CN114943284A - 行为预测模型的数据处理系统与方法 - Google Patents

行为预测模型的数据处理系统与方法 Download PDF

Info

Publication number
CN114943284A
CN114943284A CN202210542104.XA CN202210542104A CN114943284A CN 114943284 A CN114943284 A CN 114943284A CN 202210542104 A CN202210542104 A CN 202210542104A CN 114943284 A CN114943284 A CN 114943284A
Authority
CN
China
Prior art keywords
graph
user
training data
behavior
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210542104.XA
Other languages
English (en)
Inventor
陆承镪
陈政聿
张健伟
况琨
杨红霞
周靖人
吴飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202210542104.XA priority Critical patent/CN114943284A/zh
Publication of CN114943284A publication Critical patent/CN114943284A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2323Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Discrete Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种行为预测模型的数据处理系统与方法,系统中云侧设备从任一端侧设备获取多组训练数据,每组训练数据包括端侧设备覆盖范围内多个用户的子图及每个子图的行为标签。云侧设备获取每组训练数据中每个子图的图表征向量,确定每个子图的权重值;通过行为预测模型获取每组训练数据中每个子图对应的行为预测值,根据每组训练数据中每个子图对应的行为预测值、行为标签及权重值,确定训练数据的损失函数值,在损失函数收敛时停止训练。本申请构建的训练数据中每个子图指示用户少量的行为数据,在数据特征上与新用户或非活跃用户类似,基于该训练数据训练得到的行为预测模型对新用户或非活跃用户的预测效果得到有效提升。

Description

行为预测模型的数据处理系统与方法
技术领域
本申请涉及计算机技术领域,尤其涉及一种行为预测模型的数据处理系统与方法。
背景技术
在不同领域常常需要对用户行为进行预测,从而基于行为预测结果向用户推送相关信息。相关技术中,对于新用户或非活跃用户,由于这类用户的行为数据较少,行为预测模型对该类用户的行为预测效果较差。
发明内容
本申请实施例提供一种行为预测模型的数据处理系统与方法,提升行为预测模型的预测效果,可适用对新用户或非活跃用户的行为预测。
本申请实施例的第一方面提供一种行为预测模型的数据处理系统,包括:
端侧设备,用于构建多组训练数据,向云侧设备发送所述多组训练数据;每组训练数据包括多个用户的子图以及每个子图的行为标签,所述用户的子图用于指示用户的行为数据;
所述云侧设备,用于针对每组训练数据,确定每个用户的子图对应的权重值;将所述训练数据中每个用户的子图分别输入行为预测模型,获取每个用户的子图对应的行为预测值,所述行为预测值指示用户的行为趋势;根据所述训练数据中每个用户的子图对应的行为预测值、行为标签以及权重值,确定所述训练数据的损失函数值;在所述训练数据的损失函数值收敛时,获取训练好的行为预测模型的模型参数;
所述云侧设备,还用于向所述端侧设备发送所述训练好的行为预测模型的模型参数。
本申请实施例的第二方面提供一种行为预测模型的数据处理方法,应用于云服务器,所述云服务器与多个端侧设备连接,所述方法包括:
从第一端侧设备获取多组训练数据;所述第一端侧设备为所述多个端侧设备的任意一个,每组训练数据包括多个用户的子图以及子图的行为标签,每个用户的子图包括用户节点以及以所述用户节点为中心的预设连跳次数内的行为对象的节点;
针对每组训练数据,确定每个用户的子图对应的权重值;将所述训练数据中每个用户的子图分别输入行为预测模型,获取每个用户的子图对应的行为预测值,所述行为预测值指示用户的行为趋势;根据所述训练数据中每个用户的子图对应的行为预测值、行为标签以及权重值,确定所述训练数据的损失函数值;
在所述训练数据的损失函数值收敛时,获取训练好的行为预测模型的模型参数;
向所述第一端侧设备发送所述训练好的行为预测模型的模型参数。
本申请实施例的第三方面提供一种行为预测模型的数据处理方法,应用于端侧设备,所述端侧设备与云服务器连接;所述方法包括:
获取多个用户的行为数据,根据每个用户的行为数据构建每个用户的子图;每个用户的子图包括用户节点以及以所述用户节点为中心的预设连跳次数内的行为对象的节点;
获取每个子图的行为标签,将所述多个用户的子图以及每个子图的行为标签作为一组训练数据;
重复执行上述步骤,构建多组训练数据;
向所述云服务器发送所述多组训练数据。
本申请实施例的第四方面提供一种行为预测模型的数据处理装置,包括:
获取模块,用于从第一端侧设备获取多组训练数据;每组训练数据包括多个用户的子图以及子图的行为标签,每个用户的子图包括用户节点以及以所述用户节点为中心的预设连跳次数内的行为对象的节点;
处理模块,用于针对每组训练数据,确定每个用户的子图对应的权重值;将所述训练数据中每个用户的子图分别输入行为预测模型,获取每个用户的子图对应的行为预测值,所述行为预测值指示用户的行为趋势;根据所述训练数据中每个用户的子图对应的行为预测值、行为标签以及权重值,确定所述训练数据的损失函数值;
所述获取模块,还用于在所述训练数据的损失函数值收敛时,获取训练好的行为预测模型的模型参数;
发送模块,用于向所述第一端侧设备发送所述训练好的行为预测模型的模型参数。
本申请实施例的第五方面提供一种行为预测模型的数据处理装置,包括:
获取模块,用于获取多个用户的行为数据;
处理模块,用于根据每个用户的行为数据构建每个用户的子图;每个用户的子图包括用户节点以及以所述用户节点为中心的预设连跳次数内的行为对象的节点;
所述获取模块,还用于获取每个子图的行为标签;
所述处理模块,还用于将所述多个用户的子图以及每个子图的行为标签作为一组训练数据;重复执行上述步骤,构建多组训练数据;
发送模块,用于向所述云服务器发送所述多组训练数据。
本申请实施例的第六方面提供一种电子设备,包括:存储器和处理器;存储器用于存储程序指令;处理器用于调用存储器中的程序指令执行如第二方面所述的行为预测模型的数据处理方法,或者,执行如第三方面所述的行为预测模型的数据处理方法。
本申请实施例的第七方面提供一种存储有计算机程序的计算机可读存储介质,当计算机程序/指令被处理器执行时,以使处理器执行如第二方面所述的行为预测模型的数据处理方法,或者,执行如第三方面所述的行为预测模型的数据处理方法。
本申请实施例的第八方面提供一种计算机程序产品,包括计算机程序/指令,当计算机程序/指令被处理器执行时,以使处理器执行如第二方面所述的行为预测模型的数据处理方法,或者,执行如第三方面所述的行为预测模型的数据处理方法。
在本申请实施例提供的行为预测模型的数据处理系统中,云侧设备从任一端侧设备获取多组训练数据,每组训练数据包括该端侧设备覆盖范围内多个用户的子图及每个子图的行为标签。云侧设备获取每组训练数据中每个子图的图表征向量,确定每个子图的权重值;通过行为预测模型获取每组训练数据中每个子图对应的行为预测值,根据每组训练数据中每个子图对应的行为预测值、行为标签及权重值,确定训练数据的损失函数值,在训练数据的损失函数收敛时停止训练。本申请构建的训练数据中每个子图指示用户少量的行为数据,在数据特征上与新用户或非活跃用户相类似,基于该训练数据训练得到的行为预测模型对新用户或非活跃用户的预测效果得到有效提升。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种系统架构示意图;
图2为本申请实施例提供的一种行为预测模型的数据处理系统示意图;
图3为本申请实施例提供的一种用户子图的示意图;
图4为本申请实施例提供的云侧设备构建用户大图的示意图;
图5为本申请实施例提供的确定训练数据中每个子图权重值的流程示意图;
图6为本申请实施例提供的确定训练数据的图表征向量中变量之间的全局相关系数的示意图;
图7为本申请实施例提供的每组训练数据构建的全局图的权重分布示意图;
图8为本申请实施例提供的一种行为预测模型的数据处理方法的流程示意图;
图9为本申请实施例提供的一种行为预测模型的数据处理方法的流程示意图;
图10为本申请实施例提供的一种行为预测模型的数据处理装置的结构示意图;
图11为本申请实施例提供的一种行为预测模型的数据处理装置的结构示意图;
图12为本申请实施例提供的一种云服务器的结构示意图;
图13为本申请实施例提供的一种端侧设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面首先对本申请实施例涉及到的技术术语进行简要说明。
第一,云计算(cloud computing)是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。
第二,图神经网络(GNN:Graph Neural Network)是指使用神经网络来学习图结构数据,提取和发掘图结构数据中的特征和模式,满足聚类、分类、预测、分割、生成等图学习任务需求的算法总称。
第三,子图是图论的基本概念之一,指节点集和边集分别是某一图的节点集的子集和边集的子集的图。本申请实施例中,用户子图中的节点包括用户节点、产品节点、服务节点等,用户子图中的边用于连接具有关联关系的用户节点、产品节点或服务节点。
第四,相关系数是一种非确定性的关系,研究变量之间线性相关程度的量。
第五,互协方差矩阵(cross-covariance)是两个随机向量元素之间的协方差,例如(向量X减去其均值向量)乘以(向量Y减去其均值向量)的复共轭,COVX,Y=E((X-E(X))(Y-E(Y))T)。
第六,范数是对函数、向量和矩阵定义的一种度量形式。任何对象的范数值都是一个非负实数,使用范数可以测量两个函数、向量或矩阵之间的距离。
云计算通过整合分布式计算、效用计算、负载均衡、并行计算、网络存储、热备份冗杂和虚拟化等计算机技术,构建了一个超大规模“中心化”计算能力的平台,为用户提供了更加强大的计算处理服务。随着近年来技术的不断发展,云计算的全球市场份额不断攀升,其对互联网、政务、金融、物流、教育等服务数字化转型起到了至关重要的作用,已成为影响国计民生的新基建。边缘计算作为一种在高带宽、时间敏感型、物联网集成背景下发展起来的分布式架构,在近些年不断演进,逐渐发展为一种与云计算“中心化”服务互补性的重要技术。随着手机、物联网(IoTs)等爆发式增长,端侧设备(或称为边缘设备)数据传输的诉求已经达到850ZB,远超万维网当前的数据传输负载20.6ZB,充分运用边缘计算的优势,与云计算配合构建成一种“端云协同”的服务新范式,已经成为实现计算-传输均衡所不可避免的发展趋势。
针对现有行为预测模型对新用户或非活跃用户的预测效果较差的问题,在本申请实施例中,通过搭建协同训练的数据处理系统,在端侧设备构建训练数据,云上基于来自端侧设备的训练数据训练得到相应的行为预测模型,并通过端云链路下发行为预测模型,实现在不同端侧设备上部署不同的行为预测模型,提高端侧设备的行为预测模型的预测效果。进一步的,端侧设备构建的训练数据包括端侧设备覆盖范围内的多个用户的子图数据,每个用户的子图数据仅指示该用户少量的行为数据,从而在数据特征上与新用户或非活跃用户相类似,基于上述训练数据训练得到的行为预测模型对于新用户或非活跃用户的预测效果能够得到有效提升。
在介绍本申请提供的技术方案之前,下面首先对本申请技术方案的系统架构进行详细说明。
图1为本申请实施例提供的一种系统架构示意图。如图1所示,本实施例提供的系统架构包括:云侧设备、端侧设备以及数据生产设备,云侧设备通过端云链路与端侧设备通信连接,每个端侧设备与多个数据生产设备通信连接。
本实施例中,云侧设备是分布式云架构的中心云设备,端侧设备是分布式云架构的边缘云设备。数据生产设备包括各类终端设备,包括但不限于智能手机、便携式电脑、平板电脑、智能家电设备等。
数据生成设备负责各类数据的生产、采集以及上传。端侧设备负责收集其覆盖范围内的数据生产设备的各类数据,并对数据进行预处理,得到高价值数据(关键片段),端侧设备可将原始数据和高价值数据通过端云链路上传至云侧设备。云侧设备除了同步端侧设备的各项数据之外,还负责整合来自不同端侧设备的各项数据,根据预设规则进行数据运算,可将数据运算结果同步给不同端侧设备。
云侧设备提供超强的计算和存储能力,距离用户较远,而端侧设备部署范围大,距离用户较近。端侧设备是云侧设备的拓展,可将云侧设备的计算能力向端侧设备下沉,通过端云的一体化、协同管理来解决集中式云计算模式下无法满足的业务需求。
为了便于理解本实施例系统架构中设备间的执行交互,下面结合几个具体场景对设备间的执行交互过程进行说明。
一种可能的场景中,云侧设备是电商平台的中心云设备,端侧设备是电商平台部署在各地区的边缘云设备。端侧设备获取其覆盖区域范围内用户在电商平台的行为数据,例如用户浏览某款产品,用户下单某款产品,用户向亲友分享某款产品等等。端侧设备根据用户的行为数据构建用户的子图,向云侧设备发送用户的子图,用户的子图指示了用户的历史行为数据。云侧设备基于端侧设备发送的不同用户的子图,构建区域范围内用户的大图。用户的大图指示了用户间的关联关系以及每个用户的行为数据,可用于用户行为预测(即用户偏好分析,如预测用户可能感兴趣的产品或服务类型)、热门产品统计等。
一种可能的场景中,云侧设备是短视频平台的中心云设备,端侧设备是短视频平台部署在各地区的边缘云设备。端侧设备获取其覆盖范围内用户在短视频平台的行为数据,例如用户观看某条视频,用户点赞某条视频,用户上传视频等等。端侧设备根据用户的行为数据构建用户的子图,向云侧设备发送用户的子图。云侧设备基于端侧设备发送的不同用户的子图,构建区域范围内用户的大图,可用于用户行为预测(如预测用户可能感兴趣的视频类型)、热门短视频统计等。
一种可能的场景中,云侧设备是新闻资讯平台的中心云设备,端侧设备是新闻资讯平台部署在各地区的边缘云设备。端侧设备获取其覆盖范围内用户在新闻资讯平台的行为数据,例如用户查看某条新闻,用户转发某条新闻,用户收藏某条资讯等等。端侧设备根据用户的行为数据构建用户的子图,向云侧设备发送用户的子图。云侧设备基于端侧设备发送的不同用户的子图,构建区域范围内用户的大图,可用于用户行为预测(如预测用户可能感兴趣的新闻类型)、热门资讯统计等。
对于上述任一种场景,端侧设备分析用户的行为数据,提炼出用户子图,并将用户子图发送至云侧设备,出于隐私保护,端侧设备应及时删除用户的个人数据和隐私数据,在确保用户隐私不回传的同时,实现为用户推荐相关服务或产品。
对于上述任一种场景,在训练用户的行为预测模型中,端侧设备负责构建训练数据,云侧设备构建初始的行为预测模型,根据训练数据对行为预测模型的模型参数进行优化,在模型损失函数收敛时,将训练好的行为预测模型下发端侧设备。端侧设备基于训练好的行为预测模型直接在端侧设备进行用户行为预测,并基于预测结果向用户推送信息。在电商场景中,端侧设备基于行为预测模型的预测结果,向用户推送产品或服务的链接、图片、视频等信息。在短视频场景中,端侧设备基于行为预测模型的预测结果,向用户推送短视频。在新闻资讯场景中,端侧设备基于行为预测模型的预测结果,向用户推送新闻资讯。
云端设备基于不同的端侧设备上传的训练数据,进行行为预测模型的训练,得到不同的行为预测模型,分别向不同的端侧设备下发相对应的行为预测模型,实现行为预测模型的分区训练和部署,提升行为预测模型的预测效果。
下面通过具体实施例对本申请实施例提供的技术方案进行详细说明。需要说明的是,本申请实施例提供的技术方案可以包括以下内容中的部分或全部,下面几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本申请实施例提供的一种行为预测模型的数据处理系统示意图。如图2所示,本实施例提供的行为预测模型的数据处理系统200,包括:端侧设备201,以及与端侧设备201通信连接的云侧设备202。端侧设备201构建多组训练数据,并向云侧设备202上传多组训练数据。云侧设备202根据多组训练数据训练行为预测模型,并在模型的损失函数收敛时,向端侧设备201下发训练好的行为预测模型的模型参数。
本实施例中,端侧设备201可以是各种网络平台部署在网络边缘的边缘云设备,负责收集端侧设备覆盖范围内的终端设备产生的各类数据。其中,端侧设备201可以是常规服务器、云服务器或服务器阵列等服务端设备。终端设备包括但不限于台式电脑、笔记本电脑或智能手机等终端设备,终端设备产生的各类数据包括但不限于用户的行为数据,例如用户在网络平台上对各种对象,如产品、视频、新闻等,进行浏览、评论、推荐等各种行为数据。网络平台包括但不限于电商平台、短视频平台、新闻资讯平台等。
作为一种示例,端侧设备201负责收集终端设备的用户历史行为数据,对用户历史数据作预处理生成高价值数据,例如从用户历史行为数据中筛选符合预设条件(如重复次数大于阈值)的用户行为数据,将符合预设条件的用户行为数据作为高价值数据。端侧设备201可以将终端设备的用户历史行为数据全部上传云侧设备202,也可以将终端设备的高价值数据上传云侧设备202,还可以将终端设备的用户历史行为数据和高价值数据同时上传云侧设备202。
作为一种示例,端侧设备201负责构建多组用于训练行为预测模型的训练数据,并向云侧设备202发送多组训练数据。端侧设备201构建的每组训练数据包括多个用户的子图以及每个子图的行为标签,用户的子图用于指示用户的行为数据。
示例性的,图3为本申请实施例提供的一种用户子图的示意图。如图3所示,端侧设备获取用户A的行为数据,根据用户A的行为数据构建用户A的子图。具体来说,以用户A为中心节点,用户A的行为数据中各行为对象为从节点,构建用户A的子图。以电商场景为例,行为数据中的行为对象包括产品链接、关联用户等。例如,用户A点击查看产品1的链接,随后点击查看产品2的链接;又例如,用户A分享产品3的链接给用户B;再例如,用户A收藏产品4的链接,随后转发产品5的链接给用户C。基于用户A的上述行为,生成图3所示的用户A的子图。其中,用户B和用户C均属于用户A的关联用户。
一个可选实施例中,端侧设备201获取多个用户的行为数据,根据每个用户的行为数据构建每个用户的子图,同时获取每个子图的行为标签,将多个用户的子图以及每个子图的行为标签作为多组训练数据的其中一组训练数据。
可选的,用户的子图包括用户节点以及以用户节点为中心的预设连跳次数内的行为对象的节点。本实施例对预设连跳次数不作具体限定,本领域技术人员可以根据实际应用需求进行合理设置。示例性的,预设连跳次数设置为3,在构建用户子图时,仅获取用户在连续3跳内的行为对象,如图3中节点“产品4的链接”、“产品5的链接”以及“用户C”为用户A连续3跳的行为对象的节点。
需要说明的是,通过设置预设连跳次数,获取轻量化的用户子图,以模拟新用户或非活跃用户的用户子图,通过后续的模型训练,使得行为预测模型能够更准确地对新用户或非活跃用户进行行为预测。
本实施例中,云侧设备202可以是各种网络平台部署在网络中心的中心云设备,可以是常规服务器、云服务器或服务器阵列等服务端设备。
作为一种示例,云侧设备202从端侧设备201获取多个用户的历史行为数据,将多个用户的历史行为数据存储在本地。
作为一种示例,云侧设备202从端侧设备201获取多个用户的高价值数据,将多个用户的高价值数据存储在本地。其中,用户的高价值数据是端侧设备201从用户的历史行为数据中筛选的数据。可选的,云侧设备可基于用户的高价值数据进行数据分析和统计,例如分析用户群的行为趋势等。
作为一种示例,云侧设备202从端侧设备201获取多组用于行为预测模型训练的训练数据。每组训练数据包括多个用户的子图以及每个子图的行为标签,用户的子图用于指示用户的行为数据。可选的,每组训练数据中每个用户的子图包括用户节点以及以用户节点为中心的预设连跳次数内的行为对象的节点。
云侧设备202针对每组训练数据,首先确定每个用户的子图对应的权重值;随后将训练数据中每个用户的子图分别输入行为预测模型,获取每个用户的子图对应的行为预测值,行为预测值指示用户的行为趋势;再根据训练数据中每个用户的子图对应的行为预测值、行为标签以及权重值,确定训练数据的损失函数值;在训练数据的损失函数值收敛时,获取训练好的行为预测模型的模型参数。云侧设备202可向端侧设备201发送训练好的行为预测模型的模型参数,以便端侧设备201更新部署在本地的行为预测模型的模型参数,端侧设备201中的行为预测模型侧重于学习局部用户的行为数据,如某区域用户或某一类群体的行为数据。
作为一种示例,云侧设备202从不同端侧设备发送的训练数据中获取大量用户的子图,根据这些用户的子图可构建用户大图,用户大图不仅包含每个用户的行为数据,还包含同一区域用户间的各种关联关系,以及跨区域用户间的各种关联关系。关联关系包括但不限于兴趣爱好相同、属于同一群组、亲友关系、同事关系等。云侧设备202还可以基于来自不同端侧设备的用户子图以及每个子图的行为标签,训练一个大型的行为预测模型,该模型侧重于学习全网用户的行为数据。
图4为本申请实施例提供的云侧设备构建用户大图的示意图,如图4所示,云侧设备获取用户A的子图和用户B的子图,用户A的子图与用户B的子图存在部分节点的重叠,如图4中的节点“用户A”、“用户B”以及“产品3的链接”。云侧设备通过这些重叠节点将用户A的子图和用户B的子图连接,基于此,可继续叠加更多用户的子图,从而在云端构建用户大图。
一个可选实施例中,云侧设备202针对每组训练数据,获取训练数据中的每个用户的子图的图表征向量;根据训练数据中所有用户的子图的图表征向量,确定图表征向量中变量之间的全局相关系数;根据图表征向量中变量之间的全局相关系数确定图表征向量中变量的聚类结果,聚类结果包括变量的聚类中心和聚类的簇;根据图表征向量中变量的聚类结果以及训练数据中的每个用户的子图的图表征向量,确定训练数据中每个用户的子图对应的权重值。
上述数据处理过程是对行为预测模型进行一轮训练前的一组训练数据的预处理过程,用于确定该组训练数据中的每个用户子图对应的权重值。在执行上述数据处理过程之前,初始化训练数据的子图权重,假设每组训练数据包括N个子图,则该组训练数据的初始化子图权重矢量可表示为W=(1,1,..,1),W中包括N个1。
通过对训练数据中所有用户子图的图表征向量的分析,确定每个用户子图(对应某地区或某用户群的一个用户)在全局图(对应某地区或某用户群的所有用户)的重要程度,即每个用户子图对应的权重值。重要程度越高,则权重值越大。
需要说明的是,同一组训练数据中不同用户的子图的图表征向量的向量维度相同,由于每个用户的行为数据不同,生成的图表征向量的各变量的数值不同。通过对所有用户的子图的图表征向量中变量之间的相关度计算,可确定图表征向量中变量之间的全局(总体)相关度,从而将不同变量聚类到不同的簇。应理解,相关度较高的变量更有可能在不同的子图上保持稳定的联合分布,并且应该分组到同一个簇中。
一个可选实施例中,云侧设备202将训练数据中的每个用户的子图的图表征向量输入图神经网络;基于图神经网络的网络参数对每个用户的子图进行特征提取,获取每个用户的子图的图表征向量。具体的,可通过如下公式表示特征提取的过程:
Z=GNN(Gv,θ)
上式中,Z表示某用户的子图Gv的图表征向量,GNN表示图神经网络,θ表示图神经网络的网络参数。本实施例基于图神经网络的图表征学习,是根据用户子图的节点属性、边和边的属性生成一个向量作为图的表征,基于图表征向量可以做用户子图的预测,例如预测用户的行为趋势。
图5为本申请实施例提供的确定训练数据中每个子图权重值的流程示意图。如图5所示,某一组训练数据包括用户1至用户n的n个子图,分别记为子图1,2…,n。将这n个子图依次输入图神经网络GNN中,获取每个子图的图表征向量,分别记为Z1,Z2,…,Zn。基于n个子图的图表征向量,确定图表征向量中变量之间的全局相关系统,从而确定图表征向量中每个变量的聚类结果(包括聚类中心和簇),再结合每个子图的图表征向量,可以分别确定每个子图的图表征向量中各个变量与聚类中心的距离,从而确定每个子图对应的权重值。
需要说明的是,图神经网络的网络参数为可调参数,在对行为预测模型进行多轮训练的过程中,可以根据行为预测模型的损失函数的收敛情况确定是否需要更新图神经网络的网络参数。通过更新图神经网络的网络参数提升特征提取的准确率,为后续用户行为预测提供数据支撑。
一个可选实施例中,云侧设备202根据训练数据中每个用户的子图的图表征向量,确定每个用户的子图的图表征向量中变量之间的第一相关系数;根据训练数据中所有用户的子图的图表征向量,确定所有用户的子图的图表征向量的变量平均值之间的第二相关系数;根据每个用户的子图的图表征向量中变量之间的第一相关系数,以及所有用户的子图的图表征向量的变量平均值之间的第二相关系数,确定图表征向量中变量之间的全局相关系数。本实施例通过计算全局相关系数,确定在全局训练数据中子图的图表征向量中的变量之间的相关度,从而确定图表征向量中变量的聚类结果,为后续基于用户子图的图表征向量预测用户行为数据提供数据支撑,提高预测效果。
可选的,可通过如下公式确定图表征向量中变量之间的全局相关系数:
Figure BDA0003648684010000111
上式中,N表示每组训练数据中用户子图的数量,corr(zl,i,zl,j)表示第l个用户子图的图表征向量中第i个变量和第j个变量之间的第一相关系数,
Figure BDA0003648684010000112
表示每组训练数据中所有用户子图的图表征向量的第i个变量的平均值
Figure BDA0003648684010000113
和第j个变量的平均值
Figure BDA0003648684010000114
之间的第二相关系数,Dis(z:,i,z:,j)表示每组训练数据的图表征向量中第i个变量和第j个变量之间的全局相关系数。
相关系数是研究变量之间线性相关程度的量,可用corr表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数,本实施例对相关系数定义方式不作具体限定。
图6为本申请实施例提供的确定训练数据的图表征向量中变量之间的全局相关系数的示意图。如图6所示,某一组训练数据包括n个用户子图,每个用户子图的图表征向量的向量维度为m,如子图1的图表征向量Z1=(z11,z12,…,z1m),子图2的图表征向量Z2=(z21,z22,…,z2m)。基于该组训练数据的n个用户子图的图表征向量,确定如下几种相关系数:一是,针对每个子图的图表征向量,计算每个子图的图表征向量中变量之间的相关系数,如z1i,z1j之间的相关系数,z2i,z2j之间的相关系数,zni,znj之间的相关系数。二是,计算n个子图的图表征向量的每个维度变量的平均值,如图6的
Figure BDA0003648684010000115
随后计算
Figure BDA0003648684010000116
之间的相关系数。三是,基于上述两种相关系数,确定该组训练数据的图表征向量的z:,i,z:,i之间的全局相关系数。上述i和j取[1,m]。
在确定训练数据的图表征向量中变量之间的全局相关系数后,即可确定每个变量在全局的聚类结果,聚类结果包括变量的聚类中心和聚类的簇。可选的,可通过最小化如下损失函数来确定每个变量在全局的聚类结果:
Figure BDA0003648684010000121
上式中,μ和S分别表示聚类中心和聚类的簇,μj表示第j个聚类中心,Sj表示第j个聚类中心的簇,k表示聚类中心的数量,Dis(z:,i,μj)表示第i个变量与第j个聚类中心之间的相关系数。
一个可选实施例中,云侧设备202根据图表征向量中变量的聚类中心,训练数据中每个用户的子图的图表征向量以及每个用户的子图对应的初始权重值,调整每个用户的子图的权重值,直至训练数据对应的互协方差矩阵的范数值收敛,确定训练数据中每个用户的子图对应的权重值。
其中,互协方差矩阵是根据训练数据中所有用户的子图的图表征矢量以及每个用户的子图对应的权重值确定的,每个用户子图对应的初始化权重值均为1。
可选的,可通过最小化如下损失函数调整训练数据的子图权重矢量W,即调整训练数据中每个子图对应的权重值:
Figure BDA0003648684010000122
上式中,m表示用户子图的图表征向量的向量维度,
Figure BDA0003648684010000123
表示指示函数,若i和j属于同一个聚类簇S,则
Figure BDA0003648684010000124
否则
Figure BDA0003648684010000126
Figure BDA0003648684010000125
表示训练数据对应的互协方差矩阵C的范数值(二范数值)。
图7为本申请实施例提供的每组训练数据构建的全局图的权重分布示意图。如图7所示,某一组训练数据包括6个用户的子图,部分用户子图之间存在重叠,例如用户1的子图分别与用户2、用户3和用户6的子图有部分重叠,重叠部分对应用户共有的行为数据,例如用户1和用户2均点击查看某一产品的链接。可以理解,用户子图的重叠部分越多表明用户共有的行为数据越多,在对某用户进行行为预测时,可以更多地参考与其行为数重叠较多的用户的子图,给予该子图更大的权重值。基于对训练数据中每个用户子图对应的权重值的调整,再对行为预测模型的参数进行优化,可提升模型优化的准确率,进而提升模型的预测效果。
一个可选实施例中,若训练数据的损失函数值未收敛,云侧设备202需更新图神经网络的网络参数和行为预测模型的模型参数;随后根据更新后的图神经网络的网络参数、行为预测模型的模型参数以及新的训练数据,对行为预测模型进行新一轮训练,确定新的训练数据的损失函数值,直至训练数据的损失函数收敛。
需要说明的是,新一轮的模型训练,需要重新执行如下步骤:确定新一轮训练数据中每个用户的子图对应的权重值;将新一轮训练数据中每个用户的子图分别输入已更新模型参数的行为预测模型,获取每个用户的子图对应的行为预测值;再根据新一轮训练数据中每个用户的子图对应的行为预测值、行为标签以及权重值,重新确定新一轮训练数据的损失函数值。
若确定新一轮训练数据的损失函数值与上一轮训练数据的损失函数值的差值是否小于阈值,若差值小于阈值,确定行为预测模型的损失函数收敛,即可停止对行为预测模型的训练。
可选的,可通过最小化如下损失函数对行为预测模型进行多轮训练:
Figure BDA0003648684010000131
上式中,N表示每组训练数据中用户子图的数量,θ表示图神经网络GNN的网络参数,Gn表示训练数据中的第n个用户子图,
Figure BDA0003648684010000132
表示行为预测模型,Yn表示第n个用户子图的行为标签,Wn表示训练数据中第n个用户子图对应的权重值,l表示损失函数。
一个可选实施例中,云侧设备202在训练数据的损失函数值收敛时,除了向端侧设备201发送更新后的行为预测模型的模型参数外,还向端侧设备201发送更新后的图神经网络的网络参数。端侧设备201基于更新后的图神经网络的网络参数,获取测试阶段用户子图的图表征向量,将用户子图的图表征向量输入训练好的行为预测模型,获取用户子图对应的行为预测结果,从而基于该行为预测结果向用户终端推送信息。
本申请实施例提供的行为预测模型的数据处理系统包括云侧设备和多个端侧设备。云侧设备从任一端侧设备获取多组训练数据,每组训练数据中包括该端侧设备覆盖范围内多个用户的子图以及每个子图的行为标签。云侧设备通过图神经网络获取每组训练数据中每个子图的图表征向量,确定每组训练数据中每个子图对应的权重值;通过行为预测模型获取每组训练数据中每个子图对应的行为预测值,根据每组训练数据中每个子图对应的行为预测值、行为标签以及权重值,确定该组训练数据的损失函数值。通过多轮训练过程,不断更新图神经网络的网络参数和行为预测模型的模型参数,直至训练数据的损失函数收敛时停止模型训练。最后向端侧设备发送最后一次训练时的图神经网络的网络参数和行为预测模型的模型参数。
一方面,端侧设备构建的训练数据中,用户子图仅指示用户少量的行为数据,在数据特征上与新用户或非活跃用户相类似,因此基于上述训练数据训练得到的行为预测模型对于新用户或非活跃用户的预测效果能够得到有效提升。另一方面,云侧设备在训练行为预测模型时,考虑每组训练数据中用户子图的权重值,结合用户子图权重值确定模型损失函数,可进一步提升模型训练的效果。
在本申请实施例中,除了提供一种行为预测模型的数据处理系统之外,还提供一种行为预测模型的数据处理方法,可为不同的端侧设备训练相应的行为预测模型,作为预置在端侧设备的功能模型。
图8为本申请实施例提供的一种行为预测模型的数据处理方法的流程示意图,本实施例提供的数据处理方法适用于图1或图2所示的云侧设备,或者,云服务器。如图8所示,该数据处理方法包括:
步骤801、从第一端侧设备获取多组训练数据。第一端侧设备为多个端侧设备的任意一个,每组训练数据包括多个用户的子图以及子图的行为标签,每个用户的子图包括用户节点以及以用户节点为中心的预设连跳次数内的行为对象的节点。
步骤802、针对每组训练数据,确定每个用户的子图对应的权重值。
步骤803、将训练数据中每个用户的子图分别输入行为预测模型,获取每个用户的子图对应的行为预测值,行为预测值指示用户的行为趋势。
步骤804、根据训练数据中每个用户的子图对应的行为预测值、行为标签以及权重值,确定训练数据的损失函数值,在训练数据的损失函数值收敛时,获取训练好的行为预测模型的模型参数。
步骤805、向第一端侧设备发送训练好的行为预测模型的模型参数。
本实施例的一个可选实施例中,针对每组训练数据,确定每个用户的子图对应的权重值,包括:获取训练数据中的每个用户的子图的图表征向量;根据训练数据中所有用户的子图的图表征向量,确定图表征向量中变量之间的全局相关系数;根据图表征向量中变量之间的全局相关系数确定图表征向量中变量的聚类结果,聚类结果包括变量的聚类中心和聚类的簇;根据图表征向量中变量的聚类结果以及训练数据中的每个用户的子图的图表征向量,确定训练数据中每个用户的子图对应的权重值。
本实施例的一个可选实施例中,获取训练数据中的每个用户的子图的图表征向量,包括:将训练数据中的每个用户的子图的图表征向量输入图神经网络;基于图神经网络的网络参数对每个用户的子图进行特征提取,获取每个用户的子图的图表征向量。
本实施例的一个可选实施例中,根据训练数据中所有用户的子图的图表征向量,确定图表征向量中变量之间的全局相关系数,包括:根据训练数据中每个用户的子图的图表征向量,确定每个用户的子图的图表征向量中变量之间的第一相关系数;根据训练数据中所有用户的子图的图表征向量,确定所有用户的子图的图表征向量的变量平均值之间的第二相关系数;根据每个用户的子图的图表征向量中变量之间的第一相关系数,以及所有用户的子图的图表征向量的变量平均值之间的第二相关系数,确定图表征向量中变量之间的全局相关系数。
本实施例的一个可选实施例中,根据图表征向量中变量的聚类结果以及训练数据中的每个用户的子图的图表征向量,确定训练数据中每个用户的子图对应的权重值,包括:根据图表征向量中变量的聚类中心,训练数据中每个用户的子图的图表征向量以及每个用户的子图对应的初始权重值,调整每个用户的子图的权重值,直至训练数据对应的互协方差矩阵的范数值收敛,确定训练数据中每个用户的子图对应的权重值。其中,互协方差矩阵是根据训练数据中所有用户的子图的图表征矢量以及每个用户的子图对应的权重值确定的。
本实施例的一个可选实施例中,若训练数据的损失函数值未收敛,更新图神经网络的网络参数和行为预测模型的模型参数;根据更新后的图神经网络的网络参数、行为预测模型的模型参数以及新的训练数据,对行为预测模型进行新一轮训练,确定新的训练数据的损失函数值,直至训练数据的损失函数收敛。
本实施例的一个可选实施例中,在训练数据的损失函数值收敛时,向第一端侧设备发送更新后的图神经网络的网络参数。
本申请实施例提供的行为预测模型的数据处理方法中,云侧设备从端侧设备获取多组训练数据,每组训练数据中包括端侧设备覆盖范围内多个用户的子图以及每个子图的行为标签,用户子图包含用户的行为数据以及关联用户。云侧设备通过图神经网络获取每组训练数据中每个子图的图表征向量,确定每组训练数据中每个子图对应的权重值;通过行为预测模型获取每组训练数据中每个子图对应的行为预测值,根据每组训练数据中每个子图对应的行为预测值、行为标签以及权重值,确定该组训练数据的损失函数值。在多轮训练过程中,不断更新图神经网络的网络参数和行为预测模型的模型参数,直至训练数据的损失函数收敛时停止模型训练。一方面,构建的训练数据中用户子图仅指示用户少量的行为数据,在数据特征上与新用户或非活跃用户相类似,因此基于上述训练数据训练得到的行为预测模型对于新用户或非活跃用户的预测效果能够得到有效提升。另一方面,在训练行为预测模型时,考虑每组训练数据用户子图的权重值,结合用户子图权重值确定模型损失函数,可进一步提升模型训练的效果。
图9为本申请实施例提供的一种行为预测模型的数据处理方法的流程示意图,本实施例提供的数据处理方法适用于图1或图2所示的端侧设备。如图9所示,该数据处理方法包括:
步骤901、获取多个用户的行为数据。
步骤902、根据每个用户的行为数据构建每个用户的子图,每个用户的子图包括用户节点以及以用户节点为中心的预设连跳次数内的行为对象的节点。
步骤903、获取每个子图的行为标签,将多个用户的子图以及每个子图的行为标签作为一组训练数据。
步骤904、重复执行步骤901至903,构建多组训练数据。
步骤905、向云服务器发送多组训练数据。
本申请实施例提供的行为预测模型的数据处理方法中,端侧设备通过收集端侧设备覆盖范围内多个用户的行为数据,根据每个用户的行为数据构建每个用户的子图,同时获取每个用户的子图对应的行为标签,将多个用户的子图以及每个子图对应的行为标签作为模型训练的一组训练数据。端侧设备基于上述过程构建多组训练数据,以使云侧设备基于端侧设备传输的多组训练数据,训练得到满足收敛条件的行为预测模型。端侧设备可从端云链路获取云侧设备为其训练的行为预测模型,用于预测用户的行为趋势,从而向用户推送信息。
本实施例中,端侧设备构建的训练数据中用户子图仅指示用户少量的行为数据,在数据特征上与新用户或非活跃用户相类似,因此基于上述训练数据训练得到的行为预测模型对于新用户或非活跃用户的预测效果能够得到有效提升。
图10为本申请实施例提供的一种行为预测模型的数据处理装置的结构示意图。如图10所示,本实施例的行为预测模型的数据处理装置1000,包括:获取模块1001,处理模块1002以及发送模块1003。
获取模块1001,用于从第一端侧设备获取多组训练数据;每组训练数据包括多个用户的子图以及子图的行为标签,每个用户的子图包括用户节点以及以所述用户节点为中心的预设连跳次数内的行为对象的节点;
处理模块1002,用于针对每组训练数据,确定每个用户的子图对应的权重值;将所述训练数据中每个用户的子图分别输入行为预测模型,获取每个用户的子图对应的行为预测值,所述行为预测值指示用户的行为趋势;根据所述训练数据中每个用户的子图对应的行为预测值、行为标签以及权重值,确定所述训练数据的损失函数值;
获取模块1001,还用于在所述训练数据的损失函数值收敛时,获取训练好的行为预测模型的模型参数;
发送模块1003,用于向所述第一端侧设备发送所述训练好的行为预测模型的模型参数。
一个可选实施例中,处理模块1002,用于:
获取所述训练数据中的每个用户的子图的图表征向量;
根据所述训练数据中所有用户的子图的图表征向量,确定图表征向量中变量之间的全局相关系数;
根据图表征向量中变量之间的全局相关系数确定图表征向量中变量的聚类结果,所述聚类结果包括变量的聚类中心和聚类的簇;
根据所述图表征向量中变量的聚类结果以及所述训练数据中的每个用户的子图的图表征向量,确定所述训练数据中每个用户的子图对应的权重值。
一个可选实施例中,处理模块1002,用于:
将所述训练数据中的每个用户的子图的图表征向量输入图神经网络;
基于所述图神经网络的网络参数对每个用户的子图进行特征提取,获取每个用户的子图的图表征向量。
一个可选实施例中,处理模块1002,用于:
根据所述训练数据中每个用户的子图的图表征向量,确定每个用户的子图的图表征向量中变量之间的第一相关系数;
根据所述训练数据中所有用户的子图的图表征向量,确定所有用户的子图的图表征向量的变量平均值之间的第二相关系数;
根据每个用户的子图的图表征向量中变量之间的第一相关系数,以及所有用户的子图的图表征向量的变量平均值之间的第二相关系数,确定图表征向量中变量之间的全局相关系数。
一个可选实施例中,处理模块1002,用于:
根据所述图表征向量中变量的聚类中心,所述训练数据中每个用户的子图的图表征向量以及每个用户的子图对应的初始权重值,调整所述每个用户的子图的权重值,直至所述训练数据对应的互协方差矩阵的范数值收敛,确定所述训练数据中每个用户的子图对应的权重值;所述互协方差矩阵是根据所述训练数据中所有用户的子图的图表征矢量以及每个用户的子图对应的权重值确定的。
一个可选实施例中,数据处理装置1000还包括:更新模块1004。
若所述训练数据的损失函数值未收敛,更新模块1004,用于更新图神经网络的网络参数和所述行为预测模型的模型参数;
处理模块1002,用于根据更新后的图神经网络的网络参数、所述行为预测模型的模型参数以及新的训练数据,对所述行为预测模型进行新一轮训练,确定所述新的训练数据的损失函数值,直至所述训练数据的损失函数收敛。
一个可选实施例中,发送模块1003,还用于在所述训练数据的损失函数值收敛时,向所述第一端侧设备发送更新后的所述图神经网络的网络参数。
本实施例提供的行为预测模型的数据处理装置,可以执行前述方法实施例中云侧设备的技术方案,其实现原理和技术效果类似,此处不再赘述。
图11为本申请实施例提供的一种行为预测模型的数据处理装置的结构示意图。如图11所示,本实施例的行为预测模型的数据处理装置1100,包括:获取模块1101,处理模块1102以及发送模块1103。
获取模块1101,用于获取多个用户的行为数据;
处理模块1102,用于根据每个用户的行为数据构建每个用户的子图;每个用户的子图包括用户节点以及以所述用户节点为中心的预设连跳次数内的行为对象的节点;
获取模块1101,还用于获取每个子图的行为标签;
处理模块1102,还用于将所述多个用户的子图以及每个子图的行为标签作为一组训练数据;重复执行上述步骤,构建多组训练数据;
发送模块1103,用于向云服务器发送所述多组训练数据。
本实施例提供的行为预测模型的数据处理装置,可以执行前述方法实施例中端侧设备的技术方案,其实现原理和技术效果类似,此处不再赘述。
需要说明的是,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
图12为本申请实施例提供的一种云服务器的结构示意图。如图12所示,该云服务器包括:存储器1201和处理器1202。存储器1201,用于存储计算机程序,并可被配置为存储其它各种数据以支持在云服务器上的操作。处理器1202,与存储器1201耦合,用于执行存储器1201中的计算机程序,以实现前述方法实施例中云侧设备的技术方案,其实现原理和技术效果类似,此处不再赘述。
可选的,如图12所示,该云服务器还包括:防火墙1203、负载均衡器1204、通信组件1205、电源组件1206等其它组件。图12中仅示意性给出部分组件,并不意味着电子设备只包括图12所示组件。
图13为本申请实施例提供的一种端侧设备的结构示意图。如图13所示,该端侧设备包括:存储器1301和处理器1302。存储器1301,用于存储计算机程序,并可被配置为存储其它各种数据以支持在端侧设备上的操作。处理器1302,与存储器1301耦合,用于执行存储器1301中的计算机程序,以实现前述方法实施例中端侧设备的技术方案,其实现原理和技术效果类似,此处不再赘述。
可选的,如图13所示,该端侧设备还包括:防火墙1303、负载均衡器1304、通信组件1305、电源组件1306等其它组件。图13中仅示意性给出部分组件,并不意味着电子设备只包括图13所示组件。
本申请实施例提供一种存储有计算机程序的计算机可读存储介质,当计算机程序/指令被处理器执行时,以使处理器实现如前述方法实施例中云侧设备的技术方案。
本申请实施例提供一种存储有计算机程序的计算机可读存储介质,当计算机程序/指令被处理器执行时,以使处理器实现如前述方法实施例中端侧设备的技术方案。
本申请实施例提供一种计算机程序产品,包括计算机程序/指令,当计算机程序/指令被处理器执行时,以使处理器实现如前述方法实施例中云端设备的技术方案。
本申请实施例提供一种计算机程序产品,包括计算机程序/指令,当计算机程序/指令被处理器执行时,以使处理器实现如前述方法实施例中端侧设备的技术方案。
本申请实施例提供一种芯片,包括:处理模块与通信接口,该处理模块能执行前述方法实施例中云端设备的技术方案。可选的,该芯片还包括存储模块(如,存储器),存储模块用于存储指令,处理模块用于执行存储模块存储的指令,并且对存储模块中存储的指令的执行使得处理模块执行前述方法实施例中云端设备的技术方案。
本申请实施例提供一种芯片,包括:处理模块与通信接口,该处理模块能执行前述方法实施例中端侧设备的技术方案。可选的,该芯片还包括存储模块(如,存储器),存储模块用于存储指令,处理模块用于执行存储模块存储的指令,并且对存储模块中存储的指令的执行使得处理模块执行前述方法实施例中端侧设备的技术方案。
上述存储器可以是对象存储(Object Storage Service,OSS)。
上述存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
上述通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G、3G、4G/LTE、5G等移动通信网络,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
上述电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (14)

1.一种行为预测模型的数据处理系统,其特征在于,包括:
端侧设备,用于构建多组训练数据,向云侧设备发送所述多组训练数据;每组训练数据包括多个用户的子图以及每个子图的行为标签,所述用户的子图用于指示用户的行为数据;
所述云侧设备,用于针对每组训练数据,确定每个用户的子图对应的权重值;将所述训练数据中每个用户的子图分别输入行为预测模型,获取每个用户的子图对应的行为预测值,所述行为预测值指示用户的行为趋势;根据所述训练数据中每个用户的子图对应的行为预测值、行为标签以及权重值,确定所述训练数据的损失函数值;在所述训练数据的损失函数值收敛时,获取训练好的行为预测模型的模型参数;
所述云侧设备,还用于向所述端侧设备发送所述训练好的行为预测模型的模型参数。
2.根据权利要求1所述的数据处理系统,其特征在于,所述云侧设备针对每组训练数据,确定每个用户的子图对应的权重值,具体包括:
获取所述训练数据中的每个用户的子图的图表征向量;
根据所述训练数据中所有用户的子图的图表征向量,确定图表征向量中变量之间的全局相关系数;
根据图表征向量中变量之间的全局相关系数确定图表征向量中变量的聚类结果,所述聚类结果包括变量的聚类中心和聚类的簇;
根据所述图表征向量中变量的聚类结果以及所述训练数据中的每个用户的子图的图表征向量,确定所述训练数据中每个用户的子图对应的权重值。
3.根据权利要求2所述的数据处理系统,其特征在于,所述云侧设备获取所述训练数据中的每个用户的子图的图表征向量,具体包括:
将所述训练数据中的每个用户的子图的图表征向量输入图神经网络;
基于所述图神经网络的网络参数对每个用户的子图进行特征提取,获取每个用户的子图的图表征向量。
4.根据权利要求2所述的数据处理系统,其特征在于,所述云侧设备根据所述训练数据中所有用户的子图的图表征向量,确定图表征向量中变量之间的全局相关系数,具体包括:
根据所述训练数据中每个用户的子图的图表征向量,确定每个用户的子图的图表征向量中变量之间的第一相关系数;
根据所述训练数据中所有用户的子图的图表征向量,确定所有用户的子图的图表征向量的变量平均值之间的第二相关系数;
根据每个用户的子图的图表征向量中变量之间的第一相关系数,以及所有用户的子图的图表征向量的变量平均值之间的第二相关系数,确定图表征向量中变量之间的全局相关系数。
5.根据权利要求2所述的数据处理系统,其特征在于,所述云侧设备根据所述图表征向量中变量的聚类结果以及所述训练数据中的每个用户的子图的图表征向量,确定所述训练数据中每个用户的子图对应的权重值,包括:
根据所述图表征向量中变量的聚类中心,所述训练数据中每个用户的子图的图表征向量以及每个用户的子图对应的初始权重值,调整所述每个用户的子图的权重值,直至所述训练数据对应的互协方差矩阵的范数值收敛,确定所述训练数据中每个用户的子图对应的权重值;
所述互协方差矩阵是根据所述训练数据中所有用户的子图的图表征矢量以及每个用户的子图对应的权重值确定的。
6.根据权利要求1-5任一项所述的数据处理系统,其特征在于,若所述训练数据的损失函数值未收敛,所述云侧设备,还用于:
更新图神经网络的网络参数和所述行为预测模型的模型参数;
根据更新后的图神经网络的网络参数、所述行为预测模型的模型参数以及新的训练数据,对所述行为预测模型进行新一轮训练,确定所述新的训练数据的损失函数值,直至所述训练数据的损失函数收敛。
7.根据权利要求1-5任一项所述的数据处理系统,其特征在于,所述端侧设备构建多组训练数据,具体包括:
获取多个用户的行为数据,根据每个用户的行为数据构建每个用户的子图,用户的子图包括用户节点以及以所述用户节点为中心的预设连跳次数内的行为对象的节点;
获取每个子图的行为标签;
将所述多个用户的子图以及每个子图的行为标签作为所述多组训练数据的其中一组训练数据。
8.根据权利要求6所述的数据处理系统,其特征在于,所述云侧设备,还用于在所述训练数据的损失函数值收敛时,向所述端侧设备发送更新后的所述图神经网络的网络参数。
9.一种行为预测模型的数据处理方法,其特征在于,应用于云服务器,所述云服务器与多个端侧设备连接;所述方法包括:
从第一端侧设备获取多组训练数据;所述第一端侧设备为所述多个端侧设备的任意一个,每组训练数据包括多个用户的子图以及子图的行为标签,每个用户的子图包括用户节点以及以所述用户节点为中心的预设连跳次数内的行为对象的节点;
针对每组训练数据,确定每个用户的子图对应的权重值;将所述训练数据中每个用户的子图分别输入行为预测模型,获取每个用户的子图对应的行为预测值,所述行为预测值指示用户的行为趋势;根据所述训练数据中每个用户的子图对应的行为预测值、行为标签以及权重值,确定所述训练数据的损失函数值;
在所述训练数据的损失函数值收敛时,获取训练好的行为预测模型的模型参数;
向所述第一端侧设备发送所述训练好的行为预测模型的模型参数。
10.根据权利要求9所述的方法,其特征在于,所述针对每组训练数据,确定每个用户的子图对应的权重值,包括:
获取所述训练数据中的每个用户的子图的图表征向量;
根据所述训练数据中所有用户的子图的图表征向量,确定图表征向量中变量之间的全局相关系数;
根据图表征向量中变量之间的全局相关系数确定图表征向量中变量的聚类结果,所述聚类结果包括变量的聚类中心和聚类的簇;
根据所述图表征向量中变量的聚类结果以及所述训练数据中的每个用户的子图的图表征向量,确定所述训练数据中每个用户的子图对应的权重值。
11.根据权利要求10所述的方法,其特征在于,所述获取所述训练数据中的每个用户的子图的图表征向量,包括:
将所述训练数据中的每个用户的子图的图表征向量输入图神经网络;
基于所述图神经网络的网络参数对每个用户的子图进行特征提取,获取每个用户的子图的图表征向量。
12.根据权利要求10所述的方法,其特征在于,所述根据所述训练数据中所有用户的子图的图表征向量,确定图表征向量中变量之间的全局相关系数,包括:
根据所述训练数据中每个用户的子图的图表征向量,确定每个用户的子图的图表征向量中变量之间的第一相关系数;
根据所述训练数据中所有用户的子图的图表征向量,确定所有用户的子图的图表征向量的变量平均值之间的第二相关系数;
根据每个用户的子图的图表征向量中变量之间的第一相关系数,以及所有用户的子图的图表征向量的变量平均值之间的第二相关系数,确定图表征向量中变量之间的全局相关系数。
13.根据权利要求10所述的方法,其特征在于,所述根据所述图表征向量中变量的聚类结果以及所述训练数据中的每个用户的子图的图表征向量,确定所述训练数据中每个用户的子图对应的权重值,包括:
根据所述图表征向量中变量的聚类中心,所述训练数据中每个用户的子图的图表征向量以及每个用户的子图对应的初始权重值,调整所述每个用户的子图的权重值,直至所述训练数据对应的互协方差矩阵的范数值收敛,确定所述训练数据中每个用户的子图对应的权重值;
所述互协方差矩阵是根据所述训练数据中所有用户的子图的图表征矢量以及每个用户的子图对应的权重值确定的。
14.一种行为预测模型的数据处理方法,其特征在于,应用于端侧设备,所述端侧设备与云服务器连接;所述方法包括:
获取多个用户的行为数据,根据每个用户的行为数据构建每个用户的子图;每个用户的子图包括用户节点以及以所述用户节点为中心的预设连跳次数内的行为对象的节点;
获取每个子图的行为标签,将所述多个用户的子图以及每个子图的行为标签作为一组训练数据;
重复执行上述步骤,构建多组训练数据;
向所述云服务器发送所述多组训练数据。
CN202210542104.XA 2022-05-17 2022-05-17 行为预测模型的数据处理系统与方法 Pending CN114943284A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210542104.XA CN114943284A (zh) 2022-05-17 2022-05-17 行为预测模型的数据处理系统与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210542104.XA CN114943284A (zh) 2022-05-17 2022-05-17 行为预测模型的数据处理系统与方法

Publications (1)

Publication Number Publication Date
CN114943284A true CN114943284A (zh) 2022-08-26

Family

ID=82906946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210542104.XA Pending CN114943284A (zh) 2022-05-17 2022-05-17 行为预测模型的数据处理系统与方法

Country Status (1)

Country Link
CN (1) CN114943284A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115170840A (zh) * 2022-09-08 2022-10-11 阿里巴巴(中国)有限公司 数据处理系统、方法和电子设备
CN115601485A (zh) * 2022-12-15 2023-01-13 阿里巴巴(中国)有限公司(Cn) 任务处理模型的数据处理方法及虚拟人物动画生成方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115170840A (zh) * 2022-09-08 2022-10-11 阿里巴巴(中国)有限公司 数据处理系统、方法和电子设备
CN115170840B (zh) * 2022-09-08 2022-12-23 阿里巴巴(中国)有限公司 数据处理系统、方法和电子设备
CN115601485A (zh) * 2022-12-15 2023-01-13 阿里巴巴(中国)有限公司(Cn) 任务处理模型的数据处理方法及虚拟人物动画生成方法

Similar Documents

Publication Publication Date Title
Baştuğ et al. Big data meets telcos: A proactive caching perspective
EP3893154A1 (en) Recommendation model training method and related apparatus
CN114943284A (zh) 行为预测模型的数据处理系统与方法
Rathore et al. DeepCachNet: A proactive caching framework based on deep learning in cellular networks
US11354593B2 (en) Techniques to generate network simulation scenarios
Gehlot et al. Application of neural network in the prediction models of machine learning based design
CN115170840B (zh) 数据处理系统、方法和电子设备
CN113807926A (zh) 推荐信息生成方法、装置、电子设备和计算机可读介质
Karapantelakis et al. Generative ai in mobile networks: a survey
CN115757745A (zh) 基于人工智能的业务场景控制方法、系统及云平台
CN109993562B (zh) 一种满意度仿真方法、装置及终端设备
AU2020103373A4 (en) Machine learning based network intelligentization for automatically- configurable cellular communication systems
CN112541556A (zh) 模型构建优化方法、设备、介质及计算机程序产品
Costa et al. Intelligent resource sharing to enable quality of service for network clients: the trade-off between accuracy and complexity
Sountharrajan et al. On-the-go network establishment of iot devices to meet the need of processing big data using machine learning algorithms
CN116757270A (zh) 基于人机交互模型或大模型的数据处理方法、服务器
CN110457387A (zh) 一种应用于网络中用户标签确定的方法及相关装置
CN114969508A (zh) 推荐模型数据处理方法
Gao et al. ML-WiGR: a meta-learning-based approach for cross-domain device-free gesture recognition
Lockhart et al. Scission: Context-aware and performance-driven edge-based distributed deep neural networks
CN114611015A (zh) 交互信息处理方法、装置和云服务器
US20190236625A1 (en) Arrangement and method for digital media measurements involving user panels
CN114862098A (zh) 资源分配方法以及装置
Jansevskis et al. Machine Learning and on 5G Based Technologies Create New Opportunities to Gain Knowledge
CN112395490B (zh) 用于生成信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination