CN115062230B - 数据处理方法、装置、设备、介质和程序产品 - Google Patents

数据处理方法、装置、设备、介质和程序产品 Download PDF

Info

Publication number
CN115062230B
CN115062230B CN202210977812.6A CN202210977812A CN115062230B CN 115062230 B CN115062230 B CN 115062230B CN 202210977812 A CN202210977812 A CN 202210977812A CN 115062230 B CN115062230 B CN 115062230B
Authority
CN
China
Prior art keywords
data
neural network
target user
interest
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210977812.6A
Other languages
English (en)
Other versions
CN115062230A (zh
Inventor
邹小刚
周波
蔡芳发
苗瑞
武新宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Haiqing Zhiyuan Technology Co ltd
Original Assignee
Shenzhen HQVT Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen HQVT Technology Co Ltd filed Critical Shenzhen HQVT Technology Co Ltd
Priority to CN202210977812.6A priority Critical patent/CN115062230B/zh
Publication of CN115062230A publication Critical patent/CN115062230A/zh
Application granted granted Critical
Publication of CN115062230B publication Critical patent/CN115062230B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种数据处理方法、装置、设备、介质和程序产品,该方法包括:获取用户的行为日志和属性信息,根据行为数据,确定特征云图,特征云图包括节点和节点的关联关系,节点用于表征用户对感兴趣对象产生的行为,根据特征云图和属性信息,确定特征结果,特征结果包括第一感兴趣对象和第二感兴趣对象的关联关系,第一感兴趣对象为用户长期感兴趣的对象,第二感兴趣对象为用户短期感兴趣的对象,根据特征结果,更新预设初始模型的参数得到目标模型,预设初始模型包括嵌入层、第一图神经网络、循环神经网络、第二图神经网络、归一化层,目标模型用于预测用户的感兴趣对象。该方案在个性化推荐中可以更准确的为无历史数据的用户推送信息。

Description

数据处理方法、装置、设备、介质和程序产品
技术领域
本申请涉及人工智能技术领域,尤其涉及一种数据处理方法、装置、设备、介质和程序产品。
背景技术
个性化推荐是指根据用户的兴趣特点推荐其感兴趣的对象的活动,例如用户在网站浏览某一类数据信息时,网站端可以基于用户浏览的数据信息,为用户推送与该类数据信息相类似的同类信息。
现有技术中,网站端在进行数据信息的推送时,通常需要利用到用户的历史记录和历史偏好等,基于历史记录和历史偏好,网站端才能为用户推荐与其历史记录和历史偏好相关的数据信息。
但是,对于一个新注册的用户而言,网站端可能没有该新用户的偏好记录,由此就有可能无法给与该新用户精确的推荐,导致推荐效果变差。
发明内容
本申请提供一种数据处理方法、装置、设备、介质和程序产品,用于解决现有的个性化推荐在为新注册用户推送信息时,信息推送效果差的问题。
第一方面,本申请实施例提供一种数据处理方法,包括:
获取目标用户的行为日志和属性信息,所述行为日志中包括所述目标用户对感兴趣对象产生的行为数据;
根据所述行为数据,确定特征云图,所述特征云图中包括有至少两个节点和各个节点之间的关联关系,所述节点用于表征所述目标用户对感兴趣对象产生的行为;
根据所述特征云图和所述属性信息,确定特征结果,所述特征结果包括第一感兴趣对象和第二感兴趣对象之间的关联关系,所述第一感兴趣对象为所述目标用户长期感兴趣的对象,所述第二感兴趣对象为所述目标用户短期感兴趣的对象;
根据所述特征结果,对预设初始模型的参数进行优化更新,得到目标模型,所述预设初始模型包括嵌入层、与所述嵌入层连接的第一图神经网络、与所述第一图神经网络连接的循环神经网络、与所述循环神经网络连接的第二图神经网络、与所述第二图神经网络连接的归一化层,所述目标模型用于预测所述目标用户的感兴趣对象。
在第一方面的一种可能设计中,所述根据所述行为数据,确定特征云图,包括:
对所述行为数据进行预处理,得到预处理之后的数据;
将所述预处理之后的数据转换为图嵌入表征,所述图嵌入表征中包括至少两个节点;
确定所述图嵌入表征中各个节点之间的关联关系;
根据所述图嵌入表征中的各个节点和各个节点之间的关联关系,确定所述特征云图。
在第一方面的另一种可能设计中,所述对所述行为数据进行预处理,得到预处理之后的数据,包括:
从所述行为数据中提取得到所述目标用户的显性数据和隐性数据,所述显性数据包括所述目标用户产生的用户评价,所述隐性数据包括所述目标用户的浏览历史和浏览时长;
对所述目标用户的显性数据和隐性数据进行预处理,得到预处理之后的数据。
在第一方面的再一种可能设计中,所述对所述目标用户的显性数据和隐性数据进行预处理,得到预处理之后的数据,包括:
对所述目标用户的显性数据和隐性数据进行归一化处理,得到归一化之后的数据;
根据所述归一化之后的数据,得到预处理之后的数据。
在第一方面的又一种可能设计中,所述根据所述归一化之后的数据,得到预处理之后的数据,包括:
对所述归一化之后的数据进行特征选择,筛选得到特征数据,所述特征数据的相关性大于预设阈值;
对所述特征数据进行降维得到所述预处理之后的数据。
在第一方面的又一种可能设计中,所述根据所述特征结果,对预设初始模型的参数进行优化更新,得到目标模型,包括:
对所述特征结果进行归一化,得到概率分布,所述概率分布用于指示所述目标用户对不同感兴趣对象的偏好程度;
根据所述概率分布和预设交叉熵损失函数,对所述初始模型的参数进行优化更新,得到所述目标模型。
在第一方面的又一种可能设计中,所述预设交叉熵损失函数为:
Figure 828065DEST_PATH_IMAGE001
上式中,L表示损失函数,N表示感兴趣对象的数量,
Figure 516929DEST_PATH_IMAGE002
表示第i个感兴趣对象所属的类别,
Figure 908727DEST_PATH_IMAGE003
表示预测第i个感兴趣对象所属类别的概率。
第二方面,本申请实施例提供一种数据处理装置,包括:
信息获取模块,用于获取目标用户的行为日志和属性信息,所述行为日志中包括所述目标用户对感兴趣对象产生的行为数据;
特征确定模块,用于根据所述行为数据,确定特征云图,所述特征云图中包括有至少两个节点和各个节点之间的关联关系,所述节点用于表征所述目标用户对感兴趣对象产生的行为;
结果确定模块,用于根据所述特征云图和所述属性信息,确定特征结果,所述特征结果包括第一感兴趣对象和第二感兴趣对象之间的关联关系,所述第一感兴趣对象为所述目标用户长期感兴趣的对象,所述第二感兴趣对象为所述目标用户短期感兴趣的对象;
参数优化模块,用于根据所述特征结果,对预设初始模型的参数进行优化更新,得到目标模型,所述预设初始模型包括嵌入层、与所述嵌入层连接的第一图神经网络、与所述第一图神经网络连接的循环神经网络、与所述循环神经网络连接的第二图神经网络、与所述第二图神经网络连接的归一化层,所述目标模型用于预测所述目标用户的感兴趣对象。
第三方面,本申请实施例提供一种计算机设备,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现上述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现上述的方法。
第五方面,本申请实施例提供一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现上述的方法。
本申请实施例提供的数据处理方法、装置、设备、介质和程序产品,通过收集用户的行为日志数据以及用户的属性信息,基于行为数据和属性信息可以确定出用户的短期兴趣与长期兴趣之间的关联关系,使得新注册用户也可以得到与自己长短期的个人兴趣相关的推荐,实现为新注册的用户提供更加准确的个性化推荐服务。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理;
图1为本申请实施例提供的信息推送的场景示意图;
图2为本申请实施例提供的数据处理方法的流程示意图;
图3为本申请实施例提供的初始模型的结构示意图;
图4为本申请实施例提供的特征云图的示意图;
图5为本申请实施例提供的数据预处理的流程示意图;
图6为本申请实施例提供的数据处理装置的结构示意图;
图7为本申请实施例提供的计算机设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先对本申请所涉及的名词进行解释:
嵌入向量:又称为embedding向量,是用一个低维的向量表示一个对象,该对象可以是一个词,或一个商品,或一个电影视频等等。这个embedding向量的性质是能使距离相近的向量对应的物体有相近的含义。
归一化指数函数:又称softmax函数,用于将线性预测值转为类别概率。
推荐系统作为当今网络大数据时代的应用产物,在学术研究以及工程应用方面都取得了显著的成果。推荐系统的出现解决了在数据过载时代,人们越来越难从大量的信息中找到自身感兴趣的信息,信息也越来越难展示给可能对它感兴趣的用户的问题。推荐系统作为一种信息过滤技术具有以下两个基本特性:①主动性发掘。从使用者的角度来说,使用门户网站以及一些搜索引擎来解决信息过载问题是一个不错的方式,但是这样的方式存在着需要用户提供明确需求,但用户无法描述出自己想要什么的情况下,这样的方式则显得尤为鸡肋。而推荐系统无需用户提供明确的需求,通过分析以往用户浏览以及使用过的物品历史数据,并对历史数据进行建模分析,从而达到主动为用户推荐感兴趣的内容。②个性化推荐,热门物品代表着大众用户的感兴趣方向,而推荐系统的出现可以向用户推荐更为冷门的物品,而这样的物品往往是用户更为需求的,推荐系统在机器学习等技术地推动下可以很好地发掘长尾信息,从而将个性化的冷门物件推荐给用户,提高用户的使用体验。
图1为本申请实施例提供的信息推送的场景示意图,如图1所示,以用户使用移动终端为手机为例(移动终端还可以包括计算机设备、平板电脑等),在实际生活中,用户可以通过手机中搭载的应用软件浏览网络上各种各样的信息,例如购物网站中展示的物品信息,又例如视频网站中展示的视频信息等等。为了能够提高用户的使用体验,在用户允许的前提下,应用软件可以开启个性化推荐功能,即记录用户的浏览历史,基于浏览历史为用户推荐相似的信息。参考图1,当用户在用户界面上如果存在点击行为,例如点击了“美食”,则应用软件会在信息推送区域推送相关的美食,例如“咖啡”、“炸鸡”、“茶点”和“奶茶”等。
在实际应用中,新注册用户在此之前没有任何对于该应用软件的行为记录,由此应用软件在信息推送区域可能无法推送用户实际偏好的信息,例如新注册用户对旅游感兴趣,但是应用软件由于缺乏该新注册用户的行为记录,可能会导致在信息推送区域推送美食相关的信息,但美食相关的信息并不是该新注册用户感兴趣的,如此就降低了用户的使用体验。
针对上述问题,本申请实施例提供了一种数据处理方法、装置、设备、介质和程序产品。为了解决推荐模型在面向新注册用户时,存在信息推送效果差的问题,需要对推荐模型进行优化。具体的,通过收集用户的行为日志数据以及用户的属性信息,基于行为数据和属性信息确定出用户的短期兴趣与长期兴趣之间的关联关系,使得新注册用户也可以得到与自己长短期的个人兴趣相关的推荐,实现为新注册的用户提供更加准确的个性化推荐服务。
下面,通过具体实施例对本申请的技术方案进行详细说明。需要说明的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本申请实施例提供的数据处理方法的流程示意图,如图2所示,该方法的执行主体可以是计算机设备,该方法包括如下步骤:
步骤S201,获取目标用户的行为日志和属性信息。其中,行为日志中包括目标用户对感兴趣对象产生的行为数据。
在本实施例中,用户的行为日志中包括的行为数据可以分为“点击行为”、“收藏行为”、“浏览行为”和“评论行为”等。感兴趣对象可以是视频、物品、文章等。属性信息则包括用户的年龄、性别、职业和爱好等。
其中,以感兴趣对象为某一个视频A为例,用户可以通过点击视频A来控制视频A的播放,由此就会产生“点击行为”和“浏览行为”,如果用户非常喜欢视频A,则可以加入收藏夹并对视频A的内容发表评论,由此又产生了“收藏行为”和“评论行为”。
步骤S202,根据行为数据,确定特征云图。其中,特征云图中包括有至少两个节点和各个节点之间的关联关系,节点用于表征目标用户对感兴趣对象产生的行为。
在本实施中,对于用户的行为数据,可以通过自然语言处理的特征工程来进行特征处理,通过标准化以及归一化等操作以后得到处理后的数据,然后通过特征选择得到相关性更强的特征信息,最后通过主成分分析法来对数据进行降维处理,得到预处理之后的数据。
图3为本申请实施例提供的初始模型的结构示意图,如图3所示,其包括有图嵌入层301、第一图神经网络层302、循环神经网络层303、第二图神经网络层304和归一化层305。其中,第一图神经网络层302包括有多个图神经网络模块,第一图神经网络层302的图神经网络(Graph Neural Network,GNN)是指使用神经网络学习图结构数据,提取和发掘图结构数据中的特征和模式,满足聚类、分类、预测、分割、生成等图学习任务需求的算法总称。
在本实施例中,预处理之后的数据可以输入到图嵌入层转换为第一图神经网络层302能够识别输出的相关数据。图嵌入是指将图中的节点、边或子图由低维连续向量进行表征,为了得到图嵌入表征,可以利用图中的消息传播机制,图中的消息传播机制包括两个步骤:消息汇聚和节点更新,消息汇聚是指根据周围邻居节点特征,汇聚中心节点,节点更新是指学习中心节点的嵌入表示。
示例性的,图4为本申请实施例提供的特征云图的示意图,如图4所示,特征云图中包括有多个节点,各个节点之间通过连接线来表示出关联关系。以节点A表示的是用户浏览了视频A为例,用节点B表示用户浏览了视频B为例,当用户在浏览视频A之后,如果继续浏览了视频B,则节点A与节点B之间存在关联关系。
步骤S203,根据特征云图和属性信息,确定特征结果。其中,特征结果包括第一感兴趣对象和第二感兴趣对象之间的关联关系,第一感兴趣对象为目标用户长期感兴趣的对象,第二感兴趣对象为目标用户短期感兴趣的对象。
在本实施例中,可以将特征云图和属性信息输入至图3中的循环神经网络层303。示例性的,循环神经网络层303可以是门控循环神经网络单元。其中,门控循环神经网络单元是为了更好地捕捉时间序列中时间步距离较大的依赖关系,它通过可以学习的门来控制信息的流动。门控循环神经网络单元它引入了重置门(reset gate)和更新门(updategate)的概念,门控循环神经网络单元的重置门和更新门的输入均为当前时间步输入
Figure 749644DEST_PATH_IMAGE004
与上一时间步的隐藏状态
Figure 226893DEST_PATH_IMAGE005
,然后由激活函数sigmoid的全连接层来计算得到对应的输出。这里的隐藏变量能够捕捉截至当前时间步的序列的历史信息,就像是神经网络当前时间步的状态或记忆一样,因此,该隐藏变量也称为隐藏状态。其次,收集用户的属性信息(年龄、住址、兴趣爱好等)通过联接操作加入到门控循环神经网络单元中丰富数据的表征能力以解决推荐算法冷启动问题,从而可以为用户提供更为精准的推荐服务。其中,冷启动问题是指当对一个新注册的用户来说,由于缺乏其相关的历史行为记录,无法给予新用户精确的信息推荐的问题。
步骤S204,根据特征结果,对预设初始模型的参数进行优化更新,得到目标模型。其中,预设初始模型包括嵌入层、与嵌入层连接的第一图神经网络、与第一图神经网络连接的循环神经网络、与循环神经网络连接的第二图神经网络、与第二图神经网络连接的归一化层,目标模型用于预测目标用户的感兴趣对象。
在本实施例中,参考图3,预设初始模型中的嵌入层可以是指图3中的图嵌入层301,预设初始模型中的第一图神经网络即图3中的第一图神经网络层302,由三个图神经网络模块构成。预设初始模型中的循环神经网络可以是指图3中循环神经网络层303,其具体可以是门控循环神经网络单元。预设初始模型中的第二图神经网络即图3中的第二图神经网络层304,由三个图神经网络模块构成。
其中,为了学习预设初始模型的参数,可以使用softmax函数对特征结果进行归一化,以获得概率分布,公式如下所示:
Figure 545879DEST_PATH_IMAGE006
上式中,y表示感兴趣对象的概率分布,x为输入人,即特征结果。
然后在模型训练中,可以通过最小化预测概率分布的交叉熵损失,采用神经网络反向传播对模型进行优化,该损失函数如下所示:
Figure 588921DEST_PATH_IMAGE001
上式中,L表示损失函数,N表示感兴趣对象的数量,
Figure 974641DEST_PATH_IMAGE002
表示第i个感兴趣对象所属的类别,
Figure 798241DEST_PATH_IMAGE003
表示预测第i个目标对象所属类别的概率。
本申请实施例通过通过收集用户的行为日志数据以及用户的属性信息,基于行为数据和属性信息确定出用户的短期兴趣与长期兴趣之间的关联关系,使得新注册用户也可以得到与自己长短期的个人兴趣相关的推荐,实现为新注册的用户提供更加准确的个性化推荐服务。
在另一些实施例中,上述步骤S202具体可以通过如下步骤实现:对行为数据进行预处理,得到预处理之后的数据;将预处理之后的数据转换为图嵌入表征,图嵌入表征中包括至少两个节点;确定图嵌入表征中各个节点之间的关联关系;根据图嵌入表征中的各个节点和各个节点之间的关联关系,确定特征云图。
在本实施例中,行为数据通常是文本形式的数据,其通过预处理之后转化为向量形式的数据,即数据的向量化。其中,预处理后的数据将输入到图3中的图嵌入层301,通过图嵌入层301转换为第一图神经网络层302能够识别输出的相关数据。图嵌入是指将图节点或子图以向量的形式表达,供给模型直接使用,图嵌入就像是词嵌入,词嵌入就是词的向量表达,可以供给一个分类模型做分类,而图神经网络就像全连接神经网络,全连接神经网络可以直接对一些问题做分类,帮助训练词嵌入。
其中,预处理之后的数据通过图嵌入层转换成图神经网络能够识别输出的相关数据之后,将输入至图3中的第一图神经网络层302确定出图嵌入表征中各个节点之间的关联关系,以输出特征云图。
本申请实施例通过对行为数据转换为图嵌入表征并确定图嵌入表征中各个节点以及各个节点的关联关系,能够将数据映射为低微稠密向量,能够更好的解决图数据难以高效输入机器学习算法的问题,提高模型的训练效率。
在另一些实施例中,在对行为数据进行预处理时,具体可以通过如下步骤实现:从行为数据中提取得到目标用户的显性数据和隐性数据,对目标用户的显性数据和隐性数据进行预处理,得到预处理之后的数据。其中,显性数据包括目标用户产生的用户评价,隐性数据包括目标用户的浏览历史和浏览时长。
示例性的,用户评价具体可以包括用户的内容评论、点赞等,如感兴趣对象为视频A为例,用户可以对该视频A发表评论以及点赞等。
在本实施例中,可以通过自然语言处理的特征工程技术来对显性数据和隐性数据进行预处理。其中,特征工程技术是指用一系列工程化的方式从原始数据中筛选出更好的数据特征,以提升模型的训练效果。示例性的,预处理可以包括归一化、离散化、数据变换、降维、特征选择等。其中,收集得到的行为数据通常需要进行预处理,比如行为数据存在计算量复杂度高,不容易收敛的问题,而且数据不符合正态分布,无法做一些符合正态分布的数学分析。
本申请实施例通过在行为数据中提取得到用户的显性数据和隐性数据并进行预处理,可以实现数据的标准化和归一化,解决数据计算量大,且需要花费大量训练时长的问题,进一步提高模型的训练效率。
在另一些实施例中,对目标用户的显性数据和隐性数据进行预处理具体可以通过如下步骤实现:对目标用户的显性数据和隐性数据进行归一化处理,得到归一化之后的数据;根据归一化之后的数据,得到预处理之后的数据。
在本实施例中,归一化主要是将数据统一映射到[0,1]区间上。示例性的,在另一些实施例中,在对显性数据和隐性数据进行归一化处理时,还可进行数据标准化,数据标准化的方法有很多,例如“最小-最大标准化”、“按小数定标标准化”等。通过标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析。
本申请实施例通过对显性数据和隐性数据进行归一化处理,在进行模型训练时,可以提高模型的收敛速度和模型的精度,使得训练得到的目标模型能够具有较好的效果,从而更好的为用户提供信息推送服务。
在另一些实施例中,在得到归一化之后的数据之后,可以对归一化之后的数据进行特征选择,筛选得到特征数据,并对特征数据进行降维得到预处理之后的数据。其中,特征数据的相关性大于预设阈值。
在本实施例中,特征选择可以得到相关性更强的特征信息,特征选择是从已有的M个特征中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。
其中,在筛选得到特征数据之后,可以通过主成分分析法来对数据进行降维处理以解决计算量大,训练时间长的问题。其中,主成分分析法(Principal ComponentAnalysis,PCA),是一种统计方法,通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
本申请实施例通过对数据进行特征筛选,能够降低模型发生的过拟合的风险,而通过主成分分析法对数据进行降维,可以解决数据计算量大,训练时间长的问题,提高模型的训练效率。
在一些实施例中,图5为本申请实施例提供的数据预处理的流程示意图,如图5所示,该方法具体可以包括步骤S501,数据预处理;步骤S502,特征选择;步骤S503,降维处理;步骤S504,模型训练。其中,在进行数据预处理时,通过自然语言处理的特征工程技术来进行特征处理,通过标准化以及归一化等操作以后得到预处理数据。然后通过特征选择来得到相关性更强的特征信息,最后通过主成分分析法来对数据进行降维处理以解决计算量大,训练时间长的问题。
本实施例通过步骤S503得到的数据将输入至上述图3所示的图嵌入层301,由此实现整个模型训练的过程。其中,模型训练完成之后可以部署到计算机设备或者服务器上,由计算机设备或者服务器实现信息推送。
在一些实施例中,上述步骤S204具体可以通过如下步骤实现:对特征结果进行归一化,得到概率分布;根据概率分布和预设交叉熵损失函数,对初始模型的参数进行优化更新,得到目标模型。其中,概率分布用于指示目标用户对不同感兴趣对象的偏好程度。
在本实施例中,可以通过最小化预测概率分布的交叉熵损失,采用神经网络反向传播对模型进行优化,该预设交叉熵损失函数具体可以如下所示:
Figure 61863DEST_PATH_IMAGE001
上式中,L表示损失函数,N表示感兴趣对象的数量,
Figure 287308DEST_PATH_IMAGE002
表示第i个感兴趣对象所属的类别,
Figure 345394DEST_PATH_IMAGE003
表示预测第i个感兴趣对象所属类别的概率。
本申请实施例通过构建模型的嵌入层、第一图神经网络、循环神经网络、第二图神经网络、归一化层,并对模型参数的优化更新得到的目标模型,可以为新注册用户同样提供与之匹配的信息提送服务,该模型还可以基于用户的短期兴趣与长期兴趣为用户提供更为个性化的推荐,使得新注册用户不会因为缺乏历史数据而无法得到满意的信息推送服务,用户也可以得到与自己的长短期的个人兴趣相关的推荐。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图6为本申请实施例提供的数据处理装置的结构示意图,该数据处理装置可以集成在计算机上,也可以独立于计算机设备且与计算机设备协同实现本方案。如图6所示,该数据处理装置600包括信息获取模块610、特征确定模块620、结果确定模块630和参数优化模块640。
其中,信息获取模块610用于获取目标用户的行为日志和属性信息。行为日志中包括目标用户对感兴趣对象产生的行为数据。特征确定模块620用于根据行为数据,确定特征云图。特征云图中包括有至少两个节点和各个节点之间的关联关系,节点用于表征目标用户对感兴趣对象产生的行为。结果确定模块630用于根据特征云图和属性信息,确定特征结果。特征结果包括第一感兴趣对象和第二感兴趣对象之间的关联关系,第一感兴趣对象为目标用户长期感兴趣的对象,第二感兴趣对象为目标用户短期感兴趣的对象。参数优化模块640用于根据特征结果,对预设初始模型的参数进行优化更新,得到目标模型。预设初始模型包括嵌入层、与嵌入层连接的第一图神经网络、与第一图神经网络连接的循环神经网络、与循环神经网络连接的第二图神经网络、与第二图神经网络连接的归一化层,目标模型用于预测目标用户的感兴趣对象。
在另一些实施例中,上述特征确定模块具体可以用于:对行为数据进行预处理,得到预处理之后的数据;将预处理之后的数据转换为图嵌入表征,图嵌入表征中包括至少两个节点;确定图嵌入表征中各个节点之间的关联关系;根据图嵌入表征中的各个节点和各个节点之间的关联关系,确定特征云图。
在另一些实施例中,上述特征确定模块具体可以用于:从行为数据中提取得到目标用户的显性数据和隐性数据;对目标用户的显性数据和隐性数据进行预处理,得到预处理之后的数据。其中,显性数据包括目标用户产生的用户评价,隐性数据包括目标用户的浏览历史和浏览时长。
在另一些实施例中,上述特征确定模块具体可以用于:对目标用户的显性数据和隐性数据进行归一化处理,得到归一化之后的数据;根据归一化之后的数据,得到预处理之后的数据。
在另一些实施例中,上述特征确定模块具体可以用于:对归一化之后的数据进行特征选择,筛选得到特征数据;对特征数据进行降维得到预处理之后的数据。其中,特征数据的相关性大于预设阈值。
在另一些实施例中,上述参数优化模块具体可以用于:对特征结果进行归一化,得到概率分布;根据概率分布和预设交叉熵损失函数,对初始模型的参数进行优化更新,得到目标模型。其中,概率分布用于指示目标用户对不同感兴趣对象的偏好程度。
可选的,上述预设交叉熵损失函数具体可以为:
Figure 656289DEST_PATH_IMAGE001
上式中,L表示损失函数,N表示感兴趣对象的数量,
Figure 458023DEST_PATH_IMAGE002
表示第i个感兴趣对象所属的类别,
Figure 537975DEST_PATH_IMAGE003
表示预测第i个感兴趣对象所属类别的概率。
本申请实施例提供的装置,可用于执行上述实施例中的方法,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,信息获取模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上信息获取模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
图7为本申请实施例提供的计算机设备的结构示意图。如图7所示,该计算机设备700包括:至少一个处理器710、存储器720、总线730及通信接口740。
其中:处理器710、通信接口740以及存储器720通过总线730完成相互间的通信。通信接口740,用于与其它设备进行通信。该通信接口740包括用于进行数据传输的通信接口以及用于进行人机交互的显示界面或者操作界面等。处理器710用于执行计算机执行指令,具体可以执行上述实施例中所描述的方法中的相关步骤。处理器可能是中央处理器,或者是特定集成电路(Application Specific Integrated Circuit,ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。存储器720,用于存放计算机执行指令。存储器可能包含高速RAM存储器,也可能还包括非易失性存储器,例如至少一个磁盘存储器。
本实施例还提供一种可读存储介质,可读存储介质中存储有计算机指令,当计算机设备的至少一个处理器执行该计算机指令时,计算机设备执行上述的各种实施方式提供的数据处理方法。
本实施例还提供一种程序产品,该程序产品包括计算机指令,该计算机指令存储在可读存储介质中。计算机设备的至少一个处理器可以从可读存储介质读取该计算机指令,至少一个处理器执行该计算机指令使得计算机设备实施上述的各种实施方式提供的数据处理方法。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中,a,b,c可以是单个,也可以是多个。
可以理解的是,在本申请实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本申请的实施例的范围。在本申请的实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请的实施例的实施过程构成任何限定。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (8)

1.一种数据处理方法,其特征在于,包括:
获取目标用户的行为日志和属性信息,所述行为日志中包括所述目标用户对感兴趣对象产生的行为数据;
根据所述行为数据,确定特征云图,所述特征云图中包括有至少两个节点和各个节点之间的关联关系,所述节点用于表征所述目标用户对感兴趣对象产生的行为;
根据所述特征云图和所述属性信息,确定特征结果,所述特征结果包括第一感兴趣对象和第二感兴趣对象之间的关联关系,所述第一感兴趣对象为所述目标用户长期感兴趣的对象,所述第二感兴趣对象为所述目标用户短期感兴趣的对象;
根据所述特征结果,对预设初始模型的参数进行优化更新,得到目标模型,所述预设初始模型包括嵌入层、与所述嵌入层连接的第一图神经网络、与所述第一图神经网络连接的循环神经网络、与所述循环神经网络连接的第二图神经网络、与所述第二图神经网络连接的归一化层,所述目标模型用于预测所述目标用户的感兴趣对象;
所述根据所述行为数据,确定特征云图,包括:
从所述行为数据中提取得到所述目标用户的显性数据和隐性数据,所述显性数据包括所述目标用户产生的用户评价,所述隐性数据包括所述目标用户的浏览历史和浏览时长;
对所述目标用户的显性数据和隐性数据进行预处理,得到预处理之后的数据,所述预处理包括特征选择,所述特征选择用于筛选出相关性大于预设阈值的特征数据;
将所述预处理之后的数据通过所述嵌入层转换为所述第一图神经网络能够识别输出的相关数据;
将所述相关数据输入至所述第一图神经网络确定图嵌入表征,所述图嵌入表征中包括至少两个节点,所述图嵌入表征是利用消息传播机中的消息汇聚和节点更新获得,所述消息汇聚是指根据周围邻居节点特征,汇聚中心节点,所述节点更新是指学习中心节点的嵌入表示;
确定所述图嵌入表征中各个节点之间的关联关系;
根据所述图嵌入表征中的各个节点和各个节点之间的关联关系,确定所述特征云图;
所述根据所述特征云图和所述属性信息,确定特征结果,包括:
将特征云图和属性信息输入至循环神经网络层,确定特征结果,其中,所述循环神经网络层为门控循环神经网络单元,所述门控循环神经网络单元用于捕捉时间序列中时间步距离超过阈值的依赖关系。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标用户的显性数据和隐性数据进行预处理,得到预处理之后的数据,包括:
对所述目标用户的显性数据和隐性数据进行归一化处理,得到归一化之后的数据;
根据所述归一化之后的数据,得到预处理之后的数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述归一化之后的数据,得到预处理之后的数据,包括:
对所述归一化之后的数据进行特征选择,筛选得到特征数据,所述特征数据的相关性大于预设阈值;
对所述特征数据进行降维得到所述预处理之后的数据。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据所述特征结果,对预设初始模型的参数进行优化更新,得到目标模型,包括:
对所述特征结果进行归一化,得到概率分布,所述概率分布用于指示所述目标用户对不同感兴趣对象的偏好程度;
根据所述概率分布和预设交叉熵损失函数,对所述初始模型的参数进行优化更新,得到所述目标模型。
5.根据权利要求4所述的方法,其特征在于,所述预设交叉熵损失函数为:
Figure 335456DEST_PATH_IMAGE002
上式中,L表示损失函数,N表示感兴趣对象的数量,
Figure DEST_PATH_IMAGE003
表示第i个感兴趣对象所属的类别,
Figure 803609DEST_PATH_IMAGE004
表示预测第i个感兴趣对象所属类别的概率。
6.一种数据处理装置,其特征在于,包括:
信息获取模块,用于获取目标用户的行为日志和属性信息,所述行为日志中包括所述目标用户对感兴趣对象产生的行为数据;
特征确定模块,用于根据所述行为数据,确定特征云图,所述特征云图中包括有至少两个节点和各个节点之间的关联关系,所述节点用于表征所述目标用户对感兴趣对象产生的行为;
结果确定模块,用于根据所述特征云图和所述属性信息,确定特征结果,所述特征结果包括第一感兴趣对象和第二感兴趣对象之间的关联关系,所述第一感兴趣对象为所述目标用户长期感兴趣的对象,所述第二感兴趣对象为所述目标用户短期感兴趣的对象;
参数优化模块,用于根据所述特征结果,对预设初始模型的参数进行优化更新,得到目标模型,所述预设初始模型包括嵌入层、与所述嵌入层连接的第一图神经网络、与所述第一图神经网络连接的循环神经网络、与所述循环神经网络连接的第二图神经网络、与所述第二图神经网络连接的归一化层,所述目标模型用于预测所述目标用户的感兴趣对象;
所述特征确定模块,具体用于:
从所述行为数据中提取得到所述目标用户的显性数据和隐性数据,所述显性数据包括所述目标用户产生的用户评价,所述隐性数据包括所述目标用户的浏览历史和浏览时长;
对所述目标用户的显性数据和隐性数据进行预处理,得到预处理之后的数据,所述预处理包括特征选择,所述特征选择用于筛选出相关性大于预设阈值的特征数据;
将所述预处理之后的数据通过所述嵌入层转换为所述第一图神经网络能够识别输出的相关数据;
将所述相关数据输入至所述第一图神经网络确定图嵌入表征,所述图嵌入表征中包括至少两个节点,所述图嵌入表征是利用消息传播机中的消息汇聚和节点更新获得,所述消息汇聚是指根据周围邻居节点特征,汇聚中心节点,所述节点更新是指学习中心节点的嵌入表示;
确定所述图嵌入表征中各个节点之间的关联关系;
根据所述图嵌入表征中的各个节点和各个节点之间的关联关系,确定所述特征云图;
所述结果确定模块,具体用于:
将特征云图和属性信息输入至循环神经网络层,确定特征结果,其中,所述循环神经网络层为门控循环神经网络单元,所述门控循环神经网络单元用于捕捉时间序列中时间步距离超过阈值的依赖关系。
7.一种计算机设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-5中任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现如权利要求1-5任一项所述的方法。
CN202210977812.6A 2022-08-16 2022-08-16 数据处理方法、装置、设备、介质和程序产品 Active CN115062230B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210977812.6A CN115062230B (zh) 2022-08-16 2022-08-16 数据处理方法、装置、设备、介质和程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210977812.6A CN115062230B (zh) 2022-08-16 2022-08-16 数据处理方法、装置、设备、介质和程序产品

Publications (2)

Publication Number Publication Date
CN115062230A CN115062230A (zh) 2022-09-16
CN115062230B true CN115062230B (zh) 2023-01-06

Family

ID=83208407

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210977812.6A Active CN115062230B (zh) 2022-08-16 2022-08-16 数据处理方法、装置、设备、介质和程序产品

Country Status (1)

Country Link
CN (1) CN115062230B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915395A (zh) * 2020-07-07 2020-11-10 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法
CN112561663A (zh) * 2020-12-24 2021-03-26 杭州搜车数据科技有限公司 车辆推荐方法、装置、计算机设备和存储介质
CN114491267A (zh) * 2022-01-29 2022-05-13 桂林电子科技大学 一种物品的推荐方法、装置以及存储介质
CN114519145A (zh) * 2022-02-22 2022-05-20 哈尔滨工程大学 一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060097A (zh) * 2019-04-01 2019-07-26 苏州市职业大学 基于注意力机制和卷积神经网络的用户行为序列推荐方法
CN113536139B (zh) * 2021-09-15 2022-02-11 湖南工商大学 基于兴趣的内容推荐方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915395A (zh) * 2020-07-07 2020-11-10 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法
WO2022007526A1 (zh) * 2020-07-07 2022-01-13 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法
CN112561663A (zh) * 2020-12-24 2021-03-26 杭州搜车数据科技有限公司 车辆推荐方法、装置、计算机设备和存储介质
CN114491267A (zh) * 2022-01-29 2022-05-13 桂林电子科技大学 一种物品的推荐方法、装置以及存储介质
CN114519145A (zh) * 2022-02-22 2022-05-20 哈尔滨工程大学 一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法

Also Published As

Publication number Publication date
CN115062230A (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
CN107330115B (zh) 一种信息推荐方法及装置
US11238211B2 (en) Automatic hyperlinking of documents
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
WO2022016556A1 (zh) 一种神经网络蒸馏方法以及装置
EP4181026A1 (en) Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium
CN112765480B (zh) 一种信息推送方法、装置及计算机可读存储介质
CN112052387B (zh) 一种内容推荐方法、装置和计算机可读存储介质
CN113158554B (zh) 模型优化方法、装置、计算机设备及存储介质
CN113761359B (zh) 数据包推荐方法、装置、电子设备和存储介质
CN112085565A (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
CN112150238A (zh) 一种基于深度神经网络的商品推荐方法及系统
CN112749737A (zh) 图像分类方法及装置、电子设备、存储介质
Unger et al. Hierarchical latent context representation for context-aware recommendations
CN113657087B (zh) 信息的匹配方法及装置
CN117216281A (zh) 一种基于知识图谱的用户兴趣扩散推荐方法及系统
CN112817563A (zh) 目标属性配置信息确定方法、计算机设备和存储介质
CN115730125A (zh) 对象识别方法、装置、计算机设备和存储介质
CN114817692A (zh) 确定推荐对象的方法、装置和设备及计算机存储介质
CN115062230B (zh) 数据处理方法、装置、设备、介质和程序产品
Landolsi et al. Image annotation in social networks using graph and multimodal deep learning features
CN113822291A (zh) 一种图像处理方法、装置、设备及存储介质
Li An Advertising Recommendation Algorithm Based on Deep Learning Fusion Model
Zhang et al. Robust saliency detection via corner information and an energy function
Tran et al. Improvement graph convolution collaborative filtering with weighted addition input

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 518000 Guangdong Shenzhen Baoan District Xixiang street, Wutong Development Zone, Taihua Indus Industrial Park 8, 3 floor.

Patentee after: Shenzhen Haiqing Zhiyuan Technology Co.,Ltd.

Address before: 518100 Guangdong Shenzhen Baoan District Xixiang street, Wutong Development Zone, Taihua Indus Industrial Park 8, 3 floor.

Patentee before: SHENZHEN HIVT TECHNOLOGY Co.,Ltd.