CN112883257A - 行为序列数据处理方法、装置、电子设备及存储介质 - Google Patents
行为序列数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112883257A CN112883257A CN202110034304.XA CN202110034304A CN112883257A CN 112883257 A CN112883257 A CN 112883257A CN 202110034304 A CN202110034304 A CN 202110034304A CN 112883257 A CN112883257 A CN 112883257A
- Authority
- CN
- China
- Prior art keywords
- behavior
- behavior sequence
- target
- historical
- time difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 66
- 230000009471 action Effects 0.000 claims abstract description 10
- 230000006399 behavior Effects 0.000 claims description 660
- 230000009466 transformation Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 abstract description 56
- 230000000694 effects Effects 0.000 abstract description 8
- 239000013598 vector Substances 0.000 description 43
- 230000008569 process Effects 0.000 description 36
- 238000013528 artificial neural network Methods 0.000 description 33
- 238000000605 extraction Methods 0.000 description 30
- 238000012549 training Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 238000002372 labelling Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开关于一种行为序列数据处理方法、装置、电子设备及存储介质,该方法包括获取目标对象的历史行为序列,历史行为序列包括目标对象的多个历史行为记录;确定每个历史行为记录中的行为时间与当前时间的时间差;基于时间差,生成每个历史行为记录对应的位置编码信息,位置编码信息表征每个历史行为记录与多个历史行为记录中其他历史行为记录间的区分度,每个历史行为记录对应的区分度与每个历史行为记录对应的时间差成反比;基于位置编码信息对历史行为序列进行编码处理,得到目标行为序列特征。利用本公开实施例可以使得目标行为序列特征更好地反映对象当前的真实兴趣偏好,进而提升后续进行信息推荐的精准性和推荐效果。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及一种行为序列数据处理方法、装置、电子设备及存储介质。
背景技术
在许多场景下,需要对用户行为序列进行分析和处理。用户行为序列,是用户在日常操作使用中产生的一系列点击、访问、购买等事件的发生过程,它蕴含了用户的细粒度兴趣偏好等特点,是用户级别机器学习模型的重要特征来源之一。
相关技术中,往往直接将包括很长一段时间内的用户大量历史行为记录的行为序列,作为学习用户兴趣偏好的历史数据,但行为序列本身包含了大量不同历史时间的历史行为记录,无法有效表征用户当前的兴趣偏好,造成推荐系统中推荐精准性和效果差的问题。
发明内容
本公开提供一种行为序列数据处理方法、装置、电子设备及存储介质,以至少解决相关技术中行为序列无法有效表征用户当前的兴趣偏好,造成推荐系统中推荐精准性和效果差的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种行为序列数据处理方法,包括:
获取目标对象的历史行为序列,所述历史行为序列包括所述目标对象的多个历史行为记录;
确定每个历史行为记录中的行为时间与当前时间的时间差;
基于所述时间差,生成每个所述历史行为记录对应的位置编码信息,所述位置编码信息表征每个所述历史行为记录与所述多个历史行为记录中其他历史行为记录间的区分度,每个所述历史行为记录对应的区分度与每个所述历史行为记录对应的时间差成反比;
基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征。
可选的,所述方法还包括:
获取所述目标对象的当前行为数据,所述当前行为数据表征所述目标对象对所述当前时间推荐给所述目标对象的推荐信息的行为数据;
所述基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征包括:
基于所述位置编码信息和所述当前行为数据对所述历史行为序列进行编码处理,得到所述目标行为序列特征。
所述基于所述位置编码信息和所述当前行为数据对所述历史行为序列进行编码处理,得到所述目标行为序列特征包括:
将所述历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
对所述目标行为序列和所述当前行为数据进行特征提取,得到所述目标行为序列对应的初始行为序列特征和所述当前行为数据对应的行为特征信息;
对所述初始行为序列特征和所述行为特征信息进行注意力学习,得到所述目标行为序列特征。
可选的,所述基于所述时间差,生成每个所述历史行为记录对应的位置编码信息包括:
对所述时间差进行对数变换,得到目标时间差;
对所述目标时间差进行等区间分类,得到多个类别对应的第一时间差群组;
对所述多个类别对应的第一时间差群组进行独热编码,得到所述位置编码信息;
或,
基于所述时间差的数值大小对所述时间差进行递增分类,得到多个类别对应的第二时间差群组,其中,每个所述历史行为记录对应的时间差所对应类别的时间差区间范围与每个所述历史行为记录对应的时间差成反比;
对所述多个类别对应的第二时间差群组进行独热编码,得到所述位置编码信息。
可选的,所述基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征包括:
将所述历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
对所述目标行为序列进行特征提取,得到所述目标行为序列对应的初始行为序列特征;
对所述初始行为序列特征进行注意力学习,得到所述目标行为序列特征。
可选的,所述基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征包括:
将所述位置编码信息对所述历史行为序列输入位置编码网络进行编码处理,得到所述目标行为序列特征。
可选的,所述方法还包括:
获取多个样本对象的样本行为序列和多个样本对象对应的多任务标注结果,每个样本对象的样本行为序列包括所述每个样本对象在预设历史时间之前的多个样本行为记录;
确定每个样本行为记录中的行为时间与所述预设历史时间的样本时间差;
基于所述样本时间差,生成每个所述样本行为记录对应的样本位置编码信息,所述样本位置编码信息表征每个样本对象对应的每个所述样本行为记录与每个所述样本对象对应的所述多个样本行为记录中其他样本行为记录间的区分度,每个所述样本行为记录对应的区分度与每个所述样本行为记录对应的样本时间差成反比;
将所述样本行为序列和所述样本位置编码信息输入第一待训练神经网络进行编码处理,得到样本行为序列特征;
将所述样本序列特征输入第二待训练神经网络进行多任务处理,得到所述多个样本对象对应的多任务预测结果;
根据所述多任务预测结果和所述多任务标注结果,确定目标损失;
基于所述目标损失训练所述第一待训练神经网络和所述第二待训练神经网络,得到所述目标编码网络和多任务处理网络。
可选的,所述方法还包括:
将所述目标行为序列特征输入多任务处理网络进行多任务处理,得到多任务处理结果;
根据所述多任务处理结果向所述目标对象推荐目标信息。
根据本公开实施例的第二方面,提供一种行为序列数据处理装置,包括:
历史行为序列获取模块,被配置为执行获取目标对象的历史行为序列,所述历史行为序列包括所述目标对象的多个历史行为记录;
时间差确定模块,被配置为执行确定每个历史行为记录中的行为时间与当前时间的时间差;
位置编码信息生成模块,被配置为执行基于所述时间差,生成每个所述历史行为记录对应的位置编码信息,所述位置编码信息表征每个所述历史行为记录与所述多个历史行为记录中其他历史行为记录间的区分度,每个所述历史行为记录对应的区分度与每个所述历史行为记录对应的时间差成反比;
第一编码处理模块,被配置为执行基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征。
可选的,所述装置还包括:
当前行为数据获取模块,被配置为执行获取所述目标对象的当前行为数据,所述当前行为数据表征所述目标对象对所述当前时间推荐给所述目标对象的推荐信息的行为数据;
所述第一编码处理模块还被配置为执行基于所述位置编码信息和所述当前行为数据对所述历史行为序列进行编码处理,得到所述目标行为序列特征。
可选的,所述第一编码处理模块包括:
第一位置编码单元,被配置为执行将所述历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
第一特征提取处理单元,被配置为执行对所述目标行为序列和所述当前行为数据进行特征提取,得到所述目标行为序列对应的初始行为序列特征和所述当前行为数据对应的行为特征信息;
第一注意力学习单元,被配置为执行对所述初始行为序列特征和所述行为特征信息进行注意力学习,得到所述目标行为序列特征。
可选的,所述位置编码信息生成模块包括:
第一对数变换单元,被配置为执行对所述时间差进行对数变换,得到目标时间差;
第一等区间分类单元,被配置为执行对所述目标时间差进行等区间分类,得到多个类别对应的第一时间差群组;
第一独热编码单元,被配置为执行对所述多个类别对应的第一时间差群组进行独热编码,得到所述位置编码信息;
或,
第一递增分类单元,被配置为执行基于所述时间差的数值大小对所述时间差进行递增分类,得到多个类别对应的第二时间差群组,其中,每个所述历史行为记录对应的时间差所对应类别的时间差区间范围与每个所述历史行为记录对应的时间差成反比;
第二独热编码单元,被配置为执行对所述多个类别对应的第二时间差群组进行独热编码,得到所述位置编码信息。
可选的,所述第一编码处理模块包括:
第二位置编码单元,被配置为执行将所述历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
第二特征提取单元,被配置为执行对所述目标行为序列进行特征提取,得到所述目标行为序列对应的初始行为序列特征;
第二注意力学习单元,被配置为执行对所述初始行为序列特征进行注意力学习,得到所述目标行为序列特征。
可选的,所述第一编码处理模块还被配置为执行将所述位置编码信息对所述历史行为序列输入位置编码网络进行编码处理,得到所述目标行为序列特征。
可选的,所述装置还包括:
训练数据获取模块,被配置为执行获取多个样本对象的样本行为序列和多个样本对象对应的多任务标注结果,每个样本对象的样本行为序列包括所述每个样本对象在预设历史时间之前的多个样本行为记录;
样本时间差确定模块,被配置为执行确定每个样本行为记录中的行为时间与所述预设历史时间的样本时间差;
样本位置编码信息生成模块,被配置为执行基于所述样本时间差,生成每个所述样本行为记录对应的样本位置编码信息,所述样本位置编码信息表征每个样本对象对应的每个所述样本行为记录与每个所述样本对象对应的所述多个样本行为记录中其他样本行为记录间的区分度,每个所述样本行为记录对应的区分度与每个所述样本行为记录对应的样本时间差成反比;
第二编码处理模块,被配置为执行将所述样本行为序列和所述样本位置编码信息输入第一待训练神经网络进行编码处理,得到样本行为序列特征;
第二多任务处理模块,被配置为执行将所述样本序列特征输入第二待训练神经网络进行多任务处理,得到所述多个样本对象对应的多任务预测结果;
目标损失确定模块,被配置为执行根据所述多任务预测结果和所述多任务标注结果,确定目标损失;
网络训练模块,被配置为执行基于所述目标损失训练所述第一待训练神经网络和所述第二待训练神经网络,得到所述目标编码网络和多任务处理网络。
可选的,所述装置还包括:
第一多任务处理模块,被配置为执行将所述目标行为序列特征输入多任务处理网络进行多任务处理,得到多任务处理结果;
信息推荐模块,被配置为执行根据所述多任务处理结果向所述目标对象推荐目标信息。
根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如上述第一方面中任一项所述的方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行本公开实施例的第一方面中任一所述方法。
根据本公开实施例的第五方面,提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例的第一方面中任一所述方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
在进行历史行为序列处理过程中,结合历史行为序列中多个历史行为记录中的行为时间与当前时间的时间差,来生成表征每个历史行为记录与其他历史行为记录间的区分度的位置编码信息,每个历史行为记录对应的区分度与每个历史行为记录对应的时间差成反比,且在对历史行为序列编码处理时,加入该位置编码信息,使得编码过程中,可以更好的侧重对近期行为记录的学习,保证得到的目标行为序列特征可以保留更多的近期行为记录,可以更好地反映对象当前的真实兴趣偏好,进而提升后续进行信息推荐的精准性和推荐效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种应用环境的示意图;
图2是根据一示例性实施例示出的一种行为序列数据处理方法的流程图;
图3是根据一示例性实施例示出的一种基于时间差,生成每个历史行为记录对应的位置编码信息的流程示意图;
图4是根据一示例性实施例示出的一种基于位置编码信息对历史行为序列进行编码处理,得到目标行为序列特征的流程示意图;
图5是根据一示例性实施例示出的另一种基于位置编码信息对历史行为序列进行编码处理,得到目标行为序列特征的流程图;
图6是根据一示例性实施例示出的一种训练目标编码网络和多任务处理网络的流程图;
图7是根据一示例性实施例示出的一种行为序列数据处理装置框图;
图8是根据一示例性实施例示出的一种用于行为序列数据处理的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
请参阅图1,图1是根据一示例性实施例示出的一种应用环境的示意图,如图1所示,该应用环境可以包括服务器01和终端02。
在一个可选的实施例中,服务器01可以用于训练目标编码网络。具体的,服务器01可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一个可选的实施例中,终端02可以结合服务器01训练出的目标编码网络进行行为序列数据处理。具体的,终端02可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality,AR)/虚拟现实(virtualreality,VR)设备、智能可穿戴设备等类型的电子设备。可选的,电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。
此外,需要说明的是,图1所示的仅仅是本公开提供的一种应用环境,在实际应用中,还可以包括其他应用环境,例如目标编码网络的训练,也可以在终端02上实现。
本说明书实施例中,上述服务器01以及终端02可以通过有线或无线通信方式进行直接或间接地连接,本公开在此不做限制。
图2是根据一示例性实施例示出的一种行为序列数据处理方法的流程图,如图2所示,该行为序列数据处理方法用于终端、边缘计算节点等电子设备中,包括以下步骤。
在步骤S201中,获取目标对象的历史行为序列。
本说明书实施例中,目标对象可以为推荐系统中信息的推荐对象,可选的,目标对象可以为推荐系统中的单个用户,也可以为某一群体等。
在一个具体的实施例中,历史行为序列可以包括目标对象的多个历史行为记录。可选的,多个历史行为记录可以为当前时间之前一段时间(该一段时间可以预先设置)内目标对象的历史行为记录,也可以为当前时间之前目标对象全部的历史行为记录。具体的,每一历史行为记录可以表征目标对象行为过程中的相关信息。
在实际应用中,目标对象在不同业务中往往具有多种行为,且同一业务中目标对象也可以对应多种行为,例如点击行为、视频播放行为等。本说明书实施例中,可以结合实际应用需求选取一种或多种行为对应的记录作为目标对象的历史行为记录。
在一个可选的实施例中,在一些用户被动接收推荐视频的场景下,用户往往需要观看(播放)视频一段时间后再做反馈,导致用户主动择权降低,本说明书实施例中,通过选取播放历史记录为历史行为序列,可以更好的体现用户的兴趣偏好。
在一个具体的实施例中,在将目标对象的多个播放历史记录作为历史行为序列的情况下,该历史行为序列中每一播放历史记录可以包目标对象观看的视频id(即视频标识),视频作者id(即作者标识),视频时长,视频tag(主题标签),视频观看时长,视频观看时间(行为时间)等内容。
在步骤S203中,确定每个历史行为记录中的行为时间与当前时间的时间差。
在实际应用中,用户长期行为更多的体现用户的多兴趣分布,而短期的行为往往更能反映该用户当前的兴趣。具体的,多个历史行为记录是由目标对象在不同的时间进行了某一行为产生的,本说明书实施例中,可以通过确定每个历史行为记录中的行为时间与当前时间的时间差来区分该历史行为记录是目标对象短期内的行为记录还是长期的行为记录。
在步骤S205中,基于时间差,生成每个历史行为记录对应的位置编码信息。
本说明书实施例中,上述位置编码信息可以表征每个历史行为记录与多个历史行为记录中其他历史行为记录间的区分度,每个历史行为记录对应的区分度与该历史行为记录对应的时间差成反比。即时间差越小,该历史时间记录对应的区分度越高;时间差越大,该历史时间记录对应的区分度越低。
在一个具体的实施例中,如图3所示,基于时间差,生成每个历史行为记录对应的位置编码信息可以包括以下步骤:
在步骤S2051中,对时间差进行对数变换,得到目标时间差;
在步骤S2053中,对目标时间差进行等区间分类,得到多个类别对应的第一时间差群组;
在步骤S2055中,对多个类别对应的第一时间差群组进行独热编码,得到位置编码信息。
在一个具体的实施例中,在对时间差进行对数变换时,可以以无理数e为底数,时间差为真数。在实际应用中,在对时间差进行对数变换过程,时间差越小,对数变换后的数值间往往会更具有区分度;对数越大,对数变换后的数值间往往会区分度较小;通过对对数变化后得到的目标时间差进行等区间分类,可以实现时间差越小分类越细,时间差越大分类越粗的目的,接着对多个类别对应的第一时间差群组进行独热编码,可以使得同一类别对象中的第一时间差群组对应的位置编码信息相同,且由于时间差越小的分类越细,近期历史行为记录对应的位置编码信息间的区分度更高,进而有效保证后续编码过程中,近期行为记录具有更好的区分度。
在另一个具体的实施例中,基于时间差,生成每个历史行为记录对应的位置编码信息可以包括:
1)基于时间差的数值大小对时间差进行递增分类,得到多个类别对应的第二时间差群组,其中,每个历史行为记录对应的时间差所对应类别的时间差区间范围与每个历史行为记录对应的时间差成反比;
2)对多个类别对应的第二时间差群组进行独热编码,得到位置编码信息。
在一个具体的实施例中,假设上述多个历史时间记录对应的时间差划分成四个类别,且按照递增分类后,四个类别依次为:第一类别,时间差在0-10分钟(包括10分钟)内;第二类别,时间差在10-60分钟(包括60分钟)内;第三类别,时间差在60-180分钟(包括180分钟)内;第四类别,时间差大于180分钟。
进一步的,针对上述多个历史时间记录对应的时间差:在0-10分钟内的时间差,可以划分到第一类别对应的时间差群组;在10-60分钟内的时间差,可以划分到第二类别对应的时间差群组;在60-180分钟内的时间差,可以划分到第三类别对应的时间差群组;大于180分钟的时间差,可以划分到第四类别对应的时间差群组。
上述实施例中,结合时间差的数值大小对多个历史行为记录对应的时间差进行递增分类,可以使得时间差越小分类越细,时间差越大分类越粗,有效保证近期历史行为记录对应的位置编码信息间的区分度更高,进而有效保证后续编码过程中,近期行为记录具有更好的区分度。
进一步的,对上述四个类别对应的时间差群组进行独热编码后,在第一类别对应的时间差群组中的时间差所对应的位置编码信息可以为:1000;在第二类别对应的时间差群组中的时间差,所对应的位置编码信息可以为:0100;在第三类别对应的时间差群组中的时间差,所对应的位置编码信息可以为:0010;在第四类别对应的时间差群组中的时间差,所对应的位置编码信息可以为:0001。
上述实施例中,结合历史行为序列中多个历史行为记录中的行为时间与当前时间的时间差,来生成表征每个历史行为记录与其他历史行为记录间的区分度的位置编码信息,且每个历史行为记录对应的区分度与每个历史行为记录对应的时间差成反比,可以有效保证后续编码过程中,更好的区分近期行为记录。
在步骤S207中,基于位置编码信息对历史行为序列进行编码处理,得到目标行为序列特征。
在一个具体的实施例中,如图4所示,基于位置编码信息对历史行为序列进行编码处理,得到目标行为序列特征可以包括以下步骤:
在步骤S401中,将历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
在步骤S403中,对目标行为序列进行特征提取,得到目标行为序列对应的初始行为序列特征;
在步骤S405中,对初始行为序列特征进行注意力学习,得到目标行为序列特征。
在一个具体的实施例中,目标行为序列对应的初始行为序列特征可以为目标行为序列对应的特征向量。在一个具体的实施例中,可以包括但不限于结合one-hot编码网络、N-Gram(汉语语言模型)等特征提取网络来对目标行为序列进行特征提取。
在一个具体的实施例中,初始行为序列特征中可以包括多个历史行为记录对应的行为特征,相应的,对初始行为序列特征进行注意力学习,得到目标行为序列特征可以包括将初始行为序列特征中每个行为特征分别与三个预设矩阵进行点积,得到每个行为特征各自对应的三个新的特征向量;基于三个新的特征向量进行注意力学习,得到目标行为序列特征。
在一个具体的实施例中,将初始行为序列特征与三个预设矩阵进行点积,得到对应的三个新的特征向量,可以包括结合下述公式:
Qi=Xi·w1
Ki=Xi·w2
Vi=Xi·w3
其中,Xi表示目标对象的初始行为序列特征中第i个行为特征,w1、w2、w3表示三个预设矩阵,其中,w2、w3可以为相同的矩阵。Qi表示第i个行为特征对应的三个新的特征向量中的第一特征向量;Ki表示第i个行为特征对应的三个新的特征向量中的第二特征向量;Vi表示第i个行为特征对应的三个新的特征向量中的第三特征向量。
上述实施例中,将初始行为序列特征中每个行为特征与三个预设矩阵进行点积,可以增加更多特征,进而提升编码效果。
在一个具体的实施例中,基于三个新的特征向量进行注意力学习,得到目标行为序列特征,可以包括结合下述公式:
其中,Zi表示第i个行为特征对应的目标行为序列特征;Qi表示第i个行为特征对应的三个新的特征向量中的第一特征向量;Vi表示第i个行为特征对应的三个新的特征向量中的第三特征向量;KT表示初始行为序列特征中多个行为特征对应的第二特征向量;dk表示初始行为序列特征中多个行为特征对应的第二特征向量的维度。
上述实施例中,在对历史行为序列进行编码过程中,结合可以表征目标对象的历史行为记录与该目标对象其他历史行为记录间的区分度的位置编码信息,且每个历史行为记录对应的区分度与该历史行为记录对应的时间差成反比,可以有效保证编码过程中,可以更好的侧重对近期行为记录的学习,使得得到的目标行为序列特征保留更多的近期行为记录,可以更好地反映对象当前的真实兴趣偏好,进而提升后续进行信息推荐的精准性。
在一个可选的实施例中,上述方法还可以包括:获取目标对象的当前行为数据,当前行为数据表征目标对象对当前时间推荐给目标对象的推荐信息的行为数据。
在实际应用中,推荐系统中其他负责信息推荐的模块可以在当前时间向目标对象推荐信息,相应的,可以获取目标对象的当前行为数据,当前行为数据表征目标对象对当前时间推荐给目标对象的推荐信息的行为数据;
相应的,如图5所示,基于位置编码信息和当前行为数据对历史行为序列进行编码处理,得到目标行为序列特征可以包括:
在步骤S501中,将历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
在步骤S503中,对目标行为序列和当前行为数据进行特征提取,得到目标行为序列对应的初始行为序列特征和当前行为数据对应的行为特征信息;
在步骤S505中,对初始行为序列特征和行为特征信息进行注意力学习,得到目标行为序列特征。
在一个具体的实施例中,目标行为序列对应的初始行为序列特征可以为目标行为序列对应的特征向量,当前行为数据对应的行为特征信息可以为当前行为数据对应的特征向量。在一个具体的实施例中,可以包括但不限于结合one-hot编码网络、N-Gram(汉语语言模型)等特征提取网络来对目标行为序列和当前行为数据进行特征提取。
在一个具体的实施例中,对初始行为序列特征和行为特征信息进行注意力学习,得到目标行为序列特征可以包括:将行为特征信息与第一预设矩阵进行点积,得到第四特征向量;将初始行为序列特征分别第二预设矩阵和第三预设矩阵进行点积,得到第五特征向量和第六特征向量;基于第四特征向量、第五特征向量和第六特征向量进行注意力学习,得到目标行为序列特征。
在一个具体的实施例中,上述得到第四特征向量、第五特征向量和第六特征向量,可以包括结合下述公式:
Q=Y·w1
K=X·w2
V=X·w3
其中,X表示目标对象的初始行为序列特征,Y表示目标对象的行为特征信息;w1、w2、w3表示依次表示第一预设矩阵、第二预设矩阵和第三预设矩阵,其中,w2、w3可以为相同的矩阵。Q表示行为特征信息对应的第四特征向量;K表示初始行为序列特征对应的第五样本特征向量;V表示初始行为序列特征对应的第六样本特征向量。
在一个具体的实施例中,基于第四特征向量、第五特征向量和第六特征向量进行注意力学习,得到目标行为序列特征,可以包括结合下述公式:
其中,Z表示目标行为序列特征征;Q表示行为特征信息对应的第四特征向量;K表示初始行为序列特征对应的第五样本特征向量;V表示初始行为序列特征对应的第六样本特征向量;KT表示表示初始行为序列特征对应的第五样本特征向量(由于在自注意力学习过程中除初始行为序列特征对应的第五样本特征向量,无其特征对应的第五样本特征向量);dk表示第五样本特征向量的维度。
上述实施例中,在对历史行为序列进行编码过程中,加入了目标对象在当前时间的当前行为数据,可以学习到更多的对象兴趣信息,且当前行为数据中的数量量往往比历史行为序列中的数据量少,可以有效降低编码过程中的复杂度,进而提升处理效率。
在一个可选的实施例中,基于位置编码信息对历史行为序列进行编码处理,得到目标行为序列特征可以包括将历史行为序列和位置编码信息输入目标编码网络进行编码处理,得到目标行为序列特征。相应的,可以预先训练目标编码网络,在实际应用中,目标编码网络训练过程中,可以结合实际应用对应的任务需求进行训练。在一个可选的实施例中,假设需要结合目标编码网络输出的目标行为序列特征进行多任务处理,相应的,上述方法还可以包括:预先训练目标编码网络和多任务处理网络的步骤,具体的,如图6所示,可以包括:
在步骤S601中,获取多个样本对象的样本行为序列和多个样本对象对应的多任务标注结果。
在一个具体的实施例中,多个样本对象可以为推荐系统中任意多个对象,每个样本对象的样本行为序列可以包括每个样本对象在预设历史时间之前的多个样本行为记录;具体的,预设历史时间可以为预设的某个向样本对象推荐信息的历史时刻。具体的,可以获取该样本对象对预设历史时间推荐的信息的历史行为数据,并结合历史行为数据确定样本对象对应的多任务标注结果。具体的,可以结合历史行为数据确定的每个任务的子任务标注结果。
在一个具体的实施例中,假设某一样本对象的历史行为数据包括:样本对象的对象标识,历史推荐信息的信息标识,点击该历史推荐信息的点击信息,未转发该历史推荐信息、属于长播放。假设多任务中的某一任务为预测样本对象是否会点击历史行为数据中的历史推荐信息;相应的,该任务对应的子任务标注结果为点击,可选的,可以通过1表示点击,0表示未点击;在另一个具体的实施例中,结合上述历史行为数据,假设多任务中的某一任务为预测样本对象是否会转发历史行为数据中的历史推荐信息;相应的,该任务对应的子任务标注结果为未转发,可选的,可以通过1表示转发,0表示未转发。
此外,需要说明的是,本说明书实施例中,多任务并不仅限于上述列举的两个任务,在实际应用中,还可以包括结合实际业务需求包括更多的业务,例如还可以包括时长相关预测任务(如是否为有效播放,是否为长播放,是否为短播放,观看时长预测),细分业务预测任务(如是否会下载推荐信息,进入是否会进入推荐信息的简介页面,在简介页面停留时长的预测)等等。
在步骤S603中,确定每个样本行为记录中的行为时间与预设历史时间的样本时间差。
在一个具体的实施例中,可以通过确定每个样本行为记录中的行为时间与预设历史时间的样本时间差来区分该样本行为记录在预设历史时间是样本对象短期内的行为记录还是长期的行为记录。
在步骤S605中,基于样本时间差,生成每个样本行为记录对应的样本位置编码信息。
本说明书实施例中,样本位置编码信息表征每个样本对象对应的每个样本行为记录与该样本对象对应的多个样本行为记录中其他样本行为记录间的区分度,每个样本行为记录对应的区分度与该样本行为记录对应的样本时间差成反比。在一个可选的实施例中,基于样本时间差,生成每个样本行为记录对应的样本位置编码信息可以包括:对样本时间差进行对数变换,得到目标样本时间差;对目标样本时间差进行等区间分类,得到多个类别对应的第一样本时间差群组;对多个类别对应的第一样本时间差群组进行独热编码,得到样本位置编码信息。
上述实施例中,通过对对数变化后得到的目标样本时间差进行等区间分类,可以实现样本时间差越小分类越细,样本时间差越大分类越粗的目的,接着对多个类别对应的第一样本时间差群组进行独热编码,可以使得同一类别对象中的第一样本时间差群组对应的位置编码信息相同,且由于时间差越小的分类越细,近期样本行为记录对应的样本位置编码信息间的区分度更高,进而有效保证后续编码过程中,近期行为记录具有更好的区分度。
在另一个可选的实施例中,基于样本时间差,生成每个样本行为记录对应的样本位置编码信息可以包括:基于样本时间差的数值大小对样本时间差进行递增分类,得到多个类别对应的第二样本时间差群组;对多个类别对应的第二样本时间差群组进行独热编码,得到样本位置编码信息。
上述实施例中,结合样本时间差的数值大小对多个样本行为记录对应的样本时间差进行递增分类,可以使得样本时间差越小分类越细,样本时间差越大分类越粗,有效保证近期样本行为记录对应的样本位置编码信息间的区分度更高,进而有效保证后续编码过程中,近期行为记录具有更好的区分度。
本说明书实施例中,基于样本时间差,生成每个样本行为记录对应的样本位置编码信息的相关步骤的具体细化,可以参见上述基于时间差,生成每个历史行为记录对应的位置编码信息的相关步骤的细化,在此不再赘述。
上述实施例中,结合样本行为序列中多个样本行为记录中的行为时间与预设历史时间的样本时间差,来生成可以表征每个样本对象对应的每个样本行为记录与该样本对象对应的多个样本行为记录中其他样本行为记录间的区分度的样本位置编码信息,且每个样本行为记录对应的区分度与每个样本行为记录对应的样本时间差成反比,可以有效保证后续编码过程中,更好的区分近期行为记录。
在步骤S607中,将样本行为序列和样本位置编码信息输入第一待训练神经网络进行编码处理,得到样本行为序列特征。
在一个具体的实施例中,第一待训练神经网络可以为待训练的编码网络。在一个可选的实施例中,上述第一待训练神经网络包括:待训练位置编码层、待训练特征提取层和待训练注意力学习层;相应的,上述将样本行为序列和样本位置编码信息输入第一待训练神经网络进行编码处理,得到样本行为序列特征可以包括:将样本行为序列和样本位置编码信息输入待训练位置编码层进行位置编码,得到目标样本行为序列;将目标样本行为序列输入待训练特征提取层进行特征提取,得到目标样本行为序列对应的初始样本行为序列特征;将初始样本行为序列特征输入待训练注意力学习层进行注意力学习,得到样本行为序列特征。
在一个具体的实施例中,将样本行为序列和样本位置编码信息输入待训练位置编码层进行位置编码,得到目标样本行为序列可以包括将样本行为序列的每个样本行为记录中的行为时间替换成对应的样本位置编码信息,得到目标样本行为序列。
在一个具体的实施例中,目标样本行为序列对应的初始样本行为序列特征可以为目标样本行为序列对应的特征向量。在一个具体的实施例中,待训练特征提取层可以包括但不限于one-hot(独热)编码网络、N-Gram(汉语语言模型)等。
在一个具体的实施例中,待训练注意力学习层可以为Transformer中一个编码网络中的自注意力层。在一个具体的实施例中,将初始样本行为序列特征输入待训练注意力学习层进行注意力学习,得到样本行为序列特征可以包括:将初始样本行为序列特征与三个预设矩阵进行点积,得到对应的三个新的特征向量;基于三个新的特征向量进行注意力学习,得到样本行为序列特征。
本说明书实施例中,将初始样本行为序列特征输入待训练注意力学习层进行注意力学习,得到样本行为序列特征的具体细化步骤可参见上述对初始行为序列特征进行注意力学习,得到目标行为序列特征的具体细化,在此不再赘述。其中,三个预设矩阵可以为网络参数。
在一个可选的实施例中,待训练注意力学习层可以为多头注意力学习层(即多个注意力学习层),每个样本对象在每个注意力学习层进行注意力学习后,可以得到一个样本行为序列特征,相应的,对多个注意力学习层输出的样本行为序列特征进行拼接,可以得到每个样本对象经多头注意力学习层学习后的样本行为序列特征。
上述实施例中,在对样本行为序列进行编码过程中,结合可以表征每个样本对象对应的每个样本行为记录与该样本对象对应的多个样本行为记录中其他样本行为记录间的区分度的样本位置编码信息,且每个样本行为记录对应的区分度与每个样本行为记录对应的样本时间差成反比,可以有效保证编码过程中,可以更好的侧重对近期行为记录的学习,使得得到的样本行为序列特征保留更多的近期行为记录,可以更好地反映对象当前的真实兴趣偏好,进而提升后续进行信息推荐的精准性。
在一个可选的实施例中,上述方法还可以包括:
获取多个样本对象对预设历史时间的推荐信息的样本行为数据;
相应的,将样本行为序列和样本位置编码信息输入第一待训练神经网络进行编码处理,得到样本行为序列特征可以包括:
将样本行为序列、样本位置编码信息和样本行为数据输入第一待训练神经网络进行编码处理,得到样本行为序列特征。
在一个具体的实施例中,将样本行为序列、样本位置编码信息和样本行为数据输入第一待训练神经网络进行编码处理,得到样本行为序列特征可以包括:将样本行为序列和样本位置编码信息输入待训练位置编码层进行位置编码,得到目标样本行为序列;将目标样本行为序列和样本行为数据输入待训练特征提取层进行特征提取,得到目标样本行为序列对应的初始样本行为序列特征和样本行为数据对应的样本行为特征信息;将初始样本行为序列特征和样本行为特征信息输入待训练注意力学习层进行注意力学习,得到样本行为序列特征。
在一个具体的实施例中,上述步将初始样本行为序列特征和样本行为特征信息输入待训练注意力学习层进行注意力学习,得到样本行为序列特征的具体细化可以参见对初始行为序列特征和行为特征信息进行注意力学习,得到目标行为序列特征的具体细化步骤,在此不再赘述,其中,第一预设矩阵、第二预设矩阵和第三预设矩阵可以为网络参数。
在一个可选的实施例中,在待训练注意力学习层为多头注意力学习层(即多个注意力学习层),每个样本对象在每个注意力学习层进行注意力学习后,可以得到一个样本行为序列特征,相应的,对多个注意力学习层输出的样本行为序列特征进行拼接,可以得到每个样本对象经多头注意力学习层学习后的样本行为序列特征。
上述实施例中,在对样本行为序列进行编码过程中,加入了样本对象的历史行为数据,可以学习到更多的对象兴趣信息,且历史行为数据中的数量量往往比样本行为序列中的数据量少,可以有效降低编码过程中的复杂度,进而提升处理效率。
在步骤S609中,将样本序列特征输入第二待训练神经网络进行多任务处理,得到多个样本对象对应的多任务预测结果。
在一个具体的实施例中,第二待训练神经网络可以为待训练的多任务处理网络。可选的,该待训练的多任务处理网络可以为mmoe(Modeling Task Relationships inMulti-task Learning with Multi-gate Mixture-of-Experts,多任务学习模型)。具体的,第二待训练神经网络包括多个待训练子特征提取层、多个待训练子任务加权层和多个待训练子任务处理层,具体的,将样本序列特征输入第二待训练神经网络进行多任务处理,得到多个样本对象对应的多任务预测结果可以包括:
1)将样本序列特征输入多个待训练子特征提取层进行特征提取,得到得到多个样本序列子特征信息;
2)将多个样本序列子特征信息输入多个待训练子任务加权层进行任务加权处理,得到每个任务对应的样本加权特征信息;
3)将每个任务对应的样本加权特征信息输入对应的子任务处理层进行子任务处理,得到多个样本对象对应的多任务预测结果。
本说明书实施例中,多个待训练子特征提取层可以从不同角度提取样本序列特征中的特征,但由于多个任务是共用多个待训练子特征提取层,为了突出不同任务间的差异,上述多个待训练子任务加权层可以分别与一个任务相对应;每个待训练子任务加权层可以用于结合对应任务的需求,对多个样本序列子特征信息进行加权。相应的,每个任务对应的样本序列子特征信息可以更好的反映该任务关注的特征信息。具体的,多个样本序列子特征信息对应的权重,可以结合不同任务对对应样本序列子特征信息的关注程度来确定。
进一步的,可以将每个任务对应的样本加权特征信息输入该任务对应的子任务处理层进行子任务处理,得到每个任务对应的子任务预测结果,将多个任务对应的子任务预测结果作为上述多个样本对象对应的多任务预测结果。
在步骤S611中,根据多任务预测结果和多任务标注结果,确定目标损失;
在一个具体的实施例中,根据多任务预测结果和多任务标注结果,确定目标损失可以包括基于预设损失函数计算每个样本行为数据对应的子任务预测结果和子任务标注结果间的损失;以及对多个样本行为数据对应的损失相加,得到上述目标损失。
本说明书实施例中,预设损失函数可以包括但不限于交叉熵损失函数、逻辑损失函数、Hinge(铰链)损失函数、指数损失函数等,本说明书实施例并不以上述为限。
在步骤S613中,基于目标损失训练第一待训练神经网络和第二待训练神经网络,得到目标编码网络和多任务处理网络。
在一个具体的实施例中,基于目标损失训练第一待训练神经网络和第二待训练神经网络,得到目标编码网络和多任务处理网络可以包括
在目标损失不满足预设条件的情况下,更新第一待训练神经网络和第二待训练神经网络中的网络参数;
基于更新后第一待训练神经网络、第二待训练神经网络更新目标损失,至目标损失满足预设条件,将当前的第一待训练神经网络作为目标编码网络,将当前的第二待训练神经网络作为多任务处理网络。
在一个可选的实施例中目标损失满足预设条件可以为目标损失小于等于指定阈值,或前后两次训练过程中对应的目标损失间的差值小于一定阈值。本说明书实施例中,指定阈值和一定阈值可以为结合实际训练需求进行设置。
此外,需要说明书的是,在实际应用中,也可以结合目标编码网络输出的目标行为序列特征进行单任务处理。
上述实施例中,在进行目标编码网络训练过程中,先结合样本行为序列中多个样本行为记录中的行为时间与预设历史时间的样本时间差,生成可以表征每个样本对象对应的每个样本行为记录与该样本对象对应的多个样本行为记录中其他样本行为记录间的区分度的样本位置编码信息,且每个样本行为记录对应的区分度与每个样本行为记录对应的样本时间差成反比,然后,在对样本行为序列进行编码过程中,加入了该目标编码网络,可以有效保证编码过程中,可以更好的侧重对近期行为记录的学习,使得得到的样本行为序列特征,保留更多的近期行为记录,可以更好地反映对象当前的真实兴趣偏好,提升多任务处理结果的预测精准性,进而大大提升推荐系统中学习推荐精准性和推荐效果。
在一个具体的实施例中,结合上述待训练的编码网络的网络结构,训练好的目标编码网络可以包括:特征提取层、位置编码层和注意力学习层;
相应的,上述将历史行为序列和位置编码信息输入目标编码网络进行编码处理,得到目标行为序列特征可以包括:
将历史行为序列和位置编码信息输入位置编码层进行位置编码,得到目标行为序列;
将目标行为序列输入特征提取层进行特征提取,得到目标行为序列对应的初始行为序列特征;
将初始行为序列特征输入注意力学习层进行注意力学习,得到目标行为序列特征。
在一个具体的实施例中,将初始行为序列特征输入注意力学习层进行注意力学习,得到目标行为序列特征可以包括:将初始行为序列特征与三个预设矩阵进行点积,得到对应的三个新的特征向量;基于三个新的特征向量进行注意力学习,得到目标行为序列特征。
本说明书实施例中,将历史行为序列和位置编码信息输入目标编码网络进行编码处理,得到目标行为序列特征的相关步骤的具体细化可参见上述基于位置编码信息对历史行为序列进行编码处理,得到目标行为序列特征的相关步骤的具体细化,在此不再赘述。
上述实施例中,在对历史行为序列进行编码过程中,结合可以表征每个历史行为记录与其他历史行为记录间的区分度的位置编码信息,每个历史行为记录对应的区分度与每个历史行为记录对应的时间差成反比,可以有效保证编码过程中,可以更好的侧重对近期行为记录的学习,使得得到的目标行为序列特征保留更多的近期行为记录,可以更好地反映对象当前的真实兴趣偏好,进而提升后续进行信息推荐的精准性。
在一个可选的实施例中,上述将历史行为序列和位置编码信息输入目标编码网络进行编码处理,得到目标行为序列特征可以包括:
将历史行为序列、位置编码信息和当前行为数据输入目标编码网络进行编码处理,得到目标行为序列特征。
在一个具体的实施例中,将历史行为序列、位置编码信息和当前行为数据输入目标编码网络进行编码处理,得到目标行为序列特征可以包括:
将历史行为序列和位置编码信息输入位置编码层进行位置编码,得到目标行为序列;
将目标行为序列和当前行为数据输入特征提取层进行特征提取,得到目标行为序列对应的初始行为序列特征和当前行为数据对应的行为特征信息;
将初始行为序列特征和行为特征信息输入注意力学习层进行注意力学习,得到目标行为序列特征。
本说明书实施例中,将历史行为序列、位置编码信息和当前行为数据输入目标编码网络进行编码处理,得到目标行为序列特征的相关步骤的具体细化可参见上述基于位置编码信息和当前行为数据对历史行为序列进行编码处理,得到目标行为序列特征的相关步骤的具体细化,在此不再赘述。
上述实施例中,在对历史行为序列进行编码过程中,加入了目标对象的当前行为数据,可以学习到更多的对象兴趣信息,且当前行为数据中的数量量往往比历史行为序列中的数据量少,可以有效降低编码过程中的复杂度,进而提升处理效率。
在一个可选的实施例中,基于上述目标行为序列特征可以为后续进行信息推荐进行进一步的优化筛选,相应的,上述方法还包括:
将目标行为序列特征输入多任务处理网络进行多任务处理,得到多任务处理结果;
根据多任务处理结果向目标对象推荐目标信息。
在一个具体的实施例中,假设多任务中包括对目标对象是否点击某些推荐信息的预测任务,相应的,可以将对应的任务处理结果为点击的推荐信息作为目标信息,并推荐给目标对象。
上述实施例中,通过可以有效反应目标对象当前的真实兴趣偏好的目标行为序列特征来进行信息推荐,可以有效保证推荐的信息更好的满足用户需求,提升推荐精准性和推荐效果。
由以上本说明书实施例提供的技术方案可见,本说明书在进行历史行为序列处理过程中,结合历史行为序列中多个历史行为记录中的行为时间与当前时间的时间差,来生成表征每个历史行为记录与其他历史行为记录间的区分度的位置编码信息,每个历史行为记录对应的区分度与每个历史行为记录对应的时间差成反比,且在对历史行为序列编码处理时,加入该位置编码信息,使得编码过程中,可以更好的侧重对近期行为记录的学习,保证得到的目标行为序列特征可以保留更多的近期行为记录,可以更好地反映对象当前的真实兴趣偏好,进而提升后续进行信息推荐的精准性和推荐效果。
图7是根据一示例性实施例示出的一种行为序列数据处理装置框图。参照图7,该装置包括:
历史行为序列获取模块710,被配置为执行获取目标对象的历史行为序列,历史行为序列包括目标对象的多个历史行为记录;
时间差确定模块720,被配置为执行确定每个历史行为记录中的行为时间与当前时间的时间差;
位置编码信息生成模块730,被配置为执行基于时间差,生成每个历史行为记录对应的位置编码信息,位置编码信息表征每个历史行为记录与多个历史行为记录中其他历史行为记录间的区分度,每个历史行为记录对应的区分度与每个历史行为记录对应的时间差成反比;
第一编码处理模块740,被配置为执行基于位置编码信息对历史行为序列进行编码处理,得到目标行为序列特征。
可选的,上述装置还包括:
当前行为数据获取模块,被配置为执行获取目标对象的当前行为数据,当前行为数据表征目标对象对当前时间推荐给目标对象的推荐信息的行为数据;
第一编码处理模块740还被配置为执行基于位置编码信息和当前行为数据对历史行为序列进行编码处理,得到目标行为序列特征。
可选的,第一编码处理模块740包括:
第一位置编码单元,被配置为执行将历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
第一特征提取处理单元,被配置为执行对目标行为序列和当前行为数据进行特征提取,得到目标行为序列对应的初始行为序列特征和当前行为数据对应的行为特征信息;
第一注意力学习单元,被配置为执行对初始行为序列特征和行为特征信息进行注意力学习,得到目标行为序列特征。
可选的,位置编码信息生成模块730包括:
第一对数变换单元,被配置为执行对时间差进行对数变换,得到目标时间差;
第一等区间分类单元,被配置为执行对目标时间差进行等区间分类,得到多个类别对应的第一时间差群组;
第一独热编码单元,被配置为执行对多个类别对应的第一时间差群组进行独热编码,得到位置编码信息;
或,
第一递增分类单元,被配置为执行基于时间差的数值大小对时间差进行递增分类,得到多个类别对应的第二时间差群组,其中,每个历史行为记录对应的时间差所对应类别的时间差区间范围与每个历史行为记录对应的时间差成反比;
第二独热编码单元,被配置为执行对多个类别对应的第二时间差群组进行独热编码,得到位置编码信息。
可选的,第一编码处理模块740包括:
第二位置编码单元,被配置为执行将历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
第二特征提取单元,被配置为执行对目标行为序列进行特征提取,得到目标行为序列对应的初始行为序列特征;
第二注意力学习单元,被配置为执行对初始行为序列特征进行注意力学习,得到目标行为序列特征。
可选的,第一编码处理模块还被配置为执行将位置编码信息对历史行为序列输入位置编码网络进行编码处理,得到目标行为序列特征。
可选的,上述装置还包括:
训练数据获取模块,被配置为执行获取多个样本对象的样本行为序列和多个样本对象对应的多任务标注结果,每个样本对象的样本行为序列包括每个样本对象在预设历史时间之前的多个样本行为记录;
样本时间差确定模块,被配置为执行确定每个样本行为记录中的行为时间与预设历史时间的样本时间差;
样本位置编码信息生成模块,被配置为执行基于样本时间差,生成每个样本行为记录对应的样本位置编码信息,样本位置编码信息表征每个样本对象对应的每个样本行为记录与每个样本对象对应的多个样本行为记录中其他样本行为记录间的区分度,每个样本行为记录对应的区分度与每个样本行为记录对应的样本时间差成反比;
第二编码处理模块,被配置为执行将样本行为序列和样本位置编码信息输入第一待训练神经网络进行编码处理,得到样本行为序列特征;
第二多任务处理模块,被配置为执行将样本序列特征输入第二待训练神经网络进行多任务处理,得到多个样本对象对应的多任务预测结果;
目标损失确定模块,被配置为执行根据多任务预测结果和多任务标注结果,确定目标损失;
网络训练模块,被配置为执行基于目标损失训练第一待训练神经网络和第二待训练神经网络,得到目标编码网络和多任务处理网络。
可选的,上述装置还包括:
第一多任务处理模块,被配置为执行将目标行为序列特征输入多任务处理网络进行多任务处理,得到多任务处理结果;
信息推荐模块,被配置为执行根据多任务处理结果向目标对象推荐目标信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种用于行为序列数据处理的电子设备的框图,该电子设备可以是终端,其内部结构图可以如图8所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括计算机可读存储介质、内存储器。该计算机可读存储介质存储有操作系统和计算机程序。该内存储器为计算机可读存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种行为序列数据处理方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种电子设备,包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器被配置为执行该指令,以实现如本公开实施例中的行为序列数据处理方法。
在示例性实施例中,还提供了一种计算机可读存储介质,当该计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开实施例中的行为序列数据处理方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例中的行为序列数据处理方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种行为序列数据处理方法,其特征在于,包括:
获取目标对象的历史行为序列,所述历史行为序列包括所述目标对象的多个历史行为记录;
确定每个历史行为记录中的行为时间与当前时间的时间差;
基于所述时间差,生成每个所述历史行为记录对应的位置编码信息,所述位置编码信息表征每个所述历史行为记录与所述多个历史行为记录中其他历史行为记录间的区分度,每个所述历史行为记录对应的区分度与每个所述历史行为记录对应的时间差成反比;
基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征。
2.根据权利要求1所述的行为序列数据处理方法,其特征在于,所述方法还包括:
获取所述目标对象的当前行为数据,所述当前行为数据表征所述目标对象对所述当前时间推荐给所述目标对象的推荐信息的行为数据;
所述基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征包括:
基于所述位置编码信息和所述当前行为数据对所述历史行为序列进行编码处理,得到所述目标行为序列特征。
3.根据权利要求2所述的行为序列数据处理方法,其特征在于,所述基于所述位置编码信息和所述当前行为数据对所述历史行为序列进行编码处理,得到所述目标行为序列特征包括:
将所述历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
对所述目标行为序列和所述当前行为数据进行特征提取,得到所述目标行为序列对应的初始行为序列特征和所述当前行为数据对应的行为特征信息;
对所述初始行为序列特征和所述行为特征信息进行注意力学习,得到所述目标行为序列特征。
4.根据权利要求1所述的行为序列数据处理方法,其特征在于,所述基于所述时间差,生成每个所述历史行为记录对应的位置编码信包括:
对所述时间差进行对数变换,得到目标时间差;
对所述目标时间差进行等区间分类,得到多个类别对应的第一时间差群组;
对所述多个类别对应的第一时间差群组进行独热编码,得到所述位置编码信息;
或,
基于所述时间差的数值大小对所述时间差进行递增分类,得到多个类别对应的第二时间差群组,其中,每个所述历史行为记录对应的时间差所对应类别的时间差区间范围与每个所述历史行为记录对应的时间差成反比;
对所述多个类别对应的第二时间差群组进行独热编码,得到所述位置编码信息。
5.根据权利要求1所述的行为序列数据处理方法,其特征在于,所述基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征包括:
将所述历史行为序列中每个历史行为记录的行为时间替换成对应的位置编码信息得到目标行为序列;
对所述目标行为序列进行特征提取,得到所述目标行为序列对应的初始行为序列特征;
对所述初始行为序列特征进行注意力学习,得到所述目标行为序列特征。
6.根据权利要求1至5任一所述的行为序列数据处理方法,其特征在于,所述基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征包括:
将所述位置编码信息对所述历史行为序列输入位置编码网络进行编码处理,得到所述目标行为序列特征。
7.一种行为序列数据处理装置,其特征在于,包括:
历史行为序列获取模块,被配置为执行获取目标对象的历史行为序列,所述历史行为序列包括所述目标对象的多个历史行为记录;
时间差确定模块,被配置为执行确定每个历史行为记录中的行为时间与当前时间的时间差;
位置编码信息生成模块,被配置为执行基于所述时间差,生成每个所述历史行为记录对应的位置编码信息,所述位置编码信息表征每个所述历史行为记录与所述多个历史行为记录中其他历史行为记录间的区分度,每个所述历史行为记录对应的区分度与每个所述历史行为记录对应的时间差成反比;
第一编码处理模块,被配置为执行基于所述位置编码信息对所述历史行为序列进行编码处理,得到目标行为序列特征。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的行为序列数据处理方法。
9.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至6中任一项所述的行为序列数据处理方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的行为序列数据处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110034304.XA CN112883257B (zh) | 2021-01-11 | 2021-01-11 | 行为序列数据处理方法、装置、电子设备及存储介质 |
PCT/CN2021/134635 WO2022148186A1 (zh) | 2021-01-11 | 2021-11-30 | 行为序列数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110034304.XA CN112883257B (zh) | 2021-01-11 | 2021-01-11 | 行为序列数据处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112883257A true CN112883257A (zh) | 2021-06-01 |
CN112883257B CN112883257B (zh) | 2024-01-05 |
Family
ID=76045059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110034304.XA Active CN112883257B (zh) | 2021-01-11 | 2021-01-11 | 行为序列数据处理方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112883257B (zh) |
WO (1) | WO2022148186A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113641835A (zh) * | 2021-08-27 | 2021-11-12 | 北京达佳互联信息技术有限公司 | 多媒体资源推荐方法、装置、电子设备及介质 |
CN114722238A (zh) * | 2022-05-13 | 2022-07-08 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、电子设备、存储介质及程序产品 |
WO2022148186A1 (zh) * | 2021-01-11 | 2022-07-14 | 北京达佳互联信息技术有限公司 | 行为序列数据处理方法及装置 |
WO2023016147A1 (zh) * | 2021-08-09 | 2023-02-16 | 腾讯科技(深圳)有限公司 | 多目标预测方法、装置、设备、存储介质及程序产品 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106997360A (zh) * | 2016-01-25 | 2017-08-01 | 阿里巴巴集团控股有限公司 | 用户行为数据的处理方法和装置 |
US20200090056A1 (en) * | 2018-09-19 | 2020-03-19 | Tata Consultancy Services Limited | Systems and methods for real time configurable recommendation using user data |
CN111274462A (zh) * | 2020-01-16 | 2020-06-12 | 珠海格力电器股份有限公司 | 数据的处理方法和装置 |
CN111274501A (zh) * | 2020-02-25 | 2020-06-12 | 支付宝(杭州)信息技术有限公司 | 推送信息的方法、系统和非暂时性存储介质 |
CN111859097A (zh) * | 2019-04-30 | 2020-10-30 | 北京达佳互联信息技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
US10824940B1 (en) * | 2016-11-30 | 2020-11-03 | Amazon Technologies, Inc. | Temporal ensemble of machine learning models trained during different time intervals |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112883257B (zh) * | 2021-01-11 | 2024-01-05 | 北京达佳互联信息技术有限公司 | 行为序列数据处理方法、装置、电子设备及存储介质 |
-
2021
- 2021-01-11 CN CN202110034304.XA patent/CN112883257B/zh active Active
- 2021-11-30 WO PCT/CN2021/134635 patent/WO2022148186A1/zh unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106997360A (zh) * | 2016-01-25 | 2017-08-01 | 阿里巴巴集团控股有限公司 | 用户行为数据的处理方法和装置 |
US10824940B1 (en) * | 2016-11-30 | 2020-11-03 | Amazon Technologies, Inc. | Temporal ensemble of machine learning models trained during different time intervals |
US20200090056A1 (en) * | 2018-09-19 | 2020-03-19 | Tata Consultancy Services Limited | Systems and methods for real time configurable recommendation using user data |
CN111859097A (zh) * | 2019-04-30 | 2020-10-30 | 北京达佳互联信息技术有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN111274462A (zh) * | 2020-01-16 | 2020-06-12 | 珠海格力电器股份有限公司 | 数据的处理方法和装置 |
CN111274501A (zh) * | 2020-02-25 | 2020-06-12 | 支付宝(杭州)信息技术有限公司 | 推送信息的方法、系统和非暂时性存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022148186A1 (zh) * | 2021-01-11 | 2022-07-14 | 北京达佳互联信息技术有限公司 | 行为序列数据处理方法及装置 |
WO2023016147A1 (zh) * | 2021-08-09 | 2023-02-16 | 腾讯科技(深圳)有限公司 | 多目标预测方法、装置、设备、存储介质及程序产品 |
CN113641835A (zh) * | 2021-08-27 | 2021-11-12 | 北京达佳互联信息技术有限公司 | 多媒体资源推荐方法、装置、电子设备及介质 |
CN114722238A (zh) * | 2022-05-13 | 2022-07-08 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、电子设备、存储介质及程序产品 |
CN114722238B (zh) * | 2022-05-13 | 2022-09-30 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、电子设备、存储介质及程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN112883257B (zh) | 2024-01-05 |
WO2022148186A1 (zh) | 2022-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112883257B (zh) | 行为序列数据处理方法、装置、电子设备及存储介质 | |
CN111090756B (zh) | 基于人工智能的多目标推荐模型的训练方法及装置 | |
CN113641835B (zh) | 多媒体资源推荐方法、装置、电子设备及介质 | |
CN110163252B (zh) | 数据分类方法及装置、电子设备、存储介质 | |
CN112883258B (zh) | 信息推荐方法、装置、电子设备及存储介质 | |
US20210350175A1 (en) | Key-value memory network for predicting time-series metrics of target entities | |
CN113918738B (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
CN113704511B (zh) | 多媒体资源的推荐方法、装置、电子设备及存储介质 | |
CN113806568B (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
CN114912030A (zh) | 权益模型训练方法、推荐方法及电子终端和计算机介质 | |
CN113420203B (zh) | 对象推荐方法、装置、电子设备及存储介质 | |
CN114461869A (zh) | 业务特征数据处理方法、装置、电子设备及存储介质 | |
CN112883256B (zh) | 多任务处理方法、装置、电子设备及存储介质 | |
CN114491093B (zh) | 多媒体资源推荐、对象表征网络的生成方法及装置 | |
CN113610215B (zh) | 任务处理网络生成、任务处理方法、装置及电子设备 | |
CN115756821A (zh) | 在线任务处理模型训练、任务处理方法及装置 | |
CN114510627A (zh) | 对象推送方法、装置、电子设备及存储介质 | |
CN115017362A (zh) | 数据处理方法、电子设备及存储介质 | |
CN113947185A (zh) | 任务处理网络生成、任务处理方法、装置、电子设备及存储介质 | |
CN113868516A (zh) | 对象推荐方法、装置、电子设备及存储介质 | |
CN115329183A (zh) | 数据处理方法、装置、存储介质及设备 | |
CN113761272A (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
CN112818142B (zh) | 帐户行为信息的处理方法、装置、电子设备及存储介质 | |
CN114417944B (zh) | 识别模型训练方法及装置、用户异常行为识别方法及装置 | |
CN114048392B (zh) | 多媒体资源推送方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |