CN111898904B - 一种数据处理方法及装置 - Google Patents
一种数据处理方法及装置 Download PDFInfo
- Publication number
- CN111898904B CN111898904B CN202010739614.7A CN202010739614A CN111898904B CN 111898904 B CN111898904 B CN 111898904B CN 202010739614 A CN202010739614 A CN 202010739614A CN 111898904 B CN111898904 B CN 111898904B
- Authority
- CN
- China
- Prior art keywords
- information
- layer
- time
- user
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 21
- 238000003062 neural network model Methods 0.000 claims abstract description 177
- 230000007246 mechanism Effects 0.000 claims abstract description 71
- 238000000034 method Methods 0.000 claims abstract description 57
- 239000013598 vector Substances 0.000 claims description 194
- 238000012549 training Methods 0.000 claims description 146
- 230000006399 behavior Effects 0.000 claims description 118
- 238000012545 processing Methods 0.000 claims description 60
- 230000003993 interaction Effects 0.000 claims description 47
- 239000011159 matrix material Substances 0.000 claims description 37
- 238000013528 artificial neural network Methods 0.000 claims description 28
- 238000000354 decomposition reaction Methods 0.000 claims description 27
- 238000005065 mining Methods 0.000 claims description 26
- 238000012360 testing method Methods 0.000 claims description 25
- 238000002372 labelling Methods 0.000 claims description 17
- 230000008859 change Effects 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241001122767 Theaceae Species 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06316—Sequencing of tasks or work
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Abstract
本申请公开了一种数据处理方法,包括:获得目标用户标识以及所述目标用户标识对应的候选对象信息;获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息;根据所述目标用户标识、所述候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。采用所述方法,解决了针对用户对候选对象的关注度顺序的预测准确度较低的问题。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种数据处理方法、装置及设备。本申请还涉及一种推荐系统。
背景技术
随着互联网的发展,在业务服务平台上运营的可供用户选择的对象越来越多,因此,用户与对象的相关性挖掘显得非常重要。其中,业务服务平台可以是外卖平台,也可以是提供其他业务服务的运营平台,例如,商品网购平台。所谓对象可以是向用户提供业务服务的实体对象,也可以是供用户进行网购的商品。例如,对象为提供外卖服务的商户;再如,对象为外卖菜品。
现有技术中,业务服务平台根据日志中记录的用户行为,预测目标用户与候选对象的相关性排序。所述相关性排序,为目标用户对每个候选对象的关注度顺序。以外卖平台为例,根据用户的下单、点击、曝光行为,通过矩阵分解技术预测用户与提供外卖服务的商户的相关性评分。采用矩阵分解技术的方式中假设潜在空间的每一维相互独立,并且用相同的权重进行线性结合,未考虑非线性因素,从而导致预测得到的相关性排序的准确度较低。另外,用户在不同时段对候选对象的偏好不同,时段是用户的业务行为习惯的影响因素,但是,现有技术中未根据时段预测用户对不同对象的偏好权重。因此使得用户对候选对象的关注度顺序的预测准确度较低。
因此,如何针对用户对候选对象的关注度顺序进行更为准确的预测是需要解决的问题。
发明内容
本申请实施例提供的数据处理方法,解决了针对用户对候选对象的关注度顺序的预测准确度较低的问题。
本申请实施例提供一种数据处理方法,包括:获得目标用户标识以及所述目标用户标识对应的候选对象信息;获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息;根据所述目标用户标识、所述候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。
可选的,所述获得目标用户标识以及所述目标用户标识对应的候选对象信息,包括:确定所述目标用户标识对应的计算设备的位置信息;根据所述位置信息确定所述候选对象信息。
可选的,所述获得目标用户标识以及所述目标用户标识对应的候选对象信息,包括:确定特定对象的业务特征;根据所述业务特征确定与所述用户目标标识匹配的特定对象,将所述特定对象的信息作为所述候选对象信息。
可选的,所述获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息,包括:获得业务服务平台接收到所述计算设备发送的业务访问请求的时间信息,作为所述特定时间信息,其中,所述业务服务平台为向所述计算设备提供针对所述候选对象信息的业务访问服务的平台。
可选的,还包括:确定所述神经网络模型的网络结构,按照所述网络结构构建初始神经网络模型;获得用于训练所述神经网络模型的包含用户标识、对象信息、时间信息的样本数据,使用所述样本数据针对初始神经网络模型进行训练,得到所述预先训练的神经网络模型;所述神经网络模型的网络结构包括:输入层、密集层、加入基于时间特征的注意力机制的模型层、拼接层以及输出层;其中,
所述输入层,用于接收独热向量输入信息,所述独热向量输入信息包含针对用户标识、对象信息以及时间信息分别进行独热编码,得到的用户独热向量、对象独热向量以及时间独热向量;所述密集层,用于对经过嵌入处理后的用户独热向量、对象独热向量以及时间独热向量进行非线性变化,提取出嵌入处理后的用户独热向量的用户特征、嵌入处理后的对象独热向量的对象特征以及嵌入处理后的时间独热向量的时段特征;所述模型层,包括矩阵分解层,多层神经网络层以及基于时间特征的注意力机制层;所述矩阵分解层,用于针对所述用户特征以及所述对象特征进行元素点积计算,挖掘线性交互特征;所述多层神经网络层,用于针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;所述基于时间特征的注意力机制层,用于根据所述对象特征以及所述时段特征,训练得到每个时段目标用户对每个对象的关注权重;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接;所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。
可选的,所述神经网络模型,还用于:针对时间独热向量以及对象独热向量进行嵌入处理,得到时段嵌入特征和对象嵌入特征;将所述时段嵌入特征与所述对象嵌入特征进行乘法运算;拼接乘法运算结果、所述时段嵌入特征以及所述对象嵌入特征,训练得到第一拼接信息;针对第一拼接信息进行数值映射,得到每个时段用户对每个对象的关注权重;将所述关注权重和所述对象嵌入特征相乘;拼接相乘结果、所述线性交互特征、所述非线性特征,得到第二拼接信息;针对第二拼接信息进行数值映射,得到每个时段用户对每个对象产生业务行为的概率。
可选的,所述获得用于训练所述神经网络模型的包含用户标识、对象信息、时间信息的样本数据,包括:获取参与训练的历史订单数据以及日志;获得所述历史订单数据以及日志中包含的用户标识以及对象信息;根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生过业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据;将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值从所述备选样本数据中抽取所述样本数据。
可选的,所述根据所述标签值从所述备选样本数据中抽取所述样本数据,包括:按照标签值合并备选样本数据;对合并后的备选样本数据按比例抽样,得到包含训练样本的训练集以及包含测试样本的测试集中的至少一个数据集。
可选的,所述使用所述样本数据进行训练,得到所述预先训练的神经网络模型,包括:获得训练集的训练样本,使用所述训练样本训练所述神经网络模型;通过多次迭代训练,如果预测输出与真实标签之间的损失满足约束条件,则训练结束。
可选的,所述使用所述样本数据进行训练,得到所述预先训练的神经网络模型,包括:获得测试集的测试样本,使用所述测试样本验证所述神经网络模型,将经过验证的神经网络模型作为所述预先训练的神经网络模型。
可选的,所述根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息产生过业务行为,包括:如果用户标识对应的用户针对对象信息产生业务行为,则将所述对象信息作为正样本;否则将所述对象信息作为负样本;将正样本对应的标签值置为第一预设数值,将负样本对应的标签值置为第二预设数值。
可选的,还包括:如果用户标识对应的用户针对对象信息下单,则判断所述用户针对所述对象信息产生业务行为;如果用户标识对应的用户针对对象信息进行曝光未点击以及点击未下单中的至少一种访问行为,则判断所述用户针对所述对象信息未产生业务行为。
可选的,还包括:将所述业务行为发生的时间按照预定间隔进行离散处理;针对离散处理后的时间进行独热编码得到所述时间独热向量。
可选的,所述根据所述目标用户标识、所述候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序,包括:将所述目标用户标识、所述候选对象信息以及所述特定时间信息,分别进行独热编码,处理为目标用户独热向量、候选对象独热向量以及时间独热向量;将上述独热向量作为所述神经网络模型的输入信息,学习得到目标用户标识针对每个候选对象信息的产生业务行为的概率;按照所述概率对候选对象信息进行排序,得到所述关注度顺序。
可选的,还包括:输出所述关注度顺序,或者,将满足关注度阈值的候选对象信息推荐给所述目标用户标识对应的计算设备。
本申请实施例还提供一种推荐系统,包括:数据采集模块、数据处理模块、训练模块、推荐模块;其中,所述数据采集模块,用于获得参与训练的历史订单数据以及日志,获得所述历史订单数据以及日志中包含的用户标识以及对象信息;根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生了业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据;所述数据处理模块,用于将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值按照比例从所述备选样本数据中抽取样本数据;所述训练模块,用于根据所述样本数据训练用于确定目标用户对候选对象的关注度顺序的神经网络模型,得到训练好的神经网络模型;;其中,所述神经网络模型中加入了基于时间特征的注意力机制;所述推荐模块,用于根据目标用户的计算设备的位置信息以及对象业务特征信息中的至少一种信息,确定候选对象信息;根据目标用户的用户标识、候选对象信息、所述目标用户的计算设备针对所述候选对象信息进行访问的特定时间信息,采用训练好的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;将满足关注度阈值的候选对象信息推荐给所述目标用户的计算设备。
可选的,所述神经网络模型的网络结构包括:输入层、密集层、加入基于时间特征的注意力机制的模型层、拼接层以及输出层;其中,所述输入层,用于接收独热向量输入信息,所述独热向量输入信息包含针对用户标识、对象信息以及时间信息分别进行独热编码,得到的用户独热向量、对象独热向量以及时间独热向量;所述密集层,用于对经过嵌入处理后的用户独热向量、对象独热向量以及时间独热向量进行非线性变化,提取出嵌入处理后的用户独热向量的用户特征、嵌入处理后的对象独热向量的对象特征以及嵌入处理后的时间独热向量的时段特征;所述模型层,包括矩阵分解层,多层神经网络层以及基于时间特征的注意力机制层;所述矩阵分解层,用于针对所述用户特征以及所述对象特征进行元素点积计算,挖掘线性交互特征;所述多层神经网络层,用于针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;所述基于时间特征的注意力机制层,用于根据所述对象特征以及所述时段特征,训练得到每个时段目标用户对每个对象的关注权重;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接;所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。
本申请实施例还提供一种数据处理装置,包括:候选对象获得单元,用于获得目标用户标识以及所述目标用户标识对应的候选对象信息;业务时间获得单元,用于获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息;关注度排序单元,用于根据所述目标用户标识、所述候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。
本申请实施例还提供一种神经网络模型训练方法,包括:获得包含用户标识、对象信息、时间信息的样本数据;根据所述样本数据,针对初始神经网络模型进行训练,获得训练好的神经网络模型,所述神经网络模型用于根据目标用户标识、候选对象信息以及目标用户的计算设备针对所述候选对象信息进行访问的特定时间信息,获得所述目标用户对于所述候选对象信息的关注度顺序;所述神经网络模型为加入了基于时间特征的注意力机制的网络模型。
可选的,所述获得包含用户标识、对象信息、时间信息的样本数据,包括:获取参与训练的历史订单数据以及日志;获得所述历史订单数据以及日志中包含的用户标识以及对象信息;根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生过业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据;将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值从所述备选样本数据中抽取所述样本数据。
可选的,所述样本数据还包含用户对象相关性标签真实值;所述用户对象相关性标签真实值,为根据每个用户标识是否针对每个对象信息对应的对象真实产生了业务行为进行标注的标签;所述方法还包括:如果训练时预测输出与所述用户对象相关性标签真实值之间的损失满足约束条件,则终止训练;否则,进行迭代训练。
可选的,所述神经网络模型包括:输入层、密集层、加入基于时间特征的注意力机制的模型层、拼接层以及输出层;其中,所述输入层,用于接收用户标识独热向量、对象信息独热向量以及时间独热向量,将提取的特征经过嵌入处理后输出给密集层;所述密集层,用于对经过嵌入处理后的特征进行非线性变化,提取出嵌入处理后得到的用户特征、对象特征以及时段特征;所述模型层,用于针对所述用户特征以及所述对象特征进行元素点积计算,挖掘线性交互特征;针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;针对所述对象特征以及所述时段特征通过基于时间特征的注意力机制,训练得到每个时段目标用户对每个对象的关注权重;将所述线性交互特征、所述非线性特征以及所述关注权重输出给拼接层;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接,拼接后得到的特征输出给输出层;所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。
可选的,所述神经网络模型,还用于:针对时间独热向量以及对象独热向量进行嵌入处理,得到时段嵌入特征和对象嵌入特征;将所述时段嵌入特征与所述对象嵌入特征进行乘法运算;拼接乘法运算结果、所述时段嵌入特征以及所述对象嵌入特征,训练得到第一拼接信息;针对第一拼接信息进行数值映射,得到每个时段用户对每个对象的关注权重;将所述关注权重和所述对象嵌入特征相乘;拼接相乘结果、所述线性交互特征、所述非线性特征,得到第二拼接信息;针对第二拼接信息进行数值映射,得到每个时段用户对每个对象产生业务行为的概率。
本申请实施例还提供一种电子设备,包括:存储器,以及处理器;所述存储器用于存储计算机程序,所述计算机程序被所述处理器运行后,执行本申请实施例提供的所述的数据处理方法以及所述神经网络模型训练方法。
本申请实施例还提供一种存储设备,存储有计算机程序,所述计算机程序被处理器运行后,执行本申请实施例提供的所述的数据处理方法以及所述神经网络模型训练方法。
与现有技术相比,本申请具有以下优点:
本申请实施例提供的数据处理方法、装置、设备,通过获得目标用户标识以及所述目标用户标识对应的候选对象信息;获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息;根据所述目标用户标识、所述候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。由于用户在不同时段对不同对象的注意力权重是不同的,因而将时段特征作为神经网络模型的输入信息,更加符合用户的业务行为习惯。基于时间注意力机制针对目标用户与候选对象协同过滤,从而能够更准确的预测用户行为,挖掘准确度更高的关注度顺序,解决了针对用户对候选对象的关注度顺序的预测准确度较低的问题。进一步,能更精准地为目标用户推荐满足关注度阈值的候选对象。
本申请实施例提供的神经网络模型训练方法,通过根据包含用户标识、对象信息、时间信息的样本数据,训练加入了基于时间特征的注意力机制的神经网络模型;训练过的神经网络模型用于确定所述目标用户对于所述候选对象信息的关注度顺序。由于用户在不同时段对不同对象的注意力权重是不同的,因而将时段特征作为神经网络模型的输入信息,更加符合用户的业务行为习惯。因而使用上述神经网络模型能够更准确的预测用户行为,挖掘准确度更高的关注度顺序,解决了针对用户对候选对象的关注度顺序的预测准确度较低的问题。
附图说明
图1是本申请第一实施例提供的数据处理方法的系统环境示意图。
图2是本申请第一实施例提供的数据处理方法的处理流程图。
图3是本申请第一实施例提供的神经网络模型的网络结构示意图。
图4是本申请第二实施例提供的推荐系统示意图。
图5是本申请第三实施例提供的数据处理装置示意图。
图6是本申请第四施例提供的神经网络模型训练方法的处理流程图。
图7是本申请提供的电子设备示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
本申请实施例提供一种数据处理方法、装置、电子设备及存储设备。本申请实施例还提供一种推荐系统。在下面的实施例中逐一进行详细说明。
为便于理解,首先给出一种数据处理方法的系统环境。实际应用中,所述数据处理方法用于预测目标用户与候选对象的相关性排序。所述相关性排序,为目标用户对每个候选对象的关注度顺序。所述关注度顺序的准确度是针对用户进行精准推荐的基础。目前一般采用矩阵分解技术针对目标用户计算出关注度数值高的N个对象推荐给目标用户。以外卖平台为例,根据用户的下单、点击、曝光行为,通过矩阵分解技术预测用户与提供外卖服务的商户的相关性评分。例如,用户下过单的商户标记为1,未下单的商户标记为0,得到用户商户标记矩阵。将用户商户标记矩阵A通过奇异值分解为三个矩阵相乘,即:
;
其中,U(m*m)为用户矩阵,Σ(m*n)为用户商户对角矩阵,(n*n)为商户矩阵的转置矩阵。如果预测第i个用户对第j个商户的相关性分值,则计算第i个用户的用户矩阵乘以i与j的关系矩阵乘以第j个商户矩阵,从而可以确定相关性分值高的N个商户推荐给用户。采用矩阵分解技术的方式中未考虑时间对于用户业务行为习惯的影响。实际上用户在不同时段对候选对象的偏好不同。本申请实施例提供数据处理方法采用了引入时间注意力机制的神经网络学习得到所述关注度顺序,在学习过程中加入了用户针对对象的业务行为发生的时间特征,从而可以针对不同时段学习到不同的权重。图1示出了一种系统环境,包括:业务服务平台101、离线训练计算设备102、在线预测计算设备103、用户的计算设备104。业务服务平台为用户接入平台,能够向用户的计算设备提供针对对象进行业务访问的服务。例如向接入业务服务平台的用户提供访问外卖信息的外卖平台。所谓对象可以是向用户提供业务服务的实体对象,也可以是供用户进行网购的商品或服务。例如,对象为提供外卖服务的商户;再如,对象为外卖菜品。用户的计算设备显示界面控件用于接收用户的输入触发,根据输入触发向业务服务平台发送业务访问请求。例如,业务访问请求可以是下单请求、点击链接请求、浏览页面展示的商品信息。离线训练计算设备用于根据历史订单数据以及与对象相关的日志,获得用于训练神经网络模型的样本数据,使用所述样本数据训练神经网络模型,将训练好的神经网络模型提供给在线预测计算设备。其中,神经网络模型用于确定目标用户对于候选对象信息的关注度顺序。所述神经网络模型可以是二分类神经网络模型。离线训练计算设备包括数据采集模块102-1、数据处理模块102-2以及训练模块102-3。所述数据采集模块,用于获得参与训练的历史订单数据以及与对象相关的日志,获得所述历史订单数据以及日志中包含的用户标识以及对象信息;根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生了业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据。所述数据处理模块,用于将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值按照比例从所述备选样本数据中抽取样本数据。所述训练模块,用于根据所述样本数据训练所述神经网络模型,所述神经网络模型中加入了基于时间特征的注意力机制。在线预测计算设备,用于获得目标用户标识以及所述目标用户标识对应的候选对象信息,获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息,将所述目标用户标识、所述候选对象信息以及所述特定时间信息进行格式化处理,得到的格式化数据作为神经网络模型的输入数据,通过神经网络模型学习得到目标用户对所述候选对象信息的关注度顺序,进一步,将满足关注度阈值的候选对象信息推荐给目标用户标识对应的计算设备。按照特定条件确定的、目标用户可能产生业务行为的潜在对象为候选对象,所述获得所述目标用户标识对应的候选对象信息为获得所述候选对象的信息,例如,获得候选对象标识。具体的,根据目标用户的计算设备的位置信息以及对象业务特征信息中的至少一种信息,确定候选对象信息。
以下结合图2和图3对本申请第一实施例提供的数据处理方法进行说明。图2所示的数据处理方法,包括:步骤S201至步骤S203。
步骤S201,获得目标用户标识以及所述目标用户标识对应的候选对象信息。
本申请实施例提供的数据处理方法,用于根据用户标识以及对象信息协同过滤,挖掘用户标识与对象信息的相关性关系,从而确定用户对对象信息的关注度顺序,进一步根据关注度顺序向用户进行精准推荐。所谓对象可以是提供业务服务的实体对象,例如商户;也可以是可提供的商品或服务例如外卖菜品。具体的,采用预先训练的神经网络模型确定目标用户对候选对象信息的关注度顺序,其中,所述模型中加入了时间注意力机制。所述神经网络模型可以是二分类神经网络模型。所述预先训练的神经网络模型为多层网络,能挖掘非线性特征,学习用户与对象信息的隐向量,从而学到用户标识与对象信息的相关性关系,在此基础上通过时间注意力机制加入时段特征。实际上,用户在不同时段对不同对象的注意力是不一样的,例如,一般情况下用户在下午会对提供下午茶的商户更关注。如果不加入时段特征,则训练出来的权重在一天中的不同时段是不会变化的,显然不符合用户的下单习惯。利用注意力机制(attention)加入时段特征,同时用神经网络训练用户与对象信息的隐向量,则能够学习到每个时段用户对每个对象的偏好权重以及非线性因素,更准确地预测用户的业务行为,从而可以向用户进行精准的对象推荐。
本实施例中,按照特定条件确定所述目标用户标识对应的目标用户可能产生业务行为的潜在对象,作为候选对象。所述获得所述目标用户标识对应的候选对象信息为获得所述候选对象的信息。具体可以通过下述两种方式中的任一种方式或者两种方式的结合获得候选对象信息:
方式一、确定所述目标用户标识对应的计算设备的位置信息;根据所述位置信息确定所述候选对象信息。
方式二、确定特定对象的业务特征;根据所述业务特征确定与所述用户目标标识匹配的特定对象,将所述特定对象的信息作为所述候选对象信息。
例如,获得终端用户的计算设备的位置信息后,按照与所述位置信息指示的位置距离满足距离阈值的范围内的、并且可提供业务服务的实体对象的信息,作为所述候选对象信息。
步骤S202,获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息。
本实施例中,通过下述任一处理确定所述特定时间信息,包括:获得业务服务平台接收到所述计算设备发送的业务访问请求的时间信息,作为所述特定时间信息,其中,所述业务服务平台为向所述计算设备提供针对所述候选对象信息的业务访问服务的平台。当然,也可以接收界面显示控件的输入触发,根据所述输入触发获得指定访问时间信息,作为所述特定时间信息。例如,业务服务平台将接收到业务访问请求的时间信息提供给在线预测计算设备,在线预测计算设备将所述时间信息按照预设对应关系对应到特定时段。再如,获得指定时间信息作为特定时间信息。时段可以是按自然天内不同的时间段,例如一个小时为一个时段。时段的划分方式不受局限,可以按照对象的业务特征划分。例如可以是一天内的不同或者按照时间信息对应的自然天内的上午、下午或晚上划分时段。当然,时段也可以是按照时间信息对应的日期,对应到周内的不同天,或者对应月内的节假日,或者对应不同的季节。
步骤S203,根据所述目标用户标识、所述候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。
本实施例中,还包括下述处理:确定所述神经网络模型的网络结构,按照所述网络结构构建初始神经网络模型;获得用于训练所述神经网络模型的包含用户标识、对象信息、时间信息的样本数据,使用所述样本数据针对初始神经网络模型进行训练,得到所述预先训练的神经网络模型;所述神经网络模型的网络结构包括:输入层、密集层、加入基于时间特征的注意力机制的模型层、拼接层以及输出层;其中,所述输入层,用于接收独热向量(onehot)输入信息,所述独热向量输入信息包含针对用户标识、对象信息以及时间信息分别进行独热编码,得到的用户独热向量、对象独热向量以及时间独热向量;所述密集层,用于对经过嵌入处理后的用户独热向量、对象独热向量以及时间独热向量进行非线性变化,提取出嵌入处理后的用户独热向量的用户特征、嵌入处理后的对象独热向量的对象特征以及嵌入处理后的时间独热向量的时段特征;所述模型层,包括矩阵分解层,多层神经网络层以及基于时间特征的注意力机制层;所述矩阵分解层,用于针对所述用户特征以及所述对象特征进行元素点积计算,挖掘线性交互特征;所述多层神经网络层,用于针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;所述基于时间特征的注意力机制层,用于根据所述对象特征以及所述时段特征,训练得到每个时段目标用户对每个对象的关注权重;多层神经网络层可以包括一个或多个隐藏层。所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接;所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。关于针对独热向量进行嵌入处理,既可以通过训练嵌入层进行嵌入处理,也可以使用预训练的向量操作进行嵌入处理。所述样本数据还包含用户对象相关性标签真实值,所述用户对象相关性标签真实值,为根据每个用户标识是否针对每个对象信息对应的对象真实产生了业务行为进行标注的标签。例如,用户对商户下单则标签为1,否则为0。所述用户对象相关性标签真实值用于进行迭代判断。如果训练时预测输出与真实标签之间的损失满足约束条件,则表示神经网络模型已训练好,终止训练;否则,进行迭代训练。
请参考图3,图3所示的神经网络的网络结构包括:输入层301、密集层302、模型层303、拼接层304、输出层305、迭代判断模块306。输入层包括接收用户标识输入、商户标识输入、时段输入。密集层包括针对user_embedding(用户标识嵌入)、shop_embedding(商户标识嵌入)、time_embedding(时段嵌入)进行全连接处理。模型层包括GMF层303-1、MLP层303-2、Attention机制303-3。GMF(Generalized Matrix Factorization,广义矩阵分解)层为矩阵分解层,MLP(Multilayer Perceptron,多层感知器)层为多层神经网络层,图中的多层神经网络层包括2个隐层,隐层即指隐藏层。Attention(注意力)机制为时间注意力机制层。用户标识输入为用户标识对应的用户独热向量;商户标识输入为商户标识对应的商户独热向量;时段输入层为时段对应的时间独热向量。密集层对经过嵌入(embedding)处理的独热向量进行全连接处理,得到关联特征,例如得到值为0.1和0.5作为用户关联特征;再如得到0.2和0.3为商户关联特征;再如得到0.8和0.4为时段关联特征。GMF层将用户关联特征与商户关联特征进行元素点积计算,挖掘线性交互特征,例如,得到向量(0.1*0.2,0.5*0.3)。MLP层通过2个隐层拼接用户与商户的向量,例如拼接得到[0.1,0.5,0.2,0.3],挖掘非线性特征。Attention机制将商户关联特征与时段关联特征做乘法运算,再拼接时段与商户的嵌入,在做sigmoid处理得到标量,为不同时段用户对商户的关注权重。将关注权重与商户嵌入通过w*shop_embedding处理进行拼接,得到第一拼接结果,通过拼接层将第一拼接结果与GMF层以及MLP层的输出进行再拼接,得到第二拼接结果,对第二拼接结果采用sigmoid处理得到分值,作为用户向商户的下单概率。迭代判断模块用于判断训练时预测输出与真实标签之间的损失是否满足约束条件,如果满足约束条件,则表示神经网络模型已经训练好,终止训练;否则,进行迭代训练。所述样本数据还包含用户对象相关性标签真实值,所述用户对象相关性标签真实值,为根据每个用户标识是否针对每个对象信息对应的对象真实产生了业务行为进行标注的标签。例如,用户对商户下单则标签为1,否则为0。
本实施例中,所述神经网络模型在训练和学习过程中针对时段特征的引入,包括下述处理:针对时间独热向量以及对象独热向量进行嵌入处理,得到时段嵌入特征和对象嵌入特征;将所述时段嵌入特征与所述对象嵌入特征进行乘法运算;拼接乘法运算结果、所述时段嵌入特征以及所述对象嵌入特征,训练得到第一拼接信息;针对第一拼接信息进行数值映射,得到每个时段用户对每个对象的关注权重;将所述关注权重和所述对象嵌入特征相乘;拼接相乘结果、所述线性交互特征、所述非线性特征,得到第二拼接信息;针对第二拼接信息进行数值映射,得到每个时段用户对每个对象产生业务行为的概率。例如,使用sigmoid函数处理第一拼接信息,将第一拼接信息映射为[0,1]之间的值,得到每个时段用户对每个对象的关注权重。使用sigmoid函数处理第二拼接信息,将第一拼接信息映射为[0,1]之间的值,得到每个时段用户对每个对象产生业务行为的概率。
本实施例中,还包括对神经网络模型进行训练以获得预先训练的模型。获得用于训练所述神经网络模型的包含用户标识、对象信息、时间信息的样本数据,使用所述样本数据进行训练,得到所述预先训练的神经网络模型。其中,通过下述处理获得所述样本数据:获取参与训练的历史订单数据以及日志;获得所述历史订单数据以及日志中包含的用户标识以及对象信息;根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生过业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据;将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值从所述备选样本数据中抽取所述样本数据。例如,收集用户的7天的订单数据,用于标注用户是否在商户下单;如果用户7天之内下过单label(标签)为1,未下单(包括曝光未点击、点击未下单)label为0,得到格式化数据,例如[用户id,商户id,label]的数据。具体的,所述根据所述标签值从所述备选样本数据中抽取所述样本数据,包括:按照标签值合并备选样本数据;对合并后的备选样本数据按比例抽样,得到包含训练样本的训练集以及包含测试样本的测试集中的至少一个数据集。可以随机抽取样本。例如,当正样本、负样本比例差异较大时,为了减少计算量,根据label按照正负样本1:4的比例抽样。再如,将时间离散为24小时,得到格式化数据[用户id的onehot向量,商户id的onehot向量,时间的onehot向量,label],作为样本数据。进一步,获得训练集的训练样本,使用所述训练样本训练所述神经网络模型;通过多次迭代训练,如果预测输出与真实标签之间的损失满足约束条件,则训练结束。一个实施方式中还包括:获得测试集的测试样本,使用所述测试样本验证所述神经网络模型,将经过验证的神经网络模型作为所述预先训练的神经网络模型。其中,通过下述处理使用标签标注每个用户标识是否针对每个对象信息产生过业务行为:如果用户标识对应的用户针对对象信息产生业务行为,则将所述对象信息作为正样本;否则将所述对象信息作为负样本;将正样本对应的标签值置为第一预设数值,将负样本对应的标签值置为第二预设数值。例如,第一预设数值为1,第二预设数值为0,即,将正样本标签设为1,负样本标签设为0。具体的,还包括:如果用户标识对应的用户针对对象信息下单,则判断所述用户针对所述对象信息产生业务行为;如果用户标识对应的用户针对对象信息进行曝光未点击以及点击未下单中的至少一种访问行为,则判断所述用户针对所述对象信息未产生业务行为。本实施例中,还包括:将所述业务行为发生的时间按照预定间隔进行离散处理;针对离散处理后的时间进行独热编码得到所述时间独热向量。本实施例中,采用TensorFlow搭建所述神经网络。
本实施例中,通过下述处理确定所述目标用户对于所述候选对象信息的关注度顺序:将所述目标用户标识、所述候选对象信息以及所述特定时间信息,分别进行独热编码,处理为目标用户独热向量、候选对象独热向量以及时间独热向量;将上述独热向量作为所述神经网络模型的输入信息,学习得到目标用户标识针对每个候选对象信息的产生业务行为的概率;按照所述概率对候选对象信息进行排序,得到所述关注度顺序。例如,按照概率从大到小的降序顺序或从小到大的升序顺序对候选对象进行排序。进一步,输出所述关注度顺序,或者,将满足关注度阈值的候选对象信息推荐给所述目标用户标识对应的计算设备。例如,按照所述概率对候选对象信息进行降序排列,将按照降序排列的候选对象信息进行展示。从而,通过神经网络模型挖掘不同时段用户与对象的关系,使得针对目标用户的线上推荐更为准确。从具体实验结果上看,可以有效提升模型AUC(Area Under Curve,曲线下面积)(78.2%-79.8%)。并且,神经网络可以很好地处理稀疏特征,学习到更多线性交互特征与非线性特征,从而可以更好估计用户-对象的相关性关系。例如,对象为商户,当线上预测目标用户感兴趣的商户时,不需要存储庞大的用户商户矩阵,只需要获得目标用户的用户标识、候选商户标识;加入目标用户访问业务的时间特征之后,训练出用户在不同时段对不同商户的关注程度,更加精准地为用户进行推荐。
本实施例中,还包括针对目标用户进行对象推荐的推荐系统。所述推荐系统包括:数据采集模块、数据处理模块、训练模块、推荐模块;其中,所述数据采集模块,用于获得参与训练的历史订单数据以及日志,获得所述历史订单数据以及日志中包含的用户标识以及对象信息;根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生了业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据;所述数据处理模块,用于将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值按照比例从所述备选样本数据中抽取样本数据;所述训练模块,用于根据所述样本数据训练用于确定目标用户对候选对象的关注度顺序的神经网络模型,得到训练好的神经网络模型;其中,所述神经网络模型中加入了基于时间特征的注意力机制;所述推荐模块,用于根据目标用户的计算设备的位置信息以及对象业务特征信息中的至少一种信息,确定候选对象信息;根据目标用户的用户标识、候选对象信息、所述目标用户的计算设备针对所述候选对象信息进行访问的特定时间信息,采用训练好的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;将满足关注度阈值的候选对象信息推荐给所述目标用户的计算设备。其中,所述神经网络模型的网络结构包括:输入层、密集层、加入基于时间特征的注意力机制的模型层、拼接层以及输出层;其中,所述输入层,用于接收独热向量输入信息,所述独热向量输入信息包含针对用户标识、对象信息以及时间信息分别进行独热编码,得到的用户独热向量、对象独热向量以及时间独热向量;所述密集层,用于对经过嵌入处理后的用户独热向量、对象独热向量以及时间独热向量进行非线性变化,提取出嵌入处理后的用户独热向量的用户特征、嵌入处理后的对象独热向量的对象特征以及嵌入处理后的时间独热向量的时段特征;所述模型层,包括矩阵分解层,多层神经网络层以及基于时间特征的注意力机制层;所述矩阵分解层,用于针对所述用户特征以及所述对象特征进行元素点积计算,挖掘线性交互特征;所述多层神经网络层,用于针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;所述基于时间特征的注意力机制层,用于根据所述对象特征以及所述时段特征,训练得到每个时段目标用户对每个对象的关注权重;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接;所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。按照所述概率对候选对象信息进行排序,得到所述关注度顺序。例如,所述概率为(0-1),如果按照概率降序排序,则概率数值越高商户的排序越高。
至此,对本实施例提供的数据处理方法进行了详细说明,所述方法通过获得目标用户标识对应的计算设备针对候选对象信息进行访问的特定时间信息;根据目标用户标识、候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。由于用户在不同时段对不同对象的注意力权重是不同的,因而将时段特征作为神经网络模型的输入信息,更加符合用户的业务行为习惯。基于时间注意力机制针对目标用户与候选对象协同过滤,从而能够更准确的预测用户行为,挖掘准确度更高的关注度顺序,解决了针对用户对候选对象的关注度顺序的预测准确度较低的问题。
以上述实施例为基础,本申请第二实施例提供一种推荐系统。以下结合图4对第二实施例提供的推荐系统进行说明,相关部分请参见上述实施例对应部分的说明。图4所示的推荐系统,包括:数据采集模块401、数据处理模块402、训练模块403、推荐模块404;其中,
所述数据采集模块,用于获得参与训练的历史订单数据以及日志,获得所述历史订单数据以及日志中包含的用户标识以及对象信息;根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生了业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据。
所述数据处理模块,用于将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值按照比例从所述备选样本数据中抽取样本数据。
所述训练模块,用于根据所述样本数据训练用于确定目标用户对候选对象的关注度顺序的神经网络模型,得到训练好的神经网络模型;其中,所述神经网络模型中加入了基于时间特征的注意力机制。其中,所述神经网络模型的网络结构包括:输入层、密集层、加入基于时间特征的注意力机制的模型层、拼接层以及输出层;其中,所述输入层,用于接收独热向量输入信息,所述独热向量输入信息包含针对用户标识、对象信息以及时间信息分别进行独热编码,得到的用户独热向量、对象独热向量以及时间独热向量;所述密集层,用于对经过嵌入处理后的用户独热向量、对象独热向量以及时间独热向量进行非线性变化,提取出嵌入处理后的用户独热向量的用户特征、嵌入处理后的对象独热向量的对象特征以及嵌入处理后的时间独热向量的时段特征;所述模型层,包括矩阵分解层,多层神经网络层以及基于时间特征的注意力机制层;所述矩阵分解层,用于针对所述用户特征以及所述对象特征进行元素点积计算,挖掘线性交互特征;所述多层神经网络层,用于针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;所述基于时间特征的注意力机制层,用于根据所述对象特征以及所述时段特征,训练得到每个时段目标用户对每个对象的关注权重;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接;所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。按照所述概率对候选对象信息进行排序,得到所述关注度顺序。
所述推荐模块,用于根据目标用户的计算设备的位置信息以及对象业务特征信息中的至少一种信息,确定候选对象信息;根据目标用户的用户标识、候选对象信息、所述目标用户的计算设备针对所述候选对象信息进行访问的特定时间信息,采用训练好的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;将满足关注度阈值的候选对象信息推荐给所述目标用户的计算设备。例如,针对目标用户标识,通过神经网络模型学习到针对每个对象信息标识的候选对象产生业务行为的概率,所述概率为(0-1),数越高则商户的排序越高。按照所述概率对候选对象信息进关注度排序。展示排序后的候选对象信息。
至此,对本实施例提供的推荐系统进行了详细说明,所述系统的推荐模块根据目标用户标识、候选对象信息以及特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。由于用户在不同时段对不同对象的注意力权重是不同的,因而将时段特征作为神经网络模型的输入信息,更加符合用户的业务行为习惯。基于时间注意力机制针对目标用户与候选对象协同过滤,从而能够更准确的预测用户行为,挖掘准确度更高的关注度顺序,解决了针对用户对候选对象的关注度顺序的预测准确度较低的问题。
与第一实施例对应,本申请第三实施例提供一种数据处理装置。以下结合图5对第三实施例提供的装置进行说明。图5所示的数据处理装置,包括:
候选对象获得单元501,用于获得目标用户标识以及所述目标用户标识对应的候选对象信息;
业务时间获得单元502,用于获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息;
关注度排序单元503,用于根据所述目标用户标识、所述候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。
可选的,所述候选对象获得单元501具体用于:确定所述目标用户标识对应的计算设备的位置信息;根据所述位置信息确定所述候选对象信息。
可选的,所述候选对象获得单元501具体用于:确定特定对象的业务特征;根据所述业务特征确定与所述用户目标标识匹配的特定对象,将所述特定对象的信息作为所述候选对象信息。
可选的,所述业务时间获得单元502具体用于:获得业务服务平台接收到所述计算设备发送的业务访问请求的时间信息,作为所述特定时间信息,其中,所述业务服务平台为向所述计算设备提供针对所述候选对象信息的业务访问服务的平台。
可选的,所述装置还包括训练单元,所述训练单元用于:确定所述神经网络模型的网络结构,按照所述网络结构构建初始神经网络模型;获得用于训练所述神经网络模型的包含用户标识、对象信息、时间信息的样本数据,使用所述样本数据针对初始神经网络模型进行训练,得到所述预先训练的神经网络模型;所述神经网络模型的网络结构包括:输入层、密集层、加入基于时间特征的注意力机制的模型层、拼接层以及输出层;其中,所述输入层,用于接收独热向量输入信息,所述独热向量输入信息包含针对用户标识、对象信息以及时间信息分别进行独热编码,得到的用户独热向量、对象独热向量以及时间独热向量;所述密集层,用于对经过嵌入处理后的用户独热向量、对象独热向量以及时间独热向量进行非线性变化,提取出嵌入处理后的用户独热向量的用户特征、嵌入处理后的对象独热向量的对象特征以及嵌入处理后的时间独热向量的时段特征;所述模型层,包括矩阵分解层,多层神经网络层以及基于时间特征的注意力机制层;所述矩阵分解层,用于针对所述用户特征以及所述对象特征进行元素点积计算,挖掘线性交互特征;所述多层神经网络层,用于针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;所述基于时间特征的注意力机制层,用于根据所述对象特征以及所述时段特征,训练得到每个时段目标用户对每个对象的关注权重;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接;所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。
可选的,所述神经网络模型,还用于:针对时间独热向量以及对象独热向量进行嵌入处理,得到时段嵌入特征和对象嵌入特征;将所述时段嵌入特征与所述对象嵌入特征进行乘法运算;拼接乘法运算结果、所述时段嵌入特征以及所述对象嵌入特征,训练得到第一拼接信息;针对第一拼接信息进行数值映射,得到每个时段用户对每个对象的关注权重;将所述关注权重和所述对象嵌入特征相乘;拼接相乘结果、所述线性交互特征、所述非线性特征,得到第二拼接信息;针对第二拼接信息进行数值映射,得到每个时段用户对每个对象产生业务行为的概率。
可选的,所述训练单元具体用于:获取参与训练的历史订单数据以及日志;
获得所述历史订单数据以及日志中包含的用户标识以及对象信息;根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生过业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据;将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值从所述备选样本数据中抽取所述样本数据。
可选的,所述训练单元具体用于:按照标签值合并备选样本数据;对合并后的备选样本数据按比例抽样,得到包含训练样本的训练集以及包含测试样本的测试集中的至少一个数据集。
可选的,所述训练单元具体用于:获得训练集的训练样本,使用所述训练样本训练所述神经网络模型;通过多次迭代训练,如果预测输出与真实标签之间的损失满足约束条件,则训练结束。
可选的,所述训练单元具体用于:获得测试集的测试样本,使用所述测试样本验证所述神经网络模型,将经过验证的神经网络模型作为所述预先训练的神经网络模型。
可选的,所述训练单元具体用于:如果用户标识对应的用户针对对象信息产生业务行为,则将所述对象信息作为正样本;否则将所述对象信息作为负样本;将正样本对应的标签值置为第一预设数值,将负样本对应的标签值置为第二预设数值。
可选的,所述训练单元具体用于:如果用户标识对应的用户针对对象信息下单,则判断所述用户针对所述对象信息产生业务行为;如果用户标识对应的用户针对对象信息进行曝光未点击以及点击未下单中的至少一种访问行为,则判断所述用户针对所述对象信息未产生业务行为。
可选的,所述训练单元具体用于:将所述业务行为发生的时间按照预定间隔进行离散处理;针对离散处理后的时间进行独热编码得到所述时间独热向量。
可选的,所述关注度排序单元503具体用于:将所述目标用户标识、所述候选对象信息以及所述特定时间信息,分别进行独热编码,处理为目标用户独热向量、候选对象独热向量以及时间独热向量;将上述独热向量作为所述神经网络模型的输入信息,学习得到目标用户标识针对每个候选对象信息的产生业务行为的概率;按照所述概率对候选对象信息进行排序,得到所述关注度顺序。
可选的,所述关注度排序单元503具体用于:输出所述关注度顺序,或者,将满足关注度阈值的候选对象信息推荐给所述目标用户标识对应的计算设备。
至此,对本实施例提供的装置进行了说明,所述装置的关注度排序单元根据目标用户标识、候选对象信息以及特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。由于用户在不同时段对不同对象的注意力权重是不同的,因而将时段特征作为神经网络模型的输入信息,更加符合用户的业务行为习惯。基于时间注意力机制针对目标用户与候选对象协同过滤,从而能够更准确的预测用户行为,挖掘准确度更高的关注度顺序,解决了针对用户对候选对象的关注度顺序的预测准确度较低的问题。
以上述实施例为基础,本申请第四实施例提供一种神经网络模型训练方法。相关的部分请参见上述实施例的对应说明。以下结合图6对所述神经网络模型训练方法进行说明。图6所示的方法包括:步骤S601至步骤S602。
步骤S601,获得包含用户标识、对象信息、时间信息的样本数据。
本实施例中通过下述处理获得所述样本数据:获取参与训练的历史订单数据以及日志;获得所述历史订单数据以及日志中包含的用户标识以及对象信息;根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生过业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据;将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值从所述备选样本数据中抽取所述样本数据。例如,收集用户的7天的订单数据,用于标注用户是否在商户下单;如果用户7天之内下过单label(标签)为1,未下单(包括曝光未点击、点击未下单)label为0,得到格式化数据,例如[用户id,商户id,label]的数据。具体的,所述根据所述标签值从所述备选样本数据中抽取所述样本数据,包括:按照标签值合并备选样本数据;对合并后的备选样本数据按比例抽样,得到包含训练样本的训练集以及包含测试样本的测试集中的至少一个数据集。可以随机抽取样本。例如,当正样本、负样本比例差异较大时,为了减少计算量,根据label按照正负样本1:4的比例抽样。再如,将时间离散为24小时,得到格式化数据[用户id的onehot向量,商户id的onehot向量,时间的onehot向量,label],作为样本数据。其中,通过下述处理使用标签标注每个用户标识是否针对每个对象信息产生过业务行为:如果用户标识对应的用户针对对象信息产生业务行为,则将所述对象信息作为正样本;否则将所述对象信息作为负样本;将正样本对应的标签值置为第一预设数值,将负样本对应的标签值置为第二预设数值。例如,第一预设数值为1,第二预设数值为0,即,将正样本标签设为1,负样本标签设为0。具体的,还包括:如果用户标识对应的用户针对对象信息下单,则判断所述用户针对所述对象信息产生业务行为;如果用户标识对应的用户针对对象信息进行曝光未点击以及点击未下单中的至少一种访问行为,则判断所述用户针对所述对象信息未产生业务行为。本实施例中,还包括:将所述业务行为发生的时间按照预定间隔进行离散处理;针对离散处理后的时间进行独热编码得到所述时间独热向量。所述样本数据还包含用户对象相关性标签真实值;所述用户对象相关性标签真实值,为根据每个用户标识是否针对每个对象信息对应的对象真实产生了业务行为进行标注的标签。例如,用户对商户下单则标签为1,否则为0。所述用户对象相关性标签真实值用于进行迭代判断。如果训练时预测输出与真实标签之间的损失满足约束条件,则表示神经网络模型已训练好,终止训练;否则,进行迭代训练
步骤S602,根据所述样本数据,针对初始神经网络模型进行训练,获得训练好的神经网络模型,所述神经网络模型用于根据目标用户标识、候选对象信息以及目标用户的计算设备针对所述候选对象信息进行访问的特定时间信息,获得所述目标用户对于所述候选对象信息的关注度顺序;所述神经网络模型为加入了基于时间特征的注意力机制的网络模型。
本实施例中,包括下述处理:获得训练集的训练样本,使用所述训练样本训练所述神经网络模型;通过多次迭代训练,如果预测输出与真实标签之间的损失满足约束条件,则训练结束。进一步还包括:获得测试集的测试样本,使用所述测试样本验证所述神经网络模型,将经过验证的神经网络模型作为训练好的神经网络模型,用于确定目标用户对于候选对象信息的关注度顺序。具体的,所述神经网络模型包括:输入层、密集层、加入基于时间特征的注意力机制的模型层、拼接层以及输出层;其中,所述输入层,用于接收用户标识独热向量、对象信息独热向量以及时间独热向量,将提取的特征经过嵌入处理后输出给密集层;所述密集层,用于对经过嵌入处理后的特征进行非线性变化,提取出嵌入处理后得到的用户特征、对象特征以及时段特征;所述模型层,用于针对所述用户特征以及所述对象特征进行元素点积计算,挖掘线性交互特征;针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;针对所述对象特征以及所述时段特征通过基于时间特征的注意力机制,训练得到每个时段目标用户对每个对象的关注权重;将所述线性交互特征、所述非线性特征以及所述关注权重输出给拼接层;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接,拼接后得到的特征输出给输出层;所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。本实施例中,所述神经网络模型,还用于:针对时间独热向量以及对象独热向量进行嵌入处理,得到时段嵌入特征和对象嵌入特征;将所述时段嵌入特征与所述对象嵌入特征进行乘法运算;拼接乘法运算结果、所述时段嵌入特征以及所述对象嵌入特征,训练得到第一拼接信息;针对第一拼接信息进行数值映射,得到每个时段用户对每个对象的关注权重;将所述关注权重和所述对象嵌入特征相乘;拼接相乘结果、所述线性交互特征、所述非线性特征,得到第二拼接信息;针对第二拼接信息进行数值映射,得到每个时段用户对每个对象产生业务行为的概率。
至此,对本实施例提供的方法进行了说明,所述方法根据包含用户标识、对象信息、时间信息的样本数据,训练加入了基于时间特征的注意力机制的神经网络模型;训练过的神经网络模型用于确定所述目标用户对于所述候选对象信息的关注度顺序。由于用户在不同时段对不同对象的注意力权重是不同的,因而将时段特征作为神经网络模型的输入信息,更加符合用户的业务行为习惯。因而使用上述神经网络模型能够更准确的预测用户行为,挖掘准确度更高的关注度顺序,解决了针对用户对候选对象的关注度顺序的预测准确度较低的问题。
与第一实施例相对应,本申请第五实施例提供一种电子设备。图7为所述电子设备的示意图,所述电子设备,包括:存储器701,以及处理器702;所述存储器用于存储计算机程序,所述计算机程序被所述处理器运行后,执行本申请实施例提供的所述数据处理方法。
至此,对本实施例提供的电子设备进行了说明,所述电子设备根据目标用户标识、候选对象信息以及特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。由于用户在不同时段对不同对象的注意力权重是不同的,因而将时段特征作为神经网络模型的输入信息,更加符合用户的业务行为习惯。基于时间注意力机制针对目标用户与候选对象协同过滤,从而能够更准确的预测用户行为,挖掘准确度更高的关注度顺序,解决了针对用户对候选对象的关注度顺序的预测准确度较低的问题。
与第一实施例对应,本申请第六实施例提供一种存储设备,相关的部分请参见上述实施例的对应说明即可。所述存储设备的示意图类似图7。所述存储设备存储有计算机程序,所述计算机程序被处理器运行后,执行本申请实施例提供的所述数据处理方法。
至此,对本实施例提供的数据处理存储设备进行了说明,所述存储设备存储有数据处理指令,所述指令根据目标用户标识、候选对象信息以及特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制。由于用户在不同时段对不同对象的注意力权重是不同的,因而将时段特征作为神经网络模型的输入信息,更加符合用户的业务行为习惯。基于时间注意力机制针对目标用户与候选对象协同过滤,从而能够更准确的预测用户行为,挖掘准确度更高的关注度顺序,解决了针对用户对候选对象的关注度顺序的预测准确度较低的问题。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器(ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
Claims (25)
1.一种数据处理方法,其特征在于,包括:
获得目标用户标识以及所述目标用户标识对应的候选对象信息;
获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息;
根据所述目标用户标识、所述候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制;
其中,所述神经网络模型的网络结构包括:加入基于时间特征的注意力机制的模型层以及拼接层;所述模型层,包括矩阵分解层,多层神经网络层以及基于时间特征的注意力机制层;所述矩阵分解层,用于针对用户特征以及对象特征进行元素点积计算,挖掘线性交互特征;所述多层神经网络层,用于针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;所述基于时间特征的注意力机制层,用于根据所述对象特征以及时间独热向量的时段特征,训练得到每个时段目标用户对每个对象的关注权重;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接;
其中,所述时间独热向量的时段特征,为所述神经网络模型的密集层对嵌入处理后的时间独热向量进行非线性变化提取出的时段特征;所述时间独热向量,为针对时间信息进行独热编码得到。
2.根据权利要求1所述的方法,其特征在于,所述获得目标用户标识以及所述目标用户标识对应的候选对象信息,包括:
确定所述目标用户标识对应的计算设备的位置信息;
根据所述位置信息确定所述候选对象信息。
3.根据权利要求1所述的方法,其特征在于,所述获得目标用户标识以及所述目标用户标识对应的候选对象信息,包括:
确定特定对象的业务特征;
根据所述业务特征确定与所述用户目标标识匹配的特定对象,将所述特定对象的信息作为所述候选对象信息。
4.根据权利要求1所述的方法,其特征在于,所述获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息,包括:
获得业务服务平台接收到所述计算设备发送的业务访问请求的时间信息,作为所述特定时间信息,其中,所述业务服务平台为向所述计算设备提供针对所述候选对象信息的业务访问服务的平台。
5.根据权利要求1所述的方法,其特征在于,还包括:
确定所述神经网络模型的网络结构,按照所述网络结构构建初始神经网络模型;
获得用于训练所述神经网络模型的包含用户标识、对象信息、时间信息的样本数据,使用所述样本数据针对初始神经网络模型进行训练,得到所述预先训练的神经网络模型;所述神经网络模型的网络结构还包括:输入层、密集层以及输出层;其中,
所述输入层,用于接收独热向量输入信息,所述独热向量输入信息包含针对用户标识、对象信息分别进行独热编码,得到的用户独热向量、对象独热向量;
所述密集层,用于对经过嵌入处理后的用户独热向量、对象独热向量进行非线性变化,提取出嵌入处理后的用户独热向量的用户特征、嵌入处理后的对象独热向量的对象特征;
所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。
6.根据权利要求5所述的方法,其特征在于,所述神经网络模型,还用于:
针对时间独热向量以及对象独热向量进行嵌入处理,得到时段嵌入特征和对象嵌入特征;
将所述时段嵌入特征与所述对象嵌入特征进行乘法运算;
拼接乘法运算结果、所述时段嵌入特征以及所述对象嵌入特征,训练得到第一拼接信息;
针对第一拼接信息进行数值映射,得到每个时段用户对每个对象的关注权重;
将所述关注权重和所述对象嵌入特征相乘;
拼接相乘结果、所述线性交互特征、所述非线性特征,得到第二拼接信息;
针对第二拼接信息进行数值映射,得到每个时段用户对每个对象产生业务行为的概率。
7.根据权利要求5所述的方法,其特征在于,所述获得用于训练所述神经网络模型的包含用户标识、对象信息、时间信息的样本数据,包括:
获取参与训练的历史订单数据以及日志;
获得所述历史订单数据以及日志中包含的用户标识以及对象信息;
根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生过业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据;
将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值从所述备选样本数据中抽取所述样本数据。
8.根据权利要求7所述的方法,其特征在于,所述根据所述标签值从所述备选样本数据中抽取所述样本数据,包括:
按照标签值合并备选样本数据;
对合并后的备选样本数据按比例抽样,得到包含训练样本的训练集以及包含测试样本的测试集中的至少一个数据集。
9.根据权利要求8所述的方法,其特征在于,所述使用所述样本数据进行训练,得到所述预先训练的神经网络模型,包括:
获得训练集的训练样本,使用所述训练样本训练所述神经网络模型;
通过多次迭代训练,如果预测输出与真实标签之间的损失满足约束条件,则训练结束。
10.根据权利要求8所述的方法,其特征在于,所述使用所述样本数据进行训练,得到所述预先训练的神经网络模型,包括:
获得测试集的测试样本,使用所述测试样本验证所述神经网络模型,将经过验证的神经网络模型作为所述预先训练的神经网络模型。
11.根据权利要求7所述的方法,其特征在于,所述根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息产生过业务行为,包括:
如果用户标识对应的用户针对对象信息产生业务行为,则将所述对象信息作为正样本;否则将所述对象信息作为负样本;
将正样本对应的标签值置为第一预设数值,将负样本对应的标签值置为第二预设数值。
12.根据权利要求11所述的方法,其特征在于,还包括:
如果用户标识对应的用户针对对象信息下单,则判断所述用户针对所述对象信息产生业务行为;
如果用户标识对应的用户针对对象信息进行曝光未点击以及点击未下单中的至少一种访问行为,则判断所述用户针对所述对象信息未产生业务行为。
13.根据权利要求7所述的方法,其特征在于,还包括:
将所述业务行为发生的时间按照预定间隔进行离散处理;
针对离散处理后的时间进行独热编码得到所述时间独热向量。
14.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户标识、所述候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序,包括:
将所述目标用户标识、所述候选对象信息以及所述特定时间信息,分别进行独热编码,处理为目标用户独热向量、候选对象独热向量以及时间独热向量;
将上述独热向量作为所述神经网络模型的输入信息,学习得到目标用户标识针对每个候选对象信息的产生业务行为的概率;
按照所述概率对候选对象信息进行排序,得到所述关注度顺序。
15.根据权利要求14所述的方法,其特征在于,还包括:
输出所述关注度顺序,或者,将满足关注度阈值的候选对象信息推荐给所述目标用户标识对应的计算设备。
16.一种推荐系统,其特征在于,包括:数据采集模块、数据处理模块、训练模块、推荐模块;其中,
所述数据采集模块,用于获得参与训练的历史订单数据以及日志,获得所述历史订单数据以及日志中包含的用户标识以及对象信息;根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生了业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据;
所述数据处理模块,用于将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值按照比例从所述备选样本数据中抽取样本数据;
所述训练模块,用于根据所述样本数据训练用于确定目标用户对候选对象的关注度顺序的神经网络模型,得到训练好的神经网络模型;其中,所述神经网络模型中加入了基于时间特征的注意力机制;
所述推荐模块,用于根据目标用户的计算设备的位置信息以及对象业务特征信息中的至少一种信息,确定候选对象信息;根据目标用户的用户标识、候选对象信息、所述目标用户的计算设备针对所述候选对象信息进行访问的特定时间信息,采用训练好的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;将满足关注度阈值的候选对象信息推荐给所述目标用户的计算设备;
其中,所述神经网络模型的网络结构包括:加入基于时间特征的注意力机制的模型层以及拼接层;所述模型层,包括矩阵分解层,多层神经网络层以及基于时间特征的注意力机制层;所述矩阵分解层,用于针对用户特征以及对象特征进行元素点积计算,挖掘线性交互特征;所述多层神经网络层,用于针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;所述基于时间特征的注意力机制层,用于根据所述对象特征以及时间独热向量的时段特征,训练得到每个时段目标用户对每个对象的关注权重;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接;
其中,所述时间独热向量的时段特征,为所述神经网络模型的密集层对嵌入处理后的时间独热向量进行非线性变化提取出的时段特征;所述时间独热向量,为针对时间信息进行独热编码得到。
17.根据权利要求16所述的系统,其特征在于,所述神经网络模型的网络结构还包括:输入层、密集层以及输出层;其中,
所述输入层,用于接收独热向量输入信息,所述独热向量输入信息包含针对用户标识、对象信息分别进行独热编码,得到的用户独热向量、对象独热向量;
所述密集层,用于对经过嵌入处理后的用户独热向量、对象独热向量进行非线性变化,提取出嵌入处理后的用户独热向量的用户特征、嵌入处理后的对象独热向量的对象特征;
所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。
18.一种数据处理装置,其特征在于,包括:
候选对象获得单元,用于获得目标用户标识以及所述目标用户标识对应的候选对象信息;
业务时间获得单元,用于获得所述目标用户标识对应的计算设备针对所述候选对象信息进行访问的特定时间信息;
关注度排序单元,用于根据所述目标用户标识、所述候选对象信息以及所述特定时间信息,采用预先训练的神经网络模型确定所述目标用户对于所述候选对象信息的关注度顺序;其中,所述神经网络模型中加入了基于时间特征的注意力机制;
其中,所述神经网络模型的网络结构包括:加入基于时间特征的注意力机制的模型层以及拼接层;所述模型层,包括矩阵分解层,多层神经网络层以及基于时间特征的注意力机制层;所述矩阵分解层,用于针对用户特征以及对象特征进行元素点积计算,挖掘线性交互特征;所述多层神经网络层,用于针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;所述基于时间特征的注意力机制层,用于根据所述对象特征以及时间独热向量的时段特征,训练得到每个时段目标用户对每个对象的关注权重;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接;
其中,所述时间独热向量的时段特征,为所述神经网络模型的密集层对嵌入处理后的时间独热向量进行非线性变化提取出的时段特征;所述时间独热向量,为针对时间信息进行独热编码得到。
19.一种神经网络模型训练方法,其特征在于,包括:
获得包含用户标识、对象信息、时间信息的样本数据;
根据所述样本数据,针对初始神经网络模型进行训练,获得训练好的神经网络模型,所述神经网络模型用于根据目标用户标识、候选对象信息以及目标用户的计算设备针对所述候选对象信息进行访问的特定时间信息,获得所述目标用户对于所述候选对象信息的关注度顺序;所述神经网络模型为加入了基于时间特征的注意力机制的网络模型;
其中,所述神经网络模型的网络结构包括:加入基于时间特征的注意力机制的模型层以及拼接层;所述模型层,包括矩阵分解层,多层神经网络层以及基于时间特征的注意力机制层;所述矩阵分解层,用于针对用户特征以及对象特征进行元素点积计算,挖掘线性交互特征;所述多层神经网络层,用于针对所述用户特征与所述对象特征拼接后的信息,通过多层隐藏层挖掘非线性特征;所述基于时间特征的注意力机制层,用于根据所述对象特征以及时间独热向量的时段特征,训练得到每个时段目标用户对每个对象的关注权重;所述拼接层,用于将所述关注权重与所述对象特征拼接后的信息,与所述线性交互特征以及所述非线性交互特征进行拼接;
其中,所述时间独热向量的时段特征,为所述神经网络模型的密集层对嵌入处理后的时间独热向量进行非线性变化提取出的时段特征;所述时间独热向量,为针对时间信息进行独热编码得到。
20.根据权利要求19所述的方法,其特征在于,所述获得包含用户标识、对象信息、时间信息的样本数据,包括:
获取参与训练的历史订单数据以及日志;
获得所述历史订单数据以及日志中包含的用户标识以及对象信息;
根据所述历史订单数据以及所述日志,使用标签标注每个用户标识是否针对每个对象信息对应的对象产生过业务行为,得到包含用户标识、对象信息、业务行为发生的时间以及标签值的标注数据;
将所述标注数据中的用户标识、对象信息以及业务行为发生的时间分别进行独热编码,得到包含用户独热向量、对象独热向量、时间独热向量以及标签值的备选样本数据,根据所述标签值从所述备选样本数据中抽取所述样本数据。
21.根据权利要求20所述的方法,其特征在于,所述样本数据还包含用户对象相关性标签真实值;所述用户对象相关性标签真实值,为根据每个用户标识是否针对每个对象信息对应的对象真实产生了业务行为进行标注的标签;
所述方法还包括:如果训练时预测输出与所述用户对象相关性标签真实值之间的损失满足约束条件,则终止训练;否则,进行迭代训练。
22.根据权利要求19所述的方法,其特征在于,所述神经网络模型还包括:输入层、密集层以及输出层;其中,
所述输入层,用于接收用户标识独热向量、对象信息独热向量,将提取的特征经过嵌入处理后输出给密集层;
所述密集层,用于对经过嵌入处理后的特征进行非线性变化,提取出嵌入处理后得到的用户特征、对象特征;
所述输出层,用于针对拼接层输出的拼接信息进行处理,得到用户标识对应的用户针对每个对象信息标识的对象产生业务行为的概率。
23.根据权利要求22所述的方法,其特征在于,所述神经网络模型,还用于:
针对时间独热向量以及对象独热向量进行嵌入处理,得到时段嵌入特征和对象嵌入特征;
将所述时段嵌入特征与所述对象嵌入特征进行乘法运算;
拼接乘法运算结果、所述时段嵌入特征以及所述对象嵌入特征,训练得到第一拼接信息;
针对第一拼接信息进行数值映射,得到每个时段用户对每个对象的关注权重;
将所述关注权重和所述对象嵌入特征相乘;
拼接相乘结果、所述线性交互特征、所述非线性特征,得到第二拼接信息;
针对第二拼接信息进行数值映射,得到每个时段用户对每个对象产生业务行为的概率。
24.一种电子设备,其特征在于,包括:
存储器,以及处理器;所述存储器用于存储计算机程序,所述计算机程序被所述处理器运行后,执行权利要求1-15以及19-23任意一项所述的方法。
25.一种存储设备,其特征在于,存储有计算机程序,所述计算机程序被处理器运行后,执行权利要求1-15以及19-23任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010739614.7A CN111898904B (zh) | 2020-07-28 | 2020-07-28 | 一种数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010739614.7A CN111898904B (zh) | 2020-07-28 | 2020-07-28 | 一种数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111898904A CN111898904A (zh) | 2020-11-06 |
CN111898904B true CN111898904B (zh) | 2024-03-22 |
Family
ID=73182505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010739614.7A Active CN111898904B (zh) | 2020-07-28 | 2020-07-28 | 一种数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111898904B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112287177B (zh) * | 2020-11-25 | 2021-07-13 | 城云科技(中国)有限公司 | 一种创建、变更、显示和查询对象标签的方法和装置 |
CN112328901B (zh) * | 2020-12-14 | 2021-12-17 | 北京中嘉和信通信技术有限公司 | 基于云计算和区块链金融的业务推荐方法及云计算系统 |
CN112784165A (zh) * | 2021-01-29 | 2021-05-11 | 北京百度网讯科技有限公司 | 关联关系预估模型的训练方法以及预估文件热度的方法 |
TWI807905B (zh) * | 2022-07-07 | 2023-07-01 | 創鑫智慧股份有限公司 | 推薦系統中建構特徵交互的全交互方法與裝置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829775A (zh) * | 2018-12-03 | 2019-05-31 | 苏州大学 | 一种物品推荐方法、装置、设备及可读存储介质 |
CN109960759A (zh) * | 2019-03-22 | 2019-07-02 | 中山大学 | 基于深度神经网络的推荐系统点击率预测方法 |
CN110929206A (zh) * | 2019-11-20 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 点击率预估方法、装置、计算机可读存储介质和设备 |
CN111159564A (zh) * | 2019-12-31 | 2020-05-15 | 联想(北京)有限公司 | 信息推荐方法、装置、存储介质及计算机设备 |
CN111291264A (zh) * | 2020-01-23 | 2020-06-16 | 腾讯科技(深圳)有限公司 | 基于机器学习的访问对象预测方法、装置和计算机设备 |
-
2020
- 2020-07-28 CN CN202010739614.7A patent/CN111898904B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829775A (zh) * | 2018-12-03 | 2019-05-31 | 苏州大学 | 一种物品推荐方法、装置、设备及可读存储介质 |
CN109960759A (zh) * | 2019-03-22 | 2019-07-02 | 中山大学 | 基于深度神经网络的推荐系统点击率预测方法 |
CN110929206A (zh) * | 2019-11-20 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 点击率预估方法、装置、计算机可读存储介质和设备 |
CN111159564A (zh) * | 2019-12-31 | 2020-05-15 | 联想(北京)有限公司 | 信息推荐方法、装置、存储介质及计算机设备 |
CN111291264A (zh) * | 2020-01-23 | 2020-06-16 | 腾讯科技(深圳)有限公司 | 基于机器学习的访问对象预测方法、装置和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111898904A (zh) | 2020-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111898904B (zh) | 一种数据处理方法及装置 | |
CN112487278A (zh) | 推荐模型的训练方法、预测选择概率的方法及装置 | |
US10783442B1 (en) | Demand forecasting via direct quantile loss optimization | |
CN107729937A (zh) | 用于确定用户兴趣标签的方法及装置 | |
US8868471B1 (en) | Evaluation of task judging results | |
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
CN110110233B (zh) | 信息处理方法、装置、介质和计算设备 | |
CN109189922B (zh) | 评论评估模型的训练方法和装置 | |
CN111080417A (zh) | 用于提高预订顺畅率的处理方法、模型训练方法及系统 | |
CN114610865A (zh) | 召回文本推荐方法、装置、设备及存储介质 | |
CN111680213B (zh) | 信息推荐方法、数据处理方法及装置 | |
US20230128579A1 (en) | Generative-discriminative ensemble method for predicting lifetime value | |
CN114511387A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN113822734A (zh) | 用于生成信息的方法和装置 | |
CN116800831A (zh) | 一种业务数据推送方法、装置、存储介质及处理器 | |
CN116401522A (zh) | 一种金融服务动态化推荐方法和装置 | |
CN111597430A (zh) | 数据处理方法及装置、电子设备、存储介质 | |
CN114429384A (zh) | 基于电商平台的产品智能推荐方法及系统 | |
CN113792952A (zh) | 用于生成模型的方法和装置 | |
CN111915339A (zh) | 数据的处理方法、装置及设备 | |
WO2010037077A1 (en) | Apparatus, system, and method for predicting attitudinal segments | |
CN111581068A (zh) | 终端的工作量计算方法及其装置、存储介质、终端、云服务系统 | |
Stöckl et al. | Regression: Data-Driven Modeling of Numerical Relationships in Tourism | |
CN112632389B (zh) | 信息处理方法、信息处理装置、存储介质与电子设备 | |
CN114491283B (zh) | 对象推荐方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |