CN110297970A - 信息推荐模型训练方法及装置 - Google Patents

信息推荐模型训练方法及装置 Download PDF

Info

Publication number
CN110297970A
CN110297970A CN201910452929.0A CN201910452929A CN110297970A CN 110297970 A CN110297970 A CN 110297970A CN 201910452929 A CN201910452929 A CN 201910452929A CN 110297970 A CN110297970 A CN 110297970A
Authority
CN
China
Prior art keywords
user behavior
information
insertion vector
behavior
information recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910452929.0A
Other languages
English (en)
Other versions
CN110297970B (zh
Inventor
牛亚男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910452929.0A priority Critical patent/CN110297970B/zh
Publication of CN110297970A publication Critical patent/CN110297970A/zh
Application granted granted Critical
Publication of CN110297970B publication Critical patent/CN110297970B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本公开公开了一种信息推荐模型训练方法、装置、电子设备及计算机可读存储介质,其中,所述方法包括:确定与第一用户行为存在条件依赖的至少一种第二用户行为;获取第一用户行为对应的第一嵌入向量;第一嵌入向量为发生第一用户行为的信息对应的嵌入向量;将第一嵌入向量分别与每种第二用户行为对应的第二嵌入向量进行拼接,得到每种第二用户行为对应的第三嵌入向量;第二嵌入向量为发生第二用户行为的信息对应的嵌入向量;根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型。本公开通过拼接存在条件依赖的用户行为的嵌入向量,根据拼接后的嵌入向量进行训练得到信息推荐模型,解决了样本数据稀疏性的问题,并提高了信息推荐精度。

Description

信息推荐模型训练方法及装置
技术领域
本公开涉及信息处理技术领域,尤其涉及一种信息推荐模型训练方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网技术的飞速发展,人们越来越多地使用个性化推送应用程序(Applicationapp,App)来获取信息,包括新闻、视频等等。这些App除了在用户使用的时候给用户推送感兴趣的信息之外,还可以通过信息推送机制,在用户没有使用app的时候主动给用户推送定制化的信息。
在现有技术中,往往通过推荐模型预测用户点击信息的行为、或喜欢信息的行为、或关注信息作者的行为该信息的概率,将概率高的信息推送给用户。而在训练推荐模型时需要大量的训练样本,例如,在训练根据点击信息的行为量训练推荐模型时,需要获取足量的点击信息的行为数据对应的样本,在训练根据喜欢信息的行为量训练推荐模型时,需要获取足量的喜欢信息的行为数据对应的样本,在训练根据浏览信息的行为量训练推荐模型时,需要获取足量的浏览信息的行为数据对应的样本,等等。
在实际情况下,喜欢信息的行为及浏览信息的行为对应的样本数据量稀疏,则很难直接训练好,这样就导致训练模型失败,而基于该训练的推荐模型在信息推荐时不够精确。
发明内容
本公开提供一种信息推荐模型训练方法、装置、电子设备及计算机可读存储介质,以至少解决相关技术中信息推荐模型训练失败的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种信息推荐模型训练方法,包括:
确定与第一用户行为存在条件依赖的至少一种第二用户行为;其中,所述条件依赖为所述第二用户行为的执行依赖于所述第一用户行为的执行,所述第一用户行为和所述第二用户行为对所述信息执行不同操作的行为;
获取所述第一用户行为对应的第一嵌入向量;其中,所述第一嵌入向量为发生所述第一用户行为的信息对应的嵌入向量;
将所述第一嵌入向量分别与每种第二用户行为对应的第二嵌入向量进行拼接,得到每种第二用户行为对应的第三嵌入向量;其中,所述第二嵌入向量为发生所述第二用户行为的信息对应的嵌入向量;
根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型;其中,所述信息推荐模型用于预估所述信息发生每种第二用户行为的概率。
进一步的,获取用户行为对应的嵌入向量的步骤,包括:
根据历史日志获取用户行为列表;其中,所述用户行为列表中包含发生所述用户行为的信息标识;
根据所述信息标识获取对应信息的信息特征,将多个信息的信息特征形成训练样本集合;
将所述训练样本集合输入嵌入神经网络进行训练,得到所述用户行为对应的嵌入向量。
进一步的,所述根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型,包括:
将每种第二用户行为对应的第三嵌入向量输入卷积神经网络;其中,所述卷积神经网络包含至少一个子卷积神经网络,一个子卷积神经网络对应一种用户行为预测子模型;
每种用户行为预测子模型根据对应的第三嵌入向量独立训练直至满足预设的收敛条件,得到包含至少一种用户行为预测子模型的信息推荐模型。
进一步的,所述第一用户行为为点击信息的行为,和/或,所述至少一种第二用户行为为喜欢信息的行为、浏览信息的行为和关注信息作者的行为。
进一步的,所述信息为多媒体信息。
根据本公开实施例的第二方面,还提供一种信息推荐方法,包括:
接收推荐请求;
采用上述第一方面所述的任一项所述信息推荐模型预测信息发生至少一种用户行为的概率;
根据所述概率进行信息推荐。
根据本公开实施例的第三方面,提供一种信息推荐模型训练装置,包括:
行为确定模块,用于确定与第一用户行为存在条件依赖的至少一种第二用户行为;其中,所述条件依赖为所述第二用户行为的执行依赖于所述第一用户行为的执行,所述第一用户行为和所述第二用户行为对所述信息执行不同操作的行为;
向量获取模块,用于获取所述第一用户行为对应的第一嵌入向量;其中,所述第一嵌入向量为发生所述第一用户行为的信息对应的嵌入向量;
向量拼接模块,用于将所述第一嵌入向量分别与每种第二用户行为对应的第二嵌入向量进行拼接,得到每种第二用户行为对应的第三嵌入向量;其中,所述第二嵌入向量为发生所述第二用户行为的信息对应的嵌入向量;
模型训练模块,用于根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型;其中,所述信息推荐模型用于预估所述信息发生每种第二用户行为的概率。
进一步的,所述向量获取模块具体用于:根据历史日志获取用户行为列表;其中,所述用户行为列表中包含发生所述用户行为的信息标识;根据所述信息标识获取对应信息的信息特征,将多个信息的信息特征形成训练样本集合;将所述训练样本集合输入嵌入神经网络进行训练,得到所述用户行为对应的嵌入向量。
进一步的,所述模型训练模块具体用于:将每种第二用户行为对应的第三嵌入向量输入卷积神经网络;其中,所述卷积神经网络包含至少一个子卷积神经网络,一个子卷积神经网络对应一种用户行为预测子模型;每种用户行为预测子模型根据对应的第三嵌入向量独立训练直至满足预设的收敛条件,得到包含至少一种用户行为预测子模型的信息推荐模型。
进一步的,所述第一用户行为为点击信息的行为,和/或,所述至少一种第二用户行为为喜欢信息的行为、浏览信息的行为和关注信息作者的行为。
进一步的,所述信息为多媒体信息。
根据本公开实施例的第四方面,提供一种信息推荐装置,包括:
请求接收模块,用于接收推荐请求;
概率预测模块,用于采用上述第一方面所述的任一项所述信息推荐模型预测信息发生至少一种用户行为的概率;
信息推荐模块,用于根据所述概率进行信息推荐。
根据本公开实施例的第五方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:通过执行指令以实现上述第一方面任一项所述的信息推荐模型训练方法。
根据本公开实施例的第六方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行上述第一方面任一项所述的信息推荐模型训练方法。
根据本公开实施例的第七方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:通过执行指令以实现上述第二方面所述的信息推荐方法。
根据本公开实施例的第八方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行上述第二方面所述的信息推荐方法。
根据本公开实施例的第九方面,提供一种计算机产品,包括上述第一方面任一项所述的信息推荐模型训练方法。
根据本公开实施例的第十方面,提供一种计算机产品,包括上述第二方面所述的信息推荐方法。
本公开的实施例提供的技术方案至少带来以下有益效果:通过确定与第一用户行为存在条件依赖的至少一种第二用户行为,将所述第一用户行为对应的第一嵌入向量分别与每种第二用户行为对应的第二嵌入向量进行拼接,得到每种第二用户行为对应的第三嵌入向量,根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型,不仅解决了样本数据稀疏性的问题,大大提高了模型训练的成功率,并且提高了信息推荐精度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1a是本公开实施例一提供的一种信息推荐模型训练方法的流程图。
图1b是本公开实施例一提供的一种信息推荐模型训练方法中的卷积层的卷积过程示意图。
图1c是本公开实施例一提供的一种信息推荐模型训练方法中的卷积层的卷积结果示意图。
图2是本公开实施例二提供的一种信息推荐模型训练方法的流程图。
图3是本公开实施例三提供的一种信息推荐模型训练装置的结构框图。
图4是本公开实施例四提供的一种信息推荐装置的结构框图。
图5是本公开实施例五提供的一种电子设备的结构框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
实施例一
图1a是本公开实施例一提供的一种信息推荐模型训练方法的流程图,本实施例提供的信息推荐模型训练方法的执行主体,可为本公开实施例提供的信息推荐模型训练装置,该装置可以集成于移动终端设备(例如,智能手机、平板电脑等)、笔记本或固定终端(台式电脑)中,该信息推荐模型训练装置可以采用硬件或软件实现。如图1a所示,包括以下步骤:
在步骤S11中,确定与第一用户行为存在条件依赖的至少一种第二用户行为;其中,所述条件依赖为所述第二用户行为的执行依赖于所述第一用户行为的执行,所述第一用户行为和所述第二用户行为对所述信息执行不同操作的行为。
其中,信息包括但不限于多媒体信息,例如短视频。本公开可以应用于短视频应用中,用于对短视频进行推荐。
其中,第一用户行为可以为点击信息的行为,至少一种第二用户行为可以为喜欢信息的行为、浏览信息的行为和关注信息作者的行为。所述第二用户行为的执行依赖于所述第一用户行为的执行,例如,对于一个信息,只有用户先点击了该行为,才会有后续的喜欢、浏览及关注等行为。例如,以短视频为例,在一个短视频应用显示界面可以提供点击按钮、喜欢按钮、及关注按钮等操作按钮。针对其中的视频,用户可以通过触发点击按钮播放该视频内容即发生了点击视频的行为;进一步的,如果该视频被播放完毕或该视频被播放超过预定时间(例如1分钟),那么可以认为用户浏览了该视频即发生了浏览视频的行为;进一步的,如果用户浏览完毕该视频之后喜欢该视频,则通过触发喜欢按钮标记喜欢该视频内容即发生了喜欢视频的行为;进一步的,如果用户喜欢该视频则可以关注该视频的作者,则通过触发关注按钮以关注该视频的作者即发生了关注视频作者的行为。
在步骤S12中,获取所述第一用户行为对应的第一嵌入向量;其中,所述第一嵌入向量为发生所述第一用户行为的信息对应的嵌入向量。
其中,嵌入向量embedding是一个根据映射关系构建的向量,该映射关系可以为将一个空间里的信息抛射到一个线性向量空间里去,这样一来可以在向量空间里计算度量它们的距离等。
其中,第一嵌入向量根据信息的信息特征和/或用户属性生成,其包含信息特征和/或用户属性。其中,用户属性包括用户输入的姓名或昵称、年龄、性别、户籍类型等。
其中,所述第一用户行为可以为点击信息的行为,发生所述第一用户行为的信息即为用户点击的信息。
在步骤S13中,将所述第一嵌入向量分别与每种第二用户行为对应的第二嵌入向量进行拼接,得到每种第二用户行为对应的第三嵌入向量;其中,所述第二嵌入向量为发生所述第二用户行为的信息对应的嵌入向量。
其中,第二用户行为可能为多种,例如喜欢信息的行为、浏览信息的行为和关注信息作者的行为。在本实施例中,对该多种第二用户行为对应的嵌入向量分别进行拼接。
其中,发生所述第二用户行为的信息即为用户喜欢的信息、用户浏览的信息、或用户关注的作者发布的信息。
其中,在拼接时可以从第一嵌入向量中选取全部特征向量或部分特征向量与第二用户行为对应的第二嵌入向量进行拼接。具体的,可以将第二嵌入向量拼接在第一嵌入向量的后面或中间或前面,这里不做具体限定。
例如,第一嵌入向量为[a1、a2、a3、a4、a5、a6]、其中,a1、a2、a3、a4为信息特征对应的向量元素,a5、a6为用户对应的信息元素,第二嵌入向量为[b1、b2、b3、b4、b5]、其中,b1、b2、b3为信息特征对应的向量元素,b4、b5为用户对应的信息元素,针对上述第一嵌入向量和第二嵌入向量其对应的拼接形式有:第一种,选取第一嵌入向量的全部特征向量与第二嵌入向量拼接,具体拼接后的第三嵌入向量可以为:[a1、a2、a3、a4、a5、a6、b1、b2、b3、b4、b5]、或[b1、b2、b3、b4、b5、a1、a2、a3、a4、a5、a6]、或[a1、a2、a3、a4、b1、b2、b3、b4、b5、a5、a6]等;第一种,选取第一嵌入向量的部分特征向量与第二嵌入向量拼接,具体拼接后的第三嵌入向量可以为:[a1、a2、a3、a4、b1、b2、b3、b4、b5]、或[b1、b2、b3、b4、b5、a1、a2、a3、a4]、或[a1、a2、b1、b2、b3、a3、a4、b4、b5]等。
在步骤S14中,根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型;其中,所述信息推荐模型用于预估所述信息发生每种第二用户行为的概率。
具体的,当第二用户行为文多种时,可以同时对多种第二用户行为进行训练,训练得到的信息推荐模型可以预测多种第二用户行为的概率。
本实施例通过确定与第一用户行为存在条件依赖的至少一种第二用户行为,将所述第一用户行为对应的第一嵌入向量分别与每种第二用户行为对应的第二嵌入向量进行拼接,得到每种第二用户行为对应的第三嵌入向量,根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型,不仅解决了样本数据稀疏性的问题,并且提高了信息推荐精度。
在一个可选的实施例中,获取用户行为对应的嵌入向量的步骤,包括:
根据历史日志获取用户行为列表;其中,所述用户行为列表中包含发生所述用户行为的信息标识;根据所述信息标识获取对应信息的信息特征,将多个信息的信息特征形成训练样本集合;将所述训练样本集合输入嵌入神经网络进行训练,得到所述用户行为对应的嵌入向量。
其中,嵌入神经网络可以将离散的特征即信息特征映射为连续的向量即嵌入向量,具体可以通过训练优化权重最小化损失函数来实现。
本实施例可以用于训练得到上述的第一用户行为的第一嵌入向量,和/或,第二用户行为的第二嵌入向量。
在一个可选的实施例中,步骤14具体包括:
步骤141:将每种第二用户行为对应的第三嵌入向量输入卷积神经网络;其中,所述卷积神经网络包含至少一个子卷积神经网络,一个子卷积神经网络对应一种用户行为预测子模型。
其中,卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,主要包括输入层、卷积层、池化层、全连接层和输出层。并且,一个卷积神经网络可以包括多个卷积层。在本文中,卷积神经网络可以为直筒型卷积神经网络,也可以为深度学习卷积神经网络,这里不做具体限定。
其中,卷积层包括卷积核,卷积核可以为一个矩阵,用于对输入信息进行卷积,具体计算方法为对输入的信息的不同局部矩阵和卷积核矩阵各个位置的元素相乘,然后相加。在本文中,每种用户行为可以对应不同的卷积核。
举个例子,如图1b所示,输入是一个二维的3x4的矩阵,而卷积核是一个2x2的矩阵。这里假设卷积是一次移动一个像素来卷积的,那么首先对输入的左上角2x2局部和卷积核卷积,即各个位置的元素相乘再相加,得到的输出矩阵S的S00的元素,值为aw+bx+ey+fzaw+bx+ey+fz。接着将输入的局部向右平移一个像素,现在是(b,c,f,g)四个元素构成的矩阵和卷积核来卷积,这样得到了输出矩阵S的S01的元素,同样的方法,可以得到输出矩阵S的S02,S10,S11,S12,S10,S11,S12的元素。如图1c所示,最终得到卷积输出的矩阵为一个2x3的矩阵S。
其中,所述参数包括卷积层的卷积核对应的参数,例如卷积矩阵的大小,例如可以设为3*3的矩阵,不同的卷积层可以设置不同的卷积核。此外,还可以包括池化层的参数,例如池化矩阵的大小,可以为3*3的池化矩阵,或者输出层的参数,例如线性系数矩阵及偏倚向量等。
步骤142:每种用户行为预测子模型根据对应的第三嵌入向量独立训练直至满足预设的收敛条件,得到包含至少一种用户行为预测子模型的信息推荐模型。
其中,收敛条件可以为最小化损失函数。
当有多种用户行为时,多种用户行为分别独自训练,可以分别拥有各自的损失函数,直至各自的损失函数最小化结束训练,得到各自对应的用户行为预测子模型。
实施例二
图2是本公开实施例二提供的一种信息推荐方法的流程图,本实施例提供的信息推荐模型训练方法的执行主体,可为本公开实施例提供的信息推荐装置,该装置可以集成于移动终端设备(例如,智能手机、平板电脑等)、笔记本或固定终端(台式电脑)中,该信息推荐装置可以采用硬件或软件实现。如图2所示,包括以下步骤:
在步骤S21中,接收推荐请求。
其中,推荐请求可以为用户在应用程序界面上的滑动操作、上拉操作、下拉操作中的任意一种;还可以为应用程序的启动指令等。
在步骤S22中,采用信息推荐模型预测信息发生至少一种用户行为的概率。
其中,信息推荐模型为采用上述实施例一中的信息推荐模型训练方法得到。
在步骤S23中,根据所述概率进行信息推荐。
例如,当用户行为为一种时,例如可以为点击信息的行为、或喜欢信息的行为、或浏览信息的行为、或关注信息作者的行为,可以使用信息推荐模型预测上述任意一种用户行为的概率,选取概率最高的信息进行推荐。
当用户行为为多种时,例如可以为点击信息的行为、喜欢信息的行为、浏览信息的行为、和关注信息作者中的任意组合,可以使用信息推荐模型预测多种用户行为的概率,根据多种用户行为的概率进行信息推荐。具体的,可以对多种用户行为的概率进行加权融合,选取加权融合后概率最高的信息进行推荐。
本实施例通过上述实施例一的信息推荐模型进行信息推荐,由于该信息推荐模型是通过确定与第一用户行为存在条件依赖的至少一种第二用户行为,将所述第一用户行为对应的第一嵌入向量分别与每种第二用户行为对应的第二嵌入向量进行拼接,得到每种第二用户行为对应的第三嵌入向量,根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到,该信息推荐模型不仅解决了样本数据稀疏性的问题,并且可以提高信息推荐精度。
实施例三
图3是本公开实施例三提供的一种信息推荐模型训练装置框图。该装置可以集成于移动终端设备(例如,智能手机、平板电脑等)、笔记本或固定终端(台式电脑)中,该信息推荐模型训练装置可以采用硬件或软件实现。参照图3,该装置包括行为确定模块31、向量获取模块32、向量拼接模块33和模型训练模块34;其中,
行为确定模块31用于确定与第一用户行为存在条件依赖的至少一种第二用户行为;其中,所述条件依赖为所述第二用户行为的执行依赖于所述第一用户行为的执行,所述第一用户行为和所述第二用户行为对所述信息执行不同操作的行为;
向量获取模块32用于获取所述第一用户行为对应的第一嵌入向量;其中,所述第一嵌入向量为发生所述第一用户行为的信息对应的嵌入向量;
向量拼接模块33用于将所述第一嵌入向量分别与每种第二用户行为对应的第二嵌入向量进行拼接,得到每种第二用户行为对应的第三嵌入向量;其中,所述第二嵌入向量为发生所述第二用户行为的信息对应的嵌入向量;
模型训练模块34用于根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型;其中,所述信息推荐模型用于预估所述信息发生每种第二用户行为的概率。
进一步的,所述向量获取模块32具体用于:根据历史日志获取用户行为列表;其中,所述用户行为列表中包含发生所述用户行为的信息标识;根据所述信息标识获取对应信息的信息特征,将多个信息的信息特征形成训练样本集合;将所述训练样本集合输入嵌入神经网络进行训练,得到所述用户行为对应的嵌入向量。
进一步的,所述模型训练模块34具体用于:将每种第二用户行为对应的第三嵌入向量输入卷积神经网络;其中,所述卷积神经网络包含至少一个子卷积神经网络,一个子卷积神经网络对应一种用户行为预测子模型;每种用户行为预测子模型根据对应的第三嵌入向量独立训练直至满足预设的收敛条件,得到包含至少一种用户行为预测子模型的信息推荐模型。
进一步的,所述第一用户行为为点击信息的行为,和/或,所述至少一种第二用户行为为喜欢信息的行为、浏览信息的行为和关注信息作者的行为。
进一步的,所述信息为多媒体信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例四
图4是本公开实施例四提供的一种信息推荐装置框图。该装置可以集成于移动终端设备(例如,智能手机、平板电脑等)、笔记本或固定终端(台式电脑)中,该信息推荐模型训练装置可以采用硬件或软件实现。参照图4,该装置包括请求接收模块41、概率预测模块42和信息推荐模块43;其中,
请求接收模块41用于接收推荐请求;
概率预测模块42用于采用上述第一方面所述的任一项所述信息推荐模型预测信息发生至少一种用户行为的概率;
信息推荐模块43用于根据所述概率进行信息推荐。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例五
图5是根据一示例性实施例示出的一种用于信息推荐模型训练的装置500的框图。例如,装置500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置500可以包括以下一个或多个组件:处理组件502,存储器504,电力组件506,多媒体组件508,音频组件510,输入/输出(I/O)的接口512,传感器组件514,以及通信组件516。
处理组件502通常控制装置500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在设备500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件506为装置500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。
多媒体组件508包括在所述装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
I/O接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击信息的行为轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为装置500提供各个方面的状态评估。例如,传感器组件514可以检测到设备500的打开/关闭状态,组件的相对定位,例如所述组件为装置500的显示器和小键盘,传感器组件514还可以检测装置500或装置500一个组件的位置改变,用户与装置500接触的存在或不存在,装置500方位或加速/减速和装置500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件516还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器504,上述指令可由装置500的处理器520执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种信息推荐模型训练方法,其特征在于,包括:
确定与第一用户行为存在条件依赖的至少一种第二用户行为;其中,所述条件依赖为所述第二用户行为的执行依赖于所述第一用户行为的执行,所述第一用户行为和所述第二用户行为对所述信息执行不同操作的行为;
获取所述第一用户行为对应的第一嵌入向量;其中,所述第一嵌入向量为发生所述第一用户行为的信息对应的嵌入向量;
将所述第一嵌入向量分别与每种第二用户行为对应的第二嵌入向量进行拼接,得到每种第二用户行为对应的第三嵌入向量;其中,所述第二嵌入向量为发生所述第二用户行为的信息对应的嵌入向量;
根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型;其中,所述信息推荐模型用于预估所述信息发生每种第二用户行为的概率。
2.根据权利要求1所述的方法,其特征在于,获取用户行为对应的嵌入向量的步骤,包括:
根据历史日志获取用户行为列表;其中,所述用户行为列表中包含发生所述用户行为的信息标识;
根据所述信息标识获取对应信息的信息特征,将多个信息的信息特征形成训练样本集合;
将所述训练样本集合输入嵌入神经网络进行训练,得到所述用户行为对应的嵌入向量。
3.根据权利要求1所述的方法,其特征在于,所述根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型,包括:
将每种第二用户行为对应的第三嵌入向量输入卷积神经网络;其中,所述卷积神经网络包含至少一个子卷积神经网络,一个子卷积神经网络对应一种用户行为预测子模型;
每种用户行为预测子模型根据对应的第三嵌入向量独立训练直至满足预设的收敛条件,得到包含至少一种用户行为预测子模型的信息推荐模型。
4.一种信息推荐方法,其特征在于,包括:
接收推荐请求;
采用权利要求1-3任一项所述信息推荐模型预测信息发生至少一种用户行为的概率;
根据所述概率进行信息推荐。
5.一种信息推荐模型训练装置,其特征在于,包括:
行为确定模块,用于确定与第一用户行为存在条件依赖的至少一种第二用户行为;其中,所述条件依赖为所述第二用户行为的执行依赖于所述第一用户行为的执行,所述第一用户行为和所述第二用户行为对所述信息执行不同操作的行为;
向量获取模块,用于获取所述第一用户行为对应的第一嵌入向量;其中,所述第一嵌入向量为发生所述第一用户行为的信息对应的嵌入向量;
向量拼接模块,用于将所述第一嵌入向量分别与每种第二用户行为对应的第二嵌入向量进行拼接,得到每种第二用户行为对应的第三嵌入向量;其中,所述第二嵌入向量为发生所述第二用户行为的信息对应的嵌入向量;
模型训练模块,用于根据每种第二用户行为对应的第三嵌入向量分别进行独立训练得到信息推荐模型;其中,所述信息推荐模型用于预估所述信息发生每种第二用户行为的概率。
6.一种信息推荐装置,其特征在于,包括:
请求接收模块,用于接收推荐请求;
概率预测模块,用于采用权利要求1-3任一项所述信息推荐模型预测信息发生至少一种用户行为的概率;
信息推荐模块,用于根据所述概率进行信息推荐。
7.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:通过执行指令以实现权利要求1-3任一项所述的信息推荐模型训练方法。
8.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行权利要求1-3任一项所述的信息推荐模型训练方法。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:通过执行指令以实现权利要求4所述的信息推荐方法。
10.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行权利要求4所述的信息推荐方法。
CN201910452929.0A 2019-05-28 2019-05-28 信息推荐模型训练方法及装置 Active CN110297970B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910452929.0A CN110297970B (zh) 2019-05-28 2019-05-28 信息推荐模型训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910452929.0A CN110297970B (zh) 2019-05-28 2019-05-28 信息推荐模型训练方法及装置

Publications (2)

Publication Number Publication Date
CN110297970A true CN110297970A (zh) 2019-10-01
CN110297970B CN110297970B (zh) 2021-04-23

Family

ID=68027334

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910452929.0A Active CN110297970B (zh) 2019-05-28 2019-05-28 信息推荐模型训练方法及装置

Country Status (1)

Country Link
CN (1) CN110297970B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111311462A (zh) * 2020-01-13 2020-06-19 北京明略软件系统有限公司 嫌疑人推荐方法和装置、电子设备及计算机可读存储介质
CN113836439A (zh) * 2021-09-14 2021-12-24 上海任意门科技有限公司 用户匹配方法、计算设备和计算机可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286217A (zh) * 2007-04-12 2008-10-15 株式会社东芝 信息评估系统及用于评估信息的方法
US20110029464A1 (en) * 2009-07-31 2011-02-03 Qiong Zhang Supplementing a trained model using incremental data in making item recommendations
CN106251174A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 信息推荐方法及装置
CN106485562A (zh) * 2015-09-01 2017-03-08 苏宁云商集团股份有限公司 一种基于用户历史行为的商品信息推荐方法及系统
CN109408724A (zh) * 2018-11-06 2019-03-01 北京达佳互联信息技术有限公司 多媒体资源预估点击率的确定方法、装置及服务器
CN109508407A (zh) * 2019-01-14 2019-03-22 上海电机学院 融合时间与兴趣相似度的电视产品推荐方法
CN109800325A (zh) * 2018-12-26 2019-05-24 北京达佳互联信息技术有限公司 视频推荐方法、装置和计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286217A (zh) * 2007-04-12 2008-10-15 株式会社东芝 信息评估系统及用于评估信息的方法
US20110029464A1 (en) * 2009-07-31 2011-02-03 Qiong Zhang Supplementing a trained model using incremental data in making item recommendations
CN106485562A (zh) * 2015-09-01 2017-03-08 苏宁云商集团股份有限公司 一种基于用户历史行为的商品信息推荐方法及系统
CN106251174A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 信息推荐方法及装置
CN109408724A (zh) * 2018-11-06 2019-03-01 北京达佳互联信息技术有限公司 多媒体资源预估点击率的确定方法、装置及服务器
CN109800325A (zh) * 2018-12-26 2019-05-24 北京达佳互联信息技术有限公司 视频推荐方法、装置和计算机可读存储介质
CN109508407A (zh) * 2019-01-14 2019-03-22 上海电机学院 融合时间与兴趣相似度的电视产品推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘杨涛等: "基于嵌入式向量和循环神经网络的用户行为预测方法 ", 《现代电子技术》 *
李博文: "基于用户行为分析的个性化推荐技术研究 ", 《电子世界》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111311462A (zh) * 2020-01-13 2020-06-19 北京明略软件系统有限公司 嫌疑人推荐方法和装置、电子设备及计算机可读存储介质
CN113836439A (zh) * 2021-09-14 2021-12-24 上海任意门科技有限公司 用户匹配方法、计算设备和计算机可读存储介质
CN113836439B (zh) * 2021-09-14 2024-01-30 上海任意门科技有限公司 用户匹配方法、计算设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN110297970B (zh) 2021-04-23

Similar Documents

Publication Publication Date Title
WO2020215962A1 (zh) 视频推荐方法、装置、计算机设备及存储介质
US11823677B2 (en) Interaction with a portion of a content item through a virtual assistant
CN109684510B (zh) 视频排序方法、装置、电子设备及存储介质
CN109859096A (zh) 图像风格迁移方法、装置、电子设备及存储介质
CN109800325A (zh) 视频推荐方法、装置和计算机可读存储介质
CN110363346A (zh) 点击率预测方法、预测模型的训练方法、装置及设备
CN110909815B (zh) 神经网络训练、图像处理方法、装置及电子设备
CN112926339B (zh) 文本相似度确定方法、系统、存储介质以及电子设备
CN107992478A (zh) 确定热点事件的方法和装置
CN109871843A (zh) 字符识别方法和装置、用于字符识别的装置
CN110188865B (zh) 信息处理方法及装置、电子设备和存储介质
CN107230137A (zh) 商品信息获取方法及装置
CN109670077A (zh) 视频推荐方法、装置和计算机可读存储介质
CN112445970A (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN110502648A (zh) 用于多媒体信息的推荐模型获取方法及装置
CN110297970A (zh) 信息推荐模型训练方法及装置
CN112800276A (zh) 视频封面确定方法、装置、介质及设备
CN113765953A (zh) 信息推送方法、装置及设备
CN109635926A (zh) 用于神经网络的注意力特征获取方法、装置及存储介质
WO2022057764A1 (zh) 广告显示方法及电子设备
US11797584B2 (en) Method, electronic device, and computer-readable storage medium for determining answer to question of product
CN114202380A (zh) 金融产品的推荐方法、装置和设备
CN112380388B (zh) 搜索场景下的视频排序方法、装置、电子设备及存储介质
WO2020224448A1 (zh) 交互方法及装置、音箱、电子设备和存储介质
CN109145936B (zh) 一种模型优化方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant