CN111368195A - 一种模型训练方法、装置、设备及存储介质 - Google Patents

一种模型训练方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111368195A
CN111368195A CN202010141139.3A CN202010141139A CN111368195A CN 111368195 A CN111368195 A CN 111368195A CN 202010141139 A CN202010141139 A CN 202010141139A CN 111368195 A CN111368195 A CN 111368195A
Authority
CN
China
Prior art keywords
sample data
behavior
user
pieces
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010141139.3A
Other languages
English (en)
Other versions
CN111368195B (zh
Inventor
成梭宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Himalaya Technology Co ltd
Original Assignee
Shanghai Himalaya Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Himalaya Technology Co ltd filed Critical Shanghai Himalaya Technology Co ltd
Priority to CN202010141139.3A priority Critical patent/CN111368195B/zh
Publication of CN111368195A publication Critical patent/CN111368195A/zh
Application granted granted Critical
Publication of CN111368195B publication Critical patent/CN111368195B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种模型训练方法、装置、设备及存储介质。其中,该方法包括:从数据库获取M条样本数据,其中,样本数据包括用户标识、信息标识、至少两个用户行为的标签,M为大于等于1的整数,根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure DDA0002398338120000011
其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数,根据M条样本数据的至少两个行为损失函数
Figure DDA0002398338120000012
确定损失函数L,根据损失函数L训练预测模型。这样可以考虑到多种用户行为之间的耦合关系,通过多种用户行为辅助预测模型,可以提高预测模型预测的准确性。

Description

一种模型训练方法、装置、设备及存储介质
技术领域
本发明实施例涉及信息处理技术,尤其涉及一种模型训练方法、装置、设备及存储介质。
背景技术
在信息推荐领域,通常需要通过训练模型以实现向用户推荐各类信息。但是,目前常用的方式是单独使用用户的某种特定行为来训练模型,例如,使用展示和点击数据单独训练预测用户点击率的模型,或者使用展示和播放数据单独训练用户播放率的模型,这种方式只采用单一的用户行为进行模型训练与决策,基于模型向用户推荐各类信息的准确度不高。
发明内容
本发明提供一种模型训练方法、装置、设备及存储介质,能够考虑到多种用户行为之间的耦合关系,通过多种用户行为辅助预测模型,可以提高预测模型预测的准确性。
第一方面,本发明实施例提供了一种模型训练方法,该方法包括:
从数据库获取M条样本数据,其中,样本数据包括用户标识、信息标识、至少两个用户行为的标签,其中,M为大于等于1的整数;
根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000011
其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数;
根据M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000012
确定损失函数L;
根据损失函数L训练预测模型。
第二方面,本发明实施例还提供了一种模型训练装置,该装置包括:
获取模块,用于从数据库获取M条样本数据,样本数据包括用户标识、信息标识、至少两个用户行为的标签,其中,M为大于等于1的整数;
确定模块,用于根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000021
其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数;
确定模块,还用于根据M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000022
确定损失函数L;
训练模块,用于根据损失函数L训练预测模型。
第三方面,本发明实施例还提供了一种设备,该设备包括:
存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,当处理器执行计算机程序时,实现如本发明第一方面提供的模型训练方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当该计算机程序被处理器执行时,实现如本发明第一方面提供的模型训练方法。
本发明实施例提供了一种模型训练方法、装置、设备及存储介质,具体为从数据库获取M条样本数据,其中,样本数据包括用户标识、信息标识、至少两个用户行为的标签,M为大于等于1的整数,根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000023
其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数,根据M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000024
确定损失函数L,根据损失函数L训练预测模型。这样可以考虑到多种用户行为之间的耦合关系,通过多种用户行为辅助预测模型,可以提高预测模型预测的准确性。
附图说明
图1是本发明实施例中的模型训练方法流程图;
图2是本发明实施例中的第一网络层结构示意图;
图3是本发明实施例中的预测模型结构示意图;
图4是本发明实施例中的确定第n个用户行为的数据的实现方式示意图;
图5是本发明实施例中的模型训练装置结构示意图;
图6是本发明实施例中的设备结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外,在本发明实施例中,“可选地”或者“示例性地”等词用于表示作例子、例证或说明。本发明实施例中被描述为“可选地”或者“示例性地”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“可选地”或者“示例性地”等词旨在以具体方式呈现相关概念。
图1为本发明实施例提供的一种模型训练方法,如图1所示,该方法具体包括:
S101、从数据库获取M条样本数据。
在本实施例中,上述数据库可以为任意网络平台的数据库,例如,某音乐网站的数据库或者某论文网站的数据库等等。
从数据库中获取的M条样本数据中,每条数据样本可以包括用户标识、信息标识、至少两个用户行为的标签,其中,M为大于等于1的整数,至少两个用户行为可以理解为用户针对网络平台向用户展示的各类信息的操作行为,例如,某视频网站向用户展示视频,用户点击视频、播放视频,或者购买视频时,该点击、播放、购买的操作即可被认为是用户行为,并且网络平台的数据库可以自动保存该用户行为的相关数据。
进一步地,至少两个用户行为的标签可以理解为用户是否通过某个行为操作了网络平台向用户展示的信息。例如,假设用户播放了某个视频,那么该播放行为的标签可以为1,而用户未播放某个视频,对应地,该用户对该信息的播放行为的标签可以设置为0,假设用户购买了某个视频,那么针对该视频信息,该用户的购买行为的标签可以为1,反之,则该用户的购买行为地标签可以为0。当然,本领域技术人员也可以采用其他方式设置标签的不同属性,以区分用户的行为,本实施例对此不作限定。
S102、根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000041
从数据库中获取到样本数据中某用户对某信息的至少两个用户行为的标签之后,可以根据该至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000042
其中,k表示第k条样本数据,k的取值范围为1≤k≤M,n表示用户行为数,且n为大于1的整数。
S103、根据M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000043
确定损失函数L。
通过步骤S102获取到M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000059
后,可以通过该至少两个行为损失函数确定得到损失函数L。
示例性地,上述确定得到损失函数L的实现方式可以为,根据M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000051
确定M条样本数据的损失函数Lk,进而根据M条样本数据的损失函数Lk确定损失函数L。
S104、根据损失函数L训练预测模型。
通过上述步骤得到损失函数L之后,可以根据该损失函数训练预测模型,进而,通过该预测模型可以对用户的各种行为进行预测。
在本实施例中,基于至少两个用户行为的标签确定得到损失函数,并根据损失函数训练预测模型,这样可以考虑到多种用户行为之间的耦合关系,通过多种用户行为辅助预测模型更加准确的预测。
在一种示例中,上述步骤S102的实现方式可以为,根据至少两个用户行为的标签,通过第一公式确定M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000052
其中,第一公式为:
Figure BDA0002398338100000053
在上述公式中,
Figure BDA0002398338100000054
表示第k条样本数据的第n个用户行为的标签,
Figure BDA0002398338100000055
表示第k条样本数据产生第n个用户行为的概率。
示例性地,以步骤S101中点击视频、播放视频、购买视频三个用户行为为例,那么上述公式(1)可以为以下形式:
Figure BDA0002398338100000056
Figure BDA0002398338100000057
Figure BDA0002398338100000058
即公式(2)表示针对第k条样本数据中,某用户点击某个视频的损失函数,公式(3)表示针对第k条样本数据中,某用户播放某个视频的损失函数,公式(4)表示针对第k条样本数据中,某用户购买某个视频的损失函数。对应地,上述公式中,
Figure BDA0002398338100000061
分别表示第k条样本数据中,某用户点击、或者播放、或者购买某个视频的概率。
当然,上述描述仅是举例说明,本领域技术人员也可以根据实际需求设置四个、五个,甚至更多个用户行为,并且,上述三个用户行为也并不局限于点击行为、播放行为、购买行为。
在一种示例中,步骤S103中确定M条样本数据的损失函数Lk可以为,根据M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000065
通过第二公式确定M条样本数据的损失函数Lk,其中,第二公式为:
Figure BDA0002398338100000062
其中,Lk为第k条样本数据的损失函数,α1+α2+……+αn=1,α1、α2、……、αn为对应损失函数
Figure BDA0002398338100000066
的权值。
可以理解的是,当每条样本数据中的至少两个用户行为为三个用户行为时,上述公式(5)即演化为公式(6),如下:
Figure BDA0002398338100000063
并且,上述α1、α2、……、αn均为可调参数。
进一步,可选地,根据M条样本数据的损失函数Lk确定损失函数L可以为,计算M条样本数据的损失函数Lk的平均值,确定损失函数L,即通过公式(7)确定得到损失函数L。
Figure BDA0002398338100000064
另外,在本实施例获取至少两个行为损失函数
Figure BDA0002398338100000071
的示例性实现方式中,也需要基于产生第n个用户行为的概率,即借助参数
Figure BDA0002398338100000072
实现,那么本申请实施例提供一种确定产生第n个用户行为的概率的可选实现为,根据用户标识从数据库获取用户特征和信息特征,根据用户特征、信息特征、信息标识,通过预测模型的第一网络层确定至少两个用户行为的向量,其中,用户特征可以为用户年龄、性别、兴趣等特征,信息特征可以为类别等特征。
如图2所示,预测模型的第一网络层中包括有输入层、向量层、拼接层、全连接层,通过该第一网络层获取到至少两个用户行为的向量。
进而,根据至少两个用户行为的向量,通过预测模型的加权平均层确定第n个用户行为的数据,将第n个用户行为的数据输入预测模型的全连接层,得到产生第n个用户行为的概率。
示例性地,上述预测模型的结构如图3所示,以三个用户行为为例,那么,上述第n个用户行为可以为三个用户行为中的任意一个用户行为,如图3,根据用户特征、信息特征、信息标识,通过预测模型中的第一网络层可以确定三个用户行为的向量,进而,根据三个用户行为的向量,通过预测模型的加权平均层确定三个用户行为的数据,将三个用户行为的数据输入预测模型的全连接层,得到三个用户行为的概率。相应地,上述第n个用户行为的概率即为得到的三个用户行为的概率中的任意一个。
进一步地,如图4所示,在上述过程中,通过预测模型的加权平均层确定第n个用户行为的数据的实现方式可以为计算至少两个用户行为的向量中第n个用户行为的向量与其余向量之间的余弦值,将余弦值与对应的其余向量相乘,得到乘积值,根据第n个用户行为的向量与乘积值,通过预测模型的加权平均层确定第n个用户行为的数据。
示例性地,即将第n个用户行为作为主向量,其余两个用户行为的向量作为副向量,分别计算该第n个用户行为的向量与其余两个副向量之间的余弦值(Consine),并将得到的余弦值与对应的副向量相乘。例如,第n个用户行为的向量与副向量1之间的余弦值与副向量1相乘,第n个用户行为的向量与副向量2之间的余弦值与副向量2相乘。进一步地,根据该第n个用户行为的向量与得到的两个乘积值,通过预测模型的加权平均层确定出第n个用户行为的数据。
通过上述示例性的实现方式即可获得损失函数L,这样根据损失函数L训练预测模型可以考虑到具有多种关联关系的用户行为,从而可以提高预测模型预测的准确性。
图5为本发明实施例提供的一种模型训练装置,如图5所示,该装置包括:获取模块501、确定模块502、训练模块503。
其中,获取模块,可以用于从数据库获取M条样本数据,其中,样本数据包括用户标识、信息标识、至少两个用户行为的标签,M为大于等于1的整数;
确定模块,用于根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000081
其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数;
进一步地,确定模块,还用于根据M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000082
确定损失函数L;
训练模块,用于根据损失函数L训练预测模型。
在一种示例中,确定模块,用于根据M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000091
确定M条样本数据的损失函数Lk,并根据M条样本数据的损失函数Lk确定损失函数L。
在一种示例中,确定模块,用于根据至少两个用户行为的标签,通过第一公式确定M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000092
其中,第一公式为:
Figure BDA0002398338100000093
其中,
Figure BDA0002398338100000094
表示第k条样本数据的第n个用户行为的标签,
Figure BDA0002398338100000095
表示第k条样本数据产生第n个用户行为的概率。
进一步地,获取模块,还用于根据用户标识从数据库获取用户特征和信息特征;
确定模块,还用于根据用户特征、信息特征、信息标识,通过预测模型的第一网络层确定至少两个用户行为的向量,根据至少两个用户行为的向量,通过预测模型的加权平均层确定第n个用户行为的数据,以及,将第n个用户行为的数据输入预测模型的全连接层,得到产生第n个用户行为的概率。
在一种示例中,上述确定模块还可以包括计算单元和确定单元;
该计算单元,用于计算至少两个用户行为的向量中第n个用户行为的向量与其余向量之间的余弦值,将余弦值与对应的其余向量相乘,得到乘积值;
确定单元,用于根据第n个用户行为的向量与乘积值,通过预测模型的加权平均层确定第n个用户行为的数据。
在一种示例中,确定模块,用于根据M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000096
通过第二公式确定M条样本数据的损失函数Lk,其中,第二公式为:
Figure BDA0002398338100000097
其中,Lk为第k条样本数据的损失函数,α1+α2+……+αn=1,α1、α2、……、αn为对应损失函数
Figure BDA0002398338100000101
的权值。
在一种示例中,确定模块,用于计算M条样本数据的损失函数Lk的平均值,确定损失函数L。
本发明实施例所提供的模型训练装置可执行本发明实施例所提供的模型训练方法,具备执行方法相应的功能模块和有益效果。
图6为本发明实施例提供的一种设备的结构示意图,如图6所示,该设备包括处理器601、存储器602、输入装置603和输出装置604;设备中处理器601的数量可以是一个或多个,图6中以一个处理器601为例;设备中的处理器601、存储器602、输入装置603和输出装置604可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器602作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的模型训练方法对应的程序指令/模块(例如,模型训练装置中的获取模块501、确定模块502、训练模块503)。处理器601通过运行存储在存储器602中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的模型训练方法。
存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器602可进一步包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至设备/终端/服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置603可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置604可包括显示屏等显示设备。
本发明实施例还提供一种包含计算机可执行指令的存储介质,该计算机可执行指令在由计算机处理器执行时用于执行一种模型训练方法,该方法包括:
从数据库获取M条样本数据,样本数据包括用户标识、信息标识、至少两个用户行为的标签,其中,M为大于等于1的整数;
根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000111
其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数;
根据M条样本数据的至少两个行为损失函数
Figure BDA0002398338100000112
确定损失函数L;
根据损失函数L训练预测模型。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的模型训练方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述模型训练装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种模型训练方法,其特征在于,包括:
从数据库获取M条样本数据,所述样本数据包括用户标识、信息标识、至少两个用户行为的标签,其中,M为大于等于1的整数;
根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure FDA0002398338090000011
其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数;
根据M条样本数据的至少两个行为损失函数
Figure FDA0002398338090000012
确定损失函数L;
根据所述损失函数L训练预测模型。
2.根据权利要求1所述的方法,其特征在于,根据M条样本数据的至少两个行为损失函数
Figure FDA0002398338090000013
确定损失函数L,包括:
根据M条样本数据的至少两个行为损失函数
Figure FDA0002398338090000014
确定M条样本数据的损失函数Lk
根据所述M条样本数据的损失函数Lk确定损失函数L。
3.根据权利要求1所述的方法,其特征在于,根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure FDA0002398338090000015
包括:
根据至少两个用户行为的标签,通过第一公式确定M条样本数据的至少两个行为损失函数
Figure FDA0002398338090000016
所述第一公式为:
Figure FDA0002398338090000017
其中,
Figure FDA0002398338090000018
表示第k条样本数据的第n个用户行为的标签,
Figure FDA0002398338090000019
表示第k条样本数据产生第n个用户行为的概率。
4.根据权利要求3所述的方法,其特征在于,确定产生第n个用户行为的概率,包括:
根据所述用户标识从数据库获取用户特征和信息特征;
根据所述用户特征、所述信息特征、所述信息标识,通过所述预测模型的第一网络层确定至少两个用户行为的向量;
根据所述至少两个用户行为的向量,通过所述预测模型的加权平均层确定第n个用户行为的数据;
将所述第n个用户行为的数据输入所述预测模型的全连接层,得到产生第n个用户行为的概率。
5.根据权利要求4所述的方法,根据所述至少两个用户行为的向量,通过所述预测模型的加权平均层确定第n个用户行为的数据,包括:
计算所述至少两个用户行为的向量中第n个用户行为的向量与其余向量之间的余弦值;
将所述余弦值与对应的其余向量相乘,得到乘积值;
根据所述第n个用户行为的向量与所述乘积值,通过所述预测模型的加权平均层确定第n个用户行为的数据。
6.根据权利要求2-5任一项所述的方法,其特征在于,根据样本数据的至少两个行为损失函数
Figure FDA0002398338090000021
确定M条样本数据的损失函数Lk,包括:
根据M条样本数据的至少两个行为损失函数
Figure FDA0002398338090000022
通过第二公式确定M条样本数据的损失函数Lk,所述第二公式为:
Figure FDA0002398338090000023
其中,Lk为第k条样本数据的损失函数,α1+α2+……+αn=1,α1、α2、……、αn为对应损失函数
Figure FDA0002398338090000024
的权值。
7.根据权利要求2-5任一项所述的方法,其特征在于,根据所述M条样本数据的损失函数Lk确定损失函数L,包括:
计算所述M条样本数据的损失函数Lk的平均值,确定损失函数L。
8.一种模型训练装置,其特征在于,包括:
获取模块,用于从数据库获取M条样本数据,所述样本数据包括用户标识、信息标识、至少两个用户行为的标签,其中,M为大于等于1的整数;
确定模块,用于根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数
Figure FDA0002398338090000031
其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数;
所述确定模块,还用于根据M条样本数据的至少两个行为损失函数
Figure FDA0002398338090000032
确定损失函数L;
训练模块,用于根据所述损失函数L训练预测模型。
9.一种设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1-7任一项所述的模型训练方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-7中任一项所述的模型训练方法。
CN202010141139.3A 2020-03-03 2020-03-03 一种模型训练方法、装置、设备及存储介质 Active CN111368195B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010141139.3A CN111368195B (zh) 2020-03-03 2020-03-03 一种模型训练方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010141139.3A CN111368195B (zh) 2020-03-03 2020-03-03 一种模型训练方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111368195A true CN111368195A (zh) 2020-07-03
CN111368195B CN111368195B (zh) 2024-02-13

Family

ID=71206636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010141139.3A Active CN111368195B (zh) 2020-03-03 2020-03-03 一种模型训练方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111368195B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860870A (zh) * 2020-07-29 2020-10-30 北京达佳互联信息技术有限公司 交互行为确定模型的训练方法、装置、设备及介质
CN113965805A (zh) * 2021-10-22 2022-01-21 北京达佳互联信息技术有限公司 预测模型的训练方法及装置和目标视频剪辑方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648020A (zh) * 2018-05-15 2018-10-12 携程旅游信息技术(上海)有限公司 用户行为量化方法、系统、设备及存储介质
CN109345302A (zh) * 2018-09-27 2019-02-15 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、存储介质和计算机设备
CN109961357A (zh) * 2019-03-25 2019-07-02 上海拉扎斯信息科技有限公司 用户数据处理方法、装置、电子设备及存储介质
CN110659678A (zh) * 2019-09-09 2020-01-07 腾讯科技(深圳)有限公司 一种用户行为分类方法、系统及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648020A (zh) * 2018-05-15 2018-10-12 携程旅游信息技术(上海)有限公司 用户行为量化方法、系统、设备及存储介质
CN109345302A (zh) * 2018-09-27 2019-02-15 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、存储介质和计算机设备
CN109961357A (zh) * 2019-03-25 2019-07-02 上海拉扎斯信息科技有限公司 用户数据处理方法、装置、电子设备及存储介质
CN110659678A (zh) * 2019-09-09 2020-01-07 腾讯科技(深圳)有限公司 一种用户行为分类方法、系统及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860870A (zh) * 2020-07-29 2020-10-30 北京达佳互联信息技术有限公司 交互行为确定模型的训练方法、装置、设备及介质
CN113965805A (zh) * 2021-10-22 2022-01-21 北京达佳互联信息技术有限公司 预测模型的训练方法及装置和目标视频剪辑方法及装置

Also Published As

Publication number Publication date
CN111368195B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
US10958748B2 (en) Resource push method and apparatus
US11551239B2 (en) Characterizing and modifying user experience of computing environments based on behavior logs
EP4181026A1 (en) Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium
US11687352B2 (en) Machine-learning models applied to interaction data for determining interaction goals and facilitating experience-based modifications to interface elements in online environments
JP5180743B2 (ja) ブランド分析方法及び装置
CN110674620A (zh) 目标文案生成方法、装置、介质及电子设备
WO2023000491A1 (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
US20190156177A1 (en) Aspect Pre-selection using Machine Learning
CN111061979A (zh) 一种用户标签的推送方法、装置、电子设备和介质
CN111754278A (zh) 物品推荐方法、装置、计算机存储介质和电子设备
CN111340605B (zh) 训练用户行为预测模型、用户行为预测的方法和装置
CN113139115A (zh) 信息推荐方法、搜索方法、装置及客户端、介质及设备
CN111368195B (zh) 一种模型训练方法、装置、设备及存储介质
CN110909258B (zh) 一种信息推荐方法、装置、设备及存储介质
CN110516162B (zh) 一种信息推荐方法、装置、设备及存储介质
CN111507471B (zh) 一种模型训练方法、装置、设备及存储介质
CN116703046A (zh) 实时派工顺序的控制方法及系统、电子设备和存储介质
CN117332068B (zh) 人机交互方法、装置、电子设备以及存储介质
US20230353487A1 (en) Method, computer device, and non-transitory computer-readable recording medium for providing optimal path using expert knowledge
CN112200602B (zh) 用于广告推荐的神经网络模型训练方法及装置
CN114817716A (zh) 预测用户转化行为及训练模型的方法、装置、设备及介质
CN111325614B (zh) 电子对象的推荐方法、装置和电子设备
CN113743906A (zh) 一种确定业务处理策略的方法和装置
JP7375096B2 (ja) 分散表現生成システム、分散表現生成方法及び分散表現生成プログラム
WO2024140229A1 (zh) 用于特征学习的方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant