CN117271880A - 一种推荐方法、装置和电子设备 - Google Patents

一种推荐方法、装置和电子设备 Download PDF

Info

Publication number
CN117271880A
CN117271880A CN202211610210.3A CN202211610210A CN117271880A CN 117271880 A CN117271880 A CN 117271880A CN 202211610210 A CN202211610210 A CN 202211610210A CN 117271880 A CN117271880 A CN 117271880A
Authority
CN
China
Prior art keywords
actual
data
model
recommendation
multimedia file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211610210.3A
Other languages
English (en)
Inventor
赵宝新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Juhaokan Technology Co Ltd
Original Assignee
Juhaokan Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Juhaokan Technology Co Ltd filed Critical Juhaokan Technology Co Ltd
Priority to CN202211610210.3A priority Critical patent/CN117271880A/zh
Publication of CN117271880A publication Critical patent/CN117271880A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种推荐方法、装置和电子设备,涉及多媒体技术领域,解决了如何提高多媒体文件的推荐准确率的问题。该方法包括:接收电子设备发送的请求信息;根据实际用户标识,确定实际用户数据;将预先配置的媒资数据、实际用户数据和实际上下文数据输入至推荐模型中,得到媒资数据中每个实际多媒体文件对应的实际点击率和实际转化率;根据实际点击率和实际转化率,确定推荐数据;向电子设备发送推荐数据。

Description

一种推荐方法、装置和电子设备
技术领域
本公开涉及多媒体技术领域,尤其涉及一种推荐方法、装置和电子设备。
背景技术
目前,在多媒体技术领域,随着智能终端应用的普及,人们在智能终端的时间消费越来越多,对智能终端的提供的服务要求也随之增强。为了提升用户的体验,智能终端通常会为用户预先推荐多媒体文件,供用户选择。
但是,经常会出现智能终端预先推荐的多媒体文件并不是用户所需要的,导致多媒体文件的推荐准确率较低。
发明内容
为了解决上述技术问题,本公开提供了一种推荐方法、装置和电子设备。
本公开的技术方案如下:
第一方面,本公开提供一种推荐方法,包括:接收电子设备发送的请求信息;其中,请求信息至少包括实际用户标识和实际上下文数据,实际上下文数据至少包括时间信息和位置信息;根据实际用户标识,确定实际用户数据;将预先配置的媒资数据、实际用户数据和实际上下文数据输入至推荐模型中,得到媒资数据中每个实际多媒体文件对应的实际点击率和实际转化率;其中,推荐模型基于历史多媒体文件对应的特征信息、历史用户数据以及历史上下文数据二者在每个行为动机的历史隶属度、以及包含每个行为动机的隐空间对应的特征向量训练得到的,行为动机用于指示在目标环境下执行行为动机对应的用户行为的原因;根据实际点击率和实际转化率,确定推荐数据;其中,推荐数据中包括至少一个实际多媒体文件;向电子设备发送推荐数据。
第二方面,本公开提供一种推荐装置,包括:接收单元,用于接收电子设备发送的请求信息;其中,请求信息至少包括实际用户标识和实际上下文数据,实际上下文数据至少包括时间信息和位置信息;处理单元,用于根据接收单元接收的实际用户标识,确定实际用户数据;处理单元,还用于将预先配置的媒资数据、实际用户数据和接收单元接收的实际上下文数据输入至推荐模型中,得到媒资数据中每个实际多媒体文件对应的实际点击率和实际转化率;其中,推荐模型基于历史多媒体文件对应的特征信息、历史用户数据以及历史上下文数据二者在每个行为动机的历史隶属度、以及包含每个行为动机的隐空间对应的特征向量训练得到的,行为动机用于指示在目标环境下执行行为动机对应的用户行为的原因;处理单元,还用于根据实际点击率和实际转化率,确定推荐数据;其中,推荐数据中包括至少一个实际多媒体文件;处理单元,还用于控制发送单元向电子设备发送推荐数据。
第三方面,本公开提供一种电子设备,包括:存储器和处理器,存储器用于存储计算机程序;处理器用于在执行计算机程序时,使得电子设备实现如上述第一方面提供的任一项推荐方法。
第四方面,本公开提供一种计算机可读存储介质,包括:计算机可读存储介质上存储有计算机程序,当计算机程序被计算设备执行时,使得计算设备实现如上述第一方面提供的任一项推荐方法。
第五方面,本发明提供一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如第一方面提供的任一项的推荐方法。
需要说明的是,上述计算机指令可以全部或者部分存储在第一计算机可读存储介质上。其中,第一计算机可读存储介质可以与推荐装置的处理器封装在一起的,也可以与推荐装置的处理器单独封装,本公开对此不作限定。
本公开中第二方面、第三方面、第四方面以及第五方面的描述,可以参考第一方面的详细描述;并且,第二方面、第三方面、第四方面以及第五方面的描述的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。
在本公开中,上述推荐装置的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本公开类似,属于本公开权利要求及其等同技术的范围之内。
本公开的这些方面或其他方面在以下的描述中会更加简明易懂。
本公开提供的技术方案与现有技术相比具有如下优点:
在接收到电子设备发送的请求信息后,根据接收的实际用户标识,确定实际用户数据。将预先配置的媒资数据、实际用户数据和实际上下文数据输入至推荐模型中,由于推荐模型基于历史多媒体文件对应的特征信息、历史用户数据以及历史上下文数据二者在每个行为动机的历史隶属度、以及每个行为动机的隐空间对应的特征向量训练得到的,因此推荐模型可以分析出在当前的实际上下文数据所做行为的行为动机,进而可以根据该行为动机确定媒资数据中每个实际多媒体文件对应的实际点击率和实际转化率。之后,根据实际点击率和实际转化率,确定推荐数据,发送并向电子设备推荐数据。由于实际点击率和实际转化率是分析行为动机后所确定的,因此可以更加准确地提升多媒体文件的推荐准确率,保证用户的体验,解决了如何提高多媒体文件的推荐准去率的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的推荐方法的场景示意图;
图2为本申请实施例提供的推荐方法中显示设备的结构示意图之一;
图3为本申请实施例提供的推荐方法中显示设备的结构示意图之二;
图4为本申请实施例提供的推荐方法的流程示意图之一;
图5为本申请实施例提供的推荐方法的流程示意图之二;
图6为本申请实施例提供的推荐方法中推荐模型的示意图;
图7为本申请实施例提供的推荐方法的流程示意图之三;
图8为本申请实施例提供的推荐方法的流程示意图之四;
图9为本申请实施例提供的服务器的结构示意图;
图10为本申请实施例提供的一种芯片系统的示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本公开实施例中的深度神经网络是指deep neural network,简称DNN。
本公开实施例中的Adam,是指自适应矩估计(Adaptive Moment Estimation)。
本公开实施例中的多任务学习模型是指Multi-gate Mixture-of-Experts,简称MMOE。
本公开实施例中的隐空间是指Latent Space。
本公开实施例中的rule是指线性整流函数(Linear rectification function),又称修正线性单元,是一种人工神经网络中常用的激活函数(activation function),通常指代以斜坡函数及其变种为代表的非线性函数。
本公开实施例中的Sigmoid是指Sigmoid函数是一个有着优美S形曲线的数学函数,在逻辑回归、人工神经网络中有着广泛的应用。
本公开实施例中的Softmax是指Softmax函数常在神经网络输出层充当激活函数,将输出层的值通过激活函数映射到0-1区间,将神经元输出构造成概率分布。
本公开实施例中的CNN是指卷积神经网络(Convolutional Neural Networks,CNN)。
本公开实施例中的RNN是指循环神经网络(Recurrent Neural Network,RNN)。
图1为根据本申请一个或多个实施例的显示设备与控制装置之间操作场景的示意图,如图1所示,用户可通过移动终端300和控制装置100操作显示设备200。控制装置100可以是遥控器,遥控器和显示设备的通信包括红外协议通信、蓝牙协议通信,无线或其他有线方式来控制显示设备200。用户可以通过遥控器上按键,语音输入、控制面板输入等输入用户指令,来控制显示设备200。在一些实施例中,也可以使用移动终端、平板电脑、计算机、笔记本电脑、和其他智能设备以控制显示设备200。
在一些实施例中,移动终端300可与显示设备200安装软件应用,通过网络通信协议实现连接通信,实现一对一控制操作的和数据通信的目的。也可以将移动终端300上显示音视频内容传输到显示设备200上,实现同步显示功能显示设备200还与显示设备200通过多种通信方式进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。显示设备200可以向显示设备200提供各种内容和互动。显示设备200,可以液晶显示器、OLED显示器、投影显示设备。显示设备200除了提供广播接收电视功能之外,还可以附加提供计算机支持功能的智能网络电视功能。
在一些实施例中,本申请实施例提供电子设备可以为上述服务器400。其中,显示设备200开机后,显示设备200会向服务器400发送携带实际用户标识和实际上下文数据的请求信息。之后,服务器400接收到显示设备200发送的请求信息后,服务器400根据接收的实际用户标识,确定实际用户数据。服务器400将预先配置的媒资数据、实际用户数据和实际上下文数据输入至推荐模型中,由于推荐模型基于包含每个行为动机的隐空间对应的特征向量训练得到的,因此可以统一不同领域和场景的差异。同时,基于实际用户数据和实际上下文数据分析,从而可以确定行为动机。进而,基于行为动机和媒资数据可以得到媒资数据中每个实际多媒体文件对应的实际点击率和实际转化率。之后,服务器400根据实际点击率和实际转化率,确定推荐数据。由于实际点击率和实际转化率是充分分析行为动机后所确定的,因此可以更加准确地提升多媒体文件的推荐准确率,保证用户的体验。最后,服务器400向电子设备发送推荐数据。如此,显示设备200便可以根据显示服务器400发送的推荐数据,生成相应的推荐页面供用户选择。
图2示出了根据示例性实施例中显示设备200的硬件配置框图。如图2所示显示设备200包括调谐解调器210、通信器220、检测器230、外部装置接口240、控制器250、显示器260、音频输出接口270、存储器、供电电源、用户接口280中的至少一种。控制器包括中央处理器,视频处理器,音频处理器,图形处理器,RAM,ROM,用于输入/输出的第一接口至第n接口。显示器260可为具有触控功能的显示器,如触控显示器。调谐解调器210通过有线或无线接收方式接收广播电视信号,以及从多个无线或有线广播电视信号中解调出音视频信号,如以及EPG数据信号。检测器230用于采集外部环境或与外部交互的信号。控制器250和调谐解调器210可以位于不同的分体设备中,即调谐解调器210也可在控制器250所在的主体设备的外置设备中,如外置机顶盒等。
在一些实施例中,控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250控制显示设备200的整体操作。
在一些示例中,以申请一个或多个实施例的显示设备200为电视机1,并且电视机1的操作系统为Android系统为例,如图3所示,电视机1从逻辑上可以分为应用程序(Applications)层(简称“应用层”)21,应用程序框架(Application Framework)层(简称“框架层”)22,安卓运行时(Android runtime)和系统库层(简称“系统运行库层”)23,以及内核层24。
其中,应用层21包括一个或多个应用。应用可以为系统应用,也可以为第三方应用。如,应用层21包括第一应用,第一应用可以提供多媒体文件的推荐服务。框架层22为应用层21的应用程序提供应用编程接口(application programming interface,API)和编程框架。系统运行库层23为上层即框架层22提供支撑,当框架层22被使用时,安卓操作系统会运行系统运行库层23中包含的C/C++库以实现框架层22要实现的功能。内核层24作为硬件层和应用层21之间的软件中间件,用于管理和控制硬件与软件资源。
在一些示例中,显示设备200开机后,第一应用向服务器400发送携带实际用户标识和实际上下文数据的请求信息。之后,服务器400的接收单元401接收到显示设备200发送的请求信息后,服务器400的处理单元402根据接收单元401接收的实际用户标识,确定实际用户数据。处理单元402将预先配置的媒资数据、实际用户数据和实际上下文数据输入至推荐模型中,由于推荐模型基于包含每个行为动机的隐空间对应的特征向量训练得到的,因此可以统一不同领域和场景的差异。同时,基于实际用户数据和实际上下文数据分析,从而可以确定行为动机。进而,基于行为动机和媒资数据可以得到媒资数据中每个实际多媒体文件对应的实际点击率和实际转化率。之后,处理单元402根据实际点击率和实际转化率,确定推荐数据。由于实际点击率和实际转化率是充分分析行为动机后所确定的,因此可以更加准确地提升多媒体文件的推荐准确率,保证用户的体验。最后,处理单元402控制发送单元403向电子设备发送推荐数据。如此,显示设备200便可以根据显示服务器400发送的推荐数据,生成相应的推荐页面供用户选择。
具体的,存储单元404中用于存储实际用户标识与实际用户数据的对应关系,推荐模型的模型数据等。
具体的,位置信息可以通过中国北斗卫星导航系统(BeiDou NavigationSatellite System,BDS)、全球定位系统(Global Positioning System,GPS)、格洛纳斯(GLOBAL NAVIGATION SATELLITE SYSTEM,GLONASS)等可以提供定位服务的系统提供的。
本申请所涉及的实际用户标识和实际用户数据均可以为经用户授权或者经过各方充分授权的数据。
以下实施例中以执行本公开实施例提供的推荐方法的执行主体为上述服务器400为例,对本申请实施例的方法进行说明。
本申请实施例提供一种推荐方法,如图4所示,该推荐方法可以包括S11-S15。
S11、接收电子设备发送的请求信息。其中,请求信息至少包括实际用户标识和实际上下文数据,实际上下文数据至少包括时间信息和位置信息。
在一些示例中,本公开实施例提供的推荐方法,通过分析各种行为的行为动机,如:某个用户喜欢在工作日中午时段观看一些综艺节目,是因为午休时间较短,午饭空闲时间阶段,相对较短时间的综艺节目可以满足用户的需求;在傍晚时间,该用户更多的观看一些动漫、少儿节目,是因为家里的小孩放学回来有观影需求。如此,通过分析用户做出该行为的行为动机,可以提升多媒体文件的推荐准确率。
在一些示例中,实际用户标识可以是电子设备的设备代码(如设备串号、物理地址等),或者用户账号(如手机号等)。
S12、根据实际用户标识,确定实际用户数据。
在一些示例中,实际用户数据包括用户性别、年龄等注册信息,以及偏好数据,如:在指定时间段内观看各个类别的多媒体文件的占比等。
在一些示例中,服务器400的存储器中预先存储了每个实际用户标识对应的实际用户数据的对应关系。如此,当服务器400需要确定实际用户数据时,可以根据实际用户标识在存储器中查询该对应关系,从而确定该实际用户标识对应的实际用户数据。
在一些示例中,服务器400中预先训练了用户数据模型,当需要确定实际用户数据时,可以将该实际用户标识输入至用户数据模型中,确定实际用户数据。
其中,用户数据模型的训练过程如下:
获取训练样本数据和训练监督数据;其中,训练样本数据和训练监督数据均包括训练用户标识,和该训练用户标识对应的训练用户数据。
基于训练样本数据反复调整神经网络模型的网络参数,直至神经网络模型收敛,得到预训练后的神经网络模型。
基于训练监督数据对预训练后的神经网络模型进行监督训练,直至预训练后的神经网络模型的网络参数不再改变,得到用户数据模型。
S13、将预先配置的媒资数据、实际用户数据和实际上下文数据输入至推荐模型中,得到媒资数据中每个实际多媒体文件对应的实际点击率和实际转化率。其中,推荐模型基于历史多媒体文件对应的特征信息、历史用户数据以及历史上下文数据二者在每个行为动机的历史隶属度、以及包含每个行为动机的隐空间对应的特征向量训练得到的,行为动机用于指示在目标环境下执行行为动机对应的用户行为的原因。
在一些示例中,服务器400中预先存储了媒资数据,以便电子设备请求播放该媒资数据中的实际多媒体文件时,可以快速地向电子设备下发该实际多媒体文件,保证用户的体验。
S14、根据实际点击率和实际转化率,确定推荐数据。其中,推荐数据中包括至少一个实际多媒体文件。
在一些示例中,可以根据实际点击率和实际转化率,确定推荐得分。其中,推荐得分用于指示访问推荐得分对应的实际多媒体文件的访问概率。根据推荐得分,筛选推荐得分大于或等于得分阈值的实际多媒体文件。将推荐得分大于或等于得分阈值的实际多媒体文件作为推荐数据。
在一些示例中,推荐得分等于实际点击率和实际转化率之和,或者推荐得分等于实际点击率和实际转化率二者的平均值,此处不做限定。
在一些示例中,基于推荐得分和得分阈值的大小关系,确定推荐数据时,会出现满足推荐得分大于或等于得分阈值的实际多媒体文件的数量较多的情况,为了更好地为生成推荐数据,本公开实施例提供的推荐方法,通过对满足推荐得分大于或等于得分阈值的实际多媒体文件继续进行筛选,如:对推荐得分大于或等于得分阈值的实际多媒体文件,按照从大到小的顺序对大于或等于得分阈值的推荐得分进行排序,得到排序结果。根据排序结果,筛选大于或等于目标排序(如目标排序为3)的推荐得分。最后,将大于或等于目标排序的推荐得分对应的实际多媒体文件作为推荐数据,这样可以大大降低推荐数据中实际多媒体文件的数量,提高实际多媒体文件的推荐准确率。
或者,根据实际用户数据确定用户在预设时间段内访问不同的媒资类型(如:电影、电视剧、新闻等)的多媒体文件的占比,确定占比大于或等于预设占比的媒资类型。之后,在推荐得分大于或等于得分阈值的实际多媒体文件中,筛选占比大于或等于预设占比的媒资类型对应的实际多媒体文件,并将筛选出的比大于或等于预设占比的媒资类型对应的实际多媒体文件作为推荐数据。
S15、向电子设备发送推荐数据。
由上述可知,本公开实施例提供的推荐方法,通过将行为动机统一映射到隐空间中,从而可以统一不同媒资类型下的差异问题。其次,通过对实际用户数据和实际上下文数据进行分析,从而可以确定当前行为对应的行为动机。之后,通过该行为动机得到该行为动机对应的语义表达。最后,通过结合语义表达以及实际多媒体文件的媒资特征,从而可以挑选出符合该语义表达的实际多媒体文件。由于,推荐数据是基于语义表达得到的,因此可以提升多媒体文件的推荐准确率,保证用户的体验。
在一些可实施的示例中,推荐模型至少包括特征提取子模型、动机识别子模型、数据预测子模型和双塔子模型;其中,特征提取子模型用于提取每个实际多媒体文件的媒资特征,动机识别子模型用于确定历史隶属度,数据预测子模型用于根据特征提取子模型确定的媒资特征、动机识别子模型确定的历史隶属度以及特征向量,确定每个实际多媒体文件的点击结果,双塔子模型用于根据数据预测子模型确定的点击结果,确定每个实际多媒体文件对应的实际点击率和实际转化率;其中,点击结果包括未被点击和已被点击中的任一项。
在一些可实施的示例中,结合图4,如图5所示,本公开实施例提供的推荐方法还包括:S16-S22。
S16、获取训练样本数据和训练样本数据的标记结果。其中,训练样本数据包括特征向量、至少一个历史多媒体文件、至少一组训练数据,训练数据包括历史用户数据和历史上下文数据,标记结果包括每个历史多媒体文件对应的历史实际点击率和历史实际转化率。
S17、将历史多媒体文件输入至特征提取子模型,得到特征提取子模型对历史多媒体文件的提取结果。
S18、将训练数据输入至动机识别子模型,得到动机识别子模型对训练数据的识别结果。
S19、将提取结果、识别结果和特征向量三者输入至数据预测子模型,得到数据预测子模型对预测结果和特征向量的预测结果。
在一些示例中,在将提取结果、识别结果和特征向量三者输入至数据预测子模型时,需将提取结果、识别结果和特征向量三者进行特征拼接,之后将特征拼接后的特征输入至数据预测子模型。
S20、将预测结果输入至双塔子模型,得到双塔子模型对预测结果的召回结果。
S21、基于目标损失函数计算召回结果与标记结果的损失值。
S22、在损失值大于或等于损失阈值的情况下,调整特征提取子模型的第一网络参数、调整动机识别子模型的第二网络参数、调整数据预测子模型的第三网络参数,以及调整双塔子模型的第四网络参数,直至损失值小于损失阈值时,得到推荐模型。
在一些示例中,推荐模型的网络结构如图6所示。其中,物品表示媒资数据,用户表示实际用户数据,上下文表示实际上下文数据,潜入层用于将媒资数据、实际用户数据以及实际上下文数据等转化为推荐模型可识别的数据格式,物品嵌入表达指物品的媒资特征,用户嵌入表达指实际用户数据对应的用户特征,上下文嵌入表达指实际上下文数据对应的上下文特征。
在一些示例中,本公开实施例提供的推荐方法,将行为动机定义为用户在特定环境下所做行为的根本原因,将所有的用户所做行为的根本原因统一映射到某个特定的隐空间,即L∈RM*N。其中,M代表隐空间中行为动机的向量长度,N代表所有行为动机的集合的长度,L表示行为动机。
在一些示例中,由于在不同的实际上下文数据的情况下,用户的行为动机不一样,为此本公开实施例提供的推荐方法,通过将实际用户数据对应的用户特征和实际上下文数据对应的上下文特征输入至动机识别子模型,从而可以得到该实际用户数据和该实际上下文数据二者对应的用户的行为在每种行为动机的隶属度,即:
其中,函数g(*)可以用深度神经网络(DNN)来表达,函数σ(·)=sigmoid(·)是激活函数,m∈RN代表该实际用户数据和该实际上下文数据二者对应的用户的行为在隐空间中每种行为动机的隶属度,ci,j表示用户ui点击了物品vj时的上下文特征,表示用户ui的用户特征。
需要说明的是,这里之所以不采用relu激活函数,是防止隐空间中某些特征向量模值太大,导致训练不稳定,还可以有效的避免隐空间向量分布不均匀问题。softmax激活函数输出和为1,不适合应对多个行为动机的场景。
在一些示例中,根据该实际用户数据和该实际上下文数据二者对应的用户的行为在每种行为动机的隶属度和隐空间的特征向量,可以得到用户的行为的语义表达,即:
其中,⊙代表矩阵点乘,rep(mT,M,axis=1)∈RM*N代表将向量m转置后在第二个维度上复制M次,向量m表示该实际用户数据和该实际上下文数据二者对应的用户的行为在隐空间中每种行为动机的隶属度,表示用户ui的行为的语义表达。
需要说明的是,由于不同场景(如:电影和动画,二者虽然都可以观看多媒体文件,但是二者针对的群体存在差异,导致实际用户数据也会存在差异)之间存在巨大的差异,L在不同的场景下的表示也会不同,因此本公开实施例提供的推荐方法对该隐空间加入如下限制:
限制1、相同场景下,样本的行为动机表示类内距离尽可能小。
限制2、在不同场景下,样本的行为动机表示类间间距的边界距离尽可能大。
以上两种限制我们通过中心损失来解决,即:
lc=-lintra+αlinter
其中,lintra表示限制1,linter表示限制2,α用来调整限制1和限制2之间的权重。
其中,代表该场景的聚类中心,是对所有隶属于该类的样本的特征图求算数平均值。集合S={s1,s2,s3,s4,s5,s6}代表所有场景的集合,此处我们共有6大场景,分别为电视剧、综艺,纪录片,电影,动漫、少儿。
如此,可以通过增大类间间距来增加不同场景下行为动机表达的差异性,提高多媒体文件的推荐准确率。
可以看出,本公开实施例提供的推荐方法,通过将用户特征进行了二次嵌入表达,将多种场景下的差异进行统一,从而适应场景差异较大的情况。同时,将场景差异限制通过损失函数进行表达,显示增强行为动机提取的能力。
在一些示例中,特征提取子模型的输入是物品的媒资特征,主要用于提取物品的高阶特征,其表达式为:
其中,代表媒资特征提取后的特征图,/>代表提取媒资特征的函数,/>表示物品vj的特征。
示例性的,f(*)可以是DNN,CNN或者RNN等网络结构。
示例性的,本公开实施例提供的推荐方法中,f(*)采用DNN网络结构。
在一些示例中,将用户的行为的语义表达和提取后的特征图作为数据预测子模型的输入,输出为该用户ui是否点击了物品vj,即:
其中,pi,j表示数据预测子模型预测用户ui是否点击了物品vj的概率,作为结果输出。
示例性的,Pi,j是处于区间[0,1]的浮点型数值,表示用户ui点击了物品vj的概率大小。
示例性的,可以将用户的行为的语义表达和提取后的特征图进行特征拼接,并将拼接后的特征输入至数据预测子模型。
示例性的,可以通过门控来专家n对应的特征输入不同任务的权重。
在一些示例中,双塔子模型的任务为点击率(Click-Through-Rote,ctr)预估和转化率(Conversion Rate,CVR)预估,CTR代表用户ui是否点击了物品vj,通过塔1模型来表达。CVR代表用户观影行为是否为一次有效观看,是一个0/1二分类问题,通过塔2模型来表达。两个任务都采用log loss函数作为损失函数,即:
其中,D代表数据样本的个数,Ω是正则项,代表CTR的输出概率(即实际点击率),/>代表CVR的输出概率(即实际转化率),βlc表示中心损失,其中β是超参数(hyperparameter)。
示例性的,Ω正则项采用L2正则化(Regularization)。
需要的说明的是,推荐模型在训练的过程中,优化器采用Adam,同时学习率初始值为0.001,由于数据量巨大,真个训练的最大步数设置为10,每步之后的学习率以0.9的倍率衰减。
在一些示例中,推荐模型在线上进行服务时,采用加群平均的方式对实际点击率和实际转化率进行求和,得到最终的分数,即:
其中,a、b均为超参数。
示例性的,a+b=1,a>0,b>0。
在一些示例中,电子设备在接收到服务器400发送的推荐数据后,电子设备会根据推荐数据中的多媒体文件通过score分数倒序在前端进行展示。
在一些可实施的示例中,特征提取子模型、动机识别子模型和双塔子模型三者均包括深度神经网络,数据预测子模型包括多任务学习模型。
在一些可实施的示例中,目标损失函数包括对数损失函数。
在一些可实施的示例中,结合图4,如图7所示,上述S14具体可以通过下述S140-S142实现。
S140、根据实际点击率和实际转化率,确定推荐得分。其中,推荐得分用于指示访问推荐得分对应的实际多媒体文件的访问概率。
S141、根据推荐得分,筛选推荐得分大于或等于得分阈值的实际多媒体文件。
S142、将推荐得分大于或等于得分阈值的实际多媒体文件作为推荐数据。
在一些可实施的示例中,结合图7,如图8所示,上述S142具体可以通过下述S1420-S1422实现。
S1420、对推荐得分大于或等于得分阈值的实际多媒体文件,按照从大到小的顺序对大于或等于得分阈值的推荐得分进行排序,得到排序结果。
S1421、根据排序结果,筛选大于或等于目标排序的推荐得分。其中,一个推荐得分对应一个排序得分。
S1422、将大于或等于排序阈值的排序得分对应的实际多媒体文件作为推荐数据。
示例性的,给定用户1,假设媒资数据中包括5个实际多媒体文件,分别为实际多媒体文件1、实际多媒体文件2、实际多媒体文件3、实际多媒体文件4和实际多媒体文件5。经过上述步骤S11-S14的计算,确定实际多媒体文件1对应的推荐得分为0.95、实际多媒体文件2对应的推荐得分为0.6、实际多媒体文件3对应的推荐得分为0.72、实际多媒体文件4对应的推荐得分为0.83、实际多媒体文件5对应的推荐得分为0.3。当得分阈值为0.5时,可以确定实际多媒体文件1、实际多媒体文件2、实际多媒体文件3、实际多媒体文件4四者对应的推荐得分均大于得分阈值0.5。之后,按照从大到小的顺序对大于或等于得分阈值的推荐得分进行排序,得到如表1所示的排序结果。
表1
其中,推荐得分越高,对应的目标排序的排序越靠前,即用户可以优先看到媒资。
如此,当前端只展示2个媒资的情况下,此时可以将实际多媒体文件1和实际多媒体文件4作为推荐数据呈现给用户。
在一些示例中,本公开实施例提供的推荐方法,不仅可以通过实际用户数据和实际上下文数据对推荐模型进行训练,还可以解决领域任务差异非常大的问题,在实际的项目中,对用户的点击率的准确率提升了2.4%;且在性能稳定性方面也得到了改善,长时间预测点击率的方差降低3.2%。同时该方法也是一个通用的解决方法,还可以应用与其他场景的个性化推荐,例如商品推荐等。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对推荐装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图9所示,本申请的实施例提供一种服务器400的结构示意图。包括通信器101和处理器102。
通信器101,用于接收电子设备发送的请求信息;其中,请求信息至少包括实际用户标识和实际上下文数据,实际上下文数据至少包括时间信息和位置信息;处理器102,用于根据通信器101接收的实际用户标识,确定实际用户数据;处理器102,还用于将预先配置的媒资数据、实际用户数据和通信器101接收的实际上下文数据输入至推荐模型中,得到媒资数据中每个实际多媒体文件对应的实际点击率和实际转化率;其中,推荐模型基于历史多媒体文件对应的特征信息、历史用户数据以及历史上下文数据二者在每个行为动机的历史隶属度、以及包含每个行为动机的隐空间对应的特征向量训练得到的,行为动机用于指示在目标环境下执行行为动机对应的用户行为的原因;处理器102,还用于根据实际点击率和实际转化率,确定推荐数据;其中,推荐数据中包括至少一个实际多媒体文件;处理器102,还用于控制通信器102向电子设备发送推荐数据。
在一些可实施的示例中,推荐模型至少包括特征提取子模型、动机识别子模型、数据预测子模型和双塔子模型;其中,特征提取子模型用于提取每个实际多媒体文件的媒资特征,动机识别子模型用于确定历史隶属度,数据预测子模型用于根据特征提取子模型确定的媒资特征、动机识别子模型确定的历史隶属度以及特征向量,确定每个实际多媒体文件的点击结果,双塔子模型用于根据数据预测子模型确定的点击结果,确定每个实际多媒体文件对应的实际点击率和实际转化率;其中,点击结果包括未被点击和已被点击中的任一项。
在一些可实施的示例中,推荐模型的训练过程如下:通信器101,还用于获取训练样本数据和训练样本数据的标记结果;其中,训练样本数据包括特征向量、至少一个历史多媒体文件、至少一组训练数据,训练数据包括历史用户数据和历史上下文数据,标记结果包括每个历史多媒体文件对应的历史实际点击率和历史实际转化率;处理器102,还用于将通信器101获取的历史多媒体文件输入至特征提取子模型,得到特征提取子模型对历史多媒体文件的提取结果;处理器102,还用于将通信器101获取的训练数据输入至动机识别子模型,得到动机识别子模型对训练数据的识别结果;处理器102,还用于将提取结果、识别结果和通信器101获取的特征向量三者输入至数据预测子模型,得到数据预测子模型对预测结果和特征向量的预测结果;处理器102,还用于将预测结果输入至双塔子模型,得到双塔子模型对预测结果的召回结果;处理器102,还用于基于目标损失函数计算召回结果与标记结果的损失值;处理器102,还用于在损失值大于或等于损失阈值的情况下,调整特征提取子模型的第一网络参数、调整动机识别子模型的第二网络参数、调整数据预测子模型的第三网络参数,以及调整双塔子模型的第四网络参数,直至损失值小于损失阈值时,得到推荐模型。
在一些可实施的示例中,特征提取子模型、动机识别子模型和双塔子模型三者均包括深度神经网络,数据预测子模型包括多任务学习模型。
在一些可实施的示例中,目标损失函数包括对数损失函数。
在一些可实施的示例中,处理器102,具体用于根据实际点击率和实际转化率,确定推荐得分;其中,推荐得分用于指示访问推荐得分对应的实际多媒体文件的访问概率;处理器102,具体用于根据推荐得分,筛选推荐得分大于或等于得分阈值的实际多媒体文件;处理器102,具体用于将推荐得分大于或等于得分阈值的实际多媒体文件作为推荐数据。
在一些可实施的示例中,处理器102,具体用于对推荐得分大于或等于得分阈值的实际多媒体文件,按照从大到小的顺序对大于或等于得分阈值的推荐得分进行排序,得到排序结果;处理器102,具体用于根据排序结果,筛选大于或等于目标排序的推荐得分;其中,一个推荐得分对应一个排序得分。处理器102,具体用于将大于或等于排序阈值的趴下得分对应的实际多媒体文件作为推荐数据。
其中,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,其作用在此不再赘述。
当然,本申请实施例提供的服务器400包括但不限于上述模块,例如服务器400还可以包括存储器103。存储器103可以用于存储该服务器400的程序代码,还可以用于存储服务器400在运行过程中生成的数据,如写请求中的数据等。
作为一个示例,结合图3,服务器400中的获取单元401和发送单元403二者实现的功能通信器101的功能相同,处理单元402实现的功能与处理器102的功能相同,存储单元404实现的功能与存储器103的功能相同。
如图10所示,本申请实施例还提供一种芯片系统,该芯片系统可以应用于前述实施例中的服务器400。该芯片系统包括至少一个处理器1501和至少一个接口电路1502。该处理器1501可以是上述服务器400中的处理器。处理器1501和接口电路1502可通过线路互联。该处理器1501可以通过接口电路1502从上述服务器400的存储器接收并执行计算机指令。当计算机指令被处理器1501执行时,可使得服务器400执行上述实施例中服务器400执行的各个步骤。当然,该芯片系统还可以包含其他分立器件,本申请实施例对此不作具体限定。
本申请实施例还提供一种计算机可读存储介质,用于存储上述服务器400运行的计算机指令。
本申请实施例还提供一种计算机程序产品,包括上述服务器400运行的计算机指令。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种推荐方法,其特征在于,包括:
接收电子设备发送的请求信息;其中,所述请求信息至少包括实际用户标识和实际上下文数据,所述实际上下文数据至少包括时间信息和位置信息;
根据所述实际用户标识,确定实际用户数据;
将预先配置的媒资数据、所述实际用户数据和所述实际上下文数据输入至推荐模型中,得到所述媒资数据中每个实际多媒体文件对应的实际点击率和实际转化率;其中,所述推荐模型基于历史多媒体文件对应的特征信息、历史用户数据以及历史上下文数据二者在每个行为动机的历史隶属度、以及包含每个所述行为动机的隐空间对应的特征向量训练得到的,所述行为动机用于指示在目标环境下执行所述行为动机对应的用户行为的原因;
根据所述实际点击率和所述实际转化率,确定推荐数据;其中,所述推荐数据中包括至少一个实际多媒体文件;
向所述电子设备发送所述推荐数据。
2.根据权利要求1所述的推荐方法,其特征在于,所述推荐模型至少包括特征提取子模型、动机识别子模型、数据预测子模型和双塔子模型;其中,所述特征提取子模型用于提取每个所述实际多媒体文件的媒资特征,所述动机识别子模型用于确定所述历史隶属度,所述数据预测子模型用于根据所述特征提取子模型确定的所述媒资特征、所述动机识别子模型确定的所述历史隶属度以及所述特征向量,确定每个所述实际多媒体文件的点击结果,所述双塔子模型用于根据所述数据预测子模型确定的所述点击结果,确定每个所述实际多媒体文件对应的实际点击率和实际转化率;其中,所述点击结果包括未被点击和已被点击中的任一项。
3.根据权利要求2所述的推荐方法,其特征在于,所述推荐模型的训练过程如下:
获取训练样本数据和所述训练样本数据的标记结果;其中,所述训练样本数据包括所述特征向量、至少一个历史多媒体文件、至少一组训练数据,所述训练数据包括历史用户数据和历史上下文数据,所述标记结果包括每个所述历史多媒体文件对应的历史实际点击率和历史实际转化率;
将所述历史多媒体文件输入至所述特征提取子模型,得到所述特征提取子模型对所述历史多媒体文件的提取结果;
将所述训练数据输入至所述动机识别子模型,得到所述动机识别子模型对所述训练数据的识别结果;
将所述提取结果、所述识别结果和所述特征向量三者输入至所述数据预测子模型,得到所述数据预测子模型对所述预测结果和所述特征向量的预测结果;
将所述预测结果输入至所述双塔子模型,得到所述双塔子模型对所述预测结果的召回结果;
基于目标损失函数计算所述召回结果与所述标记结果的损失值;
在所述损失值大于或等于损失阈值的情况下,调整所述特征提取子模型的第一网络参数、调整所述动机识别子模型的第二网络参数、调整所述数据预测子模型的第三网络参数,以及调整所述双塔子模型的第四网络参数,直至所述损失值小于所述损失阈值时,得到所述推荐模型。
4.根据权利要求3所述的推荐方法,其特征在于,所述特征提取子模型、所述动机识别子模型和所述双塔子模型三者均包括深度神经网络,所述数据预测子模型包括多任务学习模型。
5.根据权利要求3所述的推荐方法,其特征在于,所述目标损失函数包括对数损失函数。
6.根据权利要求1所述的推荐方法,其特征在于,所述根据所述实际点击率和所述实际转化率,确定推荐数据,包括:
根据所述实际点击率和所述实际转化率,确定推荐得分;其中,所述推荐得分用于指示访问所述推荐得分对应的实际多媒体文件的访问概率;
根据所述推荐得分,筛选所述推荐得分大于或等于得分阈值的实际多媒体文件;
将所述推荐得分大于或等于所述得分阈值的实际多媒体文件作为推荐数据。
7.根据权利要求6所述的推荐方法,其特征在于,所述将所述推荐得分大于或等于得分阈值的实际多媒体文件作为推荐数据,包括:
对所述推荐得分大于或等于所述得分阈值的实际多媒体文件,按照从大到小的顺序对大于或等于所述得分阈值的所述推荐得分进行排序,得到排序结果;
根据所述排序结果,筛选大于或等于目标排序的所述推荐得分;其中,一个所述推荐得分对应一个排序得分;
将所述大于或等于排序阈值的所述排序得分对应的实际多媒体文件作为推荐数据。
8.一种推荐装置,其特征在于,包括:
接收单元,用于接收电子设备发送的请求信息;其中,所述请求信息至少包括实际用户标识和实际上下文数据,所述实际上下文数据至少包括时间信息和位置信息;
处理单元,用于根据所述接收单元接收的所述实际用户标识,确定实际用户数据;
所述处理单元,还用于将预先配置的媒资数据、所述实际用户数据和所述接收单元接收的所述实际上下文数据输入至推荐模型中,得到所述媒资数据中每个实际多媒体文件对应的实际点击率和实际转化率;其中,所述推荐模型基于历史多媒体文件对应的特征信息、历史用户数据以及历史上下文数据二者在每个行为动机的历史隶属度、以及包含每个所述行为动机的隐空间对应的特征向量训练得到的,所述行为动机用于指示在目标环境下执行所述行为动机对应的用户行为的原因;
所述处理单元,还用于根据所述实际点击率和所述实际转化率,确定推荐数据;其中,所述推荐数据中包括至少一个实际多媒体文件;
所述处理单元,还用于控制发送单元向所述电子设备发送所述推荐数据。
9.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器用于存储计算机程序;所述处理器用于在执行计算机程序时,使得所述电子设备实现权利要求1-7任一项所述的推荐方法。
10.一种计算机可读存储介质,其特征在于,包括:所述计算机可读存储介质上存储有计算机程序,当所述计算机程序被计算设备执行时,使得所述计算设备实现权利要求1-7任一项所述的推荐方法。
CN202211610210.3A 2022-12-14 2022-12-14 一种推荐方法、装置和电子设备 Pending CN117271880A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211610210.3A CN117271880A (zh) 2022-12-14 2022-12-14 一种推荐方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211610210.3A CN117271880A (zh) 2022-12-14 2022-12-14 一种推荐方法、装置和电子设备

Publications (1)

Publication Number Publication Date
CN117271880A true CN117271880A (zh) 2023-12-22

Family

ID=89205105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211610210.3A Pending CN117271880A (zh) 2022-12-14 2022-12-14 一种推荐方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN117271880A (zh)

Similar Documents

Publication Publication Date Title
WO2021159776A1 (zh) 基于人工智能的推荐方法、装置、电子设备及存储介质
CN111444428B (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
US20210027160A1 (en) End-to-end deep collaborative filtering
CN111008332B (zh) 内容项推荐方法、装置、服务器以及存储介质
US20220122099A1 (en) Analytical precursor mining for personalized recommendation
CN112822526B (zh) 视频推荐方法、服务器和可读存储介质
RU2720954C1 (ru) Способ и система построения поискового индекса с использованием алгоритма машинного обучения
CN110413894B (zh) 内容推荐模型的训练方法、内容推荐的方法及相关装置
US20230162005A1 (en) Neural network distillation method and apparatus
US10185983B2 (en) Least-ask: conversational recommender system with minimized user interaction
CN113392237A (zh) 一种分类标签展示方法、服务器及显示设备
US11360927B1 (en) Architecture for predicting network access probability of data files accessible over a computer network
JP2024503774A (ja) 融合パラメータの特定方法及び装置、情報推奨方法及び装置、パラメータ測定モデルのトレーニング方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
WO2021155691A1 (zh) 用户画像生成方法、装置、存储介质及设备
CN111625680A (zh) 确定搜索结果的方法及装置
CN115905687A (zh) 基于元学习图神经网络面向冷启动的推荐系统及方法
US20230237093A1 (en) Video recommender system by knowledge based multi-modal graph neural networks
CN114817692A (zh) 确定推荐对象的方法、装置和设备及计算机存储介质
CN116957678A (zh) 一种数据处理方法和相关装置
CN117034963A (zh) 模型训练方法、翻译方法、预估方法、推荐方法及装置
CN116910357A (zh) 一种数据处理方法及相关装置
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
CN115129902B (zh) 媒体数据处理方法、装置、设备及存储介质
CN117271880A (zh) 一种推荐方法、装置和电子设备
CN113569130A (zh) 内容推荐方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination