CN117453933A - 一种多媒体数据推荐方法、装置、电子设备及存储介质 - Google Patents
一种多媒体数据推荐方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117453933A CN117453933A CN202311385652.7A CN202311385652A CN117453933A CN 117453933 A CN117453933 A CN 117453933A CN 202311385652 A CN202311385652 A CN 202311385652A CN 117453933 A CN117453933 A CN 117453933A
- Authority
- CN
- China
- Prior art keywords
- multimedia data
- preset
- characteristic information
- sample
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 230000004927 fusion Effects 0.000 claims abstract description 75
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 238000012163 sequencing technique Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims description 46
- 238000013528 artificial neural network Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 7
- 238000003062 neural network model Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 16
- 238000005516 engineering process Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 230000006399 behavior Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开关于一种多媒体数据推荐方法、装置、电子设备及存储介质,包括:获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息;将第一特征信息及第二特征信息输入至预设排序模型中进行特征提取,输出候选多媒体数据分别对应于各个预设指标的指标值;将第一特征信息输入至门控模型中进行权重预测,输出预设指标分别对应的融合权重;根据融合权重对指标值进行加权融合,得到候选多媒体数据的排序分数,并根据排序分数从候选多媒体数据中确定推荐多媒体数据。这样,门控模型通过对目标用户的第一特征信息进行权重预测,确定各个预设指标的融合权重,从而实现了自适应的动态融合权重,达到优化推荐排序的效果。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及一种多媒体数据推荐方法、装置、电子设备及存储介质。
背景技术
多媒体数据平台需要向用户进行多媒体数据内容的推送,以便用户快速获取到感兴趣的内容,提升用户体验。
现有技术中,可以通过多个指标评估用户对多媒体数据的感兴趣程度,包括点击率、观看时长、完播率等,具体来说,多媒体数据推荐模型对多媒体数据进行分析,预测多媒体数据在各个指标的表现情况,进而依据表现情况确定多媒体数据的推荐排序。
但是,目前的多媒体数据推荐模型通常采用统一的推荐排序方式,无法对不同用户进行自适应个性化,因此多媒体数据推荐的效果较差。
发明内容
本公开提供一种多媒体数据推荐系统、方法、装置、电子设备及存储介质,以至少解决相关技术中多媒体数据推荐模型通常采用统一的推荐排序方式,无法根据对不同用户进行自适应个性化,因此多媒体数据推荐的效果较差的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种多媒体数据推荐方法,包括:
获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息;
将所述第一特征信息及所述第二特征信息输入至预设排序模型中进行特征提取,输出所述候选多媒体数据分别对应于各个预设指标的指标值;
将所述第一特征信息输入至门控模型中进行权重预测,输出所述预设指标分别对应的融合权重;所述门控模型由训练数据对预设深度神经网络模型进行训练得到;
根据所述融合权重对所述指标值进行加权融合,得到所述候选多媒体数据的排序分数,并根据所述排序分数从所述候选多媒体数据中确定推荐多媒体数据。
可选地,所述第一特征信息包括:
所述目标用户的用户特征;
所述目标用户的上下文特征。
可选地,在所述将所述第一特征信息输入至门控模型中进行权重预测,输出所述预设指标分别对应的融合权重之前,包括:
获取训练数据;所述训练数据包括样本用户的样本第一特征信息、样本多媒体数据分别对应于各个所述预设指标的预测指标值及所述样本多媒体数据的目标排序分数;
将所述样本第一特征信息输入至预设深度神经网络中进行处理,输出所述预设指标分别对应的预测融合权重;
根据所述预测融合权重对所述预测指标值进行加权融合,得到所述样本多媒体数据的预测排序分数;
确定所述预测排序分数与所述目标排序分数之间的损失值;
根据所述损失值,对所述预设深度神经网络的模型参数进行迭代调整,直至所述损失值满足预设条件,将参数调整后的预设深度神经网络作为门控模型。
可选地,所述获取训练数据,包括:
获取样本用户的样本第一特征信息、多个样本多媒体数据的样本第二特征信息及所述样本多媒体数据的目标排序分数;
将所述样本第一特征信息及所述样本第二特征信息输入至预设排序模型中进行特征提取,输出所述样本多媒体数据分别对应于各个预设指标的预测指标值。
可选地,所述预设指标用于指示所述目标用户对所述候选多媒体数据的感兴趣程度,包括以下至少一项:
所述候选多媒体数据的点击率、观看时长及完播率。
根据本公开实施例的第二方面,提供一种多媒体数据推荐装置,包括:
获取模块,用于获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息;
指标确定模块,用于将所述第一特征信息及所述第二特征信息输入至预设排序模型中进行特征提取,输出所述候选多媒体数据分别对应于各个预设指标的指标值;
权重确定模块,用于将所述第一特征信息输入至门控模型中进行权重预测,输出所述预设指标分别对应的融合权重;所述门控模型由训练数据对预设深度神经网络模型进行训练得到;
融合模块,用于根据所述融合权重对所述指标值进行加权融合,得到所述候选多媒体数据的排序分数,并根据所述排序分数从所述候选多媒体数据中确定推荐多媒体数据。
可选地,所述第一特征信息包括:
所述目标用户的用户特征;
所述目标用户的上下文特征。
可选地,所述装置还包括训练模块,用于:
获取训练数据;所述训练数据包括样本用户的样本第一特征信息、样本多媒体数据分别对应于各个所述预设指标的预测指标值及所述样本多媒体数据的目标排序分数;
将所述样本第一特征信息输入至预设深度神经网络中进行处理,输出所述预设指标分别对应的预测融合权重;
根据所述预测融合权重对所述预测指标值进行加权融合,得到所述样本多媒体数据的预测排序分数;
确定所述预测排序分数与所述目标排序分数之间的损失值;
根据所述损失值,对所述预设深度神经网络的模型参数进行迭代调整,直至所述损失值满足预设条件,将参数调整后的预设深度神经网络作为门控模型。
可选地,所述训练模块,具体用于:
获取样本用户的样本第一特征信息、多个样本多媒体数据的样本第二特征信息及所述样本多媒体数据的目标排序分数;
将所述样本第一特征信息及所述样本第二特征信息输入至预设排序模型中进行特征提取,输出所述样本多媒体数据分别对应于各个预设指标的预测指标值。
可选地,所述预设指标用于指示所述目标用户对所述候选多媒体数据的感兴趣程度,包括以下至少一项:
所述候选多媒体数据的点击率、观看时长及完播率。
根据本公开实施例的第三方面,提供一种多媒体数据推荐电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现所述任一项所述的多媒体数据推荐方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由多媒体数据推荐电子设备的处理器执行时,使得多媒体数据推荐电子设备能够执行所述任一项所述的多媒体数据推荐方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现所述任一项所述的多媒体数据推荐方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息;将第一特征信息及第二特征信息输入至预设排序模型中进行特征提取,输出候选多媒体数据分别对应于各个预设指标的指标值;将第一特征信息输入至门控模型中进行权重预测,输出预设指标分别对应的融合权重;门控模型由训练数据对预设深度神经网络模型进行训练得到;根据融合权重对指标值进行加权融合,得到候选多媒体数据的排序分数,并根据排序分数从候选多媒体数据中确定推荐多媒体数据。
这样,在多媒体数据的推荐过程中,引入了门控模型,门控模型通过对目标用户的第一特征信息进行权重预测,确定各个预设指标的融合权重,由于不同用户的第一特征信息各不相同,因此门控网络的输出也不相同,这样,对于不同用户而言,各个预设指标的融合权重也有所不同,从而实现了自适应的动态融合权重,达到优化推荐排序的效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种多媒体数据推荐方法的流程图。
图2是根据一示例性实施例示出的一种预设排序模型及门控网络的网络示意图。
图3是根据一示例性实施例示出的一种多媒体数据推荐方法的逻辑示意图。
图4是根据一示例性实施例示出的一种多媒体数据推荐装置的框图。
图5是根据一示例性实施例示出的一种用于多媒体数据推荐的电子设备的框图。
图6是根据一示例性实施例示出的一种用于多媒体数据推荐的装置的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及所述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种多媒体数据推荐方法的流程图,如图1所示,该多媒体数据推荐方法包括:
在步骤S11中,获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息。
一些场景中,可以通过多个预设指标评估用户对候选多媒体数据的感兴趣程度,包括候选多媒体数据的点击率、观看时长、完播率等,具体来说,多媒体数据推荐模型对候选多媒体数据进行分析,预测候选多媒体数据在各个预设指标的表现情况,进而依据表现情况确定候选多媒体数据的推荐排序。
但相关技术中,多媒体数据推荐模型对不同的用户采用了统一的推荐排序方式,无法根据用户的不同进行自适应个性化,因此多媒体数据推荐的效果较差。本申请提供的多媒体数据推荐方法可以对多媒体数据的个性化推荐效果进行改善。
其中,多媒体数据可以是视频数据,也可以是音频数据或图像、文本数据,本申请对此不作限定。
具体地,本申请可以应用于服务器,服务器本地、网络中的其他服务器或终端中,获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息并进行后续的多媒体数据推荐步骤,并在从候选多媒体数据中确定推荐多媒体数据后,向目标用户对应终端返回推荐多媒体数据,以实现对目标用户的个性化推荐效果。
上述终端可以是手机、平板电脑、台式电脑、便携式笔记本电脑等多种形式的终端设备,本申请实施例对此不加以限定。
上述服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
在一些实施例中,上述服务器还可以实现为区块链系统中的节点。区块链(Blockchain)是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链,本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
在本步骤中,首先获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息,其中,目标用户是指需要向其推荐多媒体数据的用户,第一特征信息用于体现目标用户的特征,候选多媒体数据是指可以向目标用户推荐的全部或部分多媒体数据,第二特征信息用于体现候选多媒体数据的特征。
比如,候选多媒体数据可以是指在预设时间范围内发布的多媒体数据,或者,也可以是指在在目标用户当前所处位置坐标预设距离内发布的多媒体数据,等等,具体不做限定。
一种实现方式中,第一特征信息包括但不限于:目标用户的用户特征;目标用户的上下文特征。
其中,用户特征是对目标用户进行画像得到的信息,包括目标用户自带的属性信息,比如目标用户在注册时候输入的性别、年龄、位置等信息;还包括对目标用户属性进行挖掘得到的信息,比如目标用户过去一个月内下单的总次数、总金额等;除此之外,还可以包括目标用户的其他属性信息。
上下文特征主要是指目标用户请求发生的一系列“环境”信息,通常是实时的目标用户的行为特征,比如当前的时间、目标用户终端的信息、目标用户的地理位置、网络等;另外,还可以包括目标用户的活跃度特征,比如目标用户在过去一段时间的登录次数、注册时间、最近一周的活跃天数等等,具体不做限定。
根据目标用户的用户特征和上下文特征,可以对目标用户的特点有较为全面的了解,这样,在后续的步骤中可以有效实现针对目标用户的个性化多媒体数据推荐效果。
在步骤S12中,将第一特征信息及第二特征信息输入至预设排序模型中进行特征提取,输出候选多媒体数据分别对应于各个预设指标的指标值。
在本步骤中,将获取到的第一特征信息及第二特征信息输入至预设排序模型中,由预设排序模型对候选多媒体数据进行排序特征提取,得到候选多媒体数据分别对应于各个预设指标的指标值。
比如,如果预设指标包括点击率、观看时长、完播率,那么,预设排序模型可以对候选多媒体数据的点击率、观看时长及完播率进行预测,得到对应的三项指标值。得到的指标值可以用于后续对候选多媒体数据的排序及推荐。
一种实现方式中,预设排序模型可以热加载已有的排序模型,获取已有的排序模型中的所有参数,也就是说,可以通过在已有的训练好的排序模型的基础上进行进一步训练,得到预设排序模型,无需从零开始训练新的排序模型,从而充分利用已有的排序模型的训练结果,不仅可以减少模型训练所需的计算量,提高多媒体数据排序及推荐的效率,而且,还可以保证各个预设指标的原始指标值的一致性,提高后续多媒体数据排序及推荐的稳定性。
另一种实现方式中,预设排序模型也可以是由训练数据对初始排序模型进行训练得到的,具体来说,先获取训练数据,包括样本用户的样本第一特征信息、样本多媒体数据分别对应于各个预设指标的真实指标值及样本多媒体数据的样本第二特征信息;将样本第一特征信息及样本第二特征信息输入至初始排序模型中进行处理,输出样本多媒体数据分别对应于各个预设指标的预测指标值;根据预测指标值与真实指标值,对初始排序模型的模型参数进行迭代调整,得到预设排序模型。这样,不同的目标用户对应的预设排序模型也会有所不同,进一步改善后续多媒体数据排序及推荐的个性化效果。
其中,预设排序模型可以为逻辑回归(Logistics Regression,LR)模型、因子分解机(Factorization Machine,FM)模型或梯度提升树(Gradient Boosting Decision Tree,GBDT)模型等,具体不做限定。
在步骤S13中,将第一特征信息输入至门控模型中进行权重预测,输出预设指标分别对应的融合权重;门控模型由训练数据对预设深度神经网络模型进行训练得到。
在本步骤中,将目标用户的第一特征信息输入至门控模型,门控模型对目标用户的特点进行权重预测,得到各个预设指标分别对应的融合权重,这样,对于不同的目标用户而言,各个预设指标分别对应的融合权重将有所不同,从而实现多媒体数据排序及推荐的个性化。
在本申请中,步骤S13和上述步骤S12可以是先后进行,也可以是同时进行,具体不做限定。
其中,门控网络为深度神经网络(Deep Neural Networks,DNN),输入为目标用户的第一特征信息,包括用户特征及上下文特征等,输出为多目标的融合权重,也就是说,门控网络的输出维度与预设指标的个数相等,每个维度对应一个预设指标的融合权重。
一种实现方式中,在将第一特征信息输入至门控模型中进行权重预测,输出预设指标分别对应的融合权重之前,包括:
获取训练数据,包括样本用户的样本第一特征信息、样本多媒体数据分别对应于各个预设指标的预测指标值及样本多媒体数据的目标排序分数;将样本第一特征信息输入至预设深度神经网络中进行处理,输出预设指标分别对应的预测融合权重;根据预测融合权重对预测指标值进行加权融合,得到样本多媒体数据的预测排序分数;确定预测排序分数与目标排序分数之间的损失值;根据损失值,对预设深度神经网络的模型参数进行迭代调整,直至损失值满足预设条件,将参数调整后的预设深度神经网络作为门控模型。
也就是说,门控网络的输入只有第一特征信息,不包含待推荐的候选多媒体数据的第二特征信息,门控网络的训练过程中,将各个预设指标对应的加权和与样本多媒体数据的目标排序分数之间的损失值作为优化目标,通过对预设深度神经网络的迭代调整,使得损失值最小化,得到门控模型。可以理解,门控模型的优化目标与本申请对候选多媒体数据进行推荐的业务目标是一致的,各个预设指标对应的加权越高,则候选多媒体数据被推荐的可能性越大,因此,门控模型对候选多媒体数据的推荐具有较好的效果,可以保证最终自适应模型的有效性。
具体来说,可以针对每个预设指标,将该预设指标对应的预测指标值和预测融合权重相乘,得到该预设指标对应的预测排序分数,然后,将各个预设指标对应的预测排序分数相加,得到样本多媒体数据的预测排序分数,再与目标排序分数进行比较,确定两者之间的损失值,进而对预设深度神经网络的模型参数进行迭代调整,得到门控模型。
因此,在多媒体数据的排序及推荐过程中,候选多媒体数据各个预设指标的融合权重,由门口模型对第一特征信息进行权重预测得到,而第一特征信息用于体现目标用户的特征,那么,各个预设指标的融合权重只与目标用户有关,和候选多媒体数据自身无关,对于同一个目标用户而言,不同的候选多媒体数据均采用了相同的融合权重进行排序分数的计算,从而保证了融合权重的稳定性和公平性。
一种实现方式中,训练数据中样本多媒体数据分别对应于各个预设指标的预测指标值可以是由预设排序模型进行计算得到的,那么,获取训练数据,包括:
获取样本用户的样本第一特征信息、多个样本多媒体数据的样本第二特征信息及样本多媒体数据的目标排序分数;将样本第一特征信息及样本第二特征信息输入至预设排序模型中进行特征提取,输出样本多媒体数据分别对应于各个预设指标的预测指标值。
也就是说,可以根据样本用户的样本第一特征信息和多个样本多媒体数据的样本第二特征信息,由预设排序模型输出样本多媒体数据分别对应于各个预设指标的预测指标值,进而基于预测指标值训练门控网络,这样,门控网络的训练及应用过程中,预设排序模型的模型参数保持不变,从而可以保证各个预设指标的指标值输出的稳定性。
另外,预测指标值也可以是预先获取的经验值或采用其他方式计算得到的,本申请实施例对此不作限定。
在步骤S14中,根据融合权重对指标值进行加权融合,得到候选多媒体数据的排序分数,并根据排序分数从候选多媒体数据中确定推荐多媒体数据。
在前述步骤中,门控网络的输出为各个预设指标分别对应的融合权重,那么,在本步骤中,根据融合权重对各个预设指标分别对应的指标值进行加权融合,针对每个预设指标,先将其对应的指标值和融合权重相乘,再对各个预设指标的相乘结果进行融合,最终得到的融合分数为候选多媒体数据的排序分数。其中,可以直接将各个预设指标的相乘结果相加,得到融合分数,或者,也可以采用计算平均值或其他滤波算法等方式进行融合,具体不做限定。
可以理解,排序分数越高,则表示该候选多媒体数据被推荐给目标用户后,可能达到的各个预设指标的表现情况越好,即该候选多媒体数据排序越高,越值得被推荐给目标用户。反之,排序分数越低,则表示该候选多媒体数据排序越低,越不值得被推荐给目标用户。
因此,可以根据排序分数从候选多媒体数据中确定一个或多个推荐多媒体数据,并将推荐多媒体数据推送给目标用户,以实现对目标用户进行多媒体数据推荐。
进一步地,将推荐多媒体数据推送给目标用户之后,可以获取目标用户对推荐多媒体数据的行为数据,比如目标用户是否点击推荐多媒体数据、观看推荐多媒体数据的时长以及是否完播推荐多媒体数据等,获取到的行为数据可以做为新的训练数据中第一特征信息的一部分,对预设排序模型及门控模型进行进一步的迭代调整,不断提高模型的计算效果。
如图2所示,为本申请中预设排序模型及门控网络的网络示意图。其中,首先获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息,其中,第一特征信息包括目标用户的用户特征及上下文特征;然后,用户特征、上下文特征及第二特征信息输入至预设排序模型中进行特征提取,输出候选多媒体数据分别对应于各个预设指标的指标值;同时,用户特征及上下文特征输入至门控模型中进行权重预测,输出预设指标分别对应的融合权重;进而,根据融合权重对指标值进行加权融合,得到候选多媒体数据的排序分数。
如图3所示,为本申请中多媒体数据推荐方法的逻辑示意图。在多媒体数据为视频数据的情况下,首先生成训练样本,每个训练样本包括样本用户的样本第一特征信息、样本视频的视频特征以及样本视频分别对应于各个预设指标的预测指标值及样本视频的目标排序分数,其中样本第一特征信息包括用于进行用户画像的用户特征以及用于描述用户行为的上下文特征;然后,基于用户画像、用户行为以及视频特征进行门控模型的训练;进而,根据训练好的门控模型对候选多媒体数据进行排序及推荐,并获取目标用户对推荐多媒体数据的行为数据,不断对门控模型进行进一步的迭代调整。
由以上可见,本公开的实施例提供的技术方案,在多媒体数据的推荐过程中,引入了门控模型,门控模型通过对目标用户的第一特征信息进行权重预测,确定各个预设指标的融合权重,由于不同用户的第一特征信息各不相同,因此门控网络的输出也不相同,这样,对于不同用户而言,各个预设指标的融合权重也有所不同,从而实现了自适应的动态融合权重,达到优化推荐排序的效果。
图4是根据一示例性实施例示出的一种多媒体数据推荐装置框图,包括:
获取模块201,用于获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息;
指标确定模块202,用于将所述第一特征信息及所述第二特征信息输入至预设排序模型中进行特征提取,输出所述候选多媒体数据分别对应于各个预设指标的指标值;
权重确定模块203,用于将所述第一特征信息输入至门控模型中进行权重预测,输出所述预设指标分别对应的融合权重;所述门控模型由训练数据对预设深度神经网络模型进行训练得到;
融合模块204,用于根据所述融合权重对所述指标值进行加权融合,得到所述候选多媒体数据的排序分数,并根据所述排序分数从所述候选多媒体数据中确定推荐多媒体数据。
可选地,所述第一特征信息包括:
所述目标用户的用户特征;
所述目标用户的上下文特征。
可选地,所述装置还包括训练模块,用于:
获取训练数据;所述训练数据包括样本用户的样本第一特征信息、样本多媒体数据分别对应于各个所述预设指标的预测指标值及所述样本多媒体数据的目标排序分数;
将所述样本第一特征信息输入至预设深度神经网络中进行处理,输出所述预设指标分别对应的预测融合权重;
根据所述预测融合权重对所述预测指标值进行加权融合,得到所述样本多媒体数据的预测排序分数;
确定所述预测排序分数与所述目标排序分数之间的损失值;
根据所述损失值,对所述预设深度神经网络的模型参数进行迭代调整,直至所述损失值满足预设条件,将参数调整后的预设深度神经网络作为门控模型。
可选地,所述训练模块,具体用于:
获取样本用户的样本第一特征信息、多个样本多媒体数据的样本第二特征信息及所述样本多媒体数据的目标排序分数;
将所述样本第一特征信息及所述样本第二特征信息输入至预设排序模型中进行特征提取,输出所述样本多媒体数据分别对应于各个预设指标的预测指标值。
可选地,所述预设指标用于指示所述目标用户对所述候选多媒体数据的感兴趣程度,包括以下至少一项:
所述候选多媒体数据的点击率、观看时长及完播率。
由以上可见,本公开的实施例提供的技术方案,在多媒体数据的推荐过程中,引入了门控模型,门控模型通过对目标用户的第一特征信息进行权重预测,确定各个预设指标的融合权重,由于不同用户的第一特征信息各不相同,因此门控网络的输出也不相同,这样,对于不同用户而言,各个预设指标的融合权重也有所不同,从而实现了自适应的动态融合权重,达到优化推荐排序的效果。
图5是根据一示例性实施例示出的一种用于多媒体数据推荐的电子设备的框图。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器,所述指令可由电子设备的处理器执行以完成所述方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,当其在计算机上运行时,使得计算机实现所述多媒体数据推荐的方法。
由以上可见,本公开的实施例提供的技术方案,在多媒体数据的推荐过程中,引入了门控模型,门控模型通过对目标用户的第一特征信息进行权重预测,确定各个预设指标的融合权重,由于不同用户的第一特征信息各不相同,因此门控网络的输出也不相同,这样,对于不同用户而言,各个预设指标的融合权重也有所不同,从而实现了自适应的动态融合权重,达到优化推荐排序的效果。
图6是根据一示例性实施例示出的一种用于多媒体数据推荐的装置800的框图。
例如,装置800可以是移动电话,计算机,数字广播电子设备,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成所述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件807为装置800的各种组件提供电力。电源组件807可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和账户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自账户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,所述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,账户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行第一方面和第二方面所述的方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,所述指令可由装置800的处理器820执行以完成所述方法。可选地,例如,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性非临时性计算机可读存储介质计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行所述实施例中任一所述的多媒体数据推荐方法。
由以上可见,本公开的实施例提供的技术方案,在多媒体数据的推荐过程中,引入了门控模型,门控模型通过对目标用户的第一特征信息进行权重预测,确定各个预设指标的融合权重,由于不同用户的第一特征信息各不相同,因此门控网络的输出也不相同,这样,对于不同用户而言,各个预设指标的融合权重也有所不同,从而实现了自适应的动态融合权重,达到优化推荐排序的效果。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种多媒体数据推荐方法,其特征在于,包括:
获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息;
将所述第一特征信息及所述第二特征信息输入至预设排序模型中进行特征提取,输出所述候选多媒体数据分别对应于各个预设指标的指标值;
将所述第一特征信息输入至门控模型中进行权重预测,输出所述预设指标分别对应的融合权重;
根据所述融合权重对所述指标值进行加权融合,得到所述候选多媒体数据的排序分数,并根据所述排序分数从所述候选多媒体数据中确定推荐多媒体数据。
2.根据权利要求1所述的多媒体数据推荐方法,其特征在于,所述第一特征信息包括:
所述目标用户的用户特征;以及,
所述目标用户的上下文特征。
3.根据权利要求1所述的多媒体数据推荐方法,其特征在于,在所述将所述第一特征信息输入至门控模型中进行权重预测,输出所述预设指标分别对应的融合权重之前,包括:
获取训练数据;所述训练数据包括样本用户的样本第一特征信息、样本多媒体数据分别对应于各个所述预设指标的预测指标值及所述样本多媒体数据的目标排序分数;
将所述样本第一特征信息输入至预设深度神经网络中进行处理,输出所述预设指标分别对应的预测融合权重;
根据所述预测融合权重对所述预测指标值进行加权融合,得到所述样本多媒体数据的预测排序分数;
确定所述预测排序分数与所述目标排序分数之间的损失值;
根据所述损失值,对所述预设深度神经网络的模型参数进行迭代调整,直至所述损失值满足预设条件,将参数调整后的预设深度神经网络作为门控模型。
4.根据权利要求3所述的多媒体数据推荐方法,其特征在于,所述获取训练数据,包括:
获取样本用户的样本第一特征信息、多个样本多媒体数据的样本第二特征信息及所述样本多媒体数据的目标排序分数;
将所述样本第一特征信息及所述样本第二特征信息输入至预设排序模型中进行特征提取,输出所述样本多媒体数据分别对应于各个预设指标的预测指标值。
5.根据权利要求3所述的多媒体数据推荐方法,其特征在于,所述预设指标用于指示所述目标用户对所述候选多媒体数据的感兴趣程度,包括以下至少一项:
所述候选多媒体数据的点击率、观看时长及完播率。
6.一种多媒体数据推荐装置,其特征在于,包括:
获取模块,用于获取目标用户的第一特征信息及多个候选多媒体数据的第二特征信息;
指标确定模块,用于将所述第一特征信息及所述第二特征信息输入至预设排序模型中进行特征提取,输出所述候选多媒体数据分别对应于各个预设指标的指标值;
权重确定模块,用于将所述第一特征信息输入至门控模型中进行权重预测,输出所述预设指标分别对应的融合权重;所述门控模型由训练数据对预设深度神经网络模型进行训练得到;
融合模块,用于根据所述融合权重对所述指标值进行加权融合,得到所述候选多媒体数据的排序分数,并根据所述排序分数从所述候选多媒体数据中确定推荐多媒体数据。
7.根据权利要求6所述的多媒体数据推荐装置,其特征在于,所述装置还包括训练模块,用于:
获取训练数据;所述训练数据包括样本用户的样本第一特征信息、样本多媒体数据分别对应于各个所述预设指标的预测指标值及所述样本多媒体数据的目标排序分数;
将所述样本第一特征信息输入至预设深度神经网络中进行处理,输出所述预设指标分别对应的预测融合权重;
根据所述预测融合权重对所述预测指标值进行加权融合,得到所述样本多媒体数据的预测排序分数;
确定所述预测排序分数与所述目标排序分数之间的损失值;
根据所述损失值,对所述预设深度神经网络的模型参数进行迭代调整,直至所述损失值满足预设条件,将参数调整后的预设深度神经网络作为门控模型。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至5中任一项所述的多媒体数据推荐方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由多媒体数据推荐电子设备的处理器执行时,使得多媒体数据推荐电子设备能够执行如权利要求1至5中任一项所述的多媒体数据推荐方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述的多媒体数据推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311385652.7A CN117453933A (zh) | 2023-10-24 | 2023-10-24 | 一种多媒体数据推荐方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311385652.7A CN117453933A (zh) | 2023-10-24 | 2023-10-24 | 一种多媒体数据推荐方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117453933A true CN117453933A (zh) | 2024-01-26 |
Family
ID=89592224
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311385652.7A Pending CN117453933A (zh) | 2023-10-24 | 2023-10-24 | 一种多媒体数据推荐方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117453933A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726475A (zh) * | 2024-02-05 | 2024-03-19 | 煤炭科学研究总院有限公司 | 尾矿溃坝监控方法、装置、电子设备及存储介质 |
-
2023
- 2023-10-24 CN CN202311385652.7A patent/CN117453933A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117726475A (zh) * | 2024-02-05 | 2024-03-19 | 煤炭科学研究总院有限公司 | 尾矿溃坝监控方法、装置、电子设备及存储介质 |
CN117726475B (zh) * | 2024-02-05 | 2024-05-14 | 煤炭科学研究总院有限公司 | 尾矿溃坝监控方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109800325B (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
RU2640632C2 (ru) | Способ и устройство для доставки информации | |
CN111859020B (zh) | 推荐方法、装置、电子设备及计算机可读存储介质 | |
CN112445970B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN109670632B (zh) | 广告点击率的预估方法、广告点击率的预估装置、电子设备及存储介质 | |
CN111898018B (zh) | 一种虚拟资源的发送方法、装置、电子设备及存储介质 | |
CN112148980B (zh) | 基于用户点击的物品推荐方法、装置、设备和存储介质 | |
CN112148923B (zh) | 搜索结果的排序方法、排序模型的生成方法、装置及设备 | |
CN117453933A (zh) | 一种多媒体数据推荐方法、装置、电子设备及存储介质 | |
CN112131466A (zh) | 群组展示方法、装置、系统和存储介质 | |
CN110941727B (zh) | 一种资源推荐方法、装置、电子设备及存储介质 | |
CN111246255B (zh) | 视频推荐方法、装置、存储介质、终端及服务器 | |
CN111859097B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN110297970B (zh) | 信息推荐模型训练方法及装置 | |
CN114430504B (zh) | 一种媒体内容的推荐方法以及相关装置 | |
CN113656637B (zh) | 视频推荐方法、装置、电子设备及存储介质 | |
CN114648116A (zh) | 模型量化方法、装置、车辆及存储介质 | |
CN112241486A (zh) | 多媒体信息获取方法及装置 | |
CN113742566B (zh) | 多媒体信息的推荐方法、装置、电子设备和存储介质 | |
CN115484471B (zh) | 主播推荐方法及装置 | |
CN111949808A (zh) | 一种多媒体内容相似度确定方法、装置、电子设备及存储介质 | |
CN112446720B (zh) | 一种广告显示方法及装置 | |
CN114785852B (zh) | 一种推送内容确定方法、装置、电子设备及存储介质 | |
CN110516027B (zh) | 信息集合的更新方法、装置、电子设备及存储介质 | |
CN111753184B (zh) | 信息推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |