CN115964560A - 基于多模态预训练模型的资讯推荐方法及设备 - Google Patents

基于多模态预训练模型的资讯推荐方法及设备 Download PDF

Info

Publication number
CN115964560A
CN115964560A CN202211563461.0A CN202211563461A CN115964560A CN 115964560 A CN115964560 A CN 115964560A CN 202211563461 A CN202211563461 A CN 202211563461A CN 115964560 A CN115964560 A CN 115964560A
Authority
CN
China
Prior art keywords
information
text
image
recommended
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211563461.0A
Other languages
English (en)
Other versions
CN115964560B (zh
Inventor
侯旭
郑茂盛
杜向阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Aegis Information Technology Co ltd
Original Assignee
Nanjing Aegis Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Aegis Information Technology Co ltd filed Critical Nanjing Aegis Information Technology Co ltd
Priority to CN202211563461.0A priority Critical patent/CN115964560B/zh
Publication of CN115964560A publication Critical patent/CN115964560A/zh
Application granted granted Critical
Publication of CN115964560B publication Critical patent/CN115964560B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多模态预训练模型的资讯推荐方法,其特征在于它包括以下步骤:S1、对待推荐资讯、历史点击资讯集合中的内容分别进行多模态编码;S2、输入跨模态注意力网络,获得用户向量表示;S3、将待推荐资讯的文本表示向量、待推荐资讯的图像表示向量与用户向量表示结合,获得待推荐资讯的相关性得分;S4、根据相关性得分对待排序资讯排序,得分高的资讯表示与用户兴趣更匹配,优先推荐高得分资讯,实现资讯推荐。本发明所使用的推荐方法,融合了多模态数据信息,并建立了跨模态注意力网络对多模态数据信息进行融合。以综合考虑多因素影响,实现用户感兴趣咨询的精准推送。

Description

基于多模态预训练模型的资讯推荐方法及设备
技术领域
本发明属于大数据领域,具体是一种基于多模态预训练模型的资讯推荐方法及设备。
背景技术
随着互联网技术和应用的不断发展,互联网资讯内容呈现爆炸式的增长。为了在海量信息中为用户准确推荐感兴趣的内容,个性化推荐服务已经广泛应用于电商、社交、资讯等各互联网平台。此外,同一个互联网平台会包含文本、图片、视频等多种形式的资讯内容。
传统的资讯推荐方法主要基于文本内容进行推荐。专利CN201510509331.2提出一种新闻推荐方法,将文本相似度较高的新闻分为一个类簇,并将每个类簇存储于数据库中,当需要推荐新闻时,将该新闻对应的类簇中的其他新闻推荐给用户。然而,除了标题、内容等文本信息之外,资讯的封面图片等图像信息,也是用户是否点击的一个影响因素。
现有的多模态推荐方法主要通过分别对文本、图像、音频等模态数据进行特征编码,然后再通过拼接等方式对多种模态的特征表示进行融合,通过融合的多模态特征进行内容推荐。专利CN201910606172.6基于图像模态、音频模态和文本模态分别构建用户-内容图结构,通过相应图卷积神经网络的聚合层分别计算表达各个模态的用户及内容,利用相应图卷积神经网络的融合层合并用户及内容的各个模态的表达,得到用户和内容的最终表达。现有方法不能很好地学习到跨模态特征的统一表示,并且需要大量的标注数据进行训练。
发明内容
本发明基于背景技术中存在的问题,提出了一种基于多模态预训练模型的资讯推荐方法及设备。
技术方案:
本发明首先公开了一种基于多模态预训练模型的资讯推荐方法,它包括以下步骤:
S1、对待推荐资讯、历史点击资讯集合中的内容分别进行多模态编码,获取待推荐资讯的文本表示向量、待推荐资讯的图像表示向量、历史点击资讯的文本表示向量、历史点击资讯的图像表示向量;
S2、将待推荐资讯的文本表示向量、待推荐资讯的图像表示向量、历史点击资讯的文本表示向量、历史点击资讯的图像表示向量输入跨模态注意力网络,获得用户向量表示;
S3、将待推荐资讯的文本表示向量、待推荐资讯的图像表示向量与用户向量表示结合,获得待推荐资讯的相关性得分;
S4、根据相关性得分对待排序资讯排序,得分高的资讯表示与用户兴趣更匹配,优先推荐高得分资讯,实现资讯推荐。
优选的,S1的具体步骤包括:
S1-1、输入数据准备,输入数据包资讯的文本模态数据和图像模态数据,其中:
抽取文本内容的关键词,将标题、标签、关键词拼接获得文本模态数据;
提取视频关键帧获得图像数据,资讯的封面图片、视频中提取的关键帧作为图像模态数据;
资讯包括待推荐资讯和历史点击资讯;
S1-2、特征提取,分别获得文本的词序列、图像特征序列;
S1-3、使用视觉语言预训练模型对文本特征序列和图像特征序列进行跨模态关系表示建模,获取词表示序列Ht和ROI表示序列Hp
S1-4、词表示序列通过文本注意力网络学习,获得文本表示向量;ROI表示序列通过视觉注意力网络学习,获得图像表示向量。
优选的,S1-2中,文本特征序列的获取方法为:使用jieba分词,得到一个词序列[w1,w2,...,wM],其中M为词序列中词的个数。
优选的,S1-2中,图像特征序列的获取方法为:
首先,利用预训练的MaskR-CNN模型获取图像的感兴趣区域;
然后,利用ResNet-50模型提取ROI特征,得到图像特征序列[e1,e2,...,eN],其中N为ROI序列中的ROI个数。
具体的,S1-3中,视觉语言预训练模型为ViLBERT,将S1-2获得的文本的词序列、图像特征序列作为视觉语言预训练模型的输入,获得视觉语言预训练模型的输出为词表示序列Ht和ROI表示序列Hp
S1-4中,具体的:
文本表示向量:rt2Ht×at,式中,at为文本注意力权重;
图像表示向量:rp=Hp×ap,式中,ap为视觉注意力权重。
具体的:
at=softmax[(WtHt)Tqt]
ap=softmax[(WpHp)Tqp]
式中,Wt和Wp为参数矩阵(网络参数,初始值随机确定,训练过程中不断更新),qt和qp为注意力query向量(表示序列H中的每个特征为一个query向量)。
优选的,S2中,具体步骤为:
S2-1、使用跨模态注意力网络,计算待推荐资讯与历史点击资讯的跨模态相关性:
文本-文本注意力权重
Figure BDA0003985657600000031
文本-图像注意力权重
Figure BDA0003985657600000032
图像-文本注意力权重
Figure BDA0003985657600000033
图像-图像注意力权重
Figure BDA0003985657600000034
式中,权重值表示相关性的大小;Rt表示历史点击资讯的文本表示向量,
Figure BDA0003985657600000035
表示待推荐资讯的文本表示向量,Rp表示历史点击资讯的图像表示向量,
Figure BDA0003985657600000036
表示待推荐资讯的图像表示向量;
Figure BDA0003985657600000037
其中z=(z1,...,zK)∈RK
S2-2、用户向量表示u=Rt×(at,p+ap,p)+Rp×(ap,t+at,t)。
具体的,S3中,待推荐资讯得分
Figure BDA0003985657600000038
为:
Figure BDA0003985657600000039
式中,
Figure BDA00039856576000000310
表示待推荐资讯的文本表示向量,
Figure BDA00039856576000000311
表示待推荐资讯的图像表示向量,u为用户向量表示。
本发明还公开了一种基于多模态预训练模型的资讯推荐设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行本发明所述方法的步骤。
本发明的有益效果
本发明所使用的推荐方法,融合了多模态数据信息,并建立了跨模态注意力网络对多模态数据信息进行融合。以综合考虑多因素影响,实现用户感兴趣咨询的精准推送。
附图说明
图1为本发明的多模态编码的流程图
图2为本发明的资讯推荐流程图
具体实施方式
下面结合实施例对本发明作进一步说明,但本发明的保护范围不限于此:
结合图1,实施例给出了具体的多模态编码方法:
(1)准备输入数据
互联网平台展示的资讯,不仅包括文本,往往还包括图片或视频甚至混合了多种形式。用户对资讯感兴趣可能会对某条资讯感兴趣不单单因为标题或者文本内容,还可能是由于吸引人的封面图片或者视频内容。因此,推荐系统充分利用这些不同模态的信息可以使得推荐的效果更好。
文本模态数据包括资讯的标题、标签,并抽取资讯详细内容的关键词作为补充。
本发明采用KeyBERT模型抽取文本内容的关键词。KeyBERT是基于BERT预训练模型的关键词抽取方法,只需要预训练模型,不需要额外训练模型。
将标题、标签以及提取得到的内容关键词拼接作为文本模态的输入数据。
图像模态数据包括资讯的封面图片,对于视频内容,通过提取视频关键帧得到其图像数据。本发明利用FFmpeg工具按照固定时间间隔提取视频的关键帧。
(2)特征提取,分别得到文本的词序列和图像的特征表示向量序列
文本:分词,得到词序列。本发明使用jieba分词,得到一个词序列[w1,w2,...,wM],其中M为词序列中词的个数。
图像:对于一张图像来说,不同的区域所信息量也不尽相同,例如背景部分的信息量会比较少,所以,本发明首先利用预训练的MaskR-CNN模型抽取出资讯图像的感兴趣区域(ROI),然后利用ResNet-50模型对得到的ROI进行特征提取,得到特征序列[e1,e2,...,eN],其中N为ROI序列中的ROI个数。
(3)应用视觉语言预训练模型(如ViLBERT)获取文本和图像的内在关系
以往的方法在得到图像和文本特征之后会分别进行建模,但是这种方法忽视了文本和图像之间的关系,这种对应关系会帮助模型更好地理解内容并预测用户的兴趣。视觉语言模型可以有效地对文本与图像的跨模态关系表示建模。
将上一步得到的词序列[w1,w2,...,wM]和图像特征序列[e1,e2,...,eN]作为视觉语言预训练模型的输入,得到词表示序列
Figure BDA0003985657600000041
和ROI表示序列
Figure BDA0003985657600000042
(4)分别利用文本注意力网络和视觉注意力网络学习文本和图像的统一表示,得到文本和视觉的表示向量。
文本注意力权重的计算公式:
at=softmax(WtHt)Tqt
其中,Wt为参数矩阵,qt为注意力query向量。最终的文本表示向量为注意力权重与词表示序列的加权和,即rt=Ht×at
类似的,视觉注意力权重的计算公式:
ap=softmax(WpHp)Tqp
其中,Wp为参数矩阵,qp为注意力query向量。最终的图像表示向量为注意力权重与ROI表示序列的加权和,即rp=Hp×ap
结合图2,实施例给出了多模态资讯推荐方法。
(1)利用上述多模态资讯编码方法学习得到用户的历史浏览资讯的文本表示和图像表示,分别表示为
Figure BDA0003985657600000051
Figure BDA0003985657600000052
其中L为用户的历史点击资讯条数。
(2)首先,在用户的历史浏览资讯集中,可能只有一小部分与待推荐资讯相关,而与待推荐资讯不相关的历史浏览资讯不会提升推荐的效果,所以为了更加精准地对用户兴趣进行建模,需要根据与待推荐资讯的相关性来选择历史浏览资讯。此外,待推荐资讯与历史浏览资讯可能也会存在跨模态的关系。
基于上述考虑,为了更好地根据浏览历史对用户兴趣进行建模,本发明利用跨模态注意力网络,计算历史浏览资讯与待推荐资讯的跨模态相关性:计算文本-文本注意力权重
Figure BDA0003985657600000053
Figure BDA0003985657600000054
表示历史浏览咨询与待推荐资讯的文本与文本之间的相关性,类似的,历史浏览资讯的文本-图像注意力、图像-文本注意力和图像-图像注意力权重分别为
Figure BDA0003985657600000055
Figure BDA0003985657600000056
(3)根据以上权重计算得到统一用户向量表示,即用户兴趣建模
u=Rt×(at,p+ap,p)+Rp×(ap,t+at,t)
(4)计算待推荐资讯得分
Figure BDA0003985657600000057
通过softmax函数将得分标准化,将资讯点击预测转化为一个多分类任务。
本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (10)

1.一种基于多模态预训练模型的资讯推荐方法,其特征在于它包括以下步骤:
S1、对待推荐资讯、历史点击资讯集合中的内容分别进行多模态编码,获取待推荐资讯的文本表示向量、待推荐资讯的图像表示向量、历史点击资讯的文本表示向量、历史点击资讯的图像表示向量;
S2、将待推荐资讯的文本表示向量、待推荐资讯的图像表示向量、历史点击资讯的文本表示向量、历史点击资讯的图像表示向量输入跨模态注意力网络,获得用户向量表示;
S3、将待推荐资讯的文本表示向量、待推荐资讯的图像表示向量与用户向量表示结合,获得待推荐资讯的相关性得分;
S4、根据相关性得分对待排序资讯排序,得分高的资讯表示与用户兴趣更匹配,优先推荐高得分资讯,实现资讯推荐。
2.根据权利要求1所述的方法,其特征在于S1的具体步骤包括:
S1-1、输入数据准备,输入数据包资讯的文本模态数据和图像模态数据,其中:
抽取文本内容的关键词,将标题、标签、关键词拼接获得文本模态数据;
提取视频关键帧获得图像数据,资讯的封面图片、视频中提取的关键帧作为图像模态数据;
资讯包括待推荐资讯和历史点击资讯;
S1-2、特征提取,分别获得文本的词序列、图像特征序列;
S1-3、使用视觉语言预训练模型对文本特征序列和图像特征序列进行跨模态关系表示建模,获取词表示序列Ht和ROI表示序列Hp
S1-4、词表示序列通过文本注意力网络学习,获得文本表示向量;ROI表示序列通过视觉注意力网络学习,获得图像表示向量。
3.根据权利要求2所述的方法,其特征在于S1-2中,文本特征序列的获取方法为:使用jieba分词,得到一个词序列[w1,w2,...,wM],其中M为词序列中词的个数。
4.根据权利要求2所述的方法,其特征在于S1-2中,图像特征序列的获取方法为:
首先,利用预训练的MaskR-CNN模型获取图像的感兴趣区域;
然后,利用ResNet-50模型提取ROI特征,得到图像特征序列[e1,e2,...,eN],其中N为ROI序列中的ROI个数。
5.根据权利要求2所述的方法,其特征在于S1-3中,视觉语言预训练模型为ViLBERT,将S1-2获得的文本的词序列、图像特征序列作为视觉语言预训练模型的输入,获得视觉语言预训练模型的输出为词表示序列Ht和ROI表示序列Hp
6.根据权利要求2所述的方法,其特征在于S1-4中,具体的:
文本表示向量:rt=Ht×at,式中,at为文本注意力权重;
图像表示向量:rp=Hp×ap,式中,ap为视觉注意力权重。
7.根据权利要求6所述的方法,其特征在于:
at=softmax[(WtHt)Tqt]
ap=softmax[(WpHp)Tqp]
式中,Wt和Wp为参数矩阵,qt和qp为注意力query向量。
8.根据权利要求1所述的方法,其特征在于S2中,具体步骤为:
S2-1、使用跨模态注意力网络,计算待推荐资讯与历史点击资讯的跨模态相关性:
文本-文本注意力权重
Figure FDA0003985657590000021
文本-图像注意力权重
Figure FDA0003985657590000022
图像-文本注意力权重
Figure FDA0003985657590000023
图像-图像注意力权重
Figure FDA0003985657590000024
式中,权重值表示相关性的大小;Rt表示历史点击资讯的文本表示向量,
Figure FDA0003985657590000025
表示待推荐资讯的文本表示向量,Rp表示历史点击资讯的图像表示向量,
Figure FDA0003985657590000026
表示待推荐资讯的图像表示向量;
Figure FDA0003985657590000027
其中z=(z1,...,zK)∈RK
S2-2、用户向量表示u=Rt×(at,p+ap,p)+Rp×(ap,t+at,t)。
9.根据权利要求1所述的方法,其特征在于S3中,待推荐资讯得分
Figure FDA0003985657590000028
为:
Figure FDA0003985657590000029
式中,
Figure FDA00039856575900000210
表示待推荐资讯的文本表示向量,
Figure FDA00039856575900000211
表示待推荐资讯的图像表示向量,u为用户向量表示。
10.一种基于多模态预训练模型的资讯推荐设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述方法的步骤。
CN202211563461.0A 2022-12-07 2022-12-07 基于多模态预训练模型的资讯推荐方法及设备 Active CN115964560B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211563461.0A CN115964560B (zh) 2022-12-07 2022-12-07 基于多模态预训练模型的资讯推荐方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211563461.0A CN115964560B (zh) 2022-12-07 2022-12-07 基于多模态预训练模型的资讯推荐方法及设备

Publications (2)

Publication Number Publication Date
CN115964560A true CN115964560A (zh) 2023-04-14
CN115964560B CN115964560B (zh) 2023-10-27

Family

ID=87360802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211563461.0A Active CN115964560B (zh) 2022-12-07 2022-12-07 基于多模态预训练模型的资讯推荐方法及设备

Country Status (1)

Country Link
CN (1) CN115964560B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116932887A (zh) * 2023-06-07 2023-10-24 哈尔滨工业大学(威海) 一种基于多模态图卷积的影像推荐系统及方法
CN117290596A (zh) * 2023-09-20 2023-12-26 北京约来健康科技有限公司 用于多模态数据模型的推荐标签生成方法、装置、设备及介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125386A (zh) * 2019-12-02 2020-05-08 腾讯科技(北京)有限公司 媒体资源的处理方法和装置、存储介质及电子装置
CN111461175A (zh) * 2020-03-06 2020-07-28 西北大学 自注意与协同注意机制的标签推荐模型构建方法及装置
CN112232929A (zh) * 2020-11-05 2021-01-15 南京工业大学 一种多模态下的互补物品的多样性推荐列表生成方法
CN113033912A (zh) * 2021-04-16 2021-06-25 中国建设银行股份有限公司 问题解决人推荐方法及装置
CN113094534A (zh) * 2021-04-09 2021-07-09 陕西师范大学 一种基于深度学习的多模态图文推荐方法及设备
CN113807440A (zh) * 2021-09-17 2021-12-17 北京百度网讯科技有限公司 利用神经网络处理多模态数据的方法、设备和介质
CN113935401A (zh) * 2021-09-18 2022-01-14 北京三快在线科技有限公司 物品信息的处理方法、装置、服务器及存储介质
CN114154054A (zh) * 2021-10-21 2022-03-08 北京邮电大学 基于多头自注意神经机制的多模态新闻推荐方法及装置
CN114329004A (zh) * 2021-09-26 2022-04-12 腾讯科技(深圳)有限公司 数字指纹生成、数据推送方法、装置和存储介质
US20220222920A1 (en) * 2020-05-07 2022-07-14 Tencent Technology (Shenzhen) Company Limited Content processing method and apparatus, computer device, and storage medium
CN114840705A (zh) * 2022-04-27 2022-08-02 中山大学 一种基于多模态预训练模型的组合商品检索方法及系统
CN115329127A (zh) * 2022-07-22 2022-11-11 华中科技大学 一种融合情感信息的多模态短视频标签推荐方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125386A (zh) * 2019-12-02 2020-05-08 腾讯科技(北京)有限公司 媒体资源的处理方法和装置、存储介质及电子装置
CN111461175A (zh) * 2020-03-06 2020-07-28 西北大学 自注意与协同注意机制的标签推荐模型构建方法及装置
US20220222920A1 (en) * 2020-05-07 2022-07-14 Tencent Technology (Shenzhen) Company Limited Content processing method and apparatus, computer device, and storage medium
CN112232929A (zh) * 2020-11-05 2021-01-15 南京工业大学 一种多模态下的互补物品的多样性推荐列表生成方法
CN113094534A (zh) * 2021-04-09 2021-07-09 陕西师范大学 一种基于深度学习的多模态图文推荐方法及设备
CN113033912A (zh) * 2021-04-16 2021-06-25 中国建设银行股份有限公司 问题解决人推荐方法及装置
CN113807440A (zh) * 2021-09-17 2021-12-17 北京百度网讯科技有限公司 利用神经网络处理多模态数据的方法、设备和介质
CN113935401A (zh) * 2021-09-18 2022-01-14 北京三快在线科技有限公司 物品信息的处理方法、装置、服务器及存储介质
CN114329004A (zh) * 2021-09-26 2022-04-12 腾讯科技(深圳)有限公司 数字指纹生成、数据推送方法、装置和存储介质
CN114154054A (zh) * 2021-10-21 2022-03-08 北京邮电大学 基于多头自注意神经机制的多模态新闻推荐方法及装置
CN114840705A (zh) * 2022-04-27 2022-08-02 中山大学 一种基于多模态预训练模型的组合商品检索方法及系统
CN115329127A (zh) * 2022-07-22 2022-11-11 华中科技大学 一种融合情感信息的多模态短视频标签推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZHENHUA HUANG 等: "Multimodal Representation Learning for Recommendation in Internet of Things", IEEE INTERNET OF THINGS JOURNAL, vol. 6, no. 6, pages 10675, XP011760781, DOI: 10.1109/JIOT.2019.2940709 *
李志峰 等: "融合覆盖机制的多模态神经机器翻译", 中文信息学报, vol. 34, no. 03, pages 44 - 55 *
郭斌 等: "基于群智数据的情境关联旅游路线推荐", 郑州大学学报(理学版), vol. 52, no. 02, pages 22 - 28 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116932887A (zh) * 2023-06-07 2023-10-24 哈尔滨工业大学(威海) 一种基于多模态图卷积的影像推荐系统及方法
CN117290596A (zh) * 2023-09-20 2023-12-26 北京约来健康科技有限公司 用于多模态数据模型的推荐标签生成方法、装置、设备及介质

Also Published As

Publication number Publication date
CN115964560B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
CN111581510B (zh) 分享内容处理方法、装置、计算机设备和存储介质
US11893071B2 (en) Content recommendation method and apparatus, electronic device, and storage medium
WO2021179640A1 (zh) 一种基于图模型的短视频推荐方法、和智能终端和存储介质
CN111339415B (zh) 一种基于多交互式注意力网络的点击率预测方法与装置
CN112765486B (zh) 一种融合知识图谱的注意力机制的电影推荐方法
CN110737801A (zh) 内容分类方法、装置、计算机设备和存储介质
CN112119388A (zh) 训练图像嵌入模型和文本嵌入模型
CN115964560B (zh) 基于多模态预训练模型的资讯推荐方法及设备
CN113297370B (zh) 基于多交互注意力的端到端多模态问答方法及系统
CN110659411B (zh) 一种基于神经注意力自编码器的个性化推荐方法
CN110083729B (zh) 一种图像搜索的方法及系统
WO2021139415A1 (zh) 数据处理方法、装置、计算机可读存储介质及电子设备
CN106169083B (zh) 基于视觉特征的电影推荐方法和系统
CN112074828A (zh) 训练图像嵌入模型和文本嵌入模型
CN113239159B (zh) 基于关系推理网络的视频和文本的跨模态检索方法
CN111985520A (zh) 一种基于图卷积神经网络的多模态分类方法
CN109918162B (zh) 一种可学习的海量信息高维图形交互式展示方法
CN113590965B (zh) 一种融合知识图谱与情感分析的视频推荐方法
CN115640449A (zh) 媒体对象推荐方法、装置、计算机设备和存储介质
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
CN116977701A (zh) 视频分类模型训练的方法、视频分类的方法和装置
CN116010696A (zh) 融合知识图谱和用户长短期兴趣的新闻推荐方法、系统及介质
CN114647787A (zh) 一种基于多模态数据的用户个性化推荐方法
CN116955599A (zh) 一种类目确定的方法、相关装置、设备以及存储介质
Xiong et al. An intelligent film recommender system based on emotional analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant