CN110489574A - 一种多媒体信息推荐方法、装置和相关设备 - Google Patents

一种多媒体信息推荐方法、装置和相关设备 Download PDF

Info

Publication number
CN110489574A
CN110489574A CN201910718067.1A CN201910718067A CN110489574A CN 110489574 A CN110489574 A CN 110489574A CN 201910718067 A CN201910718067 A CN 201910718067A CN 110489574 A CN110489574 A CN 110489574A
Authority
CN
China
Prior art keywords
interest
user
degree
multimedia messages
undetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910718067.1A
Other languages
English (en)
Other versions
CN110489574B (zh
Inventor
孟健
程万军
何光宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201910718067.1A priority Critical patent/CN110489574B/zh
Publication of CN110489574A publication Critical patent/CN110489574A/zh
Application granted granted Critical
Publication of CN110489574B publication Critical patent/CN110489574B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Multimedia (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种多媒体信息推荐方法、装置和相关设备,在获取待推荐的多媒体信息之后,可以确定多媒体信息的目标特征,所述目标特征包括文本特征、图片特征或视频特征中的至少两种特征;然后,根据多媒体信息的目标特征、待定用户的用户特征和目标模型参数,确定待定用户对所述多媒体信息的兴趣度。最后,将兴趣度满足预设条件的待定用户作为目标用户,并向目标用户推荐多媒体信息。该方法通过将多媒体信息的文本特征、图片特征或视频特征中的至少两种特征,作为表征该多媒体信息的目标特征,可以使得目标特征更完整的表征所述多媒体信息的内容。进而提高了后续个性化推荐的准确性。

Description

一种多媒体信息推荐方法、装置和相关设备
技术领域
本申请涉及数据处理领域,特别是涉及一种多媒体信息推荐方法、装置和相关设备。
背景技术
用户可以通过社交网络浏览多媒体信息,如阅读、播放多媒体信息等。其中,所述多媒体信息可以是一种包括多种表现形式的内容,比如一条包括文字、图片的信息可以为多媒体消息。在浏览的过程中,社交网络应用可以为用户推荐多媒体信息。以期望将用户感兴趣的多媒体信息推荐给用户,提高用户的浏览体验。
目前,为用户进行个性化推荐的主要方法为:应用多媒体信息的文本特征来表征该多媒体信息,进而通过文本特征确定该多媒体信息是否符合用户的兴趣。
然而,由于多媒体信息除文本内容外通常还包括其他类型的内容,由此,仅基于文本特征无法完整的表征多媒体信息的全部内容,进而降低了后续为用户确定该多媒体信息是否符合其兴趣的准确性。
发明内容
为了解决上述技术问题,本申请提供了一种多媒体信息推荐方法、装置和相关设备,提高了个性化推荐的准确性。
本申请实施例公开了如下技术方案:
在本申请实施例第一方面,提供了一种多媒体信息推荐方法,所述方法包括:
获取待推荐的多媒体信息;
确定所述多媒体信息的目标特征,所述目标特征包括文本特征、图片特征或视频特征中的至少两种特征;
根据所述目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,所述目标模型参数是通过预先训练的兴趣度模型得到的;
将兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息。
可选的,所述确定所述多媒体信息的目标特征,包括:
从所述多媒体信息中提取文本数据、图片数据或视频数据;
将提取的文本数据、图片数据、视频数据分别输入到对应的特征提取模型,确定所述文本特征、所述图片特征、所述视频特征;
将所述文本特征、所述图片特征、所述视频特征中的至少两种特征组成所述多媒体信息的目标特征。
可选的,所述将所述文本特征、所述图片特征、所述视频特征中的至少两种特征组成所述多媒体信息的目标特征,包括:
根据所述文本特征、所述图片特征、所述视频特征在所述多媒体信息中的位置排列顺序,将每种目标特征排列组合成所述多媒体信息的整体特征向量。
可选的,所述兴趣度模型包括第一兴趣度模型,所述第一兴趣度模型为如下公式:
IR=1/(1+eA·X·F);
其中,IR为历史用户对所感兴趣的历史多媒体信息的兴趣度,A为所述历史用户的用户特征,X为模型参数,F为所述历史多媒体信息的目标特征。
可选的,所述目标模型参数通过下述方法得到:
根据n维训练样本矩阵对所述兴趣度模型进行m次训练,每次训练得到一个n维兴趣度矩阵,其中,任意一次训练得到的n维兴趣度矩阵中的一维元素用于体现本次训练中的一条训练样本的兴趣度;所述n维训练样本矩阵包括n条训练样本,所述训练样本是根据历史用户的用户特征和所述历史用户感兴趣的历史多媒体信息的目标特征确定的;
从m个n维兴趣度矩阵中确定总兴趣度值最大的n维兴趣度矩阵为目标矩阵;其中,一个n维兴趣度矩阵的总兴趣度值为这个n维兴趣度矩阵中所有元素的和;
确定所述兴趣度模型在得到所述目标矩阵时的模型参数为所述目标模型参数。
可选的,所述根据所述目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,包括:
将所述目标特征、待定用户的用户特征和目标模型参数输入至IR'=1/(1+eA '·X'·F'),计算得到所述待定用户对所述多媒体信息的兴趣度,其中,IR'为所述待定用户对所述多媒体信息的兴趣度,A'为所述待定用户的用户特征,X'为所述目标模型参数,F'为所述多媒体信息的目标特征。
可选的,所述兴趣度模型还包括第二兴趣度模型,所述第二兴趣度模型为如下公式:
FIR=1/(1+eAt·T·Ft)×wf+IR×wr
FIR为所述历史用户对历史转发多媒体信息的转发兴趣度,At为所述历史用户的转发特征,T为模型转发参数,Ft为所述历史转发多媒体信息的目标特征,wf为转发权重,IR为所述历史用户对所述历史转发多媒体信息的阅读兴趣度,wr为阅读权重;所述转发权重wf和所述阅读权重wr是预先设置的;
其中,当所述历史转发多媒体信息为所述历史用户阅读过的历史多媒体信息时,Ar为所述历史用户的阅读特征,X1'为目标阅读参数,所述目标阅读参数是通过训练所述第一兴趣度模型得到的;当所述历史转发多媒体信息为所述历史用户未阅读过的历史多媒体信息时,IR=0。
可选的,所述根据所述目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,包括:
当所述待定用户的用户特征包括阅读特征和转发特征时,根据计算所述待定用户对所述多媒体信息的转发兴趣度,FIR'为所述待定用户对所述多媒体信息的转发兴趣度,At'为所述待定用户的转发特征,T'为所述目标转发参数,F'为所述多媒体信息的目标特征,Ar'为所述待定用户的阅读特征;
所述将兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息,包括:
将转发兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息。
在本申请实施例第二方面,提供了一种多媒体信息推荐装置,所述装置包括:
获取单元,用于获取待推荐的多媒体信息;
第一确定单元,用于确定所述多媒体信息的目标特征,所述目标特征包括文本特征、图片特征或视频特征中的至少两种特征;
第二确定单元,用于根据所述目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,所述目标模型参数是通过预先训练的兴趣度模型得到的;
推荐单元,用于将兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息。
可选的,所述第一确定单元,具体用于:
从所述多媒体信息中提取文本数据、图片数据或视频数据;
将提取的文本数据、图片数据、视频数据分别输入到对应的特征提取模型,确定所述文本特征、所述图片特征、所述视频特征;
将所述文本特征、所述图片特征、所述视频特征中的至少两种特征组成所述多媒体信息的目标特征。
可选的,所述第一确定单元,还具体用于:
根据所述文本特征、所述图片特征、所述视频特征在所述多媒体信息中的位置排列顺序,将每种目标特征排列组合成所述多媒体信息的整体特征向量。
可选的,所述兴趣度模型包括第一兴趣度模型,所述第一兴趣度模型为如下公式:
IR=1/(1+eA·X·F);
其中,IR为历史用户对所感兴趣的历史多媒体信息的兴趣度,A为所述历史用户的用户特征,X为模型参数,F为所述历史多媒体信息的目标特征。
可选的,所述第二确定单元,具体用于:
根据n维训练样本矩阵对所述兴趣度模型进行m次训练,每次训练得到一个n维兴趣度矩阵,其中,任意一次训练得到的n维兴趣度矩阵中的一维元素用于体现本次训练中的一条训练样本的兴趣度;所述n维训练样本矩阵包括n条训练样本,所述训练样本是根据历史用户的用户特征和所述历史用户感兴趣的历史多媒体信息的目标特征确定的;
从m个n维兴趣度矩阵中确定总兴趣度值最大的n维兴趣度矩阵为目标矩阵;其中,一个n维兴趣度矩阵的总兴趣度值为这个n维兴趣度矩阵中所有元素的和;
确定所述兴趣度模型在得到所述目标矩阵时的模型参数为所述目标模型参数。
可选的,所述第二确定单元,还具体用于:
将所述目标特征、待定用户的用户特征和目标模型参数输入至IR'=1/(1+eA '·X'·F'),计算得到所述待定用户对所述多媒体信息的兴趣度,其中,IR'为所述待定用户对所述多媒体信息的兴趣度,A'为所述待定用户的用户特征,X'为所述目标模型参数,F'为所述多媒体信息的目标特征。
可选的,所述兴趣度模型还包括第二兴趣度模型,所述第二兴趣度模型为如下公式:
FIR=1/(1+eAt·T·Ft)×wf+IR×wr
FIR为所述历史用户对历史转发多媒体信息的转发兴趣度,At为所述历史用户的转发特征,T为模型转发参数,Ft为所述历史转发多媒体信息的目标特征,wf为转发权重,IR为所述历史用户对所述历史转发多媒体信息的阅读兴趣度,wr为阅读权重;所述转发权重wf和所述阅读权重wr是预先设置的;
其中,当所述历史转发多媒体信息为所述历史用户阅读过的历史多媒体信息时,Ar为所述历史用户的阅读特征,X1'为目标阅读参数,所述目标阅读参数是通过训练所述第一兴趣度模型得到的;当所述历史转发多媒体信息为所述历史用户未阅读过的历史多媒体信息时,IR=0。
可选的,所述第二确定单元,还具体用于:
当所述待定用户的用户特征包括阅读特征和转发特征时,根据计算所述待定用户对所述多媒体信息的转发兴趣度,FIR'为所述待定用户对所述多媒体信息的转发兴趣度,At'为所述待定用户的转发特征,T'为所述目标转发参数,F'为所述多媒体信息的目标特征,Ar'为所述待定用户的阅读特征;
则,所述推荐单元,具体用于:
将转发兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息。
在本申请实施例第三方面,提供了一种计算机可读存储介质,所述机算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行第一方面所述的多媒体信息推荐的方法。
在本申请实施例第四方面,提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行第一方面所述的多媒体信息推荐的方法
由上述技术方案可以看出,在获取待推荐的多媒体信息之后,可以确定所述多媒体信息的目标特征,其中,所述目标特征包括文本特征、图片特征或视频特征中的至少两种特征;然后,可以根据所述多媒体信息的目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,其中,目标模型参数是通过预先训练的兴趣度模型得到的。最后,将兴趣度满足预设条件的待定用户作为目标用户,并向目标用户推荐多媒体信息。可见,该方法通过将多媒体信息的文本特征、图片特征或视频特征中的至少两种特征,作为表征该多媒体信息的目标特征。从而,可以使得目标特征更完整的表征所述多媒体信息的内容。进而,能够在后续步骤中基于更完整表征所述多媒体信息的目标特征,来确定是否将其推荐给用户,提高了个性化推荐的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种多媒体信息推荐方法的流程图;
图2a为本申请实施例提供的一种确定多媒体信息的文本特征的方法示意图;
图2b为本申请实施例提供的一种确定多媒体信息的图片特征的方法示意图;
图2c为本申请实施例提供的一种确定多媒体信息的视频特征的方法示意图;
图3为本申请实施例提供的一种组成多媒体信息的目标特征的方法示意图;
图4为本申请实施例提供的一种得到历史阅读特征的方法示意图;
图5为本申请实施例提供的一种计算待定用户对多媒体信息的阅读兴趣度的方法示意图;
图6为本申请实施例提供的一种多媒体信息推荐装置的结构图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
目前,主要应用多媒体信息的文本特征来表征该多媒体信息,从而通过该文本特征确定该多媒体信息是否符合用户的兴趣。然而,由于多媒体信息除文本内容外通常还包括其他类型的内容,由此,仅基于文本特征无法完整的表征多媒体信息的全部内容,从而降低了后续为用户确定该多媒体信息是否符合其兴趣的准确性。
为此,本申请实施例提供了一种多媒体信息推荐方法,以希望通过将多媒体信息的文本特征、图片特征或视频特征中的至少两个特征,作为表征该多媒体信息的目标特征。由此使得目标特征能够更完整的表征所述多媒体信息的内容。从而,在后续步骤中可以基于更能完整表征所述多媒体信息的目标特征,来确定是否将其推荐给用户,进而提高了后续个性化推荐的准确性。
首先,对本申请实施例的应用场景进行介绍。该方法可以应用到终端设备中,终端设备例如可以是智能终端、计算机、个人数字助理(Personal Digital Assistant,简称PDA)、平板电脑等设备。
所述多媒体信息推荐方法还可以应用到服务器中,服务器是向终端设备提供多媒体信息推荐服务的设备,终端设备可以将待推荐的多媒体信息上传给服务器,服务器利用本申请实施例提供的多媒体信息推荐方法确定目标用户,并向目标用户推荐所述多媒体信息。其中,服务器可以是独立的服务器,也可以是集群中的服务器。
下面结合附图对本申请实施例提供的多媒体信息推荐方法进行介绍。
参见图1,该图示出了本申请实施例提供的一种多媒体信息推荐方法的流程图,所述方法包括:
S101:获取待推荐的多媒体信息。
所述多媒体信息可以是一种包括多种形式内容的媒体信息,所述多媒体信息中的形式包括文本、图片或视频等。在实际场景中,所述多媒体信息比如可以是一条包括文本内容和图片内容的博客等。
在本申请实施例中,可以获取待推荐的多媒体信息。这里所述的待推荐的多媒体信息可以是指有待推荐给对其感兴趣的用户的多媒体信息。
S102:确定所述多媒体信息的目标特征。
在接收到该待推荐的多媒体信息后,可以确定该多媒体信息的目标特征。其中,所述目标特征可以用于表征多媒体信息中每种形式的内容,且所述目标特征可以包括文本特征、图片特征或视频特征中的至少两种特征。其中,所述文本特征可以是表征多媒体信息中的文本内容的特征;所述图片特征可以是表征多媒体信息中的图片内容的特征;所述视频特征可以是表征多媒体信息中的视频内容的特征。这样,确定出的该多媒体信息的目标特征可以更完整的体现该多媒体信息的内容。
S103:根据所述目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度。
在确定出多媒体信息的目标特征后,可以根据该待推荐多媒体信息的目标特征、待定用户的用户特征和目标模型参数,确定出该待定用户对该多媒体信息的兴趣度。
其中,所述待定用户的用户特征可以体现所述待定用户感兴趣的多媒体信息内容。所述目标模型参数可以是通过预先训练的兴趣度模型得到的。
在实际场景中,通常包括多个待定用户,比如使用一个社交网站的多个待定用户。这样,可以通过S103的方法为每个待定用户分别确定其对该条多媒体信息的兴趣度。
S104:将兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息。
预设条件可以是用于表示待定用户对多媒体信息感兴趣的条件,例如:预设条件为待定用户对多媒体信息的兴趣度大于0.7。
在确定出待定用户对多媒体信息的兴趣度后,可以将兴趣度满足预设条件的待定用户作为目标用户,并向目标用户推荐所述多媒体信息。举例来说,假设预设条件为待定用户对多媒体信息的兴趣度大于0.7,在确定一待定用户对一多媒体信息的兴趣度为0.8时,可以表示该待定用户对该多媒体信息感兴趣,进而可以将该待定用户作为目标用户,并向目标用户推荐所述多媒体信息。
接下来,对本实施例提供的多媒体信息推荐方法进行举例说明:假设待定用户分别为:待定用户A、待定用户B、待定用户C,预设条件为兴趣度大于d。
当获取一条待推荐的多媒体信息m时,所述多媒体信息m中包括文本、图片和视频内容。那么,在获取所述多媒体信息m后,可以为其确定目标特征,其中,假设确定出的目标特征包括文本特征和视频特征。接下来,针对于待定用户A、待定用户B和待定用户C,可以根据多媒体信息m的目标特征、每个待定用户的用户特征和目标模型参数x,为每个待定用户确定它们分别对多媒体信息m的兴趣度,即:可以确定出待定用户A对多媒体信息m的兴趣度a、待定用户B对多媒体信息m的兴趣度b和待定用户C对多媒体信息m的兴趣度c。
假设在上述三个待定用户(待定用户A、待定用户B和待定用户C)中包括待定用户B和待定用户C对多媒体信息m的兴趣度大于d,即:b>d,c>d。则表示待定用户B和待定用户C对多媒体信息m感兴趣,如此,可以将待定用户B和待定用户C都作为目标用户,并将该多媒体信息m分别推荐给待定用户B和待定用户C。
由上述技术方案可以看出,在获取待推荐的多媒体信息之后,可以确定所述多媒体信息的目标特征,其中,所述目标特征包括文本特征、图片特征或视频特征中的至少两种特征;然后,可以根据所述多媒体信息的目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,其中,目标模型参数是通过预先训练的兴趣度模型得到的。最后,将兴趣度满足预设条件的待定用户作为目标用户,并向目标用户推荐多媒体信息。确定是否将所述多媒体信息推荐给用户。可见,该方法通过将多媒体信息的文本特征、图片特征或视频特征中的至少两种特征,作为表征该多媒体信息的目标特征。从而,可以使得目标特征更完整的表征所述多媒体信息的内容。进而,能够在后续步骤中基于更完整表征所述多媒体信息的目标特征,来确定是否将其推荐给用户,提高了个性化推荐的准确性。
需要说明,本申请实施例不限定S102中确定多媒体信息的目标特征的方法,为了提升多媒体信息的目标特征的确定效率,在一种可能的实现方式中,可以应用神经网络模型来确定,则,所述S102的方法可以包括:
S201:从所述多媒体信息中提取文本数据、图片数据或视频数据。
其中,所述文本数据可以是对应多媒体信息中文本内容的数据,所述图片数据可以是对应多媒体信息中图片内容的数据,所述视频数据可以是对应于多媒体信息中视频内容的数据。
在本申请实施例中,可以从多媒体信息中提取出文本数据、图片数据和视频数据。
在具体实现中,从多媒体信息中提取出文本数据的方式比如可以如下:
可以对提取的文本内容进行分词操作,从而得到文本内容的全部分词。其中,所述分词的操作可以是将文本内容划分为字或词,得到的这些字和词可以是对文本内容进行分词操作后得到的各个分词。需要说明,根据文本内容所得到的分词具有先后顺序,它们的顺序是根据这些分词在文本内容中的位置决定的。例如:假设文本内容包括“篮球明星姚明”,对该短语进行分词后可以得到“篮球、明星、姚明”这三个分词,且根据这三个分词在文本内容中的位置,可以得到这三个分词的先后顺序关系,即分词“篮球”的顺序先于分词“明星”,分词“明星”的顺序先于分词“姚明”,而不能是其他的先后顺序,如分词“明星”的顺序先于分词“篮球”的顺序即是错误的。
针对于得到的这些分词,其中可能包括有停用词,其中,所述停用词可以是没有实际意义的词语,如“然后”、“一般”等。由于其中的停用词通常无实际意义,因此可以将它们去除,得到保留下来的字或词,可以将这些保留下来的字或词的组合作为文本内容保留词集合。需要说明,文本内容保留词集合中的保留词之间也具有先后顺序关系。
然后,可以根据文本内容保留词集合中的保留词间的先后顺序关系,对它们进行编号。如文本内容保留词集合中包括t个保留词,可以将它们分别记为:保留词1、保留词2、......保留词t。接下来,可以为该文本内容保留词集合中的每个保留词采用词频-逆文本频率(Term Frequency-Inverse Document Frequency,TF-IDF)等方式,以将其转换为对应的词向量的形式。则,得到的该文本内容保留词集合中保留词的词向量即可以是该条多媒体信息的文本数据。
另外,可以将多媒体信息中的图片提取出来,生成该条多媒体信息中全部图片的图片数据,其中,生成的图片数据中包括多媒体信息中图片的先后位置信息。相应的,可以将多媒体信息中的视频提取出来,并生成该条多媒体信息中全部视频的视频数据,其中,生成的视频数据中包括多媒体信息中视频的先后位置信息。
S202:将提取的文本数据、图片数据、视频数据分别输入到对应的特征提取模型,确定所述文本特征、所述图片特征、所述视频特征。
在本申请实施例中,可以预先建立用于提取多媒体信息中文本特征的文本特征提取模型,以使其可以实现根据多媒体信息中的文本数据提取对应的文本特征的功能。以及,可以预先建立用于提取多媒体信息中图片特征的图片特征提取模型,以使其可以实现根据多媒体信息中的图片数据提取对应的图片特征的功能。此外,还可以预先建立用于提取多媒体信息中视频特征的视频特征提取模型,以使其可以实现根据多媒体信息中的视频数据提取对应的视频特征的功能。
这样,可以将提取的文本数据输入至对应的文本特征提取模型,确定出该多媒体信息的文本特征,可以将提取的图片数据输入至对应的特征提取模型,确定出该多媒体信息的图片特征,可以将提取的视频数据输入至对应的视频提取模型,确定出该多媒体信息的视频特征。
在具体实现中,预先训练有循环神经网络(Recurrent Neural Network,RNN)模型1,作为文本特征提取模型;预先训练有二维卷积神经网络(2Dimensiona ConvolutionalNeural Network,2D CNN),作为图片特征提取模型;以及,预先训练有三维卷积神经网络(3Dimensiona Convolutional Neural Network,2D CNN),作为视频特征提取模型。
下面结合实际场景介绍S202的具体实现过程。
参见图2a,该图示出了本申请实施例提供的一种确定多媒体信息的文本特征的方法示意图。其中,根据多媒体信息的文本数据和RNN模型1确定多媒体信息的文本特征的方法可以如下:
如图2a所示,针对于前述的文本内容保留词集合,可以按照其中的保留词的先后顺序,将每个保留词(保留词1、保留词2、......保留词t)对应的词向量依次输入至文本特征提取模型(RNN模型1)中。需要说明,RNN模型1内部包括状态值Bi,i=1,2……t,所述状态值Bi是根据上一次输入的保留词i-1计算得到的状态值,且其中包括有保留词i-1的信息。这样,在此次向RNN模型1输入保留词i时,可以根据该输入的保留词i和当前的状态值Bi-1,对保留词i进行处理,也就是说,在对保留词i进行处理时,还加入状态值Bi-1,即考虑了保留词i-1(保留词i的上一个保留词)对保留词i的影响。
其中,由于在保留词1之前没有保留词对其产生影响,因此可以将RNN模型1中的初始状态值B0设置为0。
这样,在将t个保留词对应的词向量依次输入RNN模型1后,可以得到最终的状态值Bt,可以理解,状态值Bt中包括全部保留词的信息,由此可以将最终得到的状态值Bt作为根据文本内容确定的文本特征。
参见图2b,该图示出了本申请实施例提供的一种确定多媒体信息的图片特征的方法示意图。如图2b所示,针对于多媒体信息的图片数据,可以将其输入至图片特征提取模型(2D CNN模型)中进行特征提取,并将得到的特征向量Ct作为图片数据对应的图片特征。
参见图2c,该图示出了本申请实施例提供的一种确定多媒体信息的视频特征的方法示意图,如图2c所示,针对于多媒体信息中的视频数据,可以将其输入至视频特征提取模型(3D CNN模型)中进行特征提取,并将得到的特征向量Dt作为视频内容对应的视频特征。
S203:将所述文本特征、所述图片特征、所述视频特征中的至少两种特征组成所述多媒体信息的目标特征。
针对于S203的方法,为了保证目标特征可以更准确的体现多媒体信息的内容,在一种可能的实现方式中,可以根据文本特征、图片特征、视频特征在多媒体信息中的位置排列顺序,将每种目标特征排列组合成多媒体信息的整体特征向量,由于是根据特征、图片特征和视频特征在多媒体信息中的位置排列顺序得到的目标特征,可以使得目标特征更准确的体现多媒体信息的内容。
举例来说:参见图3,该图示出了本申请实施例提供的一种组成多媒体信息的目标特征的方法示意图,如图3所示,假设目标特征包括文本特征、图片特征和视频特征这三种目标特征,确定出的文本特征、图片特征和视频特征分别为Bt、Ct和Dt,且多媒体信息中的文本特征、图片特征和视频特征的位置关系为:文本特征的位置先于视频特征、视频特征的位置先于图片特征,这样,根据它们的位置关系,在将这三种目标特征进行向量叠加后,确定整体特征向量F可以为BtDtCt。
其中,S103中的目标模型参数是通过预先训练的兴趣度模型得到的,需要说明,本申请实施例不限定兴趣度模型的具体形式,可以根据适合的兴趣度模型训练得到适合的目标模型参数。
本申请实施例提供了两种兴趣度模型,以及提供了通过训练每种兴趣度模型得到目标模型参数的方法,接下来对这两种兴趣度模型及通过训练模型得到目标模型参数的方法进行介绍。
在一种可能的实现方式中,兴趣度模型可以包括第一兴趣度模型,该第一兴趣度模型为如下公式:IR=1/(1+eA·X·F);其中,IR为历史用户对所感兴趣的历史多媒体信息的兴趣度,A为所述历史用户的用户特征,X为模型参数,F为所述历史多媒体信息的目标特征。需要说明,A·X·F可以对应于点积计算。
其中,训练兴趣度模型得到目标模型参数的方法可以如下:
S301:根据n维训练样本矩阵对兴趣度模型进行m次训练,每次训练得到一个n维兴趣度矩阵。
在本申请实施例中,可以基于历史用户的用户特征和所述历史用户感兴趣的历史多媒体信息的目标特征,确定用于训练兴趣度模型的训练样本。具体的,比如一条训练样本可以包括一个历史用户的用户特征和该历史用户感兴趣的一条历史多媒体信息的目标特征。通过该种方式,可以确定出n条训练样本,并根据这n条训练样本得到一个n维训练样本矩阵。
接下来,可以根据确定出的n维训练样本矩阵对兴趣度模型进行m次训练,具体实现中,在第一次训练时,系统内部会初始设置模型参数,在将n维训练样本矩阵输入兴趣度模型后,可以基于设置的模型参数,计算并输出该n维训练样本矩阵中每条训练样本对应的兴趣度,即得到n个兴趣度,其中,该n维训练样本矩阵中每条训练样本对应的兴趣度,可以是以n维兴趣度矩阵的形式输出的,且n维兴趣度矩阵中的一维元素用于体现本次训练中的一条训练样本的兴趣度。
为了加深理解,对n维兴趣度矩阵中一维元素体现本次训练中一条训练样本的兴趣度进行举例说明:假设n=3,则3维训练样本矩阵中包括3条训练样本:训练样本1、训练样本2和训练样本3,在通过该3维训练样本矩阵对第一兴趣度模型训练一次时,可以得到一个3维兴趣度矩阵,该3维兴趣度矩阵中包括3个一维元素:a,b和c。其中,每个一维元素体现本次训练中一条训练样本的兴趣度,也就是说,一维元素a可以体现本次训练中训练样本1的兴趣度,若训练样本1中包括历史用户1的用户特征和该历史用户1感兴趣的历史多媒体信息1的目标特征,则该一维元素a即体现本次训练中历史用户1对历史多媒体信息1的兴趣度。
相应的,在之后的每次训练中,系统内部会自动调整模型参数,当将n维训练样本矩阵输入至兴趣度模型后,可以根据本次兴趣度模型的模型参数,计算输出一个对应的n维兴趣度矩阵。
如此,可以根据n维训练样本矩阵对兴趣度模型进行m次训练,每次训练都对应系统设置的模型参数,基于每次训练的模型参数都输出一个对应的n维兴趣度矩阵。可以理解,在对兴趣度模型完成m次训练后,可以得到m个n维兴趣度矩阵。
S302:从m个n维兴趣度矩阵中确定总兴趣度值最大的n维兴趣度矩阵为目标矩阵。
其中,由于一个n维兴趣度矩阵中的一维元素用于体现本次训练中的一条训练样本的兴趣度,因此,可以将一个n维兴趣度矩阵中所有元素的和(即n条训练样本对应的兴趣度的和)作为该n维兴趣度矩阵的总兴趣度值。
这样,针对于进行m次训练后得到的m个n维兴趣度矩阵,可以得到m个n维兴趣度矩阵对应的总兴趣度值。
可以从这m个n维兴趣度矩阵中确定出总兴趣度值最大的n维兴趣度矩阵,作为目标矩阵。举例来说,假设对兴趣度模型进行4次训练后得到的4个n维兴趣度矩阵为:n维兴趣度矩阵1、n维兴趣度矩阵2、n维兴趣度矩阵3和n维兴趣度矩阵4,这四个n维兴趣度矩阵对应的总兴趣度值分别为:4.1、5.2、4.8、5.6。则,由于n维兴趣度矩阵4的总兴趣度值最大,可以将n维兴趣度矩阵4作为目标矩阵。
S303:确定所述兴趣度模型在得到所述目标矩阵时的模型参数为所述目标模型参数。
由于训练样本是基于历史用户和所述历史用户感兴趣的历史多媒体信息确定的,因此,每条训练样本对应的兴趣度应当尽可能大。进一步说,通过n维训练样本矩阵对兴趣度模型进行m次训练,在得到总兴趣度值最大的目标矩阵时兴趣度模型的模型参数应当为最准确的模型参数。基于此,可以确定兴趣度模型在得到目标矩阵时的模型参数为目标模型参数。通过该种方法,即得到了目标模型参数。
在具体实现中,可以通过上述方法对第一兴趣度模型进行训练,以得到目标模型参数。其中,为了便于和后面的训练第二兴趣度模型的训练样本进行区分,可以将训练第一兴趣度模型的训练样本记为第一训练样本。
需要说明,当应用不同的第一训练样本训练第一兴趣度模型时,可以得到不同的目标模型参数。
具体的,当历史用户的用户特征包括历史阅读特征,所述历史用户感兴趣的历史多媒体信息包括所述历史用户阅读过的历史多媒体信息时,可以根据历史用户的历史阅读特征和所述历史用户阅读多的历史多媒体信息的目标特征确定第一训练样本,这样训练得到的目标模型参数为目标阅读参数。
或者,当历史用户的用户特征包括历史转发特征,所述历史用户感兴趣的历史多媒体信息包括所述历史用户转发过的历史多媒体信息时,可以根据历史用户的历史转发特征和所述历史用户转发过的历史多媒体信息的目标特征确定第一训练样本,这样训练得到的目标模型参数为第一转发参数。
上述描述说明了兴趣度模型的训练方法。可以看出,在进行模型训练时会应用到历史用户的用户特征和多媒体信息的目标特征。其中,历史多媒体信息的目标特征的确定方式如前述S201-S203提供的方法,此处不再赘述。下面对确定历史用户的用户特征(历史阅读特征或历史转发特征)的方法进行说明。
其中,对确定历史用户的历史阅读特征的方法进行说明:
在本申请实施例中,可以预先训练有RNN模型2,作为阅读特征综合模型。其中,所述阅读特征综合模型可以实现如下功能:将输入的阅读数据相综合,并得到对应的阅读特征,且该阅读特征可以体现全部输入的阅读数据。
首先,可以获取历史用户的历史阅读数据,其中,所述历史阅读数据可以是历史用户在阅读方面的特征,在具体实现中,所述历史阅读数据比如可以包括:历史用户在社交网站的用户ID、性别、年龄、居住地、职业、爱好、好友数量、每日平均阅读文章数量、阅读发生时间等。
然后,对历史用户的全部历史阅读数据进行排列,得到历史阅读特征序列,接着,对得到的历史阅读数据序列进行分词,从而得到该历史阅读数据序列的各个分词。其中,得到的该历史阅读数据序列的各个分词可以具有先后顺序。针对于这些分词,可以将其中的停用词去除,以得到保留下来的字或词,可以将保留下来的字或词的组合作为历史阅读数据保留词集合。需要说明,历史阅读数据保留词集合中的保留词之间具有先后顺序。
接着,可以根据历史阅读数据保留词集合中的保留词间的先后顺序,对它们进行编号。如历史阅读数据保留词集合中包括m个保留词,可以将它们分别记为:保留词1’、保留词2’、......保留词m’。接下来,可以为该历史阅读数据保留词集合中的每个保留词采用TF-IDF等方式,以将其转换为对应的词向量的形式。
参见图4,该图示出了本申请实施例提供的一种确定历史阅读特征的方法示意图,如图4所示,针对于历史阅读数据保留词集合,可以按照其中的保留词的先后顺序,将每个保留词(保留词1’、保留词2’、......保留词m’)对应的词向量依次输入至阅读特征综合模型(即RNN模型2)中。其中,RNN模型2内部包括状态值Aj,j=1,2……m,所述状态值Aj是根据上一次输入的保留词j-1’计算得到的状态值,且其中包括有保留词j-1’的信息。另外,可以设置RNN模型2中的初始状态值A0为0。
这样,在将m个保留词对应的词向量依次输入RNN模型2后,可以得到最终的状态值Am,可以将最终得到的状态值Am作为综合历史用户的全部历史阅读数据后的历史阅读特征。
相应的,确定历史转发特征的方式与前述确定历史阅读特征的方式相同,其区别仅为所应用的数据的不同,因此,此处仅对确定历史转发特征所应用的历史用户的历史转发数据进行介绍,对历史转发特征的具体确定方法不再赘述。
其中,所述历史用户的历史转发数据可以包括:社交网络的用户ID、性别、年龄、居住地、职业、爱好、好友数量、每日平均转发文章数量、转发发生时间、转发好友数量、转发列表等。其中,所述转发好友数量比如可以是,目标用户所转发的多媒体信息被其社交网络中的好友转发的好友数量。所述转发列表比如可以包括目标用户所转发的多媒体信息。
这样,通过上述方法即可确定出历史用户的历史阅读特征和历史转发特征。
在本申请实施例中,通过训练第一兴趣度模型,可以得到目标模型参数。在得到目标模型参数后,在一种可能的实现方式中,针对于S203中根据所述目标特征、待定用户的用户特征和目标模型参数,确定待定用户对多媒体信息的兴趣度的方法可以包括:
可以将多媒体信息的目标特征、待定用户的用户特征和目标模型参数输入至IR'=1/(1+eA'·X'·F'),计算得到待定用户对多媒体信息的兴趣度,其中,IR'为待定用户对所述多媒体信息的兴趣度,A'为待定用户的用户特征,X'为目标模型参数,F'为多媒体信息的目标特征。其中,A'·X'·F'可以对应于点积计算。
具体的,若在S303中得到的目标模型参数为目标阅读参数X1',所述待定用户的用户特征包括用户阅读特征,则可以将所述目标阅读参数X1'作为目标模型参数X',将所述用户阅读特征作为用户特征A',从而,可以将多媒体信息的目标特征、待定用户的用户阅读特征和目标阅读参数输入至IR'=1/(1+eA'·X'·F')中,计算得到的兴趣度IR'为待定用户对多媒体信息的第一阅读兴趣度(Reading Interest Rate,RIR),所述第一阅读兴趣度可以用于标识该待推荐的多媒体信息符合所述待定用户阅读兴趣的程度,第一阅读兴趣度越高,可以表示该多媒体信息越符合待定用户的阅读兴趣。
在具体的实现中,计算待定用户对多媒体信息的第一阅读兴趣度的方式可以包括:
首先,可以对待定用户的全部阅读数据进行排列,得到阅读数据序列,然后,对得到的转发特征序列进行分词,从而得到该阅读数据序列的各个分词。其中,得到的该阅读数据序列的各个分词可以具有先后顺序。针对于这些分词,可以将其中的停用词去除,以得到保留下来的字或词,可以将保留下来的字或词的组合作为阅读数据保留词集合。需要说明,阅读数据保留词集合中的保留词之间具有先后顺序。
然后,可以根据阅读数据保留词集合中的保留词间的先后顺序,对它们进行编号。如阅读数据保留词集合中包括n个保留词,可以将它们分别记为:保留词1”、保留词2”、......保留词n”。接下来,可以为该阅读数据保留词集合中的每个保留词采用TF-IDF等方式,以将其转换为对应的词向量的形式。
参见图5,该图示出了本申请实施例提供的一种计算待定用户对多媒体信息的阅读兴趣度的方法示意图,如图5所示,针对于阅读数据保留词集合,可以按照其中的保留词的先后顺序,将每个保留词(保留词1”、保留词2”、......保留词n”)对应的词向量依次输入至阅读综合模型(即RNN模型2)中。其中,RNN模型2内部包括状态值Ak’,k=1,2……n,所述状态值Ak’是根据上一次输入的保留词k-1”计算得到的状态值,且其中包括有保留词k-1”的信息。另外,可以设置RNN模型2中的初始状态值A0为0。
这样,在将n个保留词对应的词向量依次输入RNN模型2后,可以得到最终的状态值An’,可以将最终得到的状态值An’作为综合待定用户的全部阅读数据后的用户阅读特征。
另外,如图5所示,确定多媒体信息的目标特征的方式与前述S201-S203中多媒体信息的目标特征的得到方式相同,此处不再赘述。
在得到待定用户的用户阅读特征、多媒体信息的目标特征(整体特征向量)和目标阅读参数后,可以根据第一兴趣度模型,计算得到待定用户对多媒体信息的第一阅读兴趣度。
或者,若在S303中得到的目标模型参数为第一转发参数X2',所述待定用户的用户特征包括用户转发特征,则可以将所述第一转发参数X2'作为目标模型参数X',将所述用户转发特征作为用户特征A',可以将多媒体信息的目标特征、待定用户的用户转发特征和第一转发参数输入至IR'=1/(1+eA'·X'·F')中,计算得到的兴趣度IR'为待定用户对多媒体信息的第一转发兴趣度(Forwarding Interest Rate,FIR),所述第一转发兴趣度可以用于标识该待推荐的多媒体信息符合所述待定用户转发兴趣的程度,第一转发兴趣度越高,可以表示该多媒体信息越符合目标用户的转发兴趣。
其中,计算待定用户对多媒体信息的第一转发兴趣度的方法与前述计算第一阅读兴趣度的方法相同,此处不再赘述。
如此,针对于S104中确定目标用户的方式可以是,将第一阅读兴趣度或第一转发兴趣度满足预设条件的待定用户作为目标用户,进而向目标用户推荐多媒体信息。
由此可知,由于用户更愿意选择阅读或转发满足其兴趣的多媒体信息,基于此,该方式通过确定目标用户对所述多媒体信息的阅读兴趣度或转发兴趣度,可以准确的确定所述多媒体信息是否符合目标用户的兴趣,进而进行个性化推荐的决策,从而提升了个性化推荐的准确性。
在一种可能的实现方式中,兴趣度模型还包括第二兴趣度模型,所述第二兴趣度模型为如下公式:
FIR=1/(1+eAt·T·Ft)×wf+IR×wr,其中,FIR可以为历史用户对历史转发多媒体信息的转发兴趣度,At为历史用户的转发特征,T为模型转发参数,Ft为历史转发多媒体信息的目标特征,wf为转发权重,IR为历史用户对历史转发多媒体信息的阅读兴趣度,wr为阅读权重,转发权重wf和阅读权重wr是预先设置的。其中,At·T·F可以对应于点积计算。
需要说明,针对于第二兴趣度模型中的IR,在不同的情况下,IR的数值不同,具体为:当历史转发多媒体信息为历史用户阅读过的历史多媒体信息时,即该历史转发多媒体信息为历史用户既阅读又转发过的多媒体信息时,令其中,Ar为所述历史用户的阅读特征,X1'为目标阅读参数,所述目标阅读参数是通过训练前述第一兴趣度模型得到的。当历史转发多媒体信息为所述历史用户未阅读过的历史多媒体信息时,即该历史转发多媒体信息仅为该历史用户转发过而未阅读过的多媒体信息时,令IR=0。
在本申请实施例中,在通过前述S301-S303的方法训练第一兴趣度模型,且得到目标阅读参数X1'后,还可以通过前述S301-S303的方法对上述第二兴趣度模型进行训练,得到目标转发参数。
需要说明,根据历史多媒体信息是否为历史用户既阅读过又转发过的多媒体信息这两种情形,使得确定出的用于对第二兴趣度模型进行训练的一条第二训练样本也对应如下两种情形:
第一种情形:对应历史用户p既阅读过又转发过的历史转发多媒体信息p’,一条第二训练样本可以包括:所述历史用户p的历史阅读特征、所述历史用户p的历史转发特征和所述历史转发多媒体信息p’。
第二种情形:对应历史用户q仅转发过而未阅读过的历史转发多媒体信息q’,一条第二训练样本可以包括:所述历史用户p的历史转发特征和所述历史转发多媒体信息p’。
需要说明,在本申请实施例中不限定转发权重wf和阅读权重wr的设置方式,在具体实现中,可以设置转发权重wf适当高于阅读权重wr,以提高训练样本中与历史用户转发特征相关的比重。
这样,在对第二兴趣度模型进行训练后,还可以得到目标转发参数。则,在一种可能的实现方式中,前述S103中根据目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度的方法可以包括:
如果待定用户的用户特征中包括该待定用户的阅读特征和转发特征,可以根据计算该待定用户对多媒体信息的转发兴趣度,其中,FIR'为所述待定用户对所述多媒体信息的转发兴趣度,At'为所述待定用户的转发特征,T'为所述目标转发参数,F'为所述多媒体信息的目标特征,Ar'为所述待定用户的阅读特征。
相应的,在S104中将兴趣度满足预设条件的待定用户作为目标用户,并向目标用户推荐所述多媒体信息的方法可以包括:将转发兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息。
可见,该方法在确定转发兴趣度时,将待定用户对多媒体信息的第一阅读兴趣度也考虑在内,从而,可以降低那些符合用户恶意转发兴趣的多媒体信息的转发兴趣度,更为准确的确定出待定用户对多媒体信息的转发兴趣度,进而提高了后续确定推荐结果的准确性。
基于上述方法实施例,本实施还提供了一种多媒体信息推荐装置,参见图6,该图示出了本申请实施例提供的一种多媒体信息推荐装置的结构图,所述装置包括:
获取单元601,用于获取待推荐的多媒体信息;
第一确定单元602,用于确定所述多媒体信息的目标特征,所述目标特征包括文本特征、图片特征或视频特征中的至少两种特征;
第二确定单元603,用于根据所述目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,所述目标模型参数是通过预先训练的兴趣度模型得到的;
推荐单元604,用于将兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息。
可选的,所述第一确定单元602,具体用于:
从所述多媒体信息中提取文本数据、图片数据或视频数据;
将提取的文本数据、图片数据、视频数据分别输入到对应的特征提取模型,确定所述文本特征、所述图片特征、所述视频特征;
将所述文本特征、所述图片特征、所述视频特征中的至少两种特征组成所述多媒体信息的目标特征。
可选的,所述第一确定单元602,还具体用于:
根据所述文本特征、所述图片特征、所述视频特征在所述多媒体信息中的位置排列顺序,将每种目标特征排列组合成所述多媒体信息的整体特征向量。
可选的,所述兴趣度模型包括第一兴趣度模型,所述第一兴趣度模型为如下公式:
IR=1/(1+eA·X·F);
其中,IR为历史用户对所感兴趣的历史多媒体信息的兴趣度,A为所述历史用户的用户特征,X为模型参数,F为所述历史多媒体信息的目标特征。
可选的,所述第二确定单元603,具体用于:
根据n维训练样本矩阵对所述兴趣度模型进行m次训练,每次训练得到一个n维兴趣度矩阵,其中,任意一次训练得到的n维兴趣度矩阵中的一维元素用于体现本次训练中的一条训练样本的兴趣度;所述n维训练样本矩阵包括n条训练样本,所述训练样本是根据历史用户的用户特征和所述历史用户感兴趣的历史多媒体信息的目标特征确定的;
从m个n维兴趣度矩阵中确定总兴趣度值最大的n维兴趣度矩阵为目标矩阵;其中,一个n维兴趣度矩阵的总兴趣度值为这个n维兴趣度矩阵中所有元素的和;
确定所述兴趣度模型在得到所述目标矩阵时的模型参数为所述目标模型参数。
可选的,所述第二确定单元603,还具体用于:
将所述目标特征、待定用户的用户特征和目标模型参数输入至IR'=1/(1+eA '·X'·F'),计算得到所述待定用户对所述多媒体信息的兴趣度,其中,IR'为所述待定用户对所述多媒体信息的兴趣度,A'为所述待定用户的用户特征,X'为所述目标模型参数,F'为所述多媒体信息的目标特征。
可选的,所述兴趣度模型还包括第二兴趣度模型,所述第二兴趣度模型为如下公式:
FIR=1/(1+eAt·T·Ft)×wf+IR×wr
FIR为所述历史用户对历史转发多媒体信息的转发兴趣度,At为所述历史用户的转发特征,T为模型转发参数,Ft为所述历史转发多媒体信息的目标特征,wf为转发权重,IR为所述历史用户对所述历史转发多媒体信息的阅读兴趣度,wr为阅读权重;所述转发权重wf和所述阅读权重wr是预先设置的;
其中,当所述历史转发多媒体信息为所述历史用户阅读过的历史多媒体信息时,Ar为所述历史用户的阅读特征,X1'为目标阅读参数,所述目标阅读参数是通过训练所述第一兴趣度模型得到的;当所述历史转发多媒体信息为所述历史用户未阅读过的历史多媒体信息时,IR=0。
可选的,所述第二确定单元603,还具体用于:
当所述待定用户的用户特征包括阅读特征和转发特征时,根据计算所述待定用户对所述多媒体信息的转发兴趣度,FIR'为所述待定用户对所述多媒体信息的转发兴趣度,At'为所述待定用户的转发特征,T'为所述目标转发参数,F'为所述多媒体信息的目标特征,Ar'为所述待定用户的阅读特征;
则,所述推荐单元604,具体用于:
将转发兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息。
由上述技术方案可以看出,在获取待推荐的多媒体信息之后,可以确定所述多媒体信息的目标特征,其中,所述目标特征包括文本特征、图片特征或视频特征中的至少两种特征;然后,可以根据所述多媒体信息的目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,其中,目标模型参数是通过预先训练的兴趣度模型得到的。最后,将兴趣度满足预设条件的待定用户作为目标用户,并向目标用户推荐多媒体信息。可见,该方法通过将多媒体信息的文本特征、图片特征或视频特征中的至少两种特征,作为表征该多媒体信息的目标特征。从而,可以使得目标特征更完整的表征所述多媒体信息的内容。进而提高了个性化推荐的准确性。
另外,本申请实施例还提供了一种计算机可读存储介质,所述机算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行所述的多媒体信息推荐方法。
本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行所述的多媒体信息推荐方法。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种多媒体信息推荐方法,其特征在于,所述方法包括:
获取待推荐的多媒体信息;
确定所述多媒体信息的目标特征,所述目标特征包括文本特征、图片特征或视频特征中的至少两种特征;
根据所述目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,所述目标模型参数是通过预先训练的兴趣度模型得到的;
将兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息。
2.根据权利要求1所述的方法,其特征在于,所述确定所述多媒体信息的目标特征,包括:
从所述多媒体信息中提取文本数据、图片数据或视频数据;
将提取的文本数据、图片数据、视频数据分别输入到对应的特征提取模型,确定所述文本特征、所述图片特征、所述视频特征;
将所述文本特征、所述图片特征、所述视频特征中的至少两种特征组成所述多媒体信息的目标特征。
3.根据权利要求2所述的方法,其特征在于,所述将所述文本特征、所述图片特征、所述视频特征中的至少两种特征组成所述多媒体信息的目标特征,包括:
根据所述文本特征、所述图片特征、所述视频特征在所述多媒体信息中的位置排列顺序,将每种目标特征排列组合成所述多媒体信息的整体特征向量。
4.根据权利要求1所述的方法,其特征在于,所述兴趣度模型包括第一兴趣度模型,所述第一兴趣度模型为如下公式:
IR=1/(1+eA·X·F);
其中,IR为历史用户对所感兴趣的历史多媒体信息的兴趣度,A为所述历史用户的用户特征,X为模型参数,F为所述历史多媒体信息的目标特征。
5.根据权利要求4所述的方法,其特征在于,所述目标模型参数通过下述方法得到:
根据n维训练样本矩阵对所述兴趣度模型进行m次训练,每次训练得到一个n维兴趣度矩阵,其中,任意一次训练得到的n维兴趣度矩阵中的一维元素用于体现本次训练中的一条训练样本的兴趣度;所述n维训练样本矩阵包括n条训练样本,所述训练样本是根据历史用户的用户特征和所述历史用户感兴趣的历史多媒体信息的目标特征确定的;
从m个n维兴趣度矩阵中确定总兴趣度值最大的n维兴趣度矩阵为目标矩阵;其中,一个n维兴趣度矩阵的总兴趣度值为这个n维兴趣度矩阵中所有元素的和;
确定所述兴趣度模型在得到所述目标矩阵时的模型参数为所述目标模型参数。
6.根据权利要求5所述的方法,其特征在于,所述根据所述目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,包括:
将所述目标特征、待定用户的用户特征和目标模型参数输入至IR'=1/(1+eA'·X'·F'),计算得到所述待定用户对所述多媒体信息的兴趣度,其中,IR'为所述待定用户对所述多媒体信息的兴趣度,A'为所述待定用户的用户特征,X'为所述目标模型参数,F'为所述多媒体信息的目标特征。
7.根据权利要求4所述的方法,其特征在于,所述兴趣度模型还包括第二兴趣度模型,所述第二兴趣度模型为如下公式:
FIR=1/(1+eAt·T·Ft)×wf+IR×wr
FIR为所述历史用户对历史转发多媒体信息的转发兴趣度,At为所述历史用户的转发特征,T为模型转发参数,Ft为所述历史转发多媒体信息的目标特征,wf为转发权重,IR为所述历史用户对所述历史转发多媒体信息的阅读兴趣度,wr为阅读权重;所述转发权重wf和所述阅读权重wr是预先设置的;
其中,当所述历史转发多媒体信息为所述历史用户阅读过的历史多媒体信息时,Ar为所述历史用户的阅读特征,X1'为目标阅读参数,所述目标阅读参数是通过训练所述第一兴趣度模型得到的;当所述历史转发多媒体信息为所述历史用户未阅读过的历史多媒体信息时,IR=0。
8.一种多媒体信息推荐装置,其特征在于,所述装置包括:
获取单元,用于获取待推荐的多媒体信息;
第一确定单元,用于确定所述多媒体信息的目标特征,所述目标特征包括文本特征、图片特征或视频特征中的至少两种特征;
第二确定单元,用于根据所述目标特征、待定用户的用户特征和目标模型参数,确定所述待定用户对所述多媒体信息的兴趣度,所述目标模型参数是通过预先训练的兴趣度模型得到的;
推荐单元,用于将兴趣度满足预设条件的待定用户作为目标用户,并向所述目标用户推荐所述多媒体信息。
9.一种计算机可读存储介质,其特征在于,所述机算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1-7任一项所述的多媒体信息推荐的方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行权利要求1-7任一项所述的多媒体信息推荐的方法。
CN201910718067.1A 2019-08-05 2019-08-05 一种多媒体信息推荐方法、装置和相关设备 Active CN110489574B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910718067.1A CN110489574B (zh) 2019-08-05 2019-08-05 一种多媒体信息推荐方法、装置和相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910718067.1A CN110489574B (zh) 2019-08-05 2019-08-05 一种多媒体信息推荐方法、装置和相关设备

Publications (2)

Publication Number Publication Date
CN110489574A true CN110489574A (zh) 2019-11-22
CN110489574B CN110489574B (zh) 2022-06-03

Family

ID=68549475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910718067.1A Active CN110489574B (zh) 2019-08-05 2019-08-05 一种多媒体信息推荐方法、装置和相关设备

Country Status (1)

Country Link
CN (1) CN110489574B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111010595A (zh) * 2019-12-25 2020-04-14 广州欢聊网络科技有限公司 一种新节目推荐的方法及装置
CN112182351A (zh) * 2020-09-28 2021-01-05 哈尔滨工业大学(深圳) 一种基于多特征融合的新闻推荐方法及装置
CN112968785A (zh) * 2021-01-28 2021-06-15 维沃移动通信有限公司 信息转发方法和装置
CN112989074A (zh) * 2021-04-23 2021-06-18 腾讯科技(深圳)有限公司 多媒体信息推荐方法、装置、电子设备及存储介质
CN113761364A (zh) * 2021-08-17 2021-12-07 武汉卓尔数字传媒科技有限公司 多媒体数据推送方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897283A (zh) * 2015-12-17 2017-06-27 北京奇虎科技有限公司 多媒体信息的处理方法和装置
US20180053210A1 (en) * 2016-08-17 2018-02-22 Adobe Systems Incorporated Personalization of Digital Content Recommendations
CN108243357A (zh) * 2018-01-25 2018-07-03 北京搜狐新媒体信息技术有限公司 一种视频推荐方法及装置
CN108776676A (zh) * 2018-02-02 2018-11-09 腾讯科技(深圳)有限公司 信息推荐方法、装置、计算机可读介质及电子设备
CN109522531A (zh) * 2017-09-18 2019-03-26 腾讯科技(北京)有限公司 文案生成方法和装置、存储介质及电子装置
CN109547814A (zh) * 2018-12-13 2019-03-29 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
CN109992679A (zh) * 2019-03-21 2019-07-09 腾讯科技(深圳)有限公司 一种多媒体数据的分类方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106897283A (zh) * 2015-12-17 2017-06-27 北京奇虎科技有限公司 多媒体信息的处理方法和装置
US20180053210A1 (en) * 2016-08-17 2018-02-22 Adobe Systems Incorporated Personalization of Digital Content Recommendations
CN109522531A (zh) * 2017-09-18 2019-03-26 腾讯科技(北京)有限公司 文案生成方法和装置、存储介质及电子装置
CN108243357A (zh) * 2018-01-25 2018-07-03 北京搜狐新媒体信息技术有限公司 一种视频推荐方法及装置
CN108776676A (zh) * 2018-02-02 2018-11-09 腾讯科技(深圳)有限公司 信息推荐方法、装置、计算机可读介质及电子设备
CN109547814A (zh) * 2018-12-13 2019-03-29 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
CN109992679A (zh) * 2019-03-21 2019-07-09 腾讯科技(深圳)有限公司 一种多媒体数据的分类方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111010595A (zh) * 2019-12-25 2020-04-14 广州欢聊网络科技有限公司 一种新节目推荐的方法及装置
CN112182351A (zh) * 2020-09-28 2021-01-05 哈尔滨工业大学(深圳) 一种基于多特征融合的新闻推荐方法及装置
CN112968785A (zh) * 2021-01-28 2021-06-15 维沃移动通信有限公司 信息转发方法和装置
CN112989074A (zh) * 2021-04-23 2021-06-18 腾讯科技(深圳)有限公司 多媒体信息推荐方法、装置、电子设备及存储介质
CN113761364A (zh) * 2021-08-17 2021-12-07 武汉卓尔数字传媒科技有限公司 多媒体数据推送方法及装置
CN113761364B (zh) * 2021-08-17 2024-02-09 武汉卓尔数字传媒科技有限公司 多媒体数据推送方法及装置

Also Published As

Publication number Publication date
CN110489574B (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN110489574A (zh) 一种多媒体信息推荐方法、装置和相关设备
JP6961727B2 (ja) 関心点コピーの生成
CN110555050B (zh) 一种基于元路径的异构网络节点表示学习方法
CN112000819B (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN111324774B (zh) 一种视频去重方法和装置
CN105045818B (zh) 一种图片的推荐方法、装置和系统
CN107832432A (zh) 一种搜索结果排序方法、装置、服务器和存储介质
CN109145245A (zh) 预测点击率的方法、装置、计算机设备及存储介质
CN110413888B (zh) 一种书籍推荐方法及装置
CN105589938A (zh) 基于fpga的图像检索系统及检索方法
CN110232403A (zh) 一种标签预测方法、装置、电子设备及介质
CN110033097B (zh) 基于多个数据域确定用户与物品的关联关系的方法及装置
CN107122786B (zh) 一种众包学习方法及装置
CN110134885A (zh) 一种兴趣点推荐方法、装置、设备以及计算机存储介质
CN110598118A (zh) 资源对象的推荐方法、装置及计算机可读介质
CN109062914A (zh) 用户推荐方法和装置,存储介质和服务器
CN109902471A (zh) 滑块验证的检测方法、装置、计算机设备及存储介质
CN110008999A (zh) 目标帐号的确定方法、装置、存储介质及电子装置
CN110502701B (zh) 引入注意力机制的好友推荐方法、系统和存储介质
CN115130711A (zh) 一种数据处理方法、装置、计算机及可读存储介质
CN103399900B (zh) 基于位置服务的图片推荐方法
CN109086932A (zh) 一种媒体信息流行度的预测方法、系统及装置
CN115438225A (zh) 视频文本互检方法及其模型训练方法、装置、设备、介质
CN106777201B (zh) 搜索结果页上的推荐数据的排序方法及装置
CN110472143A (zh) 一种信息推送方法、装置、可读存储介质及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant