CN102486796A - 获取视频信息的方法和装置 - Google Patents

获取视频信息的方法和装置 Download PDF

Info

Publication number
CN102486796A
CN102486796A CN201010582263XA CN201010582263A CN102486796A CN 102486796 A CN102486796 A CN 102486796A CN 201010582263X A CN201010582263X A CN 201010582263XA CN 201010582263 A CN201010582263 A CN 201010582263A CN 102486796 A CN102486796 A CN 102486796A
Authority
CN
China
Prior art keywords
video
user
specific user
vector
tabulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201010582263XA
Other languages
English (en)
Other versions
CN102486796B (zh
Inventor
陈培炫
易文晟
廖海波
丘正元
盛馥钟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201010582263.XA priority Critical patent/CN102486796B/zh
Publication of CN102486796A publication Critical patent/CN102486796A/zh
Application granted granted Critical
Publication of CN102486796B publication Critical patent/CN102486796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种获取视频信息的方法和装置,属于互联网领域。所述方法包括:构建视频间的拉动矩阵;获取特定用户的观看历史信息;根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息。所述装置包括:构建模块,获取模块,提供模块。本发明实施例通过所有用户的历史观看信息,得到各个视频之间的拉动关系,再根据特定用户的观看历史信息,结合构建的视频拉动矩阵,分析出该特定用户的习惯和偏好,推荐其可能喜欢的视频,从而保证用户的停留时间。

Description

获取视频信息的方法和装置
技术领域
本发明涉及互联网领域,特别涉及一种获取视频信息的方法和装置。
背景技术
目前有很多视频网站,为用户提供多元化的视频服务。做为网站,希望用户停留的时间更长一些,为了留住用户,各个网站都推出了“相关视频”服务,即视频推荐,就是在所观看视频的旁边,显示了其他相关视频推荐给用户,希望用户观看完所看视频后,能点击旁边的相关视频,以此使用户在网站的停留时间加长。
现有技术中,当用户登录视频网站输入所要观看的视频信息时,该视频网站会根据用户输入的视频信息,来搜索与该视频信息相关联的视频,提供给用户选择。
在对现有技术进行分析后,发明人发现现有技术至少具有如下缺点:现有技术中都是根据用户观看某个视频时输入的该视频信息来搜索相关联的视频以提供给用户,但是提供给用户的不一定是用户喜欢观看的视频信息,因此也不能保证用户的停留时间。
发明内容
为了能够提供给用户喜欢的视频,以延长用户在该网站的停留时间,本发明实施例提供了一种获取视频信息的方法和装置。所述技术方案如下:
一方面,提供了一种获取视频信息的方法,所述方法包括:
构建视频间的拉动矩阵;
获取特定用户的观看历史信息;
根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息。
所述构建视频拉动矩阵,包括:
将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,所述观看态度包括喜欢和不喜欢;
根据所述用户对视频所持有的观看态度,分别统计视频信息平台上用户同时对任意两个视频i和视频j所持有的观看态度的用户数量bij;其中包括,喜欢所述j视频同时喜欢所述i视频的用户数量,喜欢所述视频j但不喜欢所述视频i的用户数量,不喜欢所述视频j但喜欢所述视频i的用户数量,不喜欢所述视频j同时也不喜欢所述视频i的用户数量;
根据所述统计出的用户同时对任意两个视频i和视频j所持有的态度的用户数量,计算出所述用户中同时对所述任意两个视频i和视频j所持有的态度的概率aij;其中包括,喜欢所述视频j同时喜欢所述视频i的用户的概率aij(1,1),喜欢所述视频j但不喜欢所述视频i的用户的概率aij(-1,1),不喜欢所述视频j但是喜欢所述视频i的用户的概率aij(1,-1),不喜欢所述视频j同时也不喜欢所述视频i的用户的概率aij(-1,-1);
将所述用户同时对所述任意两个视频i和视频j所持有的态度的概率aij组成n×n的矩阵,得到视频间的拉动矩阵;其中,所述矩阵的每个元素aij是一个包含4个值aij(1,1),aij(-1,1),aij(1,-1),aij(-1,-1)的结构体,所述i不等于所述j,且所述i和j为小于等于n的自然数,n为所述视频信息平台上视频的数量。
所述根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息,包括:
根据所述特定用户的观看历史信息,构建一个由fj组成的n维向量f,其中fj代表所述用户对第j个视频的态度;
根据所述n维向量f和所述视频间的拉动矩阵,计算得到所述特定用户喜欢的列表向量和不喜欢的列表向量;
根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量;
根据所述得到的所述特定用户对所述所有视频的综合向量,获取所述特定用户喜欢的视频信息,并将所述特定用户喜欢的视频信息返回给所述特定用户。
所述将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,包括:
获取用户对视频的观看时间;
判断所述观看时间是否小于预设时长;
如果是,则得到所述用户对所述视频的观看态度为不喜欢;否则得到所述用户对所述视频的观看态度为喜欢。
所述根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量,包括:
对所述用户喜欢的列表向量和不喜欢的列表向量均做归一化处理,得到新的所述用户喜欢的列表向量和不喜欢的列表向量;
根据所述新的所述用户喜欢的列表向量和不喜欢的列表向量,得到所述用户对所有视频的综合向量。
所述获取所述特定用户喜欢的视频信息,之后还包括:
判断所述特定用户喜欢的视频信息是否为所述特定用户未观看过的视频信息;
如果是,则继续执行步骤,否则,丢弃所述视频信息。
另一方面,提供了一种获取视频信息的装置,所述装置包括:
构建模块,用于构建视频间的拉动矩阵;
获取模块,用于获取特定用户的观看历史信息;
提供模块,用于根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息。
所述构建模块,包括:
第一获取单元,用于将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,所述观看态度包括喜欢和不喜欢;
统计单元,用于根据所述用户对视频所持有的观看态度,分别统计所述用户同时对任意两个视频i和视频j所持有的观看态度的用户数量bij其中包括,喜欢j视频同时喜欢i视频的用户数量,喜欢所述视频j但不喜欢所述视频i的用户数量,不喜欢所述视频j但喜欢所述视频i的用户数量,不喜欢所述视频j同时也不喜欢所述视频i的用户数量;
第一计算单元,用于根据所述统计出的用户同时对任意两个视频i和视频j所持有的态度的用户数量,计算出所述用户中同时对所述任意两个视频i和视频j所持有的态度的概率aij;其中包括,喜欢所述视频j同时喜欢所述视频i的用户的概率aij(1,1),喜欢所述视频j但不喜欢所述视频i的用户的概率aij(-1,1),不喜欢所述视频j但是喜欢所述视频i的用户的概率aij(1,-1),不喜欢所述视频j同时也不喜欢所述视频i的用户的概率aij(-1,-1);
第一构建单元,用于将所述用户同时对所述任意两个视频i和视频j所持有的态度的概率aij组成n×n的矩阵,得到视频间的拉动矩阵;其中,所述矩阵的每个元素aij是一个包含4个值aij(1,1),aij(-1,1),aij(1,-1),aij(-1,-1)的结构体,所述i不等于所述j,且所述i和j为小于等于n的自然数,n为所述视频信息平台上视频的数量。
所述提供模块,包括:
第二构建单元,用于根据所述特定用户的观看历史信息,构建一个由fj组成的n维向量f,其中fj代表所述用户对第j个视频的态度;
第二计算单元,用于根据所述n维向量f和所述视频间的拉动矩阵,计算得到所述特定用户喜欢的列表向量和不喜欢的列表向量;
第二获取单元,用于根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量;
提供单元,用于根据所述得到的所述特定用户对所述所有视频的综合向量,获取所述特定用户喜欢的视频信息,并将所述特定用户喜欢的视频信息返回给所述特定用户。
所述第一获取单元,具体用于:
获取用户对视频的观看时间;
判断所述观看时间是否小于预设时长;
如果是,则得到所述用户对所述视频的观看态度为不喜欢;否则得到所述用户对所述视频的观看态度为喜欢。
所述第二获取单元,具体用于:
对所述用户喜欢的列表向量和不喜欢的列表向量均做归一化处理,得到新的所述用户喜欢的列表向量和不喜欢的列表向量;
根据所述新的所述用户喜欢的列表向量和不喜欢的列表向量,得到所述用户对所述所有视频的综合向量。
所述提供单元,还用于:
在获取所述特定用户喜欢的视频信息之后,判断所述特定用户喜欢的视频信息是否为所述特定用户未观看过的视频信息;
如果是,则继续执行步骤,否则,丢弃所述视频信息。
本发明实施例提供的技术方案的有益效果是:通过所有用户的历史观看信息,得到各个视频之间的拉动关系,再根据特定用户的观看历史信息,结合构建的视频拉动矩阵,分析出该特定用户的习惯和偏好,推荐其可能喜欢的视频,从而保证用户的停留时间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1提供的一种获取视频信息的方法的流程图;
图2是本发明实施例2提供的一种获取视频信息的方法的流程图;
图3是本发明实施例3提供的一种获取视频信息的装置的示意图;
图4是本发明实施例3提供的一种获取视频信息的装置的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例1
参见图图1,本实施例提供了一种获取视频信息的方法,包括:
步骤101:构建视频间的拉动矩阵;
步骤102:获取特定用户的观看历史信息;
步骤103:根据视频间的拉动矩阵和特定用户的观看历史信息,提供特定用户喜欢的视频信息。
本发明实施例提供的技术方案的有益效果是:通过所有用户的历史观看信息,得到各个视频之间的拉动关系,再根据特定用户的观看历史信息,结合构建的视频拉动矩阵,分析出该特定用户的习惯和偏好,推荐其可能喜欢的视频,从而保证用户的停留时间。
买施例2
参见图2,本实施例提供了一种获取视频信息的方法,包括:
步骤201:将历史数据进行预处理,获得每个用户对视频信息平台上视频持有的观看态度。
本实施例中,视频信息平台,指任何可以提供视频信息的平台,可以是专门视频网站,也可以是包含视频信息的网站,本实施例对此不做具体限定。其中,本实施例中以视频网站为例进行说明。
本实施例中,以用户的观看历史为输入数据,每条记录包含以下信息:
(userId,vedioId,观看时长与视频时长之比);
对历史观看数据进行预处理,获得每个用户对视频信息平台上视频持有的观看态度,具体包括:获取用户对视频的观看时间,判断该用户的观看时长是否小于预设的时长,如果是,则将用户对该视频的观看态度记为不喜欢;否则将用户对该视频的观看态度记为喜欢。
其中,可以将用户对视频的观看态度转换为用户观看列表,如下形式,
userId:(vedio_1,1),(vedio_4,-1)......
其中,用户观看列表中每个元素包含两个字段,第一个为用户点击过的视频,第二个为对该视频的态度,1代表喜欢,-1代表不喜欢。本实施例中,预设时长为用户观看视频最少的时间,可以为视频时长的15%,20%,30%等,本实施例对此不做具体限定。
步骤202:根据用户对视频所持有的观看态度,分别统计视频网站上的用户中同时对视频i和视频j所持有的态度的用户数量bij(*,*)。
其中,将喜欢j视频同时喜欢i视频的用户数记为bij(1,1),喜欢视频j但不喜欢视频i的用户数记为bij(-1,1),不喜欢视频j但喜欢视频i的用户数记为bij(1,-1),不喜欢视频j同时也不喜欢视频i的用户数记为bij(-1,-1),其中i不等于j,且i和j为小于等于n的自然数。
步骤203:根据统计出的用户同时对视频i和视频j所持有的态度的用户数量,计算出用户中同时对视频i和视频j所持有的态度的概率。
其中,将喜欢视频j同时喜欢视频i的概率记为aij(1,1),喜欢视频j但不喜欢视频i的概率记为aij(-1,1),不喜欢视频j但是喜欢视频i的概率记为aij(1,-1),不喜欢视频j同时也不喜欢视频i的概率记为aij(-1,-1)。
本实施例中,根据统计出的bij(*,*),计算aij(*,*),有以下两种情况:
如果bij(*,1)有一个不为0,则
a ij ( 1,1 ) = b ij ( 1,1 ) b ij ( 1,1 ) + b ij ( - 1,1 ) , a ij ( - 1,1 ) = b ij ( - 1,1 ) b ij ( 1,1 ) + b ij ( - 1,1 )
同理如果bij(*,-1)有一个不为0,则
a ij ( 1 , - 1 ) = b ij ( 1 , - 1 ) b ij ( 1 , - 1 ) + b ij ( - 1 , - 1 ) , a ij ( - 1 , - 1 ) = b ij ( - 1 , - 1 ) b ij ( 1 , - 1 ) + b ij ( - 1 , - 1 )
如果bij(*,1)都为0,则
aij(1,1)=0.5,aij(-1,1)=0.5
同理如果bij(*,-1)都为0,则
aij(1,-1)=0.5,aij(-1,-1)=0.5
步骤204:将用户同时对任意两个视频i和视频j所持有的态度的概率组成矩阵,得到视频间的拉动矩阵。
假设有n个视频,那么将构造一个n×n矩阵A,矩阵的每个元素aij是一个包含4个值aij(1,1),aij(-1,1),aij(1,-1),aij(-1,-1)的结构体,即如下矩阵:
{ a 11 ( 1,1 ) , a 11 ( - 1,1 ) , a 11 ( 1 , - 1 ) , a 11 ( - 1 , - 1 ) } , . . . . . . . . { a 1 n ( 1,1 ) , a 1 n ( - 1,1 ) , a 1 n ( 1 , - 1 ) , a 1 n ( - 1 , - 1 ) } . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . { a i 1 ( 1,1 ) , a i 1 ( - 1,1 ) , a i 1 ( 1 , - 1 ) , a i 1 ( - 1 , - 1 ) } , . . . . . . . . . . { a ij ( 1,1 ) , a ij ( - 1,1 ) , a ij ( 1 , - 1 ) , a ij ( - 1 , - 1 ) } . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . { a n 1 ( 1,1 ) , a n 1 ( - 1,1 ) , a n 1 ( 1 , - 1 ) , a n 1 ( - 1 , - 1 ) } , . . . . . . . . . . { a nn ( 1,1 ) , a nn ( - 1,1 ) , a nn ( 1 , - 1 ) , a nn ( - 1 , - 1 ) }
其中,通过步骤201-204,构建视频间的拉动矩阵。
步骤205:获取特定用户的观看历史信息。
其中不同于现有视频网站的推荐方式根据用户输入的相关信息进行推荐的方式,本实施例中,特定用户指任意一个登录该视频网站的用户,并不是特指某个用户。当特定用户登录该视频网站时,该视频网站获取该特定用户的观看历史信息,根据历史信息向用户推荐相关视频。
步骤206:根据特定用户的观看历史信息,构建一个由fj组成的n维向量。
本实施例中,可以将用户的观看历史可以转换为一个n维向量f,fj代表用户对第j个视频的态度,1为喜欢,-1为不喜欢,0为未知。其中,获取到用户的观看历史后,对用户的观看历史进行统计,按照步骤201中对用户观看态度的统计方法,获取特定用户的观看态度,在此不在赘述。但对于视频网站上的n个视频,用户有可能没有完全都观看过,所以对用户未观看过的视频,将用户的观看态度记为零。
步骤207:根据n维向量f和视频间的拉动矩阵,计算得到特定用户对视频的喜欢列表向量和不喜欢列表向量。
本实施例中,对于特定的用户,利用其观看历史,结合在之前构建的拉动矩阵,计算用户对视频的喜欢列表向量L和不喜欢列表向量H:
其中,用户的喜欢列表向量L,
L i = Σ j = 1 n a ij ( 1 , sgn ( f j ) ) * | f j |
用户的不喜欢列表向量H,其中
H i = Σ j = 1 n a ij ( - 1 , sgn ( f j ) ) * | f j |
其中函数
sgn ( x ) = 1 x &GreaterEqual; 0 - 1 x < 0
步骤208:对特定用户对视频的喜欢列表向量L和不喜欢列表向量H做归一化处理得到新的特定用户对视频的喜欢列表向量和不喜欢列表向量。
其中,为了保证参与参数计算的数值相差不大,对用户对视频的喜欢列表向量L和不喜欢列表向量H做归一化处理,得到
L i &prime; = L i / &Sigma; j = 0 n L j , H i &prime; = H i / &Sigma; j = 0 n H j
H′为新的用户对视频的喜欢列表向量,L′为新的用户对视频的不喜欢列表向量。
步骤209:根据新的特定用户喜欢的列表向量和不喜欢的列表向量,得到特定用户对视频网站上所有视频的综合向量。
本实施例中,给定参数a∈[0,1],根据H′i和L′i得到特定用户对第i个视频的喜欢程度Ti,Ti=α*L′i-(1-a)*H′i,综合向量T由Ti组成,Ti取值范围在-1和1之间,数值越大说明用户对该视频的喜欢程度越高,数值越小说明用户对该视频的喜欢程度越低。
步骤210:根据得到的特定用户对视频网站上所有视频的综合向量,获取特定用户喜欢的视频信息,并将该特定用户喜欢的视频信息提供给特定用户。
其中,通过步骤206-206,实现根据视频间的拉动矩阵和特定用户的观看历史信息,提供特定用户喜欢的观看列表。
本实施例中,找到将综合向量中数值较大的元素,因为数值越大,代表特定用户对该元素中的视频的喜欢程度越高,返回特定用户喜欢的视频。其中,可以对综合向量T中每个元素按降序排序,从综合向量的最大值开始到最小值,依次获取其中的向量对应的视频信息,并优选地,返回给用户的视频信息的数量满足预设的数值。其中,预设的数值可以根据不同网站的不同需求来确定,可以为4个,5个或是6个等,本实施例对根据得到的特定用户对视频网站上所有视频的综合向量,获取特定用户喜欢的视频信息的方法不做具体限定。
其中,优选地,在获取到特定用户喜欢的视频信息后,判断该视频信息是否为用户未观看过的视频信息,即fj是否为零,如果是则将该视频信息返回给该用户,否则,丢弃该视频信息,即不将此视频信息返回给特定用户。当然,也可以不做此判断,直接返回用户喜欢的视频信息。
本发明实施例提供的技术方案的有益效果是:通过视频信息平台上的历史观看信息,得到各个视频之间的拉动关系,再根据特定用户的观看历史,了解用户的习惯和偏好,推荐其可能喜欢的视频,从而保证用户在该视频信息平台的停留时间。
实施例3
参见图3,本实施例提供了一种获取视频的装置,包括:构建模块301,获取模块302,提供模块303。
构建模块301,用于构建视频间的拉动矩阵;
获取模块302,用于获取特定用户的观看历史信息;
提供模块303,用于根据视频间的拉动矩阵和特定用户的观看历史信息,提供特定用户喜欢的视频信息。
参见图4,进一步地,构建模块301,包括:
第一获取单元301a,用于将历史观看数据进行预处理,获得每个用户对视频的观看态度,观看态度包括喜欢和不喜欢;
统计单元301b,用于根据用户对视频所持有的观看态度,分别统计用户同时对任意两个视频i和视频j所持有的观看态度的用户数量bij;其中包括,喜欢j视频同时喜欢i视频的用户数量,喜欢所述视频j但不喜欢所述视频i的用户数量,不喜欢所述视频j但喜欢所述视频i的用户数量,不喜欢所述视频j同时也不喜欢所述视频i的用户数量;
第一计算单元301c,用于根据统计出的用户同时对任意两个视频i和视频j所持有的态度的用户数量,计算出用户中同时对任意两个视频i和视频j所持有的态度的概率aij;其中包括,喜欢所述视频j同时喜欢所述视频i的用户的概率aij(1,1),喜欢视频j但不喜欢所述视频i的用户的概率aij(-1,1),不喜欢视频j但是喜欢视频i的用户的概率aij(1,-1),不喜欢视频j同时也不喜欢视频i的用户的概率aij(-1,-1);
第一构建单元301d,用于将用户同时对任意两个视频i和视频j所持有的态度的概率aij组成n×n的矩阵,得到视频间的拉动矩阵;其中,矩阵的每个元素aij是一个包含4个值aij(1,1),aij(-1,1),aij(1,-1),aij(-1,-1)的结构体,i不等于j,且i和j为小于等于n的自然数,n为视频信息平台上视频的数量。
参见图4,提供模块303,包括:
第二构建单元303a,用于根据特定用户的观看历史信息,构建一个由fj组成的n维向量f,其中fj代表用户对第j个视频的态度;
第二计算单元303b,用于根据n维向量f和视频间的拉动矩阵,计算得到特定用户喜欢的列表向量和不喜欢的列表向量;
第二获取单元303c,用于根据特定用户喜欢的列表向量和不喜欢的列表向量,得到特定用户对所有视频的综合向量;
提供单元303d,用于根据得到的特定用户对所有视频的综合向量,获取特定用户喜欢的视频信息,并将特定用户喜欢的视频信息返回给特定用户。
其中,第一获取单元301a,具体用于:
获取用户对视频的观看时间;
判断观看时间是否小于预设时长;
如果是,则得到用户对视频的观看态度为不喜欢;否则得到用户对视频的观看态度为喜欢。
本实施例中,第二获取单元303c,具体用于:
对用户喜欢的列表向量和不喜欢的列表向量均做归一化处理,得到新的用户喜欢的列表向量和不喜欢的列表向量;
根据新的所述用户喜欢的列表向量和不喜欢的列表向量,得到用户对所有视频的综合向量。
进一步地,本实施例中,提供单元303d,还用于:
在获取特定用户喜欢的视频信息之后,判断特定用户喜欢的视频信息是否为特定用户未观看过的视频信息;
如果是,则继续执行步骤,否则,丢弃视频信息。
本发明实施例提供的技术方案的有益效果是:通过所有用户的历史观看信息,得到各个视频之间的拉动关系,再根据特定用户的观看历史信息,结合构建的视频拉动矩阵,分析该特定用户的习惯和偏好,推荐其可能喜欢的视频,从而保证用户的停留时间。
本实施例提供的装置,具体可以,与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本发明实施例提供的上述技术方案的全部或部分可以通过程序指令相关的硬件来完成,所述程序可以存储在可读取的存储介质中,该存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种获取视频信息的方法,其特征在于,所述方法包括:
构建视频间的拉动矩阵;
获取特定用户的观看历史信息;
根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息。
2.根据权利要求1所述的方法,其特征在于,所述构建视频拉动矩阵,包括:
将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,所述观看态度包括喜欢和不喜欢;
根据所述用户对视频所持有的观看态度,分别统计所述用户同时对任意两个视频i和视频j所持有的观看态度的用户数量bij;其中包括,喜欢所述j视频同时喜欢所述i视频的用户数量,喜欢所述视频j但不喜欢所述视频i的用户数量,不喜欢所述视频j但喜欢所述视频i的用户数量,不喜欢所述视频j同时也不喜欢所述视频i的用户数量;
根据所述统计出的用户同时对任意两个视频i和视频j所持有的态度的用户数量,计算出所述用户中同时对所述任意两个视频i和视频j所持有的态度的概率aij;其中包括,喜欢所述视频j同时喜欢所述视频i的用户的概率aij(1,1),喜欢所述视频j但不喜欢所述视频i的用户的概率aij(-1,1),不喜欢所述视频j但是喜欢所述视频i的用户的概率aij(1,-1),不喜欢所述视频j同时也不喜欢所述视频i的用户的概率aij(-1,-1);
将所述用户同时对所述任意两个视频i和视频j所持有的态度的概率aij组成n×n的矩阵,得到视频间的拉动矩阵;其中,所述矩阵的每个元素aij是一个包含4个值aij(1,1),aij(-1,1),aij(1,-1),aij(-1,-1)的结构体,所述i不等于所述j,且所述i和j为小于等于n的自然数,n为所述视频信息平台上视频的数量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息,包括:
根据所述特定用户的观看历史信息,构建一个由fj组成的n维向量f,其中fj代表所述用户对第j个视频的态度;
根据所述n维向量f和所述视频间的拉动矩阵,计算得到所述特定用户喜欢的列表向量和不喜欢的列表向量;
根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量;
根据所述得到的所述特定用户对所述所有视频的综合向量,获取所述特定用户喜欢的视频信息,并将所述特定用户喜欢的视频信息返回给所述特定用户。
4.根据权利要求2所述的方法,其特征在于,所述将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,包括:
获取用户对视频的观看时间;
判断所述观看时间是否小于预设时长;
如果是,则得到所述用户对所述视频的观看态度为不喜欢;否则得到所述用户对所述视频的观看态度为喜欢。
5.根据权利要求3所述的方法,其特征在于,所述根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量,包括:
对所述用户喜欢的列表向量和不喜欢的列表向量均做归一化处理,得到新的所述用户喜欢的列表向量和不喜欢的列表向量;
根据所述新的所述用户喜欢的列表向量和不喜欢的列表向量,得到所述用户对所有视频的综合向量。
6.根据权利要求3所述的方法,其特征在于,所述获取所述特定用户喜欢的视频信息,之后还包括:
判断所述特定用户喜欢的视频信息是否为所述特定用户未观看过的视频信息;
如果是,则继续执行步骤,否则,丢弃所述视频信息。
7.一种获取视频信息的装置,其特征在于,所述装置包括:
构建模块,用于构建视频间的拉动矩阵;
获取模块,用于获取特定用户的观看历史信息;
提供模块,用于根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息。
8.根据权利要求7所述的装置,其特征在于,所述构建模块,包括:
第一获取单元,用于将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,所述观看态度包括喜欢和不喜欢;
统计单元,用于根据所述用户所持有的观看态度,分别统计所述用户同时对任意两个视频i和视频j所持有的观看态度的用户数量bij;其中包括,喜欢所述j视频同时喜欢所述i视频的用户数量,喜欢所述视频j但不喜欢所述视频i的用户数量,不喜欢所述视频j但喜欢所述视频i的用户数量,不喜欢所述视频j同时也不喜欢所述视频i的用户数量;
第一计算单元,用于根据所述统计出的用户同时对任意两个视频i和视频j所持有的态度的用户数量,计算出所述用户中同时对所述任意两个视频i和视频j所持有的态度的概率aij;其中包括,喜欢所述视频j同时喜欢所述视频i的用户的概率aij(1,1),喜欢所述视频j但不喜欢所述视频i的用户的概率aij(-1,1),不喜欢所述视频j但是喜欢所述视频i的用户的概率aij(1,-1),不喜欢所述视频j同时也不喜欢所述视频i的用户的概率aij(-1,-1);
第一构建单元,用于将所述用户同时对所述任意两个视频i和视频j所持有的态度的概率aij组成n×n的矩阵,得到视频间的拉动矩阵;其中,所述矩阵的每个元素aij是一个包含4个值aij(1,1),aij(-1,1),aij(1,-1),aij(-1,-1)的结构体,所述i不等于所述j,且所述i和j为小于等于n的自然数,n为所述视频信息平台上视频的数量。
9.根据权利要求7所述的装置,其特征在于,所述提供模块,包括:
第二构建单元,用于根据所述特定用户的观看历史信息,构建一个由fj组成的n维向量f,其中fj代表所述用户对第j个视频的态度;
第二计算单元,用于根据所述n维向量f和所述视频间的拉动矩阵,计算得到所述特定用户喜欢的列表向量和不喜欢的列表向量;
第二获取单元,用于根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量;
提供单元,用于根据所述得到的所述特定用户对所述所有视频的综合向量,获取所述特定用户喜欢的视频信息,并将所述特定用户喜欢的视频信息返回给所述特定用户。
10.根据权利要求8所述的装置,其特征在于,所述第一获取单元,具体用于:
获取用户对视频的观看时间;
判断所述观看时间是否小于预设时长;
如果是,则得到所述用户对所述视频的观看态度为不喜欢;否则得到所述用户对所述视频的观看态度为喜欢。
11.根据权利要求9所述的装置,其特征在于,所述第二获取单元,具体用于:
对所述用户喜欢的列表向量和不喜欢的列表向量均做归一化处理,得到新的所述用户喜欢的列表向量和不喜欢的列表向量;
根据所述新的所述用户喜欢的列表向量和不喜欢的列表向量,得到所述用户对所有视频的综合向量。
12.根据权利要求9所述的装置,其特征在于,所述提供单元,还用于:
在获取所述特定用户喜欢的视频信息之后,判断所述特定用户喜欢的视频信息是否为所述特定用户未观看过的视频信息;
如果是,则继续执行步骤,否则,丢弃所述视频信息。
CN201010582263.XA 2010-12-03 2010-12-03 获取视频信息的方法和装置 Active CN102486796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010582263.XA CN102486796B (zh) 2010-12-03 2010-12-03 获取视频信息的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010582263.XA CN102486796B (zh) 2010-12-03 2010-12-03 获取视频信息的方法和装置

Publications (2)

Publication Number Publication Date
CN102486796A true CN102486796A (zh) 2012-06-06
CN102486796B CN102486796B (zh) 2016-05-04

Family

ID=46152289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010582263.XA Active CN102486796B (zh) 2010-12-03 2010-12-03 获取视频信息的方法和装置

Country Status (1)

Country Link
CN (1) CN102486796B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544663A (zh) * 2013-06-28 2014-01-29 Tcl集团股份有限公司 网络公开课的推荐方法、系统和移动终端
CN103974096A (zh) * 2013-02-01 2014-08-06 腾讯科技(北京)有限公司 一种视频文件评估方法、装置和系统
CN103995875A (zh) * 2014-05-23 2014-08-20 百度在线网络技术(北京)有限公司 信息推荐方法及装置
CN104182449A (zh) * 2013-05-20 2014-12-03 Tcl集团股份有限公司 基于用户兴趣建模的个性化视频推荐系统和方法
CN106802946A (zh) * 2017-01-12 2017-06-06 合网络技术(北京)有限公司 视频分析方法及装置
CN107368584A (zh) * 2017-07-21 2017-11-21 山东大学 一种个性化视频推荐方法及系统
CN108304526A (zh) * 2018-01-25 2018-07-20 腾讯科技(深圳)有限公司 一种数据处理方法、装置及服务器
CN110472151A (zh) * 2019-08-14 2019-11-19 腾讯科技(深圳)有限公司 媒体数据推送方法、装置和计算机可读存储介质
CN111479168A (zh) * 2020-04-14 2020-07-31 腾讯科技(深圳)有限公司 用于标记多媒体内容热点的方法、装置、服务器以及介质
CN112822526A (zh) * 2020-12-30 2021-05-18 咪咕文化科技有限公司 视频推荐方法、服务器和可读存储介质
CN113420206A (zh) * 2021-06-02 2021-09-21 杭州当贝网络科技有限公司 基于用户行为预测的视频推荐方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101047831A (zh) * 2006-03-30 2007-10-03 株式会社东芝 推荐节目信息提供方法和装置
CN101441667A (zh) * 2008-12-29 2009-05-27 北京搜狗科技发展有限公司 一种音乐推荐方法及装置
WO2010027033A1 (ja) * 2008-09-05 2010-03-11 株式会社ソニー・コンピュータエンタテインメント コンテンツ推薦システム、コンテンツ推薦方法、コンテンツ推薦装置、プログラム及び情報記憶媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101047831A (zh) * 2006-03-30 2007-10-03 株式会社东芝 推荐节目信息提供方法和装置
WO2010027033A1 (ja) * 2008-09-05 2010-03-11 株式会社ソニー・コンピュータエンタテインメント コンテンツ推薦システム、コンテンツ推薦方法、コンテンツ推薦装置、プログラム及び情報記憶媒体
CN101441667A (zh) * 2008-12-29 2009-05-27 北京搜狗科技发展有限公司 一种音乐推荐方法及装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103974096B (zh) * 2013-02-01 2018-10-26 腾讯科技(北京)有限公司 一种视频文件评估方法、装置和系统
CN103974096A (zh) * 2013-02-01 2014-08-06 腾讯科技(北京)有限公司 一种视频文件评估方法、装置和系统
CN104182449B (zh) * 2013-05-20 2018-10-26 Tcl集团股份有限公司 基于用户兴趣建模的个性化视频推荐系统和方法
CN104182449A (zh) * 2013-05-20 2014-12-03 Tcl集团股份有限公司 基于用户兴趣建模的个性化视频推荐系统和方法
CN103544663B (zh) * 2013-06-28 2017-06-09 Tcl集团股份有限公司 网络公开课的推荐方法、系统和移动终端
CN103544663A (zh) * 2013-06-28 2014-01-29 Tcl集团股份有限公司 网络公开课的推荐方法、系统和移动终端
CN103995875A (zh) * 2014-05-23 2014-08-20 百度在线网络技术(北京)有限公司 信息推荐方法及装置
CN106802946A (zh) * 2017-01-12 2017-06-06 合网络技术(北京)有限公司 视频分析方法及装置
CN106802946B (zh) * 2017-01-12 2020-03-27 合一网络技术(北京)有限公司 视频分析方法及装置
CN107368584A (zh) * 2017-07-21 2017-11-21 山东大学 一种个性化视频推荐方法及系统
CN107368584B (zh) * 2017-07-21 2020-07-03 山东大学 一种个性化视频推荐方法及系统
CN108304526A (zh) * 2018-01-25 2018-07-20 腾讯科技(深圳)有限公司 一种数据处理方法、装置及服务器
CN108304526B (zh) * 2018-01-25 2022-02-11 腾讯科技(深圳)有限公司 一种数据处理方法、装置及服务器
CN110472151A (zh) * 2019-08-14 2019-11-19 腾讯科技(深圳)有限公司 媒体数据推送方法、装置和计算机可读存储介质
CN110472151B (zh) * 2019-08-14 2022-05-24 腾讯科技(深圳)有限公司 媒体数据推送方法、装置和计算机可读存储介质
CN111479168B (zh) * 2020-04-14 2021-12-28 腾讯科技(深圳)有限公司 用于标记多媒体内容热点的方法、装置、服务器以及介质
CN111479168A (zh) * 2020-04-14 2020-07-31 腾讯科技(深圳)有限公司 用于标记多媒体内容热点的方法、装置、服务器以及介质
CN112822526A (zh) * 2020-12-30 2021-05-18 咪咕文化科技有限公司 视频推荐方法、服务器和可读存储介质
CN112822526B (zh) * 2020-12-30 2023-07-07 咪咕文化科技有限公司 视频推荐方法、服务器和可读存储介质
CN113420206A (zh) * 2021-06-02 2021-09-21 杭州当贝网络科技有限公司 基于用户行为预测的视频推荐方法

Also Published As

Publication number Publication date
CN102486796B (zh) 2016-05-04

Similar Documents

Publication Publication Date Title
CN102486796A (zh) 获取视频信息的方法和装置
CN103377242B (zh) 用户行为分析方法、分析预测方法及电视节目推送系统
O’donovan et al. Big data in manufacturing: a systematic mapping study
CN101840410B (zh) 学习装置和方法、信息处理装置和方法以及程序
Zheng et al. PENETRATE: Personalized news recommendation using ensemble hierarchical clustering
CN106294830A (zh) 多媒体资源的推荐方法及装置
CN105426548A (zh) 一种基于多用户的视频推荐方法及装置
CN104182449A (zh) 基于用户兴趣建模的个性化视频推荐系统和方法
CN104216960A (zh) 一种视频推荐方法和装置
CN106131703A (zh) 一种视频推荐的方法和终端
CN102780920A (zh) 电视节目推荐方法及系统
Wang et al. Identifying emerging customer requirements in an early design stage by applying bayes factor-based sequential analysis
CN101482884A (zh) 一种基于用户偏好评分分布的协作推荐系统
CN103870454A (zh) 数据推荐方法及系统
US20140188838A1 (en) Information search engine, processing and rating system
Saravanan et al. A fuzzy entropy technique for dimensionality reduction in recommender systems using deep learning
Doyle Television and the development of the data economy: Data analysis, power and the public interest
CN112100221A (zh) 一种资讯推荐方法、装置、推荐服务器及存储介质
Alhamdani et al. Recommender system for global terrorist database based on deep learning
Murschetz et al. Big Data and Television Broadcasting: a Critical Reflection on Big Data's Surge to Become a New Techno-Economic Paradigm and its Impacts on the Concept of the Addressable Audience
Do et al. Mining revenue-maximizing bundling configuration
Wu et al. Digital content recommendation system using implicit feedback data
CN108182600A (zh) 一种根据加权计算来确定扩展用户的方法和系统
CN108053260A (zh) 一种根据统计数据兴趣度确定扩展用户的方法和系统
Saraswathi et al. Survey: a hybrid approach to solve cold-start problem in online recommendation system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200825

Address after: Shenzhen Futian District City, Guangdong province 518000 Zhenxing Road, SEG Science Park 2 East Room 403

Co-patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd.

Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Address before: 518000 Guangdong city of Shenzhen province Futian District SEG Science Park 2 East Room 403

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.