CN107924401A - 基于视频标题的视频推荐 - Google Patents

基于视频标题的视频推荐 Download PDF

Info

Publication number
CN107924401A
CN107924401A CN201680024161.1A CN201680024161A CN107924401A CN 107924401 A CN107924401 A CN 107924401A CN 201680024161 A CN201680024161 A CN 201680024161A CN 107924401 A CN107924401 A CN 107924401A
Authority
CN
China
Prior art keywords
video
candidate video
candidate
target
ranking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680024161.1A
Other languages
English (en)
Inventor
加伦·切克利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN107924401A publication Critical patent/CN107924401A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

提供了一种在视频共享环境中生成视频推荐的解决方案。视频推荐系统选择视频作为目标视频,并从所识别的目标视频的标题或非视频热门新闻项目的标题中提取目标关键词。系统接收多个候选视频。对于每个候选视频,系统从候选视频的标题中提取关键词,并将所提取的关键词与目标词进行比较。基于该比较,系统生成候选视频的相似性得分。该系统基于候选视频相关联的相似性得分对候选视频进行排名,并选择具有最高相似性得分的候选视频作为对于目标视频的视频推荐。

Description

基于视频标题的视频推荐
背景技术
所描述的实施例通常涉及基于网络的视频观看,并且具体涉及基于从在线视频内容分发系统的视频的标题中提取的关键词来推荐视频。
网络视频观看使得用户能够在快速增长的在线视频娱乐社区中上传、观看和共享视频。诸如YOUTUBE的在线视频内容分发网站允许内容提供者轻松上传视频;该网站的用户可以通过邮寄链接到他人,或将链接嵌入到网页或博客中,来轻松地共享视频。浏览视频内容分发网站的用户可以通过例如搜索视频,浏览视频目录或通过分配给视频的评分对视频进行分类来找到感兴趣的视频。
为了方便用户观看感兴趣的视频,一些视频托管服务基于对视频之间的相关性或相似性的一些测量将相关的视频分组在一起,并将所识别到的视频作为视频推荐呈现给用户。一个现有的解决方案假设观看者可能会观看内容相似的视频,并基于视频内容的相似性对视频进行排名。然而,对观看者而言,基于这样的排名的视频推荐并不总是有意义。例如,基于其内容与观看者已经观看过的视频相似而选择的视频可能没有合适的缩略图,或者太长而不能观看,特别是当观看者希望在有限的时间段里浏览尽可能多的视频的时候。
发明内容
提供了一种在视频共享环境中生成视频推荐的解决方案。
在一个实施例中,视频推荐系统选择目标视频,例如,与谷歌新闻热门头条相关的视频,并从选择的视频的标题中提取目标关键词。例如,系统从选择的视频的标题中提取具有超过三个字符的任何词,并且去除预定义的通用词集中识别的任何词(例如,什么(what)/当…时(when)/在…处(where)/如何(how)/为何(why))。系统检索从在视频数据库中存储的多个候选视频的标题中提取的关键词。对于每个候选视频,系统将从候选视频的标题中提取的关键词与目标关键词进行比较。基于比较,系统生成候选视频的相似性得分。系统基于候选视频的相关联的相似性得分对候选视频进行排名,并选择一个或多个候选视频作为对目标视频的视频推荐。
另一个实施例包括非暂时性计算机可读介质,其存储用于以上述方式生成视频推荐的可执行计算机程序指令。
鉴于附图、说明书和权利要求书,本说明书中描述的特点和优点不是全部包括的,并且特别地,许多附加的特点和优点对于本领域普通技术人员将是显而易见的。此外,应当注意,说明书中使用的语言主要是为了可读性和教学目的而选择的,并且可能没有被选择来划定或限定所公开的主题。
附图说明
图1是具有视频推荐系统的视频托管服务的框图。
图2是图1所示的视频推荐系统的关键词提取模块的框图。
图3是图1所示的视频推荐系统的视频排名模块的框图。
图4是基于从视频标题中提取的关键词与目标关键词的比较的视频推荐的流程图的示例。
图5是基于关键词的视频推荐的流程图。
附图仅仅为了说明的目的描绘了本发明的各种实施例。本领域技术人员将容易地从以下讨论中认识到,在不脱离本文所述的发明原理的情况下,可以采用本文所示的结构和方法的替代实施例。
具体实施方式
应当理解,为了清楚理解本发明的实施例,已经简化了本发明的附图和说明,以示出有关的元件,同时为了清楚起见,去除了在典型的基于网络的视频播放器及其使用方法中发现的许多其它元件。本领域普通技术人员可以识别实施本发明所期望和/或需要的其它元件和/或步骤。然而,因为这些元件和步骤是本领域公知的,并且因为它们不促进更好地理解本发明,所以这里不提供对这些元件和步骤的讨论。本文的公开内容指向对本领域技术人员已知的这些元件和方法的所有这样的变化和修改。
图1是具有视频推荐系统102的视频托管服务100的框图。多个用户/观看者使用客户端110A-N将视频上传到视频托管服务100,以进行托管,并从视频托管服务100接收各种服务,包括视频推荐。视频托管服务100经由网络130与一个或多个客户端110A-N进行通信,并将视频推荐系统102生成的视频推荐提供给客户端110A-N。
转向图1所示的各个实体,每个客户端110被用户用来使用由视频托管服务100提供的服务。例如,用户使用客户端110来上传视频或视频组,观看视频并且针对正在观看的视频或视频搜索请求接收一个或多个视频推荐。客户端110可以是任何类型的计算机设备,诸如个人计算机(例如,台式机、笔记本电脑、膝上型计算机),以及诸如具有记录视频内容的能力的移动电话或个人数字助理的设备。客户端110一般来说包括处理器、显示设备(或到显示设备的输出)、客户端110向其存储用户在执行任务中所使用的数据的本地存储器——诸如硬盘驱动器或闪存设备,以及用于经由网络130耦合到视频托管服务100的网络接口。客户端110还具有用于回放视频的视频播放器120。视频播放器120可以是独立的应用,也可以是诸如网络浏览器的另一应用的插件。
网络130使得客户端110和视频托管服务100之间能够通信。在一个实施例中,网络130是互联网,并且使用现在已知或随后开发的标准化的网络通信技术和协议,该网络通信技术和协议使得客户端110能够与视频托管服务100进行通信。在另一个实施例中,网络130是云计算网络,并且包括视频托管服务100的一个或多个组件。
视频托管服务100包括视频推荐系统102、视频数据库104、视频服务器106和用户数据库108。视频托管服务100的其它实施例可以包括其它和/或不同的计算机模块。视频数据库104存储由用户或其它来源上传的视频。视频数据库104还存储用于在视频数据库104中存储的每个视频的元数据。视频元数据描述视频的各种特征,例如,视频的标识符、视频的标题、从标题中提取的关键词、视频的来源、视频的标签、视频的持续时间、视频的上传时间和视频的观看者人数。存储在视频托管服务100的视频数据库104中的视频可以基于诸如视频的类型(例如,新闻、运动、教育/学术等)、视频的来源以及视频上传的日期和时间(例如,过去24小时内上传的视频)的各种准则被分类为多个类别。视频的分类可以被存储为与视频相关联的元数据的一部分。视频推荐系统102适于对视频数据库104中的视频进行排名,而不管视频是否被分类。视频服务器106接收上传到托管服务100的视频并将其存储在视频数据库104中。用户数据库108存储与由用户上传到托管服务100的视频相关联的用户信息。
视频推荐系统102包括关键词提取模块200和视频排名模块300。视频推荐系统102分析存储在视频数据库104中的视频,以从视频标题中提取关键词,并将所提取的关键词和与目标视频相关联的目标关键词进行比较。目标视频是对于其由视频推荐系统102基于与推荐的视频相关联的相似性得分推荐一个或多个相关视频的视频。基于比较,视频推荐系统102对视频进行排名,并且基于排名来选择一个或多个视频作为视频推荐。在一个实施例中,视频推荐系统102离线地(即不是实时地)生成对于目标关键词的视频推荐。视频推荐系统102的其它实施例可以实时地生成视频推荐。
图2是图1所示的视频推荐系统102的关键词提取模块200的框图。在图2所示的实施例中,关键词提取模块200包括识别模块210、提取模块220和元数据模块230。关键词提取模块200选择视频作为视频推荐系统102的目标视频,并从选择的目标视频的标题中提取目标关键词。目标视频的目标关键词被用于选择与目标视频相关的、存储在视频数据库104中的视频。关键词提取模块200进一步获取存储在视频数据库104中视频的元数据和从存储在视频数据库104中的视频的标题中获得关键词。
识别模块210选择视频作为视频推荐系统102的目标视频。例如,识别模块210选择被分类为新闻相关视频的视频,例如选择与谷歌新闻的热门头条相关联的视频作为目标视频。谷歌新闻是计算机生成的新闻网站,其汇总了来自全球新闻来源的头条及其相关联的视频。在一实施例中,识别模块210从非视频语料库——例如一组新闻故事,识别热门新闻项目。识别模块210基于所选择的热门新闻项目的标题来选择视频作为目标视频。应当注意,例如热门新闻项目的媒体项目的标题,通常是总结媒体项目呈现的信息的有效方式。例如,陈述为“演员罗宾·威廉姆斯已经死于63岁”的热门头条新闻的标题简洁地传达了新闻中呈现的信息。具有与热门头条新闻相关的内容的视频,例如罗宾·威廉姆斯担任主角的电影海报的汇集,很有可能被热门头条新闻的读者观看。
识别模块210的其它实施例可以选择其它视频作为视频推荐系统102的目标视频。例如,识别模块210接收由视频托管服务100的用户选择的视频作为目标视频。在另一示例中,识别模块210将视频数据库104中存储的每个视频视为目标视频。
关键词提取模块200的提取模块220从所选择的目标视频的标题中或所选择的非视频热门新闻项目的标题中提取目标关键词,并从存储在视频数据库104中的视频的标题中提取一个或多个关键词。提取模块220可以使用本领域普通技术人员已知的任何关键词提取方案,例如,基于词间距离、词使用频率或预定词关系的关键词识别。在一个实施例中,提取模块220从字符串中提取具有多于三个字符的任何词。字符串可能代表来自谷歌新闻的热门头条的视频的标题或用户选择的视频的标题。为了进一步提高简洁性,提取模块220从提取的关键词中去除诸如“什么”,“在…处”,“当…时”,“是否”和“如何”等通用词。为了避免不必要地去除关键词,提取模块220忽略标题中字母的大写。
以标题为“当4月20日来临时世界各地的人们庆祝地球日”的热门新闻作为示例,提取模块220提取“人们”、“各地(around)”、“世界”、“庆祝”、“地球”、“四月”和“来临”作为目标关键词,并从视频关键词列表中去除通用术语“当…时”和“各地”。以标题为“伊拉克-ISIS 2014:奥巴马关于伊拉克的空袭和空投|纽约时报”的新闻视频作为另一个示例,提取模块220提取“伊拉克”、“ISIS”、“2014年”、“奥巴马”、“伊拉克”、“空袭”、“空投”、“纽约”和“时报”作为视频的关键词。
在一个实施例中,关键词提取模块200在将视频上传到视频托管服务100时从视频的标题中提取关键词。在其它实施例中,关键词提取模块200在收到请求时提取关键词,例如,根据预定时间表——例如,由视频托管服务100接收的每1000个视频,或每24个小时,由视频托管服务100接收到的搜索请求。关键词提取模块200将所提取的关键词与其相关联的标题一起存储在视频数据库104中,例如,将所提取的关键词存储在可被视频排名模块300访问的表中。
元数据模块230获得与存储在视频服务器104中的视频相关联的元数据。视频的元数据描述视频的各种特征。视频的元数据的示例包括例如视频的标题、标题的关键词、视频的来源、视频的标签、视频的持续时间、视频的上传时间和视频的观看者人数。视频的元数据还可以包括描述视频和视频压缩数据的分类的信息,例如视频的比特率和帧大小和/或用于编码的视频数据的视频帧的编码的特征,例如压缩算法的类型。元数据模块230将视频的元数据和视频的识别一起存储在视频数据库104中。
图1中的视频推荐系统102的视频排名模块300对存储在视频数据库104中的视频进行排名。视频可以以各种方式与另一视频相关,诸如视频内容、视频来源、视频的上传时间和与其它视频在一个或多个播放列表上被分组在一起。视频排名模块300可以基于不同的排名准则对视频进行不同的排名。在一个实施例中,视频排名模块300基于视频标题中的关键词与目标视频的一组目标关键词之间的相似性,对存储在视频数据库104中的视频进行排名。
图3是图1所示的视频推荐系统的视频排名模块300的框图。图3中的视频排名模块300具有匹配模块310、排名模块320和推荐模块330。视频排名模块300的其它实施例可以具有不同的或附加的模块。
匹配模块310计算存储在视频数据库中的视频相对于目标视频的相似性得分。在一个实施例中,匹配模块310基于从视频的标题中提取的关键词与从目标视频的标题或选择的非视频新闻项目的标题中提取的目标关键词的比较,生成视频的相似性得分。对于在视频的标题中找到的目标关键词中的每个关键词,匹配模块310对视频的相似性得分增加得分。
例如,从分类为新闻视频的视频中选择的目标视频的目标关键词,例如与谷歌新闻上的标题为“演员罗宾·威廉姆斯已经死于63岁”的热门头条相关联的视频的目标关键词,是“演员”、“罗宾”、“威廉姆斯”和“死”。匹配模块310将每个目标词与存储在视频数据库104的视频或存储在视频数据库104的视频的子集的标题的关键词匹配,例如在过去24小时内更新到视频托管服务100的新闻视频。对于在视频的标题中找到的每个匹配,匹配模块310对视频的相似性得分赋予一分。下面的表I示出了存储在视频数据库104中的视频的示例以及这些视频针对从“演员罗宾·威廉姆斯已经死于63岁”的标题中提取的目标关键词的相关联的相似性得分。
表I
排名模块320对存储在视频数据库104中的视频进行针对目标视频的排名。在一个实施例中,排名模块320基于与视频相关联的相似性得分来对视频排名。排名模块320从具有最高相似性得分的视频开始,接着是具有次高相似性得分的视频,直到具有最低相似性得分的视频为止对视频进行排序。
为了增加排名的粒度,排名模块320可以基于具有一个或多个二级排名准则的相似性得分来增加主要的排名。二级排名准则的示例包括与视频相关联的视频来源、上传时间、视频持续时间和观看者人数。视频的来源可以表明视频的质量。例如,专业人士为“国家地理”拍摄的视频被假定比业余爱好者拍摄的相似视频具有更好的质量。数百万用户共享的视频比在一小组朋友中共享的视频显示更高的流行度。最近上传到视频共享服务100的视频比一个月前上传的视频代表更高的相关性。长视频可能不适合想要快速查看视频的观看者。
为了考虑用于对存储在视频数据库104中的视频进行排名的多个因素,视频排名模块300可以为每个排名因素分配权重并且计算与目标视频相关的每个视频的合计排名得分。分配给每个排名因素的权重是可配置的设计选择,例如,基于描述视频共享环境中的用户频道的用户信息、用户爱好等。
推荐模块330接收针对目标视频的视频的排名,并且基于排名选择一个或多个视频作为视频推荐。在一个实施例中,推荐模块330选择具有最高排名的视频作为推荐,并将该视频推荐给客户端110的用户。
图4是基于从视频的标题中提取的关键词与目标视频的目标关键词的比较的视频推荐的流程图的示例。在图4所示的示例中,视频数据库104具有8个视频的组410:V1、V2、V3、V4、V5、V6、V7和V8。关键词提取模块200从每个视频的标题中提取一组关键词。框420列出从每个视频的标题中提取的关键词的数目。视频排名模块300将与每个视频相关联的关键词与目标视频的一组给定的目标关键词402进行比较。对于目标关键词中的每个关键词,排名模块300确定在视频的标题中是否存在匹配,并且响应于匹配将视频的相似性得分增加得分。框430显示视频、视频的相关联的相似性得分,以及基于视频的相似性得分从最高的相似性得分开始的视频排名顺序。排名模块300选择具有最高相似性得分的视频410,例如视频V1,作为针对一组给定的目标关键词的推荐。
注意到视频V5、V6和V7具有相同的相似性得分:2。为了进一步对视频V5、V6和V7进行排名,排名模块300可以考虑二级因素,诸如视频的来源、视频的持续时间、视频的上传时间和每个视频的观看者人数。基于使用二级因素的分析,排名模块300为每个视频生成合计排名得分。在另一个实施例中,排名模块300可以计算所有8个视频的合计排名得分。
图5是基于关键词的视频推荐的流程图。最初,视频推荐系统102接收目标视频的一组目标关键词(510),例如,从在过去24小时内接收的被谷歌新闻识别的热门新闻项目的标题中提取的关键词。视频推荐系统102接收多个候选视频(520),例如用户上传的视频或由视频托管服务100分类的一个类别的视频。对于每个候选视频,视频推荐系统102从视频的标题中提取一组关键词(530),并将目标关键词与候选视频的关键词进行比较(540)。视频推荐系统102基于关键词比较来计算每个候选视频的相似性得分(550)。例如,将目标关键词的关键词与来自候选视频的标题的关键词之间的匹配算为一分,将其增加到候选视频的相似性得分。基于与候选视频相关联的相似性得分,视频推荐系统102将候选视频排名(560),并选择视频——例如,具有最高排名的视频,作为目标视频的视频推荐(570)。
除了视频之外,推荐系统102的其它实施例可以选择任何其它类型的媒体,例如新闻、文章、数字图像、音频文件或任何机器可读数字文档作为推荐的目标。对于具有标题的每个所选择的媒体项目,推荐系统102从媒体项目的标题中提取目标关键词,并将目标词与存储在视频语料库中的视频的标题的关键词进行比较。基于关键词的比较,推荐系统102计算相似性得分,并且选择一个或多个相关视频作为对选择的媒体项目的推荐。
以例如从谷歌新闻中选择的热门新闻项目的新闻文章作为示例,推荐系统102将新闻文章作为目标,并从新闻文章的标题中提取一个或多个关键词作为目标关键词。推荐系统102将与分类为新闻视频的、存储在新闻视频语料库中的视频相关联的关键词与目标关键词进行比较。基于比较,推荐系统102计算每个新闻视频的相似性得分。推荐系统102基于相似性得分来选择一个或多个新闻视频作为对目标新闻文章的推荐。
说明书中对“一个实施例”或“实施例”的引用意味着结合实施例描述的特定特点、结构或特征被包括在本发明的至少一个实施例中。在说明书的各个地方中出现的短语“在一个实施例中”或“优选实施例”不一定都指代相同的实施例。
上述的一些部分是以计算机存储器内的数据位的操作的方法和符号表示来呈现。这些描述和表示是本领域技术人员用来最有效地将其工作的实质传达给本领域其他技术人员的手段。一种方法在这里,并且一般地被认为是导致期望结果的自相一致序列的步骤(指令)。这些步骤是需要物理量的物理操纵的步骤。通常,虽然不一定需要,这些数量采取能够被存储、传送、组合、比较和以其它方式操纵的电、磁或光信号的形式。有时,主要是出于公共使用的原因,将这些信号称为比特、值、元件、符号、字符、术语、数字等是方便的。此外,在不失一般性的情况下,有时将需要物理量的物理操纵的步骤的特定安排称为模块或代码设备也是方便的。
然而,应该记住,所有这些和相似的术语都应该与适当的物理量相关联,并且仅仅是适用于这些量的方便标签。除非另有特别说明,否则从以下讨论中显而易见,可以理解,在整个说明书中,利用诸如“处理”或“计算(computing)”或“计算(calculating)”或“确定”或“显示”或“确定”等术语的讨论,指的是计算机系统或其他类似电子计算设备的动作和过程,在计算机系统的存储器或寄存器或其他此类信息存储、传输、或显示设备内操纵和转换表示为物理(电子)量的数据。
本发明的某些方面包括本文以方法的形式描述的步骤和指令。应当注意,本发明的处理步骤和指令可以体现在软件、固件或硬件中,并且当以软件体现时,可以下载以驻留在由各种操作系统所使用的不同平台上并由其操作。
本发明还涉及用于执行本文操作的装置。该装置可以为所需目的而特别构造,或者可以包括由存储在计算机中的计算机程序选择性地激活或重新配置的通用计算机。这样的计算机程序可以存储在计算机可读存储介质中,诸如但不限于包括软盘、光盘、CD-ROM、磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、、EEPROM、磁或光卡、专用集成电路(ASIC)等的任何类型的盘或适用于存储电子指令的任何类型的介质,并且每个都耦合到计算机系统总线。此外,说明书中所指的计算机可以包括单个处理器,或者可以是采用多个处理器设计以提高计算能力的架构。
本文呈现的方法和显示并不固有地与任何特定的计算机或其它装置相关。各种通用系统也可以根据本文的教导与程序一起使用,或者可以证明构造更专用的装置来执行所需的方法步骤是方便的。各种这些系统所需的结构将从下面的描述中出现。此外,本发明不参考任何特定的编程语言来描述。应当理解,可以使用各种编程语言来实施如本文所述的本发明的教导,并且提供了下列特定语言的任何参考以用于公开本发明的实现和最佳模式。
虽然已经参考优选实施例和若干替代实施例特别示出和描述了本发明,但是相关领域的技术人员将会理解,在不脱离本发明的精神和范围的情况下,可以在形式和细节上进行各种改变。
最后,应当注意,说明书中使用的语言主要是为了可读性和教学目的而选择的,并且可以不被选择来划定或限定本发明的主题。因此,本发明的公开内容旨在是说明性的,而不是限制本发明的范围。

Claims (21)

1.一种用于在视频共享环境中生成对于视频的视频推荐的计算机实施的方法,包括:
选择目标视频;
从所选择的目标视频的标题中提取多个目标关键词;
接收多个候选视频;
对于每个候选视频:
从所述候选视频的标题中提取多个关键词;
将所述目标关键词与所提取的所述候选视频的关键词进行比较;以及
基于所述比较计算所述候选视频的相似性得分;
基于所计算的相似性得分对所述多个候选视频进行排名;以及
基于所述多个候选视频的所述排名来选择推荐视频。
2.根据权利要求1所述的方法,其中选择目标视频包括从以下中的至少一个选择视频:
与由所述视频共享环境的网络实体识别的热门新闻项目相关的视频;
由用户选择的视频;以及
存储在视频数据库中的视频。
3.根据权利要求1所述的方法,其中从目标视频的所述标题中提取多个目标关键词包括:
从所述标题中提取具有超过三个字符的每个词;以及
从所提取的词中去除一个或多个预定义的词。
4.根据权利要求1所述的方法,其中基于所述比较来计算所述候选视频的相似性得分包括:
将所述目标视频的每个目标关键词与所提取的所述候选视频的关键词中的每个关键词进行比较;以及
响应于所述目标视频的所述目标关键词与所述候选视频的所述关键词之间的匹配,对所述候选视频的所述相似性得分增加分点。
5.根据权利要求1所述的方法,其中从候选视频的所述标题中提取多个关键词包括:
从所述标题中提取具有超过三个字符的每个词;以及
从所提取的词中去除一个或多个预定义的词。
6.根据权利要求1所述的方法,其中对所述多个候选视频进行排名包括:
基于从最高相似性得分开始的所述相似性得分的递减顺序来排序所述多个候选视频。
7.根据权利要求1所述的方法,其中对所述多个候选视频进行排名还包括:
基于多个二级排名因素来调整所述多个候选视频的所述排名。
8.根据权利要求7所述的方法,其中所述多个二级排名因素包括以下中的至少一个:
候选视频的持续时间;
候选视频的来源;
候选视频的上传时间;以及
候选视频的观看者人数。
9.根据权利要求7所述的方法,其中基于多个二级排名因素来调整所述多个候选视频的所述排名包括:
为每个二级排名因素分配权重;
基于加权的所述多个二级排名因素,生成每个候选视频的合计排名得分;以及
基于与所述候选视频相关联的所述合计排名得分来排序所述多个候选视频。
10.根据权利要求1所述的方法,其中基于所述多个候选视频的所述排名来选择推荐视频包括:
从所述多个候选视频中选择具有最高相似性得分的候选视频。
11.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质存储用于在视频共享环境中生成对于视频的视频推荐的可执行计算机程序指令,所述计算机程序指令包括用于以下的指令:
选择目标视频;
从所选择的目标视频的标题中提取多个目标关键词;
接收多个候选视频;
对于每个候选视频:
从所述候选视频的标题中提取多个关键词;
将所述目标关键词与所提取的所述候选视频的关键词进行比较;以及
基于所述比较计算所述候选视频的相似性得分;
基于所计算的相似性得分对所述多个候选视频进行排名;以及
基于所述多个候选视频的所述排名来选择推荐视频。
12.根据权利要求11所述的计算机可读存储介质,其中选择目标视频包括从以下中的至少一个选择视频:
与由所述视频共享环境的网络实体识别的热门新闻项目相关的视频;
由用户选择的视频;以及
存储在视频数据库中的视频。
13.根据权利要求11所述的计算机可读存储介质,其中从目标视频的所述标题中提取多个目标关键词包括:
从所述标题中提取具有超过三个字符的每个词;以及
从所提取的词中去除一个或多个预定义的词。
14.根据权利要求11所述的计算机可读存储介质,其中基于所述比较来计算所述候选视频的相似性得分包括:
将所述目标视频的每个目标关键词与所提取的所述候选视频的关键词中的每个关键词进行比较;以及
响应于所述目标视频的所述目标关键词与所述候选视频的所述关键词之间的匹配,对所述候选视频的所述相似性得分增加分点。
15.根据权利要求11所述的计算机可读存储介质,其中从候选视频的所述标题中提取多个关键词包括:
从所述标题中提取具有超过三个字符的每个词;以及
从所述提取的词中去除一个或多个预定义的词。
16.根据权利要求11所述的计算机可读存储介质,其中对所述多个候选视频进行排名包括:
基于从最高相似性得分开始的所述相似性得分的递减顺序来排序所述多个候选视频。
17.根据权利要求11所述的计算机可读存储介质,其中对所述多个候选视频进行排名还包括:
基于多个二级排名因素来调整所述多个候选视频的所述排名。
18.根据权利要求17所述的计算机可读存储介质,其中所述多个二级排名因素包括以下中的至少一个:
候选视频的持续时间;
候选视频的来源;
候选视频的上传时间;以及
候选视频的观看者人数。
19.根据权利要求17所述的计算机可读存储介质,其中基于多个二级排名因素来调整所述多个候选视频的所述排名包括:
为每个二级排名因素分配权重;
基于加权的所述多个二级排名因素,生成每个候选视频的合计排名得分;以及
基于与所述候选视频相关联的所述合计排名得分来排序所述多个候选视频。
20.一种用于在媒体共享环境中生成对于媒体项目的推荐的计算机实施的方法,包括:
选择媒体项目作为目标项目;
从所选择的目标项目的标题中提取多个目标关键词;
接收多个候选视频;
对于每个候选视频:
从所述候选视频的标题中提取多个关键词;
将所述目标关键词与所提取的所述候选视频的关键词进行比较;以及
基于所述比较计算所述候选视频的相似性得分;
基于所计算的相似性得分对所述多个候选视频进行排名;以及
基于所述多个候选视频的所述排名来选择一个或多个候选视频作为推荐。
21.根据权利要求20所述的方法,其中从多个媒体项目来源选择媒体项目,包括:
非视频新闻项目的语料库;
数字图像的语料库;
音频文件的语料库;以及
机读数字文件的语料库;
其中媒体来源的每个媒体项目具有标题。
CN201680024161.1A 2015-08-24 2016-08-09 基于视频标题的视频推荐 Pending CN107924401A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/833,496 2015-08-24
US14/833,496 US10387431B2 (en) 2015-08-24 2015-08-24 Video recommendation based on video titles
PCT/IB2016/054791 WO2017033083A1 (en) 2015-08-24 2016-08-09 Video recommendation based on video titles

Publications (1)

Publication Number Publication Date
CN107924401A true CN107924401A (zh) 2018-04-17

Family

ID=58100033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680024161.1A Pending CN107924401A (zh) 2015-08-24 2016-08-09 基于视频标题的视频推荐

Country Status (4)

Country Link
US (1) US10387431B2 (zh)
EP (1) EP3341861A4 (zh)
CN (1) CN107924401A (zh)
WO (1) WO2017033083A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109040775A (zh) * 2018-08-24 2018-12-18 深圳创维-Rgb电子有限公司 视频关联方法、装置及计算机可读存储介质
CN109151500A (zh) * 2018-09-29 2019-01-04 北京数美时代科技有限公司 一种针对视频直播的主播推荐方法、系统及计算机设备
CN110941766A (zh) * 2019-12-10 2020-03-31 北京字节跳动网络技术有限公司 一种信息推送的方法、装置、计算机设备及存储介质
CN111061939A (zh) * 2019-12-31 2020-04-24 西安理工大学 基于深度学习的科研学术新闻关键字匹配推荐方法
CN111930925A (zh) * 2020-07-20 2020-11-13 湖北美和易思教育科技有限公司 一种基于在线教学平台的试题推荐方法及系统
WO2021190412A1 (zh) * 2020-03-25 2021-09-30 华为技术有限公司 一种生成视频缩略图的方法、装置和电子设备
CN113507613A (zh) * 2021-06-07 2021-10-15 茂名市群英网络有限公司 基于cdn的视频录入调度系统及方法
CN115244941A (zh) * 2020-09-16 2022-10-25 谷歌有限责任公司 用于改进视频组包的用户界面

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3026584A1 (en) * 2014-11-25 2016-06-01 Samsung Electronics Co., Ltd. Device and method for providing media resource
RU2632131C2 (ru) 2015-08-28 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и устройство для создания рекомендуемого списка содержимого
RU2629638C2 (ru) 2015-09-28 2017-08-30 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер создания рекомендуемого набора элементов для пользователя
RU2632100C2 (ru) * 2015-09-28 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер создания рекомендованного набора элементов
US10032081B2 (en) * 2016-02-09 2018-07-24 Oath Inc. Content-based video representation
RU2632144C1 (ru) 2016-05-12 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Компьютерный способ создания интерфейса рекомендации контента
RU2632132C1 (ru) 2016-07-07 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и устройство для создания рекомендаций содержимого в системе рекомендаций
RU2636702C1 (ru) 2016-07-07 2017-11-27 Общество С Ограниченной Ответственностью "Яндекс" Способ и устройство для выбора сетевого ресурса в качестве источника содержимого для системы рекомендаций
US9905267B1 (en) 2016-07-13 2018-02-27 Gracenote, Inc. Computing system with DVE template selection and video content item generation feature
USD882600S1 (en) 2017-01-13 2020-04-28 Yandex Europe Ag Display screen with graphical user interface
CN108932245A (zh) * 2017-05-24 2018-12-04 合网络技术(北京)有限公司 视频搜索方法及装置
RU2666336C1 (ru) 2017-08-01 2018-09-06 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для рекомендации медиаобъектов
CN108307240B (zh) * 2018-02-12 2019-10-22 北京百度网讯科技有限公司 视频推荐方法和装置
RU2720952C2 (ru) 2018-09-14 2020-05-15 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания рекомендации цифрового содержимого
RU2714594C1 (ru) 2018-09-14 2020-02-18 Общество С Ограниченной Ответственностью "Яндекс" Способ и система определения параметра релевантность для элементов содержимого
RU2720899C2 (ru) 2018-09-14 2020-05-14 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для определения зависящих от пользователя пропорций содержимого для рекомендации
RU2725659C2 (ru) 2018-10-08 2020-07-03 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для оценивания данных о взаимодействиях пользователь-элемент
RU2731335C2 (ru) 2018-10-09 2020-09-01 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для формирования рекомендаций цифрового контента
US10897639B2 (en) * 2018-12-14 2021-01-19 Rovi Guides, Inc. Generating media content keywords based on video-hosting website content
CN110008401B (zh) * 2019-02-21 2021-03-09 北京达佳互联信息技术有限公司 关键词提取方法、关键词提取装置和计算机可读存储介质
CN111797273B (zh) * 2019-04-08 2024-04-23 百度时代网络技术(北京)有限公司 用于调整参数的方法和装置
RU2757406C1 (ru) 2019-09-09 2021-10-15 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для обеспечения уровня сервиса при рекламе элемента контента
WO2021071524A1 (en) * 2019-10-11 2021-04-15 Hewlett-Packard Development Company, L.P. Image recommendation for content publishing
WO2021201893A1 (en) * 2020-04-01 2021-10-07 Hewlett-Packard Development Company, L.P. Item recommendation by chatbot
CA3175544A1 (en) * 2020-09-16 2022-03-24 Google Llc Digital video analysis
CN112100438A (zh) * 2020-09-21 2020-12-18 腾讯科技(深圳)有限公司 一种标签抽取方法、设备及计算机可读存储介质
CN112188295B (zh) * 2020-09-29 2022-07-05 有半岛(北京)信息科技有限公司 一种视频推荐方法及装置
CN113709529B (zh) * 2021-04-13 2023-07-14 腾讯科技(深圳)有限公司 视频合成方法、装置、电子设备及计算机可读介质
CN113886633B (zh) * 2021-10-11 2024-07-02 平安国际智慧城市科技股份有限公司 基于人工智能的视频推荐、装置、设备及存储介质
CN113807085B (zh) * 2021-11-19 2022-03-04 成都索贝数码科技股份有限公司 一种针对新闻场景的标题字幕提取方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090006368A1 (en) * 2007-06-29 2009-01-01 Microsoft Corporation Automatic Video Recommendation
US20090240674A1 (en) * 2008-03-21 2009-09-24 Tom Wilde Search Engine Optimization
CN101930438A (zh) * 2009-06-19 2010-12-29 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN103136275A (zh) * 2011-12-02 2013-06-05 盛乐信息技术(上海)有限公司 个性化视频推荐系统及方法
US20130191362A1 (en) * 2008-06-13 2013-07-25 News Distribution Network, Inc. Searching, sorting, and displaying video clips and sound files by relevance
US20140136528A1 (en) * 2012-11-12 2014-05-15 Google Inc. Providing Content Recommendation to Users on a Site
CN104219575A (zh) * 2013-05-29 2014-12-17 酷盛(天津)科技有限公司 相关视频推荐方法及系统
CN104462573A (zh) * 2014-12-29 2015-03-25 北京奇艺世纪科技有限公司 一种视频搜索结果展示方法及装置
CN104699696A (zh) * 2013-12-05 2015-06-10 深圳市腾讯计算机系统有限公司 文件推荐方法和装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100515052C (zh) 2003-11-13 2009-07-15 松下电器产业株式会社 节目推荐装置以及节目推荐装置的节目推荐方法
JP4664283B2 (ja) 2004-06-08 2011-04-06 パナソニック株式会社 番組選択支援装置
JP4779481B2 (ja) * 2005-07-19 2011-09-28 ソニー株式会社 情報処理装置および方法、並びにプログラム
US8538989B1 (en) * 2008-02-08 2013-09-17 Google Inc. Assigning weights to parts of a document
US8364671B1 (en) * 2009-02-23 2013-01-29 Mefeedia, Inc. Method and device for ranking video embeds
US20120151342A1 (en) 2010-12-13 2012-06-14 Sony Corporation Of America User interface for prioritizing media content
US8868481B2 (en) * 2011-12-14 2014-10-21 Google Inc. Video recommendation based on video co-occurrence statistics
US20140201180A1 (en) * 2012-09-14 2014-07-17 Broadbandtv, Corp. Intelligent Supplemental Search Engine Optimization
US9110988B1 (en) 2013-03-14 2015-08-18 Google Inc. Methods, systems, and media for aggregating and presenting multiple videos of an event
US20150020106A1 (en) * 2013-07-11 2015-01-15 Rawllin International Inc. Personalized video content from media sources
US20160041998A1 (en) * 2014-08-05 2016-02-11 NFL Enterprises LLC Apparatus and Methods for Personalized Video Delivery

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090006368A1 (en) * 2007-06-29 2009-01-01 Microsoft Corporation Automatic Video Recommendation
US20090240674A1 (en) * 2008-03-21 2009-09-24 Tom Wilde Search Engine Optimization
US20130191362A1 (en) * 2008-06-13 2013-07-25 News Distribution Network, Inc. Searching, sorting, and displaying video clips and sound files by relevance
CN101930438A (zh) * 2009-06-19 2010-12-29 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN103136275A (zh) * 2011-12-02 2013-06-05 盛乐信息技术(上海)有限公司 个性化视频推荐系统及方法
US20140136528A1 (en) * 2012-11-12 2014-05-15 Google Inc. Providing Content Recommendation to Users on a Site
CN104219575A (zh) * 2013-05-29 2014-12-17 酷盛(天津)科技有限公司 相关视频推荐方法及系统
CN104699696A (zh) * 2013-12-05 2015-06-10 深圳市腾讯计算机系统有限公司 文件推荐方法和装置
CN104462573A (zh) * 2014-12-29 2015-03-25 北京奇艺世纪科技有限公司 一种视频搜索结果展示方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《信息检索教程》: "《信息检索教程》", 31 March 2010 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109040775A (zh) * 2018-08-24 2018-12-18 深圳创维-Rgb电子有限公司 视频关联方法、装置及计算机可读存储介质
CN109151500A (zh) * 2018-09-29 2019-01-04 北京数美时代科技有限公司 一种针对视频直播的主播推荐方法、系统及计算机设备
CN110941766A (zh) * 2019-12-10 2020-03-31 北京字节跳动网络技术有限公司 一种信息推送的方法、装置、计算机设备及存储介质
CN110941766B (zh) * 2019-12-10 2023-10-20 北京字节跳动网络技术有限公司 一种信息推送的方法、装置、计算机设备及存储介质
CN111061939A (zh) * 2019-12-31 2020-04-24 西安理工大学 基于深度学习的科研学术新闻关键字匹配推荐方法
CN111061939B (zh) * 2019-12-31 2023-03-24 西安理工大学 基于深度学习的科研学术新闻关键字匹配推荐方法
WO2021190412A1 (zh) * 2020-03-25 2021-09-30 华为技术有限公司 一种生成视频缩略图的方法、装置和电子设备
CN111930925A (zh) * 2020-07-20 2020-11-13 湖北美和易思教育科技有限公司 一种基于在线教学平台的试题推荐方法及系统
CN111930925B (zh) * 2020-07-20 2024-01-23 湖北美和易思教育科技有限公司 一种基于在线教学平台的试题推荐方法及系统
CN115244941A (zh) * 2020-09-16 2022-10-25 谷歌有限责任公司 用于改进视频组包的用户界面
CN113507613A (zh) * 2021-06-07 2021-10-15 茂名市群英网络有限公司 基于cdn的视频录入调度系统及方法

Also Published As

Publication number Publication date
US20170060870A1 (en) 2017-03-02
US10387431B2 (en) 2019-08-20
EP3341861A4 (en) 2019-03-06
EP3341861A1 (en) 2018-07-04
WO2017033083A1 (en) 2017-03-02

Similar Documents

Publication Publication Date Title
CN107924401A (zh) 基于视频标题的视频推荐
US11601703B2 (en) Video recommendation based on video co-occurrence statistics
KR101678521B1 (ko) 도서 추천 서비스 제공 장치 및 방법
US11455465B2 (en) Book analysis and recommendation
WO2017181612A1 (zh) 个性化视频推荐方法及装置
US20140201180A1 (en) Intelligent Supplemental Search Engine Optimization
CN105916032A (zh) 视频推荐的方法及视频推荐的终端设备
Yamasaki et al. Social popularity score: Predicting numbers of views, comments, and favorites of social photos using only annotations
CN114845149B (zh) 视频片段的剪辑方法、视频推荐方法、装置、设备及介质
Kaneko et al. Visual event mining from geo-tweet photos
CN105574030A (zh) 一种信息搜索方法及装置
KR101346927B1 (ko) 검색 장치, 검색 방법, 및 검색 프로그램을 기억하는 컴퓨터 판독 가능한 기록 매체
KR20140006516A (ko) 위치 기반 콘텐츠 추천 서비스 제공 시스템 및 방법
US20240220537A1 (en) Metadata tag identification
JP2014153977A (ja) コンテンツ解析装置、コンテンツ解析方法、コンテンツ解析プログラム、およびコンテンツ再生システム
KR101486924B1 (ko) 소셜 네트워크 서비스를 이용한 미디어 콘텐츠 추천 방법
WO2016125166A1 (en) Systems and methods for analyzing video and making recommendations
CN112445921B (zh) 摘要生成方法和装置
CN113705209A (zh) 一种副标题的生成方法、装置、电子设备和存储介质
Papadakis et al. Movie score: Personalized movie recommendation on mobile devices
US20180268066A1 (en) Information providing system, information providing server, information providing method, and program for information providing system
AU2015200201B2 (en) Video recommendation based on video co-occurrence statistics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination