CN108475279B - 视频竞争发现和推荐 - Google Patents

视频竞争发现和推荐 Download PDF

Info

Publication number
CN108475279B
CN108475279B CN201680078204.4A CN201680078204A CN108475279B CN 108475279 B CN108475279 B CN 108475279B CN 201680078204 A CN201680078204 A CN 201680078204A CN 108475279 B CN108475279 B CN 108475279B
Authority
CN
China
Prior art keywords
video
search
videos
competition
hosting system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680078204.4A
Other languages
English (en)
Other versions
CN108475279A (zh
Inventor
卢卡·基亚兰蒂尼
约翰·乔治·格伦斯特伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN108475279A publication Critical patent/CN108475279A/zh
Application granted granted Critical
Publication of CN108475279B publication Critical patent/CN108475279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供确定计算机网络上对于视频托管系统上的搜索查询的竞争的计算机实现的方法和系统。接收与针对视频托管系统的搜索查询相关联的搜索记录。每个搜索记录识别视频托管系统上可用的视频并且指示视频响应于搜索查询而被观看的关联观看持续时间,所述视频是对应搜索查询的搜索结果。从所接收的搜索记录中,识别针对第一视频和第二视频的搜索查询以及第一视频响应于查询而被观看的关联观看持续时间。基于所识别的搜索查询和关联观看持续时间,计算指示第一视频与第二视频对视频托管系统的用户观看的竞争量的竞争分值。

Description

视频竞争发现和推荐
技术领域
本发明总体上涉及在线视频和流送服务,具体涉及将观看者引导到这样的服务上的特定视频。
背景技术
在线系统存储、索引各种形式的媒体内容并且使其可用于供互联网用户消费。这种内容可能采取多种形式;特别是,包括流式视频的视频内容跨互联网而广泛可用。在线视频系统允许用户观看其他用户上传的视频。
用户能够经由搜索于在线视频系统上发现新的内容。典型地,用户提供搜索查询并且接收视频列表作为返回的搜索结果。这些视频通常被排名并且基于排名而依序呈现给用户。相比排名更低的视频,排名更高的视频在更突出的位置呈现给用户,并且更有可能吸引用户访问。在搜索查询的搜索结果当中,一些视频包括原创内容并且由内容制作者或合作者上传;而一些视频可能使用原创内容并且由并非内容制作者或合作者的用户上传。包括原创内容的视频在下文中称为“原创视频”,并且并非由原作者或创作者创建但使用原创内容的视频在下文中称为“衍生视频”。换而言之,衍生视频包括原创视频的至少一些媒体内容(例如,视频、音频)。衍生视频与原创视频竞争用户观看、干扰原创视频的播放并且使用户对原创视频的搜索复杂化。结果,为保障用户的利益以及内容制作者的利益,区分原创视频与衍生视频是有用的。
发明内容
在一个实施例中,一种提供与计算机网络上的视频托管系统上的视频相关联的元数据的计算机实现的方法包括接收与针对视频托管系统的搜索查询相关联的搜索记录。每个搜索记录识别视频托管系统上可用的视频的集合并且指示所述集合中的视频响应于搜索查询而被观看的关联的观看持续时间,所述视频是对应搜索查询的搜索结果。所述方法从所接收的搜索记录中识别竞争视频托管系统的用户的观看的第一视频和第二视频。第一视频和第二视频各自具有分别描述第一视频和第二视频的元数据。所述方法从搜索记录中识别针对第一视频的第一搜索查询集合。第一视频是第一集合中的搜索查询的搜索结果。所述方法识别与第一搜索查询集合相关联的搜索词项并且进一步将所识别的搜索词项与第二视频的元数据进行比较。响应于比较指示第二视频的元数据不包括搜索词项,所述方法将搜索词项识别为对第二视频的元数据改进。所述方法进一步将元数据改进提供给与第二视频相关联的视频托管系统的用户。
在一个实施例中,一种视频托管系统包括计算机处理器以及存储指令的非暂时性计算机可读存储介质,所述指令被配置成使得计算机处理器接收与针对视频托管系统的搜索查询相关联的搜索记录。每个搜索记录识别视频托管系统上可用的视频的集合并且指示集合中的视频响应于搜索查询而被观看的关联观看持续时间,所述视频是对应搜索查询的搜索结果。所述指令被配置成使得计算机处理器从所接收的搜索记录中识别竞争视频托管系统的用户的观看的第一视频和第二视频。第一视频和第二视频各自具有分别描述第一视频和第二视频的元数据。所述指令被配置成使得计算机处理器从搜索记录中识别针对第一视频的第一搜索查询集合。第一视频是第一集合中的搜索查询的搜索结果。所述指令被配置成使得计算机处理器识别与第一搜索查询集合相关联的搜索词项并且进一步将所识别的搜索词项与第二视频的元数据进行比较。所述指令被配置成使得计算机处理器:响应于比较指示第二视频的元数据不包括搜索词项,将搜索词项识别为对第二视频的元数据改进。所述指令被配置成使得计算机处理器将元数据改进提供给与第二视频相关联的视频托管系统的用户。
在一个实施例中,一种非暂时性计算机可读存储介质包含计算机程序代码,其可执行来执行包括以下的步骤:接收与计算机网络上针对视频托管系统的搜索查询相关联的搜索记录。每个搜索记录识别视频托管系统上可用的视频的集合并且指示集合中的视频响应于搜索查询而被观看的关联的观看持续时间,所述视频是对应搜索查询的搜索结果。所述步骤包括从所接收的搜索记录中识别竞争视频托管系统的用户的观看的第一视频和第二视频。第一视频和第二视频各自具有分别描述第一视频和第二视频的元数据。所述步骤包括从搜索记录中识别针对第一视频的第一搜索查询集合。第一视频是第一集合中的搜索查询的搜索结果。所述步骤包括识别与第一搜索查询集合相关联的搜索词项并且将所识别的搜索词项与第二视频的元数据进行比较。所述步骤包括进一步包括:响应于比较指示第二视频的元数据不包括搜索词项,将搜索词项识别为对第二视频的元数据改进。所述步骤包括提供给与第二视频相关联的视频托管系统的用户。
附图说明
图1是根据一个实施例的评估视频间对用户观看的竞争的系统的高级框图。
图2是根据一个实施例的视频竞争引擎的框图。
图3A图示出根据一个实施例的确定视频间竞争的过程。
图3B图示出根据一个实施例的确定和推荐与视频相关的元数据改进的过程。
图4图示出将与所监视的视频业务相关的信息显示给视频所有者的示例用户界面。
具体实施方式
系统架构
图1是根据一个实施例的,评估视频间对用户观看的竞争的系统的高级框图。图1图示通过网络124连接的视频托管系统102和用户120。用户120表示能够访问视频托管系统102内所包含的视频的实体。用户120能够通过浏览视频目录、使用关键字执行搜索、查阅来自其他用户或系统管理员的播放列表(例如,形成频道的视频集)或者观看与特定用户群组(例如,社区)相关联的视频来访问视频托管系统102中的视频。此外,在一些实施例中,视频托管系统102适于接收用于存储的视频,以便能够与其他用户共享视频。
在一个实施例中,用户120使用计算机系统通过网络124与视频托管系统102通信。在一个实施例中,计算机系统是执行诸如GOOGLE CHROME的web浏览器122的个人计算机,该web浏览器122允许用户查看由视频托管系统102提供的web页面和视频。在另一个实施例中,计算机系统是执行软件应用(“app”)的诸如智能电话或平板型计算机的移动设备,甚至是个人计算机,该软件应用提供用于访问视频托管系统102的特定功能。由用户120使用的计算机系统也可以是诸如汽车娱乐系统、电视“机顶盒”等的另一支持网络的设备。尽管图1仅图示出单个用户,但应理解,许多用户(例如,数百万个)可能随时与视频托管系统102通信。为使本说明书简要并清楚,图中图示出单个用户120。
网络124表示用户与视频托管系统102之间的通信路径。在一个实施例中,网络124是互联网,但也可以是任何网络,包括但不限于有线或无线网络、云计算网络、专用网络、虚拟专用网络以及其任何组合。此外,能够使用诸如安全套接字层(SSL)、安全HTTP和/或虚拟专用网络(VPN)的常规加密技术对全部或某些链接进行加密。在另一个实施例中,实体能够使用定制和/或专门的数据通信技术来代替或补充上述技术。
视频托管系统102允许用户经由搜索和/或浏览界面访问视频内容。视频的来源能够来自用户上传的视频、搜索或爬取其他网站或视频数据库等或者其任何组合。例如,在一个实施例中,视频托管系统102能够被配置成允许用户上传内容;在另一个实施例中,视频托管系统102能够被配置成仅通过实时爬取其他源或搜索其他源而从这样的源获得视频。
一种用于实现该系统的合适的视频托管系统102是YOUTUBETM网站。应当理解,术语“网站”表示适于使用任何互联网协议来提供内容的任何计算机系统,并不旨在限于经由互联网或HTTP协议上传或下载的内容。一般而言,在一个实施例中描述为在服务器侧执行的功能在其他实施例中也能够酌情在客户端侧执行。此外,归属于特定组件的功能可能由共同操作的不同组件或多个组件执行。
视频托管系统102包括前端服务器104、摄取服务器106、视频搜索服务器108、视频竞争引擎110、视频访问服务器112、视频数据存储114和查询数据存储116。图中并未示出诸如防火墙、负载均衡器、应用服务器、故障切换服务器、站点管理工具等许多常规特征,以免模糊系统的特征。
前端服务器104处置所有经由网络124与用户的通信。前端服务器104从用户接收请求并且与视频托管系统102的其他服务器通信以处理该请求。前端服务器104被进一步配置成监视与视频托管系统102的用户交互。例如,如果用户点击web页面、观看视频、进行购买、打开文档或者填写基于web的表单,则前端服务器104监视这些交互。前端服务器104可以被进一步配置成在web页面上将所请求的视频和相关的视频链接传送并呈现给用户。所请求的视频由前端服务器104流送给用户。一个或多个相关的视频链接出现在正播放所请求的视频的web页面上,使得用户120能够选择相关的视频链接以便观看相关的视频。
经由网络124从用户接收以供发布到视频托管系统102的任何内容被传递到摄取服务器106以供处理。对视频文件的处理包括向新接收的视频文件指派标识符。处理视频文件的其他步骤可以包括格式化(例如,转码)、压缩、元数据标记、内容分析和/或其他数据处理方法。视频文件的元数据包括描述视频文件的媒体内容的标签。例如,“Hemingway(海明威)”、“philosophy(哲学)”和“meditate(冥想)”、“pugs(八哥犬)”和“jazz(爵士)”皆为标签的示例。发布视频文件的用户可以提供与视频文件相关联的标签作为元数据。此外,摄取服务器106可以分析视频文件的媒体内容以识别标签并且将所识别的标签与视频文件相关联。在一个实施例中,用户随同传送到视频托管系统102的视频文件一起传送表单。用户可以在表单中包括描述视频的信息(例如,标题、描述和标签信息)。表单信息也可以包括媒体类型的指示,该媒体类型的指示对于上传的视频而言始终会是“视频”类型。摄取服务器106将处理后的视频文件存储在视频数据存储114中,并且将包括在表单中的信息存储为视频文件的元数据。视频数据存储114是存储传送到视频托管系统102的视频文件的存储系统。视频可以伴有图标或缩略图视图、关联的元数据,诸如标题、作者、标签、描述、评论和评级。
视频搜索服务器108处理由前端服务器104接收的用户请求并且识别与该用户请求相关的视频。由用户向前端服务器104提供的用户请求可以包括指定一个或多个搜索词项的搜索查询。搜索查询是由用户录入的用于搜索满足用户信息需求的一个或多个视频的查询。搜索查询可以包括搜索词项,所述搜索词项是能够用来识别用户有兴趣观看的视频的文本(例如,关键字)和/或图像。例如,搜索查询可以包括搜索词项“Kilimanjaro(乞力马扎罗)”。例如,视频搜索服务器108可以使用搜索词项来查询存储在视频数据存储114中的所有视频文件的元数据。搜索结果是其关联元数据与搜索词项相关的视频。例如,搜索查询“Kilimanjaro”的搜索结果包括与匹配搜索词项“Kilimanjaro”的元数据“Kilimanjaro”相关联的视频。来自查询的搜索结果被传送到前端服务器104,使得搜索结果能够呈现给用户。可以基于搜索结果与搜索查询的相关性来对搜索结果进行排名,并且将搜索结果以排名的顺序呈现给用户。与搜索查询的相关性更高的视频排名高于与搜索查询的相关性更低的那些视频。
视频搜索服务器108生成搜索日志并且将所生成的搜索日志存储在查询数据存储116中。搜索日志包括诸如以下的信息:将用户引导到视频的搜索查询、搜索查询将用户引导到的视频、已观看视频的次数、已观看视频的时间量等。例如,搜索日志可以包括指示全球变暖纪录片是对于搜索查询“Kilimanjaro”以及“Africa snow(非洲下雪)”二者的搜索结果的信息。搜索日志也包括指示以下的信息:搜索查询“Kilimanjaro”的搜索结果包括全球变暖纪录片、某个人徒步乞力马扎罗山脉的视频以及歌手的“Kilimanjaro”歌曲的视频是搜索结果。搜索日志进一步包括示出不同用户观看全球变暖纪录片花费的时间量(即,持续时间)的信息。在一些实施例中,搜索日志包括与搜索查询相关联的搜索记录的历史。每个搜索记录包括搜索词项、用户、执行搜索时的当前时间、搜索结果(即,响应于搜索查询而返回给用户的视频)、搜索结果当中被用户观看的视频的标识符、每个视频被用户观看的观看持续时间以及其他信息。
视频访问服务器112从前端服务器104接收来自用户的希望观看特定视频的请求。从用户的角度来看,用户可以通过浏览视频托管系统102的不同类别或者通过点击指向搜索结果web页面中的视频的链接来提交对于视频的请求。由用户传送的请求能够包括用户希望观看的视频的标识符(一旦用户点击视频的链接,便能够自动包括该标识符)。视频访问服务器112使用标识符来搜索并定位视频存储在视频数据存储114中的位置。视频访问服务器112将所请求的视频提供给前端服务器104。
视频竞争引擎110确定视频对用户观看的竞争。当搜索查询产生多个搜索结果时,这些结果中列出的视频竞争用户的观看。特别地,衍生视频(即,其内容是基于原创内容而生成的视频)分散用户对原创视频(即,内容是原创的视频)的观看。视频竞争引擎110确定一对视频之间的竞争分值。竞争分值测量两个视频竞争的搜索查询之间的相似性。更高的竞争分值指示两个视频将出现在相同搜索查询的搜索结果中的似然率升高,而更低的竞争分值指示两个视频出现在相同搜索查询的搜索结果中的似然率降低。例如,竞争分值为1可以指示两个视频始终出现在相同搜索查询的搜索结果中,而竞争分值为0可以指示两个视频从不一起出现在任何搜索查询的搜索结果中。
此外,视频竞争引擎110可以确定合计搜索竞争分值,其测量所有其他视频总体上与给定视频对用户观看的竞争。对于给定视频,合计搜索竞争分值可以通过合计对于该视频和其他视频确定的个体竞争分值来确定。更高的合计竞争分值指示可能存在至少一个其他视频与该视频竞争非常相似的搜索查询,或者可能存在多个其他视频与该视频竞争有些相似的搜索查询。例如,合计竞争分值为1指示可能存在至少一个其他视频与该视频竞争完全相同的搜索查询,或者可能存在多个其他视频与该视频竞争相似的搜索查询。对于特定的合计竞争分值,正同该视频竞争的其他视频的数量与视频正竞争的搜索查询之间的相似度能够呈负相关。
视频搜索服务器108或视频竞争引擎110可以基于所确定的视频之间的竞争来调整搜索查询的搜索结果的排名。搜索竞争分值和/或合计搜索竞争分值可以被使用于使视频降级,诸如与原创视频竞争的衍生视频,以使它们分散用户观看原创视频的注意力降低至最低程度。此外,合计搜索竞争分值可以被使用于确定由视频集形成的频道的原创性。频道的原创性可以被使用于奖励频道。视频竞争引擎110可以监视去往原创视频和衍生视频的业务(例如,用户观看的次数、用户观看的观看持续时间)。视频竞争引擎110可以识别原创视频中不存在的衍生视频的元数据,并且向原创视频的所有者建议将元数据包括在原创视频中。
应领会到,如本文所述,视频竞争引擎110的数据处理操作固有地需要经编程的计算机系统用于它们的实际实现。出于精简和阐明本说明书起见,由视频托管系统102接收并共享的内容大体上称为视频、视频文件或视频项目,以适于本文所述的视频特定的实施例,但应理解到,视频托管系统102能够接收并共享任何媒体类型的内容。该内容可以称为媒体内容项目、媒体项目或项目。因此,本文所述的用于确定视频文件间的竞争的视频竞争引擎110的操作能够应用于任何类型的媒体内容项目,而不仅是视频;其他合适类型的内容项目包括音频文件(例如,音乐、播客、有声读物等)、文档、多媒体演示、数字购买商品和服务等等。
视频竞争引擎
图2是图示出根据一个实施例的视频竞争引擎110的细节视图的高级框图。如图2所示,视频竞争引擎110包括若干模块。本领域技术人员会认识到,其他实施例可能具有与本文所述的模块不同的模块,并且所述功能可能以不同方式分布于模块间。此外,属于视频竞争引擎110的功能能够由多个引擎执行。如图所示,视频竞争引擎110包括向量生成模块202、相似性确定模块204、合计模块206、竞争监视与呈现模块208、元数据推荐模块210和相似性数据存储212。
向量生成模块202生成视频的向量。向量表示用户响应于搜索查询而观看视频的持续时间。向量生成模块202可以分析查询数据存储116中的信息以生成视频的向量。例如,向量生成模块202从查询数据存储116中识别全部或一些搜索查询。此外,对于每个所识别的搜索查询,向量生成模块202确定该搜索查询所针对的视频以及响应于基于该查询接收到搜索结果而观看该视频的持续时间。也就是说,识别搜索查询的搜索结果中所包括的视频,并且确定响应于搜索查询而观看该视频的持续时间。对于视频,根据方程式(1),向量生成模块202生成向量:
Figure BDA0001722022230000091
其中
Figure BDA0001722022230000101
是所识别的搜索查询的查询空间,其中每个维度对应于一个查询qi;并且Vn是响应于对应的搜索查询qn而观看视频的时间量。换而言之,查询空间
Figure BDA0001722022230000102
是搜索查询q的集合。表示视频的向量V是其搜索结果包括该视频的搜索查询qn的线性组合(即,基向量)。每个基向量qn(即,搜索查询)的标量是响应于该搜索查询而观看视频的时间量。
相似性确定模块204测量一个视频与另一个视频竞争的搜索查询之间的相似性。如本文所述,如果两个视频都在搜索查询的搜索结果当中,则它们竞争该搜索查询。相似性确定模块204可以确定搜索竞争分值,该搜索竞争分值测量将用户引导到一个视频的一个搜索查询集合与将用户引导到另一个视频的另一个搜索查询集合之间的相似性。在查询空间中,表示竞争相同查询的视频的向量指向相同的方向,因为这些向量具有完全相同的基向量。在一个实施例中,根据方程式(2),相似性确定模块204确定两个视频的搜索竞争分值SCS(vi,vj):
Figure BDA0001722022230000103
其中vi是对于第一视频i生成的向量,vj是对于第二视频j生成的向量。搜索竞争分值SCS(vi,vj)是测量向量夹角余弦的内积空间中对于两个视频生成的向量之间的相似度的量度。所确定的搜索竞争分值SCS(vi,vj)是从0到1范围内的值。如前所述,更高的搜索竞争分值指示视频竞争的搜索查询之间的相似性更大。相似性确定模块204可以将所确定的搜索竞争分值SCS(vi,vj)存储在相似性数据存储212中。
合计模块206测量一个视频与其他视频总体竞争的搜索查询之间的相似性。对于特定视频,合计模块206可以确定总体搜索竞争分值,该总体搜索竞争分值测量将用户引导到一个视频的一个搜索查询集合与将用户引导到其他视频的另一个搜索查询集合之间的相似性。
在各个实施例中,总体搜索竞争分值具有从0到1范围内的值。合计模块206根据各种规则来确定总体搜索竞争。首先,对于特定视频,如果存在特定视频和另一个视频的值为1的搜索竞争分值,则合计模块206确定总体搜索竞争分值为1。也就是说,如果存在与一个视频竞争完全相同的搜索条目的另一个视频,则合计模块206确定总体搜索竞争分值为1。其次,对于特定视频,如果特定视频和所有其他视频的所有搜索竞争分值皆为0,则合计模块206确定总体搜索竞争分值为0。也就是说,仅当不存在其他视频与某个视频竞争任何搜索查询时,合计模块206才确定总体搜索竞争分值为0。此外,合计模块206确定第一视频和给定视频的集合的第一总体搜索竞争分值与第二视频和给定视频的集合的第二总体搜索竞争分值之间的关系。合计模块206确定:对于给定集合中的任何视频,如果与第一视频的搜索竞争分值小于与第二视频的搜索竞争分值,则第一总体搜索竞争分值小于第二总体搜索竞争分值。合计模块206在合计搜索竞争分值时维持所确定的关系。
在一个实施例中,根据方程式(3),合计模块206确定特定视频的总体搜索竞争分值gSCS(vi):
Figure BDA0001722022230000111
其中SCS(vi,vj)是给定视频与其他视频中的一个视频之间的搜索竞争分值,并且函数f(x)定义0到1的区间与0到无穷的区间之间的一一对应关系。在一些实施例中,函数f(x)定义为
Figure BDA0001722022230000112
合计模块206可以将所确定的总体搜索竞争分值gSCS(vi)存储在相似性数据存储212中。相似性数据存储212可以存储对于原创视频和衍生视频所确定的搜索竞争分值以及对于原创视频所确定的总体搜索竞争分值。
对于特定视频,合计模块206可以通过合计对于该视频和其他视频所确定的搜索竞争分值来确定总体搜索竞争分值。其他视频可以基于内容或所有者来确定。其他视频可以包括作为查询空间的所有搜索查询的搜索结果的所有其他视频。对于具有特定内容的一个视频,合计模块206可以合计对于该视频和该特定视频的衍生视频所确定的搜索竞争分值。例如,合计对于原创音乐视频以及包括整首歌曲或歌曲中的一段的衍生视频所确定的搜索竞争分值以确定总体搜索竞争分值。对于具有特定内容的一个视频,合计模块206可以合计对于该视频以及该视频的衍生视频的所有者所拥有的所有视频所确定的搜索竞争分值。例如,对于原创音乐视频以及包括整首歌曲或歌曲中的一段的衍生视频的所有者所拥有的所有视频所确定的搜索竞争分值被合计成总体搜索竞争分值。
合计模块206可以进一步确定由视频集形成的频道的原创性。频道的原创性测量频道中所包括的视频集与其他视频竞争的搜索查询之间的整体相似性。对于频道中所包括的每个视频,合计模块206基于计算出的搜索竞争分值来识别竞争视频。对于视频及其竞争视频所确定的搜索竞争分值超过阈值。合计模块206能够从搜索日志中确定与视频相关联的观看持续时间。在一个实施例中,根据方程式(4),合计模块206计算频道的原创性:
Figure BDA0001722022230000121
其中gSCS(v)是频道C中所包括的视频v的总体搜索竞争分值,watchtime(v)是频道C中所包括的视频v的观看持续时间。频道的原创性是从0到1范围内的值。原创性为1的频道指示该频道与其竞争视频相比吸引所有用户观看。原创性为0的频道指示该频道中所包括的视频与其竞争视频相比不吸引用户观看。
竞争监视与呈现模块208监视定向到不同视频的业务(例如,用户观看计数和观看持续时间),并且将显示与所监视的业务相关的信息的用户界面呈现给用户。竞争监视与呈现模块208可以分析搜索日志以监视定向到不同视频的业务。竞争监视与呈现模块208解析搜索日志以按目的地对业务进行分类(例如,原创视频、原创视频的衍生视频)。对于去往原创视频的业务,竞争监视与呈现模块208可以通过搜索查询、响应于搜索查询对原创视频的观看计数、响应于搜索查询对原创视频的观看持续时间、与搜索查询相关联的用户属性(例如,群体特征、位置等)以及诸如此类对业务进行分类。
竞争监视与呈现模块208分析所监视的业务并且将显示与所监视的业务的分析相关的信息的用户界面呈现给用户。在一个实施例中,竞争监视与呈现模块208生成将与所监视的业务相关的信息呈现给视频所有者的用户界面。
图4图示出将与所监视的视频业务相关的信息显示给视频所有者的示例用户界面400。用户界面400将与包括所监视的业务的视频相关的各种信息以及对其的分析呈现给视频的所有者。在所图示的示例中,用户界面呈现包括艺术家和标题的视频标识符402。此外,用户界面400还呈现与所监视的业务相关的信息,诸如视频402的总观看计数404和总观看持续时间406。竞争监视与呈现模块208随时间流逝合计已观看视频的次数,并且将所确定的数量作为总观看计数404在用户界面400中呈现。竞争监视与呈现模块208进一步随时间流逝合计观看视频的观看持续时间,并且将所确定的观看持续时间作为总观看持续时间406在用户界面400中呈现。用户界面400也呈现将用户引导到视频402的搜索查询以及与每个搜索查询相关联的对应观看计数。如图所示,视频402在对于搜索查询410的搜索结果当中。也就是说,如果用户输入搜索查询410中的任何一个,则搜索查询410能够将用户引导到视频402。将用户引导到视频402的搜索查询能够按照业务排名并且基于关联的观看计数按照降序呈现。如图所示,区域408a至408e分别表示响应于搜索查询410a至410e而观看视频402的总观看计数。每当用户通过使用搜索查询找到并播放音乐视频402时,与该搜索查询相对应的总观看计数增加1。
竞争监视与呈现模块208可以进一步对于每个搜索查询确定去往原创视频以及去往竞争视频的业务。每个搜索查询与用户通过使用搜索查询观看视频的观看计数414和总观看持续时间416以及平均观看持续时间418相关联。竞争监视与呈现模块208通过将总观看持续时间416除以观看计数414来确定对于搜索查询的平均观看持续时间418。将用户引导到特定视频的各个搜索查询可以包括不同的搜索词项并因此生成不同的业务量。搜索查询根据关联的观看计数来组织,并且根据观看计数、观看持续时间或平均观看持续时间来按照降序呈现给视频所有者。例如,搜索查询410a和410b包括不同的搜索词项。与搜索查询410a相关联的观看计数远高于与搜索查询410b相关联的观看计数。
如图所示,水平条420a的长度表示响应于搜索查询410a对视频402的总观看计数,并且水平条420a'的长度表示响应于搜索查询410a对视频402的竞争视频的观看计数。同样地,水平条420b至420d的长度表示响应于搜索查询410b至410d对视频402的总观看计数,并且水平条420b'至420d'的长度分别表示响应于搜索查询410b至420d对视频402的竞争视频的观看计数。用户界面400以图形方式区分水平条420a至420d与水平条420a'至420d'。作为结果,用户界面400以图形方式区分响应于搜索查询导向原创视频的业务与导向原创视频的竞争视频的业务。
此外,搜索查询能够具有不同程度的有效性。当所有生成的业务皆去往原创视频时,搜索查询的有效性最高。搜索查询的有效性可以通过将原创视频的观看计数与竞争视频的观看计数进行比较来测量。竞争监视与呈现模块208可以将去往竞争视频的业务与业务阈值进行比较。业务阈值是用于评估竞争视频是否吸引用户观看的预定量。如果去往竞争视频的业务(例如,观看计数、总观看持续时间、平均观看持续时间)大于业务阈值,则竞争视频被确定为可观的(substantial)。响应于确定去往竞争视频的业务大于业务阈值,竞争监视与呈现模块208可以向原创视频的所有者通知对应的搜索查询将可观的业务量引导到竞争视频。竞争监视与呈现模块208可以通过将去往竞争视频的业务与去往原创视频的业务进行比较来测量搜索查询的有效性。可以将去往衍生视频的业务与去往原创视频的业务的比率与阈值比率进行比较。响应于确定去往衍生视频的业务与去往原创视频的业务的比率大于阈值比率,可以向原创视频的所有者通知该搜索查询无效。
用户界面410被配置成在视觉上区分有效性被确定为小于阈值的那些搜索查询。如图所示,由于去往竞争视频的业务与去往原创视频的业务的比率大于阈值比率,因此搜索查询410b至410d被确定有效性更低。用户界面400被配置成用警示412突出显示搜索查询410b至410d,该警示412在视觉上区分这些搜索查询与其他搜索查询。这样,警示412能够向用户通知搜索查询410b至410d的有效性更低。
回到图2,由于向所有者呈现与用户用来访问视频以及其竞争视频的不同搜索查询相关的信息,因此用户可以利用从搜索查询中确定的附加元数据来扩增视频。例如,向音乐视频的所有者通知用户经由其访问音乐视频的搜索查询,其包括两种类型的搜索词项:歌曲的名称和歌曲的歌词。歌曲的歌词可以被包含作为与音乐视频相关联的元数据。因此,对于包括歌曲的歌词的搜索查询的搜索结果将包括音乐视频。在搜索查询中使用歌曲的歌词的用户将被定向到音乐视频。
元数据推荐模块210确定元数据改进并且将其推荐给原创视频的所有者。对于视频,元数据推荐模块210可以基于对于存储在相似性数据存储212中的两个视频所确定的搜索竞争分值来识别竞争视频。此外,元数据推荐模块210可以识别将用户引导到竞争视频的搜索查询。元数据推荐模块210可以提取搜索查询中所使用的搜索词项,将搜索词项同与原创视频相关联的元数据进行比较,并且识别在与原创视频相关联的元数据中不存在的搜索词项。元数据推荐模块210将确定为与原创视频相关联的元数据中缺失的搜索词项推荐给原创视频的所有者。
对于作为多个原创视频的所有者的用户,元数据推荐模块210可以确定跨所有原创视频的元数据改进并且将其推荐给所有者。对于用户拥有的每个原创视频,元数据推荐模块210确定搜索查询中所包括的将业务导向竞争视频的搜索词项。随后,根据去往对应竞争视频的业务量,元数据推荐模块210可以对从用户拥有的所有原创视频中所确定的搜索词项进行排名。元数据推荐模块210选择去往竞争视频的业务大于阈值的排名最高的搜索词项,并且将所选择的排名最高的搜索词项作为能够与用户拥有的所有原创视频相关联的元数据推荐给用户。
图3A图示出根据一个实施例的确定视频间竞争的过程。视频竞争引擎110接收302存储在查询数据存储116中的搜索日志。视频竞争引擎110识别304针对视频的搜索查询以及关联观看持续时间。也就是说,对于视频,视频竞争引擎110识别视频作为其搜索结果的搜索查询。对于针对视频识别的每个搜索查询,视频竞争引擎110例如从所接收的搜索日志中识别响应于搜索查询而观看视频的持续时间。视频竞争引擎110创建306表示视频的向量。基于视频作为搜索结果的搜索查询以及关联观看持续时间来生成被创建来表示视频的向量。向量的维度对应于所识别的搜索查询。
视频竞争引擎110确定308两个视频之间对用户观看的竞争。也就是说,确定两个视频之间对于搜索查询的竞争。视频竞争引擎110可以基于被创建来表示两个视频的向量来确定搜索竞争分值。在一个实施例中,可以通过根据方程式(2)计算两个视频之间的余弦相似性来确定搜索竞争分值。
对于视频,视频竞争引擎110确定310视频与视频的集合之间对用户观看的竞争。确定视频的集合总体上与特定视频竞争用户观看的搜索查询的相似性。视频竞争引擎110可以合计一个视频与视频的集合中的每个个体视频之间所确定的竞争,以确定该视频与该视频的集合之间的竞争。在一个实施例中,根据方程式(3),确定总体搜索竞争分值。视频竞争引擎110可以选择总体上与视频竞争用户观看的视频的集合。可以基于内容、所有者或者包括查询空间中的所有搜索查询所导向的所有其他视频来选择视频的集合。
视频竞争引擎110可以进一步确定由视频集形成的频道的频道原创性。频道原创性测量用户对视频集的兴趣与用户对其他视频的兴趣之间的整体相似性。可以基于对于视频集中的视频所确定的总体搜索竞争分值以及能够从搜索日志中确定的与视频相关联的观看持续时间来确定频道的原创性。具有更高原创性分值的原创性更高的频道反映出该频道与其竞争视频相比吸引更多的用户兴趣。视频与其竞争视频之间的搜索竞争分值大于0。原创性更高的频道可以得到奖励。例如,能够基于频道的原创性来调整不同频道中所包括的视频的货币化。
搜索竞争分值可以被使用于推广原创内容。可以基于所确定的竞争来调整312视频的排名。例如,原创视频和一个或多个竞争视频在对于新搜索查询的搜索结果当中。可以调整原创视频和竞争视频的排名,使得原创视频的排名可以高于竞争视频的排名。例如,对于特定视频,如果对于该视频和竞争视频所确定的搜索竞争分值大于阈值,则从搜索查询的搜索结果中移除竞争视频以推广该特定视频。可以从对于搜索查询的搜索结果中移除竞争视频。另举一例,如果视频在对于搜索查询的搜索结果当中排名低于其竞争视频,若对于该视频和竞争视频所确定的搜索竞争分值大于阈值,则视频的排名可以被提升为相对高于竞争视频以推广特定视频。
图3B图示出根据一个实施例的,确定和推荐与视频相关的元数据改进的过程。视频竞争引擎110识别352视频以及与该视频竞争搜索查询的视频。例如,可以从相似性数据存储212中识别视频的竞争视频。在一个实施例中,确定搜索竞争分值,使得视频和竞争视频的搜索竞争分值超过阈值。视频竞争引擎110接收354存储在查询数据存储116中的搜索日志。
视频竞争引擎110识别356针对竞争视频的搜索查询。也就是说,对于竞争视频,视频竞争引擎110识别竞争视频作为搜索结果的搜索查询。对于针对竞争视频所识别的每个搜索查询,视频竞争引擎110可以例如从所接收的搜索日志中识别响应于搜索查询而观看竞争视频的观看持续时间。视频竞争引擎110识别358与所识别的搜索查询相关联的搜索词项。视频竞争引擎110可以例如从搜索日志中识别搜索查询中所使用的搜索词项。视频竞争引擎110将搜索词项同与视频相关联的元数据进行比较360。响应于确定与视频相关联的元数据中不存在搜索词项,视频竞争引擎110可以确定该搜索词项作为视频的元数据改进。视频竞争引擎110将视频的元数据改进提供362给与视频相关联的用户(例如,所有者)。视频竞争引擎110可以更新视频的元数据以包括所识别的元数据改进。
本公开已关于一个可能的实施例作出特别详细的描述。本领域技术人员将领会到,本公开可以在其他实施例中实践。首先,组件和变量的特定命名、术语大写、属性、数据结构或者任何其他编程或结构方面并非强制性或别有含义,并且实现本公开或其特征的机制可以具有不同的名称、格式或协议。此外,本文所述的各种系统组件之间的特定功能划分仅出于示例目的,而非强制性;由单个系统组件执行的功能可以由多个组件代为执行,并且由多个组件执行的功能可以由单个组件代为执行。
上文所述的一些部分在对信息执行操作的算法和符号表示方面呈现本公开的特征。这些算法的描述和表示是数据处理领域技术人员用来最高效地将他们的工作实质传达给本领域其他技术人员的手段。这些操作虽然在功能上或逻辑上来描述,但应理解为由计算机程序来实现。另外,还已证实,有时将这些操作布置称为模块或按功能名称来引用它们是便利的,而不丧失普遍性。
除非另作特别说明,否则从上述讨论显而易见,应当理解,在说明书全文中,利用诸如“确定”或“显示”等术语的讨论是指计算机系统或类似电子计算设备的动作和过程,其操纵并转换计算机系统存储器或寄存器或者其他这样的信息存储、传输或显示设备内表示为物理量(电子量)的数据。
本公开的某些方面包括本文以算法形式描述的处理步骤和指令。应当指出,本公开的过程步骤和指令能够以软件、固件或硬件体现,并且以软件体现时能够被下载以驻留在实时网络操作系统所使用的不同平台上并且从这些平台上操作。
本公开还涉及用于执行本文的操作的设备。该设备可以针对所需目的而专门构建,或者该设备可以包括通过存储在计算机可读介质上的计算机程序选择性激活或重配置的通用计算机,所述计算机程序能够供计算机访问。这样的计算机程序可以被存储在计算机可读存储介质中,诸如但不限于包括软盘、光盘、CD-ROM、磁光盘的任何类型的盘、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、磁卡或光卡、专用集成电路(ASIC)或者适于存储电子指令的任何类型的非暂时性计算机可读存储介质。另外,说明书中提及的计算机可以包括单个处理器或者可以是采用多处理器设计以提高计算能力的架构。
本文提出的算法和操作并非固有地涉及任何特定的计算机或其他装置。根据本文的教导,各种通用系统也可以与程序一起使用,或者可以证实,构建更专用的装置来执行所需的方法步骤十分便利。各种这类系统所需的结构以及等价变化对于本领域技术人员而言将显而易见。此外,本公开并未结合任何特定的编程语言来描述。应领会到,可以使用各种编程语言来实现如本文所述的本公开的教导,并且为揭示本公开的实现和最佳实施方式而提供对具体语言的任何引用。
本公开非常适于众多拓扑结构的各种计算机网络系统。在本领域内,大型网络的配置和管理包括通过诸如互联网的网络以通信方式耦合到不同计算机和存储设备的存储设备和计算机。
最后,应当指出,本说明书中所用的语言原则上是针对易读性和指导性目的而选择,而可能并非选择用来划定或限定本发明的主题。因此,本公开的揭示旨在说明而非限制本公开的范围,在所附权利要求中阐明本公开的范围。

Claims (17)

1.一种确定计算机网络上对于视频托管系统上的搜索查询的竞争的计算机实现的方法,包括:
接收与针对所述视频托管系统的搜索查询相关联的搜索记录,每个搜索记录识别所述视频托管系统上可用的视频的集合并且指示所述集合中的视频响应于所述搜索查询而被观看的关联的观看持续时间,所述视频是对应搜索查询的搜索结果;
从所接收的搜索记录中,识别针对所述视频的集合中的第一视频的第一搜索查询集合以及所述第一视频响应于所述第一搜索查询集合而被观看的关联的观看持续时间;
从所接收的搜索记录中,识别针对所述视频的集合中的第二视频的第二搜索查询集合以及所述第二视频响应于所述第二搜索查询集合而被观看的关联的观看持续时间;
基于所识别的第一搜索查询集合和第二搜索查询集合以及关联的观看持续时间,计算指示所述第一视频与所述第二视频对所述视频托管系统的用户观看的竞争量的第一竞争分值;
从所接收的搜索记录中对于所述视频托管系统上可用的视频的第二集合中的每个视频,识别针对该视频的第三搜索查询集合以及该视频响应于所述第三搜索查询集合而被观看的关联的观看持续时间;
基于所识别的第一搜索查询集合和第三搜索查询集合以及关联的观看持续时间,计算指示所述第一视频与该视频对所述视频托管系统的用户观看的竞争量的第二竞争分值;以及
基于所述第一竞争分值和所述第二竞争分值,计算所述第一视频与所述视频的第二集合对所述视频托管系统的用户观看的总体竞争分值。
2.根据权利要求1所述的方法,其中,所述视频的第二集合中的每个视频包括所述第一视频的至少一个媒体内容。
3.一种确定计算机网络上对于视频托管系统上的搜索查询的竞争的计算机实现的方法,包括:
接收与针对所述视频托管系统的搜索查询相关联的搜索记录,每个搜索记录识别所述视频托管系统上可用的视频的集合并且指示所述集合中的视频响应于所述搜索查询而被观看的关联的观看持续时间,所述视频是对应搜索查询的搜索结果;
从所接收的搜索记录中,识别针对所述视频的集合中的第一视频的第一搜索查询集合以及所述第一视频响应于所述第一搜索查询集合而被观看的关联的观看持续时间;
从所接收的搜索记录中,识别针对所述视频的集合中的第二视频的第二搜索查询集合以及所述第二视频响应于所述第二搜索查询集合而被观看的关联的观看持续时间;
基于所识别的第一搜索查询集合和关联的观看持续时间,生成所述第一视频的第一向量,所述第一向量表示所述第一视频响应于所述第一搜索查询集合而被观看的观看持续时间;
基于所识别的第二搜索查询集合和关联的观看持续时间,生成所述第二视频的第二向量,所述第二向量表示所述第二视频响应于所述第二搜索查询集合而被观看的持续时间;
测量所述第一向量与所述第二向量之间的相似度;以及
基于所述第一向量与所述第二向量之间的相似度,计算指示所述第一视频与所述第二视频对所述视频托管系统的用户观看的竞争量的竞争分值。
4.根据权利要求3所述的方法,其中,所述竞争分值测量所述第一视频与所述第二视频竞争的搜索查询之间的相似度,以及其中,较高的竞争分值指示这两个视频在竞争较高相似度的搜索查询,并且较低的竞争分值指示这两个视频在竞争较低相似度的搜索查询。
5.根据权利要求3所述的方法,进一步包括:
接收针对所述视频托管系统的新搜索查询;
识别经排名的视频的集合作为对于所述新搜索查询的搜索结果,所述经排名的集合中的视频包括所述第一视频和所述第二视频;以及
响应于所述竞争分值高于阈值,调整所述经排名的视频的集合中的视频的排名,使得所述第一视频排名高于所述第二视频。
6.根据权利要求3所述的方法,进一步包括:
接收针对所述视频托管系统的新搜索查询;
识别视频的结果集合作为所述新搜索查询的搜索结果,所述结果集合中的视频包括所述第一视频和所述第二视频;
将所述竞争分值与阈值进行比较;以及
响应于所述竞争分值大于所述阈值,从所述视频的结果集合中移除所述第二视频。
7.一种视频托管系统,包括:
计算机处理器;以及
存储指令的非暂时性计算机可读存储介质,所述指令被配置成使得所述计算机处理器:
接收与计算机网络上针对所述视频托管系统的搜索查询相关联的搜索记录,每个搜索记录识别所述视频托管系统上可用的视频的集合并且指示所述集合中的视频响应于所述搜索查询而被观看的关联的观看持续时间,所述视频是对应搜索查询的搜索结果;
从所接收的搜索记录中,识别针对所述视频的集合中的第一视频的第一搜索查询集合以及所述第一视频响应于所述第一搜索查询集合而被观看的关联的观看持续时间;
从所接收的搜索记录中,识别针对所述视频的集合中的第二视频的第二搜索查询集合以及所述第二视频响应于所述第二搜索查询集合而被观看的关联的观看持续时间;
基于所识别的第一搜索查询集合和关联的观看持续时间,生成所述第一视频的第一向量,所述第一向量表示所述第一视频响应于所述第一搜索查询集合而被观看的观看持续时间;
基于所识别的第二搜索查询集合和关联的观看持续时间,生成所述第二视频的第二向量,所述第二向量表示所述第二视频响应于所述第二搜索查询集合而被观看的持续时间;
测量所述第一向量与所述第二向量之间的相似度;以及
基于所述第一向量与所述第二向量之间的相似度,计算指示所述第一视频与所述第二视频对所述视频托管系统的用户观看的竞争量的竞争分值。
8.根据权利要求7所述的视频托管系统,其中,所述竞争分值测量所述第一视频与所述第二视频竞争的搜索查询之间的相似度,以及其中较高的竞争分值指示这两个视频在竞争较高相似度的搜索查询,并且较低的竞争分值指示这两个视频在竞争较低相似度的搜索查询。
9.根据权利要求7所述的视频托管系统,其中,所述非暂时性计算机可读存储介质存储指令,所述指令被进一步配置成使得所述处理器:
接收针对所述视频托管系统的新搜索查询;
识别经排名的视频的集合作为对于所述新搜索查询的搜索结果,所述经排名的集合中的视频包括所述第一视频和所述第二视频;以及
响应于所述竞争分值,调整所述经排名的视频的集合中的视频的排名。
10.根据权利要求7所述的视频托管系统,其中,所述非暂时性计算机可读存储介质存储指令,所述指令被进一步配置成使得所述处理器:
接收针对所述视频托管系统的新搜索查询;
识别视频的结果集合作为所述新搜索查询的搜索结果,所述结果集合中的视频包括所述第一视频和所述第二视频;
将所述竞争分值与阈值进行比较;以及
响应于所述竞争分值大于所述阈值,从所述视频的结果集合中移除所述第二视频。
11.一种视频托管系统,包括:
计算机处理器;以及
存储指令的非暂时性计算机可读存储介质,所述指令被配置成使得所述处理器:
接收与计算机网络上针对所述视频托管系统的搜索查询相关联的搜索记录,每个搜索记录识别所述视频托管系统上可用的视频的集合并且指示所述集合中的视频响应于所述搜索查询而被观看的关联的观看持续时间,所述视频是对应搜索查询的搜索结果;
从所接收的搜索记录中,识别针对所述视频的集合中的第一视频的第一搜索查询集合以及所述第一视频响应于所述第一搜索查询集合而被观看的关联的观看持续时间;
从所接收的搜索记录中,识别针对所述视频的集合中的第二视频的第二搜索查询集合以及所述第二视频响应于所述第二搜索查询集合而被观看的关联的观看持续时间;
基于所识别的第一搜索查询集合和第二搜索查询集合以及关联的观看持续时间,计算指示所述第一视频与所述第二视频对所述视频托管系统的用户观看的竞争量的第一竞争分值;
从所接收的搜索记录中对于所述视频托管系统上可用的视频的第二集合中的每个视频,识别针对该视频的第三搜索查询集合以及该视频响应于所述第三搜索查询集合而被观看的关联的持续时间;以及
基于所识别的第一搜索查询集合和第三搜索查询集合以及关联的观看持续时间,计算指示所述第一视频与该视频对所述视频托管系统的用户观看的竞争量的第二竞争分值;以及
基于所述第一竞争分值和所述第二竞争分值,计算所述第一视频与所述视频的第二集合对所述视频托管系统的用户观看的总体竞争分值。
12.根据权利要求11所述的视频托管系统,其中,所述视频的第二集合中的每个视频包括所述第一视频的至少一个媒体内容。
13.一种包含计算机程序代码的非暂时性计算机可读存储介质,所述计算机程序代码能够执行以执行包括以下的步骤:
接收与计算机网络上针对视频托管系统上的搜索查询相关联的搜索记录,每个搜索记录识别所述视频托管系统上可用的视频的集合并且指示所述集合中的视频响应于所述搜索查询而被观看的关联的观看持续时间,所述视频是对应搜索查询的搜索结果;
从所接收的搜索记录中,识别针对所述视频的集合中的第一视频的第一搜索查询集合以及所述第一视频响应于所述第一搜索查询集合而被观看的关联的观看持续时间;
从所接收的搜索记录中,识别针对所述视频的集合中的第二视频的第二搜索查询集合以及所述第二视频响应于所述第二搜索查询集合而被观看的关联的观看持续时间;
基于所识别的第一搜索查询集合和关联的观看持续时间,生成所述第一视频的第一向量,所述第一向量表示所述第一视频响应于所述第一搜索查询集合而被观看的观看持续时间;
基于所识别的第二搜索查询集合和关联的观看持续时间,生成所述第二视频的第二向量,所述第二向量表示所述第二视频响应于所述第二搜索查询集合而被观看的持续时间;
测量所述第一向量与所述第二向量之间的相似度;以及
基于所述第一向量与所述第二向量之间的相似度,计算指示所述第一视频与所述第二视频对所述视频托管系统的用户观看的竞争量的竞争分值。
14.根据权利要求13所述的非暂时性计算机可读存储介质,其中,所述竞争分值测量所述第一视频与所述第二视频竞争的搜索查询之间的相似度,以及其中,较高的竞争分值指示这两个视频在竞争较高相似度的搜索查询,并且较低的竞争分值指示这两个视频在竞争较低相似度的搜索查询。
15.根据权利要求13所述的非暂时性计算机可读存储介质,进一步包含计算机程序代码,所述计算机程序代码能够执行以执行包括以下的步骤:
接收针对所述视频托管系统的新搜索查询;
识别经排名的视频的集合作为所述新搜索查询的搜索结果,所述经排名的集合中的视频包括所述第一视频和所述第二视频;以及
响应于所述竞争分值高于阈值,调整所述经排名的视频的集合中的视频的排名,使得所述第一视频排名高于所述第二视频。
16.根据权利要求13所述的非暂时性计算机可读存储介质,进一步包含计算机程序代码,所述计算机程序代码能够执行以执行包括以下的步骤:
接收针对所述视频托管系统的新搜索查询;
识别视频的结果集合作为所述新搜索查询的搜索结果,所述结果集合中的视频包括所述第一视频和所述第二视频;
将所述竞争分值与阈值进行比较;以及
响应于所述竞争分值大于所述阈值,从所述视频的结果集合中移除所述第二视频。
17.一种包括计算机程序代码的非暂时性计算机可读存储介质,所述计算机程序代码能够执行以执行包括以下的步骤:
接收与计算机网络上针对视频托管系统上的搜索查询相关联的搜索记录,每个搜索记录识别所述视频托管系统上可用的视频的集合并且指示所述集合中的视频响应于所述搜索查询而被观看的关联的观看持续时间,所述视频是对应搜索查询的搜索结果;
从所接收的搜索记录中,识别针对所述视频的集合中的第一视频的第一搜索查询集合以及所述第一视频响应于所述第一搜索查询集合而被观看的关联的观看持续时间;
从所接收的搜索记录中,识别针对所述视频的集合中的第二视频的第二搜索查询集合以及所述第二视频响应于所述第二搜索查询集合而被观看的关联的观看持续时间;
基于所识别的第一搜索查询集合和第二搜索查询集合以及关联的观看持续时间,计算指示所述第一视频与所述第二视频对所述视频托管系统的用户观看的竞争量的第一竞争分值;
从所接收的搜索记录中对于所述视频托管系统上可用的视频的第二集合中的每个视频,识别针对该视频的第三搜索查询集合以及该视频响应于所述第三搜索查询集合而被观看的关联的观看持续时间;
基于所识别的第一搜索查询集合和第三搜索查询集合以及关联的观看持续时间,计算指示所述第一视频与该视频对所述视频托管系统的用户观看的竞争量的第二竞争分值;以及
基于所述第一竞争分值和所述第二竞争分值,计算所述第一视频与所述视频的第二集合对所述视频托管系统的用户观看的总体竞争分值。
CN201680078204.4A 2016-04-13 2016-12-15 视频竞争发现和推荐 Active CN108475279B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/098,121 US10311104B2 (en) 2016-04-13 2016-04-13 Video competition discovery and recommendation
US15/098,121 2016-04-13
PCT/US2016/067001 WO2017180198A1 (en) 2016-04-13 2016-12-15 Video competition discovery and recommendation

Publications (2)

Publication Number Publication Date
CN108475279A CN108475279A (zh) 2018-08-31
CN108475279B true CN108475279B (zh) 2020-06-16

Family

ID=60038927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680078204.4A Active CN108475279B (zh) 2016-04-13 2016-12-15 视频竞争发现和推荐

Country Status (4)

Country Link
US (2) US10311104B2 (zh)
EP (1) EP3443472A4 (zh)
CN (1) CN108475279B (zh)
WO (1) WO2017180198A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10346417B2 (en) * 2016-08-18 2019-07-09 Google Llc Optimizing digital video distribution
US10387515B2 (en) * 2017-06-08 2019-08-20 International Business Machines Corporation Network search query
US10853375B1 (en) * 2017-08-25 2020-12-01 Roblox Corporation Leveraging historical data to improve the relevancy of search results
CN110737799B (zh) * 2018-07-03 2023-06-27 阿里巴巴集团控股有限公司 视频搜索的方法、装置、设备和介质
CN112352439A (zh) * 2018-07-26 2021-02-09 威超智能股份有限公司 影像评选方法、影像评选服务器及影像评选系统
CN110008375A (zh) * 2019-03-22 2019-07-12 广州新视展投资咨询有限公司 推荐视频召回方法和装置
US11962547B2 (en) 2019-09-27 2024-04-16 Snap Inc. Content item module arrangements
US11288310B2 (en) 2019-09-27 2022-03-29 Snap Inc. Presenting content items based on previous reactions
US11425062B2 (en) 2019-09-27 2022-08-23 Snap Inc. Recommended content viewed by friends
US11343209B2 (en) 2019-09-27 2022-05-24 Snap Inc. Presenting reactions from friends
US11477143B2 (en) * 2019-09-27 2022-10-18 Snap Inc. Trending content view count
JPWO2022070340A1 (zh) * 2020-09-30 2022-04-07
US11750713B1 (en) * 2022-02-25 2023-09-05 Bankinvideos, Llc System and method for facilitating an online continuous multimedia contest
US11675790B1 (en) 2022-04-01 2023-06-13 Meltwater News International Holdings Gmbh Computing company competitor pairs by rule based inference combined with empirical validation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7836050B2 (en) * 2006-01-25 2010-11-16 Microsoft Corporation Ranking content based on relevance and quality
US8407207B1 (en) * 2011-05-12 2013-03-26 Google Inc. Measuring video content of web domains

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1646956A1 (en) * 2003-07-23 2006-04-19 University College Dublin, National University of Ireland Dublin Information retrieval
US8185543B1 (en) 2004-11-10 2012-05-22 Google Inc. Video image-based querying for video content
JP2010026724A (ja) * 2008-07-17 2010-02-04 Fujitsu Ltd Webページ提供装置、webページのランキング連動方法及びそのプログラム
US8180766B2 (en) 2008-09-22 2012-05-15 Microsoft Corporation Bayesian video search reranking
CA3149767A1 (en) 2009-07-16 2011-01-20 Bluefin Labs, Inc. Estimating and displaying social interest in time-based media

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7836050B2 (en) * 2006-01-25 2010-11-16 Microsoft Corporation Ranking content based on relevance and quality
US8407207B1 (en) * 2011-05-12 2013-03-26 Google Inc. Measuring video content of web domains

Also Published As

Publication number Publication date
US10311104B2 (en) 2019-06-04
US20220092111A1 (en) 2022-03-24
WO2017180198A1 (en) 2017-10-19
US20190286654A1 (en) 2019-09-19
US20170300571A1 (en) 2017-10-19
US11194859B2 (en) 2021-12-07
CN108475279A (zh) 2018-08-31
EP3443472A1 (en) 2019-02-20
EP3443472A4 (en) 2019-11-20

Similar Documents

Publication Publication Date Title
CN108475279B (zh) 视频竞争发现和推荐
CN108464007B (zh) 提供视频的元数据关联的方法、系统和介质
US9972356B2 (en) Media Summarization
US20230161967A1 (en) Identifying multimedia asset similarity using blended semantic and latent feature analysis
US8572647B2 (en) Online ad placement based on user metrics for hosted media
US11301528B2 (en) Selecting content objects for recommendation based on content object collections
US8856111B1 (en) Cross media type recommendations for media items based on identified entities
US8650203B1 (en) Iterated related item discovery
US20170046573A1 (en) Feature-based Video Annotation
Pichl et al. Combining Spotify and Twitter Data for Generating a Recent and Public Dataset for Music Recommendation.
US8572073B1 (en) Spam detection for user-generated multimedia items based on appearance in popular queries
US10362349B1 (en) Detecting channel similarity based on content reuse
US9627004B1 (en) Video frame annotation
US11983218B2 (en) Video competition discovery and recommendation
US9208157B1 (en) Spam detection for user-generated multimedia items based on concept clustering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant