CN108464007B - 提供视频的元数据关联的方法、系统和介质 - Google Patents

提供视频的元数据关联的方法、系统和介质 Download PDF

Info

Publication number
CN108464007B
CN108464007B CN201680078594.5A CN201680078594A CN108464007B CN 108464007 B CN108464007 B CN 108464007B CN 201680078594 A CN201680078594 A CN 201680078594A CN 108464007 B CN108464007 B CN 108464007B
Authority
CN
China
Prior art keywords
video
search
queries
metadata
videos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680078594.5A
Other languages
English (en)
Other versions
CN108464007A (zh
Inventor
卢卡·基亚兰蒂尼
约翰·乔治·格伦斯特伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN108464007A publication Critical patent/CN108464007A/zh
Application granted granted Critical
Publication of CN108464007B publication Critical patent/CN108464007B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2407Monitoring of transmitted content, e.g. distribution time, number of downloads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer Networks & Wireless Communication (AREA)

Abstract

本文提供了用于提供与计算机网络上的视频托管系统上的视频的元数据关联的方法和系统。接收与针对所述视频托管系统的搜索查询相关联的搜索记录。每个搜索记录识别作为有关搜索查询的搜索结果的视频,并且指示所述视频响应于所述搜索查询而被观看的观看持续时间。竞争用户观看的第一视频和第二视频是根据接收的搜索记录识别的。所述第一视频和所述第二视频各自具有分别描述所述第一视频和所述第二视频的元数据。针对所述第一视频的搜索查询是根据所述搜索记录识别的。还识别与所述搜索查询相关联的搜索词项,并且将识别的搜索词项与所述第二视频的所述元数据进行比较。不包括在所述第二视频的所述元数据中的搜索词项被识别为所述第二视频的元数据改进。

Description

提供视频的元数据关联的方法、系统和介质
技术领域
本发明大体上涉及在线视频和流媒体服务,且确切地说涉及将观众引导到这样的服务上的特定视频。
背景技术
在线系统对各种形式的媒体内容进行存储,编索引并提供给互联网用户。该内容可以采取多种形式;确切地说包括流式视频的视频内容在互联网上广泛使用。在线视频系统允许用户来观看由其它用户上传的视频。
用户可以经由搜索发现在线视频系统上的新内容。通常来说,用户提供搜索查询并接收作为搜索结果返回的一批视频。这些视频通常被排名,并按照基于该排名的顺序呈现给用户。排名较高的视频比排名较低的视频呈现在更加醒目的位置,并且更有可能吸引用户的访问。在有关搜索查询的搜索结果中,一些视频包含原创内容并且是由内容制作者或合作伙伴上传的;并且一些可能会使用原创内容,并且是由非内容制作者或合作伙伴的用户上传的。包括原创内容的视频在下文中被称作“原创视频”,并且并非由原作者或创作者创建但是使用了原创内容的视频在下文中被称作“衍生视频”。换句话说,衍生视频包括原创视频的至少一些媒体内容(例如,视频、音频)。衍生视频与原创视频竞争用户观看,干扰原创视频的播放,并且使用户对原创视频的搜索复杂化。因此,将原创视频与衍生视频区分开以保护用户的利益以及内容制作者的利益是有用的。
发明内容
在一个实施例中,一种提供与计算机网络上的视频托管系统上的视频的元数据关联的计算机实现方法包括接收与针对视频托管系统的搜索查询相关联的搜索记录。每个搜索记录识别作为对应搜索查询的搜索结果的在视频托管系统上可用的视频集合,并且指示集合中的视频响应于所述搜索查询而被观看的相关联的观看持续时间。所述方法根据接收的搜索记录识别竞争视频托管系统的用户观看的第一视频和第二视频。所述第一视频和第二视频各自具有分别描述所述第一视频和第二视频的元数据。所述方法根据所述搜索记录识别针对所述第一视频的搜索查询的第一集合。所述第一视频是所述第一集合的搜索查询的搜索结果。所述方法识别与所述搜索查询的第一集合相关联的搜索词项,并且将所述识别的搜索词项与第二视频的元数据进行比较。响应于指示第二视频的元数据不包括搜索词项的比较,所述方法将所述搜索词项识别为第二视频的元数据改进。所述方法还将所述元数据改进提供给与第二视频相关联的视频托管系统的用户。
在一个实施例中,视频托管系统包括计算机处理器和存储指令的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质被配置为使所述计算机处理器接收与针对视频托管系统的搜索查询相关联的搜索记录。每个搜索记录识别作为对应搜索查询的搜索结果的在视频托管系统上可用的视频集合,并且指示集合中的视频响应于所述搜索查询而被观看的相关联的观看持续时间。所述指令被配置为使所述计算机处理器根据接收的搜索记录识别竞争视频托管系统的用户观看的第一视频和第二视频。所述第一视频和第二视频各自具有分别描述所述第一视频和第二视频的元数据。所述指令被配置为使所述计算机处理器根据所述搜索记录识别针对所述第一视频的搜索查询的第一集合。所述指令被配置为使所述计算机处理器识别与所述搜索查询的第一集合相关联的搜索词项,并且还将所识别的搜索词项与第二视频的元数据进行比较。所述指令被配置为使所述计算机处理器响应于指示第二视频的元数据不包括搜索词项的比较,将所述搜索词项识别为第二视频的元数据改进。所述指令被配置为使所述计算机处理器将所述元数据改进提供给与第二视频相关联的视频托管系统的用户。
在一个实施例中,一种含有计算机程序代码的非暂时性计算机可读存储介质,所述计算机程序代码可实行来执行步骤,所述步骤包括接收与针对视频托管系统的搜索查询相关联的搜索记录。每个搜索记录识别作为对应搜索查询的搜索结果的在视频托管系统上可用的视频集合,并且指示所述集合中的视频响应于所述搜索查询而被观看的相关联的观看持续时间。所述步骤包括根据所接收的搜索记录识别竞争视频托管系统的用户观看的第一视频和第二视频。所述第一视频和第二视频各自具有分别描述所述第一视频和第二视频的元数据。所述步骤包括根据所述搜索记录识别针对所述第一视频的搜索查询的第一集合。所述第一视频是所述第一集合的搜索查询的搜索结果。所述步骤包括识别与所述搜索查询的第一集合相关联的搜索词项,并且将所识别的搜索词项与第二视频的元数据进行比较。所述步骤进一步包括响应于指示第二视频的元数据不包括搜索词项的比较,将所述搜索词项识别为第二视频的元数据改进。所述步骤包括提供给与第二视频相关联的视频托管系统的用户。
附图说明
图1是根据一个实施例的评估各视频对用户观看的竞争的系统的高级框图。
图2是根据一个实施例的视频竞争引擎的框图。
图3A示出根据一个实施例的确定视频之间的竞争的过程。
图3B示出根据一个实施例的确定和推荐与视频有关的元数据改进的过程。
图4示出向视频的所有者显示与监视的视频的业务有关的信息的示例性用户接口。
具体实施方式
系统架构
图1是根据一个实施例的评估各视频对用户观看的竞争的系统的高级框图。图1示出通过网络124连接的视频托管系统102和用户120。用户120表示可以访问视频托管系统102内所含有的视频的实体。用户120可以通过以下方式从视频托管系统102访问视频:浏览视频目录,使用关键词执行搜索,查看来自其他用户或系统管理员的播放列表(例如,形成频道的视频集合),或者观看与特定用户群(例如,社区)相关联的视频。另外,在一些实施例中,视频托管系统102被适应来接收视频进行存储,以便实现与其他用户的视频共享。
在一个实施例中,用户120使用计算机系统来通过网络124与视频托管系统102通信。在一个实施例中,计算机系统是实行诸如GOOGLE CHROME等web浏览器122的个人计算机,所述web浏览器122允许用户观看网页和由视频托管系统102提供的视频。在另一实施例中,计算机系统是诸如智能电话或平板计算机等移动装置或甚至是个人计算机,其实行提供特定功能以便访问视频托管系统102的软件应用(“app”)。由用户120使用的计算机系统还可以是另一支持网络的装置,诸如汽车娱乐系统、电视“机顶盒”等。虽然图1示出仅单个用户,但是应理解,许多用户(例如,数百万)可以随时与视频托管系统102通信。示出了单个用户120,以便简化和阐明本说明书。
网络124表示用户与视频托管系统102之间的通信路径。在一个实施例中,网络124是互联网,但是还可以是任何网络,包括但不限于有线或无线网络、云计算网络、专用网络、虚拟专用网络和它们的任何组合。另外,可以使用诸如安全套接字层(SSL)、安全HTTP和/或虚拟专用网络(VPN)等常见加密技术对所有或一些链路进行加密。在另一实施例中,代替或补充上面描述的技术,所述实体可以使用定制和/或专用数据通信技术。
视频托管系统102允许用户经由搜索和/或浏览接口而访问视频内容。视频的源可以来自用户上传的视频、对其它视频网站或数据库的搜索或抓取等,或它们的任何组合。例如,在一个实施例中,视频托管系统102可以被配置为允许用户上传内容;在另一实施例中,视频托管系统102可以被配置为仅从其它源获得视频,通过抓取所述源或者实时搜索所述源。
用于系统的实施方案的合适视频托管系统102是YOUTUBETM网站。应理解,术语“网站”表示被适应来使用任何联网协议供应内容的任何计算机系统,并且并非意在限于经由互联网或HTTP协议上传或下载的内容。一般而言,在一个实施例中被描述成是在服务器侧上执行的功能在其它实施例中也可以在客户端侧上执行。另外,归因于特定组件的功能可以由一起操作的不同或多个组件来执行。
视频托管系统102包括前端服务器104、摄取服务器106、视频搜索服务器108、视频竞争引擎110、视频访问服务器112、视频数据存储装置114和查询数据存储装置116。诸如防火墙、负载平衡器、应用服务器、故障转移服务器、站点管理工具等许多常见特征未示出,以免模糊系统的功能。
前端服务器104处理经由网络124与用户的所有通信。前端服务器104接收来自用户的请求,并且与视频托管系统102的其它服务器通信以便对请求进行处理。前端服务器104被进一步配置来监视用于与视频托管系统102的交互。例如,如果用户点击网页,观看视频,进行购买,打开文档或者填写基于网络的表格,那么前端服务器104监视这些交互。前端服务器104可以被进一步配置来将所请求的视频和相关视频链接传输和呈现给网页上的用户。所请求的视频被前端服务器104流式传输给用户。一个或多个相关视频链接出现在网页上正在播放所请求的视频的位置,以使得用户120可以选择相关的视频链接,以便观看相关视频。
经由网络124从用户接收以便发布到视频托管系统102的任何内容被传递到摄取服务器106上进行处理。视频文件的处理包括将标识符指派给新接收的视频文件。对视频文件进行处理的其它步骤可以包括格式化(例如,码转换)、压缩、元数据标签、内容分析和/或其它数据处理方法。视频文件的元数据包括描述视频文件的媒体内容的标签。例如,“海明威”、“主导思想”以及“冥想”、“哈巴狗”和“爵士乐”全部都是标签的示例。发布视频文件的用户可以提供与视频文件相关联的标签作为元数据。另外,摄取服务器106可以对视频文件的媒体内容进行分析,以识别标签并且将识别的标签与视频文件相关联。在一个实施例中,用户随传输给视频托管系统102的视频文件一起传输表格。用户可以在表格中包括描述视频的信息(例如,标题、描述和标签信息)。所述表格信息还可以包括对媒体类型的指示,对于上传的视频而言,所述媒体类型将始终是“视频”类型。摄取服务器106将处理的视频文件存储在视频数据存储装置114中,并且存储包括在表格中的信息作为视频文件的元数据。视频存储装置114是存储系统,其中存储有被传输给视频托管系统102的视频文件。视频可以伴随有图标或缩略图视图,诸如标题、作者、标签、描述、评论和评级等相关联的元数据。
视频搜索服务器108对由前端服务器104接收的用户请求进行处理,并且识别与用户的请求有关的视频。由用户提供给前端服务器104的用户请求可以包括指定一个或多个搜索词项的搜索查询。搜索查询是由用户输入的用于搜索满足用户的信息需求的一个或多个视频的查询。搜索查询可以包括为文本(例如,关键词)和/或图像的搜索词项,搜索词项可以被用来识别用户有兴趣观看的视频。例如,搜索查询可以包括搜索词项“乞力马扎罗”。视频搜索服务器108可以例如使用所述搜索词项查询存储在视频数据存储装置114中的所有视频文件的元数据。搜索结果是相关联的元数据与搜索词项有关的视频。例如,有关搜索查询“乞力马扎罗”的搜索结果包括与匹配搜索词项“乞力马扎罗”的元数据“乞力马扎罗”相关联的视频。由查询产生的搜索结果被传输给前端服务器104,以使得搜索结果可以被呈现给用户。可以基于搜索结果与搜索查询的相关性对搜索结果进行排名,并按照排名顺序将搜索结果呈现给用户。与搜索查询较为相关的视频排名高于与搜索查询较不相关的视频。
视频搜索服务器108生成搜索日志,并且将生成的搜索日志存储在查询数据存储装置116中。搜索日志包括诸如以下的信息:将用户引导至视频的搜索查询、搜索查询将用户引至的视频、视频已经被观看的次数、视频已经被观看的时间等。例如,搜索日志可以包括指示全球变暖纪录片是有关两个搜索查询“乞力马扎罗”和“非洲雪景”的搜索结果的信息。搜索日志还包括指示有关搜索查询“乞力马扎罗”的搜索结果包括以下内容的信息:全球变暖纪录片,一个在乞力马扎罗山远足的人的视频和歌手的“乞力马扎罗”歌曲的视频是搜索结果。搜索日志还包括示出不同用户用来观看全球变暖纪录片的时间量(即,持续时间)的信息。在一些实施例中,搜索日志包括与搜索查询相关联的搜索记录的历史。每个搜索记录包括搜索查询、用户、执行搜索的当前时间、搜索结果(即,响应于搜索查询而返回给用户的视频)、搜索结果中被用户观看的视频的标识符、每个视频被用户观看的观看持续时间和其它信息。
视频访问服务器112从前端服务器104接收来自用户的希望观看特定视频的请求。从用户的角度来看,用户可以通过浏览不同类别的视频托管系统102或者通过点击来自搜索结果网页的视频的链接来提交对视频的请求。由用户传输的请求可以包括用户希望观看的视频的标识符(一旦用户点击有关视频的链接就可以自动包括所述标识符)。视频访问服务器112使用所述标识符来搜索和定位视频存储在视频数据存储装置114中的位置。视频访问服务器112将所请求的视频提供给前端服务器104。
视频竞争引擎110确定视频对用户观看的竞争。当搜索查询产生多个搜索结果时,这些结果中列出的视频竞争用户观看。确切地说,衍生视频(即,内容是基于原创内容而生成的视频)转移了用户对原创视频(即,内容是原创的视频)的观看。视频竞争引擎110确定一对视频之间的竞争分值。所述竞争分值测量两个视频正在竞争的搜索查询之间的相似性。竞争分值越高指示有关相同搜索查询的搜索结果中将出现这两个视频的可能性越大,而竞争分值越低指示有关相同搜索查询的搜索结果中将出现这两个视频的可能性越小。例如,为1的竞争分值可以指示相同搜索查询的搜索结果中将始终出现这两个视频,且为0的竞争分值可以指示任何搜索查询的搜索结果中都不会一起出现这两个视频。
另外,视频竞争引擎110可以确定汇总的搜索竞争分值,所述分值测量来自所有其它视频全体与给定视频对用户观看的竞争。对于给定视频,汇总的搜索竞争分值可以通过将确定的有关该视频和其它视频的各个竞争分值进行汇总来确定。汇总的竞争分值越高指示对于非常类似的搜索查询可能存在至少一个其它视频与该视频竞争,或者对于一定程度上类似的搜索查询,可能存在多个其它视频与该视频竞争。例如,为1的汇总竞争分值指示对于完全相同的搜索查询,可能存在至少一个其它视频与该视频竞争,或者对于类似的搜索查询,可能存在多个其它视频与该视频竞争。对于特定的汇总竞争分值,与该视频竞争的其它视频的数量以及竞争的视频的搜索查询之间的相似程度可以成反比关系。
视频搜索服务器108或视频竞争引擎110可以基于所确定的视频之间的竞争而调整搜索查询的搜索结果的排名。搜索竞争分值和/或汇总的搜索竞争分值可以被用来将诸如与原创视频竞争的衍生视频的视频降级,以减少它们转移用户对原创视频的观看。另外,汇总的搜索竞争分值可以被用来确定由一批视频形成的频道的原创性。频道的原创性可以被用来对频道进行奖励。视频竞争引擎110可以监视流向原创视频和衍生视频的业务(例如,用户观看的次数,用户观看的观看持续时间)。视频竞争引擎110可以识别不存在于原创视频中的衍生视频的元数据,并且向原创视频的所有者建议将所述元数据包括在原创视频中。
应了解,如本文所描述的视频竞争引擎110的数据处理操作固有地需要编程的计算机系统来用于它们的实际实施方案。为了简化和阐明本说明书,根据本文所描述的视频特定实施例的需要,由视频托管系统102所接收和共享的内容一般被称作视频、视频文件或视频项目,但是应理解,视频托管系统102可以接收和共享具有任何媒体类型的内容。该内容可以被称作媒体内容项目、媒体项目或项目。因此,本文所描述的视频竞争引擎110的用于确定视频文件之间的竞争的操作可以被应用于任何类型的媒体内容项目,不仅仅是视频;其它合适类型的内容项目包括音频文件(例如,音乐、播客、有声读物等)、文档、多媒体演示文稿、商品和服务的数字采购等。
视频竞争引擎
图2是示出根据一个实施例的视频竞争引擎110的详细视图的高级框图。如图2中所示,视频竞争引擎110包括几个模块。本领域技术人员将认识到,其它实施例可以具有与这里所描述的模块不同的模块,并且功能可以以不同方式在模块之间分配。另外,归于视频竞争引擎110的功能可以由多个引擎来执行。如图所示,视频竞争引擎110包括矢量生成模块202、相似性确定模块204、汇总模块206、竞争监视和展示模块208、元数据推荐模块210和相似性数据存储装置212。
矢量生成模块202生成有关视频的矢量。所述矢量表示视频响应于搜索查询而被用户观看的持续时间。矢量生成模块202可以分析查询数据存储装置116中的信息,以生成有关视频的矢量。例如,矢量生成模块202识别来自查询数据存储装置116的所有或一些搜索查询。另外,对于每个识别的搜索查询,矢量生成模块202基于所述查询确定搜索查询所针对的视频,并且确定视频响应于基于查询接收到搜索结果而被观看的持续时间。也就是说,识别了包括在有关搜索查询的搜索结果中的视频,并且确定了视频响应于搜索查询而被观看的持续时间。矢量生成模块202根据等式(1)生成有关视频的矢量:
Figure GDA0002550487680000101
其中
Figure GDA0002550487680000103
是所识别的搜索查询的查询空间,其中每个维度对应于一个查询qi;并且Vn是视频响应于对应搜索查询qn而被观看的时间量。换句话说,查询空间
Figure GDA0002550487680000104
是一批搜索查询q。表示视频的矢量V是搜索结果包括该视频的搜索查询qn(即,基矢量)的线性组合。每个基矢量的qn的标量(即,搜索查询)是视频响应于该搜索查询而被观看的时间量。
相似性确定模块204测量一个视频和另一个视频竞争的搜索查询之间的相似性。如本文所描述,如果两个视频是有关搜索查询的搜索结果,那么这两个视频竞争该搜索查询。相似性确定模块204可以确定搜索竞争分值,所述搜索竞争分值测量将用户引向一个视频的搜索查询的集合与将用户引向其它视频的搜索查询的另一集合之间的相似性。在查询空间中,表示竞争相同查询的视频的矢量指向相同的方向,因为所述矢量具有相同的基矢量。在一个实施例中,相似性确定模块204根据等式(2)确定有关两个视频的搜索竞争分值SCS(vi,vj):
Figure GDA0002550487680000102
其中vi是生成的有关第一视频i的矢量,且vj是生成的有关第二视频j的矢量。搜索竞争分值SCS(vi,vj)是内积空间中对两个视频生成的矢量之间的相似程度的测量,其测量矢量之间的角度的余弦。确定的搜索竞争分值SCS(vi,vj)是在从0到1的范围内的值。如前面所提及,搜索竞争分值越高指示视频竞争的搜索查询之间的相似性越高。相似性确定模块204可以将确定的搜索竞争分值SCS(vi,vj)存储在相似性数据存储装置212中。
汇总模块206测量一个视频与全体其它视频竞争的搜索查询之间的相似性。对于特定视频,汇总模块206可以确定集体搜索竞争分值,其测量将用户引向一个视频的搜索查询的集合与将用户引向其它视频的搜索查询的另一集合之间的相似性。
在各种实施例中,集体搜索竞争分值具有在从0到1的范围内的值。汇总模块206确定根据各种规则的集体搜索竞争。首先,对于特定视频,如果有关特定视频和另一视频的搜索竞争分值具有为1的值,那么汇总模块206确定集体搜索竞争分值为1。也就是说,如果有对于相同的搜索条目与一个视频竞争的另一视频,那么汇总模块206确定集体搜索竞争分值为1。其次,对于特定视频,如果有关特定视频和所有其它视频的所有搜索竞争分值为0,那么汇总模块206确定集体搜索竞争分值为0。也就是说,仅当没有其它视频与视频竞争任何搜索查询时,汇总模块206才会确定集体搜索竞争分值为0。另外,汇总模块206确定有关第一视频的第一集体搜索竞争分值与给定视频集合之间的关系,以及有关第二视频的第二集体搜索竞争分值与给定视频集合之间的关系。如果第一视频之间的搜索竞争分值小于第二视频之间的搜索竞争分值,那么对于给定集合的任何视频,汇总模块206确定第一集体搜索竞争分值小于第二集体搜索竞争分值。当对搜索竞争分值进行汇总时,汇总模块206维持确定的关系。
在一个实施例中,汇总模块206根据等式(3)确定有关特定视频gSCS(vi)的集体搜索竞争分值:
Figure GDA0002550487680000111
其中SCS(vi,vj)是给定视频与其它视频中的一个之间的搜索竞争分值,并且函数f(x)定义从0到1的间隔与从0到无限大的间隔之间的一一对应。在一些实施例中,函数f(x)被定义成
Figure GDA0002550487680000112
汇总模块206可以将确定的集体搜索竞争分值gSCS(vi)存储在相似性数据存储装置212中。相似性数据存储装置212可以存储确定的有关原创视频和衍生视频的搜索竞争分值和确定的有关原创视频的集体搜索竞争分值。
对于特定视频,汇总模块206可以通过对确定的有关该视频和其它视频的搜索竞争分值进行汇总来确定集体搜索竞争分值。其它视频可以基于内容或所有者来确定。其它视频可以包括作为查询空间的所有搜索查询的搜索结果的所有其它视频。对于具有特定内容的一个视频,汇总模块206可以对确定的有关该视频和特定视频的衍生视频的搜索竞争分值进行汇总。例如,确定的有关原创音乐视频和包括完整歌曲或歌曲的一部分的衍生视频的搜索竞争分值被汇总来确定集体搜索竞争分值。对于具有特定内容的一个视频,汇总模块206可以对确定的有关该视频和该视频的衍生视频的所有者所拥有的所有视频的搜索竞争分值进行汇总。例如,确定的有关原创音乐视频和包括完整歌曲或歌曲的一部分的衍生视频的所有者所拥有的所有视频的搜索竞争分值被汇总至集体搜索竞争分值。
汇总模块206可以进一步确定由一批视频形成的频道的原创性。频道的原创性测量有关包括在频道中的一批视频的搜索查询与有关竞争的其它视频的搜索查询之间的整体相似性。对于包括在频道中的每个视频,汇总模块206基于计算的搜索竞争分值而识别竞争视频。确定的有关视频以及其竞争视频的搜索竞争分值超过阈值。汇总模块206可以根据搜索日志确定与视频相关联的观看持续时间。在一个实施例中,汇总模块206根据等式(4)计算频道的原创性:
Figure GDA0002550487680000121
其中gSCS(v)是有关包括在频道C中的视频v的集体搜索竞争分值,并且watchtime(v)是有关包括在频道C中的视频v的观看持续时间。频道的原创性是在从0到1的范围内的值。原创性为1的频道指示频道较之其竞争视频吸引了所有用户观看。原创性为0的频道指示包括在频道中的视频较之其竞争视频未吸引用户观看。
竞争监视和展示模块208监视针对不同视频的业务(例如,用户观看计数和观看持续时间),并且向用户呈现与监视的业务有关的用户接口显示信息。竞争监视和展示模块208可以分析搜索日志来监视针对不同视频的业务。竞争监视和展示模块208对搜索日志进行解析,以按照目的地来对业务进行分类(例如,原创视频、原创视频的衍生视频)。对于流向原创视频的业务,竞争监视和展示模块208可以按照以下内容来对业务进行分类:搜索查询、响应于搜索查询对原创视频的观看计数,响应于搜索查询对原创视频的观看持续时间,与搜索查询相关联的用户属性(例如,人口统计资料、位置等)等。
竞争监视和展示模块208对监视的业务进行分析,并且向用户呈现与监视的业务的分析有关的用户接口显示信息。在一个实施例中,竞争监视和展示模块208为视频的所有者生成与监视的业务有关的用户接口展示信息。
图4示出向视频的所有者显示与视频的监视的业务有关的信息的示例性用户接口400。用户接口400向视频的所有者呈现与视频有关的各种信息,包括监视的业务和对监视的业务的分析。在示出的示例中,用户接口呈现视频标识符402,包括艺术家和标题。另外,用户接口400呈现与监视的业务有关的信息,诸如视频402的总观看计数404和总观看持续时间406。竞争监视和展示模块208随着时间推移对视频已经被观看的次数进行汇总,并且在用户接口400中呈现所述确定的量作为总观看计数404。竞争监视和展示模块208随着时间推移进一步对视频已经被观看的观看持续时间进行汇总,并且在用户接口400中呈现确定的观看持续时间作为总观看持续时间406。用户接口400还呈现将用户引向视频402的搜索查询和与每个搜索查询相关联的对应观看计数。如图所示,视频402属于有关搜索查询410的搜索结果。也就是说,如果用户输入搜索查询410中的任何一个,那么搜索查询410可以将用户引向视频402。将用户引向视频402的搜索查询可以按业务进行排名,并且基于相关联的观看计数按照降序呈现。如图所示,区域408a至408e分别表示视频402响应于搜索查询410a至410e而被观看的总观看计数。每当用户找到并且通过使用搜索查询来播放音乐视频402时,对应于该搜索查询的总观看计数增加1。
竞争监视和展示模块208还可以针对每个搜索查询确定流向原创视频和流向竞争视频的业务。每个搜索查询与用户通过使用搜索查询观看视频的观看计数414和总观看持续时间416,以及平均观看持续时间418相关联。竞争监视和展示模块208通过用总观看持续时间416除以观看计数414来确定有关搜索查询的平均观看持续时间418。将用户引向特定视频的各种搜索查询可以包括不同的搜索词项,并且因此生成不同的业务量。根据相关联的观看计数对搜索查询进行组织,并且根据观看计数、观看持续时间或平均观看持续时间按照降序向视频的所有者呈现。例如,搜索查询410a和410b包括不同的搜索词项。与搜索查询410a相关联的观看计数远高于与搜索查询410b相关联的观看计数。
如图所示,水平条420a的长度表示响应于搜索查询410a对视频402的总观看计数,且水平条420a'的长度表示响应于搜索查询410a对视频402的竞争视频的观看计数。类似地,水平条420b至420d的长度分别表示响应于搜索查询410b至410d对视频402的总观看计数,且水平条420b'至420d'的长度分别表示响应于搜索查询410b至420d对视频402的竞争视频的观看计数。用户接口400用图形区分水平条420a至420d以及水平条420a'至420d'。因此,用户接口400响应于搜索查询用图形将引向原创视频的业务与引向原创视频的竞争视频的业务区分开来。
另外,搜索查询可以具有不同程度的有效性。当所有生成的业务流向原创视频时,搜索查询是最有效的。可以通过将原创视频的观看计数与竞争视频的观看计数进行比较来测量搜索查询的有效性。竞争监视和展示模块208可以将流向竞争视频的业务与业务阈值进行比较。业务阈值是用来评估竞争视频是否吸引用户观看的预先确定的量。如果流向竞争视频的业务(例如,观看计数、总观看持续时间、平均观看持续时间)高于业务阈值,那么竞争视频被确定为是可观的。竞争监视和展示模块208可以响应于确定流向竞争视频的业务高于业务阈值而通知原创视频的所有者对应搜索查询将大量的业务引向竞争视频。竞争监视和展示模块208可以通过将流向竞争视频的业务与流向原创视频的业务进行比较来测量搜索查询的有效性。可以将流向衍生视频的业务与流向原创视频的业务的比率与阈值比率进行比较。可以响应于确定流向衍生视频的业务与流向原创视频的业务的比率高于阈值比率而通知原创视频的所有者搜索查询是低效的。
用户接口410被配置为视觉地辨别有效性被确定为小于阈值的那些搜索查询。如图所示,搜索查询410b至410d被确定为不太有效,因为流向竞争视频的业务与流向原创视频的业务的比率大于阈值比率。用户接口400被配置为使用视觉地将这些搜索查询与其它搜索查询区别开来的通知信号412来突出搜索查询410b至410d。因此,可以通过关于搜索查询410b至410d不太有效的通知信号412来通知用户。
返回参看图2,因为向所有者呈现了与用户用来访问视频以及其竞争视频的不同搜索查询有关的信息,所以用户可以使用根据搜索查询确定的额外元数据来对视频进行增补。例如,可以通知音乐视频的所有者用户用来访问音乐视频的搜索查询包括两种类型的搜索词项:歌曲的标题和歌曲的歌词。歌曲的歌词可以被合并作为与音乐视频相关联的元数据。因此,有关包括歌曲的歌词的搜索查询的搜索结果将包括音乐视频。在搜索查询中使用歌曲的歌词的用户将被指向该音乐视频。
元数据推荐模块210确定并向原创视频的所有者推荐元数据改进。对于视频,元数据推荐模块210可以基于对于存储在相似性数据存储装置212中的两个视频确定的搜索竞争分值而识别竞争视频。另外,元数据推荐模块210可以识别将用户引向竞争视频的搜索查询。元数据推荐模块210可以提取在搜索查询中使用的搜索词项,将所述搜索词项与和原创视频相关联的元数据进行比较,并且识别在与原创视频相关联的元数据中不存在的搜索词项。元数据推荐模块210向原创视频的所有者推荐被确定为与原创视频相关联的元数据中所缺少的搜索词项。
对于作为多个原创视频的所有者的用户,元数据推荐模块210可以确定并且向该所有者推荐对所有原创视频的元数据改进。对于用户所拥有的每个原创视频,元数据推荐模块210确定包括在将业务引向竞争视频的搜索查询中的搜索词项。随后,元数据推荐模块210可以根据流向对应竞争视频的业务量来对从用户所拥有的所有原创视频确定的搜索查询进行排名。元数据推荐模块210选择流向竞争视频的业务高于阈值的排名最高的搜索查询,并且向用户推荐选定的排名最高的搜索查询作为可以与用户所拥有的所有原创视频相关联的元数据。
图3A示出根据一个实施例的确定视频之间的竞争的过程。视频竞争引擎110接收302存储在查询数据存储装置116中的搜索日志。视频竞争引擎110识别304针对视频的搜索查询以及相关联的观看持续时间。也就是说,视频竞争引擎110识别有关视频的搜索查询,所述视频是搜索查询的搜索结果。对于识别的有关视频的每个搜索查询,视频竞争引擎110例如根据接收的搜索日志识别视频响应于搜索查询而被观看的持续时间。视频竞争引擎110创建306表示视频的矢量。所创建的表示视频的矢量是基于搜索查询和相关联的观看持续时间而生成的,视频是有关所述搜索查询的搜索结果。矢量的维度对应于所识别的搜索查询。
视频竞争引擎110确定308两个视频之间对用户观看的竞争。也就是说,确定两个视频之间对搜索查询的竞争。视频竞争引擎110可以基于所创建的表示两个视频的矢量而确定搜索竞争分值。在一个实施例中,可以通过根据公式(2)来计算两个视频之间的余弦相似性而确定搜索竞争分值。
对于视频来说,视频竞争引擎110确定310视频与视频集合之间对用户观看的竞争。确定视频集合全体与特定视频对用户观看的竞争的搜索查询的相似性。视频竞争引擎110可以对一个视频与视频集合中的每个个体视频之间确定的竞争进行汇总,以确定视频与视频集合之间的竞争。在一个实施例中,集体搜索竞争分值是根据等式(3)来确定的。视频竞争引擎110可以选择共同与视频竞争用户观看的视频的集合。视频集合可以基于内容、所有者而进行选择,或者以包括查询空间中的所有搜索查询引向的所有其它视频。
视频竞争引擎110可以进一步确定由一批视频所形成的频道的频道原创性。频道原创性测量用户对一批视频的兴趣与用户对其它视频的兴趣之间的总体相似性。频道的原创性可以基于对于一批视频中的视频确定的集体搜索竞争分值和可以根据搜索日志确定的与视频相关联的观看持续时间而确定。具有较高原创性分值的原创性较高的频道反映该频道较之其竞争视频吸引了更多的用户兴趣。视频与其竞争视频之间的搜索竞争分值大于0。可以对较为原创的频道进行奖励。例如,可以基于频道的原创性对包括在不同频道中的视频的货币化进行调整。
搜索竞争分值可以被用来宣传原创内容。可以基于确定的竞争而调整312视频的排名。例如,原创视频和一个或多个竞争视频是有关新搜索查询的搜索结果。可以调整原创视频和竞争视频的排名,以使得原创视频的排名可以高于竞争视频。例如,对于特定视频,如果对于该视频和竞争视频确定的搜索竞争分值高于阈值,那么从搜索查询的搜索结果移除竞争视频,以宣传该特定视频。可以从有关搜索查询的搜索结果移除竞争视频。举另一示例来说,如果在搜索查询的搜索结果中视频的排名低于其竞争视频,如果对于该视频和竞争视频确定的搜索竞争分值高于阈值,那么可以将该视频的排名提升的相对高于竞争视频,以宣传该特定视频。
图3B示出根据一个实施例的确定和推荐与视频有关的元数据改进的过程。视频竞争引擎110识别352有关搜索查询的视频和与该视频竞争的视频。可以例如从相似性数据存储装置212识别有关视频的竞争视频。在一个实施例中,确定了搜索竞争分值,以使得用于视频和竞争视频的搜索竞争分值超过阈值。视频竞争引擎110接收354存储在查询数据存储装置116中的搜索日志。
视频竞争引擎110识别356针对竞争视频的搜索查询。也就是说,对于竞争视频,视频竞争引擎110识别搜索结果为该竞争视频的搜索查询。对于识别的有关竞争视频的每个搜索查询,视频竞争引擎110可以例如根据接收的搜索日志识别竞争视频响应于搜索查询而被观看的观看持续时间。视频竞争引擎110识别358与识别的搜索查询相关联的搜索词项。视频竞争引擎110可以例如根据搜索日志识别搜索查询中所使用的搜索词项。视频竞争引擎110将搜索查询与和视频相关联的元数据进行比较360。响应于确定搜索查询在与视频相关联的元数据中不存在,视频竞争引擎110可以确定所述搜索词项作为有关视频的元数据改进。视频竞争引擎110向与视频相关联的用户(例如,所有者)提供262有关视频的元数据改进。视频竞争引擎110可以对视频的元数据进行更新,以包括识别的元数据改进。
已将相关于一个可能的实施例特别详细地描述了本公开。本领域技术人员将了解,本公开可以在其它实施例中实践。首先,组件和变量的特定命名、术语的大写、属性、数据结构或任何其它编程或结构方面不是强制的或重要的,并且实现本公开或其特征的机制可以具有不同的名称、格式或协议。而且,本文所描述的各种系统组件之间的功能的特定划分仅仅是为了举例的目的,而不是强制性的;由单个系统组件执行的功能可以替代地由多个组件执行,并且由多个组件执行的功能可以替代地由单个组件执行。
以上描述的一些部分根据对信息的操作的算法和符号表示来呈现本公开的特征。这些算法描述和表示是数据处理领域的技术人员用来最有效地将他们工作的实质传达给本领域其他技术人员的手段。这些操作虽然在功能上或逻辑上进行了描述,但是被理解为由计算机程序实现。另外,也已经证明,在不失一般性的情况下有时可以方便地将这些操作布置称为模块或用功能名称来称呼。
除非另有如从以上讨论中可以明显看出的特别声明,否则应了解,在整个说明书中,利用诸如“确定”或“显示”等术语的讨论表示计算机系统的动作和过程或类似的电子计算装置,它们操纵和转换在计算机系统存储器或寄存器或此种的信息存储装置、传输或显示装置内表示为物理(电子)量的数据。
本公开的某些方面包括本文呈算法的形式描述的处理步骤和指令。应指出本公开的过程步骤和指令可以在软件、固件或硬件中体现,并且当在软件中体现时,可以被下载以驻留在由实时网络操作系统使用的不同平台上,并且可以从所述不同的平台进行操作。
本公开还涉及用于执行本文的操作的设备。该设备可以为了所需目的而专门构造,或者它可以包括通过存储在计算机可读媒体上的计算机程序选择性地激活或重新配置的通用计算机,所述计算机可读媒体可以被计算机访问。此种计算机程序可以存储在计算机可读存储介质中,诸如但不限于任何类型的磁盘,包括软盘、光盘、CD-ROM、磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、磁卡或光卡、专用集成电路(ASIC)或适合于存储电子指令的任何类型的非暂时性计算机可读存储介质。另外,本说明书中所称作的计算机可以包括单个处理器,或者可以是采用多个处理器设计以便实现增加的计算能力的架构。
本文所呈现的算法和操作并不固有地涉及任何特定的计算机其它设备。根据本文的教示,各种专用系统还可以与程序仪器使用,或者可以证明能够便于构建更专业的设备来执行所需要的方法步骤。用于多种这些系统的所需的结构以及等效变化形式对于本领域技术人员将是显而易见的。另外,并未参考任何特定编程语言来描述本公开。应了解,多种编程语言可以被用来实现如本文所描述的本公开的教示,并且提供对特定语言的任何引用以用于公开本发明的实现和最佳模式。
本公开很好地适用于众多拓扑结构上的多种计算机网络系统。在该领域内,大型网络的配置和管理包括通过诸如互联网等网络通信地耦接到不同计算机和存储装置的存储装置和计算机。
最后,应注意,本说明书中使用的语言主要是为了可读性和指导性目的而选择的,并且可能未被选择来描绘或限制本发明的主题。因此,本公开的公开内容意在是说明性的,而不是限制在下面的权利要求中阐述的本公开的范围。

Claims (18)

1.一种提供视频的元数据关联的方法,所述方法包括:
接收与针对视频托管系统的搜索查询相关联的搜索记录,每个搜索记录识别作为对应搜索查询的搜索结果的在所述视频托管系统上可用的视频集合,并且指示集合中的视频响应于所述搜索查询而被观看的相关联的观看持续时间;
根据所接收的搜索记录识别竞争所述视频托管系统的用户观看的第一视频和第二视频,所述第一视频和所述第二视频各自具有分别描述所述第一视频和所述第二视频的元数据,并且所述第一视频和所述第二视频中的每个已在响应于针对所述视频托管系统的所述搜索查询中的第一搜索查询的搜索结果中被提供;
根据所述搜索记录识别针对所述第一视频的搜索查询的第一集合,所述第一视频是所述第一集合的搜索查询的搜索结果;
识别与所述搜索查询的第一集合相关联的搜索词项;
将所识别的搜索词项与所述第二视频的所述元数据进行比较;以及
响应于指示所述第二视频的所述元数据不包括来自与针对所述第一视频的所述搜索查询的第一集合相关联的所述搜索词项的搜索词项的比较,将所述搜索词项识别为所述第二视频的元数据改进;
通过处理器将所述元数据改进提供给与所述第二视频相关联的所述视频托管系统的用户;以及
对所述第二视频的所述元数据进行更新,以包括所识别的元数据改进,所识别的元数据改进基于来自与针对所述第一视频的所述搜索查询的第一集合相关联的所述搜索词项的搜索词项。
2.一种提供视频的元数据关联的方法,所述方法包括:
接收与针对视频托管系统的搜索查询相关联的搜索记录,每个搜索记录识别作为对应搜索查询的搜索结果的在所述视频托管系统上可用的视频集合,并且指示集合中的视频响应于所述搜索查询而被观看的相关联的观看持续时间;
根据所接收的搜索记录识别竞争所述视频托管系统的用户观看的第一视频和第二视频,所述第一视频和所述第二视频各自具有分别描述所述第一视频和所述第二视频的元数据,并且所述第一视频和所述第二视频中的每个已在响应于针对所述视频托管系统的所述搜索查询中的第一搜索查询的搜索结果中被提供;
根据所述搜索记录识别针对所述第一视频的搜索查询的第一集合,所述第一视频是所述第一集合的搜索查询的搜索结果;
识别与所述搜索查询的第一集合相关联的搜索词项;
将所识别的搜索词项与所述第二视频的所述元数据进行比较;以及
响应于指示所述第二视频的所述元数据不包括来自与针对所述第一视频的所述搜索查询的第一集合相关联的所述搜索词项的搜索词项的比较,将所述搜索词项识别为所述第二视频的元数据改进;以及
通过处理器将所述元数据改进提供给与所述第二视频相关联的所述视频托管系统的用户,所述元数据改进基于来自与针对所述第一视频的所述搜索查询的第一集合相关联的所述搜索词项的搜索词项。
3.根据权利要求2所述的方法,其中,识别竞争所述视频托管系统的用户观看的所述第一视频和所述第二视频包括:
基于所识别的查询的第一集合和第二集合以及相关联的观看持续时间,计算指示所述第一视频与所述第二视频之间对所述视频托管系统的用户观看的竞争量的竞争分值。
4.根据权利要求3所述的方法,其中,所述竞争分值测量所述第一视频和所述第二视频竞争的所述搜索查询之间的相似性,并且其中,较高的竞争分值指示所述第一视频和所述第二视频在竞争较相似的搜索查询,且较低的竞争分值指示所述第一视频和所述第二视频在竞争较不相似的搜索查询。
5.根据权利要求3所述的方法,其中,计算所述竞争分值包括:
基于所识别的查询的第一集合以及相关联的观看持续时间生成用于所述第一视频的第一矢量,所述第一矢量表示所述第一视频响应于所述查询的第一集合而被观看的观看持续时间;
基于所识别的查询的第二集合以及相关联的观看持续时间生成用于所述第二视频的第二矢量,所述第二矢量表示所述第二视频响应于所述查询的第二集合而被观看的观看持续时间;
测量所述第一矢量与所述第二矢量之间的相似程度;以及
响应于所测量的相似程度而计算所述竞争分值。
6.根据权利要求2所述的方法,其中,所述第一视频包括所述第二视频的至少一个媒体内容。
7.一种用于提供视频的元数据关联的系统,包括:
存储器;以及
与所述存储器操作性地耦接的处理器,所述处理器用于:
接收与针对视频托管系统的搜索查询相关联的搜索记录,每个搜索记录识别作为对应搜索查询的搜索结果的在所述视频托管系统上可用的视频集合,并且指示集合中的视频响应于所述搜索查询而被观看的相关联的观看持续时间;
根据所接收的搜索记录识别竞争所述视频托管系统的用户观看的第一视频和第二视频,所述第一视频和所述第二视频各自具有分别描述所述第一视频和第二视频的元数据,并且所述第一视频和所述第二视频中的每个已在响应于针对所述视频托管系统的所述搜索查询中的第一搜索查询的搜索结果中被提供;
根据所述搜索记录识别针对所述第一视频的搜索查询的第一集合,所述第一视频是所述第一集合的搜索查询的搜索结果;
识别与所述搜索查询的第一集合相关联的搜索词项;
将所识别的搜索词项与所述第二视频的所述元数据进行比较;以及
响应于指示所述第二视频的所述元数据不包括来自与针对所述第一视频的所述搜索查询的第一集合相关联的所述搜索词项的搜索词项的比较,将所述搜索词项识别为所述第二视频的元数据改进;以及
将所述元数据改进提供给与所述第二视频相关联的所述视频托管系统的用户,所述元数据改进基于来自与针对所述第一视频的所述搜索查询的第一集合相关联的所述搜索词项的搜索词项。
8.根据权利要求7所述的系统,其中,所述处理器进一步用于:
对所述第二视频的所述元数据进行更新,以包括所识别的元数据改进。
9.根据权利要求7所述的系统,其中,为了识别竞争所述视频托管系统的用户观看的所述第一视频和所述第二视频,所述处理器进一步用于:
基于所识别的查询的第一集合和第二集合以及相关联的观看持续时间,计算指示所述第一视频与所述第二视频之间对所述视频托管系统的用户观看的竞争量的竞争分值。
10.根据权利要求9所述的系统,其中,所述竞争分值测量所述第一视频和所述第二视频竞争的所述搜索查询之间的相似性,并且其中,较高的竞争分值指示所述第一视频和所述第二视频在竞争较相似的搜索查询,且较低的竞争分值指示所述第一视频和所述第二视频在竞争较不相似的搜索查询。
11.根据权利要求9所述的系统,其中,为了计算所述竞争分值,所述处理器进一步用于:
基于所识别的查询的第一集合以及相关联的观看持续时间生成用于所述第一视频的第一矢量,所述第一矢量表示所述第一视频响应于所述查询的第一集合而被观看的观看持续时间;
基于所识别的查询的第二集合以及相关联的观看持续时间生成用于所述第二视频的第二矢量,所述第二矢量表示所述第二视频响应于所述查询的第二集合而被观看的观看持续时间;
测量所述第一矢量与所述第二矢量之间的相似程度;以及
响应于所测量的相似程度而计算所述竞争分值。
12.根据权利要求7所述的系统,其中,所述第一视频包括所述第二视频的至少一个媒体内容。
13.一种包括指令的非暂时性计算机可读存储介质,所述指令在由处理器执行时使得所述处理器执行操作,所述操作包括:
接收与针对视频托管系统的搜索查询相关联的搜索记录,每个搜索记录识别作为对应搜索查询的搜索结果的在所述视频托管系统上可用的视频集合,并且指示集合中的视频响应于所述搜索查询而被观看的相关联的观看持续时间;
根据所接收的搜索记录识别竞争所述视频托管系统的用户观看的第一视频和第二视频,所述第一视频和所述第二视频各自具有分别描述所述第一视频和所述第二视频的元数据,并且所述第一视频和所述第二视频中的每个已在响应于针对所述视频托管系统的所述搜索查询中的第一搜索查询的搜索结果中被提供;
根据所述搜索记录识别针对所述第一视频的搜索查询的第一集合,所述第一视频是所述第一集合的搜索查询的搜索结果;
识别与所述搜索查询的第一集合相关联的搜索词项;
将所识别的搜索词项与所述第二视频的所述元数据进行比较;以及
响应于指示所述第二视频的所述元数据不包括来自与针对所述第一视频的所述搜索查询的第一集合相关联的所述搜索词项的搜索词项的比较,将所述搜索词项识别为所述第二视频的元数据改进;以及
将所述元数据改进提供给与所述第二视频相关联的所述视频托管系统的用户,所述元数据改进基于来自与针对所述第一视频的所述搜索查询的第一集合相关联的所述搜索词项的搜索词项。
14.根据权利要求13所述的非暂时性计算机可读存储介质,还含有计算机程序代码,所述计算机程序代码可执行来执行步骤,所述步骤包括:
对所述第二视频的所述元数据进行更新,以包括所识别的元数据改进。
15.根据权利要求13所述的非暂时性计算机可读存储介质,其中,为了识别竞争所述视频托管系统的用户观看的所述第一视频和所述第二视频,所述操作进一步包括:
基于所识别的查询的第一集合和第二集合以及相关联的观看持续时间,计算指示所述第一视频与所述第二视频之间对所述视频托管系统的用户观看的竞争量的竞争分值。
16.根据权利要求15所述的非暂时性计算机可读存储介质,其中,所述竞争分值测量所述第一视频和所述第二视频竞争的所述搜索查询之间的相似性,并且其中,较高的竞争分值指示所述第一视频和所述第二视频在竞争较相似的搜索查询,且较低的竞争分值指示所述第一视频和所述第二视频在竞争较不相似的搜索查询。
17.根据权利要求15所述的非暂时性计算机可读存储介质,其中,为了计算所述竞争分值,所述操作进一步包括:
基于所识别的查询的第一集合以及相关联的观看持续时间生成用于所述第一视频的第一矢量,所述第一矢量表示所述第一视频响应于所述查询的第一集合而被观看的观看持续时间;
基于所识别的查询的第二集合以及相关联的观看持续时间生成用于所述第二视频的第二矢量,所述第二矢量表示所述第二视频响应于所述查询的第二集合而被观看的观看持续时间;
测量所述第一矢量与所述第二矢量之间的相似程度;以及
响应于所测量的相似程度而计算所述竞争分值。
18.根据权利要求13所述的非暂时性计算机可读存储介质,其中,所述第一视频包括所述第二视频的至少一个媒体内容。
CN201680078594.5A 2016-04-13 2016-12-15 提供视频的元数据关联的方法、系统和介质 Active CN108464007B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/098,126 US10318581B2 (en) 2016-04-13 2016-04-13 Video metadata association recommendation
US15/098,126 2016-04-13
PCT/US2016/067003 WO2017180199A1 (en) 2016-04-13 2016-12-15 Video metadata association recommendation

Publications (2)

Publication Number Publication Date
CN108464007A CN108464007A (zh) 2018-08-28
CN108464007B true CN108464007B (zh) 2021-10-29

Family

ID=60039560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680078594.5A Active CN108464007B (zh) 2016-04-13 2016-12-15 提供视频的元数据关联的方法、系统和介质

Country Status (4)

Country Link
US (1) US10318581B2 (zh)
EP (1) EP3395075A4 (zh)
CN (1) CN108464007B (zh)
WO (1) WO2017180199A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2016251812B2 (en) 2015-04-20 2021-08-05 Snap Inc. Interactive media system and method
US10346417B2 (en) 2016-08-18 2019-07-09 Google Llc Optimizing digital video distribution
GB201715475D0 (en) * 2017-09-25 2017-11-08 Promomii Ltd Electronic programme guide media system and method
CN108307240B (zh) * 2018-02-12 2019-10-22 北京百度网讯科技有限公司 视频推荐方法和装置
CN110691256B (zh) 2018-07-04 2021-04-20 北京字节跳动网络技术有限公司 视频关联信息的处理方法、装置,服务器及存储介质
CN109885726B (zh) * 2019-02-28 2021-11-26 北京奇艺世纪科技有限公司 一种生成视频元信息的方法和装置
CN110996124B (zh) * 2019-12-20 2022-02-08 北京百度网讯科技有限公司 原创视频确定方法及相关设备
WO2021149923A1 (ko) * 2020-01-20 2021-07-29 주식회사 씨오티커넥티드 영상 검색 제공 방법 및 장치
US20220358088A1 (en) * 2021-05-04 2022-11-10 At&T Intellectual Property I, L.P. Media content memory retrieval
CN114885188B (zh) * 2022-04-20 2024-07-23 百度在线网络技术(北京)有限公司 视频处理方法、装置、设备以及存储介质
CN118715514A (zh) * 2022-05-30 2024-09-27 脸萌有限公司 信息处理方法、装置及电子设备

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1646956A1 (en) * 2003-07-23 2006-04-19 University College Dublin, National University of Ireland Dublin Information retrieval
US7844590B1 (en) * 2005-06-16 2010-11-30 Eightfold Logic, Inc. Collection and organization of actual search results data for particular destinations
US7917492B2 (en) * 2007-09-21 2011-03-29 Limelight Networks, Inc. Method and subsystem for information acquisition and aggregation to facilitate ontology and language-model generation within a content-search-service system
CN101021855B (zh) * 2006-10-11 2010-04-07 北京新岸线网络技术有限公司 基于内容的视频检索系统
CN101021857A (zh) * 2006-10-20 2007-08-22 鲍东山 基于内容分析的视频搜索系统
US7739264B2 (en) * 2006-11-15 2010-06-15 Yahoo! Inc. System and method for generating substitutable queries on the basis of one or more features
US8468212B2 (en) * 2007-08-08 2013-06-18 Silicon Image, Inc. Network repository for metadata
US8566315B1 (en) 2009-03-09 2013-10-22 Google Inc. Sequenced video segment mix
WO2011143160A2 (en) 2010-05-10 2011-11-17 The Johns Hopkins University Metabolic inhibitor against tumors having an idh mutation
US8521541B2 (en) * 2010-11-02 2013-08-27 Google Inc. Adaptive audio transcoding
US8737817B1 (en) 2011-02-08 2014-05-27 Google Inc. Music soundtrack recommendation engine for videos
GB2483125B (en) * 2011-02-25 2012-09-26 British Sky Broadcasting Ltd Media system
US8407207B1 (en) * 2011-05-12 2013-03-26 Google Inc. Measuring video content of web domains
CN102790917B (zh) * 2011-05-19 2016-02-17 上海贝尔股份有限公司 交互式多屏业务内容传输方法和设备
EP2549389A1 (en) * 2011-07-20 2013-01-23 Axel Springer Digital TV Guide GmbH Easy 2D navigation in a video database
US9176965B2 (en) * 2011-11-02 2015-11-03 Lenovo (Singapore) Pte. Ltd. Associating search terms with a downloaded file
CN102567538A (zh) * 2011-12-31 2012-07-11 上海聚力传媒技术有限公司 提供与用户视频操作相对应的目标访问信息的方法和设备
US8620951B1 (en) 2012-01-28 2013-12-31 Google Inc. Search query results based upon topic
US9058385B2 (en) * 2012-06-26 2015-06-16 Aol Inc. Systems and methods for identifying electronic content using video graphs
US8873867B1 (en) * 2012-07-10 2014-10-28 Google Inc. Assigning labels to images
US20140074866A1 (en) * 2012-09-10 2014-03-13 Cisco Technology, Inc. System and method for enhancing metadata in a video processing environment
US20140201227A1 (en) * 2013-01-15 2014-07-17 Getty Images (Us), Inc. Content-identification engine based on social media
US9110988B1 (en) 2013-03-14 2015-08-18 Google Inc. Methods, systems, and media for aggregating and presenting multiple videos of an event
CN103617233B (zh) * 2013-11-26 2017-05-17 烟台中科网络技术研究所 一种基于语义内容多层表示的重复视频检测方法与装置

Also Published As

Publication number Publication date
US20170300570A1 (en) 2017-10-19
US10318581B2 (en) 2019-06-11
EP3395075A4 (en) 2019-07-10
CN108464007A (zh) 2018-08-28
WO2017180199A1 (en) 2017-10-19
EP3395075A1 (en) 2018-10-31

Similar Documents

Publication Publication Date Title
US11983218B2 (en) Video competition discovery and recommendation
CN108464007B (zh) 提供视频的元数据关联的方法、系统和介质
US8572647B2 (en) Online ad placement based on user metrics for hosted media
US9972356B2 (en) Media Summarization
US20220237247A1 (en) Selecting content objects for recommendation based on content object collections
US8484203B1 (en) Cross media type recommendations for media items based on identified entities
US8874566B2 (en) Online content ranking system based on authenticity metric values for web elements
US8650203B1 (en) Iterated related item discovery
US20140229487A1 (en) System and method for user preference augmentation through social network inner-circle knowledge discovery
US10362349B1 (en) Detecting channel similarity based on content reuse
JP6982527B2 (ja) レコメンド動画決定装置、レコメンド動画決定方法、およびプログラム
JP2008262520A (ja) インターネット情報検索システム及びその方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant