CN109923543A

CN109923543A - 通过生成视频帧的多个部分的指纹来检测立体视频的方法、系统和介质

Info

Publication number: CN109923543A
Application number: CN201780069375.5A
Authority: CN
Inventors: 瓦莱里·扎马拉耶夫; 菲利普·帕维蒂克
Original assignee: Google LLC
Current assignee: Google LLC
Priority date: 2016-12-16
Filing date: 2017-09-28
Publication date: 2019-06-21
Anticipated expiration: 2037-09-28
Also published as: EP3513326A1; KR102030322B1; JP2020513705A; US9872056B1; CN109923543B; KR20190086781A; US10499097B2; EP3513326B1; WO2018111379A1; US20180176619A1; JP6619542B1

Abstract

本发明提供了用于识别立体视频中的内容并且更具体地是用于通过生成视频帧的多个部分的指纹来检测滥用立体视频的方法、系统和介质。所述方法包括：从用户设备接收用于上传到内容提供者的视频内容项；从所述视频内容项的多个帧中选择帧以生成与所述视频内容项相对应的一个或者多个指纹；生成与所选择的帧相对应的第一指纹、与所选择的帧的第一编码部分相对应的第二指纹以及与所选择的帧的第二编码部分相对应的第三指纹；将所述第一指纹、所述第二指纹和所述第三指纹中的每个与对应于参考视频内容项的多个参考指纹进行比较；确定所述第一指纹、所述第二指纹和所述第三指纹中的至少一个是否与所述多个参考指纹中的参考指纹匹配；以及响应于确定所述第一指纹、所述第二指纹和所述第三指纹中的至少一个与所述参考指纹匹配，使所述匹配的指示被呈现在所述用户设备上。

Description

通过生成视频帧的多个部分的指纹来检测立体视频的方法、系统和介质

技术领域

所公开的主题涉及用于识别立体视频中的内容、例如用于检测哪里的内容可能是未授权分发或者受损数字版权管理的主题的方法、系统和介质。

背景技术

视频内容提供者可以接收上传视频内容，存储上传视频内容，并且然后将上传视频内容提供给许多用户，例如，通过将视频内容流传送至多个用户设备。这些视频内容提供者可以确定上传视频内容是否与例如受版权保护的内容的参考数据库中的视频内容匹配。随着沉浸式或者360度球形视频内容的出现，这些内容提供者已经开始接收包含三维视频内容的上传视频内容。然而，可能很难确定这种三维视频内容是否与参考数据库中的视频内容匹配。

因此，需要提供用于识别立体视频中的内容、并且更具体地用于通过生成视频帧的多个部分的指纹来检测“滥用”立体视频(例如，哪里的内容可能是未授权分发或者受损数字版权管理的主题)的方法、系统和介质。

发明内容

本发明提供了用于识别立体视频中的内容并且更具体地用于通过生成视频帧的多个部分的指纹来检测立体视频的方法、系统和介质。

根据所公开的主题的一些实施例，提供了一种识别立体视频中的内容的计算机实现的方法，该方法包括：从用户设备接收用于上传到内容提供者的视频内容项；从视频内容项的多个帧中选择帧以生成与视频内容项相对应的一个或者多个指纹；生成与选择的帧相对应的第一指纹、与选择的帧的第一编码部分相对应的第二指纹以及与选择的帧的第二编码部分相对应的第三指纹；将第一指纹、第二指纹和第三指纹中的每个与对应于参考视频内容项的多个参考指纹进行比较；确定第一指纹、第二指纹和第三指纹中的至少一个是否与多个参考指纹中的参考指纹匹配；以及响应于确定第一指纹、第二指纹和第三指纹中的至少一个与参考指纹匹配，使匹配的指示被呈现在用户设备上。

在一些实施例中，方法进一步包括：响应于确定第一指纹、第二指纹和第三指纹中的至少一个与参考指纹匹配，使视频内容项的存储被阻止。

在一些实施例中，选择的帧的第一编码部分和选择的帧的第二编码部分与在视频内容项被立体呈现时要被呈现给观看者的左眼的第一图像和要被呈现给观看者的右眼的第二图像相对应。

在一些实施例中，选择的帧的第一编码部分是选择的帧的左半部分并且选择的帧的第二编码部分是选择的帧的右半部分。

在一些实施例中，选择的帧的第一编码部分是选择的帧的上半部分并且选择的帧的第二编码部分是选择的帧的下半部分。

在一些实施例中，方法进一步包括：从用户设备接收视频内容项包含三维视频内容的指示，其中，第一指纹和第二指纹是响应于接收到视频内容项包含三维视频内容的指示来生成的。

根据所公开的主题的一些实施例，提供了一种用于识别立体视频中的内容的计算机实现的系统，该系统包括硬件处理器，该硬件处理器被配置为：从用户设备接收用于上传到内容提供者的视频内容项；从视频内容项的多个帧中选择帧以生成与视频内容项相对应的一个或者多个指纹；生成与选择的帧相对应的第一指纹、与选择的帧的第一编码部分相对应的第二指纹以及与选择的帧的第二编码部分相对应的第三指纹；将第一指纹、第二指纹和第三指纹中的每个与对应于参考视频内容项的多个参考指纹进行比较；确定第一指纹、第二指纹和第三指纹中的至少一个是否与多个参考指纹中的参考指纹匹配；以及响应于确定第一指纹、第二指纹和第三指纹中的至少一个与参考指纹匹配，使匹配的指示被呈现在用户设备上。

根据所公开的主题的一些实施例，提供了一种包含计算机可执行指令的非暂时性计算机可读介质，该计算机可执行指令在被处理器执行时使处理器执行识别立体视频中的内容的方法，该方法包括：从用户设备接收用于上传到内容提供者的视频内容项；从视频内容项的多个帧中选择帧以生成与视频内容项相对应的一个或者多个指纹；生成与选择的帧相对应的第一指纹、与选择的帧的第一编码部分相对应的第二指纹以及与选择的帧的第二编码部分相对应的第三指纹；将第一指纹、第二指纹和第三指纹中的每个与对应于参考视频内容项的多个参考指纹进行比较；确定第一指纹、第二指纹和第三指纹中的至少一个是否与多个参考指纹中的参考指纹匹配；以及响应于确定第一指纹、第二指纹和第三指纹中的至少一个与参考指纹匹配，使匹配的指示被呈现在用户设备上。

根据所公开的主题的一些实施例，提供了一种用于识别立体视频中的内容的系统，该系统包括：用于从用户设备接收用于上传到内容提供者的视频内容项的装置；用于从视频内容项的多个帧中选择帧以生成与视频内容项相对应的一个或者多个指纹的装置；用于生成与选择的帧相对应的第一指纹、与选择的帧的第一编码部分相对应的第二指纹以及与选择的帧的第二编码部分相对应的第三指纹的装置；用于将第一指纹、第二指纹和第三指纹中的每个与对应于参考视频内容项的多个参考指纹进行比较的装置；用于确定第一指纹、第二指纹和第三指纹中的至少一个是否与多个参考指纹中的参考指纹匹配的装置；以及用于响应于确定第一指纹、第二指纹和第三指纹中的至少一个与参考指纹匹配，使匹配的指示被呈现在用户设备上的装置。

附图说明

当结合附图考虑时，参考所公开的主题的以下详细描述，可以更完全地了解所公开的主题的各种目的、特征和优点，在附图中，类似的元件符号表示类似的元件。

图1示出了根据所公开的主题的一些实施例的用于接收从内容创建者上传的视频内容的用户界面。

图2A和图2B示出了根据所公开的主题的一些实施例的生成与整个帧和视频内容项的帧的两个编码部分相关联的指纹的示意图的说明性示例。

图3示出了根据所公开的主题的一些实施例的适合于用于通过生成视频帧的多个部分的指纹来检测滥用立体视频的本文所描述的机制的实施方式的说明性系统的示意图。

图4示出了根据所公开的主题的一些实施例的可以用于图3的服务器和/或用户设备的硬件的详细示例。

图5示出了根据所公开的主题的一些实施例的通过生成视频帧的多个部分的指纹来检测滥用立体视频的过程的说明性示例。

具体实施方式

根据各个实施例，提供了用于识别立体视频中的内容并且更具体地是用于通过生成视频帧的多个部分的指纹来检测滥用立体视频的机制(其可以包括方法、系统和介质)。

在一些实施例中，本文所描述的机制可以用于检测上传视频内容项中的特定类型的视频内容。例如，在一些实施例中，机制可以用于检测上传视频内容项内的可能受版权保护的视频内容或者可能受版权保护的音频内容。应当注意，各种采指纹(fingerprinting)技术已经被用来识别受版权保护的内容，例如，通过将内容项的部分与参考内容项的数据库中的参考内容项进行比较。然而，当上传视频内容项是三维视频内容时，这些采指纹技术有时不能用于识别受版权保护的视频内容。例如，在上传视频内容项包括被编码为立体视频内容的三维内容(例如，具有被编码为帧的左半部分和右半部分的要被传送至用户的左眼和右眼的视频内容，并且/或者以任何其它合适的方式被编码)的情况下，采指纹技术可能无法检测与参考数据库中的视频内容的匹配。具体地，在采指纹技术没有意识到上传视频内容项包括立体视频内容(基于上传视频内容项的用户没有指示上传内容包括立体视频内容，和/或基于任何其它合适的信息)的情况下，采指纹技术可以对视频内容项的整个帧采指纹，并且因此无法检测与参考视频内容项的匹配。相反，在上传视频内容项包括二维视频内容，但是被标记或者指示为三维视频内容(例如，通过用户上传视频内容项，和/或以任何其它合适的方式)的情况下，采指纹技术可以试图将视频内容项的帧的一半与参考视频内容项进行匹配，并且因此无法检测参考数据库中的匹配视频内容。

在一些实施例中，本文所描述的机制可以生成上传视频内容项的整个帧、上传视频内容项的帧的第一编码部分和上传视频内容项的帧的第二编码部分的指纹。例如，在一些实施例中，如果视频作为被立体编码的三维视频内容项被传送，则帧的第一编码部分可以与要被传送至观看者的左眼的帧的前半部分相对应，并且如果视频作为被立体编码的三维视频内容项被传送，则帧的第二编码部分可以与要被传送至观看者的右眼的帧的后半部分相对应。作为更具体的示例，在一些实施例中，帧的前半部分和帧的后半部分可以分别与帧的左半部分和帧的右半部分相对应。另外或者可替代地，在一些实施例中，帧的前半部分和帧的后半部分可以是立体视频内容的任何合适的布置，诸如，帧的上半部分和下半部分、帧的交替像素(例如，呈棋盘式)、视频内容写的交替帧和/或任何其它合适的布置。

在一些实施例中，机制然后可以将从整个帧生成的指纹和从帧的每个编码部分生成的指纹与存储在参考数据库中的视频内容项的指纹进行比较，并且可以检测生成的指纹中的任何一个指纹是否与参考指纹匹配。应当注意，在一些实施例中，机制因此可以检测上传视频内容项是否与参考视频内容匹配，不管上传视频内容项是否包括2维视频内容或者3维视频内容。还应当注意，在一些实施例中，机制因此可以检测上传视频内容项是否与参考视频内容匹配，不管用户所上传的上传视频内容项是否已经将视频内容项正确地指示或者指定为二维视频内容项或者三维视频内容项。

在一些实施例中，如果本文所描述的机制检测到上传视频内容项与参考视频内容项之间的匹配(例如，指示上传视频内容项是可能受版权保护的的视频内容)，则机制可以使匹配的指示被呈现在发送和/或上传视频内容项的用户设备上。例如，在一些实施例中，指示上传内容与参考视频内容匹配的消息可以被呈现在用户设备上。另外或者可替代地，在一些实施例中，机制可以响应于检测到与参考视频内容项的匹配来阻止上传视频内容项的存储。此外，在一些实施例中，机制可以使已经与参考视频内容匹配的上传视频内容项被标记以进行手动查看。

应当注意，在一些实施例中，上传视频内容项可以是任何合适类型的视频内容，包括视频、电影、电视节目、直播流传送的内容和/或任何其它合适的视频内容。例如，在上传视频内容项是直播流传送的视频内容的情况下，用户设备可以将现场视频内容发送至服务器，该服务器可以托管接收到的视频内容并且使视频内容被流传送至其它用户设备，例如，响应于观看视频内容的请求。在上传视频内容项是直播流传送的视频内容的情况下，本文所描述的机制可以在接收到直播流传送的内容时生成直播流传送的内容的部分的指纹。例如，在一些实施例中，在直播流传送的视频内容项被从用户设备发送至托管视频内容的服务器的情况下，机制可以在视频内容被服务器接收到时生成任何合适的持续时间(例如，1秒、2秒、5秒、1分钟和/或者任何其它合适的持续时间)的接收到的视频内容的部分的指纹。在直播流传送的内容与参考数据库中的参考视频内容匹配的情况下，本文所描述的机制可以将直播流传送的内容与参考数据库中的参考视频内容匹配的指示呈现在将直播流传送的内容发送至服务器的用户设备上。例如，在一些实施例中，机制可以使指示已经确定直播流传送的内容与参考数据库中的特定视频内容项匹配的消息呈现在用户设备上，并且在一些实施例中，可以识别参考数据库中的特定视频内容项的名称。另外或者可替代地，在一些实施例中，机制可以响应于检测到与参考视频内容项的匹配来阻止进一步流传送直播流传送的视频内容。

转向图1，根据所公开的主题的一些实施例示出了用于接收上传视频内容项和关于要被上传到内容提供者的视频内容项的信息的用户界面的示例100。如图所示，用户界面100包括内容项选择界面102和内容项信息界面104。

在一些实施例中，内容项选择界面102可以包括用于允许用户界面100的用户选择要上传的内容项的任何合适的用户界面控件。例如，如图1所示，在一些实施例中，内容项选择界面102可以包括按钮，该按钮在被选择时可以使与用户界面100相关联的用户设备的目录列表呈现。在一些实施例中，选择的内容项然后可以用文本框指示。在一些实施例中，可以省略内容项选择界面102。

在一些实施例中，内容项信息界面104可以用于允许上传特定视频内容项的内容创建者指示关于视频内容项的任何合适的信息。例如，如图1所示，在一些实施例中，内容项信息界面104可以包括用于允许内容创建者指示上传视频内容项是否是立体视频内容项的户界面控件。在一些实施例中，任何其它合适的信息可以由内容项信息界面104指示。例如，在一些实施例中，信息可以包括视频内容项的名称、视频内容项的创建者的名称、与视频内容项相关联的信用信息或者协作信息、与视频内容项相关联的关键字、与视频内容项相关联的访问控制或者隐私设置和/或任何其它合适的信息。

转向图3，根据所公开的主题的一些实施例示出了适合于实施用于识别立体视频中的内容并且更具体地是用于通过生成视频帧的多个部分的指纹来检测滥用立体视频的本文所描述的机制的说明性系统300的示例。如图所示，硬件300可以包括诸如服务器302等一个或者多个服务器、通信网络304和/或诸如用户设备308和310等一个或者多个用户设备306。

在一些实施例中，(多个)服务器302可以是用于接收视频内容项的上传、确定上传视频内容项是否与参考视频内容项匹配并且/或者执行任何其它合适的功能的任何合适的(多个)服务器。例如，如下面结合图5所描述的，(多个)服务器302可以执行任何合适的(多种)采指纹技术来确定上传视频内容项是否与参考数据库中的视频内容项匹配。作为更具体的示例，在一些实施例中，(多个)服务器302可以生成视频内容项的整个帧以及帧的前半部分和后半部分的指纹以确定视频内容项是否与参考视频内容项匹配，不管上传视频内容项是否是立体视频内容项。在某些实施例中，(多个)服务器302可以省略。

在一些实施例中，通信网络304可以是一个或者多个有线网络和/或无线网络的任何合适的组合。例如，通信网络306可以包括互联网、内联网、广域网(WAN)、局域网(LAN)、无线网络、数字用户线路(DSL)网络、帧中继网络、异步传送模式(ATM)网络、虚拟专用网络(VPN)和/或任何其它合适的通信网络中的任何一个或者多个。用户设备306可以被一个或者多个通信链接312和/或314连接至可以经由一个或者多个通信链接(例如，通信链接316)链接至(多个)服务器302的通信网络304。通信链接312、314和/或316可以是适合于在用户设备306和(多个)服务器302之间传递数据的任何通信链接，诸如，网络链接、拨号链接、无线链接、硬线链接、任何其它合适的通信链接或者这些链接的任何合适的组合。

在一些实施例中，用户设备306可以包括适合于将视频内容项发送至(多个)服务器302，将与视频内容项相关的信息发送至(多个)服务器302和/或任何其它合适的功能的一个或者多个计算设备。例如，在一些实施例中，用户设备306可以被实施为移动设备，诸如，智能电话、移动电话、平板计算机、膝上型计算机、交通工具(例如，汽车、船、飞机或者任何其它合适的交通工具)娱乐系统、便携式媒体播放器和/或任何其它合适的移动设备。作为另一示例，在一些实施例中，用户设备306可以被实施为非移动设备，诸如，台式计算机、机顶盒、电视机、流媒体播放器、游戏机或者任何其它合适的非移动设备。

虽然服务器302被图示为单个设备，但是在一些实施例中，服务器302所执行的功能可以使用任何合适数量的设备来执行。例如，在一些实施例中，可以使用多个设备来实施服务器302所执行的功能。

虽然在图3中示出了两个用户设备308和310，但是在一些实施例中可以使用任何合适数量的用户设备和/或任何合适类型的用户设备。

在一些实施例中，(多个)服务器302和用户设备306可以使用任何合适的硬件来实施。例如，在一些实施例中，设备302和306可以使用任何合适的通用计算机或者专用计算机来实施。例如，服务器可以使用专用计算机来实施。任何这种通用计算机或者专用计算机都可以包括任何合适的硬件。例如，如在图4的示例硬件400中所示的，这种硬件可以包括硬件处理器402、存储器和/或存储设备404、输入设备控制器406、输入设备408、显示/音频驱动器410、显示和音频输出电路系统412、(多个)消息接口414、天线416和总线418。

在一些实施例中，硬件处理器402可以包括任何合适的硬件处理器，诸如，微处理器、微控制器、(多个)数字信号处理器、专用逻辑和/或用于控制通用计算机或者专用计算机的功能的任何其它合适的电路系统。在一些实施例中，硬件处理器402可以由存储在服务器(例如，诸如，服务器302)的存储器和/或存储设备404中的服务器程序控制。例如，服务器程序可以使硬件处理器402对上传视频内容项的一个或者多个帧采指纹，确定(多个)指纹是否与参考数据库中的视频内容项匹配，响应于确定视频内容项与参考数据库中的视频内容项匹配来阻止上传视频内容项并且/或者执行任何其它合适的动作。在一些实施例中，硬件处理器402可以被存储在用户设备306的存储器和/或存储设备404中的计算机程序控制。例如，计算机程序可以使硬件处理器402将视频内容项发送至(多个)服务器302并且/或者执行任何其它合适的动作。

在一些实施例中，存储器和/或存储设备404可以是用于存储程序、数据、媒体内容、广告和/或任何其它合适的信息的任何合适的存储器和/或存储设备。例如，存储器和/或存储设备404可以包括随机存取存储器、只读存储器、闪存、硬盘存储设备、光学介质和/或任何其它合适的存储器。

在一些实施例中，输入设备控制器406可以是用于控制和接收来自一个或者多个输入设备408的输入的任何合适的电路系统。例如，输入设备控制器406可以是用于接收来自触摸屏、来自键盘、来自鼠标、来自一个或者多个按钮、来自语音识别电路、来自麦克风、来自摄像头、来自光学传感器、来自加速度计、来自温度传感器、来自近场传感器和/或任何其它类型的输入设备的输入的电路系统。在另一示例中，输入设备控制器406可以是用于接收来自头戴式设备的输入(例如，用于呈现虚拟现实内容或者增强现实内容)的电路系统。

在一些实施例中，显示/音频驱动器410可以是用于控制和驱动至一个或者多个显示/音频输出电路系统412的输出的任何合适的电路系统。例如，显示/音频驱动器410可以是用于驱动触摸屏、平板显示器、阴极射线管显示器、投影仪、一个或者多个扬声器和/或任何其它合适的显示和/或呈现设备的电路系统。

(多个)通信接口414可以是用于与一个或者多个通信网络(诸如，图3所示的网络304)交互的任何合适的电路系统。例如，(多个)接口414可以包括网络接口卡电路系统、无线通信电路系统和/或任何其它合适类型的通信网络电路系统。

在一些实施例中，天线416可以是用于与通信网络(例如，通信网络304)进行无线通信的任何合适的一个或者多个天线。在一些实施例中，天线416可以省略。

在一些实施例中，总线418可以是用于在两个或者两个以上的组件402、404、406、410和414之间进行通信的任何合适的机制。

根据一些实施例，任何其它合适的组件可以被包括在硬件400中。

转向图5，根据所公开的主题的一些实施例示出了用于识别立体视频中的内容并且更具体地是用于通过生成视频帧的多个部分的指纹来检测滥用立体视频的过程的示例500。在一些实施例中，过程500的框可以在(多个)服务器302上执行。

过程500可以通过接收上传视频内容项开始于502。在一些实施例中，视频内容项可以由任何合适的实体上传。例如，在一些实施例中，视频内容项可以由视频内容项的创建者和/或任何其它合适的实体上传。在另一示例中，在一些实施例中，多个视频内容项可以由实体上传到内容提供者(例如，使用应用程序接口)。在一些实施例中，视频内容项可以是任何合适类型的视频内容，诸如，电视节目、电影、直播流传送的内容(例如，其中，上传视频内容项是直播流传送的内容的视频标识符)、视频广告和/或任何其它合适类型的视频内容。另外，在一些实施例中，视频内容项可以包括三维视频内容，该三维视频内容可以任何合适的方式被编码。例如，在一些实施例中，三维视频内容可以被编码为立体视频内容，具有以任何合适的格式编码的左图像和右图像。作为更具体的示例，在一些实施例中，左图像和右图像可以通过视频内容项的每个帧内的交错像素(例如，呈棋盘式)在视频内容项的每个帧的上半部分和下半部分中根据视频内容项的每个帧内的每一侧被编码为视频内容项的连续帧和/或以任何其它合适的格式被编码。

在一些实施例中，过程500可以另外接收关于上传视频内容项的任何合适的信息。例如，如图1所示和如上面结合图1所描述的，过程500可以从上传视频内容项的用户接收指示视频内容项是否包括被立体编码的三维内容的信息。在一些实施例中，过程500可以另外或者可替代地接收任何合适的信息，诸如，视频内容项的名称、视频内容项的创建者的名称、与视频内容项相关联的信用信息或者协作信息、与视频内容项相关联的关键字、与视频内容项相关联的访问控制或者隐私设置和/或任何其它合适的信息。

应当注意，在一些实施例中，过程500可以使用任何合适的技术或者技术的组合来确定上传视频内容项是否包括被立体编码的三维视频内容。例如，在一些实施例中，过程500可以确定帧的左半部分中的像素中的图像内容是否与帧的右半部分中的相应像素中的图像内容相对应，以确定帧是否包括要被传送至观看者的左眼和右眼的图像内容。作为另一示例，在一些实施例中，过程500可以确定帧的上半部分中的像素中的图像内容是否与帧的下半部分中的相应像素中的图像内容相对应，以确定帧是否包括要被传送至观看者的左眼和右眼的图像内容。另外或者可替代地，在过程500(例如，经由用户界面100和/或以任何其它合适的方式)从用户接收到上传视频内容项是否包括三维视频内容的明确指示的情况下，过程500可以使用任何合适的技术或者技术的组合来验证明确的用户输入。

在504中，在一些实施例中，过程500可以选择要采指纹的上传视频内容项的帧。在一些实施例中，帧可以任何合适的方式被选择。例如，在一些实施例中，过程500可以选择被确定为视频内容项中的关键帧的帧。作为更具体的示例，在一些实施例中，选择的关键帧可以是基于对视频内容项的运动分析识别到的帧并且将具有内容的时间点包括在运动中。作为另一更具体的示例，在一些实施例中，选择的关键帧可以是作为视频内容项中的两个不同场景之间的边界的帧。作为另一示例，在一些实施例中，过程500可以随机地选择上传视频内容项的帧。作为又一示例，在一些实施例中，过程500可以生成与上传视频内容项的一系列帧(例如，每个帧、每个其它帧、每十个帧和/或任何其它系列)相对应的指纹，直到发现与参考数据库中的视频内容项的匹配或者上传视频内容项的所有帧都已经被分析为止。

在一些实施例中，过程500可以采用从上传视频内容项选择帧的多种方法。例如，过程500可以确定多种方法(例如，运动分析、边界分析、随机选择等)中的哪些方法已产生与具有最少数量的选择帧的参考视频内容项的指纹匹配的生成指纹，并且作为响应，指定过程500使用从上传视频内容项选择帧的这种方法。在另一示例中，过程500可以选择从上传视频内容项选择帧的多种方法，其中，一个或者多个指纹是针对基于运动分析选择的帧生成的并且一个或者多个指纹是针对基于边界分析选择的帧生成的。

在一些实施例中，过程500在506中可以生成整个选择帧的一个或者多个指纹。转向图2A，根据所公开的主题的一些实施例示出了帧200的示例。如图所示，帧200可以包括可以任何合适的方式布置的任何合适数量的像素(诸如，像素202)。在一些实施例中，过程500可以通过创建表示帧200的图像内容的一个或者多个签名来生成帧200的一个或者多个指纹。例如，在一些实施例中，一个或者多个签名可以包括帧200的颜色、饱和度或者色调的直方图。在一些实施例中，一个或者多个签名可以是基于与帧200相关的任何其它合适的信息。在一些实施例中，过程500可以将帧200分成两个或者两个以上的空间块并且可以计算空间块中的每个空间块的一个或者多个签名。在一些实施例中，与整个选择帧相对应的通过过程500生成的第一指纹可以是基于生成的签名中的任何一个或者签名的任何组合。

在一些实施例中，过程500在508中可以生成选择的帧的第一编码部分和选择的帧的第二编码部分的一个或者多个指纹。在一些实施例中，选择的帧的第一编码部分可以是要被传送至观看者的一只眼睛的第一立体图形并且选择的帧的第二编码部分可以是要被传送至观看者的另一只眼睛的第二立体图形。在一些实施例中，选择的帧的第一编码部分和第二编码部分可以任何合适的格式被编码。例如，如图2B所示，帧250可以具有可以与帧250的第一编码部分相对应的左半部分帧252和可以与帧250的第二编码部分相对应的右半部分帧254。应当注意，在一些实施例中，选择的帧的第一编码部分和选择的帧的第二编码部分可以呈任何合适的布置，诸如，左右两部分(如图2B所示)、上下两部分、逐个像素交错(例如，呈棋盘式)、逐帧交错和/或以任何其它合适的方式被布置。另外，应当注意，在一些实施例中，过程500可以生成选择的帧的第一编码部分和选择的帧的第二编码部分的一个或者多个指纹，不管帧250是否包括立体内容。

应当注意，过程500可以使用任何合适的技术或者技术的组合来生成选择的帧的第一编码部分和选择的帧的第二编码部分的一个或者多个指纹。例如，在一些实施例中，过程500可以使用上面结合框506描述的技术来生成表示选择的帧的第一编码部分的第一指纹和表示选择的帧的第二编码部分的第二指纹。如上面结合框506讨论的，在一些实施例中，第一指纹和第二指纹可以是基于选择的帧的每个编码部分的任何合适的信息或者签名，诸如，颜色、饱和度或者色调的直方图和/或任何其它合适的信息。

在一些实施例中，过程500在510中可以确定在框506和508中生成的指纹中的至少一个指纹是否与存储在参考数据库中的参考视频内容项的指纹匹配。过程500可以使用任何合适的技术或者技术的组合来确定是否存在匹配。例如，在一些实施例中，过程500可以确定与上传视频内容项相关联的生成指纹中的任何一个指纹的图案与参考视频内容项的指纹的图案之间的距离(例如，欧氏距离和/或任何其它合适的距离度量)是否小于预定阈值。作为另一示例，在一些实施例中，过程500可以确定与上传视频内容项相关联的生成指纹中的任何一个指纹与参考视频内容项的指纹之间的相关性是否超过预定阈值。应当注意，在一些实施例中，过程500可以另外或者可替代地计算在框506和508中生成的指纹中的至少一个指纹与参考数据库中的视频内容项的指纹匹配的可能性。在一些这样的实施例中，过程500可以使用任何合适的技术或者技术的组合来计算匹配的可能性。例如，在一些实施例中，过程500可以基于指纹之间的距离度量、指纹之间的相关性和/或任何其它合适的因素或者因素的组合来计算匹配的可能性(例如，结果可能性分数在0与1之间)。

应当注意，在一些实施例中，过程500可以基于从上传视频内容项的多个帧生成的指纹确定生成的指纹中的任何一个指纹是否与参考数据库中的视频内容项的指纹匹配。例如，在一些实施例中，过程500可以生成上传视频内容项的多个帧的指纹并且可以计算指示生成的指纹中的每个指纹与参考视频内容项的指纹的接近程度的任何合适的度量(例如，距离度量、相关性度量和/或任何其它合适的度量)。过程500然后可以组合每个帧的度量以计算上传视频内容项与参考视频内容项匹配的可能性。在一些实施例中，过程500可以使用视频内容项的整个帧(例如，如在框506中生成的)和/或选择的帧的一个或者两个编码部分(例如，如在框508中生成的)跨越视频内容项的多个帧组合指纹信息。

在一些实施例中，过程500可以另外或者可替代地生成一个或者多个音频指纹(例如，在框506中和/或在框508中)。过程500然后可以使用上面描述的任何合适的度量来确定(多个)生成的音频指纹是否与参考数据库中的参考视频的参考音频指纹相对应。在一些这样的实施例中，过程500可以基于音频指纹、与上传视频内容项的整个选择帧相对应的(多个)指纹、与上传视频内容项的第一编码部分相对应的指纹和/或与上传视频内容项的第二编码部分相对应的指纹中的任何一个确定上传视频内容项与参考视频匹配的可能性(例如，一个或者多个指纹中的每一个在与参考指纹进行比较时都接收可能性分数并且可以生成包含每个单独的可能性分数的组合的可能性分数)。

如果在510中过程500确定指纹中的一个或者多个指纹与参考视频内容项的指纹匹配(510中的“是”)，则过程500可以进行框512并且可以阻止上传视频内容项的存储。在一些实施例中，过程500可以使指示上传视频内容项的存储已经被阻止的任何合适的消息呈现在发送视频内容项的用户设备上。例如，在一些实施例中，消息可以指示上传视频内容项因为已经确定上传视频内容项与参考数据库中的视频内容项(例如，受版权保护的视频内容和/或任何其它合适的视频内容)匹配而被阻止。在一些实施例中，消息可以包括任何其它合适的信息，诸如，与上传视频内容项匹配的参考视频的名称或者其它标识符、参考视频的创建者的名称、上传视频内容项与参考视频匹配的一个或者多个时间点和/或任何其它合适的信息。应当注意，在一些实施例中，过程500可以允许存储上传视频内容项，但是可以标记上传视频内容项以进行手动查看。可替代地，在一些实施例中，过程500可以阻止上传视频内容项的存储，直到进一步的手动查看已经完成为止。

如果在510中过程500确定生成的指纹中的没有一个与参考视频内容项的指纹匹配(510中的“否”)，则过程500可以进行框514并且可以允许上传视频内容项的存储。在一些实施例中，响应于接收到上传视频内容项的请求，上传视频内容项然后可以在稍后被呈现在例如用户设备上。在一些实施例中，上传视频内容项可以被存储在(多个)服务器302上。在一些实施例中，上传视频内容项可以与任何合适的信息诸如上传视频内容项的创建者的名称、视频内容项被上传到(多个)服务器302的日期、与上传视频内容项相关联的关键字和/或主题和/或任何其它合适的信息结合存储。在一些实施例中，存储的信息可以进一步指示未发现上传视频内容项与参考数据库中的任何视频内容匹配并且可以指示上传视频内容项与参考数据库中的视频内容比较是最近的时间和/或日期。

应当注意，在一些实施例中，过程500可以在任何合适的时间重复框504至510。例如，在一些实施例中，过程500可以在稍后(例如，在已经允许上传视频内容项存储在(多个)服务器302之后)重复框504至510以确定自在框54中批准上传视频内容项的存储以来上传视频内容项是否与添加到参考数据库的视频内容匹配。作为另一示例，在一些实施例中，过程500可以响应于从上传视频内容项的用户接收到关于视频内容项的信息已经改变的指示重复框504至510。作为更具体的示例，在用户之前已经指示上传视频内容项包含被编码为立体视频内容的三维视频内容(例如，如图1A所示和如上面结合图1A描述的)并且随后指示上传视频内容不是三维内容的情况下，过程500可以重复框504至510以确定视频内容项的整个帧的一个或者多个指纹是否与参考数据库中的参考视频内容项的指纹匹配。

在一些实施例中，图5的过程的上述框中的至少一些框可以按照任何次序或者顺序执行或者进行，并不限于图中所示和结合图所描述的次序或者顺序。同样，在适当的情况下或者在并行减少延迟和处理次数的同时，可以大体上同时执行或者进行图5的上述框中的一些框。另外或者可替代地，图5的过程的上述框中的一些框可以省略。

在一些实施例中，任何合适的计算机可读介质可以用于存储用于执行本文中的功能和/或过程的指令。例如，在一些实施例中，计算机可读介质可以是暂时性的或者非暂时性的。例如，非暂时性计算机可读介质可以包括介质诸如磁性介质(诸如，硬盘、软盘和/或其它合适的磁性介质)、光学介质(诸如，光盘、数字化视频光盘、蓝光光盘和/或任何其它合适的光学介质)、半导体介质(诸如，闪存、电可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)和/或任何其它合适的半导体介质)、在传输期间转瞬即逝或者不会有任何持久性假象的任何合适的介质、和/或任何合适的有形介质。作为另一示例，暂时性计算机可读介质可以包括在网络、线、导体、光纤、电路、在传输期间转瞬即逝或者不会有任何持久性假象的任何合适的介质、和/或任何合适的有形介质上的信号。

在本文所描述的系统收集关于用户的个人信息或者使用个人信息的情况下，用户可以具有控制程序或者特征是否收集用户信息(例如，关于用户的社交网络、社交动作或者活动、职业、用户的偏好、或者用户的当前位置的信息)的机会。另外，在存储或者使用特定数据之前，可以按照一种或者多种方式来处理该特定数据，从而使得可以去除个人信息。例如，可以对用户的身份进行处理，使得无法为用户确定个人可识别信息，或者在获得位置信息的情况下可以使用户的地理位置一般化(诸如至城市、ZIP代码、或者州级)，使得无法确定用户的特定位置。由此，用户可以控制关于用户的信息如何采集以及如何由内容服务器使用。

因此，提供了用于识别立体视频中的内容的方法、系统和介质。

虽然在上述说明性实施例中描述并且示出了本发明，但是应当理解，已经仅仅以举例的方式对本公开进行了说明，并且在不脱离本发明的精神和范围的情况下，可以对实施本发明的细节进行各种变化，本发明仅受以下权利要求书的限制。所公开的实施例的特征可以按照不同的方式组合和重新设置。

Claims

1.一种用于识别立体视频中的内容的计算机实现的方法，所述方法包括：

从用户设备接收用于上传到内容提供者的视频内容项；

从所述视频内容项的多个帧中选择帧以生成与所述视频内容项相对应的一个或者多个指纹；

生成与所选择的帧相对应的第一指纹、与所选择的帧的第一编码部分相对应的第二指纹以及与所选择的帧的第二编码部分相对应的第三指纹；

将所述第一指纹、所述第二指纹和所述第三指纹中的每个与对应于参考视频内容项的多个参考指纹进行比较；

确定所述第一指纹、所述第二指纹和所述第三指纹中的至少一个是否与所述多个参考指纹中的参考指纹匹配；以及

响应于确定所述第一指纹、所述第二指纹和所述第三指纹中的至少一个与所述参考指纹匹配，使所述匹配的指示被呈现在所述用户设备上。

2.根据权利要求1所述的方法，进一步包括：响应于确定所述第一指纹、所述第二指纹和所述第三指纹中的至少一个与所述参考指纹匹配，使所述视频内容项的存储被阻止。

3.根据权利要求1或者2所述的方法，其中，所选择的帧的所述第一编码部分和所选择的帧的所述第二编码部分与在所述视频内容项被立体呈现时要被呈现给观看者的左眼的第一图像和要被呈现给观看者的右眼的第二图像相对应。

4.根据权利要求3所述的方法，其中，所选择的帧的所述第一编码部分是所选择的帧的左半部分并且所选择的帧的所述第二编码部分是所选择的帧的右半部分。

5.根据权利要求3所述的方法，其中，所选择的帧的所述第一编码部分是所选择的帧的上半部分并且所选择的帧的所述第二编码部分是所选择的帧的下半部分。

6.根据前述权利要求中的任一项所述的方法，进一步包括：从所述用户设备接收所述视频内容项包含三维视频内容的指示，其中，所述第一指纹和所述第二指纹是响应于接收到所述视频内容项包含三维视频内容的所述指示而生成的。

7.一种用于识别立体视频中的内容的系统，所述系统包括：

硬件处理器，所述硬件处理器被配置为：

从用户设备接收用于上传到内容提供者的视频内容项；

8.根据权利要求7所述的系统，其中，所述硬件处理器进一步被配置为：响应于确定所述第一指纹、所述第二指纹和所述第三指纹中的至少一个与所述参考指纹匹配，使所述视频内容项的存储被阻止。

9.根据权利要求7或者8所述的系统，其中，所选择的帧的所述第一编码部分和所选择的帧的所述第二编码部分与在所述视频内容项被立体呈现时要被呈现给观看者的左眼的第一图像和要被呈现给观看者的右眼的第二图像相对应。

10.根据权利要求9所述的系统，其中，所选择的帧的所述第一编码部分是所选择的帧的左半部分并且所选择的帧的所述第二编码部分是所选择的帧的右半部分。

11.根据权利要求9所述的系统，其中，所选择的帧的所述第一编码部分是所选择的帧的上半部分并且所选择的帧的所述第二编码部分是所选择的帧的下半部分。

12.根据权利要求7至11中的任一项所述的系统，其中，所述硬件处理器进一步被配置为：从所述用户设备接收所述视频内容项包含三维视频内容的指示，其中，所述第一指纹和所述第二指纹是响应于接收到所述视频内容项包含三维视频内容的所述指示而生成的。

13.一种包含计算机可执行指令的非暂时性计算机可读介质，所述计算机可执行指令在被处理器执行时使所述处理器执行用于识别立体视频中的内容的方法，所述方法包括：

从用户设备接收用于上传到内容提供者的视频内容项；

将所述第一指纹、所述第二指纹和所述第三指纹中的每个指纹与对应于参考视频内容项的多个参考指纹进行比较；

14.根据权利要求13所述的非暂时性计算机可读介质，其中，所述方法进一步包括：响应于确定所述第一指纹、所述第二指纹和所述第三指纹中的至少一个与所述参考指纹匹配，使所述视频内容项的存储被阻止。

15.根据权利要求13或者14所述的非暂时性计算机可读介质，其中，所选择的帧的所述第一编码部分和所选择的帧的所述第二编码部分与在所述视频内容项被立体呈现时要被呈现给观看者的左眼的第一图像和要被呈现给观看者的右眼的第二图像相对应。

16.根据权利要求15所述的非暂时性计算机可读介质，其中，所选择的帧的所述第一编码部分是所选择的帧的左半部分并且所选择的帧的所述第二编码部分是所选择的帧的右半部分。

17.根据权利要求15所述的非暂时性计算机可读介质，其中，所选择的帧的所述第一编码部分是所选择的帧的上半部分并且所选择的帧的所述第二编码部分是所选择的帧的下半部分。

18.根据权利要求13至17中的任一项所述的非暂时性计算机可读介质，其中，所述方法进一步包括：从所述用户设备接收所述视频内容项包含三维视频内容的指示，其中，所述第一指纹和所述第二指纹是响应于接收到所述视频内容项包含三维视频内容的所述指示而生成的。