CN113360709B

CN113360709B - 短视频侵权风险的检测方法、装置和电子设备

Info

Publication number: CN113360709B
Application number: CN202110592664.1A
Authority: CN
Inventors: 龚兵; 周亚
Original assignee: Vivo Mobile Communication Hangzhou Co Ltd
Current assignee: Vivo Mobile Communication Hangzhou Co Ltd
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2023-02-17
Anticipated expiration: 2041-05-28
Also published as: CN113360709A

Abstract

本申请公开了一种短视频侵权风险的检测方法、装置和电子设备，属于通信技术领域。该短视频侵权风险的检测方法包括：将短视频分离为N个内容；对N个内容中的目标内容进行主题分类预测，得到目标内容的目标主题类型；根据目标主题类型，对目标内容的侵权风险进行检测；其中，N为大于或等于2的整数。

Description

短视频侵权风险的检测方法、装置和电子设备

技术领域

本申请属于通信技术领域，具体涉及一种短视频侵权风险的检测方法、装置和电子设备。

背景技术

随着网络基础设施的逐渐升级完善与网民兴趣的逐渐转移，短视频产品开始受到了用户的广泛喜爱。越来越多的用户通过一些平台型APP以及终端设备自带的短视频软件进行视频的创作和发布。在上述过程中，保护短视频作品的版权，成为了用户和平台的当务之急。

在相关技术中，保护短视频版权的一种方案为：短视频的原创者可以通过在自已创作和发布的短视频中增加水印来保护自身的版权，或者短视频的平台方也可以为原创者的短视频进行增加水印的处理。保护短视频版权的另一种方案为：短视频的原创者可以在将短视频发送到云端或短视频平台的互联网数据中心(Internet Data Center，IDC)后，利用云端或者IDC的算力和存储空间，进行短视频的处理以及短视频的侵权排查。

然而，对于上述的第一种方案，剽窃者可以容易地将水印去掉，因此通过该种方式禁止侵权行较为困难。对于上述的第二种方案，尽管通过云端或IDC可以在一定程度上进行侵权预测或排查，但是该种方案需要占用大量的网络带宽，并且其需要较高的成本。

综上可知，相关技术中存在着进行有效短视频侵权行为排查所需的网络带宽和成本较高的问题。

发明内容

本申请实施例的目的是提供一种短视频侵权风险的检测方法、装置和电子设备，能够解决短视频侵权行为排查所需的网络带宽和成本较高的问题。

第一方面，本申请实施例提供了一种短视频侵权风险的检测方法，该检测方法包括：将短视频分离为N个内容；对N个内容中的目标内容进行主题分类预测，得到目标内容的目标主题类型；根据目标主题类型，对目标内容的侵权风险进行检测；其中，N为大于或等于2的整数。

第二方面，本申请实施例提供了一种短视频侵权风险的检测装置，该检测装置包括：分离模块，用于将短视频分离为N个内容；预测模块，用于对分离模块分离的N个内容中的目标内容进行主题分类预测，得到目标内容的目标主题类型；检测模块，用于根据预测模块得到的目标主题类型，对目标内容的侵权风险进行检测；其中，N为大于或等于2的整数。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第四方面，本申请实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

第五方面，本申请实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法。

在本申请实施例中，首先将短视频分离为N个内容。进而，对该N个内容中的目标内容进行主题分类预测，并由此得到该目标内容的目标主题类型。随后，根据该目标主题类型，则可以对目标内容的侵权风险进行检测，由此实现对短视频侵权风险的检测和排查。其中，N为大于或等于2的整数。通过将短视频分离为N个内容，并根据N个内容中目标内容对应的目标主题类型对目标内容的侵权风险进行检测，可以避免因对短视频进行全量的侵权检测，并由此通过分布式地侵权检测，降低了短视频侵权排查所需的网络带宽和成本。

附图说明

图1是本申请实施例的短视频侵权风险的检测方法的步骤流程图；

图2是本申请实施例的短视频侵权风险的检测方法的原理图；

图3是本申请实施例的短视频侵权风险的检测装置的结构示意图；

图4是本申请实施例的电子设备的结构示意图之一；

图5是本申请实施例的电子设备的结构示意图之二。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的短视频侵权风险的检测方法、装置和电子设备进行详细地说明。

近年来，短视频产品逐渐受到了用户的广泛喜爱。用户可以通过平台型APP或终端设备自带的短视频软件，进行短视频的创作和发布。在这一过程中，用户和平台均面临着版权保护和侵权排查的迫切需求。

一方面，对于原创作者而言，在缺少版权保护途径和侵权行为排查的情况下，其精心创作的短视频则容易被他人轻而易举地抄袭或经过二次包装后营利。

另一方面，对于汇编、改编的创作者而言，在缺少侵权风险排查的情况下，其可能在不知情的状态下通过汇编、改编的作品无意识地侵犯了他人的版权，并由此为个人或平台带来运营风险。尤其，对于影视解说、音乐点评等类型的短视频，其面临的侵权行为排查需求更为迫切。

在相关技术中，为了对短视频作品实现侵权排查，需要对短视频作品进行全量的侵权行为匹配。该侵权行为匹配的工作通常控制云端或IDC进行。为此，则需要云端或IDC具备海量的算力和存储能力。这无疑极大地增加了短视频平台方所需的网络带宽和运营及维护成本。

为此，本申请实施例提供了一种短视频侵权风险的检测方法，其通过将短视频分离为N个内容，并根据N个内容中目标内容对应的目标主题类型对目标内容的侵权风险进行检测，可以避免因对短视频进行全量的侵权检测，并由此通过分布式地侵权检测，降低了短视频侵权排查所需的网络带宽和成本。

本申请实施例提供的短视频侵权风险的检测方法的执行主体可以为短视频侵权风险的检测装置，该装置可以为电子设备，也可以为电子设备中的功能模块和/或功能主体，具体可以根据实际使用需求确定，本申请实施例不作限定。为了更加清楚地描述本申请实施例提供的短视频侵权风险的检测方法，下面方法实施例中以短视频侵权风险的检测方法的执行主体为短视频侵权风险的检测装置为例进行示例性地说明。

下面以各个实施例为例，对本申请实施例提供的短视频侵权风险的检测方法进行详细的说明。

如图1所示，本申请实施例提供了一种短视频侵权风险的检测方法，该方法包括以下的S101至S103：

S101、检测装置将短视频分离为N个内容。

其中，N为大于或等于2的整数。

本申请实施例中，N个内容包括以下至少两项：视频内容、音频内容、文字内容。

换言之，通过S101，可以将短视频中例如视频内容(即图像)、音频内容(例如配乐或配音)、文字内容(例如文案)等的不同类型的内容进行分离或拆解。

S102、检测装置对N个内容中的目标内容进行主题分类预测，得到目标内容的目标主题类型。

本申请实施例中，目标内容可以为N个内容中部分内容或全部内容。

可选地，本申请实施例中，可以逐一选取N个内容中的每个内容，将其作为目标内容，并由此对N个内容中的每个内容逐一进行主题分类预测。

换言之，可以针对N个内容中的每个内容，分别将其作为目标内容，并分别对其执行S102，以获取N个内容中的每个内容的主题类型。

可以理解，对目标内容进行主题分类预测，以得到目标内容的目标主题类型的目的在于，获知目标内容所应属于的主题。

换言之，一个内容的主题类型可以为该内容所对应的主题类型。主题类型的数量和种类具体可以根据实际使用需求确定，本发明实施例不作限定。

可以理解，可以根据内容的类别或属性，对主题类型进行分类。不同内容的主题类型分类方式可以不同。

在一个示例中，以目标内容为视频内容进行举例，则视频内容对应的主题类型可以被分类为：影视类视频、综艺类视频、新闻类视频、访谈类视频、科普类视频、美食类视频等等。

在另一个示例中，以目标内容为音乐内容进行举例，则音乐内容对应的主题类型可以被分类为：怀旧类音乐、流行类音乐、古典类音乐、爱情类音乐、伤感类音乐、由特定乐器演奏的音乐、有特定地域风格的音乐等等。

在再一个示例中，以目标内容为文字内容进行举例，则文字内容对应的主题类型可以被分类为：名人名言类文字、食谱菜谱类文字、诗句词句类文字等等。

S103、检测装置根据目标主题类型，对目标内容的侵权风险进行检测。

可以理解，目标内容的侵权风险可以为该目标内容侵犯他人著作权的风险，也可以为他人作品侵犯该目标内容的风险。

本申请实施例中，S103中检测获得的结果可以为间接的侵权风险参数(例如侵权概率百分比，或侵权概率指数或侵权风险等级)，还可以为直接的侵权风险结果(例如无风险或有风险)。用户或短视频平台可以根据检测的结果，判断或获知短视频是否存在侵权风险。

可以理解，根据目标主题类型对目标内容的侵权风险进行检测是指：根据目标内容所属的主题类型，将该主题类型下的作品(不限于短视频作品，还可以是完整的影视作品、音乐作品，以及文学作品)与该目标内容进行比较或比对，并由此判断短视频中该目标内容的侵权风险。

可以理解，在逐一选取N个内容中的每个内容，将其作为目标内容，并对该目标内容侵权风险进行检测之后，则可以完成对包括该N个内容的短视频的侵权风险检测。

在一个示例中，对于短视频中的音乐内容，假设其对应的主题类型根据情感种类进行划分，具体包括：浪漫类型、伤感类型、兴奋类型、放松类型。那么，在目标内容为音乐内容的情况下，如果通过S102预测获得的目标主题类型为上述四种类型中的伤感类型，则在S103中，则以数据库中收录或存储的伤感类型音乐为目标，在该伤感类型音乐中查找可能与目标内容形成版权冲突的音乐，并由此检测目标内容的侵权风险。

在另一个示例中，对于短视频中的视频内容，假设其对应的主题类型被划分为：影视类型、科普类型、美食类型。那么，在目标内容为视频内容的情况下，如果通过S102预测获得的目标主题类型为上述三种类型中的影视类型，则在S103中，则以数据库中收录或存储的影视类型视频为目标，在该影视类型视频中查找可能与目标内容形成版权冲突的影视作品，并由此检测目标内容的侵权风险。

在再一个示例中，对于短视频中的文字内容，假设其对应的主题类型被划分为：名人名言类型和诗句词句类型。那么，在目标内容为文字内容的情况下，如果通过S102预测获得的目标主题类型为上述两种类型中的名人名言类型，则在S103中，则以数据库中收录或存储的名人名言类型文字为目标，在该名人名言类型文字中查找可能与目标内容形成版权冲突的文字类作品，并由此检测目标内容的侵权风险。

本申请实施例中，首先将短视频分离为N个内容。进而，对该N个内容中的目标内容进行主题分类预测，并由此得到该目标内容的目标主题类型。随后，根据该目标主题类型，则可以对目标内容的侵权风险进行检测，由此实现对短视频侵权风险的检测和排查。其中，N为大于或等于2的整数。通过将短视频分离为N个内容，并根据N个内容中目标内容对应的目标主题类型对目标内容的侵权风险进行检测，可以避免因对短视频进行全量的侵权检测，并由此通过分布式地侵权检测，降低了短视频侵权排查所需的网络带宽和成本。

可选地，本申请实施例中，为了有效降低侵权检测所需的带宽和成本，可以通过分布式检测方法，实现对短视频的侵权检测。

其中，该分布式检测方法是指：采用多个相互协作的设备(包括终端设备和云端设备)，构造分布式检测系统，该分布式检测系统协同分工，共同对短视频进行侵权检测。

如图2所示，可选地，本申请实施例中，该分布式检测系统可以包括多个终端、CDN(Content Delivery Network，内容分发网络)，以及云端数据中心层。

其中，上述多个终端可以包括智能手机、个人电脑、可穿戴设备等用于实现短视频录制、上传或浏览的终端(比如多个MEC移动边缘节点，或者例如智能家电或IoT设备等FogNode节点)。CDN可以包括多个节点服务器(比如移动CDN、联调CDN、电信CDN、网宿CDN)。云端数据中心层可以包括公有云或私有云。

多个终端可以构成边缘计算存储层。各个地域的CDN可以构成CDN计算存储节点层，数据中心可以作为云端数据中心层。

可选地，本申请实施例中，可以通过边缘计算存储层、CDN计算存储节点层，以及云端数据中心层，构造出能够进行分层AI计算和分层AI存储的短视频侵权检测系统。该短视频侵权检测系统可以基于多智能终端，构造边缘AI-Tier层并结合云边，协同进行短视频的侵权检测。

由此，通过多个相互协作的设备构成的短视频侵权检测系统，能够通过合理的调度策略，调度多个设备中的一个或多个目标设备，执行将短视频分离为N个内容的操作，或者执行对目标内容进行主题分类预测的操作，或者执行根据目标主题类型对目标内容的侵权风险进行检测的操作。

如此，通过分布式的检测方法和系统，能够进一步提高侵权检测的效率，提高侵权检测的精度，并降低侵权检测所需的带宽、时间，以及成本。

可选地，本申请实施例中，为了通过分布式检测方法实现对短视频的侵权检测，可以在多个终端中选择适合的终端，以实现将短视频分离为N个内容的操作的终端。

示例性地，上述S101可以包括以下的S101a至S101c：

S101a、检测装置在M个终端中选择目标终端。

其中，M个终端包括发布短视频的发布终端，M为大于或等于2的整数。

本申请实施例中，目标终端可以为M个终端中的部分终端或全部终端。

可以理解，M个终端不仅可以包括发布短视频的发布终端，还可以包括非发布终端。

其中，发布终端可以为对短视频进行录制、编辑并最终发布上传的终端。非发布终端可以为能够浏览或下载该短视频的终端。

S101b、检测装置在目标终端为发布终端的情况下，控制发布终端，将短视频分离为N个内容。

S101c、检测装置在目标终端非发布终端的情况下，控制发布终端将短视频发送至目标终端，并控制目标终端将短视频分离为N个内容。

换言之，本申请实施例中，可以在发布终端和非发布终端中选择一个或多个终端，作为目标终端，并控制该目标终端将短视频分离为N个内容。

可以理解，可以根据各个终端的性能或者计算能力或者存储能力，在发布终端和非发布终端中选择一个或多个终端，作为目标终端。

示例性地，可以在发布终端和非发布终端中选择计算能力最佳的终端，作为目标终端。

示例性地，可以在M个终端中的每个终端部署类似于ffpmeg的处理软件，以在由M个终端中选择目标终端后，控制该目标终端，将短视频分离为N个内容。

示例性地，以上述通过边缘计算存储层、CDN计算存储节点层，以及云端数据中心层，构造出的短视频侵权检测系统为例，则上述M个终端共同构成边缘计算存储层。其中，可以在构成边缘计算存储层的M个终端中，计算能力相对较好的一个或多个终端，作为目标终端。

在一个示例中，假设小明为短视频的创作者，则小明在发布该短视频时采用的终端则为发布终端。小明的亲戚A、朋友B、同事C为该短视频的观看者，则亲戚A、朋友B、同事C在观看该短视频时采用的终端则为非发布终端。小明、亲戚A、朋友B、同事C所使用的终端共同构成边缘计算存储层。在小明所使用的终端的计算能力较好的情况下，可以控制小明所使用的终端(即发布终端)将短视频分离为N个内容。在同事C所使用的终端的计算能力较好的情况下，可以控制同事C的终端(即非发布终端)将短视频分离为N个内容。

本申请实施例中，可以根据不同调度策略将短视频的内容调度到不同的边缘节点(即选择不同的目标终端)。或者，可以根据M个终端中各个终端的计算和存储能力，将短视频的内容调度到不同的边缘节点。

在一个示例中，可以根据M个终端中各个终端的计算能力，采用以下调度策略中的任一项，将短视频的内容调度到不同的边缘节点：

按边缘计算存储节点轮询；

按边缘计算存储节点的CPU核数权重；

Hash散列法；

负载最低优先；

其它基于蚁群算法/遗传算法的调度算法。

在另一个示例中，可以根据M个终端中各个终端的存储能力，采用以下调度策略中的任一项，将短视频的内容调度到不同的边缘节点：

按边缘计算存储节点轮询；

按边缘计算存储节点的内存容量权重；

Hash散列法；

内存使用量最低优先；

其它基于蚁群算法/遗传算法的调度算法。

可选地，本申请实施例中，可以采用边缘节点的整体缓存淘汰机制，对短视频中的内容进行分类。

示例性地，可以先提供一个权重占比(比如视频：音乐：文案为5:4:1)，其中，视频占比可以相对更重。其中，当终端占用的内存快用满的情况下，需要进行淘汰的时候，可以利用如下方式，实现边缘节点的整体缓存淘汰机制：Min(Rand[0,1]*视频的权重，Rand[0,1]*音乐的权重，Rand[0,1]*文案的权重)，如此，根据上述伪抽签算法签，结果最短的则为需要执行LRU-Cache的分类内容。

如此，可以在M个终端中选择适合的或性能较优的终端(即目标终端)，将短视频分离为N个内容。由此，可以进一步有效降低侵权检测所需的带宽和成本，并提高侵权检测的效率。

可选地，本申请实施例中，为了进一步节约侵权检测所需的带宽和成本，可以在内容分发网络中对目标内容进行主题分类预测。

示例性地，上述S102可以包括以下的S102a至S102b：

S102a、检测装置在内容分发网络的P个节点中选择第一目标节点。

其中，第一目标节点为存储有与目标内容对应的目标主题分类模型的节点，P为大于或等于2的整数。

本申请实施例中，P个节点可以为内容分发网络中的部分节点或全部节点。

可以理解，可以根据P个节点的性能或者计算能力或者存储能力，在P个节点中选择一个或多个节点，作为第一目标节点。

示例性地，可以在P个节点中选择存储能力最佳且存储有目标主题分类模型的节点，作为第一目标节点。

可以理解，P个节点不仅可以包括第一目标节点，还可以包括其他节点。S102b、检测装置控制第一目标节点，根据目标主题分类模型，对N个内容中的目标内容进行主题分类预测。

换言之，本申请实施例中，对N个内容中的目标内容进行主题分类预测的操作，由第一目标节点进行。

可以理解，第一目标节点为存储有目标主题分类模型的节点。换言之，可以在内容分发网络的P个节点中，选择存储有目标主题分类模型的节点，作为第一目标节点。可选地，本申请实施例中，为了能够根据目标主题分类模型，对N个内容中的目标内容进行主题分类预测，可以将目标主题分类模型缓存至第一目标节点中。

可选地，本申请实施例中，可以采用LRU-Cache策略，对目标主题分类模型进行缓存。

在一个示例中，以目标内容为视频内容为例，可以通过如下步骤，根据目标主题分类模型，对N个内容中的目标内容进行主题分类预测：

FFpmeg视频抽帧；

视频关键特征提取：Resnet18、VGG-16；

特征降维PCA、SVD，形成视频文件特征向量；

CNN+LSTM视频主题分类模型在线预测。

在另一个示例中，以目标内容为音乐内容为例，可以通过如下步骤，根据目标主题分类模型，对N个内容中的目标内容进行主题分类预测：

特征抽取MFCC；

PCA降维；

Knn+SVM音乐主题分类模型预测。

在再一个示例中，以目标内容为文字内容为例，可以通过如下步骤，根据目标主题分类模型，对N个内容中的目标内容进行主题分类预测：

BOW文本预处理；

特征提取向量空间模型；

TextCNN/FastText。

如此，通过在内容分发网络的P个节点中选择第一目标节点，并控制第一目标节点，根据目标主题分类模型，对N个内容中的目标内容进行主题分类预测，可以实现分布式地侵权检测，提高侵权检测的效率，并降低侵权检测所需的带宽压力。

可选地，本申请实施例中，为了进一步降低成本，并降低侵权检测所需的带宽，可以对目标主题分类模型进行离线训练。

示例性地，上述S102b之前，检测方法还包括以下的S201至S202：

S201、检测装置控制云端数据中心，对目标主题分类模型进行离线训练。

可选地，本申请实施例中，云端数据中心可以为公有云端数据中心，也可以为私有云端数据中心。

可选地，本申请实施例中，云端数据中心可以为云端数据库或IDC。

可以理解，通过对目标主题分类模型进行离线训练，可以提高目标主题分类模型对目标主题分类预测的准确程度。

示例性地，以目标内容为视频内容为例，则对目标主题分类模型进行离线训练的方式可以为CNN+LSTM；以目标内容为音乐内容为例，则对目标主题分类模型进行离线训练的方式可以为Knn+SVM；以目标内容为文本内容为例，则对目标主题分类模型进行离线训练的方式可以为TextCNN/FastText。

S202、检测装置控制云端数据中心，将经过训练的目标主题分类模型发送至第一目标节点。

可以理解，发送至第一目标节点的目标主题分类模型可以为一个或多个。相应地第一目标节点中存储的来自云端数据中心的目标主题分类模型可以为一个或多个。

如此，通过在云端数据中心中对目标主题分类模型进行离线训练，可以有效降低侵权检测所需的带宽，以及低侵权检测的延时。

可选地，本申请实施例中，为了进一步节约侵权检测所需的带宽和成本，可以在内容分发网络中选择适宜的节点，并控制该节点单独完成，或与终端配合完成侵权风险检测。

示例性地，上述S103包括以下的S103a至S103c：

S103a、检测装置在内容分发网络中的Q个节点中选择第二目标节点。

其中，第二目标节点为存储有与目标主题类型对应的目标特征向量库的节点，Q为大于或等于2的整数。

本申请实施例中，Q个节点可以为内容分发网络中的部分节点或全部节点。

可以理解，可以根据Q个节点的性能或者计算能力或者存储能力，在Q个节点中选择一个或多个节点，作为第二目标节点。

示例性地，可以在Q个节点中选择存储能力最佳且存储有目标特征向量库的节点，作为第二目标节点。

可以理解，Q个节点不仅可以包括第二目标节点，还可以包括其他节点。

可以理解，第二目标节点可以与上述的第一目标节点为相同的节点，也可以与上述的第一目标节点为不同的节点。

S103b、检测装置控制第二目标节点，通过目标特征向量库，计算目标内容的目标特征向量相似度。

可以理解，目标特征向量库存储于第二目标节点中。换言之，第二目标节点为存储有目标特征向量库的节点。

可以理解，计算目标内容的目标特征向量相似度的方式可以为，将目标内容与目标特征向量库中的内容进行比对，并根据比对结果，计算目标内容的目标特征向量相似度。

可选地，本申请实施例中，目标特征向量相似度可以为相似度参数值，也可以为相似度百分比，亦可以为相似度等级。

示例性地，可以通过COS余弦相似度作为衡量侵权风险的目标特征向量相似度。

S103c、检测装置根据目标特征向量相似度，对目标内容的侵权风险进行检测。

可以理解，可以根据目标特征向量相似度的数值大小或等级高低，对目标内容的侵权风险进行检测。

可选地，本申请实施例中，可以设置相似度阈值，并将目标特征向量相似度与相似度阈值进行比较，以根据比较结果，对目标内容的侵权风险进行检测。

示例性地，假设将相似度阈值设置为0.5。由此，在目标特征向量相似度小于0.5的情况下，可以判断目标内容无侵权风险；在目标特征向量相似度大于或等于于0.5的情况下，可以判断目标内容有侵权风险。

如此，可以在内容分发网络中的Q个节点中选择适宜的节点(即第二目标节点)，并通过该节点中的目标特征向量库计算目标内容的目标特征向量相似度。由此，可以根据目标特征向量相似度，对目标内容的侵权风险进行检测。因而，可以进一步达到节约侵权检测所需的带宽和成本的目的。

可选地，本申请实施例中，为了提高侵权检测的效率，减少侵权检测的延时，可以控制第二目标节点进行目标特征向量相似度计算，并在短视频的发布终端中进行风险进行检测。

示例性地，上述S103c包括以下的S103c’至S103c”：

S103c’、检测装置控制第二目标节点，将目标特征向量相似度发送至发布短视频的发布终端。

可以理解，第二目标节点与发布终端通信连接，以实现目标特征向量相似度的发送。

S103c”、检测装置控制发布终端，将目标特征向量相似度与相似度阈值进行比较，并根据比较结果，对目标内容的侵权风险进行检测。

如此，则可以有效地提高侵权检测的效率，提高用户体验。

可选地，本申请实施例中，为了进一步降低成本，并降低侵权检测所需的带宽，可以控制第二目标节点中已存储的目标特征向量库，计算目标内容的目标特征向量相似度。

示例性地，在上述S103之前，检测方法还包括以下的S301至S302：

S301、检测装置控制云端数据中心，生成目标特征向量库。

本申请实施例中，目标特征向量库可以为一个或多个。不同节点中可以存储有不同的特征向量库。一个节点中可以存储有一个或多个特征向量库。

在一个示例中，假设目标内容为视频内容，可以通过如下步骤，生成目标特征向量库：

FFpmeg视频抽帧；

视频关键特征提取：Resnet18、VGG-16；

特征降维PCA、SVD，形成版权视频特征库。

在又一个示例中，假设目标内容为音乐内容，可以通过如下步骤，生成目标特征向量库：

特征抽取MFCC；

PCA降维。

在再一个示例中，假设目标内容为文本内容，可以通过如下步骤，生成目标特征向量库：

TextCNN/FastText；

BOW文本预处理；

特征提取向量空间模型。

S302、检测装置控制云端数据中心，将已生成的目标特征向量库发送至第二目标节点。

可以理解，存储有目标特征向量库的为第二目标节点。

如此，控制第二目标节点中已存储的目标特征向量库，计算目标内容的目标特征向量相似度可以有效降低侵权检测所需的带宽，以及低侵权检测的延时。

可选地，本申请实施例中，可以在终端提供接口，以支持用户上传多个短视频，并进行边缘AI计算，由此判断该多个短视频之间是否存在互相侵权行为。

可选地，本申请实施例中，可以在终端侧增加原版权创作者与当前视频创作者的交流平台，以供用户进行相关版权协商，由此为侵权方用户和被侵权方用户避免不必要的版权纠纷。

示例性地，假设短视频创作者小明准备用手机(即发布终端)中内置的短视频创作APP上传自已编辑过的一个短视频(比如，该短视频中的视频内容为电影“泰坦尼克号”的片段，短视频中的背景音乐选用了一首拥有版本的歌曲“后来”，该短视频中的文案也选了作家莫言的一段句子)。在触发终端上传该短视频时，可以在小明手机、爸爸手机、妈妈手机、同学手机、同事手机、以及小明的IoT设备相关智能设备当中(即多个非发布终端的其他终端当中)挑选计算能力最好的手机(即目标终端)进行短视频的预处理操作(即将短视频分离为N个内容，比如分离出该短视频中的视频内容、音乐内容、文案类文字内容三部分)。

可以把分离出的视频内容送进边缘计算存储层任一缓存了视频主题分类模型的终端(即第一目标节点A)进行视频的主题分类预测。比如小明上传的是电影“泰坦尼克号”，那视频内容送进这个主题分类模型进行预测得到的主题就是影视类别。

可以把分离出的音乐内容送进边缘计算存储层任一缓存了音乐主题分类模型的终端(即第一目标节点B，该第一目标节点B可以与第一目标节点A相同或不同)进行音乐的主题分类预测。比如小明上传的短视频背景音乐用的“后来”，那音乐内容送进这个主题分类模型进行预测得到的主题就是情歌。

可以把分离出的文案内容送进边缘计算存储层任一缓存了文案主题分类模型的终端(即第一目标节点C，该第一目标节点C可以与第一目标节点A，以及第一目标节点B相同或不同)上进行文案的主题分类预测。比如小明上传的短视频文案是莫言的“轻易不动感情的人，一旦动情，就会地裂山崩，把自己燃烧成一堆灰烬，被他爱上的人，也会被这狼烟烈火烧烤得痛不欲生。”，那文案主题分类模型预测的主题就是爱情。

在该短视频的视频、音乐、文案三部分内容的主题被相应的主题分类模型预测出来是【影视】、【情歌】、【爱情】之后，可以同时在边缘计算存储层的所有手机终端中挑选3个终端同时进行该短视频中的视频、音乐、文案进行特征提取。

在视频、音乐、文案的特征向量获取之后，则可以进行侵权校验。这时先根据预测出来的视频主题影视把短视频中的视频内容送进边缘计算存储层终端中有缓存了视频主题为【影视】的目标特征向量库的设备(即第二目标节点a)进行特征向量的相似度计算。

根据预测出来的音乐主题是情歌，把短视频的音乐内容送进边缘计算存储层终端中有缓存了音乐主题为【情歌】的目标特征向量库的设备(即第二目标节点b，该第二目标节点b可以与第二目标节点a相同或不同)进行特征向量的相似度计算。

根据预测出来的文案主题是爱情，把短视频的文案内容送进边缘计算存储层终端中有缓存了文案主题为【爱情】的目标特征向量库的设备(即第二目标节点c，该第二目标节点c可以与第一目标节点a，以及第二目标节点c相同或不同)进行特征向量库的相似度计算。

将根据视频内容、音乐内容、文案内容计算得到的相似度返回到上传短视频的小明手机，则可以进行侵权风险判定。

如果视频内容与影视主题版权视频相似度大于0.5则提示小明短视频当中的视频内容有侵权泰坦尼克号电影的风险。

如果音乐内容与情歌主题版权音乐相似度大于0.5则提示小明短视频当中的背景音乐有侵权刘若英的《后来》的风险。

如果文案内容与青春主题版权文案相似度大于0.5则提示小明短视频当中的背景文案有侵权莫言的《我们的荆轲》这本书的著作权。

如此，可以解决小明手机因计算和存储能力小，而无法承载短视频侵权检测这样的高计算高存储的场景的问题，通过分布式检测方法实现对短视频的侵权检测。

可选地，本申请实施例中，由于边缘存储计算层的算力和存储容量有限，因此可以把对目标主题分类模型的离线训练和目标特征向量库生成放到云端数据中心层，并把主题分类预测和计算目标内容的目标特征向量相似度的操作放到CDN计算存储节点上。此外，由边缘计算存储层协同进行相关内容分割、特征向量提取。

可选地，本申请实施例中，目标主题分类模型和目标特征向量库的存储采用LRU-Cache算法进行淘汰缓存。

如此，可以最大可能地利用边缘层的计算与存储进行短视频内容的侵权检测，达到低延时、低带宽、高精度的短视频版权检测目的，节约短视频上传下载带宽成本及存储、计算成本。

需要说明的是，本申请实施例提供的检测方法，执行主体可以为检测装置，或者该检测装置中的用于执行检测方法的控制模块。本申请实施例中以检测装置执行检测方法为例，说明本申请实施例提供的检测装置。

如图3所示，本申请实施例提供了一种短视频侵权风险的检测装置200，该检测装置200包括：

分离模块210，用于将短视频分离为N个内容。

预测模块220，用于对分离模块210分离的N个内容中的目标内容进行主题分类预测，得到目标内容的目标主题类型。

检测模块230，用于根据预测模块220得到的目标主题类型，对目标内容的侵权风险进行检测。

其中，N为大于或等于2的整数。

在本申请实施例中，检测装置200首先将短视频分离为N个内容。进而，检测装置200对该N个内容中的目标内容进行主题分类预测，并由此得到该目标内容的目标主题类型。随后，检测装置200根据该目标主题类型，则可以对目标内容的侵权风险进行检测，由此实现对短视频侵权风险的检测和排查。其中，N为大于或等于2的整数。检测装置200通过将短视频分离为N个内容，并根据N个内容中目标内容对应的目标主题类型对目标内容的侵权风险进行检测，可以避免因对短视频进行全量的侵权检测，并由此通过分布式地侵权检测，降低了短视频侵权排查所需的网络带宽和成本。

可选地，本申请实施例中，分离模块210具体用于：

在M个终端中选择目标终端，其中，M个终端包括发布短视频的发布终端，M为大于或等于2的整数。

在目标终端为发布终端的情况下，控制发布终端，将短视频分离为N个内容。

在目标终端非发布终端的情况下，控制发布终端将短视频发送至目标终端，并控制目标终端将短视频分离为N个内容。

可选地，本申请实施例中，预测模块220具体用于：

在内容分发网络的P个节点中选择第一目标节点，其中，第一目标节点为存储有与目标内容对应的目标主题分类模型的节点，P为大于或等于2的整数。

控制第一目标节点，根据预测模块220得到的目标主题分类模型，对N个内容中的目标内容进行主题分类预测。

可选地，本申请实施例中，检测装置还包括：

训练模块240，用于在对N个内容中的目标内容进行主题分类预测之前，控制云端数据中心，对目标主题分类模型进行离线训练。并控制云端数据中心，将经过训练的目标主题分类模型发送至第一目标节点。

可选地，本申请实施例中，检测模块230具体用于：

在内容分发网络中的Q个节点中选择第二目标节点，其中，第二目标节点为存储有与预测模块220得到的目标主题类型对应的目标特征向量库的节点，Q为大于或等于2的整数。

控制第二目标节点，通过目标特征向量库，计算目标内容的目标特征向量相似度。

根据目标特征向量相似度，对目标内容的侵权风险进行检测。

可选地，本申请实施例中，检测模块230具体用于：

控制第二目标节点，将目标特征向量相似度发送至发布短视频的发布终端。

控制发布终端，将目标特征向量相似度与相似度阈值进行比较，并根据比较结果，对目标内容的侵权风险进行检测。

可选地，本申请实施例中，检测装置还包括：

生成模块250，用于在根据目标主题类型，对目标内容的侵权风险进行检测之前，控制云端数据中心，生成目标特征向量库。并控制云端数据中心，将已生成的目标特征向量库发送至第二目标节点。

本申请实施例中的检测装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personaldigital assistant，PDA)等，非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

本申请实施例提供的检测装置能够实现图1的方法实施例实现的各个过程，为避免重复，这里不再赘述。

如图4所示，本申请实施例还提供一种电子设备300，包括处理器301，存储器302，存储在存储器302上并可在处理器301上运行的程序或指令，该程序或指令被处理器301执行时实现上述方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。

图5为实现本申请实施例的一种电子设备的硬件结构示意图。

该电子设备400包括但不限于：射频单元401、网络模块402、音频输出单元403、输入单元404、传感器405、显示单元406、用户输入单元407、接口单元408、存储器409、以及处理器410等部件。

本领域技术人员可以理解，电子设备400还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器410逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图5中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

其中，处理器410，用于将短视频分离为N个内容；对N个内容中的目标内容进行主题分类预测，得到目标内容的目标主题类型；根据目标主题类型，对目标内容的侵权风险进行检测；其中，N为大于或等于2的整数。

可选地，处理器410，具体用于在M个终端中选择目标终端，其中，M个终端包括发布短视频的发布终端，M为大于或等于2的整数；在目标终端为发布终端的情况下，控制发布终端，将短视频分离为N个内容；在目标终端非发布终端的情况下，控制发布终端将短视频发送至目标终端，并控制目标终端将短视频分离为N个内容。

可选地，处理器410，具体用于在内容分发网络的P个节点中选择第一目标节点，其中，第一目标节点为存储有与目标内容对应的目标主题分类模型的节点，P为大于或等于2的整数；控制第一目标节点，根据目标主题分类模型，对N个内容中的目标内容进行主题分类预测。

可选地，处理器410，具体用于控制云端数据中心，对目标主题分类模型进行离线训练；控制云端数据中心，将经过训练的目标主题分类模型发送至第一目标节点。

可选地，处理器410，具体用于在内容分发网络中的Q个节点中选择第二目标节点，其中，第二目标节点为存储有与目标主题类型对应的目标特征向量库的节点，Q为大于或等于2的整数；控制第二目标节点，通过目标特征向量库，计算目标内容的目标特征向量相似度；根据目标特征向量相似度，对目标内容的侵权风险进行检测。

可选地，处理器410，具体用于控制第二目标节点，将目标特征向量相似度发送至发布短视频的发布终端；控制发布终端，将目标特征向量相似度与相似度阈值进行比较，并根据比较结果，对目标内容的侵权风险进行检测。

可选地，处理器410，还用于控制云端数据中心，生成目标特征向量库；控制云端数据中心，将已生成的目标特征向量库发送至第二目标节点。

应理解的是，本申请实施例中，输入单元404可以包括图形处理器(GraphicsProcessing Unit，GPU)4041和麦克风4042，图形处理器4041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元406可包括显示面板4061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板4061。用户输入单元407包括触控面板4071以及其他输入设备4072。触控面板4071，也称为触摸屏。触控面板4071可包括触摸检测装置和触摸控制器两个部分。其他输入设备4072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。存储器409可用于存储软件程序以及各种数据，包括但不限于应用程序和操作系统。处理器410可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器410中。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

1.一种短视频侵权风险的检测方法，其特征在于，所述检测方法包括：

将短视频分离为N个内容；

依次选择所述N个内容中的每个内容作为目标内容，对所述目标内容进行主题分类预测，得到所述目标内容的目标主题类型；

根据所述目标主题类型，将所述目标内容与所述目标主题类型对应的目标特征向量库中的内容进行相似度比对，确定所述目标内容的侵权风险；

其中，N为大于或等于2的整数。

2.根据权利要求1所述的检测方法，其特征在于，所述将短视频分离为N个内容，包括：

在M个终端中选择目标终端，其中，所述M个终端包括发布所述短视频的发布终端，M为大于或等于2的整数；

在所述目标终端为所述发布终端的情况下，控制所述发布终端，将短视频分离为N个内容；

在所述目标终端非所述发布终端的情况下，控制所述发布终端将所述短视频发送至所述目标终端，并控制所述目标终端将短视频分离为N个内容。

3.根据权利要求1所述的检测方法，其特征在于，所述依次选择所述N个内容中的每个内容作为目标内容，对所述目标内容进行主题分类预测，得到所述目标内容的目标主题类型，包括：

在内容分发网络的P个节点中选择第一目标节点，其中，所述第一目标节点为存储有与所述目标内容对应的目标主题分类模型的节点，P为大于或等于2的整数；

控制所述第一目标节点，根据所述目标主题分类模型，依次选择所述N个内容中的每个内容作为目标内容，对所述目标内容进行主题分类预测，得到所述目标内容的目标主题类型。

4.根据权利要求3所述的检测方法，其特征在于，在所述依次选择所述N个内容中的每个内容作为目标内容，对所述目标内容进行主题分类预测，得到所述目标内容的目标主题类型之前，所述检测方法还包括：

控制云端数据中心，对所述目标主题分类模型进行离线训练；

控制所述云端数据中心，将经过训练的所述目标主题分类模型发送至所述第一目标节点。

5.根据权利要求1至4中任一项所述的检测方法，其特征在于，所述根据所述目标主题类型，将所述目标内容与所述目标主题类型对应的目标特征向量库中的内容进行相似度比对，确定所述目标内容的侵权风险，包括：

在内容分发网络中的Q个节点中选择第二目标节点，其中，所述第二目标节点为存储有与所述目标主题类型对应的目标特征向量库的节点，Q为大于或等于2的整数；

控制所述第二目标节点，将所述目标内容与所述目标主题类型对应的目标特征向量库中的内容进行相似度比对，计算所述目标内容的目标特征向量相似度；

根据所述目标特征向量相似度，确定所述目标内容的侵权风险。

6.根据权利要求5所述的检测方法，其特征在于，所述根据所述目标特征向量相似度，确定所述目标内容的侵权风险，包括：

控制所述第二目标节点，将所述目标特征向量相似度发送至发布所述短视频的发布终端；

控制所述发布终端，将所述目标特征向量相似度与相似度阈值进行比较，并根据比较结果，确定所述目标内容的侵权风险。

7.根据权利要求5所述的检测方法，其特征在于，在所述根据所述目标主题类型，将所述目标内容与所述目标主题类型对应的目标特征向量库中的内容进行相似度比对，确定所述目标内容的侵权风险之前，所述检测方法还包括：

控制云端数据中心，生成所述目标特征向量库；

控制所述云端数据中心，将已生成的所述目标特征向量库发送至所述第二目标节点。

8.一种短视频侵权风险的检测装置，其特征在于，所述检测装置包括：

分离模块，用于将短视频分离为N个内容；

预测模块，用于依次选择所述分离模块分离的所述N个内容中的每个内容作为目标内容，对所述目标内容进行主题分类预测，得到所述目标内容的目标主题类型；

检测模块，用于根据所述预测模块得到的所述目标主题类型，将所述目标内容与所述目标主题类型对应的目标特征向量库中的内容进行相似度比对，确定所述目标内容的侵权风险；

其中，N为大于或等于2的整数。

9.根据权利要求8所述的检测装置，其特征在于，分离模块具体用于：

10.根据权利要求8所述的检测装置，其特征在于，所述预测模块具体用于：

控制所述第一目标节点，根据所述预测模块得到的所述目标主题分类模型，依次选择所述N个内容中的每个内容作为目标内容，对所述目标内容进行主题分类预测，得到所述目标内容的目标主题类型。

11.根据权利要求10所述的检测装置，其特征在于，所述检测装置还包括：

训练模块，用于在所述依次选择所述N个内容中的每个内容作为目标内容，对所述目标内容进行主题分类预测，得到所述目标内容的目标主题类型之前，控制云端数据中心，对所述目标主题分类模型进行离线训练；并控制所述云端数据中心，将经过训练的所述目标主题分类模型发送至所述第一目标节点。

12.根据权利要求8至11中任一项所述的检测装置，其特征在于，所述检测模块具体用于：

在内容分发网络中的Q个节点中选择第二目标节点，其中，所述第二目标节点为存储有与所述预测模块得到的所述目标主题类型对应的目标特征向量库的节点，Q为大于或等于2的整数；

13.根据权利要求12所述的检测装置，其特征在于，所述检测模块具体用于：

14.根据权利要求12所述的检测装置，其特征在于，所述检测装置还包括：

生成模块，用于在所述根据所述目标主题类型，将所述目标内容与所述目标主题类型对应的目标特征向量库中的内容进行相似度比对，确定所述目标内容的侵权风险之前，控制云端数据中心，生成所述目标特征向量库；并控制所述云端数据中心，将已生成的所述目标特征向量库发送至所述第二目标节点。

15.一种电子设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至7中任一项所述的检测方法的步骤。

16.一种可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1至7中任一项所述的检测方法的步骤。