CN110443007B

CN110443007B - 一种多媒体数据的溯源检测方法、装置及设备

Info

Publication number: CN110443007B
Application number: CN201910589262.9A
Authority: CN
Inventors: 张�诚; 张勇
Original assignee: Beijing Rui Zhuo Xi Tou Technology Development Co ltd
Current assignee: Beijing Rui Zhuo Xi Tou Technology Development Co ltd
Priority date: 2019-07-02
Filing date: 2019-07-02
Publication date: 2021-07-30
Anticipated expiration: 2039-07-02
Also published as: CN110443007A

Abstract

本申请实施例公开了一种多媒体数据的溯源检测方法、装置及设备，所述方法包括：获取待检测的目标多媒体数据，并从目标多媒体数据中提取关键帧数据；对每个关键帧数据进行特征提取，得到每个关键帧数据对应的一个或多个维度的特征；基于每个关键帧数据对应的一个或多个维度的特征和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征，确定目标多媒体数据与存储的每个基准多媒体数据之间的内容相似程度；根据目标多媒体数据与存储的每个基准多媒体数据之间的内容相似程度，判断存储的至少一个基准多媒体数据中是否存在目标多媒体数据。通过本方法，不仅可以提高溯源检测的容错性，而且还可以有效的提高溯源的准确性。

Description

一种多媒体数据的溯源检测方法、装置及设备

技术领域

本申请涉及计算机技术领域，尤其涉及一种多媒体数据的溯源检测方法、装置及设备。

背景技术

匿名可追溯是区块链技术的核心优势，区块链中的账本信息不存在于单一的中央服务系统中，而是分布在区块链的所有的用户节点，保证了数据的不可篡改，该优势使得区块链系统适合数字内容版权的追溯，从而达到保护原创的目的。

在实际应用中，数字多媒体内容的特征维度非常的高，很难完全存储在区块链中的区块内，为了达到数据溯源的目的，通常采用存储hash特征值的方式将多媒体数据的二进制数值进行hash计算，可以将多媒体数据映射成定长的hash值，并将其存储到区块链中的区块内。在对多媒体数据进行溯源时，可以将该多媒体数据对应的hash值与区块链中的区块内存储的hash值进行比较，如果区块链中存在一个hash值与该多媒体数据对应的hash值相同，则表明该多媒体数据当前已存在。

然而，上述处理方式的容错性远远不够，由于hash计算的原理在于充分散列，只需要对输入的内容稍作修改，就可以导致该输入的内容的hash值发生巨大变化，显然，上述处理方式不能符合数据溯源的要求，达不到数字版权保护的目的，为此，需要提供一种容错性更好的多媒体数据的溯源检测机制。

发明内容

本申请实施例的目的是提供一种多媒体数据的溯源检测方法、装置及设备，以提供一种容错性更好的多媒体数据的溯源检测机制。

为了实现上述技术方案，本申请实施例是这样实现的：

本申请实施例提供的一种多媒体数据的溯源检测方法，所述方法包括：

获取待检测的目标多媒体数据，并从所述目标多媒体数据中提取关键帧数据；

对每个所述关键帧数据进行特征提取，得到每个所述关键帧数据对应的一个或多个维度的特征；

基于每个所述关键帧数据对应的一个或多个维度的特征和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征，确定所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度；其中，所述预定区块链中存储有至少一个基准多媒体数据；

根据所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度，判断存储的所述至少一个基准多媒体数据中是否存在所述目标多媒体数据。

可选地，所述根据所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度，判断存储的所述至少一个基准多媒体数据中是否存在所述目标多媒体数据，包括：

如果存储的至少一个所述基准多媒体数据中存在基准多媒体数据与所述目标多媒体数据之间的内容相似程度大于预定程度阈值，则判定存储的至少一个所述基准多媒体数据中存在所述目标多媒体数据。

可选地，所述基于每个所述关键帧数据对应的一个或多个维度的特征和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征，确定所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度，包括：

根据每个所述关键帧数据对应的一个或多个维度的特征，确定每个所述关键帧数据对应的特征向量；

根据每个所述关键帧数据对应的特征向量和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征向量，确定每个所述关键帧数据分别与每个所述基准多媒体数据中的相应关键帧数据的相似度；

如果所述目标多媒体数据中与第一基准多媒体数据的相应关键帧数据的相似度大于预定相似度阈值的关键帧数据数量大于预定数量阈值，则判定所述目标多媒体数据与所述第一基准多媒体数据之间的内容相似程度大于预定程度阈值，所述第一基准多媒体数据为所述至少一个基准多媒体数据中的一个或多个基准多媒体数据。

可选地，所述根据每个所述关键帧数据对应的特征向量和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征向量，确定每个所述关键帧数据分别与每个所述基准多媒体数据中的相应关键帧数据的相似度，包括：

根据每个所述关键帧数据对应的特征向量和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征向量，通过预定的相似度算法，确定每个所述关键帧数据分别与每个所述基准多媒体数据中的相应关键帧数据的相似度；所述相似度算法包括k近邻kNN算法、欧式距离算法或余弦距离算法。

可选地，获取待检测的目标多媒体数据，并从所述目标多媒体数据中提取关键帧数据之前，所述方法还包括：

获取至少一个所述基准多媒体数据，并从每个所述基准多媒体数据中提取关键帧数据；

对每个所述基准多媒体数据中的关键帧数据进行特征提取，得到每个所述关键帧数据对应的一个或多个维度的特征；

将每个所述基准多媒体数据中的关键帧数据对应的一个或多个维度的特征存储到所述预定区块链中。

可选地，当所述关键帧数据对应多个维度的特征时，将每个所述基准多媒体数据中的关键帧数据对应的多个维度的特征存储到所述预定区块链中，包括：

获取所述预定区块链中的目标区块的信息，所述目标区块用于存储所述基准多媒体数据中的关键帧数据对应的多个维度的特征；

根据所述目标区块的信息，确定所述目标区块的存储容量；

当所述目标区块的存储容量小于所述基准多媒体数据的关键帧数据对应的多个维度的特征所需的存储容量时，从所述基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征；

将选取的预定数量个维度的特征存储到所述目标区块中。

可选地，所述从所述基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征，包括：

获取所述关键帧数据对应的多个维度的重要程度信息；

根据所述关键帧数据对应的多个维度的重要程度信息，将所述多个维度的特征进行排序；

根据所述多个维度的特征的排序结果，从所述基准多媒体数据中的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征。

本申请实施例提供的一种多媒体数据的溯源检测装置，所述装置包括：

数据获取模块，用于获取待检测的目标多媒体数据，并从所述目标多媒体数据中提取关键帧数据；

特征提取模块，用于对每个所述关键帧数据进行特征提取，得到每个所述关键帧数据对应的一个或多个维度的特征；

内容相似检测模块，用于基于每个所述关键帧数据对应的一个或多个维度的特征和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征，确定所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度；其中，所述预定区块链中存储有至少一个基准多媒体数据；

数据溯源判断模块，用于根据所述目标多媒体数据与存储的所述基准多媒体数据之间的内容相似程度，判断存储的所述至少一个基准多媒体数据中是否存在所述目标多媒体数据。

本申请实施例提供的一种多媒体数据的溯源检测设备，所述多媒体数据的溯源检测设备包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：

本申请实施例提供的一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如上述实施例提供的多媒体数据的溯源检测方法的步骤。

由以上本申请实施例提供的技术方案可见，本申请实施例通过对多媒体数据抽取关键帧，得到一定数量的关键帧数据，并对每个关键帧数据进行容错提取，得到每个关键帧数据的特征。在多媒体数据溯源时，通过比对待检测的目标多媒体数据与区块链中基准多媒体数据的每个关键帧数据的特征，判断待检测的目标多媒体数据与存储的基准多媒体数据之间的内容相似程度，进而确定目标多媒体数据的溯源结果，由于处理中基于关键帧数据和每个关键帧数据的特征组成的高维度特征空间进行溯源检测，不仅提高了溯源检测的容错性，而且有效的提高了溯源的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一种多媒体数据的溯源检测方法实施例的流程示意图；

图2为本申请一种用于多媒体数据的溯源检测的应用程序界面的示意图；

图3为本申请另一种多媒体数据的溯源检测方法实施例的流程示意图；

图4为本申请一种多媒体数据的溯源检测装置实施例的结构示意图；

图5为本申请一种多媒体数据的溯源检测设备实施例的结构示意图。

具体实施方式

本申请实施例提供一种多媒体数据的溯源检测方法、装置及设备。

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

实施例一

如图1所示，本申请实施例提供一种多媒体数据的溯源检测方法，该方法的执行主体可以为终端设备或服务器，其中，该终端设备可以如手机或平板电脑等移动终端设备，还可以如个人计算机等设备。该服务器可以是一个独立的服务器，还可以是由多个服务器构成的服务器集群，该服务器可以是用于多媒体数据的溯源检测的服务器，也可以是预定区块链中的节点。为了提高处理效率，本申请实施例的执行主体以服务器为例进行详细说明，对于执行主体为终端设备的情况，可以参见下述服务器的相关内容执行，在此不再赘述。该方法具体可以包括以下步骤：

在步骤S102中，获取待检测的目标多媒体数据，并从目标多媒体数据中提取关键帧数据。

其中，目标多媒体数据可以是任意多媒体数据，目标多媒体数据可以包括音频、视频和图像等。关键帧数据可以是最小单位的单幅画面的数据，可以是指画面变化中的关键动作所处的一帧画面的数据。

在具体实施中，匿名可追溯是区块链技术的核心优势，区块链中的账本信息不存在于单一的中央服务系统中，而是分布在区块链的所有的用户节点，保证了数据的不可篡改，该优势使得区块链系统适合数字内容版权的追溯，从而达到保护原创的目的。在实际应用中，通常采用存储hash特征值的方式将多媒体数据的二进制数值进行hash计算，得到一个固定长度的hash值，而多媒体数据可以放置在通常的数据库或者通常的文件系统中。

但是，存储多媒体数据的hash值，并通过hash值比对的方式进行数据溯源只适用于严格的数据比对场景，由于hash计算是一种充分散列的计算方法，因此，对于一个图像或视频，只要改动该图像的一个像素，或者，改动一个视频中的一帧图像，就会导致该图像或视频的hash值产生巨大变化，而改动之前的两份多媒体数据实际是同一个来源，因而产生错判。

基于上述内容，在对多媒体数据进行溯源时，可以将多媒体数据映射成定长的hash值，并将其存储到区块链中的区块内。在对多媒体数据进行溯源时，可以将该多媒体数据对应的hash值与区块链中的区块内存储的hash值进行比较，如果区块链中存在一个hash值与该多媒体数据对应的hash值相同，则表明该多媒体数据当前已存在，然而，上述处理方式的容错性远远不够，由于hash计算的原理在于充分散列，只需要对输入的内容稍作修改，就可以导致该输入的内容的hash值发生巨大变化，显然，上述处理方式不能符合数据溯源的要求，达不到数字版权保护的目的。为此，本申请实施例提供一种容错性更好的多媒体数据的溯源检测机制，具体可以包括以下内容：

当需要对某多媒体数据(即待检测的目标多媒体数据)进行溯源检测时，可以通过上传或拉取等方式获取目标多媒体数据，例如，如图2所示，可以预先设置有溯源检测的应用程序，该应用程序中可以包括数据上传按键和结果输出界面等，当需要对目标多媒体数据进行溯源检测时，可以点击该应用程序的数据上传按键，该应用程序可以弹出数据上传界面，用户可以通过数据上传界面中提供的查找机制查找目标多媒体数据，或者，通过数据上传界面中提供的数据输入方式输入目标多媒体数据等，查找或输入完成后，可以点击数据上传界面中的确定按键，该应用程序可以基于提供的查找路径获取查找到的目标多媒体数据或可以基于输入的目标多媒体数据获取该目标多媒体数据等。

再例如，还可以提供目标多媒体数据所在的存储位置，该存储位置可以是网络地址等，然后，服务器可以获取该网络地址，并可以通过该网络地址查找到目标多媒体数据，可以将该目标多媒体数据拉入到服务器中，从而服务器可以获取目标多媒体数据。

由于多媒体数据中包含多帧的数据，而且多媒体数据中包含的特征的维度较多，为了提高溯源检测的容错性，可以从目标多媒体数据中选取一定数量的关键帧的数据，具体地，可以通过多种方式从目标多媒体数据中选取关键帧的数据，如可以通过随机抽取的方式，从目标多媒体数据中随机抽取多个关键帧数据，或者，还可以预先设置抽取规则，并可以通过该抽取规则，从目标多媒体数据中抽取多个关键帧数据等。

具体的从目标多媒体数据中选取的关键帧数据的数量可根据需求进行设定。

在步骤S104中，对每个关键帧数据进行特征提取，得到每个关键帧数据对应的一个或多个维度的特征。

在具体实施中，可以预先设定特征提取算法，例如HOG(Histogram of OrientedGradient，梯度方向直方图)特征提取算法或SIFT(Scale Invariant Feature Transform，尺度不变特征变换)特征提取算法等。针对每个关键帧数据，可以通过上述设定的特征提取算法进行特征提取。其中，通过上述设定的特征提取算法进行特征提取的具体处理过程，可以根据HOG特征提取算法或SIFT特征提取算法的执行步骤执行，最终得到相应的特征，本申请实施例对于上述具体处理过程不再赘述。

本申请实施例中，为了便于管理，可以将每个关键帧数据的特征映射到有限维的特征空间内，首先可以确定提取的特征的维度信息，然后可以基于确定的维度信息，将相应的特征对应存储到特征空间内。

例如，如果多媒体内容源(即目标多媒体数据)为A，首先从A中提取关键帧数据，假设其中包括K个关键帧数据，关键帧数据可记为A_0，A_1，...，A_(K-1)。然后对每个关键帧数据进行特征提取，得到每个关键帧数据对应的m个维度的特征，可以把每一个关键帧数据的特征映射到有限维度的特征空间X内，特征空间X的维数是m，m个维度的特征可记为X_k0，X_k1，...，X_km。其中，K和m均为大于或等于1的整数，k为0至(K-1)之间的整数。假设每一个关键帧数据的特征集合记为F，则F(A_k)＝(X_k0，X_k1，...，X_km)。

进一步的，每一个维度的特征可以使用预定个数的字节(如4个字节或3个字节等，其中使用的字节的个数可以取决于区块链中的区块的大小)的浮点数来表示。

在步骤S106中，基于每个关键帧数据对应的一个或多个维度的特征和预定区块链中存储的每个基准多媒体数据中关键帧数据对应的特征，确定目标多媒体数据与存储的每个基准多媒体数据之间的内容相似程度，其中，预定区块链中存储有至少一个基准多媒体数据。

其中，基准多媒体数据可以是对其拥有某些特殊权利(如拥有版权或使用权等)的多媒体数据，可以通过基准多媒体数据进行溯源检测。

在具体实施中，随着人们对权益保护意识的不断加强和深入，人们对自身拥有的权益越来越重视，尤其是在当前大数据的背景下，数据的版权或使用权等成为人们关注的焦点，为了保护自己的权益，往往需要检测是否存在其它没有版权或使用权的个人或组织使用某数据，为此，可将拥有版权或使用权等特殊权利的多媒体数据作为基准多媒体数据，并对基准多媒体数据执行如上述步骤S102和步骤S104的处理，即从每个基准多媒体数据中提取关键帧数据，并对每个基准多媒体数据中的每个关键帧数据进行特征提取，得到每个基准多媒体数据中的每个关键帧数据对应的一个或多个维度的特征，上述具体处理过程可以参见上述步骤S102和步骤S104中的相关内容，在此不再赘述。通过上述方式得到每个基准多媒体数据中的每个关键帧数据对应的一个或多个维度的特征后，可以将每个基准多媒体数据中的每个关键帧数据对应的一个或多个维度的特征存储到区块链中。

其中，为了便于查找，可以预先设置一个索引区块，指向每一个关键帧数据空间的地址，例如，A_0：0X0000000000000000，即指向偏移量0的地址；A_1：0X0000001000000000，即指向偏移量1024的地址，也即是，每一个关键帧对应的特征空间可以是1024维。在实际应用中，还可以根据区块链中区块的大小，从每一个关键帧数据中提取出该区块所容许的前n维度的特征(其中，n可以小于或等于上述m)。

当通过上述步骤S104的处理得到目标多媒体数据中每个关键帧数据对应的一个或多个维度的特征后，可以将目标多媒体数据中每个关键帧数据对应的特征与区块链中存储的每个基准多媒体数据中关键帧数据对应的特征进行比对，如果某关键帧数据对应的特征与基准多媒体数据中关键帧数据对应的特征相匹配，则表明目标多媒体数据中的该关键帧数据在基准多媒体数据中存在，然后，可以对目标多媒体数据中的下一个关键帧数据进行上述比对，直到目标多媒体数据中的所有关键帧数据比对完成，可以基于关键帧相匹配的数量和关键帧不匹配的数量等数据，确定目标多媒体数据与存储的每个基准多媒体数据之间的内容相似程度，例如，如果目标多媒体数据中超过预定数量(如超过总数量的80％或超过总数量的60％等)的关键帧数据与某一基准多媒体数据中的关键帧数据匹配，则确定目标多媒体数据与存储的该基准多媒体数据之间的内容相似程度较大，否则，确定目标多媒体数据与存储的至少一个基准多媒体数据之间的内容相似程度较小。

需要说明的是，确定目标多媒体数据与存储的每个基准多媒体数据之间的内容相似程度的方式可以不限于上述方式，在实际应用中还可以包括多种方式，具体可以根据实际情况设定，本申请实施例对此不做限定。

在步骤S108中，根据目标多媒体数据与存储的每个基准多媒体数据之间的内容相似程度，判断存储的至少一个基准多媒体数据中是否存在目标多媒体数据。

在具体实施中，如果确定目标多媒体数据与存储的某一基准多媒体数据之间的内容相似程度较大，如大于预定程度阈值，则可以判定存储的至少一个基准多媒体数据中存在目标多媒体数据，如果确定目标多媒体数据与存储的任何一个基准多媒体数据之间的内容相似程度较小，如小于预定程度阈值，则可以判定存储的至少一个基准多媒体数据中不存在目标多媒体数据。

本申请实施例提供一种多媒体数据的溯源检测方法，通过对多媒体数据抽取关键帧，得到一定数量的的关键帧数据，并对每个关键帧数据进行容错提取，得到每个关键帧数据的特征。在多媒体数据溯源时，通过比对待检测的目标多媒体数据与区块链中基准多媒体数据的每个关键帧数据的特征，判断待检测的目标多媒体数据与存储的基准多媒体数据之间的内容相似程度，进而确定目标多媒体数据的溯源结果，由于处理中基于关键帧数据和每个关键帧数据的特征组成的高维度特征空间进行溯源检测，不仅提高了溯源检测的容错性，而且有效的提高了溯源的准确性。

实施例二

如图3所示，本申请实施例提供一种多媒体数据的溯源检测方法，该方法的执行主体可以为终端设备或服务器，其中，该终端设备可以如手机或平板电脑等移动终端设备，还可以如个人计算机等设备。该服务器可以是一个独立的服务器，还可以是由多个服务器构成的服务器集群，该服务器可以是用于多媒体数据的溯源检测的服务器，也可以是预定区块链中的节点。为了提高处理效率，本申请实施例的执行主体以服务器为例进行详细说明，对于执行主体为终端设备的情况，可以参见下述服务器的相关内容执行，在此不再赘述。该方法具体可以包括以下步骤：

在步骤S302中，获取至少一个基准多媒体数据，并从每个基准多媒体数据中提取关键帧数据。

在具体实施中，在当前大数据的背景下，数据的版权或使用权等成为人们关注的焦点，为了保护自己的权益，往往需要检测是否存在其它没有版权或使用权的个人或组织使用某数据，为此，可以将拥有版权或使用权等特殊权利的多媒体数据作为基准多媒体数据，其中，基准多媒体数据可以包括一个或一种，也可以包括多个或多种，例如，基准多媒体数据为某一电影的数据或多个不同电影的数据等。然后，可以从每个基准多媒体数据中提取关键帧数据，具体如可以通过随机抽取的方式，从每个基准多媒体数据中随机抽取多个关键帧数据，或者，还可以预先设置抽取规则，并可以通过该抽取规则，从每个基准多媒体数据中抽取多个关键帧数据。

在步骤S304中，对每个基准多媒体数据中的关键帧数据进行特征提取，得到每个关键帧数据对应的一个或多个维度的特征。

在具体实施中，针对每个基准多媒体数据中的关键帧数据，可以通过设定的特征提取算法进行特征提取。可以将每个关键帧数据的特征映射到到有限维的特征空间内，为此，可以确定提取的特征所属的维度信息，可以基于确定的维度信息，将相应的特征对应存储到上述到特征空间内。

需要说明的是，每一个维度的特征可以使用预定个数的字节(如4个字节或3个字节等)的浮点数来表示。

在步骤S306中，将每个基准多媒体数据中的关键帧数据对应的一个或多个维度的特征存储到预定区块链中。

在具体实施中，通过上述步骤S302和步骤S304得到至少一个基准多媒体数据中的每个关键帧数据对应的一个或多个维度的特征后，可以将至少一个基准多媒体数据中的每个关键帧数据对应的一个或多个维度的特征存储到区块链中。

在实际应用中，针对关键帧数据对应多个维度的特征的情况，上述步骤S310的处理可以多种多样，以下提供一种可选的处理方式，具体可以包括以下步骤一～步骤四的处理。

步骤一，获取预定区块链中的目标区块的信息，目标区块用于存储基准多媒体数据中的关键帧数据对应的多个维度的特征。

其中，目标区块的信息可以包括与目标区块相关的信息，例如目标区块的存储容量和目标区块的上一区块的相关信息等。

在具体实施中，在区块链中，可以每隔一定的时长生成一个区块，此时，可以获取该区块的相关信息，例如该区块能够容纳数据的数量等，可以将该区块设定为目标区块。

步骤二，根据目标区块的信息，确定目标区块的存储容量。

在具体实施中，可以对目标区块的信息进行分析，从中可以分析得到目标区块的存储容量的相关信息，从而获取目标区块的存储容量。

步骤三，当目标区块的存储容量小于基准多媒体数据的关键帧数据对应的多个维度的特征所需的存储容量时，从基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征。

其中，预定数量可以根据实际情况确定，具体可以基于目标区块的存储容量确定，本申请实施例对此不做限定。

在具体实施中，可以将每个基准多媒体数据中的关键帧数据对应的多个维度的特征中的每个维度的特征使用预定个数的字节的浮点数来表示，计算每个基准多媒体数据中的关键帧数据对应的多个维度的特征所占据的空间大小(或所需的存储容量)，然后将计算的该空间大小(或所需的存储容量)与目标区块的存储容量进行比对，如果计算的该空间大小(或所需的存储容量)大于目标区块的存储容量，则表明该基准多媒体数据中的关键帧数据对应的多个维度的特征的数量过多，目标区块中无法存储基准多媒体数据中的关键帧数据对应的多个维度的特征，此时，可以通过随机选取或通过预先设定的选取方式，从基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征。如果计算的该空间大小(或所需的存储容量)小于目标区块的存储容量，则表明目标区块中能够存储基准多媒体数据中的关键帧数据对应的多个维度的特征。

在实际应用中，上述步骤三的处理方式可以多种多样，以下还提供一种可选的处理方式，具体可以包括以下子步骤一～子步骤三。

子步骤一，获取上述关键帧数据对应的多个维度的重要程度信息。

其中，维度的重要程度信息可以由不同的业务所决定，不同的业务，包含的多个维度的重要程度可以不同，重要程度信息可以用于记录某维度的重要程度等级或与重要程度相关的信息(如重要程度为高或低的信息等)。

子步骤二，根据关键帧数据对应的多个维度的重要程度信息，将多个维度的特征进行排序。

在具体实施中，可以将基准多媒体数据中多个维度的特征，根据重要程度的高低进行排序(如可以根据重要程度由高到低的方式对多个维度的特征进行排序等)，得到排序后的多个维度的特征。

子步骤三，根据多个维度的特征的排序结果，从基准多媒体数据中的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征。

子步骤四，将选取的预定数量个维度的特征存储到目标区块中。

通过上述方式，基于对基准多媒体数据的关键帧提取，并对每一个关键帧进行特征提取，根据区块大小计算目标空间维度，以将基准多媒体数据降低维度存储到区块链，且关键帧的多个维度的特征在区块容量允许的范围以内，极大的提高了溯源的准确度，从而避免了通过简单的篡改多媒体数据的内容而绕过溯源检测机制的情况发生。

通过上述方式，在区块链中存储了每个基准多媒体数据中的关键帧数据对应的一个或多个维度的特征，可以基于区块链中的基准多媒体数据对应的特征，对待检测的目标多媒体数据进行溯源检测，具体可以参见下述步骤S308～步骤S318的处理。

在步骤S308中，获取待检测的目标多媒体数据，并从目标多媒体数据中提取关键帧数据。

在步骤S310中，对目标多媒体数据中每个关键帧数据进行特征提取，得到每个关键帧数据对应的一个或多个维度的特征。

考虑到前述基准多媒体数据中的多个维度的特征可以是通过维度的重要程度选取的，因此，为了提高后续过程的处理效率，在上述步骤S310之后，还可以对目标多媒体数据中多个维度的特征进行排序，这样可以快速进行后续的特征比对操作，提高处理效率，具体可以参见下述步骤一和步骤二的处理。

步骤一，获取目标多媒体数据中每个关键帧数据对应的多个维度的重要程度信息。

步骤二，根据目标多媒体数据中每个关键帧数据对应的多个维度的重要程度信息，将目标多媒体数据中多个维度的特征进行排序。

基于上述步骤一和步骤二的处理，可以将目标多媒体数据中多个维度的特征，根据重要程度的高低进行排序，得到排序后的多个维度的特征。而在实际应用中也可以不需要执行上述步骤一和步骤二的处理，而直接执行下述步骤S312的处理。

在步骤S312中，根据目标多媒体数据中每个关键帧数据对应的一个或多个维度的特征，确定目标多媒体数据中每个关键帧数据对应的特征向量。

上述步骤S312中，根据关键帧数据对应的一个或多个维度的特征，确定该关键帧数据对应的特征向量的处理可以基于特征向量的确定方式执行，在此不再赘述。

在步骤S314中，根据目标多媒体数据中每个关键帧数据对应的特征向量和预定区块链中存储的每个基准多媒体数据中关键帧数据对应的特征的特征向量，确定每个关键帧数据与任一基准多媒体数据中的相应关键帧数据的相似度。

在具体实施中，确定每个关键帧数据与每个基准多媒体数据中的相应关键帧数据的相似度的处理可以通过多种方式实现，例如可以通过预先设定的相似度算法确定上述两者的相似度，或者，也可以通过预先设定的计算方式计算上述两者的相似度等。具体可以依据相应的算法或计算方式指示的方法步骤确定上述两者的相似度，本申请实施例在此不再赘述。

在实际应用中，上述步骤S314的具体处理方式可以多种多样，以下提供一种可选的处理方式，具体可以包括以下内容：根据每个关键帧数据对应的特征向量和预定区块链中存储的每个基准多媒体数据中关键帧数据对应的特征的特征向量，通过预定的相似度算法，确定每个关键帧数据与每个基准多媒体数据中的相应关键帧数据的相似度，相似度算法包括kNN(k-Nearest Neighbor，k近邻)算法、欧式距离或余弦距离。

在具体实施中，以相似度算法为kNN算法为例，距离度量、k值的选择及分类决策规则是kNN算法的三个基本要素，可以根据选择的距离度量算法(如曼哈顿距离或欧氏距离等)，计算目标多媒体数据中每个关键帧数据对应的特征向量与存储的每个基准多媒体数据中关键帧数据对应的特征的特征向量的距离，根据k值选择k个最近邻的关键帧数据，最后根据分类决策规则确定每个关键帧数据与每个基准多媒体数据中的相应关键帧数据的相似度。

以相似度算法为欧式距离为例，针对目标多媒体数据中某个关键帧数据对应的特征向量，可以计算该特征向量与存储的每个基准多媒体数据中每个关键帧数据对应的特征向量之间的欧式距离，从中找到欧式距离的最小值，可以获取该最小值对应的基准多媒体数据中的关键帧数据，然后，计算目标多媒体数据中下一个关键帧数据对应的特征向量与获取的基准多媒体数据中的相应关键帧数据对应的特征向量之间的欧式距离(可以将欧式距离的数值确定为相似度数值)，直到遍历目标多媒体数据中所有关键帧数据对应的特征向量，从而得到每个关键帧数据与至少一个基准多媒体数据中的相应关键帧数据的相似度。

在步骤S316中，如果目标多媒体数据中与第一基准多媒体数据中的相应关键帧数据的相似度大于预定相似度阈值的关键帧数据数量大于预定数量阈值，则判定目标多媒体数据与第一基准多媒体数据之间的内容相似程度大于预定程度阈值。

其中，预定数量阈值可以根据实际情况设定，本申请实施例对此不做限定。第一基准多媒体数据可以为至少一个基准多媒体数据中的一个或多个基准多媒体数据。预定的程度阈值可以根据实际情况设定，本申请实施例对此不做限定。

在步骤S318中，如果目标多媒体数据与第一基准多媒体数据之间的内容相似程度大于预定程度阈值，则判定存储的至少一个基准多媒体数据中存在目标多媒体数据。

在实际应用中，上述步骤S316的处理还可以是根据目标多媒体数据中与基准多媒体数据中的相应关键帧数据的相似度大于预定相似度阈值的关键帧数据数量，确定目标多媒体数据与存储的至少一个基准多媒体数据之间的内容相似程度，即可以将目标多媒体数据中与至少一个基准多媒体数据中的相应关键帧数据的相似度大于预定相似度阈值的关键帧数据数量的数值作为内容相似程度的数值等。

实施例三

以上为本申请实施例提供的多媒体数据的溯源检测方法，基于同样的思路，本申请实施例还提供一种多媒体数据的溯源检测装置，如图4所示。

该多媒体数据的溯源检测装置包括：数据获取模块401、特征提取模块402、内容相似检测模块403和数据溯源判断模块404，其中：

数据获取模块401，用于获取待检测的目标多媒体数据，并从所述目标多媒体数据中提取关键帧数据；

特征提取模块402，用于对每个所述关键帧数据进行特征提取，得到每个所述关键帧数据对应的一个或多个维度的特征；

内容相似检测模块403，用于基于每个所述关键帧数据对应的一个或多个维度的特征和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征，确定所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度；其中，所述预定区块链中存储有至少一个基准多媒体数据；

数据溯源判断模块404，用于根据所述目标多媒体数据与存储的所述基准多媒体数据之间的内容相似程度，判断存储的所述基准多媒体数据中是否存在所述目标多媒体数据。

本申请实施例中，所述数据溯源判断模块404，用于如果存储的至少一个所述基准多媒体数据中存在基准多媒体数据与所述目标多媒体数据之间的内容相似程度大于预定程度阈值，则判定存储的至少一个所述基准多媒体数据中存在所述目标多媒体数据。

本申请实施例中，所述内容相似检测模块403，包括：

特征向量确定单元，用于根据每个所述关键帧数据对应的一个或多个维度的特征，确定每个所述关键帧数据对应的特征向量；

相似度确定单元，用于根据每个所述关键帧数据对应的特征向量和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征向量，确定每个所述关键帧数据分别与每个所述基准多媒体数据中的相应关键帧数据的相似度；

内容相似检测单元，用于如果所述目标多媒体数据中与第一基准多媒体数据的相应关键帧数据的相似度大于预定相似度阈值的关键帧数据数量大于预定数量阈值，则判定所述目标多媒体数据与所述第一基准多媒体数据之间的内容相似程度大于预定程度阈值，所述第一基准多媒体数据为所述至少一个基准多媒体数据中的一个或多个基准多媒体数据。

本申请实施例中，所述相似度确定单元，用于根据每个所述关键帧数据对应的特征向量和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征向量，通过预定的相似度算法，确定每个所述关键帧数据分别与每个所述基准多媒体数据中的相应关键帧数据的相似度；所述相似度算法包括k近邻kNN算法、欧式距离算法或余弦距离算法。

本申请实施例中，所述装置还包括：

基准数据获取模块，用于获取至少一个所述基准多媒体数据，并从每个所述基准多媒体数据中提取关键帧数据；

基准数据特征提取模块，用于对每个所述基准多媒体数据中的关键帧数据进行特征提取，得到每个所述关键帧数据对应的一个或多个维度的特征；

存储模块，用于将每个所述基准多媒体数据中的关键帧数据对应的一个或多个维度的特征存储到所述预定区块链中。

本申请实施例中，所述存储模块，包括：

区块获取单元，用于获取所述预定区块链中的目标区块的信息，所述目标区块用于存储所述基准多媒体数据中的关键帧数据对应的多个维度的特征；

存储容量确定单元，用于根据所述目标区块的信息，确定所述目标区块的存储容量；

特征选取单元，用于当所述目标区块的存储容量小于所述基准多媒体数据的关键帧数据对应的多个维度的特征所需的存储容量时，从所述基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征；

存储单元，用于将选取的预定数量个维度的特征存储到所述目标区块中。

本申请实施例中，所述特征选取单元，用于获取所述关键帧数据对应的多个维度的重要程度信息；根据所述关键帧数据对应的多个维度的重要程度信息，将所述多个维度的特征进行排序；根据所述多个维度的特征的排序结果，从所述基准多媒体数据中的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征。

本申请实施例提供一种多媒体数据的溯源检测装置，通过对多媒体数据抽取关键帧，得到一定数量的的关键帧数据，并对每个关键帧数据进行容错提取，得到每个关键帧数据的特征。在多媒体数据溯源时，通过比对待检测的目标多媒体数据与区块链中基准多媒体数据的每个关键帧数据的特征，判断待检测的目标多媒体数据与存储的基准多媒体数据之间的内容相似程度，进而确定目标多媒体数据的溯源结果，由于处理中基于关键帧数据和每个关键帧数据的特征组成的高维度特征空间进行溯源检测，不仅提高了溯源检测的容错性，而且有效的提高了溯源的准确性。

实施例四

以上为本申请实施例提供的多媒体数据的溯源检测装置，基于同样的思路，本申请实施例还提供一种多媒体数据的溯源检测设备，如图5所示。

所述多媒体数据的溯源检测设备可以为上述实施例提供的服务器。

多媒体数据的溯源检测设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器501和存储器502，存储器502中可以存储有一个或一个以上存储应用程序或数据。其中，存储器502可以是短暂存储或持久存储。存储在存储器502的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括对多媒体数据的溯源检测设备中的一系列计算机可执行指令。更进一步地，处理器501可以设置为与存储器502通信，在多媒体数据的溯源检测设备上执行存储器502中的一系列计算机可执行指令。多媒体数据的溯源检测设备还可以包括一个或一个以上电源503，一个或一个以上有线或无线网络接口504，一个或一个以上输入输出接口505，一个或一个以上键盘506。

具体在本实施例中，多媒体数据的溯源检测设备包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对多媒体数据的溯源检测设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

本申请实施例中，所述根据所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度，判断存储的所述至少一个基准多媒体数据中是否存在所述目标多媒体数据，包括：

本申请实施例中，所述基于每个所述关键帧数据对应的一个或多个维度的特征和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征，确定所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度，包括：

本申请实施例中，所述根据每个所述关键帧数据对应的特征向量和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征向量，确定每个所述关键帧数据分别与每个所述基准多媒体数据中的相应关键帧数据的相似度，包括：

本申请实施例中，获取待检测的目标多媒体数据，并从所述目标多媒体数据中提取关键帧数据之前，所述方法还包括：

本申请实施例中，当所述关键帧数据对应多个维度的特征时，将每个所述基准多媒体数据中的关键帧数据对应的多个维度的特征存储到所述预定区块链中，包括：

根据所述目标区块的信息，确定所述目标区块的存储容量；

将选取的预定数量个维度的特征存储到所述目标区块中。

本申请实施例中，所述从所述基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征，包括：

获取所述关键帧数据对应的多个维度的重要程度信息；

本申请实施例提供一种多媒体数据的溯源检测设备，通过对多媒体数据抽取关键帧，得到一定数量的的关键帧数据，并对每个关键帧数据进行容错提取，得到每个关键帧数据的特征。在多媒体数据溯源时，通过比对待检测的目标多媒体数据与区块链中基准多媒体数据的每个关键帧数据的特征，判断待检测的目标多媒体数据与存储的基准多媒体数据之间的内容相似程度，进而确定目标多媒体数据的溯源结果，由于处理中基于关键帧数据和每个关键帧数据的特征组成的高维度特征空间进行溯源检测，不仅提高了溯源检测的容错性，而且有效的提高了溯源的准确性。

实施例五

本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述多媒体数据的溯源检测方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random AccessMemory，简称RAM)、磁碟或者光盘等。

本申请实施例提供一种计算机可读存储介质，通过对多媒体数据抽取关键帧，得到一定数量的的关键帧数据，并对每个关键帧数据进行容错提取，得到每个关键帧数据的特征。在多媒体数据溯源时，通过比对待检测的目标多媒体数据与区块链中基准多媒体数据的每个关键帧数据的特征，判断待检测的目标多媒体数据与存储的基准多媒体数据之间的内容相似程度，进而确定目标多媒体数据的溯源结果，由于处理中基于关键帧数据和每个关键帧数据的特征组成的高维度特征空间进行溯源检测，不仅提高了溯源检测的容错性，而且有效的提高了溯源的准确性。

上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device，PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请的实施例是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程多媒体数据的溯源检测设备的处理器以产生一个机器，使得通过计算机或其他可编程多媒体数据的溯源检测设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程多媒体数据的溯源检测设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程多媒体数据的溯源检测设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种多媒体数据的溯源检测方法，其特征在于，所述方法包括：

获取至少一个基准多媒体数据，并从每个所述基准多媒体数据中提取关键帧数据；

对每个所述基准多媒体数据中的关键帧数据进行特征提取，得到每个所述关键帧数据对应的一个或多个维度的特征；其中，将每个关键帧数据的特征映射到有限维的特征空间内，确定提取的特征所属的维度信息，基于确定的维度信息，将相应的特征对应存储到上述特征空间内；

将每个所述基准多媒体数据中的关键帧数据对应的一个或多个维度的特征存储到预定区块链中；

根据所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度，判断存储的所述至少一个基准多媒体数据中是否存在所述目标多媒体数据；

其中，当所述关键帧数据对应多个维度的特征时，将每个所述基准多媒体数据中的关键帧数据对应的多个维度的特征存储到所述预定区块链中，包括：

获取所述预定区块链中的目标区块的信息，所述目标区块用于存储所述基准多媒体数据中的关键帧数据对应的多个维度的特征；其中，在区块链中，每隔一定的时长生成一个区块，获取该区块的相关信息，将该区块设定为目标区块；

根据所述目标区块的信息，确定所述目标区块的存储容量；

当所述目标区块的存储容量小于所述基准多媒体数据的关键帧数据对应的多个维度的特征所需的存储容量时，从所述基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征；其中，将每个基准多媒体数据中的关键帧数据对应的多个维度的特征中的每个维度的特征使用预定个数的字节的浮点数来表示，计算每个基准多媒体数据中的关键帧数据对应的多个维度的特征所占据的空间大小，然后将计算的该空间大小与目标区块的存储容量进行比对，如果计算的该空间大小大于目标区块的存储容量，则表明该基准多媒体数据中的关键帧数据对应的多个维度的特征的数量过多，目标区块中无法存储基准多媒体数据中的关键帧数据对应的多个维度的特征，通过随机选取或通过预先设定的选取方式，从基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征；如果计算的该空间大小小于目标区块的存储容量，则表明目标区块中能够存储基准多媒体数据中的关键帧数据对应的多个维度的特征；

将选取的预定数量个维度的特征存储到所述目标区块中；

所述从所述基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征，包括：

获取所述关键帧数据对应的多个维度的重要程度信息；

根据所述多个维度的特征的排序结果，从所述基准多媒体数据中的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征；

所述根据所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度，判断存储的所述至少一个基准多媒体数据中是否存在所述目标多媒体数据，包括：

如果存储的至少一个所述基准多媒体数据中存在基准多媒体数据与所述目标多媒体数据之间的内容相似程度大于预定程度阈值，则判定存储的至少一个所述基准多媒体数据中存在所述目标多媒体数据；

所述基于每个所述关键帧数据对应的一个或多个维度的特征和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征，确定所述目标多媒体数据与存储的每个所述基准多媒体数据之间的内容相似程度，包括：

如果所述目标多媒体数据中与第一基准多媒体数据的相应关键帧数据的相似度大于预定相似度阈值的关键帧数据数量大于预定数量阈值，则判定所述目标多媒体数据与所述第一基准多媒体数据之间的内容相似程度大于预定程度阈值，所述第一基准多媒体数据为所述至少一个基准多媒体数据中的一个或多个基准多媒体数据；

所述根据每个所述关键帧数据对应的特征向量和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征向量，确定每个所述关键帧数据分别与每个所述基准多媒体数据中的相应关键帧数据的相似度，包括：

根据每个所述关键帧数据对应的特征向量和预定区块链中存储的每个基准多媒体数据的关键帧数据对应的特征向量，通过预定的相似度算法，确定每个所述关键帧数据分别与每个所述基准多媒体数据中的相应关键帧数据的相似度；所述相似度算法包括k近邻kNN算法、欧式距离算法或余弦距离算法；如果相似度算法为kNN算法，距离度量、k值的选择及分类决策规则是kNN算法的三个基本要素，根据选择的距离度量算法，计算目标多媒体数据中每个关键帧数据对应的特征向量与存储的每个基准多媒体数据中关键帧数据对应的特征的特征向量的距离，根据k值选择k个最近邻的关键帧数据，最后根据分类决策规则确定每个关键帧数据与每个基准多媒体数据中的相应关键帧数据的相似度；如果相似度算法为欧式距离，针对目标多媒体数据中某个关键帧数据对应的特征向量，计算该特征向量与存储的每个基准多媒体数据中每个关键帧数据对应的特征向量之间的欧式距离，从中找到欧式距离的最小值，获取该最小值对应的基准多媒体数据中的关键帧数据，然后，计算目标多媒体数据中下一个关键帧数据对应的特征向量与获取的基准多媒体数据中的相应关键帧数据对应的特征向量之间的欧式距离，直到遍历目标多媒体数据中所有关键帧数据对应的特征向量，从而得到每个关键帧数据与至少一个基准多媒体数据中的相应关键帧数据的相似度。

2.一种多媒体数据的溯源检测装置，其特征在于，所述装置包括：

数据溯源判断模块，用于根据所述目标多媒体数据与存储的所述基准多媒体数据之间的内容相似程度，判断存储的所述至少一个基准多媒体数据中是否存在所述目标多媒体数据；

基准数据特征提取模块，用于对每个所述基准多媒体数据中的关键帧数据进行特征提取，得到每个所述关键帧数据对应的一个或多个维度的特征；其中，将每个关键帧数据的特征映射到有限维的特征空间内，确定提取的特征所属的维度信息，基于确定的维度信息，将相应的特征对应存储到上述特征空间内；

存储模块，用于将每个所述基准多媒体数据中的关键帧数据对应的一个或多个维度的特征存储到所述预定区块链中；

所述存储模块，包括：

区块获取单元，用于获取所述预定区块链中的目标区块的信息，所述目标区块用于存储所述基准多媒体数据中的关键帧数据对应的多个维度的特征；其中，在区块链中，每隔一定的时长生成一个区块，获取该区块的相关信息，将该区块设定为目标区块；

特征选取单元，用于当所述目标区块的存储容量小于所述基准多媒体数据的关键帧数据对应的多个维度的特征所需的存储容量时，从所述基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征；其中，将每个基准多媒体数据中的关键帧数据对应的多个维度的特征中的每个维度的特征使用预定个数的字节的浮点数来表示，计算每个基准多媒体数据中的关键帧数据对应的多个维度的特征所占据的空间大小，然后将计算的该空间大小与目标区块的存储容量进行比对，如果计算的该空间大小大于目标区块的存储容量，则表明该基准多媒体数据中的关键帧数据对应的多个维度的特征的数量过多，目标区块中无法存储基准多媒体数据中的关键帧数据对应的多个维度的特征，通过随机选取或通过预先设定的选取方式，从基准多媒体数据的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征；如果计算的该空间大小小于目标区块的存储容量，则表明目标区块中能够存储基准多媒体数据中的关键帧数据对应的多个维度的特征；

存储单元，用于将选取的预定数量个维度的特征存储到所述目标区块中；

所述特征选取单元，用于获取所述关键帧数据对应的多个维度的重要程度信息；根据所述关键帧数据对应的多个维度的重要程度信息，将所述多个维度的特征进行排序；根据所述多个维度的特征的排序结果，从所述基准多媒体数据中的关键帧数据对应的多个维度的特征中选取预定数量个维度的特征；

3.一种多媒体数据的溯源检测设备，其特征在于，所述多媒体数据的溯源检测设备包括：

处理器；以及

根据所述目标区块的信息，确定所述目标区块的存储容量；

将选取的预定数量个维度的特征存储到所述目标区块中；

获取所述关键帧数据对应的多个维度的重要程度信息；

4.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1所述的多媒体数据的溯源检测方法的步骤。