CN1332354C

CN1332354C - 数据内容识别

Info

Publication number: CN1332354C
Application number: CNB2004100545512A
Authority: CN
Inventors: J·C·佩尔利; D·W·塔普森; M·J·鲁斯塞尔
Original assignee: Sony United Kingdom Ltd
Current assignee: Sony Corp
Priority date: 2003-07-23
Filing date: 2004-07-23
Publication date: 2007-08-15
Anticipated expiration: 2024-07-23
Also published as: CN1577391A

Abstract

检测输入数据内容的版本的方法，所述数据内容有多个不同的版本，其中：所述数据内容按照分段模式被安排为两个或更多分段；以及所述数据的所述版本通过相应的识别数据模式是可识别的，为此至少某些所述分段具有相应的识别数据；所述方法包括以下步骤：(i)对于所述输入数据内容的所述分段检测所述识别数据；(ii)把所述检测的识别数据与相应于所述数据内容的所述不同版本的所述识别数据模式进行比较；以及(iii)如果在所述检测的识别数据与某个版本的所述识别数据模式之间得到的匹配数超过阈值，则检测所述输入数据内容是否包括来自所述数据内容的某个版本的至少一个贡献。

Description

数据内容识别

发明背景

发明领域

本发明涉及数据内容识别。这样的内容的例子包括一个或多个视频内容、音频内容、元数据内容、文本内容、图像内容等等，例如视听(audio visual)内容。

现有技术描述

包括数字设备和高速度网络的新的数字基础设施的发展，与不断增长的处理器能力相组合，使得内容创建、处理、和分发更加简单和快速。虽然这大大地帮助合法地使用内容，但缺点是：这样的内容(特别是版权内容)的非法滥用或“盗版”，诸如非法复制或分发，变得越来越容易和越来越损害内容拥有者。

这种情形变得更加复杂，因为商业考虑需要内容拥有者允许潜在的客户尝试地查看或使用内容-这或许是作为内容的专业评审的一部分，或在向拥有者承诺购买内容使用权之前。例如在电影的情形下，该内容的许多拷贝以这样的方式被发布。

已经提出，使用所谓的“指纹”技术把识别数据加到内容上。虽然这不能防止非法复制，但它允许检测出非法复制品的来源。可应用于视频信号的指纹技术在GB-A-2383221和US-A-5664018中描述。

然而，这种技术的实现会花费很长的时间。使用在本申请之前的日期的当前的技术，可能会花费例如10小时来把指纹处理应用到一部完整长度的电影。

发明概要

本发明提供检测输入数据内容的版本的方法，其中：

所述输入数据内容按照分段模式被安排为两个或更多分段，所述分段是选自具有各自识别数据的所述输入数据内容的两个或更多主拷贝；以及

所述输入数据内容的版本通过由所述分段的各自识别数据形成的识别数据模式是可识别的；

所述方法包括以下步骤：

(i)相对于所述输入数据内容的分段检测识别数据；

(ii)对所述检测的识别数据与相应于所述数据内容的不同版本的识别数据模式进行比较；以及

(iii)如果在所述检测识别数据与一个确定版本的所述识别数据模式之间得到的识别数据匹配的数目超过阈值数，则检测所述输入数据内容包括来自所述数据内容的所述确定版本的至少一个组成部分。

本发明建立在一个未公布的建议方案的基础上，它建议通过组合内容的多个主拷贝的部分或“分段”(它们之中至少某些带有指纹数据)来生成加指纹的内容。(这里，术语“指纹”是指把识别数据保密地加到内容上，理想地是这样加入的，即它的存在对于用户几乎是不会觉察的。)这些分段按照对于该内容拷贝的特定用户是独特的或准独特的分段模式进行组合。这个未公布的建议的优点在于，内容的独特的指纹拷贝能以比起把全部指纹处理加到每个单独的拷贝所需要的时间短得多的时间被生成。

如果发现内容的可疑的盗版拷贝，则能够识别藉以复制该盗版的内容来源是有用的。这可以识别盗版的拷贝的制造者或识别由允许由另外的人制作盗版的拷贝的用户造成的保密性失效。在未公布的建议中，这需要检测在每个分段上检测的指纹数据与被使用于发布给用户的版本中的每个分段的已知的指纹数据之间的100％的匹配。

然而，这种基本检测技术没有考虑在一个或多个加指纹的分段中对检测指纹的失败。如果内容受到过某种处理，诸如在电影的情形下所谓的“摄像机盗版”，就会出现这样的失败。这种基本检测技术也没有考虑所谓的“串通攻击”，其中盗版的拷贝被做成为多个合法拷贝的组合，试图去除或冲淡指纹数据。

本发明通过提供在检测到的识别数据与用户的版本的识别数据模式之间的匹配数之和的阈值以检测用户的版本是非法拷贝的源而解决至少某些这样的问题。

特别是在其中各个分段可以产生多个识别数据的串通攻击的情形下，为了确信想要的虚假确信检测率(false positive detectionrate)，最好从在对于输入数据内容的分段检测到的识别数据得出阈值数。具体地，最好是阈值数取决于：对于输入数据内容的每个分段，识别数据有多少个事例被检测。优选地，阈值数这样来设置，以使得在对于输入数据内容的每个分段上检测到的识别数据的事例是给定的数目的情况下，输入数据内容被错误地检测为一个确定的版本的统计机会要小于阈值概率。

在替换的/附加的技术中，优选地，该方法包括：按照对于输入数据内容的该分段检测到的识别数据的事例的数目，对于在输入数据内容的分段上检测到的识别数据之间的匹配进行加权，各匹配之和是匹配的加权和值。

当加权是这样进行的，以致于一个其中检测到了识别数据的多个事例的分段，比起一个其中检测到了识别数据的单个事例的分段，对于特定的版本的检测的贡献更小的场合下，预期将得到更可靠的结果。然而，与直观相反，在原型的某些实验测试中检测到：当加权是这样进行的，以致于一个其中检测到识别数据的多个事例的分段，比起一个其中检测到识别数据的单个事例的分段，对于特定的版本的检测的贡献更大的场合下，将得到更好的结果。

为了缓和某些分段不产生识别数据的问题，最好是，如果对于输入数据内容的两个或更多分段没有检测到识别数据，则这些分段被组合成两个或更多分段的组，以及对于分段的所述组合后的组进行识别数据的检测。这个过程优选地可迭代地重复进行。

优选地，阈值数代表小于分段总数的分段数，和/或小于在该识别数据模式中具有相关的识别数据的分段总数的分段数。

虽然可以使用那些其中只有某些分段载有识别数据的识别模式，但最好是数据内容的版本是可以通过相应的识别模式识别的，其中几乎所有的分段都依据所述相应的识别模式而具有各自的识别数据。

本发明也提供一种创建输入数据内容的指纹版本的方法，所述方法其特征在于以下步骤：

(i)生成输入数据内容的n个主拷贝，其中n大于1，至少除了一个以外的所有主拷贝载有各自的识别数据，载有各自的识别数据的每个所述主拷贝的识别数据相对于由其他主拷贝所载有的所述各自的识别数据是独特的；以及

(ii)根据分段模式通过从所述n个主拷贝中选择分段而生成所述输入数据内容的版本，从而按照分段模式，所述输入数据内容的每个版本载有来自所述主拷贝的识别数据；

其中所述分段模式使得在所述输入数据内容内至少一个所述分段是不相邻的。

为了更好地检测盗版的拷贝的来源，最好是在步骤(i)中所有的事例要载有各自的对于其他事例独特的识别数据。

本发明也提供用于检测输入数据内容版本的设备，其中：

所述输入数据内容按照分段模式被安排成两个或更多分段，所述分段是选自具有各自识别数据的所述输入数据内容的两个或更多主拷贝；以及

所述输入数据内容的版本通过由所述分段的各自识别数据形成的分段模式是可识别的；

所述设备包括：

识别数据检测器，用来相对于所述输入数据内容的分段检测识别数据；

比较器，用来比较所述检测的识别数据与相应于所述数据内容的不同版本的分段模式；以及

贡献检测器，用于当在所述检测的识别数据与一个确定版本的所述分段模式之间获得的识别数据匹配数超过一个阈值数，则检测所述输入数据内容包括至少来自所述数据内容的那个确定版本的贡献。

本发明的这个方面可以提供避免所谓的串通攻击的优点，其中加指纹的数据的多个拷贝被加以组合。通过使用非相邻的分段，一组串通者(colluder)更难识别分段边界。

本发明特别适用于包括具有多个接续图像的视频内容的数据内容。优选地，识别数据被编码在代表至少某些图像的数据内，例如在至少某些图像的空间频率分量的一个子组内。

本发明还提供用于创建输入数据内容的指纹版本的设备，所述设备包括：

主拷贝生成器，用来生成所述输入数据内容的n个主拷贝，其中n大于1，至少除了一个以外的所有所述主拷贝载有各自的识别数据，载有各自识别数据的每个所述主拷贝的所述识别数据相对于由其他主拷贝载有的所述各自的识别数据是独特的；以及

版本生成器，用来根据分段模式通过从所述n个主拷贝选择分段而生成所述输入数据内容的版本，从而按照分段模式，所述输入数据内容的每个版本载有所述主拷贝的识别数据；

本发明的另外的各个方面和特性在附属权利要求中规定。

附图简述

当结合附图阅读说明性实施例的以下的详细说明时将明白本发明的以上的和其他的目的、特性和优点，其中：

图1是指纹编码设备的示意图；

图2示意地显示通过使用多个主拷贝的分段来生成内容的加了指纹的拷贝；

图3示意地显示该技术在DVD中沿VOBU边界的应用；

图4示意地显示非相邻的分段；

图5示意地显示该技术应用于视频点播传输；

图6示意地显示该技术应用于互联网下载文件；

图7示意地显示指纹检测设备；

图8示意地显示图7的设备的运行；

图9示意地显示分段分析运行；以及

图10示意地显示主拷贝生成运行。

发明详细描述

本技术可用于对内容加标记，以便以后能够通过使用法庭分析来唯一地识别该内容(或至少部分内容的拷贝)。这个概念可应用于任何可分组的数据，诸如视频和音频基本数据或复接的数据流。这并不是说，数据必须具有正式的分组化的形式，而是数据可被处理成分段或部分，它们代表要被加标记的整个数据量的子集。该技术可被应用于封装的媒体(诸如被存储在诸如光盘的存储媒体上的内容)、从因特网(所谓的内容“拉出”系统)下载的内容、例如通过数字电视业务(所谓的内容“推入”系统)而广播的内容、或其他内容传递的格式。

创建加指纹的内容的过程牵涉到创建两个或更多(一般是m个)主拷贝M₁。各个主拷贝都可通过使用加指纹而被独特地加标记，或一个原始的内容可以被保留为未加标记的。在视频内容的情形下，在以上参考文献中描述的技术允许这样地来把识别数据加到内容上，以使得识别数据的存在对于观众基本上是不会觉察的，识别数据可以以后用短的内容分段(或许几秒的视频的量级)来编码，而且识别数据对于把内容进行处理(诸如改变尺寸、数据压缩或甚至摄像机盗版(通过把视频摄像机对准显示内容的屏幕而获取内容)基本上是很健全的。

然后主内容被相同地划分成n个部分(分段或部分)。

在基本系统中，分割方式是简单的时分，这样，分段1包括第一时间间隔的内容，分段2跟随在分段1后面，分段3跟随在分段2后面，等等。分段可以具有相等的长度或可以具有不同的长度。

在更先进的设备中，每个分段潜在地占用多个不相邻的时间间隔。这种设备具有对抗所谓的串通攻击的优点，以及将在下面参照图4进行描述。

在另一种可能性中(它可以与以上描述的两个可能性的任一项相组合)，分段可被安排为视频内容的空间划分，这样，例如，图像的上部可以代表一个与图像的下部的不同的分段。

根据从m个主拷贝伪随机生成n个分段的组合，创建了内容的一个版本，它包含相同的n个分段，但加到这些分段的识别数据是以伪随机方式组合的。只要使用足够数目的主拷贝和分段以提供足够大的一组排列组合以便能包含要分发的版本的数目，就没有两个版本再具有分段识别数据的相同的排列。这意味着，每个版本具有独特的指纹，而不需要应用耗时的约定的指纹生成的处理来产生每个这样的版本。

图1是通过使用该技术的指纹编码设备的示意图。

在图1上，未加标记的(未加指纹的)视频文件10被提供给两个指纹编码器20，30。使用两个不同的指纹数据组来对该视频进行指纹编码，产生两个主拷贝M₁，M₂。将会看到，一个主拷贝实际上仍旧被保留为未加指纹的，也将会看到，指纹编码处理可作为串行处理被实行，而不是图1所示的并行处理。而且，主拷贝的数目可以大于2。

两个主拷贝被编码器40，50进行MPEG2编码，以及像AC3这样的音频数据的压缩音频数据被复接器60，70复接到数据中。这产生两个所谓的DVD图像，也就是说，具有准备好被记录到DVD盘的形式的视频数据。每个图像包含相应于主拷贝M₁或主拷贝M₂的指纹。

两个图像分段组合器80，90接收来自用户数据库100的识别矢量，并按照识别矢量组合两个主拷贝DVD图像M₁，M₂的分段。通过安排以使得主拷贝数目和分段变形的数目可以给出足够大数目的识别矢量以用于要产生的所需要的版本的数目，则识别矢量可被认为是唯一的(或至少是准唯一的)。每个组合器的输出被提供到各自的DVD写入器(所谓的“刻录机(burner)”)110，120，以及各自的DVD盘130，140被写入。为了从每个刻录机产生另一个DVD盘，从数据库提供新的识别矢量，以及产生两个主DVD图像M₁，M₂的分段的新的组合。

虽然图1显示相同的数目的主拷贝、组合器和刻录机(即，每种两个)，但将会看到，这只是为了附图的简明性。没有任何技术理由要求组合器和刻录机与主拷贝具有相同的数目。

一个用于使每个盘与存储在数据库100的(保密的)识别矢量相联系的非保密代码可被写入到盘上，或可看见地打印在盘上，或同时执行这两种操作。这不是一种技术特性，而是对于把盘路由到正确的用户是有用的。事实上，用户的名字可存储在数据库100，也可打印在各个DVD盘的表面。

作为例子，假设有三个主拷贝，以及每个主拷贝被划分成5个分段。这个安排示意地显示于图2。每个版本由5位数字的“识别矢量”诸如’13213’或’22131’规定。这表示：按预订的分段次序，哪个主拷贝被用来提供该版本的每个分段。参照图2，在图的下部，用于四个示例版本(a到d)的ID矢量是：

版本a： 32212

版本b： 11332

版本c： 13222

版本d： 23221

在再现时，在用户欣赏的音频/视频材料中在版本之间应当没有差别(假设指纹数据以基本上不会觉察的方式加入)。版本之间的唯一差别是指纹数据。

识别矢量可以用这样的方式存储在数据库，以使其被链接到接收该版本的用户。

各个指纹的可能的组合取决于3个因素：

(i)主拷贝数目m；

(ii)分段数目n；

(iii)可被交换的分段的最大数目k。

用于确定不同于单个主拷贝的组合数目(c)的公式是：

(i)如果全部n个分段是可交换的，则数目是

c＝mⁿ-1

(ii)如果n个分段中最大k个分段是可交换的，则数目是

{c = Σ}_{j = 1}^{k} {(m - 1)}^{j}_{n} C_{j}

例如，如果使用120分钟电影划分成60(＝n)个分段的2(＝m)个主拷贝，以及60个分段中只有20(＝k)个是可交换的，则不同于单个主拷贝的组合数目超过7×10¹⁵。对于较简单的方案，假设m＝2，n＝20，以及全部20个是可交换的，则不同于单个主拷贝的组合数目是1,048,575。以下的表展示不同于单个主拷贝的组合数如何随主拷贝数目和分段数目而按比例改变。

m	n	c
m	n	c	2	20	1048575
3	20	3486784400	2	20	1048575
3	20	3486784400	5	20	95367431640624
10	20	99999999999999999999	5	20	95367431640624
10	20	99999999999999999999
2	10	1023
2	10	1023	2	20	1048575
2	60	1152921504606846975	2	20	1048575
2	60	1152921504606846975	2	99	633825300114114700748351602687

图3示意地显示该技术沿DVD的VOBU边界的应用。

VOBU(视频对象单元)是存储在DVD上的小的(典型地几秒)相邻的序列的视频(和相关的音频)。它必须包括一个或多个可被DVD放像机的MPEG译码器理解的自包含的“图像组”(GOP)。保证在再现时所有的搜寻、跳跃等等出现在VOBU边界，以使译码器不需要重新启动，并且跳过的位置总是在有效的MPEG流的开始。VOBU可被组织为VOBU组，它又进而可被安排在VOB(视频对象)中。每个VOBU组是独立的复接的单元，以及对于以前的和以后的单元没有相关性。VOBU组可以具有与所必须的或适当的那样多的VOBU。

为了附图的简单性，图3只显示两个主拷贝M₁和M₂。这两个主拷贝可以单独地加指纹，或一个加指纹而另一个不加指纹。两个主拷贝被MPEG2编码，以及被预复接成VOBU和VOBU组结构。为了本技术的目的，主拷贝沿VOBU组边界被分段。

然后，根据上述的准唯一的识别矢量，分段按伪随机方式被组合以便重新创建唯一的DVD记录，它然后(例如)可被刻录到可记录的DVD上(DVD-R)。这个过程比起准备约定的加指纹的DVD-R花费少得多的时间，因为加指纹必须只对主拷贝进行，然后被预复接。关于每个版本的个性化过程只与级联的数据分段有关。

一旦VOBU组被组合，就进行IFO生成过程，该过程计算在新建立的VOB内每个VOBU的偏移。(在DVD视频盘编码中，IFO是存储在DVD盘上的、包含信息的文件。DVD的主要分量由MPEG-2编码的音频、视频和子标题流的VOB文件代表，而IFO文件则把关于DVD章节在哪里开始，某些音频轨道位于什么地方等等信息提供给DVD放像机。)对于DVD放像机，VOB似乎是完全独立自主的，正如任何正确地编码的DVD那样，但从内部看，它是来自两个或更多不同的DVD编码的VOBU组的组合。VOB遵从DVD技术说明约束条件。

如果这些DVD中的一个DVD是通过直接复制(所谓的“剥离”)或通过重新编码成例如所谓的DiVx或Xvid格式而被盗版，则应当也可能识别盗版的拷贝的来源，即，藉以作出盗版的拷贝的版本的拥有者。为了做到这一点，对盗版的拷贝的视频流进行分析。分段边界被加以识别，以及在每个分段上由指纹载有的识别数据被加以识别。这生成一个识别矢量，并把它与在光盘被刻录时创建的、被存储在数据库的识别矢量进行比较。因为每个光盘具有准唯一的识别矢量，这应当允许识别该来源。

图4示意地显示使用非相邻的分段的安排。这里，分段被编号为1，2，3，4，5，...，以及可以看到，在视频材料的长度期间(在该页上从左到右地观看)，每个分段被分裂成两个或更多非相邻的部分。下面将讨论帮助击败所谓的串通攻击的方法。

同样的概念可被使用于例如互联网下载或视频点播安排，或其他内容传递机制，其中各个内容包被传递到每个用户或用户组。

图5示意地显示该技术应用于的视频点播(VOD)传输。这里，被划分成分段(为简单起见，被显示为相邻的分段)的两个主拷贝M₁，M₂被组合器80’按从数据库100’接收的识别矢量被组合。组合的视频流被VOD服务器200处理，以及被有线网络发送到用户的VOD机顶盒210。用户在电视机220上观看该文件。

类似地，在图6上，数据库100”把识别矢量提供给组合器80”，以便组合两个主拷贝M₁，M₂。组合的文件由网络服务器230通过互联网连接被发送到客户个人计算机(PC)240。

应当指出，就VOD服务器和以后的处理而言，以及就网络服务器230和以后的处理而言，被保护的文件就像任何其他文件。通过把加指纹的主拷贝加以组合而得到的安全性与VOD服务器或网络服务器无关，也与内容的最终用户的欣赏无关。

不管基础的指纹技术的觉察的健全性和低的虚假确信率，不恰当地使用本技术的分段系统潜在地具有更高的虚假确信率和小的串通健全性。这方面的至少某些困难可以通过适当的译码策略来解决。

图7示意地显示指纹检测设备。

图7的设备包括个人计算机300，它具有显示器310、键盘320和用户输入设备，诸如鼠标330。个人计算机具有中央处理机340，只读存储器350、随机存取存储器360、硬盘存储器370、网络接口380(用来完成对诸如互联网390的网络连接)、以及输入/输出处理400(例如进行从DVD盘410读出数据和/或写入数据到DVD盘410)。可以借助个人计算机实施本技术的软件(事实上，该软件控制这里描述的版本生成技术)被提供到存储媒体(诸如硬盘存储器370)、或可移动的媒体，(诸如光盘410)、和/或经由网络或互联网连接(诸如经由网络接口380的连接)。

图8示意地显示图7的设备的运行。

在图8上，从DVD盘读出保护的内容的可疑的盗版的拷贝500。在510，内容按照预定的(和保密的)分段模式被划分成分段，以及为了指纹数据分析这些分段，在520从这个分析得出阈值量。下面将描述得出阈值的方法，但基本上，这是一种统计计算，以便在给定了识别数据在分段之间的分布后，给出需要的或想要的虚假确信率(即，为了最终结果是有效而所需的保证)。

在530，对于从数据库100的拷贝读出的用户识别矢量，测试分段识别数据。检测识别数据匹配情形。

最后，在550，把阈值应用到在530实行的测试的结果。任何一个其识别矢量充分地匹配以致于导致测试得分超过阈值的用户被认为是盗版的拷贝的来源。

在基本级别上，如上所述，译码器可以译码来自盗版的拷贝的每个分段的识别数据，从而产生译码后的识别矢量，然后试图把这个译码的识别矢量与各个用户以前存储的识别矢量进行匹配。然而，为了在从分段识别数据进行译码能强有力地对付可能的失败(例如，如果内容被太严重地处理，或如果分段从内容中被删除)，重要的是，译码器不对每个单独的分段搜索识别数据的匹配。而是，良好的译码器策略是要测试在足够多的分段上是否有识别数据匹配。究竟多大的匹配的阈值数才被认为是足够的，将取决于想要的虚假确信率-如果阈值太小，则无罪的接收者的随机识别矢量将充分地与译码的识别矢量匹配，从而表明一次匹配。

在存在串通的情形下，基础指纹译码器也可能设法对于每个分段对多个输入数据内容译码(取决于串通攻击如何被执行)。

在这种情形下，良好的译码策略仍旧是测试用户的识别矢量与译码的识别矢量是否有足够多的匹配数量。然而，正如指出的，译码的识别矢量可能会在每个分段具有多个识别数据。这一事实增加了这样的可能性，即无罪的用户的伪随机识别矢量恰好会充分地匹配于解码的识别矢量，以致于将无罪的用户认为是盗版的拷贝的源。所以应当设置匹配分段的阈值以便避免这个问题。应当指出，阈值实际上取决于每个分段有多少个识别数据被译码，而它本身取决于串通如何被执行。

在译码后的识别矢量中，令分段的权重w是从该分段中译码的信息数据的数目。假设有m个主拷贝，则对于每个分段，0、＜w、＜m。权重为0的分段在匹配过程中没有提供信息，因为匹配是不可能的。类似地，权重m的分段在匹配过程中没有提供信息，因为匹配总是可能的。

优选的译码策略是，对于每个接收者，对在接收者的识别矢量与译码的识别矢量之间的匹配的数目进行计数，这里只集中在权重1≤w＜m的分段。如果对于特定的接收者的识别矢量的匹配的数目大于或等于阈值t，则那个接收者可被指责为参与盗版。接着跟随的是一个通过计算t以保证规定的虚假确信率p的方法。

对于1≤w＜m，令c_w是在译码的识别矢量中权重w的分段数，即，从中已译码w个识别数据的分段数。

这样，

l = Σ_{w = 1}^{m - 1} c_{w}

代表权重1≤w＜m的分段的总数。

对于1≤w＜m，令B_w～Bin(c_w，w/m)。对于在译码的识别矢量中权重为w的任一分段，它与在独立的随机识别矢量中相应的分段相匹配的概率是w/m。由于在译码的识别矢量中有c_w个这样的分段，所以当只考虑权重w的分段时，B_w代表在译码后的识别矢量与独立的随机识别矢量之间匹配的数目的二项式概率分布。

对于任何随机识别矢量(与译码的识别矢量无关)，令A是一个随机变量，它代表当只考虑译码的识别矢量中权重1≤w＜m的分段时，在随机识别矢量与译码的识别矢量之间匹配的数目。于是

P (A = a) = \underset{s . l . b_{1} + b_{2} + \cdot \cdot \cdot + b_{m - 1} = a}{\underset{0 \leq b_{m - 1} \leq c_{m - 1}}{\underset{. . .}{\underset{0 \leq b_{2} \leq c_{2}}{\underset{0 \leq b_{1} \leq c_{1}}{Σ}}}}} P (B_{1} = b_{1}) P (B_{2} = b_{2}) \cdot \cdot \cdot P (B_{m - 1} = b_{m - 1}) .

如果总数(population)具有大小y，则阈值t可被计算为最小的正整数，以使得

Σ_{a = l}^{l} P (A = a) \leq \frac{p}{y},

其中虚假确信率是p。

现在将描述另一个可能的算法。有利的是，把更大的重要性与一个权重的分段的匹配相联系，而不是与另一个权重的的分段相匹配。所以，希望能有一个用于计算匹配数目的加权的和值。对于1≤w＜m，令α_w是正整数。

对于任意识别矢量V，令c_w，v是在译码的识别矢量中与在V中相应的分段相匹配的、权重为w的分段的数目(对于1≤w＜m)。然后令用于计算匹配数目的加权的和值是

应当指出，当α_w＝1时，对于1≤w＜m，这等价于以前的策略。

对于任何随机识别矢量(与译码的识别矢量无关)，令A是随机变量，它代表当只考虑译码的识别矢量中权重1≤w＜m的分段时，在随机识别矢量与译码的识别矢量之间匹配的加权和。于是

P (A = a) = \underset{s . l . {a_{1} b}_{1} + {a_{2} b}_{2} + \cdot \cdot \cdot + a_{m - 1} b_{m - 1} = a}{\underset{0 \leq b_{m - 1} \leq c_{m - 1}}{\underset{. . .}{\underset{0 \leq b_{2} \leq c_{2}}{\underset{0 \leq b_{1} \leq c_{1}}{Σ}}}}} P (B_{1} = b_{1}) P (B_{2} = b_{2}) \cdot \cdot \cdot P (B_{m - 1} = b_{m - 1}) .

如果总数具有尺寸y，则阈值t可被计算为最小的正整数，以使得

Σ_{a = l}^{l} P (A = a) \leq \frac{p}{y},

其中虚假确信率是p。

测试表明，使用匹配计数的加权的和值比起非加权的匹配计数来说，有时略好而有时更坏。当然，有可能使用非加权的和多重加权的和值来执行许多测试。在这种情形下，对于每次测试，虚假确信率p必须被减小，以使得来自所有的测试的总的组合的虚假确信率足够低。

实验结果表明，对于1≤w＜m，

α_{w} = \frac{m^{2}}{m - w + 1}

的加权其结果良好。

在不存在串通的情形下，加权和非加权译码策略是等价的，且都工作得非常好。例如，对于(i)只有两个主拷贝，(ii)10000个接收者，(iii)120个分段(例如，2小时电影，每个分段1分钟)，和(iv)10-8的虚假确信率，当只有40个分段产生分段识别数据时，就有可能成功地检测出盗版的拷贝的来源。对于4个主拷贝，为了确定盗版的拷贝的来源，只需要20个分段产生分段识别数据。

然而，串通使得情形变得错综复杂得多。很难确定一组串通者应当采取的最好的串通策略。在不考虑基础指纹技术的串通应答的情况下，串通者的一个策略是这样一种生成识别矢量，它的每个分段至多只有一个识别数据。如果分段模式是已知的(或可被确定的)，则串通者可以简单地通过从他们可得到的已有拷贝中选择不同的分段而形成一个攻击的拷贝(例如，如果有z个串通者，则攻击的版本中1/z个分段来自每个串通者)。

所以，重要的是，攻击者不能够确定电影的哪些部分构成分段。所以，编码方式最好应当这样来规定，即(i)使用大量分段，和(ii)用电影上伪随机地分布的更小的部分来形成每个分段(如以上图4所示的)。这应当使得攻击者隔离开各个分段成为不可能或至少非常困难，这意味着，每个分段将会以所有的或然率产生一个以上的分段识别数据。

替代地，串通者可以选择比如说把帧合在一起取平均的更惯用的串通攻击。在这样的方法中，对基础指纹技术的串通应答是重要的。对于给定的分段，指纹检测器有希望检测到某些或全部分段识别数据。随着分段输入数据内容的数目增加，检测作为盗版的拷贝的来源的用户，会变得更加容易。然而，如果有足够多的串通者，则这样的攻击使得检测器无法在分段的间隔内检测到任何识别数据。所以，重要的是分段足够长，从而足以经受得住预期的攻击(假如是串通或更一般的处理，诸如压缩、改变尺寸等等)。

在(i)保证分段足够长以允许指纹检测器检测出分段识别数据与(ii)保证有尽可能多的分段使得尽可能难地得出分段模式之间必须作出折衷。

减小总数的大小也有助于改进译码。生成一组加指纹的主拷贝后，分段的复接操作就可开始产生用于分发的加指纹的拷贝。同时，随着背景处理，可以生成新的加指纹的主拷贝组。一旦完成这一点，就可以使用这些主拷贝作为替代。这有效地减小了每个主拷贝组的总分发数的大小。替换地，在使用老的主拷贝以外还可以使用新的主拷贝。由此，增加了用于将来的拷贝的主拷贝数目。这个过程将在下面参照图10进行描述。

在不是每个分段产生输入数据内容的情形下(这或许是因为处理操作或摄像机盗版被应用到内容上)，现在将描述通过使用聚集的分段以试图从这些分段得出识别数据的技术。当然，这假设分段曾经打算载有识别数据。从分段模式和主拷贝的性质(即，一个主拷贝是未加指纹的文件吗？)，将能获知对于每个分段是否预期有识别数据。这确实指出使用所有的加指纹的主拷贝(而不是一个未加标记的加指纹的主拷贝)的优点，因为预期每个分段将载有某种识别数据。

参照图9，在步骤600，分析分段以搜寻识别数据。在步骤610，进行关于所有的分段是否至少产生一个识别数据的检测。如果这是真实的，则处理过程(有关于分析分段)结束。如果这不真实的，则控制进到步骤620。

在步骤620，对于那些预期会有识别数据但还没有得到识别数据的分段进行是否可被聚集的检测。基本上，这个问题可被看作为：检测一个以上的分段是否没有按预期地产生识别数据。

如果回答是“否”，即，只有一个这样的分段，于是处理过程结束。如果回答是“是”，则控制处理过程进到步骤630，在该步骤630，未成功译码的分段被聚集。

聚集分段的处理可以以几个阶段实现。例如，如果几个分段预期载有识别数据但在译码时没有产生这样的识别数据，则分段可被成对地组合成任意的编组(或许，不成功地译码的分段的临时相邻的那些对可被组合)。在这种情形下，如果有奇数个分段，则其中的一个对可以由三个分段的组组成。或例如可以应用不同的法则，以使得不成功地译码的分段被聚集成三个分段的组，等等。聚集的分段然后被传送回步骤600，以用于重复分析，以便试图检测识别数据。

当然，有可能是，组成一个聚集的分段的那些不成功地译码的分段正好都载有相同的识别数据。在这种情形下，分段聚集将意味着译码器更可能检测识别数据。(通常，加指纹的视频材料的分段越长，译码器越可能检测到识别数据。)如果分段没有载有相同的识别数据，则仍旧有机会靠聚集分段来帮助检测，或替换地，随着组成聚集分段的初始分段的组变大，更有可能在两个或更多初始分段中载有相同的识别数据。

所以，在进行一个阶段的聚集分段后，如果仍有两个或更多不成功译码的(聚集的)分段，则可进行另一个聚集的阶段。这可以以迭代方式重复进行，直至只留下一个不成功译码的聚集的分段为止。

图10示意地显示另一个生成主拷贝的操作。在本例中，使用三个并行指纹编码器，称为编码器1、2和3。图10被划分成四列，显示在最左面三列上编码器1、2和3的运行，以及在最右面一列上组合器/刻录机装置(80、110、或90、120)。

在编码的第一阶段，编码器生成三个主拷贝M₁、M₂、M₃。这三个主拷贝被组合，并从这三个主拷贝产生DVD。

一旦产生三个主拷贝，编码器然后就可任意产生三个另外的主拷贝M₄、M₅、M₆。在准备这些另外的主拷贝的期间，由组合器/刻录机产生的DVD基本上只根据M₁到M₃。然而，一旦另外的主拷贝M₄到M₆是可提供的，组合器/刻录机有可能根据以下各项来产生版本：

·只是主拷贝M₄到M₆

·全部的M₁到M₆，或

·它们的任何排列组合

处理过程可以迭代地继续进行。通常，通过使用当前的技术，预期要花费在产生一个加指纹的主拷贝时的十倍时间来完成单个输出版本的组合和写入。

虽然本发明的说明性实施例在这里是参照附图详细说明的，但应当看到，本发明并不限于这些精确的实施例，以及可以由本领域技术人员作出各种改变和修正，而不背离如附属权利要求规定的本发明的范围和精神。

Claims

1.检测输入数据内容的版本的方法，其中：

所述方法包括以下步骤：

(i)相对于所述输入数据内容的分段检测识别数据；

2.按照权利要求1的方法，包括从相对于所述输入数据内容的分段检测到的所述识别数据中得出所述阈值数的步骤。

3.按照权利要求2的方法，其中所述阈值数取决于相对于所述输入数据内容的每个分段检测到的识别数据的事例数目。

4.按照权利要求3的方法，其中所述阈值数被设置为，在相对于输入数据内容的每个分段所检测到的识别数据的事例数目被给定的情况下，使得输入数据内容被不正确地检测为一个确定版本的统计机会小于一个阈值概率。

5.按照前述权利要求中任一项所述的方法，还包括以下步骤：

按照相对于所述输入数据内容的该分段检测到的所述识别数据的事例数目，来对相对于在所述输入数据内容的一个所述分段检测到的识别数据之间的匹配进行加权，所述匹配的和值是匹配的加权和值。

6.按照权利要求5的方法，其中所述加权步骤是：使得一个其中检测到识别数据的多个事例的分段，比起一个其中检测到识别数据的单个事例的分段，对特定版本的检测有更多贡献。

7.按照权利要求5的方法，其中所述加权步骤是：使得一个其中检测到识别数据的多个事例的分段，比起一个其中检测到识别数据的单个事例的分段，对特定版本的检测有更少贡献。

8.按照前述权利要求中任一项所述的方法，还包括以下步骤：

如果相对于所述输入数据内容的两个或更多分段上没有检测到识别数据，则把这些分段组合成两个或更多分段的组，并且相对于所述分段的组合的组检测识别数据。

9.按照权利要求8的方法，还包括以下步骤：

如果相对于所述输入数据内容的两个或更多分段的组没有检测到识别数据，则把所述分段的组迭代地组合成分段的更大的组，并且相对于所述分段的组合的组检测识别数据。

10.按照前述权利要求中任一项所述的方法，其中所述阈值数代表一个小于分段总数的分段数。

11.按照权利要求10的方法，其中所述阈值数代表小于所述分段总数的分段数，所述分段具有按照一个识别数据模式的相关识别数据。

12.按照前述权利要求中任一项所述的方法，其中所述数据内容的版本是通过相应的识别模式而可识别的，所有的所述分段依据所述相应的识别模式基本上具有各自的识别数据。

13.一种创建输入数据内容的指纹版本的方法，所述方法其特征在于以下步骤：

14.按照权利要求13的方法，接着是以下步骤的一次或多次迭代：

(iii)生成所述输入数据内容的m个另外的主拷贝，其中m是1或大于1，每个所述m个主拷贝载有相对于所有其他主拷贝独特的各自识别数据；以及

(iv)通过从所述m个主拷贝中选择分段来生成所述输入数据内容的另外的版本，一组主拷贝包括所述m个主拷贝或所有生成的主拷贝组，从而按照分段模式，所述输入数据内容的每个版本载有来自所述主拷贝的识别数据。

15.按照权利要求13或14的方法，其中，在步骤(i)中，全部所述主拷贝载有相对于其他所述主拷贝是独特的各自的识别数据。

16.按照权利要求14或15的方法，其中步骤(iv)包括通过从所述m个主拷贝中选择分段而生成所述输入数据内容的另外的版本。

17.按照权利要求14或15的方法，其中步骤(iv)包括通过从包含所述m个主拷贝的一组主拷贝中选择分段而生成所述输入数据内容的另外的版本。

18.按照权利要求17的方法，其中步骤(iv)包括通过从所有生成的主拷贝的组中选择分段而生成所述输入数据内容的另外的版本。

19.按照权利要求13的方法，其中至少大多数所述分段包括两个或更多非相邻的子分段。

20.按照前述权利要求中任一项所述的方法，其中所述数据内容包括具有多个接连的图像的视频内容。

21.按照权利要求20的方法，其中所述识别数据被编码在代表至少一些所述图像的所述数据内。

22.按照权利要求21的方法，其中所述识别数据被编码在至少一些所述图像的空间频率分量的子集内。

23.用于检测输入数据内容版本的设备，其中：

所述设备包括：

比校器，用来比较所述检测的识别数据与相应于所述数据内容的不同版本的分段模式；以及

24.用于创建输入数据内容的指纹版本的设备，所述设备包括：

25.按照权利要求24的设备，还包括：

主拷贝生成器控制器，用于生成所述输入数据内容的m个另外的主拷贝，其中m是1或大于1，所述m个另外主拷贝中的每个主拷贝载有各自的识别数据，它相对于所有其他主拷贝是独特的；以及

版本生成器控制器，用于通过从所述m个主拷贝中选择分段而生成所述输入数据内容的另外的版本，一组主拷贝包括所述m个主拷贝或所有生成的主拷贝组，从而按照一个相关的分段模式，所述输入数据内容的每个版本载有来自所述主拷贝的识别数据。

26.按照权利要求24或25的设备，

其中所述分段模式使得至少一个所述分段在所述输入数据内容内是不相邻的。