CN100380975C - 用于从压缩多媒体内容中生成散列的方法 - Google Patents
用于从压缩多媒体内容中生成散列的方法 Download PDFInfo
- Publication number
- CN100380975C CN100380975C CNB03814669XA CN03814669A CN100380975C CN 100380975 C CN100380975 C CN 100380975C CN B03814669X A CNB03814669X A CN B03814669XA CN 03814669 A CN03814669 A CN 03814669A CN 100380975 C CN100380975 C CN 100380975C
- Authority
- CN
- China
- Prior art keywords
- signal
- hash
- bit stream
- parameter
- predefined parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000008447 perception Effects 0.000 claims description 24
- 230000005236 sound signal Effects 0.000 claims description 19
- 238000001228 spectrum Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 7
- 230000007704 transition Effects 0.000 claims description 5
- 230000001052 transient effect Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 28
- 238000005516 engineering process Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 230000000007 visual effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005284 basis set Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2347—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving video stream encryption
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/467—Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/835—Generation of protective data, e.g. certificates
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3225—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
- H04N2201/3233—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
- H04N2201/3236—Details of authentication information generation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Security & Cryptography (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
描述了用于生成表示多媒体信号的散列信号的方法和设备。该方法包括接收包括压缩多媒体信号的比特流、从比特流中选择地读取预定参数以及从这些参数中导出散列函数。
Description
技术领域
本发明涉及适合于生成表示多媒体信号的散列信号的方法和设备。
背景技术
散列函数通常使用在密码术领域中,其中这些散列函数通常用于概括和验证大量数据。例如,由MIT(麻省理工学院)的R L Rivest教授开发的MD5算法具有作为输入的任意长度的消息,并且产生作为输出的128-比特“指纹”、“签名”或者输入的“散列”。人们推测两个不同消息具有相同散列在统计上是非常不可能的。所以,这种密码术散列算法是验证数据完整性的有用途径。
在许多应用中,包括音频和/或视频内容的多媒体信号的标识是人们所希望的。然而,可以以各种文件格式频繁发送多媒体信号。例如,存在用于音频文件的若干不同文件格式,如WAV、MP3和Windows媒体,以及存在各种压缩或者质量等级。诸如MD5的密码术散列基于二进制数据格式,并因此将为相同多媒体内容的不同文件格式提供不同散列值。这使得密码术散列不适合概括多媒体数据,为此需要相同内容的不同质量版本产生相同散列或者至少产生相似散列。
对于数据处理是相对恒定的多媒体内容的散列(只要处理保持可接受的内容质量)被称作稳健(robust)概括、稳健签名、稳健指纹、感知散列或者稳健散列。稳健散列捕获利用人类听觉系统(HAS)和/或人类视觉系统(HVS)所感知的音频-视频内容的感知基本部分。
稳健散列的一个定义是与多媒体内容的每个基本时间单位即相对于利用HAS/HVS所感知的内容相似性是连续的半独特的比特序列相关联的函数。换言之,如果HAS/HVS把两段音频、视频或者图像识别为非常相似,则相关联的散列也应当是非常相似的。特别地,原始内容和压缩内容的散列应当是相似的。另一方面,如果两个信号确实代表不同的内容,则稳健散列应当能够辨别这两个信号(半独特)。所以,稳健散列允许内容标识,这是许多应用的基础。
由Jaap Haitsma、Ton Kalker和Job Oostveen在Content BasedMultimedia Indexing 2001,Brescia,Italy,September 2001公开的“Robust Audio Hashing for Content Identification(内容标识的稳健音频散列)”一文公开了一种稳健音频散列技术,并且还公开了采用以下技术的技术方案,该技术允许通过散列内容以及将其与稳健散列值的数据库进行比较来识别未知音频内容。
该提议的技术计算用于音频信号的基本窗口时间间隔的稳健散列值。音频信号因而被划分成帧,并且随后通过傅里叶变换计算每个时间帧的频谱表示。该技术的目的是提供模仿HAS行为的稳健散列函数,即提供模仿收听者将感知的音频信号内容的散列值。
在这种散列技术中,如图1所示,由比特流解码器110接收包括编码音频信号的比特流。比特流解码器对比特流进行充分解码,以产生音频信号。该音频信号随后被传递到成帧单元120。该成帧单元把音频信号划分成一系列基本窗口时间间隔。这些时间间隔最好重叠,以使得从后续帧得到的散列值非常相似。
每个窗口时间间隔信号随后被传送到傅里叶变换单元130,该单元130为每个时间窗口计算傅里叶变换。绝对值计算单元140随后用来计算傅里叶变换的绝对值。执行该计算是因为人类听觉系统(HAS)对相位比较敏感,并且仅仅保留频谱的绝对值,这是因为它对应于人耳将听到的音调。
为了允许对于频谱内预定系列频带中的每一个计算单独的散列值,选择器151、152、......158、159用来选择对应于预期频带的傅里叶系数。用于每个频带的傅里叶系数随后被传送到相应的能量计算级161、162、......168、169。每个能量计算级随后计算每个频带的能量,并且然后把已计算的能量传送到比特导出电路170,该电路170计算散列比特(H(n,x),其中x对应于相应的频带,而n对应于相关的时间帧间隔)并将其发送到输出180。在最简单情况下,这些比特可以是指示能量是否大于预定阈值的符号。通过对应于单个时间帧整理这些比特,为每个时间帧计算散列字。
类似地,由J.C.Oostveen、A.A.C.Kalker,J.A.Haitsma在SPIE,数字图像处理XXIV的应用,2001年7月31日至8月3日,圣地亚哥,USA的文章“Visual Hashing of Digital Video:Application andTechniques(数字电视的可视散列:应用和技术)”公开了用于从活动图像序列中提取基本感知特征的技术,并且通过有效地将短分段的散列值与预先计算的散列值的大型数据库相匹配来识别任何足够长的未知视频分段的技术。
由于该技术涉及可视散列,因此感知特征涉及将利用HVS观看的那些特征,即,其目的是对于HVS认为是相同的内容产生相同(或者相似)的散列信号。所建议的算法看来考虑了从亮度分量或者可选择地从色度分量提取的特征,这些分量是在像素块上计算出的。
在上述的音频和视频稳健散列方案中,从被划分成帧的比特流中解码相应的信息(音频或视频)信号,然后从这些帧中提取感知特征,并用于计算散列信号。
发明内容
本发明的一般目的是提供一种稳健散列技术。
本发明的另一个目的是提供用于确定比特流内编码的多媒体信号的散列的方法和安排。
在第一方面中,本发明提供了一种生成表示多媒体信号的散列信号的方法,该方法包括以下步骤:接收包括压缩的多媒体信号的比特流;从比特流中选择地读取预定参数;以及从所述参数中导出散列函数。
在第二方面中,本发明提供了表示多媒体信号的一种散列信号,该散列信号是通过从包括压缩版本的多媒体信号的比特流中选择地读取涉及多媒体信号的感知特性的预定参数而生成的。
在另一方面中,本发明提供了一种被安排来生成表示多媒体信号的散列信号的设备,该设备包括:接收机,被安排来接收包括压缩多媒体信号的比特流;解码器,被安排来从比特流中选择地读取预定参数;处理单元,被安排来从所述参数中导出散列函数。
在从属权利要求中定义了本发明的其它特征。
附图说明
为了更好地理解本发明,并且为了更好地显示本发明的实施例如何可以实现,现在参考附图通过实例对本发明进行详细说明,其中:
图1是用于从比特流内编码的音频信号中提取散列信号的已知安排的示意图;和
图2是根据本发明的一个实施例用于从编码的多媒体信号中提取散列信号的安排的示意图。
具体实施方式
现有技术的稳健散列方案要求从已编码信号(即比特流)中解码相应信息信号,对已解码的信息信号进行抽样,以提取相关的感知信息。该感知信息随后被用来确定散列函数。
本发明人已经认识到,传输信号的完全解码是不需要的。相反,在许多实例中,可以从比特流表示中直接确定散列函数。
通常使用源编码对多媒体信号进行编码,以形成信息源的有效描述。然后,可以在比特流中有效地发送源编码的数据。
为了使多媒体信号在解码时可以被识别,编码信号必须包含涉及多媒体信号的感知特征的信息。例如,变换、子带和参数编码的音频信号都包含音频信号的频谱表示。
本发明人还认识到,这样的感知信息可以从包含编码多媒体信号的比特流中进行提取,并且直接用来计算散列函数,而不对整个比特流信号进行解码。这改善了正常的散列函数计算,而正常的散列函数计算需要对已编码比特流的解码进行相对复杂的运算,并且还需要对已解码多媒体信号的频谱表示(或其它感知特性)进行后续推导。
接着,对于预定频带组中的每个频带,计算特定(不一定标量)的特征特性。在该描述中,假定一个频带拥有表示已编码信号的频率范围的一个或多个频谱值。这种特性的实例是功率谱密度的能量、音调和标准偏差。一般来说,所选的特性可以是感知系数的任何预定函数。在实践上,业已证实能量差的符号(同时沿着时间和频率轴)是对于多种处理非常稳健的特性。
随后把稳健特性转换成比特,每个比特指示相应帧的频带内的能量改变,一帧的所有比特表示该帧的散列。
图2示出了适于从并入已编码的多媒体信号的比特流中直接计算散列函数的设备。现在将结合一个变换编码的音频信号说明该设备的操作。
变换编码器通常被称作频谱编码器,因为根据频谱分解来描述信号(在所选的基集中)。计算谱项,以重叠(通常具有50%重叠)连续的输入数据块。因而,变换编码器的输出可以被视为一组时间序列,每个频谱项一个序列。
因而,在进行变换编码时,将过滤输入音频信号,从而得到大量的频谱系数。通常,这些系数在被表示为比例因子带的频带中被分组,这类似于非均匀频率划分,比如ERB格栅(等效矩形带宽格栅)。对于每个比例因子带,在定标频谱系数的比特流中编码一个比例因子。根据感知模型来量化所得到的频谱系数,并且随后将其编码成比特流表示。
图2显示了被安排成接收这样的比特流的设备200的示意图。在选择比特流解码器210的输入上接收比特流。解码器210被安排成从涉及多媒体信号的预定参数的比特流中选择地提取比特。这些预定参数随后用于确定散列函数。在变换编码音频信号的优选实施例中,从比特流中提取每个比例因子带的比例因子(和可选择地提取频谱值)。随后处理这些比例因子和频谱值,以获得能量。原则上,比例因子仅仅提供能量的估算。如果还考虑频谱值,则能够使估算更加精确。在最简单的情况下,这些值然后用来计算散列函数。
然而,在优选实施例中,这些值随后被传送给计算单元260、261、......2631、2632。每个计算单元对应于独立的ERB频带,并且用来从每个比例因子带的已解码比例因子(以及选择地从频谱值)中导出每个ERB频带的能量估算。在优选实施例中,ERB频带具有对数间隔,第一频带开始于300Hz,并且每个后续频带具有高达3000Hz最大频率的一个乐音(musical tone)的带宽(对于HAS的最相关的频率范围)。
为了导出多媒体信号的每帧的二进制散列字,随后把能量变换成比特。通过计算可能不同的帧的能量的任意函数来分配这些比特,并且然后将其与一个阈值进行比较。该阈值本身还可以是能量值的另一个函数的结果。
在该优选实施例中,比特导出电路270把频带的能级转换成二进制散列字。
如果帧n的频带m的能量用EB(n,m)来表示,并且帧n的散列H的第m比特用H(n,m)来表示,则散列串的比特可以被正式定义为:
为了计算这些值,对每个频带,比特导出电路270包括第一减法器271、帧延迟器272、第二减法器273和比较器274。在优选实施例中,包括33个能级,或者因而将音频帧的频谱的33个能级转换成32比特散列字,即H(n,m)。对于音频信号的每个时间帧计算独立的散列字,借助于散列字的级联形成整个散列函数。
这样计算的连续帧的散列字可以存储在缓存器或者其它的存储器中,并且被计算机用来进行匹配处理,即通过将其与以相同方式计算的散列值的数据库进行比较,匹配比特流中编码的多媒体信号。
虽然已经参考特定类型的编码方案说明了上述实施例,但是本领域技术人员将会明白上述实施例也可以适用于存储感知信息的任何编码技术方案。
对于现存的每种编码技术方案而言,还存在“语法描述”和“解码器描述”。这样的描述可以是标准化的或者是专有的。语法描述包含比特流的结构,以及如何向比特流写入或者从比特流中提取(读取)已编码的参数。解码器描述说明了如何对这些提取的参数进行解码以及随后生成多媒体输出。因而,对于任何给定的特定编码方案,利用语法描述,有可能定位涉及希望的感知信息的希望的特定参数。因而,可以提取这些参数而无需充分分析或者解码该比特流。
例如,在子带编码器中,编码处理类似于变换编码器中使用的编码处理。对音频输出信号进行滤波,从而得到有限数量的子信号。每个子信号表示固定大小的频带中的信号值。然后,根据感知模型来量化如此获得的子信号,并且随后将其编码成比特流表示。在比特流中对这些信号值以及定标这些信号值的比例因子进行编码。
因而,为了从子带编码描述中计算出散列函数,从比特流中提取每个子带的比例因子。可选择地,如果需要更精确的能量估算,则从比特流中提取信号值,即实际的(定标的)频谱值。接着将提取的参数转换成能量。然后将对应于“临界”频带的子带内的能量分组。临界频带是那些已经被确定为包含形成稳健散列所需要的希望感知信息的预定频带。
在临界带未精确地匹配子带边界的情况下,通过使用例如线性内插(或内插的任何其它希望顺序)得到子带能量的小数部分,可以进行临界频带内的能量估算。
因为在相对于图2所述的方法中,为了计算散列函数,可以将该数据传送给导出电路。类似于转换编码,这些比例因子还可以用来进一步减少复杂度。
作为选择,由Philips(菲利浦)开发了参数编码方案,其中利用瞬变、噪声和正弦表示音频信号。该技术方案被公开在Preprint5554,112th AES Convention Munich,10-13 May 2002 由E.Schuijers、B.den Brinker和W.Oomen撰写的文章“Parametriccoding for High Quality Audio(高质量音频的参数编码)”中。
在该技术中,利用频谱分析方法,估算正弦分量。这些预定时间间隔上的正弦分量表示存在于音频信号中的频率。在优选技术方案中,大约每8毫秒更新这些正弦参数。对于编码效率,在类似于对数格栅的ERB格栅上量化这些正弦频率。接着在频率方向以及时间方向上对量化后获得的表示级进行差分编码,并将其编码成比特流表示。
为了从参数表示中计算散列函数,提取被包含在参数比特流中的频率,并且在用于散列操作的频率范围内对所提取的频率进行分组。对于每个时间帧和一组(即频带)内的频率,检索振幅(和选择地检索相位信息),以计算频率组内的所有分量的能量。该数据随后可以被用来计算散列函数。
对于低频,相位信息被选择地用作对正弦波中所包含的实际功率有影响的相位信息。根据正弦波的起始相位,功率可能波动。因此,特别地如果多媒体信号包含许多低频分量,则包含相位信息可能是合适的。
在参数表示中,由于在正弦分量中包含音频信号的大部分能量,所以仅仅考虑正弦参数来计算散列函数是合理的。然而,如果需要的话,也可以利用瞬变和噪声分量中所包含的能量的影响。
每个瞬变对象仅仅存在于单个时间帧中。以与正弦对象相同的方式,瞬变对象内所包含的频率在频带内被成组,对应的振幅和相位信息有助于频带内的总能量。当瞬变对象内的正弦波用包络函数进行加权时,当确定每个分量的能量时,也需要考虑该包络函数。
噪声分量中所含的能量的内含物比较复杂,并且将明显增加计算复杂性。然而,通过集中于噪声信号的主正弦分量,可以获得足够可靠的特征信号,因而允许从这些正弦分量中构成散列字。
本领域熟练技术人员将会明白,各种未具体描述的实施将被理解为落入本发明的范围内。例如,虽然仅仅描述了散列生成设备的功能,但是本领域普通技术人员将会明白,该设备可以被实施为数字电路、模拟电路、计算机程序或其组合。
同样地,虽然已经参考特定类型的编码技术方案描述了上述实施例,但是应当明白,本发明可以适用于其它类型的编码技术方案,特别是在传送多媒体信号时包含涉及感知有效信息的系数的编码技术方案。
许多编码技术方案将多媒体信号同时划分成预定时间帧和用于每个时间帧的感知特征的块。例如,对于每个图像,视频信号可以被划分为像素的正方形块。同样地,音频信号可以被划分为多个预定频带。如果希望从不匹配编码方案中使用的时间帧和/或感知特征块中计算出散列函数,将认识到,可以对涉及从比特流中提取的感知特征的分量执行进一步处理,以便根据在编码方案中使用的时间帧或者感知块来估算落入希望时间帧和/或感知块内的多媒体信号的特性。
读者可以将注意力放到与本申请的说明书同时提交或者在前提交的并且利用该说明书对于公众查阅是开放的所有论文和文献,并且所有这样的论文和文献的内容作为参考在此引用。
本说明书(包括任何权利要求、摘要和附图)中公开的所有特征和/或所公开的任何方法或处理的所有步骤可以在任意组合中进行组合,但不包括其中至少某些这样的特征和/或步骤是互斥的组合。
该说明书(包括任何权利要求、摘要和附图)所公开的每个特征可以利用用于相同、等同或者类似目的的可选特征来替代,除非另有说明。因此,除非另有说明,所公开的每个特征仅仅是等同物或者类似特征的一般系列的一个实例。
本发明并不限于上述实施例的细节。本发明扩展到该说明书(包括任何权利要求、摘要和附图)所公开的特征的任何新的特征或者任何新的组合,或者扩展到所公开的任何方法或者处理的步骤的任何新的步骤或者任何新的组合。
应当理解,在本说明书中,单词“包括”并不排除其它元件或者步骤的存在,“一”或者“一个”并不排除多个,并且单个处理器或者其它单元可以完成权利要求书中所述的若干装置的功能。
Claims (10)
1.一种生成表示多媒体信号的散列信号的方法,该方法包括以下步骤:
接收包括压缩多媒体信号的比特流;
从比特流中选择地读取预定参数;和
从所述参数中导出散列信号,
其中所述预定参数涉及多媒体信号的感知信息。
2.根据权利要求1所述的方法,其中多媒体信号至少包括音频信号、视频信号和图象信号之一。
3.根据权利要求1所述的方法,其中至少使用变换编码、子带编码和参数编码之一来压缩多媒体信号。
4.根据权利要求1所述的方法,其中所述预定参数至少涉及以下之一:频带的能量;频带的振幅;频带的音调;视频信号的区域的亮度;和视频信号的区域的色度。
5.根据权利要求1所述的方法,其中该方法还包括以下步骤:
分析已接收的比特流,以确定用于压缩多媒体信号的解码方案。
6.根据权利要求5所述的方法,其中所述分析步骤包括将比特流的特性与包含许多编码方案的特性的数据库进行比较。
7.根据权利要求1所述的方法,其中选择地读取预定参数的所述步骤包括:
通过使用语法描述在比特流内定位所述预定参数;
读取被定位的预定参数;和
使用解码器描述来解码预定参数。
8.根据权利要求1所述的方法,其中所述预定参数涉及第一组频带,并且其中导出散列信号的步骤包括从预定参数中导出存在于第二组频带中的频谱信息的值的估算,然后从估算的值中计算散列信号。
9.根据权利要求1所述的方法,其中使用参数编码方案来压缩所述多媒体信号,以及其中预定参数至少涉及在参数方案内使用的正弦分量、噪声分量和瞬变分量之一。
10.一种用于生成表示多媒体信号的散列信号的设备,该设备包括:
接收机,用于接收包括压缩多媒体信号的比特流;
解码器(210),用于从比特流中选择地读取预定参数;
处理单元(270),用于从所述参数中导出散列信号,
其中所述预定参数涉及多媒体信号的感知信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02077499 | 2002-06-24 | ||
EP02077499.8 | 2002-06-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1663281A CN1663281A (zh) | 2005-08-31 |
CN100380975C true CN100380975C (zh) | 2008-04-09 |
Family
ID=29797222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB03814669XA Expired - Fee Related CN100380975C (zh) | 2002-06-24 | 2003-06-12 | 用于从压缩多媒体内容中生成散列的方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20050259819A1 (zh) |
EP (1) | EP1518414A1 (zh) |
JP (1) | JP2005531024A (zh) |
KR (1) | KR20050013630A (zh) |
CN (1) | CN100380975C (zh) |
AU (1) | AU2003239732A1 (zh) |
WO (1) | WO2004002162A1 (zh) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7824029B2 (en) | 2002-05-10 | 2010-11-02 | L-1 Secure Credentialing, Inc. | Identification card printer-assembler for over the counter card issuing |
US7606790B2 (en) | 2003-03-03 | 2009-10-20 | Digimarc Corporation | Integrating and enhancing searching of media content and biometric databases |
DE102004054549B3 (de) * | 2004-11-11 | 2006-05-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Detektieren einer Manipulation eines Informationssignals |
KR100636232B1 (ko) * | 2005-04-29 | 2006-10-18 | 삼성전자주식회사 | 해시 체인을 이용하여 디바이스들간의 인접성을 검사하는방법 및 장치 |
US20070162761A1 (en) | 2005-12-23 | 2007-07-12 | Davis Bruce L | Methods and Systems to Help Detect Identity Fraud |
US8224018B2 (en) | 2006-01-23 | 2012-07-17 | Digimarc Corporation | Sensing data from physical objects |
US8077905B2 (en) * | 2006-01-23 | 2011-12-13 | Digimarc Corporation | Capturing physical feature data |
US20080086311A1 (en) * | 2006-04-11 | 2008-04-10 | Conwell William Y | Speech Recognition, and Related Systems |
US8738749B2 (en) | 2006-08-29 | 2014-05-27 | Digimarc Corporation | Content monitoring and host compliance evaluation |
US8707459B2 (en) | 2007-01-19 | 2014-04-22 | Digimarc Corporation | Determination of originality of content |
US8010511B2 (en) | 2006-08-29 | 2011-08-30 | Attributor Corporation | Content monitoring and compliance enforcement |
US9179200B2 (en) | 2007-03-14 | 2015-11-03 | Digimarc Corporation | Method and system for determining content treatment |
US10242415B2 (en) | 2006-12-20 | 2019-03-26 | Digimarc Corporation | Method and system for determining content treatment |
US7984158B2 (en) * | 2007-03-20 | 2011-07-19 | Microsoft Corporation | Web service for coordinating actions of clients |
WO2009004727A1 (ja) * | 2007-07-04 | 2009-01-08 | Fujitsu Limited | 符号化装置、符号化方法および符号化プログラム |
US8141152B1 (en) * | 2007-12-18 | 2012-03-20 | Avaya Inc. | Method to detect spam over internet telephony (SPIT) |
JP5262171B2 (ja) | 2008-02-19 | 2013-08-14 | 富士通株式会社 | 符号化装置、符号化方法および符号化プログラム |
US10631068B2 (en) | 2008-11-26 | 2020-04-21 | Free Stream Media Corp. | Content exposure attribution based on renderings of related content across multiple devices |
US9986279B2 (en) | 2008-11-26 | 2018-05-29 | Free Stream Media Corp. | Discovery, access control, and communication with networked services |
US8180891B1 (en) | 2008-11-26 | 2012-05-15 | Free Stream Media Corp. | Discovery, access control, and communication with networked services from within a security sandbox |
US10880340B2 (en) | 2008-11-26 | 2020-12-29 | Free Stream Media Corp. | Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device |
US10567823B2 (en) | 2008-11-26 | 2020-02-18 | Free Stream Media Corp. | Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device |
US10419541B2 (en) | 2008-11-26 | 2019-09-17 | Free Stream Media Corp. | Remotely control devices over a network without authentication or registration |
US9154942B2 (en) | 2008-11-26 | 2015-10-06 | Free Stream Media Corp. | Zero configuration communication between a browser and a networked media device |
US10334324B2 (en) | 2008-11-26 | 2019-06-25 | Free Stream Media Corp. | Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device |
US10977693B2 (en) | 2008-11-26 | 2021-04-13 | Free Stream Media Corp. | Association of content identifier of audio-visual data with additional data through capture infrastructure |
US9519772B2 (en) | 2008-11-26 | 2016-12-13 | Free Stream Media Corp. | Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device |
US9961388B2 (en) | 2008-11-26 | 2018-05-01 | David Harrison | Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements |
US8886531B2 (en) * | 2010-01-13 | 2014-11-11 | Rovi Technologies Corporation | Apparatus and method for generating an audio fingerprint and using a two-stage query |
US20140064107A1 (en) * | 2012-08-28 | 2014-03-06 | Palo Alto Research Center Incorporated | Method and system for feature-based addressing |
EP2709017B1 (en) * | 2012-09-14 | 2015-05-27 | Barcelona Supercomputing Center-Centro Nacional de Supercomputación | Device for controlling the access to a cache structure |
US10701305B2 (en) * | 2013-01-30 | 2020-06-30 | Kebron G. Dejene | Video signature system and method |
US10567489B2 (en) * | 2013-03-15 | 2020-02-18 | Time Warner Cable Enterprises Llc | System and method for seamless switching between data streams |
CN104602015A (zh) * | 2014-12-31 | 2015-05-06 | 西安蒜泥电子科技有限责任公司 | 一种实时视频监控加密认证方法 |
US10594689B1 (en) | 2015-12-04 | 2020-03-17 | Digimarc Corporation | Robust encoding of machine readable information in host objects and biometrics, and associated decoding and authentication |
CN108701158B (zh) * | 2016-12-30 | 2023-03-10 | 谷歌有限责任公司 | 对信息资源上的内容的基于散列的动态限制 |
KR20200142787A (ko) * | 2019-06-13 | 2020-12-23 | 네이버 주식회사 | 멀티미디어 신호 인식을 위한 전자 장치 및 그의 동작 방법 |
US11922532B2 (en) | 2020-01-15 | 2024-03-05 | Digimarc Corporation | System for mitigating the problem of deepfake media content using watermarking |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1108020A (zh) * | 1992-11-30 | 1995-09-06 | 索尼公司 | 利用通用存贮器对压缩的数字视频信号解码和2/3下降变换的解码器 |
CN1122990A (zh) * | 1994-08-19 | 1996-05-22 | 汤姆森消费电子有限公司 | 音频/视频/数据分量的系统总线 |
US5852664A (en) * | 1995-07-10 | 1998-12-22 | Intel Corporation | Decode access control for encoded multimedia signals |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2675032B2 (ja) * | 1987-12-21 | 1997-11-12 | 株式会社日立製作所 | 伝票圧縮文の作成方法 |
JP2997483B2 (ja) * | 1989-11-08 | 2000-01-11 | 株式会社日立製作所 | 検証用データ生成装置 |
US5987181A (en) * | 1995-10-12 | 1999-11-16 | Sharp Kabushiki Kaisha | Coding and decoding apparatus which transmits and receives tool information for constructing decoding scheme |
US6205249B1 (en) * | 1998-04-02 | 2001-03-20 | Scott A. Moskowitz | Multiple transform utilization and applications for secure digital watermarking |
US8107015B1 (en) * | 1996-06-07 | 2012-01-31 | Virage, Incorporated | Key frame selection |
US6002443A (en) * | 1996-11-01 | 1999-12-14 | Iggulden; Jerry | Method and apparatus for automatically identifying and selectively altering segments of a television broadcast signal in real-time |
US5907619A (en) * | 1996-12-20 | 1999-05-25 | Intel Corporation | Secure compressed imaging |
JPH11164130A (ja) * | 1997-12-01 | 1999-06-18 | Sumikin Seigyo Engineering Kk | 画像改ざん防止方法 |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
JP3768705B2 (ja) * | 1998-11-27 | 2006-04-19 | キヤノン株式会社 | 電子透かし埋め込み装置、出力制御装置及びコンピュータ読み取り可能な記憶媒体 |
JP2000286836A (ja) * | 1999-03-30 | 2000-10-13 | Fujitsu Ltd | 認証装置および記録媒体 |
GB9922904D0 (en) * | 1999-09-28 | 1999-12-01 | Signum Technologies Limited | Method of authenticating digital data works |
US20010032189A1 (en) * | 1999-12-27 | 2001-10-18 | Powell Michael D. | Method and apparatus for a cryptographically assisted commercial network system designed to facilitate idea submission, purchase and licensing and innovation transfer |
JP3683766B2 (ja) * | 2000-01-21 | 2005-08-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 画像処理装置およびその方法 |
US6675174B1 (en) * | 2000-02-02 | 2004-01-06 | International Business Machines Corp. | System and method for measuring similarity between a set of known temporal media segments and a one or more temporal media streams |
US6236341B1 (en) * | 2000-03-16 | 2001-05-22 | Lucent Technologies Inc. | Method and apparatus for data compression of network packets employing per-packet hash tables |
KR100893671B1 (ko) * | 2001-02-12 | 2009-04-20 | 그레이스노트, 인크. | 멀티미디어 콘텐트의 해시들의 생성 및 매칭 |
EP1244221A1 (en) * | 2001-03-23 | 2002-09-25 | Sun Microsystems, Inc. | Method and system for eliminating data redundancies |
US20060047967A1 (en) * | 2004-08-31 | 2006-03-02 | Akhan Mehmet B | Method and system for data authentication for use with computer systems |
WO2007061178A1 (en) * | 2005-09-15 | 2007-05-31 | Samsung Electronics Co., Ltd. | Method and system for protecting broadcast frame |
US8788830B2 (en) * | 2008-10-02 | 2014-07-22 | Ricoh Co., Ltd. | Method and apparatus for logging based identification |
-
2003
- 2003-04-12 US US10/518,264 patent/US20050259819A1/en not_active Abandoned
- 2003-06-12 CN CNB03814669XA patent/CN100380975C/zh not_active Expired - Fee Related
- 2003-06-12 JP JP2004515156A patent/JP2005531024A/ja active Pending
- 2003-06-12 WO PCT/IB2003/002625 patent/WO2004002162A1/en active Application Filing
- 2003-06-12 AU AU2003239732A patent/AU2003239732A1/en not_active Abandoned
- 2003-06-12 KR KR10-2004-7021157A patent/KR20050013630A/ko not_active Application Discontinuation
- 2003-06-12 EP EP03732921A patent/EP1518414A1/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1108020A (zh) * | 1992-11-30 | 1995-09-06 | 索尼公司 | 利用通用存贮器对压缩的数字视频信号解码和2/3下降变换的解码器 |
CN1122990A (zh) * | 1994-08-19 | 1996-05-22 | 汤姆森消费电子有限公司 | 音频/视频/数据分量的系统总线 |
US5852664A (en) * | 1995-07-10 | 1998-12-22 | Intel Corporation | Decode access control for encoded multimedia signals |
Non-Patent Citations (2)
Title |
---|
A CRITICAL EVALUATION OF IMAGE AND VIDEOINDEXING TECHNIQUES IN THECOMPRESSED DOMAIN. MANDAL M K ET AL:.IMAGE AND VISION COMPUTING, GUILDFORD, GB,,Vol.17 . 1999 * |
A ROBUST CONTENT BASED DIGITAL SIGNATUREFORIMAGE AUTHENTICATION. SCHNEIDER M ET AL:.PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP) LAUSANNE, SEPT16-19 ,1996. NEW YORK, IEEE, US,Vol.3 . 1996 * |
Also Published As
Publication number | Publication date |
---|---|
WO2004002162A1 (en) | 2003-12-31 |
US20050259819A1 (en) | 2005-11-24 |
KR20050013630A (ko) | 2005-02-04 |
JP2005531024A (ja) | 2005-10-13 |
AU2003239732A1 (en) | 2004-01-06 |
EP1518414A1 (en) | 2005-03-30 |
CN1663281A (zh) | 2005-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100380975C (zh) | 用于从压缩多媒体内容中生成散列的方法 | |
EP1351401B1 (en) | Audio signal decoding device and audio signal encoding device | |
Li et al. | Steganalysis of QIM steganography in low-bit-rate speech signals | |
US7660720B2 (en) | Lossless audio coding/decoding method and apparatus | |
CN100588124C (zh) | 无损音频解码/编码方法和装置 | |
Liu et al. | Detection of double MP3 compression | |
Li et al. | Detection of quantization index modulation steganography in G. 723.1 bit stream based on quantization index sequence analysis | |
WO2000022605A1 (en) | Efficient watermark method and apparatus for digital signals | |
EP3007168A1 (en) | Encoding device and method, decoding device and method, and program | |
Wu et al. | An approach of steganography in G. 729 bitstream based on matrix coding and interleaving | |
US11869523B2 (en) | Method and apparatus for decoding a bitstream including encoded higher order ambisonics representations | |
US7747435B2 (en) | Information retrieving method and apparatus | |
CN1823482B (zh) | 水印嵌入方法和装置 | |
EP1932239A1 (en) | Method and apparatus for encoding/decoding | |
US7860721B2 (en) | Audio encoding device, decoding device, and method capable of flexibly adjusting the optimal trade-off between a code rate and sound quality | |
JP2005513543A (ja) | マルチメディア信号のqimデジタルウォーターマーキング | |
KR20120006050A (ko) | 혼합 신호를 형성하기 위한 방법 및 장치, 신호를 분리하기 위한 방법 및 장치, 그리고 이에 대응하는 신호 | |
US7099823B2 (en) | Coded voice signal format converting apparatus | |
JP2003316394A (ja) | 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム | |
US20140037110A1 (en) | Method and device for forming a digital audio mixed signal, method and device for separating signals, and corresponding signal | |
Organiściak et al. | Single-ended quality measurement of a music content via convolutional recurrent neural networks | |
Yang et al. | Multi-stage encoding scheme for multiple audio objects using compressed sensing | |
JPH09146593A (ja) | 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置及び音響信号復号化装置 | |
Stoica et al. | An analysis of steganographic and steganalytic schemes for AAC. | |
Welburn et al. | Object-coding for resolution-free musical audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080409 Termination date: 20100612 |