CN1810034A - 增加具有极少频率分量的媒体信号中附加数据的可检测性 - Google Patents

增加具有极少频率分量的媒体信号中附加数据的可检测性 Download PDF

Info

Publication number
CN1810034A
CN1810034A CNA2004800171461A CN200480017146A CN1810034A CN 1810034 A CN1810034 A CN 1810034A CN A2004800171461 A CNA2004800171461 A CN A2004800171461A CN 200480017146 A CN200480017146 A CN 200480017146A CN 1810034 A CN1810034 A CN 1810034A
Authority
CN
China
Prior art keywords
media signal
signal
additional data
media
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004800171461A
Other languages
English (en)
Inventor
M·范德维恩
A·N·勒马
J·F·阿普雷
A·A·M·L·布鲁克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1810034A publication Critical patent/CN1810034A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32154Transform domain methods
    • H04N1/3216Transform domain methods using Fourier transforms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32203Spatial or amplitude domain methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32352Controlling detectability or arrangements to facilitate detection or retrieval of the embedded information, e.g. using markers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8358Generation of protective data, e.g. certificates involving watermark
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0052Embedding of the watermark in the frequency domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0065Extraction of an embedded watermark; Reliable detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3269Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs
    • H04N2201/327Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs which are undetectable to the naked eye, e.g. embedded codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

本发明涉及在媒体信号中嵌入附加数据的方法、设备、媒体信号以及信息存储媒体。第一加法单元(12)将媒体信号(x)与噪声信号(n)混合,以提供修正媒体信号(x+n);并且组合器单元(14)通过把修正媒体信号与附加数据相乘,将附加数据(w)与修正媒体信号(x+n)组合,以提供主修正媒体信号(mw)。以这样的方式,如果媒体信号(x)包含极少频率分量,则能够在输出信号(y)中利用较高确定性来检测附加数据。

Description

增加具有极少频率分量的媒体信号中附加数据的可检测性
技术领域
本发明一般涉及在媒体信号中提供附加数据的领域,并且更特别涉及在媒体信号中嵌入附加数据的方法、设备、信号和信息存储媒体。
背景技术
随着因特网的发展,有可能访问或检索实际上无限量的信息内容。随后,能够由不同的内容提供商以不同形状和形式的媒体信号的形式提供内容。例如,能够以压缩或未压缩形式作为音频信号提供媒体信号,以压缩或未压缩形式作为图像信号提供媒体信号,以及以压缩或未压缩形式作为视频信号提供媒体信号。为了禁止未授权的人员非法获取媒体内容或进行内容的非法拷贝,需要内容拥有者保护其内容。为此,他们时常需要在媒体数据中提供附加信息。附加信息也能够由于其它原因而被提供,类似于例如为了提供与一段音频(例如,民歌中的词句)有关的文本。
在媒体信号中提供附加数据的一种使用领域是在Digital RightsManagement(数字权利管理)(DRM)的领域,其中水印形式的附加数据用来指示媒体内容的来源以及有可能指示用户的来源,以禁止媒体内容的非法窜改。
正确和有效的水印检测的可能性大量地依赖于用于把数据嵌入主信号(host signal)中的方法,以及依赖于这个信号的特性。一种频繁使用类型的水印嵌入是所谓的乘法印制水印(multiplicativewatermarking),其中将被印制水印的媒体信号与所述的水印相乘。另一方面,媒体信号通常具有许多不同的频率分量,而有时,它能够具有极少这样的分量。当这些分量极少时,可能难以检测已利用乘法印制水印嵌入的水印。
国际专利申请WO-A-02/15587描述了如何把类似于水印的附加数据加到媒体信号上。这里描述有关正弦波的信号。通过在高频带中添加噪声或者不添加噪声,把二进制代码加到这个高频带中的信号上。在检测时,所获得的数字(即,0和1)序列代表(编码版本)水印信息。因而,该文献描述了用于加性印制水印的技术,其不可应用于乘法印制水印环境中。另外,由于仅在高频带中提供附加信息,这能够容易地使用简单的低通滤波器来滤除掉,因此在稳健性是重要条件时,它是脆弱的并因此不是合适的。
在更稳健的乘法印制水印方案中,实数的多个循环移位的片序列与媒体信号的适当定标的版本相乘,并被加回到原始媒体信号上。在检测时,不同的相关峰值之间的距离传送(编码版本)水印信息。如果主信号包含很少的频率分量,则相关性将是弱的。因此,对于必须使用乘法嵌入技术嵌入到具有极少频率分量的媒体信号中的附加数据,需要更高级的可检测性。
发明内容
因而,本发明的目的是提供在更稳健(即,具有附加数据的较高级可检测性)的媒体信号中,尤其在具有极少频率分量的媒体信号的部分中附加数据的乘法嵌入。
根据本发明的第一方面,这个目的利用在媒体信号中嵌入附加数据的方法来实现,该方法包括以下步骤:
获得媒体信号;
将所述媒体信号的至少一部分与噪声信号混合,以提供修正媒体信号;和
将所述附加数据与所述修正媒体信号组合,以提供第一主修正媒体信号。
根据本发明的第二方面,这个目的也利用用于在媒体信号中嵌入附加数据的设备来实现,该设备包括:
第一加法单元,用于将所述媒体信号的至少一部分号与噪声信号混合,以提供修正媒体信号;和
组合器单元,用于将所述附加数据与所述修正媒体信号组合,以提供第一主修正媒体信号。
根据本发明的第三方面,这个目的还利用媒体信号来实现,该媒体信号包括:
修正媒体信号的至少一部分,包括与噪声信号混合的媒体信号,其中附加数据已与这个修正媒体信号相组合。
根据本发明的第四方面,这个目的也利用信息存储媒体来实现,该信息存储媒体包括:
包含具有修正媒体信号的至少一部分的媒体信号,包括:
与噪声信号混合的媒体信号;
其中附加数据已与这个修正媒体信号组合。
本发明的目的还在于提供用于在媒体信号与修正版本的媒体信号之间(自动)转换的技术,以便有选择地增强对于这个新的主信号乘法嵌入的信息的可检测性。
根据本发明的第五方面,这个目的利用在媒体信号中嵌入附加数据的方法来实现,包括以下步骤:
获得媒体信号,
分析媒体信号,
将所述媒体信号的至少一部分与噪声信号混合,以提供修正媒体信号,和
对于媒体信号的不同部分,依据分析,组合所述附加数据与所述修正媒体信号,以提供第一主修正媒体信号,或者与所述媒体信号相组合。
根据本发明的第六方面,这个目的也利用用于把附加数据嵌入媒体信号中的设备来实现,该设备包括:
第一加法单元,用于将所述媒体信号的至少一部分与噪声信号混合,以提供修正媒体信号,
组合器单元,用于把所述附加数据与所述修正媒体信号组合,以提供第一主修正媒体信号,或者与所述媒体信号组合;和
分析单元,被安排为分析所述媒体信号,并且对于所述媒体信号的不同部分,依据分析,控制与噪声混合的所述媒体信号或所述媒体信号向组合器单元的提供。
权利要求2和16的目的在于使用乘法执行组合。
权利要求5和17的目的在于根据人类感知(human perception)的模型来整形噪声信号。这具有确保附加噪声不可感觉到的优点。
权利要求6和18的目的也在于根据人类感知的模型,利用信号整形函数来整形与所述附加数据组合的修正媒体信号。这具有确保附加噪声和嵌入水印都不可感觉到的优点。
权利要求8、9、10、20、21和22的目的在于对附加噪声定标,把媒体信号加到与所述附加数据组合的修正媒体信号上,并且把未定标的噪声信号添加到与附加数据组合的媒体信号上。这具有为了附加数据的嵌入而提供更可预测控制机制的优点。
权利要求12和23的目的在于分析媒体信号,并依据分析,把附加数据与媒体信号的部分或者与噪声混合的媒体信号相组合。
本发明具有在附加数据被嵌入具有很少频率分量(例如,高音调信号,类似于定调管或羽管键琴的摘录)的媒体信号中时,提供附加数据更好的可检测性的优点。与具有这些特性的普通媒体信号相比,利用本发明,例如,有可能把更容易检测的水印嵌入修正媒体信号中。由于这个较高级的可检测性,即使媒体信号的质量降低,附加数据也保持为可检测的,即,增加正确检测的概率。随后,更容易执行例如已处理媒体信号的法庭追踪。
因而,本发明背后的总思想是:将媒体信号与噪声信号混合,并将附加数据与已按此方式修正的媒体信号组合。
本发明的这些和其它方面从下面所述的实施例中将是显而易见的并将结合这些实施例进行阐述。
附图说明
现在,将结合附图更详细解释本发明,其中:
图1显示了根据本发明第一实施例的用于把水印嵌入修正媒体信号中的设备的方框示意图;
图2显示了可以用于图1的设备中的组合器单元的第一变型的方框示意图;
图3显示了可以用于图1的设备中的组合器单元的第二变型的方框示意图;
图4显示了根据本发明第二实施例的用于把水印嵌入修正媒体信号中的设备的方框示意图;
图5显示了根据本发明第三实施例的用于把水印嵌入修正媒体信号中的设备的方框示意图;
图6显示了根据本发明第三实施例的用于把水印嵌入修正媒体信号中的方法的流程图;
图7显示了根据本发明第四实施例的用于把水印嵌入修正媒体信号中的设备的方框示意图;
图8显示了根据本发明的用于在将水印嵌入原始媒体信号或修正媒体信号之间转换的设备的方框示意图;和
图9显示了CD盘形式的信息存储媒体,在它上面存储有根据本发明的媒体信号。
具体实施方式
本发明涉及在媒体信号中提供附加数据的领域,至少在该信号的部分中具有稀少频率内容。在音频的领域中,这样的信号可以包括来自类似于羽管键琴和定调管的乐器的声音。然而,本发明并不限于音频,而能够应用于其它的媒体信号,例如,类似于视频或数字图像。最好,以水印的形式提供附加数据。然而,应当认识到,本发明并不限于水印,并且附加数据可以是需要在媒体信号中进行检测的任何附加数据,例如,类似于关于歌曲的附加文本。
图1显示了根据本发明第一实施例的用于把附加数据嵌入具有稀少频率内容的媒体信号中的设备10的方框示意图。为此,设备10包括第一加法单元12,该第一加法单元12接收媒体信号x,并且把噪声信号n加到这个媒体信号上,以提供修正媒体信号x+n。媒体信号x在这些环境中时常被称作主信号。修正主信号x+n随后被提供给水印组合器单元14,该组合器单元把水印w形式的附加信号组合在修正主信号x+n中,以便在其输出上提供第一主修正信号mw。最后,在第二加法单元36中,把第一主修正信号mw加回到修正主信号x+n(或主信号x),以提供具有所述附加数据的输出媒体信号y。这里所示出的组合器单元14是滤波器,其应用合适选择的滤波器系数形式的水印w。组合器单元14因而是乘法单元,其通过将修正的主信号x+n与水印相乘来修正修正的主信号x+n。由于修正信号包含比原始信号更多的频率分量,因此水印更容易检测。这里,噪声信号n是附加水印载波,因此噪声信号和主信号承载水印。
然而,具有许多不同频率分量的信号也可以受益于这种类型的嵌入,特别地通过在较高频率范围内插入噪声整形。这将不会明显改善水印的稳健性,但是,对于未处理的水印音频,这可以产生显著更好的检测可靠性。
图2显示了根据本发明的工作在频域中的组合器单元14的第一变型。因此,该组合器单元包括离散傅里叶变换单元16,该单元16接收修正主信号x+n,并将其变换到频域。然后,把变换的修正主信号提供给乘法单元18,该单元18将变换的修正主信号与水印w相乘。水印w在此是频域水印。然后,把印制水印的变换的修正主信号提供给逆傅里叶变换单元20,该单元20把印制水印的变换的修正主信号变换回到时域,并将其提供给乘法单元22。乘法单元22也接收适度(graceful)增加/衰减通/断转换功能的结果。为了提供这个转换,修正主信号x+n因此被提供给使用时间增益函数G的单元24。乘法单元22的输出随后被提供给定标(scaling)单元26,其利用定标参数α来定标相乘的信号。这个相乘与定标的信号随后被提供给第二加法单元36,该单元36也接收修正主信号,并将这些信号加在一起,以形成输出信号y,这是印制水印的主信号。有关根据这个原理的水印嵌入的更多细节被描述在Michiel van der Veen、Fons Breukers、Jaap Haitsma、TonKalker、Aweke Negash Lemma和Werner Oomen在The Proceedingsof the 110-th AES Convention,Amsterdam,The Netherlands,2001年5月的文献“Robust,multi-functional and high-quality audiowatermarking technology(稳健、多功能和高质量音频印制水印技术)”中,该文献在此引用以资参考。
上述的频域组合器单元能够以许多方式进行修正。例如,有可能除去包括放大单元的分支并且也有可能除去定标单元,尽管这将降低信号质量。
图3显示了工作于时域中的组合器单元的另一变型。组合器单元14包括带通滤波器30,其过滤修正的主信号x+n,并提供过滤的信号给乘法单元32,该乘法单元32也接收水印w并将水印w与过滤的修正主信号x+n相乘。乘法单元32的输出连接到定标单元34,定标单元34利用定标参数α来定标印制水印的信号,并将其提供给也接收修正主信号x+n的第二加法单元36。第二加法单元36的输出则是印制水印的主信号y。定标单元34在此对于提供印制水印的信号也不是绝对必需的。水印w在此是时域水印。能够从以下文件中找到有关这个印制水印技术的更多细节:Aweke Negash Lemma,Javier Aprea,WernerOomen和Leon van de Kerhof,IEEE Transactions on SignalProcessing,2003年4月,Vol.51,第1088-1097页上的“A temporaldomain audio watermarking technique(时域音频印制水印技术)”,该文件在此引用以资参考。
上述组合器单元仅仅是能够用于本发明中的乘法组合器单元的实例。应当认识到,也可以替代使用许多其它类型的乘法组合器单元。
图1所示的如此描述的印制水印技术可以被改进,其中人类感知模型可以用来整形噪声信号,以降低可感觉到的失真。所用的模型取决于信号的类型。在媒体信号是音频信号的情况下,该模型是人类听觉系统的心理声学模型,并且在使用纯图像的情况下,使用人类视觉系统的心理视觉模型。
根据本发明第二实施例的用于执行媒体信号中水印嵌入的设备的方框图显示在图4中。图4中的设备基本上包括与图1中的设备相同的组成部分。但是,存在一个差别,即设备10还包括掩蔽(masking)滤波器形式的第一信号整形单元40以及滤波控制单元38。滤波控制单元38接收主信号x,利用人类听觉系统P的心理声学模型来分析这个信号。单元38使用分析的结果来选择滤波器40的滤波器系数。接收噪声信号n的滤波器40利用第一信号整形函数M1来整形该噪声,由此获得整形的噪声信号ns。这个整形的噪声信号ns随后被提供给第一加法单元12,用于与主信号x混合。此后,在水印组合器单元14中以上述方式执行水印的嵌入。滤波器40整形噪声信号,以使之可感觉到地被主信号x掩蔽。如果媒体信号是图像,则该模型替代地将是人类视觉系统的心理视觉模型。
通过也包括使用信号整形函数M2的第二信号整形单元,有可能进一步改变根据本发明的设备,该函数M2也基于滤波控制单元38的信息。根据这个第三实施例的设备被显示在图5的方框示意图中。现在,将相对于显示根据这个第三实施例的方法的流程图的图6描述图5中的设备的功能。噪声相加在这个实施例中与图4中的噪声相加相同。唯一区别在此是:设备10包括第二噪声整形单元44。首先,在步骤48,获得主信号x,例如,通过从其中存储主信号x的存储器中提取它来获得。在步骤50,例如,从噪声生成单元中提供噪声信号n。此后,在滤波器40中使用第一噪声整形函数M1来整形噪声信号n,以获得整形的噪声信号ns,步骤52。随后,由第一加法单元12将整形的噪声信号ns与主信号x相加或混合,以提供修正的主信号x+ns,步骤54。组合器单元14能够例如仅仅是滤波器或图2或3所示的单元之一,其接收修正主信号x+ns并把水印与这个信号组合,以提供印制水印的主修正信号mw,该信号mw也被称作第一主修正信号,步骤56。第一主修正信号mw随后被提供给第二信号整形单元44,该单元44使用由滤波控制单元38确定的第二信号整形函数M2,以提供整形的主修正信号mws或第二主修正信号,步骤58。第二信号整形单元44也以滤波器的形式来提供,滤波器的系数根据上述模型P来设置。函数M2确保在印制水印的信号中没有额外的可感觉到的人工产物。第二主修正信号mws随后被提供给第二加法单元36,该单元36也接收修正主信号x+ns,并把这两个信号加在一起,以提供印制水印的主信号或印制水印的输出媒体信号y,步骤60。以这样的方式,水印利用媒体信号x可察觉地被掩蔽,步骤60。应当认识到,由于噪声信号ns被不可察觉地加到媒体信号上,因此它提供不可察觉的水印通道。
有可能改变所用的功能。作为选择,当媒体信号是音频信号时,可以使用所谓的threshold-in-quite(TQ)功能,以替代上述函数M1和/或M2。在此情况下,噪声被预过滤,以使其落到听觉阈值以下。类似的功能可以用于图像信号和/或视频。
图5和图6所示的根据本发明的第三实施例的设备和方法具有微小的缺点,即噪声信号被两次加到主信号上。这使得印制水印处理的控制稍微不可预测。在图7中以方框示意图显示了用于这个问题解决方案的本发明第四实施例中的设备。在这个设备中没有第一信号整形单元。在此,噪声信号n首先被提供给定标单元62,其利用定标函数δ定标噪声信号。δ在此小于1,并且最好在0.1至0.2之间。随后,向第一加法单元12提供按比例缩小的噪声信号δn,在第一加法单元12中将它加到主信号x上,以提供修正主信号,该信号现在表示为x+δn,因为噪声信号已被按比例缩小。修正主信号随后被传送给组合器单元14,该单元14以前述方式嵌入水印w。组合器单元14的输出连接到第三加法单元64,该单元64也接收未定标的噪声信号n,用于加到印制水印的修正主信号,以提供第一主修正信号mw。信号mw被提供给第二信号整形单元44,该单元44根据前述的函数M2过滤第一主修正信号mw,其中函数M2基于滤波控制单元38中进行的人类听觉系统分析的函数P。来自滤波器44的整形信号mws或者第二主修正信号被提供给第二加法单元36,以便加到原始主信号x上。滤波器44因而确保主修正信号mw利用主信号x被可感觉地掩蔽。以这样的方式,仅在一点上把所有附加信号分量注入主信号x中,这使得控制机制更可预测。
如上所述,噪声信号被添加,以便在主或媒体信号具有少量频率分量时,能够更安全检测水印;其中当信号是音频信号时,所述频率分量可以是声音频率分量,或者当信号是图像信号时,所述频率分量是空间频率分量。然而,音频信号时常不是仅由频谱稀疏声音组成的,而是能够经常在一首音乐的某些段落或部分中具有很少频率分量。因此,在整个媒体信号中可能不需要使用本发明的上述实施例,而只是在其某些片段或者部分中使用本发明的上述实施例。因而,具有能够根据本发明的上述实施例嵌入水印,以及能够依赖于媒体信号特性根据公知原理嵌入水印的需要。
图8显示了用于提供这种功能的设备。该设备根据第一实施例包括第一加法单元12、水印组合器单元14和第二加法单元36。也应当认识到,利用某些微小和简单的修正,根据第二、第三和第四实施例的设备可以容易地适于在图8的设备中使用。在图8中,第一加法单元12接收噪声信号n和主信号x,并且根据上述原理把这些信号加在一起,以形成修正主信号x+n。第一加法单元12的输出经由第一转换器68连接到水印组合器单元14。主信号也经由第二转换器70直接连接到水印组合器单元14。分析单元66使用分析函数A来分析主信号的频率内容,并依据该分析来控制第一和第二转换器,以便在主信号x中频率分量的数量稀疏时第一转换器68把第一加法单元12连接到水印组合器单元14,并且否则第二转换器70把未修正主信号x连接到水印组合器单元14。水印组合器单元14则以前述方式把水印嵌入它所接收的信号中,并且第二加法单元36把第一主修正信号mw添加到未修正主信号x或者修正主信号x+n上,以提供输出信号y。这里,转换器最好是软转换功能,因此适度地进行从一个信号输入到水印组合器单元14过渡到另一个。这意味着,在执行从一种状态到另一种状态的转换时,使得被接通的转换器逐渐地使信号通过,以使得最初它是非常小的或者被衰减,并逐渐上升,直至全部信号通过该转换器。将被断开的正在被断开的转换器以同样的方式逐渐地衰减信号,直至它被完全断开。也最好完成此,以使得被传送给水印组合器单元的总能量在转换之前、在转换期间和在转换之后基本上是单一式的。
应当认识到,转换不一定是软的或者适度的,尽管这是优选的。在不执行软转换的情况下,也许仅提供一个转换器就足够了,这个转换器或把修正主信号或把未修正主信号连接到水印组合器单元14。当使用单个转换器时,还有可能在实现信号的正确转换的任何位置中提供这个转换器,例如,类似于在第一加法单元12之前提供。
输出信号y可以在存储媒体(在图9中示出其CD盘形式的媒体72)上提供。输出信号y还可以在其它类型的存储媒体诸如计算机中的存储器上提供。
因而,已描述了在媒体信号具有很少频率分量时,在媒体信号中相乘地嵌入附加数据的设备和方法。利用本发明,有可能把水印嵌入这样的媒体信号中,这比具有这些特性的普通媒体信号更容易检测。第二实施例确保附加噪声是不可感觉的,并且第三实施例确保附加噪声和嵌入的水印都是不可察觉的。第四实施例具有提供用于水印嵌入的更可预测的控制机制的优点。此外,较高水平的可检测性具有以下优点。附加数据保持为可检测的,即使媒体信号的质量被恶化。因而,更容易执行例如处理的媒体信号的复制控制或法庭追踪。
本发明可以以许多方式来改变。例如,有可能使噪声信号能够包含数据。这可以利用能够使一个随机序列代表“0”并且能够使另一个随机序列代表“1”来实现。以这样的方式,相加和相乘水印可以被集成到单一系统中。如前所述,水印可以在时域以及频域中被嵌入,并且媒体信号可以是任何类型的媒体信号。媒体信号而且能够是音频、视频或者图像信号。在音频的情况下,这可以是未压缩的音频,诸如PCM。然而,本发明还有可能应用于已压缩媒体上,这在音频的情况下可以是MP3比特流。然而,随后,此噪声必须被适当地转换到比特流。因此,本发明将仅仅利用以下的权利要求来限定。

Claims (28)

1、一种在媒体信号(x)中嵌入附加数据(w)的方法,包括以下步骤:
获得媒体信号(x)(步骤48);
将所述媒体信号(x)的至少一部分与噪声信号(n;ns;δn)混合,以提供修正媒体信号(x+n;x+ns;x+δn)(步骤54);和
将所述附加数据(w)与所述修正媒体信号组合(步骤56),以提供第一主修正媒体信号(mw)。
2、根据权利要求1的方法,其中通过将所述修正媒体信号与所述附加数据(w)相乘,执行组合的步骤。
3、根据权利要求2的方法,其中在时域中执行相乘的步骤。
4、根据权利要求2的方法,其中在频域中执行相乘的步骤。
5、根据权利要求1的方法,还包括根据人类感知的模型利用第一信号整形函数(M1)来整形所述噪声信号的步骤(步骤52),以提供将被用于提供修正媒体信号(x+ns)的整形噪声信号。
6、根据权利要求1的方法,还包括根据人类感知的模型利用第二信号整形函数(M2)来整形所述第一主修正媒体信号(mw)的步骤(步骤58),以提供第二主修正媒体信号(mws)。
7、根据权利要求1的方法,还包括把主修正媒体信号(mw;mws)加到所述修正媒体信号上的步骤(步骤60)。
8、根据权利要求1的方法,还包括把主修正媒体信号(mw;mws)加到所述媒体信号上的步骤。
9、根据权利要求1的方法,还包括以下步骤:在混合步骤之前,利用定标因子δ来定标所述噪声信号,以提供将被用来提供修正媒体信号(x+δn)的定标噪声信号。
10、根据权利要求9的方法,还包括把未定标噪声信号加到所述第一主修正媒体信号上的步骤。
11、根据权利要求1的方法,其中所述附加数据是水印(w)。
12、根据权利要求1的方法,还包括以下步骤:分析(A)媒体信号,并且对于媒体信号的不同部分,依据分析,提供所述修正媒体信号(x+n)的一部分或者所述媒体信号(x)的一部分,用于与所述附加数据组合。
13、根据权利要求12的方法,还包括以下步骤:在所述媒体信号与修正媒体信号之间转换,以便于所述附加数据组合,其中转换的步骤最好是适度转换。
14、一种在媒体信号(x)中嵌入附加数据(w)的方法,包括以下步骤:
获得媒体信号(x);
分析(A)媒体信号;
将所述媒体信号(x)的至少一部分与噪声信号(n)混合,以提供修正媒体信号(x+n);和
对于媒体信号的不同部分,依据分析,将所述附加数据(w)与所述修正媒体信号(x+n)或者与所述原始媒体信号(x)组合。
15、一种用于在媒体信号(x)中嵌入附加数据(w)的设备,包括:
第一加法单元(12),用于将所述媒体信号(x)的至少一部分与噪声信号(n;ns;δn)混合,以提供修正媒体信号(x+n;x+ns;x+δn);和
组合器单元(14),用于将所述附加数据(w)与所述修正的媒体信号组合,以提供第一主修正媒体信号(mw)。
16、根据权利要求15的设备,其中组合器单元被安排成:通过将所述修正媒体信号与所述附加数据相乘,将所述附加数据与所述修正媒体信号相组合。
17、根据权利要求15的设备,还包括第一信号整形单元(40),其被安排成:根据人类感知的模型(P),使用第一信号整形函数(M1)来整形所述噪声信号,以提供将被用于提供修正媒体信号的整形噪声信号。
18、根据权利要求15的设备,还包括第二信号整形单元(44),其被安排成:根据人类感知的模型(P),利用第二信号整形函数(M2)来整形所述第一主修正媒体信号,以提供第二主修正媒体信号。
19、根据权利要求15的设备,还包括第二加法单元(36),其被安排成把主修正媒体信号加到所述修正媒体信号上。
20、根据权利要求15的设备,还包括第二加法单元(36),其被安排成把主修正媒体信号加到所述媒体信号(x)上。
21、根据权利要求15的设备,还包括定标单元(62),其被安排成:在与所述媒体信号(x)混合之前,按比例缩小所述噪声信号(δn),以提供将被用于提供修正媒体信号的定标噪声信号。
22、根据权利要求21的设备,还包括第三加法单元(64),其被安排成把未定标噪声信号加到所述第一主修正媒体信号上。
23、根据权利要求15的设备,还包括分析单元(66),其被安排为:分析所述媒体信号(x),并且对于媒体信号的不同部分,依据分析(A),控制向组合器单元(14)提供修正媒体信号的一部分或所述媒体信号的一部分,以便与所述附加数据组合。
24、根据权利要求23的设备,还包括至少一个第一转换器(68),其被安排成:在分析单元的控制下,把所述媒体信号或所述修正媒体信号连接到组合器单元。
25、根据权利要求24的设备,其中具有受分析单元控制的第二转换器(70),其中第一转换器将所述修正媒体信号连接到组合器单元,第二转换器把所述媒体信号连接到组合器单元,并且这些转换器被安排成适度地从一个状态转换到另一状态。
26、一种用于在媒体信号(x)中嵌入附加数据(w)的设备(10),包括:
第一加法单元(12),用于将所述媒体信号(x)的至少一部分与噪声信号(n;ns;δn)混合,以提供修正媒体信号(x+n;x+ns;x+δn);
组合器单元(14),用于将所述附加数据(w)与所述修正媒体信号(x+n)或与所述媒体信号(x)组合,以提供第一主修正信号;和
分析单元(66),被安排为分析所述媒体信号(x),并且对于媒体信号的不同部分,依据分析(A),控制所述修正媒体信号或者所述媒体信号向组合器单元(14)的提供。
27、一种媒体信号(y),包括:
修正媒体信号的至少一部分,包括与噪声信号(n;ns;δn)混合的媒体信号(x),其中附加数据(w)已与这个修正媒体信号(x+n;x+ns;x+δn)组合。
28、一种信息存储媒体(72),包括:
包含具有修正媒体信号的至少一部分的媒体信号(y),包括:
与噪声信号(n;ns;δn)混合的媒体信号(x),
其中附加数据(w)已与这个修正媒体信号(x+n;x+ns;x+δn)组合。
CNA2004800171461A 2003-06-19 2004-06-15 增加具有极少频率分量的媒体信号中附加数据的可检测性 Pending CN1810034A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03101792.4 2003-06-19
EP03101792 2003-06-19

Publications (1)

Publication Number Publication Date
CN1810034A true CN1810034A (zh) 2006-07-26

Family

ID=33547741

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800171461A Pending CN1810034A (zh) 2003-06-19 2004-06-15 增加具有极少频率分量的媒体信号中附加数据的可检测性

Country Status (8)

Country Link
US (1) US20060168448A1 (zh)
EP (1) EP1639826B1 (zh)
JP (1) JP2006527958A (zh)
KR (1) KR20060027351A (zh)
CN (1) CN1810034A (zh)
AT (1) ATE415784T1 (zh)
DE (1) DE602004017993D1 (zh)
WO (1) WO2004112399A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7082413B2 (en) * 1999-11-24 2006-07-25 International Business Machines Corporation System and method for authorized compression of digitized music
EP2362385A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark signal provision and watermark embedding
US10210545B2 (en) * 2015-12-30 2019-02-19 TCL Research America Inc. Method and system for grouping devices in a same space for cross-device marketing
US11095927B2 (en) * 2019-02-22 2021-08-17 The Nielsen Company (Us), Llc Dynamic watermarking of media based on transport-stream metadata, to facilitate action by downstream entity
US11736742B2 (en) 2019-05-10 2023-08-22 Roku, Inc. Content-modification system with responsive transmission of reference fingerprint data feature
WO2020231927A1 (en) 2019-05-10 2020-11-19 The Nielsen Company (Us), Llc Content-modification system with responsive transmission of reference fingerprint data feature
TWI802797B (zh) 2019-05-10 2023-05-21 美商六科股份有限公司 用於檢測和回應於在先前檢測到的指紋匹配之後檢測到的指紋不匹配的方法、非暫時性電腦可讀儲存介質及計算系統
US11234050B2 (en) 2019-06-18 2022-01-25 Roku, Inc. Use of steganographically-encoded data as basis to control dynamic content modification as to at least one modifiable-content segment identified based on fingerprint analysis
US11012757B1 (en) 2020-03-03 2021-05-18 The Nielsen Company (Us), Llc Timely addition of human-perceptible audio to mask an audio watermark

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6104863A (en) * 1990-08-17 2000-08-15 Samsung Electronics Co., Ltd. Video signal encoded with additional detail information
US5613004A (en) * 1995-06-07 1997-03-18 The Dice Company Steganographic method and device
US6611599B2 (en) * 1997-09-29 2003-08-26 Hewlett-Packard Development Company, L.P. Watermarking of digital object
KR100898879B1 (ko) * 2000-08-16 2009-05-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 부수 정보에 응답하여 하나 또는 그 이상의 파라메터를변조하는 오디오 또는 비디오 지각 코딩 시스템

Also Published As

Publication number Publication date
DE602004017993D1 (de) 2009-01-08
US20060168448A1 (en) 2006-07-27
KR20060027351A (ko) 2006-03-27
EP1639826A1 (en) 2006-03-29
ATE415784T1 (de) 2008-12-15
JP2006527958A (ja) 2006-12-07
WO2004112399A1 (en) 2004-12-23
EP1639826B1 (en) 2008-11-26

Similar Documents

Publication Publication Date Title
Lin et al. Audio watermarking techniques
Lie et al. Robust and high-quality time-domain audio watermarking based on low-frequency amplitude modification
CN1969487A (zh) 水印嵌入
JP2008529046A5 (zh)
Dhar et al. Digital watermarking scheme based on fast Fourier transformation for audio copyright protection
Dhar et al. A new DCT-based watermarking method for copyright protection of digital audio
CN1795494A (zh) 位流水印嵌入
CN1810034A (zh) 增加具有极少频率分量的媒体信号中附加数据的可检测性
Nikmehr et al. A new approach to audio watermarking using discrete wavelet and cosine transforms
CN1647186A (zh) 多媒体信号的时域加水印
CN1792096A (zh) 在载体信号中嵌入二进制有效数据片断的设备和方法
JP2007506128A (ja) マルチメディア信号に透かしを入れる装置及び方法
CN1462440A (zh) 水印
JP2005528652A (ja) 独立チャネルのウォーター・マークの符号化および復号化
Maha et al. A blind audio watermarking scheme based on neural network and psychoacoustic model with error correcting code in wavelet domain
KR20070061285A (ko) 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법
Wei et al. Controlling bitrate steganography on AAC audio
Wang et al. A new adaptive audio watermarking algorithm for copyright protection
JP2007514976A (ja) 透かしの埋め込み
Trivedi et al. An algorithmic digital audio watermarking in perceptual domain using direct sequence spread spectrum
Patil et al. Audio watermarking: A way to copyright protection
Xiang12 et al. Analysis of D/A and A/D conversions in quantization-based audio watermarking
Artameeyanant Wavelet audio watermark robust against MPEG compression
WO2011160966A1 (en) Audio watermarking
Tianchi et al. A multiple audio watermarking algorithm based on shear resisting DWT and LSB

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
C20 Patent right or utility model deemed to be abandoned or is abandoned