CN1771532A - 埋置数据通道的更新 - Google Patents
埋置数据通道的更新 Download PDFInfo
- Publication number
- CN1771532A CN1771532A CNA2004800093829A CN200480009382A CN1771532A CN 1771532 A CN1771532 A CN 1771532A CN A2004800093829 A CNA2004800093829 A CN A2004800093829A CN 200480009382 A CN200480009382 A CN 200480009382A CN 1771532 A CN1771532 A CN 1771532A
- Authority
- CN
- China
- Prior art keywords
- data
- buried
- data channel
- information
- spectral shape
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003595 spectral effect Effects 0.000 claims abstract description 72
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000005070 sampling Methods 0.000 claims description 45
- 238000007493 shaping process Methods 0.000 claims description 16
- 238000001228 spectrum Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 9
- 238000003780 insertion Methods 0.000 claims description 8
- 230000037431 insertion Effects 0.000 claims description 8
- 238000011002 quantification Methods 0.000 claims description 5
- 230000001360 synchronised effect Effects 0.000 claims description 5
- 230000002441 reversible effect Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 2
- 230000004048 modification Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 239000012634 fragment Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Circuits Of Receivers In General (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
本发明涉及与具有包括埋置数据通道(30,32,34,36)的音频采样的媒体信号有关的方法、设备、媒体信号以及记录介质。在媒体信号的音频采样中提供的埋置数据通道(30,32,34,36),包括关于埋置数据通道(30,32,34,36)的频谱形状的信息。采用这样的方式,埋置数据通道(30,32,34,36)中的数据可以以简单方式而被更新,而不用必须分析该媒体信号。
Description
技术领域
本发明通常涉及消费电子产品领域,更具体而言,涉及在媒体信号音频采样中提供的附加数据的更新。
背景技术
存在一种需求,即需要提供与媒体信号音频采样有关或无关的附加可检索信息。此附加信息可以是诸如附加注释之类的事情,例如可显示的副标题或文本、附加声道、多种语言的语音业务、卡拉OK或视频。该信息还可以是关于允许内容买主进行复制的次数的信息。
WO-A-95/18523描述了在这种附加数据的编码声音采样的最不重要的比特中使用埋置数据通道(buried data channel)。该文献还描述了使用特殊处理,以便确定多少采样可以用于数据通道。在这一方面,分析了声音频谱,并且确定了屏蔽误差,在屏蔽误差之下,为了不被觉察,将提供对埋置数据通道中信息的影响。
存在与此有关的需求,即需要内容买主能够更新附加数据。一个这样的示例是,可能允许某一内容片段的持有者制成该内容的多个复制品。因此如果内容能够包括可以由用户影响的附加信息,例如改变复制计数器的数值,则是有利的。其它示例可包括将自己的注释插入音频片段。
当更新埋置数据通道中的数据时,经常执行所谓的实际音频信号的串联编码(tandem coding),这意味着媒体信号的采样经历多步编码与解码。在这完成时,附加信息的频谱形状丢失,这意味着为了将新的附加数据插入采样中,将必须再次重复上述的分析,以便确定如何无觉察地插入更新的数据。除了执行起来复杂之外,实施此工作的设备还将变得更加昂贵,如果将该设备投入消费市场,则是不利的。
因此,需要一种能够在埋置数据通道中插入数据的方法,该方法允许在没有降低音质和使得执行数据改变/附加的设备更加复杂因而更加昂贵的情况下,改变数据并且能够执行所述改变。
发明内容
因此,本发明的目的在于提供一种方法,用于改变包含音频采样的媒体信号的埋置数据通道中的埋置数据,而不必必须为提供更新的埋置通道而分析媒体信号。
根据本发明的第一方面,此目的通过一种方法实现,该方法允许改变在媒体信号中所提供的埋置数据通道中的数据,而媒体信号包括至少一组数字音频信息的音频采样,所述方法包括如下步骤:
在媒体信号的音频采样中提供具有某种频谱形状的埋置数据通道;
在埋置数据通道中插入有效载荷数据;以及
将对应于埋置数据通道的频谱形状的信息插入埋置数据通道。
根据本发明的第二方面,此目的还通过一种方法实现,该方法改变媒体信号中埋置的数据,而媒体信号包括至少一组数字音频信息的音频采样,所述方法包括如下步骤:
从所述埋置数据通道中提取对应于埋置数据通道的频谱形状的信息,而所述通道包括有效载荷数据并被提供在至少一些音频采样中;
更新有效载荷数据;
在至少一些音频采样中插入包括更新的有效载荷的数据;以及
使用所述频谱形状信息修改具有更新的有效载荷数据的埋置数据通道中数据的频谱形状。
根据本发明的第三方面,此目的另外通过一种设备实现,该设备用于插入信息,所述信息允许改变在媒体信号中所提供的埋置数据通道中的数据,而媒体信号包括至少一组数字音频采样,所述设备包括:
数字媒体源输入,用于接收至少一组数字音频采样;以及
数据插入单元,布置成:
在媒体信号的音频采样中提供具有某种频谱形状的埋置数据通道;
在埋置数据通道中插入有效载荷数据;以及
将对应于埋置数据通道的频谱形状的信息插入埋置数据通道中。
根据本发明的第四方面,此目的还通过一种设备实现,此设备用于改变媒体信号中埋置的数据,而媒体信号包括至少一组数字音频信息的音频采样,所述设备包括:
控制单元,布置成从所述埋置数据通道中提取对应于埋置数据通道的频谱形状的信息,而所述通道包括有效载荷数据,并且在至少一些音频采样中提供所述通道;
埋置数据处理器,布置成更新有效载荷数据;以及
数据插入单元,被布置成使用所述频谱形状信息在至少一些音频采样中插入包括更新的有效载荷数据的数据,以修改具有更新的有效载荷数据的埋置数据通道中数据的频谱形状。
根据本发明的第五方面,此目的还通过一种媒体信号实现,该媒体信号包括至少一组二进制音频信息的音频采样,包括:
在至少一个音频采样中的埋置数据通道,其包括对应于埋置数据通道的频谱形状的信息。
根据本发明的第六方面,此目的还通过一种记录介质实现,该记录介质包括媒体信号,所述信号包括至少一组数字音频信息的音频采样,所述信号包含:
在至少一个音频采样中的埋置数据通道,其包括对应于埋置数据通道的频谱形状的信息。
权利要求3、11、19和26的目的在于,提供关于可用于滤波器的多个系数中的频谱形状的信息。
权利要求4、13和20的目的在于,当在滤波器上应用频谱形状信息时以降低误差的方式提供频谱形状信息。
权利要求5和23的目的在于确定频谱形状信息。
权利要求6和18的目的在于,在埋置数据通道的报头中提供频谱形状信息。
本发明在用更新的埋置数据通道来重新编码媒体信号的音频采样时,具有提供不太复杂和更便宜编码器的优势。
因此,本发明隐含的一般性概念在于提供关于埋置数据通道的频谱形状的信息,而埋置数据通道的频谱形状提供在媒体信号的埋置数据通道中。
表示有效载荷的数据意欲包含具有信息内容的数据,其与用于控制提供埋置数据通道的数据相反。
本发明的这些和其它方面将从下文描述的实施例中显现出来,并参照其阐明本发明的这些和其它方面。
附图说明
现将参照附图更加详细地说明本发明,其中
图1示出了根据本发明使用频谱形状信息的系统的方框示意图;
图2示出了根据本发明将频谱形状信息插入媒体信号采样中的设备的方框示意图;
图3示出了根据本发明的信号,该信号具有多个包含埋置数据通道的音频采样;
图4示出了图3埋置数据通道的报头;
图5示出了根据本发明用于提取和使用来自埋置数据通道的频谱形状信息的设备的方框示意图;
图6示出了根据本发明用于将频谱形状信息插入埋置数据通道的方法的流程图;
图7示出了根据本发明用于提取并使用涉及埋置数据通道的频谱形状信息的方法流程图;
图8示出了根据本发明用于将数据插入埋置数据通道的单元的方框示意图;
图9示出了根据本发明的光盘,在其上存储的媒体信号具有带有频谱形状信息的埋置数据通道。
具体实施方式
本发明涉及在具有音频采样的数字媒体信号中提供附加信息的领域。媒体信号在优选实施例中为音频信号。然而,本发明并不限于音频而可以适用于其它的媒体信号,例如在包括音频采样时适用于视频。
图1示出了根据本发明的设备的方框示意图。该设备包括:发送机一侧的第一设备10,用于在媒体信号的音频采样中提供附加信息,即用于插入允许改变埋置数据通道中的数据的信息;以及接收机一侧的第二设备15,用于提取媒体信号音频采样中的附加信息,以及用于改变媒体信号中埋置的数据。第一设备10包括音频采样源11,其包括多个以PCM(脉冲编码调制)采样形式的音频采样,例如在CD记录中提供的一首或多首歌曲。源11连接可听度确定(audibilitydetermination)或屏蔽误差频谱(masked error spectrum)发生单元13,其提供音频采样的可听度阈值,所述音频采样具有包含1152个采样的帧之类的多个采样的有限部分。单元13连接数据插入单元14,并提供采样S以及可听度阈值信息(用虚线表示),其用于确定埋置数据通道的大小以及用于提供埋置数据通道的频谱形状的滤波器系数。单元14因此具有用于接收PCM采样S的输入以及用于接收可听度阈值信息的输入。数据插入单元14还连接数据提供单元12,其向数据插入单元14提供了将要在PCM采样中埋置的数据D(下文指有效载荷数据)。数据插入单元14在音频采样S中建立埋置数据通道,而在音频采样S中提供有效载荷数据。通道的大小用接收到的可听度阈值信息来确定。数据插入单元14提供包括埋置数据通道的采样S’。设备15在接收单元16接收具有埋置数据通道的PCM采样S’。埋置数据通道中的有效载荷数据D被提取并提供给埋置数据处理器17。接收到的PCM采样S’还提供给音频处理器18,因而甚至在音频处理器的采样中保持埋置数据。设备15还包括数据插入单元19,其基本上具有与设备10中的数据插入单元相同的类型。此单元14从控制单元16接收更新过的数据D’、PCM采样S’以及同步与分配数据和频谱形状信息(用虚线表示)。数据插入单元19提供具有包含有效载荷数据D’的埋置数据通道的PCM采样S”。
数据提供单元12和埋置数据处理器17提供的有效载荷数据D可以采用附加注释的形式,例如可显示的副标题或文本、附加声道、多种语言的语音业务、卡拉OK或视频。该数据还可以包括诸如允许某一内容片段可以进行复制的次数之类的信息。此外该数据还可以包括水印,其在埋置数据处理器17的情况下可以是被改变或更新的水印。
图2示出了数据插入单元14的方框示意图,其包括:第一缓冲器20,用于接收即将插入埋置数据通道的有效载荷数据D;以及第二缓冲器22,用于接收PCM采样S。在第二缓冲器中,PCM采样被量化成更小尺寸的采样,以便提供有效载荷数据D的空间。该方框还包括控制单元24,其基于接收到的可听度阈值信息来确定埋置数据通道的同步与分配信息。控制单元24还确定埋置数据通道的频谱形状,以及即将用于提供此频谱形状的滤波器系数。控制单元24为第一缓冲器20和第二缓冲器22提供信息,该信息是关于每个初始PCM采样S的多少比特将包括埋置数据的信息。基于来自可听度确定单元的信息,动态地完成针对多个采样块的所述确定。控制单元24以及两个缓冲器20、22还连接组合器26,在组合器26中,将数据插入已记录的PCM采样的最不重要的空比特中。控制单元24还向组合器26转发同步与分配信息以及关于埋置数据通道的频谱形状的信息,用于埋置数据通道中的插入。接收机一侧的数据更新单元19包括与发送机一侧单元14相同的单元。只是控制单元略微不同。
CD音频信号一般包括两个通道,即左、右通道,埋置数据可以插入这两个通道中。图3示出了通常在这两个通道中如何提供埋置数据通道。首先将全部采样分成帧Fr,其中一个帧由1152个PCM采样构成。每个帧Fr再分成3个不同的子帧SF0、SF1和SF2。始终可能提供每个PCM采样的两个最不重要比特作为埋置通道,因此可以提供这两个最不重要比特用于包括分配与同步信息的报头,其用于指示埋置有效载荷数据的属性。在图3,示出了帧Fr的两个通道,即左通道LCH和右通道R CH。在每个通道中提供埋置数据通道。右通道R CH包括其全部子帧中的埋置数据通道,而左通道L CH只包括第二子帧SF1和第三子帧SF2中的埋置数据通道。包含埋置通道的子帧的第一采样始终包括带有同步与分配信息的字段或报头30,其附加了CRC校验32。此部分被提供在始终可用的埋置通道的部分中。此信息因此指示埋置数据通道有多大,以及如果大的话,则指示在哪些采样中提供埋置数据通道。根据本发明,报头还包括关于埋置数据通道的频谱形状的信息。取决于PCM采样的属性,更多或较少的比特可以提供用于有效载荷数据34,其中显示出右通道R CH在第一子帧SF0和第二子帧SF1中具有更多的这种空间,而此通道的第三子帧SF2具有甚至更高的容量。左通道L CH在第二子帧SF1中没有任何额外的容量,而它在第三子帧SF2中具有更多的容量。通过先前提及的可听度阈值信息,逐个子帧地决定该容量。此处有效载荷数据34包括上述意欲在接收机一侧处理的数据。在埋置通道的末端,最后的子帧提供有CRC校验46。提供此CRC校验用于有效载荷数据的误差修正。
图4一般性地示出了具有CRC校验32的报头30。报头因而包括同步与分配字段40以及包括关于埋置数据通道的频谱形状信息的字段42,该信息用数字的形式提供。
图5示出了用于改变在PCM采样中埋置的数据的接收机或设备的方框示意图。接收单元16包括:输入缓冲器50,在那里接收PCM采样S’;控制单元52,其从埋置数据通道中提取同步与分配信息以及频谱形状信息,并向音频处理器18提供所有接收到的PCM采样S’。然后,根据该同步与分配信息,将数据有效载荷提供给埋置数据处理器17。例如通过使有效载荷数据中的复制计数器递减或递增,或通过改变水印并将其转发给接收设备的数据插入单元19,埋置数据处理器更新埋置数据的有效载荷。按照相同的方式,可能在制作内容或音频采样的复制品的处理过程时以及在已经做出多步编码和解码之后,音频处理器18还向数据插入单元19提供PCM采样。控制单元52还将频谱形状信息转发给接收设备的数据插入单元。它还转发提取出的同步与分配信息。数据插入单元19然后利用同步与分配信息以及频谱形状信息,将更新后的数据插入埋置数据通道。随后将更详细说明如何完成这一工作。如前所述,数据插入单元19基本上与单元14相同。可是有一个不同。数据插入单元19的控制单元不必确定同步与分配信息,或不必确定埋置数据通道的适宜频谱形状,这是因为这个工作已经完成了。
现参照示出了在发送机和接收机一侧执行的方法步骤的图6和7,简短描述根据本发明的方法。
首先,在具有某一频谱形状的媒体信号的PCM采样中提供埋置数据通道,步骤60。数据通道提供有某一频谱形状,从而埋置数据通道中的数据尽可能不影响对音频的觉察。如前所述,通道的大小还基于采样中音频属性来确定。此后,在报头部分中插入同步与分配信息以及关于通道的频谱形状的信息,步骤62。此后,将有效载荷数据插入通道,步骤64。基于PCM采样的属性,逐个子帧的计算同步与分配信息,频谱形状信息也照此办理。这里,在包括埋置数据通道的每个帧的全部子帧中,提供了同步与分配信息、关于通道的频谱形状的信息以及有效载荷数据。
在接收侧,从埋置数据通道提取同步与分配信息以及关于通道的频谱形状的信息,步骤70。此后,基于这一信息,从埋置数据通道提取有效载荷数据,步骤72。将有效载荷数据提供给埋置数据处理器,埋置数据处理器更新该有效载荷,步骤74。与此同时,音频处理器还处理PCM采样,步骤74,例如通过制作许可的复制品。对于音频的复制品,然后再次在PCM采样中提供埋置数据通道,步骤76。在此通道中,先前提取的有关频谱形状的信息和同步与分配信息一起使用,以便提供通道。此后,将同步与分配信息和频谱形状信息插入最新创建的埋置数据通道的报头中,步骤78。最后跟着的是,将更新过的数据插入埋置数据通道的有效载荷中,步骤79。
在图8中,更加详细地示出了如何执行数据D的插入。随机化单元81利用随机化函数R,使在埋置数据通道中提供的数据D随机化。初始PCM采样S被提供给第一相减单元80,其连接噪声整形单元89的输出,该噪声整形单元89用函数H来整形噪声。此噪声整形单元在一个实施例中为FIR滤波器。第一相减单元80连接第二相减单元82,第二相减单元82还连接随机化单元81的输出。第二相减单元82连接具有量化函数Q的量化单元84,其中量化单元84的输出连接相加单元86,相加单元86还连接随机化单元81的输出。相加单元86还提供输出信号S’。输出信号S’被提供给接收机一侧,但也提供给第三相减单元87,第三相减单元87还连接第一相减单元80。另外,第三相减单元87连接噪声整形单元89的输入。
图8中设备的工作如下。埋置数据通道的数据D被提供给随机化单元81,其根据可逆的随机化函数R使得数据随机化,这些附加的数据将构成音频采样的多个最不重要的比特。随机化可以通过CRC电路提供,CRC电路包括分接式延迟线(tapped delay line)以及对延迟的输入数据比特执行异或组合的多个异或单元。因此这些随机化的最不重要比特按照高频振动的方式来提供,并首先从PCM采样S中减去。从减法中得出的信号然后在量化单元84中被量化,从而从PCM采样中去除多个最不重要比特。如前所述,通过分析可听度阈值以及此情况下PCM采样的屏蔽误差频谱,来动态地确定所去除的比特的数量。然后,数据D以随机化最不重要比特或高频振动的形式,被添加给该量化后的信号,其中插入的比特数量还通过动态分析屏蔽误差频谱来确定。提供该结果作为信号S’,其具有包括埋置数据通道的PCM采样。第三相减单元87提供输入PCM采样S与输出PCM采样S’之间的误差信号,其被提供给噪声整形单元89。噪声整形单元89是噪声整形滤波器,其基于误差信号对白噪声层进行整形,并从输入信号S中减去误差信号。WO-A-95/18523中更加详细地描述了该设备的工作,其在此引入作为参考。
图8中的设备可以用在任一数据插入单元中。然而,由于已经在信号中提供了滤波器系数和定时与分配信息,所以在接收机一侧不需要可听度确定单元及其功能。也不必在数据插入单元的控制单元中确定滤波器系数。这极大地简化了接收侧,并还使其能更加便宜地生产。
插入埋置数据通道报头中的是关于即将在噪声整形单元89中使用的滤波器系数。通过完成这一工作,接收侧不必确定屏蔽误差频谱,并接着基于该频谱确定这些系数,但可以直接在噪声整形单元使用此信息。上述这一点是需要的,因为例如在复制内容的处理过程中,可能执行所谓的串联编码,其中PCM采样经过多步编码和解码。在这些情况下,频谱形状信息通常丢失。如果埋置数据通道中的数据将要改变即:重新插入,则存在风险,即如果未插入白噪声层,可觉察到音质降低。
在埋置数据通道中提供的滤波器参数是浮点参数的量化形,其在优选实施例中为对数面积比的形式。这样做是为了最小化参数绝对值之间的差值,而参数可以是有效的。否则,这些差值可以产生不必要的误差。也存在提供滤波器参数的其它方法。其它方法在于将它们变换到诸如反射或部分自相关(Parcors)参数之类的其它域中。当然,还可以将它们提供为浮点值的直接二进制表示。
上面提到使用高频振动编码函数R编码有效载荷数据。为了解码此数据,埋置数据处理器还包括用于解码该高频振动的逆编码函数R-1。优选不用编码函数R来编码报头,以便更加容易地定位并解码该信息。由于报头的尺寸小,所以无论如何,将可以忽略对音频觉察的影响。然而还可能编码报头。
本发明可以按照许多方式进行改变。例如,可以不使用随机化函数R来提供埋置数据通道中的数据,但是存在风险,即可觉察到音频信号的质量下降。还应当意识到,任何适宜的传输通道可以在发送机与接收机两侧之间提供通道。在接收机一侧的控制单元不必提取用于提供给埋置数据处理器的有效载荷数据。因此,埋置数据处理器还可以直接提供埋置数据通道的新数据,不用接收在那提供的数据。可以逐帧地而不是逐个子帧地决定频谱形状信息以及同步信息。为了提供通道,媒体信号还可以存储在存储介质上,例如CD盘,然后其可以以适宜的方式提供给接收侧。图9示出了一个这样的盘90。另外,不必是音频采样的两个通道,即左、右通道,但本发明恰好可以只使用音频采样的一个通道而工作良好。此外,接收侧还不必处理音频。频谱形状信息也不必提供在更新过的埋置数据通道中。
Claims (28)
1.允许改变数据的方法,所述数据是在媒体信号(S)中所提供的埋置数据通道(30,32,34,36)中的数据,而媒体信号(S)包括至少一组数字音频信息的音频采样,所述方法包括如下步骤:
在媒体信号的音频采样中提供具有某种频谱形状的埋置数据通道(30,32,34,36),(步骤60);
在埋置数据通道中插入有效载荷数据(D),(步骤64);以及
将对应于埋置数据通道的频谱形状(42)的信息插入埋置数据通道中,(步骤62)。
2.根据权利要求1的方法,其中,对应于频谱形状的信息是数字的。
3.根据权利要求1的方法,其中,对应于埋置数据通道的频谱形状的信息,包括关于当更新埋置数据通道的数据时在滤波器中要使用的系数数量的信息。
4.根据权利要求3的方法,其中,所述系数表示为量化的对数面积比(LAR)系数。
5.根据权利要求3的方法,还包括如下步骤:确定埋置数据通道的屏蔽误差频谱;基于屏蔽误差频谱确定滤波器系数;确定在至少一个音频采样中要插入的比特数;以及向滤波器提供所述系数,以便提供埋置数据通道的频谱形状。
6.根据权利要求1的方法,其中,埋置数据通道包括报头(30),并且插入对应于埋置数据通道的频谱形状的信息的步骤包括:在埋置数据通道的报头中插入所述信息。
7.根据权利要求6的方法,还包括如下步骤:在埋置数据通道的报头中插入同步与分配信息(40),而所述信息能够提取埋置数据通道中的数据。
8.根据权利要求1的方法,还包括如下步骤:以编码的高频振动的形式,使将要插入在埋置数据通道中的数据随机化,所述高频振动用于允许解码以便检索数据。
9.改变媒体信号(S)中埋置的数据的方法,而媒体信号(S)包括至少一组数字音频信息的音频采样,所述方法包括如下步骤:
从所述埋置数据通道(30,32,34,36)中提取对应于埋置数据通道的频谱形状(42)的信息,而所述通道包括有效载荷数据(D),并且在至少一些音频采样中提供所述通道,(步骤70);
更新有效载荷数据,(步骤74);
在至少一些音频采样中插入包括更新有效载荷数据的数据,(步骤79);以及
使用所述频谱形状信息修改具有更新的有效载荷数据的埋置数据通道中数据的频谱形状,(步骤76)。
10.根据权利要求9的方法,还包括提取埋置数据通道中的有效载荷数据的步骤,(步骤72)。
11.根据权利要求9的方法,其中,对应于埋置数据通道的频谱形状的信息,包括关于当改变埋置数据通道的数据时在滤波器中要使用的大量系数的信息。
12.根据权利要求11的方法,其中,使用所述频谱形状信息来修改埋置数据通道中数据频谱形状的步骤包括:使用在埋置数据通道中插入包含更新的有效载荷数据时,在噪声整形滤波器中使用的频谱形状系数。
13.根据权利要求11的方法,其中,所述系数表示为量化的对数面积比(LAR)系数。
14.根据权利要求11的方法,其中,所述系数已被变换到另一域中。
15.根据权利要求9的方法,还包括如下步骤:从埋置数据通道中提取同步与分配信息(70);以及基于同步与分配信息,提取埋置数据通道中的数据。
16.根据权利要求9的方法,其中,最初提供在埋置数据通道中的数据是作为允许数据检索的可逆编码的高频振动而被提供的,并且提取步骤包括解码所述高频振动并进一步包括如下步骤:在将数据插入音频采样的步骤之前,用高频振动函数编码包含更新的有效载荷数据的数据。
17.用于插入信息的设备(10),所述信息允许改变在媒体信号(S)中所提供的埋置数据通道(30,32,34,36)中的数据,而媒体信号(S)包括至少一组数字音频采样,所述设备包括:
数字媒体源输入,用于接收至少一组数字音频采样;以及数据插入单元(14),布置成:
在媒体信号的音频采样中提供具有某种频谱形状的埋置数据通道(30,32,34,36);
在埋置数据通道中插入有效载荷数据(D);以及
将对应于埋置数据通道(42)的频谱形状的信息插入埋置数据通道中。
18.根据权利要求17的设备,其中,数据插入单元被布置成在通道的报头(30)中插入对应于埋置数据通道信息的频谱形状的信息。
19.根据权利要求17的设备,其中,对应于道频谱形状的信息包括:关于当更新埋置通道的数据时在滤波器中要使用的大量系数的信息。
20.根据权利要求19的设备,其中,所述系数表示为量化的对数面积比(LAR)系数。
21.根据权利要求17的设备,其中,数据插入单元被布置成插入同步与分配信息(40),而所述信息能够提取埋置数据通道中的数据。
22.根据权利要求17的设备,其中,数据插入单元包括随机化单元(81),按照使用可逆编码函数编码的高频振动的形式,来提供要插入在埋置数据通道中的数据。
23.根据权利要求17的设备,其中,数据插入单元还包括屏蔽误差频谱发生单元(13)和噪声整形单元(89),并进一步被布置成组合高频振动变化的频谱与期望的屏蔽误差频谱,然后将这一信息提供给噪声整形单元,以形成用于组合音频采样的噪声整形信号。
24.用于改变媒体信号(S)中埋置的数据的设备(15),媒体信号(S)包括至少一组数字音频信息的音频采样,所述设备包括:
控制单元(52),被布置成从所述埋置数据通道(30,32,34,36)中提取对应于埋置数据通道(42)的频谱形状的信息,而所述通道包括有效载荷数据(D),并且在至少一些音频采样中提供所述通道;
埋置数据处理器(17),被布置成更新有效载荷数据;以及
数据插入单元(19),被布置成使用所述频谱形状信息在至少一些音频采样中插入包括更新的有效载荷数据的数据,以修改具有更新的有效载荷数据的埋置数据通道中数据的频谱形状。
25.根据权利要求24的设备,其中,控制单元还被布置成提取埋置数据通道中包括的有效载荷数据。
26.根据权利要求24的设备,其中,数据插入单元包括提供埋置数据通道的所述频谱形状的噪声整形单元(89),并且控制单元被布置成提取关于当提取频谱形状信息时在所述噪声整形单元中要使用的大量系数的信息,并将这些系数提供给数据插入单元。
27.包括至少一组数字音频信息的音频采样的媒体信号(S),包括:
在至少一个音频采样中的埋置数据通道(30,32,34,36),其包括对应于埋置数据通道(42)的频谱形状的信息。
28.包括媒体信号的记录介质(90),所述信号包括至少一组数字音频信息的音频采样,所述信号包含:
在至少一个音频采样中的埋置数据通道(30,32,34,36),其包括对应于埋置数据通道(42)的频谱形状的信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03100945 | 2003-04-08 | ||
EP03100945.9 | 2003-04-08 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1771532A true CN1771532A (zh) | 2006-05-10 |
Family
ID=33155220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004800093829A Pending CN1771532A (zh) | 2003-04-08 | 2004-03-31 | 埋置数据通道的更新 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20060069549A1 (zh) |
EP (1) | EP1614103B1 (zh) |
JP (1) | JP2006522949A (zh) |
KR (1) | KR20050122244A (zh) |
CN (1) | CN1771532A (zh) |
AT (1) | ATE362167T1 (zh) |
DE (1) | DE602004006401T2 (zh) |
WO (1) | WO2004090868A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8170883B2 (en) | 2005-05-26 | 2012-05-01 | Lg Electronics Inc. | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal |
ATE476834T1 (de) * | 2006-10-13 | 2010-08-15 | Galaxy Studios Nv | Verfahren und codierer zum kombinieren von digitalen datensätzen, decodierungsverfahren und decodierer für solche kombinierte digitale datensätze und aufzeichnungsträger zum speichern eines solchen kombinierten digitalen datensatzes |
GB2495918B (en) * | 2011-10-24 | 2015-11-04 | Malcolm Law | Lossless buried data |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5212551A (en) * | 1989-10-16 | 1993-05-18 | Conanan Virgilio D | Method and apparatus for adaptively superimposing bursts of texts over audio signals and decoder thereof |
FI89439C (fi) * | 1991-10-30 | 1993-09-27 | Salon Televisiotehdas Oy | Foerfarande foer att dekoda en audiosignal i vilken annan information aer infoerd med anvaendning av maskningseffekt |
FI101439B1 (fi) * | 1995-04-13 | 1998-06-15 | Nokia Telecommunications Oy | Transkooderi, jossa on tandem-koodauksen esto |
WO1997033391A1 (de) * | 1996-03-07 | 1997-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer udn decodierer |
JP3690043B2 (ja) * | 1997-03-03 | 2005-08-31 | ソニー株式会社 | 音声情報伝送装置及び方法並びに音声情報記録装置 |
JPH1132200A (ja) * | 1997-07-09 | 1999-02-02 | Matsushita Electric Ind Co Ltd | 透かしデータ挿入方法及び透かしデータ検出方法 |
FR2781110B1 (fr) * | 1998-07-13 | 2000-08-11 | Alsthom Cge Alcatel | Procede et dispositif de transmission de donnees sur un canal de paroles |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
EP1208499A4 (en) * | 1999-05-19 | 2007-11-07 | Digimarc Corp | METHOD AND SYSTEM WITH DIGITAL WATERMARKS IN MUSIC AND OTHER MEDIA. |
US6748362B1 (en) * | 1999-09-03 | 2004-06-08 | Thomas W. Meyer | Process, system, and apparatus for embedding data in compressed audio, image video and other media files and the like |
JP3507743B2 (ja) * | 1999-12-22 | 2004-03-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 圧縮オーディオデータへの電子透かし方法およびそのシステム |
-
2004
- 2004-03-31 DE DE602004006401T patent/DE602004006401T2/de not_active Expired - Fee Related
- 2004-03-31 CN CNA2004800093829A patent/CN1771532A/zh active Pending
- 2004-03-31 JP JP2006506798A patent/JP2006522949A/ja not_active Withdrawn
- 2004-03-31 EP EP04724677A patent/EP1614103B1/en not_active Expired - Lifetime
- 2004-03-31 AT AT04724677T patent/ATE362167T1/de not_active IP Right Cessation
- 2004-03-31 WO PCT/IB2004/050369 patent/WO2004090868A1/en active IP Right Grant
- 2004-03-31 US US10/552,078 patent/US20060069549A1/en not_active Abandoned
- 2004-03-31 KR KR1020057019125A patent/KR20050122244A/ko not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
DE602004006401D1 (de) | 2007-06-21 |
ATE362167T1 (de) | 2007-06-15 |
EP1614103B1 (en) | 2007-05-09 |
DE602004006401T2 (de) | 2008-01-10 |
WO2004090868A1 (en) | 2004-10-21 |
EP1614103A1 (en) | 2006-01-11 |
KR20050122244A (ko) | 2005-12-28 |
JP2006522949A (ja) | 2006-10-05 |
US20060069549A1 (en) | 2006-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8214220B2 (en) | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal | |
US20090055005A1 (en) | Audio Processor | |
CN1154087C (zh) | 提高低比特率音频编码系统音质的方法、编码器和译码器 | |
US7974840B2 (en) | Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information | |
US20070174053A1 (en) | Audio Decoding | |
CN101652810A (zh) | 用于处理混合信号的装置及其方法 | |
CN1957348A (zh) | 多媒体音乐内容的服务方法和系统 | |
CN102365680A (zh) | 音频信号的编码和解码方法及其装置 | |
US20080288263A1 (en) | Method and Apparatus for Encoding/Decoding | |
CN100489965C (zh) | 音频编码系统 | |
CN1231890C (zh) | 编码设备、解码设备和广播系统 | |
CN1795494A (zh) | 位流水印嵌入 | |
CN1823482A (zh) | 水印嵌入方法和装置 | |
CN1768386A (zh) | 与隐藏数据信道有关的脆弱音频水印 | |
CN1771532A (zh) | 埋置数据通道的更新 | |
CN1722277A (zh) | 直接由编码器硬件生成dvd数据流的系统及方法 | |
CN101361275A (zh) | 处理音频信号的方法和装置 | |
JP5455222B2 (ja) | ディジタルオーディオ信号の音質劣化装置、音質回復装置、及び音質劣化・回復システム | |
CN1894972A (zh) | 在媒体信号中嵌入信号相关属性 | |
CN1702737A (zh) | 音频译码的语音帧计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |