CN1129114C

CN1129114C - 附加信息嵌入方法和设备,以及附加信息解调方法和设备

Info

Publication number: CN1129114C
Application number: CN00800363A
Authority: CN
Inventors: 佐藤英雄
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1999-03-19
Filing date: 2000-03-21
Publication date: 2003-11-26
Anticipated expiration: 2020-03-21
Also published as: DE60034520D1; DE60034520T2; KR100632723B1; US7299189B1; CN1297560A; EP1087377A1; JP4470322B2; KR20010043700A; EP1087377B1; EP1087377A4; WO2000057399A1

Abstract

一种将附加信息嵌入音频信号的附加信息嵌入方法，其中对音频信号进行改进离散余弦变换变换，计算出改进离散余弦变换系数，沿着频率轴衰减和位移改进离散余弦变换系数，并将所得的结果与原始改进离散余弦变换系数相加，从而将附加信息嵌入音频信号中作为水印。一种接收附加信息嵌入其中的音频信号并解调附加信息的解调方法，包括接收步骤，接收通过沿着频率轴方向衰减和位移并且加入到在原频率轴上的音频信号将附加信息嵌入其中的音频信号；和解调步骤，根据接收信号的、在频率轴上的每个预定间隔上的音频信号的极性解调附加信息。

Description

附加信息嵌入方法和设备，以及附加信息解调方法和设备

技术领域

本发明涉及一种附加信息嵌入方法和设备，用于将能够限制音频信号的记录、禁止传输到另一台设备或保护版权拥有者的利益的信息作为附加信息嵌入音频信号中，并且涉及一种解调方法和设备，用于解调加入音频信号中的附加信息。

现有技术

传统上利用将禁止音频信号传输到另一台设备或限制音频信号的记录以便实现对音频作品的内容的保护的信息作为附加信息嵌入的技术。这种类型的附加信息被嵌入音频信号中作为水印，这种水印可以是数字水印或模拟水印。

作为将数字水印嵌入数字音频信号中的技术，已经应用了利用16-位PCM(脉码调制)音频信号的最低有效位(LSB)用作水印数据的技术。还应用了通过运算压缩编码数字音频信号的改进离散余弦变换(MDCT)系数或子带的系数，将附加信息嵌入数字音频信号中作为水印的技术。

由于数字水印可以通过将水印数据直接叠加在数字音频信号上来进行读写，因此，便于进行信号处理。但是，当数字音频信号被解调为模拟音频信号时，数字水印将会被破密。当数字音频信号被转换成不同的数据格式时，数字水印也会被破密。因此，数字水印不能限制模拟音频信号的重复记录，即，模拟音频信号的复制，和不能有效地保护音频作品的版权拥有者的利益。

模拟水印以通过模拟信号的形式进行检测的方式嵌入数字音频信号中。即使在实现了文件格式的转换之后，也可以通过将数字音频信号解调成模拟音频信号再次读出水印。

同时，还提出了通过通信网络将诸如乐曲之类的音频作品分配给用户的技术。以压缩数据格式发送和记录数字音频信号的电子音乐分配器(EMD)示范了这种分配技术。如果不将压缩的数字音频信号解调成PCM信号或模拟信号，就不能读出或写入嵌入在EMD分配的压缩数字音频信号中的模拟水印。因此，为了记录模拟水印叠加在上面的、由EMD分配的音频信号，用户需要将音频信号解调成PCM信号。随着压缩的数字音频信号被解调成PCM信号或类似的信号，数据大小增大了，不能有效地实现对记录介质的记录。此外，为了重写模拟水印，音频信号分配器方需要解调曾经压缩成PCM信号的音频信号，因此不能容易地重写模拟水印。

作为将模拟水印嵌入音频信号的方法，已经提出了扩频系统和相移键控(PSK)系统。扩频系统和PSK系统适用于通过利用在再现音频信号过程中关于听觉的掩蔽效应将附加信息嵌入音频信号中。但是，由于这些系统不能达到足够的掩蔽效应，因此，难以将附加信息嵌入音频信号中而不损害再现声音的质量。

发明公开

综观上述现有技术的现状，本发明的目的是提供一种能够解决上述问题的新附加信息嵌入方法和设备以及附加信息解调方法和设备。

本发明的另一个目的是提供一种能够将附加信息嵌入音频信号而不损害再现声音的质量的附加信息嵌入方法和设备，以及能够解调附加信息而不损害附加信息嵌入其中的音频信号的声音质量的附加信息解调方法和设备。

本发明还有一个目的是提供一种能够将附加信息嵌入音频信号中，而即使在音频信号从数字信号解调成模拟信号的情况下或在改变数据格式的情况下也不会轻易遭到毁坏的附加信息嵌入方法和设备、以及附加信息解调方法和设备。

本发明再一个目的是提供一种能够容易地将附加信息嵌入压缩音频信号中的附加信息嵌入方法和设备，以及能够在数据压缩状态下解调嵌入的附加信息的附加信息解调方法和设备。

根据本发明将附加信息嵌入音频信号中的附加信息嵌入方法包括：正交变换步骤，正交变换音频信号并且计算正交变换系数；和位移和相加步骤，沿着频率轴方向衰减和位移正交变换系数并且将所得的系数与原始的正交变换系数相加，以便嵌入附加信息。

正交变换步骤包括音频信号的MDCT以便计算MDCT系数，和位移和相加步骤包括沿着频率轴方向衰减和位移计算的MDCT系数并将所得的系数与原始的MDCT系数相加以便嵌入附加信息。

本发明的方法还包括利用伪随机信号加扰位移和相加步骤计算的信号的步骤。

嵌入音频信号的附加信息是禁止传输音频信号的限制信息、禁止将音频信号记录到记录介质的限制信息、和与音频信号相对应的作品数据。

此外，在本发明的方法中，位移和相加步骤包括将在频率轴上位移的正交变换系数与原始的正交变换系数相加以便使频率掩蔽条件和时间掩蔽条件得到满足。

并且，位移和相加步骤还包括在将位移的正交变换系数与原始的正交变换系数相加所得的值不高于预定值的情况下进行相加。

此外，位移和相加步骤还包括根据将位移的正交变换系数与原始的正交变换系数相加所得的值的极性禁止位移和相加。

并且，位移和相加步骤还包括在音频信号落在从低限值到高限值的范围内的情况下进行位移和相加。在这种情况下，位移和相加步骤包括在音频信号落在根据人的听觉特性设定的从低限值到高限值的范围内的情况下进行位移和相加。

此外，位移和相加步骤还包括在预定频带内位移和相加正交变换系数。

并且，位移和相加步骤还包括分割音频信号的频带并且对每个分割的频带进行位移和相加。在这种情况下，位移和相加步骤包括反转分割的相邻频带的位移方向。

此外，位移和相加步骤还包括朝着频率升高端位移MDCT系数并且将MDCT系数与原始的MDCT系数相加。在这种情况下，在位移和相加步骤，随着MDCT系数位移了2N个单位(这里N是自然数)，MDCT系数的频率升高了((取样频率/MDCT系数的样本数)×2N)Hz。位移和相加步长大体上相当于音频信号的幅度。

并且，位移和相加步骤还包括朝着频率下降端位移MDCT系数并且将MDCT系数与原始的MDCT系数相加。在这种情况下，随着MDCT系数位移了2N个单位(这里N是自然数)，MDCT系数的频率下降了((取样频率/MDCT系数的样本数)×2N)Hz。

根据本发明将附加信息嵌入音频信号的附加信息嵌入设备包括：正交变换装置，用于正交变换音频信号并且计算正交变换系数；和位移和相加装置，用于沿着频率轴的方向衰减和位移正交变换系数并将所得的系数与原始的正交变换系数相加以便嵌入附加信息。

正交变换装置进行音频信号的MDCT以便计算MDCT系数，和位移和相加装置沿着频率轴的方向衰减和位移计算的MDCT系数并将所得的系数与原始的MDCT系数相加以便嵌入附加信息。

根据本发明的附加信息嵌入设备还包括利用伪随机信号加扰位移和相加步骤计算的信号的装置。

本发明用于接收附加信息嵌入其中的音频信号并且解调该附加信息的解调方法包括：接收步骤，接收通过沿着频率轴的方向衰减和位移并且添加到在原频率轴上的音频信号将附加信息嵌入其中的音频信号；和解调步骤，根据接收信号的、在频率轴上的每个预定间隔上音频信号极性解调附加信息。接收步骤包括接收通过沿着频率轴的方向衰减和位移正交变换音频信号所计算的正交变换系数，并且将所得的正交变换系数与原始的正交变换系数相加，将附加信息嵌入其中的音频信号。并且，接收步骤还包括接收通过沿着频率轴的方向衰减和位移音频信号的MDCT所计算的MDCT系数并且将所得的MDCT系数与原始的MDCT系数相加将附加信息嵌入其中的音频信号。

此外，接收步骤包括接收通过调幅(AM调制)将附加信息嵌入其中的音频信号，并且解调步骤包括根据接收信号的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

并且，接收步骤还包括接收通过FM调制将附加信息嵌入其中的音频信号，并且解调步骤包括根据接收信号的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

此外，解调步骤还包括根据在接收信号的预定频带内、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

本发明用于接收附加信息嵌入其中的音频信号并解调该附加信息的解调设备包括：接收装置，用于接收通过沿着频率轴的方向衰减和位移并与原频率轴上的音频信号相加将附加信息嵌入其中的音频信号；和解调装置，用于根据接收信号的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。接收装置接收通过沿着频率轴方向衰减和位移正交变换音频信号所计算的正交变换系数并且将所得的正交变换系数与原始的正交变换系数相加，将附加信息嵌入其中的音频信号。

此外，接收装置还接收通过沿着频率轴方向衰减和位移音频信号的MDCT所计算的MDCT系数并且将所得的MDCT系数与原始的MDCT系数相加，将附加信息嵌入其中的音频信号。

并且，接收装置还接收通过AM调制将附加信息嵌入其中的音频信号，并且解调装置根据接收信号的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

此外，接收装置还接收通过FM调制将附加信息嵌入其中的音频信号，并且解调装置根据接收信号的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

并且，解调装置根据在接收信号的预定频带内的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

本发明的其它目的和特定优点将通过如下的实施例描述得到进一步澄清。

附图简述

图1显示了音频信号的频率掩蔽；

图2A是显示用正弦波表示的音频信号的MDCT结果的图形；

图2B显示了用正弦波表示的音频信号的快速付里叶变换的结果；

图3A和3B是显示MDCT系数沿着频率轴方向位移的状态的图形；

图4A和4B是显示在MDCT系数沿着频率轴方向位移的情况下频率改变的图形；

图5A和5B是显示嵌入音频信号的水印的频率选择处理的图形；

图6A是显示在通过正弦波调幅音频信号所得的信号的频率范围内信号特性的图形；

图6B是显示原始音频信号的图形；

图6C是显示通过正弦波调幅图6B的音频信号所得的信号的图形；

图7A是显示在通过正弦波调频音频信号所得的信号的频率范围内信号特性的图形；

图7B是显示原始音频信号的图形；

图7C是显示通过正弦波调频图7B的音频信号所得的信号的图形；

图8A是显示将水印嵌入原始音频信号的高频带端的例子的图形；

图8B是显示将水印嵌入原始音频信号的低频带端的例子的图形；

图9是说明MDCT系数计算方法的图形；

图10A和10B是显示MDCT系数替换的图形；

图11A是显示原始音频信号的MDCT系数的图形；

图11B是显示沿着频率轴方向位移的MDCT系数被加入到原始音频信号的MDCT系数中的状态的图形；

图11C是显示当沿着频率轴方向位移的MDCT系数被加入到原始音频信号的MDCT系数中时产生原来不存在的极性改变的状态的图形；

图12A是显示根据MDCT系数的级(level)选择要嵌入水印的MDCT系数的状态的图形；

图12B是显示在图12A所选择的MDCT系数附近嵌入附加信息作为水印的状态的图形；

图13A是显示水印的频带限制的例子的第一图形；

图13B是显示水印的频带限制的例子的第二图形；

图14是显示利用数层水印插入多个信息的例子的图形；

图15A是显示分割成数个频带的频带分割的例子的第一图形；

图15B是显示分割成数个频带的频带分割的例子的第二图形；

图16是显示将附加信息作为水印叠加在音频信号上以便实现调制，然后解码附加信息叠加在上面的音频信号的编解码的方块图；

图17是显示将附加信息叠加在音频信号上的过程的流程图；

图18是显示通过每隔一秒复位并检测每个部分的偏差提取以水印形式嵌入音频信号中的附加信息的处理的图形；

图19是显示根据MDCT系数沿着频率轴方向的不同位移量的曲线的比较进行解调操作的第一图形；

图20是显示根据MDCT系数沿着频率轴方向的不同位移量的曲线的比较进行解调操作的第二图形；

图21A是显示频带分割的状态的图形；

图21B是显示通过含有在图21A内分割的带的音频信号被分别反相调制所得的包络线的图形；

图21C是显示由包络线产生的误差的图形；

图21D是显示合成反相调制的带分割音频信号的状态的图形；

图22A是显示在没有实现频率分割的情况下在MDCT系数之间相同极性的个数和不同极性的个数；

图22B是显示在没有实现频率分割的情况下在合成的MDCT系数之间的和关于每一块的相同极性的个数和不同极性的个数；

图23A是显示在实现了频率分割的情况下在MDCT系数之间相同极性的个数和不同极性的个数；

图23B是显示在实现了频率分割的情况下在合成的MDCT系数之间的和关于每一块的相同极性的个数和不同极性的个数；

图24是显示将附加信息作为水印叠加在音频信号上以便实现调制，然后解码附加信息叠加在上面的音频信号的编解码器的另一个例子的方块图；

图25是显示利用图24的编解码器将附加信息叠加在音频信号上的过程的流程图；

图26是显示将附加信息作为水印叠加在音频信号上以便实现调制，然后解码附加信息叠加在上面的音频信号的编解码器的再一个例子的方块图；

图27是显示借助于希尔伯特(Hilbert)转换的水印发生电路的方块图；

图28是显示利用借助于希尔伯特转换的水印发生电路将附加信息作为水印嵌入音频信号的方块图。

现在结合附图描述根据本发明的附加信息嵌入方法和设备以及附加信息解调方法和设备。

在描述本发明之前，先说明一下声音掩蔽效应。掩蔽效应是指这样一种状态，相对于作为具有某一频率和预定声压级或更高声压级的声音的掩蔽者(masker)，人的听觉对具有在预定范围内位移的频率和所述声压级或更低的声压级的声音没有响应。当存在具有某一频率和预定声压或更高的声音Ms时，人的听觉不响应在图1所示的预定频区BW内不超过掩蔽曲线1所指示的声压级的声音WM。例如，相对于1kHz或更低的频带中的声音As，人的听觉不响应在此音频信号附近100Hz的临界带宽Bw的范围内不超过掩蔽曲线1所指示的声压级的声音WM。临界带宽Bw依赖于频率，并且频率带宽在1kHz或更高处逐渐变宽，如图1所示。

掩蔽效应还包括所述时间掩蔽效应。至于这种时间掩蔽效应。如果在时基(time base)方向相对于用作某一频率和预定声压级或更高的掩蔽者的声音As发生位移，甚至本身是在时基方向在掩蔽曲线1所指示的声压级或更低上要受到掩蔽的被掩蔽者(maskee)的声音WM也将被人的听觉所俘获。例如，根据听者的不同，被掩蔽者声音WM可以按照在时基方向相对于掩蔽者声音As向前位移几个毫秒或向后位移几个毫秒的方式被人听到。

因此，为了将作为被掩蔽者的附加信息嵌入作为掩蔽者的音频信号之中，考虑到上述的掩蔽效应，必须将附加信息加入到相对于作为掩蔽者的音频信号由掩蔽曲线所指示的声压级或更低的范围内。考虑到时间掩蔽效应，必须不能让附加信息在时基方向相对于作为掩蔽者的音频信号作较大位移。

现在描述本发明处理的音频信号。音频信号具有叠加在上面的各种频率的正弦波。如果这种正弦波通过快速付里叶变换(FFT)进行变换，那么就在某一频率上产生一个谱(快速付里叶变换系数)，如图2A所示。另一方面，如果此正弦波是通过MDCT(改进离散余弦变换)进行变换的，那么就会在数个频率上产生数个两种极性的MDCT系数，如图2B所示，正如图2B所示的，中心区中的四个MDCT系数大约占整个的90％。在图2A和2B中，垂直轴表示增益(或级)。

通过实现正弦波的MDCT所获得的MDCT系数具有如下特性。即，如果所有MDCT系数沿着频率轴方向位移了偶数个单位以便实现逆MDCT(IMDCT)，那么，由于MDCT和逆MDCT的特性，结果是在PCM信号上进行频率位移所获得的信号。例如，如果1kHz的音频信号被44.1kHz的频率取样，那么，1024个样本值通过MDCT得到变换，如图3A所示，所得的MDCT系数在频率轴上向右位移了2并且通过逆MDCT得到变换，如图3B所示，图4A所示的1kHz的音频信号变成了如图4B所示的其频率升高了43Hz的信号。同样地，如果所得的MDCT系数如图4B所示的那样向右位移了4并且通过逆MDCT得到了变换，那么，如图3B所示，就获得了其频率升高了86Hz的信号。因此，如上所述，如果所有MDCT系数沿着频率轴方向向右位移了2，那么就产生通过位移图4A所示的1kHz的音频信号所得的图4B所示的1043Hz的信号。如果所有MDCT系数位移了4，那么就产生图4B所示的1086Hz的信号。

通过利用44.1kHz的频率取样典型音频信号，然后实现1024个样本值的MDCT，接着从图5A所示的所得MDCT系数中选择预定个数的MDCT系数，并且对所选MDCT系数实现逆MDCT，就可以获得带有频率限制的调制结果。这样，就可以将附加信息作为水印WM嵌入限制在如图5B所示的1.5至5kHz的带内的信号中，而不是音频信号的整个频率范围内。

作为将附加信息作为水印WM嵌入音频信号的方法，应用了直接从音频信号本身生成附加信息的系统，即，利用包含在音频信号之中的预定频带波的成分作为附加信息并且将此附加信息作为水印WM嵌在获得图1所示的掩蔽效应的范围之内的系统。

作为这样的系统之一，可以应用AM调制系统。AM调制系统适用于进行如图6A、6B和6C所示的处理。具体地说，如果附加信息要嵌入其中的原始音频信号的特定频率的信号(正弦波)的包络线由图6B所示的正弦波调幅，那么，如图6C所示，边带信号SB呈现在图6A的原始音频信号的两边，并且使边带信号SB落在图1所示的掩蔽曲线1的范围内。通过利用边带信号SB，可以将附加信息作为水印嵌入音频信号中。

作为另一个系统，可以应用FM调制系统。FM调制系统适用于进行如图7A、7B和7C所示的处理。具体地说，如果附加信息要嵌入其中的音频信号的特定频率的信号(正弦波)被图7B所示的正弦波调频，那么，如图7C所示，边带信号SB呈现在图7A所示的原始音频信号的两边，并且使边带信号SB落在图1所示的掩蔽曲线1的范围内。通过利用边带信号SB，可以将附加信息作为水印嵌入音频信号中。

此外，在将附加信息作为水印嵌入音频信号的情况下，可以将附加信息作为水印WM嵌入在附加信息要嵌入其中的音频信号的特定频率的信号的高频带中，如图8A所示，或者嵌入在特定频率的信号的低频带中，如图8B所示。在图8A和8B的两种情况下，利用衰减到落在特定频率的音频信号的掩蔽曲线1的范围内的增益嵌入水印WM，如图1所示。

现在描述通过衰减由MDCT获得的MDCT系数并且解码音频信号，然后沿着频率轴方向位移MDCT系数，解调作为水印WM嵌入音频信号的掩蔽曲线1的范围内的附加信息的方法。

在解调通过音频信号的MDCT所得的MDCT系数的情况下，如果在调制时作为MDCT单元的1024个样本与在解调时作为逆MDCT单元的1024个变换系数之间存在位移，那么就不能实现正确的解调。因此，为了正确解调附加信息，必须借助于逐个位移的变换系数的相位进行1024次的逆MDCT，如图9所示。考虑到处理时间和处理速度，如此多次的逆MDCT是不切实际的，并且需要额外增大电路规模。

通过沿着频率轴方向位移MDCT音频信号所得的MDCT系数嵌入到音频信号中的附加信息与原始音频信号之间存在相关性。因此，可以利用附加信息的特性实现嵌入音频信号中的附加信号的解调。在这种解调中，通过将沿着频率轴方向位移的MDCT系数与MDCT音频信号所得的原始MDCT系数相加可以容易地解调附加信息。

具体地说，如果由音频信号的MDCT所得的图10A所示的MDCT系数沿着频率轴方向位移了4然后与原始MDCT系数相加，那么，原始MDCT系数的极性与相加的MDCT系数的极性具有相同的相位的几率很高，如图10B所示。也就是说，正如图10B所示的，沿着频率轴方向相加的并且与原始MDCT具有相同相位的MDCT系数增大了，而相反相位的MDCT系数减小了。因此，根据相同相位或相反相位计数通过沿着频率轴方向将MDCT系数位移4并且相加所得的MDCT系数获得的、图10B所示的MDCT系数的极性，并且进行统计处理，从而检测出位移的MDCT系数是作为相同相位相加的还是作为相反相位相加的。通过这种做法，即使在调制时作为MDCT单元的1024个样本与解调时作为逆MDCT单元的1024个变换系数之间存在位移的情况下，也可以容易地解调调制的附加信息而无需进行多次逆MDCT。

在这种情况下，为了实现MDCT系数的极性具有相同相位的高几率，MDCT系数沿着频率轴方向位移了4。但是，MDCT系数可以位移2N(这里N是自然数)。

同时，在解调附加信息过程中，存在着一些对沿着频率轴方向位移的和与通过MDCT和解码音频信号所得的原始MDCT系数相加或相减的MDCT系数的极性的增加或减少没有贡献的MDCT系数。也就是说，在沿着频率轴方向位移的MDCT系数中，存在着一些其极性不能通过与原始MDCT系数相加或相减而改变的MDCT系数。

具体地说，将沿着频率轴方向位移了4的MDCT系数与MDCT音频信号所得的、图11A所示的原始MDCT系数相加。在这种情况下，要相加的MDCT系数具有降低了预定级，例如，大约30dB的增益，如图11B所示，然后与原始MDCT系数相加。相加的结果如图16C所示。即使在增益降低了30dB的MDCT系数与原始MDCT系数相加这样一种情况下，仍然存在一些既不对原始MDCT系数的极性的反向有贡献也不当他们超过预定频率的音频信号的掩蔽级时用作水印的MDCT系数。因此，存在着损害再现声音的质量的风险。

为了解决这样一些问题，应该考虑到只相加其级比原始MDCT系数的级高的并且具有相反相位的MDCT系数。然而，即使在完全实现了这样的处理的情况下，仍然存在着当MDCT系数变换的音频信号被转换成模拟信号并且通过一批不同的样本值再次得到MDCT变换时不能解调嵌入音频信号的附加信息的风险。也就是说，存在着当通过与上述处理相似的处理，将沿着频率轴方向位移的MDCT系数与再次MDCT变换转换成模拟信号的音频信号所得的MDCT系数相加时可能丢失附加信息的风险。

因为，为了防止对嵌入音频信号中的附加信息的损害和防止损坏解调音频信号的音质，只有通过附加信息嵌入其中的音频信号的MDCT所得的MDCT系数的、其增益不超过预定级的MDCT系数用于附加信息的嵌入。相对于预定频率的声音，频率位移了的和不低于某一声压级的声音不能提供听觉的掩蔽效应。考虑到这样的声音特性，鉴于人的听觉在用于附加信息的MDCT系数的增益和频率上规定了阈值S1，如图12A，只有在不超过阈值S1的范围内的MDCT系数才用于附加信息的嵌入。将在这种情况下选择的MDCT系数沿着频率轴的方向位移4，然后使增益降低，并且与原始MDCT系数相加。这样，附加信息被作为水印WM嵌在原始MDCT系数的两侧，如图12B所示。在这种情况下，正如图12B所示的，可以防止不低于预定级的附加信息被嵌在距离预定频率的原始MDCT系数达预定频率的位置上，并且可以防止产生再现为听觉的噪声成分的声音。

在将附加信息作为水印WM嵌入音频信号的过程中，如果用于附加信息的MDCT系数被嵌在总是距离预定频率的MDCT系数一预定频率的位置上，那么，当再现音频信号时可能会听到没有得到掩蔽的听觉噪声，正如根据图1所描述的。由于可以获得掩蔽效应的频带随着频率而改变，因此，用于嵌入作为水印WM的附加信息的频率距离Hr也随着附加信息嵌入其中的音频信号的频率而改变。例如，当附加信息要作为水印WM嵌入到1kHz或更低的音频信号中时，原始MDCT系数在频率轴上位移以便用于附加信息的MDCT系数嵌在43Hz的频率距离Hr内，如图13A所示。另一方面，当附加信息要作为水印WM嵌入2kHz或更高的音频信号中时，原始MDCT系数在频率轴上位移以便用于生成附加信息的MDCT系数被嵌入在86Hz的频率距离Hr内，如图13A所示。

此外，在将附加信息作为水印WM嵌入音频信号的过程中，用于嵌入作为水印WM的附加信息的频率距离Hr相对于2kHz或更高的音频信号而增大。因此，用于附加信息的MDCT系数可以被多路复用，然后嵌在频率距离Hr内，如图13B所示。

如上所述，如果在附加信息嵌入其中作为水印WM的音频信号上进行利用用于视频信号的压缩量化的信号压缩处理，那么，附加信息可能被破密。这是因为在信号压缩过程中受到量化步数的限制音频信号的频带内每个频率成分的幅度被四舍五入成更小的整数。为了解决这个问题，可以将要加入音频信号的附加信息的级保持在预定级或更高上。例如，通过将附加信息的级保持在相对于附加信息嵌入其中的、预定频率的音频信号的级为大约-6至-30dB上，即使当附加信息嵌入其中的音频信号通过量化或类似方法得到压缩时，也能保证附加信息的容限和能够防止附加信息被破密。为了防止当进行信号压缩时附加信息被破密，可以避免使用相对于用于附加信息的原始MDCT系数衰减了-30dB或更多的MDCT系数。

当沿着频率轴的方向位移通过MDCT音频信号所得的MDCT系数并且嵌入作为水印WM的附加信息时，如果要嵌入的附加信息被多路复用到如图14所示的数层L1、L2、…、LN，那么，可以唯一地设置每层的频率。

根据编解码器，音频信号可以在音频信号的频带被数据滤波器分割成预定的频带之后得到MDCT变换，如图15A和15B所示。这样分割的频区的成分可以直接用作层。图15A显示了应用自适应音频信号压缩技术(ATRAC2或自适应变换声音编码(Adaptive Transform Acoustic Coding)：索尼公司(SonyCorporation)的商标)和每5kHz进行一次频率分割的例子。图15B显示了来自子带滤波器的、由MDCT层3分割成32的输出被MDCT变换的例子。

如上所述，在通过沿着频率轴方向位移MDCT音频信号所得的MDCT系数将附加信息作为水印WM嵌入音频信号的方法中，根据原始MDCT系数的极性与沿着频率轴方向位移了预定个单位并且相加的MDCT系数的极性的一致或不一致，来确定用于生成附加信息的MDCT系数的级。因此，高的MDCT系数的级并不直接影响附加信息的调制强度。较低级的MDCT系数和较高级的MDCT系数具有相同的数据量。因此，如果给予再现音频信号的音质以优先级，那么，考虑到附加信息加入其中的音频信号的掩蔽效应和在实现信号压缩情况下附加信息的容限，可以期望使用用于生成附加信息的、最低可能级的MDCT系数。

在要加入到音频信号的附加信息的级要根据音频信号的级自动设置的情况下，附加信息的最大幅度可以通过限制音频信号的级的相加/相减来设置。此外，通过设置要加入到音频信号的附加信息的级的低限，可以防止生成由于信号压缩或从数字信号到模拟信号的重复转换而受到损害的附加信息。

为自动设置附加信息加入其中的音频信号的级，使用了用于归一化每个频带或每个滤波器组的输出的方法。在ATRAC2或ATRAC3中，在多相正交滤波器(PQF)之后的级上配置了AGC(自动增益控制)电路，因此，在MDCT变换音频信号之前实现级的调整。这样，ATRAC2或ATRAC3可以用于本发明的解调方法。

此外，作为用于自动设置音频信号的级的方法，可以计数用于生成要加入音频信号的附加信息的有效MDCT系数的个数并且可以自动限制用于生成附加信息的MDCT系数的级以便按平均相加不变个数的MDCT系数。

现在描述用于将附加信息作为水印嵌入音频信号的附加信息嵌入设备和用于解调嵌入音频信号的附加信息的解调设备。

在本发明中，附加信息嵌入设备和附加信息解调设备整合在一起构成编解码器10，如图16所示。这个编解码器10含有A/D转换器12，用于将通过音频信号输入端口10a输入的音频信号转换成数字信号，和MDCT单元14，用于MDCT变换(改进离散余弦变换)由A/D转换器转换成数字信号的音频数据。MDCT单元14适用于进行PCM信号的一维正交变换，PCM信号是一维音频数据。MDCT单元14进行PCM信号的一维MDCT并输出MDCT系数。

编解码器10还含有位移/相加单元16，由MDCT单元14计算的MDCT系数输入到其中和通过附加信息输入端口10b输入的附加信息输入到其中。位移/相加单元16根据附加信息沿着频率轴方向位移从MDCT单元14传输的MDCT系数并进行原始MDCT系数的极性转换，从而将附加信息嵌入MDCT系数。

从位移/相加单元16输出的信号输入到逆MDCT单元18。逆MDCT单元18根据从位移/相加单元16输出的信号进行与MDCT单元14所进行的变换相反的逆改进离散余弦变换。

作为数字信号从逆MDCT单元18输出的附加信息嵌入其中的数字音频数据由D/A转换器20转换成模拟音频数据，然后通过输出端口21输出。从输出端口21输出的音频信号是附加信息嵌入其中的信号。

编解码器10用作附加信息解调设备，因此含有附加信息解调单元22，用于解调来自从MDCT单元14输出的MDCT系数的、嵌入音频信号中的附加信息。由附加信息解调单元22解调的附加信息通过输出端口21输出到设备的外部。

作为水印嵌入音频信号的附加信息包括用于禁止传输音频信号的限制信息、用于禁止将音频信号记录在另一个记录介质上的限制信息、和与音频信号相对应的作品数据。作品数据包括用于管理与音频信号相对应的乐曲等的版权的数据、版权拥有者代码、版权管理号等等。

现在参照图17的流程描述利用图16所示的具有附加信息嵌入功能的编解码器10将附加信息嵌入音频信号的过程。

随着在步骤S1从音频信号输入端口10a输入音频信号，音频信号输入到A/D转换器12，在步骤S2音频信号在A/D转换器12中被转换成数字信号。转换成数字信号的音频信号输入到MDCT单元14。在步骤S3，对输入到MDCT单元14的音频信号进行MDCT变换以计算MDCT系数。由MDCT单元14计算的MDCT系数输入到位移/相加单元16。

在步骤S4，判断附加信息是否输入到位移/相加单元16。具体地说，当附加信息的输入表示为“1”时，在步骤S5位移/相加单元16沿着频率轴方向将从MDCT单元14输入的MDCT系数位移2或4并且将所得的MDCT系数与原始MDCT系数相加，从而嵌入作为水印WM的附加信息。另一方面，当没有输入附加信息时，即，当附加信息表示为“0”时，位移/相加单元16输出原始MDCT系数而不进行上述的位移和相加。当附加信息表示为“1”时位移/相加单元16将沿着频率轴方向位移了的MDCT系数与原始MDCT系数相加，当附加信息表示为“0”时位移/相加单元16并不进行MDCT系数的位移和相加。因此，可以在接收或被供应从附加信息嵌入设备输出的音频信号的设备这一方检测附加信息的“0”或“1”。在音频信号被44.1kHz的频率取样和1024个样本值作为一个块被MDCT变换以获得MDCT系数的情况下，对1024个样本值的每一个都可以嵌入附加信息的每一位。但是，应该注意到，样本值的个数并不仅限于1024。

在步骤S6，在由位移/相加单元16的预定处理处理过的MDCT系数上进行与MDCT变换相反的逆改进离散余弦变换。在后续的步骤S7，音频信号被转换成模拟音频信号，并且在步骤S8，输出附加信息嵌入其中的模拟音频信号。

现在描述利用图16所示的编解码器10解调作为水印嵌入音频信号的附加信息的情况。

在位移/相加单元16将MDCT系数沿着频率轴方向位移了2或4并且与原始MDCT系数相加以便嵌入附加信息作为水印WM的情况下，任意MDCT系数的左边和右边上第四个系数的极性具有很大几率被作为水印嵌入的附加信息成分反向，从而增加/减少了极性。因此，随着MDCT系数的左边和右边上的第四个系数按照相同极性和不同极性被累积起来，可以在预定时间间隔内，例如，在一秒的间隔内检测到极性的偏移。

为了通过利用MDCT系数的极性的偏移检测嵌入音频信号中的附加信息，每隔一秒复位计数数并检验每个间隔内极性的偏移，如图18所示。因此，这使得检测作为水印嵌入的附加信息成为可能。根据极性往正向偏移的情况和极性往负向偏移的情况的组合，可以发送和检测作为各个间隔的数据的数据串“1”、“1”、“0”，如图18所示。

此外，在MDCT系数沿着频率轴方向位移了4并且与原始MDCT系数相加以便嵌入附加信息作为水印WM的情况下，如果在简单解调信号的过程中当在音频信号被转换成模拟信号之后再次进行MDCT时在样本值的相位中产生了位移使得相同极性的MDCT系数增多了，那么，有时不能根据正和负极性的组合读出附加信息。

同时，在MDCT系数沿着频率轴方向位移了4并且与原始MDCT系数相加以便嵌入附加信息作为水印WM的情况下，如果在样本值的相位中产生了位移，那么极性一致的MDCT系数的个数以余弦波的形式增多或减少。另一方面，在MDCT系数沿着频率轴方向位移了5并且与原始MDCT系数相加以便嵌入附加信息作为水印WM的情况下，如果在样本值的相位中产生了位移，那么，极性一致的MDCT系数的个数以正弦波的形式增多或减少。因此，在1024个样本值作为一个块得到MDCT变换的情况下，如果MDCT系数的相位位移了128个样本值，那么，即使沿着频率轴方向位移了4的MDCT系数的、相同极性的MDCT系数的总数是0，也可以获得足够数量的沿着频率轴方向位移了5的MDCT系数的、相同极性的MDCT系数。

在检测要由比复制控制的方法容易的方法来实现的情况下，或者在MDCT的相位不能得到控制的应用中，这种方法是一种有长处的技术。

此外，在与正确相位匹配的同步处理中，由于位置可以通过检验MDCT系数的4和5的值得到大致指定，因此，无需检验所有1024个样本值的相位就可以实现与正确相位的同步。或者，可以寻找到1024个样本值的、能够获得最大增益的相位。

图20显示了MDCT系数沿着频率轴方向位移了8并且与原始MDCT系数相加以便嵌入附加信息作为水印WM的情况和MDCT系数沿着频率轴方向位移了9并且与原始MDCT系数相加以便嵌入附加信息作为水印WM的情况。每64个样本值在8和9之间改变距离。通过组合MDCT系数沿着频率轴方向位移了8并且与原始MDCT系数相加以便嵌入附加信息作为水印WM的情况和MDCT系数沿着频率轴方向位移了9并且与原始MDCT系数相加以便嵌入附加信息作为水印WM的情况，使得用于寻找正确相位的粗调整变得更加容易。

现在描述为这个系统提供多层的方法。

在附加信息解调单元22中，沿着原始MDCT系数的高频的方向相加或相减要成为附加信息的MDCT系数。或者，在附加信息解调单元22中，沿着原始MDCT系数的低频的方向相加或相减要成为附加信息的MDCT系数。在这些方法中，可以通过设置原始MDCT系数的级与相加或相减的MDCT系数的级之间的关系来利用彼此完全独立的两种类型的层。

由于MDCT系数对应于频带，因此，可以通过限制MDCT系数来限制频带，如图5所示。

在MDCT系数沿着频率轴方向位移并且与原始MDCT系数相加以便嵌入附加的情况下，与所得的附加信息相同的信号可能存在于音频信号的分量中。在这样的情况下，会发生附加信息的错误检测。

生成这样的信号分量的主要原因是原始音频信号的包络线是与要解调的改变量同相的，或者是反相的，如图21B所示。在这样的情况下，每个频带的音频信号往往随着相同相位而改变，因此实现了加强调制。如果使用了淹没它的大信号，那么在音质方面就会出现问题。因此，为了易于从原始音频信号中识别出附加信息，将频带分割成块A和块B，两者具有相反的调制方向，如图21A所示。在本例中，从1.5至5kHz的频带被分割成1.5至3.kHz和从3至5kHz的块。

如果沿着相同方向调制频带的这两个块A和B，那么，结果如图21C所示。但是，如果沿着相反方向调制些块，则解调包含在原始音频信号中的低频带和音频带的调制分量作为相反相位的数据，如图21D所示。因此，可以在保持数据的相同增益的同时只消除错误信号。

图22A和22B是显示在没有进行频率分割的情况下在MDCT系数之间相同极性的个数和不同极性的个数的图形。图23A和23B是显示在进行了频率分割的情况下在MDCT系数之间相同极性的个数和不同极性的个数的图形。在进行了频率分割的情况下，可以通过尽可能地避免偶尔发生在音频信号中的模式来降低数据率和差错率。

在进行频率分割过程中，选择八音度作为要分割的频率导致消除效应的改善。这是由于音乐特性造成的。包括音程的分量对八音度有负作用，就几率而论，这对保持相反相位是有用的。或者，选择个数大体相同的包括在两个频带块A和B中的MDCT系数也是有效的。

此外，作为用于分割频带的方法，就几率而论可以子分割进一步用于消除方法的频带，如图15所示。

在对音频压缩的应用中，ATRAC2的多相正交滤波器(PQF)的分割特性可以用于上述的频频分割的方法。此外，还可以利用MPEG(运动图像专家组)层3的子带滤波器。

通过沿着频率轴的方向位移MDCT系数并将所得的MDCT系数与原始MDCT系数相加嵌入作为水印的附加信息具有非常高的保密性，使得即使当进行转换成模拟信号或快速付里叶变换时也不能将其分离出来。但是，利用MDCT可以相对容易地攻击这样的附加信息。为了解决这个问题，可以通过设置在基于音频信号的原始MDCT系数与沿着频率轴方向位移的相加MDCT系数之间的距离，即位移数，并利用这些MDCT系数的极性，来进行利用MDCT嵌入音频信号中的附加信息的检测。在伪随机信号或类似信号使生成附加信息的每个MDCT系数的极性反向的情况下，即使当第三方利用MDCT检验它时也不能知道该信号是否受到附加信息调制。

作为在这种情况下使用的伪随机信号，可以使用简单的PN(伪噪声)序列和哥德(gold)码，也可以使用复杂的DES(数据加密系统)和椭圆密码术。或者，可以使用1和0的简单重复倒向的AC(交流)信号。

此外，通过从诸如哥德码两种类型的密码产生假信号、然后针对每个独立单位的每个终端固定一个而改变另一个，并且针对每个终端单元改变合成密码，就可以提高附加信息的保密性。

现在描述用于将附加信息作为水印嵌入音频信号的附加信息嵌入设备和用于解调嵌入音频信号的附加信息的解调设备的另一个例子。

本例中的附加信息嵌入设备和附加信息解调设备也都整合在一起构成编解码器30，如图24所示。这个编码器30含有A/D转换器32，用于通过音频信号输入端口30a输入的音频信号转换成数字信号；和MDCT单元34，用于MDCT变换(变换离散余弦变换)由A/D转换器32转换成数字信号的音频数据。MDCT单元34适用于MDCT变换PCM信号以便输出MDCT系数。MDCT单元34对一维音频信号进行一维离散余弦变换。

编解码器30还含有位移/相加单元36，由MDCT单元34计算的MDCT系数输入到其中和通过附加信息输入端口30b输入的附加信息也输入到其中。位移/相加单元36沿着频率轴方向位移通过变换音频信号获得的并从MDCT单元34传输的MDCT系数，并根据附加信息进行原始MDCT系数的极性转换，从而编码MDCT系数和附加信息。

从MDCT单元34输出的信号输入到逆MDCT单元38。逆MDCT单元38根据从MDCT单元34输出的信号进行与MDCT单元34所进行的变换相反的逆改进离散余弦变换。

作为数字信号从逆MDCT单元38输出的附加信息嵌入其中的数字音频数据由压缩处理电路40进行压缩编码并通过输出端口31输出作为压缩编码信号。

编解码器30也用作附加信息解调设备，因此含有附加信息解调单元38，用于解调来自从MDCT单元34输出的MDCT系数的、嵌入音频信号中的附加信息。由附加信息解调单元38解调的附加信息通过输出端口31输出到设备的外部。

作为水印嵌入音频信号的附加信息包括用于禁止传输音频信号的限制信息、用于禁止将音频信号记录在另一个记录介质上的限制信号、和与音频信号相对应的作品数据。作品数据包括用于管理与音频信号相对应的乐曲等的版权的数据、版权拥有者代码、版权管理号等。

在图24的编解码器30中，位移/相加单元36和附加信息解调单元38整合在一起构成单元电路35。由于位移/相加单元36和附加信息解调单元38整合在一起构成单元电路35，因此，为非法目的从外部访问受到禁止。此外，由于MDCT单元34、组合电路35和压缩处理电路40也整合在一起构成电路33，因此，为了非法目的从外部访问也受到禁止。作为电路33，可以使用执行ATRAC2的电路。借助于这样的结构，可以提高编解码器30的保密性并且使得从外部对通过编解码器30的信号处理的非法访问变得困难。

现在参照图25的流程描述利用图24所示的具有附加信息嵌入功能的编解码器30将附加信息嵌入音频信号的过程。

随着在步骤S11从音频信号输入端口30a输入音频信号，音频信号被输入到A/D转换器32，在步骤S12，音频信号在A/D转换器32中被转换成数字信号。转换成数字信号的音频信号输入到MDCT单元34。在步骤S13，对输入到MDCT单元34的音频信号进行MDCT变换以计算MDCT系数。由MDCT单元34计算的MDCT系数输入到位移/相加单元36。

在步骤S14，判断附加信息是否输入到位移/相加单元36。具体地说，当附加信息的输入表示为“1”时，在步骤S15位移/相加单元36沿着频率轴方向将从MDCT单元34输入的MDCT系数位移2或4并且将所得的MDCT系数与原始MDCT系数相加，从而嵌入作为水印WM的附加信息。另一方面，当没有输入附加信息时，即，当附加信息表示为“0”时，位移/相加单元36输出原始MDCT系数而不进行上述的位移和相加。当附加信息表示为“1”时位移/相加单元36将沿着频率轴方向位移了的MDCT系数与原始MDCT系数相加，当附加信息表示为“0”时位移/相加单元36并不进行MDCT系数的位移和相加。因此，可以在接收或被供应从附加信息嵌入设备输出的音频信号的设备这一方检测附加信息的存在与否。在音频信号被44.1kHz的频率取样和1024个样本值作为一个块得到MDCT变换以获得MDCT系数的情况下，对1024个样本值的每一个可以获得附加信息的每一个位，但是，应该注意到，样本值的个数并不仅限于1024。

在步骤S16，在由位移/相加单元36的预定处理处理过的MDCT系数上进行根据ATRAC2的压缩系统的压缩处理。在步骤S17，从输出端口31输出所得信号作为附加信息嵌入其中的数字音频信号。

现在描述利用图24所示的编解码器30解调作为水印嵌入音频信号的附加信息的情况。

在编解码器30用作解调器的情况下，从输入端口30a输入的模拟音频信号由D/A转换器32转换成数字信号。MDCT单元34MDCT变换从D/A转换器32输出的数字信号并输出MDCT系数。根据MDCT系数，解调附加信息并且从输出端口31将其输出之。

现在参照图26描述用于将附加信息作为水印嵌入压缩数字音频信号的附加信息嵌入设备和用于解调嵌入在压缩数字音频信号中的附加信息的解调设备的另一个例子。这种设备对接收和解调例如通过通信网络分布的数字音频信号是有用的。

在本例中的附加信息嵌入设备和附加信息解调设备也都整合在一起构成编解码器50，如图26所示。这个编解码器30含有扩展处理单元52，用于扩展通过输入端口50a输入的压缩数字音频信号并MDCT变换(改进离散余弦变换)扩展音频数据；和位移/相加单元54，由扩展处理单元52计算的MDCT系数输入到其中和通过附加信息输入端口50b输入的附加信息也输入到其中。位移/相加单元54沿着频率轴方向位移通过变换音频信号获得的和从扩展处理单元52传输的MDCT系数，并根据从附加信息输入端口50b输入的附加信息进行原始MDCT系数的极性转换，从而编码MDCT系数和附加信息。

从位移/相加单元54输出的信号输入到逆MDCT单元58。逆MDCT单元58对从位移/相加单元54输出的数字数据进行逆改进离散余弦变换。

从逆MDCT单元58输出的附加信息嵌入其中的数字音频数据由A/D转换器60转换成模拟音频信号并且从输出端口61输出。

编解码器50也用作附加信息解调设备，因此含有附加信息解调单元56，用于解调来自从扩展处理单元52输出的MDCT系数的、嵌入音频信号中的附加信息。由附加信息解调单元56解调的附加信息通过输出端口61输出到设备的外部。

在图26的编解码器50中，位移/相加单元54和附加信息解调单元56整合在一起构成单元电路53。由于位移/相加单元54和附加信息解调单元56整合在一起构成单元电路53，因此，为非法目的从外部访问受到禁止。此外，由于扩展处理单元52、单元电路53和逆MDCT单元58也都整合在一起构成电路51，因此，为了非法目的从外部访问也受到禁止。

同时，在将附加信息作为水印嵌入音频信号的情况下，正如上面参照图6所述的，如果图6B所示的模拟音频信号的包络线直接由图6C所示的正弦波调幅(AM)，那么，可以在图6A所示的原始音频信号的两边上形成边带信号SB。由于边带信号SB相对于原始音频信号起到水印作用，因此，可以利用边带信号SB嵌入附加信息。

此外，在将附加信息作为水印嵌入音频信号的情况下，正如上面参照图7所描述的，如果图7B所示的模拟音频信号由图7C所示的预定频率的正弦波调频(FM)，那么，可以在图7A所示的原始音频信号的两边形成边带信号SB。由于边带信号SB相对于原始音频信号起到水印的作用，因此，可以利用边带信号SB嵌入附加信息。

这样，可以通过希尔伯特转换生成由于AM调制和FM调制所致的边带信号SB。

现在参照图27描述通过希尔伯特转换在音频信号上生成边带的例子。

用于通过希尔伯特转换在音频信号上生成边带信号SB的边带生成电路100包括希尔伯特转换器102，用于希尔伯特转换作为从输入端口101a输入的数字音频信号的PCM信号；调制频率发生器104，用于根据从输入端口101b输入的诸如频率、增益、相位等的控制信号生成调制频率；实部乘法器106，用于将从希尔伯特转换器102输出的实部与从调制频率发生器104输出的实部相乘；虚部乘法器108，用于将从希尔伯特转换器102输出的虚部与从调制频率发生器104输出的虚部相乘；第一加法器110，用于从虚部乘法器108的输出减去实部乘法器106的输出以便在作为原始音频信号的PCM信号的高频侧上生成上边带信号SB；和第二加法器112，用于将实部乘法器106的输出与虚部乘法器108的输出相加以便在作为原始音频信号的PCM信号的低频侧上生成下边带信号SB。

通过利用由此在作为原始音频信号的PCM信号的高频侧和低频侧上生成的边带信号SB，可以将附加信息作为水印嵌入。

图28显示了示范性调制设备200，用于AM调制或FM调制原始音频信号和利用在原始音频信号的两侧上生成的边带信号SB以便嵌入附加信息作为水印。调制设备200含有MDCT单元202，作为原始音频信号的PCM信号通过输入端口201输入到其中；音频信号提取单元204，用于提取附加信息加入其中的预定频率的音频信号；逆MDCT单元206；通过希尔伯特转换的水印发生器208；定时调整延迟单元210和信号嵌入电路212。

MDCT单元202进行作为PCM信号输入的音频信号的MDCT，并由此计算出MDCT系数。音频信号提取电路204从MDCT系数提取附加信息嵌入其中的预定频率的音频信号。逆MDCT单元206针对由音频信号提取电路204提取的PCM信号进行逆MDCT。

通过希尔伯特转换的水印生成电路208具有图27所示的结构，并且在附加信息作为水印嵌入其中的预定频率的音频信号的两侧上生成边带信号SB。

定时调整延迟电路210将通过输入端口201输入的PCM音频信号延迟与MDCT单元202、音频信号提取单元204、逆MDCT单元206和通过希尔伯特转换的水印发生器208的处理时间相对应的时间，由此来调整定时。

信号嵌入电路212将在可以获得掩蔽效应的音频信号的上或下频带中生成的边带信号作为水印嵌入从定时调整延迟电路210输出的音频信号。

用于通过利用希尔伯特转换将附加信息作为水印嵌入音频信号的调制设备200可以在如图6A和7A所示的任意频率的音频信号的上和下频带中生成边带信号，AM调制和FM调制可以由通过希尔伯特转换的频移来实现。此外，由于调制设备可以在图7A所示的任意频率的音频信号的上和下频带两者之一中生成边带信号SB，因此，可以在任意频率上将附加信息嵌入作为水印。

工业实用性

根据本发明，通过正交变换音频信号以计算正交变换系数，然后沿着频率轴方向衰减和位移计算的正交变换系数，并且将所得的正交变换系数与原始正交变换系数相加，嵌入附加信息。因此，附加信息可以作为水印嵌入音频信号中。另外，即使在音频信号被压缩的情况下，也可以可靠地防止对作为水印嵌入的附加信息的损害。

Claims

1.一种将附加信息嵌入音频信号的附加信息嵌入方法，所述方法包括：

正交变换步骤，正交变换音频信号并由此计算出正交变换系数；和

位移和相加步骤，沿着频率轴方向衰减和位移正交变换系数并且将所得的系数与原始的正交变换系数相加以便嵌入附加信息。

2.根据权利要求1所述的附加信息嵌入方法，其中正交变换步骤包括进行音频信号的改进离散余弦变换以便计算出改进离散余弦变换系数，和其中位移和相加步骤包括沿着频率轴方向衰减和位移计算的改进离散余弦变换系数并且将所得的系数与原始改进离散余弦变换系数相加以便嵌入附加信息。

3.根据权利要求1所述的附加信息嵌入方法，其中位移和相加步骤包括将在频率轴上位移了的正交变换系数与原始正交变换系数相加以便满足频率掩蔽条件和时间掩蔽条件。

4.根据权利要求1所述的附加信息嵌入方法，其中位移和相加步骤包括当将位移了的正交变换系数与原始正交变换系数的值相加所得的值不高于预定值时进行相加。

5.根据权利要求1所述的附加信息嵌入方法，其中位移和相加步骤包括根据将位移了的正交变换系数与原始正交变换系数的值相加所得的值的极性禁止位移和相加。

6.根据权利要求1所述的附加信息嵌入方法，其中位移和相加步骤包括当音频信号落在从高限值到低限值的范围内时进行位移和相加。

7.根据权利要求6所述的附加信息嵌入方法，其中位移和相加步骤包括当音频信号落在根据人的听觉特性设置的从高限值到低限值的范围内时进行位移和相加。

8.根据权利要求1所述的附加信息嵌入方法，其中位移和相加步骤包括在预定频带内进行正交变换系数的位移和相加。

9.根据权利要求2所述的附加信息嵌入方法，其中位移和相加步骤包括在预定频带内进行改进离散余弦变换系数的位移和相加。

10.根据权利要求1所述的附加信息嵌入方法，其中位移和相加步骤包括分割音频信号的频带并对分割的频带的每一个进行位移和相加。

11.根据权利要求10所述的附加信息嵌入方法，其中位移和相加步骤包括反转分割的相邻频带的位移方向。

12.根据权利要求1所述的附加信息嵌入方法，进一步包括利用伪随机信号加扰由位移和相加步骤计算的信号的步骤。

13.根据权利要求2所述的附加信息嵌入方法，其中位移和相加步骤包括朝着频率升高端位移改进离散余弦变换系数并且将改进离散余弦变换系数与原始改进离散余弦变换系数相加。

14.根据权利要求13所述的附加信息嵌入方法，其中在位移和相加步骤，随着改进离散余弦变换系数位移了2N个单位(这里N是自然数)，改进离散余弦变换系数的频率升高了((取样频率/改进离散余弦变换系数的样本数)×2N)Hz。

15.根据权利要求14所述的附加信息嵌入方法，其中位移和相加步骤等于音频信号的幅度。

16.根据权利要求2所述的附加信息嵌入方法，其中位移和相加步骤包括朝着频率下降端位移改进离散余弦变换系数并且将改进离散余弦变换系数与原始改进离散余弦变换系数相加。

17.根据权利要求16所述的附加信息嵌入方法，其中在位移和相加步骤，随着改进离散余弦变换系数位移了2N个单位(这里N是自然数)，改进离散余弦变换系数的频率下降了((取样频率/改进离散余弦变换系数的样本数)×2N)Hz。

18.根据权利要求17所述的附加信息嵌入方法，其中位移和相加步骤等于音频信号的幅度。

19.根据权利要求2所述的附加信息嵌入方法，其中位移和相加步骤包括使改进离散余弦变换系数位移了2N个单位(这里N是自然数)。

20.根据权利要求2所述的附加信息嵌入方法，其中位移和相加步骤包括使改进离散余弦变换系数位移了2N-1个单位(这里N是自然数)。

21.根据权利要求2所述的附加信息嵌入方法，其中位移和相加步骤包括在原始音频信号的改进离散余弦变换系数的频率掩蔽区的临界带内相加位移的改进离散余弦变换系数。

22.根据权利要求1所述的附加信息嵌入方法，其中附加信息是用于禁止传输音频信号的限制信息。

23.根据权利要求1所述的附加信息嵌入方法，其中附加信息是用于禁止将音频信号记录在记录介质上的限制信息。

24.根据权利要求1所述的附加信息嵌入方法，其中附加信息是与音频信号相对应的作品数据。

25.一种将附加信息嵌入音频信号的附加信息嵌入设备，所述设备包括：

正交变换装置，正交变换音频信号并由此计算出正交变换系数；和

位移和相加装置，沿着频率轴方向衰减和位移正交变换系数并且将所得的系数与原始的正交变换系数相加以便嵌入附加信息。

26.根据权利要求25所述的附加信息嵌入设备，其中正交变换装置进行音频信号的改进离散余弦变换以便计算出改进离散余弦变换系数，和其中位移和相加装置沿着频率轴方向衰减和位移计算的改进离散余弦变换系数并且将所得的系数与原始改进离散余弦变换系数相加以便嵌入附加信息。

27.根据权利要求25所述的附加信息嵌入设备，其中位移和相加装置将在频率轴上位移了的正交变换系数与原始正交变换系数相加以便满足频率掩蔽条件和时间掩蔽条件。

28.根据权利要求25所述的附加信息嵌入设备，其中当将位移了的正交变换系数与原始正交变换系数的值相加所得的值不高于预定值时，位移和相加装置进行相加。

29.根据权利要求25所述的附加信息嵌入设备，其中位移和相加装置根据将位移了的正交变换系数与原始正交变换系数的值相加所得的值的极性禁止位移和相加。

30.根据权利要求25所述的附加信息嵌入设备，其中当音频信号落在从高限值到低限值的范围内时，位移和相加装置进行位移和相加。

31.根据权利要求30所述的附加信息嵌入设备，其中当音频信号落在根据人的听觉特性设置的从高限值到低限值的范围内时，位移和相加装置进行位移和相加。

32.根据权利要求25所述的附加信息嵌入设备，其中位移和相加装置在预定频带内进行正交变换系数的位移和相加。

33.根据权利要求26所述的附加信息嵌入设备，其中位移和相加装置在预定频带内进行改进离散余弦变换系数的位移和相加。

34.根据权利要求25所述的附加信息嵌入设备，其中位移和相加装置分割音频信号的频带并对分割的频带的每一个进行位移和相加。

35.根据权利要求34所述的附加信息嵌入设备，其中位移和相加装置反转分割的相邻频带的位移方向。

36.根据权利要求25所述的附加信息嵌入设备，进一步包括利用伪随机信号加扰由位移和相加装置计算的信号的装置。

37.根据权利要求26所述的附加信息嵌入设备，其中位移和相加装置朝着频率升高端位移改进离散余弦变换系数并且将改进离散余弦变换系数与原始改进离散余弦变换系数相加。

38.根据权利要求37所述的附加信息嵌入设备，其中在位移和相加装置，随着改进离散余弦变换系数位移了2N个单位(这里N是自然数)，改进离散余弦变换系数的频率升高了((取样频率/改进离散余弦变换系数的样本数)×2N)Hz。

39.根据权利要求38所述的附加信息嵌入设备，其中位移和相加装置基本上等于音频信号的幅度。

40.根据权利要求26所述的附加信息嵌入设备，其中位移和相加装置朝着频率下降端位移改进离散余弦变换系数并且将改进离散余弦变换系数与原始改进离散余弦变换系数相加。

41.根据权利要求40所述的附加信息嵌入设备，其中在位移和相加装置，随着改进离散余弦变换系数位移了2N个单位(这里N是自然数)，改进离散余弦变换系数的频率下降了((取样频率/改进离散余弦变换系数的样本数)×2N)Hz。

42.根据权利要求41所述的附加信息嵌入设备，其中位移和相加装置基本上等于音频信号的幅度。

43.根据权利要求26所述的附加信息嵌入设备，其中位移和相加装置使改进离散余弦变换系数位移了2N个单位(这里N是自然数)。

44.根据权利要求26所述的附加信息嵌入设备，其中位移和相加装置使改进离散余弦变换系数位移了2N-1个单位(这里N是自然数)。

45.根据权利要求26所述的附加信息嵌入设备，其中位移和相加装置在原始音频信号的改进离散余弦变换系数的频率掩蔽区的临界带内相加位移的改进离散余弦变换系数。

46.根据权利要求25所述的附加信息嵌入设备，其中正交变换装置与位移和相加装置是整合在一起构成的。

47.根据权利要求25所述的附加信息嵌入设备，其中附加信息是用于禁止传输音频信号的限制信息。

48.根据权利要求25所述的附加信息嵌入设备，其中附加信息是用于禁止将音频信号记录在记录介质上的限制信息。

49.根据权利要求25所述的附加信息嵌入设备，其中附加信息是与音频信号相对应的作品数据。

50.一种接收附加信息嵌入其中的音频信号并解调附加信息的解调方法，所述方法包括：

接收步骤，接收通过沿着频率轴方向衰减和位移并且加入到在原频率轴上的音频信号将附加信息嵌入其中的音频信号；和

解调步骤，根据接收信号的、在频率轴上的每个预定间隔上的音频信号的极性解调附加信息。

51.根据权利要求50所述的解调方法，其中接收步骤包括接收通过沿着频率轴方向衰减和位移由正交变换音频信号所计算的正交变换系数并且将所得的正交变换系数与原始正交变换系数相加将附加信息嵌入其中的音频信号。

52.根据权利要求51所述的解调方法，其中接收步骤包括接收通过沿着频率轴方向衰减和位移由音频信号的改进离散余弦变换所计算的改进离散余弦变换系数并且将所得的改进离散余弦变换系数与原始改进离散余弦变换系数相加将附加信息嵌入其中的音频信号。

53.根据权利要求50所述的解调方法，其中接收步骤包括接收通过调幅调制将附加信息嵌入其中的音频信号，和其中解调步骤包括根据接收信号的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

54.根据权利要求50所述的解调方法，其中接收步骤包括接收通过调频调制将附加信息嵌入其中的音频信号，和其中解调步骤包括根据接收信号的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

55.根据权利要求50所述的解调方法，其中接收步骤包括接收通过希尔伯特转换将附加信息嵌入其中的音频信号，和其中解调步骤包括根据接收信号的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

56.根据权利要求50所述的解调方法，其中解调步骤包括根据在接收信号的预定频带内的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

57.根据权利要求50所述的解调方法，其中附加信息是用于禁止传输音频信号的控制信息。

58.根据权利要求50所述的解调方法，其中附加信息是用于将音频信号记录在记录介质上的控制信息。

59.根据权利要求50所述的解调方法，其中附加信息是与音频信号相对应的作品数据。

60.一种接收附加信息嵌入其中的音频信号并解调附加信息的解调设备，所述设备包括：

接收装置，接收通过沿着频率轴方向衰减和位移并且加入到在原频率轴上的音频信号将附加信息嵌入其中的音频信号；和

解调装置，根据接收信号的、在频率轴上的每个预定间隔上的音频信号的极性解调附加信息。

61.根据权利要求60所述的解调设备，其中接收装置接收通过沿着频率轴方向衰减和位移由正交变换音频信号所计算的正交变换系数并且将所得的正交变换系数与原始正交变换系数相加将附加信息嵌入其中的音频信号。

62.根据权利要求61所述的解调设备，其中接收装置接收通过沿着频率轴方向衰减和位移通过音频信号的改进离散余弦变换所计算的改进离散余弦变换系数并且将所得的改进离散余弦变换系数与原始改进离散余弦变换系数相加将附加信息嵌入其中的音频信号。

63.根据权利要求60所述的解调设备，其中接收装置接收通过调幅调制将附加信息嵌入其中的音频信号，和其中解调装置根据接收信号的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

64.根据权利要求60所述的解调设备，其中接收装置接收通过调频调制将附加信息嵌入其中的音频信号，和其中解调装置根据接收信号的、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

65.根据权利要求60所述的解调设备，其中接收装置接收通过希尔伯特转换将附加信息嵌入其中的音频信号，和其中解调装置根据接收信号的、在频率轴上的每个预定间隔上间音频信号的极性解调附加信息。

66.根据权利要求60所述的解调设备，其中解调装置根据在接收信号的预定频带内、在频率轴上的每个预定间隔上音频信号的极性解调附加信息。

67.根据权利要求60所述的解调设备，其中附加信息是用于禁止传输音频信号的控制信息。

68.根据权利要求60所述的解调设备，其中附加信息是用于将音频信号记录在记录介质上的控制信息。

69.根据权利要求60所述的解调设备，其中附加信息是与音频信号相对应的作品数据。