CN1706192A

CN1706192A - 音频流匹配与渐进扰频

Info

Publication number: CN1706192A
Application number: CN 200380101841
Authority: CN
Inventors: 达尼埃尔·勒孔特; 达尼埃拉·帕雷尔－米特佐瓦
Original assignee: Medialive SA
Current assignee: Medialive SA
Priority date: 2002-10-21
Filing date: 2003-10-21
Publication date: 2005-12-07
Also published as: US20050289063A1; EP1554878A2; WO2004039053A3; JP2006504212A; JP5678020B2; AU2003292364A8; BR0315332A; US9008306B2; FR2846179A1; FR2846179B1; JP5265075B2; WO2004039053A2; US20120201384A1; US8184809B2; AU2003292364A1; JP2013041661A

Abstract

本发明涉及一种按照标称流格式分布数字音频序列的方法，其中该音频序列是由一系列帧构成，每个帧至少包括一个数字音频模块，该数据音频模块包含多个与简单数字编码的音频单元相应的多个系数。根据本发明，该方法包括修改至少一个原始音频流模块的步骤。本发明的特征在于上述修改步骤按照代表原始音频流的结构、内容和参数以及目标的简档和外部事件的多个特征中的至少一部分特征，以匹配方式作用于上述原始音频流。在一个特殊的实施例中，该修改步骤包括替换上述系数的一部分，以便一方面产生(i)标称格式的主音频流，另一方面产生(ii)一种可通过所述目标设备的解码器重建原始音频流的修改补充信息，修改范围是可变的并由上述代表特征确定。本发明还涉及一种实施该方法的系统。

Description

音频流匹配与渐进扰频

本发明涉及数字音频流处理领域。

在本发明中人们试图提供一种听觉上可扰频并可补偿数字音频内容的系统。

本发明尤其是涉及一种可向一个音乐或语音播放机安全传输一组高质量音频流装置，目的是将其记录在存储器中或通过远距离传输网与音频播放机连接将其记录在一个解码器的硬盘上，在保存听觉质量的同时，但还要避免任何不正当的使用，如可能剽窃存储器中或解码器硬盘上录制的音频节目。

本发明涉及一种按照标称音频流格式的数字音频序列分布方法，该音频序列是由帧序列构成，每个帧至少包括一个数字音频模块，该音频模块组合有与按照相关音频流内部和所有音频解码器使用的准确模式进行简单数字编码的音频元件相应的若干数量的系数。该方法包括：

●包括修改至少上述一个系数的预备步骤，

●发送下列内容的步骤：

-符合标称格式的主音频流，其中该主音频流由一系列帧构成，这些帧包括在预备步骤中经过修改的模块，和

-与由所述主音频流分路传输的补充数字信息，使得可按照上述主音频流和上述补充数字信息，在目标设备上通过计算重构原始音频流。人们定义上述补充信息为一组数据(例如描述原始数字音频流或选自原始音频流的系数)和功能(例如，替换或交换功能)。一个被确定的功能如至少包含一个与数据和操作员有关的指令。上述数字补充信息描述从修改音频流中恢复原始音频流所需要进行的操作。

在目标设备上进行原始音频流的重现，基于已经修改的或在目标设备上实时发送的主音频流和收听时实时发送的补充信息，包括数据和借助数字例程(所有指令)执行的功能。

通过国际专利申请WO 0058963(Liquid Audio)的先前技术已经知道一种便携音乐播放器系统。一些数据如一段乐曲作为安全可携带曲段(SPT)被保护，它可与一个或多个播放器(“播放机”)连接，并可与一个专门的保护设备连接，这样可限制特殊播放器SPT浏览和保证该浏览只是从特别的保护设备开始进行。SPT与一个通过SPT数据节目限定的播放器连接，使用一个对播放器是唯一的难以改变的保护密码，并由播放器在非常安全的条件中保留。SPT与一个特殊的保护设备连接，包括唯一识别抗伪造形式，即节目限定式签名的保护设备。

人们通过美国专利US 4600941(Sony)同样了解到一种音频信号扰频系统，其中将一种音频信号分为一些模块，每个模块由多个帧形成，基于一定时间按照每个模块的预定顺序重新排列大多数帧，以便被编码，并且编码信号基于一定时间按照原来顺序被重新排列，以便被解码。在该系统中，提供将冗长部分并入邻近帧之间的部分并在基本时间压缩那些在编码时对应冗长部分的帧的第一信号处理电路，一个将不同于音频信息的控制信号并入冗长部分的信号发生电路，一个检测解码时控制信号的控制信号检测电路，以及一个第二信号处理电路，用于去掉与检测控制信号同步的冗长部分并在基本时间解压缩对回应冗长部分的帧。

在美国专利US5058159(Macrovision corporation)中同样公开音频信息信号的扰频和解扰频的方法和系统。通过倒置原始频谱，音频信号以这样一种方式被扰频，即，使原本在音频带中低端的频段移到上部，而原本在频带上部的频段移到下部。已知频率的控制音(son pilote)与具有位移频率的音频信号一起被录制。当再现时，每个相和频率的变化由控制音检索，用来产生解调信号，以便重建音频信号频率的原始内容。

通过国际专利申请WO99/55089(多媒体自适应扰频系统)的先前技术了解到一种代表多媒体数据(音频和视频)的数字取样扰频系统，以便使这些取样内容降级(dégradé)，但可认出或甚至按照要求的质量提供。质量水平与组合的信号/声噪比相关联，并借助客观和主观测验被确定。一定数量的LSB(最低有效位)数据将根据可能值的动态范围以匹配形式一个帧一个帧地扰频。所有加密钥被包括在视/听流中，并用于解码器解扰频和重现流。在解扰频后，加密钥是不可恢复的，因为它本身已被解码器扰频。

现有技术证明许多音频流保护系统，主要基于对数据的加密，在对音频流内容重新添加密钥的同时，改变具有一定结构流的格式。一种特殊和不同的实施方式是编码技术公司的实施形式，它在于通过扰频保护选择的一部分比特流(人们称之为比特流，是音频编码输出二进制流)，不是全部的比特流。代表音频信号频谱值的受保护的部分，导致当无解密解码时，音频流失真而且听起来不舒服。

本发明提出实施一种根据音频流结构，用户特征和外部事件的匹配和渐进的扰频，试图克服先前技术中的缺陷。

在本发明中，“扰频”一词是指通过合适的方法改变数字音频流，以便使该流保持在符合与之进行数字编码的规范或标准，通过一个音频播放器(或播放机)将其变为可听的，但从人类听觉认识角度讲已经变调。

在本发明中，“解扰频”一词是指通过合适方法对最初音频流进行重现处理，在信号清晰后的重现音频流与最初的原始音频流相同。原始音频流的重现是在目标设备上基于已经出现变化的主音频流或在目标设备上实时发送的主音频流和在收听期间实时发送的补充信息进行，包括数据和借助数字例程(全部指令)实施的功能。全部或部分的补充信息是根据用户的特征和权限进行发送的。如同包括在上述部分补充信息中的信息质量一样，人们要确定在联接期间发往目标的属于补充信息的数据和/或功能数量。

包括在上述部分中的信息类型与根据目标简档确定的标度水平相一致。作为类型，人们确定在联接期间发往接收人的属于补充信息的数据和/或功能的种类。例如，数据的种类与接收人的习惯(联接时间、联接期限、联接的合法性和付费情况)及其环境(居住在一个大城市、该时间的天气)，以及其特征(年龄、性别、宗教信仰、社团)有关。

上述补充信息至少由多项功能组成，与联接时间段相比，对于每个接收人来说，具有个性化。人们从联接时间开始确定期限、上述收听修改音频流的类型和已联接的元件(目标设备，服务器)。

上述补充信息细分为两个子部分，其每一部分均可通过不同的媒体或通过同一媒体被输送。例如，在通过多种媒体输送补充信息的情况下，可保证目标设备权限的最复杂的管理。

用户的“简档(profile)”是指一个包括描述和用户专门信息数字档案，例如其文化爱好、其社会与文化特征、其使用习惯如音频设备使用的周期性、一个扰频音频序列的平均收听时间、一个扰频序列的收听频率、用户准备支付的费用或有关音频序列开发的任何其它行为特征。该简档通过数字档案或一个通过信息化设备可开发的数字图表而逐渐形式化。

许多扰频系统具有一种直接的效果，或是将最初音频流全部扰频，或是最初音频流根本没有扰频，通常不同的音频序列可用同样的算法和同样的调节参数进行扰频。所使用的大量保护措施不改变根据其内容的音频流的扰频。

在本发明中，根据音频流和用户实施的特征修改算法和/或扰频的参数的同时，实施一种根据音频流(比特流)结构和/或其内容的匹配和渐进式扰频，并且这样目的是实现一种可信赖的保护，从原始音频流降级和抗剽窃的角度来看，用最少的费用，保证最后达到目标设备或用户要求的服务质量。人们采用各种不同的扰频合适匹配，如下所述。

按其最普通含义，本发明涉及一种按照标称音频流的格式输送数字音频序列的方法，这些数字音频序列是由一系列帧构成，每个帧包括至少一个音频块，组合成与简单数字编码的音频元件相一致的多种系数，该方法包括至少一个原始音频流块的修改步骤，其特征是上述修改步骤根据代表原始音频流的结构，内容和参数以及目标设备的简档和外部事件以匹配的形式作用于上述原始音频流，。

最好是，修改包括替换上述部分系数，一方面产生标称格式的主音频流，另一方面产生一种可通过目标设备解码器重建原始音频流的修改补充信息，修改范围是可变的并由上述代表特征确定。

根据一个变化的形式，修改过的主音频流在向目标设备传输补充信息之前已录入目标设备中。

根据一个变化的形式，修改过的主音频流在向目标设备传输补充信息之前，先存入一个物理载体，以便被传输到目标设备。

根据一个变化的形式，修改过的主音频流和补充信息被一起实时传输。

有益的是，上述修改的补充信息包括至少一个能执行一功能的数字例程。

根据一个特殊的实施方式，上述修改的补充信息被细分为至少两个子部分。

根据一个变化的形式，上述修改的补充信息的子部分被不同的媒体输送。

根据一个变化的形式，上述修改的补充信息的子部分被同一媒体输送。

根据一个特殊的实施方式，补充信息在物理矢量上传输。

根据一个变化的形式，补充信息是在线传输。

有益的是，上述数字音频序列根据其音频内容进行不同方式的修改。

有益的是，上述数字音频序列根据修改的标度的层次进行不同方式的修改。

有益的是，上述数字音频序列根据原始音频流每秒例行程序数千比特(kbits/s)的输送量进行不同方式的修改。

根据一个变化的形式，上述数字音频序列根据简档和由依此进行编码的规范或标准确定的数字水平进行不同方式的修改。

根据一个变化的形式，上述数字音频序列根据出现在流中的音频信道的数量进行不同方式的修改。

有益的是，上述数字音频序列根据流中出现的不同音频信道之间的匹配和多路传输进行不同方式的修改。

根据一个变化的形式，上述数字音频序列根据音频流编码的取样频率进行不同方式的修改。

根据一个变化的形式，上述数字音频序列根据使用的心理声学模型进行不同方式的修改。

根据一个特殊的实施方式，上述数字音频序列根据其分级编码进行不同方式的修改。

有益的是，上述数字音频序列被渐进式的修改，提高降级效果，直到完全扰频音频流。

最好是，上述数字音频序列用随机产生的参数和扰频结构进行修改。

根据一个变化的形式，该方法包括一个结构格式的模拟/数字转换预先步骤，该方法适用于一个模拟音频信号。

本发明还涉及一种含有一个音频服务器的数字音频序列分布系统，该音频服务器包括多个用于广播按照前述任一权利要求修改的音频流的装置和多个配备扰频电路的设备，其特征是，该服务器还包括一个记录每个目标的数字简档的登记设备，和一个控制装置，用于根据与那些代表原始音频流的结构、内容和参数以及目标简档和外部事件的多个特征中的至少一部分特征相对应的输入变量来控制修改装置。

数字音频流通常是由专用于每个音频编码的数字格式组织的帧或组块构成的序列组成，包括具有与数字音频取样专门表示有关的不同编码参数和系数的帧标头。了解音频编码器的音频信号的修改、压缩和编码的方式和/或给出的标准或规范，总是能够从比特流中提取描述和已被发往解码器的主要参数。

一旦这些参数被识别，就会被修改，以便使由编码器和/或规定的标准产生的音频流符合该编码器和/或该标准。另外，该修改保证音频信号的稳定性，但将其变为用户不可使用的，这是因为被扰频。然而，它可在与其编码相符的解码器中被理解和翻译，并由一个播放器播放无需后者被干扰。

对上述音频信号一个或多个成分的修改(频谱包、基准或谐波，心理声学模型，时间的演变，信号/噪音比，构成，压缩，量化，转换)将导致其听觉上的降级，并将其转换为一种完全不可理解并且主观听感不舒服的信号。音频信号部分或将被修改的描述音频信号的构成部分，对于每个编码-解码器来说，取决于其编码，无论它是语言、音乐、声音或特殊效果，合成声音或任何同种类型的音频信号。根据编码和合成参数的传输的实施方式，可获得一种音频信号主要特征的直接或间接信息，并将其修改。该原理适用于所有类型数字编码器以及适用于底层或改进层或两者组合层的其所有层面。

人们根据音频流的内容实施一种扰频参数的匹配：自然或合成语言、音乐、声音、自然或合成或组成音、特殊效果。例如，由MPEG-4标准确定的语言编码器HVXC(Harmonic Vecter eXcitation Coding(谐波矢量激励编码))和音乐编码器HILN(Harmonic and Individual Lines plus Noise)是根据其内容分别或联合编制音频信号的参数编码器。例如在语言是主要的情况下，来自HVXC的比特流含有体现参数LPC(线性预测编码)的LSP(线频谱对)的数值。当前帧的LSP数值分两个阶段进行矢量量化，稳定在一个数值中，以确保LPC合成滤波器的稳定性，然后以相邻系数间最小的距离，按照上升顺序被排列在比特流中。矢量量化的LSP对的指数(indice)被传送给解码器，利用标准表重现LSP和LPC数值。在用标准中预先确定图表中的其它数值替换原有指标的同时，比特流将处于合格状态，但解码的LSP数值与LPC的原有参数不一致。所以，频谱包络将被修改，而语言被损坏。

许多音频编码器的特征是标度(scalabilité)。人们确定“标度”的概念，是从“scalability(伸缩性)”英语一词而来的，其特征是一个编码器能编码或一个解码器能解码，一个二元(binaire)音频流有序系统，以便产生或重建一个多层序列。根据音频编码器的结构，人们实施一种针对底层或改进层的匹配扰频。例如，HVXC和HILN编码器，每个拥有一个底层和一个改进层，这样可具有多种结构。根据需要扰频的程度，改变底层、改进层或这两层的参数。

人们同样根据一定数量的音频流每秒千比特(kbits/s)恒定或变化流量，实施一种匹配。对于某些比较复杂的音频流(如MPEG-4型，它有一个非常宽比例的可变流量(从2kbits/s到64kbits/s))来说，人们根据流量选择扰频参数，众所周知，一个约2kbits/s小流量扰频没有大流量扰频高效，在此编码准确性要求非常高。

人们同样根据来自描述某些音频流特征的精细分级编码(fine granularscalability)，实施一种扰频参数的匹配。人们基于在MPEG-4标准中使用的英语表达式“granular scalability(分级编码)”来定义本申请中的“分级编码”概念，其特征在于一个能编码的编码器或一个能译全部有序的二元流的解码器，以便产生或重建一个多层序列。人们将分级(granularite)确定为能通过具有任何一种标度特征的系统层传输的信息量，此时系统同样是分级的。例如，采用BSAC(比特分片算术编码)的AAC(高级音频编码)编码机制可降低AAC比特流的噪音，成为一个具有在每个信道16kbits/s和64kbits/s之间的精细分级编码的比特流，其二元流量以一个1kbits/s的步幅进行调节。

对于某些比较复杂的音频流(如由MPEG-4确定的)来说，人们根据流中的对象类型，简档，水平(level)，实施一种匹配扰频，指出其复杂性和当构成音频流时使用的选择。其实，在MPEG-4音频的范围内，有大量的对象和音频简档。例如，对于自然音频对象来说，其中一种简档是“简易可标度的”，它含有CELP(激励编码线性预测)和AAC(高级音频编码)工具。扰频是根据这两个编码器的参数进行的。音频流元素的匹配改变是根据每个简档和水平包含的音频对象的类型而进行的。

根据在流中出现的音频信道的数量，人们同样实施一种扰频参数的匹配。

人们根据流中出现不同音频信道间的匹配和多路传输，实施一种扰频参数的匹配。

根据用其为音频流编码的取样频率，实施一种扰频参数的匹配。

根据用于描述某些音频编码器特征的心理声学模型，实施一种扰频参数的匹配。

例如，在MPEG-4AAC标准中，当保证音频质量的压缩时，心理声学模型估算可接受的最大量化误差的限定阈限。根据这些估算阈限，频谱数据被量化和编码。根据估算阈限选择量化，例如量化可以是一致的或不一致，并借助标度因子(scale factors)进行量化。在改变二进流内不同编码的这些标度因子值的同时，引入一个量化误差，因为标度因子不再与用心理声学模型估算而确定的那些相一致。根据希望听觉降级，适应扰频，在希望一个轻微扰频的情况下，改变最后的标度因子。有益处的是，人们想获得一个较大的听觉降级时，就改变第一标度因子，众所周知，所有标度因子与第一标度因子相比均被不同编码，相继的所有值都是错的，音频信号被严重干扰。

人们同样实施一个渐进式扰频，以便用户开始收听非扰频音频流。然后，由轻微扰频开始，逐渐加强，直到音频完全变为扰频为止。研究目的是唤起用户对音频流的兴趣，但剥夺未购买音频流的用户的权力。该应用的实施是用一个或多个给出的算法扰频音频流，在确定的时间内逐渐改变扰频参数，以便增加麻烦，直至达到完全扰频和难以听见的一个音频流。

通常根据由一个规范或一个规定标准确定的数字音频流的内容、特征、结构和成分，实现一个匹配扰频。

用一个随机产生的音频流扰频参数组合，同样实现一个扰频。用这种形式，可保证一种强有力和很难受到攻击的保护，或不会被人恶意剽窃。

根据收信方的简档，根据目标在联接服务器期间的行为(例如合法性和接受付费)，根据他准备支付的费用，根据他的习惯(例如上网时间，联接时刻)，根据他的特征(例如年龄、性别、宗教信仰、团体)，或根据与第三者联系的数据(例如属于那个团体或消费者数据库中收录的信息)，同样实施一个参数和扰频算法的匹配。

根据外部事件，例如广播时刻、收听率、社会政治事件或在广播期间的干扰，同样实施一个参数和扰频算法的匹配。

借助下面仅作为纯解释的本发明实施方式的说明，参照附图，将很好地理解本发明：图1是一种本发明用户-服务器系统特定实施方式。人们希望安全的MPEG-AAC型的音频流被发送到一个将产生一个改变的主音频流和一个输出的补充信息的分析(121)和扰频(122)系统。

原始音频流(1)可以是直接数字形式(10)或模拟形式(11)。在最后的情况下，模拟流(11)是由一个未示出的编码器转换成一个数字格式(10)。在全文的后面，我们将以输入的音频数字音频流(1)以例。

与输入数字流(1)同样格式的MPEGAAC格式的第一流(124)，除了那些其系数和/或值已经改变之外，被放在一个输出缓冲存储器(125)中。

任何格式的补充信息(123)包括已经改变的和被放入缓冲存储器(126)中的音频取样的一部分的参考资料(référence)。根据输入流(1)的特征，分析(121)和扰频(122)系统决定实施哪种匹配扰频和改变哪些流参数，同样根据用户的权力，决定实施什么样的改变方式例如渐进式与否。

然后将MPEG-AAC流(125)以如物理形式在一个CD-ROM，一个非易失的存储器，DVD等上面或者通过一个电话网类型的网络(4)，DSL(数字音频线路数字用户线路)，DLR(射频本地环)，DAB(数字音频广播)，RTC(电话交换网)，数字移动(GSM，GPRS，UMTS)，赫兹，电缆，卫星等传输给用户(8)，准确地说，传入其RAM，ROM，硬盘类型的存储器(81)中。当目标(8)希望收听在其存储器(81)中提供的一个音频序列时，会出现两种可能性：

-目标(8)不具备播放音频序列所需要的权力。在这种情况下由出现在其存储器(81)中的扰频系统(122)产生的流(125)传到合成系统(82)，该合成系统不会对其修改，将其传输到与传统音频播放器(83)一样的播放器上，其内容在听觉上大大减弱，通过播放器(83)在耳机或扩音器(9)上播放。

-或者，目标(8)拥有收听音频序列的权力。根据目标的权力，服务器(12)通过连线(6)传输经过扰频的补充信息(126)。在这种情况下，合成系统向含有需要恢复原始音频序列(1)所需的信息的服务器(12)提出收听请求。此时服务器(12)由连线(6)通过模拟或数字电话线传输网，DSL(数字音频线路数字音频线路)，DLR(射频本地环)，DAB(数字音频广播)，RTC(电话交换网)，数字移动(GSM，GPRS，UMTS)，赫兹，电缆或卫星发送补充信息(126)，以重建音频序列，以便用户(8)能够收听和/或存储音频序列。此时通过组合改变的主音频流(125)和补充信息(126)重建原始音频流，合成系统(82)开始音频序列解扰频。在合成系统(82)输出端如此获得的音频流此时被传输到传统音频播放器(83)，而原始音频序列在耳机或扩音器(9)上播放。

下面借助于第二实施例来说明本发明，其示出了根据信息流量、结构、音频帧组成以及根据获得的听觉变差效果的不同变例。

越来越多的编码器拥有操作不同流量的选择能力，以便满足特殊的应用，例如满足有限通带的要求。一个具有保证语言可接受质量为目的编码器的例子，在遵守低流量通带的同时。是为蜂窝电话而设计的AMR(自适应多速率)编码器，能够有八种不同的运行方式，其流量可在4,75kbits/s和12,2kbits/s之间变化。根据已进行音频流编码的方式，即根据流量、帧构成部分的长度，以及根据希望听觉降级程度，本发明进行不同修改。

例如在12,2kbits/s方式下，AMR帧的结构如下：

-被称为LSF(线性频谱)的与频谱对相对应的索引，与LSP(线性频谱对)参数有关，同样与参数LPC(线性预测编码)有关，即与共振峰滤波形式有关，上述索引对于所有帧是相同的；

-与四个子帧相关的四组参数，包含在整个帧中，代表160个音频取样。

子帧的每组参数构成方式如下：

-基准延迟(音调延迟)，

-基准振幅(音调增益)，

-有关激励脉冲的频率符号和位置的数据，

-有关增益的数值图表索引(代码本)。

根据希望听觉降级，改变这些不同方式的参数。

例如，通过用一个不同数值代替来修改基准延迟数值导致一个频移：较小的值导致失音，获得的效果是一个浊音，具有与“声音衰弱”相同的杂音。

用一个较大的值代替基准振幅的同时改变基准振幅导致一个抖动变形，某些部分被扩大，其它部分被“压低”。

同样对LSF值进行许多修改：

-用固定值替代LSF值产生一个干扰广播信道一样的已知声音效果；

-在盲目地改变指数的同时替代LSF值，完全损坏声音，因为添加的不同频率和振幅的杂音产生一个非常难听的声音，语言成为不可理解的。

-在改变LSF的同时，听觉降级与一个“啸声”类的基础噪声相类似，但一部分声音是听的见的，适应在这种情况下的改变，例如对于预听(préaudition)(英语是“teasing”)来说，此时希望用户能够听到该声音并选择需要它或没有这样的权力。例如，通过用一个相同值替代一些指数的值，修改一个LSF，并且逐步地在第二个LSF、第三个、第四个以及第五个LSF基础上增加一些变化，直到修改了所有LSF的值。在这种情况中获得的结果是围绕一个频率的频谱集中，例如如果将这些些指数置为1，获得一个不可理解的低频音。

对于一个较大听觉降级来说，LSF的不同修改给出少量的补充信。最好是，它们与其它修改进行组合。

有益处的是，改变有关激励构造的脉冲符号。另外，在用“假”位置替代一些脉冲位置的同时，同样修改激励，并声音是完全失真。

对于7,95kbits/s的模式来说，除了包括三个LSF为唯一一组不同外，帧结构是类似的；因此在考虑到该特殊性和与该模式对应的帧的长度时，采用不同的修改。

对于AMR编码器的其它方式来说，帧结构有轻微的不同，它既不包括基准振幅，也不包括固定值图表的增益，但包括一组与固定匹配值图表相关的增益，用于调整通过添加匹配矢量码和新特性(innovation)而构造的激励。这些应用的修改考虑到这些特性。修改这些LSF产生大量降级，然而，众所周知音频流量不大，一些小的修改就足以获得一个较大的听觉降级。

最好是，在考虑到希望获得的补充信息的流量的同时，进行不同的修改。

本发明不局限于作为实施例引用的这些修改，上述修改保证不超过允许声音的振幅值，并保证修改的主音频流与原始音频流的一致性。

有益处的是，在基于修改主音频流和补充信息的用户设备上重现之后，重现音频流听觉上与原频流一样，但从原始音频流二元的角度看是不同的，这样是为了加强安全性。

有益处的是，在基于修改主音频流和补充信息的用户设备上重现之后，重现音频流与原频流完全相同，该方法没有任何损失。

Claims

1.一种按照标称流格式分布数字音频序列的方法，其中该音频序列是由一系列帧构成，每个帧至少包括一个数字音频模块，该数据音频模块组合多个与简单数字编码的音频单元相对应的多个系数，该方法包括修改至少一个原始音频流模块的步骤，其特征在于上述修改步骤按照代表原始音频流的结构、内容和参数以及目标简档和外部事件的多个特征中的至少一部分特征，以匹配方式作用于上述原始音频流。

2.根据权利要求1中所述的分布数字音频序列的方法，其特征是，所述修改步骤包括替换上述系数的一部分，以便一方面产生一个标称格式的主音频流，另一方面产生一个可由目标设备解码器重建原始音频流的修改的补充信息，该修改的范围是可变的，并由上述代表性特征确定。

3.根据权利要求2中所述的分布数字音频序列的方法，其特征是，在向所述目标设备传输补充信息之前，将修改的主音频流录入所述目标设备。

4.根据权利要求2中所述的分布数字音频序列的方法，其特征是，在向所述目标设备传输补充信息之前，将修改的主音频流录入在一个物理载体上以便向所述目标设备传输。

5.根据权利要求2中所述的分布数字音频序列的方法，其特征是，所述修改的主音频流和补充信息一起被实时传输。

6.根据至少权利要求2-5中任一项所述的分布数字音频序列的方法，其特征是，上述修改的补充信息包括至少一个能执行一项功能的数字例程。

7.根据权利要求2-6中任何一项所述的分布数字音频序列的方法，其特征是，上述修改的补充信息细分为至少两个子部分。

8.根据权利要求7中所述的分布数字音频序列的方法，其特征是，上述修改补充信息的子部分通过不同的媒体分布。

9.根据权利要求7中所述的分布数字音频序列的方法，其特征是，上述修改补充信息的子部分通过同一媒体分布。

10.根据至少权利要求2-9中一项中所述的分布数字音频序列的方法，其特征是，所述补充信息在一个物理矢量上传输。

11.根据至少权利要求2-9中一项中所述的分布数字音频序列的方法，其特征是，所述补充信息被在线传输。

12.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照其音频内容进行不同方式的修改。

13.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照修改的标度的层次进行不同方式的修改。

14.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照原始音频流每秒数千比特的流量进行不同方式的修改。

15.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照由对其进行编码所采用的指标或标准确定的简档和数字水平进行不同方式的修改。

16.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照在音频流中出现的音频信道数量进行不同方式的修改。

17.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照在音频流中出现的不同音频信道之间的匹配和多路传输进行不同方式的修改。

18.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照音频流编码的取样频率进行不同方式的修改。

19.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照使用的心理声学模型进行不同方式的修改。

20.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照其分级编码进行不同方式的修改。

21.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照希望获得的听觉降级效果进行不同方式的修改。

22.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，将上述数字音频序列按照希望获得补充信息的希望流量进行不同方式的修改。

23.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，修改上述数字音频序列的LSP(线频谱对)指数或LSF(线谱频率)指数的值。

24.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，修改上述数字音频序列的基准延迟和振幅的值。

25.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，修改上述数字音频序列的激励脉冲的符号和位置。

26.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，上述修改保证不超过允许的声音振幅值。

27.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，根据修改的主音频流和所述补充信息而重建的上述音频序列从听觉上与所述原始音频流一样，但从所述原始音频流二元的角度看是不同的。

28.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，根据修改的主音频流和补充信息而重建的上述音频序列从听觉上和从二元的角度上看与原始音频流是相同的。

29.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，上述数字音频序列以渐进方式修改，提高降级效果，直到完全扰频音频流。

30.根据上述至少一项权利要求中所述的分布数字音频序列的方法，其特征是，利用随机产生的扰频参数和配置修改上述数字音频序列。

31.根据上述任何一项权利要求中所述的分布数字音频序列的方法，其特征是，它包括一个模拟/数字结构格式的预先转换步骤，该方法适用于模拟音频信号。

32.一种含有一个音频服务器的数字音频序列分布系统，该音频服务器包括多个用于广播按照前述任一权利要求修改的音频流的装置和多个配备扰频电路的设备，其特征是，该服务器还包括一个记录每个目标的数字简档的记录设备，和一个控制装置，用于根据与代表原始音频流的结构、内容和参数以及目标简档和外部事件的多个特征中的至少一部分特征相对应的输入变量来控制修改装置。