CN1497879A

CN1497879A - 广播编码的系统和方法

Info

Publication number: CN1497879A
Application number: CNA2003101142139A
Authority: CN
Inventors: V・斯里尼瓦桑; V·斯里尼瓦桑
Original assignee: Nielsen Media Research LLC
Current assignee: TNC US Holdings Inc
Priority date: 1998-07-16
Filing date: 1998-11-05
Publication date: 2004-05-19
Anticipated expiration: 2018-11-05
Also published as: CN100372270C

Abstract

一种编码器，配置成把一二进制代码位加到一信号的块上，该编码器在该块内选择，(i)预定信号带宽内的基准频率，(ii)与基准频率有第一预定偏移的第一代码频率，以及(iii)与基准频率有第二预定偏移的第二代码频率。增加该信号在第一代码频率处的频谱幅度，从而使该第一代码频率处的频谱幅度在其频率邻域内为最大值，减小信号在第二代码频率处的频谱幅度，从二使该第二代码频率处的频谱幅度在其频率邻域内为最小值。或者，把在第一和第二代码频率中的一个频率处频谱幅度较小的信号的部分指定为可修正信号分量，从而为了指示该二进制位，如此改变可修正信号分量的相位，从而该相位与基准信号分量的相位的差别在预定的数量内。要么，可把第一代码频率的频谱幅度与在第一频率邻域内有最大幅度的频率的频谱幅度交换，并把第二代码频率的频谱幅度与在第二频率邻域内有最小幅度的频率的频谱幅度交换。一种解码器，可配置成对该二进制位进行解码。

Description

广播编码的系统和方法

本申请是申请日为1998年11月5日申请号为第98814165.5号发明名称为“用于广播节目识别系统中的通过给音频信号添加听不见的代码而对音频信号进行编码的系统和方法”的中国专利申请的分案申请。

技术领域

本发明涉及用于把听不见的代码添加到音频信号上随后检索该代码的系统和方法。为了识别广播节目，例如可在观众测量应用中使用这种代码。

背景技术

给一信号添加辅助代码有许多配置，这些配置采用所加代码不受人注意的方式。例如，在电视广播中众所周知，通过把这些辅助代码插入视频的垂直消隐间隔或水平回扫间隔中，从而把这些辅助代码隐藏在视频的看不见的部分。把代码隐藏在视频的看不见的部分中的一个示例系统叫做“AMOL”，在4,025,851号美国专利中对其进行了描述。本申请的受让人使用该系统来监测电视节目的广播以及这些广播的次数。

其它公知的视频编码系统致力于把辅助代码隐藏在电视信号中携带较少信号能量的电视信号发射带宽的部分中。Dougherty在5,629,739号美国专利中揭示了这种系统的一个例子，该专利已转让给本发明的受让人。

其它方法和系统把辅助代码加到音频信号上，以识别这些信号，并可能通过信号分布系统跟踪这些信号的进程。这些配置的明显优点在于，不仅可适用于电视，而且还可适用于无线电广播和预先记录的音乐。此外，可在扬声器输出的音频信号中再现加到音频信号的辅助代码。相应地，这些配置提供了以麦克风作为输入的设备非侵入地截取代码并进行解码的可能性。尤其是，这些配置提供了利用参加者(panelist)所携带的便携式计量设备来测量广播观众的方案。

在为了广播观众测量而对音频信号进行编码的领域中，Crosby在3,845,391号美国专利中揭示了一种音频编码方案，其中把代码插入从中删除原始音频信号的窄频率“槽”中。该槽是在固定的预定频率(例如，40Hz)处形成的。此方案导致在包含该代码的原始音频信号的强度低时可听见该代码。

Crosby的专利后进行了一系列的改进。继而，Howard在4,703,476号美国专利中描述了把两个隔开的槽频率用于代码信号的标记(mark)和空间部分。尤其是，Kramer在4,931,871号美国专利以及4,945,412号美国专利中描述了使用一代码信号，该代码信号的幅度跟踪加有该代码的音频信号的幅度。

广播观众测量系统也是公知的，其中参加者有希望携带可拾取和存储音频信号中听不见的代码广播的带麦克风的音频监测装置。例如，Aijalla等人在WO 94/11989和5,579,124号美国专利中描述了一种配置，其中使用扩展频谱技术把一代码添加到音频信号上，从而该代码既感觉不到，也只能作为低电平的“静电”噪声而听到。此外，Jensen等人在5,450,490号美国专利中描述了一种在一组固定的频率处添加一代码并使用两个屏蔽信号之一的配置，其中屏蔽信号的选择是根据对加有该代码的音频信号的频率分析而进行的。Jensen等人未揭示代码频率随块而改变的编码配置。Jensen等人所插入的代码的强度是一测量值的预定部分(例如，从峰值强度向下30dB)，而不包括相对的最大值或最小值。

此外，Preuss等人在5,319,735号美国专利中揭示了一种多频带音频编码配置，其中把一扩展频谱代码插入所记录的音乐中，该代码与输入信号强度(最好为19dB)成固定比例(代码-音乐比)。Lee等人在5,687,191号美国专利中揭示了一种适用于数字化音频信号的音频编码配置，其中通过计算几个频带中每个频带的信号-屏蔽比，然后把代码(其强度与该带中音频输入成预定比例)插入该频带中，从而使代码强度与输入信号匹配。如该专利中所述，Lee等人还在08/524,132号未决美国专利申请中描述了一种把数字信息嵌入数字波形中的方法。

应认识到由于最好以低强度插入辅助代码以防止该代码打扰节目音频的听众，所以这些代码易受各种信号处理操作的损坏。例如，虽然Lee等人讨论了数字化的音频信号，但可注意到，先前的许多对改变音频信号进行编码的公知方案与当前所计划的数字音频标准不兼容，尤其是那些利用信号压缩方法的标准，这些信号压缩方法可能减小信号的动态范围(从而删除低电平代码)或者可能破坏辅助代码。因此，使辅助代码幸免于AC-3算法或ISO/IEC11172 MPEG标准(这一标准有希望在未来的数字电视广播系统中广泛使用)中所推荐的算法之一的压缩和随后的解压缩是尤其重要的。

本发明旨在解决以上所述的一个或多个问题。

发明内容

依据本发明的一个方面，一种用于把一二进制代码位添加到在一预定信号带宽内改变的信号块上的方法，该方法包括以下步骤：a)在预定信号带宽内选择一基准频率，把与基准频率有第一预定偏移的第一代码频率和与基准频率有第二预定偏移的第二代码频率与该基准频率相关；b)测量信号在第一代码频率附近延伸的第一频率邻域中以及在第二代码频率附近延伸的第二频率邻域中的频谱功率；c)增加第一代码频率处的频谱功率，从而使第一代码频率处的频谱功率在第一频率邻域中为最大值；以及d)减小第二代码频率处的频谱功率，从而使第二代码频率处的频谱功率在第二频率邻域中为最小值。

依据本发明的另一个方面，一种方法涉及把一二进制代码位加到具有一频谱幅度和一相位的一信号块上，该频谱幅度和相位在一预定信号带宽内改变。该方法包括以下步骤：a)在块内，选择(i)预定信号带宽内的基准频率，(ii)与第一基准频率有第一预定偏移的第一代码频率，以及(iii)与基准频率有第二预定偏移的第二代码频率；b)把第一代码频率附近信号的频谱幅度与第二代码频率附近信号的频谱幅度相比较；c)选择在第一和第二代码频率中的一个频率处相应频谱幅度较小的一部分信号作为可修正信号分量，并选择在第一和第二代码频率中另一频率处的一部分信号作为基准信号分量；以及d)选择性地改变可修正信号分量的相位，从而它与基准信号分量的相位差别不超过预定的数量。

依据本发明的再一个方面，一种方法涉及读取与强度随时间变化的信号一起发射的数字编码消息。以信号带宽来表征该信号，该数字编码消息包括多个二进制位。该方法包括以下步骤：a)在信号带宽内选择一基准频率；b)选择离基准频率第一预定频率偏移处的第一代码频率，并选择离基准频率第二预定频率偏移处的第二代码频率；c)找出第一和第二代码频率中与其相关的频谱幅度在相应频率邻域内为最大值的一个频率，找出第一和第二代码频率中与其相关的频谱幅度在相应频率邻域中为最小值的一个频率，从而确定二进制位中接收到的一个位的值。

依据本发明的又一个方面，一种方法涉及读取与具有一频谱幅度和一相位的信号一起发射的数字编码消息。以信号带宽来表征该信号，该消息包括多个二进制位。该方法包括以下步骤：a)在信号带宽内选择一基准频率；b)选择离基准频率第一预定频率偏移处的第一代码频率，并选择离基准频率第二预定频率偏移处的第二代码频率：c)确定信号在第一和第二代码频率的各预定频率邻域内的相位；以及d)确定第一代码频率处的相位是否在第二代码频率处的相位的预定值内，从而确定二进制位中接收到的一个位的值。

依据本发明的另一个方面，一种编码器，该编码器配置成把一代码的二进制位加到一信号块上，该信号的强度在一预定信号带宽内变化，该编码器包括选择器、检测器和位插入器。选择器配置成在块内选择(i)预定信号带宽内的基准频率，(ii)与基准频率有第一预定偏移的第一代码频率，以及(iii)与基准频率有第二预定偏移的第二代码频率。检测器配置成检测信号在第一代码频率附近延伸的第一频率邻域中以及在第二代码频率附近延伸的第二频率邻域中的频谱幅度。位插入器配置成通过增加第一代码频率处的频谱幅度，从而使第一代码频率处的频谱幅度在第一频率邻域中为最大值，通过减小第二代码频率处的频谱幅度，从而使第二代码频率处的频谱幅度在第二频率邻域中为最小值，从而来插入二进制位。

依据本发明的再一个方面，一种编码器配置成把一代码的二进制位加到具有一频谱幅度和一相位的信号块上。频谱幅度和相位在一预定信号带宽内变化。该编码器包括选择器、检测器、比较器和位插入器。选择器配置成在块内选择(i)预定信号带宽内的基准频率，(ii)与基准频率有第一预定偏移的第一代码频率，以及(iii)与基准频率有第二预定偏移的第二代码频率。检测器配置成检测信号在第一代码频率附近和第二代码频率附近的频谱幅度。选择器配置成选择在第一和第二代码频率中的一个频率处相应频谱幅度较小的一部分信号作为可修正信号分量，并选择在第一和第二代码频率中另一频率处的一部分信号作为基准信号分量。位插入器配置成通过选择性地改变可修正信号分量的相位，从而它与基准信号分量的相位差别不超过预定的数量。

依据本发明的又一个方面，一种解码器配置成对来自一信号块的代码的二进制位进行解码，以随时间变化的强度来发射该信号，该解码器包括选择器、检测器和位寻找器。选择器配置成在块内选择(i)信号带宽内的基准频率，(ii)离基准频率第一预定频率偏移处的第一代码频率，以及(iii)离基准频率第二预定频率偏移处的第二代码频率。检测器配置成检测第一和第二代码频率的各预定频率邻域内的频谱幅度。位寻找器配置成在第一和第二代码频率中一个频率的相关频谱幅度在其各个频率邻域内为最大值以及在第一和第二代码频率中另一个频率的相关频谱幅度在其各个频率邻域中为最小值时找出二进制位。

依据本发明的另一个方面，一种解码器配置成对来自一信号块的代码的二进制位进行解码，以随时间变化的强度发射该信号。该解码器包括选择器、检测器和位寻找器。选择器配置成在块内选择(i)信号带宽内的基准频率，(ii)离基准频率第一预定频率偏移处的第一代码频率，以及(iii)离基准频率第二预定频率偏移处的第二代码频率。检测器配置成检测信号在第一和第二代码频率的各预定频率邻域内的相位。位寻找器配置成在第一代码频率处的相位在第二代码频率处的相位的预定值内时找出二进制位。

依据本发明的再一个方面，一种编码配置以一代码对信号进行编码。该信号具有视频部分和音频部分。编码配置包括编码器和补偿器。编码器配置成对信号的各部分之一进行编码。补偿器配置成补偿编码器所引起的视频部分与音频部分之间的任何相对延迟。

依据本发明的又一个方面，一种从接收到的信号中读取数据元素的方法，该方法包括以下步骤：a)计算接收到的信号的n个样本构成的第一块的傅里叶变换；b)测试第一块的数据元素；c)如果在第一块中找到该数据元素，则把一SIS阵列的阵列元素SIS[a]设定为预定值；d)对于接收到的信号的n个样本构成的第二块，更新n个样本构成的第一块的傅里叶变换，其中第二块与第一块不同在于k个样本，其中k＜n；e)测试第二块的数据元素；以及f)如果在第一块中找到该数据元素，则把SIS阵列的阵列元素SIS[a+1]设定为预定值。

依据本发明的还有一个方面，一种把二进制代码位加到在预定信号带宽内变换的信号块上的方法，该方法包括以下步骤：a)在预定信号带宽内选择一基准频率，并把与基准频率有第一预定偏移的第一代码频率以及与基准频率有第二预定偏移的第二代码频率与其相关；b)测量块内信号在第一代码频率附近延伸的第一频率邻域中以及在第二代码频率附近延伸的第二频率邻域中的频谱功率，其中第一频率具有一频谱幅度，第二频率具有一频谱幅度；c)把第一代码频率的频谱幅度与第一频率邻域中具有最大幅度的频率的频谱幅度交换，同时保持第一频率处以及在第一频率邻域中具有最大幅度的频率处的相位角；以及d)把第二代码频率的频谱幅度与在第二频率邻域中具有最小幅度的频率的频谱幅度交换，同时保持第二频率处以及在第二频率邻域中具有最小幅度的频率处的相位角。

附图概述

从以下对本发明的详细描述并结合附图，将使本发明的这些和其它特征和优点变得更加明显起来，其中：

图1是利用本发明的信号编码和解码配置的观众测量系统的示意方框图；

图2是示出图1所示系统的编码器所执行的步骤的流程图；

图3是一音频块的频谱曲线图，其中曲线图中的细线是原始音频信号的频谱，曲线图中的粗线是依据本发明经调制的信号的频谱；

图4示出可用来防止瞬态效应的窗函数，该瞬态效应可能发生在相邻编码块之间的边界处；

图5是用于产生七位伪噪声同步序列的配置的示意方框图；

图6是形成较佳同步序列的第一块的“三联音(triple tone)”音频块的频谱曲线图，其中曲线图中的细线是原始音频信号的频谱，曲线图中的粗线是经调制的信号的频谱；

图7a示意地示出可用来形成完整的代码消息的同步和信息块的排列；

图7b示意地示出图7a所示同步块的进一步细节；

图8是示出图1所示系统的解码器所执行的步骤的流程图；以及

图9示出一编码配置，其中补偿视频数据流中的音频编码延迟。

本发明的较佳实施方式

通常，以范围在32kHz和48kHz之间的采样速率对音频信号进行数字化。例如，在数字记录音乐期间通常使用44.1kHz的采样速率。然而，数字电视(“DTV”)可能使用48kHz的采样速率。除了采样速率以外，在对音频信号进行数字化时所关心的另一个参数是用来在对音频信号进行采样时的每个瞬时代表音频信号的二进制位的数目。二进制位的数字可在例如每样本16和24个位之间变化。由每个音频信号样本使用16位而获得的幅度动态范围为96dB。此分贝测量值为最高音频幅度(2¹⁶＝65536)的平方与最低音频幅度(1²＝1)之比。由每个样本使用24位而获得的动态范围为144dB。以44.1kHz采样且被转换成每样本16位的表示的原始音频导致705.6kbit/s的数据速率。

为了把此数据速率减小到可在吞吐量低达192kbits/s的声道(channel)上发送一对这样的立体声数据的水平，对音频信号执行压缩。此压缩通常是通过变换编码来实现的。例如，可应用快速傅里叶变换或类似的频率分析过程把由N_d＝1024个样本构成的块分解成一频谱表示。为了防止可能发生在某个块与前一或后一块之间边界处的误差，通常可使用重叠的块。在每个重叠块使用1024个样本的配置中，一个块包括由“旧”样本(即，来自前一块的样本)构成的512个样本以及由“新”或当前样本构成的512个样本。把这种块的频谱表示分割成临界频带，其中每一频带包括由几个相邻频率构成的一组。可通过对每一频带内频率分量的幅度的平方求和来计算该频带中的功率。

音频压缩基于屏蔽原理，即当在一个频率(即，屏蔽频率)处存在高频谱能量时，如果能量较低信号的频率(即，被屏蔽的频率)在能量较高信号的频率附近，则人耳感觉不到该能量较低的信号。被屏蔽频率处的能量较低信号叫做被屏蔽信号。屏蔽阈值代表(i)为了使被屏蔽频率可听见而在该处所需的声学能量或(ii)可感觉到的现有频谱值的能量改变，可对每一频带动态地计算该屏蔽阈值。可根据此屏蔽阈值，使用较少位以粗略的方式来表示被屏蔽频带中的频率分量。即，以构成被压缩音频的较少数目的位对此屏蔽阈值和每一频带内频率分量的幅度进行编码。根据此数据去压缩重新构成原始信号。

图1示出一观众测量系统10，其中编码器12把一辅助代码加到广播信号的音频信号部分14。或者，如本邻域内所公知的，可把编码器12设置在广播信号分布链中的某些其它位置。发射器16把经编码的音频部分与广播信号的视频信号部分18一起发射。当位于按统计方法选中的计量点22处的接收器20接收到经编码的信号时，即使在把经编码的音频信号部分提供给接收器20的扬声器24时听众感觉不到该辅助信号的存在，也可通过处理接收到的广播信号的音频信号部分来恢复该辅助代码。为此，解码器26直接连到接收器20处可获得的音频输出28或直接连到置于扬声器24(通过它再现音频)附近的麦克风30。接收到的音频信号可以是单声道或立体声的形式。

通过频谱调制进行编码

为了使编码器12以与压缩技术兼容的方式把数字代码数据嵌入音频数据流中，编码器12最好应使用与压缩中所使用的匹配的频率和临界频带。可如此选择用于编码的音频信号的块长度N_C，从而例如jN_C＝N_d＝1024，这里j是一整数。N_C的适当值可能是例如512。如图2所示编码器12所执行的流程图的步骤40所示，编码器12利用诸如模拟-数字转换器等从音频信号部分14中得到jN_C个样本构成的第一块v(t)，这里v(t)是该块内音频信号的时域表示。如以下更详细所述，可把任选的窗应用于块42处的v(t)。假定在不使用这种窗时，在步骤44计算待编码的块v(t)的傅里叶变换

(在步骤44处实现的傅里叶变换可以是快速傅里叶变换。)

在-256到+255的范围内给傅里叶变换获得的频率作索引，这里255的索引相应于采样频率fs的刚好一半。因此，对于一48kHz的采样频率，最高的索引将相应于24kHz的频率。相应地，为了这样作索引，由以下公式给出最接近从傅里叶变换获得的特定频率分量f_j的索引：

I_{j} = (\frac{255}{24}) \cdot f_{j} - - - (1)

其中，在以下讨论中使用公式(1)把频率f_j与其相应使用I_j联系起来。

为了开发此频带中的较高听阈，可在步骤46，在4.8kHz到6kHz的范围内，从傅里叶变换

中选择用于对块进行编码的代码频率f_i。此外，该代码的每个相继位可使用由相应的代码频率索引I₁和I₀所代表的一对不同的代码频率f₁和f₀。在步骤46处有两种选择代码频率f₁和f₀的较佳方式，从而产生了类似于代码的听不见的宽频带噪声。

(a)直接序列

在步骤46处选择代码频率f₁和f₀的一个方式是使用利用跳跃序列(hopsequence)H_s和移位索引I_shift的频率跳跃算法来计算代码频率。例如，如果把N_s位组合在一起而形成一伪噪声序列，则H_s是代表相对于预定基准索引I_5k的频率偏差的N_s个数字的有序序列。对于N_s＝7的情况，可使用的跳跃序列H_s＝{2，5，1，4，3，2，5}，移位索引I_shift＝5。总之，可由以下公式来给出从跳跃序列获得的N_s位的索引：

I₁＝I_5k+H_s-I_shift (2)

以及

I₀＝I_5k+H_s+I_shift (3)

基准频率f_5k的一个可能选择是5kHz，它相应于预定基准索引I_5k＝53。选择f_5k的该值是因为它超过了人耳的平均最大敏感频率。在对音频信号的第一块进行编码时，使用跳跃序列数字中的第一个数字从公式(2)和(3)中确定第一块的I₁和I₀；在对音频信号的第二块进行编码时，使用跳跃序列数字中的第二个数字从公式(2)和(3)中确定第二块的I₁和I₀；依此类推。例如，对于序列{2，5，1，4，3，2，5}中的第五位，跳跃序列值为3，使用公式(2)和(3)，在I_shift＝5的情况下产生了索引I₁＝51，索引I₀＝61。在本例中，由以下公式给出中间频率索引：

I_mid＝I_5k+3＝56 (4)

这里，I_mid代表代码频率索引I₁和I₀之间的中间索引。相应地，每个代码频率索引与中间频率索引偏移相同的量值I_shift，但这两个偏移具有相反的符号。

(b)基于低频最大值的跳跃

在步骤46处选择代码频率的另一个方式是确定一频率索引I_max，如步骤44所确定的，该频率索引处的音频信号的频谱功率在从0Hz延伸到2kHz的低频频带中为最大值。换句话说，I_max是相应于0-2kHz范围内具有最大功率的频率的索引。有用的是在索引1处开始该计算，这是因为索引0代表“局部”DC分量，且它可由压缩中所使用的高通滤波器来修正。相对于频率索引I_max来选择代码频率索引I₁和I₀，从而它们位于人耳相对不太敏感的较高频带内。此外，相应于基准索引I_5k＝53，基准频率f_5k的一个可能的选择是5kHz，从而由以下公式给出I₁和I₀：

I₁＝I_5k+I_max-I_shift (5)

以及

I₀＝I_5k+I_max+I_shift (6)

这里，I_shift是移位索引，I_max依据音频信号的频谱功率而改变。这里，一个重要的注意点是，对于依据相应输入块的频率索引I_max的频谱调制，对不同的输入块选择一组不同的代码频率索引I₁和I₀。在此情况下，把一代码位编码成为单个位；然而，用来对每一位进行编码的频率相对于不同的块是跳跃的。

与诸如频移键控(FSK)或相移键控(PSK)等许多传统的编码方法不同的是，本发明不依靠单个固定频率。相应地，类似于扩展频谱调制系统产生“频率跳跃”效应。然而，与扩展频谱不同的是，本发明中改变编码频率的目的是避免使用可听见的恒定代码频率。

对于以上所述的两个频率选择方案(a)和(b)中的任一个，存在至少四种方法对音频块中的二进制位进行编码，即幅度调制和相位调制。以下分开描述这两种调制方法。

(i)幅度调制

为了使用幅度调制对二进制‘1’进行编码，把I₁处的频谱功率增加到一水平，从而它在其相应的频率邻域中构成最大值。在步骤48处分析相应于该频率邻域的索引邻域，以确定必须把代码频率f₁和f₀提高和衰减多少，从而它们可由检测器26检测。对于索引I₁，邻域最好可从I₁-2延伸到I₁+2，它被约束在覆盖足够窄的频率范围，从而I₁的邻域与I₀的邻域不重叠。与此同时，修正I₀处的频谱功率，以使它在其索引邻域(从I₀-2到I₀+2)中为最小值。相反，为了使用幅度调制对二进制‘0’进行编码，在其相应邻域中增加I₀处的功率并衰减I₁处的功率。

作为一个例子，图3示在频率索引从45到77的范围内绘制的jN_C样本音频块的典型频谱50。频谱52示出在对‘1’位编码后的音频块，频谱54示出编码前音频块。在此依据代码频率选择方案(a)对‘1’位进行编码的特定实例中，跳跃序列值为5，它产生了58的中间频率索引。I₁和I₀的值分别为53和63。然后，在图2的步骤56处修正53处的频谱幅度，以使它在其索引邻域中为最大值。63处的幅度已构成一最小值，所以，仅在步骤56利用小的附加衰减。

频谱功率修正过程需要在I₁和I₀的邻域中计算这四个值中的每一个值。对于I₁的邻域，这四个值如下：(1)I_max1，它是在I₁的邻域中具有最大功率的频率的索引；(2)P_max1，它是I_max1处的频谱功率；(3)I_min1，它是在I₁的邻域中具有最小功率的频率的索引；(4)P_min1，它是I_min1处的频谱功率。I₀邻域的相应值为I_max0、P_max0、I_min0和P_min。

如果I_max1＝I₁，而且如果待编码的二进制值为‘1’，则在步骤56处仅需要P_max1(即，I₁处的功率)中的令牌(token)增加。类似地，如果I_min0＝I₀，则在步骤56处仅需要P_max0(即，I₀处的功率)中的令牌减少。当增加P_max1时，在步骤56把它乘以因子1+A，这里A在约1.5到约2.0的范围内。根据结合压缩残存率测试相结合的实验能听度测试来选择A。不可感知度的条件需要A的值低，而压缩残存率的条件需要A的值大。固定的A值不能给它自己仅提供功率的令牌增加或减少。因此，对A的更逻辑的选择是基于局部屏蔽阈值的值。在此情况下，A是可变的，可以小的递增的功率值变化和残存压缩来实现编码。

在任一种情况下，由以下公式给出I₁处的频谱功率：

P_I1＝(1+A)·P_max1 (7)

适当地修正I₁处的频率分量的实部和虚部。把实部和虚部乘以同一因子，以保持相位角不变。以类似的方式把I₀处的功率减小到相应于(1+A)^-1P_min0的值。

如步骤44所确定的待编码的块的傅里叶变换还包含索引在索引值从-256到-1的负频率分量。必须依据以下公式，把频率索引-I₁和-I₀处的频谱幅度设定为分别代表I₁和I₀处的幅度的复共轭的值：

Re[f(-I₁)]＝Re[f(I₁)] (8)

Im[f(-I₁)]＝-Im[f(I₁)] (9)

Re[f(-I₀)]＝Re[f(I₀)] (10)

Im[f(-I₀)]＝-Im[f(I₀)] (11)

这里f(I)为索引I处的复数频谱幅度。如下所述，在步骤62处，现在包含二进制代码(‘0’或‘1’)的经修正的频谱将经历逆变换操作，以获得经编码的时域信号。

基于屏蔽效果的压缩算法利用位分配算法修正各频谱分量的幅度。给经历高水平屏蔽的频带(由于相邻频带中存在高频谱能量)指派较少的位，其结果是给这些频带的幅度进行粗略的量化。然而，经解压缩的音频在大多数情况下将保持一邻域内频率处的相对幅度水平。因此，即使在压缩/解压缩过程后，已在步骤56放大或衰减的编码音频流中的选中频率将保持其相对位置。

可能发生的是，块的傅里叶变换

不可能导致一频率分量在频率f₁和f₀处的幅度足以通过提高适当频率处的功率对位进行编码。在此情况下，最好不对这一块进行编码，而是对一后续块(该信号在频率f₁和f₀处的功率适合于编码)进行编码。

(ii)通过频率交换的调制

本方案是以上在章节(i)中所述的幅度调制方案的变化，在本方案中，在对一位进行编码时交换I₁和I_max1处的频谱幅度，同时保持I₁和I_max1处的原始相位角。也在I₀和I_max0处的频谱幅度之间进行类似的交换。在对一零位进行编码时，如幅度调制的情况，I₁和I₀的作用颠倒。如前一种情况，还把交换应用于相应的负频率索引。此编码方案导致能听度较低，这是因为经编码的信号只经历较小的频率失真。未编码和经编码的信号都具有相同的能量值。

(iii)相位调制

由以下公式给出有关频谱分量I₀的相位角：

φ_{0} = ta n^{- 1} \frac{Im [f (I_{0})]}{Re [f (I_{0})]} - - - (12)

这里，0≤φ₀≤2π。可以类似的方式计算有关I₁的相位角。为了对二进制数字进行编码，可把这些分量之一(通常是频谱幅度较低的分量)的相位角修正为相对于另一分量(它变为基准)为同相(即，0°)或反相(即，180°)。这样，可把二进制0编码成为同相修正，把二进制1编码成为反相修正。或者，可把二进制1编码成为同相修正，把二进制0编码成为反相修正。把被修正的分量的相位角指定为φ_M，把另一分量的相位角指定为φ_R。选择幅度较低的分量为可修正频谱分量把原始音频信号的变化减到最少。

为了实现这种形式的调制，频谱分量之一必须经历180°的最大相位变化，这使得代码可听见。然而，实际上，不必把相位调制进行到如此程度，而只需要保证两个分量的相位要么相互“接近”，要么“远”离。因此，在步骤48，可选择在φ_R周围±π/4范围内延伸的相位邻域、基准分量以及在φ_R+π周围±π/4范围内延伸的相位邻域。可修正频谱分量的相位角φ_M在步骤56处如此修正，从而该相位角根据是对二进制‘0’还是二进制‘1’进行编码而落入这些相位邻域之一中。如果可修正频谱分量已位于适当的相位邻域中，则不必进行相位修正。在典型的音频流中，约30％的部分这样“自编码”，而不需要调制。在步骤62确定逆傅里叶变换。

(iv)奇/偶索引调制

在此奇/偶索引调制方案中，使用在另一调制的情况下选中的单个代码频率索引I₁。分析由索引I₁、I₁+1、I₁+2和I₁+3所限定的邻域，以确定相应于在其邻域中有最大功率的频谱分量的索引I_m是奇数还是偶数。如果待编码的位是‘1’且索引I_m为奇数，则假定待编码的块为“自编码”。否则，选择放大该邻域中的一个以奇数索引的频率，以使它为最大值。使用偶数索引以类似的方式对位‘0’进行编码。在由四个索引给出的邻域中，具有最大频谱功率的频率的索引的奇偶性匹配于对适当位值进行编码所需的奇偶性的几率为0.25。因此，平均有25％的块为自编码。这种类型的编码将明显地降低代码的能听度。

有关通过上述类型的幅度或相位调制来进行块编码的实际问题在于，可能在相继块之间的边界处发生音频信号的大的不连续。这些急剧的转变可能使代码可听见。为了消除这些急剧的转变，可在步骤44处进行傅里叶变换前，在步骤42处把时域信号v(t)乘以一平滑的包络或窗函数w(t)。由于这里所述的频率交换方案，所以调制不需要窗函数。频率失真通常足够小，从而在相邻块的时域中仅产生较小的边缘不连续。

在图4中示出窗函数w(t)。因此，步骤54处所进行的分析限于从获得的块的中间部分。在步骤56处，根据变换来实现所需的频谱调制。

在步骤62后，在步骤64处，依据以下公式来确定经编码的时域信号：

这里，公式(13)的右手一侧的第一部分为原始音频信号v(t)，公式(13)的右手一侧的第二部分为编码，公式(13)的左手一侧为获得的经编码的音频信号v₀(t)。

虽然可通过以上所述的方法对各位进行编码，但对数字数据的实际解码还需要(i)同步，从而找到数据起点的位置，以及(ii)内部纠错，从而提供可靠的数据接收。通过频谱调制的编码而获得的原始位差错率较高，且通常可能达到20％的值。当存在这样的差错率时，可使用一和零的伪噪声(PN)序列来实现同步和纠错。例如，可使用m级移位寄存器58(这里，在图5的情况下m为3)和图5所示的异或门60来产生PN序列。为了方便，这里把n位PN序列叫做PNn序列。对于N_PN位PN序列，m级移位寄存器需要依据以下公式操作：

N_PN＝2^m-1 (14)

这里，m为整数。例如，m＝3，则7位PN序列(PN7)为1110100。此特定序列依据移位寄存器58的初始设定。在编码器12的一个加强版本中，由此PN序列来代表数据的各位-即，把1110100用于位‘1’，把补码0001011用于位‘0’。使用七位对代码的每一位进行编码导致编码开销极高。

另一个方法使用多个PN15序列，每个序列包括五位代码数据和10个附加的纠错位。此表示法在任何两个5位代码数据字之间提供了汉明距离7。可检测和纠正十五位序列中的高达三个差错。此PN15序列理想地适用于原始位差错率为20％的声道。

就同步而言，为了把PN15代码位序列74与经编码的数据流中的其它位序列区分开来，同步需要一独有的同步序列66(图7a)。在图7b所示的较佳实施例中，同步序列66的第一代码块使用该同步序列中的“三联音”70，其中充分地放大索引为I₀、I₁和I_mid的三个频率，从而如图6中的例子所示，每个频率在其各频域中变为最大值。应注意，虽然最好通过把这三个选中频率处的信号放大到在其各频率邻域中相对最大来产生三联音70，但取而代之，可对这些信号作局部衰减，从而这三个相关联的局部极值包括三个局部最小值。应注意，局部最大和局部最小的任何组合可用于三联音70。然而，由于广播音频信号包括基本上无声的周期，所以较佳的方案涉及局部放大，而不是局部衰减。作为一个序列中的第一位，从中得到三联音70的块的跳跃序列值为2，中间频率索引为55。为了使三联音块真正成为唯一的，可选择移位索引7，而不是通常的5。如图6所示，这三个索引I₀、I₁和I_mid(其幅度都被放大)为48、62和55。(在本例中，I_mid＝H_s+53＝2+53＝55。)三联音70是十五个块序列66中的第一块，它实质上代表同步数据的一位。同步序列66的其余十四个块由两个PN7序列构成：1110100、0001011。这使得这十五个同步块区别于代表代码数据的所有PN序列。

如上所述，把待发送的代码数据转换成五位的组，每一组由一PN15序列代表。如图7a所示，把一未经编码的块72插入每对相继的PN序列74之间。在解码期间，通过允许在一音频样本范围内搜索相关最大值，相邻PN序列74之间的这一未经编码的块72(或间隔)使得可进行精确同步。

在立体声信号的情况下，以相同的数字数据对左和右声道进行编码。在单声道信号的情况下，把左和右声道相结合来产生单个音频信号流。由于为调制而选择的频率对两个声道都相同，所以获得的单声道声音也有希望具有想要的频谱特性，从而在解码时，恢复相同的数字代码。

对经频谱调制的信号进行解码

在大多数情况下，可从接收器20的音频输出28处可获得的音频信号中恢复嵌入的数字代码。或者，在接收器20没有音频输出28的情况下，可利用置于扬声器24附近的麦克风30来再现模拟信号。在使用麦克风30的情况下，或者在音频输出28上的信号为模拟的情况下，解码器20把模拟音频转换成以与编码器12的采样速率匹配的较佳采样速率采样的数字输出流。在存储器和计算能力受限制的解码系统中，可使用半速率采样。在半速率采样的情况下，每个代码块将由N_c/2＝256个样本构成，频域的分辨率(即，相继频谱分量之间的频率差)将保持与全采样速率的情况相同。在接收器20提供数字输出的情况下，由解码器26直接处理该数字输出，只需适合于解码器26的数据速率而不进行采样。

解码的任务主要是把经解码的数字位与PN15序列的那些数据位匹配，该PN15序列可以是同步序列或代表一个或多个代码数据位的代码数据序列。这里考虑经幅度调制的音频块的情况。然而，除了比较相位角而不是幅度分布的频谱分析以外，对经相位调制的块的解码实际上是相同的，对经索引调制的块的解码将类似地分析在指定的邻域中具有最大功率的频率索引的奇偶性。通过同一过程还可对以频率交换编码的音频块进行解码。

在诸如可在家庭观众计量系统中所使用的音频解码的实际实现中，非常想要对音频流进行实时解码的能力。还非常想要把经解码的数据发送到中央局。可把解码器26配置成在以通常用于该应用中的硬件为基础的数字信号处理(DSP)上运行以下所述的解码算法。如上所述，可使解码器26从音频输出28或从置于扬声器24附近的麦克风30中获得输入的经编码的音频信号。为了提高处理速度并减少存储器要求，解码器26可以正常的48kHz采样速率的一半(24kHz)对输入的编码音频信号进行采样。

在恢复代表代码信息的实际数据位前，必须找到同步序列的位置。为了搜索入局音频流内的同步序列，可分析256个样本的块，每个块由最近接收到的样本和255个先前的样本构成。对于实时操作，此分析包括计算256个样本的块的快速傅里叶变换，该分析必须在下一样本到达前完成。在40MHZ DSP处理器上进行256点的快速傅里叶变换花费约600毫秒。然而，样本之间的时间仅为40毫秒，从而以当前的硬件对如上所述输入的编码音频信号进行实时处理是不实际的。

因此，可把解码器26配置成与状态信息阵列SIS(它在处理过程中不断更新)相结合实现快速傅里叶变换例程100(图8)的增加或滑动来实现实时解码，而不是计算每个256样本块的普通快速傅里叶变换。该阵列包括p个元素SIS[0]到SIS[p-1]。例如，如果p＝64，则状态信息阵列SIS中的元素为SIS[0]到SIS[63]。

此外，与计算由256个频率“箱(bin)”构成的完整频谱的常规变换不同，解码器26仅计算位于属于感兴趣的邻域(即，编码器12所使用的邻域)的频率索引处的频谱幅度。在一个典型的例子中，范围从45到70的频率索引是足够的，从而相应的频谱仅包含26个频率箱。一碰到某一消息块的结尾，所恢复的任何代码就出现在状态信息阵列SIS的一个或多个元素中。

此外，注意，在音频流的少量样本内，以快速傅里叶变换所分析的频谱通常变化极少。因此，可如此处理256个样本的块，从而在待处理的每个256样本的块中，最后k个样本是“新”的，而其余的256-k个样本来自于前一分析，而不是处理由一个“新”样本和255个“旧”样本构成的每个256样本的块。在k＝4的情况下，可通过以四个样本的增量跳越音频流来增加处理速度，这里把跳越因子k定义为k＝4，以说明该操作。

状态信息阵列SIS的每个元素SIS[p]由五个成员构成：前一条件状态PCS、下一跳转索引JI、组计数器GC、原始数据阵列DA和输出数据阵列OP。原始数据阵列DA的容量可保存十五个整数。输出数据阵列OP存储十个整数，输出数据阵列OP的每个整数相应于从恢复的PN15序列中提取的一个五位的数字。相应地，此PN15序列具有五个实际数据位和十个其它的位。例如，可把这些其它的位用于纠错。虽然可使用任何尺寸的消息块，但这里假定一个消息块中的有用数据由50位构成，这50位被分成10组，每组包含5位。

最好结合图8来说明状态信息阵列SIS的操作。在处理阶段102，把接收到的音频的256个样本的初始块读入缓冲器。在处理阶段104，通过常规的快速傅里叶变换来分析256个样本的初始块，以获得其频谱功率分布。例程100实现的所有后续变换都使用如上所述和如下所述的高速递增方案。

为了首先找到同步序列的位置，在处理阶段106，对于代表同步序列中第一位的三联音，测试相应于处理阶段102处所读取的初始256样本块的快速傅里叶变换。如上所述，通过检查初始256样本块中编码器12在产生三联音所使用的索引I₀、I₁和I_mid，可确定三联音的存在。与此256样本的初始块有关的SIS阵列的SIS[p]元素是SIS[0]，这里状态阵列索引p等于0。如果在处理阶段106找到三联音，则在处理阶段108如下改变状态信息阵列SIS的SIS[0]元素的特定成员的值：把初始设定为0的前一条件状态PCS变为1，以指示在相应于SIS[0]的样本块中找到三联音；把下一个跳转索引JI的值增加到1；以及，把原始数据阵列DA中的原始数据成员DA[0]的第一个整数设定为三联音的值(0或1)。在此情况下，把原始数据阵列DA中的原始数据成员DA[0]的第一个整数设定为1，这是因为在此分析中假设，三联音是1位的等价物。此外，对于下一个样本块，把状态阵列索引p递增1。如果不存在三联音，则在处理阶段108在SIS[0]元素中不进行这些改变，但对于下一个样本块，仍旧把状态阵列索引p递增1。无论是否在此256样本块中检测到三联音，例程100进入处理阶段110处的递增FFT模式。

相应地，在处理阶段112，通过把四个新的样本加到在处理阶段102-106处处理的初始256样本块并从中丢弃四个最旧的样本，把一个新的256样本块增量读入缓冲器。在处理阶段114，依据以下步骤来分析此新的256样本块：

步骤1：为了得到相应的中间频率分量F₁(u₀)而修正相应于初始样本块的频谱的每个频率分量F_old(u₀)，依据以下公式来应用傅里叶变换的跳越因子k：

F_{1} (u_{0}) = F_{old} (u_{0}) \exp - (\frac{2 π u_{0} k}{256}) - - - (15)

这里，u₀是感兴趣的频率索引。依据如上所述的典型例子，频率索引u₀从45变化到70。应注意，此第一步骤涉及把两个复数相乘。

步骤2：然后，从相应于初始样本块的频谱的每个F₁(u₀)中消除旧的256样本块中前四个样本的影响，在相应于当前样本块增量的频谱的每个F₁(u₀)包括这四个新样本的相关，以依据以下公式获得每个频率索引u₀的新频谱幅度F_new(u₀)：

F_{new} (u_{0}) = F_{1} (u_{0}) + Σ_{m = 1}^{m = 4} (f_{new} (m) - f_{old} (m)) \exp - (\frac{2 π u_{0} (k - m + 1)}{256}) - - - (16)

这里，f_old和f_new是时域样本值。应注意，此第二步骤涉及把一复数同一实数与一复数之积的和相加。横跨感兴趣的频率索引范围(例如，45到70)重复此计算。

步骤3：然后，考虑把256样本的块乘以编码器12中的窗函数的效果。即，以上步骤2的结果不受编码器12中所使用的窗函数的限制。因此，最好把步骤2的结果乘以此窗函数。由于时域中的相乘等价于频谱与窗函数的傅里叶变换的卷积，所以可把第二步骤的结果与窗函数进行卷积。在此情况下，用于此存在的较佳窗函数是以下公知的“升余弦”函数，该函数具有幅度为(-0.50，1，+0.50)的窄的3索引频谱：

w (t) = \frac{1}{2} [1 - \cos (\frac{2 πt}{T_{w}})] - - - (17)

这里，T_w为时域中窗的宽度。此“升余弦”只需要涉及频谱幅度的实部和虚部的三个乘法和加法操作。此操作明显地提高了计算速度。通过频率交换而进行调制的情况中不需要此步骤。

步骤4：然后检查步骤3获得的频谱是否存在三联音。如果找到三联音，则在处理阶段116如下设定状态信息阵列SIS的SIS[1]元素中某些成员的值：初始被设定为0的前一条件状态PCS变为1；下一跳转索引JI递增到1：以及，原始数据阵列DA中的原始数据成员DA[1]的第一个整数被设定为1。此外，状态阵列索引p递增1。如果没有三联音，则在处理阶段116对SIS[1]元素结构的成员不作任何改变，但仍把状态阵列索引p递增1。

由于在处理阶段118确定p还不等于64且在处理阶段120确定组计数器GC还未累加到计数10，所以以上述方式对四个样本增量进行此相应于处理阶段112-120的分析，其中把每个样本增量递增p。当到达SIS[63](在这里，p＝64)时，在处理阶段118把p复位为0，现在缓冲器中的256样本块增量离音频流中最后一次更新SIS[0]位置刚好为256个样本。每当p到达64时，检查由SIS[0]-SIS[63]所代表的SIS阵列，以确定这些元素中任一个的前一条件状态PCS是否表示三联音。如果相应于当前64样本块增量的这些元素中任一个的前一条件状态PCS不是1，则对下一64个块增量重复处理阶段112-120。(每一个块增量包括256个样本)。

对于相应于任何一组64个样本块增量的SIS[0]-SIS[63]元素中的任一个，一旦前一条件状态PCS等于1，且相应的原始数据成员DA[p]被设定为三联音位的值，则在处理阶段112-120，对于接着的64个块增量，分析同步序列中的下一位。

对于每个新块增量的起点(在这里，p复位为0)，分析同步序列中的下一位。此分析使用跳跃序列H_s的第二个成员，这是因为下一跳转索引JI等于1。从此跳跃序列号和编码中所使用的移位索引，可例如从公式(2)和(3)中确定I₁和I₀索引。然后，分析I₁和I₀索引的邻域，以在幅度调制的情况下找到最大值和最小值。例如，如果检测到I₁处的功率为最大，I₀处的功率为最小，则把同步序列中的下一位取作1。为了允许信号中的某些变化(可能因压缩或其它形式的失真而产生)，允许邻域中的最大功率或最小功率的索引与其期望值偏离1。例如，如果在索引I₁中找到功率最大值，且在I₀-1而不是I₀处找到索引I₀邻域中的功率最小值，则仍旧把同步序列中的下一位取作1。另一方面，如果使用上述相同的可允许变化检测到I₁处功率为最小值且在I₀处功率为最大值，则把同步序列中的下一位取作0。然而，如果不满足这些条件中的任一个，则把输出代码设定为-1，以指示样本块不能被解码。假定找到一个0位或一个1位，则把原始数据阵列DA中的原始数据成员DA[1]的第二个整数设定为适当的值，把SIS[0]的下一跳转索引JI递增到2，这相应于跳跃序列H_s中的第三个成员。从此跳跃序列号和编码中所使用的移位索引，可确定I₁和I₀索引。然后，分析I₁和I₀索引的邻域，以在幅度调制的情况下找到最大值和最小值，从而可从第三组64块增量中解码出下一位的值，依此类推到同步序列的十五个这样的位。然后，可把存储在原始数据阵列DA中的十五位与基准同步序列相比较，以确定同步。如果存储在原始数据阵列DA中的十五位与基准同步序列之间的差错数超过先前设定的阈值，则所提取的序列不可接受为同步，以搜索三联音重新开始搜索同步序列。

如果这样检测到有效的同步序列，则存在有效同步，然后除了每个PN15数据序列的检测不以检测到三联音(这是为同步序列而准备的)为条件以外，可使用与同步序列相同的的分析来提取PN15数据序列。在找到PN15数据序列的每一位时，把它作为原始数据阵列DA的相应整数插入。在填充了原始数据阵列DA的所有整数时，(i)把这些整数与32个可能的PN15序列中的每一个相比较，(ii)最佳的匹配序列指示选择把哪5位数字写入输出数据阵列OP的适当阵列位置，以及(iii)递增组计数器GC成员，以指示已成功地提取第一个PN15数据序列。如果在处理阶段120确定还未把组计数器GC递增到10，则程序流返回处理阶段112，以对下一个PN15数据序列进行解码。

当在处理阶段120确定组计数器GC已被递增到10，则在处理阶段122读取包含全部50位消息的输出数据阵列OP。在24kHz的半速率采样频率下，一个消息块中的样本总数为45,056。状态信息阵列SIS的几个相邻元素中的每一个代表与其相邻元素隔开四个样本的消息块，这些相邻元素可能导致同一消息的恢复，这是因为同步可发生在相互接近的音频流中的几个位置。如果所有这些消息都相同，则已接收到无差错代码的几率很高。

一旦消息被恢复且在处理阶段122读取该消息，则在处理阶段124把相应SIS元素的前一条件状态PCS设定为0，从而在处理阶段126处重新开始搜索下一消息块的同步序列的三联音。

多级编码

通常，需要把不止一个消息插入同一音频流中。例如，在电视广播的环境中，节目的网络始发台可插入其识别码和时间标记，传送该节目的网络联播(affiliate)台也可插入它自己的识别码。此外，广告商或制造商有希望加上它自己的代码。为了满足这种多级编码，可把50位系统中的48位用于该代码，可把其余的2位用于级别规定。通常，第一节目材料产生者，即网络将把代码插入音频流中。在三级系统的情况下，其第一消息块将具有被设定为00的级别位，而对于第二和第三消息块仅设定一同步序列和此第二级别位。例如，可把第二和第三消息的级别位都设定为11，以指示实际数据区还未被使用。

网络联播台现在可以解码器/编码器组合输入它自己的代码，该解码器/编码器组合将利用11级别设定找到第二消息块的同步。该台把它自己的代码插入这一块的数据区中，并把级别位设定为01。下一级编码器把它自己的编码插入第三消息块的数据区中，并把级别位设定为10。在解码期间，级别位区分每个消息级的类别。

代码擦除和改写

还可能需要提供擦除代码或擦除和改写代码的装置。可通过使用解码器检测三联音/同步序列，然后修正三联音频率中的至少一个，从而使该代码不再可恢复来实现擦除。改写涉及提取音频中的同步序列，测试数据区中的数据位，以及把一新的位仅插入没有所要位值的那些块中。通过放大和衰减数据区中的适当频率来插入该新的位。

延迟补偿

在编码器12的实际实现中，在任何给定的时间处理N_C个音频样本，这里N_C通常为512。为了实现通过延迟最少的操作，使用以下四个缓冲器：输入缓冲器IN0和IN1以及输出缓冲器OUT0和OUT1。这些缓冲器中的每一个都可保存N_C个样本。在处理输入缓冲器IN0中的样本的同时，输入缓冲器IN1接收新输入的样本。把来自输入缓冲器IN0的经处理的输出样本写入输出缓冲器OUT0，把先前经编码的样本从输出缓冲器OUT1写到输出。在有关这些缓冲器中每一个的操作结束时，对存储在输入缓冲器IN1中的样本开始处理，同时输入缓冲器IN0开始接收新的数据。现在把来自输出缓冲器OUT0的数据写到输出。只要新的音频样本到达编码，编码器的输入和输出部分中的缓冲器对之间的这种切换循环就继续。清楚的是，到达输入缓冲器的样本所遭受的延迟等价于在其经编码的版本出现在输出前以48kHz的采样斜率填充两个缓冲器所需的持续时间。此延迟近似于22ms。当在电视广播环境中使用编码器12时，必须补偿此延迟，以保持视频与音频之间的同步。

在图9中示出这种补偿配置。如图9所示，把可用于图1中的元件12、14和18的编码配置200配置成接收模拟视频和音频输入或数字视频和音频输入。把模拟视频和音频输入提供给相应的视频和音频模拟-数字转换器202和204。把来自音频模拟-数字转换器204的音频样本提供给音频编码器206，该编码器206可以是公知的设计或可以如上所述配置。把数字音频输入直接提供给音频编码器206。或者，如果输入的数字位流是数字视频和音频位流部分的混合，则把输入的数字位流提供给多路分用器208，该多路分用器208把输入的数字位流的数字视频和音频部分分离，并把分离的数字音频部分提供给音频编码器206。

由于音频编码器206如上所述相对于数字视频位流把延迟施加到数字音频位流上，所以在数字视频位流中引入延迟器210。由延迟器210在数字视频位流上所施加的延迟等于由音频编码器206在数字音频位流上所施加的延迟。相应地，将使编码配置200的数字视频和音频位流的下游同步。

在把模拟视频和音频输入提供给编码配置200的情况下，把延迟器210的输出提供给视频数字-模拟转换器212，把音频编码器206的输出提供给音频数字-模拟转换器214。在把分开的数字视频和音频位流提供给编码配置200的情况下，直接提供延迟器210的输出作为编码配置200的数字视频输出，且直接提供音频编码器206的输出作为编码配置200的数字音频输出。然而，在把混合的数字视频和音频位流提供给编码配置200的情况下，把延迟器210和音频编码器206的输出提供给多路复用器216，该多路复用器216把数字视频和音频位流重新组合成为编码配置200的输出。

以上讨论了本发明的某些修改。本邻域内的技术人员将想到其它修改。例如，依据以上描述，编码配置200包括延迟器210，该延迟器210把一延迟施加到视频位流上，以补偿音频编码器206施加到音频位流上的延迟。然而，编码配置200的某些实施例可包括视频编码器218，该视频编码器218可以是公知的设计，以根据可能的情况对视频模拟-数字转换器202的视频输出或输入的数字视频位流或多路分用器208的输出进行编码。在使用视频编码器218时，可如此调节音频编码器206和/或视频编码器218，从而施加到音频和视频位流上的相对延迟为零，从而使音频和视频位流同步。在此情况下，延迟器210不是必须的。或者，可使用延迟器210来提供适当的延迟，可把它插入视频或音频处理中，从而施加到音频和视频位流上的相对延迟为零，从而使音频和视频位流同步。

在编码配置200的又一个实施例中，可使用视频编码器218而非音频编码器206。在此情况下，需要延迟器210，以把一延迟施加到音频位流，从而音频和视频位流之间的相对延迟为零，从而使音频和视频位流同步。

相应地，本发明的描述只是示意性的，以向本邻域内的技术人员指示实施本发明的最佳模式。细节基本上可变，而不背离本发明的精神，保留对所附权利要求书范围内的所有修改的排他使用。

Claims

1.一种以一代码对一信号进行编码的编码配置，该信号具有一视频部分和一音频部分，所述编码配置包括：

编码器，配置成对该信号的一个部分进行编码；以及，

补偿器，配置成补偿编码器所引起的视频部分和音频部分之间的任何相对延迟。

2.如权利要求1所述的编码配置，其特征在于编码器是一音频编码器，该音频编码器配置成以一音频代码对信号的音频部分进行编码，补偿器配置成补偿由音频编码器引起的视频部分和音频部分之间的任何相对延迟。

3.如权利要求2所述的编码器配置，其特征在于还包括一视频编码器，该视频编码器配置成以一视频代码对信号的视频部分进行编码。

4.如权利要求1所述的编码器，其特征在于补偿器包括一延迟器，该延迟器配置成使视频部分相对于音频部分延迟，以补偿编码器所引起的视频部分和音频部分之间的任何相对延迟。

5.如权利要求1所述的编码器，其特征在于补偿器包括一延迟器，该延迟器配置成使信号的一个部分相对于另一个部分延迟，以补偿编码器所引起的视频部分和音频部分之间的任何相对延迟。

6.一种从接收到的信号中读取数据元素的方法，包括以下步骤：

a)计算接收到的信号的n样本的第一块的傅里叶变换；

b)就数据元素对第一块进行测试；

c)如果在第一块中找到该数据元素，则把一SIS阵列的一阵列元素SIS[a]设定为预定值；

d)对于接收到的信号的n个样本的第二块，更新n个样本的第一块的傅里叶变换，这里，第二块与第一块的不同在于k个样本，k＜n；

e)就数据元素对第二块进行测试；以及，

f)如果在第一块中找到该数据元素，则把SIS阵列的一阵列元素SIS[a+1]设定为预定值。

7.如权利要求6所述的方法，其特征在于依据以下公式来执行步骤d)：

F_{1} (u_{0}) = F_{old} (u_{0}) \exp - (\frac{2 π u_{0} k}{256})

以及

F_{new} (u_{0}) = F_{1} (u_{0}) + Σ_{m = 1}^{m = 4} (f_{new} (m) - f_{old} (m)) \exp - (\frac{2 π u_{0} (k - m + 1)}{256})

这里，f_old是对应于第一块的傅里叶变换频率，f_new是对应于第二块的经更新的傅里叶变换频率，u₀是感兴趣的频率索引。

8.如权利要求6所述的方法，步骤d)限于感兴趣的频率索引范围。

9.如权利要求6所述的方法，其特征在于对于预定数目为m的数据元素重复步骤d)-f)。

10.如权利要求9所述的方法，其特征在于还包括以下步骤：

g)把预定数目为m的数据元素与一基准相比较；

h)把一原始数据阵列DA的一个整数设定为依据步骤g)的一个值。

11.如权利要求10所述的方法，其特征在于重复步骤d)-h)，直到找到预定的数据元素。