CN108174614A

CN108174614A - 用于对致损耗地压缩的音频信号进行处理的方法和设备

Info

Publication number: CN108174614A
Application number: CN201780003220.1A
Authority: CN
Inventors: D·佩尔里奇内夫
Original assignee: Ask Industries GmbH
Current assignee: Ask Industries GmbH
Priority date: 2016-03-14
Filing date: 2017-03-13
Publication date: 2018-06-15
Anticipated expiration: 2037-03-13
Also published as: DE102016104665A1; WO2017157841A1; US10734000B2; EP3403260A1; US20190080702A1; EP3403260B1; CN108174614B

Abstract

本发明涉及一种用于对致损耗地压缩的音频信号2进行处理的方法，包括如下步骤：‑提供致损耗地压缩的音频信号2；‑将音频信号2变换为频谱，在频谱中将音频信号2的能量与音频信号2的频率相关联；‑确定在频谱中的局部的振幅极限的频率f_i；‑确定第一选择标准并且预选两个直接依次跟随的局部的振幅极限的频率f_i，所述频率f_i符合第一选择标准；‑确定第二选择标准并且选择两个直接依次跟随的局部的振幅极限的、符合第一选择标准的预选频率f_i，所述频率f_i附加地符合第二选择标准；‑产生音频填充信号(AFS)；以及‑通过将音频填充信号(AFS)引入到符合第二选择标准的频率f_i之间的频率范围中，处理音频信号2，使得所述频率范围至少部分地、尤其完全地用音频填充信号(AFS)来填充。

Description

用于对致损耗地压缩的音频信号进行处理的方法和设备

技术领域

本发明涉及一种用于对致损耗地压缩的音频信号进行处理的方法。

背景技术

音频信号或信息(例如音乐文件)的数据压缩本身是已知的。数据压缩的目的是减少相应的音频信号的数据大小。数据压缩原则上能够致损耗地或不致损耗地进行。另外，尤其应考虑致损耗的数据压缩，所述数据压缩例如能够通过对位于人类的听力范围的边缘处频率分量进行数据抑制来实现。这样应当几乎不损害通过听筒的主观的听感。

由于致损耗地压缩的音频信号的音质相对降低，有时期望的是，对致损耗地压缩的音频信号进行处理，也就是说将相应地丢失的频率分量至少部分地恢复或者通过类似的频率分量替代。

为了处理致损耗地压缩的音频信号，迄今为止已知不同的技术手段。所述已知的手段通常设计为相对(计算方面)昂贵的且不太有效的。因此，存在对用于对致损耗地压缩的音频信号进行处理的改进的方法进行进一步改善的需求。

发明内容

因此，本发明基于的目的是，提出一种用于对致损耗地压缩的音频信号进行处理的改进的方法。

所述目的通过根据权利要求1的方法来实现。从属权利要求涉及该方法的有利的实施例。此外，所述目的通过根据权利要求14的设备以及通过根据权利要求15的音频装置来实现。

其中所描述的方法通常用于对致损耗地压缩的音频信号进行处理。根据该方法，待处理的或经处理的音频信号例如能够是致损耗地压缩的音频文件或是这种音频文件的一部分。具体来说，例如能够是借助于mp3编码的致损耗地压缩的音频文件，即mp3编码的音频文件或mp3文件。

音频文件或所述音频文件的部分已经被解码。因此，针对mp3编码的音频文件的前述实例，例如能够应用适合的解码算法，经由所述解码算法对mp3编码的音频文件的至少部分进行解码。不言而喻，类似情况适用于不经由mp3算法，而是经由其他算法编码的音频数据。

在所有情况下，音频文件例如能够包含例如乐曲的音频信号。

原则上，在处理中，至少部分地恢复缺失，即例如在数据压缩的范围中丢失的频率分量，或通过近似的频率部分至少部分地替代缺失，即例如在数据压缩的范围中丢失的频率分量。如以下得出的，根据该方法对于致损耗地压缩的音频信号的处理，尤其至少部分地替换缺失，即例如与在数据压缩的范围中丢失的频率分量相关。

下面，详细阐述其中所描述的方法的各个步骤：

在该方法的第一步骤中，提供待处理的致损耗地压缩的音频信号。提供相应的音频信号原则上能够经由任何实体的或非实体的音源，即例如由用于处理和输出音频信号的音频装置实现。

在该方法的第二步骤中，进行将音频信号进行频谱变换。在频谱中，将音频信号的能量与音频信号的频率相关联。换言之，将音频信号的内容与其能量部分(即振幅分量或频率分量)相关联进行检查，并且将音频信号的各个能量分量在数据方面变换或转换为频率相关的表示方式。典型地，为此将音频信号划分为各个可能重叠的时间区间，将所述时间区间单个地变换或转换为频谱。音频信号到频谱的变换或转换借助于适当的算法进行，即例如借助于(快速)傅里叶变换算法进行。原则上，算法的长度是可变的。音频信号的内容的对其能量分量的检查能够包含将音频信号的能量分量分类和分组以及估算音频信号的能量分量。

在该方法的第三步骤中，在频谱中确定局部的振幅极限的频率。换言之，将频谱针对局部的振幅极限进行检查并且确定属于相应的振幅极限的频率。将局部的振幅极限理解为在限定的频率周边范围中的振幅最大值。借助于适当的分析算法进行局部的振幅极限的确定。

在该方法的第四步骤中，确定第一选择标准。基于第一选择标准，预选两个直接依次跟随的(局部的)振幅极限的频率，所述频率符合第一选择标准。因此，在第四步骤中，在第一选择标准方面检查直接依次跟随的振幅极限的配对的频率。因此，在第四步骤中，对直接依次跟随的振幅极限的频率成对地进行检查，以确定属于相应的振幅极限的频率是否符合第一选择标准。在该方法的其他步骤中，通常仅观察符合第一选择标准的频率。因此，在第四步骤中进行进一步待观察的频率或所属的振幅极限的预选。

第一选择标准通常描述特定的临界频率值(范围)(“threshold(阈值)”)。当直接依次跟随的振幅极限的频率的频率差的数值超过通过第一选择标准所描述的临界频率值(范围)时，所述直接依次跟随的振幅极限的频率符合第一选择标准，对此参照通过下述公式I示出的相互关系：

Δf_i＞|Δf_T|(I)

在此适用，Δf_i：两个直接依次跟随的振幅极限的频率差；Δf_T：临界频率值(范围)。

临界频率值(范围)能够通过将预选的频率变换为巴克刻度来确定。已知地，原则上能将频率变换为巴克刻度。基于通过下述公式II示出的相互关系进行预选的频率到巴克刻度的变换：

在此适用：z：巴克；f：待变换为巴克刻度的频率值。

经由通过公式II示出的相互关系，不仅能将将由第一选择标准所描述的预选的频率而且能临界频率值变换为巴克刻度。

原则上，临界频率值能够对应于巴克或经由调整系数调整的或与调整系数相乘的巴克。调整系数通常在0.7和1.1之间，尤其为0.9。因此，临界频率值典型地对应于0.7至1.1，尤其0.9巴克。换言之，相应的频率的频率差应对应于巴克或近似对应于巴克，以便符合第一选择标准。通过调整系数得到临界频率值的一定的变化性。

在该方法的第五步骤中，确定第二选择标准。基于第二选择标准，选择两个直接依次跟随的局部的振幅极限的(基于第一选择标准)预选的频率，所述频率符合第二选择标准。在第五步骤中，在第二选择标准方面观察预选的频率。因此，在第五步骤中，进行对预选的频率的检查，以确定所述频率(附加地)是否满足第二选择标准。

第二选择标准能够描述临界能量值(范围)。当在相应的预选的频率之间的能量含量的数值低于通过第二选择标准所描述的临界能量值(范围)(“threshold”)时，所述相应的预选的频率符合第二选择标准。

临界能量值(范围)能够通过确定的临界能量含量限定。当相应的预选的频率的数值低于通过第二选择标准所描述的临界能量含量时，所述相应的预选的频率符合第二选择标准，对此参照通过下述式III示出的相互关系：

在此适用：S(f)：通过两个直接依次跟随的振幅极限的频率或频率值f1、f2所描述的面积(在两个直接依次跟随的振幅极限的频率或频率值f1、f2之间的能量含量)；T：临界能量含量。

临界能量值(范围)替选地也能够通过如下方式确定，即通过其中一个预选频率(“低频”)，其中这个频率与较低(频率较低的)振幅极限相关联，产生第一能量曲线分布，并且通过其中一个频率(“高频”)，其中是这个频率与直接跟随的较高(频率较高的)振幅极限相关联，产生第二能量曲线分布，并且将这两个能量曲线分布变换为频谱的方式来确定。由此，临界能量值通过相应的能量曲线分布限定。第一能量曲线分布从两个直接依次跟随的振幅极限的(频率)低的振幅极限的频率起始，朝两个直接依次跟随的振幅极限的(频率)大(较高)的频率极限的方向伸展。第二能量曲线分布从两个直接依次跟随的振幅极限的(频率)大的频率极限的频率起始，朝两个直接依次跟随的振幅极限的(频率)小(较低)的频率极限的方向伸展。所产生的能量曲线分布能够在数据方面变换为频谱。通过在频率和能量曲线分布之间的实际的频率曲线分布，限定闭合的范围或闭合的面积。所述范围在频率分量方面通过两个直接相邻的振幅极限的频率来限定，从而在能量分量方面通过在振幅极限和在其之间伸展的能量曲线分布之间的实际频率曲线分布来限定。所述范围通常仅包含能量值≥零。如果几何地关于频谱方面观察所述范围，那么所述范围对应于通过这两个直接相邻的振幅极限、在这两个振幅极限伸展的能量曲线分布或频率曲线分布和频率轴线(x轴线)之间几何地限定的面积。

典型地，基于心理声学的模型进行能量曲线分布的产生。因此，为了产生能量曲线分布，典型地考虑心理声学的模型或从心理声学的模型中推导出能量曲线分布。心理声学的模型通常描述特定的声音的如下频率分量，所述频率分量在特定的声音环境中，即在可能存在其他声音的情况下，可由人的听觉感知到。优选使用的心理声学的模型是频谱遮罩或屏蔽的模型，通过所述模型描述的是，人的听力不能或仅能以小的敏感度感知特定的声音的频率分量。所述遮罩或屏蔽效应基本上基于人的内耳的解剖学的或机械的条件，并且例如造成：在中间的频率范围中的低能的或小声的声音不能在同时播放在低频率范围中的高能的或大的声音的情况下被感知到；在低频率范围中的声音屏蔽在中间的频率范围中的声音。

能量曲线分布尤其在相应的预选的频率中通过人的听觉的从相应的心理声学的模型给出的听阈推导出的。也就是说，心理声学的模型分别应用于两个直接依次跟随的振幅极限的频率。第一能量曲线分布对应于针对较低振幅极限的频率、从心理声学的模型推导出的听阈的部分，所述部分朝频率升高的方向延伸。第二能量曲线分布对应于针对较高振幅极限的频率、从心理声学的模型推导出的听阈的部分，所述部分朝频率降低的方向延伸。

对于所述方法重要的是，对两个直接依次跟随的振幅极限的相应的频率之间的频率范围进行处理，所述相应的频率不仅符合第一选择标准而且符合第二选择标准。因此，至今为止所描述的方法步骤涉及在待处理的音频信号之内的待再处理的频率范围的确定。

在该方法的第六步骤中，产生或生成音频填充信号。鉴于在待处理的音频信号之内的之前确定的待处理的频率范围，典型地有针对性地产生音频填充信号。因此，鉴于通过直接依次跟随的、不仅符合第一选择标准而且符合第二选择标准的频率限定的频率范围，典型地有针对性地产生音频填充信号，以便填满所述频率范围并且至少部分地，尤其完全地填充在所述频率之间给出的“能量谷”。因此，所产生音频填充信号适当地具有位于相应的直接依次跟随的振幅极限的频率之间的频率范围。例如借助于适合的信号发生器进行音频填充信号的产生。

在该方法的第七步骤中，通过将音频填充信号插入到在相应的符合第一选择标准和第二选择标准的频率之间的每个频率范围中，进行音频信号的实际处理，使得至少部分地，尤其完全地用音频填充信号填满相应的频率范围。

换言之，根据该方法确定相应的从音频信号的数据压缩中得到的“能量谷”并且将所述能量谷以相对于所确定的“能量谷”产生的音频填充信号的形式有针对性地用特定的数据内容填充，由此实现音频信号的处理。由此得出，如在更上面提到的，根据该方法处理音频信号尤其通过至少部分地替代音频信号的缺失，即例如在数据压缩的范围中丢失的频率分量来实现。

通过所述方法的所描述的步骤，提供了尤其鉴于经处理的音频信号的质量和处理的效率方面改进的、用于对致损耗地压缩的音频信号进行处理的方法。

不言而喻，在该方法的可选的第八步骤中可行的是，经由至少一个例如配置为扬声器装置或至少一个这种综合扬声器装置输出相应的经处理的音频信号。因此，该方法的可选的第八步骤能够提出将经处理的音频信号经由至少一个信号输出装置输出。替选地或附加地，在该方法的第八步骤中可行的是，相应地将处理的音频信号存储在存储装置中，即例如在硬盘存储器中(其间)。能够相应地将处理的已存储的音频信号在随后的时间点经由至少一个相应的信号输出装置输出和/或经由适合的、尤其无线的通信网络传输给至少一个通信伙伴。因此，该方法的可选的第八步骤(也)能够提出，将经处理的音频信号存储在至少一个存储装置中和/或将经处理的音频信号传输给至少一个通信伙伴。经处理的音频信号能够在输出和/或存储和/或传输之前进行傅里叶逆变换。

可行的是，在处理音频信号之前，在通过将音频填充信号引入到符合第二选择标准的频率之间的频率范围中，与较低(频率较低的)振幅极限的所选频率(“低频”)相关联地产生可能的第三能量曲线分布，并且与相对(频率较高的)振幅极限的所选频率(“高频”)相关联地可能的第四能量曲线分布，并且将这两个能量曲线分布变换为频谱。可能的第三能量曲线分布从两个直接依次跟随的振幅极限的(频率)小的振幅极限的频率起始，朝这两个直接依次跟随的振幅极限的(频率)大的振幅极限的频率的方向伸展。可能的第四能量曲线分布从两个直接依次跟随的振幅极限的(频率)大(较高)的振幅极限的频率起始，朝这两个直接依次跟随的振幅极限的(频率)小(较低)的振幅极限的频率的方向伸展。所产生的能量曲线分布还能够数据方面地变换为频谱。通过频率和能量曲线分布同样限定闭合的范围或闭合的面积。所述范围在频率分量方面还通过两个直接依次跟随的振幅极限的频率限定，而在能量分量方面通过在其之间伸展的能量曲线分布来限定。所述范围典型地仅包含能量值≥零。如果几何地关于频谱方面观察所述范围，那么所述范围还对应于通过这两个直接相邻的振幅极限、在这两个振幅极限伸展的能量曲线分布或频率曲线分布和频率轴线(x轴线)之间几何地限定的面积。

典型地，同样基于心理声学的模型进行可能的第三和第四能量曲线分布的产生。因此，为了产生能量曲线分布，典型地考虑心理声学的模型或从心理声学的模型中推导出能量曲线分布。在此，类似地适用结合前两个能量曲线分布的陈述。

可能的第三和第四能量曲线分布同样尤其在相应的预选的频率中通过人的听觉从相应的心理声学的模型给出的听阈推导出的。也就是说，心理声学的模型分别应用于两个直接依次跟随的振幅极限的频率。可能的第三能量曲线分布对应于相对较低振幅极限的频率从心理声学的模型推导出的听阈的部分，所述部分朝频率升高的方向延伸。可能的第四能量曲线分布对应于相对较高振幅极限的频率从心理声学的模型推导出的听阈的部分，所述部分朝频率降低的方向延伸。

只要，如更上面所阐述，与由第二选择标准所描述的临界能量值相关联地产生相应的能量曲线分布，并且应当将所述能量曲线分布变换为频谱，就能够区分所述(前两个)能量曲线分布与在前一段中提到的(第三和第四)能量曲线分布。

另外，将音频填充信号至少部段地，尤其完全地引入到频谱的由两个预选的频率和相应的能量曲线分布所限定的范围中。在此，通过如下方式进行音频信号的处理，即通过将音频填充信号引入到频谱的通过两个直接相邻的振幅极限的频率和相应的能量曲线分布限定的频率范围中，使得频谱的由两个直接依次跟随的振幅极限的频率和相应的能量曲线分布限定的范围至少部分地，尤其完全地用音频填充信号来填充。

在所有情况下适用的是，与待处理的音频信号的声学参数相关地或无关地，尤其涉及音频信号的相应的能量分量和频率分量，能够产生音频填充信号。然而，适宜地，与音频信号的声学参数无关地，即仅考虑到将频谱的由两个直接相邻的振幅极限的频率限定的范围至少部分地填满，从而产生音频填充信号，因为这样能够必要时显著地降低用于产生音频填充信号的计算成本。

只要与音频信号的声学参数相关地产生音频填充信号，就能够根据音频信号的特定的声学参数，尤其振幅曲线分布和/或频率曲线分布，或根据另一待处理的音频信号的特定的声学参数，尤其振幅曲线分布和/或频率曲线分布，对频谱的由两个直接依次跟随的振幅极限的频率限定的区域进行填满或填充(Aus-bzw.Befüllung)。这样，能够实现经处理的音频信号对于人耳而言可能更自然的感知。

原则上适的是，根据本发明将音频信号变换为频谱，能够使用巴克刻度。已知24个单个的巴克或巴克刻度的带对应于人的听觉的24个单独频率组，即通过人的听觉共同地评估的频率范围。单个的巴克或巴克刻度的带包含不同的频率或频率范围或带宽。频谱的可能的频带能够对应于24个巴克或24个巴克刻度的带。

本发明除了所述方法以外，还涉及一种用于依照根据前述方法处理致损耗地压缩的音频信号的设备。所述设备包括至少一个硬件和/或软件实现的控制装置，所述控制装置的特征在于，设置为

-将音频信号变换为频谱，在频谱中将音频信号的能量与音频信号的频率相关联；

-确定在频谱中的局部的振幅极限的频率；

-确定第一选择标准并且预选两个直接依次跟随的局部的振幅极限的频率，所述频率符合所述第一选择标准；

-确定第二选择标准并且选择两个直接依次跟随的振幅极限的预选的、符合第一选择标准的频率，所述频率附加地符合第二选择标准；

-产生音频填充信号；以及

-通过将音频填充信号引入到符合第二选择标准的频率之间的范围中，由此处理音频信号，使得所述范围至少部分地、尤其完全地用音频填充信号来填充。

不言而喻，在控制装置的单个硬件和/或软件实现的装置中也能够根据本发明执行单个、多个或所有步骤。在此情况下，所述设备包括配设有适当的装置或通信控制装置。如在下文中得出的，所述设备能够是用于机动车的音频装置的或音频系统的部分。

本发明还涉及一种用于机动车的音频装置或音频系统。音频装置能够是机动车侧的用于将多媒体内容输出给机动车的乘客的多媒体设备的部分，所述多媒体内容尤其是音频和/或视频内容。音频装置包括至少一个信号输出装置，即例如包括扬声器装置，所述扬声器装置设置为将经处理的音频信号声学输出到机动车的形成客舱的至少一部分内部空间中。音频装置的特征在于，所述音频装置为了处理致损耗地压缩的音频信号，具有至少一个用于处理致损耗地压缩的音频信号的如上所述的设备。

结合所描述的方法的所有实施例类似地不仅适用于对致损耗地压缩的音频信号进行处理的设备而且适用于音频装置。

附图说明

下面，根据附图详细阐述本发明的实施例。在此示出：

图1示出用于执行一个实施例的方法的设备的原理图；

图2示出一个实施例的方法的方框图；

图3、4分别示出一个实施例的心理声学的模型的原理图；以及

图5-8分别示出一个实施例的频谱的原理图，在所述频谱中音频信号的能量与音频信号的频率相关联。

具体实施方式

图1示出用于对致损耗地压缩的音频信号2进行处理的设备1的原理图。音频信号2例如能够是致损耗地压缩的音频文件。具体来说，例如能够是借助于mp3算法致损耗地压缩的mp3编码的音频文件(mp3文件)。音频文件已经能够至少部分地解码。音频文件例如能够包含乐曲。

在实施例中示出的设备1形成机动车4的音频系统或音频装置3的一部分。音频装置3能够是用于将多媒体内容，尤其音频和/或视频内容输出给机动车4的乘客的机动车侧的多媒体设备(未示出)的部分。音频装置3包括至少一个例如构成为扬声器装置或至少一个这种综合信号输出装置5，所述信号输出装置5设置为用于将经处理的音频信号6声学输出到机动车4的形成客舱的至少一部分的内部空间7中。

所述设备1包括中央的硬件和/或软件实现的控制装置8，所述控制装置8设置为用于实现进一步详细地参照图2阐述的、用于对致损耗地压缩的音频信号2进行处理的方法。

进一步参照图2阐述的、根据本方法执行的单个、多个或所有步骤S1-S7(S8)能够在控制装置8的单个硬件和/或软件实现的装置(未示出)中进行。在此情况下，所述设备1包括配设有相应的装置的控制装置8。

图2示出用于对致损耗地压缩的音频信号2进行处理的方法的一个实施例的方框图。所述方法能够借助于前述设备1执行。

在方法的第一步骤S1中，提供待处理的、致损耗地压缩的音频信号2。音频信号2的提供原则上能够经由任何实体的或非实体的音源，即例如音频装置3进行。具体来说，音频信号2例如能够由音频装置3的数据存储器(未示出)提供。

在方法的第二步骤S2中，进行音频信号2到频谱中的变换。在频谱中，将音频信号2的能量与音频信号2的频率相关联。为此，将音频信号2的内容针对其能量部分，即振幅分量或频率分量进行检查，并且将音频信号2的各个能量分量借助于适合的算法，即例如借助于(快速)傅里叶变换算法在数据方面变换为频率相关的表示方式。相应的频谱尤其在图5中以原理图示出。

在方法的第三步骤S3中，在频谱中确定局部的振幅极限的频率f_i；因此将频谱针对局部的振幅极限进行检查，并且确定与各个相应的振幅极限的频率f_i。将在图5-8中，通过点来图形性强调局部的振幅极限理解为在限定的频率周边范围中的振幅最大值。

在方法的第四步骤S4中，确定第一选择标准。基于第一选择标准，预选两个直接依次跟随的(局部的)振幅极限的频率f_i，所述频率f_i符合第一选择标准。因此，在第四步骤S4中，相对于第一选择标准检查直接依次跟随的振幅极限的配对的频率。因此，在第四步骤中，对直接依次跟随的振幅极限的频率f_i的成对地针对第一选择标准进行检查，以确定所述频率f_i是否符合第一选择标准。在方法的其他步骤S5-S7中，仅观察符合第一选择标准的频率f_i。因此，在第四步骤S4中进行进一步待观察的频率f_i的预选。

第一选择标准描述特定的临界频率值Δf_T。当直接依次跟随的振幅极限的频率f_i的频率差Δf_i的数值超过通过第一选择标准所描述的临界频率值Δf_T时，则所述直接依次跟随的振幅极限的频率f_i符合第一选择标准，对此参照通过下述公式示出的相互关系：

Δf_i＞|Δf_T|

在此适用，Δf_i：两个直接依次跟随的振幅极限的频率差；Δf_T：临界频率值。

临界频率值Δf_T能够通过将预选的频率f_i变换为巴克刻度来确定。基于通过下述公式示出的相互关系进行预选的频率到巴克刻度的变换：

在此适用：z：巴克；f：待变换为巴克刻度的频率值。

经由上述公式示出的相互关系，不仅能将预选的频率f_i而且能将由第一选择标准所描述的临界频率值Δf_T变换为巴克刻度。

原则上，临界频率值Δf_T能够对应于巴克或经由调整系数调整的或与调整系数相乘的巴克。调整系数通常在0.7和1.1之间，尤其为0.9。因此，临界频率值通常对应于0.7至1.1，尤其0.9巴克。

在方法的第五步骤S5中，确定第二选择标准。基于第二选择标准，(基于第一选择标准)选择所述预选的频率，所述频率(附加地)符合第二选择标准。在第五步骤中，在第二选择标准方面对预选的频率f_i进行检查，以确定所述频率(附加地)是否满足第二选择标准。(附加地)满足第二选择标准的频率f_i还能够变换为巴克刻度。

第二选择标准能够描述临界能量值。当在相应的预选的频率f_i之间的能量含量的数值低于通过第二选择标准所描述的临界能量值时，则所述相应的预选的频率f_i符合第二选择标准。

临界能量值能够由确定的临界能含量T来限定。当相应的预选的频率的数值低于通过第二选择标准所描述的临界能量值T时，则所述相应的预选的频率f_i符合第二选择标准，对此参照通过下述公式示出的相互关系：

在此适用，S(f)：由两个直接依次跟随的振幅极限的频率f₁、f₂所描述的面积(在两个直接依次跟随的振幅极限的频率f₁、f₂之间的能量含量)；T：临界能含量。

为此，参照在图6中示出的包含两个预选的频率f₁、f₂的频谱的原理图，所述频谱f₁、f₂也涉及另外的，即在图5中示出的频谱的局部。从图6中，图解说明由两个直接依次跟随的振幅极限的频率f₁、f₂所描述的面积(用阴影线表示)以及通过水平线示出的临界能量含量T。用阴影线表示的面积对应于通过上述公式示出的积分。

临界能量值替选地也能够通过如下方式确定，即通过从预选的相对较低(频率较低的)振幅极限的频率f₁(“低频”)产生第一能量曲线分布EV1，并且从预选的相对较高(频率较高的)振幅极限的频率f₂(“高频”)产生第二能量曲线分布EV2，并且将这两个能量曲线分布EV1、EV2变换为频谱的方式来确定。然后，临界能量值由相应的能量曲线分布EV1、EV2来限定。

根据图7可见的是，能够将所产生的能量曲线分布EV1、EV2的数据变换为频谱。第一能量曲线分布EV1从较低频率f₁起始，朝较高频率f₂的方向伸展。第二能量曲线分布EV2从较高频率f₂起始，朝较低频率f₁的方向伸展。

通过在频率f₁、₂和能量曲线分布EV1、EV2之间的实际的频率曲线分布，限定闭合的范围或闭合的面积。所述范围在频率分量方面由两个频率f₁、₂限定，而在能量分量方面通过实际的频率曲线分布和在所述频率曲线分布之间伸展的能量曲线分布EV1、EV2限定。所述范围通常仅包含能量值≥零。如果几何地关于频谱方面观察所述范围，那么所述范围对应于由这两个直接相邻的振幅极限、在这两个振幅极限伸展的能量曲线分布或频率曲线分布和频率轴线(x轴线)之间几何地限定的，在图7中用阴影线示出的面积。

基于心理声学的模型进行能量曲线分布EV1、EV2的产生。优选使用的心理声学的模型是频谱遮罩或屏蔽的模型。根据图3可见的是，能量曲线分布EV1、EV2是在相应的预选的频率f₁、₂中通过人的听觉从相应的心理声学的模型给出的听阈推导出的。也就是说，所使用的心理声学的模型分别应用于两个频率f₁、₂。第一能量曲线分布EV1对应于针对较低频率f₁从心理声学的模型推导出的听阈的部分，所述部分朝频率升高的方向延伸(参照图3中左边的弧形的括号)。第二能量曲线分布EV2对应于针对较高频率f₂从心理声学的模型推导出的听阈的部分，所述部分朝频率降低的方向延伸(参照图3中右边的弧形的括号)。不言而喻，与图3中的图示不同，也可行的是，能量曲线分布EV1、EV2在x轴线上方的数值范围中交叉或相交。

对于所述方法重要的是，对两个直接依次跟随的振幅极限的相应的频率f_i或f₁、₂之间的频率范围进行处理，所述频率不仅符合第一选择标准而且符合第二选择标准。因此，至今为止所描述的方法步骤S1-S5涉及在待处理的音频信号2之内的、待根据本发明地处理的频率范围的确定。

在方法的第六步骤S6中，借助于适合的信号发生器产生或生成音频填充信号AFS。相对于在待处理的音频信号2之内的、之前确定的待处理的频率范围，有针对性地产生音频填充信号AFS。因此，相对于通过两个直接依次跟随的振幅极限的、不仅符合第一选择标准而且符合第二选择标准的频率f_i或f₁、₂限定的频率范围，有针对性地产生音频填充信号AFS，以便填满所述频率范围并且填充在所述频率f_i之间给出的“能量谷”。因此，所产生的音频填充信号AFS具有位于各个直接依次跟随的振幅极限的频率f_i之间的频率范围。

与音频信号2的声学参数相关地或无关地，尤其涉及音频信号2的相应的能量分量和频率分量，能够产生音频填充信号AFS。在所描述的实施例中，与音频信号2的声学参数无关地，即仅考虑到将频率分量通过频率f₁、₂来限定，而将能量分量通过实际的频率曲线分布和在其之间伸展的能量曲线分布EV3、EV4限定的范围来填满，产生音频填充信号AFS。

在方法的第七步骤S7中，通过将音频填充信号AFS引入到在相应的符合第一选择标准和第二选择标准的频率f_i之间的相应的频率范围中进行音频信号2的实际处理，使得用音频填充信号AFS填充相应的频率范围。

在通过将音频填充信号AFS引入来处理音频信号2之前，产生从选择的相对较低(频率较低的)振幅极限的、较低(“较低的”)频率f₁起始的、另外的或第三能量曲线分布EV3和从选择的相对较高(频率较高的)振幅极限的较高(“较高的”)频率f₂起始的、另外的或第四能量曲线分布EV4。

根据图8可见的是，与能量曲线分布EV1、EV2类似地，将所产生的能量曲线分布EV3、EV4的数据变换为频谱。第三能量曲线分布EV3从较低频率f₁起始，朝较高频率f₂的方向伸展。第四能量曲线分布EV4从较高频率f₂起始，朝较低频率f₁的方向伸展。

通过在频率f₁、₂之间的实际的频率曲线分布和能量曲线分布EV3、EV4限定了闭合的范围或闭合的面积。所述范围在频率分量方面通过振幅极限的频率f₁、₂限定而在能量分量方面通过实际的频率曲线分布和在其之间伸展的能量曲线分布EV3、EV4限定。所述范围通常仅包含能量值≥零。如果几何地关于频谱方面观察所述范围，那么所述范围对应于通过这两个直接相邻的振幅极限的频率f₁、₂、在所述频率伸展的能量曲线分布或频率曲线分布和频率轴线(x轴线)之间几何地限定的，在图8中用阴影线示出的面积。

同样地，基于心理声学的模型进行第三和第四能量曲线分布EV3、EV4的产生。优选使用的心理声学的模型在此也是频谱遮罩或屏蔽的模型(参见图4)。根据图4可见的是，能量曲线分布EV3、EV4是在相应的预选的频率f₁、₂中通过人的听觉从相应的心理声学的模型给出的听阈推导出的。在此也就是说，所使用的心理声学的模型分别应用于两个直接依次跟随的频率f₁、₂。第三能量曲线分布EV3对应于相对较低频率f₁从心理声学的模型推导出的听阈的部分，所述部分朝频率升高的方向延伸(参照图4中左边的弧形的括号)。第四能量曲线分布EV4对应于相对较高频率f₂从心理声学的模型推导出的听阈的部分，所述部分朝频率降低的方向延伸(参照图4中右边的弧形的括号)。不言而喻，与图4中的图示不同，在此也可行的是，能量曲线分布EV3、EV4在x轴线上方的数值范围中交叉或相交。

通常适用：能够区分(前两个)能量曲线分布EV1、EV2与第三和第四能量曲线分布EV3、EV4。

因此，总的来说，根据本发明确定从音频信号2的数据压缩中得到的“能量谷”并且将所述能量谷以相对于确定的“能量谷”产生的音频填充信号AFS的形式，有针对性地用特定的数据内容来填充，由此实现对音频信号2的处理。由此得出，通过至少部分地替代音频信号2的缺失，即例如在数据压缩的范围中丢失的频率分量来实现根据方法地处理音频信号2。

方法的可选的第八步骤S8能够提出，经由至少一个信号输出装置5输出经处理的音频信号2和/或将经处理的音频信号2存储在至少一个存储装置(未示出)中和/或将经处理的音频信号2传输给至少一个通信伙伴(未示出)。经处理的音频信号2能够在输出和/或存储和/或传输之前进行傅里叶逆变换。

通过方法的所描述的步骤S1-S7(S8)，尤其鉴于处理的效率和经处理的音频信号6的质量，给出用于对致损耗地压缩的音频信号2进行处理的改进的方法。

附图标记列表

1 设备

2 音频信号(经压缩)

3 音频装置

4 机动车

5 信号输出装置

6 音频信号(经处理)

7 内部空间

8 控制装置

AFS 音频填充信号

EV1-EV4 能量曲线分布

f_i 频率

Δf_T 临界频率值

T 临界能量含量

S1-S8 方法步骤

Claims

1.一种用于对致损耗地压缩的音频信号(2)进行处理的方法，其特征在于，具有如下步骤：

-提供致损耗地压缩的音频信号(2)，所述音频信号是致损耗地压缩的、已经解码的音频文件；

-将所述音频信号(2)变换为频谱，在频谱中将所述音频信号(2)的能量与所述音频信号(2)的频率相关联；

-确定在所述频谱中的局部的振幅极限的频率(f_i)；

-确定第一选择标准并且预选两个直接依次跟随的局部的振幅极限的频率(f_i)，所述频率(f_i)符合所述第一选择标准；

-确定第二选择标准并且选择两个直接依次跟随的局部的振幅极限的、符合所述第一选择标准的预选频率(f_i)，所述频率(f_i)附加地符合所述第二选择标准；

-产生音频填充信号(AFS)；以及

-通过将所述音频填充信号(AFS)引入到符合所述第二选择标准的频率(f_i)之间的频率范围中，处理所述音频信号(2)，使得所述频率范围至少部分地、尤其完全地用所述音频填充信号(AFS)来填充。

2.根据权利要求1所述的方法，其特征在于，当所述频率(f_i)的频率差的数值高于通过所述第一选择标准所描述的临界频率值(Δf_i)时，所述频率(f_i)符合所述第一选择标准。

3.根据权利要求2所述的方法，其特征在于，通过将所述频率(f_i)变换为巴克刻度来确定所述临界频率值(Δf_i)，其中所述临界频率值(Δf_i)对应于巴克或经由调整系数调整的巴克。

4.根据权利要求3所述的方法，其特征在于，所使用的所述调整系数对应于0.7和1.1巴克之间的，尤其0.9巴克的值。

5.根据上述权利要求中任一项所述的方法，其特征在于，当在所述频率(f_i)之间的能量含量的数值低于临界能量值时，所述频率(f_i)符合所述第二选择标准。

6.根据权利要求5所述的方法，其特征在于，通过确定的临界能量含量(T)限定所述临界能量值。

7.根据权利要求5所述的方法，其特征在于，通过如下方式确定所述临界能量值，即从选择的低频(f₁)产生第一能量曲线分布(EV1)和从选择的高频(f₂)产生第二能量曲线分布(EV2)，并且将所述两个能量曲线分布(EV1、EV2)变换为频谱，其中通过相应的能量曲线分布(EV1、EV2)限定所述临界能量值。

8.根据权利要求7所述的方法，其特征在于，基于心理声学的模型实现所述第一能量曲线分布和第二能量曲线分布(EV1、EV2)的产生。

9.根据上述权利要求中任一项所述的方法，其特征在于：

在处理所述音频信号(2)之前通过将所述音频填充信号(AFS)引入到符合所述第二选择标准的频率(f_i)之间的频率范围中，使得所述频率范围至少部分地，尤其完全地用所述音频填充信号(AFS)来填充，

从选择的低频(f₁)产生可能的第三能量曲线分布(EV3)和从选择的高频(f₂)产生可能的第四能量曲线分布(EV4)，并且将这两个能量曲线分布(EV3，EV4)变换为所述频谱。

10.根据权利要求9所述的方法，其特征在于，将所述音频填充信号(AFS)至少部分地，尤其完全地引入到所述频谱的通过两个选择的频率(f₁，f₂)和相应的能量曲线分布(EV3，EV4)限定的范围中。

11.根据权利要求9或10所述的方法，其特征在于，基于心理声学的模型实现能量曲线分布(EV3，EV4)的产生。

12.根据上述权利要求中任一项所述的方法，其特征在于，与所述音频信号(2)的声学参数相关地或不相关地产生所述音频填充信号(AFS)。

13.根据权利要求12所述的方法，其特征在于，与所述音频信号(2)的声学参数相关地产生所述音频填充信号(AFS)，其中根据所述音频信号(2)或另外的待处理的音频信号(2)的特定的声学参数进行范围(A)的填充。

14.一种用于依照根据上述权利要求中任一项所述的方法处理致损耗地压缩的音频信号(2)的设备(1)，其特征在于，所述设备具有至少一个控制装置(8)，所述控制装置设置为

-提供致损耗地压缩的音频信号(2)；

-确定在所述频谱中的局部的振幅极限的频率(f_i)；

-产生音频填充信号(AFS)；以及

-通过将所述音频填充信号(AFS)引入到符合所述第二选择标准的频率(f_i)之间的范围中，处理所述音频信号(2)，使得所述范围至少部分地、尤其完全地用所述音频填充信号(AFS)来填充。

15.一种用于机动车(4)的音频装置(3)，所述音频装置包括至少一个信号输出装置(5)，所述信号输出装置(5)设置为将经处理的音频信号(6)声学输出到机动车(4)的形成客舱的至少一部分的内部空间(7)中，其特征在于，所述信号输出装置(5)为了处理致损耗地压缩的音频信号(2)，具有至少一个根据权利要求14所述的设备(1)。