CN102483925A - 数字音频信号处理系统 - Google Patents
数字音频信号处理系统 Download PDFInfo
- Publication number
- CN102483925A CN102483925A CN2010800310968A CN201080031096A CN102483925A CN 102483925 A CN102483925 A CN 102483925A CN 2010800310968 A CN2010800310968 A CN 2010800310968A CN 201080031096 A CN201080031096 A CN 201080031096A CN 102483925 A CN102483925 A CN 102483925A
- Authority
- CN
- China
- Prior art keywords
- digital audio
- symbol
- video signals
- parameter
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 105
- 230000005236 sound signal Effects 0.000 title claims abstract description 46
- 238000004590 computer program Methods 0.000 claims abstract description 16
- 238000006243 chemical reaction Methods 0.000 claims description 35
- 238000007906 compression Methods 0.000 claims description 28
- 230000006835 compression Effects 0.000 claims description 27
- 239000003638 chemical reducing agent Substances 0.000 claims description 15
- 238000009434 installation Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 5
- 238000000034 method Methods 0.000 abstract description 54
- 230000008569 process Effects 0.000 abstract description 39
- 238000005070 sampling Methods 0.000 description 15
- 230000008901 benefit Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 238000005538 encapsulation Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 229920006395 saturated elastomer Polymers 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004304 visual acuity Effects 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
本发明公开了一种数字音频信号处理系统,该系统使得具有不同格式的信号能够在相同硬件架构中灵活共存。所述系统包括至少一个输入、至少一个第一格式变换器以及至少一个数字音频信号处理器。所述至少一个输入用于:至少接收具有第一格式的第一数字音频信号,该第一格式包括第一符号分辨率和第一符号分布。所述至少一个第一格式变换器用于:至少基于第一参数和第二参数而将所述第一数字音频信号变换为具有第二格式的第二数字音频信号,该第二格式包括与所述第一符号分辨率不同的第二符号分辨率以及与所述第一符号分布不同的第二符号分布,其中,所述第一参数与所述第二格式的整数符号数量关联,所述第二参数与所述第二格式的小数符号数量关联。所述至少一个数字音频信号处理器用于处理所述第二数字音频信号,以产生第三数字音频信号。本发明还公开了对应的计算机程序产品。
Description
技术领域
本发明一般涉及数字音频信号处理系统领域。更具体而言,本发明涉及处理不同格式的数字音频信号的数字音频信号处理系统。
背景技术
在便携式设备(例如移动电话)所应用的数字音频信号处理系统技术领域中,其功能已经从基本的播放和/或记录功能发展为更高级的功能。例如,这些更高级的功能可包括诸如多个音频解码器和编码器(编解码器)的单元和音响效果单元(例如动态范围控制器和均衡器),以及包括能够将音频源混合至和/或将音频信号路由至不同目的地(例如扬声器或头戴式耳机)的结构。
多数带有音频再现能力的音乐播放器和便携式设备具有采用定点处理器进行音频处理的数字音频信号处理系统硬件架构。
图1示出了音频信号采样的示例性表示及其对应格式。比特表示10包括多个比特。比特的数量与该格式的比特分辨率20对应。在比特表示10中,小数点30将这多个比特划分为表示音频信号采样的整数部分的比特(整数比特)以及表示音频信号采样的小数部分的比特(小数比特)。小数点30在比特表示10内的位置对应于该格式的比特分布。应理解,在整个本说明书中,提及比特(例如在上述采样表示中的比特)时表示泛指任何符号(例如四进制、十进制或十六进制符号)。
在定点硬件上实现音频处理算法既不能利用浮点表示也不能利用浮点运算,这是因为其就资源而言太昂贵,而这对于便携式设备尤其重要。因此,音频处理算法的实现以定点运算来执行,其中,根据预定格式将用于表示采样的比特划分为整数比特和小数比特。因此,音频采样的比特分辨率是固定的,并且小数点被设置于音频采样的比特模式表示内的特定位置。相应的格式称为Q-格式。
将比特分为整数比特和小数比特是件十分重要的任务,其影响所得到的输出音频质量,还影响获得期望输出所需的资源(例如编码大小、计算功率)量。在实现中明确进行比特分布配置,对数字音频信号处理的灵活性和性能都具有较大限制。
例如就所支持的音频格式和音频增强能力方面,对能够再现音频的设备(音频呈现设备)的评估涉及一系列功能。所呈现音频的质量是评估中的重要因素。在报纸和杂志中关于各种设备经常报道音频质量(常使用预设的一组音轨根据信噪比或信号对噪声及失真比而量化或估量),从市场前景而言音频质量极其重要。
目前,大多数数字音轨(被采样及编码的音频,例如音乐)使用16比特分辨率来表现。然而,已知一些编解码器支持更高分辨率,例如,具有20比特分辨率的无损音频编解码器(FLAC-无损音频压缩/解压缩)。
尽管也取决于所使用的编解码器的类型,但增加比特分辨率中的比特数量可提高数字音轨的质量,因此使其与数字化的初始音轨更相似。因此,为了在处理后保持音频质量,期望能够使用较高的比特分辨率。例如,可使用额外比特(精度比特)表示音频采样的更多细节。更多精确比特的使用有效地减少了量化噪声(一般称为减少或降低噪声基底)。例如,在对音频采样进行数字化时和/或在对数字音频采样执行运算操作期间可能引入量化噪声。
由于数字音轨的比特分辨率的变化增加,以及由于具有更高比特分辨率的音频处理块的增加,当尝试设计支持高分辨率音轨和低分辨率音轨两者的系统时,以定点运算(根据预定格式)实施音频处理算法将成为障碍。例如,设计支持所有相关格式的系统,为每种格式产生期望的音频质量且优化音频信号处理系统的资源利用,即使并非不可能,但是也会很麻烦。
因此,越来越需要具有不同比特分辨率(和/或不同比特分布)的数字音频信号在数字音频信号处理系统的相同硬件架构上共存。也要求这样的系统就目标质量和资源优化方面具有更高的适应性。
发明内容
应注意,术语“包括/包含”在用于本说明书中用于表明存在所记载的特征、整体、步骤或组件,但不排除一个或多个其它特征、整体、步骤、组件或其集合的存在或增加。
本发明目的在于消除上述缺点中的至少一些缺点,并且提供使得具有不同格式的信号能够在相同硬件架构中灵活共存的数字音频信号处理系统和对应的计算机程序产品。
根据本发明第一方面,通过一种数字音频信号处理系统来实现该目的,所述数字音频信号处理系统包括至少一个输入、至少一个第一格式变换器以及至少一个数字音频信号处理器。所述至少一个输入用于:至少接收具有第一格式的第一数字音频信号,该第一格式包括第一符号分辨率和第一符号分布。所述至少一个第一格式变换器用于:至少基于第一参数和第二参数将所述第一数字音频信号变换为具有第二格式的第二数字音频信号,该第二格式包括与所述第一符号分辨率不同的第二符号分辨率以及与所述第一符号分布不同的第二符号分布,其中,所述第一参数与所述第二格式的整数符号数量关联,所述第二参数与所述第二格式的小数符号数量关联。所述至少一个数字音频信号处理器用于处理所述第二数字音频信号,以产生第三数字音频信号。在一些实施例中,每一符号可以包括一比特。
在一些实施例中,第三数字音频信号可以具有第三符号分辨率的第三格式,该第三格式包括等于所述第二符号分辨率的第三符号分辨率以及等于所述第二符号分布的第三符号分布。在这些实施例中,所述数字音频信号处理系统可以进一步包括至少一个第二格式变换器以及至少一个输出。所述至少一个第二格式变换器可以用于:至少基于第三参数和第四参数而将所述第三数字音频信号变换为具有第四格式的第四数字音频信号,该第四格式包括与所述第三符号分辨率不同的第四符号分辨率以及与所述第三符号分布不同的第四符号分布,其中,所述第三参数与所述第四格式的整数符号数量关联,所述第四参数与所述第四格式的小数符号数量关联。所述至少一个输出可以用于至少提供所述第四数字音频信号。
在一些实施例中,所述第一参数可以包括所述第二格式的整数符号数量,所述第二参数可以包括所述第二格式的小数符号数量。在这些实施例中,所述第一格式变换器可以包括至少一个压缩器,用于:压缩所述第一数字音频信号。所述压缩器可以用于:当所述第一数字音频信号的最大幅度的绝对值超过ZY-1时,压缩所述第一数字音频信号,其中,Y等于所述第二格式的整数符号数量与所述第一格式的小数符号数量之和,其中,Z是所述符号表示的数学数基。所述第一格式变换器可以包括格式宽度调准器,用于将多个符号添加到所述第一数字音频信号或者从所述第一数字音频信号移除多个符号,以提供具有所述第二符号分辨率的第二数字音频信号。所述第一格式变换器可以包括符号分布调准器,用于对所述第一数字音频信号进行移位,以提供具有所述第二符号分布的第二数字音频信号。
在一些实施例中,所述第一格式变换器可以用于:将所述多个数字音频信号变换为均具有变换后格式的对应的多个变换后数字音频信号,变换后格式对于所述多个数字音频信号中的每一个至少基于相应的第一参数和相应的第二参数,其中,所述相应的第一参数包括对应的变换后格式的整数符号数量,所述各个第二参数包括对应的变换后格式的小数符号数量。
根据一些实施例,所述第一参数可以包括关于所述第二格式的净空符号的最小数量的指示,所述第二参数可以包括关于所述第二格式的精度符号的最小数量的指示。所述第一格式变换器可以包括格式宽度调准器,用于将多个符号添加到所述第一数字音频信号,其中,所述符号数量等于或大于净空符号的最小数量与精度符号的最小数量之和,以提供具有所述第二符号分辨率的第二数字音频信号。所述第一格式变换器可以包括符号分布调准器,用于对所述第一数字音频信号进行移位,以提供具有所述第二符号分辨率的第二数字音频信号。所述第一格式变换器可以用于基于所述第一参数和第二参数并且基于所述第一数字音频信号的第一格式而确定所述第二格式。
在一些实施例中,所述第一格式变换器可以用于:至少基于所述第一参数和所述第二参数而将均具有各自的第一格式的多个数字音频信号变换为均具有相同第二格式的对应多个变换后数字音频信号。所述第一格式变换器可以用于:基于所述第一参数和第二参数并且基于所述多个数字音频信号的各自的第一格式而确定所述第二格式。所述第二符号分辨率可以是以下项之和:净空符号的最小数量、精度符号的最小数量、所述各第一格式当中的整数符号的最大数量、以及所述各第一格式当中的小数符号的最大数量。
在一些实施例中,所述第一格式转换器可以进一步用于:以所述第二格式的指示符对所述第二数字音频信号进行标记。
本发明的第二方面是一种电子装置,其包括根据本发明第一方面的系统。在一些实施例中,所述电子装置可以是音频呈现设备、媒体播放器、通信设备或移动电话。
本发明第三方面是一种计算机程序产品,包括计算机可读介质,其上具有包括程序指令的计算机程序,所述计算机程序可被加载到音频处理设备的数据处理单元,并且用于:当所述数据处理单元运行所述计算机程序时,使得所述数据处理单元至少执行以下步骤。至少接收具有第一格式的第一数字音频信号,所述第一格式包括第一符号分辨率和第一符号分布。至少基于第一参数和第二参数而将所述第一数字音频信号变换为具有第二格式的第二数字音频信号,该第二格式包括与所述第一符号分辨率不同的第二符号分辨率以及与所述第一符号分布不同的第二符号分布,其中,所述第一参数与所述第二格式的整数符号数量关联,所述第二参数与所述第二格式的小数符号数量关联。处理所述第二数字音频信号,以产生第三数字音频信号。
在一些实施例中,本发明的第三方面可以另外具有与如上关于本发明第一方面说明的各个特征中的任一个相同或对应的特征。
本发明一些实施例的优点在于,提供具有任意比特分辨率和任意比特分布表示的数字音频信号在基于定点处理器的硬件架构上的系统化处理和共存。
本发明一些实施例的另一优点在于,不同分辨率和比特分布之间的转换是自动的。这可为小成本提供灵活性。在一些实施例中,就操作方面而言仅需增加的是基本的处理器操作。在一些实施例中,压缩功能也是需添加的。
本发明一些实施例的另一优点是提供了数字音频信号的可扩展格式。这可以使得能够经由使用净空符号和/或压缩功能进行饱和保护。因此,在一些实施例中,不必执行初始音量减少来创建净空。由此,可以避免降低信噪比。
本发明一些实施例的另一优点在于提供灵活性,其使得添加符号能够保留音频信号的细节。由此,可以降低噪声基底。当噪声基底降低时,音量减小不一定导致损失信号细节。因此,可以保留高信噪比。
本发明一些实施例的另一优点在于,根据本发明实施例的音频系统可配置为:强调资源节省和高质量音频处理之一或二者。因此,在资源效率与音频质量之间的权衡提供了灵活性。
本发明一些实施例的另一优点在于,取决于输入和输出信号的比特分辨率和比特分布的音频处理可以动态地适应当前设置。因此,可以实现音频处理算法用于支持资源高效处理和高质量处理之一或二者。
本发明一些实施例的另一优点在于,所提供的可扩展格式使得能够移植到通用硬件架构。例如,所述格式可以适应该架构的总线所支持的格式,以及适应具有可选择的比特分辨率的D/A(数模)转换器。
本发明一些实施例的另一优点在于,提供在关于音频质量和资源效率两者都维持高级别优化的同时在不同硬件架构之间迁移的可能性。
附图说明
通过参照附图,根据本发明实施例的以下详细描述,可容易理解本发明的更多目的、特征和优点,在附图中:
图1是数字音频信号的格式的示意图;
图2A是根据本发明一些实施例的两个示例性布置的结构图;
图2B是根据本发明一些实施例的示例性数字音频信号处理系统的结构图;
图3是根据本发明一些实施例的示例性格式调准器的结构图;
图4是根据本发明一些实施例的示例性方法步骤的流程图;
图5是根据本发明一些实施例的示例性格式转换器的结构图;
图6是根据本发明一些实施例的示例性格式转换器的结构图;
图7是根据本发明一些实施例的示例性方法步骤的流程图;
图8是根据本发明一些实施例的示例性方法步骤的流程图;以及
图9是根据本发明一些实施例的可以包括一个或多个数字音频信号处理系统的示例性音频呈现设备的示意图。
具体实施方式
下面将描述本发明实施例,其中,使得具有不同格式的信号能够在相同架构中灵活共存。因此,本发明实施例提供手段以使用定点数字音频处理(例如,在需要预定定点格式的音频处理算法中),但仍然能够使用不同的可变信号格式(分辨率和分布)。本发明实施例使得能够使用相同架构来组合和/或处理不同格式的信号。根据本发明实施例,还使得需要不同信号格式的处理单元能够在相同处理链中使用和组合。
本发明实施例还在音频质量优化(例如,使用对于硬件架构可能是最佳的或非最佳的较高分辨率)和资源利用优化(例如,功耗、硬件利用,采用针对硬件架构而优化的音频处理软件,从而减小功耗)之间提供灵活的权衡。
本发明实施例使得上述权衡变得可配置。因此,潜在用户可专注于资源管理(例如,功耗)或更高的收听体验质量(例如,在音频处理中使用更高的分辨率,这可能导致例如功耗增加)。
例如,音频处理系统的(软件或硬件)设计者可使用这种权衡,应用或设备设计者在将音频处理系统集成到应用或设备中时可使用这种权衡,甚至终端用户在使用应用或设备时可使用这种权衡。在后一情况下,例如,终端用户可能设置设备中不同应用的音频质量(例如,高质量用于音乐呈现,中等质量用于电话对话中的话音呈现,低质量用于铃音信号),从而隐含地设置了资源利用。
如前所述,大多数带有音频再现能力的音乐播放器和便携式设备具有数字音频信号处理系统硬件架构,该架构使用定点处理器进行音频处理。标准设备可采用16比特定点处理器,而更高级的设备可能包括具有或不具有浮点能力的20、24或32比特定点处理器。
由于具有超过16比特分辨率的数字音轨变得越来越普遍,会要求具有不同比特分辨率的数字音频信号在相同硬件架构上共存,以例如提供后向兼容性(例如,“旧的”16比特分辨率音轨应能够与“新的”24比特分辨率音轨使用相同的音频处理系统进行处理)。此外,由于将较低分辨率轨道简单转换为较高分辨率格式可能对于所关心的硬件架构并非是最优的,和/或可能损害音频信号处理系统的稳定性、功能和/或开发时间,因此并不总是推荐该方式或者该方式甚至不可能。
在一些情况下,可存在多个音频目的地(接收器)。在这些情况下,不同目的地可能需要或不需要不同格式(其可与音频系统输出所提供的格式不同),以例如符合目的地的软件或硬件限制。
此外,在数模(D/A)转换器和总线机制支持可变比特分辨率的音频呈现设备中,将需要支持具有可变比特分辨率的音频处理。这将使得可能产生以下系统:在该系统中,用户/设计者有决定在整个音频链(即,从音频解码器到音频输出设备(例如外放扬声器或头戴式耳机)的整个路径)中使用高比特分辨率还是使用低比特分辨率的可能性。
在回放模式中(当播放音轨时),从解码器到输出设备的音频路径经常包括用于改善收听体验的音频处理块(例如音量增益控制)。由这种音频处理块产生的音响效果的本质和目的通常可能造成或不会造成与音频处理块的输入信号相比输出信号的幅度最终得到放大。为了保持音频质量,需要控制使得数字音频信号的幅度能够以所选择的比特分辨率和比特分布来表示,并且保证不会出现饱和(由运算操作中的溢出引起的饱和)。这可通过在音频采样的表达中引入净空(即,附加的最高有效位)来实现。此外,为了保持音频质量,可在音频采样的表达中引入精度比特(即,附加的最低有效位),这降低了所谓的噪声基底。例如,音频处理算法可产生比初始音频信号需要更多的待完全表示的小数比特的信号。在此情况下,精度比特可有助于避免质量损失。净空和/或精度比特的引入可能改变格式,由此提高了对不同格式的信号共存的需要。
在一些已知的音频处理系统中,在应用音频处理之前,使用预先音量减小在用于表示音频信号采样的比特分辨率内创建净空。然而这会降低信噪比(从而降低音频质量),这是因为音频信号在音频处理之前被衰减且在处理中引入了更多的量化噪声(例如,由于有限比特分辨率而在计算中引入的噪声)。因此丢弃了音频采样的细节。
此外,可能期望基于被处理信号的音频质量和系统或系统中特定处理单元的资源利用中的一者或两者对音频处理进行优化。
特定硬件架构上的实现在资源管理方面通常是经过优化的,其中,比特分辨率以及比特分布是固定的,没有灵活变化的余地。由此,例如由软件设计者进行的固定比特分辨率和固定比特分布的管理会导致就质量和/或资源利用而言配置较差的音频处理单元。
如果不为简化、改进和/或提升具有不同格式的信号和/或需要不同格式的处理单元(例如,音频处理算法)在相同硬件架构上共存的可能性而做一些事情,则可能出现在硬件架构和/或音频质量方面未以最优方式执行音频处理的情况。
本发明实施例提供在比特分辨率和比特分布方面具有灵活性的音频再现系统,从而至少克服上述的一些缺点。由于可动态调准音频采样的格式表示,因此本发明实施例有利于定点硬件架构上采用的音频处理。
本发明实施例提供从一种格式到另一格式的转换,同时避免音频失真。在一些实施例中,可保持基准级别(例如,用于音量和幅度控制)。
本发明提供一种系统化方法,使得在基于硬件架构的定点处理器上能够对具有可变比特分辨率和可变比特分布的数字音频信号进行数字音频处理。
本发明实施例通过提供由于引入净空比特的机制对溢出提供保护。此外,本发明实施例通过提供减少噪声基底的机制以及通过引入精度比特来保留音频采样的细节,实现高质量音频处理,从而减少计算噪声并且保持高信噪比。
本发明实施例还实现音频处理系统设计的灵活性。例如,所提供的一种可能是,采用对数字音频信号表示具有不同要求的和/或出于不同目的(例如,高分辨率处理或资源节省)而进行优化的音频处理算法。此外还具有灵活性,即,本发明实施例可支持具有不同比特分辨率和比特分布(例如,数字音频处理系统的输入、输出、和/或其内部信号)的数字音频信号的混合。此外,如果根据本发明实施例的音频处理系统在不同硬件架构之间迁移,则可容易地重配置该音频处理系统。
图2A示出了根据本发明一些实施例的两个示例性音频处理链100a、100b。
音频处理链100a在110a接收具有各自的(可能不同的)比特分辨率和/或比特分布的N个输入信号。所述N个信号被输入到格式调准器120a,在调准器120a中对信号进行调准,使得得到的信号具有相同格式(例如,相同比特分辨率和比特分布)。格式调准器也可实现引入净空和/或精度比特。然后,将被调准信号提供给音频处理器130a(或音频处理内核),在音频处理器130a中,根据任何已知的或将来的音频处理算法(例如,混合、放大、均衡、滤波等)进行实际的音频处理。如此处理的K个信号具有各自的格式(可能不同于输入格式,并且K个被处理信号之间可能不同)。如果音频信号接收器150a(例如,外放扬声器、头戴式耳机、或更多其它音频处理器)需要与所述K个被处理信号的格式不同的格式,则提供格式转换器140a将K个被处理信号转换为具有所需格式的K个被转换的信号。
音频处理链100b在110b接收具有各自的(可能不同的)比特分辨率和/或比特分布的N个输入信号。所述N个信号输入到格式转换器120b,其中,信号被转换为具有音频处理器130b(或音频处理内核)所需的相应格式的N个被转换信号。在音频处理器130b中,根据任何已知的或未来的音频处理算法(例如,混合、放大、均衡等)进行实际的音频处理。由此经处理的K个信号具有各自的格式(可能不同于输入格式,且K个被处理信号之间可能不同)。如果音频信号接收器150b(例如外放扬声器、头戴式耳机、或其它更多的音频处理器)需要K个被处理信号具有相同格式并且该格式与K个被处理信号的格式不同,则提供格式调准器140b对所述K个被处理信号进行调准,使得得到的信号具有与接收器150b所需相同的格式(例如,相同比特分辨率和比特分布)。格式调准器也可实现引入净空和/或精度比特,如果例如接收器包括进一步的音频处理,则可适用该净空和/或精度比特。
图2A的格式调准器120a、140b以及格式转换器120b、140a用于在处理之前以及在处理之后(若需要)调准/转换信号。该方法在选择音频处理算法(130a、130b)的适当版本方面提供灵活性。该方法还使得能够支持若干输出格式。
图2B示出了根据本发明一些实施例的示例性数字音频信号处理系统200。该示例性音频信号处理系统包括源集合210、音频处理器(算法)230a、230b、230c、230d、250a、250c、以及接收器(目的地)270a、270c、270d。该示例性音频信号处理系统200还包括数个格式调准器220a、220b、220c、240a、以及格式转换器220d、240c、260。该示例性音频信号处理系统200实际上可看作是若干图2A中描述的音频处理链100a、100b的组合。
系统在源集合210接收具有各(可能不同)格式的一个或多个音频信号。信号处理链起始块220a、220b、220c、220d中的每一个可接收在源集合210所接收的一个或多个音频信号中的一个或多个,并且在源集合210接收的一个或多个音频信号中的任一信号可输入到信号处理链起始块220a、220b、220c、220d中的一个或多个。
从图2B的顶部开始,N1个信号输入到格式调准器220a,在调准器220a中,对信号进行调准,使得所得到的信号具有相同的格式。格式调准器也可实现引入净空和/或精度比特。然后,将经调准的信号提供给音频处理器230a。该系统中的这个部分例如被设计为聚焦于需要净空和低噪声基底的高比特分辨率计算(例如,以实现高音频质量)。
在图2B中继续向下,N2个信号输入到格式调准器220b,在调准器220b中,对信号进行调准,使得所得到的信号具有相同的格式。该格式可以与从格式调准器220a输出的格式相同或不同。与以上类似,格式调准器也可实现引入净空和/或精度比特。然后,将经调准的信号提供给音频处理器230b。该系统中的这个部分例如被设计为聚焦于不需要净空或仅需小的净空和/或可接受高噪声基底的低比特分辨率计算(例如,以实现低计算复杂度和资源管理)。
从处理器230a和230b输出的如此处理后的信号具有各自的格式(可能不同于输入格式,在处理器230a与230b之间可能不同,且来自于每一个处理器的经处理信号之间可能不同)。在系统200中,来自处理器230a和230b的输出被输入到格式调准器240a,在调准器240a中对信号进行调准,使得所得到的信号具有与音频处理器250a所需相同的格式。如通常的那样,格式调准器也可实现引入净空和/或精度比特。如此调准后的信号提供给音频处理器250b。该系统的这个部分例如被设计为聚焦于需要净空和低噪声基底的高比特分辨率计算(例如,以实现高音频质量)。
在该系统中,音频信号接收器270a需要与从处理器250a输出的格式不同的格式。因此,提供格式转换器260将经处理信号转换为具有所需格式的信号。提供给接收器270a的信号可以是高分辨率信号。
在图2B中继续进一步向下,N3个信号输入到格式调准器220c,其中,对信号进行调准,使得所得到的信号具有相同的格式(可能引入净空和/或精度比特)。然后,将调准后的信号提供给音频处理器230c。该系统的这个部分例如可被设计为聚焦于需要净空和低噪声基底的高比特分辨率计算(例如,以得到可进行压缩但没有实质质量损失的信号)。
在图2B的下部分中,N4个信号被输入到格式转换器220d,在格式转换器220d中对信号进行转换,使得所得到的信号具有音频处理器230d所需的格式。然后,将经转换的信号提供给音频处理器230d。该系统的这个部分可例如被设计为针对高比特分辨率转换具有计算效率。
从处理器230c和230d输出的如此处理后的信号具有各自的格式(可能不同于输入格式,在处理器230d与230d之间可能不同,且来自每个处理器的处理后信号之间可能不同)。在系统200中,来自处理器230c和230d的输出被输入到格式转换器240c,在格式转换器240c中对信号进行转换,使得所得到的信号具有音频处理器250c所需的格式。将如此转换后的信号提供给音频处理器250c。该系统的这个部分例如可被设计为聚焦于低计算复杂度和资源管理。
音频信号接收器270c接受从处理器250c输出的格式,不需要进一步转换或调准。将来自处理器230d的输出也提供给音频信号接收器270d,音频信号接收器270d接受从处理器230d输出的格式,且不需要进一步转换或调准。提供给接收器270c和270d的信号可以是低分辨率信号。
通常,音频信号处理系统的输入和输出信号可具有相同或不同的格式。输入和/或输出信号的格式可取决于音频应用。在音频信号处理系统中,可能采用需要特定格式的音频处理设备。需要不同格式的若干处理设备可能一起使用。这可通过使用格式调准器和格式转换器来实施,其中格式调准器和格式转换器被嵌入到系统中的合适位置从而为系统中的每个点提供所需的格式。
通常,格式调准器调准音频信号,使得它们具有相同格式(即,相同分辨率和分布,或换言之,相同的整数比特数量和相同的小数比特数量)。此外,格式调准器可增加比特,以提供净空并且降低噪声基底。可提供所需净空和/或所需精度比特数量的指示作为格式调准器的输入。因此,比特数量的分辨率对于在调准之后的所有输出信号是相等的,并且等于或大于输入信号的最大分辨率。
通常,格式转换器将输入格式的音频信号转换为由具有作为格式转换器的输入而提供的参数所确定的格式的信号。格式转换器可包括压缩能力(优选地,具有最小音频失真),从而使从某种格式到具有更小比特分辨率的另一格式的转换成为可能。
在本发明一些实施例中,指示当前格式的参数(例如,关于分辨率和分布的指示、或分别关于整数比特数量和小数比特数量的指示)被标记在音频信号上,或以另外方式与音频信号一起传播。为此目的,例如,用于描述音频信号或音频信号集合的数据结构可包括一个或多个变量。替代地或附加地,音频数据流可在特定时间间隔、在系统启动时、和/或当信号格式改变时包括这样的指示符。
图3示出了示例性格式调准器300。格式调准器在310接受NAL个信号作为输入且在320输出NAL个信号。在310输入的信号可具有不同的格式(例如,不同分辨率和/或分布,或有差异地设置不同的整数比特数量和/或小数比特数量),而在320输出的信号具有相同的格式,即经过调准。格式调准器300还可在330接收参数H和/或K作为输入。H是净空参数,例如,指示在输出信号中所需的净空比特的最小数量。K是噪声基底(或精度)参数,例如,指示在输出信号中所需的精度比特的最小数量。在一些实施例中,净空参数和精度参数之一或两者可被禁用(功能上与下述的设置H=K=0对应)。
图4示出了图3的格式调准器300执行的示例性操作400。在步骤410,格式调准器接收音频信号输入以及净空参数H和噪声基底参数K。
然后,在步骤430和440中,将输入信号变换为步骤420中确定的格式。在该实施例中,通过在步骤430将数个最高有效位添加到信号采样来执行所述变换。该步骤实现了所需格式大小(或宽度)。所添加比特的数量等于信号采样中缺少的小数比特数量和整数比特数量,以具有在步骤420中确定的所需分辨率,例如,X=(A+B)-(Ai+Bi),其中,X是所添加比特的数量。然后,在步骤440中,调准(例如,通过对所述表示左移位)信号以在实现步骤420中确定的所需分布。应理解,可以预想到变换信号格式的其它方式,并且步骤430和440中的方法仅仅是例子。其它例子包括:添加X个最低有效位且对表示进行右移位,或添加A-Ai个最高有效位和B-Bi个最低有效位。
在步骤450中,将上述步骤420中确定的格式的指示符标记在输出信号上。
在步骤460中,确定是否要变换更多的输入信号。如果要变换更多的输入信号,则过程返回到步骤430以将另一信号变换为所需格式。对步骤430-460进行迭代,直到所有输入信号的变换完成。然后在步骤470结束所述过程。
应理解,在本发明一些实施例中可将步骤450和460颠倒,例如,首先变换所有输入信号,然后对它们全部进行标记。
图5示出了示例性格式转换器500。格式转换器在510接受NCON个信号作为输入且在520输出NCON个信号。在510输入的信号可具有不同的格式(即,不同分辨率和/或分布、或有差异地设置不同的整数比特数量和/或小数比特数量),在520输出的信号也可如此。格式转换器500在530接收参数Ai,CON、Bi,CON作为输入,i=1、2、......、NCON,其中,Ai,CON、Bi,CON分别是表示信号i在转换之后的整数比特数量和小数比特数量的参数,并且将输入信号转换为具有由在530输入的参数指定的所需格式。与上述关于格式调准器所述相似,格式转换器可包括用于添加比特及对所述表示进行移位的功能。此外,格式转换器可包括压缩器功能,该功能能够在输入信号改变格式之前压缩输入信号的幅度。这在输入信号幅度太大以至于不在于530输入的参数所给定的输出格式的范围内的情况下尤其有帮助。因此,提供了避免由于转换后格式中整数比特的数量少引起的信号限幅的手段,而同时通过在格式转换之前避免单纯音量降低而仍然保留最低有效位的详细信号式样。应理解,在530的输入可以是任意形式的关于所需输出格式(例如是分辨率和分布,而不是整数比特数量和小数比特数量)的指示。
图6是示例性格式转换器600的更详细表示。输入610和630基本上分别与图5的输入510和530对应。输出620基本上与图5的输出520对应。
示例性格式转换器600针对NCON个输入信号中的每一个分别具有处理链650a-660a、650b-660b、650c-660c。在640,将输入信号提供给它们各自的处理链。假设将信号1提供给处理链650a-660a,则首先基于信号1(经由630输入)所需的输出格式确定是否需要压缩信号1。例如,该确定可在单独的控制单元中或在压缩器650a中完成,如在示例性格式转换器600中那样。如果无需压缩,则简单绕过压缩器650a。如果需要压缩,则压缩器650a执行该操作。然后,将被压缩的(或绕过的)信号提供给信号调准器660a,信号调准器660a将被压缩的信号1转换为指定格式。信号调准器660a可包括添加最高有效位和/或最低有效位、丢弃最低有效位和/或最高有效位、和/或对信号表示进行左/右移位的功能。其它处理链650b-660b、650c-660c具有与已描述的处理链650a-660a相似的功能。经转换的信号可提供作为单独的输出,或可在670组合为单个输出(例如,在数据结构中或作为来自不同信号的信号采样的序列)。
图7示出了分别由图5和图6所示格式转换器500、600中的任一个执行的示例性操作700。在步骤710,格式转换器接收音频信号输入和输出格式参数(例如,Ai,CON、Bi,CON,i=1、2、......、NCON)。
在步骤720中,确定特定的信号(信号i)是否需要压缩。在一些实施例中,该确定基于信号的输入和输出格式。在一些实施例中,如果输入信号的最大幅度的绝对值超过ZY-1,则确定需要压缩,其中,Y=Ai,CON+Bi,Z是符号表示的数学数基(例如,对于比特表示,Z=2)。
如果需要压缩,则在步骤725执行该操作,所述过程于是进入步骤730。如果不需要压缩,则过程从步骤720直接转到步骤730。
然后,在步骤730至770中,将输入信号变换为由输入参数定义的格式。在该实施例中,以特定方式(其在下文中描述)执行该变换。然而,应理解,存在用于执行变换(例如以其它组合和顺序添加比特、丢弃比特、和/或对表示进行移位)的很多其它方式。
在步骤730中,确定输入格式中的比特总数是否小于输出格式中的比特总数。
如果输入格式中的比特总数小于输出格式中的比特总数,则过程进入步骤740,其中,向信号采样添加多个最高有效位或最低有效位添加,以实现所需输出信号分辨率(例如,格式大小/宽度)。所添加比特的数量等于信号采样中缺少的小数比特数量和整数比特数量,以具有由输入参数所定义的所需信号分辨率,即,X=(Ai,CON+Bi,CON)-(Ai+Bi),其中,X是所添加比特的数量。然后,在步骤750中,调准(例如,通过对所述表示进行左移位或右移位)信号以实现由输入参数定义的所需分布。如果Bi,CON<Bi,则步骤740可包括添加最高有效位,而步骤750可包括对所述表示进行左移位。否则,步骤740可包括添加最低有效位,而步骤750可包括对表示进行右移位。在步骤750调准信号之后,过程进入步骤780。
如果输入格式中的比特总数不小于输出格式中的比特总数,则过程从步骤730进入步骤760,其中,调准(通过对表示进行左移位或右移位)信号以实现由输入参数定义的所需分布。如果Bi,CON<Bi,则步骤760可包括对所述表示进行左移位。否则,步骤760可包括对所述表示进行右移位。在步骤770中,在步骤760的移位操作之后结束于所述表示外部的比特被丢弃(或移除),以实现所需的输出信号分辨率(例如,格式大小/宽度)。取决于步骤720和725的压缩,在左移位操作之后的被丢弃的最高有效位不应包括任何有效信息。在右移位操作之后的被丢弃的最低有效位可能包括信息,而移除它们可能引入一定量的量化噪声。由于在步骤760的移位操作中可以认为移除是隐含的,因此将步骤770描述成是可选的。在步骤770之后,所述过程进入步骤780。
在步骤780,确定是否有更多的输入信号要进行变换。如果是,则所述过程返回到步骤720以将另一信号变换为所需格式。对步骤720-780进行迭代,直到所有输入信号完成变换。然后,在步骤790所述过程结束。
尽管在图7中未示出,但与上述情况相似,在一些实施例中,也可将输出格式的指示符标记在来自格式转换器的输出信号上。
图8示出了根据本发明实施例的音频信号处理系统执行的示例性操作800。例如,该示例性操作800可由图2A和图2B的任何系统100a、100b、200执行。
在步骤810中,音频系统接收一个或多个音频输入信号(可能具有不同格式)。在步骤820中,使用例如格式转换器或格式调准器之一(或可能这二者),输入信号被变换为另一格式,该格式适合于在步骤830中将采用的处理或是该处理所需的。例如,步骤820可采用分别结合图4和图7描述的任何方法。在步骤830中,例如使用任何已知的和/或将来的音频处理算法处理如此变换后的信号。在步骤840中,确定音频系统处理链是否包括任何其它处理步骤。如果包括,则所述过程返回步骤820。对步骤820和830进行迭代(在步骤830的每次迭代中可能采用不同算法),直到音频系统处理链不包括任何其它处理步骤。然后,所述过程继续进入可选步骤850,其中,将处理后信号变换为适合于将要接收该处理后信号的音频接收器的格式或该音频接收器所需的格式。例如,步骤850可采用分别结合图4和图7描述的任何方法。在步骤860中,将音频信号从音频信号处理系统输出到一个或多个接收器。
以下,将进一步举例说明格式调准器和格式转换器。在以下描述中,数字音频信号n将表示为Channel_n(An,Bn),n=1、......、N。因此,由于An表示整数比特的数量(其在所述表示包括符号位的情况下可能是负的),Bn表示小数比特的数量,所以信号n被标记上比特分布。作为例子,S(0,15)是用于脉冲编码调制(PCM)格式的记号,该格式使用16比特分辨率描述[-1、......、1]范围中的采样,其中,一个比特(符号位)用作整数比特,15个比特用作小数比特。
通常,信号可以是标量、矢量或矩阵,这取决于传输通过音频系统并由该音频系统处理的是单声道信号、立体声道信号还是多声道信号,以及这些信号是作为采样还是作为阵列进行传输及处理。
如上所述,可对信号标记上指示信号的当前分辨率和分布的信息。例如,如以下例子情况那样,A参数和B参数可与信号采样一起传输。可替代地,其它参数可用于传递必要信息(例如,分辨率参数和分布参数)。对于基于阵列的实现方式,如果所有采样被同样格式化,则只要该这列打上标记即可。
作为以必要格式信息来标记信号的可替代方式,必要格式信息可以独立于信号传送而在音频信号处理系统的单元之间传送。然而,这种解决方案具有需要更多资源的风险。其还需要专用于该目的的单元之间的附加通信信道。
一般地,本发明实施例提供用于将关于信号的必要格式信息传递/传达到音频处理系统的各个单元的手段。实现该操作的一种高效方式是在采样承载结构中包括格式描述,如以下将假设的那样。
在以下例子中,例如,如以下伪代码中所示,通过使用信号封装而在采样中包括格式描述(其中,An包括任何净空比特,Bn包括任何精度比特):
在一些实施例中,在信号封装中不包括参数H和K中的一个或二者。
如上所述,格式调准器可接收参数H和K作为输入,分别表示用于代表净空大小的比特数量和用于降低噪声基底的精度比特数量。参数H和K可用于确保格式调准器所调准的信号当中的最少量的净空比特和噪声基底比特。
在示例性格式调准器中,从信号封装中提取输入信号的格式(A1,B1),(A2,B2),...,(AN,BN)。用于输出信号表示的所需比特分辨率(RequiredSize)可确定为(其中,与图4中的过程400的步骤420相当,AI是输出格式中整数比特的数量,BI是输出格式中小数比特的数量):
示例性格式调准器于是使用RequiredSize和BI对输入信号就格式方面进行调准,使得每一输出信号具有相同分辨率和分布(或换句话说,分别相同的整数比特数量和小数比特数量)。因此,输出信号中的每个信号与任何其它输出信号在幅度上相当,且将具有一个相同的共同比特分辨率。
通过基于输入格式和输出格式调准所述表示,可实现调准。通过选取等于或大于RequiredSize的硬件架构的正确变量大小,确定输出采样的大小。然后,可(例如,基于BI)对大小改变后的信号中的每一个进行移位,以实现所需输出分布。以下伪代码描述信号的示例性调准(与图4中的过程400的步骤430、440、450、460相当):
在该实施例中,在An个整数比特的头部增加H个比特。因此,AIn=An+H将为每一输出信号保留关于动态范围(AIn+BI)的信息。可以观察到,由于BI对于所有经调准的信号是恒定的,所以在该实施例中,在AIn与BI之间存在的差异。因此,AIn+BI小于或等于ReqSize,这意味着,对于一些配置,一个信号可利用所有比特,而其它比特仅利用该配置中的比特的子集。
添加净空比特作为保护比特,如果操作导致放大到An个整数比特以上,则会体现净空比特的效果。
以AIn对经调准的信号进行标记的优点在于,如果信号在处理链中的后段输入到格式转换器,则获知AIn(=An+H)可有助于更精确地确定是否需要压缩。例如,如果AIn=ReqSize-BI,则可以确定,如果幅度超过阈值,则应该应用压缩(例如,如结合图7解释的那样)。在一些实施例中,以此方式使用AIn可导致更频繁地执行压缩器操作。
例如出于动态范围压缩的目的,AIn也可用于确定最大动态范围(以dB为单位,20log10(2AIn+BI))。
例如,将S1(0,15)、S2(0,15)、H=4和K=12输入到以上格式调准器将得到A1=A2=4,BI=27以及ReqSize=32。输入S1(0,15)、S2(8,7)、H=5和K=5的另一例子将导致A1=5,A2=13,BI=20,RequiredSize=34(因此,可以使用ReqSize=64)。如果输入S1(0,15)、S2(0,19)、H=4以及K=8,则调准将导致A1=A2=4,BI=27以及ReqSize=32(即32比特处理)。例如,如以上伪代码和例子中那样,可以用(An,Bn)=(AIn,BI)=(An+H,BI)标记输出信号。在另一例子中,如果如上所述的信号封装中包括H和K,则可以用(An,Bn)=(An,BI)来标记输出信号。
在使用格式调准器的软件实现的普通音频处理系统中,如果在软件的编译时需要获知适合于相应硬件的可用变量类型(ReqSize),则格式调准单元的实现可能要求以上算法的多个实现(例如函数的若干实例)。取决于实现方式,可以通过紧凑形式实现(例如利用宏和函数指针)来达到这些多个实现。
如上所述,格式转换器接收表示输出信号n所需格式的参数Azn、Bzn作为输入,其中,n=1、2、......、N。格式转换器将具有输入格式(An、Bn),n=1、2、......N的输入信号转换为具有输出格式(Azn、Bzn)的输出信号。格式转换器包括两个主要部分:压缩器和格式调整器。如果要求信号在所定义的输出格式的范围内,则压缩器用于压缩信号的幅度。调整器对所述表示格式重设大小(例如,通过添加和/或移除比特而重设大小)并且对其进行移置(例如,通过移位),以实现输出格式(Azn、Bzn)所需的分辨率和分布。
首先,格式转换器确定是否需要压缩(与图7中的过程700的步骤720相当)。在一些实施例中,该确定可以应用以下条件。如果Azn<An,则输入信号的信号幅度可大于输出格式可表现出的最大幅度,并且信号n可能需要被压缩,以能够适配输出格式。另一方面,如果Azn>=An,则确信输入信号的信号幅度不大于输出格式可表现出的最大幅度,并且不需要压缩。在一些实施例中,确定如果输入信号n的幅度的最大绝对值大于ZY-1,则需要压缩,其中,Y=(Azn+Bn),并且Z是符号表示的数学数基(即,对于二进制比特表示,Z=2)。
在一些实施例中,可使用US 6,741,966中公开的压缩算法,用于格式转换器的压缩功能。
根据一些实施例,压缩器用作自适应增益单元。压缩器也可以包括:在实际压缩之前延迟输入信号,这可提供在压缩中使用预测时间(look ahead time)来考虑将来采样值的可能性。在一些实施例中,压缩器的处理可以划分为三个阶段,其中每一阶段具有的长度为预定数量的采样。这三个阶段可包括:攻击阶段(其中,减少增益,这与减少的总幅度对应)、释放阶段(其中,增加增益,这与增加的总幅度对应)、以及保持阶段(其中,保持增益恒定,因此幅度不受影响)。对于示例性压缩器实现的进一步细节,参见US 6,741,966。
然而应注意,本发明绝不受限于该特定压缩器实现。反之,可以使用任何合适的压缩器(例如,能够充分地降低输入信号的幅度而使其在输出信号格式的范围内的任何压缩器)。甚至可以使用直接的纯增益控件(虽然在精度质量方面可能不是最优的)。
当信号n经过了压缩器并且潜在地已经被压缩(如果确定需要压缩的话)时,在一些实施例中,可以确保信号的幅度的最大绝对值使得:比信号的(Azn+Bn)个最低有效位更高位的比特不包含信息(例如,根据信号n是正还是负,这些比特可以是全0或全1)。
在一些实施例中,在压缩之后对所需格式(Azn,Bzn)的调准可以包括:对所述表示重设大小以及进行移位(与格式调准相当,例如图4中的过程400的步骤430和440),且可如下以伪代码实现(与图7中的过程700的步骤730、740、750、760、770、780相当):
在使用格式转换器的软件实现的普通音频处理系统中,如果在软件的编译时需要获知适合于相应硬件的可用变量类型(ReqSize),则格式转换器单元的实现可能——就格式调准器而言——要求以上算法的多个实现(例如函数的若干实例)。
值得注意的是,以上示例性格式转换器在(Azn+Bzn>An+Bn)且(Bn<Bzn)时的以上调准操作与以上伪代码中给出的示例行格式调准器中的调准操作对应,这可在一些硬件和/或软件实现中提供功能的重用。
本发明实施例可以用在标准化音频框架中,例如OpenMax IL框架(见例如www.khronos.org/openmax)。格式调准器和格式转换器可以被看作两个OpenMaxIL组件。
图9示出了具有音频呈现能力的示例性移动终端900。该移动终端900包括根据本发明实施例的音频信号处理系统。例如,移动终端900可包括结合图2A和图2B中的任一个而描述的布置。
所描述的本发明实施例及其等同方案可以通过软件或硬件或其组合来实现。格式调准器和/或格式转换器可实施为程序函数,由特定音频处理系统根据需调用或实例化。信号和/或信号采样,和/或信号和/或信号采样的集合可实施为本发明实施例的软件实现中的数据结构。与通信设备关联或与之集成的通用电路,例如数字信号处理器(DSP)、中央处理单元(CPU)、协同处理器单元、现场可编程门阵列(FPGA)或其它可编程硬件,或专用电路例如专用集成电路(ASIC)可以执行一些实施例。所有这些形式预期在本发明范围内。
可在包括电路/逻辑或执行根据本发明任何实施例的方法的电子装置内实施本发明。例如,电子装置可以是音频呈现设备、媒体播放器、通信设备、便携式或手持移动无线电通信器件、移动无线电终端、移动电话、通信器、电子组织器、智能电话、计算机、笔记本、移动游戏设备或(腕带)手表。
根据本发明一些实施例,计算机程序产品包括计算机可读介质,例如盘或CD-ROM。计算机可读介质可使得其上存储包括程序指令的计算机程序。计算机程序可加载到数据处理单元,例如,计算机程序可被包括在音频处理设备(例如,移动终端)中。当加载到数据处理单元时,计算机程序可以存储在与数据处理单元关联或集成至数据处理单元的存储器中。根据一些实施例,当加载到数据处理单元并且由数据处理单元运行时,计算机程序可以使得数据处理单元执行根据例如图4、图7和图8中的任一所示的方法的方法步骤。
在此已经参照各个实施例描述了本发明。然而,本领域技术人员应理解,对所述实施例的众多变化仍将落入本发明的范围内。例如,在此描述的方法实施例通过以特定顺序执行方法步骤而描述了示例性方法。然而,应理解,在不脱离本发明范围的情况下,这些系列的事件可以按另一顺序进行。此外,即使一些方法步骤被描述为按顺序执行,但是它们也可以并行执行。
同理,应注意,在本发明实施例的描述中,功能块划分为特定单元绝不限制本发明。反之,这些划分仅仅是例子。在此作为一个单元进行描述的功能块可以分离为两个或更多个单元。同理,在不脱离本发明范围的情况下,在此描述为作为两个或更多个单元而实现的功能块可以实现为单个单元。
因此,应理解,所述实施例的限制仅仅为了说明,但绝不是限制。反之,本发明的范围由所附权利要求而非说明书限定,并且落入权利要求的范围内的所有变化目的被包括在其中。
Claims (20)
1.一种数字音频信号处理系统,包括:
至少一个输入(110a-b、210),用于至少接收具有第一格式的第一数字音频信号,所述第一格式包括第一符号分辨率和第一符号分布;
至少一个第一格式变换器(120a-b、220a-d、300、500、600),用于基于至少第一参数和第二参数将所述第一数字音频信号变换为具有第二格式的第二数字音频信号,该第二格式包括与所述第一符号分辨率不同的第二符号分辨率以及与所述第一符号分布不同的第二符号分布,其中,所述第一参数与所述第二格式的整数符号的数量关联,所述第二参数与所述第二格式的小数符号的数量关联;以及
至少一个数字音频信号处理器(130a-b、230a-d),用于处理所述第二数字音频信号,以产生第三数字音频信号。
2.如权利要求1所述的数字音频系统,其中,所述第三数字音频信号具有第三格式,所述第三格式包括与所述第二符号分辨率相等的第三符号分辨率以及与所述第二符号分布相等的第三符号分布,该系统还包括:
至少一个第二格式变换器(140a-b、260、300、500、600),用于基于至少第三参数和第四参数将所述第三数字音频信号变换为具有第四格式的第四数字音频信号,该第四格式包括与所述第三符号分辨率不同的第四符号分辨率以及与所述第三符号分布不同的第四符号分布,其中,所述第三参数与所述第四格式的整数符号的数量关联,所述第四参数与所述第四格式的小数符号的数量关联;以及
至少一个输出(150a-b、270a),用于提供至少所述第四数字音频信号。
3.如权利要求1至2中的任一项所述的数字音频系统,其中,所述第一参数包括所述第二格式的整数符号的数量,所述第二参数包括所述第二格式的小数符号的数量。
4.如权利要求3所述的数字音频系统,其中,所述第一格式变换器包括至少一个压缩器(650a-c),用于压缩(725)所述第一数字音频信号。
5.如权利要求4所述的数字音频系统,其中,所述压缩器用于在所述第一数字音频信号的最大幅度的绝对值超过ZY-1时压缩(720)所述第一数字音频信号,其中,Y等于所述第二格式的整数符号数量与所述第一格式的小数符号数量之,并且,其中Z是所述符号表示的数学数基。
6.如权利要求3至5中的任一项所述的数字音频系统,其中,所述第一格式变换器包括格式宽度调准器(660a-c),用于将数个符号添加(740)到所述第一数字音频信号或者从所述第一数字音频信号移除(770)数个符号,以提供具有所述第二符号分辨率的第二数字音频信号。
7.如权利要求3至6中的任一项所述的数字音频系统,其中,所述第一格式变换器包括符号分布调准器(660a-c),用于对所述第一数字音频信号进行移位(750、760),以提供具有所述第二符号分布的第二数字音频信号。
8.如权利要求3至7中的任一项所述的数字音频系统,其中,所述第一格式变换器用于将多个数字音频信号变换为各自具有变换后格式的相应的多个变换后数字音频信号,对于所述多个数字音频信号中的每一个至少基于相应的第一参数和相应的第二参数,其中,所述相应的第一参数包括相应的变换后格式的整数符号的数量,所述相应的第二参数包括相应的变换后格式的小数符号的数量。
9.如权利要求1至2中的任一项所述的数字音频系统,其中,所述第一参数包括关于所述第二格式的净空符号的最小数量的指示,所述第二参数包括关于所述第二格式的精度符号的最小数量的指示。
10.如权利要求9所述的数字音频系统,其中,所述第一格式变换器包括格式宽度调准器,用于将数个符号添加(430)到所述第一数字音频信号,其中,所述符号的数量等于或大于净空符号的最小数量与精度符号的最小数量之和,以提供具有所述第二符号分辨率的所述第二数字音频信号。
11.如权利要求9至10中的任一项所述的数字音频系统,其中,所述第一格式变换器包括符号分布调准器,用于对所述第一数字音频信号进行移位(440),以提供具有所述第二符号分辨率的所述第二数字音频信号。
12.如权利要求9至11中的任一项所述的数字音频系统,其中,所述第一格式变换器用于基于所述第一参数和第二参数并且基于所述第一数字音频信号的第一格式确定(420)所述第二格式。
13.如权利要求9至12中的任一项所述的数字音频系统,其中,所述第一格式变换器用于至少基于所述第一参数和所述第二参数而将均具有各自的第一格式的多个数字音频信号变换为均具有相同第二格式的相应的多个变换后数字音频信号。
14.如权利要求13所述的数字音频系统,其中,所述第一格式变换器用于基于所述第一参数和第二参数并且基于所述多个数字音频信号的各自的第一格式而确定(420)所述第二格式。
15.如权利要求13至14中的任一项所述的数字音频系统,其中,所述第二符号分辨率是净空符号的最小数量、精度符号的最小数量、相应的第一格式当中的整数符号的最大数量、以及相应的第一格式当中的小数符号的最大数量之和。
16.如权利要求1至15中的任一项所述的数字音频系统,其中,所述第一格式转换器进一步用于:用所述第二格式的指示符对所述第二数字音频信号进行标记(450)。
17.如权利要求1至15中的任一项所述的数字音频系统,其中,每一符号包括一比特。
18.一种电子装置(900),包括如权利要求1至17中的任一项所述的系统。
19.如权利要求18所述的电子装置,其中,所述电子装置是音频呈现设备、媒体播放器、通信设备或移动电话。
20.一种计算机程序产品,包括计算机可读介质,在该计算机可读介质上具有包括程序指令的计算机程序,所述计算机程序可被加载到音频处理设备的数据处理单元中,并且用于:当所述数据处理单元运行所述计算机程序时,使得所述数据处理单元至少执行以下步骤:
接收(810)具有第一格式的至少第一数字音频信号,该第一格式包括第一符号分辨率和第一符号分布;
至少基于第一参数和第二参数将所述第一数字音频信号变换(820)为具有第二格式的第二数字音频信号,该第二格式包括与所述第一符号分辨率不同的第二符号分辨率以及与所述第一符号分布不同的第二符号分布,其中,所述第一参数与所述第二格式的整数符号的数量关联,所述第二参数与所述第二格式的小数符号的数量关联;以及
处理(830)所述第二数字音频信号,以产生第三数字音频信号。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09164705A EP2273495A1 (en) | 2009-07-07 | 2009-07-07 | Digital audio signal processing system |
EP09164705.7 | 2009-07-07 | ||
US22821709P | 2009-07-24 | 2009-07-24 | |
US61/228,217 | 2009-07-24 | ||
PCT/EP2010/058531 WO2011003715A1 (en) | 2009-07-07 | 2010-06-17 | Digital audio signal processing system |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102483925A true CN102483925A (zh) | 2012-05-30 |
Family
ID=41334528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800310968A Pending CN102483925A (zh) | 2009-07-07 | 2010-06-17 | 数字音频信号处理系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20120158410A1 (zh) |
EP (2) | EP2309497A3 (zh) |
CN (1) | CN102483925A (zh) |
DE (1) | DE212010000100U1 (zh) |
WO (1) | WO2011003715A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102881305A (zh) * | 2012-09-21 | 2013-01-16 | 北京君正集成电路股份有限公司 | 一种播放音频文件的方法和装置 |
CN106297811A (zh) * | 2013-06-19 | 2017-01-04 | 杜比实验室特许公司 | 音频处理单元和音频解码方法 |
CN110580919A (zh) * | 2019-08-19 | 2019-12-17 | 东南大学 | 多噪声场景下语音特征提取方法及可重构语音特征提取装置 |
US10956121B2 (en) | 2013-09-12 | 2021-03-23 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
CN113228694A (zh) * | 2018-12-20 | 2021-08-06 | 交互数字Vc控股公司 | 处理音频和/或视频内容及相应信号的方法、设备、电子组件、系统、计算机可读程序产品和计算机可读存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5569436B2 (ja) * | 2011-03-04 | 2014-08-13 | 株式会社Jvcケンウッド | 音声信号補正装置、音声信号補正方法及びプログラム |
MX2020009576A (es) | 2018-10-08 | 2020-10-05 | Dolby Laboratories Licensing Corp | Transformación de señales de audio capturadas en diferentes formatos en un número reducido de formatos para simplificar operaciones de codificación y decodificación. |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6741966B2 (en) * | 2001-01-22 | 2004-05-25 | Telefonaktiebolaget L.M. Ericsson | Methods, devices and computer program products for compressing an audio signal |
US20050010622A1 (en) * | 2003-07-10 | 2005-01-13 | Peng-Hua Wang | Method and apparatus for binary number conversion |
US20070005349A1 (en) * | 1998-10-26 | 2007-01-04 | Stmicroelectronics Asia Pactific (Pte) Ltd. | Multi-precision technique for digital audio encoder |
US20090094038A1 (en) * | 2007-09-19 | 2009-04-09 | Qualcomm Incorporated | Efficient design of mdct / imdct filterbanks for speech and audio coding applications |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5574934A (en) * | 1993-11-24 | 1996-11-12 | Intel Corporation | Preemptive priority-based transmission of signals using virtual channels |
US7395209B1 (en) * | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
WO2003077425A1 (fr) * | 2002-03-08 | 2003-09-18 | Nippon Telegraph And Telephone Corporation | Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques |
US7394410B1 (en) * | 2004-02-13 | 2008-07-01 | Samplify Systems, Inc. | Enhanced data converters using compression and decompression |
US7801383B2 (en) * | 2004-05-15 | 2010-09-21 | Microsoft Corporation | Embedded scalar quantizers with arbitrary dead-zone ratios |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US7561082B2 (en) * | 2006-12-29 | 2009-07-14 | Intel Corporation | High performance renormalization for binary arithmetic video coding |
-
2009
- 2009-07-07 EP EP11153054A patent/EP2309497A3/en not_active Withdrawn
- 2009-07-07 EP EP09164705A patent/EP2273495A1/en not_active Withdrawn
-
2010
- 2010-06-17 US US13/381,611 patent/US20120158410A1/en not_active Abandoned
- 2010-06-17 WO PCT/EP2010/058531 patent/WO2011003715A1/en active Application Filing
- 2010-06-17 DE DE212010000100U patent/DE212010000100U1/de not_active Expired - Lifetime
- 2010-06-17 CN CN2010800310968A patent/CN102483925A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070005349A1 (en) * | 1998-10-26 | 2007-01-04 | Stmicroelectronics Asia Pactific (Pte) Ltd. | Multi-precision technique for digital audio encoder |
US6741966B2 (en) * | 2001-01-22 | 2004-05-25 | Telefonaktiebolaget L.M. Ericsson | Methods, devices and computer program products for compressing an audio signal |
US20050010622A1 (en) * | 2003-07-10 | 2005-01-13 | Peng-Hua Wang | Method and apparatus for binary number conversion |
US20090094038A1 (en) * | 2007-09-19 | 2009-04-09 | Qualcomm Incorporated | Efficient design of mdct / imdct filterbanks for speech and audio coding applications |
Non-Patent Citations (4)
Title |
---|
ANONYMOUS: "reinterpretcast-Convert fixed-point data types without changing underlying data", 《HTTP://WWW.MATHWORKS.COM/ACCESS/HELPDESK/HELP/TOOLBOX/FIXEDPOINT/REF/REINTERPRETCAST.HTML》, 31 December 2008 (2008-12-31), pages 1 - 2, XP002558392 * |
ENRICO BOCCHIERI,ET AL.: "A DECODER FOR LVCSR BASED ON FIXED-POINT ARITHMETIC", 《PROCEEDINGS. 2006 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH AND SIGNAL PROCESSING,2006,ICASSP 2006》, 19 May 2006 (2006-05-19), pages 1113 - 1116 * |
ERICK L.OBERSTAR: "Fixed-Point Representation & Fractional Math", 《HTTP:WWW.SUPERKITS.NET/WHITEPAPERS/FIXED%20POINT%20REPRESENTATION%20&%20FRACIONAL%20MATH.PDF》, 30 August 2007 (2007-08-30), pages 13 * |
KI-I1 KUM,ET AL.: "A FLOATING-POINT TO INTEGER C CONVERTER WITH SHIFT REDUCTION FOR FIXED-POINT DIGITAL SIGNAL PROCESSORS", 《PROCEEDINGS. 1999 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 1999》, vol. 4, 19 March 1999 (1999-03-19), pages 2163 - 2166, XP010327809, DOI: doi:10.1109/ICASSP.1999.758363 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102881305A (zh) * | 2012-09-21 | 2013-01-16 | 北京君正集成电路股份有限公司 | 一种播放音频文件的方法和装置 |
CN106297811A (zh) * | 2013-06-19 | 2017-01-04 | 杜比实验室特许公司 | 音频处理单元和音频解码方法 |
CN106297811B (zh) * | 2013-06-19 | 2019-11-05 | 杜比实验室特许公司 | 音频处理单元和音频解码方法 |
US11404071B2 (en) | 2013-06-19 | 2022-08-02 | Dolby Laboratories Licensing Corporation | Audio encoder and decoder with dynamic range compression metadata |
US11823693B2 (en) | 2013-06-19 | 2023-11-21 | Dolby Laboratories Licensing Corporation | Audio encoder and decoder with dynamic range compression metadata |
US10956121B2 (en) | 2013-09-12 | 2021-03-23 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
US11429341B2 (en) | 2013-09-12 | 2022-08-30 | Dolby International Ab | Dynamic range control for a wide variety of playback environments |
US11842122B2 (en) | 2013-09-12 | 2023-12-12 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
CN113228694A (zh) * | 2018-12-20 | 2021-08-06 | 交互数字Vc控股公司 | 处理音频和/或视频内容及相应信号的方法、设备、电子组件、系统、计算机可读程序产品和计算机可读存储介质 |
CN110580919A (zh) * | 2019-08-19 | 2019-12-17 | 东南大学 | 多噪声场景下语音特征提取方法及可重构语音特征提取装置 |
CN110580919B (zh) * | 2019-08-19 | 2021-09-28 | 东南大学 | 多噪声场景下语音特征提取方法及可重构语音特征提取装置 |
Also Published As
Publication number | Publication date |
---|---|
DE212010000100U1 (de) | 2012-03-05 |
EP2309497A2 (en) | 2011-04-13 |
WO2011003715A1 (en) | 2011-01-13 |
EP2273495A1 (en) | 2011-01-12 |
EP2309497A3 (en) | 2011-04-20 |
US20120158410A1 (en) | 2012-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102483925A (zh) | 数字音频信号处理系统 | |
TWI453734B (zh) | 用以將符號編碼之方法、用以將符號解碼之方法、用以將符號從發送器發送至接收器之方法、編碼器、解碼器、及用以將符號從發送器發送至接收器之系統 | |
US11676612B2 (en) | Determination of spatial audio parameter encoding and associated decoding | |
US9378751B2 (en) | Method and system for digital gain processing in a hardware audio CODEC for audio transmission | |
US7949303B2 (en) | Method and system for an efficient implementation of the Bluetooth® subband codec (SBC) | |
JPH08328599A (ja) | Mpegオーディオ復号器 | |
CN101192832A (zh) | 处理音频信号的方法和系统 | |
US20110282657A1 (en) | Coding method, decoding method, and apparatuses, programs and recording media therefor | |
TW200614150A (en) | Multi-channel encoder | |
CN101918999A (zh) | 执行音频水印嵌入以及水印检测和提取的方法和设备 | |
WO2006003993A1 (ja) | 多チャネル信号符号化方法、その復号化方法、これらの装置、プログラム及びその記録媒体 | |
CN102460976A (zh) | 用于可变长度编码的方法和设备 | |
US7333036B2 (en) | Computing circuits and method for running an MPEG-2 AAC or MPEG-4 AAC audio decoding algorithm on programmable processors | |
EP4315324A1 (en) | Combining spatial audio streams | |
EP1366626B1 (en) | Video and audio transcoder | |
RU2486609C2 (ru) | Квантователь, кодер и их способы | |
US8601039B2 (en) | Computation apparatus and method, quantization apparatus and method, and program | |
CN111028849B (zh) | 包括编码hoa表示的位流的解码方法和装置、以及介质 | |
EP1249830A1 (en) | A method for decompressing a compressed audio signal | |
US20240127828A1 (en) | Determination of spatial audio parameter encoding and associated decoding | |
US20230335143A1 (en) | Quantizing spatial audio parameters | |
CN116032901A (zh) | 多路音频数据信号采编方法、装置、系统、介质和设备 | |
US20100013687A1 (en) | Method and apparatus for converting signals | |
JPH10233691A (ja) | 符号化方式および復号方式 | |
US20030210793A1 (en) | External input audio processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120530 |