CN101366177B - 音频供给量控制 - Google Patents

音频供给量控制 Download PDF

Info

Publication number
CN101366177B
CN101366177B CN2006800419216A CN200680041921A CN101366177B CN 101366177 B CN101366177 B CN 101366177B CN 2006800419216 A CN2006800419216 A CN 2006800419216A CN 200680041921 A CN200680041921 A CN 200680041921A CN 101366177 B CN101366177 B CN 101366177B
Authority
CN
China
Prior art keywords
audio signal
frequency
signal
synthetic audio
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800419216A
Other languages
English (en)
Other versions
CN101366177A (zh
Inventor
基姆·洛夫乔伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beaumont Freidman and Co
Original Assignee
Beaumont Freidman and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beaumont Freidman and Co filed Critical Beaumont Freidman and Co
Publication of CN101366177A publication Critical patent/CN101366177A/zh
Application granted granted Critical
Publication of CN101366177B publication Critical patent/CN101366177B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

一种控制暴露给消费者的合成音频信号的音频供给量的方法,该方法包括:采样所述合成音频信号;利用快速傅立叶变换算法对所采样的音频信号进行变换,以产生代表所述音频信号的频率分量的振幅的信号;将所变换的音频信号与预定的脉冲控制阈值分布进行比较,以产生代表广播信号与所述分布之间差异的配置信号,其中所述预定脉冲控制阈值分布表示所述音频信号阈值分布中每个频率分量的目标最大值振幅;利用所述配置信号自动地实时配置有限脉冲响应(FIR)滤波器,从而使得所述有限脉冲响应滤波器衰减多个频带中的所变换的音频信号的振幅,其中所述频带集中于超出所述目标阈值的频率;以及输出暴露给消费者的被衰减的音频信号。

Description

音频供给量控制
技术领域
本发明涉及音频供给量(audio dosage)控制,用以控制例如公共音乐会上扬声器的音频输出或者个人音乐播放器中馈给耳机的音频。
背景
公共音乐会上的表演者通常使用大功率放大系统,其中该大功率放大系统输出非常高的噪声级别。这可能对听众成员的听力造成损伤,也对录音师以及定期出席这种音乐会的其他人员的工作能力造成破坏。听力损伤包括在特定频率或广泛地横跨整个声音音频频谱(20Hz至20,000Hz)的敏感度损失,或者导致例如耳鸣的听力残疾。经常,这种损伤在当时不被受害人所察觉并将产生进一步的损伤,这是因为受害人随后将收听增加音量的音频信号,用以补偿已经遭受的听力损失。这种损伤在可听范围的较高频率部分尤其严重,而较高频率在摇滚音乐会中非常普遍。
因此,存在对这样一种方法和装置的需要,这种方法和装置能够控制用于音乐会的公共广播系统以及其它音频输出系统的音频供给量输出。
背景技术
用于音频供给量控制的已知系统包括US 2338551、US 4254303和US4306115,其自动调节发自扬声器的输出音量,以补偿背景噪声的级别。
在US 4583245中描述了一种系统,其通过叠加额外频率来控制扬声器膜片变化范围,以保护扬声器免于损伤。
EP 0529158描述了一种方法,用于衰减在瞬时强度或者累积声音供给量超出预定阈值的频带内的声音信号的振幅。这使用三分之一倍频程模拟固定带宽阻带陷波滤波器的阵列,其中根据来自监控广播声音信号并将该广播声音信号与目标分布(profile)进行比较的麦克风的反馈来触发该三分之一倍频程模拟固定带宽阻带陷波滤波器。这个已知方法有一个问题,即特定频带内的所有音频分量的振幅都被衰减(并非仅仅超出阈值的分量),而这将导致整体声音质量的降低。此外,依赖于滤波器的个数及它们的衰减带宽,对于被滤波的声音存在可变的时间延迟。这个一致时间延迟产生不受欢迎的、降低声音质量的音频效果,例如音调(tonal)偏移。此外,滤波发生在原始声音生成之后,而高振幅未滤波的脉冲串在校正之前通过。
进一步而言,由于衰减因子决定于频带之内的峰值,因此实际应用的衰减可能多于或少于理想所需的级别,并再次倾向于出现不必要的整体声音质量的降低。
发明内容
根据本发明第一方面,提供了一种控制暴露给消费者的合成音频信号的音频供给量的方法,该方法包括:采样所述合成音频信号;利用快速傅立叶变换算法对所采样的音频信号进行变换,以产生代表所述音频信号的频率分量的振幅的信号;将所变换的音频信号与预定的脉冲控制阈值分布进行比较,以产生代表广播信号与所述分布之间差异的配置信号,其中所述预定脉冲控制阈值分布表示所述音频信号阈值分布中每个频率分量的目标最大值振幅;利用所述配置信号自动地实时配置有限脉冲响应(FIR)滤波器,从而使得所述有限脉冲响应滤波器衰减多个频带中的所变换的音频信号的振幅,其中所述频带集中于超出所述目标阈值的频率;以及输出暴露给消费者的被衰减的音频信号。
该方法具有结合音频信号监控傅立叶变换程序和运行时间滤波器设计的优点。FIR(有限脉冲响应)滤波器的使用尤其具有优势。这些是以软件实现的固有稳定的数字滤波器,该软件典型地运行在数字信号处理器(DSP)上。该软件执行数学模型算法,例如由著名程序MATLAB(注册商标)定义的那些,以从给定的输入系数中定义滤波器响应,或者从给定的期望响应中定义系数。FIR滤波器可被配置为,仿效具有相当高准确度的大量非常窄的频率阻带滤波器。
通过例如来自舞台所采样的合成音频信号与所期望的目标分布之间的比较结果,有效地定义本发明FIR滤波器的期望响应。这个期望的滤波器响应随后被用来对特定频率计算该滤波器的系数,且这些系数被用来处理所述频率的后续信号:在此情况下,来抑制或衰减特定频率的信号,从而减少所述频率的振幅值。所述滤波立即生效,也即,在所采样音频信号被传到输出装置之前生效,其中所述输出装置为例如广播用扬声器或在个人音乐播放器中的个人消费用耳机等。
优选地,对每个带宽采用四个或更多子带。这可为对数标度上的。
优选地,根据本发明第二方面,对超出所定义阈值分布的所变换的音频信号进行标度,其中,本发明第二方面将被详细描述如下,并且为了参考方便其将被称为“校准方法盒增益(bin gain)”。
由于现场音频信号被实时地用来设计所述FIR滤波器的响应曲线,因此,与已知方法中可能使用的滤波相比,所述滤波更准确地适应需求。这具有明显优势,因为相比至今的方法,待衰减的频率分量可被更准确地识别出,而所述衰减被更准确地作为目标。本发明可显著减少出现例如靠近目标频率的那些频率分量的不必要的衰减。性能因此胜过利用固定滤波器的已知系统很多,其中固定滤波器具有横跨它们频率范围的不等的衰减。这应用于模拟和数字滤波器两者,并且误差在频率范围的界限处变得更极端。这个误差通常被称为“旁瓣”。然而,根据本发明配置的FIR滤波器的中心频率更准确地与待衰减的频率分量相匹配,因此大大减少了这种误差。
根据本发明第二方面,提供了一种控制暴露给消费者的合成音频信号的音频供给量的系统,该系统包括:用于采样所述合成音频信号的装置;用于对所采样的信号执行快速傅立叶变换算法的装置,以将所采样的信号变换为代表所述音频信号的频率分量的振幅的信号;用于将所变换的音频信号与预定脉冲控制阈值分布进行比较并产生代表广播信号与所述分布之间差异的配置信号的装置,其中所述预定脉冲控制阈值分布表示广播音频信号的每个频率的目标振幅;根据所述配置信号自动地实时配置有限脉冲响应(FIR)滤波器的装置,从而使得所述滤波器衰减多个频带中的所变换的音频信号的振幅,其中所述频带集中于超出所述目标阈值的频率;以及输出暴露给消费者被衰减的音频信号的装置。
一个或多个脉冲控制阈值分布可被定义为本发明第一方面的方法中的预校准步骤,且可将它们存储于高速数字信号处理器(DSP)中。
可利用缺省值例如监管机构所建议的值来整个或部分地生成这些分布。所述分布还可被手动地生成。可选地,它们可被自动生成。
在一个实施例中,预录制的样本被广播以及录制,并被用来生成分布;其中当被使用于所述第一方面的方法中时,该分布将使得待调节的衰减级别匹配所述样本。
在另一个实施例中,通过下列步骤自动地生成分布:应用多个不同的频率和振幅,采样各自的输出信号并用其来编译校准数据矩阵,以形成该分布。
因此,根据本发明第三方面提供了一种定义脉冲控制阈值分布的方法,该方法包括:广播多个频率信号,在每个频率包括多个振幅级别;在每个频率和振幅采样所述广播信号;以及利用所采样的信号来编译校准数据矩阵,用来定义该分布。
所述第三方面的方法可用来定义用于所述第一和/或第二方面中的一个或多个分布。
优选地,可通过在最靠近的位置设置两个麦克风和各自的前置放大器来使所述第三方面起作用,其中听众将相对音频信道扩音器占据该最靠近的位置,且所述麦克风被横向地分开放置在所述扩音器传播角度的中间角处(angle midrange)。这个传播角度在厂商说明书中被给出。
还提供了相应的系统。
优选地,每个麦克风被安排用于预定增益,也即,被校准以提供比拟声学级别输入的预定输出。
可编程振幅和频率正弦波产生器可被用来横跨20Hz至20,000Hz音频频谱在频率和振幅中扫描,并在每个频率测试点的振幅中循环。所需的校准数据矩阵可被用来定义待与演奏中实际样本进行比较的所述脉冲控制阈值分布。每个FFT盒带宽(bin bandwidth)的盒增益(bin gain)校准矩阵表示振幅范围上每个盒频率(bin frequency)的电输入级别的声学噪声级别的函数。
由于使用了实际测得的音频信道输出,这个预校准方法可改善脉冲控制准确度。然后,演奏或事件期间的反馈无需用于瞬时控制音频供给量。然而,在总供给量保护和衰减曲线控制仍然待解决时,仍将使用反馈。
还可对录音技术员和工程师在混合例如嗓音、乐器和特殊效果(合成)成分的音频信号时的技能加以利用,手动地生成分布,以在最终广播中获得艺术效果,对用户可变选择的分布提供有利的系统范围(latitude)。
可通过为通常在0至8dB范围中的频率子范围或盒频率手动地分配公差值(tolerance value),来产生衰减分布。
优选地,缺省衰减限度被安排为与标准的dBA加权标度成比例。然而,操作者可优选地调整这些限度。例如,根据音频广播的本性和待达到的效果,他可能希望增加某些子带衰减的阈值,且将随后减少其它子带的阈值,以补偿并保持在预定的总目标阈值供给量之内。这个目标将是所计算出的这个事件的最大总声音供给量,也即目标平均声音级别乘以这个事件的长度。这被称为等价声音级别或Leq。可由例如美国安全与健康管理局(OSHA)的标准机构设定这个最大声音供给量,以及可将所述Leq级别与其进行比较以提供百分比供给量。OSHA当前建议8小时的平均最大供给量为90dBA。在更短的时间周期上,可能更容易容忍更高的级别。
可选地,可通过录制预定时间周期的合成信号来确定分布,其中预定时间周期为例如期望的增强时间范围,随后根据期望的增强程度分配噪声级别。
根据本发明第四方面,提供了一种重新灌制预录制的音频信号的方法。所述第四方面的方法包括:播放音频样本,例如包括在音频播放器上诸如音乐或嗓音录制的商业录制形式的声轨(sound track);利用在预定配置中设置的多个有限脉冲响应(FIR)滤波器对所播放的音频样本进行滤波;录制所滤波的音频样本;重播所录制的音频样本;利用它来定义目标脉冲控制阈值分布;以及在用于控制所播放样本的音量的装置上应用所定义的分布。
所述分布可为预定时间周期上的目标限制供给量,例如样本长度上的目标平均音量级别,其可为声轨的长度或标准的收听周期。所述分布随后被应用于确定后续播放所述音频样本的音量的装置。
本发明的这个方面在个人移动音频播放器中具有特定的应用,其中个人移动音频播放器传统上是经由耳机在某些损伤音量级别来收听的。这种播放器的当前流行示例为固态和微型硬盘播放器,其以例如已知的MP3格式的压缩格式录制音频信号。然而,它可以以多种压缩技术和播放器格式被使用,而并无实质性修改。
在这些播放器中,通过例如CODEC(编码器一解码器)文件的软件程序来管理音量控制,CODEC文件当前被用来平衡压缩格式之间的音量级别,例如CD和MP3格式之间。所定义的目标分布可被应用于被压缩录制的所述CODEC文件中音量控制项,以确保所述广播音频样本编译所述分布,也即,观测到目标平均音量级别。
这个方法可被应用于压缩录制,或可被应用于所述音频播放器本身。在商业级别,当录制和/或音频播放器被配置为利用这个方法时,它将被签署为具有标识符号。因此,不注意关心是否超出建议的音频级别的人们,将受到保证没有超出总的建议限度。
附图说明
图1为图解针对不同频率建议的最大音频供给量的曲线图;
图2为图解本发明可应用于其中的一个方式的曲线图;
图3为图解本发明用于音乐会中的示意图;
图4为图解本发明系统的框图;
图5为图解本发明可应用于其中的第二个方式的曲线图;
图6图解了第二实施例的变体;
图7图解了供本发明使用的控制屏幕显示;
图8图解了根据本发明第二实施例的方法;以及
图9为图解图8所示方法的软件处理顺序的简化的基于时间的图表。
具体实施方式
政府和监管机构例如美国职业安全与健康管理局(Occupational,Safetyand Health Act,OSHA)已公布了建议的噪声暴露限度。在图1中示出了OSHA表,其在对数标度上以赫兹(Hz)为单位水平地标绘频率,相对地以分贝(dB)为单位在左手侧垂直轴上标绘音量;并且,对于每一个频率和音量的组合,以分钟为单位在右手侧垂直轴上标识建议的最大暴露时间。
较低的频率值,朝向曲线图的左侧,表示较低音高(pitch)的声音;而较高的频率值,也即较高的音高,朝向右侧。例如,地板振动为约20赫兹,吉他声音和嗓音将高达约1000 Hz。高于10,000 Hz的频率将听起来象尖叫(squeel)。振幅或响度标度从表示低语的30dB(SPL)、经过在约45dB(SPL)的日常对话、经过在约80dB(SPL)的喊叫向人体耐受量的较高级别变化,其中人体耐受量的较高级别包括喷气式飞机起飞的声音(约120dB(SPL))和位于标度顶端的通常可接受的痛阈值(140dB(SPL))。
将可看出,建议的限度变化相当大。与较高的频率相比,较低的频率在较高的级别可被忍受较长的时间,尤其在高级别时。因此,例如,在300Hz的声音建议最大供给量从90dB(SPL)的约480分钟变化为130dB(SPL)的仅仅7分钟。在120dB(SPL),100Hz的频率可被忍受约60分钟,而较高的频率3000Hz可能仅仅被忍受1.5分钟。当然,安全限度将在听众的个别成员之间变化,且这些建议仅用于一般性指导。
这种监管机构的建议可用作定义将用于本发明中的预定阈值分布的基础。
图2为典型音频频谱在一个具体时间点的快照,表现为在垂直轴上以分贝为单位的振幅曲线(音量级别),相对在对数标度上以赫兹为单位水平标绘的频率(音高)。
在曲线图顶部示出了一组曲线,其表示可由本发明系统所应用的阈值分布(threshold profile),以设置待广播的监控信号的衰减级别。这些曲线一般以图1所示的OSHA曲线为基础。因此,例如,如果曲线43被用作阈值分布,则50、51、52和53所示的频率分量将按照所指示的量被衰减,以使它们达到沿曲线43排列。这样,频率51被衰减最多,频率50被衰减次多,而频率52和53仅被衰减很小的量。
通过以个别频率分量作为目标以及使用精心定义的分布,本发明能够仅将最危险的频率衰减必需量以使声音变得安全。从图2可以看出,没有必要衰减大部分频率。因此,本发明方法的整体效果不对听众表现出明显的音量降低,但显著减少了听力损伤的风险。
在依赖于瞬时计算出的总音频供给量的演奏期间,可选择并改变分布曲线的级别。这样,如果系统计算出总的音频供给量,通过音乐会的演出长度(projected length),将很可能超出建议值,则分布曲线将被“下”移,也即至图2所示示例中的曲线41或42之一。如果计算出的总供给量低于总建议值,则将使用“较高”的曲线,即曲线44至49中之一。
整个音乐会期间的总投射供给量被计算为目标总供给量的百分比,且被称为百分比L EQ供给量。可将它持续地显示给录音师,通过例如汽油表型显示形式,该汽油表型显示具有指示总目标供给量的多少已被使用的箭头,和/或与整个音乐会的平均供给量相比,瞬时音频输出或前五分钟的音频输出的图形显示形式。
图3图解了本发明在音乐会上的使用。典型地,乐队1在听众2前面的舞台上演奏。乐队1演唱并弹奏乐器,因此具有种种乐器的和嗓音的输出,其中由麦克风和电子乐器拾音器拾取所述乐器和嗓音的输出。相应的电子音频信号沿线路3被提供给混合单元4,然后典型地提供给放大器5以及随后给扬声器6,以将被混合且放大的乐队1的声音广播给听众2。
混合单元4可为模拟或数字单元并典型地由有经验的录音师操纵,该录音师改变所监控的乐队1的声音中不同分量的比较强度,从而使得广播信号对听众来说是可接受的:例如,可增强嗓音的频率,以使得相比一些乐器的声音,可以更清楚地听到嗓音的声音。可选地,对于某些类型的音乐,可增强低音部的声音。
混合单元4连接至担当控制单元7的一组后混合器(post-mixer),一个后混合器控制单元对应于每一个放大器5;并且,控制单元均连接至中心集成单元8,该中心集成单元8连接至例如便携式计算机9的计算装置。此外,一组反馈麦克风10被置于听众2之中,优选地,相隔一定距离地、沿最靠近扬声器11的听众2的边界11放置,从而采样听众2听到的最高的声音级别。反馈麦克风10优选为无线使能的,并将表示边界11处的声音级别的信号回传至各控制单元7以及传送至集成单元8。当然,麦克风可为硬连线的或通过其它方式传送信号。它们可悬挂在边界11上方,例如,如果可以的话从天花板,或者从可能被竖立起来以支撑照明设备的托架悬挂。可选地,它们可被置于堆积的障碍物中。
集成单元8处理来自反馈麦克风10的信号,并实时地、每隔一定时间地,例如一分钟,计算累积的声音投射供给量。便携式计算机9向录音师提供当前声音供给量的信息,并且它还存储目标阈值分布并计算投射供给量。
控制单元7有效地将从混合单元4接收到的声音信号与预定的阈值目标分布进行比较,并衰减声音信号中超出阈值分布的成分。从图4流程图考虑,将更充分地理解它们的操作。
至控制单元7的输入通常为数字信号,而任何模拟信号在任何情形下将被数字化。
在图4中,舞台上的麦克风和拾音器被表示于框20,且它们提供电子信号至混合单元4,该混合单元4提供时域信号T至控制单元7。控制单元7包括固件21,其对时域信号T执行快速傅立叶变换(Fast Fourier Transform,FFT)运算以将时域信号T转换为频域信号F,也即,提供指示频率值的频谱振幅的频谱,例如随后描述的图5所示。
控制单元7包括比较器22,其将通过快速傅立叶变换运算产生的频谱与由便携式计算机9提供的阈值分布P进行比较。比较器22识别瞬时振幅超出由阈值所确定的振幅的那些频率,并输出代表那些频率的配置信号C。这个配置信号C被应用于可配置的滤波器23,其优选地包括有限脉冲响应滤波器(Finite Impulse Response,FIR)。FIR滤波器为实时可配置的,从而衰减占据以下频带的信号的振幅,所述频带集中于超出阈值的分量的精确频率。随后,可配置的FIR滤波器23被用来衰减时域信号T的振幅,并且被滤波的信号经由放大器5和扬声器6被广播。
图4还图解了一种产生具体阈值分布P的方法。通过至少一个反馈麦克风10监控从扬声器6广播的声音,其中反馈麦克风10优选地如图3所示被置于最靠近扬声器或多个扬声器的听众边界处。经由积分器(integrator)8将来自反馈麦克风或多个麦克风10的信号提供给便携式计算机9,在便携式计算机9上分析该信号以对正在执行的具体动作确定典型的声音分布。这可为,例如,如随后描述的图6所示。可随后将典型分布添加至预定衰减曲线,例如图2中所示的那些,以产生合成分布P,该合成分布P被施加到控制单元7中的比较器22。
在EP0529158A中说明了这样一个模拟范例,其中可听见的频率被划分为16个频带,并产生表示每个频带的平均振幅的信号。本发明利用数字技术,并能够有效地提供可听见的频谱的更准确表示以及每个频率分量的振幅。
本发明还可提供一种方式,其中录音师可设计用于衰减的阈值分布,以允许一些免除(exemption)。例如,他可能希望相比缺省的分布,允许强调主唱或主奏吉他。为此,计算机9可被设置为,允许一些相关的特定频带达到比缺省阈值分布更高的振幅级别,否则将不被允许。这示出在图5中,其中阈值曲线42至44在频率子带60至65中被修改。这可为,例如,在60通过主奏吉他声(rip)、在61强调主唱、在62强调第二唱(second vocal)、在63降低对反馈的强调、在64通过铙钹的声音以及在65降低对较高频率反馈的强调。典型地,这种修改可在+8dB至-12dB的范围内,其中在+8dB允许频率上的更大声的级别、在-12dB减少响度级。当然,这仅为本发明所允许的预配置种类的一个示例。
可由有经验的录音师手动进入该免除分布,但更优选地,从先前记录或瞬时采样的音乐会节目的成分(element)自动生成该免除分布。例如,特定歌手可具有与众不同的嗓音分布,且不希望通过衰减改变该嗓音分布。这样,可对该歌手的演唱嗓音提取样本,并将该样本提供给便携式计算机9,便携式计算机9将使用该样本以叠加在缺省的阈值分布曲线上。在图6对这个进行图解,其中女性歌手71的嗓音样本被示出为在72的频率对振幅图,并示出为被叠加在从图2选择的阈值曲线(例如,43)上,从而产生合成分布73。
可通过从反馈麦克风10提取样本来在音乐会期间生成分布72。
图7为便携式计算机9上屏幕显示的示例,其指示录音师在音乐会期间可用的衰减分布选项,以允许对特定乐队和歌曲精心协调分布。例如,屏幕可被划分为四个区A、B、C和D,这四个区A、B、C和D对应于在音乐会中演奏的四个不同乐队;以及每个歌曲可如图所示被编号1至5。可能用到弹出式显示框,例如对乐队B的歌曲2在78所示的。框78给出了歌曲的更多细节,例如“John’s lead for“Breaking Out”B-2 solo”;并将显示分布的样本,在分布转为“on(开)”时该分布样本被叠加在缺省曲线(也就是图4中的43)上。这种显示和存储特定分布的形式允许录音师拥有绝对的灵活性以适合于在音乐会期间改变演奏的时间或次序。
本发明使得录音师能够完全有效地控制所施加的衰减,从而能够保持特定艺术内容和特殊效果。
在广播之前,可从信号生成音乐会演奏的数字原版录音(digital masterrecording),这是有用的,因为这些录音不存在伴随的噪声且在需要时为播音室重新灌制(re-mastering)作好准备。
本发明还可用于数字化重新灌制已录制的音乐,尤其是那些以例如CD或MP3格式的压缩形式进行商业化销售的音乐,且典型地在个人可移动音频播放器上播放的音乐。
在基准(benchmark)音频播放器上播放音频样本,并利用设置缺省或预定值的有限脉冲响应(FIR)滤波器将输出进行滤波。被滤波的输出随后被用来定义目标分布,以确定满足该目标分布的平均音量级别;并且,这个被应用于压缩录音的CODEC文件。对每个声轨(sound track)而言,可使用一个例如图中7所示的后混合器控制单元和中心集成单元来实现。
在图8和图9图解的本发明的增强形式中,低频率(优选地低于100Hz)被排除在信号处理之外,并被允许作为基载波通过。这减少了传播延迟并降低了输出中的失真,其中输出中的失真可能因为在最低滤波器应用的启动和停止出现的阶跃变化而发生。
四个反向FFT缓冲被添加至基载波,以形成合成的音频输出信号。典型地,最低范围的传播延迟可减少至85毫秒,第二范围的传播延迟可减少至43毫秒,第三范围的传播延迟可减少至21毫秒,以及第四范围的传播延迟可减少至5毫秒。
在缓冲求和之后,可通过简单的衰减器来管理对累积供给量起反作用的任何非常低的频率,但这些低频率对典型的总音频供给量的作用通常低于1%,因此这个意义不是很大。
在图8中示意性示出了该适应性方法。通过工作于48KHz的24比特A/D转换器100将输入合成信号IN转换为数字信号,并通过24KHz的FIR滤波器101对其进行滤波。低于100Hz的最低频率被允许通过FIR滤波器102并形成基载波信号,该基载波信号被输入至求和模块103。高于100Hz的频率要经过本发明方法的处理,也即,它们要经过在FFT输入循环缓冲器104中使用快速傅立叶变换算法和FIR滤波的分解处理,其中FFT输入循环缓冲器104工作在如图所示100Hz和24KHZ之间的四个范围1、2、3和4中。这些范围在各自的模块121、122、123和124中被变换和衰减,并通过各自的模块131、132、133和134被反变换;并且,这四个范围中的结果信号随后被应用于求和模块103,以将其添加至基载波。然后,通过低频计数器105对求和后的信号进行标度,并在D/A转换器106中将其转换为模拟信号,以形成输出信号OUT。
四个范围的间距以被接受的感知编码实践为基础。每个范围均定义样本片断,样本预调节,例如零塞入(zero-stuffing)、完整的合成FFT运行和与频域谐波滤波相比较的dB数量。
图9为简化的基于时间的图表,用于对图8所示方法中操作的关键软件处理顺序进行图解。当然,取样频率和范围数据交叠值仅作为示例给出,且对于具体的应用被最优化。可通过在存储器中维持配置参数集来帮助这种最优化,以准许程序管理器PC做出改变。
图9示意图合并与图8相同的元件,且使用一样的附图标记。程序调度程序(program routine)的描述列表如下:
程序调度程序描述
A/D 48KHz、24比特取样的音频信道。这是连续的后台程序(backgroundroutine),其将输入的转化加载至接收循环缓冲器。
24K FIR这个为具有0.02dB通带波动和60dB阻带抑制的4095采样FIR低通滤波器,被用作普通的抗混叠滤波器。该滤波器根据系数集对接收循环缓冲器递增地操作,其结果输出被保存至FFT循环缓冲器和基载波信号循环缓冲器。
100 FIR这个为具有0.02dB通带波动和60dB阻带衰减的4095采样FIR低通滤波器,被用来移除除了基载波循环缓冲分量之外的所有分量。
缓冲器  求和程序,其累加基载波、FFT-1反向循环缓冲成分、FFT-2反向循环缓冲成分、FFT-3反向循环缓冲成分和FFT-4反向循环缓冲成分。这个程序还维持峰值动态范围更新,其对任何必需的低音部衰减进行低频标度调整。
D/A 48KHz、24比特的衰减音频信道输出。这个为连续的后台程序,其从缓冲器求和程序加载并输出目前模拟级别(immediate analoguelevel)。
A-加载  这个为测试分支,其检查接收循环缓冲器加载的位置,以启动具有滤波功能的基载波信号缓冲器的再加载操作。
B-加载  这个为测试分支,其检查FFT循环缓冲器的位置,以对交替执行的四个范围的FFT计算计时,如在通过选择中所示的。
FFT-4  对具有指定的交替采样和零塞入的FFT循环缓冲器运行最高频FFT程序。
FATN-4  将FFT-4频谱中可用的盒频率(bin frequency)范围与(从程序管理器接收到的)目前衰减分布进行比较,并将任何超出该分布的盒频率减少至该分布级别。
BUFF-4  针对时域校准调整已衰减的FFT-4频谱,对减少的频谱运行反向FFT,并将结果加载至FFT 4循环缓冲器用以求和输出。
FFT-3  对具有指定的交替采样和零塞入的FFT循环缓冲器运行中高频FFT程序。
FATN-3  将FFT-3频谱中可用的盒频率范围与(从程序管理器接收到的)目前衰减分布进行比较,并将任何超出该分布的盒频率减少至该分布级别。
BUFF-3  针对时域校准调整已衰减的FFT-3频谱,对减少的频谱运行反向FFT,并将结果加载至FFT 4循环缓冲器用以求和输出。
FFT-2  对具有指定的交替采样和零塞入的FFT循环缓冲器运行中低频FFT程序。
FATN-2  将FFT-2频谱中可用的盒频率范围与(从程序管理器接收到的)目前衰减分布进行比较,并将任何超出该分布的盒频率减少至该分布级别。
BUFF-2  针对时域校准调整已衰减的FFT-2频谱,对减少的频谱运行反向FFT,并将结果加载至FFT 4循环缓冲器用以求和输出。
FFT-1  对具有指定的交替采样和零塞入的FFT循环缓冲器运行低频FFT程序。
FATN-1  将FFT-1频谱中可用的盒频率范围与(从程序管理器接收到的)目前衰减分布进行比较,并将任何超出该分布的盒频率减少至该分布级别。
BUFF-1  针对时域校准调整已衰减的FFT-1频谱,对减少的频谱运行反向FFT,并将结果加载至FFT 4循环缓冲器用以求和输出。
通信检查(COMM Chk)这个为测试分支,用以查明自从最后通过以来是否发生了由程序管理器数据查询引起的通信中断。
交换(EXCHG)这个程序处理输入的分布带限制与输出的目前级别之间的一系列数据交换。

Claims (20)

1.一种控制暴露给消费者的合成音频信号的音频供给量的方法,该方法包括:
采样所述合成音频信号;
利用快速傅立叶变换算法对所采样的合成音频信号进行变换,以产生代表所述合成音频信号的频率分量振幅的合成音频信号;
将所变换的合成音频信号与预定的脉冲控制阈值分布进行比较,以产生代表所述变换的合成音频信号与所述预定脉冲控制阈值分布之间差异的配置信号,其中所述预定脉冲控制阈值分布表示期望广播的合成音频信号阈值分布的每个频率分量的目标最大值振幅;
利用所述配置信号自动地实时配置有限脉冲响应FIR滤波器,从而使得所述有限脉冲响应滤波器衰减多个频带中的所变换的合成音频信号的振幅,其中所述频带集中于超出目标阈值的频率;以及
输出暴露给消费者的被衰减的合成音频信号。
2.如权利要求1所述的方法,还包括利用数字信号处理器以配置所述FIR滤波器。
3.如权利要求1或2所述的方法,还包括识别所述变换的合成音频信号中具有超出各目标的振幅的所述频率分量。
4.如权利要求2所述的方法,还包括为所述快速傅立叶变换算法设置时间周期,以与所述采样的合成音频信号的带宽的最小周期相同。
5.如权利要求1所述的方法,其中所述脉冲控制阈值分布至少部分地由缺省分布定义,且所述缺省分布由每个频率的音频供给量决定。
6.如权利要求1所述的方法,其中所述脉冲控制阈值分布至少部分地由操作者手动定义,且所述操作者根据期望的广播输出信号建立所述阈值分布。
7.如权利要求1所述的方法,其中所述脉冲控制阈值分布至少部分地通过以下步骤被定义:对所需的分布广播音频样本,监控所广播的音频样本,以及配置计算机来匹配所广播的音频样本。
8.如权利要求1所述的方法,还包括以下可选的步骤:使操作者能够在一个或多个频率手动修改所述变换的合成音频信号的振幅衰减。
9.如权利要求8所述的方法,包括以下步骤:通过自动衰减至少一个其它频率的振幅,补偿任何一个频率衰减的任何手动修改。
10.如权利要求9所述的方法,还包括对每个没有衰减的频率,生成所述期望广播的合成音频信号输出对输入振幅的预校准矩阵。
11.如权利要求1所述的方法,包括定义所述预定脉冲控制阈值分布,以确定经过预定时间周期的最大音频级别供给量。
12.一种控制暴露给消费者的合成音频信号的音频供给量的系统,该系统包括:
用于采样所述合成音频信号的装置;
用于对所采样的合成音频信号执行快速傅立叶变换算法的装置,以将所采样的合成音频信号变换为代表所述合成音频信号频率分量的振幅的信号;
用于将所变换的合成音频信号与预定脉冲控制阈值分布进行比较并产生代表所述变换的合成音频信号与所述预定脉冲控制阈值分布之间差异的配置信号的装置,其中所述预定脉冲控制阈值分布表示期望广播的合成音频信号的每个频率的目标振幅;
用于根据所述配置信号自动地实时配置有限脉冲响应FIR滤波器的装置,从而使得所述滤波器衰减多个频带中的所变换的合成音频信号的振幅,其中所述频带集中于超出目标阈值的频率;以及
输出暴露给消费者的被衰减的合成音频信号的装置。
13.如权利要求12所述的系统,还包括,用于测量所述采样的合成音频信号的带宽的最小周期的装置。
14.如权利要求13所述的系统,还包括,将所述快速傅立叶变换算法的时间周期设置为与所述最小周期相同的装置。
15.如权利要求12至14中任一所述的系统,其中还包括用于定义脉冲控制阈值分布的装置,所述装置至少部分地将所述脉冲控制阈值分布定义为缺省分布,且所述缺省分布由每个频率的音频供给量决定。
16.如权利要求15所述的系统,其中所述用于定义所述脉冲控制阈值分布的装置包括,适于操作者手动介入以根据期望的广播输出信号建立所述阈值分布的装置。
17.如权利要求15所述的系统,其中所述用于定义所述脉冲控制阈值分布的装置包括:用于广播所需分布的音频样本的装置,用于监控所述音频样本的装置,以及用于配置计算机以匹配所述音频样本的装置。
18.如权利要求14所述的系统,还包括,用于使操作者能够在一个或多个频率上手动修改所述变换的的合成音频信号的振幅衰减的装置。
19.如权利要求18所述的系统,还包括,用于通过自动衰减至少一个其它频率的振幅来补偿任何一个频率衰减的任何手动修改的装置。
20.如权利要求14所述的系统,还包括用于存储所述预定脉冲控制阈值分布的数字信号处理器。
CN2006800419216A 2005-09-15 2006-09-15 音频供给量控制 Expired - Fee Related CN101366177B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0518864.4 2005-09-15
GB0518864A GB2430319B (en) 2005-09-15 2005-09-15 Audio dosage control
PCT/EP2006/066426 WO2007031582A1 (en) 2005-09-15 2006-09-15 Audio dosage control

Publications (2)

Publication Number Publication Date
CN101366177A CN101366177A (zh) 2009-02-11
CN101366177B true CN101366177B (zh) 2012-09-26

Family

ID=35248848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800419216A Expired - Fee Related CN101366177B (zh) 2005-09-15 2006-09-15 音频供给量控制

Country Status (6)

Country Link
US (1) US8431957B2 (zh)
EP (1) EP1941611A1 (zh)
CN (1) CN101366177B (zh)
GB (1) GB2430319B (zh)
RU (1) RU2419964C2 (zh)
WO (1) WO2007031582A1 (zh)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8199919B2 (en) 2006-06-01 2012-06-12 Personics Holdings Inc. Earhealth monitoring system and method II
US8208646B2 (en) * 2006-11-22 2012-06-26 Verizon Patent And Licensing Inc. Audio filtration for content processing systems and methods
JP5396685B2 (ja) * 2006-12-25 2014-01-22 ソニー株式会社 音声出力装置、音声出力方法、音声出力システムおよび音声出力処理用プログラム
KR101356206B1 (ko) * 2007-02-01 2014-01-28 삼성전자주식회사 자동 오디오 볼륨 기능을 갖는 오디오 재생 방법 및 장치
WO2009086033A1 (en) * 2007-12-20 2009-07-09 Dean Enterprises, Llc Detection of conditions from sound
US8838259B2 (en) 2009-11-18 2014-09-16 Blackberry Limited Frequency-specific determination of audio dose
US8660677B2 (en) 2009-11-18 2014-02-25 Blackberry Limited Sound pressure level-aware music playlists
EP2325843B1 (en) 2009-11-18 2013-04-03 Research in Motion Limited Frequency-specific determination of audio dose
EP2333497B1 (en) * 2009-11-18 2013-07-03 Research in Motion Limited Sound pressure level-aware music playlists
US9066171B2 (en) 2009-12-24 2015-06-23 Nokia Corporation Loudspeaker protection apparatus and method thereof
GB201005026D0 (en) 2010-03-25 2010-05-12 Georgiou Archiveades Method and system
JP5532518B2 (ja) * 2010-06-25 2014-06-25 ヤマハ株式会社 周波数特性制御装置
CN103119846B (zh) * 2010-09-22 2016-03-30 杜比实验室特许公司 利用对白水平归一化对音频流进行混合
JP2012169828A (ja) * 2011-02-14 2012-09-06 Sony Corp 音声信号出力装置、スピーカ装置、音声信号出力方法
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9706323B2 (en) 2014-09-09 2017-07-11 Sonos, Inc. Playback device calibration
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
US10664224B2 (en) 2015-04-24 2020-05-26 Sonos, Inc. Speaker calibration user interface
WO2016172593A1 (en) 2015-04-24 2016-10-27 Sonos, Inc. Playback device calibration user interfaces
CN107852564B (zh) * 2015-07-21 2019-06-18 搜诺思公司 用于使用移动麦克风进行的空间平均房间音频校准的混合测试音调
US9538305B2 (en) 2015-07-28 2017-01-03 Sonos, Inc. Calibration error conditions
EP3531714B1 (en) 2015-09-17 2022-02-23 Sonos Inc. Facilitating calibration of an audio playback device
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
US20190391782A1 (en) * 2017-02-10 2019-12-26 Cary Randolph Miller Method and system of processing an audio recording for facilitating production of competitively loud mastered audio recording
US9860644B1 (en) 2017-04-05 2018-01-02 Sonos, Inc. Limiter for bass enhancement
FR3067207B1 (fr) * 2017-06-02 2020-02-14 Peugeot Citroen Automobiles Sa Dispositif de controle du niveau d’exposition au bruit dans un espace d’un systeme
US10531180B2 (en) * 2018-04-06 2020-01-07 Motorola Mobility Llc Feed-forward, filter-based, acoustic control system
US11122354B2 (en) * 2018-05-22 2021-09-14 Staton Techiya, Llc Hearing sensitivity acquisition methods and devices
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
CN109769175B (zh) * 2019-02-25 2021-03-23 维沃移动通信有限公司 一种音频处理方法和电子设备
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device
US20230199381A1 (en) * 2020-06-09 2023-06-22 Sony Group Corporation Dosimeter for sound exposure
US20220225048A1 (en) * 2021-01-14 2022-07-14 Onanoff Limited Company (Ltd.) System and method for managing a headphones users sound exposure

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0529158A1 (en) * 1989-11-14 1993-03-03 Lovejoy Controls Corporation Controlling sound dosage
EP0288159B1 (en) * 1987-03-23 1995-05-10 Matsushita Electric Industrial Co., Ltd. Digital equalizer apparatus enabling separate phase and amplitude characteristic modification
CN1373566A (zh) * 2001-02-28 2002-10-09 矽统科技股份有限公司 供非对称数字客户端回路用之回波消除器

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4583245A (en) 1984-06-14 1986-04-15 Renkus-Heinz, Inc. Speaker system protection circuit
US4888808A (en) * 1987-03-23 1989-12-19 Matsushita Electric Industrial Co., Ltd. Digital equalizer apparatus enabling separate phase and amplitude characteristic modification
JP3266020B2 (ja) * 1996-12-12 2002-03-18 ヤマハ株式会社 音像定位方法及び装置
US6826515B2 (en) * 2002-02-01 2004-11-30 Plantronics, Inc. Headset noise exposure dosimeter

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0288159B1 (en) * 1987-03-23 1995-05-10 Matsushita Electric Industrial Co., Ltd. Digital equalizer apparatus enabling separate phase and amplitude characteristic modification
EP0529158A1 (en) * 1989-11-14 1993-03-03 Lovejoy Controls Corporation Controlling sound dosage
CN1373566A (zh) * 2001-02-28 2002-10-09 矽统科技股份有限公司 供非对称数字客户端回路用之回波消除器

Also Published As

Publication number Publication date
RU2419964C2 (ru) 2011-05-27
WO2007031582A1 (en) 2007-03-22
US20090092265A1 (en) 2009-04-09
CN101366177A (zh) 2009-02-11
EP1941611A1 (en) 2008-07-09
RU2008114497A (ru) 2009-10-20
GB2430319B (en) 2008-09-17
GB0518864D0 (en) 2005-10-26
US8431957B2 (en) 2013-04-30
GB2430319A (en) 2007-03-21

Similar Documents

Publication Publication Date Title
CN101366177B (zh) 音频供给量控制
CN100481722C (zh) 声虚拟现实引擎中增强传送音的系统和方法
US7162046B2 (en) Microphone-tailored equalizing system
JP4234174B2 (ja) 残響調整装置、残響調整方法、残響調整プログラムおよびそれを記録した記録媒体、並びに、音場補正システム
US8386242B2 (en) Method, medium and apparatus enhancing a bass signal using an auditory property
CN1065370A (zh) 有线广播清晰度系统
JP2004056527A (ja) 周波数特性調整装置および周波数特性調整方法
AU2010291203A1 (en) An auditory test and compensation method
CN101770769B (zh) 频带划分装置
Pelegrín-García et al. Equal autophonic level curves under different room acoustics conditions
US20090060209A1 (en) Audio-signal processing apparatus and method
JP2020079835A (ja) ロードボックス、及び音質改良方法
JP2008507934A (ja) 音声強調
Corbett Mic it!: microphones, microphone techniques, and their impact on the final mix
WO1993004529A1 (en) A digital filtering method and apparatus
JP5041308B1 (ja) ラウドネス補正手段と音質調整手段
US10587983B1 (en) Methods and systems for adjusting clarity of digitized audio signals
US8462964B2 (en) Recording apparatus, recording method, audio signal correction circuit, and program
WO2022209171A1 (ja) 信号処理装置、信号処理方法およびプログラム
JPH0936685A (ja) 音響信号再生方法及び装置
CN2465434Y (zh) 频率均衡自动调节装置
CN201243266Y (zh) 一种基于dsp的声频系统频响特性均衡处理装置
CN1630427A (zh) 一种低音增效处理的方法
US20140376726A1 (en) Stereo headphone audio process
JP2010068175A (ja) 音響調整装置及びそれを用いた音響装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120926

Termination date: 20150915

EXPY Termination of patent right or utility model