CN101176149A - 用于音调噪声鲁棒的信号处理系统 - Google Patents

用于音调噪声鲁棒的信号处理系统 Download PDF

Info

Publication number
CN101176149A
CN101176149A CNA2006800171969A CN200680017196A CN101176149A CN 101176149 A CN101176149 A CN 101176149A CN A2006800171969 A CNA2006800171969 A CN A2006800171969A CN 200680017196 A CN200680017196 A CN 200680017196A CN 101176149 A CN101176149 A CN 101176149A
Authority
CN
China
Prior art keywords
signal
component
input signal
smooth
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800171969A
Other languages
English (en)
Inventor
P·A·赫瑟林顿
A·埃斯科特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
QNX Software Systems Wavemakers Inc
Original Assignee
QNX Software Systems Wavemakers Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by QNX Software Systems Wavemakers Inc filed Critical QNX Software Systems Wavemakers Inc
Publication of CN101176149A publication Critical patent/CN101176149A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Picture Signal Circuits (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种处理系统生成包括需要的信号分量的输出信号,并且减小或消除音调噪声。输出信号可被提供到包括声音识别系统、音调检测器和其它处理系统的任何后续信号处理系统。后续处理系统不太可能将音调输入信号噪声误认为是需要的信号内容,不必要地消耗计算资源以分析噪声,并且采取由音调噪声引起的伪操作。

Description

用于音调噪声鲁棒的信号处理系统
技术领域
本发明涉及信号处理系统。具体地,本发明涉及一种向其它信号处理系统传递相对音调噪声的鲁棒的测量的信号处理系统。
背景技术
大多数(如果不是所有)信号处理系统必须智能地处理输入信号噪声。输入信号噪声可以对输入信号所需要的分量进行掩蔽(mask)、恶化、使其失真或有害地对其进行影响。输入信号噪声也可模拟需要的输入信号分量并且增加识别、去除或补偿输入信号噪声的难度,而无论信号处理系统或其目的为何。
音调噪声是在一些应用中模仿需要的输入信号分量的一种形式的噪声。例如,语音处理系统通常检测和处理包括谐波活动的声音信号分量。元音声音和一定辅音显示处理系统使用的特征音调内容以确定人说话的时间和他们说话的内容或其它语音特性。
检验用于需要的信号内容的输入信号的语音处理系统可将音调噪声解释为语音,可将具有音调噪声的输入信号分段隔离,并且可试图处理音调噪声。语音处理系统消耗宝贵的计算资源以便不仅将分段隔离,还处理该分段并且基于处理的结果采取行动。在语音识别系统中,系统可将音调噪声解释为语音命令,执行伪命令并且响应地采取并不希望的动作。
在此需要一种为信号处理系统提供音调噪声鲁棒(tonal noiserobustness)的系统。
发明内容
本发明提供了一种减少或消除作为进一步处理的信号分量的音调噪声的检测的预处理系统。该预处理系统产生可由任何下游处理系统更为可靠地进行分析的输出信号。该输出信号在保持需要的信号内容的同时抑制音调噪声。下游处理系统不太可能将音调输入信号噪声误认为是需要的信号内容,不需要消耗计算资源,并且不太可能采取输入信号内容未要求的操作。
预处理系统包括存储器和连接到存储器的处理器。存储器存储平滑程序、背景噪声估计和混合程序。平滑程序将衰减施加到输入信号中的信号峰以生成平滑的信号。混合程序基于背景噪声估计将平滑的信号与输入信号相结合以生成输出信号。处理器执行平滑程序和混合程序。
衰减可以是输入信号的多通过窗口平均。衰减可平滑噪声峰,例如音调噪声峰与输入信号中的需要的信号峰。可使用其它衰减。
混合程序基于输入信号分量和平滑的信号分量确定输出信号分量。输出信号分量可部分地根据输入信号的信号噪声比或其它噪声量度。根据SNR,输出信号分量可以是输入信号分量、平滑的信号分量、或可以是输入信号分量与平滑的信号分量两者的混合。也可使用其它量的较少或附加信号的混合。
本发明的其它系统、方法、特性和优点对于本领域的技术人员在考查以下附图和详细说明后将变得明显。所有此种附加系统、方法、特性和优点意在被包括在此说明书中,在本发明的范围内,并且由所附权利要求保护。
附图说明
本发明可以参照附图和说明书被更好地理解。附图中的组件不必按比例、强调,而是置于此处以示例本发明的原理。此外,在图中,类似的附图标记在不同视图中指示相对应的部分。
图1显示出信号处理系统;
图2显示出道路噪声频谱和输入信号频谱;
图3显示出能量宽带增加的道路噪声频谱和输入信号频谱;
图4显示出输入信号频谱和平滑信号频谱;
图5显示出输入信号分量;
图6显示出窗口平均信号分量;
图7显示出双通过窗口平均信号分量;
图8显示出输入信号频谱、背景噪声频谱和输出信号频谱;
图9显示出输入信号频谱、背景噪声频谱和输出信号频谱;
图10显示出平滑程序可采取的衰减输入信号中的峰的操作;
图11显示出混合程序可采取的组合平滑的信号和输入信号的操作;
图12显示出包括提供音调噪声鲁棒的信号预处理系统的信号处理系w统。
具体实施方式
信号处理系统减小将音调噪声检测作为感兴趣的信号分量用于进一步处理的可能性。信号处理系统提供输出信号用于后续处理电路或逻辑。输出信号包括在减小或消除音调噪声的同时在输入信号中出现的需要的信号内容。后续处理阶段可避免耗费时间或计算资源以处理被误认为感兴趣的信号的噪声。
在图1中,处理系统100包括处理器102和存储器104。处理器102可控制自动增益控制器108以建立或保持输入信号‘x’106所需要的动态范围。处理器102接收输入信号‘x’并且可由模数转换器(ADC)将输入信号‘x’106数字化。ADC可作为处理器102的一部分或可与其分开。可替换地或附加地,处理器102可接收输入信号‘x’106作为数字信号样本。
输入信号‘x’106包括需要的信号分量和不需要的信号分量。以下讨论说明用于车辆中的声音识别系统的预处理系统。然而,处理系统100可被用于任何其它处理输入信号的应用中。
在图1中,需要的信号源110包括声音112。声音112可传递口语命令到车辆中的声音识别系统。声音识别系统可控制车辆组件,例如窗口、锁、音频或视觉系统、气候控制系统或任何其它车辆组件。
不需要的信号源包括音调噪声源116。音调噪声源116生成可恶化、掩蔽声音112或使声音112失真的信号。音调噪声源116可产生具有周期分量的信号。音调噪声源可包括交流声或变调或其它电磁干扰、车辆轮胎(例如,在轮胎在公路凹槽上或例如停车振动带的隆起的标记上行驶时)或其它机械噪声源、包括来自车辆音频/视觉系统的噪声的音频输出、车辆内的其它声音、或其它音调噪声源。
扩音器118捕获由需要的信号源110和不需要的信号源114产生的声音。扩音器118可以是车辆中的声音识别系统的一部分、免提电话系统的一部分或车辆中的任何其它系统的一部分。扩音器118捕获声音并且提供相应的电信号到自动增益控制器108。自动增益控制器108根据模数转换器109的动态范围调整输入信号等级。
在扩音器118和/或自动增益控制108之前或之后,音调噪声可直接结合到输入信号中。这样,音调噪声不需要为可听到的并且不需要由扩音器118捕获以出现在输入信号‘x’106中。由引擎电子装置生成的电磁噪声可产生直接结合到输入信号中的音调噪声。
处理器102执行噪声估计器120、平滑程序122和混合程序124。噪声估计器120可以是提供背景噪声估计的电路或逻辑。噪声估计器120可在没有声音活动以形成背景噪声估计的时段中测量输入信号等级。可替换地,或附加地,无论声音是否出现以获得背景噪声估计,在时间窗口上,噪声估计器120可形成在时间或频率含量上的输入信号‘x’106的平均或其它统计测量(即,1-500ms,1-5s,或者其它窗口)。也可使用基于信号幅度、频率含量或其它特性的其它噪声估计技术。
平滑程序122减少或消除输入信号‘x’106中的峰。峰可以是音调噪声峰、需要的信号峰或两种类型的峰。平滑程序122生成平滑的信号126。
平滑参数128建立对平滑程序122的配置选项。平滑参数128可在可被应用到输入信号的多种平滑技术间选择,可对任何平滑技术提供参数、或可对平滑程序122建立配置选项。可替换地,平滑程序122可被任何需要的平滑技术预配置。
在一个实现方式中,平滑参数128选择窗口平均平滑技术。平滑参数128可进一步指定平滑程序122是否将应用单通过窗口平均、双通过窗口平均或其它多通过窗口平均。附加地,平滑参数128可指定对于每一通过的窗口平均的窗口大小、平均是如何被计算的、是否丢弃外围的样本,超过其可丢弃外围的样本的外围样本阈值或其它平滑参数。
混合程序124实现混合规则132以生成输出信号‘y’130。混合参数134可对混合程序124建立操作参数。混合参数134建立低SNR阈值136、高SNR阈值138,并且可包括混合函数说明符140。可替换地,混合程序124可实现用于生成输出信号‘y’130的预配置技术。
处理器102使用背景噪声估计以对输入信号‘x’106形成信号噪声比(SNR)频谱估计。SNR估计可在执行混合程序124之前在离散事件出现时或在任何其它时间,周期性地基于采样在样本上更新。SNR估计影响混合程序124的操作。
混合程序124考虑输入信号、背景噪声估计和平滑的信号的频谱。处理器102可应用例如快速傅利叶变换的时频变换来获得频谱。时频变换可具有显示输入信号‘x’106的音调峰的256、512或任何其它长度的长度。
时频变换生成表示输入信号和背景噪声估计中的频率含量的离散信号分量。从输入信号获得的平滑的信号126也可被表示为离散频率信号分量。混合程序124基于输入信号分量、平滑的信号分量和SNR估计确定一个或多个输出信号分量。
图1显示出由混合程序124应用的或实现的三个混合规则132:第一混合规则142、第二混合规则144和第三混合规则144。混合规则132可如表1中显示而建立:
Figure A20068001719600111
任何其它规则或规则集合可被建立以指导混合程序124的操作。
下SNR阈值136确定混合程序124使用平滑的信号分量作为输出的信号频谱分量的时间。在混合程序124产生输出信号时,在SNR估计小于下SNR阈值136时,混合规则144指导混合程序124以使用用于当前输出信号‘y’130分量的平滑的信号分量。上SNR阈值138可确定混合程序124使用输入信号分量作为输出信号频谱分量的时间。在混合程序124产生输出信号‘y’130时,在SNR估计大于上SNR阈值138时,混合规则142指导混合程序124使用用于当前输出信号分量的输入信号分量。
SNR估计也可位于上SNR阈值138和下SNR阈值136之间。在此情况下,混合规则146指导混合程序124以通过估计输入信号分量和平滑的信号分量的混合函数确定当前输出信号分量。混合函数说明符140可指导混合程序124以确定输入信号分量和平滑的信号分量的加权平均。其它混合函数可被使用并且可考虑不同的、附加的或更少的信号。
加权平均可为线性SNR加权平均:
y = ( 1 - SNR upper - lower ) * s + SNR upper - lower * x
其中‘y’为输出信号分量,‘s’为平滑的信号分量,‘x’为输入信号分量,‘upper’为上SNR阈值138,‘lower’为下SNR阈值136,‘SNR’为SNR估计。这样,如果SNR估计为上SNR阈值138和下SNR阈值136间的80%,输出信号分量被设置为平滑的信号分量的20%和输入信号分量的80%。也可使用其它线性和/或非线性加权。
混合程序124可基于以分贝(dB)表示的输入信号和平滑的信号分量确定以dB表示的输出信号频谱分量。可替换地,混合程序124可基于输入信号或平滑的信号分量的功率或幅度确定输出信号分量。处理器102也可在提供输出信号‘y’到其它处理阶段前将输出信号‘y’130转换为例如功率或幅度的其它表示。
图2显示出输入信号频谱202和道路噪声频谱204。道路噪声对输入信号‘x’106的整体等级有贡献。附加的噪声源贡献1000Hz音调噪声到输入信号。音调噪声由在1000Hz的音调噪声峰206以及标记为208、210、212和214的在1000Hz的谐波处的噪声峰所显示。
图3显示出输入信号频谱302和道路噪声频谱304。输入信号频谱302显示出信号能量的宽带增加。该增加是瞬时的,并且可由车辆碰到道路上的隆起,或由其它噪声源产生。音调噪声保持出现并且在音调噪声峰206-214中是明显的。
信号能量中的宽带增加可使信号检测器或其它处理逻辑确定输入信号应该被进行分析用于到车辆声音识别系统的声音命令。声音识别系统可使用音调检测器(pitch detector)、端点指示器(endpointer)或其他信号处理系统以检查响应于信号检测的输入信号‘y’106。音调噪声模拟语音特性(例如,元音)并且可导致错误地识别输入信号中的声音内容。处理系统100平滑并且混合输入信号‘x’106以减小或消除错误识别。
图4显示出从输入信号频谱302生成的平滑的信号频谱402。平滑的信号频谱402已经沿着垂直(dB)轴向下移动大约40dB。平滑程序122生成平滑的信号频谱402。在平滑的频谱402中,音调噪声峰206-214通过输入信号频谱302的双通过窗口平均被实质上减小或消除。
图5显示出输入信号302的一部分的离散频谱表示的信号分量。标记为502和504的两个分量是输入信号中的峰506的一部分。第一通过平均窗口508包括第一四个输入信号分量。第一通道平均窗口508长度为四,但可更大(例如,20-30)或更小。长度为五的第二通道平均窗口510也显示在包括信号分量512、514、516、518和520的索引位置。平均窗口508、510的长度可根据FFT长度以使窗口508和510包括在FFT中得到的并且围绕频率分量的频谱峰。
平滑程序122首先将平均窗口508应用到输入信号分量。平滑程序122生成窗口508中的输入信号分量的第一窗口平均。平滑程序122沿着输入信号分量一个索引位置接一个索引位置地移动平均窗口508。在每一个索引位置,平滑程序122确定第一窗口平均信号的新的频谱分量。
图6显示出第一窗口平均信号616的一部分的离散频谱表示的信号分量。第二通道平均窗口510在图6中与第二通过平均窗口510内的输入信号分量512-520一起再现。平滑程序122在输入信号302上使用第一通过平均窗口508的一通过生成第一窗口平均信号616。第一窗口平均信号616的两个分量被标记为602和604。第一窗口平均峰606的两个分量602和604示例出通过第一窗口平均通过的输入信号峰506的减小。
在第二通过过程中,平滑程序112将第二通过平均窗口510应用到输入信号分量。第二通过平均窗口510可以与第一通过平均窗口608大小相同,比第一通过平均窗口608大或小。平滑程序122基于窗口510中的第一窗口平均分量和输入信号分量生成平滑的频谱信号分量。平滑程序122沿着输入信号分量一个索引位置接着一个索引位置移动第二平均窗口510。在每一个索引位置,平滑程序122确定平滑的信号频谱的新的信号分量。
在窗口平均的第二通过过程中,平滑程序122可以从考虑因素中丢弃或消除任何给定索引位置处的无关的信号分量。在图6中,关于第二通过平均窗口510的当前索引位置的两个外围的信号分量为信号分量516和518。在任何给定的索引位置,外围信号分量可以是那些在窗口510中的位于在此索引位置处的第一窗口平均分量值以上的信号分量。
在图6中,平均窗口510的索引位置处的平均值被标记为614。信号分量516和518位于平均值614以上并且从确定平滑的信号分量的第二窗口平均的考虑因素中被消除。平滑参数128可建立信号分量何时符合外围的分量的其它标准。该标准在信号分量被确定为外围信号分量前可建立平均值以上的阈值,绝对或相对信号分量值,和/或信号分量要满足的其它标准。
图7显示出平滑的信号频谱702的一些分量。平滑的峰706的两个分量702和704被标记并且显示出峰506和606的进一步的减少。平滑程序122可对输入信号应用附加的或不同的平滑技术以获得减小或消除输入信号中的峰的平滑的输出信号。平滑的峰可以是音调噪声峰、例如声音的感兴趣的信号分量、或由任何其它源产生的峰。这样,平滑的信号频谱不是完全平坦的,而是保持了输入信号的一些衰减特性。
图8显示出输出信号频谱802和背景噪声估计频谱804。图8还显示出具有音调噪声分量206-214的输入信号频谱302和平滑的信号频谱402。频谱802、804、302和402已经在垂直(dB)轴被分开。图8显示出背景噪声估计804已经被适应于音调噪声分量206-214,并且这样包括相对应的背景噪声峰806、808、810、812和814。
混合程序124生成输出信号频谱802作为输入信号频谱302和平滑的信号频谱402的混合。混合程序124执行部分基于背景噪声估计804的混合。该混合可遵照混合规则132或其它规则。在一个实现方式中,由下式给出在每一个频谱索引位置处的输出信号分量‘y’:
y = x , SNR > upper s , SNR < lower ( 1 - SNR upper - lower ) * s + SNR upper - lower * x , lower < SNR < upper
其中‘x’为在该索引位置处的输入信号分量,‘s’为在该索引位置处的平滑的输入信号分量,SNR为SNR估计,‘upper’为SNR上阈值138并且‘lower’为SNR下阈值136。
SNR上阈值138可以是1-10dB、2-8dB、4-6dB或任何其它上阈值。SNR下阈值136可以是0-1dB、小于0dB或任何其它下阈值。阈值136和138可在处理系统100操作过程中被动态地设置或适应。
在图8中,背景噪声估计804已经被适应于音调噪声并且在跨越显示出的频率范围下SNR较低(例如,0-1dB)。这样,混合程序132主要使用平滑的信号402生成输出信号802。音调噪声峰206-214在输出信号802中被显著减小或消除。输出信号802可被提供到任何后续处理系统以减小或消除将音调噪声分量错误检测为需要的信号分量的可能性。
图9显示出包括声音内容和大约在100Hz和2000Hz间的谐波904的输入信号频谱902。音调噪声保持出现,并产生以1KHz间隔的音调噪声峰206-214。背景噪声估计频谱906已经被适应于持续的音调噪声,并且包括音调噪声峰806-814。背景噪声估计906没有被适应于更快变化的声音内容和谐波904,并且这样漏掉了与声音内容904相对应的分量。
平滑程序122从输入信号频谱902生成平滑的信号频谱908。平滑的信号普908在保持了输入信号的衰减特性的同时显著地减小或消除输入信号频谱902中的峰。在平滑的信号频谱908中,音调噪声和声音内容两者的峰被平滑或消除。
图9还显示出输出信号频谱910。混合程序124基于混合规则132和混合参数134生成输出信号频谱910。输入信号频谱902包括声音内容和谐波904(大约在100Hz到2000Hz间)的部分具有相对较高的SNR。输入信号频谱902在2000Hz后的部分具有相对较低的SNR。SNR谱频的影响显示在输入信号频谱902和平滑的信号908的混合中以形成输出信号910。例如,输入信号分量914具有比相对应的背景噪声频谱点916高很多的SNR。这样,输出信号频谱910包括再生大部分或全部输入信号分量914的信号分量918。
输出信号频谱910再生具有相对较高SNR的输入信号频谱902的分量。这样,输出信号频谱910包括表示声音内容904的频谱分量912。另外,输出信号频谱910通过在输入信号SNR较低时使用平滑的信号分量显著地减小或消除音调噪声峰806-814。
在生成输出信号分量时,混合程序124在SNR超过上阈值138时使用输入信号分量。因此输出信号频谱910捕获在输入信号频谱902中的需要的信号内容。混合程序124在SNR低于下阈值136时使用平滑的信号分量。因此,输出信号频谱910反映出最初在输入信号频谱902中出现的峰的显著的衰减。
输出信号频谱910可被提供到例如音调检测器(pitch detector)、声音识别系统或其它系统的后续处理系统。处理器102可以基于输出信号频谱910的频谱采样的形式、幅度或功率(例如,幅度的平方)的形式或任何其它形式提供输出信号‘y’130。输出信号‘y’130显著地减小或消除了音调噪声分量206-214,但保持了需要的信号内容904。后续处理系统可以可靠地检测并且处理最初出现在输入信号‘x’106中的声音内容,而没有由可以模仿声音内容或其它需要的信号内容的音调噪声分量206-214引起的错误触发。
图10显示出可由平滑程序122采取的操作的流程图1000。平滑程序122获得输入信号频谱902(操作1002)。处理器可在输入信号‘x’106上执行时频变换(例如,FFT)以在存储器104中提供输入信号频谱902。可替换地,平滑程序122可执行该变换。
在准备平滑输入信号频谱902时,平滑程序122读取存储器104中的平滑参数128(操作1004)。平滑参数128可确定平滑算法、用于平滑算法的参数(例如用于一个或更多窗口平均通道的窗口大小)或其它参数。对于双通过窗口平均平滑技术,平滑程序122对输入信号频谱902一个位置接一个位置地施加第一平均窗口508以生成第一窗口平均信号(操作1006)。
在第二通过时,平滑程序122对输入信号应用第二平均窗口608(操作1008)。在第二通过过程中,平滑程序122可确定在当前平均窗口中的信号分量是否为外围的信号分量。平滑程序122可丢弃或减小外围的信号分量以使它们不对窗口平均有贡献或有同等程度的贡献(操作1010)。
平滑程序122基于保持在窗口中的输入信号分量生成输出信号分量(操作1010)。在输入信号中不再有分量时,混合程序结束。否则,平滑程序122将第二平均窗口608移到下一位置(操作1012)并且继续。结果产生平滑的信号频谱908。
图11显示出可以由混合程序124采取的操作的流程图1100。混合程序124从存储器104读取混合参数134(操作1102)并且获得输入信号频谱902、平滑的信号频谱908和SNR频谱估计(操作1104)。SNR频谱估计可基于输入信号频谱相对于背景噪声频谱906的比例。
混合程序124生成单独的输出信号频谱分量。对于每一个分量,混合程序124获得下一个输入信号频谱分量、平滑的信号频谱分量和SNR估计(操作1106)。混合程序124应用混合规则132以生成下一个输出信号频谱分量。
图11显示出混合规则142、144和146的应用。在SNR大于SNR上阈值138(操作1108)时,混合程序124确定输出信号分量为输入信号分量(操作1110)。在SNR小于SNR下阈值136(操作1112)时,混合程序124确定输出信号分量为平滑的信号分量(操作1114)。
在SNR介于SNR上阈值138和SNR下阈值136之间时,混合程序124确定输出信号分量为输入信号分量和平滑的信号分量的混合(操作1116)。该混合可为由SNR加权的混合。可替换地,也可使用相同的或不同的信号的其它混合以形成输出信号分量。
混合程序124可为每一个输入信号分量产生输出信号分量。在没有更多输入信号分量(操作1118)时,混合程序124结束。产生输出信号频谱910。
在图12中,用于音调噪声鲁棒的信号预处理系统1200与预处理逻辑1202和后处理逻辑1204协同操作。预处理系统1200包括噪声估计逻辑1206、平滑逻辑1208和混合逻辑1210。噪声估计逻辑1206提供背景噪声估计,平滑逻辑1208减小或消除输入信号中的峰以形成平滑的信号,混合逻辑1210基于输入信号、平滑的信号和背景噪声估计确定音调噪声鲁棒的输出信号。
信号处理系统1200可直接从输入源1212接受输入,或在由信号处理系统1214进行初始处理后接受输入。信号处理系统1214可从信号源1212接受数字或模拟的输入,对信号应用任何需要的处理,并且产生到预处理系统1200的输出信号。
输入源1212可以包括数字信号源或例如模拟传感器1216的模拟信号源。输入源可包括扩音器1218或其它声音传感器。扩音器1218可捕获到车辆内的、在家庭计算机上的或在任何其它应用中的声音识别系统的声音命令。其它系统可使用也易受到音调噪声源影响的其它类型的传感器1220。传感器1220可以包括触摸、力或运动传感器,电感位移传感器,近程检测器(proximity detector)或其它类型的传感器。
数字信号源可包括通信接口1222、存储器或其它在其中实现预处理系统1200的系统中的电路或逻辑。在输入源1212为数字信号源时,信号处理系统1214可处理数字信号采样并且生成模拟输出信号。预处理系统1200可处理模拟输出信号或数字信号采样。
预处理系统1200也连接到后处理逻辑1204。后处理逻辑1204可包括音频再生系统1204、数字和/或模拟数据传输系统1226、音调估计器(pitch estimator)1228、声音识别系统1230或其它系统。预处理系统1200可提供音调噪声鲁棒的输出信号到任何其它类型的后处理逻辑1204。
声音识别系统1230可与音调估计器1228协同操作。音调估计器1228可包括离散余弦变换电路或逻辑并且可处理基于功率或幅度表示的输出信号频谱910。声音识别系统可包括解释声音、从声音获得方向、记录或处理声音的电路和/或逻辑。声音识别系统1230可处理作为免提汽车电话、膝上型或便携式计算机系统、娱乐装置或任何其它系统的一部分的语音。在免提汽车电话中,预处理系统1200去除音调噪声并且提供输出信号到声音识别系统。
传输系统1226可提供网络连接、数字或模拟发射机、或其它传输电路和/或逻辑。传输系统1226可将由预处理系统1200生成的音调噪声鲁棒的输出信号传送到其它装置。例如,在汽车电话中,传输系统1226可通过例如ZigBee、Mobile-Fi、Ultrawideband、Wi-fi或WiMax网络的无线连接将来自汽车电话的增强的信号传送到基站或其它接收机。
音频再生系统1224可包括数字到模拟转换器、滤波器、放大器和其它电路或逻辑。音频再生系统1224可以是语音和/或音乐再生系统。音频再生系统224可在蜂窝电话、汽车电话、数字媒体播放器/录音机、无线电、立体声、便携式游戏装置或其它使用声音再生的装置中实现。
处理系统100和/或1200可在硬件和/或软件中实现。处理系统100和/或1200可包括数字信号处理器(DSP)、微控制器或其它处理器。处理系统100和/或1200可包括离散逻辑或电路、离散逻辑和处理器的混合、或可在多处理器或程序上分布。另外,或可替换地,处理系统100和/或1200可采取存储在例如磁盘、EPROM、闪存卡或其它存储器的机器可读介质上的指令的形式。
处理系统100在抑制音调噪声的同时保持了在输出信号‘y’130中的需要的信号内容。处理系统100可去除强的音调噪声,允许在输出信号中检测到甚至微小的声音内容。输出信号‘y’130减小了后续处理电路或逻辑将噪声解释为信号的可能性,保证了进一步的处理。有限的计算资源可被节省并且后续处理逻辑可防止采取伪操作、发出不正确的命令、或以输入信号不需要的其它方式响应。
在说明本发明的不同实施例时,对于本领域的普通技术人员明显的是可在本发明的范围内有更多的实施例和实现方式。因此,本发明除了根据所附权利要求和它们的等价物之外不被限制。
权利要求书(按照条约第19条的修改)
1. 一种信号预处理方法,其包括:
获得包括噪声信号蜂的输入信号;
衰减所述输入信号中的所述噪声峰以获得平滑的信号;
获得背景噪声估计;以及
基于所述背景噪声估计将所述平滑的信号与所述输入信号混合以获得输出信号。
2. 如权利要求1所述的方法,其中:
衰减所述噪声峰包括衰减所述输入信号中的音调噪声。
3. 如权利要求2所述的方法,其中:
获得所述输入信号包括获得包括音调噪声和需要的信号峰的输入信号;以及其中
衰减还包括衰减所述需要的信号峰以获得所述平滑的信号。
4. 如权利要求2所述的方法,其中,衰减包括确定所述输入信号的第一窗口平均。
5. 如权利要求2所述的方法,其中,衰减包括确定所述输入信号的第一窗口平均以获得第一平均信号,和确定所述第一平均信号的第二窗口平均。
6. 如权利要求5所述的方法,其中,确定所述第二窗口平均包括:
选择从所述第一平均信号中的索引点开始的信号分量的窗口;
识别至少一个所述信号分量作为外围的信号分量;以及
在确定所述第二窗口平均时排除所述外围的信号分量。
7. 如权利要求6所述的方法,其中,识别包括:
确定所述窗口中的在所述索引点处超过所述输入信号的所述第一窗口平均的信号分量。
8. 如权利要求1所述的方法,其中,混合包括形成所述输入信号和所述平滑的信号的信号噪声比加权的混合。
9. 一种信号处理系统,其包括;
存储器,其包括:
在输入信号中的噪声信号峰上应用衰减以获得平滑的信号的平滑程序;
背景噪声估计;和
混合程序,其基于所述背景噪声估计结合所述平滑的信号和所述输入信号以产生输出信号;和
连接到所述存储器的执行所述平滑程序和混合程序的处理器。
10. 如权利要求9所述的系统,其中,所述衰减包括所述输入信号的窗口平均。
11. 如权利要求9所述的系统,其中,所述衰减包括所述输入信号的双通过窗口平均。
12. 如权利要求9所述的系统,其中,所述衰减包括所述输入信号的双通过窗口平均,在所述双通过窗口平均的第二通过过程中排除外围的信号分量。
13. 如权利要求9所述的系统,其中,所述存储器还包括:
由所述混合程序应用以产生所述输出信号的混合规则。
14. 如权利要求9所述的系统,其中,所述混合规则基于所述输入信号的输入信号分量和所述平滑的信号的平滑的信号分量产生所述输出信号的输出信号分量,并且其中,所述混合规则在基于所述背景噪声估计的信号噪声估计大于上阈值时,将所述输出信号分量设置为所述输入信号分量。

Claims (31)

1.一种信号预处理方法,其包括:
获得包括噪声信号蜂的输入信号;
衰减所述输入信号中的所述噪声峰以获得平滑的信号;
获得背景噪声估计;以及
基于所述背景噪声估计将所述平滑的信号与所述输入信号混合以获得输出信号。
2.如权利要求1所述的方法,其中:
衰减所述噪声峰包括衰减所述输入信号中的音调噪声。
3.如权利要求2所述的方法,其中:
获得所述输入信号包括获得包括音调噪声和需要的信号峰的输入信号;以及其中
衰减还包括衰减所述需要的信号峰以获得所述平滑的信号。
4.如权利要求2所述的方法,其中,衰减包括确定所述输入信号的第一窗口平均。
5.如权利要求2所述的方法,其中,衰减包括确定所述输入信号的第一窗口平均以获得第一平均信号,和确定所述第一平均信号的第二窗口平均。
6.如权利要求5所述的方法,其中,确定所述第二窗口平均包括:
选择从所述第一平均信号中的索引点开始的信号分量的窗口;
识别至少一个所述信号分量作为外围的信号分量;以及
在确定所述第二窗口平均时排除所述外围的信号分量。
7.如权利要求6所述的方法,其中,识别包括:
确定所述窗口中的在所述索引点处超过所述输入信号的所述第一窗口平均的信号分量。
8.如权利要求1所述的方法,其中,混合包括形成所述输入信号和所述平滑的信号的信号噪声比加权的混合。
9.一种信号处理系统,其包括;
存储器,其包括:
在输入信号中的噪声信号峰上应用衰减以获得平滑的信号的平滑程序;
背景噪声估计;和
混合程序,其基于所述背景噪声估计结合所述平滑的信号和所述输入信号以产生输出信号;和
连接到所述存储器的执行所述平滑程序和混合程序的处理器。
10.如权利要求9所述的系统,其中,所述衰减包括所述输入信号的窗口平均。
11.如权利要求9所述的系统,其中,所述衰减包括所述输入信号的双通过窗口平均。
12.如权利要求9所述的系统,其中,所述衰减包括所述输入信号的双通过窗口平均,在所述双通过窗口平均的第二通过过程中排除外围的信号分量。
13.如权利要求9所述的系统,其中,所述存储器还包括:
由所述混合程序应用以产生所述输出信号的混合规则。
14.如权利要求9所述的系统,其中,所述混合规则基于所述输入信号的输入信号分量和所述平滑的信号的平滑的信号分量产生所述输出信号的输出信号分量,并且其中,所述混合规则在基于所述背景噪声估计的信号噪声估计大于上阈值时,将所述输出信号分量设置为所述输入信号分量。
15.如权利要求9所述的系统,其中,所述混合规则基于所述输入信号的输入信号分量和所述平滑的信号的平滑的信号分量产生所述输出信号的输出信号分量,并且其中,所述混合规则在基于所述背景噪声估计的信号噪声估计小于下阈值时,将所述输出信号分量设置为所述平滑的信号分量。
16.如权利要求9所述的系统,其中,所述混合规则基于所述输入信号的输入信号分量和所述平滑的信号的平滑的信号分量产生所述输出信号的输出信号分量,并且其中,所述混合规则在SNR阈值落入SNR上阈值和SNR下阈值之间时,通过应用所述输入信号分量和所述平滑的信号分量的混合函数设置所述输出信号分量。
17.如权利要求16所述的系统,其中,所述混合函数包括所述输入信号和所述平滑的信号的线性加权平均。
18.一种信号预处理系统,其包括:
存储器,其包括:
包括音调噪声峰和需要的信号峰的输入信号表示;
背景噪声估计;
基于所述输入信号表示和所述背景噪声估计的信号噪声比(SNR)估计;
可操作以连续应用平均窗口到所述输入信号表示以衰减所述音调噪声峰和所述需要的信号峰以获得平滑的信号表示的多通过窗口程序;
SNR上阈值;
SNR下阈值;
用于从所述输入信号表示的输入信号分量和所述平滑的信号表示的平滑的信号分量生成输出信号分量的混合程序,所述混合程序实现至少以下的混合规则:
在所述SNR估计大于所述SNR上阈值时,将所述输出信号分量设置为所述输入信号分量;
在所述SNR估计小于所述SNR下阈值时,将所述输出
信号分量设置为所述平滑的信号分量;和
在所述SNR阈值介于所述SNR上阈值和所述SNR下阈
值之间时,通过应用所述输入信号分量和所述平滑的信号分
量的混合函数设置所述输出信号分量;以及
连接到所述存储器的执行所述多通窗口程序和所述混合程序的处理器。
19.如权利要求18所述的系统,其中,所述平均窗口包括第一长度平均窗口和不同的第二长度平均窗口。
20.如权利要求19所述的系统,其中,所述不同的第二长度平均窗口比所述第一长度平均窗口长,并且其中,所述多通过窗口程序在应用所述较长的第二长度平均窗口过程中排除外围的信号分量。
21.如权利要求20所述的系统,其中,所述外围的信号分量超过通过应用所述第一长度平均窗口获得的平均信号等级。
22.如权利要求18所述的系统,其中,所述混合函数为所述平滑的信号分量和所述输入信号分量的线性相关的混合。
23.如权利要求19所述的系统,其中,所述不同的第二长度平均窗口比所述第一长度平均窗口短。
24.一种产品,其包括:
机器可读介质;和
存储在所述介质上使处理系统执行以下操作的指令:
获得背景噪声估计;
衰减输入信号中的峰以获得平滑的信号;和
基于所述背景噪声估计,应用混合规则以将所述平滑的信号与所述输入信号结合,来形成输出信号。
25.如权利要求24所述的产品,其中,衰减所述峰的指令包括:衰减音调噪声峰和需要的信号峰的指令。
26.如权利要求24所述的产品,其中,衰减峰的指令包括:窗口平均指令。
27.如权利要求24所述的产品,其中,衰减峰的指令包括:多通过窗口平均指令。
28.如权利要求24所述的产品,其中,衰减峰的指令包括:丢弃外围的信号分量的多通过窗口平均指令。
29.如权利要求28所述的产品,其中,所述外围的信号采样包括音调噪声峰分量和需要的信号峰分量。
30.如权利要求24所述的产品,其中,应用所述混合规则的指令包括:
形成所述输入信号和所述平滑的信号的信号噪声比加权的混合的指令。
31.如权利要求30所述的产品,其中所述介质还包括基于所述背景噪声估计和所述输入信号确定信号噪声比(SNR)测量的指令,并且其中所述加权的混合包括:
y=(1-(SNR/(upper-lower)))*s+(SNR/(upper-lower))*x,其中:
‘y’为所述输出信号分量,‘s’为所述平滑的信号分量,‘x’为所述输入信号分量,‘upper’为SNR上阈值,‘lower’为SNR下阈值,并且‘SNR’为所述SNR测量。
CNA2006800171969A 2005-05-17 2006-04-12 用于音调噪声鲁棒的信号处理系统 Pending CN101176149A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/131,150 2005-05-17
US11/131,150 US8520861B2 (en) 2005-05-17 2005-05-17 Signal processing system for tonal noise robustness

Publications (1)

Publication Number Publication Date
CN101176149A true CN101176149A (zh) 2008-05-07

Family

ID=37430870

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800171969A Pending CN101176149A (zh) 2005-05-17 2006-04-12 用于音调噪声鲁棒的信号处理系统

Country Status (7)

Country Link
US (1) US8520861B2 (zh)
EP (1) EP1882251A1 (zh)
JP (1) JP2008541177A (zh)
KR (1) KR20070119741A (zh)
CN (1) CN101176149A (zh)
CA (1) CA2607169C (zh)
WO (1) WO2006122388A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751929B (zh) * 2008-12-09 2012-11-21 富士通株式会社 声音处理方法及装置
CN105702264A (zh) * 2015-12-30 2016-06-22 努比亚技术有限公司 音频处理装置和方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4757158B2 (ja) * 2006-09-20 2011-08-24 富士通株式会社 音信号処理方法、音信号処理装置及びコンピュータプログラム
US8489396B2 (en) * 2007-07-25 2013-07-16 Qnx Software Systems Limited Noise reduction with integrated tonal noise reduction
US20090150144A1 (en) * 2007-12-10 2009-06-11 Qnx Software Systems (Wavemakers), Inc. Robust voice detector for receive-side automatic gain control
KR101335417B1 (ko) * 2008-03-31 2013-12-05 (주)트란소노 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
KR101317813B1 (ko) * 2008-03-31 2013-10-15 (주)트란소노 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
WO2012083555A1 (en) 2010-12-24 2012-06-28 Huawei Technologies Co., Ltd. Method and apparatus for adaptively detecting voice activity in input audio signal
WO2013125257A1 (ja) * 2012-02-20 2013-08-29 株式会社Jvcケンウッド 雑音信号抑制装置、雑音信号抑制方法、特殊信号検出装置、特殊信号検出方法、報知音検出装置、および、報知音検出方法
US10027430B1 (en) * 2017-04-18 2018-07-17 Topcon Positioning Systems, Inc. Method and apparatus for estimating the current signal-to-thermal noise ratio and signal-to-pulse noise ratio
KR20240048109A (ko) 2022-10-06 2024-04-15 주식회사 쿱와 센싱신호로부터 노이즈를 제거하기 위한 장치 및 노이즈 제거하기 위한 방법

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4628156A (en) 1982-12-27 1986-12-09 International Business Machines Corporation Canceller trained echo suppressor
WO1995002288A1 (en) * 1993-07-07 1995-01-19 Picturetel Corporation Reduction of background noise for speech enhancement
JP3604393B2 (ja) * 1994-07-18 2004-12-22 松下電器産業株式会社 音声検出装置
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
JP2606171B2 (ja) * 1994-12-12 1997-04-30 日本電気株式会社 受話音量自動可変回路
US5862230A (en) * 1997-01-22 1999-01-19 Darby; Ronald A. Method to reduce perceived sound leakage between auditoriums in multiplex theaters
CA2312721A1 (en) * 1997-12-08 1999-06-17 Mitsubishi Denki Kabushiki Kaisha Sound signal processing method and sound signal processing device
US6111957A (en) 1998-07-02 2000-08-29 Acoustic Technologies, Inc. Apparatus and method for adjusting audio equipment in acoustic environments
US6111156A (en) * 1998-11-10 2000-08-29 Nova Chemicals (International) S.A. Integrated high temperature high conversion olefin/polyolefin process
US6321197B1 (en) * 1999-01-22 2001-11-20 Motorola, Inc. Communication device and method for endpointing speech utterances
US6725190B1 (en) * 1999-11-02 2004-04-20 International Business Machines Corporation Method and system for speech reconstruction from speech recognition features, pitch and voicing with resampled basis functions providing reconstruction of the spectral envelope
US6674865B1 (en) * 2000-10-19 2004-01-06 Lear Corporation Automatic volume control for communication system
DE10118653C2 (de) * 2001-04-14 2003-03-27 Daimler Chrysler Ag Verfahren zur Geräuschreduktion
GB2375028B (en) * 2001-04-24 2003-05-28 Motorola Inc Processing speech signals
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
US7136079B2 (en) * 2002-04-04 2006-11-14 Saudi Arabian Oil Company Edge preserving smoothing method
US20030216907A1 (en) * 2002-05-14 2003-11-20 Acoustic Technologies, Inc. Enhancing the aural perception of speech
US8145491B2 (en) * 2002-07-30 2012-03-27 Nuance Communications, Inc. Techniques for enhancing the performance of concatenative speech synthesis
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
US7343283B2 (en) * 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
DE10250739A1 (de) * 2002-10-31 2004-05-13 Bayerische Motoren Werke Ag Verfahren zur Bewertung von Störgeräuschen
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751929B (zh) * 2008-12-09 2012-11-21 富士通株式会社 声音处理方法及装置
CN105702264A (zh) * 2015-12-30 2016-06-22 努比亚技术有限公司 音频处理装置和方法
WO2017113946A1 (zh) * 2015-12-30 2017-07-06 努比亚技术有限公司 音频处理装置和方法
CN105702264B (zh) * 2015-12-30 2020-02-07 深圳海福地电子科技有限公司 音频处理装置和方法

Also Published As

Publication number Publication date
CA2607169A1 (en) 2006-11-23
KR20070119741A (ko) 2007-12-20
EP1882251A1 (en) 2008-01-30
US20060265215A1 (en) 2006-11-23
CA2607169C (en) 2014-05-20
JP2008541177A (ja) 2008-11-20
US8520861B2 (en) 2013-08-27
WO2006122388A1 (en) 2006-11-23

Similar Documents

Publication Publication Date Title
CN101176149A (zh) 用于音调噪声鲁棒的信号处理系统
CN1727860B (zh) 语音噪音抑制方法和语音噪音抑制器
CN100382141C (zh) 抑制风噪声的系统和方法
US6691090B1 (en) Speech recognition system including dimensionality reduction of baseband frequency signals
CN101010722B (zh) 用于检测语音信号中话音活动的设备和方法
JP5127754B2 (ja) 信号処理装置
EP1208563B1 (en) Noisy acoustic signal enhancement
CN101583996B (zh) 结合多种噪声抑制技术的方法和噪声抑制电路
CN110880329B (zh) 一种音频识别方法及设备、存储介质
JP4660578B2 (ja) 信号補正装置
CN105513605A (zh) 手机麦克风的语音增强系统和语音增强方法
CN1783214A (zh) 混响估计和抑制系统
CN101080766A (zh) 使用bark频带weiner滤波器和线性衰减的噪声降低和舒适噪声增益控制
CN102549659A (zh) 抑制音频信号中的噪声
Kumar Real-time performance evaluation of modified cascaded median-based noise estimation for speech enhancement system
CN105261359A (zh) 手机麦克风的消噪系统和消噪方法
CN106024017A (zh) 语音检测方法及装置
CN101673550A (zh) 谱增益计算方法、装置以及噪声抑制系统
CN113674763B (zh) 利用线谱特性的鸣笛声识别方法及系统、设备与存储介质
JP5443547B2 (ja) 信号処理装置
CN116612778B (zh) 回声及噪声抑制方法、相关装置和介质
Li et al. A high-performance auditory feature for robust speech recognition.
CN112233693B (zh) 一种音质评估方法、装置和设备
Uhle et al. Speech enhancement of movie sound
CN113593604A (zh) 检测音频质量方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication