CN105810203A - 消除噪声的设备和方法、声音识别设备和配备其的车辆 - Google Patents

消除噪声的设备和方法、声音识别设备和配备其的车辆 Download PDF

Info

Publication number
CN105810203A
CN105810203A CN201410836402.5A CN201410836402A CN105810203A CN 105810203 A CN105810203 A CN 105810203A CN 201410836402 A CN201410836402 A CN 201410836402A CN 105810203 A CN105810203 A CN 105810203A
Authority
CN
China
Prior art keywords
signal
noise
gain
input signal
snr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410836402.5A
Other languages
English (en)
Other versions
CN105810203B (zh
Inventor
李昌宪
尹现珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyundai Motor Co
Original Assignee
Hyundai Motor Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyundai Motor Co filed Critical Hyundai Motor Co
Publication of CN105810203A publication Critical patent/CN105810203A/zh
Application granted granted Critical
Publication of CN105810203B publication Critical patent/CN105810203B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Noise Elimination (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种用于消除噪声的设备,所述设备包含:增益获取单元,其使用输入信号的信噪比(SNR)确定增益和所述增益的校正值;以及增益应用单元,其使用所确定的增益和所确定的校正值获取对应于所述输入信号的输出信号,其中所述输出信号包含噪声消除的输入信号和噪声未消除的输入信号,并且噪声消除的输入信号的比例和噪声未消除的输入信号的比例是根据所确定的校正值确定的。

Description

消除噪声的设备和方法、声音识别设备和配备其的车辆
技术领域
本发明的实施例涉及用于消除噪声的设备和方法、使用所述设备的声音识别设备和配备有所述声音识别设备的车辆。
背景技术
如本领域中已知,车辆是可以例如,在道路或轨道上行驶中,将物体例如,人类或货物运输到另一位置的运输构件。车辆可以主要通过安装在其车身上的一个或多个车轮的旋转来移动。车辆的实例包含三轮机动车和四轮机动车、两轮机动车例如,摩托车、电动自行车、施工机械、自行车以及在轨道上行驶的火车。
声音识别设备可以安装在车辆中。声音识别设备是可以识别由用户例如,驾驶者或乘客的语音生成的声音的设备。当车辆的声音由声音识别设备识别时,车辆内部的控制器将对应于识别出的声音的控制信号传输到车辆的组件,因此所述组件可以根据声音进行操作。当声音识别设备以此方式使用时,用户可以使用声音控制车辆的组件,因而增加了用户的便利性和安全性。
发明内容
因此,本发明的一个方面是提供:用于消除噪声的设备,所述设备能够改进声音识别速率即使当存在许多噪声时也是如此;消除噪声的方法;使用所述设备的声音识别设备和配备有所述声音识别设备的车辆。本发明的另一方面是提供:用于消除噪声的设备,所述设备能够通过相对较小量的计算改进声音识别的性能;消除噪声的方法;使用所述设备的声音识别设备和配备有所述声音识别设备的车辆。本发明的另外的方面将部分在以下描述中得到阐述,并且部分地,将从描述中显而易见,或者可以通过对公开内容的实践习得。
根据本发明的实施例,提供用于消除噪声的设备,所述设备包含:增益获取单元,其使用输入信号的信噪比(SNR:signaltonoiseratio)确定增益和增益的校正值;以及增益应用单元,其使用所确定的增益和所确定的校正值获取对应于输入信号的输出信号,其中输出信号可以包含噪声消除的输入信号和噪声未消除的输入信号,并且噪声消除的输入信号的比例和噪声未消除的输入信号的比例可以根据所确定的校正值来确定。
增益获取单元可以基于SNR确定增益的校正值。
增益获取单元可以进一步基于与输入信号的SNR和校正值之间的关系相关联的设定值来确定增益的校正值,并且可以基于设定值改变输入信号的SNR与校正值之间的关系,其中设定值可以指示声音识别设备的性能。
校正值可以以如下方式确定:校正值随着输入信号的SNR的增大而增大,或者当输入信号的SNR小于第一值或大于第二值时校正值具有均一的值。
校正值可以以如下方式确定,当输入信号的SNR增大时噪声消除的输入信号的比例增大,而当输入信号的SNR减小时噪声未消除的输入信号的比例增大。
所述设备可以进一步包含噪声成分评估单元,所述噪声成分评估单元使用最小值控制递归平均(MCRA:minimacontrolledrecursiveaveraging)算法、改进的最小值控制递归平均(IMCRA:improvedminimacontrolledrecursiveaveraging)算法和最小统计数据算法中的至少一个来评估输入信号的噪声。
所述设备可以进一步包含SNR评估单元,所述SNR评估单元使用最小均方差(MMSE:minimummeansquareerror)、均方根(RMS:rootmeansquare)误差、累积最小距离(CMD:cumulativeminimumdistance)和语音存在概率(SPP:speechpresenceprobability)评估输入信号的SNR。
此外,根据本发明的实施例,提供用于消除噪声的设备,所述设备包含:频带划分单元,其将输入信号划分成具有高频成分的信号和具有低频成分的信号;高频噪声处理单元,其基于低分辨率分析算法消除具有高频成分的信号的噪声;低频噪声处理单元,其基于高分辨率分析算法消除具有低频成分的信号的噪声;以及合成单元,其合成通过高频噪声处理单元处理的信号与通过低频噪声处理单元处理的信号。
低频噪声处理单元可以使用输入信号的SNR确定增益和增益的校正值并且可以通过应用校正过的增益获取输出信号,所述校正过的增益是通过将所确定的校正值应用到所确定的增益获得的,其中输出信号中噪声消除的输入信号的比例和输出信号中噪声未消除的输入信号的比例可以根据所确定的校正值发生变化。
高频噪声处理单元可以评估来自输入信号的最初信号的噪声并且可以使用评估过的噪声消除具有高频成分的信号的噪声。
此外,根据本发明的实施例,提供声音识别设备,所述设备包含:输入单元,其接收初始信号和噪声混合的声音信号;转换单元,其将声音信号转换成频域中的信号;增益获取单元,其使用声音信号的SNR确定增益和增益的校正值并且获取校正过的增益,所述校正过的增益是通过应用所确定的校正值到所确定的增益获得的;增益应用单元,其通过将校正过的增益应用到声音信号获取输出信号,其中输出信号中噪声消除的输入信号的比例和输出信号中噪声未消除的输入信号的比例是根据所确定的校正值变化的;以及逆变器,其使输出信号逆变。
此外,根据本发明的实施例,提供声音识别设备,所述设备包含:输入单元,其接收初始信号和噪声混合的声音信号;频带划分单元,其将输入信号划分成具有高频成分的信号和具有低频成分的信号;高频噪声处理单元,其基于低分辨率分析算法消除具有高频成分的信号的噪声;低频噪声处理单元,其基于高分辨率分析算法消除具有低频成分的信号的噪声;以及合成单元,其合成通过高频噪声处理单元处理的信号与通过低频噪声处理单元处理的信号。
高频噪声处理单元可以评估来自输入信号的最初信号的噪声并且可以使用评估过的噪声消除具有高频成分的信号的噪声。
此外,根据本发明的实施例,提供车辆,所述车辆包含:输入单元,其接收来自车辆的乘客的声音信号,在所述声音信号中声音指令和噪声是混合在一起的;声音识别单元,其通过以下项识别声音指令,i)将所接收的声音信号转换频域中的信号,ii)使用频域中的信号的SNR确定增益和增益的校正值,iii)通过应用校正过的增益获取输出信号,所述校正过的增益是通过将所确定的校正值应用到所确定的增益获得的,以及iv)使输出信号逆变,其中输出信号中噪声消除的所接收的声音信号的比例和输出信号中噪声未消除的所接收的声音信号的比例是基于所确定的校正值变化的;以及控制器,其基于识别出的声音指令生成控制信号。
此外,根据本发明的实施例,提供车辆,所述车辆包含:输入单元,其接收来自车辆的乘客的声音信号,其中声音指令和噪声是混合在一起的;频带划分单元,其将所接收的声音信号划分成具有高频成分的信号和具有低频成分的信号;声音识别单元,其:i)基于低分辨率分析算法消除具有高频成分的信号的噪声,ii)基于高分辨率分析算法消除具有低频成分的信号的噪声,iii)合成具有高频成分的噪声消除的信号与具有低频成分的噪声消除的信号,以及iv)基于所合成的信号识别声音指令;以及控制器,其基于识别出的声音指令生成控制信号。
此外,根据本发明的实施例,提供消除噪声的方法,所述方法包含:使用输入信号的SNR确定增益和增益的校正值;获取校正过的增益,所述校正过的增益是通过将所确定的校正值应用到所确定的增益获得的;以及获取输出信号,方法是将校正过的增益应用到输入信号,其中输出信号中噪声消除的输入信号的比例和输出信号中噪声未消除的输入信号的比例基于所确定的校正值发生变化。
增益的校正值的确定可以包含基于输入信号的SNR与校正值之间的关系确定增益的校正值。
增益的校正值的确定可以包含进一步基于使用与输入信号的SNR和校正值之间的关系相关联的设定值确定增益的校正值。
校正值可以以如下方式确定:校正值随着输入信号的SNR的增大而增大,或者当输入信号的SNR小于第一值或大于第二值时校正值具有均一的值。
校正值可以以如下方式确定:当输入信号的SNR增大时噪声消除的输入信号的比例增大,并且当输入信号的SNR减小时噪声未消除的输入信号的比例增大。
所述方法可以进一步包含使用MCRA算法、IMCRA算法和最小统计数据算法中的至少一个评估输入信号的噪声。
所述方法可以进一步包含使用MMSE、RMS误差、CMD和SPP中的至少一个评估输入信号的SNR。
此外,根据本发明的实施例,提供消除噪声的方法,其包含:将输入信号划分成具有高频成分的信号和具有低频成分的信号;基于低分辨率分析算法消除具有高频成分的信号的噪声;基于高分辨率分析算法消除具有低频成分的信号的噪声;以及合成具有高频成分的噪声消除的信号与具有低频成分的噪声消除的信号。
具有高频成分的信号的噪声的消除可以包含:使用输入信号的SNR确定增益和增益的校正值;获取校正过的增益,方法是将所确定的校正值应用到所确定的增益;以及获取输出信号,方法是将校正过的增益应用到输入信号,输出信号中噪声消除的输入信号的比例和输出信号中噪声未消除的输入信号的比例是基于所确定的校正值变化的。
具有低频成分的信号的噪声的消除可以包含从输入信号的最初信号中评估噪声以及使用所评估的噪声消除具有高频成分的信号的噪声。
附图说明
通过结合附图对实施例进行的以下描述,将可以清楚地知道并且更容易地理解公开内容的这些和/或其它方面,附图中:
图1是根据本发明的实施例的用于消除噪声的设备的框图;
图2说明具有噪声的信号的波形的一个实例;
图3到5是示出校正值与信噪比(SNR)之间的关系的曲线图;
图6是根据本发明的实施例的用于消除噪声的设备的框图;
图7是用于说明频率的高分辨率分析和低分辨率分析的曲线图;
图8是根据本发明的实施例的声音识别设备的框图;
图9是示出使用频率转换单元的频率转换的曲线图;
图10是车辆的内部结构的视图;
图11是根据本发明的实施例的安装在车辆中的声音识别设备的框图;
图12是根据本发明的实施例的安装在车辆中的声音识别设备的框图;
图13是根据本发明的实施例的消除噪声的方法的流程图;以及
图14是根据本发明的实施例的消除噪声的方法的流程图。
具体实施方式
现将详细参考本发明的实施例,在附图中说明了所述实施例的实例,其中相同的参考标号通篇指代相同的元件。
本文中所使用的术语仅出于描述具体实施例的目的,且并不意图限制公开内容。如本文中所使用,单数形式“一”、“一个”及“所述”意图还包含复数形式,除非上下文另外清楚地指示。将进一步理解,术语“包括”在用于本说明书中时规定所陈述的特征、整数、步骤、操作、元件,和/或组件的存在,但不排除一个或多个其它特征、整数、步骤、操作、元件、组件,和/或其群组的存在或添加。如本文中所使用,术语“和/或”包含相关联的所列项目中的一个或多个的任何和所有组合。
应理解术语“车辆”或“汽车”或如本文所使用的其它类似术语包括:一般的机动车,例如,乘用汽车,包含运动型多用途车辆(SUV)、公共汽车、卡车、各种商业车辆;船艇,包含多种小艇和船、飞机等等;并且包含混合动力车辆、电动车、充电式混合动力电动车辆、氢动力车辆和其它替代燃料车辆(例如,来源于石油外的资源的燃料)。如本文中所提到,混合动力车辆是具有两种或两种以上动力源的车辆,例如具有汽油动力和电动力的车辆。
另外,应理解下文方法或其方面中的一个或多个可由至少一个控制器执行。术语“控制器”可指包含存储器和处理器的硬件装置。存储器经配置以存储程序指令,且处理器经配置以执行程序指令,从而执行下文进一步描述的一个或多个过程。此外,应理解下文方法可以由包括控制单元的设备来执行,由此所述设备是本领域中已知的适合于消除噪声和/或体现声音识别的设备。
此外,本发明的控制逻辑可以实施为计算机可读介质上的非瞬时性计算机可读介质,所述计算机可读介质含有由处理器、控制器等执行的可执行程序指令。计算机可读介质的实例包含但不限于ROM、RAM、压缩光盘(CD)-ROM、磁带、软盘、闪存盘、智能卡和光学数据存储装置。计算机可读记录介质也可以分布在网络耦合的计算机系统中,因此计算机可读介质以分布方式储存和执行,例如,通过远程信息处理服务器或控制器区域网络(CAN:controllerareanetwork)。
在下文中,多个元件是区分于单个元件的,以便说明消除噪声的设备和方法、使用所述设备的声音识别设备和配备有所述声音识别设备的车辆。然而,为了说明的方便起见将要描述的元件是区分开的,并且此分类并不意味着元件应该彼此物理地分开。此外,将要描述的元件可以是细分的或组合的。
在下文中,将参考图1到7描述用于消除噪声的设备。
图1是根据本发明的实施例的用于消除噪声的设备的框图,并且图2说明具有噪声的信号的波形的一个实例。
根据在图1中示出的本发明的实施例,用于消除噪声的设备10可以包含噪声成分评估单元11、增益获取单元12和增益应用单元19。参考图1和图2,用于消除噪声的设备10可以接收输入信号I(I=S+N),其中初始信号和噪声N是从外部装置(例如,麦克风)中混合的,并且可以输出信号O,其中噪声N是使用噪声成分评估单元11、增益获取单元12和增益应用单元19从所接收的输入信号I中消除或衰减的。
用于消除噪声的设备10的噪声成分评估单元11可以接收输入信号I,其中初始信号S和噪声N是从外部装置中混合的并且可以从输入信号I中获取评估过的噪声(EN:eliminatednoise),其中初始信号S和噪声N是混合的。详细地说,噪声成分评估单元11可以仅从输入信号I的频率成分之中评估EN。
噪声成分评估单元11可以使用所属领域的一般技术人员可以考虑的各种算法从输入信号I中评估噪声成分。举例来说,噪声成分评估单元11可以使用各种算法从输入信号I中获取EN,例如,最小值控制递归平均(MCRA)算法、改进的最小值控制递归平均(IMCRA)算法和最小统计数据算法。此外,噪声成分评估单元11可以使用各种数学或统计算法来评估来自输入信号I的噪声信号。在实施例中,噪声成分评估单元11也可以使用关于频率成分是否接近声音的语音存在概率(SPP)来评估噪声成分。举例来说,噪声成分评估单元11也可以使用MCRA算法中的SPP来评估噪声。
在实施例中,噪声成分评估单元11也可以将输入信号I分成多个频带并且随后可以分开评估所划分的多个频带中的每一个中的噪声成分。并且,在实施例中,噪声成分评估单元11也可以评估来自整个输入信号I的噪声成分。
通过噪声成分评估单元11获取的EN可以被传输到增益获取单元12。
增益获取单元12可以使用EN获取将要应用到输入信号I的增益G。在实施例中,增益获取单元12可以在输入信号I的所划分的频带中的每一个中单独地获取增益G。另外,在实施例中,增益获取单元12也可以通过计算来自整个输入信号I的增益G获取增益G。
在图1中所示出的实施例中,增益获取单元12可以包含信噪比(SNR)评估单元13、增益评估单元15、校正值确定单元16和增益校正单元18。
SNR评估单元13可以从噪声成分评估单元11中接收所获取的EN,并且可以使用所接收的EN评估SNR。此处,SNR评估单元13可以从噪声成分评估单元11和外部装置中接收EN和输入信号I并且可以使用所接收的EN和输入信号I来评估SNR。
举例来说,SNR可以使用以下公式1定义。在下文中,将描述在公式1中定义的SNR。然而,SNR不限于在公式1中所定义的而是可以根据设计者不同地定义。
【公式1】
SNR = c log ( S 2 N 2 )
S是噪声N未合成的初始信号,N是噪声,并且SNR是一个SNR。c是可以根据用户的选择应用的常量。此处,N可以是通过噪声成分评估单元11评估的评估过的噪声(EN)。当SNR以此方式定义时,如果在初始信号S中存在许多噪声N,那么SNR可以具有相对较小的值,并且如果在初始信号S中存在较少噪声N,那么SNR可以具有相对较大的值。
当SNR以此方式定义时,应该首先获取噪声N未合成的初始信号S。因此,SNR评估单元13可以获取通过噪声成分评估单元11评估的EN和使用以下公式2评估的SNRSNR_EST并且可以替代用于初始SNR。
【公式2】
SNR EST = c log ( I 2 N 2 ) , wherein I = S + N
I是输入信号,其中上述初始信号S和噪声N是混合的,并且SNR_EST是评估过的SNR。
SNR评估单元13可以使用上述公式2获取评估过的SNRSNR_EST。
在实施例中,SNR评估单元13可以通过使用其中均方误差(MSE:meansquareerror)最小化的最小均方差(MMSE)评估SNR,可以使用均方根(RMS)误差评估SNR,或者可以使用累积最小距离(CMD)评估SNR。
在实施例中,SNR评估单元13可以获取SPP或可以使用所获取的SPP评估SNR。为此目的,SNR评估单元13可以进一步包含计算和评估SPP的SPP评估单元14。SPP评估单元14可以使用所属领域的一般技术人员可以考虑的各种方法评估和获取SPP。当SPP通过SPP评估单元14评估时,SNR评估单元13可以基于SPP校正所评估的SNRSNR_EST。取决于所述实施例可以省略SPP评估单元14。
通过SNR评估单元13获取的评估过的SNRSNR_EST可以被传输到增益评估单元15和校正值确定单元16。并且,通过SNR评估单元13的SPP评估单元14获取的SPP可以被传输到增益评估单元15。
增益评估单元15可以使用评估过的SNRSNR_EST计算和评估增益EG。在实施例中,增益评估单元15也可以通过进一步使用所传输的SPP以及评估过的SNRSNR_EST来计算和评估EG。
取决于实施例增益评估单元15也可以使用最小均方差短时间频谱幅度(MMSE-STSA:minimummeansquareerror-shorttimespectralamplitude)估计量(estimator)、最小均方差对数频谱幅度(MMSE-LSA:minimummeansquareerror-logspectralamplitude)估计量,或最佳地修改的对数频谱幅度(OM-LSA:optimallymodified-logspectralamplitude)估计量来评估增益EG。此外,增益评估单元15也可以使用所属领域的一般技术人员可以考虑的各种方法评估增益EG。
校正值确定单元16可以确定用于校正评估过的增益EG的校正值α。详细地说,校正值确定单元16可以使用SNR确定校正值α。用于校正值确定单元16的SNR可以包含从SNR评估单元13中传输的评估过的SNRSNR_EST。在下文中,SNR和评估过的SNRSNR_EST可被称为SNRSNR_EST。
图3到图5是示出校正值与SNR之间的关系的曲线图。在图3到图5中,x轴表示SNRSNR_EST,并且y轴表示用于校正评估过的增益EG的校正值α。校正值α可以是在范围0到1内的特定值。在图3到图5中,对应于y轴的点a1到a6中的每一个的校正值α是大于0且小于1的值。在图3到图5中,校正值α并不具有0的值。然而,取决于实施例校正值α也可以是0。并且,校正值α并不具有1的值。然而,取决于实施例校正值α也可以是1。
参考图3,当SNRSNR_EST小于预定第一SNRR1时,校正值确定单元16可以确定均一的下限值a1作为用于校正评估过的增益EG的校正值α。换句话说,相对于小于第一SNRR1的SNRSNR_EST校正值α可以是均一的。
并且,当SNRSNR_EST大于预定第二SNRR2时,校正值确定单元16可以确定均一的上限值a2作为用于校正评估过的增益EG的校正值α。换句话说,当SNRSNR_EST大于第二SNRR2时,校正值α可以是均一的。当SNRSNR_EST大于第二SNRR2时,它可以意味着在输入信号I中出现较少的噪声N。因此,校正值α可以确定为1或接近1的值。
参考图3,当SNRSNR_EST在第一SNRR1与第二SNRR2之间时,校正值确定单元16可以确定与SNRSNR_EST的值成比例的校正值α。换句话说,SNR、SNR_EST和校正值α可以具有在第一值R1和第二值R2的范围内的线性关系I1。此处,校正值α可以具有在下限值a1和上限值a2的范围内的值。
参考图4,当SNRSNR_EST小于第三SNRR3时,校正值确定单元16可以确定均一的下限值a3作为用于校正评估过的增益EG的校正值α,并且当SNRSNR_EST大于预定第四SNRR4时,校正值确定单元16可以确定均一的上限值a4作为用于校正评估过的增益EG的校正值α。当SNRSNR_EST在第三SNRR3与第四SNRR4之间时,校正值确定单元16可以通过将SNRSNR_EST应用到预定指数函数I2来确定校正值α。
并且,参看图5,当SNRSNR_EST小于第五SNRR5时,校正值确定单元16可以确定均一的下限值a5作为校正值α,并且当SNRSNR_EST大于第六SNRR6时,校正值确定单元16可以确定上限值a6作为校正值α,并且当SNRSNR_EST在第五SNRR5与第六SNRR6之间时,校正值确定单元16也可以通过将SNRSNR_EST应用到预定对数函数I3来确定校正值α。
此外,校正值确定单元16可以使用SNRSNR_EST与校正值α之间的各种关系确定校正值α用于校正评估过的增益EG。
上述上限值a1、a3或a5以及上述下限值a2、a4或a6可以由设备10的设计者任意地确定以用于消除噪声或由使用设备10的用户任意地确定以用于消除噪声。上限值a1、a3或a5以及下限值a2、a4或a6也可以是固定值。此外,取决于实施例上限值a1、a3或a5以及下限值a2、a4或a6可以是可变值。换句话说,设计者或用户可以改变上限值a1、a3或a5以及下限值a2、a4或a6,由此改变根据SNRSNR_EST确定的校正值α。
在实施例中,校正值确定单元16可以通过进一步使用SNRSNR_EST和单独地输入的设定值17来确定校正值α。在这种情况下,校正值确定单元16可以首先根据设定值17确定SNRSNR_EST与校正值α之间的关系,并且随后可以通过将输入SNRSNR_EST应用到上述SNRSNR_EST与校正值α之间的关系来确定校正值α。
设定值17可指指示可选情况的值。因此,可选设定值17的数目可以对应于可选情况的数目。设定值17可以是指示声音识别设备的设置或性能的值,对于声音识别设备可以应用用于消除噪声的设备10。举例来说,设定值17可以是指示声音识别设备的值,所述值通过进一步使用另一用于消除噪声的设备指示噪声是否从输出信号o中进一步消除或未从输出信号o中消除。
根据设定值17校正值确定单元16可以改变校正值与SNR之间的关系。举例来说,校正值确定单元16也可以根据设定值17改变关于校正值与SNR之间的关系的函数并且也可以根据设定值17改变校正值α的下限值a1、a3或a5或上限值a2、a4或a6。换句话说,校正值确定单元16可以根据设定值17获取适合于若干情况的各种校正值α。
详细地说,例如,如果指示声音识别设备进一步使用另一设备来消除噪声的设定值17输入到校正值确定单元16中,那么校正值确定单元16可以根据输入设定值17在将上述下限值a1、a3或a5变为相对较小之后获取校正值α。如果在输入信号I中存在许多噪声N,那么SNRSNR_EST较低并且输出信号o传输至进一步使用另一设备来消除噪声的声音识别设备,校正值α可以具有相对较小的值。因此,如稍后将描述,在输出信号o中未失真的初始输入信号I的比例升高。如果未失真的初始输入信号的比例增大,那么在输入信号I中未失真的初始信号的比例增大,因此可以输出更多初始信号而不会失真。因此,可以减小声音识别设备的声音识别的误差。
如果指示声音识别设备并不进一步使用另一设备来消除噪声的设定值17输入到校正值确定单元16中,那么校正值确定单元16可以根据输入设定值17在将上述下限值a1、a3或a5变为相对较小之后获取校正值α。
设定值17可以存储在分开的存储设备中,例如,半导体存储设备或磁盘存储设备。校正值确定单元16可以通过从分开的存储设备中调用设定值17来确定SNRSNR_EST与校正值α之间的关系。
增益校正单元18可以使用由校正值确定单元16确定的校正值α来校正通过增益评估单元15传输的增益EG并且可以输出校正过的增益CG。增益校正单元18可以使用以下公式3来校正增益。
【公式3】
cG=a(SNR,T)*G+(1.0-a(SNR,T))
cG是校正过的增益,SNR是SNRSNR_EST,T是设定值,并且(SNR,T)是由SNRSNR_EST和设定值T确定的校正值α。G是通过增益评估单元15评估的增益EG。根据公式3,当校正值α是1或接近1的值时,从增益校正单元18输出的校正过的增益cG将与由增益评估单元15评估的增益EG相同或类似。如果校正值α是0或接近0的值,那么从增益校正单元18输出的校正过的增益cG可以是1或接近1的值。
增益应用单元19可以使用校正过的增益CG通过增益校正单元18和输入信号I获取输出信号o。增益应用单元19可以使用以下公式4产生输出信号o,增益应用到所述输出信号。
【公式4】
O=cG*I=[a*G+(1.0-a)]*I=a*G*I+(1.0-a)*I
o是输出信号并且cG是校正过的增益。α是校正过的值,并且G是评估过的增益EG。校正值α可以通过SNRSNR_EST和设定值T确定。此处,在距离右边最远侧的a*G*I是输入信号的比例,其中消除了由评估增益EG校正过的噪声N,并且(1.0-a)*I是未失真的初始输入信号I的比例。
根据公式4,噪声N消除的输入信号的比例和初始输入信号I的比例可以根据校正值α的大小确定。如果校正值α是1或接近1的值,那么噪声N消除的输入信号将作为输出信号o从增益应用单元19中输出。如果校正值α是0或接近0的值,那么未失真的初始输入信号I将作为输出信号o从增益应用单元19中输出。
参考图3到5,校正值α可以根据SNRSNR_EST和设定值17来确定。因此,噪声N消除的输入信号的比例和初始输入信号I的比例可以根据SNRSNR_EST或设定值17来确定。更详细地说,噪声N消除的输入信号的比例和初始输入信号I的比例可以取决于在输入信号I中是否存在许多噪声N或根据用于消除噪声的设备10的声音识别设备的设置或性能来确定。
如果在输入信号I中存在较小噪声N并且SNRSNR_EST是较大的,那么校正值α可以确定为接近上限值a2、a4或a6的值。在这种情况下,校正值α也可以确定为1或接近1的值。随后,由于校正值α是增大的,所以噪声N在输出信号o中消除的输入信号的比例是相对增大的,并且未失真的初始输入信号I的比例是相对减小的。如果SNRSNR_EST较大,那么评估增益EG应用到其上的输入信号是噪声N消除且几乎不失真的信号,并且噪声N消除的输入信号的比例增大,因此输入信号I的失真可以最小化并且可以获得优化的输出信号o。
当在输入信号I中存在许多噪声N并且SNRSNR_EST是较小的时,那么校正值α可以确定为接近下限值a1、a3或a5的值。在这种情况下,由于校正值α是减小的,所以噪声N在输出信号o中消除的输入信号的比例将是相对减小的,并且未失真的初始输入信号I的比例将是相对增大的。如果SNRSNR_EST较小,那么评估增益EG应用到其上的输入信号的许多噪声N是消除的,因此声音信号的失真增大。因此,未失真的初始输入信号I的比例增大,因此可以获得其中失真最小化的输出信号o。
如果校正值α未应用到评估过的增益EG,那么在输入信号I中存在许多噪声N,并且SNRSNR_EST较小,仅噪声N消除的输入信号作为输出信号o输出,因此输入信号I的失真可能增大。
然而,如上文所述,如果根据SNRSNR_EST或声音识别设备的设置或性能应用适当的校正值α,那么输入信号I的失真可以最小化,并且可以获得优化的输出信号o。
上述噪声成分评估单元11、增益获取单元12和增益应用单元19可以通过物理地彼此分开的分开的处理器或使用一个处理器来执行。处理器可以经编程以执行噪声成分评估单元11、增益获取单元12或增益应用单元19的功能。处理器可以通过一个或两个或更多半导体实施。
图6是根据本发明的实施例的用于消除噪声的设备的框图,并且图7是用于说明频率的高分辨率分析算法和低分辨率分析算法的视图。
如图6中所说明,用于消除噪声的设备20可以包含频带划分单元21、合成单元22、高频噪声处理单元30,以及低频噪声处理单元40。详细地说,根据本发明的实施例用于消除噪声的设备20可以根据频带来分类输入信号I并且随后可以通过在每个频带中应用不同的方法来消除噪声N。
频带划分单元21可以将输入信号I划分成具有高频成分的信号H和具有低频成分的信号L。输入信号I可以划分成具有高频成分的信号H和具有低频成分的信号L。频带划分单元21可以使用预定参考值将输入信号I划分成具有高频成分的信号H和具有低频成分的信号L。举例来说,如图7中所说明,预定参考值可以包含4kHz。在这种情况下,频带划分单元21可以将小于4kHz的频率的成分划分成具有低频成分的信号L并且将频率大于4kHz的成分划分成具有高频成分的信号H。以此方式,预定参考值可以根据设计者或用户的选择任意地确定。
具有高频成分的信号H可以被传输到高频噪声处理单元30,并且具有低频成分的信号L可以被传输到低频噪声处理单元40。
高频噪声处理单元30和低频噪声处理单元40可以相同方式或使用不同方法消除具有高频成分的信号的噪声和具有低频成分的信号的噪声。举例来说,高频噪声处理单元30和低频噪声处理单元40都可以使用通过稍后将描述的高频噪声处理单元30执行的方法或通过稍后将描述的低频噪声处理单元40执行的方法来消除噪声。在下文中将描述其中高频噪声处理单元30和低频噪声处理单元40使用不同方法来消除噪声的实施例。然而,这并不意味着高频噪声处理单元30和低频噪声处理单元40可以仅根据所述实施例来消除噪声。
高频噪声处理单元30可以消除具有高频成分的信号H的噪声N。在实施例中,高频噪声处理单元30可以根据低分辨率分析算法消除噪声N。参看图7,低分辨率分析算法可以是设定成将高频成分划分成多个频带c1到c3的算法,其中每个带宽变得相对较宽,并且设定成消除所述多个划分过的频带c1到c3中的每一个中的噪声N。
高频噪声处理单元30可以包含第一噪声成分评估单元31和噪声消除单元32。
在相对较宽的频带c1到c3中的每一个中,第一噪声成分评估单元31可以仅评估来自信号H的噪声成分,所述信号具有从频带划分单元21中传输的高频成分。第一噪声成分评估单元31可以使用所属领域的一般技术人员可以考虑的各种算法从具有高频成分的信号H中评估噪声成分。第一噪声成分评估单元31可以使用不具有初始信号的最初信号来评估噪声N,例如,声音,即,噪声N,或主要成分是噪声N的最初信号。第一噪声成分评估单元31可以将最初信号评估和确定为噪声。在这种情况下,第一噪声成分评估单元31可以在预定周期中从最初信号中计算平均能级并且可以将计算出的平均能级评估为噪声N。
噪声消除单元32可以消除从频带划分单元21中传输的具有高频成分的信号H的每个频带c1到c3中的噪声N。噪声消除单元32可以从输入信号I中消除噪声N,方法是从输入信号I中消除评估为噪声N的最初信号。噪声消除单元32可以消除噪声N,方法是消除从具有高频成分的信号H中的最初信号中计算出的平均能级的评估过的噪声。噪声消除单元32可以使用各种算法从具有高频成分的信号H中消除噪声N。举例来说,噪声消除单元32可以使用频谱减法或威纳滤波器从具有高频成分的信号H中消除噪声N。
其中的噪声通过高频噪声处理单元30消除的信号o1可以被传输到合成单元22并且可以与信号o2一起合成,从低频噪声处理单元40传输的信号o2的噪声是消除的。
低频噪声处理单元40可以消除具有低频成分的信号L的噪声N。在实施例中,低频噪声处理单元40可以根据高分辨率分析算法消除噪声N。参看图7,低频噪声处理单元40可以根据高分辨率分析算法将低频成分划分成多个频带c4到c10,其中每个带宽变得相对狭窄,并且随后可以在多个频带c4到c10中的每一个中消除噪声N。换句话说,低频噪声处理单元40可以将频率成分划分成具有与高频噪声处理单元30相比相对较大数目的多个频带并且可以消除多个所划分的频带c4到c10中的每一个中的噪声N。
低频噪声处理单元40可以包含第二噪声成分评估单元41、增益获取单元42和增益应用单元49。
第二噪声成分评估单元41可以仅从具有低频成分的信号L的频率成分中评估一个噪声成分。此处,第二噪声成分评估单元41可以评估每个频带中的噪声成分。第二噪声成分评估单元41可以使用所属领域的一般技术人员可以考虑的各种算法从具有低频成分的信号L中评估噪声成分,例如,MCRA算法、IMCRA算法和最小统计数据算法。此外,第二噪声成分评估单元41可以使用用于评估噪声信号的各种数学或统计算法从具有低频成分的信号L中评估噪声成分。并且,第二噪声成分评估单元41可以使用关于频率成分是否接近声音的SPP来评估噪声成分。
增益获取单元42可以使用评估过的噪声获取将要应用到具有低频成分的信号L的增益。在图1中所示的实施例中,增益获取单元42可以包含SNR评估单元43、增益评估单元45、校正值确定单元46和增益校正单元48。
SNR评估单元43可以使用通过第二噪声成分评估单元41获取的评估过的噪声获取评估过的SNR。图6的SNR评估单元43可以与图1中所说明的SNR评估单元13相同。
在实施例中,SNR评估单元43可以使用MMSE、RMS误差或CMD以便评估SNR。并且,SNR评估单元43可以获取SPP或可以使用所获取的SPP评估SNR。
增益评估单元45可以使用评估过的SNR计算和评估增益。在实施例中,增益评估单元45也可以通过进一步使用评估过的SNR和SPP计算和评估。
取决于实施例,增益评估单元45可以使用MMSE-STSA估计量、MMSE-LSA估计量,或OD-LSA估计量,以便评估增益。此外,增益评估单元15可以使用所属领域的一般技术人员可以考虑的各种方法以便评估增益。
校正值确定单元46可以确定校正值用于使用SNR校正评估过的增益。此处,SNR可以包含从SNR评估单元43传输的评估过的SNR。校正值确定单元46可以仅使用SNR或使用SNR和设定值47确定校正值。
校正值确定单元46可以使用已经参考图3到5描述的校正值与SNR之间的关系确定校正值。如图3到5中所说明,如果所获取的SNR小于预定值R1、R3或R5或大于预定值R2、R4或R6,那么校正值a1到a6可以是均一的。校正值和SNR可以具有在预定值R1和R2、R3和R4,或R5和R6的范围内的线性函数I1、指数函数I2或对数函数I3的关系。此外,校正值确定单元46可以确定校正值用于使用SNR与校正值之间的各种关系校正评估增益。
并且,校正值确定单元46可以通过进一步使用设定值47来确定校正值。在这种情况下,如上文所述,校正值确定单元16可以首先根据设定值47确定SNR与将要使用的校正值之间的关系,并且随后可以使用SNR与校正值之间的关系来确定校正值。此处,设定值47可以与参考图1描述的设定值17相同。详细地说,设定值47可指指示可选情况的值并且还可以包含指示声音识别设备的设置或性能的值,用于消除噪声的设备10可以应用于所述声音识别设备。校正值与SNR之间的关系可以根据设定值47变化。在这种情况下,关于校正值与SNR之间的关系的函数可以根据设定值47变化,并且图3到5中所说明的校正值与SNR之间的关系的下限值a1、a3或a5或上限值a2、a4或a6可以根据设定值47变化。
增益校正单元48可以使用由校正值确定单元46确定的校正值校正和输出通过增益评估单元45传输的增益。增益校正单元18可以使用上述公式3来校正增益。
增益应用单元49可以使用由增益校正单元48校正过的增益和具有低频成分的信号L获取将要被传输到合成单元22的信号o2。增益应用单元49可以生成将要被传输到合成单元22的信号o2,使用上述公式4将增益应用到所述合成单元。因此,从增益应用单元49输出的信号o2可以是根据校正值具有较高比例的具有低频成分的信号L的信号或具有较高比例的其噪声从具有低频成分的信号L中消除的信号的信号。从增益应用单元49中输出的信号可以被传输到合成单元22。
合成单元22可以合成从高频噪声处理单元30输出信号o1与从低频噪声处理单元40输出的信号o2并且可以获取输出信号o。输出信号o可以是取决于输出信号o是否具有高频或低频使用不同方法消除其噪声N的信号。
如上文所述用于消除噪声的设备20的频带划分单元21、高频噪声处理单元30、低频噪声处理单元40和合成单元22可以使用彼此物理地分开的分开的处理器执行或使用一个处理器执行。处理器可以经编程以执行频带划分单元21、高频噪声处理单元30、低频噪声处理单元40或合成单元22的函数。处理器可以通过一个或两个或更多半导体实施。
在下文中,将参考图8和9描述使用用于消除噪声的设备的声音识别设备。
图8是根据本发明的实施例的声音识别设备的框图。
参考图8,声音识别设备50可以包含声音输入单元51、频率转换单元52、频带划分单元53、噪声消除单元54和逆变器58。
声音输入单元51可以接收作为在人类讲话或物体振动时生成的波的语音或声音。声音输入单元51可以对应于语音或声音的频率通过根据语音或声音的频率的振动生成和输出电信号。此处,所生成的电信号可以包含模拟信号。并且,所生成的电信号可以是时域中的信号。从声音输入单元51中输出的电信号可以被传输到频率转换单元52。视需要,从声音输入单元51输出的电信号可以使用放大器或模/数(A/D:analogtodigital)转换器被传输到频率转换单元52。
图9是示出使用频率转换单元的频率转换的曲线图。
如图9中所说明,频率转换单元52可以将时域中的输入信号J转换成频域中的信号f1到f3。频率转换单元52可以使用快速傅里叶变换(FFT:fastFouriertransform)将时域中的信号J转换成信号f1到f3。取决于实施例也可以省略频率转换单元52。
频带划分单元53可以将频域中的信号f1到f3划分成具有高频成分的信号H和具有低频成分的信号L,可以将具有高频成分的信号H传输到噪声消除单元54的高频噪声处理单元55,并且可以将具有低频成分的信号L传输到噪声消除单元54的低频噪声处理单元56。取决于实施例也可以省略频带划分单元53。
噪声消除单元54可以包含高频噪声处理单元55、低频噪声处理单元56和合成单元57。取决于实施例噪声消除单元54可以是图1中示出的噪声消除设备10。在这种情况下,可以从噪声消除单元54中省略高频噪声处理单元55和合成单元57,并且低频噪声处理单元56可以处理具有高频成分的信号H和具有低频成分的信号L。
高频噪声处理单元55可以消除具有高频成分的信号H的噪声N并且可以将其中噪声N消除的信号o1传输到合成单元57。在所述实施例中,高频噪声处理单元55可以根据低分辨率分析算法消除具有高频成分的信号H的噪声N,如图7中所说明。在这种情况下,高频噪声处理单元55可以评估来自信号H的噪声成分并且可以消除在具有高频成分的信号H的频带c1到c3中的每一个中评估的噪声,所述信号H具有从频带划分单元53传输的高频成分。高频噪声处理单元55可以通过从最初信号中计算平均能级来评估噪声并且可以根据评估的结果消除具有高频成分的信号H的噪声N。高频噪声处理单元55可以使用频谱减法或威纳滤波器以便消除噪声N。
低频噪声处理单元56可以消除具有低频成分的信号L的噪声N并且可以将其中噪声N消除的信号o2传输到合成单元57。在实施例中,低频噪声处理单元56可以根据高分辨率分析算法消除具有低频成分的信号L的噪声N,如图7中所说明。低频噪声处理单元56可以使用已经参考图1和6描述的噪声成分评估单元11或41、增益获取单元12或42,以及增益应用单元19或49消除噪声N。用于低频噪声处理单元56的噪声成分评估单元11或41、增益获取单元12或42以及增益应用单元19或49可以与上文所述的那些相同或根据需要略微地修改。
合成单元57可以合成从高频噪声处理单元55输出的信号o1与从低频噪声处理单元56输出的信号o2并且可以获取输出信号o。
逆变器58可以使从合成单元57输出的信号o逆变并且可以生成语音信号S。逆变器58可以使用快速傅里叶逆变换(IFFT:inversefastFouriertransform)执行输出到合成单元57的信号o的逆变。
获取的语音信号s可以被传输到输出单元59,例如,扬声器,可以输出到外部或可以被传输到将受到控制的装置60的控制器61,例如,车辆。控制器61可以由分开的微处理器配置。控制器61可以根据语音信号s生成对应于声音信号s的控制指令,可以将生成的控制指令传输到将受到控制的装置60的对应的成分,并且可以根据通过声音识别设备50识别的用户的声音指令控制将受到控制的装置60。
在下文中,将描述配备有使用用于消除噪声的设备的声音识别设备的车辆。在下文中,将描述通常的四轮机动车辆作为配备有声音识别设备的车辆的一个实例,所述声音识别设备使用用于消除噪声的设备。四轮机动车辆可以包含可以通过四个车轮驾驶的小型汽车、厢式货车、公共汽车或卡车。并且,配备有使用用于消除噪声的设备的声音识别设备的车辆不限于通常的四轮机动车辆。配备有声音识别设备的车辆的实例可以包含:三轮机动车辆;两轮机动车辆,例如,摩托车、电动自行车、施工机械、自行车;能够在轨道上行驶的火车;或能够在水路中导航的船只。
图10是车辆的内部结构的视图。
如图10中所说明,仪表板(dashboard)200可以设置在车辆100内部。仪表板200是指分隔车辆100的内部和发动机舱的面板并且设置在驾驶者座椅250和乘客座椅251的前方并且其中安装有驾驶所需的各种组件。仪表板200可以包含上部面板201、中心仪表盘(centerfascia)220和变速箱230。仪表板200的上部面板201可以设置在挡风玻璃202下方,并且空气调节装置113的风口(tuyere)113a和手套箱(glovebox)或各种指示器140可以安装在上部面板201上。
并且,车辆的显示装置110,例如,导航装置,可以安装在仪表板200上。更详细地说,车辆的显示装置110可以安装在中心仪表盘220的顶端。车辆的显示装置110可以埋入仪表板200中并且可以安装在中心仪表盘220的顶端或者也可以使用预定框架配置的支撑单元安装在中心仪表盘220的顶端。用于接收来自用户(例如,驾驶者或乘客)的声音的一个或两个或更多输入单元133和134可以设置在用于车辆的显示装置110的外壳111处。输入单元133和134可以由麦克风实施。
仪表板200的中心仪表盘220(例如,中心控制台:centerconsole)可以安装为连接到上部面板201,并且输入单元221和222,例如,用于控制车辆的物理按钮、收音机装置116,或声音再现装置115,例如压缩光盘播放器,可以设置在仪表板200的中心仪表盘220处。中心仪表盘220可以设置在驾驶者座椅250与乘客座椅251之间。
在实施例中,包含用于控制各种车辆中的电子装置的微处理器的包含用于车辆的显示装置110的各种组件可以安装在仪表板200的内侧。各种组件可以包含执行微处理器的函数的至少一个半导体芯片、至少一个开关、至少一个集成电路(IC:integratedcircuit)、至少一个电阻、至少一个易失性或非易失性存储器和至少一个印刷电路板(PCB:printedcircuitboard)中的至少一个。半导体芯片、开关、IC、电阻和易失性或非易失性存储器可以设置在PCB上。
用于从驾驶者或乘客接收声音的一个或两个或更多输入单元131可以设置在车辆100的上框架的内侧。输入单元131可以由麦克风实施。输入单元131可以使用缆线电连接到设置在仪表板200的内侧的微处理器或用于车辆100的显示装置110。并且,输入单元131可以使用蓝牙或近场通信等无线通信网络电连接到设置在仪表板200的内侧的微处理器或用于车辆100的显示装置110,并且可以将由输入单元131接收到的声音传输到微处理器。
遮阳板121和122可以安装在车辆100的上框架的内侧。用于接收来自驾驶者或乘客的声音的一个或两个或更多输入单元132可以设置在遮阳板121和122处。遮阳板121和122的输入单元132可以由麦克风实施。遮阳板121和122的输入单元132可以有线或无线方式电连接到设置在仪表板200的内侧的微处理器或用于车辆100的显示装置110,并且可以将由输入单元132接收到的声音信号传输到微处理器。并且,用于锁定车辆100的门117的锁定装置112可以设置在车辆100内部。
图11是根据本发明的实施例安装在车辆100中的声音识别设备的框图。
参考图11,车辆100可以包含车辆100中的各种组件和装置118,包含:安装在车辆100或导航装置110内部的麦克风131到134、频率转换单元140、噪声消除单元141、逆变器145、声音/文本转换单元146、控制器147和存储单元148。
车辆100中的各种组件和装置118可以包含可以在用于驾驶的车辆100内部使用的或为用户提供便利性的各种装置,例如,麦克风131和132、导航装置110、锁定装置112、空气调节装置113、照明装置114、声音再现装置115和收音机装置116,如图11中所说明。麦克风133和134可以安装在导航装置110中。
麦克风131到134可以接收驾驶者的声音或乘客的声音并且可以输出对应于所接收的声音的电信号。输出电信号可以是模拟信号。输出电信号可以被传输到频率转换单元140。输出电信号可以在输出电信号传输至频率转换单元140之前通过放大器放大或通过A/D转换器转换成数字信号。输出电信号可以包含时域中的信号。
麦克风131到134可以接收作为驾驶者或乘客的用户的声音、车辆100的发动机声音以及不同类型的噪声,例如,从空气调节装置113的风口113a排放的风声或在车辆100外部生成的汽车喇叭声。因此,从麦克风131到134输出的电信号可以进一步包含各种噪声信号连同涉及用户的声音的信号。
麦克风131和132可以设置在车辆100的上框架的内侧或遮阳板121和122处,如图10中所说明。此外,麦克风131和132可以安装在车辆100的内部的各种位置中,例如,在方向把手上。麦克风131和132安装在其中的位置可以是易于接收驾驶者的或乘客的声音的位置。此外,麦克风133和134可以预先安装在导航装置110中。
频率转换单元140可以将时域中的信号转换为频域中的信号,如参考图9所描述。频率转换单元140可以使用包含FFT的各种方法将时域中的信号转换成频域中的信号。取决于实施例可以省略频率转换单元140。
噪声消除单元141执行来自频域中的信号的消除噪声的功能,其中用户的声音和车辆内部的噪声是混合的。噪声消除单元141可以包含噪声成分评估单元142、增益获取单元143和增益应用单元144。
噪声成分评估单元142可以获取从麦克风131到134或频率转换单元140传输的评估过的噪声。噪声成分评估单元142可以获取评估过的噪声,方法是使用所属领域的一般技术人员可以考虑的各种算法评估噪声成分,所述算法,例如,MCRA算法、IMCRA算法和最小统计数据算法。在这种情况下,噪声成分评估单元142也可以使用SPP评估噪声成分。
增益获取单元143可以使用获取的评估过的噪声获取评估过的SNR,可以使用评估过的SNR计算和评估增益,可以使用SNR确定用于校正评估过的增益的校正值,并且可以使用所确定的校正值校正和输出评估过的增益。
增益获取单元143可以使用MMSE、RMS误差或CMD等方法来评估SNR。并且,增益获取单元143可以获取SPP并且也可以使用获取的SPP来评估SNR。
增益获取单元143可以使用评估过的SNR计算评估过的增益。视需要,增益获取单元143也可以使用SPP计算评估过的增益。增益获取单元143可以使用所属领域的一般技术人员可以考虑的各种方法来评估增益,例如,MMSE-STSA估计量、MMSE-LSA估计量,或OM-LSA估计量。
增益获取单元143可以使用评估过的SNR确定用于校正评估过的增益的校正值。在这种情况下,增益获取单元143可以使用校正值与SNR之间的关系或预定设定值获取校正值。此处,校正值与SNR之间的关系可以包含已经参考图3到5描述的关于校正值与SNR之间的关系的若干实施例。设定值可以是指示可选情况的值,并且可选情况可以包含车辆内部的声音识别设备的设置或性能。图3到5中示出的校正值与SNR之间的关系的下限值a1、a3或a5或上限值a2、a4或a6可以根据设定值变化。
当SNR较大时,即,当存在较少噪声时,校正值可以确定为较大的,并且当SNR较小时,即,当存在较多噪声时,校正值可以确定为较小的。并且,当车辆内部的声音识别设备通过反映车辆的驾驶噪声识别声音时获得的校正值(下文称为第一校正值)可以相对小于当车辆内部的声音识别设备通过不反映车辆的驾驶噪声识别声音时获得的校正值(下文称为第二校正值),如同在外部服务器或终端设备中,例如,智能电话。具体来说,当SNR较大时,第一校正值可以确定为与第二校正值相同,并且第一校正值可以确定为小于第二校正值。
增益获取单元143可以使用所确定的校正值来校正评估过的增益。增益获取单元143可以根据上述公式3来校正增益。
增益应用单元144可以通过将通过增益获取单元143获取的校正过的评估过的增益应用到通过麦克风131到134或频率转换单元140传输的信号来获取输出信号。增益应用单元144可以根据上述公式4获取输出信号。
更详细地说,当获取的校正值接近1时增益获取单元144可以增加噪声消除的信号的比例,并且当获取的校正值接近0时增益获取单元144可以增加初始信号的比例。因此,如果车辆内部的声音识别设备通过反映车辆的驾驶噪声来识别声音并且声音信号的SNR较大时,那么校正值可以确定为相对较小,并且增益获取单元144可以合成初始信号,所述信号的噪声是消除的,因此可以增大初始信号的比例。
从增益应用单元144输出的信号可以被传输到逆变器145。逆变器145可以使用IFFT使从噪声消除单元141输出的信号逆变,由此生成噪声消除的声音信号。从逆变器145输出的信号可以通过声音/文本转换单元146被传输到控制器147或直接被传输到控制器147。
声音/文本转换单元146可以使用各种语音到文本技术将声音转换成文本信号并且可以将转换过的文本信号传输到控制器147。如果控制器147能够直接使用声音信号生成控制指令,那么也可以省略声音/文本转换单元146。
控制器147可以使用声音信号或通过声音/文本转换单元146转换的文本信号生成对应的控制指令,可以将生成的控制指令传输到车辆中的各种组件和装置118之中的将受到控制的对应的组件和装置,由此控制将受到控制的组件和装置。举例来说,当驾驶者给出用于照明的声音指令时,控制器147可以生成对应于声音指令的控制信号并且随后可以将所生成的控制信号传输到照明装置114并且可以开启照明装置114。
存储单元148可以储存生成用于车辆中的组件和装置的控制信号所需的各种数据。视需要,存储单元148也可以储存关于由控制器147生成的控制信号的历史。关于控制信号的历史也可以用于安装在车辆中的声音识别设备的学习。此外,存储单元168可以储存各种数据或必需的设置。
上述频率转换单元140、噪声消除单元141、逆变器145、声音/文本转换单元146和控制器147可以通过安装在车辆或导航装置110的特定位置中的微处理器来实施。微处理器可以实施为一个或两个或更多半导体芯片。频率转换单元140、噪声消除单元141、逆变器145、声音/文本转换单元146和控制器147也可以仅通过一个微处理器或彼此物理地分开的多个微处理器来实施。所述微处理器可以经编程以便执行频率转换单元140、噪声消除单元141、逆变器145、声音/文本转换单元146、控制器147的功能。
图12是根据本发明的实施例安装在车辆中的声音识别设备的框图。
参考图12,车辆100可以包含车辆100中的各种组件和装置118,包含:安装在车辆100中的麦克风131到134、频率转换单元150、频带划分单元160、噪声消除单元161、逆变器165、声音/文本转换单元166、控制器167和存储单元168。
车辆100中的各种组件和装置118可以包含麦克风131和132、导航装置110、锁定装置112、空气调节装置113、照明装置114、声音再现装置115和收音机装置116,所述装置用于车辆100的驾驶或为用户提供便利性,如图12中所说明。
麦克风131到134可以接收驾驶者的或乘客的声音并且可以输出对应于所接收的声音的电信号,如参考图11所描述。输出电信号可以是模拟信号。输出电信号可以被传输到频率转换单元150。输出电信号可以在输出电信号传输至频率转换单元150之前通过放大器放大或通过A/D转换器转换成数字信号。输出电信号可以包含时域中的信号。麦克风131到134可以安装在车辆100的各种位置中,例如车辆100的上框架的内侧、遮阳板121和122、方向把手或导航装置110。
频率转换单元150可以将时域中的信号转换为频域中的信号,如参考图9所描述。频率转换单元150可以使用包含FFT的各种方法将时域中的信号转换成频域中的信号。取决于实施例也可以省略频率转换单元150。频率转换单元150可以通过安装在车辆100中或导航装置110中的特定位置中的微处理器来实施。
频带划分单元160可以使用预定参考值将从麦克风131到134或频率转换单元150传输的信号划分成具有高频成分的信号和具有低频成分的信号。此处,预定参考值可以根据设计者或用户的选择任意地确定。举例来说,预定参考值可以包含4kHz。所划分的具有高频成分的信号和具有低频成分的信号可以被传输到噪声消除单元161。
噪声消除单元161可以包含高频噪声处理单元162、低频噪声处理单元163,和合成单元164。
具有从频带划分单元160输出的高频成分的信号可以被传输到高频噪声处理单元162,并且具有低频成分的信号可以被传输到低频噪声处理单元163。
高频噪声处理单元162可以消除具有高频成分的信号的噪声。高频噪声处理单元162可以使用低分辨率分析算法消除噪声。更详细地说,高频噪声处理单元162可以将具有高频成分的信号划分成相对较大的频带(参见图7的c1到c3),可以仅评估每个频带中的噪声成分(参见图7的c1到c3),并且可以消除具有高频成分的信号的每个频带中的噪声(参见图7的c1到c3)。高频噪声处理单元162可以使用其中用户未发出声音的最初信号从通过麦克风131到134输入的信号中评估噪声并且可以消除通过麦克风131到134输入的信号中的评估过的噪声。最初信号可以由噪声配置,例如,发动机噪声,或者最初信号的主要成分可以是噪声。高频噪声处理单元162可以在预定周期从最初信号中计算平均能级并且可以从通过麦克风131到134输入的信号中消除计算出的平均能级,由此消除噪声。高频噪声处理单元162可以使用频谱减法或威纳滤波器等算法从具有高频成分的信号中消除噪声。所述高频噪声处理单元162消除噪声的信号可以被传输到合成单元164。
低频噪声处理单元163可以消除具有低频成分的信号的噪声。在实施例中,低频噪声处理单元163可以根据高分辨率分析算法消除噪声。低频噪声处理单元163可以将高频成分划分成多个频带(参见图7的c4到c10),因此使用高分辨率分析算法的多个频带中的每一个(参见图7的c4到c10)可以是相对狭窄的并且随后可以消除每个频带中的噪声(参见图7的c4到c10)。
低频噪声处理单元163可以使用所属领域的一般技术人员可以考虑的各种算法从具有低频成分的信号中评估噪声成分,所述算法,例如,MCRA算法、IMCRA算法和最小统计数据算法。低频噪声处理单元163可以评估每个频带中的噪声成分。并且,低频噪声处理单元163也可以使用上述SPP评估噪声成分。
低频噪声处理单元163可以使用获取的评估过的噪声获取评估过的SNR,可以使用评估过的SNR计算增益,可以使用SNR确定用于校正评估过的增益的校正值,并且可以使用所确定的校正值校正评估过的增益。
低频噪声处理单元163可以使用MMSE、RMS误差或CMD等方法评估SNR。并且,低频噪声处理单元163可以获取SPP并且也可以使用所获取的SPP来评估SNR。
低频噪声处理单元163可以使用评估过的SNR获取评估过的增益。低频噪声处理单元163可以使用评估过的SNR和SPP获取评估过的增益。
低频噪声处理单元163可以使用校正值与SNR之间的关系和设定值确定用于校正评估过的增益的校正值。可以给出校正值与SNR之间的关系,如图3到5中所说明。举例来说,校正值可以是在SNR的预定范围中均一的并且可以具有SNR与在不同范围中的线性函数I1、指数函数I2或对数函数I3之间的关系。设定值可用于确定将用于确定校正值的SNR与校正值之间的关系。设定值可以包含指示声音识别设备的设置或性能的值,用于消除噪声的设备10可以应用到所述声音识别设备。
低频噪声处理单元163可以使用所确定的校正值校正和输出上述评估过的增益。随后,低频噪声处理单元163可以通过将校正过的增益应用到具有低频成分的信号获取输出信号并且随后可以将所获取的输出信号传输到合成单元164。校正评估过的增益和应用具有低频成分的信号可以根据公式3和4计算。
合成单元164可以合成从高频噪声处理单元162输出的信号以及从低频噪声处理单元163输出的信号,以便获取合成信号并且可以将合成的信号传输到逆变器165。
逆变器165可以使用IFFT使从噪声消除单元161输出的信号逆变。因此,可以获取噪声消除的声音信号。从逆变器165输出的信号可以通过声音/文本转换单元166被传输到控制器167或直接被传输到控制器167而无需通过声音/文本转换单元166。
声音/文本转换单元166可以使用各种语音到文本技术将声音信号转换成文本信号并且可以将转换过的文本信号传输到控制器167。如果控制器167能够直接使用声音信号生成控制指令,那么也可以省略声音/文本转换单元166。
控制器167可以使用噪声消除的声音信号或文本信号生成对应于用户的声音的控制指令,可以将生成的控制指令传输到车辆100中的各种组件和装置118之中的将受到控制的对应的组件和装置,由此控制将受到控制的组件和装置。
存储单元168可以储存使用控制器167生成用于车辆100中的各种组件和装置118的控制信号所需的各种数据或关于由控制器167生成的控制信号的历史。此外,存储单元168可以储存各种数据或设置。
上述频率转换单元150、频带划分单元160、噪声消除单元161、逆变器165、声音/文本转换单元166和控制器167可以通过安装在车辆100中或导航装置110中的特定位置中的微处理器来实施。
微处理器可以通过一个或两个或更多半导体芯片来实施。频率转换单元150、频带划分单元160、噪声消除单元161、逆变器165、声音/文本转换单元166和控制器167可以仅使用一个微处理器或使用彼此物理地分开的两个或两个以上微处理器实施。
在下文中,将参考图13和图14描述根据本发明的实施例的消除噪声的方法。
在下文中,将描述可以在声音识别设备中使用的消除噪声的方法。然而,消除噪声的方法不是仅通过声音识别设备执行的。消除噪声的方法可以在消除噪声所需的各种设备中使用。并且,如上文所述,以下声音识别设备可以是用于以下项中的声音识别设备:三轮机动车辆或四轮机动车辆;两轮机动车辆,例如,摩托车、电动自行车、施工机械、自行车;能够在轨道上行驶的火车;或能够在水路中导航的船只。然而,本发明的实施例并不限于此。举例来说,蜂窝电话、个人数字助理(personaldigitalassistant)设备、智能电话、平板电报(PC:personalcomputer)、笔记本电脑、导航装置或便携式终端设备也可以是使用稍后将描述的消除噪声的方法的声音识别设备的实例。此外,所属领域的一般技术人员可以考虑的不同类型的装置可以是使用稍后将描述的消除噪声的方法的声音识别设备的实例。
图13是根据本发明的实施例的消除噪声的方法的流程图。
参考图13,首先声音和噪声混合的信号可以通过麦克风输入(S300)。输入信号可以通过放大器放大或通过A/D转换器转换成数字信号。输入信号可以是时域中的信号。在这种情况下,时域中的信号可以转换成频域中的信号(S301)。输入信号到频域中的转换可以使用FFT执行。取决于实施例可以省略输入信号到频域中的信号的转换的操作。
随后,可以从输入信号中评估噪声成分(S302)。当输入信号被划分成多个频带时,噪声成分可以单独地在所划分的多个频带中的每个中评估。
如果噪声成分得到评估,那么可以使用评估过的噪声成分获取或评估SNR(S303)。可以在多个划分过的频带中的每个中获取SNR或评估过的SNR。SNR可以使用MMSE、RMS误差或CMD来评估。并且,SNR可以使用SPP来评估。
如果获取了SNR,那么可以使用SNR评估增益,并且可以计算将应用到增益的校正值(S304)。可以使用MMSE-STSA估计量、MMSE-LSA估计量或OD-LSA估计量执行增益的评估。校正值可以使用已经参考图3到5描述的校正值与SNR之间的关系和设定值来确定(S305)。
校正值与SNR之间的关系可以经设定使得校正值随着SNR的增大而增大。校正值与SNR之间的关系也可以经设定使得当SNR处于预定范围时校正值是均一的。
设定值是指示可选情况的值,并且校正值与SNR之间的关系可以根据设定值变化。改变校正值与SNR之间的关系可以通过改变指示校正值与SNR之间的关系的关系函数执行或通过改变可选校正值的上限值和下限值中的至少一个来执行。此处,指示校正值与SNR之间的关系的关系函数可以具有特定部分中的线性函数、指数函数或对数函数的形状,如图3到5中所说明。
如果获取增益和校正值,那么可以通过将校正值应用到增益来校正增益,并且可以通过将校正过的增益应用到输入信号来获取输出信号(S306)。在实施例中,当校正值是1或接近1的值时,输出信号中噪声消除的信号的比例可以进一步增大,并且当校正值是接近0的值时,最初输入的信号的比例和输出信号中噪声未消除的信号的比例可以进一步增大。
可以使用IFFT使输出信号逆变(S307)。可以使用IFFT获取具有对应于输出信号的声音的信号。取决于校正值,具有获取的声音的信号可以是噪声消除的信号、噪声未消除的信号,或噪声的一部分消除的信号。
图14是根据本发明的实施例的消除噪声的方法的流程图。
参考图14,首先声音和噪声混合的信号可以通过麦克风输入(S310)。声音和噪声混合的输入信号可以通过放大器放大或通过A/D转换器转换成数字信号。
输入信号可以是时域中的信号。在这种情况下,时域中的信号可以转换成频域中的信号(S311)。也可以使用FFT执行输入信号到频域中的信号的转换。取决于实施例可以省略输入信号到频域中的信号的转换的操作。
取决于预定参考值输入信号可以被划分成具有高频成分的信号和具有低频成分的信号(S312)。此处,预定参考值可以是4kHz。然而,本发明的实施例并不限于此。参考值可以根据设计者或用户的选择任意地确定或变化。
具有高频成分的信号的噪声和具有低频成分的信号的噪声可以使用相同方法消除或可以使用不同方法消除。
当具有高频成分的信号的噪声和具有低频成分的信号的噪声是使用不同方法消除时,具有低频成分的信号的噪声(S313)可以通过评估噪声成分(S314)、评估SNR(S315)、获取评估过的增益和校正值(S316),并且对增益进行校正和获取输出信号(S317)来消除。
在实施例中,可以使用高分辨率分析算法消除具有低频成分的信号的噪声。当高分辨率分析算法用于消除具有低频成分的信号的噪声时,可以在通过划分具有低频成分的信号获得的每个频带中评估噪声成分(S314)。
如果对噪声成分进行评估,那么可以使用评估过的噪声成分在每个划分的频带中获取SNR(S315)。可以使用MMSE、RMS误差或CMD并且视需要通过进一步使用SPP来评估SNR。
如果获取了SNR,那么可以使用SNR评估增益,并且可以计算将应用到增益的校正值(S316)。可以使用MMSE-STSA估计量、MMSE-LSA估计量或OD-LSA估计量执行增益的评估。校正值可以使用已经参考图3到5描述的校正值与SNR之间的关系和设定值来确定。
校正值与SNR之间的关系可以如下方式设定:校正值随着SNR的增大而增大。校正值与SNR之间的关系也可以以如下方式设定:当SNR处于预定范围时校正值是均一的。
校正值与SNR之间的关系可以根据设定值变化。改变校正值与SNR之间的关系可以通过改变指示校正值与SNR之间的关系的关系函数执行或通过改变可选校正值的上限值和下限值中的至少一个来执行。指示校正值与SNR之间的关系的关系函数可以具有特定部分中的线性函数、指数函数或对数函数的形状,如图3到5中所说明。
如果获取增益和校正值,那么可以通过将校正值应用到增益来校正增益,并且可以通过将校正过的增益应用到输入信号来获取输出信号(S317)。如上文所述,校正值可以以如下方式设定:当校正值是1或接近1的值时,输出信号中噪声消除的信号的比例可以进一步增大,并且当校正值是接近0的值时,最初输入的信号的比例和输出信号中噪声未消除的信号的比例可以进一步增大。
具有高频成分的信号的噪声(S318)可以通过评估噪声成分(S319)、消除噪声(S320)和获取输出信号(S321)来消除。在实施例中,具有高频成分的信号的噪声可以使用低分辨率分析算法来消除。
当低分辨率分析算法用于评估具有高频成分的信号的噪声时,可以在通过划分具有高频成分的信号获得的每个频带中评估噪声成分(S319)。在实施例中,用于预定周期或从最初信号中计算出的平均能级的最初信号可以被评估为噪声。
随后,可以使用评估过的噪声成分从具有高频成分的信号中消除噪声(S320)。在这种情况下,可以在每个频带中消除噪声。可以使用频谱减法或威纳滤波器执行噪声的消除。因此,可以获取作为具有高频成分的噪声消除的信号的输出信号(S321)。
如果获取具有低频成分的噪声消除的信号和具有高频成分的噪声消除的信号,那么获取的信号可以彼此合成(S323)。合成的信号可以使用包含IFFT的各种逆变方法来逆变(S324)。可以获取具有对应于通过IFFT合成的信号的声音的信号。
上述消除噪声的方法可以使用一个或两个或更多代码实施,并且这些代码可以由设备中的微处理器编程用于消除噪声以便实施消除噪声的方法。并且,用于实施上述消除噪声的方法的代码可以由计算机编码和执行。这些代码可以记录在存储介质中,例如,压缩光盘存存储装置、半导体存储装置,或磁盘存储装置。
如上文所述,在根据本发明的实施例的用于消除噪声的设备和方法、使用所述设备的声音识别设备和配备有所述声音识别设备的车辆中,通过用户说话生成的声音可以更精确地由相对较小量的计算来识别,即使当存在许多噪声时也是如此,并且因此可以改进声音识别性能。
此外,在根据本发明的实施例的用于消除噪声的设备和方法、使用所述设备的声音识别设备和配备有所述声音识别设备的车辆中,用户的声音可以得到清晰地识别,即使当存在许多噪声(例如,发动机噪声)时也是如此,因此车辆内部的组件可以根据用户的意图得到控制并且因此可以改进声音识别设备的可靠性。此外,可以改进用户便利性,并且可以执行车辆的安全驾驶。
虽然已经示出并且描述了本发明的实施例,但是所属领域的技术人员将理解,可以在不脱离公开内容的原理和精神的情况下在这些实施例中做出改变,公开内容的范围由权利要求书及其等效物来界定。

Claims (25)

1.一种用于消除噪声的设备,其包括:
增益获取单元,其使用输入信号的信噪比(SNR)确定增益和所述增益的校正值;以及
增益应用单元,其使用所确定的增益和所确定的校正值获取对应于所述输入信号的输出信号,其中
所述输出信号包含噪声被消除的输入信号和噪声未消除的输入信号,并且
噪声被消除的输入信号的比例和噪声未消除的输入信号的比例是根据所确定的校正值确定的。
2.根据权利要求1所述的设备,其中所述增益获取单元基于所述输入信号的SNR确定所述增益的校正值。
3.根据权利要求2所述的设备,其中所述增益获取单元进一步基于与所述输入信号的SNR和所述校正值之间的关系相关联的设定值来确定所述增益的校正值,并且基于所述设定值改变所述输入信号的SNR与所述校正值之间的关系,其中所述设定值指示声音识别设备的性能。
4.根据权利要求1所述的设备,其中所述校正值以如下方式确定:所述校正值随着所述输入信号的SNR的增大而增大,或者当所述输入信号的SNR小于第一值或大于第二值时所述校正值具有均一的值。
5.根据权利要求1所述的设备,其中所述校正值以如下方式确定:当所述输入信号的SNR增大时所述噪声被消除的输入信号的比例增大,而当所述输入信号的SNR减小时所述噪声未消除的输入信号的比例增大。
6.根据权利要求1所述的设备,其还包括:
噪声成分评估单元,所述噪声成分评估单元使用最小值控制递归平均(MCRA)算法、改进的最小值控制递归平均(IMCRA)算法和最小统计数据算法中的至少一个来评估所述输入信号的噪声。
7.根据权利要求1所述的设备,其还包括:
SNR评估单元,所述SNR评估单元使用最小均方差(MMSE)、均方根(RMS)误差、累积最小距离(CMD)和语音存在概率(SPP)中的至少一个评估所述输入信号的SNR。
8.一种用于消除噪声的设备,其包括:
频带划分单元,其将输入信号划分成具有高频成分的信号和具有低频成分的信号;
高频噪声处理单元,其基于低分辨率分析算法消除具有高频成分的信号的噪声;
低频噪声处理单元,其基于高分辨率分析算法消除具有低频成分的信号的噪声;以及
合成单元,其将通过所述高频噪声处理单元处理的信号和通过所述低频噪声处理单元处理的信号合成到一起。
9.根据权利要求8所述的设备,其中所述低频噪声处理单元使用所述输入信号的SNR确定增益和所述增益的校正值并且通过应用校正过的增益获取输出信号,所述校正过的增益是通过将所确定的校正值应用到所确定的增益获得的,其中所述输出信号中噪声被消除的输入信号的比例和所述输出信号中噪声未消除的输入信号的比例是根据所确定的校正值变化的。
10.根据权利要求8所述的设备,其中所述高频噪声处理单元评估来自所述输入信号的最初信号的噪声并且使用所评估的噪声消除具有高频成分的信号的噪声。
11.一种声音识别设备,其包括:
输入单元,其接收声音信号,在所述声音信号中初始信号和噪声是混合的;
转换单元,其将所述声音信号转换成频域中的信号;
增益获取单元,其使用所述声音信号的信噪比(SNR)确定增益和所述增益的校正值并且获取校正过的增益,所述校正过的增益是通过将所确定的校正值应用到所确定的增益获得的;
增益应用单元,其通过将校正过的增益应用到所述声音信号获取输出信号,其中所述输出信号中噪声被消除的输入信号的比例和所述输出信号中噪声未消除的输入信号的比例是根据所确定的校正值变化的;以及
逆变器,其使所述输出信号逆变。
12.一种声音识别设备,其包括:
输入单元,其接收声音信号,在所述声音信号中初始信号和噪声是混合的;
频带划分单元,其将输入信号划分成具有高频成分的信号和具有低频成分的信号;
高频噪声处理单元,其基于低分辨率分析算法消除具有高频成分的信号的噪声;
低频噪声处理单元,其基于高分辨率分析算法消除具有低频成分的信号的噪声;以及
合成单元,其将通过所述高频噪声处理单元处理的信号和通过所述低频噪声处理单元处理的信号合成到一起。
13.根据权利要求12所述的设备,其中所述高频噪声处理单元评估来自所述输入信号的最初信号的噪声并且使用所评估的噪声消除具有高频成分的信号的噪声。
14.一种车辆,其包括:
输入单元,其接收来自所述车辆的乘客的声音信号,在所述声音信号中声音指令和噪声是混合在一起的;
声音识别单元,其通过以下项识别声音指令,i)将所接收的声音信号转换频域中的信号,ii)使用所述频域中的信号的信噪比(SNR)确定增益和所述增益的校正值,iii)通过应用校正过的增益获取输出信号,所述校正过的增益是通过将所确定的校正值应用到所确定的增益获得的,以及iv)使所述输出信号逆变,其中所述输出信号中噪声被消除的所接收的声音信号的比例和所述输出信号中噪声未消除的所接收的声音信号的比例是基于所确定的校正值变化的;以及
控制器,其基于所识别的声音指令生成控制信号。
15.一种车辆,其包括:
输入单元,其接收来自所述车辆的乘客的声音信号,在所述声音信号中声音指令和噪声是混合在一起的;
频带划分单元,其将所接收的声音信号划分成具有高频成分的信号和具有低频成分的信号;
声音识别单元,其:i)基于低分辨率分析算法消除具有高频成分的信号的噪声,ii)基于高分辨率分析算法消除具有低频成分的信号的噪声,iii)将具有高频成分的噪声被消除的信号与具有低频成分的噪声消除的信号合成到一起,以及iv)基于所合成的信号识别声音指令;以及
控制器,其基于所识别的声音指令生成控制信号。
16.一种消除噪声的方法,其包括如下步骤:
使用输入信号的信噪比(SNR)确定增益和所述增益的校正值;
获取校正过的增益,所述校正过的增益是通过将所确定的校正值应用到所确定的增益获得的;以及
通过将所述校正过的增益应用到所述输入信号获取输出信号,其中所述输出信号中噪声被消除的输入信号的比例和所述输出信号中噪声未消除的输入信号的比例是基于所确定的校正值变化的。
17.根据权利要求16所述的方法,其中确定所述增益的所述校正值的步骤包括:
基于所述输入信号的所述SNR与所述校正值之间的关系确定所述增益的所述校正值。
18.根据权利要求16所述的方法,其中确定所述增益的所述校正值的步骤包括:
进一步基于与所述输入信号的SNR和所述校正值之间的关系相关联的设定值确定所述增益的所述校正值。
19.根据权利要求16所述的方法,其中所述校正值以如下方式确定:所述校正值随着所述输入信号的SNR的增大而增大,或者当所述输入信号的SNR小于第一值或大于第二值时所述校正值具有均一的值。
20.根据权利要求16所述的方法,其中所述校正值以如下方式确定:当所述输入信号的SNR增大时噪声消除的所述输入信号的比例增大,而当所述输入信号的SNR减小时噪声未消除的输入信号的比例增大。
21.根据权利要求16所述的方法,其还包括如下步骤:
使用最小值控制递归平均(MCRA)算法、改进的最小值控制递归平均(IMCRA)算法和最小统计数据算法中的至少一个来评估所述输入信号的噪声。
22.根据权利要求16所述的方法,其还包括如下步骤:
使用最小均方差(MMSE)、均方根(RMS)误差、累积最小距离(CMD)和语音存在概率(SPP)中的至少一个评估所述输入信号的SNR。
23.一种消除噪声的方法,其包括如下步骤:
将输入信号划分成具有高频成分的信号和具有低频成分的信号;
基于低分辨率分析算法消除具有高频成分的信号的噪声;
基于高分辨率分析算法消除具有低频成分的信号的噪声;以及
将具有高频成分的噪声被消除的信号和具有低频成分的噪声被消除的信号合成到一起。
24.根据权利要求23所述的方法,其中消除具有高频成分的信号的噪声的步骤包括:
使用所述输入信号的信噪比(SNR)确定增益和所述增益的校正值;
通过将所确定的校正值应用到所确定的增益获取校正过的增益;以及
通过将校正过的增益应用到所述输入信号获取输出信号,
其中所述输出信号中噪声被消除的输入信号的比例和所述输出信号中噪声未消除的输入信号的比例是基于所确定的校正值发生变化的。
25.根据权利要求23所述的方法,其中消除具有低频成分的信号的噪声步骤包括:
评估来自所述输入信号的最初信号的噪声;以及
使用所述评估过的噪声消除具有高频成分的所述信号的噪声。
CN201410836402.5A 2014-09-11 2014-12-29 消除噪声的设备和方法、声音识别设备和配备其的车辆 Active CN105810203B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020140120256A KR101630155B1 (ko) 2014-09-11 2014-09-11 잡음 제거 장치, 잡음 제거 방법, 잡음 제거 장치를 이용하는 음성 인식 장치 및 음성 인식 장치가 설치된 차량
KR10-2014-0120256 2014-09-11

Publications (2)

Publication Number Publication Date
CN105810203A true CN105810203A (zh) 2016-07-27
CN105810203B CN105810203B (zh) 2020-10-30

Family

ID=55406037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410836402.5A Active CN105810203B (zh) 2014-09-11 2014-12-29 消除噪声的设备和方法、声音识别设备和配备其的车辆

Country Status (4)

Country Link
US (1) US9472204B2 (zh)
KR (1) KR101630155B1 (zh)
CN (1) CN105810203B (zh)
DE (1) DE102014225699A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107240404A (zh) * 2017-06-08 2017-10-10 福建省电力勘测设计院 用于预制舱式变电站的降噪方法
CN112185410A (zh) * 2020-10-21 2021-01-05 北京猿力未来科技有限公司 音频处理方法及装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150042807A1 (en) * 2013-08-12 2015-02-12 Magna Electronics Inc. Head unit with uniform vision processing unit interface
WO2016034915A1 (en) * 2014-09-05 2016-03-10 Intel IP Corporation Audio processing circuit and method for reducing noise in an audio signal
US9413423B1 (en) * 2015-08-18 2016-08-09 Texas Instruments Incorporated SNR calculation in impulsive noise and erasure channels
EP3516653B1 (en) * 2016-10-12 2021-08-11 Huawei Technologies Co., Ltd. Apparatus and method for generating noise estimates
GB2561559A (en) * 2017-04-13 2018-10-24 Detroit Electric Ev Ltd Acoustic environmental system for electrical vehicles
CN111128215B (zh) * 2019-12-24 2022-06-07 声耕智能科技(西安)研究院有限公司 一种单通道实时降噪方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000769A (zh) * 2006-01-13 2007-07-18 三星电子株式会社 便携式记录器中消除噪声的装置和方法
KR20070078171A (ko) * 2006-01-26 2007-07-31 삼성전자주식회사 신호대 잡음비에 의한 억제 정도 조절을 이용한 잡음 제거장치 및 그 방법
KR20080030140A (ko) * 2006-09-29 2008-04-04 한국전자통신연구원 통계적 모델에 기반한 선험적 음성 부재 확률 추정 방법
US20080219472A1 (en) * 2007-03-07 2008-09-11 Harprit Singh Chhatwal Noise suppressor
JP2010185974A (ja) * 2009-02-10 2010-08-26 Panasonic Corp 雑音抑圧装置および雑音抑圧方法
CN102572236A (zh) * 2010-11-24 2012-07-11 三星电子株式会社 消除音频噪声的方法以及使用该方法的图像捕捉设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004228937A (ja) 2003-01-23 2004-08-12 Pioneer Electronic Corp 音響補正システムおよび音響補正プログラムおよび音響補正方法および音響補正装置
KR100724066B1 (ko) 2005-11-18 2007-06-07 진정윤 능동식 노이즈 제거장치
KR100755182B1 (ko) 2007-03-19 2007-09-03 김유장 코일을 사용한 자동차 노이즈 제거, 진동완화 및 성능 개선장치
KR20120060513A (ko) 2010-12-02 2012-06-12 현대자동차주식회사 차량의 맞춤형 능동소음제어장치 및 그 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000769A (zh) * 2006-01-13 2007-07-18 三星电子株式会社 便携式记录器中消除噪声的装置和方法
KR20070078171A (ko) * 2006-01-26 2007-07-31 삼성전자주식회사 신호대 잡음비에 의한 억제 정도 조절을 이용한 잡음 제거장치 및 그 방법
KR20080030140A (ko) * 2006-09-29 2008-04-04 한국전자통신연구원 통계적 모델에 기반한 선험적 음성 부재 확률 추정 방법
US20080219472A1 (en) * 2007-03-07 2008-09-11 Harprit Singh Chhatwal Noise suppressor
JP2010185974A (ja) * 2009-02-10 2010-08-26 Panasonic Corp 雑音抑圧装置および雑音抑圧方法
CN102572236A (zh) * 2010-11-24 2012-07-11 三星电子株式会社 消除音频噪声的方法以及使用该方法的图像捕捉设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107240404A (zh) * 2017-06-08 2017-10-10 福建省电力勘测设计院 用于预制舱式变电站的降噪方法
CN112185410A (zh) * 2020-10-21 2021-01-05 北京猿力未来科技有限公司 音频处理方法及装置
CN112185410B (zh) * 2020-10-21 2024-04-30 北京猿力未来科技有限公司 音频处理方法及装置

Also Published As

Publication number Publication date
KR20160030722A (ko) 2016-03-21
US9472204B2 (en) 2016-10-18
DE102014225699A1 (de) 2016-03-17
CN105810203B (zh) 2020-10-30
KR101630155B1 (ko) 2016-06-15
US20160078856A1 (en) 2016-03-17

Similar Documents

Publication Publication Date Title
CN105810203A (zh) 消除噪声的设备和方法、声音识别设备和配备其的车辆
US10224053B2 (en) Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering
CN106409280B (zh) 用于改进语音识别性能的有源噪声消除设备和方法
CN110691299B (zh) 音频处理系统、方法、装置、设备及存储介质
US8812312B2 (en) System, method and program for speech processing
CN107097718A (zh) 主动声音合成装置及交通工具
CN103544949A (zh) 发动机声音合成
CN108538280B (zh) 一种汽车主动降噪系统、方法及移动终端
US20170213550A1 (en) Adaptive dual collaborative kalman filtering for vehicular audio enhancement
CN105810210B (zh) 声音信号处理装置及其方法与配备有该装置的车辆
CN206856594U (zh) 主动声音合成装置及交通工具
CN113091875A (zh) 一种车内异响检测与评价系统及检测方法
CN102906811B (zh) 用于调节包括扬声器和麦克风的语音识别系统的方法及语音识别系统
CN111862945A (zh) 一种语音识别方法、装置、电子设备及存储介质
CN112151058B (zh) 一种声音信号的处理方法、装置及设备
US11455338B2 (en) Question answering device, question answering method, and program
CN107889026A (zh) 车辆声音系统及交通工具
CN107757537B (zh) 一种车载发动机的声音控制方法及装置
JP2008070877A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
CN117612528A (zh) 音频信号处理方法、装置、设备、车辆以及存储介质
JP2018077504A (ja) エンジン音出力装置及びエンジン音出力方法
US20180025740A1 (en) Optimization of speech input for multiple speech agents used in a common application environment
CN117746877A (zh) 语音降噪方法及车辆
CN117292669A (zh) 一种车辆降噪方法及系统
Whittington et al. Low-cost hardware speech enhancement for improved speech recognition in automotive environments

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant