CN105306648A - 具有学习能力的基于车辆状态的免提电话自适应降噪 - Google Patents
具有学习能力的基于车辆状态的免提电话自适应降噪 Download PDFInfo
- Publication number
- CN105306648A CN105306648A CN201510416175.5A CN201510416175A CN105306648A CN 105306648 A CN105306648 A CN 105306648A CN 201510416175 A CN201510416175 A CN 201510416175A CN 105306648 A CN105306648 A CN 105306648A
- Authority
- CN
- China
- Prior art keywords
- information
- prefilter
- vehicle
- noise reduction
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 136
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 9
- 238000011045 prefiltration Methods 0.000 claims abstract description 128
- 238000000034 method Methods 0.000 claims abstract description 79
- 238000012549 training Methods 0.000 claims description 34
- 238000004891 communication Methods 0.000 claims description 33
- 238000005259 measurement Methods 0.000 claims description 25
- 230000015654 memory Effects 0.000 claims description 21
- 230000000712 assembly Effects 0.000 claims description 7
- 238000000429 assembly Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 5
- 230000001133 acceleration Effects 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 abstract description 48
- 238000004458 analytical method Methods 0.000 abstract description 6
- 230000008569 process Effects 0.000 description 37
- 230000006870 function Effects 0.000 description 9
- 238000003860 storage Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 230000035939 shock Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 235000021170 buffet Nutrition 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000004378 air conditioning Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 244000287680 Garcinia dulcis Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02085—Periodic noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
- H04M1/6041—Portable telephones adapted for handsfree use
- H04M1/6075—Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明总体上涉及一种用于实现基于车辆状态的自适应免提降噪特征的系统、装置和方法。降噪工具被提供用于对声音输入自适应地应用降噪策略,其使用反馈语音质量测量和机器学习以开发未来的降噪策略,其中降噪策略包括分析预测导致舱室噪声的车辆操作状态信息和外部信息,和基于分析选择降噪预滤器选项。
Description
技术领域
本发明总体上涉及一种用于实现基于车辆状态的自适应免提降噪特征的系统、装置和方法。这个降噪特征可以被实施作为车辆免提电话系统的一部分,该免提电话系统允许用户连接他们的通信设备(例如,智能电话)到车辆,以进行电话交谈。
背景技术
为了安全和方便的原因,免提音频系统被包括在车辆的舱室内已经变得流行起来。这种免提音频系统可以在车辆的舱室内实施以允许用户(例如,驾驶员或乘客)发出用于控制某些车辆组件的口头命令,或通过通信网络连接与其他人通信。
为了取得效果,重要的是用户的语音从用于接收用户语音的免提音频系统的麦克风组件可接收到的其它噪声中是清楚地可检测的。
发明内容
本申请由所附权利要求限定。说明书概述了实施例的多个方面且不应该用来限制权利要求。其他实施方式可以根据本文所描绘的技术进行预期,如根据下面的附图和详细的描述将是显而易见的那样,并且这样的实施方式旨在包含在本申请的范围内。
示例性实施例提供一种降噪工具,其配置为提供降噪特征给车辆的舱室内的麦克风接收的声音输入,以便更好地从声音输入中检测用户的语音。更具体地,降噪工具可以应用特定的降噪预滤器,以降低在声音输入通过麦克风接收时已知运行或存在的车辆组件和/或其它外部因素引起的声音输入中的噪声。进一步地,降噪工具配置为基于在先前实施中的预滤器的降噪性能自适应地调节预滤器的应用。结果就是,降噪工具配置为提供基于一个或多个预滤器的应用来提高接收的声音输入的降噪的自适应学习特征。
根据一些实施例,提供一种用于在声音输入上自适应地实现降噪的装置。该装置可以包括一种装置,其包含:存储器,其配置为基于先前的降噪策略存储一个或多个降噪预滤器和反馈数据;和与存储器通信的处理器。处理器可以配置为:接收声音输入;接收训练输入数据;接收反馈数据;基于训练输入数据和反馈数据选择一个或多个降噪预滤器,以及应用选择的降噪预滤器于声音输入。
根据一些实施例,提供一种用于在声音输入上自适应地实现降噪的方法。方法可以包括:基于先前的降噪策略在存储器中存储一个或多个降噪预滤器和反馈数据;接收声音输入;接收训练输入数据;接收反馈数据;基于训练输入数据和反馈数据选择一个或多个降噪预滤器,以及应用选择的降噪预滤器于声音输入。
附图说明
为了更好地理解本发明,可以参照在下面的附图中所示的实施例。在附图中的组件不一定是按比例的且相关元件可以被省略以便强调和清楚地说明本文描述的新颖特征。此外,系统组件可以不同地布置,如本领域已知的。在附图中,相同的附图标记表示贯穿不同视图的相应的部分,除非另有说明。
图1说明了根据一些实施例描述用于实现降噪的过程的示例性框图;
图2说明了根据一些实施例用于获得信息的示例性系统;
图3说明了描述根据一些实施例的过程的示例性流程图;以及
图4说明了根据一些实施例用于可以是车辆系统的一部分的计算系统的示例性框图。
具体实施方式
尽管本发明可以以各种形式来体现,但在附图中显示了并且将在下文中描绘一些示例性和非限制性实施例,同时要理解的是,本公开应被认为是本发明的例证并且不旨在限制本发明到所示的具体实施例。然而,不是所有的在本发明中所描述的描绘组件是需要的,并且一些实施方式可以包括与本发明中清楚地描述的那些相比额外的、不同的或更少的组件。可以做出组件的布置和类型上的变化,而不脱离本申请所列出的权利要求的精神或范围。
实施为车辆的全部车辆系统的一部分的免提音频系统可以包含语音命令系统,其中语音命令系统配置为接收用户语音命令输入,从用户语音命令输入中识别命令,和基于从用户语音命令输入中识别的命令控制车辆组件或特征。实施为车辆的全部车辆系统的一部分的免提音频系统还可以包含免提电话系统,其中免提电话系统配置为与通信设备(例如,连接到免提电话组件的智能电话,或是车辆一部分的通讯组件)连接,以便通过车辆舱室内的和/或在通信设备上的麦克风接收用户语音输入,传递用户语音输入到另一通信设备,从其它通信设备中接收外部用户语音输入,和通过包括在车辆舱室内的一个或多个扬声器输出外部用户语音输入,以使用户在车辆内听见。
语音命令系统和免提电话系统仅仅是在可以利用本文描述的降噪特征的车辆内实施的免提音频系统的两个示例。然而,为了简化本文提供的描述,免提音频系统将依据免提电话系统来描述。即使如此,但应该注意的是,其它类型的免提音频系统也可预期包含在本文中描述的创新的范围内。
免提电话系统可以操作以允许车辆内的用户连接电话(例如,能够无线地或有线地连接到车辆的免提电话系统的智能电话)到免提电话系统和通过电信网络拨打电话到另一电话。免提电话系统到电话的连接可以根据任何一个或多个标准,其包括例如,蓝牙、近场通信(NFC)、WiFi(无线保真),或其它可以使用的通信网络。除了描述的无线连接协议,免提电话系统也可以通过有线连接与电话连接。
连接电话到车辆的免提电话系统是有利的,因为它允许用户利用车辆舱室内的麦克风拾取用户语音输入,并且也利用车辆舱室内的扬声器输出从呼叫通信的另一端接收的语音输入。以这种方式,用户不需要实际地保持电话至用户的嘴和耳朵,这是由于车辆的麦克风和扬声器取代了电话的麦克风和扬声器。这提供用户在驾驶车辆过程中或作为车内乘客时不会因为保持和操作电话而分散注意力的优点。应当注意的是,尽管本发明描述电话为连接到车辆的免提电话系统,但是这提供用于示例性的目的。使免提电话系统连接到能够通过通信网络通信的其他类型的通信设备在本文描述的创新的范围内。例如,便携式计算机、平板计算机设备、个人数字助理(PDA)、或其他能够通过通信网络与另一通信设备通信的其他计算设备可以使用。
尽管免提电话系统提供从操作通信设备中腾出用户的手的利益,但是免提电话系统仍然从事于努力实现具有最小的噪声干扰的高品质的电话交谈。这是因为车辆舱室——从其中免提电话系统的麦克风拾取用户语音输入——可能是噪声环境。例如,车辆舱室可以渗入起源于在电话交谈过程中正在操作的各种车辆组件的噪声。此外,其他外部因素也可以导致渗入车辆舱室的噪声。因此,通过舱室麦克风拾取的声音输入可以包含用户语音、以及来自不同来源的噪声。因此目标为,识别在车辆舱室内通过舱室麦克风拾取的噪声源,识别对应于识别的噪声源的降噪预滤器,和应用噪声预滤器到通过舱室麦克风拾取的声音输入,以便至少部分地降低在声音输入中可以干扰用户实际语音的噪声。
为了实现用于车辆的免提音频系统的降噪的目标,降噪工具可以被利用。降噪工具可以是程序、应用程序、和/或在包含车辆操作系统的一个或多个组件上结合的软件和硬件的某些组合。用于降噪工具和运行降噪工具的车辆系统的组件的进一步描述在下面更详细地进行。
图1公开了框图100,其根据一些实施例描述了通过降噪工具接收的信息,通过降噪工具分析的信息,通过降噪工具产生的信息,和操作框。框图100被理解为在一个或多个车辆组件——其包含车辆系统,且更具体地包含本文描述的免提电话系统——上运行的降噪工具的实施方式。免提电话系统可以是硬件、软件和车辆组件的组合,其允许降噪工具完成至少部分地降低在通过车辆舱室麦克风拾取的声音输入中的噪声,其中噪声被识别为是通过已知的车辆组件和/或已知的外部因素引起。免提电话系统的示例性实施例可以包括降噪工具,配置为执行存储在对应于降噪工具的存储器上的指令的处理器,存储对应于降噪工具的指令的存储器,用于从车辆舱室中拾取语音输入的一个或多个麦克风,用于与外部服务器通信的接口,以及用于与用户电话通信的接口。所描述的免提电话系统仅仅提供用于示例性的目的,这是由于,在其他实施例中免提电话系统包括更少的、或更多数量的组件也在本创新的范围内。
如上面所描述的,车辆舱室可以被由各种车辆组件引起的噪声渗入。例如,许多车辆组件涉及引起最终渗入车辆舱室的声音的活动部件。其它渗入车辆舱室的噪声可以通过外部因素引起,比如风,在道路表面上滚动的轮胎,或在车辆舱室中的其他乘客。在任何情况下,这种渗入车辆舱室的声音可以随后导致在通过免提电话系统实施的电话交谈的过程中在通过车辆舱室麦克风拾取的声音输入中的背景噪声。结果就是,降噪工具期望准确地至少部分地降低通过已知的车辆组件的操作引起的噪声,以及通过已知的外部因素引起的噪声,以便更清楚地理解在声音输入中的用户的语音。
关于通过特定车辆组件的操作所引起的噪音,可以产生大致描述通过舱室麦克风接收的归因于特定车辆组件的操作的声音的声音特性。基于这个声音通信,相应的预滤器可以被开发,其用来至少部分地降低通过舱室麦克风拾取的归因于特定车辆组件的噪声。类似的预滤器可以针对一个或多个车辆组件开发,该车辆组件已知导致声音进入乘客舱室中,该声音可以通过舱室麦克风随后拾取作为对用户语音的噪声。预滤器的集合可以存储为在免提电话系统的存储器单元上的预滤器数据库的一部分。
结果就是,在图1中框101描述了通过检测一个或多个车辆组件的操作状态的降噪工具完成的检查。车辆操作状态信息101可以识别车辆组件是否打开或关闭,或在各种可用于车辆组件的可用状态中的一个中操作。
例如,转向信号组件的操作状态可以识别转向信号组件是在打开或关闭状态中的一个,其中,来自转向信号的嘀嗒噪声可以导致舱室噪声。
此外,发动机的操作状态可以识别当前发动机速度(例如,以每分钟转动次数测量),其中发动机已知在不同的发动机速度下在车辆的舱室内制造特定的已知声音。
此外,节气门位置的操作状态可以与当前发动机速度或车辆速度相互关联,其中发动机已知在基于节气门位置可以识别的不同的发动机速度和/或车辆速度下在车辆舱室内制造特定已知的声音。
此外,暖通空调(HVAC)系统的操作状态可以识别加热或空调是否被激活,其中在加热操作下操作的HVAC系统可以已知在车辆舱室内产生特定的已知声音,和在空调操作下操作的HVAC系统可以已知在车辆舱室内产生特定的已知声音。
此外,HVAC风机的操纵状态可以识别HVAC风机正在操作的速度,其中HVAC已知在不同风机操纵速度下在车辆舱室内具有不同的声音。
此外,刮水器组件的操作状态可以识别刮水器组件正在操作的速度,其中刮水器组件已知在不同刮水器操作速度下在车辆舱室内具有特定声音。
此外,车辆音频系统的操作状态可以识别通过车辆音频系统正在输出的声音输出,以便预滤器可以产生并应用以至少部分地降低在车辆舱室内通过车辆音频系统引起的声音输出。更具体地说,车辆音频系统的操作状态也可以识别车辆音频系统正在工作的音量,其中车辆音响系统已知在不同的音量下在车辆舱室内产生特定频率的特定声音。结果就是,预滤器可以产生并应用,以至少部分地降低在车辆舱室内通过车辆音频系统引起的声音输出,并且在一些实施例中,额外地补偿车辆音频系统输出的已知音量。
此外,车窗的操作状态可以识别用于车辆的一个或多个车窗的车窗打开位置,其中车窗打开位置已知在车辆舱室内产生特定的声音。
此外,主轴加速度计(spindleaccelerometer)的操作状态可以识别通过主轴加速度计的主轴检测到的加速度,其中主轴的加速度可以识别车辆的道路冲击的存在,其中道路冲击已知引起特定声音渗入到车辆舱室内。
此外,舱室声学的操作状态可以识别可以影响舱室噪声的车辆舱室的特性。例如,操作状态可以识别不同的舱室声学特性,比如乘员的数量,内饰表面材料等,其已知以特定方式和实例影响舱室噪声。
此外,操作状态可以识别用于在机器学习阶段103期间可以被参考的舱室麦克风的位置。例如,舱室麦克风的位置可以影响舱室麦克风如何拾取不同的声音(例如,用户的语音输入和舱室噪声),这是由于不同的位置可以更靠近某些声源,同时进一步远离其他声源。结果就是,识别舱室麦克风位置的操作状态可以对应于不同的声源将如何通过舱室麦克风拾取的已知影响。
此外,操作状态可以识别用于在机器学习阶段103期间可以被参考的车辆的驾驶员和/或乘客的座椅位置。例如,座椅位置可以影响用户到舱室麦克风的距离,其中用户负责产生对舱室麦克风的声音输入中的用户语音。因此,通过改变用户的座椅位置,用户的语音输入可以被影响,其进而影响包括舱室噪声的声音特性的整体声音输入。结果就是,通过操作状态识别的座椅位置可以对应于舱室麦克风如何能够拾取用户的语音输入和/或舱室噪声的已知影响。
本文描述的车辆操作状态信息被提供仅仅用于示例性的目的,这是由于更多、或更少数量的车辆操作状态信息可以用于降噪工具。
进一步地,降噪工具可以接收外部信息102,其识别可以渗入车辆舱室的噪声的潜在源。外部信息102可以包括从全球定位系统(GPS)中获得的车辆行驶路线的地理信息,其中该地理信息可以包括可以导致车辆舱室中的噪声的地理条件。外部信息102也可以包括车辆行驶的道路的道路表面信息。道路表面信息可以识别道路表面的类型,比如砂砾、高速公路、沥青、混凝土、泥土、平滑、或其他可识别的道路表面类型,其中不同的道路表面的类型已知导致车辆舱室中不同的噪声,这归因于轮胎对道路的接触。此外,外部信息102可以包括识别可以导致车辆舱室中的噪声的气象条件(例如,雨、雪、冰雹、雷电、闪电、或可以导致车辆舱室中的噪声的其它气象条件)的气象信息。
在一些实施例中,获得的外部信息102可以从如图2中所示的外部信息服务器203中被接收。图2说明了包含车辆202(例如,本文所描述的车辆)、网络201、和信息服务器203的示例性网络系统200。信息服务器203可以代表一个或多个存储本文所描述的一个或多个外部信息102的外部服务器。降噪工具可以在车辆202上运行,以便降噪工具可以控制车辆系统的通信接口以通过网络201与信息服务器203通信。降噪工具可以控制通过网络201传递到信息服务器203的对外部信息102的请求。作为响应,信息服务器203可以接收请求和通过网络201传递一个或多个所请求的外部信息102回到车辆202,以通过车辆202的通信接口接收。一旦外部信息102被接收并存储在车辆系统的存储单元(即,存储器)中,则降噪工具可以访问如图1所示的外部信息102。
本文所描述的外部信息102被提供仅仅用于示例性的目的,更多或更少数量的外部信息选项可以用于降噪工具。
结果就是,车辆操作状态信息102可以通过降噪工具接收,降噪工具识别一个或多个可以操作并可以导致车辆舱室中的噪声的车辆组件的操作状态。降噪工具也可以接收识别一个或多个可以导致车辆舱室中的噪声的外部信息的外部信息102。降噪工具也可以接收语音质量测量信息。同时,车辆操作状态信息101和外部信息102可以包含用于训练下面所描述的机器学习的训练输入,以便在103处开发预滤器的选择策略。训练输入可以是识别被预测为导致舱室噪声的车辆组件或其它来源的信息。
在接收车辆操作状态信息101,和接收外部信息102之后,降噪工具可以在103处应用预滤器的选择策略。预滤器的选择策略可以是机器学习训练操作的结果,机器学习训练操作是鉴于根据先前识别的训练输入的预滤器组合的先前应用并基于先前获得的语音质量性能来开发的用于选择预滤器的策略。因此,机器学习训练可以是基于一个或多个过去车辆状态信息、过去麦克风声音信息、过去语音质量性能测量数据、或先前接收的外部信息的组合的分析。机器学习过程本身可以根据已知的技术,比如决策树学习、群集、神经网络、或其它类似地可应用的机器学习技术。
最初,机器学习训练可以在离线训练时期的过程中在外部计算设备(即,不是车辆上的车载计算系统的一部分)上被实施,其中所得到的预滤器选择策略可以预先加载到车辆的计算系统上作为如通过在103处的预滤器选择策略所示的降噪工具的一部分。初始预滤器选择策略的加载之后,机器学习的随后的实例可以通过在车辆上运行的降噪工具在103处实施,以开发更新的预滤器选择策略。
在103处应用的预滤器选择策略被实施,以便确定来自104处的预滤器选项的数据库中的哪个预滤器将被应用到通过舱室麦克风接收的声音输入105。例如,基于车辆操作状态信息101和接收的外部信息102应用所有对应于操作的车辆组件的预滤器可能不会导致通过舱室麦克风接收的声音输入的最清晰的降噪。在一些实施例中,并非全部基于车辆操作状态信息101和/或外部信息102预测的舱室噪声源候选相对应的预滤器被应用,以便实现包括用户语音和舱室噪音的声音输入的更好降噪。基于在机器学习过程期间学习的结果,可以做出将哪个预滤器应用到声音输入以便实现更清楚的用户语音和对来自声音输入的舱室噪声的更好降低的这样的决定。
例如,机器学习可以通过降噪工具配置,以基于接收的训练输入(例如,车辆操作状态信息101和接收的外部信息102)分析所选择的预滤器选项的过去应用的性能。性能分析可以基于语音质量性能测量,该测量针对所得到的已经应用选择的降噪预滤器的声音输入而产生。用于语音质量性能测量的产生的进一步描述参照框107在下面被提供。
如前文所描述的,用于开发初始预滤器选择策略的初始的机器学习可以在机器学习在外部计算系统上训练的时期相应的离线训练时期期间发生。例如,离线学习可以在计算设备上实现,比如在个人计算机(PC),服务器(例如,图2中所示的信息服务器203),或能够接收过去车辆状态数据、麦克风声音数据和降噪性能数据的其它计算设备上。然而,在初始预滤器选择策略在车辆的计算系统上的预加载之后,在车辆的计算系统上运行的降噪工具可以在操作车辆的过程中实施持续的机器学习训练过程。例如,图1说明了103处通过降噪工具实施的随后的机器学习。开发提高的预滤器选择策略的持续的机器学习可以基于反馈信息,该反馈信息包括鉴于先前执行的预滤器选择策略、先前选择的预滤器和导致预滤器被选择的对应的训练输入的语音质量性能测量。
结果就是,通过分析语音质量性能测量,降噪工具可以学习如何根据从训练输入中所确定的预测的舱室噪声源来执行某些预滤器的应用。结果是,下面机器学习可以基于相同或不同的接收的训练输入来学习应用不同的预滤器选项。通过在103处的机器学习实施的学习行为可以根据机器学习技术进行,比如决策树、群集、神经网络、或者其它类似地可应用的机器学习技术。
在103处的机器学习过程将依靠学习的智力和接收的训练输入来识别和选择应用于来自舱室麦克风的声音输入105的一个或多个预滤器。
例如,瞬时去除预滤器1可以被选择,用于去除来自声音输入105的与道路冲击相对应的舱室噪声。由于道路冲击的舱室噪声可以是道路与轮胎的冲击声音、或由道路冲击引起的来自车辆悬挂系统的其他部分的声音的结果。瞬时去除预滤器1可以对应于在101处识别的特定道路冲击噪声。例如,从主轴加速度计中获得的操作状态信息可以识别101处特定类型的道路冲击,以便对应于在101处识别的特定类型的道路冲击的瞬时去除预滤器1从104处的预滤器的选项中被选择。
可以被选择用于去除舱室噪声的另一预滤器选项是频率加权的降噪(NR)预滤器2。频率加权的NR预滤器2提供着重在声音输入105内的特定频率区域的降噪能力。结果是来自101的车辆操作状态信息可以帮助确定最适合于从声音输入105中去噪的频率区域。例如,在低速度下的风噪声不大可能是显著的舱室噪声因素。因此,重点可能不在较高频率区域(即,较高的频率区域对应于在高速度下通过风引起的舱室噪声),而是频率加权的NR预滤器2可以在用于去噪的较低频率区域上。
可以被选择用于去除舱室噪声的另一预滤器选项是发动机谐振预滤器3。发动机谐振预滤器3可被创建以至少部分地降低如从101中识别的车辆操作状态信息中识别的车辆发动机的旋转的实际操作导致的舱室噪声。例如,发动机谐振预滤器3可以是基于从用于车辆发动机的车辆操作状态中识别的发动机转速值的自适应陷波滤波器。发动机转速值可以用来创建陷波滤波器类型的预滤器,其降低车辆舱室内发动机谐振噪声。发动机谐振预滤器可以鉴于发动机转速值创建,以便发动机谐振预滤器至少部分地从声音输入105中降低以识别的发动机转速值操作的发动机导致的舱室噪声。
可以被选择用于去除舱室噪声的另一预滤器的选项是道路噪声预滤器4。道路噪声预滤器4可被创建以至少部分地降低识别的道路噪声,该识别的道路噪声可以是如从101处识别的车辆操作状态信息中识别的舱室噪声的一部分。例如,道路噪声预滤器4可以使用来自主轴加速度计的主轴振动信息作为基准信号,以使用最小均方(LMS)方法——其中主轴输入是基准信号——去除来自声音输入10的道路噪声。
可以被选择用于去除舱室噪声的预滤器的另一选项是风抖振(非静止的风噪声)预滤器5。风抖振预滤器5可以被创建以至少部分地降低识别的风噪声,该风噪声可以是如从101处识别的车辆操作状态信息中识别的舱室噪声的一部分。例如,HVAC模式或HVAC风机速度操作状态信息可以识别潜在的舱室噪声。在这种情况下,风抖振预滤器5的创建可以通过HVAC模式和/或正在操作的HVAC风机速度被触发,并且进一步风抖振预滤器5可以被创建以至少部分地降低车辆舱室内的风噪声,其预测归因于风抖振。此外,在一个或多个下降的位置中的一个或多个车窗的识别也可以触发风抖振预滤器5的创建。在这种情况下,风抖振预滤器5的创建可以用来从声音输入105中至少部分地降低舱室噪声,该舱室噪声预测为由于一个或多个车窗处于下降位置通过风斗振而在车辆舱室内产生。
可以被选择用于去除舱室噪声的另一预滤器的选项是风噪声预滤器6。风噪声预滤器6可以被创建以至少部分地降低风噪声,该风噪声可以是如从101处识别的车辆操作状态信息中识别的舱室噪声的一部分。例如,风噪声预滤器可以是基于特定车辆的风噪声谱创建的维纳滤波器。降噪频谱可以基于车辆速度映射,以便选择用于去除舱室噪声的风噪声预滤器可以对应于在从101处的车辆操作状态信息识别的特定速度下通过风引起的预测的舱室噪声。结果是,风噪声预滤器6用来基于来自101的车辆操作状态信息至少部分地降低来自声音输入105的预测的风噪声类型的舱室噪声。
可以被选择用于去除舱室噪声的另一预滤器的选项是HVAC噪声预滤器7。HVAC噪声预滤器7可以被创建以至少部分地降低识别的稳定气流噪声,其可以是如从101处识别的车辆操作状态信息中识别的舱室噪声的一部分。例如,HVAC预滤器7可以是维纳滤波器,其中用于预测的HVAC噪声舱室噪声的频谱可以基于HVAC模式、HVAC风机速度设置来映射。以这种方式,HVAC噪声预滤器7可以基于如在101处识别的HVAC模式、或HVAC风机速度来对应于特定的预测的HVAC舱室噪声。HVAC模式或HVAC风机转速操作状态信息可以识别潜在的HVAC类型舱室噪声。在这种情况下,HVAC噪声预滤器7的创建可以通过正在操作的HVAC模式和/或HVAC风机转速的识别被触发,并且进一步HVAC噪声预滤器7可以被创建以至少部分地从声音输入105中降低预测的车辆舱室内的HVAC噪声。
可以被选择用于去除舱室噪声的另一预滤器的选项是车辆音频去除预滤器8。车辆音频去除预滤器8可以被创建以至少部分地降低从车辆的车辆音频系统中输出到车辆舱室中的识别的声音。车辆音频系统输出声音可以在从101处识别的车辆操作状态信息中识别,以便车辆音频去除预滤器8用来从来自舱室麦克风的声音输入105中减去识别的车辆音频输出声音。结果是,车辆音频去除预滤器8用来基于来自101的车辆操作状态信息至少部分地降低来自声音输入105的预测的车辆音频系统输出类型的舱室噪声。
本文所描述的预滤器被提供仅仅用于示例性的目的,因为更多或更少数量的预滤器选项可用于通过降噪工具选择并应用到声音输入105。
然后,通过在103处的预滤器的选择策略选择的一个或多个预滤器可以作为104处的预滤器选项应用到从舱室麦克风中接收的声音输入105。
在106处,在应用104处的一个或多个预滤器选项之后,传统的降噪滤波器(例如,维纳滤波器)可以额外地应用到声音输入105。应当注意的是,在106处的传统的降噪滤波器的应用紧跟在104处的一个或多个预滤器的应用是可选的。换句话说,在一些实施例中,在104处应用一个或多个预滤器之后,传统的降噪滤波器可以不应用到声音输入。
降噪工具可以然后在框107处在所得到的声音输入105'上实施语音质量性能测量,其中,所得到的声音输入105'对应于在104处的一个或多个预滤器选项的应用和可选地在106处的传统降噪滤波器的应用之后的声音输入105。
在一些实施例中,语音质量性能测量可以通过与在车辆上运行的降噪工具通信的外部服务器产生。外部服务器可以类似于图2中所示的信息服务器203。例如,降噪工具可以引起车辆的接口来传递所得到的声音输入105'到外部服务器以及产生语音质量性能测量的请求。外部服务器可以然后接收语音质量性能测量和请求,做出是否响应于接收请求而产生语音质量性能测量的决定,基于决定产生语音质量性能测量,并且如果语音质量性能测量被产生,则通过车辆上的接口传递语音质量性能测量回到降噪工具。如果做出决定是不产生语音质量性能测量,则外部服务器可以传递消息回到降噪工具,该消息识别语音质量性能测量没有产生的原因(例如,没有足够的信息来产生语音质量性能测量)。语音质量性能测量的产生可以是处理器密集型分析。因此,通过依靠外部服务器来产生语音质量性能测量,降噪工具可以保存处理带宽或保留车辆的一个或多个处理组件。进一步地,外部服务器对于产生语音质量性能测量来说可能配备更好,这归因于外部服务器包括具有比在车辆上可用的处理器更大处理能力的处理器。因为具有更大的处理能力的处理器可能更昂贵,所以降噪工具可能已配置为与外部服务器通信以便产生用于所得到的声音输入105'的语音质量性能测量,以补偿车辆上具有较低处理能力的处理器(即,更便宜的)。
所产生的语音质量性能测量可以测量在所得到的声音输入105'内的用户的语音分量的语音质量。例如,语音质量性能测量可以是所得到的声音输入105'的MOS(平均评价得分)(例如,ETSI(欧洲电信标准协会)EG202396-3或ETSITS103106)值,其中的MOS值可以从1(最低/最差)到5(最高/最好)。此外或可选择地,语音质量性能测量可以是根据非侵入式模型产生的信噪比(SNR)的测量,其不需要用于计算的原始语音信号。例如,降噪工具可以产生SNR测量,其中语音活性检测器(VAD)确定语音何时存在于所得到的声音输入105'中和计算语音的能量含量。在语音不存在的片段,噪声的能量被确定以提供SNR估计。此外或可选择地,其他非侵入式语音质量性能测量可以包括如下技术,比如ITU(国际电信联盟)-TRec.P.561(2004)和ITU-TRec.P.562,其用来量化现场呼叫业务的实际特性和估计通话清晰指数(ITU-TP.562)和E-模型(ITU-TRec.G.107(1998))以评估语音质量。其它非侵入式技术可以使用先验信息来训练机器学习阶段(例如,高斯混合模型,神经网络等)以量化语音的质量。对于这些模型,一组已知的失真以几个参数为特征,并且在这组失真和感知的语音质量之间的关系被推导。一旦训练已完成,在103处的机器学习过程就可以建立这些关系。
结果是,其它类型的算法或过程可以通过降噪模型来实施以产生所得到的声音输入105'的语音质量性能测量,该测量从所得到的声音输入105’内识别用户的语音的质量。
在一些实施例中,基线语音质量性能测量可以在安装免提电话系统的车辆的制造之前从制定的测试中开发。基线语音质量性能测试可以识别在免提电话系统中接收使用的声音输入的基线语音质量。基线语音质量性能测量可以存储在存储器上,以便降噪工具可以参考它,该存储器是车辆系统的一部分。结果是,语音质量性能测量可以根据基线语音质量性能测量在107处产生。例如,比基线语音质量性能测量更好的在107处产生的语音质量性能测量可以通过降噪工具被认为已经是有效的(即,积极的)降噪策略的结果,其中降噪效果的水平是根据在107所产生的语音质量性能测量比基线语音质量性能测量好多少。类似地,比基线语音质量性能测量更差的在107处产生的语音质量性能测量可以通过降噪工具被认为是无效的(即,消极的)降噪策略的结果,其中降噪无效的水平是根据在107所产生的语音质量性能测量比基线语音质量性能测量差多少。
为了促进机器学习,降噪工具可以至少反馈语音质量性能测量到103处的机器学习过程,以便机器学习组件可以应用机器学习技术,来确定某些预滤器的选项的单独应用或与在104处的一种或多种预滤器选项组合的应用在从声音输入105中降低舱室噪声上表现如何,以便用户的语音在所得到的声音输入105'内增强。此外或可选择地,在103处的机器学习过程可以接收下面的一个或多个作为反馈信息:用于所得到的声音输入105’的语音质量性能测量,识别导致所得到的声音输入105’的语音质量性能测量的先前选择的预滤器选项的信息,和导致所得到的声音输入105’的语音质量性能测量的先前预滤器选项的选择的先前接收的训练输入。结果是,这种信息的反馈为降噪工具的在103处的机器学习过程提供了应用机器学习技术来自适应地从先前的降噪策略中学习所需的信息。
通过将语音质量性能测量反馈回到在103处的机器学习过程,降噪工具能够更好地分析训练输入,下一步开发也在103处的提高的预滤器的选择策略,其可以导致更高(即更好)的语音质量性能测量,以提高来自声音输入105的舱室噪声中的用户的语音。
这种类型的自适应机器学习可以在免提电话系统的操作过程中(即,当车辆正在被驱动或以其它方式处于操作中),或其它类型的免提音频系统的操作过程中,通过降噪工具连续地实施,以便在103处的机器学习过程可以访问反馈信息的增长的数据库,用于鉴于接收的训练输入进行分析。随着反馈信息的数据库继续从免提电话系统和降噪工具的连续操作中增长,在103处的机器学习过程将能够开发也在103处的提高的预滤器的选择策略,其将选择用于实现在所接收的声音输入105中更好的降噪的预滤器。换句话说,通过连续增长识别语音质量性能测量的反馈信息,机器学习将访问更多信息,该信息可以导致提高的预滤器的选择过程的开发,其可以鉴于接收的训练输入选择用于实现更好降噪的适当的预滤器的选项。这允许降噪工具来产生具有超过舱室噪声分量的更清晰的用户声音分量的所得到的声音输入信号105'。所得到的声音输入105'然后可以被传递到接收通信设备和以更清晰的用户语音分量在接收通信设备的扬声器上输出。
在一些实施例中,在103处的机器学习过程可以在与车辆上运行的降噪工具通信的外部服务器上实施。外部服务器可以类似于图2中所示的信息服务器203。例如,降噪工具可以引起车辆的接口来传递训练输入信息和反馈信息以及产生应用到声音输入105的降噪预滤器选择的请求到外部服务器。外部服务器可以然后接收训练输入信息和反馈信息和请求,响应于接收请求而做出根据本文描述的一种或多种方法选择哪个预滤器的决定,并通过车辆上的接口传递识别一个或多个选择的预滤器的响应回到降噪工具。通过在103处的机器学习过程应用的机器学习技术可以是处理器密集型分析。因此,通过依靠外部服务器来实施机器学习技术以选择用于应用到声音输入105的一个或多个预滤器,降噪工具可以保存处理带宽或保留车辆的一个或多个处理组件。进一步地,外部服务器对于实施机器学习技术来说配备得更好,这归因于外部服务器具有超出在车辆上可用的处理器的含更大的处理能力的处理器。因为具有更大的处理能力的处理器可能更昂贵,所以降噪工具可能已配置为与外部服务器通信,以便实施机器学习技术以补偿车辆上具有低处理能力(即,更便宜的)的处理器。
图3说明了根据一些实施例描述用于降噪工具的过程的示例性流程图300。通过流程图300所描述的过程描述了示例性步骤,其可以通过降噪工具实施以实现本文中所描述的自适应降噪。下面描述的过程的步骤被提供仅仅用于示例性的目的,因为降噪工具实施更多或更少数量的步骤以实现本文所描述的舱室噪声的自适应降噪也在本发明的范围内。现在提供描述流程图300的进一步的说明。
在301处,根据本文所描述的一种或多种方法,降噪工具可以接收用于一个或多个车辆组件的车辆操作状态信息。例如,根据本文所描述的一种或多种方法,降噪工具可以在机器学习组件处接收车辆操作状态信息。通过接收在301处的车辆操作状态信息,降噪工具可以识别哪些车辆组件当前运行或操作,并且也识别用于车辆组件的特定操作状态(例如,打开或关闭,在高、中或低的操作状态或其他操作状态下的运行)。
在302处,根据本文所描述的任意一种或多种方法,降噪工具可以接收外部信息。例如,根据本文所描述的一种或多种方法,降噪工具可以在机器学习组件处接收外部信息。通过在302处接收外部信息,降噪工具可以识别一个或多个可以导致车辆舱室内进一步通过舱室麦克风拾取的舱室噪声的外部条件。
假设免提电话系统当前运行,则舱室麦克风可以在303处接收声音输入。声音输入可以是用户语音、以及起源于车辆组件的操作、乘客和/或外部条件的舱室噪声的组合。例如,舱室麦克风可以根据本文所描述的一种或多种方法在103处拾取来自车辆舱室的输入声音。
在304处,降噪工具可以基于在301处接收的一个或多个车辆操作状态信息、在302处接收的外部信息、和先前的机器学习智力的组合来确定选择应用于在声音输入上的一个或多个预滤器。例如,降噪工具的机器学习组件可以根据本文所描述的一种或多种方法来确定应用到声音输入一个或多个预滤器。
在305处,降噪工具可以在304处应用选择的一个或多个预滤器到声音输入。例如,一个或多个预滤器可以根据本文所述的任意一种或多种方法被应用到声音输入。此外,在一些实施例中,传统的降噪滤波器可以在预滤器的应用之后应用。传统的降噪滤波器例如可以是维纳滤波器。
在306处,降噪工具可以确定在305处的预滤器(和可选择地传统的降噪滤波器)的应用之后所得到的声音输入的语音质量性能测量。例如,用于所得到的声音输入的语音质量性能测量可以根据本文所述的任意一种或多种方法来确定。语音质量性能测量可以被存储在车辆的存储器上作为反馈数据。
在307处,语音质量性能测量可以通过反馈回路提供回到降噪工具,从而促进自适应机器学习以促进更好的降噪策略。例如,反馈回路可以根据本文描述的任意一种或多种方法提供语音质量性能测量回到降噪工具的机器学习组件。
应该注意的是,流程图300所描述的过程被提供用于示例性的目的,并且对于降噪工具实施包括更多或更少数量的步骤的自适应降噪过程在本文所描述的创新范围内。例如,尽管没有在图3中明确地表示,但是下面的步骤305所得到的声音输入可以传递到与连接到免提电话系统的电话的电话交谈中处于另一端的电话。
参照图4,计算系统400——其可以用于如图2中所示的一个或多个设备,或在配置为实施本文所讨论的任意一种或多种方法、特征、和过程的任意其他系统中——的说明性实施例通过计算系统400显示和指定。例如,需要实施降噪的本文所描述的车辆(例如,车辆202)的功能组件可以实施为计算机系统400。而且,在图2所示的信息服务器203可以被实施为计算系统400。
计算系统400可以包括由与主存储器412通信的处理器411组成的处理单元410,其中主存储器412存储一组指令427,指令427可以通过处理器411执行以引起计算系统400来执行本文所公开的任意一种或多种方法、过程或基于计算机的功能。例如,贯穿本公开描述的降噪工具可以是包含指令组427的程序,该指令组427被执行以执行本文所描述的任意一种或多种方法、过程、或基于计算机的功能,比如用于实现本文所描述的应用到通过免提电话系统的舱室麦克风拾取的声音输入的降噪的过程。这包括通过本文所描述的降噪工具实施的机器学习过程。计算系统400可以是移动的或不可移动的,作为独立的设备操作,或者可以使用网络连接到其他计算机系统或外围设备。
在网络的部署中,计算系统400可以以服务器的容量运行或作为在服务器-客户端用户网络环境中车辆内的客户端用户计算机,或作为在对等(或分布式)网络环境中的车辆内的对等计算机系统。除了作为车辆系统的组件,降噪工具也可以在计算系统400上运行,计算系统400实施为,或结合到各种设备,比如个人计算机(“PC”),平板PC,机顶盒(“STB”),个人数字助理(“PDA”),智能电话或平板电脑这样的移动设备、掌上型电脑,膝上型计算机,台式计算机,网络路由器,交换器和桥接器,或能够执行指定机器采取的行动的一组指令(顺序的或以其他方式)的其他机器设备。在特定实施例中,计算系统400可以使用提供语音、视频或数据通信的电子设备来实施。进一步地,尽管单个计算系统400被示出,但是术语“系统”还应该被理解为包括单独或共同地执行一组或多组的执行一个或多个计算机功能的指令的任意系统或子系统的集合。
如图4中所示,计算系统400可以包括处理器411,比如中央处理单元(“CPU”),图形处理单元(“GPU”),或两者。结果是,处理器411可以代表一个或多个处理单元。而且,计算系统400可以包括主存储器412和静态存储器422,其可以通过总线405彼此通信。如图所示,计算系统400可以进一步包括显示单元425,比如液晶显示器(“LCD”),有机发光二极管(“OLED”),平板显示器,固态显示器,或阴极射线管(“CRT”)。显示单元425可以对应于本文中所描述的车辆(例如,车辆202)的导航系统的显示组件、车载信息娱乐系统、抬头显示器、或本文中所描述的车辆(例如,车辆202)的仪表板上的显示组件。此外,计算系统400可以包括一个或多个输入命令设备423,比如控制旋钮,仪表板,键盘,扫描器仪,用于图像捕捉的数码相机和/或视觉命令识别的数码相机,触摸屏或音频输入设备(例如,舱室麦克风),按钮,鼠标或触控板。计算系统400也可以包括用于接收的计算机可读介质428的磁盘驱动单元421。在特定实施例中,磁盘驱动单元421可以接收其中可嵌入一组或多组指令427,(比如对应于降噪工具的软件,)可以被嵌入的计算机可读介质428。进一步地,指令427可以体现为如本文所描述的的一种或多种方法或逻辑。在特定实施例中,在通过处理器411执行指令427过程中,指令427可以完全地,、或者至少部分地,驻留在任何一个或多个主存储器412,、静态存储器422,、计算机可读介质428内,、和/或在通过处理器411执行指令427过程中的处理器411中的任何一个或多个内。
计算系统400也可以包括比如扬声器或远程遥控器这样的信号生成设备424,以及车辆操作状态接口429。车辆操作状态的接口429可以配置为接收与包含车辆系统的各种车辆组件的操作状态相关联的信息。例如,车辆系统可以包括电动车窗、发动机、挡风玻璃刮水器、转向灯、车辆音频系统、HVAC系统、悬挂系统、和潜在地增加舱室噪声的其他组件中的一个或多个。
计算系统400可以进一步包括通信接口426。通信接口426可以包含用于与外部网络440通信的网络接口(有线或无线的)。外部网络440可以是一个或多个网络的集合,包括基于标准的网络(例如,2G,3G,4G,通用移动电信系统(UMTS),GSM(全球移动通信)(R)协会,长期演进(LTE)(TM),或更多),WiMAX(全球微波接入互操作),蓝牙,近场通信(NFC),WiFi(包括802.11a/b/g/n/ac或其他),WiGig(无线吉比特),全球定位系统(GPS)网络,和在提交本申请时可用的或可以在将来开发的其它电信网络和其他技术。进一步地,网络440可以是比如因特网这样的公用网络,比如内联网这样的专用网络,或其组合,并且可以利用现在可用的或以后开发的多种网络协议,包括但不限于基于TCP/IP的网络协议。例如,外部网络440可以对应于参照图2所描述的相同的网络201。
在一些实施例中,体现降噪工具的程序可以通过网络440的传输从场外服务器被下载并存储在主存储器412、计算机可读介质428、或静态存储器422中的任何一个或多个上。进一步地,在一些实施例中,在计算系统500上运行的降噪工具可以通过网络440与信息服务器通信。例如,降噪工具可以通过网络440与信息服务器203通信,以便通过通信接口426接收本文描述的任何一个或多个外部信息。
在替代实施例中,专用硬件实现方式,包括特定应用集成电路、可编程逻辑阵列和其他硬件设备,可以构造为实施本文中所描述的一种或多种方法。可以包括各种实施例的装置和系统的应用程序可以广泛地包括各种电子和计算机系统。本文中所描述的一个或多个实施例可以使用两个或更多个包含可以在模块之间和通过模块传输的相关控制和数据信号的特定互联的硬件模块或设备实施功能,或作为特定应用程序集成电路的部分实施功能。因此,本系统包含软件、固件和硬件实现方式。
根据本公开的各种实施例,本文中所描述的方法可以通过由计算系统800可执行的软件程序来实施。此外,在示例性、非限制性实施例中,实现方式可以包括分布式处理、组件/对象分布式处理和并行处理。可替代地,虚拟计算机系统处理可以构造为实施本文中所描述的一个或多个方法或功能。
虽然计算机可读介质被示为单个介质,但是术语“计算机可读介质”包括单个介质或多个介质,例如集中式或分布式数据库,和/或相关联的高速缓存和存储一组或多组指令的服务器。术语“计算机可读介质”还应当包括能够存储、编码或支持用于由处理器执行或使计算机系统执行本文中所公开的方法或操作中的任何一个或多个的一组指令的任何有形介质。
在特定的非限制性、示例性实施例中,计算机可读介质可以包括固体存储器,例如容纳一个或多个非易失性只读存储器——如闪速存储器——的存储卡或其它程序包。此外,计算机可读介质可以是随机存取存储器或其他易失性可重写存储器。此外,计算机可读介质可以包括磁光或光学介质,例如捕获在传输介质上传送信息的盘或带或其他存储设备。因此,本公开被认为包括可以存储数据或指令的计算机可读介质或分布式介质以及其他等同物和后继介质中的任何一个或多个。
附图中的任何过程描述或框应当被理解为表示包括用于实现过程中的特定逻辑功能或步骤的一个或多个可执行指令的模块、段、或代码部分,并且替代的实施方式包括在本文中所描述的实施例的范围内,其中功能可以根据涉及的功能不按所示或所讨论的顺序执行,包括实质上同时或以相反的顺序执行,如本领域的普通技术人员可以理解的那样。
应当强调的是,上述实施例,特别是任何“优选”实施例,是实施方式的可能示例,仅仅阐述用于清楚地理解本发明的原理。在实质上不脱离本文中所描述的技术的精神和原则的前提下,可以对上述实施例作出各种变化和修改。所有这些修改旨在包括在本公开的范围内并由以下的权利要求所保护。
Claims (20)
1.一种装置,包含:
配置为存储降噪预滤器和反馈数据的存储器;
与所述存储器通信的处理器,所述处理器配置为:
接收声音输入;
接收训练输入数据;
接收所述反馈数据;
基于所述的训练输入数据和反馈数据确定是否选择所述预滤器,以及
如果所述预滤器被选择,则应用所述选择的预滤器到所述声音输入。
2.根据权利要求1所述的装置,其中所述处理器进一步配置为:
在所述选择的预滤器已经被应用之后,应用维纳滤波器到所述声音输入。
3.根据权利要求1所述的装置,其中所述处理器进一步配置为:
在所述选择的预滤器已经被应用之后,产生对所述声音输入的性能测量,其中所述性能测量指示所述选择的预滤器被应用之后所述声音输入的语音质量。
4.根据权利要求3所述的装置,其中所述性能测量是信噪比测量,其识别在所述选择的预滤器已经被应用之后所述声音输入内的语音信号的能量水平。
5.根据权利要求3所述的装置,其中所述处理器进一步配置为:
反馈所述性能测量作为新的反馈数据,以及
使所述新的反馈数据存储在所述存储器中。
6.根据权利要求1所述的装置,其中所述训练输入数据包括容纳所述装置的车辆的一个或多个组件的车辆操作状态信息和外部信息,其中所述车辆操作状态信息和所述外部信息识别预测为至少部分地导致车辆内的舱室噪声的因素。
7.根据权利要求6所述的装置,其中所述车辆操作状态信息包括发动机速度信息、节气门位置信息、HVAC模式信息、HVAC风机速度信息、车辆速度信息、转向信号操作状态信息、刮水器操作状态信息、车辆音频音量状态信息、车窗位置信息、主轴加速度信息、舱室声学信息、舱室麦克风位置信息、和/或所述车辆内的一个或多个座椅的座椅位置信息中的至少一个。
8.根据权利要求6所述的装置,其中所述外部信息包括地理信息、道路表面信息、和/或气象信息中的至少一个。
9.根据权利要求6所述的装置,进一步包含:
接口,其配置为;
与信息服务器通信;
传递对所述外部信息的请求到所述信息服务器,以及
响应于所述请求,从所述信息服务器中接收所述外部信息。
10.根据权利要求1所述的装置,其中所述选择的预滤器对应于一个或多个可用的降噪预滤器,并且其中所述反馈数据基于先前的降噪策略。
11.一种对声音输入自适应降噪的方法,包含:
在存储器中存储降噪预滤器和反馈数据;
接收所述声音输入;
接收训练输入数据;
接收所述反馈数据;
基于所述训练输入数据和所述反馈数据确定是否选择所述预滤器,以及
如果所述预滤器被选择,则应用所述选择的预滤器到所述声音输入。
12.根据权利要求11所述的方法,其中进一步包含:
在所述选择的预滤器已经被应用之后,应用维纳滤波器到所述声音输入。
13.根据权利要求11所述的方法,进一步包含:
在所述选择的预滤器已经被应用之后,产生对所述声音输入的性能测量,其中所述性能测量指示在所述选择的预滤器被应用之后所述声音输入的语音质量。
14.根据权利要求13所述的方法,其中所述性能测量是信噪比测量,其识别在所述选择的预滤器已经被应用之后所述声音输入内的语音信号的能量水平。
15.根据权利要求13所述的方法,进一步包含:
反馈所述性能测量作为新的反馈数据,以及
使所述新的反馈数据存储在所述存储器中。
16.根据权利要求11所述的方法,其中所述训练输入数据包括车辆的一个或多个组件的车辆操作状态信息和外部信息,其中所述车辆操作状态信息和所述外部信息识别预测为至少部分地导致车辆内的舱室噪声的因素。
17.根据权利要求16所述的方法,其中所述车辆操作状态信息包括发动机速度信息、节气门位置信息、HVAC模式信息、HVAC风机速度信息、车辆速度信息、转向信号操作状态信息、刮水器操作状态信息、车辆音频音量状态信息、车窗位置信息、主轴加速度信息、舱室声学信息、舱室麦克风位置信息、和/或所述车辆内的一个或多个座椅的座椅位置信息中的至少一个。
18.根据权利要求16所述的方法,其中所述外部信息包括地理信息、道路表面信息、和/或气象信息中的至少一个。
19.根据权利要求16所述的方法,进一步包含:
引起接口与信息服务器通信;
传递对所述外部信息的请求到所述信息服务器,以及
响应于所述请求,从所述信息服务器中接收所述外部信息。
20.根据权利要求11所述的方法,其中所述选择的预滤器对应于一个或多个可用的降噪预滤器,并且其中所述反馈数据基于先前的降噪策略。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/334,627 | 2014-07-17 | ||
US14/334,627 US10475466B2 (en) | 2014-07-17 | 2014-07-17 | Adaptive vehicle state-based hands-free phone noise reduction with learning capability |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105306648A true CN105306648A (zh) | 2016-02-03 |
CN105306648B CN105306648B (zh) | 2020-10-20 |
Family
ID=55021923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510416175.5A Active CN105306648B (zh) | 2014-07-17 | 2015-07-15 | 具有学习能力的基于车辆状态的免提电话自适应降噪 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10475466B2 (zh) |
CN (1) | CN105306648B (zh) |
DE (1) | DE102015110935A1 (zh) |
MX (1) | MX2015009187A (zh) |
RU (1) | RU2015129116A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107895572A (zh) * | 2016-09-30 | 2018-04-10 | 法乐第(北京)网络科技有限公司 | 一种语音识别训练方法及系统 |
CN110138463A (zh) * | 2018-02-02 | 2019-08-16 | 比亚迪股份有限公司 | 用于车内通信降噪的方法、车载终端及车辆 |
CN110265053A (zh) * | 2019-06-29 | 2019-09-20 | 联想(北京)有限公司 | 信号降噪控制方法、装置及电子设备 |
CN117690303A (zh) * | 2024-02-04 | 2024-03-12 | 四川三元环境治理股份有限公司 | 一种基于交通数据采集的噪声预警系统、装置及预警方法 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9779752B2 (en) | 2014-10-31 | 2017-10-03 | At&T Intellectual Property I, L.P. | Acoustic enhancement by leveraging metadata to mitigate the impact of noisy environments |
US9530408B2 (en) * | 2014-10-31 | 2016-12-27 | At&T Intellectual Property I, L.P. | Acoustic environment recognizer for optimal speech processing |
US9978399B2 (en) * | 2015-11-13 | 2018-05-22 | Ford Global Technologies, Llc | Method and apparatus for tuning speech recognition systems to accommodate ambient noise |
KR102503684B1 (ko) * | 2016-06-24 | 2023-02-28 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US10462567B2 (en) | 2016-10-11 | 2019-10-29 | Ford Global Technologies, Llc | Responding to HVAC-induced vehicle microphone buffeting |
US10186260B2 (en) * | 2017-05-31 | 2019-01-22 | Ford Global Technologies, Llc | Systems and methods for vehicle automatic speech recognition error detection |
US10525921B2 (en) | 2017-08-10 | 2020-01-07 | Ford Global Technologies, Llc | Monitoring windshield vibrations for vehicle collision detection |
US10562449B2 (en) | 2017-09-25 | 2020-02-18 | Ford Global Technologies, Llc | Accelerometer-based external sound monitoring during low speed maneuvers |
US10479300B2 (en) | 2017-10-06 | 2019-11-19 | Ford Global Technologies, Llc | Monitoring of vehicle window vibrations for voice-command recognition |
US10134415B1 (en) * | 2017-10-18 | 2018-11-20 | Ford Global Technologies, Llc | Systems and methods for removing vehicle geometry noise in hands-free audio |
CN108172220B (zh) * | 2018-02-22 | 2022-02-25 | 成都启英泰伦科技有限公司 | 一种新型语音除噪方法 |
US10347236B1 (en) * | 2018-02-28 | 2019-07-09 | Harman International Industries, Incorporated | Method and apparatus for continuously optimized road noise cancellation |
US11217242B2 (en) * | 2019-05-22 | 2022-01-04 | Ford Global Technologies, Llc | Detecting and isolating competing speech for voice controlled systems |
KR20190109341A (ko) * | 2019-09-06 | 2019-09-25 | 엘지전자 주식회사 | 노이즈 관리가 가능한 전자기기 및 이의 제어 방법 |
CN110970046B (zh) * | 2019-11-29 | 2022-03-11 | 北京搜狗科技发展有限公司 | 一种音频数据处理的方法及装置、电子设备、存储介质 |
US11508387B2 (en) * | 2020-08-18 | 2022-11-22 | Dell Products L.P. | Selecting audio noise reduction models for non-stationary noise suppression in an information handling system |
US20240040309A1 (en) * | 2022-07-28 | 2024-02-01 | Mediatek Inc. | Non-Coherent Noise Reduction For Audio Enhancement on Mobile Device |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020097884A1 (en) * | 2001-01-25 | 2002-07-25 | Cairns Douglas A. | Variable noise reduction algorithm based on vehicle conditions |
JP2008239099A (ja) * | 2007-03-28 | 2008-10-09 | Fujitsu Ten Ltd | 車両騒音制御装置および車両騒音制御方法 |
CN103208286A (zh) * | 2012-01-17 | 2013-07-17 | 通用汽车环球科技运作有限责任公司 | 使用车辆声音信息以增强音频提示的方法和系统 |
CN103208287A (zh) * | 2012-01-17 | 2013-07-17 | 通用汽车环球科技运作有限责任公司 | 使用声音相关的车辆信息以增强语音对话的方法和系统 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7487084B2 (en) | 2001-10-30 | 2009-02-03 | International Business Machines Corporation | Apparatus, program storage device and method for testing speech recognition in the mobile environment of a vehicle |
JP2003344083A (ja) | 2002-05-24 | 2003-12-03 | Denso Corp | 車載ノイズ制御装置 |
DE10251603A1 (de) | 2002-11-06 | 2004-05-19 | Dr.Ing.H.C. F. Porsche Ag | Verfahren zur Störgeräuschunterdrückung |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
DE10311587A1 (de) | 2003-03-14 | 2004-09-23 | Volkswagen Ag | Verfahren und Vorrichtung zum Freisprechen in einem Kraftfahrzeug |
US7912625B2 (en) * | 2005-01-18 | 2011-03-22 | Colin Paul CAHOON | Portable memory automobile ignition system |
JP4671303B2 (ja) * | 2005-09-02 | 2011-04-13 | 国立大学法人北陸先端科学技術大学院大学 | マイクロホンアレイ用ポストフィルタ |
US7941189B2 (en) | 2007-02-07 | 2011-05-10 | Denso Corporation | Communicating road noise control system, in-vehicle road noise controller, and server |
US7881929B2 (en) * | 2007-07-25 | 2011-02-01 | General Motors Llc | Ambient noise injection for use in speech recognition |
EP2151821B1 (en) | 2008-08-07 | 2011-12-14 | Nuance Communications, Inc. | Noise-reduction processing of speech signals |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
DK2381700T3 (en) | 2010-04-20 | 2015-06-01 | Oticon As | Removal of the reverberation from a signal with use of omgivelsesinformation |
US8892046B2 (en) | 2012-03-29 | 2014-11-18 | Bose Corporation | Automobile communication system |
WO2013187932A1 (en) | 2012-06-10 | 2013-12-19 | Nuance Communications, Inc. | Noise dependent signal processing for in-car communication systems with multiple acoustic zones |
US9112984B2 (en) * | 2013-03-12 | 2015-08-18 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9312826B2 (en) * | 2013-03-13 | 2016-04-12 | Kopin Corporation | Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction |
WO2014152339A1 (en) | 2013-03-14 | 2014-09-25 | Robert Bosch Gmbh | Time and environment aware graphical displays for driver information and driver assistance systems |
-
2014
- 2014-07-17 US US14/334,627 patent/US10475466B2/en active Active
-
2015
- 2015-07-07 DE DE102015110935.2A patent/DE102015110935A1/de active Pending
- 2015-07-15 CN CN201510416175.5A patent/CN105306648B/zh active Active
- 2015-07-16 RU RU2015129116A patent/RU2015129116A/ru not_active Application Discontinuation
- 2015-07-16 MX MX2015009187A patent/MX2015009187A/es unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020097884A1 (en) * | 2001-01-25 | 2002-07-25 | Cairns Douglas A. | Variable noise reduction algorithm based on vehicle conditions |
JP2008239099A (ja) * | 2007-03-28 | 2008-10-09 | Fujitsu Ten Ltd | 車両騒音制御装置および車両騒音制御方法 |
CN103208286A (zh) * | 2012-01-17 | 2013-07-17 | 通用汽车环球科技运作有限责任公司 | 使用车辆声音信息以增强音频提示的方法和系统 |
CN103208287A (zh) * | 2012-01-17 | 2013-07-17 | 通用汽车环球科技运作有限责任公司 | 使用声音相关的车辆信息以增强语音对话的方法和系统 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107895572A (zh) * | 2016-09-30 | 2018-04-10 | 法乐第(北京)网络科技有限公司 | 一种语音识别训练方法及系统 |
CN110138463A (zh) * | 2018-02-02 | 2019-08-16 | 比亚迪股份有限公司 | 用于车内通信降噪的方法、车载终端及车辆 |
CN110138463B (zh) * | 2018-02-02 | 2021-03-26 | 比亚迪股份有限公司 | 用于车内通信降噪的方法、车载终端及车辆 |
CN110265053A (zh) * | 2019-06-29 | 2019-09-20 | 联想(北京)有限公司 | 信号降噪控制方法、装置及电子设备 |
CN110265053B (zh) * | 2019-06-29 | 2022-04-19 | 联想(北京)有限公司 | 信号降噪控制方法、装置及电子设备 |
CN117690303A (zh) * | 2024-02-04 | 2024-03-12 | 四川三元环境治理股份有限公司 | 一种基于交通数据采集的噪声预警系统、装置及预警方法 |
CN117690303B (zh) * | 2024-02-04 | 2024-04-26 | 四川三元环境治理股份有限公司 | 一种基于交通数据采集的噪声预警系统、装置及预警方法 |
Also Published As
Publication number | Publication date |
---|---|
RU2015129116A (ru) | 2017-01-20 |
US10475466B2 (en) | 2019-11-12 |
US20160019904A1 (en) | 2016-01-21 |
CN105306648B (zh) | 2020-10-20 |
MX2015009187A (es) | 2016-04-04 |
DE102015110935A1 (de) | 2016-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105306648A (zh) | 具有学习能力的基于车辆状态的免提电话自适应降噪 | |
CN105280194A (zh) | 具有学习能力的基于车辆状态的免提电话降噪 | |
US9963012B2 (en) | Personalizing vehicular comfort settings for a specific user | |
US7634095B2 (en) | Dynamic tuning of hands-free algorithm for noise and driving conditions | |
US7729911B2 (en) | Speech recognition method and system | |
DE102020113756A1 (de) | Systeme und verfahren zur akustischen steuerung eines fahrzeuginnenraums | |
US10156637B2 (en) | Apparatus and method for controlling noise in vehicle | |
CN105966405A (zh) | 驾驶员分心检测系统 | |
CN105389976A (zh) | 用于道路风险指数产生的方法和设备 | |
US9706299B2 (en) | Processing of audio received at a plurality of microphones within a vehicle | |
US10993079B2 (en) | Motion detection method, device, and medium | |
CN108630221A (zh) | 基于量化snr分析和自适应维纳滤波的音频信号质量增强 | |
DE102018128003A1 (de) | Neuronales netzwerk zum anwenden bei der spracherkennungsarbitrierung | |
US9830925B2 (en) | Selective noise suppression during automatic speech recognition | |
US11854541B2 (en) | Dynamic microphone system for autonomous vehicles | |
CN108986819A (zh) | 用于车辆自动语音识别错误检测的系统和方法 | |
CN107891867A (zh) | 车身部件的实时状态显示方法和装置 | |
CN108551623A (zh) | 车辆及其基于声音识别的音频播放调节方法 | |
US20190096397A1 (en) | Method and apparatus for providing feedback | |
EP3691297B1 (en) | Test arrangement and test method | |
US9978399B2 (en) | Method and apparatus for tuning speech recognition systems to accommodate ambient noise | |
JP2020016838A (ja) | ノイズ低減装置、ノイズ低減方法およびノイズ低減プログラム | |
US10914603B2 (en) | Method and apparatus for noise-adaptive vehicle navigation | |
CN108288378A (zh) | 获取交通状况的方法 | |
KR102647575B1 (ko) | 차량용 인포테인먼트 시스템 및 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |