CN114979734A - 一种语音控制遥控器及其降噪方法和电视机 - Google Patents
一种语音控制遥控器及其降噪方法和电视机 Download PDFInfo
- Publication number
- CN114979734A CN114979734A CN202210533670.4A CN202210533670A CN114979734A CN 114979734 A CN114979734 A CN 114979734A CN 202210533670 A CN202210533670 A CN 202210533670A CN 114979734 A CN114979734 A CN 114979734A
- Authority
- CN
- China
- Prior art keywords
- microphones
- frequency response
- microphone
- voice
- remote controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000004044 response Effects 0.000 claims abstract description 121
- 230000035945 sensitivity Effects 0.000 claims abstract description 54
- 230000005236 sound signal Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 3
- 230000001960 triggered effect Effects 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 16
- 230000007613 environmental effect Effects 0.000 abstract description 6
- 230000008569 process Effects 0.000 description 12
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000011946 reduction process Methods 0.000 description 3
- 101100434411 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ADH1 gene Proteins 0.000 description 2
- 101150102866 adc1 gene Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 101710096660 Probable acetoacetate decarboxylase 2 Proteins 0.000 description 1
- 208000003443 Unconsciousness Diseases 0.000 description 1
- 101150042711 adc2 gene Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/42225—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details characterized by types of remote control, e.g. universal remote control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/42222—Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明公开了一种语音控制遥控器及其降噪方法和电视机,在遥控器的同一侧布设两个麦克风,二者间距半个噪声波长的奇数倍;在通过遥控器上的开机按键控制被控设备开机时,启动两个麦克风拾取被控设备播放的开机音乐,获取两个麦克风的频响曲线;计算两个频响曲线的灵敏度差值,根据灵敏度差值对其中一个麦克风的频响曲线进行补偿,使两个麦克风的频响曲线达到相对一致的状态;之后通过两个麦克风拾取用户语音,将获取到的两路声音波形叠加,提取出语音信号进行语义识别,解析出用户指令。本发明不仅可以降低环境噪音,还可以解决两个麦克风在声学性能不一致的情况下对降噪效果造成的影响,同时可以增强语音指令的增益,使得语音指令更加清晰。
Description
技术领域
本发明属于遥控设备技术领域,涉及一种语音控制遥控器,具体地说,是涉及一种对遥控器采集到的语音指令进行降噪的方法。
背景技术
遥控器是一种无线发射装置,其利用数字编码技术对按键信息进行编码,并将所形成的遥控编码以光波或者电磁波的形式无线发送至被控设备,以控制被控设备执行相应操作。
目前,智能化已成为家电行业发展的一大趋势,遥控器也从传统的按键操作方式向语音控制方式转型,形成了一种可以根据用户语音自动生成遥控编码的语音控制遥控器。
为了在遥控器上实现语音控制功能,需要在遥控器上配置麦克风拾取用户的语音指令。麦克风在拾取用户语音时,遥控器周围的环境噪音也会被麦克风一并拾取。当环境噪音较大时,会对语音指令的提取造成严重的干扰,导致语音指令的识别出现错误,影响用户的使用体验。
为了解决上述问题,在某些语音控制遥控器上配置有主、副两个麦克风。其中,主麦克风通常布设在遥控器的前壳上,主要采集用户语音;副麦克风通常布设在遥控器的后壳上,主要采集环境噪音。将副麦克风采集到的噪音波形的相位取反后,与主麦克风采集到的声音波形叠加,即可去除掉声音波形中的环境噪音,提取出用户的语音指令,实现主动降噪的功能。采用这种主动降噪方式,当用户向遥控器发出语音指令时,由于副麦克风也会不可避免地接收到用户语音,这在执行后续的降噪处理时,会在一定程度上削弱主麦克风采集到的语音波形的增益,影响语音指令的提取和识别。
发明内容
本发明的目的在于提供一种语音控制遥控器及其降噪方法,不仅可以有效降低环境噪音,还可以解决主副麦克风在声学性能不一致的情况下对降噪效果造成的影响,同时可以增强语音指令的增益,使得语音指令更加清晰。
为了达到上述设计目的,本发明采用以下技术方案予以实现:
在一个方面,本发明提出了一种语音控制遥控器,包括开机按键、两个麦克风和控制单元;其中,所述开机按键用于控制被控设备开机;所述两个麦克风安装在遥控器的同一侧,二者之间的距离按照半个噪声波长的奇数倍配置;所述控制单元在所述开机按键控制所述被控设备开机时,启动两个麦克风拾取所述被控设备播放的开机音乐,以获取两个麦克风的频响曲线,并计算两个频响曲线的灵敏度差值,根据所述灵敏度差值对其中一个麦克风的频响曲线进行补偿,使两个麦克风的频响曲线达到相对一致的状态;之后,所述控制单元通过所述两个麦克风拾取用户语音,并将获取到的两路声音波形叠加后,提取出语音信号进行语义识别,解析出用户指令。
在本申请的一些实施例中,优选配置所述控制单元在进行频响曲线补偿时,对灵敏度低的一个麦克风的频响曲线进行补偿,使其与灵敏度高的一个麦克风的频响曲线一致。这样可以得到更高的语音幅度,使得提取出的语音更清晰,有利于提高语义识别的准确度。
在本申请的一些实施例中,可以采用调整各频段信号的增益值的方式达到调整频响曲线的目的,即,所述控制单元可以对计算出的灵敏度差值取绝对值,将所述绝对值作为增益补偿值,对频响曲线的灵敏度低的一个麦克风所输出的信号进行增益补偿,通过提高信号增益,使得该麦克风的频响曲线与灵敏度高的一个麦克风的频响曲线一致。
在本申请的一些实施例中,可以在所述控制单元中配置两路模数转换器、处理模块、比较器、两路均衡器、降噪模块和语义识别模块;其中,两路模数转换器分别用于将所述两个麦克风输出的模拟信号转换成数字信号;两路均衡器分别用于调整两个麦克风音频通道的各频段的增益值;所述处理模块在检测到所述开机按键控制被控设备开机时,启动所述两个麦克风拾取所述被控设备播放的开机音乐,并接收所述两路模数转换器输出的两路数字信号,根据所述两路数字信号生成两个麦克风的频响曲线;所述比较器用于对两个所述频响曲线进行比较,输出两个频响曲线的灵敏度差值至所述处理模块;所述处理模块对所述灵敏度差值取绝对值,将所述绝对值作为增益补偿值发送至频响曲线的灵敏度低的一个麦克风所对应的均衡器,以对该麦克风音频通道的各频段的增益值进行补偿;所述降噪模块用于在补偿结束后,接收通过两个麦克风音频通道输出的包含有用户语音的声音信号,并将获取到的两路声音信号叠加,以增强语音,降低噪声;所述语义识别模块接收所述降噪模块输出的声音信号,进行语义识别,以解析出用户指令后,发送至所述处理模块;所述处理模块根据解析出的用户指令生成相应的遥控编码,控制遥控器上的发射头发射遥控信号。
在本申请的一些实施例中,为了对两个麦克风的频响曲线实现多频段校准,配置所述被控设备播放的开机音乐为具有多频段音频信号的音源,以保证两个麦克风声学性能的一致性。
在本申请的一些实施例中,为了提高两个麦克风的拾音效果,优选将所述两个麦克风均安装在遥控器的前面板上,配置两个麦克风之间的距离为半个噪声波长,以简化遥控器前面板的结构布局。
在本申请的一些实施例中,为了进一步提高拾音效果,可以在所述遥控器上布设多组麦克风,并配置所述多组麦克风以阵列方式排布,在每一组麦克风中均配置上述两个麦克风,利用多组麦克风同步拾音,可以提高音频信号的接收功率,使得提取出来的用户语音更加清晰,语音控制更加精准。
在另外一个方面,本发明还提出了一种语音控制遥控器的降噪方法,在所述遥控器的同一侧,布设有两个麦克风,两个麦克风之间的距离按照半个噪声波长的奇数倍配置;在遥控器上的开机按键被触发,以控制被控设备开机时,启动所述两个麦克风拾取所述被控设备播放的开机音乐,以获取两个麦克风的频响曲线;计算两个频响曲线的灵敏度差值;根据所述灵敏度差值对其中一个麦克风的频响曲线进行补偿,使两个麦克风的频响曲线达到相对一致的状态;补偿结束后,通过所述两个麦克风拾取用户语音,并将获取到的两路声音信号进行波形叠加;从叠加后的波形中提取出声音信号进行语义识别,以解析出用户指令。
在其他方面,本发明还提出了一种电视机,包括主机和语音控制遥控器,所述主机在开机时播放开机音乐,所述语音控制遥控器包括开机按键、两个麦克风和控制单元;其中,所述开机按键用于控制所述主机开机;所述两个麦克风安装在遥控器的同一侧,二者之间的距离按照半个噪声波长的奇数倍配置;所述控制单元在所述开机按键控制所述主机开机时,启动两个麦克风拾取所述主机播放的开机音乐,以获取两个麦克风的频响曲线,并计算两个频响曲线的灵敏度差值,根据所述灵敏度差值对其中一个麦克风的频响曲线进行补偿,使两个麦克风的频响曲线达到相对一致的状态;之后,所述控制单元通过所述两个麦克风风拾取用户语音,并将获取到的两路声音波形叠加后,提取出语音信号进行语义识别,解析出用户指令。
与现有技术相比,本发明的优点和积极效果主要体现在:
(1)本发明在遥控器的同一侧布设两个麦克风同时接收用户语音,并配置两个麦克风之间的距离为半个噪声波长的奇数倍,这样,在用户对着两个麦克风发出语音指令时,两个麦克风拾取到的用户语音为幅度相同、相位相同的波形,而拾取到的环境噪声为幅度相同、相位相反的波形,将两个麦克风拾取到的两个波形叠加,即可获得语音幅度增强、噪声幅度衰减的声音波形,不仅达到了降噪目的,而且可以使得语音更加清晰,有助于提高语音信号的提取以及语义识别的准确度。
(2)由于本发明所提出的上述降噪方式,对两个麦克风的声学性能的一致性要求较高,为了保证降噪效果,本发明的遥控器配置两个麦克风在每次控制被控设备开机时,首先拾取被控设备播放的开机音乐,利用该开机音乐调整两个麦克风的频响曲线达到一致,继而解决了两个麦克风因声学性能不一致问题而对降噪效果造成的影响,为后续的降噪过程提供了更好的条件。
(3)本发明的遥控器利用被控设备的开机音乐作为两个麦克风的频响曲线调整音源,这相比于在遥控器本体上布设扬声器或蜂鸣器,利用扬声器或蜂鸣器发出的声音作为调整音源的方式,具有以下主要优势:
其一,在遥控器上布设扬声器,由于扬声器的功耗较大,会导致遥控器耗电严重,需要频繁更换电池,不仅影响用户的使用体验,而且也不适合实际应用。而本发明的遥控器无需配置发声器件,因此功耗低,不会对遥控器的续航时间产生明显影响。
其二,在遥控器上布设扬声器,由于扬声器与两个麦克风都布设在遥控器本体上,因此扬声器到两个麦克风的距离差会相对较大,使得两个麦克风接收到的声音响度差别较大,即使两个麦克风的声学性能一致,也会因为接收到的声音响度不同而导致两个麦克风的频响曲线产生差异,继而影响频响曲线的补偿效果。而本发明采用被控设备的开机音乐作为两个麦克风的频响曲线调整音源,由于被控设备距离遥控器较远,被控设备到遥控器上的两个麦克风的距离差可以忽略不计,因此可以保证两个麦克风接收到声音响度是一致的,使两个麦克风的频响曲线能够真实地反映出两个麦克风的声学性能是否一致,继而获得更好的补偿效果。
其三,在遥控器上布设扬声器,在扬声器发声时,会引起遥控器振动,振动沿固体传播产生的非线性噪音,会影响频响曲线的校准。而本发明的遥控器由于无需配置发声器件,因此不存在振动噪音,不会对频响曲线的校准过程产生影响。
其四,在遥控器上布设蜂鸣器,由于蜂鸣器只能产生单频音源,而频响曲线是一种灵敏度随频率变化的多频曲线,因此单频音源无法对频响曲线进行校准。而本发明利用被控设备的开机音乐作为两个麦克风的频响曲线调整音源,由于开机音乐可以涉及多个频段的音频信号,因此适合用于频响曲线的校准过程。
其五,利用布设在遥控器上的扬声器或蜂鸣器发声,需要在遥控器上配置专用按键,并需要用户触发该按键来控制扬声器或蜂鸣器发声,即,需要用户有意识地启动两个麦克风的频响曲线校准过程,这对于儿童、老年人等特殊用户而言,显然会造成使用上的困扰。而本发明采用被控设备的开机音乐作为两个麦克风的频响曲线调整音源,在用户通过操作遥控器控制被控设备开机时,两个麦克风的频响曲线校准过程可以在用户无意识的情况下自动完成,无需用户特意操作,因此实际使用更加自然,适用于各类用户。
结合附图阅读本发明实施方式的详细描述后,本发明的其他特点和优点将变得更加清楚。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所提出的语音控制遥控器的一种实施例的前面板布局示意图;
图2是两个麦克风拾取到的用户语音波形示意图;
图3是两个麦克风拾取到的噪声波形示意图;
图4是语音控制遥控器中的控制单元的一种实施例的系统架构框图;
图5是两个麦克风在声学性能不一致的情况下的频响曲线图;
图6是本发明所提出的语音控制遥控器降噪方法的一种实施例的流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步详细地说明。
需要说明的是,在本发明的描述中,术语“左”、“右”、“前”、“后”等指示方向或者位置关系的术语是基于附图所示的方向或者位置关系,这仅仅是为了便于描述,而不是指示或者暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此,不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或者暗示其相对重要性。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解。例如,可以是固定连接,也可以是可拆卸连接或者一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
本实施例为了解决现有的主动降噪技术,将主麦克风和副麦克风分置于遥控器的前壳体和后壳体上,会导致有用的语音指令波形的增益在降噪的同时也会被削弱的问题,提出了一种将两个麦克风安装在遥控器的同一侧的结构设计。如图1所示,可以将两个麦克风11、12均布设在遥控器的前面板10上,且左右排布或上下排布。例如将第一麦克风11布设在前面板10的左侧,将第二麦克风12布设在前面板10的右侧,且两个麦克风11、12位于同一水平线上。配置两个麦克风11、12之间的距离d与噪声半波长的奇数倍相当,由此可以达到降低噪音的同时,增强语音增益的目的。
由于人耳可以听到的声音的频率范围在20Hz~20000Hz之间,而声速为340m/s,因此,人耳可以听到的声音的波长范围在17mm~17m之间。在确定两个麦克风11、12之间的距离d时,可以根据遥控器的实际应用场景,考虑所需消除的噪声属于哪个频段,进而根据该频段确定噪声波长,根据该噪声波长确定两个麦克风11、12之间的距离d。
举例说明:对于电视机遥控器而言,可以配置两个麦克风11、12之间的距离d在40mm~50mm之间,用于抑制半波长为40mm~50mm的噪声,即,频率在3400Hz~4250Hz的噪声,例如开窗声、装修声音等这类可能对用户语音产生干扰,导致语义识别错误的噪声。
采用上述两个麦克风11、12配置方式,当用户对着两个麦克风11、12发出语音指令时,声音波形以趋于90°方向传播至两个麦克风11、12,如图2所示。此时,两个麦克风11、12接收到的声音波形“幅度相同、相位相同”,叠加后,声音幅度变成两倍,即,产生语音增强的效果。而周围环境的噪声以0°方向传播至两个麦克风11、12,如图3所示。由于两个麦克风11、12之间的距离为半个噪声波长或者半个噪声波长的奇数倍,因此,通过两个麦克风11、12接收到的噪声波形“幅度相同、相位相反”,叠加后刚好相互抵消,即,产生噪声衰减的效果,达到降噪目的。
当然,环境噪声多种多样,噪声波长也不尽相同,本实施例的降噪技术对于半波长或者半个噪声波长的奇数倍趋近于两个麦克风11、12的间距d的噪声而言,抑制效果显然是最好的,对于其他波长的噪声,也能有一定的衰减效果。所以,应选择最想抑制的噪声频段,确定两个麦克风11、12之间的距离d,以获得满意的降噪效果。
采用本实施例的降噪方式,对于两个麦克风11、12的声学性能的一致性问题提出了更高的要求,否则会影响降噪效果。而遥控器在使用过程中,若某个麦克风11/12进灰,或者两个麦克风11、12都进了灰,但进灰程度不同,都会导致两个麦克风11、12的声学性能不一致。此外,也存在遥控器上配置的两个麦克风11、12自身的声学性能就不一致的情况。
为了解决两个麦克风11、12因声学性能不一致,导致降噪效果大打折扣的问题,本实施例提出了一种频响曲线补偿方法,通过调整两个麦克风11、12的频响曲线趋于一致,以弥补两个麦克风11、12在声学性能上的偏差。
频响是频率响应的简称,反映音响系统对于不同频率的反应能力。灵敏度在不同的频率有不同的数值,这就是频率响应。将灵敏度对频率的依赖关系用曲线表示出来,便称为频率响应曲线,简称频响曲线,如图5所示。
要获取两个麦克风11、12的频响曲线,需要为两个麦克风11、12提供音源,供其采集。为了达到理想的频响曲线补偿效果,需要对音源提供方式进行特殊考虑。在本实施例中,优选采用被控设备的开机音乐作为音源,在被控设备开机时,自动完成频响曲线的校准过程。
以被控设备为电视机为例进行说明。在电视机开机时,都会播放一段开机音乐,这段开机音乐一般都涉及多个频段的音频信号,而频响曲线恰恰反映的是不同频点的灵敏度变化,因此,只有多频段音源才适合对频响曲线进行校准,像蜂鸣器等只能发出单频音源的发声器件,显然是无法满足频响曲线的校准需求的,因此不适合应用在本实施例所提出的降噪设计方案中。
将电视机的开机音乐作为音源,供遥控器上的两个麦克风11、12拾取,并生成频响曲线,这样,若两个麦克风11、12的声学性能不一致,则二者所生成的两个频响曲线会在多个频率处表现出灵敏度上的差异,这对于频响曲线的校准显然是非常有利的。同时,选择电视机的开机音乐作为频响曲线的校准音源的另外一个优势是:用户无需特意操作,只需按照常规操作流程,触发遥控器上的开机按键13,控制电视机开机即可,如图1所示。在电视机播放开机音乐的同时,两个麦克风11、12的频响曲线校准过程自动完成,整个过程自然、无突兀,用户完全察觉不到。因此,对于音源的选择以及触发时机的选取,在提高频响曲线的补偿效果以及用户使用满意度上都有着重要的作用。
配置遥控器内的控制单元在用户触发遥控器上的开机按键13控制电视机开机时,启动遥控器上的两个麦克风11、12拾取开机音乐,生成频响曲线。若两个麦克风11、12的声学性能一致,则生成的两条频响曲线基本一致;若两个麦克风11、12的声学性能不一致,则生成的两条频响曲线会存在明显的差异,如图5所示。
为了调整两个麦克风11、12的频响曲线达到相对一致的状态,可以首先计算两个频响曲线在每个频点的灵敏度差值,形成一个数组。然后,根据所述灵敏度差值对其中一个麦克风的频响曲线进行补偿,使得两个麦克风11、12的频响曲线基本一致,继而为后续的降噪过程提供更好的条件。
为了在后续的降噪过程中能够得到更高的语音幅度和更低的噪声,优选对灵敏度低的频响曲线进行补偿,使其与灵敏度高的频响曲线趋于一致。
在本实施例中,可以采用提高增益的方式对频响曲线的灵敏度进行补偿。即,对计算出的灵敏度差值取绝对值,并将所述绝对值作为增益补偿值,对频响曲线的灵敏度低的一个麦克风所输出的信号进行增益补偿,通过提高信号增益,使得该麦克风的频响曲线与灵敏度高的一个麦克风的频响曲线达到相对一致的状态。
为了实现频响曲线的调节,在遥控器的控制单元中可以配置模数转换器、处理模块、比较器和均衡器,如图4所示。其中,模数转换器包括两路,分别为ADC1、ADC2。ADC1用于接收第一麦克风11输出的模拟音频信号,并转换出数字信号后,发送至处理模块,以生成第一麦克风频响曲线。ADC2用于接收第二麦克风12输出的模拟音频信号,并转换出数字信号后,发送至处理模块,以生成第二麦克风频响曲线。处理模块可以将生成的第一麦克风频响曲线和第二麦克风频响曲线发送至比较器进行比较,以获得两个频响曲线的灵敏度差值。对所述灵敏度差值取绝对值,并将所述绝对值作为增益补偿值,发送至均衡器,以用于增益调节。
均衡器EQ是Equalizer的缩写,其作用是调整各频段信号的增益值。本实施例在控制单元中配置有两个均衡器EQ1、EQ2,分别用于对第一麦克风11和第二麦克风12拾取到的音频信号进行增益调节。
在本实施例中,处理模块将增益补偿值发送至频响曲线灵敏度低的一个麦克风所对应的均衡器,以对该麦克风音频通道的各频段的增益值进行补偿。例如,若第一麦克风11的频响曲线的灵敏度高,则处理模块将增益补偿值发送至第二麦克风12所对应的均衡器EQ2,通过提高第二麦克风音频通道的增益值,使第二麦克风12的频响曲线趋于第一麦克风11的频响曲线。反之,若第一麦克风11的频响曲线的灵敏度低,则处理模块将增益补偿值发送至第一麦克风11所对应的均衡器EQ1,通过提高第一麦克风音频通道的增益值,使第一麦克风11的频响曲线趋于第二麦克风12的频响曲线。
在完成两个麦克风频响曲线的校准过程后,处理模块启动降噪模块接收两个麦克风11、12拾取输出的声音信号,并将两路声音信号进行叠加,由此来增强语音幅度,降低噪声幅度,继而提高语音的清晰度。
降噪模块将叠加后的声音信号发送至控制单元中的语音识别模块,进行语义识别,以解析出用户指令,发送至处理模块。处理模块根据解析出的用户指令生成相应的遥控编码,控制遥控器上的发射头14发射遥控信号,结合图1所示,以控制电视机响应用户操作。
当然,所述控制单元也可以采用一颗具有数据处理能力的集成芯片完成上述频响曲线校准、降噪及语义识别等功能,本实施例并不仅限于以上举例。
本实施例可以在遥控器的前面板10上保留原有的按键区15,如图1所示,以满足用户不同的使用需求。
下面结合图6,对本实施例的语音控制遥控器的降噪方法进行详细阐述,具体包括以下过程:
S601、检测遥控器上的开机按键的触发状态,若开机按键被触发,且被控设备受控开机,则执行后续过程;
S602、启动遥控器上的第一麦克风和第二麦克风拾取被控设备播放的开机音乐;
S603、利用第一麦克风和第二麦克风采集到的开机音乐,生成第一麦克风频响曲线和第二麦克风的频响曲线;
S604、计算第一麦克风频响曲线和第二麦克风频响曲线的灵敏度差值;
S605、对所述灵敏度差值取绝对值,形成增益补偿值;
S606、利用所述增益补偿值对灵敏度低的一个麦克风所输出的信号进行增益补偿,通过提高信号增益,使得该麦克风的频响曲线与另外一个麦克风的频响曲线基本一致;
S607、通过第一麦克风和第二麦克风拾取用户语音;
S608、将第一麦克风和第二麦克风采集到的两路声音信号进行波形叠加,以增强语音,衰减噪声;
S609、从叠加后的波形中提取出声音信号进行语义识别,解析出用户指令;
S610、根据解析出的用户指令生成遥控编码;
S611、根据遥控编码控制遥控器上的发射头发射遥控信号,控制被控设备响应用户操作。
本实施例利用被控设备自身的开机音乐作为校准音源,对遥控器上的两个麦克风的声学性能偏差进行补偿和平衡,在达到削弱噪声目的的同时,可以使麦克风采集到的语音指令更加清晰,继而提高了语音识别的准确率。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
Claims (10)
1.一种语音控制遥控器,其特征在于,包括:
开机按键,其用于控制被控设备开机;
两个麦克风,其安装在遥控器的同一侧,二者之间的距离按照半个噪声波长的奇数倍配置;
控制单元,其在所述开机按键控制所述被控设备开机时,启动两个麦克风拾取所述被控设备播放的开机音乐,以获取两个麦克风的频响曲线;计算两个频响曲线的灵敏度差值,根据所述灵敏度差值对其中一个麦克风的频响曲线进行补偿,使两个麦克风的频响曲线达到相对一致的状态;之后,所述控制单元通过所述两个麦克风拾取用户语音,并将获取到的两路声音波形叠加后,提取出语音信号进行语义识别,解析出用户指令。
2.根据权利要求1所述的语音控制遥控器,其特征在于,所述控制单元在进行频响曲线补偿时,对灵敏度低的一个麦克风的频响曲线进行补偿,使其与灵敏度高的一个麦克风的频响曲线趋于一致。
3.根据权利要求2所述的语音控制遥控器,其特征在于,所述控制单元对计算出的灵敏度差值取绝对值,将所述绝对值作为增益补偿值,对频响曲线的灵敏度低的一个麦克风所输出的信号进行增益补偿,通过提高信号增益,使得该麦克风的频响曲线与灵敏度高的一个麦克风的频响曲线一致。
4.根据权利要求3所述的语音控制遥控器,其特征在于,所述控制单元包括:
两路模数转换器,其分别用于将所述两个麦克风输出的模拟信号转换成数字信号;
处理模块,其在检测到所述开机按键控制被控设备开机时,启动所述两个麦克风拾取所述被控设备播放的开机音乐,并接收所述两路模数转换器输出的两路数字信号,根据所述两路数字信号生成两个麦克风的频响曲线;
比较器,其用于对两个所述频响曲线进行比较,输出两个频响曲线的灵敏度差值至所述处理模块;所述处理模块对所述灵敏度差值取绝对值,将所述绝对值作为增益补偿值;
两路均衡器,其分别用于调整两个麦克风音频通道的各频段的增益值;其中,频响曲线灵敏度低的一个麦克风所对应的均衡器接收所述增益补偿值,以对该麦克风音频通道的各频段的增益值进行补偿;
降噪模块,其用于在补偿结束后,接收通过两个麦克风音频通道输出的包含有用户语音的声音信号,并将获取到的两路声音信号叠加,以增强语音,降低噪声;
语义识别模块,其接收所述降噪模块输出的声音信号,进行语义识别,以解析出用户指令后,发送至所述处理模块;所述处理模块根据解析出的用户指令生成相应的遥控编码,控制遥控器上的发射头发射遥控信号。
5.根据权利要求1至4中任一项所述的语音控制遥控器,其特征在于,
所述遥控器上布设有多组麦克风,多组麦克风呈阵列排布,每一组麦克风中均配置有所述的两个麦克风;
所述两个麦克风均安装在遥控器的前面板上,二者之间的距离为半个噪声波长;
所述被控设备播放的开机音乐为具有多频段音频信号的音源。
6.一种语音控制遥控器的降噪方法,在所述遥控器的同一侧,布设有两个麦克风,两个麦克风之间的距离按照半个噪声波长的奇数倍配置;其特征在于,
在遥控器上的开机按键被触发,以控制被控设备开机时,启动所述两个麦克风拾取所述被控设备播放的开机音乐,以获取主麦克风的频响曲线和副麦克风的频响曲线;
计算两个频响曲线的灵敏度差值;
根据所述灵敏度差值对其中一个麦克风的频响曲线进行补偿,使两个麦克风的频响曲线达到相对一致的状态;
补偿结束后,通过所述两个麦克风拾取用户语音,并将获取到的两路声音信号进行波形叠加;
从叠加后的波形中提取出声音信号进行语义识别,以解析出用户指令。
7.根据权利要求6所述的语音控制遥控器的降噪方法,其特征在于,在根据所述灵敏度差值对其中一个麦克风的频响曲线进行补偿时,对灵敏度低的一个麦克风的频响曲线进行补偿,使其与另外一个麦克风的频响曲线一致。
8.根据权利要求7所述的语音控制遥控器的降噪方法,其特征在于,对所述灵敏度低的一个麦克风的频响曲线进行补偿的过程包括:
对计算出的所述灵敏度差值取绝对值;
将所述绝对值作为增益补偿值,对灵敏度低的一个麦克风所输出的信号进行增益补偿,通过提高信号增益,使该麦克风的频响曲线与另外一个麦克风的频响曲线一致。
9.根据权利要求6至8中任一项所述的语音控制遥控器的降噪方法,其特征在于,
在所述遥控器上布设多组麦克风,将所述多组麦克风以阵列的形式排布,并在每一组麦克风中均配置所述的两个麦克风;
配置所述被控设备播放的开机音乐为具有多频段音频信号的音源。
10.一种电视机,其特征在于,其配置有如权利要求1至5中任一项所述的语音控制遥控器,所述被控设备为电视机的主机,所述主机在开机时播放开机音乐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210533670.4A CN114979734B (zh) | 2022-05-17 | 2022-05-17 | 一种语音控制遥控器及其降噪方法和电视机 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210533670.4A CN114979734B (zh) | 2022-05-17 | 2022-05-17 | 一种语音控制遥控器及其降噪方法和电视机 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114979734A true CN114979734A (zh) | 2022-08-30 |
CN114979734B CN114979734B (zh) | 2024-04-02 |
Family
ID=82983971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210533670.4A Active CN114979734B (zh) | 2022-05-17 | 2022-05-17 | 一种语音控制遥控器及其降噪方法和电视机 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114979734B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5937070A (en) * | 1990-09-14 | 1999-08-10 | Todter; Chris | Noise cancelling systems |
WO2014163231A1 (ko) * | 2013-04-05 | 2014-10-09 | 주식회사 금영 | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 |
CN206283621U (zh) * | 2016-12-09 | 2017-06-27 | 康佳集团股份有限公司 | 一种智能遥控器 |
CN108260051A (zh) * | 2018-01-15 | 2018-07-06 | 深圳前海黑鲸科技有限公司 | 语音遥控系统、便携式传输设备及智能设备 |
US20190180738A1 (en) * | 2016-08-26 | 2019-06-13 | Samsung Electronics Co., Ltd. | Portable device for controlling external device, and audio signal processing method therefor |
CN114333817A (zh) * | 2021-12-02 | 2022-04-12 | 歌尔科技有限公司 | 遥控器及遥控器语音识别方法 |
-
2022
- 2022-05-17 CN CN202210533670.4A patent/CN114979734B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5937070A (en) * | 1990-09-14 | 1999-08-10 | Todter; Chris | Noise cancelling systems |
WO2014163231A1 (ko) * | 2013-04-05 | 2014-10-09 | 주식회사 금영 | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 |
US20190180738A1 (en) * | 2016-08-26 | 2019-06-13 | Samsung Electronics Co., Ltd. | Portable device for controlling external device, and audio signal processing method therefor |
CN206283621U (zh) * | 2016-12-09 | 2017-06-27 | 康佳集团股份有限公司 | 一种智能遥控器 |
CN108260051A (zh) * | 2018-01-15 | 2018-07-06 | 深圳前海黑鲸科技有限公司 | 语音遥控系统、便携式传输设备及智能设备 |
CN114333817A (zh) * | 2021-12-02 | 2022-04-12 | 歌尔科技有限公司 | 遥控器及遥控器语音识别方法 |
Non-Patent Citations (1)
Title |
---|
支艳利;张云伟;: "基于环形麦克风阵列的远场语音识别系统", 微型电脑应用, no. 04, 20 April 2017 (2017-04-20), pages 62 - 64 * |
Also Published As
Publication number | Publication date |
---|---|
CN114979734B (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4792156B2 (ja) | マイクロホンアレイを有するボイス制御システム | |
EP1278183B1 (en) | Voice operated electronic appliance | |
EP3217686B1 (en) | System and method for enhancing performance of audio transducer based on detection of transducer status | |
US9531338B2 (en) | Signal processing apparatus, signal processing method, program, signal processing system, and communication terminal | |
EP3080801B1 (en) | Systems and methods for bandlimiting anti-noise in personal audio devices having adaptive noise cancellation | |
CN102440007B (zh) | 使用无线流传输的信号增强的装置和方法 | |
WO2014196399A1 (ja) | 入力デバイス及び送信方法、ホストデバイス及び受信方法、並びに、信号処理システム及び送受信方法 | |
JPH10282993A (ja) | 機器の音声作動式遠隔制御システム | |
CN108447483B (zh) | 语音识别系统 | |
CN109218885A (zh) | 耳机校准结构、耳机及其校准方法、计算机程序存储介质 | |
CN208691496U (zh) | 耳机校准结构及其耳机 | |
CN110521115A (zh) | 声音换能器和声音产生单元的放大器单元 | |
EP2482566B1 (en) | Method for generating an audio signal | |
CN105049976A (zh) | 一种声音降噪的方法、耳机和终端 | |
CN114979734B (zh) | 一种语音控制遥控器及其降噪方法和电视机 | |
KR20200033617A (ko) | 차량용 음성 인식 장치 및 그 제어 방법 | |
US20110142271A1 (en) | Method for frequency transposition in a hearing aid and hearing aid | |
US10424316B2 (en) | Audio processing apparatus and audio processing method | |
CN106507242A (zh) | 一种音频装置及终端 | |
CN205029822U (zh) | 数字话筒 | |
CN109348385A (zh) | 一种具有回声消声系统的麦克风及电子设备 | |
CN107197403B (zh) | 一种终端音频参数管理方法、装置及系统 | |
KR20180071930A (ko) | 음향신호 인식용 무선 원격 제어기 | |
CN107544769B (zh) | 基于振动电机采集语音命令的方法及音频组件、音频终端 | |
CN209390369U (zh) | 一种具有回声消声系统的麦克风及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |