CN106548783A - 语音增强方法、装置及智能音箱、智能电视 - Google Patents
语音增强方法、装置及智能音箱、智能电视 Download PDFInfo
- Publication number
- CN106548783A CN106548783A CN201611135608.0A CN201611135608A CN106548783A CN 106548783 A CN106548783 A CN 106548783A CN 201611135608 A CN201611135608 A CN 201611135608A CN 106548783 A CN106548783 A CN 106548783A
- Authority
- CN
- China
- Prior art keywords
- signal
- microphone array
- reference signal
- sound
- array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- ONUFESLQCSAYKA-UHFFFAOYSA-N iprodione Chemical compound O=C1N(C(=O)NC(C)C)CC(=O)N1C1=CC(Cl)=CC(Cl)=C1 ONUFESLQCSAYKA-UHFFFAOYSA-N 0.000 claims description 12
- 230000008030 elimination Effects 0.000 claims description 6
- 238000003379 elimination reaction Methods 0.000 claims description 6
- 239000004568 cement Substances 0.000 claims description 4
- 230000005236 sound signal Effects 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 2
- 238000006243 chemical reaction Methods 0.000 description 6
- 241000209140 Triticum Species 0.000 description 5
- 235000021307 Triticum Nutrition 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 2
- RKTYLMNFRDHKIL-UHFFFAOYSA-N copper;5,10,15,20-tetraphenylporphyrin-22,24-diide Chemical compound [Cu+2].C1=CC(C(=C2C=CC([N-]2)=C(C=2C=CC=CC=2)C=2C=CC(N=2)=C(C=2C=CC=CC=2)C2=CC=C3[N-]2)C=2C=CC=CC=2)=NC1=C3C1=CC=CC=C1 RKTYLMNFRDHKIL-UHFFFAOYSA-N 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供一种语音增强方法、装置及智能音箱、智能电视,该语音增强方法首先由智能音箱上设置的麦克风阵列拾取音箱播放的音乐原声和人说话产生的语音人声,经ADC转换为多路数字信号,然后由FPGA将所述多路数字信号转成一路数字信号,送至CPU,由CPU从所述一路数字信号中获取回声消除的参考信号,最后基于所述参考信号利用AEC算法用所述参考信号抵消麦克风阵列拾取的音乐原声信号,输出语音人声数据。本发明直接从麦克风阵列中提取信号作为回声消除的参考信号,无需修改音箱电路,保证音箱的完整性,语音识别准确,输出音频信号强,功率大。
Description
技术领域
本发明涉及智能电视技术领域,尤其涉及一种语音增强方法、装置及智能音箱、智能电视。
背景技术
在目前的智能音箱系统中,音箱在播放音乐的时候,麦克风会把播放出去的音乐采集回来,这个时候有人对着音箱进行说话时,就会和音乐声音混在一起,语音识别就无法识别,因此人声采集需要做AEC处理,AEC算法要求专门从音箱的喇叭电路上接出一路音频作为参考信号。作为麦克风阵列模组,若需要当前的智能音箱或设备支持远场识别,就必须要从电路上进行改造,接出喇叭输出音频作为参考信号。
发明内容
本发明的主要目的在于提供一种语音增强方法,旨在解决现有智能音箱设备支持语音识别时,必须从电路上接出一路音频作为参考信号的技术问题。
为实现上述目的,本发明提出一种语音增强方法,应用于智能音箱,所述智能音箱设有至少一对相对称的喇叭及与所述喇叭的出声口平行设置的麦克风阵列,该语音增强方法包括以下步骤:
将麦克风阵列拾取的音乐原声和语音人声经ADC转换为多路数字信号;
获取所述多路数字信号经转换阵列转换成的一路数字信号;
从所述一路数字信号中获取回声消除的参考信号;
基于所述参考信号利用AEC算法进行所述音乐原声的消除,输出语音人声数据。
进一步地,所述从所述一路数字信号中获取回声消除的参考信号的步骤包括:
在所述麦克风阵列中,设定近端信号;
依据所述近端信号,计算该麦克风阵列的参考信号。
进一步地,若所述麦克风阵列为奇数环形阵列,所述参考信号的计算公式为ref=(an-1+an)*r,其中,ref为参考信号,设定anear为麦克风阵列中的一近端信号,则an-1和an为麦克风阵列中近端信号anear的两相邻的对端信号,r为能量系数,0≤r≤1.0。
进一步地,若所述麦克风阵列为偶数环形阵列,则所述参考信号的计算公式为ref=(an-1+an)*0.5,其中,ref为参考信号,设定anear1和anear2为麦克风阵列中的两相邻的近端信号,则an-1和an为麦克风阵列中近端信号anear1和anear2的两相邻的对端信号。
本发明的另一目的在于提供一种语音增强装置,应用于智能音箱,所述智能音箱设有至少一对相对称的喇叭及与所述喇叭的出声口平行设置的麦克风阵列,该语音增强装置包括:
音频拾取模块,将麦克风阵列拾取的音乐原声和语音人声经ADC转换为多路数字信号;
数字信号获取模块,获取所述多路数字信号经转换数列转换成的一路数字信号;
参考信号获取模块,从所述一路数字信号中获取回声消除的参考信号;
回声消除模块,基于所述参考信号利用AEC算法进行所述音乐原声的消除,输出语音人声数据。
进一步地,所述参考信号获取模块包括:
设定单元,在所述麦克风阵列中,设定近端信号;
计算单元,依据所述近端信号,计算该麦克风阵列的参考信号。
进一步地,若所述麦克风阵列为奇数环形阵列,所述参考信号的计算公式为ref=(an-1+an)*r,其中,ref为参考信号,设定anear为麦克风阵列中的一近端信号,则an-1和an为麦克风阵列中近端信号anear的两相邻的对端信号,r为能量系数,0≤r≤1.0。
进一步地,若所述麦克风阵列为偶数环形阵列,则所述参考信号的计算公式为ref=(an-1+an)*0.5,其中,ref为参考信号,设定anear1和anear2为麦克风阵列中的两相邻的近端信号,则an-1和an为麦克风阵列中近端信号anear1和anear2的两相邻的对端信号。
本发明还提供一种智能音箱,该智能音箱包括如上所述的语音增强装置。
本发明还提供一种智能电视,该智能电视包括如上所述的智能音箱。
本发明的语音增强方法,应用于包括对称设置的若干喇叭及与所述喇叭平行设置的麦克风阵列的智能音箱,智能音箱进行语音增强时,首先由智能音箱上设置的麦克风阵列拾取音箱播放的音乐原声和人说话产生的语音人声,经ADC转换为多路数字信号,然后由转换阵列将所述多路数字信号转成一路数字信号,送至CPU,由CPU从所述一路数字信号中获取回声消除的参考信号,最后基于所述参考信号利用AEC算法用所述参考信号抵消麦克风阵列拾取的音乐原声信号,输出语音人声数据。本发明的语音增强方法,直接从麦克风阵列中提取信号作为回声消除的参考信号,无需修改音箱电路,保证音箱的完整性,语音识别准确,输出音频信号强,功率大。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明的语音增强方法一实施例的流程图;
图2为图1中步骤S30的具体流程图;
图3为本发明中麦克风阵列一实施例的示意图;
图4为本发明中麦克风阵列另一实施例的示意图;
图5为本发明的语音增强装置一实施例的功能模块图。
附图标号说明:
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种语音增强方法。
参照图1,图1为本发明的语音增强方法一实施例的流程图。
在本实施例中,该语音增强方法应用于智能音箱,所述智能音箱设有至少一对相对称的喇叭及与所述喇叭的出声口平行设置的麦克风阵列,该语音增强方法包括以下步骤:
S10:将麦克风阵列拾取的音乐原声和语音人声经ADC转换为多路数字信号;
S20:获取所述多路数字信号经转换阵列转换成的一路数字信号;
S30:从所述一路数字信号中获取回声消除的参考信号;
S40:基于所述参考信号利用AEC算法进行所述音乐原声的消除,输出语音人声数据。
在本实施例中,该语音增强方法应用的智能音箱为一圆柱体,在其他实施例中也可以是四方体或圆锥体结构,在该圆柱体智能音箱的侧面设置有两两对称的4个喇叭,在其他实施例中,也可以是6个、8个或其他复数个喇叭,只要这些喇叭在声学上的保持对称关系,在该圆柱体的顶面设置有一麦克风阵列,该麦克风阵列与所述喇叭的出声口所在的平面平行,以使得每一麦克风接收到的音乐原声信号的功率相同。
在智能音箱播放音乐并检测到语音人声时,由智能音箱上设置的麦克风阵列拾取的音箱播放的音乐原声和检测到的语音人声,经I2S协议送至ADC转换为多路数字信号,然后由转换阵列将所述多路数字信号转成一路数字信号,所述转换阵列为FPGA阵列,经I2S协议发送至CPU,以缓解CPU的处理压力,防止CPU卡顿或卡死,CPU接收到所述数字信号后,从所述一路数字信号中获取回声消除的参考信号,最后基于所述参考信号利用AEC算法用所述参考信号抵消麦克风阵列拾取的音乐原声信号,输出语音人声数据。
本实施例的语音增强方法,首先由麦克风阵列拾取的音箱播放的音乐原声和人说话产生的语音人声,经ADC转换为多路数字信号,然后由FPGA将所述多路数字信号转成一路数字信号,送至CPU,由CPU从所述一路数字信号中获取回声消除的参考信号,最后基于所述参考信号利用AEC算法用所述参考信号抵消麦克风阵列拾取的音乐原声信号,输出语音人声数据,直接从麦克风阵列中提取信号作为回声消除的参考信号,无需修改音箱电路,保证音箱的完整性,语音识别准确,输出音频信号强,功率大。
进一步地,参照图2,基于上述实施例的语音增强方法,步骤S30包括:
S31:在所述麦克风阵列中,设定近端信号;
S32:依据所述近端信号,计算该麦克风阵列的参考信号。
在本实施例中,CPU从所述数字信号中获取回声消除的参考信号时,首先需要在麦克风阵列中,设定一麦克风作为近端信号的采集点,该采集点一般为与人声声源距离最近的麦克风位置,然后依据设定的近端信号获取近端信号的对端信号计算该麦克风阵列的参考信号。
进一步地,基于上述实施例的语音增强方法,若所述麦克风阵列为奇数环形阵列,该麦克风阵列的参考信号的计算公式为ref=(an-1+an)*r,其中,ref为参考信号,设定anear为麦克风阵列中的一近端信号,则an-1和an为麦克风阵列中近端信号anear的两相邻的对端信号,r为能量系数,0≤r≤1.0。
基于上述实施例的语音增强方法,参照图3,该麦克风阵列由编号为0、1、2、3、4、5、6的7个麦克风组成一环形阵列,如果设定4号麦克风为近端信号的采集点,则a0和a1就成为了近端信号a4的对端信号,则该麦克风阵列的参考信号ref=(a0+a1)*r,由于麦克风阵列中每一麦克风获取的音乐原声的信号功率相同,也即任意两相邻的麦克风都可以作为对端信号的采集点,也即在同一麦克风阵列中无论选择哪一麦克风作为近端信号的采集点,最后计算得出的参考信号ref都是相同的,所以在麦克风阵列中只要有一近端信号,就可以依据公式ref=(an-1+an)*r计算得出该麦克风阵列的参考信号。
进一步地,基于上述实施例的语音增强方法,若所述麦克风阵列为偶数环形阵列,该麦克风阵列的参考信号的计算公式为ref=(an-1+an)*0.5,其中,ref为参考信号,设定anear1和anear2为麦克风阵列中的两相邻的近端信号,则an-1和an为麦克风阵列中近端信号anear1和anear2的两相邻的对端信号。
基于上述实施例的语音增强方法,参照图4,该麦克风阵列由编号为0、1、2、3、4、5的6个麦克风组成一环形阵列,如果设定3号和4号麦克风为近端信号的采集点,则则a0和a1就成为了近端信号a3和a4的对端信号,则该麦克风阵列的参考信号ref=(a0+a1)*0.5,由于麦克风阵列中每一麦克风获取的音乐原声的信号功率相同,也即任意两相邻的麦克风都可以作为对端信号的采集点,也即在同一麦克风阵列中无论选择哪两个相邻的麦克风作为近端信号的采集点,最后计算得出的参考信号ref都是相同的,所以在麦克风阵列中只要有一组近端信号,就可以依据公式ref=(an-1+an)*0.5计算得出该麦克风阵列的参考信号。
本发明进一步提供一种语音增强装置100。
参照图5,图5为本发明的语音增强装置一实施例的功能模块图。
在本实施例中,该语音增强装置100,应用于智能音箱,所述智能音箱设有至少一对相对称的喇叭及与所述喇叭的出声口平行设置的麦克风阵列该语音增强装置100包括:
音频拾取模块10,将麦克风阵列拾取的音乐原声和语音人声经ADC转换为多路数字信号;
数字信号获取模块20,获取所述多路数字信号经转换阵列转换成的一路数字信号;
参考信号获取模块30,从所述一路数字信号中获取回声消除的参考信号;
回声消除模块40,基于所述参考信号利用AEC算法进行所述音乐原声的消除,输出语音人声数据。
在本实施例中,该语音增强装置100包括音频拾取模块10、数字信号获取模块20、参考信号获取模块30、及回声消除模块40,该语音增强装置100应用的智能音箱为一圆柱体,在其他实施例中也可以是四方体或圆锥体结构,在该圆柱体智能音箱的侧面设置有两两对称的4个喇叭,在其他实施例中,也可以是6个、8个或其他复数个喇叭,只要这些喇叭在声学上的保持对称关系,在该圆柱体的顶面设置有一麦克风阵列,该麦克风阵列与所述喇叭的出声口所在的平面平行,以使得每一麦克风接收到的音乐原声信号的功率相同。
在智能音箱播放音乐并检测到语音人声时,音频拾取模块10将麦克风阵列拾取的音箱播放的音乐原声和检测到的语音人声,经I2S协议送至ADC转换为多路数字信号,然后由数字信号获取模块20控制转换阵列将所述多路数字信号转成一路数字信号,经I2S协议发送至CPU,以缓解CPU的处理压力,防止CPU卡顿或卡死,所述转换阵列为FPGA阵列,CPU接收到所述一路数字信号后,由参考信号获取模块30从所述一路数字信号中获取回声消除的参考信号,最后由回声消除模块40基于所述参考信号利用AEC算法用所述参考信号抵消麦克风阵列拾取的音乐原声信号,输出语音人声数据。
本实施例的语音增强装置,首先由音频拾取模块10将麦克风阵列拾取音箱播放的音乐原声和人说话产生的语音人声经ADC转换为多路数字信号,然后由数字信号获取模块20控制FPGA将所述多路数字信号转成一路数字信号,送至CPU,由参考信号获取模块30从所述数字信号中获取回声消除的参考信号,最后由回声消除模块40基于所述参考信号利用AEC算法用所述参考信号抵消麦克风阵列拾取的音乐原声信号,输出语音人声数据,直接从麦克风阵列中提取信号作为回声消除的参考信号,无需修改音箱电路,保证音箱的完整性,语音识别准确,输出音频信号强,功率大。
进一步地,参照图5,基于上述实施例的语音增强装置,参考信号获取模块30包括:
设定单元31,在所述麦克风阵列中,设定近端信号;
计算单元32,依据所述近端信号,计算该麦克风阵列的参考信号。
在本实施例中,该语音增强装置100的参考信号模块30包括设定单元31和计算单元32,CPU对所述数字信号处理时,从中获取回声消除的参考信号,通过设定单元31在麦克风阵列中,设定一麦克风作为近端信号的采集点,该近端信号一般在与人声声源距离最近的麦克风位置进行采集,然后由计算单元32依据设定的近端信号获取近端信号的对端信号,再根据所述对端信号计算该麦克风阵列的参考信号。
进一步地,基于上述实施例的语音增强装置,若所述麦克风阵列为奇数环形阵列,该麦克风阵列的参考信号的计算公式为ref=(an-1+an)*r,其中,ref为参考信号,设定anear为麦克风阵列中的一近端信号,则an-1和an为麦克风阵列中近端信号anear的两相邻的对端信号,r为能量系数,0≤r≤1.0。
基于上述实施例的语音增强装置,参照图3,该麦克风阵列由编号为0、1、2、3、4、5、6的7个麦克风组成一环形阵列,如果设定4号麦克风为近端信号的采集点,则a0和a1就成为了近端信号a4的对端信号,则该麦克风阵列的参考信号ref=(a0+a1)*r,由于麦克风阵列中每一麦克风获取的音乐原声的信号功率相同,也即任意两相邻的麦克风都可以作为对端信号的采集点,也即在同一麦克风阵列中无论选择哪一麦克风作为近端信号的采集点,最后计算得出的参考信号ref都是相同的,所以在麦克风阵列中只要有一近端信号,就可以依据公式ref=(an-1+an)*r计算得出该麦克风阵列的参考信号。
进一步地,基于上述实施例的语音增强装置,若所述麦克风阵列为偶数环形阵列,该麦克风阵列的参考信号的计算公式为ref=(an-1+an)*0.5,其中,ref为参考信号,设定anear1和anear2为麦克风阵列中的两相邻的近端信号,则an-1和an为麦克风阵列中近端信号anear1和anear2的两相邻的对端信号。
基于上述实施例的语音增强装置,参照图4,该麦克风阵列由编号为0、1、2、3、4、5的6个麦克风组成一环形阵列,如果设定3号和4号麦克风为近端信号的采集点,则则a0和a1就成为了近端信号a3和a4的对端信号,则该麦克风阵列的参考信号ref=(a0+a1)*0.5,由于麦克风阵列中每一麦克风获取的音乐原声的信号功率相同,也即任意两相邻的麦克风都可以作为对端信号的采集点,也即在同一麦克风阵列中无论选择哪两个相邻的麦克风作为近端信号的采集点,最后计算得出的参考信号ref都是相同的,所以在麦克风阵列中只要有一组近端信号,就可以依据公式ref=(an-1+an)*0.5计算得出该麦克风阵列的参考信号。
本发明还提供一种智能音箱,该智能音箱包括如上所述的语音增强装置100。
在本实施例中,该智能音箱为一圆柱体音箱,其侧面设置有两两对称的4个喇叭,其顶面设置有一由7个麦克风构成的麦克风阵列,该麦克风阵列与所述4个喇叭所在的平面平行,以使得每一麦克风接收到的音乐原声信号的功率相同。该智能音箱还包括CPU、ADC、及FPGA,所述麦克风阵列与FPGA电性连接,FPGA通过I2S协议与ADC连接,ADC通过I2S协议与CPU连接,在智能音箱播放音乐并检测到语音人声时,音频拾取模块10将麦克风阵列拾取的音箱播放的音乐原声和检测到的语音人声,经I2S协议送至ADC转换为多路数字信号,然后由数字信号获取模块20控制FPGA将所述多路数字信号转成一路数字信号,经I2S协议发送至CPU,以缓解CPU的处理压力,防止CPU卡顿或卡死,CPU接收到所述数字信号后,由参考信号获取模块30从所述数字信号中获取回声消除的参考信号,最后由回声消除模块40基于所述参考信号利用AEC算法用所述参考信号抵消麦克风阵列拾取的音乐原声信号,输出语音人声数据,语音识别准确,输出音频信号强,功率大。
本发明还提供一种智能电视,该智能电视包括如上所述的智能音箱。
在该实施例中,该智能电视应用了如上所述的智能音箱,该智能音箱为一圆柱体音箱,其侧面设置有两两对称的4个喇叭,其顶面设置有一由7个麦克风构成的麦克风阵列,该麦克风阵列与所述4个喇叭所在的平面平行,以使得每一麦克风接收到的音乐原声信号的功率相同。该智能音箱还包括CPU、ADC、及FPGA,所述麦克风阵列与FPGA电性连接,FPGA通过I2S协议与ADC连接,ADC通过I2S协议与CPU连接,在智能音箱播放音乐并检测到语音人声时,音频拾取模块10将麦克风阵列拾取的音箱播放的音乐原声和检测到的语音人声,经I2S协议送至ADC转换为多路数字信号,然后由数字信号获取模块20控制FPGA将所述多路数字信号转成一路数字信号,经I2S协议发送至CPU,以缓解CPU的处理压力,防止CPU卡顿或卡死,CPU接收到所述数字信号后,由参考信号获取模块30从所述数字信号中获取回声消除的参考信号,最后由回声消除模块40基于所述参考信号利用AEC算法用所述参考信号抵消麦克风阵列拾取的音乐原声信号,输出语音人声数据,在用户对着该智能电视讲话时,可以输出准确和清晰的语音人声。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种语音增强方法,应用于智能音箱,其特征在于,所述智能音箱设有至少一对相对称的喇叭及与所述喇叭的出声口平行设置的麦克风阵列,该语音增强方法包括以下步骤:
将麦克风阵列拾取的音乐原声和语音人声经ADC转换为多路数字信号;
获取所述多路数字信号经转换阵列转换成的一路数字信号;
从所述一路数字信号中获取回声消除的参考信号;
基于所述参考信号利用AEC算法进行所述音乐原声的消除,输出语音人声数据。
2.如权利要求1所述的语音增强方法,其特征在于,所述从所述一路数字信号中获取回声消除的参考信号的步骤包括:
在所述麦克风阵列中,设定近端信号;
依据所述近端信号,计算该麦克风阵列的参考信号。
3.如权利要求1或2所述的语音增强方法,其特征在于,若所述麦克风阵列为奇数环形阵列,所述参考信号的计算公式为ref=(an-1+an)*r,其中,ref为参考信号,设定anear为麦克风阵列中的一近端信号,则an-1和an为麦克风阵列中近端信号anear的两相邻的对端信号,r为能量系数,0≤r≤1.0。
4.如权利要求1或2所述的语音增强方法,其特征在于,若所述麦克风阵列为偶数环形阵列,则所述参考信号的计算公式为ref=(an-1+an)*0.5,其中,ref为参考信号,设定anear1和anear2为麦克风阵列中的两相邻的近端信号,则an-1和an为麦克风阵列中近端信号anear1和anear2的两相邻的对端信号。
5.一种语音增强装置,应用于智能音箱,其特征在于,所述智能音箱设有至少一对相对称的喇叭及与所述喇叭的出声口平行设置的麦克风阵列,该语音增强装置包括:
音频拾取模块,将麦克风阵列拾取的音乐原声和语音人声经ADC转换为多路数字信号;
数字信号获取模块,获取所述多路数字信号经转换阵列转换成的一路数字信号;
参考信号获取模块,从所述一路数字信号中获取回声消除的参考信号;
回声消除模块,基于所述参考信号利用AEC算法进行所述音乐原声的消除,输出语音人声数据。
6.如权利要求5所述的语音增强装置,其特征在于,所述参考信号获取模块包括:
设定单元,在所述麦克风阵列中,设定近端信号;
计算单元,依据所述近端信号,计算该麦克风阵列的参考信号。
7.如权利要求5或6所述的语音增强装置,其特征在于,若所述麦克风阵列为奇数环形阵列,所述参考信号的计算公式为ref=(an-1+an)*r,其中,ref为参考信号,设定anear为麦克风阵列中的一近端信号,则an-1和an为麦克风阵列中近端信号anear的两相邻的对端信号,r为能量系数,0≤r≤1.0。
8.如权利要求5或6所述的语音增强装置,其特征在于,若所述麦克风阵列为偶数环形阵列,则所述参考信号的计算公式为ref=(an-1+an)*0.5,其中,ref为参考信号,设定anear1和anear2为麦克风阵列中的两相邻的近端信号,则an-1和an为麦克风阵列中近端信号anear1和anear2的两相邻的对端信号。
9.一种智能音箱,其特征在于,该智能音箱包括如权利要求5-6任一项所述的语音增强装置。
10.一种智能电视,其特征在于,该智能电视包括如权利要求9所述的智能音箱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611135608.0A CN106548783B (zh) | 2016-12-09 | 2016-12-09 | 语音增强方法、装置及智能音箱、智能电视 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611135608.0A CN106548783B (zh) | 2016-12-09 | 2016-12-09 | 语音增强方法、装置及智能音箱、智能电视 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106548783A true CN106548783A (zh) | 2017-03-29 |
CN106548783B CN106548783B (zh) | 2020-07-14 |
Family
ID=58397560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611135608.0A Active CN106548783B (zh) | 2016-12-09 | 2016-12-09 | 语音增强方法、装置及智能音箱、智能电视 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106548783B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107105366A (zh) * | 2017-06-15 | 2017-08-29 | 歌尔股份有限公司 | 一种多通道回声消除电路、方法和智能设备 |
CN107396158A (zh) * | 2017-08-21 | 2017-11-24 | 深圳创维-Rgb电子有限公司 | 一种声控交互装置、声控交互方法和电视机 |
CN107452395A (zh) * | 2017-08-23 | 2017-12-08 | 深圳创维-Rgb电子有限公司 | 一种语音信号回声消除装置及电视机 |
CN107481729A (zh) * | 2017-09-13 | 2017-12-15 | 百度在线网络技术(北京)有限公司 | 一种将智能终端升级为远场语音智能设备的方法及系统 |
CN107966910A (zh) * | 2017-11-30 | 2018-04-27 | 深圳Tcl新技术有限公司 | 语音处理方法、智能音箱及可读存储介质 |
WO2019037732A1 (zh) * | 2017-08-23 | 2019-02-28 | 深圳创维-Rgb电子有限公司 | 麦克风阵列的电视机及电视系统 |
CN109448724A (zh) * | 2018-12-29 | 2019-03-08 | 深圳市慧声信息科技有限公司 | 一种具备语音中断功能的智能故事机及其实现方法 |
CN112216295A (zh) * | 2019-06-25 | 2021-01-12 | 大众问问(北京)信息科技有限公司 | 一种声源定位方法、装置及设备 |
CN112567330A (zh) * | 2018-11-30 | 2021-03-26 | 华为技术有限公司 | 一种语音识别方法、设备及系统 |
CN113079401A (zh) * | 2021-03-29 | 2021-07-06 | 海信视像科技股份有限公司 | 显示设备及回声消除方法 |
CN113411698A (zh) * | 2021-06-21 | 2021-09-17 | 歌尔科技有限公司 | 音频信号处理方法及智能音箱 |
WO2022091591A1 (ja) * | 2020-10-30 | 2022-05-05 | Jfeアドバンテック株式会社 | 音源方位標定装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040220800A1 (en) * | 2003-05-02 | 2004-11-04 | Samsung Electronics Co., Ltd | Microphone array method and system, and speech recognition method and system using the same |
CN1613109A (zh) * | 2002-01-09 | 2005-05-04 | 皇家飞利浦电子股份有限公司 | 具有与频谱功率比值相关的处理器的音频增强系统 |
CN101903948A (zh) * | 2007-12-19 | 2010-12-01 | 高通股份有限公司 | 用于基于多麦克风的语音增强的系统、方法及设备 |
US20110181452A1 (en) * | 2010-01-28 | 2011-07-28 | Dsp Group, Ltd. | Usage of Speaker Microphone for Sound Enhancement |
US20130216064A1 (en) * | 2010-10-29 | 2013-08-22 | Mightyworks Co., Ltd. | Multi-beam sound system |
CN104065798A (zh) * | 2013-03-21 | 2014-09-24 | 华为技术有限公司 | 声音信号处理方法及设备 |
CN104464739A (zh) * | 2013-09-18 | 2015-03-25 | 华为技术有限公司 | 音频信号处理方法及装置、差分波束形成方法及装置 |
CN105989850A (zh) * | 2016-06-29 | 2016-10-05 | 北京捷通华声科技股份有限公司 | 一种回声对消方法及装置 |
-
2016
- 2016-12-09 CN CN201611135608.0A patent/CN106548783B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1613109A (zh) * | 2002-01-09 | 2005-05-04 | 皇家飞利浦电子股份有限公司 | 具有与频谱功率比值相关的处理器的音频增强系统 |
US20040220800A1 (en) * | 2003-05-02 | 2004-11-04 | Samsung Electronics Co., Ltd | Microphone array method and system, and speech recognition method and system using the same |
CN101903948A (zh) * | 2007-12-19 | 2010-12-01 | 高通股份有限公司 | 用于基于多麦克风的语音增强的系统、方法及设备 |
US20110181452A1 (en) * | 2010-01-28 | 2011-07-28 | Dsp Group, Ltd. | Usage of Speaker Microphone for Sound Enhancement |
US20130216064A1 (en) * | 2010-10-29 | 2013-08-22 | Mightyworks Co., Ltd. | Multi-beam sound system |
CN104065798A (zh) * | 2013-03-21 | 2014-09-24 | 华为技术有限公司 | 声音信号处理方法及设备 |
CN104464739A (zh) * | 2013-09-18 | 2015-03-25 | 华为技术有限公司 | 音频信号处理方法及装置、差分波束形成方法及装置 |
CN105989850A (zh) * | 2016-06-29 | 2016-10-05 | 北京捷通华声科技股份有限公司 | 一种回声对消方法及装置 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107105366A (zh) * | 2017-06-15 | 2017-08-29 | 歌尔股份有限公司 | 一种多通道回声消除电路、方法和智能设备 |
CN107105366B (zh) * | 2017-06-15 | 2022-09-23 | 歌尔股份有限公司 | 一种多通道回声消除电路、方法和智能设备 |
CN107396158A (zh) * | 2017-08-21 | 2017-11-24 | 深圳创维-Rgb电子有限公司 | 一种声控交互装置、声控交互方法和电视机 |
CN107452395A (zh) * | 2017-08-23 | 2017-12-08 | 深圳创维-Rgb电子有限公司 | 一种语音信号回声消除装置及电视机 |
WO2019037732A1 (zh) * | 2017-08-23 | 2019-02-28 | 深圳创维-Rgb电子有限公司 | 麦克风阵列的电视机及电视系统 |
CN107481729A (zh) * | 2017-09-13 | 2017-12-15 | 百度在线网络技术(北京)有限公司 | 一种将智能终端升级为远场语音智能设备的方法及系统 |
CN107966910A (zh) * | 2017-11-30 | 2018-04-27 | 深圳Tcl新技术有限公司 | 语音处理方法、智能音箱及可读存储介质 |
CN107966910B (zh) * | 2017-11-30 | 2021-08-03 | 深圳Tcl新技术有限公司 | 语音处理方法、智能音箱及可读存储介质 |
CN112567330A (zh) * | 2018-11-30 | 2021-03-26 | 华为技术有限公司 | 一种语音识别方法、设备及系统 |
CN109448724B (zh) * | 2018-12-29 | 2022-03-04 | 思必驰科技股份有限公司 | 一种具备语音中断功能的智能故事机及其实现方法 |
CN109448724A (zh) * | 2018-12-29 | 2019-03-08 | 深圳市慧声信息科技有限公司 | 一种具备语音中断功能的智能故事机及其实现方法 |
CN112216295A (zh) * | 2019-06-25 | 2021-01-12 | 大众问问(北京)信息科技有限公司 | 一种声源定位方法、装置及设备 |
CN112216295B (zh) * | 2019-06-25 | 2024-04-26 | 大众问问(北京)信息科技有限公司 | 一种声源定位方法、装置及设备 |
WO2022091591A1 (ja) * | 2020-10-30 | 2022-05-05 | Jfeアドバンテック株式会社 | 音源方位標定装置 |
CN113079401A (zh) * | 2021-03-29 | 2021-07-06 | 海信视像科技股份有限公司 | 显示设备及回声消除方法 |
CN113411698A (zh) * | 2021-06-21 | 2021-09-17 | 歌尔科技有限公司 | 音频信号处理方法及智能音箱 |
Also Published As
Publication number | Publication date |
---|---|
CN106548783B (zh) | 2020-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106548783A (zh) | 语音增强方法、装置及智能音箱、智能电视 | |
US20200265834A1 (en) | Detection of replay attack | |
CN113889138B (zh) | 一种基于双麦克风阵列的目标语音提取方法 | |
US10277750B2 (en) | Method and system for improving echo in hands-free call of mobile terminal | |
CN101656908A (zh) | 控制声音聚焦的方法、通讯设备及通讯系统 | |
CN105245355A (zh) | 智能语音速记会议系统 | |
CN205754809U (zh) | 一种机器人自适应音量调节系统 | |
CN106293599A (zh) | 一种输出控制方法、电子设备及输出系统 | |
CN108449691A (zh) | 一种拾音装置及声源距离确定方法 | |
US11367457B2 (en) | Method for detecting ambient noise to change the playing voice frequency and sound playing device thereof | |
US20180367905A1 (en) | Vibration Diaphragm and MEMS Microphone Using Same | |
CN106534461B (zh) | 耳机的降噪系统及其降噪方法 | |
CN110544472B (zh) | 提升使用cnn网络结构的语音任务的性能的方法 | |
CN208094741U (zh) | 一种基于语音识别技术的智能麦克风 | |
CN111182412A (zh) | 一种电子设备、用于电子设备的数据处理方法及会议系统设备 | |
CN107770679A (zh) | 处理信号的方法以及相应的设备 | |
CN107087239B (zh) | 声音信号的处理方法及装置、麦克风 | |
US11490211B2 (en) | Directivity hearing-aid device and method thereof | |
WO2021004067A1 (zh) | 一种显示装置 | |
CN106531188A (zh) | 声学回声评估系统及方法 | |
CN103035237B (zh) | 一种中文语音信号处理方法、装置和助听设备 | |
CN207625800U (zh) | 麦克风 | |
CN208316931U (zh) | 一种拾音装置 | |
CN104902402A (zh) | 语音识别装置、语音声控系统和语音通讯系统 | |
CN110830897B (zh) | 助听器及其助听器的输出语音调整的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |