CN111402877B - 基于车载多音区的降噪方法、装置、设备和介质 - Google Patents

基于车载多音区的降噪方法、装置、设备和介质 Download PDF

Info

Publication number
CN111402877B
CN111402877B CN202010188707.5A CN202010188707A CN111402877B CN 111402877 B CN111402877 B CN 111402877B CN 202010188707 A CN202010188707 A CN 202010188707A CN 111402877 B CN111402877 B CN 111402877B
Authority
CN
China
Prior art keywords
voice
noise reduction
zone
vehicle
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010188707.5A
Other languages
English (en)
Other versions
CN111402877A (zh
Inventor
张腾飞
张龙
殷切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apollo Zhilian Beijing Technology Co Ltd
Original Assignee
Apollo Zhilian Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apollo Zhilian Beijing Technology Co Ltd filed Critical Apollo Zhilian Beijing Technology Co Ltd
Priority to CN202010188707.5A priority Critical patent/CN111402877B/zh
Publication of CN111402877A publication Critical patent/CN111402877A/zh
Priority to US17/029,923 priority patent/US11197094B2/en
Priority to EP20214633.8A priority patent/EP3882915A1/en
Priority to JP2021040999A priority patent/JP7258932B2/ja
Application granted granted Critical
Publication of CN111402877B publication Critical patent/CN111402877B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R11/00Arrangements for holding or mounting articles, not otherwise provided for
    • B60R11/02Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
    • B60R11/0247Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof for microphones or earphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Mechanical Engineering (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本申请公开了一种基于车载多音区的降噪方法、装置、设备和介质,涉及降噪技术。具体实现方案为:根据各音区获取到的语音信号,确定当前唤醒车载终端的语音信号所属的目标音区,其中,每个音区对应有各自的降噪模块;将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪关闭指令用于指示所述其他各音区的降噪模块,在针对所述目标音区进行语音交互的过程中关闭降噪算法。本申请实施例通过保留目标音区的降噪算法正常运行,而暂时关闭其他音区的降噪算法的方式,在不影响语音识别和交互的前提下,降低了cpu消耗,避免车载终端运行的卡顿现象。

Description

基于车载多音区的降噪方法、装置、设备和介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种降噪技术,具体涉及一种基于车载多音区的降噪方法、装置、设备和介质。
背景技术
随着互联网和智能终端的发展,智能车辆的使用也越来越广泛,司机或乘客可以通过语音与车载终端进行交互,实现播放音乐或导航等操作。为了准确地进行语音识别和交互,通常会在车辆内划分多个音区,先识别出唤醒车载终端的用户位于哪个音区,然后再针对该用户的语音进行识别和交互,以便减少来自其他音区语音数据对语音识别的影响。
在车载四音区的场景中,有四路麦克获取用户语音、回声参考信号和周围环境噪声,相应的,每路麦克都对应有一路降噪算法,用于对回声参考信号和周围环境噪声进行消除。然而,同时运行的四路降噪算法耗用的cpu较高,尤其是当语音识别功能被用户唤醒后,识别引擎打开,会进一步耗用cpu的资源,从而导致车载终端运行的卡顿现象。
发明内容
本申请实施例提供一种基于车载多音区的降噪方法、装置、设备和介质,以解决现有技术中出现的cpu消耗过高,容易导致车载终端运行的卡顿现象的问题。
第一方面,本申请实施例提供了一种基于车载多音区的降噪方法,包括:
根据各音区获取到的语音信号,确定当前唤醒车载终端的语音信号所属的目标音区,其中,每个音区对应有各自的降噪模块;
将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪关闭指令用于指示所述其他各音区的降噪模块,在针对所述目标音区进行语音交互的过程中关闭降噪算法。
上述申请中的一个实施例具有如下优点或有益效果:通过保留目标音区的降噪算法正常运行,而暂时关闭其他音区的降噪算法的方式,在不影响语音识别和交互的前提下,降低了cpu消耗,避免车载终端运行的卡顿现象。
可选的,所述根据各音区获取到的语音信号,确定当前唤醒车载终端的语音所属的目标音区,包括:
根据各音区获取到的语音信号,利用音区判决算法,确定当前唤醒车载终端的语音所属的目标音区。
上述申请中的一个实施例具有如下优点或有益效果:利用音区判决算法,可以准确地确定出唤醒车载终端的语音所属的目标音区,以确保后续操作的顺利进行。
可选的,在确定所述目标音区之后,所述方法还包括:
打开所述车载终端的语音识别引擎。
上述申请中的一个实施例具有如下优点或有益效果:在确定目标音区之后,打开语音识别引擎,该语音识别引擎就可以对来自目标音区的语音信号进行识别和交互。
可选的,在所述将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块之后,所述方法还包括:
如果预设时间段内没有接收到来自所述目标音区的语音信号,则将降噪恢复指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪恢复指令用于指示所述其他各音区的降噪模块恢复降噪算法。
上述申请中的一个实施例具有如下优点或有益效果:当目标音区不再出现语音信号,表明当前基于目标音区的语音交互已经结束,此时,可以对除所述目标音区之外的其他各音区的降噪模块进行恢复,以确保当其他音区的语音唤醒车载终端时,可以正常对该音区的语音信号进行识别和交互。
可选的,在确定所述目标音区之前,所述方法还包括:
对唤醒所述车载终端的语音信号进行识别。
上述申请中的一个实施例具有如下优点或有益效果:先对车载终端是否被唤醒进行识别,当识别到被唤醒后,再进行目标音区的识别,以及相应的对降噪模块进行关闭和恢复,避免不必要的操作,确保各路降噪模块的正常运行。
第二方面,本申请实施例还提供了一种基于车载多音区的降噪装置,包括:
音区确定模块,用于根据各音区获取到的语音信号,确定当前唤醒车载终端的语音信号所属的目标音区,其中,每个音区对应有各自的降噪模块;
指令发送模块,用于将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪关闭指令用于指示所述其他各音区的降噪模块,在针对所述目标音区进行语音交互的过程中关闭降噪算法。
第三方面,本申请实施例还提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任意实施例所述的基于车载多音区的降噪方法。
第四方面,本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请任意实施例所述的基于车载多音区的降噪方法。
上述申请中的一个实施例具有如下优点或有益效果:通过保留目标音区的降噪算法正常运行,而暂时关闭其他音区的降噪算法的方式,在不影响语音识别和交互的前提下,降低了cpu消耗,避免车载终端运行的卡顿现象。而且,当目标音区不再出现语音信号,表明当前基于目标音区的语音交互已经结束,此时,可以对除所述目标音区之外的其他各音区的降噪模块进行恢复,以确保当其他音区的语音唤醒车载终端时,可以正常对该音区的语音信号进行识别和交互。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的基于车载多音区的降噪方法的流程示意图;
图2是根据本申请第二实施例的基于车载多音区的降噪方法的流程示意图;
图3是根据本申请第三实施例的基于车载多音区的降噪装置的结构示意图;
图4是用来实现本申请实施例的基于车载多音区的降噪方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请第一实施例的基于车载多音区的降噪方法的流程示意图,本实施例可适用于在基于车载多音区的语音交互过程中进行降噪的情况,例如车载四音区。该方法可由一种基于车载多音区的降噪装置来执行,该装置采用软件和/或硬件的方式实现,优选是配置于电子设备中,例如车载终端等。如图1所示,该方法具体包括如下:
S101、根据各音区获取到的语音信号,确定当前唤醒车载终端的语音信号所属的目标音区,其中,每个音区对应有各自的降噪模块。
以车载四音区为例,车内每个音区都配备有麦克等拾音装置,用于获取用户的语音信号,每个音区还对应有各自的降噪模块,用于对该音区获取到语音信号进行降噪,例如消除回声参考信号或周围环境噪声等。通常情况下,四路降噪模块的降噪算法是同时运行的,会实时对获取到的语音信号进行降噪。同时,这也给cpu带来一定的压力,导致cpu耗能较大。
按照车载多音区的划分,是可以定位出每次唤醒车载终端的语音信号是来自于哪个音区的,而后,也会针对该音区获取到的语音信号继续进行语音识别,并基于语音识别结果进行语音交互。因此,在本申请实施例中,当车载终端被唤醒后,车载终端会根据各音区获取到的语音信号,确定当前唤醒车载终端的语音信号所属的目标音区。
这里需要说明的是,当车内有一位用户说话时,各音区的麦克都可以获取到语音信号,只不过由于说话用户的位置与各音区麦克的距离不一样,因此,每个麦克获取到的语音信号都是不同的。而利用音区判决算法,就可以根据各音区获取到的语音信号,确定当前唤醒车载终端的语音所属的目标音区。本申请实施例可以使用现有技术中的任一种音区判决算法来确定目标音区,本申请实施例对音区判决算法的具体内容不做任何限定。
S102、将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪关闭指令用于指示所述其他各音区的降噪模块,在针对所述目标音区进行语音交互的过程中关闭降噪算法。
由于各路降噪模块的降噪算法是同时运行的,这会造成较大的cpu耗能,因此,本申请实施例在确定出目标音区之后,只允许目标音区对应的降噪模块运行降噪算法即可,并向其他各音区的降噪模块发送降噪关闭指令,指示其他各音区的降噪模块在针对目标音区进行语音交互的过程中关闭降噪算法。
可以理解的是,由于唤醒车载终端的语音信号是属于目标音区,这也就表明位于目标音区的用户正打算与车载终端进行语音交互,因此,接下来只需要针对目标音区的语音信号进行识别和交互即可,而关闭其他各音区的降噪模块的降噪算法,并不会影响目标音区的语音识别和语音交互效果,同时还能降低cpu耗能。
此外,在确定出目标音区之后,车载终端还会打开车载终端的语音识别引擎,以对来自于目标音区的语音信号进行语音识别。
本申请实施例的技术方案,通过保留目标音区的降噪算法正常运行,而暂时关闭其他音区的降噪算法的方式,在不影响语音识别和交互的前提下,降低了cpu消耗,避免车载终端运行的卡顿现象。
图2是根据本申请第二实施例的基于车载多音区的降噪方法的流程示意图,本实施例在上述实施例的基础上进一步进行优化。如图2所示,该方法具体包括如下:
S201、对唤醒所述车载终端的语音信号进行识别。
车载终端与用户进行语音交互,需要先由用户唤醒。通常,可以预先设定唤醒词,并通过关键词匹配的方式,将实时获取到的语音与唤醒词进行匹配,如果匹配上,则表明用户正在唤醒车载终端。
本申请实施例中,先对车载终端是否被唤醒进行识别,当识别到被唤醒后,再进行后续目标音区的识别,以及相应的对降噪模块进行关闭和恢复,避免不必要的操作,确保各路降噪模块的正常运行。
S202、根据各音区获取到的语音信号,确定当前唤醒车载终端的语音信号所属的目标音区,其中,每个音区对应有各自的降噪模块。
S203、将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪关闭指令用于指示所述其他各音区的降噪模块,在针对所述目标音区进行语音交互的过程中关闭降噪算法。
S204、如果预设时间段内没有接收到来自所述目标音区的语音信号,则将降噪恢复指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪恢复指令用于指示所述其他各音区的降噪模块恢复降噪算法。
关闭其他各音区的降噪算法,保留目标音区的降噪模块运行降噪算法,是在当前针对目标音区的语音交互的过程中实现的。而当目标音区不再产生语音信号,则表明当前的语音交互过程已经结束。本申请实施例中,可以依据在预设时间段内都没有接收到来自目标音区的语音信号,来确定当前的语音交互过程已经结束。其中,预设时间段是由技术人员预先配置,这里不做任何限定。
当前的语音交互过程结束后,由于无法预测下一次语音交互是针对哪一个音区,因此,本申请实施例中,如果预设时间段内没有接收到来自目标音区的语音信号,则将降噪恢复指令发送至除目标音区之外的其他各音区的降噪模块,指示其他各音区的降噪模块恢复降噪算法。这样,当车载终端下一次被唤醒,会重新识别新的目标音区,并向除该新的目标音区之外的其他各音区的降噪模块发送降噪关闭指令,当针对该新的目标音区的语音交互过程结束,则向除该新的目标音区之外的其他各音区的降噪模块发送降噪恢复指令。以此类推,每次车载终端被唤醒,都重复执行上述操作,不仅不会影响当前语音交互过程,而且不会影响下一次语音交互过程,同时还能降低cpu耗能。
本申请实施例的技术方案,通过保留目标音区的降噪算法正常运行,而暂时关闭其他音区的降噪算法的方式,在不影响语音识别和交互的前提下,降低了cpu消耗,避免车载终端运行的卡顿现象。而且,当目标音区不再出现语音信号,表明当前基于目标音区的语音交互已经结束,此时,可以对除所述目标音区之外的其他各音区的降噪模块进行恢复,以确保当其他音区的语音唤醒车载终端时,可以正常对该音区的语音信号进行识别和交互。
图3是根据本申请第三实施例的基于车载多音区的降噪装置的结构示意图,本实施例可适用于的情况。该装置可实现本申请任意实施例所述的基于车载多音区的降噪方法。如图3所示,该装置300具体包括:
音区确定模块301,用于根据各音区获取到的语音信号,确定当前唤醒车载终端的语音信号所属的目标音区,其中,每个音区对应有各自的降噪模块;
指令发送模块302,用于将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪关闭指令用于指示所述其他各音区的降噪模块,在针对所述目标音区进行语音交互的过程中关闭降噪算法。
可选的,所述音区确定模块301具体用于:
根据各音区获取到的语音信号,利用音区判决算法,确定当前唤醒车载终端的语音所属的目标音区。
可选的,所述装置还包括:
识别引擎开启模块,用于在所述音区确定模块301确定所述目标音区之后,打开所述车载终端的语音识别引擎。
可选的,所述指令发送模块302还用于:
在所述将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块之后,如果预设时间段内没有接收到来自所述目标音区的语音信号,则将降噪恢复指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪恢复指令用于指示所述其他各音区的降噪模块恢复降噪算法。
可选的,所述装置还包括:
唤醒识别模块,用于在所述音区确定模块301确定所述目标音区之前,对唤醒所述车载终端的语音信号进行识别。
本申请实施例提供的基于车载多音区的降噪装置300可执行本申请任意实施例提供的基于车载多音区的降噪方法,具备执行方法相应的功能模块和有益效果。本实施例中未详尽描述的内容可以参考本申请任意方法实施例中的描述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图4所示,是根据本申请实施例的基于车载多音区的降噪方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图4所示,该电子设备包括:一个或多个处理器401、存储器402,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图4中以一个处理器401为例。
存储器402即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的基于车载多音区的降噪方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的基于车载多音区的降噪方法。
存储器402作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的基于车载多音区的降噪方法对应的程序指令/模块(例如,附图3所示的音区确定模块模块301和指令发送模块302)。处理器401通过运行存储在存储器402中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的基于车载多音区的降噪方法。
存储器402可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据实现本申请实施例的基于车载多音区的降噪方法的电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器402可选包括相对于处理器401远程设置的存储器,这些远程存储器可以通过网络连接至实现本申请实施例的基于车载多音区的降噪方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现本申请实施例的基于车载多音区的降噪方法的电子设备还可以包括:输入装置403和输出装置404。处理器401、存储器402、输入装置403和输出装置404可以通过总线或者其他方式连接,图4中以通过总线连接为例。
输入装置403可接收输入的数字或字符信息,以及产生与实现本申请实施例的基于车载多音区的降噪方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置404可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,通过保留目标音区的降噪算法正常运行,而暂时关闭其他音区的降噪算法的方式,在不影响语音识别和交互的前提下,降低了cpu消耗,避免车载终端运行的卡顿现象。而且,当目标音区不再出现语音信号,表明当前基于目标音区的语音交互已经结束,此时,可以对除所述目标音区之外的其他各音区的降噪模块进行恢复,以确保当其他音区的语音唤醒车载终端时,可以正常对该音区的语音信号进行识别和交互。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (10)

1.一种基于车载多音区的降噪方法,适用于在基于车载多音区的语音交互过程中进行降噪的情况,其特征在于,包括:
根据各音区获取到的语音信号,确定当前唤醒车载终端的语音信号所属的目标音区,其中,每个音区对应有各自的降噪模块;
将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪关闭指令用于指示所述其他各音区的降噪模块,在针对所述目标音区进行语音交互的过程中关闭降噪算法;
其中,所述根据各音区获取到的语音信号,确定当前唤醒车载终端的语音所属的目标音区,包括:
根据各音区获取到的语音信号,利用音区判决算法,确定当前唤醒车载终端的语音所属的目标音区。
2.根据权利要求1所述的方法,其特征在于,在确定所述目标音区之后,所述方法还包括:
打开所述车载终端的语音识别引擎。
3.根据权利要求1所述的方法,其特征在于,在所述将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块之后,所述方法还包括:
如果预设时间段内没有接收到来自所述目标音区的语音信号,则将降噪恢复指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪恢复指令用于指示所述其他各音区的降噪模块恢复降噪算法。
4.根据权利要求1所述的方法,其特征在于,在确定所述目标音区之前,所述方法还包括:
对唤醒所述车载终端的语音信号进行识别。
5.一种基于车载多音区的降噪装置,适用于在基于车载多音区的语音交互过程中进行降噪的情况,其特征在于,包括:
音区确定模块,用于根据各音区获取到的语音信号,确定当前唤醒车载终端的语音信号所属的目标音区,其中,每个音区对应有各自的降噪模块;
指令发送模块,用于将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪关闭指令用于指示所述其他各音区的降噪模块,在针对所述目标音区进行语音交互的过程中关闭降噪算法;
其中,所述音区确定模块具体用于:
根据各音区获取到的语音信号,利用音区判决算法,确定当前唤醒车载终端的语音所属的目标音区。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
识别引擎开启模块,用于在所述音区确定模块确定所述目标音区之后,打开所述车载终端的语音识别引擎。
7.根据权利要求5所述的装置,其特征在于,所述指令发送模块还用于:
在所述将降噪关闭指令发送至除所述目标音区之外的其他各音区的降噪模块之后,如果预设时间段内没有接收到来自所述目标音区的语音信号,则将降噪恢复指令发送至除所述目标音区之外的其他各音区的降噪模块,其中,所述降噪恢复指令用于指示所述其他各音区的降噪模块恢复降噪算法。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括:
唤醒识别模块,用于在所述音区确定模块确定所述目标音区之前,对唤醒所述车载终端的语音信号进行识别。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的基于车载多音区的降噪方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的基于车载多音区的降噪方法。
CN202010188707.5A 2020-03-17 2020-03-17 基于车载多音区的降噪方法、装置、设备和介质 Active CN111402877B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202010188707.5A CN111402877B (zh) 2020-03-17 2020-03-17 基于车载多音区的降噪方法、装置、设备和介质
US17/029,923 US11197094B2 (en) 2020-03-17 2020-09-23 Noise reduction method and apparatus based on in-vehicle sound zones, and medium
EP20214633.8A EP3882915A1 (en) 2020-03-17 2020-12-16 Noise reduction based on in-vehicle sound zones
JP2021040999A JP7258932B2 (ja) 2020-03-17 2021-03-15 車載多音域に基づくノイズ低減方法、装置、電子機器及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010188707.5A CN111402877B (zh) 2020-03-17 2020-03-17 基于车载多音区的降噪方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN111402877A CN111402877A (zh) 2020-07-10
CN111402877B true CN111402877B (zh) 2023-08-11

Family

ID=71430976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010188707.5A Active CN111402877B (zh) 2020-03-17 2020-03-17 基于车载多音区的降噪方法、装置、设备和介质

Country Status (4)

Country Link
US (1) US11197094B2 (zh)
EP (1) EP3882915A1 (zh)
JP (1) JP7258932B2 (zh)
CN (1) CN111402877B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113053402B (zh) * 2021-03-04 2024-03-12 广州小鹏汽车科技有限公司 一种语音处理方法、装置和车辆
CN113327608B (zh) * 2021-06-03 2022-12-09 阿波罗智联(北京)科技有限公司 针对车辆的语音处理方法、装置、电子设备和介质
WO2023279366A1 (zh) * 2021-07-09 2023-01-12 Oppo广东移动通信有限公司 基于迁移学习的降噪方法、终端设备、网络设备及存储介质
CN113611334A (zh) * 2021-08-10 2021-11-05 合众新能源汽车有限公司 一种车外声音感知方法和系统
CN114063969A (zh) * 2021-11-15 2022-02-18 阿波罗智联(北京)科技有限公司 音频数据处理方法、装置、设备、存储介质及程序产品
CN115440206A (zh) * 2022-03-16 2022-12-06 北京罗克维尔斯科技有限公司 多音区语音识别方法、装置、车辆及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19944467A1 (de) * 1999-09-16 2001-03-29 Siemens Audiologische Technik Verfahren zur Reduzierung von akustischen Störsignalen
CN101176382A (zh) * 2005-05-17 2008-05-07 西门子技术至商业中心有限责任公司 创建个人化声音区的系统和方法
CN106960670A (zh) * 2017-03-27 2017-07-18 联想(北京)有限公司 一种录音方法和电子设备
CN107146628A (zh) * 2017-04-07 2017-09-08 宇龙计算机通信科技(深圳)有限公司 一种语音通话处理方法及移动终端
CN107623783A (zh) * 2017-09-11 2018-01-23 安徽省未来博学信息技术有限公司 一种通话语音优化系统
CN109545230A (zh) * 2018-12-05 2019-03-29 百度在线网络技术(北京)有限公司 车辆内的音频信号处理方法和装置
CN109669663A (zh) * 2018-12-28 2019-04-23 百度在线网络技术(北京)有限公司 音区幅值获取方法、装置、电子设备及存储介质
CN109754803A (zh) * 2019-01-23 2019-05-14 上海华镇电子科技有限公司 车载多音区语音交互系统及方法
CN110310633A (zh) * 2019-05-23 2019-10-08 北京百度网讯科技有限公司 多音区语音识别方法、终端设备和存储介质
CN110366156A (zh) * 2019-08-26 2019-10-22 科大讯飞(苏州)科技有限公司 车载蓝牙通讯处理方法、车载音频管理系统及相关设备
CN110459234A (zh) * 2019-08-15 2019-11-15 苏州思必驰信息科技有限公司 用于车载的语音识别方法及系统
KR20200046919A (ko) * 2018-10-26 2020-05-07 주식회사 에스큐그리고 스피커 음향 특성을 고려한 독립음장 구현 방법 및 구현 시스템

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001075594A (ja) 1999-08-31 2001-03-23 Pioneer Electronic Corp 音声認識システム
US20090248411A1 (en) * 2008-03-28 2009-10-01 Alon Konchitsky Front-End Noise Reduction for Speech Recognition Engine
JP5581705B2 (ja) * 2010-01-26 2014-09-03 株式会社デンソー 車両用ノイズキャンセル装置及び車両用ノイズキャンセルシステム
WO2014026165A2 (en) * 2012-08-10 2014-02-13 Johnson Controls Technology Company Systems and methods for vehicle cabin controlled audio
US9773495B2 (en) * 2016-01-25 2017-09-26 Ford Global Technologies, Llc System and method for personalized sound isolation in vehicle audio zones
WO2017138934A1 (en) * 2016-02-10 2017-08-17 Nuance Communications, Inc. Techniques for spatially selective wake-up word recognition and related systems and methods
US20180190282A1 (en) * 2016-12-30 2018-07-05 Qualcomm Incorporated In-vehicle voice command control
US20190237067A1 (en) * 2018-01-31 2019-08-01 Toyota Motor Engineering & Manufacturing North America, Inc. Multi-channel voice recognition for a vehicle environment
US11164557B2 (en) * 2019-11-14 2021-11-02 Bose Corporation Active noise cancellation systems with convergence detection
CN115641861A (zh) * 2022-10-13 2023-01-24 科大讯飞股份有限公司 一种车载语音增强方法、装置、存储介质及设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19944467A1 (de) * 1999-09-16 2001-03-29 Siemens Audiologische Technik Verfahren zur Reduzierung von akustischen Störsignalen
CN101176382A (zh) * 2005-05-17 2008-05-07 西门子技术至商业中心有限责任公司 创建个人化声音区的系统和方法
CN106960670A (zh) * 2017-03-27 2017-07-18 联想(北京)有限公司 一种录音方法和电子设备
CN107146628A (zh) * 2017-04-07 2017-09-08 宇龙计算机通信科技(深圳)有限公司 一种语音通话处理方法及移动终端
CN107623783A (zh) * 2017-09-11 2018-01-23 安徽省未来博学信息技术有限公司 一种通话语音优化系统
KR20200046919A (ko) * 2018-10-26 2020-05-07 주식회사 에스큐그리고 스피커 음향 특성을 고려한 독립음장 구현 방법 및 구현 시스템
CN109545230A (zh) * 2018-12-05 2019-03-29 百度在线网络技术(北京)有限公司 车辆内的音频信号处理方法和装置
CN109669663A (zh) * 2018-12-28 2019-04-23 百度在线网络技术(北京)有限公司 音区幅值获取方法、装置、电子设备及存储介质
CN109754803A (zh) * 2019-01-23 2019-05-14 上海华镇电子科技有限公司 车载多音区语音交互系统及方法
CN110310633A (zh) * 2019-05-23 2019-10-08 北京百度网讯科技有限公司 多音区语音识别方法、终端设备和存储介质
CN110459234A (zh) * 2019-08-15 2019-11-15 苏州思必驰信息科技有限公司 用于车载的语音识别方法及系统
CN110366156A (zh) * 2019-08-26 2019-10-22 科大讯飞(苏州)科技有限公司 车载蓝牙通讯处理方法、车载音频管理系统及相关设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Qi TZ 等.A hybrid noise canceller with a real-time adaptive Winer filter and a geometric based voice activity detector for an automotive application.《International Journal of Adaptive Control and Signal Processing》.2010,全文. *

Also Published As

Publication number Publication date
JP7258932B2 (ja) 2023-04-17
EP3882915A1 (en) 2021-09-22
JP2021105725A (ja) 2021-07-26
US20210297776A1 (en) 2021-09-23
CN111402877A (zh) 2020-07-10
US11197094B2 (en) 2021-12-07

Similar Documents

Publication Publication Date Title
CN111402877B (zh) 基于车载多音区的降噪方法、装置、设备和介质
CN111640428B (zh) 一种语音识别方法、装置、设备和介质
US10720158B2 (en) Low power detection of a voice control activation phrase
CN107112017B (zh) 操作语音识别功能的电子设备和方法
CN111192591B (zh) 智能设备的唤醒方法、装置、智能音箱及存储介质
KR102553234B1 (ko) 음성 데이터 처리 방법, 장치 및 지능형 차량
CN110225386B (zh) 一种显示控制方法、显示设备
CN108810280B (zh) 语音采集频率的处理方法、装置、存储介质及电子设备
US11817082B2 (en) Electronic device for performing voice recognition using microphones selected on basis of operation state, and operation method of same
EP3799036A1 (en) Speech control method, speech control device, electronic device, and readable storage medium
CN111640429B (zh) 提供语音识别服务的方法和用于该方法的电子装置
CN112634890B (zh) 用于唤醒播放设备的方法、装置、设备以及存储介质
US20220068267A1 (en) Method and apparatus for recognizing speech, electronic device and storage medium
CN112133307A (zh) 人机交互方法、装置、电子设备及存储介质
US20210201894A1 (en) N/a
EP4030424B1 (en) Method and apparatus of processing voice for vehicle, electronic device and medium
CN114333017A (zh) 一种动态拾音方法、装置、电子设备及存储介质
CN112037794A (zh) 语音交互方法、装置、设备以及存储介质
US20150100321A1 (en) Intelligent state aware system control utilizing two-way voice / audio communication
EP4056424B1 (en) Audio signal playback delay estimation for smart rearview mirror
EP3799038A1 (en) Speech control method and device, electronic device, and readable storage medium
CN112037786A (zh) 语音交互方法、装置、设备以及存储介质
CN113918334A (zh) 一种设备性能优化方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211019

Address after: 100176 101, floor 1, building 1, yard 7, Ruihe West 2nd Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing

Applicant after: Apollo Zhilian (Beijing) Technology Co.,Ltd.

Address before: 2 / F, baidu building, 10 Shangdi 10th Street, Haidian District, Beijing 100085

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant