CN109658930B - 语音信号处理方法、电子装置及计算机可读存储介质 - Google Patents

语音信号处理方法、电子装置及计算机可读存储介质 Download PDF

Info

Publication number
CN109658930B
CN109658930B CN201811553672.XA CN201811553672A CN109658930B CN 109658930 B CN109658930 B CN 109658930B CN 201811553672 A CN201811553672 A CN 201811553672A CN 109658930 B CN109658930 B CN 109658930B
Authority
CN
China
Prior art keywords
audio signal
electronic device
target application
application program
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811553672.XA
Other languages
English (en)
Other versions
CN109658930A (zh
Inventor
裴琨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201811553672.XA priority Critical patent/CN109658930B/zh
Publication of CN109658930A publication Critical patent/CN109658930A/zh
Application granted granted Critical
Publication of CN109658930B publication Critical patent/CN109658930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone

Abstract

一种语音信号处理方法、电子装置及计算机可读存储介质,通过在电子装置上的目标应用程序开启后,获取电子装置的麦克风采集的第一音频信号,在电子装置的播放外放状态满足预设条件时,获取电子装置当前外放的第二音频信号,可以在第一音频信号中夹杂了因为第二音频信号的外放所产生的干扰,第一音频信号中源于电子装置外部的语音指令的识别受到了干扰之时,基于本申请的方案,根据第一音频信号和第二音频信号,有效去除第一音频信号中源自第二音频信号的干扰,降低电子装置外放的音频信号对外部输入的语音指令的干扰,提升第一音频信号的信噪比,提升电子装置正确识别语音指令的概率,进而提升用户体验。

Description

语音信号处理方法、电子装置及计算机可读存储介质
技术领域
本申请涉及终端技术领域,尤其涉及一种语音信号处理方法、电子装置及计算机可读存储介质。
背景技术
随着移动终端的普及,人们在越来越多的场合使用移动终端。某些场合下,用户不愿意或者不方便直接用手指操作移动终端输入指令,这时候可以使用语音助手来接收用户发出的语音指令,解析该语音指令并执行。
但是在语音助手工作时,移动终端可能处于音频播放阶段,这些音频的播放会给语音助手的语音识别带来障碍。例如手机来电时,手机可能会播放铃声,而铃声的种类和响度都有可能并不相同,当用户使用语音助手,通过输入语音指令来控制手机挂断或接通时,很多情况下,用户的发声响度可能比铃声的响度小,或者铃声中可能出现和用户声音相似的语音,这就会造成用户的语音指令被铃声淹没或干扰的情况,从而降低了语音助手的识别率,使得手机无法正确执行用户的语音指令,严重影响了用户体验。
发明内容
本申请实施例提供一种语音信号处理方法、电子装置及计算机可读存储介质,可提升电子装置对语音指令的识别率。
本申请实施例第一方面提供一种语音信号处理方法,该语音信号处理方法包括:
在电子装置上的目标应用程序开启后,获取所述电子装置的麦克风采集的第一音频信号;
在所述电子装置的外放状态满足预设条件时,获取所述电子装置当前外放的第二音频信号;
基于所述第一音频信号和所述第二音频信号,从所述第一音频信号中去除因所述第二音频信号的外放产生的干扰,得到输入所述目标应用程序的语音指令。
本申请实施例第二方面提供一种电子装置,该电子装置包括:
第一获取模块,用于在电子装置上的目标应用程序开启后,获取所述电子装置的麦克风采集的第一音频信号;
第二获取模块,用于在所述电子装置的外放状态满足预设条件时,获取所述电子装置当前外放的第二音频信号;
音频信号处理模块,用于基于所述第一音频信号和所述第二音频信号,从所述第一音频信号中去除因所述第二音频信号的外放产生的干扰,得到输入所述目标应用程序的语音指令。
本申请实施例第三方面提供另一种电子装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述本申请实施例第一方面提供的语音信号处理方法中的各步骤。
本申请实施例第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述本申请实施例第一方面提供的语音信号处理方法中的各步骤。
由上可见,本申请方案中,通过在电子装置上的目标应用程序开启后,获取电子装置的麦克风采集的第一音频信号,在电子装置的外放状态满足预设条件时,获取电子装置当前外放的第二音频信号,可以在第一音频信号中夹杂了因为第二音频信号的外放产生的干扰,使得第一音频信号中源于电子装置外部的语音指令的识别受到了干扰之时,可根据第一音频信号和第二音频信号,有效去除第一音频信号中因第二音频信号产生的干扰,降低电子装置外放的音频信号对外部输入的语音指令的干扰,提升第一音频信号的信噪比,提升电子装置正确识别语音指令的概率,进而提升用户体验。
附图说明
图1为一种电子装置的结构框图;
图2为本申请第一实施例提供的语音信号处理方法的流程示意图;
图3为本申请第二实施例提供的语音信号处理方法的流程示意图;
图4为本申请第三实施例提供的语音信号处理方法的流程示意图;
图5为本申请第四实施例提供的电子装置的程序模块示意图;
图6为本申请第五实施例提供的电子装置的结构示意图。
具体实施方式
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参照图1,图1示出了一种电子装置的结构框图。本发明实施例提供的语音信号处理方法可应用于如图1所示的电子装置10中,电子装置10包括但不限于:移动终端如智能手机、笔记本及穿戴智能设备等,以及固定终端如台式电脑及智能电视等等。
如图1所示,电子装置10包括存储器101、存储控制器102,一个或多个(图中仅示出一个)处理器103、外设接口104及触控屏幕105。这些组件通过一条或多条通讯总线/信号线106相互通讯。
可以理解,图1所示的结构仅为示意,其并不对电子装置的结构造成限定。电子装置10还可包括比图1所示更多或者更少的组件,或者具有与图1所示不同的配置。图1所示的各组件可以采用硬件、软件或其组合实现。
存储器101可用于存储软件程序以及模块,如本发明实施例中的语音信号处理方法及电子装置对应的程序指令/模块,处理器103通过运行存储在存储器101内的软件程序以及模块,从而执行各种功能应用以及数据处理,例如实现上述的语音信号处理方法。
存储器101可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器101可进一步包括相对于处理器103远程设置的存储器,这些远程存储器可以通过网络连接至电子装置10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。处理器103以及其他可能的组件对存储器101的访问可在存储控制器102的控制下进行。
外设接口104将各种输入/输入装置耦合至CPU以及存储器101。处理器103运行存储器101内的各种软件、指令以执行电子装置10的各种功能以及进行数据处理。
在一些实施例中,外设接口104,处理器103以及存储控制器102可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
触控屏幕105在电子装置与用户之间同时提供一个输出及输入界面。具体地,触控屏幕105向用户显示视频输出,这些视频输出的内容可包括文字、图形、视频、及其任意组合。触控屏幕105的一些输出结果是对应于一些用户界面对象。触控屏幕105还接收用户的输入,例如用户的点击、滑动等手势操作,以便用户界面对象对这些用户的输入做出响应。检测用户输入的技术可以是基于电阻式、电容式或者其他任意可能的触控检测技术。触控屏幕105显示单元的具体实例包括但并不限于液晶显示器或发光聚合物显示器。
基于上述电子装置描述本发明实施例中的语音信号处理方法。
为了降低电子装置外放音频信号时,该音频信号对目标应用程序识别语音指令的干扰,本实施例提出如图2所示的语音信号处理方法,参见图2,该语音信号处理方法包括以下的步骤:
步骤201、在电子装置上的目标应用程序开启后,获取电子装置的麦克风采集的第一音频信号;
本实施例中电子装置可以是如手机、智能穿戴设备以及平板电脑等的移动终端,也可以如智能电视和台式电脑等的固定终端,本实施例对此没有限定。
可选的,本实施例中,电子装置上的麦克风的数量可以是一个或多个,在麦克风的数量为多个时,第一音频信号可以是根据多个麦克风采集的音频信号处理而成。
本实施例中提到的目标应用程序,是具有接收输入的语音指令并执行语音指令的功能的应用程序,例如,目标应用程序为语音助手这个应用程序,或者具有语音助手功能的应用程序。可选的,语音助手可以是电子装置的系统提供的系统语音助手,也可以是由安装在电子装置上的应用提供的应用的语音助手。
可选的,本实施例中,在目标应用程序开启前,还包括:通过电子装置的麦克风采集来源于电子装置外部环境的噪声并保存。在获取电子装置的麦克风采集的第一音频信号后,基于该保存的噪声预测电子装置获取第一音频信号时,源自电子装置外部环境的噪声,在下述步骤203之前,基于预测的噪声去除第一音频信号中源自电子装置外部环境的噪声。
步骤202、在电子装置的外放状态满足预设条件时,获取电子装置当前外放的第二音频信号;
在步骤202中,预设条件可以根据实际情况而定,例如,预设条件可以不对电子装置的外放状态有任何限制,只要电子装置上的目标应用程序开启后,即获取电子装置外放的音频信号,可以理解的是,获取的音频信号可能为空。
在一实施例中,预设条件可以是电子装置处于外放音频信号的状态,即步骤202中在电子装置外放音频信号时,获取电子装置外放的音频信号作为第二音频信号。本实施例中,可以通过电子装置的系统(如安卓系统)本身的服务,来检测电子装置是否外放音频信号。在电子装置外放音频信号的情况下,获取电子装置外放的第二音频信号,可以在步骤203中快速地消除第一音频信号中源自第二音频信号的外放产生的干扰,得到信噪比较高的音频信号。
可选的,在另一实施例中,预设条件还可以是根据电子装置外放音频信号的响度来确定的,例如预设条件可以是电子装置外放音频信号的响度大于预设响度。即在电子装置以大于预设响度的响度外放音频信号时,获取电子装置外放的第二音频信号。由此,可以降低电子装置获取第二音频信号的频率,降低电子装置的任务量和功耗。其中,电子装置可以通过自身安装的系统,查询音频信号外放的相关设置如外放音量大小的设置,以获取外放音频信号的响度。可选的,预设响度可以是根据用户的声音响度设置的。例如,在步骤201之前,电子装置可以多次检测用户正常说话时的声音响度,计算平均的声音响度并存储与电子装置中。在步骤202中,预设响度可以是计算出的用户的声音响度的1/3。
可选的,在另一实施例中,预设条件还可以是根据电子装置外放的音频信号的频率来确定的,例如预设条件可以是电子装置外放音频信号的频率大于预设频率。即在电子装置外放的音频信号的频率大于预设频率时,获取电子装置当前外放的第二音频信号。可选的,预设频率可以是根据电子装置的用户的声音频率确定的,例如,在步骤201之前,电子装置可以多次采集用户的声音信号,根据声音信号计算用户的声音频率,在步骤202中,预设频率可以是计算出的用户的声音频率的1/2。
本实施例中,获取电子装置外放的第二音频信号的方式有多种,例如,可以采用从电子装置的下行语音通道中实时提取音频信号的方式获取电子装置当前外放的第二音频信号;例如,还可以预先设置电子装置的使用状态与音频信号的预设对应关系,在电子装置外放音频信号时,获取电子装置的实际使用状态,从预设对应关系中获取实际使用状态对应的音频信号作为第二音频信号。
可以理解的是,本实施中,获取的第二音频信号中可以包含电子装置当前未外放的音频信号部分,例如电子装置外放的音频信号是歌曲A,当前外放至歌曲A的1/2处,但是电子装置获取的第二音频信号是完整的歌曲A。
步骤203、基于第一音频信号和第二音频信号,从所述第一音频信号中去除因所述第二音频信号的外放产生的干扰,得到输入所述目标应用程序的语音指令。
本实施例中,在使用目标应用程序时,在目标应用程序开启后,目标应用程序处于接收语音指令的状态,麦克风对外界的声音进行录制,会同时录制外部的语音指令和第二音频信号中已经传播到空气中的音频信号,为了降低第二音频信号对语音指令的干扰,步骤203中,基于第一音频信号和第二音频信号,去除第一音频信号中因第二音频信号产生的干扰。可以理解的是,本实施例中,语音指令可以是当前使用电子装置的用户发出的,也可以是电子装置外部的设备输出的,本实施例对此没有限制。
在步骤203之后,目标应用程序可以执行步骤203中得到的语音指令。可选的,在一个示例中,在执行该语音指令前,还可以对语音指令进行识别,判断语音指令指示的操作是否属于预设的非安全操作,是,则拒绝执行该语音指令或者进入进一步的用户身份验证步骤,否,则继续执行语音指令的步骤。其中,预设的非安全操作可以是转账操作和加密文件打开操作等等,可以由用户自己设置,本实施例对此没有限制。
可选的,用户身份验证步骤可以是,停止外放音频信号,采集用户的语音信息,将该语音信息与预设的语音验证信息进行比对,若两者的音色和语音内容均相同,则比对通过,用户身份验证成功。在用户身份验证成功过后,继续执行语音指令的步骤。
采用本申请实施例的语音信号处理方法,可在电子装置上的目标应用程序开启后,获取电子装置的麦克风采集的第一音频信号,在电子装置的外放状态满足预设条件时,获取电子装置当前外放的第二音频信号。当第一音频信号中源于电子装置外部的语音指令的识别,因为第二音频信号的外放受到了干扰之时,基于本申请的方案,可根据第一音频信号和第二音频信号,有效去除第一音频信号中因第二音频信号产生的干扰,降低电子装置外放的音频信号对外部输入的语音指令的干扰,提升第一音频信号的信噪比,提升电子装置正确识别语音指令的概率,进而提升用户体验。
请参阅图3,图3为本发明第二实施例提供的一种语音信号处理方法。该语音信号处理方法包括以下的步骤:
步骤301、在电子装置上的目标应用程序开启后,获取电子装置的麦克风采集的第一音频信号;
步骤302、在电子装置处于外放音频信号的状态时,获取电子装置当前外放的第二音频信号;
步骤303、基于第一音频信号和第二音频信号,从第一音频信号中去除因第二音频信号的外放产生的干扰,得到输入目标应用程序的语音指令。
本实施例中,在电子装置中的目标应用程序未开启前,可以基于预设的开启方式开启目标应用程序。预设的开启方式包括但不限于以下的三种:
第一种:若接收到通过触控屏输入的目标应用程序开启指令,则开启电子装置的目标应用程序。
在第一种方式中,电子装置会检测是否通过触控屏输入目标应用程序开启指令。
可选的,电子装置检测触控屏显示的目标应用程序的应用图标是否被点击,若是,则认为接收到目标应用程序开启指令,开启目标应用程序,开启麦克风采集外部的第一音频信号。
可选的,电子装置检测是否在触控屏上输入预设的触控操作,若是,则认为接收到目标应用程序开启指令,开启目标应用程序,开启麦克风采集外部的第一音频信号。其中,预设的触控操作可以由电子装置的系统提供,或者由用户自定义,例如预设的触控操作可以是点击操作或者长按操作等等,点击操作包括但不限于连续三次指关节点击触控屏,可以理解的是,对于不同的目标应用程序,可以设置不同的触控操作。
可选的,在一个示例中,若电子装置的显示屏为曲面屏,则可在检测到用户通过曲面屏的两侧输入特定的触控操作时,确定接收到目标应用程序开启指令,开启目标应用程序。其中,特定的触控操作包括上滑以及下滑等操作。
第二种:获取电子装置当前的实际使用状态,若预设使用状态中包含实际使用状态,则开启电子装置的目标应用程序;
可选的,预设使用状态可以由系统设置或由用户自定义,例如,预设使用状态包括:来电状态,闹钟工作状态以及电子装置于厨房使用的状态等等。可选的,电子装置通过操作系统提供的服务可以检测自身是否处于来电状态和闹钟工作状态,以及电子装置可以通过与厨房中的智能设备通信确定自身是否位于厨房中。例如,电子装置的操作系统检测到电子装置处于来电状态,则自动开启目标应用程序。
第三种:若电子装置内的手势传感器检测到的手势为预设的目标应用程序开启手势,则开启电子装置的目标应用程序。
可选的,在一个示例中,手势传感器可以包含红外传感器。预设的目标应用程序开启手势可以是用户预先设置在电子装置中的。
在某些场景下,用户不方便通过触控屏操作的方式输入目标应用程序开启指令,例如用户正在开车,或者用户正在准备晚餐等等,上述后两种方式可帮助用户实现目标应用程序的非接触式操作,提升用户的体验。
可选的,本实施例的步骤302中,电子装置处于外放音频信号的状态,只是获取电子装置当前外放的第二音频信号的一种前提条件,在另一实施例中,步骤302还可以是在电子装置外放音频信号的响度大于预设响度时,获取电子装置当前外放的第二音频信号;或者,在电子装置外放的音频信号的频率大于预设频率时,获取电子装置当前外放的第二音频信号。其中,预设响度和预设频率可以根据用户的声音响度和用户的声音频率设置,具体的设置方式可参考实施例一中的相关叙述,本实施例在此不再赘述。
本实施例中,在电子装置外放第二音频信号的过程中,待外放的音频信号要传输至电子装置的扬声器,需要经过系统的多个框架层的传输和处理,本实施例中,可以在待外放的音频信号要传输至电子装置的扬声器前,对该音频信号进行实时的提取,将提取的音频信号作为电子装置当前外放的第二音频信号。可选的,上述获取电子装置当前外放的第二音频信号包括:提取待输入电子装置的扬声器的音频信号,将提取到的音频信号作为电子装置当前外放的第二音频信号。
可以理解的是,对于电子装置而言,在播放音频信号时,需要建立音频输出通道,音频输出通道的末端即为音频信号的输出设备(例如本实施例中的扬声器),该音频输出通道需要系统的多个框架层的配合,例如硬件抽象层(Hardware Abstract Layer,HAL)的配合,在音频输出通道建立完成后,可以向音频输出通道中输入音频信号,实现音频信号的播放。本申请中可以提取待输入电子装置的扬声器的音频信号包括:对于将扬声器作为输出设备的音频输出通道,提取该音频输出通道中传输的音频信号,可以理解的是,该音频输出通道中传输的音频信号即为待输入电子装置的扬声器的音频信号。
本实施例中,电子装置的系统可以是任意操作系统,例如安卓和IOS系统。可选的,提取待输入电子装置的扬声器的音频信号,将提取到的音频信号作为电子装置当前外放的第二音频信号包括:调用在电子装置的第一框架层预设的语音提取逻辑,基于该语音提取逻辑提取待输入电子装置的扬声器的音频信号,将提取的音频信号作为电子装置当前外放的第二音频信号。
本实施例中,第一框架层可以是HAL层或者其它框架层,本实施例对此没有限制。
可选的,在电子装置出厂前,各个电子装置的厂商可以在audio的HAL中设计语音提取逻辑,该语音提取逻辑用于实现提取待输入电子装置的扬声器的音频信号,也即用于实现提取将扬声器作为输出设备的音频输出通道中的音频信号。可以理解的是,不同的音频信号,其来源可能不同(例如来自于来电时的提醒铃声、闹钟铃声以及视频软件外放的音频信号等等),在audio的HAL中,可能会使用不同的接口。在设计逻辑时,可以针对各类来源的音频信号设计不同的语音提取逻辑,例如针对来电时的提醒铃声设置来电提醒铃声提取逻辑,针对闹钟铃声设置闹铃声提取逻辑等等;在获取第二音频信号时,按照对应的语音提取逻辑(如来电提醒铃声提取逻辑),提取待输入电子装置的扬声器的音频信号(如来电提醒铃声)。可以理解的是,本实施例中,该语音提取逻辑可以用于实现从硬件层中提取待输入电子装置的扬声器的音频信号。
在本实施例中,开启目标应用程序后,在操作系统将音频信号输入电子装置的扬声器前,可以将该音频信号同步保存至某个特定存储空间中,电子装置需要该音频信号时,可以直接从该特定存储空间中提取。可选的,在提取待输入电子装置的扬声器的音频信号,将提取到的音频信号作为电子装置当前外放的第二音频信号前,还包括:在电子装置外放音频信号时,将电子装置外放的音频信号写入特定存储空间中。
可以理解的是,该特定存储空间可以由系统提供,也可以由用户设置。在该实施例中,提取待输入电子装置的扬声器的音频信号,将提取到的音频信号作为电子装置当前外放的第二音频信号包括:从特定存储空间中读取写入时间最接近当前时刻的音频信号,将读取的音频信号作为电子装置当前外放的第二音频信号。可以理解的是,特定存储空间中可能存储有多段音频信号,从特定存储空间中读取写入时间最接近当前时刻的音频信号,将其作为第二音频信号,可以避免第二音频信号获取错误,有利于可以较为快速地获取电子装置外放的第二音频信号。
在一个实施例中,在将电子装置外放的音频信号写入特定存储空间中时,可以为特定存储空间的该音频信号添加写入时间标签,以便电子装置根据写入时间标签读取写入时间最接近当前时刻的音频信号。
可选的,在将电子装置外放的音频信号写入特定存储空间中前,可以将特定存储空间中存储的音频数据清空,使得特定存储空间中同一时间只存有一段音频数据。而从特定存储空间中读取写入时间最接近当前时刻的音频信号,即为读取特定存储空间中存储的音频信号,由此,可有效提升对写入时间最接近当前时刻的音频信号的读取速度。
在另一个实施例中,在提取待输入电子装置的扬声器的音频信号,将提取到的音频信号作为电子装置当前外放的第二音频信号之前,还包括:获取电子装置当前的实际使用状态,从使用状态与音频信号的预设对应关系中,匹配与实际使用状态对应的音频信号;若匹配成功,则获取匹配出的音频信号作为电子装置当前外放的第二音频信号;若匹配失败,则继续执行提取待输入电子装置的扬声器的音频信号,将提取到的音频信号作为电子装置当前外放的第二音频信号的步骤。
其中,上述使用状态和音频信号的预设对应关系可以是用户设置的。上述的预设对应关系中的使用状态包括用户来电的状态、和特定时刻的闹钟工作状态等等。在实际中,若电子装置上为不同电话号码的来电,设置有不同的提醒铃声,则使用状态与音频信号的预设对应关系中,需要设置各个用户的来电状态和铃声的对应关系,例如设置第一用户来电状态对应铃声1,第二用户来电状态对应铃声2,以及第三用户来电状态对应铃声3等等。
同样的,若电子装置上为不同时间段的闹钟,设置有不同的闹铃声,则使用状态与音频信号的预设对应关系中,需要设置不同特定时刻的闹钟工作状态和闹铃声的对应关系,例如设置早上八点工作的闹钟对应闹铃声1,下午一点半工作的闹钟对应闹铃声2,以及晚上六点工作的闹钟对应闹铃声3等等。
可以理解的是,上述实施中,对于来电状态,若对于不同用户设有不同的来电提醒铃声,获取电子装置当前的实际使用状态时,还需要获取来电的具体用户,以具体用户的来电状态从使用状态与音频信号的预设对应关系中,匹配与实际使用状态对应的音频信号。同样的,对于闹钟工作状态,若不同时刻的闹钟有不同的闹铃声,获取电子装置当前的实际使用状态时,还需要获取当前闹钟工作的时刻,以此从使用状态与音频信号的预设对应关系中,匹配与实际使用状态对应的音频信号。
本实施例中,可选的,上述基于所述第一音频信号和所述第二音频信号,从第一音频信号中去除因第二音频信号的外放产生的干扰,得到输入目标应用程序的语音指令包括:从第二音频信号中获取被麦克风采集的音频信号作为干扰音频信号;从第一音频信号中去除干扰音频信号,得到输入目标应用程序的语音指令。
可选的,本实施例中,可以采用预设的噪声消除算法,将干扰音频信号作为第一音频信号中的噪声信号,从而将干扰音频信号从第一音频信号中去除。可选的,该噪声消除算法可以采用现有的噪声消除算法,本实施例对此没有限制。进一步的,该噪声消除算法可以是在ADSP(美国模拟器件公司(Analog Device Instrument,ADI)生产的数字信号处理芯片(Digital Singal Processor,DSP))中执行的。
采用本申请实施例的语音信号处理方法,可在电子装置上的目标应用程序开启后,获取电子装置的麦克风采集的第一音频信号,在电子装置的外放状态满足预设条件时,获取电子装置当前外放的第二音频信号。当第一音频信号中源于电子装置外部的语音指令的识别受到了干扰之时,基于本申请的方案,可根据第一音频信号和第二音频信号,有效去除第一音频信号中因第二音频信号产生的干扰,降低电子装置外放的音频信号对外部输入的语音指令的干扰,提升了第一音频信号的信噪比,提升电子装置正确识别语音指令的概率,进而提升用户体验。
下面以电子装置在来电时外放提醒铃声的场景为例,结合图4,对来电时的语音信号处理方法进行示例说明。
参见图4,该语音信号处理方法包括:
步骤401、监测当前是否来电,若是,则进入步骤402,否则继续监测;
步骤402、开启目标应用程序,开启麦克风采集音频信号,获取麦克风采集的第一音频信号;
步骤403、判断电子装置是否外放来电的提醒铃声,若是,则进入步骤404,否则进入步骤406;
步骤404、调用在硬件抽象层预设的来电提醒铃声提取逻辑,基于来电提醒铃声提取逻辑,提取待输入电子装置的扬声器的来电提醒铃声,将提取的来电提醒铃声作为电子装置当前外放的第二音频信号,进入步骤405;
步骤405、基于第一音频信号和第二音频信号,从第一音频信号中去除因第二音频信号的外放产生的干扰,得到输入目标应用程序的语音指令,进入步骤407;
步骤406、处理第一音频信号,得到输入目标应用程序的语音指令,进入步骤407;
步骤407、目标应用程序执行语音指令。
采用本申请实施例的语音信号处理方法,可在来电时自动开启目标应用程序,以及开启麦克风采集第一音频信号,在电子装置有外放来电提醒铃声时,启动设置在硬件抽象层预设的来电提醒铃声提取逻辑,提取待输入电子装置的来电提醒铃声作为电子装置当前外放的第二音频信号,然后有效去除第一音频信号中因第二音频信号产生的干扰音频信号,降低来电时外放的提醒铃声对外部输入的语音指令的干扰,提升第一音频信号的信噪比,提升电子装置正确识别语音指令的概率,进而提升用户体验。
请参阅图5,图5为本发明第四实施例提供的一种电子装置。该电子装置可用于实现图2-4所示实施例中的语音信号处理方法。如图5所示,该电子装置主要包括:
第一获取模块501,用于在电子装置上的目标应用程序开启后,获取电子装置的麦克风采集的第一音频信号;
第二获取模块502,用于在电子装置的外放状态满足预设条件时,获取电子装置当前外放的第二音频信号;
音频信号处理模块503,用于基于所述第一音频信号和所述第二音频信号,从所述第一音频信号中去除因所述第二音频信号的外放产生的干扰,得到输入所述目标应用程序的语音指令。
可选的,第二获取模块502,用于在电子装置处于外放音频信号的状态时,获取电子装置当前外放的第二音频信号,或者,第二获取模块502,用于在电子装置外放音频信号的响度大于预设响度时,获取电子装置当前外放的第二音频信号。
可选的,第二获取模块502获取电子装置当前外放的第二音频信号的方式包括:提取待输入电子装置的扬声器的音频信号,将提取到的音频信号作为电子装置当前外放的第二音频信号。
可选的,第二获取模块502,用于调用在硬件抽象层预设的语音提取逻辑,基于语音提取逻辑提取待输入电子装置的扬声器的音频信号,将提取的音频信号作为电子装置当前外放的第二音频信号。
可选的,电子装置还包括与预存模块,用于在电子装置外放音频信号时,将电子装置外放的音频信号写入特定存储空间中。第二获取模块502,用于从特定存储空间中读取写入时间最接近当前时刻的音频信号,将读取的音频信号作为电子装置当前外放的第二音频信号。
可选的,第二获取模块502,用于在提取待输入电子装置的扬声器的音频信号,将提取到的音频信号作为电子装置当前外放的第二音频信号之前,获取电子装置当前的实际使用状态,从使用状态与音频信号的预设对应关系中,匹配与实际使用状态对应的音频信号;若匹配成功,则获取匹配出的音频信号作为电子装置当前外放的第二音频信号;若匹配失败,则继续执行提取待输入电子装置的扬声器的音频信号,将提取到的音频信号作为电子装置当前外放的第二音频信号的步骤。
可选的,电子装置还包括启动模块,该启动模块用于在获取电子装置的麦克风采集的第一音频信号前,获取电子装置当前的实际使用状态,若预设使用状态中包含实际使用状态,则开启目标应用程序;或者,启动模块用于在获取电子装置的麦克风采集的第一音频信号前,若接收到通过触控屏输入的目标应用程序开启指令,则开启目标应用程序。或者,启动模块用于在获取电子装置的麦克风采集的第一音频信号前,若电子装置内的手势传感器检测到的手势为预设的目标应用程序开启手势,则开启目标应用程序。
可选的,音频信号处理模块503,用于从第二音频信号中获取被麦克风采集的音频信号作为干扰音频信号;从第一音频信号中去除干扰音频信号,得到输入目标应用程序的语音指令。
采用本申请实施例的电子装置,可在目标应用程序开启后,获取电子装置的麦克风采集的第一音频信号,在电子装置的外放状态满足预设条件时,获取电子装置当前外放的第二音频信号,根据第一音频信号和第二音频信号,有效去除第一音频信号中因第二音频信号产生的干扰,降低电子装置外放的音频信号对外部输入的语音指令的干扰,提升了第一音频信号的信噪比,提升电子装置正确识别语音指令的概率,进而提升用户体验。
请参阅图6,图6为本发明第五实施例提供的一种电子装置。该电子装置可用于实现图2-4所示任一实施例中的语音信号处理方法。如图6所示,该电子装置主要包括:
存储器601、处理器602、总线603及存储在存储器601上并可在处理器602上运行的计算机程序,存储器601和处理器602通过总线603连接。处理器602执行该计算机程序时,实现图2-4所示任一实施例中的语音信号处理方法。其中,处理器的数量可以是一个或多个。
进一步的,电子装置还包括用于采集音频信号的麦克风和用于播放音频信号的扬声器。
存储器601可以是高速随机存取记忆体(RAM,Random Access Memory)存储器,也可为非不稳定的存储器(non-volatile memory),例如磁盘存储器。存储器601用于存储可执行程序代码,处理器602与存储器601耦合。
采用本申请实施例的电子装置,可在目标应用程序开启后,获取电子装置的麦克风采集的第一音频信号,在电子装置的外放状态满足预设条件时,获取电子装置当前外放的第二音频信号,根据第一音频信号和第二音频信号,有效从第一音频信号中去除因第二音频信号产生的干扰,降低电子装置外放的音频信号对外部输入的语音指令的干扰,提升了第一音频信号的信噪比,提升电子装置正确识别语音指令的概率,进而提升用户体验。
进一步的,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是设置于上述各实施例中的电子装置中,该计算机可读存储介质可以是前述图6所示实施例中的存储器。
该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现图2-4所示任一实施例中的语音信号处理方法。进一步的,该计算机可存储介质还可以是U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本申请所提供的语音信号处理方法、电子装置及计算机可读存储介质的描述,对于本领域的技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (9)

1.一种语音信号处理方法,其特征在于,包括:
在电子装置上的目标应用程序开启后,获取所述电子装置的麦克风采集的第一音频信号;
在所述电子装置的外放状态满足预设条件时,获取所述电子装置当前的实际使用状态,从使用状态与音频信号的预设对应关系中,匹配与所述实际使用状态对应的音频信号;其中,所述使用状态至少包括:来电状态、闹钟工作状态;
若匹配成功,则获取匹配出的音频信号作为所述电子装置当前外放的第二音频信号;
若匹配失败,则提取待输入所述电子装置的扬声器的音频信号,将提取到的音频信号作为所述电子装置当前外放的第二音频信号;
基于所述第一音频信号和所述第二音频信号,从所述第一音频信号中去除因所述第二音频信号的外放产生的干扰,得到输入所述目标应用程序的语音指令。
2.根据权利要求1所述的语音信号处理方法,其特征在于,所述电子装置的外放状态满足预设条件包括:
所述电子装置处于外放音频信号的状态;
或者,所述电子装置外放音频信号的响度大于预设响度。
3.根据权利要求2所述的语音信号处理方法,其特征在于,所述提取待输入所述电子装置的扬声器的音频信号,将提取到的所述音频信号作为所述电子装置当前外放的第二音频信号包括:
调用在硬件抽象层预设的语音提取逻辑,基于所述语音提取逻辑提取待输入所述电子装置的扬声器的音频信号,将提取的所述音频信号作为所述电子装置当前外放的第二音频信号。
4.根据权利要求2所述的语音信号处理方法,其特征在于,在所述提取待输入所述电子装置的扬声器的音频信号,将提取到的所述音频信号作为所述电子装置当前外放的第二音频信号之前,还包括:
在所述电子装置外放音频信号时,将所述电子装置外放的所述音频信号写入特定存储空间中;
所述提取待输入所述电子装置的扬声器的音频信号,将提取到的所述音频信号作为所述电子装置当前外放的第二音频信号包括:
从所述特定存储空间中读取写入时间最接近当前时刻的音频信号,将读取的所述音频信号作为所述电子装置当前外放的第二音频信号。
5.根据权利要求1-4任一项所述的语音信号处理方法,其特征在于,在所述获取所述电子装置的麦克风采集的第一音频信号之前,还包括:
获取所述电子装置当前的实际使用状态,若预设使用状态中包含所述实际使用状态,则开启所述目标应用程序;
或者,若接收到通过触控屏输入的目标应用程序开启指令,则开启所述目标应用程序;
或者,若所述电子装置内的手势传感器检测到的手势为预设的目标应用程序开启手势,则开启所述目标应用程序。
6.根据权利要求1-4任一项所述的语音信号处理方法,其特征在于,所述基于所述第一音频信号和所述第二音频信号,从所述第一音频信号中去除因所述第二音频信号的外放产生的干扰,得到输入所述目标应用程序的语音指令包括:
从所述第二音频信号中获取被所述麦克风采集的音频信号作为干扰音频信号;
从所述第一音频信号中去除所述干扰音频信号,得到输入所述目标应用程序的语音指令。
7.一种电子装置,其特征在于,包括:
第一获取模块,用于在电子装置上的目标应用程序开启后,获取所述电子装置的麦克风采集的第一音频信号;
第二获取模块,用于在所述电子装置的外放状态满足预设条件时,获取所述电子装置当前的实际使用状态,从使用状态与音频信号的预设对应关系中,匹配与所述实际使用状态对应的音频信号;若匹配成功,则获取匹配出的音频信号作为所述电子装置当前外放的第二音频信号;若匹配失败,则提取待输入所述电子装置的扬声器的音频信号,将提取到的音频信号作为所述电子装置当前外放的第二音频信号;其中,所述使用状态至少包括:来电状态、闹钟工作状态;
音频信号处理模块,用于基于所述第一音频信号和所述第二音频信号,从所述第一音频信号中去除因所述第二音频信号的外放产生的干扰,得到输入所述目标应用程序的语音指令。
8.一种电子装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1至6中任意一项所述方法中的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至6中的任意一项所述方法中的步骤。
CN201811553672.XA 2018-12-19 2018-12-19 语音信号处理方法、电子装置及计算机可读存储介质 Active CN109658930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811553672.XA CN109658930B (zh) 2018-12-19 2018-12-19 语音信号处理方法、电子装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811553672.XA CN109658930B (zh) 2018-12-19 2018-12-19 语音信号处理方法、电子装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109658930A CN109658930A (zh) 2019-04-19
CN109658930B true CN109658930B (zh) 2021-05-18

Family

ID=66114828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811553672.XA Active CN109658930B (zh) 2018-12-19 2018-12-19 语音信号处理方法、电子装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109658930B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115361180B (zh) * 2022-08-05 2024-04-30 歌尔股份有限公司 基于物理按键的语音处理方法、电子设备、装置及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1397063A (zh) * 2000-11-27 2003-02-12 皇家菲利浦电子有限公司 对具有声音输出装置的设备进行控制的方法
JP2013218757A (ja) * 2012-04-05 2013-10-24 Alpine Electronics Inc 楽曲再生装置
CN106126164A (zh) * 2016-06-16 2016-11-16 广东欧珀移动通信有限公司 一种音效处理方法及终端设备
CN108986831A (zh) * 2017-05-31 2018-12-11 南宁富桂精密工业有限公司 语音干扰滤除的方法、电子装置及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015050556A1 (en) * 2013-10-04 2015-04-09 Intel Corporation Cancellation of interfering audio on a mobile device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1397063A (zh) * 2000-11-27 2003-02-12 皇家菲利浦电子有限公司 对具有声音输出装置的设备进行控制的方法
JP2013218757A (ja) * 2012-04-05 2013-10-24 Alpine Electronics Inc 楽曲再生装置
CN106126164A (zh) * 2016-06-16 2016-11-16 广东欧珀移动通信有限公司 一种音效处理方法及终端设备
CN108986831A (zh) * 2017-05-31 2018-12-11 南宁富桂精密工业有限公司 语音干扰滤除的方法、电子装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN109658930A (zh) 2019-04-19

Similar Documents

Publication Publication Date Title
CN107147792B (zh) 一种自动配置音效的方法、装置、移动终端及存储装置
CN107463247B (zh) 一种文本阅读处理的方法、装置以及终端
US20150088515A1 (en) Primary speaker identification from audio and video data
US11200899B2 (en) Voice processing method, apparatus and device
CN108831477B (zh) 一种语音识别方法、装置、设备及存储介质
CN109284080B (zh) 音效调整方法、装置、电子设备以及存储介质
CN109101517B (zh) 信息处理方法、信息处理设备以及介质
US9766852B2 (en) Non-audio notification of audible events
CN107643909B (zh) 用于协调多个本地设备上的输入的方法和电子设备
CN106228047B (zh) 一种应用程序图标处理方法及终端设备
CN110086941B (zh) 语音播放方法、装置及终端设备
CN113033245A (zh) 一种功能调节方法、装置、存储介质及电子设备
US10269347B2 (en) Method for detecting voice and electronic device using the same
CN109658930B (zh) 语音信号处理方法、电子装置及计算机可读存储介质
CN104572007A (zh) 一种终端的音量调节方法
CN106155707B (zh) 信息处理方法及电子设备
CN111970671B (zh) 近场通信模块的控制方法、装置及电子设备
CN113157240A (zh) 语音处理方法、装置、设备、存储介质及计算机程序产品
CN108334339A (zh) 一种蓝牙设备驱动方法和装置
US11108709B2 (en) Provide status message associated with work status
US9894193B2 (en) Electronic device and voice controlling method
US10572955B2 (en) Presenting context for contacts
CN111045641B (zh) 一种电子终端及语音识别方法
CN108417208B (zh) 一种语音输入方法和装置
WO2019061323A1 (zh) 一种降噪方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant