WO2019061292A1 - 一种终端降噪方法及终端 - Google Patents

一种终端降噪方法及终端 Download PDF

Info

Publication number
WO2019061292A1
WO2019061292A1 PCT/CN2017/104381 CN2017104381W WO2019061292A1 WO 2019061292 A1 WO2019061292 A1 WO 2019061292A1 CN 2017104381 W CN2017104381 W CN 2017104381W WO 2019061292 A1 WO2019061292 A1 WO 2019061292A1
Authority
WO
WIPO (PCT)
Prior art keywords
microphone
terminal
sound source
source position
dual camera
Prior art date
Application number
PCT/CN2017/104381
Other languages
English (en)
French (fr)
Inventor
曹军
张玉磊
王成永
桂明建
Original Assignee
深圳传音通讯有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳传音通讯有限公司 filed Critical 深圳传音通讯有限公司
Priority to PCT/CN2017/104381 priority Critical patent/WO2019061292A1/zh
Publication of WO2019061292A1 publication Critical patent/WO2019061292A1/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules

Definitions

  • the obtaining unit 720 is configured to obtain a sound source position, where the sound source position includes a position of the sound source relative to the first terminal, and the sound source includes a sound source generated by the body performing the voice interaction.
  • the prompt message may be a vibrating alert or a voice prompt.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)

Abstract

本发明实施例公开了一种终端降噪方法及终端,其中方法包括:当第一终端进入语音交互状态时,所述第一终端开启双摄像头,其中所述第一终端设有所述双摄像头、第一麦克风和第二麦克风;根据所述双摄像头获得声源位置,所述声源位置包括声源相对于所述第一终端的位置,所述声源包括语音交互的主体产生的声音来源;计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离;根据所述目标距离,调整内部算法参数;根据调整后的内部算法参数,对所述第一麦克风和所述第二麦克风接收到的语音信号做降噪处理,并将降噪后的语音信号发送给第二终端。本发明实施例通过结合双摄像头和双麦克风进行降噪,可以滤除环境噪声,提高通话质量。

Description

一种终端降噪方法及终端 技术领域
本发明涉及通信技术领域,尤其涉及一种终端降噪方法及终端。
背景技术
移动终端的发展极大的改变了我们的生活方式,使我们的生活变得更加便利,尤其是手机的出现更是让我们的沟通变得更加畅通。但是在通话过程中总是会有很多的环境噪音,甚至某些时候用户的声音完成被噪声淹没,极大的影响了我们的通话质量。
目前,很多带有两个麦克风的手机都会有双麦克降噪功能。双麦克降噪的原理是:两个不同位置的麦克风收集的音频信号不同,一个是用户通话时使用的主麦克风,收集的人声信号强度更大,另一个一般配置在机身顶端,收集的人声信号强度更小,大概相差6dB。周围环境噪声到达两个麦克风的声波强度是差不多的。语音到达两个麦克风的幅度相差6dB,被保留,噪声到达两个麦克风幅度相当,被过滤,从而实现了双麦克降噪。当用户使用免提通话时,手机位置不固定,两个麦克风接收到人声的幅度差不一定为6dB,如果没有做相应调整的话就可能会把有用信号滤除而使声音变小。如何在用户使用免提通话或者在手机位置不固定的情况下滤除噪音,保证通话质量是现在手机通信急需解决的问题。
发明内容
本发明实施例提供一种终端降噪方法,可通过双摄像头定位出声源的位置及与第一麦克风和第二麦克风的距离,然后根据得到的距离信息获取在这个距离下两个麦克风接收到语音信号的差值,进而保留这个差值的有用信号,可以动态的采集声源信号,实时调整特定参数,滤除环境噪声,有效地改善终端的语音清晰度,提高通话质量。
第一方面,本发明实施例提供了一种终端降噪方法,该方法包括:
当第一终端进入语音交互状态时,所述第一终端开启双摄像头,其中所述第一终端设有所述双摄像头、第一麦克风和第二麦克风;
根据所述双摄像头获得声源位置,所述声源位置包括声源相对于所述第一终端的位置,所述声源包括进行语音交互的主体产生的声音来源;
计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离;
根据所述目标距离,调整内部算法参数;
根据调整后的内部算法参数,对所述第一麦克风和所述第二麦克风接收到的语音信号做降噪处理,并将降噪后的语音信号发送给第二终端。
其中,在所述第一终端开启双摄像头之后,所述方法还包括:
根据所述双摄像头按照预定周期获得声源位置,执行所述计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离的步骤。
其中,所述当第一终端进入语音交互状态时,所述第一终端开启双摄像头,包括:
当第一终端建立了语音交互连接,且所述第一终端的扬声器处于开启状态时,所述第一终端开启双摄像头;或者,当第一终端建立了语音交互连接,且所述第一终端外接有声 音播放设备时,所述第一终端开启双摄像头。
其中,所述计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离之后,还包括:
若所述声源位置与所述第一麦克风之间的目标距离和所述第二麦克风之间的目标距离超过第一预定阈值,增大所述第一麦克风和第二麦克风的增益。
其中,所述计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离之后,还包括:
若所述声源位置与所述第一麦克风之间的距离与所述第二麦克风之间的距离小于第二预设阈值,则所述第一终端只使用第一麦克风接收语音信号。
其中,所述第一终端存储有多个距离分别与多个差值的对应关系,所述距离与所述差值一一对应,不同的距离对应不同的差值;其中所述距离包括声源位置分别与所述第一麦克风和第二麦克风之间的距离,所述差值包括所述第一麦克风与所述第二麦克风接收目标信号的幅度差值;
所述根据所述目标距离,调整内部算法参数包括:
从所述多个距离分别与多个差值的对应关系中,查找所述声源位置及与第一麦克风和第二麦克风之间的目标距离对应的目标差值;将所述目标差值作为当前目标信号差值。
其中,在查找所述声源位置及与所述第一麦克风和所述第二麦克风之间的目标距离信息对应的目标差值时,若所述双摄像头获得的声源位置与所述第一麦克风和所述第二麦克风之间的距离与预先存储在所述第一终端中的多个距离的差值小于第四预设阈值,将查找到的声源位置及与所述第一麦克风和所述第二麦克风之间的目标距离对应的目标差值作为当前目标信号差值。
其中,在所述根据所述双摄像头获得声源位置之后,还包括:
若所述第一麦克风和所述第二麦克风接收到的语音信号强度超过第三预设阈值,所述第一终端发出提示消息,以提示所述进行语音交互的主体调整位置。
第二方面,本发明实施例提供了一种终端,该终端包括:
开启单元,用于当第一终端进入语音交互状态时,所述第一终端开启双摄像头,其中所述第一终端设有所述双摄像头、第一麦克风和第二麦克风。
获得单元,用于获得声源位置,所述声源位置包括声源相对于所述第一终端的位置,所述声源包括进行语音交互的主体产生的声音来源。
计算单元,用于计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离。
调整单元,用于根据所述目标距离,调整内部算法参数。
处理单元,用于根据调整后的内部算法参数,对所述第一麦克风和所述第二麦克风接收到的语音信号做降噪处理。
发送单元,用于将降噪后的语音信号发送给第二终端。
增大单元,用于在所述声源位置与所述第一麦克风之间的目标距离和所述第二麦克风之间的目标距离超过第一预定阈值,增大所述第一麦克风和第二麦克风的增益。
查找单元,用于从所述多个距离分别与多个差值的对应关系中,查找所述声源位置及 与第一麦克风和第二麦克风之间的目标距离对应的目标差值。
提示单元,用于在所述第一麦克风和所述第二麦克风接收到的语音信号强度超过第三预设阈值时,发出提示消息,以提示所述进行语音交互的主体调整位置。
第三方面,本发明实施例提供了另一种终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持终端执行上述方法的应用程序代码,所述处理器被配置用于调用所述程序代码,执行上述第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
本发明实施例通过双摄像头定位出声源的位置及与第一麦克风和第二麦克风的距离,然后根据得到的距离信息获取在这个距离下两个麦克风接收到语音信号的差值,进而保留这个差值的有用信号,可以动态的采集声源信号,实时调整特定参数,滤除环境噪声,有效地改善终端的语音清晰度,提高通话质量。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种降噪方法的示意流程图;
图2是本发明实施例提供的一种终端的示意图;
图3是本发明实施例提供的一种语音交互状态的示意图;
图4是本发明实施例提供的另一种语音交互状态的示意图;
图5是本发明实施例提供的一种获取声源位置的示意图;
图6是本发明实施例提供的另一种终端降噪方法的示意流程图;
图7是本发明实施例提供的一种终端的示意性框图;
图8是本发明实施例提供的另一种终端的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文 清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
具体实现中,本发明实施例中描述的终端包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,所述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其它物理用户接口设备。
终端支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、文字处理应用程序、网站创建应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄影机应用程序、web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。
参见图1,是本发明实施例提供一种终端降噪方法的示意流程图,如图1所示,本发明的一个实施例提供的一种终端降噪方法可包括:
S101、当第一终端进入语音交互状态时,所述第一终端开启双摄像头,其中所述第一终端设有所述双摄像头、第一麦克风和第二麦克风。
其中,第一终端可以是手机、平板电脑、掌上电脑、移动互联网设备或其他具有双摄像头和双麦克风结构的终端设备。
其中,在语音交互完成后,第一终端关闭所述双摄像头。
参见图2,是本发明实施例提供的一种终端的示意图。这里以手机为例,可以看到,在手机左上侧有两个摄像头,手机通过这两个摄像头获取声源位置,在手机的右下底部安装有第一麦克风,第一麦克风可以理解为主麦克风,在手机右上顶部安装有第二麦克风,第二麦克风可以理解为次麦克风。可以理解的是,这仅仅是本发明可能的一种实施方式,对于麦克风的数量和安装在手机上的位置以及摄像头安装在手机上的位置,可以根据实际需求有所改变,本申请不做限制。
可选的,在本发明的一些可能的实施方式中,第一终端进入语音交互状态可以是第一终端建立了语音交互连接,且所述第一终端的扬声器处于开启状态;或者,当第一终端建 立了语音交互连接,且所述第一终端外接有声音播放设备,其中声音播放设备可以是耳机或其他能够从手机等终端设备中接出音频信号的设备。
参见图3,是本发明实施例提供的一种语音交互状态的示意图。可以看出,第一终端已经与第二终端建立了语音交互连接,且第一终端的扬声器处于开启状态,这表明第一终端已经进入语音交互状态,需要执行开启双摄像头。
参见图4,是本发明实施例提供的另一种语音交互状态的示意图。可以看出,第一终端已经与第二终端建立了语音交互连接,且第一终端插入了耳机设备,这表明第一终端已经进入了语音交互状态,需要执行开启双摄像头。
可以看出,本发明实施例的方案中,第一终端在确认进入语音交互状态后才会开启双摄像头,一旦语音交互完成后将会关闭所述双摄像头,可以避免双摄像头一直处于开启状态,节约第一终端的电源开支,延长待机时间。
S102、根据所述双摄像头获得声源位置,所述声源位置包括声源相对于所述第一终端的位置,所述声源包括进行语音交互的主体产生的声音来源。
其中,根据所述双摄像头获得声源位置是在整个语音交互过程中按照预定周期获得声源位置,不是仅仅只获得一次声源位置,而是在整个语音交互过程中不断调整的。
可选的,在本发明可能的一些可能的实施方式中,预定周期可以设置为0.1s、0.2s、0.5s、1s或2s,预设周期具体设置为多少,本申请不做限制。
参见图5,是本发明实施例提供的一种获取声源位置的示意图。这里将声源理解为用户发出声音的嘴部,手机通过双摄像头确定用户嘴部相对于手机的位置,以便于计算用户嘴部分别于第一麦克风和第二麦克风之间的目标距离。
可以看出,本发明实施例的方案中,声源位置可能并不固定,双摄像头通过预定周期获得声源位置,可以动态的采集声源信号,实时的获得声源位置,及时的做出调整,避免把有用信号滤除而使声音变小,影响用户通话质量。
S103、计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离。
其中,在第一终端中存储有计算距离的算法,第一终端可以通过所述算法根据双摄像头获得的声源位置计算出声源位置与第一麦克风和第二麦克风之间的距离。
可选的,在本发明的一些可能的实施方式中,在计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离之后,若所述声源位置与所述第一麦克风之间的目标距离和所述第二麦克风之间的目标距离超过第一预定阈值,增大所述第一麦克风和第二麦克风的增益。
可以理解,若声源位置距离第一麦克风和第二麦克风都较远时,两个麦克风接收到的语音信号都比较小,不容易辨听清楚,需要对两个麦克风接收到的语音信号做放大处理,保证通话质量。其中,所述第一预设阈值可以根据实际需要来进行设置,具体设置为何值,本申请不做限制。
可选的,在本发明的一些可能的实施方式中,在计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离之后,若所述声源位置与所述第一麦克风之间的距离与所述第二麦克风之间的距离小于第二预设阈值,则所述第一终端只使用第一麦克风接收语音信号。
可以理解,若声源位置与第一麦克风和第二麦克风之间的距离相近时,两个麦克风接收到的声源信号也几乎相同,若不加处理,那么第一终端可能将其作为背景噪声滤除掉,导致第二终端接收到的声音很小,甚至接收不到声音,严重影响通话质量。所以为了避免这种情况的发生,若所述声源位置与所述第一麦克风之间的距离与所述第二麦克风之间的距离小于第二预设阈值,则所述第一终端只使用第一麦克风接收语音信号。其中,所述第二预设阈值可以根据实际需要来进行设置,具体设置为何值,本申请不做限制。
S104、根据所述目标距离,调整内部算法参数。
其中,第一终端存储有多个距离分别与多个差值的对应关系,所述距离与所述差值一一对应,不同的距离对应不同的差值;其中所述距离包括声源位置分别与所述第一麦克风和第二麦克风之间的距离,所述差值包括所述第一麦克风与所述第二麦克风接收目标信号的幅度差值。
第一终端根据目标距离,调整内部算法参数是从存储于第一终端中的所述多个距离分别与多个差值的对应关系中,查找所述声源位置及与第一麦克风和第二麦克风之间的目标距离对应的目标差值;将所述目标差值作为当前目标信号差值。
可选的,在本发明的一些可能的实施方式中,在查找所述声源位置及与所述第一麦克风和所述第二麦克风之间的目标距离信息对应的目标差值时,若所述双摄像头获得的声源位置与所述第一麦克风和所述第二麦克风之间的距离与预先存储在所述第一终端中的多个距离的差值小于第四预设阈值,将查找到的声源位置及与所述第一麦克风和所述第二麦克风之间的目标距离对应的目标差值作为当前目标信号差值。
举例来说,若之前第一终端的第一麦克风和第二麦克风接收到的目标信号的差值是6dB,即用户在正常手持终端通话时两个麦克风接收到的目标信号的差值,现在用户离开了终端,开启扬声器保持通话,因为用户的位置发生了改变,那么两个麦克风接收的目标信号的差值也不再是之前的6dB,第一终端需要通过双摄像头确定用户嘴部的位置,根据所述位置,通过内部算法计算出用户嘴部与第一麦克风和第二麦克风之间的距离,然后再根据所述距离从存储于第一终端中的所述多个距离分别与多个差值的对应关系中,查找所述声源位置及与第一麦克风和第二麦克风之间的目标距离对应的目标差值,这里假设查找到的目标差值是10dB,那么第一终端就将10dB作为新的目标差值,而不再是之前的6dB。
可选的,在本发明的一些可能的实施方式中,在获得目标距离之后,根据存储在第一终端中的算法计算出两个麦克风接收到的语音信号的幅度差值,将所述幅度差值作为当前目标信号差值,在语音交互过程中保留这个差值的语音信号,可以有效地滤除环境噪声。
可以看出,本发明实施例的方案中,第一终端可以根据获得的目标距离,快速的查找出所述目标距离对应的目标差值,将查找到的目标差值作为当前目标信号差值,可以保证实时的更新目标信号差值,避免滤除目标信号,提高通话质量。
S105、根据调整后的内部算法参数,对所述第一麦克风和所述第二麦克风接收到的语音信号做降噪处理,并将降噪后的语音信号发送给第二终端。
其中,若所述第一麦克风和所述第二麦克风接收到的语音信号强度超过第三预设阈值,所述第一终端发出提示消息,以提示所述进行语音交互的主体调整位置。
可选的,在本发明的一些可能的实施方式中,提示消息可以是振动提示或者是语音提 示。
可以理解,若环境噪声太大,用户发出的声音将会淹没在噪声中,不易甄别出来,这时候就需要用户调整自身的位置以及第一终端的位置,保证两个麦克风能够接收到用户发出的声音并识别出来,所以若第一麦克风和所述第二麦克风接收到的语音信号强度超过第三预设阈值,所述第一终端将发出提示消息。其中,所述第三预设阈值可以根据实际需要来进行设置,具体设置为何值,本申请不做限制。
其中,降噪包括对两个麦克风接收到的语音信号进行分析,若两个麦克风接收到的语音信号的差值与当前目标信号差值一致,则保留此语音信号,若不一致则滤除。通过这样处理后就将环境噪声滤除,得到降噪后的语音信号,第一终端再将降噪后的语音信号发送给第二终端。
可以看出,本发明实施例的方案中,在环境噪声过大的情况下,第一终端通过发出提示消息以提示用户调整位置可以使两个麦克风能够接收到用户发出的声音并识别出来,保证用户能够正常通话。
参见图6,是本发明实施例提供的另一种终端降噪方法的示意流程图。
601、第一终端首先建立了语音交互连接,然后检测扬声器是否处于开启状态或外接有声音播放设备,在确认后执行步骤602,开启双摄像头。
603、根据双摄像头获得声源位置。
604、计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离。
605、若所述声源位置与所述第一麦克风之间的目标距离和所述第二麦克风之间的目标距离超过第一预定阈值,执行步骤608,增大所述第一麦克风和第二麦克风的增益。
606、若所述声源位置与所述第一麦克风之间的距离与所述第二麦克风之间的距离小于第二预设阈值,执行步骤609,第一终端只使用第一麦克风接收语音信号。
607、若所述双摄像头获得的声源位置与所述第一麦克风和所述第二麦克风之间的距离与预先存储在所述第一终端中的多个距离的差值小于第四预设阈值,执行步骤610,将查找到的声源位置及与所述第一麦克风和所述第二麦克风之间的目标距离对应的目标差值作为当前目标信号差值。
611、根据所述目标距离,调整内部算法参数。
612、根据调整后的内部算法参数,对所述第一麦克风和所述第二麦克风接收到的语音信号做降噪处理,并将降噪后的语音信号发送给第二终端。
因为声源位置可能并不固定,双摄像头需要实时获得声源位置,动态的采集声源信号,所以在将降噪后的语音信号发送给第二终端后,需要再次执行获得声源位置步骤,即双摄像头是需要周期性的获得声源位置的。
可以看出,本发明实施例可通过双摄像头定位出声源的位置及与第一麦克风和第二麦克风的距离,然后根据得到的距离信息获取在这个距离下两个麦克风接收到语音信号的差值,进而保留这个差值的有用信号,可以动态的采集声源信号,实时调整特定参数,滤除环境噪声,有效地改善终端的语音清晰度,提高通话质量。
参见图7,是本发明实施例提供的一种终端的示意框图。终端700包括:开启单元710,获得单元720,计算单元730,调整单元740,处理单元750,发送单元760,增大单元770, 查找单元780和提示单元790。
开启单元710,用于当第一终端进入语音交互状态时,开启双摄像头,其中所述第一终端设有所述双摄像头、第一麦克风和第二麦克风。
其中,第一终端可以是手机、平板电脑、掌上电脑、移动互联网设备或其他具有双摄像头和双麦克风结构的终端设备。
其中,在语音交互完成后,第一终端关闭所述双摄像头。
可选的,在本发明的一些可能的实施方式中,第一终端进入语音交互状态可以是第一终端建立了语音交互连接,且所述第一终端的扬声器处于开启状态;或者,当第一终端建立了语音交互连接,且所述第一终端外接有声音播放设备,其中声音播放设备可以是耳机或其他能够从手机等终端设备中接出音频信号的设备。
可以看出,本发明实施例的方案中,开启单元710在确认第一终端进入语音交互状态后才会开启双摄像头,一旦语音交互完成后将会关闭所述双摄像头,可以避免双摄像头一直处于开启状态,节约第一终端的电源开支,延长待机时间。
获得单元720,用于获得声源位置,所述声源位置包括声源相对于所述第一终端的位置,所述声源包括进行语音交互的主体产生的声音来源。
其中获得单元720获得声源位置是在整个语音交互过程中按照预定周期获得声源位置,不是仅仅只获得一次声源位置,而是在整个语音交互过程中不断调整的。
可选的,在本发明可能的一些可能的实施方式中,预定周期可以设置为0.1s、0.2s、0.5s、1s或2s,预设周期具体设置为多少,本申请不做限制。
可以看出,本发明实施例的方案中,声源位置可能并不固定,获得单元720通过预定周期获得声源位置,可以动态的采集声源信号,实时的获得声源位置,及时的做出调整,避免把有用信号滤除而使声音变小,影响用户通话质量。
计算单元730,用于计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离。
其中,在第一终端中存储有计算距离的算法,计算单元730可以通过所述算法根据双摄像头获得的声源位置计算出声源位置与第一麦克风和第二麦克风之间的距离。
其中,计算单元730中还包括增大单元770,用于在计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离之后,若所述声源位置与所述第一麦克风之间的目标距离和所述第二麦克风之间的目标距离超过第一预定阈值,增大所述第一麦克风和第二麦克风的增益。
可以理解,若声源位置距离第一麦克风和第二麦克风都较远时,两个麦克风接收到的语音信号都比较小,不容易辨听清楚,需要对两个麦克风接收到的语音信号做放大处理,保证通话质量。其中,所述第一预设阈值可以根据实际需要来进行设置,具体设置为何值,本申请不做限制。
可选的,在本发明的一些可能的实施方式中,在计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离之后,若所述声源位置与所述第一麦克风之间的距离与所述第二麦克风之间的距离小于第二预设阈值,则所述第一终端只使用第一麦克风接收语音信号。
可以理解,若声源位置与第一麦克风和第二麦克风之间的距离相近时,两个麦克风接收到的声源信号也几乎相同,若不加处理,那么第一终端可能将其作为背景噪声滤除掉,导致第二终端接收到的声音很小,甚至接收不到声音,严重影响通话质量。所以为了避免这种情况的发生,若所述声源位置与所述第一麦克风之间的距离与所述第二麦克风之间的距离小于第二预设阈值,则所述第一终端只使用第一麦克风接收语音信号。其中,所述第二预设阈值可以根据实际需要来进行设置,具体设置为何值,本申请不做限制。
调整单元740,用于根据所述目标距离,调整内部算法参数。
其中,第一终端存储有多个距离分别与多个差值的对应关系,所述距离与所述差值一一对应,不同的距离对应不同的差值;其中所述距离包括声源位置分别与所述第一麦克风和第二麦克风之间的距离,所述差值包括所述第一麦克风与所述第二麦克风接收目标信号的幅度差值。
其中,调整单元740还包括查找单元780,,用于在存储于第一终端中的所述多个距离分别与多个差值的对应关系中,查找所述声源位置及与第一麦克风和第二麦克风之间的目标距离对应的目标差值;将所述目标差值作为当前目标信号差值。
可选的,在本发明的一些可能的实施方式中,在查找所述声源位置及与所述第一麦克风和所述第二麦克风之间的目标距离信息对应的目标差值时,若所述获得单元720获得的声源位置与所述第一麦克风和所述第二麦克风之间的距离与预先存储在所述第一终端中的多个距离的差值小于第四预设阈值,将查找到的声源位置及与所述第一麦克风和所述第二麦克风之间的目标距离对应的目标差值作为当前目标信号差值。
可以看出,本发明实施例的方案中,查找单元780可以根据获得的目标距离,快速的查找出所述目标距离对应的目标差值,将查找到的目标差值作为当前目标信号差值,可以保证实时的更新目标信号差值,避免滤除目标信号,提高通话质量。
处理单元750,用于根据调整后的内部算法参数,对所述第一麦克风和所述第二麦克风接收到的语音信号做降噪处理。
其中,处理单元750中还包括提示单元790,用于在所述第一麦克风和所述第二麦克风接收到的语音信号强度超过第三预设阈值,发出提示消息,以提示所述进行语音交互的主体调整位置。
可选的,在本发明的一些可能的实施方式中,提示消息可以是振动提示或者是语音提示。
可以理解,若环境噪声太大,用户发出的声音将会淹没在噪声中,不易甄别出来,这时候就需要用户调整自身的位置以及第一终端的位置,保证两个麦克风能够接收到用户发出的声音并识别出来,所以若第一麦克风和所述第二麦克风接收到的语音信号强度超过第三预设阈值,提示单元790将发出提示消息。其中,所述第三预设阈值可以根据实际需要来进行设置,具体设置为何值,本申请不做限制。
其中,降噪包括对两个麦克风接收到的语音信号进行分析,若两个麦克风接收到的语音信号的差值与当前目标信号差值一致,则保留此语音信号,若不一致则滤除,通过这样处理后就将环境噪声滤除,得到降噪后的语音信号。
其中,处理单元750还包括发送单元760,用于将得到降噪后的语音信号发送给第二 终端。
可以看出,本发明实施例的方案中,在环境噪声过大的情况下,提示单元790通过发出提示消息以提示用户调整位置可以使两个麦克风能够接收到用户发出的声音并识别出来,保证用户能够正常通话。
参见图8,是本发明另一实施例提供的一种终端示意框图。如图8所示,本实施例中的终端200可以包括:基带芯片210、存储器215(一个或多个计算机可读存储介质)、射频(RF)模块216、外围系统217。这些部件可在一个或多个通信总线214上通信。
外围系统217主要用于实现终端210和用户/外部环境之间的交互功能,主要包括终端200的输入输出装置。具体实现中,外围系统217可包括:触摸屏控制器218、摄像头控制器219、音频控制器220以及传感器管理模块221。其中,各个控制器可与各自对应的外围设备(如触摸屏223、摄像头224、音频电路225以及传感器226)耦合。需要说明的,外围系统217还可以包括其他I/O外设。
基带芯片210可集成包括:一个或多个处理器211、时钟模块222以及电源管理模块213。集成于基带芯片210中的时钟模块222主要用于为处理器211产生数据传输和时序控制所需要的时钟。集成于基带芯片210中的电源管理模块213主要用于为处理器211、射频模块216以及外围系统提供稳定的、高精确度的电压。
应当理解,在本发明实施例中,所称处理器211可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
射频(RF)模块216用于接收和发送射频信号,包括SIM卡2161和Wi-Fi2162,主要集成了终端200的接收器和发射器。射频(RF)模块216通过射频信号与通信网络和其他通信设备通信。具体实现中,射频(RF)模块216可包括但不限于:天线系统、RF收发器、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、CODEC芯片、SIM卡和存储介质等。在一些实施例中,可在单独的芯片上实现射频(RF)模块216。
存储器215与处理器211耦合,用于存储各种软件程序和/或多组指令。具体实现中,存储器215可包括高速随机存取的存储器,并且也可包括非易失性存储器,例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备。存储器215可以存储操作系统(下述简称系统),例如ANDROID,IOS,WINDOWS,或者LINUX等嵌入式操作系统。存储器215还可以存储网络通信程序,该网络通信程序可用于与一个或多个附加设备,一个或多个终端设备,一个或多个网络设备进行通信。存储器215还可以存储用户接口程序,该用户接口程序可以通过图形化的操作界面将应用程序的内容形象逼真的显示出来,并通过菜单、对话框以及按键等输入控件接收用户对应用程序的控制操作。
存储器215还可以存储一个或多个应用程序。这些应用程序可包括:社交应用程序(例如Facebook),图像管理应用程序(例如相册),地图类应用程序(例如谷歌地图),浏览器(例如Safari,Google Chrome)等等。
本发明中,处理器211可用于读取和执行计算机可读指令。具体的,处理器211可用于调用存储于存储器215中的程序,例如本申请提供的降噪方法的实现程序,并执行该程序包含的指令。
在本发明可能的实施方式中,用户通过在外围系统217中的摄像头224中开启双摄像头,获得声源位置,在存储器215中找到计算距离的算法,通过处理器211计算出所述声源位置与第一麦克风和第二麦克风之间的目标距离,再通过音频控制器220对接收的语音信号做降噪处理,最后通过射频模块216将降噪后的语音信号发送给第二终端。
本发明实施例通过双摄像头定位出声源的位置及与第一麦克风和第二麦克风的距离,然后根据得到的距离信息获取在这个距离下两个麦克风接收到语音信号的差值,进而保留这个差值的有用信号,可以动态的采集声源信号,实时调整特定参数,滤除环境噪声,有效地改善终端的语音清晰度,提高通话质量。
应当理解,终端200仅为本发明实施例提供的一个例子,并且,终端200可具有比示出的部件更多或更少的部件,可以组合两个或更多个部件,或者可具有部件的不同配置实现。
在本发明的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现:当第一终端进入语音交互状态时,所述第一终端开启双摄像头,其中所述第一终端设有所述双摄像头、第一麦克风和第二麦克风;根据所述双摄像头获得声源位置,所述声源位置包括声源相对于所述第一终端的位置,所述声源包括进行语音交互的主体产生的声音来源;计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离;根据所述目标距离,调整内部算法参数;根据调整后的内部算法参数,对所述第一麦克风和所述第二麦克风接收到的语音信号做降噪处理,并将降噪后的语音信号发送给第二终端。
本发明实施例通过双摄像头定位出声源的位置及与第一麦克风和第二麦克风的距离,然后根据得到的距离信息获取在这个距离下两个麦克风接收到语音信号的差值,进而保留这个差值的有用信号,可以动态的采集声源信号,实时调整特定参数,滤除环境噪声,有效地改善终端的语音清晰度,提高通话质量。
所述计算机可读存储介质可以是前述任一实施例所述的终端的内部存储单元,例如终端的硬盘或内存。所述计算机可读存储介质也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述终端的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应 认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

  1. 一种终端降噪方法,其特征在于,包括:
    当第一终端进入语音交互状态时,所述第一终端开启双摄像头,其中所述第一终端设有所述双摄像头、第一麦克风和第二麦克风;
    根据所述双摄像头获得声源位置,所述声源位置包括声源相对于所述第一终端的位置,所述声源包括进行语音交互的主体产生的声音来源;
    计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离;
    根据所述目标距离,调整内部算法参数;
    根据调整后的内部算法参数,对所述第一麦克风和所述第二麦克风接收到的语音信号做降噪处理,并将降噪后的语音信号发送给第二终端。
  2. 根据权利要求1所述的方法,其特征在于,所述第一终端开启双摄像头之后,所述方法还包括:
    根据所述双摄像头按照预定周期获得声源位置,并执行所述计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离的步骤。
  3. 根据权利要求1或2所述的方法,其特征在于,所述当第一终端进入语音交互状态时,所述第一终端开启双摄像头,包括:
    当第一终端建立了语音交互连接,且所述第一终端的扬声器处于开启状态时,所述第一终端开启双摄像头;或者,当第一终端建立了语音交互连接,且所述第一终端外接有声音播放设备时,所述第一终端开启双摄像头。
  4. 根据权利要求1或2所述的方法,其特征在于,所述计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离之后,还包括:
    若所述声源位置与所述第一麦克风之间的目标距离和所述第二麦克风之间的目标距离超过第一预定阈值,增大所述第一麦克风和第二麦克风的增益。
  5. 根据权利要求4所述的方法,其特征在于,所述计算所述声源位置分别与所述第一麦克风和所述第二麦克风之间的目标距离之后,还包括:
    若所述声源位置与所述第一麦克风之间的距离与所述第二麦克风之间的距离小于第二预设阈值,则所述第一终端只使用第一麦克风接收语音信号。
  6. 根据权利要求1所述的方法,其特征在于,所述第一终端存储有多个距离分别与多个差值的对应关系,所述距离与所述差值一一对应,不同的距离对应不同的差值;其中所述距离包括声源位置分别与所述第一麦克风和第二麦克风之间的距离,所述差值包括所述第一麦克风与所述第二麦克风接收目标信号的幅度差值;
    所述根据所述目标距离,调整内部算法参数包括:
    从所述多个距离分别与多个差值的对应关系中,查找所述声源位置及与第一麦克风和第二麦克风之间的目标距离对应的目标差值;将所述目标差值作为当前目标信号差值。
  7. 根据权利要求1所述的方法,其特征在于,所述根据所述双摄像头获得声源位置之后,还包括:
    若所述第一麦克风和所述第二麦克风接收到的语音信号强度超过第三预设阈值,所述第一终端发出提示消息,以提示所述进行语音交互的主体调整位置。
  8. 一种终端,其特征在于,包括用于执行如权利要求1-7任一权利要求所述的方法的单元。
  9. 一种终端,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储应用程序代码,所述处理器被配置用于调用所述程序代码,执行如权利要求1-7任一项所述的方法。
  10. 一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
PCT/CN2017/104381 2017-09-29 2017-09-29 一种终端降噪方法及终端 WO2019061292A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/104381 WO2019061292A1 (zh) 2017-09-29 2017-09-29 一种终端降噪方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/104381 WO2019061292A1 (zh) 2017-09-29 2017-09-29 一种终端降噪方法及终端

Publications (1)

Publication Number Publication Date
WO2019061292A1 true WO2019061292A1 (zh) 2019-04-04

Family

ID=65902215

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/104381 WO2019061292A1 (zh) 2017-09-29 2017-09-29 一种终端降噪方法及终端

Country Status (1)

Country Link
WO (1) WO2019061292A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111694539A (zh) * 2020-06-23 2020-09-22 北京小米松果电子有限公司 在听筒和扬声器之间切换的方法、装置及介质
CN112578338A (zh) * 2019-09-27 2021-03-30 阿里巴巴集团控股有限公司 声源定位方法、装置、设备及存储介质
CN115083404A (zh) * 2022-04-29 2022-09-20 中国第一汽车股份有限公司 一种车载语音降噪方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9100492B2 (en) * 2013-02-04 2015-08-04 Electronics And Telecommunications Research Institute Mobile communication terminal and operating method thereof
WO2016183791A1 (zh) * 2015-05-19 2016-11-24 华为技术有限公司 一种语音信号处理方法及装置
CN106440192A (zh) * 2016-09-19 2017-02-22 珠海格力电器股份有限公司 一种家电控制方法、装置、系统及智能空调

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9100492B2 (en) * 2013-02-04 2015-08-04 Electronics And Telecommunications Research Institute Mobile communication terminal and operating method thereof
WO2016183791A1 (zh) * 2015-05-19 2016-11-24 华为技术有限公司 一种语音信号处理方法及装置
CN106440192A (zh) * 2016-09-19 2017-02-22 珠海格力电器股份有限公司 一种家电控制方法、装置、系统及智能空调

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112578338A (zh) * 2019-09-27 2021-03-30 阿里巴巴集团控股有限公司 声源定位方法、装置、设备及存储介质
CN112578338B (zh) * 2019-09-27 2024-05-14 阿里巴巴集团控股有限公司 声源定位方法、装置、设备及存储介质
CN111694539A (zh) * 2020-06-23 2020-09-22 北京小米松果电子有限公司 在听筒和扬声器之间切换的方法、装置及介质
CN111694539B (zh) * 2020-06-23 2024-01-30 北京小米松果电子有限公司 在听筒和扬声器之间切换的方法、装置及介质
CN115083404A (zh) * 2022-04-29 2022-09-20 中国第一汽车股份有限公司 一种车载语音降噪方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
JP6505252B2 (ja) 音声信号を処理するための方法及び装置
US9294612B2 (en) Adjustable mobile phone settings based on environmental conditions
US10438572B2 (en) Sound effect parameter adjustment method, mobile terminal and storage medium
CN108540900B (zh) 音量调节方法及相关产品
EP3432136B1 (en) Sound effect configuration method and related device
CN103618514A (zh) 音量调节方法、装置和电子设备
US10805708B2 (en) Headset sound channel control method and system, and related device
CN111083289B (zh) 音频播放方法、装置、存储介质及移动终端
WO2019033987A1 (zh) 提示方法、装置、存储介质及终端
US9414174B2 (en) Method and apparatus for controlling audio output
AU2013211541B2 (en) Mobile apparatus and control method thereof
US10628119B2 (en) Sound effect processing method and mobile terminal
WO2017215635A1 (zh) 一种音效处理方法及移动终端
CN106384597B (zh) 一种音频数据处理方法、及设备
WO2020107290A1 (zh) 音频输出控制方法和装置、计算机可读存储介质、电子设备
WO2017215654A1 (zh) 一种防止音效突变的方法及终端
WO2019061292A1 (zh) 一种终端降噪方法及终端
TWM526238U (zh) 可依據使用者年齡調整等化器設定之電子裝置及聲音播放裝置
CN111081283A (zh) 一种音乐播放方法、装置、存储介质及终端设备
CN111356908B (zh) 一种降噪方法及终端
CN108769364B (zh) 通话控制方法、装置、移动终端及计算机可读介质
CN109144462B (zh) 发声控制方法、装置、电子装置及计算机可读介质
CN106210951A (zh) 一种蓝牙耳机的适配方法、装置和终端
WO2020215321A1 (zh) 语音播报的控制方法、装置、存储介质及电子设备
WO2019033938A1 (zh) 音量调节方法、装置、存储介质及移动终端

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17926902

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17926902

Country of ref document: EP

Kind code of ref document: A1