发明内容
为此,本发明提供一种新的方案以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供一种适于在移动终端中执行的安全通话方法,该方法包括:响应于预定条件的满足,进入安全通话模式;在安全通话模式中,接收音频信号,包括用户语音分量和噪音分量;处理音频信号,使得抑制音频输入信号中的用户语音分量和/或放大噪音分量;输出经处理的音频信号。
预定条件可以包括以下中的至少一个:接收到用户进入安全通话模式的指示;来电号码不匹配移动终端通讯录中的联系人;来电号码匹配移动终端通信录或者联网数据库中的不受欢迎者;检测到通话内容中的特定关键字。
音频信号可以包括从第一麦克风输入的第一子音频信号和从第二麦克风输入的第二子音频信号。处理音频信号的步骤可以包括:对第一和第二子音频信号进行频域变换以获得第一频域信号和第二频域信号;通过第一频域信号和第二频域信号的差值获得语音分量分布的第一频点集合和噪音分量分布的第二频点集合;减少第一频点集合上的增益;和/或增加第二频点集合上的增益。
该安全通话方法还可以包括在经处理的音频信号中随机删除部分时间点上的信号采样。该安全通话方法还可以包括响应于用户的输入切换回正常通话模式。
根据本发明的另一方面,提供一种移动终端中的安全通话装置。安全通话装置包括通话模式控制单元和数字信号处理器。通话模式控制单元被配置为响应于预定条件的满足,进入安全通话模式。数字信号处理器被配置为在安全通话模式中,通过至少一个麦克风接收包括用户语音分量和噪音分量的音频信号,处理音频信号,使得抑制音频输入信号中的用户语音分量和/或放大噪音分量,输出经处理的音频信号。
音频信号可以包括从第一麦克风输入的第一子音频信号和从第二麦克风输入的第二子音频信号。数字信号处理器可以被进一步配置为:对第一和第二子音频信号进行频域变换以获得第一频域信号和第二频域信号;通过第一频域信号和第二频域信号的差值获得语音分量分布的第一频点集合和噪音分量分布的第二频点集合;减少第一频点集合上的增益;和/或增加第二频点集合上的增益。
数字信号处理器可以被进一步配置为在经处理的音频信号中随机删除部分时间点上的信号采样。通话模式控制单元可以被进一步配置为响应于用户的输入切换回正常通话模式。
根据本发明的另一方面,提供一种移动终端,包括如上所述的安全通话装置。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是移动终端100的结构框图。具有多点触摸能力的移动终端100可以包括存储器接口102、一个或多个数据处理器、图像处理器和/或中央处理单元104,以及外围接口106。存储器接口102、一个或多个处理器104和/或外围接口106既可以是分立元件,也可以集成在一个或多个集成电路中。在移动终端100中,各种元件可以通过一条或多条通信总线或信号线来耦合。传感器、设备和子系统可以耦合到外围接口106,以便帮助实现多种功能。例如,运动传感器110、光传感器112和距离传感器114可以耦合到外围接口106,以方便定向、照明和测距等功能。其他传感器116同样可以与外围接口106相连,例如定位系统(例如GPS接收机)、温度传感器、生物测定传感器或其他感测设备,由此可以帮助实施相关的功能。
相机子系统120和光学传感器122可以用于方便诸如记录照片和视频剪辑的相机功能的实现,其中所述相机子系统和光学传感器例如可以是电荷耦合器件(CCD)或互补金属氧化物半导体(CMOS)光学传感器。可以通过一个或多个无线通信子系统124来帮助实现通信功能,其中无线通信子系统可以包括射频接收机和发射机和/或光(例如红外)接收机和发射机。无线通信子系统124的特定设计和实施方式可以取决于移动终端100所支持的一个或多个通信网络。例如,移动终端100可以包括被设计成支持GSM网络、GPRS网络、EDGE网络、Wi-Fi或WiMax网络以及BlueboothTM网络的通信子系统124。音频子系统126可以与扬声器128以及麦克风130相耦合,以便帮助实施启用语音的功能,例如语音识别、语音复制、数字记录和电话功能。I/O子系统140可以包括触摸屏控制器142和/或一个或多个其他输入控制器144。触摸屏控制器142可以耦合到触摸屏146。举例来说,该触摸屏146和触摸屏控制器142可以使用多种触摸感测技术中的任何一种来检测与之进行的接触和移动或是暂停,其中感测技术包括但不局限于电容性、电阻性、红外和表面声波技术。一个或多个其他输入控制器144可以耦合到其他输入/控制设备148,例如一个或多个按钮、摇杆开关、拇指旋轮、红外端口、USB端口、和/或指示笔之类的指点设备。所述一个或多个按钮(未显示)可以包括用于控制扬声器128和/或麦克风130音量的向上/向下按钮。存储器接口102可以与存储器150相耦合。该存储器150可以包括高速随机存取存储器和/或非易失性存储器,例如一个或多个磁盘存储设备,一个或多个光学存储设备,和/或闪存存储器(例如NAND,NOR)。存储器150可以存储操作系统152,例如Android、IOS或是Windows Phone之类的操作系统。该操作系统152可以包括用于处理基本系统服务以及执行依赖于硬件的任务的指令。存储器150还可以存储应用154,应用154运行在操作系统之上,利用操作系统以及底层硬件提供的接口实现各种用户期望的功能,如即时通信、网页浏览、图片管理等。应用可以是独立于操作系统提供的,也可以是操作系统自带的。
本发明提出了一种安全通话模式来保护用户的安全和隐私。
在这种安全通话模式中,通过信号处理使得用户的语音分量被抑制,以及/或者噪音分量被放大,从而使对方听到的通话效果不佳,难以听清用户语音,这样保护了用户的安全和隐私。用户可以在此情况下以信号不好为由挂断电话,而不必担心对方的进一步骚扰。
安全通话模式的信号处理和模式控制涉及图1中的音频子系统126和无线通信子系统124。图2以双麦克风配置为例说明在安全通话模式下的示例性信号处理过程。
在图2的示例中采用了目前手机中常见的双麦克风配置进行说明。在这个例子中,第一麦克风靠近话筒位置,打电话时距离嘴部较近,作为主麦克风。第二麦克风靠近听筒向外位置,打电话时距离嘴部较远,作为参考麦克风。第一麦克风和第二麦克风输入的音频经过模数转换作为第一子音频信号s1(n)和第二子音频信号s2(n)进入数字信号处理器进行处理。显然,这两个子音频信号既包括语音分量也包括噪音分量。首先,第一子音频信号s1(n)和第二子音频信号s2(n)分别经过傅立叶变换,转换为频域信号S1(k)和S2(k)。然后数字信号处理器通过计算S1(k)和S2(k)的差值区分语音分量与噪音分量所在的频点,并对于S1(k)和S2(k)的合成信号S’(k)相应地减少其中语音分量的增益,和/或增大噪声的增益,从而使通话信号听上去更嘈杂。此外,还可以进一步删除合成信号中的部分采样点,可以使通话语音听上去断断续续。以下更具体说明信号处理的过程。
假设输入信号为s1(n)=a1x(n)+b1y(n),s2(n)=a2x(n)+b2y(n),其中x为语音分量,y为噪声分量,a1,b1,a2,b2分别是表示不同信号幅度的系数。在两个麦克风的例子中,由于第一麦克风靠近嘴部,因此语音分量的幅度较大,而噪音分量的幅度较小,而第二麦克风离嘴部较远,因此语音分量的幅度较小,噪音分量的幅度较大,即,a1>a2,b1<b2。两路输入信号经过傅立叶变换后分别为S1(k)=a1X(k)+b1Y(k),S2(k)=a2X(k)+b2Y(k)。对于重叠频点,两者相减后得到S1(k)-S2(k)=(a1-a2)X(k)+(b1-b2)Y(k)。因此,相减后语音分量的幅度大于零,而噪音分量的幅度小于0。数字信号处理器由此可以区分哪些频点是语音分量所占据的频点,而哪些频点是噪音分量所占据频点。DSP区分差值大于0的第一频点集合(即语音分量所占据的频点)和差值小于0的第二频点集合(即噪音分量所占据的频点)。数字信号处理器同时将S1(k)与S2(k)合并,S1(k)+S2(k)=(a1+a2)X(k)+(b1+b2)Y(k),DSP将合并后的信号中第一频点集合(即语音分量所占据的频点)上的增益(即a1+a2)减小,和/或将第二频点集合(即噪音分量所占据的频点)上的增益(即b1+b2)增大。当然,数字信号处理器也可以先对S1(k)和S2(k)进行频点集合上的增益调整,然后再将其合并。总之,数字信号处理器抑制语音分量和/或放大噪音分量,从而使得处理后的信号S’(k)听上去更嘈杂。S’(k)经过傅立叶逆变换得到时域信号s’(n)。为了进一步增强安全通话模式的效果,数字信号处理器还可以,例如每隔几百毫秒到几秒的时间区间内,随机删除s’(n)的部分时间点上的采样值。最终得到的信号s”(n)由于删除了部分采样值,因此听起来有断断续续的效果。
应当注意,尽管以双麦克风配置为例进行了说明,然而本领域技术人员应当理解,也可以采用其他数量的麦克风。调节语音和噪音增益的方式也不局限于上面例子中的方式,而是可以采用各种可能的数字信号处理方式。例如,也可以通过语音与噪音分量在频率和其他特性上的差别来进行区分,并进行相应的增益调节。总之,只要使得用户的语音分量被抑制,以及/或者噪音分量被放大,即可实现安全通话模式的效果。
图3是根据本发明一个示例性实施例的移动终端执行的安全通话方法的流程图。
在步骤S310,移动终端响应于预定条件的满足,进入安全通话模式。预定条件可以包括各种触发安全通话模式的情形。例如,安全通话模式可以在用户接听电话时或者通话过程中自动开启。自动开启可以是基于对来电号码与通信录的比对。例如,如果来电号码不匹配通信录中的任何联系人,即来电号码属于陌生人,那么在用户接听电话时可以自动开启该安全通话模式,使对方难以听清用户的声音,避免泄露用户的个人信息。此外,用户也可以对通信录中的特定联系人设置为不受欢迎的人,当来电号码匹配该特定联系人时自动开启安全通话模式。当然,也可以在联网存储(如云服务器中)的数据库中检索该来电号码并对于不受欢迎的人(如被多个用户标记为骚扰电话的来电号码)开启安全通话模式。在用户接听电话时或者通话过程中用户也可以指示进入安全通话模式。在通话过程中,也可以通过检测到用户或对方语音中的特定关键字而自动开启安全通话模式。例如,特定关键字可以包括“卖方”、“保险”、“贷款”等。手机可以通过屏幕显示或者声音提示用户处于安全通话模式中。在屏幕上可以提供正常通话模式的按键,用户在接听过程中如果认为对方没有危险,可以随时点击该按键切换到正常通话模式。
在步骤S320,在安全通话模式中,接收音频信号,包括用户语音分量和噪音分量。在步骤S330,处理音频信号,使得抑制音频输入信号中的用户语音分量和/或放大噪音分量。在步骤S340,输出经处理的音频信号。
音频信号可以包括从第一麦克风输入的第一子音频信号和从第二麦克风输入的第二子音频信号。处理音频信号的步骤可以包括对第一和第二子音频信号进行频域变换以获得第一频域信号和第二频域信号,通过第一频域信号和第二频域信号的差值获得语音分量分布的第一频点集合和噪音分量分布的第二频点集合,减少第一频点集合上的增益,和/或增加第二频点集合上的增益。此外,还可以包括在经处理的音频信号中随机删除部分时间点上的信号采样。
图4是根据本发明一个示例性实施例的移动终端中的安全通话装置400的框图。
如图4所示,通话模式控制单元410被配置为响应于预定条件的满足,进入安全通话模式。数字信号处理器(DSP)420被配置为在安全通话模式中通过至少一个麦克风接收包括用户语音分量和噪音分量的音频信号,处理音频信号,使得抑制音频输入信号中的用户语音分量和/或放大噪音分量,以及输出经处理的音频信号。预定条件包括以下中的至少一个:接收到用户进入安全通话模式的指示;来电号码不匹配移动终端通讯录中的联系人;来电号码匹配移动终端通信录或者联网数据库中的不受欢迎者;检测到通话内容中的特定关键字。
音频信号包括从第一麦克风输入的第一子音频信号和从第二麦克风输入的第二子音频信号,DSP 420被进一步配置为:对第一和第二子音频信号进行频域变换以获得第一频域信号和第二频域信号;通过第一频域信号和第二频域信号的差值获得语音分量分布的第一频点集合和噪音分量分布的第二频点集合;减少第一频点集合上的增益;和/或增加第二频点集合上的增益。
DSP 420被进一步配置为在经处理的音频信号中随机删除部分时间点上的信号采样。通话模式控制单元410被进一步配置为响应于用户的输入切换回正常通话模式。
经过DSP 420处理后的信号被输出到基带单元和射频单元(未示出)进行基带和射频信号处理并通过天线发射。
在此处所提供的说明书中描述了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。