WO2021184920A1

WO2021184920A1 - 一种声音的掩蔽方法、装置及终端设备

Info

Publication number: WO2021184920A1
Application number: PCT/CN2020/141881
Authority: WO
Inventors: 宋贤高; 吴融融; 刘嘉禾; 高俊平
Original assignee: 华为技术有限公司
Priority date: 2020-03-20
Filing date: 2020-12-31
Publication date: 2021-09-23
Also published as: CN116684514A; BR112022018722A2; CN113497849A; EP4109863A1; US20230008818A1; EP4109863A4; MX2022011638A

Abstract

本申请公开了一种声音的掩蔽方法、装置及终端设备。当终端设备通过受话器作为音频信号的输出端时，基于音频信号确定掩蔽声音信号，再通过扬声器发射掩蔽声音信号。由于该掩蔽声音信号是依据音频信号确定的，并且扬声器与受话器相对于远场的距离差异较小，因此掩蔽声音信号能够较好地掩蔽受话器的漏音，防止通话语音中的信息泄露。此外，由于掩蔽声音信号和声音信号分别由扬声器和受话器输出，当听者以受话器收听声音信号时，扬声器与受话器相对于听者耳朵的距离差异较大，因此掩蔽声音信号对听者收听声音信号的干扰较小，不会影响听者的通话质量。

Description

一种声音的掩蔽方法、装置及终端设备

本申请要求于2020年03月20日提交中华人民共和国国家知识产权局、申请号为202010202057.5、发明名称为“一种声音的掩蔽方法、装置及终端设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及电子设备技术领域，尤其涉及一种声音的掩蔽方法、装置及终端设备。

背景技术

随着移动通讯技术的不断发展，移动通讯设备已经普遍应用于人们的生产和生活中。人们通过移动通讯设备建立通讯连接，开展通话。通常在使用移动通讯设备通话时，听者以受话器收听对方的声音，但是当听者处于静室、对方的音量较大或受话器的播放音量较大时，位于听者附近的其他人(以下简称旁听者)也可能收听到受话器传出的语音。一方面，受话器传出的语音容易对旁听者产生干扰；另一方面，这可能导致部分或全部的语音泄露到旁听者耳中，语音中的隐私信息或机密信息的安全性得不到保证。

针对上述问题，目前可以通过对受话器待播放的语音进行处理的方式以避免通话语音的隐私信息或机密信息泄露。但是该方法需要处理受话器待播放的语音，与此同时会影响听者的通话质量。

目前，在利用移动通讯设备进行通话时，如何保证通话内容的私密性并避免对听者的通话质量造成干扰，已经成为本领域急需解决的技术问题。

发明内容

本申请提供一种声音的掩蔽方法、装置及终端设备，在不影响听者的通话质量的前提下，防止旁听者听懂受话器漏音中的信息。

第一方面，本申请提供一种声音的掩蔽方法。该方法应用于任意具有通讯功能且包含受话器和扬声器的终端设备。该方法包括：

当终端设备通过受话器作为音频信号的输出端时，根据音频信号确定掩蔽声音信号；

通过扬声器发射掩蔽声音信号，掩蔽声音信号用于向远场掩蔽受话器输出的音频信号。例如，可以控制扬声器输出该掩蔽声音信号。

该方法中掩蔽声音信号是依据音频信号确定的，并且对于远场而言，扬声器与远场距离和受话器与远场距离相差较小，因此音频信号能够被掩蔽声音信号有效掩蔽。另外，对于听者耳朵，音频信号的衰减幅度明显小于，掩蔽声音信号反而会被音频信号掩蔽，因此扬声器发射的掩蔽声音信号不会对听者耳朵造成干扰，从而避免对听者通话质量造成影响。

受话器播放的音频信号可以包括多种类型的音频信号，例如人的语音信号、动物的声音信号或音乐等。

掩蔽声音信号可以是根据音频信号确定的。例如，在第一方面的第一种实现方式中，可以根据音频信号从预先生成的音频库中选择或匹配出对应的掩蔽声音信号。在第一方面的第二种实现方式中，还可以根据实时的下行音频信号生成掩蔽声音信号。

通过频谱特性分析可以匹配粉噪信号或者白噪信号作为掩蔽声音信号，还可以通过频谱特性分析生成粉噪信号或白噪信号作为掩蔽声音信号。另外，还可以基于音频信号进行具体分析，对音频信号进行特征提取后匹配针对性的掩蔽声音信号；或者基于音频信号进行针对性的处理操作，例如时域反转、增强处理等，生成掩蔽声音信号。

结合第一方面的第二种实现方式，根据音频信号确定掩蔽声音信号，具体可以包括：

对音频信号进行频谱分析，获得频谱响应；

根据频谱响应生成掩蔽声音信号。

依据音频信号的频谱响应生成掩蔽声音信号，保证掩蔽声音信号与音频信号的频谱响应相互匹配，从而使掩蔽声音信号能够高效掩蔽受话器输出的音频信号。

按照预设帧长截取音频信号，获得截取后的声音片断；

将声音片断进行时域反转，获得反转声音；

将反转声音直接拼接生成掩蔽声音信号，或者通过窗函数之后再拼接生成掩蔽声音信号。

通过反转生成掩蔽声音信号，使掩蔽声音信号难以被旁听者听懂，从而当掩蔽声音信号向远场发射时，受话器漏音能够被不易听懂的掩蔽声音信号掩蔽。

按照预设帧长截取音频信号，获得截取后的声音片断；

将声音片断进行插值，获得补充后的声音信号；或者从预设音频库中匹配后续片断，获得补充后的声音信号；

根据补充后的声音信号生成对应的掩蔽声音信号。

通过插值或匹配获取补充后的声音信号，避免频繁截取声音片段，降低了终端设备的处理负荷，提升对掩蔽声音信号的生成效率。

可选地，结合第一方面的第二种实现方式，该方法还可以包括：

获得根据音频信号生成掩蔽声音信号的时间长度；

根据时间长度对音频信号进行延迟，以使受话器输出的音频信号与扬声器输出的掩蔽声音信号相适应。

例如，延迟后是音频信号和掩蔽声音信号局部对齐或完全对齐。通过对齐掩蔽声音信号和音频信号，保证掩蔽声音信号与音频信号的同步性，提升了掩蔽效果。

结合第一方面的任意一种实现方式，该方法还可以包括：

将掩蔽声音信号进行相位反相处理，获得反相声音信号；

将反相声音信号进行降低幅值处理后和音频信号进行混音，获得混音声音信号；

受话器输出混音声音信号。

通过反相处理，使混音声音信号能够在一定程度上抵消扬声器发射的掩蔽声音信号对近场听者耳朵的影响，在保证通话私密性的基础上进一步提升了通话质量。

结合第一方面的任意一种实现方式，该方法通过扬声器发射掩蔽声音信号，具体包括：

检测周围环境的声音信号，当周围环境的声音信号的幅值低于第一预设阈值时，通过扬声器发射掩蔽声音信号。该方法降低漏音内容的泄露风险。

结合第一方面的任意一种实现方式，该方法通过扬声器发射掩蔽声音信号，具体可以包括：

当检测到有下行音频信号时，判断下行音频信号的幅值大于第二预设阈值时，通过扬声器发射掩蔽声音信号。该方法避免对旁听者造成不必要的噪声干扰。

可选地，预设帧长的时间取值范围为10ms-300ms。

可选地，反相处理的相位范围是90度-270度。

受话器与扬声器的距离大于终端设备的宽度；

受话器与扬声器的距离大于终端设备的长度的一半；

受话器与扬声器的距离大于100mm；

受话器与扬声器的距离至少为受话器与听者耳朵的20倍。

第二方面，本申请提供一种声音的掩蔽装置。该装置应用于任意具有通讯功能且包含受话器和扬声器的终端设备。

该装置包括：判断模块、确定模块和第一控制模块。

其中，判断模块，用于判断终端设备是否以受话器作为音频信号的输出端；

确定模块，用于当判断模块的判断结果为是时，根据音频信号确定掩蔽声音信号；

第一控制模块，用于控制扬声器发射掩蔽声音信号，以向远场掩蔽受话器输出的音频信号。

在第二方面的第一种实现方式中，确定模块用于当以所述受话器输出音频信号时，根据音频信号从预先生成的音频库中选择或匹配对应的掩蔽声音信号。

在第二方面的第二种实现方式中，确定模块用于根据音频信号实时生成掩蔽声音信号。

结合第二方面的第二种实现方式，确定模块具体可以包括：

频谱分析单元，用于对音频信号进行频谱分析，获得频谱响应；

第一生成单元，用于根据频谱响应生成掩蔽声音信号。

结合第二方面的第二种实现方式，确定模块具体可以包括：

信号截取单元，用于按照预设帧长截取音频信号，获得截取后的声音片断；

信号反转单元，用于将声音片断进行时域反转，获得反转声音；

第二生成单元，用于根据反转声音生成对应的掩蔽声音信号。

结合第二方面的第二种实现方式，确定模块具体可以包括：

信号补充单元，用于将声音片断进行插值，获得补充后的声音信号；或者从预设音频库中匹配后续片断，获得补充后的声音信号；

第三生成单元，用于根据补充后的声音信号生成对应的掩蔽声音信号。

结合第二方面的第二种实现方式，该装置还可以包括：

时间长度获取模块，用于获得根据音频信号生成掩蔽声音信号的时间长度；

延迟模块，用于根据时间长度对音频信号进行延迟，以使受话器输出的音频信号与扬声器输出的掩蔽声音信号相适应。

结合第二方面的任意一种实现方式，上述装置还可以包括：

反相处理模块，用于将掩蔽声音信号进行相位反相处理，获得反相声音信号；

混音模块，用于将反相声音信号进行降低幅值处理后和音频信号进行混音，获得混音声音信号；

第二控制模块，用于控制受话器输出混音声音信号。

结合第二方面的任意一种实现方式，第一控制模块，具体可以包括：

第一检测单元，用于检测周围环境的声音信号；

第一判断单元，用于判断周围环境声音的幅值是否低于第一预设阈值；

第一控制单元，用于当第一判断单元判断结果为是时通过扬声器发射掩蔽声音信号。

第二检测单元，用于检测是否有下行音频信号；

第二判断单元，用于当第二检测单元检测到有下行音频信号时，判断下行音频信号的幅值是否大于第二预设阈值；

第二控制单元，用于当第二判断单元判断结果为是时，通过扬声器发射掩蔽声音信号。

结合第二方面的任意一种实现方式，装置还可以包括：

信号增强模块，用于对掩蔽声音信号进行增强处理，获得增强后的掩蔽声音信号，再提供给扬声器。

第三方面，本申请提供一种终端设备。该终端设备可以为手机、平板电脑、个人数字助理(英文全称：Personal Digital Assistant，英文缩写：PDA)、销售终端设备(英文全称：Point of Sales，英文缩写：POS)、车载电脑等任意具有通讯功能且包含受话器和扬声器的终端设备。

本申请第三方面提供的终端设备包括：受话器、扬声器和处理器；

处理器，用于当以受话器输出音频信号时，根据音频信号确定或生成掩蔽声音信号；

扬声器，用于发射掩蔽声音信号，以向远场掩蔽受话器输出的音频信号。

在第三方面的第一种实现方式中，处理器具体用于当以所述受话器输出音频信号时，根据音频信号从预先生成的音频库中选择或匹配对应的掩蔽声音信号。

在第三方面的第二种实现方式中，处理器具体用于根据音频信号实时地生成掩蔽声音信号。

结合第三方面的第二种实现方式，处理器，具体用于对音频信号进行频谱分析，获得频谱响应；根据频谱响应生成掩蔽声音信号。

结合第三方面的第二种实现方式，处理器，具体用于按照预设帧长截取音频信号，获得截取后的声音片断；将声音片断进行时域反转，获得反转声音；根据反转声音生成对应的掩蔽声音信号。

结合第三方面的第二种实现方式，处理器，具体用于按照预设帧长截取音频信号，获得截取后的声音片断；将声音片断进行插值，获得补充后的声音信号；或者从预设音频库中匹配后续片断，获得补充后的声音信号；根据补充后的声音信号生成对应的掩蔽声音信号。

结合第三方面的第二种实现方式，处理器，还用于获得根据音频信号生成掩蔽声音信号的时间长度；根据时间长度对音频信号进行延迟，以使受话器输出的音频信号与扬声器输出的掩蔽声音信号相适应。

结合第三方面的任意一种实现方式，处理器，还用于将掩蔽声音信号进行相位反相处理，获得反相声音信号；将反相声音信号进行降低幅值处理后和音频信号进行混音，获得混音声音信号；控制受话器输出混音声音信号。

结合第三方面的任意一种实现方式，处理器，具体用于检测周围环境的声音信号，当周围环境的声音信号的幅值低于第一预设阈值时，通过扬声器发射掩蔽声音信号。

结合第三方面的第二种实现方式，处理器，具体用于当检测到有下行音频信号时，判断下行音频信号的幅值大于第二预设阈值时，通过扬声器发射掩蔽声音信号。

本申请至少具有以下优点：

本申请提供的声音的掩蔽方法应用在具有受话器和扬声器的终端设备。当终端设备通过受话器作为音频信号的输出端时，基于音频信号确定掩蔽声音信号，再控制扬声器发射掩蔽声音信号。由于该掩蔽声音信号是依据音频信号确定的，并且扬声器与受话器相对于远场的距离差异较小，因此掩蔽声音信号能够较好地掩蔽受话器的漏音，防止通话语音中的信息泄露。此外，由于掩蔽声音信号和声音信号分别由扬声器和受话器输出，当听者以受话器收听声音信号时，扬声器与受话器相对于听者耳朵的距离差异较大，因此掩蔽声音信号对听者收听声音信号的干扰较小，不会影响听者的通话质量。

附图说明

图1为本申请实施例提供的声音的掩蔽方法的应用场景示意图；

图2为图1所示的第一终端设备与近场听者耳朵及远场旁听者耳朵的距离示意图；

图3为本申请实施例提供的一种声音的掩蔽方法流程图；

图4为本申请实施例提供的另一种声音的掩蔽方法流程图；

图5为本申请实施例提供的对声音信号进行频谱分析得到的频谱响应示意图；

图6为掩蔽声音信号和声音信号的频谱特性曲线的示意图；

图7为本申请实施例提供的信号处理示意图；

图8为本申请实施例提供的一种截取后的声音片段示意图；

图9为图8所示的声音片段经过时域反转后的反转声音示意图；

图10为本申请实施例提供的掩蔽声音信号和反相声音信号的示意图；

图11为本申请实施例提供的掩蔽声音信号在增强前后的对比示意图；

图12为本申请实施例提供的一种声音的掩蔽装置的结构示意图；

图13为本申请实施例提供的一种信号生成模块的结构示意图；

图14为本申请实施例提供的另一种信号生成模块的结构示意图；

图15为本申请实施例提供的又一种信号生成模块的结构示意图；

图16为本申请实施例提供的一种终端设备的结构示意图；

图17为本申请实施例提供的一种手机的硬件架构图。

具体实施方式

移动通讯设备作为当前通用的通讯设备，以其便携的特点满足人们在多种场景下的通讯需求。例如，在拥挤的地铁上、在人来人往的商业街、在空旷的更衣室里，人们均可以利用移动通讯设备与其他人进行通话。当以受话器接收音频信号时，如果听者处于静室、对方音量过大或者受话器的播放音量较大，受话器漏音的问题难以避免。通话中可能包含不希望被其他人获知的内容，这些内容可能涉及到隐私信息或者机密信息。受话器漏音的问题容易导致通话内容中的隐私信息或机密信息遭到泄露。

通过调节受话器播放音量来避免漏音的方式可控性不足。当听者调小受话器播放音量时，漏音现象可能已经发生。而处理受话器待播放的音频信号尽管能够在一定程度上降低旁听者对音频信号的可懂度，但是同时导致听者也难以听清对方的通话内容。因此该方法影响了听者的通话质量。

基于以上问题，经过研究，本申请实施例提供一种声音的掩蔽方法、装置及终端设备。本申请实施例中，当以受话器作为音频信号(即被掩蔽音)的输出端时，根据音频信号确定掩蔽声音信号(即掩蔽音)，再控制扬声器发射掩蔽声音信号。由于掩蔽音是根据被掩蔽音确定的，二者存在相关性，并且旁听者相对于受话器的距离与旁听者相对于扬声器的距离接近，因此掩蔽音能够向旁听者掩蔽被掩蔽音。同时，由于掩蔽音到达听者耳朵的距离要远大于被掩蔽音到达听者耳朵的距离，因此掩蔽音不会影响听者正常收听音频信号，扬声器发出的掩蔽声音信号在听者耳朵处反而会被受话器发出的音频信号所掩蔽，从而保证了听者的通话质量不受干扰。通常而言，与声源的距离大于一个临界值r _far(1/r-法则)的位置定义为远场，与声源的距离小于或等于一个临界值r _far(1/r-法则)的位置定义为近场。为便于理解本申请实施例的技术方案，由于听者与终端设备的距离远小于旁听者与终端设备的距离，因此以终端设备作为声源，设定听者处于近场，旁听者处于远场。

为了使本领域技术人员更好地理解本申请实施例提供的技术方案，下面先介绍本申请实施例提供的声音的掩蔽方法的应用场景。

参见图1，该图为本申请实施例提供的声音的掩蔽方法的应用场景示意图。

图1中，第一终端设备101与第二终端设备102建立通讯连接。本申请实施例提供的声音的掩蔽方法应用于第一终端设备101，第二终端设备102则作为该第一终端设备101的对端设备。实际应用中，第一终端设备101可以是任意一种具有通讯功能的移动通讯设备，例如手机、平板电脑或便携式笔记本电脑等。图1中仅以手机形式的第一终端设备101为例进行展示，本申请实施例中对于第一终端设备101的具体类型不进行限定。

第一终端设备101包括受话器1011和扬声器1012。在本申请实施例中，第一终端设备101的受话器1011和扬声器1012可以分别设置于该第一终端设备1011的两侧。如图1所示，受话器1011位于第一终端1011在长度方向的中线1013一侧，扬声器1012位于中线1013另一侧。

受话器1011和扬声器1012均可以向外界输出来自第二终端设备102的音频信号，进行通话时，第一终端设备101的用户(即听者)可以根据自身的需要选择以受话器1011输出音频信号或者以扬声器1012输出音频信号。本申请实施例的技术方案主要基于以受话器1011作为音频信号输出端的场景。当以受话器1011作为音频信号的输出端时，扬声器1012输出掩蔽声音信号。该掩蔽声音信号用于向远场掩蔽音频信号。

参见图2，该图为图1所示的第一终端设备101与近场听者耳朵及远场旁听者的距离示意图。

图2中，当以第一终端设备1011的受话器1011作为音频信号的输出端时，听者(第一终端设备1011的用户，即音频信号的目标接收者)与该第一终端设备101的距离远小于旁听者(位于听者附近的其他人，即音频信号的非目标接收者)与第一终端设备101的距离。因此，在本申请实施例中，听者的耳朵201位于第一终端设备101的近场，旁听者的耳朵202位于第一终端设备101的远场。

当以受话器1011作为音频信号的输出端时，听者耳朵201贴近受话器1011的位置。此时，听者耳朵201的耳参考点(英文全称：Ear Reference Point，英文缩写：ERP)处与受话器1011的第一距离d1大约为5mm，听者耳朵201的ERP处与扬声器1012的第二距离d2大约为150mm。可见，第二距离d2与第一距离d1相差接近30倍。旁听者耳朵202的ERP处与受话器1011的第三距离d3大约为500mm，旁听者耳朵202的ERP处与扬声器1012的第四距离d4大约为500mm。可见，第四距离d4与第三距离d3的差异非常小，二者相差倍数远小于30。

基于脉动球源在空间辐射的声压与辐射径向距离的关系，以及声压级与声压的转换关系，可以得到声压级与距离的关系：声压振幅随着径向距离的增大而反比例地减小。假设受话器1011和扬声器1012分别输出同等音量的音频信号和掩蔽声音信号，由于第二距离d2与第一距离d1相差接近30倍，因此听者耳朵201听到的掩蔽声音信号的衰减幅度大于听到的音频信号的衰减幅度。因此，掩蔽声音信号不会干扰听者耳朵201收听音频信号。而由于第四距离d4与第三距离d3的差异非常小，通常小于2倍，因此旁听者耳朵202听到的掩蔽声音信号的衰减幅度与听到的音频信号的衰减幅度接近，旁听者耳朵202收听到的掩蔽声音信号和声音信号得到的响度基本一致。此外，由于掩蔽声音信号是根据音频信号确定的，因此掩蔽声音信号能够向远场掩蔽音频信号。

需要说明的是，图2所示的第一距离d1、第二距离d2、第三距离d3和第四距离 d4的数值仅为示例。实际应用中，第一距离d1可能与听者的听力相关，或者与听者手持第一终端设备的姿势相关。例如听者听力较差，第一距离d1可能小于5mm；而如果听者听力较好，第一距离d1可能大于5mm，例如d1＝10mm。随着第一终端设备101的长度变化，第二距离d2可能大于或小于150mm。另外，第三距离d3和第四距离d4的数值也可能根据旁听者与第一终端设备的相对位置变化而改变，因此第三距离d3和第四距离d4也可能大于500mm。因此，本申请实施例对d1、d2、d3和d4的数值大小不进行限定。

参见图3，该图为本申请实施例提供的一种声音的掩蔽方法流程图。

如图3所示，声音的掩蔽方法包括：

S301：判断终端设备是否通过受话器作为音频信号的输出端，如果是，则执行S302。

受话器输出的音频信号可以包括人的语音信号、动物的声音信号或音乐等。此处对音频信号的类型和具体内容不进行限定。

在一种可能的实现方式中，判断受话器是否接收到音频信号输出指令，当受话器接收到音频信号输出指令时，表示以受话器作为音频信号的输出端。而当扬声器接收到音频信号输出指令时，表示以扬声器作为音频信号的输出端。实际应用中音频信号输出指令仅发向受话器，或者仅发向扬声器。

由于扬声器工作时提供语音外放的功能，因此当终端设备以扬声器作为音频信号的输出端时，表示终端设备的用户不需要对通话内容进行保密，此时无需执行本实施例方法的后续操作来掩蔽音频信号。

而当终端设备以受话器作为音频信号的输出端时，终端设备的用户与对方终端设备的用户通话过程中可能涉及到隐私或机密。如果受话器漏音，则旁听者有可能获知音频信号中的隐私信息或机密信息。为此，需要对音频信号进行掩蔽。

S302：当终端设备通过受话器作为音频信号的输出端时，根据音频信号确定掩蔽声音信号。

例如，对方终端设备提供的音频信号具有对应的时域特性和频域特性，本申请实施例中掩蔽声音信号具体可以是依据实时的音频信号的时域特性和/或频域特性进行分析后实时生成的。

另外，还可以预先对历史音频信号的时域特性和/或频域特性进行分析后，构建包含多种掩蔽声音信号的音频库。当终端设备再次以受话器作为音频信号的输出端时，根据本次的音频信号的时域特性和/或频域特性，从预设的音频库中选择或匹配出掩蔽声音信号，用以掩蔽本次的音频信号。

依据音频信号确定的掩蔽声音信号在时域和/或频域上，与音频信号的匹配度更高，能够更好地向远掩蔽音频信号，降低处于远场的旁听者对漏音中隐私信息或机密信息的可懂度。

S303：扬声器发射掩蔽声音信号，所述掩蔽声音信号用于向远场掩蔽受话器输出的音频信号。

实际应用中，可以根据多种可能的触发条件控制扬声器发射掩蔽声音信号。

在一种可能的实现方式中，终端设备以受话器作为音频信号输出端的整个通话过程中，控制扬声器持续发射掩蔽声音信号。

当终端设备周围环境比较嘈杂时，终端设备的受话器即便漏音，通话内容也很难被旁听者获知。而当终端设备周围环境比较安静时，受话器漏音便容易致使通话内容中的隐私信息或机密信息泄露。为避免此问题，在另一种可能的实现方式中，检测终端设备周围环境的声音信号，当周围环境的声音信号的幅值低于第一阈值时，表示周围环境过于安静。此时需要控制扬声器发射掩蔽声音信号。

在终端设备的通话过程中，音频信号可能存在空白或幅值较小的时段，此时掩蔽声音信号起不到掩蔽音频信号的作用，反而对旁听者造成噪声干扰。为了避免此问题，在又一种可能的实现方式中，当检测到有下行音频信号时，判断下行音频信号的幅值是否大于第二预设阈值。当下行音频信号的幅值大于第二预设阈值时，表示下行音频信号的音量较大，受话器有可能漏音。此时，控制扬声器发射掩蔽声音信号。

实际应用中，可以依据用户的选择实施本实施例提供的声音的掩蔽方法。例如，终端设备中安装了一个具有掩蔽音频信号的功能的应用程序(英文全称：Applicaiton，英文缩写：APP)，APP运行时，用户可以操控该APP上的功能选项即可选择开启或关闭掩蔽音频信号的功能。当功能开启时，该终端设备即可执行本申请实施例提供的声音的掩蔽方法。另外，终端设备中还可以在通话界面中嵌入功能模块，该功能模块可以根据用户的选择开启或关闭，当功能模块开启时，终端设备即可执行本申请实施例提供的声音的掩蔽方法。

此外，上述APP或功能模块还可以自动开启。例如，检测到下行音频信号时自动开启，接收到通话请求时自动开启，或者终端设备开机后自动开启。

以上即为本申请实施例提供的声音的掩蔽方法。该方法应用在具有受话器和扬声器的终端设备。当终端设备通过受话器作为音频信号的输出端时，根据音频信号确定掩蔽声音信号。再控制扬声器发射掩蔽声音信号。由于该掩蔽声音信号是依据音频信号确定的，并且扬声器与受话器相对于远场的距离差异较小，因此掩蔽声音信号能够较好地掩蔽受话器的漏音，降低旁听者对漏音的可懂度，防止通话语音中的信息泄露。此外，由于掩蔽声音信号和音频信号分别由扬声器和受话器输出，当听者以受话器收听音频信号时，扬声器与受话器相对于听者耳朵的距离差异较大，因此掩蔽声音信号对听者收听音频信号的干扰较小，不会影响听者的通话质量。

实际应用中，如果两种声音信号到达听者耳朵的声压级相差15dB，便能使听者耳朵感受到明显的差异。为了避免掩蔽音干扰听者的通话质量，在一种可能的实现方式中，终端设备的扬声器与听者耳朵的第二距离d2是受话器大于听者耳朵的第一距离。作为示例，d1为d2的10倍以上，音频信号到达听者耳朵的声压级比掩蔽声音信号到达听者耳朵的声压级高出20dB以上，此时听者耳朵收听音频信号不会受到掩蔽声音信号的干扰。

以图1所示的第一终端设备101为例，第一终端设备101的长度为L1，宽度为W1，扬声器1012和受话器1011的距离为L2。L2满足以下不等式(1)-(3)中的至少一个：

L2＞W1 (1)

L2＞0.5*L1 (2)

L2＞100mm (3)

当L2满足不等式(1)-(3)中的至少一个时，可以保证第一距离d1远小于第二距离d2，从而保证掩蔽声音信号相比于音频信号以更小的声压级到达听者耳朵，避免掩蔽声音信号对听者的通话质量造成干扰。

在另一种可能的实现方式中，L2满足以下不等式(4)：

L2≥20*d1 (4)

本申请实施例提供的声音的掩蔽方法中，包括多种生成掩蔽声音信号的实现方式。下面结合实施例和附图展开说明。

参见图4，该图为本申请实施例提供的另一种声音的掩蔽方法流程图。

如图4所示，该声音的掩蔽方法包括：

S401：判断终端设备是否通过受话器作为音频信号的输出端，如果是，则执行S402。

S401的实现方式与前述方法实施例中S301的实现方式基本相同，S401的相关描述可参照前述实施例，此处不做赘述。

S402：当终端设备通过受话器作为音频信号的输出端时，对音频信号进行频谱分析，获得频谱响应。

对一段声音信号进行频谱分析得到频谱响应属于本领域比较成熟的技术，故此处对S402的具体实现方式不做赘述。为便于理解，可参见图5，该图为执行S402得到的频谱响应示意图。图5横轴表示频率(单位：Hz)，纵轴表示信号幅度(单位：dBFS)。

S403：根据频谱响应生成掩蔽声音信号。

在实际应用中，可以将S402得到的频谱响应曲线作为滤波器，进而生成掩蔽声音信号。生成的掩蔽声音信号包括多种可能的形式，例如：掩蔽声音信号可以是随机噪声信号，如频率响应曲线与音频信号一致的白噪信号或粉噪信号。

S404：扬声器发射掩蔽声音信号。

S404的实现方式与前述方法实施例中S303的实现方式基本相同，S404的相关描述可参照前述实施例，此处不做赘述。

本申请实施例提供的声音的掩蔽方法中，由于掩蔽声音信号是依据音频信号的频谱响应生成的，因此掩蔽声音信号在频谱上与音频信号具备一样相似或相同的特性曲线。掩蔽声音信号的幅值与音频信号的幅值可以相同，也可以有所区别。参见图6，该图中掩蔽声音信号601的频谱特性曲线和音频信号602的频谱特性曲线非常相似，因此掩蔽声音信号601向远场遮蔽该音频信号602的效果较好。

需要说明的是，在上文介绍的实施例中，掩蔽声音信号可以是根据本次通话的音频信号实时生成的，例如根据本次通话的音频信号的前n毫秒生成(n为正数，且n毫秒小于下行音频信号的总时长)。

另外，掩蔽声音信号还可以是根据终端设备与对端的历史通话的音频信号预先生成的。例如，对端设备102前一次与本端设备101通话时，向本端设备101发送了音频信号，该音频信号包含对端设备102的用户A2声音的频谱特征。在对端设备102再一次与本端设备101建立通讯连接之前，根据其提供的音频信号的频谱响应生成该用户A2对应的掩蔽声音信号V2。以此类推，对于用户A3，也可建立其对应的掩蔽声音信号V3。如此即可以建立该终端设备101的通讯录中每个联系人与掩蔽声音信号的映射表，并将掩蔽声音信号V2、V3等加入到音频库中。当通讯录中的联系人通过其持有的终端设备与本端设备101建立通讯连接时，若以终端设备101的受话器作为音频信号的输出端时，即可以直接利用映射表从音频库中选择或匹配，获得该联系人对应的掩蔽声音信号，进而向远场对该联系人的音频信号进行掩蔽。

通过上述方法预先生成掩蔽声音信号，提升了掩蔽声音信号的生成效率，并且掩蔽效果更加具有针对性。在该实现方式中，由于S402和S403是预先完成的，因此生成后每次实施本实施例方法时，仅执行S401和S404。

实际应用中，为了进一步防止掩蔽声音信号对听者通话造成干扰，还可以对音频信号进行处理，以此弱化掩蔽声音信号对听者的影响。下面结合附图和实施例进行说明。

参见图7，该图为本申请实施例提供的信号处理示意图。

如图7所示，终端设备中音频信号被分为两路，两路音频信号701和702的内容相同。其中，音频信号701提供给受话器，音频信号702提供给扬声器。作为一种可能的实现方式，音频信号702可以是通过复制音频信号701得到的。

下面首先介绍掩蔽声音信号的生成流程。为了降低旁听者对受话器漏音的可懂度，本申请实施例中按照预设帧长截取音频信号702，获得截取后的声音片段；其后将声音片段进行时域反转，获得反转声音。在一种可能的实现方式中，预设帧长可以是固定帧长，也可以是浮动帧长(即帧长可变)。可以理解的是，如果预设帧长的取值过大，可能需要花费过长的时间来生成掩蔽声音信号，影响听者的通话感受。本申请实施例中，预设帧长的取值范围为10ms-300ms，保证以较快的频率对声音片段进行时域反转，以便于实时向远场掩蔽音频信号。

参见图8和图9，其中，图8所示为截取后的声音片段，图9为图8所示的声音片段经过时域反转后的反转声音。可以理解的是，反转声音与反转前的声音片段相比，可懂度大大降低。利用反转声音即可生成对应的掩蔽声音信号703。例如，将每帧反转声音直接拼接生成掩蔽声音信号，或者利用窗函数对反转声音进行处理后，将处理得到的声音拼接生成掩蔽声音信号。

实际应用中，掩蔽声音信号703的生成时间相对于音频信号701可能存在迟滞。例如，掩蔽声音信号703滞后于音频信号701若干毫秒。为了进一步提升掩蔽效果，本申请实施例中还可以获取根据音频信号702生成掩蔽声音信号703的时间长度，依据该时间长度对音频信号701进行延迟，以使受话器输出的音频信号701与扬声器输出的掩蔽声音信号703相适应，例如局部对齐或完全对齐。例如，生成掩蔽声音信号花费了10ms的时间，则将音频信号701进行10ms的延迟。另外，还可以按照预设延时长度对音频信号701进行延时，该预设延时长度的取值范围为10ms-300ms。需要说明的是，在本实施例中对音频信号701进行延迟为可选的操作，而非必需执行的操作。

掩蔽声音信号703直接提供给扬声器，以便扬声器输出该掩蔽声音信号。另外，为了减少掩蔽声音信号703对近场听者耳朵的干扰，本申请实施例中还可以利用该掩蔽声音信号703对音频信号701进行处理。具体实现时，对掩蔽声音信号进行相位反相处理，获得反相声音信号704。在一种可能的实现方式中，反相处理的相位范围是90度-270度，以此保证该反相声音信号704对掩蔽声音信号703具有较好的补偿能力。

图10为掩蔽声音信号703和反相声音信号704的示意图。本申请实施例中，将反相声音信号704进行降低幅值处理后与音频信号701进行混音，获得混音声音信号705，最后将该混音声音信号705提供给受话器，以便受话器播放混音声音信号705。降低幅值处理可以通过均衡器实现，也可以通过增益控制或滤波处理的方式实现。此处对降低幅值处理的具体实现方式不进行限定。

由于混音声音信号705是根据反相声音信号704和音频信号701混音而成，因此，该混音声音信号705包含了有效的通话内容。同时，混音声音信号705中反相声音信号704的成分在混音声音信号705输出后，也能够在近场补偿掩蔽声音信号703，抵消扬声器播放的掩蔽声音信号对听者通话质量。另外，降低幅值处理后，也削弱了混音声音信号705中的反相声音信号704对听者耳朵的干扰影响。

如图10所示，在一种可能的实现方式中，还可以对掩蔽声音信号703进行增强处理，从而获得增强后的掩蔽声音信号，增强后的掩蔽声音信号可以提供给扬声器，以进行发射。具体实现时，由于漏音的中高音频域与旁听者对漏音的可懂度紧密关联，因此可以利用均衡器对掩蔽声音信号的中高音频域进行增强，以加强对受话器输出的音频信号在中高音频域的掩蔽效果。增强处理可以通过均衡器、增益控制或滤波处理来实现，此处对增强处理的实现方式不进行限定。

参见图11，该图中曲线1101表示增强之前的掩蔽声音信号，曲线1102表示增强后的掩蔽声音信号。通过增强掩蔽声音信号703，提升掩蔽声音信号对漏音的掩蔽效果。可以理解的是，在实际应用中还可以采用其他方式对掩蔽声音信号703进行增强，本实施例中对增强掩蔽声音信号703的具体方式、实施增强的频域以及增强的幅度不加以限定。

在上文和图7中介绍了截取声音片段后，通过反转声音片段来生成掩蔽声音信号的实现方式。下面描述利用截取后的声音片段生成掩蔽声音信号的另一种实现方式。

本申请实施例中，按照预设帧长截取音频信号702，获得截取后的声音片段。其后可以将声音片段进行插值，得到补充后的声音信息；或者从预设音频库中匹配后续片段，从而得到补充后的声音信息。最后，根据补充后的声音信息生成对应的掩蔽声音信号。

作为一示例，可以对截取后的声音片段进行预处理，提取其中的特征参数(例如字节、音调等)，其后利用特征参数和预先训练的经验模型对该声音片段进行插值，抽查之后得到补充后的声音信息。

作为另一示例，预先构建音频库，该音频库中每一段声音片段至少匹配一段其他的声音片段。当获得截取后的声音片段后，依据该声音片段从预设音频库中获得其匹配的任意一段声音片段，该匹配出的声音片段称为后续片段。利用声音片段和后续片段即获得补充后的声音信息。

本申请实施例中通过补充后的声音信息生成掩蔽声音信号，降低了截取声音片段的频率，提升掩蔽声音信号的生成效率。该掩蔽声音信号生成后，作为一种可选的实现方式，为了提升掩蔽效果，也可以将音频信号701延迟，以使掩蔽声音信号与音频信号701对齐播放。

经测试，通过执行以上实施例中提供的声音掩蔽方法，显著降低了500mm处旁听者对漏音的可懂度，使其对漏音的可懂度从实施本实施例方法之前的90％降低至10％以下。远场对漏音的单字可懂度小于30％，对句子的可懂度小于10％。此外，对于周边环境的噪声影响在6dB以下，相比于实施该方法之前，对周围环境的响度影响无明显变化。实施该方法对近场听者的音频可懂度几乎没有影响，因此本实施例提供的声音掩蔽方法能够在不改变听者通话质量的基础上，向远场有效地掩蔽受话器漏音。

基于前述实施例提供的声音的掩蔽方法，相应地，本申请还提供一种声音的掩蔽装置。以下结合附图和实施例进行说明。

参见图12，该图为本申请实施例提供的声音的掩蔽装置的结构示意图。该图所示的声音的掩蔽装置120可以应用在图1和图2所示的第一终端设备101中。

如图12所示，该装置120包括：

判断模块1201用于判断终端设备是否以受话器作为音频信号的输出端；

确定模块1203用于当判断模块的判断结果为是时，根据音频信号确定掩蔽声音信号；

第一控制模块1202用于控制扬声器发射掩蔽声音信号，以向远场掩蔽受话器输出的音频信号。

由于该掩蔽声音信号是依据音频信号确定的，并且扬声器与受话器相对于远场的距离差异较小，因此掩蔽声音信号能够较好地掩蔽受话器的漏音，降低旁听者对漏音的可懂度，防止通话语音中的信息泄露。此外，由于掩蔽声音信号和音频信号分别由扬声器和受话器输出，当听者以受话器收听音频信号时，扬声器与受话器相对于听者耳朵的距离差异较大，因此掩蔽声音信号对听者收听音频信号的干扰较小，不会影响听者的通话质量。

在一种可能的实现方式中，确定模块1203用于根据所述音频信号从预先生成的音频库中选择或匹配对应的掩蔽声音信号。

在一种可能的实现方式中，扬声器与听者耳朵的距离大于受话器与听者耳朵的距离。

在一种可能的实现方式中，确定模块1203，用于根据音频信号生成掩蔽声音信号。

如图13所示的信号生成模块的结构示意图，在一种可能的实现方式中，确定模块 1203具体包括：

频谱分析单元12031用于对音频信号进行频谱分析，获得频谱响应；

第一生成单元12032用于根据频谱响应生成掩蔽声音信号。

可以理解的是，由于掩蔽声音信号是依据音频信号的频谱响应生成的，因此掩蔽音与被掩蔽音在频谱特性上存在一致性或相似性。进而，掩蔽声音信号能够较好地掩蔽受话器播放的声音信号。

如图14所示的信号生成模块的结构示意图，在另一种可能的实现方式中，确定模块1203具体包括：

信号截取单元12033用于按照预设帧长截取音频信号，获得截取后的声音片断；

信号反转单元12034用于将声音片断进行时域反转，获得反转声音；

第二生成单元12035用于根据反转声音生成对应的掩蔽声音信号。

通过反转声音片段，并依据反转声音生成对应的掩蔽声音信号，能够以该生成的掩蔽声音信号降低远场旁听者对漏音的可懂度。进而保证了通话内容中隐私信息或机密信息的安全性。

如图15所示的信号生成模块的结构示意图，在又一种可能的实现方式中，确定模块1203具体包括：

信号补充单元12036用于将声音片断进行插值，获得补充后的声音信号；或者从预设音频库中匹配后续片断，获得补充后的声音信号；

第三生成单元12037用于根据补充后的声音信号生成对应的掩蔽声音信号。

通过补充声音信号，降低对声音信号的截取频率，提升生成掩蔽声音信号的效率。从而，避免听者对声音信号的收听等待时间，提升听者的通话体验。

在一种可能的实现方式中，还包括：

延迟模块，用于根据时间长度对音频信号进行延迟，以使受话器输出的声音信号与扬声器输出的掩蔽声音信号相适应。

通过延迟受话器输出的声音信号，保证掩蔽声音信号同步掩蔽受话器输出的音频信号，提升掩蔽效果。

在一种可能的实现方式中，还包括：

混音模块，用于将反相声音信号进行EQ或幅值处理后和音频信号进行混音，获得混音声音信号；

第二控制模块，用于控制受话器输出混音声音信号。

通过反相处理模块的处理获得的反相声音信号能够补偿掩蔽声音信号，在一定程度上抵消掩蔽声音信号对近场听者耳朵的干扰，保证听者的通话质量。

在一种可能的实现方式中，第一控制模块1203，具体包括：

第一检测单元，用于检测周围环境的声音信号；

第一判断单元，用于判断周围环境的声音信号的幅值是否低于第一预设阈值；

第一控制单元，用于当第一判断单元的判断结果为是时，通过扬声器发射掩蔽声音信号。

将周围环境的声音信号的幅值低于第一预设阈值作为通过扬声器发射掩蔽声音信号的触发条件，防止因为周围环境过于安静以至于环境中的旁听者收听到受话器的漏音。因此，避免了漏音中的隐私信息或机密信息被泄露。

在一种可能的实现方式中，第一控制模块1203，具体包括：

第二检测单元，用于检测是否有下行音频信号；

第二控制单元，用于当第一判断单元判断结果为是时，通过扬声器发射掩蔽声音信号。

将下行音频信号的幅值大于预设阈值作为通过扬声器发射掩蔽声音信号的触发条件，避免对周围环境中的旁听者造成不必要的噪声干扰。

在一种可能的实现方式中，还包括：

信号增强模块，用于对掩蔽声音信号进行增强处理，获得增强后的掩蔽声音信号。通过增强掩蔽声音信号，使增强后的掩蔽声音信号对受话器播放的声音信号起到更有效的掩蔽作用，降低旁听者对漏音的可懂度。

基于前述实施例提供的声音的掩蔽方法和声音的掩蔽装置，相应地，本申请还提供一种终端设备。该终端设备可以是图1和图2中所示的第一终端设备101，关于该终端设备的应用场景可以参见图1和图2，此处不加以赘述。下面结合实施例和附图描述本申请实施例提供的终端设备的结构实现。

参见图16，该图为本申请实施例提供的一种终端设备的结构示意图。

如图16所示，该终端设备160包括：受话器1601、扬声器1602和处理器1603。

其中，处理器1603用于当以受话器1601输出音频信号时，根据音频信号确定掩蔽声音信号；

扬声器1602用于发射掩蔽声音信号，以向远场掩蔽受话器1011输出的音频信号。扬声器1602可以在处理器1603的控制下输出该掩蔽声音信号。

由于该掩蔽声音信号是依据音频信号确定的，并且扬声器1602与受话器1601相对于远场的距离差异较小，因此掩蔽声音信号能够较好地掩蔽受话器1601的漏音，降低旁听者对漏音的可懂度，防止通话语音中的信息泄露。此外，由于掩蔽声音信号和声音信号分别由扬声器1602和受话器1601输出，当听者以受话器1601收听声音信号时，扬声器1602与受话器1601相对于听者耳朵的距离差异较大，扬声器1602发射的掩蔽声音信号在听者耳朵处反而会被受话器1601发出的音频信号所掩蔽，因此掩蔽声音信号对听者收听声音信号的干扰较小，不会影响听者的通话质量。

在一种实现方式中，处理器1603，具体用于当以所述受话器输出音频信号时，根据音频信号从预先生成的音频库中选择或匹配对应的掩蔽声音信号。

在一种实现方式中，扬声器1602与听者耳朵的距离大于受话器1601与听者耳朵的距离。

在一种实现方式中，处理器1603具体用于对音频信号进行频谱分析，获得频谱响应；根据频谱响应生成掩蔽声音信号。

在一种实现方式中，处理器1603具体用于按照预设帧长截取音频信号，获得截取后的声音片断；将声音片断进行时域反转，获得反转声音；根据反转声音生成对应的掩蔽声音信号。

在一种实现方式中，处理器1603具体用于按照预设帧长截取音频信号，获得截取后的声音片断；将声音片断进行插值，获得补充后的声音信号；或者从预设音频库中匹配后续片断，获得补充后的声音信号；根据补充后的声音信号生成对应的掩蔽声音信号。

在一种实现方式中，处理器1603还用于获得根据音频信号生成掩蔽声音信号的时间长度；根据时间长度对音频信号进行延迟，以使受话器1601输出的音频信号与扬声器1602输出的掩蔽声音信号相适应。

在一种实现方式中，处理器1603还用于将掩蔽声音信号进行相位反相处理，获得反相声音信号；将反相声音信号和音频信号进行混音，获得混音声音信号；控制受话器1601输出混音声音信号。

在一种实现方式中，处理器1603具体用于检测周围环境的声音信号，当周围环境的声音信号的幅值低于第一预设阈值时，控制扬声器1602输出掩蔽声音信号。

在一种实现方式中，处理器1603具体用于当检测到有下行音频信号时，判断下行音频信号的幅值大于第二预设阈值时，控制扬声器1602输出掩蔽声音信号。

在一种实现方式中，处理器1603还用于对掩蔽声音信号进行增强处理，获得增强后的掩蔽声音信号。

本申请实施例提供的终端设备160中，处理器1603可以用于执行前述方法实施例中的部分或全部步骤。关于处理器1603的功能描述以及执行方法步骤的相关技术效果可以参照前述方法实施例和装置实施例，此处不再赘述。

在图16所示的终端设备160仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端设备160可以为包括手机、平板电脑、个人数字助理(英文全称：Personal Digital Assistant，英文缩写：PDA)、销售终端设备(英文全称：Point of Sales，英文缩写：POS)、车载电脑等任意终端设备。下面以手机为例对本申请实施例提供的终端设备进行描述和说明。

图17示出的是与本申请实施例提供的终端设备相关的手机的部分结构框图。参考图17，手机170包括：射频(英文全称：Radio Frequency，英文缩写：RF)电路1710、存储器1720、输入单元1730、显示单元1740、传感器1750、音频电路1760、无线保真(英文全称：wireless fidelity，英文缩写：WiFi)模块1770、处理器1780(该处理器1780可以实现图16中所示的处理器1603的功能)、以及电源Bat等部件。本领域技术人员可以理解，图17中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图17对手机的各个构成部件进行具体的介绍：

RF电路1710可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器1780处理；另外，将设计上行的数据发送给基站。通常，RF电路1710包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(英文全称：Low Noise Amplifier，英文缩写：LNA)、双工器等。此外，RF电路1710还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(英文全称：Global System of Mobile communication，英文缩写：GSM)、通用分组无线服务(英文全称：General Packet Radio Service，GPRS)、码分多址(英文全称：Code Division Multiple Access，英文缩写：CDMA)、宽带码分多址(英文全称：Wideband Code Division Multiple Access,英文缩写：WCDMA)、长期演进(英文全称：Long Term Evolution，英文缩写：LTE)、电子邮件、短消息服务(英文全称：Short Messaging Service，SMS)等。

存储器1720可用于存储软件程序以及模块，处理器1780通过运行存储在存储器1720的软件程序以及模块，从而执行手机170的各种功能应用以及数据处理。存储器1720可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机170的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1720可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1730可用于接收输入的数字或字符信息，以及产生与手机170的用户设置以及功能控制有关的键信号输入。具体地，输入单元1730可包括触控面板1731以及其他输入设备1732。触控面板1731，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1731上或在触控面板1731附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板1731可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1780，并能接收处理器1780发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1731。除了触控面板1731，输入单元1730还可以包括其他输入设备1732。具体地，其他输入设备1732可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1740可用于显示由用户输入的信息或提供给用户的信息以及手机170的各种菜单。显示单元1740可包括显示面板1741，可选的，可以采用液晶显示器(英文全称：Liquid Crystal Display，英文缩写：LCD)、有机发光二极管(英文全称：Organic Light-Emitting Diode，英文缩写：OLED)等形式来配置显示面板1741。进一步的，触控面板1731可覆盖显示面板1741，当触控面板1731检测到在其上或附近的触摸操作后，传送给处理器1780以确定触摸事件的类型，随后处理器1780根据触摸事件的类型在显示面板1741上提供相应的视觉输出。虽然在图17中，触控面板1731与显示面板1741是作为两个独立的部件来实现手机170的输入和输入功能，但是在某些实施例中，可以将触控面板1731与显示面板1741集成而实现手机170的输入和输出功能。

手机170还可包括至少一种传感器1750，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1741的亮度，接近传感器可在手机170移动到耳边时，关闭显示面板1741和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机170姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机170还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路1760、扬声器1761、传声器1762及受话器1763可提供用户与手机170之间的音频接口。音频电路1760可将接收到的音频数据转换后的电信号，传输到扬声器1761或受话器1763，由扬声器1761或受话器1763转换为声音信号输出；另一方面，传声器1762将收集的声音信号转换为电信号，由音频电路1760接收后转换为音频数据，再将音频数据输出处理器1780处理后，经RF电路1710以发送给比如另一手机170，或者将音频数据输出至存储器1720以便进一步处理。

WiFi属于短距离无线传输技术，手机170通过WiFi模块1770可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图17示出了WiFi模块1770，但是可以理解的是，其并不属于手机170的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器1780是手机170的控制中心，利用各种接口和线路连接整个手机170的各个部分，通过运行或执行存储在存储器1720内的软件程序和/或模块，以及调用存储在存储器1720内的数据，执行手机170的各种功能和处理数据，从而对手机170进行整体监控。可选的，处理器1780可包括一个或多个处理单元；优选的，处理器1780可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1780中。

手机170还包括给各个部件供电的电源Bat(比如电池)，优选的，电源可以通过电源管理系统与处理器1780逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机170还可以包括摄像头、蓝牙模块等，在此不再赘述。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

以上所述，仅是本申请的较佳实施例而已，并非对本申请作任何形式上的限制。虽然本申请已以较佳实施例揭露如上，然而并非用以限定本申请。任何熟悉本领域的技术人员，在不脱离本申请技术方案范围情况下，都可利用上述揭示的方法和技术内容对本申请技术方案做出许多可能的变动和修饰，或修改为等同变化的等效实施例。因此，凡是未脱离本申请技术方案的内容，依据本申请的技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均仍属于本申请技术方案保护的范围内。

Claims

一种声音的掩蔽方法，其特征在于，应用于终端设备，所述终端设备包括受话器和扬声器；

该方法包括：

当所述终端设备通过所述受话器作为音频信号的输出端时，根据所述音频信号确定掩蔽声音信号；

所述扬声器发射所述掩蔽声音信号，所述掩蔽声音信号用于向远场掩蔽所述受话器输出的音频信号。
根据权利要求1所述的掩蔽方法，其特征在于，根据所述音频信号确定所述掩蔽声音信号，具体包括：

根据所述音频信号从预先生成的音频库中选择或匹配对应的掩蔽声音信号。
根据权利要求1所述的方法，其特征在于，根据所述音频信号确定掩蔽声音信号，具体包括：

对所述音频信号进行频谱分析，获得频谱响应；

根据所述频谱响应生成所述掩蔽声音信号。
根据权利要求1所述的方法，其特征在于，根据所述音频信号确定掩蔽声音信号，具体包括：

按照预设帧长截取所述音频信号，获得截取后的声音片断；

将所述声音片断进行时域反转，获得反转声音；

将所述反转声音直接拼接生成所述掩蔽声音信号，或者通过窗函数之后再拼接生成所述掩蔽声音信号。
根据权利要求1所述的方法，其特征在于，根据所述音频信号确定掩蔽声音信号，具体包括：

按照预设帧长截取所述音频信号，获得截取后的声音片断；

将所述声音片断进行插值，获得补充后的声音信号；或者从预设音频库中匹配后续片断，获得补充后的声音信号；

根据所述补充后的声音信号生成对应的掩蔽声音信号。
根据权利要求4或5所述的方法，其特征在于，还包括：

获得根据所述音频信号生成所述掩蔽声音信号的时间长度；

根据所述时间长度对所述音频信号进行延迟，以使所述受话器输出的音频信号与所述扬声器输出的掩蔽声音信号相适应。
根据权利要求1-5任一项所述的方法，其特征在于，还包括：

将所述掩蔽声音信号进行相位反相处理，获得反相声音信号；

将所述反相声音信号进行降低幅值处理后和所述音频信号进行混音，获得混音声音信号；

所述受话器输出所述混音声音信号。
根据权利要求1-5任一项所述的方法，其特征在于，所述通过所述扬声器发射所述掩蔽声音信号，具体包括：

当检测到有下行音频信号时，判断所述下行音频信号的幅值大于第二预设阈值时，通过所述扬声器发送掩蔽声音信号。
一种终端设备，其特征在于，包括：受话器、扬声器和处理器；

所述处理器，用于当以所述受话器输出音频信号时，根据所述音频信号确定或生成掩蔽声音信号；

所述扬声器，用于发射所述掩蔽声音信号，以向远场掩蔽所述受话器输出的所述音频信号。
根据权利要求9所述的终端设备，其特征在于，

所述处理器，具体用于当以所述受话器输出音频信号时，根据所述音频信号从预先生成的音频库中选择或匹配对应的掩蔽声音信号。
根据权利要求9所述的终端设备，其特征在于，

所述处理器，具体用于对所述音频信号进行频谱分析，获得频谱响应；根据所述频谱响应生成所述掩蔽声音信号。
根据权利要求9所述的终端设备，其特征在于，

所述处理器，具体用于按照预设帧长截取所述音频信号，获得截取后的声音片断；将所述声音片断进行时域反转，获得反转声音；根据所述反转声音生成对应的掩蔽声音信号。
根据权利要求9所述的终端设备，其特征在于，

所述处理器，具体用于按照预设帧长截取所述音频信号，获得截取后的声音片断；将所述声音片断进行插值，获得补充后的声音信号；或者从预设音频库中匹配后续片断，获得补充后的声音信号；根据所述补充后的声音信号生成对应的掩蔽声音信号。
根据权利要求12或13所述的终端设备，其特征在于，

所述处理器，还用于获得根据所述音频信号生成所述掩蔽声音信号的时间长度；根据所述时间长度对所述音频信号进行延迟，以使所述受话器输出的音频信号与所述扬声器输出的掩蔽声音信号相适应。
根据权利要求9-13任一项所述的终端设备，其特征在于，

所述处理器，还用于将所述掩蔽声音信号进行相位反相处理，获得反相声音信号；将所述反相声音信号进行降低幅值处理后和所述音频信号进行混音，获得混音声音信号；控制所述受话器输出所述混音声音信号。
根据权利要求9-13任一项所述的终端设备，其特征在于，

所述处理器，具体用于当检测到有下行音频信号时，判断所述下行音频信号的幅值大于第二预设阈值时，通过所述扬声器发射所述掩蔽声音信号。