WO2024032035A1

WO2024032035A1 - 一种语音信号的输出方法和电子设备

Info

Publication number: WO2024032035A1
Application number: PCT/CN2023/091095
Authority: WO
Inventors: 杨枭; 褚建飞
Original assignee: 荣耀终端有限公司
Priority date: 2022-08-11
Filing date: 2023-04-27
Publication date: 2024-02-15
Also published as: WO2024032035A9; CN116320123B; CN116320123A

Abstract

本申请实施例提供了一种语音信号的输出方法和电子设备。该方法可以生成第一语音信号，第一语音信号是指根据下行语音信号生成的干扰信号；以及，生成第二语音信号，第二语音信号是指对下行语音信号进行时延处理后，得到的与第一语音信号具有相同时延的语音信号；然后，可以在相同的输出时间，分别通过可以靠近人耳的第一发声组件输出第二语音信号，以及通过远离人耳的第二发声组件输出第一语音信号。这样，可以通过根据下行语音信号生成的干扰信号，对下行语音信号进行掩蔽，使得用户之外的其他人无法听清楚用户的通话内容，从而很好地保护了用户的隐私。

Description

一种语音信号的输出方法和电子设备

本申请要求于2022年8月11日提交到国家知识产权局、申请号为202210960657.7、发明名称为“一种语音信号的输出方法和电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及终端技术领域，尤其涉及一种语音信号的输出方法和电子设备。

背景技术

目前，为了减少手持通话中声音的泄露，电子设备可以通过陶瓷驱动屏幕的发声组件发声。这样，用户手持通话的过程中，陶瓷驱动屏幕的发声组件中，屏幕发声区域可以正对用户的耳朵，电子设备发出的声音，可以大部分进入用户的耳中，只有极少一部分声音会泄露到周围环境中，所以，周围环境中的其他人，无法听清楚用户的通话内容，从而可以很好地保护用户的隐私。

但是，如果用户增大通话音量，进一步提高声音在人耳内的响度，就会增大陶瓷驱动屏幕的发声组件中陶瓷器件的驱动，这样的话，泄露到用户周围的声音强度也会增大，其他人便可以听清楚用户的通话内容，从而造成用户隐私的泄露，用户体验较差。

发明内容

本申请实施例提供了一种语音信号的输出方法和电子设备，以解决目前电子设备在手持通话的场景中，增大音量会造成用户通话内容的泄露，用户体验较差的问题。

第一方面，本申请实施例提供了一种语音信号的输出方法，该方法用于电子设备，所述电子设备包括第一发声组件和第二发声组件，所述第一发声组件设置于所述电子设备的第一位置，用户手持所述电子设备通话时，所述第一位置靠近所述用户的耳朵，所述第二发声组件设置于与所述第一位置不同的第二位置，所述方法包括：生成第一语音信号，所述第一语音信号是指根据下行语音信号生成的干扰信号；生成第二语音信号，所述第二语音信号是指对所述下行语音信号进行时延处理后，得到的与所述第一语音信号具有相同时延的语音信号；在相同的输出时间，分别通过所述第一发声组件输出所述第二语音信号，以及通过所述第二发声组件输出所述第一语音信号。

这样，可以通过根据下行语音信号生成的干扰信号，对下行语音信号进行掩蔽。在用户手持电子设备进行通话时，进入用户耳朵的声音强度足够大，可以保证用户可以清楚地听到通话内容。而对于周围环境中的其他人，由于干扰信号对下行语音信号的掩蔽作用，传到这些人耳朵的声音的强度较小，信息不完整，使得这些人无法听清楚用户的通话内容，从而很好地保护了用户的隐私，用户的体验更好。

在一种实现方式中，所述生成第一语音信号，包括：生成第一功率谱密度，所述第一功率谱密度是指根据所述下行语音信号计算得到的功率谱密度；根据所述第一功率谱密度生成所述第一语音信号。

在一种实现方式中，所述根据所述第一功率谱密度生成所述第一语音信号，包括：根据所述第一功率谱密度生成掩蔽信号和粉噪信号；调整所述掩蔽信号和所述粉噪信号至相同时延；根据调整至相同时延的所述掩蔽信号和所述粉噪信号，生成所述第一语音信号。

这样，生成的第一语音信号，可以掩蔽掉下行语音信号中功率谱密度值较大的频点的信号，后续同时输出第一语音信号和第二语音信号之后，使得进入用户周围环境中其它人耳中的声音的强度减弱，从而无法听清楚用户的通话内容，可以很好地保护用户的隐私，用户的体验更好。

在一种实现方式中，所述根据所述第一功率谱密度生成掩蔽信号，包括：根据所述第一功率谱密度，确定第一平均功率，所述第一平均功率是指所述第一功率谱密度对应的所有频点的功率谱密度值的平均值；确定第一频点，所述第一频点是指所述第一功率谱密度对应的所有频点中，对应功率谱密度值大于所述第一平均功率的频点；根据所述第一频点生成所述掩蔽信号。

这样，可以生成能够掩蔽掉下行语音信号中功率谱密度值较大的信号的掩蔽音，后续可以掩蔽掉下行语音信号中功率谱密度值较大的信号，使得进入用户周围环境中其它人耳中的声音的强度减弱，从而无法听清楚用户的通话内容，进而可以很好地保护用户的隐私。

在一种实现方式中，所述根据所述第一频点生成所述掩蔽信号，包括：如果所述第一频点的数量为多个，且所有所述第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差小于第一预设频率阈值，则按照对应功率谱密度值由大至小的顺序，在所有所述第一频点中选出第一预设数量的第一频点，确定为第二频点；确定第三频点，所述第三频点位于相邻两个所述第二频点之间；根据预设人耳掩蔽效应曲线，确定所述第三频点对应的幅值，所述幅值用于表征信号的强弱；根据所述第三频点的频率值和所述第三频点对应的幅值，生成所述掩蔽信号。

这样，当功率谱密度值大于第一平均功率的频点较为集中时，可以确定出较为准确的掩蔽信号，后续掩蔽效果较好。

在一种实现方式中，所述根据所述第一频点生成所述掩蔽信号，包括：如果所述第一频点的数量为多个，且所有所述第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差大于等于第一预设频率阈值，则在所有所述第一频点中选出对应功率谱密度值最大的第一频点、频率值最大的第一频点和频率值最小的第一频点，确定为第四频点；在各所述第四频点附近，与各所述第四频点之间，频率值相差小于等于第二预设频率阈值处，分别选取一个频点，确定为第五频点；根据预设人耳掩蔽效应曲线，确定所述第五频点对应的幅值，所述幅值用于表征信号的强弱；根据所述第五频点的频率值和所述第五频点对应的幅值，生成所述掩蔽信号。

这样，当功率谱密度值大于第一平均功率的频点分布较为离散，且频率值最大的频点与频率值最小的频点之间频率值相差较大时，可以确定出较为准确的掩蔽信号，后续掩蔽效果较好。

在一种实现方式中，所述根据所述第一频点生成所述掩蔽信号，包括：如果所述第一频点的数量为多个，且所有所述第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差大于等于第一预设频率阈值，则在各频点区间中，按照对应功率谱密度值由大至小的顺序，选出第二预设数量的第一频点，确定为第六频点，其中，各所述频点区间的终止频点与起始频点之间，频率值相差小于等于第三预设频率阈值，且各所述频点区间包括的第一频点的数量大于等于第三预设数量；确定各所述频点区间对应的第七频点，所述第七频点位于相应频点区间中相邻两个所述第六频点之间；根据预设人耳掩蔽效应曲线，确定所述第七频点对应的幅值，所述幅值用于表征信号的强弱；根据所述第七频点的频率值和所述第七频点对应的幅值，生成所述掩蔽信号。

这样，当功率谱密度值大于第一平均功率的频点有两个或两个以上密集区间，且频率值最大的频点与频率值最小的频点之间频率值相差较大时，可以确定出较为准确的掩蔽信号，后续掩蔽效果较好。

在一种实现方式中，所述根据所述第一频点生成所述掩蔽信号，包括：如果所述第一频点的数量为一个，则在所述第一频点两侧分别选取一个频点，确定为第八频点；根据预设人耳掩蔽效应曲线，确定所述第八频点对应的幅值，所述幅值用于表征信号的强弱；根据所述第八频点的频率值和所述第八频点对应的幅值，生成所述掩蔽信号。

这样，当功率谱密度值大于第一平均功率的频点仅有一个时，可以确定出较为准确的掩蔽信号，后续掩蔽效果较好。

在一种实现方式中，所述根据所述第一频点生成所述掩蔽信号，包括：如果所述第一频点的数量为一个，则在所述第一频点两侧分别选取一个频点，确定为第九频点；在各所述第九频点与所述第一频点之间，分别选取一个频点，确定为第十频点；根据预设人耳掩蔽效应曲线，确定所述第十频点对应的幅值，所述幅值用于表征信号的强弱；根据所述第十频点的频率值和所述第十频点对应的幅值，生成所述掩蔽信号。

在一种实现方式中，所述根据所述第一功率谱密度生成粉噪信号，包括：确定第二平均功率，所述第二平均功率是指所有第十一频点的功率谱密度值的平均值，所述第十一频点是指所述第一功率谱密度对应的所有频点中，功率谱密度值小于等于第一平均功率的频点，所述第一平均功率是指所述第一功率谱密度对应的所有频点的功率谱密度值的平均值；获取所述第二平均功率对应的预设粉噪带通滤波增益；调整第一带通滤波器的增益为所述预设粉噪带通滤波增益；通过增益调整后的所述第一带通滤波器对粉噪信号源输出的信号进行带通滤波，生成所述粉噪信号。

这样，可以确定出可以与掩蔽信号相互配合的粉噪信号，使得后续生成的干扰信号能够更好地对下行语音信号进行掩蔽，从而较好地保护用户的通话隐私。

在一种实现方式中，所述根据所述第一功率谱密度生成所述第一语音信号，包括：根据所述第一功率谱密度，确定第一平均功率，所述第一平均功率是指所述第一功率谱密度对应的所有频点的功率谱密度值的平均值；确定第十二频点，所述第十二频点是指所述第一功率谱密度对应的所有频点中，对应功率谱密度值大于所述第一平均功率的频点；按照对应功率谱密度值由大至小的顺序，在所有所述第十二频点中选出第四预设数量的第十二频点，确定为第十三频点；根据所述第十三频点，生成陷波滤波器，所述陷波滤波器的陷波频率包括所述第十三频点的频率值；通过所述陷波滤波器对粉噪信号源输出的信号进行陷波滤波，生成所述第一语音信号。

这样，生成的第一语音信号，可以掩蔽掉下行语音信号中除功率谱密度值较大的频点的信号之外的其余大部分信号，后续同时输出第一语音信号和第二语音信号之后，使得进入用户周围环境中其他人耳中的声音缺失大部分频点的信号的信息，从而无法听清楚用户的通话内容，同样可以很好地保护用户的隐私，用户的体验更好。

在一种实现方式中，所述生成第一功率谱密度，包括：通过第二带通滤波器对所述下行语音信号进行带通滤波，得到第一带宽范围内的第一信号；所述第一带宽为所述第二带通滤波器的带宽；计算所述第一信号的功率谱密度；确定所述第一信号的功率谱密度为所述第一功率谱密度。

这样，可以先将下行语音信号中，人耳听不见的信号，通过第二带通滤波器滤掉，从而可以提高下行语音信号的输出效率，使得通话过程更加流畅，用户体验更好。

在一种实现方式中，所述电子设备还包括第三发声组件，所述第三发声组件设置于靠近所述第一位置的第三位置，所述方法还包括：生成第三语音信号，所述第三语音信号是指对所述下行语音信号进行时延处理后，得到的与所述第一语音信号具有相同时延的语音信号；在所述相同的输出时间，通过所述第三发声组件输出所述第三语音信号。

这样，可以通过第三发声组件发出的声音对第一发声组件发出的声音进行补充，使得用户听到的声音更加清楚，提高用户的体验。

第二方面，本申请实施例提供了一种电子设备，该电子设备包括第一发声组件和第二发声组件，所述第一发声组件设置于所述电子设备的第一位置，用户手持所述电子设备通话时，所述第一位置靠近所述用户的耳朵，所述第二发声组件设置于与所述第一位置不同的第二位置，该电子设备还包括存储器和处理器，所述存储器和所述处理器耦合；所述存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令，当所述处理器执行所述计算机指令时，使所述电子设备执行第一方面中任一项所述的方法。

这样，电子设备可以通过根据下行语音信号生成的干扰信号，对下行语音信号进行掩蔽。在用户手持电子设备进行通话时，进入用户耳朵的声音强度足够大，可以保证用户可以清楚地听到通话内容。而对于周围环境中的其他人，由于干扰信号对下行语音信号的掩蔽作用，传到这些人耳朵的声音的强度较小，信息不完整，使得这些人无法听清楚用户的通话内容，从而很好地保护了用户的隐私，用户的体验更好。

第三方面，本申请提供了一种计算机存储介质，所述计算机存储介质中存储有计算机程序或指令，当所述计算机程序或指令被执行时，如第一方面中任一项所述的方法被执行。

综上，通过本申请实施例提供的语音信号的输出方法和电子设备，可以通过根据下行语音信号生成的干扰信号，对下行语音信号进行掩蔽。在用户手持电子设备进行通话时，进入用户耳朵的声音强度足够大，可以保证用户可以清楚地听到通话内容。而对于周围环境中的其他人，由于干扰信号对下行语音信号的掩蔽作用，传到这些人耳朵的声音的强度较小，信息不完整，使得这些人无法听清楚用户的通话内容，从而很好地保护了用户的隐私，用户的体验更好。

附图说明

图1是本申请实施例提供的电子设备的结构示意图；

图2是本申请实施例提供的电子设备的软件结构框图；

图3是本申请实施例提供的语音信号的输出方法的流程示意图；

图4是本申请实施例提供的一种应用场景示意图；

图5是本申请实施例提供的一种生成第一语音信号的方法的流程示意图；

图6是本申请实施例提供的一种根据第一功率谱密度生成第一语音信号的方法的流程示意图；

图7是本申请实施例提供的一种根据第一功率谱密度生成掩蔽信号的方法的流程示意图；

图8是本申请实施例提供的另一种应用场景示意图；

图9是本申请实施例提供的另一种应用场景示意图；

图10是本申请实施例提供的另一种应用场景示意图；

图11是本申请实施例提供的另一种应用场景示意图；

图12是本申请实施例提供的另一种应用场景示意图；

图13是本申请实施例提供的另一种应用场景示意图；

图14是本申请实施例提供的另一种应用场景示意图；

图15是本申请实施例提供的另一种应用场景示意图；

图16是本申请实施例提供的另一种应用场景示意图；

图17是本申请实施例提供的一种根据第一功率谱密度生成粉噪信号的方法的流程示意图；

图18是本申请实施例提供的另一种根据第一功率谱密度生成第一语音信号的方法的流程示意图；

图19是本申请实施例提供的一种电子设备的结构框图。

具体实施方式

下面结合附图，对本申请的技术方案进行描述。

在本申请的描述中，除非另有说明，“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。此外，“至少一个”是指一个或多个，“至少两个”是指两个或两个以上，“多个”也是指两个或两个以上。“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。

需要说明的是，本申请中，“示例性地”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性地”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言，使用“示例性地”或者“例如”等词旨在以具体方式呈现相关概念。

为了便于理解本申请的技术方案，下面先对本申请提供的技术方案的应用场景进行示例性说明。

目前，电子设备中可以设置多个发声组件，例如，通过陶瓷驱动屏幕的发声组件、顶部设置的扬声器和底部设置的扬声器等。在手持通话的场景中，电子设备通常通过陶瓷驱动屏幕的发声组件和/或顶部设置的扬声器，进行发声。这样的话，用户手持通话的过程中，陶瓷驱动屏幕的发声组件中，屏幕发声区域可以正对用户的耳朵，顶部扬声器也可以紧挨用户的耳朵，电子设备发出的大部分声音，可以进入用户的耳内，仅有极少部分的声音会泄露到周围环境中，周围环境中即使有其他人存在，也无法听清楚用户通话的内容，可以很好的保护用户的隐私。

但是，当用户调高通话的音量，进一步提升声音在耳内的响度时，陶瓷驱动会进一步增大，陶瓷驱动屏幕的发声组件发出的声音，以及顶部设置的扬声器发出的声音，强度也会增大，使得泄露到周围环境中的声音的强度也同步增大，这样的话，周围环境中的其他人，便可以听清楚用户的通话内容，从而导致用户通话内容的泄露，造成用户的隐私泄露，用户体验较差。

为了解决上述技术问题，本申请实施例提供了一种语音信号的输出方法、装置和电子设备。该方法可以应用于电子设备中，通过该方法，电子设备可以根据用户通话过程中的下行语音信号生成干扰信号，然后将下行语音信号和该干扰信号调整至相同的时延后，在相同的输出时间，分别通过电子设备中靠近人耳的第一发声组件输出下行语音信号，以及通过远离人耳的第二发声组件输出干扰信号，从而通过干扰信号对下行语音信号进行掩蔽，使得周围环境中的其他人无法听清楚用户的通话内容，达到保护用户通话隐私的目的，用户的体验更好。

需要说明的是，本申请的电子设备可以是静止的，也可以是移动的。电子设备可以包括通信终端、车载设备、移动设备、用户终端、移动终端、无线通信设备、便携式终端、用户代理、用户装置、服务设备或用户设备(user equipment，UE)等计算机网络中处于网络最外围的设备，主要用于数据的输入以及处理结果的输出或显示等。例如，终端设备可以是移动电话、无绳电话、智能手表、可穿戴设备、平板设备、具备无线通信功能的手持设备、计算设备、车载通信模块或连接到无线调制解调器的其它处理设备等。

示例性地，可以参见图1，图1示出了电子设备100的结构示意图。

电子设备100可以包括处理器110，外部存储器接口120，内部存储器121，通用串行总线(universal serial bus，USB)接口130，充电管理模块140，电源管理模块141，电池142，天线1，天线2，移动通信模块150，无线通信模块160，音频模块170，扬声器170A，受话器170B，麦克风170C，耳机接口170D，传感器模块180，按键190，马达191，指示器192，摄像头193，显示屏194，以及用户标识模块(subscriber identification module，SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A，陀螺仪传感器180B，气压传感器180C，磁传感器180D，加速度传感器180E，距离传感器180F，接近光传感器180G，指纹传感器180H，温度传感器180J，触摸传感器180K，环境光传感器180L，骨传导传感器180M等。

可以理解的是，本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中，电子设备100可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件，软件或软件和硬件的组合实现。

处理器110可以包括一个或多个处理单元，例如：处理器110可以包括应用处理器(application processor，AP)，调制解调处理器，图形处理器(graphics processing unit，GPU)，图像信号处理器(image signal processor，ISP)，控制器，视频编解码器，数字信号处理器(digital signal processor，DSP)，基带处理器，和/或神经网络处理器(neural-network processing unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。

控制器可以根据指令操作码和时序信号，产生操作控制信号，完成取指令和执行指令的控制。

处理器110中还可以设置存储器，用于存储指令和数据。在一些实施例中，处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据，可从所述存储器中直接调用。避免了重复存取，减少了处理器110的等待时间，因而提高了系统的效率。

在一些实施例中，处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit，I2C)接口，集成电路内置音频(inter-integrated circuit sound，I2S)接口，脉冲编码调制(pulse code modulation，PCM)接口，通用异步收发传输器(universal asynchronous receiver/transmitter，UART)接口，移动产业处理器接口(mobile industry processor interface，MIPI)，通用输入输出(general-purpose input/output，GPIO)接口，用户标识模块(subscriber identity module，SIM)接口，和/或通用串行总线(universal serial bus，USB)接口等。

I2C接口是一种双向同步串行总线，包括一根串行数据线(serial data line，SDA)和一根串行时钟线(derail clock line，SCL)。在一些实施例中，处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K，充电器，闪光灯，摄像头193等。例如：处理器110可以通过I2C接口耦合触摸传感器180K，使处理器110与触摸传感器180K通过I2C总线接口通信，实现电子设备100的触摸功能。

I2S接口可以用于音频通信。在一些实施例中，处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合，实现处理器110与音频模块170之间的通信。在一些实施例中，音频模块170可以通过I2S接口向无线通信模块160传递音频信号，实现通过蓝牙耳机接听电话的功能。

PCM接口也可以用于音频通信，将模拟信号抽样，量化和编码。在一些实施例中，音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中，音频模块170也可以通过PCM接口向无线通信模块160传递音频信号，实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。

UART接口是一种通用串行数据总线，用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中，UART接口通常被用于连接处理器110与无线通信模块160。例如：处理器110通过UART接口与无线通信模块160中的蓝牙模块通信，实现蓝牙功能。在一些实施例中，音频模块170可以通过UART接口向无线通信模块160传递音频信号，实现通过蓝牙耳机播放音乐的功能。

MIPI接口可以被用于连接处理器110与显示屏194，摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface，CSI)，显示屏串行接口(display serial interface，DSI)等。在一些实施例中，处理器110和摄像头193通过CSI接口通信，实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信，实现电子设备100的显示功能。

GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号，也可被配置为数据信号。在一些实施例中，GPIO接口可以用于连接处理器110与摄像头193，显示屏194，无线通信模块160，音频模块170，传感器模块180等。GPIO接口还可以被配置为I2C接口，I2S接口，UART接口，MIPI接口等。

USB接口130是符合USB标准规范的接口，具体可以是Mini USB接口，Micro USB接口，USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电，也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机，通过耳机播放音频。该接口还可以用于连接其他电子设备，例如AR设备等。

可以理解的是，本发明实施例示意的各模块间的接口连接关系，只是示意性说明，并不构成对电子设备100的结构限定。在本申请另一些实施例中，电子设备100也可以采用上述实施例中不同的接口连接方式，或多种接口连接方式的组合。

充电管理模块140用于从充电器接收充电输入。其中，充电器可以是无线充电器，也可以是有线充电器。在一些有线充电的实施例中，充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中，充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时，还可以通过电源管理模块141为电子设备供电。

电源管理模块141用于连接电池142，充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入，为处理器110，内部存储器121，显示屏194，摄像头193，和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量，电池循环次数，电池健康状态(漏电，阻抗)等参数。在其他一些实施例中，电源管理模块141也可以设置于处理器110中。在另一些实施例中，电源管理模块141和充电管理模块140也可以设置于同一个器件中。

电子设备100的无线通信功能可以通过天线1，天线2，移动通信模块150，无线通信模块160，调制解调处理器以及基带处理器等实现。

天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用，以提高天线的利用率。例如：可以将天线1复用为无线局域网的分集天线。在另外一些实施例中，天线可以和调谐开关结合使用。

移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器，开关，功率放大器，低噪声放大器(low noise amplifier，LNA)等。移动通信模块150可以由天线1接收电磁波，并对接收的电磁波进行滤波，放大等处理，传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大，经天线1转为电磁波辐射出去。在一些实施例中，移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中，移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。

调制解调处理器可以包括调制器和解调器。其中，调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后，被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A，受话器170B等)输出声音信号，或通过显示屏194显示图像或视频。在一些实施例中，调制解调处理器可以是独立的器件。在另一些实施例中，调制解调处理器可以独立于处理器110，与移动通信模块150或其他功能模块设置在同一个器件中。

无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wireless local area networks，WLAN)(如无线保真(wireless fidelity，Wi-Fi)网络)，蓝牙(bluetooth，BT)，全球导航卫星系统(global navigation satellite system，GNSS)，调频(frequency modulation，FM)，近距离无线通信技术(near field communication，NFC)，红外技术(infrared，IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波，将电磁波信号调频以及滤波处理，将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号，对其进行调频，放大，经天线2转为电磁波辐射出去。

在一些实施例中，电子设备100的天线1和移动通信模块150耦合，天线2和无线通信模块160耦合，使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications，GSM)，通用分组无线服务(general packet radio service，GPRS)，码分多址接入(code division multiple access，CDMA)，宽带码分多址(wideband code division multiple access，WCDMA)，时分码分多址(time-division code division multiple access，TD-SCDMA)，长期演进(long term evolution，LTE)，BT，GNSS，WLAN，NFC，FM，和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system，GPS)，全球导航卫星系统(global navigation satellite system，GLONASS)，北斗卫星导航系统(beidou navigation satellite system，BDS)，准天顶卫星系统(quasi-zenith satellite system，QZSS)和/或星基增强系统(satellite based augmentation systems，SBAS)。

电子设备100通过GPU，显示屏194，以及应用处理器等实现显示功能。GPU为图像处理的微处理器，连接显示屏194和应用处理器。GPU用于执行数学和几何计算，用于图形渲染。处理器110可包括一个或多个GPU，其执行程序指令以生成或改变显示信息。

显示屏194用于显示图像，视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display，LCD)，有机发光二极管(organic light-emitting diode，OLED)，有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrix organic light emitting diode的，AMOLED)，柔性发光二极管(flex light-emitting diode，FLED)，Miniled，MicroLed，Micro-oLed，量子点发光二极管(quantum dot light emitting diodes，QLED)等。在一些实施例中，电子设备100可以包括1个或N个显示屏194，N为大于1的正整数。在另一些实施例中，电子设备100的显示屏194还可以称为屏幕194，电子设备100的屏幕194上还可以设置一块发声区域，电子设备100可以通过陶瓷或其它驱动器件，驱动发声区域的屏幕，进行发声。在手持通话的场景下，屏幕194上的发声区域，可以正对人耳。

电子设备100可以通过ISP，摄像头193，视频编解码器，GPU，显示屏194以及应用处理器等实现拍摄功能。

ISP用于处理摄像头193反馈的数据。例如，拍照时，打开快门，光线通过镜头被传递到摄像头感光元件上，光信号转换为电信号，摄像头感光元件将所述电信号传递给ISP处理，转化为肉眼可见的图像。ISP还可以对图像的噪点，亮度，肤色进行算法优化。ISP还可以对拍摄场景的曝光，色温等参数优化。在一些实施例中，ISP可以设置在摄像头193中。

摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device，CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor，CMOS)光电晶体管。感光元件把光信号转换成电信号，之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB，YUV等格式的图像信号。在一些实施例中，电子设备100可以包括1个或N个摄像头193，N为大于1的正整数。

数字信号处理器用于处理数字信号，除了可以处理数字图像信号，还可以处理其他数字信号。例如，当电子设备100在频点选择时，数字信号处理器用于对频点能量进行傅里叶变换等。

视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样，电子设备100可以播放或录制多种编码格式的视频，例如：动态图像专家组(moving picture experts group，MPEG)1，MPEG2，MPEG3，MPEG4等。

NPU为神经网络(neural-network，NN)计算处理器，通过借鉴生物神经网络结构，例如借鉴人脑神经元之间传递模式，对输入信息快速处理，还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用，例如：图像识别，人脸识别，语音识别，文本理解等。

外部存储器接口120可以用于连接外部存储卡，例如Micro SD卡，实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信，实现数据存储功能。例如将音乐，视频等文件保存在外部存储卡中。

内部存储器121可以用于存储计算机可执行程序代码，所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中，存储程序区可存储操作系统，至少一个功能所需的应用程序(比如声音播放功能，图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据，电话本等)等。此外，内部存储器121可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件，闪存器件，通用闪存存储器(universal flash storage，UFS)等。处理器110通过运行存储在内部存储器121的指令，和/或存储在设置于处理器中的存储器的指令，执行电子设备100的各种功能应用以及数据处理。

电子设备100可以通过音频模块170，扬声器170A，受话器170B，麦克风170C，耳机接口170D，以及应用处理器等实现音频功能。例如音乐播放，录音等。

音频模块170用于将数字音频信息转换成模拟音频信号输出，也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中，音频模块170可以设置于处理器110中，或将音频模块170的部分功能模块设置于处理器110中。

扬声器170A，也称“喇叭”，用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐，或收听免提通话。电子设备100中可以设置多个扬声器170A，例如，可以在电子设备100的顶部设置一个扬声器170A，还可以在底部设置一个扬声器170A等。

受话器170B，也称“听筒”，用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时，可以通过将受话器170B靠近人耳接听语音。在一些实施例中，也可以将扬声器170A和受话器170B设置为一个部件，本申请对此不进行限制。

麦克风170C，也称“话筒”，“传声器”，用于将声音信号转换为电信号。当拨打电话或发送语音信息时，用户可以通过人嘴靠近麦克风170C发声，将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中，电子设备100可以设置两个麦克风170C，除了采集声音信号，还可以实现降噪功能。在另一些实施例中，电子设备100还可以设置三个，四个或更多麦克风170C，实现采集声音信号，降噪，还可以识别声音来源，实现定向录音功能等。

耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130，也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform，OMTP)标准接口，美国蜂窝电信工业协会(cellular telecommunications industry association of the USA，CTIA)标准接口。

压力传感器180A用于感受压力信号，可以将压力信号转换成电信号。在一些实施例中，压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多，如电阻式压力传感器，电感式压力传感器，电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A，电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194，电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中，作用于相同触摸位置，但不同触摸操作强度的触摸操作，可以对应不同的操作指令。例如：当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时，执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时，执行新建短消息的指令。

陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中，可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即，x，y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的，当按下快门，陀螺仪传感器180B检测电子设备100抖动的角度，根据角度计算出镜头模组需要补偿的距离，让镜头通过反向运动抵消电子设备100的抖动，实现防抖。陀螺仪传感器180B还可以用于导航，体感游戏场景。

气压传感器180C用于测量气压。在一些实施例中，电子设备100通过气压传感器180C测得的气压值计算海拔高度，辅助定位和导航。

磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中，当电子设备100是翻盖机时，电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态，设置翻盖自动解锁等特性。

加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态，应用于横竖屏切换，计步器等应用。

距离传感器180F，用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中，拍摄场景，电子设备100可以利用距离传感器180F测距以实现快速对焦。

接近光传感器180G可以包括例如发光二极管(LED)和光检测器，例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时，可以确定电子设备100附近有物体。当检测到不充分的反射光时，电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话，以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式，口袋模式自动解锁与锁屏。

环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合，检测电子设备100是否在口袋里，以防误触。

指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁，访问应用锁，指纹拍照，指纹接听来电等。

温度传感器180J用于检测温度。在一些实施例中，电子设备100利用温度传感器180J检测的温度，执行温度处理策略。例如，当温度传感器180J上报的温度超过阈值，电子设备100执行降低位于温度传感器180J附近的处理器的性能，以便降低功耗实施热保护。在另一些实施例中，当温度低于另一阈值时，电子设备100对电池142加热，以避免低温导致电子设备100异常关机。在其他一些实施例中，当温度低于又一阈值时，电子设备100对电池142的输出电压执行升压，以避免低温导致的异常关机。

触摸传感器180K，也称“触控器件”。触摸传感器180K可以设置于显示屏194，由触摸传感器180K与显示屏194组成触摸屏，也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器，以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中，触摸传感器180K也可以设置于电子设备100的表面，与显示屏194所处的位置不同。

骨传导传感器180M可以获取振动信号。在一些实施例中，骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏，接收血压跳动信号。在一些实施例中，骨传导传感器180M也可以设置于耳机中，结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号，解析出语音信号，实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息，实现心率检测功能。

按键190包括开机键，音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入，产生与电子设备100的用户设置以及功能控制有关的键信号输入。

马达191可以产生振动提示。马达191可以用于来电振动提示，也可以用于触摸振动反馈。例如，作用于不同应用(例如拍照，音频播放等)的触摸操作，可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作，马达191也可对应不同的振动反馈效果。不同的应用场景(例如：时间提醒，接收信息，闹钟，游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。

指示器192可以是指示灯，可以用于指示充电状态，电量变化，也可以用于指示消息，未接来电，通知等。

SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195，或从SIM卡接口195拔出，实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口，N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡，Micro SIM卡，SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同，也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互，实现通话以及数据通信等功能。在一些实施例中，电子设备100采用eSIM，即：嵌入式SIM卡。eSIM卡可以嵌在电子设备100中，不能和电子设备100分离。

电子设备100的软件系统可以采用分层架构，事件驱动架构，微核架构，微服务架构，或云架构。本发明实施例以分层架构的Android系统为例，示例性说明电子设备100的软件结构。

图2是本申请实施例的电子设备100的软件结构框图。

分层架构将软件分成若干个层，每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中，将Android系统分为四层，从上至下分别为应用程序层，应用程序框架层，安卓运行时(Android runtime)和系统库，以及内核层。

应用程序层可以包括一系列应用程序包。

如图2所示，应用程序包可以包括相机，图库，日历，通话，地图，导航，WLAN，蓝牙，音乐，视频，短信息等应用程序。

应用程序框架层为应用程序层的应用程序提供应用编程接口(application programming interface，API)和编程框架。应用程序框架层包括一些预先定义的函数。

如图2所示，应用程序框架层可以包括窗口管理器，内容提供器，视图系统，电话管理器，资源管理器，通知管理器等。

窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小，判断是否有状态栏，锁定屏幕，截取屏幕等。

内容提供器用来存放和获取数据，并使这些数据可以被应用程序访问。所述数据可以包括视频，图像，音频，拨打和接听的电话，浏览历史和书签，电话簿等。

视图系统包括可视控件，例如显示文字的控件，显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如，包括短信通知图标的显示界面，可以包括显示文字的视图以及显示图片的视图。

电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通，挂断等)。

资源管理器为应用程序提供各种资源，比如本地化字符串，图标，图片，布局文件，视频文件等等。

通知管理器使应用程序可以在状态栏中显示通知信息，可以用于传达告知类型的消息，可以短暂停留后自动消失，无需用户交互。比如通知管理器被用于告知下载完成，消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知，例如后台运行的应用程序的通知，还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息，发出提示音，电子设备振动，指示灯闪烁等。

Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。

核心库包含两部分：一部分是java语言需要调用的功能函数，另一部分是安卓的核心库。

应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理，堆栈管理，线程管理，安全和异常的管理，以及垃圾回收等功能。

系统库可以包括多个功能模块。例如：表面管理器(surface manager)，媒体库(Media Libraries)，三维图形处理库(例如：OpenGL ES)，2D图形引擎(例如：SGL)等。

表面管理器用于对显示子系统进行管理，并且为多个应用程序提供了2D和3D图层的融合。

媒体库支持多种常用的音频，视频格式回放和录制，以及静态图像文件等。媒体库可以支持多种音视频编码格式，例如:MPEG4，H.264，MP3，AAC，AMR，JPG，PNG等。

三维图形处理库用于实现三维图形绘图，图像渲染，合成，和图层处理等。

2D图形引擎是2D绘图的绘图引擎。

内核层是硬件和软件之间的层。内核层至少包含显示驱动，摄像头驱动，音频驱动，传感器驱动。

下面结合捕获拍照场景，示例性说明电子设备100软件以及硬件的工作流程。

当触摸传感器180K接收到触摸操作，相应的硬件中断被发给内核层。内核层将触摸操作加工成原始输入事件(包括触摸坐标，触摸操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件，识别该输入事件所对应的控件。以该触摸操作是触摸单击操作，该单击操作所对应的控件为相机应用图标的控件为例，相机应用调用应用框架层的接口，启动相机应用，进而通过调用内核层启动摄像头驱动，通过摄像头193捕获静态图像或视频。

下面，对本申请提供的语音信号的输出方法的实施例进行说明。

参见图3，图3为本申请实施例提供的语音信号的输出方法的流程示意图。该方法可以应用于电子设备中，该电子设备中设置有第一发声组件和第二发声组件。其中，第一发声组件可以设置于电子设备的第一位置，用户手持电子设备通话时，即电子设备处于手持通话的应用场景中时，第一位置靠近用户的耳朵。第二发声组件可以设置于电子设备中与第一位置不同的第二位置。

例如，参见图4，图4为本申请实施例提供的一种应用场景示意图。如图4所示，第一位置可以位于电子设备100的屏幕194上，第一发声组件401可以为陶瓷驱动屏幕的发声组件。第二位置可以位于电子设备100的底部，第二发声组件402可以为设置于电子设备100底部的扬声器。

需要说明的是，第一位置和第二位置还可以位于电子设备的其它位置。例如，第一位置还可以位于电子设备的顶部、屏幕上方的位置。第二位置还可以位于电子设备的侧面等。本申请对此不进行限制。同理，第一发声组件和第二发声组件还可以设置为其它发声组件，例如，第一发声组件还可以为设置于电子设备顶部的扬声器，第二发声组件还可以为设置于电子设备侧面的扬声器等。本申请对此不进行限制。

如图3所示，该方法可以包括以下步骤：

步骤S101、生成第一语音信号。

其中，第一语音信号是指根据下行语音信号生成的干扰信号。下行语音信号可以为用户通话中的下行语音信号。

需要说明的是，在手持通话的应用场景中，用户手持的电子设备(以下简称电子设备)可以实时且连续地接收其它终端设备(以下简称终端设备)传输到该电子设备的下行语音信号。每次接收到下行语音信号之后，电子设备都可以按照本申请实施例提供的语音信号的输出方法，对本次接收到的下行语音信号进行处理后输出。

如图5所示，生成第一语音信号，可以按照以下步骤实现：

步骤S201、生成第一功率谱密度。

其中，第一功率谱密度是指根据下行语音信号计算得到的功率谱密度。

一种可能的实现方式中，第一功率谱密度可以是下行语音信号的功率谱密度。具体实现中，首先可以通过自相关函数法计算下行语音信号的功率谱密度，然后将计算得到的下行语音信号的功率谱密度确定为第一功率谱密度。

另一种可能的实现方式中，还可以先通过预先设置的第二带通滤波器对下行语音信号进行带通滤波，得到第一带宽范围内的第一信号，第一带宽为第二带通滤波器的带宽。然后通过自相关函数法计算第一信号的功率谱密度，之后，将计算得到的第一信号的功率谱密度确定为第一功率谱密度。这样，可以先将下行语音信号中，人耳听不见的信号，通过第二带通滤波器滤掉，从而可以提高下行语音信号的输出效率，使得通话过程更加流畅，用户体验更好。

步骤S202、根据所述第一功率谱密度生成第一语音信号。

具体实现时，根据第一功率谱密度生成第一语音信号，可以包括多种实现方式。示例性地，如图6所示，根据第一功率谱密度生成第一语音信号，可以按照以下步骤实现：

步骤S301、根据第一功率谱密度生成掩蔽信号和粉噪信号。

其中，掩蔽信号可以用于对下行语音信号进行掩蔽，两者同时输出后，下行语音信号对应的声音信号进入周围环境中其他人耳中的强度减弱，信息不完整，即使用户增大音量，周围环境中的其他人也无法听清楚用户的通话内容，可以很好的保护用户的隐私。

如图7所示，根据第一功率谱密度生成掩蔽信号，可以按照以下步骤实现：

步骤S401、根据第一功率谱密度，确定第一平均功率。

其中，第一平均功率是指第一功率谱密度对应的所有频点的功率谱密度值的平均值。

步骤S402、确定第一频点。

其中，第一频点是指第一功率谱密度对应的所有频点中，对应功率谱密度值大于第一平均功率的频点。

例如，如图8所示，第一功率谱密度对应的所有频点中，频点f1、f2和f3对应的功率谱密度值大于第一平均功率，则可以将频点f1、f2和f3均确定为第一频点。

步骤S403、根据所述第一频点生成掩蔽信号。

具体实现中，第一频点的数量可以为多个，也可以为一个。基于此，根据第一频点生成掩蔽信号的实现方式，也可以包括多种。

示例性地，如果第一频点的数量为多个，且所有第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差小于第一预设频率阈值，则按照对应功率谱密度值由大至小的顺序，在所有第一频点中选出第一预设数量的第一频点，确定为第二频点。其中，第一预设频率阈值可以根据实际应用场景的需求设置，例如，可以设置为1000HZ。第一预设数量也可以根据实际应用场景的需求设置，例如，可以设置为3个或5个。

然后，确定第三频点，第三频点位于相邻两个第二频点之间，即，每相邻的两个第二频点之间可以选取一个第三频点。可以将确定出的第三频点作为单掩蔽音的频点。可选地，可以在相邻的两个第二频点之间任意选择一个频点，确定为第三频点。可选地，也可以选择位于相邻两个第二频点的中间的频点，作为第三频点，本申请对此不进行限制。

之后，可以根据预设人耳掩蔽效应曲线，确定第三频点对应的幅值，该幅值可以用于表征信号的强弱。最后，可以根据第三频点的频率值和第三频点对应的幅值，生成掩蔽信号。掩蔽信号包括频率为第三频点对应的频率值，且幅值为相应第三频点对应的幅值的信号。

具体实现时，可以将人耳掩蔽效应曲线包括的点对应的频率值(以下记为预设频率值，单位为赫兹Hz)和幅值(以下记为预设幅值)对应存储在电子设备中。在根据预设人耳掩蔽效应曲线，确定第三频点对应的幅值时，可以从存储的预设频率值中筛选出与第三频点的频率值相同的预设频率值，然后将与筛选出的该预设频率值对应存储的预设幅值确定为第三频点对应的幅值。其中，幅值可以为声强，单位为分贝(dB)，或者，幅值也可以为功率谱密度值，单位为分贝/赫兹，或者，幅值还可以为功率等。本申请对此不进行限制。或者，如果从存储的预设频率值中没有找到与第三频点的频率值相同的预设频率值，可以采用插值的方式，根据对应存储的预设频率值和预设幅值，确定第三频点对应的幅值。

例如，仍然如图8所示，第一频点的数量为三个，分别为f1、f2和f3，其中，频率值最大的第一频点f3的频率值为400HZ，频率值最小的第一频点f1的频率值为100HZ，两者相差的频率值为300HZ，小于1000HZ，则可以将第一频点f1、f2和f3，均确定为第二频点。

然后，如图9所示，可以在第二频点f1和第二频点f2中间选取一个频点fa1，还可以在第二频点f2和第二频点f3之间，选取一个频点fa2，然后，将频点fa1和频点fa2确定为第三频点。

之后，可以分别从预先保存的预设频率值中，找到与第三频点fa1的频率值和第三频点fa2的频率值相同的预设频率值，然后再分别找到对应的预设幅值，从而确定出第三频点fa1对应的幅值和第三频点fa2对应的幅值。进而确定出掩蔽信号。

示例性地，如果第一频点的数量为多个，且所有第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差大于等于第一预设频率阈值，则在所有第一频点中选出对应功率谱密度值最大的第一频点、频率值最大的第一频点和频率值最小的第一频点，确定为第四频点。

然后，在各第四频点与其相邻第一频点之间，分别选取一个频点，确定为第五频点。或者，也可以在各个第四频点附近，与各所述第四频点之间，频率值相差小于等于第二预设频率阈值处，分别选取一个频点，确定为第五频点，即，各个第五频点与其相邻的第四频点之间，频率值相差小于等于第二预设频率阈值。其中，第二预设频率阈值可以根据实际应用场景的需求设置，例如，第二预设频率阈值可以设置为5Hz、20Hz或50Hz等。

之后，根据预设人耳掩蔽效应曲线，确定第五频点对应的幅值。幅值的具体内容可以参考前述实施例的内容，此处不再赘述。最后，根据第五频点的频率值和第五频点对应的幅值，生成掩蔽信号。掩蔽信号包括频率为第五频点对应的频率值，且幅值为相应第五频点对应的幅值的信号。

例如，如图10所示，第一频点的数量为三个，分别为频点f4、f5和f6，其中，第一频点f5对应的功率谱密度值最大，频率值最大的第一频点f6的频率值为1500HZ，频率值最小的第一频点f4的频率值为100HZ，两者相差的频率值为1400HZ，大于1000HZ，则可以将第一频点f4、f5和f6，均确定为第四频点。

然后，如图11所示，可以分别在第四频点f4、f5和f6附近，各选取一个频点fa3、fa4和fa5，然后，将频点fa3、fa4和fa5确定为第五频点。

之后，可以分别从预先保存的预设频率值中，找到与第五频点fa3的频率值、第五频点fa4的频率值、以及第五频点fa5的频率值相同的预设频率值，然后再分别找到对应的预设幅值，从而确定出第五频点fa3对应的幅值、第五频点fa4对应的幅值、以及第五频点fa5对应的幅值。进而确定出掩蔽信号。

具体实现过程，还可以参考前述实施例的内容，此处不再赘述。

示例性地，如果第一频点的数量为多个，且所有第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差大于等于第一预设频率阈值，则在各频点区间中，按照对应功率谱密度值由大至小的顺序，选出第二预设数量的第一频点，确定为第六频点，其中，各个频点区间的终止频点与起始频点之间，频率值相差小于等于第三预设频率阈值，且各个频点区间包括的第一频点的数量大于等于第三预设数量。其中，第二预设数量可以根据实际应用场景的需求设置，例如，可以将第二预设数量设置为3个或5个等。第三预设频率阈值也可以根据实际应用场景的需求设置，例如，可以将第三预设频率阈值设置为50赫兹或100赫兹等。第三预设数量也可以根据实际应用场景的需求设置，例如，可以将第三预设数量设置为8个或10个等。本申请对此不进行限制。

然后，确定各个频点区间对应的第七频点，第七频点位于相应频点区间中相邻两个第六频点之间。即，在每个频点区间中，每两个相邻的第六频点之间，分别选取一个频点，确定为该频点区间对应的第七频点。可选地，可以在两个相邻的第六频点之间，任意选取一个频点，作为第七频点。可选地，还可以将两个相邻的第六频点中间的频点，作为第七频点。本申请对此不进行限制。

之后，可以根据预设人耳掩蔽效应曲线，确定各个第七频点对应的幅值，幅值的具体内容可以参考前述实施例的内容，此处不再赘述。最后，可以根据各个第七频点的频率值和各个第七频点对应的幅值，生成掩蔽信号。掩蔽信号包括频率值为第七频点的频率值，幅值为第七频点对应的幅值的信号。

例如，如图12所示，第一频点的数量为10个，其中，第一频点f7、f8、f9、f10和f11集中在一个频点区间(例如频点区间1)中，第一频点f12、f13、f14、f15和f16集中在一个频点区间(例如频点区间2)中。则可以在频点区间1中，按照各第一频点对应的功率谱密度值由大至小的顺序，选取f8、f9和f10，确定为第六频点。以及，在频点区间2中，按照各第一频点对应的功率谱密度值由大至小的顺序，选取f13、f15和f16，确定为第六频点。

然后，如图13所示，在频点区间1中，在第六频点f8和f9之间，选取一个频点fa6，确定为第七频点，以及，在第六频点f9和f10之间，选取一个频点fa7，确定为第七频点。在频点区间2中，在第六频点f13和f15之间，选取一个频点fa8，确定为第七频点，以及，在第六频点f15和f16之间，选取一个频点fa9，确定为第七频点。

之后，可以分别从预先保存的预设频率值中，找到与第七频点fa6的频率值、第七频点fa7的频率值、第七频点fa8的频率值、以及第七频点fa9的频率值相同的预设频率值，然后再分别找到对应的预设幅值，从而确定出第七频点fa6对应的幅值、第七频点fa7对应的幅值、第七频点fa8对应的幅值、以及第七频点fa9对应的幅值。进而确定出掩蔽信号。

示例性地，如果第一频点的数量为一个，则可以在第一频点两侧分别选取一个频点，确定为第八频点。具体实现时，第八频点与第一频点之间，频率值可以相差第四预设频率阈值。其中，第四预设频率阈值可以根据实际应用场景的需求设置。例如，可以将第四预设频率阈值设置为5Hz、10Hz或20Hz等。

然后，可以根据预设人耳掩蔽效应曲线，确定第八频点对应的幅值，幅值的内容可以参考前述实施例的内容，此处不再赘述。

之后，可以根据第八频点的频率值和第八频点对应的幅值，生成掩蔽信号。掩蔽信号包括频率值为第八频点的频率值，幅值为第八频点对应的幅值的信号。

例如，如图14所示，第一频点只有一个，为频点f17，则可以在第一频点f17两侧分别选取一个频点f18和f19，确定为第八频点。

然后，可以分别从预先存储的预设频率值中，找到与第八频点f18的频率值相同的预设频率值，以及与第八频点f19的频率值相同的预设频率值，然后再分别找到相应的预设幅值，从而确定出第八频点f18对应的幅值，以及第八频点f19对应的幅值。进而确定出掩蔽信号。

示例性地，如果第一频点的数量为一个，则可以在第一频点两侧分别选取一个频点，确定为第九频点。具体实现时，第九频点与第一频点之间，频率值可以相差第五预设频率阈值。其中，第五预设频率阈值可以根据实际应用场景的需求设置。例如，可以将第五预设频率阈值设置为5Hz、10Hz或20Hz等。

然后，在各第九频点与第一频点之间，分别选取一个频点，确定为第十频点。即，在每一个第九频点与第一频点之间，各自选取一个频点，确定为第十频点。

之后，可以根据预设人耳掩蔽效应曲线，确定第十频点对应的幅值，幅值的内容可以参考前述实施例的内容，此处不再赘述。最后，可以根据第十频点的频率值和第十频点对应的幅值，生成掩蔽信号。掩蔽信号包括频率为第十频点对应的频率值，且幅值为相应第十频点对应的幅值的信号。

例如，如图15所示，第一频点只有一个，为频点f20，则可以在第一频点f20两侧分别选取一个频点f21和f22，确定为第九频点。

然后，如图16所示，可以分别在第九频点f21与第一频点f20之间，以及第九频点f22与第一频点f20之间，各选取一个频点，分别为频点fa10和fa11，确定为第十频点。

之后，可以分别从预先保存的预设频率值中，找到与第十频点fa10的频率值和第十频点fa11的频率值相同的预设频率值，然后再分别找到对应的预设幅值，从而确定出第十频点fa10对应的幅值和第十频点fa11对应的幅值。进而确定出掩蔽信号。

如图17所示，根据第一功率谱密度生成粉噪信号，可以按照以下步骤实现：

步骤S501、确定第二平均功率。

其中，第二平均功率是指所有第十一频点的功率谱密度值的平均值。第十一频点是指第一功率谱密度对应的所有频点中，功率谱密度值小于等于第一平均功率的频点。第一平均功率是指第一功率谱密度对应的所有频点的功率谱密度值的平均值。

步骤S502、获取所述第二平均功率对应的预设粉噪带通滤波增益。

具体实现时，可以根据多次通话试验，在电子设备中预先设置一个增益规则表，增益规则表中对应存储有功率(后续称为预设功率)与粉噪带通滤波增益(后续称为预设粉噪带通滤波增益)。

在执行步骤S502时，电子设备可以从预先设置的增益规则表中，找出与第二平均功率相同的预设功率，然后，再从该增益规则表中，找出与该预设功率对应存储的预设粉噪带通滤波增益，将该预设粉噪带通滤波增益确定为第二平均功率对应的预设粉噪带通滤波增益。

步骤S503、调整第一带通滤波器的增益为所述预设粉噪带通滤波增益。

其中，第一带通滤波器预先设置于电子设备中，用于对粉噪信号源输出的信号进行带通滤波。

步骤S504、通过增益调整后的所述第一带通滤波器对粉噪信号源输出的信号进行带通滤波，生成粉噪信号。

需要说明的是，如果在步骤S201中，生成的第一功率谱密度为第一信号的功率谱密度，则在执行步骤S504时，还需要将第一带通滤波器的带宽设置为第一带宽，然后通过带宽为第一带宽，增益为第二平均功率对应的预设粉噪带通滤波增益的第一带通滤波器，对粉噪信号源输出的信号进行带通滤波，生成粉噪信号。

步骤S302、调整所述掩蔽信号和所述粉噪信号至相同时延。

生成掩蔽信号和粉噪信号之后，需要分别对掩蔽信号和粉噪信号进行时延调节，将掩蔽信号和粉噪信号调整至相同的时延。

步骤S303、根据调整至相同时延的所述掩蔽信号和所述粉噪信号，生成第一语音信号。

一种可能的实现方式中，将掩蔽信号和粉噪信号调整至相同时延之后，可以对调整至相同时延后的掩蔽信号和粉噪信号求和，然后将求和后得到的信号确定为第一语音信号。

一种可能的实现方式中，将掩蔽信号和粉噪信号调整至相同时延之后，还可以对调整至相同时延后的掩蔽信号和粉噪信号进行加权求和，然后将加权求和后得到的信号确定为第一语音信号。其中，掩蔽信号和粉噪信号分别对应的权重可以预先通过通话试验确定。

一种可能的实现方式中，将掩蔽信号和粉噪信号调整至相同的时延之后，还可以分别对时延调整后的掩蔽信号和粉噪信号进行增益调整，掩蔽信号对应的增益与粉噪信号对应的增益可以相同，也可以不同，均可以根据通话试验确定，然后预先设置于电子设备中，对掩蔽信号和粉噪信号进行增益调整时，从电子设备中调取即可。

然后，对增益调整后的掩蔽信号和粉噪信号进行求和或加权求和，将求和或加权求和得到的信号确定为第一语音信号。这样，可以预先根据通话试验，更好地确定合适的掩蔽信号和粉噪信号，使得生成的第一语音信号后续可以更好的掩蔽下行语音信号，在保证用户听清楚通话内容的同时，避免周围环境中的其他人听清楚用户的通话内容，用户体验更好。

按照图6至图17所示的任意一种实施方式，生成的第一语音信号，可以掩蔽掉下行语音信号中功率谱密度值较大的频点的信号，后续同时输出第一语音信号和第二语音信号之后，使得进入用户周围环境中其它人耳中的声音的强度减弱，从而无法听清楚用户的通话内容，可以很好地保护用户的隐私，用户的体验更好。

示例性地，如图18所示，根据第一功率谱密度生成第一语音信号，还可以按照以下步骤实现：

步骤S601、根据第一功率谱密度，确定第一平均功率。

步骤S602、确定第十二频点。

其中，第十二频点是指第一功率谱密度对应的所有频点中，对应功率谱密度值大于第一平均功率的频点。

步骤S603、按照对应功率谱密度值由大至小的顺序，在所有所述第十二频点中选出第四预设数量的第十二频点，确定为第十三频点。

其中，第四预设数量可以根据实际应用场景的需求设置。例如，可以将第四预设数量设置为3个或5个。

步骤S604、根据所述第十三频点，生成陷波滤波器。

其中，陷波滤波器的陷波频率包括第十三频点的频率值。也就是说，通过该陷波滤波器滤波之后，可以滤掉频率为第十三频点的频率值的信号。

步骤S605、通过所述陷波滤波器对粉噪信号源输出的信号进行陷波滤波，生成第一语音信号。

需要说明的是，如果在步骤S201中，生成的第一功率谱密度为下行语音信号的功率谱密度，则在执行步骤S605时，通过陷波频率包括第十三频点的频率值的陷波滤波器，对粉噪信号源输出的信号进行陷波滤波，将陷波滤波后得到的信号确定为第一语音信号。

如果在步骤S201中，生成的第一功率谱密度为第一信号的功率谱密度，则在执行步骤S605时，还需要将陷波滤波器的带宽设置为第一带宽，然后通过带宽为第一带宽，陷波频率包括第十三频点的频率值的陷波滤波器，对粉噪信号源输出的信号进行陷波滤波，将陷波滤波后得到的信号确定为第一语音信号。

按照图18所示的实施方式，生成的第一语音信号，可以掩蔽掉下行语音信号中除功率谱密度值较大的频点的信号之外的其余大部分信号，后续同时输出第一语音信号和第二语音信号之后，使得进入用户周围环境中其它人耳中的声音缺失大部分频点的信号的信息，从而无法听清楚用户的通话内容，同样可以很好地保护用户的隐私，用户的体验更好。

在其它一些可选的实施例中，电子设备还可以在计算出第一功率谱密度之后，确定第一功率谱密度包含的所有功率谱密度值中，最大的功率谱密度值与第一平均功率之间的差值，是否大于等于预设功率谱密度阈值，如果最大的功率谱密度值与第一平均功率的差值大于等于预设功率谱密度阈值，则通过图18所示的实施方式，生成第一语音信号。或者，如果最大的功率谱密度值与第一平均功率的差值小于预设功率谱密度阈值，则通过图6至图17所示的任意一种实施方式，生成第一语音信号。其中，预设功率谱密度阈值可以根据实际场景的需求设置。

这样的话，电子设备在实时且连续地获取到下行语音信号之后，可以实时地根据下行语音信号的属性，调整生成第一语音信号的实施方式，从而可以根据下行语音信号的属性，采用更加合适的方式，生成更加适合的干扰信号，在保证用户听清楚通话内容的同时，可以避免用户周围的其他人听清楚用户的通话内容，用户的体验更好。

在其它一些可选的实施例中，根据第一功率谱密度生成第一语音信号，还可以按照下述方式实现：电子设备还可以分别通过图18所示的实施方式，生成一个第一语音信号(在此实施例中，后续可以将该第一语音信号记为第四语音信号)，以及通过图6至图17所示的任意一种实施方式，生成一个第一语音信号(在此实施例中，后续可以将该第一语音信号记为第五语音信号)。然后，将第四语音信号与第五语音信号进行求和或加权求和，将求和或加权求和后得到的信号确定为干扰信号。之后，可以将该干扰信号确定为步骤S202中的第一语音信号。

需要说明的是，在其它一些可选的实施例中，在上述任意一个实施例的基础上，在根据下行语音信号生成第一语音信号之前，均可以先对下行语音信号的属性信息进行调整，例如，调整下行语音信号的信噪比和/或增益等属性信息，然后，根据属性信息调整后的下行语音信号生成第一语音信号，本申请对此不进行限制。

步骤S102、生成第二语音信号。

其中，第二语音信号是指对下行语音信号进行时延处理后，得到的与第一语音信号具有相同时延的语音信号。

需要说明的是，在一些可选的实施例中，在对下行语音信号进行时延处理之前，还可以先对下行语音信号的其它属性信息进行调整，例如，调整下行语音信号的信噪比和/或增益等属性信息。然后再对属性信息调整后的下行语音信号进行时延处理，得到与第一语音信号具有相同时延的语音信号，最后，将得到的语音信号确定为第二语音信号。

还需要说明的是，生成第一语音信号时，对下行语音信号的属性信息的调整方式，与生成第二语音信号时，对下行语音信号的属性信息的调整方式，可以相同，也可以不同，本申请对此不进行限制。

步骤S103、在相同的输出时间，分别通过第一发声组件输出所述第二语音信号，以及通过第二发声组件输出所述第一语音信号。

在相同的输出时间，通过第一发声组件输出第二语音信号，以及通过第二发声组件输出第一语音信号后，第一语音信号和第二语音信号均被转化为声音信号后发出。这样，第一语音信号可以对第二语音信号进行掩蔽，即，下行语音信号的干扰信号可以掩蔽下行语音信号。

其中，由于第一发声组件设置于电子设备的第一位置，在用户手持通话时，第一位置靠近用户的耳朵，甚至正对用户的耳朵，第二发声组件设置于远离用户耳朵的第二位置，这样，在用户调大音量的情况下，即使第一语音信号对第二语音信号进行了掩蔽，进入用户耳朵的声音的强度仍然足够大，用户可以清楚地听清楚通话的内容。而在用户周围的其它人，由于第一发声组件发出的声音和第二发声组件发出的声音都离耳朵较远，在第一语音信号对第二语音信号进行掩蔽的情况下，进入耳朵的声音强度较小，无法听清楚用户的通话内容，从而达到保护用户通话隐私的目的，用户体验较好。

在一些可选的实施例中，电子设备中还可以设置第三发声组件，第三发声组件可以设置于靠近第一位置的第三位置，例如，第一发声组件可以为陶瓷驱动屏幕的发声组件，第二发声组件可以为设置于电子设备底部的扬声器，第三发声组件可以为设置于电子设备顶部的扬声器。此种应用场景下，本申请提供的语音信号的输出方法，还可以包括：生成第三语音信号，第三语音信号是指对下行语音信号进行时延处理后，得到的与第一语音信号具有相同时延的语音信号；在与第一语音信号和第二语音信号相同的输出时间，通过第三发声组件输出第三语音信号。这样，可以通过第三发声组件发出的声音对第一发声组件发出的声音进行补充，使得用户听到的声音更加清楚，提高用户的体验。

可见，本申请实施例提供的语音信号的输出方法中，可以通过根据下行语音信号生成的干扰信号，对下行语音信号进行掩蔽。在用户手持电子设备进行通话时，进入用户耳朵的声音强度足够大，可以保证用户可以清楚地听到通话内容。而对于周围环境中的其他人，由于干扰信号对下行语音信号的掩蔽作用，传到这些人耳朵的声音的强度较小，信息不完整，使得这些人无法听清楚用户的通话内容，从而很好地保护了用户的隐私，用户的体验更好。

本文中描述的各个方法实施例可以为独立的方案，也可以根据内在逻辑进行组合，这些方案都落入本申请的保护范围中。

上述实施例对本申请提供的语音信号的输出方法进行了介绍。下面，对本申请提供的电子设备的实施例进行介绍。可以理解的是，电子设备为了实现上述功能，其包含了执行每一个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对电子设备进行功能模块的划分，例如，可以对应每一个功能划分每一个功能模块，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本申请实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

以上，结合图3至图18详细说明了本申请实施例提供的方法。以下，结合图19详细说明本申请实施例提供的电子设备。应理解，电子设备实施例的描述与方法实施例的描述相互对应，因此，未详细描述的内容可以参见上文方法实施例，为了简洁，这里不再赘述。

参见图19，图19为本申请实施例提供的一种电子设备的结构框图，如图19所示，该电子设备1900包括第一发声组件1901和第二发声组件1902，第一发声组件1901设置于电子设备1900的第一位置，用户手持所述电子设备通话时，所述第一位置靠近所述用户的耳朵，第二发声组件1902设置于与所述第一位置不同的第二位置，所述电子设备1900还包括存储器1903和处理器1904，所述存储器1903和所述处理器1904耦合；所述存储器1903用于存储计算机程序代码，所述计算机程序代码包括计算机指令，当所述处理器 1904执行所述计算机指令时，使所述电子设备1900执行上述图3至图18任意一个实施例所述的语音信号的输出方法。该电子设备1900可以执行上述方法实施例的操作。

例如，在本申请一种可选的实施例中，处理器1904可以用于：生成第一语音信号，所述第一语音信号是指根据下行语音信号生成的干扰信号；生成第二语音信号，所述第二语音信号是指对所述下行语音信号进行时延处理后，得到的与所述第一语音信号具有相同时延的语音信号；在相同的输出时间，分别通过所述第一发声组件输出所述第二语音信号，以及通过所述第二发声组件输出所述第一语音信号。

一种可能的实现方式中，所述处理器1904用于生成第一语音信号，具体为：所述处理器1904用于，生成第一功率谱密度，所述第一功率谱密度是指根据所述下行语音信号计算得到的功率谱密度；根据所述第一功率谱密度生成所述第一语音信号。

一种可能的实现方式中，所述处理器1904用于根据所述第一功率谱密度生成所述第一语音信号，具体为：所述处理器1904用于，根据所述第一功率谱密度生成掩蔽信号和粉噪信号；调整所述掩蔽信号和所述粉噪信号至相同时延；根据调整至相同时延的所述掩蔽信号和所述粉噪信号，生成所述第一语音信号。

一种可能的实现方式中，所述处理器1904用于根据所述第一功率谱密度生成掩蔽信号，具体为：所述处理器1904用于，根据所述第一功率谱密度，确定第一平均功率，所述第一平均功率是指所述第一功率谱密度对应的所有频点的功率谱密度值的平均值；确定第一频点，所述第一频点是指所述第一功率谱密度对应的所有频点中，对应功率谱密度值大于所述第一平均功率的频点；根据所述第一频点生成所述掩蔽信号。

一种可能的实现方式中，所述处理器1904用于根据所述第一频点生成所述掩蔽信号，具体为：所述处理器1904用于，如果所述第一频点的数量为多个，且所有所述第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差小于第一预设频率阈值，则按照对应功率谱密度值由大至小的顺序，在所有所述第一频点中选出第一预设数量的第一频点，确定为第二频点；确定第三频点，所述第三频点位于相邻两个所述第二频点之间；根据预设人耳掩蔽效应曲线，确定所述第三频点对应的幅值，所述幅值用于表征信号的强弱；根据所述第三频点的频率值和所述第三频点对应的幅值，生成所述掩蔽信号。

一种可能的实现方式中，所述处理器1904用于根据所述第一频点生成所述掩蔽信号，具体为：所述处理器1904用于，如果所述第一频点的数量为多个，且所有所述第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差大于等于第一预设频率阈值，则在所有所述第一频点中选出对应功率谱密度值最大的第一频点、频率值最大的第一频点和频率值最小的第一频点，确定为第四频点；在各所述第四频点附近，与各所述第四频点之间，频率值相差小于等于第二预设频率阈值处，分别选取一个频点，确定为第五频点；根据预设人耳掩蔽效应曲线，确定所述第五频点对应的幅值，所述幅值用于表征信号的强弱；根据所述第五频点的频率值和所述第五频点对应的幅值，生成所述掩蔽信号。

一种可能的实现方式中，所述处理器1904用于根据所述第一频点生成所述掩蔽信号，具体为：所述处理器1904用于，如果所述第一频点的数量为多个，且所有所述第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差大于等于第一预设频率阈值，则在各频点区间中，按照对应功率谱密度值由大至小的顺序，选出第二预设数量的第一频点，确定为第六频点，其中，各所述频点区间的终止频点与起始频点之间，频率值相差小于等于第三预设频率阈值，且各所述频点区间包括的第一频点的数量大于等于第三预设数量；确定各所述频点区间对应的第七频点，所述第七频点位于相应频点区间中相邻两个所述第六频点之间；根据预设人耳掩蔽效应曲线，确定所述第七频点对应的幅值，所述幅值用于表征信号的强弱；根据所述第七频点的频率值和所述第七频点对应的幅值，生成所述掩蔽信号。

一种可能的实现方式中，所述处理器1904用于根据所述第一频点生成所述掩蔽信号，具体为：所述处理器1904用于，如果所述第一频点的数量为一个，则在所述第一频点两侧分别选取一个频点，确定为第八频点；根据预设人耳掩蔽效应曲线，确定所述第八频点对应的幅值，所述幅值用于表征信号的强弱；根据所述第八频点的频率值和所述第八频点对应的幅值，生成所述掩蔽信号。

一种可能的实现方式中，所述处理器1904用于根据所述第一频点生成所述掩蔽信号，具体为：所述处理器1904用于，如果所述第一频点的数量为一个，则在所述第一频点两侧分别选取一个频点，确定为第九频点；在各所述第九频点与所述第一频点之间，分别选取一个频点，确定为第十频点；根据预设人耳掩蔽效应曲线，确定所述第十频点对应的幅值，所述幅值用于表征信号的强弱；根据所述第十频点的频率值和所述第十频点对应的幅值，生成所述掩蔽信号。

一种可能的实现方式中，所述处理器1904用于根据所述第一功率谱密度生成粉噪信号，具体为：所述处理器1904用于确定第二平均功率，所述第二平均功率是指所有第十一频点的功率谱密度值的平均值，所述第十一频点是指所述第一功率谱密度对应的所有频点中，功率谱密度值小于等于第一平均功率的频点，所述第一平均功率是指所述第一功率谱密度对应的所有频点的功率谱密度值的平均值；获取所述第二平均功率对应的预设粉噪带通滤波增益；调整第一带通滤波器的增益为所述预设粉噪带通滤波增益；通过增益调整后的所述第一带通滤波器对粉噪信号源输出的信号进行带通滤波，生成所述粉噪信号。

一种可能的实现方式中，所述处理器1904用于根据所述第一功率谱密度生成所述第一语音信号，具体为：所述处理器1904用于根据所述第一功率谱密度，确定第一平均功率，所述第一平均功率是指所述第一功率谱密度对应的所有频点的功率谱密度值的平均值；确定第十二频点，所述第十二频点是指所述第一功率谱密度对应的所有频点中，对应功率谱密度值大于所述第一平均功率的频点；按照对应功率谱密度值由大至小的顺序，在所有所述第十二频点中选出第四预设数量的第十二频点，确定为第十三频点；根据所述第十三频点，生成陷波滤波器，所述陷波滤波器的陷波频率包括所述第十三频点的频率值；通过所述陷波滤波器对粉噪信号源输出的信号进行陷波滤波，生成所述第一语音信号。

一种可能的实现方式中，所述处理器1904用于生成第一功率谱密度，具体为：所述处理器1904用于，通过第二带通滤波器对所述下行语音信号进行带通滤波，得到第一带宽范围内的第一信号；所述第一带宽为所述第二带通滤波器的带宽；计算所述第一信号的功率谱密度；确定所述第一信号的功率谱密度为所述第一功率谱密度。

一种可能的实现方式中，所述电子设备1900还包括第三发声组件，所述第三发声组件设置于靠近所述第一位置的第三位置，所述处理器1904还用于：生成第三语音信号，所述第三语音信号是指对所述下行语音信号进行时延处理后，得到的与所述第一语音信号具有相同时延的语音信号；在所述相同的输出时间，通过所述第三发声组件输出所述第三语音信号。

在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

应注意，本申请实施例中的处理器可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

可以理解，本申请实施例中的存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(dynamic RAM，DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM，DR RAM)。应注意，本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。

根据本申请实施例提供的方法，本申请实施例还提供一种计算机程序产品，该计算机程序产品包括：计算机程序或指令，当该计算机程序或指令在计算机上运行时，使得该计算机执行方法实施例中任意一个实施例的方法。

根据本申请实施例提供的方法，本申请实施例还提供一种计算机存储介质，该计算机存储介质存储有计算机程序或指令，当该计算机程序或指令在计算机上运行时，使得该计算机执行方法实施例中任意一个实施例的方法。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各种说明性逻辑块(illustrative logical block)和步骤(step)，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的电子设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的电子设备实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

上述本申请实施例提供的电子设备、计算机存储介质、计算机程序产品均用于执行上文所提供的方法，因此，其所能达到的有益效果可参考上文所提供的方法对应的有益效果，在此不再赘述。

应理解，在本申请的各个实施例中，各步骤的执行顺序应以其功能和内在逻辑确定，各步骤序号的大小并不意味着执行顺序的先后，不对实施例的实施过程构成限定。

本说明书的各个部分均采用递进的方式进行描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点介绍的都是与其他实施例不同之处。尤其，对于电子设备、计算机存储介质、计算机程序产品的实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例中的说明即可。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

以上所述的本申请实施方式并不构成对本申请保护范围的限定。

Claims

一种语音信号的输出方法，其特征在于，所述方法用于电子设备，所述电子设备包括第一发声组件和第二发声组件，所述第一发声组件设置于所述电子设备的第一位置，用户手持所述电子设备通话时，所述第一位置靠近所述用户的耳朵，所述第二发声组件设置于与所述第一位置不同的第二位置，所述方法包括：

生成第一语音信号，所述第一语音信号是指根据下行语音信号生成的干扰信号；

生成第二语音信号，所述第二语音信号是指对所述下行语音信号进行时延处理后，得到的与所述第一语音信号具有相同时延的语音信号；

在相同的输出时间，分别通过所述第一发声组件输出所述第二语音信号，以及通过所述第二发声组件输出所述第一语音信号。
根据权利要求1所述的方法，其特征在于，所述生成第一语音信号，包括：

生成第一功率谱密度，所述第一功率谱密度是指根据所述下行语音信号计算得到的功率谱密度；

根据所述第一功率谱密度生成所述第一语音信号。
根据权利要求2所述的方法，其特征在于，所述根据所述第一功率谱密度生成所述第一语音信号，包括：

根据所述第一功率谱密度生成掩蔽信号和粉噪信号；

调整所述掩蔽信号和所述粉噪信号至相同时延；

根据调整至相同时延的所述掩蔽信号和所述粉噪信号，生成所述第一语音信号。
根据权利要求3所述的方法，其特征在于，所述根据所述第一功率谱密度生成掩蔽信号，包括：

根据所述第一功率谱密度，确定第一平均功率，所述第一平均功率是指所述第一功率谱密度对应的所有频点的功率谱密度值的平均值；

确定第一频点，所述第一频点是指所述第一功率谱密度对应的所有频点中，对应功率谱密度值大于所述第一平均功率的频点；

根据所述第一频点生成所述掩蔽信号。
根据权利要求4所述的方法，其特征在于，所述根据所述第一频点生成所述掩蔽信号，包括：

如果所述第一频点的数量为多个，且所有所述第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差小于第一预设频率阈值，则按照对应功率谱密度值由大至小的顺序，在所有所述第一频点中选出第一预设数量的第一频点，确定为第二频点；

确定第三频点，所述第三频点位于相邻两个所述第二频点之间；

根据预设人耳掩蔽效应曲线，确定所述第三频点对应的幅值，所述幅值用于表征信号的强弱；

根据所述第三频点的频率值和所述第三频点对应的幅值，生成所述掩蔽信号。
根据权利要求4所述的方法，其特征在于，所述根据所述第一频点生成所述掩蔽信号，包括：

如果所述第一频点的数量为多个，且所有所述第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差大于等于第一预设频率阈值，则在所有所述第一频点中选出对应功率谱密度值最大的第一频点、频率值最大的第一频点和频率值最小的第一频点，确定为第四频点；

在各所述第四频点附近，与各所述第四频点之间，频率值相差小于等于第二预设频率阈值处，分别选取一个频点，确定为第五频点；

根据预设人耳掩蔽效应曲线，确定所述第五频点对应的幅值，所述幅值用于表征信号的强弱；

根据所述第五频点的频率值和所述第五频点对应的幅值，生成所述掩蔽信号。
根据权利要求4所述的方法，其特征在于，所述根据所述第一频点生成所述掩蔽信号，包括：

如果所述第一频点的数量为多个，且所有所述第一频点中频率值最大的第一频点与频率值最小的第一频点之间，频率值相差大于等于第一预设频率阈值，则在各频点区间中，按照对应功率谱密度值由大至小的顺序，选出第二预设数量的第一频点，确定为第六频点，其中，各所述频点区间的终止频点与起始频点之间，频率值相差小于等于第三预设频率阈值，且各所述频点区间包括的第一频点的数量大于等于第三预设数量；

确定各所述频点区间对应的第七频点，所述第七频点位于相应频点区间中相邻两个所述第六频点之间；

根据预设人耳掩蔽效应曲线，确定所述第七频点对应的幅值，所述幅值用于表征信号的强弱；

根据所述第七频点的频率值和所述第七频点对应的幅值，生成所述掩蔽信号。
根据权利要求4所述的方法，其特征在于，所述根据所述第一频点生成所述掩蔽信号，包括：

如果所述第一频点的数量为一个，则在所述第一频点两侧分别选取一个频点，确定为第八频点；

根据预设人耳掩蔽效应曲线，确定所述第八频点对应的幅值，所述幅值用于表征信号的强弱；

根据所述第八频点的频率值和所述第八频点对应的幅值，生成所述掩蔽信号。
根据权利要求4所述的方法，其特征在于，所述根据所述第一频点生成所述掩蔽信号，包括：

如果所述第一频点的数量为一个，则在所述第一频点两侧分别选取一个频点，确定为第九频点；

在各所述第九频点与所述第一频点之间，分别选取一个频点，确定为第十频点；

根据预设人耳掩蔽效应曲线，确定所述第十频点对应的幅值，所述幅值用于表征信号的强弱；

根据所述第十频点的频率值和所述第十频点对应的幅值，生成所述掩蔽信号。
根据权利要求3所述的方法，其特征在于，所述根据所述第一功率谱密度生成粉噪信号，包括：

确定第二平均功率，所述第二平均功率是指所有第十一频点的功率谱密度值的平均值，所述第十一频点是指所述第一功率谱密度对应的所有频点中，功率谱密度值小于等于第一平均功率的频点，所述第一平均功率是指所述第一功率谱密度对应的所有频点的功率谱密度值的平均值；

获取所述第二平均功率对应的预设粉噪带通滤波增益；

调整第一带通滤波器的增益为所述预设粉噪带通滤波增益；

通过增益调整后的所述第一带通滤波器对粉噪信号源输出的信号进行带通滤波，生成所述粉噪信号。
根据权利要求2所述的方法，其特征在于，所述根据所述第一功率谱密度生成所述第一语音信号，包括：

根据所述第一功率谱密度，确定第一平均功率，所述第一平均功率是指所述第一功率谱密度对应的所有频点的功率谱密度值的平均值；

确定第十二频点，所述第十二频点是指所述第一功率谱密度对应的所有频点中，对应功率谱密度值大于所述第一平均功率的频点；

按照对应功率谱密度值由大至小的顺序，在所有所述第十二频点中选出第四预设数量的第十二频点，确定为第十三频点；

根据所述第十三频点，生成陷波滤波器，所述陷波滤波器的陷波频率包括所述第十三频点的频率值；

通过所述陷波滤波器对粉噪信号源输出的信号进行陷波滤波，生成所述第一语音信号。
根据权利要求2所述的方法，其特征在于，所述生成第一功率谱密度，包括：

通过第二带通滤波器对所述下行语音信号进行带通滤波，得到第一带宽范围内的第一信号；所述第一带宽为所述第二带通滤波器的带宽；

计算所述第一信号的功率谱密度；

确定所述第一信号的功率谱密度为所述第一功率谱密度。
根据权利要求1至12中任意一项所述的方法，其特征在于，所述电子设备还包括第三发声组件，所述第三发声组件设置于靠近所述第一位置的第三位置，所述方法还包括：

生成第三语音信号，所述第三语音信号是指对所述下行语音信号进行时延处理后，得到的与所述第一语音信号具有相同时延的语音信号；

在所述相同的输出时间，通过所述第三发声组件输出所述第三语音信号。
一种电子设备，其特征在于，所述电子设备包括第一发声组件和第二发声组件，所述第一发声组件设置于所述电子设备的第一位置，用户手持所述电子设备通话时，所述第一位置靠近所述用户的耳朵，所述第二发声组件设置于与所述第一位置不同的第二位置，所述电子设备还包括存储器和处理器，所述存储器和所述处理器耦合；所述存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令，当所述处理器执行所述计算机指令时，使所述电子设备执行如权利要求1-13中任一项所述的方法。
一种计算机存储介质，其特征在于，所述计算机存储介质中存储有计算机程序或指令，当所述计算机程序或指令被执行时，如权利要求1-13中任一项所述的方法被执行。