WO2013170802A1

WO2013170802A1 - 一种提高移动终端通话音质的方法及装置

Info

Publication number: WO2013170802A1
Application number: PCT/CN2013/077711
Authority: WO
Inventors: 胡楠
Original assignee: 中兴通讯股份有限公司
Priority date: 2012-10-09
Filing date: 2013-06-21
Publication date: 2013-11-21
Also published as: CN103716446A; CN103716446B

Abstract

本发明公开了一种提高移动终端通话音质的方法及装置，该方法包括：获取利用移动终端进行通话的用户的人嘴位置信息；根据所述人嘴位置信息，获取双麦克或多麦克的收音区域；判断所述收音区域是否超出了所述移动终端预先设置的默认收音区域，如果是，则将所述收音区域调整为通话的收音区域；否则，以所述默认收音区域作为通话的收音区域。本发明通过检查人嘴的位置，进而调整麦克的收音区域，提高了移动终端的通话质量，而且能避开外放的下行声音区域，且可改善免提通话的回声消除的效果。

Description

一种提高移动终端通话音质的方法及装置技术领域

本发明涉及移动通讯技术领域，特别是涉及一种提高移动终端通话音质的方法及装置。背景技术

随着移动终端产品消费量的增大，尤其是智能机和平板电脑的迅猛发展，无论是使用移动网络还是 WiFi ( Wireless Fidelity, 无线保真）网络，用户可以随时随地的使用移动终端和他人进行通话。同时，用户对其通话音质的要求也越来越高。

为了满足用户在嘈杂的环境下正常通话的需要，双麦克已经变成了他、移动终端设备的标准配置。单麦克的移动终端设备在噪声消除方面都是釆用稳态噪声估计方式，只能对平稳的噪声，例如风声，有较好的抑制，但是双麦克的移动终端釆用了空间滤波的方式，可以将声音集中在某一个区域，这样可以最大限度的减少噪声和回声。

正是这种区域性，导致了双麦克降噪方案要求人嘴说话的位置非常严格，相应技术只能应用于移动终端的手持通话模式，对于应用场景更加广泛的免提和三段式耳机通话效果却非常差，所述三段式耳机本身没有麦克设备，通话只能釆用移动终端固有麦克来接收声音。尤其是当前 WiFi功能在智能移动终端的应用， VOIP ( Voice on Internet Protocol )技术的广泛釆用，这种免提和三段式耳机通话的应用越来越广泛，但相关的技术却没有得到改善，成为了瓶颈。发明内容

本发明实施例要解决的技术问题是一种提高移动终端通话音质的方法及装置，用以解决现有技术中人嘴位置改变带来的通话质量下降的问题。

为解决上述技术问题，一方面，本发明实施例提供一种提高移动终端通话音质的方法，该方法包括：

获取利用移动终端进行通话的用户的人嘴位置信息；

根据所述人嘴位置信息，获取双麦克或多麦克的收音区域；

判断所述收音区域是否超出了所述移动终端预先设置的默认收音区域，如果是，则将所述收音区域调整为通话的收音区域；如果否，则以所述默认收音区域作为通话的收音区域。

其中，所述获取用户的人嘴位置信息，为：利用所述移动终端的摄像头釆集所述人脸位置信息，根据所述人脸位置信息，获取所述人嘴位置信息。

其中，当所述摄像头釆集的是单张人脸位置信息时，所述通话的收音区域的确定方法为：判断所述单张人脸是否为预设在移动终端中追踪的人脸，如果是，则根据所述单张人脸对应的人嘴位置信息，获取双麦克或多麦克的收音区域；如果否，则将单麦克收集的所有收音区域作为通话的收音区域。

其中，当所述摄像头釆集的是多张人脸位置信息时，所述通话的收音区域的确定方法为：将整体收音区域调整为通话的收音区域，或将单麦克收集的所有收音区域作为通话的收音区域；其中，所述整体收音区域包括多张人脸中的每个人嘴位置信息对应的收音区域。

其中，所述人嘴位置信息包括人嘴相对于移动终端的方向和距离。另一方面，本发明实施例还提供一种提高移动终端通话音质的装置，该装置包括：人嘴位置信息获取单元，配置为获取利用移动终端进行通话的用户的人嘴位置信息；

收音区域获取单元，配置为根据所述人嘴位置信息，获取双麦克或多麦克的收音区域；

处理单元，配置为判断所述收音区域是否超出了所述移动终端预先设置的默认收音区域，如果是，则将所述收音区域调整为通话的收音区域；如果否，则以所述默认收音区域作为通话的收音区域。

其中，所述人嘴位置信息获取单元，配置为利用所述移动终端的摄像头釆集所述人脸位置信息，根据所述人脸位置信息，获取所述人嘴位置信息。

其中，当所述摄像头釆集的是单张人脸位置信息时，所述处理单元，配置为判断所述单张人脸是否为预设在移动终端中追踪的人脸，如果是，则根据所述单张人脸对应的人嘴位置信息，获取双麦克或多麦克的收音区域；如果否，则将单麦克收集的所有收音区域作为通话的收音区域。

其中，当所述摄像头釆集的是多张人脸位置信息时，所述处理单元，配置为将整体收音区域调整为通话的收音区域，或将单麦克收集的所有收音区域作为通话的收音区域；其中，所述整体收音区域包括多张人脸中的每个人嘴位置信息对应的收音区域。

其中，所述人嘴位置信息包括人嘴相对于移动终端的方向和距离。本发明实施例的有益效果如下：

本发明实施例通过检查人嘴的位置，进而调整麦克的收音区域，提高了移动终端的通话质量，而且能够避开外放的下行声音区域，能够改善免提通话的回声消除的效果。附图说明

图 1 是本发明实施例中移动终端（手机）双麦克调整收音区域的效果示意图；

图 2 是本发明实施例中一种提高移动终端通话音质的方法的流程图；图 3 是本发明实施例中一种提高移动终端通话音质的装置的结构示意图。具体实施方式

以下结合附图以及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不限定本发明。

如图 1 所示，本领域中，移动终端，例如：手机利用收音麦克和降噪麦克进行通话时，通过改变降噪参数，利用不同的降噪算法就可以实现对收音区域的调整，例如：从收音区域 A调整到收音区域因此，本发明利用该原理，通过追踪通话者的人嘴位置，实时调整收音区域，进而达到提高通话音质的目的。

如图 2所示，本发明实施例涉及一种提高移动终端通话音质的方法，包括：

步骤 S201 , 获取利用移动终端进行通话的用户的人嘴位置信息；本步骤中，可以利用移动终端的摄像头釆集通话者的人脸位置信息，利用人脸识别技术来识别人嘴的位置，对人嘴进行实时的跟踪。人脸识别技术在智能移动终端上已经得到了广泛的应用，比如安卓（android ) 系统已经在 4.0版本上集成了此项功能。在实际操作中，可以但并不限于仅仅使用移动终端前端摄像头，如果移动终端有后端摄像头的话，也可以开启使用，这样检测区域的角度就可以从 180度扩展到 360度。但后端摄像头像素通常较高，利用后端摄像头进行釆集会更耗电。

另外，也可以通过其它技术获取通话者的人嘴位置信息，例如：利用语音识别技术对通话者进行识别，利用音频测距技术确定通话者的人嘴相对于移动终端的方位和距离。本发明主要是需要获取通话者的人嘴相对于移动终端的方位和距离，至于获取的手段和方式则不需限定。

步骤 S202 ,根据所述人嘴位置信息，获取双麦克或多麦克的收音区域；本步骤中，就是根据获取通话者的人嘴相对于移动终端的方位和距离，利用各种不同的降噪算法，计算移动终端的收音区域。目前，利用双麦克进行降噪的移动终端很多，各种降噪算法也各不相同，本发明不限定具体的降噪算法，对于各种降噪算法，只要利用通话者的人嘴位置信息，可以确定出新的收音区域，就适用本发明。

另外，目前一些移动终端出现了利用多麦克，例如三麦克，来确定收音区域，收音效果更好，移动终端利用三麦克从三维的角度确定一个更加精确的收音区域。但是，目前没有移动终端对收音区域进行调整，因此，本发明在其利用三麦克进行降噪的基础上，通过追踪通话者人嘴的位置来调整收音区域，进而提高通话音质。

本实施例中的收音区域，是指移动终端通过降噪计算确定的釆集通话者语音信息的区域，可以是通过双麦克降噪算法确定的区域，也可以是单麦克或多麦克确定的区域。

步骤 S203 , 判断所述收音区域是否超出了所述移动终端预先设置的默认收音区域，如果是，则将所述收音区域调整为通话的收音区域；如果否，则以所述默认收音区域作为通话的收音区域。

移动终端在出厂时都设置有默认的收音区域，默认收音区域是按照正常情况下多数通话人脸所处位置进行设定的，默认收音区域设定需要前期音频调试人员通过大量测试或仿真进行确定。另外，当收音区域调整后，调整后的收音区域就是作为下一次进行收音区域调整的默认收音区域，这样，就可以保证连续实时的调整收音区域；当然，也可以每次都用根据通话者人嘴确定的收音区域和出厂时默认的收音区域进行比较。

移动终端判断时，可以判断根据通话者人嘴确定的收音区域超出默认收音区域的范围是不是超过了预先设定的区域差别阔值，如果是，则进行收音区域调整，如果否，则保持现有的收音区域为通话的收音区域。

另外，步骤 S201中，摄像头釆集的可能是单张人脸位置信息，此种情况时，移动终端可以追踪任意一张在釆集区域内的人脸，直接按照步骤

S202、 S203进行处理；也可以进行人脸识别，来区分是否追踪一张固定人脸，例如移动终端机主的人脸,；当预先设置的是追踪一张固定人脸，并且预先设置了要追踪的人脸信息，则判断摄像头釆集的单张人脸是否为预设在移动终端中追踪的人脸，如果是，则根据摄像头釆集的单张人脸对应的人嘴位置信息，获取双麦克或多麦克的收音区域；如果否，则将单麦克收集的所有收音区域作为通话的收音区域。

步骤 S201中，摄像头釆集的也可能是多张人脸位置信息，此种情况时，应该将收音区域调整的更广阔一些，尽量将所有的人嘴对应的收音区域都包含在内，最差的效果是釆用单麦克进行釆音，即：则将整体收音区域调整为通话的收音区域，或将单麦克收集的所有收音区域作为通话的收音区域；其中，整体收音区域包括多张人脸中的每个人嘴位置信息对应的收音区域。

步骤 S201中，还可以检测通话者的人脸移动速度，当通话者的人脸移动速度超过预先设定的速度阈值时，将无法釆集通话者的人嘴位置信息，或无法完成收音区域的调整操作，这时，可以将收音区域调整的更加广泛，例如：将移动终端支持的最大收音区域作为通话的收音区域，或者釆用单麦克进行降噪，将单麦克收集的所有收音区域作为通话的收音区域。当通话者的人脸移动速度没有超过（包括该阔值）预先设定的速度阔值时，则按照步骤 S202、 S203进行处理。

另外，如图 3 所示，本发明还涉及一种实现上述方法的提高移动终端通话音质的装置，包括：人嘴位置信息获取单元 301 ,用于获取利用移动终端进行通话的用户的人嘴位置信息；

收音区域获取单元 302 , 用于根据人嘴位置信息，获取双麦克或多麦克的收音区域；

处理单元 303 ,用于判断收音区域是否超出了移动终端预先设置的默认收音区域，如果是，则将收音区域调整为通话的收音区域；如果否，则以默认收音区域作为通话的收音区域。

人嘴位置信息获取单元 301利用移动终端的摄像头釆集人脸位置信息，根据人脸位置信息，获取人嘴位置信息；

其中，人嘴位置信息包括人嘴相对于移动终端的方向和距离。

当摄像头釆集的是单张人脸位置信息时，处理单元 303 判断单张人脸是否为预设在移动终端中追踪的人脸，如果是，则根据单张人脸对应的人嘴位置信息，获取双麦克或多麦克的收音区域；如果否，则将单麦克收集的所有收音区域作为通话的收音区域。

当摄像头釆集的是多张人脸位置信息时，处理单元 303 将整体收音区域调整为通话的收音区域，或将单麦克收集的所有收音区域作为通话的收音区域；其中，整体收音区域包括多张人脸中的每个人嘴位置信息对应的收音区域。

本发明实施例是将移动终端模拟为人说话的处理方式，将双麦克模拟双耳，摄像头模拟眼睛，将 "听" 和 "看" 结合起来，通过 "看" 判断出有效音源和噪声音源的位置，实时调整 "听" 的参数，这样就可以有效的提高音频音质。具体实现就是利用目前智能机或者平板电脑本身带有的设备，即：双麦克和摄像头，结合人脸识别技术（目前绝大多数智能平台都是支持人脸识别技术 ), 根据人脸鉴别出人嘴相对于移动终端的位置变化情况，设置新的双麦克捕获声音的区域，从而保证人在通话过程中的音质。本发明对免提和三段式耳机通话的音效都有较大的提升，所述三段式耳机本身没有麦克设备，通话只能釆用移动终端固有麦克来接收声音。由此可见，本发明通过检查人嘴的位置，进而调整麦克的收音区域，提高了移动终端的通话质量，而且能够避开外放的下行声音区域，能够改善免提通话的回声消除。

尽管为示例目的，已经公开了本发明的优选实施例，本领域的技术人员将意识到各种改进、增加和取代也是可能的，因此，本发明的范围应当不限于上述实施例。工业实用性

本发明实施例通过获取用户的人嘴位置信息，并获取麦克的收音区域，确定所述收音区域超出了所述移动终端预先设置的默认收音区域，则将所述收音区域调整为通话的收音区域；否则，以所述默认收音区域作为通话的收音区域。因此，可提高移动终端的通话质量，而且能够避开外放的下行声音区域，能够改善免提通话的回声消除的效果。

Claims

权利要求书

1、一种提高移动终端通话音质的方法，该方法包括：

获取利用移动终端进行通话的用户的人嘴位置信息；

根据所述人嘴位置信息，获取双麦克或多麦克的收音区域；

判断所述收音区域是否超出了所述移动终端预先设置的默认收音区域，如果是，则将所述收音区域调整为通话的收音区域；否则，以所述默认收音区域作为通话的收音区域。

2、如权利要求 1所述的提高移动终端通话音质的方法，其中，所述获取用户的人嘴位置信息，为：

利用所述移动终端的摄像头釆集所述人脸位置信息，根据所述人脸位置信息，获取所述人嘴位置信息。

3、如权利要求 2所述的提高移动终端通话音质的方法，其中，当所述摄像头釆集的是单张人脸位置信息时，所述通话的收音区域的确定方法为：判断所述单张人脸是否为预设在移动终端中追踪的人脸，如果是，则根据所述单张人脸对应的人嘴位置信息，获取双麦克或多麦克的收音区域；否则，将单麦克收集的所有收音区域作为通话的收音区域。

4、如权利要求 2所述的提高移动终端通话音质的方法，其中，当所述摄像头釆集的是多张人脸位置信息时，所述通话的收音区域的确定方法为：将整体收音区域调整为通话的收音区域，或将单麦克收集的所有收音区域作为通话的收音区域；其中，所述整体收音区域包括多张人脸中的每个人嘴位置信息对应的收音区域。

5、如权利要求 1~4中任一项所述的提高移动终端通话音质的方法，其中，

所述人嘴位置信息，包括人嘴相对于移动终端的方向和距离。

6、一种提高移动终端通话音质的装置，该装置包括：人嘴位置信息获取单元，配置为获取利用移动终端进行通话的用户的人嘴位置信息；

处理单元，配置为判断所述收音区域是否超出了所述移动终端预先设置的默认收音区域，如果是，则将所述收音区域调整为通话的收音区域；否则，以所述默认收音区域作为通话的收音区域。

7、如权利要求 6所述的提高移动终端通话音质的装置，其中，所述人嘴位置信息获取单元，配置为利用所述移动终端的摄像头釆集所述人脸位置信息，根据所述人脸位置信息，获取所述人嘴位置信息。

8、如权利要求 7所述的提高移动终端通话音质的装置，其中，当所述摄像头釆集的是单张人脸位置信息时，

所述处理单元，配置为判断所述单张人脸是否为预设在移动终端中追踪的人脸，如果是，则根据所述单张人脸对应的人嘴位置信息，获取双麦克或多麦克的收音区域；如果否，则将单麦克收集的所有收音区域作为通话的收音区域。

9、如权利要求 7所述的提高移动终端通话音质的装置，其中，当所述摄像头釆集的是多张人脸位置信息时，

所述处理单元，配置为将整体收音区域调整为通话的收音区域，或将单麦克收集的所有收音区域作为通话的收音区域；其中，所述整体收音区域包括多张人脸中的每个人嘴位置信息对应的收音区域。

10、如权利要求 6~9 中任一项所述的提高移动终端通话音质的装置，其中，所述人嘴位置信息，包括人嘴相对于移动终端的方向和距离。