CN114040319A

CN114040319A - 一种终端设备外放音质优化方法、装置、设备和介质

Info

Publication number: CN114040319A
Application number: CN202111359054.3A
Authority: CN
Inventors: 段秀华; 刘忠正
Original assignee: Hisense Mobile Communications Technology Co Ltd
Current assignee: Hisense Mobile Communications Technology Co Ltd
Priority date: 2021-11-17
Filing date: 2021-11-17
Publication date: 2022-02-11
Anticipated expiration: 2041-11-17
Also published as: CN114040319B

Abstract

本申请公开了一种终端设备外放音质优化方法、装置、设备和介质，由于该方法中获取当前声场环境的第一图像，根据第一图像、以及预先保存的每个声场环境的声场信息对应的模板图像，确定满足图像相似度要求的目标模板图像对应的目标声场信息，将目标声场信息确定为当前声场环境的声场信息；根据目标声场信息与预先保存的调试环境的基准声场信息的第一差值、以及预先保存的混响算法参数与声场信息的函数关系，确定混响算法参数的调整值，并根据调整值对终端设备扬声器的混响算法参数进行调整，由于可以根据当前所处声场环境的声场信息的不同，对终端设备扬声器的混响算法参数进行调整，从而保证了声音外放的音质。

Description

一种终端设备外放音质优化方法、装置、设备和介质

技术领域

本申请涉及外放音质优化技术领域，尤其涉及一种终端设备外放音质优化方法、装置、设备和介质。

背景技术

手机平板等终端设备类产品的对消费者体验影响最大的有两个方面，一个是画面，还有一个是声音。画面的好坏主要与终端类产品的屏幕相关，随着技术的发展，手机屏幕早已不是短板。而声音的音质尤其是外放音质的好坏则是需要提高的方向。

声音的外放音质的好坏最少需要三个硬性的物理指标，分别是频响范围，响应时间和混响空间。对于频响范围以及响应时间，随着终端设备上超线性扬声器以及智能功率放大器(smart power amplifier，smart PA)的广泛普及和应用，使得在更小的扬声器体积里，实现比之前更宽阔的频响范围和更好的动态效果。

而为了优化外放音质的混响空间，现有技术中存在两种方案，一种是利用虚拟声场算法的应用优化混响空间，比如杜比全景声，具体是利用头相关传递函数算法，建立虚拟声场，使听音者能明显感知声音的方向和空间感。但是该方案只能针对特定的片源有明显改善，例如3D电影音效，而针对普通场景时则表现一般。另一种方案则是提前预设一些声音外放的使用场景，例如听音乐、看电视或者游戏等场景，根据这些不同声音外放时的使用场景的特点，在普通听音乐的基础上增强混响或者加强动态、低频类效果。因此，现有技术中实际上只能针对一些固定场景下，优化声音外放的音质。

而在不同的声场环境中，由于声反射和衰减不同，导致扬声器声音外放时的音质相比在调试环境时的音质变差，因此，现有技术中终端设备扬声器在不同声场环境下声音外放的鲁棒性较差，无法保证声音外放的音质。

发明内容

本申请提供了一种终端设备外放音质优化方法、装置、设备和介质，用以解决现有技术中无法保证声音外放音质的问题。

第一方面，本申请提供了一种终端设备外放音质优化方法，所述方法包括：

获取当前声场环境的第一图像；

根据所述第一图像、以及预先保存的每个声场环境的声场信息对应的模板图像，确定满足图像相似度要求的目标模板图像对应的目标声场信息，将所述目标声场信息确定为所述当前声场环境的声场信息；

根据所述目标声场信息与预先保存的调试环境的基准声场信息的第一差值、以及预先保存的混响算法参数与声场信息的函数关系，确定所述混响算法参数的调整值，并根据所述调整值对终端设备扬声器的混响算法参数进行调整。

进一步地，所述方法还包括：

根据预先保存的每个声场环境的声场信息与扬声器模式的对应关系、以及所述目标声场信息，确定所述目标声场信息对应的目标扬声器模式；

根据所述目标扬声器模式，控制所述终端设备扬声器以所述目标扬声器模式工作。

进一步地，所述方法还包括：

获取声源与听音者的第一距离；

根据所述第一距离对应的目标头相关传递函数，确定通过滤波器将所述目标头相关传递函数转换为基准头相关传递函数时的滤波器函数，根据所述滤波器函数对所述当前声场环境对应的频率响应曲线进行调整。

进一步地，所述终端设备扬声器的扬声器模式包括单扬声器模式、双扬声器模式和四扬声器模式，所述获取声源与听音者的第一距离包括：

若所述扬声器模式为所述单扬声器模式，获取终端设备与听音者的距离并确定为声源与所述听音者的第一距离；或

若所述扬声器模式非所述单扬声器模式，获取终端设备与听音者的距离，并采集包含所述听音者的第二图像，根据所述听音者在所述第二图像的第一位置，确定将所述第一位置投影到所述终端设备屏幕上的第二位置，根据所述第二位置以及所述终端设备每个扬声器的第三位置，确定所述第二位置与每个所述第三位置的第二距离，根据每个所述第二距离以及所述终端设备与所述听音者的距离，确定所述终端设备每个扬声器与所述听音者的第三距离，将每个所述第三距离组成的距离向量确定为声源与所述听音者的第一距离。

进一步地，所述声场信息包括背景噪声的分贝值，所述方法还包括：

根据所述第一距离与预先保存的基准距离的第二差值、以及预先保存的响度调整值与距离差值的对应关系，确定所述第二差值对应的第一响度调整值；

根据所述目标声场信息中背景噪声的第一分贝值与所述基准声场信息的背景噪声的第二分贝值的第三差值、以及预先保存的响度调整值与背景噪声的分贝值差值的对应关系，确定所述第三差值对应的第二响度调整值；

根据所述第一响度调整值和所述第二响度调整值中最大值对所述终端设备扬声器的响度进行调整。

进一步地，所述根据所述第一图像、以及预先保存的每个声场环境的声场信息对应的模板图像，确定满足图像相似度要求的目标模板图像对应的目标声场信息包括：

获取所述当前声场环境的第一位置；

根据所述第一图像和所述第一位置、以及预先保存的每个声场环境的声场信息对应的模板图像和基准位置，确定同时满足图像相似度要求和位置距离要求时对应的目标声场信息。

第二方面，本申请提供了一种终端设备外放音质优化装置，所述装置包括：

获取模块，用于获取当前声场环境的第一图像；

确定模块，用于根据所述第一图像、以及预先保存的每个声场环境的声场信息对应的模板图像，确定满足图像相似度要求的目标模板图像对应的目标声场信息，将所述目标声场信息确定为所述当前声场环境的声场信息；

调整模块，用于根据所述目标声场信息与预先保存的调试环境的基准声场信息的第一差值、以及预先保存的混响算法参数与声场信息的函数关系，确定所述混响算法参数的调整值，并根据所述调整值对终端设备扬声器的混响算法参数进行调整。

进一步地，所述确定模块，还用于根据预先保存的每个声场环境的声场信息与扬声器模式的对应关系、以及所述目标声场信息，确定所述目标声场信息对应的目标扬声器模式；

所述装置还包括：

控制模块，用于根据所述目标扬声器模式，控制所述终端设备扬声器以所述目标扬声器模式工作。

进一步地，所述获取模块，还用于获取声源与听音者的第一距离；

所述调整模块，还用于根据所述第一距离对应的目标头相关传递函数，确定通过滤波器将所述目标头相关传递函数转换为基准头相关传递函数时的滤波器函数，根据所述滤波器函数对所述当前声场环境对应的频率响应曲线进行调整。

进一步地，所述终端设备扬声器的扬声器模式包括单扬声器模式、双扬声器模式和四扬声器模式，所述获取模块，具体用于若所述扬声器模式为所述单扬声器模式，获取终端设备与听音者的距离并确定为声源与所述听音者的第一距离；或若所述扬声器模式非所述单扬声器模式，获取终端设备与听音者的距离，并采集包含所述听音者的第二图像，根据所述听音者在所述第二图像的第一位置，确定将所述第一位置投影到所述终端设备屏幕上的第二位置，根据所述第二位置以及所述终端设备每个扬声器的第三位置，确定所述第二位置与每个所述第三位置的第二距离，根据每个所述第二距离以及所述终端设备与所述听音者的距离，确定所述终端设备每个扬声器与所述听音者的第三距离，将每个所述第三距离组成的距离向量确定为声源与所述听音者的第一距离。

进一步地，所述声场信息包括背景噪声的分贝值，所述确定模块，具体用于根据所述第一距离与预先保存的基准距离的第二差值、以及预先保存的响度调整值与距离差值的对应关系，确定所述第二差值对应的第一响度调整值；根据所述目标声场信息中背景噪声的第一分贝值与所述基准声场信息的背景噪声的第二分贝值的第三差值、以及预先保存的响度调整值与背景噪声的分贝值差值的对应关系，确定所述第三差值对应的第二响度调整值；根据所述第一响度调整值和所述第二响度调整值中最大值对所述终端设备扬声器的响度进行调整。

进一步地，所述确定模块，具体还用于获取所述当前声场环境的第一位置；根据所述第一图像和所述第一位置、以及预先保存的每个声场环境的声场信息对应的模板图像和基准位置，确定同时满足图像相似度要求和位置距离要求时对应的目标声场信息。

第三方面，本申请提供了一种终端设备，包括：处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

所述存储器中存储有计算机程序，当所述程序被所述处理器执行时，使得所述处理器执行时实现上述终端设备外放音质优化方法中任一所述方法的步骤。

第四方面，本申请提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现上述终端设备外放音质优化方法中任一所述方法的步骤。

本申请提供了一种终端设备外放音质优化方法、装置、设备和介质，由于该方法中获取当前声场环境的第一图像，根据所述第一图像、以及预先保存的每个声场环境的声场信息对应的模板图像，确定满足图像相似度要求的目标模板图像对应的目标声场信息，将所述目标声场信息确定为所述当前声场环境的声场信息；根据所述目标声场信息与预先保存的调试环境的基准声场信息的第一差值、以及预先保存的混响算法参数与声场信息的函数关系，确定所述混响算法参数的调整值，并根据所述调整值对终端设备扬声器的混响算法参数进行调整，由于可以根据当前所处声场环境的声场信息的不同，对终端设备扬声器的混响算法参数进行调整，从而提高了终端设备扬声器在不同声场环境下声音外放的鲁棒性，保证了声音外放的音质。

附图说明

为了更清楚地说明本申请中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请提供的一种终端设备外放音质优化方法的过程示意图；

图2为本申请提供的一种头相关传递函数转化的示意图；

图3为本申请提供的一种扬声器模式非所述单扬声器模式时，确定出声源与听音者的第一距离的示意图；

图4为本申请提供的一种基准距离的示意图；

图5为本身请提供的一种终端设备外放音质优化方法的流程示意图；

图6为本申请提供的一种基于声场信息的不同调整终端设备扬声器的播放参数的示意图；

图7为本申请提供的一种终端设备外放音质优化装置的结构示意图；

图8为本申请提供的一种终端设备结构示意图；

图9中示出了根据实施例中终端设备900的硬件配置框图；

图10是本申请的终端设备900的软件结构框图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

为了保证声音外放的音质，本申请提供了一种终端设备外放音质优化方法、装置、设备和介质。

图1为本申请提供的一种终端设备外放音质优化方法的过程示意图，该过程包括以下步骤：

S101：获取当前声场环境的第一图像。

本申请提供的一种终端设备外放音质优化方法应用于终端设备自身，其中该终端设备可以是智能手机和平板电脑等。

为了提高终端设备在不同声场环境下声音外放时的鲁棒性，该终端设备获取当前声场环境的第一图像，其中该终端设备包括有后置摄像头，通过该后置摄像头，采集终端设备自身当前所在声场环境的第一图像。

S102：根据所述第一图像、以及预先保存的每个声场环境的声场信息对应的模板图像，确定满足图像相似度要求的目标模板图像对应的目标声场信息，将所述目标声场信息确定为所述当前声场环境的声场信息。

由于当前终端设备扬声器声音外放时的相关参数均值在调试环境中得到的最佳参数，而在当前声场环境下，在调试环境下的最佳参数并不能在当前声场环境中使得声音外放时的音质最佳，为了保证在当前声场环境终端设备扬声器的外放音质，该终端设备在获取到第一图像后，首先根据该第一图像确定出当前声场环境的声场信息，根据当前声场环境的声场信息对终端设备扬声器声音外放时的相关参数进行调整。

其中，该声场信息包括混响时间、吸声系数和声场环境面积，混响时间是指声源停止发声后声压级减少60db所需要的时间，吸声系数是指被材料吸收的声能与入射到材料的总声能的比值，声场环境面积是指当前声场环境的面积，若当前声场环境为密闭场所，则声场环境面积即为密闭场所的面积，若当前声场环境为开放场所，则声场环境面积即为无穷。

为了确定出当前声场环境的声场信息，在本申请中，预先保存有每个声场环境的声场信息对应的模板图像，根据获取的第一图像，将第一图像与每个模板图像进行匹配，确定第一图像与每个模板图像的图像相似度，将图像相似度最高的模板图像确定为目标模板图像，确定出目标模板图像对应的目标声场信息，将目标声场信息确定为当前声场环境的声场信息。

S103：根据所述目标声场信息与预先保存的调试环境的基准声场信息的第一差值、以及预先保存的混响算法参数与声场信息的函数关系，确定所述混响算法参数的调整值，并根据所述调整值对终端设备扬声器的混响算法参数进行调整。

该终端设备预先保存有调试环境的基准声场信息，其中该基准声场信息F₀可以用混响时间T₀、吸声系数a₀以及声场环境面积S₀等参量进行描述，在本申请中，该调试环境为标准的听音室声场环境时，对应的基准声场信息F₀＝(T₀，a₀，S₀)＝(0.5，0.5，25)。

根据该基准声场信息以及确定出的当前声场环境的目标声场信息，确定出目标声场信息中每个信息与基准声场信息中对应的信息的第一差值。具体的，根据目标声场信息中的第一混响时间和基准声场信息中的第二混响时间，确定出第一混响时间和第二混响时间的差值；根据目标声场信息的第一吸声系数和基准声场信息的第二吸声系数，确定出第一吸声系数和第二吸声系数的差值；根据目标声场信息的第一声场环境面积和基准声场信息的第二声场环境面积，确定第一声场环境面积与第二声场环境面积的差值。

以当前声场环境为空旷的室外环境为例，当前声场环境对应的目标声场信息F₁＝(T₁，a₁，S₁)＝(∞，0，∞)，目标声场信息中的每个信息与基准声场信息中对应的信息的第一差值为(∞，-0.5，∞)。

为了保证终端设备的外放音质，在本申请中预先保存有混响算法参数与声场信息的函数关系，根据该函数关系以及确定出的第一差值，将第一差值代入该函数关系，确定出混响算法参数的调整值，根据该调整值对终端设备扬声器的混响算法参数进行调整。

由于在本申请中获取当前声场环境的第一图像，根据所述第一图像、以及预先保存的每个声场环境的声场信息对应的模板图像，确定满足图像相似度要求的目标模板图像对应的目标声场信息，将所述目标声场信息确定为所述当前声场环境的声场信息；根据所述目标声场信息与预先保存的调试环境的基准声场信息的第一差值、以及预先保存的混响算法参数与声场信息的函数关系，确定所述混响算法参数的调整值，并根据所述调整值对终端设备扬声器的混响算法参数进行调整，由于可以根据当前所处声场环境的声场信息的不同，对终端设备扬声器的混响算法参数进行调整，从而提高了终端设备扬声器在不同声场环境下声音外放的鲁棒性，保证了声音外放的音质。

为了保证终端设备扬声器的外放音质，在上述实施例的基础上，在本申请中，所述方法还包括：

在本申请中，该终端设备可能是有一个扬声器、也可能是有两个扬声器，还可以是有四个扬声器，因此该终端设备扬声器的扬声器模式包括有单扬声器模式、双扬声器模式和四扬声器模式。在不同的声场环境下，需要与声场环境相适配的扬声器模式才能保证终端设备扬声器的外放音质。例如声场环境为密闭环境时，与密闭环境相适配的扬声器模式为双扬声器模式，在声场环境为开放环境时，与开放环境相适配的扬声器模式为四扬声器模式。

为了保证终端设备扬声器的外放音质，该终端设备还保存有每个声场环境的声场信息与扬声器模式的对应关系，根据当前声场环境的目标声场信息，确定目标声场信息对应的目标扬声器模式，根据目标扬声器模式，控制终端设备扬声器以目标扬声器模式工作。

为了保证终端设备扬声器的外放音质，在上述各实施例的基础上，在本申请中，所述方法还包括：

获取声源与听音者的第一距离；

在本申请中，终端设备扬声器声音外放时的头相关传递函数是随着当前声场环境的变化而变化，由于声音外放时的头相关传递函数最佳的是在调试环境下的基准头相关传递函数，因此本申请中的终端设备在当前声场环境下，为了保证终端设备扬声器的外放音质，还要对终端设备扬声器的频率响应曲线进行调整，使得声音外放时的头相关传递函数保持为基准头相关传递函数。

终端设备获取声源与听音者的第一距离时，具体可以是通过距离传感器(Psensor)获取声源与听音者的第一距离，也可以是根据距离传感器获取的终端设备与听音者的距离、以及采集的包含听音者的图像，确定声源与听音者的第一距离。

根据预先保存的距离与头相关传递函数的关系，确定该第一距离对应的目标头相关传递函数，通过滤波器将目标头相关传递函数转换为基准头相关传递函数，确定出滤波器的滤波器函数。

图2为本申请提供的一种头相关传递函数转化的示意图，如图2所示，HRTF1是指第一距离对应的目标头相关传递函数，HRTF0是指调试环境下的基准头相关传递函数，将目标头相关传递函数HRTF1通过矩阵函数变换为基准头相关传递函数HRTF0。

根据该滤波器函数对当前声场环境对应的频率响应曲线进行调整，具体的，将滤波器函数与当前声场环境对应的频率响应曲线相乘，得到的乘积值作为新的目标频率响应曲线，并将当前声场环境对应的频率响应曲线更新为目标频率响应曲线。

由于声源与听音者的第一距离与声源的数量相关，为了确定出第一距离，所述终端设备扬声器的扬声器模式包括单扬声器模式、双扬声器模式和四扬声器模式，所述获取声源与听音者的第一距离包括：

若终端设备扬声器的扬声器模式为单扬声器模式，则说明终端设备只有一个声源，因此获取终端设备与听音者的距离，将该距离确定为声源与听音者的距离。具体的，在终端设备上包含有距离传感器，可以确定出终端设备与听音者的距离。

若终端设备扬声器的扬声器模式非单扬声器模式，则说明终端设备包含有多个声源，因此获取每个声源与听音者的距离，并将每个声源与听音者的距离组成距离向量确定为声源与听音者的第一距离。

为了确定出每个声源与听音者的距离，在本申请中，获取终端设备与听音者的距离，并控制终端设备的前置摄像头采集包含听音者的第二图像，根据第二图像进行人脸识别确定出第二图像中包含人脸的区域图像，可以将该区域图像的中心位置作为听音者在第二图像中的第一位置。

根据听音者在第二图像的第一位置，将该第二图像投影到终端设备屏幕上，确定第一位置投影到终端设备屏幕上的第二位置，根据第二位置以及终端设备每个扬声器的第三位置，确定出第二位置与每个第三位置的第二距离。

根据每个第二距离以及终端设备与听音者的距离，确定出终端设备每个扬声器与听音者的第三距离，具体的，针对终端设备每个扬声器，根据该扬声器对应的第二距离，确定出该第二距离的平方与终端设备与听音者的距离的平方的和值，将该和值的平方根确定为该扬声器与听音者的第三距离。

图3为本申请提供的一种扬声器模式非所述单扬声器模式时，确定出声源与听音者的第一距离的示意图，如图3所示，该终端设备包括扬声器SPK1和扬声器SPK2，图3中的虚线表示终端设备与听音者的距离，图3中的d₁₁表示扬声器SPK2与听音者的距离，图3中的d₁₂表示扬声器SPK1与听音者的距离。

为了提高终端设备扬声器的外放音质，在上述各实施例的基础上，在本申请中，所述声场信息包括背景噪声的分贝值，所述方法还包括：

为了保证终端设备扬声器的外放音质，在本申请中，声场信息还包括背景噪声的分贝值，其中背景噪声也叫底噪，是指当前声场环境中与终端设备扬声器的外放声音无关的其他声音。

根据获取到的声源与听音者的第一距离与预先保存的调试环境下的基准距离，确定第一距离与基准距离的第二差值，为了确定出当前声场环境下的响度调整值，该终端设备还保存有响度调整值与距离差值的对应关系，根据该对应关系确定出第二差值对应的第一响度调整值。

根据当前声场环境的目标声场信息中背景噪声的第一分贝值、预先保存的基准声场信息中背景噪声的第二分贝值，确定出第一分贝值与第二分贝值的第三差值，本申请中还预先保存有响度调整值与背景噪声的分贝差值的对应关系，根据该对应关系确定出第三差值对应的第二响度调整值。

根据第一响度调整值和第二响度调整值，确定出第一响度调整值和第二响度调整值中的最大值，根据该最大值对终端设备扬声器的响度进行调整。

在终端设备扬声器的扬声器模式为双扬声器模式时，图4为本申请提供的一种基准距离的示意图，如图4所示，该终端设备包括扬声器SPK1和扬声器SPK2，图4中的虚线表示终端设备与听音者的距离，图4中的d₁₁表示扬声器SPK2与听音者的距离，图4中的d₁₂表示扬声器SPK1与听音者的距离。

为了提高确定出的目标声场信息的准确度，在上述各实施例的基础上，在本申请中，所述根据所述第一图像、以及预先保存的每个声场环境的声场信息对应的模板图像，确定满足图像相似度要求的目标模板图像对应的目标声场信息包括：

获取所述当前声场环境的第一位置；

为了提高确定出的目标声场信息的准确度，在本申请中，该终端设备还获取当前声场环境的第一位置，由于当前声场环境与该终端设备为同一位置，因此该终端设备可以是将自身的GPS位置作为第一位置。

该终端设备预先保存有每个声场环境的声场信息对应的模板图像和基准位置，根据该第一图像和每个声场环境对应的每个模板图像，确定出该第一图像与每个模板图像的相似度，根据该第一位置和每个声场环境对应的每个基准位置，确定该第一位置与每个基准位置的距离。

根据第一图像与每个模板图像的相似度，确定出相似度最高的目标模板图像，根据该第一位置与每个基准位置的距离，确定出距离最小的目标基准位置，若目标模板图像和目标基准位置对应同一个声场信息，则将该声场信息确定为目标声场信息。

作为一种可能的实施方式，本申请中可以根据第一位置和每个基准位置的距离，确定出距离小于距离阈值的每个基准位置对应的待选声场环境，根据第一图像与待选声场环境对应的每个模板图像的相似度，确定出相似度最高的目标模板图像对应的目标声场信息。

作为另一种可能的实施方式，本申请中还可以根据第一图像和每个模板图像的相似度，确定出相似度大于相似度阈值的每个模板图像对应的待选声场环境，根据第一位置和待选声场环境对应的每个基准位置的距离，确定出距离最小的目标基准位置对应的目标声场信息。

下面通过一个具体的实施例对本申请的一种终端设备外放音质优化方法进行说明，终端设备包括有两个扬声器时，图5为本身请提供的一种终端设备外放音质优化方法的流程示意图，如图5所示，该方法包括以下步骤：

S501：获取当前声场环境的第一图像和第一位置。

S502：根据第一图像和第一位置、以及预先保存的每个声场环境的声场信息对应的模板图像和基准位置，确定同时满足图像相似度要求和位置距离要求时对应的目标声场信息，将目标声场信息确定为当前声场环境的声场信息。

S503：根据目标声场信息与预先保存的调试环境的基准声场信息的第一差值、以及预先保存的混响算法参数与声场信息的函数关系，确定混响算法参数的调整值，并根据调整值对终端设备扬声器的混响算法参数进行调整。

S504：根据预先保存的每个声场环境的声场信息与扬声器模式的对应关系、以及所述目标声场信息，确定所述目标声场信息对应的目标扬声器模式，根据所述目标扬声器模式，控制所述终端设备扬声器以所述目标扬声器模式工作。

S505：获取终端设备与听音者的距离，并采集包含所述听音者的第二图像，根据所述听音者在所述第二图像的第一位置，确定将所述第一位置投影到所述终端设备屏幕上的第二位置，根据所述第二位置以及所述终端设备每个扬声器的第三位置，确定所述第二位置与每个所述第三位置的第二距离，根据每个所述第二距离以及所述终端设备与所述听音者的距离，确定所述终端设备每个扬声器与所述听音者的第三距离，将每个所述第三距离组成的距离向量确定为声源与所述听音者的第一距离。

S506：根据所述第一距离对应的目标头相关传递函数，确定通过滤波器将所述目标头相关传递函数转换为基准头相关传递函数时的滤波器函数，根据所述滤波器函数对所述当前声场环境对应的频率响应曲线进行调整。

S507：根据所述第一距离与预先保存的基准距离的第二差值、以及预先保存的响度调整值与距离差值的对应关系，确定所述第二差值对应的第一响度调整值；根据所述目标声场信息中背景噪声的第一分贝值与所述基准声场信息的背景噪声的第二分贝值的第三差值、以及预先保存的响度调整值与背景噪声的分贝值差值的对应关系，确定所述第三差值对应的第二响度调整值；根据所述第一响度调整值和所述第二响度调整值中最大值对所述终端设备扬声器的响度进行调整。

图6为本申请提供的一种基于声场信息的不同调整终端设备扬声器的播放参数的示意图，如图6所示，在初始的调试环境的声场信息F₀＝(T₀，a₀，N₀，S₀，d₀，HRTF0)时，其中N₀为调试环境下背景噪声的分贝值，N₀为调试环境下声源与听音者的第一距离，HRTF0为调试环境下的基准头相关传递函数，调试环境的声场信息对应的终端设备扬声器的播放参数P₀＝(响度SPL₀，频率响应曲线C₀，混响算法参数)；在初始的调试环境的声场信息变更为当前的声场环境对应的目标声场信息F₁＝(T₁，a₁，N₁，S₁，d₁，HRTF1)时，目标生成信息对应的优化后的终端设备扬声器的播放参数P₁＝(响度SPL₁，频率响应曲线C₁，混响算法参数)。

图7为本申请提供的一种终端设备外放音质优化装置的结构示意图，在上述各实施例的基础上，本申请还提供一种终端设备外放音质优化装置，所述装置包括：

获取模块701，用于获取当前声场环境的第一图像；

确定模块702，用于根据所述第一图像、以及预先保存的每个声场环境的声场信息对应的模板图像，确定满足图像相似度要求的目标模板图像对应的目标声场信息，将所述目标声场信息确定为所述当前声场环境的声场信息；

调整模块703，用于根据所述目标声场信息与预先保存的调试环境的基准声场信息的第一差值、以及预先保存的混响算法参数与声场信息的函数关系，确定所述混响算法参数的调整值，并根据所述调整值对终端设备扬声器的混响算法参数进行调整。

所述装置还包括：

图8为本申请提供的一种终端设备结构示意图，在上述各实施例的基础上，本申请中还提供了一种终端设备，包括处理器801、通信接口802、存储器803和通信总线804，其中，处理器801，通信接口802，存储器803通过通信总线804完成相互间的通信；

所述存储器803中存储有计算机程序，当所述程序被所述处理器801执行时，使得所述处理器801执行如下步骤：

获取当前声场环境的第一图像；

上述终端设备提到的通信总线可以是外设部件互连标准(PeripheralComponentInterconnect，PCI)总线或扩展工业标准结构(Extended IndustryStandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口802用于上述终端设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述处理器可以是通用处理器，包括中央处理器、网络处理器(NetworkProcessor，NP)等；还可以是数字指令处理器(Digital Signal Processing，DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

在一些实施例中。本申请提供的终端设备可以是手机。示例性地，图9中示出了根据实施例中终端设备900的硬件配置框图。应该理解的是，图9所示终端设备900仅是一个范例，并且终端设备900可以具有比图9中所示的更多的或者更少的部件，可以组合两个或多个的部件，或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

如图9所示，终端设备900包括：通信组件910、处理器920、存储器930、显示器940、输入组件950、音频电路960、SIM卡接口970以及传感器980等部件。

其中，通信组件910用于接收或发送通话请求，并在通话过程中接收和发送信号，以及连接服务器，上传或下载数据。通信组件910可以包括RF(radiofrequency，射频)电路911、Wi-Fi(Wireless Fidelity，无线保真)模块912。

RF电路911可用于在收发信息或通话过程中信号的接收和发送，可以接收基站的下行数据后交给处理器920处理；可以将上行数据发送给基站。通常，RF电路911包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等器件。RF电路911可以由天线接收电磁波，并对接收的电磁波进行滤波，放大等处理，传送至调制解调处理器进行解调。RF电路911还可以对经调制解调处理器调制后的信号放大，经天线转为电磁波辐射出去。在一些实施例中，RF电路911的至少部分功能模块可以被设置于处理器920中。在一些实施例中，RF电路911的至少部分功能模块可以与处理器920的至少部分模块被设置在同一个器件中。终端设备900的RF电路911和天线耦合，使得终端设备900可以通过无线通信技术与网络以及其他设备通信。

Wi-Fi属于短距离无线传输技术，终端设备900可以通过Wi-Fi模块912帮助用户收发电子邮件、浏览网页和访问流媒体等，它为用户提供了无线的宽带互联网访问。Wi-Fi模块912可以连接路由器，通过路由器连接外部网络。Wi-Fi模块912也可以连接服务器，上传或下载数据。

存储器930可用于存储终端设备运行时所使用的数据或程序代码。处理器920通过运行存储在存储器930的数据或程序代码，从而执行终端设备900的各种功能以及数据处理。存储器930可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器930存储有使得终端设备900能运行的操作系统。

显示器940用于显示由用户输入的信息或提供给用户的信息以及终端设备900的各种菜单的图形用户界面(graphical user interface，GUI)。具体地，显示器940可以包括设置在终端设备900正面的显示器。显示器可以采用液晶显示器、发光二极管等形式来配置。显示器940可用于显示终端设备运行时的界面。

输入组件950可用于接收用户输入的数字或字符信息，以及用户输入的各种操作等，产生与终端设备900的用户设置以及功能控制有关的信号输入。具体地，输入组件950可以包括按键和触控屏，触控屏可以设置在终端设备900的正面，可收集用户在其上或附近的触摸操作，例如点击按钮，拖动滚动框等。

其中，触控屏可以覆盖在显示器之上，在一些实施例中，可以将触控屏与显示器集成而实现终端设备900的输入和输出功能，集成后可以简称触控显示器。

终端设备900还可以包括定位模块，如卫星定位模块或移动通信网络定位模块等，可以实时确定终端设备900所处的地理位置。

音频电路960、扬声器961、麦克风962可提供用户与终端设备900之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号，传输到扬声器961，由扬声器961转换为声音信号输出。终端设备900还可配置音量按钮，用于调节声音信号的音量。另一方面，麦克风962将收集的声音信号转换为电信号，由音频电路960接收后转换为音频数据，再将音频数据输出至RF电路911以发送给比如另一终端，或者将音频数据输出至存储器930以便进一步处理。

SIM卡接口970用于连接SIM卡。SIM卡可以通过插入SIM卡接口970，或从SIM卡接口970中拔出，实现和终端设备900的接触和分离。终端设备900可以支持1个或N个SIM卡接口，N为大于1的正整数。SIM卡接口970可以支持Nano SIM卡，Micro SIM卡，SIM卡等。同一个SIM卡接口可以同时插入多张卡。所述多张卡的类型可以相同，也可以不同。SIM卡接口也可以兼容不同类型的SIM卡。SIM卡接口也可以兼容外部存储卡。终端设备900通过SIM卡和网络交互，实现通话以及数据通信等功能。在一些实施例中，终端设备900采用eSIM，即：嵌入式SIM卡。eSIM卡可以嵌在终端设备900中，不能和终端设备900分离。SIM卡用于标识用户的手机号码。

终端设备900除包含SIM卡接口970之外，还可以包括USB(universal serialbus，通用串行总线)接口等。USB接口用于连接充电线或其它外设。例如，终端设备900可以通过USB接口连接充电线。终端设备900中的各组件或模块通过总线连接。

终端设备900还可以包括至少一种传感器980，比如加速度传感器981、距离传感器982、指纹传感器983、温度传感器984。终端设备900还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。例如，指纹传感器983可以用于感应用户点击终端设备900操作界面的图标。

终端设备900还可以包括摄像头，用于捕获静态图像或视频。摄像头可以是一个，也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device，CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor，CMOS)光电晶体管。感光元件把光信号转换成电信号，之后将电信号传递给处理器920转换成数字图像信号。

处理器920是终端设备900的控制中心，利用各种接口和线路连接整个终端的各个部分，通过运行或执行存储在存储器930内的软件程序，以及调用存储在存储器930内的数据，执行终端设备900的各种功能和处理数据。在一些实施例中，处理器920可包括一个或多个处理单元。本申请中处理器920可以运行操作系统、应用程序、用户界面显示及触控响应，以及本申请实施例所述的信息展示方法。处理器920执行信息展示方法的具体过程，将在下文中详细介绍。

图10是本申请的终端设备900的软件结构框图。

分层架构将软件分成若干个层，每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中，将安卓(Android)系统分为四层，从上至下分别为应用程序层，应用程序框架层，安卓运行时(Android runtime)和系统库，以及内核层。

应用程序层可以包括一系列应用程序包。如图2所示，应用程序包可以包括相机，图库，日历，通话，地图，导航，时钟，蓝牙，音乐，视频，短信息等应用程序。用户可以在时钟应用程序中设置闹钟。应用程序层还可以包括安装在终端设备上的第三方应用。

应用程序框架层为应用程序层的应用程序提供应用编程接口(ApplicationProgramming Interface，API)和编程框架。应用程序框架层包括一些预先定义的函数。

如图10所示，应用程序框架层可以包括窗口管理器，内容提供器，视图系统，电话管理器，资源管理器，通知管理器等。

窗口管理器用于管理窗口程序。窗口管理器可以获取显示器大小，判断是否有状态栏，锁定屏幕，截取屏幕等。

内容提供器用来存放和获取数据，并使这些数据可以被应用程序访问。所述数据可以包括闹钟数据，视频，图像，音频，拨打和接听的电话，浏览历史和书签，电话簿等。

视图系统包括可视控件，例如显示文字的控件，显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如，包括短信通知图标的显示界面，可以包括显示文字的视图以及显示图片的视图。

电话管理器用于提供终端设备的通信功能。例如通话状态的管理(包括接通，挂断等)。资源管理器为应用程序提供各种资源，比如本地化字符串，图标，图片，布局文件，视频文件等等。

通知管理器使应用程序可以在状态栏中显示通知信息，可以用于传达告知类型的消息，可以短暂停留后自动消失，无需用户交互。比如通知管理器被用于告知下载完成，消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知，例如后台运行的应用程序的通知，还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息，发出提示音，终端振动，指示灯闪烁等。

Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。

核心库包含两部分：一部分是java语言需要调用的功能函数，另一部分是安卓的核心库。

应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理，堆栈管理，线程管理，安全和异常的管理，以及垃圾回收等功能。

系统库可以包括多个功能模块。例如：表面管理器(surface manager)，媒体库(Media Libraries)，三维图形处理库(例如：OpenGL ES)，2D图形引擎(例如：SGL)等。其中，三维图形处理库和2D图形引擎均属于公共相机资源。

表面管理器用于对显示子系统进行管理，并且为多个应用程序提供了2D和3D图层的融合。

媒体库支持多种常用的音频，视频格式回放和录制，以及静态图像文件等。媒体库可以支持多种音视频编码格式，例如:MPEG4，H.264，MP3，AAC，AMR，JPG，PNG等。

三维图形处理库用于实现三维图形绘图，图像渲染，合成，和图层处理等。

2D图形引擎是2D绘图的绘图引擎。

内核层是硬件和软件之间的层。内核层至少包含显示驱动，摄像头驱动，音频驱动，传感器驱动。

在上述各实施例的基础上，本申请还提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行如下步骤：

获取当前声场环境的第一图像；

进一步地，所述方法还包括：

获取声源与听音者的第一距离；

获取所述当前声场环境的第一位置；

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种终端设备外放音质优化方法，其特征在于，所述方法包括：

获取当前声场环境的第一图像；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取声源与听音者的第一距离；

4.根据权利要求3所述的方法，其特征在于，所述终端设备扬声器的扬声器模式包括单扬声器模式、双扬声器模式和四扬声器模式，所述获取声源与听音者的第一距离包括：

5.根据权利要求3所述的方法，其特征在于，所述声场信息包括背景噪声的分贝值，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述第一图像、以及预先保存的每个声场环境的声场信息对应的模板图像，确定满足图像相似度要求的目标模板图像对应的目标声场信息包括：

获取所述当前声场环境的第一位置；

7.一种终端设备外放音质优化装置，其特征在于，所述装置包括：

获取模块，用于获取当前声场环境的第一图像；

8.根据权利要求7所述的装置，其特征在于，所述确定模块，还用于根据预先保存的每个声场环境的声场信息与扬声器模式的对应关系、以及所述目标声场信息，确定所述目标声场信息对应的目标扬声器模式；

所述装置还包括：

9.一种终端设备，其特征在于，包括：处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

所述存储器中存储有计算机程序，当所述程序被所述处理器执行时，使得所述处理器执行权利要求1-6任一项所述方法。

10.一种计算机可读存储介质，其特征在于，其存储有可由处理器执行的计算机程序，当所述程序在所述处理器上运行时，使得所述处理器执行权利要求1-6任一项所述方法。