CN105679335B

CN105679335B - 基于无线分析的语音质量评估方法及系统

Info

Publication number: CN105679335B
Application number: CN201510961903.0A
Authority: CN
Inventors: 吴冬华; 欧阳晔; 代心灵; 石路路; 胡岳
Original assignee: Nanjing Hua Su Science And Technology Ltd
Current assignee: Nanjing Hua Su Science And Technology Ltd
Priority date: 2015-12-21
Filing date: 2015-12-21
Publication date: 2019-08-13
Anticipated expiration: 2035-12-21
Also published as: CN105679335A

Abstract

本发明提供一种基于无线分析的语音质量评估方法及系统，该方法包括训练阶段和测试阶段，训练阶段，自动收集在不同位置和网络的情况下的用户数据，根据收集的数据，运行无线分析算法，建立一个基于网络环境的移动语音质量模型；测试阶段，从客户端收集实时数据，然后根据移动语音质量模型计算评估客户端的移动语音质量；该方法及系统，在网络指标侧首次实现可扩展和可移动的语音质量评估。能通过众包用户运行语音质量评估算法实现数据收集。进行了试点后证明了系统的高可实施性。

Description

基于无线分析的语音质量评估方法及系统

技术领域

本发明涉及一种基于无线分析的语音质量评估方法及系统。

背景技术

智能手机现被广泛应用于人们的生活中，它能为人们提供更好的连接和更多高性能、高质量的语音通话。尽管每年新应用程序层出不穷，语音呼叫仍然是最重要的终端间的互动。在2013年，日常生活中人们平均要花39分钟打电话，一般来说，人们更偏向于通过打电话来进行时间比较紧迫或敏感的对话。除了语音呼叫在人们日常生活中扮演的不可替代的角色，在户外，语音呼叫本身通常还伴随着噪音干扰和轻微延迟。所有这些事实使语音通话质量始终是最能衡量一个移动网络综合质量的重要指标，所以手机的语音性能表现在手机质量评估中始终处于最高优先级。

移动语音通话质量评估目前主要侧重于直接评估听到的语音质量。客观的感知听力评价POLQA是一个由ITU-T提供标准音频输入，与之前记录的参考听力进行比较来提供客观语音质量评价。在这样的架构下，建立了7个不同的模型来用信号特征模拟音频质量。人们可感触的音频质量进行了分析，分析中提取得到的关键特征是人类感知。为了多维度评估语音质量，不同的语言和音调的特征变量都有涉及。

感性客观听力评价(POLQA)是一个ITU-T标准(ITU-T Rec.p.863)，它通过音频信号分析来量化语音质量，为3G和4G LTE网络中的的新类型的语音编解码器提供专业支持，这个评价标准在移动运营商评估3G语音质量时被广泛采用。其核心思想是以POLQA的音频片段作为输入端，并将它与预先记录的音频信号比较，得到一个退化处理的语音信号与原始信号的关系。

实际上，如图2所示，为评估终端移动语音质量，每个测试终端都需要连接一个POLQA盒，其内置POLQA评估算法、麦克风、录音、回放机等。POLQA盒把来电关联到另外一部手机，与已经录制的音频剪辑进行比较，并记录音频信号，然后通过POLQA算法计算语音评估质量分数。

在分析音频剪辑过程中，声学指标是量化音频样本质量的关键变量。这些声学指标不能直接测得，除非以下2个条件满足：(1)一个POLQA箱和一些可以连接到每一个测试电话的专业音频处理工具；(2)所有的测试电话需要提前配对，能与对方相互进行呼叫，这种音频评估涉及很多人力投入，需要相关领域专家和巨大的硬件投资，因此只有在实验室这种非常小的测试环境是可行的。如果进行大规模的评估，例如，对一个运营商的语音质量评估的开销将会很大。此外，音频特征分析只能给出语音质量评估，但无法确定其不好的根源，因此，不能帮助运营商用以诊断和提高网络。

虽然语音呼叫中通话质量可以直接反映语音通话质量，但要评估通话质量不仅非常麻烦，而且成本较高。为了确保语音测试环境良好，每一项评价都需要专业的硬件设备，如高清录音机、耳机和回放机，需要由该领域专家的专业配置和操作。即使听力测试效果中噪音干扰不大，测试结果仍然是相对主观的语言和声调的反映。此外，对音频质量的评价并没有分析出语音质量变差的根本原因，因而无法为移动的系统性诊断提供优化指导建议。另一方面，移动运营商的最感兴趣的是为大规模网络中和本地语音问题进行语音质量评估。现有的语音质量评价系统绝对不能满足这种需求，甚至对在小区级别评估也不行。

因此，一个能提供因果分析的语音评估方法对于移动运营商很是重要。换句话说，这样的方法需要满足以下两点要求：第一，可拓展性(可行性)，评估需要涉及尽量少的硬件和人力资源投入。第二，可诊断性，评价结果必须可以直接映射到网络指标上，例如业务、切换等。

可扩展性和可诊断性是移动网络语音呼叫质量评估的最关键需求。尽管这两需求被移动运营商广泛接受，仍没有得到足够重视。目前的相关研究主要集中在音频功能分析上，它不仅成本高，还对语言和音调敏感，并且应用到移动网络上也是不可行的。

发明内容

为了克服这些问题，本发明提供一种基于无线分析的语音质量评估方法及系统解决现有技术中存在的语音评估对语言和音调敏感，并且应用到移动网络上也是不可行的问题。

本发明的技术解决方案是：

一种基于无线分析的语音质量评估方法，包括训练阶段和测试阶段，

训练阶段，自动收集在不同位置和网络的情况下的用户数据，根据收集的数据，运行无线分析算法，建立一个基于网络环境的移动语音质量模型；

测试阶段，从客户端收集实时数据，然后根据移动语音质量模型计算评估客户端的移动语音质量。

进一步地，在训练阶段，建立一个基于网络环境的移动语音质量模型，具体为：

首先，确定射频指标，根据指标特征对每个射频组进行分类后，每个分类种包括有一定范围的射频质量记录，以及一组对应的网络指标；

然后，在每个射频组中，基于其网络指标的记录进行聚类，对于每个聚类，将确定的网络指标关联到计算的POLQA得分，回归相关性高的语音质量网络指标；

使用局部自适应加权散点平滑算法，通过增加自适应窗口大小来改善局部回归特征，计算估计语音质量，建立语音质量模型。

进一步地，通过空间轮廓的距离SSD选择对不同的语音品质有区分度的网络指标，具体为：

在训练集，首先把所有的记录分为不同的质量组，根据POLQA标准对其进行语音评分；

然后，计算每组的每个网络指标的空间轮廓的距离SSD，并使用该值来判别网络指标；

得到所有网络指标的空间轮廓的距离SSD后，选择空间轮廓的距离SSD在设定范围内的网络指标作为聚类的特征变量。

进一步地，计算每组的每个网络指标的空间轮廓的距离SSD，具体为：

以ITU-T标准，基于POLQA得到四组移动语音得分如下：C1：[0，2)，C2：[2,3)，C3：[3,4)和C4：[4，4.5]；

假设每个组k，k＝1，2，3，4，有n条记录，并且每条记录有m个指标变量，在每个组，对于每个网络资源指标和每条记录，首先计算同一组间所有点间的欧式距离，并计算组间的平均欧式距离，然后得到各个组间所有点的欧式距离，以及组内所有点的欧式距离；对于每个变量，给出以下公式(1)：

其中，上式中，表示第i个指标在第k类的欧几里得距离，表示第k个类中第i个指标的平均组内欧几里得距离，表示第k个类中第i个指标的平均组间欧几里得距离；

对于每一个组内的网络指标，通过以下公式(2)来计算权重：

其中，W_i ^k表示第i个指标在第K类的权重，表示第k个类的第i个指标值，表示第k个类的第j个指标值；

最后，根据公式(3)对每个网络指标计算不同组间的SSD距离：

其中，W_i ^k表示第i个指标在第k类的权重，表示第i个指标在第k类的欧几里得距离。

进一步地，确定的射频指标包括参考信号接收功率RSRP和信号干扰噪声比SINR。

进一步地，在筛选到不同特征变量后，用所有训练集数据进行聚类，确定最佳聚类数量如下：在定义一个上限的聚类数的基础上，k从2到此上限进行循环，在每一次迭代中执行k-中心点聚类，k-中心点聚类算法中，将从当前簇中选取这样一个点作为中心点，该点到当前簇中的其他所有点的距离之和最小；遍历所有点，把这些点归结到离以上k个中心点最近的一点得到一个簇，则可以得到k个簇；为得到最佳的聚类数k，使簇内的聚类最小化，并且簇间的距离最大化，如下：

上式中，IntraSumOfError_k表示第k个簇间的误差和，IntraSumOfError_k+1表示第k+1个簇间的误差和，IntraSumOfError_k+2表示第k+2个簇间的误差和，IntraSumOfError_k+3表示第k+3个簇间的误差和。

进一步地，基于POLQA评分的局部自适应加权散点平滑算法a-loess特征回归聚类后，所有记录都有属于自己的簇；基于POLQA对每个簇进行回归，基于选取的相关网络指标，根据局部自适应加权散点平滑算法a-loess回归得到POLQA分数。

进一步地，根据局部自适应加权散点平滑算法a-loess回归得到POLQA分数，具体为：

首先，对每一个音频数据，结合散点函数值的范围计算其分布密度：

上式中，a表示a-loess算法中的取到的显著水平，x在此代表积分函数的单位参数；

然后，对y_a进行升序排列，根据排列顺序计算窗口大小指标，如下：

上式中，win-size表示窗口大小指标，S代表根据0-5分成的9个POLQA区间的不同编号，N代表样本点的个数；

最后，基于选定的指标，使用自适应窗口大小的计算式(6)，运行局部自适应加权散点平滑算法a-loess回归到POLQA得分。

一种实现上述任一项所述方法的基于无线分析的语音质量评估系统，包括：

数据收集模块：通过自动收集在不同位置和网络的情况下的用户数据，将用户数据通过众包发送回给模型建立模块；

模型建立模块：根据收集的数据，建立一个基于网络环境的移动语音质量模型，运行无线分析算法；

语音质量评估模块：从客户端收集实时数据，然后根据移动语音质量模型计算评估客户端的移动语音质量。

本发明的有益效果是：该种基于无线分析的语音质量评估方法及系统，在网络指标侧首次实现可扩展和可移动的语音质量评估。能通过众包用户运行Crowdmi算法实现数据收集。进行了试点后证明了系统的高可实施性。

附图说明

图1是本发明实施例基于无线分析的语音质量评估系统的说明框架图。

图2是POLQA语音评估标准的说明示意图。

图3是实施例中无线网射频组中变量的分布图。

图4是选择到的特征变量的POLQA评分示意图。(a)RLC层下行吞吐量rlc.dl.throughput，(b)实时语音传输吞吐量rtp.audio.rx.throughput，(c)切换出现handover.happening。

图5是每个无线网射频组语音质量评估的相应匹配值。

具体实施方式

下面结合附图详细说明本发明的优选实施例。

实施例基于无线分析的可拓展和可诊断的语音质量评估方法及系统，通过众包和挖掘终端的网络指标来评估移动语音质量。该方法及系统通过挖掘数百个网络和语音频率指标来建立语音质量和网络资源之间的关系，然后根据广泛被接受的POLQA语音评估标准来校准模型，成本不高，具有可推广性和可诊断性。使用该系统在不同网络覆盖点进行试点，试验表明，该方法及系统不仅不需要任何额外的硬件或人力投入，而且具有非常高的模型的精确度和可诊断性。在美国的VoLTE网络中试验表明，该系统具有很高的可用性。

实施例

实施例探索直接影响移动语音的根本性因素---缺乏关注的无线网络。移动语音变差的主要原因就是无线信号传播环境差导致的。受此启发，设计了一个语音质量模型，该模型通过分析移动语音质量来挖掘相关网络指标。该系统以POLQA为标准来评估移动语音质量，然而，并没有直接测量音频质量，相反，根据用户在不同的网络场景，通过大规模的数据众包，建立了一个网络条件与语音质量的变化的因果关系。通过语音质量模型，实施例得出网络语音质量怎样以及在质量较差时的造成原因。

在实施例系统中，为了建立语音质量评价模型，在打电话时，记录下彼此通话过程中录音音频片段和呼叫过程中的网络指标。经过数据采集，识别出重要的无线电频率RF特征变量，并分为不同的组。然后，对于每个无线电频率组，设计空间轮廓距离选择最相关的网络指标来度量组间距离，并且在此基础上，根据筛选出的对网络有重要影响的指标进行聚类。在每一个聚类簇，用POLQA的标准分析音频特征并计算语音质量得分。通过回归与语音质量相关性最高的变量，设计一种自适应的LOESS算法，LOESS算法即局部加权回归散点平滑法(locally weighted scatter plot smoothing，LOWESS或LOESS)类似于移动平均技术，是在指定的窗口之内，每一点的数值都用窗口内临近的数据进行加权回归得到的，回归方程可用线性的或者二次的。如果在指定的窗口宽度之内，拟进行平滑的数据点两侧的进行平滑的数据点是相等的，则为对称LOWESS，如果两侧数据点不等，则为非对称LOWESS。一般来说，LOWESS方法包括以下步骤：

一、计算指定窗口内各个数据点的初始权重，权重函数一般表达为数值之间欧氏距离比值的立方函数；

二、利用初始权重进行回归估计，利用估计式的残差定义稳健的权函数，计算新的权重；

三、利用新的权重重复步骤2，不停的修正权函数，第N步收敛后可根据多项式和权重得到任意点的光滑值。

利用LOWESS方法进行数据平滑处理的重点参数在于窗口宽度的选择，窗口宽度过大将使得光滑描点涵盖的历史数据过多，降低最新价格信息对平滑值的影响，反之，过窄的窗口宽度使“平滑”后的数据并不平滑。需要指出的是，由于LOWESS方法应用的是某一数据点两侧的数值进行平滑，而对于股票价格等金融时间序列而言，得到最新的实际成交价格之后，如果对该时刻的平滑值进行估计，则往往缺失该时点右侧的数据信息，因此LOWESS在股票价格平滑处理中的应用，是以“非对称”的方式进行的。

利用以上LOESS算法来将网络指标与计算得分进行关联。由此得到语音质量评价模型，其中筛选到的网络指标都是和语音质量高度相关或者具有映射关系的。模型建立后，实施例系统不再依靠POLQA，仅仅通过收集语音通话的网络指标来建模，直接估计语音质量。

按照客户服务体系结构来在Android智能手机程序中实现实施例的基于无线分析的可拓展和可诊断的语音质量评估过程，系统通过自动收集在不同位置和网络的情况下的用户数据，通过众包发送回语音质量评估服务器，再由语音质量评估服务器在数据中心部署后，根据收集的数据，建立一个基于网络环境的移动语音质量模型，运行无线分析算法。为了模型的准确性，它需要从每个客户的语音质量评估客户端收集实时数据，然后根据模型计算评估语音质量评估客户端的移动语音质量，来代表语音质量评估的客户当前位置的语音质量。在不同VOLTE和众包用户所在的不同网络覆盖区域内部署来进行试点。试验表明，语音质量评估方法及系统不需要任何额外的硬件或人力的投入，且具有非常高的模型精确度和较强的可诊断性。

语音质量评估方法由训练阶段和测试阶段两部分组成，用可以安装在手机上的软件来执行语音质量评估。在训练阶段，根据收集的数据构建语音质量模型，手机安装语音质量评估客户端进行语音呼叫。在通话后，POLQA根据每个语音剪辑记录的计算得分，与记录的语音对比，组织架构性强，在每一个时间点，音频质量得分可以与一组网络指标和无线网射频RF功能相关联。

基于以上的背景，先将以射频为基础的数据进行分组记录。首先确定重要的射频指标：(1)参考信号接收功率RSRP，(2)信号干扰噪声比SINR，根据指标特征进行分类。之后，每分类里包括有一定范围的射频质量记录，以及一组对应的网络指标。然后，在每个射频组中，基于其网络指标的记录进行聚类。在做聚类之前，只需要选择重要的网络指标进行聚类，以减少过度拟合。使用空间轮廓距离SSD测量每个网络指标来区分语音质量，选定的网络指标作为特征变量，采用k-Medoids算法进行聚类。这种聚类方法，选取对网络性能影响较大的网络指标，然后根据这些指标进行聚类分组。对于每个类，将选定的网络指标关联到计算的POLQA得分，回归相关性高的语音质量网络指标。

使用局部自适应散点平滑回归算法a-loess，通过增加自适应窗口大小来改善局部回归特征，计算估计语音质量，建立语音质量模型。在每个簇中，选定的网络指标与语音质量高度相关，并可映射到语音质量，这些指标的变化是语音质量偏差的根本原因。在建立语音质量模型之后，不再仅仅依靠POLQA，会有更充分的利用模式。

在测试阶段，为了评估终端语音质量，该方法不需要收集或分析音频剪辑片段，只需要收集每个电话的网络指标和射频数据。对于每条收集的记录，该方法输入分配其射频质量和网络指标到模型，通过输入数据来训练模型。模型建立后，利用a-loess模型来计算这个评估的语音质量，如下：

输入有：AC_i：第i条音频剪辑参数，RF：各条射频变量，NR：各项网络指标。

训练阶段：V_i ^R＝＜AC_i,RF,NR＞；

测试阶段：V_i ^T＝＜RF,NR＞；

输出：训练阶段：语音质量模型：K个射频质量组，每组有M_K个类别，每个分类内，网络指标具有相关性，回归到POLQA评分。测试阶段：进行POLQA评分。

在训练阶段中，对于所有训练阶段的V指标，计算POLQA评分S_i；根据射频变量RF将V_i ^R分为K组。

对以上K组中的每一组，计算所有网络指标NR的SSD；选择SSD_NR>0.5的网络指标NR；根据NRS变量，做K-Medoids聚类，得到M_K个类别；

对得到的每个类别，使用a-loess算法建立网络指标NR与POLQA评分S的回归模型。

在测试阶段中，对于所有的测试阶段的V指标，基于射频变量RF分类到射频变量组；根据网络指标NR对分类，用a-loess算法计算其POLQA评分。

射频变量RF质量分类，网络覆盖和干扰是影响移动语音质量的主要因素，按照3GPP TS 36.214和3GPP TS 36.133协议选择2个指标来代表这两个因素：(1)参考信号接收功率RSRP，(2)信号干扰噪声比SINR，并给定他们的适用范围。更具体地，参考信号接收功率RSRP是LTE网络中可以代表无线信号强度的关键参数以及物理层测量需求之一，是在某个符号内承载参考信号的所有资源粒子RE上接收到的信号功率的平均值，因此，是一个具有代表性的表示覆盖强度的指标。另一方面，强覆盖也不能保证良好的无线网射频质量。强覆盖区域干扰和噪声可能仍然会降低语音信号质量。信噪比SINR反映了干扰和噪声的情况，是典型的指示干扰条件。高信噪比情况总是与高参考信号接收功率RSRP共存。此外，专家提出了LTE信号强度可用信号指标表示。下表1是基于参考信号接收功率RSRP和信号干扰噪声比SINR的规模分类表：

表1无线网射频RF质量分类

组号	RSRP(dbm)	SINR(db)	描述
				组1	>＝-85	>15	强覆盖低干扰
组2	>＝-85	<＝15	强覆盖强干扰
				组3	(-105,-85)	>15	中覆盖低干扰
组4	(-105,-85)	<＝15	中覆盖强干扰
				组5	<＝-105	>15	弱覆盖低干扰
组6	<＝-105	<＝15	弱覆盖强干扰

特征值选择和网络指标聚类。移动网络中有成百上千个指标，但只有少数几个可能关联到语音质量。实施例通过一个特征值选择方法选择最相关的网络指标，然后将它们作为特征变量来进行聚类。

选择网络指标：设定空间轮廓的距离SSD，选择对不同的语音品质有区分度的网络指标。在训练集，首先把所有的记录分为不同的质量组，根据POLQA标准对其进行语音评分。然后，计算每组的每个网络指标的SSD，并使用该值来判别网络指标。更具体地说，遵循ITU-T标准[26]，基于POLQA，得到四组移动语音得分如下：C1：[0，2)，C2：[2,3)，C3：[3,4)和C4：[4，4.5]。假设每个组k，k＝1，2，3，4，有n条记录，并且每条记录有m个指标变量。在每个组，对于每个网络资源指标和每条记录，我们首先计算同一组间所有点间的欧式距离，并计算组间的平均欧式距离，然后得到各个组间所有点的欧式距离，和组内所有点的欧式距离。对于每个变量，给出以下公式(1)：

对于每一个组内的网络指标，通过以下公式(2)来计算权重：

最后，根据公式(3)对每个网络指标计算不同组间的SSD距离：

得到所有网络指标的SSD后，考虑到是与语音质量高度相关的变量，并且变量之间关联性明显，选择SSD>0.7的指标作为聚类的特征变量。

聚类：在筛选到不同特征变量后，用所有训练集数据进行聚类。利用k-Medoids聚类算法，强加一个新的收敛规则，以确定最佳的收敛模型。采用k-Medoids聚类方法的原因是，它比其他基于距离的聚类算法偏差低。为了确定最佳聚类数量，定义一个上限的聚类数的基础上，k从2到此上限进行循环，在每一次迭代中执行k-Medoids聚类，为得到最佳的聚类数K，应该使得簇内的聚类最小化，并且簇间的距离最大化，如下：

基于POLQA评分的a-loess特征回归

聚类后，所有记录都有属于自己的簇，基于POLQA对每个簇进行回归。基于选取的相关网络指标，根据局部自适应加权散点平滑算法a-loess回归得到POLQA分数。首先，对每一个音频数据，结合散点函数值的范围计算其分布密度：

上式中，win-size表示窗口大小指标，S代表根据0-8分成的9个POLQA区间的不同编号，N代表样本点的个数；

最后，基于选定的指标，使用自适应窗口大小的计算式(6)，运行LOESS算法回归到POLQA得分。

实施例系统由两个主要部分组成，语音质量评估客户端和语音质量评估服务器。它分两期进行，训练阶段主要是收集数据并建立语音质量模型，测试阶段主要根据众包用户的数据来评估语音质量，语音质量评估的实现过程是，在安卓智能手机安装一个应用程序，其主要功能是在不同地点和网络场景中收集用户数据，通过众包，并发送回语音质量评估服务器以运行无线分析算法。在训练阶段，建立一个基于收集数据的移动语音质量模型。当模型建立并检验后，进入测试阶段，它需要实时数据计算语音质量评估客户移动语音质量，定位这个语音质量为当前这个地方的语音质量。

图1是实施例的系统框架图，图1中，训练阶段进行收集数据以建模，而在测试阶段中，用众包数据评价语音质量。

实施例基于无线分析的可拓展和可诊断的语音质量评估系统，包括：

数据收集模块：通过自动收集在不同位置和网络的情况下的用户数据，将用户数据通过众包发送回给模型建立模块。

模型建立模块：根据收集的数据，建立一个基于网络环境的移动语音质量模型，运行无线分析算法。

实施例为Android智能终端安装一个轻量语音质量评估客户端，语音质量评估客户端，包括数据收集模块、持有安卓智能手机的用户、通过众包方式收集的数据。可以通过用户众包自动收集数据，并输送到语音质量评估服务器上的模型建立模块来建立算法模型。

实施例挖掘了相关的网络指标，而不是声信号，以避免巨大的评估费用。它充分利用了现有的许多众包的实时网络数据和移动用户调查的大型蜂窝网络数据，不需要引入额外的硬件和人力资源。

语音质量评估客户端

智能手机的语音质量评估客户端自动监测手机的网络环境来收集数据。在训练阶段，每一个这样的手机都是通过工程师连接POLQA箱测试操作的，标准化语音质量测量系统的POLQA盒包括几个预先录制的音频剪辑的参考语音，和一个标准化的客观语音质量测量系统，这需要输入语音剪辑片段，与参考语音片段作比较，计算语音质量。训练阶段开始后，与语音质量评估客户端之间进行电话连接，由POLQA箱记录产生的音频，并同时记录电话的网络状况。每次通话结束后，每个POLQA框计算录制的音频剪辑的质量分数，并向语音质量评估客户端上传分数，语音质量评估服务器利用这些数据建立模型来进行语音质量评估。在测试阶段，该语音质量评估客户端利用现有的众多移动用户装在他们的手机里的安卓应用程序，直接运行语音质量评估客户端，并在后台收集语音网络指标。它定期发送数据回语音质量评估服务器，报告给网络在不同地点的语音呼叫情况。

在VoLTE阶段，训练的语音质量评估客户端，为帮助各地工程师诊断网络问题，应用程序还从语音质量评估服务器实时发送回丰富的日志信息和评估的可视化结果信息，如KPI，语音质量评估分数，位置跟踪信息等，并显示出不同终端型号，这大大方便了网络语音评估。在训练阶段。值得注意的是，POLQA盒不需要连接，可视化功能可以关闭，在做大规模的众包的测试阶段，应用程序在后台运行，并不破坏任何其他的手机程序的正常使用。

语音质量评估服务器

模型建立模块建立语音质量模型，评估不同地区蜂窝网络的语音质量和覆盖率情况。在训练阶段，服务器从客户那里收集数据，通过利用接收到的语音质量分数和网络指标，运行语音质量评估算法对手机语音质量进行建模。在测试阶段，对于每个客户，语音质量评估模块利用该模型周期性评估语音质量，这种评估是对客户所在地点的网络质量的评估。

试验验证

系统设置，为了验证实施例系统，在VoLTE网络中，对不同网络覆盖质量的不同地区进行了试验，目的是为了测试语音质量模型的精确性和评估系统寻找相关网络指标的诊断能力。从2013年12月到2014年8月，试验持续了9个月。在这9个月中，给了客户50部智能手机，这些手机安装安卓4.3系统并支持VoLTE功能，这些客户测试所有所需要的网络/无线网射频RF/设备性能指标，并把测试信息上传到日志。

为了收集语音数据，选择预先设定的美国英语“哈佛句子“中第11个单元的女性读音，每个句子有10秒钟的长度，作为POLQA箱子的音频输入，所有的测试手机处于时间一致的状态。当一个手机呼叫另一个的时候，就会演奏音频剪辑，接收器通过比较接收到的语音信号与参考语音信号来计算POLQA分数，与此同时，被呼叫者会演奏相同的音频剪辑至呼叫者。

绝大多数数据收集器通过驱动测试执行，这些测试认为移动性是语音质量的一个重要因素。在所有的数据日志中，77％的是驱动测试，23％的是静态测试。对每个测试案例，随机选择无线环境。通过这种方法，在不同覆盖质量的不同无线环境下产生POLQA记录。总共收集了317个POLQA的日志，其中299个是有效的，18个是错误的，错误的直接删除后，可用的日志包括8987条POLQA语音记录。根据表1，根据测量到的参考信号接收功率RSRP和信号干扰噪声比SINR值，把所有记录分成6个组，图3是其数据分布。

特征变量筛选。使用空间轮廓距离SSD来选择对语音质量有重要影响的判别性网络指标，表2展示了相关性最高的9个。通过这个表，可以看到绝大多数选择的指标和吞吐量、音频传输有关，这并不符合期望。

表2筛选到的特征变量

为了显示选择的相关变量与语音质量之间的高相关性，选择RLC.DL吞吐量(RLC层的吞吐量)，RTP音频Rx吞吐量(实时语音传输吞吐量)，从表2中，将他们与计算得到的POLQA成绩画在图5中。正如所期望的，当吞吐量指标高的时候，POLQA成绩也高，如果6(a)和6(b)，当交接频繁发生时，POLQA成绩低，如6(c)所示，指标与POLQA成绩强相关。

模型的精确度

在语音质量评估模型中，经过特征变量筛选后，根据筛选的变量进行K-Medoids聚类。每个类别中，使用A-LOESS算法来回归逼近这些特征变量，然后基于这些网络指标评估POLQA得分。

为了评估A-LOESS算法的精确度，使用75％的数据作为训练集，剩余的25％的数据作为测试集，通过绝对平均误差比来计算模型的误差，如下：

上式中，e代表模型的误差，S_i代表上文中计算的SSD距离，POLQA代表POLQA得分，Crowdmi代表Crowdmi算法给出的语音质量得分。

从图5中，可以看到所有训练阶段的相应匹配值，除了低覆盖和干扰的情况，都是小于10％。实际上，这种低相应匹配值不是因为模型造成的，而是因为图4中试验数据收集不充分。可以通过在这种无线网射频组中执行一些附加的测试来克服这个问题。当所有的相应匹配值保持在一个低值时，这表明实施例的系统有很高的模型精确度。此外，训练集和测试集之间的依赖性相对稳定，这是因为训练集间相应匹配值的差异很小，不超过12.5％，这些来自于低覆盖和语音干扰。这表明实施例方法是一个有效的方法，可以应用于LTE网络语音质量评估。

Claims

1.一种基于无线分析的语音质量评估方法，其特征在于，包括训练阶段和测试阶段；

测试阶段，从客户端收集实时数据，然后根据移动语音质量模型计算评估客户端的移动语音质量；

在训练阶段，建立一个基于网络环境的移动语音质量模型，具体为：

首先，确定射频指标，根据指标特征对每个射频组进行分类后，每个分类中包括有一定范围的射频质量记录，以及一组对应的网络指标；

2.如权利要求1所述的基于无线分析的语音质量评估方法，其特征在于，通过空间轮廓的距离SSD选择对不同的语音品质有区分度的网络指标，具体为：

得到所有网络指标的空间轮廓的距离SSD后，选择空间轮廓的距离SSD在设定范围内的网络指标作为聚类的特征变量；

选择SSD>0.7的指标作为聚类的特征变量。

3.如权利要求2所述的基于无线分析的语音质量评估方法，其特征在于，计算每组的每个网络指标的空间轮廓的距离SSD，具体为：

对于每一个组内的网络指标，通过以下公式(2)来计算权重：

最后，根据公式(3)对每个网络指标计算不同组间的SSD距离：

4.如权利要求2或3所述的基于无线分析的语音质量评估方法，其特征在于：确定的射频指标包括参考信号接收功率RSRP和信号干扰噪声比SINR。

5.如权利要求3所述的基于无线分析的语音质量评估方法，其特征在于，在筛选到不同特征变量后，用所有训练集数据进行聚类，确定最佳聚类数量如下：在定义一个上限的聚类数的基础上，k从2到此上限进行循环，在每一次迭代中执行k-中心点聚类，k-中心点聚类算法中，将从当前簇中选取这样一个点作为中心点，该点到当前簇中的其他所有点的距离之和最小；遍历所有点，把这些点归结到离以上k个中心点最近的一点得到一个簇，则可以得到k个簇；为得到最佳的聚类数k，使簇内的聚类最小化，并且簇间的距离最大化，如下：

6.如权利要求1所述的基于无线分析的语音质量评估方法，其特征在于：基于POLQA对每个簇进行回归，基于选取的相关网络指标，根据局部自适应加权散点平滑算法a-loess回归得到POLQA分数。

7.如权利要求6所述的基于无线分析的语音质量评估方法，其特征在于，根据局部自适应加权散点平滑算法a-loess回归得到POLQA分数，具体为：

上式中，win_size表示窗口大小指标，S代表根据0-8分成的9个POLQA区间的不同编号，N代表样本点的个数；

8.一种实现权利要求1-7任一项所述方法的基于无线分析的语音质量评估系统，包括：