CN110797046B - 语音质量mos值的预测模型建立方法及装置 - Google Patents

语音质量mos值的预测模型建立方法及装置 Download PDF

Info

Publication number
CN110797046B
CN110797046B CN201810871944.4A CN201810871944A CN110797046B CN 110797046 B CN110797046 B CN 110797046B CN 201810871944 A CN201810871944 A CN 201810871944A CN 110797046 B CN110797046 B CN 110797046B
Authority
CN
China
Prior art keywords
mos
standard
value
sample data
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810871944.4A
Other languages
English (en)
Other versions
CN110797046A (zh
Inventor
郭奕吟
王硕然
林华乐
彭树铁
胡晓丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Guangdong Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201810871944.4A priority Critical patent/CN110797046B/zh
Publication of CN110797046A publication Critical patent/CN110797046A/zh
Application granted granted Critical
Publication of CN110797046B publication Critical patent/CN110797046B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例提供一种语音质量MOS值的预测模型建立方法及装置。所述方法包括:获取第一预设数目个原始样本数据集,所述原始样本数据集包括原始平均意见MOS值以及第二预设数目个原始特征值;对所述原始样本数据集进行预设数据处理,得到标准样本数据集;所述标准样本数据集包括与原始MOS值对应的标准MOS值以及与所述原始特征值对应的标准特征值;根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,所述预测模型为随机森林模型。本发明使用随机森林算法构建预测模型,可取代路测与MOS盒集合进行语音质量评估的方法,路测时无需再携带MOS盒,只需测得各个特征值,便可实现对MOS值的精准预测。

Description

语音质量MOS值的预测模型建立方法及装置
技术领域
本发明实施例涉及移动通信技术领域,尤其涉及一种语音质量MOS值的预测模型建立方法及装置。
背景技术
随着移动通信技术的发展,VoLTE(Voice over LTE)以其优越的特性已经逐步打开市场,占据一定的市场份额。VoLTE通话通常接通等待时间更短,通话质量更高。
语音质量的评价方式有主观评价与客观评价,早期主要采用主观评价,以用户为主体进行语音质量评价,而在现实中让一组用户接听语音和评价语音质量是非常困难、昂贵且耗时的,很难用于日常的网络语音质量监测。目前,针对VoLTE语音质量评估,广泛采用插入式客观评价方法进行语音质量评估;比如通过平均意见值(Mean Opinion Score,MOS)对VoLTE通话进行语音质量评估,通常采用ITU-T P.862建议书提供的语音质量感知评估(Perceptual Evaluation of Speech Quality,PESQ)方法,由专用的仪器或软件组成MOS盒,结合路测数据,对语音质量MOS值进行评估。
然而,此种方案必须在路测时携带MOS盒,才能进行语音质量MOS值评估,给路测工作带来一定不便。
发明内容
本发明实施例提供一种语音质量MOS值的预测模型建立方法及装置,用以解决现有技术中进行语音质量MOS值评估时需在路测时携带MOS盒的问题。
一方面,本发明实施例提供一种语音质量MOS值的预测模型建立方法,所述方法包括:
获取第一预设数目个原始样本数据集,所述原始样本数据集包括原始平均意见MOS值以及第二预设数目个原始特征值;其中,MOS值为对特征值加权求和得到的综合权值;
对所述原始样本数据集进行预设数据处理,得到标准样本数据集;所述标准样本数据集包括与原始MOS值对应的标准MOS值以及与所述原始特征值对应的标准特征值;
根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,所述预测模型为随机森林模型。
另一方面,本发明实施例提供一种语音质量MOS值的预测模型建立装置,所述装置包括:
样本获取模块,用于获取第一预设数目个原始样本数据集,所述原始样本数据集包括原始平均意见MOS值以及第二预设数目个原始特征值;其中,MOS值为对特征值加权求和得到的综合权值;
数据处理模块,用于对所述原始样本数据集进行预设数据处理,得到标准样本数据集;所述标准样本数据集包括与原始MOS值对应的标准MOS值以及与所述原始特征值对应的标准特征值;
模型建立模块,用于根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,所述预测模型为随机森林模型。
另一方面,本发明实施例还提供了一种电子设备,包括存储器、处理器、总线以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述语音质量MOS值的预测模型建立方法中的步骤。
再一方面,本发明实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述语音质量MOS值的预测模型建立方法中的步骤。
本发明实施例提供的语音质量MOS值的预测模型建立方法及装置,通过获取一地点的原始样本数据集,对所述原始样本数据集进行预设数据处理,得到包括标准MOS值以及标准特征值对应的标准样本数据集;进一步根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,且所述预测模型为随机森林模型,后续需要评估语音质量的MOS值时,只需将待评估语音输入至该预测模型中,便可得到预测MOS值。引入机器学习思路,使用随机森林算法构建语音质量MOS值预测模型,可取代路测与MOS盒集合进行语音质量评估的方法,路测时无需再携带MOS盒,只需测得各个特征值,使用此模型便可实现对MOS值的精准预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的语音质量MOS值的预测模型建立方法的流程示意图;
图2为本发明实施例提供的语音质量MOS值的预测模型建立装置的结构示意图;
图3为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出了本发明实施例提供的一种语音质量MOS值的预测模型建立方法的流程示意图。
如图1所示,本发明实施例提供的语音质量MOS值的预测模型建立方法,所述方法具体包括以下步骤:
步骤101,获取第一预设数目个原始样本数据集,所述原始样本数据集包括原始平均意见MOS值以及第二预设数目个原始特征值;其中,MOS值为对特征值加权求和得到的综合权值。
其中,特征值为路测数据中,语音通话数据的特征值。每个原始样本数据集作为一组数据,包括第二预设数目个特征值(即原始特征值)以及已知的MOS值(即原始MOS值),且MOS值为根据该组特征值所确定的。其中,MOS值为对特征值加权求和得到的综合权值。
参见表1,表1中为一样本数据集的示例,样本数据集包括MOS值和多个特征值。
表1:
Figure BDA0001752366520000041
其中,表1中所示样本数据集包括n个特征,分别为:演进型-通用移动通信系统陆地无线接入网小区标识符(E-UTRAN Cell Identifier,ECI)、载波频点号(E-UTRAAbsolute Radio Frequency Channel Number,EARFCN)、物理小区标识(Physical CellIdentifier,PCI)、信号与干扰加噪声比(Signal to Interference plus Noise Ratio,SINR)、参考信号接收功率(Reference Signal Receiving Power,RSRP)、…、参考信号接收质量(Reference Signal Receiving Quality,RSRQ)等;A1,A2,…,An表示每个特征对应的特征值。
X表示该组特征值对应的语音质量知觉评价听力质量-平均意见值(PerceptualEvaluaTIon of Speech Quality Listening Quality-Mean Opinion Score,PESQLQ-MOS),即MOS值。
需要说明的是,本发明的实施例中,样本数据集及MOS值为针对一地点的数据,该地点具有特定的经纬度信息。可选地,对于一确定地点,原始样本数据集可选取该地点一段时间内的路测数据作为基础数据。
步骤102,对所述原始样本数据集进行预设数据处理,得到标准样本数据集;所述标准样本数据集包括与原始MOS值对应的标准MOS值以及与所述原始特征值对应的标准特征值。
其中,本发明实施例中,所构建的预测模型为随机森林模型。预设数据处理包括:对所述原始样本数据集进行缺失值处理、异常数据处理、噪声处理以及数据变换等,使得样本数据集满足随机森林模型对样本数据集的要求。对原始样本数据进行预算数据处理后得到的标准样本数据,标准样本数据用于构建预测模型,且标准样本数据中包括标准MOS值、标准特征值。
步骤103,根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,所述预测模型为随机森林模型。
其中,预测模型为随机森林模型,随机森林是由多个决策树分类器构成的集成学习模式。标准MOS值是多个标准特征值进行加权求和的结果,在每个标准特征值的权重未知的情况下,通过随机森林的方式多次训练,进而得到每个权重,得到MOS值的预测模型。
具体地,构建预测模型的过程,首先随机赋予每个特征值相同的权重,得到一初始模型;然后根据大量的标准MOS值、标准特征值不断对初始模型进行分类并投票,最终得到准确率最高的一组权重数值(该组权重中,各个特征值的对应各自的权重),由该组权重数值构成预测模型。
在选择样本数据时,通过自助法(bootstrap)重采样技术,从标准样本数据集有放回地重复随机抽取k个样本生成新的自助样本集,然后根据自助样本集生成k个用于分类的决策树,将多个决策树合并在一起,组成随机森林模型。
随机森林中,每棵树的建立依赖于一个独立抽取的样本,森林中的每棵树具有相同的分布,分类误差取决于每一棵树的分类能力和它们之间的相关性。对于每个特征,采用随机的方法去分裂每一个节点,比较不同情况下产生的误差,能够检测到内在估计误差、分类能力和相关性决定选择特征的数目。单棵树的分类能力可能很小,但在随机产生大量的决策树后,分类能力必然增强,经统计后选择最可能的分类。通过大量的分类、回归训练,最终得到准确率最高的一组权重数值,由该组权重数值构成预测模型。
在得到MOS值的预测模型之后,后续需要评估语音质量的MOS值时,只需将待评估语音输入至该预测模型中,便可得到预测MOS值,由于随机森林模型的精确度较高,因此该预测MOS值较高。
本发明上述实施例中,通过获取一地点的原始样本数据集,对所述原始样本数据集进行预设数据处理,得到包括标准MOS值以及标准特征值对应的标准样本数据集;进一步根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,且所述预测模型为随机森林模型,后续需要评估语音质量的MOS值时,只需将待评估语音输入至该预测模型中,便可得到预测MOS值。引入机器学习思路,使用随机森林算法构建语音质量MOS值预测模型,可取代路测与MOS盒集合进行语音质量评估的方法,路测时无需再携带MOS盒,只需测得各个特征值,使用此模型便可实现对MOS值的精准预测。本发明解决了现有技术中进行语音质量MOS值评估时需在路测时携带MOS盒的问题。
可选地,本发明实施例中,所述对所述原始样本数据集进行预设数据处理,得到标准样本数据集的步骤,包括:
第一步,根据第一预设规则,对所述原始样本数据进行预设填充处理,得到第一样本数据集;
第二步,根据第二预设规则,对所述第一样本数据集进行预设附加特征处理,得到标准样本数据集。
其中,预设数据处理主要包括两个过程,分别是预设填充处理和预设附加特征处理。
预设填充处理的目的一方面是对数据进行清洗,滤出异常值;另一方面,对丢包数据进行填充。
预设附加特征处理的目的是针对语音通话,增加一些相关特征,以提高预测模型的适用性。
具体地,上述第一步包括:
根据第一预设规则,检测所述原始样本数据中的丢包数据以及异常值;
对所述丢包数据以及异常值进行预设填充处理,得到第一样本数据集。
其中,丢包数据即原始样本数据中包数为空值的情况;通常情况下,根据路测数据解析出来的包数和丢包数容易存在数据异常,根据第一预设规则,检测所述原始样本数据中的丢包数据以及异常值。
第一预设规则包括检测原始样本数据中包数、丢包数出现空值的丢包数据,以及检测检测原始样本数据中下一个包数小于上一个包数以及丢包数大于包数的异常值,可选地,可在python工具中进行遍历检测。
作为具体示例,丢包数据的检测如表2所示:
表2:
MOS值 包数 丢包数
2 0
-1000 5 1
-1000 18 1
1.5 2
-1000 58 2
3.2 2 2
-1000 82 2
由表2可知,包数在第5行中出现空值,则此处为丢包数据处。
而包数在第7行中出现异常值,正常情况下,包数应递增,因此,此处为异常值处。
检测出丢包数据以及异常值后,对丢包数据以及异常值进行预设填充处理,得到第一样本数据集,预设填充处理即由目标位置处(丢包数据处、异常值处)的下一列数据向上填充。
填充后如表3所示:
表3:
Figure BDA0001752366520000071
Figure BDA0001752366520000081
表3中对被填充的数值添加了填充标识。
进一步地,上述第二步包括:
获取所述第一样本数据集中的主叫用户的第二样本数据集;
根据第二预设规则,对所述第二样本数据集进行处理,提取预设附加特征值;
将所述附加特征值增加至所述标准特征值中,得到标准样本数据集。
其中,通常情况下,在第一样本数据集中两个MOS值之间,前八秒为主叫用户的MOS值,后八秒为被叫用户的MOS值,需要提取第一样本数据集中主叫用户的第二样本数据集作为样本特征。
提取过程中,首先使用python Datetime方法对第一样本数据集进行时间格式化,转换成预设的格式;然后对MOS空值数据进行填充(填充方式参考表3)。最后计算时间差遍历数据,可使用python pandas库中的loc函数对两个mos值之间进行分段,通过时间差取8秒内数据并且把新字段valid_mos(有效mos)记录为1,其余为0,最后通过筛选valid_mos标记为1的为8秒内的数据。
具体地,作为具体示例,第一样本数据集中中部分提取前的数据如表4所示:
表4:
Figure BDA0001752366520000082
Figure BDA0001752366520000091
表4中为时间与MOS至之间的对应关系。
并且,表4中数据提取后的数据如表5所示:
表5:
Figure BDA0001752366520000092
表5中,将16秒的数据提取为前8秒和后8秒两部分;valid_mos为1时表示为有效,为0时表示为无效,将有效mos值对应的特征值作为第二样本数据集。
需要说明的是,本发明实施例中,8秒仅作为一种实施方式,还可以是其他数值。
得到第二样本数据集后,根据第二预设规则,对其中的特征值进行数据处理,得到各个特征值的平均值、最大值、最小值和方差值做为新增样本特征,作为新的预设附加特征值,并将所述附加特征值增加至所述标准特征值中,得到标准样本数据集。
可选地,本发明实施例中,步骤103包括:
针对每个所述标准特征值,依据所述标准特征值的最小均方差建立所述标准特征值的决策树;
根据所述决策树,建立MOS值的预测模型,所述预测模型的预测值为所述决策树的预测值的算术平均值。
其中,对标准特征值,依据所述标准特征值的最小均方差建立所述标准特征值的决策树,将决策树作为分类器,采用随机的方法去分裂每一个标准特征值。
对于任意标准特征值A,对应的任意分裂点s,将两边划分成的数据集D1和D2,根据以下公式1求出使D1和D2各自集合的均方差最小,同时D1和D2的均方差之和最小的分裂点,该分裂点为划分点。
公式1:
Figure BDA0001752366520000101
其中,yi为数据集中任一值;c1为D1数据集的样本输出均值,c2为D2数据集的样本输出均值。
各回归树的预测是根据叶子结点的均值,因此随机森林的预测是所有树的预测值的算数平均值。
单棵树的分类能力可能很小,但在随机产生大量的决策树后,分类能力必然增强,经统计后选择最可能的分类。最终根据每个所述决策树,建立MOS值的预测模型,且所述预测模型的预测值为所有决策树的预测值的算术平均值。
进一步地,所述根据所述决策树,建立MOS值的预测模型的步骤,包括:
根据预设划分比例,将所述标准样本数据集分为训练数据集和测试数据集;
根据所述训练数据集以及所述决策树,生成所述MOS值的待测模型;
通过所述测试数据集,对所述待测模型进行测试;
当测试通过时,确定所生成的待测模型为所述MOS值的预测模型。
其中,在根据所述决策树,建立MOS值的预测模型的过程中,首先根据预算比例,将标准样本数据集分为两部分,一部分作为训练数据集,一部分作为测试数据集。比如,将标准样本数据集以8:2比例划分为训练数据集和测试数据集。根据所述训练数据集以及所述决策树,生成所述MOS值的待测模型;并通过所述测试数据集,对所述待测模型进行测试,当测试通过时,确认待测模型为预测模型。
具体地,所述通过所述测试数据集,对所述待测模型进行测试的步骤,包括:
获取所述测试数据集中的待测标准特征值的标准MOS值;
将所述待测标准特征值分别输入至所述预测模型,得到预测值;
当所述待测标准特征值的标准MOS值与预测值的均方根误差小于或等于预设阈值时,确定对所述待测模型测试通过。
其中,根据测试数据集的标准MOS值,对预测值进行验证,可采用以下公式2进行验证:
公式2:
Figure BDA0001752366520000111
其中,RMSE为均方根误差,M1为标准MOS值,M2为预测值;
当RMSE小于或等于预设阈值时,确定对所述待测模型测试通过;可选地,预设阈值根据经验值确定。
本发明上述实施例中,通过获取一地点的原始样本数据集;对所述原始样本数据集进行预设数据处理,得到包括标准MOS值以及标准特征值对应的标准样本数据集;进一步根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,且所述预测模型为随机森林模型,后续需要评估语音质量的MOS值时,只需将待评估语音输入至该预测模型中,便可得到预测MOS值。引入机器学习思路,使用随机森林算法构建语音质量MOS值预测模型,可取代路测与MOS盒集合进行语音质量评估的方法,路测时无需再携带MOS盒,只需测得各个特征值,使用此模型便可实现对MOS值的精准预测。
以上介绍了本发明实施例提供的语音质量MOS值的预测模型建立方法,下面将结合附图介绍本发明实施例提供的语音质量MOS值的预测模型建立装置。
如图2所示,本发明实施例提供的语音质量MOS值的预测模型建立装置包括:
样本获取模块201,用于获取第一预设数目个原始样本数据集,所述原始样本数据集包括原始平均意见MOS值以及第二预设数目个原始特征值;其中,MOS值为对特征值加权求和得到的综合权值。
其中,特征值为路测数据中,语音通话数据的特征值。每个原始样本数据集作为一组数据,包括第二预设数目个特征值(即原始特征值)以及已知的MOS值(即原始MOS值),且原始MOS值为根据该组特征值所确定的。且MOS值为对特征值加权求和得到的综合权值。
数据处理模块202,用于对所述原始样本数据集进行预设数据处理,得到标准样本数据集;所述标准样本数据集包括与原始MOS值对应的标准MOS值以及与所述原始特征值对应的标准特征值。
其中,本发明实施例中,所构建的预测模型为随机森林模型。预设数据处理包括:对所述原始样本数据集进行缺失值处理、异常数据处理、噪声处理以及数据变换等,使得样本数据集满足随机森林模型对样本数据集的要求。对原始样本数据进行预算数据处理后得到的标准样本数据,标准样本数据用于构建预测模型,且标准样本数据中包括标准MOS值、标准特征值。
模型建立模块203,用于根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,所述预测模型为随机森林模型。
其中,预测模型为随机森林模型,随机森林是由多个决策树分类器构成的集成学习模式。标准MOS值是多个标准特征值进行加权求和的结果,在每个标准特征值的权重未知的情况下,通过随机森林的方式多次训练,进而得到每个权重,得到MOS值的预测模型。
具体地,构建预测模型的过程,首选随机赋予每个特征值相同的权重,得到一初始模型;然后根据大量的标准MOS值、标准特征值不断对初始模型进行分类并投票,最终得到准确率最高的一组权重数值(该组权重中,各个特征值的对应各自的权重),由该组权重数值构成预测模型。
在得到MOS值的预测模型之后,后续需要评估语音质量的MOS值时,只需将待评估语音输入至该预测模型中,便可得到预测MOS值,由于随机森林模型的精确度较高,因此该预测MOS值较高。
可选地,本发明实施例中,所述数据处理模块202包括:
第一处理子模块,用于根据第一预设规则,对所述原始样本数据进行预设填充处理,得到第一样本数据集;
第二处理子模块,用于根据第二预设规则,对所述第一样本数据集进行预设附加特征处理,得到标准样本数据集。
可选地,本发明实施例中,所述第一处理子模块用于:
根据第一预设规则,检测所述原始样本数据中的丢包数据以及异常值;
对所述丢包数据以及异常值进行预设填充处理,得到第一样本数据集。
可选地,本发明实施例中,所述第二处理子模块用于:
获取所述第一样本数据集中的主叫用户的第二样本数据集;
根据第二预设规则,对所述第二样本数据集进行处理,提取预设附加特征值;
将所述附加特征值增加至所述标准特征值中,得到标准样本数据集。
可选地,本发明实施例中,所述模型建立模块203包括:
决策树子模块,用于针对每个所述标准特征值,依据所述标准特征值的最小均方差建立所述标准特征值的决策树;
预测子模块,用于根据所述决策树,建立MOS值的预测模型,所述预测模型的预测值为所述决策树的预测值的算术平均值。
可选地,本发明实施例中,所述预测子模块用于:
根据预设划分比例,将所述标准样本数据集分为训练数据集和测试数据集;
根据所述训练数据集以及所述决策树,生成所述MOS值的待测模型;
通过所述测试数据集,对所述待测模型进行测试;
当测试通过时,确定所生成的待测模型为所述MOS值的预测模型。
可选地,本发明实施例中,所述预测子模块用于:
获取所述测试数据集中的待测标准特征值的标准MOS值;
将所述待测标准特征值分别输入至所述预测模型,得到预测值;
当所述待测标准特征值的标准MOS值与预测值的均方根误差小于或等于预设阈值时,确定对所述待测模型测试通过。
本发明上述实施例中,通过样本获取模块201获取一地点的原始样本数据集;数据处理模块202对所述原始样本数据集进行预设数据处理,得到包括标准MOS值以及标准特征值对应的标准样本数据集;模型建立模块203进一步根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,且所述预测模型为随机森林模型,后续需要评估语音质量的MOS值时,只需将待评估语音输入至该预测模型中,便可得到预测MOS值。引入机器学习思路,使用随机森林算法构建语音质量MOS值预测模型,可取代路测与MOS盒集合进行语音质量评估的方法,路测时无需再携带MOS盒,只需测得各个特征值,使用此模型便可实现对MOS值的精准预测。
图3示出了本发明又一实施例提供的一种电子设备的结构示意图。
参见图3,本发明实施例提供的电子设备,所述电子设备包括存储器(memory)31、处理器(processor)32、总线33以及存储在存储器31上并可在处理器上运行的计算机程序。其中,所述存储器31、处理器32通过所述总线33完成相互间的通信。
所述处理器32用于调用所述存储器31中的程序指令,以执行所述程序时实现如本发明上述实施例中提供的方法。
在另一种实施方式中,所述处理器执行所述程序时实现如下方法:
获取第一预设数目个原始样本数据集,所述原始样本数据集包括原始平均意见MOS值以及第二预设数目个原始特征值;其中,MOS值为对特征值加权求和得到的综合权值;
对所述原始样本数据集进行预设数据处理,得到标准样本数据集;所述标准样本数据集包括与原始MOS值对应的标准MOS值以及与所述原始特征值对应的标准特征值;
根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,所述预测模型为随机森林模型。
本发明实施例提供的电子设备,可用于执行上述方法实施例的方法对应的程序,本实施不再赘述。
本发明实施例提供的电子设备,通过获取一地点的原始样本数据集;对所述原始样本数据集进行预设数据处理,得到包括标准MOS值以及标准特征值对应的标准样本数据集;进一步根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,且所述预测模型为随机森林模型,后续需要评估语音质量的MOS值时,只需将待评估语音输入至该预测模型中,便可得到预测MOS值。引入机器学习思路,使用随机森林算法构建语音质量MOS值预测模型,可取代路测与MOS盒集合进行语音质量评估的方法,路测时无需再携带MOS盒,只需测得各个特征值,使用此模型便可实现对MOS值的精准预测。
本发明又一实施例提供的一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质上存储有计算机程序,所述程序被处理器执行时实现如本发明上述实施例中提供的方法中的步骤。
在另一种实施方式中,所述程序被处理器执行时实现如下方法:
获取第一预设数目个原始样本数据集,所述原始样本数据集包括原始平均意见MOS值以及第二预设数目个原始特征值;其中,MOS值为对特征值加权求和得到的综合权值;
对所述原始样本数据集进行预设数据处理,得到标准样本数据集;所述标准样本数据集包括与原始MOS值对应的标准MOS值以及与所述原始特征值对应的标准特征值;
根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,所述预测模型为随机森林模型。
本发明实施例提供的非暂态计算机可读存储介质,所述程序被处理器执行时实现上述方法实施例的方法,本实施不再赘述。
本发明实施例提供的非暂态计算机可读存储介质,通过获取一地点的原始样本数据集;对所述原始样本数据集进行预设数据处理,得到包括标准MOS值以及标准特征值对应的标准样本数据集;进一步根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,且所述预测模型为随机森林模型,后续需要评估语音质量的MOS值时,只需将待评估语音输入至该预测模型中,便可得到预测MOS值。引入机器学习思路,使用随机森林算法构建语音质量MOS值预测模型,可取代路测与MOS盒集合进行语音质量评估的方法,路测时无需再携带MOS盒,只需测得各个特征值,使用此模型便可实现对MOS值的精准预测。
本发明又一实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:
获取第一预设数目个原始样本数据集,所述原始样本数据集包括原始平均意见MOS值以及第二预设数目个原始特征值;其中,MOS值为对特征值加权求和得到的综合权值;
对所述原始样本数据集进行预设数据处理,得到标准样本数据集;所述标准样本数据集包括与原始MOS值对应的标准MOS值以及与所述原始特征值对应的标准特征值;
根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,所述预测模型为随机森林模型。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种语音质量MOS值的预测模型建立方法,其特征在于,包括:
获取第一预设数目个原始样本数据集,所述原始样本数据集包括原始平均意见MOS值以及第二预设数目个原始特征值;其中,MOS值为对特征值加权求和得到的综合权值;
对所述原始样本数据集进行预设数据处理,得到标准样本数据集;所述标准样本数据集包括与原始MOS值对应的标准MOS值以及与所述原始特征值对应的标准特征值;
根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,所述预测模型为随机森林模型;
所述根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型的步骤,包括:
针对每个所述标准特征值,依据所述标准特征值的最小均方差建立所述标准特征值的决策树;
根据所述决策树,建立MOS值的预测模型,所述预测模型的预测值为所述决策树的预测值的算术平均值。
2.根据权利要求1所述的方法,其特征在于,所述对所述原始样本数据集进行预设数据处理,得到标准样本数据集的步骤,包括:
根据第一预设规则,对所述原始样本数据进行预设填充处理,得到第一样本数据集;
根据第二预设规则,对所述第一样本数据集进行预设附加特征处理,得到标准样本数据集。
3.根据权利要求2所述的方法,其特征在于,所述根据第一预设规则,对所述原始样本数据进行预设填充处理,得到第一样本数据集的步骤,包括:
根据第一预设规则,检测所述原始样本数据中的丢包数据以及异常值;
对所述丢包数据以及异常值进行预设填充处理,得到第一样本数据集。
4.根据权利要求2所述的方法,其特征在于,所述根据第二预设规则,对所述第一样本数据集进行预设附加特征处理,得到标准样本数据集的步骤,包括:
获取所述第一样本数据集中的主叫用户的第二样本数据集;
根据第二预设规则,对所述第二样本数据集进行处理,提取预设附加特征值;
将所述附加特征值增加至所述标准特征值中,得到标准样本数据集。
5.根据权利要求1所述的方法,其特征在于,所述根据所述决策树,建立MOS值的预测模型的步骤,包括:
根据预设划分比例,将所述标准样本数据集分为训练数据集和测试数据集;
根据所述训练数据集以及所述决策树,生成所述MOS值的待测模型;
通过所述测试数据集,对所述待测模型进行测试;
当测试通过时,确定所生成的待测模型为所述MOS值的预测模型。
6.根据权利要求5所述的方法,其特征在于,所述通过所述测试数据集,对所述待测模型进行测试的步骤,包括:
获取所述测试数据集中的待测标准特征值的标准MOS值;
将所述待测标准特征值分别输入至所述预测模型,得到预测值;
当所述待测标准特征值的标准MOS值与预测值的均方根误差小于或等于预设阈值时,确定对所述待测模型测试通过。
7.一种语音质量MOS值的预测模型建立装置,其特征在于,包括:
样本获取模块,用于获取第一预设数目个原始样本数据集,所述原始样本数据集包括原始平均意见MOS值以及第二预设数目个原始特征值;其中,MOS值为对特征值加权求和得到的综合权值;
数据处理模块,用于对所述原始样本数据集进行预设数据处理,得到标准样本数据集;所述标准样本数据集包括与原始MOS值对应的标准MOS值以及与所述原始特征值对应的标准特征值;
模型建立模块,用于根据所述标准MOS值、标准特征值以及预设算法,建立MOS值的预测模型,所述预测模型为随机森林模型;
所述模型建立模块包括:
决策树子模块,用于针对每个所述标准特征值,依据所述标准特征值的最小均方差建立所述标准特征值的决策树;
预测子模块,用于根据所述决策树,建立MOS值的预测模型,所述预测模型的预测值为所述决策树的预测值的算术平均值。
8.一种电子设备,其特征在于,包括存储器、处理器、总线以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至6中任一项所述的语音质量MOS值的预测模型建立方法中的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于:所述程序被处理器执行时实现如权利要求1至6中任一项所述的语音质量MOS值的预测模型建立方法中的步骤。
CN201810871944.4A 2018-08-02 2018-08-02 语音质量mos值的预测模型建立方法及装置 Active CN110797046B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810871944.4A CN110797046B (zh) 2018-08-02 2018-08-02 语音质量mos值的预测模型建立方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810871944.4A CN110797046B (zh) 2018-08-02 2018-08-02 语音质量mos值的预测模型建立方法及装置

Publications (2)

Publication Number Publication Date
CN110797046A CN110797046A (zh) 2020-02-14
CN110797046B true CN110797046B (zh) 2022-05-06

Family

ID=69425867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810871944.4A Active CN110797046B (zh) 2018-08-02 2018-08-02 语音质量mos值的预测模型建立方法及装置

Country Status (1)

Country Link
CN (1) CN110797046B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108389082B (zh) * 2018-03-15 2021-07-06 火烈鸟网络(广州)股份有限公司 一种游戏智能评级方法与系统
CN113411456B (zh) * 2021-06-29 2023-05-02 中国人民解放军63892部队 一种基于语音识别的话音质量评估方法及装置
CN113656386A (zh) * 2021-07-13 2021-11-16 华中科技大学 工业装备数据清洗方法、装置、设备及存储介质
CN115086286B (zh) * 2022-06-06 2023-05-16 中国联合网络通信集团有限公司 语音业务质量确定方法、装置、电子设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103581956A (zh) * 2012-07-25 2014-02-12 中国移动通信集团河南有限公司 一种语音质量的检测方法及装置
CN104506387A (zh) * 2014-12-26 2015-04-08 大连理工大学 一种评估lte通信系统语音质量的方法
US9119086B1 (en) * 2014-05-08 2015-08-25 Cellco Partnership Evaluating 3G and voice over long term evolution voice quality
CN105282347A (zh) * 2014-07-22 2016-01-27 中国移动通信集团公司 语音质量的评估方法及装置
CN105794187A (zh) * 2013-11-15 2016-07-20 微软技术许可有限责任公司 预测通话品质
CN108346434A (zh) * 2017-01-24 2018-07-31 中国移动通信集团安徽有限公司 一种语音质量评估的方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060200346A1 (en) * 2005-03-03 2006-09-07 Nortel Networks Ltd. Speech quality measurement based on classification estimation
US9329833B2 (en) * 2013-12-20 2016-05-03 Dell Products, L.P. Visual audio quality cues and context awareness in a virtual collaboration session

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103581956A (zh) * 2012-07-25 2014-02-12 中国移动通信集团河南有限公司 一种语音质量的检测方法及装置
CN105794187A (zh) * 2013-11-15 2016-07-20 微软技术许可有限责任公司 预测通话品质
US9119086B1 (en) * 2014-05-08 2015-08-25 Cellco Partnership Evaluating 3G and voice over long term evolution voice quality
CN105282347A (zh) * 2014-07-22 2016-01-27 中国移动通信集团公司 语音质量的评估方法及装置
CN104506387A (zh) * 2014-12-26 2015-04-08 大连理工大学 一种评估lte通信系统语音质量的方法
CN108346434A (zh) * 2017-01-24 2018-07-31 中国移动通信集团安徽有限公司 一种语音质量评估的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Single-Ended Speech Quality Measurement Using Machine Learning Methods;T.H. Falk;《IEEE Transactions on Audio, Speech, and Language Processing》;IEEE;20061016;第14卷(第6期);全文 *
一种VoIP语音质量评价模型;胡治国等;《计算机科学》;中国知网;20110515;第38卷(第5期);全文 *

Also Published As

Publication number Publication date
CN110797046A (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN110797046B (zh) 语音质量mos值的预测模型建立方法及装置
CN108877839B (zh) 基于语音语义识别技术的语音质量感知评估的方法及系统
US10026418B2 (en) Abnormal frame detection method and apparatus
CN107027023A (zh) 基于神经网络的VoIP无参考视频通信质量客观评价方法
CN109496334B (zh) 用于评估语音质量的设备和方法
CN111312286A (zh) 年龄识别方法、装置、设备及计算机可读存储介质
CN113067653B (zh) 一种频谱感知方法、装置、电子设备及介质
CN110619535B (zh) 一种数据处理方法及其装置
CN111245667A (zh) 网络业务识别方法及装置
US9531867B2 (en) Methods and systems for determining a voice quality score for a mobile telephone
CN109256148B (zh) 一种语音质量评估方法和装置
Sang et al. Blind image quality assessment using a reciprocal singular value curve
CN115273909B (zh) 语音活性检测方法、装置、设备及计算机可读存储介质
CN111081269B (zh) 通话过程中的噪声检测方法及系统
CN110868731A (zh) VoLTE网络故障检测方法及系统
CN110210522A (zh) 图片质量分数模型的训练方法及装置
CN116050253A (zh) 菜品风味智能识别方法、装置、设备及存储介质
CN115588439A (zh) 一种基于深度学习的声纹采集装置的故障检测方法及装置
CN111368858A (zh) 用户满意度评估方法及装置
CN110868732B (zh) VoLTE接通无线失败的问题定位方法、系统和设备
WO2017041553A1 (zh) 一种语音质量确定的方法和装置
CN112819079A (zh) 模型的采样算法匹配方法、装置和电子设备
CN112860870A (zh) 一种噪音数据的识别方法和设备
CN113935758A (zh) 一种预测宽带业务办理概率的随机森林模型的训练方法和装置
CN111652304A (zh) 人员亲密度分析方法、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant