CN117953918A - 一种通话语音质量评估方法和装置 - Google Patents
一种通话语音质量评估方法和装置 Download PDFInfo
- Publication number
- CN117953918A CN117953918A CN202211365885.6A CN202211365885A CN117953918A CN 117953918 A CN117953918 A CN 117953918A CN 202211365885 A CN202211365885 A CN 202211365885A CN 117953918 A CN117953918 A CN 117953918A
- Authority
- CN
- China
- Prior art keywords
- data
- call
- voice quality
- feature
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012360 testing method Methods 0.000 claims abstract description 69
- 239000011159 matrix material Substances 0.000 claims abstract description 62
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000013441 quality evaluation Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000001303 quality assessment method Methods 0.000 claims abstract description 23
- 238000011156 evaluation Methods 0.000 claims abstract description 20
- 238000005070 sampling Methods 0.000 claims description 34
- 238000004891 communication Methods 0.000 claims description 17
- 238000005259 measurement Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 6
- 230000011664 signaling Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000012076 audiometry Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种通话语音质量评估方法和装置,该方法包括:获取通话测试日志,依据通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵;其中,关联矩阵中记录有各个维度与各个维度对应的评分;依据关联矩阵构建网络质量特征因子量表;依据回归模型对网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型;依据语音质量评估模型对通话语音质量进行评估。本发明依据通话测试日志和预设语音质量评分标准进行对标处理,通过通话测试日志包含的网络质量指标信息,进行语音质量分析,促进网络侧对语音质量进行评估分析,解决了现有技术POLQA算法对语音质量评估的成本问题。
Description
技术领域
本发明涉及通信技术领域,具体涉及一种通话语音质量评估方法和装置。
背景技术
超高清通话技术(Voice over New Radio,VoNR)是基于纯5G接入的通话解决方案,实现话音业务和数据业务均承载在5G网络。其核心网依赖于改进的5G网络协议多媒体子系统(IP Multimedia Subsystem,IMS)系统实现在分组交换网络下的语音业务;VoNR支持一种新的语音编解码方案,可以有效提升语音通话的音质到高保真(High-Fidelity,Hi-Fi)的级别,即增强型语音通话服务(Enhanced Voice Services,EVS),也称超高分辨率语音(Super HD Voice)。
在业务质量测试过程中,EVS语音质量的评价很重要,在语音质量评估领域,现有技术中采用客观感知语音质量评估算法(Perceptual Objective Listening QualityAssessment,POLQA)对EVS语音质量进行评估,其实现方式是通过传统路测按照主被叫终端VoNR互拨进行,由一方进行标准音频输入,另一方通过网络传输获得退化音频;再利用标准音频与退化音频进行数字信号处理(Digital Signal Processing,DSP)与解析回归获取音调、音色差异,结合大规模的人工测听实现;尽管POLQA算法能准确客观的反映人对语音质量的感知,但是目前使用POLQA算法对语音质量评估存在如下的问题:由于其采用传统路测采集方式,需要大量的时间成本与人力成本;且相关语音质量评价未与VoNR网络质量建立关联关系,仅实现问题发现,无法实现问题解决。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种通话语音质量评估方法和装置。
根据本发明的一个方面,提供了一种通话语音质量评估方法,包括:
获取通话测试日志,依据所述通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵;其中,所述关联矩阵中记录有各个维度与各个维度对应的评分;
依据所述关联矩阵构建网络质量特征因子量表;
依据回归模型对所述网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型;
依据所述语音质量评估模型对通话语音质量进行评估。
根据本发明的另一方面,提供了一种通话语音质量评估装置,包括:
网络质量特征因子量表构建模块,用于获取通话测试日志,依据所述通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵;其中,所述关联矩阵中记录有各个维度与各个维度对应的评分;依据所述关联矩阵构建网络质量特征因子量表;
模型训练模块,用于依据回归模型对所述网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型;
评估模块,用于依据所述语音质量评估模型对通话语音质量进行评估。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述一种通话语音质量评估方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述一种通话语音质量评估方法对应的操作。
根据本发明的一种通话语音质量评估方法和装置,通过获取通话测试日志,依据通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵;其中,关联矩阵中记录有各个维度与各个维度对应的评分;依据关联矩阵构建网络质量特征因子量表;依据回归模型对网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型;依据语音质量评估模型对通话语音质量进行评估。本发明依据通话测试日志和预设语音质量评分标准进行对标处理,通过通话测试日志包含的网络质量指标信息,进行语音质量分析,促进网络侧对语音质量进行评估分析,解决了现有技术POLQA算法对语音质量评估的成本问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种通话语音质量评估方法流程图;
图2示出了本发明实施例提供的采集通话数据示意图;
图3示出了本发明实施例提供的一种通话语音质量评估装置的结构示意图;
图4示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本实施例通过从VoNR测试日志中获得网络侧全量质量信息,关联会话初始协议(Session initialization Protocol,SIP)接通信令与SIP挂断信令,结合POLQA算法的主观评价标准(Mean Opinion Score,MOS)测试中的8秒录放音双路迁移机制,解读标准音频结构区分通话数据的音频状态,构建语音网络质量特征因子数据链,并匹配VoNR音频评价的POLQA 3.0评分,利用机器学习手段进行模型训练,实现人工智能算法支持的网络特征因子识别语音质量评分。
图1示出了本发明实施例提供的一种通话语音质量评估方法的流程图,如图1所示,该方法包括以下步骤:
步骤S110:获取通话测试日志,依据通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵。
在本实施例中,获取通话测试日志即为获取VoNR测试日志,预设语音质量评分标准可以是POLQA算法构建的语音质量评分标准,即通过VoNR测试日志与POLQA算法构建的语音质量评分标准进行对标处理,得到采样点级质量信息与评分的关联矩阵。
在一种可选的方式中,步骤S110进一步包括:从通话测试日志中提取多个网络测量参数作为基础数据,依据基础数据构建采样点级别的测量参数基础表;采集主叫终端和被叫终端在通话过程中各个采样点对应的通话数据,并区分通话数据对应的测试路以及音频状态;依据预设语音质量评分标准和测量参数基础表对各个采样点对应的通话数据进行打分处理,得到关联矩阵。其中,关联矩阵中记录有各个维度与各个维度对应的评分。
具体地说,语音质量评价必须保证通话过程进行,因此依托会话创建(SIP inviteOK)与会话结束(SIP BYE)信令区分接通与挂断,取会话创建与会话结束之间的全量网络测量参数作为基础数据,依据基础数据构建采样点级别的测量参数基础表,其中,采样点级可以为毫秒;测量参数基础表至少包括:通用数据,例如时间、经纬度等;物理层数据,例如上下行各信道的参考信号接收功率(Reference Signal Receiving Power,RSRP)、参考信号接收质量(Reference Signal Receiving Quality,RSRQ)、信号与干扰加噪声比(Signalto Interference plus Noise Ratio,SINR)、手机的发射功率(TxPower)等;传输层和应用层数据,例如上下行共享信道误块率(Block Error Rate,BLER)、吞吐量、自适应变码率(Adaptive Multi-Rate,AMR)等;SIP及数据传输协议(Real-time Transport Protocol,RTP)数据,例如传输方向、包序号、包载荷、上下行丢包率、端到端时延、抖动等信息。
依据POLQA算法构建的语音质量评分标准和测量参数基础表对各个采样点对应的通话数据进行打分处理,具体地,POLQA算法评分依托MOS测试机制进行,即采用集成POLQA算法MOS盒,对接主叫终端和被叫终端,在一种可选的方式中,测试路包括:放音测试路和录音测试路;音频状态包括:静默状态和语音状态;步骤S110进一步包括:每隔第一预设时间间隔转换测试路,采集主叫终端和被叫终端在通话过程中各个采样点对应的通话数据,并记录各个采样点对应的通话数据对应的测试路;对各个采样点对应的通话数据进行音频识别,确定各个采样点对应的通话数据的音频状态。
在本实施例中,以第一预设时间间隔为8秒为例,图2示出了本发明实施例提供的采集通话数据示意图,如图2所示,则执行被叫8秒放音后,主叫录音与标准对比计分;而后主叫放音8秒,被叫录音计分,而后循环。其标准音频包含20个字,可划分为五段,包含3段静默状态和2段语音状态,表1示出了采集通话数据得到的音频识别表,如表1所示,RTP包类型为静默状态(SID)的有3段,分别为1.28秒、2.08秒和0.48秒;RTP包类型为语音状态(表中24.4)有2段,分别为1.88秒和2.38秒。
表1采集通话数据得到的音频识别表
POLQA算法是通过对标准音频和退化音频进行数字信号处理与解析回归处理,通过感知模型识别音频本身的差异,按照大量人工测听实验构建的认知模型进行打分,因此在本实施例中,提取POLQA 3.0映射的8秒评分结果的同时也要兼顾放音测试路和录音测试路双路机制与内化的静默状态和语音双态构造;具体地,通过对测量参数基础表执行8秒音频分割;最终形成每个POLQA打分对应横向95个维度(录放延展)、纵向800个维度(测量采样10ms/个,略有波动)的关联矩阵,该关联矩阵涵盖了POLQA算法评分重点表征的时间进程与参数波动,具备以网络质量信息评估VoNR语音的音频编码器(EnhanceVoiceServices,EVS)质量的全部信息。
步骤S120:依据关联矩阵构建网络质量特征因子量表。
在一种可选的方式中,步骤S120进一步包括:对关联矩阵进行数据采样空处理和矩阵数据归一化处理,得到一维化的网络质量特征因子量表。
在一种可选的方式中,步骤S120进一步包括:针对关联矩阵中的空值信息,利用空值信息的邻近信息或者零值对空值信息进行填充处理;将关联矩阵中纵向的第一预设时间间隔内的多个维度的数据,按照第二预设时间间隔进行数据汇总处理,构建每个维度的第一特征数据;其中,第二预设时间间隔小于第一预设时间间隔;针对每个维度,计算该维度的第一特征数据对应的均值、方差和/或偏移量,得到该维度的第二特征数据;将多个维度的第一特征数据和多个维度的第二特征数据作为网络质量特征因子量表中的特征数据。
具体地说,因从通话测试日志中提取多个网络测量参数的过程中,上报的通话测试日志采样频率为10ms/次,性能指标数据(如RSRP),RTP包的统计(如丢包率)等非每个采样频次均能输出,因此需要对关联矩阵的空值信息,利用空值信息的邻近信息或者零值对空值信息进行填充处理,例如,针对关联矩阵每行的空值信息,按照指标类型区分后,采取就近继承及以零替换空值原则进行处理。
另外,由于关联矩阵数据为二维数据,为了将关联矩阵数据转换为训练模型可以应用的数据,需要对矩阵数据归一化处理,得到一维化的网络质量特征因子量表;以第一预设时间间隔为8秒,第二预设时间间隔为1秒为例,将关联矩阵中纵向8秒的多维数据,按照单秒数据进行数据汇总处理,构建每个维度中8秒的第一特征数据,针对每个维度,计算该维度的第一特征数据对应的均值、方差和/或偏移量,得到该维度的第二特征数据,例如,关联矩阵中纵向8秒为92维数据,则经过,计算该维度的第一特征数据对应的均值、方差和/或偏移量,得到该维度的第二特征数据合计生成960种属性,通过上述处理,形成一维化的网络质量特征因子量表,将一维化的网络质量特征因子量表作为回归模型的训练基础。
步骤S130:依据回归模型对网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型。
在一种可选的方式中,步骤S130进一步包括:依据回归模型对网络质量特征因子量表中的特征数据进行第一次特征训练,获取多个特征数据的属性贡献率,将属性贡献率超过预设阈值的特征数据确定为目标特征数据;依据回归模型对网络质量特征因子量表中的目标特征数据进行至少一次特征训练,得到语音质量评估模型。
为了实现强分类,可以采用极致梯度提升(Extreme Gradient Boosting,XGBoost)回归模型对网络质量特征因子量表中的特征数据进行第一次特征训练,标签列为POLQA算法构建的语音质量的各样本数据的评分,特征列为第一预设时间间隔(8s)语音状态的电平值,上下行共享信道的BLER、吞吐量等特征数据在第二预设时间间隔(1s)的均值、方差和偏移量。第一次训练通过对多个特征数据的属性贡献率根据各属性对分类贡献率由大到小进行排序,将属性贡献率超过预设阈值(例如80%)的特征数据确定为目标特征数据;将目标特征数据作为回归模型第二次训练的特征数据;其中,属性贡献率为各属性的增益值占总增益值的比例。
因采样数据种类是依据人为经验采集,同时考虑到对数据属性压缩,因此可以采用XGboos回归模型对网络质量特征因子量表中的目标特征数据进行多次特征训练;例如,第一次训练获取对语音质量影响较大的特征数据作为第二次训练采用的数据特征;第二次训练得到能够用于实际生产评估语音质量的语音质量评估模型
例如,模型第一次训练采用网络质量特征因子量表生成的960种属性数据进行训练,通过各属性数据对分类的属性贡献率从大到小排序,选出属性累计贡献率达到80%属性(例如436种)进行第二次训练,第二次训练可以采用网格搜索法(GridSearchCV)获取最优参数进而获得最优模型作为实际应用的语音质量评估模型。
在一种可选的方式中,该方法还包括:计算语音质量评估模型的均方误差、平均绝对误差以及模型拟合准确程度数据;依据均方误差、平均绝对误差以及模型拟合准确程度数据对语音质量评估模型进行模型评估,评估通过后得到最终的语音质量评估模型。
具体地说由于采用的是回归模型进行训练,因此可以通过计算语音质量评估模型的均方误差(MSE:观测值与真值偏差的平方和与观测次数的比值)、平均绝对误差(MAE:预测值与真实值之间平均差)以及模型拟合准确程度数据(R2)进行模型评估。
例如,通过第二次训练,语音质量评估模型的MSE值为:0.1934;MAE值为:0.3162;R2值为:0.8939,依据实际生产经验,R2大于0.4时表示拟合效果好,因此评估通过,证明该语音质量评估模型可以在实际生产中应用。
步骤S140:依据语音质量评估模型对通话语音质量进行评估。
本发明基于网络质量特征因子量表中的特征数据进行回归模型训练,拟合落实EVS语音质量5级评估,可以通过网络质量特征因子量表包含的网络质量指标信息,进行语音质量分析,从而促进网络侧进行分析解决。
采用本实施例的方法,依据VoNR测试日志和预设语音质量评分标准进行对标处理,通过通话测试日志包含的网络质量指标信息,进行语音质量分析,促进网络侧对语音质量进行评估分析,解决了现有技术POLQA算法对语音质量评估的成本问题;该方法利用VoNR测试日志中获得的质量相关的全量网络信令、性能信息,拟征语音MOS测试的8秒音频分割机制,区分录音放音双路机制及音频结构中的静默包与语音包双态,构造EVS网络质量特征因子量表,并通过该量表匹配POLQA评分5级标准,利用XGboost回归模型进行特征数据训练,构建了语音质量评估模型,实现了基于特征因子识别的语音质量5级MOS评价。
图3示出了本发明实施例提供的一种通话语音质量评估装置的结构示意图。如图3所示,该装置包括:网络质量特征因子量表构建模块310、模型训练模块320和评估模块330。
网络质量特征因子量表构建模块310,用于获取通话测试日志,依据通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵;其中,关联矩阵中记录有各个维度与各个维度对应的评分;依据关联矩阵构建网络质量特征因子量表。
在一种可选的方式中,网络质量特征因子量表构建模块310进一步用于:从通话测试日志中提取多个网络测量参数作为基础数据,依据基础数据构建采样点级别的测量参数基础表;采集主叫终端和被叫终端在通话过程中各个采样点对应的通话数据,并区分通话数据对应的测试路以及音频状态;依据预设语音质量评分标准和测量参数基础表对各个采样点对应的通话数据进行打分处理,得到关联矩阵。
在一种可选的方式中,测试路包括:放音测试路和录音测试路;音频状态包括:静默状态和语音状态;网络质量特征因子量表构建模块310进一步用于:采集主叫终端和被叫终端在通话过程中各个采样点对应的通话数据,并区分通话数据对应的测试路以及音频状态进一步包括:每隔第一预设时间间隔转换测试路,采集主叫终端和被叫终端在通话过程中各个采样点对应的通话数据,并记录各个采样点对应的通话数据对应的测试路;对各个采样点对应的通话数据进行音频识别,确定各个采样点对应的通话数据的音频状态。
在一种可选的方式中,网络质量特征因子量表构建模块310进一步用于:对关联矩阵进行数据采样空处理和矩阵数据归一化处理,得到一维化的网络质量特征因子量表。
在一种可选的方式中,网络质量特征因子量表构建模块310进一步用于:针对关联矩阵中的空值信息,利用空值信息的邻近信息或者零值对空值信息进行填充处理;将关联矩阵中纵向的第一预设时间间隔内的多个维度的数据,按照第二预设时间间隔进行数据汇总处理,构建每个维度的第一特征数据;其中,第二预设时间间隔小于第一预设时间间隔;针对每个维度,计算该维度的第一特征数据对应的均值、方差和/或偏移量,得到该维度的第二特征数据;将多个维度的第一特征数据和多个维度的第二特征数据作为网络质量特征因子量表中的特征数据。
模型训练模块320,用于依据回归模型对网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型。
在一种可选的方式中,模型训练模块320进一步用于:依据回归模型对网络质量特征因子量表中的特征数据进行第一次特征训练,获取多个特征数据的属性贡献率,将属性贡献率超过预设阈值的特征数据确定为目标特征数据;依据回归模型对网络质量特征因子量表中的目标特征数据进行至少一次特征训练,得到语音质量评估模型。
在一种可选的方式中,模型训练模块320进一步用于:计算语音质量评估模型的均方误差、平均绝对误差以及模型拟合准确程度数据;依据均方误差、平均绝对误差以及模型拟合准确程度数据对语音质量评估模型进行模型评估,评估通过后得到最终的语音质量评估模型。
评估模块330,用于依据语音质量评估模型对通话语音质量进行评估。
采用本实施例的装置,通过获取通话测试日志,依据通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵;其中,关联矩阵中记录有各个维度与各个维度对应的评分;依据关联矩阵构建网络质量特征因子量表;依据回归模型对网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型;依据语音质量评估模型对通话语音质量进行评估。本装置依据通话测试日志和预设语音质量评分标准进行对标处理,通过通话测试日志包含的网络质量指标信息,进行语音质量分析,促进网络侧对语音质量进行评估分析,解决了现有技术POLQA算法对语音质量评估的成本问题。
本发明实施例提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的一种通话语音质量评估方法。
可执行指令具体可以用于使得处理器执行以下操作:
获取通话测试日志,依据通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵;其中,关联矩阵中记录有各个维度与各个维度对应的评分;
依据关联矩阵构建网络质量特征因子量表;
依据回归模型对网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型;
依据语音质量评估模型对通话语音质量进行评估。
图4示出了本发明计算设备实施例的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图4所示,该计算设备可以包括:
处理器(processor)、通信接口(Communications Interface)、存储器(memory)、以及通信总线。
其中:处理器、通信接口、以及存储器通过通信总线完成相互间的通信。通信接口,用于与其它设备比如客户端或其它服务器等的网元通信。处理器,用于执行程序,具体可以执行上述一种通话语音质量评估方法实施例中的相关步骤。
具体地,程序可以包括程序代码,该程序代码包括计算机操作指令。
处理器可能是中央处理器CPU,或者是特定集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。服务器包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器,用于存放程序。存储器可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序具体可以用于使得处理器执行以下操作:
获取通话测试日志,依据通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵;其中,关联矩阵中记录有各个维度与各个维度对应的评分;
依据关联矩阵构建网络质量特征因子量表;
依据回归模型对网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型;
依据语音质量评估模型对通话语音质量进行评估。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (10)
1.一种通话语音质量评估方法,其特征在于,包括:
获取通话测试日志,依据所述通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵;其中,所述关联矩阵中记录有各个维度与各个维度对应的评分;
依据所述关联矩阵构建网络质量特征因子量表;
依据回归模型对所述网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型;
依据所述语音质量评估模型对通话语音质量进行评估。
2.根据权利要求1所述的方法,其特征在于,所述依据所述通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵进一步包括:
从所述通话测试日志中提取多个网络测量参数作为基础数据,依据所述基础数据构建采样点级别的测量参数基础表;
采集主叫终端和被叫终端在通话过程中各个采样点对应的通话数据,并区分所述通话数据对应的测试路以及音频状态;
依据所述预设语音质量评分标准和所述测量参数基础表对各个采样点对应的通话数据进行打分处理,得到所述关联矩阵。
3.根据权利要求2所述的方法,其特征在于,所述测试路包括:放音测试路和录音测试路;所述音频状态包括:静默状态和语音状态;
所述采集主叫终端和被叫终端在通话过程中各个采样点对应的通话数据,并区分所述通话数据对应的测试路以及音频状态进一步包括:
每隔第一预设时间间隔转换测试路,采集主叫终端和被叫终端在通话过程中各个采样点对应的通话数据,并记录各个采样点对应的通话数据对应的测试路;
对各个采样点对应的通话数据进行音频识别,确定各个采样点对应的通话数据的音频状态。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述依据所述关联矩阵构建网络质量特征因子量表进一步包括:
对所述关联矩阵进行数据采样空处理和矩阵数据归一化处理,得到一维化的网络质量特征因子量表。
5.根据权利要求4所述的方法,其特征在于,所述对所述关联矩阵进行数据采样空处理和矩阵数据归一化处理,得到一维化的网络质量特征因子量表进一步包括:
针对所述关联矩阵中的空值信息,利用所述空值信息的邻近信息或者零值对所述空值信息进行填充处理;
将所述关联矩阵中纵向的第一预设时间间隔内的多个维度的数据,按照第二预设时间间隔进行数据汇总处理,构建每个维度的第一特征数据;其中,所述第二预设时间间隔小于所述第一预设时间间隔;
针对每个维度,计算该维度的第一特征数据对应的均值、方差和/或偏移量,得到该维度的第二特征数据;
将多个维度的第一特征数据和多个维度的第二特征数据作为所述网络质量特征因子量表中的特征数据。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述依据回归模型对所述网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型进一步包括:
依据回归模型对所述网络质量特征因子量表中的特征数据进行第一次特征训练,获取多个特征数据的属性贡献率,将属性贡献率超过预设阈值的特征数据确定为目标特征数据;
依据回归模型对所述网络质量特征因子量表中的目标特征数据进行至少一次特征训练,得到语音质量评估模型。
7.根据权利要求1-6任一项中所述的方法,其特征在于,所述依据回归模型对所述网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型之后,所述方法还包括:
计算所述语音质量评估模型的均方误差、平均绝对误差以及模型拟合准确程度数据;
依据所述均方误差、所述平均绝对误差以及所述模型拟合准确程度数据对所述语音质量评估模型进行模型评估,评估通过后得到最终的语音质量评估模型。
8.一种通话语音质量评估装置,其特征在于,包括:
网络质量特征因子量表构建模块,用于获取通话测试日志,依据所述通话测试日志和预设语音质量评分标准进行对标处理,得到关联矩阵;其中,所述关联矩阵中记录有各个维度与各个维度对应的评分;依据所述关联矩阵构建网络质量特征因子量表;
模型训练模块,用于依据回归模型对所述网络质量特征因子量表中的特征数据进行至少两次特征训练,得到语音质量评估模型;
评估模块,用于依据所述语音质量评估模型对通话语音质量进行评估。
9.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的一种通话语音质量评估方法对应的操作。
10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的一种通话语音质量评估方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211365885.6A CN117953918A (zh) | 2022-10-31 | 2022-10-31 | 一种通话语音质量评估方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211365885.6A CN117953918A (zh) | 2022-10-31 | 2022-10-31 | 一种通话语音质量评估方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117953918A true CN117953918A (zh) | 2024-04-30 |
Family
ID=90790963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211365885.6A Pending CN117953918A (zh) | 2022-10-31 | 2022-10-31 | 一种通话语音质量评估方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117953918A (zh) |
-
2022
- 2022-10-31 CN CN202211365885.6A patent/CN117953918A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108389592B (zh) | 一种语音质量评价方法及装置 | |
US10523809B2 (en) | Systems and methods for detecting call provenance from call audio | |
US10963803B2 (en) | System and method for machine learning based QoE prediction of voice/video services in wireless networks | |
US10284712B2 (en) | Voice quality evaluation method, apparatus, and system | |
CN105679335B (zh) | 基于无线分析的语音质量评估方法及系统 | |
Dantas Nunes et al. | Performance improvement of a non‐intrusive voice quality metric in lossy networks | |
CN110048962A (zh) | 一种网络流量分类的方法、系统及设备 | |
US9531867B2 (en) | Methods and systems for determining a voice quality score for a mobile telephone | |
CN109256148B (zh) | 一种语音质量评估方法和装置 | |
CN114627899A (zh) | 声音信号检测方法及装置、计算机可读存储介质、终端 | |
CN114067822A (zh) | 通话音频处理方法、装置、计算机设备和存储介质 | |
JP2005143074A (ja) | 品質評価装置 | |
CN110636176A (zh) | 一种通话故障检测方法、装置、设备及存储介质 | |
CN113676926B (zh) | 用户网络感知画像方法及装置 | |
JP2004343687A (ja) | 品質評価装置 | |
CN117953918A (zh) | 一种通话语音质量评估方法和装置 | |
CN113453076A (zh) | 用户视频业务质量评估方法、装置、计算设备和存储介质 | |
Ouyang et al. | CrowdMi: scalable and diagnosable mobile voice quality assessment through wireless analytics | |
Mellouk et al. | Quality of experience engineering for customer added value services: from evaluation to monitoring | |
CN110868732B (zh) | VoLTE接通无线失败的问题定位方法、系统和设备 | |
Dubin et al. | Video quality representation classification of encrypted http adaptive video streaming | |
CN111212376B (zh) | 关联实时位置及语音质量结果的方法、装置、设备及介质 | |
CN113436644A (zh) | 音质评估方法、装置、电子设备及存储介质 | |
Diallo et al. | Quality of experience for audio-visual services | |
CN114258069B (zh) | 语音通话质量评估方法、装置、计算设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |