CN112242151A - 语音质量评估装置及方法、介质和mos打分装置 - Google Patents
语音质量评估装置及方法、介质和mos打分装置 Download PDFInfo
- Publication number
- CN112242151A CN112242151A CN201910645319.2A CN201910645319A CN112242151A CN 112242151 A CN112242151 A CN 112242151A CN 201910645319 A CN201910645319 A CN 201910645319A CN 112242151 A CN112242151 A CN 112242151A
- Authority
- CN
- China
- Prior art keywords
- scoring
- test terminal
- mos
- test
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 13
- 238000012360 testing method Methods 0.000 claims abstract description 264
- 238000001303 quality assessment method Methods 0.000 claims abstract description 43
- 230000015556 catabolic process Effects 0.000 claims description 44
- 238000006731 degradation reaction Methods 0.000 claims description 44
- 238000011156 evaluation Methods 0.000 claims description 40
- 230000000977 initiatory effect Effects 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 5
- 239000004065 semiconductor Substances 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 229910044991 metal oxide Inorganic materials 0.000 claims description 3
- 150000004706 metal oxides Chemical class 0.000 claims description 3
- 239000000523 sample Substances 0.000 claims 23
- 239000012723 sample buffer Substances 0.000 claims 2
- 230000005540 biological transmission Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 7
- 230000006854 communication Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007175 bidirectional communication Effects 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
- H04L67/141—Setup of application sessions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/16—Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
- H04L69/161—Implementation details of TCP/IP or UDP/IP stack architecture; Specification of modified or new header fields
- H04L69/162—Implementation details of TCP/IP or UDP/IP stack architecture; Specification of modified or new header fields involving adaptations of sockets based mechanisms
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Computer Security & Cryptography (AREA)
- Telephonic Communication Services (AREA)
Abstract
本公开实施例是关于一种语音质量评估装置及方法、介质和MOS打分装置。该语音质量评估装置包括:自组网络单元、测试配对单元、测试连接单元、语音评分单元。本公开实施例中,一方面,所述语音质量评估装置先通过自组网络与待测试终端建立连接,建立连接后对待测终端进行主叫测试终端和被叫测试终端配对设置,设置完成后再与主叫测试终端和被叫测试终端建立用于数据传输的应用层连接,此种方式相对于现有的音频接口采用连接线进行连接,稳定性较好,相对于现有的蓝牙技术连接,相对传输速率较高,不易造成文件的丢失;另一方面,语音质量评估装置中内置有语音评分单元和MOS评分算法,不需要通过外部打分软件或者服务器端进行打分,使用起来十分方便。
Description
技术领域
本公开实施例涉及通信技术领域,尤其涉及语音质量评估装置及方法、介质和MOS打分装置。
背景技术
随着移动网络的发展,高质量的语音通信因其特有的可靠性和高QoS一直被广泛普及及应用。在网络建设过程中,对于语音质量的测试已经成为在优化过程中评判其网络质量好坏尤为重要的一环。
相关技术中,语音MOS(Mean Opinion Score,平均主观评分)测试系统由MOS盒子,手机测试终端,打分软件/后台分析系统组成,其中MOS盒子与手机测试终端通过音频接口或采用蓝牙接口进行连接,打分软件集成在PC端或后台,PC端对MOS盒子下发操作指令,MOS盒仅具有录音功能,录音后将退化的录音文件提交到外部打分软件,通过样本与退化文件的比较,完成打分。
关于上述技术方案,发明人发现至少存在如下一些技术问题:首先,采用音频接口进行连接时携带不方便且音频线的抖动会导致稳定性较差,采用蓝牙技术受限于带宽影响,传输速率过低时容易造成录音文件的丢失;其次,打分评估软件非内置于MOS盒子,而是通过外部打分软件或者服务器端进行打分,使用起来不方便;最后,大多数MOS盒子仅具有录放音操作,无交互性较好地屏幕对其进行直接操作。
因此,有必要改善上述相关技术方案中存在的一个或者多个问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例的目的在于提供一种语音质量评估装置及方法、介质和MOS打分装置,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本公开实施例的第一方面,提供一种语音质量评估装置,应用于MOS打分装置,包括:
自组网络单元,用于在搜索到预设范围内的至少两个待测试终端时,发起自组网络连接请求以与至少两个待测试终端建立自组网络连接;
测试配对单元,用于在建立自组网络链接后的所述至少两个待测试终端中确定主叫测试终端和被叫测试终端;
测试连接单元,用于与所述主叫测试终端和被叫测试终端建立预设网络连接;
语音评分单元,用于设定评分测试参数,并下发音频样本文件及该评分测试参数至主叫测试终端,以使主叫测试终端根据该评分测试参数拨叫被叫测试终端,并播放该音频样本文件而使得被叫测试终端录音得到音频退化样本;
所述语音评分单元,还用于接收被叫测试终端上传的该音频退化样本,并调用MOS评分算法比对该音频退化样本和下发的音频样本文件,以得到MOS评分值。
本公开的一种示例性实施例中,所述预设网络链接包括TCP/IP网络Socket链接;和/或,所述自组网络单元包括AP自组网络模块。
本公开的一种示例性实施例中,所述评分测试参数包括当前测试对应的评估打分时长、MOS评分算法标识、音频样本文件标识、拨叫方式、拨叫起止时刻、被叫测试终端的退化样本缓存门限;
所述语音评分单元,还用于根据该评分测试参数确定下发至主叫测试终端的音频样本文件;和/或,所述语音评分单元,还用于下发该评分测试参数至被叫测试终端,以使该被叫测试终端在该音频退化样本缓存量达到该缓存门限时上传该音频退化样本。
本公开的一种示例性实施例中,还包括存储单元,用于存储以下至少一项:
所述评分测试参数;
至少一个音频样本文件;
至少一种MOS评分算法。
测试过程日志信息;
MOS评分值;
主叫测试终端和被叫测试终端设备属性参数。
本公开的一种示例性实施例中,还包括定位单元,用于获取测试过程中评估装置的位置信息,所述存储单元还用于存储该位置信息。
本公开的一种示例性实施例中,还包括显示交互单元,用于至少呈现所述MOS评分值、位置信息和日志信息中的一个或多个。
本公开的实施例提供的技术方案可以包括以下有益效果:通过上述语音质量评估装置,一方面,所述语音质量评估装置与待测试终端先通过自组网络建立连接,建立连接后对待测终端进行主叫测试终端和被叫测试终端的配对设置,设置完成后再与主叫测试终端和被叫测试终端建立用于数据传输的应用层连接,此种方式相对于现有的音频接口采用连接线进行连接,稳定性较好,相对于现有的蓝牙技术连接,相对传输速率较高,不易造成文件的丢失;另一方面,语音质量评估装置中内置有语音评分单元和MOS评分算法,不需要通过外部打分软件或者服务器端进行打分,使用起来十分方便。
根据本公开实施例的第二方面,提供一种语音质量评估方法,应用于MOS打分装置,该方法包括以下步骤:
MOS打分装置在搜索到预设范围内的至少两个待测试终端时,发起自组网络连接请求以与至少两个待测试终端建立自组网络链接;
在建立自组网络链接后的所述至少两个待测试终端中确定主叫测试终端和被叫测试终端;
与所述主叫测试终端和被叫测试终端建立预设网络链接;
设定评分测试参数,并下发音频样本文件及该评分测试参数至主叫测试终端,以使主叫测试终端根据该评分测试参数拨叫被叫测试终端,并播放该音频样本文件而使得被叫测试终端录音得到音频退化样本;
接收被叫测试终端上传的该音频退化样本,并调用MOS评分算法比对该音频退化样本和下发的音频样本文件,以得到MOS评分值。
本公开的一种示例性实施例中,所述预设网络链接包括TCP/IP网络Socket链接。
本公开的一种示例性实施例中,所述评分测试参数包括当前测试对应的评估打分时长、MOS评分算法标识、音频样本文件标识、拨叫方式、拨叫起止时刻、被叫测试终端的退化样本缓存门限;
下发音频样本文件及该评分测试参数至主叫测试终端的步骤,包括:
根据该评分测试参数确定下发至主叫测试终端的音频样本文件;
和/或,下发该评分测试参数至被叫测试终端,以使该被叫测试终端在该音频退化样本缓存量达到该缓存门限时上传该音频退化样本。
本公开的一种示例性实施例中,所述MOS打分装置中存储有以下至少一项:
所述评分测试参数;
至少一个音频样本文件;
至少一种MOS评分算法。
测试过程日志信息;
MOS评分值;
主叫测试终端和被叫测试终端设备属性参数。
本公开的一种示例性实施例中,该方法还包括:
获取测试过程中评估装置的位置信息并存储。
本公开的一种示例性实施例中,该MOS打分装置包括显示屏,该方法还包括:
通过显示屏至少呈现所述MOS评分值、位置信息和日志信息中的一个或多个。
根据本公开实施例的第三方面,提供一种MOS打分装置,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述实施例所述语音质量评估方法的步骤。
本公开的一种示例性实施例中,还包括显示器、无线收发器、MOS打分单元、接口单元和定位模组,分别与所述处理器连接;其中,该MOS打分单元为可编程逻辑器件构成。
根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所述语音质量评估方法的步骤。
由于本公开的语音质量评估方法、MOS打分装置及计算机可读存储介质都涵盖了本公开的语音质量评估装置,故本公开的语音质量评估方法、MOS打分装置及计算机可读存储介质都包括前述语音质量评估装置所产生的有益技术效果,在此不在赘述。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开示例性实施例中一语音质量评估装置示意图;
图2示出本公开示例性实施例中另一语音质量评估装置示意图;
图3示出本公开示例性实施例中另一语音质量评估装置示意图;
图4示出本公开示例性实施例中另一语音质量评估装置示意图;
图5示出本公开示例性实施例中一语音质量评估方法步骤流程图;
图6示出本公开示例性实施例中另一语音质量评估方法步骤流程图;
图7示出本公开示例性实施例中另一语音质量评估方法步骤流程图;
图8示出本公开示例性实施例中另一语音质量评估方法步骤流程图;
图9示出本公开示例性实施例中一具体实施例中语音质量评估方法步骤流程图;
图10示出本公开示例性实施例中一MOS打分装置示意图;
图11示出本公开示例性实施例中另一MOS打分装置示意图;
图12示出本公开示例性实施例中一种程序产品示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
如背景技术部分所描述的内容,相关技术中语音MOS(Mean Opinion Score,平均主观评分)测试系统由MOS盒子,手机测试终端,打分软件/后台分析系统组成,其中MOS盒与手机测试终端通过音频接口或采用蓝牙接口进行连接,携带不方便且音频线的抖动会导致稳定性较差;打分软件集成在PC端或后台,PC端对MOS盒子下发操作指令,使用起来十分不方便。
本示例实施方式中首先提供了一种语音质量评估装置,该评估装置可以应用于一终端设备,例如可以是手机、个人数字助理、笔记本电脑、平板电脑等移动终端。
参考图1中所示,该评估装置可以包括:自组网络单元101,用于在搜索到预设范围内的至少两个待测试终端时,发起自组网络连接请求以与至少两个待测试终端建立自组网络连接;测试配对单元102,用于在建立自组网络链接后的所述至少两个待测试终端中确定主叫测试终端和被叫测试终端;测试连接单元103,用于与所述主叫测试终端和被叫测试终端建立预设网络连接;语音评分单元104,用于设定评分测试参数,并下发音频样本文件及该评分测试参数至主叫测试终端,以使主叫测试终端根据该评分测试参数拨叫被叫测试终端,并播放该音频样本文件而使得被叫测试终端录音得到音频退化样本;所述语音评分单元104,还用于接收被叫测试终端上传的该音频退化样本,并调用MOS评分算法比对该音频退化样本和下发的音频样本文件,以得到MOS评分值。
通过上述语音质量评估装置,一方面,所述语音质量评估装置与待测试终端先通过自组网络建立连接,建立连接后对待测终端进行主叫测试终端和被叫测试终端的配对设置,设置完成后再与主叫测试终端和被叫测试终端建立用于数据传输的应用层连接,此种方式相对于现有的音频接口采用连接线进行连接,稳定性较好,相对于现有的蓝牙技术连接,相对传输速率较高,不易造成文件的丢失;另一方面,语音质量评估装置中内置有语音评分单元和MOS评分算法,不需要通过外部打分软件或者服务器端进行打分,使用起来十分方便。
下面,将参考图1对本示例实施方式中的上述评分装置的各个单元进行更详细的说明。
具体的,当需要进行语音质量评估时,该评估装置的自组网络单元101在预设范围内搜索待测试终端,所述预设范围即为自组网络的网络信号覆盖范围,待测试终端至少有两个也可以有多个,自组网络单元101搜索到待测试终端后发起自组网络连接请求,待测试终端接收到请求后与该评估装置建立自组网络连接;在待测试终端与该评估装置建立自组网络连接后,测试配对单元102对至少两个待测试终端进行配对设定,分别确定主叫测试终端和被叫测试终端;配对完成后,该评估装置与主叫测试终端和被叫测试终端通过测试连接单元103建立预设网络连接,所述预设网络连接可以是用于数据传输的应用层连接;预设网络连接建立后,语音评分单元104根据评分需求设定相应的评分测试参数,并将音频样本文件及评分测试参数下发至主叫测试终端,主叫测试终端根据评分测试参数的指示拨叫被叫测试终端并播放音频样本文件,被叫测试终端接收到主叫测试终端的拨叫后进行接听并对接听到的播放内容进行录音从而得到音频退化样本,被叫测试终端将音频退化样本上传至该评估装置,所述语音评分单元104接收到该音频退化样本后调用相应的MOS评分算法比对该音频退化样本和下发的音频样本文件,以得到MOS评分值。
在一个实施例中,所述预设网络连接可以包括TCP/IP网络Socket连接;和/或,所述自组网络单元可以包括AP自组网络模块。
具体的,所述TCP/IP是传输层协议,主要解决数据如何在网络中传输,Socket是对TCP/IP协议的封装,通过Socket才能使用TCP/IP协议。网络上的两个程序通过一个双向的通信连接实现数据的交换,这个连接的一端称为一个Socket,Socket连接比较稳定,一般情况下不会主动断掉,当评估装置只建立一路测试时,则建立一个Socket连接,当评估装置建立多路测试时,则需要建立多路Socket连接。所述预设网络连接还可以包括UDP网络,当然并不限于此。自组网络单元可以包括AP自组网络模块,无线接入点AP是无线局域网的一种典型应用。AP是Access Point的简称,就是所谓的“无线访问节点”,无线AP是无线网和有线网之间沟通的桥梁,是组建无线局域网(WLAN)的核心设备,它主要是提供无线工作站和有线局域网之间的互相访问,这样,在AP信号覆盖范围内的无线工作站可以通过它进行相互通信,当然并不限于此。
在一个实施例中,所述评分测试参数可以包括当前测试对应的评估打分时长、MOS评分算法标识、音频样本文件标识、拨叫方式、拨叫起止时刻、被叫测试终端的退化样本缓存门限;所述语音评分单元103,还用于根据该评分测试参数确定下发至主叫测试终端的音频样本文件;和/或,所述语音评分单元,还用于下发该评分测试参数至被叫测试终端,以使该被叫测试终端在该音频退化样本缓存量达到该缓存门限时上传该音频退化样本。
具体的,所述MOS评分算法标识指的是MOS评分算法的序号或者名称,音频样本文件标识指的是音频样本文件的序号或者标识;缓存门限指的是被叫测试终端可缓存的退化样本的总量,缓存门限可以是根据缓存容量设定,即以缓存音频退化样本的内存大小设置门限值,也可以是缓存时长门限,即以缓存音频退化样本的音频时长设置门限值,当然并不限于此。
所述语音评分单元103根据评分需求设定评分测试参数,评分测试参数中可以包括音频样本文件标识,语音评分单元103根据音频样本文件标识将相应的音频样本文件下发至主叫测试终端,主叫测试终端根据评分测试参数的指示拨叫被叫测试终端并播放该音频样本文件;所述语音评分单元103还可以将评分测试参数发送至被叫测试终端,被叫测试终端根据评分测试参数的指示在音频退化样本缓存量达到缓存门限时上传该音频退化样本。
在一个实施例中,参考图2所示,还可以包括存储单元105,用于存储以下至少一项:所述评分测试参数;至少一个音频样本文件;至少一种MOS评分算法;测试过程日志信息;MOS评分值;主叫测试终端和被叫测试终端设备属性参数。所述存储单元105至少存储有一个音频样本文件,也可以有多个,多个音频样本文件可组成样音频样本文件库,在进行语音质量评估时根据评估需求在音频样本文件库中调用相应的音频样本文件;所述存储单元105至少存储有一种MOS评分算法,也可以有多个,多个MOS评分算法可组成样MOS评分算法库,在进行语音质量评估时根据评估需求在MOS评分算法库中调用相应的MOS评分算法,所述MOS评分算法可以包括:主观语音质量评估(Perceptual evaluation of speechquality,PESQ)、知觉通话质量测试(Perceptual speech quality measure,PSQM)、知觉分析测量(Perceptual analysis measurement stystem,PAMS)、客观感知语音质量评估算法(Perceptual objective listening quality assessment,POLQA);主叫测试终端和被叫测试终端设备属性参数可以包括:测试终端的IP地址、GPU性能指标,当然并不限于此。
在一个实施例中,参考图3所示,还可以包括定位单元106,用于获取测试过程中评估装置的位置信息,所述存储单元105还用于存储该位置信息。所述自组网络单元101还可以包括SIM移动网络模块,SIM移动网络模块提供移动制式网络连接,完成定位单元106的GPS或北斗连接,定位单元106连接后可以获取测试过程中评估装置的位置信息并发送至存储单元105进行存储,当然并不限于此。
在一个实施例中,参考图4所示,还可以包括显示交互单元107,用于至少呈现所述MOS评分值、位置信息和日志信息中的一个或多个。所述显示交互单元107在所述评估装置进行评估的过程中可以实时呈现交互操作,并可以呈现MOS评分值、评估装置位置信息、日志信息等,当然并不限于此。
关于上述实施例中的评估装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。作为模块或单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现木公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本示例实施方式中其次提供了一种语音质量评估方法,应用于MOS打分装置,该方法包括以下步骤:
步骤S101:MOS打分装置在搜索到预设范围内的至少两个待测试终端时,发起自组网络连接请求以与至少两个待测试终端建立自组网络链接;
步骤S102:在建立自组网络链接后的所述至少两个待测试终端中确定主叫测试终端和被叫测试终端;
步骤S103:与所述主叫测试终端和被叫测试终端建立预设网络连接;
步骤S104:设定评分测试参数,并下发音频样本文件及该评分测试参数至主叫测试终端,以使主叫测试终端根据该评分测试参数拨叫被叫测试终端,并播放该音频样本文件而使得被叫测试终端录音得到音频退化样本;
步骤S105:接收被叫测试终端上传的该音频退化样本,并调用MOS评分算法比对该音频退化样本和下发的音频样本文件,以得到MOS评分值。
下面,将参考图5对本示例实施方式中的上述方法的各个步骤进行更详细的说明。
在步骤S101中:所述预设范围即为MOS打分装置自组网络的网络信号覆盖范围,待测试终端至少有两个也可以有多个,自组网络单元搜索到待测试终端后发起自组网络连接请求,待测试终端接收到请求后与该评估装置建立自组网络连接。
在步骤S102中:在建立自组网络连接后,MOS打分装置在所述至少两个待测试终端中确定主叫测试终端和被叫测试终端,待测试终端至少有两个也可以有多个。
在步骤S103中:MOS打分装置与主叫测试终端和被叫测试终端建立预设网络连接,所述预设网络连接可以是用于数据传输的应用层连接。
在步骤S104中:MOS打分装置设置相应的评分参数,并将音频样本文件即相应的额评分参数下发至主叫测试终端,主叫测试终端根据评分测试参数的指示拨叫被叫测试终端并播放音频样本文件,被叫测试终端接收到主叫测试终端的拨叫后进行接听并对接收到的播放内容进行录音从而得到音频退化样本。
在步骤S105中:被叫测试终端将音频退化样本上传至MOS打分装置,MOS打分装置接收到该音频退化样本后调用相应的MOS评分算法比对该音频退化样本和下发的音频样本文件,以得到MOS评分值。
在一个实施例中,所述预设网络链接包括TCP/IP网络Socket链接。所述TCP/IP是传输层协议,主要解决数据如何在网络中传输,Socket是对TCP/IP协议的封装,通过Socket才能使用TCP/IP协议。网络上的两个程序通过一个双向的通信连接实现数据的交换,这个连接的一端称为一个Socket,Socket连接比较稳定,一般情况下不会主动断掉,当MOS打分装置只建立一路测试时,则建立一个Socket连接,当评估装置建立多路测试时,则需要建立多路Socket连接。所述预设网络连接还可以包括UDP网络,当然并不限于此。
在一个实施例中,所述评分测试参数包括当前测试对应的评估打分时长、MOS评分算法标识、音频样本文件标识、拨叫方式、拨叫起止时刻、被叫测试终端的退化样本缓存门限;
参考图6所示,下发音频样本文件及该评分测试参数至主叫测试终端的步骤,包括:
根据该评分测试参数确定下发至主叫测试终端的音频样本文件;和/或,下发该评分测试参数至被叫测试终端,以使该被叫测试终端在该音频退化样本缓存量达到该缓存门限时上传该音频退化样本。
具体的,所述MOS评分算法标识指的是MOS评分算法的序号或者名称,音频样本文件标识指的是音频样本文件的序号或者标识;缓存门限指的是被叫测试终端可缓存的退化样本的总量,缓存门限可以是根据缓存容量设定,即以缓存音频退化样本的内存大小设置门限值,也可以是缓存时长门限,即以缓存音频退化样本的音频时长设置门限值,当然并不限于此。
所述MOS打分装置根据评分需求设定评分参数,根据该评分测试参数确定下发至主叫测试终端的音频样本文件并将音频样本文件和所述评分测试参数下发至主叫测试终端;所述MOS打分装置还需要将评分测试参数发送至被叫测试终端,被叫测试终端根据评分测试参数的指示在音频退化样本缓存量达到缓存门限时上传该音频退化样本。
在一个实施例中,所述MOS打分装置中存储有以下至少一项:所述评分测试参数;至少一个音频样本文件;至少一种MOS评分算法;测试过程日志信息;MOS评分值;主叫测试终端和被叫测试终端设备属性参数。所述MOS打分装置中至少存储有一个音频样本文件,也可以有多个,多个音频样本文件可组成样音频样本文件库,在进行语音质量评估时根据评估需求在音频样本文件库中调用相应的音频样本文件;所述储存单元至少存储有一种MOS评分算法,也可以有多个,多个MOS评分算法可组成样MOS评分算法库,在进行语音质量评估时根据评估需求在MOS评分算法库中调用相应的MOS评分算法,所述MOS评分算法可以包括:主观语音质量评估(Perceptual evaluation of speech quality,PESQ)、知觉通话质量测试(Perceptual speech quality measure,PSQM)、知觉分析测量(Perceptual analysismeasurement stystem,PAMS)、客观感知语音质量评估算法(Perceptual objectivelistening quality assessment,POLQA);主叫测试终端和被叫测试终端设备属性参数可以包括:测试终端的IP地址、GPU性能指标,当然并不限于此。
在一个实施例中,参考图7所示,该方法还包括:
步骤S106:获取测试过程中评估装置的位置信息并存储。
所述MOS打分装置完成GPS或北斗连接后,获取测试过程中评估装置的位置信息并存储所述位置信息
在一个实施例中,该MOS打分装置包括显示屏,该方法还包括:
步骤S107:通过显示屏至少呈现所述MOS评分值、位置信息和日志信息中的一个或多个。
所述显示屏还可以呈现MOS打分装置在进行评估的过程中实时交互操作信息,当然并不限于此。
在一个具体的实施例中,参考图9所示,语音质量评估方法可以包括以下步骤:
步骤S201:MOS打分装置发起自组网络连接请求与待测试终端建立自组网络链接;
步骤S202:确定待测试终端中的主叫测试终端和被叫测试终端;
步骤S203:MOS打分装置与所述主叫测试终端和被叫测试终端建立Socket连接;
步骤S204:MOS打分装置设定评分测试参数,并下发音频样本文件及该评分测试参数至主叫测试终端,主叫测试终端拨叫被叫测试终端;
步骤S205:主叫测试终端和被叫测试终端同步分别开始放音和录音处理;
步骤S206:被叫测试终端缓存录音得到的音频退化样本;
步骤S207:判断被叫测试终端的缓存容量是否达到缓存门限;
步骤S208:若是,将缓存样本上报至MOS打分装置;
步骤S209:MOS打分装置根据选定的MOS评分算法进行语音质量打分;
步骤S210:打分结果存储至MOS打分装置并在显示屏进行显示,同时将打分结果发送至主叫测试终端和被叫测试终端;
步骤S211:分析评分测试参数中的打分评估时长,判断剩余的评估测试时间的时长是否足够进行一次MOS打分;若是,则继续执行步骤S205及之后的步骤;
步骤S212:若否,则MOS打分装置断开与所述主叫测试终端和被叫测试终端的Socket连接。
需要说明的是,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。另外,也易于理解的是,这些步骤可以是例如在多个模块/进程/线程中同步或异步执行。
进一步的,本示例实施方式中还提供了一种MOS打分装置,参考图10所示,包括:处理器201;以及存储器202,用于存储所述处理器201的可执行指令;其中,所述处理器201配置为经由执行所述可执行指令来执行上述实施例所述语音质量评估方法的步骤。
在一个实施例中,参考图11所示,还包括显示器203、无线收发器204、MOS打分单元205、接口单元206和定位模组207,分别与所述处理器连接;其中,该MOS打分单元为可编程逻辑器件构成。
所述处理器进行指令的下发和任务的调度,处理器与无线收发器通过异步收发传输器(Universal Asynchronous Receiver/Transmitter,UART)进行通信连接,处理器控制无线收发器与所述测试终端建立网络连接;处理器与MOS打分单元通过串行外设接口(Serial Peripheral Interface,SPI)进行通信连接,调用MOS评分算法并控制MOS打分单元进行打分;接口单元可以外接测试装置,用以获取测试过程中MOS打分装置所在的位置信息,实施信令解码,并根据需求可打印测试过程日志信息,当然并不限于此。
本示例实施方式中最后提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所述语音质量评估方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述语音质量评估方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图12所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品300,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述语音质量评估方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
Claims (15)
1.一种语音质量评估装置,其特征在于,应用于MOS打分装置,包括:
自组网络单元,用于在搜索到预设范围内的至少两个待测试终端时,发起自组网络连接请求以与至少两个待测试终端建立自组网络连接;
测试配对单元,用于在建立自组网络连接后的所述至少两个待测试终端中确定主叫测试终端和被叫测试终端;
测试连接单元,用于与所述主叫测试终端和被叫测试终端建立预设网络连接;
语音评分单元,用于设定评分测试参数,并下发音频样本文件及该评分测试参数至主叫测试终端,以使主叫测试终端根据该评分测试参数拨叫被叫测试终端,并播放该音频样本文件而使得被叫测试终端录音得到音频退化样本;
所述语音评分单元,还用于接收被叫测试终端上传的该音频退化样本,并调用MOS评分算法比对该音频退化样本和下发的音频样本文件,以得到MOS评分值。
2.根据权利要求1所述评估装置,其特征在于,所述预设网络连接包括TCP/IP网络Socket连接;和/或,所述自组网络单元包括AP自组网络模块。
3.根据权利要求2所述评估装置,其特征在于,所述评分测试参数包括当前测试对应的评估打分时长、MOS评分算法标识、音频样本文件标识、拨叫方式、拨叫起止时刻、被叫测试终端的退化样本缓存门限;
所述语音评分单元,还用于根据该评分测试参数确定下发至主叫测试终端的音频样本文件;和/或,所述语音评分单元,还用于下发该评分测试参数至被叫测试终端,以使该被叫测试终端在该音频退化样本缓存量达到该缓存门限时上传该音频退化样本。
4.根据权利要求3所述评估装置,其特征在于,还包括存储单元,用于存储以下至少一项:
所述评分测试参数;
至少一个音频样本文件;
至少一种MOS评分算法;
测试过程日志信息;
MOS评分值;
主叫测试终端和被叫测试终端设备属性参数。
5.根据权利要求4所述评估装置,其特征在于,还包括定位单元,用于获取测试过程中评估装置的位置信息,所述存储单元还用于存储该位置信息。
6.根据权利要求5所述评估装置,其特征在于,还包括显示交互单元,用于至少呈现所述MOS评分值、位置信息和日志信息中的一个或多个。
7.一种语音质量评估方法,其特征在于,应用于MOS打分装置,该方法包括以下步骤:
MOS打分装置在搜索到预设范围内的至少两个待测试终端时,发起自组网络连接请求以与至少两个待测试终端建立自组网络链接;
在建立自组网络链接后的所述至少两个待测试终端中确定主叫测试终端和被叫测试终端;
与所述主叫测试终端和被叫测试终端建立预设网络链接;
设定评分测试参数,并下发音频样本文件及该评分测试参数至主叫测试终端,以使主叫测试终端根据该评分测试参数拨叫被叫测试终端,并播放该音频样本文件而使得被叫测试终端录音得到音频退化样本;
接收被叫测试终端上传的该音频退化样本,并调用MOS评分算法比对该音频退化样本和下发的音频样本文件,以得到MOS评分值。
8.根据权利要求7所述评估方法,其特征在于,所述预设网络链接包括TCP/IP网络Socket链接。
9.根据权利要求8所述评估方法,其特征在于,所述评分测试参数包括当前测试对应的评估打分时长、MOS评分算法标识、音频样本文件标识、拨叫方式、拨叫起止时刻、被叫测试终端的退化样本缓存门限;
下发音频样本文件及该评分测试参数至主叫测试终端的步骤,包括:
根据该评分测试参数确定下发至主叫测试终端的音频样本文件;
和/或,下发该评分测试参数至被叫测试终端,以使该被叫测试终端在该音频退化样本缓存量达到该缓存门限时上传该音频退化样本。
10.根据权利要求9所述评估方法,其特征在于,所述MOS打分装置中存储有以下至少一项:
所述评分测试参数;
至少一个音频样本文件;
至少一种MOS评分算法。
测试过程日志信息;
MOS评分值;
主叫测试终端和被叫测试终端设备属性参数。
11.根据权利要求9所述评估方法,其特征在于,该方法还包括:
获取测试过程中评估装置的位置信息并存储。
12.根据权利要求11所述评估方法,其特征在于,该MOS打分装置包括显示屏,该方法还包括:
通过显示屏至少呈现所述MOS评分值、位置信息和日志信息中的一个或多个。
13.一种MOS打分装置,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求7~12任一项所述语音质量评估方法的步骤。
14.根据权利要求13所述打分装置,其特征在于,还包括显示器、无线收发器、MOS打分单元、接口单元和定位模组,分别与所述处理器连接;其中,该MOS打分单元为可编程逻辑器件构成。
15.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时实现权利要求7~12任一项所述语音质量评估方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910645319.2A CN112242151A (zh) | 2019-07-17 | 2019-07-17 | 语音质量评估装置及方法、介质和mos打分装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910645319.2A CN112242151A (zh) | 2019-07-17 | 2019-07-17 | 语音质量评估装置及方法、介质和mos打分装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112242151A true CN112242151A (zh) | 2021-01-19 |
Family
ID=74167201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910645319.2A Pending CN112242151A (zh) | 2019-07-17 | 2019-07-17 | 语音质量评估装置及方法、介质和mos打分装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112242151A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112951274A (zh) * | 2021-02-07 | 2021-06-11 | 脸萌有限公司 | 语音相似度确定方法及设备、程序产品 |
CN117411969A (zh) * | 2023-12-14 | 2024-01-16 | 致讯科技(天津)有限公司 | 一种非标语料的用户感知评测方法及装置 |
-
2019
- 2019-07-17 CN CN201910645319.2A patent/CN112242151A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112951274A (zh) * | 2021-02-07 | 2021-06-11 | 脸萌有限公司 | 语音相似度确定方法及设备、程序产品 |
CN117411969A (zh) * | 2023-12-14 | 2024-01-16 | 致讯科技(天津)有限公司 | 一种非标语料的用户感知评测方法及装置 |
CN117411969B (zh) * | 2023-12-14 | 2024-03-12 | 致讯科技(天津)有限公司 | 一种非标语料的用户感知评测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101534353B (zh) | 一种无线网络语音质量测量方法及终端 | |
JP6336577B2 (ja) | 通信システム | |
CN109274405B (zh) | 数据传输方法、装置、电子设备及计算机可读介质 | |
CN109548103B (zh) | 用于切换网络的方法和装置 | |
CN111199743B (zh) | 音频编码格式确定方法、装置、存储介质及电子设备 | |
CN112786070B (zh) | 音频数据处理方法、装置、存储介质与电子设备 | |
JP6087950B2 (ja) | 通信システム及び通信方法 | |
CN112242151A (zh) | 语音质量评估装置及方法、介质和mos打分装置 | |
US20240340233A1 (en) | Method, apparatus, medium and electronic device for network access | |
US11822854B2 (en) | Automatic volume adjustment method and apparatus, medium, and device | |
CN112867074A (zh) | 数据传输方法、电子设备及存储介质 | |
CN113890822A (zh) | 日志处理方法、日志处理装置、存储介质与电子设备 | |
KR101291654B1 (ko) | Cpns 환경에서 종단 단말기가 다수의 이동통신 단말기에 연결되어 서비스를 제공받기 위한 방법 및 시스템과 이를 위한 cpns 서버 및 종단 단말기 | |
JP5878148B2 (ja) | 音声品質測定システム | |
CN112954602A (zh) | 语音控制方法、传输方法、装置、电子设备及存储介质 | |
CN116633823A (zh) | 异网宽带用户识别方法、装置、设备及存储介质 | |
CN114827516A (zh) | 视频通话方法及装置 | |
CN114639392A (zh) | 音频处理方法、装置、电子设备及存储介质 | |
CN106714226A (zh) | 一种语音质量评估方法、装置及系统 | |
JP2011003066A (ja) | 情報取得装置、情報取得プログラム | |
CN113495712A (zh) | 自动音量调整方法、装置、介质和设备 | |
KR100929531B1 (ko) | 음성 인식을 이용한 무선 환경에서의 정보 제공 시스템 및그 방법 | |
CN100379210C (zh) | 通信系统回波特性的在线测试方法及测试系统 | |
US11019178B1 (en) | Deployment router based on channel traffic | |
JP2008182319A (ja) | ストリームデータ再生システム、携帯端末機およびストリームデータ再生方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20211228 Address after: 518000 Zhongnan communication tower, South China Road, Nanshan District high tech Industrial Park, Shenzhen, Guangdong Applicant after: ZTE Corp. Address before: 201308 building C, No. 888, Huanhu West 2nd Road, Nanhui new town, Pudong New Area, Shanghai Applicant before: ZTE NETARTIST TECHNOLOGIES (SHANGHAI) Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |