CN112382313A - 一种音频通讯质量评价系统及方法 - Google Patents
一种音频通讯质量评价系统及方法 Download PDFInfo
- Publication number
- CN112382313A CN112382313A CN202011394753.7A CN202011394753A CN112382313A CN 112382313 A CN112382313 A CN 112382313A CN 202011394753 A CN202011394753 A CN 202011394753A CN 112382313 A CN112382313 A CN 112382313A
- Authority
- CN
- China
- Prior art keywords
- audio
- audio signal
- standard
- module
- sampled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 27
- 230000005236 sound signal Effects 0.000 claims abstract description 215
- 238000006243 chemical reaction Methods 0.000 claims abstract description 29
- 239000012634 fragment Substances 0.000 claims description 92
- 238000005070 sampling Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 28
- 238000004458 analytical method Methods 0.000 claims description 18
- 238000000926 separation method Methods 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 14
- 230000001360 synchronised effect Effects 0.000 claims description 10
- 238000012360 testing method Methods 0.000 abstract description 39
- 230000005540 biological transmission Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 13
- 238000002372 labelling Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 238000010998 test method Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q5/00—Selecting arrangements wherein two or more subscriber stations are connected by the same line to the exchange
- H04Q5/24—Selecting arrangements wherein two or more subscriber stations are connected by the same line to the exchange for two-party-line systems
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephone Function (AREA)
Abstract
本发明涉及一种音频通讯质量评价系统及方法,通过对采样音频信号切片、频域转换之后得到的音频特征值与标准音频信号比较评分了解输出后的音频质量与标准音频信号之间的差异,直接用真人语音作为信号源对终端产品进行测试,提高测试准确度,能够为人们接受。
Description
技术领域
本发明涉及一种音频传输检测领域,尤其涉及一种音频通讯质量评价系统及方法。
背景技术
在现有技术中,需要对音频或视频传输使用的设备进行音频传输、视频传输等性能是否符合规定的各项指标做检测(检验)或测试,只有当这些检测或测试所获得结果符合规定的各项标准要求,才能保证这些音频或视频设备是可用且好用、质量是有保障的,进而,才能将这些设备进行生产和实际应用。随着音频、视频传输设备的各项技术的不断进步,对设备以及设备配合使用时的各方面的性能要求也在不断更新进步中。因此,对于设备检测(检验)的技术,也随之不断改进以便提高检测检验结果的准确性和精确度。以应用于住宅楼宇出入口控制的楼宇对讲系统为例,对其使用的设备以及系统整体上的音频传输特性的检测(检验)或测试就是整个对讲系统检测最为重要的部分。已知的楼宇对讲系统的音频传输质量测试的试验方法是评价楼宇对讲系统产品音频传输质量的一整套全程声测试的试验方法,其包括了5项技术参数(如:响度评定值、频率响应/频响、失真、信噪比、侧音掩蔽评定值)的测试和计算。该已有的测试方法中,对输出端的音频信号检测则专注于对其频响、失真及振幅特性的技术特性的评测。其中,还原度,是指信号源输入的原片频谱的形状与输出端的采样片频谱形状的一致性,其是音频测量中评测设备和系统整体性能尤其是输出性能的一个重要技术参数。而由于现有技术缺少对输出端的输出信号还原度进行直接测试和判断,导致对设备和系统性能尤其输出性能的测评并不精确。并且,现有的测试方式中还存在以下缺陷:用频响来判断设备的性能太粗燥,测试结果和实际使用有差异,测试结果有局限性,实际设备和系统应用时,实际存在的音频信号都是多频点信号(如:人发声为N个频点/频率的各种叠加),而现有的失真测试是使用单频点(即单纯的200Hz、400Hz等)进行,与实际的多频点的失真情况并不一致,导致利用该测试的失真来判别还原度也不准确。因而,最终导致现有的音频信号的检测结果并不准确或者说精确度不高,与实际的主观评测差距较大。
随着人工智能的出现,对终端产品测试要求也相应提高,用传统测试方法不能满足现终端产品要求。
发明内容
基于现有技术中存在的上述缺陷,本申请的主要目的是提供一种音频信号还原度检测系统及方法,以提高音频信号还原度测试的准确度、精确度。进一步,提高了对设备、系统等的音频信号性能测试整体的精确度。为了解决上述现有技术中的技术缺陷,本申请的目的是通过以下技术方案来实现的。
一种音频通讯质量评价系统,其特征在于:
包括音频采集装置和音频通讯质量评价装置,二者电性连接;
其中,预设一标准音频信号,所述标准音频信号在被测设备中传输,最后作为被测输出的音频信号由被测设备的输出端输出;
所述音频采集装置用于采集所述被测设备输出的音频信号得到采样音频信号,并将采样音频信号发给音频通讯质量评价装置;
所述音频通讯质量评价装置用于接收所述采样音频信号以及接收标准音频信号,对所述采样音频信号和所述标准音频信号做同步处理,并将所述采样音频信号和所述标准音频信号按照相同的时间间隔进行切片和比对分析,得出评分结果。
其特征在于,所述音频通讯质量评价装置包括:
接收模块,用于获取所述标准音频信号,并与所述音频采集装置连接,从所述音频采集装置接收所述采样音频信号,将所述标准音频信号和所述采样音频信号发送给延时处理模块;
延时处理模块,与接收模块连接,用于扣除所述采样音频信号与所述标准音频信号相比的延迟时间,使所述采样音频信号与所述标准音频信号同步;
切片模块,分别与延时处理模块连接,用于对从延时处理模块处接收与所述标准音频信号同步后的所述采样音频信号按照预设的时间间隔进行切片,获得所述采样音频碎片;
频域转换模块,与所述切片模块连接,用于对所述采样音频碎片进行频谱转换,在频域中获取所述采样音频碎片的声音特征值;
所述分离标记模块,与所述频域转换模块连接,用于分析每一片所述采样音频碎片的声音特征值,将声音强度大于阈值的所述采样音频碎片标记成话音信号,将声音强度小于等于阈值的所述采样音频碎片标记成间隙信号;
所述评分模块,与分离标记模块连接,用于将属于话音信号的每一片所述采样音频碎片的声音特征值与存储的对应的标准音频碎片的声音特征值进行比较评分,属于间隙信号的所有所述采样音频碎片不参与评分,所述评分模块将所有属于话音信号的每一片所述采样音频碎片的评分进行累加,求平均得到平均分数值。
其特征在于,所述切片模块与所述接收模块连接并从所述接收模块接收所述标准音频信号并按照所述预设的时间间隔进行切片,获得标准音频碎片;所述频域转换模块对所述标准音频碎片进行频谱转换,在频域中获取所述标准音频碎片的声音特征值;一存储模块,存储所述标准音频碎片的声音特征值。
其特征在于,所述预设的时间间隔是20ms。
一种音频质量评分方法,其特征在于:使用如上述的一种音频通讯质量评价系统,具有如下步骤:
步骤S1,预设一标准音频信号,所述标准音频信号在被测设备中传输,最后作为被测输出的音频信号由被测设备的输出端输出;
步骤S2,音频采集装置采集所述被测设备输出的音频信号得到采样音频信号,并将采样音频信号发给音频通讯质量评价装置;
步骤S3,所述音频通讯质量评价装置接收所述采样音频信号以及标准音频信号,对所述采样音频信号和所述标准音频信号做同步处理,并将所述采样音频信号和所述标准音频信号按照相同的时间间隔进行切片和比对分析,得出评分结果。
其特征在于,
步骤S3包括如下步骤:
步骤S31,接收模块获取所述标准音频信号,并从所述音频采集装置接收所述采样音频信号,将所述标准音频信号和所述采样音频信号发送给延时处理模块;
步骤S32,所述延时处理模块扣除所述采样音频信号与所述标准音频信号相比的延迟时间,使所述采样音频信号与所述标准音频信号同步;
步骤S33,切片模块对从延时处理模块处接收与所述标准音频信号同步后的所述采样音频信号按照预设的时间间隔进行切片,获得所述采样音频碎片;
步骤S34,频域转换模块对所述采样音频碎片进行频谱转换,在频域中获取所述采样音频碎片的声音特征值;
步骤S35,分离标记模块分析每一片所述采样音频碎片的声音特征值,将声音强度大于一阈值的所述采样音频碎片标记成话音信号,将声音强度小于等于所述阈值的所述采样音频碎片标记成间隙信号;
步骤S36,评分模块将被标记成话音信号的每一片所述采样音频碎片的声音特征值与存储的对应的标准音频碎片的声音特征值进行比较评分,被标记成间隙信号的所有所述采样音频碎片不参与评分,所述评分模块将所有标记成话音信号的每一片所述采样音频碎片的评分进行累加,求平均得到平均分数值。
其特征在于,所述标准音频碎片的获取步骤如下:
步骤S41,所述切片模块从所述接收模块接收所述标准音频信号并按照所述预设的时间间隔进行切片,获得标准音频碎片;
步骤S42,所述频域转换模块对所述标准音频碎片进行频谱转换,在频域中获取所述标准音频碎片的声音特征值;
此外还包括步骤S43:存储所述标准音频碎片的声音特征值;
其中所述步骤S41-S43在所述步骤S32之前进行。
其特征在于,所述预设的时间间隔是20ms。
本发明的有益技术效果是:直接用真人音频作为信号源对终端产品进行测试,用软件方法算出与标准音频信号差异,给出评分。这样的结果更加精确,更为人们接受。
附图说明
图1为本发明的一种实施例系统结构示意图。
图2为本发明的采样音频信号的延迟示意图。
图3-5为本发明的实施例方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。参见图1-2以对楼宇对讲系统的音频传输特性进行采样测试为例,基于采样信号的频谱分析以及声源信号进行还原度分析,确定该被测系统的声音输出性能。该实施例的检测系统中,主要可以包括:音频采集装置2、音频通讯质量评价装置33。
预设一标准音频信号,例如音频输入模块,产生标准音频信号。此标准音频信号可以为标准的人说话的声音,即真人音频信号。该真人音频信号作为被测设备1的音频传输特性的测试用传输音频。该标准音频信号可以经由音频输入模块作为输入音频信号(例如:信号源),输入到被测设备1的输入端,在被测设备1中传输,最后作为被测输出音频信号由被测设备1的输出端(例如:喇叭、听筒等)输出。
被测设备1,在本实施例中,可以是楼宇对讲系统,接收来自音频输入模块的输入音频信号,经过功放装置、被测通路、功放装置,传输该输入音频信号直到被测系统的输出端,由该输出端将经过被测系统的该输入的音频信号作为被测输出音频信号而输出。其中,被测通路,可以是被测系统(如被测的楼宇对讲系统)中需要检测的通话通路。
音频采集装置2,采集被测设备1输出的音频信号,把采集到的采样音频信号进行转换后传送到音频通讯质量评价装置3进行处理分析。如在输出端设置传声器。
音频采集装置2可以包括MIC、功放、音频信号采集仪等等。
例如:由MIC接收被测系统的输出端喇叭播放的经过被测设备1统传输过来的音频信号,具体地,这些从输入端进入的连续音频信号经过被测设备1后,通过输出端作为输出的连续音频信号被MIC所接收;连续的音频信号,通过功放,传递到音频信号采集仪,由音频采集装置2将这些连续的音频信号采集到的并传送给音频通讯质量评价装置3。
进一步,例如:由MIC接收被测设备1的输出端喇叭播放的经过该被测系统传输过来的采样音频信号,可以由MIC将输出的音频信号转换成电信号,再由MIC中的CPU等处理器进行A/D转换等处理,形成数字信号,再将对应音频信号的数字信号传送到音频通讯质量评价装置3进行数字信号的处理和分析。由于音频输入模块的输入音频是连续的,通过被测设备1输出的音频信号也是连续的,因而,这些由音频采集装置2采集到的连续的采样音频信号所对应的连续的数字信号可以传送到音频通讯质量评价装置3。音频通讯质量评价装置3,接收到从音频采集装置2传送来的连续音频信号,或者说,连续音频信号所转换成的相应的连续数字信号,并进行处理和分析,进而,可以对音频质量进行评分。
具体地,音频通讯质量评价装置3可以包括内置的处理器(如CPU等)或者具有分析处理性能的PC机等等。当接收到连续音频信号时,通过CPU对连续的音频信号做转换形成连续的数字信号或者说音频的数字信号流;当接收到已经转换成的连续数字信号时,该连续数字信号即为音频的数字信号流。这里,将连续音频信号对应的数字信号流称为音频信号的信号流。
在本发明的一种具体实施例中,音频质量采集模块具体包括接收模块4、延时处理模块5、切片模块6、频域转换模块7、分离标记模块8以及评分模块9。
其中,延时处理模块5用于比较采样音频信号与标准音频信号的延迟时间,将采样音频信号扣除延迟时间使得采样音频信号与标准音频信号同步。
其中,切片模块6用于分别对标准音频信号以及采样音频信号进行切片,得到采样音频碎片和标准音频碎片。具体而言,将音频信号流按照时间间隔划分成N片,例如,时间间隔为20ms,则每一片的时间为20ms。由于音频输入模块的输入标准音频信号是连续的,通过被测设备1输出的音频信号也是连续的,因而,这些由音频采集装置2采集到的采样音频信号也是连续的,并和且标准音频信号和采样音频信号具有随着时间具有对应的关系。因此,采样音频信号被切片之后的每一采样音频碎片在标准音频信号被切片后具有相对应的标准音频碎片。
其中,频域转换模块7用于对采样音频碎片和标准音频碎片的每一片做傅立叶频谱转换,获取每一片音频信号转换后在频域中的声音特征值。
其中,分离标记模块8用于分离标记模块8分析采样音频碎片每一片的声音特征值,对采样音频碎片的每一片分类标记成话音信号和间隙信号,其中话音信号是指声音强度大于一阈值的碎片信号,间隙信号是指声音强度小于等于所述阈值的碎片信号。作为优选的实时方式,阈值一般选为10-40dB,优选的,为10dB,优选的,为20dB、30dB或者40dB。实际而言,话音信号便是真人在讲话时的声音信号,人在讲话时声音强度一般比不讲话时强度要高。间隙信号就是没有人在讲话时的声音,例如停顿时,一般存在的环境的噪音等即底噪。此时分理出人讲话和不讲话分别做处理,更加有利于音频质量的分析提高音频质量的分析精度。在本发明中,可以将是话音信号的片标记为1,间隔信号的片标记为0,以此分离开来。
其中,评分模块9,将属于话音信号的采样音频碎片的每一片声音特征值与标准音频碎片的对应片的对应声音特征值进行比较评分,将属于间隙信号的采样音频碎片的每一片不参与评分,之后将评分进行累加求平均得到平均分数值。间隙信号是真人不讲话时例如停顿时的声音,如果参与评分会影响平均分数值,影响测试结果的精确度,因此不参与评分。具体而言,将采样音频碎片的每一片的声音特征值和标准音频碎片的对应片的声音特征值进行比较,首先进行判断,如果判断是话音信号例如被分离标记模块8标记为1时,该片参与评分,而被分离标记模块8标记为0的间隙信号直接略过,不参与评分。在本发明中,将比较采样音频碎片的每一片的声音特征值和标准音频碎片的对应片的声音特征值的相似程度得出评分,声音特征值例如是波形特征或/和频率特征信息,波形特征或/和频率特征信息相似度越高,得分越高。具体的,可以根据真人音频信号的频域特特征选择不同的频域比较范围,一般在窄频域范围内例300-3400赫兹,一般宽频域选择100-7000赫兹。
进一步的,所述切片模块6与所述接收模块4连接并从所述接收模块4接收所述标准音频信号并按照所述预设的时间间隔进行切片,获得标准音频碎片;所述频域转换模块7对所述标准音频碎片进行频谱转换,在频域中获取所述标准音频碎片的声音特征值;一存储模块10,存储所述标准音频碎片的声音特征值。
下面将结合图3-5所示本申请的音频信号还原度检测方法一实施例的流程图,对本申请的音频信号还原度检测方法进行更具体的描述。
步骤S1,预设一标准音频信号,标准音频信号在被测设备1中传输,最后作为被测输出的音频信号由被测设备1的输出端输出。
音频输入模块产生标准音频信号,该标准音频信号可以是标准的人说话的声音,例如真人音频信号。该真人音频信号作为被测设备1的音频传输特性的测试用传输音频信号。该音频信号可以经由音频输入模块作为输入音频信号,输入到被测设备1的输入端,在被测设备1中传输,最后作为被测输出音频信号由被测设备1的输出端输出。真人音频信号包含所有的交条失真,采用其作为输入信号,更符合被测系统的使用环境,其测试更准确客观。被测设备1,例如:楼宇对讲系统。本步骤的具体实施可以参见对系统中关于音频输入模块及其被测设备1的描述。
步骤S2,音频采集装置2采集被测设备1输出的音频信号得到采样音频信号,并将采样音频信号发给音频通讯质量评价装置3;
步骤S3,音频通讯质量评价装置3接收采样音频信号以及标准音频信号,对采样音频信号和标准音频信号做同步处理,并将采样音频信号和标准音频信号按照相同的时间间隔进行切片和比对分析,得出评分结果。
进一步的,步骤S3包括如下步骤:
步骤S31,接收模块4获取标准音频信号,并从音频采集装置2接收采样音频信号,将标准音频信号和采样音频信号发送给延时处理模块5;
步骤S32,延时处理模块5扣除采样音频信号与标准音频信号相比的延迟时间,使采样音频信号与标准音频信号同步;
步骤S33,切片模块6对从延时处理模块5处接收与标准音频信号同步后的采样音频信号按照预设的时间间隔进行切片,获得采样音频碎片;
步骤S34,频域转换模块7对采样音频碎片进行频谱转换,在频域中获取采样音频碎片的声音特征值;
步骤S35,分离标记模块8分析每一片采样音频碎片的声音特征值,将声音强度大于一阈值的采样音频碎片标记成话音信号,将声音强度小于等于所述阈值的采样音频碎片标记成间隙信号;
步骤S36,评分模块9将被标记成话音信号的每一片采样音频碎片的声音特征值与存储的对应的标准音频碎片的声音特征值进行比较评分,被标记成间隙信号的所有采样音频碎片不参与评分,评分模块9将所有标记成话音信号的每一片采样音频碎片的评分进行累加,求平均得到平均分数值。
进一步的,标准音频碎片的获取步骤如下:
步骤S41,切片模块6从接收模块4接收标准音频信号并按照所述预设的时间间隔进行切片,获得标准音频碎片;
步骤S42,频域转换模块7对标准音频碎片进行频谱转换,在频域中获取标准音频碎片的声音特征值;
此外还包括步骤S43:存储标准音频碎片的声音特征值;
其中所述步骤S41-S43在步骤S32之前进行。
预设的时间间隔是20ms。
所述阈值为10-40dB。
分离标记模块8分析采样音频信号每一片的声音特征值,对采样音频信号的每一片分类标记成话音信号和间隙信号,其中话音信号是指声音强度大于一阈值的信号,间隙信号是指声音强度小于等于所述阈值的信号。作为优选的实时方式,阈值一般选为10-40dB,优选的,为10dB,优选的,为20dB、30dB或者40dB。实际而言,话音信号便是真人在讲话时的声音信号,人在讲话时声音强度一般比不讲话时强度要高。间隙信号就是没有人在讲话时的声音,例如停顿时,一般存在的环境的噪音等即底噪。此时分理出人讲话和不讲话分别做处理,更加有利于音频质量的分析提高音频质量的分析精度。在本发明中,可以将是话音信号的片标记为1,间隔信号的片标记为0,以此分离开来。
评分模块9,将属于话音信号的采样音频信号的每一片声音特征值与标准音频信号的对应片对应的声音特征值进行比较评分,将属于间隙信号的采样音频信号的每一片不参与评分,之后将评分进行累加求平均得到平均分数值。间隙信号是真人不讲话时例如停顿时的声音,如果参与评分会影响平均分数值,影响测试结果的精确度,因此不参与评分。具体而言,将采样音频信号的每一片的声音特征值和标准音频信号的对应片的声音特征值进行比较,首先进行判断,如果判断是话音信号例如被分离标记模块8标记为1时,该片参与评分,而被分离标记模块8标记为0的间隙信号直接略过,不参与评分。在本发明中,将比较采样音频信号的每一片的声音特征值和标准音频信号的对应片的声音特征值的相似程度得出评分,声音特征值例如是波形特征或/和频率特征信息,波形特征或/和频率特征信息相似度越高,得分越高。具体的,可以根据真人音频信号的频域特特征选择不同的频域比较范围,一般在窄频域范围内例300-3400赫兹,一般宽频域选择100-7000赫兹。
其中,对标准音频信号的切片处理以及频域转换处理在步骤S2或S3之前进行,由音频通讯质量评价装置3预先处理得到相应的声音特征值,并进行存储。
在声音特征值比较过程中,将采样音频信号每片对应的声音特征值和标准音频信号的对应片对应的声音特征值,基于诸如相似性原理/相似度计算等方式。如:采样音频信号的第一片P1的声音特征值A、B、C、D、…,与对应于标准音频信号的第一片p1的声音特征值a、b、c、d、…之间的相似度计算,得到相似度值0~1(0相似或100%相似),为了更清晰的确定分析结果,可以对该值的范围同乘以倍数如100,采用百分制,即0~100分,从而每片都能得到一个对比分析的分数。最后,累计所有话音信号的片的分数并获得该输出音频信号的平均得分。
利用本申请的方案,通过在检测过程中检测用的声源信号采用真人音频,以保证被测系统在检测过程中处于实际工作环境,并且,由于信号是真人音频,其失真包含所有交调失真;进而,通过对信号的切片处理,包括了对连续频率的测试,符合真人音频的信号状况,更能充分显现被测系统的声音输出特性,因此,直接对还原度的连续信号切片检测方式,能获得更准确、更精确的被测系统、设备的检测结果。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
Claims (8)
1.一种音频通讯质量评价系统,其特征在于:
包括音频采集装置和音频质量分析装置,二者电性连接;
其中,预设一标准音频信号,所述标准音频信号在被测设备中传输,最后作为被测输出的音频信号由被测设备的输出端输出;
所述音频采集装置用于采集所述被测设备输出的音频信号得到采样音频信号,并将采样音频信号发给音频质量分析装置;
所述音频质量分析装置用于接收所述采样音频信号以及接收标准音频信号,对所述采样音频信号和所述标准音频信号做同步处理,并将所述采样音频信号和所述标准音频信号按照相同的时间间隔进行切片和比对分析,得出评分结果。
2.如权利要求1所述的一种音频通讯质量评价系统,其特征在于,所述音频质量分析装置包括:
接收模块,用于获取所述标准音频信号,并与所述音频采集装置连接,从所述音频采集装置接收所述采样音频信号,将所述标准音频信号和所述采样音频信号发送给延时处理模块;
延时处理模块,与接收模块连接,用于扣除所述采样音频信号与所述标准音频信号相比的延迟时间,使所述采样音频信号与所述标准音频信号同步;
切片模块,分别与延时处理模块连接,用于对从延时处理模块处接收与所述标准音频信号同步后的所述采样音频信号按照预设的时间间隔进行切片,获得采样音频碎片;
频域转换模块,与所述切片模块连接,用于对所述采样音频碎片进行频谱转换,在频域中获取所述采样音频碎片的声音特征值;
分离标记模块,与所述频域转换模块连接,用于分析每一片所述采样音频碎片的声音特征值,将声音强度大于一阈值的所述采样音频碎片标记成话音信号,将声音强度小于等于所述阈值的所述采样音频碎片标记成间隙信号;
评分模块,与所述分离标记模块连接,用于将属于话音信号的每一片所述采样音频碎片的声音特征值与存储的对应的标准音频碎片的声音特征值进行比较评分,属于间隙信号的所有所述采样音频碎片不参与评分,所述评分模块将所有属于话音信号的每一片所述采样音频碎片的评分进行累加求平均得到平均分数值。
3.如权利要求2所述的一种音频通讯质量评价系统,其特征在于,所述切片模块与所述接收模块连接并从所述接收模块接收所述标准音频信号并按照所述预设的时间间隔进行切片,获得标准音频碎片;所述频域转换模块对所述标准音频碎片进行频谱转换,在频域中获取所述标准音频碎片的声音特征值;一存储模块,存储所述标准音频碎片的声音特征值。
4.如权利要求3所述的一种音频通讯质量评价系统,其特征在于,所述预设的时间间隔是20ms。
5.一种音频通讯质量评价方法,其特征在于:使用如权利要求1的一种音频通讯质量评价系统,具有如下步骤:
步骤S1,预设一标准音频信号,所述标准音频信号在被测设备中传输,最后作为被测输出的音频信号由被测设备的输出端输出;
步骤S2,音频采集装置采集所述被测设备输出的音频信号得到采样音频信号,并将采样音频信号发给音频质量分析装置;
步骤S3,所述音频质量分析装置接收所述采样音频信号以及标准音频信号,对所述采样音频信号和所述标准音频信号做同步处理,并将所述采样音频信号和所述标准音频信号按照相同的时间间隔进行切片和比对分析,得出评分结果。
6.如权利要求5所述的一种音频通讯质量评价方法,其特征在于,
步骤S3包括如下步骤:
步骤S31,接收模块获取所述标准音频信号,并从所述音频采集装置接收所述采样音频信号,将所述标准音频信号和所述采样音频信号发送给延时处理模块;
步骤S32,所述延时处理模块扣除所述采样音频信号与所述标准音频信号相比的延迟时间,使所述采样音频信号与所述标准音频信号同步;
步骤S33,切片模块对从延时处理模块处接收与所述标准音频信号同步后的所述采样音频信号按照预设的时间间隔进行切片,获得采样音频碎片;
步骤S34,频域转换模块对所述采样音频碎片进行频谱转换,在频域中获取所述采样音频碎片的声音特征值;
步骤S35,分离标记模块分析每一片所述采样音频碎片的声音特征值,将声音强度大于一阈值的所述采样音频碎片标记成话音信号,将声音强度小于等于所述阈值的所述采样音频碎片标记成间隙信号;
步骤S36,评分模块将被标记成话音信号的每一片所述采样音频碎片的声音特征值与存储的对应的标准音频碎片的声音特征值进行比较评分,被标记成间隙信号的所有所述采样音频碎片不参与评分,所述评分模块将所有标记成话音信号的每一片所述采样音频碎片的评分进行累加求平均得到平均分数值。
7.如权利要求6所述的一种音频通讯质量评价方法,其特征在于,所述标准音频碎片的获取步骤如下:
步骤S41,所述切片模块从所述接收模块接收所述标准音频信号并按照所述预设的时间间隔进行切片,获得标准音频碎片;
步骤S42,所述频域转换模块对所述标准音频碎片进行频谱转换,在频域中获取所述标准音频碎片的声音特征值;
此外还包括步骤S43:存储所述标准音频碎片的声音特征值;
其中所述步骤S41、步骤S42、步骤S43在所述步骤S32之前进行。
8.如权利要求7所述的一种音频通讯质量评价方法,其特征在于,所述预设的时间间隔是20ms。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011394753.7A CN112382313A (zh) | 2020-12-02 | 2020-12-02 | 一种音频通讯质量评价系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011394753.7A CN112382313A (zh) | 2020-12-02 | 2020-12-02 | 一种音频通讯质量评价系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112382313A true CN112382313A (zh) | 2021-02-19 |
Family
ID=74589453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011394753.7A Pending CN112382313A (zh) | 2020-12-02 | 2020-12-02 | 一种音频通讯质量评价系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112382313A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112562737A (zh) * | 2021-02-25 | 2021-03-26 | 北京映客芝士网络科技有限公司 | 一种音频处理质量的评价方法、装置、介质及电子设备 |
CN113409820A (zh) * | 2021-06-09 | 2021-09-17 | 合肥群音信息服务有限公司 | 一种基于语音数据的质量评价方法 |
CN114429770A (zh) * | 2022-04-06 | 2022-05-03 | 北京普太科技有限公司 | 一种被测设备的声音数据测试方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104050964A (zh) * | 2014-06-17 | 2014-09-17 | 公安部第三研究所 | 音频信号还原度检测方法及系统 |
WO2017206935A1 (zh) * | 2016-06-03 | 2017-12-07 | 公安部第三研究所 | 一种音视频同步测试的系统及方法 |
CN111081278A (zh) * | 2019-12-18 | 2020-04-28 | 公安部第三研究所 | 一种对讲终端通话质量的测试方法及测试系统 |
CN111276161A (zh) * | 2020-03-05 | 2020-06-12 | 公安部第三研究所 | 一种语音质量评分系统及方法 |
CN112017693A (zh) * | 2019-05-30 | 2020-12-01 | 腾讯科技(深圳)有限公司 | 一种音频质量评估方法及装置 |
-
2020
- 2020-12-02 CN CN202011394753.7A patent/CN112382313A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104050964A (zh) * | 2014-06-17 | 2014-09-17 | 公安部第三研究所 | 音频信号还原度检测方法及系统 |
WO2017206935A1 (zh) * | 2016-06-03 | 2017-12-07 | 公安部第三研究所 | 一种音视频同步测试的系统及方法 |
CN112017693A (zh) * | 2019-05-30 | 2020-12-01 | 腾讯科技(深圳)有限公司 | 一种音频质量评估方法及装置 |
CN111081278A (zh) * | 2019-12-18 | 2020-04-28 | 公安部第三研究所 | 一种对讲终端通话质量的测试方法及测试系统 |
CN111276161A (zh) * | 2020-03-05 | 2020-06-12 | 公安部第三研究所 | 一种语音质量评分系统及方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112562737A (zh) * | 2021-02-25 | 2021-03-26 | 北京映客芝士网络科技有限公司 | 一种音频处理质量的评价方法、装置、介质及电子设备 |
CN112562737B (zh) * | 2021-02-25 | 2021-06-22 | 北京映客芝士网络科技有限公司 | 一种音频处理质量的评价方法、装置、介质及电子设备 |
CN113409820A (zh) * | 2021-06-09 | 2021-09-17 | 合肥群音信息服务有限公司 | 一种基于语音数据的质量评价方法 |
CN113409820B (zh) * | 2021-06-09 | 2022-03-15 | 合肥群音信息服务有限公司 | 一种基于语音数据的质量评价方法 |
CN114429770A (zh) * | 2022-04-06 | 2022-05-03 | 北京普太科技有限公司 | 一种被测设备的声音数据测试方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112382313A (zh) | 一种音频通讯质量评价系统及方法 | |
EP3166239B1 (en) | Method and system for scoring human sound voice quality | |
Smeds et al. | Estimation of signal-to-noise ratios in realistic sound scenarios | |
Castellana et al. | Discriminating pathological voice from healthy voice using cepstral peak prominence smoothed distribution in sustained vowel | |
US5940792A (en) | Nonintrusive testing of telecommunication speech by determining deviations from invariant characteristics or relationships | |
KR950002442B1 (ko) | 오디오 신호처리 시스템을 검사하기 위한 장치 | |
CN111276161B (zh) | 一种语音质量评分系统及方法 | |
Hirson et al. | Speech fundamental frequency over the telephone and face-to-face: Some implications for forensic phonetics1 | |
Lu et al. | Speech production modifications produced in the presence of low-pass and high-pass filtered noise | |
CN112017693B (zh) | 一种音频质量评估方法及装置 | |
Xiong et al. | Exploring auditory-inspired acoustic features for room acoustic parameter estimation from monaural speech | |
US7818168B1 (en) | Method of measuring degree of enhancement to voice signal | |
CA2326138C (en) | Quality evaluation method | |
Branstetter et al. | Time and frequency metrics related to auditory masking of a 10 kHz tone in bottlenose dolphins (Tursiops truncatus) | |
CN113053351A (zh) | 一种基于听觉感知的飞机舱内噪声合成方法 | |
CN106713623A (zh) | 一种通信终端植入式的通话检测系统与方法 | |
Jaiswal | Influence of silence and noise filtering on speech quality monitoring | |
JP2648779B2 (ja) | 通話信号識別装置 | |
WO2019081649A1 (en) | METHOD FOR DETERMINING THE QUALITY OF VOICE DATA WITH TRANSMISSION VIA A NETWORK, METHOD AND APPARATUS FOR REALIZING A TELEPHONE CALL | |
CN111312289B (zh) | 一种音频测试的预处理方法及系统 | |
CN117579982A (zh) | 基于机器视觉的音响检测方法、装置、设备及介质 | |
Lozano et al. | A real-time sound recognition system in an assisted environment | |
Gamba et al. | Subspecific divergence in the black lemur’s low-pitched vocalizations | |
Blatnik et al. | Influence of the perceptual speech quality on the performance of the text-independent speaker recognition system | |
Somarathne et al. | A Study of the Variation of Acoustic Properties of Signals Received by Used Mobile Phones |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |