CN115424636B - 一种基于语音传输指数的音质测量方法及装置 - Google Patents
一种基于语音传输指数的音质测量方法及装置 Download PDFInfo
- Publication number
- CN115424636B CN115424636B CN202211373363.0A CN202211373363A CN115424636B CN 115424636 B CN115424636 B CN 115424636B CN 202211373363 A CN202211373363 A CN 202211373363A CN 115424636 B CN115424636 B CN 115424636B
- Authority
- CN
- China
- Prior art keywords
- voice
- sound
- calculating
- transmission index
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 155
- 238000000691 measurement method Methods 0.000 title claims description 20
- 238000001228 spectrum Methods 0.000 claims abstract description 70
- 238000000034 method Methods 0.000 claims abstract description 41
- 238000012546 transfer Methods 0.000 claims abstract description 33
- 238000004364 calculation method Methods 0.000 claims abstract description 30
- 238000004880 explosion Methods 0.000 claims abstract description 19
- 238000002592 echocardiography Methods 0.000 claims abstract description 18
- 238000005422 blasting Methods 0.000 claims abstract description 16
- 230000006870 function Effects 0.000 claims description 33
- 238000005259 measurement Methods 0.000 claims description 29
- 238000010586 diagram Methods 0.000 claims description 17
- 238000001914 filtration Methods 0.000 abstract description 5
- 238000012360 testing method Methods 0.000 abstract description 5
- 238000001514 detection method Methods 0.000 description 14
- 238000011156 evaluation Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01H—MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
- G01H17/00—Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/08—Arrangements for producing a reverberation or echo sound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本申请公开了一种基于语音传输指数的音质测量方法及装置,其方法包括:爆破气球,爆破气球,采集房间的回声,转化为脉冲信号;绘制声压频谱图;计算各倍频程带宽的中心频率的声压频谱值;对声压频谱曲线进行线性拟合;计算各倍频程带宽的中心频率相对应的混响时间;计算各混响时间的各调制频率的调制传递函数值;计算各调制频率对应的表观信噪比;计算调制频率传输指数;计算所有调制频率的平均调制频率传输指数;对所有混响时间的平均传输指数值计权,得到男声的语音传输指数和女声的语音传输指数;计算平均值测量音质。本申请将爆破气球声为测试音,线性拟合计算混响时间,无需复杂的滤波计算,减小测量音质过程的计算量。
Description
技术领域
本申请涉及室内音质测量技术领域,尤其是涉及一种基于语音传输指数的音质测量方法及装置。
背景技术
语音传输指数是被广泛接受和使用的房间音质客观评价参量,使用室内声学理论来进行测量与计算。具体的,语音传输指数是衡量语音传输质量的一个指标,该指数可以较为全面的反映混响时间信噪比和回声等对语言清晰度的影响,并且考虑了系统失真,心理声学效果(掩蔽效应)等因素。语音传输指数的值的范围为0-1,值越大说明清晰度越好。
语音传输指数与一些较为公认的传统音质客观评价参量如混响时间、背景噪声、明晰度等相比,除了能综合考虑混响时间、信噪比的影响外,混响衰变的细节、房间反射声序列的分布等也可考虑,并与言语可懂度的主观感受直接对应,有着传统音质评价参量所不具备的优势。
现有的一种房间音质测量方法需要使用扩声音箱、麦克风、音频主机,音频主机采用改进的语言传输间接法测量语音传输指数,并根据语言传输指数值对室内音质进行测量。该方法需要扩声音箱播放测试声音,并在房间的多个位置布置麦克风采集测试声音,将测试声音转化为测试信号,传输给音频主机,并计算房间的语音传输指数,再根据该语音传输指数对室内的音质进行测量。但是,该方法由于采集的声音是人的语音,需要测试者对采集到的语音信号进行语音活动检测,将语音分为有话段和无话段,并将有话段和无话段的语音信号通过倍频程滤波器进行滤波,才能计算不同倍频程中心频率的调制传递函数,进而计算语音传输指数和测量音质;滤波过程的计算复杂,会导致测量音质过程计算量大的问题。
发明内容
为此,本申请的实施例提供了一种基于语音传输指数的音质测量方法,能够解决现有的房间音质测量方法滤波过程的计算复杂,导致测量音质过程计算量大的问题,具体技术方案内容如下:
第一方面,本申请提供一种基于语音传输指数的音质测量方法,包括:
爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;
根据所述脉冲信号绘制声压频谱图;
预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数;根据所述调制频率传输指数,计算所有调制频率的平均调制频率传输指数;
预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算男声的语音传输指数和女声的语音传输指数的平均值;
根据所述平均值测量音质。
优选的,所述预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值,包括:
根据预设的多个倍频程带宽,和各倍频程带宽的中心频率,计算各倍频程带宽的上限频率和下限频率;
根据各倍频程带宽的上限频率、下限频率和频率带宽,计算各倍频程中心频率的声压频谱值。
优选的,所述根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间,包括:
根据所述声压频谱曲线,得到气球爆破声稳定衰变的声音强度范围;
根据所述声音强度范围和拟合直线的斜率,计算得到各倍频程中心频率相对应的混响时间。
优选的,根据所述声压频谱曲线,得到气球爆破声稳定衰变的声音强度范围,包括:
所述气球爆破声稳定衰变的声音强度范围为,从气球爆破声的声音强度衰变5dB时的声音强度,到气球爆破声的声音强度衰变35dB时的声音强度。
优选的,所述根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线,包括:
将所述拟合直线的表达式设为y=kx+b,其中y为气球爆破声的声音强度,x为气球爆破后的时间,k为拟合直线的斜率,b为拟合直线的截距;
预设多个测量时间点,根据所述声压频谱曲线得到各测量时间点对应的气球爆破声的声音强度;将各测量时间点代入x,将各测量时间点对应的气球爆破声的声音强度代入y,得到所述拟合直线。
优选的,根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间,包括:
所述拟合直线的斜率的计算公式如下:
其中,k为拟合直线的斜率,n为预设的测量时间点的数量,xi为第i个测量时间点的时间值,yi为第i个测量时间点对应的气球爆破声的声音强度,i的取值为从1到n的所有整数。
优选的,所述根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数,包括:
男声的语音传输指数和女声的语音传输指数计算公式如下:
当计算男声的语音传输指数时,STI男女为男声的语音传输指数,当计算女声的语音传输指数时,STI男女为女声的语音传输指数;
MTI k为平均调制频率传输指数,k为倍频程中心频率;
当计算男声的语音传输指数时,αk为男声权重因子,βk为男声冗余因子;当计算女声的语音传输指数时,αk为女声权重因子,βk为女声冗余因子。
优选的,根据所述平均值测量音质,包括:
预设5个音质等级,分别为:不能接受、较差、良好、优秀、非常好,根据所述平均值的范围确定对应的音质等级;
平均值范围在0-0.3时,对应的音质等级为不能接受;
平均值范围在0.3-0.45时,对应的音质等级为较差;
平均值范围在0.45-0.6时,对应的音质等级为良好;
平均值范围在0.6-0.75时,对应的音质等级为优秀;
平均值范围在0.75-1时,对应的音质等级为非常好。
优选的,所述预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值,包括:
调制传递函数值的计算公式如下:
优选的,根据所述调制传递函数值,计算各调制频率对应的表观信噪比,包括:
表观信噪比的计算公式如下:
优选的,根据所述调制传递函数值,计算各调制频率对应的表观信噪比,包括:
对所述表观信噪比进行限制,当所述表观信噪比大于15dB时记为15dB,小于-15dB时记为-15dB。
优选的,根据所述表观信噪比,计算调制频率传输指数,包括:
调制频率传输指数的计算公式如下:
第二方面,本申请还提供一种基于语音传输指数的音质测量装置,包括:
采集模块,用于爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;根据所述脉冲信号绘制声压频谱图;
混响时间测量模块,用于预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
语音传输指数测量模块,用于预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数;根据所述调制频率传输指数,计算所有调制频率的平均调制频率传输指数;
预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算男声的语音传输指数和女声的语音传输指数的平均值;
音质测量模块,用于根据所述平均值测量音质。
第三方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行基于语音传输指数的音质测量方法。
第四方面,本申请还提供一种电子设备,包括:处理器和存储器,所述处理器用于运行所述存储器中存储的程序,其中,所述程序运行时执行基于语音传输指数的音质测量方法。
综上所述,与现有技术相比,本申请实施例提供的技术方案带来的有益效果至少包括:
爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;根据所述脉冲信号绘制声压频谱图;预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;再根据调制传递函数值计算语音传输指数,并测量音质。
由于设备采集的是气球爆破的回声,声音较为纯净,同时采用了拟合直线的方法直接计算各倍频程带宽的中心频率相对应的混响时间,再根据混响时间计算调制传递函数值,不用再对声压频谱曲线进行复杂的滤波计算才得到有效的信号,简化了调制传递函数值的计算过程,进而减少了计算语音传输指数和测量音质过程的计算量。
附图说明
图1是本申请一实施例提供的一种基于语音传输指数的音质测量方法的流程图;
图2是本申请一实施例提供的一种基于语音传输指数的音质测量方法的混响时间计算示意图;
图3是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测底噪操作示意图;
图4是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测底噪操作另一示意图;
图5是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测混响时间操作示意图;
图6是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测混响时间操作另一示意图;
图7是本申请一实施例提供的一种基于语音传输指数的音质测量方法的语音传输指数计算操作示意图;
图8是本申请一实施例提供的一种基于语音传输指数的音质测量方法的音质测量报告图;
图9是本申请一实施例提供的一种基于语音传输指数的音质测量装置的结构框图;
图10是本申请一实施例提供的一种电子设备结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面结合说明书附图对本申请实施例作进一步详细描述。
本申请一实施例提供了一种基于语音传输指数的音质测量方法,如图1所示:
S01:爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号,绘制声压频谱图;
具体的,采集气球爆破时房间内回声的脉冲,可以使用带有传声器的电子设备,所述电子设备可以为手机等常用的具有采集声音,储存运算功能的设备。将手机放置在房间内听众较多的区域,距地面1.2m高处;气球爆破位置靠房间的角落,与手机的距离在1.5m以上。手机采集回声的脉冲后,将采集到的脉冲转化为脉冲信号,并对所述脉冲信号进行快速傅里叶变换运算,得到所述脉冲信号的声压信号,然后根据声压信号在手机的处理器生成声压频谱图。
S02:预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
具体的,预设的多个倍频程带宽可以是频率带宽为89Hz,倍频程中心频率为125Hz,上限频率为177Hz,下限频率为88Hz;频率带宽为178Hz,倍频程中心频率为250Hz,上限频率为355Hz,下限频率为177Hz;频率带宽为355Hz,倍频程中心频率为500Hz,上限频率为710Hz,下限频率为355Hz;频率带宽为710Hz,倍频程中心频率为1000Hz,上限频率为1420Hz,下限频率为710Hz;频率带宽为1420Hz,倍频程中心频率为2000Hz,上限频率为2840Hz,下限频率为1420Hz;频率带宽为2840Hz,倍频程中心频率为4000Hz,上限频率为5680Hz,下限频率为2840Hz;频率带宽为5680Hz,倍频程中心频率为8000Hz,上限频率为11360Hz、下限频率为5680Hz。
可以将拟合直线的表达式设为y=kx+b,其中y为气球爆破声的声音强度,x为气球爆破后的时间,k为拟合直线的斜率,b为拟合直线的截距;
预设多个测量时间点,时间测量点可以根据测量设备的计算能力尽可能多的设置,因为通过设置更多的时间测量点可以得到更多的拟合直线时需要的坐标点,进而对声压频谱曲线进行更准确的线性拟合。预设好测量时间点后,根据声压频谱曲线得到各测量时间点对应的气球爆破声的声音强度;将各测量时间点代入x,将各测量时间点对应的气球爆破声的声音强度代入y,得到拟合直线。
根据拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间,具体的:
可以使用如下的计算公式来计算拟合直线的斜率:
其中,k为拟合直线的斜率,n为预设的测量时间点的数量,xi为第i个测量时间点的时间值,yi为第i个测量时间点对应的气球爆破声的声音强度,i的取值为从1到n的所有整数。
混响时间的计算可以根据所述声压频谱曲线,得到气球爆破声稳定衰变的声音强度范围;根据所述声音强度范围和拟合直线的斜率,计算得到各倍频程中心频率相对应的混响时间。
如图2所示,气球爆破声稳定衰变的声音强度范围为,从气球爆破声的声音强度衰变5dB时的声音强度,到气球爆破声的声音强度衰变35dB时的声音强度。将这一段时间的长度乘以2,就可以计算出各倍频程中心频率相对应的混响时间。
现有技术通过测量衰变60dB的时间来作为混响时间,但是由于背景噪声的影响,衰变60dB的时间难以准确的测量。因此,采用气球爆破声的声音强度衰变5dB的时间,到气球爆破声的声音强度衰变35dB的时间乘以2,以此结果作为替代计算衰变60dB时的混响时间,可以减少背景噪声对混响时间测量的影响。选择从衰变5dB的时间开始,可以减少声音开始衰变之后的前端不稳定信号,使计算出的混响时间更准确。
如图3,图4,图5,图6所示,本实施例提供了基于以上的测量混响时间的方法的操作示意图,主要包括:选择检测时间为20s,然后检测类型选择脉冲,之后测量混响时间前自动检测底噪,以防止由于底噪过大造成测量混响时间不准确的问题。底噪测量完成后开始测量混响时间。经过一段时间后即可得到结果。
S03:预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数,并计算所有调制频率传输指数的平均值,作为平均调制频率传输指数。
具体的,可以将调制频率fm的数量设置为14个,分别是0.63Hz、0.8Hz、1Hz、1.25Hz、1.6Hz、2Hz、2.5Hz、3.15Hz、4Hz、5Hz、6.3Hz、8Hz、10Hz、12.5Hz,并且使用如下的调制传递函数值的计算公式:
根据调制传递函数值,计算各调制频率对应的表观信噪比,可以采用如下的计算公式:
根据相关标准,需要对计算出的表观信噪比进行限制,当所述表观信噪比大于15dB时记为15dB,小于-15dB时记为-15dB。
根据所述表观信噪比,计算调制频率传输指数,可以使用如下的计算公式:
S04:预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算所述男声的语音传输指数和所述女声的语音传输指数的平均值;
具体的,男声和女声的语音传输指数测量可以采用如下的计算公式:
当计算男声的语音传输指数时,STI男女为男声的语音传输指数,当计算女声的语音传输指数时,STI男女为女声的语音传输指数;
MTI k为平均调制频率传输指数,k为倍频程中心频率;
当计算男声的语音传输指数时,αk为男声权重因子,βk为男声冗余因子;当计算女声的语音传输指数时,αk为女声权重因子,βk为女声冗余因子。
男声权重因子,男声冗余因子,女声权重因子和女声冗余因子的数值,如表1所示:
表1
表1中的权重因子和冗余因子的设置参考了现有的国家标准,具体含义指的是各倍频带对语音传输指数的相对贡献。男声和女声的语音传输指数计算公式参考现行国家标准,在此基础上,考虑了各倍频带对语音传输指数的相对贡献和两相邻倍频带对言语可懂度有贡献信息的重叠部分比例,使计算出的语音传输指数更能准确反映言语可懂度。
如图7所示,基于以上测量语音传输指数的方法,本实施例还提供了一种测量语音传输指数的操作示意图,根据设定好的检测时间为20s,检测类型为脉冲,得到传输指数的测量结果后,可以查看详情或导出音质的评价报告,也可以取消后再次测量。
S05:根据所述平均值测量音质。
具体的,根据平均值测量音质,可以根据表2进行:
表2
表2中的范围指的是男声和女声的语音传输指数的平均值,通过该平均值所在的评价范围,对音质进行测量,可以更好的反映音质的不同级别。
如图8所示,音质测量的结果可以生成音质测量报告,报告包括检测项目,检测设备,检测地点,检测时间,检测时长,检测标准,环境噪声等测量音质的相关信息。报告中检测结果部分的内容,包括各倍频程中心频率相对应的混响时间,混响时间均值,男声和女声的语音传输指数的平均值,以及通过该平均值所在的范围得到的检测结论,以及各倍频程中心频率相对应的混响时间的曲线图。
本实施例提供的技术方案带来的有益效果至少包括:
爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;根据所述脉冲信号绘制声压频谱图;预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;再根据调制传递函数值计算语音传输指数,并测量音质。
由于设备采集的是气球爆破的回声,声音较为纯净,同时采用了拟合直线的方法直接计算各倍频程带宽的中心频率相对应的混响时间,再根据混响时间计算调制传递函数值,不用再对声压频谱曲线进行复杂的滤波计算才得到有效的信号,简化了调制传递函数值的计算过程,进而减少了计算语音传输指数和测量音质过程的计算量。
此外,本实施例提供的技术方案带来的有益效果还包括,减少背景噪声和声音开始衰变之后的前端不稳定信号对混响时间测量的影响,计算出的混响时间更准确;优化设计语音传输指数计算方式,使其更能准确反映言语可懂度;测量音质按等级划分,更好的反映音质的不同级别。
本申请一实施例还提供一种基于语音传输指数的音质测量装置,如图9所示,包括:
采集模块,用于爆破气球,设备采集气球爆破时房间内的脉冲,将所述脉冲转化为脉冲信号;根据所述脉冲信号绘制声压频谱图;
混响时间测量模块,用于预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
语音传输指数测量模块;
音质测量模块,用于根据所述平均值测量音质。
其中,语音传输指数测量模块还包括调制频率传输指数计算单元,用于预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数;根据所述调制频率传输指数,计算所有调制频率的平均调制频率传输指数;
男女声语音传输指数计算单元,用于预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算男声的语音传输指数和女声的语音传输指数的平均值。
在本申请一实施例中,提供了一种电子设备,如图10所示,该电子设备包通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该电子设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现基于语音传输指数的音质测量方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行基于语音传输指数的音质测量方法。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本申请一个实施例中,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述基于语音传输指数的音质测量方法的步骤。此处基于语音传输指数的音质测量方法的步骤可以是上述各个实施例的基于语音传输指数的音质测量方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。
其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本申请的保护范围。
Claims (15)
1.一种基于语音传输指数的音质测量方法,其特征在于,包括:
爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;
根据所述脉冲信号绘制声压频谱图;
预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数;根据所述调制频率传输指数,计算所有调制频率的平均调制频率传输指数;
预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算男声的语音传输指数和女声的语音传输指数的平均值;
根据所述平均值测量音质。
2.如权利要求1所述的音质测量方法,其特征在于,所述预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值,包括:
根据预设的多个倍频程带宽,和各倍频程带宽的中心频率,计算各倍频程带宽的上限频率和下限频率;
根据各倍频程带宽的上限频率、下限频率和频率带宽,计算各倍频程带宽的中心频率的声压频谱值。
3.如权利要求1所述的音质测量方法,其特征在于,所述根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间,包括:
根据所述声压频谱曲线,得到气球爆破声稳定衰变的声音强度范围;
根据所述声音强度范围和拟合直线的斜率,计算得到各倍频程带宽的中心频率相对应的混响时间。
4.如权利要求3所述的音质测量方法,其特征在于,根据所述声压频谱曲线,得到气球爆破声稳定衰变的声音强度范围,包括:
所述气球爆破声稳定衰变的声音强度范围为,从气球爆破声的声音强度衰变5dB时的声音强度,到气球爆破声的声音强度衰变35dB时的声音强度。
5.如权利要求1所述的音质测量方法,其特征在于,所述根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线,包括:
将所述拟合直线的表达式设为y=kx+b,其中y为气球爆破声的声音强度,x为气球爆破后的时间,k为拟合直线的斜率,b为拟合直线的截距;
预设多个测量时间点,根据所述声压频谱曲线得到各测量时间点对应的气球爆破声的声音强度;将各测量时间点代入x,将各测量时间点对应的气球爆破声的声音强度代入y,得到所述拟合直线。
8.如权利要求1所述的音质测量方法,其特征在于,根据所述平均值测量音质,包括:
预设5个音质等级,分别为:不能接受、较差、良好、优秀、非常好,根据所述平均值的范围确定对应的音质等级;
平均值范围在0-0.3时,对应的音质等级为不能接受;
平均值范围在0.3-0.45时,对应的音质等级为较差;
平均值范围在0.45-0.6时,对应的音质等级为良好;
平均值范围在0.6-0.75时,对应的音质等级为优秀;
平均值范围在0.75-1时,对应的音质等级为非常好。
11.如权利要求10所述的音质测量方法,其特征在于,根据所述调制传递函数值,计算各调制频率对应的表观信噪比,包括:
对所述表观信噪比进行限制,当所述表观信噪比大于15dB时记为15dB,小于-15dB时记为-15dB。
13.一种基于语音传输指数的音质测量装置,其特征在于,包括:
采集模块,用于设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;根据所述脉冲信号绘制声压频谱图;
混响时间测量模块,用于预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
语音传输指数测量模块,用于预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数;根据所述调制频率传输指数,计算所有调制频率的平均调制频率传输指数;
预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算男声的语音传输指数和女声的语音传输指数的平均值;
音质测量模块,用于根据所述平均值测量音质。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1-12任一项所述的基于语音传输指数的音质测量方法。
15.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器用于运行所述存储器中存储的程序,其中,所述程序运行时执行权利要求1-12任一项所述的基于语音传输指数的音质测量方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211373363.0A CN115424636B (zh) | 2022-11-04 | 2022-11-04 | 一种基于语音传输指数的音质测量方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211373363.0A CN115424636B (zh) | 2022-11-04 | 2022-11-04 | 一种基于语音传输指数的音质测量方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115424636A CN115424636A (zh) | 2022-12-02 |
CN115424636B true CN115424636B (zh) | 2023-02-03 |
Family
ID=84208029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211373363.0A Active CN115424636B (zh) | 2022-11-04 | 2022-11-04 | 一种基于语音传输指数的音质测量方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115424636B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006195449A (ja) * | 2004-12-15 | 2006-07-27 | Yamaha Corp | 声質判定装置、声質判定方法、および声質判定プログラム |
CN102148033A (zh) * | 2011-04-01 | 2011-08-10 | 华南理工大学 | 一种语言传输系统清晰度测试方法 |
JP2014228697A (ja) * | 2013-05-22 | 2014-12-08 | 国立大学法人名古屋大学 | 音響処理装置 |
CN106768266A (zh) * | 2017-03-07 | 2017-05-31 | 江苏大学 | 一种剔除背景噪声能量的厂房混响时间的测量方法 |
CN106920544A (zh) * | 2017-03-17 | 2017-07-04 | 深圳市唯特视科技有限公司 | 一种基于深度神经网络特征训练的语音识别方法 |
CN109410973A (zh) * | 2018-11-07 | 2019-03-01 | 北京达佳互联信息技术有限公司 | 变声处理方法、装置和计算机可读存储介质 |
CN111711914A (zh) * | 2020-06-15 | 2020-09-25 | 杭州艾力特数字科技有限公司 | 一种具有混响时间测量功能的扩声系统 |
CN115132215A (zh) * | 2022-06-07 | 2022-09-30 | 上海声瀚信息科技有限公司 | 一种单通道语音增强方法 |
-
2022
- 2022-11-04 CN CN202211373363.0A patent/CN115424636B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006195449A (ja) * | 2004-12-15 | 2006-07-27 | Yamaha Corp | 声質判定装置、声質判定方法、および声質判定プログラム |
CN102148033A (zh) * | 2011-04-01 | 2011-08-10 | 华南理工大学 | 一种语言传输系统清晰度测试方法 |
JP2014228697A (ja) * | 2013-05-22 | 2014-12-08 | 国立大学法人名古屋大学 | 音響処理装置 |
CN106768266A (zh) * | 2017-03-07 | 2017-05-31 | 江苏大学 | 一种剔除背景噪声能量的厂房混响时间的测量方法 |
CN106920544A (zh) * | 2017-03-17 | 2017-07-04 | 深圳市唯特视科技有限公司 | 一种基于深度神经网络特征训练的语音识别方法 |
CN109410973A (zh) * | 2018-11-07 | 2019-03-01 | 北京达佳互联信息技术有限公司 | 变声处理方法、装置和计算机可读存储介质 |
CN111711914A (zh) * | 2020-06-15 | 2020-09-25 | 杭州艾力特数字科技有限公司 | 一种具有混响时间测量功能的扩声系统 |
CN115132215A (zh) * | 2022-06-07 | 2022-09-30 | 上海声瀚信息科技有限公司 | 一种单通道语音增强方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115424636A (zh) | 2022-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Houtgast et al. | The modulation transfer function in room acoustics as a predictor of speech intelligibility | |
Neff et al. | Auditory thresholds of the cat | |
Vorländer et al. | Comparison of methods for measuring reverberation time | |
Alayrac et al. | Annoyance from industrial noise: Indicators for a wide variety of industrial sources | |
CN109831733A (zh) | 音频播放性能的测试方法、装置、设备和存储介质 | |
Fletcher et al. | The dependence of the loudness of a complex sound upon the energy in the various frequency regions of the sound | |
CN115424636B (zh) | 一种基于语音传输指数的音质测量方法及装置 | |
US9088857B2 (en) | Audio apparatus, control method for the audio apparatus, and storage medium for determining sudden noise | |
CN111816207B (zh) | 声音分析方法、系统、汽车及存储介质 | |
CN107785025A (zh) | 基于房间脉冲响应重复测量的噪声去除方法及装置 | |
Ando et al. | Subjective preference of sound with a single early reflection | |
CN111935624B (zh) | 车内音响空间感的客观评价方法、系统、设备及存储介质 | |
WO2005106407A1 (en) | A method of objectively determining subjective properties of a binaural sound signal | |
CN115512718A (zh) | 用于存量语音文件的语音质量评价方法、装置及系统 | |
Pollack | The effect of white noise on the loudness of speech of assigned average level | |
CN113593604A (zh) | 检测音频质量方法、装置及存储介质 | |
CN217306099U (zh) | 可剔除稳态干扰声音的声级计 | |
CN114220411A (zh) | 一种可剔除稳态干扰声音的声级计 | |
Reichardt | Subjective and objective measurement of the loudness level of single and repeated impulses | |
Balik et al. | Assessment of Audio Signal Noise Reduction Based on Psychoacoustic Model | |
Alghamdi et al. | Using acoustic parameters for intelligibility prediction of reverberant speech | |
JPH063474B2 (ja) | 信号分析装置 | |
CN112146745B (zh) | 一种水池混响时间的精确测量方法 | |
Stojanow et al. | A review on conventional psychoacoustic evaluation tools, methods and algorithms | |
JP2024057456A (ja) | 震度推定装置、震度推定プログラム及び震度推定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |