CN115424636B - 一种基于语音传输指数的音质测量方法及装置 - Google Patents

一种基于语音传输指数的音质测量方法及装置 Download PDF

Info

Publication number
CN115424636B
CN115424636B CN202211373363.0A CN202211373363A CN115424636B CN 115424636 B CN115424636 B CN 115424636B CN 202211373363 A CN202211373363 A CN 202211373363A CN 115424636 B CN115424636 B CN 115424636B
Authority
CN
China
Prior art keywords
voice
sound
calculating
transmission index
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211373363.0A
Other languages
English (en)
Other versions
CN115424636A (zh
Inventor
黄海婵
陈送阳
郑建辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Soundbox Acoustic Tech Co ltd
Original Assignee
Guangzhou Soundbox Acoustic Tech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Soundbox Acoustic Tech Co ltd filed Critical Guangzhou Soundbox Acoustic Tech Co ltd
Priority to CN202211373363.0A priority Critical patent/CN115424636B/zh
Publication of CN115424636A publication Critical patent/CN115424636A/zh
Application granted granted Critical
Publication of CN115424636B publication Critical patent/CN115424636B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H17/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals

Abstract

本申请公开了一种基于语音传输指数的音质测量方法及装置,其方法包括:爆破气球,爆破气球,采集房间的回声,转化为脉冲信号;绘制声压频谱图;计算各倍频程带宽的中心频率的声压频谱值;对声压频谱曲线进行线性拟合;计算各倍频程带宽的中心频率相对应的混响时间;计算各混响时间的各调制频率的调制传递函数值;计算各调制频率对应的表观信噪比;计算调制频率传输指数;计算所有调制频率的平均调制频率传输指数;对所有混响时间的平均传输指数值计权,得到男声的语音传输指数和女声的语音传输指数;计算平均值测量音质。本申请将爆破气球声为测试音,线性拟合计算混响时间,无需复杂的滤波计算,减小测量音质过程的计算量。

Description

一种基于语音传输指数的音质测量方法及装置
技术领域
本申请涉及室内音质测量技术领域,尤其是涉及一种基于语音传输指数的音质测量方法及装置。
背景技术
语音传输指数是被广泛接受和使用的房间音质客观评价参量,使用室内声学理论来进行测量与计算。具体的,语音传输指数是衡量语音传输质量的一个指标,该指数可以较为全面的反映混响时间信噪比和回声等对语言清晰度的影响,并且考虑了系统失真,心理声学效果(掩蔽效应)等因素。语音传输指数的值的范围为0-1,值越大说明清晰度越好。
语音传输指数与一些较为公认的传统音质客观评价参量如混响时间、背景噪声、明晰度等相比,除了能综合考虑混响时间、信噪比的影响外,混响衰变的细节、房间反射声序列的分布等也可考虑,并与言语可懂度的主观感受直接对应,有着传统音质评价参量所不具备的优势。
现有的一种房间音质测量方法需要使用扩声音箱、麦克风、音频主机,音频主机采用改进的语言传输间接法测量语音传输指数,并根据语言传输指数值对室内音质进行测量。该方法需要扩声音箱播放测试声音,并在房间的多个位置布置麦克风采集测试声音,将测试声音转化为测试信号,传输给音频主机,并计算房间的语音传输指数,再根据该语音传输指数对室内的音质进行测量。但是,该方法由于采集的声音是人的语音,需要测试者对采集到的语音信号进行语音活动检测,将语音分为有话段和无话段,并将有话段和无话段的语音信号通过倍频程滤波器进行滤波,才能计算不同倍频程中心频率的调制传递函数,进而计算语音传输指数和测量音质;滤波过程的计算复杂,会导致测量音质过程计算量大的问题。
发明内容
为此,本申请的实施例提供了一种基于语音传输指数的音质测量方法,能够解决现有的房间音质测量方法滤波过程的计算复杂,导致测量音质过程计算量大的问题,具体技术方案内容如下:
第一方面,本申请提供一种基于语音传输指数的音质测量方法,包括:
爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;
根据所述脉冲信号绘制声压频谱图;
预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数;根据所述调制频率传输指数,计算所有调制频率的平均调制频率传输指数;
预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算男声的语音传输指数和女声的语音传输指数的平均值;
根据所述平均值测量音质。
优选的,所述预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值,包括:
根据预设的多个倍频程带宽,和各倍频程带宽的中心频率,计算各倍频程带宽的上限频率和下限频率;
根据各倍频程带宽的上限频率、下限频率和频率带宽,计算各倍频程中心频率的声压频谱值。
优选的,所述根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间,包括:
根据所述声压频谱曲线,得到气球爆破声稳定衰变的声音强度范围;
根据所述声音强度范围和拟合直线的斜率,计算得到各倍频程中心频率相对应的混响时间。
优选的,根据所述声压频谱曲线,得到气球爆破声稳定衰变的声音强度范围,包括:
所述气球爆破声稳定衰变的声音强度范围为,从气球爆破声的声音强度衰变5dB时的声音强度,到气球爆破声的声音强度衰变35dB时的声音强度。
优选的,所述根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线,包括:
将所述拟合直线的表达式设为y=kx+b,其中y为气球爆破声的声音强度,x为气球爆破后的时间,k为拟合直线的斜率,b为拟合直线的截距;
预设多个测量时间点,根据所述声压频谱曲线得到各测量时间点对应的气球爆破声的声音强度;将各测量时间点代入x,将各测量时间点对应的气球爆破声的声音强度代入y,得到所述拟合直线。
优选的,根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间,包括:
所述拟合直线的斜率的计算公式如下:
Figure 656202DEST_PATH_IMAGE001
其中,k为拟合直线的斜率,n为预设的测量时间点的数量,xi为第i个测量时间点的时间值,yi为第i个测量时间点对应的气球爆破声的声音强度,i的取值为从1到n的所有整数。
优选的,所述根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数,包括:
男声的语音传输指数和女声的语音传输指数计算公式如下:
Figure DEST_PATH_IMAGE002
当计算男声的语音传输指数时,STI男女为男声的语音传输指数,当计算女声的语音传输指数时,STI男女为女声的语音传输指数;
MTI k为平均调制频率传输指数,k为倍频程中心频率;
当计算男声的语音传输指数时,αk为男声权重因子,βk为男声冗余因子;当计算女声的语音传输指数时,αk为女声权重因子,βk为女声冗余因子。
优选的,根据所述平均值测量音质,包括:
预设5个音质等级,分别为:不能接受、较差、良好、优秀、非常好,根据所述平均值的范围确定对应的音质等级;
平均值范围在0-0.3时,对应的音质等级为不能接受;
平均值范围在0.3-0.45时,对应的音质等级为较差;
平均值范围在0.45-0.6时,对应的音质等级为良好;
平均值范围在0.6-0.75时,对应的音质等级为优秀;
平均值范围在0.75-1时,对应的音质等级为非常好。
优选的,所述预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值,包括:
调制传递函数值的计算公式如下:
Figure 975451DEST_PATH_IMAGE003
其中
Figure 240210DEST_PATH_IMAGE004
为倍频程中心频率为k,调制频率为fm的调制传递函数值,T为混 响时间,fm为调制频率。
优选的,根据所述调制传递函数值,计算各调制频率对应的表观信噪比,包括:
表观信噪比的计算公式如下:
Figure 790140DEST_PATH_IMAGE005
其中
Figure 202667DEST_PATH_IMAGE006
为倍频程中心频率为k,调制频率为fm的表观信噪比。
优选的,根据所述调制传递函数值,计算各调制频率对应的表观信噪比,包括:
对所述表观信噪比进行限制,当所述表观信噪比大于15dB时记为15dB,小于-15dB时记为-15dB。
优选的,根据所述表观信噪比,计算调制频率传输指数,包括:
调制频率传输指数的计算公式如下:
Figure 558562DEST_PATH_IMAGE007
其中
Figure 5723DEST_PATH_IMAGE008
为倍频程中心频率为k,调制频率为fm的调制频率传输指数
Figure 398659DEST_PATH_IMAGE006
为倍频程中心频率为k,调制频率为fm的表观信噪比。
第二方面,本申请还提供一种基于语音传输指数的音质测量装置,包括:
采集模块,用于爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;根据所述脉冲信号绘制声压频谱图;
混响时间测量模块,用于预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
语音传输指数测量模块,用于预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数;根据所述调制频率传输指数,计算所有调制频率的平均调制频率传输指数;
预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算男声的语音传输指数和女声的语音传输指数的平均值;
音质测量模块,用于根据所述平均值测量音质。
第三方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行基于语音传输指数的音质测量方法。
第四方面,本申请还提供一种电子设备,包括:处理器和存储器,所述处理器用于运行所述存储器中存储的程序,其中,所述程序运行时执行基于语音传输指数的音质测量方法。
综上所述,与现有技术相比,本申请实施例提供的技术方案带来的有益效果至少包括:
爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;根据所述脉冲信号绘制声压频谱图;预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;再根据调制传递函数值计算语音传输指数,并测量音质。
由于设备采集的是气球爆破的回声,声音较为纯净,同时采用了拟合直线的方法直接计算各倍频程带宽的中心频率相对应的混响时间,再根据混响时间计算调制传递函数值,不用再对声压频谱曲线进行复杂的滤波计算才得到有效的信号,简化了调制传递函数值的计算过程,进而减少了计算语音传输指数和测量音质过程的计算量。
附图说明
图1是本申请一实施例提供的一种基于语音传输指数的音质测量方法的流程图;
图2是本申请一实施例提供的一种基于语音传输指数的音质测量方法的混响时间计算示意图;
图3是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测底噪操作示意图;
图4是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测底噪操作另一示意图;
图5是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测混响时间操作示意图;
图6是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测混响时间操作另一示意图;
图7是本申请一实施例提供的一种基于语音传输指数的音质测量方法的语音传输指数计算操作示意图;
图8是本申请一实施例提供的一种基于语音传输指数的音质测量方法的音质测量报告图;
图9是本申请一实施例提供的一种基于语音传输指数的音质测量装置的结构框图;
图10是本申请一实施例提供的一种电子设备结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面结合说明书附图对本申请实施例作进一步详细描述。
本申请一实施例提供了一种基于语音传输指数的音质测量方法,如图1所示:
S01:爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号,绘制声压频谱图;
具体的,采集气球爆破时房间内回声的脉冲,可以使用带有传声器的电子设备,所述电子设备可以为手机等常用的具有采集声音,储存运算功能的设备。将手机放置在房间内听众较多的区域,距地面1.2m高处;气球爆破位置靠房间的角落,与手机的距离在1.5m以上。手机采集回声的脉冲后,将采集到的脉冲转化为脉冲信号,并对所述脉冲信号进行快速傅里叶变换运算,得到所述脉冲信号的声压信号,然后根据声压信号在手机的处理器生成声压频谱图。
S02:预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
具体的,预设的多个倍频程带宽可以是频率带宽为89Hz,倍频程中心频率为125Hz,上限频率为177Hz,下限频率为88Hz;频率带宽为178Hz,倍频程中心频率为250Hz,上限频率为355Hz,下限频率为177Hz;频率带宽为355Hz,倍频程中心频率为500Hz,上限频率为710Hz,下限频率为355Hz;频率带宽为710Hz,倍频程中心频率为1000Hz,上限频率为1420Hz,下限频率为710Hz;频率带宽为1420Hz,倍频程中心频率为2000Hz,上限频率为2840Hz,下限频率为1420Hz;频率带宽为2840Hz,倍频程中心频率为4000Hz,上限频率为5680Hz,下限频率为2840Hz;频率带宽为5680Hz,倍频程中心频率为8000Hz,上限频率为11360Hz、下限频率为5680Hz。
可以将拟合直线的表达式设为y=kx+b,其中y为气球爆破声的声音强度,x为气球爆破后的时间,k为拟合直线的斜率,b为拟合直线的截距;
预设多个测量时间点,时间测量点可以根据测量设备的计算能力尽可能多的设置,因为通过设置更多的时间测量点可以得到更多的拟合直线时需要的坐标点,进而对声压频谱曲线进行更准确的线性拟合。预设好测量时间点后,根据声压频谱曲线得到各测量时间点对应的气球爆破声的声音强度;将各测量时间点代入x,将各测量时间点对应的气球爆破声的声音强度代入y,得到拟合直线。
根据拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间,具体的:
可以使用如下的计算公式来计算拟合直线的斜率:
Figure 564061DEST_PATH_IMAGE009
其中,k为拟合直线的斜率,n为预设的测量时间点的数量,xi为第i个测量时间点的时间值,yi为第i个测量时间点对应的气球爆破声的声音强度,i的取值为从1到n的所有整数。
混响时间的计算可以根据所述声压频谱曲线,得到气球爆破声稳定衰变的声音强度范围;根据所述声音强度范围和拟合直线的斜率,计算得到各倍频程中心频率相对应的混响时间。
如图2所示,气球爆破声稳定衰变的声音强度范围为,从气球爆破声的声音强度衰变5dB时的声音强度,到气球爆破声的声音强度衰变35dB时的声音强度。将这一段时间的长度乘以2,就可以计算出各倍频程中心频率相对应的混响时间。
现有技术通过测量衰变60dB的时间来作为混响时间,但是由于背景噪声的影响,衰变60dB的时间难以准确的测量。因此,采用气球爆破声的声音强度衰变5dB的时间,到气球爆破声的声音强度衰变35dB的时间乘以2,以此结果作为替代计算衰变60dB时的混响时间,可以减少背景噪声对混响时间测量的影响。选择从衰变5dB的时间开始,可以减少声音开始衰变之后的前端不稳定信号,使计算出的混响时间更准确。
如图3,图4,图5,图6所示,本实施例提供了基于以上的测量混响时间的方法的操作示意图,主要包括:选择检测时间为20s,然后检测类型选择脉冲,之后测量混响时间前自动检测底噪,以防止由于底噪过大造成测量混响时间不准确的问题。底噪测量完成后开始测量混响时间。经过一段时间后即可得到结果。
S03:预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数,并计算所有调制频率传输指数的平均值,作为平均调制频率传输指数。
具体的,可以将调制频率fm的数量设置为14个,分别是0.63Hz、0.8Hz、1Hz、1.25Hz、1.6Hz、2Hz、2.5Hz、3.15Hz、4Hz、5Hz、6.3Hz、8Hz、10Hz、12.5Hz,并且使用如下的调制传递函数值的计算公式:
Figure 130171DEST_PATH_IMAGE003
其中
Figure 759736DEST_PATH_IMAGE004
为倍频程中心频率为k,调制频率为fm的调制传递函数值,T为混 响时间,fm为调制频率。通过设置数量和间距都比较合适的调制频率,可以在较为准确的计 算调制传递函数值的同时,保证运算的效率。
根据调制传递函数值,计算各调制频率对应的表观信噪比,可以采用如下的计算公式:
Figure 385889DEST_PATH_IMAGE010
其中
Figure 976270DEST_PATH_IMAGE011
为倍频程中心频率为k,调制频率为fm的表观信噪比。
根据相关标准,需要对计算出的表观信噪比进行限制,当所述表观信噪比大于15dB时记为15dB,小于-15dB时记为-15dB。
根据所述表观信噪比,计算调制频率传输指数,可以使用如下的计算公式:
Figure 611651DEST_PATH_IMAGE012
其中
Figure 502247DEST_PATH_IMAGE013
为倍频程中心频率为k,调制频率为fm的调制频率传输指数
Figure 627198DEST_PATH_IMAGE014
为倍频程中心频率为k,调制频率为fm的表观信噪比。
S04:预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算所述男声的语音传输指数和所述女声的语音传输指数的平均值;
具体的,男声和女声的语音传输指数测量可以采用如下的计算公式:
Figure 501613DEST_PATH_IMAGE015
当计算男声的语音传输指数时,STI男女为男声的语音传输指数,当计算女声的语音传输指数时,STI男女为女声的语音传输指数;
MTI k为平均调制频率传输指数,k为倍频程中心频率;
当计算男声的语音传输指数时,αk为男声权重因子,βk为男声冗余因子;当计算女声的语音传输指数时,αk为女声权重因子,βk为女声冗余因子。
男声权重因子,男声冗余因子,女声权重因子和女声冗余因子的数值,如表1所示:
表1
Figure 878367DEST_PATH_IMAGE016
表1中的权重因子和冗余因子的设置参考了现有的国家标准,具体含义指的是各倍频带对语音传输指数的相对贡献。男声和女声的语音传输指数计算公式参考现行国家标准,在此基础上,考虑了各倍频带对语音传输指数的相对贡献和两相邻倍频带对言语可懂度有贡献信息的重叠部分比例,使计算出的语音传输指数更能准确反映言语可懂度。
如图7所示,基于以上测量语音传输指数的方法,本实施例还提供了一种测量语音传输指数的操作示意图,根据设定好的检测时间为20s,检测类型为脉冲,得到传输指数的测量结果后,可以查看详情或导出音质的评价报告,也可以取消后再次测量。
S05:根据所述平均值测量音质。
具体的,根据平均值测量音质,可以根据表2进行:
表2
Figure 889049DEST_PATH_IMAGE017
表2中的范围指的是男声和女声的语音传输指数的平均值,通过该平均值所在的评价范围,对音质进行测量,可以更好的反映音质的不同级别。
如图8所示,音质测量的结果可以生成音质测量报告,报告包括检测项目,检测设备,检测地点,检测时间,检测时长,检测标准,环境噪声等测量音质的相关信息。报告中检测结果部分的内容,包括各倍频程中心频率相对应的混响时间,混响时间均值,男声和女声的语音传输指数的平均值,以及通过该平均值所在的范围得到的检测结论,以及各倍频程中心频率相对应的混响时间的曲线图。
本实施例提供的技术方案带来的有益效果至少包括:
爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;根据所述脉冲信号绘制声压频谱图;预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;再根据调制传递函数值计算语音传输指数,并测量音质。
由于设备采集的是气球爆破的回声,声音较为纯净,同时采用了拟合直线的方法直接计算各倍频程带宽的中心频率相对应的混响时间,再根据混响时间计算调制传递函数值,不用再对声压频谱曲线进行复杂的滤波计算才得到有效的信号,简化了调制传递函数值的计算过程,进而减少了计算语音传输指数和测量音质过程的计算量。
此外,本实施例提供的技术方案带来的有益效果还包括,减少背景噪声和声音开始衰变之后的前端不稳定信号对混响时间测量的影响,计算出的混响时间更准确;优化设计语音传输指数计算方式,使其更能准确反映言语可懂度;测量音质按等级划分,更好的反映音质的不同级别。
本申请一实施例还提供一种基于语音传输指数的音质测量装置,如图9所示,包括:
采集模块,用于爆破气球,设备采集气球爆破时房间内的脉冲,将所述脉冲转化为脉冲信号;根据所述脉冲信号绘制声压频谱图;
混响时间测量模块,用于预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
语音传输指数测量模块;
音质测量模块,用于根据所述平均值测量音质。
其中,语音传输指数测量模块还包括调制频率传输指数计算单元,用于预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数;根据所述调制频率传输指数,计算所有调制频率的平均调制频率传输指数;
男女声语音传输指数计算单元,用于预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算男声的语音传输指数和女声的语音传输指数的平均值。
在本申请一实施例中,提供了一种电子设备,如图10所示,该电子设备包通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该电子设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现基于语音传输指数的音质测量方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行基于语音传输指数的音质测量方法。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本申请一个实施例中,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述基于语音传输指数的音质测量方法的步骤。此处基于语音传输指数的音质测量方法的步骤可以是上述各个实施例的基于语音传输指数的音质测量方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。
其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本申请的保护范围。

Claims (15)

1.一种基于语音传输指数的音质测量方法,其特征在于,包括:
爆破气球,设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;
根据所述脉冲信号绘制声压频谱图;
预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数;根据所述调制频率传输指数,计算所有调制频率的平均调制频率传输指数;
预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算男声的语音传输指数和女声的语音传输指数的平均值;
根据所述平均值测量音质。
2.如权利要求1所述的音质测量方法,其特征在于,所述预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值,包括:
根据预设的多个倍频程带宽,和各倍频程带宽的中心频率,计算各倍频程带宽的上限频率和下限频率;
根据各倍频程带宽的上限频率、下限频率和频率带宽,计算各倍频程带宽的中心频率的声压频谱值。
3.如权利要求1所述的音质测量方法,其特征在于,所述根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间,包括:
根据所述声压频谱曲线,得到气球爆破声稳定衰变的声音强度范围;
根据所述声音强度范围和拟合直线的斜率,计算得到各倍频程带宽的中心频率相对应的混响时间。
4.如权利要求3所述的音质测量方法,其特征在于,根据所述声压频谱曲线,得到气球爆破声稳定衰变的声音强度范围,包括:
所述气球爆破声稳定衰变的声音强度范围为,从气球爆破声的声音强度衰变5dB时的声音强度,到气球爆破声的声音强度衰变35dB时的声音强度。
5.如权利要求1所述的音质测量方法,其特征在于,所述根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线,包括:
将所述拟合直线的表达式设为y=kx+b,其中y为气球爆破声的声音强度,x为气球爆破后的时间,k为拟合直线的斜率,b为拟合直线的截距;
预设多个测量时间点,根据所述声压频谱曲线得到各测量时间点对应的气球爆破声的声音强度;将各测量时间点代入x,将各测量时间点对应的气球爆破声的声音强度代入y,得到所述拟合直线。
6.如权利要求5所述的音质测量方法,其特征在于,根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间,包括:
所述拟合直线的斜率的计算公式如下:
Figure 91728DEST_PATH_IMAGE001
其中,k为拟合直线的斜率,n为预设的测量时间点的数量,xi为第i个测量时间点的时间值,yi为第i个测量时间点对应的气球爆破声的声音强度,i的取值为从1到n的所有整数。
7.如权利要求1所述的音质测量方法,其特征在于,所述根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数,包括:
男声的语音传输指数和女声的语音传输指数计算公式如下:
Figure 908375DEST_PATH_IMAGE002
当计算男声的语音传输指数时,STI男女为男声的语音传输指数,当计算女声的语音传输指数时,STI男女为女声的语音传输指数;
MTI k为平均调制频率传输指数,k为倍频程中心频率;
当计算男声的语音传输指数时,αk为男声权重因子,βk为男声冗余因子;当计算女声的语音传输指数时,αk为女声权重因子,βk为女声冗余因子。
8.如权利要求1所述的音质测量方法,其特征在于,根据所述平均值测量音质,包括:
预设5个音质等级,分别为:不能接受、较差、良好、优秀、非常好,根据所述平均值的范围确定对应的音质等级;
平均值范围在0-0.3时,对应的音质等级为不能接受;
平均值范围在0.3-0.45时,对应的音质等级为较差;
平均值范围在0.45-0.6时,对应的音质等级为良好;
平均值范围在0.6-0.75时,对应的音质等级为优秀;
平均值范围在0.75-1时,对应的音质等级为非常好。
9.如权利要求1所述的音质测量方法,其特征在于,所述预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值,包括:
调制传递函数值的计算公式如下:
Figure 645386DEST_PATH_IMAGE003
其中
Figure 981821DEST_PATH_IMAGE004
为倍频程中心频率为k,调制频率为fm的调制传递函数值,T为混响时 间,fm为调制频率。
10.如权利要求9所述的音质测量方法,其特征在于,根据所述调制传递函数值,计算各调制频率对应的表观信噪比,包括:
表观信噪比的计算公式如下:
Figure 411665DEST_PATH_IMAGE005
其中
Figure 715608DEST_PATH_IMAGE006
为倍频程中心频率为k,调制频率为fm的表观信噪比。
11.如权利要求10所述的音质测量方法,其特征在于,根据所述调制传递函数值,计算各调制频率对应的表观信噪比,包括:
对所述表观信噪比进行限制,当所述表观信噪比大于15dB时记为15dB,小于-15dB时记为-15dB。
12.如权利要求10所述的音质测量方法,其特征在于,根据所述表观信噪比,计算调制频率传输指数,包括:
调制频率传输指数的计算公式如下:
Figure 803781DEST_PATH_IMAGE007
其中
Figure 447251DEST_PATH_IMAGE008
为倍频程中心频率为k,调制频率为fm的调制频率传输指数;
Figure 844735DEST_PATH_IMAGE009
为倍频程中心频率为k,调制频率为fm的表观信噪比。
13.一种基于语音传输指数的音质测量装置,其特征在于,包括:
采集模块,用于设备采集气球爆破时房间的回声,将所述回声转化为脉冲信号;根据所述脉冲信号绘制声压频谱图;
混响时间测量模块,用于预设多个倍频程带宽,根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值;根据所述声压频谱值绘制声压频谱曲线,对所述声压频谱曲线进行线性拟合,得到拟合直线;根据所述拟合直线的斜率,计算各倍频程带宽的中心频率相对应的混响时间;
语音传输指数测量模块,用于预设多个调制频率,根据所述混响时间和所述调制频率,计算各混响时间的各调制频率的调制传递函数值;根据所述调制传递函数值,计算各调制频率对应的表观信噪比;根据所述表观信噪比,计算调制频率传输指数;根据所述调制频率传输指数,计算所有调制频率的平均调制频率传输指数;
预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子,对所有混响时间的平均传输指数值进行计权,得到男声的语音传输指数和女声的语音传输指数;计算男声的语音传输指数和女声的语音传输指数的平均值;
音质测量模块,用于根据所述平均值测量音质。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1-12任一项所述的基于语音传输指数的音质测量方法。
15.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器用于运行所述存储器中存储的程序,其中,所述程序运行时执行权利要求1-12任一项所述的基于语音传输指数的音质测量方法。
CN202211373363.0A 2022-11-04 2022-11-04 一种基于语音传输指数的音质测量方法及装置 Active CN115424636B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211373363.0A CN115424636B (zh) 2022-11-04 2022-11-04 一种基于语音传输指数的音质测量方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211373363.0A CN115424636B (zh) 2022-11-04 2022-11-04 一种基于语音传输指数的音质测量方法及装置

Publications (2)

Publication Number Publication Date
CN115424636A CN115424636A (zh) 2022-12-02
CN115424636B true CN115424636B (zh) 2023-02-03

Family

ID=84208029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211373363.0A Active CN115424636B (zh) 2022-11-04 2022-11-04 一种基于语音传输指数的音质测量方法及装置

Country Status (1)

Country Link
CN (1) CN115424636B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195449A (ja) * 2004-12-15 2006-07-27 Yamaha Corp 声質判定装置、声質判定方法、および声質判定プログラム
CN102148033A (zh) * 2011-04-01 2011-08-10 华南理工大学 一种语言传输系统清晰度测试方法
JP2014228697A (ja) * 2013-05-22 2014-12-08 国立大学法人名古屋大学 音響処理装置
CN106768266A (zh) * 2017-03-07 2017-05-31 江苏大学 一种剔除背景噪声能量的厂房混响时间的测量方法
CN106920544A (zh) * 2017-03-17 2017-07-04 深圳市唯特视科技有限公司 一种基于深度神经网络特征训练的语音识别方法
CN109410973A (zh) * 2018-11-07 2019-03-01 北京达佳互联信息技术有限公司 变声处理方法、装置和计算机可读存储介质
CN111711914A (zh) * 2020-06-15 2020-09-25 杭州艾力特数字科技有限公司 一种具有混响时间测量功能的扩声系统
CN115132215A (zh) * 2022-06-07 2022-09-30 上海声瀚信息科技有限公司 一种单通道语音增强方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195449A (ja) * 2004-12-15 2006-07-27 Yamaha Corp 声質判定装置、声質判定方法、および声質判定プログラム
CN102148033A (zh) * 2011-04-01 2011-08-10 华南理工大学 一种语言传输系统清晰度测试方法
JP2014228697A (ja) * 2013-05-22 2014-12-08 国立大学法人名古屋大学 音響処理装置
CN106768266A (zh) * 2017-03-07 2017-05-31 江苏大学 一种剔除背景噪声能量的厂房混响时间的测量方法
CN106920544A (zh) * 2017-03-17 2017-07-04 深圳市唯特视科技有限公司 一种基于深度神经网络特征训练的语音识别方法
CN109410973A (zh) * 2018-11-07 2019-03-01 北京达佳互联信息技术有限公司 变声处理方法、装置和计算机可读存储介质
CN111711914A (zh) * 2020-06-15 2020-09-25 杭州艾力特数字科技有限公司 一种具有混响时间测量功能的扩声系统
CN115132215A (zh) * 2022-06-07 2022-09-30 上海声瀚信息科技有限公司 一种单通道语音增强方法

Also Published As

Publication number Publication date
CN115424636A (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
Pollack Effects of high pass and low pass filtering on the intelligibility of speech in noise
Neff et al. Auditory thresholds of the cat
Alayrac et al. Annoyance from industrial noise: Indicators for a wide variety of industrial sources
CN109831733A (zh) 音频播放性能的测试方法、装置、设备和存储介质
CN101194535A (zh) 修正电声转换器声学参数的方法及实现该方法的装置
Fukushima et al. Study on the amplitude modulation of wind turbine noise: Part 1—Physical investigation
Fletcher et al. The dependence of the loudness of a complex sound upon the energy in the various frequency regions of the sound
CN115424636B (zh) 一种基于语音传输指数的音质测量方法及装置
US9088857B2 (en) Audio apparatus, control method for the audio apparatus, and storage medium for determining sudden noise
CN107785025A (zh) 基于房间脉冲响应重复测量的噪声去除方法及装置
CN111935624B (zh) 车内音响空间感的客观评价方法、系统、设备及存储介质
EP1740913A1 (en) A method of objectively determining subjective properties of a binaural sound signal
CN111816207B (zh) 声音分析方法、系统、汽车及存储介质
CN115512718A (zh) 用于存量语音文件的语音质量评价方法、装置及系统
Pollack The effect of white noise on the loudness of speech of assigned average level
RU2241242C1 (ru) Эхолот
Yost et al. Critical bands and critical ratios in animal psychoacoustics: An example using chinchilla data
CN217306099U (zh) 可剔除稳态干扰声音的声级计
CN114220411A (zh) 一种可剔除稳态干扰声音的声级计
Reichardt Subjective and objective measurement of the loudness level of single and repeated impulses
Alghamdi et al. Using acoustic parameters for intelligibility prediction of reverberant speech
JPH063474B2 (ja) 信号分析装置
CN112146745B (zh) 一种水池混响时间的精确测量方法
Stojanow et al. A review on conventional psychoacoustic evaluation tools, methods and algorithms
JP2024057456A (ja) 震度推定装置、震度推定プログラム及び震度推定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant