CN115019830A - 声音测评方法、装置、电子设备、存储介质及程序产品 - Google Patents

声音测评方法、装置、电子设备、存储介质及程序产品 Download PDF

Info

Publication number
CN115019830A
CN115019830A CN202110248660.1A CN202110248660A CN115019830A CN 115019830 A CN115019830 A CN 115019830A CN 202110248660 A CN202110248660 A CN 202110248660A CN 115019830 A CN115019830 A CN 115019830A
Authority
CN
China
Prior art keywords
sound
evaluation
amplitude
sound evaluation
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110248660.1A
Other languages
English (en)
Inventor
韩翀蛟
章伟明
郭万永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Innovation Co
Original Assignee
Alibaba Singapore Holdings Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Singapore Holdings Pte Ltd filed Critical Alibaba Singapore Holdings Pte Ltd
Priority to CN202110248660.1A priority Critical patent/CN115019830A/zh
Publication of CN115019830A publication Critical patent/CN115019830A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本公开实施例公开了一种声音测评方法、装置、电子设备、存储介质及程序产品,所述声音测评方法包括:接收声音测评命令,获取所述声音测评命令携带的声音测评目标;响应于所述声音测评命令,采集待测声音;根据所述声音测评目标对所述待测声音进行测评以得到声音测评结果;输出所述声音测评结果。该技术方案能够简化声音测评操作流程,统一声音测评标准,增强对接产品的自检能力,提高对接产品的测试验收率,提升声音测评效率,减少声音测评人力物力的投入成本。

Description

声音测评方法、装置、电子设备、存储介质及程序产品
技术领域
本公开涉及数据测评技术领域,具体涉及一种声音测评方法、装置、电子设备、存储介质及程序产品。
背景技术
随着互联网和人工智能技术的发展,智能语音交互产品的应用越来越广泛。对于智能语音交互产品来说,语音采集的质量、语音处理的质量以及语音输出的质量会直接影响智能语音交互产品的服务质量,随着智能语音交互产品的对接产品数量的增加,亟需一种方便、快捷、统一的声音测评请求方案来对于麦克风拾音质量、扬声器腔体设计失真情况、扬声器播放质量等因素进行评估,并提供调整方案,以简化声音测评操作流程,统一声音测评标准,增强对接产品的自检能力,提高对接产品的测试验收率,提升声音测评效率,减少声音测评人力物力的投入成本。
发明内容
本公开实施例提供一种声音测评方法、装置、电子设备、存储介质及程序产品。
第一方面,本公开实施例中提供了一种声音测评方法。
具体的,所述声音测评方法,包括:
接收声音测评命令,获取所述声音测评命令携带的声音测评目标;
响应于所述声音测评命令,采集待测声音;
根据所述声音测评目标对所述待测声音进行测评以得到声音测评结果;
输出所述声音测评结果。
结合第一方面,本公开在第一方面的第一种实现方式中,所述获取所述声音测评命令携带的声音测评目标,包括:
根据预设信息传输协议解析所述声音测评命令,得到所述声音测评目标。
结合第一方面和第一方面的第一种实现方式,本公开实施例在第一方面的第二种实现方式中,所述根据所述声音测评目标对所述待测声音进行测评以得到声音测评结果,包括:
当所述声音测评目标为削波检测时,对所述待测声音进行削波检测;
当所述声音测评目标为拾音测评时,对所述待测声音进行拾音测评;
当所述声音测评目标为均衡测评时,对所述待测声音进行均衡测评。
结合第一方面、第一方面的第一种实现方式和第一方面的第二种实现方式,本公开实施例在第一方面的第三种实现方式中,所述对所述待测声音进行削波检测,包括:
设置音量检测范围;
在所述音量检测范围内,遍历每个音量对所述待测声音进行削波检测。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式和第一方面的第三种实现方式,本公开实施例在第一方面的第四种实现方式中,所述对所述待测声音进行削波检测,包括:
统计所述待测声音的幅度直方图,得到幅度最大值;
将0到所述幅度最大值形成的幅度区间划分为N个幅度子区间,计算落入每个幅度子区间的幅度值个数,生成幅度值序列;
对所述幅度值序列进行平滑滤波处理,得到平滑幅度值序列;
对所述平滑幅度值序列中的某一幅度子区间,将其所在预设长度窗口内的局部均值确定为与其对应的幅度阈值;
计算所述平滑幅度值序列中该幅度子区间的平滑幅度值与对应幅度阈值之间的幅度差值;
将所述幅度差值与零进行比较,根据比较结果确定削波检测结果。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式和第一方面的第四种实现方式,本公开实施例在第一方面的第五种实现方式中,所述对所述待测声音进行拾音测评,包括:
获取不同声音采集设备采集得到的待测声音;
计算所述待测声音之间的相关度,其中,所述相关度为时域相关度或频域相关度;
根据所述相关度确定拾音测评结果。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式和第一方面的第五种实现方式,本公开实施例在第一方面的第六种实现方式中,所述对所述待测声音进行均衡测评,包括:
对所述待测声音进行快速傅里叶变换,得到待测声音频域数据;
根据所述待测声音频域数据确定不同频率成分的强度值;
根据不同频率成分的强度值计算得到谐波失真度量值;
获取预设谐波失真阈值,根据所述谐波失真度量值与所述预设谐波失真阈值的比较结果,确定均衡测评结果。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式和第一方面的第六种实现方式,本公开实施例在第一方面的第七种实现方式中,所述输出所述声音测评结果,包括:
根据预设信息传输协议封装所述声音测评结果后输出。
结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式、第一方面的第六种实现方式和第一方面的第七种实现方式,本公开实施例在第一方面的第八种实现方式中,还包括:
根据所述声音测评结果执行预设调整操作。
第二方面,本公开实施例中提供了一种声音测评装置。
具体的,所述声音测评装置,包括:
获取模块,被配置为接收声音测评命令,获取所述声音测评命令携带的声音测评目标;
采集模块,被配置为响应于所述声音测评命令,采集待测声音;
执行模块,被配置为根据所述声音测评目标对所述待测声音进行测评以得到声音测评结果;
输出模块,被配置为输出所述声音测评结果。
结合第二方面,本公开在第二方面的第一种实现方式中,所述获取模块中获取所述声音测评命令携带的声音测评目标的部分,被配置为:
根据预设信息传输协议解析所述声音测评命令,得到所述声音测评目标。
结合第二方面和第二方面的第一种实现方式,本公开实施例在第二方面的第二种实现方式中,所述执行模块被配置为:
当所述声音测评目标为削波检测时,对所述待测声音进行削波检测;
当所述声音测评目标为拾音测评时,对所述待测声音进行拾音测评;
当所述声音测评目标为均衡测评时,对所述待测声音进行均衡测评。
结合第二方面、第二方面的第一种实现方式和第二方面的第二种实现方式,本公开实施例在第二方面的第三种实现方式中,所述对所述待测声音进行削波检测的部分,被配置为:
设置音量检测范围;
在所述音量检测范围内,遍历每个音量对所述待测声音进行削波检测。
结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式和第二方面的第三种实现方式,本公开实施例在第二方面的第四种实现方式中,所述对所述待测声音进行削波检测的部分,被配置为:
统计所述待测声音的幅度直方图,得到幅度最大值;
将0到所述幅度最大值形成的幅度区间划分为N个幅度子区间,计算落入每个幅度子区间的幅度值个数,生成幅度值序列;
对所述幅度值序列进行平滑滤波处理,得到平滑幅度值序列;
对所述平滑幅度值序列中的某一幅度子区间,将其所在预设长度窗口内的局部均值确定为与其对应的幅度阈值;
计算所述平滑幅度值序列中该幅度子区间的平滑幅度值与对应幅度阈值之间的幅度差值;
将所述幅度差值与零进行比较,根据比较结果确定削波检测结果。
结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式和第二方面的第四种实现方式,本公开实施例在第二方面的第五种实现方式中,所述对所述待测声音进行拾音测评的部分,被配置为:
获取不同声音采集设备采集得到的待测声音;
计算所述待测声音之间的相关度,其中,所述相关度为时域相关度或频域相关度;
根据所述相关度确定拾音测评结果。
结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式和第二方面的第五种实现方式,本公开实施例在第二方面的第六种实现方式中,所述对所述待测声音进行均衡测评的部分,被配置为:
对所述待测声音进行快速傅里叶变换,得到待测声音频域数据;
根据所述待测声音频域数据确定不同频率成分的强度值;
根据不同频率成分的强度值计算得到谐波失真度量值;
获取预设谐波失真阈值,根据所述谐波失真度量值与所述预设谐波失真阈值的比较结果,确定均衡测评结果。
结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式和第二方面的第六种实现方式,本公开实施例在第二方面的第七种实现方式中,所述输出模块被配置为:
根据预设信息传输协议封装所述声音测评结果后输出。
结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式、第二方面的第六种实现方式和第二方面的第七种实现方式,本公开实施例在第二方面的第八种实现方式中,还包括:
调整模块,被配置为根据所述声音测评结果执行预设调整操作。
第九方面,本公开实施例提供了一种电子设备,包括存储器和至少一个处理器,其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述至少一个处理器执行以实现上述声音测评方法的方法步骤。
第十方面,本公开实施例提供了一种计算机可读存储介质,用于存储声音测评装置所用的计算机指令,其包含用于执行上述声音测评方法为声音测评装置所涉及的计算机指令。
第十一方面,本公开实施例提供了一种计算机程序产品,包括计算机程序/指令,其中,该计算机程序/指令被处理器执行时实现上述声音测评方法的方法步骤。
本公开实施例提供的技术方案可以包括以下有益效果:
上述技术方案借助声音测评命令的交互获取声音测评目标,并基于声音测评目标自动实现对于声音的多因素测评。该技术方案能够简化声音测评操作流程,统一声音测评标准,增强对接产品的自检能力,提高对接产品的测试验收率,提升声音测评效率,减少声音测评人力物力的投入成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。在附图中:
图1示出根据本公开一实施方式的声音测评方法的流程图;
图2A示出根据本公开一实施方式的未发生削波的幅度直方图;
图2B示出根据本公开一实施方式的发生硬削波的幅度直方图;
图2C示出根据本公开一实施方式的发生软削波的幅度直方图;
图3示出根据本公开一实施方式的施加增益示意图;
图4示出根据本公开一实施方式的声音测评方法的整体流程图;
图5示出根据本公开一实施方式的声音测评装置的结构框图;
图6示出根据本公开一实施方式的电子设备的结构框图;
图7是适于用来实现根据本公开一实施方式的声音测评方法的计算机系统的结构示意图。
具体实施方式
下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。
在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
本公开实施例提供的技术方案借助声音测评命令的交互获取声音测评目标,并基于声音测评目标自动实现对于声音的多因素测评。该技术方案能够简化声音测评操作流程,统一声音测评标准,增强对接产品的自检能力,提高对接产品的测试验收率,提升声音测评效率,减少声音测评人力物力的投入成本。
图1示出根据本公开一实施方式的声音测评方法的流程图,如图1所示,所述声音测评方法包括以下步骤S101-S104:
在步骤S101中,接收声音测评命令,获取所述声音测评命令携带的声音测评目标;
在步骤S102中,响应于所述声音测评命令,采集待测声音;
在步骤S103中,根据所述声音测评目标对所述待测声音进行测评以得到声音测评结果;
在步骤S104中,输出所述声音测评结果。
上文提及,随着互联网和人工智能技术的发展,智能语音交互产品的应用越来越广泛。对于智能语音交互产品来说,语音采集的质量、语音处理的质量以及语音输出的质量会直接影响智能语音交互产品的服务质量,随着智能语音交互产品的对接产品数量的增加,亟需一种方便、快捷、统一的声音测评请求方案来对于麦克风拾音质量、扬声器腔体设计失真情况、扬声器播放质量等因素进行评估,并提供调整方案,以简化声音测评操作流程,统一声音测评标准,增强对接产品的自检能力,提高对接产品的测试验收率,提升声音测评效率,减少声音测评人力物力的投入成本。
考虑到上述缺陷,在该实施方式中,提出一种声音测评方法,该方法借助声音测评命令的交互获取声音测评目标,并基于声音测评目标自动实现对于声音的多因素测评。该技术方案能够简化声音测评操作流程,统一声音测评标准,增强对接产品的自检能力,提高对接产品的测试验收率,提升声音测评效率,减少声音测评人力物力的投入成本。
在本公开一实施方式中,所述声音测评方法可适用于对于声音进行测评的计算机、计算设备、电子设备等声音测评设备。
在本公开一实施方式中,所述声音测评命令指的是由声音测评请求方发出的、通过数据网络传输的、携带有声音测评目标的、以使所述声音测评设备根据所述声音测评目标对于声音进行某种因素的测评的命令。其中,所述声音测评目标比如可以为:声音削波检测、拾音质量测评、声音均衡测评等等,以对于麦克风等拾音器的拾音质量、扬声器腔体设计失真情况、扬声器播放质量等因素进行评估。其中,所述声音测评命令可通过用户交互页面由声音测评请求方发出,比如,可设置一用户交互页面,上面显示有不同测评目标的声音测评按钮,用户点击哪一测评目标的声音测评按钮,即可发出携带有该测评目标的声音测评命令。
在本公开一实施方式中,所述待测声音指的是为了实现与所述声音测评命令对应的声音测评而播放的声音。其中,所述待测声音既可以是所述声音测评请求方播放的声音、所述声音测评请求方应所述声音测评设备的要求播放的声音,也可以为所述声音测评设备自动播放的声音。当所述待测声音为应所述声音测评设备的要求播放的声音时,所述声音测评设备可通过所述用户交互页面显示待测声音播放提示信息,以使所述声音测评请求方根据所述待测声音播放提示信息播放相应的待测声音。
在本公开一实施方式中,所述测评指的是与所述声音测评目标对应的声音测评,比如,若所述声音测评目标为声音削波检测,则所述测评为削波检测,若所述声音测评目标为拾音质量测评,则所述测评为拾音测评,若所述声音测评目标为声音均衡测评,则所述测评为均衡测评。
在本公开一实施方式中,所述声音测评结果比如可包括测试结果、测试评分及调整建议等信息,所述声音测评请求方根据所述声音测评结果可了解当前声音质量情况、当前声音问题所在以及该如何进行调整,以完成对于对接产品等产品的自动快速的测评。
在上述实施方式中,声音测评设备在接收到声音测评请求方发出的声音测评命令后,获取所述声音测评命令携带的声音测评目标,并响应于所述声音测评命令,采集待测声音,然后根据所述声音测评目标对所述待测声音进行与所述声音测评目标对应的声音测评,得到声音测评结果,最后输出所述声音测评结果,比如返回给声音测评请求方。
在本公开一实施方式中,所述步骤S101中获取所述声音测评命令携带的声音测评目标的步骤,可包括以下步骤:
根据预设信息传输协议解析所述声音测评命令,得到所述声音测评目标。
上文提及,所述声音测评命令是通过数据网络传输的,也就是说,所述声音测评命令的发送需遵循预设信息传输协议,根据预设信息传输协议进行格式转换、封装等操作。因此,在该实施方式中,在接收到所述声音测评命令后,需先对其根据所述预设信息传输协议进行解析,比如数据提取或解封装等操作,以得到所述声音测评命令携带的声音测评目标。
在本公开一实施方式中,所述步骤S102,即根据所述声音测评目标对所述待测声音进行测评以得到声音测评结果的步骤,可包括以下步骤:
当所述声音测评目标为削波检测时,对所述待测声音进行削波检测;
当所述声音测评目标为拾音测评时,对所述待测声音进行拾音测评;
当所述声音测评目标为均衡测评时,对所述待测声音进行均衡测评。
上文提及,所述声音测评目标可包括:声音削波检测、拾音质量测评、声音均衡测评等目标,因此,在该实施方式中,当确定所述声音测评目标为削波检测时,则对所述待测声音进行削波检测;当确定所述声音测评目标为拾音测评时,则对所述待测声音进行拾音测评;当确定所述声音测评目标为均衡测评时,则对所述待测声音进行均衡测评。
在本公开一实施方式中,所述对所述待测声音进行削波检测的步骤,可包括以下步骤:
设置音量检测范围;
在所述音量检测范围内,遍历每个音量对所述待测声音进行削波检测。
为了确定在哪个音量上所述待测声音发生了削波,该实施方式采用渐进音量控制,并在每个音量上进行削波检测的方法。即首先设置音量检测范围,然后在所述音量检测范围内,遍历每个音量对于所述待测声音进行削波检测。
在本公开一实施方式中,所述对所述待测声音进行削波检测的步骤,可包括以下步骤:
统计所述待测声音的幅度直方图,得到幅度最大值;
将0到所述幅度最大值形成的幅度区间划分为N个幅度子区间,计算落入每个幅度子区间的幅度值个数,生成幅度值序列;
对所述幅度值序列进行平滑滤波处理,得到平滑幅度值序列;
对所述平滑幅度值序列中的某一幅度子区间,将其所在预设长度窗口内的局部均值确定为与其对应的幅度阈值;
计算所述平滑幅度值序列中该幅度子区间的平滑幅度值与对应幅度阈值之间的幅度差值;
将所述幅度差值与零进行比较,根据比较结果确定削波检测结果。
在该实施方式中,对于每一确定的音量均执行上述削波检测步骤,具体地:
首先对所述待测声音进行幅度直方图统计,得到幅度最大值Max_Amplitude。
然后将从0至幅度最大值Max_Amplitude形成的幅度区间划分为N个幅度子区间,计算落入每个幅度子区间的幅度值个数,生成幅度值序列Histogram[n_bins],其中,n_bins∈[0,N]表示第n个幅度子区间,若所述待测声音未发生削波,以n_bins为横坐标,以幅度值序列Histogram[n_bins]为纵坐标,相应的幅度直方图可如图2A所示,若所述待测声音发生了硬削波,相应的幅度直方图可如图2B所示,若所述待测声音发生了软削波,相应的幅度直方图可如图2C所示,其中,图2A、图2B和图2C中的横坐标已进行归一化处理,由图2A、图2B和图2C显示的幅度直方图分布特性可知,无论发生硬削波或软削波,发生削波的声音数据的幅度直方图会在末端发生明显凸起,因此后续可基于该特点实现削波检测,而无需得知削波处理时使用的削波阈值。
对所述幅度值序列Histogram[n_bins]进行平滑滤波处理,以消除数据细小跳变带来的干扰,得到平滑幅度值序列Histogram_Sm[n_bins],在本公开一实施方式中,可利用下式对于所述幅度值序列Histogram[n_bins]进行平滑滤波处理:
Histogram_Sm[n_bins]=Sm_Para*Histogram[n_bins]+(1.0-Sm_Para)*Histogram[n_bins-1],
其中,Histogram_Sm[n_bins]表示经过平滑滤波处理后得到的平滑幅度值序列,Sm_Para为平滑参数,Sm_Para∈[0,1],所述平滑参数越小幅度值序列就越平滑,但平滑参数越小细节损失得也就越多,因此在实际应用中,可根据实际应用的需要和待测声音的特点确定所述平滑参数的值。
然后对所述平滑幅度值序列Histogram_Sm[n_bins]中的某一幅度子区间,将其所在预设长度窗口内的局部均值确定为与其对应的幅度阈值。比如,假设所述预设长度为M,则对于所述平滑幅度值序列Histogram_Sm[n_bins]中的第k个幅度子区间,其对应的幅度阈值可表示为:
Figure BDA0002964593970000111
计算所述平滑幅度值序列中该幅度子区间的平滑幅度值与对应幅度阈值之间的幅度差值,对于所述平滑幅度值序列Histogram_Sm[n_bins]中的第k个幅度子区间,所述幅度差值可表示为:
G_Sm_Avg[k]=Histogram_Avg[k]-Histogrem_Sm[k],
其中,G_Sm_Avg[k]表示第k个幅度子区间对应的幅度差值。
结合上述公式以及图2A、图2B和图2C可知,当未发生削波时,所述幅度直方图整体呈下降趋势,则幅度差值G_Sm_Avg[k]应大于零,当发生削波时,所述幅度直方图会出现尾段上翘,则幅度差值G_Sm_Avg[k]出现小于零的情况,因此,若连续X个幅度差值出现小于零的情况,则可确定在该音量上所述待测声音发生了削波,其中,X的值可根据实际应用的需要和待测声音的特点进行确定,本公开对其具体取值不作特别限定。后续向所述声音测评请求方返回发生削波的音量值,以及根据发生削波的音量值得到的削波检测得分,使得所述声音测评请求方能够根据上述削波检测对于相关产品进行调整。其中,所述削波检测得分主要依据不同的削波检测评价标准而定,比如,若削波检测评价标准规定在处于最大音量100时不出现削波,若经削波检测发现产品在音量达到90时就出现了削波,则该次削波检测得分可设置为90分。
上述削波检测方法仅依赖幅度分布直方图即可实现硬削波、软削波的检测,并且无需得知削波处理时使用的削波阈值,即能够对变增益场景下未知削波阈值的场景进行检测,因此具有较高的灵活性,以及较广的适用范围。
在本公开一实施方式中,所述对所述待测声音进行拾音测评的步骤,可包括以下步骤:
获取不同声音采集设备采集得到的待测声音;
计算所述待测声音之间的相关度,其中,所述相关度为时域相关度或频域相关度;
根据所述相关度确定拾音测评结果。
其中,所述拾音测评的主要目的是检测当某一产品具有两个或多个麦克风等拾音设备时,采集得到的各路声音数据之间的一致性是否符合要求。在该实施方式中,利用多路声音数据之间的相关度来判断各路声音数据之间的一致性,进而得到拾音测评结果。
其中,所述相关度的计算既可以在时域进行也可以在频域进行,即所述相关度既可以为时域相关度,也可以为频域相关度。在实际应用中,可根据所述声音测评设备的算力来选用不同的相关度计算方式,比如,若所述声音测评设备的算力较低,则可采用在时域计算相关度的方式,具体地,假设有两路声音数据x[n]、y[n],利用下式计算这两路声音数据的时域相关度:
Figure BDA0002964593970000121
其中,N表示声音数据长度,cross_corr表示两路声音数据的时域相关度。时域相关度cross_corr值越大,比如高于预设时域相关度阈值,说明拾音设备得到的声音数据的一致性越好,反之,时域相关度cross_corr值越小,比如低于预设时域相关度阈值,说明拾音设备得到的声音数据的一致性较差,拾音设备拾音的一致性存在问题,声音测评请求方需对于拾音设备进行检查,其中,判断时域相关度cross_corr值大小的时域相关度阈值可依据实际应用的需要进行设置。
若所述声音测评设备的算力较高,则可采用在频域计算相关度的方式,具体地,依然假设有两路声音数据x[n]、y[n],首先对两路声音数据进行快速傅里叶变换(FFT),得到对应的频域数据x_freq[n]、y_freq[n],n=[0,N],频域数据表征声音数据在每个频段的能量分布,若两个拾音设备拾音一致,则两路声音数据对应频段能量分布也应当相似,基于此,可将频域数据量化为N个二进制数构成的向量,以频域数据x_freq[n]为例,可利用下式将频域数据x_freq[n]量化为N个二进制数构成的向量binary_vector_x[n],n=[0,N]:
Figure BDA0002964593970000131
Figure BDA0002964593970000132
同理可以得到频域数据y_freq[n]对应的N个二进制数构成的向量binary_vector_y[n],若两个拾音设备拾音一致,则向量binary_vector_x[n]与binary_vector_y[n]的1、0分布应足够接近,此时可以以两者差值的累加和,即能量分布差异作为两路声音数据的频域相关度:
Figure BDA0002964593970000133
与时域相关度类似,频域相关度越大,比如高于预设频域相关度阈值,说明拾音设备得到的声音数据的一致性越好,反之,频域相关度值越小,比如低于预设频域相关度阈值,说明拾音设备得到的声音数据的一致性较差,拾音设备拾音的一致性存在问题,声音测评请求方需对于拾音设备进行检查,其中,所述频域相关度阈值可依据实际应用的需要进行设置。
在本公开一实施方式中,所述对所述待测声音进行均衡测评的步骤,可包括以下步骤:
对所述待测声音进行快速傅里叶变换,得到待测声音频域数据;
根据所述待测声音频域数据确定不同频率成分的强度值;
根据不同频率成分的强度值计算得到谐波失真度量值;
获取预设谐波失真阈值,根据所述谐波失真度量值与所述预设谐波失真阈值的比较结果,确定均衡测评结果。
在该实施方式中,基于对于频率成分的分析获取谐波失真情况,以进行均衡测评,具体地,对采集得到的待测声音进行快速傅里叶变换,得到待测声音频域数据,其中,所述待测声音data_in[n]为由所述声音评测设备采集所述声音评测设备自身播放的扫频音或有限单频音fteq_x而得到的声音,所述声音评测设备采集到的待测声音data_in[n]除了包含freq_x频率成分,还可能包含谐波失真freq_x*2、freq_x*3、freq_x*4等频率成分,后续可通过计算和分析上述频率成分强度来获取谐波失真情况;根据所述待测声音频域数据确定不同频率成分的强度值,比如,假设freq_x对应的频率成分强度为H(f),各次谐波对应的频率成分强度为H(nf),n=[2,m],m为选取计算谐波失真度量值的谐波次数,比如,当m设置为5时,即为计算5次以内谐波失真;根据不同频率成分的强度值计算得到谐波失真度量值,比如,所述谐波失真度量值THD_Val可由下式计算得到:
Figure BDA0002964593970000141
获取预设谐波失真阈值THD_THRE,根据所述谐波失真度量值与所述预设谐波失真阈值的比较结果,确定均衡测评结果,比如,若freq_x的谐波失真度量值THD_Val<预设谐波失真阈值THD_THRE,则表明freq_x频点处谐波失真较小,不需要抑制;若freq_x的谐波失真度量值THD_Val>预设谐波失真阈值THD_THRE,则表明freq_x频点处谐波失真较大,需要在输出时针对该频点对应频段施加增益gain_x进行抑制,其中,增益gain_x可利用下式计算:
Figure BDA0002964593970000142
在实际应用中,可调用产品芯片底层均衡设置接口将增益施加在对应频段上,如图3所示,假设需要施加增益的频段为band3,所施加的增益为gain_3,则为频段band3施加增益gain_3后得到的增益图形为图3中的虚线所示。如此,失真频段在输出过程中可得到一定的抑制,从而减小了谐波对回声消除的干扰,进而提升声音数据的接收准确率。
在本公开一实施方式中,所述步骤S103,即输出所述声音测评结果的步骤,可包括以下步骤:
根据预设信息传输协议封装所述声音测评结果后输出。
上文提及,所述声音测评命令是通过数据网络传输的,因此,声音测评结果也需要通过数据网络传输,即所述声音测评结果的发送也需遵循预设信息传输协议,根据预设信息传输协议进行格式转换、封装等操作。因此,在该实施方式中,在输出所述声音测评结果之前,需先对其根据所述预设信息传输协议进行封装再传输。
在本公开一实施方式中,所述方法还可包括以下步骤:
根据所述声音测评结果执行预设调整操作。
其中,所述预设调整操作指的是根据所述声音测评结果做出的、以优化声音测评结果为目的的操作,比如所述预设调整操作可以为调节扬声器增益、调节硬件参数、检查产品物料品质、检查硬件接入情况等等。
上述实施方式提供了一种实时化、可平台化的声音测评方案,基于所述声音测评方案搭建的声音测评平台可使得声音测评请求方无需自行搭建声音测评环境及声音外设,借助声音测评平台的自动执行即可实现声音测评,并可方便地通过声音测评平台获取声音测评结果,从而降低了声音测评门槛,还可得到与声音测评结果对应的调整建议。
图4示出根据本公开一实施方式的声音测评方法的整体流程图,如图4所示,声音测评请求方通过用户交互页面向声音测评设备发送声音测评命令,所述声音测评设备响应于接收到所述声音测评请求方发送的声音测评命令,获取所述声音测评命令携带的声音测评目标,并采集待测声音;所述声音测评设备根据所述声音测评目标对于所述待测声音执行与所述声音测评目标对应的声音测评,比如削波检测、拾音测评、均衡测评等等,得到声音测评结果;最后将声音测评结果输出,发送给所述声音测评请求方。
下述为本公开装置实施例,可以用于执行本公开方法实施例。
图5示出根据本公开一实施方式的声音测评装置的结构框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图5所示,所述声音测评装置包括:
获取模块501,被配置为接收声音测评命令,获取所述声音测评命令携带的声音测评目标;
采集模块502,被配置为响应于所述声音测评命令,采集待测声音;
执行模块503,被配置为根据所述声音测评目标对所述待测声音进行测评以得到声音测评结果;
输出模块504,被配置为输出所述声音测评结果。
上文提及,随着互联网和人工智能技术的发展,智能语音交互产品的应用越来越广泛。对于智能语音交互产品来说,语音采集的质量、语音处理的质量以及语音输出的质量会直接影响智能语音交互产品的服务质量,随着智能语音交互产品的对接产品数量的增加,亟需一种方便、快捷、统一的声音测评请求方案来对于麦克风拾音质量、扬声器腔体设计失真情况、扬声器播放质量等因素进行评估,并提供调整方案,以简化声音测评操作流程,统一声音测评标准,增强对接产品的自检能力,提高对接产品的测试验收率,提升声音测评效率,减少声音测评人力物力的投入成本。
考虑到上述缺陷,在该实施方式中,提出一种声音测评装置,该装置借助声音测评命令的交互获取声音测评目标,并基于声音测评目标自动实现对于声音的多因素测评。该技术方案能够简化声音测评操作流程,统一声音测评标准,增强对接产品的自检能力,提高对接产品的测试验收率,提升声音测评效率,减少声音测评人力物力的投入成本。
在本公开一实施方式中,所述声音测评装置可实现为对于声音进行测评的计算机、计算设备、电子设备等声音测评设备。
在本公开一实施方式中,所述声音测评命令指的是由声音测评请求方发出的、通过数据网络传输的、携带有声音测评目标的、以使所述声音测评设备根据所述声音测评目标对于声音进行某种因素的测评的命令。其中,所述声音测评目标比如可以为:声音削波检测、拾音质量测评、声音均衡测评等等,以对于麦克风等拾音器的拾音质量、扬声器腔体设计失真情况、扬声器播放质量等因素进行评估。其中,所述声音测评命令可通过用户交互页面由声音测评请求方发出,比如,可设置一用户交互页面,上面显示有不同测评目标的声音测评按钮,用户点击哪一测评目标的声音测评按钮,即可发出携带有该测评目标的声音测评命令。
在本公开一实施方式中,所述待测声音指的是为了实现与所述声音测评命令对应的声音测评而播放的声音。其中,所述待测声音既可以是所述声音测评请求方播放的声音、所述声音测评请求方应所述声音测评设备的要求播放的声音,也可以为所述声音测评设备自动播放的声音。当所述待测声音为应所述声音测评设备的要求播放的声音时,所述声音测评设备可通过所述用户交互页面显示待测声音播放提示信息,以使所述声音测评请求方根据所述待测声音播放提示信息播放相应的待测声音。
在本公开一实施方式中,所述测评指的是与所述声音测评目标对应的声音测评,比如,若所述声音测评目标为声音削波检测,则所述测评为削波检测,若所述声音测评目标为拾音质量测评,则所述测评为拾音测评,若所述声音测评目标为声音均衡测评,则所述测评为均衡测评。
在本公开一实施方式中,所述声音测评结果比如可包括测试结果、测试评分及调整建议等信息,所述声音测评请求方根据所述声音测评结果可了解当前声音质量情况、当前声音问题所在以及该如何进行调整,以完成对于对接产品等产品的自动快速的测评。
在上述实施方式中,声音测评设备在接收到声音测评请求方发出的声音测评命令后,获取所述声音测评命令携带的声音测评目标,并响应于所述声音测评命令,采集得到待测声音,然后根据所述声音测评目标对所述待测声音进行与所述声音测评目标对应的声音测评,得到声音测评结果,最后输出所述声音测评结果,比如返回给声音测评请求方。
在本公开一实施方式中,所述获取模块501中获取所述声音测评命令携带的声音测评目标的部分,可被配置为:
根据预设信息传输协议解析所述声音测评命令,得到所述声音测评目标。
上文提及,所述声音测评命令是通过数据网络传输的,也就是说,所述声音测评命令的发送需遵循预设信息传输协议,根据预设信息传输协议进行格式转换、封装等操作。因此,在该实施方式中,在接收到所述声音测评命令后,需先对其根据所述预设信息传输协议进行解析,比如数据提取或解封装等操作,以得到所述声音测评命令携带的声音测评目标。
在本公开一实施方式中,所述执行模块503可被配置为:
当所述声音测评目标为削波检测时,对所述待测声音进行削波检测;
当所述声音测评目标为拾音测评时,对所述待测声音进行拾音测评;
当所述声音测评目标为均衡测评时,对所述待测声音进行均衡测评。
上文提及,所述声音测评目标可包括:声音削波检测、拾音质量测评、声音均衡测评等目标,因此,在该实施方式中,当确定所述声音测评目标为削波检测时,则对所述待测声音进行削波检测;当确定所述声音测评目标为拾音测评时,则对所述待测声音进行拾音测评;当确定所述声音测评目标为均衡测评时,则对所述待测声音进行均衡测评。
在本公开一实施方式中,所述对所述待测声音进行削波检测的部分,可被配置为:
设置音量检测范围;
在所述音量检测范围内,遍历每个音量对所述待测声音进行削波检测。
为了确定在哪个音量上所述待测声音发生了削波,该实施方式采用渐进音量控制,并在每个音量上进行削波检测的方法。即首先设置音量检测范围,然后在所述音量检测范围内,遍历每个音量对于所述待测声音进行削波检测。
在本公开一实施方式中,所述对所述待测声音进行削波检测的部分,可被配置为:
统计所述待测声音的幅度直方图,得到幅度最大值;
将0到所述幅度最大值形成的幅度区间划分为N个幅度子区间,计算落入每个幅度子区间的幅度值个数,生成幅度值序列;
对所述幅度值序列进行平滑滤波处理,得到平滑幅度值序列;
对所述平滑幅度值序列中的某一幅度子区间,将其所在预设长度窗口内的局部均值确定为与其对应的幅度阈值;
计算所述平滑幅度值序列中该幅度子区间的平滑幅度值与对应幅度阈值之间的幅度差值;
将所述幅度差值与零进行比较,根据比较结果确定削波检测结果。
在该实施方式中,对于每一确定的音量均执行上述削波检测流程,具体地:
首先对所述待测声音进行幅度直方图统计,得到幅度最大值Max_Amplitude。
然后将从0至幅度最大值Max_Amplitude形成的幅度区间划分为N个幅度子区间,计算落入每个幅度子区间的幅度值个数,生成幅度值序列Histogram[n_bins],其中,n_bins∈[0,N]表示第n个幅度子区间,若所述待测声音未发生削波,以n_bins为横坐标,以幅度值序列Histogram[n_bins]为纵坐标,相应的幅度直方图可如图2A所示,若所述待测声音发生了硬削波,相应的幅度直方图可如图2B所示,若所述待测声音发生了软削波,相应的幅度直方图可如图2C所示,其中,图2A、图2B和图2C中的横坐标已进行归一化处理,由图2A、图2B和图2C显示的幅度直方图分布特性可知,无论发生硬削波或软削波,发生削波的声音数据的幅度直方图会在末端发生明显凸起,因此后续可基于该特点实现削波检测,而无需得知削波处理时使用的削波阈值。
对所述幅度值序列Histogram[n_bins]进行平滑滤波处理,以消除数据细小跳变带来的干扰,得到平滑幅度值序列Histogram_Sm[n_bins],在本公开一实施方式中,可利用下式对于所述幅度值序列Histogram[n_bins]进行平滑滤波处理:
Histogram_Sm[n_bins]=Sm_Para*Histogram[n_bins]+(1.0-Sm_Para)*Histogram[n_bins-1],
其中,Histogram_Sm[n_bins]表示经过平滑滤波处理后得到的平滑幅度值序列,Sm_Para为平滑参数,Sm_Para∈[0,1],所述平滑参数越小幅度值序列就越平滑,但平滑参数越小细节损失得也就越多,因此在实际应用中,可根据实际应用的需要和待测声音的特点确定所述平滑参数的值。
然后对所述平滑幅度值序列Histogram_Sm[n_bins]中的某一幅度子区间,将其所在预设长度窗口内的局部均值确定为与其对应的幅度阈值。比如,假设所述预设长度为M,则对于所述平滑幅度值序列Histogram_Sm[n_bins]中的第k个幅度子区间,其对应的幅度阈值可表示为:
Figure BDA0002964593970000191
计算所述平滑幅度值序列中该幅度子区间的平滑幅度值与对应幅度阈值之间的幅度差值,对于所述平滑幅度值序列Histogram_Sm[n_bins]中的第k个幅度子区间,所述幅度差值可表示为:
G_Sm_Avg[k]=Histogram_Avg[k]-Histogrem_Sm[k],
其中,G_Sm_Avg[k]表示第k个幅度子区间对应的幅度差值。
结合上述公式以及图2A、图2B和图2C可知,当未发生削波时,所述幅度直方图整体呈下降趋势,则幅度差值G_Sm_Avg[k]应大于零,当发生削波时,所述幅度直方图会出现尾段上翘,则幅度差值G_Sm_Avg[k]出现小于零的情况,因此,若连续X个幅度差值出现小于零的情况,则可确定在该音量上所述待测声音发生了削波,其中,X的值可根据实际应用的需要和待测声音的特点进行确定,本公开对其具体取值不作特别限定。后续向所述声音测评请求方返回发生削波的音量值,以及根据发生削波的音量值得到的削波检测得分,使得所述声音测评请求方能够根据上述削波检测对于相关产品进行调整。其中,所述削波检测得分主要依据不同的削波检测评价标准而定,比如,若削波检测评价标准规定在处于最大音量100时不出现削波,若经削波检测发现产品在音量达到90时就出现了削波,则该次削波检测得分可设置为90分。
上述削波检测方法仅依赖幅度分布直方图即可实现硬削波、软削波的检测,并且无需得知削波处理时使用的削波阈值,即能够对变增益场景下未知削波阈值的场景进行检测,因此具有较高的灵活性,以及较广的适用范围。
在本公开一实施方式中,所述对所述待测声音进行拾音测评的部分,可被配置为:
获取不同声音采集设备采集得到的待测声音;
计算所述待测声音之间的相关度,其中,所述相关度为时域相关度或频域相关度;
根据所述相关度确定拾音测评结果。
其中,所述拾音测评的主要目的是检测当某一产品具有两个或多个麦克风等拾音设备时,采集得到的各路声音数据之间的一致性是否符合要求。在该实施方式中,利用多路声音数据之间的相关度来判断各路声音数据之间的一致性,进而得到拾音测评结果。
其中,所述相关度的计算既可以在时域进行也可以在频域进行,即所述相关度既可以为时域相关度,也可以为频域相关度。在实际应用中,可根据所述声音测评设备的算力来选用不同的相关度计算方式,比如,若所述声音测评设备的算力较低,则可采用在时域计算相关度的方式,具体地,假设有两路声音数据x[n]、y[n],利用下式计算这两路声音数据的时域相关度:
Figure BDA0002964593970000211
其中,N表示声音数据长度,cross_corr表示两路声音数据的时域相关度。时域相关度cross_corr值越大,比如高于预设时域相关度阈值,说明拾音设备得到的声音数据的一致性越好,反之,时域相关度cross_corr值越小,比如低于预设时域相关度阈值,说明拾音设备得到的声音数据的一致性较差,拾音设备拾音的一致性存在问题,声音测评请求方需对于拾音设备进行检查,其中,判断时域相关度cross_corr值大小的时域相关度阈值可依据实际应用的需要进行设置。
若所述声音测评设备的算力较高,则可采用在频域计算相关度的方式,具体地,依然假设有两路声音数据x[n]、y[n],首先对两路声音数据进行快速傅里叶变换(FFT),得到对应的频域数据x_freq[n]、y_freq[n],n=[0,N],频域数据表征声音数据在每个频段的能量分布,若两个拾音设备拾音一致,则两路声音数据对应频段能量分布也应当相似,基于此,可将频域数据量化为N个二进制数构成的向量,以频域数据x_freq[n]为例,可利用下式将频域数据x_freq[n]量化为N个二进制数构成的向量binary_vector_x[n],n=[0,N]:
Figure BDA0002964593970000212
Figure BDA0002964593970000213
同理可以得到频域数据y_freq[n]对应的N个二进制数构成的向量binary_vector_y[n],若两个拾音设备拾音一致,则向量binary_vector_x[n]与binary_vector_y[n]的1、0分布应足够接近,此时可以以两者差值的累加和,即能量分布差异作为两路声音数据的频域相关度:
Figure BDA0002964593970000221
与时域相关度类似,频域相关度越大,比如高于预设频域相关度阈值,说明拾音设备得到的声音数据的一致性越好,反之,频域相关度值越小,比如低于预设频域相关度阈值,说明拾音设备得到的声音数据的一致性较差,拾音设备拾音的一致性存在问题,声音测评请求方需对于拾音设备进行检查,其中,所述频域相关度阈值可依据实际应用的需要进行设置。
在本公开一实施方式中,所述对所述待测声音进行均衡测评的部分,可被配置为:
对所述待测声音进行快速傅里叶变换,得到待测声音频域数据;
根据所述待测声音频域数据确定不同频率成分的强度值;
根据不同频率成分的强度值计算得到谐波失真度量值;
获取预设谐波失真阈值,根据所述谐波失真度量值与所述预设谐波失真阈值的比较结果,确定均衡测评结果。
在该实施方式中,基于对于频率成分的分析获取谐波失真情况,以进行均衡测评,具体地,对采集得到的待测声音进行快速傅里叶变换,得到待测声音频域数据,其中,所述待测声音data_in[n]为由所述声音评测设备采集所述声音评测设备自身播放的扫频音或有限单频音freq_x而得到的声音,所述声音评测设备采集到的待测声音data_in[n]除了包含freq_x频率成分,还可能包含谐波失真freq_x*2、freq_x*3、freq_x*4等频率成分,后续可通过计算和分析上述频率成分强度来获取谐波失真情况;根据所述待测声音频域数据确定不同频率成分的强度值,比如,假设freq_x对应的频率成分强度为H(f),各次谐波对应的频率成分强度为H(nf),n=[2,m],m为选取计算谐波失真度量值的谐波次数,比如,当m设置为5时,即为计算5次以内谐波失真;根据不同频率成分的强度值计算得到谐波失真度量值,比如,所述谐波失真度量值THD_Val可由下式计算得到:
Figure BDA0002964593970000222
获取预设谐波失真阈值THD_THRE,根据所述谐波失真度量值与所述预设谐波失真阈值的比较结果,确定均衡测评结果,比如,若freq_x的谐波失真度量值THD_Val<预设谐波失真阈值THD_THRE,则表明freq_x频点处谐波失真较小,不需要抑制;若freq_x的谐波失真度量值THD_Val>预设谐波失真阈值THD_THRE,则表明freq_x频点处谐波失真较大,需要在输出时针对该频点对应频段施加增益gain_x进行抑制,其中,增益gain_x可利用下式计算:
Figure BDA0002964593970000231
在实际应用中,可调用产品芯片底层均衡设置接口将增益施加在对应频段上,如图3所示,假设需要施加增益的频段为band3,所施加的增益为gain_3,则为频段band3施加增益gain_3后得到的增益图形为图3中的虚线所示。如此,失真频段在输出过程中可得到一定的抑制,从而减小了谐波对回声消除的干扰,进而提升声音数据的接收准确率。
在本公开一实施方式中,所述输出模块504可被配置为:
根据预设信息传输协议封装所述声音测评结果后输出。
上文提及,所述声音测评命令是通过数据网络传输的,因此,声音测评结果也需要通过数据网络传输,即所述声音测评结果的发送也需遵循预设信息传输协议,根据预设信息传输协议进行格式转换、封装等操作。因此,在该实施方式中,在输出所述声音测评结果之前,需先对其根据所述预设信息传输协议进行封装再传输。
在本公开一实施方式中,所述装置还可包括:
调整模块,被配置为根据所述声音测评结果执行预设调整操作。
其中,所述预设调整操作指的是根据所述声音测评结果做出的、以优化声音测评结果为目的的操作,比如所述预设调整操作可以为调节扬声器增益、调节硬件参数、检查产品物料品质、检查硬件接入情况等等。
上述实施方式提供了一种实时化、可平台化的声音测评方案,基于所述声音测评方案搭建的声音测评平台可使得声音测评请求方无需自行搭建声音测评环境及声音外设,借助声音测评平台的自动执行即可实现声音测评,并可方便地通过声音测评平台获取声音测评结果,从而降低了声音测评门槛,还可得到与声音测评结果对应的调整建议。
本公开还公开了一种电子设备,图6示出根据本公开一实施方式的电子设备的结构框图,如图6所示,所述电子设备600包括存储器601和处理器602;其中,
所述存储器601用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器602执行以实现上述方法步骤。
图7是适于用来实现根据本公开一实施方式的声音测评方法的计算机系统的结构示意图。
如图7所示,计算机系统700包括处理单元701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行上述实施方式中的各种处理。在RAM703中,还存储有计算机系统700操作所需的各种程序和数据。处理单元701、ROM702以及RAM703通过总线704彼此相连。输入/输出(I/0)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。其中,所述处理单元701可实现为CPU、GPU、TPU、FPGA、NPU等处理单元。
附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (21)

1.一种声音测评方法,包括:
接收声音测评命令,获取所述声音测评命令携带的声音测评目标;
响应于所述声音测评命令,采集待测声音;
根据所述声音测评目标对所述待测声音进行测评以得到声音测评结果;
输出所述声音测评结果。
2.根据权利要求1所述的方法,所述获取所述声音测评命令携带的声音测评目标,包括:
根据预设信息传输协议解析所述声音测评命令,得到所述声音测评目标。
3.根据权利要求1或2所述的方法,所述根据所述声音测评目标对所述待测声音进行测评以得到声音测评结果,包括:
当所述声音测评目标为削波检测时,对所述待测声音进行削波检测;
当所述声音测评目标为拾音测评时,对所述待测声音进行拾音测评;
当所述声音测评目标为均衡测评时,对所述待测声音进行均衡测评。
4.根据权利要求3所述的方法,所述对所述待测声音进行削波检测,包括:
设置音量检测范围;
在所述音量检测范围内,遍历每个音量对所述待测声音进行削波检测。
5.根据权利要求4所述的方法,所述对所述待测声音进行削波检测,包括:
统计所述待测声音的幅度直方图,得到幅度最大值;
将0到所述幅度最大值形成的幅度区间划分为N个幅度子区间,计算落入每个幅度子区间的幅度值个数,生成幅度值序列;
对所述幅度值序列进行平滑滤波处理,得到平滑幅度值序列;
对所述平滑幅度值序列中的某一幅度子区间,将其所在预设长度窗口内的局部均值确定为与其对应的幅度阈值;
计算所述平滑幅度值序列中该幅度子区间的平滑幅度值与对应幅度阈值之间的幅度差值;
将所述幅度差值与零进行比较,根据比较结果确定削波检测结果。
6.根据权利要求3-5任一所述的方法,所述对所述待测声音进行拾音测评,包括:
获取不同声音采集设备采集得到的待测声音;
计算所述待测声音之间的相关度,其中,所述相关度为时域相关度或频域相关度;
根据所述相关度确定拾音测评结果。
7.根据权利要求3-6任一所述的方法,所述对所述待测声音进行均衡测评,包括:
对所述待测声音进行快速傅里叶变换,得到待测声音频域数据;
根据所述待测声音频域数据确定不同频率成分的强度值;
根据不同频率成分的强度值计算得到谐波失真度量值;
获取预设谐波失真阈值,根据所述谐波失真度量值与所述预设谐波失真阈值的比较结果,确定均衡测评结果。
8.根据权利要求1-7任一所述的方法,所述输出所述声音测评结果,包括:
根据预设信息传输协议封装所述声音测评结果后输出。
9.根据权利要求1-8任一所述的方法,还包括:
根据所述声音测评结果执行预设调整操作。
10.一种声音测评装置,包括:
获取模块,被配置为接收声音测评命令,获取所述声音测评命令携带的声音测评目标;
采集模块,被配置为响应于所述声音测评命令,采集待测声音;
执行模块,被配置为根据所述声音测评目标对所述待测声音进行测评以得到声音测评结果;
输出模块,被配置为输出所述声音测评结果。
11.根据权利要求10所述的装置,所述获取模块中获取所述声音测评命令携带的声音测评目标的部分,被配置为:
根据预设信息传输协议解析所述声音测评命令,得到所述声音测评目标。
12.根据权利要求10或11所述的装置,所述执行模块被配置为:
当所述声音测评目标为削波检测时,对所述待测声音进行削波检测;
当所述声音测评目标为拾音测评时,对所述待测声音进行拾音测评;
当所述声音测评目标为均衡测评时,对所述待测声音进行均衡测评。
13.根据权利要求12所述的装置,所述对所述待测声音进行削波检测的部分,被配置为:
设置音量检测范围;
在所述音量检测范围内,遍历每个音量对所述待测声音进行削波检测。
14.根据权利要求13所述的装置,所述对所述待测声音进行削波检测的部分,被配置为:
统计所述待测声音的幅度直方图,得到幅度最大值;
将0到所述幅度最大值形成的幅度区间划分为N个幅度子区间,计算落入每个幅度子区间的幅度值个数,生成幅度值序列;
对所述幅度值序列进行平滑滤波处理,得到平滑幅度值序列;
对所述平滑幅度值序列中的某一幅度子区间,将其所在预设长度窗口内的局部均值确定为与其对应的幅度阈值;
计算所述平滑幅度值序列中该幅度子区间的平滑幅度值与对应幅度阈值之间的幅度差值;
将所述幅度差值与零进行比较,根据比较结果确定削波检测结果。
15.根据权利要求12-14任一所述的装置,所述对所述待测声音进行拾音测评的部分,被配置为:
获取不同声音采集设备采集得到的待测声音;
计算所述待测声音之间的相关度,其中,所述相关度为时域相关度或频域相关度;
根据所述相关度确定拾音测评结果。
16.根据权利要求12-15任一所述的装置,所述对所述待测声音进行均衡测评的部分,被配置为:
对所述待测声音进行快速傅里叶变换,得到待测声音频域数据;
根据所述待测声音频域数据确定不同频率成分的强度值;
根据不同频率成分的强度值计算得到谐波失真度量值;
获取预设谐波失真阈值,根据所述谐波失真度量值与所述预设谐波失真阈值的比较结果,确定均衡测评结果。
17.根据权利要求10-16任一所述的装置,所述输出模块被配置为:
根据预设信息传输协议封装所述声音测评结果后输出。
18.根据权利要求10-17任一所述的装置,还包括:
调整模块,被配置为根据所述声音测评结果执行预设调整操作。
19.一种电子设备,其特征在于,包括存储器和至少一个处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述至少一个处理器执行以实现权利要求1-9任一项所述的方法步骤。
20.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-9任一项所述的方法步骤。
21.一种计算机程序产品,包括计算机程序/指令,其中,该计算机程序/指令被处理器执行时实现权利要求1-9任一项所述的方法步骤。
CN202110248660.1A 2021-03-05 2021-03-05 声音测评方法、装置、电子设备、存储介质及程序产品 Pending CN115019830A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110248660.1A CN115019830A (zh) 2021-03-05 2021-03-05 声音测评方法、装置、电子设备、存储介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110248660.1A CN115019830A (zh) 2021-03-05 2021-03-05 声音测评方法、装置、电子设备、存储介质及程序产品

Publications (1)

Publication Number Publication Date
CN115019830A true CN115019830A (zh) 2022-09-06

Family

ID=83064312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110248660.1A Pending CN115019830A (zh) 2021-03-05 2021-03-05 声音测评方法、装置、电子设备、存储介质及程序产品

Country Status (1)

Country Link
CN (1) CN115019830A (zh)

Similar Documents

Publication Publication Date Title
CN109831733B (zh) 音频播放性能的测试方法、装置、设备和存储介质
JP2021533423A (ja) オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム
CN109845288B (zh) 用于麦克风之间的输出信号均衡的方法和装置
CN113170024B (zh) 回声消除方法、延时估计方法、装置、存储介质及设备
CN1783214A (zh) 混响估计和抑制系统
US20150058002A1 (en) Detecting Wind Noise In An Audio Signal
CN108010536B (zh) 回声消除方法、装置、系统及存储介质
US11450309B2 (en) Information processing method and system, computer system and computer readable medium
CN112992190B (zh) 音频信号的处理方法、装置、电子设备和存储介质
CN111415653A (zh) 用于识别语音的方法和装置
RU2611973C2 (ru) Ослабление шума в сигнале
WO2024041512A1 (zh) 音频降噪方法、装置、电子设备及可读存储介质
CN111383629B (zh) 语音处理方法和装置、电子设备以及存储介质
CN115019830A (zh) 声音测评方法、装置、电子设备、存储介质及程序产品
CN110517708B (zh) 一种音频处理方法、装置及计算机存储介质
JP6517124B2 (ja) 雑音抑圧装置、雑音抑圧方法、およびプログラム
CN116312621A (zh) 时延估计方法、回声消除方法、训练方法和相关设备
CN113450812A (zh) 一种啸叫检测方法、语音通话方法以及相关装置
CN117998254B (zh) 破音修复方法、装置及存储介质
JP2010103650A (ja) 信号検出方法,プログラム,情報記憶媒体,及びセンサー
EP1376997A1 (en) Method for testing and adapting an audio unit parameters to a telecommunication system
CN118301244A (zh) 一种语音通道的筛选方法、装置、设备及存储介质
CN116996138B (zh) 多分辨率载波信号检测方法、系统、电子设备及存储介质
CN111273216B (zh) 宽带信号幅度比的估计方法和装置
CN118275788B (zh) 一种参数估计方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20240305

Address after: # 03-06, Lai Zan Da Building 1, 51 Belarusian Road, Singapore

Applicant after: Alibaba Innovation Co.

Country or region after: Singapore

Address before: Room 01, 45th Floor, AXA Building, 8 Shanton Road, Singapore

Applicant before: Alibaba Singapore Holdings Ltd.

Country or region before: Singapore

TA01 Transfer of patent application right