CN110581915B - 稳定性测试方法、装置、存储介质及电子设备 - Google Patents

稳定性测试方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN110581915B
CN110581915B CN201910818785.6A CN201910818785A CN110581915B CN 110581915 B CN110581915 B CN 110581915B CN 201910818785 A CN201910818785 A CN 201910818785A CN 110581915 B CN110581915 B CN 110581915B
Authority
CN
China
Prior art keywords
audio signal
verified
test
processor
recognition chip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910818785.6A
Other languages
English (en)
Other versions
CN110581915A (zh
Inventor
陈喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910818785.6A priority Critical patent/CN110581915B/zh
Publication of CN110581915A publication Critical patent/CN110581915A/zh
Application granted granted Critical
Publication of CN110581915B publication Critical patent/CN110581915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/24Arrangements for testing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)

Abstract

本申请实施例公开了一种稳定性测试方法、装置、存储介质及电子设备,其中,通过接收输入的测试指令,并根据该测试指令确定专用语音识别芯片或处理器为测试对象;当确定专用语音识别芯片为测试对象时,通过麦克风进行音频采集得到第一待校验音频信号,并根据第一待校验音频信号对专用语音识别芯片进行稳定性测试,得到第一测试结果;当确定处理器为测试对象时,根据本地预存的第二待校验音频信号对处理器进行稳定性测试,得到第二测试结果。由上可知,本申请针对包括专用语音识别芯片和处理器的电子设备,分别采用不同来源的音频信号对专用语音识别芯片和处理器进行针对性的稳定性测试,由此,能够准确的校验电子设备的唤醒稳定性。

Description

稳定性测试方法、装置、存储介质及电子设备
技术领域
本申请涉及测试技术领域,具体涉及一种稳定性测试方法、装置、存储介质及电子设备。
背景技术
语音识别是智能手机、平板电脑等电子设备获取用户意图的重要途径,目前,语音识别功能已成为众多电子设备的标配功能,比如,用户可以在不方便直接操控电子设备的情况下说出语音指令来控制电子设备。
应当说明的是,语音识别的可以分为唤醒和识别两个流程,当电子设备被唤醒后,才能够对电子设备进行语音控制,这也使得能够稳定的唤醒电子设备成为一个重要性能指标,因此,如何准确的的校验电子设备的唤醒稳定性变得尤为重要。
发明内容
本申请实施例提供了一种稳定性测试方法、装置、存储介质及电子设备,能够准确的校验电子设备的唤醒稳定性。
第一方面,本申请实施例提供了一种稳定性测试方法,应用于电子设备,所述电子设备包括麦克风、专用语音识别芯片和处理器,所述稳定性测试方法包括:
接收输入的测试指令,并根据所述测试指令确定所述专用语音识别芯片或所述处理器为测试对象;
当确定所述专用语音识别芯片为测试对象时,通过所述麦克风进行音频采集得到第一待校验音频信号,并根据所述第一待校验音频信号对所述专用语音识别芯片进行稳定性测试,得到第一测试结果;
当确定所述处理器为测试对象时,根据本地预存的第二待校验音频信号对所述处理器进行稳定性测试,得到第二测试结果。
第二方面,本申请实施例提供了一种稳定性测试装置,应用于电子设备,所述电子设备包括麦克风、专用语音识别芯片和处理器,所述稳定性测试装置包括:
指令接收模块,用于接收输入的测试指令,并根据所述测试指令确定所述专用语音识别芯片或所述处理器为测试对象;
第一测试模块,用于当确定所述专用语音识别芯片为测试对象时,通过所述麦克风进行音频采集得到第一待校验音频信号,并根据所述第一待校验音频信号对所述专用语音识别芯片进行稳定性测试,得到第一测试结果;
第二测试模块,用于当确定所述处理器为测试对象时,根据本地预存的第二待校验音频信号对所述处理器进行稳定性测试,得到第二测试结果。
第三方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,计算机程序被处理器和专用语音识别芯片加载以执行本申请实施例提供的稳定性测试方法。
第四方面,本申请实施例还提供了一种电子设备,所述电子设备包括麦克风、专用语音识别芯片、处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序被所述专用语音识别芯片和所述处理器调用时用于执行本申请实施例提供的稳定性测试方法。
本申请实施例中,针对包括专用语音识别芯片和处理器的电子设备,分别采用不同来源的音频信号对专用语音识别芯片和处理器进行针对性的稳定性测试,由此,能够准确的校验电子设备的唤醒稳定性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的稳定性测试方法的一流程示意图。
图2是本申请实施例中对专用语音识别芯片进行稳定性测试的示意图。
图3是本申请实施例中搭建的测试环境的示意图。
图4是本申请实施例中对处理器进行稳定性测试的示意图。
图5是本申请实施例中提取梅尔频率倒谱系数的示意图。
图6是本申请实施例提供的稳定性测试装置的结构示意图。
图7是本申请实施例提供的电子设备的结构示意图。
图8是本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
应当说明的是,以下的说明是通过所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。
本申请实施例提供一种稳定性测试方法、稳定性测试装置、存储介质以及电子设备,其中,该稳定性测试方法的执行主体可以是本申请实施例提供的稳定性测试装置,或者集成了该稳定性测试装置的电子设备,其中该稳定性测试装置可以采用硬件或者软件的方式实现,电子设备可为计算设备诸如膝上型计算机、包含嵌入式计算机的计算机监视器、平板电脑、蜂窝电话、媒体播放器、或其他手持式或便携式电子设备、较小的设备(诸如腕表设备、挂式设备、耳机或听筒设备、被嵌入在眼镜中的设备或者佩戴在用户的头部上的其他设备,或其他可佩戴式或微型设备)、电视机、不包含嵌入式计算机的计算机显示器、游戏设备、导航设备、嵌入式系统(诸如其中具有显示器的电子设备被安装在信息亭或汽车中的系统)等。
如图1所示,本申请实施例提供的稳定性测试方法的流程可以如下:
101,接收输入的测试指令,并根据测试指令确定专用语音识别芯片或处理器为测试对象。
应当说明的是,本申请实施例中的电子设备包括麦克风、专用语音识别芯片和处理器,其中,专用语音识别芯片是以语音识别为目的而设计的专用芯片,比如以语音识别为目的而设计的数字信号处理芯片,以语音识别为目的而设计的专用集成电路芯片等,其相较于通用的处理器,具有更低的功耗,但处理能力相对较弱。由于专用语音识别芯片的处理能力不及处理器的处理能力,在实际进行语音唤醒时,先由专用语音识别芯片对采集的音频信号进行一级校验,也即进行大致的校验,在且仅在一级校验通过时,再由处理器对采集的音频信号进行二级校验,确保整体的校验准确性,当二级校验通过时,再唤醒语音交互应用,实现与用户的语音交互。其中,语音交互应用也称为语音助手,比如“小欧”等。
假设按照专用语音识别芯片和处理器的实际唤醒流程来校验整体的稳定性,可能因麦克风采集异常或者专用语音识别芯片校验异常等原因导致专用语音识别芯片的一级校验失败,进而导致无法进行二级校验,影响稳定性测试结果的可靠性,本申请分别对专用语音识别芯片和处理器进行稳定性测试。
相应的,本申请实施例中通过测试指令来指示专用语音识别芯片或处理器为进行稳定性测试的测试对象。比如,以基于安卓系统的电子设备为例,可以采用ADB(AndroidDebug Bridge,安卓调试桥)命令的方式输入测试指令,其中,在ADB命令中携带接口属性,用于对测试对象进行设定,当接口属性设为False.First时,指示对专用语音识别芯片进行稳定性测试,当接口属性设为False.Second时,指示对处理器进行稳定性测试。此外,当接口属性配置为True时,指示对专用语音识别芯片和处理器的唤醒率进行测试。
102,当确定专用语音识别芯片为测试对象时,通过麦克风进行音频采集得到第一待校验音频信号,并根据第一待校验音频信号对专用语音识别芯片进行稳定性测试,得到第一测试结果。
当确定专用语音识别芯片为测试对象时,电子设备通过麦克风进行音频采集,将实际采集得到的音频信号记为第一待校验音频信号,然后按照专用语音识别芯片进行一级校验的流程,通过采集的第一待校验音频信号对专用语音识别芯片进行稳定性测试,得到第一测试结果。
其中,电子设备所设置的麦克风可以是内置的麦克风,也可以是外置的麦克风(可以是有线的麦克风,也可以是无线的麦克风)。假设麦克风为模拟制式的麦克风,那么将采集到模拟制式的第一待校验音频信号,此时需要将采集到的待校验音频信号进行模数转换,得到数字化的第一待校验音频信号,用于后续处理。本领域普通技术人员可以理解的是,若电子设备所设置的麦克风为数字制式的麦克风,那么将直接采集到数字化的第一待校验音频信号,无需再进行模数转换。
103,当确定处理器为测试对象时,根据本地预存的第二待校验音频信号对处理器进行稳定性测试,得到第二测试结果。
比如,本申请实施例中还在电子设备本地预先设置有语料数据库,该语料数据库中存储有多条相同的语料,将语料数据库中存储的语料作为用于对处理器进行稳定性测试的第二待校验音频信号。
相应的,当确定处理器为测试对象时,电子设备从语料数据库中提取出第二待校验音频信号,然后按照处理器进行二级校验的流程,通过提取的第二待校验音频信号对处理器进行稳定性测试,得到第二测试结果。
本申请实施例中,通过接收输入的测试指令,并根据该测试指令确定专用语音识别芯片或处理器为测试对象;当确定专用语音识别芯片为测试对象时,通过麦克风进行音频采集得到第一待校验音频信号,并根据第一待校验音频信号对专用语音识别芯片进行稳定性测试,得到第一测试结果;当确定处理器为测试对象时,根据本地预存的第二待校验音频信号对处理器进行稳定性测试,得到第二测试结果。由上可知,本申请针对包括专用语音识别芯片和处理器的电子设备,分别采用不同来源的音频信号对专用语音识别芯片和处理器进行针对性的稳定性测试,由此,能够准确的校验电子设备的唤醒稳定性。
在一实施例中,将电子设备放置在预先搭建的测试环境中,测试环境中设置有用于播放测试语音的语音播放设备,测试语音为包括第一预设唤醒词的纯净语音信号,请参照图2,“通过麦克风进行音频采集得到第一待校验音频信号,并根据第一待校验音频信号对专用语音识别芯片进行稳定性测试,得到第一测试结果”,包括:
1021,通过专用语音识别芯片调用对应第一预设唤醒词的一级文本校验模型;
1022,通过麦克风进行音频采集,得到对应测试语音的第一待校验音频信号;
1023,通过一级文本校验模型校验第一待校验音频信号中是否包括第一预设唤醒词,得到校验结果;
1024,判断当前是否满足第一预设停止条件,否则重新通过麦克风采集第一待校验音频信号进行校验,是则获取专用语音识别芯片最后一次进行校验的校验结果;
1025,当专用语音识别芯片最后一次进行校验的校验结果为是时,得到专用语音识别芯片通过稳定性测试的第一测试结果。
本申请实施例中,预先搭建测试环境,比如,为了排除外界干扰,可以搭建隔音的测试环境,其中,测试环境中设置有用于播放测试语音的语音播放设备,测试语音为包括第一预设唤醒词的纯净语音信号,比如,语音播放设备可以为人工头,其以5秒为间隔,循环播放测试语音。应当说明的是,第一预设唤醒词可由本领域普通技术人员根据实际需要进行设置,本申请实施例中对此不作具体限制,比如,可以设置为“小欧小欧”。
在开始对专用语音识别芯片进行稳定性测试前,将电子设备放置在搭建的测试环境中,以通过语音播放设备播放测试语音模拟真实使用场景,校验专用语音识别芯片的稳定性。
其中,首先通过专用语音识别芯片调用预先训练的对应第一预设唤醒词的一级文本校验模型,该一级文本校验模型用于校验音频信号中是否包括第一预设唤醒词。
然后,通过麦克风进行音频采集,采集得到对应测试语音的音频信号,记为第一待校验音频信号。本领域普通技术人员应当理解的是,由于声音传播以及麦克风采集等因素,采集得到的第一待校验音频信号将与语音部分设备原始播放的测试语音存在一定的差异。
在采集得到第一待校验音频信号之后,专用语音识别芯片通过调用的一级文本校验模型校验第一待校验音频信号中是否包括第一预设唤醒词,得到校验结果。
示例性的,一级文本校验模型由评分函数训练得到,其中,评分函数用于将向量映射到数值,以此为约束,可由本领域普通技术人员根据实际需要选取合适的函数作为评分函数,本发明实施例对此不做具体限制。
在通过一级文本校验模型对第一待校验音频信号进行校验时,专用语音识别芯片首先提取第一待校验音频信号向量形式的声学特征,并将提取到声学特征输入一级文本校验模型进行评分,并输出一个评分分值,当输出的评分分值达到该一级文本校验模型对应的判别分值(可由本领域普通技术人员根据实际需要预先设定)时,判定第一待校验音频信号中包括第一预设唤醒词。
比如,一级文本校验模型的输出分值的区间为[0,1],其对应的判别分值配置为0.45,也即是当第一待校验音频信号所对应的评分分值达到0.45时,专用语音识别芯片将判定该第一待校验音频信号中包括第一预设唤醒词。
在完成对当次采集第一待校验音频信号的校验,并得到校验结果之后,判断当前是否满足第一预设停止条件,该第一预设停止条件用于描述在何种情况下结束对专用语音识别芯片的稳定性测试,可由本领域普通技术人员根据实际需要进行设置。示例性的,可以第一预设停止条件设置为:
专用语音识别芯片进行校验的累计校验时长达到预设时长;或者,
专用语音识别芯片进行校验的累计校验次数达到预设次数等。
其中,预设时长和预设次数可由本领域普通技术人员根据实际需要进行设置,本申请实施例中对此不作具体限制,比如,可以设置预设时长为72小时,即将第一预设停止条件设置为:专用语音识别芯片进行校验的累计校验时长达到72小时;可以设置预设次数为50000次,即将第一预设停止条件设置为:专用语音识别芯片进行校验的累计校验次数达到50000次。
本申请实施例中,在当前满足第一预设停止条件时,获取专用语音识别芯片最后一次进行校验的校验结果,若专用语音识别芯片最后一次进行校验的校验结果为是,则得到专用语音识别芯片通过稳定性测试的第一测试结果。
在当前不满足第一预设停止条件时,继续通过麦克风采集第一待校验音频信号进行校验,直至满足第一预设停止条件时。
在一实施例中,测试环境中还设置有噪声播放设备,噪声播放设备用于播放预设场景的样本噪声。
本申请实施例中,还设置有噪声播放设备,该噪声播放设备用于播放预设场景的样本噪声,从而测试专用语音识别芯片在预设场景下的稳定性。其中,对于选取何种场景的样本噪声,可由本领域普通技术人员根据实际需要进行选取,比如,通过噪声设备播放地铁场景的样本噪声,可以测试专用语音识别芯片在地铁场景下的稳定性。
在一实施例中,“通过麦克风进行音频采集”之前,还包括:
(1)获取语音播放设备播放测试语音的第一分贝值,以及获取噪声播放设备播放样本噪声的第二分贝值;
(2)当第一分贝值和第二分贝值满足预设测试条件时,通过麦克风进行音频采集。
本申请实施例中,为了确保对专用语音识别芯片稳定性测试的正常进行,需要保证测试时一定的信噪比。
比如,在开始进行测试前,将分贝仪放置在电子设备相同位置处,通过该分贝仪获取语音播放设备播放测试语音的第一分贝值,以及获取噪声播放设备播放样本噪声的第二分贝值,然后,计算第一分贝值和第二分贝值的比值,作为测试环境的信噪比。
相应的,可以将预设测试条件设置为测试环境的信噪比达到预设信噪比,对于预设信噪比的取值,可由本领域普通技术人员根据实际需要取值。
专用语音识别芯片在根据第一分贝值以及第二分贝值计算得到测试环境的信噪比之后,判断该信噪比是否达到预设信噪比,是则通过麦克风进行音频采集得到第一待校验音频信号,开始进行稳定性测试。
比如,请参照图3,首先搭建隔音的测试环境,并在测试环境中设置人工头作为用于播放测试语音的语音播放设备,以及设置扬声器作为用于播放样本噪声的噪声播放设备,此外,测试环境中还设置有计算机,作为对人工头和扬声器进行播放控制的主控设备。本领域普通技术人员根据实际需要,确定电子设备在测试环境中的放置位置,并将电子设备放置在确定的该放置位置。
其中,在计算机的控制下,人工头每间隔5秒循环播放包括第一预设唤醒词的纯净语音信号,记为测试语音,扬声器持续播放样本噪声,模拟预设场景,从而校验专用语音识别芯片在该预设场景下的稳定性。
在一实施例中,第二待校验音频信号包括第二预设唤醒词,请参照图4,“根据本地预存的第二待校验音频信号对处理器进行稳定性测试,得到第二测试结果”,包括:
1031,通过处理器调用对应第二预设唤醒词的二级文本校验模型,以及调用对应第二待校验音频信号的声纹校验模型;
1032,提取本地存储的第二待校验音频信号,并通过二级文本校验模型校验第二待校验音频信号中是否包括第二预设唤醒词;
1033,若第二待校验音频信号中包括第二预设唤醒词,则通过声纹校验模型校验第二待校验音频信号的声纹特征;
1034,若第二待校验音频信号的声纹特征通过校验,则发送指示信息至预设计数应用,指示预设计数应用进行计数,以得到对应处理器的计数结果;
1035,判断当前是否满足第二预设停止条件,否则重新提取第二待校验音频信号进行校验,是则获取计数结果;
1036,当计数结果与处理器校验声纹特征的校验次数相同时,得到处理器通过稳定性测试的第二测试结果。
其中,第二预设唤醒词可以与第一预设唤醒词相同,也可以不同。
在对处理器的稳定性进行测试时,首先通过处理器调用预先训练的对应第二预设唤醒词的二级文本校验模型,该二级文本校验模型用于校验音频信号中是否包括第二预设唤醒词。此外,还调用预先根据第二待校验音频信号训练的声纹校验模型,该声纹校验模型描述了第二待校验音频信号的声纹特征。比如,声纹校验模型可由二级文本模型基于第二待校验音频信号进一步训练得到。
然后,从语料数据库中提取第二待校验音频信号,处理器通过调用的二级文本校验模型校验第二待校验音频信号中是否包括第二预设唤醒词,得到校验结果。
若校验结果为第二待校验音频信号中包括第二预设唤醒词,则进一步通过处理器调用的声纹校验模型校验第二待校验音频信号的声纹特征。本领域普通技术人员应当理解的是,由于声纹校验模型描述的即是第二待校验音频信号的声纹特征,在处理器运行声纹校验模型正常的情况下,将得到第二待校验音频信号的声纹特征通过校验的校验结果。其中,处理器在第二待校验音频信号的声纹特征通过校验时,发送指示信息至电子设备的操作系统(比如安卓系统)。
另一方面,本申请实施例中还预先设计有计数应用,可由本领域普通技术人员根据实际需要选择合适的编程语言编程得到。为了能够获知处理器对第二待校验音频信号的声纹特征的校验是否通过,预设计数应用预先在操作系统注册指示信息,使得安卓系统能够将指示信息推送给预设计数应用。
相应的,预设计数应用在接收到指示信息时,根据该指示信息进行计数,以得到对应处理器的计数结果,比如,预设计数应用创建有对应处理器的、初始值为零的计数值,并在每次接收到指示信息,也即是每一次处理器对提取的第二待校验音频信号的声纹特征校验通过时,对计数值加一,由此实现对声纹特征校验成功次数的统计,得到计数结果。应当说明的是,由于处理器在且仅在第二待校验音频信号通过二级文本校验模型的校验后,再通过声纹校验模型进行校验,最终得到的计数结果即反映了二级文本校验模型和声纹校验模型同时对第二待校验音频信号校验通过的次数。
之后,处理器判断当前是否满足第二预设停止条件,该第一预设停止条件用于描述在何种情况下结束对专用语音识别芯片的稳定性测试,可由本领域普通技术人员根据实际需要进行设置。示例性的,可以第二预设停止条件设置为:
处理器已完成对语料数据库中全部第二待校验音频信号的校验。
比如,语料数据库中保存有50000条第二待校验音频信号,则处理器在完成这50000条第二待校验音频信号的校验后,确定满足第二预设停止条件。
本申请实施例中,在当前满足第二预设停止条件时,获取预设计数应用的计数结果,若该计数结果与处理器校验声纹特征的校验次数相同,则得到处理器通过稳定性测试的第二测试结果。
在当前不满足第二预设停止条件时,继续提取语料数据库中的第二待校验音频信号进行校验,直至满足第二预设停止条件。
此外,在当次提取的第二待校验音频信号未通过二级文本校验模型或声纹校验模型的校验,且当前为满足第二预设停止条件时,继续提取语料数据库中的第二待校验音频信号进行校验,直至满足第二预设停止条件。
在一实施例中,“接收输入的测试指令”之前,还包括:
(1)获取预先训练的对应第二预设唤醒词的通用校验模型,将通用校验模型设为二级文本校验模型;
(2)提取第二待校验音频信号的声学特征,并基于通用校验模型对声学特征进行自适应处理,得到对应第二待校验音频信号的声纹校验模型。
比如,在开始进行稳定性测试前,可以预先采集多人(比如200人)说出第二预设关键词的样本音频信号,然后分别提取这些样本音频信号的声学特征(比如梅尔频率倒谱系数),再根据这些样本音频信号的声学特征训练得到一个与第二预设唤醒词对应的通用校验模型。由于通用校验模型采用大量与特定人(即用户)无关的音频信号训练得到,其仅拟合人的声学特征分布,并不代表某个具体的人。由此,只要音频信号中包括第二预设唤醒词即可通过该通用校验模型的校验。
本申请实施例中,处理器获取预先训练的对应第二预设唤醒词的通用校验模型,将该通用校验模型设为二级文本校验模型。
然后,处理器进一步提取本地存储的第二待校验音频信号的声学特征,并基于通用校验模型对提取的声学特征进行自适应处理,将自适应处理后的通用校验模型设为对应第二待校验音频信号的声纹校验模型。其中,自适应处理可以采用最大后验估计算法实现。
在一实施例中,“提取第二待校验音频信号的声学特征”,包括:
提取第二待校验音频信号的梅尔频率倒谱系数,设为第二待校验音频信号的声学特征。
比如,请参照图5,处理器首先对第二待校验音频信号进行预处理,比如高通滤波,数学表达式为:H(z)=1-az-1,其中H(z)表示滤波后的第二待校验音频信号,z表示滤波前的第二待校验音频信号,a是修正系数,一般取0.95-0.97;然后对滤波后的第二待校验音频信号进行加窗处理,以平滑第二待校验音频信号的边缘,比如采用汉明窗的形式加窗,数学表达式为:
Figure GDA0002743195740000111
其中n为整数,n=0,1,2,3....M,M为傅里叶变换的点数,比如M取值512;然后,专用语音识别芯片进行梅尔频率倒谱系数的提取,数学表达式为
Figure GDA0002743195740000112
其中Fmel(f)表示提取到的梅尔频率倒谱系数,f为傅里叶变换后的频点。
请参照图6,图6为本申请实施例提供的稳定性测试装置的结构示意图。该稳定性测试装置可以应用于电子设备,该电子设备包括麦克风、专用语音识别芯片和处理器。稳定性测试装置可以包括指令接收模块301、第一测试模块302以及第二测试模块303,其中,
指令接收模块301,用于接收输入的测试指令,并根据测试指令确定专用语音识别芯片或处理器为测试对象;
第一测试模块302,用于当确定专用语音识别芯片为测试对象时,通过麦克风进行音频采集得到第一待校验音频信号,并根据第一待校验音频信号对专用语音识别芯片进行稳定性测试,得到第一测试结果;
第二测试模块303,用于当确定处理器为测试对象时,根据本地预存的第二待校验音频信号对处理器进行稳定性测试,得到第二测试结果。
在一实施例中,将电子设备放置在预先搭建的测试环境中,测试环境中设置有用于播放测试语音的语音播放设备,测试语音为包括第一预设唤醒词的纯净语音信号,在通过麦克风进行音频采集得到第一待校验音频信号,并根据第一待校验音频信号对专用语音识别芯片进行稳定性测试,得到第一测试结果时,第一测试模块302用于:
通过专用语音识别芯片调用对应第一预设唤醒词的一级文本校验模型;
通过麦克风进行音频采集,得到对应测试语音的第一待校验音频信号;
通过一级文本校验模型校验第一待校验音频信号中是否包括第一预设唤醒词,得到校验结果;
判断当前是否满足第一预设停止条件,否则重新通过麦克风采集第一待校验音频信号进行校验,是则获取专用语音识别芯片最后一次进行校验的校验结果;
当专用语音识别芯片最后一次进行校验的校验结果为是时,得到专用语音识别芯片通过稳定性测试的第一测试结果。
在一实施例中,测试环境中还设置有噪声播放设备,噪声播放设备用于播放预设场景的样本噪声。
在一实施例中,在通过麦克风进行音频采集之前,第一测试模块302还用于:
获取语音播放设备播放测试语音的第一分贝值,以及获取噪声播放设备播放样本噪声的第二分贝值;
当第一分贝值和第二分贝值满足预设测试条件时,通过麦克风进行音频采集。
在一实施例中,第二待校验音频信号包括第二预设唤醒词,在根据本地预存的第二待校验音频信号对处理器进行稳定性测试,得到第二测试结果时,第二测试模块303用于:
通过处理器调用对应第二预设唤醒词的二级文本校验模型,以及调用对应第二待校验音频信号的声纹校验模型;
提取本地存储的第二待校验音频信号,并通过二级文本校验模型校验第二待校验音频信号中是否包括第二预设唤醒词;
若第二待校验音频信号中包括第二预设唤醒词,则通过声纹校验模型校验第二待校验音频信号的声纹特征;
若第二待校验音频信号的声纹特征通过校验,则发送指示信息至预设计数应用,指示预设计数应用进行计数,以得到对应处理器的计数结果;
判断当前是否满足第二预设停止条件,否则重新提取第二待校验音频信号进行校验,是则获取计数结果;
当计数结果与处理器校验声纹特征的校验次数相同时,得到处理器通过稳定性测试的第二测试结果。
在一实施例中,稳定性测试装置还包括模型训练模块,在接收输入的测试指令之前,用于:
获取预先训练的对应第二预设唤醒词的通用校验模型,将通用校验模型设为二级文本校验模型;
提取第二待校验音频信号的声学特征,并基于通用校验模型对声学特征进行自适应处理,得到对应第二待校验音频信号的声纹校验模型。
在一实施例中,在提取第二待校验音频信号的声学特征时,第二测试模块303用于:
提取第二待校验音频信号的梅尔频率倒谱系数,设为第二待校验音频信号的声学特征。
应当说明的是,本申请实施例提供的稳定性测试装置与上文实施例中的稳定性测试方法属于同一构思,在稳定性测试装置上可以运行稳定性测试方法实施例中提供的任一方法,其具体实现过程详见特征获取方法实施例,此处不再赘述。
本申请实施例还提供一种存储介质,其上存储有计算机程序,当其存储的计算机程序在本申请实施例提供的电子设备上执行时,使得电子设备执行如本申请实施例提供的稳定性测试方法中的步骤。其中,存储介质可以是磁碟、光盘、只读存储器(Read OnlyMemory,ROM)或者随机存取器(Random Access Memory,RAM)等。
本申请实施例还提供一种电子设备,请参照图7,电子设备包括处理器401、存储器402、麦克风403和专用语音识别芯片404。
本申请实施例中的处理器401是通用处理器,比如ARM架构的处理器。
专用语音识别芯片402是以语音识别为目的而设计的专用芯片,比如以语音识别为目的而设计的数字信号处理芯片,以语音识别为目的而设计的专用集成电路芯片等,其相较于通用的处理器401,具有更低的功耗,但处理能力相对较弱。
其中,存储器402中存储有计算机程序,其可以为高速随机存取存储器,还可以为非易失性存储器,比如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件等。相应地,存储器402还可以包括存储器控制器,以提供处理器401、专用语音识别芯片404对存储器402的访问。
处理器401和专用语音识别芯片404通过调用存储器402中的计算机程序,用于执行:
处理器401接收输入的测试指令,并根据测试指令确定专用语音识别芯片404或处理器401为测试对象;
当确定专用语音识别芯片404为测试对象时,专用语音识别芯片404通过麦克风403进行音频采集得到第一待校验音频信号,并根据第一待校验音频信号对专用语音识别芯片404进行稳定性测试,得到第一测试结果;
当确定处理器为测试对象时,处理器401根据本地预存的第二待校验音频信号对处理器401进行稳定性测试,得到第二测试结果。
请参照图8,图8为本申请实施例提供的电子设备的另一结构示意图,与图7所示电子设备的区别在于,电子设备还包括输入单元405和输出单元406等组件。
其中,输入单元405可用于接收输入的数字、字符信息或用户特征信息(比如指纹),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入等。
输出单元406可用于显示由用户输入的信息或提供给用户的信息,如屏幕。
在本申请实施例中,处理器401和专用语音识别芯片404通过调用存储器402中的计算机程序,用于执行:
处理器401接收输入的测试指令,并根据测试指令确定专用语音识别芯片404或处理器401为测试对象;
当确定专用语音识别芯片404为测试对象时,专用语音识别芯片404通过麦克风403进行音频采集得到第一待校验音频信号,并根据第一待校验音频信号对专用语音识别芯片404进行稳定性测试,得到第一测试结果;
当确定处理器为测试对象时,处理器401根据本地预存的第二待校验音频信号对处理器401进行稳定性测试,得到第二测试结果。
在一实施例中,将电子设备放置在预先搭建的测试环境中,测试环境中设置有用于播放测试语音的语音播放设备,测试语音为包括第一预设唤醒词的纯净语音信号,在通过麦克风403进行音频采集得到第一待校验音频信号,并根据第一待校验音频信号对专用语音识别芯片404进行稳定性测试,得到第一测试结果时,专用语音识别芯片404用于执行:
调用对应第一预设唤醒词的一级文本校验模型;
通过麦克风403进行音频采集,得到对应测试语音的第一待校验音频信号;
通过一级文本校验模型校验第一待校验音频信号中是否包括第一预设唤醒词,得到校验结果;
判断当前是否满足第一预设停止条件,否则重新通过麦克风403采集第一待校验音频信号进行校验,是则获取最后一次进行校验的校验结果;
当最后一次进行校验的校验结果为是时,得到专用语音识别芯片404通过稳定性测试的第一测试结果。
在一实施例中,测试环境中还设置有噪声播放设备,噪声播放设备用于播放预设场景的样本噪声。
在一实施例中,在通过麦克风403进行音频采集之前,专用语音识别芯片404还用于执行:
获取语音播放设备播放测试语音的第一分贝值,以及获取噪声播放设备播放样本噪声的第二分贝值;
当第一分贝值和第二分贝值满足预设测试条件时,通过麦克风进行音频采集。
在一实施例中,第二待校验音频信号包括第二预设唤醒词,在根据本地预存的第二待校验音频信号对处理器401进行稳定性测试,得到第二测试结果时,处理器401用于执行:
调用对应第二预设唤醒词的二级文本校验模型,以及调用对应第二待校验音频信号的声纹校验模型;
提取本地存储的第二待校验音频信号,并通过二级文本校验模型校验第二待校验音频信号中是否包括第二预设唤醒词;
若第二待校验音频信号中包括第二预设唤醒词,则通过声纹校验模型校验第二待校验音频信号的声纹特征;
若第二待校验音频信号的声纹特征通过校验,则发送指示信息至预设计数应用,指示预设计数应用进行计数,以得到对应处理器401的计数结果;
判断当前是否满足第二预设停止条件,否则重新提取第二待校验音频信号进行校验,是则获取计数结果;
当计数结果与校验声纹特征的校验次数相同时,得到处理器401通过稳定性测试的第二测试结果。
在一实施例中,在接收输入的测试指令之前,处理器401还用于执行:
获取预先训练的对应第二预设唤醒词的通用校验模型,将通用校验模型设为二级文本校验模型;
提取第二待校验音频信号的声学特征,并基于通用校验模型对声学特征进行自适应处理,得到对应第二待校验音频信号的声纹校验模型。
在一实施例中,在提取第二待校验音频信号的声学特征时,处理器401用于执行:
提取第二待校验音频信号的梅尔频率倒谱系数,设为第二待校验音频信号的声学特征。
应当说明的是,本申请实施例提供的电子设备与上文实施例中的稳定性测试方法属于同一构思,在电子设备上可以运行稳定性测试方法实施例中提供的任一方法,其具体实现过程详见特征获取方法实施例,此处不再赘述。
需要说明的是,对本申请实施例的稳定性测试方法而言,本领域普通测试人员可以理解实现本申请实施例的稳定性测试方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,所述计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的处理器和专用语音识别芯片执行,在执行过程中可包括如稳定性测试方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。
以上对本申请实施例所提供的一种稳定性测试方法、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种稳定性测试方法,应用于电子设备,其特征在于,所述电子设备包括麦克风、专用语音识别芯片和处理器,所述稳定性测试方法包括:
接收输入的测试指令,并根据所述测试指令确定所述专用语音识别芯片或所述处理器为测试对象;
当确定所述专用语音识别芯片为测试对象时,通过所述麦克风进行音频采集得到第一待校验音频信号,并根据所述第一待校验音频信号对所述专用语音识别芯片进行稳定性测试,得到第一测试结果;
当确定所述处理器为测试对象时,根据本地预存的第二待校验音频信号对所述处理器进行稳定性测试,得到第二测试结果。
2.根据权利要求1所述的稳定性测试方法,其特征在于,将所述电子设备放置在预先搭建的测试环境中,所述测试环境中设置有用于播放测试语音的语音播放设备,所述测试语音为包括第一预设唤醒词的纯净语音信号,所述通过所述麦克风进行音频采集得到第一待校验音频信号,并根据所述第一待校验音频信号对所述专用语音识别芯片进行稳定性测试,得到第一测试结果,包括:
通过所述专用语音识别芯片调用对应所述第一预设唤醒词的一级文本校验模型;
通过所述麦克风进行音频采集,得到对应所述测试语音的第一待校验音频信号;
通过所述一级文本校验模型校验所述第一待校验音频信号中是否包括所述第一预设唤醒词,得到校验结果;
判断当前是否满足第一预设停止条件,否则重新通过所述麦克风采集第一待校验音频信号进行校验,是则获取所述专用语音识别芯片最后一次进行校验的校验结果;
当所述专用语音识别芯片最后一次进行校验的校验结果为是时,得到所述专用语音识别芯片通过稳定性测试的第一测试结果。
3.根据权利要求2所述的稳定性测试方法,其特征在于,所述测试环境中还设置有噪声播放设备,所述噪声播放设备用于播放预设场景的样本噪声。
4.根据权利要求3所述的稳定性测试方法,其特征在于,所述通过所述麦克风进行音频采集之前,还包括:
获取所述语音播放设备播放所述测试语音的第一分贝值,以及获取所述噪声播放设备播放所述样本噪声的第二分贝值;
当所述第一分贝值和所述第二分贝值满足预设测试条件时,通过所述麦克风进行音频采集。
5.根据权利要求1所述的稳定性测试方法,其特征在于,所述第二待校验音频信号包括第二预设唤醒词,所述根据本地预存的第二待校验音频信号对所述处理器进行稳定性测试,得到第二测试结果,包括:
通过所述处理器调用对应所述第二预设唤醒词的二级文本校验模型,以及调用对应所述第二待校验音频信号的声纹校验模型;
提取本地存储的所述第二待校验音频信号,并通过所述二级文本校验模型校验所述第二待校验音频信号中是否包括所述第二预设唤醒词;
若所述第二待校验音频信号中包括所述第二预设唤醒词,则通过所述声纹校验模型校验所述第二待校验音频信号的声纹特征;
若所述第二待校验音频信号的声纹特征通过校验,则发送指示信息至预设计数应用,指示所述预设计数应用进行计数,以得到对应所述处理器的计数结果;
判断当前是否满足第二预设停止条件,否则重新提取所述第二待校验音频信号进行校验,是则获取所述计数结果;
当所述计数结果与所述处理器校验声纹特征的校验次数相同时,得到所述处理器通过稳定性测试的第二测试结果。
6.根据权利要求5所述的稳定性测试方法,其特征在于,所述接收输入的测试指令之前,还包括:
获取预先训练的对应所述第二预设唤醒词的通用校验模型,将所述通用校验模型设为所述二级文本校验模型;
提取所述第二待校验音频信号的声学特征,并基于所述通用校验模型对所述声学特征进行自适应处理,得到对应所述第二待校验音频信号的声纹校验模型。
7.根据权利要求6所述的稳定性测试方法,其特征在于,所述提取所述第二待校验音频信号的声学特征,包括:
提取所述第二待校验音频信号的梅尔频率倒谱系数,设为所述声学特征。
8.一种稳定性测试装置,应用于电子设备,其特征在于,所述电子设备包括麦克风、专用语音识别芯片和处理器,所述稳定性测试方法包括:
指令接收模块,用于接收输入的测试指令,并根据所述测试指令确定所述专用语音识别芯片或所述处理器为测试对象;
第一测试模块,用于当确定所述专用语音识别芯片为测试对象时,通过所述麦克风进行音频采集得到第一待校验音频信号,并根据所述第一待校验音频信号对所述专用语音识别芯片进行稳定性测试,得到第一测试结果;
第二测试模块,用于当确定所述处理器为测试对象时,根据本地预存的第二待校验音频信号对所述处理器进行稳定性测试,得到第二测试结果。
9.一种电子设备,其特征在于,包括麦克风、专用语音识别芯片、处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序被所述专用语音识别芯片和处理器调用时用于执行如权利要求1-7任一项所述的稳定性测试方法。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器和专用语音识别芯片加载以执行如权利要求1-7任一项所述的稳定性测试方法。
CN201910818785.6A 2019-08-30 2019-08-30 稳定性测试方法、装置、存储介质及电子设备 Active CN110581915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910818785.6A CN110581915B (zh) 2019-08-30 2019-08-30 稳定性测试方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910818785.6A CN110581915B (zh) 2019-08-30 2019-08-30 稳定性测试方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN110581915A CN110581915A (zh) 2019-12-17
CN110581915B true CN110581915B (zh) 2021-02-19

Family

ID=68811569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910818785.6A Active CN110581915B (zh) 2019-08-30 2019-08-30 稳定性测试方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN110581915B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111369992A (zh) * 2020-02-27 2020-07-03 Oppo(重庆)智能科技有限公司 指令执行方法、装置、存储介质及电子设备
CN113556661B (zh) * 2020-04-26 2023-04-07 阿里巴巴集团控股有限公司 电声检测与信息输出方法、系统、设备及存储介质
CN111899731A (zh) * 2020-06-16 2020-11-06 北京百度网讯科技有限公司 语音功能的稳定性测试方法、装置、设备和计算机存储介质
CN111986652B (zh) * 2020-07-31 2022-12-13 广州市凯泽利科技有限公司 一种车载智能语音系统测试与评价方法
CN115440192B (zh) * 2021-06-04 2025-04-18 科大讯飞股份有限公司 一种语音识别系统的测试方法、装置、设备及存储介质
CN113671348A (zh) * 2021-08-18 2021-11-19 北京博清科技有限公司 一种电路板的测试方法、装置、设备、系统及存储介质
CN117221435B (zh) * 2023-11-09 2024-01-12 万道智控信息技术有限公司 基于手机柜的手机安全性能检测方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106228986A (zh) * 2016-07-26 2016-12-14 北京奇虎科技有限公司 一种语音识别引擎的自动化测试方法、装置和系统
CN107643967A (zh) * 2017-10-27 2018-01-30 深圳市传测科技有限公司 一种自动语音唤醒测试装置、系统及方法
JP2018045062A (ja) * 2016-09-14 2018-03-22 Kddi株式会社 学習者の口述音声から自動的に採点するプログラム、装置及び方法
CN107995060A (zh) * 2017-11-29 2018-05-04 努比亚技术有限公司 移动终端音频测试方法、装置以及计算机可读存储介质
CN108184201A (zh) * 2017-12-28 2018-06-19 上海传英信息技术有限公司 音频测试方法、音频测试系统
CN108510992A (zh) * 2018-03-22 2018-09-07 北京云知声信息技术有限公司 语音唤醒设备的方法
CN108872834A (zh) * 2018-06-29 2018-11-23 上海与德通讯技术有限公司 语音识别芯片的测试系统及方法、语音识别芯片
CN110021307A (zh) * 2019-04-04 2019-07-16 Oppo广东移动通信有限公司 音频校验方法、装置、存储介质及电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745731B (zh) * 2013-12-31 2016-10-19 科大讯飞股份有限公司 一种语音识别效果自动化测试系统及测试方法
CN109360550B (zh) * 2018-12-07 2022-01-04 上海智臻智能网络科技股份有限公司 语音交互系统的测试方法、装置、设备和存储介质
CN109669865A (zh) * 2018-12-10 2019-04-23 万兴科技股份有限公司 性能测试方法、装置、电子设备及可读存储介质
CN109979438A (zh) * 2019-04-04 2019-07-05 Oppo广东移动通信有限公司 语音唤醒方法及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106228986A (zh) * 2016-07-26 2016-12-14 北京奇虎科技有限公司 一种语音识别引擎的自动化测试方法、装置和系统
JP2018045062A (ja) * 2016-09-14 2018-03-22 Kddi株式会社 学習者の口述音声から自動的に採点するプログラム、装置及び方法
CN107643967A (zh) * 2017-10-27 2018-01-30 深圳市传测科技有限公司 一种自动语音唤醒测试装置、系统及方法
CN107995060A (zh) * 2017-11-29 2018-05-04 努比亚技术有限公司 移动终端音频测试方法、装置以及计算机可读存储介质
CN108184201A (zh) * 2017-12-28 2018-06-19 上海传英信息技术有限公司 音频测试方法、音频测试系统
CN108510992A (zh) * 2018-03-22 2018-09-07 北京云知声信息技术有限公司 语音唤醒设备的方法
CN108872834A (zh) * 2018-06-29 2018-11-23 上海与德通讯技术有限公司 语音识别芯片的测试系统及方法、语音识别芯片
CN110021307A (zh) * 2019-04-04 2019-07-16 Oppo广东移动通信有限公司 音频校验方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN110581915A (zh) 2019-12-17

Similar Documents

Publication Publication Date Title
CN110581915B (zh) 稳定性测试方法、装置、存储介质及电子设备
CN110602624B (zh) 音频测试方法、装置、存储介质及电子设备
CN111261195A (zh) 音频测试方法、装置、存储介质及电子设备
WO2020181824A1 (zh) 声纹识别方法、装置、设备以及计算机可读存储介质
EP3210205B1 (en) Sound sample verification for generating sound detection model
US8719019B2 (en) Speaker identification
EP2700071B1 (en) Speech recognition using multiple language models
WO2020037555A1 (zh) 评估麦克风阵列一致性的方法、设备、装置和系统
CN110400571B (zh) 音频处理方法、装置、存储介质及电子设备
US20140200890A1 (en) Methods, systems, and circuits for speaker dependent voice recognition with a single lexicon
CN110211599B (zh) 应用唤醒方法、装置、存储介质及电子设备
CN111369976A (zh) 测试语音识别设备的方法及测试装置
US20190392839A1 (en) System for creating speaker model, recognition system, computer program product, and controller
US6990446B1 (en) Method and apparatus using spectral addition for speaker recognition
CN111888765B (zh) 多媒体文件的处理方法、装置、设备及介质
US11848029B2 (en) Method and device for detecting audio signal, and storage medium
CN110600048B (zh) 音频校验方法、装置、存储介质及电子设备
CN110580897B (zh) 音频校验方法、装置、存储介质及电子设备
CN110473554A (zh) 音频校验方法、装置、存储介质及电子设备
CN110544468B (zh) 应用唤醒方法、装置、存储介质及电子设备
WO2021169711A1 (zh) 指令执行方法、装置、存储介质及电子设备
CN112992184A (zh) 一种发音评测方法、装置、电子设备和存储介质
CN115700877A (zh) 音频特征检测技术
WO2019073233A1 (en) ANALYSIS OF VOICE SIGNALS
CN110875043B (zh) 声纹识别方法、装置、移动终端及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant