CN111899722B

CN111899722B - 一种语音处理方法及装置、存储介质

Info

Publication number: CN111899722B
Application number: CN202010801109.0A
Authority: CN
Inventors: 陈喆; 曹冰; 胡宁宁
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2020-08-11
Filing date: 2020-08-11
Publication date: 2024-02-06
Anticipated expiration: 2040-08-11
Also published as: CN111899722A

Abstract

本申请实施例公开了一种语音处理方法及装置、存储介质，语音处理方法应用于语音处理装置，语音处理装置包括第一处理器，第一处理器为中央处理器，语音处理方法包括：在接收到语音唤醒数据的情况下，利用第一处理器对语音唤醒数据进行录音，得到录音数据；并将语音唤醒数据输入第一处理器的一级唤醒模块；利用一级唤醒模块对语音唤醒数据进行处理；在一级唤醒模块对语音唤醒数据处理失败的情况下，将录音数据输入第一处理器的后续唤醒模块，以利用后续唤醒模块启动与语音唤醒数据对应的语音设备。

Description

一种语音处理方法及装置、存储介质

技术领域

本申请涉及语音识别技术领域，尤其涉及一种语音处理方法及装置、存储介质。

背景技术

随着智能识别技术的发展，利用语音唤醒数据唤醒电子设备的应用越来越广泛，如利用语音唤醒数据唤醒智能电视、唤醒智能电视等等。

在现有技术中，在将语音唤醒数据输入语音处理装置中的一级唤醒模块，且一级唤醒模块对语音处理数据处理成功的情况下，语音处理装置就存储语音唤醒数据成功唤醒时截止之前2.5s内的部分语音唤醒数据，如此，在一级唤醒模块唤醒失败的情况下，语音处理装置需要重新接收语音唤醒数据，降低了语音处理装置处理语音唤醒数据时的速度。

发明内容

为解决上述技术问题，本申请实施例期望提供一种语音处理方法及装置、存储介质，能够提高语音处理装置处理语音数据时的速度。

本申请的技术方案是这样实现的：

本申请实施例提供一种语音处理方法，应用于语音处理装置，所述语音处理装置包括第一处理器，所述第一处理器为中央处理器，所述方法包括：

在接收到语音唤醒数据的情况下，利用所述第一处理器对所述语音唤醒数据进行录音，得到录音数据；并将所述语音唤醒数据输入所述第一处理器的一级唤醒模块；

利用所述一级唤醒模块对所述语音唤醒数据进行处理；

在所述一级唤醒模块对所述语音唤醒数据处理失败的情况下，将所述录音数据输入所述第一处理器的后续唤醒模块，以利用所述后续唤醒模块启动与所述语音唤醒数据对应的语音设备。

本申请实施例提供了一种语音处理装置，所述语音处理装置包括第一处理器，所述第一处理为中央处理器，所述语音处理装置包括：

录音单元，用于在接收到语音唤醒数据的情况下，利用所述第一处理器对所述语音唤醒数据进行录音，得到录音数据；

输入单元，用于将所述语音唤醒数据输入所述第一处理器的一级唤醒模块；在所述一级唤醒模块对所述语音唤醒数据处理失败的情况下，将所述录音数据输入所述第一处理器的后续唤醒模块，以利用所述后续唤醒模块启动与所述语音唤醒数据对应的语音设备；

处理单元，用于利用所述一级唤醒模块对所述语音唤醒数据进行处理。

本申请实施例提供一种语音处理装置，所述装置包括：

存储器、处理器和通信总线，所述存储器通过所述通信总线与所述处理器进行通信，所述存储器存储所述处理器可执行的语音处理的程序，当所述语音处理程序被执行时，通过所述处理器执行上述所述的方法。

本申请实施例提供了一种存储介质，其上存储有计算机程序，应用于语音处理装置，其特征在于，该计算机程序被处理器执行时实现上述所述的方法。

本申请实施例提供了一种语音处理方法及装置、存储介质，语音处理方法应用于语音处理装置，语音处理装置包括第一处理器，第一处理器为中央处理器，语音处理方法包括：利用第一处理器对语音唤醒数据进行录音，得到录音数据；并将语音唤醒数据输入第一处理器的一级唤醒模块；利用一级唤醒模块对语音唤醒数据进行处理；在一级唤醒模块对语音唤醒数据处理失败的情况下，将录音数据输入第一处理器的后续唤醒模块，以利用后续唤醒模块启动与语音唤醒数据对应的语音设备。采用上述方法实现方案，语音处理装置在接收到语音唤醒数据的情况下，就利用第一处理器对该语音唤醒数据进行录音，得到录音数据，在一级唤醒模块唤醒失败的情况下，数语音唤醒装置还可以将录音数据输入第一处理器的后续唤醒模块中，使得语音处理装置可以直接利用后续唤醒模块对录音数据进行处理，提高了语音处理装置处理语音唤醒数据时的速度。

附图说明

图1为本申请实施例提供的一种现有技术中的语音处理结构示意图；

图2为本申请实施例提供的一种现有技术中的对语音唤醒数据进行处理的示意图；

图3为本申请实施例提供的一种语音处理方法流程图；

图4为本申请实施例提供的一种示例性DSP的状态示意图；

图5为本申请实施例提供的一种示例性的对语音唤醒数据进行处理的示意图一；

图6为本申请实施例提供的一种示例性的对语音唤醒数据进行处理的示意图二；

图7为本申请实施例提供的一种语音处理装置的组成结构示意图一；

图8为本申请实施例提供的一种语音处理装置的组成结构示意图二。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

现有的语音唤醒测试方案是：将光亮检测设备与测试平台进行通信连接，根据智能终端屏幕亮或者灯亮，自动的进行语音唤醒性能测试；或者是将唤醒词对应的至少一个语音数据和至少一个环境噪声数据进行文件配置，生成测试语料数据，或者是由于数字信号处理器(Digital Signal Processing，DSP)内存，传输速率和功耗的限制，当用户进行语音唤醒时，若通过一级唤醒模块，则将一级唤醒语音模块成功唤醒时的时间点，截取该时间点前2.5s语音数据保存和上传，而不会将麦克风实时监听的数据保存下来，如此，当用户尝试唤醒时，若一级唤醒模块唤醒失败，则语音数据无法保存下来，这样不利于分析和优化语音唤醒数据对应的语音唤醒模型。

现有技术在进行主观测试(采集的测试人员的发出的语音唤醒数据)或者客观测试(采集的语音设备发出的语音唤醒数据)时，在唤醒测试手机的相近位置，选择一台与唤醒测试手机同样机型的手机，作为录音手机，并打开录音手机的录音工具开始录音；当测试用户开始唤醒测试时，录音手机就对该语音唤醒数据进行录音，保存下用户的音频数据；通过将录音手机保存的音频数据，送入一级唤醒离线算法，进行仿真，即可以分析没有通过一级唤醒模块的语音数据。

此方案在实施时，由于唤醒测试手机和录音手机是两台手机，唤醒测试手机和录音手机的位置上存在一定差别，录音手机的得到的语音唤醒数据不能完全替代唤醒测试的手机得到的语音唤醒数据，尤其是在当语音唤醒数据的打分在阈值附近时的语音唤醒数据。

现有技术在进行主观或者客观测试时，也可以将测试手机连接到电脑上，通过相关工具抓取实时音频数据，如图1所示，计算机控制人工头播放纯净的语音唤醒数据对应的语音，利用扬声器播放噪声数据对应的语音，调节音量大小，并用噪声仪在测试手机处，测量语音的分贝数和扬声器播放噪声的分贝数，使得测试时语音唤醒数据和噪声数据的信噪比为一个定值。人工头播放纯净的测试语音信号，间隔时间5s，扬声器按照预先设定音量，播放不同的噪声信号。测试手机连接到计算机，计算机通过音频数据抓取工具，实时获取并保存测试手机送入一级唤醒模块的语音唤醒数据。计算机将保存送入一级唤醒模块的语音唤醒数据送入一级唤醒离线算法，进行仿真，即可以分析没有通过一级唤醒模块的语音唤醒数据。

当采用高通平台自带的宽带数字信号处理(Wideband Digital SignalProcessing，WDSP)或者高级数字信号处理(Advanced Digital Signal Processor，ADSP)时，可以通过高通手机调试工具(QXDM)直接实时获取麦克风的语音唤醒数据，如图2所示，图2中的计算机为QXDM计算机，一级唤醒模块在DSP(具体为WDSP或者为ADSP)上运行，二级唤醒模块声纹唤醒模块和语音助手在CPU上运行，而当不采用高通的WDSP或者为ADSP时，麦克风直接连接在外挂的低功耗DSP芯片上，无法直接通过高通的QXDM工具直接实时获取麦克风的语音唤醒数据，若一级唤醒模块唤醒失败，则语音数据无法保存下来。

对于现有技术中存在的问题，具体可通过以下实施例中的方法进行解决。

实施例一

本申请实施例提供了一种语音处理方法，图3为本申请实施例提供的一种语音处理方法流程图一，如图3所示，语音处理方法可以包括：

S101、在接收到语音唤醒数据的情况下，利用第一处理器对语音唤醒数据进行录音，得到录音数据；并将语音唤醒数据输入第一处理器的一级唤醒模块。

本申请实施例提供的语音处理方法适用于语音处理装置在接收到语音唤醒数据时，对语音唤醒数据进行处理的场景下。

在本申请实施例中，语音处理装置可以以各种形式来实施。例如，本申请中描述的语音处理装置可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant，PDA)、便捷式媒体播放器(Portable Media Player，PMP)、导航装置、可穿戴设备、智能手环、计步器等装置，以及诸如数字TV、台式计算机等装置。

在本申请实施例中，语音处理装置包括第一处理器，具体的，第一处理器为中央处理器(Central Processing Unit，CPU)。

需要说明的是，第一处理器为高功耗的CPU。

在本申请实施例中，语音唤醒数据可以为语音处理装置接收到的录音装置播放的语音数据，语音唤醒数据也可以为语音处理装置接收到的用户呼叫得到的语音数据，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，语音唤醒数据可以为唤醒语音处理装置中的语音设备的语音，如：小欧小欧、满天星、智能管家等等，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，语音处理装置在接收到语音唤醒数据之前，语音处理装置可以处于第一处理器运行的状态下，语音处理装置也可以处于第二处理器运行的状态下，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

S102、利用一级唤醒模块对语音唤醒数据进行处理。

在本申请实施例中，在语音处理装置利用第一处理器对语音唤醒数据进行录音，得到录音数据；并将语音唤醒数据输入第一处理器的一级唤醒模块之后，语音处理装置就可以利用一级唤醒模块对语音唤醒数据进行处理了。

在本申请实施例中，语音处理装置利用一级唤醒模块对语音唤醒数据进行处理的过程，可以为语音处理装置确定语音唤醒数据中的关键词，并将该关键词与第一处理器的一级唤醒模块中的预设关键词进行匹配；语音处理装置确定出语音唤醒数据中的关键词，并将该关键词与预设关键词进行匹配之后，语音处理装置在确定出关键词与预设关键词不匹配的情况下，语音处理装置就确定一级唤醒模块唤醒失败。

在本申请实施例中，语音处理装置将语音唤醒数据输入第一处理器的一级唤醒模块之后，语音处理装置就利用一级唤醒模块对该语音唤醒数据进行语音识别，得到与该语音唤醒数据对应的语音唤醒文字，然后语音处理装置就可以从该语音唤醒文字中确定出语音唤醒数据中的关键词了。

在本申请实施例中，语音处理装置可以对该语音唤醒文字中的每一个文字进行识别，从语音唤醒文字中确定出关键词；语音处理装置也可以按照预设数量的文字对该语音唤醒文字进行划分，从而得到多个语音唤醒文字片，并对多个语音唤醒文字片进行识别，从而确定出关键词，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，语音处理装置还包括第二处理器，语音处理装置在利用一级唤醒模块对语音唤醒数据进行处理之后，语音处理装置还可以将第一处理器切换为第二处理器；在语音处理装置将第一处理器切换为第二处理器之后，语音处理装置就将录音数据输入第二处理器中的二级唤醒模块和第二处理器中的声纹唤醒模块，以利用第二处理器中的二级唤醒模块和第二处理器中的声纹唤醒模块启动语音唤醒数据对应的语音设备。

在本申请实施例中，第二处理器可以为DSP，具体的，第二处理器为低功耗的DSP。

在本申请实施例中，语音处理装置将录音数据输入第二处理器中的二级唤醒模块和第二处理器中的声纹唤醒模块的过程，可以为语音处理装置先将录音数据输入第二处理器中的二级唤醒模块中，然后语音处理装置再将录音数据输入第二处理器中的声纹唤醒模块中；语音处理装置也可以先将录音数据输入第二处理器中的声纹唤醒模块中，然后语音处理装置再将录音数据输入第二处理器中的二级唤醒模块中；语音处理装置也可以将录音数据同时输入第二处理器中的二级唤醒模块和第二处理器中的声纹唤醒模块中，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，语音处理装置将录音数据输入第二处理器中的二级唤醒模块之后，语音处理装置就将录音数据与第二处理器中的二级唤醒模块中的预设录音数据进行匹配，在录音数据与第二处理器中的二级唤醒模块中的预设录音数据匹配的情况下，语音处理装置就确定第二处理器中的二级唤醒模块对录音数据处理成功。

在本申请实施例中，预设录音数据可以为语音处理装置中存储的标准的录音数据。

在本申请实施例中，语音处理装置将录音数据输入第二处理器中的声纹唤醒模块之后，语音处理装置就将录音数据声纹特征与第二处理器中的声纹唤醒模块中的预设声纹特征进行匹配，在录音数据声纹特征与第二处理器中的声纹唤醒模块中的预设声纹特征匹配的情况下，语音处理装置就确定第二处理器中的声纹唤醒模块对录音数据处理成功。

在本申请实施例中，预设声纹特征可以为代表用户发声方式的参数，如声音频率，声音响度等等，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，在第二处理器中的二级唤醒模块对录音数据处理成功，且第二处理器中的声纹唤醒模块对录音数据处理成功的情况下，语音处理装置就启动语音唤醒数据对应的语音设备。

在本申请实施例中，语音处理装置可以检测第一处理器中的一级唤醒模块是否对录音数据处理成功，若第一处理器中的一级唤醒模块对录音数据处理成功，则语音处理装置就将第一处理器切换为第二处理器，利用第二处理器的一级唤醒模块和第二处理器的声纹唤醒模块对语音唤醒数据进行处理；语音处理装置也可以在其他情况下，将第一处理器切换为第二处理器，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

可以理解的是，语音处理装置在利用高功耗的第一处理器中的一级唤醒模块对录音数据处理成功之后，就切换到低功耗的第二处理器，将录音数据输入低功耗的第二处理器中的二级唤醒模块和低功耗的第二处理器中的声纹唤醒模块，利用低功耗的第二处理器中的二级唤醒模块和低功耗的第二处理器中的声纹唤醒模块启动语音唤醒数据对应的语音设备，降低了语音处理装置启动语音唤醒数据对应的语音设备时的功耗。

在本申请实施例中，语音处理装置利用一级唤醒模块对语音唤醒数据进行处理之后，语音处理装置在确定出一级唤醒模块对语音唤醒数据处理成功的情况下，语音处理装置就将语音唤醒数据输入第一处理器的后续唤醒模块，以利用后续唤醒模块启动语音唤醒数据对应的语音设备。

在本申请实施例中，后续唤醒模块包括二级唤醒模块和声纹唤醒模块。

在本申请实施例中，语音设备可以为语音处理装置中的设备，也可以为与语音处理装置连接的设备，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

需要说明的是，若语音设备为语音处理装置中的设备，则语音设备具体可以为语音助手，语音设备也可以为其他能接收语音指令，并执行语音指令对应的操作的设备，具体的可根据实际情况进行确定，本身申请实施例对此不作限定。

在本申请实施例中，语音处理装置可以将语音唤醒数据中的关键词与一级唤醒模块中的预设关键词进行匹配，在语音唤醒数据中的关键词预设关键词匹配的情况下，语音处理装置就可以确定出一级唤醒模块对语音唤醒数据处理成功。

在本申请实施例中，在一级唤醒模块对语音唤醒数据处理成功的情况下，语音处理装置就存储该语音唤醒数据，之后，语音处理装置就可以对该语音唤醒数据进行仿真，以获取语音唤醒数据对应的语音参数信息，从而确定出一级唤醒模块唤醒失败的原因。

在本申请实施例中，语音处理装置存储该语音唤醒数据的过程，可以为语音处理装置在确定出一级唤醒模块对语音唤醒数据处理成功的情况下，语音处理装置就从一级唤醒模块对语音唤醒数据处理成功的时刻开始，截取前2.5s的部分语音唤醒数据，并将该部分语音唤醒数据进行存储；语音处理装置也可以从一级唤醒模块对语音唤醒数据处理成功的时刻开始，存储这一时刻前接收到的所有语音唤醒数据，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，语音处理装置可以将该语音唤醒数据输入一级唤醒模块中，利用一级唤醒模块对该语音唤醒数据进行仿真；语音处理装置还可以利用其它器件对该语音唤醒数据进行仿真，以获取语音唤醒数据对应的语音参数信息，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，语音处理装置可以将该语音唤醒数据输入第一处理器的一级唤醒模块中，利用第一处理器的一级唤醒模块对该语音唤醒数据进行仿真；语音处理装置也可以将该语音唤醒数据输入第二处理器的一级唤醒模块中，利用第二处理器的一级唤醒模块对该语音唤醒数据进行仿真；具体的可根据实际情况进行确定，本申请实施例对此不作限定。

S103、在一级唤醒模块对语音唤醒数据处理失败的情况下，将录音数据输入第一处理器的后续唤醒模块，以利用后续唤醒模块启动与语音唤醒数据对应的语音设备。

在本申请实施例中，在语音处理装置利用一级唤醒模块对语音唤醒数据进行处理之后，在一级唤醒模块对语音唤醒数据处理失败的情况下，语音处理装置就将录音数据输入第一处理器的后续唤醒模块中，以利用后续唤醒模块启动与该语音唤醒数据对应的语音设备。

在本申请实施例中，在一级唤醒模块唤醒失败的情况下，语音处理装置就将录音数据输入二级唤醒模块和声纹唤醒模块中，以利用二级唤醒模块和声纹唤醒模块启动与语音唤醒数据对应的语音设备。

需要说明的是，在一级唤醒模块唤醒失败的情况下，语音处理装置可以先将录音数据输入二级唤醒模块，然后再将录音数据输入声纹唤醒模块；语音处理装置还可以先将录音数据输入声纹唤醒模块，然后将录音数据输入二级唤醒模块；语音处理装置也可以将录音数据同时输入二级唤醒模块和声纹唤醒模块，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，语音处理装置在得到录音数据之后，语音处理装置就可以将该录音数据进行仿真，以获取录音数据对应的语音参数信息，从而确定出一级唤醒模块唤醒失败的原因。

在本申请实施例中，语音处理装置可以将该录音数据输入一级唤醒模块中，利用一级唤醒模块对该录音数据进行仿真；语音处理装置还可以利用其它器件对该录音数据进行仿真，以获取录音数据对应的语音参数信息，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，语音处理装置可以将该录音数据输入第一处理器的一级唤醒模块中，利用第一处理器的一级唤醒模块对该录音数据进行仿真；语音处理装置也可以将该录音数据输入第二处理器的一级唤醒模块中，利用第二处理器的一级唤醒模块对该录音数据进行仿真；具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，语音处理装置将录音数据输入第一处理器的后续唤醒模块，以利用后续唤醒模块启动与语音唤醒数据对应的语音设备的过程，具体为语音处理装置将录音数据输入二级唤醒模块和声纹唤醒模块；语音处理装置将录音数据输入二级唤醒模块，并利用二级唤醒模块对录音数据进行处理；语音处理装置在将录音数据输入二级唤醒模块，并利用二级唤醒模块对录音数据进行处理之后，语音处理装置在确定出二级唤醒模块对语音唤醒数据处理成功的情况下，语音处理装置就将语音唤醒数据输入声纹唤醒模块，利用声纹唤醒模块对语音唤醒数据进行处理；语音处理装置将语音唤醒数据输入声纹唤醒模块，利用声纹唤醒模块对语音唤醒数据进行处理之后，语音处理装置在确定出声纹唤醒模块对录音数据处理成功的情况下，语音唤醒装置就启动与语音唤醒数据对应的语音设备。

在本申请实施例中，语音处理装置可以先将录音数据输入二级唤醒模块中，然后语音处理装置再将录音数据输入声纹唤醒模块；语音处理装置也可以先将录音数据输入声纹唤醒模块中，然后语音处理装置再将录音数据输入二级唤醒模块；语音处理装置也可以将录音数据同时输入二级唤醒模块和声纹唤醒模块，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，语音处理装置利用第一处理器对语音唤醒数据进行录音，得到录音数据；并将语音唤醒数据输入第一处理器的一级唤醒模块之后，语音处理装置会将录音数据输入一级唤醒算法中进行仿真，得到仿真结果，语音唤醒数据将录音数据输入一级唤醒算法中进行仿真，得到仿真结果之后，语音唤醒数据就基于仿真结果，优化第二处理器的一级唤醒模块，以供下一轮利用第二处理器的一级唤醒模块成功唤醒语音设备。

需要说明的是，一级唤醒算法用于仿真第二处理器的一级唤醒模块的唤醒功能。

在本申请实施例中，语音处理方法还可以应用于仿真设备，语音处理方法包括：将语音唤醒数据输入仿真设备中的一级仿真唤醒模块，并利用第一仿真唤醒模块对语音唤醒数据进行处理；在仿真设备将语音唤醒数据输入仿真设备中的一级仿真唤醒模块，并利用第一仿真唤醒模块对语音唤醒数据进行处理之后，仿真设备确定出第一仿真唤醒模块对语音唤醒数据处理失败，且仿真设备接收到唤醒模块切换命令的情况下，仿真设备就根据唤醒模块切换命令，从一级仿真唤醒模块切换至第一处理器的一级唤醒模块；仿真设备根据唤醒模块切换命令，从一级仿真唤醒模块切换至第一处理器的一级唤醒模块之后，仿真设备就利用第一处理器的一级唤醒模块对语音唤醒数据进行处理，并对语音唤醒数据进行录音，得到录音数据；仿真设备利用第一处理器的一级唤醒模块对语音唤醒数据进行处理，并对语音唤醒数据进行录音，得到录音数据之后，在仿真设备确定出第一处理器的一级唤醒模块对语音唤醒数据处理完成的情况下，仿真设备就将录音数据输入后续仿真唤醒模块，以利用后续仿真唤醒模块对录音数据进行处理。

在本申请实施例中，一级仿真唤醒模块用于仿真第二处理器的一级唤醒模块的唤醒功能。

在本申请实施例中，仿真设备可以为语音处理装置中的一部分，仿真设备也可以为与语音处理装置独立的设备，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，若仿真设备也可以为与语音处理装置独立的设备，则仿真设备可以与语音处理装置建立通信连接，以与语音处理装置之间进行数据通信。

在本申请实施例中，若仿真设备将语音唤醒数据输入仿真设备中的一级仿真唤醒模块，并利用第一仿真唤醒模块对语音唤醒数据进行处理之后，仿真设备确定出第一仿真唤醒模块对语音唤醒数据处理失败，则用户或者测试员可以通过暗码命令打开抓取系统运行日志功能，并设置属性为wakeup_model_high之后，仿真设备就从一级仿真唤醒模块切换为第一处理器的一级唤醒模块；仿真设备也可以在其他情况下，将一级仿真唤醒模块切换为第一处理器的一级唤醒模块，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

在本申请实施例中，则用户或者测试员可以通过暗码命令打开抓取系统运行日志功能，并设置属性为wakeup_model_low之后，仿真设备就将录音数据输入后续仿真唤醒模块，以利用后续仿真唤醒模块对录音数据进行处理。

在本申请实施例中，DSP处理器还包括状态机，如图4所示，在DSP处理器的一级唤醒模块没有启动的情况下，DSP处理器处于停止状态，在上层发送开始识别(StartRecognition)指令并启动一级唤醒模块的情况下，此时DSP处理器处于监听状态，并将该语音唤醒数据输入DSP处理器的一级唤醒模块。DSP处理器在监听状态下接收到停止识别(StopRecognition)指令时，将DSP处理器的状态切换为停止状态。在DSP处理器的一级唤醒模块对语音唤醒数据处理成功的情况下，DSP处理器处于唤醒状态，此时，语音处理装置停止接收语音唤醒数据，然后根据DSP处理器的一级唤醒模块对语音唤醒数据处理成功的时间点，从DSP处理器的缓存区内倒推2.5s的时间，截取这段时间内的部分语音唤醒数据，并将该部分语音唤醒输入DSP处理器的二级唤醒模块和声纹唤醒模块，在语音处理装置将该部分语音唤醒输入DSP处理器的二级唤醒模块和声纹唤醒模块，DSP处理器就处于停止状态，若DSP处理器的二级唤醒模块唤醒失败，则DSP处理器重新处于监听状态。

示例性的，如图5所示，语音处理装置可以直接将语音唤醒数据输入第一处理器中的一级唤醒模块，语音处理装置也可以将语音唤醒数据输入第二处理器中的一级唤醒模块。语音处理装置在获取到语音唤醒数据的情况下，可以直接将语音唤醒数据输入第二处理器中的一级唤醒模块，在第二处理器中的一级唤醒模块对语音唤醒数据处理成功的情况下，语音处理装置就将语音唤醒数据输入第一处理器中的二级唤醒模块和第一处理器中的声纹唤醒模块，以利用第一处理器中的二级唤醒模块和第一处理器中的声纹唤醒模块启动语音唤醒数据对应的语音设备，即利用第一处理器中的二级唤醒模块和第一处理器中的声纹唤醒模块启动语音助手。若语音处理装置在获取到语音唤醒数据的情况下，可以直接将语音唤醒数据输入第一处理器中的一级唤醒模块，同时语音处理装置对该语音唤醒数据进行存储，得到录音数据，在第一处理器中的一级唤醒模块对语音唤醒数据处理成功的情况下，语音处理装置就将该语音唤醒数据输入第一处理器中的二级唤醒模块和第一处理器中的声纹唤醒模块，以利用第一处理器中的二级唤醒模块和第一处理器中的声纹唤醒模块启动语音助手，在第一处理器中的一级唤醒模块唤醒失败的情况下，语音处理装置就将录音数据输入第一处理器中的二级唤醒模块和第一处理器中的声纹唤醒模块，以利用第一处理器中的二级唤醒模块和第一处理器中的声纹唤醒模块启动语音助手。

需要说明的是，在第一处理器中的一级唤醒模块对语音唤醒数据处理成功的情况下，语音处理装置还可以将语音唤醒数据输入第二处理器中的二级唤醒模块和第二处理器中的声纹唤醒模块，以利用第二处理器中的二级唤醒模块和第二处理器中的声纹唤醒模块启动语音助手，具体的可根据实际情况进行确定，本申请实施例对此不作限定。

示例性的，如图6所示，若第二处理器为DSP处理器，语音处理装置在接收到语音唤醒数据的情况下，语音处理装置也可以直接将语音唤醒数据输入DSP的一级唤醒模块，在第二处理器中的一级唤醒模块对语音唤醒数据处理成功的情况下，语音处理装置就根据第二处理器中的一级唤醒模块对语音唤醒数据处理成功的时间点，从第二处理器的缓存区内倒推2.5s的时间，截取这段时间内的部分语音唤醒数据，并通过声音触发(soundtrigger)架构，将部分语音唤醒数据输入第一处理器的声纹唤醒服务中，该声纹唤醒服务包括二级唤醒模块和声纹唤醒模块，即语音处理装置将部分语音唤醒数据输入该二级唤醒模块和声纹唤醒模块，以启动与语音唤醒数据对应的语音设备。若第一处理器为CPU处理器，则语音处理装置在接收到语音唤醒数据的情况下，语音处理装置就利用音频服务(audioservice)绕过(bypass)掉录音通路上的滤波器，增益等音效模块，使得录音通路上的滤波器，增益等音效模块不对接收到的语音唤醒数据进行处理，从而获取到原始的语音唤醒数据，并将该语音唤醒数据保存为长音频，同时将该语音唤醒数据输入CPU的一级唤醒模块，在第一级唤醒模块对语音唤醒数据处理成功的情况下，语音处理装置就截取语音唤醒数据中的部分语音唤醒数据，并将该部分语音唤醒数据输入声纹唤醒服务，以启动与语音唤醒数据对应的语音设备。

可以理解的是，语音处理装置在接收到语音唤醒数据的情况下，就利用第一处理器对该语音唤醒数据进行录音，得到录音数据，在一级唤醒模块唤醒失败的情况下，数语音唤醒装置还可以将录音数据输入第一处理器的后续唤醒模块中，使得语音处理装置可以直接利用后续唤醒模块对录音数据进行处理，提高了语音处理装置处理语音唤醒数据时的速度。

实施例二

基于实施例一同一发明构思，本申请实施例提供了一种语音处理装置1，对应于一种语音处理方法；图7为本申请实施例提供的一种语音处理装置的组成结构示意图一，语音处理装置包括第一处理器，第一处理器为中央处理器，该语音处理装置1可以包括：

录音单元11，用于在接收到语音唤醒数据的情况下，利用所述第一处理器对所述语音唤醒数据进行录音，得到录音数据；

输入单元12，用于将所述语音唤醒数据输入所述第一处理器的一级唤醒模块；在所述一级唤醒模块对所述语音唤醒数据处理失败的情况下，将所述录音数据输入所述第一处理器的后续唤醒模块，以利用所述后续唤醒模块启动与所述语音唤醒数据对应的语音设备；

处理单元13，用于利用所述一级唤醒模块对所述语音唤醒数据进行处理。

在本申请的一些实施例中，所述输入单元12，还用于在所述一级唤醒模块对所述语音唤醒数据处理成功的情况下，将所述语音唤醒数据输入所述第一处理器的后续唤醒模块，以利用所述后续唤醒模块启动与所述语音唤醒数据对应的语音设备。

在本申请的一些实施例中，所述后续唤醒模块包括二级唤醒模块和声纹唤醒模块；所述装置还包括启动单元；

所述输入单元12，用于将所述录音数据输入所述二级唤醒模块；在所述二级唤醒模块对所述语音唤醒数据处理成功的情况下，将所述语音唤醒数据输入所述声纹唤醒模块；

所述处理单元13，用于利用所述二级唤醒模块对所述录音数据进行处理；利用所述声纹唤醒模块对所述语音唤醒数据进行处理；

所述启动单元，用于在所述声纹唤醒模块对所述录音数据处理成功的情况下，启动与所述语音唤醒数据对应的语音设备。

在本申请的一些实施例中，所述装置还包括第二处理器和切换单元；

所述切换单元，用于将所述第一处理器切换为第二处理器；

所述输入单元12，用于将所述录音数据输入所述第二处理器中的二级唤醒模块和所述第二处理器中的声纹唤醒模块，以利用所述第二处理器中的二级唤醒模块和所述第二处理器中的声纹唤醒模块启动与所述语音唤醒数据对应的语音设备。

在本申请的一些实施例中，所述装置还包括仿真单元和优化单元；

所述仿真单元，用于将所述录音数据输入一级唤醒算法中进行仿真，得到仿真结果；所述一级唤醒算法用于仿真第二处理器的一级唤醒模块的唤醒功能；

所述优化单元，用于基于所述仿真结果，优化所述第二处理器的一级唤醒模块，以供下一轮利用所述第二处理器的一级唤醒模块成功唤醒所述语音设备。

在本申请的一些实施例中，所述第二处理器为数字信号处理器。

需要说明的是，在实际应用中，上述录音单元11、输入单元12和处理单元13可由语音处理装置1上的处理器14实现，具体为CPU(Central Processing Unit，中央处理器)、MPU(Microprocessor Unit，微处理器)、DSP(Digital Signal Processing，数字信号处理器)或现场可编程门阵列(FPGA，Field Programmable Gate Array)等实现；上述数据存储可由语音处理装置1上的存储器15实现。

本申请实施例还提供了一种语音处理装置1，如图8所示，所述语音处理装置1包括：处理器14、存储器15和通信总线16，所述存储器15通过所述通信总线16与所述处理器14进行通信，所述存储器15存储所述处理器14可执行的程序，当所述程序被执行时，通过所述处理器14执行如上述所述的语音处理方法。

在实际应用中，上述存储器15可以是易失性存储器(volatile memory)，例如随机存取存储器(Random-Access Memory，RAM)；或者非易失性存储器(non-volatile memory)，例如只读存储器(Read-Only Memory，ROM)，快闪存储器(flash memory)，硬盘(Hard DiskDrive，HDD)或固态硬盘(Solid-State Drive，SSD)；或者上述种类的存储器的组合，并向处理器14提供指令和数据。

本申请实施例提供了一种计算机可读存储介质，其上有计算机程序，所述程序被处理器14执行时实现如上述所述的语音处理方法。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。

Claims

1.一种语音处理方法，其特征在于，应用于语音处理装置，所述语音处理装置包括第一处理器，所述第一处理器为中央处理器，所述方法包括：

利用所述一级唤醒模块对所述语音唤醒数据进行处理；

2.根据权利要求1所述的方法，其特征在于，所述利用所述一级唤醒模块对所述语音唤醒数据进行处理之后，所述方法还包括：

在所述一级唤醒模块对所述语音唤醒数据处理成功的情况下，将所述语音唤醒数据输入所述第一处理器的后续唤醒模块，以利用所述后续唤醒模块启动与所述语音唤醒数据对应的语音设备。

3.根据权利要求1所述的方法，其特征在于，所述后续唤醒模块包括二级唤醒模块和声纹唤醒模块，所述将所述录音数据输入所述第一处理器的后续唤醒模块，以利用所述后续唤醒模块启动与所述语音唤醒数据对应的语音设备，包括：

将所述录音数据输入所述二级唤醒模块，并利用所述二级唤醒模块对所述录音数据进行处理；

在所述二级唤醒模块对所述语音唤醒数据处理成功的情况下，将所述语音唤醒数据输入所述声纹唤醒模块，利用所述声纹唤醒模块对所述语音唤醒数据进行处理；

在所述声纹唤醒模块对所述录音数据处理成功的情况下，启动与所述语音唤醒数据对应的语音设备。

4.根据权利要求1所述的方法，其特征在于，所述语音处理装置还包括第二处理器，所述利用所述一级唤醒模块对所述语音唤醒数据进行处理之后，所述方法还包括：

将所述第一处理器切换为第二处理器；

将所述录音数据输入所述第二处理器中的二级唤醒模块和所述第二处理器中的声纹唤醒模块，以利用所述第二处理器中的二级唤醒模块和所述第二处理器中的声纹唤醒模块启动与所述语音唤醒数据对应的语音设备。

5.根据权利要求1所述的方法，其特征在于，所述利用所述第一处理器对所述语音唤醒数据进行录音，得到录音数据；并将所述语音唤醒数据输入所述第一处理器的一级唤醒模块之后，所述方法还包括：

将所述录音数据输入一级唤醒算法中进行仿真，得到仿真结果；所述一级唤醒算法用于仿真第二处理器的一级唤醒模块的唤醒功能；

基于所述仿真结果，优化所述第二处理器的一级唤醒模块，以供下一轮利用所述第二处理器的一级唤醒模块成功唤醒所述语音设备。

6.根据权利要求4或5所述的方法，其特征在于，所述第二处理器为数字信号处理器。

7.一种语音处理装置，其特征在于，所述语音处理装置包括第一处理器，所述第一处理为中央处理器，所述语音处理装置包括：

8.根据权利要求7所述的装置，其特征在于，

所述输入单元，还用于在所述一级唤醒模块对所述语音唤醒数据处理成功的情况下，将所述语音唤醒数据输入所述第一处理器的后续唤醒模块，以利用所述后续唤醒模块启动与所述语音唤醒数据对应的语音设备。

9.一种语音处理装置，其特征在于，所述装置包括：

存储器、处理器和通信总线，所述存储器通过所述通信总线与所述处理器进行通信，所述存储器存储所述处理器可执行的语音处理程序，当所述语音处理程序被执行时，通过所述处理器执行如权利要求1至6任一项所述的方法。

10.一种存储介质，其上存储有计算机程序，应用于语音处理装置，其特征在于，该计算机程序被处理器执行时实现权利要求1至6任一项所述的方法。