CN107610702B - 终端设备待机唤醒方法、装置及计算机设备 - Google Patents
终端设备待机唤醒方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN107610702B CN107610702B CN201710865662.9A CN201710865662A CN107610702B CN 107610702 B CN107610702 B CN 107610702B CN 201710865662 A CN201710865662 A CN 201710865662A CN 107610702 B CN107610702 B CN 107610702B
- Authority
- CN
- China
- Prior art keywords
- library file
- terminal equipment
- voice signal
- model library
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Stored Programmes (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提出一种终端设备待机唤醒方法、装置及计算机设备,其中方法包括:在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储;将语音信号输入唤醒词识别引擎进行识别,得到识别结果;唤醒词识别引擎中保存有,在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;在识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;在终端设备上电后,上报语音信号,以使云端服务器根据语音信号对识别模型进行训练,进而生成更新版本的识别模型库文件,从而能够根据终端设备上报的正确唤醒或误唤醒的语音信号对识别模型进行训练,降低了识别模型的训练成本和训练效率,能够有效降低识别模型的误唤醒率。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种终端设备待机唤醒方法、装置及计算机设备。
背景技术
目前,对于具有待机语音唤醒功能的智能终端设备,例如智能机器人、智能电视、智能机顶盒、智能空调、智能家居终端等,唤醒词识别引擎中用于识别语音信号的识别模型库文件的生成方法为,人为采集大量的唤醒词语料、非唤醒词语料以及噪声语料对识别模型进行训练,根据训练后的识别模型生成识别模型库文件。然而,人为采集大量的唤醒词语料、非唤醒词语料以及噪声语料,成本高,效率低,且人为准备的非唤醒词语料与终端设备误唤醒情况下的语音信号差别太大,导致识别模型的误唤醒率难以得到有效的改善。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种终端设备待机唤醒方法,用于解决现有技术中识别模型的训练成本大,效率低,且误唤醒率高的问题。
本发明的第二个目的在于提出一种终端设备待机唤醒装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种终端设备待机唤醒方法,包括:
在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储所述语音信号;
将所述语音信号输入唤醒词识别引擎进行识别,得到识别结果;所述唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;
在所述识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;
在终端设备处于上电状态时,向云端服务器上报携带所述语音信号的上报信息,以使所述云端服务器对所述语音信号进行标注,根据标注过的所述语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件。
进一步的,所述在终端设备处于待机状态时,实时采集终端设备用户的语音信号之前,还包括:
在所述终端设备处于上电状态时,向云端服务器发送下载请求;所述下载请求中包括:终端设备的标识;
接收所述云端服务器根据所述终端设备的标识返回的最新版本的识别模型库文件;
将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件。
进一步的,所述将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件之前,还包括:
判断所述唤醒词识别引擎中的识别模型库文件是否为最新版本的识别模型库文件;
所述将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件,包括:
若所述唤醒词识别引擎中的识别模型库文件不是最新版本的识别模型库文件,则将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件。
进一步的,采集所述语音信号的方式为,
向终端设备上的麦克风阵列发送控制指令,实时获取所述麦克风阵列采集的语音信号。
进一步的,所述上报信息中还包括:终端设备的标识,以及上电时间;
以使所述云端服务器获取预设时间段内的语音信号,根据预设时间段内的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件。
进一步的,包括唤醒词的识别结果对应的语音信号为正常唤醒终端设备时的语音信号,或者,为误唤醒终端设备时的语音信号。
本发明实施例的终端设备待机唤醒方法,在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储语音信号;将语音信号输入唤醒词识别引擎进行识别,得到识别结果;唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;在识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;在终端设备处于上电状态时,向云端服务器上报携带语音信号的上报信息,以使云端服务器对语音信号进行标注,根据标注过的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件,从而能够根据终端设备上报的正确唤醒时的语音信号和误唤醒时的语音信号对识别模型进行训练,降低了识别模型的训练成本,提高了识别模型的训练效率,能够有效降低识别模型的误唤醒率。
为达上述目的,本发明第二方面实施例提出了一种终端设备待机唤醒装置,包括:
采集模块,用于在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储所述语音信号;
识别模块,用于将所述语音信号输入唤醒词识别引擎进行识别,得到识别结果;所述唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;
唤醒模块,用于在所述识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;
上报模块,用于在终端设备处于上电状态时,向云端服务器上报携带所述语音信号的上报信息,以使所述云端服务器对所述语音信号进行标注,根据标注过的所述语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件。
进一步的,所述的装置还包括:
发送模块,用于在所述终端设备处于上电状态时,向云端服务器发送下载请求;所述下载请求中包括:终端设备的标识;
接收模块,用于接收所述云端服务器根据所述终端设备的标识返回的最新版本的识别模型库文件;
替换模块,用于将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件。
进一步的,所述的装置还包括:
判断模块,用于判断所述唤醒词识别引擎中的识别模型库文件是否为最新版本的识别模型库文件;
所述替换模块具体用于,在所述唤醒词识别引擎中的识别模型库文件不是最新版本的识别模型库文件时,将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件。
进一步的,所述采集模块具体用于,
向终端设备上的麦克风阵列发送控制指令,实时获取所述麦克风阵列采集的语音信号。
进一步的,所述上报信息中还包括:终端设备的标识,以及上电时间;
以使所述云端服务器获取预设时间段内的语音信号,根据预设时间段内的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件。
进一步的,包括唤醒词的识别结果对应的语音信号为正常唤醒终端设备时的语音信号,或者,为误唤醒终端设备时的语音信号。
本发明实施例的终端设备待机唤醒装置,在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储语音信号;将语音信号输入唤醒词识别引擎进行识别,得到识别结果;唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;在识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;在终端设备处于上电状态时,向云端服务器上报携带语音信号的上报信息,以使云端服务器对语音信号进行标注,根据标注过的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件,从而能够根据终端设备上报的正确唤醒时的语音信号和误唤醒时的语音信号对识别模型进行训练,降低了识别模型的训练成本,提高了识别模型的训练效率,能够有效降低识别模型的误唤醒率。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上所述的方法。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的方法。
为达上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如上所述的方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例提供的一种终端设备待机唤醒方法的流程示意图;
图2为本发明实施例提供的另一种终端设备待机唤醒方法的流程示意图;
图3为本发明实施例提供的一种终端设备待机唤醒装置的结构示意图;
图4为本发明实施例提供的另一种终端设备待机唤醒装置的结构示意图;
图5为本发明实施例提供的另一种终端设备待机唤醒装置的结构示意图;
图6为本发明实施例提供的一种计算机设备的框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的终端设备待机唤醒方法及装置。
图1为本发明实施例提供的一种终端设备待机唤醒方法的流程示意图。如图1所示,该终端设备待机唤醒方法包括以下步骤:
S101、在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储语音信号。
本发明提供的终端设备待机唤醒方法的执行主体为终端设备待机唤醒装置,终端设备待机唤醒装置具体可以为安装在终端设备上的硬件或者软件。硬件例如可以为终端设备、终端设备上的唤醒芯片或者主控芯片;软件例如唤醒芯片或者主控芯片上安装的软件。其中,唤醒芯片可以为低功耗的芯片,例如数字信号处理DSP芯片等,唤醒芯片上集成有唤醒词识别引擎,用于识别语音信号。
其中,步骤101的执行过程具体可以为,唤醒芯片实时向终端设备上的麦克风阵列发送控制信号,控制麦克风阵列实时采集语音信号并提供给唤醒芯片。本实施例中,语音信号可以存储在唤醒芯片的flash等存储器中。
S102、将语音信号输入唤醒词识别引擎进行识别,得到识别结果;唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件。
S103、在识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电。
其中,步骤103的执行过程具体可以为,在识别结果中包括唤醒词时,唤醒芯片触发中断信号唤醒终端设备的主控芯片,终端设备的主控芯片开启终端设备,实现终端设备上电。
S104、在终端设备处于上电状态时,向云端服务器上报携带语音信号的上报信息,以使云端服务器对语音信号进行标注,根据标注过的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件。
本实施例中,在终端设备处于上电状态时,唤醒芯片可以将语音信号通过通讯接口,例如总线I2C,串行外设接口SPI等发送给主控芯片,主控芯片将携带语音信号的上报信息通过有线或无线网络上传给云端服务器。其中,上报信息中还可以包括:终端设备的标识,以及上电时间。
云端服务器可以实时接收各终端设备发送的上报信息,根据上报信息中终端设备的标识,确定终端设备所采用的唤醒词识别引擎对应的识别模型。其中,各终端设备所采用的唤醒词识别引擎对应的识别模型可能相同,也可能不同,此处以各终端设备所采用的唤醒词识别引擎对应的识别模型相同为例进行说明。对于各终端设备所采用的唤醒词识别引擎对应的识别模型不同的情况,可以参考相同情况下识别模型的训练过程,此处不再对不同情况下识别模型的训练过程进行详细描述。
云端服务器在接收到各终端设备发送的上报信息后,可以根据上报信息中终端设备的上电时间,确定接收上报信息的时间长度已满足约定时间长度,则对约定时间长度内接收到的语音信号进行标注。其中,该语音信号可能为终端设备正常唤醒时的语音信号,也可能为终端设备误唤醒时的语音信号。对语音信号的标注,指的是将语音信号标注为正常唤醒或者误唤醒,以便对识别模型进行训练。对语音信号的标注方式可以为手动标注,或者采用预先训练好的语音模型等,将语音信号转为文本信息,根据文本信息进行标注。
在约定时间长度内的语音信号标注完成后,云端服务器可以结合标注过的语音信号对识别模型进行训练,得到训练后的识别模型,并根据训练后的识别模型生成更新版本的识别模型库文件;存储更新版本的识别模型库文件,以便在接收到终端设备的下载请求时,将更新版本的识别模型库文件提供给终端设备。另外,还需要进行说明的是,此处训练的识别模型为云端服务器中最新版本的识别模型库文件对应的识别模型。
本发明实施例的终端设备待机唤醒方法,在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储语音信号;将语音信号输入唤醒词识别引擎进行识别,得到识别结果;唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;在识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;在终端设备处于上电状态时,向云端服务器上报携带语音信号的上报信息,以使云端服务器对语音信号进行标注,根据标注过的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件,从而能够根据终端设备上报的正确唤醒时的语音信号和误唤醒时的语音信号对识别模型进行训练,降低了识别模型的训练成本,提高了识别模型的训练效率,能够有效降低识别模型的误唤醒率。
图2为本发明实施例提供的另一种终端设备待机唤醒方法的流程示意图。如图2所示,在图1所示实施例的基础上,步骤101之前,所述的方法还可以包括以下步骤:
S105、在终端设备处于上电状态时,向云端服务器发送下载请求;下载请求中包括:终端设备的标识。
需要说明的是,本实施例中,终端设备待机唤醒装置可以在每次终端设备处于上电状态时,即终端设备从其他状态转换到上电状态时,向云端服务器发送下载请求;下载请求中包括:终端设备的标识。
S106、接收云端服务器根据终端设备的标识返回的最新版本的识别模型库文件。
S107、将唤醒词识别引擎中的识别模型库文件替换为最新版本的识别模型库文件。
其中,步骤107之前,终端设备待机唤醒装置可以先判断唤醒词识别引擎中的识别模型库文件是否为最新版本的识别模型库文件。对应的,步骤107具体可以为,若唤醒词识别引擎中的识别模型库文件不是最新版本的识别模型库文件,则将唤醒词识别引擎中的识别模型库文件替换为最新版本的识别模型库文件。
另外,若唤醒词识别引擎中的识别模型库文件为最新版本的识别模型库文件,则不进行替换操作。
本发明实施例的终端设备待机唤醒方法,在终端设备处于上电状态时,向云端服务器发送下载请求;下载请求中包括:终端设备的标识;接收云端服务器根据终端设备的标识返回的最新版本的识别模型库文件;将唤醒词识别引擎中的识别模型库文件替换为最新版本的识别模型库文件;在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储语音信号;将语音信号输入唤醒词识别引擎进行识别,得到识别结果;唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;在识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;在终端设备处于上电状态时,向云端服务器上报携带语音信号的上报信息,以使云端服务器对语音信号进行标注,根据标注过的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件,从而能够根据终端设备上报的正确唤醒时的语音信号和误唤醒时的语音信号对识别模型进行训练,降低了识别模型的训练成本,提高了识别模型的训练效率,能够有效降低识别模型的误唤醒率。
图3为本发明实施例提供的一种终端设备待机唤醒装置的结构示意图。如图3所示,包括:
采集模块31、识别模块32、唤醒模块33和上报模块34。
其中,采集模块31,用于在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储所述语音信号;
识别模块32,用于将所述语音信号输入唤醒词识别引擎进行识别,得到识别结果;所述唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;
唤醒模块33,用于在所述识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;
上报模块34,用于在终端设备处于上电状态时,向云端服务器上报携带所述语音信号的上报信息,以使所述云端服务器对所述语音信号进行标注,根据标注过的所述语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件。
本发明提供的终端设备待机唤醒装置具体可以为安装在终端设备上的硬件或者软件。硬件例如可以为终端设备、终端设备上的唤醒芯片或者主控芯片;软件例如唤醒芯片或者主控芯片上安装的软件。其中,唤醒芯片可以为低功耗的芯片,例如数字信号处理DSP芯片等,唤醒芯片上集成有唤醒词识别引擎,用于识别语音信号。
其中,采集模块31采集语音信号的方式可以为,唤醒芯片实时向终端设备上的麦克风阵列发送控制信号,控制麦克风阵列实时采集语音信号并提供给唤醒芯片。本实施例中,语音信号可以存储在唤醒芯片的flash等存储器中。
本实施例中,在终端设备处于上电状态时,唤醒芯片可以将语音信号通过通讯接口,例如总线I2C,串行外设接口SPI等发送给主控芯片,主控芯片将携带语音信号的上报信息通过有线或无线网络上传给云端服务器。其中,上报信息中还可以包括:终端设备的标识,以及上电时间。
云端服务器可以实时接收各终端设备发送的上报信息,根据上报信息中终端设备的标识,确定终端设备所采用的唤醒词识别引擎对应的识别模型。根据上报信息中终端设备的上电时间,确定接收上报信息的时间长度已满足约定时间长度,则对约定时间长度内接收到的语音信号进行标注。在约定时间长度内的语音信号标注完成后,云端服务器可以结合标注过的语音信号对识别模型进行训练,得到训练后的识别模型,并根据训练后的识别模型生成更新版本的识别模型库文件;存储更新版本的识别模型库文件,以便在接收到终端设备的下载请求时,将更新版本的识别模型库文件提供给终端设备。另外,还需要进行说明的是,此处训练的识别模型为云端服务器中最新版本的识别模型库文件对应的识别模型。
本发明实施例的终端设备待机唤醒装置,在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储语音信号;将语音信号输入唤醒词识别引擎进行识别,得到识别结果;唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;在识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;在终端设备处于上电状态时,向云端服务器上报携带语音信号的上报信息,以使云端服务器对语音信号进行标注,根据标注过的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件,从而能够根据终端设备上报的正确唤醒时的语音信号和误唤醒时的语音信号对识别模型进行训练,降低了识别模型的训练成本,提高了识别模型的训练效率,能够有效降低识别模型的误唤醒率。
进一步的,结合参考图4,在图3所示实施例的基础上,所述的装置还包括:发送模块35、接收模块36和替换模块37。
其中,发送模块35,用于在所述终端设备处于上电状态时,向云端服务器发送下载请求;所述下载请求中包括:终端设备的标识;
接收模块36,用于接收所述云端服务器根据所述终端设备的标识返回的最新版本的识别模型库文件;
替换模块37,用于将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件。
需要说明的是,本实施例中,终端设备待机唤醒装置可以在每次终端设备处于上电状态时,即终端设备从其他状态转换到上电状态时,向云端服务器发送下载请求;下载请求中包括:终端设备的标识。
进一步的,结合参考图5,在图4所示实施例的基础上,所述的装置还包括:判断模块38,用于判断所述唤醒词识别引擎中的识别模型库文件是否为最新版本的识别模型库文件;
对应的,替换模块37具体用于,在所述唤醒词识别引擎中的识别模型库文件不是最新版本的识别模型库文件时,将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件。
另外,若唤醒词识别引擎中的识别模型库文件为最新版本的识别模型库文件,则不进行替换操作。
本发明实施例的终端设备待机唤醒装置,在终端设备处于上电状态时,向云端服务器发送下载请求;下载请求中包括:终端设备的标识;接收云端服务器根据终端设备的标识返回的最新版本的识别模型库文件;将唤醒词识别引擎中的识别模型库文件替换为最新版本的识别模型库文件;在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储语音信号;将语音信号输入唤醒词识别引擎进行识别,得到识别结果;唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;在识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;在终端设备处于上电状态时,向云端服务器上报携带语音信号的上报信息,以使云端服务器对语音信号进行标注,根据标注过的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件,从而能够根据终端设备上报的正确唤醒时的语音信号和误唤醒时的语音信号对识别模型进行训练,降低了识别模型的训练成本,提高了识别模型的训练效率,能够有效降低识别模型的误唤醒率。
需要说明的是,前述对终端设备待机唤醒方法实施例的解释说明也适用于该实施例的装置,此处不再赘述。
为了实现上述实施例,本发明还提出一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上所述的方法。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的方法。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如上所述的方法。
图6示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图6显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器52。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统54可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local AreaNetwork;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (14)
1.一种终端设备待机唤醒方法,其特征在于,包括:
在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储所述语音信号;
将所述语音信号输入唤醒词识别引擎进行识别,得到识别结果;所述唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;
在所述识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;
在终端设备处于上电状态时,向云端服务器上报携带所述语音信号的上报信息,以使所述云端服务器对所述语音信号进行标注,根据标注过的所述语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件;其中,对语音信号的标注,指的是将语音信号标注为正常唤醒或者误唤醒。
2.根据权利要求1所述的方法,其特征在于,所述在终端设备处于待机状态时,实时采集终端设备用户的语音信号之前,还包括:
在所述终端设备处于上电状态时,向云端服务器发送下载请求;所述下载请求中包括:终端设备的标识;
接收所述云端服务器根据所述终端设备的标识返回的最新版本的识别模型库文件;
将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件。
3.根据权利要求2所述的方法,其特征在于,所述将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件之前,还包括:
判断所述唤醒词识别引擎中的识别模型库文件是否为最新版本的识别模型库文件;
所述将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件,包括:
若所述唤醒词识别引擎中的识别模型库文件不是最新版本的识别模型库文件,则将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件。
4.根据权利要求1所述的方法,其特征在于,采集所述语音信号的方式为,
向终端设备上的麦克风阵列发送控制指令,实时获取所述麦克风阵列采集的语音信号。
5.根据权利要求1所述的方法,其特征在于,所述上报信息中还包括:终端设备的标识,以及上电时间;
以使所述云端服务器获取预设时间段内的语音信号,根据预设时间段内的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件。
6.根据权利要求1所述的方法,其特征在于,包括唤醒词的识别结果对应的语音信号为正常唤醒终端设备时的语音信号,或者,为误唤醒终端设备时的语音信号。
7.一种终端设备待机唤醒装置,其特征在于,包括:
采集模块,用于在终端设备处于待机状态时,实时采集终端设备用户的语音信号并存储所述语音信号;
识别模块,用于将所述语音信号输入唤醒词识别引擎进行识别,得到识别结果;所述唤醒词识别引擎中用于识别语音信号的识别模型库文件,为在终端设备处于上电状态时,从云端服务器下载的最新版本的识别模型库文件;
唤醒模块,用于在所述识别结果中包括唤醒词时,触发中断信号唤醒终端设备,实现终端设备上电;
上报模块,用于在终端设备处于上电状态时,向云端服务器上报携带所述语音信号的上报信息,以使所述云端服务器对所述语音信号进行标注,根据标注过的所述语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件;其中,对语音信号的标注,指的是将语音信号标注为正常唤醒或者误唤醒。
8.根据权利要求7所述的装置,其特征在于,还包括:
发送模块,用于在所述终端设备处于上电状态时,向云端服务器发送下载请求;所述下载请求中包括:终端设备的标识;
接收模块,用于接收所述云端服务器根据所述终端设备的标识返回的最新版本的识别模型库文件;
替换模块,用于将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件。
9.根据权利要求8所述的装置,其特征在于,还包括:
判断模块,用于判断所述唤醒词识别引擎中的识别模型库文件是否为最新版本的识别模型库文件;
所述替换模块具体用于,在所述唤醒词识别引擎中的识别模型库文件不是最新版本的识别模型库文件时,将所述唤醒词识别引擎中的识别模型库文件替换为所述最新版本的识别模型库文件。
10.根据权利要求7所述的装置,其特征在于,所述采集模块具体用于,
向终端设备上的麦克风阵列发送控制指令,实时获取所述麦克风阵列采集的语音信号。
11.根据权利要求7所述的装置,其特征在于,所述上报信息中还包括:终端设备的标识,以及上电时间;
以使所述云端服务器获取预设时间段内的语音信号,根据预设时间段内的语音信号对识别模型进行训练,根据训练后的识别模型生成更新版本的识别模型库文件。
12.根据权利要求7所述的装置,其特征在于,包括唤醒词的识别结果对应的语音信号为正常唤醒终端设备时的语音信号,或者,为误唤醒终端设备时的语音信号。
13.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-6中任一所述的方法。
14.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710865662.9A CN107610702B (zh) | 2017-09-22 | 2017-09-22 | 终端设备待机唤醒方法、装置及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710865662.9A CN107610702B (zh) | 2017-09-22 | 2017-09-22 | 终端设备待机唤醒方法、装置及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107610702A CN107610702A (zh) | 2018-01-19 |
CN107610702B true CN107610702B (zh) | 2021-01-29 |
Family
ID=61061697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710865662.9A Active CN107610702B (zh) | 2017-09-22 | 2017-09-22 | 终端设备待机唤醒方法、装置及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107610702B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107564517A (zh) | 2017-07-05 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法、设备及系统、云端服务器与可读介质 |
CN110097876A (zh) * | 2018-01-30 | 2019-08-06 | 阿里巴巴集团控股有限公司 | 语音唤醒处理方法和被唤醒设备 |
CN108665900B (zh) * | 2018-04-23 | 2020-03-03 | 百度在线网络技术(北京)有限公司 | 云端唤醒方法及系统、终端以及计算机可读存储介质 |
CN108842903B (zh) * | 2018-07-04 | 2020-06-12 | 余蝶双 | 一种蓄水池及其水质监测系统 |
CN110858479B (zh) | 2018-08-08 | 2022-04-22 | Oppo广东移动通信有限公司 | 语音识别模型更新方法、装置、存储介质及电子设备 |
CN110875041A (zh) * | 2018-08-29 | 2020-03-10 | 阿里巴巴集团控股有限公司 | 语音控制方法、装置及系统 |
CN110310628B (zh) * | 2019-06-27 | 2022-05-20 | 百度在线网络技术(北京)有限公司 | 唤醒模型的优化方法、装置、设备及存储介质 |
CN110415724A (zh) * | 2019-08-08 | 2019-11-05 | 中南大学湘雅二医院 | 报警数据的传输方法、装置、系统及计算机可读存储介质 |
CN111081241B (zh) * | 2019-11-20 | 2023-04-07 | Oppo广东移动通信有限公司 | 设备误唤醒的数据检测方法、装置、移动终端和存储介质 |
CN111128150A (zh) * | 2019-11-27 | 2020-05-08 | 云知声智能科技股份有限公司 | 一种唤醒智能语音设备的方法及装置 |
CN113066482A (zh) * | 2019-12-13 | 2021-07-02 | 阿里巴巴集团控股有限公司 | 语音模型更新、语音数据处理方法、设备及存储介质 |
CN111554000A (zh) * | 2020-04-29 | 2020-08-18 | 深圳供电局有限公司 | 进行会议的方法、装置及系统、计算机设备 |
CN111554301A (zh) * | 2020-04-29 | 2020-08-18 | 深圳供电局有限公司 | 进行现场会议的方法、系统及装置、外接语音助手设备 |
CN111667818B (zh) * | 2020-05-27 | 2023-10-10 | 北京声智科技有限公司 | 一种训练唤醒模型的方法及装置 |
CN112786040A (zh) * | 2020-10-22 | 2021-05-11 | 青岛经济技术开发区海尔热水器有限公司 | 应用于智能家电设备的语音控制方法、装置及设备 |
CN114071200A (zh) * | 2022-01-17 | 2022-02-18 | 北京智象信息技术有限公司 | 一种动态更新tv拾音外设唤醒词的方法和系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1934971A4 (en) * | 2005-08-31 | 2010-10-27 | Voicebox Technologies Inc | DYNAMIC LANGUAGE SCRIPTURE |
CN103632667B (zh) * | 2013-11-25 | 2017-08-04 | 华为技术有限公司 | 声学模型优化方法、装置及语音唤醒方法、装置和终端 |
CN105654943A (zh) * | 2015-10-26 | 2016-06-08 | 乐视致新电子科技(天津)有限公司 | 一种语音唤醒方法、装置及系统 |
CN106683668A (zh) * | 2015-11-05 | 2017-05-17 | 芋头科技(杭州)有限公司 | 一种智能设备的唤醒控制的方法以及系统 |
CN105957527A (zh) * | 2016-05-16 | 2016-09-21 | 珠海格力电器股份有限公司 | 一种语音控制电器的方法、装置及语音控制空调 |
-
2017
- 2017-09-22 CN CN201710865662.9A patent/CN107610702B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107610702A (zh) | 2018-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107610702B (zh) | 终端设备待机唤醒方法、装置及计算机设备 | |
CN107704275B (zh) | 智能设备唤醒方法、装置、服务器及智能设备 | |
CN107622770B (zh) | 语音唤醒方法及装置 | |
CN107591151B (zh) | 远场语音唤醒方法、装置和终端设备 | |
CN107452372B (zh) | 远场语音识别模型的训练方法和装置 | |
CN107564518B (zh) | 智能设备控制方法、装置及计算机设备 | |
CN111091813B (zh) | 语音唤醒模型更新及唤醒方法、系统、装置、设备及介质 | |
CN107919130B (zh) | 基于云端的语音处理方法和装置 | |
CN108009303B (zh) | 基于语音识别的搜索方法、装置、电子设备和存储介质 | |
CN109669663B (zh) | 音区幅值获取方法、装置、电子设备及存储介质 | |
CN110277089B (zh) | 离线语音识别模型的更新方法、家用电器和服务器 | |
CN105135631A (zh) | 一种空调语音播报装置、空调及语音播报方法 | |
EP1703380A3 (en) | Method of updating firmware in computer server systems | |
CN111161714A (zh) | 一种语音信息处理方法、电子设备及存储介质 | |
WO2016082649A1 (zh) | 轨道交通车辆静态试验数据自动化处理方法及装置 | |
CN112017650A (zh) | 电子设备的语音控制方法、装置、计算机设备和存储介质 | |
CN108469959B (zh) | 监护设备的固件升级方法以及装置 | |
CN113436611B (zh) | 车载语音设备的测试方法、装置、电子设备和存储介质 | |
CN110473542B (zh) | 语音指令执行功能的唤醒方法、装置及电子设备 | |
CN108962235B (zh) | 语音交互方法及装置 | |
CN112820324A (zh) | 多标签语音活动检测方法、装置及存储介质 | |
CN105828252B (zh) | 一种麦克风控制权的分配方法及电子设备 | |
CN205066045U (zh) | 一种空调语音播报装置、空调 | |
CN115147474B (zh) | 点云标注模型的生成方法、装置、电子设备及存储介质 | |
CN114706371A (zh) | 整车网络不休眠诊断方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |