CN103903623A - 一种信息处理方法及电子设备 - Google Patents

一种信息处理方法及电子设备 Download PDF

Info

Publication number
CN103903623A
CN103903623A CN201410126412.XA CN201410126412A CN103903623A CN 103903623 A CN103903623 A CN 103903623A CN 201410126412 A CN201410126412 A CN 201410126412A CN 103903623 A CN103903623 A CN 103903623A
Authority
CN
China
Prior art keywords
sub
voice messaging
engine
vocal print
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410126412.XA
Other languages
English (en)
Other versions
CN103903623B (zh
Inventor
汪俊杰
孙艳庆
赵一方
柴海新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201410126412.XA priority Critical patent/CN103903623B/zh
Publication of CN103903623A publication Critical patent/CN103903623A/zh
Application granted granted Critical
Publication of CN103903623B publication Critical patent/CN103903623B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

本发明公开了一种信息处理方法,应用于电子设备中,所述电子设备包括第一语音引擎和第二语音引擎,所述方法包括:在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;基于所述第一子结果,启动所述第二语音引擎。

Description

一种信息处理方法及电子设备
技术领域
本发明涉及信息处理技术领域,尤其涉及一种信息处理方法及电子设备。
背景技术
随着信息处理技术的发展,语音信息处理成为信息处理技术领域的研究热点。在使用语音信息控制电子设备时,利用语音识别引擎识别出用户说出的内容。例如:用户向电子设备发送语音信息“打电话”,语音识别引擎识别出用户说出的内容是“打电话”,电子设备的显示单元就显示出拨号界面。
在某些应用场景如解锁、打开文件等下,为了用户信息安全,需要进行身份认证,现有技术中产生了声纹确认技术,即利用声纹确认引擎确认用户发送的语音信息具有的声纹是否是预设用户的预设声纹。例如:第一智能手机属于第一用户,在第一智能手机中存储了第一用户的文件及第一用户的预定声纹,当第二用户想要打开第一用户的文件,向第一智能手机发送语音信息“打开文件”后,声纹确认引擎会确认语音信息“打开文件”具有的声纹是否是第一用户的第一声纹,如果不是,第一用户的文件就不会被打开,保证了第一用户的信息安全。
但本申请申请人在实现本申请实施例中申请技术方案的过程中,发现上述技术至少存在如下技术问题:
现有技术中,语音识别引擎与声纹确认引擎是串行工作的,也就是说,在语音识别引擎识别出用户说的内容后,声纹确认引擎再确认用户发送的语音信息具有的声纹是否是预设声纹。或者,在声纹确认引擎确认用户发送的语音信息具有的声纹是否是预设声纹后,识别结果为是时,语音识别引擎再识别出用户说的内容。
因此,现有技术中的语音识别技术存在的技术问题是:语音识别引擎与声纹确认引擎串行工作,导致处理语音信息的效率低。
发明内容
本申请实施例通过提供一种信息处理方法及电子设备,解决了现有技术中的语音识别技术存在的语音识别引擎与声纹确认引擎串行工作,导致处理语音信息的效率低的技术问题,实现了提高处理语音信息的效率。
一方面,本申请实施例提供了一种信息处理方法,应用于电子设备中,所述电子设备包括第一语音引擎和第二语音引擎,所述方法包括:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;
基于所述第一子结果,启动所述第二语音引擎。
可选的,在所述第一语音引擎是语音识别引擎,所述第二语音引擎是声纹确认引擎时,所述在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,具体为:
在所述电子设备接收所述语音信息的过程中,通过所述语音识别引擎识别所述第一子语音信息,在所述第一时刻,获得与所述第一子语音信息对应的第一子识别结果;
所述基于所述第一子结果,启动所述第二语音引擎,具体包括:
判断所述第一子识别结果是否表明所述第一子语音信息是预设的固定语音信息部分,获得第一判断结果;
当所述第一判断结果为是时,启动所述声纹确认引擎,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,获得与所述第一子语音信息对应的第一子确认结果。
可选的,在所述当所述第一判断结果为是时,启动所述声纹确认引擎的同时或之后,所述方法还包括:
基于所述第一子识别结果,执行与所述第一子识别结果对应的第一子操作。
可选的,在所述获得与所述第一子语音信息对应的第一子确认结果之后,所述方法还包括:
在所述第一子确认结果表明所述第一子声纹是所述预设声纹时,通过所述语音识别引擎获得所述语音信息中的具有第二子时长的第二子语音信息,在所述第一时长内的第二时刻,获得与所述第二子语音信息对应的第二子识别结果,其中,所述第二子时长与所述第一子时长之和小于等于所述第一时长;
基于所述第二子识别结果,执行与所述第二子识别结果对应的第二子操作。
可选的,在所述第一语音引擎是声纹确认引擎,所述第二语音引擎是语音识别引擎时,所述在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,具体为:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子确认结果;
所述基于所述第一子结果,启动所述第二语音引擎,具体包括:
判断所述第一子确认结果是否表明所述第一子声纹是否是所述预设声纹,获得第二判断结果;
当所述第二判断结果为是时,启动所述语音识别引擎,通过所述语音识别引擎识别所述第一子语音信息,获得与所述第一子语音信息对应的第一子识别结果。
另一方面,本申请实施例提供了一种电子设备,所述电子设备包括第一语音引擎和第二语音引擎,所述电子设备还包括:
第一获得单元,用于在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;
控制单元,用于基于所述第一子结果,启动所述第二语音引擎。
可选的,在所述第一语音引擎是语音识别引擎,所述第二语音引擎是声纹确认引擎时,所述第一获得单元具体用于:
在所述电子设备接收所述语音信息的过程中,通过所述语音识别引擎识别所述第一子语音信息,在所述第一时刻,获得与所述第一子语音信息对应的第一子识别结果;
所述控制单元具体用于:
判断所述第一子识别结果是否表明所述第一子语音信息是预设的固定语音信息部分,获得第一判断结果;当所述第一判断结果为是时,启动所述声纹确认引擎,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,获得与所述第一子语音信息对应的第一子确认结果。
可选的,所述控制单元还用于:
基于所述第一子识别结果,执行与所述第一子识别结果对应的第一子操作。
可选的,所述电子设备还包括:
第二获得单元,用于在所述第一子确认结果表明所述第一子声纹是所述预设声纹时,通过所述语音识别引擎获得所述语音信息中的具有第二子时长的第二子语音信息,在所述第一时长内的第二时刻,获得与所述第二子语音信息对应的第二子识别结果,其中,所述第二子时长与所述第一子时长之和小于等于所述第一时长;
所述控制单元还用于基于所述第二子识别结果,执行与所述第二子识别结果对应的第二子操作。
可选的,在所述第一语音引擎是声纹确认引擎,所述第二语音引擎是语音识别引擎时,所述在所述电子设备接收具有第一时长的语音信息的过程中,所述第二获得单元具体用于:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子确认结果;
所述控制单元具体用于:
判断所述第一子确认结果是否表明所述第一子声纹是否是所述预设声纹,获得第二判断结果;当所述第二判断结果为是时,启动所述语音识别引擎,通过所述语音识别引擎识别所述第一子语音信息,获得与所述第一子语音信息对应的第一子识别结果。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1、本申请实施例中,由于采用了在电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;基于所述第一子结果,启动电子设备的第二语音引擎的技术手段。
根据第一语音引擎在获得语音信息的过程中,获得的部分语音信息及对应的结果,启动第二语音引擎,相比现有技术中,两个语音引擎串行工作,即第一语音引擎获得全部语音信息再启动第二语音引擎,本申请实施例提供的信息处理方法提高了语音信息的处理效率。并且,相比现有技术中,两个语音引擎并行工作,即第一语音引擎开始获得语音信息的同时,启动第二语音引擎,本申请实施例提供的信息处理方法节约了语音引擎硬件资源,且减少了电子设备的功耗,延长了电子设备的待机时间。
2、本申请实施例中,由于采用了在电子设备接收语音信息的过程中,通过电子设备的语音识别引擎识别语音信息的第一子语音信息,在所述第一时刻,获得与所述第一子语音信息对应的第一子识别结果;判断所述第一子识别结果是否表明所述第一子语音信息是预设的固定语音信息部分,获得第一判断结果;当所述第一判断结果为是时,启动声纹确认引擎的技术手段。用户可以根据自己的说话习惯设定语音信息中的固定语音信息部分,并且用户可以将固定语音信息部分设置在语音信息中的多个位置,支持语音信息的动态扩充,相比于现有技术中基于有限个固定文本的语音信息处理方法,本申请实施例提供了一种灵活、自然的语音信息处理方法,提高了用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例一中一种信息处理方法的流程图;
图2为本申请实施例二中一种电子设备的模块图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例通过提供一种信息处理方法及电子设备,解决了现有技术中的语音识别技术存在的语音识别引擎与声纹确认引擎串行工作,导致处理语音信息的效率低的技术问题,实现了提高处理语音信息的效率。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
提供一种信息处理方法,应用于电子设备中,所述电子设备包括第一语音引擎和第二语音引擎,所述第一语音引擎与所述第二语音引擎不同,所述方法包括:在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;基于所述第一子结果,启动所述第二语音引擎。
根据第一语音引擎在获得语音信息的过程中,获得的部分语音信息及对应的结果,启动第二语音引擎,相比现有技术中,两个语音引擎串行工作,即第一语音引擎获得全部语音信息再启动第二语音引擎,本申请实施例提供的信息处理方法提高了语音信息的处理效率。并且,相比现有技术中,两个语音引擎并行工作,即第一语音引擎开始获得语音信息的同时,启动第二语音引擎,本申请实施例提供的信息处理方法节约了语音引擎硬件资源,且减少了电子设备的功耗,延长了电子设备的待机时间。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。应当理解本申请以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
实施例一
本申请实施例提供了一种信息处理方法,应用于电子设备中,所述电子设备包括第一语音引擎和第二语音引擎,所述第一语音引擎与所述第二语音引擎不同。
本申请实施例中,所述电子设备可以是个人计算机、平板电脑、智能手机、智能电视等,本申请对此不作限制。所述第一语音引擎和所述第二语音引擎可以是语音识别引擎,用来识别语音信息的语义,即识别用户说出的内容,所述第一语音引擎和所述第二语音引擎也可以是声纹确认引擎,用来确认语音信息具有的声纹是否是用户预设的声纹,所述第一语音引擎和所述第二语音引擎还可以是其他语音引擎,本申请不做任何限定。并且所述第一语音引擎与所述第二引擎可以相同,也可以不同。
如图1所示,本申请实施例提供的信息处理方法包括:
步骤1:在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;
步骤2:基于所述第一子结果,启动所述第二语音引擎。
所述电子设备可以具有声音采集单元,例如所述声音采集单元可以是麦克,所述电子设备可以通过所述声音采集单元接收所述语音信息。或者,所述电子设备也可以通过网络接收其他电子设备传输的所述语音信息。或者,所述语音信息可以存储在所述电子设备中,所述电子设备可以从所述电子设备的存储区中接收所述语音信息。或者所述电子设备也可以通过其他方式接收所述语音信息,对于所述语音信息的接收方式本申请不做限制。
所述语音信息可以是一段话,其中包括多个句子,或者所述语音信息也可以只包括一句话,即只包括一个句子。因此,语音信息具有第一时长,如5秒钟,8秒钟等。
在电子设备接收具有第一时长的语音信息的过程中,通过电子设备的第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息。具体来说,假设具有第一时长的语音信息从第零时刻开始,至第N时刻结束,即第零时刻至第N时刻间的时间段即为第一时长,第一语音引擎可以在第零时刻至第N时刻间的任一时刻开始获得所述语音信息中的具有第一子时长的第一子语音信息,本申请实施例中,电子设备的第一语音引擎与第二语音引擎采用非串行的工作方式,因此,所述第一子时长小于所述第一时长。
以电子设备是智能手机为例,在智能手机接收具有7秒钟时长的语音信息“打电话给张三”的过程中,这7秒钟时长的语音信息从第0秒开始,至第7秒结束。智能手机的第一语音引擎可以在第0秒至第7秒间的任一时刻获得语音信息中的具有3秒钟时常的第一子语音信息“打电话”。
在所述第一语音引擎获得所述第一子语音信息后,在所述语音信息具有的第一时长内得第一时刻,获得与所述第一子语音信息对应的第一子结果。所述第一语音引擎的作用不同,获得的第一子结果也不同。当所述第一语音引擎是语音识别引擎时,所述第一子结果是所述第一子语音信息的第一子语义,即第一子语音信息表示用户说出的第一子内容。当所述第一语音引擎是声纹识别引擎时,所述第一子结果是第一子语音信息具有的第一子声纹。
在执行完步骤1,获得第一子结果后,本申请实施例提供的信息处理方法就执行步骤2。在执行步骤2的过程中,具体包括以下步骤:
步骤一:判断所述第一子结果是否满足预设条件;
步骤二:当所述判断结果为是时,启动所述第二语音引擎;
步骤三:当所述判断结果为否时,继续执行步骤1。
根据第一子结果的不同,所述预设条件也不同。当所述第一子结果是所述第一子语音信息的第一子语义,即第一子语音信息表示用户说出的第一子内容时,所述预设条件是:判断所述第一子语义是否是所述语音信息中的固定语音信息部分。
继续沿用上述例子,假设第一子语音信息是“打电话”,且用户预设的固定语音信息部分是“打电话”,因为“打电话”代表一个固定指令,判断结果为是,则启动第二语音引擎。假设第一子语音信息是“张三”,不是用户预设的固定语音信息部分,因为“张三”代表一个人名,判断结果为否,则继续获得第一子语音信息及第一子结果。
根据所述第一语音引擎和所述第二语音引擎的不同,步骤1和步骤2的实现方式不同。
当所述第一语音引擎是语音识别引擎,所述第二语音引擎是声纹确认引擎时,步骤1和步骤2的实现方式为:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述语音识别引擎识别所述第一子语音信息,在所述第一时刻,获得与所述第一子语音信息对应的第一子识别结果;
判断所述第一子识别结果是否表明所述第一子语音信息是预设的固定语音信息部分,获得第一判断结果;当所述第一判断结果为是时,启动所述声纹确认引擎,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,获得与所述第一子语音信息对应的第一子确认结果。启动所述声纹确认引擎的同时或之后,所述方法还包括:基于所述第一子识别结果,执行与所述第一子识别结果对应的第一子操作。
在所述第一子确认结果表明所述第一子声纹是所述预设声纹时,通过所述语音识别引擎获得所述语音信息中的具有第二子时长的第二子语音信息,在所述第一时长内的第二时刻,获得与所述第二子语音信息对应的第二子识别结果,其中,所述第二子时长与所述第一子时长之和小于等于所述第一时长;
基于所述第二子识别结果,执行与所述第二子识别结果对应的第二子操作。
以电子设备是智能手机为例,在智能手机接收具有8秒时长的语音信息“登陆淘宝,淘春装”的过程中,通过语音识别引擎识别语音信息“登陆淘宝,淘春装”中的具有4秒钟时长的第一子语音信息“登陆淘宝”,在8秒时长内的第5秒钟,获得第一子语音信息“登陆淘宝”对应的第一子识别结果是第一子语义:登陆淘宝。
接着判断第一子语义:登陆淘宝是否表明第一子语音信息“登陆淘宝”是用户预设的固定语音信息部分:登陆淘宝,判断结果为是,则启动声纹确认引擎,通过声纹确认引擎确认第一子语音信息“登陆淘宝”具有的第一子声纹是否是预设声纹,获得与第一子语音信息“登陆淘宝”对应的第一子确认结果,其中,所述预设声纹可以是智能手机的用户本身的声纹,也可以是智能手机的用户设置的其他人的声纹。
在启动声纹确认引擎的同时,由于第一子识别结果是第一子识别语义:登陆淘宝,则智能手机可以执行登陆淘宝的登陆操作,先输入用户名。
在第一子确认结果表明第一子语音信息“登陆淘宝”具有的第一子声纹是预设声纹时,身份验证成功,则智能手机可以输入与用户名对应的密码,登陆成功。并且通过语音识别引擎继续获得语音信息“登陆淘宝,淘春装”中的具有4秒钟时长的第二子语音信息“淘春装”,在8秒时长内的第8秒钟,获得第二子语音信息“淘春装”对应的第二子识别结果是第二子语义:淘春装。
由于第二子识别结果是第二子识别语义:淘春装,则智能手机可以执行获取有春装的网页的操作,并在智能手机的显示屏上显示有春装的网页。
当所述第一语音引擎是声纹确认引擎,所述第二语音引擎是语音识别引擎时,步骤1和步骤2的实现方式为:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子确认结果;
所述基于所述第一子结果,启动所述第二语音引擎,具体包括:
判断所述第一子确认结果是否表明所述第一子声纹是否是所述预设声纹,获得第二判断结果;
当所述第二判断结果为是时,启动所述语音识别引擎,通过所述语音识别引擎识别所述第一子语音信息,获得与所述第一子语音信息对应的第一子识别结果。
以电子设备是智能手机为例,在智能手机接收具有10秒时长的语音信息“开锁,打开我的文件”的过程中,通过声纹确认引擎确认具有3秒时长的第一子语音信息“开锁”具有的第一子声纹是否是预设声纹,如用户预设的自己的声纹,在10秒时长内的第4秒,获得与第一子语音信息“开锁”对应的第一子确认结果:是。
接着判断第一子确认结果:“是”是否表明第一子声纹是用户预设的自己的声纹。判断结果为是,身份验证成功,则启动语音识别引擎,通过语音识别引擎识别第一子语音信息“开锁”,获得与第一子语音信息“开锁”对应的第一子识别结果是第一子语义:开锁。
在启动语音识别引擎之后,由于第一子识别结果是第一子识别语义:开锁,则智能手机可以执行开锁操作。
并且通过语音识别引擎继续获得语音信息“开锁,打开我的文件”中的具有6秒钟时长的第二子语音信息“打开我的文件”,在10秒时长内的第10秒钟,获得第二子语音信息“打开我的文件”对应的第二子识别结果是第二子语义:打开我的文件。
由于第二子识别结果是第二子识别语义:打开我的文件,则智能手机可以执行获取我的文件的操作,并在智能手机的显示屏上显示我的文件。
本申请实施例中,所述预设的语音信息中的固定部分及所述预设声纹可以是用户设置的,或电子设备自行设置的。用户可以根据自己的说话习惯设置语音信息中的固定部分。以打电话给张三为例,用户可以设置“打电话给”为固定部分,也可以设置“给……打电话”为固定部分。
本申请实施例中,在基于第一语音引擎获得的第一子结果,启动电子设备的第二语音引擎后,第一语音引擎可以继续运行,也可以在第二语音引擎启动时停止运行,或者在第二语音引擎运行预定时间后停止运行,本申请不做任何限定。
实施例二
基于同一发明构思,本申请实施例中还提供了一种电子设备,由于该电子设备与上述信息处理方法解决问题的原理与信息处理方法相似,因此该电子设备的实施可以参见方法的实施,重复之处不再赘述。
如图2所示,本申请实施例提供了一种电子设备,所述电子设备包括第一语音引擎和第二语音引擎,所述电子设备还包括:
第一获得单元10,用于在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;
控制单元20,用于基于所述第一子结果,启动所述第二语音引擎。
可选的,在所述第一语音引擎是语音识别引擎,所述第二语音引擎是声纹确认引擎时,所述第一获得单元具体用于:
在所述电子设备接收所述语音信息的过程中,通过所述语音识别引擎识别所述第一子语音信息,在所述第一时刻,获得与所述第一子语音信息对应的第一子识别结果;
所述控制单元具体用于:
判断所述第一子识别结果是否表明所述第一子语音信息是预设的固定语音信息部分,获得第一判断结果;当所述第一判断结果为是时,启动所述声纹确认引擎,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,获得与所述第一子语音信息对应的第一子确认结果。
可选的,所述控制单元还用于:
基于所述第一子识别结果,执行与所述第一子识别结果对应的第一子操作。
可选的,所述电子设备还包括:
第二获得单元,用于在所述第一子确认结果表明所述第一子声纹是所述预设声纹时,通过所述语音识别引擎获得所述语音信息中的具有第二子时长的第二子语音信息,在所述第一时长内的第二时刻,获得与所述第二子语音信息对应的第二子识别结果,其中,所述第二子时长与所述第一子时长之和小于等于所述第一时长;
所述控制单元还用于基于所述第二子识别结果,执行与所述第二子识别结果对应的第二子操作。
可选的,在所述第一语音引擎是声纹确认引擎,所述第二语音引擎是语音识别引擎时,所述在所述电子设备接收具有第一时长的语音信息的过程中,所述第二获得单元具体用于:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子确认结果;
所述控制单元具体用于:
判断所述第一子确认结果是否表明所述第一子声纹是否是所述预设声纹,获得第二判断结果;当所述第二判断结果为是时,启动所述语音识别引擎,通过所述语音识别引擎识别所述第一子语音信息,获得与所述第一子语音信息对应的第一子识别结果。
上述申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1、本申请实施例中,由于采用了在电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;基于所述第一子结果,启动电子设备的第二语音引擎的技术手段。
根据第一语音引擎在获得语音信息的过程中,获得的部分语音信息及对应的结果,启动第二语音引擎,相比现有技术中,两个语音引擎串行工作,即第一语音引擎获得全部语音信息再启动第二语音引擎,本申请实施例提供的信息处理方法提高了语音信息的处理效率。并且,相比现有技术中,两个语音引擎并行工作,即第一语音引擎开始获得语音信息的同时,启动第二语音引擎,本申请实施例提供的信息处理方法节约了语音引擎硬件资源,且减少了电子设备的功耗,延长了电子设备的待机时间。
2、本申请实施例中,由于采用了在电子设备接收语音信息的过程中,通过电子设备的语音识别引擎识别语音信息的第一子语音信息,在所述第一时刻,获得与所述第一子语音信息对应的第一子识别结果;判断所述第一子识别结果是否表明所述第一子语音信息是预设的固定语音信息部分,获得第一判断结果;当所述第一判断结果为是时,启动声纹确认引擎的技术手段。用户可以根据自己的说话习惯设定语音信息中的固定语音信息部分,并且用户可以将固定语音信息部分设置在语音信息中的多个位置,支持语音信息的动态扩充,相比于现有技术中基于有限个固定文本的语音信息处理方法,本申请实施例提供了一种灵活、自然的语音信息处理方法,提高了用户体验。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
具体来讲,本申请实施例中的一种信息处理方法应用于电子设备中,所述电子设备包括第一语音引擎和第二语音引擎,所述方法对应的计算机程序指令可以被存储在光盘,硬盘,U盘等存储介质上,当存储介质中的与一种信息处理方法对应的计算机程序指令被一电子设备读取或被执行时,包括如下步骤:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;
基于所述第一子结果,启动所述第二语音引擎。
可选的,在所述第一语音引擎是语音识别引擎,所述第二语音引擎是声纹确认引擎时,所述在所述电子设备接收具有第一时长的语音信息的过程中,所述存储介质中存储的与步骤:通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,对应的计算机指令在具体被执行过程中,具体包括如下步骤:
在所述电子设备接收所述语音信息的过程中,通过所述语音识别引擎识别所述第一子语音信息,在所述第一时刻,获得与所述第一子语音信息对应的第一子识别结果;
所述存储介质中存储的与步骤:基于所述第一子结果,启动所述第二语音引擎,对应的计算机指令在具体被执行过程中,具体包括如下步骤:
判断所述第一子识别结果是否表明所述第一子语音信息是预设的固定语音信息部分,获得第一判断结果;
当所述第一判断结果为是时,启动所述声纹确认引擎,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,获得与所述第一子语音信息对应的第一子确认结果。
可选的,所述存储介质中还存储有另外一些计算机指令,这些计算机指令在与步骤:当所述第一判断结果为是时,启动所述声纹确认引擎,对应的计算机指令被执行的同时或之后被执行,在被执行时包括如下步骤:
基于所述第一子识别结果,执行与所述第一子识别结果对应的第一子操作。
可选的,所述存储介质中还存储有另外一些计算机指令,这些计算机指令在与步骤:获得与所述第一子语音信息对应的第一子确认结果,对应的计算机指令被执行之后被执行,在被执行时包括如下步骤:
在所述第一子确认结果表明所述第一子声纹是所述预设声纹时,通过所述语音识别引擎获得所述语音信息中的具有第二子时长的第二子语音信息,在所述第一时长内的第二时刻,获得与所述第二子语音信息对应的第二子识别结果,其中,所述第二子时长与所述第一子时长之和小于等于所述第一时长;
基于所述第二子识别结果,执行与所述第二子识别结果对应的第二子操作。
可选的,在所述第一语音引擎是声纹确认引擎,所述第二语音引擎是语音识别引擎时,所述在所述电子设备接收具有第一时长的语音信息的过程中,所述存储介质中存储的与步骤:通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,对应的计算机指令在具体被执行过程中,具体包括如下步骤:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子确认结果;
所述存储介质中存储的与步骤:基于所述第一子结果,启动所述第二语音引擎,对应的计算机指令在具体被执行过程中,具体包括如下步骤:
判断所述第一子确认结果是否表明所述第一子声纹是否是所述预设声纹,获得第二判断结果;
当所述第二判断结果为是时,启动所述语音识别引擎,通过所述语音识别引擎识别所述第一子语音信息,获得与所述第一子语音信息对应的第一子识别结果。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种信息处理方法,应用于电子设备中,所述电子设备包括第一语音引擎和第二语音引擎,所述方法包括:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;
基于所述第一子结果,启动所述第二语音引擎。
2.如权利要求1所述的方法,其特征在于,在所述第一语音引擎是语音识别引擎,所述第二语音引擎是声纹确认引擎时,所述在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,具体为:
在所述电子设备接收所述语音信息的过程中,通过所述语音识别引擎识别所述第一子语音信息,在所述第一时刻,获得与所述第一子语音信息对应的第一子识别结果;
所述基于所述第一子结果,启动所述第二语音引擎,具体包括:
判断所述第一子识别结果是否表明所述第一子语音信息是预设的固定语音信息部分,获得第一判断结果;
当所述第一判断结果为是时,启动所述声纹确认引擎,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,获得与所述第一子语音信息对应的第一子确认结果。
3.如权利要求2所述的方法,其特征在于,在所述当所述第一判断结果为是时,启动所述声纹确认引擎的同时或之后,所述方法还包括:
基于所述第一子识别结果,执行与所述第一子识别结果对应的第一子操作。
4.如权利要求2所述的方法,其特征在于,在所述获得与所述第一子语音信息对应的第一子确认结果之后,所述方法还包括:
在所述第一子确认结果表明所述第一子声纹是所述预设声纹时,通过所述语音识别引擎获得所述语音信息中的具有第二子时长的第二子语音信息,在所述第一时长内的第二时刻,获得与所述第二子语音信息对应的第二子识别结果,其中,所述第二子时长与所述第一子时长之和小于等于所述第一时长;
基于所述第二子识别结果,执行与所述第二子识别结果对应的第二子操作。
5.如权利要求1所述的方法,其特征在于,在所述第一语音引擎是声纹确认引擎,所述第二语音引擎是语音识别引擎时,所述在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,具体为:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子确认结果;
所述基于所述第一子结果,启动所述第二语音引擎,具体包括:
判断所述第一子确认结果是否表明所述第一子声纹是否是所述预设声纹,获得第二判断结果;
当所述第二判断结果为是时,启动所述语音识别引擎,通过所述语音识别引擎识别所述第一子语音信息,获得与所述第一子语音信息对应的第一子识别结果。
6.一种电子设备,所述电子设备包括第一语音引擎和第二语音引擎,所述电子设备还包括:
第一获得单元,用于在所述电子设备接收具有第一时长的语音信息的过程中,通过所述第一语音引擎获得所述语音信息中的具有第一子时长的第一子语音信息,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子结果,其中,所述第一子时长小于所述第一时长;
控制单元,用于基于所述第一子结果,启动所述第二语音引擎。
7.如权利要求6所述的电子设备,其特征在于,在所述第一语音引擎是语音识别引擎,所述第二语音引擎是声纹确认引擎时,所述第一获得单元具体用于:
在所述电子设备接收所述语音信息的过程中,通过所述语音识别引擎识别所述第一子语音信息,在所述第一时刻,获得与所述第一子语音信息对应的第一子识别结果;
所述控制单元具体用于:
判断所述第一子识别结果是否表明所述第一子语音信息是预设的固定语音信息部分,获得第一判断结果;当所述第一判断结果为是时,启动所述声纹确认引擎,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,获得与所述第一子语音信息对应的第一子确认结果。
8.如权利要求7所述的电子设备,其特征在于,所述控制单元还用于:
基于所述第一子识别结果,执行与所述第一子识别结果对应的第一子操作。
9.如权利要求7所述的电子设备,其特征在于,所述电子设备还包括:
第二获得单元,用于在所述第一子确认结果表明所述第一子声纹是所述预设声纹时,通过所述语音识别引擎获得所述语音信息中的具有第二子时长的第二子语音信息,在所述第一时长内的第二时刻,获得与所述第二子语音信息对应的第二子识别结果,其中,所述第二子时长与所述第一子时长之和小于等于所述第一时长;
所述控制单元还用于基于所述第二子识别结果,执行与所述第二子识别结果对应的第二子操作。
10.如权利要求6所述的电子设备,其特征在于,在所述第一语音引擎是声纹确认引擎,所述第二语音引擎是语音识别引擎时,所述在所述电子设备接收具有第一时长的语音信息的过程中,所述第二获得单元具体用于:
在所述电子设备接收具有第一时长的语音信息的过程中,通过所述声纹确认引擎确认所述第一子语音信息具有的第一子声纹是否是预设声纹,在所述第一时长内的第一时刻,获得与所述第一子语音信息对应的第一子确认结果;
所述控制单元具体用于:
判断所述第一子确认结果是否表明所述第一子声纹是否是所述预设声纹,获得第二判断结果;当所述第二判断结果为是时,启动所述语音识别引擎,通过所述语音识别引擎识别所述第一子语音信息,获得与所述第一子语音信息对应的第一子识别结果。
CN201410126412.XA 2014-03-31 2014-03-31 一种信息处理方法及电子设备 Active CN103903623B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410126412.XA CN103903623B (zh) 2014-03-31 2014-03-31 一种信息处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410126412.XA CN103903623B (zh) 2014-03-31 2014-03-31 一种信息处理方法及电子设备

Publications (2)

Publication Number Publication Date
CN103903623A true CN103903623A (zh) 2014-07-02
CN103903623B CN103903623B (zh) 2017-09-29

Family

ID=50994905

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410126412.XA Active CN103903623B (zh) 2014-03-31 2014-03-31 一种信息处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN103903623B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104991946A (zh) * 2015-07-13 2015-10-21 联想(北京)有限公司 一种信息处理方法、服务器和用户设备
WO2019085105A1 (zh) * 2017-11-02 2019-05-09 平安科技(深圳)有限公司 登录界面解锁方法、装置、计算机设备及存储介质
CN112351047A (zh) * 2021-01-07 2021-02-09 北京远鉴信息技术有限公司 基于双引擎的声纹身份认证方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1941080A (zh) * 2005-09-26 2007-04-04 吴田平 一种楼宇对讲门口机声纹识别开锁模块及识别开锁方法
CN102568473A (zh) * 2011-12-30 2012-07-11 深圳市车音网科技有限公司 语音信号的录制方法和装置
US20120271633A1 (en) * 2011-04-19 2012-10-25 Honda Motor Co., Ltd. Interactive device
CN202841290U (zh) * 2012-06-04 2013-03-27 百度在线网络技术(北京)有限公司 移动终端的解锁装置及具有该解锁装置的移动终端
CN103051781A (zh) * 2012-12-07 2013-04-17 百度在线网络技术(北京)有限公司 语音后台控制方法及移动终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1941080A (zh) * 2005-09-26 2007-04-04 吴田平 一种楼宇对讲门口机声纹识别开锁模块及识别开锁方法
US20120271633A1 (en) * 2011-04-19 2012-10-25 Honda Motor Co., Ltd. Interactive device
CN102568473A (zh) * 2011-12-30 2012-07-11 深圳市车音网科技有限公司 语音信号的录制方法和装置
CN202841290U (zh) * 2012-06-04 2013-03-27 百度在线网络技术(北京)有限公司 移动终端的解锁装置及具有该解锁装置的移动终端
CN103051781A (zh) * 2012-12-07 2013-04-17 百度在线网络技术(北京)有限公司 语音后台控制方法及移动终端

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104991946A (zh) * 2015-07-13 2015-10-21 联想(北京)有限公司 一种信息处理方法、服务器和用户设备
WO2019085105A1 (zh) * 2017-11-02 2019-05-09 平安科技(深圳)有限公司 登录界面解锁方法、装置、计算机设备及存储介质
CN112351047A (zh) * 2021-01-07 2021-02-09 北京远鉴信息技术有限公司 基于双引擎的声纹身份认证方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN103903623B (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
US10489568B2 (en) Apparatus and methods for improving terminal security
EP2899955A1 (en) Terminal voice control method, device, and terminal
US20180109677A1 (en) Text-to-speech apparatus and method, browser, and user terminal
JP6202858B2 (ja) 機密情報の音声入力のための方法、コンピュータ・プログラム、およびシステム
US20140379334A1 (en) Natural language understanding automatic speech recognition post processing
CN103761463A (zh) 一种信息处理方法及电子设备
CN103456296A (zh) 提供语音识别功能的方法及其电子设备
CN104050966A (zh) 终端设备的语音交互方法和使用该方法的终端设备
US9565301B2 (en) Apparatus and method for providing call log
WO2016070533A1 (zh) 指纹输入信息的处理方法、系统及移动终端
EP3051782A1 (en) Method and system for sending contact information in call process
CN103955393A (zh) 一种启动应用程序的方法及装置
CN110825411B (zh) Tws耳机系统的升级方法、设备及计算机可读存储介质
US20140316783A1 (en) Vocal keyword training from text
CN105244025A (zh) 一种基于智能佩戴设备的语音识别方法及系统
WO2016165245A1 (zh) 一种用户界面控制方法及终端
CN103106061A (zh) 语音输入方法和装置
CN102811288B (zh) 一种通话信息的记录方法及设备
CN103177724A (zh) 语音控制文本操作的方法、装置及终端
CN104281252A (zh) 一种信息处理方法及电子设备
CN103903623A (zh) 一种信息处理方法及电子设备
CN111801731A (zh) 语音控制方法、语音控制装置以及计算机可执行非易失性存储介质
KR102501083B1 (ko) 음성 인식 방법 및 이를 사용하는 전자 장치
EP3547310A1 (en) Electronic device for processing user voice
US9792095B2 (en) Apparatus and method for converting a procedure manual to an automated program

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant