CN104078045B - 一种识别的方法及电子设备 - Google Patents

一种识别的方法及电子设备 Download PDF

Info

Publication number
CN104078045B
CN104078045B CN201310098940.4A CN201310098940A CN104078045B CN 104078045 B CN104078045 B CN 104078045B CN 201310098940 A CN201310098940 A CN 201310098940A CN 104078045 B CN104078045 B CN 104078045B
Authority
CN
China
Prior art keywords
information
electronic equipment
user
identified
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310098940.4A
Other languages
English (en)
Other versions
CN104078045A (zh
Inventor
尉伟东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201310098940.4A priority Critical patent/CN104078045B/zh
Publication of CN104078045A publication Critical patent/CN104078045A/zh
Application granted granted Critical
Publication of CN104078045B publication Critical patent/CN104078045B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种识别的方法及电子设备,用于解决现有技术中存在的电子设备不能够基于不同用户的同一语音输入信息而响应不同的操作指令的技术问题。该方法应用于第一电子设备,第一电子设备能够与第二电子设备进行数据通信,第一电子设备包含有第一特征库和第二特征库,其中,第一特征库为与第二电子设备的第一用户对应的特征库,第一特征库与第二特征库不同,该方法包括:获得由第二电子设备采集的并发出的第一待识别信息,其中,第一待识别信息具体为与第一用户对应的信息;基于第一待识别信息,在第一特征库中查找到与第一待识别信息所对应的第一指令,使得第二电子设备能够基于第一指令获得与第一指令相关的第一识别信息。

Description

一种识别的方法及电子设备
技术领域
本发明涉及人工智能领域,尤其涉及一种识别的方法及电子设备。
背景技术
随着计算机技术的发展,越来越多的电子设备进入了人们的生活,比如,平板电脑,智能手机,智能电视,笔记本电脑等等,人们通过这些电子设备获得了极大的便利。由于电子设备越来智能化,用户能够将电子设备看作一个智能机器人,能够通过与其进行语音交互,来获得一些信息。比如,用户“询问”电子设备最近的餐馆在哪;再比如,用户“询问”电子设备从地点A到地点B怎么走。
目前,当用户需要语音交互时,会打开语音交互软件,然后对着电子设备说话,电子设备通过设置在其上的语音识别引擎(本地客户端)将用户的语音输入,如“最近的火锅店在哪?”,转换为文本信息,并将该信息发送给云端服务器,云端服务器会根据上述文本信息,通过一系列的搜索计算,找到与文本信息最为匹配的结果,如“XX火锅店,前方500米”,并将该结果以文本形式发回给本地客户端,在本地客户端将上述结果的文本信息转换成语音信息输出给用户,使得用户能够听到电子设备的“回答”。
但本申请发明人在实现本发明实施例中技术方案的过程中,发现上述技术至少存在如下技术问题:
1、由于云端服务器中只设置有通用特征库,那么,对于所有的用户的语音输入,云端服务器都会通过通用特征库进行语音识别,假如,用户A和用户B的语言使用习惯不同,用户A说“关机”,意思是要电子设备(本地客户端)掉电关机,用户B说“关机”,意思是要电子设备(本地客户端)待机,但是,云端服务器通过通用特征库进行语音识别后,均会执行控制电子设备(本地客户端)掉电关机,所以,导致了云端服务器不能够基于同一语音输入信息响应不同的操作指令,即:现有技术中的电子设备存在不能够基于不同用户的同一语音输入信息而响应生成不同的操作指令的技术问题。
2、由于现有技术中的电子设备存在不能够基于不同用户的同一语音输入信息而响应生成不同的操作指令的技术问题,所以,现有技术中的电子设备还进一步存在不能准确响应每个用户的语音输入,而导致语音识别准确度低的技术问题;进一步,由于现有技术中的电子设备还进一步存在不能准确响应每个用户的语音输入,语音识别准确度低的技术问题,进而会导致电子设备的响应不是用户期望响应,进而大大降低用户体验度的问题。
发明内容
本发明提供一种识别的方法及电子设备,用以解决现有技术中存在的电子设备不能够基于不同用户的同一语音输入信息而响应不同的操作指令的技术问题。
一方面,本发明通过本申请的一个实施例,提供一种识别的方法,应用于第一电子设备,所述第一电子设备能够与第二电子设备进行数据通信,所述第一电子设备包含有第一特征库和第二特征库,其中,所述第一特征库为与所述第二电子设备的第一用户对应的特征库,所述第一特征库与所述第二特征库不同,所述方法包括:获得由所述第二电子设备采集的并发出的第一待识别信息,其中,所述第一待识别信息具体为与所述第一用户对应的信息;基于所述第一待识别信息,在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令,使得所述第二电子设备能够基于所述第一指令获得与所述第一指令相关的第一识别信息。
可选的,在所述获得由所述第二电子设备采集的并发出的第一待识别信息之前,所述方法还包括:获得一由所述第二电子设备发出的待验证用户身份信息,其中,所述待验证用户身份信息为所述第二电子设备的当前用户的身份信息;基于所述待验证用户身份信息,验证所述当前用户是否为所述第一用户;当所述当前用户为所述第一用户时,将所述第二电子设备与所述第一特征库相关联。
可选的,在所述将所述第二电子设备与所述第一特征库相关联之后,所述方法还包括:控制所述第一电子设备中的计时模块开始计时;当所述计时模块的计时值满足第一预设阈值时,返回所述获得一由所述第二电子设备发出的待验证用户身份信息步骤。
可选的,在所述将所述第二电子设备与所述第一特征库相关联之后,所述方法还包括:计算在第一预设时间段内所获得的所述第一待识别信息的第一次数;当所述第一次数大于第二预设阈值时,将所述第一预设时间段延长为第二预设时间段。
可选的,所述待验证用户身份信息具体由以下步骤获得:所述第二电子设备控制信息采集装置采集所述当前用户的第一信息;所述第二电子设备采用第一方式处理所述第一信息,以获得所述待验证用户身份信息。
可选的,所述待验证用户身份信息具体由以下步骤获得:所述第二电子设备控制信息采集装置采集所述当前用户的第一信息;在所述第二电子设备采用第二方式处理所述第一信息的过程中,所述第二电子设备采用第三方式处理所述第一信息,以获得所述待验证用户身份信息,其中,所述第二方式不同于所述第三方式。
可选的,当所述信息采集装置具体为图像采集装置时,所述待验证用户身份信息具体为包含所述当前用户的人脸的第一图像;或,当所述信息采集装置具体为声音采集装置时,所述待验证用户身份信息具体为所述当前用户的第一声音信息。
可选的,当所述待验证用户身份信息具体为所述第一图像时,所述验证所述当前用户是否为所述第一用户具体包括:将所述第一图像与存储在所述第一电子设备中的所述第一用户对应第一预设图像进行匹配,其中,所述第一预设图像为所述第一用户的人脸图像;当所述第一图像与所述第一预设图像匹配成功时,确认所述当前用户为所述第一用户。
可选的,当所述待验证用户身份信息具体为所述第一声音信息时,所述验证所述当前用户是否为所述第一用户具体包括:将所述第一声音信息与存储在所述第一电子设备中的所述第一用户对应的第一预设声纹信息进行匹配;当所述第一声音信息与所述第一预设声纹信息匹配成功时,确认所述当前用户为所述第一用户。
可选的,当所述第一特征库具体包括语音信息、指令,以及语音信息与指令之间的第一对应关系时,所述在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令具体包括:通过所述第一特征库,将所述第一待识别信息与所述语音信息进行匹配,获得第一语音信息;根据所述第一对应关系,基于所述第一语音信息,查找到与所述第一语音信息对应的所述第一指令。
可选的,当所述第一特征库具体包括指令、以及语音信息与指令之间的第一对应关系,且所述第二特征库包括语音信息时,所述在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令具体包括:通过所述第二特征库,将所述第一待识别信息与所述第二特征库中的所述语音信息进行匹配,获得第一语音信息;通过所述第一特征库,根据所述第一对应关系,基于所述第一语音信息,查找到与所述第一语音信息对应的所述第一指令。
另一方面,本发明通过本申请的另一实施例提供一种电子设备,能够与第二电子设备进行数据通信,所述电子设备包括:电路板;存储模块,设置在所述电路板上,包括有第一特征库和第二特征库,其中,所述第一特征库为与所述第二电子设备的第一用户对应的特征库,所述第一特征库与所述第二特征库为不同的特征库;识别模块,设置在所述电路板上,用于获得由所述第二电子设备采集的并发出的第一待识别信息,其中,所述第一待识别信息具体为与所述第一用户对应的信息;基于所述第一待识别信息,在所述第一特征库模中查找到与所述第一待识别信息所对应的第一指令,使得所述第二电子设备能够基于所述第一指令获得与所述第一指令相关的第一识别信息。
可选的,所述识别模块具体包括:第一获取模块,用于获得由所述第二电子设备采集的并发出的第一待识别信息,其中,所述第一待识别信息具体为与所述第一用户对应的信息;查找模块,用于基于所述第一待识别信息,在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令,使得所述第二电子设备能够获得与所述第一指令相关的第一识别信息。
可选的,所述电子设备还包括:第二获取模块,用于在获得所述第一待识别信息之前,获得一由所述第二电子设备发出的待验证用户身份信息,其中,所述待验证用户身份信息为所述第二电子设备的当前用户的身份信息;验证模块,用于基于所述待验证用户身份信息,验证所述当前用户是否为所述第一用户;关联模块,用于当所述当前用户为所述第一用户时,将所述第二电子设备与所述第一特征库相关联。
可选的,所述电子设备还包括:计时模块,用于在将所述第二电子设备与所述第一特征库相关联之后,开始计时,并在所述计时模块的计时值满足第一预设阈值时,驱动所述第二获取模块。
可选的,所述电子设备还包括:计数模块,用于在将所述第二电子设备与所述第一特征库相关联之后,计算在第一预设时间段内所获得的所述第一待识别信息的第一次数;延时模块,用于当所述第一次数大于第二预设阈值时,将所述第一预设时间段延长为第二预设时间段。
可选的,当所述待验证用户身份信息具体为包含所述当前用户人脸的第一图像时,所述验证模块具体包括:第一匹配模块,用于将所述第一图像与存储在所述第一电子设备中的所述第一用户对应第一预设图像进行匹配,其中,所述第一预设图像为所述第一用户的人脸图像;第一确认模块,用于当所述第一图像与所述第一预设图像匹配成功时,确认所述当前用户为所述第一用户。
可选的,当所述待验证用户身份信息具体为所述当前用户的第一声音信息时,所述验证模块具体包括:第二匹配模块,还用于将所述第一声音信息与存储在所述第一电子设备中的所述第一用户对应的第一预设声纹信息进行匹配;第二确认模块,还用于当所述第一声音信息与所述第一预设声纹信息匹配成功时,确认所述当前用户为所述第一用户。
可选的,当所述第一特征库具体包括语音信息、指令,以及语音信息与指令之间的第一对应关系时,所述查找模块具体包括:匹配子模块,用于通过所述第一特征库,将所述第一待识别信息与所述语音信息进行匹配,获得第一语音信息;查找子模块,用于根据所述第一对应关系,基于所述第一语音信息,查找到与所述第一语音信息对应的所述第一指令。
可选的,当所述第一特征库具体包括指令、以及语音信息与指令之间的第一对应关系,且所述第二特征库包括语音信息时,所述查找模块具体包括:匹配子模块,还用于通过所述第二特征库,将所述第一待识别信息与所述第二特征库中的所述语音信息进行匹配,获得第一语音信息;查找子模块,还用于通过所述第一特征库,根据所述第一对应关系,基于所述第一语音信息,查找到与所述第一语音信息对应的所述第一指令。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1、由于第一电子设备包含有第一特征库和第二特征库,其中,第一特征库为与第二电子设备的第一用户对应的特征库,第一特征库与第二特征库不同,那么,第一电子设备在获得由第二电子设备采集的并发出的第一待识别信息,其中,第一待识别信息具体为与第一用户对应的信息之后,就基于第一待识别信息,在第一特征库中查找到与第一待识别信息所对应的第一指令,使得第二电子设备能够基于第一指令获得与第一指令相关的第一识别信息,比如,第一用户想要第二电子设备待机,第一用户语音输入的第一待识别信息为“关机”,第一电子设备在与第一用户对应的第一特征库中找到的第一指令即为“待机”,而如果第一电子设备像现有技术一样仅使用第二特征库对上述第一待识别信息进行识别的话,就只能够得到“关机”这一指令,所以,有效地解决了现有技术中存在的电子设备不能够基于不同用户的同一语音输入信息而响应生成不同的操作指令的技术问题的技术问题,进而使得电子设备能够对同一语音输入信息针对不同的用户响应生成不同的操作指令,增加电子设备的智能程度,提供良好的用户体验。
进一步,由于电子设备能够对同一语音输入信息针对不同的用户响应生成不同的操作指令,就使得电子设备能够更为精确地响应用户的语音输入,所以,有效地解决了现有技术中存在的电子设备不能准确响应每个用户的语音输入,而导致语音识别准确度低的技术问题,进而提高了电子设备对于语音识别的准确度,使得电子设备能够提供用户所期望的响应,提供良好的用户体验。
2、由于在获得由第二电子设备发出的第一待识别信息之前,还需要对第一电子设备当前用户的身份进行验证,验证其是否为第一用户,当当前用户为第一用户时,将第二电子设备与第一特征库相关联,使得当第一用户在使用第二电子设备时,第一电子设备对于第一待识别信息就一定会采用第一特征库进行识别,也就是说,第一电子设备能够将第二电子设备的用户与其对应的特征库一一对应起来了。
3、由于在将第二电子设备与第一特征库相关联之后,第一电子设备控制其中的计时模块开始计时;当计时模块的计时值满足第一预设阈值时,返回获得一由第二电子设备发出的待验证用户身份信息步骤,也就是说,每间隔一段时间,就重新验证一次第二电子设备当前的用户用户身份,以确定该用户是否与当前的特征库匹配,这样就不需要当前用户每进行一次语音输入就要进行用户身份验证一次,这样不仅能够进一步的提高第一电子设备语音识别的精确度,而且也降低了第一电子设备的功耗,节约资源。
4、由于在将第二电子设备与第一特征库相关联之后,第一电子设备计算其在第一预设时间段内所获得的第一待识别信息的第一次数;当第一次数大于第二预设阈值时,将第一预设时间段延长为第二预设时间段,也就是说,在第二预设时间段内,第一电子设备获得一定次数的第一待验证信息后,第一电子设备就认为第一用户仍将使用第二电子设备进行语音识别,所以,第一电子设备就将第二预设时间段延长至第三预设时间段,以增加第一用户与第一特征库关联时间的长度,降低第一电子设备对于第二电子设备用户身份的验证次数,降低第一电子设备的功耗,节约资源。
附图说明
图1为本发明一实施例中的识别的方法流程图;
图2为本发明一实施例中的用户身份验证的方法流程图;
图3为本发明一实施例中的电子设备的结构示意图。
具体实施方式
本申请实施例通过提供一种识别的方法及电子设备,解决了现有技术中存在的电子设备由于不能够基于不同用户的同一语音输入信息而响应不同的操作指令而导致语音识别准确度低的技术问题。
本申请实施例中的技术方案为解决上述存在的电子设备由于不能够基于不同用户的同一语音输入信息而响应不同的操作指令而导致语音识别准确度低的问题,总体思路如下:
由于第一电子设备包含有第一特征库和第二特征库,其中,第一特征库为与第二电子设备的第一用户对应的特征库,第一特征库与第二特征库不同,那么,第一电子设备在获得由第二电子设备采集的并发出的第一待识别信息,其中,第一待识别信息具体为与第一用户对应的信息之后,就基于第一待识别信息,在第一特征库中查找到与第一待识别信息所对应的第一指令,使得第二电子设备能够基于第一指令获得与第一指令相关的第一识别信息,比如,第一用户想要第二电子设备待机,第一用户语音输入的第一待识别信息为“关机”,第一电子设备在与第一用户对应的第一特征库中找到的第一指令即为“待机”,而如果第一电子设备像现有技术一样仅使用第二特征库对上述第一待识别信息进行识别的话,就只能够得到“关机”这一指令,所以,有效地解决了现有技术中存在的电子设备不能够基于不同用户的同一语音输入信息而响应生成不同的操作指令的技术问题的技术问题,进而使得电子设备能够对同一语音输入信息针对不同的用户响应生成不同的操作指令,增加电子设备的智能程度,提供良好的用户体验。进一步,由于电子设备能够对同一语音输入信息针对不同的用户响应生成不同的操作指令,就使得电子设备能够更为精确地响应用户的语音输入,所以,有效地解决了现有技术中存在的电子设备不能准确响应每个用户的语音输入,而导致语音识别准确度低的技术问题,进而提高了电子设备对于语音识别的准确度,使得电子设备能够提供用户所期望的响应,提供良好的用户体验。
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
一方面,本发明通过本申请的一个实施例,提供一种识别的方法,应用于第一电子设备,即服务器,第一电子设备能够与第二电子设备进行数据通信,这里所说的第二电子设备可以为平板电脑,智能手机,智能电视,超级本等等,第一电子设备包含有第一特征库和第二特征库,其中,第一特征库为与第二电子设备的第一用户对应的特征库,第一特征库与第二特征库不同。
在具体实施过程中,第一特征库是经过长时间对第一用户的语言使用习惯进行统计而建立的针对第一用户的语言使用习惯的语音识别特征数据库,该特征库存储在第一电子设备,即服务器上,就使得第二电子设备数据处理量减小,降低功耗。第二特征库即为用来进行语音识别的通用特征库,也就是说,如果采用第二特征库进行语音识别的话,无论是哪个用户使用第二电子设备,只要输入的语音信息一致,则会识别的到一样的指令,该特征库是面向所有用户的,是通用的,并不专门针对某一用户。
进一步,在第一电子设备中可以不仅只有第一特征库和第二特征库,还可以存储有多个特征库,这些特征库每一个都一一与一个用户对应,用来分别或者同时识别每个用户的语音输入信息,而且,这些库可以设置在同一存储单元中,也可以设置在不同的存储单元中,只要第一电子设备能够根据用户的身份唯一的指向与用户对应的特征库即可,本申请不做具体限定。
如图1所示,该方法包括:
S101:获得由第二电子设备采集的并发出的第一待识别信息,其中,第一待识别信息具体为与第一用户对应的信息;
S102:基于第一待识别信息,在第一特征库中查找到与第一待识别信息所对应的第一指令,使得第二电子设备能够基于第一指令获得与第一指令相关的第一识别信息。
下面以具体实例来对上述技术方案进行详细说明。
例如,在第二电子设备,即手机的当前用户在使用第二电子设备进行编辑短信、拍照、视频通话,或者待机的过程中,想要进行语音识别的话,首先,需要触发语音识别功能,比如,点触语音识别启动按钮,或者长按主按键,然后在执行S101之前,为了将当前用户与其对应的特征库匹配,上述方法还包括对用户身份进行验证的过程。
在具体实施过程中,如图2所示,上述对用户身份进行验证的方法具体包括:
S201:获得一由第二电子设备发出的待验证用户身份信息,其中,待验证用户身份信息为第二电子设备当前用户的身份信息;
S202:基于待验证用户身份信息,验证当前用户是否为第一用户;
S203:当当前用户为第一用户时,将第二电子设备与第一特征库相关联。
具体来说,当前用户启动语音识别之后,第二电子设备会与第一电子设备建立数据传输通道,之后,第一电子设备就会对第二电子设备的当前用户进行身份验证。首先,第一电子设备控制第二电子设备采集当前用户的身份信息,比如,当前用户的声音信息,或者人脸图像信息,或者当前用户输入的密码等等,并以此作为待验证用户身份信息,然后,第二电子设备将待验证用户身份信息发送给第一电子设备,以对当前用户的身份进行验证。这里所说的待验证用户身份信息只要能够表征当前用户的身份即可,本申请不做具体限定。
在实际应用中,待验证用户身份信息具体可以由以下步骤获得:第二电子设备控制信息采集装置采集当前用户的第一信息;第二电子设备采用第一方式处理第一信息,以获得待验证用户身份信息。
具体来说,当信息采集装置具体为图像采集装置时,第二电子设备控制信息采集装置,即如摄像头的图像采集装置,采集当前用户的第一信息,该第一信息可以为包含当前用户的人脸的图像,然后,第二电子设备对第一信息以第一方式进行处理,比如,将第一信息进行图像处理调整其对比度,亮度,放大等等,使得第一信息成为更适于进行人脸识别的图像,并将处理后的图像确认为待验证用户身份信息,也就是包含当前用户人脸的第一图像。
那么,当信息采集装置具体为声音采集装置时,第二电子设备控制信息采集装置,即如麦克风的声音采集装置,采集当前用户的第一信息,该第一信息可以为包含当前用户声音的声音信息,然后,第二电子设备对第一信息以第一方式进行处理,比如,将第一信息进行处理,比如调整其响度,或者对其进行去噪等等,使得第一信息成为更适于进行声纹识别的声音信息,并将处理后的声音信息确认为待验证用户身份信息,也就是当前用户的第一声音信息。
当然,还可以采取用户输入登录密码的方式来进行用户身份验证,此时,第二电子设备控制信息采集装置,即如键盘、触控板的输入装置来采集当前用户的第一信息,也就是用户所输入的登录密码,然后,第二电子设备采用第一方式处理第一信息,可以是将当前用户输入的字符进行加密,并将加密后的字符信息确认为待验证用户身份信息。
上述过程中所获得当前用户的第一信息只有一个用途,就是用来获得待验证用户身份信息。
当然,为了增加第二电子设备的智能化程度,提高用户体验,第二电子设备还可以在当前用户进行拍照或者录音时,对其身份进行验证。那么,在这种情况下,待验证用户身份信息具体可以由以下步骤获得:第二电子设备控制信息采集装置采集当前用户的第一信息;在第二电子设备采用第二方式处理第一信息的过程中,第二电子设备采用第三方式处理第一信息,以获得待验证用户身份信息,其中,第二方式不同于第三方式。
具体来说,当当前用户在进行拍照或者录音时,想要进行语音识别的话,就需要开启语音识别功能,建立第二电子设备与第一电子设备之间的通信通道,接着,第二电子设备会先检测第二电子设备中的信息采集装置,如图像采集装置,是否正在工作,当检测到图像采集装置正在工作,也就是说,当前用户正在使用图像采集装置进行拍照,录视频,或者视频通话时,第二电子设备控制图像采集装置采集当前用户的第一信息,该第一信息可以为包含当前用户人脸的图像,接下来,第二电子设备就将该第一信息以第二方式处理,比如将该图像保存在第二电子设备的照片中,或者将该照片添加到短信中,再或者发送给视频通话的对方,同时,对第一信息以不同于第二方式的第三方式进行处理,比如,将第一信息进行图像处理调整其对比度,亮度,放大等等,使得第一信息成为更适于进行人脸识别的图片,并将处理后的图片确认为待验证用户身份信息,也就是包含当前用户人脸的第一图像。
当然,在第二电子设备开启语音识别功能之后,第二电子设备也可以先检测第二电子设备中的信息采集装置,如声音采集装置,是否正在工作,当检测到声音采集装置正在工作,也就是说,当前用户正在使用声音采集装置进行录音,语音通话时,第二电子设备控制声音采集装置采集当前用户的第一信息,该第一信息可以为包含当前用户声音的声音信息,接下来,第二电子设备就将该第一信息以第二方式处理,比如将该声音西信息保存在第二电子设备的语音备忘中,或者将该声音信息添加到短信中,再或者上传到网络,同时,对第一信息以不同于第二方式的第三方式进行处理,比如,调整第一信息的响度,或者对第一信息去噪等等,使得第一信息成为更适于进行声纹识别的声音信息,并将处理后的声音信息确认为待验证用户身份信息,也就是当前用户的第一声音信息。
经过上述过程,第二电子设备获得了用于对其当前用户的用户身份进行验证的待验证用户身份信息之后,第二电子设备将待验证用户身份信息发送给第一电子设备,此时,第一电子设备执行S201,即:获得一由第二电子设备发出的待验证用户身份信息,其中,待验证用户身份信息为第二电子设备当前用户的身份信息。
接下来,执行S202,即:基于待验证用户身份信息,验证当前用户是否为第一用户。
具体来说,当第一电子设备获得待验证用户身份信息后,会将其所获得的信息与预先存储在第一电子设备中的第一用户的信息模板进行匹配,获得相似度系数,以此来确认待验证用户身份信息所对应的用户,即第二电子设备的当前用户是否为第一用户。
比如,当待验证用户身份信息具体为包含当前用户人脸的第一图像时,第一电子设备将第一图像与存储在第一电子设备中的第一用户对应第一预设图像进行匹配,其中,第一预设图像为第一用户的人脸图像;当第一图像与第一预设图像匹配成功时,确认当前用户为第一用户。
再如,当待验证用户身份信息具体为当前用户的第一声音信息时,验证当前用户是否为第一用户具体包括:将第一声音信息与存储在第一电子设备中的第一用户对应的第一预设声纹信息进行匹配;当第一声音信息与第一预设声纹信息匹配成功时,确认当前用户为第一用户。
进一步,执行S203:当当前用户为第一用户时,将第二电子设备与第一特征库相关联。也就是说,将第二电子设备与第一特征库配对,使得第一电子设备受到的第二电子设备发送的所有信息均采用第一特征库进行识别。
在实际应用中,具体可以在第二电子设备所发送的信息中打上第二电子设备的硬件标识,比如MAC地址标识,或者网卡标识,这样,第一电子设备在获得该信息之后就能够知道此消息是由第二电子设备发送的,然后,将其通过第一特征库进行识别,也就使得第二电子设备与第一特征库相关联。
通过上述过程,将第二电子设备的第一用户与第一电子设备中的第一特征库相关联了,那么,接下来,进入对第一用户发出的语音输入进行语音识别。
首先,执行S101,即:获得由第二电子设备采集的并发出的第一待识别信息,其中,第一待识别信息具体为与第一用户对应的信息。也就是说,第一电子设备接收到由第二电子设备发来的第一待识别信息,此时第一待识别信息就是第一用户输入第二电子设备的语音输入,即一段声音,比如,第一用户对着第二电子设备说的“今天天儿怎么样”,或者“关机”。
在实际应用中,通过在上述用户身份验证过程的第二种情况所获得的第一声音信息也可以作为第一待识别信息,也就是说第一声音信息由两个用途。一个是用来进行用户身份验证,当验证用户身份后,该信息还可以用来进行语音识别,这样用户就无需输入两次语音输入了。
然后,在第一电子设备接收到第一待识别信息之后,执行S102,即:基于第一待识别信息,在第一特征库中查找到与第一待识别信息所对应的第一指令,使得第二电子设备能够基于第一指令获得与第一指令相关的第一识别信息。
具体来说,第一电子设备调用第一特征库来对第一待识别信息进行语音识别。也就是说,第一电子设备会根据第一待识别信息的内容来找到与其对应的第一指令。然后将第一指令发回第二电子设备,或者是发送给第三电子设备,比如天气服务器,或者是地图服务器,使得其能够响应第一指令,获得与其相关的第一识别信息,比如,第一指令为“待机”,那么,第一电子设备就将“待机”指令发回第二电子设备,此时,“待机”指令就是第一识别信息;或者,第一指令为“查询今天天气”,第一电子设备就会将第一指令发送给第三电子设备,即天气服务器,天气服务器根据第一指令查找到今天的天气情况,如“今天晴转多云”,天气服务器可以将该信息发回给第一电子设备,由第一电子设备发送给第二电子设备,也可以直接发送给第二电子设备,此时,“今天晴转多云”就是第一识别信息。
在具体实施过程中,由于第一特征库中所包含的内容不同,具体对第一待识别信息的语音识别过程可以且不限为以下两种情况。
第一种,当第一特征库具体包括语音信息、指令,以及语音信息与指令之间的第一对应关系时,S102可以包括:通过第一特征库,将第一待识别信息与语音信息进行匹配,获得第一语音信息;根据第一对应关系,基于第一语音信息,查找到与第一语音信息对应的第一指令。也就是说,当第一特征库包含所有用于进行语音识别的元素时,对第一待识别信息的识别就仅调用第一特征库即可。先通过第一特征库对第一待识别信息进行语义分析,获得第一语音信息,然后,再在第一特征库中根据语音信息与指令之间的关系,查找到与第一语音信息匹配的第一指令。
在具体实施过程中,第一特征库中的语音信息与指令之间的第一对应关系可以以表格的形式保存。比如,第一语音信息为“今天天儿怎么样”时,第一指令就为“查询今天天气”;或者,第一语音信息为“关机”时,第一指令就为“待机”,此时,语音信息与指令之间的关系如下表1所示:
表1
语音信息 指令
今天天儿怎么样 查询今天天气
关机 待机
当然,在实际应用中,语音信息还可以有其他内容,对应的指令也可以有其他指令,上述表1仅为举例说明语音信息与指令之间的第一对应关系,本领域技术人员可根据实际需要自行设定上述表格内容,本申请不做具体限定。
第二种,当第一特征库具体包括指令、以及语音信息与指令之间的第一对应关系,且第二特征库包括语音信息时,S102可以包括:通过第二特征库,将第一待识别信息与第二特征库中的语音信息进行匹配,获得第一语音信息;通过第一特征库,根据第一对应关系,基于第一语音信息,查找到与第一语音信息对应的第一指令。也就是说,当第一特征库中的内容和第二特征库中的内容一起才包含所有用于语音识别的元素时,对第一待识别信息的识别就需要调用第一特征库以及第二特征库。其中,第二特征库中包含的是语音信息,那么,就先通过第二特征库对第一待识别信息进行语义分析,获得第一语音信息,然后,再在第一特征库中根据语音信息与指令之间的关系,查找到与第一语音信息匹配的第一指令。
同样的,第一特征库中的语音信息与指令之间的关系与上述情况一致,在此不再一一赘述。
至此,就完成了对第二电子设备当前用户,即第一用户的身份验证以及语音识别的过程。
在另一实施例中,当第二电子设备还具有第二用户、第三用户、甚至更多用户时,如果第二电子设备在用户每结束一次语音识别,就对用户进行一次身份验证的话,会大大增加第二电子设备与第一电子设备的数据处理量,还增加功耗,所以,为了达到降低功耗的目的,在S203之后,上述识别的方法可以还包括:控制第一电子设备中的计时模块开始计时;当计时模块的计时值满足第一预设阈值时,返回获得一由第二电子设备发出的待验证用户身份信息步骤。也就是说,当当前用户经由身份验证为第一用户之后,第一电子设备的计时模块就开始计时,直到其值满足第一预设阈值,比如5分钟、10分钟、30分钟时,第一电子设备返回步骤S201,重新对第二电子设备的当前用户进行身份验证。
在实际应用中,还存在另一种情况,在S203之后,上述识别的方法还可以包括:计算在第一预设时间段内所获得的第一待识别信息的第一次数;当第一次数大于第二预设阈值时,将第一预设时间段延长为第二预设时间段。
具体来说,当当前用户经由身份验证为第一用户之后,第一电子设备的计时模块就开始计,同时第一电子设备中的计数模块开始计数,第一电子设备会保持第二电子设备与第一特征库关联一段时间,即第一预设时间段,直到计时模块所计的时间达到第一预设时间段时,通过计数模块统计在第一预设时间段内,第一电子设备获得第一待识别信息的第一次数,也就是说,第一用户所使用的次数,当第一次数大于第二预设阈值,如10次、30次、50次时,第一电子设备就默认第一用户还将使用第二电子设备进行语音识别,于是,第一电子设备就将第一预设时间段延长为第二预设时间段,那么,第一电子设备下次进入用户身份验证流程时间就可以从如10分钟延长至30分钟,或者1小时。
以下通过几个具体的实施例来介绍本发明中的识别的方法,下面的实施例主要介绍了所述识别的方法的几个可能的应用场景。需要说明的是,本发明中的实施例只用于解释本发明,而不能用于限制本发明。一切符合本发明思想的实施例均在本发明的保护范围之内,本领域技术人员自然知道应该如何根据本发明的思想进行变形。
实施例一:
以第一电子设备为服务器,第二电子设备为智能手机为例,当手机的当前用户想要进行语音识别时,首先,当前用户会启动语音识别应用程序,此时,为了对当前用户的身份进行验证,语音识别程序可以自动调用拍照应用程序,也就是手机控制开启摄像头。然后,手机控制摄像头对当前用户进行拍照,并将拍摄得到的照片进行图像处理,使其更加适合人脸识别,接下来,手机将处理后的图像,即第一图像发送给服务器。第三步,服务器在接收到第一图像后,对其进行人脸识别,也就是与存储在服务器中的用户人脸图像进行匹配,来确认当前用户的身份,假如,第一图像与第一用户的人脸图像匹配成功,那么,当前用户即为第一用户,服务器就将手机与第一用户对应的第一特征库相关联。第四步,第一用户开始进行语音识别,比如,此时第一用户想要查询下当前的天气,那么,第一用户对着手机说“今天天怎么样”,手机将该信息作为第一待识别信息发送给服务器,服务器在第一特征库中对其进行语义分析,得到第一语音信息,再在第一特征库中根据如表1所示的语音信息与指令的关系,找到指令“查询今天天气”,第五步,服务器将“查询今天天气”指令发送给第三电子设备,如天气服务器,使其在其数据库中查找到了今天的天气信息,如“今天晴转多云”,并将该信息发回给服务器,最后,服务器将今天的天气信息发送给手机,这样第一用户就能够知道今天的天气情况。
进一步,当服务器确认当前用户即为第一用户之后,服务器的计时模块就开始计时,比如,第一预设阈值为10分钟,那么,当第一用户使用语音识别使用满10分钟时,服务器就会向手机发用户身份验证请求,来再一次获得待验证用户身份信息,对手机的当前用户进行用户身份验证。
实施例二:
以第一电子设备为服务器,第二电子设备为平板电脑为例,当平板电脑的当前用户正在进行语音聊天时,当前用户想要结束语音聊天,于是,他按下语音识别按钮,启动语音识别功能,此时,平板电脑会先检测麦克风是否处于工作状态。然后,当检测到麦克风处于工作状态时,如果当前用户对着平板电脑说“下线了”,平板电脑就会控制麦克风采集当前用户说的这句话,接着,发送给聊天的对方,并且与此同时,平板电脑将该信息,即待识别用户身份信息进行去噪,获得第一声音信息,并发送其给服务器。第四步,服务器对第一声音信息进行声纹识别,也就是将第一声音信息与存储在服务器上的用户声纹信息进行匹配,来确认当前用户的身份,假如,第一声音信息与第一用户的声纹信息匹配成功,那么,当前用户即为第一用户,服务器就将手机与第一用户对应的第一特征库相关联。第五步,第一用户开始进行语音识别,比如,此时第一用户想要使得平板电脑待机,那么,第一用户对着平板电脑说“关机”,平板电脑将该信息作为第一待识别信息发送给服务器,服务器先通过第二特征库对其进行语义分析,得到第一语音信息,再在第一特征库中根据如表1所示的语音信息与指令的关系,找到指令“待机”,最后,服务器将“待机”指令发回给平板电脑,使得平板电脑响应该指令,进入待机模式。
进一步,服务器确认当前用户即为第一用户之后,服务器的计时模块就开始计时,同时,计数模块也开始计数,通过计数模块统计在第一预设时间段,如10分钟内,服务器获得第一待识别信息的第一次数,如10次,当第一次数大于第二预设阈值,如5次时,服务器就默认第一用户还将使用平板电脑进行语音识别,于是,服务器就将第一预设时间段即10分钟延长为第二预设时间段即30分钟,那么,服务器下次进入用户身份验证流程时间就可以从10分钟延长至30分钟。
根据上面的描述可知,由于第一电子设备包含有第一特征库和第二特征库,其中,第一特征库为与第二电子设备的第一用户对应的特征库,第一特征库与第二特征库不同,那么,第一电子设备在获得由第二电子设备采集的并发出的第一待识别信息,其中,第一待识别信息具体为与第一用户对应的信息之后,就基于第一待识别信息,在第一特征库中查找到与第一待识别信息所对应的第一指令,使得第二电子设备能够基于第一指令获得与第一指令相关的第一识别信息,比如,第一用户想要第二电子设备待机,第一用户语音输入的第一待识别信息为“关机”,第一电子设备在与第一用户对应的第一特征库中找到的第一指令即为“待机”,而如果第一电子设备像现有技术一样仅使用第二特征库对上述第一待识别信息进行识别的话,就只能够得到“关机”这一指令,所以,使得电子设备能够对同一语音输入信息针对不同的用户响应生成不同的操作指令,增加电子设备的智能程度,提供良好的用户体验;进一步,由于电子设备能够对同一语音输入信息针对不同的用户响应生成不同的操作指令,就使得电子设备能够更为精确地响应用户的语音输入,所以,提高了电子设备对于语音识别的准确度,使得电子设备能够提供用户所期望的响应,提供良好的用户体验;进一步,由于在获得由第二电子设备发出的第一待识别信息之前,还需要对第一电子设备当前用户的身份进行验证,验证其是否为第一用户,当当前用户为第一用户时,将第二电子设备与第一特征库相关联,使得当第一用户在使用第二电子设备时,第一电子设备对于第一待识别信息就一定会采用第一特征库进行识别,也就是说,第一电子设备能够将第二电子设备的用户与其对应的特征库一一对应起来了;进一步,由于在将第二电子设备与第一特征库相关联之后,第一电子设备控制其中的计时模块开始计时;当计时模块的计时值满足第一预设阈值时,返回获得一由第二电子设备发出的待验证用户身份信息步骤,也就是说,每间隔一段时间,就重新验证一次第二电子设备当前的用户用户身份,以确定该用户是否与当前的特征库匹配,这样就不需要当前用户每进行一次语音输入就要进行用户身份验证一次,这样不仅能够进一步的提高第一电子设备语音识别的精确度,而且也降低了第一电子设备的功耗,节约资源;进一步,由于在将第二电子设备与第一特征库相关联之后,第一电子设备计算其在第一预设时间段内所获得的第一待识别信息的第一次数;当第一次数大于第二预设阈值时,将第一预设时间段延长为第二预设时间段,也就是说,在第二预设时间段内,第一电子设备获得一定次数的第一待验证信息后,第一电子设备就认为第一用户仍将使用第二电子设备进行语音识别,所以,第一电子设备就将第二预设时间段延长至第三预设时间段,以增加第一用户与第一特征库关联时间的长度,降低第一电子设备对于第二电子设备用户身份的验证次数,降低第一电子设备的功耗,节约资源。
另一方面,基于同一发明构思,本发明通过本申请的另一实施例提供一种与上述一个或者多个实施例中的第一电子设备一致的电子设备,该电子设备可以为服务器,其能够与如智能手机、平板电脑、智能电视的第二电子设备进行数据通信,如图3所示,该电子设备包括:电路板10;存储模块20,设置在电路板10上,包括有第一特征库和第二特征库,其中,第一特征库为与第二电子设备的第一用户对应的特征库,第一特征库与第二特征库为不同的特征库;识别模块30,设置在电路板10上,用于获得由第二电子设备采集的并发出的第一待识别信息,其中,第一待识别信息具体为与第一用户对应的信息;基于第一待识别信息,在第一特征库中查找到与第一待识别信息所对应的第一指令,使得第二电子设备能够基于第一指令获得与第一指令相关的第一识别信息。
在具体实施过程中,第一特征库是经过长时间对第一用户的语言使用习惯进行统计而建立的针对第一用户的语言使用习惯的语音识别特征数据库,该特征库存储在第一电子设备,即服务器上,就使得第二电子设备数据处理量减小,降低功耗。第二特征库即为用来进行语音识别的通用特征库,也就是说,如果采用第二特征库进行语音识别的话,无论是哪个用户使用第二电子设备,只要输入的语音信息一致,则会识别的到一样的指令,该特征库是面向所有用户的,是通用的,并不专门针对某一用户。
进一步,在第一电子设备中可以不仅只有第一特征库和第二特征库,还可以存储有多个特征库,这些特征库每一个都一一与一个用户对应,用来分别或者同时识别每个用户的语音输入信息,而且,这些库可以设置在同一存储单元中,也可以设置在不同的存储单元中,只要第一电子设备能够根据用户的身份唯一的指向与用户对应的特征库即可,本申请不做具体限定。
进一步,识别模块30具体包括:第一获取模块,用于获得由第二电子设备采集的并发出的第一待识别信息,其中,第一待识别信息具体为与第一用户对应的信息;查找模块,用于基于第一待识别信息,在第一特征库中查找到与第一待识别信息所对应的第一指令,使得第二电子设备能够获得与第一指令相关的第一识别信息。
进一步,电子设备还包括:第二获取模块,用于在获得第一待识别信息之前,获得一由第二电子设备发出的待验证用户身份信息,其中,待验证用户身份信息为第二电子设备当前用户的身份信息;验证模块,用于基于待验证用户身份信息,验证当前用户是否为第一用户;关联模块,用于当当前用户为第一用户时,将第二电子设备与第一特征库相关联。
进一步,电子设备还包括:计时模块,用于在将第二电子设备与第一特征库相关联之后,开始计时,并在计时模块的计时值满足第一预设阈值时,驱动第二获取模块。
进一步,电子设备还包括:计数模块,用于在将第二电子设备与第一特征库相关联之后,计算在第一预设时间段内所获得的第一待识别信息的第一次数;延时模块,用于当第一次数大于第二预设阈值时,将第一预设时间段延长为第二预设时间段。
进一步,当待验证用户身份信息具体为包含当前用户人脸的第一图像时,验证模块具体包括:第一匹配模块,用于将第一图像与存储在第一电子设备中的第一用户对应第一预设图像进行匹配,其中,第一预设图像为第一用户的人脸图像;第一确认模块,用于当第一图像与第一预设图像匹配成功时,确认当前用户为第一用户。
进一步,当待验证用户身份信息具体为当前用户的第一声音信息时,验证模块具体包括:第二匹配模块,还用于将第一声音信息与存储在第一电子设备中的第一用户对应的第一预设声纹信息进行匹配;第二确认模块,还用于当第一声音信息与第一预设声纹信息匹配成功时,确认当前用户为第一用户。
进一步,当第一特征库具体包括语音信息、指令,以及语音信息与指令之间的第一对应关系时,查找模块具体包括:匹配子模块,用于通过第一特征库,将第一待识别信息与语音信息进行匹配,获得第一语音信息;查找子模块,用于根据第一对应关系,基于第一语音信息,查找到与第一语音信息对应的第一指令。
进一步,当第一特征库具体包括指令、以及语音信息与指令之间的第一对应关系,且第二特征库包括语音信息时,查找模块具体包括:匹配子模块,还用于通过第二特征库,将第一待识别信息与第二特征库中的语音信息进行匹配,获得第一语音信息;查找子模块,还用于通过第一特征库,根据第一对应关系,基于第一语音信息,查找到与第一语音信息对应的第一指令。
根据上面的描述,上述电子设备用于实现上述识别的方法,所以,该电子设备的工作过程与上述方法的一个或多个实施例一致,在此就不一一赘述了。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
1、由于第一电子设备包含有第一特征库和第二特征库,其中,第一特征库为与第二电子设备的第一用户对应的特征库,第一特征库与第二特征库不同,那么,第一电子设备在获得由第二电子设备采集的并发出的第一待识别信息,其中,第一待识别信息具体为与第一用户对应的信息之后,就基于第一待识别信息,在第一特征库中查找到与第一待识别信息所对应的第一指令,使得第二电子设备能够基于第一指令获得与第一指令相关的第一识别信息,比如,第一用户想要第二电子设备待机,第一用户语音输入的第一待识别信息为“关机”,第一电子设备在与第一用户对应的第一特征库中找到的第一指令即为“待机”,而如果第一电子设备像现有技术一样仅使用第二特征库对上述第一待识别信息进行识别的话,就只能够得到“关机”这一指令,所以,有效地解决了现有技术中存在的电子设备不能够基于不同用户的同一语音输入信息而响应生成不同的操作指令的技术问题的技术问题,进而使得电子设备能够对同一语音输入信息针对不同的用户响应生成不同的操作指令,增加电子设备的智能程度,提供良好的用户体验。
进一步,由于电子设备能够对同一语音输入信息针对不同的用户响应生成不同的操作指令,就使得电子设备能够更为精确地响应用户的语音输入,所以,有效地解决了现有技术中存在的电子设备不能准确响应每个用户的语音输入,而导致语音识别准确度低的技术问题,进而提高了电子设备对于语音识别的准确度,使得电子设备能够提供用户所期望的响应,提供良好的用户体验。
2、由于在获得由第二电子设备发出的第一待识别信息之前,还需要对第一电子设备当前用户的身份进行验证,验证其是否为第一用户,当当前用户为第一用户时,将第二电子设备与第一特征库相关联,使得当第一用户在使用第二电子设备时,第一电子设备对于第一待识别信息就一定会采用第一特征库进行识别,也就是说,第一电子设备能够将第二电子设备的用户与其对应的特征库一一对应起来了。
3、由于在将第二电子设备与第一特征库相关联之后,第一电子设备控制其中的计时模块开始计时;当计时模块的计时值满足第一预设阈值时,返回获得一由第二电子设备发出的待验证用户身份信息步骤,也就是说,每间隔一段时间,就重新验证一次第二电子设备当前的用户用户身份,以确定该用户是否与当前的特征库匹配,这样就不需要当前用户每进行一次语音输入就要进行用户身份验证一次,这样不仅能够进一步的提高第一电子设备语音识别的精确度,而且也降低了第一电子设备的功耗,节约资源。
4、由于在将第二电子设备与第一特征库相关联之后,第一电子设备计算其在第一预设时间段内所获得的第一待识别信息的第一次数;当第一次数大于第二预设阈值时,将第一预设时间段延长为第二预设时间段,也就是说,在第二预设时间段内,第一电子设备获得一定次数的第一待验证信息后,第一电子设备就认为第一用户仍将使用第二电子设备进行语音识别,所以,第一电子设备就将第二预设时间段延长至第三预设时间段,以增加第一用户与第一特征库关联时间的长度,降低第一电子设备对于第二电子设备用户身份的验证次数,降低第一电子设备的功耗,节约资源。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (16)

1.一种识别的方法,应用于第一电子设备,所述第一电子设备能够与第二电子设备进行数据通信,其特征在于,所述第一电子设备包含有第一特征库和第二特征库,其中,所述第一特征库为与所述第二电子设备的第一用户对应的特征库,所述第一特征库与所述第二特征库不同,所述方法包括:
获得由所述第二电子设备采集的并发出的第一待识别信息,其中,所述第一待识别信息具体为与所述第一用户对应的信息;
基于所述第一待识别信息,在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令,使得所述第二电子设备能够基于所述第一指令获得与所述第一指令相关的第一识别信息;
在所述获得由所述第二电子设备采集的并发出的第一待识别信息之前,所述方法还包括:
获得一由所述第二电子设备发出的待验证用户身份信息,其中,所述待验证用户身份信息为所述第二电子设备当前用户的身份信息;
基于所述待验证用户身份信息,验证所述当前用户是否为所述第一用户;
当所述当前用户为所述第一用户时,将所述第二电子设备与所述第一特征库相关联;
所述待验证用户身份信息具体由以下步骤获得:
所述第二电子设备控制信息采集装置采集所述当前用户的第一信息;
在所述第二电子设备采用第二方式处理所述第一信息的过程中,所述第二电子设备采用第三方式处理所述第一信息,以获得所述待验证用户身份信息,其中,所述第二方式不同于所述第三方式。
2.如权利要求1所述的方法,其特征在于,在所述将所述第二电子设备与所述第一特征库相关联之后,所述方法还包括:
控制所述第一电子设备中的计时模块开始计时;
当所述计时模块的计时值满足第一预设阈值时,返回所述获得一由所述第二电子设备发出的待验证用户身份信息步骤。
3.如权利要求1所述的方法,其特征在于,在所述将所述第二电子设备与所述第一特征库相关联之后,所述方法还包括:
计算在第一预设时间段内所获得的所述第一待识别信息的第一次数;
当所述第一次数大于第二预设阈值时,将所述第一预设时间段延长为第二预设时间段。
4.如权利要求1所述的方法,其特征在于,当所述信息采集装置具体为图像采集装置时,所述待验证用户身份信息具体为包含所述当前用户的人脸的第一图像;
或,当所述信息采集装置具体为声音采集装置时,所述待验证用户身份信息具体为所述当前用户的第一声音信息。
5.如权利要求4所述的方法,其特征在于,当所述待验证用户身份信息具体为所述第一图像时,所述验证所述当前用户是否为所述第一用户具体包括:
将所述第一图像与存储在所述第一电子设备中的所述第一用户对应第一预设图像进行匹配,其中,所述第一预设图像为所述第一用户的人脸图像;
当所述第一图像与所述第一预设图像匹配成功时,确认所述当前用户为所述第一用户。
6.如权利要求4所述的方法,其特征在于,当所述待验证用户身份信息具体为所述第一声音信息时,所述验证所述当前用户是否为所述第一用户具体包括:
将所述第一声音信息与存储在所述第一电子设备中的所述第一用户对应的第一预设声纹信息进行匹配;
当所述第一声音信息与所述第一预设声纹信息匹配成功时,确认所述当前用户为所述第一用户。
7.如权利要求1所述的方法,其特征在于,当所述第一特征库具体包括语音信息、指令,以及语音信息与指令之间的第一对应关系时,所述在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令,具体包括:
通过所述第一特征库,将所述第一待识别信息与所述语音信息进行匹配,获得第一语音信息;
根据所述第一对应关系,基于所述第一语音信息,查找到与所述第一语音信息对应的所述第一指令。
8.一种识别的方法,应用于第一电子设备,所述第一电子设备能够与第二电子设备进行数据通信,其特征在于,所述第一电子设备包含有第一特征库和第二特征库,其中,所述第一特征库为与所述第二电子设备的第一用户对应的特征库,所述第一特征库与所述第二特征库不同,所述方法包括:
获得由所述第二电子设备采集的并发出的第一待识别信息,其中,所述第一待识别信息具体为与所述第一用户对应的信息;
基于所述第一待识别信息,在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令,使得所述第二电子设备能够基于所述第一指令获得与所述第一指令相关的第一识别信息;
当所述第一特征库具体包括指令、以及语音信息与指令之间的第一对应关系,且所述第二特征库包括语音信息时,所述在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令具体包括:
通过所述第二特征库,将所述第一待识别信息与所述第二特征库中的所述语音信息进行匹配,获得第一语音信息;
通过所述第一特征库,根据所述第一对应关系,基于所述第一语音信息,查找到与所述第一语音信息对应的所述第一指令。
9.一种电子设备,能够与第二电子设备进行数据通信,其特征在于,所述电子设备包括:
电路板;
存储模块,设置在所述电路板上,包括有第一特征库和第二特征库,其中,所述第一特征库为与所述第二电子设备的第一用户对应的特征库,所述第一特征库与所述第二特征库为不同的特征库;
识别模块,设置在所述电路板上,用于获得由所述第二电子设备采集的并发出的第一待识别信息,其中,所述第一待识别信息具体为与所述第一用户对应的信息;基于所述第一待识别信息,在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令,使得所述第二电子设备能够基于所述第一指令获得与所述第一指令相关的第一识别信息;
所述电子设备还包括:
第二获取模块,用于在获得所述第一待识别信息之前,获得一由所述第二电子设备发出的待验证用户身份信息,其中,所述待验证用户身份信息为所述第二电子设备当前用户的身份信息;
验证模块,用于基于所述待验证用户身份信息,验证所述当前用户是否为所述第一用户;
关联模块,用于当所述当前用户为所述第一用户时,将所述第二电子设备与所述第一特征库相关联;
所述待验证用户身份信息具体由以下步骤获得:
所述第二电子设备控制信息采集装置采集所述当前用户的第一信息;
在所述第二电子设备采用第二方式处理所述第一信息的过程中,所述第二电子设备采用第三方式处理所述第一信息,以获得所述待验证用户身份信息,其中,所述第二方式不同于所述第三方式。
10.如权利要求9所述的电子设备,其特征在于,所述识别模块具体包括:
第一获取模块,用于获得由所述第二电子设备采集的并发出的第一待识别信息,其中,所述第一待识别信息具体为与所述第一用户对应的信息;
查找模块,用于基于所述第一待识别信息,在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令,使得所述第二电子设备能够获得与所述第一指令相关的第一识别信息。
11.如权利要求9所述的电子设备,其特征在于,所述电子设备还包括:计时模块,用于在将所述第二电子设备与所述第一特征库相关联之后,开始计时,并在所述计时模块的计时值满足第一预设阈值时,驱动所述第二获取模块。
12.如权利要求9所述的电子设备,其特征在于,所述电子设备还包括:
计数模块,用于在将所述第二电子设备与所述第一特征库相关联之后,计算在第一预设时间段内所获得的所述第一待识别信息的第一次数;
延时模块,用于当所述第一次数大于第二预设阈值时,将所述第一预设时间段延长为第二预设时间段。
13.如权利要求9所述的电子设备,其特征在于,当所述待验证用户身份信息具体为包含所述当前用户人脸的第一图像时,所述验证模块具体包括:
第一匹配模块,用于将所述第一图像与存储在第一电子设备中的所述第一用户对应第一预设图像进行匹配,其中,所述第一预设图像为所述第一用户的人脸图像;
第一确认模块,用于当所述第一图像与所述第一预设图像匹配成功时,确认所述当前用户为所述第一用户。
14.如权利要求9所述的电子设备,其特征在于,当所述待验证用户身份信息具体为所述当前用户的第一声音信息时,所述验证模块具体包括:
第二匹配模块,还用于将所述第一声音信息与存储在第一电子设备中的所述第一用户对应的第一预设声纹信息进行匹配;
第二确认模块,还用于当所述第一声音信息与所述第一预设声纹信息匹配成功时,确认所述当前用户为所述第一用户。
15.如权利要求10所述的电子设备,其特征在于,当所述第一特征库具体包括语音信息、指令,以及语音信息与指令之间的第一对应关系时,所述查找模块具体包括:
匹配子模块,用于通过所述第一特征库,将所述第一待识别信息与所述语音信息进行匹配,获得第一语音信息;
查找子模块,用于根据所述第一对应关系,基于所述第一语音信息,查找到与所述第一语音信息对应的所述第一指令。
16.一种电子设备,能够与第二电子设备进行数据通信,其特征在于,所述电子设备包括:
电路板;
存储模块,设置在所述电路板上,包括有第一特征库和第二特征库,其中,所述第一特征库为与所述第二电子设备的第一用户对应的特征库,所述第一特征库与所述第二特征库为不同的特征库;
识别模块,设置在所述电路板上,所述识别模块包括:第一获取模块,用于获得由所述第二电子设备采集的并发出的第一待识别信息,其中,所述第一待识别信息具体为与所述第一用户对应的信息;查找模块,用于基于所述第一待识别信息,在所述第一特征库中查找到与所述第一待识别信息所对应的第一指令,使得所述第二电子设备能够基于所述第一指令获得与所述第一指令相关的第一识别信息;
当所述第一特征库具体包括指令、以及语音信息与指令之间的第一对应关系,且所述第二特征库仅包括语音信息时,所述查找模块具体包括:
匹配子模块,还用于通过所述第二特征库,将所述第一待识别信息与所述第二特征库中的所述语音信息进行匹配,获得第一语音信息;
查找子模块,还用于通过所述第一特征库,根据所述第一对应关系,基于所述第一语音信息,查找到与所述第一语音信息对应的所述第一指令。
CN201310098940.4A 2013-03-26 2013-03-26 一种识别的方法及电子设备 Active CN104078045B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310098940.4A CN104078045B (zh) 2013-03-26 2013-03-26 一种识别的方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310098940.4A CN104078045B (zh) 2013-03-26 2013-03-26 一种识别的方法及电子设备

Publications (2)

Publication Number Publication Date
CN104078045A CN104078045A (zh) 2014-10-01
CN104078045B true CN104078045B (zh) 2017-05-24

Family

ID=51599268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310098940.4A Active CN104078045B (zh) 2013-03-26 2013-03-26 一种识别的方法及电子设备

Country Status (1)

Country Link
CN (1) CN104078045B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469553A (zh) * 2015-08-13 2017-03-01 中兴通讯股份有限公司 语音识别方法及装置
CN107526951A (zh) * 2016-06-21 2017-12-29 深圳市中兴微电子技术有限公司 一种信息发送方法及装置
CN106297790A (zh) * 2016-08-22 2017-01-04 深圳市锐曼智能装备有限公司 机器人的声纹服务系统及其服务控制方法
CN107707721B (zh) * 2017-11-06 2020-11-24 Oppo广东移动通信有限公司 移动终端的录音方法、装置、存储介质及移动终端
CN107833576A (zh) * 2017-11-17 2018-03-23 哈尔滨工大服务机器人有限公司 一种具有中间服务器的语义处理方法及系统
CN108228742B (zh) * 2017-12-15 2021-10-22 深圳市商汤科技有限公司 人脸查重方法和装置、电子设备、介质、程序
CN108763209B (zh) * 2018-05-22 2022-04-05 创新先进技术有限公司 一种特征提取和风险识别的方法、装置及设备
CN110931018A (zh) * 2019-12-03 2020-03-27 珠海格力电器股份有限公司 智能语音交互的方法、装置及计算机可读存储介质
CN113225327A (zh) * 2021-04-29 2021-08-06 心动网络股份有限公司 基于语音识别的登录客户监督方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920946A (zh) * 2005-07-01 2007-02-28 伯斯有限公司 汽车接口
CN101635743A (zh) * 2009-04-02 2010-01-27 浙江亚斯特科技有限公司 使用生物特征认证结果确认移动终端持有者身份的系统和方法
CN101833843A (zh) * 2009-03-13 2010-09-15 新奥特硅谷视频技术有限责任公司 一种基于声纹认证的监控系统
CN102316162A (zh) * 2011-09-01 2012-01-11 深圳市子栋科技有限公司 基于语音命令的车辆远程控制方法、装置及系统
CN102779509A (zh) * 2011-05-11 2012-11-14 联想(北京)有限公司 语音处理设备和语音处理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6760705B2 (en) * 2001-05-31 2004-07-06 Motorola, Inc. Virtual speech interface system and method of using same
US20060122834A1 (en) * 2004-12-03 2006-06-08 Bennett Ian M Emotion detection device & method for use in distributed systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920946A (zh) * 2005-07-01 2007-02-28 伯斯有限公司 汽车接口
CN101833843A (zh) * 2009-03-13 2010-09-15 新奥特硅谷视频技术有限责任公司 一种基于声纹认证的监控系统
CN101635743A (zh) * 2009-04-02 2010-01-27 浙江亚斯特科技有限公司 使用生物特征认证结果确认移动终端持有者身份的系统和方法
CN102779509A (zh) * 2011-05-11 2012-11-14 联想(北京)有限公司 语音处理设备和语音处理方法
CN102316162A (zh) * 2011-09-01 2012-01-11 深圳市子栋科技有限公司 基于语音命令的车辆远程控制方法、装置及系统

Also Published As

Publication number Publication date
CN104078045A (zh) 2014-10-01

Similar Documents

Publication Publication Date Title
CN104078045B (zh) 一种识别的方法及电子设备
CN107147618A (zh) 一种用户注册方法、装置及电子设备
CN107623614A (zh) 用于推送信息的方法和装置
US20180152163A1 (en) Noise control method and device
CN108335695A (zh) 语音控制方法、装置、计算机设备和存储介质
CN109313903A (zh) 语音用户接口
CN112863547A (zh) 虚拟资源转移处理方法、装置、存储介质及计算机设备
EP4099709A1 (en) Data processing method and apparatus, device, and readable storage medium
CN103391347A (zh) 一种自动录音的方法及装置
CN108766438A (zh) 人机交互方法、装置、存储介质及智能终端
US9774743B2 (en) Silence signatures of audio signals
CN103716309A (zh) 一种安全认证方法及终端
CN108521516A (zh) 用于终端设备的控制方法和装置
CN110335593A (zh) 语音端点检测方法、装置、设备及存储介质
CN106782498B (zh) 语音信息播放方法、装置及终端
CN111835522A (zh) 一种音频处理方法及装置
CN111580773A (zh) 信息处理方法、装置及存储介质
CN105357388B (zh) 一种信息推荐的方法及电子设备
CN108600559B (zh) 静音模式的控制方法、装置、存储介质及电子设备
WO2016124008A1 (zh) 一种语音控制方法、装置及系统
CN107154996B (zh) 来电拦截方法、装置、存储介质及终端
CN109615731A (zh) 一种基于人脸识别的音频输出方法
CN115118820A (zh) 一种通话处理方法、装置、计算机设备及存储介质
CN110197663B (zh) 一种控制方法、装置及电子设备
WO2017016027A1 (zh) 连接建立方法、连接建立装置和通信系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant