具体实施方式
本发明的总体构思是,通过便携式终端收集其自身无法通过指令库识别的语音指令,将语音指令发送给云端;云端对该语音指令进行语义解析获得文字数据,将该文字数据匹配为文字指令,并将语音指令及匹配的文字指令存储至语音指令库;便携式终端通过下载该语音指令库更新本地的语音指令库,从而不断扩大和完善本地的语音指令库。
下面结合附图对本发明实施例一种用于便携式终端的语音处理方法及装置进行详细描述。
图1示出了本发明实施例的便携式终端侧的语音处理方法的流程图。
参照图1,在步骤S110,获取至少一条第一语音指令。所述第一语音指令通常可以是所述便携式终端无法识别或识别失败的语音指令。
在步骤S120,将在步骤S110获取的第一语音指令发送给云端。
便携式终端在执行语音识别的过程,将获取用户的语音信息,并将语音信息发送给云端。例如,用户在执行语音识别时,向便携式终端输入语音信息“今天温度怎么样”,便携式终端在接收到该语音信息后,将该语音信息“今天温度怎么样”发送给云端。
在步骤S130,从云端下载第一语音指令集,其中,第一语音指令集可包括第二语音指令及与其匹配的文字指令的集合。所述第二语音指令可以是在一段时间内从多个客户端发送给云端的第一语音指令。
云端在接收到便携式终端发送的语音信息后,将先对语音信息进行语音解析,将语音信息转换为文字数据信息,并对该文字数据信息匹配为文字指令。例如,便携式终端向云端发送“今天温度怎么样”的语音信息,云端将该信息转换为文字数据,“温度”通常意指“天气”,云端则将“温度”匹配为“天气”这一文字指令。
根据本发明的可选实施例,便携式终端可从云端接收用于更新语音指令集的通知,并且响应于从云端接收的更新语音指令集的通知,从云端下载所述第一语音指令集。本发明技术人员可以理解的是,便携式终端也可以主动访问云端,获取所述第一语音指令集,也可以在接收到通知后从云端下载所述第一语音指令集。
在步骤S140,根据在步骤S130下载的第一语音指令集更新本地的第二语音指令集。可选地,还将更新的第二语音指令集加载到内存。
由于每个便携式终端可上传其无法识别的语音指令,依赖云端进行语义解析等复杂运算并进行语音指令的更新,通过从云端下载基于多个终端更新的语音指令集,可无限地扩大本地语音指令库,提高便携式终端语音识别的命中率。
图2示出了本发明实施例的云端的语音处理方法的流程图。
参照图2,在步骤S210中,接收至少一条第一语音指令。
在步骤S220,将第一语音指令进行语义解析,获得文字数据。云端接收到便携式终端发送的语音信息后,将语音信息进行语义解析,把语音信息转换为文字数据信息。
在步骤S230,将文字数据匹配为文字指令。例如,响应于从便携式终端接收的语音信息“今天温度怎么样”,将该语音信息转为文字格式,“温度”通常意指“天气”,云端则将“温度”匹配为“天气”这一文字指令,可以理解为,“天气”为“温度”的文字指令。
在步骤S240,将第一语音指令与匹配的文字指令存储到指令库。
进一步地,云端生成包括在一段时间内新增的第一语音指令与匹配的文字指令的更新语音指令集,并向客户端广播用于更新指令集的通知,且响应于客户端的下载请求,将更新语音指令集发送给客户端,从而达到更新客户端指令库的目的。
通过本发明提供的语音处理方法,云端接收便携式终端不断搜集的语音信息,将语音信息发送给云端,通过云端语义解析处理及文字指令匹配,以实现扩大语音指令库的目的,进而提高语音识别命中率,增强用户体验。
本发明的另一方面,还提供一种应用上述语音处理方法的语音处理装置。
图3示出了本发明实施例的便携式终端的语音处理装置的结构框图。
参照图3,本发明实施例的便携式终端的语音处理装置包括:语音指令收集单元310、语音指令发送单元320、指令集下载单元330以及指令集更新单元340。
语音指令收集单元310用于获取至少一条第一语音指令。
语音指令发送单元320将语音指令收集单元310获取的第一语音指令发送给云端。
更新指令集下载单元330,用于从云端下载第一语音指令集,其中,第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合。
具体地,便携式终端还包括更新通知接收单元,用于从云端接收更新语音指令集的通知,并将该通知发送至更新指令集下载单元330,更新指令集下载单元330响应于该通知,从云端下载第一语音指令集。
指令集更新单元340,用于根据更新指令集下载单元下载的第一语音指令集更新本地的第二语音指令集。进一步地,指令集更新单元340将更新的第二指令集加载到便携式终端的内存。
图4示出了本发明实施例的云端的语音处理装置的结构框图。
参照图4,本发明实施例的云端的语音处理装置包括:语音指令接收单元410、语音指令解析单元420、指令匹配单元430以及指令存储单元440。
语音指令接收单元410用于接收至少一条语音指令。语音指令接收单元410接收自便携式终端发送的语音指令,并将该语音指令发送至语音指令解析单元420。
语音指令解析单元420对语音指令接收单元接收410的语音指令进行语义解析,获得文字数据。语音指令解析单元420将接收的语音指令转换为文字数据信息,并将该文字数据信息发送给指令匹配单元430。
指令匹配单元430将语音指令解析单元420解析出的文字数据匹配为文字指令。例如,指令匹配单元430响应于从语音指令解析单元420接收的文字数据信息“今天温度怎么样”,“温度”通常意指“天气”,指令匹配单元430则将“温度”匹配为“天气”这一文字指令,可以理解为,“天气”为“温度”的文字指令。
指令存储单元440将语音指令和匹配的文字指令存储到指令库。
进一步地,云端的语音处理装置还包括更新指令集生成单元和更新通知发送单元。其中,更新指令集生成单元用于包括在一段时间内新增的语音指令和匹配的文字指令的更新语音指令集;更新通知发送单元,用于向各个客户端广播用于更新语音指令集的通知。
更进一步地,云端的语音处理装置还包括更新指令集发送单元,其用于响应于客户端的下载请求,将更新语音指令集发送给客户端。
本发明的语音处理方法及装置,通过便携式终端收集语音指令,将该语音指令发送给云端,云端对该语音指令进行语义解析后更新至语音指令库,便携式终端通过下载更新后的语音指令库以更新本地语音指令库,从而可无限地扩大语音指令库,有助于提高语音识别的命中率。
需要指出,根据实施的需要,可将本申请中描述的各个步骤拆分为更多步骤,也可将两个或多个步骤或者步骤的部分操作组合成新的步骤,以实现本发明的目的。
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。