CN104183237B - 用于便携式终端的语音处理方法及装置 - Google Patents

用于便携式终端的语音处理方法及装置 Download PDF

Info

Publication number
CN104183237B
CN104183237B CN201410450210.0A CN201410450210A CN104183237B CN 104183237 B CN104183237 B CN 104183237B CN 201410450210 A CN201410450210 A CN 201410450210A CN 104183237 B CN104183237 B CN 104183237B
Authority
CN
China
Prior art keywords
phonetic order
phonetic
clouds
collection
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410450210.0A
Other languages
English (en)
Other versions
CN104183237A (zh
Inventor
谢波
钟浩清
孙浩
朱举章
陈雪
杨格
吴泽武
林凯杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BAIDU INTERNATIONAL TECHNOLOGY (SHENZHEN) Co.,Ltd.
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410450210.0A priority Critical patent/CN104183237B/zh
Publication of CN104183237A publication Critical patent/CN104183237A/zh
Application granted granted Critical
Publication of CN104183237B publication Critical patent/CN104183237B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种用于便携式终端的语音处理方法及装置。所述语音处理方法包括:获取至少一条第一语音指令;将所述第一语音指令发送给云端;从云端下载第一语音指令集,所述第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合;根据下载的第一语音指令集更新本地的第二语音指令集。通过本发明提供一种用于便携式终端的语音处理方法及装置,实现扩大语音指令库的目的,有助于提高语音识别的命中率。

Description

用于便携式终端的语音处理方法及装置
技术领域
本发明涉及语音识别技术领域,尤其涉及一种用于便携式终端的语音处理方法及装置。
背景技术
说话的语序、语义及用词等因人而异,从而制约语音指令库的更新,而语音识别命中率依赖于语音指令库的完善度,导致语音识别受到了语音指令库的限制,使得语音识别命中率较低。
发明内容
本发明的目的在于提供一种用于便携式终端的语音处理方法及装置,通过便携式终端将其无法识别的语音指令上传给云端,云端基于上传的语音指令扩充指令库,便携式终端通过下载该语音指令库扩大本地语音指令集,从而无限地扩大语音指令集。
根据本发明的一方面,提供一种用于便携式终端的语音处理方法,包括:获取至少一条第一语音指令;将所述第一语音指令发送给云端;从云端下载第一语音指令集,所述第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合;根据下载的第一语音指令集更新本地的第二语音指令集。
根据本发明的一方面,提供一种语音处理方法,所述语音处理方法包括,在云端执行以下步骤:接收至少一条第一语音指令;对所述第一语音指令进行语义解析,获得文字数据;将所述文字数据匹配为文字指令;将所述第一语音指令和匹配的文字指令存储到指令库。
根据本发明的另一方面,提供一种用于语音处理的便携式终端,所述便携式终端包括:语音指令收集单元,用于获取至少一条第一语音指令;语音指令发送单元,用于将语音收集单元获取的第一语音指令发送给云端;更新指令集下载单元,用于从云端下载第一语音指令集,所述第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合;指令集更新单元,用于根据更新指令集下载单元下载的第一语音指令集更新本地的第二语音指令集。
根据本发明的另一方面,还提供一种云端的语音处理装置,所述语音处理装置包括:语音指令接收单元,用于接收至少一条语音指令;语音指令解析单元,用于对语音指令接收单元接收的语音指令进行语义解析,获得文字数据;指令匹配单元,用于将语音指令解析单元解析出的文字数据匹配为文字指令;指令存储单元,用于将所述语音指令和匹配的文字指令存储到指令库。
本发明的语音处理方法及装置,通过便携式终端收集语音指令,将该语音指令发送给云端,云端对该语音指令进行语义解析后更新至语音指令库,便携式终端通过下载更新后的语音指令库以更新本地语音指令库,从而可无限地扩大语音指令库,进而提高语音识别的命中率。
附图说明
图1为本发明实施例的便携式终端侧的语音处理方法的流程图。
图2为本发明实施例的云端的语音处理方法的流程图。
图3为本发明实施例的便携式终端的语音处理装置的结构框图。
图4为本发明实施例的云端的语音处理装置的结构框图。
具体实施方式
本发明的总体构思是,通过便携式终端收集其自身无法通过指令库识别的语音指令,将语音指令发送给云端;云端对该语音指令进行语义解析获得文字数据,将该文字数据匹配为文字指令,并将语音指令及匹配的文字指令存储至语音指令库;便携式终端通过下载该语音指令库更新本地的语音指令库,从而不断扩大和完善本地的语音指令库。
下面结合附图对本发明实施例一种用于便携式终端的语音处理方法及装置进行详细描述。
图1示出了本发明实施例的便携式终端侧的语音处理方法的流程图。
参照图1,在步骤S110,获取至少一条第一语音指令。所述第一语音指令通常可以是所述便携式终端无法识别或识别失败的语音指令。
在步骤S120,将在步骤S110获取的第一语音指令发送给云端。
便携式终端在执行语音识别的过程,将获取用户的语音信息,并将语音信息发送给云端。例如,用户在执行语音识别时,向便携式终端输入语音信息“今天温度怎么样”,便携式终端在接收到该语音信息后,将该语音信息“今天温度怎么样”发送给云端。
在步骤S130,从云端下载第一语音指令集,其中,第一语音指令集可包括第二语音指令及与其匹配的文字指令的集合。所述第二语音指令可以是在一段时间内从多个客户端发送给云端的第一语音指令。
云端在接收到便携式终端发送的语音信息后,将先对语音信息进行语音解析,将语音信息转换为文字数据信息,并对该文字数据信息匹配为文字指令。例如,便携式终端向云端发送“今天温度怎么样”的语音信息,云端将该信息转换为文字数据,“温度”通常意指“天气”,云端则将“温度”匹配为“天气”这一文字指令。
根据本发明的可选实施例,便携式终端可从云端接收用于更新语音指令集的通知,并且响应于从云端接收的更新语音指令集的通知,从云端下载所述第一语音指令集。本发明技术人员可以理解的是,便携式终端也可以主动访问云端,获取所述第一语音指令集,也可以在接收到通知后从云端下载所述第一语音指令集。
在步骤S140,根据在步骤S130下载的第一语音指令集更新本地的第二语音指令集。可选地,还将更新的第二语音指令集加载到内存。
由于每个便携式终端可上传其无法识别的语音指令,依赖云端进行语义解析等复杂运算并进行语音指令的更新,通过从云端下载基于多个终端更新的语音指令集,可无限地扩大本地语音指令库,提高便携式终端语音识别的命中率。
图2示出了本发明实施例的云端的语音处理方法的流程图。
参照图2,在步骤S210中,接收至少一条第一语音指令。
在步骤S220,将第一语音指令进行语义解析,获得文字数据。云端接收到便携式终端发送的语音信息后,将语音信息进行语义解析,把语音信息转换为文字数据信息。
在步骤S230,将文字数据匹配为文字指令。例如,响应于从便携式终端接收的语音信息“今天温度怎么样”,将该语音信息转为文字格式,“温度”通常意指“天气”,云端则将“温度”匹配为“天气”这一文字指令,可以理解为,“天气”为“温度”的文字指令。
在步骤S240,将第一语音指令与匹配的文字指令存储到指令库。
进一步地,云端生成包括在一段时间内新增的第一语音指令与匹配的文字指令的更新语音指令集,并向客户端广播用于更新指令集的通知,且响应于客户端的下载请求,将更新语音指令集发送给客户端,从而达到更新客户端指令库的目的。
通过本发明提供的语音处理方法,云端接收便携式终端不断搜集的语音信息,将语音信息发送给云端,通过云端语义解析处理及文字指令匹配,以实现扩大语音指令库的目的,进而提高语音识别命中率,增强用户体验。
本发明的另一方面,还提供一种应用上述语音处理方法的语音处理装置。
图3示出了本发明实施例的便携式终端的语音处理装置的结构框图。
参照图3,本发明实施例的便携式终端的语音处理装置包括:语音指令收集单元310、语音指令发送单元320、指令集下载单元330以及指令集更新单元340。
语音指令收集单元310用于获取至少一条第一语音指令。
语音指令发送单元320将语音指令收集单元310获取的第一语音指令发送给云端。
更新指令集下载单元330,用于从云端下载第一语音指令集,其中,第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合。
具体地,便携式终端还包括更新通知接收单元,用于从云端接收更新语音指令集的通知,并将该通知发送至更新指令集下载单元330,更新指令集下载单元330响应于该通知,从云端下载第一语音指令集。
指令集更新单元340,用于根据更新指令集下载单元下载的第一语音指令集更新本地的第二语音指令集。进一步地,指令集更新单元340将更新的第二指令集加载到便携式终端的内存。
图4示出了本发明实施例的云端的语音处理装置的结构框图。
参照图4,本发明实施例的云端的语音处理装置包括:语音指令接收单元410、语音指令解析单元420、指令匹配单元430以及指令存储单元440。
语音指令接收单元410用于接收至少一条语音指令。语音指令接收单元410接收自便携式终端发送的语音指令,并将该语音指令发送至语音指令解析单元420。
语音指令解析单元420对语音指令接收单元接收410的语音指令进行语义解析,获得文字数据。语音指令解析单元420将接收的语音指令转换为文字数据信息,并将该文字数据信息发送给指令匹配单元430。
指令匹配单元430将语音指令解析单元420解析出的文字数据匹配为文字指令。例如,指令匹配单元430响应于从语音指令解析单元420接收的文字数据信息“今天温度怎么样”,“温度”通常意指“天气”,指令匹配单元430则将“温度”匹配为“天气”这一文字指令,可以理解为,“天气”为“温度”的文字指令。
指令存储单元440将语音指令和匹配的文字指令存储到指令库。
进一步地,云端的语音处理装置还包括更新指令集生成单元和更新通知发送单元。其中,更新指令集生成单元用于包括在一段时间内新增的语音指令和匹配的文字指令的更新语音指令集;更新通知发送单元,用于向各个客户端广播用于更新语音指令集的通知。
更进一步地,云端的语音处理装置还包括更新指令集发送单元,其用于响应于客户端的下载请求,将更新语音指令集发送给客户端。
本发明的语音处理方法及装置,通过便携式终端收集语音指令,将该语音指令发送给云端,云端对该语音指令进行语义解析后更新至语音指令库,便携式终端通过下载更新后的语音指令库以更新本地语音指令库,从而可无限地扩大语音指令库,有助于提高语音识别的命中率。
需要指出,根据实施的需要,可将本申请中描述的各个步骤拆分为更多步骤,也可将两个或多个步骤或者步骤的部分操作组合成新的步骤,以实现本发明的目的。
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (14)

1.一种用于便携式终端的语音处理方法,其特征在于,所述语音处理方法包括:
获取至少一条第一语音指令;
将所述第一语音指令发送给云端;
从云端下载第一语音指令集,所述第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合,所述第二语音指令至少包括所述第一语音指令;
根据下载的第一语音指令集更新本地的第二语音指令集。
2.根据权利要求1所述的语音处理方法,其特征在于,所述语音处理方法还包括:从云端接收更新语音指令集的通知。
3.根据权利要求2所述的语音处理方法,其特征在于,所述从云端下载第一语音指令集的步骤包括:
响应于从云端接收的更新语音指令集的通知,从云端下载所述第一语音指令集。
4.根据权利要求1~3中任一项所述的语音处理方法,其特征在于,所述语音处理方法还包括:将更新的第二语音指令集加载到内存。
5.一种语音处理方法,其特征在于,所述语音处理方法包括,在云端执行以下步骤:
接收至少一条第一语音指令;
对所述第一语音指令进行语义解析,获得文字数据;
将所述文字数据匹配为文字指令;
将所述第一语音指令和匹配的文字指令存储到指令库;
生成包括在一段时间内新增的第一语音指令和匹配的文字指令的更新语音指令集。
6.根据权利要求5所述的语音处理方法,其特征在于,所述语音处理方法还包括:
向各个客户端广播用于更新语音指令集的通知。
7.根据权利要求6所述的语音处理方法,其特征在于,响应于客户端的下载请求,将所述更新语音指令集发送给所述客户端。
8.一种用于语音处理的便携式终端,其特征在于,所述便携式终端包括:
语音指令收集单元,用于获取至少一条第一语音指令;
语音指令发送单元,用于将语音指令收集单元获取的第一语音指令发送给云端;
更新指令集下载单元,用于从云端下载第一语音指令集,所述第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合,所述第二语音指令至少包括所述第一语音指令;
指令集更新单元,用于根据更新指令集下载单元下载的第一语音指令集更新本地的第二语音指令集。
9.根据权利要求8所述的便携式终端,其特征在于,所述便携式终端还包括:
更新通知接收单元,用于从云端接收更新语音指令集的通知。
10.根据权利要求9所述的便携式终端,其特征在于,更新指令集下载单元响应于更新通知接收单元从云端接收的更新语音指令集的通知,从云端下载所述第一语音指令集。
11.根据权利要求8~10中任一项所述的便携式终端,其特征在于,指令集更新单元还用于将更新的第二语音指令集加载到内存。
12.一种云端的语音处理装置,其特征在于,所述语音处理装置包括:
语音指令接收单元,用于接收至少一条语音指令;
语音指令解析单元,用于对语音指令接收单元接收的语音指令进行语义解析,获得文字数据;
指令匹配单元,用于将语音指令解析单元解析出的文字数据匹配为文字指令;
指令存储单元,用于将所述语音指令和匹配的文字指令存储到指令库;
更新指令集生成单元,用于生成包括在一段时间内新增的语音指令和匹配的文字指令的更新语音指令集。
13.根据权利要求12所述的语音处理装置,其特征在于,所述语音处理装置还包括:
更新通知发送单元,用于向各个客户端广播用于更新语音指令集的通知。
14.根据权利要求13所述的语音处理装置,其特征在于,所述语音处理装置还包括:
更新指令集发送单元,用于响应于客户端的下载请求,将所述更新语音指令集发送给所述客户端。
CN201410450210.0A 2014-09-04 2014-09-04 用于便携式终端的语音处理方法及装置 Active CN104183237B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410450210.0A CN104183237B (zh) 2014-09-04 2014-09-04 用于便携式终端的语音处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410450210.0A CN104183237B (zh) 2014-09-04 2014-09-04 用于便携式终端的语音处理方法及装置

Publications (2)

Publication Number Publication Date
CN104183237A CN104183237A (zh) 2014-12-03
CN104183237B true CN104183237B (zh) 2017-10-31

Family

ID=51964227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410450210.0A Active CN104183237B (zh) 2014-09-04 2014-09-04 用于便携式终端的语音处理方法及装置

Country Status (1)

Country Link
CN (1) CN104183237B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825848A (zh) * 2015-01-08 2016-08-03 宇龙计算机通信科技(深圳)有限公司 一种语音识别方法、装置及终端
CN106156022B (zh) * 2015-03-23 2020-02-21 联想(北京)有限公司 一种信息处理方法及电子设备
CN105006228A (zh) * 2015-06-05 2015-10-28 普天智能照明研究院有限公司 一种语音识别方法
CN107545892B (zh) * 2016-06-24 2021-07-30 中兴通讯股份有限公司 设备的控制方法、装置及系统
CN106598538B (zh) * 2016-11-29 2020-02-11 泰山信息科技有限公司 指令集合更新方法及系统
CN106778927A (zh) * 2016-12-30 2017-05-31 深圳Tcl新技术有限公司 更新电视语义识别词库方法及装置
CN107134279B (zh) * 2017-06-30 2020-06-19 百度在线网络技术(北京)有限公司 一种语音唤醒方法、装置、终端和存储介质
CN107564517A (zh) 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 语音唤醒方法、设备及系统、云端服务器与可读介质
CN107745384A (zh) * 2017-10-20 2018-03-02 高井云 一种双臂协作机器人
CN108665900B (zh) 2018-04-23 2020-03-03 百度在线网络技术(北京)有限公司 云端唤醒方法及系统、终端以及计算机可读存储介质
CN108597522B (zh) * 2018-05-10 2021-10-15 北京奇艺世纪科技有限公司 一种语音处理方法及装置
CN108961734A (zh) * 2018-07-24 2018-12-07 珠海格力电器股份有限公司 红外语义处理方法、装置及系统
CN112331197A (zh) * 2020-08-03 2021-02-05 北京京东尚科信息技术有限公司 电子设备的响应方法、响应装置、计算机系统及存储介质
CN113362820A (zh) * 2021-05-26 2021-09-07 北京奇艺世纪科技有限公司 语音信息响应方法、装置、电子设备和存储介质
CN113823284B (zh) * 2021-09-24 2023-10-24 浪潮金融信息技术有限公司 一种基于云计算设置语音助手指令的系统、方法及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103839549A (zh) * 2012-11-22 2014-06-04 腾讯科技(深圳)有限公司 一种语音指令控制方法及系统
CN103956168A (zh) * 2014-03-29 2014-07-30 深圳创维数字技术股份有限公司 一种语音识别方法、装置及终端

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
CN103218705A (zh) * 2012-01-19 2013-07-24 联想(北京)有限公司 一种日程提醒方法和装置
CN102629246B (zh) * 2012-02-10 2017-06-27 百纳(武汉)信息技术有限公司 识别浏览器语音命令的服务器及浏览器语音命令识别方法
CN103516915A (zh) * 2012-06-27 2014-01-15 百度在线网络技术(北京)有限公司 在移动终端通话过程中敏感词汇的替换方法、系统及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103839549A (zh) * 2012-11-22 2014-06-04 腾讯科技(深圳)有限公司 一种语音指令控制方法及系统
CN103956168A (zh) * 2014-03-29 2014-07-30 深圳创维数字技术股份有限公司 一种语音识别方法、装置及终端

Also Published As

Publication number Publication date
CN104183237A (zh) 2014-12-03

Similar Documents

Publication Publication Date Title
CN104183237B (zh) 用于便携式终端的语音处理方法及装置
US11991194B2 (en) Cognitive neuro-linguistic behavior recognition system for multi-sensor data fusion
CN105786993B (zh) 应用程序的功能插件推荐方法及装置
CN109857908B (zh) 用于匹配视频的方法和装置
US10158733B2 (en) Automated DPI process
CN110263916B (zh) 数据处理方法和装置、存储介质及电子装置
US20230224226A1 (en) Methods and Apparatus Relating to Machine-Learning in a Communications Network
CN112053692B (zh) 语音识别处理方法、装置及存储介质
CN105893075A (zh) 应用程序的更新方法及装置
CN104915359B (zh) 主题标签推荐方法及装置
CN110209809B (zh) 文本聚类方法和装置、存储介质及电子装置
CN103440243A (zh) 一种教学资源推荐方法及其装置
CN109558600B (zh) 翻译处理方法及装置
CN110929141B (zh) 团伙挖掘方法、装置、设备及存储介质
CN112532507B (zh) 用于呈现表情图像、用于发送表情图像的方法和设备
CN109753424B (zh) Ab测试的方法和装置
EP3009942A1 (en) Social contact message monitoring method and device
CN107526758B (zh) 消息推送方法和装置
CN109543154B (zh) 表格数据的类型转换方法、装置、存储介质及电子设备
CN103475532A (zh) 硬件检测方法和系统
US20170013430A1 (en) User classification method, apparatus, and server
CN108616413B (zh) 信息校准方法和装置
CN112765981A (zh) 一种文本信息的生成方法和装置
CN112749543A (zh) 一种信息解析过程的匹配方法、装置、设备及存储介质
CN106778927A (zh) 更新电视语义识别词库方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200427

Address after: 518000 301, floor 3, unit D, productivity building, No. 5, Gaoxin Middle Road, Science Park, Nanshan District, Shenzhen City, Guangdong Province

Co-patentee after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Patentee after: BAIDU INTERNATIONAL TECHNOLOGY (SHENZHEN) Co.,Ltd.

Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three

Patentee before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right