WO2014177015A1

WO2014177015A1 - 一种移动终端的语音识别方法及其装置

Info

Publication number: WO2014177015A1
Application number: PCT/CN2014/076180
Authority: WO
Inventors: 罗永浩
Original assignee: 锤子科技（北京）有限公司
Priority date: 2013-05-02
Filing date: 2014-04-25
Publication date: 2014-11-06
Also published as: US20160098991A1; US9502035B2; CN103280217B; CN103280217A

Abstract

一种移动终端的语音识别方法和装置，以提高语音识别的效率和准确性。该方法包括：接收对移动终端进行操作的待操作的操作类别的触发消息，所述操作类别为根据移动终端的业务功能划分的类别（S101）；接收语音关键词信息，从语音关键词信息中确定语音关键词（S102）；根据语音关键词检索所述待操作的操作类别项下的关键词库，返回检索结果（S103）。

Description

一种移动终端的语音识別方法及其裝置本申请要求于 2013 年 5 月 2 日提交中国国家知识产权局、申请号为 201310157943.0、发明名称为 "一种移动终端的语音识别方法及其装置" 的中国专利申请的优先权，该在先申请的全部内容通过 )用结合在本申请中。技术领域本申请涉及信息处理技术领域，特别涉及一种基于移动终端的语音识别方法及其对应的装置。

背景技术移动终端的使用离不开人机交互过程。在智能移动终端中比较常见的人机交互方式是通过手指触摸移动终端的屏幕，由移动终端内置的感应器感应手指的触压信息实现交互。随着苹果公司在 iPhone系列产品中加入 Siri语音助手功能后，人机交互方式由传统的物理触摸变化为语音控制，即通过人的语言来指令移动终端满足用户需要达成的任务。该语音识别过程允许用户随意以自然语言形式向语音助手类软件给出指令，移动终端的相关装置接收到该指令后，由语音助手类软件在本地和 /或云端服务器进行语音识别和语义分析，并根据识别和分析的结果给予反馈。

然而，由于现有语音识别，特别是语义分析方面的技术不完善，识别准确率较低，尤其对于多词、长句、多句的识别和分析错误率相当高，识别和分析的结果经常与用户真正的需要大相径庭，用户需要反复输入、不断修订识别和分析的结果，严重影响了基于移动终端的语音识别方法识别的准确性和快捷性。

发明内容

为解决上述技术问题，本申请实施例提供了一种移动终端的语音识别方法及其对应装置，以提高基于移动终端的语音识别的准确性和快捷性。

本申请提供的移动终端的语音识别方法包括：

接收对移动终端进行操作的待操作的操作类别的触发消息，所述操作类别为才艮据移动终端的业务功能划分的类别；

接收语音关键词信息，从语音关键词信息中确定语音关键词，根据语音关键词检索所述待操作类别项下的关键词库，返回检索结果。

优选地，所述接收对移动终端进行操作的待操作的操作类别的触发消息具体包括：

在移动终端屏幕上呈现操作类别窗口，当所述操作类别窗口中的一个操作类别对应的标签被点击或确定为焦点时，确定接收到对移动终端进行操作的待操作的操作类别的触发消息。

进一步优选地，所述操作类别窗口中的操作类别对应的标签包括用于实现通信业务功能的联系人标签、用于实现应用业务功能的应用程序标签、用于实现音乐播放业务功能的音乐标签和 /或用于实现在线搜索业务功能的网页搜索标签。

优选地，所述接收对移动终端进行操作的待操作类别的触发消息具体包括：

判断第一监听器监听到的 Z轴上的重力加速度分量是否在 0至 4个重力加速度单位范围内， X、 Y轴上的重力加速度分量是否在 4到 10个重力加速度单位范围内，且第二监听器监听到的距离是否为零，所述 X、 Y轴为移动终端面板所在的平面，所述 Z轴垂直于 X、 Y轴构成的平面，所述第一监听器为接收到传感器服务后注册的对重力传感器的监听器，所述第二监听器为接收到传感器服务器后注册的对距离传感器的监听器；如果均为是，则确定接收到对移动终端进行操作的待操作类别的触发消息，所述操作类别为联系人；则所述接收语音关键词信息，从语音关键词信息中确定语音关键词，根据语音关键词检索所述待操作类别项下的关键词库，返回检索结果包括：

接收包含联系人的语音关键词信息，从语音关键词信息中确定出联系人关键词，根据所述联系人关键词检索联系人库，返回检索到的联系人并呼叫该联系人。

进一步优选地，当根据所述联系人关键词检索到的联系人包括多个时，对每个联系人进行编号，接收编号语音信息，呼叫编号语音信息对应的联系人。

优选地，当移动终端被操作后，增加所述操作在其操作类别项下的关键词库中对应的关键词的频次，则在根据语音关键词检索待操作项下的关键词库时，按照关键词频次由大到小的顺序检索关键词库。优选地，当移动终端被操作后，在满足预设条件时根据所述操作结果对操作类别项下的语音关键词库进行更新。

本申请提供的移动终端的语音识别装置包括：触发消息接收单元、语音关键词信息接收单元、语音关键词识别单元和关键词库检索单元，其中：

所述触发消息接收单元，用于接收对移动终端进行操作的待操作类别的触发消息，所述操作类别为根据移动终端的业务功能划分的类别；

所述语音关键词信息接收单元，用于接收语音关键词信息；

所述语音关键词识别单元，用于从语音关键词信息中确定语音关键词；所述关键词库检索单元，用于根据语音关键词检索所述待操作类别项下的关键词库，返回检索结果。

优选地，所述触发消息接收单元具体包括：操作类别窗口呈现子单元和触发消息接收子单元，其中：

所述操作类别窗口呈现子单元，用于在移动终端屏幕上呈现操作类别窗口；

所述触发消息接收子单元，用于在所述操作类别窗口中的一个操作类别对应的标签被点击或确定为焦点时，接收到对移动终端进行操作的待操作类别的触发消息。

优选地，所述触发消息接收单元具体包括：监听结果判断子单元和触发消息接收子单元，其中：

所述监听结果判断子单元，用于判断第一监听器监听到的 Z轴上的重力加速度分量是否在 0至 4个重力加速度单位范围内， X、 Y轴上的重力加速度分量是否在 4至 10个重力加速度单位范围内，且第二监听器监听到的距离是否为零，所述 X、 Y轴为移动终端面板所在的平面，所述 Z轴垂直于 X、 Y轴构成的平面，所述第一监听器为接收到传感器服务后注册的对重力传感器的监听器，所述第二监听器为接收到传感器服务器后注册的对距离传感器的监听器；所述触发消息接收子单元，用于在判断结果均为是时，确定接收到对移动终端进行操作的待操作类别的触发消息，所述操作类别为联系人；

所述语音关键词信息接收单元具体用于接收包含联系人的语音关键词信息，所述语音关键词识别单元具体用于从语音关键词信息中确定出联系人关键词，所述关键词检索单元具体用于根据所述联系人关键词检索联系人库，返回检索到的联系人；

所述装置还包括呼叫单元，用于呼叫所述检索到的联系人。

进一步优选地，所述装置还包括联系人编号单元和编号语音信息接收单元，其中：所述联系人编号单元，用于在根据所述联系人关键词检索到的联系人包括多个时，对每个联系人进行编号；所述编号语音信息接收单元，用于接收编号语音信息，所述呼叫单元具体用于呼叫编号语音信息对应的联系人。

优选地，所述装置还包括关键词频次增加单元，用于在移动终端被操作后，增加所述操作在其操作类别项下的关键词库中对应的关键词的频次，则所述关键词库检索单元具体用于在根据语音关键词检索待操作项下的关键词库时，按照关键词频次由大到小的顺序检索关键词库。

优选地，所述装置还包括关键词更新单元，用于在移动终端被操作后，在满足预设条件时根据所述操作结果对操作类别项下的关键词库进行更新。

本申请实施例接收到依据移动终端业务功能划分的某个操作类别的触发消息后，接收语音关键词信息，从语音关键词中确定语音关键词，然后根据语音关键词检索相应的关键词库，并返回检索结果。与现有的语音识别技术相比，本申请实施例由于根据业务功能对操作类别进行了划分，使关键词库仅仅与每个操作类别对应，一方面根据语音关键词检索时检索处理对象仅限于与对移动终端的操作相对应的关键词库，减少了处理对象的数量，适应了移动终端的处理能力较弱的特点；又一方面，检索涉及的处理对象的数量减少使检索过程的时间缩短，从而提高了语音识别的效率；再一方面，检索涉及的处理对象的数量减少使出现关键词的重复和二义性的概率降低，从而提高了语音识别的准确性。而且，本申请实施例在接收语音信息时以语音关键词信息的形式接收，不再是普通的自然语言，避免了多词、长句和多句，一方面更加容易从语音信息中提取出关键词，进而提高了语音识别的效率；另一方面通过从语音关键词信息中提取的关键词与关键词库匹配来获取返回结果，有利于提高语音识别的准确性。

附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案，以下将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，以下描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员而言，还可以根据这些附图所示实施例得到其它的实施例及其附图。

图 1为本申请的移动终端的语音识别方法的一个实施例的流程图；图 2为本申请的移动终端的语音识别装置的一个实施例的结构框图。

具体实施方式为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

参见图 1 , 该图示出了本申请的移动终端的语音识别方法的实施例的流程。该流程包括：

步骤 S101 : 接收对操作移动终端的待操的操作类别的触发消息，所述操作类别为根据移动终端的业务功能划分的类别；

随着信息技术的发展，移动终端不仅单单具有传统的通信功能，而且还具有许多新的业务功能，比如，网络检索、播放音视频、玩游戏等。这些不同的业务功能的性质存在差别，移动终端使用者实现各个业务功能的操作方式、操作指令各具特色。尽管如此，实现同一个业务功能的各种操作通常具有共性，本实施例依据业务功能的不同预先对移动终端的各种可能的操作进行类别划分。通过这种操作类别的划分使后续的语音识别过程具有明确针对性。本实施例不限定划分出来的操作类别数量和类型，只要能够满足实际应用需要即可。比如，可以根据移动终端本身的业务功能和移动终端使用者的使用范围划分出如下的类别：联系人类别，用于存储联系人的姓名、电话号码、个人特征等信息，在语音识别出某个联系人时可以查看到该联系人的有关信息，可以呼叫该联系人、给该联系人发送短信等；应用程序类别，用于记载应用程序的程序名、图标、存储位置等与应用程序相关的信息，在语音识别出某个应用程序时可以查看该应用程序的基本属性信息，可以对该应用程序进行各种操作：启动、卸载、删除、更新等；音乐类别，用于记载音乐名、歌手名、专辑名等相关信息，在语音识别出某个音乐时可以查看关于该音乐的基本属性信息，可以对该音乐进行各种操作：播放、移动、删除等；网页搜索类别，用于实现网页搜索功能。

步骤 S102: 接收语音关键词信息，从语音关键词信息中确定语音关键词；移动终端使用者如果需要使用语音实现对移动终端的某些控制、操作，可以启动语音识别引擎，使其处于工作状态，当需要进行语音识别时，通过语音识别引擎接收语音关键词信息。本实施例接收的语音信息是包含以关键词为主题的语音内容，可以不是一般的包含完整句意的自然语言。比如，如果需要向张某某打电话，现有技术的语音是： "给张某某打电话"，而在本实施例的情形下，当确定操作类别信息为 "联系人" 时，则可以直接说出 "张某某"，即只需要给出操作的关键词，便能控制移动终端实现相应的操作。

接收到语音关键词信息后，需要从语音关键词信息中确定出语音关键词。移动终端使用者的语音信息通常不能非常精确地仅仅是语音关键词，比如，可能包括一些过渡音、语气音等，这些语音对于语音识别而言属于噪声，需要从语音关键词信息中将其去掉，从中提取出语音关键词，该语音关键词直接对应于关键词库中的某个关键词，进而对应着某个操作命令。

步骤 S103: 根据语音关键词检索所述待操作的操作类别项下的关键词库，返回检索结果；

通过前述步骤确定出语音关键词后，利用该关键词在待操作的操作类别对应的关键词库中进行检索，并返回检索结果。在获取到检索结果后，可以触发该检索结果执行对移动终端的相应操作。

需要说明的是：本实施例中的步骤 S101和 S102在实际运行过程中可以并行运行或者 S102步骤在前 S101步骤在后，即移动终端的使用者可以如前所述的先触发待操作的操作类别，然后再接收用户输入的语音关键词；也可以先接收用户的语音关键词，在接收用户对待操作的操作类别的触发，或者在接收对待操作的操作类别的触发时也接收语音关键词信息，这两者之间的执行时序并不影响本申请发明目的的实现，根据应用需要，可以选择其中合适的方式。

本实施例接收到依据移动终端业务功能划分的某个操作类别的触发消息后，接收语音关键词信息，从语音关键词中确定语音关键词，然后根据语音关键词检索相应的关键词库，并返回检索结果。与现有的语音识别技术相比，本申请实施例可以取得如下的技术效果：

( 1 ) 由于根据业务功能对操作类别进行了划分，使关键词库仅仅与每个操作类别对应，这不同于现有的语音识别使用的包含具有各种不同操作性质、方式的全部语音识别库，从而使根据语音关键词检索时检索处理对象仅限于与将要对移动终端进行的操作相对应的关键词库的范围，减少了处理对象的数量，适应了移动终端的处理能力较弱的特点。比如，现有语音识别库包含 100 个语音操作指令，本实施例对该 100个语音操作指令进行了类别划分，将其中用于实现 "联系人" 功能的指令归于一个类别，该类别包括 10个语音操作指令，当移动终端使用者仅需要进行联系人功能时，它将触发在该类别下进行语音的检索识别，即只需要在这 10个语音操作指令内进行检索，因此，处理的数量大大减少。

( 2 ) 由于检索涉及的处理对象的数量减少，在移动终端的处理能力不变的情况下，完成检索过程的时间将大为缩短，在较短的时间内即可给出与用户输入的语音关键词相对应的检索结果，从而提高了语音识别的效率。仍以前例进行说明，假设检索每个语音操作指令的时间是 0.01s, 用户说出的一个语音词的位置位于第 80位，按照现有的语音识别方式，将在上述的 100个语音操作指令库中进行 80次检索匹配后才能找到该语音操作指令，用时为 0.8s, 但是如果将检索匹配操作限制在实现联系人功能的 10 个语音操作指令范围内时，最大用时也只不过 0.1s, 可见大大缩短了检索时间，从而提高了语音识别的效率。

( 3 ) 由于检索涉及的处理对象的数量减少使出现关键词的重复和二义性的概率降低，从而提高了语音识别的准确性。比如，用户说出了 "张某某" 这个词，在上述 100个语音操作指令中，可能找到两个 "张某某"，一个 "张某某"是用户在移动终端上存储的一个联系人的名字，一个 "张某某"是用户音乐库中存储的一个歌手的名字，也就是说，该语音词存在重复和二义性，这时系统将不知道移动终端的用户到底是向给电话薄中的 "张某某"打电话，还是需要听音乐库中 "张某某" 的歌，如果默认选择前者，那么用户真正的想法可能是实现后者；如果默认选择后者，那么用户真正的想法可能是实现前者。但在本实施例中，由于用户事先指定了操作类别，如果指定的类别为 "联系人"，则用户说 "张某某"，即是想与张某某通电话；如果指定的类别为 "音乐"，则用户说 "张某某"，即是想听张某某的歌，从而能够准确地进行语音识别操作。

( 4 )本实施例在接收语音信息时以语音关键词信息的形式接收，不再是普通的自然语言，避免了多词、长句和多句，一方面更加容易从语音信息中提取出关键词，进而提高了语音识别的效率；另一方面通过从语音关键词信息中提取的关键词与关键词库匹配来获取返回结果，有利于提高语音识别的准确性。

在前述实施例中提及需要接收对移动终端的待操作的操作类别的触发消息，在实际应用过程中，接收到触发消息的方式多种多样。比如，在用户需要使用语音识别引擎操作控制移动终端时，在移动终端屏幕上呈现出一个操作类别窗口，在该类别窗口中显示各种操作类别标签，该类别标签可以包括：用于实现通信业务功能的联系人标签、用于实现应用业务功能的应用程序标签、用于实现音乐播放业务功能的音乐标签、用于实现在线搜索业务功能的网页搜索等等。当用户点击这些类别标签中的一个时或者焦点移动到某个类别标签时，将在系统中产生一个触发事件（触发消息），监测到该触发事件时即可认为接收到了对操作类别的触发消息。还比如，当用户设置了应用程序自动更新功能时，当发现网络中出现了某个应用程序的新版本时，移动终端将接收到更新通知，这时可将接收到该更新通知视为对 "应用程序"这个操作类别的触发消息，从而可以接收用户的语音指令实现应用程序的更新或不更新。此外，除上述的基于某个触控事件或网络事件来视为接收到操作类别的触发消息外，还可以基于用户对移动终端的某些惯常动作来确定是否接收到操作类别的触发消息。一个常见的动作如用户将手机放置到耳边，该动作即表示用户需要呼叫某个联系人，在这种情况下，则可以认为接收到了 "联系人" 类别。这种触发方式的具体过程如下：

在语音识别引擎初始化时获得系统的传感器服务，注册一个重力传感器的监听器和一个距离传感器的监听器，重力传感器可以提供重力加速度在三个维度（x, y, z )的分量。当手机水平放置时，沿着 z轴的重力加速度值趋向于 9.8, 而 x,y轴的分量趋向与 0.所以，语音助手应用程序实时监测重力加速度传感器返回值，当手机水平放置或稍稍倾斜的时候（也就是用户正常平握手机的时候） z轴的分量趋向于 7 , 并且同时判断距离传感器的返回值为非 0 (也就是手机的距离传感器前没有任何物体遮挡 ), 满足以上 2个条件便初始化整个流程，并记录初始化时间。在用户将手机拿到耳边之前的过程中距离传感器始终返回非 0值（无任何遮挡物），此时状态为 working 当用户将手机放置耳边时，此时的 z轴趋向于 2 (需要说明的是，在数值可以在 0至 4个重力加速度单位内即可满足本申请的发明目的）， X轴和 y轴的绝对值之和则趋向于 7 (该值可以在 4至 10范围内取值 ), 考虑到用户将手机放置耳边 X轴有一个倾斜的角度，此时 X轴的绝对值应该是大于 2的，满足以上条件并且系统为 working状态，系统状态将置为 WAIT— PROXI, 此状态等待距离传感器返回 0值（脸挡住距离传感器），一旦返回 0值将启动程序进行呼叫联系人拨号操作，如果在距离传感器返回 0值之前，从初始化到 WAIT— PROXI全过程超过 2秒钟，将判断此次动作识别失败。当呼叫联系人拨号功能启动之后，用户可以直接呼叫联系人的名字，系统将根据识别结果从手机联系人列表里读取符合条件的联系人，如果有多个匹配的联系人，系统将通过语音提示用户，例如（1.陈某某。 2.刘某某），此时用户只需说 "Γ，或者 "2"即可进行选择拨打给陈某某或王某某，当用户选择后，系统将提示用户正在进行拨号，并直接拨打给用户所选联系人。如果只有一个联系人，系统将直接提示用户正在进行拨号并拨打电话。

在上述实施例中没有限定在获取到语音关键词后具体如何实现对操作类别项下的关键词库的检索，尽管这并不影响本申请发明目的的实现。但是，同一个用户在长期使用语音识别功能过程中，必然形成某个具有规律性的习惯，这些习惯可以运用于对关键词库的检索过程。比如，当移动终端经常被执行某个操作时，说明需要用户对这种操作的需求比较频繁，这时，可以设置一个计数器，记录移动终端在被执行某个操作后该操作被执行的总次数（频次），将该总次数作为关键词库中与该动作对应的关键词的一个属性，在依据语音关键词进行检索时，按照关键词的频次大小由大到校的顺序检索关键词库，由于用户经常进行某个操作，该操作的频次必然较大，在关键词库中必然靠前，由大到小的检索顺序将能较快地得到检索结果。此外，还可以在移动终端被操作后，在满足预设条件时根据所述操作结果对操作类别项下的语音关键词库进行更新。比如，用于在联系人列表中增加了一个人，那么则需要更新语音关键词库，将该增加的联系人作为关键词添入关键词库，更新的时间可以是每次增加完一个联系人的当时，也可以是每次重启手机时，这些可以根据实际情况进行设置，当满足预设的条件时，即触发更新操作。上述内容详细叙述了本申请的移动终端语音识别的方法实施例，相应地，本申请还提供了一种移动终端语音识别的装置实施例。参见图 2, 该图示出了本申请的移动终端语音识别的装置的结构框图。该装置包括：触发消息接收单元 201、语音关键词信息接收单元 202、语音关键词识别单元 203和关键词库检索单元 204 , 其中：

触发消息接收单元 201 , 用于接收对移动终端进行操作的待操作类别的触发消息，所述操作类别为根据移动终端的业务功能划分的类别；

语音关键词信息接收单元 202 , 用于接收语音关键词信息；

语音关键词识别单元 203 , 用于从语音关键词信息中确定语音关键词；关键词库检索单元 204 , 用于根据语音关键词检索所述待操作类别项下的关键词库，返回检索结果。

上述装置实施例的工作过程是：触发消息接收单元 201接收对移动终端进行操作的待操作类别的触发消息；语音关键词信息接收单元 202接收语音关键词信息，由语音关键词识别单元 203从语音关键词信息中确定语音关键词；然后，由关键词库检索单元 204根据语音关键词检索所述待操作类别项下的关键词库，返回检索结果。

本装置实施例接收到依据移动终端业务功能划分的某个操作类别的触发消息后，接收语音关键词信息，从语音关键词中确定语音关键词，然后根据语音关键词检索相应的关键词库，并返回检索结果。与现有的语音识别技术相比，本装置实施例由于根据业务功能对操作类别进行了划分，使关键词库仅仅与每个操作类别对应，一方面根据语音关键词检索时检索处理对象仅限于与对移动终端的操作相对应的关键词库，减少了处理对象的数量，适应了移动终端的处理能力较弱的特点；又一方面，检索涉及的处理对象的数量减少使检索过程的时间缩短，从而提高了语音识别的效率；再一方面，检索涉及的处理对象的数量减少使出现关键词的重复和二义性的概率降低，从而提高了语音识别的准确性。而且，本装置实施例在接收语音信息时以语音关键词信息的形式接收，不再是普通的自然语言，避免了多词、长句和多句，一方面更加容易从语音信息中提取出关键词，进而提高了语音识别的效率；另一方面通过从语音关键词信息中提取的关键词与关键词库匹配来获取返回结果，有利于提高语音识别的准确性。

在实际应用过程中，具有多种触发操作类别的方式，不同的方式对应的触发消息接收单元的具体结构可能不同。下面提供两种方式，本领域技术人员基于这两种方式可以推知其他的实现方式：

方式之一：通过弹出窗口并接收用户的点击或焦点移动的方式来确定接收到操作类别触发消息。这种方式下，触发消息接收单元 201可以包括：操作类别窗口呈现子单元 2011和触发消息接收子单元 2012, 其中：

操作类别窗口呈现子单元 2011 , 用于在移动终端屏幕上呈现操作类别窗口；

触发消息接收子单元 2012 , 用于在所述操作类别窗口中的一个操作类别对应的标签被点击或确定为焦点时，接收到对移动终端进行操作的待操作类别的触发消息。

方式之二：通过感应器识别用户的操作的方式类确认接收到操作类别触发消息。这种方式下，触发消息接收单元具体包括：监听结果判断子单元和触发消息接收子单元，其中：

所述监听结果判断子单元，用于判断第一监听器监听到的 Z轴上的重力加速度分量是否为 2, X、 Y轴上的重力加速度分量是否为 7 , 且第二监听器监听到的距离是否为零，所述 X、 Y轴为移动终端面板所在的平面，所述 Z轴垂直于 X、 Y轴构成的平面，所述第一监听器为接收到传感器服务后注册的对重力传感器的监听器，所述第二监听器为接收到传感器服务器后注册的对距离传感器的监听器；

所述触发消息接收子单元，用于在判断结果均为是时，确定接收到对移动终端进行操作的待操作类别的触发消息，所述操作类别为联系人。

在第二种方式下，其他功能单元存在着相应的变化，即语音关键词信息接收单元具体用于接收包含联系人的语音关键词信息，语音关键词识别单元具体用于从语音关键词信息中确定出联系人关键词，关键词检索单元具体用于根据所述联系人关键词检索联系人库，返回检索到的联系人。上述装置实施例还包括呼叫单元，用于呼叫所述检索到的联系人。进一步地，上述装置实施例还包括联系人编号单元和编号语音信息接收单元，其中：所述联系人编号单元，用于在根据所述联系人关键词检索到的联系人包括多个时，对每个联系人进行编号；所述编号语音信息接收单元，用于接收编号语音信息，所述呼叫单元具体用于呼叫编号语音信息对应的联系人。

此外，还可以基于某些实际需要，对上述装置实施例进行某些变形或等同替换，以获得更加优化的技术效果。比如，上述装置实施例还包括关键词频次增加单元，用于在移动终端被操作后，增加所述操作在其操作类别项下的关键词库中对应的关键词的频次，则所述关键词库检索单元具体用于在根据语音关键词检索待操作项下的关键词库时，按照关键词频次由大到小的顺序检索关键词库。通过增加该单元可提高检索的速度。再比如，上述装置实施例还可以包括关键词更新单元 205 , 用于在移动终端被操作后，在满足预设条件时根据所述操作结果对操作类别项下的关键词库进行更新。

需要说明的是：为了叙述的简便，本说明书的上述实施例以及实施例的各种变形实现方式重点说明的都是与其他实施例或变形方式的不同之处，各个情形之间相同相似的部分互相参见即可。尤其，对于装置实施例的几个改进方式而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例的各单元可以是或者也可以不是物理上分开的，既可以位于一个地方，或者也可以分布到多个网络环境下。在实际应用过程中，可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的，本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本申请的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

权利要求

1、一种移动终端的语音识别方法，其特征在于，该方法包括：

接收对移动终端进行操作的待操作的操作类别的触发消息，所述操作类别为根据移动终端的业务功能划分的类别；接收语音关键词信息，从语音关键词信息中确定语音关键词；

根据语音关键词检索所述待操作的操作类别项下的关键词库，返回检索结果。

2、根据权利要求 1所述的方法，其特征在于，所述接收对移动终端进行操作的待操作的操作类别的触发消息具体包括：

3、根据权利要求 2所述的方法，其特征在于，所述操作类别窗口中的操作类别对应的标签包括用于实现通信业务功能的联系人标签、用于实现应用业务功能的应用程序标签、用于实现音乐播放业务功能的音乐标签和 /或用于实现在线搜索业务功能的网页搜索标签。

4、根据权利要求 1所述的方法，其特征在于，所述接收对移动终端进行操作的待操作类别的触发消息具体包括：

5、根据权利要求 4所述的方法，其特征在于，当根据所述联系人关键词检索到的联系人包括多个时，对每个联系人进行编号，接收编号语音信息，呼叫编号语音信息对应的联系人。

6、根据权利要求 1所述的方法，其特征在于，当移动终端被操作后，增加所述操作在其操作类别项下的关键词库中对应的关键词的频次，则在根据语音关键词检索待操作项下的关键词库时，按照关键词频次由大到小的顺序检索关键词库。

7、根据权利要求 1所述的方法，其特征在于，当移动终端被操作后，在满足预设条件时根据所述操作结果对操作类别项下的语音关键词库进行更新。

8、一种移动终端的语音识别装置，其特征在于，该装置包括：触发消息接收单元、语音关键词信息接收单元、语音关键词识别单元和关键词库检索单元，其中：

所述语音关键词信息接收单元，用于接收语音关键词信息；

9、根据权利要求 8所述的装置，其特征在于，所述触发消息接收单元具体包括：操作类别窗口呈现子单元和触发消息接收子单元，其中：

10、根据权利要求 8所述的装置，其特征在于，所述触发消息接收单元具体包括：监听结果判断子单元和触发消息接收子单元，其中：

所述装置还包括呼叫单元，用于呼叫所述检索到的联系人。

11、根据权利要求 10所述的装置，其特征在于，所述装置还包括联系人编号单元和编号语音信息接收单元，其中：所述联系人编号单元，用于在根据所述联系人关键词检索到的联系人包括多个时，对每个联系人进行编号；所述编号语音信息接收单元，用于接收编号语音信息，所述呼叫单元具体用于呼叫编号语音信息对应的联系人。

12、根据权利要求 8所述的装置，其特征在于，所述装置还包括关键词频次增加单元，用于在移动终端被操作后，增加所述操作在其操作类别项下的关键词库中对应的关键词的频次，则所述关键词库检索单元具体用于在根据语音关键词检索待操作项下的关键词库时，按照关键词频次由大到小的顺序检索关键词库。

13、根据权利要求 8所述的装置，其特征在于，所述装置还包括关键词更新单元，用于在移动终端被操作后，在满足预设条件时根据所述操作结果对操作类别项下的关键词库进行更新。