CN105183422A - 语音控制应用程序的方法和装置 - Google Patents

语音控制应用程序的方法和装置 Download PDF

Info

Publication number
CN105183422A
CN105183422A CN201510547927.1A CN201510547927A CN105183422A CN 105183422 A CN105183422 A CN 105183422A CN 201510547927 A CN201510547927 A CN 201510547927A CN 105183422 A CN105183422 A CN 105183422A
Authority
CN
China
Prior art keywords
application program
action target
user
operation behavior
steering order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510547927.1A
Other languages
English (en)
Other versions
CN105183422B (zh
Inventor
郭小华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510547927.1A priority Critical patent/CN105183422B/zh
Publication of CN105183422A publication Critical patent/CN105183422A/zh
Application granted granted Critical
Publication of CN105183422B publication Critical patent/CN105183422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种语音控制应用程序的方法及装置,其中方法包括:获取用户输入的语音信息,并根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为;根据用户的操作意图生成对应的控制指令;以及将控制指令发送至操作目标对应的应用程序,以使应用程序根据控制指令对应用程序中与操作行为对应的接口进行控制。该方法通过自动识别用户的语音,更精准地分析出用户的操作意图,分析出操作目标和操作行为,根据操作目标和操作行为直接为用户一步完成操作行为,缩短了用户的操作路径,节省了用户的操作时间,并且提高了用户的需求满意度,从而提升了用户体验。

Description

语音控制应用程序的方法和装置
技术领域
本发明涉及语音控制技术领域,尤其涉及一种语音控制应用程序的方法和装置。
背景技术
随着通信技术的发展,移动终端向着智能化、多功能化发展。在移动终端中,用户会安装多个第三方应用程序以满足自身的需求。当用户使用这些应用程序时,一般可先找到并选择该应用程序的图标,在移动终端根据用户的选择指令启动该应用程序之后,用户可进入该应用程序继续进行操作。
随着语音识别技术的快速发展,语音操作也逐渐成为移动终端的重要技术之一。现有技术中,在移动终端语音服务中,移动终端接收到用户输入的语音指令之后,可对语音指令进行分析以得到对应的应用程序,并启动该应用程序。又如,在具有语音搜索功能的浏览器应用程序中,搜索引擎在接收到用户输入的语音指令之后,搜索引擎将用户输入的语音作为搜索词进行搜索。
但是存在的问题是,在移动终端语音服务中,当用户发起如“用XX做某操作”等语音指令之后,移动终端只能根据该语音指令调起对应的应用程序,不会继续“做某操作”;又如,在具有语音搜索功能的浏览器应用程序中,当用户发起如“用XX做某操作”等语音指令之后,搜索引擎会直接将“用XX做某操作”作为搜索词进行搜索,这样不能很好的识别到用户意图,不能完全达到用户的需求,导致需求满足度不够,用户体验变差。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种语音控制应用程序的方法。该方法可以直接为用户一步完成操作行为,缩短了用户的操作路径,节省了用户的操作时间,并且提高了用户的需求满意度,从而提升了用户体验。
本发明的第二个目的在于提出另一种语音控制应用程序的方法。
本发明的第三个目的在于提出一种语音控制应用程序的装置。
本发明的第四个目的在于提出另一种语音控制应用程序的装置。
为了实现上述目的,本发明第一方面实施例的语音控制应用程序的方法,包括:获取用户输入的语音信息,并根据所述语音信息确定所述用户的操作意图,其中,所述操作意图包括操作目标和操作行为;根据所述用户的操作意图生成对应的控制指令;以及将所述控制指令发送至所述操作目标对应的应用程序,以使所述应用程序根据所述控制指令对所述应用程序中与所述操作行为对应的接口进行控制。
本发明实施例的语音控制应用程序的方法,可先获取用户输入的语音信息,并根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为,之后,可根据用户的操作意图生成对应的控制指令,并将控制指令发送至操作目标对应的应用程序,以使应用程序根据控制指令对应用程序中与操作行为对应的接口进行控制,即通过自动识别用户的语音,更精准地分析出用户的操作意图,分析出操作目标和操作行为,根据操作目标和操作行为直接为用户一步完成操作行为,缩短了用户的操作路径,节省了用户的操作时间,并且提高了用户的需求满意度,从而提升了用户体验。
为了实现上述目的,本发明第二方面实施例的语音控制应用程序的方法,包括:获取用户输入的语音信息,并根据所述语音信息确定所述用户的操作意图,其中,所述操作意图包括操作目标和操作行为;根据所述操作目标生成第一控制指令,并根据所述操作行为生成第二控制指令;以及根据所述第一控制指令调起所述操作目标对应的应用程序,以使所述应用程序根据所述第二控制指令进行控制。
本发明实施例的语音控制应用程序的方法,可先获取用户输入的语音信息,并根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为,之后可根据操作目标生成第一控制指令,并根据操作行为生成第二控制指令,以及根据第一控制指令调起操作目标对应的应用程序,以使应用程序根据第二控制指令进行控制,即通过自动识别用户的语音,更精准地分析出用户的操作意图,分析出操作目标和操作行为,根据操作目标和操作行为直接为用户一步完成操作行为,缩短了用户的操作路径,节省了用户的操作时间,并且提高了用户的需求满意度,从而提升了用户体验。
为了实现上述目的,本发明第三方面实施例的语音控制应用程序的装置,包括:获取模块,用于获取用户输入的语音信息;确定模块,用于根据所述语音信息确定所述用户的操作意图,其中,所述操作意图包括操作目标和操作行为;第一生成模块,用于根据所述用户的操作意图生成对应的控制指令;以及发送模块,用于将所述控制指令发送至所述操作目标对应的应用程序,以使所述应用程序根据所述控制指令对所述应用程序中与所述操作行为对应的接口进行控制。
本发明实施例的语音控制应用程序的装置,可通过获取模块获取用户输入的语音信息,确定模块根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为,第一生成模块根据用户的操作意图生成对应的控制指令,发送模块将控制指令发送至操作目标对应的应用程序,以使应用程序根据控制指令对应用程序中与操作行为对应的接口进行控制,即通过自动识别用户的语音,更精准地分析出用户的操作意图,分析出操作目标和操作行为,根据操作目标和操作行为直接为用户一步完成操作行为,缩短了用户的操作路径,节省了用户的操作时间,并且提高了用户的需求满意度,从而提升了用户体验。
为了实现上述目的,本发明第四方面实施例的语音控制应用程序的装置,包括:获取模块,用于获取用户输入的语音信息;确定模块,用于根据所述语音信息确定所述用户的操作意图,其中,所述操作意图包括操作目标和操作行为;第一生成模块,用于根据所述操作目标生成第一控制指令,并根据所述操作行为生成第二控制指令;以及控制模块,用于根据所述第一控制指令调起所述操作目标对应的应用程序,以使所述应用程序根据所述第二控制指令进行控制。
本发明实施例的语音控制应用程序的装置,可通过获取模块获取用户输入的语音信息,确定模块根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为,第一生成模块根据操作目标生成第一控制指令,并根据操作行为生成第二控制指令,控制模块根据第一控制指令调起操作目标对应的应用程序,以使应用程序根据第二控制指令进行控制,即通过自动识别用户的语音,更精准地分析出用户的操作意图,分析出操作目标和操作行为,根据操作目标和操作行为直接为用户一步完成操作行为,缩短了用户的操作路径,节省了用户的操作时间,并且提高了用户的需求满意度,从而提升了用户体验。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的语音控制应用程序的方法的流程图;
图2是根据本发明另一个实施例的语音控制应用程序的方法的流程图;
图3(a)、(b)和(c)是根据本发明实施例的语音控制应用程序的方法的示例图;
图4是根据本发明一个实施例的语音控制应用程序的装置的结构框图;
图5是根据本发明另一个实施例的语音控制应用程序的装置的结构框图;
图6是根据本发明又一个实施例的语音控制应用程序的装置的结构框图;
图7是根据本发明又一个实施例的语音控制应用程序的方法的流程图;
图8是根据本发明再一个实施例的语音控制应用程序的方法的流程图;
图9是根据本发明再一个实施例的语音控制应用程序的装置的结构框图;
图10是根据本发明又另一个实施例的语音控制应用程序的装置的结构框图;以及
图11是根据本发明又再一个实施例的语音控制应用程序的装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
以下结合附图描述根据本发明实施例的语音控制应用程序的方法和装置。
图1是根据本发明一个实施例的语音控制应用程序的方法的流程图。如图1所示,该语音控制应用程序的方法可以包括:
S101,获取用户输入的语音信息,并根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为。
具体而言,在本发明的实施例中,可对语音信息进行语音识别以生成对应的文本信息,并对该文本信息进行语法分析以确定用户的操作意图。更具体地,可通过语音识别技术对语音信息进行语音识别,以得到对应的文本信息,之后可对该文本信息的内容进行语法分析,如可先对文本信息的内容进行词法分析已得到多个词,然后在对多个词进行语义分析的同时进行语法检查,以识别出用户的意图为某操作行为,并抽取对应的操作目标和操作行为。例如,用户输入语音“用百度贴吧搜索中国好声音”,可对该语音进行语音识别,并对识别出的文本内容进行语法分析,以确定用户的意图为搜索操作行为,操作目标为“百度贴吧”,操作行为为“搜索中国好声音”。
S102,根据用户的操作意图生成对应的控制指令。
需要说明的是,在本发明的实施例中,可预先存储操作行为和操作目标对应的应用程序的对应列表以及调用方式。在本步骤中,可根据操作意图中的操作行为和操作目标信息从预先存储的操作行为和操作目标对应的应用程序的对应列表中找到对应的操作行为对应的调用方式,并根据该调用方式生成对应的控制指令,该控制指令可理解是让操作目标对应的应用程序执行该操作行为的指令。
S103,将控制指令发送至操作目标对应的应用程序,以使应用程序根据控制指令对应用程序中与操作行为对应的接口进行控制。
具体地,可根据操作目标的名称找到对应的应用程序,然后可将上述生成的控制指令发送到该应用程序,应用程序根据该控制指令直接调用该应用程序中与该操作行为对应的接口。可以理解,在本发明的实施例中,可将调起应用程序和应用程序处理操作行为作为同一条执行操作请求,然后直接发送一条对应的请求给该应用程序,该应用程序根据该请求直接调用内部内置的与操作行为对应的接口。需要说明的是,本发明实施例的语音控制应用程序的方法适用于应用程序中具有已经定义的与操作行为对应的接口。
举例而言,假设用户输入的语音内容为“用百度贴吧搜索中国好声音”,可分析出用户的意图为操作行为,操作目标为“百度贴吧”,操作行为“搜索中国好声音”,在确定用户的操作意图之后,可向操作目标对应的应用程序(即百度贴吧应用程序)发送一条控制请求,该条请求中可直接调用百度贴吧应用程序中内部内置的中国好声音搜索接口的控制指令。百度贴吧应用程序在接收到该条请求之后,可直接执行搜索中国好声音的操作。
本发明实施例的语音控制应用程序的方法,可先获取用户输入的语音信息,并根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为,之后,可根据用户的操作意图生成对应的控制指令,并将控制指令发送至操作目标对应的应用程序,以使应用程序根据控制指令对应用程序中与操作行为对应的接口进行控制,即通过自动识别用户的语音,更精准地分析出用户的操作意图,分析出操作目标和操作行为,根据操作目标和操作行为直接为用户一步完成操作行为,缩短了用户的操作路径,节省了用户的操作时间,并且提高了用户的需求满意度,从而提升了用户体验。
图2是根据本发明另一个实施例的语音控制应用程序的方法的流程图。
为了使得用户能够具有更好的使用体验,可根据终端中所安装的应用程序的情况来对操作目标进行不同的处理。具体地,如图2所示,该语音控制应用程序的方法可以包括:
S201,获取用户输入的语音信息,并根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为。
具体而言,在本发明的实施例中,可对语音信息进行语音识别以生成对应的文本信息,并对该文本信息进行语法分析以确定用户的操作意图。
优选地,在本发明的一个实施例中,当文本信息中不包含操作目标的信息时,该语音控制应用程序的方法还可包括:判断历史操作行为记录中是否存在操作行为;如果存在,则根据操作行为在历史操作行为记录进行查找以确定对应的操作目标;如果不存在,则对操作行为进行语义分析以确定与操作行为匹配的操作目标。也就是说,当用户的输入中没有明显的信息表明操作目标的信息时,可先根据分析出的操作行为判断用户是否已经有过确定的该操作行为的行为记录,若有,则可直接使用之前分析使用过的操作目标对应的应用程序进行相应的处理;若没有,则可通过对操作行为的语义分析提供最优的操作目标对应的应用程序。由此,即使在用户输入的内容没有明显的表明操作目标的信息时,也可以为尽可能提供更加精准的操作目标。
S202,根据用户的操作意图生成对应的控制指令。
S203,判断终端中是否存在操作目标对应的应用程序。
需要说明的是,在本发明的实施例中,操作目标对应的应用程序可以是终端中自带的服务,也可以是终端中已安装的应用程序,还可以是终端中未安装的应用程序。然而,由于确定的操作目标所对应的应用程序可能未在终端中安装,所以在将控制指令发送到操作目标对应的应用程序之前,可先判断终端中是否存在该操作目标所对应的应用程序。例如,可将操作目标与终端中已安装的应用程序的名称进行比对,以查找终端中是否已安装该操作目标所对应的应用程序。
S204,如果存在操作目标对应的应用程序,则将控制指令发送至操作目标对应的应用程序,以使应用程序根据控制指令对应用程序中与操作行为对应的接口进行控制。
S205,如果不存在操作目标对应的应用程序,则进一步判断应用程序是否存在网页服务。
具体地,当判断终端中不存在操作目标对应的应用程序时,可判断该应用程序是否存在对应的网页服务。也就是说,判断该应用程序是否具有支持的网页服务。例如,假设终端中不存在操作目标对应的百度贴吧应用程序,则可判断该百度贴吧应用程序是否存在对应的网页服务,即是否存在百度贴吧网页。
S206,如果存在网页服务,则调起应用程序对应的网页服务,其中,网页服务根据控制指令对网页服务中与操作行为对应的接口进行控制。
具体地,当判断操作目标对应的应用程序存在对应的网页服务时,可调起该网页服务,该网页服务可根据上述控制指令调用内部内置的与操作行为对应的接口。
S207,如果不存在网页服务,则生成下载提示信息并提供给用户。
具体地,当判断操作目标对应的应用程序不存在对应的网页服务时,可认为此时终端中没有合适的应用程序来执行该操作行为,此时可生成该操作目标所对应的应用程序的下载提示信息,该下载提示信息可包括操作行为执行失败原因信息、操作目标所对应的应用程序的下载地址信息等,并可将该下载提示信息提供给用户,使得用户可以了解到操作行为执行失败的原因,也为用户提供完成该操作行为所需要的工具,提升用户的使用体验。
可以理解,由于确定的操作目标所对应的应用程序可能未在终端中安装,所以在不同的情况下需对操作目标做不同处理。例如,以操作目标为百度贴吧、操作行为为搜索中国好声音为例,当终端中存在百度贴吧应用程序时,如图3(a)所示,可调起该百度贴吧应用程序;当终端中不存在百度贴吧应用程序时,由于该百度贴吧应用程序存在对应的网页服务,所以如图3(b)所示,可调起网页版的百度贴吧,并直接进入该百度贴吧内部内置的中国好声音的接口,或者,如图3(c)所示,可直接调起该百度贴吧的插件,并直接进入该百度贴吧插件内部内置的中国好声音的接口。
本发明实施例的语音控制应用程序的方法,在将控制指令发送到操作目标对应的应用程序之前,可先判断终端中是否存在该操作目标所对应的应用程序,之后可根据判断结果进行相应的操作,尽可能地为用户提供能够执行操作行为的应用程序,使得用户能够具有更好的使用体验。
为了实现上述实施例,本发明还提出了一种语音控制应用程序的装置。
图4是根据本发明一个实施例的语音控制应用程序的装置的结构框图。如图4所示,该语音控制应用程序的装置可以包括:获取模块110、确定模块120、第一生成模块130和发送模块140。
具体地,获取模块110可用于获取用户输入的语音信息。更具体地,获取模块110可通过终端中的麦克风部件来获取用户输入的语音信息。
确定模块120可用于根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为。具体而言,在本发明的实施例中,确定模块120可对语音信息进行语音识别以生成对应的文本信息,并对文本信息进行语法分析以确定用户的操作意图。更具体地,确定模块120可通过语音识别技术对语音信息进行语音识别,以得到对应的文本信息,之后可对该文本信息的内容进行语法分析,如可先对文本信息的内容进行词法分析已得到多个词,然后在对多个词进行语义分析的同时进行语法检查,以识别出用户的意图为某操作行为,并抽取对应的操作目标和操作行为。例如,用户输入语音“用百度贴吧搜索中国好声音”,确定模块120可对该语音进行语音识别,并对识别出的文本内容进行语法分析,以确定用户的意图为搜索操作行为,操作目标为“百度贴吧”,操作行为为“搜索中国好声音”。
第一生成模块130可用于根据用户的操作意图生成对应的控制指令。
需要说明的是,在本发明的实施例中,可预先存储操作行为和操作目标对应的应用程序的对应列表以及调用方式。其中,在本实施例中,第一生成模块130可根据操作意图中的操作行为和操作目标信息从预先存储的操作行为和操作目标对应的应用程序的对应列表中找到对应的操作行为对应的调用方式,并根据该调用方式生成对应的控制指令,该控制指令可理解是让操作目标对应的应用程序执行该操作行为的指令。
发送模块140可用于将控制指令发送至操作目标对应的应用程序,以使应用程序根据控制指令对应用程序中与操作行为对应的接口进行控制。更具体地,发送模块140可根据操作目标的名称找到对应的应用程序,然后可将上述生成的控制指令发送到该应用程序,应用程序根据该控制指令直接调用该应用程序中与该操作行为对应的接口。可以理解,在本发明的实施例中,发送模块140可将调起应用程序和应用程序处理操作行为作为同一条执行操作请求,然后直接发送一条对应的请求给该应用程序,该应用程序根据该请求直接调用内部内置的与操作行为对应的接口。需要说明的是,本发明实施例的语音控制应用程序的方法适用于应用程序中具有已经定义的与操作行为对应的接口。
举例而言,假设用户输入的语音内容为“用百度贴吧搜索中国好声音”,可分析出用户的意图为操作行为,操作目标为“百度贴吧”,操作行为“搜索中国好声音”,在确定模块120确定用户的操作意图之后,发送模块140可向操作目标对应的应用程序(即百度贴吧应用程序)发送一条控制请求,该条请求中可直接调用百度贴吧应用程序中内部内置的中国好声音搜索接口的控制指令。百度贴吧应用程序在接收到该条请求之后,可直接执行搜索中国好声音的操作。
为了使得用户能够具有更好的使用体验,可根据终端中所安装的应用程序的情况来对操作目标进行不同的处理。进一步地,在本发明的一个实施例中,如图5所示,该语音控制应用程序的装置还可包括:第一判断模块150、第二判断模块160、控制模块170和第二生成模块180。
具体地,第一判断模块150可用于在发送模块140将控制指令发送至操作目标对应的应用程序之前,判断终端中是否存在操作目标对应的应用程序。需要说明的是,在本发明的实施例中,操作目标对应的应用程序可以是终端中自带的服务,也可以是终端中已安装的应用程序,还可以是终端中未安装的应用程序。然而,由于确定的操作目标所对应的应用程序可能未在终端中安装,所以在发送模块140将控制指令发送到操作目标对应的应用程序之前,第一判断模块150可先判断终端中是否存在该操作目标所对应的应用程序。例如,第一判断模块150可将操作目标与终端中已安装的应用程序的名称进行比对,以查找终端中是否已安装该操作目标所对应的应用程序。
其中,在本发明的实施例中,发送模块140还可用于在第一判断模块150判断终端中存在操作目标对应的应用程序时,将控制指令发送至操作目标对应的应用程序。
第二判断模块160可用于在不存在操作目标对应的应用程序时,进一步判断应用程序是否存在网页服务。更具体地,在第一判断模块150判断终端中不存在操作目标对应的应用程序时,第二判断模块160可判断该应用程序是否存在对应的网页服务。也就是说,第二判断模块160判断该应用程序是否具有支持的网页服务。例如,假设终端中不存在操作目标对应的百度贴吧应用程序,则第二判断模块160可判断该百度贴吧应用程序是否存在对应的网页服务,即是否存在百度贴吧网页。
控制模块170可用于在存在网页服务时,调起应用程序对应的网页服务,其中,网页服务根据控制指令对网页服务中与操作行为对应的接口进行控制。更具体地,在第二判断模块160判断操作目标对应的应用程序存在对应的网页服务时,控制模块170可调起该网页服务,该网页服务可根据上述控制指令调用内部内置的与操作行为对应的接口。
第二生成模块180可用于在不存在网页服务时,生成下载提示信息并提供给用户。更具体地,在第二判断模块160判断操作目标对应的应用程序不存在对应的网页服务时,第二生成模块180可认为此时终端中没有合适的应用程序来执行该操作行为,此时可生成该操作目标所对应的应用程序的下载提示信息,该下载提示信息可包括操作行为执行失败原因信息、操作目标所对应的应用程序的下载地址信息等,并可将该下载提示信息提供给用户,使得用户可以了解到操作行为执行失败的原因,也为用户提供完成该操作行为所需要的工具,提升用户的使用体验。
可以理解,由于确定的操作目标所对应的应用程序可能未在终端中安装,所以在不同的情况下需对操作目标做不同处理。例如,以操作目标为百度贴吧、操作行为为搜索中国好声音为例,当终端中存在百度贴吧应用程序时,如图3(a)所示,可调起该百度贴吧应用程序;当终端中不存在百度贴吧应用程序时,由于该百度贴吧应用程序存在对应的网页服务,所以如图3(b)所示,可调起网页版的百度贴吧,并直接进入该百度贴吧内部内置的中国好声音的接口,或者,如图3(c)所示,可直接调起该百度贴吧的插件,并直接进入该百度贴吧插件内部内置的中国好声音的接口。
由此,在将控制指令发送到操作目标对应的应用程序之前,可先判断终端中是否存在该操作目标所对应的应用程序,之后可根据判断结果进行相应的操作,尽可能地为用户提供能够执行操作行为的应用程序,使得用户能够具有更好的使用体验。
进一步地,在本发明的一个实施例中,如图6所示,该语音控制应用程序的装置还可包括第三判断模块190,第三判断模块190可用于在文本信息中不包含操作目标的信息时,判断历史操作行为记录中是否存在操作行为。其中,在本发明的实施例中,确定模块120还可用于在第三判断模块190判断历史操作行为记录中存在操作行为时,根据操作行为在历史操作行为记录进行查找以确定对应的操作目标,以及在第三判断模块190判断历史操作行为记录中不存在操作行为时,对操作行为进行语义分析以确定与操作行为匹配的操作目标。
也就是说,当用户的输入中没有明显的信息表明操作目标的信息时,第三判断模块190可先根据分析出的操作行为判断用户是否已经有过确定的该操作行为的行为记录,若有,确定模块120则可直接使用之前分析使用过的操作目标对应的应用程序进行相应的处理;若没有,确定模块120则可通过对操作行为的语义分析提供最优的操作目标对应的应用程序。由此,即使在用户输入的内容没有明显的表明操作目标的信息时,也可以为尽可能提供更加精准的操作目标。
本发明实施例的语音控制应用程序的装置,可通过获取模块获取用户输入的语音信息,确定模块根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为,第一生成模块根据用户的操作意图生成对应的控制指令,发送模块将控制指令发送至操作目标对应的应用程序,以使应用程序根据控制指令对应用程序中与操作行为对应的接口进行控制,即通过自动识别用户的语音,更精准地分析出用户的操作意图,分析出操作目标和操作行为,根据操作目标和操作行为直接为用户一步完成操作行为,缩短了用户的操作路径,节省了用户的操作时间,并且提高了用户的需求满意度,从而提升了用户体验。
由于操作目标所对应的应用程序中有时并不具有已经定义的与操作行为的对应的接口,所以不能将调起应用程序和处理操作行为作为同一条操作来处理,此时需先调起操作目标对应的应用程序,然后将操作行为当作数据发送给该应用程序,由该应用程序自行处理。具体地,本发明还提出了另一种语音控制应用程序的方法。
图7是根据本发明又一个实施例的语音控制应用程序的方法的流程图。如图7所示,该语音控制应用程序的方法可以包括:
S701,获取用户输入的语音信息,并根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为。
具体而言,在本发明的实施例中,可对语音信息进行语音识别以生成对应的文本信息,并对该文本信息进行语法分析以确定用户的操作意图。更具体地,可通过语音识别技术对语音信息进行语音识别,以得到对应的文本信息,之后可对该文本信息的内容进行语法分析,如可先对文本信息的内容进行词法分析已得到多个词,然后在对多个词进行语义分析的同时进行语法检查,以识别出用户的意图为某操作行为,并抽取对应的操作目标和操作行为。例如,用户输入语音“用百度贴吧搜索中国好声音”,可对该语音进行语音识别,并对识别出的文本内容进行语法分析,以确定用户的意图为搜索操作行为,操作目标为“百度贴吧”,操作行为为“搜索中国好声音”。
S702,根据操作目标生成第一控制指令,并根据操作行为生成第二控制指令。
需要说明的是,在本发明的一个实施例中,可预先存储终端中已安装的应用程序所支持的操作事件以及该操作事件的调用方式。
具体地,可根据操作目标的名称找到终端中对应的应用程序,并生成调起该应用程序的控制指令(即上述的第一控制指令),以及可从预先存储的应用程序所支持的操作事件以及该操作事件的调用方式中找到该操作行为所对应调用方式,并根据该调用方式将该操作行为生成对应的参数数据,即作为第二控制指令。
S703,根据第一控制指令调起操作目标对应的应用程序,以使应用程序根据第二控制指令进行控制。
具体地,可根据该第一控制指令调起对应的应用程序,该应用程序根据通过操作行为生成的参数数据进行相应的操作。举例而言,以用户输入的内容为“用百度贴吧搜索中国好声音”为例,可先生成调起“百度贴吧应用程序”的控制指令,并将搜索行为“搜索中国好声音”作为参数数据发送给百度贴吧应用程序。百度贴吧应用程序在接收到控制指令时可启动并进入应用程序,并可根据传递的参数数据“搜索中国好声音”发送搜索中国好声音操作。也就是说说,可根据操作目标调起对应的应用程序,并将操作行为作为参数数据发送该应用程序,然后由该应用程序根据该参数数据自行处理。
本发明实施例的语音控制应用程序的方法,可先获取用户输入的语音信息,并根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为,之后可根据操作目标生成第一控制指令,并根据操作行为生成第二控制指令,以及根据第一控制指令调起操作目标对应的应用程序,以使应用程序根据第二控制指令进行控制,即通过自动识别用户的语音,更精准地分析出用户的操作意图,分析出操作目标和操作行为,根据操作目标和操作行为直接为用户一步完成操作行为,缩短了用户的操作路径,节省了用户的操作时间,并且提高了用户的需求满意度,从而提升了用户体验。
图8是根据本发明再一个实施例的语音控制应用程序的方法的流程图。
为了使得用户能够具有更好的使用体验,可根据终端中所安装的应用程序的情况来对操作目标进行不同的处理。具体地,如图8所示,该语音控制应用程序的方法可以包括:
S801,获取用户输入的语音信息,并根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为。
具体而言,在本发明的实施例中,可对语音信息进行语音识别以生成对应的文本信息,并对该文本信息进行语法分析以确定用户的操作意图。
进一步地,在本发明的一个实施例中,当文本信息中不包含操作目标的信息时,该语音控制应用程序的方法还可包括:判断历史操作行为记录中是否存在操作行为;如果存在,则根据操作行为在历史操作行为记录进行查找以确定对应的操作目标;如果不存在,则对操作行为进行语义分析以确定与操作行为匹配的操作目标。也就是说,当用户的输入中没有明显的信息表明操作目标的信息时,可先根据分析出的操作行为判断用户是否已经有过确定的该操作行为的行为记录,若有,则可直接使用之前分析使用过的操作目标对应的应用程序进行相应的处理;若没有,则可通过对操作行为的语义分析提供最优的操作目标对应的应用程序。由此,即使在用户输入的内容没有明显的表明操作目标的信息时,也可以为尽可能提供更加精准的操作目标。
S802,根据操作目标生成第一控制指令,并根据操作行为生成第二控制指令。
S803,判断终端中是否存在操作目标对应的应用程序。
需要说明的是,在本发明的实施例中,操作目标对应的应用程序可以是终端中自带的服务,也可以是终端中已安装的应用程序,还可以是终端中未安装的应用程序。然而,由于确定的操作目标所对应的应用程序可能未在终端中安装,所以在根据第一控制指令调起操作目标对应的应用程序之前,可先判断终端中是否存在该操作目标所对应的应用程序。例如,可将操作目标与终端中已安装的应用程序的名称进行比对,以查找终端中是否已安装该操作目标所对应的应用程序。
S804,如果存在操作目标对应的应用程序,则根据第一控制指令调起操作目标对应的应用程序,以使应用程序根据第二控制指令进行控制。
S805,如果不存在操作目标对应的应用程序,则进一步判断应用程序是否存在网页服务。
具体地,当判断终端中不存在操作目标对应的应用程序时,可判断该应用程序是否存在对应的网页服务。也就是说,判断该应用程序是否具有支持的网页服务。例如,假设终端中不存在操作目标对应的百度贴吧应用程序,则可判断该百度贴吧应用程序是否存在对应的网页服务,即是否存在百度贴吧网页。
S806,如果存在网页服务,则根据第一控制指令调起网页服务,以使网页服务根据第二控制指令进行控制。
具体地,当判断操作目标对应的应用程序存在对应的网页服务时,可根据第一控制指令调起该网页服务,该网页服务可根据上述第二控制指令调用内部内置的与操作行为对应的接口。
S807,如果不存在网页服务,则生成下载提示信息并提供给用户。
具体地,当判断操作目标对应的应用程序不存在对应的网页服务时,可认为此时终端中没有合适的应用程序来执行该操作行为,此时可生成该操作目标所对应的应用程序的下载提示信息,该下载提示信息可包括操作行为执行失败原因信息、操作目标所对应的应用程序的下载地址信息等,并可将该下载提示信息提供给用户,使得用户可以了解到操作行为执行失败的原因,也为用户提供完成该操作行为所需要的工具,提升用户的使用体验。
可以理解,由于确定的操作目标所对应的应用程序可能未在终端中安装,所以在不同的情况下需对操作目标做不同处理。例如,以操作目标为百度贴吧、操作行为为搜索中国好声音为例,当终端中存在百度贴吧应用程序时,如图3(a)所示,可调起该百度贴吧应用程序;当终端中不存在百度贴吧应用程序时,由于该百度贴吧应用程序存在对应的网页服务,所以如图3(b)所示,可调起网页版的百度贴吧,或者,如图3(c)所示,可直接调起该百度贴吧的插件。
本发明实施例的语音控制应用程序的方法,在根据第一控制指令调起操作目标对应的应用程序之前,可先判断终端中是否存在该操作目标所对应的应用程序,之后可根据判断结果进行相应的操作,尽可能地为用户提供能够执行操作行为的应用程序,使得用户能够具有更好的使用体验。
为了实现上述实施例,本发明还提出了一种语音控制应用程序的装置。
图9是根据本发明再一个实施例的语音控制应用程序的装置的结构框图。如图9所示,该语音控制应用程序的装置可以包括:获取模块210、确定模块220、第一生成模块230和控制模块240。
具体地,获取模块210可用于获取用户输入的语音信息。
确定模块220可用于根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为。具体而言,在本发明的实施例中,确定模块220可对语音信息进行语音识别以生成对应的文本信息,并对文本信息进行语法分析以确定用户的操作意图。
更具体地,确定模块220可通过语音识别技术对语音信息进行语音识别,以得到对应的文本信息,之后可对该文本信息的内容进行语法分析,如可先对文本信息的内容进行词法分析已得到多个词,然后在对多个词进行语义分析的同时进行语法检查,以识别出用户的意图为某操作行为,并抽取对应的操作目标和操作行为。例如,用户输入语音“用百度贴吧搜索中国好声音”,可对该语音进行语音识别,并对识别出的文本内容进行语法分析,以确定用户的意图为搜索操作行为,操作目标为“百度贴吧”,操作行为为“搜索中国好声音”。
第一生成模块230可用于根据操作目标生成第一控制指令,并根据操作行为生成第二控制指令。需要说明的是,在本发明的一个实施例中,可预先存储终端中已安装的应用程序所支持的操作事件以及该操作事件的调用方式。更具体地,第一生成模块230可根据操作目标的名称找到终端中对应的应用程序,并生成调起该应用程序的控制指令(即上述的第一控制指令),以及可从预先存储的应用程序所支持的操作事件以及该操作事件的调用方式中找到该操作行为所对应调用方式,并根据该调用方式将该操作行为生成对应的参数数据,即作为第二控制指令。
控制模块240可用于根据第一控制指令调起操作目标对应的应用程序,以使应用程序根据第二控制指令进行控制。更具体地,控制模块240可根据该第一控制指令调起对应的应用程序。该应用程序根据通过操作行为生成的参数数据进行相应的操作。
举例而言,以用户输入的内容为“用百度贴吧搜索中国好声音”为例,可先生成调起“百度贴吧应用程序”的控制指令,并将搜索行为“搜索中国好声音”作为参数数据发送给百度贴吧应用程序。百度贴吧应用程序在接收到控制指令时可启动并进入应用程序,并可根据传递的参数数据“搜索中国好声音”发送搜索中国好声音操作。也就是说说,可根据操作目标调起对应的应用程序,并将操作行为作为参数数据发送该应用程序,然后由该应用程序根据该参数数据自行处理。
为了使得用户能够具有更好的使用体验,可根据终端中所安装的应用程序的情况来对操作目标进行不同的处理。进一步地,在本发明的一个实施例中,如图10所示,该语音控制应用程序的装置还可包括:第一判断模块250、第二判断模块260和第二生成模块270。
具体地,第一判断模块250可用于在控制模块240根据第一控制指令调起操作目标对应的应用程序之前,判断终端中是否存在操作目标对应的应用程序。需要说明的是,在本发明的实施例中,操作目标对应的应用程序可以是终端中自带的服务,也可以是终端中已安装的应用程序,还可以是终端中未安装的应用程序。然而,由于确定的操作目标所对应的应用程序可能未在终端中安装,所以在控制模块240根据第一控制指令调起操作目标对应的应用程序之前,第一判断模块250可先判断终端中是否存在该操作目标所对应的应用程序。例如,第一判断模块250可将操作目标与终端中已安装的应用程序的名称进行比对,以查找终端中是否已安装该操作目标所对应的应用程序。
其中,在本发明的实施例中,控制模块240还可用于在存在操作目标对应的应用程序时,根据第一控制指令调起操作目标对应的应用程序,以使应用程序根据第二控制指令进行控制。
第二判断模块260可用于在不存在操作目标对应的应用程序时,进一步判断应用程序是否存在网页服务。更具体地,在第一判断模块250判断终端中不存在操作目标对应的应用程序时,第二判断模块260可判断该应用程序是否存在对应的网页服务。也就是说,第二判断模块260判断该应用程序是否具有支持的网页服务。例如,假设终端中不存在操作目标对应的百度贴吧应用程序,则第二判断模块260可判断该百度贴吧应用程序是否存在对应的网页服务,即是否存在百度贴吧网页。
第二生成模块270可用于在不存在网页服务时,生成下载提示信息并提供给用户。更具体地,在第二判断模块260判断操作目标对应的应用程序不存在对应的网页服务时,第二生成模块270可认为此时终端中没有合适的应用程序来执行该操作行为,此时可生成该操作目标所对应的应用程序的下载提示信息,该下载提示信息可包括操作行为执行失败原因信息、操作目标所对应的应用程序的下载地址信息等,并可将该下载提示信息提供给用户,使得用户可以了解到操作行为执行失败的原因,也为用户提供完成该操作行为所需要的工具,提升用户的使用体验。
其中,在本发明的实施例中,控制模块240还可用于在存在网页服务时,根据第一控制指令调起网页服务,以使网页服务根据第二控制指令进行控制。更具体地,在第二判断模块260判断操作目标对应的应用程序存在对应的网页服务时,控制模块240可根据第一控制指令调起该网页服务,该网页服务可根据上述第二控制指令调用内部内置的与操作行为对应的接口。
可以理解,由于确定的操作目标所对应的应用程序可能未在终端中安装,所以在不同的情况下需对操作目标做不同处理。例如,以操作目标为百度贴吧、操作行为为搜索中国好声音为例,当终端中存在百度贴吧应用程序时,如图3(a)所示,可调起该百度贴吧应用程序;当终端中不存在百度贴吧应用程序时,由于该百度贴吧应用程序存在对应的网页服务,所以如图3(b)所示,可调起网页版的百度贴吧,或者,如图3(c)所示,可直接调起该百度贴吧的插件。
由此,在根据第一控制指令调起操作目标对应的应用程序之前,可先判断终端中是否存在该操作目标所对应的应用程序,之后可根据判断结果进行相应的操作,尽可能地为用户提供能够执行操作行为的应用程序,使得用户能够具有更好的使用体验。
进一步地,在本发明的一个实施例中,如图11所示,该语音控制应用程序的装置还可包括:第三判断模块280,第三判断模块280可用于在文本信息中不包含操作目标的信息时,判断历史操作行为记录中是否存在操作行为。其中,在本发明的实施例中,确定模块220还可用于在第三判断模块280判断历史操作行为记录中存在操作行为时,根据操作行为在历史操作行为记录进行查找以确定对应的操作目标,以及在第三判断模块280判断历史操作行为记录中不存在操作行为时,对操作行为进行语义分析以确定与操作行为匹配的操作目标。
也就是说,当用户的输入中没有明显的信息表明操作目标的信息时,第三判断模块280可先根据分析出的操作行为判断用户是否已经有过确定的该操作行为的行为记录,若有,则确定模块220可直接使用之前分析使用过的操作目标对应的应用程序进行相应的处理;若没有,则确定模块220可通过对操作行为的语义分析提供最优的操作目标对应的应用程序。由此,即使在用户输入的内容没有明显的表明操作目标的信息时,也可以为尽可能提供更加精准的操作目标。
本发明实施例的语音控制应用程序的装置,可通过获取模块获取用户输入的语音信息,确定模块根据语音信息确定用户的操作意图,其中,操作意图包括操作目标和操作行为,第一生成模块根据操作目标生成第一控制指令,并根据操作行为生成第二控制指令,控制模块根据第一控制指令调起操作目标对应的应用程序,以使应用程序根据第二控制指令进行控制,即通过自动识别用户的语音,更精准地分析出用户的操作意图,分析出操作目标和操作行为,根据操作目标和操作行为直接为用户一步完成操作行为,缩短了用户的操作路径,节省了用户的操作时间,并且提高了用户的需求满意度,从而提升了用户体验。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种语音控制应用程序的方法,其特征在于,包括以下步骤:
获取用户输入的语音信息,并根据所述语音信息确定所述用户的操作意图,其中,所述操作意图包括操作目标和操作行为;
根据所述用户的操作意图生成对应的控制指令;以及
将所述控制指令发送至所述操作目标对应的应用程序,以使所述应用程序根据所述控制指令对所述应用程序中与所述操作行为对应的接口进行控制。
2.一种语音控制应用程序的方法,其特征在于,包括以下步骤:
获取用户输入的语音信息,并根据所述语音信息确定所述用户的操作意图,其中,所述操作意图包括操作目标和操作行为;
根据所述操作目标生成第一控制指令,并根据所述操作行为生成第二控制指令;以及
根据所述第一控制指令调起所述操作目标对应的应用程序,以使所述应用程序根据所述第二控制指令进行控制。
3.如权利要求1或2所述的语音控制应用程序的方法,其特征在于,根据所述语音信息确定所述用户的操作意图,具体包括:
对所述语音信息进行语音识别以生成对应的文本信息;以及
对所述文本信息进行语法分析以确定所述用户的操作意图。
4.如权利要求1所述的语音控制应用程序的方法,其特征在于,在将所述控制指令发送至所述操作目标对应的应用程序之前,所述方法还包括:
判断终端中是否存在所述操作目标对应的应用程序;
如果存在所述操作目标对应的应用程序,则将所述控制指令发送至所述操作目标对应的应用程序;
如果不存在所述操作目标对应的应用程序,则进一步判断所述应用程序是否存在网页服务;
如果存在所述网页服务,则调起所述应用程序对应的网页服务,其中,所述网页服务根据所述控制指令对所述网页服务中与所述操作行为对应的接口进行控制;以及
如果不存在所述网页服务,则生成下载提示信息并提供给所述用户。
5.如权利要求2所述的语音控制应用程序的方法,其特征在于,在根据所述第一控制指令调起所述操作目标对应的应用程序之前,所述方法还包括:
判断终端中是否存在所述操作目标对应的应用程序;
如果存在所述操作目标对应的应用程序,则根据所述第一控制指令调起所述操作目标对应的应用程序;
如果不存在所述操作目标对应的应用程序,则进一步判断所述应用程序是否存在网页服务;
如果存在所述网页服务,则根据所述第一控制指令调起所述网页服务,以使所述网页服务根据所述第二控制指令进行控制;
如果不存在所述网页服务,则生成下载提示信息并提供给所述用户。
6.如权利要求3所述的语音控制应用程序的方法,其特征在于,当所述文本信息中不包含所述操作目标的信息时,所述方法还包括:
判断历史操作行为记录中是否存在所述操作行为;
如果存在,则根据所述操作行为在所述历史操作行为记录进行查找以确定对应的操作目标;
如果不存在,则对所述操作行为进行语义分析以确定与所述操作行为匹配的操作目标。
7.一种语音控制应用程序的装置,其特征在于,包括:
获取模块,用于获取用户输入的语音信息;
确定模块,用于根据所述语音信息确定所述用户的操作意图,其中,所述操作意图包括操作目标和操作行为;
第一生成模块,用于根据所述用户的操作意图生成对应的控制指令;以及
发送模块,用于将所述控制指令发送至所述操作目标对应的应用程序,以使所述应用程序根据所述控制指令对所述应用程序中与所述操作行为对应的接口进行控制。
8.一种语音控制应用程序的装置,其特征在于,包括:
获取模块,用于获取用户输入的语音信息;
确定模块,用于根据所述语音信息确定所述用户的操作意图,其中,所述操作意图包括操作目标和操作行为;
第一生成模块,用于根据所述操作目标生成第一控制指令,并根据所述操作行为生成第二控制指令;以及
控制模块,用于根据所述第一控制指令调起所述操作目标对应的应用程序,以使所述应用程序根据所述第二控制指令进行控制。
9.如权利要求7或8所述的语音控制应用程序的装置,其特征在于,所述确定模块具体用于:
对所述语音信息进行语音识别以生成对应的文本信息;以及
对所述文本信息进行语法分析以确定所述用户的操作意图。
10.如权利要求7所述的语音控制应用程序的装置,其特征在于,还包括:
第一判断模块,用于在所述发送模块将所述控制指令发送至所述操作目标对应的应用程序之前,判断终端中是否存在所述操作目标对应的应用程序;
第二判断模块,用于在不存在所述操作目标对应的应用程序时,进一步判断所述应用程序是否存在网页服务;
控制模块,用于在存在所述网页服务时,调起所述应用程序对应的网页服务,其中,所述网页服务根据所述控制指令对所述网页服务中与所述操作行为对应的接口进行控制;
第二生成模块,用于在不存在所述网页服务时,生成下载提示信息并提供给所述用户。
11.如权利要求8所述的语音控制应用程序的装置,其特征在于,还包括:
第一判断模块,用于在所述控制模块根据所述第一控制指令调起所述操作目标对应的应用程序之前,判断终端中是否存在所述操作目标对应的应用程序;
第二判断模块,用于在不存在所述操作目标对应的应用程序时,进一步判断所述应用程序是否存在网页服务;
第二生成模块,用于在不存在所述网页服务时,生成下载提示信息并提供给所述用户;其中,
所述控制模块还用于在存在所述网页服务时,根据所述第一控制指令调起所述网页服务,以使所述网页服务根据所述第二控制指令进行控制。
12.如权利要求9所述的语音控制应用程序的装置,其特征在于,还包括:
第三判断模块,用于在所述文本信息中不包含所述操作目标的信息时,判断历史操作行为记录中是否存在所述操作行为;其中,
所述确定模块还用于在所述第三判断模块判断所述历史操作行为记录中存在所述操作行为时,根据所述操作行为在所述历史操作行为记录进行查找以确定对应的操作目标,以及在所述第三判断模块判断所述历史操作行为记录中不存在所述操作行为时,对所述操作行为进行语义分析以确定与所述操作行为匹配的操作目标。
CN201510547927.1A 2015-08-31 2015-08-31 语音控制应用程序的方法和装置 Active CN105183422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510547927.1A CN105183422B (zh) 2015-08-31 2015-08-31 语音控制应用程序的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510547927.1A CN105183422B (zh) 2015-08-31 2015-08-31 语音控制应用程序的方法和装置

Publications (2)

Publication Number Publication Date
CN105183422A true CN105183422A (zh) 2015-12-23
CN105183422B CN105183422B (zh) 2018-06-05

Family

ID=54905529

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510547927.1A Active CN105183422B (zh) 2015-08-31 2015-08-31 语音控制应用程序的方法和装置

Country Status (1)

Country Link
CN (1) CN105183422B (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置
CN105893345A (zh) * 2016-03-28 2016-08-24 联想(北京)有限公司 一种信息处理方法和电子设备
CN106098061A (zh) * 2016-06-01 2016-11-09 Tcl集团股份有限公司 一种基于安卓系统的语音交互方法和装置
CN106372203A (zh) * 2016-08-31 2017-02-01 北京智能管家科技有限公司 一种智能终端的信息响应方法、装置和智能终端
CN106407393A (zh) * 2016-09-19 2017-02-15 北京智能管家科技有限公司 一种用于智能设备的信息处理方法及装置
CN106558310A (zh) * 2016-10-14 2017-04-05 北京百度网讯科技有限公司 虚拟现实语音控制方法及装置
CN107015780A (zh) * 2017-03-03 2017-08-04 安徽云未科技有限公司 一种可配置的声控操作软件及语音反馈方法和系统
CN107122179A (zh) * 2017-03-31 2017-09-01 阿里巴巴集团控股有限公司 语音的功能控制方法和装置
CN107346228A (zh) * 2017-07-04 2017-11-14 联想(北京)有限公司 电子设备的语音处理方法及系统
CN107492374A (zh) * 2017-10-11 2017-12-19 深圳市汉普电子技术开发有限公司 一种语音控制方法、智能设备及存储介质
CN107919120A (zh) * 2017-11-16 2018-04-17 百度在线网络技术(北京)有限公司 语音交互方法及装置,终端,服务器及可读存储介质
CN107977183A (zh) * 2017-11-16 2018-05-01 百度在线网络技术(北京)有限公司 语音交互方法、装置及设备
CN108121721A (zh) * 2016-11-28 2018-06-05 渡鸦科技(北京)有限责任公司 意图识别方法及装置
CN108231076A (zh) * 2018-01-04 2018-06-29 广州视源电子科技股份有限公司 一种语音控制方法、装置、设备及存储介质
CN108762851A (zh) * 2018-06-04 2018-11-06 联想(北京)有限公司 电子设备的操作方法和电子设备
CN108897552A (zh) * 2018-06-15 2018-11-27 联想(北京)有限公司 功能实现方法及系统
CN108986814A (zh) * 2018-09-04 2018-12-11 出门问问信息科技有限公司 一种唤醒应用服务的方法及装置
CN109360557A (zh) * 2018-10-10 2019-02-19 腾讯科技(北京)有限公司 语音控制应用程序的方法、装置和计算机设备
CN109408623A (zh) * 2018-10-31 2019-03-01 北京小米移动软件有限公司 信息处理方法及装置
CN109582860A (zh) * 2018-10-26 2019-04-05 北京蓦然认知科技有限公司 一种应用分发的方法、装置和系统及计算机可读存储介质
CN109697098A (zh) * 2018-12-24 2019-04-30 南京国电南自电网自动化有限公司 一种继电保护装置人机界面智能组态方法
CN109716325A (zh) * 2016-09-13 2019-05-03 微软技术许可有限责任公司 计算机化的自然语言查询意图分派
CN110046045A (zh) * 2019-04-03 2019-07-23 百度在线网络技术(北京)有限公司 语音唤醒的数据包处理方法和装置
CN110620705A (zh) * 2018-06-19 2019-12-27 芜湖美的厨卫电器制造有限公司 智能浴室的控制终端和控制方法、电子设备
CN110875940A (zh) * 2018-08-31 2020-03-10 比亚迪股份有限公司 基于虚拟机器人的应用程序调用方法、装置和设备
CN111782992A (zh) * 2020-09-04 2020-10-16 北京维数统计事务所有限公司 显示控制方法、装置、设备及可读存储介质
CN112242141A (zh) * 2020-10-15 2021-01-19 广州小鹏汽车科技有限公司 一种语音控制方法、智能座舱、服务器、车辆和介质
CN113076077A (zh) * 2021-03-29 2021-07-06 北京梧桐车联科技有限责任公司 安装车载程序的方法、装置和设备
CN113555013A (zh) * 2020-04-23 2021-10-26 百度在线网络技术(北京)有限公司 一种语音交互的方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102520788A (zh) * 2011-11-16 2012-06-27 歌尔声学股份有限公司 一种语音识别控制方法
CN102883041A (zh) * 2012-08-02 2013-01-16 聚熵信息技术(上海)有限公司 移动终端的语音控制装置及方法
CN103035240A (zh) * 2011-09-28 2013-04-10 苹果公司 用于使用上下文信息的语音识别修复的方法和系统
CN103116483A (zh) * 2012-11-29 2013-05-22 深圳市金立通信设备有限公司 一种调用微博的方法、装置及终端
US20140040722A1 (en) * 2012-08-02 2014-02-06 Nuance Communications, Inc. Methods and apparatus for voiced-enabling a web application
CN103593230A (zh) * 2012-08-13 2014-02-19 百度在线网络技术(北京)有限公司 移动终端的后台任务控制方法及移动终端
CN103995657A (zh) * 2013-02-19 2014-08-20 Lg电子株式会社 移动终端及其控制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103035240A (zh) * 2011-09-28 2013-04-10 苹果公司 用于使用上下文信息的语音识别修复的方法和系统
CN102520788A (zh) * 2011-11-16 2012-06-27 歌尔声学股份有限公司 一种语音识别控制方法
CN102883041A (zh) * 2012-08-02 2013-01-16 聚熵信息技术(上海)有限公司 移动终端的语音控制装置及方法
US20140040722A1 (en) * 2012-08-02 2014-02-06 Nuance Communications, Inc. Methods and apparatus for voiced-enabling a web application
CN103593230A (zh) * 2012-08-13 2014-02-19 百度在线网络技术(北京)有限公司 移动终端的后台任务控制方法及移动终端
CN103116483A (zh) * 2012-11-29 2013-05-22 深圳市金立通信设备有限公司 一种调用微博的方法、装置及终端
CN103995657A (zh) * 2013-02-19 2014-08-20 Lg电子株式会社 移动终端及其控制方法

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389400B (zh) * 2015-12-24 2020-02-14 Tcl集团股份有限公司 语音交互方法及装置
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置
CN105893345A (zh) * 2016-03-28 2016-08-24 联想(北京)有限公司 一种信息处理方法和电子设备
CN106098061A (zh) * 2016-06-01 2016-11-09 Tcl集团股份有限公司 一种基于安卓系统的语音交互方法和装置
CN106372203A (zh) * 2016-08-31 2017-02-01 北京智能管家科技有限公司 一种智能终端的信息响应方法、装置和智能终端
CN109716325B (zh) * 2016-09-13 2023-09-12 微软技术许可有限责任公司 计算机化的自然语言查询意图分派
CN109716325A (zh) * 2016-09-13 2019-05-03 微软技术许可有限责任公司 计算机化的自然语言查询意图分派
CN106407393A (zh) * 2016-09-19 2017-02-15 北京智能管家科技有限公司 一种用于智能设备的信息处理方法及装置
CN106407393B (zh) * 2016-09-19 2020-01-31 北京儒博科技有限公司 一种用于智能设备的信息处理方法及装置
CN106558310A (zh) * 2016-10-14 2017-04-05 北京百度网讯科技有限公司 虚拟现实语音控制方法及装置
US10714090B2 (en) 2016-10-14 2020-07-14 Beijing Baidu Netcom Science And Technology Co., Ltd. Virtual reality speech control method and apparatus
CN108121721A (zh) * 2016-11-28 2018-06-05 渡鸦科技(北京)有限责任公司 意图识别方法及装置
CN107015780A (zh) * 2017-03-03 2017-08-04 安徽云未科技有限公司 一种可配置的声控操作软件及语音反馈方法和系统
US10991371B2 (en) 2017-03-31 2021-04-27 Advanced New Technologies Co., Ltd. Voice function control method and apparatus
WO2018177233A1 (zh) * 2017-03-31 2018-10-04 阿里巴巴集团控股有限公司 语音的功能控制方法和装置
US10643615B2 (en) 2017-03-31 2020-05-05 Alibaba Group Holding Limited Voice function control method and apparatus
CN107122179A (zh) * 2017-03-31 2017-09-01 阿里巴巴集团控股有限公司 语音的功能控制方法和装置
CN107346228A (zh) * 2017-07-04 2017-11-14 联想(北京)有限公司 电子设备的语音处理方法及系统
CN107492374A (zh) * 2017-10-11 2017-12-19 深圳市汉普电子技术开发有限公司 一种语音控制方法、智能设备及存储介质
CN107919120A (zh) * 2017-11-16 2018-04-17 百度在线网络技术(北京)有限公司 语音交互方法及装置,终端,服务器及可读存储介质
CN107977183A (zh) * 2017-11-16 2018-05-01 百度在线网络技术(北京)有限公司 语音交互方法、装置及设备
US10811010B2 (en) 2017-11-16 2020-10-20 Baidu Online Network Technology (Beijing) Co., Ltd. Voice interaction method and apparatus, terminal, server and readable storage medium
CN107919120B (zh) * 2017-11-16 2020-03-13 百度在线网络技术(北京)有限公司 语音交互方法及装置,终端,服务器及可读存储介质
CN108231076A (zh) * 2018-01-04 2018-06-29 广州视源电子科技股份有限公司 一种语音控制方法、装置、设备及存储介质
CN108762851A (zh) * 2018-06-04 2018-11-06 联想(北京)有限公司 电子设备的操作方法和电子设备
CN108897552A (zh) * 2018-06-15 2018-11-27 联想(北京)有限公司 功能实现方法及系统
CN110620705A (zh) * 2018-06-19 2019-12-27 芜湖美的厨卫电器制造有限公司 智能浴室的控制终端和控制方法、电子设备
CN110875940A (zh) * 2018-08-31 2020-03-10 比亚迪股份有限公司 基于虚拟机器人的应用程序调用方法、装置和设备
CN108986814A (zh) * 2018-09-04 2018-12-11 出门问问信息科技有限公司 一种唤醒应用服务的方法及装置
CN109360557A (zh) * 2018-10-10 2019-02-19 腾讯科技(北京)有限公司 语音控制应用程序的方法、装置和计算机设备
CN109582860A (zh) * 2018-10-26 2019-04-05 北京蓦然认知科技有限公司 一种应用分发的方法、装置和系统及计算机可读存储介质
CN109408623A (zh) * 2018-10-31 2019-03-01 北京小米移动软件有限公司 信息处理方法及装置
CN109408623B (zh) * 2018-10-31 2021-11-23 北京小米移动软件有限公司 信息处理方法及装置
CN109697098A (zh) * 2018-12-24 2019-04-30 南京国电南自电网自动化有限公司 一种继电保护装置人机界面智能组态方法
CN110046045A (zh) * 2019-04-03 2019-07-23 百度在线网络技术(北京)有限公司 语音唤醒的数据包处理方法和装置
CN113555013A (zh) * 2020-04-23 2021-10-26 百度在线网络技术(北京)有限公司 一种语音交互的方法、装置、电子设备及存储介质
CN111782992A (zh) * 2020-09-04 2020-10-16 北京维数统计事务所有限公司 显示控制方法、装置、设备及可读存储介质
CN112242141A (zh) * 2020-10-15 2021-01-19 广州小鹏汽车科技有限公司 一种语音控制方法、智能座舱、服务器、车辆和介质
CN112242141B (zh) * 2020-10-15 2022-03-15 广州小鹏汽车科技有限公司 一种语音控制方法、智能座舱、服务器、车辆和介质
CN113076077A (zh) * 2021-03-29 2021-07-06 北京梧桐车联科技有限责任公司 安装车载程序的方法、装置和设备

Also Published As

Publication number Publication date
CN105183422B (zh) 2018-06-05

Similar Documents

Publication Publication Date Title
CN105183422A (zh) 语音控制应用程序的方法和装置
US20220221959A1 (en) Annotations in software applications for invoking dialog system functions
CN107146606B (zh) 开发人员语音动作系统
US8370826B2 (en) Automatically managing versioning of mashup widgets
JP7112991B2 (ja) インタラクション方法および装置
CN105279278A (zh) 文件的搜索方法及装置
CN103456296A (zh) 提供语音识别功能的方法及其电子设备
CN105303105A (zh) 窗口消息拦截方法、装置和终端设备
US11176934B1 (en) Language switching on a speech interface device
CN102955706B (zh) 一种双操作系统的安装方法以及引导加载方法
CN105227626A (zh) 一种内容推送方法、装置及终端
CN110018858A (zh) 一种基于语音控制的应用管理方法、装置
CN105183778A (zh) 服务提供方法和装置
CN105404617A (zh) 一种远程桌面的控制方法、受控端及控制系统
CN105279227A (zh) 同音词的语音搜索处理方法及装置
CN106603465A (zh) 服务账号关联方法、装置、系统及终端设备
CN103995845A (zh) 信息搜索方法及其装置
CN103186671A (zh) 用于移动终端的搜索方法、搜索系统及移动终端
CN107093087B (zh) 入门者应用中的上下文诱导
CN105224574A (zh) 垃圾文件自动识别的方法和装置
CN104503994A (zh) 基于输入法的信息推荐方法及装置
CN112534799A (zh) 基于语音执行功能的方法和支持该方法的电子设备
CN104021039A (zh) 应用程序app的调用方法及浏览器
CN104699744A (zh) 信息搜索方法及装置
CN103390060A (zh) 基于移动终端的歌曲推荐方法与装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant