CN106205615B

CN106205615B - 一种基于语音交互的控制方法及系统

Info

Publication number: CN106205615B
Application number: CN201610736268.0A
Authority: CN
Inventors: 王峥嵘
Original assignee: Individual
Current assignee: Individual
Priority date: 2016-08-26
Filing date: 2016-08-26
Publication date: 2023-06-02
Anticipated expiration: 2036-08-26
Also published as: CN106205615A; CN116844543A

Abstract

本发明公开一种基于语音交互的控制方法及系统。该方法通过唤醒信号启动语音交互系统，语音交互系统实时侦听语音信息，将侦听的语音信息转换成文字信息，对转换的文字信息进行分析，通过与系统预先存储的功能参数判断语音信息对应的文字信息的功能参数是否完整，若完整，则执行相应的操作；若不完整，根据缺少的功能参数提示用户回复要执行的操作，从而实现实时通过语音调用系统操作。采用本发明的控制方法及系统，可随时通过语音调用应用程序，可随时选择不同功能操作，或者选择同一功能的不同执行参数，满足用户的不同需求，并且在调用过程中不需要用眼用手，还可实时对系统进行更新，大大的增加了语音交互控制系统的使用便捷性。

Description

一种基于语音交互的控制方法及系统

技术领域

本发明涉及智能控制领域，特别是涉及一种基于语音交互的控制方法及系统。

背景技术

语音交互控制是指通过语音交互来实现应用程序的调用。

现有的语音交互控制方法主要是根据用户的指令自动开启移动设备上的应用程序，但在使用过程中需要用户盯紧移动设备屏幕，用手去点击。当通过语音交互控制方法打开某一个应用程序时，需要用户手动关闭该应用程序，而且在执行该应用程序过程中需要调用其他应用程序时，必须重新启动语音交互控制方法进行调用。例如，当用语音交互控制方法打开地图程序之后，需要用户自己操作地图进行导航或者路线查询等操作，而且无法继续用语音交互控制方法调用短信等其他应用程序。这使得现有的语音交互控制方法使用便捷性不高。

发明内容

本发明的目的是提供一种基于语音交互的控制方法及系统，通过全语音交互的形式，实现对应用程序的调用，而且可实现多个程序同时调用与实时控制，以解决现有技术中语音交互控制方法及系统使用便捷性不高的问题。

为实现上述目的，本发明提供了如下方案：

一种基于语音交互的控制方法，所述方法包括：

获取唤醒信号，所述唤醒信号用于启动语音交互系统进入语音交互过程；

根据所述唤醒信号，启动所述语音交互系统；

获取语音信息；

判断所述语音信息是否能够被转换成文字信息，得到第一判断结果；

当所述第一判断结果为否时，返回所述获取语音信息步骤；

当所述第一判断结果为是时，对所述语音信息对应的文字信息进行分析，并存储分析结果，根据所述分析结果判断所述文字信息的功能参数是否完整，得到第二判断结果；

当所述第二判断结果为是时，则执行所述文字信息功能参数对应的操作，生成确认消息，并根据所述确认消息进行语音信息合成，并播放合成的语音信息；

当所述第二判断结果为否时，根据缺少的功能参数生成提示消息，并根据所述提示消息进行语音信息合成，并播放合成的语音信息，返回所述获取语音信息步骤。

可选的，所述根据所述唤醒信号，启动所述语音交互系统具体包括：

将所述唤醒信号与系统预存的唤醒词进行比对；

比对成功后，启动所述语音交互系统。

可选的，所述对所述语音信息对应的文字信息进行分析，并存储分析结果之后，还包括：

返回所述获取唤醒信号的步骤。

可选的，所述执行所述文字信息功能参数对应的操作之前，还包括：

当所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时，生成选择提示问题，并根据所述选择提示问题进行语音信息合成，并播放合成的语音信息，所述选择提示问题用于提示用户选择需要执行的操作选项。

可选的，所述生成选择提示问题具体包括：生成提示用户回复选项编号的消息，每个所述选项编号对应不同的所述操作选项的内容。

可选的，所述根据缺少的功能参数生成提示消息之后还包括：

当所述语音信息中包括完整的功能参数而所述分析结果为不完整时，

提示用户补充语义数据库；所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作；

获取所述用户输入的操作信息；

将所述语音信息中包括完整的功能参数以及所述用户输入的操作信息对应增加至所述语义数据库。

一种基于语音交互的系统，所述系统包括：

语音唤醒模块，用于获取唤醒信号，所述唤醒信号用于启动系统进入语音交互过程；

语音交互系统启动模块，用于根据所述唤醒信号，启动所述语音交互系统；

语音信息获取模块，用于获取语音信息；

语音信息判断模块，用于判断所述语音信息是否能够被转换成文字信息，得到第一判断结果；

语音分析模块，用于当所述第一判断结果为是时，对所述语音信息对应的文字信息进行分析；

存储模块，用于存储所述语音分析模块对所述语音信息对应的文字信息进行分析的分析结果；

功能参数判断模块，用于根据所述分析结果判断所述文字信息的功能参数是否完整，得到第二判断结果；

执行模块，用于当所述第二判断结果为是时，执行所述文字信息功能参数对应的操作；

确认消息生成模块，用于生成确认消息；

语音合成模块，用于进行语音信息合成；

语音播放模块，用于播放合成的语音信息；

提示消息生成模块，用于当所述第二判断结果为否时，根据缺少的功能参数生成提示消息。

可选的，所述语音交互系统启动模块具体包括：

语音交互系统比对模块，用于将所述唤醒信号与系统预存的唤醒词进行比对；

语音交互系统启动子模块，比对成功后，启动所述语音交互系统。。

可选的，所述系统还包括选择提示问题生成模块，用于当所述执行模块执行所述文字信息功能参数对应的操作之前，所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时，生成选择提示问题。

可选的，所述系统还包括语义补充模块，所述语义补充模块具体包括：

补充提示生成模块，用于当提示消息生成模块根据缺少的功能参数生成提示消息之后，所述语音信息中包括完整的功能参数而所述分析结果为不完整时，提示用户补充语义数据库；所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作；

输入模块，用于获取所述用户输入的操作信息；

语义数据库补充模块，用于将所述语音信息中包括完整的功能参数以及所述用户输入的操作信息对应增加至所述语义数据库。

根据本发明提供的具体实施例，本发明的有益效果为：

通过以下几个方面提高了语音交互控制方法及系统的使用便捷性：

(1)全语音操作，所有操作都通过语音方式实现，不需要用手用眼；

(2)随时语音开启操作，通过语音可随时开始新功能的操作，可随时选择不同功能操作，或者选择同一功能的不同执行参数，满足用户的不同需求；

(3)自定义配置语义知识库，可灵活扩展调整语义分析，增加处理执行的功能种类。

(4)操作简单，应用方便。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明基于语音交互的控制方法实施例1流程图；

图2为本发明基于语音交互的系统结构图；

图3为本发明基于语音交互的控制方法实施例2流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的目的是提供一种

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明基于语音交互的控制方法实施例1流程图。如图1所示，实施例1包括：

步骤101：获取唤醒信号，所述唤醒信号用于启动语音交互系统进入语音交互过程，用户可以随时通过语音唤醒控制来启动新的语音交互过程，进行唤醒时，将获取的声音数据流与某一个或多个预存的唤醒词的发声进行比对。例如，唤醒信号可以为“开启语音交互系统”，可以为“启动黑马”，一旦比对成功，则唤醒成功，启动语音交互系统，进入语音交互过程。

步骤102：获取语音信息，启动语音交互系统后，系统持续侦听语音信息；

步骤103：判断侦听到的语音信息是否可以转换成文字信息，生成第一判断结果；当第一判断结果为是时，执行步骤104；当第一判断结果为否时，返回步骤102；

步骤104：对语音信息对应的文字信息进行分析，提取文字信息中相应要操作的功能项以及功能项对应的参数项，每次一分析后，会将分析结果进行存储，并更新当前分析的结果，下一次分析时会依据上次存储的状态，对新的语音输入进行分析。功能参数提取方法可以是提取关键字，也可以是提取正则式；例如，文字信息“我要去天安门”将被提取出功能项为“导航”，参数项为“天安门”。

步骤105：根据提取的功能参数项判断功能参数是否完整，得到第二判断结果，当第二判断结果为否时，执行步骤106；当第二判断结果为是时，执行步骤107；

步骤106：根据缺少的功能参数生成提示问题，并返回步骤102继续获取语音信息。例如分析的语音信息为“我要去”，分析结果为缺少导航的目的地这一参数，生成提示问题可以为“请问您要去哪？”，也可以为“请输入您要去的目的地”。

步骤107：根据分析的功能参数执行相应的操作。例如，“我要去天安门”的分析结果功能项为“导航”，参数项为“天安门”，则开启地图实施导航功能，并指定目的地为天安门。若此时导航路线搜索结果为多种，则会根据导航路线生成选择提示问题向用户提示回复需要进行的操作，例如，去天安门的路线为3条，则生成的选择提示问题可以为“请回复您要选择的路线的选项编号：A、直行500米然后右转行驶1000米到达目的地；B、直行300米然后右转行驶1000米再左转200米到达目的地；C、右转行驶1000米然后左转行驶500米到达目的地”。

步骤108：生成确认消息，所述确认消息用于和用户确认已经执行相应的操作。例如执行操作导航去天安门，生成的确认消息可以为“已为您开启导航至天安门”。

图2为本发明基于语音交互的系统结构图。如图2所示，所述系统包括：语音唤醒模块201、语音交互系统启动模块202、语音信息获取模块203、语音信息判断模块204、语音分析模块205、存储模块206、功能参数判断模块207、提示消息生成模块208、执行模块209、确认消息生成模块2010、语音合成模块2011和语音播放模块2012。

语音唤醒模块201接收唤醒信号，将接收的唤醒信号与系统预存的一个或多个唤醒次进行比对，例如，唤醒信号可以为“开启语音交互系统”，可以为“启动黑马”，比对成功时，则唤醒信号触发语音交互系统启动模块202启动语音交互系统。语音交互系统启动后，语音信息获取模块203持续侦听语音信息，并将侦听到的语音信息传输至语音信息判断模块204，语音信息判断模块204判断传输的语音信息是否能够被转换成文字信息，如果能，则语义信息对应的文字信息传输至语音分析模块205对文字信息进行分析，语音分析模块205根据文字信息提取相应要操作的功能项以及功能项对应的参数项，每次一分析后，会将分析结果存储至存储模块206中，并更新当前分析的结果，下一次分析时会依据上次存储的状态，对新的语音输入进行分析。功能参数提取方法可以是提取关键字，也可以是提取正则式；例如，文字信息“我要去天安门”将被提取出功能项为“导航”，参数项为“天安门”。

功能参数判断模块207根据分析结果判断所述文字信息的功能参数是否完整，如果完整则通过执行模块209执行相应的操作，例如，“我要去天安门”的分析结果功能项为“导航”，参数项为“天安门”，则执行模块209开启地图实施导航功能，并指定目的地为天安门，然后通过确认消息生成模块2010生成确认消息，例如执行操作导航去天安门，生成的确认消息可以为“已为您开启导航至天安门”然后通过语音合成模块2011进行语音合成，通过语音播放模块2012进行语音播放。若此时导航路线搜索结果为多种，则会根据导航路线生成选择提示问题向用户提示回复需要进行的操作，例如，去天安门的路线为3条，则生成的选择提示问题可以为“请回复您要选择的路线的选项编号：A、直行500米然后右转行驶1000米到达目的地；B、直行300米然后右转行驶1000米再左转200米到达目的地；C、右转行驶1000米然后左转行驶500米到达目的地”通过语音合成模块2011进行语音合成，通过语音播放模块2012进行语音播放；如果判断所述文字信息的功能参数是不完整的，则通过提示消息生成模块208根据缺少的功能参数生成提示消息，例如，分析的语音信息为“我要去”，分析结果为缺少导航的目的地这一参数，生成提示问题可以为“请问您要去哪？”，也可以为“请回复您要去的目的地”，然后通过语音合成模块2011进行语音合成，通过语音播放模块2012进行语音播放。

图3为本发明基于语音交互的控制方法实施例2流程图。如图3所示，实施例2包括：

步骤301：唤醒系统，通过唤醒信号唤醒语音交互系统进入语音交互过程，此处设置唤醒信号为“启动语音”，当系统接收到“启动语音”信号时进入语音交互过程；

步骤302：获取语音信息，持续侦听语音信息；

步骤303：判断侦听的语音信息是否可以转换成文字信息，如果能转换成文字信息，执行步骤304；对于不能识别转换为文字信息的语音做丢弃处理，重新侦听语音信息。例如，侦听到鸟叫声，或者风声，都无法转换成相应的文字信息。

步骤304：对于可与转换成文字信息的语音信息，对其对应的文字信息进行分析，提取出相应的操作功能项与参数项；

步骤305：，与系统数据库中预先存储的功能项与参数项进行比对与调用，判断语音信息对应的文字信息中的功能参数是否完整，如果完整，执行步骤306，如果不完整，执行步骤307；

步骤306：根据分析的功能项与参数项调用相应模块，执行相应的操作。对于有歧义的操作，会进一步生成选择问题供用户选择。例如，地名有重复时，“我要去浦江”，由于浙江省金华市有浦江县，四川省成都市有蒲江县，两者名字相近，系统会提示“请您回复目的地的选项编号：A:浙江省金华市有浦江县，B:四川省成都市有蒲江县”。例如，当同时获取两个人语音信息时，“我要去天安门”和“打电话给小明”，系统会生成选择问题“请回复要进行的操作的选项编号：A:导航至天安门，B:打电话给小明”。

步骤307：对不完整的功能参数进行补充，此处包括两种类型，一是语音交互的形式，系统根据缺少的功能参数进行提问，用户语音回复需要进行的操作；二是当语音信息中包括完整的功能参数而分析结果为不完整时，系统提示用户补充语义数据库，语义数据库中存储有功能参数以及与该功能参数相对应的操作，用户可以通过手动输入将该语音信息中完整的功能参数对应增加至系统数据库中。除此之外，本发明的系统可以进行自动更新，实时更新数据库。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于语音交互的控制方法，其特征在于，所述方法包括：

在导航场景下，获取唤醒信号，所述唤醒信号用于启动语音交互系统进入语音交互过程；

根据所述唤醒信号，启动所述语音交互系统；

获取语音信息；其中，所述语音交互系统持续侦听语音信息，以实现全语音操作；

如果所述语音信息不能够被转换成文字信息，则丢弃，重新侦听语音信息；

当所述第一判断结果为是时，对所述语音信息对应的文字信息进行分析，以提取文字信息中相应要操作的功能项以及功能项对应的参数项，并存储分析结果，并更新当前分析的结果，下一次分析时会依据上次存储的状态对新的语音输入进行分析，根据所述分析结果判断所述文字信息的功能参数是否完整，得到第二判断结果；

当所述第二判断结果为是时，则执行所述文字信息功能参数对应的操作，生成确认消息，并根据所述确认消息进行语音信息合成，并播放合成的语音信息；其中，在所述执行所述文字信息功能参数对应的操作之前，还包括：当所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时，生成选择提示问题，并根据所述选择提示问题进行语音信息合成，并播放合成的语音信息，所述选择提示问题用于提示用户选择需要执行的操作选项；所述生成选择提示问题，包括：生成提示用户回复选项编号的消息，每个所述选项编号对应不同的所述操作选项的内容；

当所述第二判断结果为否时，根据缺少的功能参数生成提示消息，并根据所述提示消息进行语音信息合成，并播放合成的语音信息，返回所述获取语音信息步骤；在所述根据缺少的功能参数生成提示消息之后，还包括：当所述语音信息中包括完整的功能参数而所述分析结果为不完整时，提示用户补充语义数据库，以用于将补充的内容增加至所述语义数据库；所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作。

2.根据权利要求1所述的方法，其特征在于，所述根据所述唤醒信号，启动所述语音交互系统具体包括：

将所述唤醒信号与系统预存的唤醒词进行比对；

比对成功后，启动所述语音交互系统。

3.一种基于语音交互的系统，其特征在于，所述系统包括：

语音唤醒模块，用于在导航场景下，获取唤醒信号，所述唤醒信号用于启动系统进入语音交互过程；

语音信息获取模块，用于获取语音信息；其中，所述语音交互系统持续侦听语音信息，以实现全语音操作；

语音信息判断模块，用于判断所述语音信息是否能够被转换成文字信息，得到第一判断结果；如果所述语音信息不能够被转换成文字信息，则丢弃，重新侦听语音信息；

语音分析模块，用于当所述第一判断结果为是时，对所述语音信息对应的文字信息进行分析，以提取文字信息中相应要操作的功能项以及功能项对应的参数项；

存储模块，用于对所述语音信息对应的文字信息进行分析，以提取文字信息中相应要操作的功能项以及功能项对应的参数项，并存储分析结果，并更新当前分析的结果，下一次分析时会依据上次存储的状态对新的语音输入进行分析；

执行模块，用于当所述第二判断结果为是时，执行所述文字信息功能参数对应的操作；其中，在所述执行所述文字信息功能参数对应的操作之前，还包括：当所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时，生成选择提示问题，并根据所述选择提示问题进行语音信息合成，并播放合成的语音信息，所述选择提示问题用于提示用户选择需要执行的操作选项；所述生成选择提示问题，包括：生成提示用户回复选项编号的消息，每个所述选项编号对应不同的所述操作选项的内容；

确认消息生成模块，用于生成确认消息；

语音合成模块，用于进行语音信息合成；

语音播放模块，用于播放合成的语音信息；

提示消息生成模块，用于当所述第二判断结果为否时，根据缺少的功能参数生成提示消息，并根据所述提示消息进行语音信息合成，并播放合成的语音信息，返回所述获取语音信息步骤；在所述根据缺少的功能参数生成提示消息之后，还包括：当所述语音信息中包括完整的功能参数而所述分析结果为不完整时，提示用户补充语义数据库，以用于将补充的内容增加至所述语义数据库；所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作。

4.根据权利要求3所述的系统，其特征在于，所述语音交互系统启动模块具体包括：

语音交互系统启动子模块，比对成功后，启动所述语音交互系统。