CN102375535A

CN102375535A - 一种视频监控中的人机交互方法和装置、视频监控系统

Info

Publication number: CN102375535A
Application number: CN2010102636206A
Authority: CN
Inventors: 乔启盛
Original assignee: Vimicro Corp
Current assignee: Mid Star Technology Ltd By Share Ltd; Vimicro Corp
Priority date: 2010-08-25
Filing date: 2010-08-25
Publication date: 2012-03-14
Anticipated expiration: 2030-08-25
Also published as: CN102375535B

Abstract

本发明提供了一种视频监控中的人机交互方法和装置、视频监控系统，其中的装置具体包括：数据库，包括：定位库及模板库；提示模块，用于在接受到第一预置操作时，传输根级定位表语音数据；语音输出模块，用于输出语音数据；语音采集模块，用于采集用户根据输出语音数据所回复的语音数据；交互模块，包括：语音匹配单元，用于针对用户回复语音数据，将其与用户回复语音数据模板进行匹配，并获取匹配成功的用户回复语音模板的文本；确定单元，用于将所述文本确定为当前级定位表的选项序号；及交互单元，用于依据该选项序号所在记录的处理信息，获取相应的语音数据，并发送至所述语音输出模块。本发明能够在满足用户需求的同时，摆脱网络束缚。

Description

一种视频监控中的人机交互方法和装置、视频监控系统

技术领域

本发明涉及视频监控技术领域，特别是涉及一种视频监控中的人机交互方法和装置、视频监控系统。

背景技术

目前随着电子设备和网络的大规模使用以及数字信息和媒体业务的逐渐发展，视频监控得到了迅速发展。

作为典型的视频监控系统，IP Camera(网络摄像机，Internet ProtocolCamera)能够捕获影像，并直接通过局域网、国际互联网或无线网络进行传输，从而使授权用户能够通过标准的、基于独立网际协议的网络基础架构在本地或者远程地点实现观看、存储和管理视频数据。

IP Camera拥有自己独立的IP地址，能够直接连接到网络并内置网络服务器(Web Server)、文件传输协议(FTP，File Transfer Protocol)服务器、FTP客户端、电子邮件客户端、报警管理、可编程能力以及其它众多的智能功能。通常，IP Camera传送来的视频信号数字化后由高速压缩芯片压缩，通过网络总线传送到Web Server。用户可以通过网络直接用浏览器观看IPCamera捕捉的图像。

在实际中，IP Camera独立运行，无需与PC(Personal Computer)连接，可以安置在任何一个具备IP网络接口的地点。

但是，用户在使用IP Camera的过程中存在着各种各样的需求。例如，需要进行更改登录口令、停止视频监控等系统配置操作，或者，在系统升级方面存在需求等等；这样，授权用户不得不通过网络来执行上述系统配置、查询帮助等操作，由于依赖网络，在用户所在地可能出现网络故障，或者，没有网络时，不能及时满足用户需求。

总之，需要本领域技术人员迫切解决的一个技术问题就是：如何能够在满足用户需求的同时，摆脱网络束缚。

发明内容

本发明所要解决的技术问题是提供一种视频监控中的人机交互方法和装置、视频监控系统，用以在满足系统配置、系统诊断、意见反馈等用户需求的同时，摆脱网络束缚。

为了解决上述问题，本发明公开了一种视频监控中的人机交互装置，包括：

数据库，包括：

定位库，包括各级定位表，该各级定位表包括根级定位表和子级定位表，用于存储选项序号和处理信息；及

模板库，用于存储用户回复语音数据模板及相应的文本；

提示模块，用于在接受到用户的第一预置操作时，将预先录制的根级定位表语音数据传输至语音输出模块；

语音输出模块，用于输出语音数据；

语音采集模块，用于采集用户根据输出语音数据所回复的语音数据；

交互模块，包括：

语音匹配单元，用于针对当前用户回复语音数据，将其与模板库中的用户回复语音数据模板进行匹配，并获取匹配成功的用户回复语音模板的文本；

确定单元，用于将所述用户回复语音数据模板的文本确定为当前级定位表的选项序号；及

交互单元，用于依据该选项序号所在记录的处理信息，获取相应的语音数据，并发送至所述语音输出模块。

另一方面，本发明还公开了一种视频监控系统，包括前述的视频监控中的人机交互装置。

另一方面，本发明还公开了一种视频监控中的人机交互方法，包括：

在接受到用户的第一预置操作时，输出预先录制的根级定位表语音数据；

采集用户根据输出语音数据所回复的语音数据；

针对当前用户回复语音数据，将其与模板库中的用户回复语音数据模板进行匹配，并获取匹配成功的用户回复语音数据模板的文本，其中，所述模板库中存储有用户回复语音数据模板及相应的文本；

将所述用户回复语音数据模板的文本确定为当前级定位表的选项序号，其中，各级定位表包括根级定位表和子级定位表，其存储有选项序号和处理信息；

依据该选项序号所在记录的处理信息，输出相应的语音数据。

与现有技术相比，本发明具有以下优点：

本发明基于语音实现视频监控中的人机交互，具体而言，采用树形关系的各级定位表存储人机交互的流程，其中，根级定位表的存储内容包括有输出给用户的菜单，该根级定位表的每一条记录也即每一个菜单选项，子级定位表则存储有每一个菜单选项的细化内容；这样，本发明可以将各级定位表的存储内容以选项的形式通过语音输出模块提供给用户，通过语音采集模块接收用户回复的语音数据，进一步，可以基于各级定位表的树形关系，对所述用户回复语音数据进行响应；

由于以语音采集模块、语音输出模块等功能模块作为人机交互接口，也即，通过所述语音输出模块将机器语音数据传递给用户，而通过所述语音采集模块获取用户的回复语音数据，因此，本发明无需依赖网络，能够在网络故障或者网络缺乏时，及时满足系统配置、系统诊断、意见反馈等用户需求，从而能够增加用户进行系统配置的手段；帮助用户进行系统诊断；便于用户意见反馈；便于用户获得帮助；改善用户使用监控设备的感受，等等。

再者，由于本发明可以复用现有视频监控系统中的语音采集、语音输出等硬件模块，因而不会花费硬件成本。

附图说明

图1是本发明一种视频监控中的人机交互装置实施例的结构图；

图2是本发明一种视频监控中的人机交互方法实施例的流程图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明的核心构思之一在于，基于语音实现视频监控中的人机交互，该人机交互方法无需依赖网络，且可以复用现有视频监控系统中的语音采集、语音输出等硬件模块，因而不会花费硬件成本。

参照图1，示出了本发明一种视频监控中的人机交互装置实施例的结构图，具体可以包括：

提示模块101，用于在接受到用户的第一预置操作时，将预先录制的根级定位表语音数据传输至语音输出模块102；

语音输出模块102，用于输出语音数据；

语音采集模块103，用于采集用户根据输出语音数据所回复的语音数据；

数据库104，具体可以包括：

定位库141，其可以包括各级定位表，该各级定位表可以包括根级定位表和子级定位表，可用于存储选项序号和处理信息等字段；及

模板库142，用于存储用户回复语音数据模板及相应的文本；

交互模块105，具体可以包括：

语音匹配单元151，用于针对当前用户回复语音数据，将其与模板库中的用户回复语音数据模板进行匹配，并获取匹配成功的用户回复语音模板的文本；

确定单元152，用于将所述用户回复语音数据模板的文本确定为当前级定位表的选项序号；及

交互单元153，用于依据该选项序号所在记录的处理信息，获取相应的语音数据，并发送至所述语音输出模块102。

本发明可以应用于IP Camera等各种视频监控系统中，用于在不依赖网络的情况下进行人机交互，以满足系统配置、系统诊断、意见反馈等用户需求。

由于视频监控系统中本身具备语音输出模块102和语音采集模块103等硬件模块，本发明可以通过复用所述语音输出模块102和语音采集模块103，所以不会花费硬件成本。

本发明采用树形关系的各级定位表存储人机交互的流程，具体地，根级定位表的存储内容为展示给用户的菜单，该根级定位表的每一条记录也即每一个菜单选项；而子级定位表则是每一个菜单选项的细化，其与根级定位表具有相同的存储结构。

进一步，本发明实施例可以在一个各级定位表设置选项序号、选项名称、处理类型和处理信息等字段，其中，选项序号可以是1、2、3、4等数字符号，以方便用户应答回复；选项名称也即各菜单选项，用来表示各种人机交互功能；处理类型和处理信息的结合主要用来表示针对当前用户应答回复的处理。

举例来说，对于所述处理类型，可用1表示有子目录，相应地，处理信息可以存储该子目录的关系信息；可用2表示需要执行操作，相应地，处理信息可以存储执行程序信息；另外，可用3表示缺省行为，此时，处理信息可以不存储任何内容。

表1和表2，分别示出了上例情形下本发明一种根级定位表RootMenuTable和子级定位表SysconfTable的示例。

表1-RootMenuTable根级定位表

选项序号	选项名称	处理类型	处理信息
				1	系统配置	1	子级定位表名称为SysconfTable
2	系统诊断	1	子级定位表名称为DiagnoseTable
				3	意见反馈	1	子级定位表名称为FeedbackTable
4	查询帮助	1	子级定位表名称为HelpTable
				5	语音定制	1	子级定位表名称为ToneModelTable

表2-SysconfTable子级定位表

在实际中，用户可以通过第一预置操作来触发根级定位表，以使本发明的人机交互装置进入工作模式；例如，所述第一预置操作可以是连续短按复位按钮，其中，所述复位按钮可以位于现有视频监控系统上。

在接受到用户的第一预置操作时，提示模块101可将预先录制的根级定位表语音数据传输至语音输出模块102；作为本发明的一种示例，所述根级定位表语音数据既可以包括根级定位表的选项名称内容，还可以提供方便快捷的选项序号内容。

以表1所示的RootMenuTable根级定位表为例，其语音数据可以包括如下内容：如进行系统配置可回答1；如进行系统诊断，则回答2；如反馈意见，则回答3；如查询帮助，可回答4；如语音定制，可回答5。

这样，用户可以通过回复1-5中的任一数字，下面以用户回复数字“1”为例，说明交互模块105的工作过程。

步骤R1、语音匹配单元151将“1”与模板库中的用户回复语音数据模板进行匹配，并获取匹配成功的用户回复语音数据模板的文本“1”；

步骤R2、确定单元152将所述用户回复语音数据模板的文本“1”确定为当前级定位表的选项序号；

也即，当前RootMenuTable根级定位表的选项序号为1。

步骤R3、交互单元153依据该选项序号所在记录的处理信息，获取相应的语音数据，并发送至所述语音输出模块102。

在本发明的一种优选实施例中，所述数据库还可以包括：素材库，用于存储与各级定位表相应的语音数据；

依据不同的处理信息，本步骤可以有不同的实现情形：

情形一、

在所述处理信息为关系信息时，所述交互单元153可以包括：

第一交互单元，用于在该选项序号所在记录的处理信息为关系信息时，根据该关系信息确定下一级定位表，并依据素材库获取与该下一级定位表相应的语音数据，发送至语音输出模块102。

例如，第一交互单元在RootMenuTable中的第一个字段查找1，找到其所在记录的处理信息为“子级定位表名称为SysconfTable”时，则依据素材库获取与该SysconfTable定位表相应的语音数据，发送至语音输出模块102。

实际中，在所述各级定位表包括ID信息时，所述当前级定位表中某一记录的关系信息还可以为下一级定位表的ID信息。

本发明可以提供如下依据素材库获取与该下一级定位表相应的语音数据的方案：

方案一、

本方案的基本思想在于，在各级定位表的选项名称中存储选项序号的语音片段，以及，在所述素材库中设计选项序号、第一预置语音数据和第二预置语音数据等字段，从而以记录为单位，获取和输出相应的语音数据。

相应地，所述第一交互单元可以进一步包括如下子单元：

第一确定子单元A1，用于在该选项序号所在记录的处理信息为关系信息时，根据该关系信息确定下一级定位表；

第一获取子单元A2，用于针对下一级定位表中的某一记录，依据其选项序号，从素材库中获取相应的第一预置语音数据；

第二获取子单元A3，用于获取该记录中选项名称所存储的语音片段；

第三获取子单元A4，用于依据该记录中的选项序号，从素材库中获取相应的第二预置语音数据；及

第一发送子单元A5，用于以记录为单位，将相应的第一预置语音数据、语音片段和第二预置语音数据，并发送至语音输出模块101。

表3，示出了此种情况下一种素材库的应用示例，将其结合SysconfTable子级定位表，那么，针对SysconfTable子级定位表的第一条记录，第一获取子单元A2、第二获取子单元A3、第三获取子单元A4获取的语音数据分别为“第一项是”、“更改登录口令“、“如果选择该选项请回答1”，那么，第一发送子单元A5依次发送上述语音数据。

表3-素材库OptionTable

在第一预置语音数据、第二预置语音数据、选项名称所存储的语音片段三者中任一发生变化时，本方案都可以通过修改相应的字段来适应上述变化，因而具有方便修改和维护的优点。

方案二、

本方案的基本思想在于，预先存储整个各级定位表的语音数据，无需控制，即可一次性输出该语音数据。

在具体实现中，所述素材库的字段可以包括各级定位表的ID信息和第三预置语音数据；

此时，所述第一交互单元具体可以包括：

第二确定子单元B1，用于在该选项序号所在记录的处理信息为下一级定位表的ID信息时，根据所述下一级定位表的ID信息确定下一级定位表；

第四获取子单元B2、，用于依据下一级定位表的ID信息，从素材库中获取相应的第三预置语音数据；及

第二发送子单元B3，用于将相应的第三预置语音数据，发送至语音输出模块。

本方案具有控制简单的优点，但是，在用户需求(如语音数据形式)发生变化时，需要重新录制所述各级定位表的语音数据，因而不易于修改和维护。

可以理解，本领域技术人员可以根据需要，选用上述任一方案，或者，设计其它方案，本发明对此不加以限制。

情形二、

在所述处理信息为执行程序信息时，所述交互单元153可以包括：

第二交互单元，用于在该选项序号所在记录的处理信息为执行程序信息时，根据该执行程序信息获取执行结果，并将所述执行结果转换成语音形式，发送至语音输出模块102。

以RootMenuTable根级定位表中的选项名称“系统配置”为例，SysconfTable子级定位表可进一步提供：更改登录口令，停止视频监控，停止ADSL拨号，停止连接平台服务器等执行选项。

同理，选项名称“系统诊断”的子级定位表，可进一步提供：内存空间，硬盘空间，是否可识别TF卡等执行选项。

或者，选项名称“意见反馈”的子级定位表，可进一步提供：通过文本方式反馈，通过录音方式反馈，通过视频方式反馈，通过音视频方式反馈等执行选项。

或者，选项名称“查询帮助”的子级定位表，可进一步提供：怎样升级，联系电话，网络配置等执行选项。

或者，选项名称“语音定制”的子级定位表，可进一步提供：录制阿拉伯数字发音，录制英文字母发音，录制模式认证时语音识别需要的语音片段等执行选项。

特别地，对于“意见反馈”，如果网络连接正常，则装置可立刻将用户的意见以文本，语音或视频格式传输到运营商或制造商的咨询或平台服务器；

如连接不正常，则提示用户是否进行录制到本地硬盘还是只存储在内存中，以便以后网络正常时再传输到远端；当平台服务人员接收到用户的反馈意见时，可以通过传输文本，语音，视频等方式将信息传输给监控设备，以便监控设备在适当的时机通知用户。

这样，所述执行程序信息为意见反馈信息时，所述交互模块105还可以包括：

接收单元，用于接收来自网络的意见反馈信息；

所述提示模块101，还可用于在监测到接收单元中存在意见反馈信息时，将收听该意见反馈信息的提示，传输至语音输出模块101。

在实际中，模板库142的建立方法有很多。例如，可以在装置中设置模板库建立模块，其具体可以包括：

传输单元，用于将针对某一文本的录音提示语音数据，传输至语音输出模块；

存储单元，用于接收来自采集模块的用户回复语音数据，将其作为用户回复语音数据模板，连同相应的文本存储至所述模板库142。

其中，所述文本可以是1、2、3、4等阿拉伯数字，或者英文字母，本发明对此不加以限制。

又如，用户可以在各种时刻，进入选项名称“语音定制”的子级定位表，进行用户语音数据模板的建立。

可以理解，在用户需要本发明装置停止工作时，可以设置一关闭模块，其可用于在接受到用户的第二预置操作时，停止工作。例如，所述第二预置操作可以是长按复位按钮等，本发明对此不加以限制。

前述视频监控中的人机交互装置也可用于各种视频监控系统中，例如，一种视频监控系统实施例可以包括IP Camera和人机交互装置，其中，IPCamera和人机交互装置公用语音输出模块和语音采集模块。

与前述装置实施例相应，本发明还公开了一种视频监控中的人机交互方法实施例，参照图2，该视频监控中的人机交互方法具体可以包括：

步骤201、在接受到用户的第一预置操作时，输出预先录制的根级定位表语音数据；

步骤202、采集用户根据输出语音数据所回复的语音数据；

步骤203、针对当前用户回复语音数据，将其与模板库中的用户回复语音数据模板进行匹配，并获取匹配成功的用户回复语音数据模板的文本，其中，所述模板库中存储有用户回复语音数据模板及相应的文本；

步骤204、将所述用户回复语音数据模板的文本确定为当前级定位表的选项序号，其中，各级定位表包括根级定位表和子级定位表，其存储有选项序号和处理信息；

在实际中，所述各级定位表可以包括ID信息；此时，所述当前级定位表中某一记录的关系信息为下一级定位表的ID信息。

步骤205、依据该选项序号所在记录的处理信息，输出相应的语音数据。

在本发明的一种优选实施例中，所述处理信息可以进一步包括关系信息和执行程序信息；

相应地，所述步骤205可以包括：

子步骤S1、在该选项序号所在记录的处理信息为关系信息时，根据该关系信息确定下一级定位表，依据素材库获取与该下一级定位表相应的语音数据，并输出该语音数据，其中，所述素材库中存储有与各级定位表相应的语音数据；

本发明可以提供如下子步骤S1中依据素材库获取与该下一级定位表相应的语音数据的方案：

方案一、

本方案的基本思想在于，在各级定位表的选项名称中存储选项序号的语音片段，在所述素材库中设计选项序号、第一预置语音数据和第二预置语音数据等字段，从而以记录为单位，获取和输出相应的语音数据。

相应地，所述依据素材库获取与该下一级定位表相应的语音数据的步骤，具体可以包括：

子步骤C1、针对下一级定位表中的某一记录，依据其选项序号，从素材库中获取相应的第一预置语音数据；

子步骤C2、获取该记录中选项名称所存储的语音片段；

子步骤C3、依据该记录中的选项序号，从素材库中获取相应的第二预置语音数据；

子步骤C4、以记录为单位，输出相应的第一预置语音数据、语音片段和第二预置语音数据，并发送至语音输出模块。

方案二、

此时，所述依据素材库获取与该下一级定位表相应的语音数据的步骤，具体可以包括：

子步骤D1、依据下一级定位表的ID信息，从素材库中获取相应的第三预置语音数据；

子步骤D2、输出所述第三预置语音数据。

子步骤S2、在该选项序号所在记录的处理信息为执行程序信息时，根据该执行程序信息获取执行结果，将所述执行结果转换成语音形式并输出。

对于所述该选项序号所在记录的处理信息为执行程序信息的情形，可以设置选项名称“意见反馈”的子级定位表，该表可提供：通过文本方式反馈，通过录音方式反馈，通过视频方式反馈，通过音视频方式反馈等执行选项。

此时，所述方法还可以包括：

接收来自网络的意见反馈信息；

在监测到所述意见反馈信息时，提示用户是否收听该意见反馈信息。

在实际中，模板库的建立方法有很多。例如，可以依据如下步骤建立模板库：

输出针对某一文本的录音提示语音数据；

接收来自采集模块的用户回复语音数据，将其作为用户回复语音数据模板，连同相应的文本存储至所述模板库。

可以理解，在用户需要本发明装置停止工作时，还可以在接受到用户的第二预置操作时，停止人机交互工作。本领域技术人员可以根据实际需要，设置所述第二预置操作，本发明对此不加以限制。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于方法实施例而言，由于其与装置实施例基本相似，所以描述的比较简单，相关之处参见装置实施例的部分说明即可。

以上对本发明所提供的一种视频监控中的人机交互方法和装置、视频监控系统，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种视频监控中的人机交互装置，其特征在于，包括：

数据库，包括：

模板库，用于存储用户回复语音数据模板及相应的文本；

语音输出模块，用于输出语音数据；

交互模块，包括：

2.如权利要求1所述的装置，其特征在于，所述处理信息包括关系信息和执行程序信息；

所述数据库还包括：素材库，用于存储与各级定位表相应的语音数据；

所述交互单元包括：

第一交互单元，用于在该选项序号所在记录的处理信息为关系信息时，根据该关系信息确定下一级定位表，并依据素材库获取与该下一级定位表相应的语音数据，发送至语音输出模块；及

第二交互单元，用于在该选项序号所在记录的处理信息为执行程序信息时，根据该执行程序信息获取执行结果，并将所述执行结果转换成语音形式，发送至语音输出模块。

3.如权利要求2所述的装置，其特征在于，所述各级定位表还包括ID信息；

所述当前级定位表中某一记录的关系信息为下一级定位表的ID信息。

4.如权利要求2或3所述的装置，其特征在于，该各级定位表还用于存储选项名称，其中，所述选项名称用于存储选项序号序号的语音片段；

所述素材库的字段包括选项序号、第一预置语音数据和第二预置语音数据；

所述第一交互单元，包括：

第一确定子单元，用于在该选项序号所在记录的处理信息为关系信息时，根据该关系信息确定下一级定位表；

第一获取子单元，用于针对下一级定位表中的某一记录，依据其选项序号，从素材库中获取相应的第一预置语音数据；

第二获取子单元，用于获取该记录中选项名称所存储的语音片段；

第三获取子单元，用于依据该记录中的选项序号，从素材库中获取相应的第二预置语音数据；及

第一发送子单元，用于以记录为单位，将相应的第一预置语音数据、语音片段和第二预置语音数据，并发送至语音输出模块。

5.如权利要求3所述的装置，其特征在于，所述素材库的字段包括各级定位表的ID信息和第三预置语音数据；

所述第一交互单元，包括：

第二确定子单元，用于在该选项序号所在记录的处理信息为下一级定位表的ID信息时，根据所述下一级定位表的ID信息确定下一级定位表；

第四获取子单元，用于依据下一级定位表的ID信息，从素材库中获取相应的第三预置语音数据；及

第二发送子单元，用于将相应的第三预置语音数据，发送至语音输出模块。

6.如权利要求1、2或3所述的装置，其特征在于，还包括：

模板库建立模块，包括：

存储单元，用于接收来自采集模块的用户回复语音数据，将其作为用户回复语音数据模板，连同相应的文本存储至所述模板库。

7.如权利要求1、2或3所述的装置，其特征在于，所述执行程序信息为意见反馈信息；

所述交互模块还包括：

接收单元，用于接收来自网络的意见反馈信息；

所述提示模块，还用于在监测到接收单元中存在意见反馈信息时，将收听该意见反馈信息的提示，传输至语音输出模块。

8.如权利要求1、2或3所述的装置，其特征在于，还包括：

关闭模块，用于在接受到用户的第二预置操作时，停止工作。

9.一种视频监控系统，其特征在于，包括前述1、2或3所述的视频监控中的人机交互装置。

10.一种视频监控中的人机交互方法，其特征在于，包括：

采集用户根据输出语音数据所回复的语音数据；

11.如权利要求10所述的方法，其特征在于，所述处理信息包括关系信息和执行程序信息；

所述依据该选项序号所在记录的处理信息，输出相应的语音数据的步骤，包括：

在该选项序号所在记录的处理信息为关系信息时，根据该关系信息确定下一级定位表，依据素材库获取与该下一级定位表相应的语音数据，并输出该语音数据，其中，所述素材库中存储有与各级定位表相应的语音数据；

在该选项序号所在记录的处理信息为执行程序信息时，根据该执行程序信息获取执行结果，将所述执行结果转换成语音形式并输出。

12.如权利要求11所述的方法，其特征在于，所述各级定位表还包括ID信息；

13.如权利要求11或12所述的方法，其特征在于，所述各级定位表还存储有选项名称，其中，所述选项名称存储有选项序号序号的语音片段；

所述依据素材库获取与该下一级定位表相应的语音数据的步骤，包括：

针对下一级定位表中的某一记录，依据其选项序号，从素材库中获取相应的第一预置语音数据；

获取该记录中选项名称所存储的语音片段；

依据该记录中的选项序号，从素材库中获取相应的第二预置语音数据；

以记录为单位，输出相应的第一预置语音数据、语音片段和第二预置语音数据，并发送至语音输出模块。

14.如权利要求12所述的方法，其特征在于，所述素材库的字段包括各级定位表的ID信息和第三预置语音数据；

依据下一级定位表的ID信息，从素材库中获取相应的第三预置语音数据；

输出所述第三预置语音数据。

15.如权利要求10、11或12所述的方法，其特征在于，依据如下步骤建立模板库：

输出针对某一文本的录音提示语音数据；

16.如权利要求10、11或12所述的方法，其特征在于，所述执行程序信息为意见反馈信息；

所述方法还包括：

接收来自网络的意见反馈信息；

17.如权利要求10、11或12所述的方法，其特征在于，所述方法还包括：

在接受到用户的第二预置操作时，停止人机交互工作。