CN103065628A

CN103065628A - 语音交互控制的导览系统及其方法

Info

Publication number: CN103065628A
Application number: CN 201210475130
Authority: CN
Inventors: 陈丽芳; 刘渊; 黄秋儒; 陆菁; 刘一鸣; 杜欣宇; 王君竹
Original assignee: Jiangnan University
Current assignee: Jiangnan University
Priority date: 2012-11-20
Filing date: 2012-11-20
Publication date: 2013-04-24

Abstract

语音交互控制的导览系统及其方法是一种利用语音交互的方式实现导览系统的导览功能。目前的导览系统的交互方式一般采用鼠标、键盘、图形文字相结合的触摸交互等。这些交互方式无法满足不同层次和不同群体的需要，例如盲人、不识字的小孩。语音交互控制的导览系统根据语音命令执行相应导览功能。系统采用自适应语音识别和启发提示方法。根据导览系统的性质，系统把导览常用相关词汇按照不同功能存放在后台数据库中，这样当用户发语音命令的时候，系统会在对应的库中搜索，提高匹配速度。如果没有找到对应的匹配词句，系统采用语音回应反问是否要做对应操作，此时用户只需回答“是”与“否”，系统进入下一步导览。实现人性化的导览功能。

Description

语音交互控制的导览系统及其方法

技术领域

本发明涉及语音识别、语音交互、导览技术和数字媒体等领域。公开了基于语音交互控制导览的实现方法，采用微软语音识别引擎，并通过最小均方误差为准则的自适应滤波器滤波和自适应识别的方法，提高语音的识别率和实时性。

背景技术

随着数字媒体和网路技术的不断成熟和普及，数字化导览系统的应用更加广泛，智慧城市体验馆的展示、智能家居的虚拟展示、智慧旅游的景点展示、公共产所的导引系统等，都具备导览功能。

目前，大部分导览系统的交互方式一般采用鼠标、键盘的交互、图形文字相结合的触摸交互等。这些交互方式不能满足不同层次和不同群体的需要。在语音交互控制的导览系统中，当用户发出语音命令时，系统根据语音命令执行相应导览功能。这种导览系统不仅可以满足普通用户的需求，同时可以满足一些特殊群体的要求，例如盲人、或是不识字的小孩和成人，只要他们能发出要求的语音，就可以自由导览，使系统更加人性化。

发明内容

本发明的目的是实现语音交互控制的导览系统，使导览系统能够满足多种群体的需求。

按照本发明提供的技术方案，语音交互控制的导览系统及其方法包含以下步骤：

1、在语音交互控制的导览系统及其方法中，利用麦克风来得到外界语音输入。

2、外界语音读入后，采用最小均方误差为准则的自适应滤波器对外界输入语音进行滤波降噪，消除环境噪音，使得在环境噪音很大的情况下，也能得到良好的效果。

3、利用自适应识别语音方法进一步提高识别率，实现步骤为：

(1)建立导览词汇库和模糊词汇库。

(2)利用基于智能搜索的改进隐马尔可夫模型，解决语音识别的模糊性和提高识别速度。

4、把步骤3处理的语音结果作为输入，利用微软语音识别引擎进行语音识别和匹配，进而触发相应的导航功能实现导览系统的导览功能。

本发明与已有导览系统相比，实现了利用语音交互控制导览系统的导航，满足多种群体的操作要求，在微软语音识别引擎识别之前增加了最小均方误差为准则的自适应滤波器去除环境噪声，并通过改进隐马尔可夫模型的自适应识别方法，提高识别率和识别速度，使系统适用的场合更加广泛。

附图说明

图1算法执行流程图

具体实施方式

下面本发明将结合附图对本发明的实施方式做进一步的介绍。

1、导览系统语音提示用户利用麦克风进行语音输入，以便易于区别有效的输入语音和外界环境音。

2、读入外界输入语音，利用最小均方误差为准则设计的自适应滤波器进行滤波，去除环境噪声。

3、自适应语音识别方法实现如下：

(1)根据导览系统的特点，建立相关的词汇数据库，数据库包含导览系统的控制命令词汇库以及控制命令词汇的模糊相关词汇库，其中模糊相关词汇库中存放控制导览执行的词汇的近义词和读音相近的词汇，提高语音模糊性的识别率，达到自适应识别的效果。

(2)改进隐马尔可夫模型是在隐马尔可夫模型的基础上增加智能搜索方法，隐马尔可夫模型算法是一种统计模型，具有良好的识别能力和抗噪声能力，但是统计模型的建立造成一个很大的数据库，使得识别匹配的速度减慢，本发明提出利用智能搜索和模糊数据库相结合的方法，提高识别速度和自适应能力。

4、把自适应识别的结果作为微软语音识别引擎的输入数据，驱动微软语音识别引擎，判断语音是否有效，如果有效，引擎将会发出响应消息，系统得到响应消息，就会驱动对应的导览功能。如果识别结果无效，系统启发式语音提示重新输入导览目的命令，并等待再次输入，启发提示超过3次，系统将进行语音模糊匹配，并进行回应反问式提问，此时用户只需回答是与否，回答“是”进入相应导览，回答“否”进入推荐路线导览。

5、语音交互控制的导览系统除了具备语音交互控制，仍然保持传统的交互控制，根据终端设备的不同，具备触摸交互控制、鼠标和键盘控制等。

Claims

1.语音交互控制的导览系统及其方法，其特征是采用基于微软语音识别引擎，针对微软语音识别引擎在环境噪声和语音模糊性上的缺点，设置了前期的滤波降噪和自适应识别，提高导览系统的语音交互的准确性和鲁棒性。

2.根据权利要求1所述的语音交互控制的导览系统及其方法，其特征在于采用最小均方误差为准则的自适应滤波器对外界输入语音进行滤波降噪，消除环境噪音，使得在环境噪音很大的情况下，也能得到良好的效果。

3.根据权利要求1所述的语音交互控制的导览系统及其方法，其特征在于自适应识别方法的实现步骤为：

(1)建立导览词汇库和模糊词汇库。

4.语音交互控制的导览系统及其方法，其特征是利用麦克风来得到外界语音输入。

5.语音交互控制的导览系统及其方法，其特征是利用语音交互和传统交互并用控制导览系统的执行和实现导览功能。