CN103065628A - 语音交互控制的导览系统及其方法 - Google Patents

语音交互控制的导览系统及其方法 Download PDF

Info

Publication number
CN103065628A
CN103065628A CN 201210475130 CN201210475130A CN103065628A CN 103065628 A CN103065628 A CN 103065628A CN 201210475130 CN201210475130 CN 201210475130 CN 201210475130 A CN201210475130 A CN 201210475130A CN 103065628 A CN103065628 A CN 103065628A
Authority
CN
China
Prior art keywords
guide system
voice
guide
interactive voice
voice interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201210475130
Other languages
English (en)
Inventor
陈丽芳
刘渊
黄秋儒
陆菁
刘一鸣
杜欣宇
王君竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN 201210475130 priority Critical patent/CN103065628A/zh
Publication of CN103065628A publication Critical patent/CN103065628A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

语音交互控制的导览系统及其方法是一种利用语音交互的方式实现导览系统的导览功能。目前的导览系统的交互方式一般采用鼠标、键盘、图形文字相结合的触摸交互等。这些交互方式无法满足不同层次和不同群体的需要,例如盲人、不识字的小孩。语音交互控制的导览系统根据语音命令执行相应导览功能。系统采用自适应语音识别和启发提示方法。根据导览系统的性质,系统把导览常用相关词汇按照不同功能存放在后台数据库中,这样当用户发语音命令的时候,系统会在对应的库中搜索,提高匹配速度。如果没有找到对应的匹配词句,系统采用语音回应反问是否要做对应操作,此时用户只需回答“是”与“否”,系统进入下一步导览。实现人性化的导览功能。

Description

语音交互控制的导览系统及其方法
技术领域
本发明涉及语音识别、语音交互、导览技术和数字媒体等领域。公开了基于语音交互控制导览的实现方法,采用微软语音识别引擎,并通过最小均方误差为准则的自适应滤波器滤波和自适应识别的方法,提高语音的识别率和实时性。
背景技术
随着数字媒体和网路技术的不断成熟和普及,数字化导览系统的应用更加广泛,智慧城市体验馆的展示、智能家居的虚拟展示、智慧旅游的景点展示、公共产所的导引系统等,都具备导览功能。
目前,大部分导览系统的交互方式一般采用鼠标、键盘的交互、图形文字相结合的触摸交互等。这些交互方式不能满足不同层次和不同群体的需要。在语音交互控制的导览系统中,当用户发出语音命令时,系统根据语音命令执行相应导览功能。这种导览系统不仅可以满足普通用户的需求,同时可以满足一些特殊群体的要求,例如盲人、或是不识字的小孩和成人,只要他们能发出要求的语音,就可以自由导览,使系统更加人性化。
发明内容
本发明的目的是实现语音交互控制的导览系统,使导览系统能够满足多种群体的需求。
按照本发明提供的技术方案,语音交互控制的导览系统及其方法包含以下步骤:
1、在语音交互控制的导览系统及其方法中,利用麦克风来得到外界语音输入。
2、外界语音读入后,采用最小均方误差为准则的自适应滤波器对外界输入语音进行滤波降噪,消除环境噪音,使得在环境噪音很大的情况下,也能得到良好的效果。
3、利用自适应识别语音方法进一步提高识别率,实现步骤为:
(1)建立导览词汇库和模糊词汇库。
(2)利用基于智能搜索的改进隐马尔可夫模型,解决语音识别的模糊性和提高识别速度。
4、把步骤3处理的语音结果作为输入,利用微软语音识别引擎进行语音识别和匹配,进而触发相应的导航功能实现导览系统的导览功能。
本发明与已有导览系统相比,实现了利用语音交互控制导览系统的导航,满足多种群体的操作要求,在微软语音识别引擎识别之前增加了最小均方误差为准则的自适应滤波器去除环境噪声,并通过改进隐马尔可夫模型的自适应识别方法,提高识别率和识别速度,使系统适用的场合更加广泛。
附图说明
图1算法执行流程图
具体实施方式
下面本发明将结合附图对本发明的实施方式做进一步的介绍。
1、导览系统语音提示用户利用麦克风进行语音输入,以便易于区别有效的输入语音和外界环境音。
2、读入外界输入语音,利用最小均方误差为准则设计的自适应滤波器进行滤波,去除环境噪声。
3、自适应语音识别方法实现如下:
(1)根据导览系统的特点,建立相关的词汇数据库,数据库包含导览系统的控制命令词汇库以及控制命令词汇的模糊相关词汇库,其中模糊相关词汇库中存放控制导览执行的词汇的近义词和读音相近的词汇,提高语音模糊性的识别率,达到自适应识别的效果。
(2)改进隐马尔可夫模型是在隐马尔可夫模型的基础上增加智能搜索方法,隐马尔可夫模型算法是一种统计模型,具有良好的识别能力和抗噪声能力,但是统计模型的建立造成一个很大的数据库,使得识别匹配的速度减慢,本发明提出利用智能搜索和模糊数据库相结合的方法,提高识别速度和自适应能力。
4、把自适应识别的结果作为微软语音识别引擎的输入数据,驱动微软语音识别引擎,判断语音是否有效,如果有效,引擎将会发出响应消息,系统得到响应消息,就会驱动对应的导览功能。如果识别结果无效,系统启发式语音提示重新输入导览目的命令,并等待再次输入,启发提示超过3次,系统将进行语音模糊匹配,并进行回应反问式提问,此时用户只需回答是与否,回答“是”进入相应导览,回答“否”进入推荐路线导览。
5、语音交互控制的导览系统除了具备语音交互控制,仍然保持传统的交互控制,根据终端设备的不同,具备触摸交互控制、鼠标和键盘控制等。

Claims (5)

1.语音交互控制的导览系统及其方法,其特征是采用基于微软语音识别引擎,针对微软语音识别引擎在环境噪声和语音模糊性上的缺点,设置了前期的滤波降噪和自适应识别,提高导览系统的语音交互的准确性和鲁棒性。
2.根据权利要求1所述的语音交互控制的导览系统及其方法,其特征在于采用最小均方误差为准则的自适应滤波器对外界输入语音进行滤波降噪,消除环境噪音,使得在环境噪音很大的情况下,也能得到良好的效果。
3.根据权利要求1所述的语音交互控制的导览系统及其方法,其特征在于自适应识别方法的实现步骤为:
(1)建立导览词汇库和模糊词汇库。
(2)利用基于智能搜索的改进隐马尔可夫模型,解决语音识别的模糊性和提高识别速度。
4.语音交互控制的导览系统及其方法,其特征是利用麦克风来得到外界语音输入。
5.语音交互控制的导览系统及其方法,其特征是利用语音交互和传统交互并用控制导览系统的执行和实现导览功能。
CN 201210475130 2012-11-20 2012-11-20 语音交互控制的导览系统及其方法 Pending CN103065628A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201210475130 CN103065628A (zh) 2012-11-20 2012-11-20 语音交互控制的导览系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201210475130 CN103065628A (zh) 2012-11-20 2012-11-20 语音交互控制的导览系统及其方法

Publications (1)

Publication Number Publication Date
CN103065628A true CN103065628A (zh) 2013-04-24

Family

ID=48108228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201210475130 Pending CN103065628A (zh) 2012-11-20 2012-11-20 语音交互控制的导览系统及其方法

Country Status (1)

Country Link
CN (1) CN103065628A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103531197A (zh) * 2013-10-11 2014-01-22 安徽科大讯飞信息科技股份有限公司 一种对用户语音识别结果反馈的命令词识别自适应优化方法
WO2014187290A1 (zh) * 2013-05-24 2014-11-27 Wen Xia 智能机器人
CN106356057A (zh) * 2016-08-24 2017-01-25 安徽咪鼠科技有限公司 一种基于计算机应用场景语义理解的语音识别系统
CN107305769A (zh) * 2016-04-20 2017-10-31 斑马网络技术有限公司 语音交互处理方法、装置、设备及操作系统
CN107765557A (zh) * 2016-08-23 2018-03-06 美的智慧家居科技有限公司 智能家居控制系统及方法
CN109084351A (zh) * 2018-10-18 2018-12-25 浙江板川电器有限公司 一种人机对话智能集成灶

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014187290A1 (zh) * 2013-05-24 2014-11-27 Wen Xia 智能机器人
CN103531197A (zh) * 2013-10-11 2014-01-22 安徽科大讯飞信息科技股份有限公司 一种对用户语音识别结果反馈的命令词识别自适应优化方法
CN107305769A (zh) * 2016-04-20 2017-10-31 斑马网络技术有限公司 语音交互处理方法、装置、设备及操作系统
CN107765557A (zh) * 2016-08-23 2018-03-06 美的智慧家居科技有限公司 智能家居控制系统及方法
CN107765557B (zh) * 2016-08-23 2021-07-06 美的智慧家居科技有限公司 智能家居控制系统及方法
CN106356057A (zh) * 2016-08-24 2017-01-25 安徽咪鼠科技有限公司 一种基于计算机应用场景语义理解的语音识别系统
CN109084351A (zh) * 2018-10-18 2018-12-25 浙江板川电器有限公司 一种人机对话智能集成灶

Similar Documents

Publication Publication Date Title
CN103065628A (zh) 语音交互控制的导览系统及其方法
US20210335351A1 (en) Voice Characterization-Based Natural Language Filtering
CN102332265B (zh) 一种提高汽车声控系统语音识别率的方法
US9123341B2 (en) System and method for multi-modal input synchronization and disambiguation
CN110473523A (zh) 一种语音识别方法、装置、存储介质及终端
CN104123939A (zh) 基于变电站巡检机器人的语音交互控制方法
US11823662B2 (en) Control method and control apparatus for speech interaction, storage medium and system
US10854191B1 (en) Machine learning models for data driven dialog management
TW200847004A (en) Speech-centric multimodal user interface design in mobile technology
WO2014048113A1 (zh) 一种语音识别方法和设备
CN101286317B (zh) 语音识别装置、模型训练方法、及交通信息服务平台
CN101281745A (zh) 一种车载语音交互系统
CN101383150B (zh) 语音软开关的控制方法及其在地理信息系统中的应用
CN105284099B (zh) 针对免提交互来自动调整用户界面
CN110033776A (zh) 一种应用于屏幕设备的虚拟形象交互系统与方法
CN103474062A (zh) 一种语音识别方法
Anzai et al. Recognition of utterances with grammatical mistakes based on optimization of language model towards interactive CALL systems
CN112885338A (zh) 语音识别方法、设备、计算机可读存储介质及程序产品
Vicsi Thinking about the present and future of the complex speech recognition
CN110085212A (zh) 一种用于cnc程序控制器的语音识别方法
Zhang et al. Robust speech recognition directed by extended template matching in dialogue system
US11991511B2 (en) Contextual awareness in dynamic device groups
Medjkoune et al. Using speech for handwritten mathematical expression recognition disambiguation
Majima et al. Spoken inquiry discrimination using bag-of-words for speech-oriented guidance system
CN104516520A (zh) 一种基于语音识别技术的文字输入方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130424