CN101383150B - 语音软开关的控制方法及其在地理信息系统中的应用 - Google Patents

语音软开关的控制方法及其在地理信息系统中的应用 Download PDF

Info

Publication number
CN101383150B
CN101383150B CN2008100219738A CN200810021973A CN101383150B CN 101383150 B CN101383150 B CN 101383150B CN 2008100219738 A CN2008100219738 A CN 2008100219738A CN 200810021973 A CN200810021973 A CN 200810021973A CN 101383150 B CN101383150 B CN 101383150B
Authority
CN
China
Prior art keywords
string
character string
keyword
character
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008100219738A
Other languages
English (en)
Other versions
CN101383150A (zh
Inventor
龙毅
胡雷地
张翎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Maipu Information Technology Co., Ltd.
Original Assignee
Nanjing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Normal University filed Critical Nanjing Normal University
Priority to CN2008100219738A priority Critical patent/CN101383150B/zh
Publication of CN101383150A publication Critical patent/CN101383150A/zh
Application granted granted Critical
Publication of CN101383150B publication Critical patent/CN101383150B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种语音软开关的控制方法,其特征是:以现有商品化的语音输入模块为基础,按照一定规则在语音命令前后加特定的闭合与断开关键词,建立了一种既可快速屏蔽外噪音,同时又可转接到不同后期命令分支的软开关控制机制,在软件环境下实现了语音输入的开关功能。其处理流程是:通过语音输入模块识别得到带噪语句片段字符串,利用已建立的开关关键词库中数量有限的闭合关键词与断开关键词,经过匹配运算,如果带噪语句片段字符串包含闭合关键词,则根据该闭合关键词启动执行与其对应的命令操作,否则,判定带噪语句片段字符串为噪音字符串,不执行任何命令操作。本方法简单易行,可以提高地理信息系统在语音输入方面的智能化、人性化程度。

Description

语音软开关的控制方法及其在地理信息系统中的应用
技术领域
本发明涉及一种语音处理与控制方法,尤其涉及通过汉语语音分析技术、模糊匹配技术、地理信息系统技术的语音控制方法。
背景技术
语音技术是随着20世纪60年代的数字信号处理技术发展起来的一种人工智能信息技术,在计算机软件系统中的应用具有易掌握、操作方便、智能化程度高的优点。目前,语音技术已经从实验系统向实用化产品过渡,国内外许多相关企业、研究所、高等院校等投入大量人力、物力和财力,进行技术创新和系统研发,IBM、Microsoft、Nuance、AT&&T,以及我国的清华大学、中科院、中国科技大学等,均先后推出了相应的语音识别软件。科大讯飞、中文之星、汉王科技等高新企业进行了市场拓展和产品推广,进一步推动了汉语语音识别系统的实用化发展,语音技术已成为最热门和最具发展前景的技术之一。
在国外,语音应用较为广泛,比如2003年和2006年,IBM先后与HONDA(本田)公司和先锋电子集团合作,应用其嵌入式ViaVoice语音技术分别研制了车载DVD语音导航系统和“先锋AVIC-Z1”车载导航系统。在国内,由于汉语语音本身存在的多音多义、语法复杂等特点,国内的应用研究仍然处在一个初期阶段,语音只作为一种简单控制和对话的手段,比如语音控制家居电器,语音控制汽车设备,语音控制计算机等。在目前的语音控制方法中,多采用用户发出语音指令、系统解析指令、根据解析后的结果驱动应用程序的应用模式。在这种语音应用模式中存在如下情况:(1)由于环境噪音的时时存在,在用户语音输入和无输入状态下都存在噪音的干扰。通常情况下和用户语音输入状态相比,系统空闲等待状态要占用更多的时间,因此空闲时段的噪音输入信息量大,由于它同样参与系统的语音识别、匹配和语义解析处理过程,尽管最后因为搜索匹配失败而不执行具体操作,但是仍然消耗了系统资源,降低了系统运行效率;(2)用户发出语音指令后,系统无法判断语音指令是否完全结束,只能通过语音识别模块依据用户停顿时间来判断,当用户使用多个语句构成一个语音命令且语句之间存在停顿时,语音识别模块将识别出彼此独立的多个语句,这种处理方法割裂了语句间的上下文联系,破坏了语音命令的完整性,从而缺乏多语句合并的机制。
针对以上问题,目前的应用系统可以采用硬件的解决方案,例如在语音输入设备(如手持话筒或对讲机)上安装开关,当需要语音输入时开启该语音开关,当语音输入完毕后,手动关闭该开关。这种基于硬件实现的开关设施可称作语音硬开关。语音硬开关在一定程度上解决了连续无意义噪音的影响问题,但也存在一些缺点,包括:(1)增加了额外的外部操作,对于某些无法使用手动操作的场合难以得到应用,如在快速移动环境下;(2)在频繁进行语音输入时,用户必须不断的手动控制开关,增加了操作的工作量,容易出错;(3)语音硬开关只能简单起到开与闭的作用,无法进一步确定语音命令应该转入执行哪一个处理模块,难以加快处理进程。
发明内容
本发明所要解决的技术问题,在于克服噪音环境给语音应用系统带来的识别过滤任务重、效率低的不足,建立一种可快速判别输入语音是否为有效命令语音,同时确定相应命令的应用类型与范围的语音软开关的控制方法及其在地理信息系统中的应用。
本发明根据语音输入硬开关的工作原理,在正常语音命令语句的基础上增加前导关键词和结束关键词(合称开关关键词),并利用现有商品化的语音识别模块识别得到的文本字符串,在软件环境下实现语音输入的开关功能,即可以为语音输入之后的应用模块提供一种判别过滤噪音、控制应用流向的先导处理模块与方法,以实现低系统负荷、高稳定识别的语音控制方法。
在语音输入中,用户在前后两次停顿之间所输入的语言称之为一个语句片段,如果一个语句片段已构成了一个独立完整的句子,且表达了一个完整的语音命令,如“打开南京地图”、“查询解放大道”、“放大地图”等,该语句片段就称为一个标准命令语句;如果由若干语句片段组合起来,才能表达一个完整的语音命令,则这些语句片段构成一个复合命令语句,如“查找路径,从xx路到xx商场,再到xx学校”。标准命令语句和复合命令语句都表示了一个由命令操作与相关对象、参数构成的完整命令含义,因此均属于正常命令语句,正常命令语句的形式为“语句片段{+停顿+语句片段}”({}表示其中的内容可以重复)。
噪音干扰在用户语音输入识别的文本字符串中主要出现在两个位置,即正常命令语句内部的噪音信息(简称内噪音)和正常命令语句外部的噪音信息(简称外噪音)。外噪音是在用户没有语音输入情况下系统接收到的外界环境噪音,出现在用户语音输入之外的停顿时间内,其识别得到的文本字符串缺乏文字、词汇或者语义之间的连续性,没有明确的应用意义,称为外噪音字符串。内噪音是用户语音输入过程中接收到的外界环境噪音,内噪音可能在用户语音之间出现,也可能和用户语音叠加出现,前者表现为识别得到的完全无意义字符,后者则表现为识别得到的字符与正确字符之间有着一定语音上的联系,即发生部分干扰的现象。因此,用户输入的正常命令语句字符串由于内噪音的影响而成为带噪字符串。
本发明涉及到的语音软开关主要解决外噪音的屏蔽问题,同时在对开关关键词判别中也考虑内噪音的影响。因此,本发明针对语音软开关的应用需求,设计了闭合控制器、断开控制器。闭合控制器为一组可实现不同应用转向控制的特定字符串集合,其中每一个字符串称为闭合关键词,闭合关键词必须放置在正常命令语句的前面,又称为前导关键词;断开控制器是表明一个正常命令语句结束的若干特定字符串,每一个字符串称为一个断开关键词,又称为结束关键词,必须放置在正常命令语句的结尾。闭合关键词和断开关键词既可以和正常命令语句直接相连,也可以经过短暂停顿后相连,其规则的结构为“闭合关键词[+停顿]+正常命令语句[+停顿]+断开关键词”([]表示其中的内容可以省略)。
闭合关键词作为正常命令语句的前引导关键词,其作用是对于一个经过语音识别得到的待检文本字符串,只有首先从中检测到某一个闭合关键词字符串,才说明其后面的字符串为有效命令字符串,否则表明该语音为外噪音,放弃执行任何操作;同样,只有识别到断开关键词,才表明正常命令语句结束,即在断开关键词出现以前的文本字符串均为正常命令语句的有效字符串,从而可实现将若干由停顿分割的语句片段集成为完整的正常命令语句,并且一旦识别到断开关键词,之后到下一次识别到闭合关键词之前的语音输入均为外噪音。
在本发明的应用流程中,语音软开关模块设置在语音获取模块与语音应用模块之间,其中语音获取模块以现有的商品化语音识别模块为基础,在应用软件中增加语音识别模块及其接口,负责接收和识别语音信息,得到相应的带噪字符串;语音软开关模块利用已建立的开关关键词库中数量相对少而有限的闭合关键词与断开关键词,经过匹配运算,建立一种既可快速屏蔽外噪音,同时又可转接到不同后期命令分支的软开关控制机制;语音应用模块负责识别得到正确的命令字符串,从而可以有助于启动执行各个命令操作,以及应用到地理信息系统功能中。
所述语音软开关的控制方法,工作流程如下:
步骤一、设定语音软开关模块中,已事先规定和建立的闭合关键词集合为KB={KBi|i=1,n},其中KBi为第i个闭合关键词字符串,n为闭合关键词的数量,一个闭合关键词KBi对应一个命令字符串集合CMDi={strCMDij|j=1,ki},strCMDij为第i个闭合关键词所对应的第j个命令字符串,ki为第i个闭合关键词所对应的命令字符串个数;已事先规定和建立的断开关键词集合为KD={KDi |i=1,m},其中KDi为第i个断开关键词字符串,m为断开关键词的数量;初始化语音开关状态FS=0,FS用于表示当前语音开关的状态,FS=0表示断开状态,FS=1表示闭合状态;
步骤二、利用现有商品化语音识别模块,获取带噪语句片段字符串V,V用于保存经过现有商品化语音识别模块识别得到的一个带噪语句片段字符串;
步骤三、对于带噪语句片段字符串V,判断当前语音开关FS的状态,如果FS为1,转到步骤五执行;如果FS为0,执行下一步;
步骤四、以V作为源串A,以闭合关键词字符串集合KB为标准字符串集合B执行字符串查找运算:如果查找失败,判定V为外噪音字符串,将V赋为空字符串,转到步骤二执行;如果查找成功,可判定V为正常命令语句字符串,运算得到的目标字符串C以及C与源串A的有效匹配区域的下限音节位置POS和有效字符串长度LEN,可分别记录为V中所包含的闭合关键词字符串KBi以及KBi与V的有效匹配区域的下限音节位置Pb和有效字符串长度Lb,并修改当前语音开关状态FS为闭合状态;
步骤五、将带噪语句片段字符串V拼接到正常命令语句字符串S之后形成新字符串并重新赋给S,S用于保存包含一个完整正常命令语句的字符串,其中在标准命令语句时为一个语句片段字符串V,在复合命令语句时为多个语句片段字符串V的组合,其初始化值为空字符串。以V作为源串A,以断开关键词字符串集合KD为标准字符串集合B执行字符串查找运算:如果查找失败,表明V中不存在任何一个断开关键词,即当前命令语句输入尚没有结束,转到步骤二执行;如果查找成功,表明V中已包含断开关键词字符串,命令语句输入结束,运算得到的目标字符串C以及C与源串A的有效匹配区域的下限音节位置POS,可分别记录为V中所包含的断开关键词字符串KDi以及KDi与V的有效匹配区域的下限音节位置Pd,计算KDi与S的有效匹配区域下限音节位置Pds=Len(S)-Len(V)+Pd(其中Len(Str)表示一个字符串Str的长度),修改当前语音开关状态FS为断开状态;
步骤六、从S中提取正常命令语句字符串T=Mid(S,Pb+Lb,Pds),其中Mid(Str,P1,P2)表示从字符串Str中截取第P1个字符之后到第P2个字符之前的字符串作为目标字符串,该字符串中不包含第P1个和第P2个字符;
步骤七、根据闭合关键词KBi得到与其对应的命令字符串集合CMDi。将正常命令语句字符串T作为源串A,以命令字符串集合CMDi为标准字符串集合B执行字符串查找运算:如果查找失败,不执行任何命令操作;如果查找成功,其匹配得到的目标字符串C即为输入语句中所包含的命令字符串StrCMDq,该字符串在已有的标准命令字符串与功能模块对应关系表R={StrCMDij,Funij|j=1,ki}中对应于一个功能模块Funq,可以直接调用和执行相应的功能模块。
所述字符串查找运算的步骤如下:
步骤一、已知源串A和标准字符串集合B={Bi|i=1,n},设定字符串匹配的下限阈值为M(通过设定M值的大小可以调整字符串查找的灵敏度,其取值范围一般为0.6到1之间);
步骤二、从标准字符串集合B中依次取出标准字符串Bi,i=1,n;
步骤三、将A作为源串,Bi作为目标串,分别转换为拼音字符串,计算A与Bi的相近匹配度fi,记录Bi与源串A的有效匹配区域的下限音节位置STARTi=Locmin,计算Bi与源串A的有效匹配区域的长度LENi=Locmax-Locmin+1,Locmax和Locmin为Bi与A的有效匹配区域的上下限音节位置(相近匹配度以及Locmax、Locmin的计算方法采用国家发明专利“地理信息的语音识别方法及其在导航系统中的应用”,专利授权公告号:CN100358006C);
步骤四、转到步骤二执行,直到B中所有的标准字符串参与计算结束;
步骤五、对于标准字符串集合B与A的相近匹配度计算的结果,得到一组相近匹配度序列{fi|i=1,n},从中得到最大值MaxM=MAX{fi|i=1,n},获取MaxM对应的标准字符串Bj和Bj与源串A的有效匹配区域的下限音节位置STARTj以及Bj与源串A的有效匹配区域的长度LENj
步骤六、如果MaxM大于等于字符串匹配阈值M,说明A中包含标准字符串Bj,查找成功,则查找得到的目标字符串C为Bj,且C与源串A的有效匹配区域的下限音节位置POS为STARTj,有效字符串长度LEN为LENj;如果MaxM小于字符串匹配阈值M,说明A中不包含标准字符串,查找失败。
本发明语音软开关的控制方法可以应用于地理信息系统。
本发明的有益效果:
(1)由于闭合关键词与断开关键词数量少,识别容易,在对待检字符串进行匹配搜索时,不仅可以方便地判别与去除外噪音,还能够达到待检字符串只与数量相对有限的分支信息匹配的目的。和传统方法中将待检字符串直接与所有的命令信息、专题信息匹配相比,表现为判别耗时短,准确性高;
(2)可以针对系统不同的应用功能模块,设置不同的闭合关键词,在此基础上建立闭合关键词库,可以构建语音命令与各个系统处理模块之间灵活的语音驱动机制;
断开关键词是实现多语句片段合并的基础和前提,它可以有效的支持多语句片段及其之间带有停顿的复杂语音命令。
本方法以商品化的语音输入模块为基础,按照一定规则在语音命令前后加特定的闭合与断开关键词,实现了语音应用系统屏蔽外噪音字符串干扰和启动分支命令操作的目的,随着语音输入设备和识别引擎的进一步完善,结合本方法,对于提高地理信息系统的智能化程度具有很大的作用。
附图说明
图1语音软开关的工作原理图
图2语音软开关的工作流程图
图3字符串查找运算流程图
图4在输入为外噪音情况下语音软开关的实施工作流程图
图5在输入存在内噪音情况下语音软开关的实例工作流程图
图6在输入存在内噪音情况下语音软开关的实例工作流程图
图7在输入为多语句片段(复合型命令语句)情况下语音软开关的实例工作流程图
具体实施方式
下面结合附图和实施例,对本发明作进一步详细说明。
实施例:
如图4、图5、图6、图7,实施例详细描述了语音软开关在语音地理信息系统中的应用流程。
1)首先建立语音地理信息系统的开关关键词库及功能命令词库
如表1,语音地理信息系统设置字符串“命令”、“设置”、“帮助”作为闭合关键词,设置字符串“完毕”和“结束”作为断开关键词。
●闭合关键词“命令”用来启动语音地理信息系统中各种具体操作,涉及地图浏览、目标编辑、目标量算、GPS导航等多个方面功能,其对应的命令字符串有“放大”、“缩小”、“左移”、“右移”、“查找”、“搜索”“采集点目标”、“采集线目标”、“采集面目标”、“开启GPS”、“关闭GPS”等;
●闭合关键词“设置”用来启动语音地理信息系统中各种常用的设置命令,如界面设置、GPS设置、地图符号设置、网络连接设置等,其对应的命令字符串有“界面参数”、“GPS参数”、“符号参数”、“网络连接”、“语音交互方式”等;
●闭合关键词“帮助”的作用是启动帮助命令,用于提示用户各种语音命令使用方法,其对应的命令字符串有“放大命令”、“导航命令”、“点数据采集命令”、“GPS参数设置”、“网络连接设置”、“语音交互模式设置”等。
表1
Figure G2008100219738D00101
2)具体实例说明:
设置字符串串查找运算中字符串匹配的下限阈值M=0.70。
●实例一:输入为外噪音的情况
语音地理信息系统接收并识别得到带噪字符串V:“恩儿了里的了色文”。系统处理过程:首先将V与闭合关键词字符串集合做字符串查找运算,得到V与闭合关键词“设置”的相似匹配度最大,其值MaxMb=0.5,并且MaxMb<M,说明V中不包含任何闭合关键词,放弃V不进行其他运算,如图4。
●实例二:输入存在内噪音的情况
用户语音输入“命令放大完毕”,语音地理信息系统接受语音并识别得到带噪字符串V:“明令方大腕力”。系统处理过程:①首先将V与闭合关键词字符串集合做字符串查找运算,得到V与闭合关键词“命令”的相似匹配度最大,其值MaxMb=1,并且MaxMb>M,所以V中包含的闭合关键词是“命令”;②将V与断开关键词字符串集合做字符串查找运算,得到V与断开关键词“完毕”的相似匹配度最大,其值MaxMd=0.75,并且MaxMd>M,所以“完毕”是V包含的断开关键词;③提取V中正常命令语句字符串T为“方大”,将T与闭合关键词“命令”对应的命令字符串集合做字符串查找运算,得到T与命令字符串“放大”的相似匹配度最大,其值MaxMg=1,并且MaxMg>M,所以T的命令字符串是“放大”;④通过命令字符串与功能模块的对应关系表调用地图浏览模块,执行地图放大操作,如图5。
●实例三:输入存在内噪音的情况
用户语音输入“设置网络连接完毕”,语音地理信息系统接受语音并识别得到带噪字符串V:“儿里了设置网络连接腕力”,由于系统所处环境噪音比较大,V带有较多的无意义噪音字符串。系统处理过程:①首先将V与闭合关键词字符串集合做字符串查找运算得到V与闭合关键词“设置”的相似匹配度最大,其值MaxMb=1,并且MaxMb>M,所以V中包含的闭合关键词是“设置”;②将V与断开关键词字符串集合做字符串查找运算得到V与断开关键词“完毕”的相似匹配度最大,其值MaxMd=0.75,并且MaxMd>M,所以“完毕”是V中包含的断开关键词;③提取V中正常命令语句字符串T为“网络连接”,将T与闭合关键词“设置”对应的命令字符串集合做字符串查找运算,得到T与命令字符串“网络连接”的相似匹配度最大,其值MaxMg=1,并且MaxMg>M,所以T的命令字符串是“网络连接”;④通过命令字符串与功能模块的对应关系表调用网络连接设置模块执行网络连接设置功能,如图6。
●实例四:输入为多语句片段(复合型命令语句)的情况
用户语音输入“命令导航从新街口”,稍作停顿后紧接着输入“到夫子庙完毕”,语音地理信息系统接受语音并识别两个语句片段,得到带噪字符串V1:“命令导航从新街口”和V2:“到夫子庙完毕”。系统处理过程:①首先将V1与闭合关键词字符串集合做字符串查找运算得到V1与闭合关键词“命令”的相似匹配度最大,其值MaxMb=1,并且MaxMb>M,所以V1中包含的闭合关键词是“命令”,表示语音命令语句输入开始;②将V1与断开关键词字符串集合做字符串查找运算得到V1与断开关键词“结束”的相似匹配度最大,其值MaxMd=0.5并且MaxMd<M,说明V1中不包含断开关键词,即当前命令语句输入尚未结束;③将V2与断开关键词字符串集合做字符串查找运算得到V2与断开关键词“完毕”的相似匹配度最大,其值MaxMd=1并且MaxMd>M,说明V2中包含断开关键词,即当前命令语句输入结束,将V2拼接到V1之后得到V;④提取正常命令语句字符串T为“导航从新街口到夫子庙”,将T与闭合关键词“命令”对应的命令字符串集合做字符串查找运算,得到T与命令字符串“导航”的相似匹配度最大,其值MaxMg=1,并且MaxMg>M,所以“导航”是T的命令字符串;⑤通过命令字符串与功能模块的对应关系表向导航分析模块中传入导航参数字符串“从新街口到夫子庙”,并执行导航功能,如图7。
3)实施例结果分析:
从实施例中可以看出,在屏蔽外噪音处理的过程中,如果语音地理信息系统没有语音软开关的支持,其识别得到的带噪字符串需要和命令字符串集合中每个命令字符串进行匹配运算,其运算次数为命令字符串集合元素的个数m;如果语音地理信息系统有语音软开关的支持,其识别得到的带噪字符串只需要和闭合关键词字符串进行匹配运算,其运算次数为闭合关键词的个数n。由于闭合关键词在数量上要远远小于命令字符串,有助于减少对外噪音字符串的排除分析运算。在表1中,m=58,n=3,因此语音软开关在外噪音屏蔽过程中使字符串匹配运算效率提高近20倍。由此可以看出语音软开关的设置在很大程度上可以屏蔽外噪音的干扰,同时减轻系统对外噪音匹配计算所带来的处理压力。从实例四可以看出,语音软开关可以有效的支持多语句片段及其之间带有停顿的复杂语音命令,提高了语音地理信息系统在语音输入方面的智能化、人性化程度。

Claims (3)

1.一种语音软开关的控制方法,其步骤如下:
步骤一、设定语音软开关模块中,已事先规定和建立的闭合关键词集合为KB={KBi|i=1,n},其中KBi为第i个闭合关键词字符串,n为闭合关键词的数量,一个闭合关键词KBi对应一个命令字符串集合CMDi={strCMDij|j=1,ki},strCMDij为第i个闭合关键词所对应的第j个命令字符串,ki为第i个闭合关键词所对应的命令字符串个数;已事先规定和建立的断开关键词集合为KD={KDi|i=1,m},其中KDi为第i个断开关键词字符串,m为断开关键词的数量;初始化语音开关状态FS=0,FS用于表示当前语音开关的状态,FS=0表示断开状态,FS=1表示闭合状态;
步骤二、利用现有商品化语音识别模块,获取带噪语句片段字符串V,V用于保存经过现有语音识别模块识别得到的一个带噪语句片段字符串;
步骤三、对于带噪语句片段字符串V,判断当前语音开关FS的状态,如果FS为1,转到步骤五执行;如果FS为0,执行下一步;
步骤四、以V作为源串A,以闭合关键词字符串集合KB为标准字符串集合B执行字符串查找运算:如果查找失败,判定V为外噪音字符串,将V赋为空字符串,转到步骤二执行;如果查找成功,可判定V为正常命令语句字符串,运算得到的目标字符串C以及C与源串A的有效匹配区域的下限音节位置POS和有效字符串长度LEN,可分别记录为V中所包含的闭合关键词字符串KBi以及KBi与V的有效匹配区域的下限音节位置Pb和有效字符串长度Lb,并修改当前语音开关状态FS为闭合状态;
步骤五、将带噪语句片段字符串V拼接到正常命令语句字符串S之后形成新字符串并重新赋给S,S用于保存包含一个完整正常命令语句的字符串,其中在标准命令语句时为一个语句片段字符串V,在复合命令语句时为多个语句片段字符串V的组合,其初始化值为空字符串;以V作为源串A,以断开关键词字符串集合KD为标准字符串集合B执行字符串查找运算:如果查找失败,表明V中不存在任何一个断开关键词,即当前命令语句输入尚没有结束,转到步骤二执行;如果查找成功,表明V中已包含断开关键词字符串,命令语句输入结束,运算得到的目标字符串C以及C与源串A的有效匹配区域的下限音节位置POS,可分别记录为V中所包含的断开关键词字符串KDi以及KDi与V的有效匹配区域的下限音节位置Pd,计算KDi与S的有效匹配区域下限音节位置Pds=Len(S)-Len(V)+Pd,其中Len(Str)表示一个字符串Str的长度,修改当前语音开关状态FS为断开状态;
步骤六、从S中提取正常命令语句字符串T=Mid(S,Pb+Lb,Pds),其中Mid(Str,P1,P2)表示从字符串Str中截取第P1个字符之后到第P2个字符之前的字符串作为目标字符串,该字符串中不包含第P1个和第P2个字符;
步骤七、根据闭合关键词KBi得到与其对应的命令字符串集合CMDi;将正常命令语句字符串T作为源串A,以命令字符串集合CMDi为标准字符串集合B执行字符串查找运算:如果查找失败,不执行任何命令操作;如果查找成功,其匹配得到的目标字符串C即为输入语句中所包含的命令字符串StrCMDq,该字符串在已有的标准命令字符串与功能模块对应关系表R={StrCMDij,Funij|j=1,ki}中对应于一个功能模块Funq,可以直接调用和执行相应的功能模块。
2.根据权利要求1所述语音软开关的控制方法,其特征是:所述字符串查找运算的步骤如下:
步骤一、已知源串A和标准字符串集合B={Bi|i=1,n},设定字符串匹配的下限阈值为M,通过设定M值的大小可以调整字符串查找的灵敏度,M的取值范围为0.6到1之间;
步骤二、从标准字符串集合B中依次取出标准字符串Bi,i=1,n;
步骤三、将A作为源串,Bi作为目标串,分别转换为拼音字符串,计算A与Bi的相近匹配度fi,记录Bi与源串A的有效匹配区域的下限音节位置STARTi=Locmin,计算Bi与源串A的有效匹配区域的长度LENi=Locmax-Locmin+1,Locmax和Locmin为Bi与A的有效匹配区域的上下限音节位置;
步骤四、转到步骤二执行,直到B中所有的标准字符串参与计算结束;
步骤五、对于标准字符串集合B与A的相近匹配度计算的结果,得到一组相近匹配度序列{fi|i=1,n},从中得到最大值MaxM=MAX{fi|i=1,n},获取MaxM对应的标准字符串Bj和Bj与源串A的有效匹配区域的下限音节位置STARTj以及Bj与源串A的有效匹配区域的长度LENj
步骤六、如果MaxM大于等于字符串匹配阈值M,说明A中包含标准字符串Bj,查找成功,则查找得到的目标字符串C为Bj,且C与源串A的有效匹配区域的下限音节位置POS为STARTj,有效字符串长度LEN为LENj;如果MaxM小于字符串匹配阈值M,说明A中不包含标准字符串,查找失败。
3.权利要求1或2所述语音软开关的控制方法在地理信息系统中的应用。
CN2008100219738A 2008-08-19 2008-08-19 语音软开关的控制方法及其在地理信息系统中的应用 Active CN101383150B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100219738A CN101383150B (zh) 2008-08-19 2008-08-19 语音软开关的控制方法及其在地理信息系统中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100219738A CN101383150B (zh) 2008-08-19 2008-08-19 语音软开关的控制方法及其在地理信息系统中的应用

Publications (2)

Publication Number Publication Date
CN101383150A CN101383150A (zh) 2009-03-11
CN101383150B true CN101383150B (zh) 2010-11-10

Family

ID=40462952

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100219738A Active CN101383150B (zh) 2008-08-19 2008-08-19 语音软开关的控制方法及其在地理信息系统中的应用

Country Status (1)

Country Link
CN (1) CN101383150B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104157284A (zh) * 2013-05-13 2014-11-19 佳能株式会社 语音命令检测方法和系统,以及信息处理系统

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110099507A1 (en) 2009-10-28 2011-04-28 Google Inc. Displaying a collection of interactive elements that trigger actions directed to an item
CN105654943A (zh) * 2015-10-26 2016-06-08 乐视致新电子科技(天津)有限公司 一种语音唤醒方法、装置及系统
US10186263B2 (en) * 2016-08-30 2019-01-22 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Spoken utterance stop event other than pause or cessation in spoken utterances stream
CN106512393A (zh) * 2016-10-14 2017-03-22 上海异界信息科技有限公司 适用于虚拟现实环境中应用语音控制的方法和系统
CN106409294B (zh) * 2016-10-18 2019-07-16 广州视源电子科技股份有限公司 防止语音命令误识别的方法和装置
CN106570138B (zh) * 2016-11-03 2020-03-03 北京百度网讯科技有限公司 基于人工智能的信息搜索方法和装置
TW202011384A (zh) * 2018-09-13 2020-03-16 廣達電腦股份有限公司 語音校正系統及語音校正方法
CN109993152B (zh) * 2019-04-15 2021-03-09 武汉轻工大学 坐标曲线积分的模式转换方法、设备、存储介质及装置
CN112802471B (zh) * 2020-12-31 2024-01-23 北京梧桐车联科技有限责任公司 语音音区切换方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1342967A (zh) * 2000-09-13 2002-04-03 中国科学院自动化研究所 多种语音工作模式的统一识别方法
EP1330816A1 (en) * 2000-10-10 2003-07-30 Intel Corporation Language independent voice-based search system
CN1512402A (zh) * 2002-12-31 2004-07-14 程松林 一种语音检索方法及采用该方法的音像信息检索系统
CN1674091A (zh) * 2005-04-18 2005-09-28 南京师范大学 地理信息的语音识别方法及其在导航系统中的应用
CN1983389A (zh) * 2005-12-14 2007-06-20 台达电子工业股份有限公司 语音控制方法
CN101227668A (zh) * 2007-01-18 2008-07-23 刘畅 手机上建立多项关键词组及其搜索逻辑组合关系的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1342967A (zh) * 2000-09-13 2002-04-03 中国科学院自动化研究所 多种语音工作模式的统一识别方法
EP1330816A1 (en) * 2000-10-10 2003-07-30 Intel Corporation Language independent voice-based search system
CN1512402A (zh) * 2002-12-31 2004-07-14 程松林 一种语音检索方法及采用该方法的音像信息检索系统
CN1674091A (zh) * 2005-04-18 2005-09-28 南京师范大学 地理信息的语音识别方法及其在导航系统中的应用
CN1983389A (zh) * 2005-12-14 2007-06-20 台达电子工业股份有限公司 语音控制方法
CN101227668A (zh) * 2007-01-18 2008-07-23 刘畅 手机上建立多项关键词组及其搜索逻辑组合关系的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Allen J.Natural language understanding.《Natural language understanding》.Cummings publishing company,1994,全文. *
CHARANIYA A P.et.al.speech interface for Geo-spatial visualization.《proceedings of the IASTED international conference on computer science and technology for development》.2003,269-274. *
龙毅,张翎,胡雷地,闾国年.移动GIS中语音与自然语言的应用模式探讨.《测绘科学技术学报》.2008,全文. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104157284A (zh) * 2013-05-13 2014-11-19 佳能株式会社 语音命令检测方法和系统,以及信息处理系统

Also Published As

Publication number Publication date
CN101383150A (zh) 2009-03-11

Similar Documents

Publication Publication Date Title
CN101383150B (zh) 语音软开关的控制方法及其在地理信息系统中的应用
CN101281745B (zh) 一种车载语音交互系统
CN101923857A (zh) 一种人机交互的可扩展语音识别方法
CN107331400A (zh) 一种声纹识别性能提升方法、装置、终端及存储介质
CN104123939A (zh) 基于变电站巡检机器人的语音交互控制方法
CN111090727B (zh) 语言转换处理方法、装置及方言语音交互系统
CN110197279B (zh) 变换模型训练方法、装置、设备和存储介质
CN103700369A (zh) 语音导航方法及系统
CN102148031A (zh) 语音识别与交互系统及方法
CN101923854A (zh) 一种交互式语音识别系统和方法
CN105336324A (zh) 一种语种识别方法及装置
CN102280106A (zh) 用于移动通信终端的语音网络搜索方法及其装置
WO2021147041A1 (zh) 语义分析方法、装置、设备及存储介质
CN102855875B (zh) 基于外部开启控制语音输入的网络语音转换控制系统和方法
CN101345051A (zh) 带定量参数的地理信息系统语音控制方法
CN110349575A (zh) 语音识别的方法、装置、电子设备和存储介质
CN110148403A (zh) 解码网络生成方法、语音识别方法、装置、设备及介质
CN106845628A (zh) 机器人通过互联网自主学习生成新指令的方法和装置
CN103631784B (zh) 页面内容检索方法和系统
CN111178081A (zh) 语义识别的方法、服务器、电子设备及计算机存储介质
CN105654947A (zh) 一种获取交通广播语音中路况信息的方法及系统
CN104142831A (zh) 应用程序搜索方法及装置
CN103903617A (zh) 一种语音识别方法及电子设备
Khan et al. Hypotheses ranking and state tracking for a multi-domain dialog system using multiple ASR alternates.
CN105206263A (zh) 基于动态字典的语音语义识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SUZHOU MAIPU INFORMATION TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: NANJING NORMAL UNIVERSITY

Effective date: 20121211

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 210046 NANJING, JIANGSU PROVINCE TO: 215500 SUZHOU, JIANGSU PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20121211

Address after: 215500 Changshou City South East Economic Development Zone, Jiangsu, Jin Road, No. 8

Patentee after: Suzhou Maipu Information Technology Co., Ltd.

Address before: Yuen Road in Nanjing city Jiangsu province 210046 Xianlin new town No. 1

Patentee before: Nanjing Normal University