CN1674091A - 地理信息的语音识别方法及其在导航系统中的应用 - Google Patents
地理信息的语音识别方法及其在导航系统中的应用 Download PDFInfo
- Publication number
- CN1674091A CN1674091A CNA2005100389311A CN200510038931A CN1674091A CN 1674091 A CN1674091 A CN 1674091A CN A2005100389311 A CNA2005100389311 A CN A2005100389311A CN 200510038931 A CN200510038931 A CN 200510038931A CN 1674091 A CN1674091 A CN 1674091A
- Authority
- CN
- China
- Prior art keywords
- string
- character
- character string
- strings
- syllabogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种地理信息的语音识别方法,其特征是:再现有语音识别方法的基础上,增加语言获取和语言匹配两个步骤;语言获取是利用现有语音识别模块及其调用接口,加入到地理信息的应用处理程序中,得到识别后的随机带噪字符串,将其转换为拼音字符串;语言的匹配是从现有的地理信息数据库中取出地理信息字符串转换为拼音字符串,与带噪拼音字符串匹配,计算基于拼音字符串的相近匹配度,从中得到最大相近匹配度的源串为语音识别的结果字符串,即需要查询的地理信息名称。本方法提高了语音识别的灵敏度和语音识别的能力,算法简单易行,可以和各种语音识别软件配合使用。将其应用到导航系统中,可以提高交通导航系统的智能化程度。
Description
技术领域
本发明涉及一种语音识别方法,具体说是一种地理信息的语音识别方法及其在导航系统中的应用。
背景技术
语音识别技术就是一个让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,它可以为电子地图和地理信息系统(GIS)的应用提供智能化的人机交互界面服务。地理信息具有应用广泛的特点,对一个地理信息产品,通常使用者众多且频繁变动,外部环境噪声干扰大,随机性强,另外在我国地名信息一般采用汉字,文字之间有时缺乏语义关联,都直接影响了语音识别软件的应用。一些优秀的语音识别软件和模块,如IBM ViaVoice、NaturallySpeaking、Microsoft Speech SDK等,汉语语音识别率与英文相比偏低,受环境噪声影响大,易生成错误文字或者无效文字,难以在电子地图和GIS中得到较好的应用。在2686930专利公开的机载GPS语音导航系统中,语音主要用于导航信息的提示,无法进一步发挥语音识别的作用。
由于噪声对语音识别的影响大,目前主要通过对语音信号的处理来解决,包括语音增强、噪声屏蔽、提取特征参数和自适应处理等。据1542737专利公开了一种语音识别噪声自适应系统和方法,能够对许多类型的噪声数据进行最优聚类并且提高对输入语音的语音模型序列估计的精确度。哈尔滨工业大学的韩纪庆等人提出了在高噪声环境下应用环境特征学习方法针对特定人孤立词的语音识别方法。但是这些方法都是直接面对语音的底层处理,易导致系统的不灵活。对电子地图和GIS应用而言,尽管采用互联网上免费提供的开放的语音识别软件模块获取的数据可能带有噪声,但在已有地理信息数据库的情况下,可以利用现有的先验数据,通过近似的模糊匹配,来提高语音识别的效率。这些软件模块成本低,占用空间少,容易获取与更新,适合于要求功能灵活、快捷的电子地图与GIS系统的需要。
发明内容
本发明所要解决的技术问题在于克服现有技术存在的缺陷,针对目前汉语语音识别软件在噪声环境下存在的识别率低的情况,以现有语音识别模块为语音数据采集与识别的基础工具,对由其获取的随机带噪字符串,利用已有的地理信息名称字符串,建立在噪声破坏下它们之间存在的更加反映细节近似程度的相近匹配度指标,提供一种地理信息的语音识别方法,并将其应用于导航系统中。
由于在我国地理信息名称的文字之间有时缺乏关联性,汉字的语音表达很难保证完全正确,本发明是基于地理信息的语音识别方法,因此采用拼音字符串比较的方法,以提高语言匹配的效率。拼音字符串为汉字字符串的拼音转换,其中每个汉字所对应的拼音字符串称为音节字符串,每个音节字符串由声母字符串和韵母字符串构成,其中声母字符串的字符不能分解,最多只能计算成1个字符,称为有效字符,如b、p、s、sh、ch、zh都是1个有效字符,韵母字符串可以分解,如iu、ao都是2个有效字符,iong、uang都是4个有效字符。音节字符串之间用特定字符(如空格)分割。针对拼音中存在模糊拼音的情况,应将模糊拼音视为相同,以提高识别率。
本发明方法是再现有语音识别方法的基础上,增加语言获取和语言匹配两个步骤;
语言获取——是利用现有语音识别模块及其调用接口,加入到地理信息的应用处理程序中,运行该程序,启动语音采集和识别功能,得到识别后的随机带噪字符串,将其转换为拼音字符串;汉语到拼音字符串的转换是通过现有汉字-拼音对照文件直接编写转换函数实现;
语言的匹配——考虑到随机噪音的存在,从现有的地理信息数据库中取出地理信息字符串,同样转换为拼音字符串(简称为源串),与带噪拼音字符串(简称目标串)匹配,计算基于拼音字符串的相近匹配度,从中得到最大相近匹配度的源串为语音识别的结果字符串,即需要查询的地理信息名称;
所述相近匹配度计算的基本过程是:
a、设定源串的音节数、有效字符数为M1、N1,目标串的音节数、有效字符数为M2、N2;源串的音节字符串集合为S1={S1′|i=1,M1 and ∑ Len(S1′)=N1},目标串的音节字符串集合为S2={S2′|i=1,M1 and ∑ Len(S2′)=N2};Len(S)表示字符串S的长度,分割符不在计算范围内;
b、将源串的拼音字符串递次从前面去掉1个音节字符串,得到M1个新拼音字符串集合T={Tk|k=1,M1 and Tk={S1′|i=k,M1}}
c、依次从T中取出新拼音字符串(Tj,j=1,M1),分别与目标串进行匹配运算;
d、从Tj中依次取出音节字符串Yn=S1n+j-1,n=1,M1-j+1;
e、对于Yn,与目标串S2的音节字符串比较时,必须从S2的第m个音节字符串S2m开始一直到S2M2(最后一个音节字符串),得到(M2-m+1)个匹配值,其中最大的一个匹配值记为Mat(Yn),该匹配值对应的音节字符串在S2中的音节位置记为Loc(Yn);设初始化时Loc(Y0)=0,对于m,则有
对于两个音节字符串的匹配比较,设其匹配值为p,初始化为0,应遵循三个原则:①两个音节字符串的声母、韵母字符串分开比较;②无论是声母比较,还是韵母比较,模糊拼音文件中记录的模糊拼音应确定为完全匹配;③两个音节字符串的声母字符串相互比较,如果完全匹配,p加1,否则不计;两个音节字符串的韵母字符串相互比较,如果完全匹配或者部分匹配,p增加匹配正确的有效字符数,否则不计;部分匹配是指两个字符串中部分字符相同,且前后顺序一致的情况,如iong和ing就有三个字符匹配,分别为i、n、g;
f、转到d,直到Tj的所有音节字符串结束;
g、对于Tj和S2比较的结果,得到一组{Mat(Yn)|n=1,M1-j+1}序列,从中找出最大匹配值
Qj=MAX{Mat(Yn)|n=1,M1-j+1}
作为Tj与目标串S2的匹配值;从{Loc(Yn)|n=1,M1-j+1}序列中计算当Tj时,目标串S2的有效匹配区域的上下限音节位置分别为
Locmax=MAX{Loc(Yn)|n=1,M1-j+1}
Locmin=MIN{Loc(Yn)|n=1,M1-j+1}
MIN{}表示取集合中的最小值,MAX{}表示取集合中的最大值;匹配区域内的有效字符总数为
h、转到d,直到T中所有的新拼音字符串比较结束;
i、得到一组{(Qj,N2j′)|j=1,M1}序列,其中{Qj|j=1,M1}中的最大值Q为源串S1与目标串S2的结果匹配值,对应的N2j′值为目标串S2的匹配区域内的有效字符总数,记为N2′;
j、计算基于源串和目标串的相近匹配度,其大小为S1与S2经过匹配运算后的最大匹配字符数和总有效字符数的比值的两倍,其中总有效字符数是S1的有效字符串数N1与S2的匹配区域内有效字符数N2′之和,即相近匹配度
本发明公开的方法是以地理信息应用为目的,以地理名称信息为对象,在传统的基于语音信号的模式匹配基础之上,通过对得到的随机带噪语言和地理信息名称数据的细部结构相近程度比较,在二次匹配的基础上提高了语音识别的灵敏度,提高了语音识别的能力,且算法简单易行,可以和各种语音识别软件配合使用。
相近匹配度的概念提供了一个在正确拼音字符串和带噪拼音字符串之间比较相近程度的量化指标,其核心思想是承认语音输入和识别过程中噪声的客观存在和随机性,同时该指标也解决了输入信息不足情况下的模糊识别问题。
本方法针对地理信息的语音识别,采用了如下的策略:(1)以拼音字符串为处理对象,避免了汉字匹配度相对较低的问题;(2)在随机噪声干扰下,针对用户语音被部分破坏(包括声母破坏或韵母破坏)或者完全破坏的情况,在匹配运算时采用以音节为单位进行声母字符串与韵母字符串独立比较的方法,既考虑了音节字符串的完整性,又同时提高了匹配的灵敏度;(3)在最大匹配字符数计算时,采用了递次从源串的前面去掉一个音节字符串,作为一个新拼音字符串,并重新和目标串比较,提高了后面音节字符串的匹配率,避免由于目标串前面音节被噪声破坏的影响;(4)在相近匹配度计算时以总有效字符数为分母,总有效字符数同时考虑了源串和目标串的匹配有效区,从而进一步起到降低噪声和提高模糊匹配能力的作用。
本方法没有从语音的声音模型分析开始,而是用一般常用的语音输入识别模块为基础,将重点放在语言的匹配与理解上,随着语音输入设备和识别软件的进一步完善,结合本方法的匹配与理解功能,将具有更好的效果,对于提高交通导航系统的智能化程度发挥更大的作用。
附图说明
图1本发明方法计算机软件流程框图;
图2两个拼音字符串相近匹配度算法流程图;
图3两个单音节字符串匹配值算法流程图;
图4~15为测试的一些典型例图,拼音为Microsoft Speech SDK识别结果,中文名称为采用本发明的方法在拼音基础上重新匹配的结果。
具体实施方式
下面结合附图和实施例,对本发明作进一步详细说明。
实施例:
以电子地图支持下的交通导航系统为例,通过采集城市电子地图数据库,包括城市地图(尤其包括城市交通)的空间数据和地名信息等,建立导航句法—关键词规则库,运用本发明的语音识别方法,从依次取出每条句法的关键词字符串转换为拼音字符串作为源串,与语音输入的目标串进行匹配,得到一组相近匹配度值,取其中最大的值所对应的拼音字符串作为关键字,以此为基础截取带噪的地理信息名称字符串。从电子地图数据库中依次取出地理信息名称字符串转换为拼音字符串作为源串,将带噪的地理信息名称字符串作为目标串进行相近匹配度计算,得到一组相近匹配度,取其中最大值,记录对应的字符串作为名称字符串。根据功能的要求,通过记录的名称从电子地图数据库中取出地图目标,进行目标查询或路径分析处理,并将运算结果显示在电子地图中。
表1~2为Microsoft Speech SDK与经过本发明方法匹配后的识别率比较,其中表1在白天测试,运行环境噪声显著,表2在深夜测试,噪声不显著。测试人员使用头戴式麦克风,每人读相同的25组地名。
表1
试验人员编号 | 01 | 02 | 03 | 04 | 平均值 |
试验次数 | 25 | 25 | 25 | 25 | 25 |
Microsoft SpeechSDK | 48% | 56% | 64% | 56% | 56% |
本方法 | 84% | 88% | 84% | 76% | 83% |
表2
试验人员编号 | 01 | 02 | 03 | 04 | 平均值 |
试验次数 | 25 | 25 | 25 | 25 | 25 |
Microsoft SpeechSDK | 76% | 88% | 72% | 84% | 82% |
本方法 | 96% | 96% | 88% | 92% | 93% |
Claims (2)
1、一种地理信息的语音识别方法,其特征是:在现有语音识别方法的基础上,增加语言获取和语言匹配两个步骤;
语言获取——是利用现有语音识别模块及其调用接口,加入到地理信息的应用处理程序中,运行该程序,启动语音采集和识别功能,得到识别后的随机带噪字符串,将其转换为拼音字符串;汉语到拼音字符串的转换是通过现有汉字-拼音对照文件直接编写转换函数实现;
语言的匹配——考虑到随机噪音的存在,从现有的地理信息数据库中取出地理信息字符串,同样转换为拼音字符串(简称为源串),与带噪拼音字符串(简称目标串)匹配,计算基于拼音字符串的相近匹配度,从中得到最大相近匹配度的源串为语音识别的结果字符串,即需要查询的地理信息名称;
所述相近匹配度计算的基本过程是:
a、设定源串的音节数、有效字符数为M1、N1,目标串的音节数、有效字符数为M2、N2;源串的音节字符串集合为S1={S1i|i=1,M1and∑Len(S1i)=N1},目标串的音节字符串集合为S2={S2i|i=1,M1and∑Len(S2i)=N2};Len(S)表示字符串S的长度,分割符不在计算范围内;
b、将源串的拼音字符串递次从前面去掉1个音节字符串,得到M1个新拼音字符串集合T={Tk|k=1,M1andTk={S1i|i=k,M1}};
c、依次从T中取出新拼音字符串(Tj,j=1,M1),分别与目标串进行匹配运算;
d、从Tj中依次取出音节字符串Yn=S1n+j-1,n=1,M1-j+1;
e、对于Yn,与目标串S2的音节字符串比较时,必须从S2的第m个音节字符串S2m开始一直到S2M2(最后一个音节字符串),得到(M2-m+1)个匹配值,其中最大的一个匹配值记为Mat(Yn),该匹配值对应的音节字符串在S2中的音节位置记为Loc(Yn);设初始化时Loc(Y0)=0,对于m,则有
对于两个音节字符串的匹配比较,设其匹配值为p,初始化为0,应遵循三个原则:①两个音节字符串的声母、韵母字符串分开比较;②无论是声母比较,还是韵母比较,模糊拼音文件中记录的模糊拼音应确定为完全匹配;③两个音节字符串的声母字符串相互比较,如果完全匹配,p加1,否则不计;两个音节字符串的韵母字符串相互比较,如果完全匹配或者部分匹配,p增加匹配正确的有效字符数,否则不计;部分匹配是指两个字符串中部分字符相同,且前后顺序一致的情况,如iong和ing就有三个字符匹配,分别为i、n、g;
f、转到d,直到Tj的所有音节字符串结束;
g、对于Tj和S2比较的结果,得到一组{Mat(Yn)|n=1,M1-j+1}序列,从中找出最大匹配值
Qj=MAX{Mat(Yn)|n=1,M1-j+1}作为Tj与目标串S2的匹配值;从{Loc(Yn)|n=1,M1-j+1}序列中计算当Tj时,目标串S2的有效匹配区域的上下限音节位置分别为
Locmax=MAX{Loc(Yn)|n=1,M1-j+1}
Locmin=MIN{Loc(Yn)|n=1,M1-j+1}MIN{}表示取集合中的最小值,MAX{}表示取集合中的最大值;匹配区域内的有效字符总数为
h、转到d,直到T中所有的新拼音字符串比较结束;
i、得到一组{(Qj,N2j′)|j=1,M1}序列,其中{Qj|j=1,M1}中的最大值Q为源串S1与目标串S2的结果匹配值,对应的N2j′值为目标串S2的匹配区域内的有效字符总数,记为N2′;
j、计算基于源串和目标串的相近匹配度,其大小为S1与S2经过匹配运算后的最大匹配字符数和总有效字符数的比值的两倍,其中总有效字符数是S1的有效字符串数N1与S2的匹配区域内有效字符数N2′之和,即相近匹配度
2、权利要求1所述的地理信息的语音识别方法在导航系统中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100389311A CN100358006C (zh) | 2005-04-18 | 2005-04-18 | 地理信息的语音识别方法及其在导航系统中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100389311A CN100358006C (zh) | 2005-04-18 | 2005-04-18 | 地理信息的语音识别方法及其在导航系统中的应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1674091A true CN1674091A (zh) | 2005-09-28 |
CN100358006C CN100358006C (zh) | 2007-12-26 |
Family
ID=35046587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100389311A Expired - Fee Related CN100358006C (zh) | 2005-04-18 | 2005-04-18 | 地理信息的语音识别方法及其在导航系统中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100358006C (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100375006C (zh) * | 2006-01-19 | 2008-03-12 | 吉林大学 | 车辆导航装置语音控制系统 |
CN101093478B (zh) * | 2007-07-25 | 2010-06-02 | 中国科学院计算技术研究所 | 一种根据实体的汉语简称识别汉语全称的方法及系统 |
CN101345051B (zh) * | 2008-08-19 | 2010-11-10 | 南京师范大学 | 带定量参数的地理信息系统语音控制方法 |
CN101383150B (zh) * | 2008-08-19 | 2010-11-10 | 南京师范大学 | 语音软开关的控制方法及其在地理信息系统中的应用 |
CN102016502A (zh) * | 2008-03-07 | 2011-04-13 | 谷歌公司 | 基于场境的语音识别语法选择 |
CN102074231A (zh) * | 2010-12-30 | 2011-05-25 | 万音达有限公司 | 语音识别方法和语音识别系统 |
CN101846525B (zh) * | 2009-03-23 | 2012-08-08 | 华为软件技术有限公司 | 导航信息处理、获取方法及装置 |
CN102750949A (zh) * | 2012-07-16 | 2012-10-24 | 深圳市车音网科技有限公司 | 语音识别方法和装置 |
WO2013178002A1 (zh) * | 2012-05-29 | 2013-12-05 | 中国移动通信集团公司 | 一种语音识别匹配的方法和设备,以及计算机程序和存储介质 |
CN103680503A (zh) * | 2012-08-31 | 2014-03-26 | 中瀚国际语识有限公司 | 语义辨识方法 |
CN104216906A (zh) * | 2013-05-31 | 2014-12-17 | 大陆汽车投资(上海)有限公司 | 语音搜索方法和设备 |
CN105895090A (zh) * | 2016-03-30 | 2016-08-24 | 乐视控股(北京)有限公司 | 语音信号处理方法及装置 |
CN106297799A (zh) * | 2016-08-09 | 2017-01-04 | 乐视控股(北京)有限公司 | 语音识别处理方法及装置 |
CN106653007A (zh) * | 2016-12-05 | 2017-05-10 | 苏州奇梦者网络科技有限公司 | 一种语音识别系统 |
CN108268637A (zh) * | 2018-01-17 | 2018-07-10 | 广东蔚海数问大数据科技有限公司 | 一种智能语音矫正识别方法、装置和用户终端 |
CN109377993A (zh) * | 2018-10-12 | 2019-02-22 | 上海庆科信息技术有限公司 | 智能语音系统及其语音唤醒方法及智能语音设备 |
CN109697983A (zh) * | 2017-10-24 | 2019-04-30 | 上海赛趣网络科技有限公司 | 汽车钢印号快速获取方法、移动终端及存储介质 |
CN112215216A (zh) * | 2020-09-10 | 2021-01-12 | 中国东方电气集团有限公司 | 一种图像识别结果的字符串模糊匹配系统及方法 |
CN112825090A (zh) * | 2019-11-21 | 2021-05-21 | 腾讯科技(深圳)有限公司 | 一种兴趣点确定的方法、装置、设备和介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020072917A1 (en) * | 2000-12-11 | 2002-06-13 | Irvin David Rand | Method and apparatus for speech recognition incorporating location information |
US20020111810A1 (en) * | 2001-02-15 | 2002-08-15 | Khan M. Salahuddin | Spatially built word list for automatic speech recognition program and method for formation thereof |
DE10132887A1 (de) * | 2001-07-06 | 2003-01-16 | Bosch Gmbh Robert | System und Verfahren zum Navigieren eines Fortbewegungsmittels |
CN2686930Y (zh) * | 2004-02-17 | 2005-03-23 | 中国林业科学研究院资源信息研究所 | 机载gps语音导航系统 |
-
2005
- 2005-04-18 CN CNB2005100389311A patent/CN100358006C/zh not_active Expired - Fee Related
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100375006C (zh) * | 2006-01-19 | 2008-03-12 | 吉林大学 | 车辆导航装置语音控制系统 |
CN101093478B (zh) * | 2007-07-25 | 2010-06-02 | 中国科学院计算技术研究所 | 一种根据实体的汉语简称识别汉语全称的方法及系统 |
CN102016502A (zh) * | 2008-03-07 | 2011-04-13 | 谷歌公司 | 基于场境的语音识别语法选择 |
CN113506567A (zh) * | 2008-03-07 | 2021-10-15 | 谷歌有限责任公司 | 基于场境的语音识别语法选择方法和系统 |
CN102016502B (zh) * | 2008-03-07 | 2017-06-09 | 谷歌公司 | 基于场境的语音识别语法选择方法及系统 |
CN101345051B (zh) * | 2008-08-19 | 2010-11-10 | 南京师范大学 | 带定量参数的地理信息系统语音控制方法 |
CN101383150B (zh) * | 2008-08-19 | 2010-11-10 | 南京师范大学 | 语音软开关的控制方法及其在地理信息系统中的应用 |
CN101846525B (zh) * | 2009-03-23 | 2012-08-08 | 华为软件技术有限公司 | 导航信息处理、获取方法及装置 |
CN102074231A (zh) * | 2010-12-30 | 2011-05-25 | 万音达有限公司 | 语音识别方法和语音识别系统 |
WO2013178002A1 (zh) * | 2012-05-29 | 2013-12-05 | 中国移动通信集团公司 | 一种语音识别匹配的方法和设备,以及计算机程序和存储介质 |
CN103456297B (zh) * | 2012-05-29 | 2015-10-07 | 中国移动通信集团公司 | 一种语音识别匹配的方法和设备 |
CN103456297A (zh) * | 2012-05-29 | 2013-12-18 | 中国移动通信集团公司 | 一种语音识别匹配的方法和设备 |
CN102750949B (zh) * | 2012-07-16 | 2015-04-01 | 深圳市车音网科技有限公司 | 语音识别方法和装置 |
CN102750949A (zh) * | 2012-07-16 | 2012-10-24 | 深圳市车音网科技有限公司 | 语音识别方法和装置 |
CN103680503A (zh) * | 2012-08-31 | 2014-03-26 | 中瀚国际语识有限公司 | 语义辨识方法 |
CN104216906A (zh) * | 2013-05-31 | 2014-12-17 | 大陆汽车投资(上海)有限公司 | 语音搜索方法和设备 |
CN105895090A (zh) * | 2016-03-30 | 2016-08-24 | 乐视控股(北京)有限公司 | 语音信号处理方法及装置 |
WO2017166649A1 (zh) * | 2016-03-30 | 2017-10-05 | 乐视控股(北京)有限公司 | 语音信号处理方法及装置 |
CN106297799A (zh) * | 2016-08-09 | 2017-01-04 | 乐视控股(北京)有限公司 | 语音识别处理方法及装置 |
CN106653007A (zh) * | 2016-12-05 | 2017-05-10 | 苏州奇梦者网络科技有限公司 | 一种语音识别系统 |
CN106653007B (zh) * | 2016-12-05 | 2019-07-16 | 苏州奇梦者网络科技有限公司 | 一种语音识别系统 |
CN109697983A (zh) * | 2017-10-24 | 2019-04-30 | 上海赛趣网络科技有限公司 | 汽车钢印号快速获取方法、移动终端及存储介质 |
CN109697983B (zh) * | 2017-10-24 | 2024-06-11 | 上海赛趣网络科技有限公司 | 汽车钢印号快速获取方法、移动终端及存储介质 |
CN108268637A (zh) * | 2018-01-17 | 2018-07-10 | 广东蔚海数问大数据科技有限公司 | 一种智能语音矫正识别方法、装置和用户终端 |
CN109377993A (zh) * | 2018-10-12 | 2019-02-22 | 上海庆科信息技术有限公司 | 智能语音系统及其语音唤醒方法及智能语音设备 |
CN112825090A (zh) * | 2019-11-21 | 2021-05-21 | 腾讯科技(深圳)有限公司 | 一种兴趣点确定的方法、装置、设备和介质 |
CN112825090B (zh) * | 2019-11-21 | 2024-01-05 | 腾讯科技(深圳)有限公司 | 一种兴趣点确定的方法、装置、设备和介质 |
CN112215216A (zh) * | 2020-09-10 | 2021-01-12 | 中国东方电气集团有限公司 | 一种图像识别结果的字符串模糊匹配系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN100358006C (zh) | 2007-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100358006C (zh) | 地理信息的语音识别方法及其在导航系统中的应用 | |
CN1156821C (zh) | 具有互补语言模型的识别引擎 | |
Vergyri et al. | The SRI/OGI 2006 spoken term detection system. | |
US9218412B2 (en) | Searching a database of listings | |
Mandal et al. | Recent developments in spoken term detection: a survey | |
US8195459B1 (en) | Augmentation and calibration of output from non-deterministic text generators by modeling its characteristics in specific environments | |
US7729913B1 (en) | Generation and selection of voice recognition grammars for conducting database searches | |
US8321218B2 (en) | Searching in audio speech | |
CA2313968A1 (en) | A method for correcting the error characters in the result of speech recognition and the speech recognition system using the same | |
KR20080069990A (ko) | 음성 세그먼트 색인 및 검색 방법과 컴퓨터 실행 가능명령어를 갖는 컴퓨터 판독 가능 매체 | |
JPH0782353B2 (ja) | 音声及び手書き動作の統合型情報を用いたメッセージ認識システム及び方法 | |
CN1402868A (zh) | 使用离散语言模型的语音识别方法和设备 | |
CN116110405B (zh) | 一种基于半监督学习的陆空通话说话人识别方法及设备 | |
Gandhe et al. | Using web text to improve keyword spotting in speech | |
CN1151489C (zh) | 中国人名、地名和单位名的语音识别方法 | |
CN116246610A (zh) | 基于多模态识别的会议记录生成方法及系统 | |
Sim | Haptic voice recognition: Augmenting speech modality with touch events for efficient speech recognition | |
Lecouteux et al. | Combined low level and high level features for out-of-vocabulary word detection | |
Weinstein et al. | Music identification with weighted finite-state transducers | |
CN201431454Y (zh) | 带方言识别的人体生物信息采集系统 | |
US20050125224A1 (en) | Method and apparatus for fusion of recognition results from multiple types of data sources | |
Ou et al. | Application of keywords speech recognition in agricultural voice information system | |
Rahim et al. | Robust numeric recognition in spoken language dialogue | |
Wang | Mandarin spoken document retrieval based on syllable lattice matching | |
CN111506764A (zh) | 音频数据筛选方法、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |