CN105869634B - 一种基于领域的带反馈语音识别后文本纠错方法及系统 - Google Patents
一种基于领域的带反馈语音识别后文本纠错方法及系统 Download PDFInfo
- Publication number
- CN105869634B CN105869634B CN201610200575.7A CN201610200575A CN105869634B CN 105869634 B CN105869634 B CN 105869634B CN 201610200575 A CN201610200575 A CN 201610200575A CN 105869634 B CN105869634 B CN 105869634B
- Authority
- CN
- China
- Prior art keywords
- text
- word
- sentence
- speech recognition
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012937 correction Methods 0.000 title claims abstract description 37
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 abstract description 5
- 238000001514 detection method Methods 0.000 abstract description 2
- 230000008713 feedback mechanism Effects 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 9
- 235000013399 edible fruits Nutrition 0.000 description 5
- 238000011160 research Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
Abstract
本发明公开了一种基于领域的带反馈语音识别后文本纠错方法,属于语音识别领域;该方法基于汉语句子结构的语音停顿错误来分析语音识别后文本句,检测句子分隔符前后是否符合汉语的句式规则,找到停顿错误,基于音素串相似度计算来划分句子并转换成拼音,并将拼音根据音素表转换成音素串,找到语料库中与该串相似的音素串对应的句子,基于本体的受控词查询模块通过该领域的受控词表建立本体,通过本体纠正识别后文本句中的领域相关词的错误,反馈模块将匹配的结果输出,并将用户选择正确的识别结果和原始的音素串添加进语料库中。通过本发明,语音识别的原始结果如果正确也不会收到影响,而且通过本体和反馈机制可以更好的确定语音识别的准确性。
Description
技术领域
本发明涉及语音识别技术领域,特别是一种基于领域的带反馈语音识别后文本纠错方法。
背景技术
随着计算科学技术的迅猛发展,人类和计算机、机器进行语言交流的机会日益增加且越发重要,怎么使它“理解”人的语言并做出恰当回应就摆上了研究的日程,语音识别的研究目标就是让机器“听懂”人类的语言。
语音识别过程也可以分为前处理过程和后处理过程。前处理过程主要是对输入的语音信号提取参数进行分析,其重点在语音信号处理方面。而后处理主要是完成音节到汉字的转换,即将语音信息转换成计算机内码。这是一个小字符集映射到大字符集的问题,其涉及的范畴属中文信息处理、自然语言理解及人工智能。
语音识别后处理过程主要通过语言模型实现,把语言模型应用于语音识别中要解决两个问题,一是能够用数学模型来描述语言中词的语言结构,二是在给定这样一种结构的基础上,如何把它和模式识别器结合找出一种有效的识别算法。常见的语言模型有两种:
(1)基于统计的语言模型,通过训练大量语料获得语言单位之间的内在的规律来修正语音识别后的语言模型,使识别后的语言模型更加符合一般的语言规律。它的优点是对开放性纠错支持的较好,因为它是从广义的语言学上着手的,不过在某些特定领域上,它的性能尚有待提高。基于规则的语言模型一般是面向比较特殊的语音识别系统,但一般来说,基于规则的语言模型鲁棒性并不强,实用性较弱。
(2)基于统计学语言模型,用概率统计的方法来揭示语言单位内在的统计规律,它们大多是以词语为分析单位,通过考察词与词之间的关系,根据语法、语义知识来判断词语使用正确与否。但是这种方法需要大量的语料进行训练,对于特定领域的语音识别后纠错,由于语料库的限制,纠错比较困难,而且对一些不常出现的词语尤其是同音词的纠错比较困难。
因此,需要一种基于领域的带反馈语音识别后文本纠错方法及系统。
发明内容
本发明的目的就是提供一种基于领域的带反馈语音识别后文本纠错方法及系统。
本发明的目的是通过这样的技术方案实现的:
本发明提供的一种基于领域的带反馈语音识别后文本纠错方法,包括以下步骤:
S1、根据受控词典对语音识别后文本句进行词性标注,根据汉语句子结构识别停顿错误;
S2、将文本句转换成音素串,并与文本库中的音素串进行匹配,如果匹配成功,则转到步骤S4;如果匹配不成功,则转到步骤S3;
S3、根据本体与受控词典中进行匹配,如果匹配不成功,则结束识别过程;如果匹配成功,则进入下一步;
S4、将一个或者多个匹配的结果输出;
S5、将用户选择的识别成功的文本句和对应的原始文本的音素串添加到文本库中。
进一步,所述步骤S1中的停顿错误识别过程还包括以下步骤:
S11、收集领域相关词语构成受控词典,基于汉语词典将对受控词典中词语进行词性标注,并对常用的汉语句子结构进行建模;
S12、得到语音识别后的文本;
S13、对识别后的文本停顿处两边的句子进行词性划分;
S14、将已标注的句子结构与收录好的句子结构进行匹配,如果匹配成功,则该句子无停顿错误,输出该文本句;如果不匹配则该句子停顿有错误如果存在,则合并停顿分句输出文本句。
进一步,所述步骤S2中音素串的匹配过程具体包括以下步骤:
S21、根据音素串长度设置预设匹配阈值;
S22、计算语料库中的音素串与识别的音素串的相似度,判断两个音素串的编辑距离是否超过预设阈值,如果没有超过,则匹配成功;如果超过,则匹配失败。
进一步,所述步骤S3中根据本体和受控词典的匹配具体包括以下步骤:
S31、找到语音识别后文本标注时受控词典中不存在的文本词,将未识别的词语本身、未识别词语与左边词语结合、未识别词语和右边词语结合、未识别词语与左右两边词语结合后转换成音素串与受控词典中词语进行匹配,选择相似度最高且匹配长度最长的词语替换该词语;
S32、对于出现多个完全匹配项或者多个最相似匹配项的情况,通过本体建立文本上下文的语境联系,选择本体所属领域的匹配词进行替换;如果无上下文联系,则将多种结果都加入到匹配文本中,供用户选择。
本实施例还提供了一种基于领域的带反馈语音识别后文本纠错系统,包括语音停顿错误分析模块、语音匹配模块、受控词查询模块和反馈模块;
所述语音停顿错误分析模块,用于对语音识别后文本进行词性标注并判断语音停顿是否存在错误状态;
所述语音匹配模块,用于将文本句转换成音素串并与文本库中的音素串进行匹配;
所述受控词查询模块,用于纠正文本句中未在受控词典中的词语并根据本体纠正同音词错误;
所述反馈模块,用于将匹配的一个结果或者多个结果输出,并将用户选择识别正确的文本句和原始语音识别后文本的音素串添加到文本库中。
进一步,所述语音停顿错误分析模块中的停顿错误识别过程是通过以下步骤来实现的:
S11、收集领域相关词语构成受控词典,基于汉语词典将对受控词典中词语进行词性标注,并对常用的汉语句子结构进行建模;
S12、得到语音识别后的文本;
S13、对识别后的文本停顿处两边的句子进行词性划分;
S14、将已标注的句子结构与收录好的句子结构进行匹配,如果匹配成功,则该句子无停顿错误,输出该文本句;如果不匹配则该句子停顿有错误如果存在,则合并停顿分句输出文本句。
进一步,所述语音匹配模块中的音素串的匹配过程具体是通过以下步骤来实现的:
S21、根据音素串长度设置预设匹配阈值;
S22、计算语料库中的音素串与识别的音素串的相似度,判断两个音素串的编辑距离是否超过预设阈值,如果没有超过,则匹配成功;如果超过,则匹配失败。
进一步,所述受控词查询模块中根据本体和受控词典的匹配具体是通过以下步骤来实现的:
S31、找到语音识别后文本标注时受控词典中不存在的文本词,将未识别的词语本身、未识别词语与左边词语结合、未识别词语和右边词语结合、未识别词语与左右两边词语结合后转换成音素串与受控词典中词语进行匹配,选择相似度最高且匹配长度最长的词语替换该词语;
S32、对于出现多个完全匹配项或者多个最相似匹配项的情况,通过本体建立文本上下文的语境联系,选择本体所属领域的匹配词进行替换;如果无上下文联系,则将多种结果都加入到匹配文本中,供用户选择。
由于采用了上述技术方案,本发明具有如下的优点:
本发明提供的一种基于领域的带反馈语音识别后文本纠错方法,基于汉语句子结构的语音停顿错误分析,对语音识别后文本句进行分析,检测句子分隔符前后是否符合汉语的句式规则,找到停顿错误,并将拼音根据音素表转换成音素串,找到语料库中与该音素串相似的音素串对应的句子,基于受控词表建立本体,通过本体纠正识别后文本句中的领域相关词的错误,反馈模块将匹配的结果输出,并将用户选择正确的识别结果和原始的音素串添加进语料库中。通过本发明,语音识别的原始结果如果正确也不会受到影响,而且通过本体和反馈机制可以更好的确定语音识别的准确性。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和权利要求书来实现和获得。
附图说明
本发明的附图说明如下。
图1是本发明中纠错方法的基本流程和结构图
图2是本发明中基于领域的带反馈语音识别后文本纠错方法的处理流程图。
图3是本发明中语音停顿错误识别流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例1
如图所示,本实施例提供的一种基于领域的带反馈语音识别后文本纠错方法,包括以下步骤:
S1、根据受控词典对语音识别后文本句进行词性标注,根据汉语句子结构识别停顿错误;
S2、将文本句转换成音素串,并与已矫正文本库中的音素串进行匹配,如果匹配成功,则转到步骤S4;如果匹配不成功,则转到步骤S3;
S3、根据本体与受控词典中进行匹配,如果匹配不成功,则结束识别过程;如果匹配成功,则进入下一步;
S4、将一个或者多个匹配的结果输出;
S5、将用户选择的识别成功的文本句和对应的原始文本的音素串添加到文本库(即语料库或已矫正文本库)中。
所述步骤S1中的停顿错误识别过程还包括以下步骤:
S11、收集领域相关词语构成受控词典,基于汉语词典将对受控词典中词语进行词性标注,并对常用的汉语句子结构进行建模;
S12、通过现有的语音识别软件(科大讯飞语音输入法等)得到语音识别后的文本;
S13、对识别后的文本停顿处两边的句子进行词性划分,对无法进行词性标注的默认其词性是名词;
S14、将已标注的句子结构与收录好的句子结构进行匹配,匹配成功则该句子无停顿错误,输出该文本句;如果不匹配则该句子停顿有错误如果存在,则合并停顿分句输出文本句。
所述步骤S2中音素串的匹配过程具体包括以下步骤:
S21、根据音素串长度设置预设匹配阈值;
S22、计算语料库中的音素串与识别的音素串的相似度,判断两个音素串的编辑距离是否超过预设阈值,如果没有超过,则匹配成功,如果超过,则匹配失败。
所述步骤S3中根据本体和受控词典的匹配具体包括以下步骤:
S31、找到语音识别后文本标注时受控词典中不存在的文本词,将未识别的词语本身、未识别词语与左边词语结合、未识别词语和右边词语结合、未识别词语与左右两边词语结合后转换成音素串与受控词典中词语进行匹配,选择相似度最高且匹配长度最长的词语替换该词语;
S32、对于出现多个完全匹配项或者多个最相似匹配项的情况,通过本体建立文本上下文的语境联系,选择本体所属领域的匹配词进行替换;如果无上下文联系,则将多种结果都加入到匹配文本中,供用户选择。
本实施例还提供了一种基于领域的带反馈语音识别后文本纠错系统,包括语音停顿错误分析模块、语音匹配模块、受控词查询模块和反馈模块;
语音停顿错误分析模块,用于对语音识别后文本进行词性标注并判断语音停顿是否存在错误状态;
语音匹配模块,用于将文本句转换成音素串并与已矫正文本库中的音素串进行匹配;
受控词查询模块,用于纠正文本句中未在受控词典中的词语并根据本体纠正同音词错误;
反馈模块,用于将匹配的一个结果或者多个结果输出,并将用户选择识别正确的文本句和原始语音识别后文本的音素串添加到文本库(即语料库或已矫正文本库)中。
所述语音停顿错误分析模块中的停顿错误识别过程是通过以下步骤来实现的:
S11、收集领域相关词语构成受控词典,基于汉语词典将对受控词典中词语进行词性标注,并对常用的汉语句子结构进行建模;
S12、得到语音识别后的文本;
S13、对识别后的文本停顿处两边的句子进行词性划分;
S14、将已标注的句子结构与收录好的句子结构进行匹配,如果匹配成功,则该句子无停顿错误,输出该文本句;如果不匹配则该句子停顿有错误如果存在,则合并停顿分句输出文本句。
所述语音匹配模块中的音素串的匹配过程具体是通过以下步骤来实现的:
S21、根据音素串长度设置预设匹配阈值;
S22、计算语料库中的音素串与识别的音素串的相似度,判断两个音素串的编辑距离是否超过预设阈值,如果没有超过,则匹配成功;如果超过,则匹配失败。
所述受控词查询模块中根据本体和受控词典的匹配具体是通过以下步骤来实现的:
S31、找到语音识别后文本标注时受控词典中不存在的文本词,将未识别的词语本身、未识别词语与左边词语结合、未识别词语和右边词语结合、未识别词语与左右两边词语结合后转换成音素串与受控词典中词语进行匹配,选择相似度最高且匹配长度最长的词语替换该词语;
S32、对于出现多个完全匹配项或者多个最相似匹配项的情况,通过本体建立文本上下文的语境联系,选择本体所属领域的匹配词进行替换;如果无上下文联系,则将多种结果都加入到匹配文本中,供用户选择。
实施例2
本发明的目的是提供一种基于领域的带反馈语音识别后文本纠错方法,包括以下步骤:
S1、对语音识别后的文本进行词性标注,并判断该语句是否存在停顿错误,如果存在由于停顿而产生的分句,则将两句合并。
S2、将文本句转换成音素串,设置阈值,查找语料库中是否已经识别过该语句,如果识别成功则转到步骤S4,否则转到步骤S3。
S3、根据受控词典和本体对文本句中的词语进行纠错。
S4、将纠错的结果输出到前台页面供用户选择,并将用户正确的识别结果和原始音素串加入到语料库中。
所述步骤S1中语音识别后句子停顿错误判断由以下步骤组成:
S10、收集领域相关词语构成受控词典,基于汉语词典将对受控词典中词语进行词性标注,并对常用的汉语句子结构进行建模,如主谓宾结构等。
S11、同时对识别后的文本停顿处两边的句子进行词性划分,对无法进行词性标注的默认其词性是名词,将标注好的句子结构与收录好的句子结构进行匹配,匹配成功则该句子无停顿错误,如果不匹配则该句子停顿有错误。
本实施通过建立基于音素串相似度计算的语音匹配模块和基于本体的受控词查询模块来实行双重纠错,保证了纠错的准确性,其中,基于音素串相似度计算的语音匹配模块保证了纠错的效率,如果语音识别后的语句已经出现在语料库中,则可以直接在语料库找到,如果没有找到则需要通过受控词典和本体进行纠错。其中,本体是根据受控词典建立,而且根据受控词的特征,会创建多个本体,以从多个侧面矫正错误。
因此,本实施例提供的纠错方法结合了规则和统计学语言模型,弥补了双方的不足;通过对常用语句子结构的建模来消除语音识别常见的停顿错误;通过本体对同音词进行纠错,这样实现了基于上下文语境而不是基于词频纠错。
通过将基于规则和统计学语言模型相结合实现语音识别后文本纠错,通过对受控词典的词性标注和句式分析对识别后文本进行分词和断句,通过本体和语料库去纠错,所述语料库是基于反馈建立的,保证了语料的准确性。
本实施例提供的一种基于领域的带反馈语音识别后文本纠错系统,包括基于汉语句子结构的语音停顿错误分析模块,基于音素串相似度计算的语音匹配模块,基于本体的受控词查询模块和反馈模块。
所述基于汉语句子结构的语音停顿错误分析模块:用于分割语音识别后文本句子的结构,根据词性判断分隔符前后语句的完整性,并基于该分割确定该语句中带有该领域特征的关键词位置。
所述基于音素串相似度计算的语音匹配模块:将划分好的句子转换成汉语拼音的音素串,设置阈值,查找语料库中与该串最相似的音素串对应的汉语句子。
所述基于本体的受控词查询模块:在没有在语料库中找到相应的匹配串基础上,根据本体矫正句子中带有领域特征的受控词的错误。
所述反馈模块:用于将匹配的一个或多个结果输出,供用户选择,并将用户选择正确的语音识别结果及其相应的原始音素串添加到语料库中。
实施例3
本实施例中设定该领域为股票领域,输入语音第一句为“查找电子产业行业涨跌幅”,由语音引擎识别后的文本为“查找电子产业行业,张跌幅”,通过受控词典的词性标注结果为“查找”为动词,“电子产业”为名词,“行业”为名词,“张”在受控词典中不存在,标注为名词,“跌幅”标注为名词。通过句式模板的词性匹配可知,“查找电子产业行业”匹配句式,而“张跌幅”不匹配句式,故而将两句合并。然后将该句转换成音素串,由于语料库为空,无法通过语料库进行匹配,需要对受控词典中不存在的词进行匹配,该句子中“张”在受控词典中不存在,需要将“行业张”、“张跌幅”和“行业张跌幅”分别转换成音素串,与受控词典中受控词的音素串匹配,得到“张跌幅”与受控词典中“涨跌幅”完全匹配,则该句转换为“查找电子产业行业涨跌幅”。在进行词性标注的同时,根据受控词典建立本体,将识别词语与本体匹配,电子产业对应在行业本体之下,并有涨跌幅属性。
设定输入语音第二句为“查看和森科技股票最新价”,由语音引擎识别后的文本为“查看禾森科技股票最新家”,首先仍然需要进行词性标注,“查看”为动词,“禾森科技”为名词,“股票”识别为名词,“最新”识别为形容词,“家”在受控词典中不存在,标记为名词。通过音素串匹配结果,“禾森科技”的音素串与受控词典中“禾森科技”和“和森科技”完全匹配,由于禾森科技在本体中不在电子产业的本体下,而和森科技在电子产业的本体下,故“禾森科技”纠正为“和森科技”。“家”不存在受控词典中故将“最新家”转换成音素串与受控词典匹配,其与“最新价”完全匹配,则原句纠正为“查看和森科技股票最新价”。
本发明能纠正由于语音停顿而产生的断句错误,通过本体可以纠正同音词的错误,通过音素串匹配受控词典可以纠正带有领域特征的受控词的识别错误。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (8)
1.一种基于领域的带反馈语音识别后文本纠错方法,其特征在于:包括以下步骤:
S1、根据受控词典对语音识别后文本句进行词性标注,根据汉语句子结构识别停顿错误;
S2、将文本句转换成音素串,并与文本库中的音素串进行匹配,如果匹配成功,则转到步骤S4;如果匹配不成功,则转到步骤S3;
S3、根据本体与受控词典中进行匹配,如果匹配不成功,则结束识别过程;如果匹配成功,则进入下一步;
S4、将一个或者多个匹配的结果输出;
S5、将用户选择的识别成功的文本句和对应的原始文本的音素串添加到文本库中。
2.根据权利要求1所述的基于领域的带反馈语音识别后文本纠错方法,其特征在于:所述步骤S1中的停顿错误识别过程还包括以下步骤:
S11、收集领域相关词语构成受控词典,基于汉语词典将对受控词典中词语进行词性标注,并对常用的汉语句子结构进行建模;
S12、得到语音识别后的文本;
S13、对识别后的文本停顿处两边的句子进行词性划分;
S14、将已标注的句子结构与收录好的句子结构进行匹配,如果匹配成功,则该句子无停顿错误,输出该文本句;如果不匹配则该句子停顿有错误,则合并停顿分句输出文本句。
3.根据权利要求1所述的基于领域的带反馈语音识别后文本纠错方法,其特征在于:所述步骤S2中音素串的匹配过程具体包括以下步骤:
S21、根据音素串长度设置预设匹配阈值;
S22、计算文本库中的音素串与识别的音素串的相似度,判断两个音素串的编辑距离是否超过预设阈值,如果没有超过,则匹配成功;如果超过,则匹配失败。
4.根据权利要求1所述的基于领域的带反馈语音识别后文本纠错方法,其特征在于:所述步骤S3中根据本体和受控词典的匹配具体包括以下步骤:
S31、找到语音识别后文本标注时受控词典中不存在的文本词,将未识别的词语本身、未识别词语与左边词语结合、未识别词语和右边词语结合以及未识别词语与左右两边词语结合后转换成音素串与受控词典中词语进行匹配,选择相似度最高且匹配长度最长的词语替换该词语;
S32、对于出现多个完全匹配项或者多个最相似匹配项的情况,通过本体建立文本上下文的语境联系,选择本体所属领域的匹配词进行替换;如果无上下文联系,则将多种结果都加入到匹配文本中,供用户选择。
5.一种基于领域的带反馈语音识别后文本纠错系统,其特征在于:包括语音停顿错误分析模块、语音匹配模块、受控词查询模块和反馈模块;
所述语音停顿错误分析模块,用于对语音识别后文本进行词性标注并判断语音停顿是否存在错误状态;
所述语音匹配模块,用于将文本句转换成音素串并与文本库中的音素串进行匹配;
所述受控词查询模块,用于纠正文本句中未在受控词典中的词语并根据本体纠正同音词错误;
所述反馈模块,用于将匹配的一个结果或者多个结果输出,并将用户选择识别正确的文本句和原始语音识别后文本的音素串添加到文本库中。
6.根据权利要求5所述的基于领域的带反馈语音识别后文本纠错系统,其特征在于:所述语音停顿错误分析模块中的停顿错误识别过程是通过以下步骤来实现的:
S11、收集领域相关词语构成受控词典,基于汉语词典将对受控词典中词语进行词性标注,并对常用的汉语句子结构进行建模;
S12、得到语音识别后的文本;
S13、对识别后的文本停顿处两边的句子进行词性划分;
S14、将已标注的句子结构与收录好的句子结构进行匹配,如果匹配成功,则该句子无停顿错误,输出该文本句;如果不匹配则该句子停顿有错误,则合并停顿分句输出文本句。
7.根据权利要求5所述的基于领域的带反馈语音识别后文本纠错系统,其特征在于:所述语音匹配模块中的音素串的匹配过程具体是通过以下步骤来实现的:
S21、根据音素串长度设置预设匹配阈值;
S22、计算文本库中的音素串与识别的音素串的相似度,判断两个音素串的编辑距离是否超过预设阈值,如果没有超过,则匹配成功;如果超过,则匹配失败。
8.根据权利要求5所述的基于领域的带反馈语音识别后文本纠错系统,其特征在于:所述受控词查询模块中根据本体和受控词典的匹配具体是通过以下步骤来实现的:
S31、找到语音识别后文本标注时受控词典中不存在的文本词,将未识别的词语本身、未识别词语与左边词语结合、未识别词语和右边词语结合以及未识别词语与左右两边词语结合后转换成音素串与受控词典中词语进行匹配,选择相似度最高且匹配长度最长的词语替换该词语;
S32、对于出现多个完全匹配项或者多个最相似匹配项的情况,通过本体建立文本上下文的语境联系,选择本体所属领域的匹配词进行替换;如果无上下文联系,则将多种结果都加入到匹配文本中,供用户选择。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610200575.7A CN105869634B (zh) | 2016-03-31 | 2016-03-31 | 一种基于领域的带反馈语音识别后文本纠错方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610200575.7A CN105869634B (zh) | 2016-03-31 | 2016-03-31 | 一种基于领域的带反馈语音识别后文本纠错方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105869634A CN105869634A (zh) | 2016-08-17 |
CN105869634B true CN105869634B (zh) | 2019-11-19 |
Family
ID=56627708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610200575.7A Expired - Fee Related CN105869634B (zh) | 2016-03-31 | 2016-03-31 | 一种基于领域的带反馈语音识别后文本纠错方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105869634B (zh) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107305768B (zh) * | 2016-04-20 | 2020-06-12 | 上海交通大学 | 语音交互中的易错字校准方法 |
CN107895572A (zh) * | 2016-09-30 | 2018-04-10 | 法乐第(北京)网络科技有限公司 | 一种语音识别训练方法及系统 |
CN107122346B (zh) * | 2016-12-28 | 2018-02-27 | 平安科技(深圳)有限公司 | 一种输入语句的纠错方法及装置 |
CN109949813A (zh) * | 2017-12-20 | 2019-06-28 | 北京君林科技股份有限公司 | 一种将语音转换为文字的方法、装置及系统 |
CN108319692B (zh) * | 2018-02-01 | 2021-03-19 | 云知声智能科技股份有限公司 | 异常标点清洗方法、存储介质及服务器 |
CN109003600B (zh) * | 2018-08-02 | 2021-06-08 | 科大讯飞股份有限公司 | 消息处理方法及装置 |
CN109325237B (zh) * | 2018-10-22 | 2023-06-13 | 传神语联网网络科技股份有限公司 | 用于机器翻译的完整句识别方法与系统 |
CN111292751B (zh) * | 2018-11-21 | 2023-02-28 | 北京嘀嘀无限科技发展有限公司 | 语义解析方法及装置、语音交互方法及装置、电子设备 |
CN109461438B (zh) * | 2018-12-19 | 2022-06-14 | 合肥讯飞数码科技有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN109616111B (zh) * | 2018-12-24 | 2023-03-14 | 北京恒泰实达科技股份有限公司 | 一种基于语音识别的场景交互控制方法 |
CN111462748B (zh) * | 2019-01-22 | 2023-09-26 | 北京猎户星空科技有限公司 | 语音识别处理方法、装置、电子设备及存储介质 |
CN109922371B (zh) * | 2019-03-11 | 2021-07-09 | 海信视像科技股份有限公司 | 自然语言处理方法、设备及存储介质 |
CN110110041B (zh) * | 2019-03-15 | 2022-02-15 | 平安科技(深圳)有限公司 | 错词纠正方法、装置、计算机装置及存储介质 |
CN110033769B (zh) * | 2019-04-23 | 2022-09-06 | 施永兵 | 一种录入语音处理方法、终端及计算机可读存储介质 |
CN110148416B (zh) * | 2019-04-23 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置、设备和存储介质 |
CN110232921A (zh) * | 2019-06-21 | 2019-09-13 | 深圳市酷开网络科技有限公司 | 基于生活服务的语音操作方法、装置、智能电视及系统 |
CN112215010A (zh) * | 2019-07-10 | 2021-01-12 | 北京猎户星空科技有限公司 | 一种语义识别方法及设备 |
CN110377706B (zh) * | 2019-07-25 | 2022-10-14 | 腾讯科技(深圳)有限公司 | 基于深度学习的搜索语句挖掘方法及设备 |
CN110598214A (zh) * | 2019-09-10 | 2019-12-20 | 四川长虹电器股份有限公司 | 一种意图识别结果纠错方法 |
CN110826301B (zh) * | 2019-09-19 | 2023-12-26 | 厦门快商通科技股份有限公司 | 标点符号添加方法、系统、移动终端及存储介质 |
CN112988955B (zh) * | 2019-12-02 | 2024-03-15 | 卢文祥 | 多语语音识别及主题语意分析方法与装置 |
CN111192570B (zh) * | 2020-01-06 | 2022-12-06 | 厦门快商通科技股份有限公司 | 语言模型训练方法、系统、移动终端及存储介质 |
CN111341300B (zh) * | 2020-02-28 | 2023-08-15 | 广州国音智能科技有限公司 | 一种获取语音比对音素的方法、装置和设备 |
CN113763921A (zh) * | 2020-07-24 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 用于纠正文本的方法和装置 |
CN112700763B (zh) * | 2020-12-26 | 2024-04-16 | 中国科学技术大学 | 语音标注质量评价方法、装置、设备及存储介质 |
CN113012701B (zh) * | 2021-03-16 | 2024-03-22 | 联想(北京)有限公司 | 一种识别方法、装置、电子设备及存储介质 |
CN113345442A (zh) * | 2021-06-30 | 2021-09-03 | 西安乾阳电子科技有限公司 | 语音识别方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101655837A (zh) * | 2009-09-08 | 2010-02-24 | 北京邮电大学 | 一种对语音识别后文本进行检错并纠错的方法 |
CN102629246A (zh) * | 2012-02-10 | 2012-08-08 | 北京百纳信息技术有限公司 | 识别浏览器语音命令的服务器及浏览器语音命令识别方法 |
CN102682763A (zh) * | 2011-03-10 | 2012-09-19 | 北京三星通信技术研究有限公司 | 修正语音输入文本中命名实体词汇的方法、装置及终端 |
CN102956231A (zh) * | 2011-08-23 | 2013-03-06 | 上海交通大学 | 基于半自动校正的语音关键信息记录装置及方法 |
CN103871407A (zh) * | 2012-12-07 | 2014-06-18 | 浦项工科大学校产学协力团 | 语音识别错误的纠正方法及装置 |
CN104464736A (zh) * | 2014-12-15 | 2015-03-25 | 北京百度网讯科技有限公司 | 语音识别文本的纠错方法和装置 |
CN105279149A (zh) * | 2015-10-21 | 2016-01-27 | 上海应用技术学院 | 一种中文文本自动校正方法 |
KR101590724B1 (ko) * | 2014-10-06 | 2016-02-02 | 포항공과대학교 산학협력단 | 음성 인식 오류 수정 방법 및 이를 수행하는 장치 |
-
2016
- 2016-03-31 CN CN201610200575.7A patent/CN105869634B/zh not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101655837A (zh) * | 2009-09-08 | 2010-02-24 | 北京邮电大学 | 一种对语音识别后文本进行检错并纠错的方法 |
CN102682763A (zh) * | 2011-03-10 | 2012-09-19 | 北京三星通信技术研究有限公司 | 修正语音输入文本中命名实体词汇的方法、装置及终端 |
CN102956231A (zh) * | 2011-08-23 | 2013-03-06 | 上海交通大学 | 基于半自动校正的语音关键信息记录装置及方法 |
CN102629246A (zh) * | 2012-02-10 | 2012-08-08 | 北京百纳信息技术有限公司 | 识别浏览器语音命令的服务器及浏览器语音命令识别方法 |
CN103871407A (zh) * | 2012-12-07 | 2014-06-18 | 浦项工科大学校产学协力团 | 语音识别错误的纠正方法及装置 |
KR101590724B1 (ko) * | 2014-10-06 | 2016-02-02 | 포항공과대학교 산학협력단 | 음성 인식 오류 수정 방법 및 이를 수행하는 장치 |
CN104464736A (zh) * | 2014-12-15 | 2015-03-25 | 北京百度网讯科技有限公司 | 语音识别文本的纠错方法和装置 |
CN105279149A (zh) * | 2015-10-21 | 2016-01-27 | 上海应用技术学院 | 一种中文文本自动校正方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105869634A (zh) | 2016-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105869634B (zh) | 一种基于领域的带反馈语音识别后文本纠错方法及系统 | |
CN107315737B (zh) | 一种语义逻辑处理方法及系统 | |
CN109255113B (zh) | 智能校对系统 | |
US10134388B1 (en) | Word generation for speech recognition | |
US9911413B1 (en) | Neural latent variable model for spoken language understanding | |
WO2020206957A1 (zh) | 一种应用于智能客服机器人的意图识别方法及装置 | |
US8131539B2 (en) | Search-based word segmentation method and device for language without word boundary tag | |
CN106599032B (zh) | 一种结合稀疏编码和结构感知机的文本事件抽取方法 | |
Can et al. | Lattice indexing for spoken term detection | |
CN111931506B (zh) | 一种基于图信息增强的实体关系抽取方法 | |
CN104143329B (zh) | 进行语音关键词检索的方法及装置 | |
JP5440177B2 (ja) | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
US9564122B2 (en) | Language model adaptation based on filtered data | |
CN106257455B (zh) | 一种基于依存关系模板抽取观点评价对象的Bootstrapping方法 | |
CN109637537B (zh) | 一种自动获取标注数据优化自定义唤醒模型的方法 | |
CN104166462A (zh) | 一种文字的输入方法和系统 | |
US10896222B1 (en) | Subject-specific data set for named entity resolution | |
CN103678684A (zh) | 一种基于导航信息检索的中文分词方法 | |
Schuller et al. | Emotion recognition from speech: putting ASR in the loop | |
CN110853628A (zh) | 一种模型训练方法、装置、电子设备及存储介质 | |
US11526512B1 (en) | Rewriting queries | |
CN104485106B (zh) | 语音识别方法、语音识别系统和语音识别设备 | |
CN111444704B (zh) | 基于深度神经网络的网络安全关键词抽取方法 | |
CN110942767A (zh) | 一种asr语言模型识别标注与优化方法及其装置 | |
CN111858900B (zh) | 问句语义解析规则模板的生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191119 |