CN102682763B - 修正语音输入文本中命名实体词汇的方法、装置及终端 - Google Patents
修正语音输入文本中命名实体词汇的方法、装置及终端 Download PDFInfo
- Publication number
- CN102682763B CN102682763B CN201110063938.4A CN201110063938A CN102682763B CN 102682763 B CN102682763 B CN 102682763B CN 201110063938 A CN201110063938 A CN 201110063938A CN 102682763 B CN102682763 B CN 102682763B
- Authority
- CN
- China
- Prior art keywords
- vocabulary
- named entity
- user
- candidate
- lattice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012937 correction Methods 0.000 claims abstract description 27
- 238000001514 detection method Methods 0.000 claims description 14
- 206010028916 Neologism Diseases 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 6
- 208000011580 syndromic disease Diseases 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000013459 approach Methods 0.000 abstract description 8
- 238000012986 modification Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了修正语音输入文本中命名实体词汇的方法及装置,有针对性的定位识别错误的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,同时提供了包括使用从预设的本地命名实体库和/或网络资源中选择的词汇、及使用用户重新输入的词汇进行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加便捷、丰富。
Description
技术领域
本发明涉及语音识别技术,特别涉及修正语音输入文本中命名实体词汇的方法、装置及终端。
背景技术
随着半导体工业、材料工业、电子技术的高速发展,终端设备上所具有的功能日益复杂,智能型的文本输入功能和设备控制方式成为了现有终端设备的必要需求。在各种智能型的文本输入技术中,语音输入以其直观、快捷的特点,成为主流技术之一。
修正语音输入文本中错误识别的词汇是语音输入法的后处理技术,首先对用户输入的语音进行识别,然后对识别结果进行检测、定位可能识别错误的词汇,最后提供修正模式、让用户通过修正模式对可能识别错误的词汇进行修正。
在现有技术中,在定位错误词汇方面,主要通过置信测度方法衡量输入语音和识别结果之间的可信程度,找到置信度较低的词汇作为可能识别错误的词汇。在修正错误词汇方面,向用户提供用多模态方式进行重新输入的修正模式,例如从本地通信记录中选择正确词汇、或者从基于模糊音提供的候选词中重新选择正确词汇,或者通过重发音来重新输入语音、或通过手写体识别录入正确词汇、或通过直接键盘录入正确词汇等,使用用户重新输入的词汇进行修正。
现有技术中的上述方法主要存在以下缺陷:
第一、对语音输入的每个词汇采用无差别的置信度分析方法,而实际上目前针对特定领域内容的连续语音识别的正确率已经能够达到90%,容易识别错误的词汇主要是集外词汇。在短信、邮件、搜索词条的智能语音输入中,名词往往是表达该段文字中心内容的载体,在所有的名词中,主要包括人名、地名和机构名等的命名实体词汇又占据了很大的比重,由于命名实体词汇属于成长型词汇,总是在不断的更新和增加,因此很多命名实体词汇对于语音识别来说都属于集外词汇,容易造成错误识别,现有技术中的方法并没有针对性的定位这种承载了语义主体内容、又容易被错误识别的命名实体词汇;
第二、现有技术的方法在修正错误词汇时,只关注于用多模态的方式进行重新输入,没有考虑更多、更便捷的修正途径。
发明内容
本发明提供一种修正语音输入文本中命名实体词汇的方法,精确定位识别错误的命名实体词汇,并提供更丰富、便捷的修正途径。
本发明提供一种修正语音输入文本中命名实体词汇的装置,精确定位识别错误的命名实体词汇,并提供更丰富、便捷的修正途径。
本发明提供一种终端,精确定位识别错误的命名实体词汇,并提供更丰富、便捷的修正途径。
本发明的技术方案是这样实现的:
一种修正语音输入文本中命名实体词汇的方法,关键在于,该方法包括:
A、识别语音输入信号,得到包括命名实体词汇标注信息的识别结果;
B、根据所述命名实体词汇标注信息,确定所述识别结果中识别错误的命名实体词汇,突出显示所述识别错误的命名实体词汇;
C、使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇。
一种修正语音输入文本中命名实体词汇的装置,关键在于,该装置包括:连续语音识别模块、命名实体词汇检测模块和用户更正模块;
所述连续语音识别模块,用于识别语音输入信号,将包括命名实体词汇标注信息的识别结果输出给所述命名实体词汇检测模块;
所述命名实体词汇检测模块,用于根据所述命名实体词汇标注信息,确定所述识别结果中错误识别的命名实体词汇,在识别结果中突出标注出错误识别的命名实体词汇,并将标注后的识别结果输出给所述用户更正模块及显示部件;
所述用户更正模块,用于使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇。
一种终端,关键在于,该终端包括:修正语音输入文本中命名实体词汇的装置和显示部件;
所述修正语音输入文本中命名实体词汇的装置,用于识别语音输入信号,得出包括命名实体词汇标注信息的识别结果;根据所述命名实体词汇标注信息,确定所述识别结果中错误识别的命名实体词汇,在识别结果中突出标注出错误识别的命名实体词汇,并将标注后的识别结果输出给所述显示部件;使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇;
所述显示部件,用于显示所述标注后的识别结果。
可以看出,本发明中修正语音输入文本中命名实体词汇的方法、装置及终端,一方面由于在识别结果中增加了命名实体词汇标注信息,使得后续可以有针对性的定位出识别错误的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,另一方面增加了使用从本地命名实体库和/或网络资源中选择的词汇、执行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加丰富和便捷。
附图说明
图1为本发明中修正语音输入文本中命名实体词汇的方法的流程图;
图2为本发明实施例中修正语音输入文本中命名实体词汇的方法的流程图;
图3为图2中所示步骤21的实现流程图;
图4为图2中所示步骤22的实现流程图;
图5为本发明实施例中查找问题区域的过程示意图;
图6为本发明实施例中用户界面的示意图;
图7为本发明中修正语音输入文本中命名实体词汇的装置结构示意图;
图8为本发明实施例中连续语音识别模块的结构示意图;
图9为本发明实施例中命名实体检测模块的结构示意图;
图10为本发明实施例中用户更正模块的结构示意图;
图11为本发明中终端的结构示意图。
具体实施方式
为使本发明的目的和优点更加清楚,下面结合附图和实施例对本发明作进一步的详细说明。
图1为本发明中修正语音输入文本中命名实体词汇的方法流程图,在图1所示的流程开始之前,建立本地命名实体库。
图1所示流程包括:
步骤11:识别语音输入信号,得到包括命名实体词汇标注信息的识别结果。
步骤12:根据命名实体词汇标注信息,确定识别结果中识别错误的命名实体词汇,突出显示识别错误的命名实体词汇。
步骤13:使用从本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇。
可见,本发明中修正语音输入文本中命名实体词汇的方法,一方面由于在识别结果中增加了命名实体词汇标注信息,使得后续步骤中可以有针对性的定位出识别错误的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,另一方面增加了使用从本地命名实体库和/或网络资源中选择的词汇、执行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加丰富和便捷。
下面给出本发明方法的一个实施例,在本实施例中,本地命名实体库的初始状态为空。
图2为本发明实施例中修正语音输入文本中命名实体词汇的方法的流程图,该流程包括:
步骤21:识别语音输入信号,得到包括命名实体词汇位置和类别信息的识别结果。
本步骤中的命名实体词汇位置和类别信息,是命名实体词汇标注信息的一种实施方式,其中位置信息指该命名实体词汇在句子中所处的位置,例如在主语位置、宾语位置,或者句子的前段位置、中段位置等,类别信息指该命名实体词汇所属的类别,例如该命名实体词汇属于人名类别、地名类别或机构名类别等。
这里的步骤21由图3所示的流程实现,图3所示流程包括:
步骤211:提取语音输入信号的多维度倒谱特征及其差分特征。
本步骤中的多维度倒谱特征及其差分特征用来表征语音信号中和语言相关的信息,使用现有的常用方法即可实现这里的提取操作,例如通过端点检测算法,将连续语音流中的语音段切分出来,将语音段分为20~30毫秒的帧。分帧加窗以后的帧数据,通过离散傅里叶变换转换到频谱上,再将频谱信号进行一系列带通滤波、并将每次滤波后的结果进行非线性压缩,最后对得到的一组数据作离散余弦变换,以降低每维特征之间的相关性,并保留特征数据中表征性较强的部分维度。为了提高语音识别的精度和抗噪性能,Mel倒谱系数、感知线性预测系数、Gamma-tone倒谱系数等多种类型的倒谱特征均可被采用。
步骤212:基于命名实体标注词典、声学模型和基于类的语言模型,对提取出的特征解码得出包括词格和音素格的识别结果,在词格中标注命名实体词汇的位置和类别信息。
本步骤中的词格和音素格由识别栅格组成。
本步骤中,命名实体标注词典是包含了命名实体标注信息的中文词典,可以在离线状态下生成。现有技术中的词典生成算法很多,一个词典可能具备多种生成来源,例如根据汉语语言学规则得到的通用词典,或对大量相关文本进行分词后统计得到的词典,或根据距离测度生成的新词典等。在合并了多种生成来源的词条后,可以采用手工校对或者统计型测度等方法,选取其中有效的词条,得到命名实体标注词典。命名实体标注词典不仅是本步骤中解码操作的基础之一,还是声学模型训练及基于类的语言模型训练的基础。
声学模型可以在离线状态下生成。现有技术中常用的生成方法是,通过对大量语音数据的有监督和无监督学习的算法,生成针对具体应用的隐含马尔科夫模型。
基于类的语言模型可以在离线状态下生成。在语言模型训练中,将同类别的命名实体词汇作为相同词汇考虑,例如将属于人名类别的命名实体词汇作为相同词汇考虑。采用基于类的语言模型的优点有以下两点:第一,由于很多命名实体词语在文本中的出现频率比较低,普通语言模型在此情况下会由于数据稀疏而产生估计误差,基于类的语言模型在一定程度上可以避免这一问题的出现,进而提高语音识别率和识别的稳健性;第二,由于命名实体词汇属于快速成长型词汇,新词不断的出现,采用基于类的语言模型,能够减少集外词造成的识别错误,进而提高语音识别性能。
至于本步骤中如何基于命名实体标注词典、声学模型和基于类的语言模型,得出包括词格和音素格的识别结果,现有技术中有多种实现方法,这里不再赘述。
本步骤中将根据命名实体标注词典和基于类的语言模型在词格中标注命名实体词汇的位置和类别信息。
经过上述步骤211~步骤212就完成了对语音输入信号的识别,得出了识别结果。
步骤22:根据所述命名实体词汇的位置和属性信息及置信测度方法,确定所述识别结果中识别错误的命名实体词汇,高亮显示所述识别错误的命名实体词汇。
这里的步骤22可以由图4所示流程实现,图4所示流程包括:
步骤221:根据词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,查找识别栅格未对齐且包括命名实体词汇的问题区域。
图5为本步骤中查找问题区域的过程示意图,其中词格中的每个圆圈对应一个词汇,而音素格中的多个圆圈对应一个词汇的发音。图5中的标号①代表根据词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,标号②代表查找问题区域,其中标号为a和b的两处为查找出的问题区域。
这里的强制对齐是一种现有技术中的算法,具体实现方式这里不再赘述。
步骤222:根据置信测度方法,确定置信度低于设定阈值的问题区域。
本步骤中采用了广义词语后验概率方法,这也是现有技术中一种应用较广泛的置信测度方法。当然本步骤也可以应用其他的置信测度方法。
步骤223:高亮显示确定出的问题区域中的命名实体词汇。
本步骤中,也可以采用其他突出显示的方式,例如用颜色着重标注等。
经过上述步骤221~步骤223,确定出了识别错误的命名实体词汇。
步骤23:从本地命名实体库和/或网络资源中查找识别错误的命名实体词汇的候选词汇,形成候选词汇列表并显示。
本步骤中查找候选词汇有以下两种实施方式:
第一、在本地命名实体库中查找候选词汇时,在本地命名实体库中查找与识别错误的命名实体词汇相同类别且发音相似的候选词汇;在网络资源中查找候选词汇时,在网络中的公用数据库查找与识别错误的命名实体词汇发音相似的候选词汇;或者,在网络资源中搜索识别错误的命名实体词汇、及在本地命名实体库中查找出的词汇的发音,通过搜索返回率确定候选词汇。
第二、在本次资源中查找候选词汇时,和上述第一种中的实现方式相同;在网络资源中查找候选词汇时,与上述第一种中采取完全在线查找的方式不同的是,采用一种半在线或离线的搜索模式,在此情况下,在网络中的由服务提供商提供一台服务器或服务器群组中查找与识别错误的命名实体词汇发音相似的候选词汇,该服务器或服务器群组会利用网络资源定时对自身内部的命名实体词汇进行更新,这种半在线或离线的搜索模式的优点在于,服务器端已经在离线状态下将大量的网络资源进行了归纳和整理,并且定时更新,所以在服务器端查找候选词汇,将比直接在大量网络资源中查找速度更快、更有针对性且用户支出的费用更少,对服务器端而言,根据在服务器或服务器群组中查找候选词汇的情况,可以获知哪些词汇的搜索频率较多等反馈信息,从而将这些词汇优先作为候选词汇。
步骤24:使用用户直接从候选词汇列表中选择的词汇,修正所述识别错误的命名实体词汇;或者,从本地命名实体库和/或网络资源中查找识别错误的命名实体词汇的候选词汇并显示,使用用户从查找出的候选词汇中选择的词汇,修正所述识别错误的命名实体词汇;或者,使用用户重新输入的词汇,修正所述识别错误的命名实体词汇。
本步骤中,用户选择不同的修正模式时,执行对应的修正方法。
用户重新输入词汇的方式可以是从本地通信记录中选择、键盘输入、通过语音重新输入,其中采用从本地通信记录中选择和键盘输入时,与现有技术中的实现方式相同。采用语音重新输入时,需重新识别输入的语音输入信号,并显示重新识别的识别结果,在用户确认后,将重新识别的识别结果作为确认的正确词汇,在用户重新输入语音时,再执行重新识别输入的语音输入信号的步骤。进一步,由于终端的显示界面有限,步骤23中形成的候选词汇列表中只能列出一部分查找到的候选词汇,如果用户未从候选词汇列表中找到要确认的正确词汇,也不想通过上述提供的其他修正模式进行修正,还可以向用户显示步骤23中查找到的、且未包含在候选词汇列表中的更多候选词汇,使用用户从所述更多候选词汇中选择出的词汇,修正所述识别错误的命名实体词汇。
步骤25:将执行修正后确认的正确词汇更新到本地命名实体库中。
本步骤中的更新可以包括将用户确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间。
基于本步骤中的本地命名实体库的更新方式,下次再执行步骤23、在本地命名实体库中查找候选词汇时,可以考虑上述类别、在句子中的位置、出现的频次和每次更新的时间。例如,如果当前识别错误的命名实体词汇为人名,则直接查找本地命名实体库中类别为人名的候选词汇,如果当前识别错误的命名实体词汇在句子中的位置是主语,则直接查找本地命名实体库中在句子中位置为主语的候选词汇。又例如,在查找出多个针对当前识别错误的命名实体词汇的候选词语时,将出现的频次高的候选词汇排列在前,或将每次更新时间较快的候选词汇排列在前。类似的,在执行步骤23中的在网络资源中查找候选词汇时,可以依据某个词汇的检索频次来确定该词的排序,检索频次高的词汇排列在前。
本发明实施例中的本地命名实体库是根据每次用户确认的正确词汇进行更新的,由于这些更新是被用户经常使用的,所以从本地命名实体库中更容易找到与识别错误的命名实体词汇较接近的候选词汇。
图6为本发明实施例中用户界面的示意图,假设用户的语音输入为“请通知张老师,明天到华润大厦开会”,其中“张老师”和“华润”为识别错误的命名实体词汇、且被高亮显示。针对识别错误的“张老师”一词,提供的属于“人名选择”类别的候选词汇列表为“张老师、赵老师、左老师”,针对识别错误的“华润”一词,提供的属于“地名选择”类别的候选词汇列表为“鹏润、鹏辉、华润”。用户除了可以直接从候选词汇列表中直接选择词汇外,还可以选择“选项”中提供的其他修正模式,例如更多候选词、查找通讯录、查找网络、查找本地命名实体库、键盘输入或重读该词。当用户点击“查找网络”或“查找本地命名实体库”时,将执行步骤24中的显示查找出的候选词汇,使用用户从查找出的候选词汇中选择的词汇,修正所述识别错误的命名实体词汇。
图7为本发明中修正语音输入文本中命名实体词汇的装置结构示意图,该装置包括:连续语音识别模块100、命名实体词汇检测模块200和用户更正模块300。
连续语音识别模块100,用于识别语音输入信号,将包括命名实体词汇标注信息的识别结果输出给命名实体词汇检测模块200。
命名实体词汇检测模块200,用于根据命名实体词汇标注信息,确定识别结果中识别错误的命名实体词汇,在识别结果中突出标注错误识别的命名实体词汇,将标注后的识别结果输出给用户更正模块及显示部件。
用户更正模块300,用于使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇。
可见,本发明中修正语音输入文本中命名实体词汇的装置,一方面由于在识别结果中包含了命名实体词汇标注信息,使得后续可以有针对性的定位出错误识别的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,另一方面增加了使用从本地命名实体库和网络资源中选择的词汇、执行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加丰富和便捷。
下面给出本发明修正语音输入文本中命名实体词汇的装置的实施例。
图8为本发明实施例中连续语音识别模块的结构示意图,连续语音识别模块100包括:特征提取子模块101、解码器102、命名实体标注词典103、声学模型104和基于类的语言模型105。
特征提取子模块101,用于从语音输入信号中提取多维度的倒谱特征及其差分特征,输出到解码器102中。
命名实体标注词典103是解码器102的一项输入,是包含了命名实体标注信息的中文词典,可以在离线状态下生成。具体的生成方法在本发明方法中已介绍,生成命名实体标注词典103的可以是如图9中所示的词典生成子模块。
声学模型104是解码器102的另一项输入,可以在离线状态下生成。具体的形成方法在本发明方法中已介绍。形成声学模型104的可以是如图9中所示的声学模型训练子模块。
基于类的语言模型105是解码器102的第三项输入,可以在离线状态下生成。具体的形成方法在本发明方法中已介绍。形成基于类的语言模型105的可以是如图8中所示的语言模型训练子模块。
解码器102,基于命名实体标注词典103、声学模型104和基于类的语言模型105,得到音素格和词格两级识别结果,在词格中标注命名实体词汇标注信息,将得到的音素格和词格输出给命名实体检测模块200。这里的命名实体词汇标注信息为命名实体词汇位置和类别信息。
图9为本发明实施例中命名实体检测模块的结构示意图,命名实体检测模块200包括:置信度校验子模块201和新词生成子模块202。
置信度校验子模块201,用于根据解码器102输出的词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,确定识别栅格未对齐、包含命名实体词汇标注信息、且置信测度低于设定阈值的问题区域,在识别结果中突出标注确定出的问题区域中的命名实体词汇,将标注后的识别结果输出给新词生成子模块202。
新词生成子模块202,用于从本地命名实体库中和网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇,形成候选词汇列表输出给显示部件,将标注后的识别结果输出给用户更正模块300和显示部件。
前文中已提到,本发明实施例中的命名实体词汇标注信息为命名实体词汇的位置和属性信息,本发明实施例的装置中进一步包括本地命名实体库更新模块400,进一步用于将所述用户更正模块执行修正后确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间更新到本地命名实体库中。在这种情况下,上述新词生成子模块202进一步用于,在利用本地命名实体库查找所述确定出的命名实体词汇的候选词汇时,根据所述类别、在句子中的位置、出现的频次和每次更新的时间,确定查找出的候选词汇的排列顺序。
图10为本发明实施例中用户更正模块的结构示意图,用户更正模块300包括:第一更正子模块301、第二更正子模块302和第三更正子模块303。
上述第一更正子模块301,用于在用户触发后,使用用户直接从所述候选词汇列表中选择的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第一更正子模块301负责提供直接从候选词汇列表中选择正确词汇的修正模式,当用户选择这种修正模式后才执行操作。
上述第二更正子模块302,用于在用户触发后,从本地命名实体库和/或网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇,输出给显示部件;使用用户从查找出的候选词汇中选择的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第二更正子模块302负责提供直接从候选词汇中选择正确词汇的模式,当用户选择这种修正模式后才执行操作。
上述第三更正子模块303,用于在用户触发后,使用用户重新输入的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第三更正子模块303负责提供用户重新输入词汇的修正模式,当用户选择这种修正模式后才执行操作。当用户通过语音重新输入词汇时,第三更正子模块303进一步用于,触发连续语音识别模块100重新识别输入的语音输入信号、并显示重新识别的识别结果,将用户确认的重新识别的识别结果作为确认的正确词汇。
当用户没有从候选词汇列表中选择出正确词汇,也不想通过上述其他模式进行修正时,用户更正模块300中还可以包括第四更正子模块304,用于在用户触发后,显示所述新词生成子模块202确定出、且未包含在所述候选词汇列表中的更多候选词汇,使用用户从所述更多候选词汇中选择出的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第三更正子模块303负责提供后多候选词的修正模式,当用户选择这种修正模式后才执行操作。
图11为本发明中终端的结构示意图,该终端包括:修正语音输入文本中命名实体词汇的装置和显示部件。
上述修正语音输入文本中命名实体词汇的装置,用于识别语音输入信号,得出包括命名实体词汇标注信息的识别结果;根据命名实体词汇标注信息,确定所述识别结果中错误识别的命名实体词汇,在识别结果中突出标注出错误识别的命名实体词汇,并将标注后的识别结果输出给所述显示部件;使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正识别错误的命名实体词汇。
上述显示部件,用于显示修正语音输入文本中命名实体词汇的装置输出的标注后的识别结果。
本发明的终端中的修正语音输入文本中命名实体词汇的装置,其内部结构和各项附加功能可以与前文所述的修正语音输入文本中命名实体词汇的装置相同,这里不再赘述。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种修正语音输入文本中命名实体词汇的方法,其特征在于,该方法包括:
A、提取语音输入信号的多维度倒谱特征及其差分特征,基于命名实体标注词典、声学模型和基于类的语言模型,对提取出的特征解码得出包括词格和音素格的识别结果,并在所述词格中标注命名实体词汇标注信息,所述词格和音素格由识别栅格组成,所述命名实体词汇标注信息为命名实体词汇的位置和类别信息;
B、根据所述词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,查找识别栅格未对齐且包括命名实体词汇的问题区域;确定置信度低于设定阈值的问题区域;突出标注确定出的问题区域中的命名实体词汇,显示标注后的识别结果;
C、使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正识别错误的命名实体词汇。
2.如权利要求1所述的方法,其特征在于,所述步骤C包括:
C1、从本地命名实体库和/或网络资源中查找所述识别错误的命名实体词汇的候选词汇、形成候选词汇列表并显示;
C2、使用用户直接从所述候选词汇列表中选择的词汇,修正所述识别错误的命名实体词汇;或者,从本地命名实体库和/或网络资源中查找所述识别错误的命名实体词汇的候选词汇并显示,使用用户直接从查找出的候选词汇中选择的词汇,修正所述识别错误的命名实体词汇;或者,使用用户重新输入的词汇,修正所述识别错误的命名实体词汇。
3.如权利要求2所述的方法,其特征在于,所述步骤C1和步骤C2中从本地命名实体库和/或网络资源中查找所述识别错误的命名实体词汇的候选词汇为:
在本地命名实体库中查找时,包括:在本地命名实体库中查找与确定出的命名实体词汇相同类别且发音相似的词汇;
在网络资源中查找时,包括:在网络中的公用数据库查找与确定出的命名实体词汇发音相似的词汇;或者,在网络资源中搜索确定出的命名实体词汇、及在本地命名实体库中查找出的词汇的发音,通过搜索返回率确定词汇;或者,在网络中的设定服务器或服务器组查找与确定出的命名实体词汇发音相似的词汇,所述设定服务器或服务器组定时更新自身内部的命名实体词汇。
4.如权利要求3所述的方法,其特征在于,所述步骤C中进一步包括:
C3、将执行修正后确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间更新到本地命名实体库中;
所述在本地命名实体库中查找时,进一步根据所述类别、在句子中的位置、出现的频次和每次更新的时间,确定查找出的候选词汇的排列顺序。
5.如权利要求2所述的方法,其特征在于,所述步骤C2中进一步包括:显示所述查找出、且未包含在所述候选词汇列表中的更多候选词汇,使用用户从所述更多候选词汇中选择出的词汇,修正所述识别错误的命名实体词汇。
6.如权利要求2所述的方法,其特征在于,所述步骤C2中,用户重新输入的词汇为:用户通过语音重新输入的词汇;
当使用用户重新输入的词汇修正所述识别错误的命名实体词汇时,重新识别输入的语音输入信号,并显示重新识别的识别结果,在用户确认后,将重新识别的识别结果作为确认的正确词汇,在用户重新输入语音时,返回执行重新识别输入的语音输入信号的步骤。
7.一种修正语音输入文本中命名实体词汇的装置,其特征在于,该装置包括:连续语音识别模块、命名实体词汇检测模块和用户更正模块;
所述连续语音识别模块包括:特征提取子模块、解码器、命名实体标注词典、声学模型和基于类的语言模型;
所述特征提取子模块,用于从语音输入信号中提取多维度的倒谱特征及其差分特征,输出到所述解码器;
所述解码器,用于基于命名实体标注词典、声学模型和基于类的语言模型,得到音素格和词格两级识别结果,输出给所述命名实体词汇检测模块,所述词格和音素格由识别栅格组成、且词格中包括命名实体词汇标注信息,所述命名实体词汇标注信息为命名实体词汇的位置和类别信息;
所述命名实体词汇检测模块包括:置信度校验子模块和新词生成子模块;
所述置信度校验子模块,用于根据所述词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,确定识别栅格未对齐、包括命名实体词汇标注信息、且置信度低于设定阈值的问题区域,突出标注出所述问题区域中的命名实体词汇,并将标注后的识别结果输出给所述新词生成子模块;
所述新词生成子模块,用于从本地命名实体库和/或网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇,形成候选词汇列表输出给显示部件,将标注后的识别结果输出给所述用户更正模块和显示部件;
所述用户更正模块,用于使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正识别错误的命名实体词汇。
8.如权利要求7所述的装置,其特征在于,所述装置中进一步包括:本地命名实体库更新模块,用于将所述用户更正模块执行修正后确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间更新到本地命名实体库中;
所述新词生成子模块进一步用于,在利用本地命名实体库查找所述确定出的命名实体词汇的候选词汇时,根据所述类别、在句子中的位置、出现的频次和每次更新的时间,确定查找出的候选词汇的排列顺序。
9.如权利要求8所述的装置,其特征在于,所述用户更正模块包括:第一更正子模块、第二更正子模块和第三更正子模块;
所述第一更正子模块,用于在用户触发后,使用用户直接从所述候选词汇列表中选择的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块;
所述第二更正子模块,用于在用户触发后,从本地命名实体库和/或网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇,输出给显示部件;使用用户从查找出的候选词汇中选择的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块;
第三更正子模块,用于在用户触发后,使用用户重新输入的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块。
10.如权利要求9所述的装置,其特征在于,所述用户更正模块中进一步包括:第四更正子模块,用于在用户触发后,显示所述新词生成子模块确定出、且未包含在所述候选词汇列表中的更多候选词汇,使用用户从所述更多候选词汇中选择出的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块。
11.如权利要求9所述的装置,其特征在于,所述用户重新输入的词汇为:用户通过语音重新输入的词汇;
所述第三更正模块进一步用于,触发所述连续语音识别模块重新识别输入的语音输入信号、并显示重新识别的识别结果,将用户确认的重新识别的识别结果作为确认的正确词汇。
12.一种终端,其特征在于,该终端包括:修正语音输入文本中命名实体词汇的装置和显示部件;
所述修正语音输入文本中命名实体词汇的装置,用于提取语音输入信号的多维度倒谱特征及其差分特征,基于命名实体标注词典、声学模型和基于类的语言模型,对提取出的特征解码得出包括词格和音素格的识别结果,并在所述词格中标注命名实体词汇标注信息,所述词格和音素格由识别栅格组成,所述命名实体词汇标注信息为命名实体词汇的位置和类别信息;根据所述词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,查找识别栅格未对齐且包括命名实体词汇的问题区域;确定置信度低于设定阈值的问题区域;突出标注确定出的问题区域中的命名实体词汇,显示标注后的识别结果;使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正识别错误的命名实体词汇;
所述显示部件,用于显示所述标注后的识别结果。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110063938.4A CN102682763B (zh) | 2011-03-10 | 2011-03-10 | 修正语音输入文本中命名实体词汇的方法、装置及终端 |
US13/417,725 US9190056B2 (en) | 2011-03-10 | 2012-03-12 | Method and apparatus for correcting a word in speech input text |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110063938.4A CN102682763B (zh) | 2011-03-10 | 2011-03-10 | 修正语音输入文本中命名实体词汇的方法、装置及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102682763A CN102682763A (zh) | 2012-09-19 |
CN102682763B true CN102682763B (zh) | 2014-07-16 |
Family
ID=46796872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110063938.4A Active CN102682763B (zh) | 2011-03-10 | 2011-03-10 | 修正语音输入文本中命名实体词汇的方法、装置及终端 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9190056B2 (zh) |
CN (1) | CN102682763B (zh) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9542936B2 (en) | 2012-12-29 | 2017-01-10 | Genesys Telecommunications Laboratories, Inc. | Fast out-of-vocabulary search in automatic speech recognition systems |
CN103106061A (zh) * | 2013-03-05 | 2013-05-15 | 北京车音网科技有限公司 | 语音输入方法和装置 |
EP2851896A1 (en) * | 2013-09-19 | 2015-03-25 | Maluuba Inc. | Speech recognition using phoneme matching |
CN103853710B (zh) * | 2013-11-21 | 2016-06-08 | 北京理工大学 | 一种基于协同训练的双语命名实体识别方法 |
US9224038B2 (en) * | 2013-12-16 | 2015-12-29 | Google Inc. | Partial overlap and delayed stroke input recognition |
US9589562B2 (en) * | 2014-02-21 | 2017-03-07 | Microsoft Technology Licensing, Llc | Pronunciation learning through correction logs |
CN103903615B (zh) * | 2014-03-10 | 2018-11-09 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
US10749989B2 (en) | 2014-04-01 | 2020-08-18 | Microsoft Technology Licensing Llc | Hybrid client/server architecture for parallel processing |
US9773499B2 (en) * | 2014-06-18 | 2017-09-26 | Google Inc. | Entity name recognition based on entity type |
CN105374356B (zh) * | 2014-08-29 | 2019-07-30 | 株式会社理光 | 语音识别方法、语音评分方法、语音识别系统及语音评分系统 |
CN105702256B (zh) * | 2014-11-28 | 2020-01-31 | 上海航空电器有限公司 | 一种基于机载设备的数字串语音识别方法 |
KR102380833B1 (ko) * | 2014-12-02 | 2022-03-31 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
EP3089159B1 (en) * | 2015-04-28 | 2019-08-28 | Google LLC | Correcting voice recognition using selective re-speak |
CN106469554B (zh) * | 2015-08-21 | 2019-11-15 | 科大讯飞股份有限公司 | 一种自适应的识别方法及系统 |
KR102450853B1 (ko) * | 2015-11-30 | 2022-10-04 | 삼성전자주식회사 | 음성 인식 장치 및 방법 |
CN105895103B (zh) * | 2015-12-03 | 2020-01-17 | 乐融致新电子科技(天津)有限公司 | 一种语音识别方法及装置 |
US10152965B2 (en) * | 2016-02-03 | 2018-12-11 | Google Llc | Learning personalized entity pronunciations |
CN105895090A (zh) * | 2016-03-30 | 2016-08-24 | 乐视控股(北京)有限公司 | 语音信号处理方法及装置 |
CN105869634B (zh) * | 2016-03-31 | 2019-11-19 | 重庆大学 | 一种基于领域的带反馈语音识别后文本纠错方法及系统 |
CN106098060B (zh) * | 2016-05-19 | 2020-01-31 | 北京搜狗科技发展有限公司 | 语音的纠错处理方法和装置、用于语音的纠错处理的装置 |
CN106547733A (zh) * | 2016-10-19 | 2017-03-29 | 中国国防科技信息中心 | 一种面向特定文本的命名实体识别方法 |
CN107967250B (zh) * | 2016-10-19 | 2020-12-29 | 中兴通讯股份有限公司 | 一种信息处理方法及装置 |
US10013971B1 (en) | 2016-12-29 | 2018-07-03 | Google Llc | Automated speech pronunciation attribution |
CN106710592B (zh) * | 2016-12-29 | 2021-05-18 | 北京奇虎科技有限公司 | 一种智能硬件设备中的语音识别纠错方法和装置 |
EP3671730A4 (en) * | 2017-08-17 | 2020-07-15 | Sony Corporation | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS AND PROGRAM |
CN107491537A (zh) * | 2017-08-23 | 2017-12-19 | 北京百度网讯科技有限公司 | Poi数据挖掘、信息检索方法、装置、设备及介质 |
CN107622769B (zh) * | 2017-08-28 | 2021-04-06 | 科大讯飞股份有限公司 | 号码修改方法及装置、存储介质、电子设备 |
CN107678309B (zh) * | 2017-09-01 | 2021-07-06 | 科大讯飞股份有限公司 | 操控句式生成、应用操控方法及装置、存储介质 |
CN109800407B (zh) * | 2017-11-15 | 2021-11-16 | 腾讯科技(深圳)有限公司 | 意图识别方法、装置、计算机设备和存储介质 |
CN108389576B (zh) * | 2018-01-10 | 2020-09-01 | 苏州思必驰信息科技有限公司 | 压缩后的语音识别模型的优化方法及系统 |
CN110070859B (zh) * | 2018-01-23 | 2023-07-14 | 阿里巴巴集团控股有限公司 | 一种语音识别方法及装置 |
CN110111793B (zh) * | 2018-02-01 | 2023-07-14 | 腾讯科技(深圳)有限公司 | 音频信息的处理方法、装置、存储介质及电子装置 |
CN108389577B (zh) * | 2018-02-12 | 2019-05-31 | 广州视源电子科技股份有限公司 | 优化语音识别声学模型的方法、系统、设备及存储介质 |
CN110309258B (zh) * | 2018-03-15 | 2022-03-29 | 中国移动通信集团有限公司 | 一种输入检查方法、服务器和计算机可读存储介质 |
CN108595412B (zh) * | 2018-03-19 | 2020-03-27 | 百度在线网络技术(北京)有限公司 | 纠错处理方法及装置、计算机设备及可读介质 |
US10269376B1 (en) * | 2018-06-28 | 2019-04-23 | Invoca, Inc. | Desired signal spotting in noisy, flawed environments |
US11170170B2 (en) | 2019-05-28 | 2021-11-09 | Fresh Consulting, Inc | System and method for phonetic hashing and named entity linking from output of speech recognition |
WO2020256749A1 (en) * | 2019-06-20 | 2020-12-24 | Google Llc | Word lattice augmentation for automatic speech recognition |
CN111259134B (zh) * | 2020-01-19 | 2023-08-08 | 出门问问信息科技有限公司 | 一种实体识别方法、设备及计算机可读存储介质 |
CN111554295B (zh) * | 2020-04-24 | 2021-06-22 | 科大讯飞(苏州)科技有限公司 | 文本纠错方法、相关设备及可读存储介质 |
CN111459918A (zh) * | 2020-04-26 | 2020-07-28 | 上海烜翊科技有限公司 | 一种基于元数据库的体系建模命名方法 |
CN113569565B (zh) * | 2020-04-29 | 2023-04-11 | 抖音视界有限公司 | 一种语义理解方法、装置、设备和存储介质 |
CN112232080A (zh) * | 2020-10-20 | 2021-01-15 | 大唐融合通信股份有限公司 | 命名实体识别方法、装置及电子设备 |
CN112528663B (zh) * | 2020-12-18 | 2024-02-20 | 中国南方电网有限责任公司 | 一种电网领域调度场景下的文本纠错方法及系统 |
CN112882680B (zh) * | 2021-01-22 | 2024-07-30 | 维沃移动通信有限公司 | 语音识别方法及装置 |
US11593415B1 (en) * | 2021-11-05 | 2023-02-28 | Validate Me LLC | Decision making analysis engine |
CN115238702B (zh) * | 2022-09-21 | 2022-12-06 | 中科雨辰科技有限公司 | 一种实体库处理方法及存储介质 |
US11657803B1 (en) * | 2022-11-02 | 2023-05-23 | Actionpower Corp. | Method for speech recognition by using feedback information |
CN115881097B (zh) * | 2023-02-22 | 2023-07-18 | 深圳市友杰智新科技有限公司 | 语音识别结果的确认方法、装置、计算机设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1356628A (zh) * | 2000-07-05 | 2002-07-03 | 国际商业机器公司 | 具有有限或无显示器的设备的语音识别校正 |
CN101042867A (zh) * | 2006-03-24 | 2007-09-26 | 株式会社东芝 | 语音识别设备和方法 |
CN101295293A (zh) * | 2007-04-29 | 2008-10-29 | 摩托罗拉公司 | 用于对表意字符的输入字符串进行自动纠错的方法 |
CN101313276A (zh) * | 2005-10-28 | 2008-11-26 | 微软公司 | 将语音和备选项输入形式组合到移动设备中 |
CN101452700A (zh) * | 2007-11-30 | 2009-06-10 | 王瑞璋 | 一种语音辨识系统 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1159661C (zh) * | 1999-04-08 | 2004-07-28 | 肯特里奇数字实验公司 | 用于中文的标记和命名实体识别的系统 |
US20030191625A1 (en) * | 1999-11-05 | 2003-10-09 | Gorin Allen Louis | Method and system for creating a named entity language model |
US6272464B1 (en) * | 2000-03-27 | 2001-08-07 | Lucent Technologies Inc. | Method and apparatus for assembling a prediction list of name pronunciation variations for use during speech recognition |
US6912498B2 (en) * | 2000-05-02 | 2005-06-28 | Scansoft, Inc. | Error correction in speech recognition by correcting text around selected area |
JP4200645B2 (ja) * | 2000-09-08 | 2008-12-24 | 日本電気株式会社 | 情報処理装置、情報処理方法および記録媒体 |
WO2002080143A1 (en) * | 2001-03-29 | 2002-10-10 | Koninklijke Philips Electronics N.V. | Synchronise an audio cursor and a text cursor during editing |
US7337114B2 (en) * | 2001-03-29 | 2008-02-26 | International Business Machines Corporation | Speech recognition using discriminant features |
DE60207742T2 (de) * | 2001-09-17 | 2006-08-03 | Koninklijke Philips Electronics N.V. | Korrektur eines von einer spracherkennung erkannten textes mittels vergleich der phonemfolgen des erkannten textes mit einer phonetischen transkription eines manuell eingegebenen korrekturwortes |
US6950796B2 (en) * | 2001-11-05 | 2005-09-27 | Motorola, Inc. | Speech recognition by dynamical noise model adaptation |
TWI256562B (en) * | 2002-05-03 | 2006-06-11 | Ind Tech Res Inst | Method for named-entity recognition and verification |
US7289956B2 (en) * | 2003-05-27 | 2007-10-30 | Microsoft Corporation | System and method for user modeling to enhance named entity recognition |
WO2005010866A1 (en) * | 2003-07-23 | 2005-02-03 | Nexidia Inc. | Spoken word spotting queries |
US7865356B2 (en) * | 2004-07-15 | 2011-01-04 | Robert Bosch Gmbh | Method and apparatus for providing proper or partial proper name recognition |
US7742911B2 (en) * | 2004-10-12 | 2010-06-22 | At&T Intellectual Property Ii, L.P. | Apparatus and method for spoken language understanding by using semantic role labeling |
KR100723404B1 (ko) | 2005-03-29 | 2007-05-30 | 삼성전자주식회사 | 음성 인식 및 반응을 위한 음성 처리 장치와 방법 |
US8280719B2 (en) * | 2005-05-05 | 2012-10-02 | Ramp, Inc. | Methods and systems relating to information extraction |
US8412514B1 (en) * | 2005-10-27 | 2013-04-02 | At&T Intellectual Property Ii, L.P. | Method and apparatus for compiling and querying a QA database |
US20070106685A1 (en) * | 2005-11-09 | 2007-05-10 | Podzinger Corp. | Method and apparatus for updating speech recognition databases and reindexing audio and video content using the same |
KR100684160B1 (ko) | 2005-12-08 | 2007-02-20 | 한국전자통신연구원 | 개체명 인식을 이용한 대화 분석 장치 및 방법 |
US8090570B2 (en) * | 2006-10-26 | 2012-01-03 | Mobile Technologies, Llc | Simultaneous translation of open domain lectures and speeches |
EP2135231A4 (en) * | 2007-03-01 | 2014-10-15 | Adapx Inc | SYSTEM AND METHOD FOR DYNAMIC LEARNING |
CN101815996A (zh) * | 2007-06-01 | 2010-08-25 | 谷歌股份有限公司 | 检测名称实体和新词 |
WO2009081861A1 (ja) * | 2007-12-21 | 2009-07-02 | Nec Corporation | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 |
US8583416B2 (en) * | 2007-12-27 | 2013-11-12 | Fluential, Llc | Robust information extraction from utterances |
US8000956B2 (en) * | 2008-02-08 | 2011-08-16 | Xerox Corporation | Semantic compatibility checking for automatic correction and discovery of named entities |
US8560298B2 (en) * | 2008-10-21 | 2013-10-15 | Microsoft Corporation | Named entity transliteration using comparable CORPRA |
US8296141B2 (en) * | 2008-11-19 | 2012-10-23 | At&T Intellectual Property I, L.P. | System and method for discriminative pronunciation modeling for voice search |
US9484019B2 (en) * | 2008-11-19 | 2016-11-01 | At&T Intellectual Property I, L.P. | System and method for discriminative pronunciation modeling for voice search |
-
2011
- 2011-03-10 CN CN201110063938.4A patent/CN102682763B/zh active Active
-
2012
- 2012-03-12 US US13/417,725 patent/US9190056B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1356628A (zh) * | 2000-07-05 | 2002-07-03 | 国际商业机器公司 | 具有有限或无显示器的设备的语音识别校正 |
CN101313276A (zh) * | 2005-10-28 | 2008-11-26 | 微软公司 | 将语音和备选项输入形式组合到移动设备中 |
CN101042867A (zh) * | 2006-03-24 | 2007-09-26 | 株式会社东芝 | 语音识别设备和方法 |
CN101295293A (zh) * | 2007-04-29 | 2008-10-29 | 摩托罗拉公司 | 用于对表意字符的输入字符串进行自动纠错的方法 |
CN101452700A (zh) * | 2007-11-30 | 2009-06-10 | 王瑞璋 | 一种语音辨识系统 |
Also Published As
Publication number | Publication date |
---|---|
US9190056B2 (en) | 2015-11-17 |
US20120232904A1 (en) | 2012-09-13 |
CN102682763A (zh) | 2012-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102682763B (zh) | 修正语音输入文本中命名实体词汇的方法、装置及终端 | |
CN111369996B (zh) | 一种特定领域的语音识别文本纠错方法 | |
CN106598939B (zh) | 一种文本纠错方法及装置、服务器、存储介质 | |
CN110717031B (zh) | 一种智能会议纪要生成方法和系统 | |
US20210374349A1 (en) | Method for text generation, device and storage medium | |
CN108304375B (zh) | 一种信息识别方法及其设备、存储介质、终端 | |
US9396724B2 (en) | Method and apparatus for building a language model | |
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
CN109637537B (zh) | 一种自动获取标注数据优化自定义唤醒模型的方法 | |
CN1918578B (zh) | 具有自动校正的手写及语音输入 | |
CN106570180B (zh) | 基于人工智能的语音搜索方法及装置 | |
CN105956053B (zh) | 一种基于网络信息的搜索方法及装置 | |
KR20120011010A (ko) | 수기 인식 방법 및 장치 | |
CN103678684A (zh) | 一种基于导航信息检索的中文分词方法 | |
CN110782881A (zh) | 一种语音识别及实体识别后的影视实体纠错方法 | |
CN111324727A (zh) | 用户意图识别方法、装置、设备和可读存储介质 | |
JP7266683B2 (ja) | 音声対話に基づく情報検証方法、装置、デバイス、コンピュータ記憶媒体、およびコンピュータプログラム | |
CN103309926A (zh) | 基于条件随机场的中英文混合命名实体识别方法及系统 | |
CN104166462A (zh) | 一种文字的输入方法和系统 | |
EP2940551B1 (en) | Method and device for implementing voice input | |
CN105404621A (zh) | 一种用于盲人读取汉字的方法及系统 | |
CN109508441B (zh) | 通过自然语言实现数据统计分析的方法、装置及电子设备 | |
CN111508502B (zh) | 用于显示结果的备选的方法和系统 | |
CN112002323A (zh) | 语音数据处理方法、装置、计算机设备及存储介质 | |
Dinarelli et al. | Discriminative reranking for spoken language understanding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |