CN102682763A - 修正语音输入文本中命名实体词汇的方法、装置及终端 - Google Patents

修正语音输入文本中命名实体词汇的方法、装置及终端 Download PDF

Info

Publication number
CN102682763A
CN102682763A CN2011100639384A CN201110063938A CN102682763A CN 102682763 A CN102682763 A CN 102682763A CN 2011100639384 A CN2011100639384 A CN 2011100639384A CN 201110063938 A CN201110063938 A CN 201110063938A CN 102682763 A CN102682763 A CN 102682763A
Authority
CN
China
Prior art keywords
vocabulary
named entity
user
candidate
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011100639384A
Other languages
English (en)
Other versions
CN102682763B (zh
Inventor
朱璇
张华�
苏腾荣
严基完
李在原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Samsung Telecommunications Technology Research Co Ltd
Samsung Electronics Co Ltd
Original Assignee
Beijing Samsung Telecommunications Technology Research Co Ltd
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Samsung Telecommunications Technology Research Co Ltd, Samsung Electronics Co Ltd filed Critical Beijing Samsung Telecommunications Technology Research Co Ltd
Priority to CN201110063938.4A priority Critical patent/CN102682763B/zh
Priority to US13/417,725 priority patent/US9190056B2/en
Publication of CN102682763A publication Critical patent/CN102682763A/zh
Application granted granted Critical
Publication of CN102682763B publication Critical patent/CN102682763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Abstract

本发明公开了修正语音输入文本中命名实体词汇的方法及装置,有针对性的定位识别错误的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,同时提供了包括使用从预设的本地命名实体库和/或网络资源中选择的词汇、及使用用户重新输入的词汇进行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加便捷、丰富。

Description

修正语音输入文本中命名实体词汇的方法、装置及终端
技术领域
本发明涉及语音识别技术,特别涉及修正语音输入文本中命名实体词汇的方法、装置及终端。
背景技术
随着半导体工业、材料工业、电子技术的高速发展,终端设备上所具有的功能日益复杂,智能型的文本输入功能和设备控制方式成为了现有终端设备的必要需求。在各种智能型的文本输入技术中,语音输入以其直观、快捷的特点,成为主流技术之一。
修正语音输入文本中错误识别的词汇是语音输入法的后处理技术,首先对用户输入的语音进行识别,然后对识别结果进行检测、定位可能识别错误的词汇,最后提供修正模式、让用户通过修正模式对可能识别错误的词汇进行修正。
在现有技术中,在定位错误词汇方面,主要通过置信测度方法衡量输入语音和识别结果之间的可信程度,找到置信度较低的词汇作为可能识别错误的词汇。在修正错误词汇方面,向用户提供用多模态方式进行重新输入的修正模式,例如从本地通信记录中选择正确词汇、或者从基于模糊音提供的候选词中重新选择正确词汇,或者通过重发音来重新输入语音、或通过手写体识别录入正确词汇、或通过直接键盘录入正确词汇等,使用用户重新输入的词汇进行修正。
现有技术中的上述方法主要存在以下缺陷:
第一、对语音输入的每个词汇采用无差别的置信度分析方法,而实际上目前针对特定领域内容的连续语音识别的正确率已经能够达到90%,容易识别错误的词汇主要是集外词汇。在短信、邮件、搜索词条的智能语音输入中,名词往往是表达该段文字中心内容的载体,在所有的名词中,主要包括人名、地名和机构名等的命名实体词汇又占据了很大的比重,由于命名实体词汇属于成长型词汇,总是在不断的更新和增加,因此很多命名实体词汇对于语音识别来说都属于集外词汇,容易造成错误识别,现有技术中的方法并没有针对性的定位这种承载了语义主体内容、又容易被错误识别的命名实体词汇;
第二、现有技术的方法在修正错误词汇时,只关注于用多模态的方式进行重新输入,没有考虑更多、更便捷的修正途径。
发明内容
本发明提供一种修正语音输入文本中命名实体词汇的方法,精确定位识别错误的命名实体词汇,并提供更丰富、便捷的修正途径。
本发明提供一种修正语音输入文本中命名实体词汇的装置,精确定位识别错误的命名实体词汇,并提供更丰富、便捷的修正途径。
本发明提供一种终端,精确定位识别错误的命名实体词汇,并提供更丰富、便捷的修正途径。
本发明的技术方案是这样实现的:
一种修正语音输入文本中命名实体词汇的方法,关键在于,该方法包括:
A、识别语音输入信号,得到包括命名实体词汇标注信息的识别结果;
B、根据所述命名实体词汇标注信息,确定所述识别结果中识别错误的命名实体词汇,突出显示所述识别错误的命名实体词汇;
C、使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇。
一种修正语音输入文本中命名实体词汇的装置,关键在于,该装置包括:连续语音识别模块、命名实体词汇检测模块和用户更正模块;
所述连续语音识别模块,用于识别语音输入信号,将包括命名实体词汇标注信息的识别结果输出给所述命名实体词汇检测模块;
所述命名实体词汇检测模块,用于根据所述命名实体词汇标注信息,确定所述识别结果中错误识别的命名实体词汇,在识别结果中突出标注出错误识别的命名实体词汇,并将标注后的识别结果输出给所述用户更正模块及显示部件;
所述用户更正模块,用于使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇。
一种终端,关键在于,该终端包括:修正语音输入文本中命名实体词汇的装置和显示部件;
所述修正语音输入文本中命名实体词汇的装置,用于识别语音输入信号,得出包括命名实体词汇标注信息的识别结果;根据所述命名实体词汇标注信息,确定所述识别结果中错误识别的命名实体词汇,在识别结果中突出标注出错误识别的命名实体词汇,并将标注后的识别结果输出给所述显示部件;使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇;
所述显示部件,用于显示所述标注后的识别结果。
可以看出,本发明中修正语音输入文本中命名实体词汇的方法、装置及终端,一方面由于在识别结果中增加了命名实体词汇标注信息,使得后续可以有针对性的定位出识别错误的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,另一方面增加了使用从本地命名实体库和/或网络资源中选择的词汇、执行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加丰富和便捷。
附图说明
图1为本发明中修正语音输入文本中命名实体词汇的方法的流程图;
图2为本发明实施例中修正语音输入文本中命名实体词汇的方法的流程图;
图3为图2中所示步骤21的实现流程图;
图4为图2中所示步骤22的实现流程图;
图5为本发明实施例中查找问题区域的过程示意图;
图6为本发明实施例中用户界面的示意图;
图7为本发明中修正语音输入文本中命名实体词汇的装置结构示意图;
图8为本发明实施例中连续语音识别模块的结构示意图;
图9为本发明实施例中命名实体检测模块的结构示意图;
图10为本发明实施例中用户更正模块的结构示意图;
图11为本发明中终端的结构示意图。
具体实施方式
为使本发明的目的和优点更加清楚,下面结合附图和实施例对本发明作进一步的详细说明。
图1为本发明中修正语音输入文本中命名实体词汇的方法流程图,在图1所示的流程开始之前,建立本地命名实体库。
图1所示流程包括:
步骤11:识别语音输入信号,得到包括命名实体词汇标注信息的识别结果。
步骤12:根据命名实体词汇标注信息,确定识别结果中识别错误的命名实体词汇,突出显示识别错误的命名实体词汇。
步骤13:使用从本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇。
可见,本发明中修正语音输入文本中命名实体词汇的方法,一方面由于在识别结果中增加了命名实体词汇标注信息,使得后续步骤中可以有针对性的定位出识别错误的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,另一方面增加了使用从本地命名实体库和/或网络资源中选择的词汇、执行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加丰富和便捷。
下面给出本发明方法的一个实施例,在本实施例中,本地命名实体库的初始状态为空。
图2为本发明实施例中修正语音输入文本中命名实体词汇的方法的流程图,该流程包括:
步骤21:识别语音输入信号,得到包括命名实体词汇位置和类别信息的识别结果。
本步骤中的命名实体词汇位置和类别信息,是命名实体词汇标注信息的一种实施方式,其中位置信息指该命名实体词汇在句子中所处的位置,例如在主语位置、宾语位置,或者句子的前段位置、中段位置等,类别信息指该命名实体词汇所属的类别,例如该命名实体词汇属于人名类别、地名类别或机构名类别等。
这里的步骤21由图3所示的流程实现,图3所示流程包括:
步骤211:提取语音输入信号的多维度倒谱特征及其差分特征。
本步骤中的多维度倒谱特征及其差分特征用来表征语音信号中和语言相关的信息,使用现有的常用方法即可实现这里的提取操作,例如通过端点检测算法,将连续语音流中的语音段切分出来,将语音段分为20~30毫秒的帧。分帧加窗以后的帧数据,通过离散傅里叶变换转换到频谱上,再将频谱信号进行一系列带通滤波、并将每次滤波后的结果进行非线性压缩,最后对得到的一组数据作离散余弦变换,以降低每维特征之间的相关性,并保留特征数据中表征性较强的部分维度。为了提高语音识别的精度和抗噪性能,Mel倒谱系数、感知线性预测系数、Gamma-tone倒谱系数等多种类型的倒谱特征均可被采用。
步骤212:基于命名实体标注词典、声学模型和基于类的语言模型,对提取出的特征解码得出包括词格和音素格的识别结果,在词格中标注命名实体词汇的位置和类别信息。
本步骤中的词格和音素格由识别栅格组成。
本步骤中,命名实体标注词典是包含了命名实体标注信息的中文词典,可以在离线状态下生成。现有技术中的词典生成算法很多,一个词典可能具备多种生成来源,例如根据汉语语言学规则得到的通用词典,或对大量相关文本进行分词后统计得到的词典,或根据距离测度生成的新词典等。在合并了多种生成来源的词条后,可以采用手工校对或者统计型测度等方法,选取其中有效的词条,得到命名实体标注词典。命名实体标注词典不仅是本步骤中解码操作的基础之一,还是声学模型训练及基于类的语言模型训练的基础。
声学模型可以在离线状态下生成。现有技术中常用的生成方法是,通过对大量语音数据的有监督和无监督学习的算法,生成针对具体应用的隐含马尔科夫模型。
基于类的语言模型可以在离线状态下生成。在语言模型训练中,将同类别的命名实体词汇作为相同词汇考虑,例如将属于人名类别的命名实体词汇作为相同词汇考虑。采用基于类的语言模型的优点有以下两点:第一,由于很多命名实体词语在文本中的出现频率比较低,普通语言模型在此情况下会由于数据稀疏而产生估计误差,基于类的语言模型在一定程度上可以避免这一问题的出现,进而提高语音识别率和识别的稳健性;第二,由于命名实体词汇属于快速成长型词汇,新词不断的出现,采用基于类的语言模型,能够减少集外词造成的识别错误,进而提高语音识别性能。
至于本步骤中如何基于命名实体标注词典、声学模型和基于类的语言模型,得出包括词格和音素格的识别结果,现有技术中有多种实现方法,这里不再赘述。
本步骤中将根据命名实体标注词典和基于类的语言模型在词格中标注命名实体词汇的位置和类别信息。
经过上述步骤211~步骤212就完成了对语音输入信号的识别,得出了识别结果。
步骤22:根据所述命名实体词汇的位置和属性信息及置信测度方法,确定所述识别结果中识别错误的命名实体词汇,高亮显示所述识别错误的命名实体词汇。
这里的步骤22可以由图4所示流程实现,图4所示流程包括:
步骤221:根据词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,查找识别栅格未对齐且包括命名实体词汇的问题区域。
图5为本步骤中查找问题区域的过程示意图,其中词格中的每个圆圈对应一个词汇,而音素格中的多个圆圈对应一个词汇的发音。图5中的标号①代表根据词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,标号②代表查找问题区域,其中标号为a和b的两处为查找出的问题区域。
这里的强制对齐是一种现有技术中的算法,具体实现方式这里不再赘述。
步骤222:根据置信测度方法,确定置信度低于设定阈值的问题区域。
本步骤中采用了广义词语后验概率方法,这也是现有技术中一种应用较广泛的置信测度方法。当然本步骤也可以应用其他的置信测度方法。
步骤223:高亮显示确定出的问题区域中的命名实体词汇。
本步骤中,也可以采用其他突出显示的方式,例如用颜色着重标注等。
经过上述步骤221~步骤223,确定出了识别错误的命名实体词汇。
步骤23:从本地命名实体库和/或网络资源中查找识别错误的命名实体词汇的候选词汇,形成候选词汇列表并显示。
本步骤中查找候选词汇有以下两种实施方式:
第一、在本地命名实体库中查找候选词汇时,在本地命名实体库中查找与识别错误的命名实体词汇相同类别且发音相似的候选词汇;在网络资源中查找候选词汇时,在网络中的公用数据库查找与识别错误的命名实体词汇发音相似的候选词汇;或者,在网络资源中搜索识别错误的命名实体词汇、及在本地命名实体库中查找出的词汇的发音,通过搜索返回率确定候选词汇。
第二、在本次资源中查找候选词汇时,和上述第一种中的实现方式相同;在网络资源中查找候选词汇时,与上述第一种中采取完全在线查找的方式不同的是,采用一种半在线或离线的搜索模式,在此情况下,在网络中的由服务提供商提供一台服务器或服务器群组中查找与识别错误的命名实体词汇发音相似的候选词汇,该服务器或服务器群组会利用网络资源定时对自身内部的命名实体词汇进行更新,这种半在线或离线的搜索模式的优点在于,服务器端已经在离线状态下将大量的网络资源进行了归纳和整理,并且定时更新,所以在服务器端查找候选词汇,将比直接在大量网络资源中查找速度更快、更有针对性且用户支出的费用更少,对服务器端而言,根据在服务器或服务器群组中查找候选词汇的情况,可以获知哪些词汇的搜索频率较多等反馈信息,从而将这些词汇优先作为候选词汇。
步骤24:使用用户直接从候选词汇列表中选择的词汇,修正所述识别错误的命名实体词汇;或者,从本地命名实体库和/或网络资源中查找识别错误的命名实体词汇的候选词汇并显示,使用用户从查找出的候选词汇中选择的词汇,修正所述识别错误的命名实体词汇;或者,使用用户重新输入的词汇,修正所述识别错误的命名实体词汇。
本步骤中,用户选择不同的修正模式时,执行对应的修正方法。
用户重新输入词汇的方式可以是从本地通信记录中选择、键盘输入、通过语音重新输入,其中采用从本地通信记录中选择和键盘输入时,与现有技术中的实现方式相同。采用语音重新输入时,需重新识别输入的语音输入信号,并显示重新识别的识别结果,在用户确认后,将重新识别的识别结果作为确认的正确词汇,在用户重新输入语音时,再执行重新识别输入的语音输入信号的步骤。进一步,由于终端的显示界面有限,步骤23中形成的候选词汇列表中只能列出一部分查找到的候选词汇,如果用户未从候选词汇列表中找到要确认的正确词汇,也不想通过上述提供的其他修正模式进行修正,还可以向用户显示步骤23中查找到的、且未包含在候选词汇列表中的更多候选词汇,使用用户从所述更多候选词汇中选择出的词汇,修正所述识别错误的命名实体词汇。
步骤25:将执行修正后确认的正确词汇更新到本地命名实体库中。
本步骤中的更新可以包括将用户确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间。
基于本步骤中的本地命名实体库的更新方式,下次再执行步骤23、在本地命名实体库中查找候选词汇时,可以考虑上述类别、在句子中的位置、出现的频次和每次更新的时间。例如,如果当前识别错误的命名实体词汇为人名,则直接查找本地命名实体库中类别为人名的候选词汇,如果当前识别错误的命名实体词汇在句子中的位置是主语,则直接查找本地命名实体库中在句子中位置为主语的候选词汇。又例如,在查找出多个针对当前识别错误的命名实体词汇的候选词语时,将出现的频次高的候选词汇排列在前,或将每次更新时间较快的候选词汇排列在前。类似的,在执行步骤23中的在网络资源中查找候选词汇时,可以依据某个词汇的检索频次来确定该词的排序,检索频次高的词汇排列在前。
本发明实施例中的本地命名实体库是根据每次用户确认的正确词汇进行更新的,由于这些更新是被用户经常使用的,所以从本地命名实体库中更容易找到与识别错误的命名实体词汇较接近的候选词汇。
图6为本发明实施例中用户界面的示意图,假设用户的语音输入为“请通知张老师,明天到华润大厦开会”,其中“张老师”和“华润”为识别错误的命名实体词汇、且被高亮显示。针对识别错误的“张老师”一词,提供的属于“人名选择”类别的候选词汇列表为“张老师、赵老师、左老师”,针对识别错误的“华润”一词,提供的属于“地名选择”类别的候选词汇列表为“鹏润、鹏辉、华润”。用户除了可以直接从候选词汇列表中直接选择词汇外,还可以选择“选项”中提供的其他修正模式,例如更多候选词、查找通讯录、查找网络、查找本地命名实体库、键盘输入或重读该词。当用户点击“查找网络”或“查找本地命名实体库”时,将执行步骤24中的显示查找出的候选词汇,使用用户从查找出的候选词汇中选择的词汇,修正所述识别错误的命名实体词汇。
图7为本发明中修正语音输入文本中命名实体词汇的装置结构示意图,该装置包括:连续语音识别模块100、命名实体词汇检测模块200和用户更正模块300。
连续语音识别模块100,用于识别语音输入信号,将包括命名实体词汇标注信息的识别结果输出给命名实体词汇检测模块200。
命名实体词汇检测模块200,用于根据命名实体词汇标注信息,确定识别结果中识别错误的命名实体词汇,在识别结果中突出标注错误识别的命名实体词汇,将标注后的识别结果输出给用户更正模块及显示部件。
用户更正模块300,用于使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇。
可见,本发明中修正语音输入文本中命名实体词汇的装置,一方面由于在识别结果中包含了命名实体词汇标注信息,使得后续可以有针对性的定位出错误识别的命名实体词汇,而不是对用户输入的每个词汇是否识别错误都进行判断,另一方面增加了使用从本地命名实体库和网络资源中选择的词汇、执行修正的修正模式,与现有技术中仅通过多模态的文字输入进行修正相比,修正途径更加丰富和便捷。
下面给出本发明修正语音输入文本中命名实体词汇的装置的实施例。
图8为本发明实施例中连续语音识别模块的结构示意图,连续语音识别模块100包括:特征提取子模块101、解码器102、命名实体标注词典103、声学模型104和基于类的语言模型105。
特征提取子模块101,用于从语音输入信号中提取多维度的倒谱特征及其差分特征,输出到解码器102中。
命名实体标注词典103是解码器102的一项输入,是包含了命名实体标注信息的中文词典,可以在离线状态下生成。具体的生成方法在本发明方法中已介绍,生成命名实体标注词典103的可以是如图9中所示的词典生成子模块。
声学模型104是解码器102的另一项输入,可以在离线状态下生成。具体的形成方法在本发明方法中已介绍。形成声学模型104的可以是如图9中所示的声学模型训练子模块。
基于类的语言模型105是解码器102的第三项输入,可以在离线状态下生成。具体的形成方法在本发明方法中已介绍。形成基于类的语言模型105的可以是如图8中所示的语言模型训练子模块。
解码器102,基于命名实体标注词典103、声学模型104和基于类的语言模型105,得到音素格和词格两级识别结果,在词格中标注命名实体词汇标注信息,将得到的音素格和词格输出给命名实体检测模块200。这里的命名实体词汇标注信息为命名实体词汇位置和类别信息。
图9为本发明实施例中命名实体检测模块的结构示意图,命名实体检测模块200包括:置信度校验子模块201和新词生成子模块202。
置信度校验子模块201,用于根据解码器102输出的词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,确定识别栅格未对齐、包含命名实体词汇标注信息、且置信测度低于设定阈值的问题区域,在识别结果中突出标注确定出的问题区域中的命名实体词汇,将标注后的识别结果输出给新词生成子模块202。
新词生成子模块202,用于从本地命名实体库中和网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇,形成候选词汇列表输出给显示部件,将标注后的识别结果输出给用户更正模块300和显示部件。
前文中已提到,本发明实施例中的命名实体词汇标注信息为命名实体词汇的位置和属性信息,本发明实施例的装置中进一步包括本地命名实体库更新模块400,进一步用于将所述用户更正模块执行修正后确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间更新到本地命名实体库中。在这种情况下,上述新词生成子模块202进一步用于,在利用本地命名实体库查找所述确定出的命名实体词汇的候选词汇时,根据所述类别、在句子中的位置、出现的频次和每次更新的时间,确定查找出的候选词汇的排列顺序。
图10为本发明实施例中用户更正模块的结构示意图,用户更正模块300包括:第一更正子模块301、第二更正子模块302和第三更正子模块303。
上述第一更正子模块301,用于在用户触发后,使用用户直接从所述候选词汇列表中选择的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第一更正子模块301负责提供直接从候选词汇列表中选择正确词汇的修正模式,当用户选择这种修正模式后才执行操作。
上述第二更正子模块302,用于在用户触发后,从本地命名实体库和/或网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇,输出给显示部件;使用用户从查找出的候选词汇中选择的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第二更正子模块302负责提供直接从候选词汇中选择正确词汇的模式,当用户选择这种修正模式后才执行操作。
上述第三更正子模块303,用于在用户触发后,使用用户重新输入的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第三更正子模块303负责提供用户重新输入词汇的修正模式,当用户选择这种修正模式后才执行操作。当用户通过语音重新输入词汇时,第三更正子模块303进一步用于,触发连续语音识别模块100重新识别输入的语音输入信号、并显示重新识别的识别结果,将用户确认的重新识别的识别结果作为确认的正确词汇。
当用户没有从候选词汇列表中选择出正确词汇,也不想通过上述其他模式进行修正时,用户更正模块300中还可以包括第四更正子模块304,用于在用户触发后,显示所述新词生成子模块202确定出、且未包含在所述候选词汇列表中的更多候选词汇,使用用户从所述更多候选词汇中选择出的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第三更正子模块303负责提供后多候选词的修正模式,当用户选择这种修正模式后才执行操作。
图11为本发明中终端的结构示意图,该终端包括:修正语音输入文本中命名实体词汇的装置和显示部件。
上述修正语音输入文本中命名实体词汇的装置,用于识别语音输入信号,得出包括命名实体词汇标注信息的识别结果;根据命名实体词汇标注信息,确定所述识别结果中错误识别的命名实体词汇,在识别结果中突出标注出错误识别的命名实体词汇,并将标注后的识别结果输出给所述显示部件;使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正识别错误的命名实体词汇。
上述显示部件,用于显示修正语音输入文本中命名实体词汇的装置输出的标注后的识别结果。
本发明的终端中的修正语音输入文本中命名实体词汇的装置,其内部结构和各项附加功能可以与前文所述的修正语音输入文本中命名实体词汇的装置相同,这里不再赘述。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种修正语音输入文本中命名实体词汇的方法,其特征在于,该方法包括:
A、识别语音输入信号,得到包括命名实体词汇标注信息的识别结果;
B、根据所述命名实体词汇标注信息,确定所述识别结果中识别错误的命名实体词汇,突出显示所述识别错误的命名实体词汇;
C、使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇。
2.如权利要求1所述的方法,其特征在于,所述步骤A包括:
A1、提取所述语音输入信号的多维度倒谱特征及其差分特征;
A2、基于命名实体标注词典、声学模型和基于类的语言模型,得出包括词格和音素格的识别结果,并在所述词格中标注命名实体词汇标注信息,所述词格和音素格由识别栅格组成,所述命名实体词汇标注信息为命名实体词汇的位置和类别信息。
3.如权利要求2所述的方法,其特征在于,所述步骤B包括:
B1、根据所述词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,查找识别栅格未对齐且包括命名实体词汇的问题区域;
B2、确定置信度低于设定阈值的问题区域;
B3、突出标注确定出的问题区域中的命名实体词汇,显示标注后的识别结果。
4.如权利要求2所述的方法,其特征在于,所述步骤C包括:
C1、从本地命名实体库和/或网络资源中查找所述识别错误的命名实体词汇的候选词汇、形成候选词汇列表并显示;
C2、使用用户直接从所述候选词汇列表中选择的词汇,修正所述识别错误的命名实体词汇;或者,从本地命名实体库和/或网络资源中查找所述识别错误的命名实体词汇的候选词汇并显示,使用用户直接从查找出的候选词汇中选择的词汇,修正所述识别错误的命名实体词汇;或者,使用用户重新输入的词汇,修正所述识别错误的命名实体词汇。
5.如权利要求4所述的方法,其特征在于,所述步骤C1和步骤C2中从本地命名实体库和/或网络资源中查找所述识别错误的命名实体词汇的候选词汇为:
在本地命名实体库中查找时,包括:在本地命名实体库中查找与确定出的命名实体词汇相同类别且发音相似的词汇;
在网络资源中查找时,包括:在网络中的公用数据库查找与确定出的命名实体词汇发音相似的词汇;或者,在网络资源中搜索确定出的命名实体词汇、及在本地命名实体库中查找出的词汇的发音,通过搜索返回率确定词汇;或者,在网络中的设定服务器或服务器组查找与确定出的命名实体词汇发音相似的词汇,所述设定服务器或服务器组定时更新自身内部的命名实体词汇。
6.如权利要求5所述的方法,其特征在于,所述步骤C中进一步包括:
C3、将执行修正后确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间更新到本地命名实体库中;
所述在本地命名实体库中查找时,进一步根据所述类别、在句子中的位置、出现的频次和每次更新的时间,确定查找出的候选词汇的排列顺序。
7.如权利要求4所述的方法,其特征在于,所述步骤C2中进一步包括:显示所述查找出、且未包含在所述候选词汇列表中的更多候选词汇,使用用户从所述更多候选词汇中选择出的词汇,修正所述识别错误的命名实体词汇。
8.如权利要求4所述的方法,其特征在于,所述步骤C2中,用户重新输入的词汇为:用户通过语音重新输入的词汇;
当使用用户重新输入的词汇修正所述识别错误的命名实体词汇时,重新识别输入的语音输入信号,并显示重新识别的识别结果,在用户确认后,将重新识别的识别结果作为确认的正确词汇,在用户重新输入语音时,返回执行重新识别输入的语音输入信号的步骤。
9.一种修正语音输入文本中命名实体词汇的装置,其特征在于,该装置包括:连续语音识别模块、命名实体词汇检测模块和用户更正模块;
所述连续语音识别模块,用于识别语音输入信号,将包括命名实体词汇标注信息的识别结果输出给所述命名实体词汇检测模块;
所述命名实体词汇检测模块,用于根据所述命名实体词汇标注信息,确定所述识别结果中错误识别的命名实体词汇,在识别结果中突出标注出错误识别的命名实体词汇,并将标注后的识别结果输出给所述用户更正模块及显示部件;
所述用户更正模块,用于使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇。
10.如权利要求9所述的装置,其特征在于,所述连续语音识别模块包括:特征提取子模块、解码器、命名实体标注词典、声学模型和基于类的语言模型;
所述特征提取子模块,用于从语音输入信号中提取多维度的倒谱特征及其差分特征,输出到所述解码器;
所述解码器,用于基于命名实体标注词典、声学模型和基于类的语言模型,得到音素格和词格两级识别结果,输出给所述命名实体检测模块,所述词格和音素格由识别栅格组成、且词格中包括命名实体词汇标注信息,所述命名实体词汇标注信息为命名实体词汇的位置和类别信息。
11.如权利要求10所述的装置,其特征在于,所述命名实体检测模块包括:置信度校验子模块和新词生成子模块;
所述置信度校验子模块,用于根据所述词格和音素格及其起始和终止时间信息,对词格和音素格进行强制对齐,确定识别栅格未对齐、包括命名实体词汇标注信息、且置信度低于设定阈值的问题区域,突出标注出所述问题区域中的命名实体词汇,并将标注后的识别结果输出给所述新词生成子模块;
所述新词生成子模块,用于从本地命名实体库和/或网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇,形成候选词汇列表输出给显示部件,将标注后的识别结果输出给所述用户更正模块和显示部件。
12.如权利要求11所述的装置,其特征在于,所述装置中进一步包括:本地命名实体库更新模块,用于将所述用户更正模块执行修正后确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间更新到本地命名实体库中;
所述新词生成子模块进一步用于,在利用本地命名实体库查找所述确定出的命名实体词汇的候选词汇时,根据所述类别、在句子中的位置、出现的频次和每次更新的时间,确定查找出的候选词汇的排列顺序。
13.如权利要求12所述的装置,其特征在于,所述用户更正模块包括:第一更正子模块、第二更正子模块和第三更正子模块;
所述第一更正子模块,用于在用户触发后,使用用户直接从所述候选词汇列表中选择的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块;
所述第二更正子模块,用于在用户触发后,从本地命名实体库和/或网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇,输出给显示部件;使用用户从查找出的候选词汇中选择的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块;
第三更正子模块,用于在用户触发后,使用用户重新输入的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块。
14.如权利要求13所述的装置,其特征在于,所述用户更正模块中进一步包括:第四更正子模块,用于在用户触发后,显示所述新词生成子模块确定出、且未包含在所述候选词汇列表中的更多候选词汇,使用用户从所述更多候选词汇中选择出的词汇,修正所述识别错误的命名实体词汇;将执行修正后确认正确的词汇输出给本地命名实体库更新模块。
15.如权利要求13所述的装置,其特征在于,所述用户重新输入的词汇为:用户通过语音重新输入的词汇;
所述第三更正模块进一步用于,触发所述连续语音识别模块重新识别输入的语音输入信号、并显示重新识别的识别结果,将用户确认的重新识别的识别结果作为确认的正确词汇。
16.一种终端,其特征在于,该终端包括:修正语音输入文本中命名实体词汇的装置和显示部件;
所述修正语音输入文本中命名实体词汇的装置,用于识别语音输入信号,得出包括命名实体词汇标注信息的识别结果;根据所述命名实体词汇标注信息,确定所述识别结果中错误识别的命名实体词汇,在识别结果中突出标注出错误识别的命名实体词汇,并将标注后的识别结果输出给所述显示部件;使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇,修正所述识别错误的命名实体词汇;
所述显示部件,用于显示所述标注后的识别结果。
CN201110063938.4A 2011-03-10 2011-03-10 修正语音输入文本中命名实体词汇的方法、装置及终端 Active CN102682763B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110063938.4A CN102682763B (zh) 2011-03-10 2011-03-10 修正语音输入文本中命名实体词汇的方法、装置及终端
US13/417,725 US9190056B2 (en) 2011-03-10 2012-03-12 Method and apparatus for correcting a word in speech input text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110063938.4A CN102682763B (zh) 2011-03-10 2011-03-10 修正语音输入文本中命名实体词汇的方法、装置及终端

Publications (2)

Publication Number Publication Date
CN102682763A true CN102682763A (zh) 2012-09-19
CN102682763B CN102682763B (zh) 2014-07-16

Family

ID=46796872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110063938.4A Active CN102682763B (zh) 2011-03-10 2011-03-10 修正语音输入文本中命名实体词汇的方法、装置及终端

Country Status (2)

Country Link
US (1) US9190056B2 (zh)
CN (1) CN102682763B (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106061A (zh) * 2013-03-05 2013-05-15 北京车音网科技有限公司 语音输入方法和装置
CN103853710A (zh) * 2013-11-21 2014-06-11 北京理工大学 一种基于协同训练的双语命名实体识别方法
CN105206261A (zh) * 2014-06-18 2015-12-30 谷歌公司 实体名称识别
CN105374356A (zh) * 2014-08-29 2016-03-02 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
CN105702256A (zh) * 2014-11-28 2016-06-22 上海航空电器有限公司 一种基于机载设备的数字串语音识别方法
CN105869634A (zh) * 2016-03-31 2016-08-17 重庆大学 一种基于领域的带反馈语音识别后文本纠错方法及系统
CN105895103A (zh) * 2015-12-03 2016-08-24 乐视致新电子科技(天津)有限公司 一种语音识别方法及装置
CN105895090A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 语音信号处理方法及装置
CN106098060A (zh) * 2016-05-19 2016-11-09 北京搜狗科技发展有限公司 语音的纠错处理方法和装置、用于语音的纠错处理的装置
CN106469554A (zh) * 2015-08-21 2017-03-01 科大讯飞股份有限公司 一种自适应的识别方法及系统
CN106547733A (zh) * 2016-10-19 2017-03-29 中国国防科技信息中心 一种面向特定文本的命名实体识别方法
CN106710592A (zh) * 2016-12-29 2017-05-24 北京奇虎科技有限公司 一种智能硬件设备中的语音识别纠错方法和装置
CN106816148A (zh) * 2015-11-30 2017-06-09 三星电子株式会社 语音识别设备和方法
CN107678309A (zh) * 2017-09-01 2018-02-09 科大讯飞股份有限公司 操控句式生成、应用操控方法及装置、存储介质
CN108389576A (zh) * 2018-01-10 2018-08-10 苏州思必驰信息科技有限公司 压缩后的语音识别模型的优化方法及系统
CN108389577A (zh) * 2018-02-12 2018-08-10 广州视源电子科技股份有限公司 优化语音识别声学模型的方法、系统、设备及存储介质
CN108595412A (zh) * 2018-03-19 2018-09-28 百度在线网络技术(北京)有限公司 纠错处理方法及装置、计算机设备及可读介质
CN109800407A (zh) * 2017-11-15 2019-05-24 腾讯科技(深圳)有限公司 意图识别方法、装置、计算机设备和存储介质
CN110070859A (zh) * 2018-01-23 2019-07-30 阿里巴巴集团控股有限公司 一种语音识别方法及装置
CN111259134A (zh) * 2020-01-19 2020-06-09 出门问问信息科技有限公司 一种实体识别方法、设备及计算机可读存储介质
CN111554295A (zh) * 2020-04-24 2020-08-18 科大讯飞(苏州)科技有限公司 文本纠错方法、相关设备及可读存储介质
CN112232080A (zh) * 2020-10-20 2021-01-15 大唐融合通信股份有限公司 命名实体识别方法、装置及电子设备
CN112882680A (zh) * 2021-01-22 2021-06-01 维沃移动通信有限公司 语音识别方法及装置
CN113614825A (zh) * 2019-06-20 2021-11-05 谷歌有限责任公司 用于自动语音识别的字词网格扩增
CN115238702A (zh) * 2022-09-21 2022-10-25 中科雨辰科技有限公司 一种实体库处理方法及存储介质

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9542936B2 (en) 2012-12-29 2017-01-10 Genesys Telecommunications Laboratories, Inc. Fast out-of-vocabulary search in automatic speech recognition systems
US10885918B2 (en) * 2013-09-19 2021-01-05 Microsoft Technology Licensing, Llc Speech recognition using phoneme matching
US9224038B2 (en) * 2013-12-16 2015-12-29 Google Inc. Partial overlap and delayed stroke input recognition
US9589562B2 (en) * 2014-02-21 2017-03-07 Microsoft Technology Licensing, Llc Pronunciation learning through correction logs
CN103903615B (zh) * 2014-03-10 2018-11-09 联想(北京)有限公司 一种信息处理方法及电子设备
US10749989B2 (en) 2014-04-01 2020-08-18 Microsoft Technology Licensing Llc Hybrid client/server architecture for parallel processing
KR102380833B1 (ko) * 2014-12-02 2022-03-31 삼성전자주식회사 음성 인식 방법 및 음성 인식 장치
EP3089159B1 (en) * 2015-04-28 2019-08-28 Google LLC Correcting voice recognition using selective re-speak
US10152965B2 (en) * 2016-02-03 2018-12-11 Google Llc Learning personalized entity pronunciations
CN107967250B (zh) * 2016-10-19 2020-12-29 中兴通讯股份有限公司 一种信息处理方法及装置
US10013971B1 (en) 2016-12-29 2018-07-03 Google Llc Automated speech pronunciation attribution
WO2019035373A1 (ja) * 2017-08-17 2019-02-21 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
CN107491537A (zh) * 2017-08-23 2017-12-19 北京百度网讯科技有限公司 Poi数据挖掘、信息检索方法、装置、设备及介质
CN107622769B (zh) * 2017-08-28 2021-04-06 科大讯飞股份有限公司 号码修改方法及装置、存储介质、电子设备
CN110111793B (zh) * 2018-02-01 2023-07-14 腾讯科技(深圳)有限公司 音频信息的处理方法、装置、存储介质及电子装置
CN110309258B (zh) * 2018-03-15 2022-03-29 中国移动通信集团有限公司 一种输入检查方法、服务器和计算机可读存储介质
US10269376B1 (en) * 2018-06-28 2019-04-23 Invoca, Inc. Desired signal spotting in noisy, flawed environments
US11170170B2 (en) 2019-05-28 2021-11-09 Fresh Consulting, Inc System and method for phonetic hashing and named entity linking from output of speech recognition
CN111459918A (zh) * 2020-04-26 2020-07-28 上海烜翊科技有限公司 一种基于元数据库的体系建模命名方法
CN113569565B (zh) * 2020-04-29 2023-04-11 抖音视界有限公司 一种语义理解方法、装置、设备和存储介质
CN112528663B (zh) * 2020-12-18 2024-02-20 中国南方电网有限责任公司 一种电网领域调度场景下的文本纠错方法及系统
US11593415B1 (en) * 2021-11-05 2023-02-28 Validate Me LLC Decision making analysis engine
US11657803B1 (en) * 2022-11-02 2023-05-23 Actionpower Corp. Method for speech recognition by using feedback information
CN115881097B (zh) * 2023-02-22 2023-07-18 深圳市友杰智新科技有限公司 语音识别结果的确认方法、装置、计算机设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1356628A (zh) * 2000-07-05 2002-07-03 国际商业机器公司 具有有限或无显示器的设备的语音识别校正
US20020143544A1 (en) * 2001-03-29 2002-10-03 Koninklijke Philips Electronic N.V. Synchronise an audio cursor and a text cursor during editing
US20030061043A1 (en) * 2001-09-17 2003-03-27 Wolfgang Gschwendtner Select a recognition error by comparing the phonetic
CN101042867A (zh) * 2006-03-24 2007-09-26 株式会社东芝 语音识别设备和方法
CN101295293A (zh) * 2007-04-29 2008-10-29 摩托罗拉公司 用于对表意字符的输入字符串进行自动纠错的方法
CN101313276A (zh) * 2005-10-28 2008-11-26 微软公司 将语音和备选项输入形式组合到移动设备中
CN101452700A (zh) * 2007-11-30 2009-06-10 王瑞璋 一种语音辨识系统

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1159661C (zh) * 1999-04-08 2004-07-28 肯特里奇数字实验公司 用于中文的标记和命名实体识别的系统
US20030191625A1 (en) * 1999-11-05 2003-10-09 Gorin Allen Louis Method and system for creating a named entity language model
US6272464B1 (en) * 2000-03-27 2001-08-07 Lucent Technologies Inc. Method and apparatus for assembling a prediction list of name pronunciation variations for use during speech recognition
WO2001084535A2 (en) * 2000-05-02 2001-11-08 Dragon Systems, Inc. Error correction in speech recognition
JP4200645B2 (ja) * 2000-09-08 2008-12-24 日本電気株式会社 情報処理装置、情報処理方法および記録媒体
US7337114B2 (en) * 2001-03-29 2008-02-26 International Business Machines Corporation Speech recognition using discriminant features
US6950796B2 (en) * 2001-11-05 2005-09-27 Motorola, Inc. Speech recognition by dynamical noise model adaptation
TWI256562B (en) * 2002-05-03 2006-06-11 Ind Tech Res Inst Method for named-entity recognition and verification
US7289956B2 (en) * 2003-05-27 2007-10-30 Microsoft Corporation System and method for user modeling to enhance named entity recognition
WO2005010866A1 (en) * 2003-07-23 2005-02-03 Nexidia Inc. Spoken word spotting queries
US7865356B2 (en) * 2004-07-15 2011-01-04 Robert Bosch Gmbh Method and apparatus for providing proper or partial proper name recognition
US7742911B2 (en) * 2004-10-12 2010-06-22 At&T Intellectual Property Ii, L.P. Apparatus and method for spoken language understanding by using semantic role labeling
KR100723404B1 (ko) 2005-03-29 2007-05-30 삼성전자주식회사 음성 인식 및 반응을 위한 음성 처리 장치와 방법
US8280719B2 (en) * 2005-05-05 2012-10-02 Ramp, Inc. Methods and systems relating to information extraction
US8412514B1 (en) * 2005-10-27 2013-04-02 At&T Intellectual Property Ii, L.P. Method and apparatus for compiling and querying a QA database
US20070106685A1 (en) * 2005-11-09 2007-05-10 Podzinger Corp. Method and apparatus for updating speech recognition databases and reindexing audio and video content using the same
KR100684160B1 (ko) 2005-12-08 2007-02-20 한국전자통신연구원 개체명 인식을 이용한 대화 분석 장치 및 방법
US8090570B2 (en) * 2006-10-26 2012-01-03 Mobile Technologies, Llc Simultaneous translation of open domain lectures and speeches
WO2008106655A1 (en) * 2007-03-01 2008-09-04 Apapx, Inc. System and method for dynamic learning
CN101815996A (zh) * 2007-06-01 2010-08-25 谷歌股份有限公司 检测名称实体和新词
WO2009081861A1 (ja) * 2007-12-21 2009-07-02 Nec Corporation 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体
US8583416B2 (en) * 2007-12-27 2013-11-12 Fluential, Llc Robust information extraction from utterances
US8000956B2 (en) * 2008-02-08 2011-08-16 Xerox Corporation Semantic compatibility checking for automatic correction and discovery of named entities
US8560298B2 (en) * 2008-10-21 2013-10-15 Microsoft Corporation Named entity transliteration using comparable CORPRA
US8296141B2 (en) * 2008-11-19 2012-10-23 At&T Intellectual Property I, L.P. System and method for discriminative pronunciation modeling for voice search
US9484019B2 (en) * 2008-11-19 2016-11-01 At&T Intellectual Property I, L.P. System and method for discriminative pronunciation modeling for voice search

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1356628A (zh) * 2000-07-05 2002-07-03 国际商业机器公司 具有有限或无显示器的设备的语音识别校正
US20020143544A1 (en) * 2001-03-29 2002-10-03 Koninklijke Philips Electronic N.V. Synchronise an audio cursor and a text cursor during editing
US20030061043A1 (en) * 2001-09-17 2003-03-27 Wolfgang Gschwendtner Select a recognition error by comparing the phonetic
CN101313276A (zh) * 2005-10-28 2008-11-26 微软公司 将语音和备选项输入形式组合到移动设备中
CN101042867A (zh) * 2006-03-24 2007-09-26 株式会社东芝 语音识别设备和方法
CN101295293A (zh) * 2007-04-29 2008-10-29 摩托罗拉公司 用于对表意字符的输入字符串进行自动纠错的方法
CN101452700A (zh) * 2007-11-30 2009-06-10 王瑞璋 一种语音辨识系统

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106061A (zh) * 2013-03-05 2013-05-15 北京车音网科技有限公司 语音输入方法和装置
CN103853710A (zh) * 2013-11-21 2014-06-11 北京理工大学 一种基于协同训练的双语命名实体识别方法
CN105206261A (zh) * 2014-06-18 2015-12-30 谷歌公司 实体名称识别
CN105206261B (zh) * 2014-06-18 2019-10-18 谷歌有限责任公司 用于实体名称识别的方法和系统
CN105374356A (zh) * 2014-08-29 2016-03-02 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
CN105374356B (zh) * 2014-08-29 2019-07-30 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
CN105702256A (zh) * 2014-11-28 2016-06-22 上海航空电器有限公司 一种基于机载设备的数字串语音识别方法
CN105702256B (zh) * 2014-11-28 2020-01-31 上海航空电器有限公司 一种基于机载设备的数字串语音识别方法
CN106469554A (zh) * 2015-08-21 2017-03-01 科大讯飞股份有限公司 一种自适应的识别方法及系统
CN106816148A (zh) * 2015-11-30 2017-06-09 三星电子株式会社 语音识别设备和方法
CN106816148B (zh) * 2015-11-30 2022-04-22 三星电子株式会社 语音识别设备和方法
CN105895103A (zh) * 2015-12-03 2016-08-24 乐视致新电子科技(天津)有限公司 一种语音识别方法及装置
CN105895103B (zh) * 2015-12-03 2020-01-17 乐融致新电子科技(天津)有限公司 一种语音识别方法及装置
CN105895090A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 语音信号处理方法及装置
WO2017166649A1 (zh) * 2016-03-30 2017-10-05 乐视控股(北京)有限公司 语音信号处理方法及装置
CN105869634B (zh) * 2016-03-31 2019-11-19 重庆大学 一种基于领域的带反馈语音识别后文本纠错方法及系统
CN105869634A (zh) * 2016-03-31 2016-08-17 重庆大学 一种基于领域的带反馈语音识别后文本纠错方法及系统
CN106098060A (zh) * 2016-05-19 2016-11-09 北京搜狗科技发展有限公司 语音的纠错处理方法和装置、用于语音的纠错处理的装置
CN106098060B (zh) * 2016-05-19 2020-01-31 北京搜狗科技发展有限公司 语音的纠错处理方法和装置、用于语音的纠错处理的装置
CN106547733A (zh) * 2016-10-19 2017-03-29 中国国防科技信息中心 一种面向特定文本的命名实体识别方法
CN106710592A (zh) * 2016-12-29 2017-05-24 北京奇虎科技有限公司 一种智能硬件设备中的语音识别纠错方法和装置
WO2018121275A1 (zh) * 2016-12-29 2018-07-05 北京奇虎科技有限公司 一种智能硬件设备中的语音识别纠错方法和装置
CN107678309A (zh) * 2017-09-01 2018-02-09 科大讯飞股份有限公司 操控句式生成、应用操控方法及装置、存储介质
CN107678309B (zh) * 2017-09-01 2021-07-06 科大讯飞股份有限公司 操控句式生成、应用操控方法及装置、存储介质
CN109800407B (zh) * 2017-11-15 2021-11-16 腾讯科技(深圳)有限公司 意图识别方法、装置、计算机设备和存储介质
CN109800407A (zh) * 2017-11-15 2019-05-24 腾讯科技(深圳)有限公司 意图识别方法、装置、计算机设备和存储介质
CN108389576B (zh) * 2018-01-10 2020-09-01 苏州思必驰信息科技有限公司 压缩后的语音识别模型的优化方法及系统
CN108389576A (zh) * 2018-01-10 2018-08-10 苏州思必驰信息科技有限公司 压缩后的语音识别模型的优化方法及系统
CN110070859B (zh) * 2018-01-23 2023-07-14 阿里巴巴集团控股有限公司 一种语音识别方法及装置
CN110070859A (zh) * 2018-01-23 2019-07-30 阿里巴巴集团控股有限公司 一种语音识别方法及装置
CN108389577A (zh) * 2018-02-12 2018-08-10 广州视源电子科技股份有限公司 优化语音识别声学模型的方法、系统、设备及存储介质
CN108595412B (zh) * 2018-03-19 2020-03-27 百度在线网络技术(北京)有限公司 纠错处理方法及装置、计算机设备及可读介质
CN108595412A (zh) * 2018-03-19 2018-09-28 百度在线网络技术(北京)有限公司 纠错处理方法及装置、计算机设备及可读介质
US11797772B2 (en) 2019-06-20 2023-10-24 Google Llc Word lattice augmentation for automatic speech recognition
CN113614825A (zh) * 2019-06-20 2021-11-05 谷歌有限责任公司 用于自动语音识别的字词网格扩增
CN111259134A (zh) * 2020-01-19 2020-06-09 出门问问信息科技有限公司 一种实体识别方法、设备及计算机可读存储介质
CN111259134B (zh) * 2020-01-19 2023-08-08 出门问问信息科技有限公司 一种实体识别方法、设备及计算机可读存储介质
CN111554295A (zh) * 2020-04-24 2020-08-18 科大讯飞(苏州)科技有限公司 文本纠错方法、相关设备及可读存储介质
CN111554295B (zh) * 2020-04-24 2021-06-22 科大讯飞(苏州)科技有限公司 文本纠错方法、相关设备及可读存储介质
CN112232080A (zh) * 2020-10-20 2021-01-15 大唐融合通信股份有限公司 命名实体识别方法、装置及电子设备
CN112882680A (zh) * 2021-01-22 2021-06-01 维沃移动通信有限公司 语音识别方法及装置
CN115238702B (zh) * 2022-09-21 2022-12-06 中科雨辰科技有限公司 一种实体库处理方法及存储介质
CN115238702A (zh) * 2022-09-21 2022-10-25 中科雨辰科技有限公司 一种实体库处理方法及存储介质

Also Published As

Publication number Publication date
US20120232904A1 (en) 2012-09-13
CN102682763B (zh) 2014-07-16
US9190056B2 (en) 2015-11-17

Similar Documents

Publication Publication Date Title
CN102682763B (zh) 修正语音输入文本中命名实体词汇的方法、装置及终端
CN110473531B (zh) 语音识别方法、装置、电子设备、系统及存储介质
CN107315737B (zh) 一种语义逻辑处理方法及系统
US10431204B2 (en) Method and apparatus for discovering trending terms in speech requests
CN111369996B (zh) 一种特定领域的语音识别文本纠错方法
CN106598939B (zh) 一种文本纠错方法及装置、服务器、存储介质
EP4027268A1 (en) Training method for classification model, sample classification method and apparatus, and device
CN108304375B (zh) 一种信息识别方法及其设备、存储介质、终端
CN105869634B (zh) 一种基于领域的带反馈语音识别后文本纠错方法及系统
CN109637537B (zh) 一种自动获取标注数据优化自定义唤醒模型的方法
US10037758B2 (en) Device and method for understanding user intent
CN106570180B (zh) 基于人工智能的语音搜索方法及装置
US11646016B2 (en) Method and apparatus for recognizing user intention, device, and readable storage medium
CN1918578B (zh) 具有自动校正的手写及语音输入
US20150019216A1 (en) Performing an operation relative to tabular data based upon voice input
US20170103061A1 (en) Interaction apparatus and method
KR20120011010A (ko) 수기 인식 방법 및 장치
CN103678684A (zh) 一种基于导航信息检索的中文分词方法
JPWO2005122144A1 (ja) 音声認識装置、音声認識方法、及びプログラム
CN104166462A (zh) 一种文字的输入方法和系统
CN103000176A (zh) 语音识别方法和系统
CN111508502B (zh) 用于显示结果的备选的方法和系统
CN102708862A (zh) 触控辅助的实时语音识别系统及其同步解码方法
CN104485107A (zh) 名称的语音识别方法、语音识别系统和语音识别设备
CN109508441B (zh) 通过自然语言实现数据统计分析的方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant