CN102682763A

CN102682763A - 修正语音输入文本中命名实体词汇的方法、装置及终端

Info

Publication number: CN102682763A
Application number: CN2011100639384A
Authority: CN
Inventors: 朱璇; 张华�; 苏腾荣; 严基完; 李在原
Original assignee: Beijing Samsung Telecommunications Technology Research Co Ltd; Samsung Electronics Co Ltd
Current assignee: Beijing Samsung Telecommunications Technology Research Co Ltd; Samsung Electronics Co Ltd
Priority date: 2011-03-10
Filing date: 2011-03-10
Publication date: 2012-09-19
Anticipated expiration: 2031-03-10
Also published as: US20120232904A1; CN102682763B; US9190056B2

Abstract

本发明公开了修正语音输入文本中命名实体词汇的方法及装置，有针对性的定位识别错误的命名实体词汇，而不是对用户输入的每个词汇是否识别错误都进行判断，同时提供了包括使用从预设的本地命名实体库和/或网络资源中选择的词汇、及使用用户重新输入的词汇进行修正的修正模式，与现有技术中仅通过多模态的文字输入进行修正相比，修正途径更加便捷、丰富。

Description

修正语音输入文本中命名实体词汇的方法、装置及终端

技术领域

本发明涉及语音识别技术，特别涉及修正语音输入文本中命名实体词汇的方法、装置及终端。

背景技术

随着半导体工业、材料工业、电子技术的高速发展，终端设备上所具有的功能日益复杂，智能型的文本输入功能和设备控制方式成为了现有终端设备的必要需求。在各种智能型的文本输入技术中，语音输入以其直观、快捷的特点，成为主流技术之一。

修正语音输入文本中错误识别的词汇是语音输入法的后处理技术，首先对用户输入的语音进行识别，然后对识别结果进行检测、定位可能识别错误的词汇，最后提供修正模式、让用户通过修正模式对可能识别错误的词汇进行修正。

在现有技术中，在定位错误词汇方面，主要通过置信测度方法衡量输入语音和识别结果之间的可信程度，找到置信度较低的词汇作为可能识别错误的词汇。在修正错误词汇方面，向用户提供用多模态方式进行重新输入的修正模式，例如从本地通信记录中选择正确词汇、或者从基于模糊音提供的候选词中重新选择正确词汇，或者通过重发音来重新输入语音、或通过手写体识别录入正确词汇、或通过直接键盘录入正确词汇等，使用用户重新输入的词汇进行修正。

现有技术中的上述方法主要存在以下缺陷：

第一、对语音输入的每个词汇采用无差别的置信度分析方法，而实际上目前针对特定领域内容的连续语音识别的正确率已经能够达到90％，容易识别错误的词汇主要是集外词汇。在短信、邮件、搜索词条的智能语音输入中，名词往往是表达该段文字中心内容的载体，在所有的名词中，主要包括人名、地名和机构名等的命名实体词汇又占据了很大的比重，由于命名实体词汇属于成长型词汇，总是在不断的更新和增加，因此很多命名实体词汇对于语音识别来说都属于集外词汇，容易造成错误识别，现有技术中的方法并没有针对性的定位这种承载了语义主体内容、又容易被错误识别的命名实体词汇；

第二、现有技术的方法在修正错误词汇时，只关注于用多模态的方式进行重新输入，没有考虑更多、更便捷的修正途径。

发明内容

本发明提供一种修正语音输入文本中命名实体词汇的方法，精确定位识别错误的命名实体词汇，并提供更丰富、便捷的修正途径。

本发明提供一种修正语音输入文本中命名实体词汇的装置，精确定位识别错误的命名实体词汇，并提供更丰富、便捷的修正途径。

本发明提供一种终端，精确定位识别错误的命名实体词汇，并提供更丰富、便捷的修正途径。

本发明的技术方案是这样实现的：

一种修正语音输入文本中命名实体词汇的方法，关键在于，该方法包括：

A、识别语音输入信号，得到包括命名实体词汇标注信息的识别结果；

B、根据所述命名实体词汇标注信息，确定所述识别结果中识别错误的命名实体词汇，突出显示所述识别错误的命名实体词汇；

C、使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇，修正所述识别错误的命名实体词汇。

一种修正语音输入文本中命名实体词汇的装置，关键在于，该装置包括：连续语音识别模块、命名实体词汇检测模块和用户更正模块；

所述连续语音识别模块，用于识别语音输入信号，将包括命名实体词汇标注信息的识别结果输出给所述命名实体词汇检测模块；

所述命名实体词汇检测模块，用于根据所述命名实体词汇标注信息，确定所述识别结果中错误识别的命名实体词汇，在识别结果中突出标注出错误识别的命名实体词汇，并将标注后的识别结果输出给所述用户更正模块及显示部件；

所述用户更正模块，用于使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇，修正所述识别错误的命名实体词汇。

一种终端，关键在于，该终端包括：修正语音输入文本中命名实体词汇的装置和显示部件；

所述修正语音输入文本中命名实体词汇的装置，用于识别语音输入信号，得出包括命名实体词汇标注信息的识别结果；根据所述命名实体词汇标注信息，确定所述识别结果中错误识别的命名实体词汇，在识别结果中突出标注出错误识别的命名实体词汇，并将标注后的识别结果输出给所述显示部件；使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇，修正所述识别错误的命名实体词汇；

所述显示部件，用于显示所述标注后的识别结果。

可以看出，本发明中修正语音输入文本中命名实体词汇的方法、装置及终端，一方面由于在识别结果中增加了命名实体词汇标注信息，使得后续可以有针对性的定位出识别错误的命名实体词汇，而不是对用户输入的每个词汇是否识别错误都进行判断，另一方面增加了使用从本地命名实体库和/或网络资源中选择的词汇、执行修正的修正模式，与现有技术中仅通过多模态的文字输入进行修正相比，修正途径更加丰富和便捷。

附图说明

图1为本发明中修正语音输入文本中命名实体词汇的方法的流程图；

图2为本发明实施例中修正语音输入文本中命名实体词汇的方法的流程图；

图3为图2中所示步骤21的实现流程图；

图4为图2中所示步骤22的实现流程图；

图5为本发明实施例中查找问题区域的过程示意图；

图6为本发明实施例中用户界面的示意图；

图7为本发明中修正语音输入文本中命名实体词汇的装置结构示意图；

图8为本发明实施例中连续语音识别模块的结构示意图；

图9为本发明实施例中命名实体检测模块的结构示意图；

图10为本发明实施例中用户更正模块的结构示意图；

图11为本发明中终端的结构示意图。

具体实施方式

为使本发明的目的和优点更加清楚，下面结合附图和实施例对本发明作进一步的详细说明。

图1为本发明中修正语音输入文本中命名实体词汇的方法流程图，在图1所示的流程开始之前，建立本地命名实体库。

图1所示流程包括：

步骤11：识别语音输入信号，得到包括命名实体词汇标注信息的识别结果。

步骤12：根据命名实体词汇标注信息，确定识别结果中识别错误的命名实体词汇，突出显示识别错误的命名实体词汇。

步骤13：使用从本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇，修正所述识别错误的命名实体词汇。

可见，本发明中修正语音输入文本中命名实体词汇的方法，一方面由于在识别结果中增加了命名实体词汇标注信息，使得后续步骤中可以有针对性的定位出识别错误的命名实体词汇，而不是对用户输入的每个词汇是否识别错误都进行判断，另一方面增加了使用从本地命名实体库和/或网络资源中选择的词汇、执行修正的修正模式，与现有技术中仅通过多模态的文字输入进行修正相比，修正途径更加丰富和便捷。

下面给出本发明方法的一个实施例，在本实施例中，本地命名实体库的初始状态为空。

图2为本发明实施例中修正语音输入文本中命名实体词汇的方法的流程图，该流程包括：

步骤21：识别语音输入信号，得到包括命名实体词汇位置和类别信息的识别结果。

本步骤中的命名实体词汇位置和类别信息，是命名实体词汇标注信息的一种实施方式，其中位置信息指该命名实体词汇在句子中所处的位置，例如在主语位置、宾语位置，或者句子的前段位置、中段位置等，类别信息指该命名实体词汇所属的类别，例如该命名实体词汇属于人名类别、地名类别或机构名类别等。

这里的步骤21由图3所示的流程实现，图3所示流程包括：

步骤211：提取语音输入信号的多维度倒谱特征及其差分特征。

本步骤中的多维度倒谱特征及其差分特征用来表征语音信号中和语言相关的信息，使用现有的常用方法即可实现这里的提取操作，例如通过端点检测算法，将连续语音流中的语音段切分出来，将语音段分为20～30毫秒的帧。分帧加窗以后的帧数据，通过离散傅里叶变换转换到频谱上，再将频谱信号进行一系列带通滤波、并将每次滤波后的结果进行非线性压缩，最后对得到的一组数据作离散余弦变换，以降低每维特征之间的相关性，并保留特征数据中表征性较强的部分维度。为了提高语音识别的精度和抗噪性能，Mel倒谱系数、感知线性预测系数、Gamma-tone倒谱系数等多种类型的倒谱特征均可被采用。

步骤212：基于命名实体标注词典、声学模型和基于类的语言模型，对提取出的特征解码得出包括词格和音素格的识别结果，在词格中标注命名实体词汇的位置和类别信息。

本步骤中的词格和音素格由识别栅格组成。

本步骤中，命名实体标注词典是包含了命名实体标注信息的中文词典，可以在离线状态下生成。现有技术中的词典生成算法很多，一个词典可能具备多种生成来源，例如根据汉语语言学规则得到的通用词典，或对大量相关文本进行分词后统计得到的词典，或根据距离测度生成的新词典等。在合并了多种生成来源的词条后，可以采用手工校对或者统计型测度等方法，选取其中有效的词条，得到命名实体标注词典。命名实体标注词典不仅是本步骤中解码操作的基础之一，还是声学模型训练及基于类的语言模型训练的基础。

声学模型可以在离线状态下生成。现有技术中常用的生成方法是，通过对大量语音数据的有监督和无监督学习的算法，生成针对具体应用的隐含马尔科夫模型。

基于类的语言模型可以在离线状态下生成。在语言模型训练中，将同类别的命名实体词汇作为相同词汇考虑，例如将属于人名类别的命名实体词汇作为相同词汇考虑。采用基于类的语言模型的优点有以下两点：第一，由于很多命名实体词语在文本中的出现频率比较低，普通语言模型在此情况下会由于数据稀疏而产生估计误差，基于类的语言模型在一定程度上可以避免这一问题的出现，进而提高语音识别率和识别的稳健性；第二，由于命名实体词汇属于快速成长型词汇，新词不断的出现，采用基于类的语言模型，能够减少集外词造成的识别错误，进而提高语音识别性能。

至于本步骤中如何基于命名实体标注词典、声学模型和基于类的语言模型，得出包括词格和音素格的识别结果，现有技术中有多种实现方法，这里不再赘述。

本步骤中将根据命名实体标注词典和基于类的语言模型在词格中标注命名实体词汇的位置和类别信息。

经过上述步骤211～步骤212就完成了对语音输入信号的识别，得出了识别结果。

步骤22：根据所述命名实体词汇的位置和属性信息及置信测度方法，确定所述识别结果中识别错误的命名实体词汇，高亮显示所述识别错误的命名实体词汇。

这里的步骤22可以由图4所示流程实现，图4所示流程包括：

步骤221：根据词格和音素格及其起始和终止时间信息，对词格和音素格进行强制对齐，查找识别栅格未对齐且包括命名实体词汇的问题区域。

图5为本步骤中查找问题区域的过程示意图，其中词格中的每个圆圈对应一个词汇，而音素格中的多个圆圈对应一个词汇的发音。图5中的标号①代表根据词格和音素格及其起始和终止时间信息，对词格和音素格进行强制对齐，标号②代表查找问题区域，其中标号为a和b的两处为查找出的问题区域。

这里的强制对齐是一种现有技术中的算法，具体实现方式这里不再赘述。

步骤222：根据置信测度方法，确定置信度低于设定阈值的问题区域。

本步骤中采用了广义词语后验概率方法，这也是现有技术中一种应用较广泛的置信测度方法。当然本步骤也可以应用其他的置信测度方法。

步骤223：高亮显示确定出的问题区域中的命名实体词汇。

本步骤中，也可以采用其他突出显示的方式，例如用颜色着重标注等。

经过上述步骤221～步骤223，确定出了识别错误的命名实体词汇。

步骤23：从本地命名实体库和/或网络资源中查找识别错误的命名实体词汇的候选词汇，形成候选词汇列表并显示。

本步骤中查找候选词汇有以下两种实施方式：

第一、在本地命名实体库中查找候选词汇时，在本地命名实体库中查找与识别错误的命名实体词汇相同类别且发音相似的候选词汇；在网络资源中查找候选词汇时，在网络中的公用数据库查找与识别错误的命名实体词汇发音相似的候选词汇；或者，在网络资源中搜索识别错误的命名实体词汇、及在本地命名实体库中查找出的词汇的发音，通过搜索返回率确定候选词汇。

第二、在本次资源中查找候选词汇时，和上述第一种中的实现方式相同；在网络资源中查找候选词汇时，与上述第一种中采取完全在线查找的方式不同的是，采用一种半在线或离线的搜索模式，在此情况下，在网络中的由服务提供商提供一台服务器或服务器群组中查找与识别错误的命名实体词汇发音相似的候选词汇，该服务器或服务器群组会利用网络资源定时对自身内部的命名实体词汇进行更新，这种半在线或离线的搜索模式的优点在于，服务器端已经在离线状态下将大量的网络资源进行了归纳和整理，并且定时更新，所以在服务器端查找候选词汇，将比直接在大量网络资源中查找速度更快、更有针对性且用户支出的费用更少，对服务器端而言，根据在服务器或服务器群组中查找候选词汇的情况，可以获知哪些词汇的搜索频率较多等反馈信息，从而将这些词汇优先作为候选词汇。

步骤24：使用用户直接从候选词汇列表中选择的词汇，修正所述识别错误的命名实体词汇；或者，从本地命名实体库和/或网络资源中查找识别错误的命名实体词汇的候选词汇并显示，使用用户从查找出的候选词汇中选择的词汇，修正所述识别错误的命名实体词汇；或者，使用用户重新输入的词汇，修正所述识别错误的命名实体词汇。

本步骤中，用户选择不同的修正模式时，执行对应的修正方法。

用户重新输入词汇的方式可以是从本地通信记录中选择、键盘输入、通过语音重新输入，其中采用从本地通信记录中选择和键盘输入时，与现有技术中的实现方式相同。采用语音重新输入时，需重新识别输入的语音输入信号，并显示重新识别的识别结果，在用户确认后，将重新识别的识别结果作为确认的正确词汇，在用户重新输入语音时，再执行重新识别输入的语音输入信号的步骤。进一步，由于终端的显示界面有限，步骤23中形成的候选词汇列表中只能列出一部分查找到的候选词汇，如果用户未从候选词汇列表中找到要确认的正确词汇，也不想通过上述提供的其他修正模式进行修正，还可以向用户显示步骤23中查找到的、且未包含在候选词汇列表中的更多候选词汇，使用用户从所述更多候选词汇中选择出的词汇，修正所述识别错误的命名实体词汇。

步骤25：将执行修正后确认的正确词汇更新到本地命名实体库中。

本步骤中的更新可以包括将用户确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间。

基于本步骤中的本地命名实体库的更新方式，下次再执行步骤23、在本地命名实体库中查找候选词汇时，可以考虑上述类别、在句子中的位置、出现的频次和每次更新的时间。例如，如果当前识别错误的命名实体词汇为人名，则直接查找本地命名实体库中类别为人名的候选词汇，如果当前识别错误的命名实体词汇在句子中的位置是主语，则直接查找本地命名实体库中在句子中位置为主语的候选词汇。又例如，在查找出多个针对当前识别错误的命名实体词汇的候选词语时，将出现的频次高的候选词汇排列在前，或将每次更新时间较快的候选词汇排列在前。类似的，在执行步骤23中的在网络资源中查找候选词汇时，可以依据某个词汇的检索频次来确定该词的排序，检索频次高的词汇排列在前。

本发明实施例中的本地命名实体库是根据每次用户确认的正确词汇进行更新的，由于这些更新是被用户经常使用的，所以从本地命名实体库中更容易找到与识别错误的命名实体词汇较接近的候选词汇。

图6为本发明实施例中用户界面的示意图，假设用户的语音输入为“请通知张老师，明天到华润大厦开会”，其中“张老师”和“华润”为识别错误的命名实体词汇、且被高亮显示。针对识别错误的“张老师”一词，提供的属于“人名选择”类别的候选词汇列表为“张老师、赵老师、左老师”，针对识别错误的“华润”一词，提供的属于“地名选择”类别的候选词汇列表为“鹏润、鹏辉、华润”。用户除了可以直接从候选词汇列表中直接选择词汇外，还可以选择“选项”中提供的其他修正模式，例如更多候选词、查找通讯录、查找网络、查找本地命名实体库、键盘输入或重读该词。当用户点击“查找网络”或“查找本地命名实体库”时，将执行步骤24中的显示查找出的候选词汇，使用用户从查找出的候选词汇中选择的词汇，修正所述识别错误的命名实体词汇。

图7为本发明中修正语音输入文本中命名实体词汇的装置结构示意图，该装置包括：连续语音识别模块100、命名实体词汇检测模块200和用户更正模块300。

连续语音识别模块100，用于识别语音输入信号，将包括命名实体词汇标注信息的识别结果输出给命名实体词汇检测模块200。

命名实体词汇检测模块200，用于根据命名实体词汇标注信息，确定识别结果中识别错误的命名实体词汇，在识别结果中突出标注错误识别的命名实体词汇，将标注后的识别结果输出给用户更正模块及显示部件。

用户更正模块300，用于使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇，修正所述识别错误的命名实体词汇。

可见，本发明中修正语音输入文本中命名实体词汇的装置，一方面由于在识别结果中包含了命名实体词汇标注信息，使得后续可以有针对性的定位出错误识别的命名实体词汇，而不是对用户输入的每个词汇是否识别错误都进行判断，另一方面增加了使用从本地命名实体库和网络资源中选择的词汇、执行修正的修正模式，与现有技术中仅通过多模态的文字输入进行修正相比，修正途径更加丰富和便捷。

下面给出本发明修正语音输入文本中命名实体词汇的装置的实施例。

图8为本发明实施例中连续语音识别模块的结构示意图，连续语音识别模块100包括：特征提取子模块101、解码器102、命名实体标注词典103、声学模型104和基于类的语言模型105。

特征提取子模块101，用于从语音输入信号中提取多维度的倒谱特征及其差分特征，输出到解码器102中。

命名实体标注词典103是解码器102的一项输入，是包含了命名实体标注信息的中文词典，可以在离线状态下生成。具体的生成方法在本发明方法中已介绍，生成命名实体标注词典103的可以是如图9中所示的词典生成子模块。

声学模型104是解码器102的另一项输入，可以在离线状态下生成。具体的形成方法在本发明方法中已介绍。形成声学模型104的可以是如图9中所示的声学模型训练子模块。

基于类的语言模型105是解码器102的第三项输入，可以在离线状态下生成。具体的形成方法在本发明方法中已介绍。形成基于类的语言模型105的可以是如图8中所示的语言模型训练子模块。

解码器102，基于命名实体标注词典103、声学模型104和基于类的语言模型105，得到音素格和词格两级识别结果，在词格中标注命名实体词汇标注信息，将得到的音素格和词格输出给命名实体检测模块200。这里的命名实体词汇标注信息为命名实体词汇位置和类别信息。

图9为本发明实施例中命名实体检测模块的结构示意图，命名实体检测模块200包括：置信度校验子模块201和新词生成子模块202。

置信度校验子模块201，用于根据解码器102输出的词格和音素格及其起始和终止时间信息，对词格和音素格进行强制对齐，确定识别栅格未对齐、包含命名实体词汇标注信息、且置信测度低于设定阈值的问题区域，在识别结果中突出标注确定出的问题区域中的命名实体词汇，将标注后的识别结果输出给新词生成子模块202。

新词生成子模块202，用于从本地命名实体库中和网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇，形成候选词汇列表输出给显示部件，将标注后的识别结果输出给用户更正模块300和显示部件。

前文中已提到，本发明实施例中的命名实体词汇标注信息为命名实体词汇的位置和属性信息，本发明实施例的装置中进一步包括本地命名实体库更新模块400，进一步用于将所述用户更正模块执行修正后确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间更新到本地命名实体库中。在这种情况下，上述新词生成子模块202进一步用于，在利用本地命名实体库查找所述确定出的命名实体词汇的候选词汇时，根据所述类别、在句子中的位置、出现的频次和每次更新的时间，确定查找出的候选词汇的排列顺序。

图10为本发明实施例中用户更正模块的结构示意图，用户更正模块300包括：第一更正子模块301、第二更正子模块302和第三更正子模块303。

上述第一更正子模块301，用于在用户触发后，使用用户直接从所述候选词汇列表中选择的词汇，修正所述识别错误的命名实体词汇；将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第一更正子模块301负责提供直接从候选词汇列表中选择正确词汇的修正模式，当用户选择这种修正模式后才执行操作。

上述第二更正子模块302，用于在用户触发后，从本地命名实体库和/或网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇，输出给显示部件；使用用户从查找出的候选词汇中选择的词汇，修正所述识别错误的命名实体词汇；将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第二更正子模块302负责提供直接从候选词汇中选择正确词汇的模式，当用户选择这种修正模式后才执行操作。

上述第三更正子模块303，用于在用户触发后，使用用户重新输入的词汇，修正所述识别错误的命名实体词汇；将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第三更正子模块303负责提供用户重新输入词汇的修正模式，当用户选择这种修正模式后才执行操作。当用户通过语音重新输入词汇时，第三更正子模块303进一步用于，触发连续语音识别模块100重新识别输入的语音输入信号、并显示重新识别的识别结果，将用户确认的重新识别的识别结果作为确认的正确词汇。

当用户没有从候选词汇列表中选择出正确词汇，也不想通过上述其他模式进行修正时，用户更正模块300中还可以包括第四更正子模块304，用于在用户触发后，显示所述新词生成子模块202确定出、且未包含在所述候选词汇列表中的更多候选词汇，使用用户从所述更多候选词汇中选择出的词汇，修正所述识别错误的命名实体词汇；将执行修正后确认正确的词汇输出给本地命名实体库更新模块400。这里的第三更正子模块303负责提供后多候选词的修正模式，当用户选择这种修正模式后才执行操作。

图11为本发明中终端的结构示意图，该终端包括：修正语音输入文本中命名实体词汇的装置和显示部件。

上述修正语音输入文本中命名实体词汇的装置，用于识别语音输入信号，得出包括命名实体词汇标注信息的识别结果；根据命名实体词汇标注信息，确定所述识别结果中错误识别的命名实体词汇，在识别结果中突出标注出错误识别的命名实体词汇，并将标注后的识别结果输出给所述显示部件；使用从预设的本地命名实体库和/或网络资源中选择的词汇、或用户重新输入的词汇，修正识别错误的命名实体词汇。

上述显示部件，用于显示修正语音输入文本中命名实体词汇的装置输出的标注后的识别结果。

本发明的终端中的修正语音输入文本中命名实体词汇的装置，其内部结构和各项附加功能可以与前文所述的修正语音输入文本中命名实体词汇的装置相同，这里不再赘述。

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种修正语音输入文本中命名实体词汇的方法，其特征在于，该方法包括：

2.如权利要求1所述的方法，其特征在于，所述步骤A包括：

A1、提取所述语音输入信号的多维度倒谱特征及其差分特征；

A2、基于命名实体标注词典、声学模型和基于类的语言模型，得出包括词格和音素格的识别结果，并在所述词格中标注命名实体词汇标注信息，所述词格和音素格由识别栅格组成，所述命名实体词汇标注信息为命名实体词汇的位置和类别信息。

3.如权利要求2所述的方法，其特征在于，所述步骤B包括：

B1、根据所述词格和音素格及其起始和终止时间信息，对词格和音素格进行强制对齐，查找识别栅格未对齐且包括命名实体词汇的问题区域；

B2、确定置信度低于设定阈值的问题区域；

B3、突出标注确定出的问题区域中的命名实体词汇，显示标注后的识别结果。

4.如权利要求2所述的方法，其特征在于，所述步骤C包括：

C1、从本地命名实体库和/或网络资源中查找所述识别错误的命名实体词汇的候选词汇、形成候选词汇列表并显示；

C2、使用用户直接从所述候选词汇列表中选择的词汇，修正所述识别错误的命名实体词汇；或者，从本地命名实体库和/或网络资源中查找所述识别错误的命名实体词汇的候选词汇并显示，使用用户直接从查找出的候选词汇中选择的词汇，修正所述识别错误的命名实体词汇；或者，使用用户重新输入的词汇，修正所述识别错误的命名实体词汇。

5.如权利要求4所述的方法，其特征在于，所述步骤C1和步骤C2中从本地命名实体库和/或网络资源中查找所述识别错误的命名实体词汇的候选词汇为：

在本地命名实体库中查找时，包括：在本地命名实体库中查找与确定出的命名实体词汇相同类别且发音相似的词汇；

在网络资源中查找时，包括：在网络中的公用数据库查找与确定出的命名实体词汇发音相似的词汇；或者，在网络资源中搜索确定出的命名实体词汇、及在本地命名实体库中查找出的词汇的发音，通过搜索返回率确定词汇；或者，在网络中的设定服务器或服务器组查找与确定出的命名实体词汇发音相似的词汇，所述设定服务器或服务器组定时更新自身内部的命名实体词汇。

6.如权利要求5所述的方法，其特征在于，所述步骤C中进一步包括：

C3、将执行修正后确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间更新到本地命名实体库中；

所述在本地命名实体库中查找时，进一步根据所述类别、在句子中的位置、出现的频次和每次更新的时间，确定查找出的候选词汇的排列顺序。

7.如权利要求4所述的方法，其特征在于，所述步骤C2中进一步包括：显示所述查找出、且未包含在所述候选词汇列表中的更多候选词汇，使用用户从所述更多候选词汇中选择出的词汇，修正所述识别错误的命名实体词汇。

8.如权利要求4所述的方法，其特征在于，所述步骤C2中，用户重新输入的词汇为：用户通过语音重新输入的词汇；

当使用用户重新输入的词汇修正所述识别错误的命名实体词汇时，重新识别输入的语音输入信号，并显示重新识别的识别结果，在用户确认后，将重新识别的识别结果作为确认的正确词汇，在用户重新输入语音时，返回执行重新识别输入的语音输入信号的步骤。

9.一种修正语音输入文本中命名实体词汇的装置，其特征在于，该装置包括：连续语音识别模块、命名实体词汇检测模块和用户更正模块；

10.如权利要求9所述的装置，其特征在于，所述连续语音识别模块包括：特征提取子模块、解码器、命名实体标注词典、声学模型和基于类的语言模型；

所述特征提取子模块，用于从语音输入信号中提取多维度的倒谱特征及其差分特征，输出到所述解码器；

所述解码器，用于基于命名实体标注词典、声学模型和基于类的语言模型，得到音素格和词格两级识别结果，输出给所述命名实体检测模块，所述词格和音素格由识别栅格组成、且词格中包括命名实体词汇标注信息，所述命名实体词汇标注信息为命名实体词汇的位置和类别信息。

11.如权利要求10所述的装置，其特征在于，所述命名实体检测模块包括：置信度校验子模块和新词生成子模块；

所述置信度校验子模块，用于根据所述词格和音素格及其起始和终止时间信息，对词格和音素格进行强制对齐，确定识别栅格未对齐、包括命名实体词汇标注信息、且置信度低于设定阈值的问题区域，突出标注出所述问题区域中的命名实体词汇，并将标注后的识别结果输出给所述新词生成子模块；

所述新词生成子模块，用于从本地命名实体库和/或网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇，形成候选词汇列表输出给显示部件，将标注后的识别结果输出给所述用户更正模块和显示部件。

12.如权利要求11所述的装置，其特征在于，所述装置中进一步包括：本地命名实体库更新模块，用于将所述用户更正模块执行修正后确认的正确词汇及其类别、在句子中的位置、出现的频次和每次更新的时间更新到本地命名实体库中；

所述新词生成子模块进一步用于，在利用本地命名实体库查找所述确定出的命名实体词汇的候选词汇时，根据所述类别、在句子中的位置、出现的频次和每次更新的时间，确定查找出的候选词汇的排列顺序。

13.如权利要求12所述的装置，其特征在于，所述用户更正模块包括：第一更正子模块、第二更正子模块和第三更正子模块；

所述第一更正子模块，用于在用户触发后，使用用户直接从所述候选词汇列表中选择的词汇，修正所述识别错误的命名实体词汇；将执行修正后确认正确的词汇输出给本地命名实体库更新模块；

所述第二更正子模块，用于在用户触发后，从本地命名实体库和/或网络资源中查找确定出的问题区域中的命名实体词汇的候选词汇，输出给显示部件；使用用户从查找出的候选词汇中选择的词汇，修正所述识别错误的命名实体词汇；将执行修正后确认正确的词汇输出给本地命名实体库更新模块；

第三更正子模块，用于在用户触发后，使用用户重新输入的词汇，修正所述识别错误的命名实体词汇；将执行修正后确认正确的词汇输出给本地命名实体库更新模块。

14.如权利要求13所述的装置，其特征在于，所述用户更正模块中进一步包括：第四更正子模块，用于在用户触发后，显示所述新词生成子模块确定出、且未包含在所述候选词汇列表中的更多候选词汇，使用用户从所述更多候选词汇中选择出的词汇，修正所述识别错误的命名实体词汇；将执行修正后确认正确的词汇输出给本地命名实体库更新模块。

15.如权利要求13所述的装置，其特征在于，所述用户重新输入的词汇为：用户通过语音重新输入的词汇；

所述第三更正模块进一步用于，触发所述连续语音识别模块重新识别输入的语音输入信号、并显示重新识别的识别结果，将用户确认的重新识别的识别结果作为确认的正确词汇。

16.一种终端，其特征在于，该终端包括：修正语音输入文本中命名实体词汇的装置和显示部件；

所述显示部件，用于显示所述标注后的识别结果。