CN1356688A

CN1356688A - 语音识别系统、语音识别服务器、语音识别客户机及其控制方法

Info

Publication number: CN1356688A
Application number: CN01139477A
Authority: CN
Inventors: 栉田晃弘; 小坂哲夫
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2000-11-27
Filing date: 2001-11-27
Publication date: 2002-07-03
Anticipated expiration: 2021-11-27
Also published as: JP3581648B2; CN1187733C; JP2002162988A; US20020065652A1; KR20020041296A; US7099824B2; DE60126462D1; EP1209662A2; DE60126462T2; ATE353463T1; EP1209662B1; EP1209662A3; KR100679113B1

Abstract

一种用户字典－它通过彼此对应地存储用户指定的目标识别词的发音和注释而形成、输入语音识别数据、以及用来确定一个识别字典的一个识别字段的字典管理信息－该识别字典被用来识别该语音识别数据,经过一个通信模块而被送到一个服务器。在该服务器中,一个字典管理单元查询一个标识符表,以从多种识别字典中确定与从一个客户机接收的字典管理信息相应的识别字典。一个语音识别模块至少利用该确定的识别字典来识别语音识别数据。识别结果经一个通信模块而被送到该客户机。

Description

语音识别系统、语音识别服务器、语音识别客户机及其控制方法

本发明的领域

本发明涉及用于识别由一个服务器在一个客户机处输入的语音的一种客户机-服务器语音识别系统，一种语音识别服务器，一种语音识别客户机，它们的控制方法，以及一种计算机可读取存储器。

本发明的背景

近年来，语音被用作了除了键盘、鼠标器等之外的一种输入接口。

然而，随着需要得到语音识别的识别词的数目的增大，识别输入语音的语音识别的识别速率降低并要求比较长的处理时间。因此，在一种实际方法中，准备了多个识别字典或词典，它们寄存了将要受到语音识别的识别词(例如发音和注释)，且这些字典或词典有选择地得到使用(多个识别字典可同时使用)。

另外，未寄存的词不能得到识别。作为解决这一问题的一种方法，可采用一种用户字典或词典(由用户准备以寄存要进行语音识别的词)。

另一方面，一种客户机-服务器语音识别系统已经得到了研究，以在具有不足的资源的一个终端上实施语音识别。

这三种技术都是本领域的技术人员所已知的，但把这三种技术结合起来的系统还未被实现。

本发明的概述

本发明就是要解决上述问题，且其目的是提供一种语音识别系统-该系统响应于用户在一个客户机-服务器语音识别系统中的请求而采用一个用户字典以改善语音输入效率并减小在整个系统上的处理负荷，并提供一种语音识别服务器、一种语音识别客户机、它们的控制方法、以及一种计算机可读取存储器。

根据本发明，前述目的是通过提供用于识别由一个服务器在一个客户机处输入的语音的一种客户机-服务器语音识别系统而实现的，

该客户机包括：

语音输入装置，用于输入语音；

用户字典保持装置，用于保持通过寄存由一个用户指定的目标识别词而保持一个用户字典；以及

发送装置，用于向该服务器发送所述语音输入装置输入的语音数据、用于确定用来识别该语音数据的一个识别字段的字典管理信息、以及该用户字典，且

该服务器包括：

识别字典保持装置，用于保持为各识别字段准备的多种识别字典；

确定装置，用于从该多种识别字典中确定与从客户机接收的字典管理信息相应的一或多个识别字典；以及

识别装置，用于至少利用由所述确定装置确定的识别字典来识别语音数据。

从以下结合附图进行的描述，本发明的其他特征和优点将变得显而易见。在附图中相同的标号表示了相同或类似的部分。

附图的简要描述

图1是显示第一实施例的语音识别系统的硬件设置的框图；

图2是显示第一实施例的语音识别系统的功能设置的框图；

图3显示了第一实施例的用户字典的配置；

图4显示了第一实施例的一个语音输入窗口；

图5显示了第一实施例的一个标识符表；

图6是显示第一实施例的语音识别系统所执行的处理的流程图；

图7显示了根据第三实施例的附有输入表标识符的一个用户字典；且

图8显示了根据第三实施例的附有识别字典标识符的一个用户字典。

最佳实施例的描述

以下结合附图描述本发明的最佳实施例。(第一实施例)

图1显示了第一实施例的一种语音识别系统的硬件设置。

一个CPU100对整个客户机100进行系统控制。CPU101把存储在一个ROM102中的程序装载到一个RAM103中，并根据装载的程序执行各种处理。ROM102存储将要由CPU101执行的各种处理程序。RAM103提供了执行存储在ROM102中的各种程序所需的存储区。

一个次级存储设备104存储有一种OS和各种程序。当客户机100不是利用诸如个人计算机等的通用设备而是利用一种专用设备实现时，ROM102可存储OS和各种程序。通过把存储的程序装载到RAM103上，CPU101能够执行处理。作为次级存储设备104，可以采用硬盘设备、软盘驱动器、CD-ROM等。即，存储介质不受具体的限制。

一种网络I/F(接口)105与服务器200的一个网络I/F205相连。

一个输入装置106包括鼠标器、键盘、麦克风等，以便能够向CPU101所执行的处理输入各种指令，并能够被用来同时连接该多个装置。一个输出装置107包括显示器(CRT、LCD等)，并显示输入装置106输入的信息，并包括受到CPU101执行的各种处理所控制的窗口。一条总线108把客户机100的各种组成部分相互连接。

一个CPU201对整个服务器200进行系统控制。CPU201把存储在一个ROM202上的程序装载到一个RAM203中，并根据装载的程序执行各种处理。ROM202存储将要由CPU201执行的处理的各种程序。RAM203提供了执行存储在ROM202中的各种程序所需的存储区。

一个次级存储设备204存储一个OS和各种程序。当服务器200不是利用诸如一个个人计算机等的通用设备而是利用一个专用设备而实施时，ROM202可存储该OS和各种程序。通过把存储的程序装载到RAM203上，CPU201能够执行处理。作为次级存储设备204，可采用硬盘设备、软盘驱动器、CD-ROM等。即存储介质不受具体的限制。

网络I/F 205与客户机100的网络I/F 105相连。一条总线206把服务器200的各种组成部分相互连接。

以下结合图2描述第一实施例的语音识别系统的功能设置。

图2是显示第一实施例的语音识别系统的功能设置的框图。

在客户机100中，一个语音输入模块121输入用户经过一个麦克风(输入装置106)而发出的语音，并对输入的、将要受到语音识别的语音数据(语音识别数据)进行A/D转换一个通信模块122把一个用户字典124a、语音识别数据124b、字典管理信息124c等送到服务器200。另外，通信模块122接收来自服务器200的发送语音识别数据124b的语音识别结果等。

一个显示模块123显示从服务器200接收的语音识别结果，并同时将其存储在例如一个输入表中，该输入表被由本实施例的语音识别系统所执行的处理显示在输出装置107上。

在服务器200中，一个通信模块221接收来自客户机100的用户字典124a、语音识别数据124b、字典管理信息124c等。另外，通信模块221把语音识别数据124b的语音识别结果等送到客户机100。

一个字典管理模块223切换并选择为各识别字段(例如为名称、地址、字母符号等)准备的多种识别字典225(识别字典1至识别字典N，N是一个正整数)，且从客户机100接收的用户字典124a可同时利用多种字典。

注意，为从客户机100送来的各种字典管理信息124c(输入表标识符-将要在后面描述)准备了多种识别字典225。各识别字典225都附有表示该识别字典的识别字段的识别字典标识符。字典管理模块223对存储有彼此对应的这些识别字典标识符和输入表标识符的一种标识符表223a进行管理，如图5所示。

一个语音识别模块224，利用字典管理模块223根据语音识别数据和从客户机100接收的字典管理信息124c而为语音识别指定的识别字典225和用户字典124a，执行语音识别。

注意用户字典124a是由用户准备的，以寄存将要受到语音识别的识别词，并存储将要被识别的词的彼此对应的发音和注释，如例如图3所示。

语音识别数据124b可以是语音输入模块121所A/D转换的语音数据或通过对该语音数据进行编码所获得的数据。

字典管理信息124c表明了一个输入对象等。例如，当服务器200识别输入语音并把与该语音识别结果对应的文本数据输入到各个输入表(该各个输入表定义了由第一实施例的语音识别系统所显示的一个语音输入窗口，如图4所示)中时，字典管理信息124c是表示输入表的类型的一个标识符(输入表标识符)。客户机100把这种输入表标识符送到服务器200，作为字典管理信息124c。在服务器200中，字典管理模块223对标识符表223a进行查询，以获得与该接收的输入表标识符相应的一个识别字典标识符，并确定在语音识别中将要采用的一个识别字典225。

以下利用图6说明第一实施例的语音识别系统所执行的处理。

图6是显示第一实施例的语音识别系统所执行的处理的流程图。

在步骤S101，客户机100把用户字典124a送到服务器200。

在步骤S201，服务器200从客户机100接收用户字典124a。

在步骤S102，当语音作为一种目标语音输入而被输入到一个输入表时，客户机100把该输入表的输入表标识符作为字典管理信息124c而送到服务器200。

在步骤S202，服务器200接收来自客户机100的该输入表标识符，作为字典管理信息124c。

在步骤S203，服务器200利用该字典管理信息124c对标识符表223a进行查询，以获得与所接收的输入表标识符相应的识别字典标识符，并确定将要在语音识别中采用的一个识别字典225。

在步骤S103，客户机100把作为将要输入到各个输入表的文本数据而语音输入的语音识别数据124b送到服务器200。

在步骤S204，服务器200接收来自客户机100的彼此相应的语音识别数据。

在步骤S205，服务器200，利用字典管理模块223为语音识别指定的用户字典124a和识别字典225，执行语音识别模块224中的语音识别数据124b的语音识别。

在该第一实施例中，包含在从客户机100送到服务器200的用户字典124a中的所有识别词都被用于语音识别模块224进行的语音识别中。

在步骤S206，服务器200把语音识别模块224获得的语音识别结果送到客户机100。

在步骤S104，客户机100接收来自服务器200的与各个输入表相应的语音识别结果，并把与该语音识别结果相应的文本数据存储在相应的输入表中。

客户机100在步骤S105检查该处理是否完成。如果该处理未结束(步骤S105为“否”)，流程返回到步骤S102以重复该处理。另一方面，如果处理将要结束(步骤S105为“是”)，客户机100向服务器200通知处理的结束，并结束处理。

在步骤S207检查是否探测到了来自客户机100的一个处理结束指令。如果未探测到处理结束指令(步骤S207为“否”)，流程返回到步骤S202以重复上述处理。另一方面，如果已经探测到了处理结束指令(步骤S207为“是”)，处理结束。

在上述处理中，当语音作为一种目标语音输入而被输入到一个输入表时，与该输入表对应的字典管理信息124c被从客户机100送到服务器200。或者，当作为目标语音输入的输入表被来自输入装置106的一个指令所注意(作为一个目标语音输入的该输入表得到确定)时，该字典管理信息124c可得到发送。

在服务器200中，语音识别是在所有语音识别数据124b得到接收之后进行的。或者，每当语音作为文本数据而被输入到一个给定的输入表时，语音识别数据124b的该部分可以一帧一帧地被送到服务器200(例如，一帧是10毫秒的语音数据)，且语音识别能够实时进行。

如上所述，根据第一实施例，在该客户机-服务器语音识别系统中，由于服务器200利用一个适当的识别字典225和用户字典124a而执行语音识别数据124b的语音识别，服务器200中的语音识别精度能够得到改善，同时减小了处理负荷和对客户机100中与语音识别相关的存储资源的使用。(第二实施例)

在第一实施例中，如果没有将要存储到用户字典124a中的识别词得到产生，由于用户字典124a不需要得到使用，只有当从客户机100接收到用户字典124a的一个使用请求时，服务器200在识别中可使用用户字典124a中的所有识别词。

在此情况下，表示用户字典124a是否被使用的一个标记作为字典管理信息124c而被加上，从而通知服务器200用户字典124a是否得到使用。(第三实施例)

由于用户字典124a中的某些目标识别词根据输入对象、情况等而不被使用，只有在用户字典124a中的特定的识别词可根据输入对象和情况而在识别中得到使用。

在这样的情况下，当用户字典通过为相应的识别词指定输入表标识符而得到管理时，如图7所示，只有具有在语音输入中得到使用的输入表的输入表标识符的识别词能够在识别中得到采用。或者，可以为一个给定的识别词指定多个输入表标识符。另外，用户字典可通过指定代替输入表标识符的识别字典标识符而得到管理，如图8所示。(第四实施例)

通过结合第二和第三实施例，语音识别模块224的语音识别处理的效率能够得到进一步的改善。(第五实施例)

本发明的设备的多数处理可通过程序而得到实施。如上所述，由于该设备可采用诸如个人计算机的通用设备，本发明也可通过向一种系统或设备提供把能够实施上述实施例的功能的一种软件程序的程序码并由该系统或设备的一个计算机读出和执行存储在该存储介质中的该程序码，而得到实现。在此情况下，从存储介质读出的该程序码本身实施了上述实施例的功能，且该存储该程序码的存储介质构成了本发明。作为用于提供该程序码的存储介质，可采用例如一个软盘、一个硬盘、光盘、磁-光盘、CD-ROM、磁带、非易失存储卡、ROM、等等。

本发明还可通过向一个计算机提供记录该程序码的该存储介质并执行由在该计算机上运行的一种OS的某些或全部实际处理，而得到实现。进一步地，上述实施例的功能，可由设置在一种功能扩展板或一种功能扩展单元上的一个CPU等所执行的某些或全部实际处理操作，来进行实施，该功能扩展板或功能扩展单元在从该存储介质读出的程序码被写入到该功能扩展板或单元的一个存储器中之后被插入或连接到该计算机。当本发明被应用于该存储介质时，该存储介质存储了与图3所示的流程图相应的程序码。

由于在不脱离本发明的精神和范围的前提下可以实现很多非常不同实施例，因而应该理解的是本发明不限于这些具体的实施例，而只由所附权利要求书来限定。

Claims

1.一种客户机-服务器语音识别系统，用于识别一个服务器在一个客户机的语音输入，

该客户机包括：

语音输入装置，用于输入语音；

用户字典保持装置，用于保持通过寄存由用户指定的目标识别词而形成的一个用户字典；以及

发送装置，用于把由所述语音输入装置输入的语音数据、用于确定一个识别字典-该识别字典被用来识别该语音数据-的一个识别字段的字典管理信息、以及该用户字典发送进行该服务器，且

该服务器包括：

确定装置，用于从该多种识别字典确定与从该客户机接收的该字典管理信息相应的一或多个识别字典；以及

识别装置，用于至少利用所述确定装置确定的识别字典来识别该语音数据。

2.根据权利要求1的系统，其中所述识别装置利用所述确定装置确定的识别字典和从客户机接收的该用户字典来识别该语音数据。

3.根据权利要求1的系统，其中所述语音输入装置包括用于显示作为目标语音输入的一种输入表的显示装置，且

该字典管理信息是表示该输入表的类型的一种输入表标识符。

4.根据权利要求1的系统，其中该字典管理信息包含表示该用户字典是否被用在语音数据的识别中的信息。

5.根据权利要求1的系统，其中该用户字典是通过彼此对应地存储目标识别词的发音和注释而形成的。

6.根据权利要求3的系统，其中该用户字典是通过还彼此对应地存储至少一个输入表标识符和目标识别词而形成的。

7.根据权利要求1的系统，其中该用户字典是通过还存储表示该多种识别字典的识别字段的至少一个识别字典标识符和该目标识别词而形成的。

8.根据权利要求1的系统，其中该语音数据是通过对那种语音数据进行编码而获得的数据

9.用于识别由一个服务器在一个客户机输入的语音的一种客户机-服务器语音识别系统的控制方法，包括：

一个语音输入步骤，用于输入语音；

一个用户字典保持步骤，用于在该客户机中保持一个用户字典，该用户字典是通过寄存由一个用户指定的目标识别词而形成的；以及

一个发送步骤，用于把在该语音输入步骤输入的语音数据、字典管理信息-该信息用于确定用来识别语音数据的一个识别字典的一个识别字段、以及该用户字典发送给该服务器；

一个识别字典保持步骤，用于在该服务器中保持为各个识别字段准备的多种识别字典；

一个确定步骤，用于从该多种识别字典确定与从客户机接收的该字典管理信息相应的一或多个识别字典；以及

一个识别步骤，用于至少利用在该确定步骤中确定的识别字典来识别该语音数据。

10.根据权利要求9的方法，其中该识别步骤包括利用在确定步骤中确定的识别字典和从客户机接收的该用户字典来识别该语音数据的一个步骤。

11.根据权利要求9的方法，其中该语音输入步骤包括用于显示作为一种目标语音输入的一种输入表的一个显示步骤，且

该字典管理信息是表示输入表的类型的一种输入表标识符。

12.根据权利要求9的方法，其中该字典管理信息包含表示该用户字典是否被用作语音数据的识别中的信息。

13.根据权利要求9的方法，其中该用户字典是通过彼此对应地存储目标识别词的发音和注释而形成的。

14.根据权利要求11的方法，其中该用户字典是通过还彼此对应地存储至少输入表标识符和目标识别词而形成的。

15.根据权利要求9的方法，其中该用户字典是通过还存储表示该多种识别字典的识别字段的至少一个识别字典标识符和该目标识别词而形成的。

16.根据权利要求9的方法，其中该语音数据是通过对那种语音数据进行进行编码而获得的数据。

17.一种计算机可读取存储器，它存储有一种程序码，该程序码用于控制用于识别一个服务器在一个客户机输入的语音的一种客户机-服务器语音识别系统，包括：

一个语音输入步骤的程序码，该语音输入步骤用于输入语音；

一个用户字典保持步骤的程序码，该用户字典保持步骤用于在该客户机中保持一个用户字典，该用户字典是通过寄存由一个用户指定的目标识别词而形成的；以及

一个发送步骤的程序码，该发送步骤用于把在该语音输入步骤输入的语音数据、字典管理信息-该信息用于确定用来识别语音数据的一个识别字典的一个识别字段、以及该用户字典发送给该服务器；

一个识别字典保持步骤的程序码，该识别字典保持步骤用于在该服务器中保持为各个识别字段准备的多种识别字典；

一个确定步骤的程序码，该确定步骤用于从该多种识别字典确定与从客户机接收的该字典管理信息相应的一或多个识别字典；以及

一个识别步骤的程序码，该识别步骤用于至少利用在该确定步骤中确定的识别字典来识别该语音数据。

18.一种语音识别服务器，用于识别在一个客户机的语音输入并把一种识别结果送到该客户机，包括：

接收装置，用于从该客户机接收语音数据、用来确定一个识别字典的一个识别字段的字典管理信息-该识别字典用于识别该语音数据、以及通过寄存用户指定的目标识别词而形成的一个用户字典；

确定装置，用于从该多种识别字典中确定与从该客户机接收的该字典管理信息相应的一或多个识别字典；以及

识别装置，用于至少利用所述确定装置确定的该识别字典来识别该语音数据。

19.根据权利要求18的服务器，其中所述识别装置利用所述确定装置确定的识别字典和从客户机接收的用户字典对语音数据进行识别。

20.根据权利要求18的服务器，其中该语音数据是通过对那种语音数据进行编码而获得的数据。

21.一种语音识别客户机，用于把输入的所要识别的语音送到一个服务器，并接收那种语音的一个识别结果，包括：

语音输入装置，用于输入语音；

用户字典保持装置，用于保持通过对用户指定的目标识别词进行寄存而形成的一个用户字典；以及

发送装置，用于把所述语音输入装置输入的语音数据、用于确定一个识别字典的一个识别字段的字典管理信息-该识别字典被用来识别该语音数据、以及该用户字典发送给该服务器。

22.根据权利要求21的客户机，其中所述语音输入装置包括用于显示作为一个目标语音输入的一个输入表的显示装置，且

该字典管理信息是表示输入表的一个类型的一种输入表标识符。

23.根据权利要求21的客户机，其中该字典管理信息包含表示该用户字典是否被用在该语音数据的识别中的信息。

24.根据权利要求21的客户机，其中该用户字典是通过彼此对应地存储目标识别词的发音和注释而形成的。

25.根据权利要求22的客户机，其中该用户字典是通过还彼此对应地存储至少一个输入表标识符和目标识别词而形成的。

26.根据权利要求21的客户机，其中该用户字典是通过还存储至少一个包括该多种识别字典的识别字典标识符和该目标识别词而形成的。

27.根据权利要求21的客户机，其中该语音数据是通过对那种语音数据进行编码而获得的数据。

28.用于识别在一个客户机的语音输入并把一个识别结果发送到一个客户机的一种语音识别服务器的一种控制方法，包括：

一个接收步骤，用于从该客户机接收语音数据、用于确定一个识别字典的一个识别字段的字典管理信息-该识别字典被用来识别该语音数据、以及通过寄存用户指定的目标识别词而形成的一个用户字典；

一个识别字典保持步骤，用于保持为各识别字段准备的多种识别字典；

一个确定步骤，用于从该多种识别字典确定与从该客户机接收的该字典管理信息相应的一或多个识别字典；以及

29.根据权利要求28的方法，其中该识别步骤包括利用在该确定步骤中确定的该识别字典和从该客户机接收的用户字典对该语音数据进行识别的步骤。

30.根据权利要求1的方法，其中该语音数据是通过对那种语音数据进行编码而获得的数据。

31.用于把所要识别的输入语音送到一个服务器并接收该语音的识别结果的一种语音识别客户机的一种控制方法，包括：

一个语音输入步骤，用于输入语音；

一个用户字典保持步骤，用于保持通过对用户指定的目标识别词进行寄存而形成的一个用户字典；以及

一个发送步骤，用于把在该语音输入步骤输入的语音数据、用于确定一个识别字典的一个识别字段的字典管理信息-该识别字典被用来识别该语音数据、以及该用户字典发送到该服务器。

32.根据权利要求31的方法，其中该语音输入步骤包括显示作为一个目标语音输入的一个输入表的一个显示步骤，且

该字典管理信息是表示输入表的类型的一个输入表标识符。

33.根据权利要求31的方法，其中该字典管理信息包含表示该用户字典是否被用在该语音数据的识别中的信息。

34.根据权利要求31的方法，其中该用户字典是通过彼此对应地存储目标识别词的发音和注释而形成的。

35.根据权利要求32的方法，其中该用户字典是通过还彼此对应地存储至少一个输入表标识符和目标识别词而形成的。

36.根据权利要求31的方法，其中该用户字典是通过还存储表示该多种识别字典的识别字段的至少一个识别字典标识符和该目标识别词而形成的。

37.根据权利要求31的方法，其中该语音数据是通过对那种语音数据进行编码而获得的数据。

38.一种计算机可读取存储器，它存储用于识别在一个客户机输入的语音并把一个识别结果送到该客户机的一个语音识别服务器的控制的程序码，包括：

一种接收步骤的程序码，该识别步骤用于从该客户机接收语音数据、用于确定一个识别字典的一个识别字段的字典管理信息-该识别字典被用来识别该语音数据、以及通过寄存一个用户指定的目标识别词而形成的一个用户字典；

一个识别字典保持步骤的程序码，该识别字典保持步骤用于保持为各识别字段而准备的多种识别字典；

一个确定步骤的程序码，该确定步骤用于从该多种识别字典确定与从该客户机接收的字典管理信息相应的一或多个识别字典；以及

一个识别步骤的程序码，该识别步骤用于至少利用在该确定步骤确定的识别字典来识别该语音数据。

39.一种计算机可读取存储器，它存储一个语音识别客户机的控制的程序码，该语音识别客户机用于把所要识别的输入语音送到一个服务器并接收该速度的识别结果，包括：

一个识别字典保持步骤的程序码，该用户字典保持步骤用于保持通过对用户指定的目标识别词进行寄存而形成的一个用户字典；以及

一个发送步骤的程序码，该发送步骤用于把在语音输入步骤输入的语音数据、用于确定一个识别字典的一个识别字段的字典管理信息-该识别字典被用来识别该语音数据、以及该用户字典发送到该服务器。

40.用于识别由一个服务器在一个客户机输入的语音的一种客户机-服务器语音识别系统，

该客户机包括：

一个语音输入装置，用于输入语音；

一个用户字典保持装置，用于保持通过对用户指定的目标识别词进行寄存而形成的一个用户字典；以及

一个发送器，用于把所述语音输入装置输入的语音数据、用于确定一个识别字典的一个识别字段的字典管理信息-该识别字典被用来识别该语音数据、以及该用户字典送到该服务器，以及

一个服务器，包括：

一个识别字典保持单元，用于保持为各识别字段准备的多种识别字典；

一个确定单元，用于从该多种识别字典中确定与从该客户机接收的字典管理信息相应的一或多个识别字典；以及

一个识别单元，用于至少利用所述确定单元确定的识别字典来识别该语音数据。

41.用于识别在一个客户机输入的语音并把识别结果送到该客户机的一种语音识别服务器，包括：

一个接收器，用于从该客户机接收语音数据、用于确定一个识别字典的一个识别字段的字典管理信息-该识别字典被用来识别该语音数据、以及通过对用户指定的目标识别词进行寄存而形成的一个用户字典；

一个识别字典保持单元，用于保持为各个识别字段准备的多种识别字典；

一个确定单元，用于从该多种识别字典确定与从该客户机接收的字典管理信息相应的一或多个识别字典；以及

一个识别单元，用于至少利用所述确定单元确定的识别字典而识别该语音数据。

42.一种语音识别客户机，用于把所要识别的输入语音送到一个服务器并接收该语音的识别结果，包括：

一个语音输入单元，用于输入语音；

一个用户字典保持单元，用于保持通过对用户指定的目标识别词进行寄存而形成的一个用户字典；以及

一个发送器，用于把所述语音输入装置输入的语音数据、用来确定一个识别字典的一个识别字段的字典管理信息-该识别字典被用来识别该语音数据、以及该用户字典发送到该服务器。