CN114222028A

CN114222028A - 语音识别方法、装置、计算机设备和存储介质

Info

Publication number: CN114222028A
Application number: CN202111501470.2A
Authority: CN
Inventors: 赵新阳; 范会善; 王炼; 罗贤桂; 贺文明; 黄振光; 赵华; 炊向军; 董劲麟
Original assignee: China Construction Bank Corp
Current assignee: China Construction Bank Corp
Priority date: 2021-12-09
Filing date: 2021-12-09
Publication date: 2022-03-22

Abstract

本申请涉及语音识别方法、装置、计算机设备和存储介质。所述方法包括：接收呼叫请求，根据所述呼叫请求确定业务类型；确定所述业务类型对应的多个候选语音识别引擎，并基于所述多个候选语音识别引擎的负载信息，确定目标语音识别引擎；基于所述呼叫请求获取语音流，并将所述语音流发送至所述目标语音识别引擎，以便于所述目标语音识别引擎识别所述语音流，得到识别结果。采用本方法，在多种业务场景，都可以快速得到准确的语音识别结果。

Description

语音识别方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能语音识别技术领域，特别是涉及语音识别方法、装置、计算机设备和存储介质。

背景技术

呼叫中心是企业对外服务的统一平台，近年来，随着智能语音识别技术的发展，呼叫中心也引入了语音识别技术，通过语音识别提高了整体的服务质量和服务效率。

企业提供的业务类型繁多，但是目前的语音识别方法，通常为每个话务台均配置通用的语音识别系统，没有区分不同的业务场景，所有业务场景下的语音流均采用通用的语音识别系统处理，导致一些业务场景无法得到准确的语音识别结果。

发明内容

基于此，有必要针对上述技术问题，提供在多种业务场景，都可以快速得到准确的语音识别结果的语音识别方法、装置、计算机设备和存储介质。

第一方面，本申请提供了一种语音识别方法。所述方法包括：

接收呼叫请求，根据所述呼叫请求确定业务类型；

确定所述业务类型对应的多个候选语音识别引擎，并基于所述多个候选语音识别引擎的负载信息，确定目标语音识别引擎；

基于所述呼叫请求获取语音流，并将所述语音流发送至所述目标语音识别引擎，以便于所述目标语音识别引擎识别所述语音流，得到识别结果。

在其中一个实施例中，所述呼叫请求为呼入请求，所述根据所述呼叫请求确定业务类型，包括：

根据所述呼入请求发送若干操作提示，并接收所述若干操作提示对应的若干业务编码；

获取所述呼入请求携带的接入码，并根据所述接入码和所述若干业务编码确定业务类型。

所述呼叫请求为呼出请求；所述根据所述呼叫请求确定业务类型，包括：

获取所述呼出请求携带的业务接入码，根据所述业务接入码确定业务类型。

在其中一个实施例中，所述负载信息包括：CPU空闲率、语音通道数阈值，以及当前语音通道数。

在其中一个实施例中，所述根据所述多个候选语音识别引擎的负载信息，确定目标语音识别引擎，包括：

根据每个候选语音识别引擎的语音通道数阈值和当前语音通道数，确定若干参考语音识别引擎；

在所述若干参考语音识别引擎中确定CPU空闲率最大的目标语音识别引擎。

在其中一个实施例中，所述业务类型为：语音导航-理财类型，或者语音导航-储蓄类型，或者语音转写-理财类型，或者语音转写-储蓄类型；

所述语音导航-理财类型对应的多个候选语音识别引擎，用于提取所述语音流中理财类型的关键字，所述语音导航-储蓄类型对应的多个候选语音识别引擎，用于提取所述语音流中储蓄类型的关键字；所述语音转写-理财类型对应的多个候选语音识别引擎，用于将所述语音流转换为理财类型的文本信息；所述语音转写-储蓄类型对应的多个候选语音识别引擎，用于将所述语音流转换为储蓄类型的文本信息。

第二方面，本申请还提供了一种语音识别装置。所述装置包括：

业务类型确定模块，用于接收呼叫请求，根据所述呼叫请求确定业务类型；

目标语音识别引擎确定模块，用于确定所述业务类型对应的多个候选语音识别引擎，并基于所述多个候选语音识别引擎的负载信息，确定目标语音识别引擎；

语音识别模块，用于基于所述呼叫请求获取语音流，并将所述语音流发送至所述目标语音识别引擎，以便于所述目标语音识别引擎识别所述语音流，得到识别结果。

在其中一个实施例中，所述呼叫请求为呼入请求；所述业务类型确定模块，包括：

第一单元，用于根据所述呼入请求发送若干操作提示，并接收所述若干操作提示对应的若干业务编码；

第二单元，用于获取所述呼入请求携带的接入码，并根据所述接入码和所述若干业务编码确定业务类型。

在其中一个实施例中，所述呼叫请求为呼出请求；所述业务类型确定模块，包括：

第三单元，用于获取所述呼出请求携带的业务接入码，根据所述业务接入码确定业务类型。

在其中一个实施例中，所述负载信息包括：CPU空闲率、语音通道数阈值，以及当前语音通道数，所述目标语音识别引擎确定模块包括：

参考语音识别引擎确定单元，用于根据每个候选语音识别引擎的语音通道数阈值和当前语音通道数，确定若干参考语音识别引擎；

目标语音识别引擎确定单元，用于在所述若干参考语音识别引擎中确定CPU空闲率最大的目标语音识别引擎。

第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

接收呼叫请求，根据所述呼叫请求确定业务类型；

第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

接收呼叫请求，根据所述呼叫请求确定业务类型；

第五方面，本申请还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

接收呼叫请求，根据所述呼叫请求确定业务类型；

上述语音识别方法、装置、计算机设备、存储介质和计算机程序产品，根据呼叫请求确定业务类型，根据业务类型确定多个候选语音识别引擎，并基于多个候选语音识别引擎的负载信息，确定目标语音识别引擎，将语音流发送至目标语音识别引擎，得到识别结果。根据业务类型对应的目标语音识别模型，对业务类型对应的语音流进行识别，可以得到更准确的识别结果，考虑到负载均衡，目标语音识别引擎是综合考虑CPU空闲率和语音通道数，在多个候选语音识别引擎中确定得到的，采用目标语音识别引擎处理呼叫请求的语音流，避免了等待语音流传输、处理速度慢的问题，可以更快速得到识别结果，减少了语音识别的处理时长，提高了实时性。

附图说明

图1为一个实施例中语音识别方法的应用环境图；

图2为一个实施例中语音识别方法的流程示意图；

图3为一个实施例中，确定业务类型的流程示意图；

图4为一个实施例中，确定目标语音识别引擎的流程示意图；

图5为一个实施例中语音识别装置的结构框图；

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例提供的语音识别方法，可以应用于如图1所示的应用环境中。其中，用户端102发送呼叫请求到呼叫中心104，通过呼叫中心104建立用户端102与话务台106之间的通信，呼叫中心104确定目标语音识别引擎108，并将语音流同步至目标语音识别引擎108，目标语音识别引擎108识别语音流得到识别结果。其中，用户端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备；呼叫中心104可以用独立的服务器或者是多个服务器组成的服务器集群来实现；目标语音识别引擎108可以是终端或者服务器。

在一个实施例中，如图2所示，提供了一种语音识别方法，以该方法应用于图1中的呼叫中心为例进行说明，包括以下步骤：

S101，接收呼叫请求，根据所述呼叫请求确定业务类型。

其中，所述呼叫请求可以由用户端发起，此类呼叫请求称为呼入请求，所述呼叫请求也可以由话务台发起，此类呼叫请求称为呼出请求。所述业务类型用于反映用户端和话务台通信所涉及的业务的类型。

具体地，在呼叫请求为呼入请求时，呼叫中心接收到用户端发送的呼入请求，根据呼入请求获取接入码，并接收用户端发送的若干业务编码，建立用户端与话务台之间的通信，并根据接入码和若干业务编码确定业务类型；在呼叫请求为呼出请求时，话务台发送呼出请求到呼叫中心，呼叫中心根据呼出请求，建立用户端与话务台之间的通信；呼出请求中携带有业务接入码，根据业务接入码确定业务类型。

S102，确定所述业务类型对应的多个候选语音识别引擎，并基于所述多个候选语音识别引擎的负载信息，确定目标语音识别引擎。

其中，多个候选语音识别引擎用于处理所述业务类型对应的语音识别任务。所述目标语音识别引擎是所述多个候选语音识别引擎中的一个，所述负载信息用于反映候选语音识别引擎当前处理语音识别任务，所占用负载的情况。

具体地，预先设置用于处理不同业务类型的语音识别任务的多个语音识别引擎，根据所述业务类型，从多个语音识别引擎中，确定所述业务类型对应的多个候选语音识别引擎。

在一种实现方式中，预先设置多个语音识别引擎，按照每个语音识别引擎处理的业务类型，将多个语音识别引擎划分为多个语音识别引擎集合；在多个语音识别引擎集合中确定所述业务类型对应的候选语音识别引擎集合，将候选语音识别引擎集合中的多个语音识别引擎，作为多个候选语音识别引擎。

获取每个候选语音识别引擎的负载信息，按照负载均衡的原则，确定目标语音识别引擎。

S103，基于所述呼叫请求获取语音流，并将所述语音流发送至所述目标语音识别引擎，以便于所述目标语音识别引擎识别所述语音流，得到识别结果。

具体地，所述语音流是用户端和话务台通信产生的。在确定目标语音识别引擎后，将语音流同步发送至目标语音识别引擎，也就是说，所述目标语音识别引擎，用于接收实时的语音流，并且得到实时的识别结果。目标语音识别引擎将识别结果发送给话务台，以便于话务台根据识别结果做出回复，同时，目标语音识别引擎也可以将识别结果发送到呼叫中心，呼叫中心可以存储识别结果，以便于后续分析。

上述语音识别方法中，根据呼叫请求确定业务类型，根据业务类型确定多个候选语音识别引擎，并基于多个候选语音识别引擎的负载信息，确定目标语音识别引擎，将语音流发送至目标语音识别引擎，得到识别结果。根据业务类型对应的目标语音识别模型，对业务类型对应的语音流进行识别，可以得到更准确的识别结果，考虑到负载均衡，目标语音识别引擎是综合考虑CPU空闲率和语音通道数，在多个候选语音识别引擎中确定得到的，采用目标语音识别引擎处理呼叫请求的语音流，避免了等待语音流传输、处理速度慢的问题，可以更快速得到识别结果，减少了语音识别的处理时长，提高了实时性。

在一个实施例中，所述呼叫请求为呼入请求，S101包括：

S111A、根据所述呼入请求发送若干操作提示，并接收所述若干操作提示对应的若干业务编码。

具体地，呼叫中心根据呼入请求，发出操作提示，所述操作提示用于指引用户查询业务；用户端根据操作提示发送业务编码，呼叫中心根据接收的业务编码再次发送操作提示；呼叫中心发出操作提示，用户端根据操作提示发送业务编码，这样的过程可能会执行多次，直至建立话务台和用户端的语音通道。

接收到接入话务台的编码，则建立话务台和用户端的语音通道，也就是说，所述若干业务编码包括：接入话务台的编码，并且所述接入话务台的编码所述若干业务编码中的最后一个编码。

S112A、获取所述呼入请求携带的接入码，并根据所述接入码和所述若干业务编码确定业务类型。

具体地，用户端拨打接入码，以发送呼入请求到呼叫中心，因此，所述呼入请求携带有接入码。呼叫中心根据用户端拨打的接入码，以及发送的若干业务编码得到一个完整的业务类型编码，根据业务类型编码确定业务类型。

呼叫中心预设有多个业务类型编码，多个业务类型编码包括：根据多种接入码，以及多种业务编码得到的多个组合；每个业务类型编码均有其对应的业务类型。

例如，参见图3，用户端拨打呼叫中心的接入码95***，以发送呼入请求到呼叫中心，呼叫中心根据所述呼入请求发出操作提示，用户端例如，呼叫中心发出的操作提示为：查询余额请输入1，办理理财业务请输入2，人工服务请输入0；用户端发送业务编码为：2；呼叫中心发出的操作提示为：查询您名下的理财业务请输入1，查询理财业务种类请输入2，人工服务请输入0；用户端发送业务编码为：2；呼叫中心发送操作提示为：理财业务种类有：***、***、***，人工服务请输入0，用户端发送业务编码为：0，则呼叫中心接收的若干业务编码为：2、2和0，其中，0为接入话务台的编码，接收的接入码为：95***，得到业务类型编码为：95***-2-2-0，呼叫中心根据95***-2-2-0确定业务类型。

呼叫中心接收呼入请求后，确定随路数据，所述随路数据包括：业务类型编码(包括接入码和若干业务编码)、用户端的第一号码和会话标识。所述第一号码可以唯一标识用户端，所述会话标识是此次会话的唯一标识。在用户端接入呼叫中心后，则为此次接入分配会话标识。

在呼叫中心接收到接入话务台的业务类型编码后，获取话务台的第二号码，将话务台的第二号码加入所述随路数据中，所述第二号码可以唯一标识话务台。呼叫中心将随路数据、语音流、目标语音识别引擎和识别结果关联保存，以便于后续分析。

本实施例中，说明了呼叫请求为呼入请求时，确定业务类型的过程；呼叫请求为呼入请求时，获取用户端发送的接入码和若干业务编码，根据接入码和若干业务编码确定业务类型。

在一个实施例中，所述呼叫请求为呼出请求，S101包括：

S111B，获取所述呼出请求携带的业务接入码，根据所述业务接入码确定业务类型。

具体地，所述呼出请求携带有随路数据，所述随路数据包括：业务接入码、用户端的第一号码、话务台的第二号码和会话标识，所述呼出请求携带的业务接入码，用于反映所述话务台想要与用户端沟通的业务，所述业务接入码可以为字符串形式。在一种实现方式中，呼叫中心通过媒体资源控制协议(Media Resource Control Protocol,MRCP)扩展呼叫请求，传递随路数据。

呼叫中心预设有多个业务接入码，以及多个业务接入码与业务类型的对应关系；呼叫中心接收话务台发送的呼出请求，呼叫中心接收到呼出请求携带的业务接入码后，根据业务接入码确定业务类型。

接下来介绍确定目标语音识别引擎的过程。

在一个实施例中，参见图4，S102中，所述根据所述业务类型确定多个候选语音识别引擎，包括：

S211，在预设的多个语音识别引擎中确定业务类型对应的多个候选语音识别引擎。

具体地，所述业务类型可以为：语音导航-理财类型，或者语音导航-储蓄类型，或者语音转写-理财类型，或者语音转写-储蓄类型；所述多个候选语音识别引擎，可以为：语音导航-理财类型对应的多个候选语音识别引擎、语音导航-储蓄类型对应的多个候选语音识别引擎、语音转写-理财类型对应的多个候选语音识别引擎、语音转写-储蓄类型对应的多个候选语音识别引擎。

在一个实施例中，所述业务类型还可以为：语音导航-贷款类型，或者语音导航-信用卡类型，或者语音转写-贷款类型，或者语音转写-信用卡类型；相应地，所述多个候选语音识别引擎，可以为：语音导航-贷款类型对应的多个候选语音识别引擎、或者语音导航-信用卡类型对应的多个候选语音识别引擎、或者语音转写-贷款类型对应的多个候选语音识别引擎、或者语音转写-信用卡类型对应的多个候选语音识别引擎。

所述业务类型还可以为其他类型，相应地，为每种业务类型配置对应的多个候选语音识别引擎。任一业务类型对应的多个语音识别引擎，可以通过多个语音识别厂商提供。

在一个实施例中，任一业务类型对应的多个候选语音识别引擎上均配置有任一业务类型对应的语音识别模型，任一业务类型对应的语音识别模型，是根据所述任一业务类型的多个语音数据和每个语音数据的语音识别结果，训练初始模型，直至训练完成得到的。

在一个实施例中，所述负载信息包括：CPU空闲率、语音通道数阈值、以及当前语音通道数；其中，每个候选语音识别引擎均可用于处理所述业务类型的语音识别任务。所述语音通道数阈值，是候选语音识别引擎同时处理的语音通道的最大值，当前语音通道数，是候选语音识别引擎正在同时处理的语音通道的数量；语音通道是呼叫中心发送实时的语音流至语音识别引擎所需的通道。

在一个实施中，S102中，所述根据所述多个候选语音识别引擎的负载信息，确定目标语音识别引擎，包括：

S212，根据每个候选语音识别引擎的语音通道数阈值和当前语音通道数，确定若干参考语音识别引擎。

其中，所述参考语音识别引擎，是语音通道数阈值大于或等于当前语音通道数的候选语音识别引擎，也就是在多个候选语音识别引擎中确定还可以增加语音通道的参考语音识别引擎。

S213，在所述若干参考语音识别引擎中确定CPU空闲率最大的目标语音识别引擎。

具体地，将若干参考语音识别引擎中，CPU空闲率最大的参考语音识别引擎作为目标语音识别引擎。

在另一种实现方式中，可以先确定CPU空闲率最大的第一候选语音识别引擎，若所述第一候选语音识别引擎的当前语音通道数小于语音通道数阈值，则将所述第一候选语音识别引擎作为目标语音识别引擎。

若所述第一候选语音识别引擎的当前语音通道数不小于语音通道数阈值，则在多个第二候选语音识别引擎中确定目标语音识别引擎。其中，所述多个第二候选语音识别引擎，是所述多个候选语音识别引擎中，除了所述第一候选语音识别引擎以外的语音识别引擎。

也就是说，若第一候选语音识别引擎无法再增加处理的语音通道，则在多个第二候选语音识别引擎中确定目标语音识别引擎。可以在多个第二候选语音识别引擎中确定CPU空闲率最大的第三候选语音识别引擎，若第三候选语音识别引擎还可以增加处理的语音通道(第三候选语音识别引擎的当前语音通道数小于语音通道数阈值)，则将第三候选语音识别引擎作为目标语音识别引擎。

在一个实施例中，所述负载信息还包括内存使用率，相应地，所述S102中，根据所述多个候选语音识别引擎的负载信息，确定目标语音识别引擎，包括：

根据每个候选语音识别引擎的语音通道数阈值和当前语音通道数，确定若干第一参考语音识别引擎，在所述若干第一参考语音识别引擎中，确定预设数值个内存使用率最小的第二参考语音识别引擎，在预设数值个第二参考语音识别引擎中确定CPU空闲率最大的目标语音识别引擎。

在本实施例中，在负载均衡中考虑了内存使用率；根据内存使用率、CPU空闲率、语音通道数阈值和当前语音通道数选择目标语音识别引擎的规则可以根据需求设定。

在一个实施例中，S103包括：

S311，根据所述呼叫请求，获取当前会话的初始语音流；

S312，分离所述初始语音流，得到用户语音流和话务台语音流，拼接所述用户语音流和所述话务台语音流得到语音流，将所述语音流发送至所述目标语音识别引擎。

具体地，所述初始语音流中用户语音流和话务台语音流混合存在，分离所述初始语音流，得到用户语音流和话务台语音流；拼接所述用户语音流和所述话务台语音流得到语音流，是指所述语音流的第一部分为用户语音流，第二部分为话务台语音流，或者，语音流的第一部分为话务台音流，第二部分为用户语音流，第一部分和第二部分之间可以通过预设字符间隔。

在一个实施例中，业务类型对应的目标语音识别模型识别所述语音流，得到的识别结果为所述业务类型的关键字，将所述业务类型的关键字发送到话务台，话务台根据所述业务类型的关键字查询回复的语音并播放，以实现与用户端通信；或者，目标语音识别模型识别所述语音流，得到的识别结果为文本信息，将文本信息发送到话务台，话务台根据文本信息查询回复的语音并播放，或者，话务台的工作人员参考文本信息与用户端通信。

当业务类型为语音导航-理财类型时，目标语音识别引擎对语音流进行语音识别，得到的识别结果为理财类型的关键字，将理财类型的关键字发送到话务台；当业务类型为语音导航-储蓄类型时，目标语音识别引擎对语音流进行语音识别，得到的识别结果为储蓄类型的关键字，将储蓄类型的关键字发送到话务台；当业务类型为语音导航-贷款(信用卡)类型时，目标语音识别引擎对语音流进行语音识别，得到的识别结果为贷款(信用卡)类型的关键字，将贷款(信用卡)类型的关键字发送到话务台。

当业务类型为语音转写-理财类型时，目标语音识别引擎对语音流进行语音识别，得到的识别结果为理财类型的文本信息，将理财类型的文本信息发送到话务台；当业务类型为语音转写-储蓄类型时，目标语音识别引擎对语音流进行语音识别，得到的识别结果为储蓄类型的文本信息，将储蓄类型的文本信息发送到话务台；当业务类型为语音转写-贷款(信用卡)类型时，目标语音识别引擎对语音流进行语音识别，得到的识别结果为贷款(信用卡)类型的文本信息，将贷款(信用卡)类型的文本信息发送到话务台。

在一种实现方式中，所述呼叫中心配置有智能服务引擎，智能服务引擎与呼叫中心通过MRCP协议建立第一语音通道，呼叫中心通过第一语音通道发送业务类型至智能服务引擎；智能服务引擎统一管理不同业务类型对应的语音识别引擎，智能服务引擎根据业务类型确定多个候选语音识别引擎，获取每个候选语音识别引擎的负载信息，确定目标语音识别模型，并建立目标语音识别模型和智能服务引擎之间的第二语音通道；若第一通道是长连接通道，则呼叫中心通过可以第一通道发送语音流到智能服务引擎，智能服务引擎通过第二语音通道将语音流发送到目标语音识别引擎；若第一通道是短连接通道，则再建立智能服务引擎与呼叫中心之间的第三语音通道(长连接通道)，呼叫中心通过第三语音通道将语音流发送到目标语音识别引擎。

本实施例中，根据业务类型和负载信息确定的目标语音识别模型，业务类型对应的目标语音识别模型，对语音流进行识别，可以得到更准确的识别结果，例如，业务类型为语音导航-理财类型，则语音导航-理财类型对应的目标语音识别引擎，可以更准确地识别出语音流中，理财类型的关键字；考虑到负载均衡，目标语音识别引擎是综合考虑CPU空闲率和语音通道数，在多个候选语音识别引擎中确定得到的，采用目标语音识别引擎处理呼叫请求的语音流，避免了等待语音流传输、处理速度慢的问题，可以更快速得到识别结果，减少了语音识别的处理时长，提高了实时性。

应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的语音识别方法的语音识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个语音识别装置实施例中的具体限定可以参见上文中对于语音识别方法的限定，在此不再赘述。

在一个实施例中，如图5所示，提供了一种语音识别装置，包括：

在一个实施例中，所述呼叫请求为呼入请求；所述业务类型确定模块，包括：

在一个实施例中，所述呼叫请求为呼出请求；所述业务类型确定模块，包括：

在一个实施例中，所述负载信息包括：CPU空闲率、语音通道数阈值，以及当前语音通道数，所述目标语音识别引擎确定模块包括：

所述业务类型为：语音导航-理财类型，或者语音导航-储蓄类型，或者语音转写-理财类型，或者语音转写-储蓄类型；

上述语音识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音识别方法。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

接收呼叫请求，根据所述呼叫请求确定业务类型；

在一个实施例中，处理器执行计算机程序时还实现以下步骤：

所述呼叫请求为呼入请求，所述根据所述呼叫请求确定业务类型，包括：

所述负载信息包括：CPU空闲率、语音通道数阈值，以及当前语音通道数。

所述根据所述多个候选语音识别引擎的负载信息，确定目标语音识别引擎，包括：

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

接收呼叫请求，根据所述呼叫请求确定业务类型；

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

接收呼叫请求，根据所述呼叫请求确定业务类型；

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(Ferroelectric Random Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种语音识别方法，其特征在于，所述方法包括：

接收呼叫请求，根据所述呼叫请求确定业务类型；

2.根据权利要求1所述的方法，其特征在于，所述呼叫请求为呼入请求；所述根据所述呼叫请求确定业务类型，包括：

3.根据权利要求1所述的方法，其特征在于，所述呼叫请求为呼出请求；所述根据所述呼叫请求确定业务类型，包括：

4.根据权利要求1所述的方法，其特征在于，所述负载信息包括：CPU空闲率、语音通道数阈值，以及当前语音通道数。

5.根据权利要求4所述的方法，其特征在于，所述根据所述多个候选语音识别引擎的负载信息，确定目标语音识别引擎，包括：

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述业务类型为：语音导航-理财类型，或者语音导航-储蓄类型，或者语音转写-理财类型，或者语音转写-储蓄类型；

7.一种语音识别装置，其特征在于，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述呼叫请求为呼入请求；所述业务类型确定模块，包括：

9.根据权利要求7所述的装置，其特征在于，所述呼叫请求为呼出请求；所述业务类型确定模块，包括：

10.根据权利要求7所述的装置，其特征在于，所述负载信息包括：CPU空闲率、语音通道数阈值，以及当前语音通道数，所述目标语音识别引擎确定模块包括：

11.根据权利要求7至10中任一项所述的装置，其特征在于，所述业务类型为：语音导航-理财类型，或者语音导航-储蓄类型，或者语音转写-理财类型，或者语音转写-储蓄类型；

12.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

14.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。