CN117392983B

CN117392983B - 一种钻机智能语音交互控制系统及控制方法

Info

Publication number: CN117392983B
Application number: CN202311677282.4A
Authority: CN
Inventors: 谌姜
Original assignee: Sichuan Honier Electric Technology Co ltd
Current assignee: Sichuan Honier Electric Technology Co ltd
Priority date: 2023-12-08
Filing date: 2023-12-08
Publication date: 2024-02-20
Anticipated expiration: 2043-12-08
Also published as: CN117392983A

Abstract

本申请提供一种钻机智能语音交互控制系统及控制方法，通过获取多个钻机操作场景对应的模板钻机智能交互语音数据序列和每个模板钻机智能交互语音数据对应的标注交互意图指令数据，将模板钻机智能交互语音数据序列加载到初始化神经网络进行交互意图指令生成，生成所述模板钻机智能交互语音数据序列对应的推定交互意图指令数据，依据推定交互意图指令数据和标注交互意图指令数据，确定目标误差参数，依据目标误差参数，对初始化神经网络进行网络参数更新，生成目标交互意图指令生成网络。由此，能够有效地处理钻机智能交互语音数据，提高语音交互的准确性和效率。

Description

一种钻机智能语音交互控制系统及控制方法

技术领域

本申请涉及钻机控制技术领域，具体而言，涉及一种钻机智能语音交互控制系统及控制方法。

背景技术

钻机在石油、地质探测等领域有着广泛的应用。随着科技的发展，为了提高操作效率和安全性，人们开始研究如何通过语音交互来控制钻机。然而，当前的语音交互系统存在一些问题。

首先，传统的语音交互系统通常需要预设一套固定的语音指令，这意味着用户必须按照预设的方式来发出指令，限制了用户的自然语言表达。其次，钻机操作的场景多样，不同的操作可能需要不同的语音指令，而现有的语音交互系统往往无法适应这种变化，导致在实际操作中可能无法准确识别用户的意图。

因此，急需一种新的钻机智能交互语音数据的处理方法，能够解决上述问题，提高语音交互的准确性和效率。

发明内容

有鉴于此，本申请的目的在于提供一种钻机智能语音交互控制系统及控制方法。

依据本申请的第一方面，提供一种钻机智能语音交互控制方法，应用于钻机智能语音交互控制系统，所述方法包括：

获取多个钻机操作场景对应的模板钻机智能交互语音数据序列和所述模板钻机智能交互语音数据序列中每个模板钻机智能交互语音数据对应的标注交互意图指令数据；所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据为依据所述多个钻机操作场景分别对应的一个或多个样例钻机智能交互语音数据生成的；所述模板钻机智能交互语音数据序列中多个模板钻机智能交互语音数据对应的标注交互意图指令数据属于多个不同的操作指令类别；

将所述模板钻机智能交互语音数据序列加载到初始化神经网络进行交互意图指令生成，生成所述模板钻机智能交互语音数据序列对应的推定交互意图指令数据；所述推定交互意图指令数据用于反映所述每个模板钻机智能交互语音数据中的每个语音交互控制片段属于交互意图指令的置信度；

依据所述推定交互意图指令数据和所述标注交互意图指令数据，确定目标误差参数；

依据所述目标误差参数，对所述初始化神经网络进行网络参数更新，生成目标交互意图指令生成网络。

在第一方面的一种可能的实施方式中，所述方法还包括：

获取所述多个钻机操作场景分别对应的一个或多个样例钻机智能交互语音数据；

依据所述多个钻机操作场景分别对应的一个或多个样例钻机智能交互语音数据，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据。

在第一方面的一种可能的实施方式中，所述一个或多个样例钻机智能交互语音数据包括一个或多个第一样例钻机智能交互语音数据，所述一个或多个第一样例钻机智能交互语音数据中均不包含交互意图指令，所述方法还包括：

获取所述多个钻机操作场景分别对应的典型钻机智能交互语音数据和所述典型钻机智能交互语音数据对应的典型交互意图指令；

所述依据所述多个钻机操作场景分别对应的一个或多个样例钻机智能交互语音数据，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据，包括：

依据所述多个钻机操作场景对应的典型钻机智能交互语音数据、所述典型钻机智能交互语音数据对应的典型交互意图指令和所述一个或多个第一样例钻机智能交互语音数据，生成目标交互意图指令预测请求；所述典型交互意图指令属于多个不同的操作指令类别；

将所述目标交互意图指令预测请求加载到预设交互意图指令生成网络，生成第一模板钻机智能交互语音数据和所述第一模板钻机智能交互语音数据对应的标注交互意图指令数据；所述第一模板钻机智能交互语音数据为所述模板钻机智能交互语音数据序列中的任意一个。

在第一方面的一种可能的实施方式中，所述方法还包括：

获取多个操作指令类别分别对应的一个或多个预设交互意图指令样例；

依据所述一个或多个样例钻机智能交互语音数据和所述一个或多个预设交互意图指令样例，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据。

在第一方面的一种可能的实施方式中，所述一个或多个样例钻机智能交互语音数据包括一个或多个第二样例钻机智能交互语音数据，所述一个或多个第二样例钻机智能交互语音数据中均包含交互意图指令；所述依据所述一个或多个样例钻机智能交互语音数据和所述一个或多个预设交互意图指令样例，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据，包括：

对任意一个第二样例钻机智能交互语音数据和所述多个操作指令类别分别对应的一个或多个预设交互意图指令样例进行相关性比较，生成所述任意一个第二样例钻机智能交互语音数据对应的第一相关交互意图指令；所述第一相关交互意图指令为与所述任意一个第二样例钻机智能交互语音数据匹配的预设交互意图指令样例；

依据所述任意一个第二样例钻机智能交互语音数据对应的第一相关交互意图指令和所述任意一个第二样例钻机智能交互语音数据，生成第二模板钻机智能交互语音数据和所述第二模板钻机智能交互语音数据对应的标注交互意图指令数据；所述第二模板钻机智能交互语音数据为所述模板钻机智能交互语音数据序列中的任意一个。

在第一方面的一种可能的实施方式中，所述一个或多个样例钻机智能交互语音数据包括一个或多个第三样例钻机智能交互语音数据，所述一个或多个第三样例钻机智能交互语音数据中均不包含交互意图指令；

所述依据所述一个或多个样例钻机智能交互语音数据和所述一个或多个预设交互意图指令样例，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据，包括：

依据任意一个预设交互意图指令样例，获取预设交互意图指令；

将所述预设交互意图指令随机加载到任意一个第三样例钻机智能交互语音数据中，生成第三模板钻机智能交互语音数据；所述第三模板钻机智能交互语音数据为所述模板钻机智能交互语音数据序列中的任意一个；

依据所述预设交互意图指令，生成所述第三模板钻机智能交互语音数据对应的标注交互意图指令数据。

在第一方面的一种可能的实施方式中，所述方法包括：

获取候选钻机智能交互语音数据；

将所述候选钻机智能交互语音数据加载到目标交互意图指令生成网络进行交互意图指令生成，生成所述候选钻机智能交互语音数据对应的目标交互意图指令分布；所述目标交互意图指令分布用于反映所述候选钻机智能交互语音数据中每个语音交互控制片段属于交互意图指令的置信度；

依据所述目标交互意图指令分布，确定所述候选钻机智能交互语音数据中的目标交互意图指令，并基于所述目标交互意图指令执行钻机控制。

在第一方面的一种可能的实施方式中，所述方法还包括：

获取指令迭代序列以及目标钻机控制任务对应的多个候选钻机智能交互语音数据；所述指令迭代序列包括多个参考交互意图指令和任意一个参考交互意图指令对应的指令迭代类别；

将所述目标钻机控制任务对应的多个候选钻机智能交互语音数据加载到所述目标交互意图指令生成网络进行交互意图指令生成，生成所述多个候选钻机智能交互语音数据分别对应的候选交互意图指令；

对任意一个候选钻机智能交互语音数据对应的候选交互意图指令与所述多个参考交互意图指令进行相关性比较，生成所述任意一个候选钻机智能交互语音数据对应的第二相关交互意图指令；所述第二相关交互意图指令为与所述任意一个候选钻机智能交互语音数据相相关的参考交互意图指令；

依据所述第二相关交互意图指令对应的指令迭代类别，对所述第二相关交互意图指令对应的候选交互意图指令进行指令迭代处理，生成迭代处理后的候选交互意图指令。

在第一方面的一种可能的实施方式中，所述指令迭代类别包括指令变换类别，所述指令迭代序列还包括所述指令变换类别下的参考交互意图指令对应的变换交互意图指令；所述依据所述第二相关交互意图指令对应的指令迭代类别，对所述第二相关交互意图指令对应的候选交互意图指令进行指令迭代处理，生成迭代处理后的候选交互意图指令，包括：

在所述第二相关交互意图指令对应的指令迭代类别为指令变换类别时，将所述第二相关交互意图指令对应的候选交互意图指令变换迭代为所述第二相关交互意图指令对应的变换交互意图指令；

或者，所述指令迭代类别包括指令取消类别；

所述依据所述第二相关交互意图指令对应的指令迭代类别，对所述第二相关交互意图指令对应的候选交互意图指令进行指令迭代处理，生成迭代处理后的候选交互意图指令，包括：

在所述第二相关交互意图指令对应的指令迭代类别为指令取消类别时，取消所述第二相关交互意图指令对应的候选交互意图指令；

或者，所述指令迭代类别包括指令补充类别；所述方法还包括：

对所述任意一个候选钻机智能交互语音数据与所述指令补充类别对应的参考交互意图指令进行相关性比较，生成所述任意一个候选钻机智能交互语音数据对应的第三相关交互意图指令；

依据所述第三相关交互意图指令，生成所述任意一个候选钻机智能交互语音数据对应的候选交互意图指令；

其中，所述方法还包括：

从所述多个候选钻机智能交互语音数据中，确定目标数量个目标钻机智能交互语音数据；

将所述目标数量个目标钻机智能交互语音数据加载到所述目标交互意图指令生成网络进行交互意图指令生成，生成所述目标数量个目标钻机智能交互语音数据分别对应的候选交互意图指令；

对所述目标数量个目标钻机智能交互语音数据分别对应的候选交互意图指令中的每个候选交互意图指令进行衍生，生成所述每个候选交互意图指令对应的一个或多个衍生指令；

对所述目标数量个目标钻机智能交互语音数据分别对应的候选交互意图指令和多个衍生指令进行分析，生成多种候选交互意图指令分别对应的衍生数量；

依据每种候选交互意图指令对应的衍生数量，展示所述多种候选交互意图指令；

响应于所述指令迭代序列的加载请求，获取所述指令迭代序列。

依据本申请的第二方面，提供一种钻机智能语音交互控制系统，所述钻机智能语音交互控制系统包括机器可读存储介质及处理器，所述机器可读存储介质存储有机器可执行指令，所述处理器在执行所述机器可执行指令时，该钻机智能语音交互控制系统实现前述的钻机智能语音交互控制方法。

依据本申请的第三方面，提供提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机可执行指令，当所述计算机可执行指令被执行时，实现前述的钻机智能语音交互控制方法。

依据上述任意一个方面，本申请中，通过获取多个钻机操作场景对应的模板钻机智能交互语音数据序列和每个模板钻机智能交互语音数据对应的标注交互意图指令数据，将模板钻机智能交互语音数据序列加载到初始化神经网络进行交互意图指令生成，生成所述模板钻机智能交互语音数据序列对应的推定交互意图指令数据，依据推定交互意图指令数据和标注交互意图指令数据，确定目标误差参数，依据目标误差参数，对初始化神经网络进行网络参数更新，生成目标交互意图指令生成网络。由此，能够有效地处理钻机智能交互语音数据，提高语音交互的准确性和效率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以依据这些附图获得其它相关的附图。

图1本申请实施例所提供的钻机智能语音交互控制方法的流程示意图；

图2示出了本申请实施例所提供的用于实现上述的钻机智能语音交互控制方法的钻机智能语音交互控制系统的组件结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将依据本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了依据本申请实施例的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其它操作，也可以从流程图中销毁一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。依据本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例，都对应于本申请保护的范围。

图1示出了本申请实施例提供的钻机智能语音交互控制系统及控制方法的流程示意图，应当理解，在其它实施例中，本实施例的钻机智能语音交互控制方法其中部分步骤的顺序可以依据实际需要相互共享，或者其中的部分步骤也可以省略或维持。该钻机智能语音交互控制方法的详细步骤包括：

步骤S110，获取多个钻机操作场景对应的模板钻机智能交互语音数据序列和所述模板钻机智能交互语音数据序列中每个模板钻机智能交互语音数据对应的标注交互意图指令数据。

本实施例中，所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据为依据所述多个钻机操作场景分别对应的一个或多个样例钻机智能交互语音数据生成的。所述模板钻机智能交互语音数据序列中多个模板钻机智能交互语音数据对应的标注交互意图指令数据属于多个不同的操作指令类别。

例如，假设有三种常见的钻机操作场景，分别是"启动钻机"、"调整钻头速度"和"停止钻机"。对于每种场景，都记录了一些样例的交互语音数据，例如用户说的"开启钻机"、"提高钻头转速"和"关闭钻机"等。同时，也标记了这些语音数据对应的交互意图指令，例如"启动"、"调速"和"停止"。其中，假设在"启动钻机"的场景中，收集了几百条样例语音数据，例如用户可能会说"开启钻机"、"开始钻孔"、"运行钻机"等不同的指令，而这些指令的意图都是希望启动钻机。将这些语音指令录制下来，并标记它们对应的交互意图为"启动"。

步骤S120，将所述模板钻机智能交互语音数据序列加载到初始化神经网络进行交互意图指令生成，生成所述模板钻机智能交互语音数据序列对应的推定交互意图指令数据。所述推定交互意图指令数据用于反映所述每个模板钻机智能交互语音数据中的每个语音交互控制片段属于交互意图指令的置信度。

例如，可以将收集到的模板钻机智能交互语音数据输入到一个已经初始化的神经网络中，该初始化神经网络的目标是根据输入的语音数据生成相应的交互意图指令。例如，将这些模板钻机智能交互语音数据序列转化为适合神经网络处理的格式（如声谱图），然后输入到初始化神经网络，初始化神经网络可能是一个循环神经网络（RNN）或者卷积神经网络（CNN），会根据输入的语音数据生成一个预测的交互意图指令。例如，当输入"开启钻机"的语音数据时，可能会输出一个表示"启动"意图的向量。当输入"提高钻头转速"的语音数据时，初始化神经网络可能会输出一个"调速"的推定交互意图指令。

步骤S130，依据所述推定交互意图指令数据和所述标注交互意图指令数据，确定目标误差参数。

例如，将输出的推定交互意图指令与实际的标注交互意图指令进行比较，计算出它们之间的误差，这个误差就是目标误差参数。例如，如果网络输出的是"调速"，而实际标注的是"启动"，那么误差就是1。也即，将输出的推定交互意图指令数据与实际的标注交互意图指令数据进行比较，如果输出的推定交互意图指令数据完全正确，那么误差就是0；如果完全错误，那么误差就是1。在实际操作中，误差通常介于0和1之间，表示网络预测的准确度。

步骤S140，依据所述目标误差参数，对所述初始化神经网络进行网络参数更新，生成目标交互意图指令生成网络。

例如，根据目标误差参数来更新神经网络的参数，以优化其性能。这通常是通过反向传播（backpropagation）和梯度下降（gradient descent）等优化算法实现的。例如，如果发现网络总是倾向于错误地将"开启钻机"识别为"停止钻机"，那么就需要调整网络的参数，使其更倾向于将"开启钻机"识别为"启动"。这个过程会反复进行多次，直到网络的预测结果达到满意的精度。经过多次迭代后，可以得到一个能够准确生成交互意图指令的目标网络。通过上述步骤，就可以构建一个能够理解和响应用户语音指令的智能交互系统，对于钻机的操作提供便捷的语音控制接口。

基于以上步骤，通过获取多个钻机操作场景对应的模板钻机智能交互语音数据序列和每个模板钻机智能交互语音数据对应的标注交互意图指令数据，将模板钻机智能交互语音数据序列加载到初始化神经网络进行交互意图指令生成，生成所述模板钻机智能交互语音数据序列对应的推定交互意图指令数据，依据推定交互意图指令数据和标注交互意图指令数据，确定目标误差参数，依据目标误差参数，对初始化神经网络进行网络参数更新，生成目标交互意图指令生成网络。由此，能够有效地处理钻机智能交互语音数据，提高语音交互的准确性和效率。

一种可替代的实施方式中，所述方法还包括：

步骤S101，获取所述多个钻机操作场景分别对应的一个或多个样例钻机智能交互语音数据。

例如，假设有三种钻机操作场景："启动钻机"、"停止钻机"和"调整钻头速度"。在每个场景中，收集到用户实际发出的语音指令作为样例钻机智能交互语音数据，例如在"启动钻机"的场景中，可能收集到"开启钻机"、"启动钻机"等语音指令。

步骤S102，依据所述多个钻机操作场景分别对应的一个或多个样例钻机智能交互语音数据，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据。

在此步骤中，基于上述收集的样例钻机智能交互语音数据，创建模板钻机智能交互语音数据序列，同时也会对这些模板语音数据进行标注，例如"开启钻机"、"启动钻机"等语音指令都被标注为"启动"的交互意图。

一种可替代的实施方式中，所述一个或多个样例钻机智能交互语音数据包括一个或多个第一样例钻机智能交互语音数据，所述一个或多个第一样例钻机智能交互语音数据中均不包含交互意图指令，本实施例还可以获取所述多个钻机操作场景分别对应的典型钻机智能交互语音数据和所述典型钻机智能交互语音数据对应的典型交互意图指令。此步骤是在收集样例钻机智能交互语音数据的基础上，进一步收集了每个操作场景中的典型钻机智能交互语音数据和对应的典型交互意图指令。比如，在"启动钻机"的场景中，"开启钻机"可能就是一个典型的交互语音数据，其对应的典型交互意图指令为"启动"。

由此，针对步骤S102，可以依据所述多个钻机操作场景对应的典型钻机智能交互语音数据、所述典型钻机智能交互语音数据对应的典型交互意图指令和所述一个或多个第一样例钻机智能交互语音数据，生成目标交互意图指令预测请求。所述典型交互意图指令属于多个不同的操作指令类别。

此步骤中，会把以上所有收集到的语音数据和对应的意图指令一起作为输入，生成目标交互意图指令预测请求。

接着，将所述目标交互意图指令预测请求加载到预设交互意图指令生成网络，生成第一模板钻机智能交互语音数据和所述第一模板钻机智能交互语音数据对应的标注交互意图指令数据。所述第一模板钻机智能交互语音数据为所述模板钻机智能交互语音数据序列中的任意一个。最后，把以上生成的预测请求输入到一个预先设置好的交互意图指令生成网络（如深度学习模型）中，该交互意图指令生成网络会输出对应的模板钻机智能交互语音数据和其对应的标注交互意图指令数据。

一种可替代的实施方式中，本实施例还可以获取多个操作指令类别分别对应的一个或多个预设交互意图指令样例。因此在步骤S102中，可以依据所述一个或多个样例钻机智能交互语音数据和所述一个或多个预设交互意图指令样例，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据。

例如，首先需要收集一些预设的交互意图指令样例。比如，在钻机操作中，可能有"启动"、"停止"和"调速"等不同的操作指令类别。对于每一类指令，都会预设一些典型的交互意图指令样例，例如"启动"类别的指令样例可能包括"开始运行"、"启动钻机"等。

然后，将收集到的样例钻机智能交互语音数据与预设的交互意图指令样例进行匹配。例如，如果收集到的样例语音数据是"开启钻机"，并且这个指令与预设的"启动"类别的交互意图指令样例相匹配，那么就会将这条语音数据标注为"启动"类别，并将其加入到模板钻机智能交互语音数据序列中。

通过以上步骤，就可以基于样例钻机智能交互语音数据和预设的交互意图指令样例，生成对应的模板钻机智能交互语音数据序列和标注交互意图指令数据，为后续的交互意图识别和处理提供基础。

一种可替代的实施方式中，所述一个或多个样例钻机智能交互语音数据包括一个或多个第二样例钻机智能交互语音数据，所述一个或多个第二样例钻机智能交互语音数据中均包含交互意图指令。所述依据所述一个或多个样例钻机智能交互语音数据和所述一个或多个预设交互意图指令样例，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据，包括：

1、对任意一个第二样例钻机智能交互语音数据和所述多个操作指令类别分别对应的一个或多个预设交互意图指令样例进行相关性比较，生成所述任意一个第二样例钻机智能交互语音数据对应的第一相关交互意图指令。所述第一相关交互意图指令为与所述任意一个第二样例钻机智能交互语音数据匹配的预设交互意图指令样例。

2、依据所述任意一个第二样例钻机智能交互语音数据对应的第一相关交互意图指令和所述任意一个第二样例钻机智能交互语音数据，生成第二模板钻机智能交互语音数据和所述第二模板钻机智能交互语音数据对应的标注交互意图指令数据。所述第二模板钻机智能交互语音数据为所述模板钻机智能交互语音数据序列中的任意一个。

这部分内容描述了如何通过样例钻机智能交互语音数据（其中包含交互意图指令）和预设的交互意图指令样例，生成对应的模板钻机智能交互语音数据序列和标注交互意图指令数据。以下是每个步骤的具体场景举例说明：

例如，收集到一些包含交互意图指令的样例语音数据，例如用户可能会说"提高钻头转速"、"降低钻头转速"等，这些语音指令都明确表示了调整钻头速度的意图。

然后，将收集到的每一条样例语音数据与预设的交互意图指令样例进行比较，例如可能会发现"提高钻头转速"这条语音数据与预设的"调速"类别的交互意图指令样例相关性最高，因此生成的第一相关交互意图指令就是"调速"。

最后，根据第二样例钻机智能交互语音数据（如"提高钻头转速"）和其对应的第一相关交互意图指令（如"调速"），生成第二模板钻机智能交互语音数据和对应的标注交互意图指令数据。也就是说，"提高钻头转速"将被加入到模板钻机智能交互语音数据序列中，并被标注为"调速"的交互意图。

一种可替代的实施方式中，所述一个或多个样例钻机智能交互语音数据包括一个或多个第三样例钻机智能交互语音数据，所述一个或多个第三样例钻机智能交互语音数据中均不包含交互意图指令。

由此，依据所述一个或多个样例钻机智能交互语音数据和所述一个或多个预设交互意图指令样例，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据，包括：

1、依据任意一个预设交互意图指令样例，获取预设交互意图指令。

2、将所述预设交互意图指令随机加载到任意一个第三样例钻机智能交互语音数据中，生成第三模板钻机智能交互语音数据。所述第三模板钻机智能交互语音数据为所述模板钻机智能交互语音数据序列中的任意一个。

3、依据所述预设交互意图指令，生成所述第三模板钻机智能交互语音数据对应的标注交互意图指令数据。

例如，这部分内容描述了如何通过预设的交互意图指令样例和不包含交互意图指令的样例钻机智能交互语音数据，生成对应的模板钻机智能交互语音数据序列和标注交互意图指令数据。以下是每个步骤的具体场景举例说明：

首先，收集到一些不包含明确交互意图指令的语音数据，例如用户可能会说"我想让它运行起来"、"我需要它停下来"等，这些语音指令并没有明确表示启动或停止钻机的意图。

然后，从预设的交互意图指令样例中选择一个，例如选择"启动"类别的预设交互意图指令样例。

接着，将预设的交互意图指令（如"启动"）随机加载到任意一个第三样例钻机智能交互语音数据（如"我想让它运行起来"）中，生成第三模板钻机智能交互语音数据。

最后，根据预设的交互意图指令（如"启动"），为生成的第三模板钻机智能交互语音数据（如"我想让它运行起来"）生成对应的标注交互意图指令数据。

一种可替代的实施方式中，在前述描述的基础上，所述方法包括：

步骤S150，获取候选钻机智能交互语音数据。

步骤S160，将所述候选钻机智能交互语音数据加载到目标交互意图指令生成网络进行交互意图指令生成，生成所述候选钻机智能交互语音数据对应的目标交互意图指令分布。所述目标交互意图指令分布用于反映所述候选钻机智能交互语音数据中每个语音交互控制片段属于交互意图指令的置信度。

步骤S170，依据所述目标交互意图指令分布，确定所述候选钻机智能交互语音数据中的目标交互意图指令，并基于所述目标交互意图指令执行钻机控制。

步骤S150-步骤S170为基于前述步骤S110-步骤S140的应用实施例的步骤，以下是每个步骤的具体场景举例说明：

在实际操作中，例如当一个工人对钻机说"提高转速"时，就获得了一条候选钻机智能交互语音数据。

然后，把这条候选语音数据（"提高转速"）输入到预先训练好的目标交互意图指令生成网络（可能是一个深度学习模型）中，该网络会输出一个目标交互意图指令分布。这个分布反映了各种可能的交互意图指令（如"启动"、"停止"、"调速"等）的置信度。

最后，根据生成的交互意图指令分布确定候选语音数据中的目标交互意图指令。例如，如果"调速"的置信度最高，那么就确定目标交互意图指令为"调速"，并根据这个意图指令来执行钻机控制，也就是提高钻头的转速。

一种可替代的实施方式中，本申请实施例进一步包括以下步骤：

步骤A110，获取指令迭代序列以及目标钻机控制任务对应的多个候选钻机智能交互语音数据。所述指令迭代序列包括多个参考交互意图指令和任意一个参考交互意图指令对应的指令迭代类别。

例如，在"调整钻头速度"的任务中，可能会收到如"提高转速"、"降低转速"等候选语音数据，同时也有一系列参考交互意图指令，比如"增速"、"减速"等，每个参考交互意图指令都有对应的指令迭代类别。

步骤A120，将所述目标钻机控制任务对应的多个候选钻机智能交互语音数据加载到所述目标交互意图指令生成网络进行交互意图指令生成，生成所述多个候选钻机智能交互语音数据分别对应的候选交互意图指令。

然后，把收集到的候选语音数据输入到预先训练好的目标交互意图指令生成网络（可能是一个深度学习模型）中，该网络会输出每条候选语音数据对应的候选交互意图指令。

步骤A130，对任意一个候选钻机智能交互语音数据对应的候选交互意图指令与所述多个参考交互意图指令进行相关性比较，生成所述任意一个候选钻机智能交互语音数据对应的第二相关交互意图指令。所述第二相关交互意图指令为与所述任意一个候选钻机智能交互语音数据相相关的参考交互意图指令。

接着，将每条候选语音数据对应的候选交互意图指令与参考交互意图指令进行相关性比较。例如，如果"提高转速"这条候选语音数据对应的候选交互意图指令与"增速"这个参考交互意图指令最为相关，那么"增速"就是这条候选语音数据对应的第二相关交互意图指令

步骤A140，依据所述第二相关交互意图指令对应的指令迭代类别，对所述第二相关交互意图指令对应的候选交互意图指令进行指令迭代处理，生成迭代处理后的候选交互意图指令。

一种可替代的实施方式中，所述指令迭代类别包括指令变换类别，所述指令迭代序列还包括所述指令变换类别下的参考交互意图指令对应的变换交互意图指令。步骤A140可以包括：在所述第二相关交互意图指令对应的指令迭代类别为指令变换类别时，将所述第二相关交互意图指令对应的候选交互意图指令变换迭代为所述第二相关交互意图指令对应的变换交互意图指令。

或者，所述指令迭代类别包括指令取消类别。步骤A140可以包括：

在所述第二相关交互意图指令对应的指令迭代类别为指令取消类别时，取消所述第二相关交互意图指令对应的候选交互意图指令。

或者，所述指令迭代类别包括指令补充类别。步骤A140可以包括：对所述任意一个候选钻机智能交互语音数据与所述指令补充类别对应的参考交互意图指令进行相关性比较，生成所述任意一个候选钻机智能交互语音数据对应的第三相关交互意图指令。依据所述第三相关交互意图指令，生成所述任意一个候选钻机智能交互语音数据对应的候选交互意图指令。

其中，所述方法还包括：

步骤A101，从所述多个候选钻机智能交互语音数据中，确定目标数量个目标钻机智能交互语音数据。

步骤A102，将所述目标数量个目标钻机智能交互语音数据加载到所述目标交互意图指令生成网络进行交互意图指令生成，生成所述目标数量个目标钻机智能交互语音数据分别对应的候选交互意图指令。

步骤A103，对所述目标数量个目标钻机智能交互语音数据分别对应的候选交互意图指令中的每个候选交互意图指令进行衍生，生成所述每个候选交互意图指令对应的一个或多个衍生指令。

步骤A104，对所述目标数量个目标钻机智能交互语音数据分别对应的候选交互意图指令和多个衍生指令进行分析，生成多种候选交互意图指令分别对应的衍生数量。

步骤A105，依据每种候选交互意图指令对应的衍生数量，展示所述多种候选交互意图指令。

步骤A106，响应于所述指令迭代序列的加载请求，获取所述指令迭代序列。

以上部分内容描述了指令迭代类别的处理过程，包括指令变换类别、指令取消类别和指令补充类别，以及如何生成和展示候选交互意图指令。以下是每个步骤的具体场景举例说明：

1. "在所述第二相关交互意图指令对应的指令迭代类别为指令变换类别时，将所述第二相关交互意图指令对应的候选交互意图指令变换迭代为所述第二相关交互意图指令对应的变换交互意图指令"：例如，如果"提高转速"这条候选交互意图指令对应的第二相关交互意图指令（如"增速"）的迭代类别为变换类别，那么可能会把"提高转速"变换迭代为"进一步提高转速"。

2. "在所述第二相关交互意图指令对应的指令迭代类别为指令取消类别时，取消所述第二相关交互意图指令对应的候选交互意图指令"：例如，如果"提高转速"这条候选交互意图指令对应的第二相关交互意图指令（如"增速"）的迭代类别为取消类别，那么可能会直接取消"提高转速"这条候选交互意图指令。

3. "对所述任意一个候选钻机智能交互语音数据与所述指令补充类别对应的参考交互意图指令进行相关性比较，生成所述任意一个候选钻机智能交互语音数据对应的第三相关交互意图指令。依据所述第三相关交互意图指令，生成所述任意一个候选钻机智能交互语音数据对应的候选交互意图指令"：例如，如果有一条候选语音数据是"我想让它运行起来"，并且与"启动"这个参考交互意图指令最为相关，那么"启动"就是这条候选语音数据对应的第三相关交互意图指令，根据这个第三相关交互意图指令，生成新的候选交互意图指令，比如"启动钻机"。

4. "从所述多个候选钻机智能交互语音数据中，确定目标数量个目标钻机智能交互语音数据。将所述目标数量个目标钻机智能交互语音数据加载到所述目标交互意图指令生成网络进行交互意图指令生成，生成所述目标数量个目标钻机智能交互语音数据分别对应的候选交互意图指令"：例如，从收集到的多个候选语音数据中确定三个目标语音数据，比如"提高转速"、"降低转速"和"停止运行"，然后把这三条语音数据输入到目标交互意图指令生成网络（可能是一个深度学习模型）中，该网络会输出每条语音数据对应的候选交互意图指令，比如"增速"、"减速"和"停止"。

5. "对所述目标数量个目标钻机智能交互语音数据分别对应的候选交互意图指令中的每个候选交互意图指令进行衍生，生成所述每个候选交互意图指令对应的一个或多个衍生指令。对所述目标数量个目标钻机智能交互语音数据分别对应的候选交互意图指令和多个衍生指令进行分析，生成多种候选交互意图指令分别对应的衍生数量。依据每种候选交互意图指令对应的衍生数量，展示所述多种候选交互意图指令"：例如，对每个候选交互意图指令（如"增速"、"减速"和"停止"）进行衍生，生成多个衍生指令，比如"稍微提高转速"、"大幅降低转速"和"立即停止运行"等。然后分析每种候选交互意图指令对应的衍生数量，并据此展示多种候选交互意图指令。

图2示意性地示出了可被用于实现本申请中所述的各个实施例的钻机智能语音交互控制系统100。

对于一个实施例，图2示出了钻机智能语音交互控制系统100，该钻机智能语音交互控制系统100具有一个或多个处理器102、被耦合到(一个或多个)处理器102中的一个或多个的控制模块(芯片组)104、被耦合到控制模块104的存储器106、被耦合到控制模块104的非易失性存储器(NVY)/存储设备108、被耦合到控制模块104的一个或多个输入/输出设备110，和被耦合到控制模块104的网络接口112。

处理器102可包括一个或多个单核或多核处理器，处理器102可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。一种可替代的实施方式中，钻机智能语音交互控制系统100能够作为本申请实施例中所述网关等服务器设备。

对于一个实施例，图2示出了钻机智能语音交互控制系统100，该钻机智能语音交互控制系统100具有一个或多个处理器102、被耦合到(一个或多个)处理器102中的一个或多个的控制模块(芯片组)104、被耦合到控制模块104的存储器106、被耦合到控制模块104的非易失性存储器(NVM)/存储设备108、被耦合到控制模块104的一个或多个输入/输出设备110，和被耦合到控制模块104的网络接口112。

一种可替代的实施方式中，钻机智能语音交互控制系统100可包括具有指令114的一个或多个计算机可读介质(例如，存储器106或NVM/存储设备108)和与该一个或多个计算机可读介质相汇聚被配置为执行指令114以实现模块从而执行本公开中所述的动作的一个或多个处理器102。

对于一个实施例，控制模块104可包括任意适当的接口控制器，以向(一个或多个)处理器102中的一个或多个和/或与控制模块104通信的任意适当的设备或组件提供任意适当的接口。

控制模块104可包括存储器控制器模块，以向存储器106提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。

存储器106可被用于例如为钻机智能语音交互控制系统100加载和存储数据和/或指令114。对于一个实施例，存储器106可包括任意适当的易失性存储器，例如，适当的DRAM。一种可替代的实施方式中，存储器106可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。

对于一个实施例，控制模块104可包括一个或多个输入/输出控制器，以向NVM/存储设备108及(一个或多个)输入/输出设备110提供接口。

例如，NVM/存储设备108可被用于存储数据和/或指令114。NVM/存储设备108可包括任意适当的非易失性存储器(例如，闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如，一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。

NVM/存储设备108可包括在物理上作为钻机智能语音交互控制系统100被安装在其上的设备的一部分的存储资源，或者其可被该设备访问可不必作为该设备的一部分。例如，NVM/存储设备108可依据网络经由(一个或多个)输入/输出设备110进行访问。

(一个或多个)输入/输出设备110可为钻机智能语音交互控制系统100提供接口以与任意其它适当的设备通信，输入/输出设备110可以包括通信组件、拼音组件、传感器组件等。网络接口112可为钻机智能语音交互控制系统100提供接口以依据一个或多个网络通信，钻机智能语音交互控制系统100可依据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信，例如接入依据通信标准的无线网络，或它们的组合进行无线通信。

对于一个实施例，(一个或多个)处理器102中的一个或多个可与控制模块104的一个或多个控制器(例如，存储器控制器模块)的逻辑加载在一起。对于一个实施例，(一个或多个)处理器102中的一个或多个可与控制模块104的一个或多个控制器的逻辑加载在一起以形成系统级加载。对于一个实施例，(一个或多个)处理器102中的一个或多个可与控制模块104的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例，(一个或多个)处理器102中的一个或多个可与控制模块104的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。

在各个实施例中，钻机智能语音交互控制系统100可以但不限于是：服务器、台式计算设备或移动计算设备(例如，膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中，钻机智能语音交互控制系统100可具有更多或更少的组件和/或不同的架构。例如，一种可替代的实施方式中，钻机智能语音交互控制系统100包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种钻机智能语音交互控制方法，其特征在于，应用于钻机智能语音交互控制系统，所述方法包括：

依据所述目标误差参数，对所述初始化神经网络进行网络参数更新，生成目标交互意图指令生成网络；

在依据所述目标误差参数，对所述初始化神经网络进行网络参数更新，生成目标交互意图指令生成网络的步骤之后，所述方法包括：

获取候选钻机智能交互语音数据；

依据所述目标交互意图指令分布，确定所述候选钻机智能交互语音数据中的目标交互意图指令，并基于所述目标交互意图指令执行钻机控制；

在基于所述目标交互意图指令执行钻机控制的步骤之后，所述方法还包括：

2.根据权利要求1所述的钻机智能语音交互控制方法，其特征在于，在获取多个钻机操作场景对应的模板钻机智能交互语音数据序列和所述模板钻机智能交互语音数据序列中每个模板钻机智能交互语音数据对应的标注交互意图指令数据的步骤之前，所述方法还包括：

3.根据权利要求2所述的钻机智能语音交互控制方法，其特征在于，所述一个或多个样例钻机智能交互语音数据包括一个或多个第一样例钻机智能交互语音数据，所述一个或多个第一样例钻机智能交互语音数据中均不包含交互意图指令，在依据所述多个钻机操作场景分别对应的一个或多个样例钻机智能交互语音数据，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据的步骤之前，所述方法还包括：

4.根据权利要求2所述的钻机智能语音交互控制方法，其特征在于，在依据所述多个钻机操作场景分别对应的一个或多个样例钻机智能交互语音数据，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据的步骤之前，所述方法还包括：

5.根据权利要求4所述的钻机智能语音交互控制方法，其特征在于，所述一个或多个样例钻机智能交互语音数据包括一个或多个第二样例钻机智能交互语音数据，所述一个或多个第二样例钻机智能交互语音数据中均包含交互意图指令；所述依据所述一个或多个样例钻机智能交互语音数据和所述一个或多个预设交互意图指令样例，生成所述模板钻机智能交互语音数据序列和所述标注交互意图指令数据，包括：

6.根据权利要求4所述的钻机智能语音交互控制方法，其特征在于，所述一个或多个样例钻机智能交互语音数据包括一个或多个第三样例钻机智能交互语音数据，所述一个或多个第三样例钻机智能交互语音数据中均不包含交互意图指令；

7.根据权利要求1所述的钻机智能语音交互控制方法，其特征在于，所述依据所述第二相关交互意图指令对应的指令迭代类别，对所述第二相关交互意图指令对应的候选交互意图指令进行指令迭代处理，生成迭代处理后的候选交互意图指令，包括：

或者，在所述第二相关交互意图指令对应的指令迭代类别为指令取消类别时，取消所述第二相关交互意图指令对应的候选交互意图指令；

或者，对所述任意一个候选钻机智能交互语音数据与所述指令补充类别对应的参考交互意图指令进行相关性比较，生成所述任意一个候选钻机智能交互语音数据对应的第三相关交互意图指令，依据所述第三相关交互意图指令，生成所述任意一个候选钻机智能交互语音数据对应的候选交互意图指令。

8.一种钻机智能语音交互控制系统，其特征在于，包括处理器以及计算机可读存储介质，所述计算机可读存储介质存储有机器可执行指令，所述机器可执行指令被处理器执行时实现权利要求1-7中任意一项所述的钻机智能语音交互控制方法。