CN117496971A

CN117496971A - 语音交互方法、服务器及计算机可读存储介质

Info

Publication number: CN117496971A
Application number: CN202311643937.6A
Authority: CN
Inventors: 王毅
Original assignee: Guangzhou Xiaopeng Motors Technology Co Ltd
Current assignee: Guangzhou Xiaopeng Motors Technology Co Ltd
Priority date: 2023-12-01
Filing date: 2023-12-01
Publication date: 2024-02-02

Abstract

本申请公开一种语音交互方法，所述方法包括：获取初始训练数据，根据第一预设模型确定初始训练数据中样本的多个标签推理结果，根据样本的多个标签推理结果确定初始训练数据中参考样本，在候选训练数据中选取与参考样本语义相近的目标样本，确定目标训练数据，利用目标训练数据训练第二预设模型以得到语音交互模型，根据语音交互模型完成语音交互。如此，本申请选取选训练数据中目标样本以确定目标训练数据，根据目标训练数据训练语音交互模型，训练时长得到保障。本申请根据样本推理结果确定参考样本，选取与参考样本语义相近的目标样本，目标样本的选取考虑到模型推理情况，可信度和有效性得到保障，语音交互模型的预测精度得到保障。

Description

语音交互方法、服务器及计算机可读存储介质

技术领域

本申请涉及语音交互技术领域，特别涉及一种语音交互方法、服务器及计算机可读存储介质。

背景技术

为满足用户的语音交互，车辆或与车辆联网的服务器中可搭载有训练完成的语音交互模型，以使得车辆可通过语音交互模型完成与用户的交互。然而，在语音交互模型的训练过程中，训练数据过多则会导致训练时间过长，训练数据过少则可能导致模型预测精度不佳。

发明内容

本申请提供了一种语音交互方法、服务器及计算机可读存储介质。

本申请实施方式提供一种语音交互方法，包括：

获取初始训练数据，所述初始训练数据包括多个样本；

根据第一预设模型，确定所述初始训练数据中样本的多个标签推理结果；

根据所述多个标签推理结果，确定所述初始训练数据中的参考样本；

在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据；

利用所述目标训练数据训练第二预设模型，得到语音交互模型，以根据所述语音交互模型完成所述语音交互。

本申请实施方式提供的语音交互方法中，服务器可获取由多个样本构成的初始训练数据，根据第一预设模型，确定初始训练数据中每个样本的多个标签推理结果，根据每个样本的多个标签推理结果，确定初始训练数据中的参考样本，在候选训练数据中选取与参考样本语义相近的目标样本，以确定目标训练数据，利用目标训练数据对第二预设模型进行训练，以根据完成训练的第二预设模型得到语音交互模型，进而能根据语音交互模型完成语音交互。

如此，在本申请实施方式中，服务器可根据选取数据量较大的候选训练数据中与参考样本语义相近的目标样本，以确定数据量较小的目标训练数据，及根据目标训练数据训练第二预设模型，以得到能用于语义交互的语音交互模型，使得语音交互模型的训练时长可得到保障。本申请实施方式的服务器可根据初始训练数据中各个样本的标签推理结果，确定初始训练数据中的参考样本，及选取候选训练数据中与参考样本语义相近的目标样本，使得目标样本的选取能考虑到第一预设模型的多次推理情况，目标样本的可信度和有效性在一定程度上得到保障，也因此，通过包括有目标样本的目标训练数据训练得到的语音交互模型的预测精度在一定程度上得到保障。

在本申请某些实施方式中，所述根据所述多个标签推理结果，确定所述初始训练数据中的参考样本，包括：

根据所述初始训练数据中，所述多个标签推理结果中存在预设数量的错误标签推理结果的样本，确定所述参考样本，所述错误标签推理结果包括与所述样本的标签存在差异的标签推理结果。

如此，本申请实施方式的服务器可在根据初始训练数据中，多个标签推理结果中存在预设数量的错误标签推理结果的样本，完成参考样本的确定，使得参考样本的推理难度可在一定程度上保障，进而，根据参考样本选取的目标样本的推理难度亦能保障，利用目标训练数据训练得到的语音交互模型的预测精度亦可得到保障。

在本申请某些实施方式中，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

根据所述候选训练数据中，与所述参考样本的相似度满足预设条件的所述目标样本，确定所述目标训练数据。

如此，本申请实施方式可根据候选训练数据中，与参考样本的相似度满足预设条件的样本来确定目标样本，由此在一定程度上保障有目标样本与参考样本的相似性，通过目标样本训练第二预设模型而产生的训练效果也能在一定程度上得到保障。

在本申请某些实施方式中，所述候选训练数据由预设的图谱数据确定，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

在所述图谱数据包括所述参考样本的情况下，选取所述候选训练数据内与所述参考样本语义相近的目标样本，以确定目标训练数据。

如此，本申请实施方式在候选训练数据由图谱数据确定，而图谱数据不包括初始训练数据中的参考样本的情况下，直接选取候选训练数据中与参考样本语义相近的目标样本以确定目标训练数据，进而，使得由目标训练数据训练得到语音交互模型能学习到语义相近的不同目标样本的区分方式，语音交互模型的可靠性和预测精度均能在一定程度上得到保障。

在本申请某些实施方式中，所述初始训练数据由预设的图谱数据确定，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

在所述图谱数据未包括所述参考样本的情况下，根据所述候选训练数据中，与所述参考样本语义相近且与所述参考样本对应的业务功能相匹配的目标样本，确定所述目标训练数据。

如此，本申请实施方式可选取候选训练数据中与参考样本语义相近，且与参考样本对应的业务功能相匹配的样本以作为目标样本，进而在通过由目标样本构成的目标训练数据执行第二预设模型的训练时，第二预设模型能学习到语义相似且业务功能匹配的样本的标签推理知识或标签推理能力，从而使第二预设模型的泛化能力在一定程度上提升。

在本申请某些实施方式中，所述第一预设模型包括多个，所述根据第一预设模型，确定所述初始训练数据中样本的多个标签推理结果，包括：

利用多个所述第一预设模型分别推理所述初始训练数据中样本，确定多个所述标签推理结果。

如此，本申请实施方式可根据多个第一预设模型对同一个样本进行推理，以得到由多个第一预设模型得到的多个标签推理结果，使得后续的参考样本可以由不同第一预设模型所对应的标签推理结果来确定，在一定程度上保障有参考样本的合理确定。

在本申请某些实施方式中，所述根据第一预设模型，确定所述初始训练数据中样本的多个标签推理结果，包括：

利用所述第一预设模型对所述初始训练数据中样本进行多次推理，确定多个所述标签推理结果。

如此，本申请实施方式的服务器可根据利用一个第一预设模型对初始训练数据中样本进行多次推理，从而得到一个样本的多个标签推理结果，进而能在一定程度上降低服务器调用第一预设模型所需的负荷。

在本申请某些实施方式中，所述方法还包括：

抽取原始训练数据中的样本以确定所述候选训练数据。

如此，本申请实施方式可通过抽取原始训练数据中的样本，以完成候选训练数据的确定，从而能避免直接对原始训练数据进行目标样本采样的情况出现，也使得候选训练数据的获取效率能在一定程度上得到保障。

在本申请某些实施方式中，所述抽取原始训练数据中的样本以确定所述候选训练数据，包括：

根据预先确定的业务功能与样本的对应关系，根据所述业务功能抽取所述原始训练数据中的样本以确定所述候选训练数据。

如此，本申请实施方式使得服务器可根据业务功能与样本的对应，抽取原始训练数据中各个业务功能的样本以构建候选训练数据，在一定程度上保障候选训练数据和目标训练数据中样本的合理分布。

在本申请某些实施方式中，所述方法还包括：

根据预设的图谱数据，确定所述原始训练数据。

如此，本申请实施方式的服务器可根据预先确定的图谱数据得到原始训练数据的样本，使得原始训练数据中样本的获取难度得以降低，样本获取效率得以保障。

本申请实施方式提供一种服务器，包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现上述的语音交互方法。

本申请实施方式提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现上述的语音交互方法。

本申请实施方式提供的服务器和计算机可读存储介质，可根据选取数据量较大的候选训练数据中与参考样本语义相近的目标样本，以确定数据量较小的目标训练数据，及根据目标训练数据训练第二预设模型，以得到能用于语义交互的语音交互模型，使得语音交互模型的训练时长可得到保障。本申请实施方式的服务器可根据初始训练数据中各个样本的标签推理结果，确定初始训练数据中的参考样本，及选取候选训练数据中与参考样本语义相近的目标样本，使得目标样本的选取能考虑到第一预设模型的多次推理情况，目标样本的可信度和有效性在一定程度上得到保障，也因此，通过包括有目标样本的目标训练数据训练得到的语音交互模型的预测精度在一定程度上得到保障。

本申请的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实施方式的实践了解到。

附图说明

本申请的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解，其中：

图1为本申请某些实施方式中语音交互方法的流程示意图；

图2为本申请某些实施方式中语音交互装置的示意图；

图3为本申请某些实施方式中语音交互方法的流程示意图。

具体实施方式

下面详细描述本申请的实施方式，实施方式的示例在附图中示出，其中，相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本申请的实施方式，而不能理解为对本申请的实施方式的限制。

为使模型具备如知识追踪任务和开放式问答任务等下游任务的处理能力，通常需构造或收集相应的样本以构建训练集，从而能通过训练集完成模型的训练。

在模型训练完成后，可对模型进行测试以检验模型的训练效果。例如，可根据开发人员可见的白盒测试集对模型进行测试，以验证模型的性能或训练效果。

在完成白盒测试后，开发人员可根据测试结果对模型进行增强训练，或者是，根据白盒测试集对训练集中的特定类型数据进行增强从而得到增强数据集。

然而，白盒测试集中通常包括数量较多的测试用例或测试样本，可能与训练集存在重合或重叠，进而，若直接将白盒测试集与训练集合并以得到增强数据集，则可能导致通过增强数据集进行模型训练时，模型训练所需的时间较长，并且，因增强数据集中存在重合样本，一旦重合样本的数量过多，则还可能导致模型因存在过拟合的情况。

以及，若是基于人工筛选出白盒测试集中的部分测试用例或训练样本，以根据筛选结果增强训练集，一则因人工筛选效率较低，二则人工筛选的成本可能较高，三则人工筛选出的样本数量一旦较少或是不足，可能出现通过增强后的训练集和增强前的训练集分别对模型进行训练后，增强前后的训练集对于模型的精度或训练效果无较大差异，模型预测精度无法达到预期。

基于上述可能遇到的问题，请参阅图1，本申请实施方式提供了一种语音交互方法，包括：

01：获取初始训练数据，初始训练数据包括多个样本；

02：根据第一预设模型，确定初始训练数据中样本的多个标签推理结果；

03：根据多个标签推理结果，确定初始训练数据中的参考样本；

04：在候选训练数据中，选取与参考样本语义相近的目标样本，以确定目标训练数据；

05：利用目标训练数据训练第二预设模型，得到语音交互模型，以根据语音交互模型完成语音交互。

请参阅图2，本申请实施方式提供了一种语音交互装置200。本申请实施方式的语音交互方法可以由本申请实施方式的语音交互装置200实现。具体地，语音交互装置200包括获取模块210、推理结果确定模块220、参考样本确定模块230、训练数据确定模块240及交互模块250。其中，获取模块210用于获取初始训练数据，初始训练数据包括多个样本。推理结果确定模块220用于根据第一预设模型，确定初始训练数据中样本的多个标签推理结果。参考样本确定模块230用于根据多个标签推理结果，确定初始训练数据中的参考样本。训练数据确定模块240用于在候选训练数据中，选取与参考样本语义相近的目标样本，以确定目标训练数据。交互模块250用于利用目标训练数据训练第二预设模型，得到语音交互模型，以根据语音交互模型完成语音交互。

本申请实施方式还提供了一种服务器，服务器包括存储器和处理器。本申请实施方式的语音交互方法可以由本申请实施方式的服务器实现。具体地，存储器中存储有计算机程序，处理器用于获取初始训练数据，初始训练数据包括多个样本；根据第一预设模型，确定初始训练数据中样本的多个标签推理结果；根据多个标签推理结果，确定初始训练数据中的参考样本；在候选训练数据中，选取与参考样本语义相近的目标样本，以确定目标训练数据；利用目标训练数据训练第二预设模型，得到语音交互模型，以根据语音交互模型完成语音交互。

具体而言，本申请实施方式的服务器可在得到白盒测试集的情况下，或者说，得到初始训练数据的情况下，调用预先训练完成的第一预设模型，对初始训练数据中的各个样本的标签进行推理或预测，以得出样本的多个标签预测结果或多个标签推理结果。服务器可根据多个标签推理结果，确定初始训练数据中具有代表性的参考样本。服务器可根据参考样本，从候选训练数据中抽取与参考样本语义相近的目标样本，进而得到基于目标样本构建目标训练数据。服务器可利用目标训练数据完成第二预设模型的训练，从而得到能用于语音交互的语音交互模型，由此可使车辆可根据语音交互模型完成与用户的语音交互。

其中，可以理解的是，本申请实施方式中的初始训练数据可以理解为白盒测试集。也因此，初始训练数据中的样本可理解为测试用例。以及，候选训练数据可以理解为包含大量样本如2千万条以上的样本的数据集合，且根据候选训练数据训练模型时可能存在训练时长较长，以及过拟合的情况。

还可以理解的是，初始训练数据和候选训练数据的获取方式均为可根据实际情况设置的内容。例如，在某些实施方式中，初始训练数据和候选训练数据均可根据车辆的历史语音交互日志得到，其中，历史语音交互日志包括多个记录，每条记录可包括用户的语音请求及车辆执行的操作指令，进而，初始训练数据和候选训练数据中，一个样本可为历史语音交互日志中一条记录内的语音请求，一个样本的标签可以理解为历史语音交互日志中一条记录内的车辆执行的操作指令。

可选的，在另一些实施方式中，初始训练数据或白盒测试集由服务器接收到的人工输入信息确定。

能理解的是，本申请实施方式中的初始训练数据、目标训练数据及其他训练数据(如原始训练数据)包括的数据除样本外，还包括样本(的)标签。其中，样本和标签可以理解为上述用户的语音请求和车辆执行的操作指令外，还可根据实际情况设置为其他形式或结构。例如，针对于问答式任务，样本则可以理解为问题，标签则可理解为答案。

以及，本申请实施方式的服务器根据第一预设模型确定出的标签推理结果可理解为第一预设模型根据输入的样本，对标签进行推理或预测而输出的结果，可表征第一预设模型确认的标签。

还能理解的是，本申请实施方式的服务器可根据标签推理结果确定初始训练数据中具有代表性的参考样本，但第一预设模型可能因偶发错误或偶发幻觉，意外地推理出错误标签或正确标签，因而对样本进行一次推理而得到的一个标签推理结果的可信度可能不高，故本申请实施方式的服务器可利用第一预设模型，对初始训练数据中每个样本均进行多次推理，由此可得到初始训练数据中每个样本的多个标签推理结果，进而，服务器可根据初始训练数据中每个样本的多个标签推理结果，可靠地选取或确认初始训练数据中具有代表性的参考样本。

需说明的是，根据每个样本的多个标签推理结果确定参考样本的具体过程为可根据实际情况设置的内容。

示范性的，本申请实施方式为保障第二预设模型可根据目标训练数据，学习到推理难度较高的样本的标签的知识，在本申请某些实施方式，服务器可在样本的多个标签推理结果均错误的情况下，也即是，在样本的多个标签推理结果均不为正确标签(GroundTruth)的情况下，将此样本确认为目标样本。

可以明确的，本申请实施方式中的学习难度和推理难度均可理解为第一预设模型或第二预设模型根据样本推理出正确标签的难度。

可选的，在本申请另一些实施方式中，本申请实施方式的服务器可根据样本的多个标签推理结果中，与样本标签不一致的错误标签推理结果的数量，按照错误标签推理结果的数量从高到低的顺序，对初始训练数据中的所有样本进行排序，及将排序后的初始训练数据中的前30％的样本作为目标样本。其中，若存在两个或两个以上的样本的多个标签推理结果中，均包括相同数量的错误标签推理结果，则两个或两个以上的样本的前后关系可随机设置，或是按照其他策略或方式设置。

还需说明的是，本申请实施方式的服务器在根据初始训练数据中每个样本的多个标签推理结果，确定出初始训练数据中的参考样本的情况下，可根据参考样本的语义和候选训练数据中各个样本的语义，选取出候选训练数据中与参考样本语义相近或相似的目标样本，进而可根据目标样本完成目标训练数据的构建，及根据目标训练数据完成第二预设模型或语音交互模型的训练。

能理解的是，参考样本语义相近或相似的目标样本虽然不为参考样本，但因参考样本和目标样本的语义相近，因而第二预设模型基于目标样本进行训练时，可能会学习到共通的知识或能力，从而能根据目标样本，学习到根据参考样本或与参考样本相似的目标样本，推理出正确标签的能力。

此外，还需说明的是，本申请实施方式中的第一预设模型和第二预设模型可以理解为两个不同的自然语言处理模型，也可以理解为同一个自然语言处理模型，具体可根据实际情况设置。

进一步地，本申请实施方式中的第一预设模型可以理解为具备一定自然语言处理能力的自然语言处理模型。具体而言，在本申请某些实施方式，目标训练数据可理解为通过目标样本对基准训练集进行数据增强而得到的训练集，而第一预设模型可以为通过基准训练集训练得到的模型。

以及，在本申请某些实施方式中，目标训练数据可理解为通过目标样本对基准训练集进行数据增强而得到的训练集，第二预设模型可以理解为尚未经过训练的自然语言处理模型。

而在另一些实施方式中，目标训练数据可理解为由目标样本构成的数据集合，进而，第二预设模型可以理解为已根据上述基准训练集进行过训练的模型，目标训练数据可用于对第二预设模型进行增强训练或再训练。

综上，在本申请实施方式中，服务器可根据选取数据量较大的候选训练数据中与参考样本语义相近的目标样本，以确定数据量较小的目标训练数据，及根据目标训练数据训练第二预设模型，以得到能用于语义交互的语音交互模型，使得语音交互模型的训练时长可得到保障。本申请实施方式的服务器可根据初始训练数据中各个样本的标签推理结果，确定初始训练数据中的参考样本，及选取候选训练数据中与参考样本语义相近的目标样本，使得目标样本的选取能考虑到第一预设模型的多次推理情况，目标样本的可信度和有效性在一定程度上得到保障，也因此，通过包括有目标样本的目标训练数据训练得到的语音交互模型的预测精度在一定程度上得到保障。

在本申请某些实施方式中，步骤03包括：

根据初始训练数据中，多个标签推理结果中存在预设数量的错误标签推理结果的样本，确定参考样本，错误标签推理结果包括与样本的标签存在差异的标签推理结果。

本申请实施方式的参考样本确定模块还用于根据初始训练数据中，多个标签推理结果中存在预设数量的错误标签推理结果的样本，确定参考样本，错误标签推理结果包括与样本的标签存在差异的标签推理结果。

本申请实施方式的处理器还用于根据初始训练数据中，多个标签推理结果中存在预设数量的错误标签推理结果的样本，确定参考样本，错误标签推理结果包括与样本的标签存在差异的标签推理结果。

具体而言，针对于每个样本，本申请实施方式的服务器可根据样本的标签，确定样本的多个标签推理结果中，与样本的标签存在差异的错误标签推理结果，或者说，与样本的标签不一致的错误标签推理结果。

以及，服务器还可各个样本的多个标签推理结果中包含的错误标签推理结果的数量，选取全部样本中的参考样本。也即是，在第一预设模型针对于同一个样本输出的多个标签推理结果中，存在预设数量或预设数量以上的错误标签推理结果时，则可认定第一预设模型推理出此样本的正确标签的难度较高，因而此样本可作为具有代表性的、推理难度较高的参考样本。

可以理解的是，本申请实施方式中的预设数量为可根据实际情况设置的内容。

示范性的，在本申请某些实施方式中，在服务器利用第一预设模型为初始训练数据中的每个样本均输出X个标签推理结果的情况下，预设数量可以是X的50％，以及，若X的50％为小数，则向下取整。

例如，服务器通过第一预设模型，得到每个样本的11个标签推理结果的情况下，预设数量则可以为5。进而，在任意一个样本的11个标签推理结果中，存在5个或5个以上的错误11个标签推理结果时，则此样本可被选取为参考样本。

在本申请某些实施方式中，步骤04包括：

根据候选训练数据中，与参考样本的相似度满足预设条件的目标样本，确定目标训练数据。

本申请实施方式的训练数据确定模块还用于根据候选训练数据中，与参考样本的相似度满足预设条件的目标样本，确定目标训练数据。

本申请实施方式的处理器还用于根据候选训练数据中，与参考样本的相似度满足预设条件的目标样本，确定目标训练数据。

具体而言，本申请实施方式可根据候选训练数据中各个样本与参考样本的相似度，确定候选训练数据中的目标样本，进而根据目标样本构建目标训练数据。

可以理解的是，确定样本与参考样本的相似度的具体方式为根据实际情况设置的内容。举例而言，在本申请某些实施方式中，候选训练数据中的样本包括字符串或文本段，因而候选训练数据中样本与参考样本的相似度可通过下式确定，即：

式中，r表示样本与参考样本相似度，sum表示样本与参考样本的字符串的长度总和，ldist表示类编辑距离。

以及，类编辑距离可理解为一字符串转换至另一个字符串所需执行的单字符编辑操作(插入、删除及替换)的数量。若两个字符串的转换需执行x₁次删除、x₂次插入及x₃次替换，则两个字符串的类编辑距离为(x₁+x₂+2x₃)。

还可以理解的是，预设条件为可根据实际情况设置的内容。

示范性的，在本申请某些实施方式中，服务器可按照与参考样本的相似度由高到低的顺序，对第一训练数据中的样本进行排序，及在排序后，选取相似度靠前的若干条样本以作为目标训练数据内的目标样本。也因此，在目标训练数据可包括J条目标样本的情况下，本申请实施方式中的预设条件可以包括：属于排序后的第一训练数据的前J个样本。

而在另一些实施方式中，预设条件为相似度大于或等于预设阈值。

还能理解的是，目标训练数据中的目标样本数量为可根据实际情况设置的内容，例如，在某些实施方式中，目标训练数据由上述的基准数据集和采样候选训练数据得到的目标样本构成，而在基准数据集包括Y条样本的情况下，采样候选训练数据而得到的目标样本的数量小于或等于Y。

在本申请某些实施方式中，候选训练数据由预设的图谱数据确定，进而，步骤04包括：

在图谱数据包括参考样本的情况下，选取候选训练数据内与参考样本语义相近的目标样本，以确定目标训练数据。

本申请实施方式的训练数据确定模块还用于在图谱数据包括参考样本的情况下，选取候选训练数据内与参考样本语义相近的目标样本，以确定目标训练数据。

本申请实施方式的处理器还用于在图谱数据包括参考样本的情况下，选取候选训练数据内与参考样本语义相近的目标样本，以确定目标训练数据。

具体而言，本申请实施方式的候选训练数据可以由预先设置的图谱数据得到，或者说，服务器可通过能包括或能表征不同类型或不同情况的样本的图谱，得到大量的样本从而构建候选训练数据。

以及，本申请实施方式的白盒测试集或初始训练数据可不由图谱数据得到，但可能存在图谱数据与初始训练数据重合的情况。或者说，初始训练数据中的一个或多个样本可以通过图谱数据生成。

进一步地，在确定出的参考样本为“可通过图谱数据生成或确定的样本”，也即，图谱数据可包括初始训练数据中的参考样本的情况下，本申请实施方式可直接将候选训练数据中，与参考样本相似的样本作为目标样本。

举例而言，在参考样本为“打开车窗”的情况下，则可选取候选训练数据中的“打开车门”、“打开车锁”等，与参考样本所对应的功能点(或业务功能)不一致的样本以作为目标样本。

由此，在根据由目标样本确定的目标训练数据进行第二预设模型的训练时，第二预设模型能根据与参考样本相似且属于同一个业务功能的目标样本，学习到与参考样本属于同类型且语义相似的目标样本的标签推理方式，从而提高第二预设模型或语音交互模型根据与参考样本相似的目标样本，推理出正确标签的能力。

以及，因是直接采样候选训练数据中与参考样本相似的样本以作为目标样本，故目标数据包括与参考样本的标签存在差异，但与参考样本语义相似的目标样本，进而，第二预设模型基于与参考样本的标签存在差异，但与参考样本语义相似的目标样本进行训练时，可学习到与参考样本语义相似但标签不同的目标样本，从而使模型能澄清与参考样本语义相似的多个目标样本的边界，或者说，能学习到区分语义差异较小但标签推理方式差异较大的不同目标样本的知识或能力。

此外，还可以理解的是，若是在图谱数据包括参考样本的情况下，选取候选训练数据内与参考样本语义相近，且与参考样本对应的业务通过相匹配的目标样本，来完成目标训练数据的确定，则可能导致第二预设模型在训练过程中存在过拟合问题。

举例而言，假设参考样本为“打开车窗”，候选训练数据中与参考样本语义相近，且与参考样本对应的业务功能相匹配的目标样本包括“打开车门”、“请帮我打开车门”及“请帮我打一下车门”，则第二预设模型可能在因为语义相似且推理方式相似的目标样本过多，导致过拟合，也使得后续进行实际推理时，语音交互模型接收到包括“车门”和“打开”的输入数据时，直接推理出与“打开车门”、“请帮我打开车门”及“请帮我打一下车门”的标签推理结果相同或相似的输出数据，导致输出数据与实际情况不符的情形出现。

在本申请某些实施方式中，步骤04包括：

在图谱数据未包括参考样本的情况下，根据候选训练数据中，与参考样本语义相近且与参考样本对应的业务功能相匹配的目标样本，确定目标训练数据。

本申请实施方式的训练数据确定模块还用于在图谱数据未包括参考样本的情况下，根据候选训练数据中，与参考样本语义相近且与参考样本对应的业务功能相匹配的目标样本，确定目标训练数据。

本申请实施方式的处理器还用于在图谱数据未包括参考样本的情况下，根据候选训练数据中，与参考样本语义相近且与参考样本对应的业务功能相匹配的目标样本，确定目标训练数据。

具体而言，本申请实施方式的服务器还可在图谱数据未包括或未覆盖参考样本的情况下，选取候选训练数据中，与参考样本的语义相近，且与参考样本对应的业务功能相匹配的样本以作为目标样本。

其中，业务功能可以理解为样本所归属或指向的车载系统功能。举例而言，在某些实施方式中，不同样本所对应的不同业务功能可包括：定时、车门锁开闭、空调开闭、空调温度调节及空调模式调节。

可以理解的是，在图谱数据未包括参考样本的情况下，也即是，无法通过图谱数据得到与参考样本完全一致的样本的情况下，若通过候选训练数据训练第二预设模型，则可能导致第二预设模型难以学习到与参考样本相近的样本的推理方法，因而服务器可尽量地召回或采样候选训练数据中，与参考样本在语义上相似且在业务功能上匹配的样本。

进而，根据目标训练数据中，与参考样本在语义上相似且在业务功能上匹配的目标样本，训练第二预设模型或语音交互模型时，可使得语音交互模型的泛化能力增强，从而能学习到语义相似且业务功能匹配的样本的标签推理知识或标签推理能力。

示范性的，假设参考样本为“车窗打开进程启动”，则本申请实施方式中可采样候选训练数据中的“打开车窗吧”、“请帮我开启车窗”及其他语义相近且业务功能匹配的样本。

可选的，在确定图谱数据未包括参考样本的情况下，本申请实施方式可根据参考样本更新图谱数据，以驱动图谱知识积累。

在本申请某些实施方式中，步骤02包括：

利用多个第一预设模型分别推理初始训练数据中样本，确定多个标签推理结果。

本申请实施方式的推理结果确定模块还用于利用多个第一预设模型分别推理初始训练数据中样本，确定多个标签推理结果。

本申请实施方式的处理器还用于利用多个第一预设模型分别推理初始训练数据中样本，确定多个标签推理结果。

具体而言，本申请实施方式可采用多模型投票的方式来确定参考样本，以避免模型预测不稳定的问题。

也即是，本申请实施方式可根据多个第一预设模型，分别对初始训练数据中每个样本进行一次推理，得到每个第一预设模型输出的一个标签推理结果，由此得到一个样本的多个标签推理结果。

进而，在后续的参考样本确定过程中，本申请实施方式可根据多个第一预设模型输出的多个标签推理结果中，正确的标签推理结果所表征的标签预测正确的模型，错误的标签推理结果所表征的标签预测有误的模型，完成参考样本的确定。

举例而言，在本申请某些实施方式中，服务器可调用11个第一预设模型来对初始训练数据中的每个样本进行推理，因而初始训练数据中的每个样本均与11个第一预设模型分别输出的标签推理结果相对应，或者说，1个样本对应11个第一预设模型的标签推理结果。

进一步地，若1个样本对应11个第一预设模型的标签推理结果中，5个第一预设模型的标签推理结果有误，6个第一预设模型的标签推理结果正确，则本申请实施方式可将此样本确定为参考样本。

相对的，若1个样本对应11个第一预设模型的标签推理结果中，1个第一预设模型的标签推理结果有误，11个第一预设模型的标签推理结果正确，则本申请实施方式可将此样本确定为非参考样本。

在本申请某些实施方式中，步骤02包括：

利用第一预设模型对初始训练数据中样本进行多次推理，确定多个标签推理结果。

本申请实施方式的推理结果确定模块还用于利用第一预设模型对初始训练数据中样本进行多次推理，确定多个标签推理结果。

本申请实施方式的处理器还用于利用第一预设模型对初始训练数据中样本进行多次推理，确定多个标签推理结果。

具体而言，本申请实施方式为降低服务器的负荷，故使服务器利用一个第一预设模型对初始训练数据中样本进行多次推理，从而得到一个样本的多个标签推理结果。

可以理解的是，相比于服务器调动多个第一预设模型分别对对初始训练数据中样本进行推理，以得到一个样本的多个标签推理结果的方式而言，因本申请实施方式的服务器可仅利用一个第一预设模型得到多个标签推理结果，从而能在一定程度上降低服务器调用第一预设模型所需的负荷。

在本申请某些实施方式中，语音交互方法还包括：

抽取原始训练数据中的样本以确定候选训练数据。

本申请实施方式的语音交互装置还包括抽取模块。抽取模块用于抽取原始训练数据中的样本以确定候选训练数据。

本申请实施方式的处理器还用于抽取原始训练数据中的样本以确定候选训练数据。

具体而言，本申请实施方式可通过对数据量较大的原始训练数据进行采样，得到并根据原始训练数据中的部分样本，完成候选训练数据的构建。其中，本申请实施方式中的原始训练数据可以为包括2亿到20亿条样本的数据集合。

在本申请某些实施方式中，上述抽取原始训练数据中的样本以确定候选训练数据的步骤，包括：

根据预先确定的业务功能与样本的对应关系，根据业务功能抽取原始训练数据中的样本以确定候选训练数据。

本申请实施方式的抽取模块还用于根据预先确定的业务功能与样本的对应关系，根据业务功能抽取原始训练数据中的样本以确定候选训练数据。

本申请实施方式的处理器还用于根据预先确定的业务功能与样本的对应关系，根据业务功能抽取原始训练数据中的样本以确定候选训练数据。

具体而言，本申请实施方式为保障目标训练数据能包括车辆不同业务功能的样本，故在抽取原始训练数据中样本的过程中，可根据预先确定的业务功能与样本的对应关系，抽取原始训练数据中每个业务功能所对应的样本，从而完成候选训练数据的构建。

举例而言，在本申请某些实施方式中，原始训练数据包括业务功能为B₁的样本X₁条，业务功能为B₂的样本X₂条，业务功能为B₃的样本X₃条，则服务器可抽取业务功能为B₁的样本X₁条中的X_1-1条，抽取业务功能为B₁的样本X₂中的X_2-1条，抽取业务功能为B₃的样本X₃条中的X_3-1条，进而，利用业务功能为B₁的X_1-1条样本、业务功能为B₂的X_2-1条样本及业务功能为B₃的X_3-1条样本，完成候选训练数据的构建。

在本申请某些实施方式中，语音交互方法还包括：

根据预设的图谱数据，确定原始训练数据。

本申请实施方式的语音交互装置还包括原始训练数据确定模块。原始训练数据确定模块用于根据预设的图谱数据，确定原始训练数据。

本申请实施方式的处理器还用于根据预设的图谱数据，确定原始训练数据。

具体而言，本申请实施方式为保障原始训练数据或候选训练数据的高效获取，故使服务器可通过预先设置的图谱数据，生成大量的数据，及根据大量的图谱生成数据，完成原始训练数据的构建或获取。

其中，本申请实施方式的图谱数据可以理解为覆盖有(或包含有)人工维护的不同类型或不同情况的样本数据的数据集合。如在某些实施方式中，图谱数据可包括有由人工得到的、不同业务功能所对应的样本数据。

可选的，在本申请某些实施方式中，具体可参阅图3，图3为本申请某些实施方式中语音交互方法的流程示意图。具体而言，本申请实施方式的服务器可利用多个第一预设模型，分别对初始训练数据或白盒测试及中的各个样本的标签进行一次推理，从而得到初始训练数据中每个样本的多个标签推理结果。

针对于初始训练数据中每个样本的多个标签推理结果，服务器可在样本的多个标签推理结果中，包括有预设数量或预设数量以上的错误标签推理结果时，将样本确定为参考样本。

根据图谱数据相对于参考样本的包含情况，服务器可按照不同的方式采样候选训练数据。其中，针对于可被图谱数据包括的参考样本，服务器可抽取候选训练数据中，与参考样本的语义相近的样本S1，以作为目标样本。

以及，针对于可被图谱数据包括的参考样本，服务器可抽取候选训练数据中，与参考样本的语义相近，且与参考样本对应的业务功能相匹配的样本S2，以作为目标样本。

服务器可将按照两种方式分别抽取的样本S1和S2合并，从而得到目标训练数据。

服务器可根据目标训练数据完成语音交互模型或第二预设模型的训练，及将训练完成的语音交互模型部署于自身或其他服务器或自身或车辆，使得车辆可根据本地部署的语音交互模型，或是部署在服务器的语音交互模型，完成与用户的语音交互。

可选的，在语音交互模型存在部署需要的情况下，服务器可对训练完成的语音交互模型进行量化、蒸馏训练、模型迁移及其他处理，以得到参数量降低后的语音交互模型，进而，再将参数量降低后的语音交互模型部署，以使被部署方如车辆，可通过较低的运行负荷来调用参数量降低后的语音交互模型。

本申请实施方式还提供一种计算机可读存储介质，存储有计算机程序，当计算机程序被一个或多个处理器执行时，实现上述语音交互方法。

在本说明书的描述中，参考术语“具体地”、“进一步地”、“特别地”、“可以理解地”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不预定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

尽管上面已经示出和描述了本申请的实施方式，可以理解的是，上述实施方式是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施方式进行变化、修改、替换和变型。

Claims

1.一种语音交互方法，其特征在于，包括：

获取初始训练数据，所述初始训练数据包括多个样本；

2.根据权利要求1所述的方法，其特征在于，所述根据所述多个标签推理结果，确定所述初始训练数据中的参考样本，包括：

3.根据权利要求1所述的方法，其特征在于，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

4.根据权利要求1所述的方法，其特征在于，所述候选训练数据由预设的图谱数据确定，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

5.根据权利要求1所述的方法，其特征在于，所述初始训练数据由预设的图谱数据确定，所述在候选训练数据中，选取与所述参考样本语义相近的目标样本，以确定目标训练数据，包括：

6.根据权利要求1所述的方法，其特征在于，所述第一预设模型包括多个，所述根据第一预设模型，确定所述初始训练数据中样本的多个标签推理结果，包括：

7.根据权利要求1所述的方法，其特征在于，所述根据第一预设模型，确定所述初始训练数据中样本的多个标签推理结果，包括：

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

抽取原始训练数据中的样本以确定所述候选训练数据。

9.根据权利要求8所述的方法，其特征在于，所述抽取原始训练数据中的样本以确定所述候选训练数据，包括：

10.根据权利要求8所述的方法，其特征在于，所述方法还包括：

根据预设的图谱数据，确定所述原始训练数据。

11.一种服务器，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现权利要求1-10任一项所述的方法。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现权利要求1-10任意一项所述的方法。