CN117077671A

CN117077671A - 一种交互数据生成方法及系统

Info

Publication number: CN117077671A
Application number: CN202311339134.1A
Authority: CN
Inventors: 周建军
Original assignee: Beijing Qingniu Technology Co ltd
Current assignee: Beijing Qingniu Technology Co ltd
Priority date: 2023-10-17
Filing date: 2023-10-17
Publication date: 2023-11-17
Anticipated expiration: 2043-10-17
Also published as: CN117077671B

Abstract

本发明公开了一种交互数据生成方法及系统，方法包括数据采集、数据预处理、基于神经网络建立交互模型、模型参数调整和实时交互。本发明属于数据处理技术领域，具体是指一种交互数据生成方法及系统，本方案基于权重归一化加快模型收敛速度，提高模型的稳定性和准确性；基于设计可学习的分段式激活函数和加入衰减网络权值的损失函数提高模型的拟合能力，同时避免过拟合，提高模型的泛化能力，利用基于衰减项的梯度调整参数提高模型性能；采用计算移动概率以达到高效搜索，基于自适应步长和控制调节参数灵活调整参数位置，根据条件判定机制提高搜索精准性。

Description

一种交互数据生成方法及系统

技术领域

本发明涉及数据处理技术领域，具体是指一种交互数据生成方法及系统。

背景技术

交互数据生成方法是指利用技术手段生成逼真且可用于模型训练或系统测试的人机对话数据。但是一般交互模型存在过拟合，收敛速度慢，无法适应复杂的数据分布从而导致模型性能差的问题；一般参数搜索方法存在搜索范围过大导致搜索速度慢，搜索容易陷入局部最优从而搜索不精准的问题。

发明内容

针对上述情况，为克服现有技术的缺陷，本发明提供了一种交互数据生成方法及系统，针对一般交互模型存在过拟合，收敛速度慢，无法适应复杂的数据分布从而导致模型性能差的问题，本方案基于权重归一化加快模型收敛速度，提高模型的稳定性和准确性；基于设计可学习的分段式激活函数和加入衰减网络权值的损失函数提高模型的拟合能力，同时避免过拟合，提高模型的泛化能力，利用基于衰减项的梯度调整参数提高模型性能；针对一般参数搜索方法存在搜索范围过大导致搜索速度慢，搜索容易陷入局部最优从而搜索不精准的问题，本方案采用计算移动概率以达到高效搜索，基于自适应步长和控制调节参数灵活调整参数位置，根据条件判定机制提高搜索精准性。

本发明采取的技术方案如下：本发明提供的一种交互数据生成方法，该方法包括以下步骤：

步骤S1：数据采集，采集用户对话语句和回复语句；

步骤S2：数据预处理，基于数据清洗、分词和文本向量化对数据预处理；

步骤S3：基于神经网络建立交互模型，利用权重归一化，设计可学习的分段式激活函数和加入衰减网络权值的损失函数，并利用基于衰减项的梯度调整参数，共同构建神经网络，以此建立交互模型；

步骤S4：模型参数调整，将改进的sigmoid函数加入参数更新公式，结合移动概率对参数位置更新，基于条件阈值判断是否达到全局最优；

步骤S5：实时交互。

进一步地，在步骤S1中，将采集的对话语句作为样本数据，回复语句作为对应标签。

进一步地，在步骤S2中，所述数据预处理是将采集的数据进行数据清洗、分词，并基于词袋模型将文本向量化，将文本向量化后的样本数据集及对应标签作为样本集。

进一步地，在步骤S3中，所述基于神经网络构建交互模型具体包括以下步骤：

步骤S31：步骤S31：权重归一化，将权重归一化到区间[-c1，c1]，c1的计算公式如下：

；

式中，是归一化数值常数，G_m和G_m+1分别是权重前后的隐藏层大小；

步骤S32：设计可学习的分段式激活函数h（），所用公式如下：

；

式中，x是输入，S_n是分段数，s是分段索引，是第s个正分段的参数化系数，max（）是max函数，b^s是偏移量，/>是第s个负分段的参数化系数；

步骤S33：计算初始损失函数T，所用公式如下：

；

式中，α_T和β_T是损失权重系数，i是样本索引，n是样本的数量，b是真实的标签值，c是模型预测的标签值，A是样本x的特征，P（）是条件概率；

步骤S34：设计总损失函数，设置衰减网络权值γ，将T1正则化和T2正则化的损失函数加权求和作为总损失函数，T1正则化和T2正则化的损失函数计算公式如下式所示：

；

式中，n_m是权重参数的数量，J是权重参数；

步骤S35：清零，当返回梯度更新权值时，连接到该节点的权值不再更新，执行清零操作，过程表示如下：

g=dk（Lg）；

式中，g是连接节点的权重，d是节点输出的梯度，k是清零操作，Lg是损失函数在节点的梯度；

步骤S36：调整参数，步骤如下：

步骤S361：计算梯度的衰减项，所用公式如下：

；

式中，p_t和q_t是衰减项，t是迭代次数，S是最终的损失函数，λ是可学习参数的集合，是参数的梯度，α₁和α₂是衰减系数；

步骤S362：更新权重，所用公式如下：

；

式中，k是平滑项，ε是学习率；

步骤S37：交互模型建立，预先设有损失阈值，基于上述构建神经网络，当损失函数低于损失阈值时，交互模型建立完成。

进一步地，在步骤S4中，所述模型参数调整具体包括以下步骤：

步骤S41：初始化，初始化参数搜索空间，初始化参数位置，将参数位置对步骤S3建立的神经网络预测正确率作为适应度值；

步骤S42：计算移动概率，所用公式如下：

；

式中，P_ij（t）是参数个体i向参数个体j移动的概率，l_j（t）、l_i（t）和l_k（t）分别是个体j、个体i和个体k的适应度值，N_i（t）是个体i的邻域，k是邻域个体的索引；

步骤S43：更新参数位置，预先设有最大迭代次数，所用公式如下：

；

式中，s₀是步长，X_i（t+1）是参数更新后的位置，X_i（t）是参数更新前的位置，t是当前迭代次数，ζ是避免为零的极小的正数，Γ是控制更新速率的调节参数；X_j（t）是个体j的位置，t_max是最大迭代次数；

步骤S44：条件判定，预先设有判定阈值，当存在参数个体的适应度值高于判定阈值时，基于当前个体的参数建立交互模型；若达到最大迭代次数，则返回步骤S41重新初始化参数位置进行搜索；否则返回步骤S42继续搜索。

进一步地，在步骤S5中，所述实时交互是将客户的对话语句输入至交互模型中，将模型的输出作为回复语句，以此达到交互数据生成。

本发明提供的一种交互数据生成系统，包括数据采集模块、数据预处理模块、交互模型建立模块、模型参数调整模块和实时交互模块；

所述数据采集模块采集用户对话语句和回复语句，并将数据发送至数据预处理模块；

所述数据预处理模块接收数据采集模块发送的数据，基于数据清洗、分词和文本向量化对数据预处理，并将数据发送至交互模型建立模块；

所述交互模型建立模块接收数据预处理模块发送的数据，利用权重归一化，设计可学习的分段式激活函数和加入衰减网络权值的损失函数，并利用基于衰减项的梯度调整参数，共同构建神经网络，以此建立交互模型，并将数据发送至模型参数调整模块；

所述模型参数调整模块接收交互模型建立模块发送的数据，将改进的sigmoid函数加入参数更新公式，结合移动概率对参数位置更新，基于条件阈值判断是否达到全局最优，并将数据发送至实时交互模块；

所述实时交互模块接收模型参数调整模块发送的数据，将客户的对话语句输入至交互模型中，将模型的输出作为回复语句，以此达到交互数据生成。

采用上述方案本发明取得的有益效果如下：

（1）针对一般交互模型存在过拟合，收敛速度慢，无法适应复杂的数据分布从而导致模型性能差的问题，本方案基于权重归一化加快模型收敛速度，提高模型的稳定性和准确性；基于设计可学习的分段式激活函数和加入衰减网络权值的损失函数提高模型的拟合能力，同时避免过拟合，提高模型的泛化能力，利用基于衰减项的梯度调整参数提高模型性能。

（2）针对一般参数搜索方法存在搜索范围过大导致搜索速度慢，搜索容易陷入局部最优从而搜索不精准的问题，本方案采用计算移动概率以达到高效搜索，基于自适应步长和控制调节参数灵活调整参数位置，根据条件判定机制提高搜索精准性。

附图说明

图1为本发明提供的一种交互数据生成方法的流程示意图；

图2为本发明提供的一种交互数据生成系统的示意图；

图3为步骤S3的流程示意图；

图4为步骤S4的流程示意图。

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例；基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要理解的是，术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

实施例一，参阅图1，本发明提供的一种交互数据生成方法，该方法包括以下步骤：

步骤S1：数据采集，采集用户对话语句和回复语句；

步骤S5：实时交互。

实施例二，参阅图1，该实施例基于上述实施例，在步骤S1中，将采集的对话语句作为样本数据，回复语句作为对应标签。

实施例三，参阅图1，该实施例基于上述实施例，在步骤S2中，所述数据预处理是将采集的数据进行数据清洗、分词，并基于词袋模型将文本向量化，将文本向量化后的样本数据集及对应标签作为样本集。

实施例四，参阅图1和图3，该实施例基于上述实施例，在步骤S3中，基于神经网络构建交互模型具体包括以下步骤：

；

步骤S33：计算初始损失函数T，所用公式如下：

；

式中，n_m是权重参数的数量，J是权重参数；

g=dk（Lg）；

步骤S36：调整参数，步骤如下：

步骤S361：计算梯度的衰减项，所用公式如下：

；

步骤S362：更新权重，所用公式如下：

；

式中，k是平滑项，ε是学习率；

通过执行上述操作，针对一般交互模型存在过拟合，收敛速度慢，无法适应复杂的数据分布从而导致模型性能差的问题，本方案基于权重归一化加快模型收敛速度，提高模型的稳定性和准确性；基于设计可学习的分段式激活函数和加入衰减网络权值的损失函数提高模型的拟合能力，同时避免过拟合，提高模型的泛化能力，利用基于衰减项的梯度调整参数提高模型性能。

实施例五，参阅图1和图4，该实施例基于上述实施例，在步骤S4中，模型参数调整具体包括以下步骤：

步骤S42：计算移动概率，所用公式如下：

；

通过执行上述操作，针对一般参数搜索方法存在搜索范围过大导致搜索速度慢，搜索容易陷入局部最优从而搜索不精准的问题，本方案采用计算移动概率以达到高效搜索，基于自适应步长和控制调节参数灵活调整参数位置，根据条件判定机制提高搜索精准性。

实施例六，参阅图1，该实施例基于上述实施例，在步骤S5中，实时交互是将客户的对话语句输入至交互模型中，将模型的输出作为回复语句，以此达到交互数据生成。

实施例七，参阅图2，该实施例基于上述实施例，本发明提供的一种交互数据生成系统，包括数据采集模块、数据预处理模块、交互模型建立模块、模型参数调整模块和实时交互模块；

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

以上对本发明及其实施方式进行了描述，这种描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.一种交互数据生成方法，其特征在于：该方法包括以下步骤：

步骤S1：数据采集，采集用户对话语句和回复语句；

步骤S5：实时交互。

2.根据权利要求1所述的一种交互数据生成方法，其特征在于：在步骤S3中，所述基于神经网络构建交互模型具体包括以下步骤：

步骤S31：权重归一化，将权重归一化到区间[-c1，c1]，c1的计算公式如下：

；

步骤S33：计算初始损失函数T，所用公式如下：

；

式中，n_m是权重参数的数量，J是权重参数；

g=dk（Lg）；

步骤S36：调整参数，步骤如下：

步骤S361：计算梯度的衰减项，所用公式如下：

；

步骤S362：更新权重，所用公式如下：

；

式中，k是平滑项，ε是学习率；

3.根据权利要求1所述的一种交互数据生成方法，其特征在于：在步骤S4中，所述模型参数调整具体包括以下步骤：

步骤S42：计算移动概率，所用公式如下：

；

4.根据权利要求1所述的一种交互数据生成方法，其特征在于：在步骤S2中，所述数据预处理是将采集的数据进行数据清洗、分词，并基于词袋模型将文本向量化，将文本向量化后的样本数据集及对应标签作为样本集。

5.根据权利要求1所述的一种交互数据生成方法，其特征在于：在步骤S1中，将采集的对话语句作为样本数据，回复语句作为对应标签；

在步骤S5中，所述实时交互是将客户的对话语句输入至交互模型中，将模型的输出作为回复语句，以此达到交互数据生成。

6.一种交互数据生成系统，用于实现如权利要求1-5中任一项所述的一种交互数据生成方法，其特征在于：包括数据采集模块、数据预处理模块、交互模型建立模块、模型参数调整模块和实时交互模块；