CN116306684A

CN116306684A - 基于自然语言的网络管控交互方法和装置

Info

Publication number: CN116306684A
Application number: CN202310318392.5A
Authority: CN
Inventors: 袁彩霞; 高晖; 王小捷; 许文俊; 张平
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2023-03-28
Filing date: 2023-03-28
Publication date: 2023-06-23

Abstract

本申请公开了一种基于自然语言的网络管控交互方法和装置，其中方法包括：第一智能体利用预训练的自然语言生成模型，将当前的网络管控意图转换为自然语言指令并发送给第二智能体；所述第二智能体利用预训练的自然语言解析模型，对接收到的所述自然语言指令进行网络管控意图和相应槽信息的提取，得到相应的网络配置参数。采用本申请，可以提升网络管控交互的扩展性和鲁棒性。

Description

基于自然语言的网络管控交互方法和装置

技术领域

本发明涉及网络管理技术，特别是涉及一种基于自然语言的网络管控交互方法和装置。

背景技术

随着网络需求的不断上升和网络通信技术的不断发展，未来网络通信必将迈入智能化、自主化时代。传统的以收发和中继为主要功能的网络元素也将逐渐发展为具有智能化、自主化交互和决策的新型网络智能体。智能化交互需要统一的交互语言和协议簇作为基础，同时需要满足高鲁棒、高效率、高扩展等性能要求。围绕多个网元之间采用何种语言进行交互这一问题，学者们开展了诸多有效的研究。

传统网络管理方案中采用人工语言(即符合网络管理协议规定的语法规范的语言)开展网元之间的交互。例如简单网络管理协议(SNMP)通过定义协议数据单元(ProtocolData Unit，PDU)和基本编码规则(Basic Encoding Rules，BER)，将管理器和代理器之间的交互消息封装成标准语言，消息的发端和收端只需要遵守预先设定的语法规范，即可完成消息的封装和解析。

发明人在实现本发明的过程中发现：新型网络智能体之间若仍采用传统的人工语言交互方式，会存在扩展性差以及鲁棒性差的问题。具体分析如下：

一、人工语言需要依据既定的语法规范实现，而一旦语法规范确定了，所表示的消息类型也会随之确定，当有新的消息需求提出时，就需要为该新的消息需求生成相应的语法规范，以满足对该新的消息需求的表达，因此，受限于对人工语言语法规范的依赖，而存在可扩展性差的问题。

二、基于人工语言的消息指令在物理信道传输时会因为信道噪声的影响而出现错误比特，如此，容易导致接收端收到的消息要么无法解析，要么被错误解析，因此，受限于物理信道噪声的存在，而存在鲁棒性差的问题。

发明内容

有鉴于此，本发明的主要目的在于提供一种基于自然语言的网络管控交互方法和装置，可以提升网络管控交互的扩展性和鲁棒性。

为了达到上述目的，本发明实施例提出的技术方案为：

一种基于自然语言的网络管控交互方法，包括：

第一智能体利用预训练的自然语言生成模型，将当前的网络管控意图转换为自然语言指令并发送给第二智能体；

所述第二智能体利用预训练的自然语言解析模型，对接收到的所述自然语言指令进行网络管控意图和相应槽信息的提取，得到相应的网络配置参数。

本发明实施例还提出一种基于自然语言的网络管控交互装置，包括：

自然语言生成模块，用于利用预训练的自然语言生成模型，将当前的网络管控意图转换为自然语言指令并发送给第二智能体；

自然语言解析模块，用于利用预训练的自然语言解析模型，对所述第二智能体接收到的所述自然语言指令进行网络管控意图和相应槽信息的提取，得到相应的网络配置参数。

本发明实施例还提出一种基于自然语言的网络管控交互设备，包括处理器和存储器；

所述存储器中存储有可被所述处理器执行的应用程序，用于使得所述处理器执行如上所述基于自然语言的网络管控交互方法。

本发明实施例还提出一种计算机可读存储介质，其中存储有计算机可读指令，该计算机可读指令用于执行如上所述基于自然语言的网络管控交互方法。

综上所述，本发明实施例提出的基于自然语言的网络管控交互方案中，网络管控决策发送端智能体(即第一智能体)，利用预训练的自然语言生成模型，将当前的网络管控意图转换为自然语言指令并发送给网络管控决策执行端智能体(即第二智能体)；执行端智能体接收到的所述自然语言指令后，利用预训练的自然语言解析模型，对该自然语言指令进行网络管控意图和相应槽信息的提取，从而得到该自然语言指令的相应网络配置参数。如此，由于智能体之间传输的是具有语义信息的自然语言指令，使得即使传输噪声导致了错误比特依然不影响正确理解自然语言指令的语义信息。因此，可以利用自然语言指令的语义信息，降低传输噪声导致的错误比特带来的影响，获得正确的网络管控意图和关键槽信息，从而可以利用自然语言(即人与人之间交互使用的语言)的语义鲁棒性提高网络管控交互的鲁棒性。另外，由于无需事先设计智能体交互使用的交互语法和指令集合，而是利用离线训练好的自然语言生成模型和自然语言解析模型，在发送端，自动生成包含管控意图的自然语言指令，发送给接收端智能体；在接收端，将自然语言指令自动解析为具体的网络配置动作，如此，可以借助语言模型强大的生成能力，满足新的消息需求的表达，从而可以抵御现有人工协议语言的受限性，提升了网络管控交互的扩展性。

附图说明

图1为本发明实施例的方法流程示意图；

图2为本发明实施例的具体实施示意图；

图3为本发明实施例的装置结构意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图及具体实施例对本发明作进一步地详细描述。

图1为本发明实施例的基于自然语言的网络管控交互方法流程示意图，如图1所示，该实施例主要包括下述步骤：

步骤101、第一智能体利用预训练的自然语言生成模型，将当前的网络管控意图转换为自然语言指令并发送给第二智能体。

本步骤，与基于现有网络管理协议进行交互的方案所不同的是，消息发送端智能体(即第一智能体)与消息接收端智能体(即第二智能体)之间交互的是具有网络管控语义信息的自然语言指令，而非是基于某一网管协议的语法规范构建的网络管控指令，如此，可以利用自然语言指令的语义鲁棒性提升网络管控交互的鲁棒性，同时，可以利用借助语言模型强大的生成能力，提升网络管控交互的扩展能力，灵活便捷地满足新的消息需求的表达，而不如现有网管交互方案一样，需要先对网管协议进行更新，为新的消息需求生成相应的语法规范并增加至网管协议中，因此，可以大幅度提升网络管控交互的可扩展性。

在实际应用中，可以采用现有的网络通信协议，将用于网络管控的自然语言指令发送给第二智能体，在此不再赘述。

一种实施方式中，预先可以采用下述步骤a1～a4训练自然语言生成模型：

步骤a1、将训练样本的网络管控意图序列，输入所述自然语言生成模型的第一编码器进行编码，得到意图表示向量i。

本步骤，用于基于训练样本的网络管控意图序列，编码得到相应的意图表示向量i。

所述第一编码器具体可以实施为一双向长短时记忆网络(Long-Short TermMemory，LSTM)。

例如，对于一个多意图管控指令“Move&Request_Report”，可以编码得到相应的意图表示向量i，i∈R^d×1，d为LSTM隐层向量的长度。

步骤a2、将所述网络管控意图序列中的每个意图和相关联的槽信息，输入所述自然语言生成模型的第二编码器进行编码，得到意图和槽信息表示向量s。

本步骤，用于基于训练样本的网络管控意图序列和其中各意图关联的槽信息进行编码，得到意图和槽信息表示向量s。

所述第二编码器具体可以实施为一双向长短时记忆网络。

本步骤中，需要将每个意图和其所关联的槽信息(包括槽类型和槽值)拼接到一起后输出至第二编码器中进行编码，得到相应的意图和槽信息表示向量s。

例如，输入至第二编码器的信息为“Move＜Location＝左前方>&Request_Report＜Info＝SNR＞”，进行编码后得到意图和槽信息表示向量s，s∈R^d×1，d为LSTM隐层向量的长度。

步骤a3、将所述意图表示向量i和所述意图和槽信息表示向量s拼接后，输入所述自然语言生成模型的解码器进行解码，基于解码得到的词分布，得到所述网络管控意图序列对应的自然语言指令。

本步骤，用于将上述步骤a1和a2编码器的隐层向量i和s的拼接，输入一个解码器，进行解码处理，在每时刻生成一个词的分布p_t，从而可以基于解码得到的词分布，得到所述网络管控意图序列对应的自然语言指令。

步骤a4、基于自然语言生成模型的输出结果，采用语义一致性约束，生成所述自然语言生成模型的总损失函数。

本步骤中，为了使得自然语言指令能准确地表达网络管控意图，基于步骤a1～a3得到的处理结果，采用语义一致性约束，生成自然语言生成模型的总损失函数。

一种实施方式中，步骤a4中具体可以按照公式：

生成所述自然语言生成模型的总损失函数loss(θ)。

其中，p_t为所述自然语言生成模型输出的词分布，y_t为所述样本数据的参考词分布，i_t+1和i_t分别为第t+1时刻和第t时刻要表达的意图向量，T为解码器输出的词序列的长度。i₀被初始化为意图编码器得到的意图表示向量i，即：i₀＝i，i_T是解码结束时刻待表达的意图向量。通过一个控制器σ_t记录在t时刻以后需要继续解码的意图，完成i_t的更新：

σ_t＝sigmoid(W_yy_t+W_hh_t-1)

i_t+1＝σ_t⊙i_t

其中，W_y和W_h为可训练的模型参数，⊙表示向量的逐点相乘。

τ和

均为预设的调和参数，0＜τ＜1，/>

具体本领域技术人员可以根据实际需要，在上述取值范围内设置τ和/>

的合适取值，例如，τ可以为0.90，/>

可以为1.01，但不限于此。

上述损失函数包括三个部分，其中，

为解码器的正确性约束，

为不重复约束，||i_T||为无遗漏约束。

上述利用自然语言生成模型实现的基于意图驱动的自然语言生成方法，使用序列学习模型建模管控意图表示的语义序列。并且，在语义一致性的约束下，能够进一步保证生成的自然语言句子准确表达智能体的交互意图。

步骤102、所述第二智能体利用预训练的自然语言解析模型，对接收到的所述自然语言指令进行网络管控意图和相应槽信息的提取，得到相应的网络配置参数。

本步骤中，由于接收端智能体接收的是自然语言指令，因此，需要采用相应的自然语言解析模型对其进行解析，从中提取出网络管控意图和相应槽信息，从而得到相应网络管控的配置参数。

这里，自然语言解析模型包括意图识别和槽值标注两个子任务，共同构成自然语言指令的语义框架。其中，意图识别是指识别不同类型的管控任务，例如“询问”“否认”等。槽值标注指识别出自然语言指令包含的信息槽并标注其槽值，例如“IP地址”“SNR”等。槽值标注又称为槽填充技术，主要采用序列标注的方法，为自然语言指令中的字或词打上槽类别标签。

在实际指令传输过程中，由于通信过程中存在信道干扰，接收端智能体收到的文本序列可能存在错误，将带有噪声的文本序列输入到自然语言理解模块，会导致解码出来的自然语言序列出现偏差。例如，“查询信噪比”被错误解码为“嫘询信噪鞴”，“开机组网”被错误解码出“开机體网”等。

针对上述问题，为了进一步提高网络管控交互的鲁棒性，一种实施方式中，预先可以采用对抗学习的方式，训练自然语言解析模型，即从大规模预训练语言模型和对抗学习两个方面，同时提升自然语言理解的鲁棒性。较佳地可以采用下述步骤b1～b4实现这一目的。

步骤b1、将训练样本的句子序列X，输入所述自然语言解析模型的编码器，对所述句子序列进行编码，得到所述句子序列X的语义向量h_[cls]。

本步骤中的编码器具体可以实施为BERT编码器。

假设，句子序列

其中T表示句子序列的长度，经过BERT编码器对句子进行编码，得到编码输出隐藏层向量

具体可以采用下述公式表征：

H＝BERT(X)

其中，h_[cls]∈R^d×1表示句子序列的语义编码结果(即语义向量)，d为编码器使用的语义向量的长度。将该语义编码将在后续步骤中用于对句子的降噪和解析处理。

步骤b2、将所述语义向量h_[cls]，输入所述自然语言解析模型的意图识别网络，对其包含的意图与槽类型组合进行预测；每个所述意图与槽类型组合由一种意图和该种意图所关联的一种槽类型组成。

本步骤用于识别自然语言指令中的管控意图及意图绑定的槽类型，相应的模型任务为句子到意图-槽的多分类任务。

所述意图识别网络具体可以实施为一个全连接网络层MLP_intent-slot。相应地，本步骤中需要将句子的语义向量h_[cls]，输入到该全连接网络层MLP_intent-slot中，对可能出现的意图-槽类型进行预测，该预测具体可以采用下述公式表征：

I_o＝σ(W_hih_[cls]+b_i)

其中，W_hi和b_i为可训练的模型参数，σ表示激活函数，I_o＝{I₁，I₂，...，I_I}，I表示所有意图-槽的个数。将I_o输入softmax函数获得每个意图-槽类型的预测概率p_i。

步骤b3、基于所述语义向量h_[cls]，利用所述自然语言解析模型的槽值识别网络，预测每个所述意图与槽类型组合对应的槽值。

本步骤，用于为识别出的意图-槽类型生成相应的槽值。输入句子序列X和意图-槽类型，预测该意图-槽类型下的槽值。

一种实施方式中，槽值识别网络可以实施为分类器MLP_value，为每一类意图-槽类型I_n，设置一个分类器MLP_value来预测该意图-槽所对应的槽值。本步骤的预测具体可以表征为下述公式：

S_o＝σ(W_hsh_{i_[cls]}+b_s)

其中，W_hs和b_s为可训练的模型参数，σ表示激活函数，S_o＝{S₁，S₂，...，S_V}，V表示所有候选槽值的个数。h_{i_[cls]}为将意图-槽类型I_n对应的类别标签作为句子序列X的前缀，经过BERT编码后得到的语义向量。将S_o输入softmax函数获得每个意图-槽类型对应的候选槽值的概率p_v。

步骤b4、基于所述语义向量h_[cls]、所述句子序列X对应的噪声文本

的语义向量

所述意图与槽类型组合和所述槽值，计算所述自然语言解析模型的总损失函数值；利用所述总损失函数值对所述自然语言解析模型的参数进行优化调整；其中，所述噪声文本/>

基于所述句子序列X在噪声环境下生成，所述语义向量/>

为所述噪声文本/>

输入所述编码器编码得到。

这里，为了增加模型抵御噪声的能力，在计算自然语言解析模型的总损失函数值时，需要考虑对抗任务的训练，即基于所述语义向量h_[cls]和相应的噪声文本

的语义向量

计算损失函数，以获得具有降噪功能的编码器，使得模型可以输出原始正确的指令(即未加噪之前的自然语言指令)，从而可以进一步提升模型在噪声环境下的语义理解和符号还原能力。

在实际应用中，所述噪声文本

可以采用现有方法生成。较佳地，一种实施方式中可以采用下述步骤d1～d4生成噪声文本/>

步骤d1、对所述句子序列X转化0-1比特流。

上述0-1比特流即由比特1和比特0构成的比特流。具体地，可以利用Unicode编码，将所述句子序列X转化为0-1比特流，但不限于此，也可以采用其他可以获得0-1比特流的方案，在此不再赘述。

步骤d2、利用正弦波对所述0-1比特流进行调制。

步骤d3、利用引入了衰落和噪声的信道，传输所述调制的结果给目标接收端。

步骤d4、所述目标接收端对接收到所述调制的结果进行解调，并对解调结果进行解码，得到所述噪声文本

采用上述步骤，在噪声环境下，生成的句子序列X对应的噪声文本

之后，将噪声文本/>

输入编码器中编码，即/>

得到编码输出隐藏层向量/>

如此，即可得到噪声句子序列/>

的语义向量/>

一种实施方式中，具体可以采用下述方法计算所述自然语言解析模型的总损失函数值：

步骤c1、计算所述语义向量h_[cls]和所述语义向量

的余弦损失函数，得到第一损失函数。

本步骤，用于计算语义向量h_[cls]和语义向量

的余弦损失，作为相似度损失函数。具体可以表征为下述公式：

其中，L_SIM表示第一损失函数，h_i表示语义向量h_[cls]中的第i个元素，

表示语义向量/>

中的第i个元素，d表示语义向量h_[cls]或/>

中的元素数量。

步骤c2、基于所述意图识别网络输出的所述意图与槽类型组合，计算第二损失函数值。

为了便于实现，一种实施方式中，可以采用交叉熵损失函数计算第二损失函数值，具体损失函数计算公式如下：

其中，L_Intent为第二损失函数，p_i为意图-槽类型的预测概率，y_i为意图-槽类型的真实概率，I为所有意图-槽类型的个数。

在实际应用中也可以采用其他损失函数计算，在此不再赘述。

步骤c3、基于所述意图识别网络输出的所述槽值，计算第三损失函数值。

为了便于实现，一种实施方式中，可以采用交叉熵损失函数计算第三损失函数值，具体损失函数计算公式如下：

其中，L_Value为第三损失函数，p_v为候选槽值的预测概率，y_v为候选槽值的真实概率，V表示所有候选槽值的个数。

步骤c4、对所述第一损失函数、所述第二损失函数和所述第三损失函数求和，得到所述总损失函数。

本步骤具体可以表征为下述公式：

L＝L_Intent+L_Value+L_SIM

其中，L为所述总损失函数。

基于上述自然语言解析模型的预训练方法可以看出，在训练自然语言解析模型时，输入引入物理信道噪声后的自然语言指令，通过BERT编码层获得指令的语义表示，输出包括：从加噪的指令中识别出的指令意图、从加噪的指令中识别出的槽值以及从加噪的指令还原出的原始正确指令。该自然语言解析模型具有下述优点：

(1)通过多任务学习，有效发挥多个相关目标任务的类同表示，促使模型在底层编码器关注任务通用特征的表示学习，在每个目标任务的编码器部分，关注任务相关特征的表示学习。

(2)通过从噪声输入中正确识别指令意图、槽值和对噪声输入的还原，模型获得了对抗物理信道噪声的能力，从而节省了传统协议中的差错控制开销，提升了指令的传输效率。

综上所述，基于上述自然语言解析模型的预训练方法，采用上述多任务学习框架，不仅可以迫使自然语言解析模型获得关键语义信息，而且促使自然语言解析模型在极大限度上抵抗物理信道的噪声，提升基于自然语言的网络管控协议的鲁棒性。

基于上述实施例的基于自然语言的网络管控交互方法可以看出，本发明实施例，利用预训练的自然语言生成模型和自然语言解析模型，在智能体之间传输具有语义信息的自然语言指令，实现了多个网络智能体之间围绕网络管控任务的拟人化交互。如此，一方面可以利用自然语言指令的语义鲁棒性提高网络管控交互的鲁棒性，另一方面，也可以借助语言模型强大的生成能力，满足新的消息需求的表达，有效提升了网络管控交互的扩展性。

图2为本发明实施例在一具体场景下的具体实施示意图。如图2所示，发送端智能体采用自然语言生成模型将管控意图封装为自然语言指令，进而通过编码器将其转换为适合物理信道传播的0-1比特序列，经过物理信道传输给接收端智能体，在接收端译码出自然语言指令后，接收端智能体采用自然语言解析模型从自然语言指令中解析出网络配置参数，完成网络配置。其中，网络中的多个发送端和接收端共享同一个自然语言生成模型和同一个自然语言解析模型，赋予网络智能体对复杂的任务语义和环境语义的表述和理解能力，进而可以提升网络智能体的自主交互能力。

基于上述基于自然语言的网络管控交互方法实施例，本发明实施例相应地提出一种基于自然语言的网络管控交互装置，如图3所示，该装置包括：

自然语言生成模块301，用于利用预训练的自然语言生成模型，将当前的网络管控意图转换为自然语言指令并发送给第二智能体；

自然语言解析模块302，用于利用预训练的自然语言解析模型，对所述第二智能体接收到的所述自然语言指令进行网络管控意图和相应槽信息的提取，得到相应的网络配置参数。

上述自然语言生成模块301和自然语言解析模块302分别用于发送信息的封装和接收信息的解析，因此分别设置于发送端智能体和接收端智能体中。考虑到，实际应用中，一个智能体往往可能既需要发送自然语言指令信息，也需要接收自然语言指令信息，因此，也会同时部署上述两个模块(如图3中模块303和304)，以分别进行信息的发送和接收处理。

需要说明的是，上述方法和装置是基于同一发明构思的，由于方法及装置解决问题的原理相似，因此，装置和方法的实施可以相互参见，重复之处不再赘述。

基于上述基于自然语言的网络管控交互方法实施例，本发明实施例相应地还提出一种基于自然语言的网络管控交互设备，包括处理器和存储器；所述存储器中存储有可被所述处理器执行的应用程序，用于使得所述处理器执行如上所述基于自然语言的网络管控交互方法。具体地，可以提供配有存储介质的系统或者装置，在该存储介质上存储着实现上述实施例中任一实施方式的功能的软件程序代码，且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。此外，还可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作。还可以将从存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中，随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作，从而实现上述基于自然语言的网络管控交互方法实施方式中任一实施方式的功能。

其中，存储器具体可以实施为电可擦可编程只读存储器(EEPROM)、快闪存储器(Flash memory)、可编程程序只读存储器(PROM)等多种存储介质。处理器可以实施为包括一或多个中央处理器或一或多个现场可编程门阵列，其中现场可编程门阵列集成一或多个中央处理器核。具体地，中央处理器或中央处理器核可以实施为CPU或MCU。

本申请实施例还实现了一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被处理器执行时实现如上所述基于自然语言的网络管控交互方法的步骤。

需要说明的是，上述各流程和各结构图中不是所有的步骤和模块都是必须的，可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的，可以根据需要进行调整。各模块的划分仅仅是为了便于描述采用的功能上的划分，实际实现时，一个模块可以分由多个模块实现，多个模块的功能也可以由同一个模块实现，这些模块可以位于同一个设备中，也可以位于不同的设备中。

各实施方式中的硬件模块可以以机械方式或电子方式实现。例如，一个硬件模块可以包括专门设计的永久性电路或逻辑器件(如专用处理器，如FPGA或ASIC)用于完成特定的操作。硬件模块也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。至于具体采用机械方式，或是采用专用的永久性电路，或是采用临时配置的电路(如由软件进行配置)来实现硬件模块，可以根据成本和时间上的考虑来决定。

在本文中，“示意性”表示“充当实例、例子或说明”，不应将在本文中被描述为“示意性”的任何图示、实施方式解释为一种更优选的或更具优点的技术方案。为使图面简洁，各图中的只示意性地表示出了与本发明相关部分，而并不代表其作为产品的实际结构。另外，以使图面简洁便于理解，在有些图中具有相同结构或功能的部件，仅示意性地绘示了其中的一个，或仅标出了其中的一个。在本文中，“一个”并不表示将本发明相关部分的数量限制为“仅此一个”，并且“一个”不表示排除本发明相关部分的数量“多于一个”的情形。在本文中，“上”、“下”、“前”、“后”、“左”、“右”、“内”、“外”等仅用于表示相关部分之间的相对位置关系，而非限定这些相关部分的绝对位置。

本说明书及实施例中所述方案，如涉及个人信息处理，则均会在具备合法性基础(例如征得个人信息主体同意，或者为履行合同所必需等)的前提下进行处理，且仅会在规定或者约定的范围内进行处理。用户拒绝处理基本功能所需必要信息以外的个人信息，不会影响用户使用基本功能。

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。