CN113435212A

CN113435212A - 一种基于规则嵌入的文本推断方法及装置

Info

Publication number: CN113435212A
Application number: CN202110984877.9A
Authority: CN
Inventors: 孙宇清; 郑威
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2021-08-26
Filing date: 2021-08-26
Publication date: 2021-09-24
Anticipated expiration: 2041-08-26
Also published as: CN113435212B

Abstract

一种基于规则嵌入的文本推断方法，包括基于预训练的语义逻辑网络，对逻辑规则的不同组件进行神经检索及推断，且支持用户需求改变或任务迁移；结合语义逻辑网络与神经分类网络的平行结构，采用概率分布距离函数Jensen‑Shannon散度，通过网络精调训练约束其推断结果的一致性。本发明提出的语义逻辑网络将用户规则编码为语义向量，能够在检测逻辑规则的同时更好地保留文本的语义信息，支持语言灵活性和文本多样性。本发明还提出了将用户规则集成到神经分类网络中以改善文本推断性能的方法，即结合神经分类网络和语义逻辑网络推断的平行预测结构，采用一致性联合损失，能够使得语义逻辑网络和神经分类网络相互受益，并将规则的检测结果作为文本推断的证据。

Description

一种基于规则嵌入的文本推断方法及装置

技术领域

本发明公开一种基于规则嵌入的文本推断方法及装置，属于自然语言处理的技术领域。

背景技术

舆情订阅是新媒体时代的重要应用场景，其是指由传媒机构依据订阅用户的需求，定期推送用户关注的互联网舆情或新闻等文本，其中用户需求通常以关键词逻辑规则的形式表达，描述了用户偏好的文本内容。基于用户需求的文本推断任务是指判定一个文本是否满足用户需求，该任务在上述场景中具有重要应用价值。

现有处理上述推断任务的技术主要分为两类，一是基于关键词布尔检索结果进行推断，通过比对文本及用户定义的关键词逻辑表达式，找出匹配逻辑表达式的文本，但是这种关键词布尔检索方式存在局限，自然语言的灵活性使得相同语义的文本表达形式具有很大自由度，影响匹配结果。另一种是基于深度学习的分类方法，基于预训练词向量和神经网络进行文本类型推断，在大规模标注数据集上进行监督学习，使得神经网络能够从语义层面理解和推断文本是否满足用户需求，如基于卷积神经网络获取文本表示向量记载在中国专利文献CN113076488A中：一种基于用户数据推荐信息的方法及系统，通过预设关键词对承载用户信息的文本中的特定语句进行特征建模，然而其缺陷是难以处理用户需求所涉及主题的多样性问题，且难以适应用户需求变化。

发明内容

针对现有技术存在的问题，本发明公开一种基于规则嵌入的文本推断方法。

本发明还公开一种实现上述文本推断方法的装置，以实现对文本的推断处理。

发明概述：

一种基于规则嵌入的文本推断方法，包括两部分：一是基于预训练的语义逻辑网络，对逻辑规则的不同组件进行神经检索及推断，且支持用户需求改变或任务迁移；二是结合语义逻辑网络与神经分类网络的平行结构，采用概率分布距离函数Jensen-Shannon散度，通过网络精调训练约束其推断结果的一致性。最后，基于语义逻辑网络和神经分类网络的预测结果进行融合推断，同时语义逻辑网络的激活结果作为文本推断结果的证据。

本发明中提出语义逻辑网络，以神经方式近似逻辑推断过程，该过程包含文本对逻辑规则中不同粒度组件的检测，并组合检测结果，组件包括项、合取和析取。通过引入三个独立的损失函数，分别验证文本对上述组件的包含关系。针对动态变化的用户需求带来的挑战，本发明使用预训练-精调机制训练语义逻辑网络。语义逻辑网络由三个模块构成，分别用于对用户规则中的项、合取规则以及析取规则的语义检测，并组合检测结果进行文本推断。从中文通用语料库如中文维基百科获取文本，并从中文同义词林如中文WordNet获取通用关键词集合语料。使用通用语料预训练每个模块，以增强网络对关键词检测的鲁棒性，并在既往用户数据上进行微调，从而提高对用户需求变更的适应性。

另外，本发明提出一种将可选神经分类网络与语义逻辑网络相结合的平行结构，通过联合训练的方式，精调网络以提升推断性能。为了联合神经分类网络与语义逻辑网络，本发明使用Jensen-Shannon损失函数作为正则化项，通过网络精调阶段训练，约束平行结构两侧预测结果的一致性。

技术术语解释：

1.用户需求：也称为用户规则，在本发明中指订阅用户描述其对于文本内容的偏好，以关键词集合形式的逻辑规则的形式给出，关键词即为学术领域中的词汇或词组。动态变更的用户需求指：当用户提出新的关注点时，通过添加或删减关键词，改变逻辑表达式进行表达。

2.文本推断：对于给定的用户需求，推断输入文本是否满足需求。

3.语义逻辑网络：指用于对输入文本的语义检测及推断的神经网络。

4.平行网络：能实现独立计算并能联合进行文本推断的两个神经网络，本发明中的平行网络包括相互平行设置的语义逻辑网络和神经分类网络。

5.一致性约束：指在损失函数中，通过引入概率分布距离函数Jensen-Shannon散度，简称JS距离，作为正则化项，约束平行网络两侧的推断结果向概率分布一致性方向优化；其中，所述JS距离是Kullback-Leibler（KL）散度的变体，解决了KL散度的非对称问题。

本发明详细的技术方案如下：

一种基于规则嵌入的文本推断方法，其特征在于，该方法包括：

1）将描述用户需求的关键词逻辑表达式转化为等价的析取范式，用户需求是一条命题公式P，则P的析取范式为：

（1）

在公式（1）中，

表示合取规则的数量，r _i为第i个用户规则；所述命题公式P中，联结词取自集合

，项是一个关键词集合

，包含描述主题或语义相关的关键词及其同义词；依据范式存在定理，命题公式P一定能够转化为与之等价的析取范式，

是一条由关键词集合构成的合取规则，即

，其中

表示合取规则

中项的个数，构成用户需求的所有合取规则集合表示为

,即为用户规则集，其中

表示合取规则的数量；在本步骤中，所述析取范式的英文为Disjunctive Normal Form,缩写为DNF，所述析取范式具有处理用户需求变化的灵活性，通过增删合取规则能够高效的适应用户需求的变更；本步骤中所述转化的具体过程与传统的逻辑表达式转化方式相同，不属于本发明所要保护的内容；

2）判定一个输入文本是否满足用户规则：

给定文本集合

以及用户规则集

；输入文本

的词序列表示为

；推断输出文本级概率为

，表示输入文本

满足用户规则的概率；规则级概率为

，是长度为

的序列，其第i个维度取值表示预测输入文本x满足用户规则

的概率，依据

的取值判定文本x满足了哪些用户规则。

本发明利用语义逻辑网络，对输入文本x进行理解，推断其是否满足用户需求对应的用户规则：

利用语义逻辑网络依次对输入文本x进行项检测、合取规则检测和析取范式检测，最终判定一个输入文本是否满足用户规则，本步骤判定输入文本x是否满足用户规则中的项

、合取规则

、析取规则的语义，如附图1右侧所示，自底向上的三个模块分别项检测、合取规则检测以及析取规则检测。

根据本发明优选的，所述一种基于规则嵌入的文本推断方法还包括，一路与所述语义逻辑网络平行设置的神经分类网络，所述神经分类网络用于：对输入文本进行类别预测，获得输入文本符合用户需求的概率，即预测结果；

对所述输入文本分别通过神经分类网络及语义逻辑网络分别进行推断，分别得到两者的预测结果；最后利用Jensen-Shannon散度，简称JS距离，约束两者预测结果的一致性。

根据本发明优选的，所述依次对输入文本x进行项检测、合取规则检测和析取范式检测的具体方法包括：

2-1)项检测

项检测用于判定输入文本

是否包含析取范式中项

相关的语义；

输入为输入文本

；

输出为检测结果记为

，表示输入文本

包含项

的概率；

将输入文本

转化为对应的预训练词向量构成的矩阵：预训练词向量指采用中文维基百科语料库和word2vec算法训练得到的中文词向量，由输入文本

中所有词汇对应的预训练词向量组成的矩阵，记为

，其中

代表实数域，u是输入文本

的截断长度，d是预训练词向量的长度，

是词汇

对应的长度为d的向量；

将项

转化为向量形式：项

的向量为

对应关键词集合中，所有关键词对应的预训练词向量的均值，即

，其中

是集合中的关键词，

是

对应预训练词向量。

计算项

与输入文本

中每个词汇之间的交互信息，将向量

与输入文本

的预训练词嵌入矩阵

通过矩阵乘法计算得到交互向量，记为

：

(2)

对输入文本

通过编码网络ENC进行语义编码后得到文本语义向量

，本发明中，可以采用不同卷积神经网络，此处优选采用TEXTCNN结构作为编码网络ENC，所使用的三种卷积核尺寸分别为2×d，3×d,4×d，其中d是预训练词向量的维度，每种卷积核数量为64；

将文本语义向量

与交互向量

拼接，并经过多层感知机网络MLP进行降维，获得向量

，即为输入文本

对项

的语义包含关系：

(3)

经过

函数激活的值作为检测到输入文本

包含项

的概率，即推断结果，该概率表示输入文本

对项

对应关键词集合语义的满足程度：

(4)

是语义逻辑网络预测输入文本x包含项

的概率，所述向量

还作为下一阶段合取规则模块的输入；

表示

激活函数，

是网络参数；

使用交叉熵损失函数来评估推断结果

与真实结果，即项的真实标签

分布之间的差异性，求得损失

：

(5)

其中，

是项的真实标签，通过文本与关键词的字符串匹配检测和同义词扩充的方式获得；

表示训练集合样本期望；M是关键词集合的个数；训练过程通过最小化损失

以更新项检测网络中的所有参数；

表示使用

范数来对项检测网络的参数进行正则化以避免过拟合；本发明中所述交叉熵损失函数为交叉熵cross-entropy损失函数；

2-2)合取规则检测

合取规则检测用于验证输入文本x是否满足合取规则

的语义；

输入为：步骤2-1）的项表示向量

；

输出为：预测输入文本包含合取规则

的概率；

合取规则嵌入网络

，本发明验证了采用如

或

等不同结构，均具有近似逻辑合取运算的能力，合取规则

包含的项构成序列

，其对应项检测获得的项的表示向量构成序列

,将序列中所有向量拼接作为输入，经过

获得合取规则的表示向量

，该输出向量蕴含输入文本对合取规则

的语义包含关系：

(6)

其中，

表示

的所有项构成的序列；

经过

函数激活得到合取规则的检测概率，公式(7)所示，其中

表示

激活函数，

是网络参数，

是输入文本包含合取规则

的概率，即推断结果：

(7)

采用交叉熵损失函数来衡量预测结果

与真实结果，即规则的真实标签

的差异，求损失

，其中

是规则的真实标签，通过相关项标签的布尔值的合取运算获得；

表示训练集合样本期望；训练过程通过最小化损失

以更新UNet和合取规则检测模块中的所有参数，

表示使用

范数来对UNet和合取规则检测模块中的所有参数进行正则化以避免过拟合：

(8)

2-3)析取范式检测

析取范式检测用于验证输入文本x是否满足完整的用户规则集，这等价于验证文本是否满足用户规则集中任意一条合取规则；

输入为：步骤2-2）中的合取规则表示向量

和其他相关的合取规则表示向量；

输出为：预测输入文本满足用户规则集的概率；

采用max函数来实现析取网络

：将步骤2-2）所述推断结果中最大的概率作为文本推断结果，表示推断输入文本x满足用户需求的概率，其中

是预测输入文本满足用户规则集的概率，

表示取最大概率的函数，

表示合取规则检测模块输出的推断结果：

(9)

采用交叉熵损失函数，求损失

，如公式(10)所示，其中y是输入文本的真实标签，由专家标注文本是否满足用户需求，

表示训练集合样本期望，训练过程通过最小化损失

以更新语义逻辑网络的所有参数，

表示使用

范数来对语义逻辑网络的参数进行正则化以避免过拟合：

(10)。

根据本发明优选的，所述神经分类网络的处理方法包括：

通过文本编码模块构造输入文本的语义向量，此处采用的文本编码网络为

ENC₂，优选基于CNN、RNN或BERT的编码模块；通过文本编码模块获得输入文本的语义表示向量后，基于语义表示向量进行类别预测，公式(11)所示，

表示神经分类网络预测输入文本符合用户需求的概率，此处的

是所述输出文本级标签

，

表示

激活函数，

是网络参数：

(11)

用交叉熵损失函数衡量神经分类网络的预测结果

与真实结果，即输入文本的真实标签

之间的差异性，公式(12)所示，得到损失

，通过最小化损失

以更新神经分类网络的所有参数，其中y是输入文本的真实标签，由专家标注文本是否满足用户需求，

表示训练集合样本期望，

表示使用

范数来对神经分类网络的所有参数进行正则化以避免过拟合：

(12)

3）对所述输入文本分别通过神经分类网络及语义逻辑网络进行推断，得到两者的预测结果，最后利用Jensen-Shannon散度，简称JS距离，约束两者预测结果的一致性。

采用JS距离度量神经分类网络与语义逻辑网络的预测结果分布之间的相似度，两者相似性越大，JS距离值越小，记神经分类网络输出的概率分布为

，语义逻辑网络输出的概率分布为

，则两者的JS距离

的计算公式为：

(13)

所述

表示Kullback-Leibler（KL）散度，其计算如公式(14)所示，JS距离是KL散度的变体，解决了KL散度的非对称问题：

(14)

将JS距离作为联合损失中的正则项，联合损失

的计算如公式(15)，其中，超参

用于权衡不同损失项，

取值范围是(0，1),且满足约束条件

，

为公式(12)所示的损失函数，

为公式(10)所示的损失函数：

(15)

平行结构的训练过程中，通过最小化联合损失

以更新神经分类网络和语义逻辑网络的所有参数。

一种实现上述文本推断方法的装置，其特征在于，包括：语义逻辑网络模块；

语义逻辑网络模块用于：判定一个输入文本是否满足用户规则；所述语义逻辑网络模块包括：沿数据流方向依次设置的项检测模块、合取规则检测模块、析取范式检测模块。

根据本发明优选的，所述实现上述文本推断方法的装置还包括，一路与所述语义逻辑网络模块平行设置的神经分类网络模块；

所述神经分类网络用于：对输入文本进行类别预测，获得输入文本符合用户需求的概率，即预测结果；

对所述输入文本分别通过神经分类网络及语义逻辑网络分别进行推断，分别得到两者的预测结果，最后利用Jensen-Shannon散度约束两者预测结果的一致性。

本发明的技术优势在于：

(1) 本发明提出的语义逻辑网络将用户规则编码为语义向量，能够在检测逻辑规则的同时更好地保留文本的语义信息，支持语言灵活性和文本多样性。

(2) 本发明还提出了将用户规则集成到神经分类网络中以改善文本推断性能的方法，即结合神经分类网络和语义逻辑网络推断的平行预测结构，采用一致性联合损失，能够使得语义逻辑网络和神经分类网络相互受益，并将规则的检测结果作为文本推断的证据。

本发明提出的基于预训练的语义逻辑推断，能够较好地应对动态变化的用户需求。当用户提出新需求或变更需求时，难以及时获取大量标注数据的问题，为监督学习方法带来了挑战，针对该挑战，本发明利用中文维基百科等海量通用语料，及基于中文WordNet提取的同义词、近义词集合等开放领域的语言学知识，预训练语义逻辑网咯，并在特定用户数据上进行精调，增强了对关键词检测的鲁棒性，有利于高效地处理动态变化的用户需求。

附图说明

图1是本发明实现基于规则嵌入的文本推断方法的装置的示意图；

图2是本发明所述实施例中用户需求判定树示例。

具体实施方式

下面结合实施例和说明书附图对本发明做详细的说明，但不限于此。

实施例1、

一种基于规则嵌入的文本推断方法，该方法包括：

（1）

在公式（1）中，

，项是一个关键词集合

是一条由关键词集合构成的合取规则，即

，其中

表示合取规则

中项的个数，构成用户需求的所有合取规则集合表示为

,即为用户规则集，其中

表示合取规则的数量；在本步骤中，所述析取范式的英文为Disjunctive Normal Form,缩写为DNF，所述析取范式具有处理用户需求变化的灵活性，通过增删合取规则能够高效的适应用户需求的变更；

2）判定一个输入文本是否满足用户规则：

给定文本集合

以及用户规则集

；输入文本

的词序列表示为

；推断输出文本级概率为

，表示输入文本

满足用户规则的概率；规则级概率为

，是长度为

的序列，其第i个维度取值表示预测输入文本x满足用户规则

的概率，依据

的取值判定文本x满足了哪些用户规则。

利用语义逻辑网络依次对输入文本x进行项检测、合取规则检测和析取范式检测，最终判定一个输入文本是否满足用户规则。

所述依次对输入文本x进行项检测、合取规则检测和析取范式检测的具体方法包括：

2-1)项检测

项检测用于判定输入文本

是否包含析取范式中项

相关的语义；

输入为输入文本

；

输出为检测结果记为

，表示输入文本

包含项

的概率；

将输入文本

中所有词汇对应的预训练词向量组成的矩阵，记为

，其中

代表实数域，u是输入文本

的截断长度，d是预训练词向量的长度，

是词汇

对应的长度为d的向量；

将项

转化为向量形式：项

的向量为

，其中

是集合中的关键词，

是

对应预训练词向量。

计算项

与输入文本

中每个词汇之间的交互信息，将向量

与输入文本

的预训练词嵌入矩阵

通过矩阵乘法计算得到交互向量，记为

：

(2)

对输入文本

通过编码网络ENC进行语义编码后得到文本语义向量

将文本语义向量

与交互向量

拼接，并经过多层感知机网络MLP进行降维，获得向量

，即为输入文本

对项

的语义包含关系：

(3)

经过

函数激活的值作为检测到输入文本

包含项

的概率，即推断结果，该概率表示输入文本

对项

对应关键词集合语义的满足程度：

(4)

是语义逻辑网络预测输入文本

包含项

的概率，所述向量

还作为下一阶段合取规则模块的输入；

表示

激活函数，

是网络参数；

使用交叉熵损失函数来评估推断结果

与真实结果，即项的真实标签

分布之间的差异性，求得损失

：

(5)

其中，

以更新项检测网络中的所有参数；

表示使用

2-2)合取规则检测

合取规则检测用于验证输入文本x是否满足合取规则

的语义；

输入为：步骤2-1）的项表示向量

；

输出为：预测输入文本包含合取规则

的概率；

合取规则嵌入网络

，本发明验证了采用如

或

等不同结构，均具有近似逻辑合取运算的能力，合取规则

包含的项构成序列

，其对应项检测获得的项的表示向量构成序列

,将序列中所有向量拼接作为输入，经过

获得合取规则的表示向量

，该输出向量蕴含输入文本对合取规则

的语义包含关系：

(6)

其中，

表示

的所有项构成的序列；

经过

函数激活得到合取规则的检测概率，公式(7)所示，其中

表示

激活函数，

是网络参数，

是输入文本包含合取规则

的概率，即推断结果：

(7)

采用交叉熵损失函数来衡量预测结果

与真实结果

的差异，求损失

，其中

表示训练集合样本期望；训练过程通过最小化损失

以更新UNet和合取规则检测模块中的所有参数，

表示使用

(8)

2-3)析取范式检测

析取范式检测用于验证输入文本

是否满足完整的用户规则集，这等价于验证文本是否满足用户规则集中任意一条合取规则；

输入为：步骤2-2）中的合取规则表示向量

和其他相关的合取规则表示向量；

输出为：预测输入文本满足用户规则集的概率；

采用max函数来实现析取网络

：将步骤2-2）所述推断结果中最大的概率作为文本推断结果，表示推断输入文本

满足用户需求的概率，其中

是预测输入文本满足用户规则集的概率，

表示取最大概率的函数，

表示合取规则检测模块输出的推断结果：

(9)

采用交叉熵损失函数，求损失

，如公式(10)所示，其中

是输入文本的真实标签，由专家标注文本是否满足用户需求，

表示训练集合样本期望，训练过程通过最小化损失

以更新语义逻辑网络的所有参数，

表示使用

范数来对语义逻辑网络的参数进行正则化以避免过拟合：

(10)

实施例2、

如实施例1所述一种基于规则嵌入的文本推断方法还包括，一路与所述语义逻辑网络平行设置的神经分类网络，所述神经分类网络用于：对输入文本进行类别预测，获得输入文本符合用户需求的概率，即预测结果；

所述神经分类网络的处理方法包括：

是所述输出文本级标签

，

表示

激活函数，

是网络参数：

(11)

用交叉熵损失函数衡量神经分类网络的预测结果

与真实结果

之间的差异性，公式(12)所示，得到损失

，通过最小化损失

以更新神经分类网络的所有参数，其中

表示训练集合样本期望，

表示使用

(12)

，语义逻辑网络输出的概率分布为

，则两者的JS距离

的计算公式为：

(13)

所述

(14)

将JS距离作为联合损失中的正则项，联合损失

的计算如公式(15)，其中，超参

用于权衡不同损失项，

取值范围是(0，1),且满足约束条件

，

为公式(12)所示的损失函数，

为公式(10)所示的损失函数：

(15)

平行结构的训练过程中，通过最小化联合损失

以更新神经分类网络和语义逻辑网络的所有参数。

实施例3、

一种实现如实施例1所述文本推断方法的装置，包括：语义逻辑网络模块；

实施例4、

一种实现如实施例2所述文本推断方法的装置，在实施例3的基础上，所述实现上述文本推断方法的装置还包括，一路与所述语义逻辑网络模块平行设置的神经分类网络模块；

应用例、

如实施例1-4所述的方法和装置的实际应用方法如下。

基于通用语料的语义逻辑网络预训练：

获取通用语料，包括：从中文通用语料库如中文维基百科获取训练文本，从中文同义词林如中文版WordNet获取关键词集合。

对通用语料进行项级别和合取规则级别的自动标注，包括：对于项标注，对于满足至少包含

中一个关键词的文本x，其项标签

为1：

若不满足则

为0；对于合取规则标注，随机组合关键词集合生成合取规则；

若文本x同时满足合取规则

中的所有项，则该文本的合取规则标签

为1；

若至少不满足任意项，则

为0。

依据实施例1中所述步骤2)，结合附图1，使用通用语料预训练项检测模块和合取规则检测模块，具体包括：

依据步骤2-1)使用项检测网络

：

输入通用语料文本x，输入通用关键词集合

，训练项检测模块；

在模型的embedding层，将输入的token转换为对应的预训练词向量。对于待检测的关键词集合，其向量为集合中所有词汇对应预训练词向量的均值，这是因为同义词的嵌入在语义空间具有相邻的位置关系，平均向量能够呈现共同语义特征；另一方面，对于地名集合，将地理区划上的最上辖词作为代理词，这是因为下辖的地名均蕴含着“事件发生于区域内”这一事实；

项检测模块输出概率对应公式(4)的

，真实标签对应上述标签

，求公式(5)所述损失

，反向传播以更新项检测网络的参数，迭代训练直到验证集准确率提升小于阈值。

依据实施例1的步骤2-2)，在预训练的UNet上添加合取规则检测模块，使用通用语料训练两个模块，具体包括：

输入x及

，经过UNet获取输出向量t，将合取规则中包含的所有项对应的向量t拼接输入CNet，获取合取规则检测概率

，对应公式(7)，依次检测所有合取规则；

用

及标签

求损失

，对应公式(8)，丢弃项检测模块中的预测部分，基于损失

反向传播以更新UNet和CNet的参数。

基于用户数据精调网络，具体如下：

获取逻辑规则形式的用户需求：

某订阅用户关注特定地域内的突发事件，包括社会安全事件及自然灾害等，该用户的需求描述如附图2所示，白色节点表示逻辑或运算，黑色节点表示逻辑与运算：

对于目标文本，从叶节点开始判定，并将布尔判定值传向根节点，附图2中关键词集合的示例内容如表1所示：

表1 订阅用户的关键词集合示例

依据实施例1的步骤1）写出订阅用户的需求判定树对应的逻辑规则，与判定树等价的命题公式及析取范式如表2所示。

表2 订阅用户的逻辑规则

使用用户样本及规则精调语义逻辑网络：

样本集包含该用户的历史兴趣文本，即专家判定和推送的文本，这些文本构成正样本集，对应标签

;将用户历史不感兴趣文本，即由专家判定为不推送的文本构成负样本集，对应标签

。

将样本集的文本进行预处理，包括中文分词、文本截断或填充以及将分词后的词汇转换为token的输入形式。并且将逻辑规则中包含的所有关键词转换为token的输入形式。

使用样本集精调语义逻辑网络，具体包括：

依据实施例1的步骤2-1)，使用用户样本集及逻辑规则的项精调项检测网络

，类比预训练过程使用用户数据训练UNet，迭代训练直到验证集准确率提升小于阈值。

依据骤2-2)，使用用户样本集及合取规则精调网络UNet和CNet，类比预训练过程，迭代训练直到验证集准确率提升小于阈值。

依据步骤2-3)，添加析取规则检测模块，使用用户样本集训练DNet，具体包括：

输入

及

，经过UNet和CNet获取所有合取规则

的预测概率

，如公式(9)所示，用MAX网络求其中的最大概率作为推断文本满足用户需求的概率

。例如，有经过CNet输出的三个预测概率，分别为0.98、0.73、0.43，则MAX网络输出的概率为0.98，表明文本若满足其中任意一条规则，则满足用户需求。

可选的，若使用MLP实现DNet，则将所有

拼接并输入DNet，获得表示向量R，并基于向量R获取预测概率

。

用

及标签

求损失L _R，如公式(10),丢弃项、合取规则检测模块中的预测部分，用损失L _R反向传播以更新整个语义逻辑网络的参数。

基于用户数据训练平行网络，具体如下：

依据实施例2、4使用用户样本集训练平行网络结构，具体包括：

独立训练神经分类网络：使用用户样本集充分训练神经分类网络，损失函数如公式(12)。

联合训练语义逻辑网络和神经分类网络：将训练好的语义逻辑网络和训练好的神经分类网络联合起来进行精调，在联合损失中引入JS项以约束平行结构两侧预测结果的一致性。联合损失如公式(15)。此时，平行网络两端同时预测文本所属类别，神经分类网络一侧的输出为

，其计算如公式(11)所示，语义逻辑网络的输出为

，其计算如公式(9)、在测试阶段，本发明优选采用

作为最终输出结果。例如，在本应用例中，输入文本“滨州受‘利奇马’超强台风影响，暴雨来袭…”对应的预测结果为

，判定满足用户需求；输入文本“在最近更新的剧情中，翼天瞻带着羽然回到了青州…”对应的预测结果为

，判定不满足用户需求。