CN116992304A

CN116992304A - 基于人工智能的政策匹配分析系统及其方法

Info

Publication number: CN116992304A
Application number: CN202310985465.6A
Authority: CN
Inventors: 林晓丰; 周刚; 彭元元; 杨康; 胡玉宏
Original assignee: Shanwei Hongdeyu Technology Service Co ltd
Current assignee: Shanwei Hongdeyu Technology Service Co ltd
Priority date: 2023-08-04
Filing date: 2023-08-04
Publication date: 2023-11-03

Abstract

本申请涉及智能分析技术领域，其具体地公开了一种基于人工智能的政策匹配分析系统及其方法，其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息，使用上下文编码器将对三者进行语义理解，再利用高斯密度图对三者进行关联编码，以及通过卷积神经网络进行关联特征的提取，基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样，可以更准确地匹配适合企业的政策，提供个性化的推送服务，并使得推送的政策更有价值。

Description

基于人工智能的政策匹配分析系统及其方法

技术领域

本申请涉及智能分析技术领域，且更为具体地，涉及一种基于人工智能的政策匹配分析系统及其方法。

背景技术

在社会发展过程中，企业有着举足轻重的作用，对于任何一家企业来说，政策匹配的精准性对企业而言重要性不言而喻，由此凸显了政策匹配方法的重要性。

当前政策智能匹配的方法通常是通过关键词匹配的方式进行匹配，而忽略了对政策的发布时间、申报时间以及补贴金额等信息的匹配分析。政策的发布时间和企业知晓时间往往是不同步的，企业需要有一定的盈余时间来进行材料的准备，当前仅通过关键词匹配，无法保障企业申报材料准备时间的充足性，进而无法保障企业可申报政策的申报及时性和参考价值。

因此，期待一种基于人工智能的政策匹配分析系统及其方法。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种基于人工智能的政策匹配分析系统及其方法，其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息，使用上下文编码器将对三者进行语义理解，再利用高斯密度图对三者进行关联编码，以及通过卷积神经网络进行关联特征的提取，基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样，可以更准确地匹配适合企业的政策，提供个性化的推送服务，并使得推送的政策更有价值。

相应地，根据本申请的一个方面，提供了一种基于人工智能的政策匹配分析系统，其包括：

信息获取模块，用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述；

语义理解模块，用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量；

高斯关联模块，用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵；

关联特征提取模块，用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图；

优化模块，用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图；

分析结果生成模块，用于将所述优化分类特征图通过分类器以得到分类结果，所述分类结果用于表示该政策是否有推送价值。

在上述基于人工智能的政策匹配分析系统中，所述语义理解模块，包括：分词单元，用于对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词；词嵌入单元，用于将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列，其中，所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码；上下文语义编码单元，用于将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量；以及，级联单元，用于将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。

在上述基于人工智能的政策匹配分析系统中，所述上下文语义编码单元，包括：排列子单元，用于将所述政策内容词嵌入向量的序列排列为输入向量；转化子单元，用于将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；自注意关联矩阵生成子单元，用于计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；标准化自注意子单元，用于对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；注意力计算子单元，用于将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；以及，注意力施加子单元，用于将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。

在上述基于人工智能的政策匹配分析系统中，所述高斯关联模块，包括：融合高斯密度图构造单元，用于使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图；以及，高斯离散化单元，用于对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。

在上述基于人工智能的政策匹配分析系统中，所述关联特征提取模块，包括：使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图，所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。

在上述基于人工智能的政策匹配分析系统中，所述优化模块，包括：分解单元，用于对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量；上下文关联单元，用于将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量；转移计算单元，用于计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵，并对计算所述各个转移矩阵的全局均值以得到多个转移特征值；权重向量计算单元，用于将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量；权重施加单元，用于以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。

在上述基于人工智能的政策匹配分析系统中，所述分析结果生成模块，用于：使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果；其中，所述分类公式为：

softmax{(M_c,B_c)|Project(F)}

其中，Project(F)表示将所述优化分类特征图投影为向量，M_c为全连接层的权重矩阵，B_c表示全连接层的偏置矩阵，softmax表示归一化指数函数。

根据本申请的一个方面，提供了一种基于人工智能的政策匹配分析方法，其包括：

获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述；

将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量；

使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵；

将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图；

对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图；

将所述优化分类特征图通过分类器以得到分类结果，所述分类结果用于表示该政策是否有推送价值。

在上述基于人工智能的政策匹配分析方法中，将所述补贴政策内容的文本描述通过基于转换器的上下文编码器以得到政策内容语义特征向量，包括：对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词；将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列，其中，所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码；将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量；以及，将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。

在上述基于人工智能的政策匹配分析方法中，将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量，包括：将所述政策内容词嵌入向量的序列排列为输入向量；将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；以及，将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。

在上述基于人工智能的政策匹配分析方法中，使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵，包括：使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图；以及，对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。

与现有技术相比，本申请提供的基于人工智能的政策匹配分析系统及其方法，其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息，使用上下文编码器将对三者进行语义理解，再利用高斯密度图对三者进行关联编码，以及通过卷积神经网络进行关联特征的提取，基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样，可以更准确地匹配适合企业的政策，提供个性化的推送服务，并使得推送的政策更有价值。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1为根据本申请实施例的基于人工智能的政策匹配分析系统的框图。

图2为根据本申请实施例的基于人工智能的政策匹配分析系统的架构示意图。

图3为根据本申请实施例的基于人工智能的政策匹配分析系统中语义理解模块的框图。

图4为根据本申请实施例的基于人工智能的政策匹配分析系统中上下文语义编码单元的框图。

图5为根据本申请实施例的基于人工智能的政策匹配分析系统中高斯关联模块的框图。

图6为根据本申请实施例的基于人工智能的政策匹配分析方法的流程图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

申请概述

如上所述，如今，在进行政策智能匹配时，通常是通过关键词进行匹配，而忽略了对政策的发布时间、申报时间以及补贴金额等信息的匹配分析。政策的发布时间和企业知晓时间往往是不同步的，企业需要有一定的盈余时间来进行材料的准备，如果仅仅通过关键词进行匹配，无法保障企业申报材料准备时间的充足性，进而无法保障企业可申报政策的申报及时性和政策申报价值。因此，期待一种基于人工智能的政策匹配分析系统及其方法，可以更准确地匹配符合要求的政策，并提供更有参考价值的政策推送。

目前，深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外，深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域，也展现出了接近甚至超越人类的水平。

近年来，深度学习以及神经网络的发展为政策的智能匹配提供了新的解决思路和方案。

具体地，在本申请的技术方案中，首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息，使用上下文编码器将对三者进行语义理解，再利用高斯密度图对三者进行关联编码，以及通过卷积神经网络进行关联特征的提取，基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样，可以更准确地匹配适合企业的政策，提供个性化的推送服务，并使得推送的政策更有价值。

具体地，在本申请的技术方案中，首先，获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。接着，将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述，以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量，政策价值语义特征向量和企业行为语义特征向量。考虑到由于所述文本描述都是由多个词组成的，并且每个词之间具有着上下文的语义关联关系，因此，为了能够对所述补贴政策内容、所述政策申报起止时间和补贴金额以及所述企业在政策平台中搜索浏览信息进行充分的语义理解，进一步对所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述，以及所述企业在政策平台中搜索浏览信息的文本描述分别进行分词处理后通过基于转换器的上下文编码器中进行编码，以提取出所述文本描述中的各个词基于全局的高维语义关联特征。应可以理解，基于转换器的上下文编码器是一种强大的预训练模型，其通过训练大规模的语言模型学习了大量的语义信息。通过将所述文本描述输入到所述上下文编码器中，可以将其转换为语义特征向量，捕捉到文本中的语义和语境信息。

接着，使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以捕捉不同特征之间的关联性和相互作用，从而得到关联特征矩阵。通过使用高斯密度图编码，将不同特征的权重和相关性进行建模，以综合考虑政策内容特征信息、政策价值特征信息和企业行为特征信息，挖掘不同特征之间的潜在关系和相互影响，从而更准确地评估政策与企业行为之间的关联程度。

进一步地，将所述关联特征矩阵通过卷积神经网络模型进行关联特征挖掘。应可以理解，卷积神经网络模型是一种常用的深度学习模型，擅长处理图像和序列数据，其在特征提取和分类任务上具有很好的效果。将关联特征矩阵输入到卷积神经网络模型中，模型将通过学习卷积和池化等操作，自动识别和提取特征，以捕捉到政策描述和企业需求的语义信息，从而得到分类特征图。

接着，将分类特征图通过分类器进行分类以判断该政策是否具有推送价值。分类器是一种机器学习模型，通过学习已知数据集中的模式和规律，以对新的输入数据进行分类。在本方案中，基于分类结果进行进一步的决策或操作，比如将推送价值高的政策放入推送队列，优先推送给匹配的企业或用户，从而提高整体的推送效果。

特别的，在本申请的技术方案中，考虑到在实际进行推断时，所采集到的补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述中可能存在噪声、异常值或未见过的样本，例如，企业在政策平台中搜索浏览信息的文本描述可能存在各种噪声和异常情况。例如，企业可能输入错误的关键词、浏览不相关的信息或存在重复或冗余的描述。这些噪声、异常值或未见过的样本会影响后续所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量的提取，进而影响所述分类特征图进行分类处理的准确性，为了提高分类特征图的鲁棒性，使分类模型对于输入数据的变化更加鲁棒，即使在面临噪声、异常值或未见过的样本时，模型也能够更好地适应并进行正确分类，本申请进一步地，对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。

具体地，对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图，包括：对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量；将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量；计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵，并对计算所述各个转移矩阵的全局均值以得到多个转移特征值；将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量；以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。

在本申请的技术方案中，首先对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量，所述多个局部特征主成分特征向量为所述分类特征图的沿通道维度的各个特征矩阵的稀疏化表示。进一步，将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量，所述全局局部特征上下文关联特征向量用于表示所述分类特征图的所有局部特征的全局上下文表示。

进一步地，以所述全局局部特征上下文关联特征向量作为枢轴，来量化表示所述分类特征矩阵的各个局部特征的特征流形的几何复杂度，进而基于量化的几何复杂度对所述分类特征图来进行类注意力机制特征显著性强化以得到优化分类特征图，具体地，在本申请的技术方案中，首先计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵，并对计算所述各个转移矩阵的全局均值以得到多个转移特征值，进而将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量，最终以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到所述优化分类特征图。

这样，通过对所述分类特征图的高维特征分布进行基于枢轴的几何复杂度约束，可以使得所述分类特征图具有强为明确的类边界，同时，还可以使得分类模型对于输入数据的变化更加鲁棒，即使在面临噪声、异常值或未见过的样本时，模型也能够更好地适应并进行正确分类。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性系统

图1为根据本申请实施例的基于人工智能的政策匹配分析系统的框图。如图1所示，根据本申请实施例的基于人工智能的政策匹配分析系统100，包括：信息获取模块110，用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述；语义理解模块120，用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量；高斯关联模块130，用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵；关联特征提取模块140，用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图；优化模块150，用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图；以及,分析结果生成模块160，用于将所述优化分类特征图通过分类器以得到分类结果，所述分类结果用于表示该政策是否有推送价值。

图2为根据本申请实施例的基于人工智能的政策匹配分析系统的架构示意图。如图2所示，首先，获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。接着，将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量。然后，使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵。继而，将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图。接着，对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。最后，将所述优化分类特征图通过分类器以得到分类结果，所述分类结果用于表示该政策是否有推送价值。

在上述基于人工智能的政策匹配分析系统100中，所述信息获取模块110，用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。如上述背景技术所言，如今，在进行政策智能匹配时，通常是仅仅使用关键词进行匹配，而忽略了对政策的发布时间、申报时间以及补贴金额等信息的匹配分析。政策的发布时间和企业知晓时间往往是不同步的，企业需要有一定的盈余时间来进行材料的准备，如果仅仅通过关键词进行匹配，无法保障企业申报材料准备时间的充足性，进而无法保障企业可申报政策的申报及时性和政策申报价值。因此，在本申请的技术方案中，期望综合利用政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息进行政策匹配方案的构建，从而基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样，可以更准确地匹配适合企业的政策，提供个性化的推送服务，并使得推送的政策更有价值。具体地，在本申请的技术方案中，首先，获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。

在上述基于人工智能的政策匹配分析系统100中，所述语义理解模块120，用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量。考虑到由于所述文本描述都是由多个词组成的，并且每个词之间具有着上下文的语义关联关系，因此，为了能够对所述补贴政策内容、所述政策申报起止时间和补贴金额以及所述企业在政策平台中搜索浏览信息进行充分的语义理解，进一步对所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述，以及所述企业在政策平台中搜索浏览信息的文本描述分别进行分词处理后通过基于转换器的上下文编码器中进行编码，以提取出所述文本描述中的各个词基于全局的高维语义关联特征。应可以理解，基于转换器的上下文编码器是一种强大的预训练模型，其通过训练大规模的语言模型学习了大量的语义信息。通过将所述文本描述输入到所述上下文编码器中，可以将其转换为语义特征向量，捕捉到文本中的语义和语境信息。

图3为根据本申请实施例的基于人工智能的政策匹配分析系统中语义理解模块的框图。如图3所示，所述语义理解模块120，包括：分词单元121，用于对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词；词嵌入单元122，用于将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列，其中，所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码；上下文语义编码单元123，用于将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量；以及，级联单元124，用于将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。

图4为根据本申请实施例的基于人工智能的政策匹配分析系统中上下文语义编码单元的框图。如图4所示，所述上下文语义编码单元123，包括：排列子单元1231，用于将所述政策内容词嵌入向量的序列排列为输入向量；转化子单元1232，用于将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；自注意关联矩阵生成子单元1233，用于计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；标准化自注意子单元1234，用于对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；注意力计算子单元1235，用于将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；以及，注意力施加子单元1236，用于将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。

在上述基于人工智能的政策匹配分析系统100中，所述高斯关联模块130，用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵。为了捕捉不同特征之间的关联性和相互作用，使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行编码，将不同特征的权重和相关性进行建模，以综合考虑政策内容特征信息、政策价值特征信息和企业行为特征信息，挖掘不同特征之间的潜在关系和相互影响，从而更准确地评估政策与企业行为之间的关联程度。

图5为根据本申请实施例的基于人工智能的政策匹配分析系统中高斯关联模块的框图。如图5所示，所述高斯关联模块130，包括：融合高斯密度图构造单元131，用于使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图；以及，高斯离散化单元132，用于对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。

在上述基于人工智能的政策匹配分析系统100中，所述关联特征提取模块140，用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图。应可以理解，卷积神经网络模型是一种常用的深度学习模型，擅长处理图像和序列数据，其在特征提取和分类任务上具有很好的效果。将关联特征矩阵输入到卷积神经网络模型中，模型将通过学习卷积和池化等操作，自动识别和提取特征，以捕捉到政策描述和企业需求的语义信息，从而更好地进行政策的智能匹配。

相应地，在一个具体示例中，所述关联特征提取模块140，包括：使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图，所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。

在上述基于人工智能的政策匹配分析系统100中，所述优化模块150，用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。特别的，在本申请的技术方案中，考虑到在实际进行推断时，所采集到的补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述中可能存在噪声、异常值或未见过的样本，例如，企业在政策平台中搜索浏览信息的文本描述可能存在各种噪声和异常情况。例如，企业可能输入错误的关键词、浏览不相关的信息或存在重复或冗余的描述。这些噪声、异常值或未见过的样本会影响后续所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量的提取，进而影响所述分类特征图进行分类处理的准确性，为了提高分类特征图的鲁棒性，使分类模型对于输入数据的变化更加鲁棒，即使在面临噪声、异常值或未见过的样本时，模型也能够更好地适应并进行正确分类，本申请进一步地，对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。

相应地，在一个具体示例中，所述优化模块150，包括：分解单元，用于对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量；上下文关联单元，用于将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量；转移计算单元，用于计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵，并对计算所述各个转移矩阵的全局均值以得到多个转移特征值；权重向量计算单元，用于将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量；权重施加单元，用于以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。

在上述基于人工智能的政策匹配分析系统100中，所述分析结果生成模块160，用于将所述优化分类特征图通过分类器以得到分类结果，所述分类结果用于表示该政策是否有推送价值。分类器是一种机器学习模型，通过学习已知数据集中的模式和规律，以对新的输入数据进行分类。在本方案中，基于分类结果进行进一步的决策或操作，比如将推送价值高的政策放入推送队列，优先推送给匹配的企业或用户，从而提高整体的推送效果。

相应地，在一个具体示例中，所述分析结果生成模块160，用于：使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果；其中，所述分类公式为：

softmax{(M_c,B_c)|Project(F)}

综上，根据本申请实施例的基于人工智能的政策匹配分析系统被阐明，其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息，使用上下文编码器将对三者进行语义理解，再利用高斯密度图对三者进行关联编码，以及通过卷积神经网络进行关联特征的提取，基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样，可以更准确地匹配适合企业的政策，提供个性化的推送服务，并使得推送的政策更有价值。

示例性方法

图6为根据本申请实施例的基于人工智能的政策匹配分析方法的流程图。如图6所示，根据本申请实施例的基于人工智能的政策匹配分析方法，包括步骤：S110，获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述；S120，将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量；S130，使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵；S140，将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图；S150，对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图；S160，将所述优化分类特征图通过分类器以得到分类结果，所述分类结果用于表示该政策是否有推送价值。

在一个具体示例中，在上述基于人工智能的政策匹配分析方法中，所述步骤S120，将所述补贴政策内容的文本描述通过基于转换器的上下文编码器以得到政策内容语义特征向量，包括：对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词；将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列，其中，所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码；将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量；以及,将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。

在一个具体示例中，在上述基于人工智能的政策匹配分析方法中，将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量，包括：将所述政策内容词嵌入向量的序列排列为输入向量；将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；以及，将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。

在一个具体示例中，在上述基于人工智能的政策匹配分析方法中，所述步骤S130，使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵，包括：使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图；以及，对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。

在一个具体示例中，在上述基于人工智能的政策匹配分析方法中，所述步骤S140，将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图，包括：使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图，所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。

在一个具体示例中，在上述基于人工智能的政策匹配分析方法中，所述步骤S150，对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图，包括：对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量；将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量；计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵，并对计算所述各个转移矩阵的全局均值以得到多个转移特征值；将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量；以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。

在一个具体示例中，在上述基于人工智能的政策匹配分析方法中，所述步骤S160，将所述优化分类特征图通过分类器以得到分类结果，所述分类结果用于表示该政策是否有推送价值，包括：使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果；其中，所述分类公式为：

softmaX{(M_c,B_c)|Project(F)}

这里，本领域技术人员可以理解，上述基于人工智能的政策匹配分析方法中的各个步骤的具体操作已经在上面参考图1到图5的基于人工智能的政策匹配分析系统的描述中得到了详细介绍，并因此，将省略其重复描述。

Claims

1.一种基于人工智能的政策匹配分析系统，其特征在于，包括：

2.根据权利要求1所述的基于人工智能的政策匹配分析系统，其特征在于，所述语义理解模块，包括：

分词单元，用于对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词；

词嵌入单元，用于将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列，其中，所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码；

上下文语义编码单元，用于将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量；

级联单元，用于将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。

3.根据权利要求2所述的基于人工智能的政策匹配分析系统，其特征在于，所述上下文语义编码单元，包括：

排列子单元，用于将所述政策内容词嵌入向量的序列排列为输入向量；

转化子单元，用于将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；

自注意关联矩阵生成子单元，用于计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；

标准化自注意子单元，用于对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；

注意力计算子单元，用于将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；

注意力施加子单元，用于将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。

4.根据权利要求3所述的基于人工智能的政策匹配分析系统，其特征在于，所述高斯关联模块，包括：

融合高斯密度图构造单元，用于使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图；

高斯离散化单元，用于对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。

5.根据权利要求4所述的基于人工智能的政策匹配分析系统，其特征在于，所述关联特征提取模块，包括：使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：

对输入数据进行卷积处理以得到卷积特征图；

对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图；

对所述池化特征图进行非线性激活以得到激活特征图；

其中，所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图，所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。

6.根据权利要求5所述的基于人工智能的政策匹配分析系统，其特征在于，所述优化模块，包括：

分解单元，用于对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量；

上下文关联单元，用于将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量；

转移计算单元，用于计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵，并对计算所述各个转移矩阵的全局均值以得到多个转移特征值；

权重向量计算单元，用于将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量；

权重施加单元，用于以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。

7.根据权利要求6所述的基于人工智能的政策匹配分析系统，其特征在于，所述分析结果生成模块，用于：使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果；其中，所述分类公式为：

softmax{(M_c,B_c)|Project(F)}

8.一种基于人工智能的政策匹配分析方法，其特征在于，包括：

9.根据权利要求8所述的基于人工智能的政策匹配分析方法，其特征在于，将所述补贴政策内容的文本描述通过基于转换器的上下文编码器以得到政策内容语义特征向量，包括：

对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词；

将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列，其中，所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码；

将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量；

将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。

10.根据权利要求9所述的基于人工智能的政策匹配分析方法，其特征在于，将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量，包括：

将所述政策内容词嵌入向量的序列排列为输入向量；

将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量；

计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵；

对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵；

将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵；

将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。