CN116992304A - 基于人工智能的政策匹配分析系统及其方法 - Google Patents
基于人工智能的政策匹配分析系统及其方法 Download PDFInfo
- Publication number
- CN116992304A CN116992304A CN202310985465.6A CN202310985465A CN116992304A CN 116992304 A CN116992304 A CN 116992304A CN 202310985465 A CN202310985465 A CN 202310985465A CN 116992304 A CN116992304 A CN 116992304A
- Authority
- CN
- China
- Prior art keywords
- policy
- feature
- vector
- matrix
- policy content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 72
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 13
- 239000013598 vector Substances 0.000 claims description 255
- 239000011159 matrix material Substances 0.000 claims description 126
- 238000010586 diagram Methods 0.000 claims description 35
- 238000012546 transfer Methods 0.000 claims description 35
- 230000006399 behavior Effects 0.000 claims description 32
- 238000013527 convolutional neural network Methods 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 10
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 230000003213 activating effect Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 239000000463 material Substances 0.000 description 8
- 230000002159 abnormal effect Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及智能分析技术领域,其具体地公开了一种基于人工智能的政策匹配分析系统及其方法,其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息,使用上下文编码器将对三者进行语义理解,再利用高斯密度图对三者进行关联编码,以及通过卷积神经网络进行关联特征的提取,基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。
Description
技术领域
本申请涉及智能分析技术领域,且更为具体地,涉及一种基于人工智能的政策匹配分析系统及其方法。
背景技术
在社会发展过程中,企业有着举足轻重的作用,对于任何一家企业来说,政策匹配的精准性对企业而言重要性不言而喻,由此凸显了政策匹配方法的重要性。
当前政策智能匹配的方法通常是通过关键词匹配的方式进行匹配,而忽略了对政策的发布时间、申报时间以及补贴金额等信息的匹配分析。政策的发布时间和企业知晓时间往往是不同步的,企业需要有一定的盈余时间来进行材料的准备,当前仅通过关键词匹配,无法保障企业申报材料准备时间的充足性,进而无法保障企业可申报政策的申报及时性和参考价值。
因此,期待一种基于人工智能的政策匹配分析系统及其方法。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于人工智能的政策匹配分析系统及其方法,其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息,使用上下文编码器将对三者进行语义理解,再利用高斯密度图对三者进行关联编码,以及通过卷积神经网络进行关联特征的提取,基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。
相应地,根据本申请的一个方面,提供了一种基于人工智能的政策匹配分析系统,其包括:
信息获取模块,用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;
语义理解模块,用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;
高斯关联模块,用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;
关联特征提取模块,用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;
优化模块,用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;
分析结果生成模块,用于将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
在上述基于人工智能的政策匹配分析系统中,所述语义理解模块,包括:分词单元,用于对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;词嵌入单元,用于将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;上下文语义编码单元,用于将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;以及,级联单元,用于将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
在上述基于人工智能的政策匹配分析系统中,所述上下文语义编码单元,包括:排列子单元,用于将所述政策内容词嵌入向量的序列排列为输入向量;转化子单元,用于将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;自注意关联矩阵生成子单元,用于计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;标准化自注意子单元,用于对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;注意力计算子单元,用于将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,注意力施加子单元,用于将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
在上述基于人工智能的政策匹配分析系统中,所述高斯关联模块,包括:融合高斯密度图构造单元,用于使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图;以及,高斯离散化单元,用于对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。
在上述基于人工智能的政策匹配分析系统中,所述关联特征提取模块,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图,所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。
在上述基于人工智能的政策匹配分析系统中,所述优化模块,包括:分解单元,用于对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量;上下文关联单元,用于将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量;转移计算单元,用于计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值;权重向量计算单元,用于将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量;权重施加单元,用于以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。
在上述基于人工智能的政策匹配分析系统中,所述分析结果生成模块,用于:使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果;其中,所述分类公式为:
softmax{(Mc,Bc)|Project(F)}
其中,Project(F)表示将所述优化分类特征图投影为向量,Mc为全连接层的权重矩阵,Bc表示全连接层的偏置矩阵,softmax表示归一化指数函数。
根据本申请的一个方面,提供了一种基于人工智能的政策匹配分析方法,其包括:
获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;
将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;
使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;
将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;
对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;
将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
在上述基于人工智能的政策匹配分析方法中,将所述补贴政策内容的文本描述通过基于转换器的上下文编码器以得到政策内容语义特征向量,包括:对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;以及,将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
在上述基于人工智能的政策匹配分析方法中,将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量,包括:将所述政策内容词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
在上述基于人工智能的政策匹配分析方法中,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵,包括:使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图;以及,对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。
与现有技术相比,本申请提供的基于人工智能的政策匹配分析系统及其方法,其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息,使用上下文编码器将对三者进行语义理解,再利用高斯密度图对三者进行关联编码,以及通过卷积神经网络进行关联特征的提取,基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于人工智能的政策匹配分析系统的框图。
图2为根据本申请实施例的基于人工智能的政策匹配分析系统的架构示意图。
图3为根据本申请实施例的基于人工智能的政策匹配分析系统中语义理解模块的框图。
图4为根据本申请实施例的基于人工智能的政策匹配分析系统中上下文语义编码单元的框图。
图5为根据本申请实施例的基于人工智能的政策匹配分析系统中高斯关联模块的框图。
图6为根据本申请实施例的基于人工智能的政策匹配分析方法的流程图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
如上所述,如今,在进行政策智能匹配时,通常是通过关键词进行匹配,而忽略了对政策的发布时间、申报时间以及补贴金额等信息的匹配分析。政策的发布时间和企业知晓时间往往是不同步的,企业需要有一定的盈余时间来进行材料的准备,如果仅仅通过关键词进行匹配,无法保障企业申报材料准备时间的充足性,进而无法保障企业可申报政策的申报及时性和政策申报价值。因此,期待一种基于人工智能的政策匹配分析系统及其方法,可以更准确地匹配符合要求的政策,并提供更有参考价值的政策推送。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
近年来,深度学习以及神经网络的发展为政策的智能匹配提供了新的解决思路和方案。
具体地,在本申请的技术方案中,首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息,使用上下文编码器将对三者进行语义理解,再利用高斯密度图对三者进行关联编码,以及通过卷积神经网络进行关联特征的提取,基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。
具体地,在本申请的技术方案中,首先,获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。接着,将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述,以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量,政策价值语义特征向量和企业行为语义特征向量。考虑到由于所述文本描述都是由多个词组成的,并且每个词之间具有着上下文的语义关联关系,因此,为了能够对所述补贴政策内容、所述政策申报起止时间和补贴金额以及所述企业在政策平台中搜索浏览信息进行充分的语义理解,进一步对所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述,以及所述企业在政策平台中搜索浏览信息的文本描述分别进行分词处理后通过基于转换器的上下文编码器中进行编码,以提取出所述文本描述中的各个词基于全局的高维语义关联特征。应可以理解,基于转换器的上下文编码器是一种强大的预训练模型,其通过训练大规模的语言模型学习了大量的语义信息。通过将所述文本描述输入到所述上下文编码器中,可以将其转换为语义特征向量,捕捉到文本中的语义和语境信息。
接着,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以捕捉不同特征之间的关联性和相互作用,从而得到关联特征矩阵。通过使用高斯密度图编码,将不同特征的权重和相关性进行建模,以综合考虑政策内容特征信息、政策价值特征信息和企业行为特征信息,挖掘不同特征之间的潜在关系和相互影响,从而更准确地评估政策与企业行为之间的关联程度。
进一步地,将所述关联特征矩阵通过卷积神经网络模型进行关联特征挖掘。应可以理解,卷积神经网络模型是一种常用的深度学习模型,擅长处理图像和序列数据,其在特征提取和分类任务上具有很好的效果。将关联特征矩阵输入到卷积神经网络模型中,模型将通过学习卷积和池化等操作,自动识别和提取特征,以捕捉到政策描述和企业需求的语义信息,从而得到分类特征图。
接着,将分类特征图通过分类器进行分类以判断该政策是否具有推送价值。分类器是一种机器学习模型,通过学习已知数据集中的模式和规律,以对新的输入数据进行分类。在本方案中,基于分类结果进行进一步的决策或操作,比如将推送价值高的政策放入推送队列,优先推送给匹配的企业或用户,从而提高整体的推送效果。
特别的,在本申请的技术方案中,考虑到在实际进行推断时,所采集到的补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述中可能存在噪声、异常值或未见过的样本,例如,企业在政策平台中搜索浏览信息的文本描述可能存在各种噪声和异常情况。例如,企业可能输入错误的关键词、浏览不相关的信息或存在重复或冗余的描述。这些噪声、异常值或未见过的样本会影响后续所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量的提取,进而影响所述分类特征图进行分类处理的准确性,为了提高分类特征图的鲁棒性,使分类模型对于输入数据的变化更加鲁棒,即使在面临噪声、异常值或未见过的样本时,模型也能够更好地适应并进行正确分类,本申请进一步地,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。
具体地,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图,包括:对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量;将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量;计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值;将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量;以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。
在本申请的技术方案中,首先对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量,所述多个局部特征主成分特征向量为所述分类特征图的沿通道维度的各个特征矩阵的稀疏化表示。进一步,将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量,所述全局局部特征上下文关联特征向量用于表示所述分类特征图的所有局部特征的全局上下文表示。
进一步地,以所述全局局部特征上下文关联特征向量作为枢轴,来量化表示所述分类特征矩阵的各个局部特征的特征流形的几何复杂度,进而基于量化的几何复杂度对所述分类特征图来进行类注意力机制特征显著性强化以得到优化分类特征图,具体地,在本申请的技术方案中,首先计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值,进而将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量,最终以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到所述优化分类特征图。
这样,通过对所述分类特征图的高维特征分布进行基于枢轴的几何复杂度约束,可以使得所述分类特征图具有强为明确的类边界,同时,还可以使得分类模型对于输入数据的变化更加鲁棒,即使在面临噪声、异常值或未见过的样本时,模型也能够更好地适应并进行正确分类。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1为根据本申请实施例的基于人工智能的政策匹配分析系统的框图。如图1所示,根据本申请实施例的基于人工智能的政策匹配分析系统100,包括:信息获取模块110,用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;语义理解模块120,用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;高斯关联模块130,用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;关联特征提取模块140,用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;优化模块150,用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;以及,分析结果生成模块160,用于将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
图2为根据本申请实施例的基于人工智能的政策匹配分析系统的架构示意图。如图2所示,首先,获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。接着,将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量。然后,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵。继而,将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图。接着,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。最后,将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
在上述基于人工智能的政策匹配分析系统100中,所述信息获取模块110,用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。如上述背景技术所言,如今,在进行政策智能匹配时,通常是仅仅使用关键词进行匹配,而忽略了对政策的发布时间、申报时间以及补贴金额等信息的匹配分析。政策的发布时间和企业知晓时间往往是不同步的,企业需要有一定的盈余时间来进行材料的准备,如果仅仅通过关键词进行匹配,无法保障企业申报材料准备时间的充足性,进而无法保障企业可申报政策的申报及时性和政策申报价值。因此,在本申请的技术方案中,期望综合利用政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息进行政策匹配方案的构建,从而基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。具体地,在本申请的技术方案中,首先,获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。
在上述基于人工智能的政策匹配分析系统100中,所述语义理解模块120,用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量。考虑到由于所述文本描述都是由多个词组成的,并且每个词之间具有着上下文的语义关联关系,因此,为了能够对所述补贴政策内容、所述政策申报起止时间和补贴金额以及所述企业在政策平台中搜索浏览信息进行充分的语义理解,进一步对所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述,以及所述企业在政策平台中搜索浏览信息的文本描述分别进行分词处理后通过基于转换器的上下文编码器中进行编码,以提取出所述文本描述中的各个词基于全局的高维语义关联特征。应可以理解,基于转换器的上下文编码器是一种强大的预训练模型,其通过训练大规模的语言模型学习了大量的语义信息。通过将所述文本描述输入到所述上下文编码器中,可以将其转换为语义特征向量,捕捉到文本中的语义和语境信息。
图3为根据本申请实施例的基于人工智能的政策匹配分析系统中语义理解模块的框图。如图3所示,所述语义理解模块120,包括:分词单元121,用于对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;词嵌入单元122,用于将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;上下文语义编码单元123,用于将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;以及,级联单元124,用于将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
图4为根据本申请实施例的基于人工智能的政策匹配分析系统中上下文语义编码单元的框图。如图4所示,所述上下文语义编码单元123,包括:排列子单元1231,用于将所述政策内容词嵌入向量的序列排列为输入向量;转化子单元1232,用于将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;自注意关联矩阵生成子单元1233,用于计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;标准化自注意子单元1234,用于对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;注意力计算子单元1235,用于将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,注意力施加子单元1236,用于将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
在上述基于人工智能的政策匹配分析系统100中,所述高斯关联模块130,用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵。为了捕捉不同特征之间的关联性和相互作用,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行编码,将不同特征的权重和相关性进行建模,以综合考虑政策内容特征信息、政策价值特征信息和企业行为特征信息,挖掘不同特征之间的潜在关系和相互影响,从而更准确地评估政策与企业行为之间的关联程度。
图5为根据本申请实施例的基于人工智能的政策匹配分析系统中高斯关联模块的框图。如图5所示,所述高斯关联模块130,包括:融合高斯密度图构造单元131,用于使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图;以及,高斯离散化单元132,用于对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。
在上述基于人工智能的政策匹配分析系统100中,所述关联特征提取模块140,用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图。应可以理解,卷积神经网络模型是一种常用的深度学习模型,擅长处理图像和序列数据,其在特征提取和分类任务上具有很好的效果。将关联特征矩阵输入到卷积神经网络模型中,模型将通过学习卷积和池化等操作,自动识别和提取特征,以捕捉到政策描述和企业需求的语义信息,从而更好地进行政策的智能匹配。
相应地,在一个具体示例中,所述关联特征提取模块140,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图,所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。
在上述基于人工智能的政策匹配分析系统100中,所述优化模块150,用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。特别的,在本申请的技术方案中,考虑到在实际进行推断时,所采集到的补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述中可能存在噪声、异常值或未见过的样本,例如,企业在政策平台中搜索浏览信息的文本描述可能存在各种噪声和异常情况。例如,企业可能输入错误的关键词、浏览不相关的信息或存在重复或冗余的描述。这些噪声、异常值或未见过的样本会影响后续所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量的提取,进而影响所述分类特征图进行分类处理的准确性,为了提高分类特征图的鲁棒性,使分类模型对于输入数据的变化更加鲁棒,即使在面临噪声、异常值或未见过的样本时,模型也能够更好地适应并进行正确分类,本申请进一步地,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。
相应地,在一个具体示例中,所述优化模块150,包括:分解单元,用于对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量;上下文关联单元,用于将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量;转移计算单元,用于计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值;权重向量计算单元,用于将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量;权重施加单元,用于以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。
在本申请的技术方案中,首先对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量,所述多个局部特征主成分特征向量为所述分类特征图的沿通道维度的各个特征矩阵的稀疏化表示。进一步,将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量,所述全局局部特征上下文关联特征向量用于表示所述分类特征图的所有局部特征的全局上下文表示。
进一步地,以所述全局局部特征上下文关联特征向量作为枢轴,来量化表示所述分类特征矩阵的各个局部特征的特征流形的几何复杂度,进而基于量化的几何复杂度对所述分类特征图来进行类注意力机制特征显著性强化以得到优化分类特征图,具体地,在本申请的技术方案中,首先计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值,进而将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量,最终以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到所述优化分类特征图。
这样,通过对所述分类特征图的高维特征分布进行基于枢轴的几何复杂度约束,可以使得所述分类特征图具有强为明确的类边界,同时,还可以使得分类模型对于输入数据的变化更加鲁棒,即使在面临噪声、异常值或未见过的样本时,模型也能够更好地适应并进行正确分类。
在上述基于人工智能的政策匹配分析系统100中,所述分析结果生成模块160,用于将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。分类器是一种机器学习模型,通过学习已知数据集中的模式和规律,以对新的输入数据进行分类。在本方案中,基于分类结果进行进一步的决策或操作,比如将推送价值高的政策放入推送队列,优先推送给匹配的企业或用户,从而提高整体的推送效果。
相应地,在一个具体示例中,所述分析结果生成模块160,用于:使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果;其中,所述分类公式为:
softmax{(Mc,Bc)|Project(F)}
其中,Project(F)表示将所述优化分类特征图投影为向量,Mc为全连接层的权重矩阵,Bc表示全连接层的偏置矩阵,softmax表示归一化指数函数。
综上,根据本申请实施例的基于人工智能的政策匹配分析系统被阐明,其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息,使用上下文编码器将对三者进行语义理解,再利用高斯密度图对三者进行关联编码,以及通过卷积神经网络进行关联特征的提取,基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。
示例性方法
图6为根据本申请实施例的基于人工智能的政策匹配分析方法的流程图。如图6所示,根据本申请实施例的基于人工智能的政策匹配分析方法,包括步骤:S110,获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;S120,将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;S130,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;S140,将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;S150,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;S160,将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,所述步骤S120,将所述补贴政策内容的文本描述通过基于转换器的上下文编码器以得到政策内容语义特征向量,包括:对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;以及,将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量,包括:将所述政策内容词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,所述步骤S130,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵,包括:使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图;以及,对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,所述步骤S140,将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图,所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,所述步骤S150,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图,包括:对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量;将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量;计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值;将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量;以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,所述步骤S160,将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值,包括:使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果;其中,所述分类公式为:
softmaX{(Mc,Bc)|Project(F)}
其中,Project(F)表示将所述优化分类特征图投影为向量,Mc为全连接层的权重矩阵,Bc表示全连接层的偏置矩阵,softmax表示归一化指数函数。
这里,本领域技术人员可以理解,上述基于人工智能的政策匹配分析方法中的各个步骤的具体操作已经在上面参考图1到图5的基于人工智能的政策匹配分析系统的描述中得到了详细介绍,并因此,将省略其重复描述。
Claims (10)
1.一种基于人工智能的政策匹配分析系统,其特征在于,包括:
信息获取模块,用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;
语义理解模块,用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;
高斯关联模块,用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;
关联特征提取模块,用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;
优化模块,用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;
分析结果生成模块,用于将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
2.根据权利要求1所述的基于人工智能的政策匹配分析系统,其特征在于,所述语义理解模块,包括:
分词单元,用于对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;
词嵌入单元,用于将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;
上下文语义编码单元,用于将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;
级联单元,用于将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
3.根据权利要求2所述的基于人工智能的政策匹配分析系统,其特征在于,所述上下文语义编码单元,包括:
排列子单元,用于将所述政策内容词嵌入向量的序列排列为输入向量;
转化子单元,用于将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;
自注意关联矩阵生成子单元,用于计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;
标准化自注意子单元,用于对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;
注意力计算子单元,用于将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;
注意力施加子单元,用于将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
4.根据权利要求3所述的基于人工智能的政策匹配分析系统,其特征在于,所述高斯关联模块,包括:
融合高斯密度图构造单元,用于使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图;
高斯离散化单元,用于对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。
5.根据权利要求4所述的基于人工智能的政策匹配分析系统,其特征在于,所述关联特征提取模块,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:
对输入数据进行卷积处理以得到卷积特征图;
对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图;
对所述池化特征图进行非线性激活以得到激活特征图;
其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图,所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。
6.根据权利要求5所述的基于人工智能的政策匹配分析系统,其特征在于,所述优化模块,包括:
分解单元,用于对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量;
上下文关联单元,用于将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量;
转移计算单元,用于计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值;
权重向量计算单元,用于将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量;
权重施加单元,用于以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。
7.根据权利要求6所述的基于人工智能的政策匹配分析系统,其特征在于,所述分析结果生成模块,用于:使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果;其中,所述分类公式为:
softmax{(Mc,Bc)|Project(F)}
其中,Project(F)表示将所述优化分类特征图投影为向量,Mc为全连接层的权重矩阵,Bc表示全连接层的偏置矩阵,softmax表示归一化指数函数。
8.一种基于人工智能的政策匹配分析方法,其特征在于,包括:
获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;
将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;
使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;
将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;
对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;
将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
9.根据权利要求8所述的基于人工智能的政策匹配分析方法,其特征在于,将所述补贴政策内容的文本描述通过基于转换器的上下文编码器以得到政策内容语义特征向量,包括:
对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;
将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;
将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;
将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
10.根据权利要求9所述的基于人工智能的政策匹配分析方法,其特征在于,将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量,包括:
将所述政策内容词嵌入向量的序列排列为输入向量;
将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;
计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;
对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;
将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;
将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310985465.6A CN116992304A (zh) | 2023-08-04 | 2023-08-04 | 基于人工智能的政策匹配分析系统及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310985465.6A CN116992304A (zh) | 2023-08-04 | 2023-08-04 | 基于人工智能的政策匹配分析系统及其方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116992304A true CN116992304A (zh) | 2023-11-03 |
Family
ID=88533606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310985465.6A Pending CN116992304A (zh) | 2023-08-04 | 2023-08-04 | 基于人工智能的政策匹配分析系统及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116992304A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117235630A (zh) * | 2023-11-15 | 2023-12-15 | 吉林大学 | 智慧病区可视化管理系统及其方法 |
CN117271906A (zh) * | 2023-11-22 | 2023-12-22 | 吉林省牛人网络科技股份有限公司 | 肉牛交易管理系统及其方法 |
CN118014703A (zh) * | 2024-02-28 | 2024-05-10 | 湖北省招标股份有限公司 | 基于数字化平台的可视化智能决策系统及方法 |
-
2023
- 2023-08-04 CN CN202310985465.6A patent/CN116992304A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117235630A (zh) * | 2023-11-15 | 2023-12-15 | 吉林大学 | 智慧病区可视化管理系统及其方法 |
CN117235630B (zh) * | 2023-11-15 | 2024-03-05 | 吉林大学 | 智慧病区可视化管理系统及其方法 |
CN117271906A (zh) * | 2023-11-22 | 2023-12-22 | 吉林省牛人网络科技股份有限公司 | 肉牛交易管理系统及其方法 |
CN117271906B (zh) * | 2023-11-22 | 2024-03-22 | 吉林省牛人网络科技股份有限公司 | 肉牛交易管理系统及其方法 |
CN118014703A (zh) * | 2024-02-28 | 2024-05-10 | 湖北省招标股份有限公司 | 基于数字化平台的可视化智能决策系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108959431B (zh) | 标签自动生成方法、系统、计算机可读存储介质及设备 | |
CN116992304A (zh) | 基于人工智能的政策匹配分析系统及其方法 | |
CN112347268A (zh) | 一种文本增强的知识图谱联合表示学习方法及装置 | |
CN113051927B (zh) | 基于多模态图卷积神经网络的社交网络突发事件检测方法 | |
CN112069408A (zh) | 一种融合关系抽取的推荐系统及方法 | |
CN115409018B (zh) | 基于大数据的公司舆情监测系统及其方法 | |
CN113128237B (zh) | 一种服务资源的语义表征模型构建方法 | |
Meshram et al. | Long short-term memory network for learning sentences similarity using deep contextual embeddings | |
CN116523583A (zh) | 电子商务数据分析系统及其方法 | |
CN115951883B (zh) | 分布式微服务架构的服务组件管理系统及其方法 | |
CN114461890A (zh) | 分层多模态的知识产权搜索引擎方法与系统 | |
CN116527357A (zh) | 一种基于门控Transformer的Web攻击检测方法 | |
CN115859980A (zh) | 一种半监督式命名实体识别方法、系统及电子设备 | |
CN115048586A (zh) | 一种融合多特征的新闻推荐方法及系统 | |
CN116150535A (zh) | 一种企业网站建设推广平台及方法 | |
CN117729003A (zh) | 基于机器学习的威胁情报可信分析系统及方法 | |
CN117574915A (zh) | 基于多方数据源的公共数据平台及其数据分析方法 | |
CN117033626A (zh) | 一种文本审核方法、装置、设备及存储介质 | |
CN111709231A (zh) | 一种基于自注意变分自编码的类案推荐方法 | |
CN115859989A (zh) | 基于远程监督的实体识别方法及系统 | |
CN113434668A (zh) | 一种基于模型融合的深度学习文本分类方法及系统 | |
CN118051828B (zh) | 模型训练方法、装置及存储介质 | |
CN117875266B (zh) | 文本编码模型的训练方法、装置、电子设备及存储介质 | |
CN117521658B (zh) | 一种基于篇章级事件抽取的rpa流程挖掘方法及系统 | |
CN117349399A (zh) | 文本分类语料库的构建方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |