CN116992304A - 基于人工智能的政策匹配分析系统及其方法 - Google Patents

基于人工智能的政策匹配分析系统及其方法 Download PDF

Info

Publication number
CN116992304A
CN116992304A CN202310985465.6A CN202310985465A CN116992304A CN 116992304 A CN116992304 A CN 116992304A CN 202310985465 A CN202310985465 A CN 202310985465A CN 116992304 A CN116992304 A CN 116992304A
Authority
CN
China
Prior art keywords
policy
feature
vector
matrix
policy content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310985465.6A
Other languages
English (en)
Inventor
林晓丰
周刚
彭元元
杨康
胡玉宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanwei Hongdeyu Technology Service Co ltd
Original Assignee
Shanwei Hongdeyu Technology Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanwei Hongdeyu Technology Service Co ltd filed Critical Shanwei Hongdeyu Technology Service Co ltd
Priority to CN202310985465.6A priority Critical patent/CN116992304A/zh
Publication of CN116992304A publication Critical patent/CN116992304A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及智能分析技术领域,其具体地公开了一种基于人工智能的政策匹配分析系统及其方法,其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息,使用上下文编码器将对三者进行语义理解,再利用高斯密度图对三者进行关联编码,以及通过卷积神经网络进行关联特征的提取,基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。

Description

基于人工智能的政策匹配分析系统及其方法
技术领域
本申请涉及智能分析技术领域,且更为具体地,涉及一种基于人工智能的政策匹配分析系统及其方法。
背景技术
在社会发展过程中,企业有着举足轻重的作用,对于任何一家企业来说,政策匹配的精准性对企业而言重要性不言而喻,由此凸显了政策匹配方法的重要性。
当前政策智能匹配的方法通常是通过关键词匹配的方式进行匹配,而忽略了对政策的发布时间、申报时间以及补贴金额等信息的匹配分析。政策的发布时间和企业知晓时间往往是不同步的,企业需要有一定的盈余时间来进行材料的准备,当前仅通过关键词匹配,无法保障企业申报材料准备时间的充足性,进而无法保障企业可申报政策的申报及时性和参考价值。
因此,期待一种基于人工智能的政策匹配分析系统及其方法。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于人工智能的政策匹配分析系统及其方法,其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息,使用上下文编码器将对三者进行语义理解,再利用高斯密度图对三者进行关联编码,以及通过卷积神经网络进行关联特征的提取,基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。
相应地,根据本申请的一个方面,提供了一种基于人工智能的政策匹配分析系统,其包括:
信息获取模块,用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;
语义理解模块,用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;
高斯关联模块,用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;
关联特征提取模块,用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;
优化模块,用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;
分析结果生成模块,用于将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
在上述基于人工智能的政策匹配分析系统中,所述语义理解模块,包括:分词单元,用于对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;词嵌入单元,用于将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;上下文语义编码单元,用于将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;以及,级联单元,用于将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
在上述基于人工智能的政策匹配分析系统中,所述上下文语义编码单元,包括:排列子单元,用于将所述政策内容词嵌入向量的序列排列为输入向量;转化子单元,用于将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;自注意关联矩阵生成子单元,用于计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;标准化自注意子单元,用于对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;注意力计算子单元,用于将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,注意力施加子单元,用于将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
在上述基于人工智能的政策匹配分析系统中,所述高斯关联模块,包括:融合高斯密度图构造单元,用于使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图;以及,高斯离散化单元,用于对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。
在上述基于人工智能的政策匹配分析系统中,所述关联特征提取模块,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图,所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。
在上述基于人工智能的政策匹配分析系统中,所述优化模块,包括:分解单元,用于对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量;上下文关联单元,用于将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量;转移计算单元,用于计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值;权重向量计算单元,用于将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量;权重施加单元,用于以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。
在上述基于人工智能的政策匹配分析系统中,所述分析结果生成模块,用于:使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果;其中,所述分类公式为:
softmax{(Mc,Bc)|Project(F)}
其中,Project(F)表示将所述优化分类特征图投影为向量,Mc为全连接层的权重矩阵,Bc表示全连接层的偏置矩阵,softmax表示归一化指数函数。
根据本申请的一个方面,提供了一种基于人工智能的政策匹配分析方法,其包括:
获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;
将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;
使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;
将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;
对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;
将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
在上述基于人工智能的政策匹配分析方法中,将所述补贴政策内容的文本描述通过基于转换器的上下文编码器以得到政策内容语义特征向量,包括:对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;以及,将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
在上述基于人工智能的政策匹配分析方法中,将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量,包括:将所述政策内容词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
在上述基于人工智能的政策匹配分析方法中,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵,包括:使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图;以及,对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。
与现有技术相比,本申请提供的基于人工智能的政策匹配分析系统及其方法,其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息,使用上下文编码器将对三者进行语义理解,再利用高斯密度图对三者进行关联编码,以及通过卷积神经网络进行关联特征的提取,基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于人工智能的政策匹配分析系统的框图。
图2为根据本申请实施例的基于人工智能的政策匹配分析系统的架构示意图。
图3为根据本申请实施例的基于人工智能的政策匹配分析系统中语义理解模块的框图。
图4为根据本申请实施例的基于人工智能的政策匹配分析系统中上下文语义编码单元的框图。
图5为根据本申请实施例的基于人工智能的政策匹配分析系统中高斯关联模块的框图。
图6为根据本申请实施例的基于人工智能的政策匹配分析方法的流程图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
如上所述,如今,在进行政策智能匹配时,通常是通过关键词进行匹配,而忽略了对政策的发布时间、申报时间以及补贴金额等信息的匹配分析。政策的发布时间和企业知晓时间往往是不同步的,企业需要有一定的盈余时间来进行材料的准备,如果仅仅通过关键词进行匹配,无法保障企业申报材料准备时间的充足性,进而无法保障企业可申报政策的申报及时性和政策申报价值。因此,期待一种基于人工智能的政策匹配分析系统及其方法,可以更准确地匹配符合要求的政策,并提供更有参考价值的政策推送。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、语音信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
近年来,深度学习以及神经网络的发展为政策的智能匹配提供了新的解决思路和方案。
具体地,在本申请的技术方案中,首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息,使用上下文编码器将对三者进行语义理解,再利用高斯密度图对三者进行关联编码,以及通过卷积神经网络进行关联特征的提取,基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。
具体地,在本申请的技术方案中,首先,获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。接着,将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述,以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量,政策价值语义特征向量和企业行为语义特征向量。考虑到由于所述文本描述都是由多个词组成的,并且每个词之间具有着上下文的语义关联关系,因此,为了能够对所述补贴政策内容、所述政策申报起止时间和补贴金额以及所述企业在政策平台中搜索浏览信息进行充分的语义理解,进一步对所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述,以及所述企业在政策平台中搜索浏览信息的文本描述分别进行分词处理后通过基于转换器的上下文编码器中进行编码,以提取出所述文本描述中的各个词基于全局的高维语义关联特征。应可以理解,基于转换器的上下文编码器是一种强大的预训练模型,其通过训练大规模的语言模型学习了大量的语义信息。通过将所述文本描述输入到所述上下文编码器中,可以将其转换为语义特征向量,捕捉到文本中的语义和语境信息。
接着,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以捕捉不同特征之间的关联性和相互作用,从而得到关联特征矩阵。通过使用高斯密度图编码,将不同特征的权重和相关性进行建模,以综合考虑政策内容特征信息、政策价值特征信息和企业行为特征信息,挖掘不同特征之间的潜在关系和相互影响,从而更准确地评估政策与企业行为之间的关联程度。
进一步地,将所述关联特征矩阵通过卷积神经网络模型进行关联特征挖掘。应可以理解,卷积神经网络模型是一种常用的深度学习模型,擅长处理图像和序列数据,其在特征提取和分类任务上具有很好的效果。将关联特征矩阵输入到卷积神经网络模型中,模型将通过学习卷积和池化等操作,自动识别和提取特征,以捕捉到政策描述和企业需求的语义信息,从而得到分类特征图。
接着,将分类特征图通过分类器进行分类以判断该政策是否具有推送价值。分类器是一种机器学习模型,通过学习已知数据集中的模式和规律,以对新的输入数据进行分类。在本方案中,基于分类结果进行进一步的决策或操作,比如将推送价值高的政策放入推送队列,优先推送给匹配的企业或用户,从而提高整体的推送效果。
特别的,在本申请的技术方案中,考虑到在实际进行推断时,所采集到的补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述中可能存在噪声、异常值或未见过的样本,例如,企业在政策平台中搜索浏览信息的文本描述可能存在各种噪声和异常情况。例如,企业可能输入错误的关键词、浏览不相关的信息或存在重复或冗余的描述。这些噪声、异常值或未见过的样本会影响后续所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量的提取,进而影响所述分类特征图进行分类处理的准确性,为了提高分类特征图的鲁棒性,使分类模型对于输入数据的变化更加鲁棒,即使在面临噪声、异常值或未见过的样本时,模型也能够更好地适应并进行正确分类,本申请进一步地,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。
具体地,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图,包括:对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量;将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量;计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值;将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量;以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。
在本申请的技术方案中,首先对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量,所述多个局部特征主成分特征向量为所述分类特征图的沿通道维度的各个特征矩阵的稀疏化表示。进一步,将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量,所述全局局部特征上下文关联特征向量用于表示所述分类特征图的所有局部特征的全局上下文表示。
进一步地,以所述全局局部特征上下文关联特征向量作为枢轴,来量化表示所述分类特征矩阵的各个局部特征的特征流形的几何复杂度,进而基于量化的几何复杂度对所述分类特征图来进行类注意力机制特征显著性强化以得到优化分类特征图,具体地,在本申请的技术方案中,首先计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值,进而将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量,最终以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到所述优化分类特征图。
这样,通过对所述分类特征图的高维特征分布进行基于枢轴的几何复杂度约束,可以使得所述分类特征图具有强为明确的类边界,同时,还可以使得分类模型对于输入数据的变化更加鲁棒,即使在面临噪声、异常值或未见过的样本时,模型也能够更好地适应并进行正确分类。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1为根据本申请实施例的基于人工智能的政策匹配分析系统的框图。如图1所示,根据本申请实施例的基于人工智能的政策匹配分析系统100,包括:信息获取模块110,用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;语义理解模块120,用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;高斯关联模块130,用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;关联特征提取模块140,用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;优化模块150,用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;以及,分析结果生成模块160,用于将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
图2为根据本申请实施例的基于人工智能的政策匹配分析系统的架构示意图。如图2所示,首先,获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。接着,将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量。然后,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵。继而,将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图。接着,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。最后,将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
在上述基于人工智能的政策匹配分析系统100中,所述信息获取模块110,用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。如上述背景技术所言,如今,在进行政策智能匹配时,通常是仅仅使用关键词进行匹配,而忽略了对政策的发布时间、申报时间以及补贴金额等信息的匹配分析。政策的发布时间和企业知晓时间往往是不同步的,企业需要有一定的盈余时间来进行材料的准备,如果仅仅通过关键词进行匹配,无法保障企业申报材料准备时间的充足性,进而无法保障企业可申报政策的申报及时性和政策申报价值。因此,在本申请的技术方案中,期望综合利用政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息进行政策匹配方案的构建,从而基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。具体地,在本申请的技术方案中,首先,获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述。
在上述基于人工智能的政策匹配分析系统100中,所述语义理解模块120,用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量。考虑到由于所述文本描述都是由多个词组成的,并且每个词之间具有着上下文的语义关联关系,因此,为了能够对所述补贴政策内容、所述政策申报起止时间和补贴金额以及所述企业在政策平台中搜索浏览信息进行充分的语义理解,进一步对所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述,以及所述企业在政策平台中搜索浏览信息的文本描述分别进行分词处理后通过基于转换器的上下文编码器中进行编码,以提取出所述文本描述中的各个词基于全局的高维语义关联特征。应可以理解,基于转换器的上下文编码器是一种强大的预训练模型,其通过训练大规模的语言模型学习了大量的语义信息。通过将所述文本描述输入到所述上下文编码器中,可以将其转换为语义特征向量,捕捉到文本中的语义和语境信息。
图3为根据本申请实施例的基于人工智能的政策匹配分析系统中语义理解模块的框图。如图3所示,所述语义理解模块120,包括:分词单元121,用于对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;词嵌入单元122,用于将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;上下文语义编码单元123,用于将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;以及,级联单元124,用于将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
图4为根据本申请实施例的基于人工智能的政策匹配分析系统中上下文语义编码单元的框图。如图4所示,所述上下文语义编码单元123,包括:排列子单元1231,用于将所述政策内容词嵌入向量的序列排列为输入向量;转化子单元1232,用于将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;自注意关联矩阵生成子单元1233,用于计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;标准化自注意子单元1234,用于对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;注意力计算子单元1235,用于将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,注意力施加子单元1236,用于将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
在上述基于人工智能的政策匹配分析系统100中,所述高斯关联模块130,用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵。为了捕捉不同特征之间的关联性和相互作用,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行编码,将不同特征的权重和相关性进行建模,以综合考虑政策内容特征信息、政策价值特征信息和企业行为特征信息,挖掘不同特征之间的潜在关系和相互影响,从而更准确地评估政策与企业行为之间的关联程度。
图5为根据本申请实施例的基于人工智能的政策匹配分析系统中高斯关联模块的框图。如图5所示,所述高斯关联模块130,包括:融合高斯密度图构造单元131,用于使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图;以及,高斯离散化单元132,用于对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。
在上述基于人工智能的政策匹配分析系统100中,所述关联特征提取模块140,用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图。应可以理解,卷积神经网络模型是一种常用的深度学习模型,擅长处理图像和序列数据,其在特征提取和分类任务上具有很好的效果。将关联特征矩阵输入到卷积神经网络模型中,模型将通过学习卷积和池化等操作,自动识别和提取特征,以捕捉到政策描述和企业需求的语义信息,从而更好地进行政策的智能匹配。
相应地,在一个具体示例中,所述关联特征提取模块140,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图,所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。
在上述基于人工智能的政策匹配分析系统100中,所述优化模块150,用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。特别的,在本申请的技术方案中,考虑到在实际进行推断时,所采集到的补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述中可能存在噪声、异常值或未见过的样本,例如,企业在政策平台中搜索浏览信息的文本描述可能存在各种噪声和异常情况。例如,企业可能输入错误的关键词、浏览不相关的信息或存在重复或冗余的描述。这些噪声、异常值或未见过的样本会影响后续所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量的提取,进而影响所述分类特征图进行分类处理的准确性,为了提高分类特征图的鲁棒性,使分类模型对于输入数据的变化更加鲁棒,即使在面临噪声、异常值或未见过的样本时,模型也能够更好地适应并进行正确分类,本申请进一步地,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图。
相应地,在一个具体示例中,所述优化模块150,包括:分解单元,用于对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量;上下文关联单元,用于将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量;转移计算单元,用于计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值;权重向量计算单元,用于将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量;权重施加单元,用于以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。
在本申请的技术方案中,首先对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量,所述多个局部特征主成分特征向量为所述分类特征图的沿通道维度的各个特征矩阵的稀疏化表示。进一步,将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量,所述全局局部特征上下文关联特征向量用于表示所述分类特征图的所有局部特征的全局上下文表示。
进一步地,以所述全局局部特征上下文关联特征向量作为枢轴,来量化表示所述分类特征矩阵的各个局部特征的特征流形的几何复杂度,进而基于量化的几何复杂度对所述分类特征图来进行类注意力机制特征显著性强化以得到优化分类特征图,具体地,在本申请的技术方案中,首先计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值,进而将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量,最终以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到所述优化分类特征图。
这样,通过对所述分类特征图的高维特征分布进行基于枢轴的几何复杂度约束,可以使得所述分类特征图具有强为明确的类边界,同时,还可以使得分类模型对于输入数据的变化更加鲁棒,即使在面临噪声、异常值或未见过的样本时,模型也能够更好地适应并进行正确分类。
在上述基于人工智能的政策匹配分析系统100中,所述分析结果生成模块160,用于将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。分类器是一种机器学习模型,通过学习已知数据集中的模式和规律,以对新的输入数据进行分类。在本方案中,基于分类结果进行进一步的决策或操作,比如将推送价值高的政策放入推送队列,优先推送给匹配的企业或用户,从而提高整体的推送效果。
相应地,在一个具体示例中,所述分析结果生成模块160,用于:使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果;其中,所述分类公式为:
softmax{(Mc,Bc)|Project(F)}
其中,Project(F)表示将所述优化分类特征图投影为向量,Mc为全连接层的权重矩阵,Bc表示全连接层的偏置矩阵,softmax表示归一化指数函数。
综上,根据本申请实施例的基于人工智能的政策匹配分析系统被阐明,其首先获取政策内容信息、申报起止时间和补贴金额信息以及企业搜索浏览信息,使用上下文编码器将对三者进行语义理解,再利用高斯密度图对三者进行关联编码,以及通过卷积神经网络进行关联特征的提取,基于企业的兴趣和政策申报价值进行该政策是否有推送价值的判断。这样,可以更准确地匹配适合企业的政策,提供个性化的推送服务,并使得推送的政策更有价值。
示例性方法
图6为根据本申请实施例的基于人工智能的政策匹配分析方法的流程图。如图6所示,根据本申请实施例的基于人工智能的政策匹配分析方法,包括步骤:S110,获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;S120,将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;S130,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;S140,将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;S150,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;S160,将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,所述步骤S120,将所述补贴政策内容的文本描述通过基于转换器的上下文编码器以得到政策内容语义特征向量,包括:对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;以及,将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量,包括:将所述政策内容词嵌入向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,所述步骤S130,使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵,包括:使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图;以及,对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,所述步骤S140,将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图,所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,所述步骤S150,对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图,包括:对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量;将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量;计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值;将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量;以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。
在一个具体示例中,在上述基于人工智能的政策匹配分析方法中,所述步骤S160,将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值,包括:使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果;其中,所述分类公式为:
softmaX{(Mc,Bc)|Project(F)}
其中,Project(F)表示将所述优化分类特征图投影为向量,Mc为全连接层的权重矩阵,Bc表示全连接层的偏置矩阵,softmax表示归一化指数函数。
这里,本领域技术人员可以理解,上述基于人工智能的政策匹配分析方法中的各个步骤的具体操作已经在上面参考图1到图5的基于人工智能的政策匹配分析系统的描述中得到了详细介绍,并因此,将省略其重复描述。

Claims (10)

1.一种基于人工智能的政策匹配分析系统,其特征在于,包括:
信息获取模块,用于获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;
语义理解模块,用于将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;
高斯关联模块,用于使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;
关联特征提取模块,用于将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;
优化模块,用于对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;
分析结果生成模块,用于将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
2.根据权利要求1所述的基于人工智能的政策匹配分析系统,其特征在于,所述语义理解模块,包括:
分词单元,用于对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;
词嵌入单元,用于将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;
上下文语义编码单元,用于将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;
级联单元,用于将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
3.根据权利要求2所述的基于人工智能的政策匹配分析系统,其特征在于,所述上下文语义编码单元,包括:
排列子单元,用于将所述政策内容词嵌入向量的序列排列为输入向量;
转化子单元,用于将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;
自注意关联矩阵生成子单元,用于计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;
标准化自注意子单元,用于对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;
注意力计算子单元,用于将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;
注意力施加子单元,用于将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
4.根据权利要求3所述的基于人工智能的政策匹配分析系统,其特征在于,所述高斯关联模块,包括:
融合高斯密度图构造单元,用于使用高斯密度图来融合所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量以得到融合高斯密度图;
高斯离散化单元,用于对所述融合高斯密度图中各个位置的高斯分布进行离散化处理以得到所述关联特征矩阵。
5.根据权利要求4所述的基于人工智能的政策匹配分析系统,其特征在于,所述关联特征提取模块,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:
对输入数据进行卷积处理以得到卷积特征图;
对所述卷积特征图进行沿通道维度的各个特征矩阵的池化处理以得到池化特征图;
对所述池化特征图进行非线性激活以得到激活特征图;
其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述分类特征图,所述作为过滤器的卷积神经网络的第一层的输入为所述关联特征矩阵。
6.根据权利要求5所述的基于人工智能的政策匹配分析系统,其特征在于,所述优化模块,包括:
分解单元,用于对所述分类特征图的沿通道维度的各个特征矩阵进行基于特征值的矩阵分解以得到多个局部特征主成分特征向量;
上下文关联单元,用于将所述多个局部特征主成分特征向量通过基于转换器模块的上下文编码器以得到全局局部特征上下文关联特征向量;
转移计算单元,用于计算所述各个局部特征主成分特征向量相对于所述全局局部特征上下文关联特征向量的转移矩阵,并对计算所述各个转移矩阵的全局均值以得到多个转移特征值;
权重向量计算单元,用于将所述多个转移特征值排列为几何相似度输入向量后通过Softmax激活函数以得到几何复杂性约束特征向量;
权重施加单元,用于以所述几何复杂性约束特征向量中各个位置的特征值作为权重分别对所述分类特征图的沿通道维度的各个特征矩阵进行加权以得到优化分类特征图。
7.根据权利要求6所述的基于人工智能的政策匹配分析系统,其特征在于,所述分析结果生成模块,用于:使用所述分类器以如下分类公式对所述优化分类特征图进行处理以获得分类结果;其中,所述分类公式为:
softmax{(Mc,Bc)|Project(F)}
其中,Project(F)表示将所述优化分类特征图投影为向量,Mc为全连接层的权重矩阵,Bc表示全连接层的偏置矩阵,softmax表示归一化指数函数。
8.一种基于人工智能的政策匹配分析方法,其特征在于,包括:
获取补贴政策内容的文本描述、政策申报起止时间和补贴金额的文本描述以及企业在政策平台中搜索浏览信息的文本描述;
将所述补贴政策内容的文本描述、所述政策申报起止时间和补贴金额的文本描述以及所述企业在政策平台中搜索浏览信息的文本描述分别通过基于转换器的上下文编码器以得到政策内容语义特征向量、政策价值语义特征向量和企业行为语义特征向量;
使用高斯密度图对所述政策内容语义特征向量、所述政策价值语义特征向量和所述企业行为语义特征向量进行关联编码以得到关联特征矩阵;
将所述关联特征矩阵通过作为过滤器的卷积神经网络模型以得到分类特征图;
对所述分类特征图进行基于特征流形的几何复杂性约束以得到优化分类特征图;
将所述优化分类特征图通过分类器以得到分类结果,所述分类结果用于表示该政策是否有推送价值。
9.根据权利要求8所述的基于人工智能的政策匹配分析方法,其特征在于,将所述补贴政策内容的文本描述通过基于转换器的上下文编码器以得到政策内容语义特征向量,包括:
对所述补贴政策内容的文本描述进行分词处理以获得多个政策内容词;
将所述多个政策内容词通过嵌入层以将所述多个政策内容词中各个政策内容词转化为政策内容词嵌入向量以得到政策内容词嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个政策内容词进行嵌入编码;
将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量;
将所述多个政策内容特征向量进行级联以得到所述政策内容语义特征向量。
10.根据权利要求9所述的基于人工智能的政策匹配分析方法,其特征在于,将所述政策内容词嵌入向量的序列通过所述基于转换器的上下文编码器以得到多个政策内容特征向量,包括:
将所述政策内容词嵌入向量的序列排列为输入向量;
将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;
计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;
对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;
将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;
将所述自注意力特征矩阵与所述政策内容词嵌入向量的序列中各个政策内容词嵌入向量分别进行相乘以得到所述多个政策内容特征向量。
CN202310985465.6A 2023-08-04 2023-08-04 基于人工智能的政策匹配分析系统及其方法 Pending CN116992304A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310985465.6A CN116992304A (zh) 2023-08-04 2023-08-04 基于人工智能的政策匹配分析系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310985465.6A CN116992304A (zh) 2023-08-04 2023-08-04 基于人工智能的政策匹配分析系统及其方法

Publications (1)

Publication Number Publication Date
CN116992304A true CN116992304A (zh) 2023-11-03

Family

ID=88533606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310985465.6A Pending CN116992304A (zh) 2023-08-04 2023-08-04 基于人工智能的政策匹配分析系统及其方法

Country Status (1)

Country Link
CN (1) CN116992304A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235630A (zh) * 2023-11-15 2023-12-15 吉林大学 智慧病区可视化管理系统及其方法
CN117271906A (zh) * 2023-11-22 2023-12-22 吉林省牛人网络科技股份有限公司 肉牛交易管理系统及其方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117235630A (zh) * 2023-11-15 2023-12-15 吉林大学 智慧病区可视化管理系统及其方法
CN117235630B (zh) * 2023-11-15 2024-03-05 吉林大学 智慧病区可视化管理系统及其方法
CN117271906A (zh) * 2023-11-22 2023-12-22 吉林省牛人网络科技股份有限公司 肉牛交易管理系统及其方法
CN117271906B (zh) * 2023-11-22 2024-03-22 吉林省牛人网络科技股份有限公司 肉牛交易管理系统及其方法

Similar Documents

Publication Publication Date Title
CN108959431B (zh) 标签自动生成方法、系统、计算机可读存储介质及设备
CN116992304A (zh) 基于人工智能的政策匹配分析系统及其方法
CN113051927B (zh) 基于多模态图卷积神经网络的社交网络突发事件检测方法
CN103593336A (zh) 一种基于语义分析的知识推送系统及方法
CN113128237B (zh) 一种服务资源的语义表征模型构建方法
Meshram et al. Long short-term memory network for learning sentences similarity using deep contextual embeddings
CN113806554B (zh) 面向海量会议文本的知识图谱构建方法
CN115409018B (zh) 基于大数据的公司舆情监测系统及其方法
Mittal et al. Deep graph-long short-term memory: a deep learning based approach for text classification
CN115951883B (zh) 分布式微服务架构的服务组件管理系统及其方法
CN116523583A (zh) 电子商务数据分析系统及其方法
CN114461890A (zh) 分层多模态的知识产权搜索引擎方法与系统
CN116150535A (zh) 一种企业网站建设推广平台及方法
CN117574915A (zh) 基于多方数据源的公共数据平台及其数据分析方法
CN115859989A (zh) 基于远程监督的实体识别方法及系统
Wu et al. Text classification using triplet capsule networks
CN114757391A (zh) 一种基于网络数据空间设计的服务质量预测方法
CN114595370A (zh) 模型训练、排序方法、装置、电子设备及存储介质
Pfeiffer Business Process Representation Learning.
CN113434668A (zh) 一种基于模型融合的深度学习文本分类方法及系统
Li et al. Using big data from the web to train chinese traffic word representation model in vector space
US20230351270A1 (en) Intelligent filter
Paulheim et al. From Word Embeddings to Knowledge Graph Embeddings
CN117349399A (zh) 文本分类语料库的构建方法及其系统
Che et al. A feature and deep learning model recommendation system for mobile application

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination