CN117349437A

CN117349437A - 基于智能ai的政府信息管理系统及其方法

Info

Publication number: CN117349437A
Application number: CN202311283891.1A
Authority: CN
Inventors: 杜晓雪
Original assignee: Guangdong Xintuo Artificial Intelligence Research Institute Co ltd
Current assignee: Guangdong Xintuo Artificial Intelligence Research Institute Co ltd
Priority date: 2023-10-07
Filing date: 2023-10-07
Publication date: 2024-01-05

Abstract

本发明公开了一种基于智能AI的政府信息管理系统及其方法，其获取待分类政府信息；对所述待分类政府信息进行语义分析以得到多尺度政府信息语义关联特征向量；以及，基于所述多尺度政府信息语义关联特征向量，确定所述待分类政府信息的类别。这样，可以提高政府信息的检索、共享和利用效率，同时保护政府信息的安全和隐私。

Description

基于智能AI的政府信息管理系统及其方法

技术领域

本发明涉及智能化管理技术领域，尤其涉及一种基于智能AI的政府信息管理系统及其方法。

背景技术

政府信息是政府机关在履行职能过程中形成的各类信息，包括政策法规、公共服务、社会管理、公共安全等方面的信息。政府信息的管理是政府履行职责、提高效率、保障公民权利的重要基础。随着信息技术的发展，政府信息的数量和类型日益增多，传统的人工管理方式已经难以满足政府信息管理的需求。

智能AI技术是指利用人工智能算法和模型，对数据进行分析、处理和应用的技术。智能AI技术可以提高数据的价值和效用，为各行各业提供智能化解决方案。在政府信息管理领域，智能AI技术的应用可以提高政府信息的检索、共享和利用效率，同时保护政府信息的安全和隐私。

因此，期待一种基于智能AI的政府信息管理方案。

发明内容

本发明实施例提供一种基于智能AI的政府信息管理系统及其方法，其获取待分类政府信息；对所述待分类政府信息进行语义分析以得到多尺度政府信息语义关联特征向量；以及，基于所述多尺度政府信息语义关联特征向量，确定所述待分类政府信息的类别。这样，可以提高政府信息的检索、共享和利用效率，同时保护政府信息的安全和隐私。

本发明实施例还提供了一种基于智能AI的政府信息管理方法，其包括：

获取待分类政府信息；

对所述待分类政府信息进行语义分析以得到多尺度政府信息语义关联特征向量；以及

基于所述多尺度政府信息语义关联特征向量，确定所述待分类政府信息的类别。

本发明实施例还提供了一种基于智能AI的政府信息管理系统，其包括：

政府信息获取模块，用于获取待分类政府信息；

语义分析模块，用于对所述待分类政府信息进行语义分析以得到多尺度政府信息语义关联特征向量；以及

类别确定模块，用于基于所述多尺度政府信息语义关联特征向量，确定所述待分类政府信息的类别。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1为本发明实施例中提供的一种基于智能AI的政府信息管理方法的流程图。

图2为本发明实施例中提供的一种基于智能AI的政府信息管理方法的系统架构的示意图。

图3为本发明实施例中提供的一种基于智能AI的政府信息管理方法中步骤120的子步骤的流程图。

图4为本发明实施例中提供的一种基于智能AI的政府信息管理系统的框图。

图5为本发明实施例中提供的一种基于智能AI的政府信息管理方法的应用场景图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白，下面结合附图对本发明实施例做进一步详细说明。在此，本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。

除非另有说明，本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的，不是旨在限制本申请的范围。

在本申请实施例记载中，需要说明的是，除非另有说明和限定，术语“连接”应做广义理解，例如，可以是电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

需要说明的是，本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换，以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。

政府信息是指政府机关在履行职能过程中形成的各类信息，涵盖了政府的政策、法规、公共服务、社会管理、公共安全等方面的内容。政府信息的管理对于政府履行职责、提高效率和保障公民权利具有重要意义。

政府信息包括但不限于以下几个方面：

政策法规信息：政府发布的各类法律、法规、规章等文件，用于规范社会行为和管理公共事务，这些信息包括国家层面的法律法规，地方政府发布的规章制度，以及各部门、机构发布的规范性文件等。

公共服务信息：政府提供的各类公共服务信息，包括教育、医疗、社会保障、就业、住房、交通等领域的政策、服务指南、办事流程等信息，这些信息帮助公民了解政府提供的服务内容、申请条件、办理流程等，方便公民享受公共服务。

社会管理信息：政府对社会进行管理和监督的相关信息，包括社会治安、环境保护、城市管理、文化体育等方面的政策、规划、执法信息等，这些信息有助于公民了解社会管理的政策措施、法律法规要求，以及相关的社会问题和解决方案。

公共安全信息：政府发布的与公共安全相关的信息，包括灾害预警、安全防范、紧急救援等方面的信息，这些信息用于提醒公民注意安全风险、采取相应的防范措施，并在紧急情况下提供及时的救援指导和支持。

政府信息的管理对于政府机关的运行和决策具有重要意义，有效管理政府信息可以提高政府工作的透明度、效率和公信力，促进政府与公民之间的互动和沟通。同时，政府信息的安全和隐私保护也是管理工作中需要重视的方面，确保政府信息的合法使用和防止信息泄露对于保护公民权益和维护社会稳定至关重要。

智能AI技术（Artificial Intelligence）是指利用计算机科学和数学方法，模拟和实现人类智能的技术领域，通过构建智能系统，使计算机能够感知、理解、学习、推理和决策，从而解决复杂的问题和执行各种任务。

智能AI技术主要包括以下几个方面：机器学习（Machine Learning）：机器学习是一种让计算机通过数据学习和改进性能的方法，通过构建数学模型和算法，使计算机能够从数据中自动学习，并根据学习结果做出预测或决策。常见的机器学习算法包括决策树、支持向量机、神经网络和深度学习等。自然语言处理（Natural Language Processing，NLP）：自然语言处理是指让计算机能够理解和处理人类自然语言的技术，包括文本分析、语义理解、机器翻译、情感分析等任务，使计算机能够与人类进行自然的交流和理解。计算机视觉（Computer Vision）：计算机视觉是指让计算机能够理解和解释图像和视频的技术，包括图像识别、目标检测、图像分割、人脸识别等任务，使计算机能够从图像和视频中提取有用的信息。增强学习（Reinforcement Learning）：增强学习是一种通过试错和奖惩机制来训练智能系统的方法，通过与环境进行交互，根据行为的结果来调整系统的策略，从而实现系统在特定任务上的优化。深度学习（Deep Learning）：深度学习是一种基于神经网络的机器学习方法，通过构建具有多个隐层的深度神经网络，能够自动从数据中学习特征表示，并在大规模数据上进行高效的训练和推断。深度学习在图像识别、语音识别、自然语言处理等领域取得了重大突破。

智能AI技术在各个领域都有广泛的应用，包括医疗诊断、金融风控、智能交通、智能制造、智能客服等。能够处理大规模数据、发现隐藏的模式和规律，并提供智能化的解决方案，极大地提高了工作效率和决策的准确性。然而，智能AI技术也面临着一些挑战，如数据隐私和安全性、算法的可解释性和公平性等问题，需要继续进行研究和探索。

智能AI技术可以通过自然语言处理和信息抽取等技术，实现对政府信息的智能检索和快速定位，可以帮助政府工作人员快速找到所需的信息资源，提高信息利用效率。同时，智能AI技术还可以实现政府信息的共享和交流，促进政府机关之间的协同工作和信息共享。

政府信息通常包含大量的文本和数据，智能AI技术可以通过机器学习和自然语言处理等技术，自动对政府信息进行分类和管理，能够根据信息的内容和特征，将政府信息自动归类到相应的类别，提高信息管理的效率和准确性。

智能AI技术可以通过对大量的政府信息进行分析和建模，提供决策支持和预测能力，可以帮助政府机关发现潜在的问题和趋势，预测社会发展的走向，为政府决策提供科学依据和参考。

智能AI技术可以根据个体的需求和特征，提供个性化的公共服务。例如，在教育领域，可以根据学生的学习情况和兴趣，智能推荐适合的学习资源和课程。在医疗领域，可以根据患者的病情和历史数据，智能推荐个性化的治疗方案。

智能AI技术可以应用于政府信息的安全和隐私保护，可以通过数据加密、访问控制和风险评估等技术，确保政府信息的安全性和可信度。同时，智能AI技术还可以通过数据匿名化和隐私保护算法，保护公民个人信息的隐私权益。

智能AI技术在政府信息管理领域的应用可以提高政府工作效率，优化公共服务质量，提升决策科学性，保护信息安全和隐私，为政府机关提供更好的决策支持和服务能力。

因此，在本申请中，提供一种基于智能AI的政府信息管理方案。

在本发明的一个实施例中，图1为本发明实施例中提供的一种基于智能AI的政府信息管理方法的流程图。图2为本发明实施例中提供的一种基于智能AI的政府信息管理方法的系统架构的示意图。如图1和图2所示，根据本发明实施例的基于智能AI的政府信息管理方法100，包括：110，获取待分类政府信息；120，对所述待分类政府信息进行语义分析以得到多尺度政府信息语义关联特征向量；以及，130，基于所述多尺度政府信息语义关联特征向量，确定所述待分类政府信息的类别。

在所述步骤110中，确保获取的政府信息来源可靠、完整，并包含足够的样本数据用于训练和分类。获取待分类的政府信息作为后续步骤的输入，为信息管理和决策提供基础数据。

在所述步骤120中，使用自然语言处理（NLP）和机器学习等技术对政府信息进行语义分析，提取关键词、实体、主题等信息，并构建多尺度的语义关联特征向量。通过语义分析，可以深入理解政府信息的含义和关联性，生成多维度的特征向量，为后续的分类和决策提供更准确的数据基础。

在所述步骤130中，利用机器学习算法，如支持向量机（SVM）、决策树、深度学习等，根据多尺度的语义关联特征向量对待分类的政府信息进行分类，并确定其所属类别。通过智能AI的分类算法，能够自动对政府信息进行分类，提高分类的准确性和效率，为政府决策和信息管理提供科学依据。

通过上述步骤，基于智能AI的政府信息管理方法可以实现对待分类政府信息的获取、语义分析和分类，从而提高政府信息管理的效率和准确性，并为政府决策提供科学支持。

通过智能AI技术的应用，可以自动获取和处理大量的政府信息，减少人工操作和时间成本，提高信息管理的效率。通过语义分析和多尺度特征向量的应用，可以更准确地对政府信息进行分类，避免人为主观因素的干扰，提高分类的准确性。基于智能AI的分类结果，可以为政府决策提供科学依据和参考，帮助政府机构做出更准确、合理的决策。通过对政府信息的分类和分析，可以了解各类信息的分布和需求情况，有助于优化资源的分配和利用，提高资源的效益和利用率。通过智能AI技术的应用，可以对政府信息进行自动化的分类、管理和安全控制，提高信息管理的一致性和安全性。

基于智能AI的政府信息管理方法可以提高政府信息管理的效率和准确性，为政府决策提供科学支持，并优化资源分配和加强信息安全。

具体地，在所述步骤110中，获取待分类政府信息。针对上述技术问题，本申请的技术构思是采用智能算法对待分类政府信息进行语义分析，并自动化地实现政府信息的分类。

具体地，在本申请的技术方案中，首先，获取待分类政府信息，并对所述待分类政府信息进行数据清洗以得到清洗后待分类政府信息。获取待分类政府信息是进行分类的基础。这些信息可以包括政府文件、报告、新闻稿、公告等各种类型的文本数据，这些数据的获取需要确保数据来源可靠、完整，并且涵盖了各个类别的样本数据，以便训练和验证分类模型。

待分类政府信息经过语义分析后，可以提取出关键词、实体、主题等多尺度的语义关联特征向量，这些特征向量反映了政府信息的重要内容和语义关联性，为后续的分类算法提供了输入数据。获取的待分类政府信息可以用于训练分类模型，通过将政府信息的特征向量与其对应的类别进行训练，可以建立分类模型，使其能够学习不同类别之间的特征差异，从而实现对未知政府信息的自动分类。获取的待分类政府信息还可以用于验证和调优分类模型的性能，通过将一部分待分类信息作为验证集，可以评估模型的准确性和泛化能力，并进行必要的模型调整和优化。待分类政府信息的获取直接影响最终确定其类别的准确性和可靠性，通过智能AI技术对待分类信息进行分析和分类，可以自动判断其所属类别，并提供相应的结果和建议。

获取待分类政府信息是进行分类的前提和基础，提供了训练和验证分类模型所需的数据，并通过特征提取和模型训练实现对待分类信息的自动分类，从而确定其类别。这对于政府信息管理和决策具有重要的作用，可以提高分类的准确性和效率，为政府机构提供科学依据和决策支持。

具体地，在所述步骤120中，对所述待分类政府信息进行语义分析以得到多尺度政府信息语义关联特征向量。图3为本发明实施例中提供的一种基于智能AI的政府信息管理方法中步骤120的子步骤的流程图。如图3所示，对所述待分类政府信息进行语义分析以得到多尺度政府信息语义关联特征向量，包括：121，对所述待分类政府信息进行数据清洗以得到清洗后待分类政府信息；122，分别以词粒度和句粒度对所述清洗后待分类政府信息进行结构化处理与语义编码以得到政府信息词间语义关联特征向量和政府信息句间语义关联特征向量；以及，123，对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行融合交互以得到所述多尺度政府信息语义关联特征向量。

首先，对所述待分类政府信息进行数据清洗以得到清洗后待分类政府信息。数据清洗是为了去除待分类政府信息中的噪声、冗余和错误，以确保数据的质量和准确性。清洗过程可能包括去除HTML标签、纠正拼写错误、处理缺失值等。数据清洗可以提高待分类政府信息的质量，减少对后续处理和分析的干扰，确保基于清洗后数据的后续步骤的准确性和可靠性。

然后，分别以词粒度和句粒度对所述清洗后待分类政府信息进行结构化处理与语义编码以得到政府信息词间语义关联特征向量和政府信息句间语义关联特征向量。词粒度处理将待分类政府信息分解为单词，并进行词性标注、词干提取等处理，以获取每个词的语义信息。句粒度处理将待分类政府信息分解为句子，并进行句法分析、实体识别等处理，以获取句子级别的语义信息。通过结构化处理和语义编码，可以将待分类政府信息转化为具有语义关联性的特征向量。词间语义关联特征向量反映了不同词之间的语义关系，句间语义关联特征向量反映了不同句子之间的语义关系，为后续步骤提供了更丰富的语义信息。

接着，对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行融合交互以得到所述多尺度政府信息语义关联特征向量：融合交互是将词间和句间的语义关联特征向量进行融合，可以通过拼接、加权求和等方式进行。融合后的多尺度政府信息语义关联特征向量综合了词粒度和句粒度的语义信息。通过融合交互，可以综合利用词粒度和句粒度的语义关联特征，获得更全面、多维度的语义信息。多尺度政府信息语义关联特征向量能够更准确地表示政府信息的语义关联性，为后续的分类和决策提供更有力的支持。

对待分类政府信息进行数据清洗、词粒度和句粒度的结构化处理与语义编码，以及融合交互，可以得到多尺度的政府信息语义关联特征向量。这些步骤的注意点和有益效果包括提高数据质量、获取更丰富的语义信息，为后续的分类和决策提供更准确、全面的数据支持。

在本申请的一个实施例中，分别以词粒度和句粒度对所述清洗后待分类政府信息进行结构化处理与语义编码以得到政府信息词间语义关联特征向量和政府信息句间语义关联特征向量，包括：将所述清洗后待分类政府信息分别进行分词和分句处理以得到政府信息词的序列和政府信息句的序列；对所述政府信息词的序列和所述政府信息句的序列进行数据结构化处理以得到政府信息词嵌入向量的序列和政府信息句嵌入向量的序列；将所述政府信息词嵌入向量的序列通过基于双向长短期记忆神经网络的词间语义关联编码器以得到所述政府信息词间语义关联特征向量；以及，将所述政府信息句嵌入向量的序列通过基于双向长短期记忆神经网络的句间语义关联编码器以得到所述政府信息句间语义关联特征向量。

这里，待分类政府信息可能来自各个政府部门与机构，它们有不同的类型，例如政策文件、法律法规、行政文件、统计数据、报告、公告通知等，也涉及不同的领域与主题。因此，在本申请的技术方案中，通过数据清洗处理，可以对于数据集中存在的格式错误、缺失值或其他数据完整性问题进行修复，对数据集中的重复信息进行去除，并对于分类目标无关的内容，例如格式说明、签名、页眉页脚等进行清理。这样，可以确保数据的干净和一致性，提高政府信息的质量和可用性。

接着，分别以词粒度和句粒度对所述清洗后待分类政府信息进行结构化处理与语义编码以得到政府信息词间语义关联特征向量和政府信息句间语义关联特征向量。这里，基于词为粒度对清洗后待分类政府信息进行语义分析，可以更细致地捕捉政府信息中的关键词和词组，以及它们之间的语义关系。基于句为粒度对清洗后待分类政府信息进行语义分析，可以更全面地把握政府信息中的主题和内容，以提高对政府信息的概括和总结。

在本申请的一个具体示例中，分别以词粒度和句粒度对所述清洗后待分类政府信息进行结构化处理与语义编码以得到政府信息词间语义关联特征向量和政府信息句间语义关联特征向量的编码过程，包括：先将所述清洗后待分类政府信息分别进行分词和分句处理以得到政府信息词的序列和政府信息句的序列；随后，对所述政府信息词的序列和所述政府信息句的序列进行数据结构化处理以得到政府信息词嵌入向量的序列和政府信息句嵌入向量的序列；再将所述政府信息词嵌入向量的序列通过基于双向长短期记忆神经网络的词间语义关联编码器以得到政府信息词间语义关联特征向量；同时，将所述政府信息句嵌入向量的序列通过基于双向长短期记忆神经网络的句间语义关联编码器以得到政府信息句间语义关联特征向量。

在本申请的一个实施例中，对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行融合交互以得到所述多尺度政府信息语义关联特征向量，包括：使用特征间注意力层来对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行特征级交互以得到所述多尺度政府信息语义关联特征向量。

进一步地，使用特征间注意力层来对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行特征级交互以得到多尺度政府信息语义关联特征向量。值得一提的是，传统的注意力机制的目标在于学习一个注意力权重矩阵，应用于当前层的各个神经节点，对于那些重要的节点，赋予它们较大的权重，对于那些次要的节点，赋予它们较小的权重。由于每个神经节点都包含着某种特征信息，经过上述操作，神经网络就能从众多特征信息中选择出对当前任务目标更关键的信息。而特征间注意力层则不同，其更多地关注到了各个特征信息间的依赖关系。

具体地，在所述步骤130中，基于所述多尺度政府信息语义关联特征向量，确定所述待分类政府信息的类别，包括：将所述多尺度政府信息语义关联特征向量通过分类器以得到分类结果，所述分类结果用于表示所述待分类政府信息的类别标签。

然后，将所述多尺度政府信息语义关联特征向量通过分类器以得到分类结果，所述分类结果用于表示所述待分类政府信息的类别标签。

在本申请的一个实施例中，所述基于智能AI的政府信息管理方法，还包括训练步骤：对所述基于双向长短期记忆神经网络的词间语义关联编码器、所述基于双向长短期记忆神经网络的句间语义关联编码器、所述特征间注意力层和所述分类器进行训练；其中，所述训练步骤，包括：获取训练数据，所述训练数据包括训练待分类政府信息，以及，所述训练待分类政府信息的类别标签的真实值；对所述训练待分类政府信息进行数据清洗以得到训练清洗后待分类政府信息；将所述训练清洗后待分类政府信息分别进行分词和分句处理以得到训练政府信息词的序列和训练政府信息句的序列；对所述训练政府信息词的序列和所述训练政府信息句的序列进行数据结构化处理以得到训练政府信息词嵌入向量的序列和训练政府信息句嵌入向量的序列；将所述训练政府信息词嵌入向量的序列通过所述基于双向长短期记忆神经网络的词间语义关联编码器以得到训练政府信息词间语义关联特征向量；将所述训练政府信息句嵌入向量的序列通过所述基于双向长短期记忆神经网络的句间语义关联编码器以得到训练政府信息句间语义关联特征向量；使用所述特征间注意力层来对所述训练政府信息词间语义关联特征向量和所述训练政府信息句间语义关联特征向量进行特征级交互以得到训练多尺度政府信息语义关联特征向量；将所述训练多尺度政府信息语义关联特征向量通过分类器以得到分类损失函数值；以及，以所述分类损失函数值来对所述基于双向长短期记忆神经网络的词间语义关联编码器、所述基于双向长短期记忆神经网络的句间语义关联编码器、所述特征间注意力层和所述分类器进行训练，其中，在所述训练的每一轮迭代中，对所述分类器权重矩阵进行基于基准注释的外部边界约束迭代。

在本申请的技术方案中，使用特征间注意力层来对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行特征级交互时，所述多尺度政府信息语义关联特征向量可以表达所述待分类政府信息在不同源划分尺度下的近程-远程双向上下文语义关联特征的依赖关系特征，但与此同时，在强化了不同源划分尺度下的语义依赖分布的情况下，也会使得所述多尺度政府信息语义关联特征向量的整体特征分布偏离所述待分类政府信息的源域文本语义特征，也就是，偏离了源文本语义特征维度，从而在分类场景下，在分类器的权重矩阵迭代过程中导致所述多尺度政府信息语义关联特征向量的类概率映射的特征源域偏移，以及进一步的权重矩阵基于所述多尺度政府信息语义关联特征向量的源域特征拟合发散，从而影响模型的训练效果，以及训练好的模型得到的所述多尺度政府信息语义关联特征向量的分类结果的准确性。

基于此，本申请的申请人在所述多尺度政府信息语义关联特征向量通过分类器的训练过程中，进行权重矩阵的基于基准注释的外部边界约束，具体表示为：和/>分别是上次和本次迭代的权重矩阵，其中在首次迭代时，采用不同的初始化策略设置/>和/>，（例如，/>设置为单位矩阵而/>设置为待分类特征向量的均值对角矩阵），/>是所述多尺度政府信息语义关联特征向量，为列向量形式，/>表示迭代后的所述分类器权重矩阵，/>表示矩阵乘法，/>表示按位置加法。

这里，通过以所述多尺度政府信息语义关联特征向量在权重空间内的迭代关联表示来作为权重矩阵迭代的外部关联边界约束，从而在将前次的权重矩阵作为本次迭代过程中的基准注释（benchmark annotation）的情况下，减小权重空间迭代过程当中以所述多尺度政府信息语义关联特征向量/>的类概率映射作为锚点的定向不匹配（orientedmismatch），从而进行权重矩阵在迭代过程中相对于所述多尺度政府信息语义关联特征向量/>的类概率映射的源域特征偏移的补偿，并进一步增强权重矩阵基于所述多尺度政府信息语义关联特征向量/>的源域特征拟合聚合，以提升模型的训练效果，以及训练好的模型得到的所述多尺度政府信息语义关联特征向量的分类结果的准确性。

综上，基于本发明实施例的基于智能AI的政府信息管理方法100被阐明，其采用智能算法对待分类政府信息进行语义分析，并自动化地实现政府信息的分类。

图4为本发明实施例中提供的一种基于智能AI的政府信息管理系统的框图。如图4所示，所述基于智能AI的政府信息管理系统，包括：政府信息获取模块210，用于获取待分类政府信息；语义分析模块220，用于对所述待分类政府信息进行语义分析以得到多尺度政府信息语义关联特征向量；以及，类别确定模块230，用于基于所述多尺度政府信息语义关联特征向量，确定所述待分类政府信息的类别。

在所述基于智能AI的政府信息管理系统中，所述语义分析模块，包括：数据清洗单元，用于对所述待分类政府信息进行数据清洗以得到清洗后待分类政府信息；语义编码单元，用于分别以词粒度和句粒度对所述清洗后待分类政府信息进行结构化处理与语义编码以得到政府信息词间语义关联特征向量和政府信息句间语义关联特征向量；以及，融合交互单元，用于对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行融合交互以得到所述多尺度政府信息语义关联特征向量。

在所述基于智能AI的政府信息管理系统中，所述语义编码单元，用于：将所述清洗后待分类政府信息分别进行分词和分句处理以得到政府信息词的序列和政府信息句的序列；对所述政府信息词的序列和所述政府信息句的序列进行数据结构化处理以得到政府信息词嵌入向量的序列和政府信息句嵌入向量的序列；将所述政府信息词嵌入向量的序列通过基于双向长短期记忆神经网络的词间语义关联编码器以得到所述政府信息词间语义关联特征向量；以及，将所述政府信息句嵌入向量的序列通过基于双向长短期记忆神经网络的句间语义关联编码器以得到所述政府信息句间语义关联特征向量。

本领域技术人员可以理解，上述基于智能AI的政府信息管理系统中的各个步骤的具体操作已经在上面参考图1到图3的基于智能AI的政府信息管理方法的描述中得到了详细介绍，并因此，将省略其重复描述。

如上所述，根据本发明实施例的基于智能AI的政府信息管理系统100可以实现在各种终端设备中，例如用于基于智能AI的政府信息管理的服务器等。在一个示例中，根据本发明实施例的基于智能AI的政府信息管理系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该基于智能AI的政府信息管理系统100可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该基于智能AI的政府信息管理系统100同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该基于智能AI的政府信息管理系统100与该终端设备也可以是分立的设备，并且该基于智能AI的政府信息管理系统100可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

图5为本发明实施例中提供的一种基于智能AI的政府信息管理方法的应用场景图。如图5所示，在该应用场景中，首先，获取待分类政府信息（例如，如图5中所示意的C）；然后，将获取的待分类政府信息输入至部署有基于智能AI的政府信息管理算法的服务器（例如，如图5中所示意的S）中，其中所述服务器能够基于智能AI的政府信息管理算法对所述待分类政府信息进行处理，以确定所述待分类政府信息的类别。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于智能AI的政府信息管理方法，其特征在于，包括：

获取待分类政府信息；

2.根据权利要求1所述的基于智能AI的政府信息管理方法，其特征在于，对所述待分类政府信息进行语义分析以得到多尺度政府信息语义关联特征向量，包括：

对所述待分类政府信息进行数据清洗以得到清洗后待分类政府信息；

分别以词粒度和句粒度对所述清洗后待分类政府信息进行结构化处理与语义编码以得到政府信息词间语义关联特征向量和政府信息句间语义关联特征向量；以及

对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行融合交互以得到所述多尺度政府信息语义关联特征向量。

3.根据权利要求2所述的基于智能AI的政府信息管理方法，其特征在于，分别以词粒度和句粒度对所述清洗后待分类政府信息进行结构化处理与语义编码以得到政府信息词间语义关联特征向量和政府信息句间语义关联特征向量，包括：

将所述清洗后待分类政府信息分别进行分词和分句处理以得到政府信息词的序列和政府信息句的序列；

对所述政府信息词的序列和所述政府信息句的序列进行数据结构化处理以得到政府信息词嵌入向量的序列和政府信息句嵌入向量的序列；

将所述政府信息词嵌入向量的序列通过基于双向长短期记忆神经网络的词间语义关联编码器以得到所述政府信息词间语义关联特征向量；以及

将所述政府信息句嵌入向量的序列通过基于双向长短期记忆神经网络的句间语义关联编码器以得到所述政府信息句间语义关联特征向量。

4.根据权利要求3所述的基于智能AI的政府信息管理方法，其特征在于，对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行融合交互以得到所述多尺度政府信息语义关联特征向量，包括：

使用特征间注意力层来对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行特征级交互以得到所述多尺度政府信息语义关联特征向量。

5.根据权利要求4所述的基于智能AI的政府信息管理方法，其特征在于，基于所述多尺度政府信息语义关联特征向量，确定所述待分类政府信息的类别，包括：

将所述多尺度政府信息语义关联特征向量通过分类器以得到分类结果，所述分类结果用于表示所述待分类政府信息的类别标签。

6.根据权利要求5所述的基于智能AI的政府信息管理方法，其特征在于，还包括训练步骤：对所述基于双向长短期记忆神经网络的词间语义关联编码器、所述基于双向长短期记忆神经网络的句间语义关联编码器、所述特征间注意力层和所述分类器进行训练；

其中，所述训练步骤，包括：

获取训练数据，所述训练数据包括训练待分类政府信息，以及，所述训练待分类政府信息的类别标签的真实值；

对所述训练待分类政府信息进行数据清洗以得到训练清洗后待分类政府信息；

将所述训练清洗后待分类政府信息分别进行分词和分句处理以得到训练政府信息词的序列和训练政府信息句的序列；

对所述训练政府信息词的序列和所述训练政府信息句的序列进行数据结构化处理以得到训练政府信息词嵌入向量的序列和训练政府信息句嵌入向量的序列；

将所述训练政府信息词嵌入向量的序列通过所述基于双向长短期记忆神经网络的词间语义关联编码器以得到训练政府信息词间语义关联特征向量；

将所述训练政府信息句嵌入向量的序列通过所述基于双向长短期记忆神经网络的句间语义关联编码器以得到训练政府信息句间语义关联特征向量；

使用所述特征间注意力层来对所述训练政府信息词间语义关联特征向量和所述训练政府信息句间语义关联特征向量进行特征级交互以得到训练多尺度政府信息语义关联特征向量；

将所述训练多尺度政府信息语义关联特征向量通过分类器以得到分类损失函数值；以及

以所述分类损失函数值来对所述基于双向长短期记忆神经网络的词间语义关联编码器、所述基于双向长短期记忆神经网络的句间语义关联编码器、所述特征间注意力层和所述分类器进行训练，其中，在所述训练的每一轮迭代中，对所述分类器权重矩阵进行基于基准注释的外部边界约束迭代。

7.根据权利要求6所述的基于智能AI的政府信息管理方法，其特征在于，在所述训练的每一轮迭代中，对所述分类器权重矩阵进行基于基准注释的外部边界约束迭代，包括：以如下优化公式对所述分类器权重矩阵进行基于基准注释的外部边界约束迭代；

其中，所述优化公式为：其中，/>和/>分别是上次和本次迭代的权重矩阵，/>是所述多尺度政府信息语义关联特征向量，为列向量形式，/>表示迭代后的所述分类器权重矩阵，/>表示矩阵乘法，/>表示按位置加法。

8.一种基于智能AI的政府信息管理系统，其特征在于，包括：

政府信息获取模块，用于获取待分类政府信息；

9.根据权利要求8所述的基于智能AI的政府信息管理系统，其特征在于，所述语义分析模块，包括：

数据清洗单元，用于对所述待分类政府信息进行数据清洗以得到清洗后待分类政府信息；

语义编码单元，用于分别以词粒度和句粒度对所述清洗后待分类政府信息进行结构化处理与语义编码以得到政府信息词间语义关联特征向量和政府信息句间语义关联特征向量；以及

融合交互单元，用于对所述政府信息词间语义关联特征向量和所述政府信息句间语义关联特征向量进行融合交互以得到所述多尺度政府信息语义关联特征向量。

10.根据权利要求9所述的基于智能AI的政府信息管理系统，其特征在于，所述语义编码单元，用于：