CN116701639A - 基于文本分析的双碳知识图谱数据分析方法及系统 - Google Patents

基于文本分析的双碳知识图谱数据分析方法及系统 Download PDF

Info

Publication number
CN116701639A
CN116701639A CN202310923691.1A CN202310923691A CN116701639A CN 116701639 A CN116701639 A CN 116701639A CN 202310923691 A CN202310923691 A CN 202310923691A CN 116701639 A CN116701639 A CN 116701639A
Authority
CN
China
Prior art keywords
data
carbon
policy
emission
screening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310923691.1A
Other languages
English (en)
Other versions
CN116701639B (zh
Inventor
李卫红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Normal University Weizhi Information Technology Co ltd
Original Assignee
Guangdong Normal University Weizhi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Normal University Weizhi Information Technology Co ltd filed Critical Guangdong Normal University Weizhi Information Technology Co ltd
Priority to CN202310923691.1A priority Critical patent/CN116701639B/zh
Publication of CN116701639A publication Critical patent/CN116701639A/zh
Application granted granted Critical
Publication of CN116701639B publication Critical patent/CN116701639B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/84Greenhouse gas [GHG] management systems

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于文本分析的双碳知识图谱数据分析方法及系统,该方法包括:获取多个信息源的双碳相关文本数据和数据获取参数;根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。可见,本发明能够实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。

Description

基于文本分析的双碳知识图谱数据分析方法及系统
技术领域
本发明涉及文本数据处理技术领域,尤其涉及一种基于文本分析的双碳知识图谱数据分析方法及系统。
背景技术
随着绿色城市和绿色排放意识的提高,以及双碳政策的推行,越来越多的企业开始关注如何有效监控双碳政策的更新以及控制排放的合规。现有技术在解决这一问题时,一般只采用人工的政策解读和排放统计来执行,没有考虑到结合语言模型和文本分析算法来提高效率和效果。可见,现有技术存在缺陷,亟需解决。
发明内容
本发明所要解决的技术问题在于,提供一种基于文本分析的双碳知识图谱数据分析方法及系统,能够实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
为了解决上述技术问题,本发明第一方面公开了一种基于文本分析的双碳知识图谱数据分析方法,所述方法包括:
获取多个信息源的双碳相关文本数据和数据获取参数;
根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;
根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;
根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。
作为一种可选的实施方式,在本发明第一方面中,所述数据获取参数包括数据获取来源、数据获取时设备参数、数据类型、数据总大小、数据识别用时中的至少一种;所述数据获取时设备参数包括设备类型、设备性能参数和设备电量中的至少一种。
作为一种可选的实施方式,在本发明第一方面中,所述根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据,包括:
根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据;
根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据。
作为一种可选的实施方式,在本发明第一方面中,所述政策要求筛选分类器模型包括一个政策类型预测模型和多个政策相关度预测模型,所述政策类型预测模型用于根据预设的政策关键字库对输入的任一所述双碳相关文本数据的政策关键字进行筛选获取,并通过预测分类器基于获取到的政策关键字预测该双碳相关文本数据的政策类型;每一所述政策相关度预测模型用于预测一种对应的所述政策类型的双碳相关文本数据的政策相关度;所述根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据,包括:
对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述政策类型预测模型,以得到该双碳相关文本数据对应的政策关键字和政策类型;
将该双碳相关文本数据的所述政策关键字的前后预设字符范围内的相关文本输入至所述政策类型对应的所述政策相关度预测模型中,以得到该双碳相关文本数据对应的政策相关度;
根据所述政策相关度从大到小对所有所述双碳相关文本数据进行排序得到第一数据序列,将所述第一数据序列的前第一数量个所述双碳相关文本数据的所述相关文本确定为双碳政策要求数据。
作为一种可选的实施方式,在本发明第一方面中,所述排放筛选分类器模型包括一个数值类型预测模型和多个排放相关度预测模型,所述数值类型预测模型用于根据数值检测算法对输入的任一所述双碳相关文本数据的数值数据进行筛选获取,并通过预测分类器基于获取到的数值数据预测该数值数据的数据类型;每一所述排放相关度预测模型用于预测一种对应的所述数据类型的双碳相关文本数据的排放相关度;
所述根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据,包括:
对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述数值类型预测模型,以得到该双碳相关文本数据对应的数值数据和数据类型;
将该双碳相关文本数据的所述数值数据输入至所述数据类型对应的所述排放相关度预测模型中,以得到该双碳相关文本数据对应的排放相关度;
根据所述排放相关度从大到小对所有所述双碳相关文本数据进行排序得到第二数据序列,将所述第二数据序列的前第二数量个所述双碳相关文本数据的所述数值数据确定为排放数据。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求,包括:
根据预设的知识图谱算法模型,对所述双碳政策要求数据进行分析以得到数据逻辑推导结果;
将所述数据逻辑推导结果的每一部分与预设的现有政策数据的对应部分进行相似度比较,并将相似度最低的部分推送给用户端;所述用户端基于所述相似度最低的部分修改所述现有政策数据以得到新的双碳政策要求。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求,包括:
根据所述排放数据对应的所述数据获取参数,确定所述排放数据对应的区域;
对于任一所述区域对应的任一所述排放数据,将该排放数据对应的所述数据获取参数输入至训练好的数据可信度预测模型,以得到该排放数据对应的数据可信度权重;
计算该排放数据与所述双碳政策要求中的对应指标阈值的差值,以及所述差值和所述数据可信度权重的乘积;
计算该区域中所有所述排放数据对应的所述乘积的求和平均值,得到该区域对应的排放参数;
判断所述排放参数是否大于预设的参数阈值,若是则确定该区域的排放不满足双碳政策要求,否则确定该区域的排放满足双碳政策要求。
本发明第二方面公开了一种基于文本分析的双碳知识图谱数据分析系统,所述系统包括:
获取模块,用于获取多个信息源的双碳相关文本数据和数据获取参数;
筛选模块,用于根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;
第一确定模块,用于根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;
第二确定模块,用于根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。
作为一种可选的实施方式,在本发明第二方面中,所述数据获取参数包括数据获取来源、数据获取时设备参数、数据类型、数据总大小、数据识别用时中的至少一种;所述数据获取时设备参数包括设备类型、设备性能参数和设备电量中的至少一种。
作为一种可选的实施方式,在本发明第二方面中,所述筛选模块根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据的具体方式,包括:
根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据;
根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据。
作为一种可选的实施方式,在本发明第二方面中,所述政策要求筛选分类器模型包括一个政策类型预测模型和多个政策相关度预测模型,所述政策类型预测模型用于根据预设的政策关键字库对输入的任一所述双碳相关文本数据的政策关键字进行筛选获取,并通过预测分类器基于获取到的政策关键字预测该双碳相关文本数据的政策类型;每一所述政策相关度预测模型用于预测一种对应的所述政策类型的双碳相关文本数据的政策相关度;所述筛选模块根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据的具体方式,包括:
对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述政策类型预测模型,以得到该双碳相关文本数据对应的政策关键字和政策类型;
将该双碳相关文本数据的所述政策关键字的前后预设字符范围内的相关文本输入至所述政策类型对应的所述政策相关度预测模型中,以得到该双碳相关文本数据对应的政策相关度;
根据所述政策相关度从大到小对所有所述双碳相关文本数据进行排序得到第一数据序列,将所述第一数据序列的前第一数量个所述双碳相关文本数据的所述相关文本确定为双碳政策要求数据。
作为一种可选的实施方式,在本发明第二方面中,所述排放筛选分类器模型包括一个数值类型预测模型和多个排放相关度预测模型,所述数值类型预测模型用于根据数值检测算法对输入的任一所述双碳相关文本数据的数值数据进行筛选获取,并通过预测分类器基于获取到的数值数据预测该数值数据的数据类型;每一所述排放相关度预测模型用于预测一种对应的所述数据类型的双碳相关文本数据的排放相关度;
所述筛选模块根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据的具体方式,包括:
对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述数值类型预测模型,以得到该双碳相关文本数据对应的数值数据和数据类型;
将该双碳相关文本数据的所述数值数据输入至所述数据类型对应的所述排放相关度预测模型中,以得到该双碳相关文本数据对应的排放相关度;
根据所述排放相关度从大到小对所有所述双碳相关文本数据进行排序得到第二数据序列,将所述第二数据序列的前第二数量个所述双碳相关文本数据的所述数值数据确定为排放数据。
作为一种可选的实施方式,在本发明第二方面中,所述第一确定模块根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求的具体方式,包括:
根据预设的知识图谱算法模型,对所述双碳政策要求数据进行分析以得到数据逻辑推导结果;
将所述数据逻辑推导结果的每一部分与预设的现有政策数据的对应部分进行相似度比较,并将相似度最低的部分推送给用户端;所述用户端基于所述相似度最低的部分修改所述现有政策数据以得到新的双碳政策要求。
作为一种可选的实施方式,在本发明第二方面中,所述第二确定模块根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求的具体方式,包括:
根据所述排放数据对应的所述数据获取参数,确定所述排放数据对应的区域;
对于任一所述区域对应的任一所述排放数据,将该排放数据对应的所述数据获取参数输入至训练好的数据可信度预测模型,以得到该排放数据对应的数据可信度权重;
计算该排放数据与所述双碳政策要求中的对应指标阈值的差值,以及所述差值和所述数据可信度权重的乘积;
计算该区域中所有所述排放数据对应的所述乘积的求和平均值,得到该区域对应的排放参数;
判断所述排放参数是否大于预设的参数阈值,若是则确定该区域的排放不满足双碳政策要求,否则确定该区域的排放满足双碳政策要求。
本发明第三方面公开了另一种基于文本分析的双碳知识图谱数据分析系统,所述系统包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的基于文本分析的双碳知识图谱数据分析方法中的部分或全部步骤。
本发明第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的基于文本分析的双碳知识图谱数据分析方法中的部分或全部步骤。
与现有技术相比,本发明具有以下有益效果:
本发明基于多个信息源的数据直接筛选出政策数据和排放数据,并基于知识图谱算法来判断特定区域的排放是否满足更新后的政策要求,从而能够实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种基于文本分析的双碳知识图谱数据分析方法的流程示意图;
图2是本发明实施例公开的一种基于文本分析的双碳知识图谱数据分析系统的结构示意图;
图3是本发明实施例公开的另一种基于文本分析的双碳知识图谱数据分析系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明公开了一种基于文本分析的双碳知识图谱数据分析方法及系统,基于多个信息源的数据直接筛选出政策数据和排放数据,并基于知识图谱算法来判断特定区域的排放是否满足更新后的政策要求,从而能够实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种基于文本分析的双碳知识图谱数据分析方法的流程示意图。其中,图1所描述的方法可以应用于相应的数据处理设备、数据处理终端、数据处理服务器中,且该服务器可以是本地服务器,也可以是云服务器,本发明实施例不做限定如图1所示,该基于文本分析的双碳知识图谱数据分析方法可以包括以下操作:
101、获取多个信息源的双碳相关文本数据和数据获取参数。
可选的,数据获取参数包括数据获取来源、数据获取时设备参数、数据类型、数据总大小、数据识别用时中的至少一种。
可选的,数据获取时设备参数包括设备类型、设备性能参数和设备电量中的至少一种。
102、根据预设的数据筛选分类器模型,从双碳相关文本数据中筛选出双碳政策要求数据和排放数据。
103、根据双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求。
104、根据排放数据、数据获取参数和双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。
可见,实施本发明实施例所描述的方法基于多个信息源的数据直接筛选出政策数据和排放数据,并基于知识图谱算法来判断特定区域的排放是否满足更新后的政策要求,从而能够实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
作为一种可选的实施例,上述步骤中的,根据预设的数据筛选分类器模型,从双碳相关文本数据中筛选出双碳政策要求数据和排放数据,包括:
根据训练好的政策要求筛选分类器模型,从双碳相关文本数据中筛选出双碳政策要求数据;
根据训练好的排放筛选分类器模型,从双碳相关文本数据中筛选出排放数据。
可选的,本发明所述的分类器模型或预测模型,均可以为神经网络模型或线性分类器模型。
通过实施该可选的实施例,能够通过政策要求筛选分类器模型和排放筛选分类器模型分别筛选出政策要求数据和排放数据,从而在后续可以用于判断特定区域的排放是否满足更新后的政策要求,实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
作为一种可选的实施例,政策要求筛选分类器模型包括一个政策类型预测模型和多个政策相关度预测模型,政策类型预测模型用于根据预设的政策关键字库对输入的任一双碳相关文本数据的政策关键字进行筛选获取,并通过预测分类器基于获取到的政策关键字预测该双碳相关文本数据的政策类型;每一政策相关度预测模型用于预测一种对应的政策类型的双碳相关文本数据的政策相关度。
相应的,上述步骤中的,根据训练好的政策要求筛选分类器模型,从双碳相关文本数据中筛选出双碳政策要求数据,包括:
对于任一双碳相关文本数据,将该双碳相关文本数据输入至政策类型预测模型,以得到该双碳相关文本数据对应的政策关键字和政策类型;
将该双碳相关文本数据的政策关键字的前后预设字符范围内的相关文本输入至政策类型对应的政策相关度预测模型中,以得到该双碳相关文本数据对应的政策相关度;
根据政策相关度从大到小对所有双碳相关文本数据进行排序得到第一数据序列,将第一数据序列的前第一数量个双碳相关文本数据的相关文本确定为双碳政策要求数据。
可选的,政策类型预测模型可以通过预设的政策关键字匹配库来筛选获取文本数据中的政策关键字,该政策关键字匹配库可以通过预先的统计分析得到。
可选的,政策相关度预测模型可以通过包括有多个训练文本和相应的相关度标注的训练数据集训练得到,其中,相关度标注可以为政策更新相关度的标注,以用于标注训练文本与最新的政策要求之间的相关度。
通过实施该可选的实施例,能够通过政策要求筛选分类器模型中的模型检测文本数据的政策关键字和预测其政策相关度,以筛选出政策要求数据,从而在后续可以用于更新政策要求并判断特定区域的排放是否满足更新后的政策要求,实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
作为一种可选的实施例,上述步骤中的,排放筛选分类器模型包括一个数值类型预测模型和多个排放相关度预测模型,数值类型预测模型用于根据数值检测算法对输入的任一双碳相关文本数据的数值数据进行筛选获取,并通过预测分类器基于获取到的数值数据预测该数值数据的数据类型;每一排放相关度预测模型用于预测一种对应的数据类型的双碳相关文本数据的排放相关度;
根据训练好的排放筛选分类器模型,从双碳相关文本数据中筛选出排放数据,包括:
对于任一双碳相关文本数据,将该双碳相关文本数据输入至数值类型预测模型,以得到该双碳相关文本数据对应的数值数据和数据类型;
将该双碳相关文本数据的数值数据输入至数据类型对应的排放相关度预测模型中,以得到该双碳相关文本数据对应的排放相关度;
根据排放相关度从大到小对所有双碳相关文本数据进行排序得到第二数据序列,将第二数据序列的前第二数量个双碳相关文本数据的数值数据确定为排放数据。
可选的,数据类型可以为不同类型的生物化学污染物质的排放数据。
可选的,数值数据可以包括数值和单位,以更好地被预测出数据类型。
可选的,排放相关度预测模型可以通过包括有多个训练数值数据和对应的与欲监控的排放行为之间的相关度标注的训练数据集训练得到。
通过实施该可选的实施例,能够通过排放筛选分类器模型中的模型检测文本数据的数据类型和预测其排放相关度,以筛选出排放数据,从而在后续可以用于判断特定区域的排放是否满足更新后的政策要求,实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
作为一种可选的实施例,上述步骤中的,根据双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求,包括:
根据预设的知识图谱算法模型,对双碳政策要求数据进行分析以得到数据逻辑推导结果;
将数据逻辑推导结果的每一部分与预设的现有政策数据的对应部分进行相似度比较,并将相似度最低的部分推送给用户端;用户端基于相似度最低的部分修改现有政策数据以得到新的双碳政策要求。
可选的,用户端可以由人工控制来修改政策要求,也可以通过算法来修改。
可选的,知识图谱算法模型为通过包括有多个双碳政策相关的启发问题和逻辑推导标注的训练数据集训练得到的大语言模型,其可以根据双碳政策要求数据进行逻辑推导以得到逻辑推导结果,该逻辑推导结果包括有多个政策解读部分,包括但不限于政策来源解读、政策发布时间解读、政策推行地区解读和政策指标解读。
可选的,相似度的比较和计算可以通过向量距离算法来完成。
通过实施该可选的实施例,能够根据预设的知识图谱算法模型,对双碳政策要求数据进行分析以得到数据逻辑推导结果,以确定出现有政策要求中需要修改的部分进行更新,从而在后续可以用于判断特定区域的排放是否满足更新后的政策要求,实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
作为一种可选的实施例,上述步骤中的,根据排放数据、数据获取参数和双碳政策要求,来确定对应区域的排放是否满足双碳政策要求,包括:
根据排放数据对应的数据获取参数,确定排放数据对应的区域;
对于任一区域对应的任一排放数据,将该排放数据对应的数据获取参数输入至训练好的数据可信度预测模型,以得到该排放数据对应的数据可信度权重;
计算该排放数据与双碳政策要求中的对应指标阈值的差值,以及差值和数据可信度权重的乘积;
计算该区域中所有排放数据对应的乘积的求和平均值,得到该区域对应的排放参数;
判断排放参数是否大于预设的参数阈值,若是则确定该区域的排放不满足双碳政策要求,否则确定该区域的排放满足双碳政策要求。
可选的,数据可信度预测模型通过包括有多个训练数据获取参数和对应的数据可信度标注的训练数据集训练得到。
通过实施该可选的实施例,能够根据排放数据与双碳政策要求中的对应指标阈值的差值以及通过数据可信度预测模型预测出的数据可信度,计算特定区域对应的排放参数,从而能够实现完全自动化和智能化的排放分析,提高双碳政策的推行效率和效果。
实施例二
请参阅图2,图2是本发明实施例公开的一种基于文本分析的双碳知识图谱数据分析系统的结构示意图。其中,图2所描述的系统可以应用于相应的数据处理设备、数据处理终端、数据处理服务器中,且该服务器可以是本地服务器,也可以是云服务器,本发明实施例不做限定。如图2所示,该系统可以包括:
获取模块201,用于获取多个信息源的双碳相关文本数据和数据获取参数。
可选的,数据获取参数包括数据获取来源、数据获取时设备参数、数据类型、数据总大小、数据识别用时中的至少一种。
可选的,数据获取时设备参数包括设备类型、设备性能参数和设备电量中的至少一种。
筛选模块202,用于根据预设的数据筛选分类器模型,从双碳相关文本数据中筛选出双碳政策要求数据和排放数据。
第一确定模块203,用于根据双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求。
第二确定模块204,用于根据排放数据、数据获取参数和双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。
可见,实施本发明实施例所描述的系统基于多个信息源的数据直接筛选出政策数据和排放数据,并基于知识图谱算法来判断特定区域的排放是否满足更新后的政策要求,从而能够实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
作为一种可选的实施例,筛选模块202根据预设的数据筛选分类器模型,从双碳相关文本数据中筛选出双碳政策要求数据和排放数据的具体方式,包括:
根据训练好的政策要求筛选分类器模型,从双碳相关文本数据中筛选出双碳政策要求数据;
根据训练好的排放筛选分类器模型,从双碳相关文本数据中筛选出排放数据。
可选的,本发明所述的分类器模型或预测模型,均可以为神经网络模型或线性分类器模型。
通过实施该可选的实施例,能够通过政策要求筛选分类器模型和排放筛选分类器模型分别筛选出政策要求数据和排放数据,从而在后续可以用于判断特定区域的排放是否满足更新后的政策要求,实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
作为一种可选的实施例,政策要求筛选分类器模型包括一个政策类型预测模型和多个政策相关度预测模型,政策类型预测模型用于根据预设的政策关键字库对输入的任一双碳相关文本数据的政策关键字进行筛选获取,并通过预测分类器基于获取到的政策关键字预测该双碳相关文本数据的政策类型;每一政策相关度预测模型用于预测一种对应的政策类型的双碳相关文本数据的政策相关度;筛选模块202根据训练好的政策要求筛选分类器模型,从双碳相关文本数据中筛选出双碳政策要求数据的具体方式,包括:
对于任一双碳相关文本数据,将该双碳相关文本数据输入至政策类型预测模型,以得到该双碳相关文本数据对应的政策关键字和政策类型;
将该双碳相关文本数据的政策关键字的前后预设字符范围内的相关文本输入至政策类型对应的政策相关度预测模型中,以得到该双碳相关文本数据对应的政策相关度;
根据政策相关度从大到小对所有双碳相关文本数据进行排序得到第一数据序列,将第一数据序列的前第一数量个双碳相关文本数据的相关文本确定为双碳政策要求数据。
可选的,政策类型预测模型可以通过预设的政策关键字匹配库来筛选获取文本数据中的政策关键字,该政策关键字匹配库可以通过预先的统计分析得到。
可选的,政策相关度预测模型可以通过包括有多个训练文本和相应的相关度标注的训练数据集训练得到,其中,相关度标注可以为政策更新相关度的标注,以用于标注训练文本与最新的政策要求之间的相关度。
通过实施该可选的实施例,能够通过政策要求筛选分类器模型中的模型检测文本数据的政策关键字和预测其政策相关度,以筛选出政策要求数据,从而在后续可以用于更新政策要求并判断特定区域的排放是否满足更新后的政策要求,实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
作为一种可选的实施例,排放筛选分类器模型包括一个数值类型预测模型和多个排放相关度预测模型,数值类型预测模型用于根据数值检测算法对输入的任一双碳相关文本数据的数值数据进行筛选获取,并通过预测分类器基于获取到的数值数据预测该数值数据的数据类型;每一排放相关度预测模型用于预测一种对应的数据类型的双碳相关文本数据的排放相关度;
筛选模块202根据训练好的排放筛选分类器模型,从双碳相关文本数据中筛选出排放数据的具体方式,包括:
对于任一双碳相关文本数据,将该双碳相关文本数据输入至数值类型预测模型,以得到该双碳相关文本数据对应的数值数据和数据类型;
将该双碳相关文本数据的数值数据输入至数据类型对应的排放相关度预测模型中,以得到该双碳相关文本数据对应的排放相关度;
根据排放相关度从大到小对所有双碳相关文本数据进行排序得到第二数据序列,将第二数据序列的前第二数量个双碳相关文本数据的数值数据确定为排放数据。
可选的,数据类型可以为不同类型的生物化学污染物质的排放数据。
可选的,数值数据可以包括数值和单位,以更好地被预测出数据类型。
可选的,排放相关度预测模型可以通过包括有多个训练数值数据和对应的与欲监控的排放行为之间的相关度标注的训练数据集训练得到。
通过实施该可选的实施例,能够通过排放筛选分类器模型中的模型检测文本数据的数据类型和预测其排放相关度,以筛选出排放数据,从而在后续可以用于判断特定区域的排放是否满足更新后的政策要求,实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
作为一种可选的实施例,第一确定模块203根据双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求的具体方式,包括:
根据预设的知识图谱算法模型,对双碳政策要求数据进行分析以得到数据逻辑推导结果;
将数据逻辑推导结果的每一部分与预设的现有政策数据的对应部分进行相似度比较,并将相似度最低的部分推送给用户端;用户端基于相似度最低的部分修改现有政策数据以得到新的双碳政策要求。
可选的,用户端可以由人工控制来修改政策要求,也可以通过算法来修改。
可选的,知识图谱算法模型为通过包括有多个双碳政策相关的启发问题和逻辑推导标注的训练数据集训练得到的大语言模型,其可以根据双碳政策要求数据进行逻辑推导以得到逻辑推导结果,该逻辑推导结果包括有多个政策解读部分,包括但不限于政策来源解读、政策发布时间解读、政策推行地区解读和政策指标解读。
可选的,相似度的比较和计算可以通过向量距离算法来完成。
通过实施该可选的实施例,能够根据预设的知识图谱算法模型,对双碳政策要求数据进行分析以得到数据逻辑推导结果,以确定出现有政策要求中需要修改的部分进行更新,从而在后续可以用于判断特定区域的排放是否满足更新后的政策要求,实现完全自动化和智能化的双碳政策分析和排放分析,提高双碳政策的推行效率和效果。
作为一种可选的实施例,第二确定模块204根据排放数据、数据获取参数和双碳政策要求,来确定对应区域的排放是否满足双碳政策要求的具体方式,包括:
根据排放数据对应的数据获取参数,确定排放数据对应的区域;
对于任一区域对应的任一排放数据,将该排放数据对应的数据获取参数输入至训练好的数据可信度预测模型,以得到该排放数据对应的数据可信度权重;
计算该排放数据与双碳政策要求中的对应指标阈值的差值,以及差值和数据可信度权重的乘积;
计算该区域中所有排放数据对应的乘积的求和平均值,得到该区域对应的排放参数;
判断排放参数是否大于预设的参数阈值,若是则确定该区域的排放不满足双碳政策要求,否则确定该区域的排放满足双碳政策要求。
可选的,数据可信度预测模型通过包括有多个训练数据获取参数和对应的数据可信度标注的训练数据集训练得到。
通过实施该可选的实施例,能够根据排放数据与双碳政策要求中的对应指标阈值的差值以及通过数据可信度预测模型预测出的数据可信度,计算特定区域对应的排放参数,从而能够实现完全自动化和智能化的排放分析,提高双碳政策的推行效率和效果。
实施例三
请参阅图3,图3是本发明实施例公开的另一种基于文本分析的双碳知识图谱数据分析系统的结构示意图。如图3所示,该系统可以包括:
存储有可执行程序代码的存储器301;
与存储器301耦合的处理器302;
处理器302调用存储器301中存储的可执行程序代码,执行本发明实施例一公开的基于文本分析的双碳知识图谱数据分析方法中的部分或全部步骤。
实施例四
本发明实施例公开了一种计算机存储介质,该计算机存储介质存储有计算机指令,该计算机指令被调用时,用于执行本发明实施例一公开的基于文本分析的双碳知识图谱数据分析方法中的部分或全部步骤。
以上所描述的系统实施例仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
最后应说明的是:本发明实施例公开的一种基于文本分析的双碳知识图谱数据分析方法及系统所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims (10)

1.一种基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述方法包括:
获取多个信息源的双碳相关文本数据和数据获取参数;
根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;
根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;
根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。
2.根据权利要求1所述的基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述数据获取参数包括数据获取来源、数据获取时设备参数、数据类型、数据总大小、数据识别用时中的至少一种;所述数据获取时设备参数包括设备类型、设备性能参数和设备电量中的至少一种。
3.根据权利要求1所述的基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据,包括:
根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据;
根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据。
4.根据权利要求3所述的基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述政策要求筛选分类器模型包括一个政策类型预测模型和多个政策相关度预测模型,所述政策类型预测模型用于根据预设的政策关键字库对输入的任一所述双碳相关文本数据的政策关键字进行筛选获取,并通过预测分类器基于获取到的政策关键字预测该双碳相关文本数据的政策类型;每一所述政策相关度预测模型用于预测一种对应的所述政策类型的双碳相关文本数据的政策相关度;所述根据训练好的政策要求筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据,包括:
对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述政策类型预测模型,以得到该双碳相关文本数据对应的政策关键字和政策类型;
将该双碳相关文本数据的所述政策关键字的前后预设字符范围内的相关文本输入至所述政策类型对应的所述政策相关度预测模型中,以得到该双碳相关文本数据对应的政策相关度;
根据所述政策相关度从大到小对所有所述双碳相关文本数据进行排序得到第一数据序列,将所述第一数据序列的前第一数量个所述双碳相关文本数据的所述相关文本确定为双碳政策要求数据。
5.根据权利要求3所述的基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述排放筛选分类器模型包括一个数值类型预测模型和多个排放相关度预测模型,所述数值类型预测模型用于根据数值检测算法对输入的任一所述双碳相关文本数据的数值数据进行筛选获取,并通过预测分类器基于获取到的数值数据预测该数值数据的数据类型;每一所述排放相关度预测模型用于预测一种对应的所述数据类型的双碳相关文本数据的排放相关度;
所述根据训练好的排放筛选分类器模型,从所述双碳相关文本数据中筛选出排放数据,包括:
对于任一所述双碳相关文本数据,将该双碳相关文本数据输入至所述数值类型预测模型,以得到该双碳相关文本数据对应的数值数据和数据类型;
将该双碳相关文本数据的所述数值数据输入至所述数据类型对应的所述排放相关度预测模型中,以得到该双碳相关文本数据对应的排放相关度;
根据所述排放相关度从大到小对所有所述双碳相关文本数据进行排序得到第二数据序列,将所述第二数据序列的前第二数量个所述双碳相关文本数据的所述数值数据确定为排放数据。
6.根据权利要求5所述的基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求,包括:
根据预设的知识图谱算法模型,对所述双碳政策要求数据进行分析以得到数据逻辑推导结果;
将所述数据逻辑推导结果的每一部分与预设的现有政策数据的对应部分进行相似度比较,并将相似度最低的部分推送给用户端;所述用户端基于所述相似度最低的部分修改所述现有政策数据以得到新的双碳政策要求。
7.根据权利要求5所述的基于文本分析的双碳知识图谱数据分析方法,其特征在于,所述根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求,包括:
根据所述排放数据对应的所述数据获取参数,确定所述排放数据对应的区域;
对于任一所述区域对应的任一所述排放数据,将该排放数据对应的所述数据获取参数输入至训练好的数据可信度预测模型,以得到该排放数据对应的数据可信度权重;
计算该排放数据与所述双碳政策要求中的对应指标阈值的差值,以及所述差值和所述数据可信度权重的乘积;
计算该区域中所有所述排放数据对应的所述乘积的求和平均值,得到该区域对应的排放参数;
判断所述排放参数是否大于预设的参数阈值,若是则确定该区域的排放不满足双碳政策要求,否则确定该区域的排放满足双碳政策要求。
8.一种基于文本分析的双碳知识图谱数据分析系统,其特征在于,所述系统包括:
获取模块,用于获取多个信息源的双碳相关文本数据和数据获取参数;
筛选模块,用于根据预设的数据筛选分类器模型,从所述双碳相关文本数据中筛选出双碳政策要求数据和排放数据;
第一确定模块,用于根据所述双碳政策要求数据和预设的知识图谱算法模型,确定新的双碳政策要求;
第二确定模块,用于根据所述排放数据、所述数据获取参数和所述双碳政策要求,来确定对应区域的排放是否满足双碳政策要求。
9.一种基于文本分析的双碳知识图谱数据分析系统,其特征在于,所述系统包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7任一项所述的基于文本分析的双碳知识图谱数据分析方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7任一项所述的基于文本分析的双碳知识图谱数据分析方法。
CN202310923691.1A 2023-07-26 2023-07-26 基于文本分析的双碳知识图谱数据分析方法及系统 Active CN116701639B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310923691.1A CN116701639B (zh) 2023-07-26 2023-07-26 基于文本分析的双碳知识图谱数据分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310923691.1A CN116701639B (zh) 2023-07-26 2023-07-26 基于文本分析的双碳知识图谱数据分析方法及系统

Publications (2)

Publication Number Publication Date
CN116701639A true CN116701639A (zh) 2023-09-05
CN116701639B CN116701639B (zh) 2024-03-12

Family

ID=87834236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310923691.1A Active CN116701639B (zh) 2023-07-26 2023-07-26 基于文本分析的双碳知识图谱数据分析方法及系统

Country Status (1)

Country Link
CN (1) CN116701639B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920588A (zh) * 2018-06-26 2018-11-30 北京光年无限科技有限公司 一种用于人机交互的知识图谱更新方法及系统
CN112182248A (zh) * 2020-10-19 2021-01-05 深圳供电局有限公司 一种电价的关键政策的统计方法
CN113849618A (zh) * 2021-09-23 2021-12-28 平安银行股份有限公司 基于知识图谱的策略确定方法、装置、电子设备及介质
CN114780735A (zh) * 2022-02-21 2022-07-22 北京融信数联科技有限公司 基于数据分析的政策匹配方法、系统和可读存储介质
US20220238100A1 (en) * 2021-01-27 2022-07-28 Chengdu Wang'an Technology Development Co., Ltd. Voice data processing based on deep learning
CN115309987A (zh) * 2022-08-03 2022-11-08 河北百斯联科技服务有限公司 一种企业信息匹配系统
CN116361487A (zh) * 2023-04-19 2023-06-30 中电云数智科技有限公司 一种多源异构政策知识图谱构建和存储方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920588A (zh) * 2018-06-26 2018-11-30 北京光年无限科技有限公司 一种用于人机交互的知识图谱更新方法及系统
CN112182248A (zh) * 2020-10-19 2021-01-05 深圳供电局有限公司 一种电价的关键政策的统计方法
US20220238100A1 (en) * 2021-01-27 2022-07-28 Chengdu Wang'an Technology Development Co., Ltd. Voice data processing based on deep learning
CN113849618A (zh) * 2021-09-23 2021-12-28 平安银行股份有限公司 基于知识图谱的策略确定方法、装置、电子设备及介质
CN114780735A (zh) * 2022-02-21 2022-07-22 北京融信数联科技有限公司 基于数据分析的政策匹配方法、系统和可读存储介质
CN115309987A (zh) * 2022-08-03 2022-11-08 河北百斯联科技服务有限公司 一种企业信息匹配系统
CN116361487A (zh) * 2023-04-19 2023-06-30 中电云数智科技有限公司 一种多源异构政策知识图谱构建和存储方法及系统

Also Published As

Publication number Publication date
CN116701639B (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
CN109241740B (zh) 恶意软件基准测试集生成方法及装置
Yu et al. An automatically tuning intrusion detection system
CN103294592B (zh) 利用用户工具交互来自动分析其服务交付中的缺陷的方法与系统
CN111143226B (zh) 自动化测试方法及装置、计算机可读存储介质、电子设备
CN110826071A (zh) 软件漏洞风险预测方法、装置、设备及存储介质
EP1704492A1 (en) Automated anomaly detection
US20230376857A1 (en) Artificial inelligence system with intuitive interactive interfaces for guided labeling of training data for machine learning models
CN117494292A (zh) 一种基于bim和ai大模型的工程进度管理方法及系统
CN111597343A (zh) 一种基于app的智能化用户职业判断方法、装置和电子设备
CN116361104A (zh) 基于大数据的应用故障预测方法、装置、设备及存储介质
CN115982646B (zh) 一种基于云平台的多源测试数据的管理方法及系统
CN116701639B (zh) 基于文本分析的双碳知识图谱数据分析方法及系统
US20030018641A1 (en) Method and system for automatically prioritizing and analyzing performance data for one or more, system configurations
CN110033527A (zh) 一种电力作业安全监管智能机器人及其实现方法
CN110704614B (zh) 对应用中的用户群类型进行预测的信息处理方法及装置
CN110458383B (zh) 需求处理服务化的实现方法、装置及计算机设备、存储介质
CN111221704B (zh) 一种确定办公管理应用系统运行状态的方法及系统
CN113657536A (zh) 基于人工智能的对象分类方法、装置
US11868436B1 (en) Artificial intelligence system for efficient interactive training of machine learning models
US8930362B2 (en) System and method for streak discovery and prediction
CN111142898A (zh) 一种基于群体智能模式的数据防泄漏终端升级方法及系统
CN111045849A (zh) 核对异常原因的识别方法、装置、服务器和存储介质
Kubiak et al. IT-Application Behaviour Analysis: Predicting Critical System States on OpenStack using Monitoring Performance Data and Log Files.
CN112733015B (zh) 一种用户行为分析方法、装置、设备及介质
CN117632905B (zh) 基于云端使用记录的数据库管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant