CN115689386A - 一种基于知识图谱和fp增长算法的企业运营监测方法 - Google Patents

一种基于知识图谱和fp增长算法的企业运营监测方法 Download PDF

Info

Publication number
CN115689386A
CN115689386A CN202211447623.4A CN202211447623A CN115689386A CN 115689386 A CN115689386 A CN 115689386A CN 202211447623 A CN202211447623 A CN 202211447623A CN 115689386 A CN115689386 A CN 115689386A
Authority
CN
China
Prior art keywords
index
indexes
growth algorithm
enterprise
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211447623.4A
Other languages
English (en)
Inventor
王亿
樊立波
孙智卿
韩荣杰
屠永伟
方响
蒋建
阮箴
来益博
宣羿
黄佳斌
陈益芳
金旻昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority to CN202211447623.4A priority Critical patent/CN115689386A/zh
Publication of CN115689386A publication Critical patent/CN115689386A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供了一种基于知识图谱和FP增长算法的企业运营监测方法,所述企业运营监测方法具体为:获取电力行业企业指标,并依据用户、业务和财务筛选出若干个指标,以此构建指标关系图谱,确定企业的业务经营指标及其影响因素,并根据指标关系图谱计算影响因素与业务经营指标之间的联系,并通过FP增长算法获取强关联规则,通过指标关系图谱确定运营指标与其对应的二级指标的指标关联程度,获取运营指标的强关联指标,基于运营指标对应历史数据和强关联指标对应数据对企业运营进行监测。本发明能够通过指标关系图谱以及业务经营指标与其运行因素间的联系来获取业务指标数据间的关联规则,并基于业务指标数据间的关联规则实现企业运营的全面监测。

Description

一种基于知识图谱和FP增长算法的企业运营监测方法
技术领域
本发明涉及企业运营监测技术领域,尤其是指一种基于知识图谱和FP增长算法的企业运营监测方法。
背景技术
电力企业在企业运营过程中,往往需要各部门协同,并根据各部门所管理的具体业务数据来进行下一步的企业运营决策。而现在的电力企业各部门所管理的业务数据往往为独立负责,这也就使得在进行企业运营决策时,会面临信息不够全、信息渠道单一、信息传递效率低等问题。且在电力企业运营管理的跨部门协同中,可能会因信息更新不及时而出现连续异常行为,若无法及时获取异常行为,则可能会导致企业运营低效。而无论是异常行为分析还是企业运营决策,都需要对海量的业务指标数据之间的关联进行分析,但由于存在的信息不够全、信息渠道单一、信息传递效率低等问题,无法实现对于业务指标数据间的关联进行有效分析,难以实现对于企业总体运营状态的监控。
发明内容
本发明的目的是克服现有技术中的缺点,提供一种基于知识图谱和FP增长算法的企业运营监测方法,通过指标关系图谱以及业务经营指标与其运行因素间的联系来获取业务指标数据间的关联规则,并基于业务指标数据间的关联规则对企业运营进行监测,能够解决业务指标数据间的关联不清晰的问题,从而实现对于企业总体运营状态的监控。
本发明的目的是通过下述技术方案予以实现:
一种基于知识图谱和FP增长算法的企业运营监测方法,包括以下步骤:
步骤一,获取电力行业企业指标,并依据用户、业务和财务筛选出若干个指标,并根据筛选出的指标进行指标关系图谱的构建;
步骤二,确定企业的业务经营指标,并调取业务经营指标的影响因素,并根据指标关系图谱计算影响因素与业务经营指标之间的联系,并通过FP增长算法获取强关联规则;
步骤三,确定公司运营监测的运营指标,并通过指标关系图谱确定运营指标与其对应的二级指标的指标关联程度,基于指标关联程度以及强关联规则确定运营指标的强关联指标,基于运营指标对应历史数据以及强关联指标对应数据对企业运营进行监测。
进一步的,所述构建指标关系图谱的具体过程为:基于指标定义获取指标的基本信息,并基于全量指标构成实体集合,同时以步骤一中筛选出的若干个指标作为一级指标,并对一级指标进行三级分解,获取前三层指标,并调取企业运营的会计科目表,以会计科目表为基准指标,逐层分解形成后四层指标,完成指标关系图谱的指标分解后,基于分解后的指标进行实体对齐、本体构建和质量评估,并根据实体对齐和质量评估结果对构建指标关系图谱所需的知识库进行更新,再根据指标的基本信息以及实体集合进行推理规则的归纳,根据归纳的推理规则扩展知识库内的信息,完成知识库的更新和信息扩展后,基于知识库构建指标关系图谱。
进一步的,基于分解后的指标进行实体对齐、本体构建和质量评估前,还对分解后的指标进行除重和消歧义处理。
进一步的,基于分解后的指标进行实体对齐、本体构建和质量评估时,先以用户、业务和财务为基准构建三个本体,并采用自顶向下的构建方式定义本体的数据模式,完成本体构建,再根据构建的实体集合进行实体对齐,将实体加入构建的本体中,并基于指标覆盖面、指标层级深度以及指标与指标之间的关联强度进行质量评估。
进一步的,所述通过FP增长算法获取强关联规则的具体过程为:基于公司业务经营的影响因素创建数据库,并选取数据库内的主体数据,并采用聚类算法对选取的数据进行离散化处理,通过FP增长算法对离散化处理的数据进行数据挖掘,获取数据库内频繁项集,并根据支持度和置信度从频繁集内筛选出强关联规则。
进一步的,所述公司业务经营的影响因素包括月用电量、业扩储备户数、业扩报装完成户数、本月全口径单桩日均充电量和年累计售电量含趸量。
进一步的,在基于公司业务经营的影响因素创建数据库后,还对数据库中的数据进行去噪和缺失值处理,并在完成去噪和缺失值处理后,基于灰色系统修正法对数据库进行数据域修补。
进一步的,在构建指标关系图谱后,还对指标关系图谱进行可视化展示,还对指标关系图谱内的各指标进行添加标注处理。
进一步的,所述添加的标注包括指标说明、关联指标、指标的强影响因素以及指标与强影响因素间趋势变化图。
本发明的有益效果是:
能够通过构建指标关系图谱的方式对指标数据间的关联进行分析,并进一步通过FP增长算法对指标数据的关联规则进行分析,构建的指标关系图谱能够对不同部门间的数据进行集合,使得企业运营过程中,能够快速获取所需信息。且通过关联规则能够确定企业运营相关联的具体指标,且根据所确定指标的具体数据变化能够实现对于企业总体运营的监测。
附图说明
图1是本发明的一种流程示意图。
具体实施方式
下面结合附图和实施例对本发明进一步描述。
实施例:
一种基于知识图谱和FP增长算法的企业运营监测方法,如图1所示,包括以下步骤:
步骤一,获取电力行业企业指标,并依据用户、业务和财务筛选出若干个指标,并根据筛选出的指标进行指标关系图谱的构建;
步骤二,确定企业的业务经营指标,并调取业务经营指标的影响因素,并根据指标关系图谱计算影响因素与业务经营指标之间的联系,并通过FP增长算法获取强关联规则;
步骤三,确定公司运营监测的运营指标,并通过指标关系图谱确定运营指标与其对应的二级指标的指标关联程度,基于指标关联程度以及强关联规则确定运营指标的强关联指标,基于运营指标对应历史数据以及强关联指标对应数据对企业运营进行监测。
所述电力行业企业指标能够分为一级指标和二级指标,一级指标包括财务经营指标、业务经营指标和用户服务指标,在构建指标关系图谱时,从二级指标中筛选出其中50个指标,并以筛选出的指标为基础构建指标关系图谱。其中,二级指标还能够细分为基础指标,以业务运营指标中的二级指标清洁能源占比率为例,能够再细分为清洁能源发电量和总发电量。
在进行基于指标关联程度以及强关联规则确定运营指标的强关联指标时,主要依照指标业务逻辑实现指标筛选。所述指标业务逻辑指的是存在强关联、互相有影响的指标与指标间的关系。以“资产总额”、“业扩报装完成户数”、“用电量”为例,基于业务逻辑分析,“资产总额”受“费用”“负债”“所有者权益”“收入”影响,供电公司的“主营业务收入”包括“电力销售”“输电收入”“可靠性供电收入”“自备电厂系统备用容量费收入”“受托运行维护收入”“尚未并入电价单独确认的农村电网维护费收入”“可再生能源电价附加收入”“留用加价电费收入”“充换电服务收入”,其它业务收入包括“校表收入”“供电延伸服务(含户表安装收入、补卡费、赔表费)”“各种代征基金返还的手续费”;“电力销售”指标可进一步分解为“售电量”与“平均电价”,“售电量”与“用电量”存在强关联;而“业扩容量完成率”与用户用电水平具有紧密的联系,对“售电量”存在一定影响,因此其子指标“业扩报装完成户数”与“资产总额”存在关联关系。
所述构建指标关系图谱的具体过程为:基于指标定义获取指标的基本信息,并基于全量指标构成实体集合,同时以步骤一中筛选出的若干个指标作为一级指标,并对一级指标进行三级分解,获取前三层指标,并调取企业运营的会计科目表,以会计科目表为基准指标,逐层分解形成后四层指标,完成指标关系图谱的指标分解后,基于分解后的指标进行实体对齐、本体构建和质量评估,并根据实体对齐和质量评估结果对构建指标关系图谱所需的知识库进行更新,再根据指标的基本信息以及实体集合进行推理规则的归纳,根据归纳的推理规则扩展知识库内的信息,完成知识库的更新和信息扩展后,基于知识库构建指标关系图谱。
所述指标的基本信息包括指标名称、指标关系和指标属性。
所述全量指标为步骤一中所获取的电力行业企业指标,筛选出的若干个指标应当为电力行业企业指标中的二级指标。
基于分解后的指标进行实体对齐、本体构建和质量评估前,还对分解后的指标进行除重和消歧义处理。
除重和消歧义处理能够防止后续对分解后的指标进行实体对齐时,出现对其出错等问题,提高指标关系图谱的构建效率和准确性。
基于分解后的指标进行实体对齐、本体构建和质量评估时,先以用户、业务和财务为基准构建三个本体,并采用自顶向下的构建方式定义本体的数据模式,完成本体构建,再根据构建的实体集合进行实体对齐,将实体加入构建的本体中,并基于指标覆盖面、指标层级深度以及指标与指标之间的关联强度进行质量评估。
所述通过FP增长算法获取强关联规则的具体过程为:基于公司业务经营的影响因素创建数据库,并选取数据库内的主体数据,并采用聚类算法对选取的数据进行离散化处理,通过FP增长算法对离散化处理的数据进行数据挖掘,获取数据库内频繁项集,并根据支持度和置信度从频繁集内筛选出强关联规则。
FP增长算法能够对数据进行挖掘,从而实现对于关联规则的获取。
FP增长算法进行数据挖掘时,需要先在数据库中建表,得到候选1-项集后,进行各个项集的支持度计算,并在获取各个项集的支持度后,对于表中不符合要求的项目进行删除,从而找出其中的候选1-频繁项集,再结合FP增长算法进行自连接操作,对数据库进行分析,从而得到目标项集的支持度。目标项集中的元素即为其中一个业务经营指标的关联规则,再通过目标项集对应的频繁项集获取强关联规则。所述强关联规则具体通过关联规则的支持度和置信度进行筛选,支持度高且置信度也高的关联规则可以视为强关联规则。
本实施例中具体采用K-Means聚类算法对数据进行离散化处理。
所述公司业务应用的影响因素包括月用电量、业扩储备户数、业扩报装完成户数、本月全口径单桩日均充电量和年累计售电量含趸量。
所述年累计售电量含趸量为年累计售电量中以趸售方式售出的电量。
在基于公司业务经营的影响因素创建数据库后,还对数据库中的数据进行去噪和缺失值处理,并在完成去噪和缺失值处理后,基于灰色系统修正法对数据库进行数据域修补。
灰色系统修正法能够通过鉴别系统因素之间发展趋势的相异程度,即通过关联分析来寻找系统变动的规律,从而生成有较强规律性的数据序列,病建立相应的微分方程模型来预测事物未来发展趋势的状况,并基于所预测到的数据发展趋势来实现数据域的修补。
在构建指标关系图谱后,还对指标关系图谱进行可视化展示,还对指标关系图谱内的各指标进行添加标注处理。
本实施例中具体采用neo4j与GraphXR工具进行指标关系图谱的可视化构建。
所述添加的标注包括指标说明、关联指标、指标的强影响因素以及指标与强影响因素间趋势变化图。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。

Claims (9)

1.一种基于知识图谱和FP增长算法的企业运营监测方法,其特征在于,包括以下步骤:
步骤一,获取电力行业企业指标,并依据用户、业务和财务筛选出若干个指标,并根据筛选出的指标进行指标关系图谱的构建;
步骤二,确定企业的业务经营指标,并调取业务经营指标的影响因素,并根据指标关系图谱计算影响因素与业务经营指标之间的联系,并通过FP增长算法获取强关联规则;
步骤三,确定公司运营监测的运营指标,并通过指标关系图谱确定运营指标与其对应的二级指标的指标关联程度,基于指标关联程度以及强关联规则确定运营指标的强关联指标,基于运营指标对应历史数据以及强关联指标对应数据对企业运营进行监测。
2.根据权利要求1所述的一种基于知识图谱和FP增长算法的企业运营监测方法,其特征在于,所述构建指标关系图谱的具体过程为:基于指标定义获取指标的基本信息,并基于全量指标构成实体集合,同时以步骤一中筛选出的若干个指标作为一级指标,并对一级指标进行三级分解,获取前三层指标,并调取企业运营的会计科目表,以会计科目表为基准指标,逐层分解形成后四层指标,完成指标关系图谱的指标分解后,基于分解后的指标进行实体对齐、本体构建和质量评估,并根据实体对齐和质量评估结果对构建指标关系图谱所需的知识库进行更新,再根据指标的基本信息以及实体集合进行推理规则的归纳,根据归纳的推理规则扩展知识库内的信息,完成知识库的更新和信息扩展后,基于知识库构建指标关系图谱。
3.根据权利要求2所述的一种基于知识图谱和FP增长算法的企业运营监测方法,其特征在于,基于分解后的指标进行实体对齐、本体构建和质量评估前,还对分解后的指标进行除重和消歧义处理。
4.根据权利要求2所述的一种基于知识图谱和FP增长算法的企业运营监测方法,其特征在于,基于分解后的指标进行实体对齐、本体构建和质量评估时,先以用户、业务和财务为基准构建三个本体,并采用自顶向下的构建方式定义本体的数据模式,完成本体构建,再根据构建的实体集合进行实体对齐,将实体加入构建的本体中,并基于指标覆盖面、指标层级深度以及指标与指标之间的关联强度进行质量评估。
5.根据权利要求1所述的一种基于知识图谱和FP增长算法的企业运营监测方法,其特征在于,所述通过FP增长算法获取强关联规则的具体过程为:基于公司业务经营的影响因素创建数据库,并选取数据库内的主体数据,并采用聚类算法对选取的数据进行离散化处理,通过FP增长算法对离散化处理的数据进行数据挖掘,获取数据库内频繁项集,并根据支持度和置信度从频繁集内筛选出强关联规则。
6.根据权利要求5所述的一种基于知识图谱和FP增长算法的企业运营监测方法,其特征在于,所述公司业务经营的影响因素包括月用电量、业扩储备户数、业扩报装完成户数、本月全口径单桩日均充电量和年累计售电量含趸量。
7.根据权利要求1所述的一种基于知识图谱和FP增长算法的企业运营监测方法,其特征在于,在基于公司业务经营的影响因素创建数据库后,还对数据库中的数据进行去噪和缺失值处理,并在完成去噪和缺失值处理后,基于灰色系统修正法对数据库进行数据域修补。
8.根据权利要求1所述的一种基于知识图谱和FP增长算法的企业运营监测方法,其特征在于,在构建指标关系图谱后,还对指标关系图谱进行可视化展示,还对指标关系图谱内的各指标进行添加标注处理。
9.根据权利要求8所述的一种基于知识图谱和FP增长算法的企业运营监测方法,其特征在于,所述添加的标注包括指标说明、关联指标、指标的强影响因素以及指标与强影响因素间趋势变化图。
CN202211447623.4A 2022-11-18 2022-11-18 一种基于知识图谱和fp增长算法的企业运营监测方法 Pending CN115689386A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211447623.4A CN115689386A (zh) 2022-11-18 2022-11-18 一种基于知识图谱和fp增长算法的企业运营监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211447623.4A CN115689386A (zh) 2022-11-18 2022-11-18 一种基于知识图谱和fp增长算法的企业运营监测方法

Publications (1)

Publication Number Publication Date
CN115689386A true CN115689386A (zh) 2023-02-03

Family

ID=85053716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211447623.4A Pending CN115689386A (zh) 2022-11-18 2022-11-18 一种基于知识图谱和fp增长算法的企业运营监测方法

Country Status (1)

Country Link
CN (1) CN115689386A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116151870A (zh) * 2023-04-20 2023-05-23 北京融信数联科技有限公司 一种基于认知图谱的企业经营分析预测方法、系统及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116151870A (zh) * 2023-04-20 2023-05-23 北京融信数联科技有限公司 一种基于认知图谱的企业经营分析预测方法、系统及介质

Similar Documents

Publication Publication Date Title
CN102708149A (zh) 数据质量管理方法和系统
CN113553540A (zh) 一种商品销量的预测方法
Pattanayak et al. Risk analysis of estimates for cost of quality in supply chain: a case study
Sahu et al. Green supply chain management assessment under chains of uncertain indices: an intellectual approach
Xu et al. Modeling and performance evaluation of PPP projects utilizing IFC extension and enhanced matter-element method
CN113487448A (zh) 一种基于电力大数据的电力信用标签化方法及系统
CN115689386A (zh) 一种基于知识图谱和fp增长算法的企业运营监测方法
Lukinskiy et al. A probabilistic approach to information management of order fulfilment reliability with the help of perfect-order analytics
Putri et al. Big data and strengthening msmes after the covid-19 pandemic (development studies on batik msmes in east java)
Lucko et al. Quantitative research: Preparation of incongruous economic data sets for archival data analysis
CN109583773A (zh) 一种纳税信用积分确定的方法、系统及相关装置
Seifbarghy Measurement of supply risk and determining supply strategy, case study: A refrigerator making company
Ding et al. LSTM Deep Neural Network Based Power Data Credit Tagging Technology.
Bhatti et al. Impact of intelligent inventory system on improvement of reverse logistics: A case of saudi manufacturing industry
Shikhli et al. Data Acquisition Model for Analyzing Schedule Delays Using KDD: Knowledge Discovery and Datamining
Bishop et al. Measuring the low carbon economy at the local level: A hybrid approach
CN107688902B (zh) 一种高新技术创业模式分析评价方法
Cheshmberah et al. An integrated framework (CTSR-BWG) for outsourcing decisions in a marine manufacturing firm
Ionescu et al. Implication and opportunities regarding the organization of quality cost management accounting
Greig et al. A data map of existing UK data sources related to regional trade
CN110689241A (zh) 一种基于大数据的电网实物资产评价系统
Botes et al. Evaluating the impact of operational reports
Islam et al. Big Data Analysis Driven Decision Making System Ensuring Energy Security of a Country
Li et al. LSTM Deep Neural Network Based Power Data Credit Tagging Technology
Dianawati et al. Analytic Hierarchy Process (AHP) and TOPSIS for designing green public procurement indicator on Trans-Java toll rest area

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination