CN115310752A - 面向能源大数据的数据资产价值评价方法及系统 - Google Patents

面向能源大数据的数据资产价值评价方法及系统 Download PDF

Info

Publication number
CN115310752A
CN115310752A CN202210701269.7A CN202210701269A CN115310752A CN 115310752 A CN115310752 A CN 115310752A CN 202210701269 A CN202210701269 A CN 202210701269A CN 115310752 A CN115310752 A CN 115310752A
Authority
CN
China
Prior art keywords
data
value
evaluation
asset
evaluation parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210701269.7A
Other languages
English (en)
Inventor
朱东歌
马瑞
刘佳
沙江波
闫振华
李晓龙
王峰
张庆平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Ningxia Electric Power Co Ltd
Electric Power Research Institute of State Grid Ningxia Electric Power Co Ltd
Original Assignee
Electric Power Research Institute of State Grid Ningxia Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of State Grid Ningxia Electric Power Co Ltd filed Critical Electric Power Research Institute of State Grid Ningxia Electric Power Co Ltd
Priority to CN202210701269.7A priority Critical patent/CN115310752A/zh
Publication of CN115310752A publication Critical patent/CN115310752A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供面向能源大数据的数据资产价值评价方法及系统,属于能源大数据领域。包括:构建采集模型和数据资产价值评价模型;通过所述采集模型统计出待评数据资产的评价参数,所述评价参数包括颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数;分别根据所述颗粒度评价参数、所述多维度评价参数、所述活性度评价参数、所述规模度评价参数和所述关联度评价参数计算出所述待评数据资产的颗粒度值、多维度值、活性度值、规模度值和关联度值;将所述颗粒度值、所述多维度值、所述活性度值、所述规模度值和所述关联度值输入至所述数据资产价值评价模型,计算出所述待评数据资产的资产价值。

Description

面向能源大数据的数据资产价值评价方法及系统
技术领域
本发明涉及能源大数据领域,尤其涉及一种面向能源大数据的数据资产价值评价方法及系统。
背景技术
数据资产是指由企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源,经过加工处理、挖掘与分析,可以有效地提高企业在生产经营活动的效率,降低成本,让企业在市场竞争中获得优势,获取更高的利润。当前数据资产价值评估一般采用成本法、收益法与市场法,对于大数据平台中的数据资产价值方面,行业内并无成熟的资产价值计算方法。
发明内容
有鉴于此,本发明提供一种面向能源大数据的数据资产价值评价方法及系统,通过量化数据评价参数、计算资产价值的方法。
本发明实施例解决其技术问题所采用的技术方案是:
一种面向能源大数据的数据资产价值评价方法,包括:
构建采集模型和数据资产价值评价模型;
通过所述采集模型统计出待评数据资产的评价参数,所述评价参数包括颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数;
分别根据所述颗粒度评价参数、所述多维度评价参数、所述活性度评价参数、所述规模度评价参数和所述关联度评价参数计算出所述待评数据资产的颗粒度值、多维度值、活性度值、规模度值和关联度值;
将所述颗粒度值、所述多维度值、所述活性度值、所述规模度值和所述关联度值输入至所述数据资产价值评价模型,计算出所述待评数据资产的资产价值。
较优地,所述构建采集模型包括:
定义所述颗粒度评价参数,包括:数据属性数量G1、数据精度G2、数据完整度G3、数据字段长度G4、字段完整程度G5;
定义所述多维度评价参数,包括:数据来源渠道种类D1、数据来源渠道总数D2、数据产生方式总数D3、数据来源类型总数D4、数据覆盖系统总数D5、数据重复率D6、数据一致率D7、所用数据采集方式总数D8,其中,所述数据重复率D6代表不同来源提供的相同资源的重复情况,所述数据一致率D7代表不同来源提供的相同资源相互校验的准确程度;
定义所述活性度评价参数,包括:更新间隔时间A1、访问间隔时间A2、存在时间A3、更新差异度A4、访问系统数量A5、常用属性数量占比A6、累积访问次数A7、累积更新次数A8,其中,所述更新差异度A4是指每次更新会造成直接变化的数据占比,所述访问系统数量A5是指使用当前数据资产的系统数目;
定义所述规模度评价参数,包括:数据条数S1、数据资产存储体积S2、数据资产增长速度S3、企业独占程度S4;
定义所述关联度评价参数,包括:流入数据数量R1、流出数据数量R2、数据流入频率R3、数据流出频率R4、数据流入总量R5、数据流出总量R6。
较优地,所述构建数据资产价值评价模型包括:
收集N个样本数据资产,分成训练集和测试集;
对所述训练集中各个所述样本数据资产进行数据预处理,得到预处理后的样本数据资产;
统计出所述训练集中各个所述处理后的样本数据资产的所述颗粒度评价参数,并计算出算数平均值G1X、G2X、G3X、G4X、G5X
统计出所述训练集中各个所述处理后的样本数据资产的所述多维度评价参数,并计算出算数平均值D1X、D2X、D3X、D4X、D5X、D6X、D7X、D8X
统计出所述训练集中各个所述处理后的样本数据资产的所述活性度评价参数,并计算出算数平均值A1X、A2X、A3X、A4X、A5X、A6X、A7X、A8X
统计出所述训练集中各个所述处理后的样本数据资产的所述规模度评价参数,并计算出算数平均值S1X、S2X、S3X、S4X
统计出所述训练集中各个所述处理后的样本数据资产的所述关联度评价参数,并计算出算数平均值R1X、R2X、R3X、R4X、R5X、R6X
定义所述数据资产价值评价模型的输入层,所述输入层的输入内容包括所述评价参数;
定义所述数据资产价值评价模型的隐含层,所述隐含层提供颗粒度G、多维度D、活性度A、规模度S和关联度R的计算公式:
Figure BDA0003703985750000031
ωG1G2G3G4G5=1
Figure BDA0003703985750000032
ωD1D2D3D4D5D6D7D8=1
Figure BDA0003703985750000033
ωA1A2A3A4A5A6A7A8=1
Figure BDA0003703985750000034
ωS1S2S3S4=1
Figure BDA0003703985750000041
ωR1R2R3R4R5R6=1
其中,ωGi为各所述颗粒度评价参数的计算权重,ωDi为各所述多维度评价参数的计算权重,ωAi为各所述活性度评价参数的计算权重,ωSi为各所述规模度评价参数的计算权重,ωRi为各所述关联度评价参数的计算权重;G、D、A、S、R的计算结果均属于[1,3]范围;
定义所述数据资产价值评价模型的输出层,所述输出层提供资产价值IVD的计算公式:
IVD=[(1+G)×(1+D)×(1+A)×(1+S)×(1+R)-1]×(1+M)
其中,M为高价值数据量占比;
利用所述数据资产价值评价模型计算所述验证集中的所述样本数据资产的资产价值IVD;
若所述验证集中的所述样本数据资产的资产价值IVD计算值无误,则所述数据资产价值评价模型构建完成;
若所述验证集中的所述样本数据资产的资产价值IVD计算值有误,则调整各权重值后,再次利用所述验证集进行验证,直至所述资产价值IVD计算值无误。
较优地,所述ωGi、所述ωDi、所述ωAi、所述ωSi、所述ωRi均通过AHP层次分析法进行权重值分配。
较优地,所述高价值数据量占比是指所述当前数据资产中具备高价值属性的数据总量占总数据量的比值,所述高价值属性是根据评价需求从所有属性中预先选择出的。
本发明还提供一种数据资产价值评价系统,包括:
构建单元,用于构建采集模型和数据资产价值评价模型;
统计单元,用于通过所述采集模型统计出待评数据资产的评价参数,所述评价参数包括颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数;
计算单元,用于分别根据所述颗粒度评价参数、所述多维度评价参数、所述活性度评价参数、所述规模度评价参数和所述关联度评价参数计算出所述待评数据资产的颗粒度值、多维度值、活性度值、规模度值和关联度值;
所述计算单元,还用于将所述颗粒度值、所述多维度值、所述活性度值、所述规模度值和所述关联度值输入至所述数据资产价值评价模型,计算出所述待评数据资产的资产价值。
较优地,所述构建单元,还用于定义所述采集模型中的所述颗粒度评价参数,包括:数据属性数量G1、数据精度G2、数据完整度G3、数据字段长度G4、字段完整程度G5;
所述构建单元,还用于定义所述采集模型中的所述多维度评价参数,包括:数据来源渠道种类D1、数据来源渠道总数D2、数据产生方式总数D3、数据来源类型总数D4、数据覆盖系统总数D5、数据重复率D6、数据一致率D7、所用数据采集方式总数D8,其中,所述数据重复率D6代表不同来源提供的相同资源的重复情况,所述数据一致率D7代表不同来源提供的相同资源相互校验的准确程度;
所述构建单元,还用于定义所述采集模型中的所述活性度评价参数,包括:更新间隔时间A1、访问间隔时间A2、存在时间A3、更新差异度A4、访问系统数量A5、常用属性数量占比A6、累积访问次数A7、累积更新次数A8,其中,所述更新差异度A4是指每次更新会造成直接变化的数据占比,所述访问系统数量A5是指使用当前数据资产的系统数目;
所述构建单元,还用于定义所述采集模型中的所述规模度评价参数,包括:数据条数S1、数据资产存储体积S2、数据资产增长速度S3、企业独占程度S6;
所述构建单元,还用于定义所述采集模型中的所述关联度评价参数,包括:流入数据数量R1、流出数据数量R2、数据流入频率R3、数据流出频率R4、数据流入总量R5、数据流出总量R6。
较优地,所述构建单元,还用于收集构建所述数据资产价值评价模型N个样本数据资产,分成训练集和测试集;对所述训练集中各个所述样本数据资产进行数据预处理,得到预处理后的样本数据资产;统计出所述训练集中各个所述处理后的样本数据资产的所述颗粒度评价参数,并计算出算数平均值G1X、G2X、G3X、G4X、G5X;统计出所述训练集中各个所述处理后的样本数据资产的所述多维度评价参数,并计算出算数平均值D1X、D2X、D3X、D4X、D5X、D6X、D7X、D8X;统计出所述训练集中各个所述处理后的样本数据资产的所述活性度评价参数,并计算出算数平均值A1X、A2X、A3X、A4X、A5X、A6X、A7X、A8X;统计出所述训练集中各个所述处理后的样本数据资产的所述规模度评价参数,并计算出算数平均值S1X、S2X、S3X、S4X;统计出所述训练集中各个所述处理后的样本数据资产的所述关联度评价参数,并计算出算数平均值R1X、R2X、R3X、R4X、R5X、R6X
所述构建单元,还用于定义所述数据资产价值评价模型的输入层,所述输入层的输入内容包括所述评价参数;
所述构建单元,还用于定义所述数据资产价值评价模型的隐含层,所述隐含层提供颗粒度G、多维度D、活性度A、规模度S和关联度R的计算公式:
Figure BDA0003703985750000071
ωG1G2G3G4G5=1
Figure BDA0003703985750000072
ωD1D2D3D4D5D6D7D8=1
Figure BDA0003703985750000073
ωA1A2A3A4A5A6A7A8=1
Figure BDA0003703985750000074
ωS1S2S3S4=1
Figure BDA0003703985750000075
ωR1R2R3R4R5R6=1
其中,ωGi为各所述颗粒度评价参数的计算权重,ωDi为各所述多维度评价参数的计算权重,ωAi为各所述活性度评价参数的计算权重,ωSi为各所述规模度评价参数的计算权重,ωRi为各所述关联度评价参数的计算权重;G、D、A、S、R的计算结果均属于[1,3]范围;
所述构建单元,还用于定义所述数据资产价值评价模型的输出层,所述输出层提供资产价值IVD的计算公式:
IVD=[(1+G)×(1+D)×(1+A)×(1+S)×(1+R)-1]×(1+M)
其中,M为高价值数据量占比;
所述构建单元,还用于利用所述数据资产价值评价模型计算所述验证集中的所述样本数据资产的资产价值IVD;若所述验证集中的所述样本数据资产的资产价值IVD计算值无误,则所述数据资产价值评价模型构建完成;若所述验证集中的所述样本数据资产的资产价值IVD计算值有误,则调整各权重值后,再次利用所述验证集进行验证,直至所述资产价值IVD计算值无误。
较优地,所述ωGi、所述ωDi、所述ωAi、所述ωSi、所述ωRi均通过AHP层次分析法进行权重值分配。
较优地,所述高价值数据量占比是指所述当前数据资产中具备高价值属性的数据总量占总数据量的比值,所述高价值属性是根据评价需求从所有属性中预先选择出的。
由上述技术方案可知,本发明实施例提供的面向能源大数据的数据资产价值评价方法,通过构建采集模型和数据资产价值评价模型;通过该采集模型统计出待评数据资产的评价参数,评价参数包括颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数;分别根据颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数计算出待评数据资产的颗粒度值、多维度值、活性度值、规模度值和关联度值;将颗粒度值、多维度值、活性度值、规模度值和关联度值输入至数据资产价值评价模型,计算出待评数据资产的资产价值。本发明能够将数据资产量化成评价参数、从而计算出资产价值。
附图说明
图1为面向能源大数据的数据资产价值评价方法的流程图。
具体实施方式
以下结合本发明的附图,对本发明的技术方案以及技术效果做进一步的详细阐述。
为了综合考虑数据资产的特征与数据资产价值的影响因素,本发明提出使用颗粒度、多维度、活性度、规模度和关联度五个特征维度来衡量数据资产的价值。
其中,颗粒度是指数据资产价值对数据质量、共享性的反应程度,多维度是指数据资产价值对数据类型多样性和可访问性的反应程度,活性度是指数据资产价值对活性、再生性和使用效果的反应程度,规模度是指数据资产价值对数据规模和价值密度的反应程度,关联度是指数据资产价值对关联性的反应程度。这五个特征维度可以较全面的衡量数据资产的内在价值。
如图1所示,本发明提供一种面向能源大数据的数据资产价值评价方法,步骤包括:
步骤S1,构建采集模型和数据资产价值评价模型;
步骤S2,通过采集模型统计出待评数据资产的评价参数,评价参数包括颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数;
步骤S3,分别根据颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数计算出待评数据资产的颗粒度值、多维度值、活性度值、规模度值和关联度值;
步骤S4,将颗粒度值、多维度值、活性度值、规模度值和关联度值输入至数据资产价值评价模型,计算出待评数据资产的资产价值。
较优地,构建采集模型包括定义颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数,其中:
颗粒度主要反映数据的数据质量和共享性,通过数据的精细化程度来具体体现。颗粒度程度较低的数据,数据的精细化程度越低,内在价值相对偏低;颗粒度程度较高的数据,数据的精细度程度也较高,内在价值相对更高。数据的精细化程度通过细分维度来描述,颗粒度可以分为数量、类型、精度、准确度、长度、完整度等多个细分维度。定义颗粒度评价参数包括:数据属性数量G1、数据精度G2、数据完整度G3、数据字段长度G4、字段完整程度G5,其中,数据属性数量G1反应该项数据资产拥有的数据属性的数量,数据完整度G3是指完整数据量的占比,数据字段长度G4是指最大字段长度、字段完整程度G5是指完整字段量的占比;
类似空间维度的概念,多维度指标反映数据的多样化程度和可访问性,包括数据来源、数据类型的多样化等,多维度也需要进一步细分。定义多维度评价参数,包括:数据来源渠道种类D1、数据来源渠道总数D2、数据产生方式总数D3、数据来源类型总数D4、数据覆盖系统总数D5、数据重复率D6、数据一致率D7、所用数据采集方式总数D8,其中,数据来源渠道种类D1是指所涉及的所有来源渠道的种类数目,数据来源渠道总数D2是指所有的渠道总数,数据重复率D6代表不同来源提供的相同资源的重复情况,数据一致率D7代表不同来源提供的相同资源相互校验的准确程度,所用数据采集方式总数D8是指该项数据资产的采集手段数目;
活性度指标反映数据的新鲜程度、再生性、使用效果,数据被更新的频次越高,活性度越高;数据被更新的频次越低,活性度越低。一般而言,数据活性度高的数据集,蕴含更高的内在价值。定义活性度评价参数,包括:更新间隔时间A1、访问间隔时间A2、存在时间A3、更新差异度A4、访问系统数量A5、常用属性数量占比A6、累积访问次数A7、累积更新次数A8,其中,更新差异度A4是指每次更新会造成直接变化的数据占比,访问系统数量A5是指使用当前数据资产的系统数目,常用属性数量占比A6是首先提取出具有访问或更新时间间隔小于时间间隔阈值的数据所对应的属性,再计算具有该属性的数据总数占总数据量的占比;
规模度指标反映数据量的多少,量变决定质变,数据量的增长,即是数据规模的扩大。定义规模度评价参数,包括:数据条数S1、数据资产存储体积S2、数据资产增长速度S3、企业独占程度S4;其中,企业独占程度S4是指该数据资产所属企业的数目情况,具体可以是企业数目的反比,规模度评价参数还可以进一步包括反应该项数据资产的应用使用范围S4和该项数据资产获取的难易程度S5,并在后续计算时配置响应的权重。
关联度指标反映不同维度的数据之间的内在联系,如在企业中,如果能将人力资源部、财务管理部、项目管理部及其他业务部门的数据进行关联聚合分析,将激发出这些数据更大的内在价值。定义关联度评价参数,包括:流入数据数量R1、流出数据数量R2、数据流入频率R3、数据流出频率R4、数据流入总量R5、数据流出总量R6。关联度评价参数还可以进一步包括流入数据关联强度R7、流出数据关联强度R8、数据依赖程度R9、数据独立程度R10,流入数据关联强度R7反应该项数据资产流入数据的关联强度,流出数据关联强度R8反应该项数据资产流出数据的关联强度,数据依赖程度R9反应该项数据资产对于其他数据资产的依赖程度,数据独立程度R10反应该项数据资产自身的独立存在程度,R7-R10可以通过专家打分的形式获取。
较优地,步骤S1构建数据资产价值评价模型包括:
步骤S11,收集N个样本数据资产,分成训练集和测试集;收集样本数据先要针对不同的特征维度确定不同的数据输入维度,宏观层面数据包括全省宏观经济运行、发展规划、产业政策、体制改革、市场发展趋势等方面数据,以及世界主要国家和地区、全国、先进省份等经济社会、能源发展等数据。能源行业数据包括电、煤、油、气、新能源等各能源品类的资源禀赋、开采加工、运输配送、能源转化、能源消费全过程数据。其他相关数据包括生态环境、气象、交通、技术革新、工业价格等数据。样本数据是深度学习模型构建的基础,每个样本包含模型训练所需的数据。在收集样本时,为满足模型对于关联度、多维度的评价,仅收集待评价的数据是不够的,还应尽可能多的收集与之相关的数据。
步骤S12,对训练集中各个样本数据资产进行数据预处理,得到预处理后的样本数据资产;数据预处理任务其任务是执行数据抽取、数据转换和数据加载三个过程。数据抽取,即将所需数据样本从原始系统或存储介质中抽取出来的过程;数据转换,即将数据抽取过程中提取到的数据转换为后续深度学习模型训练所需数据类型的过程;数据加载,即将经过数据转换过程的数据根据模型训练需求加载到模型中的过程。选择样本后,对样本中重复、无效或不完整的数据,进行清洗;对于错误或不一致的数据,要加以修正,保障模型训练时所用数据准确和有效。与此同时,结构化的数据要根据相关业务逻辑进行转化;非结构化的数据,要对其进行结构化处理。
步骤S13,统计出训练集中各个处理后的样本数据资产的颗粒度评价参数,并计算出算数平均值G1X、G2X、G3X、G4X、G5X
步骤S14,统计出训练集中各个处理后的样本数据资产的多维度评价参数,并计算出算数平均值D1X、D2X、D3X、D4X、D5X、D6X、D7X、D8X
步骤S15,统计出训练集中各个处理后的样本数据资产的活性度评价参数,并计算出算数平均值A1X、A2X、A3X、A4X、A5X、A6X、A7X、A8X
步骤S16,统计出训练集中各个处理后的样本数据资产的规模度评价参数,并计算出算数平均值S1X、S2X、S3X、S4X
步骤S17,统计出训练集中各个处理后的样本数据资产的关联度评价参数,并计算出算数平均值R1X、R2X、R3X、R4X、R5X、R6X
步骤S18,定义数据资产价值评价模型的输入层,输入层的输入内容包括评价参数;
步骤S19,定义数据资产价值评价模型的隐含层,隐含层提供颗粒度G、多维度D、活性度A、规模度S和关联度R的计算公式:
Figure BDA0003703985750000131
ωG1G2G3G4G5=1 (2)
Figure BDA0003703985750000132
ωD1D2D3D4D5D6D7D8=1 (4)
Figure BDA0003703985750000133
ωA1A2A3A4A5A6A7A8=1 (6)
Figure BDA0003703985750000134
ωS1S2S3S4=1 (8)
Figure BDA0003703985750000135
ωR1R2R3R4R5R6=1 (10)
其中,ωGi为各颗粒度评价参数的计算权重,ωDi为各多维度评价参数的计算权重,ωAi为各活性度评价参数的计算权重,ωSi为各规模度评价参数的计算权重,ωRi为各关联度评价参数的计算权重;G、D、A、S、R的计算结果均属于[1,3]范围,ωGi、ωDi、ωAi、ωSi、ωRi均通过AHP层次分析法进行权重值分配。
首先进行权重初始化,权重初始化是对每一隐藏层的权重进行初始化,该权重在训练开始前不得为空,不同的权重决定模型训练的起点。目前根据实际情况进行权重初始化方法的选择。设定各级权重之和ω为1。如在颗粒度G的计算时设定ωG1=0.2,ωG2=0.2,ωG3=0.2,ωG4=0.2,ωG5=0.2。可根据专家打分适当确定权重。
其次,确定权重正则化,权重正则化为了防止模型过拟合现象的发生,减少模型的泛化误差,从而提高模型准确性。
再次,模型训练优化,模型优化的目标之一是使模型的输出尽可能的接近目标值。这个目标可以通过比较当前模型的预测值和实际目标值,再根据两者的差异情况来更新每一层的权重矩阵来实现,比如,如果模型的预测值高了,就调整权重让它的预测值低一些。不断调整,直到能够预测出目标值,作为数据资产价值评价模型的各个公式中的最终权重值。
步骤S110,定义数据资产价值评价模型的输出层,输出层提供资产价值IVD的计算公式:
IVD=[(1+G)×(1+D)×(1+A)×(1+S)×(1+R)-1]×(1+M) (11)
其中,M为高价值数据量占比,是指当前数据资产中具备高价值属性的数据总量占总数据量的比值,高价值属性是根据评价需求从所有属性中预先选择出的;
步骤S111,利用数据资产价值评价模型计算验证集中的样本数据资产的资产价值IVD;
步骤S112,若验证集中的样本数据资产的资产价值IVD计算值无误,则数据资产价值评价模型构建完成;若验证集中的样本数据资产的资产价值IVD计算值有误,则调整各权重值后,再次利用验证集进行验证,直至资产价值IVD计算值无误。
进一步地,本发明还提供一种数据资产价值评价系统,包括:
构建单元,用于构建采集模型和数据资产价值评价模型;
统计单元,用于通过采集模型统计出待评数据资产的评价参数,评价参数包括颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数;
计算单元,用于分别根据颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数计算出待评数据资产的颗粒度值、多维度值、活性度值、规模度值和关联度值;
计算单元,还用于将颗粒度值、多维度值、活性度值、规模度值和关联度值输入至数据资产价值评价模型,计算出待评数据资产的资产价值。
构建单元,还用于定义采集模型中的颗粒度评价参数,具体包括:数据属性数量G1、数据精度G2、数据完整度G3、数据字段长度G4、字段完整程度G5;
构建单元,还用于定义采集模型中的多维度评价参数,包括:数据来源渠道种类D1、数据来源渠道总数D2、数据产生方式总数D3、数据来源类型总数D4、数据覆盖系统总数D5、数据重复率D6、数据一致率D7、所用数据采集方式总数D8,其中,数据重复率D6代表不同来源提供的相同资源的重复情况,数据一致率D7代表不同来源提供的相同资源相互校验的准确程度;
构建单元,还用于定义采集模型中的活性度评价参数,包括:更新间隔时间A1、访问间隔时间A2、存在时间A3、更新差异度A4、访问系统数量A5、常用属性数量占比A6、累积访问次数A7、累积更新次数A8,其中,更新差异度A4是指每次更新会造成直接变化的数据占比,访问系统数量A5是指使用当前数据资产的系统数目;
构建单元,还用于定义采集模型中的规模度评价参数,包括:数据条数S1、数据资产存储体积S2、数据资产增长速度S3、企业独占程度S6;
构建单元,还用于定义采集模型中的关联度评价参数,包括:流入数据数量R1、流出数据数量R2、数据流入频率R3、数据流出频率R4、数据流入总量R5、数据流出总量R6。
构建单元,还用于收集构建数据资产价值评价模型N个样本数据资产,分成训练集和测试集;对训练集中各个样本数据资产进行数据预处理,得到预处理后的样本数据资产;统计出训练集中各个处理后的样本数据资产的颗粒度评价参数,并计算出算数平均值G1X、G2X、G3X、G4X、G5X;统计出训练集中各个处理后的样本数据资产的多维度评价参数,并计算出算数平均值D1X、D2X、D3X、D4X、D5X、D6X、D7X、D8X;统计出训练集中各个处理后的样本数据资产的活性度评价参数,并计算出算数平均值A1X、A2X、A3X、A4X、A5X、A6X、A7X、A8X;统计出训练集中各个处理后的样本数据资产的规模度评价参数,并计算出算数平均值S1X、S2X、S3X、S4X;统计出训练集中各个处理后的样本数据资产的关联度评价参数,并计算出算数平均值R1X、R2X、R3X、R4X、R5X、R6X
构建单元,还用于定义数据资产价值评价模型的输入层,输入层的输入内容包括评价参数;
构建单元,还用于定义数据资产价值评价模型的隐含层,隐含层提供颗粒度G、多维度D、活性度A、规模度S和关联度R的计算公式(1)-(10):
构建单元,还用于定义数据资产价值评价模型的输出层,输出层提供资产价值IVD的计算公式(10):
构建单元,还用于利用数据资产价值评价模型计算验证集中的样本数据资产的资产价值IVD;若验证集中的样本数据资产的资产价值IVD计算值无误,则数据资产价值评价模型构建完成;若验证集中的样本数据资产的资产价值IVD计算值有误,则调整各权重值后,再次利用验证集进行验证,直至资产价值IVD计算值无误。
通过本发明提供的方法和系统,实现了量化数据资产的评价参数过程,可有效地计算数据资产的资产价值。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (10)

1.一种面向能源大数据的数据资产价值评价方法,其特征在于,包括:
构建采集模型和数据资产价值评价模型;
通过所述采集模型统计出待评数据资产的评价参数,所述评价参数包括颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数;
分别根据所述颗粒度评价参数、所述多维度评价参数、所述活性度评价参数、所述规模度评价参数和所述关联度评价参数计算出所述待评数据资产的颗粒度值、多维度值、活性度值、规模度值和关联度值;
将所述颗粒度值、所述多维度值、所述活性度值、所述规模度值和所述关联度值输入至所述数据资产价值评价模型,计算出所述待评数据资产的资产价值。
2.如权利要求1所述的面向能源大数据的数据资产价值评价方法,其特征在于,所述构建采集模型包括:
定义所述颗粒度评价参数,包括:数据属性数量G1、数据精度G2、数据完整度G3、数据字段长度G4、字段完整程度G5;
定义所述多维度评价参数,包括:数据来源渠道种类D1、数据来源渠道总数D2、数据产生方式总数D3、数据来源类型总数D4、数据覆盖系统总数D5、数据重复率D6、数据一致率D7、所用数据采集方式总数D8,其中,所述数据重复率D6代表不同来源提供的相同资源的重复情况,所述数据一致率D7代表不同来源提供的相同资源相互校验的准确程度;
定义所述活性度评价参数,包括:更新间隔时间A1、访问间隔时间A2、存在时间A3、更新差异度A4、访问系统数量A5、常用属性数量占比A6、累积访问次数A7、累积更新次数A8,其中,所述更新差异度A4是指每次更新会造成直接变化的数据占比,所述访问系统数量A5是指使用当前数据资产的系统数目;定义所述规模度评价参数,包括:数据条数S1、数据资产存储体积S2、数据资产增长速度S3、企业独占程度S4;
定义所述关联度评价参数,包括:流入数据数量R1、流出数据数量R2、数据流入频率R3、数据流出频率R4、数据流入总量R5、数据流出总量R6。
3.如权利要求2所述的面向能源大数据的数据资产价值评价方法,其特征在于,所述构建数据资产价值评价模型包括:
收集N个样本数据资产,分成训练集和测试集;
对所述训练集中各个所述样本数据资产进行数据预处理,得到预处理后的样本数据资产;
统计出所述训练集中各个所述处理后的样本数据资产的所述颗粒度评价参数,并计算出算数平均值G1X、G2X、G3X、G4X、G5X
统计出所述训练集中各个所述处理后的样本数据资产的所述多维度评价参数,并计算出算数平均值D1X、D2X、D3X、D4X、D5X、D6X、D7X、D8X
统计出所述训练集中各个所述处理后的样本数据资产的所述活性度评价参数,并计算出算数平均值A1X、A2X、A3X、A4X、A5X、A6X、A7X、A8X
统计出所述训练集中各个所述处理后的样本数据资产的所述规模度评价参数,并计算出算数平均值S1X、S2X、S3X、S4X
统计出所述训练集中各个所述处理后的样本数据资产的所述关联度评价参数,并计算出算数平均值R1X、R2X、R3X、R4X、R5X、R6X
定义所述数据资产价值评价模型的输入层,所述输入层的输入内容包括所述评价参数;
定义所述数据资产价值评价模型的隐含层,所述隐含层提供颗粒度G、多维度D、活性度A、规模度S和关联度R的计算公式:
Figure FDA0003703985740000031
ωG1G2G3G4G5=1
Figure FDA0003703985740000032
ωD1D2D3D4D5+ωD6+ωD7D8=1
Figure FDA0003703985740000033
ωA1A2A3A4A5A6A7A8=1
Figure FDA0003703985740000034
ωS1S2S3S4=1
Figure FDA0003703985740000035
ωR1R2R3R4R5R6=1
其中,ωGi为各所述颗粒度评价参数的计算权重,ωDi为各所述多维度评价参数的计算权重,ωAi为各所述活性度评价参数的计算权重,ωSi为各所述规模度评价参数的计算权重,ωRi为各所述关联度评价参数的计算权重;G、D、A、S、R的计算结果均属于[1,3]范围;
定义所述数据资产价值评价模型的输出层,所述输出层提供资产价值IVD的计算公式:
IVD=[(1+G)×(1+D)×(1+A)×(1+S)×(1+R)-1]×(1+M)
其中,M为高价值数据量占比;
利用所述数据资产价值评价模型计算所述验证集中的所述样本数据资产的资产价值IVD;
若所述验证集中的所述样本数据资产的资产价值IVD计算值无误,则所述数据资产价值评价模型构建完成;
若所述验证集中的所述样本数据资产的资产价值IVD计算值有误,则调整各权重值后,再次利用所述验证集进行验证,直至所述资产价值IVD计算值无误。
4.如权利要求3所述的面向能源大数据的数据资产价值评价方法,其特征在于:所述ωGi、所述ωDi、所述ωAi、所述ωSi、所述ωRi均通过AHP层次分析法进行权重值分配。
5.如权利要求4所述的面向能源大数据的数据资产价值评价方法,其特征在于,所述高价值数据量占比是指所述当前数据资产中具备高价值属性的数据总量占总数据量的比值,所述高价值属性是根据评价需求从所有属性中预先选择出的。
6.一种数据资产价值评价系统,其特征在于,包括:
构建单元,用于构建采集模型和数据资产价值评价模型;
统计单元,用于通过所述采集模型统计出待评数据资产的评价参数,所述评价参数包括颗粒度评价参数、多维度评价参数、活性度评价参数、规模度评价参数和关联度评价参数;
计算单元,用于分别根据所述颗粒度评价参数、所述多维度评价参数、所述活性度评价参数、所述规模度评价参数和所述关联度评价参数计算出所述待评数据资产的颗粒度值、多维度值、活性度值、规模度值和关联度值;
所述计算单元,还用于将所述颗粒度值、所述多维度值、所述活性度值、所述规模度值和所述关联度值输入至所述数据资产价值评价模型,计算出所述待评数据资产的资产价值。
7.如权利要求6所述的数据资产价值评价系统,其特征在于,
所述构建单元,还用于定义所述采集模型中的所述颗粒度评价参数,包括:数据属性数量G1、数据精度G2、数据完整度G3、数据字段长度G4、字段完整程度G5;
所述构建单元,还用于定义所述采集模型中的所述多维度评价参数,包括:数据来源渠道种类D1、数据来源渠道总数D2、数据产生方式总数D3、数据来源类型总数D4、数据覆盖系统总数D5、数据重复率D6、数据一致率D7、所用数据采集方式总数D8,其中,所述数据重复率D6代表不同来源提供的相同资源的重复情况,所述数据一致率D7代表不同来源提供的相同资源相互校验的准确程度;
所述构建单元,还用于定义所述采集模型中的所述活性度评价参数,包括:更新间隔时间A1、访问间隔时间A2、存在时间A3、更新差异度A4、访问系统数量A5、常用属性数量占比A6、累积访问次数A7、累积更新次数A8,其中,所述更新差异度A4是指每次更新会造成直接变化的数据占比,所述访问系统数量A5是指使用当前数据资产的系统数目;
所述构建单元,还用于定义所述采集模型中的所述规模度评价参数,包括:数据条数S1、数据资产存储体积S2、数据资产增长速度S3、企业独占程度S4;所述构建单元,还用于定义所述采集模型中的所述关联度评价参数,包括:流入数据数量R1、流出数据数量R2、数据流入频率R3、数据流出频率R4、数据流入总量R5、数据流出总量R6。
8.如权利要求7所述的数据资产价值评价系统,其特征在于,
所述构建单元,还用于收集构建所述数据资产价值评价模型N个样本数据资产,分成训练集和测试集;对所述训练集中各个所述样本数据资产进行数据预处理,得到预处理后的样本数据资产;统计出所述训练集中各个所述处理后的样本数据资产的所述颗粒度评价参数,并计算出算数平均值G1X、G2X、G3X、G4X、G5X;统计出所述训练集中各个所述处理后的样本数据资产的所述多维度评价参数,并计算出算数平均值D1X、D2X、D3X、D4X、D5X、D6X、D7X、D8X;统计出所述训练集中各个所述处理后的样本数据资产的所述活性度评价参数,并计算出算数平均值A1X、A2X、A3X、A4X、A5X、A6X、A7X、A8X;统计出所述训练集中各个所述处理后的样本数据资产的所述规模度评价参数,并计算出算数平均值S1X、S2X、S3X、S4X;统计出所述训练集中各个所述处理后的样本数据资产的所述关联度评价参数,并计算出算数平均值R1X、R2X、R3X、R4X、R5X、R6X
所述构建单元,还用于定义所述数据资产价值评价模型的输入层,所述输入层的输入内容包括所述评价参数;
所述构建单元,还用于定义所述数据资产价值评价模型的隐含层,所述隐含层提供颗粒度G、多维度D、活性度A、规模度S和关联度R的计算公式:
Figure FDA0003703985740000061
ωG1G2G3G4G5=1
Figure FDA0003703985740000062
ωD1D2D3D4D5D6D7D8=1
Figure FDA0003703985740000063
ωA1A2A3A4A5A6A7A8=1
Figure FDA0003703985740000064
ωS1S2S3S4=1
Figure FDA0003703985740000065
ωR1R2R3R4R5R6=1
其中,ωGi为各所述颗粒度评价参数的计算权重,ωDi为各所述多维度评价参数的计算权重,ωAi为各所述活性度评价参数的计算权重,ωSi为各所述规模度评价参数的计算权重,ωRi为各所述关联度评价参数的计算权重;G、D、A、S、R的计算结果均属于[1,3]范围;
所述构建单元,还用于定义所述数据资产价值评价模型的输出层,所述输出层提供资产价值IVD的计算公式:
IVD=[(1+G)×(1+D)×(1+A)×(1+S)×(1+R)-1]×(1+M)
其中,M为高价值数据量占比;
所述构建单元,还用于利用所述数据资产价值评价模型计算所述验证集中的所述样本数据资产的资产价值IVD;若所述验证集中的所述样本数据资产的资产价值IVD计算值无误,则所述数据资产价值评价模型构建完成;若所述验证集中的所述样本数据资产的资产价值IVD计算值有误,则调整各权重值后,再次利用所述验证集进行验证,直至所述资产价值IVD计算值无误。
9.如权利要求8所述的数据资产价值评价系统,其特征在于:
所述ωGi、所述ωDi、所述ωAi、所述ωSi、所述ωRi均通过AHP层次分析法进行权重值分配。
10.如权利要求9所述的数据资产价值评价系统,其特征在于,
所述高价值数据量占比是指所述当前数据资产中具备高价值属性的数据总量占总数据量的比值,所述高价值属性是根据评价需求从所有属性中预先选择出的。
CN202210701269.7A 2022-06-20 2022-06-20 面向能源大数据的数据资产价值评价方法及系统 Pending CN115310752A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210701269.7A CN115310752A (zh) 2022-06-20 2022-06-20 面向能源大数据的数据资产价值评价方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210701269.7A CN115310752A (zh) 2022-06-20 2022-06-20 面向能源大数据的数据资产价值评价方法及系统

Publications (1)

Publication Number Publication Date
CN115310752A true CN115310752A (zh) 2022-11-08

Family

ID=83854547

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210701269.7A Pending CN115310752A (zh) 2022-06-20 2022-06-20 面向能源大数据的数据资产价值评价方法及系统

Country Status (1)

Country Link
CN (1) CN115310752A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116257563A (zh) * 2022-11-30 2023-06-13 荣耀终端有限公司 一种数据价值评估方法及电子设备
CN116257692A (zh) * 2023-05-15 2023-06-13 鹏城实验室 一种基于云边协同的资产共享及推荐方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116257563A (zh) * 2022-11-30 2023-06-13 荣耀终端有限公司 一种数据价值评估方法及电子设备
CN116257563B (zh) * 2022-11-30 2023-11-21 荣耀终端有限公司 一种数据价值评估方法及电子设备
CN116257692A (zh) * 2023-05-15 2023-06-13 鹏城实验室 一种基于云边协同的资产共享及推荐方法及系统
CN116257692B (zh) * 2023-05-15 2023-08-18 鹏城实验室 一种基于云边协同的资产共享及推荐方法及系统

Similar Documents

Publication Publication Date Title
Ma et al. Study on a prediction of P2P network loan default based on the machine learning LightGBM and XGboost algorithms according to different high dimensional data cleaning
CN106600455A (zh) 一种基于逻辑回归的电费敏感度评估方法
CN115310752A (zh) 面向能源大数据的数据资产价值评价方法及系统
CN112561598A (zh) 基于客户画像的客户流失预测及挽回方法和系统
CN107766929A (zh) 模型分析方法及装置
CN108846691A (zh) 区域性粮油市场价格监测分析预测系统及监测方法
CN112668822B (zh) 科技成果转化平台共享系统、方法、存储介质、手机app
Chen et al. Development strategy, resource misallocation and economic performance
CN107609771A (zh) 一种供应商价值评价方法
CN110751355A (zh) 一种科技成果评估方法和装置
CN109948913A (zh) 一种基于双层的xgboost算法的多源特征电力用户综合画像系统
CN108154311A (zh) 基于随机森林和决策树的优质客户识别方法及装置
Xu et al. Novel key indicators selection method of financial fraud prediction model based on machine learning hybrid mode
CN115145993A (zh) 基于自学习规则运算的铁路货运大数据可视化展示平台
CN116468536A (zh) 一种自动化风险控制规则生成的方法
CN116934160A (zh) 一种数据要素资产价值评估方法及系统
Zheng et al. [Retracted] Using an Optimized Learning Vector Quantization‐(LVQ‐) Based Neural Network in Accounting Fraud Recognition
CN113450004A (zh) 电力信用报告生成方法、装置、电子设备及可读存储介质
Wang et al. Stacking based LightGBM-CatBoost-RandomForest algorithm and its application in big data modeling
CN116739753A (zh) 一种银行零售业务数字孪生构建方法
Jiang et al. Applying grey relational analysis to find interactions between manufacturing and logistics industries in Taiwan
Hai Data mining of enterprise financial management based on AHP
CN114971711A (zh) 业务数据处理方法、装置、设备及存储介质
Yang et al. Automatic Feature Engineering‐Based Optimization Method for Car Loan Fraud Detection
CN114154682A (zh) 一种客户贷款收益率等级预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230421

Address after: 750002, No. 716, the Yellow River East Road, Jinfeng District, the Ningxia Hui Autonomous Region, Yinchuan

Applicant after: ELECTRIC POWER RESEARCH INSTITUTE OF STATE GRID NINGXIA ELECTRIC POWER Co.,Ltd.

Applicant after: STATE GRID NINGXIA ELECTRIC POWER Co.,Ltd.

Address before: 750002, No. 716, the Yellow River East Road, Jinfeng District, the Ningxia Hui Autonomous Region, Yinchuan

Applicant before: ELECTRIC POWER RESEARCH INSTITUTE OF STATE GRID NINGXIA ELECTRIC POWER Co.,Ltd.

TA01 Transfer of patent application right