CN114638468A - 一种对数据价值进行评估的方法 - Google Patents

一种对数据价值进行评估的方法 Download PDF

Info

Publication number
CN114638468A
CN114638468A CN202210120542.7A CN202210120542A CN114638468A CN 114638468 A CN114638468 A CN 114638468A CN 202210120542 A CN202210120542 A CN 202210120542A CN 114638468 A CN114638468 A CN 114638468A
Authority
CN
China
Prior art keywords
data
data element
value
quality
evaluated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210120542.7A
Other languages
English (en)
Inventor
陆志鹏
王希勤
朱立锋
郑曦
周崇毅
国丽
刘国栋
赵健
温彦龙
李勇
乔亲旺
胡成盛
胡俊
谢冬水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHINA ELECTRONIC INFORMATION INDUSTRY GROUP Co
Original Assignee
CHINA ELECTRONIC INFORMATION INDUSTRY GROUP Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHINA ELECTRONIC INFORMATION INDUSTRY GROUP Co filed Critical CHINA ELECTRONIC INFORMATION INDUSTRY GROUP Co
Priority to CN202210120542.7A priority Critical patent/CN114638468A/zh
Publication of CN114638468A publication Critical patent/CN114638468A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/52Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems during program execution, e.g. stack integrity ; Preventing unwanted data erasure; Buffer overflow
    • G06F21/53Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems during program execution, e.g. stack integrity ; Preventing unwanted data erasure; Buffer overflow by executing in a restricted environment, e.g. sandbox or secure virtual machine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种对数据价值进行评估的方法,本发明通过将原始数据资源设定为统一形式的数据元件,然后基于数据元件体量、数据元件质量和信息密度来通过香农信息理论建立价值评估模型,也即本发明是以数据元件这种中间件的形式,本着数据的数据量和数据特征来计算数据价值,从而实现对数据价值准确评估,并能有效提高了数据的安全隐私性,进而大大提升了用户体验。

Description

一种对数据价值进行评估的方法
技术领域
本发明涉及计算机技术领域,特别是涉及一种对数据价值进行评估的方法。
背景技术
数据资产是指由个人或企业拥有或者控制的,能够带来经济利益的,以物理或电子的方式记录的数据资源。现阶段数据资产的价值评估没有统一的科学合理的方法,数据交易市场都是基于经验进行定价,从而导致数据价值难以科学评估,而数据定价差异较大,无法保障交易双方的权益,数据资产化的途径受阻,进而制约了企业对数据的有效利用,限制了数据作为资本参与经济循环,阻碍了数据价值释放,无法有效支撑经济高质量发展。
发明内容
本发明提供了一种对数据价值进行评估的方法,以解决现有技术中不能准确对数据价值进行评估的问题。
第一方面,本发明提供了一种对数据价值进行评估的方法,该方法包括:对待评估的数据进行预处理得到数据元件,所述数据元件为具有预设功能的数据集或者为具有预设数据特征的数据集;根据香农信息理论计算方法,基于数据元件体量、数据元件质量和信息密度建立价值评估模型
Figure 234164DEST_PATH_IMAGE001
,通过所述价值评估模型来对数据元件的价值进行评估;其中,所述数据元件体量
Figure DEST_PATH_2
,N为数据元件生产使用的数据体量,C是与数据元件大小相关的标准常量;所述数据元件质量
Figure 859235DEST_PATH_IMAGE003
,其中,Z为数据元件质量评估指标矩阵,β为数据元件质量评估指标权重系数;所述信息密度
Figure 565023DEST_PATH_IMAGE004
为对信息量
Figure 41134DEST_PATH_IMAGE005
的拟合值,信息量
Figure 350149DEST_PATH_IMAGE006
Figure 491281DEST_PATH_IMAGE005
为根据香农信息理论计算数据元件X得到的,yi为数据元件的特征,n为数据元件的特征个数
Figure 802308DEST_PATH_IMAGE007
为数据元件X中特征的值的概率。
可选地,所述对待评估的数据进行预处理得到数据元件,包括:通过预设的数据元件模型来对待评估的数据进行预处理,以消除待评估的数据中的隐私安全风险,并将该待评估的数据转化为统一标准化的数据元件,使得数据在流通过程中能够以数据元件形式交易流转。
可选地,所述数据元件的组态字段数在预设组态字段阈值内,和/或,所述数据元件的模态特征字段个数在预设模态特征字段阈值内。
可选地,所述数据元件质量评估指标矩阵Z包括多级数据资源质量评估指标,且每一级的数据资源质量评估指标下还包括多个不同的数据资源质量评估指标,每一个数据资源质量评估指标均设有对应的指标权重系数,通过对各个数据资源质量评估指标及其对应的指标权重系数进行计算得到数据元件质量。
可选地,所述通过对各个数据资源质量评估指标及其对应的指标权重系数进行计算得到数据元件质量,包括:
Figure 839534DEST_PATH_IMAGE008
其中,
Figure 695232DEST_PATH_IMAGE009
为数据元件所使用的数据资源质量评估指标,
Figure 312158DEST_PATH_IMAGE010
为数据元件模型质量评估指标,
Figure 477691DEST_PATH_IMAGE011
为数据元件结果质量评估指标,
Figure 482556DEST_PATH_IMAGE012
表示数据资源质量评估指标各种二级指标,
Figure 574620DEST_PATH_IMAGE013
表示数据元件模型质量评估指标的各种二级指标,
Figure 808286DEST_PATH_IMAGE014
为数据元件结果质量评估指标的二级指标。
可选地,通过所述价值评估模型来对数据元件的价值进行评估之后,所述方法还包括:在所述价值评估模型对数据元件进行评估的基础上,进一步考虑数据该数据元件所处的行业领域、数据元件的加工成本以及数据元件被不断利用而产生的动态价值变化,以更好的对数据元件的价值进行评估。
可选地,所述方法还包括:在数据要素交易的过程中,根据数据价值转化的不同阶段,适应性采用成本法、收益法、市场法的定价策略来对数据元件进行定价,以确保数据要素交易市场实现稳定、有序、健康发展。
第二方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现上述任意一项所述的对数据价值进行评估的方法。
本发明有益效果如下:
本发明通过将原始数据资源设定为统一形式的数据元件,然后基于数据元件体量、数据元件质量和信息密度来通过香农信息理论建立价值评估模型,也即本发明是以数据元件这种中间件的形式,本着数据的数据量和数据特征来计算数据价值,从而实现对数据价值准确评估,并能有效提高了数据的安全隐私性,进而大大提升了用户体验。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的一种对数据价值进行评估的方法的流程示意图;
图2是本发明实施例提供的数据元件体量与数据价值之间的对应关系示意图;
图3是本发明实施例提供的数据元件质量与数据价值之间的对应关系示意图;
图4是本发明实施例提供的信息密度与数据价值之间的对应关系示意图;
图5是本发明实施例提供的质量评估指标的示意图;
图6是本发明实施例提供的另一种对数据价值进行评估的方法的流程示意图。
具体实施方式
本发明实施例针对现有数据交易标的物难控制、难计量、难定价的问题,本发明通过将原始数据资源设定为统一形式的数据元件,然后基于数据元件体量、数据元件质量和信息密度来通过香农信息理论建立价值评估模型,也即本发明是以数据元件这种中间件的形式,本着数据的数据量和数据特征来计算数据价值,从而实现对数据价值准确评估,并能有效提高了数据的安全隐私性,进而大大提升了用户体验。以下结合附图以及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。
本发明实施例提供了一种对数据价值进行评估的方法,参见图1,该方法包括:
S101、对待评估的数据进行预处理得到数据元件;
本发明实施例中的待评估的数据可以是各种被个人以及企业等所拥有或控制的以物理、电子方式记录的,且能够带来经济利益的数据资源。具体实施时,本发明实施例通过预设的数据元件模型来对待评估的数据进行预处理,具体该预处理包括脱敏相关字段处理以及其他各种处理,需要说明的是,本发明实施例中所述的脱敏相关字段处理实质就是对待评估数据中的预设敏感字词进行处理,以消除待评估的数据中的隐私安全风险,并将该待评估的数据转化为统一标准化的数据元件,使得数据在流通过程中能够以数据元件形式交易流转。
需要说明的是,本发明实施例中的数据元件实质就是一个从原始数据到数据应用之间的具有元件标准的中间态,换句话来说,本发明实施例中的数据元件的基本属性是原始数据与应用之间的数据初级产品、数据交易市场中的交易标的物、近源数据的信息载体、数据资产计量和定价的基本单元,其具有安全属性和价值属性,能够规模化生产应用到不同场景域,在实现数据的风险隔离与安全管控的同时,可提升数据价值密度,最终实现数据资源的产品化流通和规模化应用,也即,本发明实施例中的数据元件是数据初级产品,遵循数据元件标准,既具有安全属性也具有价值属性,所以使得其能够规模化流通应用到不同业务场景中,进而使得数据能够作为资本参与到经济循环中,以达到有效支撑经济高质量发展的目的。
具体来说,本发明实施例中的数据元件模型是在沙箱环境下,构建、训练并优化而得到的模型,通过该数据元件模型来对原始数据资源,也即上述的待评估的数据进行加工处理,最后得到对应的数据元件,该数据元件为具有预设功能的数据集或者为具有预设数据特征的数据集,换句话来说,本发明实施例是中的数据元件实质就是对原始数据资源进行预处理,并经过脱敏相关字段形成的数据集或经关联字段建模所形成的特征的初级数据产品。所以本发明最终是以数据元件的形式来对数据价值进行评估,而由于该数据元件对他人是不可见的,因此本发明的评估方法能够消除待评估的数据中的隐私安全风险,并且本发明中的数据元件是统一标准化,这也使得本发明的数据能够在流通过程中实现更有效的交易流转。
需要说明是,本发明实施例中的数据元件模型为在沙箱环境下,利用样本数据训练、优化、测试处理后而得到的模型,且构建、训练以及优化所述数据元件模型的开发环境与所述数据元件的生产环境是相分离的,通过这种设置,能够有效避免在生产环境下的数据的外泄,从而最大程度上保证数据的安全性。
另外,在具体实施时,本发明实施例是将所述数据元件存储到预设的数据元件库,以供后续调取使用,且所述数据元件包括标准的数据元件和定制的数据元件,其中,所述标准的数据元件为通用的数据元件的,所述定制数据元件为基于预设需求而设计的数据元件。也就是说,本发明可以将所有的待评估的数据都统一设置为一个统一形式的数据元件,也可以灵活的根据用户的需求来加工定制用户所要求的数据元件。并且,本发明是将所有的数据元件均存放在指定地点,以便于评估和后续调取使用,同时也便于对数据的整体维护。
在具体实施时,可以将数据元件的整体定义为:组态字段数在预设组态字段阈值内,和/或,所述数据元件的模态特征字段个数在预设模态特征字段阈值内。
例如,将数据元件定义为:组态字段数有控制在12个以内,模态特征字段个数为1个,等等。
也就是说,本发明实施例中的数据元件是符合一些特征要求的数据所组成的几个单元,在具体实施时,本领域技术人员是可以根据实际需要来任意定义数据元件的单元组成规则,本发明对此不作具体限定。
S102、根据香农信息理论计算方法,基于数据元件体量、数据元件质量和信息密度建立价值评估模型
Figure 608752DEST_PATH_IMAGE001
,通过所述价值评估模型来对数据元件的价值进行评估;
也即,由于数据元件价值与数据元件体量、数据元件质量和信息密度成正相关,所以本发明实施例通过香农信息理论计算方法来基于数据元件体量、数据元件质量和信息密度建立价值评估模型,从而实现对数据元件价值的评估。
总体来说,本发明是针对现有具有经济价值的数据难以对其价值进行准确评估,进而限制数据资产交易,最终阻碍数据价值释放的问题,通过对待评估的数据进行处理来得到数据元件,并以数据元件形式通过价值评估模型来对数据的价值进行科学合理的评估,从而使得数据能够作为资本参与到经济循环中,以达到有效支撑经济高质量发展的目的。
具体来说,参见图2、图3和图4可知,数据元件体量与数据元件使用的数据成正相关,而当体量达到一定值以后,就会有一个衰减的过程,数据元件质量由质量评估指标矩阵和各个指标的权重系数来决定,前期数据元件质量差,质量变动所带来的数据元件价值的变化较小,而信息密度可基于信息熵进行建模评估。
具体来说,本发明实施例所述数据元件体量
Figure 795773DEST_PATH_2
,N为数据元件生产使用的数据体量,C是与数据元件大小相关的标准常量;
具体地,本发明实施例中的数据元件体量的取值范围是介于0到1之间,该数据元件体量的函数表现为在一定范围内,数据体量越大,数据元件体量系数越大,当达到标准常量后,数据元件体量系数几乎趋近于1,具体参见图2所示的曲线;而当数据体量较小时,其所形成的数据元件价值较低,数据元件体量系数较小,总体呈减缓上升的趋势。
所述数据元件质量
Figure 755755DEST_PATH_IMAGE003
,其中,Z为数据元件质量评估指标矩阵,β为数据元件质量评估指标权重系数;
本发明实施例的数据元件质量的取值范围也是介于0到1之间,具体该函数表现为所使用数据资源质量越差,数据元件质量也越差,数据元件可用性越低,价值越低,而所使用数据资源质量越高,数据元件质量也越高,数据元件可用性越高,其最终价值越高,所以总体呈增速上升的趋势,具体参见图3。
所述信息密度
Figure 996374DEST_PATH_IMAGE004
为对信息量
Figure 231440DEST_PATH_IMAGE005
的拟合值,信息量
Figure 46949DEST_PATH_IMAGE006
Figure 69263DEST_PATH_IMAGE005
为根据香农信息理论计算数据元件X得到的,yi为数据元件的特征,n为数据元件的特征个数
Figure 893999DEST_PATH_IMAGE007
为数据元件X中特征的值的概率。
本发明实施例中的数据元件信息密度是关于信息量的非参数函数,数据元件所包含的信息量越少,数据元件价值越小,而数据元件所包含的信息量越多,数据元件价值越大,总体呈上升趋势,具体可参见图4进行理解。
整体上数据元件的价值是根据香农信息理论表达式进行计算,通常信息量越大,数据的价值越高,不同行业价值评估模型的表达式,可以根据实际数据进行具体设置的,本发明对此不作详细说明。
总体来说,本发明实施例是通过构建标准化统一形态的数据元件,然后根据香农信息论计算方法来对数据元件体量、质量和信息密度建立价值评估模型,以实现根据数据元件本身的信息量以及数据元件的属性来对数据价值进行评估,同时在评价时,本发明实施例还综合考虑了数据元件所处的行业领域、数据元件加工成本以及数据元件再不断利用而产生的动态价值变化,同时在数据价值转化的不同阶段适应性的成本法、收益法、市场法等多种定价策略对数据元件进行定价,最终实现对数据价值的准确评估,从而为数据市场流通提供有效支持。
进一步地,本发明实施例中所述数据元件质量评估指标矩阵Z具体是可以包括多级数据资源质量评估指标的,且每一级的数据资源质量评估指标下还可以包括多个不同的数据资源质量评估指标,每一个数据资源质量评估指标均设有对应的指标权重系数,通过对各个数据资源质量评估指标及其对应的指标权重系数进行计算得到数据元件质量。
本发明实施例中所述数据元件质量评估指标可以参见图5进行理解,需要说明的是,该质量评估指标仅仅是本发明的一个示例,在具体实施时,本领域技术人员可以根据实际数据的特征来具体设定质量评估指标,本发明对此不作具体限定。
具体实施时,本发明实施例通过对各个数据资源质量评估指标及其对应的指标权重系数进行计算得到数据元件质量,包括:
Figure 387166DEST_PATH_IMAGE008
其中,
Figure 639156DEST_PATH_IMAGE009
为数据元件所使用的数据资源质量评估指标,
Figure 273400DEST_PATH_IMAGE010
为数据元件模型质量评估指标,
Figure 652560DEST_PATH_IMAGE011
为数据元件结果质量评估指标,
Figure 485387DEST_PATH_IMAGE012
表示数据资源质量评估指标各种二级指标,
Figure 222792DEST_PATH_IMAGE013
表示数据元件模型质量评估指标的各种二级指标,
Figure 672228DEST_PATH_IMAGE014
为数据元件结果质量评估指标的二级指标。
当然上述仅仅是本发明的一个例子,在具体实施时,本领域技术人员可以按照上述思路来对当前数据的质量评估指标和权重来计算数据元件质量。
在具体实施时,本发明所述的方法还包括:在所述价值评估模型对数据元件进行评估的基础上,进一步考虑数据该数据元件所处的行业领域、数据元件的加工成本以及数据元件被不断利用而产生的动态价值变化,以更好的对数据元件的价值进行评估。以及在数据要素交易的过程中,根据数据价值转化的不同阶段,适应性采用成本法、收益法、市场法的定价策略来对数据元件进行定价,以确保数据要素交易市场实现稳定、有序、健康发展。
在具体实施时,本发明实施例所述的方法还包括:对数据元件的交易情况进行统计分析,考虑数据元件价值的衰变,并按照预设折现率折现后,对价值评估模型的数据元件质量和信息密度进行修正,以使所述价值评估模型能够准确对数据价值进行评估。
简单来说,本发明实施例对基于数据元件的交易情况的统计数据来对价值评估模型中的各个参数进行修改,如对质量评估指标进行调整,或者对指标权重系数进行修改,通过这种修改使得本发明的评估模型能够适应数据市场的变换,同时也能够使得评估模型的评估更准确。从而更好的为数据要素的估值定价提供指导依据,为数据要素市场化奠定基础。
也就是说,在基于价值评估模型对数据元件进行评估的基础上,还可以结合数据元件所处的行业领域、数据元件的加工成本以及数据元件被不断利用而产生的动态价值变化,来调整数据元件的评估价值,而且在具体流通过程中,也可以根据流通的不同阶段来通过相应的定价策略来对数据元件价值进一步进行调整,通过这种设置能够有效保证数据价值评估的准确性,使得数据作为资本参能够更好地参与到经济循环中,从而使数据价值得到更好的释放,最终有效支撑经济高质量发展。
下面将结合图6通过一个具体的例子来对本发明所述的方法进行说明:
参见图6,本发明首先是对数据进行标准化定义,严格约定数据要素的字段数和记录数,从而形成统一的标准化计量评估的数据元件,然后根据香农信息论计算方法,基于数据元件体量、数据元件质量和数据元件的信息密度等相关影响因素建立价值评估模型,再综合考虑不同行业领域特征及数据要素开发处理和生产维护成本等因素,基于信息量价值构建定价模型,同时基于成本法、收益法、市场法及组合方式,加上一定的比例的利润确定数据要素价格,构建不同方式的定价模型调节模型,如协议指导价和竞价指导价,以进一步完善定价机制,在实际过程中,对数据要素交易情况进行动态统计分析,考虑数据价值的衰变,并按照一定的折现率折现后,构建模型对价值评估指标权重和各项参数进行修正,对被评估数据要素与可比资产的差异因素量化,调整数据要素交易价格,完善数据要素动态定价体系。
数据元件的信息价值与数据元件体量、数据元件质量、信息密度具有紧密关系,数据元件信息价值评估模型可表示为:
Figure 323920DEST_PATH_IMAGE001
基于本发明所述方法开发数据要素估值定价模型,为数据要素的估值定价提供指导依据,为数据要素市场化奠定基础。
总体来说,本发明是将以往不可量化的数据形态转化为标准化的统一形态,基于标准化形态构建数据要素价值评估模型,以信息熵理论作为基础参考,综合考虑数据的行业领域、加工成本以及数据不断利用而产生的动态价值变化,从而使得模型具有可迁移性和广泛的适用性。在数据要素交易的过程中,定价机制基于数据价值转化的不同阶段,采用成本法、收益法、市场法等多种定价策略,确保数据要素交易市场实现稳定、有序、健康发展。该方法具有普适性,考虑每个数据项都具有信息量,每个字段所包含的属性价值平等,不考虑信息语义的价值。
相应地,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现本发明第一实施例中任一种所述的对数据价值进行评估的方法,具体可以参见本发明方法实施例进行理解,在此不做详细赘述。
尽管为示例目的,已经公开了本发明的优选实施例,本领域的技术人员将意识到各种改进、增加和取代也是可能的,因此,本发明的范围应当不限于上述实施例。

Claims (9)

1.一种对数据价值进行评估的方法,其特征在于,包括:
对待评估的数据进行预处理得到数据元件,所述数据元件为对原始数据资源进行预处理,并经过脱敏处理后形成的数据集或经关联字段建模所形成的特征的初级数据产品;
根据香农信息理论计算方法,基于数据元件体量、数据元件质量和信息密度建立价值评估模型
Figure 821768DEST_PATH_IMAGE001
,通过所述价值评估模型来对数据元件的价值进行评估;
其中,所述数据元件体量
Figure 2
,N为数据元件生产使用的数据体量,C是与数据元件大小相关的标准常量;
所述数据元件质量
Figure 539505DEST_PATH_IMAGE003
,其中,Z为数据元件质量评估指标矩阵,β为数据元件质量评估指标权重系数;
所述信息密度
Figure 576732DEST_PATH_IMAGE004
关于信息量
Figure 448741DEST_PATH_IMAGE005
的非参数函数,信息量
Figure 534509DEST_PATH_IMAGE006
Figure 621414DEST_PATH_IMAGE005
为根据香农信息熵理论计算数据元件X得到的,yi为数据元件中字段特征的值,n为数据元件的特征个数
Figure 517957DEST_PATH_IMAGE007
为数据元件X中特征的值的概率。
2.根据权利要求1所述的方法,其特征在于,所述对待评估的数据进行预处理得到数据元件,包括:
通过预设的数据元件模型来对待评估的数据进行预处理,以消除待评估的数据中的隐私安全风险,并将该待评估的数据转化为统一标准化的数据元件,使得数据在流通过程中能够以数据元件形式交易流转。
3.根据权利要求1所述的方法,其特征在于,
所述数据元件的组态字段数在预设组态字段阈值内,和/或,所述数据元件的模态特征字段个数在预设模态特征字段阈值内。
4.根据权利要求1-3中任意一项所述的方法,其特征在于,
所述数据元件质量评估指标矩阵Z包括多级数据资源质量评估指标,且每一级的数据资源质量评估指标下还包括多个不同的数据资源质量评估指标,每一个数据资源质量评估指标均设有对应的指标权重系数,通过对各个数据资源质量评估指标及其对应的指标权重系数进行计算得到数据元件质量。
5.根据权利要求4所述的方法,其特征在于,所述通过对各个数据资源质量评估指标及其对应的指标权重系数进行计算得到数据元件质量,包括:
Figure 690312DEST_PATH_IMAGE009
其中,
Figure 642088DEST_PATH_IMAGE010
为数据元件所使用的数据资源质量评估指标,
Figure 786761DEST_PATH_IMAGE011
为数据元件模型质量评估指标,
Figure 165790DEST_PATH_IMAGE012
为数据元件结果质量评估指标,
Figure 746813DEST_PATH_IMAGE013
表示数据资源质量评估指标各种二级指标,
Figure 705542DEST_PATH_IMAGE014
表示数据元件模型质量评估指标的各种二级指标,
Figure 563776DEST_PATH_IMAGE015
为数据元件结果质量评估指标的二级指标。
6.根据权利要求1-3中任意一项所述的方法,其特征在于,通过所述价值评估模型来对数据元件的价值进行评估之后,所述方法还包括:
在所述价值评估模型对数据元件进行评估的基础上,进一步考虑数据该数据元件所处的行业领域、数据元件的加工成本以及数据元件被不断利用而产生的动态价值变化,以更好的对数据元件的价值进行评估。
7.根据权利要求1-3中任意一项所述的方法,其特征在于,所述方法还包括:
在数据要素交易的过程中,根据数据价值转化的不同阶段,适应性采用成本法、收益法、市场法的定价策略来对数据元件进行定价。
8.根据权利要求1-3中任意一项所述的方法,其特征在于,所述方法还包括:
对数据元件的交易情况进行统计分析,考虑数据元件价值的衰变,并按照预设折现率折现后,对价值评估模型的数据元件质量和信息密度进行修正,以使所述价值评估模型能够准确对数据价值进行评估。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现权利要求1-8中任意一项所述的对数据价值进行评估的方法。
CN202210120542.7A 2022-02-09 2022-02-09 一种对数据价值进行评估的方法 Pending CN114638468A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210120542.7A CN114638468A (zh) 2022-02-09 2022-02-09 一种对数据价值进行评估的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210120542.7A CN114638468A (zh) 2022-02-09 2022-02-09 一种对数据价值进行评估的方法

Publications (1)

Publication Number Publication Date
CN114638468A true CN114638468A (zh) 2022-06-17

Family

ID=81946737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210120542.7A Pending CN114638468A (zh) 2022-02-09 2022-02-09 一种对数据价值进行评估的方法

Country Status (1)

Country Link
CN (1) CN114638468A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115202890A (zh) * 2022-09-14 2022-10-18 中国电子信息产业集团有限公司 数据元件生产资源空间分配方法、系统及设备
CN115221893A (zh) * 2022-09-21 2022-10-21 中国电子信息产业集团有限公司 基于规则与语义分析的质检规则自动化配置方法及装置
CN115689596A (zh) * 2022-08-27 2023-02-03 北京华宜信科技有限公司 一种非定制化数据资产估值方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115689596A (zh) * 2022-08-27 2023-02-03 北京华宜信科技有限公司 一种非定制化数据资产估值方法
CN115689596B (zh) * 2022-08-27 2023-07-07 北京华宜信科技有限公司 一种非定制化数据资产估值方法
CN115202890A (zh) * 2022-09-14 2022-10-18 中国电子信息产业集团有限公司 数据元件生产资源空间分配方法、系统及设备
CN115202890B (zh) * 2022-09-14 2022-12-16 中国电子信息产业集团有限公司 数据元件生产资源空间分配方法、系统及设备
CN115221893A (zh) * 2022-09-21 2022-10-21 中国电子信息产业集团有限公司 基于规则与语义分析的质检规则自动化配置方法及装置

Similar Documents

Publication Publication Date Title
CN114638468A (zh) 一种对数据价值进行评估的方法
WO2019205325A1 (zh) 确定用户风险等级的方法、终端设备及计算机可读存储介质
Fernández‐Olmos et al. The direct or indirect exporting decision in agri‐food firms
CN110335141A (zh) 一种基于多模型的授信额度确定方法、装置和电子设备
Guest et al. Population ageing and house prices in Australia
CN112184046A (zh) 广告业务用户价值评估方法、装置、设备及存储介质
CN117391583B (zh) 采购数据管理方法及平台
CN112446764A (zh) 游戏商品推荐方法、装置及电子设备
CN111754287B (zh) 物品筛选方法、装置、设备和存储介质
Gold et al. Modeling demand in computerized business simulations
Glau et al. Speed-up credit exposure calculations for pricing and risk management
CN114723481A (zh) 数据处理方法、装置、电子设备和存储介质
CN110599351A (zh) 一种投资数据处理方法及装置
CN108665312B (zh) 用于生成信息的方法和装置
CN110033165A (zh) 逾期借款催收方式的推荐方法、装置、介质、电子设备
AU2020443019A1 (en) Systems, computer-implemented methods and computer programs for capital management
Bertella et al. Confidence and self-attribution bias in an artificial stock market
CN116228416A (zh) 期权的公允价值评估系统、评估方法、设备及存储介质
Niu et al. The Impact of Advance Selling Strategies on a Three‐Echelon Supply Chain in the Presence of Social Influence
CN114862291A (zh) 一种数据资产价值评估系统及方法及装置及介质
Wang et al. Long-and short-term price behaviors in presale housing markets in Taiwan
CN114240599A (zh) 贷款测算方法、装置、计算机设备和存储介质
CN117455520A (zh) 一种基于信息熵的数据元件资产价值劵值评估方法
CN113077275A (zh) 数据产品自动定价方法及装置
Sweeney et al. How do fishery policies affect Hawaii's longline fishing industry? Calibrating a positive mathematical programming model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220617

RJ01 Rejection of invention patent application after publication