发明内容
为解决上述技术问题,本发明提出一种非定制化数据资产估值方法,基于非定制化数据资产中数据单元价值指标信息,在充分挖掘非定制化数据资产内数据单元之间,以及与历史交易数据资产中数据单元的深度关联性基础上,构建了数据资产的多维度价值关联图谱,进一步构建数据资产的价值熵;基于所述价值熵和已交易数据资产影响系数,完成对非定制化数据资产的综合估值。
为达到上述目的,本发明实施例公开了一种非定制化数据资产估值方法,所述方法包括:
S1、对非定制化数据资产进行处理,得到数据集;所述数据集包括数据单元和数据单元关系;所述非定制化数据资产表征未明确需求方的数据资产;
S2、对所述数据集中所有数据单元进行处理,得到数据单元价值指标信息集;
S3、利用所述数据单元价值指标信息集,对所述数据集进行处理,构建所述非定制化数据资产的多维度价值关联图谱;
S4、根据所述多维度价值关联图谱,对所述数据集进行处理,构建所述非定制化数据资产的价值熵;
S5、基于所述价值熵,对所述非定制化数据资产进行综合估值,得到所述非定制化数据资产的估值信息。
作为一种可选的实施方式,在本发明实施例中,所述对非定制化数据资产进行处理,得到数据集,包括:
S11、利用分词、词袋向量和朴素贝叶斯分类器等自动语言处理技术,对数据资产进行最小语义单元划分,得到语义单元集;
S12、采用数据库相似度对比、t检验、语义相似度查重和杰卡德相似系数等比对查重方法,对所述语义单元集进行比对查重,去除其中重复的最小语义单元,得到第二语义单元集;
S13、利用TF-IDF表示、卡方特征选择和支持向量机分类器等智能化扫描技术,对所述第二语义单元集进行分类处理,得到所述数据集的数据单元;
S14、利用词法分析、句法分析、语用分析和语境分析等语义识别技术,对所述数据集中所有数据单元间的关系进行识别,得到所述数据集的数据单元关系。
作为一种可选的实施方式,在本发明实施例中,所述数据单元价值指标信息包括:数据成本指标、数据质量指标、数据的层次指标、数据协调性指标;
所述数据成本指标包括时间成本、经济成本、资源成本;
所述数据质量指标包括数据时效、数据内容、数据可靠性、数据技术性指标;
所述数据层次指标包括数据范畴、数据定位;
所述数据协调性包括数据关联指标、数据途径指标、数据来源指标;
作为一种可选的实施方式,在本发明实施例中,所述对所述数据集中所有数据单元进行处理,得到数据单元价值指标信息集,包括:
S21、从所述数据集中选择任一数据单元F;
S22、对所述数据单元F进行处理,计算所述数据单元F的时间成本值、经济成本值、资源成本值、数据时效、数据内容文本、数据可靠性文本、数据技术性指标值、数据单元范畴文本、数据单元定位文本、数据单元关联文本、数据单元途径文本、数据单元来源字段、应用场景影响、市场因素影响指标,得到所述数据单元F的价值指标信息;
S23、重复步骤S22,直至所述数据集中所有数据单位完成处理,得到数据单元价值指标信息集。
作为一种可选的实施方式,在本发明实施例中,所述数据单元价值指标信息还可以包括潜在用户异质性指标;
所述潜在用户异质性指标包括应用场景影响指标和市场因素影响指标,所述应用场景影响、市场因素影响用于对数据资产的综合性资产估值进行修正。
作为一种可选的实施方式,在本发明实施例中,所述利用所述数据单元价值指标信息集,对所述数据集进行处理,构建所述非定制化数据资产的多维度价值关联图谱,包括:
S31、从预设的数据库中提取包含所述数据集内数据单元的已交易数据资产,得到历史案例集;所述预设的数据库包含已经交易成功的数据资产信息;
S32、对所述数据集中的任一数据单元进行如下处理:
S321、设待处理数据单元为第一数据单元;
S322、根据所述数据单元价值指标信息集,计算所述第一数据单元的三维度价值信息,得到所述第一数据单元的三维度价值信息;
所述三维度价值信息包括时间维度价值信息、空间维度价值信息和路径维度价值信息;所述时间价值维度信息包括数据时间和数据时效;所述空间价值维度信息包括经济成本、资源成本、数据内容、数据可靠性、数据技术性指标;所述路经价值维度价值信息包括数据范畴、数据定位、数据关联、数据途径、数据来源;
S323、利用数据价值关联挖掘技术,对所述第一数据单元与所述历史案例集中的数据单元的三维度价值信息进行挖掘,得到所述第一数据单元的关联价值关系值;
S324、以所述第一数据单元为基准点,根据所述第一数据单元的关联价值关系值,建立所述第一数据单元的三个维度价值信息的关联信息,得到所述第一数据单元的三维度价值信息相对距离;
S325、将所述三维度价值信息相对距离,除以所述关联价值关系值,得到价值距离与价值关系系数;
S326、由所述关联价值关系值、三维度价值信息相对距离、价值距离与价值关系系数组成的集合,确定为所述第一数据单元的三维度价值关联图谱;
S33、重复步骤S32,直至完成所述数据集中的所有数据单元的三维度价值关联图谱计算,得到所述非定制化数据资产的多维度价值关联图谱。
作为一种可选的实施方式,在本发明实施例中,所述利用数据价值关联挖掘技术,对所述第一数据单元与所述历史案例集中的数据单元的三维度价值信息进行挖掘,得到所述第一数据单元的关联价值关系值,包括:
S3231、比对所述第一数据单元与所述历史案例集中数据单元的关联价值,提取所述历史案例集内每个相同案例的关联价值,得到历史关联价值集;
S3232、计算所述历史关联价值集中关联价值的概率分布平均值,得到所述第一数据单元的关联价值关系值。
作为另一种可选的实施方式,在本发明实施例中,所述利用数据价值关联挖掘技术,对所述第一数据单元与所述历史案例集中的数据单元的三维度价值信息进行挖掘,得到所述第一数据单元的关联价值关系值,也可以包括:
根据所述历史案例集中数据单元的多维度价值信息,采用区块链节点共识的方法,挖掘提取数据单元在多维度价值信息上的价值关联,并对数据单元间的在多维度价值信息的关联价值关系赋值,进一步地,建立数据单元价值关联库。通过比较对比数据单元价值关联库,采用区块链节点共识的方法,得到数据集中数据单元与历史案例集中数据单元的多维度价值信息的关联价值关系值。
作为一种可选的实施方式,在本发明实施例中,所述根据所述多维度价值关联图谱,对所述数据集进行处理,构建所述非定制化数据资产的价值熵,包括:
S41、根据所述多维度价值关联图谱,对所述数据集进行处理,得到数据信息分配模式;所述数据信息分配模式包括第一比率、第二比率、第三比率、第四比率、第五比率、第六比率、第七比率、第八比率;
S42、根据所述多维度价值关联图谱,从预设的数据库中提取与所述非定制化数据资产直接相关的相关历史交易数据资产集,根据所述相关历史交易数据资产集中所有数据资产的历史交易情况,得到所述非定制化数据资产的数据信息分配交易需求和数据信息分配交易需求空间;
S43、对所述数据信息分配模式、所述数据信息分配交易需求空间和所述数据信息分配交易需求进行计算,得到需求匹配度和信息量;
S44、将所述需求匹配度和所述信息量相乘,得到所述非定制化数据资产的价值熵。
作为一种可选的实施方式,在本发明实施例中,所述根据所述多维度价值关联图谱,对所述数据集进行处理,得到数据信息分配模式,包括:
S411、根据所述多维度价值关联图谱,对所述数据集内非冗余数据单元和非冗余数据关系进行识别,得到非冗余数据单元集和非冗余数据关系集;所述非冗余数据单元表征数据单元与历史交易数据资产数据单元在时间、空间和路径价值距离上大于冗余阈值,或,相互无关联的数据资产单元;
S412、所述第一比率为非冗余数据单元集中非冗余数据单元的个数占数据集中数据单元总数的比率,所述第二比率为非冗余数据关系集中非冗余数据关系的个数占数据集中数据单元关系总数的比率;
S413、根据所述多维度价值关联图谱,对所述数据集内的高增值数据单元和高增值数据关系进行识别,得到高增值数据单元集和高增值数据关系;所述高增值数据单元表征数据资产拥有该数据单元时,所述数据资产整体价值大于整体价值阈值的数据资产单元;
S414、所述第三比率为高增值数据单元集中高增值数据单元的个数占数据集中数据单元总数的比率,所述第四比率为高增值数据关系集中高增值数据关系的个数占数据集中数据单元关系总数的比率;
S415、根据所述多维度价值关联图谱,对所述数据集内的高缺失损失数据单元和高缺失损失数据关系进行识别,得到高缺失损失数据单元集和高缺失损失数据关系;所述高缺失损失数据单元表征数据资产缺失该数据单元时,对整体价值损失大于损失阈值的数据单元;
S416、所述第五比率为高缺失损失数据单元集中高缺失损失数据单元的个数占数据集中数据单元总数的比率,所述第六比率为高缺失损失数据关系集中高缺失损失数据关系的个数占数据集中数据单元关系总数的比率;
S417、根据所述多维度价值关联图谱,对所述数据集内的高价值数据单元和高价值数据关系进行识别,得到高价值数据单元集和高价值数据关系集;所述高价值数据单元表征非冗余数据单元、高增值数据单元、高缺失损失数据单元的总和;
S418、所述第七比率为高价值数据单元集中高价值数据单元的个数占数据集中数据单元总数的比率,所述第八比率为高价值数据关系集中高价值数据关系的个数占数据集中数据单元关系总数的比率。
作为一种可选的实施方式,在本发明实施例中,所述非冗余数据单元和非冗余数据关系识别方法,包括:
设要识别的数据单元为第二数据单元;
如果第二数据单元与所述数据集中历史交易数据资产数据单元的多维度价值相对距离达到预设第一阈值,多维度关联价值关系值达到预设第二阈值,在三个维度价值信息上的价值距离与价值关系系数值接近目标数据资产数据单元与历史交易数据资产数据单元价值距离与价值关系系数值中的预设的第三阈值。所述第二数据单元为冗余数据单元,否则为非冗余数据单元。
提取所述冗余数据单元的内部数据单元关系,同时根据数据资产多维度价值关联图谱,选取所述冗余数据单元相冗余的其他数据单元的数据单元间关系;判断冗余数据资产数据单元的内部数据单元关系与相冗余的其他数据单元的数据单元间关系是否冗余,如为冗余,则确定为冗余数据单元间关系,否则确定为非冗余数据单元间关系。
根据数据资产多维度价值关联图谱,重复执行,判断具有冗余数据资产数据单元间关系的内部数据单元是否为冗余数据资产数据单元,以及是否具有冗余数据资产数据单元间关系,直至所述数据集中所有数据单元及数据单元间关系其均被识别完冗余性为止,得到非冗余数据单元集和非冗余数据关系集。
作为又一种可选的实施方式,在本发明实施例中,所述高增值数据单元和高增值数据关系识别方法,包括:
设要识别的数据单元为第三数据单元;
当第三数据单元缺失时价值损失达到预设的损失阈值,所述目标数据单元为高增值数据单元;
将数据集中的数据单元与所述高增值数据单元相关联,且关系值达到预设的阈值时,也称为高增值数据单元;
根据数据资产多维度价值关联图谱,利用数据挖掘技术,提取所述高增值数据单元和其他数据单元间关系。
作为又一种可选的实施方式,在本发明实施例中,所述高缺失损失数据单元和高缺失损失数据关系识别方法,包括:
设要识别的数据单元为第四数据单元;
当第四数据单元拥有时价值增值达到预设的增值阈值时,所述目标数据单元为高缺失损失的数据单元;
数据集中的数据单元与高缺失损失的数据单元相关联,且关系值达到预设的增值阈值时,也称为高缺失损失的数据单元;
根据数据资产多维度价值关联图谱,提取高缺失损失的数据单元和高缺失损失的数据单元。
作为又一种可选的实施方式,在本发明实施例中,所述高价值数据单元和内部数据单元间关系识别方法,包括:
将非冗余数据单元和非冗余数据关系、高增值数据单元和高增值数据关系、高缺失损失数据单元和高缺失损失数据关系进行整合处理,得到高价值数据单元和高价值数据关系。
作为一种可选的实施方式,在本发明实施例中,所述根据所述多维度价值关联图谱,从预设的数据库中提取与所述非定制化数据资产直接相关的相关历史交易数据资产集,根据所述相关历史交易数据资产集中所有数据资产的历史交易情况,得到所述非定制化数据资产的数据信息分配交易需求和数据信息分配交易需求空间,具体包括:
S421、根据所述多维度价值关联图谱,从预设的数据库中提取与所述非定制化数据资产直接相关的相关历史交易数据资产集;
S422、从所述相关历史交易数据资产集中,提取所有相关历史交易数据资产的数据信息分配模式信息,得到已交易数据信息分配模式信息集;
S423、将所述已交易数据信息分配模式信息集中,所有已交易数据资产的数据信息分配模式的历史数据利用熵值法求取权重,并且加权计算求取平均值,得到所述非定制化数据资产的数据信息分配交易需求;
S424、统计所述已交易数据信息分配模式信息集中所有已交易数据资产的数据信息分配模式最小值和最大值,以所述最小值和最大值作为数据信息分配交易需求空间的最小值和最大值,得到所述非定制化数据资产的数据信息分配交易需求空间。
作为一种可选的实施方式,在本发明实施例中,所述对所述数据信息分配模式、所述数据信息分配交易需求和所述数据信息分配交易需求空间进行处理,得到需求匹配度和信息量,包括:
根据所述数据信息分配模式、所述数据信息分配交易需求和所述数据信息分配交易需求空间,计算得到需求匹配度和信息量;
所述需求匹配度计算公式为:
所述信息量计算公式为:
信息量=ɑ1×第一比率+ɑ2×第二比率+ɑ3×第三比率+ɑ4×第四比率+ɑ5×第五比率+ɑ6×第六比率+ɑ7×第七比率+ɑ8×第八比率
式中,ɑi表示所述数据信息分配模式中第i比率的权重,为相关数据单元对数据资产内部其他关联数据单元的价值影响值的总和。
作为一种可选的实施方式,在本发明实施例中,所述基于所述价值熵,对所述非定制化数据资产进行综合估值,得到所述非定制化数据资产的估值信息,包括:
S51、从所述相关历史交易数据资产集中提取成交时间最近的N个数据资产,对所述N个数据资产的交易价格及其价值熵进行计算,得到价格修正系数;所述N为不小于3的整数;
所述价格修正系数计算公式为,设所述N取值为3:
式中,A、T、P
C(A,T)分别表示非定制化数据资产、交易时间、价格修正系数;A
1、T
1、P
C(A
1,T
1)分别表示所述相关历史交易数据资产集中距T第一近时间交易的数据资产、交易时间、价格修正系数;A
2、T
2、P
C(A
2,T
2)分别表示所述相关历史交易数据资产集中距T第二近时间交易的数据资产、交易时间、价格修正系数;A
3、T
3、P
C(A
3,T
3)分别表示所述相关历史交易数据资产集中距T第三近时间交易的数据资产、交易时间、价格修正系数;Δt
1表示T与T
1之差,Δt
2表示T与T
2之差,Δt
3表示T与T
3之差,
表示P
C(A
1,T
1)、P
C(A
2,T
2)、P
C(A
3,T
3)的平均值;
S52、将所述价值熵与所述价格修正系数相乘,得到所述非定制化数据资产的初级交易价格;
S53、将数据信息分配交易需求空间的最小值和最大值,作为数据信息分配交易需求带入需求匹配度公式,得到最小需求匹配度和最大需求匹配度;
将所述最小需求匹配度和和所述信息量相乘,得到最小价值熵;
将所述最大需求匹配度和和所述信息量相乘,得到最大价值熵;
S54、将所述最小价值熵与所述价格修正系数相乘,得到所述非定制化数据资产最低初级参考交易价格;
将所述最大价值熵与所述价格修正系数相乘,得到所述非定制化数据资产最高初级参考交易价格;
将所述非定制化数据资产最低初级参考交易价格作为最低值、所述非定制化数据资产最高初级参考交易价格作为最高值,得到所述非定制化数据资产的初级议价空间;
S55、从所述相关历史交易数据资产集中提取预设成交时间期限内数据资产的市场交易价格,得到最近已成交数据资产价格信息集;所述最近已成交数据资产价格信息包括成交价格、成交时间;所述M为不小于3的整数;
根据所述成交数据资产价格信息集,利用时间权重计算模型,得到历史交易数据资产时间权重值;
所述时间权重计算模型为:
式中,Δt
i表示历史交易数据资产所述最近已成交数据资产价格信息集中第i个已成交数据资产的与当前时间T的时间距离;M表示所述最近已成交数据资产价格信息集中已成交数据资产的个数;
表示T
i的时间权重;
利用历史应用场景价格波动影响系数计算模型,得到所述非定制化数据资产时间资产的价格波动影响系数;
所述历史应用场景价格波动影响系数计算模型为:
式中,As[A]表示非定制化数据资产A的价格波动影响系数;M表示所述最近已成交数据资产价格信息集中已成交数据资产的个数;
表示时间权重;VB(AM
i)表示所述最近已成交数据资产价格信息集中已成交数据资产AM
i的成交价格;
S56、求取所述多维度价值关联图谱中所有数据单元的关联价值关系值平均值,得到数据资产的关联价值关系值;将所述价格波动影响系数和所述数据资产的关联价值关系值相乘,得到为市场因素影响系数;
S57、将所述初级参考交易价格与市场因素影响系数相乘,得到所述非定制化数据资产的最终参考交易价格;
将所述初级议价空间的最低值和最高值分别与市场因素影响系数相乘,得到最终议价空间的最低值和最高值,进一步地,得到所述非定制化数据资产的最终议价空间;
S58、对所述最终参考交易价格、所述最终议价空间进行整合处理,得到所述非定制化数据资产的估值信息。
与现有技术相比,本发明的有益效果:
(1)本发明所公开的一种非定制化数据资产估值方法,在挖掘数据资产内部数据单元和历史交易数据资产的数据单元的价值关联的基础上,考虑了非定制化数据资产估值受用户需求和市场需求影响的差异性,计算得到市场因素影响系数,进一步地,得到非定制化数据资产综合估值信息,为数据资产交易提供精准度的参考依据。
(2)本发明所公开的一种非定制化数据资产估值方法,将数据资产划分为包含多个数据单元,并以数据单元和数据关系组合为数据集的形式描述数据资产,在此基础上,标记数据单元多个维度价值,挖掘数据单元数据价值关联,构建数据资产多维度价值关联图谱,使数据资产的内在价值得到充分描述,与历史交易数据资产的价值关联得到充分挖掘。
(3)本发明所公开的一种非定制化数据资产估值方法,建立了数据资产价值熵。数据资产价值熵建立的过程中,不仅考虑了非定制化数据资产在用户和市场潜在用户的实际需求上的差异,更重要的是比较分析了数据资产与历史交易数据资产相比在价值上的优势即不可替代性、增值性和缺失损失性,并在此基础上通过分析数据资产与用户需求的匹配度,以及数据资产信息量高低的评估,计算数据资产价值熵,以此表达价值层面买家购买数据资产的概率,体现了数据资产估值的核心需求。
(4)本发明所公开的一种非定制化数据资产估值方法,针对非定制化的数据资产估值考虑到潜在用户异质性指标,在数据资产的多维度估值图谱基础上进行应用场景和市场因素影响分析,对非定制化的数据资产估值进行调整,使估值结果动态贴合市场变化。
具体实施方式
为了使本领域的技术人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明公开了一种非定制化数据资产估值方法,基于非定制化数据资产中数据单元价值指标信息,充分挖掘非定制化数据资产内数据单元之间,以及与历史交易的数据资产的数据单元的深度关联性,构建了所述非定制化数据资产的多维度价值关联图谱,构建非定制化数据资产的价值熵,通过对相关历史交易的数据资产的分析,得到市场因素影响系数,进一步地,得到非定制化数据资产的估值信息。
下面通过具体实施例对本说明书进行描述。
请参阅图1,图1是本发明实施例公开的一种非定制化数据资产估值方法结构示意图。图1所描述的非定制化数据资产估值方法用于非定制化数据资产估值。如图1所示,该非定制化数据资产估值方法可以包括以下操作:
101、对非定制化数据资产进行处理,得到数据集。
本发明实施例中,所述数据集包括数据单元和数据单元关系;所述非定制化数据资产表征未明确需求方的数据资产。
本发明实施例中,数据资产A为非定制化数据资产。
将所述数据资产A划分为a个数据单元dc(A),将所述a个数据单元dc(A),以及dc(A)间的语义关系集合为数据集Dc(A)。
a个数据单元dc(A)的划分方法包括:
通过分词、词袋向量和朴素贝叶斯分类器等自动语言处理技术对数据资产进行最小语义单元划分,并在数据资产数据库中比对查重,通过TF-IDF表示、卡方特征选择和支持向量机分类器等智能化扫描技术确定所有最小语义单元中必须作为一个整体集合才能体现独立的概念、内涵或价值的单元集合,将这些单元集合作为数据资产的数据单元。
dc(A)间的语义关系获取方法包括:
以数据资产的数据单元为基础,采用词法分析、句法分析、语用分析和语境分析等语义识别技术对数据资产的数据单元间的关系进行识别。
可见,通过将数据资产进行处理为包括数据单元和数据单元关系的数据集,将非定制化资产划分为具体的数据单元,并通过理清数据单元关系,明确定制化数据资产的基本构成,为挖掘数据资产价值、理清非定制化资产与历史数据资产的价值关联性、深度分析非定制化数据资产与潜在用户需求的关系奠定数据资源及处理方法基础。
102、对所述数据集中所有数据单元进行处理,得到数据单元价值指标信息集。
如图2所描述的一种数据单元价值指标信息构成图所示,数据单元价值指标除了包括数据成本、数据质量、数据资产的层次和数据资产协同性指标。其中,数据成本指标包括时间成本指标、经济成本指标、资源成本指标。数据质量指标包括数据时效指标、数据内容指标、数据可靠性指标、数据技术性指标。数据层次指标包括数据范畴指标、数据定位指标。数据协调性包括数据关联指标、数据途径指标、数据来源指标。以上指标将根据数据资产A的实际情况确定是否为数值、字段或文本。
数据资产A的整个价值是每个数据单元dc(A)的价值进行单独计算并求和。对数据资产的数据单元dc(A)进行价值指标的构建,其中的时间成本值为Pt[dc(A)]、经济成本值为Pe[dc(A)]、资源成本值为Pr[dc(A)]、数据时效为Ti[dc(A)]<t[dc(A)]<Tj[dc(A)]、数据内容为内容文本S[dc(A)]、数据可靠性文本Re[dc(A)]、数据技术性指标值为一系类技术指标值Te[dc(A)](i),i=1,2,....,a、数据范畴为文本C[dc(A)]、数据定位为文本O[dc(A)],数据关联为文本B[dc(A)]、数据途径文本L[dc(A)]、数据来源为字段U[dc(A)]。
数据单元价值指标集如表1所示。
表1数据单元dc(A)价值指标集
可见,通过计算或提取数据单元的各价值指标,全面描述了数据单元在数据成本、数据质量、数据资产的层次和数据资产协同性上的各价值属性,在保证以数据单元为基础的精准价值指标为基础的前提下,进一步的,通过对构成数据资产的数据单元的各价值求和,得到了数据资产的整体价值,为数据资产的价值分析提供从微观到宏观的方法基础,即保证了数据资产的整体价值评估的精准化,又保障了数据资产与历史交易数据资产从数据单元层面做价值关联分析的可行性。
103、利用所述数据单元价值指标信息集,对所述数据集进行处理,构建所述非定制化数据资产的多维度价值关联图谱。
1031、标记数据单元三个维度价值
如图3所描述的一种数据单元价值指标信息与三维度价值信息对应图,将以上数据单元的价值指标与时间、空间和路径三个价值评价维度相关联。数据资产A的a个数据单元dc(A)时间价值维度标记包括时间成本值Pt[dc(A)]和数据时效Ti[dc(A)]<t[dc(A)]<Tj[dc(A)],数据资产A的a个数据单元dc(A)空间价值维度标记包括经济成本值Pe[dc(A)]、资源成本值Pr[dc(A)]、数据内容文本S[dc(A)]、数据可靠性文本Re[dc(A)]、数据技术一系类技术指标值Te[dc(A)](i),i=1,2,....,a,数据资产A的a个数据单元dc(A)路经价值维度标记包括数据范畴文本C[dc(A)]、数据定位文本O[dc(A)]、数据关联文本B[dc(A)]、数据途径文本L[dc(A)]、数据来源字段U[dc(A)]。
数据单元dc(A)的三维度价值信息如表2所示。
表2数据单元dc(A)三维度关联价值指标
可见,通过利用数据单位价值指标信息构建了数据单元的三维度价值信息,实现了数据单位价值在时间、空间和路径三个维度的具体体现,利于将各数据单元在这三个普适性维度上开展价值关联研究。
1032、挖掘数据单元数据价值关联
预设的数据库中,已保存了已交易的历史数据资产M(M=1,2,....,m)的数据单元dc(M)的三个维度价值标记结果。将数据资产A的数据单元dc(A)的三个维度价值标记结果与预设数据库中历史交易数据资产为数据资产M(M=1,2,....,m)的数据单元dc(M)的三个维度价值标记结果分别进行比较,采用数据价值关联挖掘的方法挖掘出数据资产A的数据单元dc(A)与预设数据库中历史交易数据资产M的数据单元dc(M)的三个维度关联价值关系。
可选的,数据价值关联挖掘采用指标分析法,具体步骤为:
①对比预设数据库中历史交易数据资产M(M=1,2,....,m)的数据单元dc(M)的三个维度价值标记,设置数据单元的价值标记的相同或相似的范围判断标准,对数值指标设置数值范围,对文本指标采用语义智能识别及文本查重方法设置范围,对字段指标设置字段范围。根据设置的数据单元价值标记的相同或相似的范围判断标准,挖掘出具有相同或相似价值标记的一系列数据单元集合。这些数据单元集合中,任意某些数据单元在三个价值标记上各指标均位于设置的数据单元价值标记的相同或相似的范围以内,则认定这些数据单元是相同案例。
②根据已设置的数据单元的价值标记相同或相似的范围判断标准,以及所有数据单元的价值标记上的分布,可以确定数据单元在价值标记上的关联价值关系值。可选的,某一价值标记数值指标的相同或相似的范围设置为[z1,z2],所有数据单元在这个价值标记指标上的最大差距范围为[Z1,Z2],所有数据单元在这个价值标记指标上的分布服从分布函数F,则任意两个数据单元在价值标记上的关联价值关系值为:当两个数据单元在价值标记上的差距为[z1,z2]内时,关联价值关系值为100%;否则关联价值关系值为数据单元指标值在最大差距范围内[Z1,Z2]且不位于两个数据单元在价值标记上差距范围内的数据单元数量占总数据单元数量的比值。
③通过比对数据资产A的数据单元dc(A)与预设数据库中历史交易数据资产M(M=1,2,....,m)的数据单元dc(M)的三个维度价值标记,将数据资产A的数据单元dc(A)的三个维度价值标记代入以上步骤①和②中,可以求取出数据资产A的数据单元dc(A)与预设数据库中历史交易数据资产M(M=1,2,....,m)的数据单元dc(M)在三个维度价值标记上的关联价值关系值。
可选的,数据价值关联挖掘采用区块链共识法,具体步骤为:
根据预设数据库中历史交易数据资产为数据资产M(M=1,2,....,m)的数据单元dc(M)的三个维度价值标记结果,采用区块链节点共识的方法,挖掘提取数据单元在三个维度价值标记上的价值关联,并对数据单元间的在三个维度价值标记上的关联价值关系赋值,进一步地,建立数据单元价值关联库。通过比较对比数据单元价值关联库,采用区块链节点共识的方法,进一步确定数据资产A的数据单元dc(A)与预设数据库中历史交易数据资产M(M=1,2,....,n)的数据单元dc(M)在三个维度价值标记上的关联价值关系值。
可见,通过挖掘数据单元数据价值关联关系,可以为数据单元理清其与历史交易数据单元的相对价值,为数据单元作为数据单元三维度价值关联图谱中的节点,提供充分的图谱定位数据。
1033、构建数据单元三维度价值关联图谱
以数据资产A的数据单元dc(A)与预设数据库中历史交易数据资产M(M=1,2,....,m)的数据单元dc(M)在三个维度价值标记上的关联价值关系值Cor dc(AM),做为数据单元dc(A)与数据单元dc(M)的在三个维度价值标记上的关联价值关系距离。以数据资产A的数据集Dc(A)中的a个数据单元dc(A)为基准点,建立数据资产A的三个维度价值标记上的关联集合。集合中的数据单元dc(A)与数据单元dc(M)的相关数据集合表述为[dc(A),dc(M),dc(A)三个维度价值标记,dc(M)三个维度价值标记,数据单元dc(A)与数据单元dc(M)的三个维度价值相对距离]。在三个维度价值空间中,根据数据单元dc(A)的三个维度价值标记,可标记数据单元dc(A)的价值位置;根据数据单元dc(M)的三个维度价值标记,可标记数据单元dc(M)的价值位置;可求出数据单元dc(A)与数据单元dc(M)的三个维度价值相对距离;数据单元dc(A)与数据单元dc(M)的三个维度价值相对距离应等于k(AM)*三个维度关联价值关系值Cordc(AM)。推导出数据单元dc(A)与数据单元dc(M)的在三个维度价值标记上的价值距离与价值关系系数k(AM)。k(AM)值越大,说明dc(A),dc(M)相关性越低,反之相关性越高。将数据单元dc(A)与其他数据单元dc(M)对应的数据资产多维度价值关联图谱值[数据单元dc(A)与数据单元dc(M)的三个维度价值相对距离,数据单元dc(A)与数据单元dc(M)的三个维度关联价值关系值,k(AM)]集合为数据资产多维度价值关联图谱。
1034、重复步骤1031~1033,直至完成数据资产A中的所有数据单元的三维度价值关联图谱计算,得到所述数据资产A的多维度价值关联图谱。
可见,通过挖掘数据单元与其他数据资产数据单元的价值关联,构建了非定制化数据资产的多维度价值关联图谱,使数据资产的内在价值得到充分描述,与其他数据资产的价值关联得到充分挖掘,使数据资产的价值全貌得到可视化体现,为数据资产的具体估值提供了实施基础。
104、根据所述多维度价值关联图谱,对所述数据集进行处理,构建所述非定制化数据资产的价值熵。
1041、识别数据资产数据信息分配模式
根据数据资产多维度价值关联图谱,判断识别数据资产A数据集Dc(A)中非冗余数据单元和内部数据单元间关系、高增值或缺失损失数据单元和内部数据单元间关系。其中,冗余数据单元指的是目标数据资产数据单元中与历史交易数据资产数据单元在时间、空间和路径价值距离上无限接近且相互关联的数据资产单元;高增值数据的单元指目标数据资产单元拥有时,数据资产整体价值较大的数据资产单元;高缺失数据单元指目标数据资产单元缺失时,对整体价值损失较大的数据资产单元;高价值数据单元指将非冗余数据单元和数据单元间关系、高增值或缺失损失的数据单元、内部数据单元间关系和其他数据单元间关系统称为数据资产高价值数据单元。所述内部数据单元间关系表征数据资产A内部数据单元间的关系。
非冗余数据单元和数据单元间关系的识别方法:
根据数据资产多维度价值关联图谱中数据单元dc(A)与其他数据单元dc(M)对应的数据资产多维度价值关联图谱值[数据单元dc(A)与数据单元dc(M)的三个维度价值相对距离,数据单元dc(A)与数据单元dc(M)的三个维度关联价值关系值,k(AM)],确定数据资产A数据单元dc(A)中与预设数据库中历史交易数据资产为数据资产M(M=1,2,....,m)的数据单元dc(M)冗余的数据单元。确定方法为数据单元dc(A)与数据单元dc(M)的三个维度价值相对距离接近0,数据单元dc(A)与数据单元dc(M)的三个维度关联价值关系值接近1,k(AM)值接近k(AM)(M=1,2,.....,m)中的最小值。如数据资产A的数据单元dc(A)是与预设数据库中历史交易数据资产M的数据单元dc(M)冗余的数据单元,则标记为数据资产A的冗余数据资产数据单元Rdc(A),否则为非冗余数据资产数据单元
进一步地,确定与冗余数据资产数据单元Rdc(A)相冗余的数据单元Rdc(M)。
根据数据资产多维度价值关联图谱,确定Rdc(M)与其他数据单元dc(M)对应的数据资产多维度价值关联图谱值[数据单元Rdc(M)与其他数据单元dc(M)的三个维度价值相对距离,数据单元Rdc(M)与其他数据单元dc(M)的三个维度关联价值关系值,k(MM)],k(MM)为数据单元Rdc(M)与其他数据单元dc(M)在三个维度价值标记上的价值距离与价值关系系数。同理可知,Rdc(A)与数据资产A内部其他数据单元dc(A)对应的数据资产多维度价值关联图谱值。比较Rdc(M)与其他数据单元dc(M)对应的数据资产多维度价值关联图谱值,与Rdc(A)与数据资产A内部其他数据单元dc(A)对应的数据资产多维度价值关联图谱值,当两者一致时,对比数据单元dc(M)和数据单元dc(A)的三个维度价值标记,如两者三个维度价值标记相接近,则冗余数据资产数据单元Rdc(A)与数据资产内部数据单元dc(A)的关系,同Rdc(A)相冗余的数据资产数据单元Rdc(M)与历史交易数据资产数据单元dc(M)的关系冗余,对此冗余关系进行标记,否则判定为非冗余数据资产数据单元间关系。
重复上述步骤,继续判断具有冗余数据资产数据单元间关系的内部数据单元是否是冗余数据资产数据单元,以及是否具有冗余数据资产数据单元间关系,直至目标数据资产内部所有数据单元及数据单元间关系其均被识别完冗余性。
②高增值或缺失损失数据单元和内部数据单元间关系识别方法
根据数据资产A的各个数据单元dc(A)与数据资产A的其他数据单元dc(a)对应的数据资产多维度价值关联图谱值[数据单元dc(A)与数据单元dc(a)的三个维度价值相对距离,数据单元dc(A)与数据单元dc(a)的三个维度关联价值关系值,k(Aa)]。求取数据资产A缺失某一内部数据单元dc(A)时,数据资产A的其他数据单元dc(a)两两之间对应的数据资产多维度价值关联图谱值。
计算数据资产A的各个数据单元dc(A)与数据资产A的其他数据单元dc(a)对应的数据资产多维度价值关联图谱值的和,达到第一结果;计算数据资产A缺失某一数据单元dc(A)时,数据资产A的其他数据单元dc(a)两两之间对应的数据资产多维度价值关联图谱值的和,得到第二结果;所述第一结果与所述第二结果之差即为数据资产A缺失或拥有某一内部数据单元dc(A)时对数据资产A内部其他关联数据单元的价值影响值。该值越高,说明数据单元dc(A)缺失时价值损失较大或拥有时价值增值较大,将数据单元dc(A)称为高增值或缺失损失的数据单元Gdc(A)。
根据数据资产多维度价值关联图谱,得到与高增值或缺失损失的数据单元Gdc(A)相关联的其他数据单元。计算得到与高增值或缺失损失的数据单元Gdc(A)相关联的其他数据单元同Gdc(A)的三个维度关联价值关系值,所述关系值达到预设的阈值时,也称与高增值或缺失损失的数据单元Gdc(A)相关联的其他数据单元为高增值或缺失损失的数据单元。
根据数据资产多维度价值关联图谱,高增值或缺失损失的数据单元Gdc(A)和其他数据单元间关系识别方法与高增值或缺失损失的数据单元和内部数据单元间关系识别方法相同。
将①、②步骤中得出的非冗余数据单元和数据单元间关系、高增值或缺失损失的数据单元、内部数据单元间关系和其他数据单元间关系统称为数据资产高价值数据单元Vdc(A)和高价值数据关系VRdc(A),其余为一般价值数据Hdc(A)和数据关系HRdc(A)。根据①、②步骤可统计出数据资产A的数据单元数量、高价值数据单元数量、高价值数据单元关系数量、数据单元关系数量、非冗余数据单元数量、非冗余数据单元关系数量、高增值数据单元数量、高增值数据单元关系数量、高缺失损失数据单元数量、高缺失损失数据单元关系数量。
进一步地,确定数据资产数据信息分配模式包括:数据资产高价值数据单元占数据资产数据单元的比例PI(Vdc(A));数据资产高价值数据单元关系占数据资产数据单元关系的比例PI(VRdc(A));数据资产非冗余数据单元占数据资产数据单元的比例PI(Rdc(A));数据资产非冗余数据单元关系占数据资产数据单元关系的比例PI(RRdc(A));数据资产高增值或高缺失损失数据单元占数据资产数据单元的比例PI(Gdc(A));数据资产高增值或高缺失损失数据单元关系占数据资产数据单元关系的比例PI(GRdc(A))。
可见,从冗余性、高增值性和缺失损失性三个价值角度分析,识别数据资产数据单元和内部数据单元间关系间的关系,判断其中高价值数据单元、非冗余数据单元、高增值或高缺失损失数据单元占比,得到数据资产数据信息分配模式,得到数据资产各类数据单元的占比,使数据资产的内在价值得到体现,更重要的是明晰了数据资产中的高价值、非冗余、高增值或高缺失损失部分,为比较分析数据资产与其他数据资产相比在价值上的优势(即不可替代性、增值性和缺失损失性)奠定基础,并为数据资产估值乃至交易做出充分的数据资产价值分布参考依据。
1042、分析数据资产数据信息分配交易需求。
由于数据资产A为非定制化的数据资产,根据数据资产的所有潜在用户的相关历史需求和交易情况,分析本次交易的数据资产分配模式潜在需求和潜在用户对数据资产分配模式的可接受空间范畴。
所述本次交易的数据资产A分配模式潜在需求包括,数据资产高价值数据单元占数据资产数据单元的比例需求WPI(Vdc(A));数据资产高价值数据单元关系占数据资产数据单元关系的比例需求WPI(VRdc(A));数据资产非冗余数据单元占数据资产数据单元的比例需求WPI(Rdc(A));数据资产非冗余数据单元关系占数据资产数据单元关系的比例需求WPI(RRdc(A));数据资产高增值或高缺失损失数据单元占数据资产数据单元的比例需求WPI(Gdc(A));数据资产高增值或高缺失损失数据单元关系占数据资产数据单元关系的比例需求WPI(GRdc(A))。
潜在用户对数据资产分配模式的可接受空间范畴包括,数据资产高价值数据单元占数据资产数据单元的比例范畴CI(Vdc(A));数据资产高价值数据单元关系占数据资产数据单元关系的比例范畴CI(VRdc(A));数据资产非冗余数据单元占数据资产数据单元的比例范畴CI(Rdc(A));数据资产非冗余数据单元关系占数据资产数据单元关系的比例范畴CI(RRdc(A));数据资产高增值或高缺失损失数据单元占数据资产数据单元的比例范畴CI(Gdc(A));数据资产高增值或高缺失损失数据单元关系占数据资产数据单元关系的比例范畴CI(GRdc(A))。
根据数据资产多维度价值关联图谱,计算与数据资产A的多个数据单元dc(A)冗余的历史交易数据资产,或具有多个与数据资产A的数据单元dc(A)关联价值关系值较高的数据单元的历史交易数据资产,当满足数据单元dc(A)与数据资产B的多维度价值关联图谱值k(MM)值小于0.2或与数据资产A的数据单元dc(A)关联价值关系值Corrdc(AM)大于0.8(强相关)条件时,将这些历史交易数据资产统称为直接相关的历史交易数据资产。根据这些数据资产的历史交易情况可知其历史交易用户,这些历史交易用户均为数据资产A的潜在用户。对数据资产分配模式进行指标i的建立,指标包括交易时间、交易规模、交易价格、交易数据类型,h
ji表示第i个指标的j个值,对指标进行标准化处理:
计算指标i的熵值:/>
其中,/>
计算指标i的差异系数:g
i=1-e
i;计算指标i的权重:/>
最后对数据资产分配模型进行权重的确定,依据此将每一个潜在用户将所有数据资产分配模式加权求取平均值,得到平均数据资产分配模式作为本次交易的数据资产交易模式潜在需求。计算得到所有潜在用户的本次交易的数据资产交易模式潜在需求的平均值,作为市场对本次交易的数据资产交易模式潜在平均需求。
市场对本次交易的数据资产交易模式潜在平均需求包括,数据资产高价值数据单元占数据资产数据单元的比例需求MPI(Vdc(A));数据资产高价值数据单元关系占数据资产数据单元关系的比例需求MPI(VRdc(A));数据资产非冗余数据单元占数据资产数据单元的比例需求MPI(Rdc(A));数据资产非冗余数据单元关系占数据资产数据单元关系的比例需求MPI(RRdc(A));数据资产高增值或高缺失损失数据单元占数据资产数据单元的比例需求MPI(Gdc(A));数据资产高增值或高缺失损失数据单元关系占数据资产数据单元关系的比例需求MPI(GRdc(A))。
以潜在用户的相关数据资产交易模式的集合为参考,将覆盖潜在用户的相关数据资产交易模式的数据资产交易模式范围作为潜在用户数据资产交易模式可接受空间范畴,也称潜在用户对本次交易的数据资产交易模式潜在需求空间。以所有数据资产分配模式的集合为参考,将覆盖所有数据资产交易模式的数据资产交易模式范围作为所有潜在用户数据资产交易模式可接受空间范畴,也称市场对本次交易的数据资产交易模式潜在需求空间。
市场对本次交易的数据资产交易模式潜在需求空间包括,数据资产高价值数据单元占数据资产数据单元的比例范畴MI(Vdc(A));数据资产高价值数据单元关系占数据资产数据单元关系的比例范畴MI(VRdc(A));数据资产非冗余数据单元占数据资产数据单元的比例范畴MI(Rdc(A));数据资产非冗余数据单元关系占数据资产数据单元关系的比例范畴MI(RRdc(A));数据资产高增值或高缺失损失数据单元占数据资产数据单元的比例范畴MI(Gdc(A));数据资产高增值或高缺失损失数据单元关系占数据资产数据单元关系的比例范畴MI(GRdc(A))。
可见,通过分析历史交易数据,确定潜在用户,进一步地得到数据资产交易模式潜在需求和需求空间,深度挖掘了不同用户对数据资产的不同需求,将这些需求公式化的描述出来,作为数据资产和不同用户需求的价值匹配的筛选、比较和判断依据。
1043、评估数据资产需求匹配度和信息量
根据所述数据资产数据信息分配交易需求和分配模式的可接受空间范畴,比较两者的匹配度。当数据资产数据信息分配交易需求包含于市场对本次交易的数据资产分配模式潜在需求空间,则称数据资产与市场需求匹配。即,PI(Vdc(A))∈CI(Vdc(A)),PI(VRdc(A))∈CI(VRdc(A)),PI(Rdc(A))∈CI(Rdc(A)),PI(RRdc(A))∈CI(RRdc(A)),PI(Gdc(A))∈CI(Gdc(A)),PI(GRdc(A))∈CI(GRdc(A)),则称数据资产与市场需求匹配。
计算得到非定制化数据资产A的数据资产数据信息分配模式与市场对本次交易的数据资产交易模式潜在平均需求的绝对差占市场对本次交易的数据资产交易模式潜在需求空间的百分比,即|PI(Vdc(A))-MPI(Vdc(A))|/MI(Vdc(A)),|PI(VRdc(A))-MPI(VRdc(A))|/MI(VRdc(A)),|PI(Rdc(A))-MPI(Rdc(A))|/MI(Rdc(A)),|PI(RRdc(A))-MPI(RRdc(A))|/MI(RRdc(A)),|PI(Gdc(A))-MPI(Gdc(A))|/MI(Gdc(A)),|PI(GRdc(A))-MPI(GRdc(A))|/MI(GRdc(A))。
非定制化数据资产A与市场需求的匹配度为[1-|PI(Vdc(A))-MPI(Vdc(A))|/MI(Vdc(A)),1-|PI(VRdc(A))-MPI(VRdc(A))|/MI(VRdc(A)),1-|PI(Rdc(A))-MPI(Rdc(A))|/MI(Rdc(A)),1-|PI(RRdc(A))-MPI(RRdc(A))|/MI(RRdc(A)),1-|PI(Gdc(A))-MPI(Gdc(A))|/MI(Gdc(A)),1-|PI(GRdc(A))-MPI(GRdc(A))|/MI(GRdc(A))]。
计算得到非定制化数据资产A的数据资产数据信息分配模式与本次交易的数据资产分配模式潜在需求的绝对差占潜在用户对本次交易的数据资产分配模式潜在需求空间的百分比,即|PI(Vdc(A))-WPI(Vdc(A))|/CI(Vdc(A)),|PI(VRdc(A))-WPI(VRdc(A))|/CI(VRdc(A)),|PI(Rdc(A))-WPI(Rdc(A))|/CI(Rdc(A)),|PI(RRdc(A))-WPI(RRdc(A))|/CI(RRdc(A)),|PI(Gdc(A))-WPI(Gdc(A))|/CI(Gdc(A)),|PI(GRdc(A))-WPI(GRdc(A))|/CI(GRdc(A))。
非定制化数据资产A与潜在用户的匹配度为[1-|PI(Vdc(A))-WPI(Vdc(A))|/CI(Vdc(A)),1-|PI(VRdc(A))-WPI(VRdc(A))|/CI(VRdc(A)),1-|PI(Rdc(A))-WPI(Rdc(A))|/CI(Rdc(A)),1-|PI(RRdc(A))-WPI(RRdc(A))|/CI(RRdc(A)),1-|PI(Gdc(A))-WPI(Gdc(A))|/CI(Gdc(A)),1-|PI(GRdc(A))-WPI(GRdc(A))|/CI(GRdc(A))]。
根据数据资产A的数据信息分配模式,计算得到数据资产A的信息量。
计算方法为:将数据资产A的数据信息分配模式中各比例赋予权重,将权重与各比例乘积加和再求平均,得出的值为数据资产A的信息量比重。即,PI(Vdc(A))赋予权重WE(Vdc(A)),PI(VRdc(A))赋予权重WE(VRdc(A)),PI(Rdc(A))赋予权重WE(Rdc(A)),PI(RRdc(A))赋予权重WE(RRdc(A)),PI(Gdc(A))赋予权重WE(Gdc(A)),PI(GRdc(A))赋予权重WE(Gdc(A))。各项权重赋值为相关数据单元对数据资产A内部其他关联数据单元的价值影响值的总和。可选的权重WE(Vdc(A))的赋值为数据资产A中高价值数据单元对数据资产A内部其他关联数据单元的价值影响值的总和。数据资产A的信息量比重为[PI(Vdc(A))*WE(Vdc(A))+PI(VRdc(A))*WE(VRdc(A))+PI(Rdc(A))*WE(Rdc(A))+PI(RRdc(A))*WE(RRdc(A))+PI(Gdc(A))*WE(Gdc(A))+PI(GRdc(A))*WE(Gdc(A))]/[num(Vdc(A))+num(VRdc(A))+num(Rdc(A))+num(RRdc(A))+num(Gdc(A))+num(GRdc(A))]。
可见,数据资产的匹配度反映了数据资产与潜在客户需求的匹配程度,信息量反映了数据资产中包含的高价值数据单元、非冗余数据单元、高增值或高缺失损失数据单元反映出的信息价值质量总和,以此作为数字资产估值和交易的需求匹配度和价值质量评判的依据。
1044、计算数据资产价值熵
数据资产A的价值熵的计算方法为数据资产与潜在用户的匹配度和数据资产信息量的乘积,即,{[1-|PI(Vdc(A))-WPI(Vdc(A))|/CI(Vdc(A))]*PI(Vdc(A))*WE(Vdc(A))+[1-|PI(VRdc(A))-WPI(VRdc(A))|/CI(VRdc(A))]*PI(VRdc(A))*WE(VRdc(A))+[1-|PI(Rdc(A))-WPI(Rdc(A))|/CI(Rdc(A))]*PI(Rdc(A))*WE(Rdc(A))+[1-|PI(RRdc(A))-WPI(RRdc(A))|/CI(RRdc(A))]*PI(RRdc(A))*WE(RRdc(A))+[1-|PI(Gdc(A))-WPI(Gdc(A))|/CI(Gdc(A))]PI(Gdc(A))*WE(Gdc(A))+[1-|PI(GRdc(A))-WPI(GRdc(A))|/CI(GRdc(A))]*PI(GRdc(A))*WE(Gdc(A))}/[num(Vdc(A))+num(VRdc(A))+num(Rdc(A))+num(RRdc(A))+num(Gdc(A))+num(GRdc(A))]。
可见,通过分析数据资产与潜在用户市场需求的匹配度,以及数据资产信息量高低的评估,计算数据资产价值熵,以此表达价值层面买家购买数据资产的概率,体现了数据资产估值的核心需求。
105、基于所述价值熵,对所述非定制化数据资产进行综合估值,得到所述非定制化数据资产的估值信息。
根据预设数据库中最近时间点的三次交易价格和价值熵,计算得到数据资产价格修正系数;
数据资产价格修正系数计算方法如下:
设当前时间的数据资产A的价值熵为Ve(A,T)(T为当前时间点),数据资产A的参考价格为VA(A,T),数据资产价格修正系数为Pc(A,T)。
当最近时间点的前三次时间点T1、T2、T3的交易价格分别为VA(A1,T1)、VA(A2,T2)、VA(A3,T3),前三次价值熵为Ve1(A1,T1)、Ve2(A2,T2)、Ve3(A3,T3),则根据数据资产价格公式可推导出前三次数据资产价格修正系数为Pc(A1,T1)、Pc(A2,T2)、Pc(A3,T3)。
数据资产价格修正系数为:
式中,A、T、P
C(A,T)分别表示定制化数据资产、交易时间、价格修正系数;A
1、T
1、P
C(A
1,T
1)分别表示定制化数据资产购买方历史交易中距T第一近时间交易的数据资产、交易时间、价格修正系数;A
2、T
2、P
C(A
2,T
2)分别表示定制化数据资产购买方历史交易中距T第二近时间交易的数据资产、交易时间、价格修正系数;A
3、T
3、P
C(A
3,T
3)分别表示定制化数据资产购买方历史交易中距T第三近时间交易的数据资产、交易时间、价格修正系数;Δt
1表示T与T
1之差,Δt
2表示T与T
2之差,Δt
3表示T与T
3之差,
表示P
C(A
1,T
1)、P
C(A
2,T
2)、P
C(A
3,T
3)的平均值;
可见,△t越小,当前时间与历史交易时间越接近,数据资产价格修正系数Pc(A,T)越接近1,表明参考价值越具有实际意义。
数据资产价值熵乘以所述数据资产价格修正系数,得出数据资产初级交易价格。
资产A的初级交易价格表示为VA(A,T)=Pc(A,T)*Ve(A,T)。
根据数据资产A匹配度范围,计算得出数据资产A价值熵范围。进一步地,计算得到数据资产A的潜在用户初级议价空间。
将数据资产交易模式潜在需求空间的最小值和最大值,作为数据信息分配交易需求带入需求匹配度公式,得到最小需求匹配度和最大需求匹配度;
将所述最小需求匹配度和和所述信息量相乘,得到最小价值熵;
将所述最大需求匹配度和和所述信息量相乘,得到最大价值熵;
将所述最小价值熵与所述价格修正系数相乘,得到所述非定制化数据资产最低初级参考交易价格;
将所述最大价值熵与所述价格修正系数相乘,得到所述非定制化数据资产最高初级参考交易价格;
将所述非定制化数据资产最低初级参考交易价格作为最低值、所述非定制化数据资产最高初级参考交易价格作为最高值,得到所述非定制化数据资产A的初级议价空间。
可见,根据数据资产市场需求匹配度,计算得出数据资产A价值熵,进而得出数据资产A的价格VA(A,T)为初级交易价格。根据数据资产交易模式潜在需求空间,计算得到所述非定制化数据资产A的初级议价空间。初级交易价格和初级议价空间为不考虑潜在用户异质性影响的参考交易价格。
由于非定制数据资产估值受潜在用户异质性影响较大。因此,对初级交易价格和初级议价空间根据潜在用户异质性进行调整。具体方法为:
根据数据资产多维度价值关联图谱,以及直接相关的历史交易数据资产的历史市场交易价格,计算得到其历史应用场景价格波动影响系数As[dc(A)]。根据直接相关的历史交易数据资产近M次市场交易价格VA(A,Mi),来进行历史应用场景价格波动影响系数As[dc(B)]的计算。
令△ti表示当前时间T与历史交易时间Ti的时间距离,n次历史交易数据资产时间权重计算公式为:
式中,Δt
i表示历史交易数据资产所述最近已成交数据资产价格信息集中第i个已成交数据资产的与当前时间T的时间距离;M表示所述最近已成交数据资产价格信息集中已成交数据资产的个数;
表示T
i的时间权重;
可见,直接相关资产历史交易时间距离当前时间越近,其越具有参考的价值。
计算历史应用场景价格波动影响系数As[dc(A)]。
所述历史应用场景价格波动影响系数计算公式为:
式中,As[dc(A)]表示非定制化数据资产A的价格波动影响系数;M表示所述最近已成交数据资产价格信息集中已成交数据资产的个数;
表示时间权重;VB(AM
i)表示所述最近已成交数据资产价格信息集中已成交数据资产AM
i的成交价格;
将非定制化数据资产A与直接相关的历史交易数据资产每个数据单元dc(AM)的关联价值关系值Cor(dc(AM)求取概率平均值
得到数据资产A与直接相关的历史交易数据资产的关联价值关系值Corr dc(AM)。
根据数据资产A与直接相关的历史交易数据资产的关联价值关系值,将历史应用场景价格波动影响系数As[dc(A)]和关联价值关系值Corr dc(AM)乘积,得到市场参考价格和市场议价空间均需要调整的市场因素影响系数Mf[dc(A)],所述市场因素影响系数计算方法为:
Mf[dc(A)]=As[dc(A)]×Corr dc(AM)
将非定制化数据资产A的初级交易价格VA(A,T)乘以市场因素影响系数Mf[dc(A)],得到数据资产A的最终参考交易价格。
将非定制化数据资产A的初级议价空间的最高值和最低值分别乘以市场因素影响系数Mf[dc(A)],得到数据资产A的最终议价空间。
可见,非定制化数据资产的估值结果信息在挖掘潜在用户不同需求的基础上,得到初级交易价格和初级议价空间;进一步地将市场因素影响计入估值,计算得到市场因素影响系数,得到最终参考交易价格和最终议价空间。本实施例为非定制化数字资产交易提供以潜在用户需求匹配和精准数据资产价值分析为基础的参考价格,并划定合理的数据资产市场参考价格和市场议价空间。
最后应说明的是:本发明实施例公开的一种非定制化数据资产估值方法所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。