CN110858368A - 一种数据评估服务价值确定系统和方法 - Google Patents
一种数据评估服务价值确定系统和方法 Download PDFInfo
- Publication number
- CN110858368A CN110858368A CN201810973523.2A CN201810973523A CN110858368A CN 110858368 A CN110858368 A CN 110858368A CN 201810973523 A CN201810973523 A CN 201810973523A CN 110858368 A CN110858368 A CN 110858368A
- Authority
- CN
- China
- Prior art keywords
- data
- value
- index
- level
- evaluated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011157 data evaluation Methods 0.000 title claims abstract description 84
- 238000000034 method Methods 0.000 title claims description 32
- 238000011156 evaluation Methods 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 12
- 230000001419 dependent effect Effects 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 208000026082 sterile multifocal osteomyelitis with periostitis and pustulosis Diseases 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
Landscapes
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种数据评估服务价值确定系统,该系统包括:第一确定模块,用于确定待评估数据的数据质量预测水平,依据确定的数据质量预测水平对应的第一历史数据,确定所述待评估数据的数据量调整参数;调整模块,用于利用所述数据量调整参数对所述待评估数据的数据量进行调整;第二确定模块,用于根据调整后的待评估数据的数据量,以及单位数据价值,确定对所述待评估数据进行价值评估的评估服务价值。
Description
技术领域
本申请涉及数据分析技术领域,具体而言,涉及一种数据评估服务价值确定系统和方法。
背景技术
在数字信息飞速发展的今天,数据对企业的影响日益增强,越来越多的企业需要“用数据说话”。对企业来说,无形资产占有的比重越来越大,除了专利、软件著作权、商标等知识产权等无形资产,业务数据这种无形资产的重要性不容小觑,业务数据的价值有时直接决定企业的价值。
现有技术中提供了业务数据的评估业务,用于实现对业务数据的价值进行评估。业务数据评估业务的提供者主要是资产评估机构;在进行业务数据评估时,待评估者需要与资产评估机构联系,双方当面沟通评估条件;在评估条件谈妥之后,待评估者将业务数据提供给资产评估机构,再由资产评估机构的资产评估专家按照一定的评估流程对业务数据进行评估。但是,现有技术中无法确定资产评估机构提供的数据评估服务的价值,也没有对种服务的价值进行确定的借鉴方法。
发明内容
有鉴于此,本申请的目的在于提供一种数据评估服务价值确定系统和方法,用于解决现有技术中的无法确定数据评估服务价值的问题。
第一方面,本申请实施例提供了一种数据评估服务价值确定系统,该系统包括:
第一确定模块,用于确定待评估数据的数据质量预测水平,依据确定的数据质量预测水平对应的第一历史数据,确定所述待评估数据的数据量调整参数;
调整模块,用于利用所述数据量调整参数对所述待评估数据的数据量进行调整;
第二确定模块,用于根据调整后的待评估数据的数据量,以及单位数据价值,确定对所述待评估数据进行价值评估的评估服务价值。
可选地,还包括:构建模块,所述构建模块用于:
构建数据评估指标体系;
将所述数据评估指标体系包含的指标作为自变量,将数据质量水平作为因变量,构建至少一个数据质量确定模型并训练,得到数据质量水平预测模型;
所述第一确定模块具体用于:
基于所述待评估数据,确定需要输入所述数据质量水平预测模型的自变量的值;
将确定的自变量的值输入到所述数据质量水平预测模型,得到所述待评估数据的数据质量预测水平。
可选地,所述第一确定模块具体用于:
根据所述待评估数据的所述数据质量预测水平,从第二历史数据中,确定与所述数据质量预测水平相同的第一历史数据;
确定所述第一历史数据的历史数据评估服务价值和单位历史数据价值;
基于确定的历史数据评估服务价值,以及所述单位历史数据价值,确定校正数据量;
基于所述校正数据量和所述待评估数据的数据量,确定所述待评估数据的数据量调整参数。
可选地,所述第一确定模块还用于:
基于第三历史数据,确定所述数据评估指标体系包含的指标的指标值和所述数据质量水平的值;
针对每个数据质量确定模型,将确定的所述数据评估指标体系包含的指标的指标值作为自变量的值,将确定的所述数据质量水平的值作为因变量的值,输入到该数据质量确定模型,对该数据质量确定模型进行训练,得到数据质量训练模型,以及用于衡量模型预测准确性的预设指标的指标值;
将表征预测准确性最高的指标值对应的数据质量训练模型作为最终确定的数据质量水平预测模型。
可选地,所述构建模块具体用于:
根据数据评估需求确定一级指标;
针对确定的上一级指标,执行如下操作,确定该一级指标的下级指标:
针对所述一级指标构建知识图谱;
根据构建的知识图谱确定所述上一级指标的下一级指标;
若确定的下一级指标为可量化指标,则将该下一级指标确定为最低级指标,完成数据评估指标体系的构建;
若确定的下一级指标为不可量化指标,则依据该下一级指标构建知识图谱,直至根据构建的知识图谱确定的下一级指标为可量化指标为止。
可选地,所述第二确定模块具体用于:
将所述调整后的待评估数据的数据量与所述单位数据价值的乘积作为对所述待评估数据进行价值评估的评估服务价值;或者,
计算所述调整后的待评估数据的数据量与所述单位数据价值的乘积,将该乘积与预设成本费用的和值作为对所述待评估数据进行价值评估的评估服务价值。
第二方面,本申请实施例提供了一种数据评估服务价值确定方法,该方法包括:
确定待评估数据的数据质量预测水平,依据确定的数据质量预测水平对应的第一历史数据,确定所述待评估数据的数据量调整参数;
利用所述数据量调整参数对所述待评估数据的数据量进行调整;
根据调整后的待评估数据的数据量,以及单位数据价值,确定对所述待评估数据进行价值评估的评估服务价值。
可选地,还包括:
构建数据评估指标体系;
将所述数据评估指标体系包含的指标作为自变量,将数据质量水平作为因变量,构建至少一个数据质量确定模型并训练,得到数据质量水平预测模型;
所述确定待评估数据的数据质量预测水平,包括:
基于所述待评估数据,确定需要输入所述数据质量水平预测模型的自变量的值;
将确定的自变量的值输入到所述数据质量水平预测模型,得到所述待评估数据的数据质量预测水平。
第三方面,本申请实施例提供了一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法的步骤。
本申请实施例提供的数据评估训练系统,第一确定模块在确定待评估数据的数据质量预测水平后,进一步确定待评估数据的数据量调整参数,利用数据量调整参数对待评估数据的数据量进行调整,根据调整后的待评估数据的数据量和单位数据价值,确定对待评估数据进行价值评估的评估服务价值。这样,本申请通过历史数据得到数据量调整参数,可以动态的对待评估数据的数量进行调整,在待评估数据的数据量较大时,通过数据量调整参数可以将待评估数据的数据量调小,在待评估数据的数据量较小时,通过数据量调整参数可以将将待评估数据的数据量调大,将待评估数据的数据量调整在合适的范围,使得确定的数据评估服务价值比较合理。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种数据评估服务价值确定系统的第一种结构示意图;
图2为本申请实施例提供的一种数据评估服务价值确定系统的第二种结构示意图;
图3为本申请实施例提供的一种数据评估服务价值确定方法的流程示意图;
图4为本申请实施例提供的一种计算机设备400的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种数据评估服务价值确定系统,如图1所示,该系统包括:
第一确定模块11,用于确定待评估数据的数据质量预测水平,依据确定的数据质量预测水平对应的第一历史数据,确定所述待评估数据的数据量调整参数;
调整模块12,用于利用所述数据量调整参数对所述待评估数据的数据量进行调整;
第二确定模块13,用于根据调整后的待评估数据的数据量,以及单位数据价值,确定对所述待评估数据进行价值评估的评估服务价值。
这里,待评估数据可以为需要确定数据评估服务价值的业务数据,待评估数据的获取方式包括多种,例如,从预设平台爬取的各预设领域的数据,预设平台包括企业网站、统计局、数据交易平台、纽扣平台等,预设领域可以为通信领域、互联网领域等,或者具有数据评估服务需求的数据源直接提供的待评估数据;数据质量预测水平表征预测的待评估数据的质量所处的水平等级;第一历史数据为通过多种方式获取的业务数据,如,从上述预设平台获取的第一历史数据等等,可参考待评估数据的获取方式;数据量调整参数用于对待评估数据的数据量进行调整,待评估数据的数据量越大,通过数据量调整参数调整后的数据量会变少,待评估数据的数据量越小,通过数据量调整参数调整后的数据量会变多;单位数据价值表征待评估数据中单位数据的价值,单位数据为待评估数据中的最小数据单位,例如,待评估数据为10行10列的数据,每个单元格的数据可以作为单位数据,单位数据价值即为一个单位格的数据的价值。
在具体实施中,可以通过构建并训练模型确定待评估数据的数据质量预测水平,在确定待评估数据的数据质量预测水平后,依据确定的数据质量预测水平,以及对应的第一历史数据,确定待评估数据的数据量调整参数,利用数据量调整参数对待评估数据的数据量进行调整,进一步利用调整后的待评估数据的数据量和单位数据价值,确定对待评估数据进行价值评估的评估服务价值。
第二确定模块13在确定评估服务价值时,将所述调整后的待评估数据的数据量与所述单位数据价值的乘积作为对所述待评估数据进行价值评估的评估服务价值;或者,
计算所述调整后的待评估数据的数据量与所述单位数据价值的乘积,将该乘积与预设成本费用的和值作为对所述待评估数据进行价值评估的评估服务价值。
这里,预设成本费用为预先设置的,该成本费用可以为对大数据进行分析得到的,也可以为根据数据量的多少确定的,本申请对此不予限制。
具体地,可以通过以下公式1或公式2计算待评估数据的评估服务价值。
P=S×OMPP (1)
其中,P为待评估数据的评估服务价值,S为调整后的待评估数据的数据量,OMPP为单位数据价值。
P=S×OMPP+DNC (2)
其中,P为待评估数据的评估服务价值,S为调整后的待评估数据的数据量,OMPP为单位数据价值,DNC为预设成分费用。
在具体实施中,可以根据待评估数据所属方的需求,确定使用公式1计算评估服务价值,还是使用公式2计算评估服务价值,若待评估数据的所属方需要提供评估细节报告,此时,通过公式2计算待评估数据的评估服务价值,预设成本费用为提供的评估细节报告的撰写费用等等,若待评估数据的所属方不需要提供评估细节报告,此时,可以通过公式1计算待评估数据的评估服务价值。
本申请实施例提供了另一中数据评估服务价值确定系统,如图2所示,该系统与图1中的系统相比,包括:构建模块14。
在预测待评估数据的数据质量预测水平之前,构建模块14用于:
构建数据评估指标体系;
将所述数据评估指标体系包含的指标作为自变量,将数据质量水平作为因变量,构建至少一个数据质量确定模型并训练,得到数据质量水平预测模型;
所述第一确定模块11具体用于:
基于所述待评估数据,确定需要输入所述数据质量水平预测模型的自变量的值;
将确定的自变量的值输入到所述数据质量水平预测模型,得到所述待评估数据的数据质量预测水平。
这里,数据评估指标体系包括多级指标,每级指标包括至少一个指标,该指标体系中的最低级指标一般为可量化指标,可量化指标表示指标可以通过对数据的分析从数据中确定出指标值,或者从数据的描述信息中提取出指标值;数值质量确定模型可以是但不限于线性回归模型、随机森林模型、极端随机森林回归模型、梯度提升回归模型等,本申请对此不予限制。
构建模块14在构建数据评估指标体系时,包括以下步骤:
根据数据评估需求确定一级指标;
针对确定的上一级指标,执行如下操作,确定该一级指标的下级指标:
针对所述一级指标构建知识图谱;
根据构建的知识图谱确定所述上一级指标的下一级指标;
若确定的下一级指标为可量化指标,则将该下一级指标确定为最低级指标,完成数据评估指标体系的构建;
若确定的下一级指标为不可量化指标,则依据该下一级指标构建知识图谱,直至根据构建的知识图谱确定的下一级指标为可量化指标为止。
这里,一级指标一般是根据数据评估需求从各预设平台获取的样本数据中确定的,一级指标可以是用于表征数据质量的指标,如,数据质量指标,一级指标包含的各指标表征的含义比较宽泛,不容易根据样本数据进行量化,也就是,难以根据样本数据确定一级指标的指标值,这些一级指标不容易进行量化,需要进一步基于一级指标和对应的知识图谱确定可进行量化的指标,直到确定出可量化的指标并将可量化的指标作为最低级指标,从而形成指标体系。
由于构建数据质量确定模型的指标不能随意选取,一般是建立在对指数深刻理解基础上建立的,因此,在构建指标体系时需要进行分层指标的建立,也就是建立多级指标,将一级指标作为最上一级指标,最上一级指标不容易进行量化,需要进一步基于一级指标确定该一级指标之后的多级指标。在实际应用中,可以根据实际情况确定需要确定指标的级数,目的为了保证最终构建的指标体系中的指标均为可量化指标。
知识图谱是基于语义分析构建的知识关系图,构建知识图谱的数据一般是与当前级的指标相关的相关数据(该数据也是从预设平台爬取的),指标体系中不同级指标对应的知识图谱不同,知识图谱中包括键与节点之间的对应关系,以及键与节点之间的关联度,每个键一般对应有至少一个节点,知识图谱中的键和节点可以均为关键词,节点对应的关键词与键对应的关键词是关联的关键词,构建知识图谱的方法在现有技术中已有详细的介绍,此处不再进行过多说明。
在根据构建的知识图谱确定当前上一级指标的下一级指标时,指标体构建模块14针对当前上一级指标中的每个指标,从知识图谱中筛选与该指标匹配的键对应的节点,基于筛选出的节点确定该指标的下一级指标。
由于筛选出的节点存在重复节点,因此,在根据筛选出的节点确定当前指标的下一级指标时,可以采用预设算法对筛选出的节点进行去冗余处理,将处理后得到的节点确定为该指标的下一级指标。这样,提高了确定出的指标的准确度。其中,预设算法包括主成分分析算法、聚类分析算法等,预设算法一般用于对确定出的每一级指标进行去冗余处理,对各级指标进行去冗余处理的过程在现有技术中已有详细的介绍,此处不再进行过多说明;也可以按照指标与节点的关联度由高到低进行排序,将排序靠前的前预设数目个节点作为下一级指标,预设数目一般为预先设置的。
例如,在一级指标为数据质量指标时,确定的一级指标的下一级指标,也即二级指标,可以为完整性指标、一直性指标、冗余度指标、时效性指标等等。
在得到二级指标后,若确定二级指标为可量化指标,则将该二级指标确定为最低级指标,完成指标体系的构建。若确定的二级指标是不可量化的指标,也就是二级指标依然比较宽泛,此时,需要将该二级指标确定为新的当前上一级指标,继续为新的当前上一级指标确定下一级指标。
在确定二级指标的下一级指标时,针对每个二级指标,从对应的知识图谱中确定与该二级指标匹配的键,在确定出与该二级指标匹配的键后,基于知识图谱中包括键与至少一个节点的对应关系,确定与确定出的匹配的键对应的至少一个节点,在从确定出的节点中确定下一级指标时,采用主成分分析算法或聚类分析算法对各节点进行冗余处理,也就是去除相同的节点,将去冗余处理后的节点作为二级指标的下一级指标,也就是三级指标。当然,也可以将筛选出的节点直接作为二级指标的下一级指标,可视实际情况而定。
例如,二级指标为完整性指标、一致性指标、冗余度指标、时效性指标时,三级指标可以为文档完整性指标、内容完整性指标、记录完整性指标、实际数据与元数据一直性指标、范式满足度指标、数据重复性指标、数据新鲜度指标、数据刷新频率指标等,其中,完整性指标对应文档完整性指标、内容完整性指标、记录完整性指标,一致性指标对应实际数据与元数据一直性指标,冗余度指标对应范式满足度指标、数据重复性指标,时效性指标对应数据新鲜度指标、数据刷新频率指标。
在得到三级指标后,若确定三级指标为可量化指标,则将该三级指标确定为最低级指标,完成指标体系的构建。若确定的三级指标是不可量化的指标,也就是三级指标不容易确定指标值,此时需要将该三级指标确定为新的当前上一级指标,继续为新的当前上一级指标确定下一级指标,在为新的当前上一级指标确定下一级指标的过程与为一级指标确定二级指标的过程相同,之后确定每级指标的过程不再进行过多说明,直到确定出的指标为可量化指标后,完成指标体系的构建。这样,得到的指标体系中的指标的数目和种类比较多,为后续构建数据评估模型提供良好的基础。
在构建完数据评估指标体系后,构建模块14将数据评估指标体系包含的指标作为自变量,将数据质量水平作为因变量,构建至少一个数据质量确定模型并训练。
第一确定模块11在对数据质量确定模型进行训练时,基于第三历史数据,确定所述数据评估指标体系包含的指标的指标值和所述数据质量水平的值;
针对每个数据质量确定模型,将确定的所述数据评估指标体系包含的指标的指标值作为自变量的值,将确定的所述数据质量水平的值作为因变量的值,输入到该数据质量确定模型,对该数据质量确定模型进行训练,得到数据质量训练模型,以及用于衡量模型预测准确性的预设指标的指标值;
将表征预测准确性最高的指标值对应的数据质量训练模型作为最终确定的数据质量水平预测模型。
这里,第三历史数据也是从预设平台获取的数据,可参考待评估数据的获取方式,第三历史数据可以与第一历史数据相同,也可以不同,本申请对此不与限制;若数据评估指标体系为多级指标,模型的自变量一般为数据评估指标体系中可以进行量化的指标,也就是,最下一级指标。
在具体实施中,在从第三历史数据中确定出数据评估指标体系中的最下一级指标的值后,针对每个数据质量确定模型,可以按照数据量对第三历史数据进行划分,得到多个第三数据集,将每个数据量对应的第三数据集确定出的指标的值和数据质量水平的值,输入到该数据质量确定模型进行训练;也可以按照数据质量水平对第三历史数据进行划分,得到多个第三数据集,将每个数据质量水平对应的第三数据集确定出的指标的值和数据质量水平的值,输入到该数据质量确定模型进行训练,对模型进行训练的方法在现有技术中已有详细的介绍,此处不再进行过多说明。
在完成对各个数据质量确定模型训练后,会得到多个数据质量训练模型,以及每个数据质量训练模型对应的能够衡量模型预测准确性的预设指标的指标值,该预设指标的指标值越大,则说明数据质量训练模型的预测准确度越高,因此,将预测准确性最高的指标值对应的数据质量训练模型作为进行预测的数据质量水平预测模型,这样,可以提高数据指令预测水平的准确度,进而可以使得得到数据量调整参数更具备应用价值。
在得到数据质量水平预测模型后,第一确定模块11根据所述待评估数据的所述数据质量预测水平,从第二历史数据中,确定与所述数据质量预测水平相同的第一历史数据;
确定所述第一历史数据的历史数据评估服务价值和单位历史数据价值;
基于确定的历史数据评估服务价值,以及所述单位历史数据价值,确定校正数据量;
基于所述校正数据量和所述待评估数据的数据量,确定所述待评估数据的数据量调整参数。
这里,第二历史数据的获取方式有多种,例如,可以为从预设平台获取的数据等,参考待评估数据的获取方式;第一历史数据为第二历史数据中的一部分数据。
在具体实施中,确定出待评估数据的数据质量预测水平后,从第二历史数据中,查找与数据质量预测水平处于同一水平等级的数据质量水平对应的第一历史数据,在确定出第一历史数据后,计算第一历史数据包含的各数据集的历史数据评估服务价值的平均值,将该平均值作为平均历史数据评估服务价值;
计算第一历史数据包含的各数据集的历史数据评估服务价值的和值与各数据集的数据量的和值的比值,将该比值作为单位历史数据价值;
计算上述平均历史数据评估服务价值与单位历史数据价值的比值,将该比值作为校正数据量;
将计算的校正数据量与待评估数据的数据量的比值作为数据量调整参数。
例如,待评估数据的数据质量预测水平为75%,该数据质量预测水平属于70%-80%的水平等级,从第二历史数据中,确定数据质量水平处于70%-80%的第一历史数据,第一历史数据包括100个数据集,,每个数据集对应有历史数据评估服务价值(该历史数据价值为去除掉预设成本费用后的价值),若计算的历史数据评估服务价值的平均值(平均历史数据评估服务价值)为10000,单位历史数据价值为100,计算平均历史数据评估服务价值10000与单位历史数据价值100的比值为100,也就是校正数据量,若待评估数据的数据量为200,计算校正数据量100与待评估数据的数据量200的比值为0.5,最终得到数据量调整参数。
在得到数据量调整参数后,调整模块12计算所述数据量调整参数和所述待评估数据的数据量的乘积,将该乘积作为调整后的待评估数据的数据量,通过上文的公式1或公式2确定待评估数据的数据评估服务价值。
本申请实施例提供给了一种数据评估服务价值确定方法,如图3所示,该方法包括以下步骤:
S301,确定待评估数据的数据质量预测水平,依据确定的数据质量预测水平对应的第一历史数据,确定所述待评估数据的数据量调整参数;
S302,利用所述数据量调整参数对所述待评估数据的数据量进行调整;
S303,根据调整后的待评估数据的数据量,以及单位数据价值,确定对所述待评估数据进行价值评估的评估服务价值。
可选地,该方法还包括:
构建数据评估指标体系;
将所述数据评估指标体系包含的指标作为自变量,将数据质量水平作为因变量,构建至少一个数据质量确定模型并训练,得到数据质量水平预测模型;
所述确定待评估数据的数据质量预测水平,包括:
基于所述待评估数据,确定需要输入所述数据质量水平预测模型的自变量的值;
将确定的自变量的值输入到所述数据质量水平预测模型,得到所述待评估数据的数据质量预测水平。
可选地,确定所述待评估数据的数据量调整参数,包括:
根据所述待评估数据的所述数据质量预测水平,从第二历史数据中,确定与所述数据质量预测水平相同的第一历史数据;
确定所述第一历史数据的历史数据评估服务价值和单位历史数据价值;
基于确定的历史数据评估服务价值,以及所述单位历史数据价值,确定校正数据量;
基于所述校正数据量和所述待评估数据的数据量,确定所述待评估数据的数据量调整参数。
可选地,所述将确定的自变量的值输入到所述数据质量水平预测模型,得到所述待评估数据的数据质量预测水平,包括:
基于第三历史数据,确定所述数据评估指标体系包含的指标的指标值和所述数据质量水平的值;
针对每个数据质量确定模型,将确定的所述数据评估指标体系包含的指标的指标值作为自变量的值,将确定的所述数据质量水平的值作为因变量的值,输入到该数据质量确定模型,对该数据质量确定模型进行训练,得到数据质量训练模型,以及用于衡量模型预测准确性的预设指标的指标值;
将表征预测准确性最高的指标值对应的数据质量训练模型作为最终确定的数据质量水平预测模型。
可选地,构建数据评估指标体系,包括:
根据数据评估需求确定一级指标;
针对确定的上一级指标,执行如下操作,确定该一级指标的下级指标:
针对所述一级指标构建知识图谱;
根据构建的知识图谱确定所述上一级指标的下一级指标;
若确定的下一级指标为可量化指标,则将该下一级指标确定为最低级指标,完成数据评估指标体系的构建;
若确定的下一级指标为不可量化指标,则依据该下一级指标构建知识图谱,直至根据构建的知识图谱确定的下一级指标为可量化指标为止。
可选地,根据调整后的待评估数据的数据量,以及单位数据价值,确定对所述待评估数据进行价值评估的评估服务价值,包括:
将所述调整后的待评估数据的数据量与所述单位数据价值的乘积作为对所述待评估数据进行价值评估的评估服务价值;或者,
计算所述调整后的待评估数据的数据量与所述单位数据价值的乘积,将该乘积与预设成本费用的和值作为对所述待评估数据进行价值评估的评估服务价值。
对应于图3中的数据评估服务价值确定方法,本申请实施例还提供了一种计算机设备400,如图4所示,该设备包括存储器401、处理器402及存储在该存储器401上并可在该处理器402上运行的计算机程序,其中,上述处理器402执行上述计算机程序时实现上述数据评估服务价值确定方法。
具体地,上述存储器401和处理器402能够为通用的存储器和处理器,这里不做具体限定,当处理器402运行存储器401存储的计算机程序时,能够执行上述数据评估服务价值确定方法,解决了现有技术中无法确定数据评估服务价值的问题,本申请第一确定模块在确定待评估数据的数据质量预测水平后,进一步确定待评估数据的数据量调整参数,利用数据量调整参数对待评估数据的数据量进行调整,根据调整后的待评估数据的数据量和单位数据价值,确定对待评估数据进行价值评估的评估服务价值。这样,本申请通过历史数据得到数据量调整参数,可以动态的对待评估数据的数量进行调整,在待评估数据的数据量较大时,通过数据量调整参数可以将待评估数据的数据量调小,在待评估数据的数据量较小时,通过数据量调整参数可以将将待评估数据的数据量调大,将待评估数据的数据量调整在合适的范围,使得确定的数据评估服务价值比较合理。
对应于图3中的数据评估服务价值确定方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述数据评估服务价值确定方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述数据评估服务价值确定方法,解决了现有技术中无法确定数据评估服务价值的问题,本申请第一确定模块在确定待评估数据的数据质量预测水平后,进一步确定待评估数据的数据量调整参数,利用数据量调整参数对待评估数据的数据量进行调整,根据调整后的待评估数据的数据量和单位数据价值,确定对待评估数据进行价值评估的评估服务价值。这样,本申请通过历史数据得到数据量调整参数,可以动态的对待评估数据的数量进行调整,在待评估数据的数据量较大时,通过数据量调整参数可以将待评估数据的数据量调小,在待评估数据的数据量较小时,通过数据量调整参数可以将将待评估数据的数据量调大,将待评估数据的数据量调整在合适的范围,使得确定的数据评估服务价值比较合理。
在本申请所提供的实施例中,应该理解到,所揭露系统和方法,可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种数据评估服务价值确定系统,其特征在于,该系统包括:
第一确定模块,用于确定待评估数据的数据质量预测水平,依据确定的数据质量预测水平对应的第一历史数据,确定所述待评估数据的数据量调整参数;
调整模块,用于利用所述数据量调整参数对所述待评估数据的数据量进行调整;
第二确定模块,用于根据调整后的待评估数据的数据量,以及单位数据价值,确定对所述待评估数据进行价值评估的评估服务价值。
2.如权利要求1所述的系统,其特征在于,还包括:构建模块,所述构建模块用于:
构建数据评估指标体系;
将所述数据评估指标体系包含的指标作为自变量,将数据质量水平作为因变量,构建至少一个数据质量确定模型并训练,得到数据质量水平预测模型;
所述第一确定模块具体用于:
基于所述待评估数据,确定需要输入所述数据质量水平预测模型的自变量的值;
将确定的自变量的值输入到所述数据质量水平预测模型,得到所述待评估数据的数据质量预测水平。
3.如权利要求2所述的系统,其特征在于,所述第一确定模块具体用于:
根据所述待评估数据的所述数据质量预测水平,从第二历史数据中,确定与所述数据质量预测水平相同的第一历史数据;
确定所述第一历史数据的历史数据评估服务价值和单位历史数据价值;
基于确定的历史数据评估服务价值,以及所述单位历史数据价值,确定校正数据量;
基于所述校正数据量和所述待评估数据的数据量,确定所述待评估数据的数据量调整参数。
4.如权利要求2所述的系统,其特征在于,所述第一确定模块还用于:
基于第三历史数据,确定所述数据评估指标体系包含的指标的指标值和所述数据质量水平的值;
针对每个数据质量确定模型,将确定的所述数据评估指标体系包含的指标的指标值作为自变量的值,将确定的所述数据质量水平的值作为因变量的值,输入到该数据质量确定模型,对该数据质量确定模型进行训练,得到数据质量训练模型,以及用于衡量模型预测准确性的预设指标的指标值;
将表征预测准确性最高的指标值对应的数据质量训练模型作为最终确定的数据质量水平预测模型。
5.如权利要求2所述的系统,其特征在于,所述构建模块具体用于:
根据数据评估需求确定一级指标;
针对确定的上一级指标,执行如下操作,确定该一级指标的下级指标:
针对所述一级指标构建知识图谱;
根据构建的知识图谱确定所述上一级指标的下一级指标;
若确定的下一级指标为可量化指标,则将该下一级指标确定为最低级指标,完成数据评估指标体系的构建;
若确定的下一级指标为不可量化指标,则依据该下一级指标构建知识图谱,直至根据构建的知识图谱确定的下一级指标为可量化指标为止。
6.如权利要求1所述的系统,其特征在于,所述第二确定模块具体用于:
将所述调整后的待评估数据的数据量与所述单位数据价值的乘积作为对所述待评估数据进行价值评估的评估服务价值;或者,
计算所述调整后的待评估数据的数据量与所述单位数据价值的乘积,将该乘积与预设成本费用的和值作为对所述待评估数据进行价值评估的评估服务价值。
7.一种数据评估服务价值确定方法,其特征在于,该方法包括:
确定待评估数据的数据质量预测水平,依据确定的数据质量预测水平对应的第一历史数据,确定所述待评估数据的数据量调整参数;
利用所述数据量调整参数对所述待评估数据的数据量进行调整;
根据调整后的待评估数据的数据量,以及单位数据价值,确定对所述待评估数据进行价值评估的评估服务价值。
8.如权利要求1所述的方法,其特征在于,还包括:
构建数据评估指标体系;
将所述数据评估指标体系包含的指标作为自变量,将数据质量水平作为因变量,构建至少一个数据质量确定模型并训练,得到数据质量水平预测模型;
所述确定待评估数据的数据质量预测水平,包括:
基于所述待评估数据,确定需要输入所述数据质量水平预测模型的自变量的值;
将确定的自变量的值输入到所述数据质量水平预测模型,得到所述待评估数据的数据质量预测水平。
9.一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求7或8所述的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求7或8所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810973523.2A CN110858368A (zh) | 2018-08-24 | 2018-08-24 | 一种数据评估服务价值确定系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810973523.2A CN110858368A (zh) | 2018-08-24 | 2018-08-24 | 一种数据评估服务价值确定系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110858368A true CN110858368A (zh) | 2020-03-03 |
Family
ID=69636341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810973523.2A Pending CN110858368A (zh) | 2018-08-24 | 2018-08-24 | 一种数据评估服务价值确定系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110858368A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819608A (zh) * | 2021-02-05 | 2021-05-18 | 建信金融科技有限责任公司 | 一种基于多元回归与时间序列的区域信贷预测方法及系统 |
CN113128911A (zh) * | 2021-05-12 | 2021-07-16 | 北京大学 | 数据资源价值的在线评估方法及装置 |
CN113129178A (zh) * | 2021-05-12 | 2021-07-16 | 北京大学 | 知识产权服务价值在线评估方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355447A (zh) * | 2016-08-31 | 2017-01-25 | 国信优易数据有限公司 | 一种数据商品的价格评估方法及系统 |
CN106709760A (zh) * | 2016-12-21 | 2017-05-24 | 上海数据交易中心有限公司 | 一种基于单一数据的数据价格评估方法及装置 |
US20170161658A1 (en) * | 2015-12-02 | 2017-06-08 | Innerworkings, Inc. | Systems and Methods for Displaying Supplier Evaluation Data |
CN107315775A (zh) * | 2017-05-27 | 2017-11-03 | 国信优易数据有限公司 | 一种指数计算平台和方法 |
CN107491381A (zh) * | 2017-07-04 | 2017-12-19 | 广西电网有限责任公司电力科学研究院 | 一种设备状态监测数据质量评测系统 |
-
2018
- 2018-08-24 CN CN201810973523.2A patent/CN110858368A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170161658A1 (en) * | 2015-12-02 | 2017-06-08 | Innerworkings, Inc. | Systems and Methods for Displaying Supplier Evaluation Data |
CN106355447A (zh) * | 2016-08-31 | 2017-01-25 | 国信优易数据有限公司 | 一种数据商品的价格评估方法及系统 |
CN106709760A (zh) * | 2016-12-21 | 2017-05-24 | 上海数据交易中心有限公司 | 一种基于单一数据的数据价格评估方法及装置 |
CN107315775A (zh) * | 2017-05-27 | 2017-11-03 | 国信优易数据有限公司 | 一种指数计算平台和方法 |
CN107491381A (zh) * | 2017-07-04 | 2017-12-19 | 广西电网有限责任公司电力科学研究院 | 一种设备状态监测数据质量评测系统 |
Non-Patent Citations (2)
Title |
---|
余晓平等: "数据仓库建设中数据处理技术的研究", 《电脑知识与技术》, no. 36, 25 December 2008 (2008-12-25), pages 20 - 21 * |
张影,李胜朋,谭建国等编著: "资源系统工程", 天津:天津大学出版社, pages: 198 - 200 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819608A (zh) * | 2021-02-05 | 2021-05-18 | 建信金融科技有限责任公司 | 一种基于多元回归与时间序列的区域信贷预测方法及系统 |
CN113128911A (zh) * | 2021-05-12 | 2021-07-16 | 北京大学 | 数据资源价值的在线评估方法及装置 |
CN113129178A (zh) * | 2021-05-12 | 2021-07-16 | 北京大学 | 知识产权服务价值在线评估方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106951984B (zh) | 一种系统健康度动态分析预测方法及装置 | |
EP3186754B1 (en) | Customizable machine learning models | |
Ampatzoglou et al. | A framework for managing interest in technical debt: an industrial validation | |
CN106886481B (zh) | 一种系统健康度静态分析预测方法及装置 | |
Azzeh | A replicated assessment and comparison of adaptation techniques for analogy-based effort estimation | |
Seo et al. | On the value of outlier elimination on software effort estimation research | |
Hotz et al. | Balancing data privacy and usability in the federal statistical system | |
CN107168995B (zh) | 一种数据处理方法及服务器 | |
CN103440242A (zh) | 一种基于用户搜索行为的个性化推荐方法和系统 | |
CN104679646B (zh) | 一种用于检测sql代码缺陷的方法和装置 | |
CN110858368A (zh) | 一种数据评估服务价值确定系统和方法 | |
Mongwe et al. | Bayesian inference of local government audit outcomes | |
Schecter et al. | The power, accuracy, and precision of the relational event model | |
Pandey et al. | Association rules network: Definition and applications | |
US20060248096A1 (en) | Early detection and warning systems and methods | |
Lander et al. | Bayesian assessment of Lorenz and stochastic dominance | |
Lee et al. | An entropy decision model for selection of enterprise resource planning system | |
TWM577148U (zh) | 評估金融風險的電子裝置 | |
CN113554350A (zh) | 活跃度评估方法、装置、电子设备及计算机可读存储介质 | |
CN110858343A (zh) | 一种数据资产价值评估系统以及方法 | |
US9667514B1 (en) | Electronic discovery system with statistical sampling | |
CN116010216A (zh) | 数据资产健康度的评估方法、装置、设备及存储介质 | |
Schütt | What Can Bayesian Inference Do for Accounting Research? | |
CN115204501A (zh) | 企业评估方法、装置、计算机设备和存储介质 | |
Nicoletti et al. | Towards software architecture documents matching stakeholders’ interests |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 101-8, 1st floor, building 31, area 1, 188 South Fourth Ring Road West, Fengtai District, Beijing Applicant after: Guoxin Youyi Data Co.,Ltd. Address before: 100070, No. 188, building 31, headquarters square, South Fourth Ring Road West, Fengtai District, Beijing Applicant before: SIC YOUE DATA Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200303 |
|
RJ01 | Rejection of invention patent application after publication |