CN110766428A - 一种数据价值评估系统以及方法 - Google Patents
一种数据价值评估系统以及方法 Download PDFInfo
- Publication number
- CN110766428A CN110766428A CN201810829759.9A CN201810829759A CN110766428A CN 110766428 A CN110766428 A CN 110766428A CN 201810829759 A CN201810829759 A CN 201810829759A CN 110766428 A CN110766428 A CN 110766428A
- Authority
- CN
- China
- Prior art keywords
- data
- index
- evaluated
- value
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 130
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013210 evaluation model Methods 0.000 claims abstract description 38
- 238000012512 characterization method Methods 0.000 claims abstract description 24
- 238000013479 data entry Methods 0.000 claims description 70
- 238000012549 training Methods 0.000 claims description 37
- 230000001419 dependent effect Effects 0.000 claims description 10
- 230000003321 amplification Effects 0.000 claims description 9
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 9
- 230000009193 crawling Effects 0.000 claims description 8
- 238000011157 data evaluation Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012854 evaluation process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000013077 scoring method Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000011000 absolute method Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
Landscapes
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种数据价值评估系统以及方法,其中数据价值评估系统包括:数据获取模块,用于获取待评估数据;指标值确定模块,用于为所述待评估数据确定价值评估指标的指标值;其中,所述价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;价值评估模块,用于将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值。该数据价值评估系统在对对数据价值的估价过程中受到人为主观因素影响小,能够较为客观、准确的得到业务数据的估价结果。
Description
技术领域
本申请涉及数据估价技术领域,具体而言,涉及一种数据价值评估系统以及方法。
背景技术
在数字信息飞速发展的今天,数据对企业的影响日益增强,越来越多的企业需要“用数据说话”。对企业来说,无形资产占有的比重越来越大,除了专利、软件著作权、商标等知识产权等无形资产,业务数据这种无形资产的重要性不容小觑。业务数据的价值有时直接决定企业的价值。
数据在交易之前,无论是数据的出售方还是数据的购买方,都会按照一定的方法对待交易数据进行定价。但是目前的数据价值评估方法由人为参与的因素较多;例如数据的购买方可能会由于数据对其的重要程度,过高的对数据进行估价;或者数据的出售方会由于各种人为的原因对数据进行错误的估价。这就造成数据的定价结果不够客观、准确,影响数据交易双方的利益。
发明内容
有鉴于此,本申请实施例的目的在于提供一种数据价值评估系统以及方法,在对数据估价过程中受到人为主观因素影响小,能够较为客观、准确的得到业务数据的估价结果。
第一方面,本申请实施例提供了一种数据价值评估系统,该系统包括:
数据获取模块,用于获取待评估数据;
指标值确定模块,用于为所述待评估数据确定价值评估指标的指标值;
其中,所述价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;
价值评估模块,用于将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值。
第二方面,本申请实施例还提供一种数据价值评估方法,该方法包括:
获取待评估数据;
为所述待评估数据确定价值评估指标的指标值;
其中,所述价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;
将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值。
本申请实施例通过获取待评估数据,为所述待评估数据确定价值评估指标的指标值,然后将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值,其中价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;在这个过程中所使用的表征数据自身价值的指标、表征数据市场影响因素的指标以及表征市场竞争影响因素的指标,能够更加客观的反应待评估数据的价值,并且整个过程不需要人为的干预,就能够更加客观、准确的确定业务数据的质量。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种数据价值评估系统的结构示意图;
图2示出了本申请实施例所提供的另一种数据价值评估系统的结构示意图;
图3示出了本申请实施例所提供的一种数据价值评估方法的流程图;
图4示出了本申请实施例所提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
与现有技术不同,本申请实施例在对业务数据进行数据价值评估时,通过数据获取模块获取业务数据(本申请实施例中待评估数据),通过指标值确定模块为待评估数据确定价值评估指标的指标值,然后通过价值评估模块将确定的价值评估指标的指标值输入至预先构建的数据价值评估模型中,得到业务数据的评估价值,全程不需要人为的干预,就能够更加客观、准确的确定业务数据的价值。
同时,由于不需要人为的干预,减少了业务数据与人接触的可能,从而降低了业务数据被人为泄露的可能性,增加业务数据在估价过程中的安全性。
为便于对本实施例进行理解,首先对本申请实施例所公开的数据价值评估系统进行详细介绍。需要注意的是,该数据价值评估系统除了能够确定业务数据的价值,也能够确定其他数据,例如试验数据、住宅数据等的价值。下面以待评估数据为业务数据为例,对本申请技术方案加以说明。
参见图1所示,本申请实施例所提供的数据价值评估系统包括:数据获取模块10、指标值确定模块20以及价值评估模块30。
I:数据获取模块10,用于获取待评估数据。
这里,待评估数据是要进行数据价值评估的业务数据。待评估数据可以通过多种方式获取,例如从预设平台爬取的业务数据,预设平台包括企业网站、统计局、数据交易平台、纽扣平台等;或者具有数据估价需求的数据来源直接提供的待评估数据。
较佳地,本申请实施例每次实施的对象可以为一类数据,如果该类数据包括多个数据集,那么本申请实施例的数据价值评估对象可以为每次一个数据集。
II:指标值确定模块20,用于为所述待评估数据确定价值评估指标的指标值。
其中,所述价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标。
在具体实现的时候:
A:表征数据自身价值的指标包括:数据一致性指标、数据完整性指标、数据冗余度指标、数据时效性指标、数据量指标、数据领域分类指标、应用场景指标、以及权益性质指标中一种或多种。
本申请实施例中指标值确定模块20具体用于根据下述1-8的方法确定待评估数据在各表征数据自身价值的指标下的指标值。
1,针对所述表征数据自身价值的指标包括数据一致性指标的情况,所述待评估数据包括:数据内容以及所述待评估数据对应的描述信息;
所述指标值确定模块20,具体用于确定所述待评估数据所包含数据内容与所述待评估数据对应描述信息的一致性程度;并基于所述一致性程度确定所述待评估数据在数据一致性指标下的指标值,且所述一致性程度越高,表征所述待评估数据在数据一致性指标下的指标值越高;
在具体实现的时候,可以通过确定如下一项或多项数据内容与对应描述信息之间的一致性程度,来表征待评估数据的数据内容和描述信息的一致性程度,其中,任一项数据内容与对应描述信息之间的一致性程度越高表征所述待评估数据的数据一致性指标的指标值越高。
其一:所述待评估数据包含的数据量与所述待评估数据的描述信息所描述的数据量。
此处,待评估数据的数据内容被承载在某格式的文件中;待评估数据可以由多条数据条目构成,每条数据条目均由多个数据元构成;其中,数据元是构成待评估数据的最基本数据单位。
例如待评估数据为商品价格数据时,一条待评估数据包括的数据元依次为:商品名称、商品生产商、产地、生产时间、保质期、净含量、营养成分、生产批号、售卖时间。
也就是说待评估数据较佳地是数据条目构成的数据表形式,针对具有估价需求的数据为非数据表的情况,可以在进行估价之前事先进行文本数据关键信息提取操作,生成数据条目形式的数据表。例如:具有估价需求的数据为商品介绍文本,可以在估价之前按照商品名称、商品生产商、产地、生产时间等关键字提取成数据条目的形式,将提取的数据条目作为待评估数据。
待评估数据所包含的数据量,即为待评估数据包含的有效数据元的数据量,例如,在上述示例中,一条完整的数据条目包括的数据元的数量应当为九项,则每条数据条目对应的数据量为9;若待评估数据包括100条数据条目,则其所应当具备的数据量应当为900,也即,描述信息所描述的数据量为900;但是实际中,可能存在某些数据元为空,为空的数据元没有实际内容,造成了待评估数据的实际数据量少于描述数据量。
以数据条目的数量为例,这里也可以比较待评估数据包含的数据条目数量与所述待评估数据的描述信息所描述的数据条目数量。
因此可以通过确定待评估数据包含的数据量与所述待评估数据的描述信息所描述的数据量的一致性程度来表征待评估数据的数据内容和描述信息的一致性程度。
其二:所述待评估数据的大小与所述待评估数据的描述信息所述描述的大小。
此处,待评估数据的大小,实际上可以看作是承载待评估数据的文件的文件大小。例如,某条数据条目的数据元缺失(即数据元为空)也会造成承载待评估数据的文件数据的真实文件大小和描述信息中描述的大小不一致。
因此可以通过确定待评估数据的大小与所述待评估数据的描述信息所述描述的大小的一致性程度来表征待评估数据的数据内容和描述信息的一致性程度。
其三:所述待评估数据的数据格式与所述待评估数据的描述信息所描述的数据格式。
此处,待评估数据的数据格式,可以是承载待评估数据的文件的文件格式。承载待评估数据的文件格式可能与描述信息所描述的文件格式不同。
因此可以通过确定待评估数据的数据格式与所述待评估数据的描述信息所述描述的数据格式的一致性程度来表征待评估数据的数据内容和描述信息的一致性程度。
需要注意的是,待评估数据所包含的数据内容可以是但不必限于数据量、大小和数据格式等;待评估数据对应的描述信息一般是用于描述待评估数据的数据,待评估数据对应的描述信息也包含有数据量、大小和数据格式等内容。
具体地,本申请实施例提供一种基于数据量、数据大小和数据格式中任意方面的一致性程度,来确定待评估数据在数据一致性指标下的指标值的具体方法:
计算待评估数据包含的数据量与待评估数据的描述信息所描述的数据量的第一差值绝对值,计算待评估数据的大小与待评估数据的描述信息的大小的第二差值绝对值,若待评估数据的数据格式与待评估数据的描述信息所描述的数据格式一致,则确定待评估数据的一致度为第一预设值,否则,为第二预设值,根据第一差值绝对值、第二差值绝对值和一致度,计算数据一致性指标的指标值。
此处,可将第一预设值设为0,第二预设值设为1。可选地,还可以将第一预设值和第二预设值设置为其他数值,满足第二预设值的数值大于第一预设值的数值即可。
具体地,第一差值绝对值L1满足:L1=|La-Lm|;
其中,La为待评估数据所包含的数据量,Lm为待评估数据的描述信息所包含的数据量。
第二差值绝对值L2满足:L2=|Sa-Sm|;
其中,Sa为待评估数据的大小,Sm为待评估数据的描述信息的大小。
则待评估数据在数据一致性指标下的指标值ω1满足:
α为计算系数,可取0-1之间的值,例如取1/3、1/4、1/2等。
ω1取值范围一般为[0,1],ω1值越大,说明待评估数据的一致性程度越高。
2、针对所述表征数据自身价值的指标包括数据完整性指标的情况,
所述指标值确定模块20,具体用于确定所述待评估数据所包含数据条目中的空值占比;并基于所述空值占比确定所述待评估数据在数据完整性指标下的指标值,且所述空值占比越低,表征所述待评估数据的数据完整性越高.
在具体实现的时候,待评估数据的数据可能存在缺失的情况。在此情况下,缺失的数据越多,则待评估数据的完整性越差。
指标值确定模块20在确定所述待评估数据所包含数据条目中的空值占比时:依次检测待评估数据中各个数据条目中的数据元是否为空;根据检测结果,对每个数据元进行完整性赋值,获得每个数据元的完整性值,且数据元若为空,则对应的完整性值为0;数据元不为空,则对应的完整性值为1;将所有数据元的完整性值的和,与数据元数量的比值,作为空值占比。
可以直接将该空值占比作为待评估数据在数据完整性指标下的指标值,例如:
采用如下公式计算待评估数据在数据完整性指标下的指标值ω2:
其中,ai为待评估数据中的第i个数据元的完整性值,N为待评估数据中的数据元的总数。针对数据为表格形式的情况,还可以将ai表示为aij,即第i行第j列的数据元aij,其中,i和j取值范围均为从1到N。
ω2的取值范围为[0,1],ω2值越大,表示待评估数据的数据完整性越好。
还可以基于待评估数据在数据完整性指标下的指标值和空值占比之间的正相关性关系,来基于空值占比确定待评估数据在数据完整性指标下的指标值。
此外,指标值确定模块20在确定待评估数据所包括数据条目中的空值占比时,还可以采用下述步骤:统计待评估数据中所有数据条目中为空的数据元的总数量;将所有数据条目中为空的数据元的总数量,和待评估数据中所有数据元的总数量的比值,作为空值占比。
进一步地,空值占比还可以为待评估数据中无效数据条目在数据条目总数中的占比。存在预设数量空数据元的数据条目可以确定为无效数据条目。ω2为无效数据条目与数据条目总数的商。
3、针对所述定价指标包括数据时效性指标的情况,
所述指标值确定模块20,具体用于确定所述待评估数据开始产生时间终止产生时间之间所跨越的时间区间,以及所述待评估数据开始产生时间与所述待评估数据提供时间之间的时间差;基于所述时间区间和所述时间差确定所述待评估数据在数据时效性指标下的指标值;其中,所述时间区间跨度越大,表征所述待评估数据在数据时效性指标下的指标值越高;以及所述时间差越小,表征所述待评估数据在数据时效性指标下的指标值越高。
其中,所述时间区间跨度越大,表征所述待评估数据的数据时效性指标的指标值越高;以及所述时间差越小,表征所述待评估数据的数据时效性指标的指标值越高。
在具体实现的时候,待评估数据产生时间所跨越的时间区间,为待评估数据开始产生时间,到待评估数据终止产生时间之间,所跨越的时间区间。时间区间的单位要根据该时间区间的长度进行具体设定。
特殊地,当无法确定待评估数据的开始产生时间和终止产生时间时,可以通过待评估数据的描述信息确定;产生时间可以为待评估数据跨越的时间区间中的起始时间、最终时间,也可以为平均时间,较佳地为起始时间。
例如,若该时间区间的长度为1天,则将时间区间的单位设置为分钟;若时间区间的长度为2个月,则将时间区间的单位设置为天;若该时间区间的长度为3年,则可以将时间区间的单位这是为周。需要注意的是,上述设定时间区间的单位仅仅为本申请实施例所提供的示例,不能将其当作是对本申请技术方案的限定。
数据提供时间,是指数据价值评估系统的数据获取模块10获取待评估数据的时间。这里需要注意的是,由于待评估数据具有一定的数据量,数据获取模块实际上是无法在某一个时间点从无到有的获取全部的待评估数据,因此,该数据提供时间可以是数据获取模块10获取待评估数据的起始时间,也可以是数据获取模块10获取待评估数据的终止时间;另外,由于数据获取模块10在获取了待评估数据之后,会在很短的时间内将待评估数据传输给指标确定模块20进行处理,数据获取模块10获取待评估数据的起始时间或者终止时间距离定价模块20对其确定在时效性指标下的指标值的当前时间的时间差是很小的,因此还可以将定价模块20对待评估数据确定其在时效性指标下的指标值的当前时间作为数据提供时间。
例如,在待评估数据中包括100条数据条目;100条数据条目中,产生最早的数据条目的产生时间(也即待评估数据开始产生时间)为2018年3月15日;产生时间最晚的数据条目的产生时间(也即待评估数据终止产生时间)为2018年4月17日;则待评估数据产生时间所跨越的时间区间为33天。若待评估数据提供时间为2018年5月10日,则待评估数据产生时间和待评估数据提供时间之间的时间差,即为2018年3月15日,至2018年5月10日之间的时间差。
在基于所述时间区间以及所述时间差确定所述待评估数据在数据时效性指标下的指标值的时候,可以将时间区间和时间差的比值作为待评估数据在时效性指标下的指标值。
例如,可以采用如下公式计算待评估数据在时效性指标下的指标值ω3:
Tf为待评估数据终止产生时间,若待评估数据无法确定最终时间,则使用待评估数据对应的描述信息的最终时间;Ts为待评估数据开始产生时间,若待评估数据无法确定开始产生时间,则使用待评估数据对应的描述信息的开始产生时间;Tn待评估数据的提供时间。
ω3取值范围为[0,1],ω3取值越大,表示待评估数据的时效性越强。
4、针对所述表征数据自身价值的指标包括数据冗余度指标的情况,
所述指标值确定模块20,具体用于确定所述待评估数据所包含的数据条目中重复条目的占比;并基于所述重复条目的占比确定所述待评估数据在数据冗余度指标下的指标值,且所述重复条目的占比越低,表征所述待评估数据的数据冗余度越低。
在具体实现的时候,数据冗余度是计算重复数据出现的比率。在一个数据集合中,重复的数据成为数据冗余,信息冗余度越高,数据质量越低。
具体地,指标值确定模块20可以采用下述方式中任意一种确定待评估数据在数据冗余度指标下的指标值:
其一:根据每条数据条目包括的数据元,统计所述待评估数据中每条数据条目重复出现的次数;根据所述待评估数据中所有数据条目重复出现的次数,以及所述数据条目的总条数,确定所述数据条目重复出现的比率,也即重复条目出现的比率;也即所待评估数据所包含的数据条目中重复条目的占比。基于所述数据条目重复出现的比率,计算所述待评估数据在所述信息冗余度指标下的定价值;其中,所述待评估数据在所述信息冗余度指标下的定价值与所述数据条目重复出现的比率成负相关性。
此处,在统计所述待评估数据中每条数据条目重复出现的次数时,要按照数据条目的排布顺序,依次检测每条数据条目在前边是否出现过;其中,两条相同的数据条目中数据元的内容完全一致,或者内容一致或者相似的数据元数量达到预设阈值。假设检测到第i条数据条目的时候,该第i条数据条目是第一次出现,则统计数量不变;若该第i条数据条目并非第一出现,则将统计数量加1。
其二:指标值确定模块20依次检测待评估数据中各个数据条目中的是否为重复出现的数据条目;根据检测结果,对每个数据条目进行重复性赋值,获得每个数据条目对应的重复性值。若数据条目为重复出现的数据条目,也即在检测当前数据条目之前,已经有与当前数据条目相同的另一条数据条目被检测过,则对应的重复性值为1;若数据条目并非重复出现的数据条目,也即在检测当前数据条目之前,没有与当前数据条目相同的另一条数据条目被检测过,则对应的重复性值为0,将所有数据条目的重复性值的和,与数据条目数量的比值,作为待评估数据所包含的数据条目中重复条目的占比。
例如,可以采用如下公式计算待评估数据在数据冗余度指标下的ω4指标值ω4:
其中,bi为待评估数据中第i个数据条目的重复性值,N为待评估数据中数据条目的总数。
ω4取值范围为[0,1],ω4值越大,表明待评估数据的数据重复性越小,那么对应的数据价值也越高。
例如,待评估数据中包含5条数据条目,分别为a、b、c、d、e,其中,a、b和e相同,c、d相同,从a至e依次检测每条数据条目是否为重复出现的数据条目;a第一次出现,其重复性值为0;b和a相同,为重复出现的数据条目,因此b的重复性值为1,c第一次出现,其重复性值为0;d和c相同,为重复出现的数据条目,其重复性值为1;e与a相同,为重复出现的数据条目,其重复性值为1,最终得到的待评估数据所包含的数据条目中重复条目的占比为0.6。根据上述公式,可知最终所得的确定数据在数据冗余度指标下的指标值ω4为0.4。
5、针对所述表征数据自身价值的指标包括数据量指标的情况,
所述指标值确定模块20,具体用于确定所述待评估数据包含的数据量;并基于所述数据量确定所述待评估数据在数据量指标下的指标值,且所述数据量越大,表征所述待评估数据在数据量指标下的指标值越高;
在具体实现的时候,可以采用下述两种方法中任意一种确定待评估数据在数据量指标下的指标值:
其一,可以将计算的待评估数据的数据量与各预设平台的数据的总数据量的比值作为数据量指标的指标值,也可以直接将待评估数据的数据量作为数据量指标的指标值,可根据实际情况确定。
例如,在将待评估数据的数据量与各预设平台的数据的总数据量的比值作为数据量指标的指标值时,可以采用以下公式计算数据量指标的指标值ω5:
其中,N为待评估数据中数据的数据量,P为各预设平台的数据的总数据量。
ω5的取值是[0,1],当ω6=0时,说明待评估数据的数据量小,反之数据量大。
其二,基于所述待评估数据的描述信息中携带的承诺数据量、以及描述信息所描述的数据量;待评估数据包含的数据量、以及对预设平台的数据进行数据采集获取的与待评估数据相似的相似数据量,计算待评估数据在数据量指标下的指标值。
其中,该承诺数据量是指用户提供待评估数据时,预计要提供的待评估数据的数据量。
待评估数据所包含的数据量,即为待评估数据包含的有效数据元的数据量。
对预设平台的数据进行数据采集获取的与待评估数据相似的相似数据量,待评估数据的相似数据获取过程与下述B中1针对表征数据市场影响因素的指标包括数据稀缺性指标的情况中,相似数据的获取过程类似,在此不再赘述。
具体地,可以采用下述公式计算待评估数据在数据量指标下的指标值:
其中,m表示待评估数据包含的数据量;N1表示对预设平台的数据进行数据采集获取的与待评估数据相似的相似数据量;N2表示描述信息所描述的数据;N3表示承诺数据量。
6、针对所述表征数据自身价值的指标包括数据领域分类指标的情况,
所述指标值确定模块20,具体用于确定所述待评估数据所属数据集对应的行业领域标签数量与所述待评估数据所属数据类别对应的行业领域标签数量的比值;并基于所述比值确定所述待评估数据领域分类指标的指标值,且所述比值越大,表征所述待评估数据的领域分类指标的指标值越大。
在具体实现的时候,行业领域标签,是待评估数据所属的行业领域下,对待评估数据进行分类时,待评估数据能够归属的分类。例如待评估数据为某产品的销售数据,包括产品的相关属性,如名称、尺寸、用途、价格、生产商相关信息等属性;还包括购买产品的买家信息,如买家名称,购买产品时间、付款账号、付款金额、配送地址、联系电话等;还包括产品的售后信息,如保修时间、保修期间内的相关修理记录等信息。可以将属性名称作为对应数据的属性标签。
所述待评估数据所属数据集对应的行业领域标签数量与所述待评估数据所属数据类别对应的行业领域标签数量的比值,即为待评估数据所具有的标签,和待评估数据所归属的行业具有的总标签数量的比值。
例如,采用以下公式计算待评估数据在数据领域分类指标下的指标值ω6:
其中,m是指待评估数据所属数据集对应的行业领域标签数量;n是指待评估数据所属数据类别对应的行业领域标签数量。
7、针对所述表征数据自身价值的指标包括应用场景指标的情况,
所述指标值确定模块20,具体用于根据所述待评估数据能够应用的场景个数,确定所述待评估数据在应用场景指标下的指标值;且所述待评估数据能够应用的场景越多,表征所述待评估数据在所述应用场景指标下的指标值越高。
在具体实现的时候,待评估数据能够应用的场景个数越多,则证明待评估数据的价值越高。因此可以根据所述待评估数据能够应用的场景个数,确定所述待评估数据在应用场景指标下的指标值。
例如,采用以下公式计算待评估数据在应用场景指标下的指标值ω7:
ω7=s。
其中,s是指待评估数据能够应用的场景个数。
8、针对所述表征数据自身价值的指标包括权益性质指标的情况,
所述指标值确定模块20,具体用于根据所述待评估数据的可交易性,确定所述待评估数据在权益性质指标下的指标值;且所述待评估数据的可交易性为可以交易时所述待评估数据在所述权益性指标下的指标值,高于所述待评估数据的可交易性为不可交易时所述待评估数据在所述权益性指标下的指标值。
此处,待评估数据的可交易性,是指待评估数据是否被允许交易;当代估价数据不被允许交易时,无法直接将其转化为市场竞争价值,因此会在一定程度上影响待评估数据的价值。
例如,采用以下公式计算待评估数据在权益性质指标下的指标值ω8:
其中,k1为当待评估数据的可交易性为可交易时的指标值;k2为当待评估数据的不可交易性为可交易时的指标值。且k1大于k2。
B:所述表征数据市场影响因素的指标包括:数据稀缺性指标、数据市场的供求紧张程度指标中至少一种。
本申请实施例中指标值确定模块20具体用于根据下述1-2的方法确定待评估数据在各表征数据市场影响因素的指标下的指标值。
1、针对所述表征数据自身价值的指标包括数据稀缺性指标的情况,
所述指标值确定模块20,具体用于确定所述待评估数据以及与所述待评估数据相似的相似数据在预设平台的出现次数;并基于所述出现次数确定所述待评估数据在数据稀缺性指标下的指标值,且所述出现次数越少,表征所述待评估数据的稀缺性越高。
在具体实现的时候,为了能够确定与待评估数据相似的相似数据,参见图2所示,本申请实施例中还包括:相似数据确定模块40。
此时,所述数据获取模块10,还用于:从预设平台爬取多个数据集;
相似数据确定模块40可以通过下述两种方式为待评估数据确定相似数据:
其一:所述相似数据确定模块40,用于分别对所述待评估数据及所述多个数据集进行解析,确定出所述待评估数据及各数据集的词汇特征;将所述待评估数据的词汇特征分别与各数据集的词汇特征进行文本相似度匹配;将文本相似度达到预设相似度阈值的数据集确定为所述待评估数据的相似数据;
具体地,稀缺性是指根据采集的预设的平台以及自身数据信息对于同类数据的提供情况,计算数据的稀缺程度;同类数据越多,稀缺性越低;同类数据越少,稀缺性越高;稀缺性越高的待评估数据,其质量以及价值也相应越高。
在具体实现的时候,预设平台可以是数据交易平台,也可以是其他数据平台;以数据交易平台为例,每一笔数据交易对应有至少一类被交易的业务数据。在从预设平台爬取数据集的时候,对针对每一笔数据交易,爬取一个数据集;每个数据集中包括多个数据条目。
相似数据确定模块40在进行数据爬取的时候,可以通过爬虫、爬取工具等技术爬取数据集,本申请对此不予限制。
在具体实施中,相似数据确定模块40可以通过下述步骤确定待评估数据和各数据集的词汇特征:
对获取的各数据集进行分词处理,得到分词处理后的第一词汇数据;按照分词处理后的各个第一词汇数据在对应数据集中的出现频次由高到低的顺序,筛选出前预设数量个第一词汇数据,针对数据集的每个数据,根据筛选出的各第一词汇数据在该数据集中出现的频次,确定该数据的词汇特征。
对待评估数据进行分词处理,得到分词处理后的第二词汇数据;按照分词处理后的各个第二词汇数据在待评估数据中的出现频次由高到低的顺序,筛选出前预设数量个第二词汇数据,针对待评估数据中的每个数据,根据筛选出的各第二词汇数据在该待评估数据中出现的频次,确定该数据的词汇特征。
针对每个数据集中的每个词汇特征,计算该数据集中的该词汇特征分别与待评估数据中的词汇特征之间的文本相似度。将文本相似度大于或等于预设相似度阈值的数据集确定为待评估数据的相似数据。
进一步地,针对待评估数据及数据集确定出多个特征词汇的情况,针对待评估数据的每个特征词汇,可以将该特征词汇与数据集的各特征词汇分别作文本相似度比对,将相似度达到第一预设相似度阈值的特征词汇确定为该特征词汇的相似词汇,相似词汇数量达到第二预设阈值的时候,讲待评估数据及数据集确定为相似数据。
进一步地,针对待评估数据和数据集具有已标注的行业标签的情况,也可以直接将行业标签作为对应数据的特征词汇,直接将特征词汇进行相似度比对。
其二:相似数据确定模块40,用于确定所述待评估数据及所述多个数据集的属性标签信息;分别确定所述待评估数据的属性标签信息与各数据集的属性标签信息相似度;将属性标签相似度满足预设属性相似度阈值的数据集,确定为所述待评估数据的相似数据。
其中,属性标签信息可以是待估价数据和多个数据集本身已经具有的,也可以是在根据待估价数据和多个数据集的属性,即时为其添加的。以待估价数据为例,属性标签信息用于标识待估价数据的属性,相似度越高的数据,其属性也应当是越相似的,因此可以通过待估价数据的属性标签信息和各个数据集的属性标签信息之间的相似度表征待估价数据和各个数据集之间的相似度。
因而可以将相似度满足预设属性相似度阈值的数据集,确定为待估价数据的相似数据。
具体地,相似数据确定模块40,具体用于根据下述步骤确定所述待估价数据与任一数据集的属性标签信息相似度:
获取所述待估价数据的属性标签与该任一数据集的属性标签中,相同属性标签的数量;以及所述待估价数据的属性标签与该任一数据集的属性标签中不重复的属性标签总数量;
根据所述相同属性标签数量以及所述总数量,确定所述待估价数据与该任一数据集的属性标签信息相似度,且所述相同属性标签数量越多,表征所述待估价数据与该任一数据集的属性标签信息相似度越大。
具体地,可以采用下述公式计算待估价数据与第i个数据集的属性标签信息相似度Si:
其中,xi表示待估价数据的属性标签与该任一数据集的属性标签中,相同属性标签的数量;yi表示待估价数据的属性标签与该任一数据集的属性标签中不重复的属性标签总数量。Si的取值在0-1之间。
在相似数据确定模块40从爬取的多个数据集中确定了待评估数据的相似数据之后,会根据相似数据在预设平台出现的次数,确定所述待评估数据在数据稀缺性指标下的指标值。
具体地,可以采用下述步骤计算待评估数据在所述稀缺性指标下的指标值:
确定与所述待评估数据的相似的所述相似数据的数据集的数量;
基于爬取的数据集的总数量,以及与所述待评估数据的相似的所述相似数据的数据集的数量,计算所述待评估数据在所述稀缺性指标下的指标值;
例如,采用以下公式计算待评估数据在数据稀缺性指标下的指标值ω9:
其中,x为待评估数据和待评估数据的相似数据在预设平台的出现次数,y为爬取到的数据集的总数量。
ω9的取值范围为[0,1],当ω9接近于1,说明待评估数据的相似数据出现的越多,待评估数据的稀缺性越低,ω9越接近0,表明待评估数据的相似数据出现的越少,待评估数据的稀缺性越高。
另外,还可以采用下述公式计算待评估数据在数据稀缺性指标下的指标值ω5:
ω9=1-e-x/y
其中,x为待评估数据和待评估数据的相似数据在预设平台的出现次数,y为预设平台的总数。
ω9的取值范围为[0,1],当ω9接近于1,说明各预设平台均存在相似数据,待评估数据的稀缺性越低,ω9等于0,表明各预设平台不存在相似数据,待评估数据的稀缺性越高。
2、针对所述表征数据自身价值的指标包括数据市场的供求紧张程度指标的情况,
所述指标值确定模块20,具体用于确定所述待评估数据和/或与所述待评估数据相似的相似数据在第一历史时间段的第一成交量;以及所述待评估数据和/或与所述待评估数据相似的相似数据在多个第二历史时间段的平均第二成交量;基于所述第一成交量和所述平均第二成交量,确定所述待评估数据在所述供求紧张程度指标下的指标值,且所述第一成交量越高,和/或所述平均第二成交量越低,表征所述待评估数据的供求紧张程度越高。
在具体实现的时候,供求紧张程度指标用于表征待评估数据的供求紧张程度;待评估数据的供求紧张程度越高,其价值也相应的也就越大。当待评估数据和/或待评估数据的相似数据的数据量较为稳定的情况下,交易量越高,也就代表待评估数据的供求紧张程度越高。但是实际中,待评估数据的相似数据的量随着时间会不断发生变化,因此本申请使用待评估数据和/或待评估数据的相似数据的交易量的增长率来表征待评估数据的供求紧张程度。
此处,以使用待评估数据和待评估数据的相似数据,获取交易量的增长率为例,对获取待评估数据在所述供求紧张程度指标下的指标值加以说明:
首先需要获得待评估数据的相似数据。待评估数据的相似数据获取过程与上述B中1针对表征数据市场影响因素的指标包括数据稀缺性指标的情况中,相似数据的获取过程类似,在此不再赘述。
在确定了待评估数据的相似数据后,要确定待评估数据和待评估数据相似的相似数据在第一历史时间段的第一成交量,并获得待评估数据和待评估数据相似的相似数据在多个第二历史时间段的平均第二成交量。
其中,第一成交量和第二成交量可以包括:成交数据量、成交金额、单位数据量的成交金额中一项或者多项来表征。
基于多个第二历史时间段的平均第二成交量确定待评估数据在供求紧张程度指标下的指标值,能够获得更加客观的结果。
具体地,多个第二历史时间段可以具有连续的时间关系。第二历史时间段的持续时间长度可以根据自己的需要进行设定,例如将第二历史时间段的持续时间长度设置为一周,15天、一个月、一个季度、半年、一年等。例如,假若第二历史时间段有3个,且每个第二历史时间段的持续时间长度均为1个月,则可以将3月、4月和5月作为这三个第二历史时间段。
第一历史时间段可以是第二历史时间段中的一个,一般地,为了数据尽可能的符合对待评估数据进行评估时的实际情况,可以将多个第二历史时间段中最近的第二历史时间段作为第一历史时间段;例如第二历史时间段有3个,且每个第二历史时间段的持续时间长度均为1个月,当前时间为6月1日,则可以将3月、4月和5月作为这三个第二历史时间段,并且将5月作为第一历史时间段。
第一历史时间段也可以与第二历史时间段不同,较佳地,晚于最近的第二历史时间段。例如,第二历史时间段有3个,且每个第二历史时间段的持续时间长度均为1个月,则可以将3月、4月和5月作为这三个第二历史时间段,并且将6月作为第一历史时间段。
在获得第一成交量和平均第二成交量后,就能够根据第一成交量和平均第二成交量,获得待评估数据及其相似数据的交易量的增长率。
例如,可以将第一成交量和平均第二成交量的比值作为该增长率,也即作为待评估数据在数据市场的供求紧张程度下的指标值。
也即,待评估数据在数据市场的供求紧张程度下的指标值ω10满足:
C:针对所述数据市场竞争程度指标,
所述指标值确定模块20,具体用于确定提供所述待评估数据的企业所属行业;确定属于所述行业的各企业在数据交易业务上分别所占市场份额;基于由大到小前预设数量市场份额的和值,确定所述数据市场竞争程度指标的指标值,且所述和值越大表征所述数据市场竞争程度指标的指标值越大。
在具体实现的时候,提供待评估数据的企业所属的行业,可以是企业所属的基本行业,以及该基本行业作为子行业或者分支行业所属的父行业,可以根据实际的情况具体设定。例如待评估数据为某品牌发电机的销售数据,提供该发电机销售数据的企业为一家发电机制造商;该发电机制造商所属的行业可以是发电机制造业、机电制造业;其中,发电机制造业是基本行业,机电制造业是发电机制造业的父行业。
在确定了待评估数据的企业所属的行业后,再根据属于该行业的各企业在数据交易业务上分别所占市场份额。
市场份额可以根据属于该行业的各企业的待评估数据和/或待评估数据的相似数据的数据交易量来确定。
具体地,指标值确定模块20可以通过下述步骤来确定数据市场竞争程度指标的指标值:
确定所述各企业中每个企业在预设历史时间段内数据交易业务对应的数据成交量;并基于每个企业对应的数据成交量与各企业对应的数据成交总量的比值,分别确定每个企业在数据交易业务上所占市场份额;确定由大到小前预设数量的市场份额的和值,且满足前预设数量加一的市场份额的和值与前预设数量的市场份额的和值相比,增幅未达到预设增幅阈值。
以使用待评估数据和待评估数据的相似数据的交易量来确定各企业所占据的市场份额为例:
提供待评估数据的企业所属的行业包括10家企业,分别为A、B、C、D、E、F、G、H、I和J,10家企业对待评估数据和相似数据的数据成交总量共1000GB(GigaByte,十亿字节);十家公司分别对应的交易量为:300GB、170GB、140GB、100GB、70GB、100GB、60GB、20GB、30GB、10GB。
则企业A至企业J分别对应的市场份额为:30%、17%、14%、10%、7%、10%、6%、2%、3%以及1%。
假设预设增幅阈值为5%,预设数量为7,也即取企业A~G的市场份额的和值,为94%;此时,若从大到小取8家企业的市场份额的和值,为97%,增幅小于预设增幅阈值5%。
这里,由于H、I和J三家企业对应的市场份额分别2%、3%以及1%,对于市场竞争程度的影响实际是非常小的,因此可以仅仅根据企业A~G的市场份额,来确定数据市场竞争程度指标的指标值。
例如,可以使用赫希曼指数来表征该数据市场竞争程度指标的指标值。赫希曼指数是指基于该行业中企业的总数和规模分布,即将相关市场上的所有企业的市场份额的平方后再相加的总和,赫希曼指数具有数学上绝对法和相对法的优点使它成为较理想的市场集中度计量指标,它可以衡量企业的市场份额对市场集中度产生的影响。
赫希曼指数HI满足:
其中,xi表示第i家企业的数据成交量;x表示所有企业的数据成交总量;SI即为第i家企业的市场份额,N表示预设数量。a表示计第一算系数,可以根据实际需要进行具体设定,例如取100、100的n次方等。m表示第二计算系数,也可以根据实际需要进行具体设定,例如设定为2、3等。
此处,数据市场竞争程度指标的指标值ω11满足:
ω11=HI。
III:价值评估模块30,用于将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值。
在具体实现的时候,数据价值评估模型可以通过下述几种方式获得:
其一:通过专家打分法为每一种价值评估指标确定权重,根据每一种价值评估指标的权重以及每种价值评估指标的指标值,对价值评估指标的指标值进行加权求和,确定待评估数据的评估价值。
专家打分法的具体流程为:
(1)选择专家。
此处,专家应当是对于待评估数据所属领域具有较深了解的专家。
(2)确定影响估价价格的两个因素:数据自身价值和市场竞争价值。
(3)向专家提供背景资料,以匿名方式征询专家意见。
(4)对专家意见进行分析汇总,将统计结果反馈给专家。
(5)专家根据反馈结果修正自己的意见。
(6)经过多轮匿名征询和意见反馈,形成最终分析结论。
其二:通过构建模型,并使用训练数据对构建的模型进行训练得到。
具体地,参见图2所示,还包括:数据价值评估模型训练模块50;
所述数据价值评估模型训练模块50,用于将所述价值评估指标作为自变量,将数据评估价值作为因变量构建数据价值评估模型;
所述数据获取模块10,还用于获取训练数据;
所述指标值确定模块20,还用于确定所述训练数据在所述价值评估指标下的指标值,以及所述训练数据的交易价格。
所述数据价值评估模型训练模块50,还用于将为所述训练数据确定的指标值作为自变量值,将对应训练数据的交易价格作为因变量值代入所述数据价值评估模型,采用预设算法对所述数据价值评估模型进行训练,得到预先训练的数据价值评估模型。
在具体实现的时候,模型训练模块50在构建数据价值评估模型的时候,需要确定模型中的解释变量和被解释变量,并通过后续模型训练过程来确定解释变量和被解释变量之间的联系。影响待评估数据的价值的因素有几种,则将这几种因素作为对应的表征数据价值的价值评估指标,并将价值评估指标作为解释变量,并将待评估数据的定价结果作为被解释变量构建估价模型。
本申请实施例中,所构建的模型包括但不限于:自回归模型、移动平均模型、自回归移动平均模型、整合移动平均自回归模型、广义自回归条件异方差模型。
在构建了数据价值评估模型后,要对数据价值评估模型进行训练。在训练所用到的训练数据可以通过数据获取模块获取;此处,需要注意的是,所获取的训练数据,可以是已经进行过交易的交易价格,也可以是未进行过交易,但已经进入待交易阶段为训练数据标注的交易价格。
在得到预先训练的数据价值评估模型后,就能够将待评估数据在各价值评估指标的指标值输入至预先构建的数据价值评估数据模型中,得到待评估数据的评估价值。其中,待评估数据的评估价值通过交易价格来表征。
例如,针对所述表征数据自身价值的指标包括:数据一致性指标、数据完整性指标、数据冗余度指标、数据时效性指标、数据量指标、数据领域分类指标、应用场景指标、以及权益性质指标,所述表征数据市场影响因素的指标包括:数据稀缺性指标、数据市场的供求紧张程度指标中,所述表征市场竞争影响因素的指标包括:数据市场竞争程度指标的情况,可以根据下述公式计算待评估数据的价值P:
其中,a1至a11依次为数据一致性指标、数据完整性指标、数据冗余度指标、数据时效性指标、数据量指标、数据领域分类指标、应用场景指标、以及权益性质指标,数据稀缺性指标、数据市场的供求紧张程度指标中,数据市场竞争程度指标分别对应的权重系数。ω1至ω11依次为数据一致性指标、数据完整性指标、数据冗余度指标、数据时效性指标、数据量指标、数据领域分类指标、应用场景指标、以及权益性质指标,数据稀缺性指标、数据市场的供求紧张程度指标中,数据市场竞争程度指标分别对应的指标值。
本申请实施例通过数据获取模块获取待评估数据;通过指标值确定模块根据确定待评估数据在预设价值评估指标下的指标值,并通过价值评估模块将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值,在这个过程中所使用的表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标,能够更加客观的反应待评估数据的价值,并且整个过程不需要人为的干预,就能够更加客观、准确的确定业务数据的质量。
基于同一发明构思,本申请实施例中还提供了与数据价值评估系统对应的数据价值评估方法,由于本申请实施例中的方法解决问题的原理与本申请实施例上述系统相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参见图3所示,本申请实施例提供的数据价值评估方法包括:
S301:获取待评估数据;
S302:为所述待评估数据确定价值评估指标的指标值;
其中,所述价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;
S303:将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值。
本申请实施例通过获取待评估数据,为所述待评估数据确定价值评估指标的指标值;将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值,其中价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;在这个过程中所使用的表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标,能够更加客观的反应待评估数据的价值,并且整个过程不需要人为的干预,就能够更加客观、准确的确定业务数据的质量。
可选地,所述表征数据自身价值的指标包括:数据一致性指标、数据完整性指标、数据冗余度指标、数据时效性指标、数据量指标、数据领域分类指标、应用场景指标、以及权益性质指标中一种或多种;
所述表征数据市场影响因素的指标包括:数据稀缺性指标、数据市场的供求紧张程度指标中至少一种;
所述表征市场竞争影响因素的指标包括:数据市场竞争程度指标;
针对所述表征数据自身价值的指标包括数据一致性指标的情况,所述待评估数据包括:数据内容以及所述待评估数据对应的描述信息;
所述指标值确定模块,具体用于确定所述待评估数据所包含数据内容与所述待评估数据对应描述信息的一致性程度;并基于所述一致性程度确定所述待评估数据在数据一致性指标下的指标值,且所述一致性程度越高,表征所述待评估数据在数据一致性指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据完整性指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据所包含数据条目中的空值占比;并基于所述空值占比确定所述待评估数据在数据完整性指标下的指标值,且所述空值占比越低,表征所述待评估数据的数据完整性越高;
针对所述表征数据自身价值的指标包括数据冗余度指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据所包含的数据条目中重复条目的占比;并基于所述重复条目的占比确定所述待评估数据在数据冗余度指标下的指标值,且所述重复条目的占比越低,表征所述待评估数据的数据冗余度越低;
针对所述表征数据自身价值的指标包括数据时效性指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据开始产生时间终止产生时间之间所跨越的时间区间,以及所述待评估数据开始产生时间与所述待评估数据提供时间之间的时间差;基于所述时间区间和所述时间差确定所述待评估数据在数据时效性指标下的指标值;其中,所述时间区间跨度越大,表征所述待评估数据在数据时效性指标下的指标值越高;以及所述时间差越小,表征所述待评估数据在数据时效性指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据量指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据包含的数据量;并基于所述数据量确定所述待评估数据在数据量指标下的指标值,且所述数据量越大,表征所述待评估数据在数据量指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据领域分类指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据所属数据集对应的行业领域标签数量与所述待评估数据所属数据类别对应的行业领域标签数量的比值;并基于所述比值确定所述待评估数据领域分类指标的指标值,且所述比值越大,表征所述待评估数据的领域分类指标的指标值越大;
针对所述表征数据自身价值的指标包括应用场景指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
根据所述待评估数据能够应用的场景个数,确定所述待评估数据在应用场景指标下的指标值;且所述待评估数据能够应用的场景越多,表征所述待评估数据在所述应用场景指标下的指标值越高;
针对所述表征数据自身价值的指标包括权益性质指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
根据所述待评估数据的可交易性,确定所述待评估数据在权益性质指标下的指标值;且所述待评估数据的可交易性为可以交易时所述待评估数据在所述权益性指标下的指标值,高于所述待评估数据的可交易性为不可交易时所述待评估数据在所述权益性指标下的指标值;
针对所述表征数据市场影响因素的指标包括数据稀缺性指标的情况,
还包括:从预设平台爬取多个数据集;
分别对所述待评估数据及所述多个数据集进行解析,确定出所述待评估数据及各数据集的词汇特征;将所述待评估数据的词汇特征分别与各数据集的词汇特征进行文本相似度匹配;将文本相似度达到预设相似度阈值的数据集确定为所述待评估数据的相似数据;或者
用于确定所述待评估数据及所述多个数据集的属性标签信息;分别确定所述待评估数据的属性标签信息与各数据集的属性标签信息相似度;将属性标签相似度满足预设属性相似度阈值的数据集,确定为所述待评估数据的相似数据;
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据以及与所述待评估数据相似的相似数据在预设平台的出现次数;并基于所述出现次数确定所述待评估数据在数据稀缺性指标下的指标值,且所述出现次数越少,表征所述待评估数据的稀缺性越高;
针对所述表征数据市场影响因素的指标包括数据市场的供求紧张程度指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据和/或与所述待评估数据相似的相似数据在第一历史时间段的第一成交量;以及所述待评估数据和/或与所述待评估数据相似的相似数据在多个第二历史时间段的平均第二成交量;基于所述第一成交量和所述平均第二成交量,确定所述待评估数据在所述供求紧张程度指标下的指标值,且所述第一成交量越高,和/或所述平均第二成交量越低,表征所述待评估数据的供求紧张程度越高;
对所述数据市场竞争程度指标,
为所述待评估数据确定价值评估指标的指标值,包括:
确定提供所述待评估数据的企业所属行业;确定属于所述行业的各企业在数据交易业务上分别所占市场份额;基于由大到小前预设数量市场份额的和值,确定所述数据市场竞争程度指标的指标值,且所述和值越大,表征所述数据市场竞争程度指标的指标值越大。
可选地,确定属于所述行业的各企业在数据交易业务上分别所占市场份额,具体包括:确定所述各企业中每个企业在预设历史时间段内数据交易业务对应的数据成交量;并基于每个企业对应的数据成交量与各企业对应的数据成交总量的比值,分别确定每个企业在数据交易业务上所占市场份额;确定由大到小前预设数量的市场份额的和值,且满足前预设数量加一的市场份额的和值与前预设数量的市场份额的和值相比,增幅未达到预设增幅阈值。
可选地,还包括:
将所述价值评估指标作为自变量,将数据评估价值作为因变量构建数据价值评估模型;
获取训练数据,并确定所述训练数据在所述价值评估指标下的指标值,以及所述训练数据的交易价格;
将为所述训练数据确定的指标值作为自变量值,将对应训练数据的交易价格作为因变量值代入所述数据价值评估模型,采用预设算法对所述数据价值评估模型进行训练,得到预先训练的数据价值评估模型。
对应于图3中的数据价值评估方法,本申请实施例还提供了一种计算机设备,如图4所示,该设备包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序,其中,上述处理器2000执行上述计算机程序时实现上述客数据价值评估方法的步骤。
具体地,上述存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器1000存储的计算机程序时,能够执行上述数据价值评估方法,从而解决定价过程中存在的人为参与导致的估价结果不够客观、准确的问题,进而达到在估价过程中受到人为主观因素影响小,能够较为客观、准确的得到业务数据的估价结果的效果。
对应于图1中的数据价值评估方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述数据价值评估方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述数据价值评估方法,从而解决定价过程中存在的人为参与导致的估价结果不够客观、准确的问题,进而达到在估价过程中受到人为主观因素影响小,能够较为客观、准确的得到业务数据的估价结果的效果。
本申请实施例所提供的数据价值评估系统以及方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种数据价值评估系统,其特征在于,该系统包括:
数据获取模块,用于获取待评估数据;
指标值确定模块,用于为所述待评估数据确定价值评估指标的指标值;
其中,所述价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;
价值评估模块,用于将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值。
2.根据权利要求1所述的系统,其特征在于,所述表征数据自身价值的指标包括:数据一致性指标、数据完整性指标、数据冗余度指标、数据时效性指标、数据量指标、数据领域分类指标、应用场景指标、以及权益性质指标中一种或多种;
所述表征数据市场影响因素的指标包括:数据稀缺性指标、数据市场的供求紧张程度指标中至少一种;
所述表征市场竞争影响因素的指标包括:数据市场竞争程度指标。
3.根据权利要求2所述的系统,其特征在于:
针对所述表征数据自身价值的指标包括数据一致性指标的情况,所述待评估数据包括:数据内容以及所述待评估数据对应的描述信息;
所述指标值确定模块,具体用于确定所述待评估数据所包含数据内容与所述待评估数据对应描述信息的一致性程度;并基于所述一致性程度确定所述待评估数据在数据一致性指标下的指标值,且所述一致性程度越高,表征所述待评估数据在数据一致性指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据完整性指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据所包含数据条目中的空值占比;并基于所述空值占比确定所述待评估数据在数据完整性指标下的指标值,且所述空值占比越低,表征所述待评估数据的数据完整性越高;
针对所述表征数据自身价值的指标包括数据冗余度指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据所包含的数据条目中重复条目的占比;并基于所述重复条目的占比确定所述待评估数据在数据冗余度指标下的指标值,且所述重复条目的占比越低,表征所述待评估数据的数据冗余度越低;
针对所述表征数据自身价值的指标包括数据时效性指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据开始产生时间终止产生时间之间所跨越的时间区间,以及所述待评估数据开始产生时间与所述待评估数据提供时间之间的时间差;基于所述时间区间和所述时间差确定所述待评估数据在数据时效性指标下的指标值;其中,所述时间区间跨度越大,表征所述待评估数据在数据时效性指标下的指标值越高;以及所述时间差越小,表征所述待评估数据在数据时效性指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据量指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据包含的数据量;并基于所述数据量确定所述待评估数据在数据量指标下的指标值,且所述数据量越大,表征所述待评估数据在数据量指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据领域分类指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据所属数据集对应的行业领域标签数量与所述待评估数据所属数据类别对应的行业领域标签数量的比值;并基于所述比值确定所述待评估数据领域分类指标的指标值,且所述比值越大,表征所述待评估数据的领域分类指标的指标值越大;
针对所述表征数据自身价值的指标包括应用场景指标的情况,
所述指标值确定模块,具体用于根据所述待评估数据能够应用的场景个数,确定所述待评估数据在应用场景指标下的指标值;且所述待评估数据能够应用的场景越多,表征所述待评估数据在所述应用场景指标下的指标值越高;
针对所述表征数据自身价值的指标包括权益性质指标的情况,
所述指标值确定模块,具体用于根据所述待评估数据的可交易性,确定所述待评估数据在权益性质指标下的指标值;且所述待评估数据的可交易性为可以交易时所述待评估数据在所述权益性指标下的指标值,高于所述待评估数据的可交易性为不可交易时所述待评估数据在所述权益性指标下的指标值。
4.根据权利要求2所述的系统,其特征在于,
针对所述表征数据市场影响因素的指标包括数据稀缺性指标的情况,
所述数据获取模块,还用于:从预设平台爬取多个数据集;
所述系统,还包括:相似数据确定模块;
所述相似数据确定模块,用于分别对所述待评估数据及所述多个数据集进行解析,确定出所述待评估数据及各数据集的词汇特征;将所述待评估数据的词汇特征分别与各数据集的词汇特征进行文本相似度匹配;将文本相似度达到预设相似度阈值的数据集确定为所述待评估数据的相似数据;或者
用于确定所述待评估数据及所述多个数据集的属性标签信息;分别确定所述待评估数据的属性标签信息与各数据集的属性标签信息相似度;将属性标签相似度满足预设属性相似度阈值的数据集,确定为所述待评估数据的相似数据;
所述指标值确定模块,具体用于确定所述待评估数据以及与所述待评估数据相似的相似数据在预设平台的出现次数;并基于所述出现次数确定所述待评估数据在数据稀缺性指标下的指标值,且所述出现次数越少,表征所述待评估数据的稀缺性越高;
针对所述表征数据市场影响因素的指标包括数据市场的供求紧张程度指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据和/或与所述待评估数据相似的相似数据在第一历史时间段的第一成交量;以及所述待评估数据和/或与所述待评估数据相似的相似数据在多个第二历史时间段的平均第二成交量;基于所述第一成交量和所述平均第二成交量,确定所述待评估数据在所述供求紧张程度指标下的指标值,且所述第一成交量越高,和/或所述平均第二成交量越低,表征所述待评估数据的供求紧张程度越高。
5.根据权利要求1所述的系统,其特征在于,针对所述数据市场竞争程度指标,
所述指标值确定模块,具体用于确定提供所述待评估数据的企业所属行业;确定属于所述行业的各企业在数据交易业务上分别所占市场份额;基于由大到小前预设数量市场份额的和值,确定所述数据市场竞争程度指标的指标值,且所述和值越大,表征所述数据市场竞争程度指标的指标值越大。
6.根据权利要求5所述的系统,其特征在于,所述指标值确定模块,具体用于确定所述各企业中每个企业在预设历史时间段内数据交易业务对应的数据成交量;并基于每个企业对应的数据成交量与各企业对应的数据成交总量的比值,分别确定每个企业在数据交易业务上所占市场份额;确定由大到小前预设数量的市场份额的和值,且满足前预设数量加一的市场份额的和值与前预设数量的市场份额的和值相比,增幅未达到预设增幅阈值。
7.根据权利要求1所述的系统,其特征在于,还包括:数据价值评估模型训练模块;
所述数据价值评估模型训练模块,用于将所述价值评估指标作为自变量,将数据评估价值作为因变量构建数据价值评估模型;
所述数据获取模块,还用于获取训练数据;
所述指标值确定模块,还用于确定所述训练数据在所述价值评估指标下的指标值,以及所述训练数据的交易价格;
所述数据价值评估模型训练模块,还用于将为所述训练数据确定的指标值作为自变量值,将对应训练数据的交易价格作为因变量值代入所述数据价值评估模型,采用预设算法对所述数据价值评估模型进行训练,得到预先训练的数据价值评估模型。
8.一种数据价值评估方法,其特征在于,该方法包括:
获取待评估数据;
为所述待评估数据确定价值评估指标的指标值;
其中,所述价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;
将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值。
9.根据权利要求8所述的方法,其特征在于,所述表征数据自身价值的指标包括:数据一致性指标、数据完整性指标、数据冗余度指标、数据时效性指标、数据量指标、数据领域分类指标、应用场景指标、以及权益性质指标中一种或多种;
所述表征数据市场影响因素的指标包括:数据稀缺性指标、数据市场的供求紧张程度指标中至少一种;
所述表征市场竞争影响因素的指标包括:数据市场竞争程度指标;
针对所述表征数据自身价值的指标包括数据一致性指标的情况,所述待评估数据包括:数据内容以及所述待评估数据对应的描述信息;
所述指标值确定模块,具体用于确定所述待评估数据所包含数据内容与所述待评估数据对应描述信息的一致性程度;并基于所述一致性程度确定所述待评估数据在数据一致性指标下的指标值,且所述一致性程度越高,表征所述待评估数据在数据一致性指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据完整性指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据所包含数据条目中的空值占比;并基于所述空值占比确定所述待评估数据在数据完整性指标下的指标值,且所述空值占比越低,表征所述待评估数据的数据完整性越高;
针对所述表征数据自身价值的指标包括数据冗余度指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据所包含的数据条目中重复条目的占比;并基于所述重复条目的占比确定所述待评估数据在数据冗余度指标下的指标值,且所述重复条目的占比越低,表征所述待评估数据的数据冗余度越低;
针对所述表征数据自身价值的指标包括数据时效性指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据开始产生时间终止产生时间之间所跨越的时间区间,以及所述待评估数据开始产生时间与所述待评估数据提供时间之间的时间差;基于所述时间区间和所述时间差确定所述待评估数据在数据时效性指标下的指标值;其中,所述时间区间跨度越大,表征所述待评估数据在数据时效性指标下的指标值越高;以及所述时间差越小,表征所述待评估数据在数据时效性指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据量指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据包含的数据量;并基于所述数据量确定所述待评估数据在数据量指标下的指标值,且所述数据量越大,表征所述待评估数据在数据量指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据领域分类指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据所属数据集对应的行业领域标签数量与所述待评估数据所属数据类别对应的行业领域标签数量的比值;并基于所述比值确定所述待评估数据领域分类指标的指标值,且所述比值越大,表征所述待评估数据的领域分类指标的指标值越大;
针对所述表征数据自身价值的指标包括应用场景指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
根据所述待评估数据能够应用的场景个数,确定所述待评估数据在应用场景指标下的指标值;且所述待评估数据能够应用的场景越多,表征所述待评估数据在所述应用场景指标下的指标值越高;
针对所述表征数据自身价值的指标包括权益性质指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
根据所述待评估数据的可交易性,确定所述待评估数据在权益性质指标下的指标值;且所述待评估数据的可交易性为可以交易时所述待评估数据在所述权益性指标下的指标值,高于所述待评估数据的可交易性为不可交易时所述待评估数据在所述权益性指标下的指标值;
针对所述表征数据市场影响因素的指标包括数据稀缺性指标的情况,
还包括:从预设平台爬取多个数据集;
分别对所述待评估数据及所述多个数据集进行解析,确定出所述待评估数据及各数据集的词汇特征;将所述待评估数据的词汇特征分别与各数据集的词汇特征进行文本相似度匹配;将文本相似度达到预设相似度阈值的数据集确定为所述待评估数据的相似数据;或者
用于确定所述待评估数据及所述多个数据集的属性标签信息;分别确定所述待评估数据的属性标签信息与各数据集的属性标签信息相似度;将属性标签相似度满足预设属性相似度阈值的数据集,确定为所述待评估数据的相似数据;
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据以及与所述待评估数据相似的相似数据在预设平台的出现次数;并基于所述出现次数确定所述待评估数据在数据稀缺性指标下的指标值,且所述出现次数越少,表征所述待评估数据的稀缺性越高;
针对所述表征数据市场影响因素的指标包括数据市场的供求紧张程度指标的情况,
为所述待评估数据确定价值评估指标的指标值,包括:
确定所述待评估数据和/或与所述待评估数据相似的相似数据在第一历史时间段的第一成交量;以及所述待评估数据和/或与所述待评估数据相似的相似数据在多个第二历史时间段的平均第二成交量;基于所述第一成交量和所述平均第二成交量,确定所述待评估数据在所述供求紧张程度指标下的指标值,且所述第一成交量越高,和/或所述平均第二成交量越低,表征所述待评估数据的供求紧张程度越高;
对所述数据市场竞争程度指标,
为所述待评估数据确定价值评估指标的指标值,包括:
确定提供所述待评估数据的企业所属行业;确定属于所述行业的各企业在数据交易业务上分别所占市场份额;基于由大到小前预设数量市场份额的和值,确定所述数据市场竞争程度指标的指标值,且所述和值越大,表征所述数据市场竞争程度指标的指标值越大。
10.根据权利要求8所述的方法,其特征在于,还包括:
将所述价值评估指标作为自变量,将数据评估价值作为因变量构建数据价值评估模型;
获取训练数据,并确定所述训练数据在所述价值评估指标下的指标值,以及所述训练数据的交易价格;
将为所述训练数据确定的指标值作为自变量值,将对应训练数据的交易价格作为因变量值代入所述数据价值评估模型,采用预设算法对所述数据价值评估模型进行训练,得到预先训练的数据价值评估模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810829759.9A CN110766428A (zh) | 2018-07-25 | 2018-07-25 | 一种数据价值评估系统以及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810829759.9A CN110766428A (zh) | 2018-07-25 | 2018-07-25 | 一种数据价值评估系统以及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110766428A true CN110766428A (zh) | 2020-02-07 |
Family
ID=69327216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810829759.9A Pending CN110766428A (zh) | 2018-07-25 | 2018-07-25 | 一种数据价值评估系统以及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110766428A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111539770A (zh) * | 2020-04-27 | 2020-08-14 | 启迪数华科技有限公司 | 一种数据资产智能评估方法及系统 |
CN111680045A (zh) * | 2020-06-15 | 2020-09-18 | 华晨宝马汽车有限公司 | 生成关于车辆的数据价值流的方法和装置及存储介质 |
CN112269777A (zh) * | 2020-10-12 | 2021-01-26 | 同盾控股有限公司 | 一种数据产品质量评估方法及装置 |
WO2021179496A1 (zh) * | 2020-03-10 | 2021-09-16 | 南方电网科学研究院有限责任公司 | 一种数据交易方法及数据交易系统 |
CN113592649A (zh) * | 2021-07-28 | 2021-11-02 | 北京易华录信息技术股份有限公司 | 一种数据资产价值确定方法、装置及电子设备 |
CN113919602A (zh) * | 2021-12-13 | 2022-01-11 | 华南师范大学 | 一种大数据交易的数据价值双向评估方法及系统 |
CN115689596A (zh) * | 2022-08-27 | 2023-02-03 | 北京华宜信科技有限公司 | 一种非定制化数据资产估值方法 |
CN116433080A (zh) * | 2023-03-17 | 2023-07-14 | 交通运输部规划研究院 | 交通运输规划行业的数据共享评分方法、装置及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103501342A (zh) * | 2013-10-09 | 2014-01-08 | 北京奇虎科技有限公司 | 点对点网络上传数据、下载数据的方法及装置 |
CN106355447A (zh) * | 2016-08-31 | 2017-01-25 | 国信优易数据有限公司 | 一种数据商品的价格评估方法及系统 |
CN106469395A (zh) * | 2016-08-31 | 2017-03-01 | 国信优易数据有限公司 | 一种数据商品动态综合评估方法及系统 |
CN106503228A (zh) * | 2016-10-28 | 2017-03-15 | 国信优易数据有限公司 | 一种数据包稀缺性评估方法及其系统 |
CN106503912A (zh) * | 2016-10-27 | 2017-03-15 | 国信优易数据有限公司 | 一种数据服务系统 |
CN106934493A (zh) * | 2017-02-28 | 2017-07-07 | 北京科技大学 | 一种电力客户价值评估模型的构建方法 |
CN107545349A (zh) * | 2016-06-28 | 2018-01-05 | 国网天津市电力公司 | 一种面向电力大数据的数据质量分析评价模型 |
-
2018
- 2018-07-25 CN CN201810829759.9A patent/CN110766428A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103501342A (zh) * | 2013-10-09 | 2014-01-08 | 北京奇虎科技有限公司 | 点对点网络上传数据、下载数据的方法及装置 |
CN107545349A (zh) * | 2016-06-28 | 2018-01-05 | 国网天津市电力公司 | 一种面向电力大数据的数据质量分析评价模型 |
CN106355447A (zh) * | 2016-08-31 | 2017-01-25 | 国信优易数据有限公司 | 一种数据商品的价格评估方法及系统 |
CN106469395A (zh) * | 2016-08-31 | 2017-03-01 | 国信优易数据有限公司 | 一种数据商品动态综合评估方法及系统 |
CN106503912A (zh) * | 2016-10-27 | 2017-03-15 | 国信优易数据有限公司 | 一种数据服务系统 |
CN106503228A (zh) * | 2016-10-28 | 2017-03-15 | 国信优易数据有限公司 | 一种数据包稀缺性评估方法及其系统 |
CN106934493A (zh) * | 2017-02-28 | 2017-07-07 | 北京科技大学 | 一种电力客户价值评估模型的构建方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021179496A1 (zh) * | 2020-03-10 | 2021-09-16 | 南方电网科学研究院有限责任公司 | 一种数据交易方法及数据交易系统 |
CN111539770B (zh) * | 2020-04-27 | 2023-06-16 | 国云数字科技(重庆)有限公司 | 一种数据资产智能评估方法及系统 |
CN111539770A (zh) * | 2020-04-27 | 2020-08-14 | 启迪数华科技有限公司 | 一种数据资产智能评估方法及系统 |
CN111680045A (zh) * | 2020-06-15 | 2020-09-18 | 华晨宝马汽车有限公司 | 生成关于车辆的数据价值流的方法和装置及存储介质 |
CN112269777A (zh) * | 2020-10-12 | 2021-01-26 | 同盾控股有限公司 | 一种数据产品质量评估方法及装置 |
CN112269777B (zh) * | 2020-10-12 | 2022-09-27 | 同盾控股有限公司 | 一种数据产品质量评估方法及装置 |
CN113592649A (zh) * | 2021-07-28 | 2021-11-02 | 北京易华录信息技术股份有限公司 | 一种数据资产价值确定方法、装置及电子设备 |
CN113919602A (zh) * | 2021-12-13 | 2022-01-11 | 华南师范大学 | 一种大数据交易的数据价值双向评估方法及系统 |
CN113919602B (zh) * | 2021-12-13 | 2022-03-29 | 华南师范大学 | 一种大数据交易的数据价值双向评估方法及系统 |
CN115689596A (zh) * | 2022-08-27 | 2023-02-03 | 北京华宜信科技有限公司 | 一种非定制化数据资产估值方法 |
CN115689596B (zh) * | 2022-08-27 | 2023-07-07 | 北京华宜信科技有限公司 | 一种非定制化数据资产估值方法 |
CN116433080A (zh) * | 2023-03-17 | 2023-07-14 | 交通运输部规划研究院 | 交通运输规划行业的数据共享评分方法、装置及电子设备 |
CN116433080B (zh) * | 2023-03-17 | 2024-02-27 | 交通运输部规划研究院 | 交通运输规划行业的数据共享评分方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110766428A (zh) | 一种数据价值评估系统以及方法 | |
Beladev et al. | Recommender systems for product bundling | |
Hu et al. | Search and learning at a daily deals website | |
Huang et al. | Winner determination for risk aversion buyers in multi-attribute reverse auction | |
CN109711955B (zh) | 基于当前订单的差评预警方法、系统、黑名单库建立方法 | |
CN110704730B (zh) | 基于大数据的产品数据推送方法、系统及计算机设备 | |
CN110659926A (zh) | 一种数据价值评估系统以及方法 | |
CN108764707A (zh) | 一种数据评估系统以及方法 | |
CN111144986B (zh) | 一种基于分享行为的社交电商网站商品推荐方法及装置 | |
Wu et al. | User Value Identification Based on Improved RFM Model and K‐Means++ Algorithm for Complex Data Analysis | |
CN108764705A (zh) | 一种数据质量评估平台以及方法 | |
JP2018139036A (ja) | 分析装置 | |
CN112132618A (zh) | 一种商品价格确定方法、装置、设备及可读存储介质 | |
CN111652653A (zh) | 价格确定及预测模型构建的方法、装置、设备及存储介质 | |
CN113095861A (zh) | 目标对象成交概率的预测方法、装置、设备及存储介质 | |
CN111861679A (zh) | 一种基于人工智能的商品推荐方法 | |
CN116385048A (zh) | 一种农产品智慧营销方法和系统 | |
CN112269920A (zh) | 一种用于鉴定刷单的方法 | |
CN115511546A (zh) | 一种电商用户的行为分析方法、系统、设备及可读介质 | |
CN116402569A (zh) | 基于知识图谱的商品推荐方法、装置、系统及存储介质 | |
CN114493361A (zh) | 一种商品推荐算法的有效性评估方法和装置 | |
CN110858343A (zh) | 一种数据资产价值评估系统以及方法 | |
Govindaraju et al. | Stakeholder role in e-commerce adoption by small and medium enterprises | |
CN115841345A (zh) | 跨境大数据智能化分析方法、系统以及存储介质 | |
KR102531633B1 (ko) | 기술 자산 기여도를 이용한 제약 산업 기술자산평가 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 101-8, 1st floor, building 31, area 1, 188 South Fourth Ring Road West, Fengtai District, Beijing Applicant after: Guoxin Youyi Data Co.,Ltd. Address before: 100070, No. 188, building 31, headquarters square, South Fourth Ring Road West, Fengtai District, Beijing Applicant before: SIC YOUE DATA Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200207 |