CN110263073A - 一种数据价值评估方法及相关装置 - Google Patents

一种数据价值评估方法及相关装置 Download PDF

Info

Publication number
CN110263073A
CN110263073A CN201910541965.4A CN201910541965A CN110263073A CN 110263073 A CN110263073 A CN 110263073A CN 201910541965 A CN201910541965 A CN 201910541965A CN 110263073 A CN110263073 A CN 110263073A
Authority
CN
China
Prior art keywords
data
assessed
subdata
value
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910541965.4A
Other languages
English (en)
Other versions
CN110263073B (zh
Inventor
刘天斯
农益辉
陈才
朱翔宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910541965.4A priority Critical patent/CN110263073B/zh
Publication of CN110263073A publication Critical patent/CN110263073A/zh
Application granted granted Critical
Publication of CN110263073B publication Critical patent/CN110263073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种数据价值评估方法及相关装置。本申请实施例方法包括:获取与待评估数据相关联的子数据,这些子数据包括直接依赖于待评估数据的数据和间接依赖于待评估数据的数据;然后获取待评估数据的被应用信息和子数据的被应用信息;根据待评估数据的被应用信息和子数据的被应用信息确定待评估数据的评估值,即从数据应用的角度对待评估数据进行了评估,所以评估值能够较好地反映出待评估数据的价值。

Description

一种数据价值评估方法及相关装置
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据价值评估方法及相关装置。
背景技术
随着计算机网络的发展,人类社会来到了大数据时代。
有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,与此类似,大数据并不在“大”,而在于“有用”,所以如何评估数据的价值成为企业需要解决的重要问题。
现有技术中,一般采用成本法对数据进行评估。具体是根据数据获取的方式,将数据分为直接购得与内部积累两种。企业内部积累的数据使用成本法进行价值评估,其成本主要包括初期准备成本和数据收集过程成本,其中初期准备成本是指企业在设备和技术方面花费的成本,而数据收集过程成本是指数据运营的费用。
由于成本法是从成本这个维度对数据进行评估,所以评估结果的参考性较差。
发明内容
本申请实施例提供了一种数据价值评估方法及相关装置,从数据应用的角度对待评估数据进行评估且评估结果能够较好地反映待评估数据的价值。
有鉴于此,本申请实施例第一方面提供了一种数据价值评估方法,包括:
获取与待评估数据相关联的子数据,所述子数据包括直接依赖于所述待评估数据的数据和间接依赖于所述待评估数据的数据;
获取所述待评估数据的被应用信息和所述子数据的被应用信息;
根据所述待评估数据的被应用信息和所述子数据的被应用信息确定待评估数据的评估值。
在一种可能的设计中,在本申请实施例的第一方面的第一种实现方式中,
所述待评估数据的被应用信息包括所述待评估数据的被调用次数,所述子数据的被应用信息包括所述子数据的被调用次数;
所述根据所述待评估数据的被应用信息和所述子数据的被应用信息确定待评估数据的评估值包括:
根据所述待评估数据的被调用次数和所述子数据的被调用次数,确定所述待评估数据的热度评估值;
所述待评估数据的被应用信息还包括依赖所述待评估数据的服务种类数及服务中的功能模块数,所述子数据的被应用信息还包括依赖所述子数据的服务种类数及服务中的功能模块数;
所述根据所述待评估数据的被应用信息和所述子数据的被应用信息确定待评估数据的评估值还包括:
将依赖所述待评估数据的服务种类数与依赖所述子数据的服务种类数的和作为服务总数;
将所述子数据对应的功能模块数与所述待评估数据对应的功能模块数的和作为模块总数;
根据所述服务总数和所述模块总数确定所述待评估数据的应用广度评估值。
所述待评估数据的被应用信息还包括经第一数据应用干预前,预选的两用户群体在所述待评估数据对应业务中投入的第一成本差值,以及在经第一数据应用干预后,所述两用户群体在所述待评估数据对应业务中投入的第二成本差值,其中所述第一数据应用依赖于所述待评估数据;
所述子数据的被应用信息还包括经第二数据应用干预前,预选的两用户群体在所述待评估数据对应业务中投入的第三成本差值,以及在经第二数据应用干预后,所述两用户群体在所述待评估数据对应业务中投入的第四成本差值,其中所述第一数据应用依赖于所述子数据;
所述根据所述待评估数据的被应用信息和所述子数据的被应用信息确定待评估数据的评估值还包括:
根据所述第二成本差值与第一成本差值的差值确定第一收益评估值;
获取所述第四成本差值与第三成本差值的差值作为第二收益评估值;
根据所述第一收益评估值和所述第二收益评估值确定所述待评估数据的收益评估总值。
本申请实施例第二方面提供了一种数据价值评估装置,包括:
第一获取单元,用于获取与待评估数据相关联的子数据,所述子数据包括直接依赖于所述待评估数据的数据和间接依赖于所述待评估数据的数据;
第二获取单元,用于获取所述待评估数据的被应用信息和所述子数据的被应用信息;
评估单元,用于根据所述待评估数据的被应用信息和所述子数据的被应用信息确定待评估数据的评估值。
在一种可能的设计中,在本申请实施例的第二方面的第一种实现方式中,
所述待评估数据的被应用信息包括所述待评估数据的被调用次数,所述子数据的被应用信息包括所述子数据的被调用次数;
所述评估单元用于:
根据所述待评估数据的被调用次数和所述子数据的被调用次数,确定所述待评估数据的热度评估值。
在一种可能的设计中,在本申请实施例的第二方面的第二种实现方式中,
所述待评估数据的被应用信息包括依赖所述待评估数据的服务种类数及服务中的功能模块数,所述子数据的被应用信息包括依赖所述子数据的服务种类数及服务中的功能模块数;
所述评估单元用于:
将依赖所述待评估数据的服务种类数与依赖所述子数据的服务种类数的和作为服务总数;
将所述子数据对应的功能模块数与所述待评估数据对应的功能模块数的和作为模块总数;
根据所述服务总数和所述模块总数确定所述待评估数据的应用广度评估值。
在一种可能的设计中,在本申请实施例的第二方面的第三种实现方式中,
所述待评估数据的被应用信息包括经第一数据应用干预前,预选的两用户群体在所述待评估数据对应业务中投入的第一成本差值,以及在经第一数据应用干预后,所述两用户群体在所述待评估数据对应业务中投入的第二成本差值,其中所述第一数据应用依赖于所述待评估数据;
所述子数据的被应用信息包括经第二数据应用干预前,预选的两用户群体在所述待评估数据对应业务中投入的第三成本差值,以及在经第二数据应用干预后,所述两用户群体在所述待评估数据对应业务中投入的第四成本差值,其中所述第一数据应用依赖于所述子数据;
所述评估单元用于:
根据所述第二成本差值与第一成本差值的差值确定第一收益评估值;
获取所述第四成本差值与第三成本差值的差值作为第二收益评估值;
根据所述第一收益评估值和所述第二收益评估值确定所述待评估数据的收益评估总值。
在一种可能的设计中,在本申请实施例的第二方面的第四种实现方式中,
若所述数据应用依赖于包括所述待评估数据在内的多个数据,则所述评估单元用于:
根据预置的收益分配规则对所述第二成本差值与所述第一成本差值的差值进行分配,以确定所第一收益评估值;
获取所述第四成本差值与第三成本差值的差值作为第二收益评估值;
根据所述第一收益评估值和所述第二收益评估值确定所述待评估数据的收益评估总值。
在一种可能的设计中,在本申请实施例的第二方面的第五种实现方式中,
所述第一获取单元用于:
获取包含目标节点的第一有向图,所述目标节点与所述待评估数据对应,所述第一有向图用于表征所述目标节点与子节点之间的直接或间接的关联关系;
获取与所述子节点对应的数据作为子数据。
在一种可能的设计中,在本申请实施例的第二方面的第五种实现方式中,
所述第一获取单元用于:
获取包含目标节点的第二有向图,所述目标节点与所述待评估数据对应,所述第二有向图用于表征所述目标节点与中间节点和子节点之间的直接或间接的关联关系,所述中间节点所对应的数据不包含被应用信息;
从所述第二有向图中剔除所述中间节点,并对所述子节点进行处理以获取所述第一有向图;
获取与所述子节点对应的数据作为子数据。
在一种可能的设计中,在本申请实施例的第二方面的第六种实现方式中,
所述第一获取单元用于:
获取包含目标节点的第二有向图,所述目标节点与所述待评估数据对应,所述第二有向图用于表征所述目标节点与中间节点和子节点之间的直接或间接的关联关系,所述中间节点所对应的数据不包含被应用信息;
从所述第二有向图中剔除所述中间节点;
通过预置算法检测所述第二有向图中的强连通分量,所述强连通分量与由至少两个子节点组成的节点环对应;
将所述强连通分量所对应的节点环替换为一个新节点,并对所述新节点的连接关系做相应调整,以获取所述第一有向图;
获取与所述子节点对应的数据作为子数据。
本申请实施例的第三方面提供一种终端设备,包括:存储器、收发器、处理器以及总线系统;其中,所述存储器用于存储程序;所述处理器用于执行所述存储器中的所述指令,使得所述通信装置执行如前述第一方面中任一项所述的方法。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如前述第一方面中任一项所述的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
获取待评估数据和子数据被应用的信息,根据待评估数据和子数据被应用的信息确定待评估数据的评估值,由于评估值是由数据被应用的信息决定的,所以本申请实施例从数据应用的角度对待评估数据进行了评估,又因为数据被应用才有价值,所以本申请实施例得到的评估值能够较好地反映待评估数据的价值。
附图说明
图1为数据价值评估的应用示意图;
图2为本申请实施例中数据价值评估方法的一个实施例示意图;
图3为本申请实施例中确定待评估数据的评估值的一个实施例示意图;
图4为数据应用依赖关系有向图;
图5为本申请实施例中数据应用依赖关系有向图的一个实施例示意图;
图6为获取与待评估数据相关联的子数据的示意图;
图7为数据节点的依赖关系的一个实施例示意图;
图8为获取包含目标节点的第一有向图的实施例示意图;
图9为对子节点进行处理以获取第一有向图的实施例示意图;
图10为本申请实施例中数据价值评估装置的一个实施例的结构示意图;
图11为本申请实施例中终端设备一个实施例示意图。
具体实施方式
本申请实施例提供了一种数据价值评估方法及相关装置,能从数据应用的角度对待评估数据进行评估且评估结果能够较好地反映待评估数据的价值。
应理解,数据价值评估有很大的实际意义。请参阅图1,数据价值评估的应用示意图。
数据价值评估的结果反映数据的价值,具体地,所以通过数据价值评估,可以比较同一业务中不同数据表的使用价值,也可以比较不同业务中同一类型数据表的使用价值。从图1中可以看出,将数据价值与数据成本结合可以形成数据投入产出比,以为企业提供可量化的决策依据。根据数据投入产出比和比较结果,企业可以有针对性地、有方向性地优化数据成本,推动挖掘更广的数据应用。
下面对数据价值评估方法进行具体介绍,请参阅图2,本申请实施例中数据价值评估方法的一个实施例示意图。
本申请实施例提供了一种数据价值评估方法的一个实施例,包括:
201,获取与待评估数据相关联的子数据,子数据包括直接依赖于待评估数据的数据和间接依赖于待评估数据的数据。
需要说明的是,数据间的依赖关系可以理解为一个数据基于另一个数据处理得出。而这种依赖关系包括直接依赖和间接依赖,假设数据C依赖于数据B,而数据B依赖于数据A,那么可以理解为数据B直接依赖于数据A,数据C直接依赖于数据B,而数据C间接依赖于数据A。为了更好地理解和区分直接依赖和间接依赖,下面通过举例进行说明。
假设数据A为一款游戏的所有玩家账号,数据B为各个玩家账号的在线时长,数据C为玩家在线时长的排行榜;由于数据B中的在线时长是与玩家账号直接对应的,所以数据B是直接依赖于数据A;由于数据C是对数据B进行排序得到的,所以数据C直接依赖于数据B;又由于数据B直接依赖于数据A,所以数据C间接依赖于数据A。
202,获取待评估数据的被应用信息和子数据的被应用信息。
可以理解的是,数据被应用才有价值,所以本申请实施例获取待评估数据的被应用信息和子数据的被应用信息。
被应用信息可以根据实际需要进行选择,不同业务中的同类型数据,对应的被应用信息可以不同。
例如,本申请实施例以游戏业务为例中,被应用信息可以包括数据的被调用次数,还可以包括经数据应用干预前后用户在该游戏业务中投入的成本;但如果以新闻业务为例,由于不存在用户向新闻业务中投入成本,所以被应用信息可能只包括被调用次数。
同理,同一业务中的不同类型数据,对应的被应用信息也可以不同,具体此处不做详述。
203,根据待评估数据的被应用信息和子数据的被应用信息确定待评估数据的评估值。
需要说明的是,不同被应用信息对应的评估值计算方法可能不同,可以根据实际需要进行灵活调整,下面会以具体的被应用信息为例,对评估值的计算方法进行详细说明。
另外,为了从多个角度分析待评估数据的价值,可以根据评估值对待评估数据的价值划分相应的等级;例如,当评估值位于第一预设值和第二预设值之间时,待评估数据的价值为低等级,当评估值位于第二预设值和第三预设值之间时,待评估数据的价值为中等级,当评估值大于第三预设值时,待评估数据的价值为高等级。
其次,还可以对一个业务中的所有数据价值所在的等级进行统计,得到该业务中数据价值位于各个等级的数据数量、数据比例以及数据数量变化趋势,具体可以以折线图表示数量变化趋势,以饼图或环图展示该业务中数据价值位于各个等级的数据比例。
在本申请实施例中,将待评估数据的应用价值和子数据的应用价值均归结为待评估数据的价值;所以,先获取待评估数据和子数据被应用的信息,根据待评估数据和子数据被应用的信息确定待评估数据的评估值,由于评估值是由数据被应用的信息决定的,所以本申请实施例从数据应用的角度对待评估数据进行了评估,又因为数据被应用才有价值,所以本申请实施例得到的评估值能够较好地反映待评估数据的价值。
可以理解的是,数据被调用的次数越多,代表数据被应用的次数越多,进而代表数据的价值越高。
所以在本申请实施例中,待评估数据的被应用信息可以包括待评估数据的被调用次数,子数据的被应用信息包括子数据的被调用次数。
根据待评估数据的被应用信息和子数据的被应用信息确定待评估数据的评估值可以包括:
根据待评估数据的被调用次数和子数据的被调用次数,确定待评估数据的热度评估值。
需要说明的是,待评估数据被调用次数反映的是待评估数据的热度,所以在本申请实施例中,最终计算出的评估值为热度评估值。
另外,根据待评估数据的被调用次数和子数据的被调用次数确定待评估数据的热度评估值的方法有很多。
例如,可以直接将评估数据的被调用次数和子数据的被调用次数相加得到热度评估值,还可以评估数据的被调用次数和子数据的被调用次数分别乘以相应的权重系数,再相加得到热度评估值。
为了凸显评估数据直接被调用次数的重要性,可以设置评估数据的被调用次数对应的权重大于子数据的被调用次数对应的权重。
进一步地,可以将热度评估值分为“冰”、“冷”、“温”和“热四个等级。”
进一步地,待评估数据的被应用信息还可以包括依赖待评估数据的服务种类数及服务中的功能模块数,子数据的被应用信息包括依赖子数据的服务种类数及服务中的功能模块数。
另外,在一个业务中,依赖待评估数据的服务可以有一种,也可以有多种,一个服务中的功能模块数可以有一个,也可以有多个,本申请实施例对此不做限定。
例如,在一游戏业务中,待评估数据可以为玩家的虚拟财产数据,依赖该待评估数据的服务可以是商城服务,还可以是排行榜服务。
相应地,当依赖该待评估数据的服务为商城服务时,对应的功能模块可以包括人物交易模块、服装交易模块和道具交易模块等,即该商城服务对应的功能模块数为3个。
当依赖该待评估数据的服务为排行榜服务时,对应的功能模块可以是虚拟财产排行榜,即该排行榜服务对应的功能模块数为1个。
下面对确定评估数据的评估值的具体过程进行说明,请参阅图3,本申请实施例中确定待评估数据的评估值的一个实施例示意图。
根据待评估数据的被应用信息和子数据的被应用信息确定待评估数据的评估值包括:
301,将依赖待评估数据的服务种类数与依赖子数据的服务种类数的和作为服务总数。
302,将子数据对应的功能模块数与待评估数据对应的功能模块数的和作为模块总数。
303,根据服务总数和模块总数确定待评估数据的应用广度评估值。
需要说明的是,当待评估数据的被应用信息包括依赖待评估数据的服务种类数及服务中的功能模块数时,待评估数据的价值体现在应用广度上,所以最终计算出的评估值为应用广度评估值。
而根据服务总数和模块总数确定待评估数据的应用广度评估值的方法包括多种,例如,可以直接将服务总数和模块总数相加得到待评估数据的应用广度评估值,还可以通过公式W(S)=n*M计算待评估数据的应用广度评估值,其中n为服务总数,M为模块总数。
可以理解的是,也可以将应用广度评估值划分相应的等级,例如,可以包括“大”、“中”、“小”和“微”四个等级。
在本申请实施例中,确定服务种类数和功能模块数的过程中,可以利用数据应用依赖关系有向图,具体请参阅图4,以待评估数据为例,数据源S为待评估数据,A1至An代表依赖数据源S的服务,F1和F2表示服务中的功能模块,箭头代表依赖关系,箭头由数据源S指向服务A1,则代表服务A1依赖数据源S。
另外,需要说明的是,在本申请实施例中,是将依赖待评估数据的服务种类数与依赖子数据的服务种类数的和作为服务总数,如果为了凸出待评估数据的服务种类数的重要性,也可以将依赖待评估数据的服务种类数与依赖子数据的服务种类数分别乘以相应的权重系数,然后再相加得到服务总数。
同理,模块总数的计算方法也可以采用上述方法,具体不做详述。
进一步地,待评估数据的被应用信息还可以包括经第一数据应用干预前,预选的两用户群体在待评估数据对应业务中投入的第一成本差值,以及在经第一数据应用干预后,两用户群体在待评估数据对应业务中投入的第二成本差值,其中第一数据应用依赖于待评估数据。
需要说明的是,第一数据应用是指依赖待评估数据的数据应用,例如,当待评估数据为游戏账号等级时,对应的数据应用可以是向一定等级的游戏账号推荐相应游戏道具的购买,具体地,当游戏账号等级达到10级时,推荐该游戏账号购买游戏人物所使用的的武器,当游戏账号达到20级时,推荐该游戏账号购买游戏人物的座骑。
可以理解的是,经过第一数据应用干预前后,用户群体在待评估数据对应业务中投入的成本可能发生变化;这里还以评估数据为游戏账号等级为例,假设对应的数据应用向一定等级的游戏账号推荐相应游戏道具的购买,该游戏账号在收到推荐购买游戏道具之前,用户投入的成本为100元人民币,游戏账号在收到推荐购买游戏道具之后,用户投入的成本可能变为200人民币。
因此,本申请通过经过第一数据应用干预前后用户群体在待评估数据对应业务中投入的成本变化情况评估待评估数据的价值。
具体地,因为不同群体投入的成本就存在差异,所以为了避免偶然性,本申请实施例选用了两个用户群体,并选用用户群体在待评估数据对应业务中投入的第一成本差值作为经过第一数据应用干预前的参考数据,选用两用户群体在待评估数据对应业务中投入的第二成本差值作为经过第一数据应用干预后的参考数据。
为了进一步避免偶然性,选用的用户群体可以为同类型用户群体,例如两个用户群体均为20至30岁之间的用户群体,也可以进一步限定两个用户群体均为20至30岁之间的男性用户群体;还可以采用平均差值作为第一成本差值,即先计算一个用户群体在经第一数据应用干预前固定时间段内向待评估数据对应业务中投入的平均成本,然后计算另一个用户群体在经第一数据应用干预前固定时间段内向待评估数据对应业务中投入的平均成本,取两个平均成本的差作为第一成本差值,而固定时间段的长短不做限定,可以为一个月,也可以为一年,甚至可以采用历史平均差值作为第一成本差值。
下面以表格地形式对被应用信息进行进一步说明:
由上表可以看出,两个用户群体为用户群体A和用户群体B,表格里的数据是指每个用户群体分别在11个周期内在待评估数据对应的业务中投入的成本,而在第11个周期内,对用户群体A和用户群体B均进行了同等程度的第一数据应用干预,所以可以通过前10个周期内用户群体A的投入成本计算第一平均成本(47+53+58+52+56+64+61+58+63+67)/10=57.9,通过前10个周期内用户群体B的投入成本计算第二平均成本(49+55+56+58+61+63+59+62+65+59)/10=58.7,那么第一成本差值=第一平均成本-第二平均成本=57.9-58.7=-0.8,而第二成本差值=84-59=25。
同样地,子数据的被应用信息还可以包括经第二数据应用干预前,预选的两用户群体在待评估数据对应业务中投入的第三成本差值,以及在经第二数据应用干预后,两用户群体在待评估数据对应业务中投入的第四成本差值,其中第一数据应用依赖于子数据。
下面对确定评估数据的评估值的具体过程进行说明,请参阅图5,本申请实施例中确定待评估数据的评估值的另一个实施例示意图。
如图5所示,根据待评估数据的被应用信息和子数据的被应用信息确定待评估数据的评估值包括:
501,根据第二成本差值与第一成本差值的差值确定第一收益评估值;
502,获取第四成本差值与第三成本差值的差值作为第二收益评估值;
503,根据第一收益评估值和第二收益评估值确定待评估数据的收益评估总值。
需要说明的是,因为被应用信息与投入的成本变化相关,所以最终计算的评估值为收益评估值。
另外,根据第一收益评估值和第二收益评估值确定待评估数据的收益评估总值的方法也包括多种,可以直接将第一收益评估值和第二收益评估值相加得到收益评估总值,也可以将第一收益评估值和第二收益评估值分别乘以相应的权重系数,然后再相加得到收益评估总值,此处不做具体限定。
进一步地,若数据应用依赖于包括待评估数据在内的多个数据,则根据第二成本差值与第一成本差值的差值确定第一收益评估值可以包括:
根据预置的收益分配规则对第二成本差值与第一成本差值的差值进行分配,以确定第一收益评估值。
可以理解的是,当数据应用依赖多个数据时,计算出的第二成本差值与第一成本差值的差值是所有数据的收益值,本申请实施例中,可以通过收益分配规则对所有数据的收益值进行分配,从而计算得到待评估数据第一收益评估值。
进一步地,请参阅图6,获取与待评估数据相关联的子数据的实施例示意图,包括:
601,获取包含目标节点的第一有向图,目标节点与待评估数据对应,第一有向图用于表征目标节点与子节点之间的直接或间接的关联关系。
请参阅图7,数据节点的依赖关系的一个实施例示意图。在图7所示的第一有向图中,A为目标节点,子节点B和子节点C直接依赖目标节点A,而子节点D、E、F均依赖子节点B,子节点E、F、G均依赖子节点C,其中箭头代表依赖关系,例如,子节点C直接依赖目标节点A,则箭头由目标节点A指向子节点C。
602,获取与子节点对应的数据作为子数据。
可以理解的是,通过第一有向图,可以更快速地确定待评估数据的子数据,尤其当数据库中数据较多且数据间的依赖关系较复杂的情况下。
进一步地,请参阅图8,获取包含目标节点的第一有向图的实施例示意图,获取包含目标节点的第一有向图可以包括:
801,获取包含目标节点的第二有向图,第二有向图用于表征目标节点与中间节点和子节点之间的直接或间接的关联关系,中间节点所对应的数据不包含被应用信息。
需要说明的是,假设待评估数据为一款游戏所有玩家的信息表,假设该信息表中包括玩家账号、玩家昵称、玩家等级和玩家在线时长,而现在需要生成玩家在线时长的排行榜,在但在处理过程中,为了降低处理的数据量,可以从信息表中提取玩家账号和玩家在线时长两个字段的数据并组成中间信息表,然后根据中间信息表生成排行榜,不难理解,该排行榜数据依赖于中间信息表,而中间信息表依赖于待评估数据。
但实际上中间信息表只是一个中间数据,被用过后就被删除,不存在被应用信息,以被应用信息为数据的被调用次数为例,中间信息表的被调用次数为0或没有记录,因此在计算评估值前,可以先删除中间信息表,以减少处理的数据量。
802,从第二有向图中剔除中间节点,并对子节点进行处理以获取第一有向图。
需要说明的是,本申请实施例通过剔除中间节点可以达到简化第二有向图的目的。
进一步地,请参阅图9,对子节点进行处理以获取第一有向图的实施例示意图,包括:
901,通过预置算法检测第二有向图中的强连通分量,强连通分量与由至少两个子节点组成的节点环对应。
需要说明的是,该算法可以为Tarjan算法,还可以是其他能够检测出第二有向图中强联通分量的算法。
可以理解的是,假设数据A依赖于数据B,数据B依赖于数据C,数据C依赖于数据A,则在第二有向图中,这三个数据对应的三个数据节点则构成节点环,使得第二有向图中存在强连通分量。
902,将强连通分量所对应的节点环替换为一个新节点,并对新节点的连接关系做相应调整,以获取第一有向图。
可以理解的是,将节点环替换为一个新节点,那么原先与节点环中任意一节点连接的环外节点,现在则与新节点连接。
相应地,节点环的应用信息也会发生变化,由节点环内每个节点的应用信息计算得到,具体计算方法可以根据实际进行调整,此处不做详述。
下面对本申请实施例中的数据价值评估装置进行详细描述,请参阅图10,本申请实施例提供了一种数据价值评估装置的一个实施例的结构示意图,包括:
第一获取单元1001,用于获取与待评估数据相关联的子数据,子数据包括直接依赖于待评估数据的数据和间接依赖于待评估数据的数据;
第二获取单元1002,用于获取待评估数据的被应用信息和子数据的被应用信息;
评估单元1003,用于根据待评估数据的被应用信息和子数据的被应用信息确定待评估数据的评估值。
进一步地,在数据价值评估装置的另一个实施例中,待评估数据的被应用信息可以包括待评估数据的被调用次数,子数据的被应用信息可以包括子数据的被调用次数;
此时评估单元1003用于:
根据待评估数据的被调用次数和子数据的被调用次数,确定待评估数据的热度评估值。
进一步地,在数据价值评估装置的另一个实施例中,待评估数据的被应用信息可以包括依赖待评估数据的服务种类数及服务中的功能模块数,子数据的被应用信息包括依赖子数据的服务种类数及服务中的功能模块数;
评估单元1003可以用于:
将依赖待评估数据的服务种类数与依赖子数据的服务种类数的和作为服务总数;
将子数据对应的功能模块数与待评估数据对应的功能模块数的和作为模块总数;
根据服务总数和模块总数确定待评估数据的应用广度评估值。
进一步地,在数据价值评估装置的另一个实施例中,待评估数据的被应用信息可以包括经第一数据应用干预前,预选的两用户群体在待评估数据对应业务中投入的第一成本差值,以及在经第一数据应用干预后,两用户群体在待评估数据对应业务中投入的第二成本差值,其中第一数据应用依赖于待评估数据;
子数据的被应用信息可以包括经第二数据应用干预前,预选的两用户群体在待评估数据对应业务中投入的第三成本差值,以及在经第二数据应用干预后,两用户群体在待评估数据对应业务中投入的第四成本差值,其中第一数据应用依赖于子数据;
评估单元1003用于:
根据第二成本差值与第一成本差值的差值确定第一收益评估值;
获取第四成本差值与第三成本差值的差值作为第二收益评估值;
根据第一收益评估值和第二收益评估值确定待评估数据的收益评估总值。
进一步地,在数据价值评估装置的另一个实施例中,若数据应用依赖于包括待评估数据在内的多个数据,则评估单元1003用于:
根据预置的收益分配规则对第二成本差值与第一成本差值的差值进行分配,以确定所第一收益评估值;
获取第四成本差值与第三成本差值的差值作为第二收益评估值;
根据第一收益评估值和第二收益评估值确定待评估数据的收益评估总值。
进一步地,在数据价值评估装置的另一个实施例中,第一获取单元1001可以用于:
获取包含目标节点的第一有向图,目标节点与待评估数据对应,第一有向图用于表征目标节点与子节点之间的直接或间接的关联关系;
获取与子节点对应的数据作为子数据。
进一步地,在数据价值评估装置的另一个实施例中,第一获取单元1001用于:
获取包含目标节点的第二有向图,目标节点与待评估数据对应,第二有向图用于表征目标节点与中间节点和子节点之间的直接或间接的关联关系,中间节点所对应的数据不包含被应用信息;
从第二有向图中剔除中间节点,并对子节点进行处理以获取第一有向图;
获取与子节点对应的数据作为子数据。
进一步地,在数据价值评估装置的另一个实施例中,第一获取单元1001用于:
获取包含目标节点的第二有向图,目标节点与待评估数据对应,第二有向图用于表征目标节点与中间节点和子节点之间的直接或间接的关联关系,中间节点所对应的数据不包含被应用信息;
从第二有向图中剔除中间节点;
通过预置算法检测第二有向图中的强连通分量,强连通分量与由至少两个子节点组成的节点环对应;
将强连通分量所对应的节点环替换为一个新节点,并对新节点的连接关系做相应调整,以获取第一有向图;
获取与子节点对应的数据作为子数据。
请参阅图11,本申请实施例中终端设备一个实施例,可以包括一个或一个以上中央处理器3001,存储器3002,输入输出接口3003,有线或无线网络接口3004,电源3005。
存储器3002可以是短暂存储或持久存储。更进一步地,中央处理器3001可以配置为与存储器3002通信,在用户面功能实体上执行存储器3002中的一系列指令操作。
本实施例中,中央处理器3001可以执行前述实施例中数据价值评估装置所执行的操作,具体此处不再赘述。
本实施例中,中央处理器3001中的具体功能模块划分可以与前述数据价值评估装置中所描述的第一获取单元、第二获取单元、评估单元的功能模块划分方式类似,此处不再赘述。
本申请实施例还提供了一种计算机存储介质,该计算机存储介质用于储存为上述请求的校验装置或服务器所用的计算机软件指令,其包括用于执行为请求数据价值评估装置或终端设备所设计的程序。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机软件指令,该计算机软件指令可通过处理器进行加载来实现上述请求的数据价值评估方法中的流程。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种数据价值评估方法,其特征在于,包括:
获取与待评估数据相关联的子数据,所述子数据包括直接依赖于所述待评估数据的数据和间接依赖于所述待评估数据的数据;
获取所述待评估数据的被应用信息和所述子数据的被应用信息;
根据所述待评估数据的被应用信息和所述子数据的被应用信息确定待评估数据的评估值。
2.根据权利要求1所述的数据价值评估方法,其特征在于,所述待评估数据的被应用信息包括所述待评估数据的被调用次数,所述子数据的被应用信息包括所述子数据的被调用次数;
所述根据所述待评估数据的被应用信息和所述子数据的被应用信息确定待评估数据的评估值包括:
根据所述待评估数据的被调用次数和所述子数据的被调用次数,确定所述待评估数据的热度评估值。
3.根据权利要求1所述的数据价值评估方法,其特征在于,所述待评估数据的被应用信息包括依赖所述待评估数据的服务种类数及服务中的功能模块数,所述子数据的被应用信息包括依赖所述子数据的服务种类数及服务中的功能模块数;
所述根据所述待评估数据的被应用信息和所述子数据的被应用信息确定待评估数据的评估值包括:
将依赖所述待评估数据的服务种类数与依赖所述子数据的服务种类数的和作为服务总数;
将所述子数据对应的功能模块数与所述待评估数据对应的功能模块数的和作为模块总数;
根据所述服务总数和所述模块总数确定所述待评估数据的应用广度评估值。
4.根据权利要求1所述的数据价值评估方法,其特征在于,所述待评估数据的被应用信息包括经第一数据应用干预前,预选的两用户群体在所述待评估数据对应业务中投入的第一成本差值,以及在经第一数据应用干预后,所述两用户群体在所述待评估数据对应业务中投入的第二成本差值,其中所述第一数据应用依赖于所述待评估数据;
所述子数据的被应用信息包括经第二数据应用干预前,预选的两用户群体在所述待评估数据对应业务中投入的第三成本差值,以及在经第二数据应用干预后,所述两用户群体在所述待评估数据对应业务中投入的第四成本差值,其中所述第一数据应用依赖于所述子数据;
所述根据所述待评估数据的被应用信息和所述子数据的被应用信息确定待评估数据的评估值包括:
根据所述第二成本差值与第一成本差值的差值确定第一收益评估值;
获取所述第四成本差值与第三成本差值的差值作为第二收益评估值;
根据所述第一收益评估值和所述第二收益评估值确定所述待评估数据的收益评估总值。
5.根据权利要求4所述的数据价值评估方法,其特征在于,若所述数据应用依赖于包括所述待评估数据在内的多个数据,则所述根据所述第二成本差值与第一成本差值的差值确定第一收益评估值包括:
根据预置的收益分配规则对所述第二成本差值与所述第一成本差值的差值进行分配,以确定第一收益评估值。
6.根据权利要求1所述的数据价值评估方法,其特征在于,所述获取与待评估数据相关联的子数据,包括:
获取包含目标节点的第一有向图,所述目标节点与所述待评估数据对应,所述第一有向图用于表征所述目标节点与子节点之间的直接或间接的关联关系;
获取与所述子节点对应的数据作为子数据。
7.根据权利要求6所述的数据价值评估方法,其特征在于,所述获取包含目标节点的第一有向图,包括:
获取包含目标节点的第二有向图,所述第二有向图用于表征所述目标节点与中间节点和子节点之间的直接或间接的关联关系,所述中间节点所对应的数据不包含被应用信息;
从所述第二有向图中剔除所述中间节点,并对所述子节点进行处理以获取所述第一有向图。
8.根据权利要求7所述的数据价值评估方法,其特征在于,所述对所述子节点进行处理以获取所述第一有向图,包括:
通过预置算法检测所述第二有向图中的强连通分量,所述强连通分量与由至少两个子节点组成的节点环对应;
将所述强连通分量所对应的节点环替换为一个新节点,并对所述新节点的连接关系做相应调整,以获取所述第一有向图。
9.一种数据价值评估装置,其特征在于,包括:
第一获取单元,用于获取与待评估数据相关联的子数据,所述子数据包括直接依赖于所述待评估数据的数据和间接依赖于所述待评估数据的数据;
第二获取单元,用于获取所述待评估数据的被应用信息和所述子数据的被应用信息;
评估单元,用于根据所述待评估数据的被应用信息和所述子数据的被应用信息确定待评估数据的评估值。
10.一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至8中任意一项所述的方法。
CN201910541965.4A 2019-06-20 2019-06-20 一种数据价值评估方法及相关装置 Active CN110263073B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910541965.4A CN110263073B (zh) 2019-06-20 2019-06-20 一种数据价值评估方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910541965.4A CN110263073B (zh) 2019-06-20 2019-06-20 一种数据价值评估方法及相关装置

Publications (2)

Publication Number Publication Date
CN110263073A true CN110263073A (zh) 2019-09-20
CN110263073B CN110263073B (zh) 2024-02-02

Family

ID=67920133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910541965.4A Active CN110263073B (zh) 2019-06-20 2019-06-20 一种数据价值评估方法及相关装置

Country Status (1)

Country Link
CN (1) CN110263073B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114881802A (zh) * 2022-07-11 2022-08-09 湖南三湘银行股份有限公司 基于元数据的数据资产管理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021869A (zh) * 2007-03-15 2007-08-22 华中科技大学 一种数据价值定量评价方法
CN108734405A (zh) * 2018-05-24 2018-11-02 国信优易数据有限公司 一种数据价值评估平台和方法
CN109189828A (zh) * 2018-08-16 2019-01-11 国云科技股份有限公司 一种基于复杂网络的业务部门间数据价值评估的方法
CN109447474A (zh) * 2018-10-30 2019-03-08 国信优易数据有限公司 一种用户数据价值评估方法以及评估系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021869A (zh) * 2007-03-15 2007-08-22 华中科技大学 一种数据价值定量评价方法
CN108734405A (zh) * 2018-05-24 2018-11-02 国信优易数据有限公司 一种数据价值评估平台和方法
CN109189828A (zh) * 2018-08-16 2019-01-11 国云科技股份有限公司 一种基于复杂网络的业务部门间数据价值评估的方法
CN109447474A (zh) * 2018-10-30 2019-03-08 国信优易数据有限公司 一种用户数据价值评估方法以及评估系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114881802A (zh) * 2022-07-11 2022-08-09 湖南三湘银行股份有限公司 基于元数据的数据资产管理方法及系统
CN114881802B (zh) * 2022-07-11 2022-10-04 湖南三湘银行股份有限公司 基于元数据的数据资产管理方法及系统

Also Published As

Publication number Publication date
CN110263073B (zh) 2024-02-02

Similar Documents

Publication Publication Date Title
Mukhametzyanov Specific character of objective methods for determining weights of criteria in MCDM problems: Entropy, CRITIC and SD
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
Yu et al. Challenges and opportunities for trust management in crowdsourcing
Schlosser et al. On the simulation of global reputation systems
JP2010204966A (ja) サンプリング装置、サンプリング方法、サンプリングプログラム、クラス判別装置およびクラス判別システム。
CN104050197B (zh) 一种信息检索系统评测方法和装置
CN113360983B (zh) 一种边坡可靠度分析与风险评估方法
CN109346168A (zh) 一种确定数据相关性的方法及装置
CN110993084A (zh) 一种对象排序方法、装置、设备及可读存储介质
CN108268357A (zh) 实时数据处理方法和装置
CN110263073A (zh) 一种数据价值评估方法及相关装置
CN109271460B (zh) 对电子平台中的商户进行分类的方法和装置
Song et al. Parallel machine scheduling under uncertainty: Models and exact algorithms
CN115794570A (zh) 压力测试方法、装置、设备及计算机可读存储介质
CN112926794A (zh) 银行贷款信息预测方法及装置
CN115186013B (zh) 一种基于航空装备数据采集及分析方法
CN110348807A (zh) 一种信息处理方法和相关装置
CN109615204A (zh) 医疗数据的质量评估方法、装置、设备及可读存储介质
CN107665395A (zh) 数据处理方法、装置、计算机设备和存储介质
CN103578014A (zh) 周期类营销邮件发送频率的确定方法及设备
CN102663006B (zh) 一种数据筛选方法及装置
CN106301880A (zh) 一种确定网络关系稳定度、互联网业务推荐方法和设备
CN114826967B (zh) 一种信息共享能力评估方法及装置
CN110232517A (zh) 一种移动群智感知用户收益选取方法
CN110826994B (zh) 一种数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant