CN109447474A - 一种用户数据价值评估方法以及评估系统 - Google Patents
一种用户数据价值评估方法以及评估系统 Download PDFInfo
- Publication number
- CN109447474A CN109447474A CN201811278661.5A CN201811278661A CN109447474A CN 109447474 A CN109447474 A CN 109447474A CN 201811278661 A CN201811278661 A CN 201811278661A CN 109447474 A CN109447474 A CN 109447474A
- Authority
- CN
- China
- Prior art keywords
- user data
- attribute tags
- weight
- data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0278—Product appraisal
Abstract
本申请提供一种用户数据价值评估方法以及评估系统;该系统包括:成本确定模块,用于确定待评估数据集的获取成本;调整权重确定模块用于为待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个属性标签所涵盖的各条用户数据每次在使用时对应属性标签的使用权重,计算每个属性标签的调整权重;调整因子确定模块用于根据各个属性标签所涵盖的用户数据被使用的总次数,以及各个属性标签对应的调整权重计算各个属性标签的调整因子;评估模块用于根据各个属性标签的调整因子以及待评估数据集的获取成本,确定待评估数据集的价值。本申请实施例能够避免用户的隐私被其他人获知,且能够获得较为准确的评估结果。
Description
技术领域
本申请涉及数据评估技术领域,具体而言,涉及一种用户数据价值评估方法以及评估系统。
背景技术
在数字信息飞速发展的今天,用户数据资产越来越成为数据资产中的重要类型。对用户数据资产的评估成为数据资产评估的重要组成部分。
当前对用户数据资产进行评估的方法,一般是采用对其他数据资产,如政务数据、企业数据等方法是一样的。并没有专门用于针对用户数据价值进行评估的方法,而采用对其他数据资产评估方法对用户数据资产进行评估。在采用其他数据资产评估方法对用户数据资产进行评估的时候,通常是将用户数据资产交付给资产评估机构,由资产评估机构的资产评估专家按照一定的评估流程对用户数据资产进行评估。但是由于用户数据资产涉及隐私问题,因此很多用户都不愿意将自己的用户数据资产交付资产评估专家,且由资产评估专家对用户数据资产进行评估的评估结果容易受到人为因素的影响,从而造成了评估难度大,评估结果精确度低的问题。
发明内容
有鉴于此,本申请实施例的目的在于提供一种用户数据价值评估方法以及评估系统,在对用户数据进行评估过程中不需要人为参与,能够避免用户的隐私被其他人获知,且能够获得较为准确的评估结果。
第一方面,本申请实施例提供了一种用户数据价值评估系统,该系统包括:
成本确定模块,用于确定待评估数据集的获取成本,所述待评估数据集中包括多条用户数据;
调整权重确定模块,用于为所述待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个所述属性标签所涵盖的各条所述用户数据每次在使用时,对应所述属性标签的使用权重,计算每个所述属性标签的调整权重;
调整因子确定模块,用于根据各个所述属性标签所涵盖的所述用户数据被使用的总次数,以及各个所述属性标签对应的调整权重计算各个所述属性标签的调整因子;
评估模块,用于根据各个所述属性标签的所述调整因子,以及所述待评估数据集的获取成本,确定所述待评估数据集的价值。
一种可选实施方式中,所述用户数据包括来自互联网平台的用户操作数据。
一种可选实施方式中,所述为所述待评估数据集中的每条用户数据确定属性标签的方式包括:
确定所述用户操作数据信息对应的操作场景、用户行为;
根据所述确定的所述操作场景以及所述用户行为,确定所述用户操作数据的属性标签。
一种可选实施方式中,所述获取成本包括:工资成本、设备成本、协作成本、培训成本、差旅成本、管理成本、运维成本、数据购买成本中一项或者多项。
一种可选实施方式中,基于各个所述属性标签所涵盖的各条所述用户数据每次在使用时,对应所述属性标签的使用权重的方式包括:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
一种可选实施方式中,基于各个所述属性标签所涵盖的各条所述用户数据每次在使用时,对应所述属性标签的使用权重的方式包括:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
第二方面,本申请实施例提供了一种用户数据价值评估方法,该方法包括:
确定待评估数据集的获取成本,所述待评估数据集中包括多条用户数据;
为所述待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个所述属性标签所涵盖的各条所述用户数据每次在使用时,对应所述属性标签的使用权重,计算每个所述属性标签的调整权重;
根据各个所述属性标签所涵盖的所述用户数据被使用的总次数,以及各个所述属性标签对应的调整权重计算各个所述属性标签的调整因子;
根据各个所述属性标签的所述调整因子,以及所述待评估数据集的获取成本,确定所述待评估数据集的价值。
一种可选实施方式中,所述用户数据包括来自互联网平台的用户操作数据。
一种可选实施方式中,所述为所述待评估数据集中的每条用户数据确定属性标签的方式包括:
确定所述用户操作数据信息对应的操作场景、用户行为;
根据所述确定的所述操作场景以及所述用户行为,确定所述用户操作数据的属性标签。
一种可选实施方式中,所述获取成本包括:工资成本、设备成本、协作成本、培训成本、差旅成本、管理成本、运维成本、数据购买成本中一项或者多项。
一种可选实施方式中,采用下述方式获得各个所述属性标签的使用权重:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
一种可选实施方式中,采用下述方式获得各个所述属性标签的使用权重:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第二方面中任一种可选的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第二方面中任一种可选的实施方式中的步骤。
本申请实施例中,为待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个属性标签所涵盖的各条用户数据每次在使用时,对应属性标签的使用权重,计算每个属性标签的调整权重,然后根据各个属性标签所涵盖的用户数据被使用的总次数,以及各个属性标签对应的调整权重计算各个属性标签的调整因子;并据各个属性标签的调整因子,以及待评估数据集的获取成本,对用户数据的价值进行自动评估,在评估过程中不需要人为参与,能够避免用户的隐私被其他人获知,且能够获得较为准确的评估结果。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种用户数据价值评估系统的示意图;
图2示出了本申请实施例所提供的用户数据价值评估方法的流程图;
图3示出了本申请实施例所提供的一种计算机设备300的示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例中,提供一种可以针对性对用户数据进行评估的系统,该系统基于待评估数据集的获取成本、待评估数据集中包括的多条用户数据分别对应的属性标签,以及各个属性标签所涵盖的各条用户数据被使用的次数对用户数据的价值进行自动评估,在评估过程中不需要人为参与,能够避免用户的隐私被其他人获知,且能够获得较为准确的评估结果。
基于此,本申请提供的一种用户数据价值评估方法以及评估系统,可以针对性的对用户数据价值进行评估,得到的评估结果更加的准确。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种用户数据价值评估系统进行详细介绍,本申请实施例中的用户数据,可以是用户对互联网平台进行操作的用户操作数据。
实施例一
参见图1所示,本申请实施例一提供一种用户数据价值评估系统,包括:
成本确定模块11、调整权重确定模块12、调整因子确定模块13以及评估模块14。
A,成本确定模块11,用于确定待评估数据集的获取成本,待评估数据集中包括多条用户数据。
在具体实现的时候,待评估数据集中所包括的多条用户数据,可以是用户操作数据,例如:用户搜索、浏览、购买、添加到购物车、评论、点击、点赞、收藏、消费等操作数据。对数据集的获取,包括利用网络手段的数据采集,如:利用网络爬虫爬取,也包括利用非网络手段的数据采集,如:调查问卷等方式,还包括数据购买等。由此,待评估数据集的获取成本,包括但不限于工资成本、设备成本、协作成本、培训成本、差旅成本、管理成本、运维成本、数据购买成本中一项或者多项。
其中,工资成本是指为了获取待评估数据,向待评估数据收集人员支付的工资。设备成本,是指获取待评估数据时所使用的设备支出。协作成本,是指获取待评估数据时需要与其它合作对象协作时的支出。培训成本,是指为了获取待评估数据而对带评估数据收集人员进行培训的支出。
B,调整权重确定模块12,用于为待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个属性标签所涵盖的各条用户数据每次在使用时,对应属性标签的使用权重,计算每个属性标签的调整权重。
在具体实现的时候,属性标签用于表征用户数据所具有的属性。在为每条用户数据确定对应的属性标签时,用户数据产生的操作场景不同,用户的行为不同,确定的属性标签也不一样。
具体地,可以采用下述方式为待评估数据集中的每条用户数据确定属性标签:首先,确定用户操作数据信息对应的操作场景、用户行为;然后,根据确定的操作场景以及用户行为,确定用户操作数据的属性标签。此处,操作场景一般是指用户发生操作的场景。具体而言,用户行为,包括动作行为和操作对象。
例如,当用户操作数据的操作场景为视频互联网平台,用户行为包括对某个操作对象电影A发生了点击观看和/或评论的动作行为。
则为该次用户操作数据添加的属性标签包括:基于用户对电影A发生点击观看以及评论行为添加的属性标签,以及基于用户的操作对象电影A添加的属性标签。其中,基于用户的动作行为添加的属性标签可以包括:“观看”,“时长”、“点赞(如果有点赞操作)”等;基于用户的操作对象添加的属性标签可以包括:“电影”、“国外冒险类”、“导演”等。
又例如,当用户操作数据的操作场景为购物互联网平台,用户行为包括对作为操作对象的商品B发生了购买的操作,并发生了购买运费险、换货、确认收货以及评论的操作。则为该用户操作数据添加的属性标签可以包括:“购买”、“运费险”、“换货”、“确认收货”以及“评论”等动作行为添加的属性标签;基于用户的操作对象添加的属性标签包括:“产品名称(如:XX产品)”、“产品种类(如:xx类型)”、“生产商(如:XX厂商)”、等。
另外,在为每条用户数据确定该用户数据对应的属性标签的时候,还可以根据操作行为的动态信息数据以及静态信息数据,分别生成属性标签。
例如,用户数据可以包括:静态信息数据和动态信息数据;
其中,静态信息数据又包括但不限于:用户的基本属性、社会属性以及消费属性。其中,用户的基本属性,如昵称、姓名、性别、出生年月、籍贯、婚姻状况以及学历中一种或者多种;用户的社会属性,如家庭组标识、家庭类型、家庭人数、小孩标签、来人标签、汽车标签中一种或者多种;用户的消费属性,预设时间段、预设时间段的消费金额、消费次数、消费种类、首次消费时间、最后一次消费时间中一种或者多种。
动态信息数据又包括但不限于:行为属性和偏好属性;其中,行为属性如登陆互联网平台的时长、登陆深度、预设时间段内发生的评论数、点赞数、浏览数等中一种或者多种。偏好属性如价格偏好、类目偏好、特征偏好等。
在确定了待评估数据集中每条用户数据对应的属性标签后,就可以基于各个属性标签所涵盖的各条用户数据每次在使用时对应的使用权重,计算每个属性标签的调整权重。
具体地,使用权重用于表征属性标签涵盖的每条用户数据在被使用时所占据的待评估数据集的评估结果的重要程度;调整权重,则是表征属性标签在占据的待评估数据集的评估结果的重要程度。
本申请实施例一些实施方式中,同一属性标签涵盖的所有用户数据在每次被使用时,该属性标签的标签权重可以相同。
此时,本申请实施例提供的调整权重确定模块12用于采用下述方式基于各个属性标签所涵盖的各条用户数据每次在使用时,对应属性标签的使用权重:
针对每个属性标签,针对该属性标签所涵盖的各条用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
例如:
示例一:假设有标签A、B、E;分别对应的标签权重包括:a、b和e。
用户数据包括:M1~M5,且用户数据M1~M5被使用的次数均为1;且
M1具有的标签为:A和B;
M2具有的标签为:A和E;
M3具有的标签为:B和E;
M4具有的标签为:A、B、E;
M5具有的标签为:B;
标签A被使用的次数为3;标签B被使用的次数为4,标签E被使用的次数为3。
以标签A为例,标签A涵盖的用户数据包括:M1、M2和M4;
(1)用户数据M1被使用时,所具有的所有标签为A和B,且标签A和B的标签权重分别为:a和b;
则用户数据M1在该次使用时,所具有的标签A的使用权重为:
(2)用户数据M2被使用时,所具有的所有标签为A和E,且标签A和E的标签权重分别为:a和e;则M2在该次使用时,所具有的标签A的使用权重为:
(3)用户数据M4被使用时,所具有的所有标签为A、B和E,且标签A、B和E的标签权重分别为:a、b和e。
则M4在该次使用时,所具有的标签A的使用权重为:
则根据标签A的所有使用权重,得到标签A的调整权重:
基于相同的方式,就能够得到标签B以及标签E分别对应的调整权重。
本申请实施例一些实施方式中,同一属性标签涵盖的所有用户数据在每次被使用时,根据不同的使用行为和使用权重,该属性标签的标签权重可以不同。
此时,本申请实施例提供的调整权重确定模块12用于采用下述方式基于各个属性标签所涵盖的各条用户数据每次在使用时,对应属性标签的使用权重:
针对每个属性标签,并针对该属性标签所涵盖的各条用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
在具体实施中,假设有标签A、B、E;
用户数据包括:M1~M5,且用户数据M1~M5被使用的次数均为1;且
M1具有的标签为:A和B;
M2具有的标签为:A和E;
M3具有的标签为:B和E;
M4具有的标签为:A、B、E;
M5具有的标签为:B;
标签A被使用的次数为3;标签B被使用的次数为4,标签E被使用的次数为3。
以标签A为例,标签A涵盖的用户数据包括:M1、M2和M4;
(1)用户数据M1被使用时,所具有的所有标签为A和B,且标签A和B的标签权重分别为:a1和b1。
则用户数据M1在该次使用时,所具有的标签A的使用权重为:
(2)用户数据M2被使用时,所具有的所有标签为A和E,且标签A和E的标签权重分别为:a2和e1;
则M2在该次使用时,所具有的标签A的使用权重为:
(3)用户数据M4被使用时,所具有的所有标签为A、B和E,且标签A、B和E的标签权重分别为:a3、b2和e2。
则M4在该次使用时,所具有的标签A的使用权重为:
则根据标签A的所有使用权重,得到标签A的调整权重:
基于相同的方式,就能够得到标签B以及标签E分别对应的调整权重。
其中,用户数据每次被使用时,所具有的属性标签的标签权重满足:
标签权重=衰减因子×行为权重×网址子权重。
此处,衰减因子根据标签的重要程度进行设定。行为权重,是根据各种操作行为所占据的权重预先进行设定的。例如:可以设定属性标签为“购买”的行为权重高于“浏览”的行为权重。网址子权重则是根据用户操作的互联网平台相关,也是根据互联网平台所占据的重要位置预先设置好。例如:当互联网平台包括M和N时,使用互联网平台M的用户多于使用互联网平台N的用户,则用户使用互联网平台发M生操作行为对应的用户数据对应的网址子权重,高于用户使用互联网平台发N生操作行为对应的用户数据对应的网址子权重。
C:调整因子确定模块13,用于根据各个属性标签所涵盖的用户数据被使用的总次数,以及各个属性标签对应的调整权重计算各个属性标签的调整因子。
具体地,各个属性标签所涵盖的用户数据被使用的总次数,也即各个属性标签被使用的总次数。
在一些实施例中,可以采用下述方式,基于各个属性标签所涵盖的用户数据被使用的总次数,以及各个属性标签对应的调整权重计算各个属性标签的调整因子:
其中,ti表示第i个属性标签所涵盖的用户数据被使用的总次数。表示属性标签对应的调整权重。Sj表示属性标签所涵盖的用户数据第j次被使用时,对应属性标签的使用权重。
例如:在上述示例一中,标签A涵盖的所有用户数据被使用的总次数tA为3。
则标签A的调整因子
基于相同的原理,分别得到标签B的调整因子和标签C的调整因子。
D:评估模块14,用于根据各个属性标签的调整因子,以及待评估数据集的获取成本,确定待评估数据集的价值。
在具体实现的时候,在一些实施例中,可以将各个属性标签的调整因子进行累加求和,然后根据调整因子累加求和的结果,与获取成本之间的乘积,作为到评估数据集的价值。
例如:
其中,P表示待评估数据集的价值;C表示获取成本;表示第i个属性标签的调整因子;m表示第i个属性标签被使用的次数为m次;n表示属性标签有n个。
本申请实施例中,为待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个属性标签所涵盖的各条用户数据每次在使用时,对应属性标签的使用权重,计算每个属性标签的调整权重,然后根据各个属性标签所涵盖的用户数据被使用的总次数,以及各个属性标签对应的调整权重计算各个属性标签的调整因子;并据各个属性标签的调整因子,以及待评估数据集的获取成本,对用户数据的价值进行自动评估,在评估过程中不需要人为参与,能够避免用户的隐私被其他人获知,且能够获得较为准确的评估结果。
基于同一发明构思,本申请实施例中还提供了与用户数据价值评估系统对应的用户数据价值评估方法,由于本申请实施例中的方法解决问题的原理与本申请实施例上述用户数据价值评估系统相似,因此装置的方法可以参见系统的实施,重复之处不再赘述。
参见图2所示,本申请实施例提供的用户数据价值评估方法,包括:
S201:确定待评估数据集的获取成本,所述待评估数据集中包括多条用户数据;
S202:为所述待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个所述属性标签所涵盖的各条所述用户数据每次在使用时,对应所述属性标签的使用权重,计算每个所述属性标签的调整权重;
S203:根据各个所述属性标签所涵盖的所述用户数据被使用的总次数,以及各个所述属性标签对应的调整权重计算各个所述属性标签的调整因子;
S204:根据各个所述属性标签的所述调整因子,以及所述待评估数据集的获取成本,确定所述待评估数据集的价值。
本申请实施例中,为待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个属性标签所涵盖的各条用户数据每次在使用时,对应属性标签的使用权重,计算每个属性标签的调整权重,然后根据各个属性标签所涵盖的用户数据被使用的总次数,以及各个属性标签对应的调整权重计算各个属性标签的调整因子;并据各个属性标签的调整因子,以及待评估数据集的获取成本,用户数据的价值进行自动评估,在评估过程中不需要人为参与,能够避免用户的隐私被其他人获知,且能够获得较为准确的评估结果。
一种可选实施方式中,所述用户数据包括来自互联网平台的用户操作数据。
一种可选实施方式中,所述为所述待评估数据集中的每条用户数据确定属性标签的方式包括:
确定所述用户操作数据信息对应的操作场景、用户行为;
根据所述确定的所述操作场景以及所述用户行为,确定所述用户操作数据的属性标签。
一种可选实施方式中,所述获取成本包括:工资成本、设备成本、协作成本、培训成本、差旅成本、管理成本、运维成本、数据购买成本中一项或者多项。
一种可选实施方式中,采用下述方式获得各个所述属性标签的使用权重:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
一种可选实施方式中,采用下述方式获得各个所述属性标签的使用权重:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
如图3所示,对应于图2中的用户数据价值评估方法,本申请实施例还提供了一种计算机设备300,如图3所示,为本申请实施例提供的计算机设备300结构示意图,包括:
处理器31、存储器32、和总线33;存储器32用于存储执行指令,包括内存321和外部存储器322;这里的内存321也称内存储器,用于暂时存放处理器31中的运算数据,以及与硬盘等外部存储器322交换的数据,处理器31通过内存321与外部存储器322进行数据交换,当所述用户设备30运行时,所述处理器31与所述存储器32之间通过总线33通信,使得所述处理器31在用户态执行以下指令:
确定待评估数据集的获取成本,所述待评估数据集中包括多条用户数据;
为所述待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个所述属性标签所涵盖的各条所述用户数据每次在使用时,对应所述属性标签的使用权重,计算每个所述属性标签的调整权重;
根据各个所述属性标签所涵盖的所述用户数据被使用的总次数,以及各个所述属性标签对应的调整权重计算各个所述属性标签的调整因子;
根据各个所述属性标签的所述调整因子,以及所述待评估数据集的获取成本,确定所述待评估数据集的价值。
一种可能的实施方式中,处理器31执行的指令中,所述用户数据包括来自互联网平台的用户操作数据。
一种可能的实施方式中,处理器31执行的指令中,所述为所述待评估数据集中的每条用户数据确定属性标签的方式包括:
确定所述用户操作数据信息对应的操作场景、用户行为;
根据所述确定的所述操作场景以及所述用户行为,确定所述用户操作数据的属性标签。
一种可能的实施方式中,处理器31执行的指令中,所述获取成本包括:工资成本、设备成本、协作成本、培训成本、差旅成本、管理成本、运维成本、数据购买成本中一项或者多项。
一种可能的实施方式中,处理器31执行的指令中,采用下述方式获得各个所述属性标签的使用权重:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
一种可能的实施方式中,处理器31执行的指令中,采用下述方式获得各个所述属性标签的使用权重:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
对应于图2中的用户数据价值评估方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器31运行时执行上述用户数据价值评估方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述用户数据价值评估方法,从而解决先有技术中存在的评估难度大,评估结果精确度低的问题,进而达到对用户数据进行评估过程中不需要人为参与,能够避免用户的隐私被其他人获知,且能够获得较为准确的评估结果。
本申请实施例所提供的用户数据价值评估方法以及评估系统的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种用户数据价值评估系统,其特征在于,该系统包括:
成本确定模块,用于确定待评估数据集的获取成本,所述待评估数据集中包括多条用户数据;
调整权重确定模块,用于为所述待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个所述属性标签所涵盖的各条所述用户数据每次在使用时,对应所述属性标签的使用权重,计算每个所述属性标签的调整权重;
调整因子确定模块,用于根据各个所述属性标签所涵盖的所述用户数据被使用的总次数,以及各个所述属性标签对应的调整权重计算各个所述属性标签的调整因子;
评估模块,用于根据各个所述属性标签的所述调整因子,以及所述待评估数据集的获取成本,确定所述待评估数据集的价值。
2.根据权利要求1所述的系统,其特征在于,
所述用户数据包括来自互联网平台的用户操作数据。
3.根据权利要求2所述的系统,其特征在于,所述为所述待评估数据集中的每条用户数据确定属性标签的方式包括:
确定所述用户操作数据信息对应的操作场景、用户行为;
根据所述确定的所述操作场景以及所述用户行为,确定所述用户操作数据的属性标签。
4.根据权利要求1所述的系统,其特征在于,所述获取成本包括:工资成本、设备成本、协作成本、培训成本、差旅成本、管理成本、运维成本、数据购买成本中一项或者多项。
5.根据权利要求1所述的系统,其特征在于,基于各个所述属性标签所涵盖的各条所述用户数据每次在使用时,对应所述属性标签的使用权重的方式包括:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
6.根据权利要求1所述的系统,其特征在于,基于各个所述属性标签所涵盖的各条所述用户数据每次在使用时,对应所述属性标签的使用权重的方式包括:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
7.一种用户数据价值评估方法,其特征在于,该方法包括:
确定待评估数据集的获取成本,所述待评估数据集中包括多条用户数据;
为所述待评估数据集中的每条用户数据确定该用户数据对应的属性标签,并基于各个所述属性标签所涵盖的各条所述用户数据每次在使用时,对应所述属性标签的使用权重,计算每个所述属性标签的调整权重;
根据各个所述属性标签所涵盖的所述用户数据被使用的总次数,以及各个所述属性标签对应的调整权重计算各个所述属性标签的调整因子;
根据各个所述属性标签的所述调整因子,以及所述待评估数据集的获取成本,确定所述待评估数据集的价值。
8.根据权利要求7所述的方法,其特征在于,采用下述方式获得各个所述属性标签的使用权重:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的标签权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
9.根据权利要求7所述的方法,其特征在于,采用下述方式获得各个所述属性标签的使用权重:
针对每个所述属性标签,并针对该属性标签所涵盖的各条所述用户数据中的每条用户数据,确定该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重;
根据该用户数据在每次被使用时所具有的所有属性标签分别对应的行为权重以及网址子权重,计算该用户数据在每次被使用时,该属性标签对应的使用权重。
10.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求7-9任意一项所述的用户数据价值评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811278661.5A CN109447474A (zh) | 2018-10-30 | 2018-10-30 | 一种用户数据价值评估方法以及评估系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811278661.5A CN109447474A (zh) | 2018-10-30 | 2018-10-30 | 一种用户数据价值评估方法以及评估系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109447474A true CN109447474A (zh) | 2019-03-08 |
Family
ID=65549850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811278661.5A Pending CN109447474A (zh) | 2018-10-30 | 2018-10-30 | 一种用户数据价值评估方法以及评估系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109447474A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263073A (zh) * | 2019-06-20 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 一种数据价值评估方法及相关装置 |
CN112817834A (zh) * | 2021-01-22 | 2021-05-18 | 上海哔哩哔哩科技有限公司 | 数据表评估方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069575A (zh) * | 2015-08-19 | 2015-11-18 | 安徽继远软件有限公司 | 一种数据资产价值的评估方法 |
CN107292465A (zh) * | 2016-03-31 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 用户评价方法、装置及设备 |
CN107358358A (zh) * | 2017-07-12 | 2017-11-17 | 北京中金浩资产评估有限责任公司 | 一种基于计算机技术的资产评估市场法 |
CN108090835A (zh) * | 2017-12-29 | 2018-05-29 | 中国电子科技集团公司信息科学研究院 | 一种城市数据资产价值评估系统及方法 |
-
2018
- 2018-10-30 CN CN201811278661.5A patent/CN109447474A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069575A (zh) * | 2015-08-19 | 2015-11-18 | 安徽继远软件有限公司 | 一种数据资产价值的评估方法 |
CN107292465A (zh) * | 2016-03-31 | 2017-10-24 | 阿里巴巴集团控股有限公司 | 用户评价方法、装置及设备 |
CN107358358A (zh) * | 2017-07-12 | 2017-11-17 | 北京中金浩资产评估有限责任公司 | 一种基于计算机技术的资产评估市场法 |
CN108090835A (zh) * | 2017-12-29 | 2018-05-29 | 中国电子科技集团公司信息科学研究院 | 一种城市数据资产价值评估系统及方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263073A (zh) * | 2019-06-20 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 一种数据价值评估方法及相关装置 |
CN110263073B (zh) * | 2019-06-20 | 2024-02-02 | 腾讯科技(深圳)有限公司 | 一种数据价值评估方法及相关装置 |
CN112817834A (zh) * | 2021-01-22 | 2021-05-18 | 上海哔哩哔哩科技有限公司 | 数据表评估方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shamout et al. | A conceptual model for the adoption of autonomous robots in supply chain and logistics industry | |
CN107729937A (zh) | 用于确定用户兴趣标签的方法及装置 | |
US20180357703A1 (en) | Recommendations Based Upon Explicit User Similarity | |
Inegbedion et al. | Inventory management and organisational efficiency | |
Farr et al. | The importance of water clarity to Great Barrier Reef tourists and their willingness to pay to improve it | |
Shermon | Systems cost engineering: program affordability management and cost control | |
JP6101620B2 (ja) | 購買予測装置、方法、及びプログラム | |
Sazvar et al. | A new order splitting model with stochastic lead times for deterioration items | |
CN109447474A (zh) | 一种用户数据价值评估方法以及评估系统 | |
Omar et al. | A single-vendor multi-buyer integrated production-inventory system with stock-dependent demand | |
Alekseevna et al. | The concept of digital transformation of the society | |
Soliha et al. | The effect of trust and customer value on loyalty: An empirical study in Indonesia | |
Laurier et al. | Track and trace future, present, and past product and money flows with a resource-event-agent model | |
Hu et al. | Optimization of fast-fashion apparel transshipment among retailers | |
US10824976B2 (en) | Infeasibility management in e-sourcing systems | |
Shah et al. | A note on ‘a replenishment policy for items with price-dependent demand, time-proportional deterioration and no shortages’ | |
CN110781399A (zh) | 一种跨平台的信息推送方法和装置 | |
Rahman et al. | Assessing consumers' willingness to use tagging technology in tracing halal status | |
US20180060953A1 (en) | Enterprise Sales Kit Creation System | |
GB2572061A (en) | A customer personalised control unit, system and method | |
Saranya et al. | An inventory system with replacement and refurbishment of failed items | |
EYİCE BAŞEV | Online buying behaviour of Turkish consumer: An Exploratory study on Hepsiburada. com. | |
Kipkulei | Effects of information technology on reducing perishable waste in supermarkets | |
CN108959324A (zh) | 多媒体展示资源库存量的预估方法、装置及存储介质 | |
CN108665345B (zh) | 标签映射方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100070, No. 101-8, building 1, 31, zone 188, South Fourth Ring Road, Beijing, Fengtai District Applicant after: Guoxin Youyi Data Co.,Ltd. Address before: 100070, No. 188, building 31, headquarters square, South Fourth Ring Road West, Fengtai District, Beijing Applicant before: SIC YOUE DATA Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190308 |