CN112950295B - 用户数据挖掘的方法、装置、可读存储介质和电子设备 - Google Patents
用户数据挖掘的方法、装置、可读存储介质和电子设备 Download PDFInfo
- Publication number
- CN112950295B CN112950295B CN202110430661.8A CN202110430661A CN112950295B CN 112950295 B CN112950295 B CN 112950295B CN 202110430661 A CN202110430661 A CN 202110430661A CN 112950295 B CN112950295 B CN 112950295B
- Authority
- CN
- China
- Prior art keywords
- mean
- variance
- target user
- determining
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 238000005065 mining Methods 0.000 title abstract description 5
- 230000000694 effects Effects 0.000 claims abstract description 63
- 238000009826 distribution Methods 0.000 claims description 46
- 238000004590 computer program Methods 0.000 claims description 15
- 238000007418 data mining Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0208—Trade or exchange of goods or services in exchange for incentives or rewards
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0224—Discounts or incentives, e.g. coupons or rebates based on user history
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种用户数据挖掘的方法、装置、可读存储介质和电子设备。本发明实施例通过获取目标用户的第一历史数据和第二历史数据,第一历史数据为目标用户参加过的积分活动的积分获取值,第二历史数据为目标用户未参加过的积分活动的积分获取值;然后根据第一历史数据确定目标用户的第一均值和第一方差;同时根据第二历史数据确定目标用户的第二均值和第二方差;最后根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的触发阈值。通过上述方法,计算出用于目标用户的积分获取值预期的触发阈值,即为每个目标用户设置奖励,提高了目标用户的使用热情。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种用户数据挖掘的方法、装置、可读存储介质和电子设备。
背景技术
随着互联网应用的发展,改变了人们传统的生活方式,例如,在线教学改变了人们传统的教学方式,在线购物改变了人们传统的购物该方式,在线教学平台和在线购物平台在人们的日常生活使用越来越广泛,以在线教学平台为例,在线教学平台有大量的用户,而用户的使用热情可能会随着时间的增长而减弱,因此,需要保持用户的使用热情。
现有技术中,通过发起一些活动保持用户的使用热情,完成活动会给用户设定数量的奖励,例如,在线教学平台中对完成活动的用户奖励一定数量的积分,针对不同的活动会奖励不同数量的积分,但不同用户对积分的需求是不同的,如果对于同一个活动,每个用户奖励相同的积分,可能无法满足不同用户的需求。
综上所述,如何为每个用户设置奖励,保证用户的使用热情,是目前需要解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种用户数据挖掘的方法、装置、可读存储介质和电子设备,为每个用户设置奖励,提高了用户的使用热情。
第一方面,本发明实施例提供了一种用户数据挖掘的方法,该方法包括:
获取目标用户的第一历史数据和第二历史数据,其中,所述第一历史数据为所述目标用户参加过的积分活动的积分获取值,所述第二历史数据为所述目标用户未参加过的积分活动的积分获取值;根据所述第一历史数据确定所述目标用户的第一均值和第一方差;根据所述第二历史数据确定所述目标用户的第二均值和第二方差;根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的触发阈值,所述触发阈值用于描述所述目标用户的积分获取值预期。
优选地,所述根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述用户的触发阈值,具体包括:
根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的基础触发阈值;
响应于所述第一均值大于所述第二均值,将所述基础触发阈值确定为所述触发阈值。
优选地,所述根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的触发阈值,具体包括:
根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述用户的基础触发阈值;
响应于所述第一均值小于所述第二均值,确定二倍的所述第二均值与所述基础触发阈值的差值;
将所述差值确定为所述触发阈值。
优选地,所述根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的基础触发阈值,具体包括:
根据对如下公式进行求解,确定所述基础触发阈值u0:
其中,u1为所述第一均值,u2为所述第二均值,为所述第一方差,/>为所述第二方差。
优选地,所述根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的基础触发阈值,具体包括:
根据所述第一均值与所述第一方差确定第一高斯分布曲线,其中,所述第一高斯分布曲线所在坐标系的横轴为积分获取值,纵轴为密度;
根据所述第二均值与所述第二方差确定第二高斯分布曲线,其中,所述第二高斯分布曲线所在坐标系的横轴为积分获取值,纵轴为密度;
将所述第一高斯分布曲线与所述第二高斯分布曲线的交点确定为所述目标用户的基础触发阈值。
优选地,所述第一均值为所述目标用户参加过的积分活动的积分获取值的平均值,所述第一方差为所述第一均值对应的方差。
优选地,所述第二均值为所述目标用户未参加过的积分活动的积分获取值的平均值,所述第二方差为所述第二均值对应的方差。
优选地,该方法还包括:
根据设定周期更新所述目标用户的所述第一历史数据和所述第二历史数据。
第二方面,本发明实施例提供了一种用户数据挖掘的装置,该装置包括:
获取单元,用于获取目标用户的第一历史数据和第二历史数据,其中,所述第一历史数据为所述目标用户参加过的积分活动的积分获取值,所述第二历史数据为所述目标用户未参加过的积分活动的积分获取值;
第一确定单元,用于根据所述第一历史数据确定所述目标用户的第一均值和第一方差;
第二确定单元,用于根据所述第二历史数据确定所述目标用户的第二均值和第二方差;
第三确定单元,用于根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述用户的触发阈值,所述触发阈值用于描述所述目标用户的积分获取值预期。
优选地,所述第三确定单元具体用于:
根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的基础触发阈值;
响应于所述第一均值大于所述第二均值,将所述基础触发阈值确定为所述触发阈值。
优选地,所述第三确定单元具体用于:
根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述用户的基础触发阈值;
响应于所述第一均值小于所述第二均值,确定二倍的所述第二均值与所述基础触发阈值的差值;
将所述差值确定为所述触发阈值。
所述第三确定单元具体用于:
根据对如下公式进行求解,确定所述基础触发阈值u0:
其中,u1为所述第一均值,u2为所述第二均值,为所述第一方差,/>为所述第二方差。
优选地,所述第三确定单元具体用于:
根据所述第一均值与所述第一方差确定第一高斯分布曲线,其中,所述第一高斯分布曲线所在坐标系的横轴为积分获取值,纵轴为概率密度;
根据所述第二均值与所述第二方差确定第二高斯分布曲线,其中,所述第二高斯分布曲线所在坐标系的横轴为积分获取值,纵轴为概率密度;
将所述第一高斯分布曲线与所述第二高斯分布曲线的交点确定为所述目标用户的基础触发阈值。
优选地,所述第一均值为所述目标用户参加过的积分活动的积分获取值的平均值,所述第一方差为所述第一均值对应的方差。
优选地,所述第二均值为所述目标用户未参加过的积分活动的积分获取值的平均值,所述第二方差为所述第二均值对应的方差。
优选地,该装置还包括:
更新单元,用于根据设定周期更新所述目标用户的所述第一历史数据和所述第二历史数据。
第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面或第一方面任一种可能中任一项所述的方法。
第四方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面或第一方面任一种可能中任一项所述的方法。
本发明实施例通过获取目标用户的第一历史数据和第二历史数据,其中,所述第一历史数据为所述目标用户参加过的积分活动的积分获取值,所述第二历史数据为所述目标用户未参加过的积分活动的积分获取值;根据所述第一历史数据确定所述目标用户的第一均值和第一方差;根据所述第二历史数据确定所述目标用户的第二均值和第二方差;根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的触发阈值。通过上述方法,通过对目标用户的历史数据进行统计,计算出用于目标用户的积分获取值预期的触发阈值,即为每个目标用户设置个性化的奖励,提高了目标用户的使用热情。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1是本发明实施例的用户数据挖掘的方法流程图;
图2是本发明实施例的用户数据挖掘的方法流程图;
图3是本发明实施例的高斯分布曲线示意图;
图4是本发明实施例的用户数据挖掘的方法流程图;
图5是本发明实施例的高斯分布曲线示意图;
图6是本发明实施例的用户数据挖掘的装置示意图;
图7是本发明实施例的电子设备的示意图。
具体实施方式
以下基于实施例对本发明公开进行描述,但是本发明公开并不仅仅限于这些实施例。在下文对本发明公开的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明公开。为了避免混淆本发明公开的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。
此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
除非上下文明确要求,否则整个申请文件中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本发明公开的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明公开的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在人们的日常生活中,出现了越来越多的在线教学平台和在线购物平台,为了保持用户的使用热情,在线教学平台和在线购物平台经常会发起一些活动来保持用户的使用热情,完成活动会给用户设定数量的奖励,以在线教学平台为例,在线教学平台中对完成活动的用户奖励一定积分,针对不同的活动会奖励不同积分,对于同一个活动,每个用户奖励的积分是相同的,但同样的积分,对有些用户,认为积分的数量达到了预期甚至超过了预期,会参加活动,进而起到了激励的作用,并且超过预测的积分也会造成一定程度的浪费,可能较少的积分就对这些用户起到激励的作用;但是也存在一些用户认为积分的数量没有达到心里预期,不会参加活动,没有起到激励的作用,因此,确定出可以达到这些用户心理预期的积分也是非常重要的。
本发明实施例中,通过目标用户历史数据,计算出所述目标用户的触发阈值,对目标用户的积分获取值进行合理的预估,从而准确触达每一个目标用户,所述触发阈值既可以对用户进行激励,又不会造成浪费,为每个目标用户设置个性化的奖励目标用户的使用热情。
本发明实施例中,所述积分还可以为其它形式的奖励,例如,在线购物平台的积分币、能量、小游戏中的道具数量等等,本发明实施例对其不做限定。
本发明实施例中,图1是本发明实施例的一种用户数据挖掘的方法流程图。如图1所示,具体包括如下步骤:
步骤S100、获取目标用户的第一历史数据和第二历史数据,其中,所述第一历史数据为所述目标用户参加过的积分活动的积分获取值,所述第二历史数据为所述目标用户未参加过的积分活动的积分获取值。
具体的,每个目标用户都有自己对应的唯一标识,根据所述目标用户的唯一标识获取目标用户的历史数据,其中,所述历史数据为获取数据的截止时间之前的全部数据或者设定时间段的数据,假设,获取数据的截至时间为2021年3月20日,则该目标用户从注册起始时间到所述2021年3月20日之间的全部数据都可以称为历史数据;或者,获取数据的截至时间为2021年3月20日,则该目标用户截止所述2021年3月20日之前设定时间段的数据可以称为历史数据,其中,所述设定时间段可以为一周、一个月、三个月或者一年,本发明实施例对其不做限定。
本发明实施例中,所述历史数据包括第一历史数据和第二历史数据,其中,所述第一历史数据和第二历史数据也可以通过列表的形式表示,具体的,所述第一历史数据可以通过第一列表表示,所述第一历史数据为所述目标用户参加过的积分活动的积分获取值,具体如下表1所示:
表1
活动时间 | 积分获取值 |
2021.3.20 | 200 |
2021.2.18 | 210 |
2021.2.16 | 210 |
2021.1.18 | 190 |
2021.1.16 | 200 |
2021.1.1 | 215 |
2020.12.24 | 203 |
2020.12.12 | 198 |
...... | ...... |
上述表1中包括活动时间以及每次活动对应的积分获取值。可选的,表1中还可以包括活动名称或者活动序号等,本发明实施例对其不做限定。
本发明实施例中,所述第二历史数据可以通过第二列表表示,所述第二历史数据为所述目标用户未参加过的积分活动的积分获取值,具体如下表2所示:
表2
活动时间 | 积分获取值 |
2021.3.19 | 100 |
2021.2.17 | 110 |
2021.2.15 | 110 |
2021.1.17 | 90 |
2021.1.15 | 100 |
2020.12.30 | 115 |
2020.12.23 | 103 |
2020.12.11 | 98 |
...... | ...... |
上述表2中包括活动时间以及每次活动对应的积分获取值,用户未参与上述表2中的活动。可选的,表2中还可以包括活动名称或者活动序号等,本发明实施例对其不做限定。
在一种可能的实现方式中,所述积分获取值可以为整型数值,即所述积分获取值为整数,具体如上表1或表2所示;可选的,所述积分获取值还可以为非整形数据,即所述积分获取值为非整数,例如,118.5、201.4等,此处仅为示例性说明,具体的所述积分获取值的数值根据实际情况确定,本发明实施例对其不做限定。
步骤S101、根据所述第一历史数据确定所述目标用户的第一均值和第一方差。
具体的,所述第一均值为所述目标用户参加过的积分活动的积分获取值的平均值,所述第一方差为所述第一均值对应的方差。
举例说明,根据目标用户参加过的积分活动的积分获取值计算所述目标用户的第一均值u1和第一方差
举例说明,根据表1中第二列的数据200、210、210、190、200、215、203和198等计算第一均值和第一方差。
步骤S102、根据所述第二历史数据确定所述目标用户的第二均值和第二方差。
具体的,所述第二均值为所述目标用户未参加过的积分活动的积分获取值的平均值,所述第二方差为所述第二均值对应的方差。
举例说明,根据目标用户未参加过的积分活动的积分获取值计算所述目标用户的第二均值u2和第二方差
举例说明,根据表2中第二列的数据100、110、110、90、100、115、103和98等计算第二均值和第二方差。
本发明实施例中,所述步骤S101和步骤S102的处理过程不分先后,可以先执行步骤S101,然后执行步骤S102;也可以是先执行步骤S102,然后执行步骤S101;还可以步骤S101和步骤S102同时执行,本发明实施例对其不做限定。
步骤S103、根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的触发阈值,所述触发阈值用于描述所述目标用户的积分获取值预期。
本发明实施例中,根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的触发阈值时,具体可以分为两种情况,分别为情况一、所述第一均值大于所述第二均值的情况,以及情况二、所述第一均值小于所述第二均值的情况;其中,由于第一历史数据为目标用户参加过的积分活动的积分获取值,一般情况下,积分获取值较高的情况下,目标用户才会有更高的参与意愿,而积分获取值较低的情况下,目标用户的参与意愿则会减少,因此,第一均值在一般情况下会大于第二均值,但是也会存在第一均值小于第二均值的情况;下面分别通过两个具体实施例对上述两种情况下如何确定触发阈值进行详细的说明。
具体实施例一、图2是本发明实施例的一种确定触发阈值的方法流程图。如图2所示,具体包括如下步骤:
步骤S200、根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的基础触发阈值。
具体的,根据所述第一均值与所述第一方差确定第一高斯分布曲线,并根据所述第二均值与所述第二方差确定第二高斯分布曲线;将所述第一高斯分布曲线与所述第二高斯分布曲线的交点确定为所述目标用户的基础触发阈值。
举例说明,图3为本发明实施例一种高斯分布曲线示意图,所述高斯分布曲线所在坐标系的横轴为积分获取值,纵轴为概率密度,不同的积分获取值对应不同的概率密度,所述高斯分布曲线本质上是一条概率密度曲线,其中,第一均值与所述第一方差确定第一高斯分布曲线为A曲线,第二均值与所述第二方差确定第二高斯分布曲线为B曲线,所以将所述A曲线与所述B曲线的交点P对应的横轴的数值确定为所述目标用户的基础触发阈值。
本发明实施例中,由于第一高斯分布曲线为目标用户参见积分活动的曲线,第二高斯分布曲线为目标用户为参见积分活动的曲线,由于高斯分布曲线在统计学上的特性,因此,选取两条高斯分布曲线的交点作为基础触发阈值,在数学上可以得到较为准确的基础触发阈值。
步骤S201、响应于所述第一均值大于所述第二均值,将所述基础触发阈值确定为所述触发阈值。
本发明实施例中,由于积分获取值较高的情况下,目标用户才会有更高的参与意愿,而积分获取值较低的情况下,目标用户的参与意愿则会减少,因此,在第一均值大于第二均值的情况下,直接将所述基础触发阈值确定为所述触发阈值,表示当达到或超过所述触发阈值时,目标用户参与活动的意愿会更高,并且也不会对积分获取值进行浪费。
具体实施例二、图4是本发明实施例的一种确定触发阈值的方法流程图。如图4所示,具体包括如下步骤:
步骤S400、根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述用户的基础触发阈值。
具体的,根据所述第一均值与所述第一方差确定第一高斯分布曲线,并根据所述第二均值与所述第二方差确定第二高斯分布曲线;将所述第一高斯分布曲线与所述第二高斯分布曲线的交点确定为所述目标用户的基础触发阈值;但是由于存在第一均值小于第二均值的情况,因此,在确定触发阈值时需要经过后续步骤S401和步骤S402的处理。
步骤S401、响应于所述第一均值小于所述第二均值确定二倍的所述第二均值与所述基础触发阈值的差值。
步骤S402、将所述差值确定为所述触发阈值。
举例说明,图5为本发明实施例一种高斯分布曲线示意图,横轴为积分获取值,纵轴为概率密度,其中,所述积分获取值可以称为正态变量,所述第一均值与所述第一方差确定第一高斯分布曲线为C曲线,第二均值与所述第二方差确定第二高斯分布曲线为D曲线,确定所述C曲线与所述D曲线的交点Q对应的横轴的数值的二倍与所述第二均值的差值,即确定交点Q以X=第二均值的轴的对称点与第二均值的差值,假设基础触发阈值u0,所述u2为第二均值,则差值为2u0-u2,进而将所述差值确定为所述目标用户的触发阈值。
本发明实施例中,响应于所述第一均值等于所述第二均值时,处理方式与所述第一均值大于所述第二阈值时的处理方式相同。
在一种可能的方式中,上述基础触发阈值也可以通过公式直接进行计算,具体的,所述根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的基础触发阈值,具体包括:
根据对如下公式进行求解,确定所述基础触发阈值u0:
其中,u1为所述第一均值,u2为所述第二均值,为所述第一方差,/>为所述第二方差,也即所述公式里未知数x的解就是所述基础触发阈值u0。
本发明实施例中,所述第一历史数据和所述第二历史数据是根据时间的变化更新的,具体可以为:根据设定周期更新所述目标用户的所述第一历史数据和所述第二历史数据。
举例说明,假设第一次获取第一历史数据和第二历史数据的时间时截止时间为2021年2月20日,当时间变化为2021年2月30日时,截止时间更新为2021年2月30日,即将2021年2月21日至2021年2月30日中包括的数据确定为新的第一历史数据和新的第二历史数据。
在一种可能的实现方式中,根据上述用户数据挖掘的方法确定出的也可以是积分消耗值,其中,所述积分消耗值用于表示消耗多少积分可以参与平台组织的活动,具体的,假设第一所述第一历史数据为所述目标用户参加过的活动的积分消耗值,所述第二历史数据为所述目标用户未参加过的活动的积分消耗值;根据所述第一历史数据确定所述目标用户的第一均值和第一方差;根据所述第二历史数据确定所述目标用户的第二均值和第二方差;根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的触发阈值,所述触发阈值用于描述所述目标用户的积分消耗值预期。
在上述实施例中,与图1中的实施例相反,用户参与活动需要的积分消耗值越多,可能用户参与的积极性越低,反之,用户参与活动需要的积分消耗值越少,可能用户参与的积极性越高;因此,在一般情况下,第一均值小于第二均值,但也存在特殊情况时第一均值大于第二均值,虽然与图1中的实施例的数值情况是相反的,但是候选确定触法阈值的方法是相同,本发明实施例在此不在赘述。
本发明实施例中,上述用户数据挖掘的方法不仅可以用于确定积分获取值的触发阈值、或者积分消耗值的触发阈值,还可以应用各种需要个性化统计此类数据的情况,本发明实施例对此不做限定。
图6是本发明实施例的一种用户数据挖掘的装置示意图。如图6所示,本实施例的装置包括获取单元601、第一确定单元602、第二确定单元603和第三确定单元604。
其中,所述获取单元601,用于获取目标用户的第一历史数据和第二历史数据,其中,所述第一历史数据为所述目标用户参加过的积分活动的积分获取值,所述第二历史数据为所述目标用户未参加过的积分活动的积分获取值;所述第一确定单元602,用于根据所述第一历史数据确定所述目标用户的第一均值和第一方差;所述第二确定单元603,用于根据所述第二历史数据确定所述目标用户的第二均值和第二方差;所述第三确定单元604,用于根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述用户的触发阈值,所述触发阈值用于描述所述目标用户的积分获取值预期。
本发明实施中,通过对目标用户的历史数据进行统计,计算出用于目标用户的积分获取值预期的触发阈值,即为每个目标用户设置个性化的奖励,提高了目标用户的使用热情。
图7是本发明实施例的电子设备的示意图。图7所示的电子设备为通用的用户数据挖掘装置,其包括通用的计算机硬件结构,其至少包括处理器71和存储器72。处理器71和存储器72通过总线73连接。存储器72适于存储处理器71可执行的指令或程序。处理器71可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器71通过执行存储器72所存储的指令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线73将上述多个组件连接在一起,同时将上述组件连接到显示控制器74和显示装置以及输入/输出(I/O)装置75。输入/输出(I/O)装置75可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出装置75通过输入/输出(I/O)控制器76与系统相连。
如本领域技术人员将意识到的,本发明实施例的各个方面可以被实现为系统、方法或计算机程序产品。因此,本发明实施例的各个方面可以采取如下形式:完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微代码等)或者在本文中通常可以都称为“电路”、“模块”或“系统”的将软件方面与硬件方面相结合的实施方式。此外,本发明实施例的各个方面可以采取如下形式:在一个或多个计算机可读介质中实现的计算机程序产品,计算机可读介质具有在其上实现的计算机可读程序代码。
可以利用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是如(但不限于)电子的、磁的、光学的、电磁的、红外的或半导体系统、设备或装置,或者前述的任意适当的组合。计算机可读存储介质的更具体的示例(非穷尽列举)将包括以下各项:具有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储装置、磁存储装置或前述的任意适当的组合。在本发明实施例的上下文中,计算机可读存储介质可以为能够包含或存储由指令执行系统、设备或装置使用的程序或结合指令执行系统、设备或装置使用的程序的任意有形介质。
计算机可读信号介质可以包括传播的数据信号,所述传播的数据信号具有在其中如在基带中或作为载波的一部分实现的计算机可读程序代码。这样的传播的信号可以采用多种形式中的任何形式,包括但不限于:电磁的、光学的或其任何适当的组合。计算机可读信号介质可以是以下任意计算机可读介质:不是计算机可读存储介质,并且可以对由指令执行系统、设备或装置使用的或结合指令执行系统、设备或装置使用的程序进行通信、传播或传输。
可以使用包括但不限于无线、有线、光纤电缆、RF等或前述的任意适当组合的任意合适的介质来传送实现在计算机可读介质上的程序代码。
用于执行针对本发明实施例各方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合来编写,所述编程语言包括:面向对象的编程语言如Java、Smalltalk、C++等;以及常规过程编程语言如“C”编程语言或类似的编程语言。程序代码可以作为独立软件包完全地在用户计算机上、部分地在用户计算机上执行;部分地在用户计算机上且部分地在远程计算机上执行;或者完全地在远程计算机或服务器上执行。在后一种情况下,可以将远程计算机通过包括局域网(LAN)或广域网(WAN)的任意类型的网络连接至用户计算机,或者可以与外部计算机进行连接(例如通过使用因特网服务供应商的因特网)。
上述根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图图例和/或框图描述了本发明实施例的各个方面。将要理解的是,流程图图例和/或框图的每个块以及流程图图例和/或框图中的块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供至通用计算机、专用计算机或其它可编程数据处理设备的处理器,以产生机器,使得(经由计算机或其它可编程数据处理设备的处理器执行的)指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。
还可以将这些计算机程序指令存储在可以指导计算机、其它可编程数据处理设备或其它装置以特定方式运行的计算机可读介质中,使得在计算机可读介质中存储的指令产生包括实现在流程图和/或框图块或块中指定的功能/动作的指令的制品。
计算机程序指令还可以被加载至计算机、其它可编程数据处理设备或其它装置上,以使在计算机、其它可编程设备或其它装置上执行一系列可操作步骤来产生计算机实现的过程,使得在计算机或其它可编程设备上执行的指令提供用于实现在流程图和/或框图块或块中指定的功能/动作的过程。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种用户数据挖掘方法,其特征在于,该方法包括:
获取目标用户的第一历史数据和第二历史数据,其中,所述第一历史数据为所述目标用户参加过的积分活动的积分获取值,所述第二历史数据为所述目标用户未参加过的积分活动的积分获取值;
根据所述第一历史数据确定所述目标用户的第一均值和第一方差;
根据所述第二历史数据确定所述目标用户的第二均值和第二方差;
根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的触发阈值,所述触发阈值用于描述所述目标用户的积分获取值预期;
其中,所述根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述用户的触发阈值,具体包括:
根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的基础触发阈值;
响应于所述第一均值大于所述第二均值,将所述基础触发阈值确定为所述触发阈值;或者,响应于所述第一均值小于所述第二均值,确定二倍的所述第二均值与所述基础触发阈值的差值,将所述差值确定为所述触发阈值;
其中,所述根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的基础触发阈值,具体包括:
根据对如下公式进行求解,确定所述基础触发阈值u0:
其中,u1为所述第一均值,u2为所述第二均值,为所述第一方差,/>为所述第二方差,σ1为第一方差对应的第一标准差,σ2为第二方差对应的第二标准差;或
根据所述第一均值与所述第一方差确定第一高斯分布曲线,其中,所述第一高斯分布曲线所在坐标系的横轴为积分获取值,纵轴为概率密度;
根据所述第二均值与所述第二方差确定第二高斯分布曲线,其中,所述第二高斯分布曲线所在坐标系的横轴为积分获取值,纵轴为概率密度;
将所述第一高斯分布曲线与所述第二高斯分布曲线的交点确定为所述目标用户的基础触发阈值。
2.如权利要求1所述的方法,其特征在于,所述第一均值为所述目标用户参加过的积分活动的积分获取值的平均值,所述第一方差为所述第一均值对应的方差。
3.如权利要求1所述的方法,其特征在于,所述第二均值为所述目标用户未参加过的积分活动的积分获取值的平均值,所述第二方差为所述第二均值对应的方差。
4.如权利要求1所述的方法,其特征在于,该方法还包括:
根据设定周期更新所述目标用户的所述第一历史数据和所述第二历史数据。
5.一种用户数据挖掘的装置,其特征在于,该装置包括:
获取单元,用于获取目标用户的第一历史数据和第二历史数据,其中,所述第一历史数据为所述目标用户参加过的积分活动的积分获取值,所述第二历史数据为所述目标用户未参加过的积分活动的积分获取值;
第一确定单元,用于根据所述第一历史数据确定所述目标用户的第一均值和第一方差;
第二确定单元,用于根据所述第二历史数据确定所述目标用户的第二均值和第二方差;
第三确定单元,用于根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述用户的触发阈值,所述触发阈值用于描述所述目标用户的积分获取值预期;
其中,所述第三确定单元具体用于:根据所述第一均值、所述第一方差、所述第二均值以及所述第二方差确定所述目标用户的基础触发阈值;
响应于所述第一均值大于所述第二均值,将所述基础触发阈值确定为所述触发阈值;或者,响应于所述第一均值小于所述第二均值,确定二倍的所述第二均值与所述基础触发阈值的差值,将所述差值确定为所述触发阈值;
其中,所述第三确定单元具体用于:
根据对如下公式进行求解,确定所述基础触发阈值u0:
其中,u1为所述第一均值,u2为所述第二均值,为所述第一方差,/>为所述第二方差,σ1为第一方差对应的第一标准差,σ2为第二方差对应的第二标准差;或
根据所述第一均值与所述第一方差确定第一高斯分布曲线,其中,所述第一高斯分布曲线所在坐标系的横轴为积分获取值,纵轴为概率密度;
根据所述第二均值与所述第二方差确定第二高斯分布曲线,其中,所述第二高斯分布曲线所在坐标系的横轴为积分获取值,纵轴为概率密度;
将所述第一高斯分布曲线与所述第二高斯分布曲线的交点确定为所述目标用户的基础触发阈值。
6.一种计算机可读存储介质,其上存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如权利要求1-4中任一项所述的方法。
7.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110430661.8A CN112950295B (zh) | 2021-04-21 | 2021-04-21 | 用户数据挖掘的方法、装置、可读存储介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110430661.8A CN112950295B (zh) | 2021-04-21 | 2021-04-21 | 用户数据挖掘的方法、装置、可读存储介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112950295A CN112950295A (zh) | 2021-06-11 |
CN112950295B true CN112950295B (zh) | 2024-03-19 |
Family
ID=76233124
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110430661.8A Active CN112950295B (zh) | 2021-04-21 | 2021-04-21 | 用户数据挖掘的方法、装置、可读存储介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112950295B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358479A (zh) * | 2017-08-31 | 2017-11-17 | 廊坊新奥新能源汽车服务有限公司 | 一种实现积分商城的方法及装置 |
CN108304479A (zh) * | 2017-12-29 | 2018-07-20 | 浙江工业大学 | 一种基于图结构过滤的快速密度聚类双层网络推荐方法 |
CN108364195A (zh) * | 2018-02-09 | 2018-08-03 | 腾讯科技(深圳)有限公司 | 用户留存概率预测方法、装置、预测服务器及存储介质 |
CN110020162A (zh) * | 2017-12-14 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 用户识别方法和装置 |
CN110148012A (zh) * | 2019-04-15 | 2019-08-20 | 中国平安人寿保险股份有限公司 | 用户激励方法、装置、计算机设备及存储介质 |
CN111782943A (zh) * | 2020-06-24 | 2020-10-16 | 中国平安财产保险股份有限公司 | 基于历史数据记录的信息推荐方法、装置、设备及介质 |
CN112101574A (zh) * | 2020-11-20 | 2020-12-18 | 成都数联铭品科技有限公司 | 一种机器学习有监督模型解释方法、系统及设备 |
CN112528549A (zh) * | 2019-09-18 | 2021-03-19 | 北京三快在线科技有限公司 | 确定任务激励参数的方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11030634B2 (en) * | 2018-01-30 | 2021-06-08 | Walmart Apollo, Llc | Personalized mechanisms to resolve explore-exploit dilemma with dynamically shared learnings |
-
2021
- 2021-04-21 CN CN202110430661.8A patent/CN112950295B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358479A (zh) * | 2017-08-31 | 2017-11-17 | 廊坊新奥新能源汽车服务有限公司 | 一种实现积分商城的方法及装置 |
CN110020162A (zh) * | 2017-12-14 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 用户识别方法和装置 |
CN108304479A (zh) * | 2017-12-29 | 2018-07-20 | 浙江工业大学 | 一种基于图结构过滤的快速密度聚类双层网络推荐方法 |
CN108364195A (zh) * | 2018-02-09 | 2018-08-03 | 腾讯科技(深圳)有限公司 | 用户留存概率预测方法、装置、预测服务器及存储介质 |
CN110148012A (zh) * | 2019-04-15 | 2019-08-20 | 中国平安人寿保险股份有限公司 | 用户激励方法、装置、计算机设备及存储介质 |
CN112528549A (zh) * | 2019-09-18 | 2021-03-19 | 北京三快在线科技有限公司 | 确定任务激励参数的方法、装置、电子设备及存储介质 |
CN111782943A (zh) * | 2020-06-24 | 2020-10-16 | 中国平安财产保险股份有限公司 | 基于历史数据记录的信息推荐方法、装置、设备及介质 |
CN112101574A (zh) * | 2020-11-20 | 2020-12-18 | 成都数联铭品科技有限公司 | 一种机器学习有监督模型解释方法、系统及设备 |
Non-Patent Citations (1)
Title |
---|
用于目标跟踪的双阈值快速序贯相似性检测算法;左军毅;张怡哲;王正平;;弹箭与制导学报(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112950295A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11170327B2 (en) | Dynamic production planning system and dynamic production planning device | |
TW575901B (en) | System for providing production progress information | |
Villarinho et al. | A simheuristic algorithm for the stochastic permutation flow‐shop problem with delivery dates and cumulative payoffs | |
JP2017010173A (ja) | 人口推計方法、人口推計プログラム、および人口推計装置 | |
JP2023182648A (ja) | 臨床試験の需給予測のためのシステムおよび方法 | |
CN113312578A (zh) | 一种数据指标的波动归因方法、装置、设备、及介质 | |
JP2001357189A (ja) | 市場参入意思決定支援装置 | |
JP5638579B2 (ja) | 評価値算出装置、評価値算出方法およびプログラム | |
CN114331286A (zh) | 备件库存预测方法、装置、计算机设备以及介质 | |
CN117196270B (zh) | 工作督办信息发布方法、系统、设备及介质 | |
CN112950295B (zh) | 用户数据挖掘的方法、装置、可读存储介质和电子设备 | |
CN107067276A (zh) | 确定对象影响力的方法及装置 | |
Barrett et al. | Design and results of the 4th annual satisfiability modulo theories competition (SMT-COMP 2008) | |
CN111191999B (zh) | 产品研发管理方法、装置、计算机设备及存储介质 | |
CN107016573B (zh) | 一种应用的评测方法和评测系统 | |
CN108961071B (zh) | 自动预测组合业务收益的方法及终端设备 | |
CN116168403A (zh) | 医疗数据分类模型训练方法、分类方法、装置及相关介质 | |
Parke et al. | Comparing oncology clinical programs by use of innovative designs and expected net present value optimization: Which adaptive approach leads to the best result? | |
CN111127108A (zh) | 物品分配方法、装置、电子设备及计算机可读存储介质 | |
JP2009157693A (ja) | データ入力装置、データ入力方法、そのプログラムおよび記憶媒体 | |
JP6927553B2 (ja) | 情報処理装置、制御方法、及びプログラム | |
CN114997720B (zh) | 一种软件研发项目风险监测方法、装置、设备及存储介质 | |
JP6952927B1 (ja) | 場所予測装置、場所予測方法、および、場所予測プログラム | |
CN112860150B (zh) | 基于大数据分析的用户页面操作提示方法及装置 | |
JP6194683B2 (ja) | アセット情報管理装置、制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |