CN117708183A - 一种基于用户消费习惯的潜在用户挖掘方法及系统 - Google Patents

一种基于用户消费习惯的潜在用户挖掘方法及系统 Download PDF

Info

Publication number
CN117708183A
CN117708183A CN202311478876.2A CN202311478876A CN117708183A CN 117708183 A CN117708183 A CN 117708183A CN 202311478876 A CN202311478876 A CN 202311478876A CN 117708183 A CN117708183 A CN 117708183A
Authority
CN
China
Prior art keywords
consumption
user
data
day
average
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311478876.2A
Other languages
English (en)
Other versions
CN117708183B (zh
Inventor
宋维杰
陈聪聪
周子猜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Simi Technology Co ltd
Original Assignee
Guangzhou Simi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Simi Technology Co ltd filed Critical Guangzhou Simi Technology Co ltd
Priority to CN202311478876.2A priority Critical patent/CN117708183B/zh
Publication of CN117708183A publication Critical patent/CN117708183A/zh
Application granted granted Critical
Publication of CN117708183B publication Critical patent/CN117708183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据分析技术领域,提供一种基于用户消费习惯的潜在用户挖掘方法及系统,方法包括:获取待挖掘用户的流水数据,根据流水数据计算各日消费额,以月度跨度为第一时间区间,将各日消费额归入多个第一时间区间内;计算各第一时间区间内的平均日消费额,标记高消费日和低消费日;判断高消费日和低消费日的日期是否符合预设聚类规律模型,若都符合,则计算高消费日的第一平均消费额和低消费日的第二平均消费额的差值,若差值大于平均日消费额的预设消费比例,则将待挖掘用户标记为潜在用户;基于待挖掘用户的流水数据分析消费额的波动情况,判断用户的消费习惯与钱币支付能力是否有影响消费水平的情况,准确识别有资金需求的潜在用户。

Description

一种基于用户消费习惯的潜在用户挖掘方法及系统
技术领域
本发明涉及数据分析技术领域,尤其涉及一种基于用户消费习惯的潜在用户挖掘方法及系统。
背景技术
目前金融公司获客渠道常为根据预先准备的用户名单进行电话推销或消息推送,这些名单上的用户在过往可能存在资金需求,因此对金融公司授权了相关信息而生成名单,但并不清楚其当前是否存在资金需求,名单信息不精准,若盲目的遍历进行推销,容易影响无资金需求的用户体验,且推销成本较高。
发明内容
本发明提供了一种基于用户消费习惯的潜在用户挖掘方法,用于解决现有技术中用户数据不精准导致推销成本高,且影响用户体验的问题。
本发明第一方面提供了一种基于用户消费习惯的潜在用户挖掘方法,包括:
获取待挖掘用户的流水数据,根据流水数据计算各日消费额,以月度跨度为第一时间区间,将各日消费额归入多个第一时间区间内;计算各第一时间区间内的平均日消费额,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日;
分别判断高消费日和低消费日的日期是否符合预设聚类规律模型,若都符合,则计算高消费日的第一平均消费额和低消费日的第二平均消费额的差值,若差值大于平均日消费额的预设消费比例,则将待挖掘用户标记为潜在用户。
可选的,所述将待挖掘用户标记为潜在用户之前,还包括:
获取各月度的高消费日期区间,在多个月度的高消费日期区间中提取重合日期,由重合日期得到第二时间区间;
获取消费数据和浏览数据,消费数据中包括第一商品信息和消费时间,浏览数据中包括第二商品信息和浏览时间;识别消费时间在第二时间区间的消费数据,将对应的第一商品信息与浏览数据中的第二商品信息进行匹配,得到多个有效浏览时间;计算各有效浏览时间与消费时间的时间差平均值;计算各消费数据对应的有效浏览次数平均值;
获取未匹配的浏览数据中浏览时间距离当前时间小于等于时间差平均值的第二商品信息,识别同类商品信息的第一浏览次数,若第一浏览次数大于有效浏览次数平均值,则获取商品的平均价格;若商品平均价格大于预设消费比例的多月平均日消费额,则将待挖掘用户标记为潜在用户。
可选的,获取待挖掘用户的流水数据之后,还包括:
识别流水数据中的自动扣款项目,并将其从流水数据中剔除。
可选的,所述将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日之后,还包括:
根据第一时间区间内的各日消费额拟合消费曲线,识别消费曲线上斜率绝对值超过预设斜率的第三时间区间,将第三时间区间对应的高消费日或低消费日剔除。
本申请第二方面提供了一种基于用户消费习惯的潜在用户挖掘系统,包括:
流水数据处理模块,用于获取待挖掘用户的流水数据,根据流水数据计算各日消费额,以月度跨度为第一时间区间,将各日消费额归入多个第一时间区间内;计算各第一时间区间内的平均日消费额,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日;
用户挖掘模块,用于分别判断高消费日和低消费日的日期是否符合预设聚类规律模型,若都符合,则计算高消费日的第一平均消费额和低消费日的第二平均消费额的差值,若差值大于平均日消费额的预设消费比例,则将待挖掘用户标记为潜在用户。
可选的,所述用户挖掘模块中,所述将待挖掘用户标记为潜在用户之前,还包括:
获取各月度的高消费日期区间,在多个月度的高消费日期区间中提取重合日期,由重合日期得到第二时间区间;
获取消费数据和浏览数据,消费数据中包括第一商品信息和消费时间,浏览数据中包括第二商品信息和浏览时间;识别消费时间在第二时间区间的消费数据,将对应的第一商品信息与浏览数据中的第二商品信息进行匹配,得到多个有效浏览时间;计算各有效浏览时间与消费时间的时间差平均值;计算各消费数据对应的有效浏览次数平均值;
获取未匹配的浏览数据中浏览时间距离当前时间小于等于时间差平均值的第二商品信息,识别同类商品信息的第一浏览次数,若第一浏览次数大于有效浏览次数平均值,则获取商品的平均价格;若商品平均价格大于预设消费比例的多月平均日消费额,则将待挖掘用户标记为潜在用户。
可选的,所述流水数据处理模块中,获取待挖掘用户的流水数据之后,还包括:
识别流水数据中的自动扣款项目,并将其从流水数据中剔除。
可选的,所述流水数据处理模块中,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日之后,还包括:
根据第一时间区间内的各日消费额拟合消费曲线,识别消费曲线上斜率绝对值超过预设斜率的第三时间区间,将第三时间区间对应的高消费日或低消费日剔除。
本申请第三方面提供了一种基于用户消费习惯的潜在用户挖掘方法设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行本发明第一方面任一项所述的一种基于用户消费习惯的潜在用户挖掘方法。
本申请第四方面提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行本发明第一方面任一项所述的一种基于用户消费习惯的潜在用户挖掘方法。
从以上技术方案可以看出,本发明具有以下优点:获取待挖掘用户的流水数据,根据流水数据计算各日消费额,以月度跨度为第一时间区间,将各日消费额归入多个第一时间区间内;计算各第一时间区间内的平均日消费额,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日;分别判断高消费日和低消费日的日期是否符合预设聚类规律模型,若都符合,则计算高消费日的第一平均消费额和低消费日的第二平均消费额的差值,若差值大于平均日消费额的预设消费比例,则将待挖掘用户标记为潜在用户;基于待挖掘用户的流水数据分析消费额的波动情况,判断用户的消费习惯与钱币支付能力是否有影响消费水平的情况,准确识别有资金需求的潜在用户。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为一种基于用户消费习惯的潜在用户挖掘方法的第一个流程图;
图2为一种基于用户消费习惯的潜在用户挖掘方法的第二个流程图;
图3为一种基于用户消费习惯的潜在用户挖掘系统结构图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供了一种基于用户消费习惯的潜在用户挖掘方法,用于解决现有技术中用户数据不精准导致推销成本高,且影响用户体验的问题。
实施例一
请参阅图1,图1为本发明实施例提供的一种基于用户消费习惯的潜在用户挖掘方法的第一个流程图。
S100,获取待挖掘用户的流水数据,根据流水数据计算各日消费额,以月度跨度为第一时间区间,将各日消费额归入多个第一时间区间内;计算各第一时间区间内的平均日消费额,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日;
需要说明的是,待挖掘用户会预先授权仅用于证明的流水账单,从账单内获取流水数据,流水数据中记录了一段时间内用户支出情况,以每日的0-24点的所有支出金额求和,得到各日消费额;本实施例中的第一时间区间即为2月3月的完整月份作为一个时间区间,也可以根据每月的15号至下月的15号作为一个时间区间,使得后续以第一时间区间为周期分析消费额的变化规律;计算平均日消费额,即将第一时间区间内的各日消费额累加后除以第一时间区间的日期数,该平均日消费额度反应整体消费情况;将各日消费额分别与所在的第一时间区间的平均日消费额比较,根据大小情况判断日期的高消费日和低消费日。
S200,分别判断高消费日和低消费日的日期是否符合预设聚类规律模型,若都符合,则计算高消费日的第一平均消费额和低消费日的第二平均消费额的差值,若差值大于平均日消费额的预设消费比例,则将待挖掘用户标记为潜在用户。
需要说明的是,许多用户的消费情况会以月为周期波动,例如发薪日之后的一个第一时间区间内,前15日的消费普遍高于后15日,这类用户的消费波动情况反映出其消费水平会随着当前钱币支付能力而变化,且可用存款不能维持消费水平;预设聚类规律模型可以采用欧式距离来度量,例如将多个典型的消费波动用户的数据用作样本组,训练K-means算法构成的聚类模型,得到预设聚类规律模型,将高消费日的日期或低消费日的日期输入后,即可根据日期的连续数量和在第一时间区间内的密集情况来判断消费情况是否符合波动;待挖掘用户的数据符合聚类规律模型时,则可认为用户的消费习惯存在周期性的波动情况;
而用户的消费习惯中体现出波动情况仅能证明用户的消费随当前钱币支付能力变化,还需要判断该波动是否影响生活质量,这样用户的消费习惯符合超前消费情况,在低生活质量时存在使用消费金融小额信贷需求,因此可以将其作为潜在用户;将高消费日的各日消费额求和取平均值,得到第一平均消费额,将低消费日的各日消费额求和取平均值,得到第二平均消费额,以两平均消费额的差值来判断波动的起伏程度大小,当前居民消费升级的表现形式包括消费水平升级、消费主体升级和消费方式升级,本实施例中仅考虑消费水平升级带来的生活质量改变,根据待挖掘用户所在城市地区的平均消费情况来计算在不同消费水平之间的消费差值占比,将该占比作为预设消费比例,即当第一平均消费额和第二平均消费额的差值大于平均日消费额的预设消费比例时,说明待挖掘用户的消费习惯带来的波动影响其原有的生活质量,例如本来平均日消费额为100元,因消费习惯和用户自身的钱币支付能力,在第一时间区间的前15天的第一平均消费额为180元,后15天的第二平均消费额为20元,这样差值160元相对于平均日消费额的比例为160%,明显影响生活质量,预设的消费比例可在50%-80%选择,当差值占比超出预设消费比例时,可视为用户钱币支付能力不足,可用储蓄不能维持生活质量,且有超前消费习惯,其存在消费信贷的需求,维持用户当前生活质量,因此可以将该待挖掘用户作为潜在用户,向其推送信息。
本实施例中,通过获取待挖掘用户的流水数据,根据流水数据计算各日消费额,以月度跨度为第一时间区间,将各日消费额归入多个第一时间区间内;计算各第一时间区间内的平均日消费额,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日;分别判断高消费日和低消费日的日期是否符合预设聚类规律模型,若都符合,则计算高消费日的第一平均消费额和低消费日的第二平均消费额的差值,若差值大于平均日消费额的预设消费比例,则将待挖掘用户标记为潜在用户;基于待挖掘用户的流水数据分析消费额的波动情况,判断用户的消费习惯与钱币支付能力是否有影响消费水平的情况,准确识别有资金需求的潜在用户。
以上为本申请提供的一种基于用户消费习惯的潜在用户挖掘方法的第一个实施例的详细说明,下面为本申请提供的一种基于用户消费习惯的潜在用户挖掘方法的第二个实施例的详细说明。
实施例二
本实施例中,进一步的提供了一种基于用户消费习惯的潜在用户挖掘方法,请参见图2,前述步骤S200中,将待挖掘用户标记为潜在用户之前,还包括:
S201,获取各月度的高消费日期区间,在多个月度的高消费日期区间中提取重合日期,由重合日期得到第二时间区间;
需要说明的是,各月份的高消费区间即将时间上最早的高消费日与最晚的高消费日分别做区间两端,多个月份的区间取交集得到重合日期,即例如4-6月三个月度的高消费日期区间分别为10-19号、9-17号和7-15号,三者之间的重合日期分别为10-17号、9-15号和10-15号,将三个重合日期取并集,得到第二时间区间,9-17号,该第二时间区间能反应出多个月度下整体的用户高消费集中的日期。
S202,获取消费数据和浏览数据,消费数据中包括第一商品信息和消费时间,浏览数据中包括第二商品信息和浏览时间;识别消费时间在第二时间区间的消费数据,将对应的第一商品信息与浏览数据中的第二商品信息进行匹配,得到多个有效浏览时间;计算各有效浏览时间与消费时间的时间差平均值;计算各消费数据对应的有效浏览次数平均值;
需要说明的是,目前的金融平台常会构建多个关联的平台,数据互通,消费数据和浏览数据为用户关联的消费购物平台处授权获取,本实施例中获取的流水数据、消费数据和浏览数据在用户授权获取后与用户的个人信息脱敏,仅对这些获取的数据特征进行分析;
消费数据即为用户在平台的消费记录,商品信息中会有商品名称和价格,商品的名称中即可得到商品类型,商品类型可以具体为手机、电脑、相机等,消费时间会有具体的下单购买商品的时间;浏览数据即为用户在平台的浏览足迹,例如用户当日浏览多个手机产品的界面,也会记载商品信息以及浏览时间,该浏览时间一般是以日期为单位进行浏览数据排序,并不记录具体的浏览精确时间;
根据识别消费时间在第二时间区间的消费数据,找到是在高消费集中的日期进行的消费,因用户的消费习惯,在该第二时间区间内的消费视为高消费;第一商品信息和第二商品信息中都会有商品的名称,通过商品名称将二者信息匹配,例如消费数据的第一商品信息中为购买手机的记录,在就看根据消费数据中商品类型为手机来匹配第二商品信息,得到用户浏览的关于手机的浏览记录;用户在购买手机前,会在平台先进行浏览,各与消费数据匹配的浏览数据的浏览时间都视为有效浏览时间,虽然整体的浏览记录中可能会在多个月份中离散分布有多个手机相关的浏览数据,但在购买前的浏览数据必然更密集出现,密集存在的有效浏览时间能淡化离散分布的有效浏览时间的影响,因此在计算各有效浏览时间与消费时间的时间差平均值时,该时间差平均值反映的实际为与消费记录最相关的密集存在的有效浏览时间,该时间差平均值又可以称为用户的购买决策时间,即用户有购买想法或欲望到付款下单的时间间隔,时间差平均值也反映了用户的消费习惯;有效浏览次数平均值即为用户在消费前平均要在平台进行的浏览次数,将所有匹配到的浏览数据次数除以消费数据次数即可。
S203,获取未匹配的浏览数据中浏览时间距离当前时间小于等于时间差平均值的第二商品信息,识别同类商品信息的第一浏览次数,若第一浏览次数大于有效浏览次数平均值,则获取商品的平均价格;若商品平均价格大于预设消费比例的多月平均日消费额,则将待挖掘用户标记为潜在用户。
需要说明的是,在用户的浏览数据中还会存在未与用户消费数据匹配的记录,在浏览数据的浏览时间距离当前时间大于时间差平均值时,可视为这些浏览数据对应内容的商品用户不会进行消费,因为已经超过了用户消费习惯的购买决策时间,即例如用户的时间差平均值为3天,那么在距离当前时间7天10天的这些数据就失去了策动或反映用户购买欲望的意义,这些时间距离大于购买决策时间数据的参考意义较小;而在这些未匹配的浏览数据中识别出同类商品信息的并统计同类商品信息的第一浏览次数后,能反应在这个时间差平均值内用户对此类商品的购买欲望程度,当第一浏览次数大于有效浏览次数平均值,则说明用户的购买欲望强烈,按用户的消费习惯会有很大的可能会购买对应类别的商品,因时间差采用的是平均值,实际的浏览数据应是在时间差平均值两侧均匀分布的,因此本实施例中第一浏览次数可以仅大于有效浏览次数平均值的一半即可;
确定用户要对该类商品消费后,可获取对应的浏览记录中商品的平均价格,将该平均价格与前述步骤S200的多个平均日消费额比较,将近几个月的日消费额取平均值,即可得到多月平均日消费额,当用户后续可能购买的商品价格会影响其生活质量时,即可将其标为潜在用户;因需要单次消费影响到整月消费水平,因此本实施例中的预设消费比例可以是前述步骤S200中的多倍。
进一步的,在前述步骤S100中,获取待挖掘用户的流水数据之后,还包括:
识别流水数据中的自动扣款项目,并将其从流水数据中剔除;自动扣款项目可在流水账单中的明细和交易原因中识别,本实施例中为从流水账单中分析用户的消费习惯,自动扣款项目如水电费缴纳、项目订阅等内容,不能充分反映用户主观的消费意图,在后续分析中可能会影响整体的判断精度。
进一步的,所述将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日之后,还包括:根据第一时间区间内的各日消费额拟合消费曲线,识别消费曲线上斜率绝对值超过预设斜率的第三时间区间,将第三时间区间对应的高消费日或低消费日剔除;
需要说明的是,可采用最小二乘法或多项式拟合法将离散的多个日消费额拟合成一条平滑的消费曲线,用户流水数据中徒然的消费额起伏并不能反映出规律性的消费习惯,反而会影响整体的分析精度,因此当消费曲线上斜率的绝对值较大时,说明对应日期的数据并没能反映出消费习惯的真实性,需要从对应的高消费日或低消费日中剔除,预设斜率可根据典型的消费波动用户的数据中的消费波动斜率均值来设置。
以上为本申请提供的第一方面的一种基于用户消费习惯的潜在用户挖掘方法的详细说明,下面为本申请第二方面提供的一种基于用户消费习惯的潜在用户挖掘系统的实施例的详细说明。
请参阅图3,图3为一种基于用户消费习惯的潜在用户挖掘系统结构图。本实施例提供了一种基于用户消费习惯的潜在用户挖掘系统,包括:
流水数据处理模块10,用于获取待挖掘用户的流水数据,根据流水数据计算各日消费额,以月度跨度为第一时间区间,将各日消费额归入多个第一时间区间内;计算各第一时间区间内的平均日消费额,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日;
用户挖掘模块20,用于分别判断高消费日和低消费日的日期是否符合预设聚类规律模型,若都符合,则计算高消费日的第一平均消费额和低消费日的第二平均消费额的差值,若差值大于平均日消费额的预设消费比例,则将待挖掘用户标记为潜在用户。
进一步的,所述用户挖掘模块20中,所述将待挖掘用户标记为潜在用户之前,还包括:
获取各月度的高消费日期区间,在多个月度的高消费日期区间中提取重合日期,由重合日期得到第二时间区间;
获取消费数据和浏览数据,消费数据中包括第一商品信息和消费时间,浏览数据中包括第二商品信息和浏览时间;识别消费时间在第二时间区间的消费数据,将对应的第一商品信息与浏览数据中的第二商品信息进行匹配,得到多个有效浏览时间;计算各有效浏览时间与消费时间的时间差平均值;计算各消费数据对应的有效浏览次数平均值;
获取未匹配的浏览数据中浏览时间距离当前时间小于等于时间差平均值的第二商品信息,识别同类商品信息的第一浏览次数,若第一浏览次数大于有效浏览次数平均值,则获取商品的平均价格;若商品平均价格大于预设消费比例的多月平均日消费额,则将待挖掘用户标记为潜在用户。
进一步的,所述流水数据处理模块10中,获取待挖掘用户的流水数据之后,还包括:
识别流水数据中的自动扣款项目,并将其从流水数据中剔除。
进一步的,所述流水数据处理模块10中,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日之后,还包括:
根据第一时间区间内的各日消费额拟合消费曲线,识别消费曲线上斜率绝对值超过预设斜率的第三时间区间,将第三时间区间对应的高消费日或低消费日剔除。
本申请第三方面还提供了一种基于用户消费习惯的潜在用户挖掘方法设备,包括处理器以及存储器:其中存储器用于存储程序代码,并将程序代码传输给处理器;处理器用于根据程序代码中的指令执行上述一种基于用户消费习惯的潜在用户挖掘方法。
本申请第四方面提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述一种基于用户消费习惯的潜在用户挖掘方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于用户消费习惯的潜在用户挖掘方法,其特征在于包括:
获取待挖掘用户的流水数据,根据流水数据计算各日消费额,以月度跨度为第一时间区间,将各日消费额归入多个第一时间区间内;计算各第一时间区间内的平均日消费额,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日;
分别判断高消费日和低消费日的日期是否符合预设聚类规律模型,若都符合,则计算高消费日的第一平均消费额和低消费日的第二平均消费额的差值,若差值大于平均日消费额的预设消费比例,则将待挖掘用户标记为潜在用户。
2.根据权利要求1所述的一种基于用户消费习惯的潜在用户挖掘方法,其特征在于,所述将待挖掘用户标记为潜在用户之前,还包括:
获取各月度的高消费日期区间,在多个月度的高消费日期区间中提取重合日期,由重合日期得到第二时间区间;
获取消费数据和浏览数据,消费数据中包括第一商品信息和消费时间,浏览数据中包括第二商品信息和浏览时间;识别消费时间在第二时间区间的消费数据,将对应的第一商品信息与浏览数据中的第二商品信息进行匹配,得到多个有效浏览时间;计算各有效浏览时间与消费时间的时间差平均值;计算各消费数据对应的有效浏览次数平均值;
获取未匹配的浏览数据中浏览时间距离当前时间小于等于时间差平均值的第二商品信息,识别同类商品信息的第一浏览次数,若第一浏览次数大于有效浏览次数平均值,则获取商品的平均价格;若商品平均价格大于预设消费比例的多月平均日消费额,则将待挖掘用户标记为潜在用户。
3.根据权利要求1所述的一种基于用户消费习惯的潜在用户挖掘方法,其特征在于,获取待挖掘用户的流水数据之后,还包括:
识别流水数据中的自动扣款项目,并将其从流水数据中剔除。
4.根据权利要求1所述的一种基于用户消费习惯的潜在用户挖掘方法,其特征在于,所述将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日之后,还包括:
根据第一时间区间内的各日消费额拟合消费曲线,识别消费曲线上斜率绝对值超过预设斜率的第三时间区间,将第三时间区间对应的高消费日或低消费日剔除。
5.一种基于用户消费习惯的潜在用户挖掘系统,其特征在于,包括:
流水数据处理模块,用于获取待挖掘用户的流水数据,根据流水数据计算各日消费额,以月度跨度为第一时间区间,将各日消费额归入多个第一时间区间内;计算各第一时间区间内的平均日消费额,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日;
用户挖掘模块,用于分别判断高消费日和低消费日的日期是否符合预设聚类规律模型,若都符合,则计算高消费日的第一平均消费额和低消费日的第二平均消费额的差值,若差值大于平均日消费额的预设消费比例,则将待挖掘用户标记为潜在用户。
6.根据权利要求5所述的一种基于用户消费习惯的潜在用户挖掘系统,其特征在于,所述用户挖掘模块中,所述将待挖掘用户标记为潜在用户之前,还包括:
获取各月度的高消费日期区间,在多个月度的高消费日期区间中提取重合日期,由重合日期得到第二时间区间;
获取消费数据和浏览数据,消费数据中包括第一商品信息和消费时间,浏览数据中包括第二商品信息和浏览时间;识别消费时间在第二时间区间的消费数据,将对应的第一商品信息与浏览数据中的第二商品信息进行匹配,得到多个有效浏览时间;计算各有效浏览时间与消费时间的时间差平均值;计算各消费数据对应的有效浏览次数平均值;
获取未匹配的浏览数据中浏览时间距离当前时间小于等于时间差平均值的第二商品信息,识别同类商品信息的第一浏览次数,若第一浏览次数大于有效浏览次数平均值,则获取商品的平均价格;若商品平均价格大于预设消费比例的多月平均日消费额,则将待挖掘用户标记为潜在用户。
7.根据权利要求5所述的一种基于用户消费习惯的潜在用户挖掘系统,其特征在于,所述流水数据处理模块中,获取待挖掘用户的流水数据之后,还包括:
识别流水数据中的自动扣款项目,并将其从流水数据中剔除。
8.根据权利要求5所述的一种基于用户消费习惯的潜在用户挖掘系统,其特征在于,所述流水数据处理模块中,将大于平均日消费额的日期标为高消费日,低于平均日消费额的日期标为低消费日之后,还包括:
根据第一时间区间内的各日消费额拟合消费曲线,识别消费曲线上斜率绝对值超过预设斜率的第三时间区间,将第三时间区间对应的高消费日或低消费日剔除。
9.一种基于用户消费习惯的潜在用户挖掘方法设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的一种基于用户消费习惯的潜在用户挖掘方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的一种基于用户消费习惯的潜在用户挖掘方法。
CN202311478876.2A 2023-11-08 2023-11-08 一种基于用户消费习惯的潜在用户挖掘方法及系统 Active CN117708183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311478876.2A CN117708183B (zh) 2023-11-08 2023-11-08 一种基于用户消费习惯的潜在用户挖掘方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311478876.2A CN117708183B (zh) 2023-11-08 2023-11-08 一种基于用户消费习惯的潜在用户挖掘方法及系统

Publications (2)

Publication Number Publication Date
CN117708183A true CN117708183A (zh) 2024-03-15
CN117708183B CN117708183B (zh) 2024-06-11

Family

ID=90155956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311478876.2A Active CN117708183B (zh) 2023-11-08 2023-11-08 一种基于用户消费习惯的潜在用户挖掘方法及系统

Country Status (1)

Country Link
CN (1) CN117708183B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107093101A (zh) * 2017-03-29 2017-08-25 广州汇融易互联网金融信息服务有限公司 基于pos流水数据的潜在贷款用户挖掘与风险评分方法
CN107578270A (zh) * 2017-08-03 2018-01-12 中国银联股份有限公司 一种金融标签的构建方法、装置及计算设备
CN108600970A (zh) * 2018-03-30 2018-09-28 深圳春沐源控股有限公司 一种信息提醒方法、装置及计算机可读存储介质
CN112967061A (zh) * 2021-03-02 2021-06-15 东华大学 具有交易性格的用户行为识别方法
US11270312B1 (en) * 2018-12-27 2022-03-08 Worldpay, Llc Systems and methods for computing and applying consumer value scores to electronic transactions
CN116433352A (zh) * 2023-02-21 2023-07-14 中国工商银行股份有限公司 潜在贷款对象的确定方法、装置及电子设备
CN116485472A (zh) * 2023-04-24 2023-07-25 道格元创(福建)文化创意有限公司 基于互联网和人工智能的精准广告、信息的投放系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107093101A (zh) * 2017-03-29 2017-08-25 广州汇融易互联网金融信息服务有限公司 基于pos流水数据的潜在贷款用户挖掘与风险评分方法
CN107578270A (zh) * 2017-08-03 2018-01-12 中国银联股份有限公司 一种金融标签的构建方法、装置及计算设备
CN108600970A (zh) * 2018-03-30 2018-09-28 深圳春沐源控股有限公司 一种信息提醒方法、装置及计算机可读存储介质
US11270312B1 (en) * 2018-12-27 2022-03-08 Worldpay, Llc Systems and methods for computing and applying consumer value scores to electronic transactions
CN112967061A (zh) * 2021-03-02 2021-06-15 东华大学 具有交易性格的用户行为识别方法
CN116433352A (zh) * 2023-02-21 2023-07-14 中国工商银行股份有限公司 潜在贷款对象的确定方法、装置及电子设备
CN116485472A (zh) * 2023-04-24 2023-07-25 道格元创(福建)文化创意有限公司 基于互联网和人工智能的精准广告、信息的投放系统

Also Published As

Publication number Publication date
CN117708183B (zh) 2024-06-11

Similar Documents

Publication Publication Date Title
US20230281652A1 (en) System, method and computer program product for geo-specific vehicle pricing
WO2019105226A1 (zh) 一种用于营销活动效果预测的方法、装置及电子设备
CN106407210B (zh) 一种业务对象的展示方法和装置
Dullaghan et al. Integration of machine learning techniques to evaluate dynamic customer segmentation analysis for mobile customers
CN108154275A (zh) 基于大数据的汽车残值预测模型及预测方法
US11842293B2 (en) Systems and methods for short identifier behavioral analytics
CN116823409B (zh) 一种基于目标搜索数据的智能筛选方法及系统
CN111340606A (zh) 一种全流程收入稽核方法和装置
CN112581291B (zh) 风险测评异动检测方法、装置、设备及存储介质
CN116757749B (zh) 基于大数据的广告推送效果评估方法、系统及存储介质
CN110019798B (zh) 一种用于对进销项商品种类差异进行度量的方法及系统
Ncube et al. Assessment of apparent losses due to meter inaccuracy using an alternative, validated methodology
CN110197316B (zh) 运营数据的处理方法、装置、计算机可读介质及电子设备
CN117708183B (zh) 一种基于用户消费习惯的潜在用户挖掘方法及系统
CN113159545A (zh) 确定价值属性值的方法、装置、电子设备和存储介质
CN117172825A (zh) 基于大数据的电商数据分析方法、装置及计算设备
KR101911922B1 (ko) 빅데이터 기반 무형저축상품 전자결제를 이용한 결제통합 저축 서비스 제공 방법
CN115619430A (zh) 用户价值评估方法及装置
CN108376300A (zh) 一种基于概率图模型的用户用电行为预测方法
CN113837648A (zh) 企业关联性分析方法、关联企业推荐方法和装置
CN114387085A (zh) 流水数据处理方法、装置、计算机设备和存储介质
CN114091715A (zh) 一种预测应收账款未来回款的方法及系统
CN111164633A (zh) 一种评分卡模型的调整方法、装置、服务器及存储介质
CN117726378B (zh) 基于移动互联网的流量数据统计分析方法
CN111192038B (zh) 基于电子账单的责任险信息处理方法、装置及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant