CN108416619B - 一种消费间隔时间预测方法、装置及可读存储介质 - Google Patents

一种消费间隔时间预测方法、装置及可读存储介质 Download PDF

Info

Publication number
CN108416619B
CN108416619B CN201810130236.5A CN201810130236A CN108416619B CN 108416619 B CN108416619 B CN 108416619B CN 201810130236 A CN201810130236 A CN 201810130236A CN 108416619 B CN108416619 B CN 108416619B
Authority
CN
China
Prior art keywords
consumption
interval time
prediction
client
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810130236.5A
Other languages
English (en)
Other versions
CN108416619A (zh
Inventor
唐傲
韩雪晨
杨绪勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Weiche Technology Co ltd
Original Assignee
Shenzhen Weiche Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Weiche Technology Co ltd filed Critical Shenzhen Weiche Technology Co ltd
Priority to CN201810130236.5A priority Critical patent/CN108416619B/zh
Publication of CN108416619A publication Critical patent/CN108416619A/zh
Application granted granted Critical
Publication of CN108416619B publication Critical patent/CN108416619B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Water Supply & Treatment (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明适用于计算机软件领域,提供了一种消费间隔时间预测方法、装置及可读存储介质,方法包括:根据客户的前m次历史消费记录,获取至少两种消费预测模型对后n‑m次消费的消费间隔时间的预测信息;根据消费间隔时间的预测信息和后n‑m次历史消费记录,确定与客户对应的目标消费预测模型;利用目标消费预测模型生成客户第n+1次消费与第n次消费的预测消费间隔时间,并输出。解决了现有技术中无法精准预测客户的消费时间间隔的问题;且由于最终的消费预测模型是根据该模型的预测结果与实际情况对比后得出的目标消费预测模型,最后获得的消费预测模型是最能反映客户消费习惯的模型,从而得到的消费时间间隔的预测结果更精确。

Description

一种消费间隔时间预测方法、装置及可读存储介质
技术领域
本发明属于计算机软件领域,尤其涉及一种消费间隔时间预测方法、装置及可读存储介质。
背景技术
随着经济水平的发展,人均拥有的车辆数量不断增多,为了更方便的使用汽车,大量客户去加油站给汽车进行加油,加油站的客户越来越多。
随着客户加油次数的增多,客户的加油间隔时间存在一定的规律,为了更加了解客户,部分油站开始利用数学模型来预测客户的加油间隔时间。
但由于不同的客户消费习惯不同,加油规律也不同,利用某个统一的模型来预测客户的加油间隔时间往往与实际情况有较大的误差,从而无法精准预测客户的加油时间间隔。
发明内容
本发明实施例提供一种消费间隔时间预测方法,旨在解决现有技术中无法精准预测客户加油间隔时间的问题。
本发明实施例是这样实现的,一种消费间隔时间预测方法,客户有n次历史消费记录,n次历史消费记录中可包含前m次历史消费记录和后n-m次历史消费记录,方法包括:
根据客户的前m次历史消费记录,获取至少两种消费预测模型对后n-m次消费的消费间隔时间的预测信息;
根据消费间隔时间的预测信息和后n-m次历史消费记录,确定与客户对应的目标消费预测模型;
利用目标消费预测模型生成客户第n+1次消费与第n次消费的预测消费间隔时间,并输出。
本发明实施例还提供一种消费间隔时间预测装置,客户有n次历史消费记录,n次历史消费记录中可包含前m次历史消费记录和后n-m次历史消费记录,装置包括:
预测信息获取单元,用于根据客户的前m次历史消费记录,获取至少两种消费预测模型对后n-m次消费的消费间隔时间的预测信息;
目标消费预测模型确定单元,用于根据消费间隔时间的预测信息和后n-m次历史消费记录,确定与客户对应的目标消费预测模型;
预测消费间隔时间生成单元,用于利用目标消费预测模型生成客户第n+1次消费与第n次消费的预测消费间隔时间,并输出。
本发明实施例还提供一种可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述消费间隔时间预测方法的步骤。
在本发明实施例中,客户的n次历史消费记录是系统预存储数据,可根据客户的前m次消费记录,利用至少两种消费预测模型对客户的后n-m次消费的消费间隔时间进行预测,再与客户的后n-m次历史消费记录进行对比,从而获得目标消费预测模型,再利用目标消费预测模型生成客户第n+1次消费与第n次消费的预测消费间隔时间,解决了现有技术中无法精准预测客户的消费时间间隔的问题;且由于最终的消费预测模型是根据该模型的预测结果与实际情况对比后得出的目标消费预测模型,最后获得的消费预测模型是最能反映客户消费习惯的模型,从而得到的消费时间间隔的预测结果更精确。
附图说明
图1是本发明实施例一提供的消费间隔时间预测方法的流程图;
图2是本发明实施例二提供的消费间隔时间预测方法的流程图;
图3是本发明实施例三提供的消费间隔时间预测装置的功能模块图;
图4是本发明实施例四提供的消费间隔时间预测装置的功能模块图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
在本发明实施例中,系统中预存有客户的n次历史消费记录,利用至少两种消费预测模型对后n-m次的消费时间间隔进行预测,进而结合后n-m次历史消费记录从上述至少两种消费预测模型中确定目标消费预测模型,并利用目标消费预测模型生成客户第n+1次消费与第n次消费的预测消费间隔时间。解决了现有技术中无法精准预测消费间隔时间的问题;且由于最终的消费预测模型是根据该模型的预测结果与实际情况对比后得出的目标消费预测模型,最后获得的消费预测模型是最能反映客户消费习惯的模型,从而得到的消费时间间隔的预测结果更精确。
实施例一:
图1示出了本发明实施例一提供的消费间隔时间预测方法的流程,客户有n次历史消费记录,n次历史消费记录中可包含前m次历史消费记录和后n-m次历史消费记录,具体包括如下步骤:
步骤S101,根据客户的前m次历史消费记录,获取至少两种消费预测模型对后n-m次消费的消费间隔时间的预测信息。
在本发明实施例中,客户的历史消费记录用于记录客户来油站消费的相关信息,根据客户来油站消费时产生的消费订单生成。
作为本发明的一优选实施例,历史消费记录至少包括消费金额信息、加油量信息和消费时间信息。
在本发明实施例中,消费金额信息可包括付款金额、优惠券抵扣金额或积分抵扣金额等其他和消费金额相关的信息等,进一步的,还可包括客户的平均付款金额等,此处不做限定。
加油量信息可包括加油升数、估计加满升数或其他与加油量相关的信息等,此处不做限定。
消费时间信息可包括付款日期、付款日期是在一年的第几天、付款日期是在一个月的第几天、付款日期是在一周的第几天、付款时间点或其他与消费时间相关的信息等,进一步的,还可包括消费间隔时间等,此处不做限定。
在本发明实施例中,对后n-m次消费的消费间隔时间的预测信息包括第m+1次消费与第m次消费的间隔时间、第m+2次消费与第m+1次消费的间隔时间、第m+3次消费与第m+4次消费的间隔时间直至第n次消费与第n-1次消费的间隔时间。
其中,消费的间隔时间可以为消费间隔天数,进一步的,还可以为消费间隔小时数。
作为本发明的另一优选实施例,消费预测模型为统计模型、逻辑回归模型和神经网络计算模型的任意组合。
在本发明实施例中,逻辑回归模型可包括订单全因素逻辑回归模型等,神经网络计算模型可包括订单全因素ANN(Artificial Neural Network,人工神经网络)、订单全因素+2历史间隔节点RNN(Recurrent neural Network,循环神经网络)、订单全因素+3历史间隔节点RNN或其他神经网络计算模型等,具体消费预测模型的选择,此处不做限定。
在本发明实施例中,客户的前m次历史消费记录为系统预先存储数据,可通过至少两种消费预测模型对后n-m次消费的消费间隔时间进行预测,以获取后n-m次消费的消费间隔天数。
作为示例,例如可利用订单全因素逻辑回归模型获得客户的预测消费间隔天数,利用订单全因素逻辑回归模型生成客户的预测加油间隔天数的公式为:
θTX=[θ01*M+θ2*Q+θ3*L+θ4*D+θ5*C+θ6*PT_d+θ7*PT_m+θ8*PT_w+θ9*PT_h]
Figure BDA0001574722050000051
其中,hθ(X)(也即pj)为客户的预测消费间隔时间,M=mj(j=1,2,...,n)为客户的消费金额,L={l1,l2,....,ln}为客户的加油升数,D={d1,d2,....,dn}为客户的优惠券抵扣金额,C={c1,c2,....,cn}为积分抵扣金额,PT_d={ptd1,ptd2,....,ptdn}为付款时间为一年的第几天,PT_m={ptm1,ptm2,....,ptmn}为付款时间为一月的第几天,PT_w={ptw1,ptw2,.....,ptwn}为付款时间为一周的第几天,PT_h={pth1,pth2,.....,pthn}为付款时间为一天的第几点。
Q=(q1,q2,...,Qj...,qm)为加满估计满足:
Figure BDA0001574722050000052
时qj=0.6
mj%c!=0时qj=1
其中,c的数值为系统预设数值,也即付款金额大于平均付款金额时,此时估计为0.6;付款金额不能被c整除时,此时估计为1。
参数θ为系统预先设定数据,以加油间隔天数的总误差为目标函数训练逻辑回归模型,使用梯度下降法进行参数逐步更新,来确定合适的模型参数θ。
由上述公式得到的(也即pj)对样本数据中的实际用户加油间隔天数进行归一化操作,使得pj∈[0,1],所以通过订单全因素逻辑回归模型输出的加油间隔天数为归一化结果,那么所预测的值也在[0,1]。将结果进行反归一化即可得到符合实际的间隔天数。
应当理解,此处对利用消费预测模型获得客户的预测消费间隔天数的举例仅为方便理解本方案,以证明本方案的可实施性,具体实现方式的设定,此处不做限定。
在本发明实施例中,将消费预测模型确定为统计模型、逻辑回归模型和神经网络计算模型的任意组合,由于统计模型、逻辑回归模型和神经网络计算模型的学习能力逐步提高,也即处理复杂数据的能力逐步提升;但学习能力强的消费预测模型又容易出现过学习的情形,也即过分解读数据。利用客户的历史消费记录对上述三种类型的消费预测模型进行验证,进而选择出最优的消费预测模型,保证了无论客户的消费习惯简单还是复杂,均能有与之匹配的消费预测模型,以拓宽本方案的数据处理能力。
作为本发明的另一优选实施例,m与n的比例不低于百分之八十。
在本发明实施例中,系统中可预先设定m与n的取值,由于消费预测模型需要根据前m次历史消费记录对后n-m次消费的消费间隔时间进行预测,将m与n的比例预设为不低于百分之八十,可提供尽量多的数据作为进行预测的依据,但同时有有百分之二十的数据对预测的消费间隔时间进行验证,从而尽量保证最后确定的目标消费预测模型为最适合当前客户的消费规律的模型,以实现对客户消费间隔时间的精准预测。
步骤S102,根据消费间隔时间的预测信息和后n-m次历史消费记录,确定与客户对应的目标消费预测模型。
在本发明实施例中,目标消费预测模型为最能精准预测客户的消费间隔时间的模型。
在本发明实施例中,后n-m次历史消费记录为系统已存储数据,可根据上述数据,获取到客户的后n-m次历史消费的实际消费间隔时间;在获得到对后n-m次消费间隔时间的预测时间后,将预测的消费间隔时间与实际的消费间隔时间进行对比,从而获得最能精准预测客户的消费间隔时间的消费预测模型。
其中,可对比客户的后n-m次历史消费的实际消费间隔时间和客户的后n-m次消费间隔时间的预测时间,对对应的消费预测模型进行评分,根据不同模型的评分值获得目标消费预测模型;也可以将客户的后n-m次历史消费的实际消费间隔时间和客户的后n-m次消费间隔时间的预测时间均图形化,根据图形见的相似度,以获取到目标消费预测模型等,应当理解,此处对目标消费预测模型的获取方式的举例仅为方便理解本方案,具体实现方式的选择,此处不做限定。
步骤S103,利用目标消费预测模型生成客户第n+1次消费与第n次消费的预测消费间隔时间,并输出。
在本发明实施例中,在确定了消费预测模型之后,将客户的n次历史消费记录带入到目标消费预测模型中,以生成客户第n+1次消费与第n次消费的预测消费间隔时间。
在本发明实施例中,客户的n次历史消费记录是系统预存储数据,可根据客户的前m次消费记录,利用至少两种消费预测模型对客户的后n-m次消费的消费间隔时间进行预测,再与客户的后n-m次历史消费记录进行对比,从而获得目标消费预测模型,再利用目标消费预测模型生成客户第n+1次消费与第n次消费的预测消费间隔时间,解决了现有技术中无法精准预测客户的消费时间间隔的问题;且由于最终的消费预测模型是根据该模型的预测结果与实际情况对比后得出的目标消费预测模型,最后获得的消费预测模型是最能反映客户消费习惯的模型,从而得到的消费时间间隔的预测结果更精确。
实施例二:
图2示出了本发明实施例二提供的消费间隔时间预测方法的流程,基于实施例一,步骤S102具体包括:
步骤S201,根据消费间隔时间的预测信息和客户的后n-m次历史消费记录,分别生成与至少两种消费预测模型各自对应的评分值。
在本发明实施例中,客户的后n-m次历史消费记录为服务器已存储数据,从后n-m次历史消费记录中可获得到客户的后n-m次消费的实际消费间隔时间;通过步骤S101可获取到至少两种消费预测模型对后n-m次消费的预测的消费间隔时间,对比后n-m次消费的实际消费间隔时间与预测的消费间隔时间,可根据预测的消费间隔时间与实际消费间隔时间之间的误差,分别生成上述至少两种消费预测模型各自对应的评分值。
其中,可以将预测的消费间隔时间与实际的消费间隔时间的误差的绝对值相加,以作为该消费预测模型对应的评分值,作为示例,例如n取值为50,m取值为40,后10次的实际消费间隔时间依次为5天、6天、8天、7天、6天、7天、8天、5天、6天、7天,通过统计模型获得的后10次的预测消费间隔时间依次为6天、7天、7天、7天、7天、7天、7天、7天、7天、7天,通过订单全因素逻辑回归模型获得的后10次的消费预测间隔时间依次为5天、6天、7天、7天、7天、7天、8天、5天、6天、7天,则将通过统计模型和订单全因素逻辑回归模型分别获得的后10次的预测消费间隔时间与后10次的实际消费预测间隔时间对比,通过统计模型获得的后10次的预测消费间隔时间与实际消费间隔时间的误差为8天,则与统计模型对应的评分值为8;通过订单全因素逻辑回归模型获得的后10次的预测消费间隔时间与实际消费间隔时间的误差为2天,则与订单全因素逻辑回归模型对应的评分值为2等;
也可以将预测的消费间隔时间与实际的消费间隔时间的误差的绝对值相加,根据误差的绝对值给予不同等级的评分值,作为示例,例如误差在1-3天对应的评分值为95,误差在4-6天对应的评分值为90分,误差在7-9天对应的评分值为85分,通过统计模型获得的后10次的预测消费间隔时间与实际消费间隔时间的误差为8天,则与统计模型对应的评分值为85分;通过订单全因素逻辑回归模型获得的后10次的预测消费间隔时间与实际消费间隔时间的误差为2天,则与订单全因素逻辑回归模型对应的评分值为95分等;应当理解,此处举例仅为方便理解本方案,具体不同消费预测模型的评分值的获得方式,此处不做限定。
步骤S202,获取评分值最优的消费预测模型。
在本发明实施例中,评分值最优的消费预测模型可以是评分值最低的消费预测模型,也可以是评分值最高的消费预测模型,可按照实际情况灵活选择,此处不做限定。
在本发明实施例中,根据客户的后n-m次的实际间隔时间对不同消费预测模型进行评分,进而获取评分值最优的消费预测模型。与消费预测模型对应的评分值可比较客观的反应出该模型对该客户的消费间隔时间进行预测的精准度,将消费预测模型的预测精准度数值化后,更加客观,且便于系统进行选择;此外,由于根据不同的消费预测模型对后n-m次的消费间隔时间进行预测时,最后获得的误差值可能会出现近似的情况,通过评分的方式可以精确的反应出不同消费预测模型之间的差距,从而选出最适合该客户的消费预测模型。
实施例二还提供了本发明的一优选实施例,获取与消费预测模型对应的评分值采用如下公式计算:
errj=pj-dj(j∈[m,n)
Figure BDA0001574722050000091
其中,n为客户的历史消费次数,m为客户的历史消费次数中的第m次,j为客户的第m+1次至第n次消费中的任意一次,pj是预测的第j+1次与第j次消费间隔天数,dj是实际的第j+1次与第j次消费间隔天数,errj是预测的第j+1次与第j次消费间隔天数与实际的第j+1次与第j次消费间隔天数的误差,sr为对通过各消费预测模型得到的消费间隔时间结果的评分,Me为clip(|errj|,0,Me)函数所取的最大值。
作为本发明的优选实施例,Me的取值为5。
在本发明实施例中,Me为系统预先设定的数值,在获取到预测的第j+1次与第j次消费间隔天数与实际的第j+1次与第j次消费间隔天数的误差errj之后,利用clip(|errj|,0,Me)函数对上述误差进行处理,也即实际误差errj超过Me时,按照Me处理。再将处理后的误差天数想加,以获得对应模型的评分值。由于客户在加油过程中,可能会出现突发情形,例如客户休假旅行半个月,则这次的加油间隔时间为15天以上,而这种突发情形并不能作为评判一个消费预测模型是否能精准预测该客户的消费间隔时间的依据,通过clip(|errj|,0,Me)函数排除客户的突发行为给数据统计造成的影响,以减少意外数据给最终评分值造成的不良影响,从而保证评分值可以客观的反应出对应的消费预测模型是否能够精准预测对应客户的消费间隔时间,从而选出最合适的模型。
实施例三:
图3示出了本发明实施例三提供的消费间隔时间预测装置的功能模块图,客户有n次历史消费记录,n次历史消费记录中可包含前m次历史消费记录和后n-m次历史消费记录,具体包括:
预测信息获取单元31,用于根据客户的前m次历史消费记录,获取至少两种消费预测模型对后n-m次消费的消费间隔时间的预测信息。
在本发明实施例中,客户的历史消费记录用于记录客户来油站消费的相关信息,根据客户来油站消费时产生的消费订单生成。
作为本发明的一优选实施例,历史消费记录至少包括消费金额信息、加油量信息和消费时间信息。
在本发明实施例中,消费金额信息可包括付款金额、优惠券抵扣金额或积分抵扣金额等其他和消费金额相关的信息等,进一步的,还可包括客户的平均付款金额等,此处不做限定。
加油量信息可包括加油升数、估计加满升数或其他与加油量相关的信息等,此处不做限定。
消费时间信息可包括付款日期、付款日期是在一年的第几天、付款日期是在一个月的第几天、付款日期是在一周的第几天、付款时间点或其他与消费时间相关的信息等,进一步的,还可包括消费间隔时间等,此处不做限定。
在本发明实施例中,对后n-m次消费的消费间隔时间的预测信息包括第m+1次消费与第m次消费的间隔时间、第m+2次消费与第m+1次消费的间隔时间、第m+3次消费与第m+4次消费的间隔时间直至第n次消费与第n-1次消费的间隔时间。
其中,消费的间隔时间可以为消费间隔天数,进一步的,还可以为消费间隔小时数。
作为本发明的另一优选实施例,消费预测模型为统计模型、逻辑回归模型和神经网络计算模型的任意组合。
在本发明实施例中,逻辑回归模型可包括订单全因素逻辑回归模型等,神经网络计算模型可包括订单全因素ANN(Artificial Neural Network,人工神经网络)、订单全因素+2历史间隔节点RNN(Recurrent neural Network,循环神经网络)、订单全因素+3历史间隔节点RNN或其他神经网络计算模型等,具体消费预测模型的选择,此处不做限定。
在本发明实施例中,客户的前m次历史消费记录为系统预先存储数据,可通过至少两种消费预测模型对后n-m次消费的消费间隔时间进行预测,以获取后n-m次消费的消费间隔天数。
作为示例,例如可利用订单全因素逻辑回归模型获得客户的预测消费间隔天数,利用订单全因素逻辑回归模型生成客户的预测加油间隔天数的公式为:
θTX=[θ01*M+θ2*Q+θ3*L+θ4*D+θ5*C+θ6*PT_d+θ7*PT_m+θ8*PT_w+θ9*PT_h]
Figure BDA0001574722050000111
其中,hθ(X)(也即pj)为客户的预测消费间隔时间,M为客户的消费金额,L为客户的加油升数,D为客户的优惠券抵扣金额,C为积分抵扣金额,PT_d为付款时间为一年的第几天,PT_m为付款时间为一月的第几天,PT_w为付款时间为一周的第几天,PT_h为付款时间为一天的第几点。
Q=(q1,q2,...,qj...,qm)为加满估计满足:
Figure BDA0001574722050000112
时qj=0.6
mj%c!=0时qj=1
其中,c的数值为系统预设数值,也即付款金额大于平均付款金额时,此时估计为0.6;付款金额不能被c整除时,此时估计为1。j为客户前m次消费中的任意一次。
参数θ为系统预先设定数据,以加油间隔天数的总误差为目标函数训练逻辑回归模型,使用梯度下降法进行参数逐步更新,来确定合适的模型参数θ。
由上述公式得到的(也即pj)对样本数据中的实际用户加油间隔天数进行归一化操作,使得pj∈[0,1],所以通过订单全因素逻辑回归模型输出的加油间隔天数为归一化结果,那么所预测的值也在[0,1]。将结果进行反归一化即可得到符合实际的间隔天数。
应当理解,此处对利用消费预测模型获得客户的预测消费间隔天数的举例仅为方便理解本方案,以证明本方案的可实施性,具体实现方式的设定,此处不做限定。
在本发明实施例中,将消费预测模型确定为统计模型、逻辑回归模型和神经网络计算模型的任意组合,由于统计模型、逻辑回归模型和神经网络计算模型的学习能力逐步提高,也即处理复杂数据的能力逐步提升;但学习能力强的消费预测模型又容易出现过学习的情形,也即过分解读数据。利用客户的历史消费记录对上述三种类型的消费预测模型进行验证,进而选择出最优的消费预测模型,保证了无论客户的消费习惯简单还是复杂,均能有与之匹配的消费预测模型,以拓宽本方案的数据处理能力。
作为本发明的另一优选实施例,m与n的比例不低于百分之八十。
在本发明实施例中,系统中可预先设定m与n的取值,由于消费预测模型需要根据前m次历史消费记录对后n-m次消费的消费间隔时间进行预测,将m与n的比例预设为不低于百分之八十,可提供尽量多的数据作为进行预测的依据,但同时有有百分之二十的数据对预测的消费间隔时间进行验证,从而尽量保证最后确定的目标消费预测模型为最适合当前客户的消费规律的模型,以实现对客户消费间隔时间的精准预测。
目标消费预测模型确定单元32,用于根据消费间隔时间的预测信息和后n-m次历史消费记录,确定与客户对应的目标消费预测模型。
在本发明实施例中,目标消费预测模型为最能精准预测客户的消费间隔时间的模型。
在本发明实施例中,后n-m次历史消费记录为系统已存储数据,可根据上述数据,获取到客户的后n-m次历史消费的实际消费间隔时间;在获得到对后n-m次消费间隔时间的预测时间后,将预测的消费间隔时间与实际的消费间隔时间进行对比,从而获得最能精准预测客户的消费间隔时间的消费预测模型。
其中,可对比客户的后n-m次历史消费的实际消费间隔时间和客户的后n-m次消费间隔时间的预测时间,对对应的消费预测模型进行评分,根据不同模型的评分值获得目标消费预测模型;也可以将客户的后n-m次历史消费的实际消费间隔时间和客户的后n-m次消费间隔时间的预测时间均图形化,根据图形见的相似度,以获取到目标消费预测模型等,应当理解,此处对目标消费预测模型的获取方式的举例仅为方便理解本方案,具体实现方式的选择,此处不做限定。
预测消费间隔时间生成单元33,用于利用目标消费预测模型生成客户第n+1次消费与第n次消费的预测消费间隔时间,并输出。
在本发明实施例中,在确定了消费预测模型之后,将客户的n次历史消费记录带入到目标消费预测模型中,以生成客户第n+1次消费与第n次消费的预测消费间隔时间。
在本发明实施例中,客户的n次历史消费记录是系统预存储数据,可根据客户的前m次消费记录,利用至少两种消费预测模型对客户的后n-m次消费的消费间隔时间进行预测,再与客户的后n-m次历史消费记录进行对比,从而获得目标消费预测模型,再利用目标消费预测模型生成客户第n+1次消费与第n次消费的预测消费间隔时间,解决了现有技术中无法精准预测客户的消费时间间隔的问题;且由于最终的消费预测模型是根据该模型的预测结果与实际情况对比后得出的目标消费预测模型,最后获得的消费预测模型是最能反映客户消费习惯的模型,从而得到的消费时间间隔的预测结果更精确。
实施例四:
图4示出了本发明实施例四提供的消费间隔时间预测装置的功能模块,基于实施例三,预测消费间隔时间生成单元32具体包括:
评分值生成模块41,用于根据消费间隔时间的预测信息和客户的后n-m次历史消费记录,分别生成与至少两种消费预测模型各自对应的评分值。
在本发明实施例中,客户的后n-m次历史消费记录为服务器已存储数据,从后n-m次历史消费记录中可获得到客户的后n-m次消费的实际消费间隔时间;通过预测信息获取单元31可获取到至少两种消费预测模型对后n-m次消费的预测的消费间隔时间,对比后n-m次消费的实际消费间隔时间与预测的消费间隔时间,可根据预测的消费间隔时间与实际消费间隔时间之间的误差,分别生成上述至少两种消费预测模型各自对应的评分值。
其中,可以将预测的消费间隔时间与实际的消费间隔时间的误差的绝对值相加,以作为该消费预测模型对应的评分值,作为示例,例如n取值为50,m取值为40,后10次的实际消费间隔时间依次为5天、6天、8天、7天、6天、7天、8天、5天、6天、7天,通过统计模型获得的后10次的预测消费间隔时间依次为6天、7天、7天、7天、7天、7天、7天、7天、7天、7天,通过订单全因素逻辑回归模型获得的后10次的消费预测间隔时间依次为5天、6天、7天、7天、7天、7天、8天、5天、6天、7天,则将通过统计模型和订单全因素逻辑回归模型分别获得的后10次的预测消费间隔时间与后10次的实际消费预测间隔时间对比,通过统计模型获得的后10次的预测消费间隔时间与实际消费间隔时间的误差为8天,则与统计模型对应的评分值为8;通过订单全因素逻辑回归模型获得的后10次的预测消费间隔时间与实际消费间隔时间的误差为2天,则与订单全因素逻辑回归模型对应的评分值为2等;
也可以将预测的消费间隔时间与实际的消费间隔时间的误差的绝对值相加,根据误差的绝对值给予不同等级的评分值,作为示例,例如误差在1-3天对应的评分值为95,误差在4-6天对应的评分值为90分,误差在7-9天对应的评分值为85分,通过统计模型获得的后10次的预测消费间隔时间与实际消费间隔时间的误差为8天,则与统计模型对应的评分值为85分;通过订单全因素逻辑回归模型获得的后10次的预测消费间隔时间与实际消费间隔时间的误差为2天,则与订单全因素逻辑回归模型对应的评分值为95分等;应当理解,此处举例仅为方便理解本方案,具体不同消费预测模型的评分值的获得方式,此处不做限定。
消费预测模型获取模块42,用于获取评分值最优的消费预测模型。
在本发明实施例中,评分值最优的消费预测模型可以是评分值最低的消费预测模型,也可以是评分值最高的消费预测模型,可按照实际情况灵活选择,此处不做限定。
在本发明实施例中,根据客户的后n-m次的实际间隔时间对不同消费预测模型进行评分,进而获取评分值最优的消费预测模型。与消费预测模型对应的评分值可比较客观的反应出该模型对该客户的消费间隔时间进行预测的精准度,将消费预测模型的预测精准度数值化后,更加客观,且便于系统进行选择;此外,由于根据不同的消费预测模型对后n-m次的消费间隔时间进行预测时,最后获得的误差值可能会出现近似的情况,通过评分的方式可以精确的反应出不同消费预测模型之间的差距,从而选出最适合该客户的消费预测模型。
实施例四还提供了本发明的一优选实施例,获取与消费预测模型对应的评分值采用如下公式计算:
errj=pj-dj(j∈[m,n])
Figure BDA0001574722050000151
其中,n为客户的历史消费次数,m为客户的历史消费次数中的第m次,j为客户的第m+1次至第n次消费中的任意一次,pj是预测的第j+1次与第j次消费间隔天数,dj是实际的第j+1次与第j次消费间隔天数,errj是预测的第j+1次与第j次消费间隔天数与实际的第j+1次与第j次消费间隔天数的误差,sr为对通过各消费预测模型得到的消费间隔时间结果的评分,Me为clip(|errj|,0,Me)函数所取的最大值。
作为本发明的优选实施例,Me的取值为5。
在本发明实施例中,Me为系统预先设定的数值,在获取到预测的第j+1次与第j次消费间隔天数与实际的第j+1次与第j次消费间隔天数的误差errj之后,利用clip(|errj|,0,Me)函数对上述误差进行处理,也即实际误差errj超过Me时,按照Me处理。再将处理后的误差天数想加,以获得对应模型的评分值。由于客户在加油过程中,可能会出现突发情形,例如客户休假旅行半个月,则这次的加油间隔时间为15天以上,而这种突发情形并不能作为评判一个消费预测模型是否能精准预测该客户的消费间隔时间的依据,通过clip(|errj|,0,Me)函数排除客户的突发行为给数据统计造成的影响,以减少意外数据给最终评分值造成的不良影响,从而保证评分值可以客观的反应出对应的消费预测模型是否能够精准预测对应客户的消费间隔时间,从而选出最合适的模型。
实施例五:
本发明实施例还提供了一种可读存储介质,该可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如实施例一或实施例二所描述的任一消费间隔时间预测方法的步骤。
示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在终端设备中的执行过程。例如,上述计算机程序可以被分割成上述各个装置实施例提供消费间隔时间预测装置的单元或模块。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,上述处理器是上述终端设备的控制中心,利用各种接口和线路连接整个用户终端的各个部分。
上述存储器可用于存储计算机程序和/或模块,上述处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现上述终端设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如预测信息获取功能、评分值生成功能等)等;存储数据区可存储根据泊位状态显示系统的使用所创建的数据(比如与消费预测模型对应的评分值、客户的n次历史消费记录等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在本发明实施例中,客户的n次历史消费记录是系统预存储数据,可根据客户的前m次消费记录,利用至少两种消费预测模型对客户的后n-m次消费的消费间隔时间进行预测,再与客户的后n-m次历史消费记录进行对比,从而获得目标消费预测模型,再利用目标消费预测模型生成客户第n+1次消费与第n次消费的预测消费间隔时间,解决了现有技术中无法精准预测客户的消费时间间隔的问题;且由于最终的消费预测模型是根据该模型的预测结果与实际情况对比后得出的目标消费预测模型,最后获得的消费预测模型是最能反映客户消费习惯的模型,从而得到的消费时间间隔的预测结果更精确。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种消费间隔时间预测方法,客户有n次历史消费记录,n次历史消费记录中可包含前m次历史消费记录和后n-m次历史消费记录,其特征在于,所述方法包括:
根据所述客户的前m次历史消费记录,获取至少两种消费预测模型对后n-m次消费的消费间隔时间的预测信息;
根据所述消费间隔时间的预测信息和所述后n-m次历史消费记录,确定与所述客户对应的目标消费预测模型;
利用所述目标消费预测模型生成所述客户第n+1次消费与第n次消费的预测消费间隔时间,并输出;
其中,所述根据所述消费间隔时间的预测信息和所述后n-m次历史消费记录,确定与所述客户对应的目标消费预测模型的步骤,具体包括:
根据所述消费间隔时间的预测信息和所述后n-m次历史消费记录,分别生成与所述至少两种消费预测模型各自对应的评分值;
获取评分值最优的消费预测模型;
所述获取与所述消费预测模型对应的评分值采用如下公式计算:
errj=pj-dj(j∈[m,n])
Figure FDA0003601454540000011
其中,n为客户的历史消费次数,m为客户的历史消费次数中的第m次,j为客户的第m+1次至第n次消费中的任意一次,pj是预测的第j+1次与第j次消费间隔天数,dj是实际的第j+1次与第j次消费间隔天数,errj是预测的第j+1次与第j次消费间隔天数与实际的第j+1次与第j次消费间隔天数的误差,sr为对通过各消费预测模型得到的消费间隔时间结果的评分,Me为clip(|errj|,0,Me)函数所取的最大值。
2.如权利要求1所述的消费间隔时间预测方法,其特征在于,所述历史消费记录至少包括消费金额信息、加油量信息和消费时间信息。
3.如权利要求1所述的消费间隔时间预测方法,其特征在于,所述消费预测模型为统计模型、逻辑回归模型和神经网络计算模型的任意组合。
4.如权利要求1所述的消费间隔时间预测方法,其特征在于,所述m与n的比例不低于百分之八十。
5.如权利要求1所述的消费间隔时间预测方法,其特征在于,所述Me的取值为5。
6.一种消费间隔时间预测装置,客户有n次历史消费记录,n次历史消费记录中可包含前m次历史消费记录和后n-m次历史消费记录,其特征在于,所述装置包括:
预测信息获取单元,用于根据所述客户的前m次历史消费记录,获取至少两种消费预测模型对后n-m次消费的消费间隔时间的预测信息;
目标消费预测模型确定单元,用于根据所述消费间隔时间的预测信息和所述后n-m次历史消费记录,确定与所述客户对应的目标消费预测模型;
预测消费间隔时间生成单元,用于利用所述目标消费预测模型生成所述客户第n+1次消费与第n次消费的预测消费间隔时间,并输出;
所述历史消费记录至少包括消费金额信息、加油量信息和消费时间信息;
其中,所述预测消费间隔时间生成单元具体包括:
评分值生成模块,用于根据所述消费间隔时间的预测信息和所述后n-m次历史消费记录,分别生成与所述至少两种消费预测模型各自对应的评分值;
消费预测模型获取模块,用于获取评分值最优的消费预测模型;
所述获取与所述消费预测模型对应的评分值采用如下公式计算:
errj=pj-dj(j∈[m,n])
Figure FDA0003601454540000021
其中,n为客户的历史消费次数,m为客户的历史消费次数中的第m次,j为客户的第m+1次至第n次消费中的任意一次,pj是预测的第j+1次与第j次消费间隔天数,dj是实际的第j+1次与第j次消费间隔天数,errj是预测的第j+1次与第j次消费间隔天数与实际的第j+1次与第j次消费间隔天数的误差,sr为对通过各消费预测模型得到的消费间隔时间结果的评分,Me为clip(|errj|,0,Me)函数所取的最大值。
7.如权利要求6所述的消费间隔时间预测装置,其特征在于,所述消费预测模型为统计模型、逻辑回归模型和神经网络计算模型的任意组合。
8.如权利要求6所述的消费间隔时间预测装置,其特征在于,所述m与n的比例不低于百分之八十。
9.如权利要求6所述的消费间隔时间预测装置,其特征在于,所述Me的取值为5。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任意一项权利要求所述方法的步骤。
CN201810130236.5A 2018-02-08 2018-02-08 一种消费间隔时间预测方法、装置及可读存储介质 Active CN108416619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810130236.5A CN108416619B (zh) 2018-02-08 2018-02-08 一种消费间隔时间预测方法、装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810130236.5A CN108416619B (zh) 2018-02-08 2018-02-08 一种消费间隔时间预测方法、装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN108416619A CN108416619A (zh) 2018-08-17
CN108416619B true CN108416619B (zh) 2022-06-07

Family

ID=63127061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810130236.5A Active CN108416619B (zh) 2018-02-08 2018-02-08 一种消费间隔时间预测方法、装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN108416619B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110874797B (zh) * 2018-08-31 2023-04-18 阿里巴巴集团控股有限公司 资源分配方法和资源分配装置
CN110517037B (zh) * 2019-08-26 2023-01-03 咪咕文化科技有限公司 一种电子储值卡的共享方法、装置、电子设备及存储介质
CN111476626A (zh) * 2020-03-04 2020-07-31 珠海市百岛科技有限公司 智能订水方法及智能水站系统
CN112861064B (zh) * 2021-01-20 2023-02-03 重庆第二师范学院 一种社会信用评价源数据处理方法、系统、终端及介质
CN114519461A (zh) * 2022-02-14 2022-05-20 中国工商银行股份有限公司 交易时间预测方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10325272B2 (en) * 2004-02-20 2019-06-18 Information Resources, Inc. Bias reduction using data fusion of household panel data and transaction data
CN101599090A (zh) * 2008-06-04 2009-12-09 泓广信息有限公司 资料的整合方法
US9462313B1 (en) * 2012-08-31 2016-10-04 Google Inc. Prediction of media selection consumption using analysis of user behavior
CN103473605A (zh) * 2013-08-22 2013-12-25 中国能源建设集团广东省电力设计研究院 能源消费预测方法与系统
US10075510B2 (en) * 2014-03-13 2018-09-11 Google Llc Analytics-based update of digital content
CN105761093A (zh) * 2014-12-17 2016-07-13 华为技术有限公司 一种基于知识空间的行为结果评估方法以及装置

Also Published As

Publication number Publication date
CN108416619A (zh) 2018-08-17

Similar Documents

Publication Publication Date Title
CN108416619B (zh) 一种消费间隔时间预测方法、装置及可读存储介质
CN110400021B (zh) 银行网点现金用量预测方法及装置
CN108399564B (zh) 信用评分方法及装置
US7765123B2 (en) Indicating which of forecasting models at different aggregation levels has a better forecast quality
CN110717671B (zh) 一种确定参与方贡献度的方法及装置
WO2021121354A1 (en) Model-based deep reinforcement learning for dynamic pricing in online ride-hailing platform
CN110363571B (zh) 交易用户的提前感知方法和装置
US11367142B1 (en) Systems and methods for clustering data to forecast risk and other metrics
CN110880127B (zh) 消费水平的预测方法、装置、电子设备及存储介质
CN107958297B (zh) 一种产品需求预测方法及产品需求预测装置
CN113657993A (zh) 信用风险识别方法、装置、设备及存储介质
CN111353828A (zh) 网点到店人数预测方法及装置
CN112150214A (zh) 一种数据预测方法、装置以及计算机可读存储介质
CN117196695B (zh) 一种目标产品的销量数据的预测方法及装置
CN111325255B (zh) 特定人群圈定方法、装置、电子设备及存储介质
CN109670875B (zh) 一种铁路客票浮动定价优化管理方法
CN116611812A (zh) 基于人工智能的车辆配件定损方法、装置、设备及介质
CN116503092A (zh) 用户留资意向识别方法、装置、电子设备及存储介质
CN115797084A (zh) 基于车主驾驶行为的投保定价指导方法及其相关设备
CN115689713A (zh) 异常风险数据处理方法、装置、计算机设备和存储介质
CN113128597B (zh) 一种用户行为特征的提取和分类预测的方法及装置
CN114429367A (zh) 异常检测方法、装置、计算机设备和存储介质
CN113849580A (zh) 一种主体评级预测方法、装置、电子设备及存储介质
CN118195280B (zh) 基于集成嵌套模型的整合式任务调度方法、系统及装置
CN112541514A (zh) 事件发布方法、服务器、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant