CN107665185A - 一种基于短信业务的客户行为分析方法及相关装置 - Google Patents

一种基于短信业务的客户行为分析方法及相关装置 Download PDF

Info

Publication number
CN107665185A
CN107665185A CN201710979227.9A CN201710979227A CN107665185A CN 107665185 A CN107665185 A CN 107665185A CN 201710979227 A CN201710979227 A CN 201710979227A CN 107665185 A CN107665185 A CN 107665185A
Authority
CN
China
Prior art keywords
data
autoregressive
moving average
customer
exponent number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710979227.9A
Other languages
English (en)
Inventor
廖奎林
李伟
张凯
苏涛
夏亮
李川
孙帅
窦凤立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dahan Tricom Data Communication Co Ltd
Original Assignee
Shanghai Dahan Tricom Data Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dahan Tricom Data Communication Co Ltd filed Critical Shanghai Dahan Tricom Data Communication Co Ltd
Priority to CN201710979227.9A priority Critical patent/CN107665185A/zh
Publication of CN107665185A publication Critical patent/CN107665185A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于短信业务的客户行为分析方法、客户行为分析装置、计算机可读存储介质及服务器,该方法包括:将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;将阶数取值的所有取值组合进行贝叶斯信息准则计算,选择最小的信息量对应的取值组合,将取值组合的自回归阶数和滑动平均阶数加入初始ARIMA模型,得到ARIMA模型,根据ARIMA模型计算得到置信区间;根据置信区间分析客户行为数据。可以通过该方法自动计算模型参数,减少算法实现过程中的人工参与的程度,并且可以自行确定自回归阶数以及滑动平均结束,判断最佳的差分次数,省去了需要人工判断计算阶数的步骤,可以更加准确地分析客户行为。

Description

一种基于短信业务的客户行为分析方法及相关装置
技术领域
本申请涉及数据分析领域,特别涉及一种基于短信业务的客户行为分析方法、客户行为分析装置、计算机可读存储介质及服务器。
背景技术
随着短信业务的发展,在日常使用环境中越来越来多的地方都需要短信,尤其在验证机主身份方面基本都通过短信进行验证。同时,也有不法分子通过非法渠道获取个人的手机账号,发送非法诈骗短信,危害社会稳定。因此,防止短信客户发送非法短信是短信业务商需要将解决的重点问题。
一般的会使用时间序列模型对客户的短信发送行为进行分析。但是在模型的获取方面,需要人工参与完成,模型建造速度不高,并且还有可能由于人工的原因出现错误,造成模型使用效果不佳,甚至无法正确判断客户行为等严重问题。
因此,如何建造更好的行为分析模型是本领域技术人员所关注的重点问题。
发明内容
本申请的目的是提供一种基于短信业务的客户行为分析方法、客户行为分析装置、计算机可读存储介质及服务器,可以通过该方法自动计算模型参数,减少算法实现过程中的人工参与的程度,并且可以自行确定自回归阶数以及滑动平均结束,判断最佳的差分次数,省去了需要人工判断计算阶数的步骤,同时提高了模型的准确度,可以更加准确地分析客户行为。
为解决上述技术问题,本申请提供一种基于短信业务的客户行为分析方法,包括:
将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;
将所述自回归阶数范围内的取值和所述滑动平均阶数范围内的取值进行排列组合得到多个取值组合;
将所有所述取值组合进行贝叶斯信息准则计算,得到多个信息量;
在所有所述信息量中选择最小的所述信息量对应的所述取值组合,将所述取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;
将所述代入自回归阶数、所述代入滑动平均阶数及所述差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据所述ARIMA模型计算得到置信区间;
根据所述置信区间分析客户行为数据。
可选的,所述将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数,包括:
获取所述客户的所述历史发送数据:
对所述历史发送数据进行稳定性处理,得到稳定历史数据,并记录所述差分处理次数;
根据自相关系数函数和偏自相关系数函数对所述稳定历史数据执行计算操作,得到所述自回归阶数范围和所述滑动平均阶数范围。
可选的,所述根据所述置信区间分析客户行为数据,包括:
判断所述客户行为数据是否在置信区间内;
若否,则将所述客户行为数据作为异常数据。
本申请还提供一种基于短信业务的客户行为分析装置,包括:
预处理模块,用于将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;
阶数组合模块,用于将所述自回归阶数范围内的取值和所述滑动平均阶数范围内的取值进行排列组合得到多个取值组合;
信息量计算模块,用于将所有所述取值组合进行贝叶斯信息准则计算,得到多个信息量;
阶数获取模块,用于在所有所述信息量中选择最小的所述信息量对应的所述取值组合,将所述取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;
模型计算模块,用于将所述代入自回归阶数、所述代入滑动平均阶数及所述差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据所述ARIMA模型计算得到置信区间;
行为数据分析模块,用于根据所述置信区间分析客户行为数据。
可选的,所述预处理模块包括:
数据获取单元,用于获取所述客户的所述历史发送数据:
稳定性处理单元,用于对所述历史发送数据进行稳定性处理,得到稳定历史数据,并记录所述差分处理次数;
阶数范围获取单元,用于根据自相关系数函数和偏自相关系数函数对所述稳定历史数据执行计算操作,得到所述自回归阶数范围和所述滑动平均阶数范围。
可选的,所述行为数据分析模块包括:
判断单元,用于判断所述客户行为数据是否在置信区间内;
异常数据获取单元,用于将所述客户行为数据作为异常数据。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如下的步骤:
将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;
将所述自回归阶数范围内的取值和所述滑动平均阶数范围内的取值进行排列组合得到多个取值组合;
将所有所述取值组合进行贝叶斯信息准则计算,得到多个信息量;
在所有所述信息量中选择最小的所述信息量对应的所述取值组合,将所述取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;
将所述代入自回归阶数、所述代入滑动平均阶数及所述差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据所述ARIMA模型计算得到置信区间;
根据所述置信区间分析客户行为数据。
本申请还提供一种服务器,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时,实现如下的步骤:
将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;
将所述自回归阶数范围内的取值和所述滑动平均阶数范围内的取值进行排列组合得到多个取值组合;
将所有所述取值组合进行贝叶斯信息准则计算,得到多个信息量;
在所有所述信息量中选择最小的所述信息量对应的所述取值组合,将所述取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;
将所述代入自回归阶数、所述代入滑动平均阶数及所述差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据所述ARIMA模型计算得到置信区间;
根据所述置信区间分析客户行为数据。
本申请所提供的一种基于短信业务的客户行为分析方法,包括:将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;将所述自回归阶数范围内的取值和所述滑动平均阶数范围内的取值进行排列组合得到多个取值组合;将所有所述取值组合进行贝叶斯信息准则计算,得到多个信息量;在所有所述信息量中选择最小的所述信息量对应的所述取值组合,将所述取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;将所述代入自回归阶数、所述代入滑动平均阶数及所述差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据所述ARIMA模型计算得到置信区间;根据所述置信区间分析客户行为数据。
可以通过本方法自动计算模型参数,减少算法实现过程中的人工参与的程度,并且可以自行确定自回归阶数以及滑动平均结束,判断最佳的差分次数,省去了需要人工判断计算阶数的步骤,同时提高了模型的准确度,可以更加准确地分析客户行为。
本申请还提供一种基于短信业务的客户行为分析装置、计算机可读存储介质及服务器,具有上述有益效果,在此不做赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种基于短信业务的客户行为分析方法的流程图;
图2为本申请实施例所提供的一种基于短信业务的客户行为分析方法的预处理的流程图;
图3为本申请实施例所提供的一种基于短信业务的客户行为分析方法的行为分析的流程图;
图4为本申请实施例所提供的一种基于短信业务的客户行为分析装置的结构示意图。
具体实施方式
本申请的核心是提供一种基于短信业务的客户行为分析方法、客户行为分析装置、计算机可读存储介质及服务器,可以通过该方法自动计算模型参数,减少算法实现过程中的人工参与的程度,并且可以自行确定自回归阶数以及滑动平均结束,判断最佳的差分次数,省去了需要人工判断计算阶数的步骤,同时提高了模型的准确度,可以更加准确地分析客户行为。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种基于短信业务的客户行为分析方法的流程图。
本实施例提供一种基于短信业务的客户行为分析方法,可以包括:
S101,将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;
本步骤旨在对历史发送数据进行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数。
其中,预处理是对将要针对ARIMA模型分析的数据进行准备操作。一般的包括对数据进行平稳处理、自相关处理和偏自相关处理。其中,平稳是指围绕着一个常数上下波动且波动范围有限,即有常数均值和常数方差。如果有明显的趋势或周期性,那它通常不是平稳序列。平稳处理就是将步平稳序列通过计算处理得到平稳的序列,一般可以通过差分处理得到平稳序列,并且记录其差分处理的次数,作为ARIMA模型的系数。
其中,ARIMA模型叫做自回归移动平均模型,是统计模型中最常见的一种用来进行时间序列预测的模型。具有模型简单,只需要内生变量而不需要借助其他外生变量的优点。
一般的ARIMA建模步骤:
(1)获取被观测系统时间序列数据;
(2)对数据绘图,观测是否为平稳时间序列;对于非平稳时间序列要先进行d阶差分运算,化为平稳时间序列;
(3)经过第二步处理,已经得到平稳时间序列。要对平稳时间序列分别求得其自相关系数ACF和偏自相关系数PACF,通过对自相关图和偏自相关图的分析,得到最佳的阶层p和阶数q;
(4)由以上得到的n、q、p,得到ARIMA模型。然后开始对得到的模型进行模型检验。
在本步骤中,还需要对于数据进行自相关系数函数和偏自相关系数函数处理,就得到了历史数据的自回归阶数和滑动平均阶数。在计算过程中,可以获取多个阶数数值,但是对于不同的阶数数值其对于模型的影响不尽相同,因此在获取的多个阶数数值上得到阶数取值范围。在后续的步骤中基于阶数数值的范围可以经过计算得到最佳的阶数取值。
S102,将自回归阶数范围内的取值和滑动平均阶数范围内的取值进行排列组合得到多个取值组合;
在步骤S101的基础上,本实施例旨在在上述阶数的范围内进行排列组合得到多个阶数取值的取值组合。
由于ARIMA模型其中需要两个阶数数值作为模型的参数,因此在本步骤需要选取两个阶数的组合作为预选的阶数参数。并且获取的也是两个阶数取值的范围,因此基于此范围的应该通过排列组合的方式得到多个阶数取值的组合。
需要注意的是,在取值组合中自回归阶数与滑动平均阶数不能同时为零。
S103,将所有取值组合进行贝叶斯信息准则计算,得到多个信息量;
在步骤S102的基础上,本步骤旨在,针对多个取值组合计算贝叶斯信息量,得到多个信息量数据。
其中,贝叶斯信息标准是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策,最后再利用期望值和修正概率做出最优决策,是使用的越来越多的信息指标。在计算后得到的信息量可以反映阶数取值组合在模型中的最佳的概率。
当信息量最小时,该取值的组合为最佳的阶数取值。
S104,在所有信息量中选择最小的信息量对应的取值组合,将取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;
在步骤S103的基础上,本步骤旨在,选择信息量最小的取值组合中的阶数作为模型的阶数取值。
一般的,在ARIMA模型中选取阶数都是通过将数据绘制图形,通过观察图形得到模型中需要计算的阶数参数。但是在短信业务中,其数据量巨大通过人工画图来识别,有一定的局限性,并且耗时较强。
因此,通过上述步骤以及本步骤可以在计算机中实现自动化运算,节约了大量人力资源,并且耗时较短,错误率较低。
S105,将代入自回归阶数、代入滑动平均阶数及差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据ARIMA模型计算得到置信区间;
在步骤S104的基础上,本步骤旨在将得到阶数取值和差分处理次数带入到模型中并进行计算得到可以进行行为分析的置信区间。
S106,根据置信区间分析客户行为数据。
在步骤S105的基础上,本步骤主要是根据获得的置信区间对客户的行为进行分析,得到分析结果。
综上,本实施例可以通过该方法自动计算模型参数,减少算法实现过程中的人工参与的程度,并且可以自行确定自回归阶数以及滑动平均结束,判断最佳的差分次数,省去了需要人工判断计算阶数的步骤,同时提高了模型的准确度,可以更加准确地分析客户行为。
请参考图2,图2为本申请实施例所提供的一种基于短信业务的客户行为分析方法的预处理的流程图。
结合上一实施例,本实施例主要是针对上一实施例中如何进行预处理做一个解释,其他部分与上一实施例大体相同,相同部分可以参考上一实施例,在此不做赘述。
本实施例可以包括:
S201,获取客户的历史发送数据:
本步骤旨在,获取客户的历史发送数据。
其中历史发送数据可以根据分析客户行为的角度进行选取,例如,本实施例是根据客户的发送数量对客户的行为进行分析,因此获取的数据就是客户在时间序列中的发送量的数据。当然,如果分析客户行为的角度不同,相适应的也要选取不同维度的数据作为模型的分析数据,具体的在此不做赘述。
需要注意的是,本技术方案选取的模型是在时间序列中进行分析的模型,因此所选取的数据也是与时间相关的序列数据。
S202,对历史发送数据进行稳定性处理,得到稳定历史数据,并记录差分处理次数;
在步骤S201的基础上,本步骤旨在对历史数据进行平稳处理。
其中,一般获取的数据都是非平稳数据,因此一般情况都需要对数据进行处理。此外,也可以通过其他方法对数据进行平稳性的判断。
一般有如下的判断方式:
(1)直接画出时间序列的趋势图,看趋势判断。
(2)画自相关和偏自相关图:如果在平稳的序列的自相关图(Autocorrelation)和偏相关图(Partial Correlation)出现拖尾或者是截尾,就判断该序列为非平稳序列。
(3)单位根检验:检验序列中是否存在单位根,如果存在单位根就是非平稳时间序列。
其中,对于非平稳数据进行平稳处理,可以通过差分转换为平稳序列。在差分处理中n阶差分就是相距n期的两个序列值之间相减。如果一个时间序列经过差分运算后具有平稳性,则该序列为差分平稳序列,可以使用ARIMA模型进行分析。其中,进行了几阶差分就为该差分处理的次数n。
S203,根据自相关系数函数和偏自相关系数函数对稳定历史数据执行计算操作,得到自回归阶数范围和滑动平均阶数范围。
在步骤S202的基础上,本步骤旨在对平稳的历史数据经过回归函数的计算得到阶数的范围。
在本步骤中,可以获得多个阶数,选取最大的阶数和0作为阶数取值的范围,以方便后续的取值组合的计算。
请参考图3,图3为本申请实施例所提供的一种基于短信业务的客户行为分析方法的行为分析的流程图。
结合上一实施例,本实施例主要是针对上一实施例中如何进行行为分析做一个解释,其他部分与上一实施例大体相同,相同部分可以参考上一实施例,在此不做赘述。
本实施例可以包括:
S301,判断客户行为数据是否在置信区间内;
本步骤旨在,判断客户的行为数据是否在置信区间内。
其中,置信区间是数值的范围,本步骤就是判断需要分析的客户行为数据是否在这个范围内,如果在则客户的行为数据没有问题,如果不在则客户的数据出现了异常。
S302,若否,则将客户行为数据作为异常数据。
在步骤S301的基础上,本步骤将不再置信区间范围的数据作为异常数据。本步骤可以讲行为数据标记为异常数据,以供管理人员发现异常数据,同时方便对于数据进行再分析。
本申请实施例提供了一种基于短信业务的客户行为分析方法,可以通过该方法自动计算模型参数,减少算法实现过程中的人工参与的程度,并且可以自行确定自回归阶数以及滑动平均结束,判断最佳的差分次数,省去了需要人工判断计算阶数的步骤,同时提高了模型的准确度,可以更加准确地分析客户行为。
下面对本申请实施例提供的一种基于短信业务的客户行为分析装置进行介绍,下文描述的一种基于短信业务的客户行为分析装置与上文描述的一种基于短信业务的客户行为分析方法可相互对应参照。
请参考图4,图4为本申请实施例所提供的一种基于短信业务的客户行为分析装置的结构示意图。
本实施例可以包括:
预处理模块100,用于将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;
阶数组合模块200,用于将自回归阶数范围内的取值和滑动平均阶数范围内的取值进行排列组合得到多个取值组合;
信息量计算模块300,用于将所有取值组合进行贝叶斯信息准则计算,得到多个信息量;
阶数获取模块400,用于在所有信息量中选择最小的信息量对应的取值组合,将取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;
模型计算模块500,用于将代入自回归阶数、代入滑动平均阶数及差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据ARIMA模型计算得到置信区间;
行为数据分析模块600,用于根据置信区间分析客户行为数据。
预处理模块100,可以包括:
数据获取单元,用于获取客户的历史发送数据:
稳定性处理单元,用于对历史发送数据进行稳定性处理,得到稳定历史数据,并记录差分处理次数;
阶数范围获取单元,用于根据自相关系数函数和偏自相关系数函数对稳定历史数据执行计算操作,得到自回归阶数范围和滑动平均阶数范围。
行为数据分析模块600,可以包括:
判断单元,用于判断客户行为数据是否在置信区间内;
异常数据获取单元,用于将客户行为数据作为异常数据。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现如下的步骤:
将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;
将自回归阶数范围内的取值和滑动平均阶数范围内的取值进行排列组合得到多个取值组合;
将所有取值组合进行贝叶斯信息准则计算,得到多个信息量;
在所有信息量中选择最小的信息量对应的取值组合,将取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;
将代入自回归阶数、代入滑动平均阶数及差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据ARIMA模型计算得到置信区间;
根据置信区间分析客户行为数据。
本申请实施例还提供一种服务器,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时,实现如下的步骤:
将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;
将自回归阶数范围内的取值和滑动平均阶数范围内的取值进行排列组合得到多个取值组合;
将所有取值组合进行贝叶斯信息准则计算,得到多个信息量;
在所有信息量中选择最小的信息量对应的取值组合,将取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;
将代入自回归阶数、代入滑动平均阶数及差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据ARIMA模型计算得到置信区间;
根据置信区间分析客户行为数据。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,功能调用装置,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本申请所提供的一种基于短信业务的客户行为分析方法、客户行为分析装置、计算机可读存储介质及服务器进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (8)

1.一种基于短信业务的客户行为分析方法,其特征在于,包括:
将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;
将所述自回归阶数范围内的取值和所述滑动平均阶数范围内的取值进行排列组合得到多个取值组合;
将所有所述取值组合进行贝叶斯信息准则计算,得到多个信息量;
在所有所述信息量中选择最小的所述信息量对应的所述取值组合,将所述取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;
将所述代入自回归阶数、所述代入滑动平均阶数及所述差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据所述ARIMA模型计算得到置信区间;
根据所述置信区间分析客户行为数据。
2.根据权利要求1所述的客户行为分析方法,其特征在于,所述将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数,包括:
获取所述客户的所述历史发送数据:
对所述历史发送数据进行稳定性处理,得到稳定历史数据,并记录所述差分处理次数;
根据自相关系数函数和偏自相关系数函数对所述稳定历史数据执行计算操作,得到所述自回归阶数范围和所述滑动平均阶数范围。
3.根据权利要求2所述的客户行为分析方法,其特征在于,所述根据所述置信区间分析客户行为数据,包括:
判断所述客户行为数据是否在置信区间内;
若否,则将所述客户行为数据作为异常数据。
4.一种基于短信业务的客户行为分析装置,其特征在于,包括:
预处理模块,用于将客户的历史发送数据执行预处理,得到自回归阶数范围、滑动平均阶数范围及差分处理次数;
阶数组合模块,用于将所述自回归阶数范围内的取值和所述滑动平均阶数范围内的取值进行排列组合得到多个取值组合;
信息量计算模块,用于将所有所述取值组合进行贝叶斯信息准则计算,得到多个信息量;
阶数获取模块,用于在所有所述信息量中选择最小的所述信息量对应的所述取值组合,将所述取值组合的自回归阶数和滑动平均阶数作为模型的代入自回归阶数和代入滑动平均阶数;
模型计算模块,用于将所述代入自回归阶数、所述代入滑动平均阶数及所述差分处理次数加入初始ARIMA模型,得到ARIMA模型,根据所述ARIMA模型计算得到置信区间;
行为数据分析模块,用于根据所述置信区间分析客户行为数据。
5.根据权利要求4所述的客户行为分析装置,其特征在于,所述预处理模块包括:
数据获取单元,用于获取所述客户的所述历史发送数据:
稳定性处理单元,用于对所述历史发送数据进行稳定性处理,得到稳定历史数据,并记录所述差分处理次数;
阶数范围获取单元,用于根据自相关系数函数和偏自相关系数函数对所述稳定历史数据执行计算操作,得到所述自回归阶数范围和所述滑动平均阶数范围。
6.根据权利要求5所述的客户行为分析装置,其特征在于,所述行为数据分析模块包括:
判断单元,用于判断所述客户行为数据是否在置信区间内;
异常数据获取单元,用于将所述客户行为数据作为异常数据。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的客户行为分析方法的步骤。
8.一种服务器,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至3任一项所述的客户行为分析方法的步骤。
CN201710979227.9A 2017-10-19 2017-10-19 一种基于短信业务的客户行为分析方法及相关装置 Pending CN107665185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710979227.9A CN107665185A (zh) 2017-10-19 2017-10-19 一种基于短信业务的客户行为分析方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710979227.9A CN107665185A (zh) 2017-10-19 2017-10-19 一种基于短信业务的客户行为分析方法及相关装置

Publications (1)

Publication Number Publication Date
CN107665185A true CN107665185A (zh) 2018-02-06

Family

ID=61098535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710979227.9A Pending CN107665185A (zh) 2017-10-19 2017-10-19 一种基于短信业务的客户行为分析方法及相关装置

Country Status (1)

Country Link
CN (1) CN107665185A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110276491A (zh) * 2019-06-24 2019-09-24 重庆锐云科技有限公司 粉丝预测管理方法、装置、计算机设备及存储介质
CN111224830A (zh) * 2018-11-23 2020-06-02 中国电信股份有限公司 数据监控方法、装置、物联网网元及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101482944A (zh) * 2000-11-09 2009-07-15 Spss公司 构建时间序列模型的系统与方法
CN105844346A (zh) * 2016-03-17 2016-08-10 福州大学 基于arima模型的航班延误预测方法
CN106991577A (zh) * 2016-01-21 2017-07-28 中国移动通信集团湖南有限公司 一种确定目标用户的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101482944A (zh) * 2000-11-09 2009-07-15 Spss公司 构建时间序列模型的系统与方法
CN106991577A (zh) * 2016-01-21 2017-07-28 中国移动通信集团湖南有限公司 一种确定目标用户的方法及装置
CN105844346A (zh) * 2016-03-17 2016-08-10 福州大学 基于arima模型的航班延误预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董海鹰 等: "基于自回归求和滑动平均模型的风力发电机轴承寿命预测", 《系统仿真技术》, vol. 13, no. 3, pages 185 - 189 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111224830A (zh) * 2018-11-23 2020-06-02 中国电信股份有限公司 数据监控方法、装置、物联网网元及计算机可读存储介质
CN110276491A (zh) * 2019-06-24 2019-09-24 重庆锐云科技有限公司 粉丝预测管理方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN106294120B (zh) 测试代码的方法、设备和计算机程序产品
CN111327655A (zh) 多租户容器资源配额预测方法、装置及电子设备
US20190246299A1 (en) Method and test system for mobile network testing as well as a network testing system
CN112632179A (zh) 模型构建方法、装置、存储介质及设备
CN107665185A (zh) 一种基于短信业务的客户行为分析方法及相关装置
CN114239952B (zh) 一种关键性能指标的异常检测方法、装置、设备及介质
Wang et al. Identifying key classes of object-oriented software based on software complex network
CN111488947A (zh) 电力系统设备的故障检测方法与装置
CN113110961B (zh) 设备异常检测方法、装置、计算机设备及可读存储介质
CN109743200B (zh) 基于资源特征的云计算平台计算任务成本预测方法及系统
CN111241571B (zh) 一种数据共享方法及模型系统、存储介质
CN113238908B (zh) 一种服务器性能测试数据分析方法及相关装置
CN110411721A (zh) 一种海洋立管损伤定位方法及系统
CN110988673A (zh) 电机转子故障检测方法、装置及终端设备
CN112346995B (zh) 一种基于银行业的测试风险预估模型的构建方法及装置
CN106919755A (zh) 一种基于数据的云制造系统不确定性量化分析方法及装置
CN116415385A (zh) 风机联调仿真方法、装置、服务器及计算机存储介质
CN113610225A (zh) 质量评估模型训练方法、装置、电子设备及存储介质
CN106971306A (zh) 产品问题的识别方法及系统
CN113742216B (zh) 一种检测机器学习引擎的效率的方法、装置和存储介质
CN115080445B (zh) 一种游戏测试管理方法及其系统
CN112685324B (zh) 一种生成测试方案的方法及系统
CN114595137B (zh) 一种测试用例获取方法和装置
CN116187148A (zh) 设备寿命预测及模型训练方法、装置和电子设备
CN116795512A (zh) 时长调整方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination