CN114298547A - 用户忠诚度的评分方法、装置、设备及可读存储介质 - Google Patents
用户忠诚度的评分方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN114298547A CN114298547A CN202111629627.XA CN202111629627A CN114298547A CN 114298547 A CN114298547 A CN 114298547A CN 202111629627 A CN202111629627 A CN 202111629627A CN 114298547 A CN114298547 A CN 114298547A
- Authority
- CN
- China
- Prior art keywords
- user
- loyalty
- sample data
- scoring
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013077 scoring method Methods 0.000 title claims abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 98
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000000556 factor analysis Methods 0.000 claims abstract description 20
- 238000013519 translation Methods 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 17
- 230000005484 gravity Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000009795 derivation Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 40
- 238000012546 transfer Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000000540 analysis of variance Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供了一种用户忠诚度的评分方法、装置、电子设备及可读存储介质,涉及数据处理领域。该方法包括:获取多个样本数据;对多个样本数据中的各参数进行预设处理,得到用于评价用户忠诚度的指标;针对每个样本数据,采用熵值法确定样本数据中的各指标在多个样本数据中所占比重;针对每个用户,基于用户对应的样本数据的各指标的比重和权重,确定用户的第一忠诚度评分;采用因子分析法,确定各多个样本数据中的各指标之间的相关关系,确定各评分因子以及各样本数据对应的各评分因子分值;针对每个用户,基于用户对应的各评分因子的分值,确定用户的第二忠诚度评分,并基于用户的第一忠诚度评分和第二忠诚度评分,确定用户的目标评分。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,本申请涉及一种用户忠诚度的评分方法、装置、电子设备及可读存储介质。
背景技术
忠诚用户不但可以为企业创造价值,还可以为企业带来很多潜在的收益,比如品牌的推广、带动其他客户的购买和成长等。所以,需要分析评定用户的忠诚度,进而做相应的营销策略。以提高客户的满意度和扩大客户群为目标,帮助企业实现营销和利润的不断增长。
目前的用户忠诚度的评分方案中,所使用的评分算法单一,导致评分结果准确度低。
发明内容
本申请实施例提供了一种用户忠诚度的评分方法、装置、电子设备及可读存储介质,可以解决用户忠诚度评分准确度低的问题。所述技术方案如下:
根据本申请实施例的一个方面,提供了一种用户忠诚度的评分方法,该方法包括:
获取多个样本数据,每个样本数据对应一个用户,每个样本数据包括多个参数;
对所述多个样本数据中的各参数进行预设处理,得到用于评价用户忠诚度的指标;其中,预设处理包括:参数筛选和参数衍生;
针对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重;
针对每个用户,基于所述用户对应的样本数据的各指标的比重以及各所述指标的权重,确定用户的第一忠诚度评分;
采用因子分析法,确定所述多个样本数据中的各指标之间的相关关系,确定各评分因子以及各所述样本数据对应的各所述评分因子分值;
针对每个用户,基于所述用户对应的各所述评分因子的分值,确定所述用户的第二忠诚度评分;
针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分。
在一个可能的实现方式中,在采用因子分析法,确定所述多个样本数据中的各指标之间的相关关系,确定各评分因子以及各所述样本数据对应的各所述评分因子分值的步骤之前,所述方法还包括:
对所述多个样本数据进行标准化处理,得到数据集;
对所述数据集中为负的数据进行平移处理,得到非负数据,其中,平移处理时的平移量为预设值与所述数据集中最小数据的绝对值之和。
在另一个可能的实现方式中,在所述针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分的步骤之前,所述方法还包括:
对所述多个样本数据对应的全部用户的第一忠诚度评分和第二忠诚度评分进行一致性校验;
在所述一致性校验通过的情况下,执行所述针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分的步骤。
在又一个可能的实现方式中,所述对所述多个样本数据对应的全部用户的第一忠诚度评分和第二忠诚度评分进行一致性校验的步骤,包括:
基于全部用户的第一忠诚度评分和第二忠诚度评分,计算组内相关系数ICC;
若所述组内相关系数ICC位于预设范围内,确定全部用户的第一忠诚度评分和第二忠诚度评分通过一致性校验。
在又一个可能的实现方式中,所述针对每个用户,基于所述用户对应的各所述评分因子的分值,确定所述用户的第二忠诚度评分的步骤,包括:
针对每个用户,将所述用户对应的各评分因子的方差贡献率作为各评分因子的权重;
将各所述评分因子的分值进行加权计算,得到所述用户的第二忠诚度评分。
在又一个可能的实现方式中,在针对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重的步骤之前,还包括:
根据业务经验确定每个样本数据对应的多个指标的标注信息,以确定正向指标和负向指标,其中,所述正向指标对用户的忠诚度评分的影响为正向,所述负向指标对用户的忠诚度评分的影响为负向;
将每个用户对应的样本数据和多个指标的标注信息进行绑定,得到相应用户的特征数据;
针对每个用户的特征数据进行预处理,所述预处理包括:对正向指标和负向指标采用不同的归一化方法进行处理;
所述对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重的步骤,包括:
针对每个用户的特征数据,采用熵值法确定所述特征数据中的各指标在全部用户的特征数据中所占比重。
根据本申请实施例的另一个方面,提供了一种用户忠诚度的评分装置,该装置包括:
获取模块,用于获取多个样本数据,每个样本数据对应一个用户
,每个样本数据包括多个参数;
预处理模块,用于对所述多个样本数据中的各参数进行预设处理,得到用于评价用户忠诚度的指标;其中,预设处理包括:参数筛选和参数衍生;
确定模块,用于针对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重;还用于针对每个用户,基于所述用户对应的样本数据的各指标的比重以及各所述指标的权重,确定用户的第一忠诚度评分;还用于采用因子分析法,确定所述多个样本数据中的各指标之间的相关关系,确定各评分因子以及各所述样本数据对应的各所述评分因子分值;还用于针对每个用户,基于所述用户对应的各所述评分因子的分值,确定所述用户的第二忠诚度评分;针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分。
在一个可能的实现方式中,所述预处理模块,还用于:
对所述多个样本数据进行标准化处理,得到数据集;
对所述数据集中为负的数据进行平移处理,得到非负数据,其中,平移处理时的平移量为预设值与所述数据集中最小数据的绝对值之和。
根据本申请实施例的另一个方面,提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上的计算机程序处理器执行计算机程序以实现上述的用户忠诚度的评分方法的步骤。
根据本申请实施例的再一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的用户忠诚度的评分方法的步骤。
本申请实施例提供的技术方案带来的有益效果是:
本申请实施例中,通过分别使用因子分析法和熵值法进行用户忠诚度评分,并基于两个评分得到用户的忠诚度得分,从而解决了用户忠诚度评分准确度低的问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种用户忠诚度的评分方法的流程示意图;
图2为本申请实施例提供的一种用户忠诚度的评分装置的结构示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”可以实现为“A”,或者实现为“B”,或者实现为“A和B”。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
目前的用户忠诚度评分的方法,主要有主观赋权法和客观赋权法。其中,主观赋权法包括层次分析法、专家调查法等,客观赋权法包括主成分分析、因子分析、熵值法等。由于,现有的大部分的评分方案中只是使用单一方法来进行评分,可能会存在偏颇,导致评分不准确。
在信息论中,熵是针对不确定性的一种度量。可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响越大。熵值法就是利用指标的信息熵来确定各指标的权系数的一种方法。但是,熵值法是通过单个指标的离散程度确定权重的模型,缺乏各指标之间的横向比较。
因子分析法是根据相关性大小把原始变量进行分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低,对各指标之间错综复杂关系的变量降维为几个少数的综合因子,再利用各个因子的贡献度作为权重,计算各个样本的得分。
而在将两个模型聚合的时候,要考虑这两个模型的数据是否适合聚合(有没有较高的组内一致性),组内相关系数ICC的基本作用就是看个体的数据是不是可以正当地聚合成更高阶的数据,在更高阶进行分析。
在使用熵值法对用户进行评分时,发现结果存在较大的偏差,考虑到熵值法是从指标纵向的离散程度确定权重的,缺乏各个指标之间的横向比较,所以在熵值法的基础上增加因子分析法,因子分析法是利用指标之间的相关性计算因子得分的,解决了熵值法存在的缺陷。
基于上述发现,本申请提供了一种用户忠诚度的评分方法,通过分别使用改进因子分析法和熵值法进行用户忠诚度评分,再利用ICC组内相关系数检验两个评分结果是否具有一致性,最后聚合两个评分结果,得到用户的忠诚度得分,从而可以解决用户忠诚度评分准确度低的问题。
另外,通过对比不同算法的评分结果以及客户的流失情况,发现使用改进因子分析法和熵值法聚合的评分结果更加客观公正,因此,本申请提供的方案适应性更强。
下面通过对几个示例性实施方式的描述,对本申请实施例的技术方案以及本申请的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
本申请实施例中提供了一种用户忠诚度的评分方法,该方法可以应用于各类需要评价用户忠诚度的场景,例如:银行、电商平台、运营商等等,如图1所示,该方法包括:
S101、获取多个样本数据,所述多个样本数据中的每个样本数据对应一个用户,每个样本数据包括多个参数。
具体的,在该实施例中,每个样本数据包括:用户的基础数据、用户行为数据和业务数据。
若用户为银行储户,则基础数据可以包括:开户时长、年龄、性别、用户级别(金卡用户、银卡用户、贵宾卡等);用户行为数据可以包括:消费(刷卡、支付等),转账(转出、转入等);业务数据可以包括:办理了哪些业务产品(理财、定存等),每个业务产品办理了多少个等。
若用户为移动/电信用户,则基础数据可以包括:网龄、年龄、性别、用户级别(5星级用户、3星级用户、2星级用户等);用户行为数据可以包括:充话费、充流量等;业务数据可以包括:办理了哪些业务产品(流量包、日包、月包、半年包、年包等),每个业务产品办理了多少个等。
S102、对所述多个样本数据中的各参数进行预设处理,得到用于评价用户忠诚度的指标;其中,预设处理包括:参数筛选和参数衍生。
具体的,在该实施例中,用于评价用户忠诚度的指标可以包括从样本数据中直接筛选的用于评价用户忠诚度的多个第一指标和基于该多个第一指标衍生的至少一个第二指标(环比、同比、均值等)。其中,若用户为银行储户,第一指标可以包括:存款、贷款、理财、交易额等。
S103、针对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重。
S104、针对每个用户,基于所述用户对应的样本数据的各指标的比重以及各所述指标的权重,确定用户的第一忠诚度评分。
具体的,在该实施例中,假设有N个用户,M个指标,下面以第i个用户的第j个指标为例,描述采用熵值法计算第i个用户的第一忠诚度评分的过程。
首先,计算第i个用户的第j个指标的值x占所有用户的第j个指标的值的比重Pij,具体的,可以通过以下公式(1)计算:
Pij=Xij/sum(Xij) (1)
其中,sum(Xij)为所有用户的第j个指标的值,其中,求和时,i的取值从1到N。
应当理解的是,当i取1到N中的某一个值,而j分别取1到M时,可以计算得到第i个用户的M个指标的比重;当i分别取1到N,且j分别取1到M时,可以计算得到N个用户中每个用户的M个指标的比重。
其次,基于比重Pij计算第j个指标的权重Wj,具体的,可以通过以下公式(2)-(4)计算:
ej=-1/ln(M)*sum(Pij*ln(Pij)) (2)
dj=1-ej (3)
Wj=dj/sum(dj) (4)
其中,ej为第j个指标的熵值,用户量取M,ln(Pij)为比重Pij的对数,dj为第j个指标的信息熵冗余度。信息熵冗余度是指信息的重复度,信息熵冗余度直接影响权重的大小,信息熵冗余度越大,对评价的重要性就越大,权重也就越大。
当i取1到N中的某一个值,而j分别取1到M时,可以计算得到第i个用户的M个指标的熵值,进而得到M个指标的信息熵冗余度,以及权重。
最后,基于第i个用户的所有指标的比重和权重,计算第i个用户的第一忠诚度评分fi,具体的,可以通过以下公式(5)计算:
fi=sum(Wj*Pij) (5)
当i取1到N中的某一个值,而j分别取1到M时,可以计算第i个用户的每个指标的权重和比重之积,再计算M个指标的权重和比重之积的和,得到第i个用户的第一忠诚度评分fi。
应当理解的是,当i取1到N中的每一个值时,即可以采用上述公式(1)-(5),计算得到N各用户中每个用户的第一忠诚度评分fi。
S105、采用因子分析法,确定所述多个样本数据中的各指标之间的相关关系,确定各评分因子以及各所述样本数据对应的各所述评分因子分值。
具体的,在该实施例中,可以计算样本数据中的各指标的相关系数矩阵,计算因子载荷矩阵、选择用于评分的公共因子、进行因子旋转,计算单个公共因子得分,即可得到各评分因子分值。
S106、针对每个用户,基于所述用户对应的各所述评分因子的分值,确定所述用户的第二忠诚度评分。
具体的,在该实施例中,可以利用各个公共因子的方差贡献率作为权重,对公共因子得分进行加权,计算得到各个样本数据对应的综合因子得分,即为各个用户的第二忠诚度评分。
S107、针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分。
也就是说,在本申请实施例中,通过分别使用因子分析法和熵值法进行用户忠诚度评分,并基于两个评分得到用户的忠诚度得分,从而解决了用户忠诚度评分准确度低的问题。
本申请实施例中还提供了一种可能的实现方式,步骤S106具体可以包括:
S1061、针对每个用户,将所述用户对应的各评分因子的方差贡献率作为各评分因子的权重。
S1062、将各所述评分因子的分值进行加权计算,得到所述用户的第二忠诚度评分。
具体的,在该实施例中,假设第i个用户有K个评分因子,则可以将K个评分因子的方差贡献率作为K个评分因子的权重。若第q个评分因子的方差贡献率为第q个评分因子的权重Wq,q的取值为1到K,则第i个用户的第二忠诚度评分Fi=sum(Wq*Vq),其中,Vq为第q个评分因子的分值。
本申请实施例中还提供了一种可能的实现方式,在步骤S103之前,还可以包括:
S10、根据业务经验确定每个样本数据对应的多个指标的标注信息,以确定正向指标和负向指标,其中,所述正向指标对用户的忠诚度评分的影响为正向,所述负向指标对用户的忠诚度评分的影响为负向。
例如:若用户为银行储户,多个指标包括:存款、转账、贷款、理财、消费,则根据业务经验确定:存款,转账(转入)、理财(购入)、贷款(无逾期)的标注信息为正向;转账(转出)、理财(卖出)、贷款(有逾期)的标注信息为负向。若用户为移动/电信用户,多个指标包括:流量、话费,则根据业务经验确定:流量、话费(充足)的标注信息为正向,话费(欠费)的标注信息为负向。
S11、将每个用户对应的样本数据和多个指标的标注信息进行绑定,得到相应用户的特征数据。
具体的,可以将每个用户对应的样本数据和多个指标的标注信息进行绑定关联,生成宽表,方便后续采用熵值法计算各个用户评分时获取相应的特征数据。
S13、针对每个用户的特征数据进行预处理,所述预处理包括:对正向指标和负向指标采用不同的归一化方法进行处理。
在该实施例中,由于各个指标的量纲、数量级以及指标的正负取向存在差异,为了消除因量纲不同对评分的影响,需要对各个指标进行标准化处理,从而解决各项不同质指标值的同质化问题,同时对负向标注的指标进行非负化处理,即正向指标数值越高越好,负向指标数值越低越好。
具体的,针对每个用户的特征数据进行预处理,包括:异常值、缺失值、量纲、数量级以及指标的正负向等,进行归一化处理。其中,针对数据中的异常值可以剔除,也可以纠正为正常值,针对缺失值可以填补;针对正向指标的值可以采用以下公式(6)进行归一化,针对负向指标的值可以采用以下公式(7)进行归一化。具体的,
X′1=(x1-Xmin)/(Xmax-Xmin) (6)
其中,x1为第i个用户的第j个指标为正向指标时的指标值,X′1为归一化后的指标值。Xmax为所有用户的第j个指标中的最大值,Xmin为所有用户的第j个指标中的最小值。
X′2=(Xmax-x2)/(Xmax-Xmin) (7)
其中,x2为第i个用户的第j个指标为负向指标时的指标值,X′2为归一化后的指标值。
则步骤S103具体包括:针对每个用户的特征数据,采用熵值法确定所述特征数据中的各指标在全部用户的特征数据中所占比重。
本申请实施例中还提供了一种可能的实现方式,在S105之前,方法还包括:
S14、对所述多个样本数据进行标准化处理,得到数据集。
具体的,在该实施例中,可以采用z_score标准化(零-均值规范化,也称标准差标准化)对多个样本数据进行处理。经过处理的数据的均值为0,标准差为1,具体的转化公式为:其中,为原始数据的均值,υ为原始数据的标准差。
S15、对所述数据集中为负的数据进行平移处理,得到非负数据,其中,平移处理时的平移量为预设值与所述数据集中最小数据的绝对值之和。
具体的,在该实施例中,预设值用于确保数据集中最小数据经平移处理后未非负值,可以取0.01、0.001等等。具体的转化公式为:x=x_z+a,其中,x-z为标准化处理后的数据集中的任一负数据,x为对x-z平移后的非负数据,a为平移量,且a=|min(x_z)|+0.01,min(x_z)为标准化处理后的数据集中的最小数据。
具体的,在该实施例中,S105具体可以包括:计算标准化后的样本数据中的各指标的相关系数矩阵,计算因子载荷矩阵、选择用于评分的公共因子、进行因子旋转,计算单个公共因子得分,即可得到各评分因子分值。S105具体可以包括:利用各个公共因子的方差贡献率作为权重,对公共因子得分进行加权,计算各个样本的综合因子得分,即各个用户的第二忠诚度评分。
需要说明的是,在该实施例中,针对标准化处理后的数据集中为负的数据进行非负处理,可以增加样本量,使得采用因子分析法得到的评分结果更加准确。
应当理解的是,采用因子分析法计算第二忠诚度评分的过程中未详细描述的步骤,可以采用现有相关技术实现,为了描述简洁,在此不再赘述。
本申请实施例中还提供了一种可能的实现方式,在步骤S107之前,方法还包括:
S16、对所述多个样本数据对应的全部用户的第一忠诚度评分和第二忠诚度评分进行一致性校验,在所述一致性校验通过的情况下,执行步骤S107。
具体的,在该实施例中,步骤S16具体可以包括:
S1、基于全部用户的第一忠诚度评分和第二忠诚度评分计算组内相关系数ICC。
在该实施例中,可以采用现有相关技术计算ICC,例如,可以采用方差分析法,具体的,可以通过spss软件中的方差分析(anova)来计算。
S2、若全部用户的第一忠诚度评分和第二忠诚度评分的组内相关系数ICC位于预设范围内,确定所有用户的第一忠诚度评分和第二忠诚度评分通过一致性校验。
具体的,在该实施例中,若所述多个样本数据对应的所有用户的第一忠诚度评分和第二忠诚度评分通过一致性校验,可以将每个用户的第一忠诚度评分和第二忠诚度评分的均值作为评价用户忠诚度的最终得分,即每个用户的目标评分。
其中,预设范围为0.5至1之间的范围。ICC等于个体的变异度除以总的变异度,故其值介于0~1之间,其中,0表示不可信,1表示完全可信。一般认为低于0.4表示信度较差,大于0.75表示信度良好。
也就是说,在该实施例中,假设有1000个样本数据,即1000个用户的数据,则采用熵值法得到对应的1000个第一忠诚度评分,采用因子分析法得到对应的1000个第二忠诚度评分,再基于1000个第一忠诚度评分和1000个第二忠诚度评分计算ICC,若ICC大于0.5,则确定通过一致性校验,然后,针对每个用户,将其第一忠诚度评分和第二忠诚度评分进行聚合(例如:求均值),得到对应用户的最终评分。
组内相关系数ICC通常用于评价不同测定方法或评定者对统一定量测量结果的一致性或可靠性,在采用多个算法进行评分后,需要考虑不同评分方法对同一样本的评分结果是否加性相关。因此,本发明通过检验熵值法和因子分析对各个样本的评分结果的ICC值,可以判断两个算法是否可以聚合成更高阶的数据,再进行分析,比如求均值。
因此,在本申请实施例中,通过分别使用因子分析法和熵值法进行用户忠诚度评分,并在两个评分结果具有一致性的情况下,聚合两个评分结果,得到用户的忠诚度得分,从而使得到的用户忠诚度评分的准确度更高。
本申请实施例提供了一种用户忠诚度的评分装置,如图2所示,该用户忠诚度的评分装置可以包括:获取模块201、预处理模块202和确定模块203,其中:
获取模块201,用于获取多个样本数据,所述多个样本数据中的每个样本数据对应一个用户,每个样本数据包括多个参数;
预处理模块202,用于对所述多个样本数据中的各参数进行预设处理,得到用于评价用户忠诚度的指标;其中,预设处理包括:参数筛选和参数衍生;
确定模块203,用于针对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重;还用于针对每个用户,基于所述用户对应的样本数据的各指标的比重以及各所述指标的权重,确定用户的第一忠诚度评分;还用于采用因子分析法,确定所述多个样本数据中的各指标之间的相关关系,确定各评分因子以及各所述样本数据对应的各所述评分因子分值;还用于针对每个用户,基于所述用户对应的各所述评分因子的分值,确定所述用户的第二忠诚度评分;针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分。
本申请实施例提供的用户忠诚度的评分装置,具体执行上述方法实施例流程,具体请详见上述用户忠诚度的评分方法实施例的内容,在此不再赘述。本申请实施例提供的用户忠诚度的评分装置,通过分别使用因子分析法和熵值法进行用户忠诚度评分,并基于两个评分得到用户的忠诚度得分,从而解决了用户忠诚度评分准确度低的问题。
在一个可能的实现方式中,上述确定模块203在针对每个用户,基于所述用户对应的各所述评分因子的分值,确定所述用户的第二忠诚度评分时,具体用于:
针对每个用户,将所述用户对应的各评分因子的方差贡献率作为各评分因子的权重;
将各所述评分因子的分值进行加权计算,得到所述用户的第二忠诚度评分。
在另一个可能的实现方式中,上述确定模块203还用于:
根据业务经验确定每个样本数据对应的多个指标的标注信息,以确定正向指标和负向指标,其中,所述正向指标对用户的忠诚度评分的影响为正向,所述负向指标对用户的忠诚度评分的影响为负向;
将每个用户对应的样本数据和多个指标的标注信息进行绑定,得到相应用户的特征数据。
上述预处理模块202还用于:针对每个用户的特征数据进行预处理,所述预处理包括:对正向指标和负向指标采用不同的归一化方法进行处理。
上述确定模块203在对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重时,具体用于:
针对每个用户的特征数据,采用熵值法确定所述特征数据中的各指标在全部用户的特征数据中所占比重。
在又一个可能的实现方式中,上述预处理模块202还用于:对所述多个样本数据进行标准化处理,得到数据集;对所述数据集中为负的数据进行平移处理,得到非负数据,其中,平移处理时的平移量为预设值与所述数据集中最小数据的绝对值之和。
在又一个可能的实现方式中,上述确定模块203还用于:
对所述多个样本数据对应的全部用户的第一忠诚度评分和第二忠诚度评分进行一致性校验;
在所述一致性校验通过的情况下,针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分。
在又一个可能的实现方式中,上述确定模块203在对所述多个样本数据对应的全部用户的第一忠诚度评分和第二忠诚度评分进行一致性校验时,具体用于:
基于全部用户的第一忠诚度评分和第二忠诚度评分计算组内相关系数ICC;
若所述组内相关系数ICC位于预设范围内,确定全部用户的第一忠诚度评分和第二忠诚度评分通过一致性校验。
本申请实施例中提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,该处理器执行上述计算机程序以实现用户忠诚度的评分方法的步骤,与相关技术相比可实现:本申请实施例中通过分别使用因子分析法和熵值法进行用户忠诚度评分,并基于两个评分得到用户的忠诚度得分,从而解决了用户忠诚度评分准确度低的问题。
在一个可选实施例中提供了一种电子设备,如图3所示,图3所示的电子设备300包括:处理器301和存储器303。其中,处理器301和存储器303相连,如通过总线302相连。可选地,电子设备300还可以包括收发器304,收发器304可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器304不限于一个,该电子设备300的结构并不构成对本申请实施例的限定。
处理器301可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器301也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线302可包括一通路,在上述组件之间传送信息。总线302可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线302可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器303可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质,在此不做限定。
存储器303用于存储执行本申请实施例的计算机程序,并由处理器301来控制执行。处理器301用于执行存储器303中存储的计算机程序,以实现前述方法实施例所示的步骤。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”、“1”、“2”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除图示或文字描述以外的顺序实施。
应该理解的是,虽然本申请实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本申请实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本申请实施例对此不限制。
以上所述仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用基于本申请技术思想的其他类似实施手段,同样属于本申请实施例的保护范畴。
Claims (10)
1.一种用户忠诚度的评分方法,其特征在于,所述方法包括:
获取多个样本数据,每个样本数据对应一个用户,每个样本数据包括多个参数;
对所述多个样本数据中的各参数进行预设处理,得到用于评价用户忠诚度的指标;其中,预设处理包括:参数筛选和参数衍生;
针对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重;
针对每个用户,基于所述用户对应的样本数据的各指标的比重以及各所述指标的权重,确定用户的第一忠诚度评分;
采用因子分析法,确定所述多个样本数据中的各指标之间的相关关系,确定各评分因子以及各所述样本数据对应的各所述评分因子分值;
针对每个用户,基于所述用户对应的各所述评分因子的分值,确定所述用户的第二忠诚度评分;
针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分。
2.根据权利要求1所述的用户忠诚度的评分方法,其特征在于,在采用因子分析法,确定所述多个样本数据中的各指标之间的相关关系,确定各评分因子以及各所述样本数据对应的各所述评分因子分值的步骤之前,所述方法还包括:
对所述多个样本数据进行标准化处理,得到数据集;
对所述数据集中为负的数据进行平移处理,得到非负数据,其中,平移处理时的平移量为预设值与所述数据集中最小数据的绝对值之和。
3.根据权利要求1所述的用户忠诚度的评分方法,其特征在于,在所述针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分的步骤之前,所述方法还包括:
对所述多个样本数据对应的全部用户的第一忠诚度评分和第二忠诚度评分进行一致性校验;
在所述一致性校验通过的情况下,执行所述针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分的步骤。
4.根据权利要求3所述的用户忠诚度的评分方法,其特征在于,所述对所述多个样本数据对应的全部用户的第一忠诚度评分和第二忠诚度评分进行一致性校验的步骤,包括:
基于全部用户的第一忠诚度评分和第二忠诚度评分,计算组内相关系数ICC;
若所述组内相关系数ICC位于预设范围内,确定全部用户的第一忠诚度评分和第二忠诚度评分通过一致性校验。
5.根据权利要求1所述的用户忠诚度的评分方法,其特征在于,所述针对每个用户,基于所述用户对应的各所述评分因子的分值,确定所述用户的第二忠诚度评分的步骤,包括:
针对每个用户,将所述用户对应的各评分因子的方差贡献率作为各评分因子的权重;
将各所述评分因子的分值进行加权计算,得到所述用户的第二忠诚度评分。
6.根据权利要求1所述的用户忠诚度的评分方法,其特征在于,在针对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重的步骤之前,还包括:
根据业务经验确定每个样本数据对应的多个指标的标注信息,以确定正向指标和负向指标,其中,所述正向指标对用户的忠诚度评分的影响为正向,所述负向指标对用户的忠诚度评分的影响为负向;
将每个用户对应的样本数据和多个指标的标注信息进行绑定,得到相应用户的特征数据;
针对每个用户的特征数据进行预处理,所述预处理包括:对正向指标和负向指标采用不同的归一化方法进行处理;
所述对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重的步骤,包括:
针对每个用户的特征数据,采用熵值法确定所述特征数据中的各指标在全部用户的特征数据中所占比重。
7.一种用户忠诚度的评分装置,其特征在于,所述装置包括:
获取模块,用于获取多个样本数据,每个样本数据对应一个用户,每个样本数据包括多个参数;
预处理模块,用于对所述多个样本数据中的各参数进行预设处理,得到用于评价用户忠诚度的指标;其中,预设处理包括:参数筛选和参数衍生;
确定模块,用于针对每个样本数据,采用熵值法确定所述样本数据中的各指标在所述多个样本数据中所占比重;还用于针对每个用户,基于所述用户对应的样本数据的各指标的比重以及各所述指标的权重,确定用户的第一忠诚度评分;还用于采用因子分析法,确定所述多个样本数据中的各指标之间的相关关系,确定各评分因子以及各所述样本数据对应的各所述评分因子分值;还用于针对每个用户,基于所述用户对应的各所述评分因子的分值,确定所述用户的第二忠诚度评分;针对每个用户,基于所述用户的第一忠诚度评分和第二忠诚度评分,确定所述用户的目标评分。
8.根据权利要求7所述的用户忠诚度的评分装置,其特征在于,所述预处理模块,还用于:
对所述多个样本数据进行标准化处理,得到数据集;
对所述数据集中为负的数据进行平移处理,得到非负数据,其中,平移处理时的平移量为预设值与所述数据集中最小数据的绝对值之和。
9.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-6任一项所述的用户忠诚度的评分方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的用户忠诚度的评分方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111629627.XA CN114298547A (zh) | 2021-12-28 | 2021-12-28 | 用户忠诚度的评分方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111629627.XA CN114298547A (zh) | 2021-12-28 | 2021-12-28 | 用户忠诚度的评分方法、装置、设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114298547A true CN114298547A (zh) | 2022-04-08 |
Family
ID=80971516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111629627.XA Pending CN114298547A (zh) | 2021-12-28 | 2021-12-28 | 用户忠诚度的评分方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114298547A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114707884A (zh) * | 2022-04-19 | 2022-07-05 | 中国银行股份有限公司 | 银行用户忠诚度数据分析方法及装置 |
CN115049114A (zh) * | 2022-05-30 | 2022-09-13 | 中国银行股份有限公司 | 用户数据分析方法及装置 |
CN115237876A (zh) * | 2022-05-16 | 2022-10-25 | 中航信移动科技有限公司 | 航旅用户分类方法、电子设备和计算机可读存储介质 |
CN115879984A (zh) * | 2023-03-03 | 2023-03-31 | 北京一凌宸飞科技有限公司 | 一种基于大数据分析的网络营销方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120101226A (ko) * | 2011-02-24 | 2012-09-13 | 성균관대학교산학협력단 | 온라인 게임 고객 충성도 분석 시스템 및 분석 방법 |
CN109993582A (zh) * | 2019-04-01 | 2019-07-09 | 东北大学 | 一种基于rfmca模型的多指标客户细分方法 |
CN111091282A (zh) * | 2019-12-10 | 2020-05-01 | 焦点科技股份有限公司 | 一种基于用户行为数据的客户忠诚度细分方法 |
CN112862356A (zh) * | 2021-03-08 | 2021-05-28 | 东南大学 | 基于数理方法构建传统村落活态化保护评价体系的方法 |
-
2021
- 2021-12-28 CN CN202111629627.XA patent/CN114298547A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120101226A (ko) * | 2011-02-24 | 2012-09-13 | 성균관대학교산학협력단 | 온라인 게임 고객 충성도 분석 시스템 및 분석 방법 |
CN109993582A (zh) * | 2019-04-01 | 2019-07-09 | 东北大学 | 一种基于rfmca模型的多指标客户细分方法 |
CN111091282A (zh) * | 2019-12-10 | 2020-05-01 | 焦点科技股份有限公司 | 一种基于用户行为数据的客户忠诚度细分方法 |
CN112862356A (zh) * | 2021-03-08 | 2021-05-28 | 东南大学 | 基于数理方法构建传统村落活态化保护评价体系的方法 |
Non-Patent Citations (2)
Title |
---|
孙伊云;袁汝华;: "基于信息熵与因子分析的城市综合竞争力评价", 河南科学, vol. 34, no. 08, 31 August 2016 (2016-08-31), pages 1357 - 1362 * |
沈红丽;: "因子分析法和熵值法在高校科技创新评价中的应用", 河北工业大学学报, vol. 38, no. 01, 15 February 2009 (2009-02-15), pages 36 - 42 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114707884A (zh) * | 2022-04-19 | 2022-07-05 | 中国银行股份有限公司 | 银行用户忠诚度数据分析方法及装置 |
CN115237876A (zh) * | 2022-05-16 | 2022-10-25 | 中航信移动科技有限公司 | 航旅用户分类方法、电子设备和计算机可读存储介质 |
CN115049114A (zh) * | 2022-05-30 | 2022-09-13 | 中国银行股份有限公司 | 用户数据分析方法及装置 |
CN115879984A (zh) * | 2023-03-03 | 2023-03-31 | 北京一凌宸飞科技有限公司 | 一种基于大数据分析的网络营销方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114298547A (zh) | 用户忠诚度的评分方法、装置、设备及可读存储介质 | |
Abad et al. | From PIN to VPIN: An introduction to order flow toxicity | |
Engelmann et al. | The Basel II risk parameters: estimation, validation, and stress testing | |
Bessembinder | Issues in assessing trade execution costs | |
US7337135B1 (en) | Asset price forecasting | |
Nieppola | Backtesting value-at-risk models | |
Han et al. | Effects of debt collection practices on loss given default | |
US8775291B1 (en) | Systems and methods for enrichment of data relating to consumer credit collateralized debt and real property and utilization of same to maximize risk prediction | |
CN111523997A (zh) | 客户风险评估方法和装置、以及电子设备和可读存储介质 | |
KR102488653B1 (ko) | 재무제표 분석을 통한 가치 산출 및 차트 표시 서비스 제공 시스템 | |
Cheikh et al. | Do sovereign credit ratings matter for corporate credit ratings? | |
CN111626855A (zh) | 债券信用利差预测方法及系统 | |
Hwang | Forecasting credit ratings with the varying-coefficient model | |
Low et al. | BV–VPIN: Measuring the impact of order flow toxicity and liquidity on international equity markets | |
Tsai et al. | Predicting financial distress based on the credit cycle index: A two-stage empirical analysis | |
Srivastava et al. | Benchmarking Indian general insurance firms | |
Ashton et al. | Valuation weights, linear dynamics and accounting conservatism: An empirical analysis | |
Ding et al. | Nonparametric tests for market timing ability using daily mutual fund returns | |
CN117575776A (zh) | 一种借贷风控模型训练方法、设备以及可读存储介质 | |
CN117291716A (zh) | 一种货款数据的风险评估方法 | |
CN117132317A (zh) | 数据处理方法、装置、设备、介质及产品 | |
CN111429286A (zh) | 财务可信度的评估方法、装置、设备和存储介质 | |
Pham et al. | A comparison of the forecasting ability of immediate price impact models | |
CN114418776A (zh) | 一种数据处理方法、装置、终端设备及介质 | |
CN113657894A (zh) | 一种外汇报价处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |