发明内容
本发明实施例提供了一种预测用户满意度的方法及装置,能够获得更加准确的用户满意度。
一方面,本发明实施例提供了一种预测用户满意度的方法,包括:
S1:获取用于预测用户满意度的指标的指标数据;
S2:根据所述指标的指标数据,对所述指标进行清洗,获取清洗后的指标的指标数据;
S3:根据清洗后的指标的指标数据,预测用户满意度,生成用户满意度的最终预测结果。
进一步地,所述指标,包括:
Attach成功率、附着时延、附着请求次数、附着失败次数、跟踪区更新TAU时延、TAU成功率、TAU请求次数、TAU失败次数、无线资源控制协议RRC连接建立成功率、小区无线接通率、小区无线掉线率、切换成功率、网页浏览业务流量、即时通信业务流量、应用下载业务流量、视频播放业务流量、游戏业务流量、金融支付业务流量、音乐业务流量、邮箱业务流量、导航业务流量、2G流量、3G流量、4G流量、4G驻留比、用户在网时长。
进一步地,所述S2中的所述对所述指标进行清洗,包括:将所有指标中指标数据为空值和缺失值的数量大于等于第一预设比例的指标剔除。
进一步地,所述S2中的所述对所述指标进行清洗,包括:将所有指标中指标数据为异常值的数量大于等于第二预设比例的指标剔除。
进一步地,所述S2中的所述对所述指标进行清洗,包括:确定任意两个指标之间的相关度,当任意两个指标之间的相关度大于等于预设值时,剔除该两个指标中的一个指标。
进一步地,还包括:预先建立多个决策树;
所述S3,包括:
将每个用户对应的清洗后的指标数据分别输入到每个决策树中;
通过每个决策树对每个用户的用户满意度进行预测,获取每个决策树对每个用户的用户满意度的中间预测结果;
将每个用户对应的所有中间预测结果中,出现次数最多的中间预测结果作为每个用户的用户满意度的最终预测结果。
进一步地,在所述S3之后,还包括:
确定每个用户的用户满意度的指标中的关键指标;
根据每个用户的关键指标的指标数据,确定关键指标的感知类型;
根据每个用户的预测出的用户满意度和每个用户的关键指标的感知类型,确定每个用户的画像类型。
另一方面,本发明实施例提供了一种预测用户满意度的装置,包括:
获取单元,用于获取用于预测用户满意度的指标的指标数据;
清洗单元,用于根据所述指标的指标数据,对所述指标进行清洗,获取清洗后的指标的指标数据;
预测单元,用于根据清洗后的指标的指标数据,预测用户满意度,生成用户满意度的最终预测结果。
进一步地,所述指标,包括:
Attach成功率、附着时延、附着请求次数、附着失败次数、跟踪区更新TAU时延、TAU成功率、TAU请求次数、TAU失败次数、无线资源控制协议RRC连接建立成功率、小区无线接通率、小区无线掉线率、切换成功率、网页浏览业务流量、即时通信业务流量、应用下载业务流量、视频播放业务流量、游戏业务流量、金融支付业务流量、音乐业务流量、邮箱业务流量、导航业务流量、2G流量、3G流量、4G流量、4G驻留比、用户在网时长。
进一步地,所述清洗单元,在执行所述对所述指标进行清洗时,用于将所有指标中指标数据为空值和缺失值的数量大于等于第一预设比例的指标剔除。
进一步地,所述清洗单元,在执行所述对所述指标进行清洗时,用于将所有指标中指标数据为异常值的数量大于等于第二预设比例的指标剔除。
进一步地,所述清洗单元,在执行所述对所述指标进行清洗时,用于确定任意两个指标之间的相关度,当任意两个指标之间的相关度大于等于预设值时,剔除该两个指标中的一个指标。
进一步地,还包括:建立单元,用于建立多个决策树;
所述预测单元,用于将每个用户对应的清洗后的指标数据分别输入到每个决策树中,通过每个决策树对每个用户的用户满意度进行预测,获取每个决策树对每个用户的用户满意度的中间预测结果,将每个用户对应的所有中间预测结果中,出现次数最多的中间预测结果作为每个用户的用户满意度的所述最终预测结果。
进一步地,还包括:
画像诊断单元,用于确定每个用户的用户满意度的指标中的关键指标,根据每个用户的关键指标的指标数据,确定关键指标的感知类型,根据每个用户的预测出的用户满意度和每个用户的关键指标的感知类型,确定每个用户的画像类型。
在本发明实施例中,获取用于预测用户满意度的指标的指标数据,为了使得预测结果更加准确,对指标进行清洗,根据清洗后的指标的指标数据预测出用户满意度,在本发明实施例中,通过客观的指标的指标数据来预测用户满意度,获得的用户满意度更加准确。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种预测用户满意度的方法,该方法可以包括以下步骤:
S1:获取用于预测用户满意度的指标的指标数据;
S2:根据所述指标的指标数据,对所述指标进行清洗,获取清洗后的指标的指标数据;
S3:根据清洗后的指标的指标数据,预测用户满意度,生成用户满意度的最终预测结果。
在本发明实施例中,获取用于预测用户满意度的指标的指标数据,为了使得预测结果更加准确,对指标进行清洗,根据清洗后的指标的指标数据预测出用户满意度,在本发明实施例中,通过客观的指标的指标数据来预测用户满意度,获得的用户满意度更加准确。
在一种可能的实现方式中,所述指标,包括:
Attach成功率、附着时延、附着请求次数、附着失败次数、TAU(TrackingArea Update,跟踪区更新)时延、TAU成功率、TAU请求次数、TAU失败次数、RRC(Radio Resource Control,无线资源控制协议)连接建立成功率、小区无线接通率、小区无线掉线率、切换成功率、网页浏览业务流量、即时通信业务流量、应用下载业务流量、视频播放业务流量、游戏业务流量、金融支付业务流量、音乐业务流量、邮箱业务流量、导航业务流量、2G流量、3G流量、4G流量、4G驻留比、用户在网时长。
在该实现方式中,用于预测用户满意度的指标可以通过信令侧、经分侧、网络侧、客服侧等平台来获取。用于预测用户满意度的指标还可以包括通过信令侧、经分侧、网络侧、客服侧等平台获取的其他指标。该指标还可以包括:用户、用户类型、NPS(Net Promoter Score,净推荐值)打分、天、月、手机通话质量满意度打分、手机上网质量满意度打分、流量套餐满意度打分、流量提醒服务满意度打分、移动4G整体表现打分、用户提交日期、用户提交时间、最大在线用户数、MR(Measurement Report,测量报告)覆盖率、MRRIP(Measurement Report Routing Information Protocol)>-105dbm占比、是否重复投诉用户、是否网络类升级(倾向)投诉用户、UE(User Equipment,用户设备)请求PDN(Packet Data Network,分组数据网)连接成功率、是否视频播放控用户、是否网页浏览控用户、是否下载控用户、是否即时通信控用户、是否游戏控用户、是否金融支付控用户、是否音乐控用户、是否邮箱控用户、是否导航控用户、是否高流量用户、是否中流量用户、是否低流量用户、终端品牌、终端型号、终端类型(2/3/4G)、用户年龄。针对这些指标,可以建立用户信息宽表来保存,用于后续处理过程。用户信息宽表简表如表1所示,每个字段名称对应一个指标。
表1
为了提高预测结果的准确性,在一种可能的实现方式中,所述S2中的所述对所述指标进行清洗,包括:将所有指标中指标数据为空值和缺失值的数量大于等于第一预设比例的指标剔除。
在该实现方式中,当某个指标的指标数据为空值和缺失值的数量大于等于第一预设比例时,说明该指标代表性不足,应当剔除,不用于用户满意度的预测。该第一预设比例可以是50%。举例来说,针对附着请求次数这个指标,该指标可以每天进行一次统计,而用于预测用户满意度的是预设时间内每天的附着请求次数,例如该预设时间是10天,其中,有6天的附着请求次数为空值或者为缺失值,则可以将附着请求次数这个指标提出,不用于后续处理。
为了提高预测结果的准确性,在一种可能的实现方式中,所述S2中的所述对所述指标进行清洗,包括:将所有指标中指标数据为异常值的数量大于等于第二预设比例的指标剔除。
在该实现方式中,当某个指标的指标数据为异常值的数量大于等于第二预设比例时,说明该指标代表性不足,应当剔除,不用于用户满意度的预测。针对每个指标的指标数据是否是异常值,可以根据预先设置的指标与异常值的对应关系来确定。举例来说,针对指标A,当指标A的指标数据在范围A中时,该指标数据为异常值。第二预设比例可以为10%。例如:attach成功率的指标数据为0时,该指标数据为异常值,当attach成功率有超过20%的为0,则排除该指标。
在一种可能的实现方式中,所述S2中的所述对所述指标进行清洗,包括:确定任意两个指标之间的相关度,当任意两个指标之间的相关度大于等于预设值时,剔除该两个指标中的一个指标。
在该实现方式中,当两个指标的相关度很高时,剔除其中一个对最终的预测结果影响较小,可以增加计算速度。
另外,在执行步骤S3之前还可以包括:
分析每个指标的指标数据的来源是否准确,如果不准确,则更新数据采集来源;分析指标计算是否符合规定,如果不符合,则更新指标计算规则。该实现方式,从指标的源头提高数据的合规性、规范性。
如果某一指标在某一类别或某两类别占比过高(例如大于50%),则认为该指标对不同满意度得分的用户区分能力弱,排除该指标。
对单个指标进行均值、中位数、众数、方差等描述性统计分析,掌握单变量指标数据特点,为后续分析奠定基础。
将任意两个指标分组,比较各组的分别状况,寻找指标间的关系。
完备指标数据,即对指标存在指标缺失、指标空值的情况进行补充,提高指标数据的数量及质量,进而提高预测的准确性。对预先确定的重要性指标存在空值、缺失值等情况采用同满意度得分、同类型样本的均值进行替代。
在一种可能的实现方式中,还包括:预先建立多个决策树;
所述S3,包括:
将每个用户对应的清洗后的指标数据分别输入到每个决策树中;
通过每个决策树对每个用户的用户满意度进行预测,获取每个决策树对每个用户的用户满意度的中间预测结果;
将每个用户对应的所有中间预测结果中,出现次数最多的中间预测结果作为每个用户的用户满意度的最终预测结果。
在该实现方式中,决策树之间是相互独立的,每个决策树能够对用户满意度进行预测,但是,每个决策树的预测结果都可能存在误差,将每个用户对应的所有中间预测结果中,出现次数最多的中间预测结果作为每个用户的用户满意度的最终预测结果,提高了预测结果的准确性。举例来说,有10个决策树,其中,有6个决策树输出的中间预测结果为“满意”,2个决策树输出的中间预测结果为“很满意”,决策树输出的中间预测结果为“不满意”,则最终预测结果为“满意”。
为了提高预测结果的准确性,可以预先对建立的多个决策树进行训练。具体地,将训练数据导入到每个决策树,决策树输出根据训练数据得到的预测结果,将预测结果与真实值进行比较,确定出决策树的预测准确率,如果准确率高于准确率阈值时,则采用该多个决策树进行预测,否则,对该多个决策树进行优化,优化后,重新进行训练,直到决策树的预测准确率高于准确率阈值。
另外,可以通过混淆矩阵来衡量该多个决策树的预测的准确率。具体地,混淆矩阵的每一列代表了多个决策树的预测的用户满意度,每一列的总数表示预测为该用户满意度的用户的数目;每一行代表了用户的真实满意度,每一行的数据总数表示该真实满意度的数目。举例来说,用户满意度包括:很满意、满意、不满意。
表2
|
很满意 |
满意 |
不满意 |
准确率 |
很满意 |
1117 |
50 |
299 |
76.19% |
满意 |
169 |
524 |
209 |
58.09% |
不满意 |
111 |
64 |
2297 |
92.92% |
整体 |
|
|
|
18.64% |
如表2所示,由“很满意”对应的行可得,“很满意”的用户数量为1117+50+299=1466。由“满意”对应的行可得,“满意”的用户数量为169+524+209=902。由“不满意”对应的行可得,“不满意”的用户数量为111+64+2297=2472。通过该多个决策树进行预测得到:由“很满意”对应的列可得,对于真实满意度为“很满意”的用户,预测结果为“很满意”的用户数量为1117,预测的准确率为:76.19%;由“满意”对应的列可得,对于真实满意度为“满意”的用户,预测结果为“满意”的用户数量为524,预测的准确率为:58.09%;由“不满意”对应的列可得,对于真实满意度为“满意”的用户,预测结果为“不满意”的用户数量为2297,预测的准确率为:92.92%。整体的准确率为预测准确的用户的数量占总的用户数量的比例,整体的准确率为81.36%。
在一种可能的实现方式中,在所述S3之后,还包括:
确定每个用户的用户满意度的指标中的关键指标;
根据每个用户的关键指标的指标数据,确定关键指标的感知类型;
根据每个用户的预测出的用户满意度和每个用户的关键指标的感知类型,确定每个用户的画像类型。
在该实现方式中,关键指标可以是预先指定的,可以按照对用户满意度的影响程度来指定。感知类型可以包括:好、差。用户的满意度可以通过满意、不满意划分。在该实现方式中,还可以包括:预先设置画像类型与用户满意度和感知类型的对应关系,举例来说,当用户满意度为满意,且感知类型为好,对应的画像类型为绝对满意型;当用户满意度为满意,且感知类型为差,对应的画像类型为网络修复型;当用户满意度为不满意,且感知类型为好,对应的画像类型为挑剔关怀型;当用户满意度为不满意,且感知类型为差,对应的画像类型为网络修复型。在该实现方式中,关键指标可以是网络质量的相关指标,例如:4G驻留比、小区无线接通率、小区无线掉线率等。
用户的画像类型如表3所示。
表3
用户 |
用户满意度 |
感知类型 |
画像类型 |
1 |
满意 |
好 |
绝对满意型 |
2 |
不满意 |
差 |
网络修复型 |
3 |
满意 |
好 |
绝对满意型 |
4 |
不满意 |
差 |
网络修复型 |
5 |
不满意 |
好 |
挑剔关怀型 |
6 |
满意 |
好 |
绝对满意型 |
7 |
满意 |
好 |
绝对满意型 |
8 |
满意 |
差 |
乐观友好型 |
9 |
不满意 |
差 |
网络修复型 |
10 |
满意 |
好 |
绝对满意型 |
通过确定出的用户的画像类型,可以进行基于画像类型的营销策略及问题推送。通过确定出的用户的画像类型,分析不同层次、不同特征的用户的特点,以采用更加针对性的营销策略。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图及具体实施例对本发明作进一步地详细描述。
如图2所示,本发明实施例提供了一种预测用户满意度的方法,该方法可以包括以下步骤:
步骤201:预先建立多个决策树。
具体地,每个决策树均用来预测用户满意度,而每个决策树的预测算法可能不同。可以将该多个决策树当做一个预测模型。而该预测模型可以是随机森林模型,可以通过随机森林模型来预测用户满意度。
步骤202:获取待预测用户的用于预测用户满意度的指标的指标数据。
举例来说,待预测用户为用户A,用户A的一个指标是1月份的每天的小区无线掉线率。
下面通过步骤203、步骤204和步骤205对指标进行清洗:
步骤203:根据指标的指标数据,将所有指标中指标数据为空值和缺失值的数量大于等于第一预设比例的指标剔除。
具体地,第一预设比例可以是50%。举例来说,如果在1月份的每天的小区无线掉线率中,有超过50%的指标数据是空值或缺失值,则剔除该指标。
步骤204:根据指标的指标数据,将所有指标中指标数据为异常值的数量大于等于第二预设比例的指标剔除。
具体地,第二预设比例可以是10%。举例来说,当小区无线掉线率的指标数据大于90%时,该指标数据为异常值。当在1月份的每天的小区无线掉线率中有超过10%为异常值,则剔除该指标。
步骤205:根据指标的指标数据,确定任意两个指标之间的相关度,当任意两个指标之间的相关度大于等于预设值时,剔除该两个指标中的一个指标。
举例来说,用户A的另一个指标为1月份中每天的小区无线接通率。确定出小区无线接通率和小区无线掉线率的相关度为90%,那么可以从小区无线接通率和小区无线掉线率中剔除其中一个。
步骤206:获取剩余的指标的指标数据。
具体地,这里的剩余的指标的指标数据指的是清洗后的指标的指标数据。
步骤207:将待预测用户对应的剩余的指标数据分别输入到每个决策树中。
举例来说,针对用户A,将用户A的小区无线掉线率等指标的指标数据输入到每个决策树中。
步骤208:通过每个决策树对待预测用户的用户满意度进行预测,获取每个决策树对待预测用户的用户满意度的中间预测结果。
举例来说,有10个决策树,针对用户A的用户满意度,6个决策树的中间预测结果为“满意”,4个决策树的中间预测结果为“不满意”。
步骤209:将待预测用户对应的所有中间预测结果中,出现次数最多的中间预测结果作为待预测用户的用户满意度的最终预测结果。
举例来说,针对用户A的用户满意度,“满意”的中间预测结果出现次数最多,则用户A的用户满意度的最终预测结果为“满意”。
基于本发明实施例提供的多个决策树,可以计算出指标的影响力,通过指标的影响力可以确定哪些指标对预测用户满意度影响大。本发明实施例提供的多个决策树,还可以用于工单标准化管理、质差定界修复等方面。
另外,根据预测出的用户满意度的最终预测结果,可以对满意度不高的用户通过赠送流量、客户关怀等方式进行修复,以提高用户的满意度。
如图3、图4所示,本发明实施例提供了一种预测用户满意度的装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图3所示,为本发明实施例提供的一种预测用户满意度的装置所在设备的一种硬件结构图,除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图4所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的一种预测用户满意度的装置,包括:
获取单元401,用于获取用于预测用户满意度的指标的指标数据;
清洗单元402,用于根据所述指标的指标数据,对所述指标进行清洗,获取清洗后的指标的指标数据;
预测单元403,用于根据清洗后的指标的指标数据,预测用户满意度,生成用户满意度的最终预测结果。
在一种可能的实现方式中,所述指标,包括:
Attach成功率、附着时延、附着请求次数、附着失败次数、跟踪区更新TAU时延、TAU成功率、TAU请求次数、TAU失败次数、无线资源控制协议RRC连接建立成功率、小区无线接通率、小区无线掉线率、切换成功率、网页浏览业务流量、即时通信业务流量、应用下载业务流量、视频播放业务流量、游戏业务流量、金融支付业务流量、音乐业务流量、邮箱业务流量、导航业务流量、2G流量、3G流量、4G流量、4G驻留比、用户在网时长。
在一种可能的实现方式中,所述清洗单元402,在执行所述对所述指标进行清洗时,用于将所有指标中指标数据为空值和缺失值的数量大于等于第一预设比例的指标剔除。
在一种可能的实现方式中,所述清洗单元402,在执行所述对所述指标进行清洗时,用于将所有指标中指标数据为异常值的数量大于等于第二预设比例的指标剔除。
在一种可能的实现方式中,所述清洗单元402,在执行所述对所述指标进行清洗时,用于确定任意两个指标之间的相关度,当任意两个指标之间的相关度大于等于预设值时,剔除该两个指标中的一个指标。
在一种可能的实现方式中,还包括:建立单元,用于建立多个决策树;
所述预测单元403,用于将每个用户对应的清洗后的指标数据分别输入到每个决策树中,通过每个决策树对每个用户的用户满意度进行预测,获取每个决策树对每个用户的用户满意度的中间预测结果,将每个用户对应的所有中间预测结果中,出现次数最多的中间预测结果作为每个用户的用户满意度的所述最终预测结果。
在一种可能的实现方式中,还包括:
画像诊断单元,用于确定每个用户的用户满意度的指标中的关键指标,根据每个用户的关键指标的指标数据,确定关键指标的感知类型,根据每个用户的预测出的用户满意度和每个用户的关键指标的感知类型,确定每个用户的画像类型。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例提供的,至少具有以下有益效果:
1、在本发明实施例中,获取用于预测用户满意度的指标的指标数据,为了使得预测结果更加准确,对指标进行清洗,根据清洗后的指标的指标数据预测出用户满意度,在本发明实施例中,通过客观的指标的指标数据来预测用户满意度,获得的用户满意度更加准确。
2、在本发明实施例中,通过清洗指标中指标数据为空值和缺失值较多的指标,以及清洗指标中的指标数据为异常值较多的指标,能够使得预测的用户满意度更加准确。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个〃.....”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。