CN112101692A - 移动互联网质差用户的识别方法及装置 - Google Patents

移动互联网质差用户的识别方法及装置 Download PDF

Info

Publication number
CN112101692A
CN112101692A CN201910528840.8A CN201910528840A CN112101692A CN 112101692 A CN112101692 A CN 112101692A CN 201910528840 A CN201910528840 A CN 201910528840A CN 112101692 A CN112101692 A CN 112101692A
Authority
CN
China
Prior art keywords
user
complaint
quality
users
poor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910528840.8A
Other languages
English (en)
Other versions
CN112101692B (zh
Inventor
李训文
王晨
尹皓玫
闻君
郑远哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910528840.8A priority Critical patent/CN112101692B/zh
Publication of CN112101692A publication Critical patent/CN112101692A/zh
Application granted granted Critical
Publication of CN112101692B publication Critical patent/CN112101692B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management

Abstract

本发明公开了一种移动互联网质差用户的识别方法及装置,方法包括:获取投诉用户的用户面单据以及非投诉用户的用户面单据;对投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据;将指标数据输入至投诉预测模型中,获取投诉预测模型的全连接层所输出的预测质差特征;基于预测质差特征构建质差用户识别模型;采用模型解释算法对质差用户识别模型进行分析,得到与质差用户识别模型的输出结果相关联的影响特征,对影响特征进行聚类生成质差异常模式集合;基于质差用户识别模型以及质差异常模式集合识别质差用户。该方式能够提升质差用户识别的效率和准确度,并能够实现体验异常的原因界定。

Description

移动互联网质差用户的识别方法及装置
技术领域
本发明涉及数据处理技术领域,具体涉及一种移动互联网质差用户的识别方法及装置。
背景技术
随着移动业务流量的持续暴涨,网络质差投诉问题快速抬升。现有的移动互联网质差用户识别方案中,主要依靠人工经验进行分析,通常只能对网络故障、停复机、4G回落23G等较为典型的异常场景下的用户质差特征进行提取归纳,并形成覆盖面十分有限的质差识别规则,基于这些经验规则开展质差用户及异常模式识别与分析。
但是,发明人在实现本发明的过程中发现:基于经验归纳总结投诉用户的特征进而查找全网质差用户的方式通常适用于用户无法上网等信令异常特征较为明显、容易通过错误码等进行表达的场景。但在业务流量持续暴涨背景下,出现了质差特征在信令面单据中错误码标识,相关体验数据主要记录在用户面单据中的投诉,例如上网慢类投诉。而人工归纳总结的方式通常难以对用户面单据所表征的业务体验情况进行是否质差的判断,主要体现在以下三个方面:
(1)不同业务对指标的敏感程度不一,业务体验门限难以准确界定。例如游戏业务侧重时延,但同下载速率、丢包率等也强相关。视频业务则会侧重卡顿、初缓等指标。面对现网成千上万的应用,难以通过人工分析手段完成。
(2)业务的体验难以通过单项网络指标进行表达。用户存在质差事件不等于用户为质差用户,质差用户的识别需要对多维特征进行综合判断,而人工分析不擅长多维的表达。人工分析难以识别出哪些行为客户敏感,通常只能做异常事件发生次数,持续时间等统计,无法和用户的真实感知对应。
(3)上网慢类等质差用户的主要异常模式难以洞察,因上网慢类投诉用户通常缺乏网络信令错误码等标识进行分析,难以界定体验质差是何种异常模式(包括弱覆盖、高负荷等)所导致的。
综上所述,现有技术中亟待一种准确有效的质差用户识别机制。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的移动互联网质差用户的识别方法及装置。
根据本发明的一个方面,提供了一种移动互联网质差用户的识别方法,方法包括:
获取投诉用户的用户面单据以及非投诉用户的用户面单据;
对投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据;
将指标数据输入至投诉预测模型中,获取投诉预测模型的全连接层所输出的预测质差特征;
基于预测质差特征构建质差用户识别模型;
采用模型解释算法对质差用户识别模型进行分析,得到与质差用户识别模型的输出结果相关联的影响特征,对影响特征进行聚类生成质差异常模式集合;
基于质差用户识别模型以及质差异常模式集合识别质差用户。
可选地,方法还包括:
对投诉用户的用户面码流和信令面码流的异常模式进行分析,构建经验质差特征;
则基于预测质差特征构建质差用户识别模型进一步包括:
基于预测质差特征和经验质差特征构建质差用户识别模型。
可选地,对投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据具体包括:
按照时间区间的切割粒度,分别对投诉用户以及非投诉用户的用户面单据进行用户维度的关键质量指标统计处理,得到与各个时段相对应的指标数据;其中,指标数据包括至少包括以下中的至少一项:RTT时延数据、上下行速率数据。
可选地,采用模型解释算法对质差用户识别模型进行分析,得到与质差用户识别模型的输出结果相关联的影响特征具体包括:
将输入特征输入至质差用户识别模型中,得到原始预测结果;
分别对质差用户识别模型的输入特征进行调整,将调整后的输入特征输入至质差用户识别模型中,得到调整预测结果;
计算原始预测结果和调整预测结果之间的差异信息,根据差异信息确定影响特征。
可选地,投诉预测模型根据卷积神经网络构建;质差用户识别模型根据XGBoost算法构建;模型解释算法为LIME算法。
可选地,方法进一步包括:
将指标数据作为训练样本集合,将交叉熵确定为损失函数,以及通过梯度下降算法对投诉预测模型的权重和偏差参数进行更新,完成对投诉预测模型的训练更新。
可选地,方法执行之前,进一步包括:
根据投诉平台中的投诉数据确定投诉用户信息,以及根据流量分布情况从全网用户中抽取非投诉用户,并确定非投诉用户信息;其中,投诉用户的数量与非投诉用户的数量之间的比值为预定比值;
则获取投诉用户的用户面单据以及非投诉用户的用户面单据进一步包括:
根据投诉用户信息从集中性能平台中提取投诉用户的用户面单据,以及根据非投诉用户信息从集中性能平台中提取非投诉用户的用户面单据。
根据本发明的另一方面,提供了一种移动互联网质差用户的识别装置,包括:
数据获取模块,适于获取投诉用户的用户面单据以及非投诉用户的用户面单据;
统计模块,适于对投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据;
特征挖掘模块,适于将指标数据输入至投诉预测模型中,获取投诉预测模型的全连接层所输出的预测质差特征;
模型构建模块,适于基于预测质差特征构建质差用户识别模型;
分析模块,适于采用模型解释算法对质差用户识别模型进行分析,得到与质差用户识别模型的输出结果相关联的影响特征,对影响特征进行聚类生成质差异常模式集合;
识别模块,适于基于质差用户识别模型以及质差异常模式集合识别质差用户。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述移动互联网质差用户的识别方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述移动互联网质差用户的识别方法对应的操作。
根据本发明的移动互联网质差用户的识别方法及装置,方法包括:获取投诉用户的用户面单据以及非投诉用户的用户面单据;对投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据;将指标数据输入至投诉预测模型中,获取投诉预测模型的全连接层所输出的预测质差特征;基于预测质差特征构建质差用户识别模型;采用模型解释算法对质差用户识别模型进行分析,得到与质差用户识别模型的输出结果相关联的影响特征,对影响特征进行聚类生成质差异常模式集合;基于质差用户识别模型以及质差异常模式集合识别质差用户。该方式通过深度学习的方法构建用户体验异常通用化模型,深度挖掘用户面单据中的异常模式,解决了传统单一KQI指标难以表征客户真实感知问题;将全连接层的输出作为质差特征的方式,为业务指标和客户感知间的复杂关联关系建立全新的表达方式;通过深度挖掘质差特征,洞察隐含在信令中的异常行为,提升质差用户识别的效率和准确度;引入模型解释算法获取影响识别模型的预测结果的特征,并通过聚类手段挖掘关键异常模式,解决了现有技术中针对缺乏信令错误码的场景下难以界定异常的问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的移动互联网质差用户的识别方法的流程示意图;
图2示出了根据本发明另一个实施例的移动互联网质差用户的识别方法的流程示意图;
图3示出了根据本发明又一个实施例的移动互联网质差用户的识别装置的功能模块图;
图4示出了本发明一种实施方式中各个决策树的示意图;
图5示出了根据本发明实施例的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的移动互联网质差用户的识别方法的流程示意图,如图1所示,该方法包括:
步骤S101,获取投诉用户的用户面单据以及非投诉用户的用户面单据。
实际应用中,根据投诉平台中的投诉数据确定投诉用户,以及从全网用户中抽取一定数量的非投诉用户,然后根据投诉用户信息和非投诉用户信息的清单从集中性能平台中提取投诉用户和非投诉用户的信令XDR单据,包括S1-C接口的信令面单据和用户面单据。可选地,抽取指定时间段内的投诉用户和非投诉用户的信令XDR单据。从而获取到投诉用户的用户面单据和非投诉用户的用户面单据。
步骤S102,对投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据。
对获取的用户面单据进行用户维度的KQI(关键质量指标)指标统计处理,KQI指标是主要针对不同业务提出的贴近用户感受的业务质量参数,从而得到用户面单据所对应的指标数据。例如,KQI指标数据包括RTT时延数据、上下行速率数据等一些感知相关的指标数据。
步骤S103,将指标数据输入至投诉预测模型中,获取投诉预测模型的全连接层所输出的预测质差特征。
通过将投诉用户对应的指标数据作为正样本标签数据,将非投诉用户对应的指标数据作为负样本标签数据训练得到投诉预测模型。该投诉预测模型为指标数据与投诉标签之间的关联模型,模型的输入层为指标数据,模型的输出层的节点则对应投诉标签,全连接层的输出即为该模型所挖掘的预测质差特征。
步骤S104,基于预测质差特征构建质差用户识别模型。
将步骤S103中模型挖掘的预测质差特征作为输入,以投诉用户对应的指标数据作为正样本标签数据,以非投诉用户对应的指标数据作为负样本标签数据,构建质差用户识别模型。
步骤S105,采用模型解释算法对质差用户识别模型进行分析,得到与质差用户识别模型的输出结果相关联的影响特征,对影响特征进行聚类生成质差异常模式集合。
该步骤的目的在于分析哪些输入特征对质差用户识别模型的结果产生贡献,通过将输入特征在其数值周围做微小的扰动,观察质差用户识别模型的预测行为,并根据扰动的数据与原始数据的距离确定贡献度较高的输入特征,对贡献度较高的输入特征进行聚类形成质差异常模式集合,异常模式表征导致体验异常的原因,例如弱覆盖、高负荷等等。
步骤S106,基于质差用户识别模型以及质差异常模式集合识别质差用户。
在后续的过程中,将用户数据输入至该质差用户识别模型中,实现根据用户的特征指标,进行质差预测,并分析导致体验质差的具体原因,输出体验异常用户的分类结果和问题聚汇。
根据本实施例所提供的移动互联网质差用户的识别方法,该方式通过深度学习的方法构建用户体验异常通用化模型,深度挖掘用户面单据中的异常模式,解决了传统单一KQI指标难以表征客户真实感知问题;将全连接层的输出作为质差特征的方式,为业务指标和客户感知间的复杂关联关系建立全新的表达方式;通过深度挖掘质差特征,洞察隐含在信令中的异常行为,提升质差用户识别的效率和准确度;引入模型解释算法获取影响识别模型的预测结果的特征,并通过聚类手段挖掘关键异常模式,解决了现有技术中针对缺乏信令错误码的场景下难以界定异常的问题。
图2示出了根据本发明另一个实施例的移动互联网质差用户的识别方法的流程示意图,如图2所示,该方法包括:
步骤S201,获取投诉用户的用户面单据以及非投诉用户的用户面单据。
具体地,预先根据投诉平台中的投诉数据确定投诉用户信息,以及根据流量分布情况从全网用户中抽取非投诉用户,并确定非投诉用户信息;投诉用户的数量与非投诉用户的数量之间的比值为预定比值。
其中,可按照流量分布从全网用户中抽取非投诉用户,例如,根据表一所示的流量分布区间和用户数之间的对应关系来抽取非投诉用户,如表一所示,投诉用户的数量与非投诉用户的数量的比值为1:8。
表一
序号 流量区间 用户数
1 X<=50KB (区间1用户数/总用户数)*投诉用户数*8
2 50KB<X<=1MB (区间2用户数/总用户数)*投诉用户数*8
3 1MB<x<=10MB (区间3用户数/总用户数)*投诉用户数*8
4 10MB<X<=50MB (区间4用户数/总用户数)*投诉用户数*8
5 50MB<X<=100MB (区间5用户数/总用户数)*投诉用户数*8
6 100MB<X<=200MB (区间6用户数/总用户数)*投诉用户数*8
7 200MB<X<=500MB (区间7用户数/总用户数)*投诉用户数*8
8 500MB<X<=1GB (区间8用户数/总用户数)*投诉用户数*8
9 1GB<X<=2GB (区间9用户数/总用户数)*投诉用户数*8
10 2GB<X<=5GB (区间10用户数/总用户数)*投诉用户数*8
11 5GB<X<=10GB (区间11用户数/总用户数)*投诉用户数*8
12 10GB<X<=20GB (区间12用户数/总用户数)*投诉用户数*8
13 20GB<X<=50GB (区间13用户数/总用户数)*投诉用户数*8
14 50<X<=100GB (区间14用户数/总用户数)*投诉用户数*8
15 X>100GB (区间15用户数/总用户数)*投诉用户数*8
然后,根据投诉用户信息从集中性能平台中提取投诉用户的用户面单据,以及根据非投诉用户信息从集中性能平台中提取非投诉用户的用户面单据。可选地,从集中性能平台中提取指定时间段内投诉用户的用户面单据和非投诉用户的用户面单据。
步骤S202,按照时间区间的切割粒度,分别对投诉用户以及非投诉用户的用户面单据进行用户纬度的关键质量指标统计处理,得到与各个时段相对应的指标数据。
时间通过区间分割编码获取,如一周小时粒度切分为7*24,取值即0-167。按照时间区间的切割粒度,分别对投诉用户的用户面单据以及非投诉用户的用户面单据进行用户维度的关键质量指标统计处理,得到与各个时段相对应KQI指标数据。KQI指标数据包括RTT时延数据、上下行速率数据等感知相关的常见指标。可选地,具体统计方式包括:指标方差统计、指标均值统计、指标分位值统计。相应地,指标数据中还包括按照不同统计方式统计得到的数据,表二示出了本发明一种实施方式中的KQI指标数据。
表二
Figure BDA0002099072740000091
步骤S203,将与各个时段相对应的指标数据输入至投诉预测模型中,获取投诉预测模型的全连接层所输出的预测质差特征。
投诉预测模型为指标数据与投诉标签之间的关联模型,本实施例中,采用卷积神经网络构建投诉预测模型。为了训练投诉预测模型,将上述步骤S202处理得到的指标数据组成训练样本集合,具体地,将投诉用户对应的指标数据作为正样本标签数据,将非投诉用户对应的指标数据作为负样本标签数据,将交叉熵定义为损失函数,通过梯度下降算法更新模型的权重和偏差函数,当损失函数不再下降或者模型判断准确率达到目标时结束训练。
具体地,该投诉预测模型的输入层数据的具体形式为包含时间信息、指标信息、指标统计特征值的三维数值,指标统计特征值即是结合时间区间,采用上述方差、均值、分位值等统计方式对对应的时间区间内的指标数据进行统计得到的。输出层的节点则对应投诉标签。因此,定义了包含2个卷积/池化层、2个全连接层的卷积网络,完成信令单据中KQI指标到用户投诉标签的多维度关联映射模型。全连接层的输出即为深度学习模型所挖掘的预测质差特征,该预测质差特征为高阶时序特征。
步骤S204,对投诉用户的用户面码流和信令面码流的异常模式进行分析,构建经验质差特征。
基于专家经验对投诉用户的用户面码流和信令面码流的异常模式进行分析,对用户的异常模式设计事件的各种特征组合,并获取相应特征的统计值,构建经验质差特征。例如,23G回落事件通过RAU次数、GbIUPS信令次数、23G业务持续时长、23G业务占比、4GNetwork Service Request无业务量且伴随GbIUPS信令次数等信令特征组合进行表达。
在对用户的异常模式设计事件的各种特征组合时,考虑信令面特征、用户面特征以及其他特征。信令面特征包括:接入和承载建立特征、掉话特征、移动特征、信令面失败特征、2/3G信令特征、业务请求特征等等;用户面特征包括:业务行为特征、2/3/4G业务流量和时长特征、业务质量KQI特征、TCP管道指标特征、CS通话行为特征等等,其他特征如APN、用户IP、签约速率等等。
步骤S205,基于预测质差特征和经验质差特征构建质差用户识别模型。
本实施例中,采用XGBoost算法,将预测质差特征和经验质差特征作为模型的输入特征,以投诉用户对应的指标数据作为正样本标签数据,非投诉用户对应的指标数据作为负样本标签数据,将挖掘的质差特征中的每一个特征对应决策树的一个节点,如果哪个类别的样本在叶子节点占比大,就将该叶子节点认为是哪个类别。通过随机构建大量决策树,让不同类别的样本尽可能分到不同的分支,拟合逼近后,按照各个决策树的预测准确率设置权重,最终得到质差用户识别模型。
图4示出了本发明一种实施方式中各个决策树的示意图。如图4中所示的公示,
Figure BDA0002099072740000101
其中,f(x)表示最终预测结果,Ti(x)表示第i个决策树输出的结果,αi为第i个决策树的权重值,也即,质差用户识别模型最终输出的质差预测结果为各个决策树输出的结果与其对应的权重值的乘积的累加和。
由此可见,本实施例中采用XGBoost算法,利用专家经验特征和人工智能算法挖掘的特征以及现网投诉标签,拟合逼近建立质差用户识别模型,能够实现对各类质差事件进行综合评价,自动化输出质差用户的识别结果。
步骤S206,将输入特征输入至质差用户识别模型中,得到原始预测结果。
其中,输入特征具体包括预测质差特征和经验质差特征,将输入特征输入至质差用户识别模型中,得到原始预测结果。
步骤S207,分别对质差用户识别模型的输入特征进行调整,将调整后的输入特征输入至质差用户识别模型中,得到调整预测结果。
对输入特征在其取值周围做微小的扰动,将调整后的输入特征输入至质差用户识别模型中,得到调整预测结果,以便观察模型的预测行为。
步骤S208,计算原始预测结果和调整预测结果之间的差异信息,根据差异信息确定影响特征,对影响特征进行聚类生成质差异常模式集合。
根据输入特征扰动之后得到的预测数据与原始预测数据之间的距离,确定对应的输入特征的权重,该权重代表输入特征对质差用户识别模型的结果的贡献度,与输出结果相关联的影响特征也就是贡献度达到指定要求的输入特征,然后,将贡献度达到指定要求的输入特征进行聚类形成异常模式集合。
可选地,上述步骤S207-步骤S208可采用LIME算法实现,分析哪一部分输入特征对质差用户识别模型的结果产生贡献。
下面举例说明采用LIME算法进行分析的过程:采集若干异常用户的数据作为异常用户样本集,这里的异常用户可以为投诉用户。对每个异常用户样本的特征进行小范围变化,形成领域样本,利用分类器(质差用户识别模型)对领域样本进行分类,对领域样本的分类情况(质差用户识别模式的输出结果)进行标注;根据标注结果,使用线性回归对领域样本做局部分类,得到特征贡献度;然后取贡献度达标的特征进行聚类形成异常模式。表三示出了该示例中分析得到的特征贡献度,表四示出了该示例中形成的异常模式集合。该示例中,异常模式总体分布为:23G回落占比55%、其他占比31%、业务请求超时或者业务请求无流量占比7%以及占比较小的TAU失败、持续Attach、掉话、EPS承载修改超时、long_dw_rtt以及long_ul_rtt。
表三
特征ID 特征值 贡献度
21 329 +4.67
23 9 +2.15
42 1
…… …… ……
132 0 -2.1
表四
异常模式ID 异常用户数 平均贡献度
1 56 +6.32
2 23 +3.45
3 12 +2.56
…… …… ……
N 1 +2.01
由此可见,本实施例的方法通过分析不同质差特征对模型的判定的影响,识别引起异常的主因,能够支撑用户网络异常原因定界。
步骤S209,基于质差用户识别模型以及质差异常模式集合识别质差用户。
在后续的过程中,将用户数据输入至该质差用户识别模型中,实现根据用户的特征指标,进行质差预测,并分析出导致体验质差的具体原因,输出体验异常用户的分类结果和问题聚汇,分类结果表示用户是质差用户还是非质差用户,问题聚汇表示导致用户体验质差的具体原因。
根据本实施例所提供的移动互联网质差用户的识别方法,该方式利用卷积神经网络算法,结合网络信令大数据和投诉用户数据,通过码流、信令和用户面序列特征表达、KQI指标组合关联识别体验异常用户的关键特征,对传统专家经验的异常行为特征进行补充,解决传统单一KQI指标难以表征客户真实感知,RTT、TCP等码流特征难以表达的问题;提供了基于深度学习挖掘质差特征和经验质差构建质差用户识别模型,结合时序特征、码流特征、KQI指标数据,深度洞察隐含在信令中的异常行为,能够提升模型的识别准确率及效率;提供了基于模型解释算法的质差用户异常模式识别方法,能够解决由于缺乏网络信令错误码从而难以异常定界的问题。
图3示出了根据本发明又一个实施例的移动互联网质差用户的识别装置的功能模块图,如图3所示,该装置包括:
数据获取模块31,适于获取投诉用户的用户面单据以及非投诉用户的用户面单据;
统计模块32,适于对投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据;
特征挖掘模块33,适于将指标数据输入至投诉预测模型中,获取投诉预测模型的全连接层所输出的预测质差特征;
模型构建模块34,适于基于预测质差特征构建质差用户识别模型;
分析模块35,适于采用模型解释算法对质差用户识别模型进行分析,得到与质差用户识别模型的输出结果相关联的影响特征,对影响特征进行聚类生成质差异常模式集合;
识别模块36,适于基于质差用户识别模型以及质差异常模式集合识别质差用户。
在一种可选的方式中,特征挖掘模块33还适于:对投诉用户的用户面码流和信令面码流的异常模式进行分析,构建经验质差特征;
则模型构建模块34进一步适于:
基于预测质差特征和经验质差特征构建质差用户识别模型。
在一种可选的方式中,统计模块32进一步适于:按照时间区间的切割粒度,分别对投诉用户以及非投诉用户的用户面单据进行用户维度的关键质量指标统计处理,得到与各个时段相对应的指标数据;
其中,指标数据包括至少包括以下中的至少一项:RTT时延数据、上下行速率数据。
在一种可选的方式中,分析模块35进一步适于:将输入特征输入至质差用户识别模型中,得到原始预测结果;
分别对质差用户识别模型的输入特征进行调整,将调整后的输入特征输入至质差用户识别模型中,得到调整预测结果;
计算原始预测结果和调整预测结果之间的差异信息,根据差异信息确定影响特征。
在一种可选的方式中,投诉预测模型根据卷积神经网络构建;质差用户识别模型根据XGBoost算法构建;模型解释算法为LIME算法。
在一种可选的方式中,装置进一步包括:训练模块,适于将指标数据作为训练样本集合,将交叉熵确定为损失函数,以及通过梯度下降算法对投诉预测模型的权重和偏差参数进行更新,完成对投诉预测模型的训练更新。
在一种可选的方式中,数据获取模块31进一步适于:根据投诉平台中的投诉数据确定投诉用户信息,以及根据流量分布情况从全网用户中抽取非投诉用户,并确定非投诉用户信息;其中,投诉用户的数量与非投诉用户的数量之间的比值为预定比值;
根据投诉用户信息从集中性能平台中提取投诉用户的用户面单据,以及根据非投诉用户信息从集中性能平台中提取非投诉用户的用户面单据。
本申请实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的移动互联网质差用户的识别方法。
图5示出了根据本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:
处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器502,用于执行程序510,具体可以执行上述移动互联网质差用户的识别方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:获取投诉用户的用户面单据以及非投诉用户的用户面单据;对投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据;将指标数据输入至投诉预测模型中,获取投诉预测模型的全连接层所输出的预测质差特征;基于预测质差特征构建质差用户识别模型;采用模型解释算法对质差用户识别模型进行分析,得到与质差用户识别模型的输出结果相关联的影响特征,对影响特征进行聚类生成质差异常模式集合;基于质差用户识别模型以及质差异常模式集合识别质差用户。
在一种可选的方式中,程序510具体还可以用于使得处理器502执行以下操作:对投诉用户的用户面码流和信令面码流的异常模式进行分析,构建经验质差特征;基于预测质差特征和经验质差特征构建质差用户识别模型。
在一种可选的方式中,程序510具体还可以用于使得处理器502执行以下操作:按照时间区间的切割粒度,分别对投诉用户以及非投诉用户的用户面单据进行用户维度的关键质量指标统计处理,得到与各个时段相对应的指标数据;其中,指标数据包括至少包括以下中的至少一项:RTT时延数据、上下行速率数据。
在一种可选的方式中,程序510具体还可以用于使得处理器502执行以下操作:将输入特征输入至质差用户识别模型中,得到原始预测结果;分别对质差用户识别模型的输入特征进行调整,将调整后的输入特征输入至质差用户识别模型中,得到调整预测结果;计算原始预测结果和调整预测结果之间的差异信息,根据差异信息确定影响特征。
在一种可选的方式中,投诉预测模型根据卷积神经网络构建;质差用户识别模型根据XGBoost算法构建;模型解释算法为LIME算法。
在一种可选的方式中,程序510具体还可以用于使得处理器502执行以下操作:将指标数据作为训练样本集合,将交叉熵确定为损失函数,以及通过梯度下降算法对投诉预测模型的权重和偏差参数进行更新,完成对投诉预测模型的训练更新。
在一种可选的方式中,程序510具体还可以用于使得处理器502执行以下操作:根据投诉平台中的投诉数据确定投诉用户信息,以及根据流量分布情况从全网用户中抽取非投诉用户,并确定非投诉用户信息;其中,投诉用户的数量与非投诉用户的数量之间的比值为预定比值;根据投诉用户信息从集中性能平台中提取投诉用户的用户面单据,以及根据非投诉用户信息从集中性能平台中提取非投诉用户的用户面单据。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的计算设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种移动互联网质差用户的识别方法,包括:
获取投诉用户的用户面单据以及非投诉用户的用户面单据;
对所述投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据;
将所述指标数据输入至投诉预测模型中,获取所述投诉预测模型的全连接层所输出的预测质差特征;
基于所述预测质差特征构建质差用户识别模型;
采用模型解释算法对所述质差用户识别模型进行分析,得到与所述质差用户识别模型的输出结果相关联的影响特征,对所述影响特征进行聚类生成质差异常模式集合;
基于所述质差用户识别模型以及所述质差异常模式集合识别质差用户。
2.根据权利要求1所述的方法,其中,所述方法还包括:
对投诉用户的用户面码流和信令面码流的异常模式进行分析,构建经验质差特征;
则所述基于所述预测质差特征构建质差用户识别模型进一步包括:
基于所述预测质差特征和所述经验质差特征构建质差用户识别模型。
3.根据权利要求1所述的方法,其中,所述对所述投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据具体包括:
按照时间区间的切割粒度,分别对投诉用户以及非投诉用户的用户面单据进行用户维度的关键质量指标统计处理,得到与各个时段相对应的指标数据;
其中,所述指标数据包括至少包括以下中的至少一项:RTT时延数据、上下行速率数据。
4.根据权利要求1所述的方法,其中,所述采用模型解释算法对所述质差用户识别模型进行分析,得到与所述质差用户识别模型的输出结果相关联的影响特征具体包括:
将输入特征输入至所述质差用户识别模型中,得到原始预测结果;
分别对所述质差用户识别模型的输入特征进行调整,将调整后的输入特征输入至所述质差用户识别模型中,得到调整预测结果;
计算原始预测结果和调整预测结果之间的差异信息,根据差异信息确定影响特征。
5.根据权利要求1所述的方法,其中,所述投诉预测模型根据卷积神经网络构建;所述质差用户识别模型根据XGBoost算法构建;所述模型解释算法为LIME算法。
6.根据权利要求1所述的方法,其中,所述方法进一步包括:
将指标数据作为训练样本集合,将交叉熵确定为损失函数,以及通过梯度下降算法对所述投诉预测模型的权重和偏差参数进行更新,完成对所述投诉预测模型的训练更新。
7.根据权利要求1-6中任一项所述的方法,其中,所述方法执行之前,进一步包括:
根据投诉平台中的投诉数据确定投诉用户信息,以及根据流量分布情况从全网用户中抽取非投诉用户,并确定非投诉用户信息;其中,投诉用户的数量与非投诉用户的数量之间的比值为预定比值;
则所述获取投诉用户的用户面单据以及非投诉用户的用户面单据进一步包括:
根据投诉用户信息从集中性能平台中提取投诉用户的用户面单据,以及根据非投诉用户信息从集中性能平台中提取非投诉用户的用户面单据。
8.一种移动互联网质差用户的识别装置,包括:
数据获取模块,适于获取投诉用户的用户面单据以及非投诉用户的用户面单据;
统计模块,适于对所述投诉用户的用户面单据和非投诉用户的用户面单据进行指标统计处理,得到指标数据;
特征挖掘模块,适于将所述指标数据输入至投诉预测模型中,获取所述投诉预测模型的全连接层所输出的预测质差特征;
模型构建模块,适于基于所述预测质差特征构建质差用户识别模型;
分析模块,适于采用模型解释算法对所述质差用户识别模型进行分析,得到与所述质差用户识别模型的输出结果相关联的影响特征,对所述影响特征进行聚类生成质差异常模式集合;
识别模块,适于基于所述质差用户识别模型以及所述质差异常模式集合识别质差用户。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的移动互联网质差用户的识别方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的移动互联网质差用户的识别方法对应的操作。
CN201910528840.8A 2019-06-18 2019-06-18 移动互联网质差用户的识别方法及装置 Active CN112101692B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910528840.8A CN112101692B (zh) 2019-06-18 2019-06-18 移动互联网质差用户的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910528840.8A CN112101692B (zh) 2019-06-18 2019-06-18 移动互联网质差用户的识别方法及装置

Publications (2)

Publication Number Publication Date
CN112101692A true CN112101692A (zh) 2020-12-18
CN112101692B CN112101692B (zh) 2023-11-24

Family

ID=73749106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910528840.8A Active CN112101692B (zh) 2019-06-18 2019-06-18 移动互联网质差用户的识别方法及装置

Country Status (1)

Country Link
CN (1) CN112101692B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112699099A (zh) * 2020-12-30 2021-04-23 广州杰赛科技股份有限公司 用户投诉数据库扩充方法、装置及存储介质
CN112751710A (zh) * 2020-12-30 2021-05-04 科大国创云网科技有限公司 一种宽带用户质差定因方法及系统
CN115134221A (zh) * 2021-03-11 2022-09-30 中国电信股份有限公司 终端的质差识别方法及装置、存储介质及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104113869A (zh) * 2014-06-20 2014-10-22 北京拓明科技有限公司 一种基于信令数据的潜在投诉用户预测方法及系统
CN105095588A (zh) * 2015-08-05 2015-11-25 中国联合网络通信集团有限公司 移动互联网用户投诉的预测方法和装置
CN106022826A (zh) * 2016-05-18 2016-10-12 武汉斗鱼网络科技有限公司 一种网络直播平台中的作弊用户识别方法与系统
WO2017076154A1 (zh) * 2015-11-05 2017-05-11 华为技术有限公司 网络事件预测以及建立网络事件预测模型的方法和装置
US20180144421A1 (en) * 2016-11-21 2018-05-24 Velites Consulting Group, LLC System and Methods for Complaint Evaluation
CN108921569A (zh) * 2018-06-01 2018-11-30 阿里巴巴集团控股有限公司 一种确定用户投诉类型的方法及装置
CN109242257A (zh) * 2018-08-09 2019-01-18 广州瀚信通信科技股份有限公司 一种基于关键指标关联分析的4g上网用户投诉模型
CN109345302A (zh) * 2018-09-27 2019-02-15 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、存储介质和计算机设备
CN109548036A (zh) * 2017-09-22 2019-03-29 中国移动通信集团浙江有限公司 一种移动网络潜在投诉用户预测方法和装置
CN109816146A (zh) * 2018-12-25 2019-05-28 国网安徽省电力有限公司 一种基于随机森林法欠费停复电投诉倾向预测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104113869A (zh) * 2014-06-20 2014-10-22 北京拓明科技有限公司 一种基于信令数据的潜在投诉用户预测方法及系统
CN105095588A (zh) * 2015-08-05 2015-11-25 中国联合网络通信集团有限公司 移动互联网用户投诉的预测方法和装置
WO2017076154A1 (zh) * 2015-11-05 2017-05-11 华为技术有限公司 网络事件预测以及建立网络事件预测模型的方法和装置
CN106022826A (zh) * 2016-05-18 2016-10-12 武汉斗鱼网络科技有限公司 一种网络直播平台中的作弊用户识别方法与系统
US20180144421A1 (en) * 2016-11-21 2018-05-24 Velites Consulting Group, LLC System and Methods for Complaint Evaluation
CN109548036A (zh) * 2017-09-22 2019-03-29 中国移动通信集团浙江有限公司 一种移动网络潜在投诉用户预测方法和装置
CN108921569A (zh) * 2018-06-01 2018-11-30 阿里巴巴集团控股有限公司 一种确定用户投诉类型的方法及装置
CN109242257A (zh) * 2018-08-09 2019-01-18 广州瀚信通信科技股份有限公司 一种基于关键指标关联分析的4g上网用户投诉模型
CN109345302A (zh) * 2018-09-27 2019-02-15 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、存储介质和计算机设备
CN109816146A (zh) * 2018-12-25 2019-05-28 国网安徽省电力有限公司 一种基于随机森林法欠费停复电投诉倾向预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
周文杰 等: ""基于深度学习的用户投诉预测模型研究"", 《计算机应用研究》, vol. 34, no. 05, pages 1428 - 1432 *
朱龙珠 等: ""基于随机森林算法的投诉预警模型优化方法"", 《电力信息与通信技术》, no. 08, pages 64 - 69 *
王希: ""基于MR数据与机器学习的LTE用户感知评估方法"", 《移动通信》, no. 08, pages 21 - 26 *
赵旺飞: ""NPS用户群网络感知保障运营体系研究"", 《电信快报》, no. 02, pages 19 - 22 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112699099A (zh) * 2020-12-30 2021-04-23 广州杰赛科技股份有限公司 用户投诉数据库扩充方法、装置及存储介质
CN112751710A (zh) * 2020-12-30 2021-05-04 科大国创云网科技有限公司 一种宽带用户质差定因方法及系统
CN115134221A (zh) * 2021-03-11 2022-09-30 中国电信股份有限公司 终端的质差识别方法及装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN112101692B (zh) 2023-11-24

Similar Documents

Publication Publication Date Title
CN111614690B (zh) 一种异常行为检测方法及装置
CN112101692B (zh) 移动互联网质差用户的识别方法及装置
CN107026750B (zh) 一种用户上网QoE评价方法及装置
CN110689368B (zh) 一种移动应用内广告点击率预测系统设计方法
CN109995611B (zh) 流量分类模型建立及流量分类方法、装置、设备和服务器
CN108768695B (zh) Kqi的问题定位方法及装置
CN105227369A (zh) 基于众包模式的移动Apps对无线网路资源利用的分析方法
CN110969215A (zh) 聚类处理方法和装置、存储介质及电子装置
CN109936857B (zh) 一种无线感知度智能识别方法
CN107451249B (zh) 事件发展趋势的预测方法及装置
CN111242430A (zh) 电力设备供应商评价方法和装置
CN102075366A (zh) 通信网络中数据处理的方法及设备
CN107943678B (zh) 一种评价应用访问过程的方法及评价服务器
CN111368858B (zh) 用户满意度评估方法及装置
KR101831959B1 (ko) 빅데이터 분석 클라우드 서비스 시스템
CN111092764A (zh) 一种实时动态亲密度关系分析方法及系统
CN114338351B (zh) 网络异常根因确定方法、装置、计算机设备及存储介质
CN111385128A (zh) 突发负荷的预测方法及装置、存储介质、电子装置
CN112241820A (zh) 资金流动中关键节点的风险识别方法、装置及计算设备
CN113517990B (zh) 一种网络净推荐值nps的预测方法及装置
CN111581508B (zh) 业务监控方法、装置、设备及存储介质
CN113918577A (zh) 数据表识别方法、装置、电子设备及存储介质
CN109308565B (zh) 人群绩效等级识别方法、装置、存储介质及计算机设备
CN110400160B (zh) 识别竞品用户的方法、装置、电子设备和存储介质
CN114997879B (zh) 一种支付路由方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant