CN109993555A - 互联网电视潜在用户投诉预测方法、装置及设备 - Google Patents

互联网电视潜在用户投诉预测方法、装置及设备 Download PDF

Info

Publication number
CN109993555A
CN109993555A CN201711489234.7A CN201711489234A CN109993555A CN 109993555 A CN109993555 A CN 109993555A CN 201711489234 A CN201711489234 A CN 201711489234A CN 109993555 A CN109993555 A CN 109993555A
Authority
CN
China
Prior art keywords
user
internet television
potential
prediction
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711489234.7A
Other languages
English (en)
Inventor
吴薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Sichuan Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Sichuan Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Sichuan Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201711489234.7A priority Critical patent/CN109993555A/zh
Publication of CN109993555A publication Critical patent/CN109993555A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种互联网电视潜在用户投诉预测方法、装置及设备。该方法包括:获取与互联网电视潜在用户投诉相关的样本数据;依据样本数据,获取FCM聚类模型的初始聚类中心;优化FCM聚类模型的初始聚类中心;获得模型参数,分别对应互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类,模糊隶属度为各互联网电视用户隶属于互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类的概率;依据模型参数,预测各互联网电视用户的投诉概率;根据最大隶属度原则确定各互联网电视用户的预测投诉标识类别,预测投诉标识类别分为预测投诉类或预测不投诉类。采用本发明技术方案,可以对互联网电视用户投诉行为进行预测。

Description

互联网电视潜在用户投诉预测方法、装置及设备
技术领域
本发明涉及互联网通信技术领域,尤其涉及一种互联网电视潜在用户投诉预测方法、装置与设备及计算机可读存储介质。
背景技术
当今,移动通信市场的净增用户空间已日趋饱和,运营商之间的角逐更多地体现在创新业务和提升服务质量两个方面。互联网电视(Over The Top TV)是一种集互联网、通讯和多媒体等技术于一体的,向用户提供交互式音视频等服务的新业务。用户投诉处理是运营商服务质量的一个衡量标准,既关系到品牌价值和影响力,又反映了用户的满意程度。因此,互联网电视用户投诉处理成为运营商服务工作中的重要环节,也是战略上的必争之地。通信运营商想要在此环节占据领先地位,则必须适应投诉分析的智能化发展趋势,不仅能对已产生的互联网电视用户投诉进行高效处理,同时对互联网电视用户的投诉倾向能进行科学评估,准确预测投诉行为,并提前做好预处理措施。
用户投诉行为的预测方法分为定性预测方法和定量预测方法两类。前者通过对投诉行为的历史及现状的分析、判断,预测其未来的一种或多种可能性,如市场调研法、德尔菲法等;后者通过历史和现状的数据建立相应的数学模型,对未来的投诉行为作出数量预测,主要分为趋势预测法和因果预测法。目前,移动通信领域的用户投诉定量预测方法有根据市场调查数据进行预测的方法、按人口普及率进行预测的方法、类比法、曲线拟合法和瑞利分布因素法等。
纵观国内外相关研究,用户投诉的分析方法主要是定性方法,这类方法依赖于分析者熟练的业务知识、丰富的经验和突出的综合分析能力,故具有一定的局限性。通信运营商在数据分析领域具有天然的优势,依靠遍布于各个部门的丰富数据,可以分析获知用户真正的需求和自身运营的不足,降低运营成本,改善网络质量,促使企业在竞争中脱颖而出。上述提及的移动通信用户投诉定量预测方法或适用于宏观分析和长期预测,或适用于中短期预测,但它们共同的特点是未能充分利用海量数据的优势,挖掘其背后高价值的信息和知识。此外,尚无任何针对互联网电视用户投诉行为的预测研究。
发明内容
本发明实施例提供了一种互联网电视潜在用户投诉预测方法、装置与设备及计算机可读存储介质,用以解决现有技术中没有对互联网电视用户投诉行为进行预测的技术问题。
第一方面,本发明实施例提供了一种互联网电视潜在用户投诉预测方法,所述方法包括:
获取与互联网电视潜在用户投诉相关的样本数据;
依据所述样本数据,获取FCM聚类模型的初始聚类中心;
优化所述FCM聚类模型的初始聚类中心;
迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数,所述聚类中心为两个聚类中心,分别对应互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类,所述模糊隶属度为各互联网电视用户隶属于互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类的概率;
依据所述模型参数,预测各互联网电视用户的投诉概率;
根据最大隶属度原则确定各互联网电视用户的预测投诉标识类别,所述预测投诉标识类别分为预测投诉类或预测不投诉类。
第二方面,本发明实施例提供了一种互联网电视潜在用户投诉预测装置,包括:
样本数据获取模块,获取与互联网电视潜在用户投诉相关的样本数据;
初始聚类中心获取模块,依据所述样本数据,获取FCM聚类模型的初始聚类中心;
优化模块,优化所述FCM聚类模型的初始聚类中心;
模型参数获取模块,迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数,所述聚类中心为两个聚类中心,分别对应互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类,所述模糊隶属度为各互联网电视用户隶属于互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类的概率;
预测投诉概率模块,依据所述模型参数,预测各互联网电视用户的投诉概率;
预测投诉标识类别确定模块,根据最大隶属度原则确定各互联网电视用户的预测投诉标识类别,所述预测投诉标识类别分为预测投诉类或预测不投诉类。
第三方面,本发明实施例提供了一种互联网电视潜在用户投诉预测设备,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时至少可以实现以下方法:
获取与互联网电视潜在用户投诉相关的样本数据;
依据所述样本数据,获取FCM聚类模型的初始聚类中心;
优化所述FCM聚类模型的初始聚类中心;
迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数,所述聚类中心为两个聚类中心,分别对应互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类,所述模糊隶属度为各互联网电视用户隶属于互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类的概率;
依据所述模型参数,预测各互联网电视用户的投诉概率;
根据最大隶属度原则确定各互联网电视用户的预测投诉标识类别,所述预测投诉标识类别分为预测投诉类或预测不投诉类。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当所述计算机程序指令被处理器执行时至少可以实现以下方法:
获取与互联网电视潜在用户投诉相关的样本数据;
依据所述样本数据,获取FCM聚类模型的初始聚类中心;
优化所述FCM聚类模型的初始聚类中心;
迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数,所述聚类中心为两个聚类中心,分别对应互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类,所述模糊隶属度为各互联网电视用户隶属于互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类的概率;
依据所述模型参数,预测各互联网电视用户的投诉概率;
根据最大隶属度原则确定各互联网电视用户的预测投诉标识类别,所述预测投诉标识类别分为预测投诉类或预测不投诉类。
本发明实施例提供的互联网电视潜在用户投诉预测方法、装置与设备及存储介质通过优化所述FCM聚类模型的初始聚类中心以及迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数,再通过模型参数预测各互联网电视用户的投诉概率,寻找潜在的投诉用户,力争将互联网电视投诉遏制在发生之前,降低用户投诉率,提高用户满意度。同时无需讨论用户投诉与影响投诉的关键指标的映射关系,对分析者的专业要求较低,便于技术的推广普及;摒弃了传统硬聚类限定隶属度只能为0或1的原则,用0到1之间的值来表征对象和子集之间的归属关系,更合理地描述出互联网电视用户和投诉标识类别(潜在投诉用户类或非潜在投诉用户类)的不确定关系。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施方式一的互联网电视潜在用户投诉预测方法的流程示意图。
图2示出了本发明实施方式二的互联网电视潜在用户投诉预测装置的结构示意图。
图3示出了本发明实施方式三的互联网电视潜在用户投诉预测设备的硬件结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
实施方式一
请参见图1,本发明实施例提供一种互联网电视潜在用户投诉预测方法,所述方法包括:
S1、获取与互联网电视潜在用户投诉相关的样本数据;
S2、依据所述样本数据,获取FCM聚类模型的初始聚类中心;
S3、优化所述FCM聚类模型的初始聚类中心;
S4、迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数,所述聚类中心为两个聚类中心,分别对应互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类,所述模糊隶属度为各互联网电视用户隶属于互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类的概率;
S5、依据所述模型参数,预测各互联网电视用户的投诉概率;
S6、根据最大隶属度原则确定各互联网电视用户的预测投诉标识类别,所述预测投诉标识类别分为预测投诉类或预测不投诉类。
所述样本数据包括:与互联网电视用户相关的用户侧数据、与互联网电视相关的设备侧数据。
所述用户侧数据包括:用户ID信息、用户收看节目开始时间、用户收看节目时长、用户收看节目名称和用户快进/快退/暂定操作情况信息。
所述设备侧数据包括:机顶盒运行数据和网络设备运行数据。
所述机顶盒运行数据包括:机顶盒内存利用率、机顶盒CPU利用率和响应请求时长;所述网络设备运行数据包含:互联网电视卡顿时长占比、二级CDN带宽利用率和组播媒体丢包率。
所述获取样本数据,所述样本数据包括:用户侧数据、设备侧数据的步骤还包括:对所述用户侧数据、设备侧数据进行预处理,剔除其中的无效数据、错误数据,并对所述用户侧数据、设备侧数据进行归一化处理。
具体来说,原始数据来源于客服支撑系统、机顶盒软探针和数据网管等,其中,用户侧数据包括用户ID信息、用户收看节目开始时间、用户收看节目时长、用户收看节目名称和用户快进/快退/暂定操作。机顶盒运行数据包括机顶盒内存利用率、机顶盒CPU利用率和响应请求时长。网络设备运行数据则包含互联网电视卡顿时长占比、二级CDN带宽利用率和组播媒体丢包率。根据投诉记录,若该用户在研究时段内投诉过,则对应的模型输出标记为1,反之,则为0。获取适度的样本数据量,如某个地市1800名用户的用户侧数据、机顶盒运行数据、对应网络设备运行数据和投诉标识(0或1),即可进行建模。此外,对原始数据进行常规的预处理,剔除其中的无效数据、错误数据等,同时,鉴于前三类样本数据中用户侧数据、机顶盒运行数据和网络设备运行数据的量纲大相径庭,故需在建模前,对此进行归一化处理。
优化所述FCM聚类模型的初始聚类中心,主要采用改进的量子蚁群算法来优化,这主要是在传统量子蚁群算法的基础上,改进了量子旋转角的更新策略,除了个体自身极值和全局最优极值,还引入了若干其它个体极值和全局中若干其它优秀个体极值,并通过加权平均的组合方式指导量子位的旋转角度更新,以克服局部收敛,增强全局搜素能力。采用改进的量子蚁群算法优化主要包括一下步骤:
量子编码,采用量子概率幅进行编码;
设种群中共有m只蚂蚁,随机分布在n维单位空间中,每只蚂蚁携带一组n维的量子比特,代表各自的位置,采用量子概率幅编码。
选择目标位置,具体包括:
令某只蚂蚁的当前位置为xr,当前位置处的信息素强度和启发式信息分别为τ(xr)和η(xs),信息素强度和启发式信息的权重分别为α和β,则该只蚂蚁的目标位置的确定规则为:
其中,q为(0,1)区间上均匀分布的随机数,q0是(0,1)之间的一个常数,X是蚁群在单位空间占据的点的集合,是按公式2选择的目标位置;
应用量子旋转门更新位置,令Pi的第k个量子位的概率幅为(αkk)T,则应用量子旋转门实施相位旋转后,该蚂蚁的位置更新为:
其中,Δθk是对应量子位的旋转角度;
按照如下公式确定旋转角的大小和方向:
Δθk=T1(Pk-Fk)+T2(P-Fk) (公式4)
式中,Pk是自身极值与若干个体极值的加权平均,P是全局中若干优秀个体极值的加权平均,Fk是当前个体的适应度值,T1和T2为权重系数;在公式4中,在旋转角度更新时,除了考虑个体自身极值和全局最优极值,还引入了若干其它个体极值和全局中若干其它优秀个体极值,并通过加权平均的组合方式指导量子位的旋转角度更新,以克服局部收敛,增强全局搜素能力。
进行量子非门变异;为了增加样本多样性,随机选择若干只蚂蚁(如种群规模的0.1倍数量的蚂蚁或者其它设定倍数量的蚂蚁)的若干量子位,通过施加量子非门变换,即概率幅互换,实现变异操作。
更新信息素强度及启发式信息。
所述更新信息素强度及启发式信息包括:局部更新信息素强度和局部更新启发式信息,具体如下:
设蚂蚁前一位置为xq,适应度函数为fit,则局部更新信息素强度和局部更新启发式信息的公式分别为:
Δfit=fit(xs)-fit(xr) (公式6)
其中,β1和β2都是0至1的常数。
所述更新信息素强度还包括:待所有蚂蚁完成本次迁移后,全局更新信息素强度,按照以下公式进行全局更新:
其中,0<ρ<1,表示当前最优解。
所述迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数的步骤包括:
以参数c作为类别数,初始时刻从样本数据中随机选取c个聚类中心对象,将样本数据余下的聚类中心对象按照预定的相似性度量方式与各个聚类中心对象计算隶属度,然后划分到与其隶属度最大的聚类中心对象为中心的簇中,重新计算每个新生成簇的质心和样本对新簇的隶属度,并计算由距离度量和模糊参数共同决定的目标函数;
评估所述目标函数;
判断是否达到所述终止条件,所述终止条件为重复上述模糊划分过程,直到所述目标函数值最小或通过FCM算法达到最大迭代次数。此外,还可通过对海量的互联网电视历史投诉数据和历史设备运行数据的训练,获得模型的关键参数,从而预测互联网电视用户在未来某时刻的投诉概率。
本发明实施例在模糊C均值(Fuzzy C-Means,FCM)聚类预测方法中引入改进的量子蚁群算法优化初始聚类中心,优化算法主要依赖于个体自身极值与若干其它个体极值的加权平均以及全局中若干优秀个体极值的加权平均进行量子旋转角更新,改善算法的收敛性,使之具有较强的全局搜索能力,避免FCM算法易陷入局部最优的缺点。
另外,本发明实施例在采用FCM算法预测潜在的互联网电视投诉用户时,将模型的输入确定为用户侧数据(即投诉数据)和设备侧数据,其中设备侧数据又包含机顶盒运行数据和网络设备运行数据,将模型的输出确定为互联网电视用户的投诉概率。模型的训练过程即是迭代计算关键参数——模糊聚类中心和模糊聚类隶属度的过程,所得的结果用以计算所预测的互联网电视用户隶属于潜在投诉用户类和非潜在投诉用户类的概率,并根据最大隶属度原则判断该用户为潜在投诉用户或非潜在投诉用户。
实验验证情况:
在实际应用过程中,相对比于普通的FCM方式,本发明实施例所提供的方法在命中率和查全率上优势较为明显。
命中率和查全率的定义如下:
其中,X2、Y1和Y2来自互联网电视用户投诉评价矩阵,依次为预测投诉且实际不投诉的互联网电视用户、预测不投诉且实际投诉的互联网电视用户以及预测投诉且实际投诉的互联网电视用户。
表1互联网电视用户投诉评价矩阵
基于相同样本数据,采用本发明实施例所提供的方案以及FCM方案进行了多次实验,对于命中率和查全率这两个指标,本发明实施例的预测结果和未经任何算法优化的FCM聚类模型的预测结果对比如下表2所示。
表2 FCM算法和改进的量子蚁群优化的FCM算法预测结果对比
通过以上实验结果验证,在采用改进的量子蚁群优化的FCM算法后,在命中率以及查全率方面相较于与传统的FCM算法提升了好几个百分点。由此可得,本发明实施例所提出的经过改进量子蚁群优化后的FCM 算法具有更好的全局寻优能力,能够更准确地预测出互联网电视投诉用户。
实施方式二
请参见图2,本发明实施例提供了一种互联网电视潜在用户投诉预测装置,包括:
样本数据获取模块10,获取与互联网电视潜在用户投诉相关的样本数据;
初始聚类中心获取模块20,依据所述样本数据,获取FCM聚类模型的初始聚类中心;
优化模块30,优化所述FCM聚类模型的初始聚类中心;
模型参数获取模块40,迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数,所述聚类中心为两个聚类中心,分别对应互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类,所述模糊隶属度为各互联网电视用户隶属于互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类的概率;
预测投诉概率模块50,依据所述模型参数,预测各互联网电视用户的投诉概率;
预测投诉标识类别确定模块60,根据最大隶属度原则确定各互联网电视用户的预测投诉标识类别,所述预测投诉标识类别分为预测投诉类或预测不投诉类。
所述样本数据包括:与互联网电视用户相关的用户侧数据、与互联网电视相关的设备侧数据。
所述用户侧数据包括:用户ID信息、用户收看节目开始时间、用户收看节目时长、用户收看节目名称和用户快进/快退/暂定操作情况信息。
所述设备侧数据包括:机顶盒运行数据和网络设备运行数据。
所述机顶盒运行数据包括:机顶盒内存利用率、机顶盒CPU利用率和响应请求时长;所述网络设备运行数据包含:互联网电视卡顿时长占比、二级CDN带宽利用率和组播媒体丢包率。
样本数据获取模块10还包括:预处理模块,对所述用户侧数据、设备侧数据进行预处理,剔除其中的无效数据、错误数据,并对所述用户侧数据、设备侧数据进行归一化处理。
优化模块30在采用改进的量子蚁群算法进行优化时,主要包括:
量子编码子模块,采用量子概率幅进行编码;
设种群中共有m只蚂蚁,随机分布在n维单位空间中,每只蚂蚁携带一组n维的量子比特,代表各自的位置,采用量子概率幅编码。
选择目标位置子模块,具体包括:
令某只蚂蚁的当前位置为xr,当前位置处的信息素强度和启发式信息分别为τ(xr)和η(xs),信息素强度和启发式信息的权重分别为α和β,则该只蚂蚁的目标位置的确定规则为:
其中,q为(0,1)区间上均匀分布的随机数,q0是(0,1)之间的一个常数,X是蚁群在单位空间占据的点的集合,是按公式2选择的目标位置;
应用量子旋转门更新位置子模块。
令Pi的第k个量子位的概率幅为(αkk)T,则应用量子旋转门实施相位旋转后,该蚂蚁的位置更新为:
其中,Δθk是对应量子位的旋转角度;
按照如下公式确定旋转角的大小和方向:
Δθk=T1(Pk-Fk)+T2(P-Fk) (公式4)
式中,Pk是自身极值与若干个体极值的加权平均,P是全局中若干优秀个体极值的加权平均,Fk是当前个体的适应度值,T1和T2为权重系数;在公式4中,在旋转角度更新时,除了考虑个体自身极值和全局最优极值,还引入了若干其它个体极值和全局中若干其它优秀个体极值,并通过加权平均的组合方式指导量子位的旋转角度更新,以克服局部收敛,增强全局搜素能力。
量子非门变异子模块;为了增加样本多样性,随机选择若干只蚂蚁 (如种群规模的0.1倍数量的蚂蚁或者其它设定倍数量的蚂蚁)的若干量子位,通过施加量子非门变换,即概率幅互换,实现变异操作。
更新信息素强度子模块及启发式信息子模块。
所述更新信息素强度子模块及启发式信息子模块包括:局部更新信息素强度单元和局部更新启发式信息单元,具体如下:
设蚂蚁前一位置为xq,适应度函数为fit,则局部更新信息素强度和局部更新启发式信息的公式分别为:
Δfit=fit(xs)-fit(xr) (公式6)
其中,β1和β2都是0至1的常数。
所述更新信息素强度单元还包括:待所有蚂蚁完成本次迁移后,全局更新信息素强度,按照以下公式进行全局更新:
其中,0<ρ<1,表示当前最优解。
上述模型参数获取模块40进一步包括:
目标函数获取单元,以参数c作为类别数,初始时刻从样本数据中随机选取c个聚类中心对象,将样本数据余下的聚类中心对象按照预定的相似性度量方式与各个聚类中心对象计算隶属度,然后划分到与其隶属度最大的聚类中心对象为中心的簇中,重新计算每个新生成簇的质心和样本对新簇的隶属度,并计算由距离度量和模糊参数共同决定的目标函数;
评估单元,评估所述目标函数;
判断单元,判断是否达到所述终止条件,所述终止条件为重复上述模糊划分过程,直到所述目标函数值最小或通过FCM算法达到最大迭代次数。
实施方式三
另外,结合图1描述的本发明实施例的互联网电视潜在用户投诉预测方法可以由互联网电视潜在用户投诉预测设备来实现。图3示出了本发明实施例提供的互联网电视潜在用户投诉预测设备的硬件结构示意图。
互联网电视潜在用户投诉预测设备可以包括处理器401以及存储有计算机程序指令的存储器402。
具体地,上述处理器401可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus, USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器402可在数据处理装置的内部或外部。在特定实施例中,存储器402是非易失性固态存储器。在特定实施例中,存储器402包括只读存储器 (ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程 ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM (EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现上述实施例中的任意一种互联网电视潜在用户投诉预测方法。
在一个示例中,互联网电视潜在用户投诉预测设备还可包括通信接口 403和总线410。其中,如图3所示,处理器401、存储器402、通信接口 403通过总线410连接并完成相互间的通信。
通信接口403,主要用于实现本发明实施例中各模块、装置、单元和/ 或设备之间的通信。
总线410包括硬件、软件或两者,将互联网电视潜在用户投诉预测设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口 (AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线 (FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件 (SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线410可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该互联网电视潜在用户投诉预测设备可以基于获取到待测小区的网管性能指标,执行本发明实施例中的互联网电视潜在用户投诉预测方法,从而实现结合图2描述的互联网电视潜在用户投诉预测方法。
另外,结合上述实施例中的互联网电视潜在用户投诉预测方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种互联网电视潜在用户投诉预测方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、 ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (11)

1.一种互联网电视潜在用户投诉预测方法,其特征在于,所述方法包括:
获取与互联网电视潜在用户投诉相关的样本数据;
依据所述样本数据,获取FCM聚类模型的初始聚类中心;
优化所述FCM聚类模型的初始聚类中心;
迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数,所述聚类中心为两个聚类中心,分别对应互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类,所述模糊隶属度为各互联网电视用户隶属于互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类的概率;
依据所述模型参数,预测各互联网电视用户的投诉概率;
根据最大隶属度原则确定各互联网电视用户的预测投诉标识类别,所述预测投诉标识类别分为预测投诉类或预测不投诉类。
2.根据权利要求1所述的互联网电视潜在用户投诉预测方法,其特征在于,所述样本数据包括:与互联网电视用户相关的用户侧数据和与互联网电视相关的设备侧数据。
3.根据权利要求2所述的互联网电视潜在用户投诉预测方法,其特征在于,所述用户侧数据包括:用户ID信息、用户收看节目开始时间、用户收看节目时长和用户收看节目名称和用户快进/快退/暂定操作情况信息。
4.根据权利要求3所述的互联网电视潜在用户投诉预测方法,其特征在于,所述设备侧数据包括:机顶盒运行数据和网络设备运行数据。
5.根据权利要求4所述的互联网电视潜在用户投诉预测方法,其特征在于,所述机顶盒运行数据包括:机顶盒内存利用率和机顶盒CPU利用率和响应请求时长;所述网络设备运行数据包含:互联网电视卡顿时长占比、二级CDN带宽利用率和组播媒体丢包率。
6.根据权利要求2所述的互联网电视潜在用户投诉预测方法,其特征在于,所述获取与互联网电视潜在用户投诉相关的样本数据,包括:
对所述用户侧数据、所述设备侧数据进行预处理,剔除其中的无效数据和错误数据,并对所述用户侧数据和所述设备侧数据进行归一化处理。
7.根据权利要求1至6任一项所述的互联网电视潜在用户投诉预测方法,其特征在于,所述优化所述FCM聚类模型的初始聚类中心,包括:
采用改进的量子蚁群算法优化所述FCM聚类模型的初始聚类中心。
8.根据权利要求1所述的互联网电视潜在用户投诉预测方法,其特征在于,所述迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数,包括:
以参数c作为类别数,初始时刻从样本数据中随机选取c个聚类中心对象,将样本数据余下的聚类中心对象按照预定的相似性度量方式与各个聚类中心对象计算隶属度,然后划分到与其隶属度最大的聚类中心对象为中心的簇中,重新计算每个新生成簇的质心和样本对新簇的隶属度,并计算由距离度量和模糊参数共同决定的目标函数;
评估所述目标函数;
判断是否达到所述终止条件,所述终止条件为重复上述模糊划分过程,直到所述目标函数值最小或通过FCM算法达到最大迭代次数。
9.一种互联网电视潜在用户投诉预测装置,其特征在于,包括:
样本数据获取模块,获取与互联网电视潜在用户投诉相关的样本数据;
初始聚类中心获取模块,依据所述样本数据,获取FCM聚类模型的初始聚类中心;
优化模块,优化所述FCM聚类模型的初始聚类中心;
模型参数获取模块,迭代计算聚类中心和模糊隶属度直至终止条件,获得模型参数,所述聚类中心为两个聚类中心,分别对应互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类,所述模糊隶属度为各互联网电视用户隶属于互联网电视潜在投诉用户类和互联网电视非潜在投诉用户类的概率;
预测投诉概率模块,依据所述模型参数,预测各互联网电视用户的投诉概率;
预测投诉标识类别确定模块,根据最大隶属度原则确定各互联网电视用户的预测投诉标识类别,所述预测投诉标识类别分为预测投诉类或预测不投诉类。
10.一种互联网电视潜在用户投诉预测设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-8中任一项所述的方法。
11.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-8中任一项所述的互联网电视潜在用户投诉预测方法。
CN201711489234.7A 2017-12-30 2017-12-30 互联网电视潜在用户投诉预测方法、装置及设备 Pending CN109993555A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711489234.7A CN109993555A (zh) 2017-12-30 2017-12-30 互联网电视潜在用户投诉预测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711489234.7A CN109993555A (zh) 2017-12-30 2017-12-30 互联网电视潜在用户投诉预测方法、装置及设备

Publications (1)

Publication Number Publication Date
CN109993555A true CN109993555A (zh) 2019-07-09

Family

ID=67110509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711489234.7A Pending CN109993555A (zh) 2017-12-30 2017-12-30 互联网电视潜在用户投诉预测方法、装置及设备

Country Status (1)

Country Link
CN (1) CN109993555A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766696A (zh) * 2019-10-10 2020-02-07 重庆第二师范学院 一种基于改进的粗糙集聚类算法的卫星图像分割方法
CN111047425A (zh) * 2019-11-25 2020-04-21 中国联合网络通信集团有限公司 一种行为预测方法及装置
CN113645051A (zh) * 2020-04-23 2021-11-12 亚信科技(中国)有限公司 一种对客户投诉进行预警的方法及装置
CN114915845A (zh) * 2021-12-28 2022-08-16 天翼数字生活科技有限公司 预测iptv用户申告的系统和方法
CN115134260A (zh) * 2022-07-12 2022-09-30 北京东土拓明科技有限公司 用户感知提升方法及装置、计算设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1928905A (zh) * 2006-07-21 2007-03-14 北京航空航天大学 企业危机预警系统
CN103945238A (zh) * 2014-05-07 2014-07-23 北京邮电大学 一种基于用户行为的社区探测方法
CN105701554A (zh) * 2014-11-28 2016-06-22 国家电网公司 基于海量计量数据的用电设备能效混沌分析方法
CN105894024A (zh) * 2016-03-29 2016-08-24 合肥工业大学 多重核的可能性模糊聚类算法
CN107451622A (zh) * 2017-08-18 2017-12-08 长安大学 一种基于大数据聚类分析的隧道运营状态划分方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1928905A (zh) * 2006-07-21 2007-03-14 北京航空航天大学 企业危机预警系统
CN103945238A (zh) * 2014-05-07 2014-07-23 北京邮电大学 一种基于用户行为的社区探测方法
CN105701554A (zh) * 2014-11-28 2016-06-22 国家电网公司 基于海量计量数据的用电设备能效混沌分析方法
CN105894024A (zh) * 2016-03-29 2016-08-24 合肥工业大学 多重核的可能性模糊聚类算法
CN107451622A (zh) * 2017-08-18 2017-12-08 长安大学 一种基于大数据聚类分析的隧道运营状态划分方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
代晓菊: ""基于数据挖掘的电信LTE用户上网数据的用户流失算法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
李盼池等: ""基于相位编码的量子蚁群算法"", 《系统工程理论与实践》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766696A (zh) * 2019-10-10 2020-02-07 重庆第二师范学院 一种基于改进的粗糙集聚类算法的卫星图像分割方法
CN111047425A (zh) * 2019-11-25 2020-04-21 中国联合网络通信集团有限公司 一种行为预测方法及装置
CN111047425B (zh) * 2019-11-25 2023-10-24 中国联合网络通信集团有限公司 一种行为预测方法及装置
CN113645051A (zh) * 2020-04-23 2021-11-12 亚信科技(中国)有限公司 一种对客户投诉进行预警的方法及装置
CN113645051B (zh) * 2020-04-23 2024-04-12 亚信科技(中国)有限公司 一种对客户投诉进行预警的方法及装置
CN114915845A (zh) * 2021-12-28 2022-08-16 天翼数字生活科技有限公司 预测iptv用户申告的系统和方法
CN115134260A (zh) * 2022-07-12 2022-09-30 北京东土拓明科技有限公司 用户感知提升方法及装置、计算设备和存储介质

Similar Documents

Publication Publication Date Title
CN109993555A (zh) 互联网电视潜在用户投诉预测方法、装置及设备
Yang et al. On designing data quality-aware truth estimation and surplus sharing method for mobile crowdsensing
Medina et al. Traffic matrix estimation: Existing techniques and new directions
CN109597844B (zh) 基于深度神经网络与图网络的核心用户挖掘方法及系统
CN103198161B (zh) 微博水军识别方法与设备
US20110082821A1 (en) Method of generating precedence-preserving crossover and mutation operations in genetic algorithms
CN110333991B (zh) 云平台任务最大资源使用率预测方法
CN109741177A (zh) 用户信用的评估方法、装置及智能终端
CN108876076A (zh) 基于指令数据的个人信用评分方法及装置
CN109635990A (zh) 一种训练方法、预测方法、装置及电子设备
CN105556558A (zh) 订货量确定设备、订货量确定方法、记录介质和订货量确定系统
CN111459657B (zh) 一种基于边缘协助的数据质量感知的任务分配方法
Wang et al. Acceptance-aware mobile crowdsourcing worker recruitment in social networks
Yu et al. F-MOGP: A novel many-objective evolutionary approach to QoS-aware data intensive web service composition
CN112328865A (zh) 信息处理和推荐方法、装置、设备及存储介质
Silaghi et al. A utility-based reputation model for service-oriented computing
CN115809280A (zh) 一种群租房识别及迭代识别方法
CN114661463A (zh) 基于bp神经网络的系统资源预测方法及系统
CN113808287A (zh) 一种停车场分区域计时计费的管理方法及系统
CN114492552A (zh) 宽带用户真实性判断模型的训练方法、装置及设备
Imamura et al. Analysis of the features and structure behind availability in blockchain using altcoin
CN101021837A (zh) 特征相关互助式统计分析方法
Saleem et al. Personalized decision making for QoS-based service selection
Deng et al. Optimal Two-Tier Outpatient Care Network Redesign With a Real-World Case Study of Shanghai
Volf A stochastic model of progression of athletic records

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190709

RJ01 Rejection of invention patent application after publication