CN113033909A - 携转用户分析方法、装置、设备及计算机存储介质 - Google Patents

携转用户分析方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN113033909A
CN113033909A CN202110379811.7A CN202110379811A CN113033909A CN 113033909 A CN113033909 A CN 113033909A CN 202110379811 A CN202110379811 A CN 202110379811A CN 113033909 A CN113033909 A CN 113033909A
Authority
CN
China
Prior art keywords
user
data
carrying
users
transfer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110379811.7A
Other languages
English (en)
Inventor
陈向前
贾磊
徐益帅
张亚男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Shanxi Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Shanxi Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Shanxi Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202110379811.7A priority Critical patent/CN113033909A/zh
Publication of CN113033909A publication Critical patent/CN113033909A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开实施例公开了一种携转用户分析方法、装置、设备及计算机存储介质。其方法能够从获取的历史业务数据中,基于用户属性聚类得到对应的多维度特征分类数据,然后根据多维度特征分类数据,通过决策树算法对相应用户的行为特征信息进行加权处理,得到携转用户特征数据输入到循环神经网络进行训练,以得到携转用户的分析模型用于对单个用户进行携转预测。本实施例可以对全部属性用户进行分拣,筛选出已携转用户的多维度特征分类数据,再通过决策树进一步筛选出符合携转相关特征的用户数据,再用于训练循环神经网络,利于得到精确的分析模型,继而用于携转用户的预测识别,得到更为准确有效的识别结果,以利于对应投放资源,提高客户挽留成功率。

Description

携转用户分析方法、装置、设备及计算机存储介质
技术领域
本公开属于大数据技术领域,尤其涉及一种携转用户分析方法、装置、设备及计算机存储介质。
背景技术
携转用户即携号转网用户。携号转网又称号码携带,是指用户从一家运营商转到另外一家运营商时,不更换号码就能享受转入的运营商所开展的各种业务和服务。
随着用户携转模式的开启,同质化竞争加剧,客户需求升级,资源精准投放有待提升,各运营商企业均面临携转意向投诉用户满意度提升、携转意向用户关怀修复的压力。然而目前业界缺乏有效的携转预测工具,使得对有携转意向的目标客户识别、问题定位等均不够准确,导致用户挽留成功率低。
发明内容
本公开实施例提供一种携转用户分析方法、装置、设备及计算机存储介质,能够实现对携转风险用户的精准识别。
一方面,本公开实施例提供一种携转用户分析方法,方法包括:
从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据;用户属性至少包括已携转用户属性和未携转用户属性;
根据已携转用户属性对应的多维度特征分类数据,通过决策树算法对相应用户的行为特征信息进行加权处理,得到携转用户特征数据;
通过携转用户特征数据,对循环神经网络进行训练,以得到携转用户的分析模型;
将待分析用户的业务数据输入分析模型,进行携转预测。
在一些实施例中,从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据,包括:
根据获取的历史业务数据,识别出已携转用户和未携转用户,并提取对应用户的行为特性信息;
将行为特性信息进行相关性算法检验,得到用户属性的影响因子;
根据用户属性的影响因子,将对应用户的行为特性信息按照预设的多个维度进行聚类,得到多维度特征分类数据。
在一些实施例中,在将行为特性信息进行相关性算法检验,得到用户属性的影响因子之后,方法还包括:
对用户属性的影响因子按照权重赋值;
删除权重低于预设影响阈值的影响因子。
在一些实施例中,根据已携转用户属性对应的多维度特征分类数据,通过决策树算法对相应用户的行为特征信息进行加权处理,得到携转用户特征数据,包括:
将已携转用户属性对应的多维度特征分类数据中的行为特征信息,按照预设的标签规则识别为显性标签和/或隐性标签;
根据已携转用户属性对应的每个用户的显性标签和/或隐性标签,生成对应用户的决策树;
按照预设的权值评价规则,确定决策树中的各节点数据项的权值;
将决策树各节点数据项的权值进行累乘后,删除累乘结果小于预设评价阈值的用户,得到包含携转用户特征数据的数据库。
在一些实施例中,通过携转用户特征数据,对循环神经网络进行训练,以得到携转用户的分析模型,包括:
将携转用户特征数据按照单个用户,形成样本数据,输入到循环神经网络中进行携转客户识别,并得到第一携转概率;
对第一携转概率进行验证,并在验证结果未达到预设匹配度时,利用预设的校准阈值,对输入到循环神经网络进行校准;并且
当验证结果达到预设匹配度后,得到携转用户的分析模型。
在一些实施例中,在将待分析用户的业务数据输入分析模型,进行携转预测之后,方法还包括:
通过分析模型进行携转预测后,输出对应用户的第二携转概率;
根据预设的携转概率与营销策略的映射关系,输出第二携转概率对应的营销策略。
在一些实施例中,在从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据之前,方法还包括:
从运营侧数据域和业务侧数据侧获取历史业务数据。
另一方面,本公开实施例提供了一种携转用户分析装置,装置包括:
聚类模块,用于从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据;用户属性至少包括已携转用户属性和未携转用户属性;
决策模块,用于根据已携转用户属性对应的多维度特征分类数据,通过决策树算法对相应用户的行为特征信息进行加权处理,得到携转用户特征数据;
训练模块,用于通过携转用户特征数据,对循环神经网络进行训练,以得到携转用户的分析模型;
预测模块,用于将待分析用户的业务数据输入分析模型,进行携转预测。
再一方面,本公开实施例提供了一种携转用户分析设备,其特征在于,设备包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现如上述任意一实施例的携转用户分析方法。
再一方面,本公开实施例提供了一种计算机存储介质,其特征在于,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如上述任意一实施例的携转用户分析方法。
本公开实施例的携转用户分析方法、装置、设备及计算机存储介质,能够从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据,然后根据已携转用户属性对应的多维度特征分类数据,通过决策树算法对相应用户的行为特征信息进行加权处理,得到携转用户特征数据输入到循环神经网络进行训练,以得到携转用户的分析模型用于对单个用户进行携转预测。这样可以对全部属性用户进行分拣,筛选出已携转用户的多维度特征分类数据进行后续处理,再通过决策树进一步筛选出符合携转相关特征的用户数据,再用于训练循环神经网络,利于得到精确的分析模型,继而用于携转用户的预测识别,得到更为准确有效的识别结果,以利于对应投放资源,提高客户挽留成功率。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对本公开实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本公开一个实施例提供的携转用户分析方法的流程示意图;
图2A是本公开另一个实施例提供的携转用户分析方法的流程示意图;
图2B是图2A所示步骤S210在一个示例中的流程示意图;
图3A是图2A所示步骤S220在一个示例中的流程示意图;
图3B是图3A所示步骤的数据聚类示意图;
图4A是图2A所示步骤S230在一个示例中的流程示意图;
图4B是图4A所示步骤S420在一个示例中形成的决策树示意图;
图5A是图2A所示步骤S240在一个示例中的流程示意图;
图5B是图5A所示步骤的模型训练示意图;
图6是本公开又一示例中形成的用户年龄聚类单项分析图表;
图7是本公开又一个实施例提供的携转用户分析装置的结构示意图;
图8是本公开又一个实施例提供的携转用户分析设备的结构示意图。
具体实施方式
下面将详细描述本公开的各个方面的特征和示例性实施例,为了使本公开的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本公开进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本公开,而不是限定本公开。对于本领域技术人员来说,本公开可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本公开的示例来提供对本公开更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对携号转网的意向用户定位时,往往主要通过用户投诉、前台用户携转咨询及聚类预测等方式,这几种用户定位方式存在以下弊端:
(1)对于用户投诉或携转咨询等行为的定位方式:用户通过营业厅或客服电话(如10086)等前台客服进行投诉或咨询时,提出有携转意向或咨询行为的,判定为携转意向用户。这种方式一般只能识别带有主观强烈携出意识的用户,如因网络、资费、宽带等因素造成用户满意度差继而导致产生携转意向的用户。仅通过用户投诉和咨询进行判断,既无法预先定位客户,也无法先于用户发现和解决问题,客户挽留成功率低。
(2)对于聚类分析预测:通过对携出用户属性分析,汇聚包括年龄、网龄、资费和投诉等基础信息,结合相关性算法得出权重因子,确定影响携转用户的主要因素,基于这些具有携转影响的因素对现网携转风险用户进行预识别。这种预测定位方式无法精准评估携转意向用户,且未将普通用户与携转风险用户进行区分和对比分析,预测用户体量大,市场需要投入大量宣传成本进行用户挽留,整体分析效率及预测准确率低。
随着号码的所有权从运营商转移到用户手中,各运营商企业之间的竞争更为激烈,同质化竞争加剧,用户体验需求升级,资源精准投放亟待提升。在降本增效的背景下,如何高效、精准的识别携转风险用户、提高市场、网络资源精准投放能力,增加客户粘滞性以及提高用户体验都是运营企业在用户维护工作中需要解决的问题。然而由于上述采用的携转意向用户定位方法的缺陷,无法准确、有效定位携转风险用户以及携转影响因素,导致用户维护工作开展难度大且效率低。
为了解决上述技术问题,本公开实施例提供了一种携转用户分析方法、装置、设备及计算机存储介质。下面首先对本公开实施例所提供的携转用户分析方法进行介绍。
图1示出了本公开一个实施例提供的携转用户分析方法的流程示意图。如图1所示,该方法包括:
S110.从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据;用户属性至少包括已携转用户属性和未携转用户属性;
S120.根据已携转用户属性对应的多维度特征分类数据,通过决策树算法对相应用户的行为特征信息进行加权处理,得到携转用户特征数据;
S130.通过携转用户特征数据,对循环神经网络进行训练,以得到携转用户的分析模型;
S140.将待分析用户的业务数据输入分析模型,进行携转预测。
本实施例方法中,采集历史业务数据后通过步骤S110用于不同用户属性的用户分拣和行为特征提取,可实现基于多维度特征分类识别的用户特征刻画,利于对影响客户携转的维度做到精准识别,继而精确判定客户携转的问题原因,进行差异化挽留策略应对。然后通过步骤S120在得到已携转用户的多维度特征分类数据后,通过决策树算法对用户的行为特征信息进行加权处理,可以实现进一步对忠诚及无风险用户进行数据清洗,减小内存开销,保障机器学习进行对比分析的准确率及模型数据库的标准化及适应性。在模型训练过程中,通过步骤S130和S140可从多维度、结合历史数据进行循环智能训练校准,以实现单用户携转的预测。
图2A示出了根据本公开另一实施例的携转用户分析方法的示意性流程图。如图2A所示,步骤S220在从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据之前,该方法还包括:
S210.从运营侧数据域和业务侧数据侧获取历史业务数据。
在步骤S210中,主要从OSS(Operation Support Systems,即运行支持系统)、BSS(Business Support Systems,业务支撑系统)采集长历时用户基本信息、捆绑行为、消费行为、交往圈、投诉情况、归属集团信息、宽带业务等业务统计数据,并对上述几部分数据进行预处理。
示例性的,如图2B所示,本实施例中步骤S210.可以包括:
S211.采集B侧(即BSS业务侧数据域)数据,例如获取用户基本信息、在网信息、订购信息、合约信息、合约解除信息、投诉信息等数据。
S212.采集O侧(即OSS运营侧数据域)数据,例如获取用户语音业务常驻小区、数据业务常驻小区、数据感知情况、语音感知情况等数据。
S213.对以上采集的数据进行单用户整合和预处理,并存储在数据库中。
S214.输出可用于分析应用的数据格式,储存在数据库中。
本步骤中,通过对B侧和O侧的数据基于单用户整合,可得到单用户的用户基本信息、捆绑行为、消费行为、交往圈、投诉情况、归属集团信息、宽带业务等历史业务数据。
由于用户离网有多方面原因,故而本实施例中基于获取的上述历史业务数据,可以对历史离网用户进行多维度的用户行为特征提取,根据用户基本信息、捆绑行为、消费行为、交往圈、投诉情况、归属集团信息、宽带业务等多种信息中包含的累计达68个字段输入,最终取影响携出较大因素的特征,并按权重赋值,进行用户特征刻画,对影响因子极低的特征因子进行清洗,然后对用户分类统计,建立分类模型,提升工作效率及模型训练准确率,实现目标客户分拣。
本实施例中,用户属性至少包括已携转用户属性和未携转用户属性。从获取的历史业务数据中,基于上述两种用户属性提取对应用户的行为特征信息,然后针对两种用户属性进行用户行为特征信息聚类,得到对应用户属性的多维度特征分类数据。
示例性的,如图3A所示,步骤S220具体可以包括:
S310.根据获取的历史业务数据,识别出已携转用户和未携转用户,并提取对应用户的行为特性信息。
参考图3B,通过对历史业务数据的识别,可实现已携转和未携转的用户分拣,对两种不同用户属性对应的历史业务数据进行行为特征提取和聚类,用于后续的模型训练时,可以将有携转风险的用户从普通用户中区分开来。
由于本实施例主要获取已携转用户的行为特征信息,因此后续的聚类处理可以只对已携转用户属性进行。
S320.将上述行为特性信息进行相关性算法检验,得到用户属性的影响因子。本步骤的一个可选示例为:
通过对已携转用户近6个月的用户基础信息、在网信息、订购信息、合约信息、通信信息、体验信息等约68项数据进行相关性算法检验,识别影响用户携转的影响因素。
又一可选示例中,在将行为特性信息进行相关性算法检验,得到用户属性的影响因子之后,本方法还可以包括
S330.对用户属性的影响因子按照权重赋值;并删除权重低于预设影响阈值的影响因子。
根据输出的用于携转影响因子进行权重赋值,权重赋值可以根据预设的经验值确定,例如投诉次数的权重值设为11.7,发生欠费的权重值设置为7.5,WLAN用户的权重值设为0.01,月均流量的权重值设置为0.01等。
将用户属性的影响因子按照权重值由大到小的相对比较方式,进行影响因子的主因、辅因信息识别,将权重值较高的影响因子列为主因,权重值较低的列为辅因,无权重或权重值极低(如0或0.01)的影响因子进行清洗丢弃。其中需要清洗丢弃的权重值阈值(即上述影响阈值)可以预先自行设置。这样可以通过按权重赋值,筛查出用户携转的主因、辅因,并做第一次用户清洗,对低影响因子指标进行剔除,利于实现目标用户精确分拣。
S340.根据用户属性的影响因子,将对应用户的行为特性信息按照预设的多个维度进行聚类,得到多维度特征分类数据。本步骤的一个可选示例为:
预设的多个维度额可以包括网络、宽带、资费、触达、集团以及其他这六个维度进行聚类,得到网络风险、宽带风险、资费风险、触达风险、集团风险以及其他风险的六维度特征分类数据。
其中网络风险可以包括:是否弱覆盖、是否感知差、是否网络投诉等行为特征信息;
宽带风险可以包括:是否异网宽带业务、是否退订宽带业务、是否有宽带业务投诉等行为特征信息;
资费风险可以包括:是否超套用户、近三个月是否转低套餐、近1-3个月ARPU值等行为特征信息;
触达风险可以包括:近三个月与异网10000/10010通话次数、异网通话次数占比、top10交往圈中竞争对手号码占比等行为特征信息;
集团风险可以包括:集团统付客户、集团单位无信息化产品签约客户等信息;
其他风险可以包括:性别、在网时长等等信息。
通过上述的六维度特征分类数据形成的分类模型,可以细化分析携转用户的影响因子,以此作为分析模型的训练基础时,可以对影响用户携转的维度做到精准识别,可以精确判定用户携转的问题原因,以利于进行差异化挽留策略应对。
为了进一步精准识别携转风险用户及优化分析模型,本实施例方法对用户多维度特征分类数据中,识别用户显性、隐性标签,基于决策树算法对不具备条件的用户评分,每个标签决策权值进行累乘计算,进行二次清洗,达到预设条件的用户保留,未到达预设条件的用户剔除,实现用户二次筛选,建立携转用户特征数据库,提升风险用户机器学习准确性。
示例性的,如图4A所示,步骤S230具体可以包括:
S410.将已携转用户属性对应的多维度特征分类数据中的行为特征信息,按照预设的标签规则识别为显性标签和/或隐性标签。
以已携转用户属性对应的多维度特征分类数据为数据基础,将其中各用户的维度指标(即各维度包含的行为特性信息)按照预设的标签规则进行标签化。标签包括显性标签,即对应表现为“是”的行为特征,例如近3月内突转低套餐、投诉突增、拨打10086/10000/10010突增、资费陡降、捆绑业务退订等。标签还包括隐性标签,即对应表现为“否”的行为特征,例如近3个月持续套餐低、合约未到期、捆绑业务持续未退订等。
S420.根据已携转用户属性对应的每个用户的显性标签和/或隐性标签,生成对应用户的决策树。
如图4B所示,针对每个标签,生成一个决策树的节点数据项,最终生成连续的决策树,采用投票选举的方式输出用户特征因子。
S430.按照预设的权值评价规则,确定决策树中的各节点数据项的权值。其中权值评价规则可以根据经验设置各节点数据项的权值。
S440.将决策树各节点数据项的权值进行累乘后,删除累乘结果小于预设评价阈值的用户,得到包含携转用户特征数据的数据库。
通过识别的用户显性/隐性标签,结合决策树确定用户行为特征信息的权值,依照标签逐项决策打分。每项打分结果进行累乘,最终得到单用户的决策树累乘结果。预设一个评价阈值,当累乘结果满足该评价阈值时,输出结果为“1”,否则为“0”。然后对结果为“0”的用户进行清洗,保留的用户和用户数据建立携转用户特征库,实现用户二次筛选,进一步对忠诚及无风险用户进行数据清洗,减小内存开销,用于后续的模型训练,保障机器学习进行对比分析的准确率及模型数据库的标准化及适应性。
本实施例给出的一个可选示例中,实现用户的携转风险预测,通过确定最终用户的携转概率。故而结合用户多维度特征分类数据的标签、权重因子,并通过历史数据的智能训练,计算每个标签的概率得分,累加后输出该用户携转概率,输出基于携转概率优先级的携转目标用户列表,实现用户精准识别。
本示例中,如图5A所示,步骤S240具体可以包括:
S510.将携转用户特征数据按照单个用户,形成样本数据,输入到循环神经网络中进行携转客户识别,并得到第一携转概率。
本示例中,每个维度特征分类数据即一类行为特征信息的组合,由多维特征分类数据标签化得到的携转用户特征数据库,可以按照单个用户形成训练样本输入到预设的循环神经网络中,对循环神经网络进行训练。
循环神经网络由输入层、隐藏层和输出层组成,通过样本数据对循环神经网络中经过一轮训练后,得到第一携转概率。
S520.对第一携转概率进行验证,并在验证结果未达到预设匹配度时,利用预设的校准阈值,对输入到循环神经网络进行校准;并且
S530.当验证结果达到预设匹配度后,得到携转用户的分析模型。
如图5B所示的循环神经网络训练过程可以包括:
用户分析预测的过程是基于RNN循环智能算法进行用户属性权值W进行计算的过程,RNN循环智能算法能够拟合函数基于大数据训练,循环模型由输入层、隐藏层和输出层组成,将模型训练好之后,在输入层给定一个参数x,通过该网络之后就能够在输出层得到特定的参数X,RNN有记忆功能,它的输出不仅依赖与当前输入,还依赖与当前的记忆,能够处理输入之间前后关联的问题。
首先通过历史数据得到的携转用户特征数据对循环神经网络中对应的用户属性阈值进行训练校准。校准过程中,神经网络会对携转用户特征数据得到的用户属性阈值识别,识别出正常用户(即未携转用户)和携转用户,继而得到第一携转概率。由于历史数据的携转概率是已知的,因此用该已知的携转概率对第一携转概率进行对比验证计算。当验证计算得到的匹配度不符合预设的匹配度阈值时,通过预设的校准阈值对本轮训练中的用户属性阈值校准,计算得到一个阈值校准值作为第二阈值反馈到用户属性阈值,校正该用户属性阈值。
直至第一携转概率的验证结果达到预设匹配度阈值后,分析模型训练完成,循环神经网络会根据输入值输出对应的用户最终权值。
本实施例中,步骤S250.将待分析用户的业务数据输入分析模型,进行携转预测。
根据将待分析用户自身属对应的行为特征信息,输入到循环神经网络的输入层,进行基于RNN循环智能算法的携转用户属性权值计算,在循环神经网络中各层之间先进行单项行为特征信息的权值计算,最后各项权值进行多次累加后输出用户最终权值W,以此计算每个将待分析用户携转概率的结果。每个将待分析用户的携转概率最终以概率值高低来确定用户转化的优先级,输出的基于携转概率优先级的用户列表。即携转概率高的用户,携转风险高,反之携转风险低。
以用户年龄为例,汇聚历史数据聚类统计分析,携转用户年龄分段如图6所示:
年龄在30-34岁的客户携转数最多,以此为基础,如客户年龄在46岁时,则输出此用户年龄单项得分为0.7835。
计算用户携转概率时,历时业务数据经过用户清洗、机器学习智能训练计算结果,形成单用户转化成功概率得分。如表1所示,通过三个月预测数据分析,共识别风险携转风险用户162.96万,预测携转用户21215户,实际携转用户22306,模型查全率达到95.11%,从计算结果可以看出,携转概率得分在0.9-1之间用户预测准确率达到80.48%,识别准确率较高,随着概率分段降低,客户携转预测准确率逐渐降低。
表1
概率分段 预测风险用户 携转用户 预测准确率
0.9-1 456 367 80.48%
0.8-0.9 1136 716 63.03%
0.7-0.8 3573 1467 41.06%
0.6-0.7 8947 2236 24.99%
0.5-0.6 28436 2951 10.38%
0.4-0.5 64362 3243 5.04%
0.3-0.4 162655 3512 2.16%
0.2-0.3 268616 2845 1.06%
0.1-0.2 424134 2236 0.53%
0-0.1 667294 1642 0.25%
通过对上述分析结果的汇聚,对每个用户生成转化概率,自动生成分析结果,并形成基于转化概率的用户开户列表,推送进行开户。
在一些实施例中,在将待分析用户的业务数据输入分析模型,进行携转预测之后,方法还包括:
通过分析模型进行携转预测后,输出对应用户的第二携转概率(也即上述待分析用户的携转概率);
根据预设的携转概率与营销策略的映射关系,输出第二携转概率对应的营销策略。
根据输出的用户携转概率,分析用户是否具备携转条件及用户携转风险等级,并存储在服务器上。后续客户端访问服务器后,可以获取相应的分析结果,得到用户的携转预测结果,利于在用户产生强烈携转意向之前定位用户,进行对应的挽留策略,提高用户满意度。还可以对具备携转高风险的用户自动输出带有用户转化概率的推送列表,根据预置营销参考方案自动对应输出高风险用户及相应参考方案等,实现高效、准确的用户u定位的同时,可以实现资源精准投放。
图7示出了本公开又一实施例提供的一种携转用户分析装置,装置包括:
聚类模块701,用于从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据;用户属性至少包括已携转用户属性和未携转用户属性;
决策模块702,用于根据已携转用户属性对应的多维度特征分类数据,通过决策树算法对相应用户的行为特征信息进行加权处理,得到携转用户特征数据;
训练模块703,用于通过携转用户特征数据,对循环神经网络进行训练,以得到携转用户的分析模型;
预测模块704,用于将待分析用户的业务数据输入分析模型,进行携转预测。
示例性的,聚类模块701可以执行上述图1中示出的步骤S110,决策模块702可以执行上述图1中示出的步骤S120,训练模块703可以执行上述图1中示出的步骤S130,预测模块704可以执行上述图1中示出的步骤S140。
需要说明的是,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
图8示出了本公开实施例提供的携转用户分析设备的硬件结构示意图。
携转用户分析设备可以包括处理器801以及存储有计算机程序指令的存储器802。
具体地,上述处理器801可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本公开实施例的一个或多个集成电路。
存储器802可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器802可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器802可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器802可在综合网关容灾设备的内部或外部。在特定实施例中,存储器802是非易失性固态存储器。通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器801通过读取并执行存储器802中存储的计算机程序指令,以实现上述实施例中的任意一种携转用户分析方法。
在一个示例中,携转用户分析设备还可包括通信接口803和总线810。其中,如图8所示,处理器801、存储器802、通信接口803通过总线810连接并完成相互间的通信。
通信接口803,主要用于实现本公开实施例中各模块、装置、单元和/或设备之间的通信。
总线810包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线810可包括一个或多个总线。尽管本公开实施例描述和示出了特定的总线,但本公开考虑任何合适的总线或互连。
另外,结合上述实施例中的携转用户分析方法,本公开实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种携转用户分析方法。
需要明确的是,本公开并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本公开的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本公开的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
还需要说明的是,本公开中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本公开不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本公开的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本公开的保护范围之内。

Claims (10)

1.一种携转用户分析方法,其特征在于,所述方法包括:
从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据;所述用户属性至少包括已携转用户属性和未携转用户属性;
根据所述已携转用户属性对应的多维度特征分类数据,通过决策树算法对相应用户的行为特征信息进行加权处理,得到携转用户特征数据;
通过所述携转用户特征数据,对循环神经网络进行训练,以得到携转用户的分析模型;
将待分析用户的业务数据输入所述分析模型,进行携转预测。
2.根据权利要求1所述的携转用户分析方法,其特征在于,所述从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据,包括:
根据所述获取的历史业务数据,识别出已携转用户和未携转用户,并提取对应用户的行为特性信息;
将所述行为特性信息进行相关性算法检验,得到用户属性的影响因子;
根据所述用户属性的影响因子,将所述对应用户的行为特性信息按照预设的多个维度进行聚类,得到所述多维度特征分类数据。
3.根据权利要求2所述的携转用户分析方法,其特征在于,在所述将所述行为特性信息进行相关性算法检验,得到用户属性的影响因子之后,所述方法还包括:
对所述用户属性的影响因子按照权重赋值;
删除权重低于预设影响阈值的影响因子。
4.根据权利要求1所述的携转用户分析方法,其特征在于,所述根据所述已携转用户属性对应的多维度特征分类数据,通过决策树算法对相应用户的行为特征信息进行加权处理,得到携转用户特征数据,包括:
将所述已携转用户属性对应的多维度特征分类数据中的行为特征信息,按照预设的标签规则识别为显性标签和/或隐性标签;
根据已携转用户属性对应的每个用户的显性标签和/或隐性标签,生成对应用户的决策树;
按照预设的权值评价规则,确定所述决策树中的各节点数据项的权值;
将所述决策树各节点数据项的权值进行累乘后,删除累乘结果小于预设评价阈值的用户,得到包含携转用户特征数据的数据库。
5.根据权利要求1所述的携转用户分析方法,其特征在于,所述通过所述携转用户特征数据,对循环神经网络进行训练,以得到携转用户的分析模型,包括:
将所述携转用户特征数据按照单个用户,形成样本数据,输入到所述循环神经网络中进行携转客户识别,并得到第一携转概率;
对所述第一携转概率进行验证,并在验证结果未达到预设匹配度时,利用预设的校准阈值,对所述输入到所述循环神经网络进行校准;并且
当所述验证结果达到预设匹配度后,得到携转用户的分析模型。
6.根据权利要求1所述的携转用户分析方法,其特征在于,在所述将待分析用户的业务数据输入所述分析模型,进行携转预测之后,所述方法还包括:
通过所述分析模型进行携转预测后,输出对应用户的第二携转概率;
根据预设的携转概率与营销策略的映射关系,输出所述第二携转概率对应的营销策略。
7.根据权利要求1-6任一项所述的携转用户分析方法,其特征在于,在所述从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据之前,所述方法还包括:
从运营侧数据域和业务侧数据侧获取所述历史业务数据。
8.一种携转用户分析装置,其特征在于:所述装置包括:
聚类模块,用于从获取的历史业务数据中,基于用户属性提取对应用户的行为特征信息,并聚类得到对应用户属性的多维度特征分类数据;所述用户属性至少包括已携转用户属性和未携转用户属性;
决策模块,用于根据所述已携转用户属性对应的多维度特征分类数据,通过决策树算法对相应用户的行为特征信息进行加权处理,得到携转用户特征数据;
训练模块,用于通过所述携转用户特征数据,对循环神经网络进行训练,以得到携转用户的分析模型;
预测模块,用于将待分析用户的业务数据输入所述分析模型,进行携转预测。
9.一种携转用户分析设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的携转用户分析方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的携转用户分析方法。
CN202110379811.7A 2021-04-08 2021-04-08 携转用户分析方法、装置、设备及计算机存储介质 Pending CN113033909A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110379811.7A CN113033909A (zh) 2021-04-08 2021-04-08 携转用户分析方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110379811.7A CN113033909A (zh) 2021-04-08 2021-04-08 携转用户分析方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN113033909A true CN113033909A (zh) 2021-06-25

Family

ID=76456041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110379811.7A Pending CN113033909A (zh) 2021-04-08 2021-04-08 携转用户分析方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113033909A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780806A (zh) * 2021-09-10 2021-12-10 未鲲(上海)科技服务有限公司 基于决策树的经纪人匹配方法、装置、设备及存储介质
CN114139646A (zh) * 2021-12-07 2022-03-04 中国联合网络通信集团有限公司 一种携出用户处理方法、装置及计算机可读存储介质
CN114679390A (zh) * 2022-03-30 2022-06-28 中国联合网络通信集团有限公司 回退账户的确定方法、装置及计算机可读存储介质
CN115988475A (zh) * 2022-12-20 2023-04-18 中国联合网络通信集团有限公司 快携用户的预测方法、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102546228A (zh) * 2011-06-16 2012-07-04 广州市龙泰信息技术有限公司 一种电信用户细分方法
CN106022505A (zh) * 2016-04-28 2016-10-12 华为技术有限公司 一种预测用户离网的方法及装置
CN109558962A (zh) * 2017-09-26 2019-04-02 中国移动通信集团山西有限公司 预测电信用户流失的装置、方法和存储介质
CN110322085A (zh) * 2018-03-29 2019-10-11 北京九章云极科技有限公司 一种客户流失预测方法和装置
CN111092762A (zh) * 2019-12-19 2020-05-01 深圳市博瑞得科技有限公司 一种携号转网潜在用户的预测方法、装置和存储介质
CN111538873A (zh) * 2019-12-23 2020-08-14 浙江大学 一种基于端对端模型的电信客户流失概率预测方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102546228A (zh) * 2011-06-16 2012-07-04 广州市龙泰信息技术有限公司 一种电信用户细分方法
CN106022505A (zh) * 2016-04-28 2016-10-12 华为技术有限公司 一种预测用户离网的方法及装置
CN109558962A (zh) * 2017-09-26 2019-04-02 中国移动通信集团山西有限公司 预测电信用户流失的装置、方法和存储介质
CN110322085A (zh) * 2018-03-29 2019-10-11 北京九章云极科技有限公司 一种客户流失预测方法和装置
CN111092762A (zh) * 2019-12-19 2020-05-01 深圳市博瑞得科技有限公司 一种携号转网潜在用户的预测方法、装置和存储介质
CN111538873A (zh) * 2019-12-23 2020-08-14 浙江大学 一种基于端对端模型的电信客户流失概率预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
姚博: "客户流失预测模型研究及其应用", 中国优秀硕士学位论文全文数据库 经济与管理科学辑, no. 2018, 15 February 2018 (2018-02-15), pages 152 - 1527 *
马文斌 等: "基于深度神经网络的客户流失预测模型", 《计算机技术与发展》, vol. 29, no. 9, 30 September 2019 (2019-09-30), pages 76 - 80 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780806A (zh) * 2021-09-10 2021-12-10 未鲲(上海)科技服务有限公司 基于决策树的经纪人匹配方法、装置、设备及存储介质
CN114139646A (zh) * 2021-12-07 2022-03-04 中国联合网络通信集团有限公司 一种携出用户处理方法、装置及计算机可读存储介质
CN114679390A (zh) * 2022-03-30 2022-06-28 中国联合网络通信集团有限公司 回退账户的确定方法、装置及计算机可读存储介质
CN115988475A (zh) * 2022-12-20 2023-04-18 中国联合网络通信集团有限公司 快携用户的预测方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN113033909A (zh) 携转用户分析方法、装置、设备及计算机存储介质
US10348550B2 (en) Method and system for processing network media information
CN108876034B (zh) 一种改进的Lasso+RBF神经网络组合预测方法
CN110991875A (zh) 一种平台用户质量评估系统
CN111178380A (zh) 数据分类方法、装置及电子设备
CN110119948A (zh) 基于时变权重动态组合的电力用户信用评价方法及系统
CN112950359B (zh) 一种用户识别方法和装置
CN113448955B (zh) 数据集质量评估方法、装置、计算机设备及存储介质
CN111062564A (zh) 一种电力客户诉求敏感值计算方法
CN107977855B (zh) 一种管理用户信息的方法及装置
CN113239275A (zh) 信息推送方法、装置、电子设备和存储介质
CN113543117B (zh) 携号转网用户的预测方法、装置及计算设备
CN114022205A (zh) 基于改进聚类法的电力用户缴费渠道偏好匹配方法及系统
CN112163155A (zh) 信息处理方法、装置、设备及存储介质
CN112734352A (zh) 一种基于数据维度的单据审核方法和装置
CN117196630A (zh) 交易风险预测方法、装置、终端设备以及存储介质
CN113570114B (zh) 一种资源服务智能匹配方法、系统和计算机设备
CN116167733A (zh) 绩效评估方法、装置、设备及介质
CN113743435B (zh) 业务数据分类模型的训练、业务数据的分类方法和装置
CN114860788A (zh) 一种技术推广信息服务系统及方法
CN113887669A (zh) 用户分类方法、用户分类装置、存储介质与电子设备
CN112308419A (zh) 数据处理方法、装置、设备及计算机存储介质
CN111385108A (zh) 业务处理方法、装置、设备及介质
CN114840583B (zh) 基于块数据构建的全景指标数据分析处理方法及系统
CN117472300B (zh) 一种分布式3d打印制造平台的订单派单方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination