CN114385709A - 一种用户信息挖掘方法及装置 - Google Patents
一种用户信息挖掘方法及装置 Download PDFInfo
- Publication number
- CN114385709A CN114385709A CN202111644256.2A CN202111644256A CN114385709A CN 114385709 A CN114385709 A CN 114385709A CN 202111644256 A CN202111644256 A CN 202111644256A CN 114385709 A CN114385709 A CN 114385709A
- Authority
- CN
- China
- Prior art keywords
- user
- telecommunication service
- service package
- key decision
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000005065 mining Methods 0.000 title claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 55
- 230000006399 behavior Effects 0.000 claims description 20
- 239000012528 membrane Substances 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 235000012054 meals Nutrition 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 abstract description 3
- 238000007418 data mining Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 9
- 210000004027 cell Anatomy 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 210000000170 cell membrane Anatomy 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 210000002390 cell membrane structure Anatomy 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种用户信息挖掘方法及装置,涉及大数据分析技术领域,包括:获取电信业务套餐的用户信息;基于用户信息中的通话数据执行PageRank算法,得到电信业务套餐内各用户的通话维度的权重;基于用户信息执行层次分析法,得到电信业务套餐内各用户的其他维度的权重;根据电信业务套餐内各用户的通话维度的权重以及其他维度的权重,计算电信业务套餐内各用户的关键决策人分数;根据电信业务套餐内各用户的关键决策人分数,确定电信业务套餐内的关键决策人。
Description
技术领域
本申请涉及大数据分析技术领域,尤其涉及一种用户信息挖掘方法及装置。
背景技术
随着电信业务套餐产品的迅速普及,套餐产品内移动用户数量逐渐由以往单用户转变为多用户。如何挖掘出有价值的用户信息,对电信业务扩展和推广有着重要作用。
传统的数据分析方法在众多维度的海量数据面前作用甚微,因此目前亟需一种用户信息挖掘方法,特别是可应用于电信业务的用户信息挖掘方法,用以从多个维度挖掘用户信息。
发明内容
本申请提供了一种用户信息挖掘方法及装置,用以从多个维度挖掘用户信息。
第一方面,提供一种用户信息挖掘方法,包括:
获取电信业务套餐的用户信息,所述用户信息包括用户基础信息和用户行为信息,所述用户行为信息至少包括通话数据;
基于所述通话数据执行PageRank算法,得到所述电信业务套餐内各用户的通话维度的权重;
基于所述用户信息中除所述通话数据以外的用户信息执行层次分析法,得到所述电信业务套餐内各用户的相应维度的权重;
根据所述电信业务套餐内各用户的通话维度的权重以及所述相应维度的权重,确定所述电信业务套餐内各用户的关键决策人分数,所述关键决策人分数用于从全维度表征用户作为关键决策人的可能性;
根据所述电信业务套餐内各用户的关键决策人分数,确定所述电信业务套餐内的关键决策人。
可选的,所述根据所述电信业务套餐内各用户的关键决策人分数,确定所述电信业务套餐内的关键决策人,包括:
基于所述电信业务套餐内各用户的关键决策人分数,执行膜计算,用以在电信业务套餐层级、客户层级以及证件层级下搜索全局最优关键决策人;
将搜索到的全局最优关键决策人确定为所述电信业务套餐内的关键决策人;
其中,所述膜计算使用的膜结构按照层级从低到高的顺序包括:
套餐维度膜:包含于同一电信业务套餐内的用户;
客户维度膜:包含于同一个客户标识对应的至少一个套餐内的用户;
证件维度膜:包含于同一证件号码对应的所有客户标识内的所有套餐内的用户。
可选的,所述根据所述电信业务套餐内各用户的通话维度的权重以及所述相应维度的权重,确定所述电信业务套餐内各用户的关键决策人分数,包括:
获取所述电信业务套餐内各用户对应的初始化分数向量;其中,所述初始化分数向量包括各维度对应的初始化分数;
分别根据所述电信业务套餐内各用户对应的初始化分数向量与权重向量,确定所述电信业务套餐内各用户对应的关键决策人分数;其中,所述权重向量包括各维度对应的权重。
可选的,所述用户基础信息包括以下信息中的至少一项:入网时间、是否是主卡、终端制式、终端价格;所述用户行为信息还包括以下信息中的至少一项:营业厅办理业务信息、缴费次数、投诉信息、故障上报信息、流量信息。
第二方面,提供一种用户信息挖掘装置,包括:
用户信息获取模块,用于获取电信业务套餐的用户信息,所述用户信息包括用户基础信息和用户行为信息,所述用户行为信息至少包括通话数据;
PageRank算法模块,基于所述通话数据执行PageRank算法,得到所述电信业务套餐内各用户的通话维度的权重;
层次分析法算法模块,用于基于所述用户信息中除所述通话数据以外的用户信息执行层次分析法,得到所述电信业务套餐内各用户的相应维度的权重;
分数确定模块,用于根据所述电信业务套餐内各用户的通话维度的权重以及所述相应维度的权重,确定所述电信业务套餐内各用户的关键决策人分数,所述关键决策人分数用于从全维度表征用户作为关键决策人的可能性;
关键决策人确定模块,用于根据所述电信业务套餐内各用户的关键决策人分数,确定所述电信业务套餐内的关键决策人。
可选的,所述关键决策人确定模块,包括:
膜计算模块,用于基于所述电信业务套餐内各用户的关键决策人分数,执行膜计算,用以在电信业务套餐层级、客户层级以及证件层级下搜索全局最优关键决策人;
确定模块,将搜索到的全局最优关键决策人确定为所述电信业务套餐内的关键决策人;
其中,所述膜计算使用的膜结构按照层级从低到高的顺序包括:
套餐维度膜:包含于同一电信业务套餐内的用户;
客户维度膜:包含于同一个客户标识对应的至少一个套餐内的用户;
证件维度膜:包含于同一证件号码对应的所有客户标识内的所有套餐内的用户。
可选的,所述分数确定模块,具体用于:获取所述电信业务套餐内各用户对应的初始化分数向量;其中,所述初始化分数向量包括各维度对应的初始化分数;分别根据所述电信业务套餐内各用户对应的初始化分数向量与权重向量,确定所述电信业务套餐内各用户对应的关键决策人分数;其中,所述权重向量包括各维度对应的权重。
第三方面,提供一种通信装置,包括:处理器、存储器;所述存储器,存储计算机指令;所述处理器,用于读取所述计算机指令,执行如上述第一方面中任一项所述的方法。
第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上述第一方面中任一项所述的方法。
第五方面,提供一种计算机程序产品,所述计算机程序产品在被计算机调用时,使得所述计算机执行如上述第一方面中任一项所述的方法。
本申请的上述实施例中,可对电信业务套餐的用户信息进行全维度的数据挖掘,基于PageRank算法和层次分析法得到用户各维度的权重,根据各维度的权重计算用户的关键决策人分数,并根据关键决策人分数确定电信业务套餐内的关键决策人,从而基于多个维度进行数据挖掘,可以提高可靠性和准确度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,显而易见地,下面所介绍的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的系统架构示意图;
图2为本申请实施例提供的一种数据挖掘方法的流程示意图;
图3为本申请实施例提供的一种基于PageRank算法模型实现的数据挖掘流程;
图4位本申请实施例中的一种计算关键决策人分数的示意图;
图5为本申请实施例中的一种具有两层细胞膜结构的膜计算系统示意图;
图6为本申请实施例提供的数据挖掘装置的结构示意图;
图7为本申请实施例提供的通信装置的结构示意图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、详尽地描述。其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;文本中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,另外,在本申请实施例的描述中,“多个”是指两个或多于两个。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为暗示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本申请实施例提供了一种用户信息挖掘方法以及可实现该方法的装置。本申请实施例提供的用户信息挖掘方法可应用于电信业务套餐产品关键用户挖掘,可精准挖掘出套餐关键决策人。采用本申请实施例,可基于电信业务套餐产品用户的多个维度的信息,并使用相关数据挖掘算法(比如包括PageRank算法、层次分析法、膜计算算法等),挖掘出使用电信业务套餐产品的用户中具有业务使用决策能力的用户,进而可以有针对性的进行电信业务扩展和推广。
运营商可将多种类型业务打包销售,该多种打包在一起销售的电信业务可称为电信业务套餐。比如,一个电信业务套餐中可包括100分钟的免费通话业务、100G免费流量的数据业务、50%折扣的国际长途固定通话业务等。
下面首先对本申请实施例中使用的一些数据挖掘算法进行说明。
(1)PageRank算法。
PageRank,简称PR,属于排名运算法则(排名公式)的一部分,主要用来标识网页的等级/重要性,是衡量一个网站的好坏的重要标准之一。PageRank计算页面的重要性,对每个链入(inbound)赋以不同的权值,链接提供页面的越重要则此链接入越高。当前页的重要性,是由其它页面的重要性决定的。在揉合了诸如标题(title)标识和关键字(keywords)标识等所有其它因素之后,通过PageRank算法来调整结果,使那些更具“等级/重要性”的网页在搜索结果中令网站排名获得提升,从而提高搜索结果的相关性和质量。
(2)层次分析法。
层次分析法(Analytic Hierarchy Process),简称AHP,是指将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。层次分析法根据问题的性质和要达到的总目标,将问题分解为不同的组成因素,并按照因素间的相互关联影响以及隶属关系将因素按不同层次聚集组合,形成一个多层次的分析结构模型,从而最终使问题归结为最低层(供决策的方案、措施等)相对于最高层(总目标)的相对重要权值的确定或相对优劣次序的排定。
(3)膜计算。
膜计算是自然计算的一个分支,其主要目的是为了从细胞、组织等结构中抽象出计算模型。如图1所示,细胞膜是由多种成分组成的,并且细胞膜将细胞内部物质和外部环境隔开,膜与膜之间的物质交流通过主动跨膜或被动跨膜两种方式实现。同时,在细胞内的物质进行的化学反应和在细胞之间进行的信息交流,都被抽象为一种计算过程,并最终被抽象为一种计算模型。由于各个细胞膜内物质的化学反应是相对独立的,因此可将大量细胞当作各自独立的计算单元,通过完成特定的任务,从而实现分布式并行计算。
图1示例性示出了本申请实施例的系统架构。如图所示,本申请实施例可包括两个部分:数据采集和数据挖掘。
通过数据采集,可采集使用(定制)电信业务套餐的用户的相关信息,比如包括用户基础信息和用户行为信息。可选的,可从电信业务相关数据库获取用户基础信息和用户行为信息,比如从运营商的通话详单数据库中获取用户的通话详单,根据通话详单获取通话数据。
可选的,用户基础信息可包括用户的通信号码(比如手机号)、入网时间、该通信号码是否主卡的通信号码、终端(比如手机)的制式、终端(比如手机)的价格、投诉报障时预留的联系号码等,进一步的,用户基础信息还可包括该通信号码是否与电信运营商的在线服务平台(比如电信运营商的微信公众号)绑定等信息。可理解,以上仅示例性的列举了一些用户基础信息的类型,本申请实施例对此不做限制。
可选的,用户行为信息可包括通话数据、流量数据、业务办理信息等。其中,通话数据可反映用户对语音业务的使用情况,比如可包括用户通话时间、时长等信息。流量数据可反映用户对数据业务的使用情况,比如可包括流量使用情况(比如包括已使用流量、未使用流量等),进一步的,还可包括用户对电信运营商提供的终端应用程序的使用情况,比如登录时间、使用时长、使用应用程序进行的电信业务相关操作(比如包括查询话费账单、充值、业务申请等)等。业务办理信息可包括用户在营业厅办理的业务信息、用户的缴费次数、用户提交的投诉相关信息(比如包括投诉内容及类型、投诉时间等)、用户提交的故障上报信息(比如包括故障类型、上报时间等)等。可理解,以上仅示例性的列举了一些用户行为信息的类型,本申请实施例对此不做限制。
进一步的,本申请实施例中,还可对采集到的数据进行预处理,比如将采集到的数据进行格式转换,转换为符合数据库要求的格式,以便存储到数据库中。可选的,可使用HiveQL数据库管理系统对采集的数据进行管理。
在数据挖掘部分,可建立PageRank算法模型、层次分析法算法模型、膜计算算法模型。PageRank算法模型可对通话数据执行PageRank算法处理,从而以通话业务的维度,按照重要性对用户进行排序。层次分析算法模型可以基于其他用户行为信息和/或用户基础信息进行数据挖掘处理,从而基于多个维度对用户进行打分,用户的得分高低可以反映该用户被确定为关键决策人的可能性大小。膜计算算法模型可从套餐维度、客户维度和证件维度对层次分析算法模型的输出数据进行数据挖掘,从而在在全局范围内搜索最优的决策人。
可理解,上述架构中的PageRank算法模型可以被看做一个框架,可以在这个基础上进行一些变化,也就是说,本申请实施例使用的PageRank算法是指采用PageRank算法基本思想的一类算法,可以包括多种改进版本。
可理解,上述架构中的层次分析法算法模型可以被看做一个框架,可以在这个基础上进行一些变化,也就是说,本申请实施例使用的层次分析法算法是指采用层次分析法算法基本思想的一类算法,可以包括多种改进版本。
可理解,上述架构中的膜计算算法模型可以被看做一个框架,可以在这个基础上进行一些变化,也就是说,本申请实施例使用的膜计算算法是指采用膜计算算法基本思想的一类算法,可以包括多种改进版本。
图2示例性示出了本申请实施例提供的一种用户信息挖掘流程示意图。该流程可由用户信息挖掘装置(或系统)实现,该用户信息挖掘装置(或系统)可由软件方式实现,也可由硬件方式实现,还可以采用软硬件结合的方式实现。
如图2所示,该流程可包括如下步骤:
S201:获取电信业务套餐用户的用户信息。
其中,电信业务套餐用户是指使用或定制了电信业务套餐产品的用户。比如,电信业务套餐为电信业务家庭套餐,一个电信业务家庭套装可被多个家庭成员使用,也就是说一个电信业务家庭套餐中包括多个用户。当用户申请使用某个电信业务家庭套餐时,需要向运营商注册用户基础信息,比如包括通信号码、用户姓名等。
该步骤中,获取到的用户信息包括用户基础信息和用户行为信息,所述用户行为信息至少包括通话数据,用户信息的具体内容以及获取方式可参见前文描述,此处不再赘述。
S202:基于通话数据执行PageRank算法,得到电信业务套餐内各用户的通话维度的权重。
其中,通话维度的权重可以从通话业务使用维度表征用户作为关键决策人的可能性。
可选的,为了提高数据挖掘的可靠性,可获取近期内产生的通话数据,比如最近三个月内产生的通话数据。可选的,在基于通话数据执行PageRank算法之前,还可以首先对通话数据进行预处理,比如对缺失数据进行补齐,将异常数据删除。可选的,可以保留同一套餐内用户成员之间的主叫通话记录,并提取主叫号码、被叫号码、呼叫次数,用于执行PageRank算法。
本申请实施例中,针对采集到的大量的电信业务套餐的用户信息,通过该步骤可得到各电信业务套餐内的各用户的权重。
该步骤可通过图1中的PageRank算法模型实现。图3示例性示出了一种基于PageRank算法模型实现的数据挖掘流程,如图所示,该流程可包括:
S301:接收到近三个月的通话详单数据后,进行数据预处理。
S302:保留同一套餐内用户成员之间的主叫通话记录,并构造主叫号码calling_nbr、被叫号码called_nbr、呼叫次数calling_num三个字段。
S303:通过遍历通话数据,获取待处理的通话数据,如果已经遍历完成,则结束本流程,否则转入S304。
S304:获取固定大小的待处理的通话数据。
该固定大小例如batch_size=16。一个batch_size是S302中构造的同一个套餐内用户成员之间的主叫通话数据,因为PageRank算法是在单节点上运行的,为避免内存溢出,故每次循环取小批量数据进行处理。
S305:对该待处理的通话数据执行PageRank算法。
由于每一个套餐内用户成员之间的通话联系是一个独立的有向图,因此可将该步骤中执行的PageRank算法命名为局部PageRank。
S306:输出PageRank算法的执行结果,即,电信业务套餐内各个用户(即各个通信号码)的权重,并返回S302以获取下一批待处理的通话数据。
一个套餐内的一个用户的权重,可以从通话业务使用维度表征该用户作为该套餐内的关键决策人的可能性。可选的,权重的取值范围可以是大于或等于0,且小于或等于1。
S203:基于用户信息中除通话数据以外的用户信息执行层次分析法,得到电信业务套餐内各用户的相应维度(其他维度)的权重。
用户信息中除了通话数据以外,还可以包括其他维度的用户信息,比如入网时间维度、终端制式维度、终端价格维度、缴费次数维度等,基于这些维度的用户信息执行层次分析法,可以得到这些维度分别对应的权重,用以从不同维度表征用户作为关键决策人的可能性。例如,入网时间最早的手机号码,其对应的用户作为套餐关键决策人的权重要比其它手机号码对应的用户高;再例如,套餐内的用户成员中,主卡用户比非主卡用户成为关键决策人的权重高;再例如,用户在CRM办理业务、缴纳费用、投诉报障时预留的联系号码,其对应的用户成为套餐关键决策人的权重较高,同时语音通话、流量使用等行为数据也一定程度上刻画了套餐用户成员的决策能力。
可选的,该步骤中,还可以基于层次分析法计算得到各维度的重要性排序。可选的,该重要性排序也可作为后续计算关键决策人分数的依据之一。
该步骤可通过图1中的层次分析法算法模型实现。本申请实施例中,针对采集到的大量的电信业务套餐的用户信息,通过该步骤可得到各电信业务套餐内的各用户的权重。
S204:根据S202中得到的权重以及S203中得到的权重,确定电信业务套餐内各用户的关键决策人分数。
其中,所述关键决策人分数可以用于从全维度表征用户作为关键决策人的可能性,比如分数越高表明相应用户成为关键决策人的可能性越大。这里的全维度是指在S201获取到的用户信息所涵盖的所有维度。
可选的,该步骤中,可获取电信业务套餐内各用户对应的初始化分数向量,该初始化分数向量包括各维度对应的初始化分数;然后,分别根据电信业务套餐内各用户对应的初始化分数向量与权重向量,确定电信业务套餐内各用户对应的关键决策人分数。其中,所述权重向量包括各维度对应的权重。
示例性的,图4示出了本申请实施例中的一种计算关键决策人分数的示意图。如图所示,针对电信业务套餐内的某个成员用户,可首先对与目标变量“决策人分数”相关的变量进行初始化,生成初始化分数向量X,该用户的初始化分数向量X包括各维度对应的初始分数,比如包括入网时间维度的初始分数x1,缴费次数维度的初始分数x7等。然后,结合业务线多位专家经验,通过层次分析法对各种维度的组合进行重要性比较,并输出该用户的权重向量Y,该权重向量Y包括各维度对应的权重,比如包括入网时间维度对应的权重y1,缴费次数维度对应的权重y7等。最后,将该用户的初始分数向量与权重向量进行运算,可得到评价套餐内该用户决策能力的决策人分数。具体的,可采用以下公式可以计算得到该用户的关键决策人分数:
JCR分数=XT*Y
其中,JCR分数为关键决策人分数,X为初始化分数向量,XT表示X的转置,Y为权重向量。
S205:根据电信业务套餐内各用户的关键决策人分数,确定电信业务套餐内的关键决策人。
在一些实施例中,可以根据电信业务套餐内各用户的关键决策人分数,直接确定出电信业务套餐内的关键决策人。
在一些场景下,一个用户证件下可关联多个客户ID,一个客户ID可关联多个电信业务套餐。比如,一个用户使用其身份证可以注册多个客户ID,每个客户ID可以关联多个电信业务家庭套餐,比如住所1关联电信业务家庭套餐1,住所2关联电信业务家庭套餐2。针对这种情况,在另一些实施例中,可以采用膜计算算法,搜索全局范围最优的关键决策人。
示例性的,可基于电信业务套餐内各用户的关键决策人分数,执行膜计算,用以在电信业务套餐层级、客户层级以及证件层级下搜索全局最优关键决策人;并将搜索到的全局最优关键决策人确定为该电信业务套餐内的关键决策人。
示例性的,可采用如图5所示的具有两层细胞型P系统,其主要结构和功能如下:
1、膜结构:
(1)套餐维度膜tq:粒度最小的膜,其膜内包含同一套餐下的用户成员;
(2)客户维度膜cp:比套餐维度膜高一个层级,其膜内包含同一个客户ID下的多个套餐内的用户成员;
(3)证件维度膜Zu:层级最高的膜,其膜内包含同一证件号码下所有客户ID内的所有套餐里的用户成员。
2、膜功能:
通过该两层细胞膜结构,可以在搜索套餐最优决策人时克服套餐这一局部层次的局限性,通过上升到同一客户ID、甚至同一证件号码层次,在证件这一全局空间里通过比较所有成员的决策人分数得到最优解,最终将全局最优解反写回套餐内,得到套餐内的最优关键决策人。
本申请的上述实施例中,可对电信业务套餐的用户信息进行全维度的数据挖掘,基于PageRank算法和层次分析法得到用户各维度的权重,根据各维度的权重计算用户的关键决策人分数,并根据关键决策人分数确定电信业务套餐内的关键决策人,从而基于多个维度进行数据挖掘,可以提高可靠性和准确度。
通过本申请实施例可以在多个维度下对套餐内用户的决策能力进行有效评估,然后根据评估分数高低在套餐、客户、证件三个层级下搜索全局最优决策人,最后将全局最优决策人作为套餐关键决策人进行应用,进而可以提高不同应用场景下与客户的接触效率和营销转化率。
基于相同的技术构思,本申请实施例还提供了一种用户信息挖掘装置。
参见图6,为本申请实施例提供的用户信息挖掘装置的结构示意图,如图所示,该装置可包括:用户信息获取模块601、PageRank算法模块602、层次分析法算法模块603、分数确定模块604、关键决策人确定模块605。
用户信息获取模块601,用于获取电信业务套餐的用户信息,所述用户信息包括用户基础信息和用户行为信息,所述用户行为信息至少包括通话数据;
PageRank算法模块602,基于所述通话数据执行PageRank算法,得到所述电信业务套餐内各用户的通话维度的权重;
层次分析法算法模块603,用于基于所述用户信息中除所述通话数据以外的用户信息执行层次分析法,得到所述电信业务套餐内各用户的相应维度的权重;
分数确定模块604,用于根据所述电信业务套餐内各用户的通话维度的权重以及所述相应维度的权重,确定所述电信业务套餐内各用户的关键决策人分数,所述关键决策人分数用于从全维度表征用户作为关键决策人的可能性;
关键决策人确定模块605,用于根据所述电信业务套餐内各用户的关键决策人分数,确定所述电信业务套餐内的关键决策人。
可选的,关键决策人确定模块605,包括膜计算模块6051、确定模块6052。膜计算模块6051,用于基于所述电信业务套餐内各用户的关键决策人分数,执行膜计算,用以在电信业务套餐层级、客户层级以及证件层级下搜索全局最优关键决策人;确定模块6052,将搜索到的全局最优关键决策人确定为所述电信业务套餐内的关键决策人。
可选的,分数确定模块604,具体用于:获取所述电信业务套餐内各用户对应的初始化分数向量;其中,所述初始化分数向量包括各维度对应的初始化分数;分别根据所述电信业务套餐内各用户对应的初始化分数向量与权重向量,确定所述电信业务套餐内各用户对应的关键决策人分数;其中,所述权重向量包括各维度对应的权重。
基于相同的技术构思,本申请实施例还提供了一种通信装置,能够实现前述实施例中的用户信息挖掘方法。
参见图7,为本申请实施例提供的通信装置的结构示意图。如图所示,该装置可包括:处理器701、存储器702以及总线接口703。
处理器701负责管理总线架构和通常的处理,存储器702可以存储处理器701在执行操作时所使用的数据。
总线架构可以包括任意数量的互联的总线和桥,具体由处理器701代表的一个或多个处理器和存储器702代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。处理器701负责管理总线架构和通常的处理,存储器702可以存储处理器701在执行操作时所使用的数据。
本申请实施例揭示的流程,可以应用于处理器701中,或者由处理器701实现。在实现过程中,处理流程的各步骤可以通过处理器701中的硬件的集成逻辑电路或者软件形式的指令完成。处理器701可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器702,处理器701读取存储器702中的信息,结合其硬件完成本申请实施例中的方法流程的步骤。
具体地,处理器701,用于读取存储器702中的计算机指令并执行本申请实施例中的用户信息挖掘方法。
在此需要说明的是,本申请实施例提供的上述通信装置,能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行上述实施例中的用户信息挖掘方法。
本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在被计算机调用时,使得所述计算机执行上述实施例中的用户信息挖掘方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种用户信息挖掘方法,其特征在于,包括:
获取电信业务套餐的用户信息,所述用户信息包括用户基础信息和用户行为信息,所述用户行为信息至少包括通话数据;
基于所述通话数据执行PageRank算法,得到所述电信业务套餐内各用户的通话维度的权重;
基于所述用户信息中除所述通话数据以外的用户信息执行层次分析法,得到所述电信业务套餐内各用户的相应维度的权重;
根据所述电信业务套餐内各用户的通话维度的权重以及所述相应维度的权重,确定所述电信业务套餐内各用户的关键决策人分数,所述关键决策人分数用于从全维度表征用户作为关键决策人的可能性;
根据所述电信业务套餐内各用户的关键决策人分数,确定所述电信业务套餐内的关键决策人。
2.如权利要求1所述的方法,其特征在于,所述根据所述电信业务套餐内各用户的关键决策人分数,确定所述电信业务套餐内的关键决策人,包括:
基于所述电信业务套餐内各用户的关键决策人分数,执行膜计算,用以在电信业务套餐层级、客户层级以及证件层级下搜索全局最优关键决策人;
将搜索到的全局最优关键决策人确定为所述电信业务套餐内的关键决策人;
其中,所述膜计算使用的膜结构按照层级从低到高的顺序包括:
套餐维度膜:包含于同一电信业务套餐内的用户;
客户维度膜:包含于同一个客户标识对应的至少一个套餐内的用户;
证件维度膜:包含于同一证件号码对应的所有客户标识内的所有套餐内的用户。
3.如权利要求1所述的方法,其特征在于,所述根据所述电信业务套餐内各用户的通话维度的权重以及所述相应维度的权重,确定所述电信业务套餐内各用户的关键决策人分数,包括:
获取所述电信业务套餐内各用户对应的初始化分数向量;其中,所述初始化分数向量包括各维度对应的初始化分数;
分别根据所述电信业务套餐内各用户对应的初始化分数向量与权重向量,确定所述电信业务套餐内各用户对应的关键决策人分数;其中,所述权重向量包括各维度对应的权重。
4.如权利要求1-3任一项所述的方法,其特征在于,所述用户基础信息包括以下信息中的至少一项:入网时间、是否是主卡、终端制式、终端价格;
所述用户行为信息还包括以下信息中的至少一项:营业厅办理业务信息、缴费次数、投诉信息、故障上报信息、流量信息。
5.一种用户信息挖掘装置,其特征在于,包括:
用户信息获取模块,用于获取电信业务套餐的用户信息,所述用户信息包括用户基础信息和用户行为信息,所述用户行为信息至少包括通话数据;
PageRank算法模块,基于所述通话数据执行PageRank算法,得到所述电信业务套餐内各用户的通话维度的权重;
层次分析法算法模块,用于基于所述用户信息中除所述通话数据以外的用户信息执行层次分析法,得到所述电信业务套餐内各用户的相应维度的权重;
分数确定模块,用于根据所述电信业务套餐内各用户的通话维度的权重以及所述相应维度的权重,确定所述电信业务套餐内各用户的关键决策人分数,所述关键决策人分数用于从全维度表征用户作为关键决策人的可能性;
关键决策人确定模块,用于根据所述电信业务套餐内各用户的关键决策人分数,确定所述电信业务套餐内的关键决策人。
6.如权利要求5所述的装置,其特征在于,所述关键决策人确定模块,包括:
膜计算模块,用于基于所述电信业务套餐内各用户的关键决策人分数,执行膜计算,用以在电信业务套餐层级、客户层级以及证件层级下搜索全局最优关键决策人;
确定模块,将搜索到的全局最优关键决策人确定为所述电信业务套餐内的关键决策人;
其中,所述膜计算使用的膜结构按照层级从低到高的顺序包括:
套餐维度膜:包含于同一电信业务套餐内的用户;
客户维度膜:包含于同一个客户标识对应的至少一个套餐内的用户;
证件维度膜:包含于同一证件号码对应的所有客户标识内的所有套餐内的用户。
7.如权利要求5所述的装置,其特征在于,所述分数确定模块,具体用于:
获取所述电信业务套餐内各用户对应的初始化分数向量;其中,所述初始化分数向量包括各维度对应的初始化分数;
分别根据所述电信业务套餐内各用户对应的初始化分数向量与权重向量,确定所述电信业务套餐内各用户对应的关键决策人分数;其中,所述权重向量包括各维度对应的权重。
8.一种通信装置,其特征在于,包括:处理器、存储器;
所述存储器,存储计算机指令;
所述处理器,用于读取所述计算机指令,执行如权利要求1-4任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1-4任一项所述的方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品在被计算机调用时,使得所述计算机执行如权利要求1-4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111644256.2A CN114385709A (zh) | 2021-12-30 | 2021-12-30 | 一种用户信息挖掘方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111644256.2A CN114385709A (zh) | 2021-12-30 | 2021-12-30 | 一种用户信息挖掘方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114385709A true CN114385709A (zh) | 2022-04-22 |
Family
ID=81199341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111644256.2A Pending CN114385709A (zh) | 2021-12-30 | 2021-12-30 | 一种用户信息挖掘方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114385709A (zh) |
-
2021
- 2021-12-30 CN CN202111644256.2A patent/CN114385709A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110704677A (zh) | 一种节目推荐方法、装置、可读存储介质及终端设备 | |
CN110737425B (zh) | 一种计费平台系统的应用程序的建立方法及装置 | |
CN112328802A (zh) | 数据处理方法、装置和服务器 | |
CN114282011B (zh) | 知识图谱的构建方法和装置、图计算方法及装置 | |
CN110572521A (zh) | 语音播报方法及装置 | |
CN111815467A (zh) | 审核方法以及装置 | |
CN111651522A (zh) | 一种数据同步方法及装置 | |
CN114385709A (zh) | 一种用户信息挖掘方法及装置 | |
CN114090462B (zh) | 软件重复缺陷识别方法、装置、计算机设备及存储介质 | |
CN109213883A (zh) | 灾害模型群服务链编排方法及装置、终端、存储介质 | |
CN113902415A (zh) | 财务数据核对方法、装置、计算机设备和存储介质 | |
CN110096376B (zh) | 一种数据转移方法及相关设备 | |
CN113326064A (zh) | 划分业务逻辑模块的方法、电子设备及存储介质 | |
CN111367634A (zh) | 信息处理方法、信息处理装置及终端设备 | |
CN111611056A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN110909038B (zh) | 基于区块链的数据处理方法、装置和电子设备 | |
CN112907009B (zh) | 标准化模型的构建方法、装置、存储介质及设备 | |
CN112508714B (zh) | 风险保障契约处理系统、电子设备、计算机可读存储介质 | |
CN113723522B (zh) | 异常用户的识别方法、装置、电子设备以及存储介质 | |
CN115208831B (zh) | 请求处理方法、装置、设备及存储介质 | |
CN118057300A (zh) | 智能合约的推荐方法、装置、电子设备以及存储介质 | |
CN117009202A (zh) | 埋点数据处理方法、装置、设备及存储介质 | |
CN118114649A (zh) | 数据处理方法及装置、设备、存储介质和程序产品 | |
CN116056018A (zh) | 一种短信业务计费方法、装置及电子设备 | |
CN116862636A (zh) | 风险预防系统的构建方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |