CN108898445A - 用户消费能力的分析方法和装置 - Google Patents

用户消费能力的分析方法和装置 Download PDF

Info

Publication number
CN108898445A
CN108898445A CN201810767021.4A CN201810767021A CN108898445A CN 108898445 A CN108898445 A CN 108898445A CN 201810767021 A CN201810767021 A CN 201810767021A CN 108898445 A CN108898445 A CN 108898445A
Authority
CN
China
Prior art keywords
data
user
information
attribute data
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810767021.4A
Other languages
English (en)
Inventor
朱潇
闫嘉
张岩
李振军
王乾佳
罗剑锋
范东
邹炎炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Smart Footprint Data Technology Co Ltd
Original Assignee
Smart Footprint Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Smart Footprint Data Technology Co Ltd filed Critical Smart Footprint Data Technology Co Ltd
Priority to CN201810767021.4A priority Critical patent/CN108898445A/zh
Publication of CN108898445A publication Critical patent/CN108898445A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/24Accounting or billing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了一种用户消费能力的分析方法和装置,该方法包括:获取来自运营商的用户通信数据和外围数据;外围数据包括移动终端信息和/或住房信息;通过用户通信数据和外围数据,确定用户的属性数据;属性数据包括至少一部分外围数据、职驻地、出行数据和上网行为偏好中的一种或多种;职驻地包括用户的工作地和居住地;对属性数据进行聚类分析和指数化分析,得到用户的消费能力分析结果。本发明通过用户的通信数据可以从多个维度对用户的消费能力进行分析,分析结果较为全面且准确度高。

Description

用户消费能力的分析方法和装置
技术领域
本发明涉及消费者数据分析领域,尤其是涉及一种用户消费能力的分析方法和装置。
背景技术
现有的技术中,对于如何确定人群的富裕程度和消费能力,往往是通过对人群做问卷调查、查询银行窗口记录及信用卡消费记录等方式实现,从银行业的数据中可以获得用户消费方面的信息,但从这些数据中获取的信息覆盖用户维度较少,因此难以对用户的消费能力做出正确的分析。
发明内容
有鉴于此,本发明的目的在于提供一种用户消费能力的分析方法和装置,以提高用户消费能力分析的准确度。
第一方面,本发明实施例提供了一种用户消费能力的分析方法,方法包括:获取来自运营商的用户通信数据和外围数据;外围数据包括移动终端信息和/或住房信息;通过用户通信数据和外围数据,确定用户的属性数据;属性数据包括至少一部分外围数据、职驻地、出行数据和上网行为偏好中的一种或多种;职驻地包括用户的工作地和居住地;对属性数据进行聚类分析和指数化分析,得到用户的消费能力分析结果。
进一步地,上述用户通信数据包括用户的用户识别号、月出账金额、月流量消耗、基站位置信息、终端串号、终端串号对应的终端入网型号信息、信令信息、上网信息中的多种。
进一步地,上述通过用户通信数据,确定用户的职驻地的步骤,包括:按照预设的时间段,对用户通信数据中的信令信息进行划分,得到多组信令组合;多组信令组合包括工作日工作时间信令组合、工作日非工作时间信令组合和节假日信令组合;根据每组信令组合对应的基站工作参数信息,确定用户的工作地和居住地。
进一步地,上述通过用户通信数据,确定用户的出行数据的步骤,包括:根据用户的信令信息,确定信令信息所属的基站;判断基站和用户的职驻地的距离是否大于预设的距离阈值;如果是,确定用户发生出行行为;根据基站,确定用户的出行目的地。
进一步地,上述通过用户通信数据,确定用户的上网行为偏好的步骤,包括:当用户的终端产生流量时,获取用户的上网数据;上网数据包括访问网站类型、消耗时间和消耗流量;对上网数据进行上网统计分类,得到每个上网类别对应的消耗时间和消耗流量;上网类别至少包括新闻类或购物类。
进一步地,上述对属性数据进行聚类分析和指数化分析的步骤之前,方法还包括:根据用户的身份标识,对属性数据进行合并,得到用户的各维度的属性数据;根据移动终端信息,剔除所述用户为物联网设备的相关数据;所述相关数据至少包括用户通信数据、外围数据及属性数据中的一种或多种;通过预设的填充值填充属性数据中的空白数据。
进一步地,上述对属性数据进行聚类分析的步骤,包括:采用PCA算法对属性数据进行降维处理;采用KMeans算法对降维处理后的属性数据进行分类,得到用户的分类结果。
进一步地,对属性数据进行指数化分析的步骤,包括:对降维处理后的属性数据中,各维度的数据相加,再除以属性数据的维度总数,得到用户的指数化分析结果。
进一步地,上述对属性数据进行聚类分析和指数化分析的步骤,包括:对属性数据中,各维度设置维度权重;根据维度权重,对属性数据进行聚类分析和指数化分析。
第二方面,本发明实施例提供了一种用户消费能力的分析装置,包括:通信数据采集模块用于获取来自运营商的用户通信数据和外围数据;外围数据包括移动终端信息和/或住房信息;属性数据采集模块用于通过用户通信数据和外围数据,确定用户的属性数据;属性数据包括至少一部分外围数据、职驻地、出行数据和上网行为偏好中的一种或多种;职驻地包括用户的工作地和居住地;属性数据分析模块用于对属性数据进行聚类分析和指数化分析,得到用户的消费能力分析结果。
本发明实施例带来了以下有益效果:
本发明实施例提供了一种用户消费能力的分析方法和装置,获取来自运营商的用户通信数据和外围数据后,通过该用户通信数据和外围数据,确定用户的属性数据;进而再对该属性数据进行聚类分析和指数化分析,得到用户的消费能力分析结果。本发明通过用户的通信数据可以从多个维度对用户的消费能力进行分析,分析结果较为全面且准确度高。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种用户消费能力的分析方法流程图;
图2为本发明实施例提供的另一种用户消费能力的分析方法流程图;
图3为本发明实施例提供的另一种用户消费能力的分析方法流程图;
图4为本发明实施例提供的另一种用户消费能力的分析方法中,数据流向示意图;
图5为本发明实施例提供的一种用户消费能力的分析装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于当前互联网通信的普及性,通信运营商积攒了大量的用户数据,这些用户数据属于用户在通信维度的消费数据,因而这些消费数据本身较为片面,同时噪声较多;为了从通信维度的消费数据中获得用户的消费信息,通常需要对数据进行相关处理,同时借助相关的外围数据进行共同分析,从而更好地提升运营商的数据价值。
首先,由于运营商的用户数据离散程度较高,因此需要对数据进行聚合与清洗;其次,由于运营商的用户数据都是底层数据,因而需要进行翻译;再次,由于数据有误差或噪音,因此,运营商的这些数据通常需要降噪处理后再使用,一般不可直接使用。
另外,如果单纯依靠用户在通信维度的消费数据,较少或者不借助外围数据进行综合判断,而是仅以用户出账金额来判断用户的消费能力,这种做法很难全面、正确评估用户的消费承受能力,评估误差较大。
考虑到现有的消费行为分析方式数据源较为片面,覆盖维度狭窄,导致分析结果误差较大的问题,本发明实施例提供了一种用户消费能力的分析方法和装置,该技术可应用于分析用户消费能力、消费行为或其他目的的分析过程中,该技术可以采用相关的软件或硬件实现,下面通过实施例进行描述。
参见图1所示的一种用户消费能力的分析方法流程图;该方法包括如下步骤:
步骤S102,获取来自运营商的用户通信数据和外围数据;该外围数据包括移动终端信息和/或住房信息;该运营商可以为移动通信运营商、互联网运营商等,例如,移动、联通、电信等。
上述的外围数据包括移动终端信息和住房信息,也可包括移动终端信息或住房信息中的一种;上述移动终端信息可以为使用手机SIM卡(Subscriber IdentificationModule,用户身份识别卡)进行网络通信的设备信息;其中,移动终端主要为:非智能手机、智能手机、平板电脑、智能手表、车载设备以及带有特定通信模块的物联网设备等;物联网设备通常为使用通信网络连接互联网进行无线或有线通信的设备;由于物联网设备与用户的消费行为关联性不大,所以通常需要将其剔除。
运营商提供的移动终端入网信息属于较为底层的数据,通过这类数据无法直接判断用户的消费数据,因此需要将用户使用的移动终端信息数据进行翻译,翻译成市场流通的商品名后,匹配价格信息;
运营商通信数据采集后,得到上述移动终端入网型号信息(也可以称为用户入网型号信息),通过爬虫爬取数据中的关键字得到用户的基本信息即:移动终端品牌、移终端类型、移动终端商品名、移动终端的价格等信息,移动终端数据匹配如下述表1所示:
表1
如:采集的用户入网型号为NX531J,经移动终端数据表的匹配可知其移动终端类型为智能手机,商品名称为努比亚Z11,价格在2500元-3000元的范围;采集的用户入网型号为GPSDWQ01LQ,经移动终端数据表的匹配可知其移动终端类型为儿童电话手表,商品名称为米兔定位电话,价格在100元-300元的范围;采集的用户入网型号为EG91SERIES,经移动终端数据表的匹配可知其移动终端类型为通信模块,但是其价格和商品名称很难判断。由于通常单独使用通信模块的设备属于物联网设备,其产生的数据,会对用户消费水平的数据分析造成干扰,这部分数据会被清理删除。
上述住房信息是通过互联网搜集的,主要包括用户居住地的住址及住房价格信息,其中住房价格信息包括了房屋售价信息及/或房屋租价信息。住房信息可以侧面说明用户的消费承受能力。
步骤S104,通过用户通信数据和外围数据,确定用户的属性数据;该属性数据包括至少一部分外围数据、职驻地、出行数据和上网行为偏好中的一种或多种;该职驻地包括用户的工作地和居住地;
上述至少一部分外围数据包括:与分析用户消费能力相关联的移动终端信息或住房信息;如:用户通信数据对应的移动终端信息;用户的职驻地对应住房信息中的用户职驻地的房价信息;
步骤S106,对属性数据进行聚类分析和指数化分析,得到用户的消费能力分析结果。
上述聚类分析是根据用户的消费水平对用户进行分类,将具有相同属性的消费者通过聚类算法归类成多个群组,得到消费者分析数据。上述指数化分析是将用户在各个维度上的指数进行累加,除以维度数,得到的消费者分析数据。上述消费能力分析结果包括用户月总消费数据、用户的具体消费数据及占总消费的比率、多用户的消费统计数据等,主要是通过数据表格、条形图、柱形图和饼状图的形式来体现。
本发明提供了一种用户消费能力的分析方法,该方法包括:获取来自运营商的用户通信数据和外围数据;外围数据包括移动终端信息和/或住房信息;通过用户通信数据和外围数据,确定用户的属性数据;属性数据包括至少一部分外围数据、职驻地、出行数据和上网行为偏好中的一种或多种;职驻地包括用户的工作地和居住地;对属性数据进行聚类分析和指数化分析,得到用户的消费能力分析结果。该方法通过用户的通信数据可以从多个维度对用户的消费能力进行分析,分析结果较为全面且准确度高。
参见图2所示的另一种用户消费能力的分析方法流程图,该方法在图1所示方法的基础上实现的,该方法通过对用户通信数据的分析,确定用户职驻地、用户出行和用户上网行为偏好的属性数据,该方法包括如下步骤:
步骤S202,获取来自运营商的用户通信数据和外围数据;
该用户通信数据与外围数据中移动终端信息相关联,包括用户的用户识别号、月出账金额、月流量消耗、基站位置信息、终端串号、终端串号对应的终端入网型号信息、信令信息、上网信息中的多种。
其中,用户识别号为唯一一个确定用户的标识,可以是数字,可以是经过其他方法得到的特定字符串等,这里做了区别化和匿名化处理,数据进行处理时可以识别用户信息但不会将用户的信息泄露;月出账金额为用户当月累计消费的话费金额包括通信费、短信费、流量费等费用;月流量消耗统计的是用户当月流量的使用情况包括不同上网数据的流量消耗;基站是在一定的无线电覆盖区域中,通过移动通信交换中心,与移动电话终端之间进行信息传递的无线电收发信电台,可根据用户基站位置信息的变化对用户的出行信息进行统计;
终端串号即IMEI码(International Mobile Equipment Identity,国际移动装备辨识码)与移动终端一一对应,相当于移动终端的身份证;入网型号信息及用户入网时对应的运营商信息为移动、联通或电信中的一个或多个;信令信息是终端和交换机之间以及交换机和交换机之间传递的一种信息。这种信息可以指导终端、交换系统、传输系统协同运行,在指定的终端间建立和拆除临时的通信隧道,并维护网络本身正常运行,相当于是通信网的神经系统。上网信息是用户利用互联网浏览网页,下载的信息。接下来通过如下步骤对用户的职驻地进行确定。
步骤S204,按照预设的时间段,对用户通信数据中的信令信息进行划分,得到多组信令组合;该多组信令组合包括工作日工作时间信令组合、工作日非工作时间信令组合和节假日信令组合;
如工作日工作时间的信令可设置为周一至周五的8:00-12:00,14:00-18:00;工作日非工作时间的信令可设置为上述周一至周五的其他时间段;节假日信令可以设置为周六、日。工作日以及节假日的时间设定可依据日历的标识,工作时间的设定可根据用户进行定制设置。
步骤S206,根据每组信令组合对应的基站工作参数信息,确定用户的工作地和居住地。
上述基站工作参数包括基站的传输距离,基站的位置设置;根据用户信令信息对应经过的基站信息可以对用户的工作地和居住地进行判断,根据工作日工作时间的信令对应的基站信息可以确定用户的工作地范围,根据工作日非工作时间的信令对应得基站信息可以确定用户的居住地范围。
上述关于职驻地信息的确定,职驻地数据与外围数据中的房价信息相关联,进而可以判定用户的消费承受能力。根据用户的职驻地信息,再结合职驻地之间用户通过的基站,可以计算出用户出行的大致距离,分别汇总得到用户的通勤距离数据。接下来的步骤是对用户出行的确定,如下。
步骤S208,根据用户的信令信息,确定信令信息所属的基站;
步骤S210,判断基站和用户的职驻地的距离是否大于预设的距离阈值;如果是,执行步骤S212,如果不是,执行步骤S214。其中,该距离阈值可以根据用户的工作地和居住地之间的距离进行设置;
步骤S212,确定用户发生出行行为;
步骤S214,确定用户未发生出行行为;
步骤S216,根据基站,确定用户的出行目的地。
由于运营商的基站传输距离有限,因此可通过基站切换的关系和基站之间的距离来获知用户是否有出行行为。例如,基站通常的覆盖范围为500m-2000m,基站覆盖密集的地方基本都是500m左右一个基站,若用户出现在A-B-C-D四个基站间的切换,且距离超过500m,则可判定为用户出行;若用户出现在A-B-A两个基站间的切换,但距离小于500m,可能由于手机在两个基站之间接收到的基站的发射功率比较接近,因此判定为用户未出行;如用户出现在A-B-C三个基站间的切换,但距离小于500m,结合基站之间的距离等条件,则可判定用户出行。
通过对用户出行的判断,从而对用户出行行为进行计数,且由于运营商的基站是分省部署,因此通过不同省的数据可以判定用户的跨省行为,获得用户跨省出行的行为数据。
上述的出行数据是通过基站的切换关系和距离进行判断的,包括出行时间、距离、地点的数据信息,如:职驻地间的出行时间、距离、地点比较固定可以判定为惯常的出行;非职驻地间的出行也可通过用户通信数据的变化进行判断;通过对用户出行数据的记录,可根据出行距离和耗时预判用户的出行工具,从而侧面反映用户的消费水平。用户上网行为对消费水平的判断也很重要,下述为通过用户上网信息确定用户上网行为偏好的步骤:
步骤S218,当用户的终端产生流量时,获取用户的上网数据;该上网数据包括访问网站类型、消耗时间和消耗流量;上述访问网站类型包括门户网站(综合网站)、行业网站、娱乐网站等,如:用户浏览电信行业网站1h,消耗流量50兆。
步骤S220,对上网数据进行上网统计分类,得到每个上网类别对应的消耗时间和消耗流量;该上网类别至少包括新闻类或购物类。
运营商通常具备收集用户上网行为的能力,运营商可以对收集到的用户手机上网信息进行解析,获知用户访问的网站类型、消耗的时间、消耗的流量等信息,并对这些信息归纳总结,将其标签化处理,如标识为新闻类、购物类等。利用这类数据,可以得到每个用户在每类标签上的时间和消耗流量,以此可以对用户的行为偏好有所了解,即用户画像。
上述上网行为的偏好数据可以通过对用户上网信息的解析得到的,上网行为的偏好的数据需要对用户浏览的数据如:新闻网页、购物网站、娱乐消息等数据进行整理,分析出用户上网浏览时间长和信息下载量大的数据,从而得到上网行为的偏好数据。通过对上网行为偏好数据的统计可以分析用户的消费喜好,进而判断用户的消费水平。
上述职驻地的确定、出行数据的确定以及上网行为偏好的确定步骤没有先后之分,图2中只顺序体现。
步骤S222,对属性数据进行聚类分析和指数化分析,得到用户的消费能力分析结果。
上述通过对用户通信数据的分析,确定用户职驻地的数据、用户出行数据和用户上网行为偏好的属性数据可以从多个维度对用户的消费能力进行分析,分析结果较为全面且准确度高。
参见图3所示另一种用户消费能力的分析方法流程图,该方法在图1所示方法的基础上实现的,该方法通过对属性数据聚类和指数化分析,得到用户的消费能力分析结果,该方法包括如下步骤:
步骤S302,获取来自运营商的用户通信数据及外围数据;
步骤S304,通过用户通信数据,确定用户的属性数据;
上述属性数据进行聚类分析和指数化分析的步骤之前,方法还包括:
根据用户的身份标识,对属性数据进行合并,得到用户的各维度的属性数据;根据移动终端信息,剔除所述用户为物联网设备的相关数据;相关数据至少包括用户通信数据、外围数据及属性数据中的一种或多种;通过预设的填充值填充属性数据中的空白数据。
预设填充值是由于部分维度的数据可能因为数据缺失或数据无法获取或其他原因数据值为空,因此需要对这些空值进行填补,填补的手段有很多种,通常采用的填充值可以为填0、填中位数、填平均数等方式,预设的填充值可根据不同的维度进行调整,最终获得所有用户在所有维度上都有值的数据。如,将属性数据的内容按照用户的身份标识进行合并,获得各用户在各个维度的数据。下述为对属性数据进行聚类分析的步骤如下:
步骤S306,采用PCA(Principal Component Analysis,主成分析)算法对属性数据进行降维处理;通过PCA算法将存储多个维度的数据合并为若干个重点维度,从而降低聚类时的计算强度。
步骤S308,采用KMeans算法(K-均值算法)对降维处理后的属性数据进行分类,得到用户的分类结果。
具体地,首先对所有维度进行数据标准化,将若干个维度的数据统一标准化至0-1之间;再对这若干维度的数据使用KMeans算法进行聚类,得到K类人群,其中K为聚类时的群组数,可进行配置。经过KMeans算法操作后的每一类人在某种维度集合上均具有的相同特征。例如,低消费人群的数据标准化的均值小于0.6;中消费人群的数据标准化的均值在0.6-0.8的范围内;高消费人群的数据标准化的均值在0.8以上。下述为对属性数据进行指数化分析的步骤,如下:
步骤S310,对降维处理后的属性数据中,各维度的数据相加,再除以属性数据的维度总数,得到用户的指数化分析结果。如将用户群体进行0-100指数化,将经过PCA算法后的若干个维度数据相加,除以维度数,再乘以100,得到的是每个用户0-100的指数化数字。
上述上述对属性数据进行聚类分析和指数化分析的步骤不分前后,图3中只顺序体现。
上述对属性数据进行聚类分析和指数化分析的步骤,包括:对属性数据中,各维度设置维度权重;根据维度权重,对属性数据进行聚类分析和指数化分析。在聚类过程和指数化过程中,可以默认所有维度的权重都相同,若对某些维度较为关注,还可以在KMeans算法之前对每个维度的权重进行调整,但通常所有维度的权重相加等于1。
上述方法通过对属性数据进行聚类分析和指数化分析,得到消费用户的消费能力分析结果,可以从多个维度对用户的消费能力进行分析,分析结果较为全面且准确度高。
基于上述用户消费能力的分析方法,图4所示为该方法中的数据流向示意图;收集运营商数据后,通过信令信息对用户的职驻地进行判定,进而对用户的出行进行判定,得到用户的出行数据,外围数据、出行数据以及用户上网喜好数据共同构成了用户的属性数据,清洗掉用户属性数据中物联网设备的部分,对属性数据进行聚类和指数化处理,得到用户的消费能力分析结果。
本发明实施例通过用户的通信数据可以从多个维度对用户的消费能力进行分析,分析结果较为全面且准确度高。
参见图5所示的一种用户消费能力的分析装置的结构示意图;该装置包括:
通信数据采集模块50,用于获取来自运营商的用户通信数据和外围数据;外围数据包括移动终端信息和/或住房信息;
属性数据采集模块51,用于通过用户通信数据和外围数据,确定用户的属性数据;属性数据包括至少一部分外围数据、职驻地、出行数据和上网行为偏好中的一种或多种;职驻地包括用户的工作地和居住地;
属性数据分析模52,用于对属性数据进行聚类分析和指数化分析,得到用户的消费能力分析结果。
本发明提供了一种用户消费能力的分析装置,该装置包括:获取来自运营商的用户通信数据和外围数据;外围数据包括终端信息和/或住房信息;通过用户通信数据和外围数据,确定用户的属性数据;属性数据包括至少一部分外围数据、职驻地、出行数据和上网行为偏好中的一种或多种;职驻地包括用户的工作地和居住地;对属性数据进行聚类分析和指数化分析,得到用户的消费能力分析结果。该装置通过用户的通信数据可以从多个维度对用户的消费能力进行分析,分析结果较为全面且准确度高。
本发明实施例提供的用户消费能力的分析装置,与上述实施例提供的用户的消费能力的分析方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
本发明实施例所提供的用户消费能力的分析方法和装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种用户消费能力的分析方法,其特征在于,所述方法包括:
获取来自运营商的用户通信数据和外围数据;所述外围数据包括移动终端信息和/或住房信息;
通过所述用户通信数据和所述外围数据,确定用户的属性数据;所述属性数据包括至少一部分外围数据、职驻地、出行数据和上网行为偏好中的一种或多种;所述职驻地包括所述用户的工作地和居住地;
对所述属性数据进行聚类分析和指数化分析,得到所述用户的消费能力分析结果。
2.根据权利要求1所述的方法,其特征在于,所述用户通信数据包括所述用户的用户识别号、月出账金额、月流量消耗、基站位置信息、终端串号、所述终端串号对应的终端入网型号信息、信令信息、上网信息中的多种。
3.根据权利要求1所述的方法,其特征在于,所述通过所述用户通信数据,确定用户的职驻地的步骤,包括:
按照预设的时间段,对所述用户通信数据中的信令信息进行划分,得到多组信令组合;多组所述信令组合包括工作日工作时间信令组合、工作日非工作时间信令组合和节假日信令组合;
根据每组所述信令组合对应的基站工作参数信息,确定所述用户的工作地和居住地。
4.根据权利要求1所述的方法,其特征在于,所述通过所述用户通信数据,确定用户的出行数据的步骤,包括:
根据所述用户的信令信息,确定所述信令信息所属的基站;
判断所述基站和所述用户的职驻地的距离是否大于预设的距离阈值;
如果是,确定所述用户发生出行行为;
根据所述基站,确定所述用户的出行目的地。
5.根据权利要求1所述的方法,其特征在于,所述通过所述用户通信数据,确定用户的上网行为偏好的步骤,包括:
当所述用户的终端产生流量时,获取所述用户的上网数据;所述上网数据包括访问网站类型、消耗时间和消耗流量;
对所述上网数据进行上网统计分类,得到每个上网类别对应的消耗时间和消耗流量;所述上网类别至少包括新闻类或购物类。
6.根据权利要求1所述的方法,其特征在于,所述对所述属性数据进行聚类分析和指数化分析的步骤之前,所述方法还包括:
根据所述用户的身份标识,对所述属性数据进行合并,得到所述用户的各维度的属性数据;
根据所述移动终端信息,剔除所述用户为物联网设备的相关数据;所述相关数据至少包括用户通信数据、外围数据及属性数据中的一种或多种;
通过预设的填充值填充所述属性数据中的空白数据。
7.根据权利要求1所述的方法,其特征在于,所述对所述属性数据进行聚类分析的步骤,包括:
采用PCA算法对所述属性数据进行降维处理;
采用KMeans算法对降维处理后的所述属性数据进行分类,得到所述用户的分类结果。
8.根据权利要求7所述的方法,其特征在于,对所述属性数据进行指数化分析的步骤,包括:
对降维处理后的所述属性数据中,各维度的数据相加,再除以所述属性数据的维度总数,得到所述用户的指数化分析结果。
9.根据权利要求1所述的方法,其特征在于,所述对所述属性数据进行聚类分析和指数化分析的步骤,包括:
对所述属性数据中,各维度设置维度权重;
根据所述维度权重,对所述属性数据进行聚类分析和指数化分析。
10.一种用户消费能力的分析装置,其特征在于,所述装置包括:
通信数据采集模块,用于获取来自运营商的用户通信数据和外围数据;所述外围数据包括移动终端信息和/或住房信息;
属性数据采集模块用于通过所述用户通信数据和所述外围数据,确定用户的属性数据;所述属性数据包括至少一部分外围数据、职驻地、出行数据和上网行为偏好中的一种或多种;所述职驻地包括所述用户的工作地和居住地;
属性数据分析模块,用于对所述属性数据进行聚类分析和指数化分析,得到所述用户的消费能力分析结果。
CN201810767021.4A 2018-07-12 2018-07-12 用户消费能力的分析方法和装置 Pending CN108898445A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810767021.4A CN108898445A (zh) 2018-07-12 2018-07-12 用户消费能力的分析方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810767021.4A CN108898445A (zh) 2018-07-12 2018-07-12 用户消费能力的分析方法和装置

Publications (1)

Publication Number Publication Date
CN108898445A true CN108898445A (zh) 2018-11-27

Family

ID=64349103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810767021.4A Pending CN108898445A (zh) 2018-07-12 2018-07-12 用户消费能力的分析方法和装置

Country Status (1)

Country Link
CN (1) CN108898445A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635190A (zh) * 2018-11-28 2019-04-16 四川亨通网智科技有限公司 基于位置和行为联合分析的用户特征挖掘方法
CN110084649A (zh) * 2019-04-29 2019-08-02 深圳正品创想科技有限公司 智能售货机信息处理方法及其装置、服务器
CN110942337A (zh) * 2019-10-31 2020-03-31 天津中科智能识别产业技术研究院有限公司 一种基于互联网大数据的精准旅游营销方法
CN111445276A (zh) * 2019-01-17 2020-07-24 苏州黑牛新媒体有限公司 一种可视化的大数据零售行业分析方法
CN112087744A (zh) * 2020-08-21 2020-12-15 宜通世纪科技股份有限公司 一种识别终端型号的方法、系统、装置及存储介质
CN113556722A (zh) * 2020-04-26 2021-10-26 中移(成都)信息通信科技有限公司 一种无线网络用户识别的方法、装置、设备及存储介质
CN114258662A (zh) * 2019-11-04 2022-03-29 深圳市欢太科技有限公司 用户行为数据处理方法、装置、服务器及存储介质
CN114741612A (zh) * 2022-06-13 2022-07-12 北京融信数联科技有限公司 一种基于大数据的消费习惯分类方法、系统和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110149817A1 (en) * 2009-12-23 2011-06-23 Lg Electronics Inc. Transmitting system and method of processing digital broadcast signal in transmitting system, receiving system and method of receiving digital broadcast signal in receiving system
CN103906027A (zh) * 2014-03-28 2014-07-02 中国联合网络通信集团有限公司 一种基于移动用户上网行为的用户价值评价方法和系统
CN104837116A (zh) * 2015-05-11 2015-08-12 广州杰赛科技股份有限公司 用户出行数据检测方法和系统
CN105224681A (zh) * 2015-10-23 2016-01-06 武汉大学 基于家庭工作地上下文环境的用户需求获取方法及系统
CN105373619A (zh) * 2015-12-03 2016-03-02 中国联合网络通信集团有限公司 一种基于用户大数据的用户群体分析方法和系统
CN105634854A (zh) * 2014-11-07 2016-06-01 中兴通讯股份有限公司 用户属性分析方法及装置
CN106779873A (zh) * 2017-01-13 2017-05-31 山东浪潮商用系统有限公司 一种基于电信运营商数据采集、汇总、交易的方法
CN106792514A (zh) * 2016-11-30 2017-05-31 南京华苏科技有限公司 基于信令数据的用户职住地分析方法
CN107086922A (zh) * 2016-02-15 2017-08-22 中国移动通信集团福建有限公司 一种用户行为识别方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110149817A1 (en) * 2009-12-23 2011-06-23 Lg Electronics Inc. Transmitting system and method of processing digital broadcast signal in transmitting system, receiving system and method of receiving digital broadcast signal in receiving system
CN103906027A (zh) * 2014-03-28 2014-07-02 中国联合网络通信集团有限公司 一种基于移动用户上网行为的用户价值评价方法和系统
CN105634854A (zh) * 2014-11-07 2016-06-01 中兴通讯股份有限公司 用户属性分析方法及装置
CN104837116A (zh) * 2015-05-11 2015-08-12 广州杰赛科技股份有限公司 用户出行数据检测方法和系统
CN105224681A (zh) * 2015-10-23 2016-01-06 武汉大学 基于家庭工作地上下文环境的用户需求获取方法及系统
CN105373619A (zh) * 2015-12-03 2016-03-02 中国联合网络通信集团有限公司 一种基于用户大数据的用户群体分析方法和系统
CN107086922A (zh) * 2016-02-15 2017-08-22 中国移动通信集团福建有限公司 一种用户行为识别方法和装置
CN106792514A (zh) * 2016-11-30 2017-05-31 南京华苏科技有限公司 基于信令数据的用户职住地分析方法
CN106779873A (zh) * 2017-01-13 2017-05-31 山东浪潮商用系统有限公司 一种基于电信运营商数据采集、汇总、交易的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
宋少飞: "基于移动通信数据的居民居住地识别方法研究", 《综合运输》 *
杨飞: "《基于手机定位数据的个体出行行为特征分析技术研究方法与实证》", 31 May 2017 *
许洪波: "基于手机信令的空间位置数据计算职住地", 《北京测绘》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635190A (zh) * 2018-11-28 2019-04-16 四川亨通网智科技有限公司 基于位置和行为联合分析的用户特征挖掘方法
CN111445276A (zh) * 2019-01-17 2020-07-24 苏州黑牛新媒体有限公司 一种可视化的大数据零售行业分析方法
CN110084649A (zh) * 2019-04-29 2019-08-02 深圳正品创想科技有限公司 智能售货机信息处理方法及其装置、服务器
CN110942337A (zh) * 2019-10-31 2020-03-31 天津中科智能识别产业技术研究院有限公司 一种基于互联网大数据的精准旅游营销方法
CN114258662A (zh) * 2019-11-04 2022-03-29 深圳市欢太科技有限公司 用户行为数据处理方法、装置、服务器及存储介质
CN113556722A (zh) * 2020-04-26 2021-10-26 中移(成都)信息通信科技有限公司 一种无线网络用户识别的方法、装置、设备及存储介质
CN113556722B (zh) * 2020-04-26 2023-08-15 中移(成都)信息通信科技有限公司 一种无线网络用户识别的方法、装置、设备及存储介质
CN112087744A (zh) * 2020-08-21 2020-12-15 宜通世纪科技股份有限公司 一种识别终端型号的方法、系统、装置及存储介质
CN112087744B (zh) * 2020-08-21 2023-07-25 宜通世纪科技股份有限公司 一种识别终端型号的方法、系统、装置及存储介质
CN114741612A (zh) * 2022-06-13 2022-07-12 北京融信数联科技有限公司 一种基于大数据的消费习惯分类方法、系统和存储介质
CN114741612B (zh) * 2022-06-13 2022-09-02 北京融信数联科技有限公司 一种基于大数据的消费习惯分类方法、系统和存储介质

Similar Documents

Publication Publication Date Title
CN108898445A (zh) 用户消费能力的分析方法和装置
CN106202117B (zh) 数据处理方法、装置和服务器
CN106934627B (zh) 一种电商行业作弊行为的检测方法及装置
CN106504099A (zh) 一种构建用户画像的系统
CN109272408A (zh) 车贷款金融产品智能推荐方法、装置、设备及介质
CN107688987A (zh) 电子装置、保险推荐方法、及计算机可读存储介质
CN104835057A (zh) 一种获取网络用户的消费特征信息的方法及装置
CN106326248A (zh) 数据库数据的存储方法和装置
CN105677787B (zh) 信息搜索装置及信息搜索方法
CN104572775B (zh) 广告分类方法、装置及服务器
CN105975479A (zh) 一种基于标签库的电信用户兴趣度分析方法及系统
CN106911801A (zh) 关联用户信息的方法及信息推送系统
CN105045872A (zh) 信息的筛选方法及装置
CN104935578A (zh) 网站恶意攻击防范方法和系统
CN103426101A (zh) 验证码的生成方法及装置
CN107766214A (zh) 基于spark技术的移动终端数据流处理方法及系统
CN107578272A (zh) 一种为家庭成员画像的方法及装置
CN103713894A (zh) 一种用于确定用户的访问需求信息的方法与设备
CN106611343A (zh) 一种顾客消费行为分析办法
CN109190027A (zh) 多源推荐方法、终端、服务器、计算机设备、可读介质
CN109308615A (zh) 基于统计序列特征的实时欺诈交易检测方法、系统、存储介质及电子终端
CN106302764A (zh) 一种针对wifi设备的信息推送方法和装置
CN113609409A (zh) 一种推荐浏览信息的方法及其系统、电子设备、存储介质
CN106101117B (zh) 一种钓鱼网站阻断方法、装置和系统
CN101770626A (zh) 具有洗卡行为的代理商识别方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181127