CN110490388A - 预测用户收入的方法及系统 - Google Patents
预测用户收入的方法及系统 Download PDFInfo
- Publication number
- CN110490388A CN110490388A CN201910794448.8A CN201910794448A CN110490388A CN 110490388 A CN110490388 A CN 110490388A CN 201910794448 A CN201910794448 A CN 201910794448A CN 110490388 A CN110490388 A CN 110490388A
- Authority
- CN
- China
- Prior art keywords
- user
- income
- attribute
- predicted
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000010586 diagram Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种预测用户收入的方法及系统,其中,该方法包括:建立预测模型,其中所述预测模型包括用于预测用户收入的属性类别及若干收入等级;采集待预测用户与所述预测模型中属性类别相对应的各个属性信息;根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,并根据计算得出的最高概率值所对应的收入等级预测所述待预测用户的收入情况。本发明可以准确预测用户的收入情况,且实现成本低。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种预测用户收入的方法,以及一种预测用户收入的系统。
背景技术
目前,高收入客户的挖掘方法,主要关注发达地区/重点行业,采用人工方式对发达地区和重点行业的人群进行范围性调查和挖掘。上述方式的缺陷在于:其一,目标针对性差,无法定位到精准人群;其二,人工成本过高,需要人为实地;其三,调研结果不准,调研人员素质参差不齐,客户不配合等,导致调研结果可信度差。
因此,提出一种可以准确预测用户收入,同时节约预测成本的方案显得尤为必要。
发明内容
本发明提供一种预测用户收入的方法及系统,以解决目前预测用户收入针对性不强、预测结果不够准确以及成本太高等问题。
为了实现上述目的,本发明提供一种预测用户收入的方法,包括:
建立预测模型,其中所述预测模型包括用于预测用户收入的属性类别及若干收入等级;
采集待预测用户与所述预测模型中属性类别相对应的各个属性信息;
根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,并根据计算得出的最高概率值所对应的收入等级预测所述待预测用户的收入情况。
可选地,所述建立预测模型,包括:
选取用户样本,并划分用于预测用户收入的属性类别;
获取所述用户样本中每个用户的收入信息;
获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息;
根据所述每个用户的收入信息划分用于预测用户收入的若干个收入等级;
计算所述用户样本中所有用户分别在每一收入等级的各个属性信息的概率分布;
将所述属性类别、若干收入等级以及所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布进行关联存储,以建立预测模型。
可选地,所述根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,包括:
根据所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布以及所述待预测用户的各个属性信息,分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,其计算公式为:
P(A|X)=P(x1|A)P(x2|A)…P(xn|A)C/P(X)
式中,P(A|X)表示所述待预测用户落入所述预测模型中某一收入等级的概率值,A表示所述预测模型中某一收入等级,X表示所述待预测用户的所有属性信息;P(x1|A)、P(x2|A)、…、P(xn|A)分别表示所述待预测用户的各个属性落入所述收入等级的概率分布,x1、x2、…、x3分别表示所述待预测用户的各个属性信息;C表示所述用户样本中所有用户落入所述收入等级的总概率;P(X)表示所述待预测用户的各个属性信息的联合概率,其中P(X)=P(x1)P(x2)..P(xn),且P(x1)、P(x2)、…、P(xn)分别表示所述待预测用户的各个属性的概率。
可选地,所述属性类别包括用户基本信息以及用户住宅类型,其中所述用户基本信息包括消费值、年龄、性别以及手机类型;
所述划分用于预测用户收入的属性类别,包括:
分别对所述消费值、年龄、性别、手机类型以及住宅类型进行分类,得到所述属性类别的各个子类别。
可选地,所述获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息,包括:
采集所述用户样本中每个用户的手机号码;
根据每个用户的手机号码对应的国际移动用户识别码从运营商网络系统中获取每个用户的基本信息,其中所述每个用户的基本信息包括每个用户的消费值、年龄、性别以及手机型号;
根据每个用户的基本信息中的消费值、年龄和性别分别确定其与所述属性类别的相应子类别对应的各个属性信息;
根据每个用户的基本信息中的手机型号获取该手机型号对应的手机单价;
根据每个用户的基本信息中的手机型号对应的手机单价确定其与所述手机类型子类别对应的属性信息。
可选地,所述获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息,包括:
获取每个用户的手机号码对应的国际移动用户识别码在预设时间段内附着的小区范围,以得到每个用户对应的住宅区域;
根据所述每个用户的住宅区域获取每个用户的住宅单价,并根据每个用户的住宅单价确定其与所述住宅类型子类别对应的属性信息。
为实现上述目的,本发明相应还提供一种预测用户收入的系统,包括:
预测模型建立模块,用于建立预测模型,其中所述预测模型包括用于预测用户收入的属性类别及若干收入等级;
属性采集模块,用于采集待预测用户与所述预测模型中属性类别相对应的各个属性信息;
收入预测模块,用于根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,并根据计算得出的最高概率值所对应的收入等级预测所述待预测用户的收入情况。
可选地,所述预测模型建立模块,包括:
样本选取单元,用于选取用户样本;
属性类别划分单元,用于划分用于预测用户收入的属性类别;
收入信息获取单元,用于获取所述用户样本中每个用户的收入信息;
属性信息获取单元,用于获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息;
收入等级划分单元,用于根据所述每个用户的收入信息划分用于预测用户收入的若干个收入等级;
第一计算单元,用于计算所述用户样本中所有用户分别在每一收入等级的各个属性信息的概率分布;
预测模型建立单元,用于将所述属性类别、若干收入等级以及所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布进行关联存储,以建立预测模型。
可选地,所述收入预测模块包括:
第二计算单元,用于根据所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布以及所述待预测用户的各个属性信息,分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,其计算公式为:
P(A|X)=P(x1|A)P(x2|A)…P(xn|A)C/P(X)
式中,P(A|X)表示所述待预测用户落入所述预测模型中某一收入等级的概率值,A表示所述预测模型中的某一收入等级,X表示所述待预测用户的所有属性信息;P(x1|A)、P(x2|A)、…、P(xn|A)分别表示所述待预测用户的各个属性落入所述收入等级的概率分布,x1、x2、…、x3分别表示所述待预测用户的各个属性信息;C表示所述用户样本中所有用户落入所述收入等级的总概率;P(X)表示所述待预测用户的各个属性信息的联合概率,其中P(X)=P(x1)P(x2)..P(xn),且P(x1)、P(x2)…P(xn)分别表示所述待预测用户的各个属性的概率。
可选地,所述属性类别包括用户基本信息以及用户住宅类型,其中所述用户基本信息包括消费值、年龄、性别以及手机类型;
所述属性类别划分单元包括:子类别划分单元,用于分别对所述消费值、年龄、性别、手机类型以及住宅类型进行分类,得到所述属性类别的子类别。
可选地,所述属性信息获取单元包括:
手机号码采集单元,用于采集所述用户样本中每个用户的手机号码;
基本信息获取单元,用于根据每个用户的手机号码对应的国际移动用户识别码从运营商网络系统中获取每个用户的基本信息,其中所述每个用户的基本信息包括每个用户的消费值、年龄、性别以及手机型号;
第一单价获取单元,用于根据每个用户的基本信息中的手机型号获取该手机型号对应的手机单价;
第一属性确定单元,用于根据每个用户的基本信息中的消费值、年龄和性别分别确定其与所述属性类别的相应子类别对应的各个属性信息;
第二属性确定单元,用于根据每个用户的基本信息中的手机型号对应的手机单价确定其与所述手机类型子类别对应的属性信息。
可选地,所述属性信息获取单元包括:
住宅区域获取单元,用于获取每个用户的手机号码对应的国际移动用户识别码在预设时间段内附着的小区范围,以得到每个用户对应的住宅区域;
第二单价获取单元,用于根据所述每个用户的住宅区域获取每个用户的住宅单价;
第三属性确定单元,用于根据每个用户的住宅单价确定其与所述住宅类型子类别对应的属性信息。
本发明提供的技术方案带来的有益效果是:
通过建立预测模型,其中所述预测模型包括用于预测用户收入的属性类别及若干收入等级;然后,采集待预测用户与所述预测模型中属性类别相对应的各个属性信息;最后,根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,并根据计算得出的最高概率值所对应的收入等级预测所述待预测用户的收入情况,以达到准确预测用户的收入情况的目的,并实现成本更低的效果。
附图说明
图1为本发明实施例一提供的一种预测用户收入的方法流程图;
图2为本发明实施例一中步骤S10的子步骤流程图;
图3为本发明实施例二提供的一种预测用户收入的方法中步骤S102的子步骤流程图;
图4为本发明实施例三提供的一种预测用户收入的系统结构示意图;
图5为图4中预测模型建立模块10的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
请参照图1,图1为实施例一提供的一种预测用户收入的方法流程图,为解决目前的预测用户高收入群体方案针对性不强、预测结果不够准确以及成本过高等问题,同时提出一种适用性更强的方法,不仅可以准确识别高收入用户群体,同时也可以应用于识别其它非高收入用户群体,本实施例提出一种预测用户收入的方法,其中,该方法可以应用计算机程序实现,该方法包括步骤S10-S30:
步骤S10:建立预测模型,其中所述预测模型包括用于预测用户收入的属性类别及若干收入等级;
本实施例通过预先建立用于预测用户收入的预测模型,该预测模型包括属性类别和若干收入等级,其中,属性类别可以包括消费值、年龄和性别等,若干收入等级可以根据用户的年收入进行划分,本实施例以预测高收入用户为例,例如年收入500万以上作为等级1,100万-500万作为等级2..依此类推,根据该预测模型可以适用于不同的收入群体。
需要说明的是,根据不同的用户收入预测需求,可以建立不同的预测模型,例如,当需要预测高收入用户群体,则可以将收入等级划分高一些,如果需要预测低收入用户群体,则可以将收入等级划分低一些,本实施例的预测方案性较现有技术而言,适用性及针对性更强。
结合图2,图2为步骤S10的子步骤流程图,具体地,步骤S10包括以下步骤:
S101:选取用户样本,并划分用于预测用户收入的属性类别;
具体地,为了建立完善的预测模型,本实施例需要选取足量的用户样本,该足量用户样本获取方式可以通过商家平台获取在平台上消费的已有用户群体或通过第三方收集;
可选地,所述属性类别包括用户基本信息以及用户住宅类型,其中所述用户基本信息包括消费值、年龄、性别以及手机类型;
所述划分用于预测用户收入的属性类别,包括,分别对所述消费值、年龄、性别、手机类型以及住宅类型进行分类,得到所述属性类别的各个子类别。
本实施例的消费值可以为arpu值(average revenue per user,每用户平均收入),arpu注重的是一个时间段内运营商从每个用户所得到的利润。为了实现商家用户对用户进行准确地收入定位,因此,arpu值可以作为用户收入预测的重要指标。
需要说明的是,所述子类别表示各个属性类别的对应属性信息在一定范围上的分类,例如,用户的apr值可以划分为2000以上,1000-2000…,其中,2001、2500、3000…,其apr值均划分至arp值为2000以上,用户的住宅单价超过1000万的住宅类型划分至高端类型,住宅单价低于200万的划分为低端住宅类型等;手机单价8000以上为高端手机类型,4000-8000为中端类型,低于4000为低端类型等。
S102:获取所述用户样本中每个用户的收入信息;
S103:获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息;
如下表1:
表1
需要说明的是,本实施例所述的用户样本中每个用户的收入信息,根据收入等级的划分标准进行采集对应的收入信息,例如,收入等级按照用户年收入进行划分,则采集用户的年收入信息,如果收入等级是按照用户的季度收入进行划分,则仅需要手机用户的季度收入信息。
S104:根据所述每个用户的收入信息划分用于预测用户收入的若干个收入等级;
前文已对如何进行收入等级的划分进行详细描述,此处不再赘述,其中,本实施例的收入等级如表2:
表2
S105:计算所述用户样本中所有用户分别在每一收入等级的各个属性信息的概率分布;
以arpu值分别落入等级为500万和100-500万的概率分布为例,如下表3和表4:
表3
表4
S106:将所述属性类别、若干收入等级以及所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布进行关联存储,以建立预测模型。
为了便于实现对用户收入的准确预测,本实施例基于足量的用户样本建立适用性更强、数据更加准确的预测模型,通过将所划分的属性类别、收入等级以及用户样本中所有用户在每一收入等级的每个属性的概率分布进行关联存储,在采用本实施例所提供的方法对待预测用户进行预测时,可以快速查找到该待预测用户的每个属性信息所对应的概率分布,并最终确定该待预测用户的收入等级。
步骤S20:采集待预测用户与所述预测模型中属性类别相对应的各个属性信息;
具体地,根据本实施例所建立的预测模型所划分的属性类别采集待预测用户的各个属性信息,同时将所采集到的各个属性信息归入相应的子类别中,例如,本实施例划分属性类别包括arpu值、年龄、性别、手机类型和住宅类型,所采集到的待预测用户信息为700arp值、女性、20岁、手机单价6000以及住宅单价300万,则该待预测用户属性信息为500-1000arp值、女性性别、20-30年龄、中端手机类型、中端住宅类型,进而通过步骤S30找出预测模型中每个属性信息对应的概率分布,最终实现待预测用户的收入等级的精准预测。
步骤S30:根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,并根据计算得出的最高概率值所对应的收入等级预测所述待预测用户的收入情况。
具体地,所述根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,包括:
根据所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布以及所述待预测用户的各个属性信息,分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,其计算公式为:
P(A|X)=P(x1|A)P(x2|A)…P(xn|A)C/P(X)
式中,P(A|X)表示所述待预测用户落入所述预测模型中某一收入等级的概率值,A表示所述预测模型中的某一收入等级,X表示所述待预测用户的所有属性信息;P(x1|A)、P(x2|A)、…、P(xn|A)分别表示所述待预测用户的各个属性落入所述收入等级的概率分布,x1、x2、…、x3分别表示所述待预测用户的各个属性信息;C表示所述用户样本中所有用户落入所述收入等级的总概率;P(X)表示所述待预测用户的各个属性信息的联合概率,其中P(X)=P(x1)P(x2)..P(xn),且P(x1)、P(x2)…P(xn)分别表示所述待预测用户的各个属性的概率。
本实施例通过属性/概率两个值,逐个计算分级收入概率,概率最高者视为该用户的预测收入。本实施例以划分五个属性类别为例,举例如下:
事件A,500万以上:
P(A|X)=P(A|x1,x2,...,x5)
=P(x1,x2,…,x5|A)P(A)/P(x1,x2,…,x5)
=P(x1|A)P(x2|A)…P(x5|A)P(A)/P(x1,x2,…,x5)
=P(x1|A)P(x2|A)…P(x5|A)C1/P(X)
事件B,100-500万:
P(B|X)=P(B|x1,x2,…,x5)
=P(x1,x2,…,x5|B)P(B)/P(x1,x2,…,x5)
=P(x1|B)P(x2|B)…P(x5|B)P(B)/P(x1,x2,…,x5)
=P(x1|B)P(x2|B)…P(x5|B)C2/P(X)
其中,省略部分为属性三(x3)和属性四(x4)在事件A或事件B中的计算过程,其计算方式与其它属性一致,并且,以上变换根据贝叶斯公式推导而来,贝叶斯公式:P(a|b)=P(b|a)P(a)/P(b)。
需要说明的是,式中:C1,C2为恒量,C1、C2代表每个分类结果的概率(例如,C1代表所有客户收入在500万以上的概率P(A)、C2代表所有客户收入在100-500万的概率P(B));
P(X)代表各属性的联合概率P(x1)P(x2)P(x3)P(x4)P(x5),对于任一用户,根据其x1、x2、x3、x4、x5的值计算到的P(X)在各式中的值相等。
本实施例提供的预测用户收入的方法首先建立预测模型,其中所述预测模型包括用于预测用户收入的属性类别及若干收入等级;然后,采集待预测用户与所述属性类别相对应的各个属性信息;最后,根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入各个收入等级的概率值,并根据最高概率值对应的收入等级预测所述待预测用户的收入情况。本实施例可以准确预测用户的收入情况,且实现成本更低;进一步的,本实施例预测用户收入方案其适用性更广、针对性更强,不仅可以准确识别高收入用户群体,同时也可以应用于识别其它非高收入用户群体,且可以针对特定用户进行该用户收入的准确预测。
请参照图2,图2为实施例二提供的一种预测用户收入的方法流程图,本实施例所提供的一种预测用户收入的方法,通过采集用户样本中用户的手机号码,并根据手机号码对应的国际移动用户识别码获取对应的基本信息,且可以广泛应用于各类手机运营商或电信运营商平台,与实施例一不同的是,本实施例针对步骤S10的子步骤S102进一步划分,具体地,所述步骤S102包括以下步骤:
S102a:采集所述用户样本中每个用户的手机号码;
由于目前的用户在注册手机号码时均需要进行实名制认证,在实名制认证过程中即涉及用户基本信息的填报,本实施例通过采集用户的手机号码实现用户基本信息的采集,相较现有技术中对用户基本信息采集通过人工数据搜集等手段,本实施例可以高效、快速获取用户的基本信息,且准确度更高,为进一步准确预测用户收入等级奠定基础。
S102b:根据每个用户的手机号码对应的国际移动用户识别码从运营商网络系统中获取每个用户的基本信息,其中所述每个用户基本信息包括每个用户的消费值、年龄、性别以及手机型号;
需要说明的是,消费值可以是客户源在对应商家中消费的均值,可以根据不同的商家定义,例如,对于电信运营商平台的用户,其消费值可以是用户充值话费、购买手机、办理宽带等业务在该电信运营商平台所消费的额度。
S102c:根据每个用户的基本信息中的消费值、年龄和性别分别确定其与所述属性类别的相应子类别对应的各个属性信息;
S102d:根据每个用户的基本信息中的手机型号获取该手机型号对应的手机单价;
S102e:根据每个用户的手机型号对应的手机单价确定其与所述手机类型子类别对应的属性信息。
具体地,如下表5:
表5
序号 | IMSI | arpu值 | 年龄 | 性别 | 手机类型 |
1 | 0 | 2000以上 | 60以上 | 男 | 高端 |
2 | 1 | 1000-2000 | 40-60 | 女 | 高端 |
3 | 2 | 500-1000 | 30-40 | 男 | 低端 |
4 | 3 | 300-500 | 20-30 | 女 | 中端 |
5 | 4 | 100-200 | 20以下 | 男 | 中端 |
… | … | … | … | … | … |
为了准确获取样本用户的住宅区域,本实施例通过基站定位,实现对每位用户的住宅区域进行准确识别,具体地,所述获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息,还包括以下步骤:
S102f:获取每个用户的手机号码对应的国际移动用户识别码在预设时间段内附着的小区范围,以得到每个用户对应的住宅区域;
需要说明的是,该预设时间段主要考虑用户停留在工作场所的时间以及停留在住宅区域的时间,本实施例以获取用户的住宅区域为例,通常用户在24:00-6:00的时间内在家休息,因此本实施例的预设时间段设定为凌晨24:00-6:00,以准确获取用户的住宅区域。
S102g:根据所述每个用户的住宅区域获取每个用户的住宅单价,并根据每个用户的住宅单价确定其与所述住宅类型子类别对应的属性信息。
具体地,本实施例通过HSS(Home Subscriber Server,归属签约用户服务器)/MME(Mobility Management Entity,移动管理实体)与eNodeB建立通信,获取每个IMSI(International Mobile Subscriber Identification Number,国际移动用户识别码)24-6点的附着的eNodeB基站/扇区,根据eNodeB基站/扇区得出客户所在小区范围,以120度扇区为例(通常eNodeB为三扇区,覆盖半径不高于200m):根据基站的GPS位置,120度,200m半径:可得到GPS覆盖范围,进而得到用户工作场所与所在住宅。根据住宅单价得到住宅类型,形成记录如下表6:
表6
序号 | IMSI | 住宅类型 |
1 | 0 | 高端 |
2 | 1 | 普通 |
3 | 2 | 普通 |
4 | 3 | 高端 |
5 | 4 | 高端 |
… | … | … |
请参照图4和图5,图4为实施例三提供一种预测用户收入的系统结构示意图,所述系统包括:
预测模型建立模块10,用于建立预测模型,其中所述预测模型包括用于预测用户收入的属性类别及若干收入等级;
属性采集模块20,用于采集待预测用户与所述预测模型中属性类别相对应的各个属性信息;
收入预测模块30,用于根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,并根据计算得出的最高概率值所对应的收入等级预测所述待预测用户的收入情况。
可选地,结合图5,图5为预测模型建立模块10的结构示意图,所述预测模型建立模块10包括:
样本选取单元101,用于选取用户样本;
属性类别划分单元102,用于划分用于预测用户收入的属性类别;
收入信息获取单元103,用于获取所述用户样本中每个用户的收入信息;
属性信息获取单元104,用于获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息;
收入等级划分单元105,根据所述每个用户的收入信息划分用于预测用户收入的若干个收入等级;
第一计算单元106,用于计算所述用户样本中所有用户分别在每一收入等级的各个属性信息的概率分布;
预测模型建立单元107,用于将所述属性类别、若干收入等级以及所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布进行关联存储,以建立预测模型。
可选地,所述收入预测模块30包括:
第二计算单元,用于根据所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布以及所述待预测用户的各个属性信息,分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,其计算公式为:
P(A|X)=P(x1|A)P(x2|A)…P(xn|A)C/P(X)
式中,P(A|X)表示所述待预测用户落入所述预测模型中某一收入等级的概率值,A表示所述预测模型中的某一收入等级,X表示所述待预测用户的所有属性信息;P(x1|A)、P(x2|A)、…、P(xn|A)分别表示所述待预测用户的各个属性落入所述收入等级的概率分布,x1、x2、…、x3分别表示所述待预测用户的各个属性信息;C表示所述用户样本中所有用户落入所述收入等级的总概率;P(X)表示所述待预测用户的各个属性信息的联合概率,其中P(X)=P(x1)P(x2)..P(xn),且P(x1)、P(x2)…P(xn)分别表示所述待预测用户的各个属性的概率。
可选地,所述属性类别包括用户基本信息以及用户住宅类型,其中所述用户基本信息包括消费值、年龄、性别以及手机类型;
所述属性类别划分单元102包括:子类别划分单元,用于分别对所述消费值、年龄、性别、手机类型以及住宅类型进行分类,得到所述属性类别的子类别。
可选地,所述属性信息获取单元104包括:
手机号码采集单元,用于采集所述用户样本中每个用户的手机号码;
基本信息获取单元,用于根据每个用户的手机号码对应的国际移动用户识别码从运营商网络系统中获取每个用户的基本信息,其中所述每个用户的基本信息包括每个用户的消费值、年龄、性别以及手机型号;
第一单价获取单元,用于根据每个用户的基本信息中的手机型号获取该手机型号对应的手机单价;
第一属性确定单元,用于根据每个用户的基本信息中的消费值、年龄和性别分别确定其与所述属性类别的相应子类别对应的各个属性信息;
第二属性确定单元,用于根据每个用户的基本信息中的手机型号对应的手机单价确定其与所述手机类型子类别对应的属性信息。
可选地,所述属性信息获取单元104包括:
住宅区域获取单元,用于获取每个用户的手机号码对应的国际移动用户识别码在预设时间段内附着的小区范围,以得到每个用户对应的住宅区域;
第二单价获取单元,用于根据所述每个用户的住宅区域获取每个用户的住宅单价;
第三属性确定单元,用于根据每个用户的住宅单价确定其与所述住宅类型子类别对应的属性信息。
综上所述:本发明提供的预测用户收入的方法及系统,建立预测模型,其中所述预测模型包括用于预测用户收入的属性类别及若干收入等级;采集待预测用户与所述预测模型中属性类别相对应的各个属性信息;根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,并根据计算得出的最高概率值所对应的收入等级预测所述待预测用户的收入情况,实现准确预测用户的收入情况,且实现成本更低的效果;进一步的,本发明科学合理地建立预测模型,其适用性更广、针对性更强,不仅可以准确识别高收入用户群体,同时也可以应用于识别其它非高收入用户群体,且可以针对特定用户进行该用户收入的准确预测;进一步的,本发明基于样本用户的国际移动用户识别码获取用户的相关属性信息以建立预测模型,其预测模型的建立更加高效和准确,进一步提高用户收入预测的准确度。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (12)
1.一种预测用户收入的方法,其特征在于,包括:
建立预测模型,其中所述预测模型包括用于预测用户收入的属性类别及若干收入等级;
采集待预测用户与所述预测模型中属性类别相对应的各个属性信息;
根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,并根据计算得出的最高概率值所对应的收入等级预测所述待预测用户的收入情况。
2.根据权利1所述的方法,其特征在于,所述建立预测模型,包括:
选取用户样本,并划分用于预测用户收入的属性类别;
获取所述用户样本中每个用户的收入信息;
获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息;
根据所述每个用户的收入信息划分用于预测用户收入的若干个收入等级;
计算所述用户样本中所有用户分别在每一收入等级的各个属性信息的概率分布;
将所述属性类别、若干收入等级以及所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布进行关联存储,以建立预测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,包括:
根据所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布以及所述待预测用户的各个属性信息,分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,其计算公式为:
P(A|X)=P(x1|A)P(x2|A)…P(xn|A)C/P(X)
式中,P(A|X)表示所述待预测用户落入所述预测模型中某一收入等级的概率值,A表示所述预测模型中某一收入等级,X表示所述待预测用户的所有属性信息;P(x1|A)、P(x2|A)、…、P(xn|A)分别表示所述待预测用户的各个属性落入所述收入等级的概率分布,x1、x2、…、x3分别表示所述待预测用户的各个属性信息;C表示所述用户样本中所有用户落入所述收入等级的总概率;P(X)表示所述待预测用户的各个属性信息的联合概率,其中P(X)=P(x1)P(x2)..P(xn),且P(x1)、P(x2)、…、P(xn)分别表示所述待预测用户的各个属性的概率。
4.根据权利要求2所述的方法,其特征在于,所述属性类别包括用户基本信息以及用户住宅类型,其中所述用户基本信息包括消费值、年龄、性别以及手机类型;
所述划分用于预测用户收入的属性类别,包括:
分别对所述消费值、年龄、性别、手机类型以及住宅类型进行分类,得到所述属性类别的各个子类别。
5.根据权利要求4所述的方法,其特征在于,所述获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息,包括:
采集所述用户样本中每个用户的手机号码;
根据每个用户的手机号码对应的国际移动用户识别码从运营商网络系统中获取每个用户的基本信息,其中所述每个用户的基本信息包括每个用户的消费值、年龄、性别以及手机型号;
根据每个用户的基本信息中的消费值、年龄和性别分别确定其与所述属性类别的相应子类别对应的各个属性信息;
根据每个用户的基本信息中的手机型号获取该手机型号对应的手机单价;
根据每个用户的基本信息中的手机型号对应的手机单价确定其与所述手机类型子类别对应的属性信息。
6.根据权利要求4所述的方法,其特征在于,所述获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息,包括:
获取每个用户的手机号码对应的国际移动用户识别码在预设时间段内附着的小区范围,以得到每个用户对应的住宅区域;
根据所述每个用户的住宅区域获取每个用户的住宅单价,并根据每个用户的住宅单价确定其与所述住宅类型子类别对应的属性信息。
7.一种预测用户收入的系统,其特征在于,包括:
预测模型建立模块,用于建立预测模型,其中所述预测模型包括用于预测用户收入的属性类别及若干收入等级;
属性采集模块,用于采集待预测用户与所述预测模型中属性类别相对应的各个属性信息;
收入预测模块,用于根据所述预测模型以及所述待预测用户的各个属性信息分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,并根据计算得出的最高概率值所对应的收入等级预测所述待预测用户的收入情况。
8.根据权利7所述的系统,其特征在于,所述预测模型建立模块,包括:
样本选取单元,用于选取用户样本;
属性类别划分单元,用于划分用于预测用户收入的属性类别;
收入信息获取单元,用于获取所述用户样本中每个用户的收入信息;
属性信息获取单元,用于获取所述用户样本中每个用户的与所述属性类别相对应的各个属性信息;
收入等级划分单元,用于根据所述每个用户的收入信息划分用于预测用户收入的若干个收入等级;
第一计算单元,用于计算所述用户样本中所有用户分别在每一收入等级的各个属性信息的概率分布;
预测模型建立单元,用于将所述属性类别、若干收入等级以及所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布进行关联存储,以建立预测模型。
9.根据权利要求8所述的系统,其特征在于,所述收入预测模块包括:
第二计算单元,用于根据所述用户样本中所有用户分别在每一收入等级的各个属性的概率分布以及所述待预测用户的各个属性信息,分别计算所述待预测用户落入所述预测模型中各个收入等级的概率值,其计算公式为:
P(A|X)=P(x1|A)P(x2|A)…P(xn|A)C/P(X)
式中,P(A|X)表示所述待预测用户落入所述预测模型中某一收入等级的概率值,A表示所述预测模型中的某一收入等级,X表示所述待预测用户的所有属性信息;P(x1|A)、P(x2|A)、…、P(xn|A)分别表示所述待预测用户的各个属性落入所述收入等级的概率分布,x1、x2、…、x3分别表示所述待预测用户的各个属性信息;C表示所述用户样本中所有用户落入所述收入等级的总概率;P(X)表示所述待预测用户的各个属性信息的联合概率,其中P(X)=P(x1)P(x2)..P(xn),且P(x1)、P(x2)…P(xn)分别表示所述待预测用户的各个属性的概率。
10.根据权利要求8所述的系统,其特征在于,所述属性类别包括用户基本信息以及用户住宅类型,其中所述用户基本信息包括消费值、年龄、性别以及手机类型;
所述属性类别划分单元包括:子类别划分单元,用于分别对所述消费值、年龄、性别、手机类型以及住宅类型进行分类,得到所述属性类别的子类别。
11.根据权利要求10所述的系统,其特征在于,所述属性信息获取单元包括:
手机号码采集单元,用于采集所述用户样本中每个用户的手机号码;
基本信息获取单元,用于根据每个用户的手机号码对应的国际移动用户识别码从运营商网络系统中获取每个用户的基本信息,其中所述每个用户的基本信息包括每个用户的消费值、年龄、性别以及手机型号;
第一单价获取单元,用于根据每个用户的基本信息中的手机型号获取该手机型号对应的手机单价;
第一属性确定单元,用于根据每个用户的基本信息中的消费值、年龄和性别分别确定其与所述属性类别的相应子类别对应的各个属性信息;
第二属性确定单元,用于根据每个用户的基本信息中的手机型号对应的手机单价确定其与所述手机类型子类别对应的属性信息。
12.根据权利要求10所述的系统,其特征在于,所述属性信息获取单元包括:
住宅区域获取单元,用于获取每个用户的手机号码对应的国际移动用户识别码在预设时间段内附着的小区范围,以得到每个用户对应的住宅区域;
第二单价获取单元,用于根据所述每个用户的住宅区域获取每个用户的住宅单价;
第三属性确定单元,用于根据每个用户的住宅单价确定其与所述住宅类型子类别对应的属性信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910794448.8A CN110490388A (zh) | 2019-08-27 | 2019-08-27 | 预测用户收入的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910794448.8A CN110490388A (zh) | 2019-08-27 | 2019-08-27 | 预测用户收入的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110490388A true CN110490388A (zh) | 2019-11-22 |
Family
ID=68554192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910794448.8A Pending CN110490388A (zh) | 2019-08-27 | 2019-08-27 | 预测用户收入的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110490388A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112668703A (zh) * | 2021-01-19 | 2021-04-16 | 上海优扬新媒信息技术有限公司 | 一种用户收入确定方法及装置 |
CN113674076A (zh) * | 2020-05-15 | 2021-11-19 | 马上消费金融股份有限公司 | 一种用户授信额度的确定方法及装置 |
WO2023115884A1 (zh) * | 2021-12-21 | 2023-06-29 | 深圳前海微众银行股份有限公司 | 有序分类标签确定方法、装置、电子设备及存储介质 |
-
2019
- 2019-08-27 CN CN201910794448.8A patent/CN110490388A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113674076A (zh) * | 2020-05-15 | 2021-11-19 | 马上消费金融股份有限公司 | 一种用户授信额度的确定方法及装置 |
CN112668703A (zh) * | 2021-01-19 | 2021-04-16 | 上海优扬新媒信息技术有限公司 | 一种用户收入确定方法及装置 |
WO2023115884A1 (zh) * | 2021-12-21 | 2023-06-29 | 深圳前海微众银行股份有限公司 | 有序分类标签确定方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bachir et al. | Inferring dynamic origin-destination flows by transport mode using mobile phone data | |
US8792909B1 (en) | Systems and methods for statistically associating mobile devices to households | |
CN110490388A (zh) | 预测用户收入的方法及系统 | |
RU2604517C2 (ru) | Система и способ предоставления контента абоненту | |
CN110991875B (zh) | 一种平台用户质量评估系统 | |
US8700631B2 (en) | Tempo spatial data extraction from network connected devices | |
CN107086922B (zh) | 一种用户行为识别方法和装置 | |
CN108154425B (zh) | 一种结合社会网络和位置的线下商户推荐方法 | |
CN109978608A (zh) | 目标用户画像的营销标签分析提取方法及系统 | |
Baggio et al. | Strategic visitor flows and destination management organization | |
CN105556554A (zh) | 多个设备相关性 | |
CN103150696A (zh) | 选择目标增值业务潜在客户的方法及装置 | |
CN103577660B (zh) | 灰度实验系统和方法 | |
CN106776925B (zh) | 一种移动终端用户性别的预测方法、服务器和系统 | |
CN108712712A (zh) | 无线保真WiFi网络关联信息显示方法及装置 | |
CN106060865B (zh) | 一种基于wifi信息建立用户画像的方法 | |
CN105824818A (zh) | 一种信息化管理方法、平台及系统 | |
CN110675179A (zh) | 营销信息处理方法、装置、电子设备及可读存储介质 | |
Lee et al. | Understanding continued ubiquitous decision support system usage behaviour | |
WO2018226173A2 (en) | A system for demographic analysis of mobile operator subscribers visiting the areas wherein indoor base station is established | |
CN111861526B (zh) | 一种分析对象来源的方法和装置 | |
CN108647189B (zh) | 一种识别用户人群属性的方法及装置 | |
CN101751611A (zh) | 渠道酬金结算方法、装置及系统 | |
KR20110045220A (ko) | 상권 현황 평가 시스템 및 그 방법 | |
CN109919811B (zh) | 基于大数据的保险代理人培养方案生成方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191122 |
|
RJ01 | Rejection of invention patent application after publication |