CN102541886B - 一种识别用户群和用户之间关系的系统和方法 - Google Patents
一种识别用户群和用户之间关系的系统和方法 Download PDFInfo
- Publication number
- CN102541886B CN102541886B CN201010596310.6A CN201010596310A CN102541886B CN 102541886 B CN102541886 B CN 102541886B CN 201010596310 A CN201010596310 A CN 201010596310A CN 102541886 B CN102541886 B CN 102541886B
- Authority
- CN
- China
- Prior art keywords
- user
- information
- customer group
- index
- incidence relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
本发明涉及一种采集和利用用户特征数据识别用户群和用户之间关系的系统,包括用户数据仓库、中间数据采集存储装置、特征数据采集存储装置、特征数据识别分析装置和展现输出装置;其中所述用户数据仓库存储原始用户数据;所述中间数据采集存储装置从用户数据仓库中抽取与用户特征相关的数据;特征数据采集存储装置采集中间数据采集存储装置处理后的用户数据,并转换成用户特征数据;特征数据识别分析装置对特征数据采集存储装置存储的用户特征数据进行分析处理,并对用户群和用户之间关系进行识别;展现输出装置用于输出相应结果。本发明同时公开了一种采集和利用用户特征数据识别用户群和用户之间关系的方法。本发明实现了用户特征和关系的识别。
Description
技术领域
本发明涉及一种电信领域采集用户特征数据及使用所采集到的用户特征数据识别用户之间关系的系统和方法。
背景技术
公开号为CN101146057,名称为《创建和显示暂时好友列表的方法和系统》,该发明以关系对象的时间属性为依据进行分类;公开号为CN102130854A,名称为《一种能在网页上显示带好友状态的好友列表的方法及系统》,一好友的当前在线状态为依据对好友进行分类;公开号为CN101399785,名称为《IM平台好友列表展现系统及展现方法》,提供了根据好友多种属性分别选择好友排列呈现的方法。
这几篇文件并没有涉及到如何采用并分析用户之间的交往指数、协议关联关系、地理关联关系,分析符合目标用户的共同特性的特征数据,来识别用户群和用户之间的关系。
发明内容
本发明所要解决的技术问题是提供一种采集和利用用户特征数据识别用户群和用户之间关系的系统和方法,通过采集并分析用户的消费行为和用户之间的交往指数、协议关联关系、地理关联关系,并分析符合目标用户的共同特性的特征数据,来识别用户群和用户之间的关系。
本发明解决上述技术问题的技术方案如下:一种采集和利用用户特征数据识别用户群和用户之间关系的系统,包括:用户数据仓库、中间数据采集存储装置、特征数据采集存储装置、特征数据识别分析装置以及展现输出装置;其中,所述用户数据仓库用于存储原始用户数据;所述中间数据采集存储装置用于从用户数据仓库中抽取与用户特征相关的数据,在进行清洗、转换、规约处理后集成存储;特征数据采集存储装置用于采集中间数据采集存储装置处理后的用户数据,转换成用户特征数据并进行分类存储;特征数据识别分析装置用于对特征数据采集存储装置所存储的用户特征数据进行分析处理,识别用户群和用户之间的关系,分析用户的消费行为,识别用户群中消费额度、圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户;展现输出装置用于输出相应结果。
本发明的有益效果是:所述系统通过提取与用户特征相关的数据,并进行分析处理,实现了对用户群和用户之间的关系的识别。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述中间数据采集存储装置包括:
用户注册信息采集单元,用于采集家庭固定电话、个人移动电话和宽带的用户开户注册信息;
移动基站小区信息采集单元,用于采集移动通信基站各小区的位置和覆盖区域信息;
用户通信信息采集单元,用于采集用户通信记录;
用户消费信息采集单元,用于采集用户通信相关的消费行为和服务行为等信息;
用户缴费信息采集单元,用于采集用户缴费记录,包括缴费方式、金额和地点等信息;
用户终端信息采集单元,用于采集用户终端代码信息;
用户套餐信息采集单元,用于采集用户当前的消费套餐名称和属性信息;
互联网信息采集单元,用于采集用户的固网互联网和移动互联网的登录和使用记录信息;
行业信息采集单元,用于采集各行业单位的相关用户记录信息;
中间数据处理存储单元,用于数据输入、输出及清洗、转换、规约处理,并集成存储与用户特征相关的数据。
采用上述进一步方案的有益效果是,实现了对各种与用户特征相关的数据的采集和存储,各种与用户特征相关的数据主要包括了:用户家庭固定电话、个人移动电话、宽带用户开户注册信息,移动通信基站各小区的位置和覆盖区域信息,用户通信记录、用户通信相关的消费行为和服务行为等信息,用户缴费记录包括缴费方式、金额和地点等信息,用户终端代码信息,用户当前消费套餐名称和属性信息,用户的固网互联网和移动互联网的登录和使用记录信息,各行业单位的相关用户记录信息等。
进一步,所述特征数据采集存储装置包括:
交往参数采集单元,用于从通信信息、消费信息、套餐信息和互联网信息数据中采集用户之间的交往信息;
协议关系参数采集单元,用于从注册信息、消费信息、缴费信息、终端信息、套餐信息、互联网信息和行业信息数据中采集用户之间的协议关系信息;
地理参数采集单元,用于从注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集用户的地理信息;
消费参数采集单元,用于采集每个用户的消费行为信息;
特征数据处理存储单元,用于特征数据的输入、输出和存储处理。
采用上述进一步方案的有益效果是,实现了对用户特征数据的采集和存储,用户特征数据主要包括了:通信信息、消费信息、套餐信息和互联网信息数据中的用户之间的交往信息,注册信息、消费信息、缴费信息、终端信息、套餐信息、互联网信息和行业信息数据中的用户之间的协议关系信息,注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中的用户的地理信息,以及每个用户的消费行为信息等。
进一步,所述特征数据识别分析装置包括:
交往指数分析识别单元,用于分析识别用户通信、消费、套餐和互联网信息中的交往指数;
协议关联关系分析识别单元,用于分析识别用户注册、消费协议、互联网登记、行业相关信息中姓名、号码之间的关联关系;
地理关联关系分析识别单元,用于分析识别用户注册、通信、缴费、上网、行业记录信息中的地理关联关系;
用户群和用户关系分析识别单元,用于用户群和识别用户之间的关系,分析用户的消费行为,识别用户群中的重点用户。
采用上述进一步方案的有益效果是,实现了对用户特征数据的识别分析。
进一步,所述用户群和用户关系分析识别单元包括:
家庭成员分析识别模块,用于分析识别各家庭的成员组成;
同事圈分析识别模块,用于分析识别工作单位的成员组成;
同学圈分析识别模块,用于分析识别同学圈的成员组成;
朋友圈分析识别模块,用于分析识别朋友圈中的成员组成;
共同业务或兴趣圈分析识别模块,用于分析识别有共同业务或兴趣爱好的群体的成员组成;
其他用户群分析模块,用于分析识别其他存在某些特定共同用户特征的用户群组成。
采用上述进一步方案的有益效果是,实现了用户群和用户关系的分析识别。
基于上述系统,本发明提供的采集和利用用户特征数据识别用户群和用户之间关系的方法,包括如下步骤:
步骤A:从用户数据仓库中采集与用户特征相关的数据,在进行清洗、转换、规约处理后集成存储为用户数据;
步骤B:利用所存储的用户数据,采集用户特征数据分类存储;
步骤C:分析所存储的用户特征数据,识别用户群和用户之间的关系,分析用户的消费行为,判断用户群中的重点用户;
步骤D:把分析结果按照需求展现输出。
采用上述方法的有益效果是,实现了对用户群和用户之间的关系的识别。
进一步,所述用户特征数据包括用户交往参数、协议关系参数、地理参数和消费参数。
进一步,步骤A中所述与用户特征相关的数据采集包括如下步骤:
步骤A1:采集用户开户注册信息;
步骤A2:采集移动通信基站各小区的位置和覆盖区域信息;
步骤A3:采集用户通信记录;
步骤A4:采集用户通信相关的消费行为和服务行为等信息;
步骤A5:采集用户缴费记录;
步骤A6:采集用户终端代码信息;
步骤A7:采集用户的消费套餐名称和属性信息;
步骤A8:采集用户的互联网登录和使用记录信息;
步骤A9:采集各行业单位的相关用户记录信息。
采用上述进一步方案的有益效果是,实现了用户特征相关的数据的采集,包括用户开户注册信息、移动通信基站各小区的位置和覆盖区域信息、用户通信记录、用户通信相关的消费行为和服务行为信息、用户缴费记录、用户终端代码信息、用户的消费套餐名称和属性信息、用户的互联网登录和使用记录信息、以及各行业单位的相关用户记录信息。
进一步,步骤B中所述采集用户特征数据包括如下步骤:
步骤B1:从通信信息、消费信息、套餐信息和互联网信息数据中采集用户之间的交往参数信息;
步骤B2:从注册信息、消费信息、缴费信息、终端信息和套餐信息、互联网信息和行业信息数据中采集用户之间的协议关系参数信息;
步骤B3:从注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集地理参数信息;
步骤B4:采集每个用户的消费行为参数信息。
采用上述进一步方案的有益效果是,实现了用户特征数据的采集,其中包括:用户之间的交往参数信息、用户之间的协议关系参数信息、地理参数信息、以及每个用户的消费行为参数信息等。
进一步,步骤C中所述识别用户群和用户之间的关系包括如下步骤:
步骤C1:分析识别用户通信、消费、套餐和互联网信息中的用户交往指数;
步骤C2:分析识别用户注册、消费协议、互联网和行业信息中姓名、号码之间的协议关联关系;
步骤C3:分析识别用户注册、通信、缴费、互联网和行业信息中的地理关联关系;
步骤C4:分析识别用户群和识别用户之间的关系;
步骤C5:分析用户群中用户消费行为,识别用户群中的重点用户。
采用上述进一步方案的有益效果是,实现了用户群和用户之间关系的分析识别,其中包括:用户交往指数;姓名和号码之间的协议关联关系、地理关联关系、用户群和用户之间的关系、用户群中用户消费行为、以及用户群中的重点用户等。
进一步,步骤C1中识别用户交往指数包括如下步骤:
步骤C10:分时段统计分析用户的频繁交往圈;
步骤C11:分时段统计分析用户的稳定非频繁交往圈;
步骤C12:统计分析特定时间用户的交往圈;
步骤C13:建立包括步骤C10至C12所述内容的用户交往指数表。
采用上述进一步方案的有益效果是,实现了用户交往指数的识别统计和保存,其中包括:统计用户的频繁交往圈、统计用户的稳定非频繁交往圈、以及统计特定时间用户的交往圈等。
进一步,所述特定时间包括节假日和重大事件时间。
进一步,步骤C2中识别协议关联关系包括如下步骤:
步骤C20:识别家庭套餐、集团套餐、校园套餐、小区套餐所包含的用户,标注单独的标识;
步骤C21:分析识别交叉优惠套餐的用户,标注单独的交叉优惠标识;
步骤C22:分析代缴费用户,标注代缴关系标识;
步骤C23:把套餐中包含的终端序列号转换电话号码的对应关系;
步骤C24:分析用户固定电话、移动电话和宽带注册信息和互联网各应用登记注册信息及行业信息中的开户用户、联系人、担保人、单位的名称、号码对应关系,标注关联关系;
步骤C25:建立包括步骤C20至C24所述内容的协议关联关系表。
采用上述进一步方案的有益效果是,实现了协议关联关系的识别。
进一步,步骤C3中识别地理关联关系包括如下步骤:
步骤C30:把行政区划地址、移动基站小区代码、套餐中区域代码、营业店面代码、网吧地址等转换成统一的地理区域代码格式;
步骤C31:把采集到的地理参数信息转换对应成统一的地理区域代码;
步骤C32:分时段统计分析用户活动区域,区分长期稳定频繁活动、阶段性频繁活动、长期稳定但非频繁活动类别,并区分用户工作、学习、生活活动区域性质;
步骤C33:统计同一区域内活动的用户号码,标注活动区域性质;
步骤C34:分析识别用户活动区域、用户注册区域和联系人、担保人、单位所在区域、套餐包含区域、缴费区域之间的关联关系;
步骤C35:建立包括步骤C30至C34所述内容的地理关联关系表。
采用上述进一步方案的有益效果是,实现了地理关联关系的识别。
进一步,步骤C4中识别用户群和用户之间的关系包括如下步骤:
步骤C40:选择目标用户交往圈范围,利用步骤C13建立的用户交往指数表,分析用户群的各用户的交往指数,判断出拥有共同的交往圈的用户群,分配用户群标识和用户群指数,并根据此用户群内每个用户交往指数的不同对应不同的成员指数;
步骤C41:选择目标用户区域范围,利用步骤C35建立的地理关联关系表,判断区域内符合目标用户特征的用户群;
步骤C42:对比步骤C40、C41识别出的用户群,分析成员组成和交往圈的重合度,根据重合度调整用户群指数和成员指数;
步骤C43:利用步骤C25建立的协议关联关系表,判断用户群内的用户号码之间存在协议关联关系,如果存在,增加存在协议关联关系用户的成员指数;
步骤C44:分析各用户群内的用户的目标特征,按照群体特征的符合程度增加用户群指数,并增加其中符合特征的用户的用户群成员指数;
步骤C45:根据用户群指数判断有某项特定共同特征的用户群符合率,如果符合,建立用户群数据表,并根据用户群成员指数确定成员组成。
采用上述进一步方案的有益效果是,实现了用户群和用户之间关系的识别。
进一步,步骤C5中用户消费行为和重点用户的分析识别包括如下步骤:
步骤C50:分析用户的消费行为,识别用户消费需求,建立用户消费特征表;
步骤C51:对比分析用户群内的用户消费行为,并利用步骤C13建立的用户交往指数表、步骤C25建立的协议关联关系表,分别识别出消费额度、圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户。
采用上述进一步方案的有益效果是,实现了用户消费行为和重点用户的分析识别。
附图说明
图1是本发明的基本系统结构示意图;
图2是本发明的实施例具体应用中中间数据采集存储装置a02的示意图;
图3是本发明的实施例具体应用中特征数据采集存储装置a03的示意图;
图4是本发明的实施例具体应用中特征数据识别分析装置a04的示意图;
图5是本发明的基本步骤程序的示意图;
图6是本发明的实施例具体应用中用户群和用户之间的关系识别步骤程序的示意图;
图7是本发明的实施例具体应用中家庭成员分析识别步骤程序的示意图;
图8是本发明的实施例具体应用中同事圈分析识别步骤程序的示意图;
图9是本发明的实施例具体应用中同学圈分析识别步骤程序的示意图;
图10是本发明的实施例具体应用中朋友圈分析识别步骤程序的示意图;
图11是本发明的实施例具体应用中有某项共同业务或共同兴趣爱好的群体分析识别步骤程序的示意图。
附图中,各标号所代表的部件列表如下:
a01、用户数据仓库,a02、中间数据采集存储装置,a03、特征数据采集存储装置,a04、特征数据识别分析装置,a05、展现输出装置,b00、中间数据处理存储单元,b01、用户注册信息采集单元,b02、移动基站小区信息采集单元,b03、用户通信信息采集单元,b04、用户消费信息采集单元,b05、用户缴费信息采集单元,b06、用户终端信息采集单元,b07、用户套餐信息采集单元,b08、互联网信息采集单元,b09、行业信息采集单元,c00、特征数据处理存储单元,c01、交往参数采集单元,c02、协议关系参数采集单元,c03、地理参数采集单元,c04、消费参数采集单元,d00、用户群和用户关系分析识别单元,d01、交往指数分析识别单元,d02、协议关联关系分析识别单元,d03、地理关联关系分析识别单元
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,本发明的采集和利用用户特征数据识别用户群和用户之间关系的系统包括:用户数据仓库a01、中间数据采集存储装置a02、特征数据采集存储装置a03、特征数据识别分析装置a04以及展现输出装置a05;其中,所述用户数据仓库a01用于存储原始用户数据;所述中间数据采集存储装置a02用于从用户数据仓库a01中抽取与用户特征相关的数据,在进行清洗、转换、规约处理后集成存储;特征数据采集存储装置a03用于采集中间数据采集存储装置a02处理后的用户数据,转换成用户特征数据并进行分类存储;特征数据识别分析装置a04用于对特征数据采集存储装置a03所存储的用户特征数据进行分析处理,识别用户群和用户之间的关系,分析用户的消费行为,识别用户群中消费额度、圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户;展现输出装置a05用于输出相应结果。
如图2所示,本发明中的中间数据采集存储装置a02包括:用户注册信息采集单元b01,用于采集家庭固定电话、个人移动电话和宽带的用户开户注册信息;移动基站小区信息采集单元b02,用于采集移动通信基站各小区的位置和覆盖区域信息;用户通信信息采集单元b03,用于采集用户通信记录;用户消费信息采集单元b04,用于采集用户通信相关的消费行为和服务行为等信息;用户缴费信息采集单元b05,用于采集用户缴费记录,包括缴费方式、金额和地点等信息;用户终端信息采集单元b06,用于采集用户终端代码信息;用户套餐信息采集单元b07,用于采集用户当前的消费套餐名称和属性信息;互联网信息采集单元b08,用于采集用户的固网互联网和移动互联网的登录和使用记录信息;行业信息采集单元b09,用于采集各行业单位的相关用户记录信息;中间数据处理存储单元b00,用于数据输入、输出及清洗、转换、规约处理,并集成存储与用户特征相关的数据。
如图3所示,本发明中的特征数据采集存储装置a03包括:交往参数采集单元c01,用于从通信信息、消费信息、套餐信息和互联网信息数据中采集用户之间的交往信息;协议关系参数采集单元c02,用于从注册信息、消费信息、缴费信息、终端信息、套餐信息、互联网信息和行业信息数据中采集用户之间的协议关系信息;地理参数采集单元c03,用于从注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集用户的地理信息;消费参数采集单元c04,用于采集每个用户的消费行为信息;特征数据处理存储单元c00,用于特征数据的输入、输出和存储处理。
如图4所示,本发明中的特征数据识别分析装置a04包括:交往指数分析识别单元d01,用于分析识别用户通信、消费、套餐和互联网信息中的交往指数;协议关联关系分析识别单元d02,用于分析识别用户注册、消费协议、互联网登记、行业相关信息中姓名、号码之间的关联关系;地理关联关系分析识别单元d03,用于分析识别用户注册、通信、缴费、上网、行业记录信息中的地理关联关系;用户群和用户关系分析识别单元d00,用于用户群和识别用户之间的关系,分析用户的消费行为,识别用户群中的重点用户。
图4中的用户群和用户关系分析识别单元d00还包括:家庭成员分析识别模块,用于分析识别各家庭的成员组成;同事圈分析识别模块,用于分析识别工作单位的成员组成;同学圈分析识别模块,用于分析识别同学圈的成员组成;朋友圈分析识别模块,用于分析识别朋友圈中的成员组成;共同业务或兴趣圈分析识别模块,用于分析识别有共同业务或兴趣爱好的群体的成员组成;其他用户群分析模块,用于分析识别其他存在某些特定共同用户特征的用户群组成。
本发明的采集和利用用户特征数据识别用户群和用户之间关系的方法利用上述系统,如图5所示包括如下步骤:
步骤e00:从用户数据仓库中采集与用户特征相关的数据,在进行清洗、转换、规约处理后集成存储为用户数据;
步骤e01:利用所存储的用户数据,采集用户特征数据分类存储;
步骤e02:分析所存储的用户特征数据,识别用户群和用户之间的关系,分析用户的消费行为,判断用户群中的重点用户;
步骤e03:把分析结果按照需求展现输出。
其中,用户特征数据包括用户交往参数、协议关系参数、地理参数和消费参数。
步骤e00中包括:采集用户开户注册信息;采集移动通信基站各小区的位置和覆盖区域信息;采集用户通信记录;采集用户通信相关的消费行为和服务行为等信息;采集用户缴费记录;采集用户终端代码信息;采集用户的消费套餐名称和属性信息;采集用户的互联网登录和使用记录信息;采集各行业单位的相关用户记录信息。
步骤e01中包括:从通信信息、消费信息、套餐信息和互联网信息数据中采集用户之间的交往参数信息;从注册信息、消费信息、缴费信息、终端信息和套餐信息、互联网信息和行业信息数据中采集用户之间的协议关系参数信息;从注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集地理参数信息;采集每个用户的消费行为参数信息。
如图6所示,步骤e02中包括:
步骤f00:分析识别用户通信、消费、套餐和互联网信息中的用户交往指数;
步骤f01:分析识别用户注册、消费协议、互联网和行业信息中姓名、号码之间的协议关联关系;
步骤f02:分析识别用户注册、通信、缴费、互联网和行业信息中的地理关联关系;
步骤f03:分析识别用户群和识别用户之间的关系;
步骤f04:分析用户群中用户消费行为,识别用户群中的重点用户。
其中步骤f00包括如下步骤:
步骤f00-1:分时段统计分析用户的频繁交往圈;
步骤f00-2:分时段统计分析用户的稳定非频繁交往圈;
步骤f00-3:统计分析特定时间(如节假日、重大事件时间等)用户的交往圈;
步骤f00-4:建立包括步骤f00-1至f00-3所述内容的用户交往指数表。
步骤f01包括:
步骤f01-1:识别家庭套餐、集团套餐、校园套餐、小区套餐所包含的用户,标注单独的标识;
步骤f01-2:分析识别交叉优惠套餐的用户,标注单独的交叉优惠标识;
步骤f01-3:分析代缴费用户,标注代缴关系标识;
步骤f01-4:把套餐中包含的终端序列号转换电话号码的对应关系;
步骤f01-5:分析用户固定电话、移动电话和宽带注册信息和互联网各应用登记注册信息及行业信息中的开户用户、联系人、担保人、单位的名称、号码对应关系,标注关联关系;
步骤f01-6:建立包括步骤f01-1至f01-5所述内容的协议关联关系表。
步骤f02包括如下步骤:
步骤f02-1:把行政区划地址、移动基站小区代码、套餐中区域代码、营业店面代码、网吧地址等转换成统一的地理区域代码格式;
步骤f02-2:把采集到的地理参数信息转换对应成统一的地理区域代码;
步骤f02-3:分时段统计分析用户活动区域,区分长期稳定频繁活动、阶段性频繁活动、长期稳定但非频繁活动类别,并区分用户工作、学习、生活活动区域性质;
步骤f02-4:统计同一区域内活动的用户号码,标注活动区域性质;
步骤f02-5:分析识别用户活动区域、用户注册区域和联系人、担保人、单位所在区域、套餐包含区域、缴费区域之间的关联关系;
步骤f02-6:建立包括步骤f02-1至f02-5所述内容的地理关联关系表。
步骤f03包括如下步骤:
步骤f03-1:选择目标用户交往圈范围,利用步骤f00-4建立的用户交往指数表,分析用户群的各用户的交往指数,判断出拥有共同的交往圈的用户群,分配用户群标识和用户群指数,并根据此用户群内每个用户交往指数的不同对应不同的成员指数;
步骤f03-2:选择目标用户区域范围,利用步骤f02-6建立的地理关联关系表,判断区域内符合目标用户特征的用户群;
步骤f03-3:对比步骤f03-1、f03-2识别出的用户群,分析成员组成和交往圈的重合度,根据重合度调整用户群指数和成员指数;
步骤f03-4:利用步骤f01-6建立的协议关联关系表,判断用户群内的用户号码之间存在协议关联关系,如果存在,增加存在协议关联关系用户的成员指数;
步骤f03-5:分析各用户群内的用户的目标特征,按照群体特征的符合程度增加用户群指数,并增加其中符合特征的用户的用户群成员指数;
步骤f03-6:根据用户群指数判断有某项特定共同特征的用户群符合率,如果符合,建立用户群数据表,并根据用户群成员指数确定成员组成。
步骤f04包括如下步骤:
步骤f04-1:分析用户的消费行为,识别用户消费需求,建立用户消费特征表;
步骤f04-2:对比分析用户群(圈)内的用户消费行为,并利用步骤f00-4建立的用户交往指数表、步骤f01-6建立的协议关联关系表,分别识别出消费额度、圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户。
以下结合具体实施例对本发明进行进一步说明。
1、交往指数
每个人在日常工作生活中,都有相对固定的沟通群体,构成大大小小的交往圈,而一个拥有某种特定关系或拥有某些共同特征的用户群,其交往圈相对固定。在本发明的具体实施例中,利用所述特征数据采集存储装置中的交往参数采集单元采集的用户之间通信信息、消费信息、套餐信息中的用户交往特征数据,转换成某个周期内的两个用户之间的通话交往特征(含通话次数、通话时长、通话费率、通话时段的指标)、信息交往特征(含短信、彩信、邮件次数和时段的指标)、互联网交往特征(网上聊天、同一门户或社区的次数、时长、时段的指标)组成的用户交往参数,通过设定不同的起始点和周期长度来构成时基的两个用户的交往参数组。
通话交往特征:
Character_Call=F_Call(Num_Call,Minute_Call,Fee_Call,Time_Call)
其中,Num_Call:通话次数、通话时长、通话费率、通话时段
Minute_Call:通话平均时长
Fee_Call:通话平均费率
Time_Call:通话时段分布
F_Call:表示Num_Call、Minute_Call、Fee_Call、Time_Call加权组合的线性函数。
信息交往特征:
Character_Info=F_Info(Num_SMS,Time_SMS,Num_MMS,Time_MMS,Num_Mail,Time_Mail)
其中,Num_SMS:短信次数
Time_SMS:短信时段
Num_MMS:彩信次数
Time_MMS:彩信时段
Num_Mail:邮件次数
Time_Mail:邮件时段
F_Info:表示Num_SMS、Time_SMS、Num_MMS、Time_MMS、Num_Mail、Time_Mail加权组合的线性函数。
互联网交往特征:
Character_Net=F_Net(Num_Chat,Minute_Chat,Time_Chat,Num_Portal,Minute_Portal,Time_Portal)
其中,Num_Chat:网上聊天次数
Minute_Chat:网上聊天时长
Time_Chat:网上聊天时段分布
Num_Portal:同一门户或社区次数
Minute_Portal:同一门户或社区时长
Time_Portal:同一门户或社区时段分布
F_Net:表示Num_Chat、Minute_Chat、Time_Chat、Num_Portal、Minute_Portal、Time_Portal加权组合的线性函数。
用户a和用户n之间在某个周期T内的交往参数:
Character_Usera_n=F_Usera_n(F_Call,F_Info,F_Net)
其中,F_Usera_n:表示与周期T相关的归一化函数。
通过设定不同的周期T和起始点T0,以及在函数中对特征数据采取不同的加权值,可以计算出用户之间交往的频繁度、稳定度、重要度和私密度构成的交往指数,体现不同的用户交往关系。
把用户a和其交往圈各用户之间在某个周期T内的交往指数存储在所述特征数据处理存储单元中,即构成用户a与其交往圈各用户之间的交往指数表。同样,建立其他用户与其各自交往圈各用户之间的交往指数表,构成如下:
用户a | 用户b | 用户c | 用户d | …… | |
用户a | F_Usera_a | F_Usera_b | F_Usera_c | F_Usera_d | …… |
用户b | F_Userb_a | F_Userb_b | F_Userb_c | F_Userb_d | …… |
用户c | F_Userc_a | F_Userc_b | F_Userc_c | F_Userc_d | …… |
用户d | F_Userd_a | F_Userd_b | F_Userd_c | F_Userd_d | …… |
…… | …… | …… | …… | …… | …… |
可以通过上述表中交往指数,来识别拥有共同交往圈的用户群。
如果用户之间的交往指数表用户量过大,将需要巨大的运算量,在本发明具体实施例中,都要先通过预设条件初步限定目标用户范围。
2、协议关联关系
在电信运营商与用户签署的各种协议中,包含了部分用户之间关系的信息。
利用所述特征数据采集存储装置中的协议关系参数采集单元从注册信息、消费信息、缴费信息、终端信息和套餐信息数据、互联网信息和行业信息中采集的用户之间的协议关系参数信息,包括注册信息(用户、用户号码、联系人、联系电话、担保人、担保电话、所在单位名称等),还包括协议信息(套餐中捆绑的号码、优惠的号码、闭合群号码、集团号码组、缴费代缴号码、套餐中包含的终端序列号及此终端实际对应的手机号码),提取用户之间的协议关系,根据协议关系性质,判断用户之间的依存度和信任度,建立用户之间的协议关联参数表。
3、地理关联关系
由于用户居住、工作、学习的地点通常不会频繁变动,用户使用移动手机(含小灵通)进行通信和用户提供固定宽带或移动手机上使用互联网时在不同时段具备相对稳定的区域性。利用所述特征数据采集存储装置中的地理参数采集单元采集的移动终端通信信息、互联网使用信息和移动及固话缴费信息,抽取出用户在生活、工作或学习时间的频繁活动区域地理特征。
生活、工作、学习时间的频繁活动区域地理特征分别表示为:
Area_Live=F_Live(Freq_Max,Longitude,Latitude)T_Live
Area_Work=F_Work(Freq_Max,Longitude,Latitude)T_work
Area_Study=F_Study(Freq_Max,Longitude,Latitude)T_Study
Freq_Max:用户在某一区域活动频繁度最高
Longitude:活动区域中心经度(移动基站小区位置)
Latitude:活动区域中心纬度(移动基站小区位置)
F_Live/F_Work/F_Study:分别表示生活、工作、学习时间活动频繁度最高的区域函数,为单一值
用户除了正常的生活、工作、学习活动区域外,还经常到一些相对固定的娱乐等场所活动,频繁度不一定很高,但在一段时间内相对稳定,也具备用户活动区域地理特征。
某一时期稳定活动区域地理特征表示为:
Area_Stably=F_Stably(Freq_Stably,Longitude,Latitude)T_Stably
Freq_Stably:用户在某一区域活动稳定度达到一定值
F_Stably:表示活动次数达到一定值的区域函数,按需要可得出多个值
在特定时间或特定地点(例如某时刻在某地点开演唱会),判断用户活动频繁度和持续时间,可以针对性地获得用户活动特性。
通过分时段统计分析用户活动区域,区分长期稳定频繁活动、阶段性频繁活动、长期稳定但非频繁活动类别,并区分用户工作、学习、生活活动区域性质。在以经纬度坐标为中心的设定的半径范围内,进一步分析识别用户活动区域与用户注册区域、套餐包含区域、缴费区域之间的关联关系,存储在特征数据处理存储单元中,建立地理关联关系表。
因为行政区划地址、移动基站小区代码、套餐中区域代码、营业店面代码、网吧代码等分别以不同的格式来表示,需要转换成统一的地理区域代码格式,本发明具体实施例采取统一的经纬度格式。
4、下面结合附图,对本发明实施例进行详细描述。
实施例1、2、3、4、5是本发明的步骤程序在具体应用中的典型实现。
实施例1
图7是本发明的实施例具体应用中家庭成员分析识别步骤程序的示意图。所述各家庭的成员组成的分析识别包括如下步骤:
g00)利用地理关联关系表,判断一个区域内存在共同的生活区域性质或属于长期稳定但非频繁活动类别的用户群,再利用用户交往指数表,分析用户群的各用户的交往指数,判断出一个或多个拥有共同的交往圈的用户群,并执行步骤g01);
g01)利用用户交往指数表,以步骤g00)所述区域内的一个家庭固话或家庭宽带号码为主键,识别此家庭固话的交往圈的用户群,分析此用户群的各用户的交往指数,判断出拥有共同的交往圈的用户群,并执行步骤g02);
g02)对比步骤g01)识别出的用户群和g00)识别出的一个或多个用户群,分析成员组成和交往圈的重合度,对重合度达到一定值的两个或多个用户群重新组合生成一个新的用户群,重新分析用户群的各用户的交往指数,判断出拥有共同的交往圈的一个用户群,分配单独的家庭群标识和家庭群指数,并根据此用户群内每个用户交往指数的不同对应不同的家庭成员指数;重合度均达不到一定值的,另外分配单独的家庭群标识和家庭群指数,并根据此用户群内每个用户交往指数的不同对应不同的家庭成员指数,并执行步骤g03);
g03)对一个区域所属的其他家庭固话重复步骤g01)~g02),直至分析完区域内所有目标用户,并执行步骤g04);
g04)分析各家庭群中的为家庭套餐的用户,按照家庭套餐用户所占的比例,增加家庭群指数,并增加其中家庭套餐用户的家庭成员指数,并执行步骤g05);
g05)分析各家庭群用户的家庭生活特征,包括节假日家庭成员活动区域一致、同在家庭区域通信较少且通信时间较短、家庭成员漫游时到达漫游地时首先与其他家庭成员通话等通信特征,上网按照群体特征的符合程度增加家庭指数,并增加其中符合家庭生活特征的家庭成员指数,并执行步骤g06);
g06)利用协议关联关系表,判断家庭群内的用户号码之间存在协议关联关系,包括同一家庭宽带帐号上网登记的用户名称、号码之间的协议关联关系,如果存在,增加存在协议关联关系用户的家庭成员指数,并执行步骤g07);
g07)利用地理关联关系表,判断家庭群中的用户号码之间存在用户生活区域与注册区域(也包括联系人、担保人、单位注册区域)、套餐包含区域、缴费区域之间的关联关系,如果存在,增加存在地理关联关系的用户的家庭成员指数,并执行步骤g08);
g08)根据各家庭群指数判断家庭群符合率,如果符合,建立家庭群数据表,并根据家庭成员指数确定成员组成。
实施例2
图8是本发明的实施例具体应用中同事圈分析识别步骤程序的示意图。所述某单位的成员组成的分析识别包括如下步骤:
h00)利用地理关联关系表,判断一个区域内属于长期稳定频繁活动和共同的工作区域性质的用户群,再利用用户交往指数表,分析用户群的各用户的交往指数,判断出一个或多个拥有共同的交往圈的用户群,并执行步骤h01);
h01)利用用户交往指数表,以步骤h00)所述区域内的一个单位的一个或多个固话为主键,识别单位固话的交往圈的用户群,分析此用户群的各用户的交往指数,判断出拥有共同的交往圈的用户群,并执行步骤h02);
h02)对比步骤h01)识别出的用户群和h00)识别出的一个或多个用户群,分析成员组成和交往圈的重合度,对重合度达到一定值的两个或多个用户群重新组合生成一个新的用户群,重新分析用户群的各用户的交往指数,判断出拥有共同的交往圈的一个用户群,分配单独的同事圈标识和同事圈指数,并根据此用户群内每个用户交往指数的不同对应不同的同事圈成员指数,并执行步骤h03);
h03)对一个区域所属的其他单位固话重复步骤h01)~h02),直至分析完区域内所有目标用户,并执行步骤h04);
h04)判断同事圈内的为集团套餐的用户,按照集团套餐用户所占的比例,增加同事圈指数,并增加其中集团套餐用户的同事圈成员指数,并执行步骤h05);
h05)分析各同事圈内的用户的工作特征,包括上下班时间同一时间段进入或离开工作区域、同时处于同一活动区域相互通信较多、在工作区域固话和移动电话交叉通信、在工作区域之外以移动通信为主的通信特征,按照群体的符合程度增加同事圈指数,并增加其中符合工作特征的同事圈成员指数,并执行步骤h06);
h06)利用协议关联关系表,判断同事圈内的用户号码之间是否存在协议关联关系,包括同一企业宽带帐号上网登记的用户名称、号码之间的协议关联关系,如果存在,增加这些用户的同事圈成员指数;判断同事圈内的用户集团套餐是否与所在单位存在协议关联关系,按照存在协议关联关系的集团套餐用户所占的比例,增加同事圈指数,并增加其中存在协议关联关系的集团套餐用户的同事圈成员指数,并执行步骤h07);
h07)利用地理关联关系表,判断同事圈中的用户号码之间存在用户工作区域与注册区域(也包括联系人、担保人、单位注册区域)、套餐包含区域、缴费区域之间的关联关系,按照存在协议关联关系的用户所占的比例,增加同事圈指数,并增加其中存在协议关联关系的用户的同事圈成员指数,并执行步骤h08);
h08)根据同事圈指数判断同事圈符合率,如果符合,建立同事圈数据表,并根据同事圈成员指数确定成员组成。
实施例3
图9是本发明的实施例具体应用中同学圈分析识别步骤程序的示意图。所述同学圈的成员组成的分析识别包括如下步骤:
i00)利用地理关联关系表,判断一个学校区域内存在共同的学习区域性质的用户群,再利用用户交往指数表,分析用户群的各用户的交往指数,判断出一个或多个拥有共同的交往圈的用户群,各自分配单独的同学圈标识和同学圈指数,并根据此用户群内每个用户交往指数的不同对应不同的同学圈成员指数,并执行步骤i01);
i01)分析各同学圈内的用户的分时段的活动特征数据,是否符合阶段性频繁活动区域类别(包括学期、寒暑假、国家规定的长假期等),按照群体的符合程度增加同学圈指数,并增加其中符合阶段性频繁活动区域的用户的同学圈成员指数,并执行步骤i02);
i02)判断各同学圈内的为校园套餐的用户,按照校园套餐用户所占的比例,增加同学圈指数,并增加其中校园套餐用户的同学圈成员指数,并执行步骤i03);
i03)分析各同学圈内的用户的学生特征,包括课前课后同一时间段开关机和通信、上课期间禁止通信、晚上通信活动频繁以及短信、彩信、音乐等业务较多的通信特征,如果目标用户所在区域为大学等学生住宿学校,进一步分析学生集体就餐、就寝的活动特征,按照群体的符合程度增加同学圈指数,并增加其中符合学生特征的用户的同学圈成员指数,并执行步骤i04);
i04)利用协议关联关系表,判断各同学圈内的用户之间存在协议关联关系,如果存在,增加这些用户的同学圈成员指数,并执行步骤i05);
i05)利用地理关联关系表,判断各同学圈中的用户号码之间存在用户工作区域与注册区域(也包括联系人、担保人、单位注册区域)、套餐包含区域、缴费区域之间的关联关系,如果存在,增加这些用户的同学圈成员指数,并执行步骤i06);
i06)根据同学圈指数判断同学圈符合率,如果符合,建立同学圈数据表,并根据同学圈成员指数确定成员组成。
实施例4
图10是本发明的实施例具体应用中朋友圈分析识别步骤程序的示意图。所述朋友圈的成员组成的分析识别包括如下步骤:
j00)利用用户交往指数表,分析某用户或某些用户的交往指数,分配单独的朋友圈标识和朋友圈指数,并根据此用户群内每个用户相互之间交往指数的不同对应不同的朋友圈成员指数,并执行步骤j01);
j01)分析各朋友圈内的用户的朋友交往特征,包括相互之间通信的时间点和区域较分散、休闲时间经常活动在同一区域且到达同一区域之前至离开之后的过程中通信相对频繁、消费行为较为一致等特征,按照群体的符合程度增加朋友圈指数,并增加其中符合朋友交往特征的用户的朋友圈成员指数,并执行步骤j02);
j02)利用协议关联关系表,判断各朋友圈内的用户之间存在协议关联关系,如果存在,增加存在协议关联关系的用户的朋友圈成员指数,并执行步骤j03);
j03)利用地理关联关系表,判断各朋友圈中的用户号码之间存在用户工作区域与注册区域(也包括联系人、担保人、单位注册区域)、套餐包含区域、缴费区域之间的关联关系,如果存在,增加存在协议关联关系的用户的朋友圈成员指数,并执行步骤j04);
j04)根据朋友圈指数判断朋友圈符合率,如果符合,建立朋友圈数据表,并根据朋友圈成员指数确定成员组成。
实施例5
图11是本发明的实施例具体应用中有某项共同业务或共同兴趣爱好的群体分析识别步骤程序的示意图。所述有某项共同业务或共同兴趣爱好的群体的成员组成的分析识别包括如下步骤:
k00)利用地理关联关系表,统计经常到某一区域(例如某高尔夫俱乐部、股票厅等)或在特定时间到某一区域(例如某明星演唱会、足球比赛等)的用户群,根据区域性质分配用户群标识和用户群指数,并根据用户的进入区域的频次、停留时间对应不同的用户群成员指数,并执行步骤k01);
k01)利用采集的用户消费行为参数信息和用户交往指数表,统计某业务单位或组织与用户之间的互动信息,包括但不限于电话(例如单位号码、400、800等)呼叫、上下行短信、彩信记录、用户上网浏览、点击记录等,还包括用户通信内容的关键字等,根据业务单位或组织性质分配用户群标识和用户群指数,并根据用户的通信频次、互动率对应不同的用户群成员指数,并执行步骤k02);
k02)选择分别由步骤k00)和k01)识别出的有关联关系的用户群,分析成员组成和交往圈的重合度,对重合度达到一定值的用户群重新组合生成一个新的用户群,分配组合后的用户群标识,根据重合程度增加用户群指数,并对重合的成员根据其交往圈的重合度增加用户群成员指数,并执行步骤k03);
k03)利用用户交往指数表,分析用户群内的各用户间的交往指数,根据用户群体交往指数增加用户群指数,根据此用户群内的用户的交往指数增加用户群成员指数,并执行步骤k04);
k04)根据用户群指数判断有某项共同业务或共同兴趣爱好的用户群符合率,如果符合,建立用户群数据表,并根据用户群成员指数确定成员组成。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (15)
1.一种采集和利用用户特征数据识别用户群和用户之间关系的系统,其特征在于,包括:用户数据仓库、中间数据采集存储装置、特征数据采集存储装置、特征数据识别分析装置以及展现输出装置;
所述用户数据仓库用于存储原始用户数据;
所述中间数据采集存储装置用于从用户数据仓库中采集用户开户注册信息、移动通信基站各小区的位置和覆盖区域信息、采集用户通信记录、服务行为信息、用户终端代码信息、消费套餐名称和属性信息、互联网登录和使用记录信息、相关用户记录信息,在进行清洗、转换、规约处理后集成存储;
特征数据采集存储装置用于采集中间数据采集存储装置处理后的用户数据,转换成用户特征数据并进行分类存储;
特征数据识别分析装置用于对特征数据采集存储装置所存储的用户特征数据进行分析处理,分析识别用户的交往指数、关联关系、地理关联关系,分析识别各家庭的成员组成、工作单位的成员组成、同学圈的成员组成、朋友圈中的成员组成、有共同业务或兴趣爱好的群体的成员组成和其他存在某些特定共同用户特征的用户群组成;
展现输出装置用于输出相应结果。
2.根据权利要求1所述的系统,其特征在于,所述中间数据采集存储装置包括:
用户注册信息采集单元,用于采集家庭固定电话、个人移动电话和宽带的用户开户注册信息;
移动基站小区信息采集单元,用于采集移动通信基站各小区的位置和覆盖区域信息;
用户通信信息采集单元,用于采集用户通信记录;
用户终端信息采集单元,用于采集用户终端代码信息;
用户套餐信息采集单元,用于采集用户当前的消费套餐名称和属性信息;
互联网信息采集单元,用于采集用户的固网互联网和移动互联网的登录和使用记录信息;
行业信息采集单元,用于采集各行业单位的相关用户记录信息;
中间数据处理存储单元,用于数据输入、输出及清洗、转换、规约处理,并集成存储与用户特征相关的数据。
3.根据权利要求1所述的系统,其特征在于,所述特征数据采集存储装置包括:
交往参数采集单元,用于从通信信息、套餐信息和互联网信息数据中采集用户之间的交往信息;
协议关系参数采集单元,用于从注册信息、终端信息、套餐信息、互联网信息和行业信息数据中采集用户之间的协议关系信息;
地理参数采集单元,用于从注册信息、通信信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集用户的地理信息;
特征数据处理存储单元,用于特征数据的输入、输出和存储处理。
4.根据权利要求1所述的系统,其特征在于,所述特征数据识别分析装置包括:
交往指数分析识别单元,用于分析识别用户通信、套餐和互联网信息中的交往指数;
协议关联关系分析识别单元,用于分析识别用户注册、互联网登记、行业相关信息中姓名、号码之间的关联关系;
地理关联关系分析识别单元,用于分析识别用户注册、通信、上网、行业记录信息中的地理关联关系;
用户群和用户关系分析识别单元,用于用户群和识别用户之间的关系,识别用户群中的重点用户。
5.根据权利要求4所述的系统,其特征在于,所述用户群和用户关系分析识别单元包括:
家庭成员分析识别模块,用于分析识别各家庭的成员组成;
同事圈分析识别模块,用于分析识别工作单位的成员组成;
同学圈分析识别模块,用于分析识别同学圈的成员组成;
朋友圈分析识别模块,用于分析识别朋友圈中的成员组成;
共同业务或兴趣圈分析识别模块,用于分析识别有共同业务或兴趣爱好的群体的成员组成;
其他用户群分析模块,用于分析识别其他存在特定共同用户特征的用户群组成。
6.一种基于权利要求1至5任一所述系统的采集和利用用户特征数据识别用户群和用户之间关系的方法,包括如下步骤:
步骤A:从用户数据仓库中采集用户开户注册信息、移动通信基站各小区的位置和覆盖区域信息、采集用户通信记录、服务行为信息、用户终端代码信息、消费套餐名称和属性信息、互联网登录和使用记录信息、相关用户记录信息,在进行清洗、转换、规约处理后集成存储为用户数据;
步骤B:利用所存储的用户数据,采集用户特征数据分类存储;
步骤C:分析识别用户交往指数、协议关联关系、地理关联关系、识别用户群和识别用户之间的关系,利用用户交往指数表、协议关联关系表,分别识别出圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户;
步骤D:把分析结果按照需求展现输出。
7.根据权利要求6所述的方法,其特征在于,所述用户特征数据包括用户交往参数、协议关系参数和地理参数。
8.根据权利要求6所述的方法,其特征在于,步骤B中所述采集用户特征数据包括如下步骤:
步骤B1:从通信信息、套餐信息和互联网信息数据中采集用户之间的交往参数信息;
步骤B2:从注册信息、终端信息和套餐信息、互联网信息和行业信息数据中采集用户之间的协议关系参数信息;
步骤B3:从注册信息、通信信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集地理参数信息。
9.根据权利要求6所述的方法,其特征在于,步骤C中所述识别用户群和用户之间的关系包括如下步骤:
步骤C1:分析识别用户通信、套餐和互联网信息中的用户交往指数;
步骤C2:分析识别用户注册、互联网和行业信息中姓名、号码之间的协议关联关系;
步骤C3:分析识别用户注册、通信、互联网和行业信息中的地理关联关系;
步骤C4:分析识别用户群和识别用户之间的关系;
步骤C5:识别用户群中的重点用户。
10.根据权利要求9所述的方法,其特征在于,步骤C1中识别用户交往指数包括如下步骤:
步骤C10:分时段统计分析用户的频繁交往圈;
步骤C11:分时段统计分析用户的稳定非频繁交往圈;
步骤C12:统计分析特定时间用户的交往圈;
步骤C13:建立包括每一时段用户的频繁交往圈、每一时段用户的稳定非频繁交往圈、特定时间用户的交往圈的用户交往指数表。
11.根据权利要求10所述的方法,其特征在于,所述特定时间包括节假日和重大事件时间。
12.根据权利要求10所述的方法,其特征在于,步骤C2中识别协议关联关系包括如下步骤:
步骤C20:识别家庭套餐、集团套餐、校园套餐、小区套餐所包含的用户,标注单独的标识;
步骤C21:分析识别交叉优惠套餐的用户,标注单独的交叉优惠标识;
步骤C22:分析代缴费用户,标注代缴关系标识;
步骤C23:把套餐中包含的终端序列号转换电话号码的对应关系;
步骤C24:分析用户固定电话、移动电话和宽带注册信息和互联网各应用登记注册信息及行业信息中的开户用户、联系人、担保人、单位的名称、号码对应关系,标注关联关系;
步骤C25:建立包括根据标注单独的标识的家庭套餐、集团套餐、校园套餐、小区套餐所包含的用户,标注单独的交叉优惠标识的用户,标注代缴关系标识的代缴费用户,套餐中包含的终端序列号转换电话号码的对应关系和标注关联关系的用户固定电话、移动电话和宽带注册信息和互联网各应用登记注册信息及行业信息中的开户用户、联系人、担保人、单位的名称、号码的协议关联关系表。
13.根据权利要求9所述的方法,其特征在于,步骤C3中识别地理关联关系包括如下步骤:
步骤C30:把行政区划地址、移动基站小区代码、套餐中区域代码、营业店面代码、网吧地址转换成统一的地理区域代码格式;
步骤C31:把采集到的地理参数信息转换对应成统一的地理区域代码;
步骤C32:分时段统计分析用户活动区域,区分长期稳定频繁活动、阶段性频繁活动、长期稳定但非频繁活动类别,并区分用户工作、学习、生活活动区域性质;
步骤C33:统计同一区域内活动的用户号码,标注活动区域性质;
步骤C34:分析识别用户活动区域、用户注册区域和联系人、担保人、单位所在区域、套餐包含区域、缴费区域之间的关联关系;
步骤C35:建立包括被转换为地理区域代码格式的行政区划地址,移动基站小区代码,套餐中区域代码,营业店面代码,网吧地址、地理区域代码、被分时段统计分析的用户活动区域,被区分类别的长期稳定频繁活动,阶段性频繁活动,长期稳定但非频繁活动,及被区分性质的用户工作,学习,生活活动区域,被标注活动区域性质的同一区域内活动的用户号码和包括用户活动区域,用户注册区域和联系人,担保人,单位所在区域,套餐包含区域,缴费区域之间的关联关系的地理关联关系表。
14.根据权利要求12所述的方法,其特征在于,步骤C4中识别用户群和用户之间的关系包括如下步骤:
步骤C40:选择目标用户交往圈范围,利用步骤C13建立的用户交往指数表,分析用户群的各用户的交往指数,判断出拥有共同的交往圈的用户群,分配用户群标识和用户群指数,并根据此用户群内每个用户交往指数的不同对应不同的成员指数;
步骤C41:选择目标用户区域范围,利用步骤C35建立的地理关联关系表,判断区域内符合目标用户特征的用户群;
步骤C42:对比步骤C40、C41识别出的用户群,分析成员组成和交往圈的重合度,根据重合度调整用户群指数和成员指数;
步骤C43:利用步骤C25建立的协议关联关系表,判断用户群内的用户号码之间存在协议关联关系,如果存在,增加存在协议关联关系用户的成员指数;
步骤C44:分析各用户群内的用户的目标特征,按照群体特征的符合程度增加用户群指数,并增加其中符合特征的用户的用户群成员指数;
步骤C45:根据用户群指数判断有特定共同特征的用户群符合率,如果符合,建立用户群数据表,并根据用户群成员指数确定成员组成。
15.根据权利要求12所述的方法,其特征在于,步骤C5中重点用户的分析识别包括如下步骤:
利用步骤C13建立的用户交往指数表、步骤C25建立的协议关联关系表,分别识别出圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010596310.6A CN102541886B (zh) | 2010-12-20 | 2010-12-20 | 一种识别用户群和用户之间关系的系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010596310.6A CN102541886B (zh) | 2010-12-20 | 2010-12-20 | 一种识别用户群和用户之间关系的系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102541886A CN102541886A (zh) | 2012-07-04 |
CN102541886B true CN102541886B (zh) | 2015-04-01 |
Family
ID=46348806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010596310.6A Active CN102541886B (zh) | 2010-12-20 | 2010-12-20 | 一种识别用户群和用户之间关系的系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102541886B (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102821058B (zh) * | 2012-07-18 | 2016-06-08 | 上海量明科技发展有限公司 | 即时通信中圈子地图的实现方法、客户端及系统 |
US20140280053A1 (en) * | 2013-03-14 | 2014-09-18 | Microsoft Corporation | Contextual socially aware local search |
CN104636382B (zh) * | 2013-11-13 | 2018-03-06 | 华为技术有限公司 | 推理社会关系的方法及装置 |
CN103631899B (zh) * | 2013-11-20 | 2017-02-22 | 中国联合网络通信集团有限公司 | 通信录还原方法和装置 |
CN103605791B (zh) * | 2013-12-04 | 2017-08-25 | 深圳中兴网信科技有限公司 | 信息推送系统和信息推送方法 |
CN104244314B (zh) * | 2014-07-30 | 2018-03-02 | 北京拓明科技有限公司 | 一种基于Mc接口信令的潜在集团客户识别方法 |
CN105578514B (zh) * | 2014-10-14 | 2019-02-26 | 中国移动通信集团广东有限公司 | 一种低值终端的识别方法和装置 |
CN105590223A (zh) * | 2014-12-29 | 2016-05-18 | 中国银联股份有限公司 | 商户的商圈信息的标定 |
CN106302104B (zh) * | 2015-06-26 | 2020-01-21 | 阿里巴巴集团控股有限公司 | 一种用户关系识别方法及装置 |
CN106557942B (zh) | 2015-09-30 | 2020-07-10 | 百度在线网络技术(北京)有限公司 | 一种用户关系的识别方法和装置 |
CN106570014B (zh) * | 2015-10-09 | 2020-09-25 | 阿里巴巴集团控股有限公司 | 用于确定用户的家庭属性信息的方法与设备 |
CN106789548B (zh) * | 2015-11-24 | 2020-04-24 | 腾讯科技(深圳)有限公司 | 处理用户关系链的方法、近场社交的实现方法和装置 |
CN105447186B (zh) * | 2015-12-16 | 2019-03-08 | 汉鼎宇佑互联网股份有限公司 | 一种基于大数据平台的用户行为分析系统 |
CN106658564B (zh) * | 2016-11-17 | 2019-10-25 | 广州杰赛科技股份有限公司 | 一种家庭用户的识别方法及装置 |
CN106960014B (zh) * | 2017-03-02 | 2021-02-19 | 阿里巴巴(中国)有限公司 | 关联用户推荐方法及装置 |
CN107579834A (zh) * | 2017-08-02 | 2018-01-12 | 百川通联(北京)网络技术有限公司 | 一种家庭账号识别方法及装置 |
CN107395516A (zh) * | 2017-09-05 | 2017-11-24 | 济南浚达信息技术有限公司 | 一种基于物联网的互联网数据备份方法 |
CN108566448A (zh) * | 2018-04-13 | 2018-09-21 | 国家计算机网络与信息安全管理中心 | 基于互联网基础资源的ip地址关联分析方法和分析系统 |
CN111324741B (zh) * | 2018-12-17 | 2023-08-18 | 中国移动通信集团山西有限公司 | 用户关系识别方法、装置、设备及介质 |
CN112307075B (zh) * | 2019-08-01 | 2023-09-19 | 中国移动通信集团广东有限公司 | 用户关系识别方法及装置 |
CN111275481A (zh) * | 2020-01-11 | 2020-06-12 | 支付宝(杭州)信息技术有限公司 | 基于电子凭证的虚拟资源分配方法及装置、电子设备 |
CN111784528A (zh) * | 2020-05-27 | 2020-10-16 | 平安科技(深圳)有限公司 | 异常社群检测方法、装置、计算机设备及存储介质 |
CN112328794B (zh) * | 2020-11-10 | 2021-08-24 | 南京师范大学 | 台风事件信息聚合方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1262485A (zh) * | 1998-11-10 | 2000-08-09 | 阿拉丁知识系统有限公司 | 由可灵活连接计算机系统群体使用的用户-计算机交互方法 |
CN101420313A (zh) * | 2007-10-22 | 2009-04-29 | 北京搜狗科技发展有限公司 | 一种针对客户端用户群进行聚类的方法和系统 |
-
2010
- 2010-12-20 CN CN201010596310.6A patent/CN102541886B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1262485A (zh) * | 1998-11-10 | 2000-08-09 | 阿拉丁知识系统有限公司 | 由可灵活连接计算机系统群体使用的用户-计算机交互方法 |
CN101420313A (zh) * | 2007-10-22 | 2009-04-29 | 北京搜狗科技发展有限公司 | 一种针对客户端用户群进行聚类的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102541886A (zh) | 2012-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102541886B (zh) | 一种识别用户群和用户之间关系的系统和方法 | |
Miller et al. | How people get local news and information in different communities | |
CN109978608A (zh) | 目标用户画像的营销标签分析提取方法及系统 | |
Narayana | Telecommunications services and economic growth: Evidence from India | |
Lee et al. | Lowering customer’s switching cost using B2B services for telecommunication companies | |
CN106658441A (zh) | 一种快捷回复未读信息的方法及装置 | |
Chen | A demand-side view of mobile internet adoption in the Global South | |
Ida et al. | Conjoint analysis of demand for IP telephony: The case of Japan | |
Nakamura | Mobile and fixed broadband access services substitution in Japan considering new broadband features | |
JP2021101382A (ja) | マーケティング支援装置、マーケティング支援方法およびコンピュータプログラム | |
Abu et al. | The determinants of the global mobile telephone deployment: an empirical analysis | |
CN106027303B (zh) | 一种征信特征获取方法及其设备 | |
Inoue et al. | Mobile internet-access behavior analysis | |
Kutlu | Effects of mobile number portability: case of Turkey | |
CN104361205B (zh) | 访客信息处理系统及方法 | |
CN103107936B (zh) | 一种发送信息的方法及装置 | |
Opoku et al. | Exploring the determinants of third generation (3G) mobile technology adoption among university students | |
Madden et al. | Residential demand estimation for bundled fixed-line and wireless mobile broadband services | |
Bonhomme | How to get the most from WeChat | |
Kuz'min et al. | Structure and Dynamics of Household Consumption of Information Goods: Regional Perspective | |
Wakhu et al. | Enhancing E/M-government synergy in Kenya: citizens’ perspectives on the driving factors for m-Government diffusion | |
Al Amin et al. | INFLUENCING FACTORS OF CUSTOMER ATTITUDE TOWARDS SMS MARKETING-A CASE OF MOBILE TELECOMMUNICATION INDUSTRY IN BANGLADESH | |
Sanda | Fifteen years of global systems of mobile telecommunication (GSM) services in Nigeria: Issues and challenges | |
Gerpott et al. | National origin as a means of customer segmentation–an analysis of mobile communications users in a GCC country | |
Saadi et al. | A Comparative Study of Customer Preferences for Telecommunication Technologies in Pakistan |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |