CN105975479A - 一种基于标签库的电信用户兴趣度分析方法及系统 - Google Patents
一种基于标签库的电信用户兴趣度分析方法及系统 Download PDFInfo
- Publication number
- CN105975479A CN105975479A CN201610248727.0A CN201610248727A CN105975479A CN 105975479 A CN105975479 A CN 105975479A CN 201610248727 A CN201610248727 A CN 201610248727A CN 105975479 A CN105975479 A CN 105975479A
- Authority
- CN
- China
- Prior art keywords
- user
- information
- telecommunication
- service
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
为解决现有技术电信用户兴趣度分析方法存在的不能够精准分析电信用户对各种电信业务或服务的兴趣度,易引起电信用户的反感或投诉等问题,本发明提出一种基于标签库的电信用户兴趣度分析方法及系统,通过获取全业务环境下的电信业务信息、电信用户上网行为、用户业务使用信息;运用相关分析法对用户标签库和电信业务信息进行分析并形成用户宽表,针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;形成“用户‑业务”二维兴趣度矩阵和“时间‑用户‑业务”的三维兴趣度矩阵,实现了电信用户兴趣度的量化分析和精准分析,为电信业务的精准营销奠定了基础。
Description
技术领域
本发明涉及电信用户兴趣度分析方法技术领域,具体涉及到一种基于标签库的电信用户兴趣度分析方法及系统。
背景技术
随着移动互联网的快速发展,电信运营商在传统的语音和信息方面的收入呈明显的下降趋势,同时,运营商的业务增长空间由于流量价值不断向OTT服务商转移而受到挤压,运营商日益呈现出管道化、边缘化、低值化的发展趋势,因此,实现对自身电信业务的精准营销能够帮助运营商攫取更大的价值。
然而,要想实现对自身电信业务的精准营销,其前提条件是对电信用户对各种电信业务或服务的兴趣度的精准分析,并以此分析为基础向电信用户进行营销,以更精确的手段进行用户需求挖掘与业务营销推广。现有技术电信用户兴趣度分析方法通常采用基于电信用户的基本资料、地理位置、通信行为等数据的分析和挖掘,从中发现业务运营规律,进而开展电信业务推荐。但随着移动互联网的不断发展,以及用户使用终端的多样化,加之互联网上丰富多彩的内容和非常复杂繁琐的电信用户行为,使得现有技术电信用户兴趣度分析方法不能精准分析电信用户对各种电信业务或服务的兴趣度,盲目的营销不仅会引起电信用户的反感,而且极其容易引发电信用户的投诉。显然,现有技术电信用户兴趣度分析方法存在着不能够精准分析电信用户对各种电信业务或服务的兴趣度,易引起电信用户的反感或投诉等问题。
发明内容
为解决现有技术电信用户兴趣度分析方法存在的不能够精准分析电信用户对各种电信业务或服务的兴趣度,易引起电信用户的反感或投诉等问题,本发明提出一种基于标签库的电信用户兴趣度分析方法及系统。
本发明基于标签库的电信用户兴趣度分析方法,包括以下步骤:
S1、获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;
S2、对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业务关 系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;
S3、针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;
S4、根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度;
S5、在设定时间间隔内运用相关分析法进行分析可生成“时间-用户-业务”的三维兴趣度矩阵。
进一步的,步骤S1中所述电信业务信息包含运营商终端信息、套餐信息和移动增值业务信息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏好信息;所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;所述IMEI信息即用户终端信息;其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获取。
进一步的,步骤S2中的用户宽表,包括:
所述地理位置包含居住地、工作地和行政区域信息;
所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、增值业务流量和通话时长信息;
所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;
所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;
所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星级信息;
所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;
所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top信息;
所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;
所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信息;
所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信息;
所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途费用和套餐外流量溢出值信息;
所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生命周 期、换机时长和曾使用的手机个数信息
其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和游戏。
进一步的,步骤S3中针对每个用户宽表的字段进行标签定义,包括,针对步骤S2中生成的用户宽表字段进行用户标签定义,使得每个宽表字段都能划分为若干个标签表示,并且,保证标签定义的合理性和完整性。
进一步的,步骤S4中根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度,包括,
所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的关联程度确定;
设某用户有n个标签,每个标签的分级数目为Bi(i=1,2,…n),每个标签相对于电信业务j的权重值为Aij(i=1,2,…n),每个用户的标签分值为Ci/Bi(i=1,2,…n;Ci=1,2,…Bi),则某用户与电信业务j的兴趣度wj的计算公式为:
对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的“用户-业务”二维兴趣度矩阵。
本发明基于标签库的电信用户兴趣度分析系统,包括,数据和信息采集模块、数据和信息处理模块、用户标签库模块和相关分析模块;
所述数据和信息采集模块用于获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;
所述数据和信息处理模块用于对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业务关系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;
所述用户标签库模块用于针对每个用户宽表的字段进行标签定义,并将用户宽表数据库 中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;
所述相关分析模块用于根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度;并且,在设定时间间隔内运用相关分析法进行分析可生成“时间-用户-业务”的三维兴趣度矩阵。
进一步的,所述数据和信息采集模块采集的电信业务信息包含运营商终端信息、套餐信息和移动增值业务信息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏好信息;所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;所述IMEI信息即用户终端信息;其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获取。
进一步的,所述用户宽表分类,包括,
所述地理位置包含居住地、工作地和行政区域信息;
所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、增值业务流量和通话时长信息;
所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;
所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;
所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星级信息;
所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;
所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top信息;
所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;
所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信息;
所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信息;
所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途费用和套餐外流量溢出值信息;
所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生命周期、换机时长和曾使用的手机个数信息
其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和游戏。
进一步的,所述相关分析模块根据用户标签库及电信业务信息,运用相关分析法进行分 析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度,包括,
所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的关联程度确定;
设某用户有n个标签,每个标签的分级数目为Bi(i=1,2,…n),每个标签相对于电信业务j的权重值为Aij(i=1,2,…n),每个用户的标签分值为Ci/Bi(i=1,2,…n;Ci=1,2,…Bi),则某用户与电信业务j的兴趣度wj的计算公式为:
对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的“用户-业务”二维兴趣度矩阵。
本发明基于标签库的电信用户兴趣度分析方法及系统的有益技术效果是获取了全业务环境下的电信业务信息、电信用户上网行为、用户业务使用信息;运用相关分析法对用户标签库和电信业务信息进行分析,形成“用户-业务”二维兴趣度矩阵和“时间-用户-业务”的三维兴趣度矩阵,实现了电信用户兴趣度的量化分析和精准分析,为电信业务的精准营销奠定了基础。
附图说明
附图1为本发明基于标签库的电信用户兴趣度分析方法的步骤示意图;
附图2是本发明基于标签库的电信用户兴趣度分析系统的结构示意图。
下面结合附图对本发明基于标签库的电信用户兴趣度分析方法及系统作进一步的说明。
具体实施方式
显而易见地,下面描述中的附图仅仅是本发明的一些实施例,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
附图1为本发明基于标签库的电信用户兴趣度分析方法的步骤示意图,由图可知,本发明基于标签库的电信用户兴趣度分析方法,包括以下步骤:
S1、获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;
S2、对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户 宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业务关系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;
S3、针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;
S4、根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度;
S5、在设定时间间隔内运用相关分析法进行分析可生成“时间-用户-业务”的三维兴趣度矩阵。
作为基本信息分类,步骤S1中所述电信业务信息包含运营商终端信息、套餐信息和移动增值业务信息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏好信息;所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;所述IMEI信息即用户终端信息;其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获取。
作为信息统计或分析的基础,步骤S2中的用户宽表,包括:
所述地理位置包含居住地、工作地和行政区域信息;
所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、增值业务流量和通话时长信息;
所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;
所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;
所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星级信息;
所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;
所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top信息;
所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;
所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信息;
所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信息;
所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途费用和套餐外流量溢出值信息;
所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生命周期、换机时长和曾使用的手机个数信息
其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和游戏。
标签化处理是本发明基于标签库的电信用户兴趣度分析方法的重要步骤之一,步骤S3中针对每个用户宽表的字段进行标签定义,包括,针对步骤S2中生成的用户宽表字段进行用户标签定义,使得每个宽表字段都能划分为若干个标签表示,并且,保证标签定义的合理性和完整性。
采用相关分析法获得各个电信用户对各种电信业务的兴趣度并以矩阵的方式,以便于进一步的分析或应用。步骤S4中根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度,包括,
所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的关联程度确定;
设某用户有n个标签,每个标签的分级数目为Bi(i=1,2,…n),每个标签相对于电信业务j的权重值为Aij(i=1,2,…n),每个用户的标签分值为Ci/Bi(i=1,2,…n;Ci=1,2,…Bi),则某用户与电信业务j的兴趣度wj的计算公式为:
对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的“用户-业务”二维兴趣度矩阵。
附图2是本发明基于标签库的电信用户兴趣度分析系统的结构示意图,由图可知,本发明基于标签库的电信用户兴趣度分析系统,包括,数据和信息采集模块、数据和信息处理模块、用户标签库模块和相关分析模块;
所述数据和信息采集模块用于获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;
所述电信业务信息包含运营商终端信息、套餐信息和移动增值业务信息;
所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;
所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏好信息;
所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;
所述IMEI信息即用户终端信息;
其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获取。
所述数据和信息处理模块用于对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业务关系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;
所述地理位置包含居住地、工作地和行政区域信息;
所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、增值业务流量和通话时长信息;
所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;
所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;
所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星级信息;
所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;
所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top信息;
所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;
所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信息;
所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信息;
所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途费用和套餐外流量溢出值信息;
所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生命周期、换机时长和曾使用的手机个数信息
其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和游戏。
所述用户标签库模块用于针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;
所述相关分析模块用于根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某 电信业务之间的兴趣度;包括,所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的关联程度确定;
设某用户有n个标签,每个标签的分级数目为Bi(i=1,2,…n),每个标签相对于电信业务j的权重值为Aij(i=1,2,…n),每个用户的标签分值为Ci/Bi(i=1,2,…n;Ci=1,2,…Bi),则某用户与电信业务j的兴趣度wj的计算公式为:
对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的“用户-业务”二维兴趣度矩阵。
在设定时间间隔内运用相关分析法进行分析可生成“时间-用户-业务”的三维兴趣度矩阵。
显然,本发明基于标签库的电信用户兴趣度分析方法及系统的有益技术效果是获取了全业务环境下的电信业务信息、电信用户上网行为、用户业务使用信息;运用相关分析法对用户标签库和电信业务信息进行分析,形成“用户-业务”二维兴趣度矩阵和“时间-用户-业务”的三维兴趣度矩阵,实现了电信用户兴趣度的量化分析和精准分析,为电信业务的精准营销奠定了基础。
Claims (9)
1.一种基于标签库的电信用户兴趣度分析方法,其特征在于,该方法包括以下步骤:
S1、获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;
S2、对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业务关系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;
S3、针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;
S4、根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度;
S5、在设定时间间隔内运用相关分析法进行分析可生成“时间-用户-业务”的三维兴趣度矩阵。
2.根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S1中所述电信业务信息包含运营商终端信息、套餐信息和移动增值业务信息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏好信息;所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;所述IMEI信息即用户终端信息;其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获取。
3.根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S2中的用户宽表,包括:
所述地理位置包含居住地、工作地和行政区域信息;
所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、增值业务流量和通话时长信息;
所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;
所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;
所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星级信息;
所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;
所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top信息;
所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;
所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信息;
所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信息;
所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途费用和套餐外流量溢出值信息;
所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生命周期、换机时长和曾使用的手机个数信息
其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和游戏。
4.根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S3中针对每个用户宽表的字段进行标签定义,包括,针对步骤S2中生成的用户宽表字段进行用户标签定义,使得每个宽表字段都能划分为若干个标签表示,并且,保证标签定义的合理性和完整性。
5.根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S4中根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度,包括,
所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的关联程度确定;
设某用户有n个标签,每个标签的分级数目为Bi(i=1,2,…n),每个标签相对于电信业务j的权重值为Aij(i=1,2,…n),每个用户的标签分值为Ci/Bi(i=1,2,…n;Ci=1,2,…Bi),则某用户与电信业务j的兴趣度wj的计算公式为:
对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的“用户-业务”二维兴趣度矩阵。
6.一种基于标签库的电信用户兴趣度分析系统,其特征在于,该系统包括,数据和信息采集模块、数据和信息处理模块、用户标签库模块和相关分析模块;
所述数据和信息采集模块用于获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;
所述数据和信息处理模块用于对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业务关系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;
所述用户标签库模块用于针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;
所述相关分析模块用于根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度;并且,在设定时间间隔内运用相关分析法进行分析可生成“时间-用户-业务”的三维兴趣度矩阵。
7.根据权利要求6所述基于标签库的电信用户兴趣度分析系统,其特征在于,所述数据和信息采集模块采集的电信业务信息包含运营商终端信息、套餐信息和移动增值业务信息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏好信息;所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;所述IMEI信息即用户终端信息;其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获取。
8.根据权利要求6所述基于标签库的电信用户兴趣度分析系统,其特征在于,所述用户宽表分类,包括,
所述地理位置包含居住地、工作地和行政区域信息;
所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、增值业务流量和通话时长信息;
所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;
所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;
所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星级信息;
所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;
所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top信息;
所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;
所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信息;
所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信息;
所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途费用和套餐外流量溢出值信息;
所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生命周期、换机时长和曾使用的手机个数信息
其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和游戏。
9.根据权利要求6所述基于标签库的电信用户兴趣度分析系统,其特征在于所述相关分析模块根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的“用户-业务”二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣度,包括,
所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的关联程度确定;
设某用户有n个标签,每个标签的分级数目为Bi(i=1,2,…n),每个标签相对于电信业务j的权重值为Aij(i=1,2,…n),每个用户的标签分值为Ci/Bi(i=1,2,…n;Ci=1,2,…Bi),则某用户与电信业务j的兴趣度wj的计算公式为:
对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的“用户-业务”二维兴趣度矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610248727.0A CN105975479B (zh) | 2016-04-20 | 2016-04-20 | 一种基于标签库的电信用户兴趣度分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610248727.0A CN105975479B (zh) | 2016-04-20 | 2016-04-20 | 一种基于标签库的电信用户兴趣度分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105975479A true CN105975479A (zh) | 2016-09-28 |
CN105975479B CN105975479B (zh) | 2019-08-27 |
Family
ID=56994774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610248727.0A Active CN105975479B (zh) | 2016-04-20 | 2016-04-20 | 一种基于标签库的电信用户兴趣度分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105975479B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107465739A (zh) * | 2017-08-01 | 2017-12-12 | 中国联合网络通信集团有限公司 | 实体渠道用户引流的方法及装置 |
CN108932646A (zh) * | 2017-05-26 | 2018-12-04 | 中移(杭州)信息技术有限公司 | 基于运营商的用户标签验证方法、装置和电子设备 |
CN109145019A (zh) * | 2018-07-10 | 2019-01-04 | 武汉海云健康科技股份有限公司 | 一种大数据动态人物画像信息提取方法 |
CN110060093A (zh) * | 2019-03-25 | 2019-07-26 | 广州瀚信通信科技股份有限公司 | 一种基于4g高流量客户的终端营销方法 |
CN110348876A (zh) * | 2019-05-28 | 2019-10-18 | 成都美美臣科技有限公司 | 一种电子商务网站客户个性化数据建立方法 |
CN110895588A (zh) * | 2018-09-13 | 2020-03-20 | 中国移动通信有限公司研究院 | 一种数据处理方法及设备 |
CN111429137A (zh) * | 2020-03-17 | 2020-07-17 | 深圳市随金科技有限公司 | 一种模块化数据采集方法、装置、服务器和存储介质 |
CN111741155A (zh) * | 2020-06-24 | 2020-10-02 | 广西东信易通科技有限公司 | 一种基于隐私号平台降低投诉率的系统 |
CN112200633A (zh) * | 2020-10-19 | 2021-01-08 | 广州瀚信通信科技股份有限公司 | 一种基于5g通信技术的订单管理的方法 |
CN112559809A (zh) * | 2020-12-21 | 2021-03-26 | 恩亿科(北京)数据科技有限公司 | 消费者多渠道数据整合方法、系统、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020049739A1 (en) * | 2000-08-14 | 2002-04-25 | Tony Hong | Method and system for integrating online topical data with uniform user interface |
US20060259475A1 (en) * | 2005-05-10 | 2006-11-16 | Dehlinger Peter J | Database system and method for retrieving records from a record library |
CN102215300A (zh) * | 2011-05-24 | 2011-10-12 | 中国联合网络通信集团有限公司 | 电信业务推荐方法和系统 |
CN102760128A (zh) * | 2011-04-26 | 2012-10-31 | 华东师范大学 | 一种基于智能客服机器人交互的电信领域套餐推荐方法 |
-
2016
- 2016-04-20 CN CN201610248727.0A patent/CN105975479B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020049739A1 (en) * | 2000-08-14 | 2002-04-25 | Tony Hong | Method and system for integrating online topical data with uniform user interface |
US20060259475A1 (en) * | 2005-05-10 | 2006-11-16 | Dehlinger Peter J | Database system and method for retrieving records from a record library |
CN102760128A (zh) * | 2011-04-26 | 2012-10-31 | 华东师范大学 | 一种基于智能客服机器人交互的电信领域套餐推荐方法 |
CN102215300A (zh) * | 2011-05-24 | 2011-10-12 | 中国联合网络通信集团有限公司 | 电信业务推荐方法和系统 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932646A (zh) * | 2017-05-26 | 2018-12-04 | 中移(杭州)信息技术有限公司 | 基于运营商的用户标签验证方法、装置和电子设备 |
CN108932646B (zh) * | 2017-05-26 | 2021-04-13 | 中移(杭州)信息技术有限公司 | 基于运营商的用户标签验证方法、装置和电子设备 |
CN107465739A (zh) * | 2017-08-01 | 2017-12-12 | 中国联合网络通信集团有限公司 | 实体渠道用户引流的方法及装置 |
CN107465739B (zh) * | 2017-08-01 | 2019-07-16 | 中国联合网络通信集团有限公司 | 实体渠道用户引流的方法及装置 |
CN109145019A (zh) * | 2018-07-10 | 2019-01-04 | 武汉海云健康科技股份有限公司 | 一种大数据动态人物画像信息提取方法 |
CN110895588A (zh) * | 2018-09-13 | 2020-03-20 | 中国移动通信有限公司研究院 | 一种数据处理方法及设备 |
CN110895588B (zh) * | 2018-09-13 | 2022-07-22 | 中国移动通信有限公司研究院 | 一种数据处理方法及设备 |
CN110060093A (zh) * | 2019-03-25 | 2019-07-26 | 广州瀚信通信科技股份有限公司 | 一种基于4g高流量客户的终端营销方法 |
CN110060093B (zh) * | 2019-03-25 | 2023-12-05 | 广州瀚信通信科技股份有限公司 | 一种基于4g高流量客户的终端营销方法 |
CN110348876A (zh) * | 2019-05-28 | 2019-10-18 | 成都美美臣科技有限公司 | 一种电子商务网站客户个性化数据建立方法 |
CN111429137A (zh) * | 2020-03-17 | 2020-07-17 | 深圳市随金科技有限公司 | 一种模块化数据采集方法、装置、服务器和存储介质 |
CN111741155A (zh) * | 2020-06-24 | 2020-10-02 | 广西东信易通科技有限公司 | 一种基于隐私号平台降低投诉率的系统 |
CN112200633A (zh) * | 2020-10-19 | 2021-01-08 | 广州瀚信通信科技股份有限公司 | 一种基于5g通信技术的订单管理的方法 |
CN112559809A (zh) * | 2020-12-21 | 2021-03-26 | 恩亿科(北京)数据科技有限公司 | 消费者多渠道数据整合方法、系统、设备及存储介质 |
CN112559809B (zh) * | 2020-12-21 | 2024-08-02 | 恩亿科(北京)数据科技有限公司 | 消费者多渠道数据整合方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105975479B (zh) | 2019-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105975479A (zh) | 一种基于标签库的电信用户兴趣度分析方法及系统 | |
CN102591942B (zh) | 一种应用自动推荐的方法及装置 | |
Jeong et al. | Moderating effect of personal innovativeness on mobile-RFID services: Based on Warshaw's purchase intention model | |
CN111190939A (zh) | 一种用户画像构建方法及装置 | |
CN108537578A (zh) | 基于大数据的广告推送方法及装置 | |
CN104765751B (zh) | 应用推荐方法及装置 | |
CN103295145A (zh) | 一种基于用户消费特征向量的手机广告投放方法 | |
CN105306495B (zh) | 用户识别方法和装置 | |
CN109345263A (zh) | 预测客户满意度的方法和系统 | |
CN102118706A (zh) | 一种基于手机广告用户细分的手机广告投放方法 | |
CN106294787A (zh) | 一种推送信息的方法、装置及电子设备 | |
KR20180120571A (ko) | 인플루언서를 활용한 소셜 네트워크 서비스 마케팅 시스템 | |
CN103455559A (zh) | 一种应用自动推荐的方法及装置 | |
CN103488788A (zh) | 一种应用自动推荐的方法及装置 | |
CN101511055A (zh) | 广告的投放方法及装置 | |
CN109087132B (zh) | 一种基于知识图谱的用户问题推送方法及装置 | |
CN103108049B (zh) | 一种为移动终端用户提供个性化页面的方法 | |
Hwang et al. | Investigation of factors affecting the diffusion of mobile telephone services: An empirical analysis for Vietnam | |
CN106991577A (zh) | 一种确定目标用户的方法及装置 | |
Joshi et al. | Customer experience and associated customer behaviour in end user devices and technologies (smartphones, mobile internet, mobile financial services) | |
Tseng et al. | An integrated model for analyzing the development of the 4G telecommunications market in Taiwan | |
US20210357953A1 (en) | Availability ranking system and method | |
US20090268890A1 (en) | Targeting ads by tracking calls | |
CN106910092A (zh) | 一种基于商业wifi行业属性的主动营销方法和系统 | |
Husso | Analysis of competition in the mobile phone markets of the United States and Europe |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 401220 No. 6 Xinmin Road, Xinshi Street, Changshou District, Chongqing Applicant after: Chongqing Zhongyou Huice Communication Technology Co., Ltd. Address before: 401121 Chongqing North New District Yubei District high tech Park mercury science and Technology Development Center North Wing 5 floor Applicant before: Chongqing Zhongyou Huice Communication Technology Co., Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |