CN106682936A - 一种多业务的数据处理方法、装置及电子设备 - Google Patents

一种多业务的数据处理方法、装置及电子设备 Download PDF

Info

Publication number
CN106682936A
CN106682936A CN201611121871.4A CN201611121871A CN106682936A CN 106682936 A CN106682936 A CN 106682936A CN 201611121871 A CN201611121871 A CN 201611121871A CN 106682936 A CN106682936 A CN 106682936A
Authority
CN
China
Prior art keywords
user
business
accounting
property
overall
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611121871.4A
Other languages
English (en)
Inventor
李金林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Holding Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Information Technology Beijing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201611121871.4A priority Critical patent/CN106682936A/zh
Publication of CN106682936A publication Critical patent/CN106682936A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Abstract

本发明实施例属于数据处理领域,涉及一种多业务的数据处理方法、装置及电子设备,所述方法包括获取多个业务的历史数据;根据所述历史数据得到所述多个业务的整体用户和交叉用户;获取所述整体用户和交叉用户对应的用户信息,所述用户信息包括至少一个用户属性,其中每个用户属性对应多个属性值;获取每个属性值对应的用户在整体用户和交叉用户中的占比;比较所述每个属性值对应的用户在整体用户中和在交叉用户中的占比,根据比较结果调整业务内容或推送业务消息。通过本发明实施例提供的方法、装置及电子设备,可以对多个业务的用户整体进行分析,从而整体进行业务调整或者业务推送,业务调整和推送的精准度更高。

Description

一种多业务的数据处理方法、装置及电子设备
技术领域
本发明属于数据处理领域,尤其涉及一种多业务的数据处理方法、装置及电子设备。
背景技术
目前,针对互联网行业产生的数据的使用显得非常重要,如何的处理、存储、分析,挖掘其中的价值是数据处理的重点,而数据分析的质量更是提高数据的使用的重点。
发明人在实现本发明的过程中发现,现有技术至少存在下述问题:
现有针对数据的分析都是针对单个业务的数据进行分析,比如体现用户粘度和变现价值指标分析、用户的特征分析等,根据分析结果进行业务调整,比如进行广告推送等,由于数据分析所对应的业务单一,对于存在关联的多个业务,无法进行综合的数据分析,使得多个业务整体调整的精准度较低。
发明内容
综上所述,本发明实施例提供一种多业务的数据处理方法、装置及电子设备,以解决现有数据分析所对应的业务单一,对于存在关联的多个业务,无法进行综合的数据分析,使得多个业务整体调整的精准度较低的问题。
第一方面,本发明实施例提供一种多业务的数据处理方法,应用于电子设备,包括:
获取多个业务的历史数据;
根据所述历史数据得到所述多个业务的整体用户和交叉用户,所述整体用户为合并相同用户后的用户集合,所述交叉用户为所述多个业务中至少两个业务共有的用户集合;
获取所述整体用户和交叉用户对应的用户信息,所述用户信息包括至少一个用户属性,其中每个用户属性对应多个属性值;
获取每个属性值对应的用户在整体用户中的占比,以及获取所述每个属性值对应的用户在交叉用户中的占比;
比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比,根据比较结果调整业务内容或推送业务消息。
进一步的,所述方法还包括:设置所述历史数据的历史时间段,相应的,所述获取多个业务的历史数据具体为获取所述历史时间段内的历史数据。
进一步的,所述方法还包括定时获取所述多个业务的历史数据,具体为:设置所述多个业务的历史数据的获取时间,当达到设置的获取时间时,获取所述多个业务的历史数据。
进一步的,所述根据所述历史数据得到所述多个业务的整体用户和交叉用户包括:
获取所述多个业务中每项业务中的用户ID;
生成用户ID与对应业务的映射表;
获得所述多个业务的整体用户;
获取对应多个业务的用户ID,以获得所述多个业务的交叉用户。
进一步的,在获取每个属性值对应的用户在整体用户中的占比,以及获取所述每个属性值对应的用户在交叉用户中的占比之后,所述方法还包括:
根据每个属性值对应的用户在整体用户中的占比,以及所述每个属性值对应的用户在交叉用户中的占比生成属性分布映射表;
相应的,所述比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比,根据比较结果调整业务内容或推送业务消息包括:
获取选定的用户属性;
遍历所述属性分布映射表,获取所述选定的用户属性的属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
根据比较结果调整业务内容或推送业务消息。
进一步的,所述用户属性包括共有属性和私有属性,其中:
当所述用户属性为共有属性时,对所述共有属性对应的业务进行业务内容调整或推送业务消息;
当所述用户属性为私有属性时,对所述私有属性对应的业务进行业务内容调整或推送业务消息。
第二方面,本发明实施例提供一种多业务的数据处理装置,包括:
数据采集模块,用于获取多个业务的历史数据;
用户提取模块,用于根据所述历史数据得到所述多个业务的整体用户和交叉用户,所述整体用户为合并相同用户后的用户集合,所述交叉用户为所述多个业务中至少两个业务共有的用户集合;
用户信息获取模块,用于获取所述整体用户和交叉用户对应的用户信息,所述用户信息包括至少一个用户属性,其中每个用户属性对应多个属性值;
数据处理模块,用于获取每个属性值对应的用户在整体用户中的占比,以及获取所述每个属性值对应的用户在交叉用户中的占比;
比较执行模块,用于比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比,根据比较结果调整业务内容或推送业务消息。
进一步的,所述装置还包括时间设置模块,用于设置所述历史数据的历史时间段,相应的,所述数据采集模块具体用于获取所述历史时间段内的历史数据。
进一步的,所述装置还包括定时模块,使得数据采集模块定时获取所述多个业务的历史数据,所述定时模块用于设置所述多个业务的历史数据的采集时间,当达到设置的采集时间时,获取所述多个业务的历史数据。
进一步的,所述用户信息获取模块包括:
用户ID获取单元,用于获取所述多个业务中每项业务中的用户ID;
映射表生成单元,用于生成用户ID与对应业务的映射表;
整体用户获取单元,用于根据所述映射表获得所述多个业务的整体用户;
交叉用户获取单元,用于根据所述映射表获取对应多个业务的用户ID,获得所述多个业务的交叉用户。
进一步的,所述数据处理模块还用于根据每个属性值对应的用户在整体用户中的占比,以及所述每个属性值对应的用户在交叉用户中的占比生成属性分布映射表;
相应的,所述比较执行模块包括:
属性获取单元,用于获取选定的用户属性;
数据获取单元,用于遍历所述属性分布映射表,获取所述选定的用户属性的属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
比较单元,用于比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
执行单元,用于根据比较结果调整业务内容或推送业务消息。
进一步的,所述用户信息获取模块获取的用户属性包括共有属性和私有属性,其中:
当所述用户属性为共有属性时,比较执行模块对所述共有属性对应的业务进行业务内容调整或推送业务消息;
当所述用户属性为私有属性时,比较执行模块对所述私有属性对应的业务进行业务内容调整或推送业务消息。
第三方面,本发明实施例提供一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的多业务的数据处理方法。
通过本发明实施例提供的多业务的数据处理方法、装置及电子设备,通过提取多个业务的整体用户和交叉用户,以及用户对应的用户属性,获取各用户属性的属性值在整体用户和交叉用户中的分布情况,可以对多个业务的用户整体进行分析,从而整体进行业务调整或者业务推送,业务调整和推送的精准度更高。
附图说明
为了更清楚地说明本发明或现有技术中的方案,下面将对实施例或现有技术描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一所提供的多业务的数据处理方法的处理流程图;
图2为本发明实施例一所提供的用户集合示意图;
图3为本发明实施例二所提供的整体用户和交叉用户的获取流程图;
图4为本发明实施例二所提供的根据比较结果调整业务内容或推送业务消息的处理流程图;
图5为本发明实施例三所提供的多业务的数据处理方法的结构框图;
图6为本发明实施例四所提供的多业务的数据处理方法的结构框图;
图7为本发明实施例四所提供的用户信息获取模块的结构框图;
图8为本发明实施例四所提供的比较执行模块的结构框图;
图9为本发明实施例五所提供的电子设备的一种硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,附图中给出了本发明的较佳实施例。本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
实施例一
本发明实施例提供的一种多业务的数据处理方法,应用于电子设备,所述电子设备具体可以是服务器等终端设备。参阅图1,图示为本发明实施例提供的多业务的数据处理方法的流程图,所述方法包括:
S101、获取多个业务的历史数据;
对于开展多项业务的公司而言,比如公司同时开展影视、购物商城、体育、智能电视、智能手机等多项业务,不同业务之间存在关联的内容或者数据,比如体育视频属于影视的一种,智能电视或者智能手机是影视的传播载体,而购物商城中的商品可以是智能电视或者智能手机、体育门票、影视会员等。
在本实施例中,所述历史数据包括各个业务的用户数据、交易数据、操作数据、推广数据等,可选的,不同业务之间的数据互相关联。
S102、根据所述历史数据得到所述多个业务的整体用户和交叉用户,所述整体用户为合并相同用户后的用户集合,所述交叉用户为所述多个业务中至少两个业务共有的用户集合;
比如公司同时开展影视、智能电视、智能手机三项业务,影视业务的用户集合为(A1,A2,A3,B1,B2),智能电视业务的用户集合为(A2,A4,A5,B2,B3,C1),智能手机业务的用户集合为(A1,A2,B2,B4,C1),则所述交叉用户为影视、智能电视、智能手机三项业务中至少两个业务共有的用户,即交叉用户的集合为(A1,A2,B2,C1),而整体用户则为合并影视、智能电视、智能手机三项业务中的相同用户后的全部用户,即整体用户的集合为(A1,A2,A3,A4,A5,B1,B2,B3,B4,C1),具体可参阅图2所示的用户集合示意图,可知影视用户所指向的圆中包含用户A1,A2,A3,B1,B2,智能电视用户和智能手机用户类似。
S103、获取所述整体用户和交叉用户对应的用户信息,所述用户信息包括至少一个用户属性,其中每个用户属性对应多个属性值;
所述用户属性包括但不限于性别、年龄、职业、地域、兴趣偏好、购买偏好、消费分布等,每种用户属性对应多个属性值,这些属性值可以是固定的,比如性别对应男和女两个固定属性值,也可以是不固定的,比如消费分布可以对应多个消费金额段,一个消费金额段为一个属性值,消费金额段的划分是不固定的,可以任意设定,只有当设定之后,所述消费分布才对应多个固定的属性值,比如将消费金额划分为五段,分别为:500元及以下、500-1000元、1000-5000元、5000-10000元、100000元及以上。
S104、获取每个属性值对应的用户在整体用户中的占比,以及获取所述每个属性值对应的用户在交叉用户中的占比;
比如用户属性包括性别、年龄、职业、地域、兴趣偏好、购买偏好、消费分布等用户属性,每个属性对应多个属性值,以性别为例,可以在整体用户中得到男性用户、女性用户各自的占比,同时在交叉用户中得到男性用户、女性用户各自的占比。
以S102中的例子进行说明,假如A1-A5、C1为女性,B1-B4为男性,可知在整体用户中男性用户占比为40%,女性用户占比为60%;而在交叉用户中男性用户占比为25%,女性用户占比为75%,可知同一用户属性在整体用户和交叉用户中各个属性值的占比有可能是不一样的。
S105、比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比,根据比较结果调整业务内容或推送业务消息。
具体的,获取交叉用户中占比最高的属性值,将该属性值在整体用户中的占比和在交叉用户中的占比进行对比,当该属性值在整体用户中的占比小于交叉用户中的占比时,根据该属性值调整业务内容,可选的,所述调整业务内容可以是增加与该属性值关联性大的内容,或者向该属性值对应的用户推送业务消息,所述业务消息可以是推广信息,也可以是广告信息、续费信息等。
可选的,可以设置属性值占比的阈值,当该属性值在整体用户中的占比小于交叉用户中的占比,且该属性值在交叉用户中的占比大于所述属性值占比的阈值时,根据该属性值调整业务内容。
根据本发明实施例提供的多业务的数据处理方法,通过提取多个业务的整体用户和交叉用户,以及用户对应的用户属性,获取各用户属性的属性值在整体用户和交叉用户中的分布情况,可以对多个业务的用户整体进行分析,从而整体进行业务调整或者业务推送,业务调整和推送的精准度更高。
实施例二
基于实施例一,作为本发明实施例的可选方案,所述方法还包括设置所述历史数据的历史时间段,具体的,在本实施例中,所述历史时间段以天、月或年为单位计算。相应的,所述获取多个业务的历史数据具体为获取所述历史时间段内的历史数据,比如获取一天或者一周内的历史数据。
通过本发明实施例的可选方案,可以获取任意时间段的历史数据,从而可获得不同的分析结果,以进行更精准的数据分析。
作为本发明实施例的可选方案,所述方法还包括定时获取所述多个业务的历史数据,具体为设置所述多个业务的历史数据的获取时间,当达到设置的获取时间时,获取所述多个业务的历史数据。
可选的,可以针对不同的业务设置不同的获取时间,比如一些业务在一天的某个时间点后将不会产生用户访问或者产生的用户访问量很低,此时可以针对不同的业务的用户访问时间分布,对应地设置历史数据的获取时间。
通过本发明实施例的可选方案,可以根据系统资源灵活调整历史数据获取和分析的时间,在系统处于空闲状态时进行历史数据的提取以及进行数据处理。
作为本发明实施例的可选方案,所述方法还包括设置需要进行数据处理的业务,比如公司同时开展影视、购物商城、体育、智能电视、智能手机等多项业务,可以设定要进行数据处理的业务种类,比如选定影视、购物商城、体育三项业务进行数据分析处理。可选的,最终设置的进行数据处理的业务之间存在关联。
通过本发明实施例的可选方案,可以根据需要任意调整进行数据分析处理的业务个数和类型,以满足多种数据分析处理需求。
作为本发明实施例的可选方案,参阅图3所示的整体用户和交叉用户的获取流程图,所述根据所述历史数据得到所述多个业务的整体用户和交叉用户包括:
S301、获取所述多个业务中每项业务中的用户ID;
S302、生成用户ID与对应业务的映射表;
在本发明实施例中,每个用户ID与选定的进行数据处理的业务之间可形成如下表所示的映射关系:
字段描述 字段名称 字段类型 字段值
用户ID user_id string
智能手机业务 is_smartphone int 1
智能电视业务 is_smartTV int 1
商城业务 is_mall int 0
影视业务 is_tv int 1
体育业务 is_sport int 0
当表中业务的字段值为0时,表示用户ID与该业务无对应关系,当表中业务的字段值为1时,表示用户ID与该业务存在对应关系,一个用户ID可以对应多个业务。
S303、获得所述多个业务的整体用户;
在本实施例中,假定所述映射表的表名为user_base_info_all,如果需要获取智能手机及智能电视的交叉用户,则可以通过如下方式筛选的整体用户:
select user_id from user_base_info_all where is_smartphone=1or is_smartTV=1。
如果要获取某一天的数据,则可增加字段dt,以表示时间,此时可以通过如下方式筛选的整体用户:
select user_id from user_base_info_all where dt=’20161010’and(is_smartphone=1or is_smartTV=1)。
S304、获取对应多个业务的用户ID,以获得所述多个业务的交叉用户。
同样的,可通过如下方式筛选出智能手机及智能电视的交叉用户:
select user_id from user_base_info_all where is_smartphone=1and is_smartTV=1。
如果要获取某一天的数据,则可增加字段dt,以表示时间,此时可以通过如下方式筛选的交叉用户:
select user_id from user_base_info_all where dt=’20161010’and is_smartphone=1and is_smartTV=1。
可选的,上述获取整体用户和交叉用户的步骤可以互相交换。
作为本发明实施例的可选方案,在获取每个属性值对应的用户在整体用户中的占比,以及获取所述每个属性值对应的用户在交叉用户中的占比之后,所述方法还包括:
根据每个属性值对应的用户在整体用户中的占比,以及所述每个属性值对应的用户在交叉用户中的占比生成属性分布映射表;
相应的,参阅图4,所述比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比,根据比较结果调整业务内容或推送业务消息包括:
S401、获取选定的用户属性;
作为本发明实施例的可选方案,所述用户属性可以包括多个子用户属性,相应的,每个子用户属性包含多个属性值。相应的,可获取所述多个子用户属性在整体用户和交叉用户中的占比。可选的,所述用户属性可以包括多个层级的子用户属性,比如用户属性购买偏好可以包括商城付费、会员付费两个子用户属性,而商城付费和会员付费还可以继续包括更低层级的子用户属性。
S402、遍历所述属性分布映射表,获取所述选定的用户属性的属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
S403、比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
S404、根据比较结果调整业务内容或推送业务消息。所述S403和S404可参考实施例一中相关技术内容。
作为本发明实施例的可选方案,所述用户属性包括共有属性和私有属性,其中:
当所述用户属性为共有属性时,对所述共有属性对应的业务进行业务内容调整或推送业务消息;
当所述用户属性为私有属性时,对所述私有属性对应的业务进行业务内容调整或推送业务消息。
作为本发明实施例的可选方案,在获取多个业务的历史数据之后,所述方法还包括对历史数据进行筛选,删除历史数据中的无效数据。
根据本发明实施例提供的多业务的数据处理方法,通过提取多个业务的整体用户和交叉用户,以及用户对应的用户属性,获取各用户属性的属性值在整体用户和交叉用户中的分布情况,可以对多个业务的用户整体进行分析,从而整体进行业务调整或者业务推送,业务调整和推送的精准度更高,此外,通过设置所述历史数据的历史时间段可以获取任意时间段的历史数据,从而可获得不同的分析结果;通过设定时间点,可以根据系统资源灵活调整历史数据获取和分析的时间;以及通过设置需要进行数据处理的业务,任意调整进行数据分析处理的业务个数和类型,以满足多种数据分析处理需求。
实施例三
本发明实施例提供一种多业务的数据处理装置,如图5所示的结构框图,所述装置包括数据采集模块501、用户提取模块502、用户信息获取模块503、数据处理模块504和比较执行模块505,下面对各模块进行详细说明,其中:
所述数据采集模块501用于获取多个业务的历史数据;在本实施例中,所述数据采集模块501获取历史数据包括各个业务的用户数据、交易数据、操作数据、推广数据等,可选的,不同业务之间的数据互相关联。
用户提取模块502用于根据所述历史数据得到所述多个业务的整体用户和交叉用户,所述整体用户为合并相同用户后的用户集合,所述交叉用户为所述多个业务中至少两个业务共有的用户集合;比如公司同时开展影视、智能电视、智能手机三项业务,用户提取模块502提取到影视业务的用户集合为(A1,A2,A3,B1,B2),智能电视业务的用户集合为(A2,A4,A5,B2,B3,C1),智能手机业务的用户集合为(A1,A2,B2,B4,C1),进一步地,用户提取模块502合并影视、智能电视、智能手机三项业务中相同的用户A1,A2,B2,C1后,可得到整体用户的集合为(A1,A2,A3,A4,A5,B1,B2,B3,B4,C1),同时用户提取模块502影视、智能电视、智能手机三项业务中至少两个业务共有的用户,得到交叉用户的集合为(A1,A2,B2,C1)。
用户信息获取模块503用于获取所述整体用户和交叉用户对应的用户信息,所述用户信息包括至少一个用户属性,其中每个用户属性对应多个属性值;可选的,用户信息获取模块503获取的用户属性包括但不限于性别、年龄、职业、地域、兴趣偏好、购买偏好、消费分布等,每种用户属性对应多个属性值,这些属性值可以是固定的,比如性别对应男和女两个固定属性值,也可以是不固定的,比如消费分布可以对应多个消费金额段,一个消费金额段为一个属性值,消费金额段的划分是不固定的,可以任意设定,只有当设定之后,所述消费分布才对应多个固定的属性值。
数据处理模块504用于获取每个属性值对应的用户在整体用户中的占比,以及获取所述每个属性值对应的用户在交叉用户中的占比;同样以上述的影视、智能电视、智能手机三项业务为例进行说明,假如A1-A5、C1为女性,B1-B4为男性,通过数据处理模块504可以计算得出整体用户中男性用户占比为40%,女性用户占比为60%;同时可以计算得出在交叉用户中男性用户占比为25%,女性用户占比为75%,可知同一用户属性在整体用户和交叉用户中各个属性值的占比有可能是不一样的。
比较执行模块505用于比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比,根据比较结果调整业务内容或推送业务消息。具体的,比较执行模块505获取交叉用户中占比最高的属性值,将该属性值在整体用户中的占比和在交叉用户中的占比进行对比,当该属性值在整体用户中的占比小于交叉用户中的占比时,所述比较执行模块505根据该属性值调整业务内容,可选的,所述比较执行模块505调整业务内容可以是增加与该属性值关联性大的内容,或者向该属性值对应的用户推送业务消息,所述比较执行模块505推送的业务消息可以是推广信息,也可以是广告信息、续费信息等。
本发明实施例中所述的各个模块的功能和效果以及未在本实施例中详尽描述的技术细节,可详细参阅前述实施例中相关技术内容,在此不再赘述。
根据本发明实施例提供的多业务的数据处理装置,通过数据采集模块、用户提取模块和用户信息获取模块提取多个业务的整体用户和交叉用户,以及用户对应的用户属性,并通过数据处理模块获取各用户属性的属性值在整体用户和交叉用户中的分布情况,对多个业务的用户整体进行分析,最终通过比较执行模块可以整体进行业务调整或者业务推送,业务调整和推送的精准度更高。
实施例四
参阅图6,所述装置还包括时间设置模块601,所述时间设置模块601用于设置所述历史数据的历史时间段,具体的,在本实施例中,所述时间设置模块601设置的历史时间段以天、月或年为单位。相应的,所述数据采集模块501具体用于获取所述历史时间段内的历史数据。
作为本发明实施例的可选方案,所述装置还包括定时模块602,使得所述数据采集模块501能够定时获取所述多个业务的历史数据,所述定时模块602用于设置所述多个业务的历史数据的采集时间,当达到设置的采集时间时,数据采集模块501获取所述多个业务的历史数据。
可选的,所述定时模块602可以针对不同的业务设置不同的获取时间,比如一些业务在一天的某个时间点后将不会产生用户访问或者产生的用户访问量很低,此时可以针对不同的业务的用户访问时间分布,对应地设置历史数据的获取时间。
作为本发明实施例的可选方案,所述装置还包括业务设置模块603,所述业务设置模块603用于设置需要进行数据处理的业务。比如公司同时开展影视、购物商城、体育、智能电视、智能手机等多项业务,可以通过业务设置模块603设定要进行数据处理的业务种类,比如选定影视、购物商城、体育三项业务进行数据分析处理。可选的,所述业务设置模块603最终设置的进行数据处理的业务之间存在关联。
作为本发明实施例的可选方案,参阅图7所示的结构框图,所述用户信息获取模块503包括用户ID获取单元5031、映射表生成单元5032、整体用户获取单元5033和交叉用户获取单元5034,其中:
所述用户ID获取单元5031用于获取所述多个业务中每项业务中的用户ID;
所述映射表生成单元5032用于生成用户ID与对应业务的映射表;
在本发明实施例中,所述映射表生成单元5032生成的映射表中,每个用户ID与选定的进行数据处理的业务之间可形成如下表所示的映射关系:
字段描述 字段名称 字段类型 字段值
用户ID user_id string
智能手机业务 is_smartphone int 1
智能电视业务 is_smartTV int 1
商城业务 is_mall int 0
影视业务 is_tv int 1
体育业务 is_sport int 0
当表中业务的字段值为0时,表示用户ID与该业务无对应关系,当表中业务的字段值为1时,表示用户ID与该业务存在对应关系,一个用户ID可以对应多个业务。
所述整体用户获取单元5033用于根据所述映射表获得所述多个业务的整体用户;
所述交叉用户获取单元5034用于根据所述映射表获取对应多个业务的用户ID,获得所述多个业务的交叉用户。
作为本发明实施例的可选方案,所述数据处理模块504还用于根据每个属性值对应的用户在整体用户中的占比,以及所述每个属性值对应的用户在交叉用户中的占比生成属性分布映射表;
相应的,参阅图8所示的结构框图,所述比较执行模块505包括属性获取单元5051、数据获取单元5052、比较单元5053和执行单元5054,其中:
所述属性获取单元5051用于获取选定的用户属性;
作为本发明实施例的可选方案,所述属性获取单元5051获取的用户属性可以包括多个子用户属性,相应的,每个子用户属性包含多个属性值。相应的,可以获取所述多个子用户属性在整体用户和交叉用户中的占比。可选的,所述属性获取单元5051获取的用户属性可以包括多个层级的子用户属性,比如用户属性购买偏好可以包括商城付费、会员付费两个子用户属性,而商城付费和会员付费还可以继续包括更低层级的子用户属性。
所述数据获取单元5052用于遍历所述属性分布映射表,获取所述选定的用户属性的属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
所述比较单元5053用于比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
所述执行单元5054用于根据比较结果调整业务内容或推送业务消息。
作为本发明实施例的可选方案,所述用户信息获取模块503获取的用户属性包括共有属性和私有属性,其中:
当所述用户属性为共有属性时,比较执行模块505对所述共有属性对应的业务进行业务内容调整或推送业务消息;
当所述用户属性为私有属性时,比较执行模块505对所述私有属性对应的业务进行业务内容调整或推送业务消息。
作为本发明实施例的可选方案,在数据采集模块501获取多个业务的历史数据之后,所述数据采集模块501还用于对历史数据进行筛选,删除历史数据中的无效数据。
本发明实施例中所述的各个模块的功能和效果以及未在本实施例中详尽描述的技术细节,可详细参阅前述实施例中相关技术内容,在此不再赘述。
根据本发明实施例提供的多业务的数据处理装置,通过数据采集模块、用户提取模块和用户信息获取模块提取多个业务的整体用户和交叉用户,以及用户对应的用户属性,并通过数据处理模块获取各用户属性的属性值在整体用户和交叉用户中的分布情况,对多个业务的用户整体进行分析,最终通过比较执行模块可以整体进行业务调整或者业务推送,业务调整和推送的精准度更高,此外,通过时间设置模块设置所述历史数据的历史时间段可以获取任意时间段的历史数据,从而可获得不同的分析结果;通过定时模块设定时间点,可以根据系统资源灵活调整历史数据获取和分析的时间;以及通过业务设置模块设置需要进行数据处理的业务,任意调整进行数据分析处理的业务个数和类型,以满足多种数据分析处理需求。
实施例五
本发明实施例基于上述方法实施例中所提供的多业务的数据处理方法,进一步给出实现上述方法实施例中各步骤及方法的电子设备实施例的硬件结构示意图,如图9所示,该电子设备包括:
一个或多个处理器901以及存储器902,图9中以一个处理器901为例。
执行多业务的数据处理方法的电子设备还可以包括:输入装置903和输出装置904。
处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
存储器902作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的多业务的数据处理方法对应的程序指令/模块。处理器901通过运行存储在存储器902中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中所述的多业务的数据处理方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储域名过滤处理过程中所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至执行域名过滤处理的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置903可获取用户在电子设备上的操作信息。输出装置904可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器902中,当被所述一个或者多个处理器901执行时,执行上述任意方法实施例中的多业务的数据处理方法。
上述产品可执行本申请方法实施例中所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请方法实施例中所提供的方法。
根据本发明实施例提供的电子设备,通过提取多个业务的整体用户和交叉用户,以及用户对应的用户属性,获取各用户属性的属性值在整体用户和交叉用户中的分布情况,可以对多个业务的用户整体进行分析,从而整体进行业务调整或者业务推送,业务调整和推送的精准度更高。
实施例六
本发明实施例提供一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有程序指令,当电子设备执行所述程序指令时,用于执行上述方法实施例中所述的多业务的数据处理方法和步骤,当执行所述方法和步骤时,具有上述方法实施例的技术效果。
需要说明的是,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或智能终端设备或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明所提供的上述实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
以上仅为本发明的实施例,但并不限制本发明的专利范围,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本发明说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本发明专利保护范围之内。

Claims (13)

1.一种多业务的数据处理方法,应用于电子设备,其特征在于,包括:
获取多个业务的历史数据;
根据所述历史数据得到所述多个业务的整体用户和交叉用户,所述整体用户为合并相同用户后的用户集合,所述交叉用户为所述多个业务中至少两个业务共有的用户集合;
获取所述整体用户和交叉用户对应的用户信息,所述用户信息包括至少一个用户属性,其中每个用户属性对应多个属性值;
获取每个属性值对应的用户在整体用户中的占比,以及获取所述每个属性值对应的用户在交叉用户中的占比;
比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比,根据比较结果调整业务内容或推送业务消息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:设置所述历史数据的历史时间段,所述获取多个业务的历史数据为获取所述历史时间段内的历史数据。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括定时获取所述多个业务的历史数据,包括:设置所述多个业务的历史数据的获取时间,当达到设置的获取时间时,获取所述多个业务的历史数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述历史数据得到所述多个业务的整体用户和交叉用户包括:
获取所述多个业务中每项业务中的用户ID;
生成用户ID与对应业务的映射表;
获得所述多个业务的整体用户;
获取对应多个业务的用户ID,以获得所述多个业务的交叉用户。
5.根据权利要求1所述的方法,其特征在于,在获取每个属性值对应的用户在整体用户中的占比,以及获取所述每个属性值对应的用户在交叉用户中的占比之后,所述方法还包括:
根据每个属性值对应的用户在整体用户中的占比,以及所述每个属性值对应的用户在交叉用户中的占比生成属性分布映射表;
相应的,所述比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比,根据比较结果调整业务内容或推送业务消息包括:
获取选定的用户属性;
遍历所述属性分布映射表,获取所述选定的用户属性的属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
根据比较结果调整业务内容或推送业务消息。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述用户属性包括共有属性和私有属性,其中:
当所述用户属性为共有属性时,对所述共有属性对应的业务进行业务内容调整或推送业务消息;
当所述用户属性为私有属性时,对所述私有属性对应的业务进行业务内容调整或推送业务消息。
7.一种多业务的数据处理装置,其特征在于,包括:
数据采集模块,用于获取多个业务的历史数据;
用户提取模块,用于根据所述历史数据得到所述多个业务的整体用户和交叉用户,所述整体用户为合并相同用户后的用户集合,所述交叉用户为所述多个业务中至少两个业务共有的用户集合;
用户信息获取模块,用于获取所述整体用户和交叉用户对应的用户信息,所述用户信息包括至少一个用户属性,其中每个用户属性对应多个属性值;
数据处理模块,用于获取每个属性值对应的用户在整体用户中的占比,以及获取所述每个属性值对应的用户在交叉用户中的占比;
比较执行模块,用于比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比,根据比较结果调整业务内容或推送业务消息。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括时间设置模块,用于设置所述历史数据的历史时间段,相应的,所述数据采集模块具体用于获取所述历史时间段内的历史数据。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括定时模块,使得数据采集模块定时获取所述多个业务的历史数据,所述定时模块用于设置所述多个业务的历史数据的采集时间,当达到设置的采集时间时,获取所述多个业务的历史数据。
10.根据权利要求7所述的装置,其特征在于,所述用户信息获取模块包括:
用户ID获取单元,用于获取所述多个业务中每项业务中的用户ID;
映射表生成单元,用于生成用户ID与对应业务的映射表;
整体用户获取单元,用于根据所述映射表获得所述多个业务的整体用户;
交叉用户获取单元,用于根据所述映射表获取对应多个业务的用户ID,获得所述多个业务的交叉用户。
11.根据权利要求7所述的装置,其特征在于,所述数据处理模块还用于根据每个属性值对应的用户在整体用户中的占比,以及所述每个属性值对应的用户在交叉用户中的占比生成属性分布映射表;
相应的,所述比较执行模块包括:
属性获取单元,用于获取选定的用户属性;
数据获取单元,用于遍历所述属性分布映射表,获取所述选定的用户属性的属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
比较单元,用于比较所述每个属性值对应的用户在整体用户中的占比和在交叉用户中的占比;
执行单元,用于根据比较结果调整业务内容或推送业务消息。
12.根据权利要求7-11任一项所述的装置,其特征在于,所述用户信息获取模块获取的用户属性包括共有属性和私有属性,其中:
当所述用户属性为共有属性时,比较执行模块对所述共有属性对应的业务进行业务内容调整或推送业务消息;
当所述用户属性为私有属性时,比较执行模块对所述私有属性对应的业务进行业务内容调整或推送业务消息。
13.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6任一项所述的多业务的数据处理方法。
CN201611121871.4A 2016-12-08 2016-12-08 一种多业务的数据处理方法、装置及电子设备 Pending CN106682936A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611121871.4A CN106682936A (zh) 2016-12-08 2016-12-08 一种多业务的数据处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611121871.4A CN106682936A (zh) 2016-12-08 2016-12-08 一种多业务的数据处理方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN106682936A true CN106682936A (zh) 2017-05-17

Family

ID=58869520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611121871.4A Pending CN106682936A (zh) 2016-12-08 2016-12-08 一种多业务的数据处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN106682936A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101595A (zh) * 2018-07-27 2018-12-28 郑州云海信息技术有限公司 一种信息查询方法、装置、设备及计算机可读存储介质
CN109951512A (zh) * 2019-01-09 2019-06-28 平安科技(深圳)有限公司 用户偏好确定方法、系统、电子设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101595A (zh) * 2018-07-27 2018-12-28 郑州云海信息技术有限公司 一种信息查询方法、装置、设备及计算机可读存储介质
CN109951512A (zh) * 2019-01-09 2019-06-28 平安科技(深圳)有限公司 用户偏好确定方法、系统、电子设备及存储介质
CN109951512B (zh) * 2019-01-09 2022-01-28 平安科技(深圳)有限公司 用户偏好确定方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
Faridani et al. Opinion space: a scalable tool for browsing online comments
CN107330445A (zh) 用户属性的预测方法和装置
CN103473238B (zh) 配送地址定位系统及方法
CN107291718A (zh) 页面资源投放方法及装置
CN107944481A (zh) 用于生成信息的方法和装置
CN106227786A (zh) 用于推送信息的方法和装置
CN106294462B (zh) 一种获取推荐视频的方法和系统
CN104050187A (zh) 搜索结果展示方法及系统
CN107679217A (zh) 基于数据挖掘的关联内容提取方法和装置
CN109815389A (zh) 应用规则引擎的节点匹配方法、装置以及计算机设备
CN104346698B (zh) 基于云计算和数据挖掘的餐饮会员大数据分析和考核系统
CN106708883A (zh) 推荐方法及装置
CN103365842B (zh) 一种页面浏览推荐方法及装置
CN105654307A (zh) 基于用户反馈的商品推荐方法和系统
CN105871940A (zh) 信息推荐方法和系统
CN109903105A (zh) 一种完善目标商品属性的方法和装置
CN108009715A (zh) 一种自动分析指标波动根因的方法
CN106327266A (zh) 数据挖掘方法及装置
CN106708978A (zh) 一种基于二分图的服务推荐方法及装置
CN102982112A (zh) 排行榜生成方法、日志生成方法和服务器
CN106682936A (zh) 一种多业务的数据处理方法、装置及电子设备
CN109086289A (zh) 一种媒体数据处理方法、客户端、介质和设备
CN115130811A (zh) 电力用户画像的建立方法、装置及电子设备
CN107831963A (zh) 金融产品显示方法、装置、设备及存储介质
CN106022860A (zh) 一种匹配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170517

WD01 Invention patent application deemed withdrawn after publication