CN107093092B - 数据分析方法和装置 - Google Patents
数据分析方法和装置 Download PDFInfo
- Publication number
- CN107093092B CN107093092B CN201611013042.4A CN201611013042A CN107093092B CN 107093092 B CN107093092 B CN 107093092B CN 201611013042 A CN201611013042 A CN 201611013042A CN 107093092 B CN107093092 B CN 107093092B
- Authority
- CN
- China
- Prior art keywords
- user
- consumption
- users
- observation
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种数据分析方法和装置,该方法包括:获取不同观察时刻时多个用户中每个用户的消费标签集合,其中,消费标签集合中的每个标签由消费属性和属性值构成;分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性。针对任一用户来说,通过对多个不同观察时刻其对应的用户消费标签集合的分析,能够跟踪发现影响用户消费行为变化的消费属性,基于此,对大量的用户进行上述分析过程,可以准确地发现一段时间内影响大量用户消费行为变化的原因,基于该原因的发现,在实际应用中可以有利于提高服务平台向服务提供方推送服务策略的针对性、准确性。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种数据分析方法和装置。
背景技术
随着互联网的发展,常常需要对用户的行为信息进行分析,以便预测用户未来的行为,进而基于预测结果确定互联网信息的分发策略或处理策略。
目前,通常通过建立模型的方式进行用户行为的分析,具体地,首先从历史数据中采集样本,基于采集的样本建立预测模型,然后根据预测模型中的预测系数,比如概率系数、关系权重系数等,来预测用户潜在的行为。
发明内容
从时间维度考虑,当通过建立模型来分析用户的消费行为时,一旦模型建立完成以后,除非重新选择样本并重新建立模型,否则模型中的预测系数是固定不变的,因此不能够适应变化的消费习惯、消费趋势等最新的消费行为信息,导致确定用户潜在消费行为的准确率降低,或者说导致不能准确分析出影响用户消费行为变化的原因。
发明人通过对大量用户的消费数据的跟踪、研究发现:以任一个用户或多个用户来说,其在不同时间阶段所体现出的消费行为可能是不同的。该用户在不同时间的消费行为的变化,可能主要受几个消费属性的影响,比如配送时间、起送价格等等。
因此,如果能够准确分析获得大量用户在不同时间阶段的消费行为的变化原因,将能够基于分析获得的变化原因,进行针对性的营销策略输出,比如,在电子商务领域,服务平台通过对短时间内影响用户消费行为变化的消费属性的分析,能够基于该消费属性向各商户推送针对性的营销建议,以满足大量用户当前的消费需求。
有鉴于此,本发明实施例提供一种数据分析方法和装置,用以准确分析用户消费行为变化的原因,从而有利于提高服务策略推送的针对性、准确性。
本发明实施例提供一种数据分析方法,包括:
获取不同观察时刻时多个用户中每个用户的消费标签集合,所述消费标签集合中的每个标签由消费属性和属性值构成;
分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性。
可选地,所述分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性,包括:
根据所述多个用户中每个用户的消费标签集合和至少一组观察指标区间,确定每组观察指标区间在不同观察时刻对应的用户集合,其中,每组观察指标区间由至少一种观察指标及对应的一个取值区间构成;
对每组观察指标区间在不同观察时刻对应的用户集合进行用户流转情况和消费标签差异性分析,确定影响用户消费行为变化的消费属性。
可选地,所述分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性之前,还包括:
响应于对目标用户类型的选择操作,确定与所述目标用户类型对应的用户筛选条件;
根据不同观察时刻时获取的多个用户中每个用户的消费标签集合和所述用户筛选条件,确定在对应观察时刻,满足所述用户筛选条件的用户集合。
从而可选地,所述分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性,包括:
根据观察时刻Ti时对应的用户集合Y和观察时刻Tj时对应的用户集合Z,确定用户集合Y中的转出用户子集合和转入用户子集合,其中,j大于i,所述转出用户子集合中的用户不包含于所述用户集合Z中,所述转入用户子集合中的用户包含于所述用户集合Z中;
对所述转出用户子集合和所述转入用户子集合进行消费标签差异性分析,获得影响所述用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性。
本发明实施例提供一种数据分析装置,包括:
第一获取模块,用于获取不同观察时刻时多个用户中每个用户的消费标签集合,所述消费标签集合中的每个标签由消费属性和属性值构成;
分析模块,用于分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性。
可选地,所述分析模块包括:
第一确定子模块,用于根据所述多个用户中每个用户的消费标签集合和至少一组观察指标区间,确定每组观察指标区间在不同观察时刻对应的用户集合,其中,每组观察指标区间由至少一种观察指标及对应的一个取值区间构成;
第一分析子模块,用于对每组观察指标区间在不同观察时刻对应的用户集合进行用户流转情况和消费标签差异性分析,确定影响用户消费行为变化的消费属性。
可选地,所述装置还包括:
第二确定模块,用于响应于对目标用户类型的选择操作,确定与所述目标用户类型对应的用户筛选条件;
第三确定模块,用于根据不同观察时刻时获取的多个用户中每个用户的消费标签集合和所述用户筛选条件,确定在对应观察时刻,满足所述用户筛选条件的用户集合。
可选地,所述分析模块包括:
第二确定子模块,用于根据观察时刻Ti时对应的用户集合Y和观察时刻Tj时对应的用户集合Z,确定用户集合Y中的转出用户子集合和转入用户子集合,其中,j大于i,所述转出用户子集合中的用户不包含于所述用户集合Z中,所述转入用户子集合中的用户包含于所述用户集合Z中;
第二分析子模块,用于对所述转出用户子集合和所述转入用户子集合进行消费标签差异性分析,获得影响所述用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性。
本发明实施例提供的数据分析方法和装置,在获取每个预设的观察时刻时的多个用户中每个用户的消费标签集合,通过对不同观察时刻时的各用户的消费标签集合中的消费标签进行分析,来确定影响用户消费行为变化的消费属性。由于每个观察时刻对应的每个用户的消费标签集合中的消费标签表征了对应用户在该观察时刻的消费行为特征,针对任一用户来说,不同观察时刻,其对应的消费标签集合所反映的消费特征可能不同,从而通过对多个不同观察时刻用户消费标签集合的分析,能够跟踪发现影响用户消费行为变化的消费属性,基于此,对大量的用户进行上述分析过程,可以准确地发现一段时间内影响大量用户消费行为变化的原因,基于该原因的发现,在实际应用中可以有利于提高服务平台向服务提供方推送服务策略的针对性、准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的数据分析方法实施例一的流程图;
图2为本发明实施例提供的数据分析方法实施例二的流程图;
图3为图2所示实施例中步骤204的一种可选实现方式的流程图;
图4为图2所示实施例对应的一种分析原理示意图;
图5为本发明实施例提供的数据分析方法实施例三的流程图;
图6为本发明实施例提供的数据分析方法实施例四的流程图;
图7为图6所示实施例对应的一种分析原理示意图;
图8为本发明实施例提供的数据分析方法实施例五的流程图;
图9为本发明实施例提供的数据分析装置实施例一的结构示意图;
图10为本发明实施例提供的数据分析装置实施例二的结构示意图;
图11为本发明实施例提供的数据分析装置实施例三的结构示意图;
图12为本发明实施例提供的数据分析装置实施例四的结构示意图;
图13为本发明实施例提供的数据分析装置实施例五的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
图1为本发明实施例提供的数据分析方法实施例一的流程图,本实施例提供的该数据分析方法可以由一数据分析装置来执行,该数据分析装置可以实现为软件,或者实现为软件和硬件的组合,该数据分析装置可以集成设置在服务平台侧的设备中,比如服务器中,以下在不引起歧义的情况下,将集成该数据分析装置的设备称为服务平台。如图1所示,该方法包括如下步骤:
步骤101、获取不同观察时刻时多个用户中每个用户的消费标签集合,其中,消费标签集合中的每个标签由消费属性和属性值构成。
步骤102、分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性。
本发明实施例中,通过对多个用户在不同观察时刻时的消费标签集合进行分析,以获得影响多个用户在一段时间内的消费行为变化的原因。
为实现上述目的,概括来说:首先,服务平台需要确定观察对象,即需要确定获取哪些用户的消费标签集合,进而,获取这些用户在不同观察时刻时对应的消费标签集合,之后,分析各用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性。
具体地,可以根据实际的应用需求来确定需要获取哪些用户的消费标签集合。举例来说,比如当需要针对某商圈进行分析时,可以获得在该商圈内消费的某些用户;再比如针对某个特定的人群进行分析时,可以获得符合该人群特征的多个用户。
值得说明的是,当确定需要观察的多个用户时,可以根据服务平台中存储的大量用户的消费数据,通过对这些消费数据进行分析来获取作为观察对象的多个用户。比如对于上述举例的某商圈,可以根据各用户消费数据中的消费地址,筛选出在该商圈中消费的用户。
进而,根据确定出的多个用户在不同历史时间内的消费数据进行消费属性或者称为消费特征提取、计算,以获得每个用户在不同观察时刻时的消费标签集合。
本实施例中,为了获得影响多个用户在一段时间内的消费行为变化的原因,对一段较长的历史时间进行区间划分,比如以一周为间隔进行划分,从而从某起点开始,每隔一周为一个观察时刻,该观察时刻对应的各用户的消费标签集合由这一周内这些用户的消费数据确定。
其中,每个用户的消费标签集合中的每个标签由消费属性和属性值构成,消费属性的数量一般是多个,用户反映用户的消费特征。比如,消费标签集合中包含表征平均客单价的标签,表征平均配送时长的标签,表征用户的配送地址的标签,表征用户的职业的标签,等等,某个用户对应的各消费属性根据相应观察周期内该用户的消费数据中相应的信息统计获得。
当获得了作为被观察对象的多个用户在不同观察时刻时的消费标签集合之后,基于对每个用户在不同观察时刻对应的消费标签集合的分析,便可以确定影响用户消费行为变化的消费属性。
可选地,对每个用户在不同观察时刻对应的消费标签集合的分析,针对同一用户来说,主要是分析在不同观察时刻其对应的各消费标签集合中各标签的差异情况。当在不同观察时刻时,某用户的消费标签集合中针对某个或某几个标签具有明显的差别,比如反映配送时长的标签由某观察时刻的30分钟变为另一观察时刻的60分钟,认为配送时长是影响该用户消费行为变化的一个消费属性。
当针对各用户进行上述分析之后,可以获得影响每个用户消费行为变化的消费属性,从而可选地,可以确定在相应的历史时间内影响上述多个用户的消费行为变化的消费属性为影响每个用户消费行为变化的消费属性的并集和部分。
上述分析过程仅为一种简单的举例,下面会结合不同的具体实施例详细说明其他的几种可选的实现方式。
本实施例中,由于每个观察时刻对应的每个用户的消费标签集合中的消费标签表征了对应用户在该观察时刻的消费行为特征,针对任一用户来说,不同观察时刻,其对应的消费标签集合所反映的消费特征可能不同,从而通过对多个不同观察时刻用户消费标签集合的分析,能够跟踪发现影响用户消费行为变化的消费属性,基于此,对大量的用户进行上述分析过程,可以准确地发现一段时间内影响大量用户消费行为变化的原因,基于该原因的发现,在实际应用中可以有利于提高服务平台向服务提供方推送服务策略的针对性、准确性。
下面以图2所示的一种实际应用场景,对该应用场景下,如何确定多个用户的消费行为变化的原因进行说明。该场景中,固定观察对象,即在不同观察时刻对应的全部用户都是相同的用户。
图2为本发明实施例提供的数据分析方法实施例二的流程图,如图2所示,该方法包括如下步骤:
步骤201、根据用户筛选条件,获取满足用户筛选条件的多个用户。
可选地,本实施例中,用户筛选条件比如可以是针对地理区域的筛选条件,比如还可以是针对地理区域、注册时间的筛选条件,不以此为限。
实际应用中,举例来说,用户筛选条件比如是:筛选出2016年9月1日,在北京市注册的所有新用户。
步骤202、获取不同观察时刻时多个用户中每个用户的消费标签集合。
实际应用中,假设当前时刻为2016年11月1日,为了预测出对当前时刻用户的消费行为具有重要影响的消费属性,服务平台可以对当前时刻之前一定历史时间内的大量用户的消费数据进行分析,以获取这些具有重要影响的消费属性。
假设不同观察时刻对应的历史时间段为2016年9月10日至2016年10月30日,在该历史时间段内,可以以10天为周期,每隔10天为一个观察时刻。
从而,服务平台以筛选出的多个用户的用户标识为索引,跟踪筛选出的多个用户在2016年9月1日至2016年10月30日的消费数据,其中,用户标识比如为用户的联系电话、用户名等。在第一个观察时刻即2016年9月10号,根据各消费数据的下单时间,从上述获得的2016年9月1日至2016年10月30日的消费数据中选择出2016年9月1日至2016年9月10日的消费数据,对这些消费数据进行消费属性提取,以得到第一观察时刻时各个用户的消费标签集合。在第二个观察时刻即2016年9月20号,根据各消费数据的下单时间,从上述获得的2016年9月1日至2016年10月30日的消费数据中选择出2016年9月10日至2016年9月20日的消费数据,对这些消费数据进行消费属性提取,以得到第二观察时刻时各个用户的消费标签集合。以此类推,直到获得最后一个观察时刻时各个用户的消费标签集合。
其中,从消费数据中获取消费标签集合的方式可以参照图1所示实施例中的介绍,在此不赘述。
步骤203、根据多个用户中每个用户的消费标签集合和至少一组观察指标区间,确定每组观察指标区间在不同观察时刻对应的用户集合。
步骤204、对每组观察指标区间在不同观察时刻对应的用户集合进行用户流转情况和消费标签差异性分析,确定影响用户消费行为变化的消费属性。
本实施例中,为了提高分析效率,对影响用户消费行为变化的消费属性的分析是以用户集合为分析对象实现的,每个用户集合对应于一组观察指标区间,即将满足一组观察指标区间的用户划分为一个用户集合。
在本实施例中,当作为观察对象的多个用户为固定的时,可以设置多组观察指标区间,通过分析不同观察时刻各组观察指标区间对应的用户集合的流转变化,以最终获得影响大量用户消费行为变化的消费属性。
因此,步骤203相应地是根据不同观察时刻时每个用户的用户消费标签集合,确定在对应观察时刻,多组观察指标区间分别对应的用户集合。
可以理解的是,在不同观察时刻,各组观察指标区间的设置是固定不变的,但是在不同观察时刻,满足同一组观察指标区间的用户集合很可能是会改变的。
其中,每组观察指标区间由至少一种观察指标及对应的一个取值区间构成。实际应用中,各组观察指标区间中包含的观察指标都是相同的,区别仅在于不同组观察指标区域中各观察指标的取值区间不同,而且,实际中,可以根据实际需求而设定观察指标的个数以及每种观察指标的取值区间个数。
一般来说,每组观察指标区间一般对应于一类用户,即满足一组观察指标区间的用户集合一般被定义为具有某种价值的用户群体。因此,实际应用中,可以从用户对服务提供方的价值的角度,设置各观察指标及相应的取值区间,从而可以将用户划分为不同价值的用户群体。
举例来说,实际应用中,观察指标比如为:周下单数、平均客单价、消费间隔天数,每种观察指标设置三个取值区间,从而总共具有27种观察指标区间。
在任一观察时刻,根据该观察时刻对应的各用户的消费标签集合和这27种观察指标区间,确定每个观察指标区间对应的用户集合。
其中,可以理解的是,消费标签集合中可以直接包含有作为观察指标的消费属性,从而根据各用户的消费标签集合中相应的消费属性的属性值即可确定各用户所归属的用户集合。
可选地,如果设置的消费标签集合中不含有与观察指标对应的消费属性,则可以通过对相应观察周期内各用户的消费数据的统计分析,获得各用户对应的观察指标的取值,以确定各用户所归属的用户集合。
在各观察时刻,获得每组观察指标区间对应的用户集合之后,对于两个相邻观察时刻,通过对前一观察时刻的每组观察指标区间对应的用户集合中用户在下一观察时刻时的流转情况进行分析,并且对流转至的不同用户集合中的用户进行消费标签差异性分析,以确定从前一观察时刻到下一观察时刻影响用户消费行为变化的消费属性。
对于每对相邻的观察时刻,都进行上述分析,最终基于每对相邻时刻的分析结果,确定在一定历史时间段内影响用户消费行为变化的消费属性。
下面结合图3所示实施例具体介绍相邻两个观察时刻时的用户流转情况和消费标签差异化分析过程。
图3为图2所示实施例中步骤204的一种可选实现方式的流程图,如图3所示,可以包括如下步骤:
步骤301、对观察时刻Ti时的任一组观察指标区间Sk对应的用户集合Xk,确定在观察时刻Tj时,在各组观察指标区间上,所述用户集合Xk对应的各流转用户子集合。
其中,j大于i,i、j的取值受限于观察时刻的个数,k的取值受限于观察指标区间的个数。
为了直观理解本实施例中的分析过程,结合图4对该分析过程进行说明,图4为图2所示实施例对应的一种分析原理示意图,在图4中,假设观察时刻Ti时的任一组观察指标区间S1对应的用户集合为X1,在观察时刻Tj时,由于用户的消费行为发生改变,可能会导致用户集合X1中的用户部分流转至其他观察指标区间对应的用户集合中的情况。假设在观察时刻Tj时,用户集合X1中的部分用户仍对应于观察指标区间S1,假设该部分用户组成第一流转用户子集合Xj1,用户集合X1中的另一部分用户流转至观察指标区间S2对应的用户集合中,假设该部分用户组成第二流转用户子集合Xj2。
步骤302、对用户集合Xk对应的各流转用户子集合进行消费标签差异性分析,获得影响用户集合Xk中用户在观察时刻Tj时消费行为变化的消费属性。
可选地,上述消费标签差异性分析可以具体实现为:
针对用户集合Xk对应的每个流转用户子集合,根据每个流转用户子集合中各用户的消费标签集合,统计每个流转用户子集合对应的每种消费属性对应的属性度量值;
确定影响用户集合Xk中用户在观察时刻Tj时消费行为变化的消费属性为:属性度量值在各流转用户子集合间的差异化程度大于预设阈值的消费属性。
在图4中,即为对第一流转用户子集合Xj1和第二流转用户子集合Xj2进行消费标签差异性分析。假设上述属性度量值为平均值度量方式,则在图4中,即为统计第一流转用户子集合Xj1对应的各消费属性的平均属性值,统计第二流转用户子集合Xj2对应的各消费属性的平均属性值。以平均配送时长为例,比如第一流转用户子集合Xj1对应的平均配送时长为30分钟,第二流转用户子集合Xj2对应的平均配送时长为60分钟。假设服务平台预先设置的配送时长差值阈值为15分钟,则由于第一流转用户子集合Xj1对应的平均配送时长与第二流转用户子集合Xj2对应的平均配送时长之间的差值大于15分钟,从而确定配送时长为影响用户集合X1中用户在观察时刻Tj时消费行为变化的消费属性之一。
值得说明的是,上述平均值的属性度量方式比较适用于诸如平均配送时长、平均客单价等消费属性,当用户的消费标签集合中包含比如配送地址这种不能直接以数值度量的消费属性时,标签差异性的分析可以实现为消费属性发生改变的次数。
具体来说,假设第一流转用户子集合Xj1中的用户的配送地址并没有发生改变,第二流转用户子集合Xj2中有一定数量比如10个用户的配送地址发送改变,其中,配送地址发送改变是相对于观察时刻Ti时各用户的配送地址来说的。此时,观察时刻Tj时,第一流转用户子集合Xj1中发生用户配送地址改变的用户数量为0,第二流转用户子集合Xj2中发生用户配送地址改变的用户数量为10,两者之差大于预设阈值比如5,则确定配送地址为影响用户集合X1中用户在观察时刻Tj时消费行为变化的消费属性之一。
步骤303、根据观察时刻Ti时全部用户集合对应的消费属性,确定观察时刻Tj时影响用户消费行为变化的消费属性。
具体地,当针对观察时刻Ti时的各个用户集合都进行了前述标签差异性分析,确定了与每个用户集合对应的影响消费行为变化的消费属性之后,根据各用户集合对应的消费属性,便可确定观察时刻Tj时影响用户消费行为变化的消费属性,即确定从观察时刻Ti到观察时刻Tj影响用户消费行为变化的消费属性。
可选地,可以确定观察时刻Tj时影响用户消费行为变化的消费属性为:观察时刻Ti时全部用户集合对应的消费属性的并集,或者为:观察时刻Ti时全部用户集合对应的消费属性中的部分消费属性,其中,该部分消费属性根据观察时刻Ti时全部用户集合对应的消费属性的出现次数确定。
举例来说,假设有三个用户集合,观察时刻Ti时,确定出的与用户集合X1对应的消费属性为a、b,确定出的与用户集合X2对应的消费属性为a、c,确定出的与用户集合X3对应的消费属性为a,那么确定观察时刻Tj时影响用户消费行为变化的消费属性为上述三个确定结果的并集—a、b和c,或者为a,此时假设确定出现次数超过两次的消费属性作为观察时刻Tj时影响用户消费行为变化的消费属性。
值得说明的是,实际应用中,往往观察的观察时刻多于两个,当观察时刻大于两个时,按照时间角度横向来说,整个观察过程最终确定出的影响用户消费行为变化的消费属性可以是根据前述分析确定过程确定出的最后一个观察时刻对应的消费属性,也可以是最后几个观察时刻对应的消费属性的并集,也可以是各观察时刻对应的消费属性的交集或并集。
上述实施例中,针对满足用户筛选条件的固定的多个用户,基于预设的观察指标区间,在不同观察时刻对该多个用户进行用户集合的划分,进而通过对不同观察时刻时每个用户集合的流转情况进行跟踪,对每个用户集合流转至的各流转用户子集合进行标签差异性分析,以分析影响每个用户集合中用户在下一观察时刻消费行为变化的消费属性,进而统计获得从前一观察时刻到下一观察时刻影响全部用户的消费行为变化的消费属性,进而统计获得一定较长历史时间内影响用户消费行为改变的消费属性。通过上述过程,能够准确挖掘出影响用户在距离当前时刻较近的一定历史时间段内的消费行为变化的原因,从而为当前时刻对用户进行针对性的营销提供依据。
从而,基于上述分析确定结果,结合图5所示实施例,服务平台可以实现针对性的服务策略推送。
图5为本发明实施例提供的数据分析方法实施例三的流程图,如图5所示,在图2所示实施例基础上,步骤204之后,还可以包括如下步骤:
步骤501、确定与用户筛选条件对应的服务提供方标识。
一般来说,用户筛选条件中会包含有地理区域信息,比如某城市、某商圈等。因此,当用户筛选条件中包括地理区域信息时,确定与用户筛选条件对应的服务提供方标识即为确定与地理区域信息对应的服务提供方标识。
具体地,服务平台中记录有各个服务提供方的服务提供方标识以及对应的注册地址、所属商圈等信息,基于该记录信息,服务平台可以确定出与作为用户筛选条件的地理区域信息对应的服务提供方标识。其中,服务提供方标识可以是服务提供方在服务平台中注册的账号。
步骤502、根据确定出的消费属性,向服务提供方标识对应的服务提供方推送相应的服务策略。
本实施例中,上述服务策略可以是提示信息,比如提示服务提供方应该在确定出的影响用户消费行为变化的消费属性方面做出改善;还可以是根据确定出的消费属性制定的营销方案,比如让服务提供方采用某种优惠活动,从而实现基于确定出的消费属性进行针对性服务策略推送的目的。
下面以图6所示的另一种实际应用场景,对该应用场景下,如何确定多个用户的消费行为变化的原因进行说明。该场景中,固定观察对象的筛选条件,即不同观察时刻对应的用户可能是不同的,但是不同观察时刻对应的用户都是满足同一筛选条件的用户。
图6为本发明实施例提供的数据分析方法实施例四的流程图,如图6所示,包括如下步骤:
步骤601、响应于对目标用户类型的选择操作,确定与目标用户类型对应的用户筛选条件。
本实施例中,可以针对某类型的用户进行分析,即分析该类型的用户在一定历史时间内消费行为变化的原因,亦即是哪些消费属性影响了该类型的用户在一定历史时间内的消费行为变化。
实际应用中,该目标用户类型比如可以是学生、白领等类型。服务平台中可以预先存储有多种用户类型以及每种用户类型与用户筛选条件的对应关系,从而,当服务平台接收到某个服务提供方的请求或者基于一定的服务机制自主触发对某个目标用户类型的分析时,基于该对应关系获得相应的用户筛选条件。
可以理解的是,与某个用户类型对应的用户筛选条件,是对该用户类型的具体量化,即通过一些消费属性来度量某个用户类型的特征,以白领用户类型为例,比如用于筛选白领的用户的筛选条件包括消费能力、配送地址、职业、年龄等等。当然,实际应用中,为了使分析更有针对性,一般也可以限制用户筛选的地理区域,比如仅在某个城市、某城市中的某个或某几个商圈的用户中进行筛选。
每种用户类型对应的用户筛选条件可以在服务平台中预先设置后,相应的,用于筛选某用户类型的用户的消费属性的属性值的设置,可以根据对大量样本消费数据的统计结果确定。
步骤602、获取不同观察时刻时多个用户中每个用户的消费标签集合。
本实施例中,不同观察时刻对应的多个用户可以是相同的,也可以是不同的。具体的获得各用户的消费标签集合的方式参考前述实施例,在此不赘述。
步骤603、根据不同观察时刻时获取的多个用户中每个用户的消费标签集合和用户筛选条件,确定在对应观察时刻,满足用户筛选条件的用户集合。
本实施例中,由于用户筛选条件固定,随着用户消费行为的改变,在某个观察时刻满足用户筛选条件的用户,在另一观察时刻可能不满足该用户筛选条件,因此,每个观察时刻对应的满足该用户筛选条件的用户集合很可能是不完全相同的。
可以理解的是,用户的消费标签集合中包含有与用户筛选条件相对应的消费属性,比如,用作用户筛选条件的消费属性包含a、b、c,用户的消费标签集合中可能包含a、b、c、d、e、f等更多的消费属性。因此,基于某用户的消费标签集合中对应消费属性的属性值与用户筛选条件中消费属性的属性值区间的关系,可以确定该用户是否属于用户集合中的一个用户。
步骤604、根据观察时刻Ti时对应的用户集合Y和观察时刻Tj时对应的用户集合Z,确定用户集合Y中的转出用户子集合和转入用户子集合。
其中,j大于i,所述转出用户子集合中的用户不包含于所述用户集合Z中,所述转入用户子集合中的用户包含于所述用户集合Z中。
由于用户消费行为的改变,在前一观察时刻Ti对应的用户集合Y中的用户,可能有部分用户流转入在下一观察时刻Tj对应的用户集合Z中,有部分用户没有流转入在下一观察时刻Tj对应的用户集合Z,即不再符合用户筛选条件,转出了符合用户筛选条件的用户集合。因此,通过对前一观察时刻Ti对应的用户集合Y中的用户在下一观察时刻Tj的转入、转出情况进行跟踪,能够确定用户集合Y对应的转入用户子集合Y入、转出用户子集合Y出,如图7所示。
可选地,由于用户消费行为的改变,在下一观察时刻Tj对应的用户集合Z中,除了可能包含由用户集合Y转入的部分用户外,还有可能包含部分在该观察时刻才刚好满足用户筛选条件的用户,假设这部分用户对应的用户子集合为Xj入,即在观察时刻Tj才刚好满足用户筛选条件的转入用户子集合。因此,本实施例中,还可以跟踪确定观察时刻Tj时该转入用户子集合为Xj入,如图7所示。
步骤605、对转出用户子集合和转入用户子集合进行消费标签差异性分析,获得影响用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性。
可选地,上述消费标签差异性分析可以具体实现为:
根据转出用户子集合Y出中各用户的消费标签集合,统计转出用户子集合Y出对应的每种消费属性对应的第一属性度量值;根据转入用户子集合Y入中各用户的消费标签集合,统计转入用户子集合Y入对应的每种消费属性对应的第二属性度量值;
确定影响用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性为:第一属性度量值和对应的第二属性度量值之间的差值大于预设阈值的消费属性。
在图7中,即为对转出用户子集合Y出和转入用户子集合Y入进行消费标签差异性分析。假设上述第一属性度量值和第二属性度量值都可以为平均值度量方式,则在图7中,即为统计转出用户子集合Y出对应的各消费属性的平均属性值,统计转入用户子集合Y入对应的各消费属性的平均属性值。以平均配送时长为例,比如转出用户子集合Y出对应的平均配送时长为30分钟,转入用户子集合Y入对应的平均配送时长为60分钟。假设服务平台预先设置的配送时长差值阈值为15分钟,则由于转出用户子集合Y出对应的平均配送时长与转入用户子集合Y入对应的平均配送时长之间的差值大于15分钟,从而确定配送时长为影响用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性之一。
其他可选的消费属性度量值的确定方式可以参考前述图2-图4所示实施例,在此不赘述。
值得说明的是,可选地,当跟踪确定在观察时刻Tj才刚好满足用户筛选条件的转入用户子集合Xj入的情况下,还可以对转出用户子集合Y出和转入用户子集合Xj入进行标签差异性分析,从而此时,可以确定影响用户在观察时刻Tj时消费行为变化的消费属性为:转出用户子集合Y出和转入用户子集合Y入消费标签差异性分析结果,与转出用户子集合Y出和转入用户子集合Xj入标签差异性分析结果的并集。
值得说明的是,实际应用中,往往观察的观察时刻多于两个,当观察时刻大于两个时,按照时间角度横向来说,整个观察过程最终确定出的影响用户消费行为变化的消费属性可以是根据前述分析确定过程确定出的最后一个观察时刻对应的消费属性,也可以是最后几个观察时刻对应的消费属性的并集,也可以是各观察时刻对应的消费属性的交集或并集。
通过该实施例,针对某类特定的用户,在不同观察时刻确定属于该类用户的用户集合,进而通过对不同观察时刻时的用户集合的流转情况进行跟踪,对用户集合流转入一下观察时刻的用户子集合和流转出的用户子集合进行标签差异性分析,以分析影响前一观察时刻的用户集合中用户在下一观察时刻消费行为变化的消费属性,从而统计获得一定较长历史时间内影响用户消费行为改变的消费属性。通过上述过程,能够准确挖掘出影响特定类的用户在距离当前时刻较近的一定历史时间段内的消费行为变化的原因,从而为当前时刻对用户进行针对性的营销提供依据。
基于上述分析确定结果,结合图8所示实施例,服务平台可以实现针对性的服务策略推送。
图8为本发明实施例提供的数据分析方法实施例五的流程图,如图8所示,在图6所示实施例基础上,步骤605之后,还可以包括如下步骤:
步骤801、确定与目标用户类型对应的服务提供方标识。
可选地,当服务平台进行前述分析过程是基于某个或某几个服务提供方的请求而触发时,此时,与目标用户类型对应的服务提供方标识即为触发请求的服务提供方的标识,该标识比如为服务提供方在服务平台的注册账号。
可选地,当服务平台进行前述分析过程是基于服务平台的服务机制而自主触发时,此时,与目标用户类型对应的服务提供方可以是服务平台基于本地预先建立的用户类型与服务提供方间的对应关系确定的,或者是,基于对各服务提供方对应的消费者的消费属性确定的。
步骤802、根据确定出的消费属性,向服务提供方标识对应的服务提供方推送相应的服务策略。
本实施例中,上述服务策略可以是提示信息,比如提示服务提供方应该在确定出的影响用户消费行为变化的消费属性方面做出改善;还可以是根据确定出的消费属性制定的营销方案,比如让服务提供方采用某种优惠活动,从而实现基于确定出的消费属性进行针对性服务策略推送的目的。
以下将详细描述本发明的一个或多个实施例的数据分析装置。这些数据分析装置可以被实现在服务器的基础架构中,也可以被实现在服务器和客户端的交互系统中。本领域技术人员可以理解,这些数据分析装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。
图9为本发明实施例提供的数据分析装置实施例一的结构示意图,如图9所示,该数据分析装置包括:第一获取模块11、分析模块12。
第一获取模块11,用于获取不同观察时刻时多个用户中每个用户的消费标签集合,所述消费标签集合中的每个标签由消费属性和属性值构成。
分析模块12,用于分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性。
图9所示装置可以执行图1所示实施例的方法,本实施例未详细描述的部分,可参考对图1所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1所示实施例中的描述,在此不再赘述。
图10为本发明实施例提供的数据分析装置实施例二的结构示意图,如图10所示,在图9所示实施例基础上,所述分析模块12包括:第一确定子模块121、第一分析子模块122。
第一确定子模块121,用于根据所述多个用户中每个用户的消费标签集合和至少一组观察指标区间,确定每组观察指标区间在不同观察时刻对应的用户集合,其中,每组观察指标区间由至少一种观察指标及对应的一个取值区间构成。
第一分析子模块122,用于对每组观察指标区间在不同观察时刻对应的用户集合进行用户流转情况和消费标签差异性分析,确定影响用户消费行为变化的消费属性。
可选地,所述数据分析装置还包括:
第二获取模块21,用于根据用户筛选条件,获取满足所述用户筛选条件的所述多个用户。
其中,所述第一确定子模块121具体用于:
根据不同观察时刻时每个用户的用户消费标签集合,确定在对应观察时刻,多组观察指标区间分别对应的用户集合。
可选地,所述第一分析子模块122包括:第一确定单元1221、分析单元1222、第二确定单元1223。
第一确定单元1221,用于对观察时刻Ti时的任一组观察指标区间Sk对应的用户集合Xk,确定在观察时刻Tj时,在各组观察指标区间上,所述用户集合Xk对应的各流转用户子集合,其中,j大于i。
分析单元1222,用于对所述用户集合Xk对应的各流转用户子集合进行消费标签差异性分析,获得影响所述用户集合Xk中用户在观察时刻Tj时消费行为变化的消费属性。
第二确定单元1223,用于根据观察时刻Ti时全部用户集合对应的消费属性,确定观察时刻Tj时影响用户消费行为变化的消费属性。
其中,所述分析单元1222具体用于:
针对所述用户集合Xk对应的每个流转用户子集合,根据每个流转用户子集合中各用户的消费标签集合,统计每个流转用户子集合对应的每种消费属性对应的属性度量值;
确定影响所述用户集合Xk中用户在观察时刻Tj时消费行为变化的消费属性为:属性度量值在所述各流转用户子集合间的差异化程度大于预设阈值的消费属性。
其中,所述第二确定单元1223具体用于:
确定所述观察时刻Tj时影响用户消费行为变化的消费属性为:所述观察时刻Ti时全部用户集合对应的消费属性的并集,或者为:所述观察时刻Ti时全部用户集合对应的消费属性中的部分消费属性,所述部分消费属性根据观察时刻Ti时全部用户集合对应的消费属性的出现次数确定。
图10所示装置可以执行图2-图4所示实施例的方法,本实施例未详细描述的部分,可参考对图2-图4所示实施例的相关说明。该技术方案的执行过程和技术效果参见图2-图4所示实施例中的描述,在此不再赘述。
图11为本发明实施例提供的数据分析装置实施例三的结构示意图,如图11所示,在图10所示实施例基础上,所述用户筛选条件中包括地理区域信息;所述装置还包括:第一确定模块31、第一推送模块32。
第一确定模块31,用于确定与所述地理区域信息对应的服务提供方标识。
第一推送模块32,用于根据确定出的消费属性,向所述服务提供方标识对应的服务提供方推送相应的服务策略。
图11所示装置可以执行图5所示实施例的方法,本实施例未详细描述的部分,可参考对图5所示实施例的相关说明。该技术方案的执行过程和技术效果参见图5所示实施例中的描述,在此不再赘述。
图12为本发明实施例提供的数据分析装置实施例四的结构示意图,如图12所示,在图9所示实施例基础上,所述装置还包括:第二确定模块41、第三确定模块42。
第二确定模块41,用于响应于对目标用户类型的选择操作,确定与所述目标用户类型对应的用户筛选条件。
第三确定模块42,用于根据不同观察时刻时获取的多个用户中每个用户的消费标签集合和所述用户筛选条件,确定在对应观察时刻,满足所述用户筛选条件的用户集合。
可选地,所述分析模块12包括:第二确定子模块123、第二分析子模块124。
第二确定子模块123,用于根据观察时刻Ti时对应的用户集合Y和观察时刻Tj时对应的用户集合Z,确定用户集合Y中的转出用户子集合和转入用户子集合,其中,j大于i,所述转出用户子集合中的用户不包含于所述用户集合Z中,所述转入用户子集合中的用户包含于所述用户集合Z中。
第二分析子模块124,用于对所述转出用户子集合和所述转入用户子集合进行消费标签差异性分析,获得影响所述用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性。
可选地,所述第二分析子模块124具体用于:
根据所述转出用户子集合中各用户的消费标签集合,统计所述转出用户子集合对应的每种消费属性对应的第一属性度量值;根据所述转入用户子集合中各用户的消费标签集合,统计所述转入用户子集合对应的每种消费属性对应的第二属性度量值;
确定影响所述用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性为:第一属性度量值和对应的第二属性度量值之间的差值大于预设阈值的消费属性。
图12所示装置可以执行图6-图7所示实施例的方法,本实施例未详细描述的部分,可参考对图6-图7所示实施例的相关说明。该技术方案的执行过程和技术效果参见图6-图7所示实施例中的描述,在此不再赘述。
图13为本发明实施例提供的数据分析装置实施例五的结构示意图,如图13所示,在图12所示实施例基础上,该装置还包括:第四确定模块51、第二推送模块52。
第四确定模块51,用于确定与所述目标用户类型对应的服务提供方标识。
第二推送模块52,用于根据确定出的消费属性,向所述服务提供方标识对应的服务提供方推送相应的服务策略。
图13所示装置可以执行图8所示实施例的方法,本实施例未详细描述的部分,可参考对图8所示实施例的相关说明。该技术方案的执行过程和技术效果参见图8所示实施例中的描述,在此不再赘述。
以上描述了数据分析装置的内部功能和结构,实际中,该数据分析装置可实现为服务器,包括:输入输出设备、处理器;
所述处理器,耦合到所述输入输出设备,用于获取不同观察时刻时多个用户中每个用户的消费标签集合;分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性;根据确定出的消费属性,制定相应的服务策略;所述消费标签集合中的每个标签由消费属性和属性值构成;
所述输入输出设备,用于向所述服务提供方推送所述相应的服务策略。
可选地,所述处理器还用于执行上述图1至图8所示方法步骤中的全部或部分步骤。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以产品的形式体现出来,该计算机产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (22)
1.一种数据分析方法,其特征在于,包括:
获取不同观察时刻时多个用户中每个用户的消费标签集合,所述消费标签集合中的每个标签由消费属性和属性值构成;
分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性;
根据服务平台中存储的用户的消费数据,通过对消费数据进行分析来获取作为观察对象的多个用户;
以筛选出的多个用户的用户标识为索引,跟踪筛选出的多个用户在不同历史时间内的消费数据;
根据确定出的多个用户在不同历史时间内的消费数据进行消费特征提取、计算,以获得每个用户在不同观察时刻时的消费标签集合;
确定与目标用户类型对应的服务提供方标识;
根据确定出的消费属性,向所述服务提供方标识对应的服务提供方推送相应的服务策略;
所述服务策略包括提示信息,所述消费属性为消费特征。
2.根据权利要求1所述的方法,其特征在于,所述分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性,包括:
根据所述多个用户中每个用户的消费标签集合和至少一组观察指标区间,确定每组观察指标区间在不同观察时刻对应的用户集合,其中,每组观察指标区间由至少一种观察指标及对应的一个取值区间构成;
对每组观察指标区间在不同观察时刻对应的用户集合进行用户流转情况和消费标签差异性分析,确定影响用户消费行为变化的消费属性。
3.根据权利要求2所述的方法,其特征在于,所述在不同观察时刻,获取多个用户中每个用户的消费标签集合之前,还包括:
根据用户筛选条件,获取满足所述用户筛选条件的所述多个用户。
4.根据权利要求3所述的方法,其特征在于,所述根据所述多个用户中每个用户的消费标签集合和至少一组观察指标区间,确定每组观察指标区间在不同观察时刻对应的用户集合,包括:
根据不同观察时刻时每个用户的用户消费标签集合,确定在对应观察时刻,多组观察指标区间分别对应的用户集合。
5.根据权利要求3所述的方法,其特征在于,所述对每组观察指标区间在不同观察时刻对应的用户集合进行用户流转情况和消费标签差异性分析,确定影响用户消费行为变化的消费属性,包括:
对观察时刻Ti时的任一组观察指标区间Sk对应的用户集合Xk,确定在观察时刻Tj时,在各组观察指标区间上,所述用户集合Xk对应的各流转用户子集合,其中,j大于i;
对所述用户集合Xk对应的各流转用户子集合进行消费标签差异性分析,获得影响所述用户集合Xk中用户在观察时刻Tj时消费行为变化的消费属性;
根据观察时刻Ti时全部用户集合对应的消费属性,确定观察时刻Tj时影响用户消费行为变化的消费属性。
6.根据权利要求5所述的方法,其特征在于,所述对所述用户集合Xk对应的各流转用户子集合进行消费标签差异性分析,获得影响所述用户集合Xk中用户在观察时刻Tj时消费行为变化的消费属性,包括:
针对所述用户集合Xk对应的每个流转用户子集合,根据每个流转用户子集合中各用户的消费标签集合,统计每个流转用户子集合对应的每种消费属性对应的属性度量值;
确定影响所述用户集合Xk中用户在观察时刻Tj时消费行为变化的消费属性为:属性度量值在所述各流转用户子集合间的差异化程度大于预设阈值的消费属性。
7.根据权利要求6所述的方法,其特征在于,所述确定观察时刻Tj时影响用户消费行为变化的消费属性,包括:
确定所述观察时刻Tj时影响用户消费行为变化的消费属性为:所述观察时刻Ti时全部用户集合对应的消费属性的并集,或者为:所述观察时刻Ti时全部用户集合对应的消费属性中的部分消费属性,所述部分消费属性根据观察时刻Ti时全部用户集合对应的消费属性的出现次数确定。
8.根据权利要求3至7中任一项所述的方法,其特征在于,所述用户筛选条件中包括地理区域信息;
所述方法还包括:
确定与所述地理区域信息对应的服务提供方标识;
根据确定出的消费属性,向所述服务提供方标识对应的服务提供方推送相应的服务策略。
9.根据权利要求1所述的方法,其特征在于,所述分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性之前,还包括:
响应于对目标用户类型的选择操作,确定与所述目标用户类型对应的用户筛选条件;
根据不同观察时刻时获取的多个用户中每个用户的消费标签集合和所述用户筛选条件,确定在对应观察时刻,满足所述用户筛选条件的用户集合。
10.根据权利要求9所述的方法,其特征在于,所述分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性,包括:
根据观察时刻Ti时对应的用户集合Y和观察时刻Tj时对应的用户集合Z,确定用户集合Y中的转出用户子集合和转入用户子集合,其中,j大于i,所述转出用户子集合中的用户不包含于所述用户集合Z中,所述转入用户子集合中的用户包含于所述用户集合Z中;
对所述转出用户子集合和所述转入用户子集合进行消费标签差异性分析,获得影响所述用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性。
11.根据权利要求10所述的方法,其特征在于,所述对所述转出用户子集合和所述转入用户子集合进行消费标签差异性分析,获得影响所述用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性,包括:
根据所述转出用户子集合中各用户的消费标签集合,统计所述转出用户子集合对应的每种消费属性对应的第一属性度量值;根据所述转入用户子集合中各用户的消费标签集合,统计所述转入用户子集合对应的每种消费属性对应的第二属性度量值;
确定影响所述用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性为:第一属性度量值和对应的第二属性度量值之间的差值大于预设阈值的消费属性。
12.一种数据分析装置,其特征在于,包括:
第一获取模块,用于获取不同观察时刻时多个用户中每个用户的消费标签集合,所述消费标签集合中的每个标签由消费属性和属性值构成;
分析模块,用于分析每个用户在不同观察时刻对应的消费标签集合,确定影响用户消费行为变化的消费属性;
第一获取模块,还用于根据服务平台中存储的用户的消费数据,通过对消费数据进行分析来获取作为观察对象的多个用户;
以筛选出的多个用户的用户标识为索引,跟踪筛选出的多个用户在不同历史时间内的消费数据;
所述分析模块,还用于根据确定出的多个用户在不同历史时间内的消费数据进行消费特征提取、计算,以获得每个用户在不同观察时刻时的消费标签集合;
所述装置还包括:第四确定模块,用于确定与目标用户类型对应的服务提供方标识;
第二推送模块,用于根据确定出的消费属性,向所述服务提供方标识对应的服务提供方推送相应的服务策略;
所述服务策略包括提示信息,所述消费属性为消费特征。
13.根据权利要求12所述的装置,其特征在于,所述分析模块包括:
第一确定子模块,用于根据所述多个用户中每个用户的消费标签集合和至少一组观察指标区间,确定每组观察指标区间在不同观察时刻对应的用户集合,其中,每组观察指标区间由至少一种观察指标及对应的一个取值区间构成;
第一分析子模块,用于对每组观察指标区间在不同观察时刻对应的用户集合进行用户流转情况和消费标签差异性分析,确定影响用户消费行为变化的消费属性。
14.根据权利要求13所述的装置,其特征在于,还包括:
第二获取模块,用于根据用户筛选条件,获取满足所述用户筛选条件的所述多个用户。
15.根据权利要求14所述的装置,其特征在于,所述第一确定子模块具体用于:
根据不同观察时刻时每个用户的用户消费标签集合,确定在对应观察时刻,多组观察指标区间分别对应的用户集合。
16.根据权利要求15所述的装置,其特征在于,所述第一分析子模块包括:
第一确定单元,用于对观察时刻Ti时的任一组观察指标区间Sk对应的用户集合Xk,确定在观察时刻Tj时,在各组观察指标区间上,所述用户集合Xk对应的各流转用户子集合,其中,j大于i;
分析单元,用于对所述用户集合Xk对应的各流转用户子集合进行消费标签差异性分析,获得影响所述用户集合Xk中用户在观察时刻Tj时消费行为变化的消费属性;
第二确定单元,用于根据观察时刻Ti时全部用户集合对应的消费属性,确定观察时刻Tj时影响用户消费行为变化的消费属性。
17.根据权利要求16所述的装置,其特征在于,所述分析单元具体用于:
针对所述用户集合Xk对应的每个流转用户子集合,根据每个流转用户子集合中各用户的消费标签集合,统计每个流转用户子集合对应的每种消费属性对应的属性度量值;
确定影响所述用户集合Xk中用户在观察时刻Tj时消费行为变化的消费属性为:属性度量值在所述各流转用户子集合间的差异化程度大于预设阈值的消费属性。
18.根据权利要求17所述的装置,其特征在于,所述第二确定单元具体用于:
确定所述观察时刻Tj时影响用户消费行为变化的消费属性为:所述观察时刻Ti时全部用户集合对应的消费属性的并集,或者为:所述观察时刻Ti时全部用户集合对应的消费属性中的部分消费属性,所述部分消费属性根据观察时刻Ti时全部用户集合对应的消费属性的出现次数确定。
19.根据权利要求14至18中任一项所述的装置,其特征在于,所述用户筛选条件中包括地理区域信息;
所述装置还包括:
第一确定模块,用于确定与所述地理区域信息对应的服务提供方标识;
第一推送模块,用于根据确定出的消费属性,向所述服务提供方标识对应的服务提供方推送相应的服务策略。
20.根据权利要求12所述的装置,其特征在于,还包括:
第二确定模块,用于响应于对目标用户类型的选择操作,确定与所述目标用户类型对应的用户筛选条件;
第三确定模块,用于根据不同观察时刻时获取的多个用户中每个用户的消费标签集合和所述用户筛选条件,确定在对应观察时刻,满足所述用户筛选条件的用户集合。
21.根据权利要求20所述的装置,其特征在于,所述分析模块包括:
第二确定子模块,用于根据观察时刻Ti时对应的用户集合Y和观察时刻Tj时对应的用户集合Z,确定用户集合Y中的转出用户子集合和转入用户子集合,其中,j大于i,所述转出用户子集合中的用户不包含于所述用户集合Z中,所述转入用户子集合中的用户包含于所述用户集合Z中;
第二分析子模块,用于对所述转出用户子集合和所述转入用户子集合进行消费标签差异性分析,获得影响所述用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性。
22.根据权利要求21所述的装置,其特征在于,所述第二分析子模块具体用于:
根据所述转出用户子集合中各用户的消费标签集合,统计所述转出用户子集合对应的每种消费属性对应的第一属性度量值;根据所述转入用户子集合中各用户的消费标签集合,统计所述转入用户子集合对应的每种消费属性对应的第二属性度量值;
确定影响所述用户集合Y中用户在观察时刻Tj时消费行为变化的消费属性为:第一属性度量值和对应的第二属性度量值之间的差值大于预设阈值的消费属性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611013042.4A CN107093092B (zh) | 2016-11-17 | 2016-11-17 | 数据分析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611013042.4A CN107093092B (zh) | 2016-11-17 | 2016-11-17 | 数据分析方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107093092A CN107093092A (zh) | 2017-08-25 |
CN107093092B true CN107093092B (zh) | 2021-07-09 |
Family
ID=59646509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611013042.4A Active CN107093092B (zh) | 2016-11-17 | 2016-11-17 | 数据分析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107093092B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685573A (zh) * | 2018-12-25 | 2019-04-26 | 拉扎斯网络科技(上海)有限公司 | 一种商圈数据的处理方法、装置、电子设备和存储介质 |
CN110134689B (zh) * | 2019-05-14 | 2021-03-26 | 佰聆数据股份有限公司 | 基于主体对象标签变化的目标群体筛选方法、系统及计算机设备 |
CN112288455A (zh) * | 2020-01-09 | 2021-01-29 | 北京沃东天骏信息技术有限公司 | 标签生成方法及装置、计算机可读存储介质、电子设备 |
CN111817912B (zh) * | 2020-06-28 | 2022-02-25 | 中国工商银行股份有限公司 | 基于轻量级脚本的接入层热点流量监控方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010286673A (ja) * | 2009-06-11 | 2010-12-24 | Nec Corp | 情報提供システム、管理サーバ、それらの情報提供方法及びプログラム |
CN102479366A (zh) * | 2010-11-25 | 2012-05-30 | 阿里巴巴集团控股有限公司 | 一种商品推荐方法及系统 |
CN106022800A (zh) * | 2016-05-16 | 2016-10-12 | 北京百分点信息科技有限公司 | 一种用户特征数据的处理方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130290094A1 (en) * | 2012-04-25 | 2013-10-31 | Seema Varma Srivastava | Methods and systems to explicitly and implicitly measure media impact |
US20150081469A1 (en) * | 2013-09-17 | 2015-03-19 | International Business Machines Corporation | Assisting buying decisions using customer behavior analysis |
-
2016
- 2016-11-17 CN CN201611013042.4A patent/CN107093092B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010286673A (ja) * | 2009-06-11 | 2010-12-24 | Nec Corp | 情報提供システム、管理サーバ、それらの情報提供方法及びプログラム |
CN102479366A (zh) * | 2010-11-25 | 2012-05-30 | 阿里巴巴集团控股有限公司 | 一种商品推荐方法及系统 |
CN106022800A (zh) * | 2016-05-16 | 2016-10-12 | 北京百分点信息科技有限公司 | 一种用户特征数据的处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107093092A (zh) | 2017-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6878450B2 (ja) | 広告に関する不正行為を防止するための方法及びデバイス並びに記憶媒体 | |
CN107093092B (zh) | 数据分析方法和装置 | |
US9213996B2 (en) | System and method for analyzing social media trends | |
KR101302507B1 (ko) | Sns를 이용한 마케팅 서비스 방법 및 장치 | |
US20180343312A1 (en) | Topical activity monitor and identity collector system | |
CN109600344B (zh) | 识别风险群体的方法、装置及电子设备 | |
CN101071437A (zh) | 对用户进行分类的方法,定向广告投放方法、装置及系统 | |
CN111405030B (zh) | 一种消息推送方法、装置、电子设备和存储介质 | |
CN111737646B (zh) | 广告推广的效果评估数据处理方法、系统和存储介质 | |
CN113412607B (zh) | 内容推送方法、装置、移动终端及存储介质 | |
CN111371672A (zh) | 消息推送方法及装置 | |
CN111782735A (zh) | 羊毛党流量识别方法及装置 | |
CN104902498A (zh) | 用户重入网识别方法和装置 | |
KR101831959B1 (ko) | 빅데이터 분석 클라우드 서비스 시스템 | |
CN104992060A (zh) | 用户年龄估计方法及装置 | |
CN111092764A (zh) | 一种实时动态亲密度关系分析方法及系统 | |
CN116091133A (zh) | 一种目标对象属性的识别方法、装置及存储介质 | |
CN113901261A (zh) | 异常对象集群的定位方法和装置、电子设备和存储介质 | |
JP7020345B2 (ja) | 評価装置、方法、及びプログラム | |
CN113065894A (zh) | 基于用户画像及订单分析的数据归集方法、装置及存储介质 | |
CN111078816B (zh) | 基于位置的分析方法、装置、终端及存储介质 | |
Dyagilev et al. | On information propagation in mobile call networks | |
CN111104609A (zh) | 人际关系的预测方法及其装置、计算机程序、存储介质 | |
CN111222897B (zh) | 基于客户上网满意度预测方法及装置 | |
CN113391923B (zh) | 系统资源数据分配方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Building N3, Jinyu Zhizao workshop, No. 27, Jiancai Chengzhong Road, Haidian District, Beijing 100096 Applicant after: Beijing Xingxuan Technology Co.,Ltd. Address before: 100085 Beijing, Haidian District on the road to the information on the ground floor of the 1 to the 3 floor of the 2 floor, room 11, 202 Applicant before: Beijing Xiaodu Information Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |