CN112085332A - 数据处理方法、装置、计算机设备和存储介质 - Google Patents

数据处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112085332A
CN112085332A CN202010784087.1A CN202010784087A CN112085332A CN 112085332 A CN112085332 A CN 112085332A CN 202010784087 A CN202010784087 A CN 202010784087A CN 112085332 A CN112085332 A CN 112085332A
Authority
CN
China
Prior art keywords
channel
service
user
data
behavior log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010784087.1A
Other languages
English (en)
Inventor
闵超
张铮
钱坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weimin Insurance Agency Co Ltd
Original Assignee
Weimin Insurance Agency Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weimin Insurance Agency Co Ltd filed Critical Weimin Insurance Agency Co Ltd
Priority to CN202010784087.1A priority Critical patent/CN112085332A/zh
Publication of CN112085332A publication Critical patent/CN112085332A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种数据处理方法、装置、计算机设备和存储介质。所述方法包括:获取目标时段内的用户行为日志数据;从用户行为日志数据中分拣出携带有渠道标识的用户渠道行为日志数据,从用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据;根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据,基于业务数据确定目标时间段内各渠道对应的业务存续比率和业务增加比率;基于业务数据、业务存续比率和业务增加比率,确定用于评估目标时段内各渠道价值的指标数据。采用本方法能够提高渠道价值评估准确性。

Description

数据处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及互联网技术领域,特别是涉及一种数据处理方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的发展,商家可以通过各种不同的渠道(例如微信朋友圈、公众号等)投放资源(例如投放广告),通过渠道投放资源需要花费成本,渠道也会带来相应的收益,为了提高收益,需要将资源更多地投放到效果更好的渠道,因此有必要对各渠道带来的价值进行评估。
传统的渠道价值评估方法中,一般以渠道创造的直接业务成交数据作为评估指标,存在评估依据不够全面的问题,评估准确性有待提高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高渠道价值评估准确性的数据处理方法、装置、计算机设备和存储介质。
一种数据处理方法,所述方法包括:
获取目标时段内的用户行为日志数据;
从所述用户行为日志数据中分拣出携带有渠道标识的用户渠道行为日志数据,从所述用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据;
根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据,基于所述业务数据确定所述目标时间段内各渠道对应的业务存续比率和业务增加比率;
基于所述业务数据、所述业务存续比率和所述业务增加比率,确定用于评估所述目标时段内各渠道价值的指标数据。
一种数据处理装置,所述装置包括:
获取模块,用于获取目标时段内的用户行为日志数据;
分拣模块,用于从所述用户行为日志数据中分拣出携带有渠道标识的用户渠道行为日志数据,从所述用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据;
业务数据确定模块,用于根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据,基于所述业务数据确定所述目标时间段内各渠道对应的业务存续比率和业务增加比率;
指标数据确定模块,用于基于所述业务数据、所述业务存续比率和所述业务增加比率,确定用于评估所述目标时段内各渠道价值的指标数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取目标时段内的用户行为日志数据;
从所述用户行为日志数据中分拣出携带有渠道标识的用户渠道行为日志数据,从所述用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据;
根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据,基于所述业务数据确定所述目标时间段内各渠道对应的业务存续比率和业务增加比率;
基于所述业务数据、所述业务存续比率和所述业务增加比率,确定用于评估所述目标时段内各渠道价值的指标数据。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取目标时段内的用户行为日志数据;
从所述用户行为日志数据中分拣出携带有渠道标识的用户渠道行为日志数据,从所述用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据;
根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据,基于所述业务数据确定所述目标时间段内各渠道对应的业务存续比率和业务增加比率;
基于所述业务数据、所述业务存续比率和所述业务增加比率,确定用于评估所述目标时段内各渠道价值的指标数据。
上述数据处理方法、装置、计算机设备和存储介质,通过用户行为日志数据携带的渠道标识,可以快速分拣出各个不同渠道对应的用户渠道行为日志数据,基于业务数据、业务存续比率和业务增加比率确定用于评估渠道价值的指标数据,不仅考虑了渠道带来直接成交业务数据,还考虑了后续可能带来的间接成交业务数据,使得评估更为全面,有助于提高评估准确性。
附图说明
图1为一个实施例中数据处理方法的应用环境图;
图2为一个实施例中数据处理方法的流程示意图;
图3为一个实施例中基于业务数据、业务存续比率和业务增加比率,确定用于评估目标时段内各渠道价值的指标数据步骤的流程示意图;
图4为一个实施例中数据处理装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与第一服务器104进行通信,第二服务器106通过网络与第一服务器104进行通信。用户通过终端102访问业务平台,第一服务器104可以是该业务平台所在的服务器,第一服务器104记录用户在业务平台上的页面浏览、点击、跳转等一系列行为,生成用户行为日志数据,第二服务器106可以是数据处理服务器,第二服务器106从第一服务器104获取用户行为日志数据,从中分拣出与渠道相关的用户渠道行为日志数据,基于用户渠道行为日志数据确定用于评估渠道价值的指标数据。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,第一服务器104和第二服务器106可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种数据处理方法,以该方法应用于图1中的第二服务器106为例进行说明,包括以下步骤S202至步骤S208。
S202,获取目标时段内的用户行为日志数据。
目标时段表示渠道评估日之前的一段时间,例如可以设置为6个月,举例来说,若渠道评估日为2020年7月1日,则目标时段可以是从2020年1月1日至2020年6月30日。
用户行为日志数据表示用户在业务相关页面的浏览、点击、跳转等操作产生的记录数据,每一条记录数据携带用户标识,用户标识表示用户进入业务相关页面的身份信息,例如具体可以是用户账号、手机号码、身份证号码等。
若用户通过渠道页面进入业务相关页面,则该用户在业务相关页面产生的用户行为日志数据还携带相应的渠道标识,渠道标识用于表征渠道来源,即用户流量来源于哪个渠道。举例来说,若一用户通过微信渠道的朋友圈广告页面进入业务相关页面,则该用户在业务相关页面产生的用户行为日志数据携带微信渠道对应的渠道标识。
S204,从用户行为日志数据中分拣出携带有渠道标识的用户渠道行为日志数据,从用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据。
用户可能通过多种方式进入业务相关页面,例如可以是通过点击渠道(例如百度、微博、微信等渠道)页面的广告位进入业务相关页面,也可以是自然访问业务相关页面。当用户通过渠道页面进入业务相关页面时,该用户在业务相关页面产生的用户行为日志数据携带相应的渠道标识,服务器获得目标时段内的所有用户行为日志数据后,可以从所有用户行为日志数据中分拣出携带有渠道标识的用户渠道行为日志数据,然后可以根据渠道标识与渠道类型的对应关系,对用户渠道行为日志数据进行分类,获得不同类型渠道的用户渠道行为日志数据。渠道标识与渠道类型的对应关系可以在业务系统预先录入的渠道基础信息中进行设置。
S206,根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据,基于业务数据确定目标时间段内各渠道对应的业务存续比率和业务增加比率。
业务数据表示用户在业务相关页面的业务成交行为对应的数据,具体可以包括业务类型、业务数量、业务收益等数据。业务存续比率表示业务数据中具有存续性质的业务类型对应的成交业务中,完成存续的业务比例。业务增加比率表示业务数据对应的用户中,在首次成交业务后又再次成交业务的用户比例。举例来说,对于保险业务,业务数据可以是成交保单相关数据,具体可以包括成交保单数量、成交保单类型、成交保单金额等,业务存续比率可以是续保率,业务增加比率可以是二单率。
S208,基于业务数据、业务存续比率和业务增加比率,确定用于评估目标时段内各渠道价值的指标数据。
渠道价值可以理解为渠道带来的业务效益,渠道的价值越高,可以认为在该渠道投放业务相关资源(如广告)的效果越好。基于业务数据、业务存续比率和业务增加比率确定的指标数据作为评估依据,用于评估渠道价值。
上述数据处理方法中,通过用户行为日志数据携带的渠道标识,可以快速分拣出各个不同渠道对应的用户渠道行为日志数据,基于业务数据、业务存续比率和业务增加比率确定用于评估渠道价值的指标数据,不仅考虑了渠道带来直接成交业务数据,还考虑了后续可能带来的间接成交业务数据,使得评估更为全面,有助于提高评估准确性。
在一个实施例中,根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据的步骤,具体可以包括以下步骤:对于每一渠道,获取对应的用户渠道行为日志数据中的业务标识;根据业务标识,确定业务数量以及各业务标识对应的业务类型和业务收益,业务数据包括业务标识、业务数量、业务类型和业务收益。
当用户在业务相关页面完成业务成交订单时,对应的用户渠道行为日志数据中可以携带业务标识,从而可以直接从用户渠道行为日志数据中获取业务标识,再基于业务标识查询获得对应的业务类型、业务收益等信息。
业务标识具体可以是业务成交订单的订单号;业务数量可以是业务成交订单的数量;业务类型可以是业务成交订单的订单类型;业务收益可以包括业务成交订单的订单金额,还可以包括业务成交订单的佣金。举例来说,对于保险业务,业务标识可以是成交保单号;业务数量可以是成交保单数量;业务类型可以是成交保单类型,如车险、短期健康险、长期健康险等;业务收益可以包括成交保费和成交佣金。
在一个实施例中,根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据的步骤,具体可以包括以下步骤:对于每一渠道,获取对应的用户渠道行为日志数据中的用户标识;基于用户标识,查询获得目标时段内各用户标识对应的业务标识;根据业务标识,确定业务数量以及各业务标识对应的业务类型和业务收益,业务数据包括业务标识、业务数量、业务类型和业务收益。
每一条用户渠道行为日志数据都会携带用户标识,用户标识表示用户进入业务相关页面的身份信息,具体可以是用户账号、手机号码、身份证号码等。当一用户标识对应的用户在目标时段内有业务成交订单时,可以基于该用户标识从业务成交订单数据库中查询获得对应的业务标识,再基于业务标识查询获得对应的业务类型、业务收益等信息。
业务标识具体可以是业务成交订单的订单号;业务数量可以是业务成交订单的数量;业务类型可以是业务成交订单的订单类型;业务收益可以包括业务成交订单的订单金额,还可以包括业务成交订单的佣金。举例来说,对于保险业务,业务标识可以是成交保单号;业务数量可以是成交保单数量;业务类型可以是成交保单类型,如车险、短期健康险、长期健康险等;业务收益可以包括成交保费和成交佣金。
在一个实施例中,基于业务数据确定目标时间段内各渠道对应的业务存续比率的步骤,具体可以包括以下步骤:对于每一渠道,基于对应的业务数据中的业务类型,查询获得目标时段内业务类型对应的存续数据;根据存续数据中已存续业务数量与应存续业务数量的比值,确定对应的业务存续比率。
举例来说,对于保险业务,业务存续比率为续保率,假设通过渠道A投放具有存续性质的保险产品a,在目标时间段内,保险产品a对应的成交保单中应续保的业务数量为N1,已续保的业务数量为N2,则目标时间段内通过渠道A投放保险产品a的续保率为N2/N1。
在一个实施例中,基于业务数据确定目标时间段内各渠道对应的业务增加比率的步骤,具体可以包括以下步骤:对于每一渠道,获取对应有业务标识的各目标用户标识所对应的业务标识数量;根据业务标识数量大于1的目标用户标识数量与所有目标用户标识数量的比值,确定对应的业务增加比率。
举例来说,对于保险业务,业务增加比率为二单率,假设通过渠道A投放保险产品,在目标时间段内,有M个用户通过渠道A成交了保单,即有M1个用户标识对应有成交保单号,即所有目标用户标识数量为M1,获取其中每个目标用户标识对应的成交保单数量,目标用户标识对应的成交保单数量大于1,说明该目标用户二次成交了保单,假设成交保单数量大于1对应的目标用户标识数量有M2个,则目标时间段内通过渠道A投放保险产品的二单率为M2/M1。
在一个实施例中,如图3所示,基于业务数据、业务存续比率和业务增加比率,确定用于评估目标时段内各渠道价值的指标数据的步骤,具体可以包括以下步骤S302至步骤S308。
S302,根据目标时段内的总业务收益与总业务数量的比值,获得平均业务收益。
S304,基于各渠道对应的业务数量、业务存续比率以及平均业务收益的乘积,确定各渠道对应的第一间接收益。
S306,基于各渠道对应的业务数量、业务增加比率以及平均业务收益的乘积,确定各渠道对应的第二间接收益。
S308,根据各渠道对应的业务收益、第一间接收益和第二间接收益的总和,获得用于评估目标时段内各渠道价值的指标数据。
举例来说,对于保险业务,平均业务收益可以是单均保费,基于目标时段内的总成交保费与总成交保单数量的比值,获得目标时段内的单均保费。用于评估渠道价值的指标数据可以包括用户生命周期总价值(LTV),对于任一渠道,用户LTV的计算方式具体如下:LTV=F+n*p*f+n*q*f,其中,F表示该渠道对应的成交保费,n*p*f表示该渠道对应的第一间接收益,n*q*f表示该渠道对应的第二间接收益,n表示该渠道对应的成交保单数量,p表示该渠道所投放的保险产品的续保率,q表示该渠道所投放的保险产品的二单率,f表示单均保费。
用于评估渠道价值的指标数据还可以包括投资回报率(ROI),ROI包括直接ROI和间接ROI。对于任一渠道,直接ROI的计算公式具体如下:直接ROI=Z/C,其中,Z表示该渠道对应的成交佣金,C表示该渠道对应的渠道成本。间接ROI的计算公式可以如下:间接ROI=LTV*w/C,其中,w表示平均佣金率(成交佣金与成交保费的比值),C表示该渠道对应的渠道成本。
举例来说,通过渠道A投放短期健康险,历史续保率为70%,历史二单率为30%;通过渠道B投放长期健康险,历史续保率为80%,历史二单率为60%;通过渠道C投放赠险,历史续保率为0%(赠险不存在续保),历史二单率为5%;单均保费为500元,平均佣金率为20%。
假设在目标时段内,渠道A:直接成交保单数量为20,直接成交保费为10000,直接成交佣金为2000,渠道成本为2000元;渠道B:直接成交保单数量为2,直接成交保费为10000,直接成交佣金为2000,渠道成本为2000元;渠道C:直接成交保单数量为20,直接成交保费为0,直接成交佣金为0,渠道成本为2000元,赠险领取用户数量为1000。各指标计算结果如下:
渠道A:
用户LTV=10000+20*70%*500+20*30%*500=20000;
直接ROI=2000/2000=1;
间接ROI=20000*20%/2000=2。
渠道B:
用户LTV=10000+2*80%*500+2*60%*500=11400;
直接ROI=2000/2000=1;
间接ROI=11400*20%/2000=1.14。
渠道C:
用户LTV=0+1000*0%*500+1000*5%*500=25000;
直接ROI=0/2000=0;
间接ROI=25000*20%/2000=2.5。
通过上述计算结果,渠道A和渠道B的直接ROI相同,按照传统评估方法可能会认为这两个渠道的投放效果一致,但实际上渠道A和渠道B的用户LTV和间接ROI不同,以用户LTV和间接ROI作为评估依据,这两个渠道的投放效果是有区别的。通过用户LTV可以评估渠道带来的用户质量,进而评估渠道价值,在直接ROI相同的情况下,渠道A对应的用户LTV更高,即用户质量更高,相应的间接ROI也更高,可以认为渠道A的价值更高,投放效果更好。
上述实施例中,将用户LTV、直接ROI和间接ROI共同作为指标数据来评估渠道的投放效果,提高了指标数据的深度和广度,使得评估更为全面,据此可以提高评估准确性。
在一个实施例中,从用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据的步骤,具体可以包括以下步骤:获取渠道标识与渠道类型之间的对应关系;根据渠道标识与对应关系,从用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据。
可以预先在所有的渠道页面以及用户可能发生的渠道动作中植入每个渠道的特定标识,以确保用户通过渠道进入业务相关页面后的每个动作都能打上一个唯一的渠道标识,渠道标识可以是渠道ID。可以预先建立渠道标识与渠道类型之间的对应关系,举例来说,对于渠道A,假设其渠道ID为123,则携带有渠道ID为123的用户行为日志数据属于渠道A的用户渠道行为日志数据。
据此,通过设置渠道标识以及渠道标识与渠道类型之间的对应关系,可以很方便地从海量的用户行为日志数据中分拣出与不同渠道对应的用户渠道行为日志数据,极大的减少了后续计算所需扫描的数据量。
在一个实施例中,还可以包括以下步骤:获取各渠道的用户渠道行为日志数据中的各用户标识对应的用户标签;基于用户标签,从各渠道对应的业务数据中获取各用户标签对应的标签业务数据,基于标签业务数据确定目标时间段内各渠道对应的标签业务存续比率和标签业务增加比率;基于标签业务数据、标签业务存续比率和标签业务增加比率,确定用于评估目标时段内针对各用户标签的各渠道价值的指标数据。
用户标签可以理解为用户画像,例如具体可以包括女性、80后等基本标签,还可以包括是否加入会员、是否关注公众号、是否订阅服务号、是否有业务成交记录、倾向于成交哪种业务类型等行为标签,还可以包括爱运动、爱唱歌等活动标签。可以理解,除了用户标签,还可以获取各渠道标识的渠道标签,例如具体是渠道入口来源、是否付费等标签。通过用户标识可以将用户标签和各渠道对应的业务数据进行关联,通过渠道标识可以将渠道标签和各渠道对应的业务数据进行关联,从而可以从业务数据中提取不同标签维度的业务数据,用以计算不同标签维度下的指标数据,实现从多个不同标签维度评估渠道价值。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种数据处理400,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:获取模块410、分拣模块420、业务数据确定模块430和指标数据确定模块440,其中:
获取模块410,用于获取目标时段内的用户行为日志数据。
分拣模块420,用于从用户行为日志数据中分拣出携带有渠道标识的用户渠道行为日志数据,从用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据。
业务数据确定模块430,用于根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据,基于业务数据确定目标时间段内各渠道对应的业务存续比率和业务增加比率。
指标数据确定模块440,用于基于业务数据、业务存续比率和业务增加比率,确定用于评估目标时段内各渠道价值的指标数据。
在一个实施例中,业务数据确定模块430在根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据时,具体用于:对于每一渠道,获取对应的用户渠道行为日志数据中的业务标识;根据业务标识,确定业务数量以及各业务标识对应的业务类型和业务收益,业务数据包括业务标识、业务数量、业务类型和业务收益。
在一个实施例中,业务数据确定模块430在根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据时,具体用于:对于每一渠道,获取对应的用户渠道行为日志数据中的用户标识;基于用户标识,查询获得目标时段内各用户标识对应的业务标识;根据业务标识,确定业务数量以及各业务标识对应的业务类型和业务收益,业务数据包括业务标识、业务数量、业务类型和业务收益。
在一个实施例中,业务数据确定模块430在基于业务数据确定目标时间段内各渠道对应的业务存续比率时,具体用于:对于每一渠道,基于对应的业务数据中的业务类型,查询获得目标时段内业务类型对应的存续数据;根据存续数据中已存续业务数量与应存续业务数量的比值,确定对应的业务存续比率。
在一个实施例中,业务数据确定模块430在基于业务数据确定目标时间段内各渠道对应的业务增加比率时,具体用于:对于每一渠道,获取对应有业务标识的各目标用户标识所对应的业务标识数量;根据业务标识数量大于1的目标用户标识数量与所有目标用户标识数量的比值,确定对应的业务增加比率。
在一个实施例中,指标数据确定模块440在基于业务数据、业务存续比率和业务增加比率,确定用于评估目标时段内各渠道价值的指标数据时,具体用于:根据目标时段内的总业务收益与总业务数量的比值,获得平均业务收益;基于各渠道对应的业务数量、业务存续比率以及平均业务收益的乘积,确定各渠道对应的第一间接收益;基于各渠道对应的业务数量、业务增加比率以及平均业务收益的乘积,确定各渠道对应的第二间接收益;根据各渠道对应的业务收益、第一间接收益和第二间接收益的总和,获得用于评估目标时段内各渠道价值的指标数据。
在一个实施例中,分拣模块420在从用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据时,具体用于:获取渠道标识与渠道类型之间的对应关系;根据渠道标识与对应关系,从用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据。
在一个实施例中,分拣模块420还用于获取各渠道的用户渠道行为日志数据中的各用户标识对应的用户标签;业务数据确定模块430还用于基于用户标签,从各渠道对应的业务数据中获取各用户标签对应的标签业务数据,基于标签业务数据确定目标时间段内各渠道对应的标签业务存续比率和标签业务增加比率;指标数据确定模块440还用于基于标签业务数据、标签业务存续比率和标签业务增加比率,确定用于评估目标时段内针对各用户标签的各渠道价值的指标数据。
关于数据处理装置的具体限定可以参见上文中对于数据处理方法的限定,在此不再赘述。上述数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据处理方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
需要理解的是,上述实施例中的术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种数据处理方法,其特征在于,所述方法包括:
获取目标时段内的用户行为日志数据;
从所述用户行为日志数据中分拣出携带有渠道标识的用户渠道行为日志数据,从所述用户渠道行为日志数据中确定各所述渠道标识对应的渠道的用户渠道行为日志数据;
根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据,基于所述业务数据确定所述目标时间段内各渠道对应的业务存续比率和业务增加比率;
基于所述业务数据、所述业务存续比率和所述业务增加比率,确定用于评估所述目标时段内各渠道价值的指标数据。
2.根据权利要求1所述的方法,其特征在于,根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据,包括下述两项中的任意一项:
第一项:
对于每一渠道,获取对应的用户渠道行为日志数据中的业务标识;
根据所述业务标识,确定业务数量以及各所述业务标识对应的业务类型和业务收益,所述业务数据包括所述业务标识、所述业务数量、所述业务类型和所述业务收益;
第二项:
对于每一渠道,获取对应的用户渠道行为日志数据中的用户标识;
基于所述用户标识,查询获得所述目标时段内各所述用户标识对应的业务标识;
根据所述业务标识,确定业务数量以及各所述业务标识对应的业务类型和业务收益,所述业务数据包括所述业务标识、所述业务数量、所述业务类型和所述业务收益。
3.根据权利要求2所述的方法,其特征在于,基于所述业务数据确定所述目标时间段内各渠道对应的业务存续比率,包括:
对于每一渠道,基于对应的业务数据中的业务类型,查询获得所述目标时段内所述业务类型对应的存续数据;
根据所述存续数据中已存续业务数量与应存续业务数量的比值,确定对应的业务存续比率。
4.根据权利要求2所述的方法,其特征在于,基于所述业务数据确定所述目标时间段内各渠道对应的业务增加比率,包括:
对于每一渠道,获取对应有业务标识的各目标用户标识所对应的业务标识数量;
根据业务标识数量大于1的目标用户标识数量与所有目标用户标识数量的比值,确定对应的业务增加比率。
5.根据权利要求2所述的方法,其特征在于,基于所述业务数据、所述业务存续比率和所述业务增加比率,确定用于评估所述目标时段内各渠道价值的指标数据,包括:
根据所述目标时段内的总业务收益与总业务数量的比值,获得平均业务收益;
基于各渠道对应的业务数量、业务存续比率以及所述平均业务收益的乘积,确定各渠道对应的第一间接收益;
基于各渠道对应的业务数量、业务增加比率以及所述平均业务收益的乘积,确定各渠道对应的第二间接收益;
根据各渠道对应的业务收益、第一间接收益和第二间接收益的总和,获得用于评估所述目标时段内各渠道价值的指标数据。
6.根据权利要求1所述的方法,其特征在于,从所述用户渠道行为日志数据中确定各所述渠道标识对应的渠道的用户渠道行为日志数据,包括:
获取渠道标识与渠道类型之间的对应关系;
根据所述渠道标识与所述对应关系,从所述用户渠道行为日志数据中确定各所述渠道标识对应的渠道的用户渠道行为日志数据。
7.根据权利要求1至6中任一项所述的方法,其特征在于,还包括:
获取各渠道的用户渠道行为日志数据中的各用户标识对应的用户标签;
基于所述用户标签,从各渠道对应的业务数据中获取各所述用户标签对应的标签业务数据,基于所述标签业务数据确定所述目标时间段内各渠道对应的标签业务存续比率和标签业务增加比率;
基于所述标签业务数据、所述标签业务存续比率和所述标签业务增加比率,确定用于评估所述目标时段内针对各所述用户标签的各渠道价值的指标数据。
8.一种数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取目标时段内的用户行为日志数据;
分拣模块,用于从所述用户行为日志数据中分拣出携带有渠道标识的用户渠道行为日志数据,从所述用户渠道行为日志数据中确定各渠道标识对应的渠道的用户渠道行为日志数据;
业务数据确定模块,用于根据各渠道对应的用户渠道行为日志数据,获得各渠道对应的业务数据,基于所述业务数据确定所述目标时间段内各渠道对应的业务存续比率和业务增加比率;
指标数据确定模块,用于基于所述业务数据、所述业务存续比率和所述业务增加比率,确定用于评估所述目标时段内各渠道价值的指标数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202010784087.1A 2020-08-06 2020-08-06 数据处理方法、装置、计算机设备和存储介质 Pending CN112085332A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010784087.1A CN112085332A (zh) 2020-08-06 2020-08-06 数据处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010784087.1A CN112085332A (zh) 2020-08-06 2020-08-06 数据处理方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN112085332A true CN112085332A (zh) 2020-12-15

Family

ID=73735424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010784087.1A Pending CN112085332A (zh) 2020-08-06 2020-08-06 数据处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112085332A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743975A (zh) * 2021-01-29 2021-12-03 北京沃东天骏信息技术有限公司 一种广告效果处理方法和装置
CN115271890A (zh) * 2022-09-28 2022-11-01 江苏火焰云数据技术有限公司 一种电商平台流量价值智慧评估系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743975A (zh) * 2021-01-29 2021-12-03 北京沃东天骏信息技术有限公司 一种广告效果处理方法和装置
CN115271890A (zh) * 2022-09-28 2022-11-01 江苏火焰云数据技术有限公司 一种电商平台流量价值智慧评估系统

Similar Documents

Publication Publication Date Title
CN105490823B (zh) 一种数据处理方法及装置
US20080091524A1 (en) System and method for advertisement price adjustment utilizing traffic quality data
CN108628866B (zh) 数据融合的方法和装置
US20150178749A1 (en) Methods, systems and computer readable media for predicting consumer purchase behavior
CN110033120A (zh) 用于为商户提供风险预测赋能服务的方法及装置
CN109325845A (zh) 一种金融产品智能推荐方法及系统
CN104935578A (zh) 网站恶意攻击防范方法和系统
CN110728301A (zh) 一种个人用户的信用评分方法、装置、终端及存储介质
CN112148992A (zh) 内容推送方法、装置、计算机设备和存储介质
CN112085332A (zh) 数据处理方法、装置、计算机设备和存储介质
CN112507212A (zh) 智能回访方法、装置、电子设备及可读存储介质
CN114116802A (zh) Flink计算框架的数据处理方法、装置、设备和存储介质
CN110019774B (zh) 标签分配方法、装置、存储介质及电子装置
CN108737138B (zh) 服务提供方法及服务平台
CN115619270A (zh) 数据资产管理方法、装置、计算机设备、存储介质
CN112511632B (zh) 基于多源数据的对象推送方法、装置、设备及存储介质
CN110348983B (zh) 交易信息管理方法及装置、电子设备和非暂态存储介质
CN112330373A (zh) 用户行为分析方法、装置及计算机可读存储介质
CN111858686A (zh) 数据显示方法、装置、终端设备及存储介质
CN116186119A (zh) 用户行为分析方法、装置、设备及存储介质
CN115880077A (zh) 基于客户标签的推荐方法及其装置、电子设备及存储介质
CN114285896A (zh) 信息推送方法、装置、设备、存储介质及程序产品
CN114565450A (zh) 一种基于逾期共债的催收策略确定方法及相关设备
CN113850416A (zh) 广告推广合作对象确定方法和装置
CN113434765A (zh) 客户回访方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination