CN113763022A - 触达用户数的确定方法、装置、设备及存储介质 - Google Patents
触达用户数的确定方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113763022A CN113763022A CN202110180829.4A CN202110180829A CN113763022A CN 113763022 A CN113763022 A CN 113763022A CN 202110180829 A CN202110180829 A CN 202110180829A CN 113763022 A CN113763022 A CN 113763022A
- Authority
- CN
- China
- Prior art keywords
- time period
- counted
- users
- touch
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000013179 statistical model Methods 0.000 claims abstract description 128
- 230000006870 function Effects 0.000 claims description 152
- 238000012545 processing Methods 0.000 claims description 140
- 239000000654 additive Substances 0.000 claims description 31
- 230000000996 additive effect Effects 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 17
- 238000011156 evaluation Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 description 103
- 238000013461 design Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000009977 dual effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 235000012813 breadcrumbs Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供一种触达用户数的确定方法、装置、设备及存储介质,通过获取触达用户数的统计请求,根据该统计请求中的待统计时间段的标识,获取待统计时间段之前的奇数个时间段中的触达用户数,该奇数个时间段包括:待统计时间段的预设参考时间段和至少一对历史时间段,每对历史时间段包括:目标时间段和该目标时间段的预设参考时间段,最后根据该奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定待统计时间段内的触达用户数。该技术方案利用了各个目标时间段和各个目标时间段的预设参考时间段的数据,提高了触达用户数的计算准确度。
Description
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种触达用户数的确定方法、装置、设备及存储介质。
背景技术
近年来,随着网络技术的迅速发展,各大电商平台每年都会在某些时期推出大型的活动,例如,618活动、双11活动、双12活动、年末活动等。在大型活动中,准确估计每个品类(或每个品牌)的触达用户数,对电商企业的运营管理、采购和销售具有重要的参考和指导意义。其中,搜索和推荐是自然流量中引导用户触达品类的两类典型方式。
现有技术中,针对搜索和推荐方式在大型活动期间的触达用户数的统计主要有历史同期同比方法和近期环比方法。历史同期同比方法主要是通过将去年同期的触达用户数与前年同期的触达用户数相比或者将去年其他时期的触达用户数与今年相同时期的触达用户数相比,得到的同比系数,然后基于去年同期的触达用户数和同比系数,得到今年在某个大型活动期间的触达用户数。近期环比方法是通过将去年同期活动之前的触达用户数与去年同期的触达用户数进行比较或者将今年其他活动期间之前的触达用户数与今年其他活动期间的触达用户数进行比较,得到环比系数,最后基于今年在某个大型活动期之前的触达用户数和环比系数,得到今年在该大型活动期间的触达用户数。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:由于上述同比系数和环比系数在确定时依赖的数据量少,确定的同比系数和环比系数不准确,致使确定的某个大型活动期间的触达用户数准确度低。
发明内容
本申请实施例提供一种触达用户数的确定方法、装置、设备及存储介质,用以解决现有方法确定的目标时间段的触达用户数准确度低的问题。
根据本申请的第一方面,本申请实施例提供一种触达用户数的确定方法,包括:
获取触达用户数的统计请求,所述统计请求包括:待统计时间段的标识;
根据所述待统计时间段的标识,获取所述待统计时间段之前的奇数个时间段中每个时间段内的触达用户数,所述奇数个时间段包括:所述待统计时间段的预设参考时间段和至少一对历史时间段,每对历史时间段包括:目标时间段和所述目标时间段的预设参考时间段;
根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数。
在第一方面的一种可能设计中,所述根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数,包括:
根据每对历史时间段中每个时间段内的触达用户数和预设统计模型,确定每对历史时间段的触达用户数变量;
根据每对历史时间段的触达用户数变量和预设统计信息,确定所述触达用户数变量对应的触达用户数变量函数;
根据所述触达用户数变量函数,确定所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量;
根据所述理论触达用户数变量和所述预设参考时间段内的触达用户数,确定所述待统计时间段内的触达用户数。
可选的,所述预设统计信息包括:每个处理周期包括的时间段对数;
所述根据每对历史时间段的触达用户数变量和预设统计信息,确定所述触达用户数变量对应的触达用户数变量函数,包括:
根据每对历史时间段的触达用户数变量,构建触达用户数变量序列;
根据所述奇数个时间段和每个处理周期包括的时间段对数,确定每个时间段所属处理周期的第一函数项和每个时间段在所属处理周期中的时间段对数信息的各个示性函数项;
根据所述触达用户数变量序列、所述第一函数项和各个示性函数项,分别确定所述第一函数项的系数和各个示性函数项的系数;
根据所述第一函数项、各个示性函数项、所述第一函数项的系数和各个示性函数项的系数,确定所述触达用户数变量对应的触达用户数变量函数。
可选的,所述根据所述触达用户数变量函数,确定所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量,包括:
根据所述至少一对历史时间段的数量,确定所述待统计时间段和所述预设参考时间段组成的待统计时间段对变量;
将所述待统计时间段对变量代入所述触达用户数变量函数,确定出所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值;
根据所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值,确定出所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量。
在第一方面的另一种可能设计中,在所述预设统计模型包括:加性统计模型和乘性统计模型时,所述方法还包括:
根据每对历史时间段中每个时间段内的触达用户数和预设评估指标,分别确定所述加性统计模型对应的第一拟合误差和所述乘性统计模型对应的第二拟合误差;
根据所述第一拟合误差和所述第二拟合误差,在所述加性统计模型和所述乘性统计模型中,确定目标统计模型;
相应的,所述根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数,包括:
根据所述奇数个时间段中每个时间段内的触达用户数和所述目标统计模型,确定所述待统计时间段内的触达用户数。
在第一方面的再一种可能设计中,在所述根据所述待统计时间段的标识,获取所述待统计时间段之前的奇数个时间段中每个时间段内的触达用户数之前,所述方法还包括:
获取所述触达用户数的预置统计信息,所述预置统计信息包括:每次统计的处理周期个数、每个处理周期包括的时间段对数、每对时间段中目标时间段的时间范围和参考时间段的时间范围;
根据所述预置统计信息和所述待统计时间段的标识,确定所述待统计时间段之前的奇数个时间段。
根据本申请的第二方面,本申请实施例提供一种触达用户数的确定装置,包括:获取模块,用于获取触达用户数的统计请求,所述统计请求包括:待统计时间段的标识,以及根据所述待统计时间段的标识,获取所述待统计时间段之前的奇数个时间段中每个时间段内的触达用户数,所述奇数个时间段包括:所述待统计时间段的预设参考时间段和至少一对历史时间段,每对历史时间段包括:目标时间段和所述目标时间段的预设参考时间段;
处理模块,用于根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数。
在第二方面的一种可能设计中,所述处理模块,具体用于:
根据每对历史时间段中每个时间段内的触达用户数和预设统计模型,确定每对历史时间段的触达用户数变量;
根据每对历史时间段的触达用户数变量和预设统计信息,确定所述触达用户数变量对应的触达用户数变量函数;
根据所述触达用户数变量函数,确定所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量;
根据所述理论触达用户数变量和所述预设参考时间段内的触达用户数,确定所述待统计时间段内的触达用户数。
可选的,所述预设统计信息包括:每个处理周期包括的时间段对数;
所述处理模块,用于根据每对历史时间段的触达用户数变量和预设统计信息,确定所述触达用户数变量对应的触达用户数变量函数,具体为:
所述处理模块,具体用于:
根据每对历史时间段的触达用户数变量,构建触达用户数变量序列;
根据所述奇数个时间段和每个处理周期包括的时间段对数,确定每个时间段所属处理周期的第一函数项和每个时间段在所属处理周期中的时间段对数信息的各个示性函数项;
根据所述触达用户数变量序列、所述第一函数项和各个示性函数项,分别确定所述第一函数项的系数和各个示性函数项的系数;
根据所述第一函数项、各个示性函数项、所述第一函数项的系数和各个示性函数项的系数,确定所述触达用户数变量对应的触达用户数变量函数。
可选的,所述处理模块,用于根据所述触达用户数变量函数,确定所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量,具体为:
所述处理模块,具体用于:
根据所述至少一对历史时间段的数量,确定所述待统计时间段和所述预设参考时间段组成的待统计时间段对变量;
将所述待统计时间段对变量代入所述触达用户数变量函数,确定出所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值;
根据所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值,确定出所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量。
在第二方面的另一种可能设计中,在所述预设统计模型包括:加性统计模型和乘性统计模型时,所述处理模块,还用于:
根据每对历史时间段中每个时间段内的触达用户数和预设评估指标,分别确定所述加性统计模型对应的第一拟合误差和所述乘性统计模型对应的第二拟合误差;
根据所述第一拟合误差和所述第二拟合误差,在所述加性统计模型和所述乘性统计模型中,确定目标统计模型;
相应的,所述处理模块,用于根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数,具体为:
所述处理模块,具体用于根据所述奇数个时间段中每个时间段内的触达用户数和所述目标统计模型,确定所述待统计时间段内的触达用户数。
在第二方面的再一种可能设计中,所述获取模块,还用于在根据所述待统计时间段的标识,获取所述待统计时间段之前的奇数个时间段中每个时间段内的触达用户数之前,获取所述触达用户数的预置统计信息,所述预置统计信息包括:每次统计的处理周期个数、每个处理周期包括的时间段对数、每对时间段中目标时间段的时间范围和参考时间段的时间范围;
所述处理模块,还用于根据所述预置统计信息和所述待统计时间段的标识,确定所述待统计时间段之前的奇数个时间段。
根据本申请的第三方面,本申请实施例提供一种数据处理设备,包括处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面以及各可能设计所述的方法。
根据本申请的第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上述第一方面以及各可能设计所述的方法。
根据本申请的第五方面,本申请实施例提供一种计算机程序产品,包括:计算机程序,所述计算机程序被处理器执行时用于实现如上述第一方面以及各可能设计所述的方法。
本申请实施例提供的触达用户数的确定方法、装置、设备及存储介质,通过获取触达用户数的统计请求,根据该统计请求中的待统计时间段的标识,获取待统计时间段之前的奇数个时间段中的触达用户数,该奇数个时间段包括:待统计时间段的预设参考时间段和至少一对历史时间段,每对历史时间段包括:目标时间段和该目标时间段的预设参考时间段,最后根据该奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定待统计时间段内的触达用户数。该技术方案可以在指定品类(或者品牌)上,准确预估自然流量中搜索和推荐在待统计时间段内的触达用户数,其利用了各个目标时间段和各个目标时间段的预设参考时间段的数据,提高了触达用户数的计算准确度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本申请实施例提供的触达用户数的确定方法的应用场景示意图;
图2为本申请提供的触达用户数的确定方法实施例一的流程示意图;
图3为本申请提供的触达用户数的确定方法实施例二的流程示意图;
图4为本申请提供的触达用户数的确定方法实施例三的流程示意图;
图5为利用加性统计模型拟合每对时间段的触达用户数增量的示意图;
图6为利用乘性统计模型拟合每对时间段的触达用户数倍比的示意图;
图7为本申请提供的触达用户数的确定装置实施例的结构示意图;
图8为本申请提供的数据处理设备实施例的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先对本申请实施例所涉及的名词进行解释:
4A模型即了解(Aware)、吸引(Appeal)、行动(Act)、拥护(Advocate),5A模型即了解(Aware)、吸引(Appeal)、问询(Ask)、行动(Act)、拥护(Advocate),均是用于评估受众用户对接收内容后的反应因素。其中,Aware也可以理解成内容能见度,代表内容覆盖消费者的广度,可用于衡量内容推广的第一重效力;Appeal即内容吸引度,代表内容吸引消费者关注的能力;Ask也即内容引流力,代表内容激发消费者“主动了解物品”的能力;Act也即内容获客力,代表内容对消费者下单行为产生引导转化的能力;Advocate也即,内容转粉力,代表内容为品牌沉淀消费者资产的能力。
AIPL模型即Awareness(认知)、Interest(兴趣)、Purchase(购买)和Loyalty(忠诚)(Awareness、Interest、Purchase、Loyalty)的首字母缩写,代表着用户对某一品类从陌生,到认知、体验,再到购买,最终转为忠实粉丝的过程。
下面针对本申请的应用场景进行介绍:
随着电商产业的发展,为了促进人们在电商平台上的消费,各大电商平台每年都会推出大型的活动。在大型活动中,如何准确估计每个品类(或每个品牌)上的触达用户数(touch users,TU)、触达转化率(conversion rate,CVR)、每用户平均收入(averagerevenue per user,ARPU)、活动达成(gross merchandise volume,GMV)等指标,对电商企业的运营管理、采购和销售具有重要的参考和指导意义。
目前,各品类触达用户的方式较多,如搜索、推荐、短信、曝光、发送优惠信息等。其中,搜索和推荐是自然流量中引导用户触达品类(或品牌)的两类典型方式,代价最小,在整个流量中具有较高的占比。本申请的技术方案主要是以搜索和推荐等触达用户的方式为基准,确定大型活动中的触达用户数。
基于背景技术中介绍可知,现有技术中常见的触达用户数预估方式,例如,历史同期同比方法、近期环比方法等,在预测逻辑和方法上比较简单,但是由于其依赖的数据量少,确定的同比系数和环比系数不准确,使得计算得到的触达用户数准确性低。
此外,现有技术中,基于时间序列的数据预测方法也可以预测触达用户数,具体的,通过把品类(或品牌)上每日触达的用户数作为时间变化序列,基于过去的时间序列数据和近期的时间序列数据预测某个大型活动期间的触达用户数。然而,这种方法需要自相关性强的数据、足够多的训练数据量。对于日常生活中的活动,训练数据比较充分,数据变化平缓稳定,自相关性强。然而,对于每年的大型活动,如618活动、双11活动、双12活动、年末活动等,经过每年的宣贯行为,用户对购买日期有强烈的预期,训练样本少,大型活动期间的数据与大型活动期之前的数据自相关性差。因而,基于时间序列的数据预测方法,可以对日常活动的触达用户数具有较好的预测效果,但对于大型活动期间的预测效果较差。
由上述分析可知,现有技术的触达用户数确定方法均存在计算得到的目标活动期间的触达用户数准确度低的问题。
针对上述技术问题,本申请技术方案的技术构思过程如下:根据实际场景需要可以首先确定出每年的大型活动期等多个时间段,然后统计出近几年中各个活动期中的触达用户数以及各个活动期之前的预设时间范围内的触达用户数,并将各个活动期与各活动期之前的预设时间范围组成一对时间段,再分别求出各对时间段中的触达用户数变量,最后,在需要统计未来某目标活动期的触达用户数时,在确定出该活动期之前的预设时间范围内的触达用户数后,再结合各对时间段中的触达用户数变量共同确定该目标活动期的触达用户数。该技术方案利用了各个活动期和各个活动期之前的数据,克服了大型活动期与日常活动的触达人数差异大、数据可用样本少的问题,提高了触达用户数的计算准确度。
基于上述构思过程,本申请实施例提供了一种触达用户数的确定方法,在获取到触达用户数的统计请求时,根据该统计请求中的待统计时间段的标识,获取待统计时间段之前的奇数个时间段中的触达用户数,该奇数个时间段包括:待统计时间段的预设参考时间段和至少一对历史时间段,每对历史时间段包括:目标时间段和该目标时间段的预设参考时间段,最后根据该奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定待统计时间段内的触达用户数。其中,待统计时间段是某个大型活动的时间范围,该待统计时间段的预设参考时间段是该大型活动之前的预设时间段的时间范围。
示例性的,图1为本申请实施例提供的触达用户数的确定方法的应用场景示意图。如图1所示,该应用场景可以包括:至少一个终端设备(图1示出了三个终端设备,分别为终端设备111、终端设备112、终端设备113)、网络12、服务器13和数据处理设备14。其中,每个终端设备与服务器13均可以通过网络12进行通信,使得服务器13可以获取到用户的操作行为数据,从而确定出各个时间段中的触达用户数。
可选的,图1所示的应用场景还可以包括数据存储设备15,该数据存储设备15既可以与服务器13连接,也可以与数据处理设备14连接,用于存储服务器13输出的数据和/或数据处理设备14输出的数据。
示例性的,在图1所示的应用场景中,作为一种示例,数据处理设备14可以具有人机交互界面,这时,数据处理设备14可以通过人机交互界面接收统计触达用户的操作人员发出的统计请求;作为另一种示例,数据处理设备14也可以接收触达用户数的统计人员通过操作终端16发出的统计请求,并将统计结果反馈给操作终端16进行展示。本申请实施例并不限定数据处理设备获取统计请求的具体方式,其可以根据实际场景确定,此处不作赘述。
在本实施例中,数据处理设备14可以基于从服务器13和/或数据存储设备15获取到的数据,执行触达用户数的确定方法的程序代码,以得到待统计时间段内的触达用户数。
需要说明的是,附图1仅是本申请实施例提供的一种应用场景的示意图,本申请实施例不对图1中包括的设备进行限定,也不对图1中设备之间的位置关系进行限定,例如,在图1中,数据存储设备15相对服务器13可以是外部存储器,在其它情况下,也可以将数据存储设备15置于服务器13中,数据处理设备14既可以是独立于服务器13单独存在的设备,也可以是集成于服务器13的一个组件,本申请实施例并不对其进行限定。
在实际应用中,由于终端设备和服务器均是具有数据处理能力的处理设备,因而,上述图1所示应用场景中的数据处理设备既可以通过终端设备实现,也可以通过服务器实现,本申请实施例以触达用户数的确定方法的执行主体为数据处理设备进行解释说明。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图2为本申请提供的触达用户数的确定方法实施例一的流程示意图。如图2所示,该触达用户数的确定方法可以包括如下步骤:
S201、获取触达用户数的统计请求,该统计请求包括:待统计时间段的标识。
在本申请的实施例中,为了统计推荐和搜索等自然流量在某个时间段中的触达用户数,操作人员可以直接操作数据处理设备发出该统计请求,也可以通过操作终端发出统计请求,为了确定出需要统计的时间段或时间范围,统计请求中需要携带待统计时间段的标识。
示例性的,待统计时间段通常是电商平台中设定的某个大型活动的时间范围。对于常见的大型活动,例如,618活动的时间范围为6.1日~6.18日,双11活动的时间范围为11.1日~11.11日,双12活动的时间范围为12.1日~12.12日。通常情况下,每个待统计时间段,即每个活动的开始日期和结束日期是订单成交的高峰日期,例如,6.1日、6.18日、11.1日、11.11日、12.12日等,但本申请实施例并不对其进行限定。
可以理解的是,待统计时间段也可以是其他的日期范围,例如,3.15活动的日期范围、基于店铺或电商平台的周年庆设定的日期范围等,本申请实施例并不对其进行限定,其可以根据实际需求确定,此处不作赘述。
S202、根据待统计时间段的标识,获取待统计时间段之前的奇数个时间段中每个时间段的触达用户数。
其中,奇数个时间段包括:待统计时间段的预设参考时间段和至少一对历史时间段,每对历史时间段包括:目标时间段和该目标时间段的预设参考时间段。
在本申请的实施例中,为了准确统计待统计时间段的触达用户数,数据处理设备中预先存储有触达用户数的预置统计信息,这样数据处理设备在获取到统计请求后,根据该统计请求中的待统计时间段的标识,通过查询上述预置统计信息,可以确定出时间上在待统计时间段之前的多个时间段,然后再从电商平台或电商服务器上获取每个时间段中的触达用户数。
相应的,在本申请的实施例中,在该S202之前,该方法还可以包括如下步骤:
A1、获取触达用户数的预置统计信息。
其中,该预置统计信息包括:每次统计的处理周期个数、每个处理周期包括的时间段对数、每对时间段中目标时间段的时间范围和参考时间段的时间范围。
A2、根据该预置统计信息和待统计时间段的标识,确定待统计时间段之前的奇数个时间段。
在本申请的实施例中,对于给定的品牌或品类,若想统计某个时间段的触达用户数,数据处理设备需要首先获取到预先存储的配置统计信息,该配置统计信息可以包括:针对每个统计请求,每次统计处理周期数量。可选的,若以年为处理周期,则每次可以获取近2年或近3年中每次大型活动对应的目标时间段和该目标时间段之前的预设参考时间段内的触达用户数,将其作为历史时间段。
可选的,配置统计信息还可以包括每个处理周期包括的时间段对数。也即,在本申请的实施例中,预设的每个处理周期中的时间段是成对出现的,每对时间段包括目标时间段和该目标时间段的预设参考时间段。
因而,在本实施例中,根据待统计时间段的标识和预置统计信息,确定出该待统计时间段的预设参考时间段之外,还可以确定出预设至少一个处理周期中包括的至少一对时间段,且每对时间段均包括目标时间段和该目标时间段的预设参考时间段。
进一步的,在本申请的实施例中,配置统计信息还可以包括每对时间段中目标时间段的时间范围和该目标时间段的预设参考时间段的时间范围。示例性的,下述以一年中的大型活动包括618活动、双11活动、双12活动等3个大型活动为例进行举例说明。相应的,每个活动对应的目标时间段和该目标时间段的预设参考时间段的时间范围(即日期范围)如表1所示。
表1目标时间段的预设参考时间段和目标时间段的时间范围
目标时间段的预设参考时间段 | 目标时间段 |
05-07~05-20 | 06-01~06-18 |
10-07~10-20 | 11-01~11-11 |
11-14~11-20 | 12-01~12-11 |
参照表1所示,表1给出了不同活动对应的不同目标时间段的一种时间范围示例以及每个目标时间段的预设参考时间段的一种时间范围示例。通常情况下,每个活动对应目标时间段的时间范围通常是该活动开展的时间范围,目标时间段的预设参考时间段通常包括该目标时间段之前的完整2周或1周的时间,其中,在时间上,目标时间段的时间范围与预设参考时间段的时间单位可以连续,也可以不连续。
有上述分析可知,本申请实施例并不限定预设参考时间段和目标时间段的时间范围,而且,不同目标时间段的时长以及不同预设参考时间段的时长均可以不同,其均可以根据实际需求设定,此处不作赘述。
示例性的,对于给定品类或品牌,若需要统计2020年双11活动期间的触达用户数,则待统计时间段为2020-11-01~2020-11-11,根据预置统计信息,可以选取最近2年中各对预设时间段中的数据,例如,将2019年、2020年的大型活动期间的触达用户数作为预设统计模型的训练拟合数据。
假设选用2020-11-01~2020-11-11之前的7个时间段中每个时间段的触达用户数来计算该待统计时间段内的触达用户数。示例性的,若一年的大型活动包括618活动、双11活动和双12活动时,上述7个时间段可以包括:2020-11-01~2020-11-11的预设参考时间段(例如,2020-10-07~2020-10-20)、3对历史时间段。3对历史时间段分别是2020-05-07~2020-05-20和2020-06-01~2020-06-18、2019-11-14~2019-11-20和2019-12-01~2019-12-12、2019-10-07~2019-10-20和2019-11-01~2019-11-11。
S203、根据上述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定待统计时间段内的触达用户数。
在本申请的实施例中,数据处理设备中可以加载有预设统计模型,当获取到待统计时间段之前的奇数个时间段中每个时间段内的触达用户数后,将其输入到该预设统计模型中,可以确定出待统计时间段内的触达用户数。
示例性的,预设统计模型可以是预先加载的一个统计模型,也可以包括预先加载的多个统计模型,当预设统计模型包括预先加载的多个统计模型时,可以根据上述奇数个时间段中每对历史时间段内的触达用户数对每个统计模型进行效果评估,并从中选择出效果较好的目标统计模型,并利用该目标统计模型计算待统计时间段内的触达用户数。
进一步的,由于搜索和推荐方式触达的用户数是自然流量中主要的组成部分,而大型活动期间的触达方式能带来的活动达成(GMV),其与触达方式的触达用户数(TU)、触达转化率(CVR)、每用户平均收入(ARPU)之间,满足如下关系:GMV=TU*CVR*ARPU,所以,在确定出待统计时间段内的触达用户数之后,可以再结合CVR和ARPU等计算GMV,因而,若提高了TU的预估准确性,则可以在一定程度上提高GMV的预估准确性,其对电商企业的辅助运营和采销等过程的追踪和调节有重大意义。
可以理解的是,在给定活动日期时,还可以统计日期范围内在品类或品牌上触达的不同用户数或者触达的不同人群分层的数量,其与给定活动日期之前的多个时间段内触达用户数的确定方式有关,此处不作赘述。
本申请实施例提供的触达用户数的确定方法,通过获取触达用户数的统计请求,根据该统计请求中的待统计时间段的标识,获取待统计时间段之前的奇数个时间段中的触达用户数,该奇数个时间段包括:待统计时间段的预设参考时间段和至少一对历史时间段,每对历史时间段包括:目标时间段和该目标时间段的预设参考时间段,最后根据该奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定待统计时间段内的触达用户数。该技术方案可以在指定品类(或者品牌)上,准确预估自然流量中搜索和推荐在待统计时间段内的触达用户数,其利用了各个目标时间段和各个目标时间段的预设参考时间段的数据,提高了触达用户数的计算准确度。
在上述实施例的基础上,图3为本申请提供的触达用户数的确定方法实施例二的流程示意图。如图3所示,在本实施例中,上述S203可以通过如下步骤实现:
S301、根据每对历史时间段中每个时间段内的触达用户数和预设统计模型,确定每对历史时间段的触达用户数变量。
在本申请的实施例中,在获取到上述奇数个时间段内的触达用户数之后,可以确定出奇数个时间段中目标时间段的数量,假设变量m为上述至少一对历史时间段中的第m对时间段,m为大于或等于1的整数,则上述至少一对历史时间段的总数量为2m个,根据每对历史时间段中每个时间段内的触达用户数构建的触达用户数的数据序列为T(0),T(1),…,T(2m-1)。
在本实施例中,数据处理设备可以根据加载的预设统计模型的形式,确定每对历史时间段的触达用户数变量。可选的,预设统计模型可以是加性统计模型,也可以是乘性统计模型。
作为一种示例,在预设统计模型为加性统计模型时,每对历史时间段的触达用户数变量为该对时间段中目标时间段相对于预设参考时间段的触达用户数增量。例如,在每对历史时间段中,触达用户数变量等于预设参考时间段的触达用户数与目标时间段的触达用户数的差值。在本示例中,每对历史时间段的触达用户数变量分别表示为y1=T(1)-T(0),y2=T(3)-T(2),…,ym=T(2m-1)-T(2m-2)。
作为另一种示例,在预设统计模型为乘性统计模型时,每对历史时间段的触达用户数变量为该对时间段中目标时间段的触达用户数与预设参考时间段的触达用户数的倍比。例如,在每对历史时间段中,触达用户数变量等于预设参考时间段的触达用户数与目标时间段的触达用户数的比值。在本示例中,每对历史时间段的触达用户数变量分别表示为y1=T(1)/T(0),y2=T(3)/T(2),…,ym=T(2m-1)/T(2m-2)。
S302、根据每对历史时间段的触达用户数变量和预设统计信息,确定触达用户数变量对应的触达用户数变量函数。
在本申请的实施例中,预设统计信息包括:每个处理周期包括的时间段对数,因而,在数据处理设备得到每对历史时间段的触达用户数变量后,可以查询预设统计信息,确定出每个处理周期包括的时间段对数,然后再结合每对历史时间段的触达用户数变量,确定触达用户数变量对应的触达用户数变量函数。
在实际应用中,相同日期范围的活动相隔一年举办一次,例如,618活动的目标时间段分别为2018-06-01~2018-06-18、2019-06-01~2019-06-18;双11活动的目标时间段分别为2018-11-01~2018-11-11、2019-11-01~2019-11-11;双12活动的目标时间段分别为2018-12-01~2018-12-12、2019-12-01~2019-12-12等。因而,触达用户数的处理周期为一年,也可以解释为年活动周期。在实际应用中,由于每年的大型活动通常包括618活动、双11活动、双12活动、年末活动等不同的活动。本申请实施例以每年的大型活动包括618活动、双11活动、双12活动为例进行举例说明,这时每个处理周期包括的时间段对数为3对。
在本申请的实施例中,该S302可以通过如下步骤实现:
B1、根据每对历史时间段的触达用户数变量,构建触达用户数变量序列。
示例性的,假设触达用户数变量函数的拟合点个数为m,用变量t表示,且t=0,1,…,m-1,这时根据每对历史时间段的触达用户数变量ym,构建以t为变量的触达用户数变量序列yt=ym-1。
示例性的,假设待统计时间段为2020年双11活动对应的目标时间段时,当选择2018年至2020年作为处理周期时,将2018年至2020年中的618活动对应的历史时间对、双11活动对应的历史时间对以及双12活动对应的历史时间对包括的各个时间段,按由时间先后的顺序排列,例如2018-05-07~2018-05-20、2018-06-01~2018-06-18、2018-10-07~2018-10-20、2018-11-01~2018-11-11、2018-11-14~2018-11-20、2018-12-01~2018-12-12、2019-05-07~2019-05-20、…、2020-10-07~2020-10-20,这时,t=0,3,6分别为2018年618活动对应的目标时间段、2019年618活动对应的目标时间段、2020年618活动对应的目标时间段,t=1,4分别为2018年双11活动对应的目标时间段和2019年双11活动对应的目标时间段,t=2,5分别为2018年双12活动对应的目标时间段和2019年双12活动对应的目标时间段。t=7为2020年双11活动对应的目标时间段。
B2、根据奇数个时间段和每个处理周期包括的时间段对数,确定每个时间段所属处理周期的第一函数项和每个时间段在所属处理周期中的时间段对数信息的各个示性函数项。
在本申请的实施例中,假设每个处理周期包括的时间段对数用M表示,为了确定奇数个时间段中每个时间段所属第几个处理周期,这时采用取整函数,例如,为t商M向下取整后的值,其表示拟合点t所属的处理周期,当t=0,1,2时,表示拟合点t对应的历史时间段对属于第0个处理周期,对应于选用的2018年至2020年中的2018年;当t=3,4,5时,表示拟合点t对应的历史时间段对属于第1个处理周期,对应于选用的2018年至2020年中的2019年;当t=6,7,8时,表示拟合点t对应的历史时间段对属于第3个处理周期,对应于选用的2018年至2020年中的2020年,依次类推。也即,每个时间段所属处理周期的第一函数项用表示。
可选的,为了确定拟合点t对应的历史时间段对在所属处理周期包括的多对时间段中的顺序时,可以选用变量为t%M=?的示性函数项,t%M表示t模M的余数,其中,?是0,…,M-1中的任意数值。因而,在本实施例中,利用I{t%M=0}表示第(t+1)对时间段在所属处理周期中为第一对时间段的示性函数项,I{t%M=1}表示第(t+1)对时间段在所属处理周期中为第二对时间段的示性函数项,I{t%M=2}表示第(t+1)对时间段在所属处理周期中为第三对时间段的示性函数项。对于I{t%M=0},当t%M余0时,I{t%M=0}=1,否则取值0;同理,对于I{t%M=1},当t%M余1时,I{t%M=1}=1,否则取值0;对于I{t%M=2},当t%M余2时,I{t%M=2}=1,否则取值0。
B3、根据触达用户数变量序列、第一函数项和各个示性函数项,分别确定第一函数项的系数和各个示性函数项的系数。
B4、根据第一函数项、各个示性函数项、第一函数项的系数和各个示性函数项的系数,确定触达用户数变量对应的触达用户数变量函数。
示例性的,在本申请的实施例中,假设触达用户数变量函数用如下形式表示:
其中,t表示触达用户数变量函数的第t个拟合点,t=0,1,…,m-1,m表示所述至少一对历史时间段中的第m对时间段,m为大于1或等于1的正整数;M表示每个处理周期包括的时间段对数;yt表示第(t+1)对时间段内的触达用户数变量;I{t%M=0}表示第(t+1)对时间段在所属处理周期中为第一对时间段的示性函数项,b0表示I{t%M=0}的系数;I{t%M=1}表示第(t+1)对时间段在所属处理周期中为第二对时间段的示性函数项,b1表示I{t%M=1}的系数;I{t%M=2}表示第(t+1)对时间段在所属处理周期中为第三对时间段的示性函数项,b2表示I{t%M=2}的系数;t%M表示t模M的余数;是t商M向下取整,表示第(t+1)对时间段所属处理周期的第一函数项;k是的系数,表示触达用户数增量随处理周期增长的斜率。
由此可知,触达用户数变量函数包含了b0,b1,b2,...,k等系数,对于上述至少一对历史时间段对应的触达用户数变量序列y0,y1,y2,…,yt,通过机器学习算法,如最小二乘方法或其它方法,可以确定出所有的待定系数。也即,触达用户数变量函数体现了参数共享的概念,对于618活动、双11活动、双12活动等不同活动的增量基数不同,但增量的增长斜率k是相同的、共享的。
示例性的,对于包括上述6对历史时间段确定的触达用户数变量序列,可以计算相邻两对历史时间段的用户数变量y1到y6,分别代入到设计的触达用户数变量函数中得到6个方程,其中有4个变量,再结合机器学习算法得到4个变量的值,基于该4个变量,可以得到各个历史时间段中的触达用户数的预测值和实际值,进而预测第7个活动期,即待统计时间段内的触达用户数。
S303、根据触达用户数变量函数,确定待统计时间段内相比于预设参考时间段内的理论触达用户数变量。
在本申请的实施例中,根据待统计时间段所属的时间段对的拟合点顺序,将其触达用户数变量函数,可以确定出待统计时间段所属的时间段对在处理周期中的顺序以及待统计时间段所属的处理周期,进而能够得到待统计时间段所处时间段对的理论触达用户数变量,也即,待统计时间段相比于预设参考时间段内的理论触达用户数变量。
可选的,在本申请的实施例中,该S303具体可以通过如下步骤实现:
根据所述至少一对历史时间段的数量,确定待统计时间段和预设参考时间段组成的待统计时间段对变量;
将该待统计时间段对变量代入触达用户数变量函数,确定出待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值;
根据所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值,确定出待统计时间段内相比于预设参考时间段内的理论触达用户数变量。
具体的,在确定出触达用户数变量函数后,可以根据上述至少一对历史时间段的数量确定出待统计时间段和预设参考时间段组成的待统计时间段对变量,例如,历史时间段对为t对,触达用户数变量函数的变量从0开始,即,历史时间段对对应的变量依次为0,1,…,t-1;则该待统计时间段对变量为t,将该t代入上述触达用户数变量函数,可以确定出有取值的示例函数项,并求出该示性函数项取值和第一函数项取值,将该示性函数项取值和第一函数项取值进行相加,可以得到
将上述时间段作为一个变量,若基于上述至少一对历史时间段进行编号,也即,确定待统计时间段对变量内的理论触达用户数变量,也即,待统计时间段内相比于预设参考时间段内的理论触达用户数变量。
S304、根据理论触达用户数变量和预设参考时间段内的触达用户数,确定待统计时间段内的触达用户数。
在本实施例中,根据预设统计模型形式,确定出待统计时间段内的触达用户数与预设参考时间段内触达用户数的关系,并结合上述获取到的预设参考时间段内的触达用户数,可以计算出待统计时间段内的触达用户数。
作为一种示例,假设选用的预设统计模型为加性统计模型,则预设参考时间段内的触达用户数加上理论触达用户数变量,即为待统计时间段内的触达用户数。
作为另一种示例,假设选用的预设统计模型为乘性统计模型,则预设参考时间段内的触达用户数乘以理论触达用户数变量,即为待统计时间段内的触达用户数。
本申请实施例提供的触达用户数的确定方法,通过根据每对历史时间段中每个时间段内的触达用户数和预设统计模型,确定每对历史时间段的触达用户数变量,根据每对历史时间段的触达用户数变量和预设统计信息,确定上述触达用户数变量对应的触达用户数变量函数,再根据触达用户数变量函数,确定待统计时间段内相比于预设参考时间段内的理论触达用户数变量,最后根据理论触达用户数变量和预设参考时间段内的触达用户数,确定待统计时间段内的触达用户数。该技术方案中,利用待统计时间段之前的奇数个时间段内的触达用户数可以准确确定出待统计时间段内的触达用户数,为后续的使用奠定了基础。
在上述实施例的基础上,图4为本申请提供的触达用户数的确定方法实施例三的流程示意图。如图4所示,在本实施例中,在上述预设统计模型包括:加性统计模型和乘性统计模型时,该触达用户数的确定方法还可以包括如下步骤:
S401、根据每对历史时间段中每个时间段内的触达用户数和预设评估指标,分别确定加性统计模型对应的第一拟合误差和乘性统计模型对应的第二拟合误差。
在本申请的实施例中,可以采用多个预设评估指标来评估各个模型的效果。预设评估指标可以包括拟合的加权平均绝对百分比误差(weighted mean absolutepercentage error,wMAPE)和拟合的最大百分比误差(max absolute percentage error,max-ape)。wMAPE和max_ape的公式分别如下:
其中,公式中假设有t个拟合点,yi为实际值,pi为拟合值或预测值。
在本申请的实施例中,假设触达用户数的序列为T(0),T(1),…,T(2m-1),触达用户数变量函数y=f(t)。
作为一种示例,对于加性统计模型,假设待统计时间段为第m个目标时间段,则待统计时间段内的触达用户数(或用户分层的触达用户数)其中,T(i=2m)为待统计时间段的预设参考时间段的触达用户数,f(t=m)为待统计时间段所属时间段对的触达用户数增量。
示例性的,图5为利用加性统计模型拟合每对时间段的触达用户数增量的示意图。如图5所示,以包含一个品类(或品牌)上3年的历史时间段(也可以只用最近2年的历史时间段)进行举例说明,横坐标是目标时间段的开始时间,纵坐标是触达用户数增量yt。细实线空点代表获取到的历史时间段对的实际触达用户数增量,粗实线点代表触达用户数变量函数确定的理论触达用户数增量,粗虚线点代表待统计时间段所属时间段对的触达人数增量的预测值。显然,根据图5可知,待统计时间段的触达用户数的预测值i=14表示待统计时间段的预设参考时间段2020-10-07~2020-10-20,t=7表示第7个目标时间段2020-11-01~2020-11-11。
作为另一种示例,对于乘性统计模型,假设待统计时间段为第m个目标时间段,则待统计时间段内的触达用户数(或用户分层的触达用户数)其中,T(i=2m)为待统计时间段的预设参考时间段的触达用户数,f(t=m)为待统计时间段所属时间段对的触达用户数倍比。
示例性的,图6为利用乘性统计模型拟合每对时间段的触达用户数倍比的示意图。如图6所示,以包含一个品类(或品牌)上3年的历史目标时间段(也可以只用最近2年的历史时间段)进行举例说明,横坐标是目标时间段的开始时间,纵坐标是触达用户数倍比yt。细实线点代表获取到的历史时间段对的实际触达用户数倍比,粗实线点代表触达用户数变量函数确定的理论触达用户数倍比,粗虚线点代表待统计时间段所属时间段对的触达人数倍比的预测值。显然,根据图6可知,待统计时间段的触达用户数的预测值i=14表示待统计时间段的预设参考时间段2020-10-07~2020-10-20,t=7表示第7个目标时间段2020-11-01~2020-11-11。
可以理解的是,本申请实施例中的日期或时间段都为示例的日期或时间段,本申请实施例并不对其进行限定,其可以根据实际需要进行修改或调整,此处不再赘述。
可选的,在本申请的实施例中,对于预设统计模型包括的两个统计模型,有的品类(或品牌)可能适合加性统计模型,有的品类(或品牌)适合乘性统计模型,因此,可以将加性统计模型的拟合结果和实际值分别代入上述预设评估指标中,得到加性统计模型对应的指标值,确定加性统计模型对应的第一拟合误差,再将乘性统计模型的拟合结果和实际值分别代入上述预设评估指标中,得到乘性统计模型对应的指标值,确定乘性统计模型对应的第二拟合误差。
S402、根据第一拟合误差和第二拟合误差,在加性统计模型和乘性统计模型中,确定目标统计模型。
在本实施例中,数据处理设备可以根据加性统计模型对应的第一拟合误差和乘性统计模型对应的第二拟合误差,从中选择误差最小的统计模型作为目标统计模型,以保证评估训练拟合误差或预测拟合误差更小。
相应的,在本实施例中,上述S203可以替换为如下步骤:
根据奇数个时间段中每个时间段内的触达用户数和目标统计模型,确定待统计时间段内的触达用户数。
在本实施例中,在确定待统计时间段的触达用户数时,可以基于确定的目标统计模型和奇数个时间段中每对历史时间段内的触达用户数,确定出待统计时间段所在历史时间段对的触达用户数变量,然后再结合待统计时间段的预设参考时间段内的触达用户数,确定出待统计时间段内的触达用户数。
关于该步骤中未赘述的细节可以参见上述图3所示实施例中的记载,此处不再赘述。
本申请实施例提供的触达用户数的确定方法,通过根据每对历史时间段中每个时间段内的触达用户数和预设评估指标,分别确定加性统计模型对应的第一拟合误差和乘性统计模型对应的第二拟合误差,进而可以根据第一拟合误差和第二拟合误差,在加性统计模型和乘性统计模型中,确定目标统计模型,从而进一步减小触达用户数的预设误差,提高了待统计时间段内的触达用户数的统计准确度,从而提高了GMV的预估准确性,从而对辅助运营和采销等过程的追踪和调节具有重大意义。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图7为本申请提供的触达用户数的确定装置实施例的结构示意图。参照图7所示,该触达用户数的确定装置可以包括:
获取模块701,用于获取触达用户数的统计请求,所述统计请求包括:待统计时间段的标识,以及根据所述待统计时间段的标识,获取所述待统计时间段之前的奇数个时间段中每个时间段内的触达用户数,所述奇数个时间段包括:所述待统计时间段的预设参考时间段和至少一对历史时间段,每对历史时间段包括:目标时间段和所述目标时间段的预设参考时间段;
处理模块702,用于根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数。
在本申请实施例的一种可能设计中,处理模块702,具体用于:
根据每对历史时间段中每个时间段内的触达用户数和预设统计模型,确定每对历史时间段的触达用户数变量;
根据每对历史时间段的触达用户数变量和预设统计信息,确定所述触达用户数变量对应的触达用户数变量函数;
根据所述触达用户数变量函数,确定所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量;
根据所述理论触达用户数变量和所述预设参考时间段内的触达用户数,确定所述待统计时间段内的触达用户数。
可选的,所述预设统计信息包括:每个处理周期包括的时间段对数;
所述处理模块702,用于根据每对历史时间段的触达用户数变量和预设统计信息,确定所述触达用户数变量对应的触达用户数变量函数,具体为:
所述处理模块702,具体用于:
根据每对历史时间段的触达用户数变量,构建触达用户数变量序列;
根据所述奇数个时间段和每个处理周期包括的时间段对数,确定每个时间段所属处理周期的第一函数项和每个时间段在所属处理周期中的时间段对数信息的各个示性函数项;
根据所述触达用户数变量序列、所述第一函数项和各个示性函数项,分别确定所述第一函数项的系数和各个示性函数项的系数;
根据所述第一函数项、各个示性函数项、所述第一函数项的系数和各个示性函数项的系数,确定所述触达用户数变量对应的触达用户数变量函数。
可选的,所述处理模块702,用于根据所述触达用户数变量函数,确定所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量,具体为:
所述处理模块702,具体用于:
根据所述至少一对历史时间段的数量,确定所述待统计时间段和所述预设参考时间段组成的待统计时间段对变量;
将所述待统计时间段对变量代入所述触达用户数变量函数,确定出所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值;
根据所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值,确定出所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量。
在本申请实施例的另一种可能设计中,在所述预设统计模型包括:加性统计模型和乘性统计模型时,所述处理模块702,还用于:
根据每对历史时间段中每个时间段内的触达用户数和预设评估指标,分别确定所述加性统计模型对应的第一拟合误差和所述乘性统计模型对应的第二拟合误差;
根据所述第一拟合误差和所述第二拟合误差,在所述加性统计模型和所述乘性统计模型中,确定目标统计模型;
相应的,所述处理模块702,用于根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数,具体为:
所述处理模块702,具体用于根据所述奇数个时间段中每个时间段内的触达用户数和所述目标统计模型,确定所述待统计时间段内的触达用户数。
在本申请实施例的再一种可能设计中,所述获取模块701,还用于在根据所述待统计时间段的标识,获取所述待统计时间段之前的奇数个时间段中每个时间段内的触达用户数之前,获取所述触达用户数的预置统计信息,所述预置统计信息包括:每次统计的处理周期个数、每个处理周期包括的时间段对数、每对时间段中目标时间段的时间范围和参考时间段的时间范围;
所述处理模块702,还用于根据所述预置统计信息和所述待统计时间段的标识,确定所述待统计时间段之前的奇数个时间段。
本申请实施例提供的装置,可用于执行方法实施例所述的技术方案,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,处理模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上处理模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。
图8为本申请提供的数据处理设备实施例的结构示意图。如图8所示,该数据处理设备可以包括:处理器801、存储器802、通信接口803和系统总线804,所述存储器802和所述通信接口803通过所述系统总线804与所述处理器801连接并完成相互间的通信,所述存储器802用于存储计算机程序,所述通信接口803用于和其他设备进行通信,所述处理器801执行所述计算机程序时实现如上述方法实施例所述的技术方案。
在该图8中,上述的处理器801可以是通用处理器,包括中央处理器CPU、网络处理器(network processor,NP)等;还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
存储器802可能包含随机存取存储器(random access memory,RAM),也可能包括只读存储器(read-only memory,RAM),还可能包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
通信接口803用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。
系统总线804可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当该计算机执行指令在计算机上运行时,使得计算机执行如上述方法实施例所述的技术方案。
可选的,本申请实施例还提供一种运行指令的芯片,所述芯片用于执行上述方法实施例所述的技术方案。
本申请实施例还提供了一种计算机程序产品,包括:计算机程序,计算机程序存储在可读存储介质中,数据处理设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得数据处理设备执行上述任一实施例提供的方案。
本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。
Claims (15)
1.一种触达用户数的确定方法,其特征在于,包括:
获取触达用户数的统计请求,所述统计请求包括:待统计时间段的标识;
根据所述待统计时间段的标识,获取所述待统计时间段之前的奇数个时间段中每个时间段内的触达用户数,所述奇数个时间段包括:所述待统计时间段的预设参考时间段和至少一对历史时间段,每对历史时间段包括:目标时间段和所述目标时间段的预设参考时间段;
根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数。
2.根据权利要求1所述的方法,其特征在于,所述根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数,包括:
根据每对历史时间段中每个时间段内的触达用户数和预设统计模型,确定每对历史时间段的触达用户数变量;
根据每对历史时间段的触达用户数变量和预设统计信息,确定所述触达用户数变量对应的触达用户数变量函数;
根据所述触达用户数变量函数,确定所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量;
根据所述理论触达用户数变量和所述预设参考时间段内的触达用户数,确定所述待统计时间段内的触达用户数。
3.根据权利要求2所述的方法,其特征在于,所述预设统计信息包括:每个处理周期包括的时间段对数;
所述根据每对历史时间段的触达用户数变量和预设统计信息,确定所述触达用户数变量对应的触达用户数变量函数,包括:
根据每对历史时间段的触达用户数变量,构建触达用户数变量序列;
根据所述奇数个时间段和每个处理周期包括的时间段对数,确定每个时间段所属处理周期的第一函数项和每个时间段在所属处理周期中的时间段对数信息的各个示性函数项;
根据所述触达用户数变量序列、所述第一函数项和各个示性函数项,分别确定所述第一函数项的系数和各个示性函数项的系数;
根据所述第一函数项、各个示性函数项、所述第一函数项的系数和各个示性函数项的系数,确定所述触达用户数变量对应的触达用户数变量函数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述触达用户数变量函数,确定所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量,包括:
根据所述至少一对历史时间段的数量,确定所述待统计时间段和所述预设参考时间段组成的待统计时间段对变量;
将所述待统计时间段对变量代入所述触达用户数变量函数,确定出所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值;
根据所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值,确定出所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量。
5.根据权利要求1-4任一项所述的方法,其特征在于,在所述预设统计模型包括:加性统计模型和乘性统计模型时,所述方法还包括:
根据每对历史时间段中每个时间段内的触达用户数和预设评估指标,分别确定所述加性统计模型对应的第一拟合误差和所述乘性统计模型对应的第二拟合误差;
根据所述第一拟合误差和所述第二拟合误差,在所述加性统计模型和所述乘性统计模型中,确定目标统计模型;
相应的,所述根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数,包括:
根据所述奇数个时间段中每个时间段内的触达用户数和所述目标统计模型,确定所述待统计时间段内的触达用户数。
6.根据权利要求1-4任一项所述的方法,其特征在于,在所述根据所述待统计时间段的标识,获取所述待统计时间段之前的奇数个时间段中每个时间段内的触达用户数之前,所述方法还包括:
获取所述触达用户数的预置统计信息,所述预置统计信息包括:每次统计的处理周期个数、每个处理周期包括的时间段对数、每对时间段中目标时间段的时间范围和参考时间段的时间范围;
根据所述预置统计信息和所述待统计时间段的标识,确定所述待统计时间段之前的奇数个时间段。
7.一种触达用户数的确定装置,其特征在于,包括:
获取模块,用于获取触达用户数的统计请求,所述统计请求包括:待统计时间段的标识,以及根据所述待统计时间段的标识,获取所述待统计时间段之前的奇数个时间段中每个时间段内的触达用户数,所述奇数个时间段包括:所述待统计时间段的预设参考时间段和至少一对历史时间段,每对历史时间段包括:目标时间段和所述目标时间段的预设参考时间段;
处理模块,用于根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数。
8.根据权利要求7所述的装置,其特征在于,所述处理模块,具体用于:
根据每对历史时间段中每个时间段内的触达用户数和预设统计模型,确定每对历史时间段的触达用户数变量;
根据每对历史时间段的触达用户数变量和预设统计信息,确定所述触达用户数变量对应的触达用户数变量函数;
根据所述触达用户数变量函数,确定所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量;
根据所述理论触达用户数变量和所述预设参考时间段内的触达用户数,确定所述待统计时间段内的触达用户数。
9.根据权利要求8所述的装置,其特征在于,所述预设统计信息包括:每个处理周期包括的时间段对数;
所述处理模块,用于根据每对历史时间段的触达用户数变量和预设统计信息,确定所述触达用户数变量对应的触达用户数变量函数,具体为:
所述处理模块,具体用于:
根据每对历史时间段的触达用户数变量,构建触达用户数变量序列;
根据所述奇数个时间段和每个处理周期包括的时间段对数,确定每个时间段所属处理周期的第一函数项和每个时间段在所属处理周期中的时间段对数信息的各个示性函数项;
根据所述触达用户数变量序列、所述第一函数项和各个示性函数项,分别确定所述第一函数项的系数和各个示性函数项的系数;
根据所述第一函数项、各个示性函数项、所述第一函数项的系数和各个示性函数项的系数,确定所述触达用户数变量对应的触达用户数变量函数。
10.根据权利要求9所述的装置,其特征在于,所述处理模块,用于根据所述触达用户数变量函数,确定所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量,具体为:
所述处理模块,具体用于:
根据所述至少一对历史时间段的数量,确定所述待统计时间段和所述预设参考时间段组成的待统计时间段对变量;
将所述待统计时间段对变量代入所述触达用户数变量函数,确定出所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值;
根据所述待统计时间段对变量在所属处理周期中的示性函数项取值和第一函数项取值,确定出所述待统计时间段内相比于所述预设参考时间段内的理论触达用户数变量。
11.根据权利要求7-10任一项所述的装置,其特征在于,在所述预设统计模型包括:加性统计模型和乘性统计模型时,所述处理模块,还用于:
根据每对历史时间段中每个时间段内的触达用户数和预设评估指标,分别确定所述加性统计模型对应的第一拟合误差和所述乘性统计模型对应的第二拟合误差;
根据所述第一拟合误差和所述第二拟合误差,在所述加性统计模型和所述乘性统计模型中,确定目标统计模型;
相应的,所述处理模块,用于根据所述奇数个时间段中每个时间段内的触达用户数和预设统计模型,确定所述待统计时间段内的触达用户数,具体为:
所述处理模块,具体用于根据所述奇数个时间段中每个时间段内的触达用户数和所述目标统计模型,确定所述待统计时间段内的触达用户数。
12.根据权利要求7-10任一项所述的装置,其特征在于,所述获取模块,还用于在根据所述待统计时间段的标识,获取所述待统计时间段之前的奇数个时间段中每个时间段内的触达用户数之前,获取所述触达用户数的预置统计信息,所述预置统计信息包括:每次统计的处理周期个数、每个处理周期包括的时间段对数、每对时间段中目标时间段的时间范围和参考时间段的时间范围;
所述处理模块,还用于根据所述预置统计信息和所述待统计时间段的标识,确定所述待统计时间段之前的奇数个时间段。
13.一种数据处理设备,包括处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述权利要求1-6任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-6任一项所述的方法。
15.一种计算机程序产品,包括:计算机程序,其特征在于,所述计算机程序被处理器执行时用于实现如权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110180829.4A CN113763022A (zh) | 2021-02-08 | 2021-02-08 | 触达用户数的确定方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110180829.4A CN113763022A (zh) | 2021-02-08 | 2021-02-08 | 触达用户数的确定方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113763022A true CN113763022A (zh) | 2021-12-07 |
Family
ID=78786615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110180829.4A Pending CN113763022A (zh) | 2021-02-08 | 2021-02-08 | 触达用户数的确定方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113763022A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120047005A1 (en) * | 2010-08-20 | 2012-02-23 | Blue Kai, Inc. | Real Time Audience Forecasting |
US20120047013A1 (en) * | 2010-08-20 | 2012-02-23 | Blue Kai, Inc. | Real Time Statistics Extraction From Arbitrary Advertising Audiences |
CN107038604A (zh) * | 2017-03-30 | 2017-08-11 | 腾讯科技(深圳)有限公司 | 产品对象用户数的展示方法和装置 |
CN107563804A (zh) * | 2017-08-24 | 2018-01-09 | 北京奇艺世纪科技有限公司 | 一种预测广告定向条件下覆盖的用户数量的方法和装置 |
CN108596652A (zh) * | 2018-03-28 | 2018-09-28 | 麒麟合盛网络技术股份有限公司 | 活跃用户数预测方法及装置 |
CN109299832A (zh) * | 2018-11-16 | 2019-02-01 | 北京奇虎科技有限公司 | 一种活跃用户数的预测方法及装置 |
CN110766185A (zh) * | 2018-07-25 | 2020-02-07 | 北京京东尚科信息技术有限公司 | 用户量的确定方法和系统、计算机系统 |
CN110838018A (zh) * | 2018-08-16 | 2020-02-25 | 中国移动通信集团浙江有限公司 | 节假日期间小区最大用户数预测方法及装置 |
CN112232887A (zh) * | 2020-11-05 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、计算机设备以及存储介质 |
-
2021
- 2021-02-08 CN CN202110180829.4A patent/CN113763022A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120047005A1 (en) * | 2010-08-20 | 2012-02-23 | Blue Kai, Inc. | Real Time Audience Forecasting |
US20120047013A1 (en) * | 2010-08-20 | 2012-02-23 | Blue Kai, Inc. | Real Time Statistics Extraction From Arbitrary Advertising Audiences |
CN107038604A (zh) * | 2017-03-30 | 2017-08-11 | 腾讯科技(深圳)有限公司 | 产品对象用户数的展示方法和装置 |
CN107563804A (zh) * | 2017-08-24 | 2018-01-09 | 北京奇艺世纪科技有限公司 | 一种预测广告定向条件下覆盖的用户数量的方法和装置 |
CN108596652A (zh) * | 2018-03-28 | 2018-09-28 | 麒麟合盛网络技术股份有限公司 | 活跃用户数预测方法及装置 |
CN110766185A (zh) * | 2018-07-25 | 2020-02-07 | 北京京东尚科信息技术有限公司 | 用户量的确定方法和系统、计算机系统 |
CN110838018A (zh) * | 2018-08-16 | 2020-02-25 | 中国移动通信集团浙江有限公司 | 节假日期间小区最大用户数预测方法及装置 |
CN109299832A (zh) * | 2018-11-16 | 2019-02-01 | 北京奇虎科技有限公司 | 一种活跃用户数的预测方法及装置 |
CN112232887A (zh) * | 2020-11-05 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、计算机设备以及存储介质 |
Non-Patent Citations (2)
Title |
---|
徐昌彪;朱联军;: "C-RAN中基于Markov模型的小区用户数预测", 光通信研究, no. 04, 10 August 2016 (2016-08-10) * |
成天旸: "运营商网络监测数据分析管理系统设计与实现", 中国优秀硕士学位论文全文数据库(信息科技辑), no. 06, 15 June 2018 (2018-06-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9348898B2 (en) | Recommendation system with dual collaborative filter usage matrix | |
US20200356572A1 (en) | Search ranking method and apparatus, electronic device and storage medium | |
CN109993627B (zh) | 推荐方法、推荐模型的训练方法、装置和存储介质 | |
CN104081392A (zh) | 社会媒体配置文件的影响评分 | |
CN111144874B (zh) | 支付方式推荐方法、装置及设备 | |
CN108965951B (zh) | 广告的播放方法及装置 | |
CN110704677B (zh) | 一种节目推荐方法、装置、可读存储介质及终端设备 | |
CN104634347A (zh) | 路径规划方法和装置 | |
CN109636479A (zh) | 一种广告推荐方法、装置、电子设备及存储介质 | |
CN109190028A (zh) | 基于大数据的活动推荐方法、装置、电子设备及存储介质 | |
CN109948882B (zh) | 基于区块数据结构的任务处理方法及相关设备 | |
CN106204087A (zh) | 用于选择广告媒体的方法和装置 | |
CN109190925B (zh) | 保单推荐方法、装置、计算机设备及存储介质 | |
CN112035717A (zh) | 信息处理方法、装置、设备及存储介质 | |
KR102507411B1 (ko) | 광고 성과 보고서를 제공하는 방법 | |
CN110113673A (zh) | 一种弹幕显示方法、装置及电子设备 | |
CN110929285B (zh) | 一种隐私数据的处理方法及装置 | |
CN111666481B (zh) | 数据挖掘方法、装置、计算机可读介质及电子设备 | |
CN113763022A (zh) | 触达用户数的确定方法、装置、设备及存储介质 | |
CN113095939B (zh) | 一种区块链智能合约推荐方法及装置 | |
CN111753208B (zh) | 确定用户可比属性收敛度的方法、装置、介质和电子设备 | |
CN105653645B (zh) | 网络信息关注度评估方法及装置 | |
KR102102788B1 (ko) | 인공 지능 기반 금융 상품 주문 시스템 및 방법 | |
CN113850416A (zh) | 广告推广合作对象确定方法和装置 | |
CN109685561B (zh) | 基于用户行为的电子凭证推送方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |