CN112270574A - 一种活动执行过程中的异动分析方法、装置、设备及介质 - Google Patents

一种活动执行过程中的异动分析方法、装置、设备及介质 Download PDF

Info

Publication number
CN112270574A
CN112270574A CN202011222187.1A CN202011222187A CN112270574A CN 112270574 A CN112270574 A CN 112270574A CN 202011222187 A CN202011222187 A CN 202011222187A CN 112270574 A CN112270574 A CN 112270574A
Authority
CN
China
Prior art keywords
data
transaction
abnormal
monitoring period
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011222187.1A
Other languages
English (en)
Inventor
孙恺
杨丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011222187.1A priority Critical patent/CN112270574A/zh
Publication of CN112270574A publication Critical patent/CN112270574A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种活动执行过程中的异动分析方法、装置、介质及设备,包括:获取活动当前监控周期内的异动指标数据;获取历史活动数据,根据历史活动数据、异动指标数据和第一判据得到第一判断结果;获取当前监控周期内的全局数据,根据全局数据、异动指标数据和第二判据得到第二判断结果;根据第一判断结果和第二判断结果确定异动指标数据异常时,得到所述当前监控周期内的的异动数据和告警信息。基于人工智能的深度学习构建异动预测模型,还可以输出下一监控周期的异动预测信息。利用本发明的技术方案可以在活动执行过程中对异动进行分析,实现动态的监控和分析,同时多维度的数据指标、多维度的数据对比以及复合预测模型提升了异动报警、异动预测的准确性。

Description

一种活动执行过程中的异动分析方法、装置、设备及介质
技术领域
本发明涉及数据分析领域,具体涉及一种活动执行过程中的异动分析方法、装置、设备及介质。
背景技术
目前对于活动的总结主要集中在活动结束后进行汇总分析,这样的方案割裂了具体的每日数据对于活动的贡献而且无法实现活动数据的动态监控。且对于目前的活动分析来说,分析指标比较单一不够全面,活动的页面PV(Page View,页面浏览量)、UV(UniqueVisitor,独立访客)数据与实际的用户参与情况存在较大偏差;再者对于活动数据来说,刚开始会有一定程度的用户参与量下滑的情况,需要区别正常和非正常的数据下滑。
随着人工智能的发展,深度学习模型已广泛应用到各行各业,在各个场景发挥着非常重要的作用。利用神经网络对活动数据的预测容易受到大量内部因素和外部因素的影响,活动数据的变化波动大且没有确定的规律,具有很强的无序性,活动的时间节点的影响也增加了预测的随机性,使得不同时间点的活动预测有着很大的差异,这都提高了活动数据预测的困难程度。
发明内容
为了解决现有技术的问题,本发明提供了一种活动执行过程中的异动分析方法、装置、设备及介质。所述技术方案如下:
第一方面,本发明提供了一种活动执行过程中的异动分析方法,所述方法包括:
获取活动当前监控周期内的异动指标数据;
获取历史活动数据,根据所述历史活动数据、所述异动指标数据和第一判据得到第一判断结果,所述第一判断结果表征所述当前监控周期内的异动指标数据在历史活动维度的异动表现;
获取所述当前监控周期内的全局数据,根据所述全局数据、所述异动指标数据和第二判据得到第二判断结果,所述第二判断结果表征所述当前监控周期内的异动指标数据在全局维度的异动表现;
根据所述第一判断结果和所述第二判断结果确定所述异动指标数据异常时,得到所述当前监控周期内的异动数据和告警信息。
第二方面,本发明提供了一种活动执行过程中的异动分析装置,所述装置包括:
数据获取模块,用于获取活动当前监控周期内的异动指标数据;
第一判断模块,用于获取历史活动数据,根据所述历史活动数据、所述异动指标数据和第一判据得到第一判断结果,所述第一判断结果表征所述当前监控周期内的异动指标数据在历史活动维度的异动表现;
第二判断模块,用于获取所述当前监控周期内的全局数据,根据所述全局数据、所述异动指标数据和所述第二判据得到第二判断结果,所述第二判断结果表征所述当前监控周期内的异动指标数据在全局维度的异动表现;
异动分析模块,用于根据所述第一判断结果和所述第二判断结果确定所述异动指标数据异常时,得到所述当前监控周期内的异动数据和告警信息。
第三方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如第一方面所述的一种活动执行过程中的异动分析方法。
第四方面,本发明提供了一种计算机设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由所述处理器加载并执行如第一方面所述的一种活动执行过程中的异动分析方法。
本发明提供的一种活动执行过程中的异动分析方法、装置、设备及存储介质,具有如下技术效果:
(1)相比在活动结束后进行活动的汇总分析,本发明提供的技术方案实现了在活动执行过程中对异动数据的动态监控和分析,在活动的一个监控周期结束后,进行对当前监控周期数据异动的分析和对下一监控周期的异动预测,使数据的异动分析更具时效性,方便业务层根据异动分析及时调整活动策略;
(2)本发明提供的技术方案结合活动特点设计了多个维度的监控数据指标,并对监控数据进行多个维度的交叉细化对比,能较为全面地反映数据是否产生异动。具体地,通过根据活动自身维度的对比发现异动,结合在历史活动维度和全局维度的异动表现进一步判断当前监控周期的数据是否异常,避免了单一告警带来的不准确性,同时使异动数据的可解释性更高;
(3)本发明提供的技术方案在异动数据的预测上,利用了时间序列分析方法与BP神经网络复合的预测模型,能更好地适应活动数据,可以处理各种复杂环境下的线性和非线性数据序列,取的更好的预测准确性,尤其能在部分极端情况下反馈出数据的异动情况。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本申请实施例提供的一种活动执行过程中的异动分析方法的实施环境示意图;
图2是本发明实施例提供的一种活动执行过程中的异动分析方法的流程图;
图3是本发明实施例提供的一种获取活动当前监控周期内的异动指标数据的流程图;
图4是本发明实施例提供的一种根据历史活动数据获取第一判断结果的流程图;
图5是本发明实施例提供的一种具体指标数据的异动分析的流程框图;
图6是本发明实施例提供的一种根据全局数据获取第二判断结果的流程图;
图7是本发明实施例提供的一种对下一监控周期进行异动数据预测的流程图;
图8(1)是本发明实施例提供的一种ARIMA模型的预测流程示意图;
图8(2)是本发明实施例提供的一种BP神经网络模型拓扑结构图;
图9是本发明实施例提供的一种异动预测模型的结构图;
图10是本发明实施例提供的异动预测模型的预测效果图;
图11是本发明实施例提供的一种活动执行过程中的异动分析装置示意图;
图12是本发明实施例提供的运行一种活动执行过程中的异动分析方法的服务器的硬件结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了使本发明实施例公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明实施例进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明实施例,并不用于限定本发明实施例。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。为了便于理解本发明实施例所述的技术方案及其产生的技术效果,本发明实施例首先对于相关专业名词进行解释:
人工智能:Artificial Intelligence,简称AI,人工智能研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术涉及的领域既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
深度学习:Deep Learning,简称DL,是机器学习(ML,Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
ARIMA模型:Autoregressive Integrated MovingAverage model,差分整合移动平均自回归模型,又称整合移动平均自回归模型(移动也可称作滑动),是时间序列预测分析方法之一。ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA为“滑动平均”,q为滑动平均项数,d为使之成为平稳序列所做的差分次数(阶数)。
BP神经网络:Back PropagationNeural Network,反向传播神经网络,是一种按照误差逆向传播算法训练的多层前馈神经网络,是应用最广泛的神经网络。
MSE:Mean Square Error,均方误差。
PV:Page View,页面浏览量或点击量,用户每一次对网站中的每个网页访问均被记录1个PV。用户对同一页面的多次访问,访问量累计,用以衡量网站用户访问的网页数量。
UV:Unique Visitor,独立访客,是指通过互联网访问、浏览这个网页的自然人,访问网站的一台电脑客户端为一个访客。
DAU:DailyActive User,日活跃用户数量。常用于反映网站、互联网应用或网络游戏的运营情况。DAU通常统计一日(统计日)之内,登录或使用了某个产品的用户数,与流量统计工具里的访客(UV)概念相似。
请参阅图1,其示出了本申请实施例提供的一种活动执行过程中的异动分析方法的实施环境示意图,如图1所示,该实施环境可以至少包括客户端01和服务器02。
具体的,所述客户端01可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、监控设备及语音交互设备等类型的设备,也可以包括运行于设备中的软体,例如一些服务商提供给用户的网页页面,也可以为该些服务商提供给用户的应用。具体的,所述客户端01可以用于显示各数据指标,以及显示服务器02发送的异动数据和告警信息。具体的,所述服务器02可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。所述服务器02可以包括有网络通信单元、处理器和存储器等等。具体的,所述服务器02可以用于各指标数据进行异动分析,以及利用异动预测模型对下一个监控周期进行异动预测。
图2是本发明实施例提供的一种活动执行过程中的异动分析方法的流程图,请参照图2,本说明书实施例提供的一种活动执行过程中的异动分析方法包括如下步骤:
S101:获取活动当前监控周期内的异动指标数据。
在本说明书实施例中,对活动数据流进行按预设监控周期的采集和分析处理,示例性地,监控周期按天设置。相比于在活动结束之后进行活动数据的汇总分析,本说明书实施例旨在在活动执行过程中实现对活动监控数据的每日动态监控和分析,确定出现的数据异动,并将其异动信息反馈至业务层,以便业务层能根据异动有效且及时地调整活动策略,如在很多互联网移动应用的活动前期容易出现参与人数急剧下降的现象,若能及时发现问题则可以通过增加推广渠道、增加高概率道具等手段及时调整策略以保证活动效果。
在本说明书实施例中,结合活动的特点可以设计监控数据多个维度的异动指标,能较为全面地反映数据是否发生异动。只分析页面的PV或UV并不能反映用户参与的实际情况,更不能反映在应用内活动的具体指标变化情况。具体地,如表1所示,多个维度的异动指标可以包括但不限于某一活动自身维度的活动参与人数前两天差值、活动参与人数的连续跌幅比等指标,活动集合维度的参与人数、浏览人数等指标,大盘维度的活跃用户相关指标和付费相关指标。需要说明的是,所述大盘维度的数据覆盖应用全局,包括活动数据和非活动数据,如在游戏应用中,除了活动运营数据,还有日常运营数据。
表1多个维度的异动指标
Figure BDA0002762451670000071
Figure BDA0002762451670000081
在一具体的实施例中,可以通过对当前监控周期的各项异动指标的数据进行环比分析找出异动。具体地,如图3所示,所述获取活动当前监控周期内的异动指标数据可以包括以下步骤:
S201:获取所述活动上一监控周期内的监控数据和当前监控周期内的监控数据。
S203:根据预设的多个数据指标,将所述当前监控周期内的监控数据和所述上一监控周期内的监控数据进行环比分析,得到所述多个数据指标的环比结果。
在一种可行的实施方式中,可以根据表1中所述的各个指标将当前监控周期内和上一个监控周期内的监控数据进行环比分析,得到针对各个指标的环比结果,可以全面地反映活动数据的变化情况。
S205:根据所述多个数据指标的环比结果和所述多个数据指标对应的异常判据,确定所述当前监控周期内的异动指标数据。
在一种可行的实施方式中,所述多个数据指标对应的异常判据可以为数据的跌幅阈值、数据的跌幅比阈值等。当某一数据指标的环比结果符合其对应的异常判据,则将该数据指标作为异动指标,其对应的数据作为异动指标数据。
S103:获取历史活动数据,根据所述历史活动数据、所述异动指标数据和第一判据得到第一判断结果,所述第一判断结果表征所述当前监控周期内的异动指标数据在历史活动维度的异动表现。
在本说明书实施例中,可以通过历史活动数据进一步判断得到的异动指标数据是否异常,提升异动分析的准确性。需要说明的是,历史活动为与当前进行的活动相似度高或匹配度高的活动集合。
在本说明书实施例中,具体地,如图4所示,所述根据所述历史活动数据、所述异动指标数据和第一判据得到第一判断结果可以包括以下步骤:
S301:根据所述异动指标数据对应的异动指标,获取所述历史活动数据中所述异动指标对应的历史数据。
可以理解的是,与当前进行的活动相似度高或匹配度高的历史活动,在指标数据的变化上具有一定的相似性或规律。
在一种可行的实施方式中,如图5所示,针对活动的参与/成功领取人数这一指标,经过环比分析发现出现了异常,并启动异动数据的在不同维度的细化分析流程。在历史活动维度的分析层面,拉取该类型活动中需要进行异动分析的指标上的数据,也即历史活动数据中参与人数与奖励成功领取人数之比的历史数据。
S303:将所述异动指标数据和所述历史数据进行对比,得到第一维度对比结果。
在本说明书实施例中,具体地,所述得到第一维度对比结果可以包括以下步骤:
S401:根据预设公式和所述历史数据计算所述异动指标的异动阈值,将所述异动指标数据与所述异动阈值进行对比,得到所述第一维度对比结果。
在另一种可行的实施方式中,如图5所示,当参与/成功领取人数下降的阈值未超过由历史数据计算得到的下降阈值时,还可以进一步与同期大盘活跃用户人数的下降值做对比,在历史活动维度细化分析异动时引入同期大盘维度,维度的交叉提升了分析的准确性。
S403:根据所述历史数据生成预设格式的数据分布图,利用所述数据分布图将所述异动指标数据和所述历史数据的对比,得到所述第一维度对比结果。
在一种可行的实施方式中,如图5所示,结合历史活动集合中的同时期数据做出箱线图,反映出历史数据的特征分布情况,根据所述异动指标数据在箱线图中的位置,得到第一维度对比结果。
S305:根据所述第一维度对比结果和所述第一判据,判断所述异动指标数据是否异常,得到第一判断结果。
具体地,若所述异动指标数据超过所述异动指标的异动阈值,则直接判定所述异动指标数据历史活动维度表现为异常;若所述异动指标数据未超过所述异动指标的异动阈值,但根据箱线图的四分位数和四分位距显示该异动指标数据为异常值,则判定所述异动指标数据在历史活动维度表现为异常。
S105:获取所述当前监控周期内的全局数据,根据所述全局数据、所述异动指标数据和第二判据得到第二判断结果,所述第二判断结果表征所述当前监控周期内的异动指标数据在全局维度的异动表现。
在本说明书实施例中,可以通过全局数据进一步判断得到的异动指标数据是否异常,提升异动分析的准确性。可以理解的是,所述全局数据可以为当前进行的所有活动集合的全局数据,也可以为覆盖应用整体的全局数据,如对于游戏类型应用,游戏大盘数据除了活动运营数据还包括日常运营数据。
在本说明书实施例中,具体地,如图6所示,所述根据所述全局数据、所述异动指标数据和第二判据得到第二判断结果可以包括以下步骤:
S501:根据所述异动指标数据对应的异动指标,确定与所述异动指标满足预设关联度的全局目标指标。
在一种可行的实施方式中,如图5所示,针对活动参与/成功领取人数这一异动指标,所结合的全局数据指标包括活动当前监控周期内大盘数据中的用户人均付费值和大盘数据中的活跃用户数,选取此两类数据指标的原因主要是在分析大量的活动效果数据和大盘数据交叉时,发现这两个指标和活动参与/成功领取人数指标的相关性很高,因此将这两个大盘数据指标以及所衍生的指标(如自身跌幅比等)和活动参与/领取人数这一异动指标可以更全面、更有解释性的得出异常数据的信息。
S503:获取所述全局数据中所述全局目标指标对应的全局目标数据。
S505:将所述异动指标数据和所述全局目标数据进行对比,得到第二维度对比结果。
在一种可行的实施方式中,如图5所示,针对活动参与/成功领取人数这一指标,经过环比分析发现指标数据下降出现了异常,并启动异动数据的在不同维度的细化分析流程。在全局数据维度的分析层面,拉取与参与人数/成功领取人数这一指标相关度高的全局指标的数据,即大盘数据中的用户人均付费值呈上升趋势,大盘数据中的活跃用户数也呈上升趋势。经对比,与异动指标活动参与/成功领取人数的变化趋势相反。
S507:根据所述第二维度对比结果和所述第二判据,判断所述异动指标数据是否异常,得到第二判断结果。
在一种可行的实施方式中,如图5所示,经对比,大盘数据中的用户人均付费值、活跃用户数的变化趋势与异动指标活动参与/成功领取人数的变化趋势相反,则判定在全局数据维度,所述异动指标数据的表现为异常。
S107:根据所述第一判断结果和所述第二判断结果确定所述异动指标数据异常时,得到所述当前监控周期内的的异动数据和告警信息。
可以理解的是,为确保告警的准确性,将所述异动指标数据进行了多维度的对比,通过组合异常的方式发现异动问题,避免了单一告警带来的不准确性;其次,指标异常的可解释性更高,比如,单看活动的浏览人数下降可能无法分辨这是否是正常变化,但如果同期的大盘活跃人数和付费比均出现上升,则可以有效推断此时的活动的效果可能不太理想,原因可能是投放渠道较少或者渠道推广效果不佳上,业务层从而能及时收到反馈并做出相应动作解决问题。
在本说明书实施例中,在活动执行过程中对异动数据的监控和分析,不仅可以对当前监控周期的异动数据进行分析,还可以对下一个监控周期的异动数据做出预测。具体地,如图7所示,所述方法还包括:
S701:获取异动预测模型,根据所述异动预测模型判断所述当前周期内的异动数据是否拟合。
可以理解的是,一直以来涉及活动数据的预测效果都不理想,数据的变化与大量的内部因素、外部因素有关,比如玩家的想法和活动推送的时间节点等,在这之中数据的预测效果又受时间节点的影响最为明显,预测的随机性大大增加,使得不同时间点的活动数据预测有着很大的差异,在一些极端的条件下更是毫无内在规律可循,很难确定是一个线性变化系统还是非线性变化系统,这极大的提高了活动数据预测的困难性。因此活动数据的预测需要一个具有不仅可以预测数据线性变化趋势并且能够反映一定的非线性变化趋势的模型,而传统的数理统计方法比如线性回归模型可以提取线性特征,而且神经网络具有有效的非线性的映射的能力。
在本说明书实施例中,为了解决上述问题,基于人工智能领域的深度学习,复合了ARIMA模型和BP神经网络作为异动预测模型。具体地,在所述获取异动预测模型之前还可以包括以下步骤:
S7011:将时间序列预测分析模型和反向传播神经网络组成所述异动预测模型。
具体地,ARIMA模型也称为自回归积分滑动平均模型,是一种能够把原始数据序列变为稳定的数据序列,再根据对算法计算所得的滞后值和现有值进行线性回归所得到的数理统计模型,其预测流程图如图8(1)所示。首先如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,使得最终处理后的数据的自相关函数值和偏相关函数值无显著地异于零。接着,根据时间序列模型的识别规则,建立相应的模型。如若平稳序列的偏相关函数是截尾的而自相关函数是拖尾的,则该序列适合AR(Autoregressive,自回归)模型;若平稳序列的偏相关函数是拖尾的而自相关函数是截尾的,则该序列适合MA(MovingAverage,滑动平均)模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则该序列适合ARMA模型。其次,进行参数估计,检验是否具有统计意义。对模型进行假设检验,检验残差序列是否为白噪声。最后,经过检验和优化后,利用模型进行预测分析。
具体地,BP神经网络模型拓扑结构如图8(2)所示,BP神经网络由输入层(m=1)、隐藏层(m=2)和输出层(m=3)组成,隐藏层可以有多层,图8只是一种示例。正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层,若输出层的实际输出与期望的输出不符,则转入误差的反向传播阶段;反向传播时,将输出以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。
在本说明书实施例中,结合ARIMA模型和BP神经网络组成组成所述异动预测模型,所述异动预测模型的结构如图9所示,使用ARIMA模型与BP神经网络预测活动数据变化趋势,尤其是在短期内预测活动数据数据具有一定的现实参考的意义,能更好地适应活动数据,可以处理各种复杂环境下的线性和非线性数据序列,取的更好的预测准确性,尤其能在部分极端情况下反馈出数据的异动情况,保证系统的稳定性。
S7013:获取历史活动数据,根据所述历史活动数据训练所述时间序列预测分析模型。
在一种可行的实施方式中,以活动参与人数为例,将活动参与人数的数据划分为500个时间数据节点,将前400个数据作为训练数据,后100条数据作为测试数据进行模型的训练,首先针对前400条数据进行ARIMA模型的序列化预测,得到模型ARIMA(2,2,4),前一个2表示自回归项数,后一个2表示使之成为平稳序列所作的差分次数,最后的4表示滑动平均项数。
S7015:获取所述时间序列预测分析模型根据所述历史活动数据得到的预测数据。
S7017:根据所述历史活动数据和所述预测数据得到残差数据,将所述残差数据作为训练数据对所述反向传播神经网络进行训练。
在一种可行的实施方式中,将上述的这400条残差数据作为训练数据输入BP神经网络并保存好参数,通过对100条测试数据进行测试所得的预测效果图如图10所示,可见模型基本上能够拟合实际值的变动曲线。在具体实践中,经过了三轮迭代后,模型的MSE已经趋于平稳并稳定在了一个较小的数值,可见模型预测效果上佳。
为了能够客观的反映ARIMA模型与BP神经网络复合模型的预测效果,可以采用计算三个模型的均方根误差(RootMean Squared Error,RMSE)和平均相对误差(MeanAbsolute Percent Error,MAPE)来对比效果。单一模型和复合模型的两个指标对比效果如表二所示:
表2不同模型性能对比
预测模型 RMSE MAPE(%)
单一ARIMA 0.6232 6.37
单一BP神经网络 0.5918 6.15
复合模型 0.1201 1.33
通过上述三个模型的对比可知,复合模型所预测的RMSE和MAPE的值明显小于另外两种单一的预测模型,因此复合模型的预测的准确度要在一定程度上高于单一的ARIMA模型和BP神经网络模型预测的准确度,复合模型的预测误差降低了许多。此对比的结果表明复合模型利用了ARIMA模型线性趋势预测的优势和BP神经网络非线性趋势的预测的优势,叠加了两个模型的优点,在一定程度上克服了两个模型的缺陷,能反映出活动数据的变化规律,因此此复合模型是一种准确性比较高的活动数据预测方法。
在本说明书的一个实施例中,具体地,所述根据所述异动预测模型判断所述当前周期内的异动数据是否拟合可以为:对所述异动数据进行处理得到异动差值;根据所述异动差值的二阶残差判断是否拟合。
S703:若拟合,则根据所述异动预测模型和所述当前监控周期内的异动数据输出下一监控周期内的异动预测数据和告警信息。
在一种可行的实施方式中,如图9所示,由ARIMA模型获得线性预测值,由BP神经网络预测模型获得非线性预测值,二者叠加则是复合模型对下一监控周期异动数据的预测值,随当前监控周期的异动数据和告警信息一并输出。
本说明书实施例中提供的技术方案在异动数据的预测上,利用了时间序列分析方法与BP神经网络复合的预测模型,能更好地适应活动数据,可以处理各种复杂环境下的线性和非线性数据序列,取的更好的预测准确性,尤其能在部分极端情况下反馈出数据的异动情况。
本发明实施例还提供了一种活动执行过程中的异动分析装置,如图11所示,所述装置可以包括:
数据获取模块1110,用于获取活动当前监控周期内的异动指标数据;
第一判断模块1120,用于获取历史活动数据,根据所述历史活动数据、所述异动指标数据和第一判据得到第一判断结果,所述第一判断结果表征所述当前监控周期内的异动指标数据在历史活动维度的异动表现;
第二判断模块1130,用于获取所述当前监控周期内的全局数据,根据所述全局数据、所述异动指标数据和所述第二判据得到第二判断结果,所述第二判断结果表征所述当前监控周期内的异动指标数据在全局维度的异动表现;
异动分析模块1140,用于根据所述第一判断结果和所述第二判断结果确定所述异动指标数据异常时,得到所述当前监控周期内的的异动数据和告警信息。
在一个实施例中,所述装置模块还可以包括:
异动预测模块1150,用于根据所述异动预测模型和所述当前监控周期内的异动数据输出下一监控周期内的异动预测数据和告警信息。
具体地,本发明实施例公开的一种活动执行过程中的异动分析装置与上述对应的方法实施例均基于相同发明构思。详情请参见方法实施例,在此不再赘述。
本发明实施例提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的一种活动执行过程中的异动分析方法。
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
本发明实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行,即上述计算机设备可以包括移动终端、计算机终端、服务器或者类似的运算装置。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。以运行在服务器上为例,图12是本发明实施例提供的运行一种活动执行过程中的异动分析方法的服务器的硬件结构框图。如图12所示,该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(CentralProcessing Units,CPU)1210(处理器1210可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1230,一个或一个以上存储应用程序1223或数据1222的存储介质1220(例如一个或一个以上海量存储设备)。其中,存储器1230和存储介质1220可以是短暂存储或持久存储。存储在存储介质1220的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1210可以设置为与存储介质1220通信,在服务器1200上执行存储介质1220中的一系列指令操作。服务器1200还可以包括一个或一个以上电源1260,一个或一个以上有线或无线网络接口1250,一个或一个以上输入输出接口1240,和/或,一个或一个以上操作系统1221,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域普通技术人员可以理解,图12所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器1200还可包括比图12中所示更多或者更少的组件,或者具有与图12所示不同的配置。
本发明实施例还提供了一种计算机可读存储介质,所述存储介质可设置于服务器之中以保存用于实现方法实施例中一种活动执行过程中的异动分析方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述方法实施例提供的一种活动执行过程中的异动分析方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
由上述本发明提供的一种活动执行过程中的异动分析方法、装置、设备及介质的实施例可见,
(1)相比在活动结束后进行活动的汇总分析,本发明提供的技术方案实现了在活动执行过程中对异动数据的动态监控和分析,在活动的一个监控周期结束后,进行对当前监控周期数据异动的分析和对下一监控周期的异动预测,使数据的异动分析更具时效性,方便业务层根据异动分析及时调整活动策略;
(2)本发明提供的技术方案结合活动特点设计了多个维度的监控数据指标,并对监控数据进行多个维度的交叉细化对比,能较为全面地反映数据是否产生异动。具体地,通过根据活动自身维度的对比发现异动,结合在历史活动维度和全局维度的异动表现进一步判断当前监控周期的数据是否异常,避免了单一告警带来的不准确性,同时使异动数据的可解释性更高;
(3)本发明提供的技术方案在异动数据的预测上,利用了时间序列分析方法与BP神经网络复合的预测模型,能更好地适应活动数据,可以处理各种复杂环境下的线性和非线性数据序列,取的更好的预测准确性,尤其能在部分极端情况下反馈出数据的异动情况。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种活动执行过程中的异动分析方法,其特征在于,所述方法包括:
获取活动当前监控周期内的异动指标数据;
获取历史活动数据,根据所述历史活动数据、所述异动指标数据和第一判据得到第一判断结果,所述第一判断结果表征所述当前监控周期内的异动指标数据在历史活动维度的异动表现;
获取所述当前监控周期内的全局数据,根据所述全局数据、所述异动指标数据和第二判据得到第二判断结果,所述第二判断结果表征所述当前监控周期内的异动指标数据在全局维度的异动表现;
根据所述第一判断结果和所述第二判断结果确定所述异动指标数据异常时,得到所述当前监控周期内的异动数据和告警信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取异动预测模型,根据所述异动预测模型判断所述当前周期内的异动数据是否拟合;
若拟合,则根据所述异动预测模型和所述当前监控周期内的异动数据输出下一监控周期内的异动预测数据和告警信息。
3.根据权利要求1至2任一项所述的方法,其特征在于,所述获取活动当前监控周期内的异动指标数据包括:
获取所述活动上一监控周期内的监控数据和当前监控周期内的监控数据;
根据预设的多个数据指标,将所述当前监控周期内的监控数据和所述上一监控周期内的监控数据进行环比分析,得到所述多个数据指标的环比结果;
根据所述多个数据指标的环比结果和所述多个数据指标对应的异常判据,确定所述当前监控周期内的异动指标数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述历史活动数据、所述异动指标数据和第一判据得到第一判断结果包括:
根据所述异动指标数据对应的异动指标,获取所述历史活动数据中所述异动指标对应的历史数据;
将所述异动指标数据和所述历史数据进行对比,得到第一维度对比结果;
根据所述第一维度对比结果和所述第一判据,判断所述异动指标数据是否异常,得到第一判断结果。
5.根据权利要求4所述的方法,其特征在于,所述将所述异动指标数据和所述历史数据进行对比,得到第一维度对比结果,包括:
根据预设公式和所述历史数据计算所述异动指标的异动阈值,将所述异动指标数据与所述异动阈值进行对比,得到所述第一维度对比结果;
和/或,根据所述历史数据生成预设格式的数据分布图,利用所述数据分布图将所述异动指标数据和所述历史数据的对比,得到所述第一维度对比结果。
6.根据权利要求1所述的方法,其特征在于,所述根据所述全局数据、所述异动指标数据和第二判据得到第二判断结果包括:
根据所述异动指标数据对应的异动指标,确定与所述异动指标满足预设关联度的全局目标指标;
获取所述全局数据中所述全局目标指标对应的全局目标数据;
将所述异动指标数据和所述全局目标数据进行对比,得到第二维度对比结果;
根据所述第二维度对比结果和所述第二判据,判断所述异动指标数据是否异常,得到第二判断结果。
7.根据权利要求2所述的方法,其特征在于,所述获取异动预测模型包括:
将时间序列预测分析模型和反向传播神经网络组成所述异动预测模型;
获取历史活动数据,根据所述历史活动数据训练所述时间序列预测分析模型;
获取所述时间序列预测分析模型根据所述历史活动数据得到的预测数据;
根据所述历史活动数据和所述预测数据得到残差数据,将所述残差数据作为训练数据对所述反向传播神经网络进行训练。
8.一种活动执行过程中的异动分析装置,其特征在于,所述装置包括:
数据获取模块,用于获取活动当前监控周期内的异动指标数据;
第一判断模块,用于获取历史活动数据,根据所述历史活动数据、所述异动指标数据和第一判据得到第一判断结果,所述第一判断结果表征所述当前监控周期内的异动指标数据在历史活动维度的异动表现;
第二判断模块,用于获取所述当前监控周期内的全局数据,根据所述全局数据、所述异动指标数据和所述第二判据得到第二判断结果,所述第二判断结果表征所述当前监控周期内的异动指标数据在全局维度的异动表现;
异动分析模块,用于根据所述第一判断结果和所述第二判断结果确定所述异动指标数据异常时,得到所述当前监控周期内的异动数据和告警信息。
9.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1至7任一项所述的一种活动执行过程中的异动分析方法。
10.一种计算机设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由所述处理器加载并执行如权利要求1至7任一项所述的一种活动执行过程中的异动分析方法。
CN202011222187.1A 2020-11-05 2020-11-05 一种活动执行过程中的异动分析方法、装置、设备及介质 Pending CN112270574A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011222187.1A CN112270574A (zh) 2020-11-05 2020-11-05 一种活动执行过程中的异动分析方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011222187.1A CN112270574A (zh) 2020-11-05 2020-11-05 一种活动执行过程中的异动分析方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN112270574A true CN112270574A (zh) 2021-01-26

Family

ID=74345625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011222187.1A Pending CN112270574A (zh) 2020-11-05 2020-11-05 一种活动执行过程中的异动分析方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112270574A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115408449A (zh) * 2022-10-28 2022-11-29 支付宝(杭州)信息技术有限公司 一种用户行为的处理方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115408449A (zh) * 2022-10-28 2022-11-29 支付宝(杭州)信息技术有限公司 一种用户行为的处理方法、装置及设备
CN115408449B (zh) * 2022-10-28 2023-03-07 支付宝(杭州)信息技术有限公司 一种用户行为的处理方法、装置及设备

Similar Documents

Publication Publication Date Title
US9015089B2 (en) Identifying and forecasting shifts in the mood of social media users
US8380607B2 (en) Predicting economic trends via network communication mood tracking
CN107451832B (zh) 推送信息的方法和装置
CN111723292B (zh) 基于图神经网络的推荐方法、系统、电子设备及存储介质
Yu et al. Detecting group concept drift from multiple data streams
CN113254833B (zh) 一种基于产教融合的信息推送的方法及服务系统
CN115221396A (zh) 基于人工智能的信息推荐方法、装置及电子设备
da Costa Fortes et al. Ensemble learning in recommender systems: Combining multiple user interactions for ranking personalization
WO2021103401A1 (zh) 数据对象分类方法、装置、计算机设备和存储介质
CN113449260A (zh) 广告点击率预测方法、模型的训练方法、装置和存储介质
CN111340540A (zh) 广告推荐模型的监控方法、推荐方法及装置
CN115280314B (zh) 基于模式的分类
US20240202588A1 (en) Systems and methods for cohort-based predictions in clustered time-series data in order to detect significant rate-of-change events
CN117972206A (zh) 一种基于人工智能的内容推荐系统、电子设备及存储介质
CN113886697A (zh) 基于聚类算法的活动推荐方法、装置、设备及存储介质
CN112270574A (zh) 一种活动执行过程中的异动分析方法、装置、设备及介质
CN113392920A (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
CN111259057A (zh) 用于民生诉求分析的数据处理方法及装置
CN116186395A (zh) 一种资源推荐、模型训练方法及装置、设备及存储介质
CN114266352B (zh) 模型训练结果优化方法、装置、存储介质及设备
Voronov et al. Forecasting popularity of news article by title analyzing with BN-LSTM network
CN115048487A (zh) 基于人工智能的舆情分析方法、装置、计算机设备及介质
Rezaeenour et al. Developing a new hybrid intelligent approach for prediction online news popularity
CN113988152A (zh) 用户类型预测模型训练方法、资源分配方法、介质及装置
Tago et al. Specifying latent factors with a domain model for personal data analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination