CN117541073A - 业务数据处理方法及装置 - Google Patents

业务数据处理方法及装置 Download PDF

Info

Publication number
CN117541073A
CN117541073A CN202311482479.2A CN202311482479A CN117541073A CN 117541073 A CN117541073 A CN 117541073A CN 202311482479 A CN202311482479 A CN 202311482479A CN 117541073 A CN117541073 A CN 117541073A
Authority
CN
China
Prior art keywords
media content
index data
business
index
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311482479.2A
Other languages
English (en)
Inventor
邹奇
贺山
孙超
兰欣迪
李佳蓉
熊运三
常铮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202311482479.2A priority Critical patent/CN117541073A/zh
Publication of CN117541073A publication Critical patent/CN117541073A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Finance (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Accounting & Taxation (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种业务数据处理方法及装置,涉及人工智能技术领域,该方法包括:获取第一预设时间段内第一媒体内容对应的第一业务指标数据、多个第一样本媒体内容对应的第二业务指标数据、第一预设指标权重和第一预设时间权重;基于第一业务指标数据、第二业务指标数据、第一预设指标权重和第一预设时间权重,对第一深度学习模型进行训练,得到第一指标预测模型;获取第三业务指标数据和第四业务指标数据;基于第三业务指标数据、第一指标预测模型和第四业务指标数据,对第一媒体内容进行业务指标变化分析,得到第一变化分析结果。利用本申请提供的技术方案可以提升模型的业务指标数据预测准确性。

Description

业务数据处理方法及装置
技术领域
本申请涉及人工智能技术领域,尤其涉及一种业务数据处理方法及装置。
背景技术
随着人工智能技术和互联网技术的发展,互联网平台中媒体内容在业务运营过程中,往往会结合人工智能技术,对业务干预策略执行前后的访问量、驱动会员付费人数等业务指标的变化进行分析,进而可以更好的进行业务干预策略等业务运营指导;
相关技术中,往往会基于合成控制模型进行业务变化分析,合成控制模型会将控制单元组合成一个合成控制单元,用作反事实预估,并结合预估的业务指标数据和业务干预后实际的业务指标数据确定变化结果,进而可以进行变化的因果归因;但现有的合成控制模型直接将干预发生前的所有时间段的数据都纳入模型,容易引入噪声使模型不稳定,导致模型的业务指标数据预测结果准确性较差,进而也带来业务变化分析结果准确性较差,无法有效进行业务运营指导。
发明内容
本申请提供了一种业务数据处理方法、装置、设备、存储介质及计算机程序产品,可以兼顾不同业务指标数据对模型预测结果影响程度的差异,以及不同时刻的业务指标数据对模型预测结果影响程度的差异,充分学习了时间先后的关系,大大提升模型的业务指标数据预测准确性和业务变化分析结果准确性,进而也可以有效的进行业务运营指导。
一方面,本申请提供了一种业务数据处理方法,所述方法包括:
获取第一预设时间段内待分析的第一媒体内容对应的第一业务指标数据、所述第一预设时间段内多个第一样本媒体内容对应的第二业务指标数据、第一预设指标权重和第一预设时间权重;所述第一预设时间段为对所述第一媒体内容执行业务干预操作之前的时间段;所述第一预设指标权重为不同第一样本媒体内容对应的第二业务指标数据的权重;所述第一预设时间权重为不同时刻的第二业务指标数据的权重;
基于所述第一业务指标数据、所述第二业务指标数据、所述第一预设指标权重和所述第一预设时间权重,对待训练的第一深度学习模型进行训练,得到所述第一媒体内容对应的第一指标预测模型;
获取第二预设时间段内所述多个第一样本媒体内容对应的第三业务指标数据和所述第一媒体内容对应的第四业务指标数据,所述第二预设时间段为对所述第一媒体内容执行业务干预操作的时间段;
基于所述第三业务指标数据、所述第一指标预测模型和所述第四业务指标数据,对所述第一媒体内容进行业务指标变化分析,得到所述第一媒体内容对应的第一变化分析结果。
另一方面提供了一种业务数据处理方法,所述方法包括:
确定待分析的第二媒体内容对应的当前运营时段,所述当前运营时段为是所述第二媒体内容当前所在运营时间在所述第二媒体内容对应总运营周期的相对时间段;
根据所述当前运营时段,确定多个第二样本媒体内容中每个第二样本媒体内容对应的目标运营时段,所述每个第二样本媒体内容对应的目标运营时段为所述每个第二样本媒体内容对应的总运营周期中与所述当前运营时段相对应的时间段,且所述目标运营时段位于对所述第二媒体内容执行业务干预操作之前;
获取所述每个第二样本媒体内容对应的目标运营时段,所述每个第二样本媒体内容对应的第五业务指标数据和所述每个第二样本媒体内容对应的第六业务指标数据;所述第五业务指标数据为目标应用中未安装预设应用的第一样本对象对应的业务指标数据,所述第六业务指标数据为所述目标应用中安装所述预设应用的第二样本对象对应的业务指标数据;
基于所述每个第二样本媒体内容对应第五业务指标数据的第二预设指标权重,对所述每个第二样本媒体内容对应第五业务指标数据进行加权处理,得到所述每个第二样本媒体内容对应第七业务指标数据;
基于所述第六业务指标数据和所述第七业务指标数据,对待训练的第四深度学习模型进行训练,得到所述第二媒体内容对应的第四指标预测模型;
获取第三预设时间段内,所述第二媒体内容对应的第八业务指标数据和所述第二媒体内容对应的第九业务指标数据;所述第八业务指标数据为第一样本对象对应的业务指标数据;所述第九业务指标数据为所述第二样本对象对应的业务指标数据;所述第三预设时间段为对所述第二媒体内容执行业务干预操作的时间段;
基于所述第八业务指标数据、所述第四指标预测模型和所述第九业务指标数据,对所述第二媒体内容进行业务指标变化分析,得到所述第二媒体内容在所述预设应用中的第二变化分析结果。
另一方面提供了一种业务数据处理装置,所述装置包括:
第一样本数据获取模块,被配置为执行获取第一预设时间段内待分析的第一媒体内容对应的第一业务指标数据、所述第一预设时间段内多个第一样本媒体内容对应的第二业务指标数据、第一预设指标权重和第一预设时间权重;所述第一预设时间段为对所述第一媒体内容执行业务干预操作之前的时间段;所述第一预设指标权重为不同第一样本媒体内容对应的第二业务指标数据的权重;所述第一预设时间权重为不同时刻的第二业务指标数据的权重;
第一模型训练模块,被配置为执行基于所述第一业务指标数据、所述第二业务指标数据、所述第一预设指标权重和所述第一预设时间权重,对待训练的第一深度学习模型进行训练,得到所述第一媒体内容对应的第一指标预测模型;
第一数据获取模块,被配置为执行获取第二预设时间段内所述多个第一样本媒体内容对应的第三业务指标数据和所述第一媒体内容对应的第四业务指标数据,所述第二预设时间段为对所述第一媒体内容执行业务干预操作的时间段;
第一变化分析模块,被配置为执行基于所述第三业务指标数据、所述第一指标预测模型和所述第四业务指标数据,对所述第一媒体内容进行业务指标变化分析,得到所述第一媒体内容对应的第一变化分析结果。
另一方面提供了一种业务数据处理装置,所述装置包括:
当前运营时段确定模块,被配置为执行确定待分析的第二媒体内容对应的当前运营时段,所述当前运营时段为是所述第二媒体内容当前所在运营时间在所述第二媒体内容对应总运营周期的相对时间段;
目标运营时段确定模块,被配置为执行根据所述当前运营时段,确定多个第二样本媒体内容中每个第二样本媒体内容对应的目标运营时段,所述每个第二样本媒体内容对应的目标运营时段为所述每个第二样本媒体内容对应的总运营周期中与所述当前运营时段相对应的时间段,且所述目标运营时段位于对所述第二媒体内容执行业务干预操作之前;
第二样本数据获取模块,被配置为执行获取所述每个第二样本媒体内容对应的目标运营时段,所述每个第二样本媒体内容对应的第五业务指标数据和所述每个第二样本媒体内容对应的第六业务指标数据;所述第五业务指标数据为目标应用中未安装预设应用的第一样本对象对应的业务指标数据,所述第六业务指标数据为所述目标应用中安装所述预设应用的第二样本对象对应的业务指标数据;
第一加权处理模块,被配置为执行基于所述每个第二样本媒体内容对应第五业务指标数据的第二预设指标权重,对所述每个第二样本媒体内容对应第五业务指标数据进行加权处理,得到所述每个第二样本媒体内容对应第七业务指标数据;
第四模型训练模块,被配置为执行基于所述第六业务指标数据和所述第七业务指标数据,对待训练的第四深度学习模型进行训练,得到所述第二媒体内容对应的第四指标预测模型;
第二数据获取模块,被配置为执行获取第三预设时间段内,所述第二媒体内容对应的第八业务指标数据和所述第二媒体内容对应的第九业务指标数据;所述第八业务指标数据为第一样本对象对应的业务指标数据;所述第九业务指标数据为所述第二样本对象对应的业务指标数据;所述第三预设时间段为对所述第二媒体内容执行业务干预操作的时间段;
第二变化分析模块,被配置为执行基于所述第八业务指标数据、所述第四指标预测模型和所述第九业务指标数据,对所述第二媒体内容进行业务指标变化分析,得到所述第二媒体内容在所述预设应用中的第二变化分析结果。
另一方面提供了一种电子设备,包括:处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述任一项所述的业务数据处理方法。
另一方面提供了一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述任一业务数据处理方法。
另一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的业务数据处理方法。
本申请提供的业务数据处理方法、装置、设备、存储介质及计算机程序产品,具有如下技术效果:
本申请结合对待分析的第一媒体内容执行业务干预操作之前的时间段内的第一媒体内容对应的第一业务指标数据、以及多个第一样本媒体内容对应的第二业务指标数据,对指标预测模型进行训练过程中,融入了第一预设指标权重和第一预设时间权重,可以使得模型在指标预测过程中,兼顾不同业务指标数据对模型预测结果影响程度的差异,以及不同时刻的业务指标数据对模型预测结果影响程度的差异,充分学习了时间先后的关系,大大提升模型的业务指标数据预测准确性,进而可以保证基于训练好的第一指标预测模型、多个第一样本媒体内容在对第一媒体内容对应的干预时间段(第二预设时间段)内的第三业务指标数据,以及第一媒体内容在干预时段段内的第四业务指标数据进行业务指标变化分析的准确性,进而也可以有效的进行业务运营指导。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本申请实施例提供的一种业务数据处理方法的应用环境的示意图;
图2是本申请实施例提供的一种业务数据处理方法的流程示意图;
图3是本申请实施例提供的一种基于第一业务指标数据和第二业务指标数据,在学习不同时刻的第二业务指标数据对模型预测结果的影响程度的基础上,对待训练的第二深度学习模型进行训练,得到第一媒体内容对应的第二指标预测模型的流程示意图;
图4是本申请实施例提供的一种基于第一业务指标数据和第二业务指标数据,在学习不同第一样本媒体内容对应的第二业务指标数据对模型预测结果的影响程度的基础上,对待训练的第三深度学习模型进行训练,得到第一媒体内容对应的第三指标预测模型的流程示意图;
图5是本申请实施例提供的一种基于第一业务指标数据、第二业务指标数据、第一预设指标权重和第一预设时间权重,对待训练的第一深度学习模型进行训练,得到第一媒体内容对应的第一指标预测模型的流程示意图;
图6是本申请实施例提供的一种进行媒体内容的业务指标变化分析过程示意图;
图7是本申请实施例提供的另一种业务数据处理方法的流程示意图;
图8是本申请实施例提供的一种基于第六业务指标数据和第七业务指标数据,对待训练的第四深度学习模型进行训练,得到第二媒体内容对应的第四指标预测模型的流程示意图;
图9是本申请实施例提供的另一种进行媒体内容的业务指标变化分析过程示意图;
图10是本申请实施例提供的一种业务数据处理装置的结构示意图;
图11是本申请实施例提供的另一种业务数据处理装置的结构示意图;
图12是本申请实施例提供的一种用于业务数据处理的电子设备的框图;
图13是本申请实施例提供的另一种用于业务数据处理的电子设备的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的方案涉及人工智能的深度学习等技术,具体的,可以涉及基于深度学习的指标预测模型生成及指标预测等处理,具体通过如下实施例进行说明:
请参阅图1,图1是本申请实施例提供的一种业务数据处理方法的应用环境的示意图,该应用环境至少可以包括目标应用对应的终端100,目标应用对应的服务器200。
在一个可选的实施例中,目标应用可以为媒体内容的发布应用;终端100可以用于面向用户提供关于媒体内容的业务互动服务。具体的,终端100可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmentedreality,AR)/虚拟现实(virtual reality,VR)设备、智能可穿戴设备、车载终端、智能电视等类型的电子设备;也可以为运行于上述电子设备的软体,例如应用程序、小程序等。本申请实施例中电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。
在一个可选的实施例中,服务器200可以用于为终端100提供后台服务支持,具体的,服务器200还可以用于基于终端的业务互动情况,生成业务指标数据,并结合业务指标数据进行业务数据处理处理,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。
此外,需要说明的是,图1所示的仅仅是一种业务数据处理方法的应用环境,本说明书实施例并不以上述为限,例如为终端100提供后台服务支持,与用于结合业务指标数据进行业务数据处理处理可以在两个服务器实现等。
本说明书实施例中,上述终端100和服务器200可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
以下介绍本申请一种业务数据处理方法,图2是本申请实施例提供的一种业务数据处理方法的流程示意图,该方法可以应用于服务器等设备,如图2所示,上述方法可以包括:
S201:获取第一预设时间段内待分析的第一媒体内容对应的第一业务指标数据、第一预设时间段内多个第一样本媒体内容对应的第二业务指标数据、第一预设指标权重和第一预设时间权重。
在一个具体的实施例中,上述第一预设时间段可以为对第一媒体内容执行业务干预操作之前的时间段;业务干扰操作可以为投放第一媒体内容的推荐媒体内容等操作,可以结合实际应用进行设置。具体的,待分析的第一媒体内容可以为目标应用中任一需要分析业务指标数据在业务干扰操作前后变化情况的媒体内容,具体的,媒体内容可以为视频、图文等内容。具体的,多个第一样本媒体内容可以为目标应用中不进行业务干扰操作的媒体内容;具体的,媒体内容的业务周期可以包括运营期和非运营期(即片库期);具体的,运营期可以为媒体内容正式开播后的宣传期;具体的,非运营期可以为运营期结束之后。具体的,上述多个第一样本媒体内容当前所处业务周期和第一媒体内容当前所处的业务周期均为非运营期。在一个可选的实施例中,上述多个第一样本媒体内容当前所处业务周期和第一媒体内容当前所处的业务周期均为非运营期。
在一个具体的实施例中,第一业务指标数据可以为第一预设时间段内第一媒体内容对应的全部的业务指标数据;任一第一样本媒体内容对应的第二业务指标数据可以为第一预设时间段内该第一样本媒体内容对应的全部的业务指标数据;具体的,业务指标数据可以结合实际应用进行设置,例如访问量、访客量、驱动对象执行指定业务的数据(例如指定业务的参与对象数量)等,具体的,指定业务可以结合实际应用进行设置,例如会员业务等。
在一个具体的实施例中,上述第一预设时间段包含在多个第一样本媒体内容各自开播后的时间段内,也包含在第一媒体内容开播后的时间段内,以保证第一预设时间段内第一媒体内容和多个第二样本媒体内容均有业务指标数据。
在一个可选的实施例中,上述多个第一样本媒体内容在第一预设时间段内的第二业务指标数据可以采用下述方式获取:
获取多个第一原始媒体内容;
对多个第一原始媒体内容和第一媒体内容进行关联分析,得到每个第一原始媒体内容和第一媒体内容间的关联数据;
基于关联数据,从多个第一原始媒体内容中,筛选出多个第一样本媒体内容。
在一个具体的实施例中,上述多个第一原始媒体内容的媒体类型与第一媒体内容的媒体类型相同,具体的,媒体类型的划分可以结合实际应用进行设置,例如爱情电视剧、悬疑电视剧等;在一个具体的实施例中,可以结合媒体内容对应的特征信息进行相应的媒体内容间的关联分析;相应的,每个第一原始媒体内容和第一媒体内容间的关联数据可以表征该第一原始媒体内容和第一媒体内容间的相似程度。
在一个具体的实施例中,可以结合实际应用需求,预先设置第一样本媒体内容的数量,相应的,结合关联数据,选取相似程度较高相应数量(第一样本媒体内容的数量)个第一原始媒体内容为多个第一样本媒体内容。
上述实施例中,从与第一媒体内容的媒体类型相同的多个第一原始媒体内容中,结合多个第一原始媒体内容分别与第一媒体内容的关联数据,筛选出待分析的第一媒体内容对应训练样本,可以大大提升训练样本的有效性,进而可以也可以更好的保证后续模型的预测准确性。
在一个具体的实施例中,上述第一预设指标权重可以为不同第一样本媒体内容对应的第二业务指标数据的权重。上述第一预设时间权重可以为不同时刻的第二业务指标数据的权重。
在一个可选的实施例中,上述方法还可以包括:
基于第一业务指标数据和第二业务指标数据,在学习不同时刻的第二业务指标数据对模型预测结果的影响程度的基础上,对待训练的第二深度学习模型进行训练,得到第一媒体内容对应的第二指标预测模型;
基于第一业务指标数据和第二业务指标数据,在学习不同第二业务指标数据对模型预测结果的影响程度的基础上,对待训练的第三深度学习模型进行训练,得到第一媒体内容对应的第三指标预测模型;
在一个具体的实施例中,上述第一预设时间权重为第二指标预测模型中第一模型参数,上述第一模型参数表征输入的不同时刻的业务指标数据对第二指标预测模型的模型预测结果的影响程度。
在一个可选的实施例中,如图3所示,上述基于第一业务指标数据和第二业务指标数据,在学习不同时刻的第二业务指标数据对模型预测结果的影响程度的基础上,对待训练的第二深度学习模型进行训练,得到第一媒体内容对应的第二指标预测模型可以包括:
S301:将第二业务指标数据输入第二深度学习模型中,并在学习不同时刻的第二业务指标数据对模型预测结果的影响程度的基础上,进行指标预测,得到第一媒体内容对应的第一预测指标数据;
S303:根据第一预测指标数据和第一业务指标数据,确定第二深度学习模型对应的第二预测损失;
S305:基于第二预测损失,对第二深度学习模型进行训练,得到第二指标预测模型。
在一个具体的实施例中,待训练的第二深度学习模型的模型结构可以结合实际应用进行设置,可选的,在第二深度学习模型中可以结合下述公式进行指标预测:
其中,表示第一预测指标数据;/>和/>均为第一深度学习模型中的模型参数,可以在模型训练中进行调整;且模型训练结束时的/>为上述第一模型参数;Yit第i个第一样本媒体内容在t时刻的业务指标数据(第二业务指标数据),t=1至t=T-1间的时间段为上述第一预设时间段。
在一个具体的实施例中,第一预测指标数据可以为第二深度学习模型预测的第一预设时间段内未对第一媒体内容执行业务干预操作情况下,第一媒体内容对应的业务指标数据。具体的,可以将第一预测指标数据和第一业务指标数据代入第二预设损失函数,来确定第二预测损失;第二预测损失可以表征当前的第二深度学习模型的业务指标数据预测性能。具体的,第二预设损失函数可以结合实际应用进行设置,例如L2正则损失函数等。
在一个具体的实施例中,上述基于第二预测损失,对第二深度学习模型进行训练,得到第二指标预测模型可以包括结合梯度下降法和第二预设损失函数更新第二深度学习模型中的模型参数,并基于更新模型参数后的第二深度学习模型,重复上述将第二业务指标数据输入第二深度学习模型中,并在学习不同时刻的第二业务指标数据对模型预测结果的影响程度的基础上,进行指标预测,得到第一媒体内容对应的第一预测指标数据至更新第二深度学习模型中的模型参数的训练迭代步骤,直至满足预设训练收敛条件,并将满足预设训练收敛条件时的第二深度学习模型作为第二指标预测模型。
在一个具体的实施例中,满足预设训练收敛条件可以结合实际应用进行设置,例如训练迭代步骤的执行次数达到预设次数,第二预测损失小于指定阈值等,具体可以结合训练速度和模型精度需求进行设置。
在一个具体的实施例中,上述预设指标权重为第三指标预测模型中第二模型参数,第二模型参数表征输入的不同业务指标数据对第三指标预测模型的模型预测结果的影响程度。
在一个可选的实施例中,如图4所示,上述基于第一业务指标数据和第二业务指标数据,在学习不同第一样本媒体内容对应的第二业务指标数据对模型预测结果的影响程度的基础上,对待训练的第三深度学习模型进行训练,得到第一媒体内容对应的第三指标预测模型包括:
S401:将第二业务指标数据输入第三深度学习模型中,并在学习不同第一样本媒体内容对应的第二业务指标数据对模型预测结果的影响程度的基础上,进行指标预测,得到第一媒体内容对应的第二预测指标数据;
S403:根据第二预测指标数据和第一业务指标数据,确定第三深度学习模型对应的第三预测损失;
S405:基于第三预测损失,对第二深度学习模型进行训练,得到第三指标预测模型。
在一个具体的实施例中,待训练的第三深度学习模型的模型结构可以结合实际应用进行设置,可选的,在第三深度学习模型中可以结合下述公式进行指标预测:
其中,表示第二预测指标数据;/>和/>均为第三深度学习模型中的模型参数,可以在模型训练中进行调整;且模型训练结束时的/>为上述第二模型参数;Yit第i个第一样本媒体内容在t时刻的业务指标数据(第二业务指标数据),N为多个第一样本媒体内容和第一媒体内容的总媒体内容数,前N-1个媒体内容为多个第一样本媒体内容,第N个媒体内容为第一媒体内容。
在一个具体的实施例中,第二预测指标数据可以为第三深度学习模型预测的第一预设时间段内未对第一媒体内容执行业务干预操作情况下,第一媒体内容对应的业务指标数据。具体的,可以将第二预测指标数据和第一业务指标数据代入第三预设损失函数,来确定第三预测损失;第三预测损失可以表征当前的第三深度学习模型的业务指标数据预测性能。具体的,第三预设损失函数可以结合实际应用进行设置,例如L2正则损失函数等。
在一个具体的实施例中,上述基于第三预测损失,对第二深度学习模型进行训练,得到第三指标预测模型的具体细化,可以参见上述基于第二预测损失,对第二深度学习模型进行训练,得到第二指标预测模型的具体细化,在此不再赘述。
S203:基于第一业务指标数据、第二业务指标数据、第一预设指标权重和第一预设时间权重,对待训练的第一深度学习模型进行训练,得到第一媒体内容对应的第一指标预测模型;
在一个具体的实施例中,待训练的第一深度学习模型的模型结构可以结合实际应用进行设置。
在一个可选的实施例中,如图5所示,上述基于第一业务指标数据、第二业务指标数据、第一预设指标权重和第一预设时间权重,对待训练的第一深度学习模型进行训练,得到第一媒体内容对应的第一指标预测模型可以包括:
S501:将第二业务指标数据输入第一深度学习模型进行指标预测,得到第一媒体内容对应的第三预测指标数据;
S503:确定第一预设损失函数,第一预设损失函数包括预设差异项;
S505:将第三预测指标数据和第一业务指标数据代入第一预设损失函数中的预设差异项,并将第一预设指标权重和第一预设时间权重作为预设差异项的权重,得到第一深度学习模型对应的第一预测损失;
S507:基于第一预测损失,对第一深度学习模型进行训练,得到第一指标预测模型。
在一个具体的实施例中,在第一深度学习模型中可以结合下述公式进行指标预测:
其中,表示第三预测指标数据;/>和/>均为第一深度学习模型中的模型参数,可以在模型训练中进行调整;Yit第i个第一样本媒体内容在t时刻的业务指标数据(第二业务指标数据),N为多个第一样本媒体内容和第一媒体内容的总媒体内容数,前N-1个媒体内容为多个第一样本媒体内容,第N个媒体内容为第一媒体内容;t=1至t=T-1间的时间段为上述第一预设时间段。
在一个具体的实施例中,第三预测指标数据可以为第一深度学习模型预测的第一预设时间段内未对第一媒体内容执行业务干预操作情况下,第一媒体内容对应的业务指标数据。具体的,第一预设损失函数可以结合实际应用进行设置,例如L2正则损失函数等。可选的,以L2正则损失函数为例,预设差异项可以为L2正则损失函数中预测值(第三预测指标数据)和实际值(第一业务指标数据)间差的平方项;具体的,将第三预测指标数据和第一业务指标数据代入第一预设损失函数中的预设差异项,并将第一预设指标权重和第一预设时间权重作为预设差异项的权重(即将预设差异项第一预设指标权重,且乘以第一预设时间权重),可以保证模型训练过程中,进行不同第一样本媒体内容对应的第二业务指标数据的权重;以及不同时刻的第二业务指标数据的权重学习。
在一个具体的实施例中,上述基于第一预测损失,对第一深度学习模型进行训练,得到第一指标预测模型的具体细化,可以参见上述基于第二预测损失,对第二深度学习模型进行训练,得到第二指标预测模型的具体细化,在此不再赘述。
上述实施例中,在第一指标预测模型训练过程中,融合了第一预设指标权重和第一预设时间权重,可以使得模型在进行指标预测过程中,兼顾不同业务指标数据对模型预测结果影响程度的差异,以及不同时刻的业务指标数据对模型预测结果影响程度的差异,充分学习了时间先后的关系,大大提升模型的业务指标数据预测准确性和业务变化分析结果准确性。
S205:获取第二预设时间段内多个第一样本媒体内容对应的第三业务指标数据和第一媒体内容对应的第四业务指标数据。
在一个具体的实施例中,上述第二预设时间段可以为对第一媒体内容执行业务干预操作的时间段。具体的,第二预设时间段内多个第一样本媒体内容不执行业务干预操作。且上述第二预设时间段包含在多个第一样本媒体内容各自开播后的时间段内,也包含在第一媒体内容开播后的时间段内,以保证第二预设时间段内第一媒体内容和多个第二样本媒体内容均有业务指标数据。
在一个具体的实施例中,任一第一样本媒体内容对应的第三业务指标数据可以为第二预设时间段内该第一样本媒体内容对应的全部的业务指标数据;第四业务指标数据可以为第二预设时间段内(在业务干扰操作执行情况下),第一媒体内容对应的全部的业务指标数据。
S207:基于第三业务指标数据、第一指标预测模型和第四业务指标数据,对第一媒体内容进行业务指标变化分析,得到第一媒体内容对应的第一变化分析结果。
在一个具体的实施例中,第一变化分析结果可以为业务干预操作后,第一媒体内容对应的业务指标增量。
在一个具体的实施例中,上述基于第三业务指标数据、第一指标预测模型和第四业务指标数据,对第一媒体内容进行业务指标变化分析,得到第一媒体内容对应的第一变化分析结果可以包括:
将第三业务指标数据输入第一指标预测模型进行指标预测,得到第一媒体内容对应的第四预测指标数据;
根据第四预测指标数据和第四业务指标数据间的差异,确定第一变化分析结果。
在一个具体的实施例中,第四预测指标数据可以为第一指标预测模型预测的第二预设时间段内,若未对第一媒体内容执行业务干预操作,该第一媒体内容对应的业务指标数据。具体的,将第三业务指标数据输入第一指标预测模型进行指标预测,得到第一媒体内容对应的第四预测指标数据的具体细化,可以参见上述在第三深度学习模型中进行指标预测的具体细化,在此不再赘述。
在一个具体的实施例中,可以将第四业务指标数据减去第四预测指标数据作为第一变化分析结果。
上述实施例中,将目标应用中不进行业务干扰操作的媒体内容(多个第一样本媒体内容)对应的业务指标数据为模型的输入,进行受业务干扰操作影响的第一媒体内容的反事实预测(即第一媒体内容未受业务干扰操作影响情况下的指标预测),可以有效保证模型输入数据未被业务干扰操作影响,进而实现媒体内容未受业务干扰操作影响情况下的预测。
在一个具体的实施例中,如图6所示,图6是本申请实施例提供的一种进行媒体内容的业务指标变化分析过程示意图;其中,横坐标表示时间,纵坐标表示业务指标数据;干预时间可以为执行业务干预操作的开始时间;T0对应的时间段可以为第一预设时间段,T1对应的时间段可以为第二预设时间段;601对应的曲线为多个第一样本媒体内容对应的第二业务指标数据;602对应的曲线可以为模型预测的第一媒体内容的业务指标数据(第三预测指标数据和第四预测指标数据);603对应的曲线可以为第四业务指标数据。
在一个具体的实施例中,在得到第一媒体内容对应的第一变化分析结果之后,可以基于第一变化分析结果进行第一媒体内容的投放处理,具体的,可以对有正向增量的媒体内容进行对应的推荐媒体内容的投放生产指导,对负向增量的媒体内容可以采用不投放推荐媒体内容等处理。
由以上本说明书实施例提供的技术方案可见,本说明书结合对待分析的第一媒体内容执行业务干预操作之前的时间段内的第一媒体内容对应的第一业务指标数据、以及多个第一样本媒体内容对应的第二业务指标数据,对指标预测模型进行训练过程中,融入了第一预设指标权重和第一预设时间权重,可以使得模型在指标预测过程中,兼顾不同业务指标数据对模型预测结果影响程度的差异,以及不同时刻的业务指标数据对模型预测结果影响程度的差异,充分学习了时间先后的关系,大大提升模型的业务指标数据预测准确性,进而可以保证基于训练好的第一指标预测模型、多个第一样本媒体内容在对第一媒体内容对应的干预时间段(第二预设时间段)内的第三业务指标数据,以及第一媒体内容在干预时段段内的第四业务指标数据进行业务指标变化分析的准确性,进而也可以有效的进行业务运营指导。
以下介绍本申请另一种业务数据处理方法,图7是本申请实施例提供的另一种业务数据处理方法的流程示意图,该方法可以应用于服务器等设备,如图7所示,上述方法可以包括:
S701:确定待分析的第二媒体内容对应的当前运营时段。
在一个具体的实施例中,待分析的第二媒体内容可以为目标应用中任一需要分析业务指标数据在业务干扰操作前后变化情况的媒体内容,第二媒体内容可以为当前的业务周期为运营期的媒体内容。上述当前运营时段为是第二媒体内容当前所在运营时间在第二媒体内容对应总运营周期的相对时间段;在一个具体的实施例中,假设第二媒体内容对应的总运营周期为10天,当前所在运营时间为总运营周期中的第1天;相应的,当前运行时段可以为总运营周期的第一个1/10天;若当前所在运营时间为总运营周期中的第2天;相应的,当前运行时段可以为总运营周期的第二个1/10天。
S703:根据当前运营时段,确定多个第二样本媒体内容中每个第二样本媒体内容对应的目标运营时段。
在一个具体的实施例中,上述每个第二样本媒体内容对应的目标运营时段为每个第二样本媒体内容对应的总运营周期中与当前运营时段相对应的时间段;在一个具体的实施例中,第二媒体内容对应的总运营周期为10天,某一第二样本媒体内容对应的总运营周期为20天;第二媒体内容当前所在运营时间为总运营周期中的第2天,即第二媒体内容对应的当前运行时段可以为总运营周期的第二个1/10天;相应的,20天的1/10为2天(20/10),且20天第二个1/10天为第3和第4天,相应的,该第二样本媒体内容对应的目标运营时段为运营期的第3和第4天。可选的,某一第二样本媒体内容对应的总运营周期与第二媒体内容对应的总运营周期的比值非整数的情况下,可以向下取整,例如第二媒体内容对应的总运营周期为12天,某一第二样本媒体内容对应的总运营周期为20天,第二媒体内容当前所在运营时间为总运营周期中的第2天,即第二媒体内容对应的当前运行时段可以为总运营周期的第二个1/12天;相应的,20天的1/12可以为1天(20/12,向下取整),且20天第二个1/12天为第2天,相应的,该第二样本媒体内容对应的目标运营时段为运营期的第2天。
在一个具体的实施例中,每个第二样本媒体内容对应的目标运营时段均位于对第二媒体内容执行业务干预操作之前。多个第一样本媒体内容可以为目标应用中不进行业务干扰操作的媒体内容,且多个第二样本媒体内容当前所处业务周期和第二媒体内容当前所处的业务周期均为运营期。
S705:获取每个第二样本媒体内容对应的目标运营时段,每个第二样本媒体内容对应的第五业务指标数据和每个第二样本媒体内容对应的第六业务指标数据;
在一个具体的实施例中,上述第五业务指标数据可以为(在对应的目标运营时段)目标应用中未安装预设应用的第一样本对象对应的业务指标数据,第六业务指标数据为(在对应的目标运营时段)目标应用中安装预设应用的第二样本对象对应的业务指标数据。
在一个具体的实施例中,预设应用可以为能够第二媒体内容对应推荐媒体内容的应用;可选的,假设目标应用为长视频应用(发布长视频的应用),预设应用为短视频应用,且第二媒体内容为长视频应用中某一处于运营期的长视频;相应的,可以在短视频应用发布该处于运营期的长视频对应推荐短视频的方式进行长视频的宣传。进一步的,为了在不从短视频应用(预设应用)获取业务指标数据的情况下,进行预设应用中待分析的第二媒体内容在业务干预操作前后的变化情况分析,可以结合每个第二样本媒体内容对应的全部业务指标数据(在目标应用中的业务指标数据)中第一样本对象对应的业务指标数据来进行每个第二样本媒体内容对应的全部业务指标数据中第二样本对象对应的业务指标数据的预测。
在一个可选的实施例中,上述多个第二样本媒体内容的媒体类型与第二媒体内容的媒体类型相同;上述方法还包括:
获取预设应用对应的安装信息;
根据安装信息,从多个第二样本媒体内容对应的业务对象中,确定未安装预设应用的多个初始样本对象和安装预设应用的第二样本对象;
获取多个初始样本对象在目标应用中的活跃度;
基于活跃度,从多个初始样本对象中确定第一样本对象,第一样本对象包括具有不同活跃度等级的多个样本对象。
在一个具体的实施例中,预设应用对应的安装信息可以为安装预设应用的对象(用户)的标识信息,且该标识信息可以为预设应用和目标应用中对象的通用标识信息;
在一个具体的实施例中,任一第二样本媒体内容对应的业务对象可以为在对应的目标运营时段内,任一第二样本媒体内容对应全部的业务指标数据涉及的对象(用户账号);例如业务指标数据为访客量,相应的,业务对象可以为在对应的目标运营时段内,第二样本媒体内容对应的全部访问对象。
在一个具体的实施例中,上述根据安装信息,从多个第二样本媒体内容对应的业务对象中,确定未安装预设应用的多个初始样本对象和安装预设应用的第二样本对象可以包括:将多个第二样本媒体内容对应的业务对象中未安装预设应用的全部对象作为多个初始样本对象;以及将个第二样本媒体内容对应的业务对象中安装预设应用的全部对象作为第二样本对象。
在一个具体的实施例中,每个初始样本对象在目标应用中的活跃度可以表征该初始样本对象在目标应用中的活跃程度,可选的,活跃度可以结合实际应用进行设置,例如日均访问次数(访问目标应用的次数)或月均访问次数等。
在一个具体的实施例中,活跃度等级的划分可以结合实际应用进行设置,具体可以结合活跃度对应数值区间进行设置,例如活跃度在[0,10]为一个等级,(10,30]为另一个等级,并结合实际需求依次设置指定数量个活跃度等级。可选的,每个活跃度等级可以选择一个样本对象作为第一样本对象。
上述实施例中,结合预设应用对应的安装信息,从与待分析的第二媒体内容媒体类型相同的多个第二样本媒体内容对应业务对象中,确定出未安装预设应用的多个初始样本对象和安装预设应用的第二样本对象;可以有效保证训练样本与待分析媒体内容间的匹配度,且结合多个初始样本对象在目标应用中的活跃度,从多个初始样本对象中,筛选出具有不同活跃度等级的多个样本对象,作为第一样本对象,可以保证样本数据的全面性,进而可以从业务感知维度,更好的学习到不同业务指标数据对象模型预测结果的不同影响程度,大大提升模型的稳定性和预测精准性。
S707:基于每个第二样本媒体内容对应第五业务指标数据的第二预设指标权重,对每个第二样本媒体内容对应第五业务指标数据进行加权处理,得到每个第二样本媒体内容对应第七业务指标数据;
在一个具体的实施例中,第二预设指标权重可以为不同第二样本媒体内容对应第五业务指标数据的权重。在一个可选的实施例中,第二预设指标权重包括第一指标权重、第二指标权重和第三指标权重中的至少一个,第一指标权重、第二指标权重和第三指标权重采用下述方式获取:
获取每个第二样本媒体内容对应累计业务指标数据的第一数量级和第二媒体内容对应累计业务指标数据的第二数量级;
根据每个第二样本媒体内容对应的第一数量级和第二数量级,确定每个第二样本媒体内容对应的第一指标权重;
获取每个第二样本媒体内容对应业务对象的第一对象特征信息和第二媒体内容对应业务对象的第二对象特征信息;
根据第一对象特征信息和每个第二样本媒体内容对应第二对象特征信息间关联度,确定每个第二样本媒体内容对应的第二指标权重;
获取第二媒体内容上线预设时长后的第一当前指标数据和每个第二样本媒体内容上线预设时长后的第二当前指标数据;
根据第一当前指标数据和每个第二样本媒体内容对应的第二当前指标数据间关联度,确定每个第二样本媒体内容对应的第三指标权重。
在一个具体的实施例中,每个第二样本媒体内容对应累计业务指标数据可以为每个第二样本媒体内容对应的全部的业务指标数据;相应的,每个第二样本媒体内容对应的第一数量级可以为该第二样本媒体内容对应的累计业务指标数据的量级。例如累计业务指标数据为20(2*101),相应的量级为1,例如累计业务指标数据为100(2*102),相应的量级为2。具体的,第二媒体内容对应累计业务指标数据可以为第二媒体内容对应的全部的业务指标数据;第二数量级可以为第二媒体内容对应累计业务指标数据的量级。
在一个具体的实施例中,上述根据每个第二样本媒体内容对应的第一数量级和第二数量级,确定每个第二样本媒体内容对应的第一指标权重可以包括将每个第二样本媒体内容对应的第一数量级和第二数量级间差值的绝对值的倒数,作为每个第二样本媒体内容对应的第一指标权重。
在一个具体的实施例中,每个第二样本媒体内容对应业务对象的第一对象特征信息可以为该第二样本媒体内容对应每个业务对象的对象特征信息;第二对象特征信息可以为第二媒体内容对应业务对象的对象特征信息。具体的,对象特征信息可以为账号基础信息和交互操作信息的表征信息。
在一个具体的实施例中,上述根据第一对象特征信息和每个第二样本媒体内容对应第二对象特征信息间关联度,确定每个第二样本媒体内容对应的第二指标权重可以包括:将第一对象特征信息和每个第二样本媒体内容对应第二对象特征信息间关联度的倒数作为每个第二样本媒体内容对应的第二指标权重;具体的,可以第一对象特征信息和每个第二样本媒体内容对应第二对象特征信息间相似度作为第一对象特征信息和每个第二样本媒体内容对应第二对象特征信息间关联度。
在一个具体的实施例中,预设时长可以结合实际应用进行设置,任一媒体内容上线预设时长,即该媒体内容正式开播预设时长。第一当前指标数据可以为第二媒体内容上线预设时长的情况下,所对应的业务指标数据;任一第二样本媒体内容上线预设时长后的第二当前指标数据可以为该第二样本媒体内容上线预设时长的情况下,所对应的业务指标数据。
在一个具体的实施例中,根据第一当前指标数据和每个第二样本媒体内容对应的第二当前指标数据间关联度,确定每个第二样本媒体内容对应的第三指标权重可以包括:将第一当前指标数据和每个第二样本媒体内容对应的第二当前指标数据间关联度的倒数,作为每个第二样本媒体内容对应的第三指标权重。
在一个具体的实施例中,可以通过两个指标数据间的相似度,例如余弦距离、曼哈顿距离等作为两个指标数据间关联度。
上述实施例中,结合样本媒体内容和待分析媒体内容各自的累计业务指标数据的数量级,来确定第一指标权重,可以便于后续模型指标预测过程中,学习到样本媒体内容和待分析媒体内容的累计业务指标数据的数量级间的差异,并结合样本媒体内容和待分析媒体内容对应业务对象的对象特征信息间关联度,来确定每个样本媒体内容对应的第二指标权重,可以便于后续模型指标预测过程中,学习到样本媒体内容和待分析媒体内容对应业务对象的对象特征信息间的差异;并结合样本媒体内容和待分析媒体内容各自上线预设时长后的当前指标数据间的关联度,来确定每个样本媒体内容对应的第三指标权重,可以便于后续模型指标预测过程中,学习到样本媒体内容和待分析媒体内容各自上线预设时长后的当前指标数据间的差异,进而可以从数据表现维度,更好的学习到不同业务指标数据对象模型预测结果的不同影响程度,大大提升模型的预测精准性。
在一个具体的实施例中,可以将在第二预设指标权重包括第一指标权重、第二指标权重和第三指标权重中的任意一个的情况下,可以将每个第二样本媒体内容对应的指标权重与该第二样本媒体内容对应的第五业务指标数据间的乘积,作为该第二样本媒体内容对应的第七业务指标数据。在第二预设指标权重包括第一指标权重、第二指标权重和第三指标权重中的多个的情况下,可以将每个第二样本媒体内容对应的多个指标权重均与该第二样本媒体内容对应的第五业务指标数据相乘后的乘积,作为该第二样本媒体内容对应的第七业务指标数据。
S709:基于第六业务指标数据和第七业务指标数据,对待训练的第四深度学习模型进行训练,得到第二媒体内容对应的第四指标预测模型;
在一个具体的实施例中,待训练的第四深度学习模型的模型结构可以结合实际应用进行设置。
在一个具体的实施例中,如图8所示,上述基于第六业务指标数据和第七业务指标数据,对待训练的第四深度学习模型进行训练,得到第二媒体内容对应的第四指标预测模型可以包括:
S801:将第七业务指标数据输入第四深度学习模型进行指标预测,得到第二媒体内容对应的第五预测指标数据;
S803:根据第五预测指标数据和第六业务指标数据,确定第四深度学习模型对应的第四预测损失;
S805:基于第四预测损失,对第四深度学习模型进行训练,得到第四指标预测模型。
在一个具体的实施例中,在第四深度学习模型中可以结合下述公式进行指标预测:
其中,表示第五预测指标数据;/>和/>均为第四深度学习模型中的模型参数,可以在模型训练中进行调整;Ynoapp_i_T第i个第二样本媒体内容在T时刻对应的第七业务指标数据,N为多个第二样本媒体内容的总媒体内容数。
在一个具体的实施例中,第五预测指标数据可以为第四深度学习模型预测的目标运营时段内第二样本媒体内容对应的业务指标数据中第二样本对象对应的业务指标数据。具体的,可以将第五预测指标数据和第六业务指标数据代入第四预设损失函数,来确定第四预测损失;第四预测损失可以表征当前的第四深度学习模型的业务指标数据预测性能。具体的,第四预设损失函数可以结合实际应用进行设置,例如L2正则损失函数等。
在一个具体的实施例中,上述基于第四预测损失,对第四深度学习模型进行训练,得到第四指标预测模型的具体细化,可以参见上述基于第二预测损失,对第二深度学习模型进行训练,得到第二指标预测模型的具体细化,在此不再赘述。
上述实施例中,结合目标应用中未安装预设应用的对象对应的业务指标数据,来训练可以预测目标应用中安装了预设应用的对象对应的业务指标数据的指标预测模型,进而可以在无需获取预设应用中业务指标数据的情况下,就实现对预设应用中执行业务干扰操作,对媒体内容指标变化的分析。
S711:获取第三预设时间段内,第二媒体内容对应的第八业务指标数据和第二媒体内容对应的第九业务指标数据;
在一个具体的实施例中,第八业务指标数据为第一样本对象对应的业务指标数据;第九业务指标数据为第二样本对象对应的业务指标数据;上述第三预设时间段可以为对第二媒体内容执行业务干预操作的时间段;
在一个具体的实施例中,由于第一样本对象未安装预设应用,故即使在第三预设时间段内对第二媒体内容进行了业务干扰操作,第二媒体内容对应的业务指标数据中第一样本对象对应的业务指标数据(第八业务指标数据)也依然是未进行业务干扰操作下的数据;但第一样本对象安装了预设应用,故第二媒体内容对应的业务指标数据中第二样本对象对应的业务指标数据(第九业务指标数据)是进行业务干扰操作下的数据。
S713:基于第八业务指标数据、第四指标预测模型和第九业务指标数据,对第二媒体内容进行业务指标变化分析,得到第二媒体内容在预设应用中的第二变化分析结果。
在一个具体的实施例中,第二变化分析结果可以为业务干预操作后,第二媒体内容对应的业务指标增量。
在一个具体的实施例中,上述基于第八业务指标数据、第四指标预测模型和第九业务指标数据,对第二媒体内容进行业务指标变化分析,得到第二媒体内容在预设应用中的第二变化分析结果可以包括:
将第八业务指标数据输入第四指标预测模型进行指标预测,得到第二媒体内容对应的第六预测指标数据;
根据第六预测指标数据和第九业务指标数据间的差异,确定第二变化分析结果。
在一个具体的实施例中,第四预测指标数据可以为第四指标预测模型预测的第三预设时间段,若未对第二媒体内容执行业务干预操作,该第一媒体内容对应的业务指标数据中第二样本对象对应的业务指标数据。具体的,将第八业务指标数据输入第四指标预测模型进行指标预测,得到第二媒体内容对应的第六预测指标数据的具体细化,可以参见上述在第四深度学习模型中进行指标预测的具体细化,在此不再赘述。
在一个具体的实施例中,可以将第九业务指标数据减去第六预测指标数据作为第二变化分析结果。
在一个可选的实施例中,可以基于预设应用对应的变化分析结果,进行全网多个应用对应的变化分析结果拓补,具体的,第二变化分析结果为业务干预操作后,预设应用对应的业务指标增量;相应的,上述方法还包括:
获取第二媒体内容对应的来源问卷信息和目标应用中第二媒体内容对应的业务指标总量;
基于来源问卷信息,确定每个应用对应的第一对象占比信息;
基于预设应用对应的业务指标增量、业务指标总量和第一对象占比信息,确定每个其他应用对应的业务指标增量;每个其他应用为多个应用中除预设应用以外的每个应用。第二媒体内容对应的业务指标总量可以为第二媒体内容对应全部业务指标数据,例如以访问量为业务指标数据,业务指标总量可以为第二媒体内容的总访问量。
在一个具体的实施例中,该来源问卷信息表征第二媒体内容对应的业务对象的来源应用,来源应用包括多个应用,多个应用包括预设应用;每个应用对应的第一对象占比信息可以每个应用对应的填写对象占来源问卷信息对应全部填写对象的比例。任一应用对应的填写对象可以为填写的应用来源为该应用的业务对象。
在实际应用中,填写问卷的用户和实际进行媒体内容访问等业务交互的用户(业务对象)之间存在一定差异,因此,为了更准确地反映媒体内容对应业务对象的媒体倾向,需要对来源问卷信息进行纠偏处理。
在一个可选的实施例中,上述方法还包括:
获取第二媒体内容对应的多个业务对象的对象特征信息;
将对象特征信息输入待训练的第五深度学习模型进行问卷填写预测,得到多个业务对象各自对应的第一填写预测结果;
基于第一填写预测结果,对第五深度学习模型进行训练,得到问卷填写预测模型。
在一个具体的实施例中,上述多个业务对象包括多个正样本对象和多个负样本对象,多个正样本对象为多个业务对象中填写来源问卷信息的业务对象;多个负样本对象为多个业务对象中未填写来源问卷信息的业务对象。
在一个具体的实施例中,第五深度学习模型的模型结构可以结合实际应用进行设置。具体的,第一填写预测结果可以为第五深度学习模型预测的多个业务对象各自填写来源问卷信息的概率;具体的,多个业务对象中正样本对象对应的预设填写结果(即填写来源问卷信息的概率)可以为1,多个业务对象中负样本对象对应的预设填写结果(即填写来源问卷信息的概率)可以为0;相应的,上述基于第一填写预测结果,对第五深度学习模型进行训练,得到问卷填写预测模型可以包括基于第一填写预测结果和多个业务对象对应的预设填写结果,确定第五深度学习模型对应的第五预测损失;基于第五预测损失对第五深度学习模型进行训练,得到问卷填写预测模型。
在一个具体的实施例中,可以将第一填写预测结果和预设填写结果代入第五预设损失函数,来确定第四预测损失;第五预测损失可以表征当前的第五深度学习模型的问卷填写概率的预测性能。具体的,第五预设损失函数可以结合实际应用进行设置,例如L2正则损失函数、L1正则损失函数等。
在一个具体的实施例中,上述基于第五预测损失对第五深度学习模型进行训练,得到问卷填写预测模型的具体细化,可以参见上述基于第二预测损失,对第二深度学习模型进行训练,得到第二指标预测模型的具体细化,在此不再赘述。
相应的,上述方法还可以包括:
根据来源问卷信息,确定每个应用对应的填写对象;
将填写对象对应的对象特征信息输入问卷填写预测模型进行问卷填写预测,得到填写对象对应的第二填写预测结果;
基于每个应用对应的填写对象对应的第二填写预测结果的倒数,对每个应用对应填写对象的填写结果进行加权处理,得到每个应用的加权填写结果;
根据加权填写结果,确定每个应用对应的第二对象占比信息;
相应的,上述基于预设应用对应的业务指标增量、业务指标总量和第一对象占比信息,确定每个其他应用对应的业务指标增量包括:
基于预设应用对应的业务指标增量、业务指标总量和第二对象占比信息,确定每个其他应用对应的业务指标增量。
在一个具体的实施例中,第二填写预测结果可以为问卷填写预测模型预测的每个填写对象填写来源问卷信息的概率;在一个具体的实施例中,以每个应用对应的填写对象对应的第二填写预测结果的倒数为对应填写结果的权重可以使得填写倾向较低的个体,具有较高的权重,而填写倾向较高的个体将具有较低的权重。
每个填写对象的填写结果可以为1,相应的,可以将每个应用对应填写对象各自的第二填写预测结果的倒数,每个应用对应填写对象的填写结果进行加权求和,得到上述每个应用的加权填写结果。相应的,上述每个应用对应的第二对象占比信息可以为每个应用对应的加权填写结果占多个应用对应的加权填写结果的比例。
上述实施例中,通过训练问卷填写预测模型,对填写问卷的业务对象进行填写预测,并结合预测结果的倒数对每个填写对象的填写结果进行调整,可以实现问卷结果的纠偏问卷结果,从而更准确地反映媒体内容对应业务对象的媒体倾向。
在一个具体的实施例中,基于预设应用对应的业务指标增量、业务指标总量和第二对象占比信息,确定每个其他应用对应的业务指标增量可以包括:确定预设应用对应的业务指标增量和业务指标总量间的指标占比信息;在预设应用对应的第二对象占比信息大于预设应用对应的指标占比信息的情况下,可以将每个其他应用对应的第二对象占比信息与预设应用对应的第二对象占比信息的比值乘以预设应用对应的业务指标增量作为每个其他应用业务指标增量。在预设应用对应的第二对象占比信息小于等于预设应用对应的指标占比信息的情况下,可以将1减去预设应用对应的业务指标增量的差值乘以每个其他应用对应的第二对象占比信息,得到每个其他应用业务指标增量。
在一个具体的实施例中,基于预设应用对应的业务指标增量、业务指标总量和第一对象占比信息,确定每个其他应用对应的业务指标增量的具体细化,可以基于预设应用对应的业务指标增量、业务指标总量和第二对象占比信息,确定每个其他应用对应的业务指标增量的具体细化,在此不再赘述。
在一个具体的实施例中,如图9所示,图9是本申请实施例提供的另一种进行媒体内容的业务指标变化分析过程示意图;其中,横坐标表示时间,纵坐标表示业务指标数据;干预时间可以为在目标应用中执行业务干预操作的开始时间;T2对应的时间段可以为目标运营时段,T3对应的时间段可以为第三预设时间段;901对应的曲线为多个第二样本媒体内容对应的第五业务指标数据;902对应的曲线可以为多个第二样本媒体内容对应的第六业务指标数据;903对应的曲线可以为第二媒体内容对应的第八业务指标数据;904对应的曲线可以为第二媒体内容对应的第九业务指标数据;905对应的曲线可以为模型预测的第二媒体内容对应的第六预测指标数据。
由以上本说明书实施例提供的技术方案可见,在获取样本媒体内容对应的业务指标数据过程中,结合待分析的媒体内容对应的当前运营时段,选取样本媒体内容对应的总运营周期中与当前运营时段相对应的时间段(目标运营时段)的业务指标数据,可以实现模型学习到不同时刻的业务指标数据对模型预测结果影响程度的差异,充分学习了时间先后的关系;且结合目标应用中未安装预设应用的对象对应的业务指标数据,来训练可以预测目标应用中安装了预设应用的对象对应的业务指标数据的指标预测模型,进而可以在无需获取预设应用中业务指标数据的情况下,就实现对预设应用中执行业务干扰操作,对媒体内容指标变化的分析,且在训练前,先接结合样本媒体内容对应的预设指标权重,对样本媒体内容对应第五业务指标数据进行加权处理,可以使得模型学习不同业务指标数据对模型预测结果影响程度的差异,大大提升模型的业务指标数据预测准确性,进而可以保证基于训练好的第四指标预测模型、待分析的媒体内容在干预时间段(第三预设时间段)内未安装预设应用的对象对应的第八业务指标数据,以及第一媒体内容在干预时段段内安装预设应用的对象对应的第九业务指标数据进行业务指标变化分析的准确性,进而也可以有效的进行业务运营指导。
在一个具体的实施例中,由于干预策略上线后就不再下线,为了验证本申请方案的有效性,针对同一待分析的媒体内容,可以在结合本申请方案进行业务变化分析处理的基础上,结合现有的基于数据交换方式,基于问卷调研的方式,以及基于外显挂链的方式进行业务变化分析处理,且由于理论上,按照数据全面性角度,由高到低依次为基于数据交换方式、基于问卷调研的方式、基于合成控制模型的方式(即本申请方案)、基于外显挂链的方式;各种方式变化分析也按照全面性由高到低排序,经验证本申请方案的变化分析结果排在第三,相应的,可以有效的证明本申请方案的有效性;
进一步的,还可以通过获取各个应用中待分析媒体内容对应的各个账号的互动数据,并验证不同应用对应的互动数据间比较情况,是否与各个应用对应的业务指标增量间的比较情况一致,来进行本申请方案的有效性验证。
此外,在验证过程可以结合站内外情况,对媒体推新、会员转免等异动情况进行确认。
在一个具体的实施例中,在得到待分析的媒体内容在各个应用中业务指标数据的变化分析结果的情况下,可以基于待分析的媒体内容在各个应用中业务指标数据的变化分析结果进行第二媒体内容的投放处理,具体的,可以对有正向增量的媒体内容进行站外短视频(对应的推荐媒体内容)生产指导,对负向增量的媒体内容在进行站外剔除授权等处理。
由以上述本说明书实施例提供的技术方案可见,本说明书中针对处于不同业务周期的待分析媒体内容分别训练各自不同业务周期的指标预测模型,进而可以实现分业务周期,分媒体内容的业务指标数据变化分析,且针对运营期的媒体内容,可以实现分应用的业务指标数据变化分析。可选的,也可以进一步提供数据交换的方式,获取各个应用不同账号对应的业务指标数据的变化情况;进而可以更好的进行媒体内容的运营指导。
本说明书本申请实施例还提供了一种业务数据处理装置,如图10所示,上述装置包括:
第一样本数据获取模块1010,被配置为执行获取第一预设时间段内待分析的第一媒体内容对应的第一业务指标数据、所述第一预设时间段内多个第一样本媒体内容对应的第二业务指标数据、第一预设指标权重和第一预设时间权重;所述第一预设时间段为对所述第一媒体内容执行业务干预操作之前的时间段;所述第一预设指标权重为不同第一样本媒体内容对应的第二业务指标数据的权重;所述第一预设时间权重为不同时刻的第二业务指标数据的权重;
第一模型训练模块1020,被配置为执行基于所述第一业务指标数据、所述第二业务指标数据、所述第一预设指标权重和所述第一预设时间权重,对待训练的第一深度学习模型进行训练,得到所述第一媒体内容对应的第一指标预测模型;
第一数据获取模块1030,被配置为执行获取第二预设时间段内所述多个第一样本媒体内容对应的第三业务指标数据和所述第一媒体内容对应的第四业务指标数据,所述第二预设时间段为对所述第一媒体内容执行业务干预操作的时间段;
第一变化分析模块1040,被配置为执行基于所述第三业务指标数据、所述第一指标预测模型和所述第四业务指标数据,对所述第一媒体内容进行业务指标变化分析,得到所述第一媒体内容对应的第一变化分析结果。
在一个可选的实施例中,所述装置还包括:
第二模型训练模块,被配置为执行基于所述第一业务指标数据和所述第二业务指标数据,在学习不同时刻的第二业务指标数据对模型预测结果的影响程度的基础上,对待训练的第二深度学习模型进行训练,得到所述第一媒体内容对应的第二指标预测模型;
第三模型训练模块,被配置为执行基于所述第一业务指标数据和所述第二业务指标数据,在学习不同第二业务指标数据对模型预测结果的影响程度的基础上,对待训练的第三深度学习模型进行训练,得到所述第一媒体内容对应的第三指标预测模型;
其中,所述第一预设时间权重为所述第二指标预测模型中第一模型参数,所述第一模型参数表征输入的不同时刻的业务指标数据对所述第二指标预测模型的模型预测结果的影响程度;所述第一预设指标权重为所述第三指标预测模型中第二模型参数,所述第二模型参数表征输入的不同业务指标数据对所述第三指标预测模型的模型预测结果的影响程度。
在一个可选的实施例中,所述第二模型训练模块包括:
第一指标预测单元,被配置为执行将所述第二业务指标数据输入所述第二深度学习模型中,并在学习不同时刻的第二业务指标数据对模型预测结果的影响程度的基础上,进行指标预测,得到所述第一媒体内容对应的第一预测指标数据;
第一预测损失确定单元,被配置为执行根据所述第一预测指标数据和所述第一业务指标数据,确定所述第二深度学习模型对应的第二预测损失;
第一模型训练单元,被配置为执行基于所述第二预测损失,对所述第二深度学习模型进行训练,得到所述第二指标预测模型。
在一个可选的实施例中,所述第三模型训练模块包括:
第二指标预测单元,被配置为执行将所述第二业务指标数据输入所述第三深度学习模型中,并在学习不同第一样本媒体内容对应的第二业务指标数据对模型预测结果的影响程度的基础上,进行指标预测,得到所述第一媒体内容对应的第二预测指标数据;
第二预测损失确定单元,被配置为执行根据所述第二预测指标数据和所述第一业务指标数据,确定所述第三深度学习模型对应的第三预测损失;
第二模型训练单元,被配置为执行基于所述第三预测损失,对所述第二深度学习模型进行训练,得到所述第三指标预测模型。
在一个可选的实施例中,所述第一模型训练模块1020包括:
第三指标预测单元,被配置为执行将所述第二业务指标数据输入第一深度学习模型进行指标预测,得到所述第一媒体内容对应的第三预测指标数据;
第一预设损失函数确定单元,被配置为执行确定第一预设损失函数,所述第一预设损失函数包括预设差异项;
第三预测损失确定单元,被配置为执行将所述第三预测指标数据和所述第一业务指标数据代入第一预设损失函数中的所述预设差异项,并将所述第一预设指标权重和所述第一预设时间权重作为所述预设差异项的权重,得到第一深度学习模型对应的第一预测损失;
第三模型训练单元,被配置为执行基于所述第一预测损失,对第一深度学习模型进行训练,得到所述第一指标预测模型。
在一个可选的实施例中,所述多个第一样本媒体内容在所述第一预设时间段内的第二业务指标数据采用下述单元获取:
原始媒体内容获取单元,被配置为执行获取多个第一原始媒体内容,所述多个第一原始媒体内容的媒体类型与所述第一媒体内容的媒体类型相同;
关联分析单元,被配置为执行对所述多个第一原始媒体内容和所述第一媒体内容进行关联分析,得到每个第一原始媒体内容和所述第一媒体内容间的关联数据;
媒体内容筛选单元,被配置为执行基于所述关联数据,从所述多个第一原始媒体内容中,筛选出所述多个第一样本媒体内容。
在一个可选的实施例中,所述第一变化分析模块1040包括:
第四指标预测单元,被配置为执行将所述第三业务指标数据输入所述第一指标预测模型进行指标预测,得到所述第一媒体内容对应的第四预测指标数据;
第一变化分析单元,被配置为执行根据所述第四预测指标数据和所述第四业务指标数据间的差异,确定所述第一变化分析结果。
在一个可选的实施例中,所述多个第一样本媒体内容当前所处业务周期和所述第一媒体内容当前所处的业务周期均为非运营期。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本说明书本申请实施例还提供了一种业务数据处理装置,如图11所示,上述装置包括:
当前运营时段确定模块1110,被配置为执行确定待分析的第二媒体内容对应的当前运营时段,所述当前运营时段为是所述第二媒体内容当前所在运营时间在所述第二媒体内容对应总运营周期的相对时间段;
目标运营时段确定模块1120,被配置为执行根据所述当前运营时段,确定多个第二样本媒体内容中每个第二样本媒体内容对应的目标运营时段,所述每个第二样本媒体内容对应的目标运营时段为所述每个第二样本媒体内容对应的总运营周期中与所述当前运营时段相对应的时间段,且所述目标运营时段位于对所述第二媒体内容执行业务干预操作之前;
第二样本数据获取模块1130,被配置为执行获取所述每个第二样本媒体内容对应的目标运营时段,所述每个第二样本媒体内容对应的第五业务指标数据和所述每个第二样本媒体内容对应的第六业务指标数据;所述第五业务指标数据为目标应用中未安装预设应用的第一样本对象对应的业务指标数据,所述第六业务指标数据为所述目标应用中安装所述预设应用的第二样本对象对应的业务指标数据;
第一加权处理模块1140,被配置为执行基于所述每个第二样本媒体内容对应第五业务指标数据的第二预设指标权重,对所述每个第二样本媒体内容对应第五业务指标数据进行加权处理,得到所述每个第二样本媒体内容对应第七业务指标数据;
第四模型训练模块1150,被配置为执行基于所述第六业务指标数据和所述第七业务指标数据,对待训练的第四深度学习模型进行训练,得到所述第二媒体内容对应的第四指标预测模型;
第二数据获取模块1160,被配置为执行获取第三预设时间段内,所述第二媒体内容对应的第八业务指标数据和所述第二媒体内容对应的第九业务指标数据;所述第八业务指标数据为第一样本对象对应的业务指标数据;所述第九业务指标数据为所述第二样本对象对应的业务指标数据;所述第三预设时间段为对所述第二媒体内容执行业务干预操作的时间段;
第二变化分析模块1170,被配置为执行基于所述第八业务指标数据、所述第四指标预测模型和所述第九业务指标数据,对所述第二媒体内容进行业务指标变化分析,得到所述第二媒体内容在所述预设应用中的第二变化分析结果。
在一个可选的实施例中,所述多个第二样本媒体内容的媒体类型与所述第二媒体内容的媒体类型相同;所述装置还包括:
安装信息获取模块,被配置为执行获取所述预设应用对应的安装信息;
第一样本对象确定模块,被配置为执行根据所述安装信息,从所述多个第二样本媒体内容对应的业务对象中,确定未安装所述预设应用的多个初始样本对象和安装所述预设应用的所述第二样本对象;
活跃度获取模块,被配置为执行获取所述多个初始样本对象在所述目标应用中的活跃度;
第二样本对象确定模块,被配置为执行基于所述活跃度,从所述多个初始样本对象中确定所述第一样本对象,所述第一样本对象包括具有不同活跃度等级的多个样本对象。
在一个可选的实施例中,所述第二预设指标权重包括第一指标权重、第二指标权重和第三指标权重中的至少一个,所述第一指标权重、所述第二指标权重和所述第三指标权重采用下述模块获取:
数量级获取模块,被配置为执行获取所述每个第二样本媒体内容对应累计业务指标数据的第一数量级和所述第二媒体内容对应累计业务指标数据的第二数量级;
第一指标权重确定模块,被配置为执行根据所述每个第二样本媒体内容对应的第一数量级和所述第二数量级,确定所述每个第二样本媒体内容对应的第一指标权重;
第一对象特征信息获取模块,被配置为执行获取所述每个第二样本媒体内容对应业务对象的第一对象特征信息和所述第二媒体内容对应业务对象的第二对象特征信息;
第二指标权重确定模块,被配置为执行根据所述第一对象特征信息和所述每个第二样本媒体内容对应第二对象特征信息间关联度,确定所述每个第二样本媒体内容对应的第二指标权重;
当前指标数据获取模块,被配置为执行获取所述第二媒体内容上线预设时长后的第一当前指标数据和所述每个第二样本媒体内容上线所述预设时长后的第二当前指标数据;
第三指标权重确定模块,被配置为执行根据所述第一当前指标数据和所述每个第二样本媒体内容对应的第二当前指标数据间关联度,确定所述每个第二样本媒体内容对应的第三指标权重。
在一个可选的实施例中,所述第二变化分析结果为业务干预操作后,所述预设应用对应的业务指标增量;所述装置还包括:
第三数据获取模块,被配置为执行获取所述第二媒体内容对应的来源问卷信息和所述目标应用中所述第二媒体内容对应的业务指标总量,所述来源问卷信息表征所述第二媒体内容对应的业务对象的来源应用,所述来源应用包括多个应用,所述多个应用包括所述预设应用;
第一对象占比信息确定模块,被配置为执行基于所述来源问卷信息,确定所述每个应用对应的第一对象占比信息;
业务指标增量确定模块,被配置为执行基于所述预设应用对应的业务指标增量、所述业务指标总量和所述第一对象占比信息,确定每个其他应用对应的业务指标增量;所述每个其他应用为所述多个应用中除预设应用以外的每个应用。
在一个可选的实施例中,所述装置还包括:
填写对象确定模块,被配置为执行根据所述来源问卷信息,确定所述每个应用对应的填写对象;
第一问卷填写预测模块,被配置为执行将所述填写对象对应的对象特征信息输入所述问卷填写预测模型进行问卷填写预测,得到所述填写对象对应的第二填写预测结果;
第二加权处理模块,被配置为执行基于每个应用对应的填写对象对应的第二填写预测结果的倒数,对所述每个应用对应填写对象的填写结果进行加权处理,得到所述每个应用的加权填写结果;
第二对象占比信息确定模块,被配置为执行根据所述加权填写结果,确定所述每个应用对应的第二对象占比信息;
所述业务指标增量确定模块具体被配置为执行基于所述预设应用对应的业务指标增量、所述业务指标总量和所述第二对象占比信息,确定每个其他应用对应的业务指标增量。
在一个可选的实施例中,所述装置还包括:
第二对象特征信息获取模块,被配置为执行获取所述第二媒体内容对应的多个业务对象的对象特征信息,所述多个业务对象包括多个正样本对象和多个负样本对象,所述多个正样本对象为所述多个业务对象中填写所述来源问卷信息的业务对象;所述多个负样本对象为所述多个业务对象中未填写所述来源问卷信息的业务对象;
第二问卷填写预测模块,被配置为执行将所述对象特征信息输入待训练的第五深度学习模型进行问卷填写预测,得到所述多个业务对象各自对应的第一填写预测结果;
第五模型训练模块,被配置为执行基于所述第一填写预测结果,对所述第五深度学习模型进行训练,得到所述问卷填写预测模型。
在一个可选的实施例中,所述第四模型训练模块1150包括:
第五指标预测单元,被配置为执行将所述第七业务指标数据输入所述第四深度学习模型进行指标预测,得到所述第二媒体内容对应的第五预测指标数据;
第五预测损失确定单元,被配置为执行根据所述第五预测指标数据和所述第六业务指标数据,确定所述第四深度学习模型对应的第四预测损失;
第四模型训练单元,被配置为执行基于所述第四预测损失,对所述第四深度学习模型进行训练,得到所述第四指标预测模型。
在一个可选的实施例中,所述第二变化分析模块1170包括:
第六指标预测单元,被配置为执行将所述第八业务指标数据输入所述第四指标预测模型进行指标预测,得到所述第二媒体内容对应的第六预测指标数据;
第二变化分析单元,被配置为执行根据所述第六预测指标数据和所述第九业务指标数据间的差异,确定所述第二变化分析结果。
在一个可选的实施例中,所述多个第二样本媒体内容当前所处业务周期和所述第二媒体内容当前所处的业务周期均为运营期。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图12是本申请实施例提供的一种用于业务数据处理的电子设备的框图,该电子设备可以是终端,其内部结构图可以如图12所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种业务数据处理方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
图13是本申请实施例提供的另一种用于业务数据处理的电子设备的框图,该电子设备可以是服务器,其内部结构图可以如图13所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种业务数据处理方法。
本领域技术人员可以理解,图12或图13中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种电子设备,包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器被配置为执行该指令,以实现如本公开实施例中的业务数据处理方法。
在示例性实施例中,还提供了一种计算机可读存储介质,当该存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开实施例中的业务数据处理方法。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的业务数据处理方法。
可以理解的是,在本申请的具体实施方式中,涉及到用户相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (15)

1.一种业务数据处理方法,其特征在于,所述方法包括:
获取第一预设时间段内待分析的第一媒体内容对应的第一业务指标数据、所述第一预设时间段内多个第一样本媒体内容对应的第二业务指标数据、第一预设指标权重和第一预设时间权重;所述第一预设时间段为对所述第一媒体内容执行业务干预操作之前的时间段;所述第一预设指标权重为不同第一样本媒体内容对应的第二业务指标数据的权重;所述第一预设时间权重为不同时刻的第二业务指标数据的权重;
基于所述第一业务指标数据、所述第二业务指标数据、所述第一预设指标权重和所述第一预设时间权重,对待训练的第一深度学习模型进行训练,得到所述第一媒体内容对应的第一指标预测模型;
获取第二预设时间段内所述多个第一样本媒体内容对应的第三业务指标数据和所述第一媒体内容对应的第四业务指标数据,所述第二预设时间段为对所述第一媒体内容执行业务干预操作的时间段;
基于所述第三业务指标数据、所述第一指标预测模型和所述第四业务指标数据,对所述第一媒体内容进行业务指标变化分析,得到所述第一媒体内容对应的第一变化分析结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述第一业务指标数据和所述第二业务指标数据,在学习不同时刻的第二业务指标数据对模型预测结果的影响程度的基础上,对待训练的第二深度学习模型进行训练,得到所述第一媒体内容对应的第二指标预测模型;
基于所述第一业务指标数据和所述第二业务指标数据,在学习不同第二业务指标数据对模型预测结果的影响程度的基础上,对待训练的第三深度学习模型进行训练,得到所述第一媒体内容对应的第三指标预测模型;
其中,所述第一预设时间权重为所述第二指标预测模型中第一模型参数,所述第一模型参数表征输入的不同时刻的业务指标数据对所述第二指标预测模型的模型预测结果的影响程度;所述第一预设指标权重为所述第三指标预测模型中第二模型参数,所述第二模型参数表征输入的不同业务指标数据对所述第三指标预测模型的模型预测结果的影响程度。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一业务指标数据、所述第二业务指标数据、所述第一预设指标权重和所述第一预设时间权重,对待训练的第一深度学习模型进行训练,得到所述第一媒体内容对应的第一指标预测模型包括:
将所述第二业务指标数据输入第一深度学习模型进行指标预测,得到所述第一媒体内容对应的第三预测指标数据;
确定第一预设损失函数,所述第一预设损失函数包括预设差异项;
将所述第三预测指标数据和所述第一业务指标数据代入第一预设损失函数中的所述预设差异项,并将所述第一预设指标权重和所述第一预设时间权重作为所述预设差异项的权重,得到第一深度学习模型对应的第一预测损失;
基于所述第一预测损失,对第一深度学习模型进行训练,得到所述第一指标预测模型。
4.根据权利要求1至3任一所述的方法,其特征在于,所述多个第一样本媒体内容在所述第一预设时间段内的第二业务指标数据采用下述方式获取:
获取多个第一原始媒体内容,所述多个第一原始媒体内容的媒体类型与所述第一媒体内容的媒体类型相同;
对所述多个第一原始媒体内容和所述第一媒体内容进行关联分析,得到每个第一原始媒体内容和所述第一媒体内容间的关联数据;
基于所述关联数据,从所述多个第一原始媒体内容中,筛选出所述多个第一样本媒体内容。
5.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述第三业务指标数据、所述第一指标预测模型和所述第四业务指标数据,对所述第一媒体内容进行业务指标变化分析,得到所述第一媒体内容对应的第一变化分析结果包括:
将所述第三业务指标数据输入所述第一指标预测模型进行指标预测,得到所述第一媒体内容对应的第四预测指标数据;
根据所述第四预测指标数据和所述第四业务指标数据间的差异,确定所述第一变化分析结果。
6.根据权利要求1至3任一所述的方法,其特征在于,所述多个第一样本媒体内容当前所处业务周期和所述第一媒体内容当前所处的业务周期均为非运营期。
7.一种业务数据处理方法,其特征在于,所述方法包括:
确定待分析的第二媒体内容对应的当前运营时段,所述当前运营时段为是所述第二媒体内容当前所在运营时间在所述第二媒体内容对应总运营周期的相对时间段;
根据所述当前运营时段,确定多个第二样本媒体内容中每个第二样本媒体内容对应的目标运营时段,所述每个第二样本媒体内容对应的目标运营时段为所述每个第二样本媒体内容对应的总运营周期中与所述当前运营时段相对应的时间段,且所述目标运营时段位于对所述第二媒体内容执行业务干预操作之前;
获取所述每个第二样本媒体内容对应的目标运营时段,所述每个第二样本媒体内容对应的第五业务指标数据和所述每个第二样本媒体内容对应的第六业务指标数据;所述第五业务指标数据为目标应用中未安装预设应用的第一样本对象对应的业务指标数据,所述第六业务指标数据为所述目标应用中安装所述预设应用的第二样本对象对应的业务指标数据;
基于所述每个第二样本媒体内容对应第五业务指标数据的第二预设指标权重,对所述每个第二样本媒体内容对应第五业务指标数据进行加权处理,得到所述每个第二样本媒体内容对应第七业务指标数据;
基于所述第六业务指标数据和所述第七业务指标数据,对待训练的第四深度学习模型进行训练,得到所述第二媒体内容对应的第四指标预测模型;
获取第三预设时间段内,所述第二媒体内容对应的第八业务指标数据和所述第二媒体内容对应的第九业务指标数据;所述第八业务指标数据为第一样本对象对应的业务指标数据;所述第九业务指标数据为所述第二样本对象对应的业务指标数据;所述第三预设时间段为对所述第二媒体内容执行业务干预操作的时间段;
基于所述第八业务指标数据、所述第四指标预测模型和所述第九业务指标数据,对所述第二媒体内容进行业务指标变化分析,得到所述第二媒体内容在所述预设应用中的第二变化分析结果。
8.根据权利要求7所述的方法,其特征在于,所述多个第二样本媒体内容的媒体类型与所述第二媒体内容的媒体类型相同;所述方法还包括:
获取所述预设应用对应的安装信息;
根据所述安装信息,从所述多个第二样本媒体内容对应的业务对象中,确定未安装所述预设应用的多个初始样本对象和安装所述预设应用的所述第二样本对象;
获取所述多个初始样本对象在所述目标应用中的活跃度;
基于所述活跃度,从所述多个初始样本对象中确定所述第一样本对象,所述第一样本对象包括具有不同活跃度等级的多个样本对象。
9.根据权利要求7所述的方法,其特征在于,所述第二预设指标权重包括第一指标权重、第二指标权重和第三指标权重中的至少一个,所述第一指标权重、所述第二指标权重和所述第三指标权重采用下述方式获取:
获取所述每个第二样本媒体内容对应累计业务指标数据的第一数量级和所述第二媒体内容对应累计业务指标数据的第二数量级;
根据所述每个第二样本媒体内容对应的第一数量级和所述第二数量级,确定所述每个第二样本媒体内容对应的第一指标权重;
获取所述每个第二样本媒体内容对应业务对象的第一对象特征信息和所述第二媒体内容对应业务对象的第二对象特征信息;
根据所述第一对象特征信息和所述每个第二样本媒体内容对应第二对象特征信息间关联度,确定所述每个第二样本媒体内容对应的第二指标权重;
获取所述第二媒体内容上线预设时长后的第一当前指标数据和所述每个第二样本媒体内容上线所述预设时长后的第二当前指标数据;
根据所述第一当前指标数据和所述每个第二样本媒体内容对应的第二当前指标数据间关联度,确定所述每个第二样本媒体内容对应的第三指标权重。
10.根据权利要求7所述的方法,其特征在于,所述第二变化分析结果为业务干预操作后,所述预设应用对应的业务指标增量;所述方法还包括:
获取所述第二媒体内容对应的来源问卷信息和所述目标应用中所述第二媒体内容对应的业务指标总量,所述来源问卷信息表征所述第二媒体内容对应的业务对象的来源应用,所述来源应用包括多个应用,所述多个应用包括所述预设应用;
基于所述来源问卷信息,确定所述每个应用对应的第一对象占比信息;
基于所述预设应用对应的业务指标增量、所述业务指标总量和所述第一对象占比信息,确定每个其他应用对应的业务指标增量;所述每个其他应用为所述多个应用中除预设应用以外的每个应用。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
根据所述来源问卷信息,确定所述每个应用对应的填写对象;
将所述填写对象对应的对象特征信息输入所述问卷填写预测模型进行问卷填写预测,得到所述填写对象对应的第二填写预测结果;
基于每个应用对应的填写对象对应的第二填写预测结果的倒数,对所述每个应用对应填写对象的填写结果进行加权处理,得到所述每个应用的加权填写结果;
根据所述加权填写结果,确定所述每个应用对应的第二对象占比信息;
所述基于所述预设应用对应的业务指标增量、所述业务指标总量和所述第一对象占比信息,确定每个其他应用对应的业务指标增量包括:
基于所述预设应用对应的业务指标增量、所述业务指标总量和所述第二对象占比信息,确定每个其他应用对应的业务指标增量。
12.根据权利要求7至11任一所述的方法,其特征在于,所述基于所述第八业务指标数据、所述第四指标预测模型和所述第九业务指标数据,对所述第二媒体内容进行业务指标变化分析,得到所述第二媒体内容在所述预设应用中的第二变化分析结果包括:
将所述第八业务指标数据输入所述第四指标预测模型进行指标预测,得到所述第二媒体内容对应的第六预测指标数据;
根据所述第六预测指标数据和所述第九业务指标数据间的差异,确定所述第二变化分析结果。
13.根据权利要求7至11任一所述的方法,其特征在于,所述多个第二样本媒体内容当前所处业务周期和所述第二媒体内容当前所处的业务周期均为运营期。
14.一种业务数据处理装置,其特征在于,所述装置包括:
第一样本数据获取模块,被配置为执行获取第一预设时间段内待分析的第一媒体内容对应的第一业务指标数据、所述第一预设时间段内多个第一样本媒体内容对应的第二业务指标数据、第一预设指标权重和第一预设时间权重;所述第一预设时间段为对所述第一媒体内容执行业务干预操作之前的时间段;所述第一预设指标权重为不同第一样本媒体内容对应的第二业务指标数据的权重;所述第一预设时间权重为不同时刻的第二业务指标数据的权重;
第一模型训练模块,被配置为执行基于所述第一业务指标数据、所述第二业务指标数据、所述第一预设指标权重和所述第一预设时间权重,对待训练的第一深度学习模型进行训练,得到所述第一媒体内容对应的第一指标预测模型;
第一数据获取模块,被配置为执行获取第二预设时间段内所述多个第一样本媒体内容对应的第三业务指标数据和所述第一媒体内容对应的第四业务指标数据,所述第二预设时间段为对所述第一媒体内容执行业务干预操作的时间段;
第一变化分析模块,被配置为执行基于所述第三业务指标数据、所述第一指标预测模型和所述第四业务指标数据,对所述第一媒体内容进行业务指标变化分析,得到所述第一媒体内容对应的第一变化分析结果。
15.一种业务数据处理装置,其特征在于,所述装置包括:
当前运营时段确定模块,被配置为执行确定待分析的第二媒体内容对应的当前运营时段,所述当前运营时段为是所述第二媒体内容当前所在运营时间在所述第二媒体内容对应总运营周期的相对时间段;
目标运营时段确定模块,被配置为执行根据所述当前运营时段,确定多个第二样本媒体内容中每个第二样本媒体内容对应的目标运营时段,所述每个第二样本媒体内容对应的目标运营时段为所述每个第二样本媒体内容对应的总运营周期中与所述当前运营时段相对应的时间段,且所述目标运营时段位于对所述第二媒体内容执行业务干预操作之前;
第二样本数据获取模块,被配置为执行获取所述每个第二样本媒体内容对应的目标运营时段,所述每个第二样本媒体内容对应的第五业务指标数据和所述每个第二样本媒体内容对应的第六业务指标数据;所述第五业务指标数据为目标应用中未安装预设应用的第一样本对象对应的业务指标数据,所述第六业务指标数据为所述目标应用中安装所述预设应用的第二样本对象对应的业务指标数据;
第一加权处理模块,被配置为执行基于所述每个第二样本媒体内容对应第五业务指标数据的第二预设指标权重,对所述每个第二样本媒体内容对应第五业务指标数据进行加权处理,得到所述每个第二样本媒体内容对应第七业务指标数据;
第四模型训练模块,被配置为执行基于所述第六业务指标数据和所述第七业务指标数据,对待训练的第四深度学习模型进行训练,得到所述第二媒体内容对应的第四指标预测模型;
第二数据获取模块,被配置为执行获取第三预设时间段内,所述第二媒体内容对应的第八业务指标数据和所述第二媒体内容对应的第九业务指标数据;所述第八业务指标数据为第一样本对象对应的业务指标数据;所述第九业务指标数据为所述第二样本对象对应的业务指标数据;所述第三预设时间段为对所述第二媒体内容执行业务干预操作的时间段;
第二变化分析模块,被配置为执行基于所述第八业务指标数据、所述第四指标预测模型和所述第九业务指标数据,对所述第二媒体内容进行业务指标变化分析,得到所述第二媒体内容在所述预设应用中的第二变化分析结果。
CN202311482479.2A 2023-11-08 2023-11-08 业务数据处理方法及装置 Pending CN117541073A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311482479.2A CN117541073A (zh) 2023-11-08 2023-11-08 业务数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311482479.2A CN117541073A (zh) 2023-11-08 2023-11-08 业务数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN117541073A true CN117541073A (zh) 2024-02-09

Family

ID=89793040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311482479.2A Pending CN117541073A (zh) 2023-11-08 2023-11-08 业务数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN117541073A (zh)

Similar Documents

Publication Publication Date Title
CN111181757B (zh) 信息安全风险预测方法、装置以及计算设备、存储介质
CN112801155B (zh) 基于人工智能的业务大数据分析方法及服务器
Song Web service reliability prediction based on machine learning
CN114461869B (zh) 业务特征数据处理方法、装置、电子设备及存储介质
CN114201626B (zh) 多媒体推荐方法、装置、电子设备及存储介质
CN113918738B (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN114297478A (zh) 一种页面推荐方法、装置、设备以及存储介质
CN113949644A (zh) 基于LSTM-prophet的网站访问量预测方法及系统
CN115794369A (zh) 内存占用数值的预测方法及装置、存储介质、终端
CN111881007B (zh) 操作行为判断方法、装置、设备及计算机可读存储介质
CN117541073A (zh) 业务数据处理方法及装置
CN112801156B (zh) 用于人工智能机器学习的业务大数据采集方法及服务器
CN115222112A (zh) 一种行为预测方法、行为预测模型的生成方法及电子设备
CN115455276A (zh) 推荐对象的方法、装置、计算机设备和存储介质
CN113011748A (zh) 推荐效果的评估方法、装置、电子设备及可读存储介质
CN112581250A (zh) 模型生成方法、装置、计算机设备和存储介质
CN107705159A (zh) 存量房估价方法及装置
CN116361641A (zh) 交互指标识别模型训练、对象推荐方法及装置
CN114841305A (zh) 数据处理方法及计算设备
CN117009653A (zh) 对象推荐模型的训练方法、对象推荐方法及装置
CN114048392A (zh) 多媒体资源推送方法、装置、电子设备及存储介质
CN116956016A (zh) 应用于内容推荐的模型训练方法、装置、设备及存储介质
CN117408820A (zh) 一种车险选择预测方法、装置、设备及其存储介质
CN116702995A (zh) 一种车险风险指标预测方法及其相关设备
CN118094420A (zh) 问卷评估方法、模型训练方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication