CN113947246B - 基于人工智能的流失处理方法、装置及电子设备 - Google Patents

基于人工智能的流失处理方法、装置及电子设备 Download PDF

Info

Publication number
CN113947246B
CN113947246B CN202111226130.3A CN202111226130A CN113947246B CN 113947246 B CN113947246 B CN 113947246B CN 202111226130 A CN202111226130 A CN 202111226130A CN 113947246 B CN113947246 B CN 113947246B
Authority
CN
China
Prior art keywords
behavior
processing
features
loss
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111226130.3A
Other languages
English (en)
Other versions
CN113947246A (zh
Inventor
徐广根
邹丰富
武宗平
叶沐芊
刘妍
陶冶
万志远
刘阳
江鑫
王惠淇
李鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202111226130.3A priority Critical patent/CN113947246B/zh
Publication of CN113947246A publication Critical patent/CN113947246A/zh
Application granted granted Critical
Publication of CN113947246B publication Critical patent/CN113947246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)

Abstract

本申请提供了一种基于人工智能的流失处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,相关实施例可应用于云技术、人工智能、智慧交通等各种行为场景;方法包括:对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到多个行为特征分别对应的嵌入特征;对多个行为特征进行线性融合处理得到线性融合特征,对多个行为特征以及多个行为特征分别对应的嵌入特征进行交叉融合处理得到交叉融合特征;对多个行为特征分别对应的嵌入特征进行线性映射处理及非线性映射处理得到映射特征;根据线性融合特征、交叉融合特征以及映射特征进行流失预测处理,得到目标对象在行为场景中的对象流失预测结果。通过本申请能够提升流失预测精度。

Description

基于人工智能的流失处理方法、装置及电子设备
技术领域
本申请涉及人工智能技术,尤其涉及一种基于人工智能的流失处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
随着网络技术和计算机技术的发展,出现了各种各样的行为场景,其中,行为场景用于支持对象(如用户或用户使用的账号)执行特定的行为。例如,游戏应用程序可提供游戏行为场景,供游戏应用程序的用户执行游戏行为;又如,办公应用程序可提供办公行为场景,供办公应用程序的用户执行办公行为。
对象流失是行为场景中的重要问题,为了应对对象流失,在相关技术提供的方案中,通常是凭借人工经验构建出与对象的各个行为特征分别对应的数值映射函数,以计算该对象的流失概率。然而,数值映射函数的构建过程耗时耗力,且准确性无法保障,流失预测的精度低。
发明内容
本申请实施例提供一种基于人工智能的流失处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够提升流失预测的精度。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种基于人工智能的流失处理方法,包括:
对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到所述多个行为特征分别对应的嵌入特征;
对所述多个行为特征进行线性融合处理得到线性融合特征,对所述多个行为特征以及所述多个行为特征分别对应的嵌入特征进行交叉融合处理,得到交叉融合特征;
对所述多个行为特征分别对应的嵌入特征进行线性映射处理及非线性映射处理,得到映射特征;
根据所述线性融合特征、所述交叉融合特征以及所述映射特征进行流失预测处理,得到所述目标对象在所述行为场景中的对象流失预测结果。
本申请实施例提供一种基于人工智能的流失处理装置,包括:
嵌入表示模块,用于对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到所述多个行为特征分别对应的嵌入特征;
融合模块,用于对所述多个行为特征进行线性融合处理得到线性融合特征,对所述多个行为特征以及所述多个行为特征分别对应的嵌入特征进行交叉融合处理,得到交叉融合特征;
映射模块,用于对所述多个行为特征分别对应的嵌入特征进行线性映射处理及非线性映射处理,得到映射特征;
流失预测模块,用于根据所述线性融合特征、所述交叉融合特征以及所述映射特征进行流失预测处理,得到所述目标对象在所述行为场景中的对象流失预测结果。
本申请实施例提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的基于人工智能的流失处理方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本申请实施例提供的基于人工智能的流失处理方法。
本申请实施例提供一种计算机程序产品,包括可执行指令,所述可执行指令被处理器执行时实现本申请实施例提供的基于人工智能的流失处理方法。
本申请实施例具有以下有益效果:
对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到多个行为特征分别对应的嵌入特征。然后,在一方面,对多个行为特征进行线性融合处理得到线性融合特征,对所述多个行为特征以及所述多个行为特征分别对应的嵌入特征进行交叉融合处理得到交叉融合特征,从而实现低阶特征的学习;在另一方面,对多个行为特征分别对应的嵌入特征进行线性映射处理及非线性映射处理,得到映射特征,从而实现高阶特征的学习。最终,结合低阶特征以及高阶特征进行流失预测处理,如此,能够提升得到的对象流失预测结果的精度,有助于行为场景的良好运营。
附图说明
图1是相关技术提供的流失预测方案的流程示意图;
图2是本申请实施例提供的基于人工智能的流失处理系统的架构示意图;
图3是本申请实施例提供的终端设备的架构示意图;
图4A是本申请实施例提供的基于人工智能的流失处理方法的流程示意图;
图4B是本申请实施例提供的基于人工智能的流失处理方法的流程示意图;
图4C是本申请实施例提供的模型训练的流程示意图;
图5A是本申请实施例提供的游戏界面的示意图;
图5B是本申请实施例提供的游戏界面的示意图;
图5C是本申请实施例提供的游戏界面的示意图;
图6是本申请实施例提供的基于人工智能的流失处理方法的架构示意图;
图7是本申请实施例提供的流失预测模型的架构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三\第四”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三\第四”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。在以下的描述中,所涉及的术语“多个”是指至少两个。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)行为场景:用于支持对象执行特定的行为,其中,对象是指行为的执行主体,可以是用户,也可以是用户所使用的账号。例如,行为场景可以是游戏应用程序提供的游戏应用场景,用于支持游戏应用程序的账号执行游戏行为(如购买虚拟道具、攻击、防御等行为);行为场景也可以是办公应用程序提供的办公应用场景,用于支持办公应用程序的账号执行办公行为(如编辑文本、传输文件等行为)。
2)行为特征:用于表示对象在行为场景中执行的行为。本申请实施例对行为特征的类型不做限定,例如可以包括离散型的行为特征(后文称为离散行为特征)以及连续型的行为特征(后文称为连续行为特征)。其中,离散型是指类别可数,例如对于性别这个特征来说,只有男性和女性这两种类别;连续型是指类别不可数,例如对于在线时长这个特征来说,其类别是无限的。
3)线性:可以从相互关联的两个角度来界定线性,其一是叠加原理成立;其二是变量间的函数关系是直线,变量间的变化率是恒量。线性关系之外的即为非线性关系。
4)人工智能(Artificial Intelligence,AI):利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。机器学习(Machine Learning,ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。在本申请实施例中,可以基于机器学习原理构建流失预测模型。
5)云技术(Cloud Technology):在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。本申请实施例可以结合云技术实现,例如,涉及的电子设备可以是用于提供云服务的云设备,如云服务器。
6)智能交通系统(Intelligent Traffic System,ITS):又称智能运输系统(Intelligent Transportation System),是将先进的科学技术(信息技术、计算机技术、数据通信技术、传感器技术、电子控制技术、自动控制理论、运筹学、人工智能等)有效地综合运用于交通运输、服务控制和车辆制造,加强车辆、道路、使用者三者之间的联系,从而形成一种保障安全、提高效率、改善环境、节约能源的综合运输系统。本申请实施例可以应用于智能交通系统中,例如行为场景可以是车载终端所提供的智慧交通行为场景,车主可以通过在智慧交通行为场景中执行控制行为,来实现对车辆的控制。
针对行为场景中的对象流失,相关技术提供的方案如图1所示,将结合图1,通过步骤形式进行说明。
1)通过人工经验筛选出部分和对象流失相关的行为特征,例如近四周活跃天数(累计登录天数)、近四周日均在线时长、近四周累计付费、近四周聊天次数、近四周参与活动次数等。
2)对于筛选出来的各个行为特征,凭借人工经验构建出一个数值映射函数。
3)对象的流失概率的计算公式为:
ChurnScore=Sigmoid(L(loginDays)+O(onlineTime)+P(Pay))
其中,L(loginDays)表示近四周活跃天数的数值映射函数,O(onlineTime)表示近四周日均在线时长的数值映射函数,P(Pay)表示近四周累计付费的数值映射函数,ChurnScore是通过Sigmoid函数计算得到的,表示对象的流失概率。
在相关技术提供的方案中,流失预测严重依赖于数值运营的历史经验,且需要人工参与的环节步骤较多。相关技术提供的方案至少存在以下缺点:1)无法充分挖掘出与对象是否流失相关的有效行为特征;2)每个行为特征都需要人工设计一个数值映射函数,耗时耗力,且衡量的准确程度难以保证;3)整体流程中,无论是特征选取还是构建数值映射函数都需要投入较多人工手动处理,效率低下,且数值映射函数一成不变,实时性不足。对象是否流失是行为场景的运营根基之一,通过相关技术提供的方案无法准确地计算出对象的流失概率,容易对行为场景的后续运营造成不良影响,同时也容易损害对象在行为场景中的行为体验。
本申请实施例提供一种基于人工智能的流失处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够通过智能预测的方式提升流失预测的精度。下面说明本申请实施例提供的电子设备的示例性应用,本申请实施例提供的电子设备可以实施为各种类型的终端设备,也可以实施为服务器。
参见图2,图2是本申请实施例提供的基于人工智能的流失处理系统100的架构示意图,终端设备400通过网络300连接服务器200,服务器200连接数据库500,其中,网络300可以是广域网或者局域网,又或者是二者的组合。
在一些实施例中,以电子设备是终端设备为例,本申请实施例提供的基于人工智能的流失处理方法可以由终端设备实现。例如,终端设备400可以对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到多个行为特征分别对应的嵌入特征;对多个行为特征进行线性融合处理得到线性融合特征,对多个行为特征以及多个行为特征分别对应的嵌入特征进行交叉融合处理,得到交叉融合特征;对多个行为特征分别对应的嵌入特征进行线性映射处理及非线性映射处理,得到映射特征;根据线性融合特征、交叉融合特征以及映射特征进行流失预测处理,得到目标对象在行为场景中的对象流失预测结果。其中,行为场景可以是终端设备400所提供的,也可以是其他电子设备提供的;行为特征可以预先存储在终端设备400本地,也可以是终端设备400从外界获取的。
在一些实施例中,以电子设备是服务器为例,本申请实施例提供的基于人工智能的流失处理方法也可以由服务器实现。例如,服务器200可以对目标对象在行为场景中的多个行为特征进行一系列处理,得到目标对象在行为场景中的对象流失预测结果。其中,行为特征可以存储于数据库500中,当然也可以存储在其他位置。
在一些实施例中,本申请实施例提供的基于人工智能的流失处理方法也可以由终端设备及服务器协同实现。例如,终端设备400可以向服务器200发送预测请求,该预测请求中指定了目标对象。服务器200在接收到预测请求时,对目标对象在行为场景中的多个行为特征进行一系列处理,得到目标对象在行为场景中的对象流失预测结果,并将对象流失预测结果发送至终端设备400,以作为对预测请求的响应。其中,行为特征可以是终端设备400发送给服务器200的,例如携带于预测请求中;也可以是服务器200从数据库500或其他存储位置获取的。
在一些实施例中,可以将基于人工智能的流失处理过程中涉及到的各种结果(如各种特征、对象流失预测结果等)存储至区块链中,由于区块链具有不可篡改的特性,因此能够保证区块链中的数据的准确性。电子设备可以向区块链发送查询请求,以查询区块链中存储的数据。
在一些实施例中,终端设备400或服务器200可以通过运行计算机程序来实现本申请实施例提供的基于人工智能的流失处理方法,例如,计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APP,Application),即需要在操作系统中安装才能运行的程序,如游戏应用程序;也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。对于游戏应用程序来说,其可以是策略游戏(SimuLation Game,SLG)、第一人称射击(First-Person Shooting,FPS)游戏、第三人称射击(Third-Personal Shooting,TPS)游戏、多人在线战术竞技(Multiplayer OnlineBattle Arena,MOBA)游戏以及多人枪战类生存游戏中的任意一种,对此不做限定。
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载终端、智能电视等,但并不局限于此。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
在一些实施例中,数据库500和服务器200可以独立设置。在一些实施例中,数据库500和服务器200也可以集成在一起,即数据库500可以视为存在于服务器200内部,与服务器200一体化,服务器200可以提供数据库500的数据管理功能。
以本申请实施例提供的电子设备是终端设备为例说明,可以理解的,对于电子设备是服务器的情况,图3中示出的结构中的部分(例如用户接口、呈现模块和输入处理模块)可以缺省。参见图3,图3是本申请实施例提供的终端设备400的结构示意图,图3所示的终端设备400包括:至少一个处理器410、存储器450、至少一个网络接口420和用户接口430。终端设备400中的各个组件通过总线系统440耦合在一起。可理解,总线系统440用于实现这些组件之间的连接通信。总线系统440除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图3中将各种总线都标为总线系统440。
处理器410可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口430包括使得能够呈现媒体内容的一个或多个输出装置431,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口430还包括一个或多个输入装置432,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器450可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器450可选地包括在物理位置上远离处理器410的一个或多个存储设备。
存储器450包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器450旨在包括任意适合类型的存储器。
在一些实施例中,存储器450能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统451,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块452,用于经由一个或多个(有线或无线)网络接口420到达其他电子设备,示例性的网络接口420包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块453,用于经由一个或多个与用户接口430相关联的输出装置431(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块454,用于对一个或多个来自一个或多个输入装置432之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的基于人工智能的流失处理装置可以采用软件方式实现,图3示出了存储在存储器450中的基于人工智能的流失处理装置455,其可以是程序和插件等形式的软件,包括以下软件模块:嵌入表示模块4551、融合模块4552、映射模块4553以及流失预测模块4554,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
将结合本申请实施例提供的电子设备的示例性应用和实施,说明本申请实施例提供的基于人工智能的流失处理方法。
参见图4A,图4A是本申请实施例提供的基于人工智能的流失处理方法的一个流程示意图,将结合图4A示出的步骤进行说明。
在步骤101中,对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到多个行为特征分别对应的嵌入特征。
这里,采集目标对象在行为场景中的多个行为特征,其中,行为特征用于表示目标对象在行为场景中执行的行为,行为特征的种类可以根据行为场景的具体情况进行定义。例如,在游戏行为场景中,行为特征包括但不限于活跃特征、付费特征、社交特征、活动参与特征,其中,活跃特征包括但不限于在线天数、日均在线时长、最高连续登录天数、活跃变化幅度(登录日在线时长的方差),付费特征包括但不限于元宝(即游戏中的虚拟资源)充值数量、元宝消耗数量,社交特征包括但不限于添加好友个数、聊天次数,活动参与特征包括但不限于参与虎牢次数、参与长平次数、攻击机关兽次数,虎牢、长平以及机关兽均为游戏内的玩法。
对于采集到的行为特征,对其进行嵌入(Embedding)表示处理,得到嵌入特征。这里,嵌入表示处理的目的是对行为特征进行稠密化,以提取行为特征中的关键信息,同时也有助于减少后续处理的工作量。
值得说明的是,目标对象可以是指参与行为场景的多个对象中的任意一个,也可以是指特定的对象,如人为选择的对象。
在一些实施例中,行为特征的种类包括经过独热编码处理的离散行为特征、以及经过离散化处理的连续行为特征;可以通过这样的方式来实现上述的对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到多个行为特征分别对应的嵌入特征:针对任意一个经过独热编码处理的离散行为特征,执行以下处理:对任意一个经过独热编码处理的离散行为特征进行嵌入表示处理,得到离散嵌入特征;步骤102之前,还包括:将经过离散化处理的连续行为特征作为连续嵌入特征。
这里,步骤101中的行为特征可以包括经过独热编码处理的离散行为特征、以及经过离散化处理的连续行为特征两类,其中,离散化处理可以是分桶离散化处理,但并不限于此。对于经过独热编码处理的离散行为特征来说,由于独热编码处理具有稀疏化的特点,因此,可以对经过独热编码处理的离散行为特征进行嵌入表示处理,得到更加稠密的嵌入特征(为了便于区分,命名为离散嵌入特征)。对于经过离散化处理的连续行为特征来说,稀疏性相较于经过独热编码处理的离散行为特征更弱,因此,无需进行嵌入表示处理,即可以将经过离散化处理的连续行为特征本身作为嵌入特征(为了便于区分,命名为连续嵌入特征)。通过上述方式,可以减少嵌入表示处理的工作量。
在一些实施例中,行为特征的种类包括经过独热编码处理的离散行为特征、以及经过离散化处理及独热编码处理的连续行为特征;可以通过这样的方式来实现上述的对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到多个行为特征分别对应的嵌入特征:对经过独热编码处理的离散行为特征进行嵌入表示处理,得到离散嵌入特征;对经过离散化处理及独热编码处理的连续行为特征进行嵌入表示处理,得到连续嵌入特征。
这里,步骤101中的行为特征可以包括经过独热编码处理的离散行为特征、以及经过离散化处理及独热编码处理的连续行为特征两类,由于这两类都经过了独热编码处理,稀疏性较强,因此均进行嵌入表示处理。例如,对经过独热编码处理的离散行为特征进行嵌入表示处理,得到离散嵌入特征;对经过离散化处理及独热编码处理的连续行为特征进行嵌入表示处理,得到连续嵌入特征。
在步骤102中,对多个行为特征进行线性融合处理得到线性融合特征,对多个行为特征以及多个行为特征分别对应的嵌入特征进行交叉融合处理,得到交叉融合特征。
这里,对步骤101采集到的多个行为特征进行线性融合处理得到线性融合特征,其中,线性融合处理是指基于线性关系实现的融合处理。同时,对多个行为特征以及多个行为特征分别对应的嵌入特征进行交叉融合处理,得到交叉融合特征,其中,交叉融合处理涉及到行为特征与嵌入特征之间的交叉,交叉融合处理也可以基于线性关系来实现。
在步骤103中,对多个行为特征分别对应的嵌入特征进行线性映射处理及非线性映射处理,得到映射特征。
这里,对多个行为特征分别对应的嵌入特征进行线性映射处理及非线性映射处理,得到映射特征。其中,线性映射处理及非线性映射处理可以执行多次,从而学习高阶的非线性关系。
值得说明的是,线性映射处理可以基于神经网络中的全连接层(Fully Connectedlayers,FC)实现,非线性映射处理可以基于激活函数实现,如Sigmoid激活函数。
在步骤104中,根据线性融合特征、交叉融合特征以及映射特征进行流失预测处理,得到目标对象在行为场景中的对象流失预测结果。
步骤102得到的线性融合特征以及交叉融合特征可以视为低阶特征,步骤103得到的映射特征可以视为高阶特征,在本申请实施例中,可以结合低阶特征以及高阶特征进行流失预测处理,得到目标对象在行为场景中的对象流失预测结果。
值得说明的是,对象流失预测结果可以用于表示是否流失,即对象流失预测结果可以是流失或不流失;对象流失预测结果也可以用于表示流失概率,即流失的可能性。
值得说明的是,目标对象在行为场景中流失可以是指目标对象在行为场景中执行的行为满足对象流失条件,对象流失条件如行为的数量为零(即不执行任何行为),又如行为特征的数值小于设定的阈值(例如日均在线时长小于时长阈值)。
在一些实施例中,行为场景包括多个子场景;步骤104之后,还包括:对多个目标对象在任意一个子场景中的对象流失预测结果进行结果融合处理,得到任意一个子场景的子场景流失预测结果;根据多个子场景分别对应的子场景流失预测结果,对多个子场景进行筛选处理,得到预流失子场景;对预流失子场景中的行为奖励进行增益处理。
这里,行为场景可以包括多个子场景,子场景可以根据实际应用场景进行划分。例如,在游戏行为场景中,可以将各个游戏副本均作为子场景,可以将地图中的各个区域均作为子场景,也可以将各个游戏玩法均作为子场景。
对于任意一个子场景来说,可以采集目标对象在该子场景中的多个行为特征,并进行一系列处理得到目标对象在该子场景中的对象流失预测结果。然后,可以对多个目标对象在该子场景中的对象流失预测结果进行结果融合处理,得到该子场景的子场景流失预测结果,其中,对结果融合处理的方式不做限定,例如包括但不限于直接求和处理(即不加权的求和处理)、加权求和处理、直接平均处理(即不加权的平均处理)、加权平均处理、取最大值、取最小值、取众数、取中位数。其中,当目标对象的数量仅有一个时,也可以直接将目标对象在该子场景中的对象流失预测结果,作为该子场景的子场景流失预测结果。
在得到多个子场景分别对应的子场景流失预测结果之后,可以对多个子场景进行筛选处理,得到预流失子场景。例如,当子场景流失预测结果用于表示是否流失时,可以将用于表示流失的子场景流失预测结果对应的子场景作为预流失子场景;当子场景流失预测结果用于表示流失概率时,可以将大于流失概率阈值的流失概率对应的子场景作为预流失子场景。
预流失子场景即为预测出的将会出现对象流失的子场景,在筛选出预流失子场景之后,可以对预流失子场景中的行为奖励进行增益处理,以防止可能出现的对象流失。其中,行为奖励表示对象执行行为所获得的奖励,行为奖励所奖励的可以是全部或部分行为,本申请实施例对行为奖励的类型不做限定,可以根据行为场景的具体情况进行设定,例如在游戏行为场景中,行为奖励包括但不限于经验值、虚拟资源。
通过上述方式,能够有效筛选出预流失子场景,并通过增益处理的方式有效避免对象流失,有助于行为场景的长期运营,同时可以提升用户体验。
在一些实施例中,对象流失预测结果用于表示目标对象在行为场景中的流失概率;步骤104之后,还包括:当流失概率大于流失概率阈值时,将目标对象作为预流失对象;对预流失对象在行为场景中的行为奖励进行增益处理。
这里,当目标对象在行为场景中的对象流失预测结果用于表示流失时,可以将目标对象作为预流失对象,并对预流失对象在行为场景中的行为奖励进行增益处理。
当目标对象在行为场景中的对象流失预测结果用于表示目标对象在行为场景中的流失概率时,可以将该流失概率与设定的流失概率阈值进行比对。当流失概率大于流失概率阈值时,将目标对象作为预流失对象,并对预流失对象在行为场景中的行为奖励进行增益处理。通过上述方式,能够在另一层面防止对象流失,有助于行为场景的长期运营,同时可以提升用户体验。
如图4A所示,本申请实施例通过结合低阶特征和高阶特征进行流失预测处理,能够提升得到的对象流失预测结果的精度,进而有助于防止对象流失的相关措施的有效实施。
在一些实施例中,参见图4B,图4B是本申请实施例提供的基于人工智能的流失处理方法的一个流程示意图,图4A示出的步骤102可以通过步骤201至步骤205实现,将结合各步骤进行说明。
在步骤201中,对多个行为特征进行线性融合处理得到线性融合特征。
在一些实施例中,可以通过这样的方式来实现上述的对多个行为特征进行线性融合处理得到线性融合特征:执行以下任意一种处理:对多个行为特征进行加权求和处理,得到线性融合特征;对多个行为特征进行加权平均处理,得到线性融合特征。
这里,提供了对多个行为特征进行线性融合处理的两种示例方式。第一种方式是,根据多个行为特征分别对应的权重,对多个行为特征进行加权求和处理,得到线性融合特征;第二种示例方式是,根据多个行为特征分别对应的权重,对多个行为特征进行加权平均处理,得到线性融合特征。通过上述方式,能够提升线性融合处理的灵活性。
值得说明的是,多个行为特征分别对应的权重可以预先设定。线性融合处理也并不限于加权求和及加权平均,例如还可以是符合线性关系的直接求和、直接平均等。
在步骤202中,对多个行为特征进行组合处理,得到互不相同的多个特征组合。
这里,对多个行为特征进行组合处理,得到多个特征组合,其中,多个特征组合互不相同。例如,可以根据设定的数量阈值对多个行为特征进行组合处理,得到多个特征组合,每个特征组合中的行为特征的数量等于数量阈值。其中,数量阈值可以根据实际应用场景进行设定,如设定为2;组合处理可以是穷举式的组合处理,组合处理时可以不区分特征组合内行为特征的顺序。
在步骤203中,对特征组合中的多个行为特征进行相积处理,得到相积行为特征。
这里,对于每个特征组合,对特征组合中的多个行为特征进行相积处理,为了便于区分,将这里得到的相积结果命名为相积行为特征。如此,可以得到每个特征组合对应的相积行为特征。
在步骤204中,对特征组合中的多个行为特征分别对应的嵌入特征进行相积处理,得到权重。
这里,对于每个特征组合,对特征组合中的多个行为特征分别对应的嵌入特征进行相积处理,得到该特征组合对应的权重。以上涉及的相积处理可以是指内积。如此,可以得到每个特征组合对应的权重。
在步骤205中,根据多个特征组合分别对应的权重,对多个特征组合分别对应的相积行为特征进行线性融合处理,得到交叉融合特征。
这里,根据多个特征组合分别对应的权重,对多个特征组合分别对应的相积行为特征进行线性融合处理(如加权求和处理或加权平均处理),得到交叉融合特征,如此,有效实现了行为特征与嵌入特征的融合。
在图4B中,图4A示出的步骤104可以通过步骤206至步骤207实现,将结合各步骤进行说明。
在步骤206中,对线性融合特征、交叉融合特征以及映射特征进行线性融合处理,得到流失预测特征。
这里,线性融合特征以及交叉融合特征可以视为低阶特征,映射特征可以视为高阶特征,因此,可以对线性融合特征、交叉融合特征以及映射特征进行线性融合处理,得到流失预测特征。
在步骤207中,对流失预测特征进行非线性映射处理,得到目标对象在行为场景中的对象流失预测结果。
例如,可以通过激活函数对流失预测特征进行非线性映射处理,得到目标对象在行为场景中的对象流失预测结果,激活函数如Sigmoid激活函数。
如图4B所示,本申请实施例阐述了交叉融合处理以及流失预测处理的示例方式,能够有效实现低阶特征与高阶特征的融合,提升得到的对象流失预测结果的精度。
在一些实施例中,参见图4C,图4C是本申请实施例提供的训练流失预测模型的一个流程示意图,将结合图4C示出的步骤进行说明。
在步骤301中,通过流失预测模型对样本对象在行为场景中的多个行为特征进行前向传播处理,得到样本对象在行为场景中的对象流失预测结果。
在本申请实施例,步骤101至步骤104可以通过流失预测模型实现,其中,流失预测模型是基于机器学习原理构建的模型,例如可以是神经网络模型。在此之前,可以对流失预测模型进行训练,以保证其精度。
例如,可以采集样本对象在行为场景中的多个行为特征,并通过流失预测模型对样本对象在行为场景中的多个行为特征进行前向传播处理,得到样本对象在行为场景中的对象流失预测结果。其中,前向传播处理包括嵌入表示处理、线性融合处理、交叉融合处理、线性映射处理、非线性映射处理以及流失预测处理,处理过程可以参见步骤101至步骤104的相关描述。
值得说明的是,样本对象可以与目标对象相同,也可以区别于目标对象。
在步骤302中,根据样本对象的对象流失预测结果以及流失标签进行损失计算处理,得到损失值;其中,流失标签用于表示样本对象在行为场景中是否流失。
在得到样本对象的对象流失预测结果之后,可以根据流失预测模型的损失函数对样本对象的对象流失预测结果以及流失标签进行损失计算处理,得到损失值,其中,对损失函数的类型不做限定,例如可以是交叉熵损失函数。
其中,样本对象的流失标签用于表示样本对象在行为场景中是否流失,样本对象的流失标签的采集时间可以晚于样本对象的行为特征的采集时间。
在步骤303中,根据损失值在流失预测模型中进行反向传播处理,以训练流失预测模型;其中,训练后的流失预测模型用于对目标对象在行为场景中的多个行为特征进行前向传播处理,得到目标对象在行为场景中的对象流失预测结果;前向传播处理包括嵌入表示处理、线性融合处理、交叉融合处理、线性映射处理、非线性映射处理以及流失预测处理。
例如,根据损失值在流失预测模型中进行反向传播处理,以实现对流失预测模型的训练,直至损失函数收敛。训练后的流失预测模型即可用于对目标对象的多个行为特征进行前向传播处理,得到目标对象的对象流失预测结果
在一些实施例中,可以通过这样的方式来实现上述的根据损失值在流失预测模型中进行反向传播处理,以训练流失预测模型:根据损失值确定当前梯度;根据当前梯度以及历史梯度均值确定当前梯度均值,根据当前梯度以及历史梯度方差确定当前梯度方差;对当前梯度均值进行偏差纠正处理得到纠正梯度均值,对当前梯度方差进行偏差纠正处理得到纠正梯度方差;根据纠正梯度均值以及纠正梯度方差,更新流失预测模型的权重参数。
这里,提供了根据损失值训练流失预测模型的一种示例。首先,更新时间步,并根据损失值计算当前时间步的当前梯度;根据当前梯度以及历史梯度均值(即上一个时间步的当前梯度均值),确定当前时间步的当前梯度均值;根据当前梯度以及历史梯度方差(即上一个时间步的当前梯度方差),确定当前时间步的当前梯度方差;对当前时间步的当前梯度均值进行偏差纠正处理得到纠正梯度均值;对当前时间步的当前梯度方差进行偏差纠正处理得到纠正梯度方差;根据纠正梯度均值以及纠正梯度方差,更新流失预测模型的权重参数。如此,随着时间步的不断更新,流失预测模型的权重参数也会不断更新,直至损失函数收敛。通过上述方式,能够实现对流失预测模型的有效训练。
在一些实施例中,步骤301之前,还包括:在第一时间窗口内对样本对象进行行为特征采集处理,得到多个行为特征;在第二时间窗口内对样本对象进行行为特征采集处理,得到多个待匹配行为特征;其中,第二时间窗口晚于第一时间窗口;将多个待匹配行为特征与对象流失条件进行匹配处理,并根据匹配结果确定流失标签;其中,多个行为特征以及流失标签用于训练流失预测模型;训练后的流失预测模型用于对目标对象在第三时间窗口的多个行为特征进行前向传播处理,得到目标对象在第四时间窗口的对象流失预测结果;其中,第一时间窗口与第二时间窗口之间的时间差等于第三时间窗口与第四时间窗口之间的时间差。
这里,可以以时间窗口为单位,从行为场景中采集相关信息。例如,在第一时间窗口内对样本对象进行行为特征采集处理,得到多个行为特征。在第二时间窗口内对样本对象进行行为特征采集处理,为了便于区分,将这里采集到的行为特征命名为待匹配行为特征。其中,第二时间窗口晚于第一时间窗口,例如,一个月通常包括四周(四个星期),第一时间窗口是某月的前两周,第二时间窗口是该月的最后一周,则第一时间窗口与第二时间窗口之间的时间差为一周。
在得到多个待匹配行为特征后,将多个待匹配行为特征与对象流失条件进行匹配处理,并根据匹配结果确定流失标签。其中,对象流失条件可以根据实际应用场景进行设定,如行为特征的数值小于设定的阈值(例如日均在线时长小于时长阈值),对象流失条件可以针对多个待匹配行为特征中的全部或部分。当匹配成功时,证明样本对象存在流失的情况,因此确定流失标签为流失;当匹配失败时,证明样本对象不存在流失的情况,因此确定流失标签为不流失(即活跃)。如此,可以实现流失预测模型的训练阶段的输入参数的有效采集。
在完成对流失预测模型的训练后,训练后的流失预测模型可以用于对目标对象在第三时间窗口的多个行为特征进行前向传播处理,得到目标对象在第四时间窗口的对象流失预测结果,其中,第四时间窗口晚于第三时间窗口,第一时间窗口与第二时间窗口之间的时间差等于第三时间窗口与第四时间窗口之间的时间差。第三时间窗口的窗口值(即时长)可以与第一时间窗口的窗口值相同,第四时间窗口的窗口值(即时长)可以与第二时间窗口的窗口值相同。值得说明的是,这里对第三时间窗口与第一时间窗口之间的早晚关系不做限定。上述方式通过规范的时间窗口,能够有效提升模型训练效果以及模型预测的精度。
如图4C所示,本申请实施例根据样本对象的行为特征以及流失标签对流失预测模型进行训练,有助于针对目标对象得到准确的对象流失预测结果。
下面,将说明本申请实施例在实际的应用场景中的示例性应用,为了便于理解,以游戏应用程序提供的游戏行为场景为例进行说明,上述的对象即为游戏应用程序的玩家(或玩家使用的账号)。本申请实施例提供了一种在游戏行为场景中预测玩家是否流失的方案,主要内容如下:1)相较于相关技术提供的方案,本申请实施例能够更加准确、及时地识别出预流失玩家(即预测出的即将流失的玩家),用于计算流失概率的行为特征可以自适应迭代,无需人工筛选或者替换;2)对于玩家而言,在被识别成预流失玩家后,可以从游戏内得到有效关怀,提升游戏体验;3)对游戏而言,识别出预流失玩家后,可以及时对预流失玩家采取相应的关怀措施和改进游戏玩法,避免玩家流失。
首先,从可视化实现的角度说明本申请实施例的方案。游戏应用程序的相关人员(如运营人员)可以周期性地(如一天计算一次)通过训练后的流失预测模型计算出两周后(并不限于两周后,也可以是其他的时间差)的预流失玩家,并对预流失玩家进行行为增益处理,其中,行为增益处理包括但不限于:提升预流失玩家的游戏等级;为预流失玩家分配游戏中的虚拟资源;提升预流失玩家的行为奖励。作为示例,提供了如图5A所示的游戏界面的示意图,其中显示有防流失助力活动的提示,即“恭喜触发xx先生的助力”;提供了如图5B所示的游戏界面的示意图,其中显示有防流失助力活动的详情内容;提供了如图5C所示的游戏界面的示意图,其中显示有玩家参与防流失助力活动所获得的行为奖励。
下面,从底层实现的角度说明本申请实施例的方案。本申请实施例可以基于游戏应用程序的服务器的离线日志数据,采用深度学习框架实现,其中,离线日志数据可以通过腾讯分布式数据仓库(Tencent distributed Data Warehouse,TDW)来进行管理,深度学习框架如Tensorflow深度学习框架。作为示例,提供了如图6所示的基于人工智能的流失处理方法的架构示意图、以及如图7所示的流失预测模型的架构示意图,将结合图6和图7进行说明,其中,图7中的内部为“+”的圆圈表示加权求和操作,内部为“×”的圆圈表示内积操作,深度神经网络层内的圆圈表示激活函数(如Sigmoid激活函数),输出层中的圆圈同样表示激活函数。
传统的简单线性模型缺乏学习高阶特征的能力,很难从训练样本中学习到从未出现或极少出现的重要特征。而本申请实施例提供的流失预测模型结合因子分解机(Factorization Machine,FM)及深度神经网络(Deep Neural Network,DNN),利用FM在一阶特征和二阶特征的简洁高效和DNN在高阶特征交互上的优势,同时通过共享FM和DNN的Embedding(即嵌入特征)来减少参数数量,从而提升模型训练效果。其中,FM通过给每个行为特征引入一个低维稠密的隐向量(即嵌入特征),来减少二阶特征交互的参数个数,同时实现信息共享,使得非常稀疏的行为特征上的学习更容易泛化;Deep通过多层的网络结构可以更好地进行特征表示,从而学习高阶的非线性关系。
为了便于理解,将通过步骤形式进行说明。
1)从TDW的离线日志数据中,选择特征窗口(对应上文的第一时间窗口)内的活跃玩家(即样本对象),特征窗口的时长可以根据实际应用场景进行设定,如设定为两周。统计特征窗口内该活跃玩家的各类行为特征以构建FeatureList,并将特征窗口的两周后(时间差并不限于两周)的一周记为标签窗口(对应上文的第二时间窗口),统计标签窗口内用于表示是否活跃的流失标签Y。其中,FeatureList包括但不限于活跃特征、付费特征、社交特征、活动参与特征等,活跃特征包括但不限于在线天数、日均在线时长、最高连续登录天数、活跃变化幅度(登录日在线时长的方差),付费特征包括但不限于元宝(即虚拟资源)充值数量、元宝消耗数量,社交特征包括但不限于添加好友个数、聊天次数,活动参与特征包括但不限于参与虎牢次数、参与长平次数、攻击机关兽次数,其中,虎牢、长平以及机关兽均为游戏内的玩法。Y是玩家在标签窗口是否流失的标记,如果标签窗口内玩家没有活跃(例如没有登录游戏应用程序),则Y=1;否则Y=0。
值得说明的是,选取行为特征列表FeatureList以及流失标签Y的前提原因是:①玩家自身的活跃/付费/社交/活动参与等特征与玩家后续是否流失是密切相关的;②玩家在标签窗口内的流失与否可以明确表示玩家的活跃情况。
2)构建流失预测模型,该流失预测模型的输入为特征窗口内活跃玩家的FeatureList以及该活跃玩家在标签窗口内是否流失的标签Y。选择合适优化算子,如随机梯度下降(Stochastic Gradient Descent,SGD)、自适应矩估计(Adaptive momentestimation,Adam)等,以更新流失预测模型的权重参数,直到损失函数收敛为止,损失函数收敛即表示流失预测模型训练完成。流失预测模型主要涉及以下两个部分。
①训练部分。流失预测模型的输入特征为特征窗口内的活跃玩家的FeatureList,输入标签为该活跃玩家在标签窗口内是否流失的标签Y。流失预测模型的网络结构如图7所示,即为稀疏特征层->稠密向量层->FM层->DNN层->输出层,将进行分别说明。
在稀疏特征层中,一般的类别特征(即离散行为特征)无法直接输入流失预测模型,所以先对类别特征进行独热编码处理得到0-1稀疏向量表示,其中,类别特征如玩家性别、玩家主玩兵种、玩家登录游戏应用程序所用的平台(iOS/安卓)。对于数值特征(即连续行为特征),进行离散化处理(如分桶离散化处理)以转变为离散型的向量。最终,将独热编码处理后的类别特征以及离散化处理后的数值特征拼接起来,作为稠密向量层的输入。
稠密向量层即为嵌入层,用于对高维稀疏0-1向量(这里指独热编码处理后的类别特征)进行嵌入处理,得到嵌入特征(表现为低维稠密向量),再将每个嵌入特征横向拼接,然后拼接上离散化处理后的数值特征,以作为FM层以及DNN层的输入。其中,可以将离散化处理后的数值特征自身视为嵌入特征。
FM层分为线性部分和交叉部分,线性部分用于对稠密向量层的多个特征进行加权求和处理,交叉部分用于对稀疏特征层中的多个特征进行两两相乘,然后对得到的多个相乘结果进行加权求和,其中,对于通过对稀疏特征层中的两个特征进行相乘得到的相乘结果来说,在加权求和过程中的权重是这两个特征的嵌入特征的内积。然后,将线性部分的输出(对应上文的线性融合特征)以及交叉部分的输出(对应上文的交叉融合特征)进行直接求和处理,得到FM层的输出,其中,直接求和处理是指不加权的求和处理。
DNN层的输入为所有嵌入特征的横向拼接,经过多次的线性映射和非线性映射(又称非线性转换)得到输出。其中,线性映射可以通过全连接层(图7中未示出)实现,但并不限于此;非线性映射可以通过激活函数实现,如Sigmoid激活函数。
输出层的输入为FM层的输出和DNN层的输出的直接求和结果,该直接求和结果实现了低阶和高阶特征之间的交互、融合。然后,对该直接求和结果进行Sigmoid非线性转换,得到流失概率。
流失预测模型的损失函数可以是对玩家预测出的流失概率和该玩家实际的标签Y的交叉熵,计算公式如下所示:
Figure BDA0003314127810000121
其中,yi表示第i个活跃玩家(样本对象)的标签;pi表示第i个活跃玩家的流失概率。
优化算子可以作用于网络结构中的输出层,可以采用训练速度较快的Adam,Adam算法的优点包括但不限于:实现简单、计算高效、对内存需求少、适用于梯度稀疏或梯度存在较大噪声的情况。在Adam算法中,输入如下:
α:步长;β12∈[0,1):指数衰减率;f(θ):权重参数为θ时的损失函数;θ0:初始权重参数;m0:初始一阶冲量向量(初始梯度均值);v0:初始二阶冲量向量(初始梯度方差);t:初始时间步。
Adam的示例实现步骤如下:
当θ0没有收敛的情况下,执行以下处理:
a)t←t+1,更新时间步;
b)
Figure BDA0003314127810000122
计算t时间步的当前梯度;
c)mt←β1·mt-1+(1-β1)·gt,计算当前梯度均值;
d)
Figure BDA0003314127810000123
计算当前梯度方差;
e)
Figure BDA0003314127810000124
对当前梯度均值进行偏差纠正处理得到纠正梯度均值;
f)
Figure BDA0003314127810000125
对当前梯度方差进行偏差纠正处理得到纠正梯度方差;
g)
Figure BDA0003314127810000126
根据纠正梯度均值以及纠正梯度方差更新权重参数;
h)返回θt
②预测部分。在完成对流失预测模型的训练之后,可以将最近的特征窗口(对应上文的第三时间窗口)内活跃玩家的行为特征输入至训练后的流失预测模型,得到该活跃玩家在两周后的流失概率。
根据预先设置的阈值,可以划分出“轻-中-重”这三种依次递增的流失等级,例如,流失等级轻是指流失概率小于0.3,流失等级中是指流失概率大于或等于0.3、且小于或等于0.7,流失等级重是指流失概率大于0.7。对于流失等级为重的玩家,可以及时采取干预手段,如针对性的发布防流失助力活动,以避免其流失。
值得说明的是,本申请实施例还可以针对游戏中的各个玩法(对应上文的子场景)进行流失预测,对于某个玩法来说,在流失预测模型的训练部分,输入特征为特征窗口内参与过该玩法的玩家的FeatureList,输入标签为该玩家在标签窗口内是否参与过该玩法的标签Y。如此,可以及时收集玩家对于玩法的反馈,并结合玩家反馈对玩法做出适当调整,提升玩法的吸引度和玩家留存率。
本申请实施例至少存在以下技术效果:1)能够通过交叉、融合的方式得到更多的有效特征,提升流失预测的准确性;2)流失预测模型的训练无需人工参与且训练速度快,只需定义好输入和输出即可,极大地改进了传统方法过多依靠人工经验和时效性低下的缺点;3)对于游戏的运营方来说,可以及时地对流失等级较高的玩家采取有效的关怀措施,进而提升玩家的游戏体验,维持游戏活跃的稳定。
下面继续说明本申请实施例提供的基于人工智能的流失处理装置455实施为软件模块的示例性结构,在一些实施例中,如图3所示,存储在存储器450的基于人工智能的流失处理装置455中的软件模块可以包括:嵌入表示模块4551,用于对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到多个行为特征分别对应的嵌入特征;融合模块4552,用于对多个行为特征进行线性融合处理得到线性融合特征,对多个行为特征以及多个行为特征分别对应的嵌入特征进行交叉融合处理,得到交叉融合特征;映射模块4553,用于对多个行为特征分别对应的嵌入特征进行线性映射处理及非线性映射处理,得到映射特征;流失预测模块4554,用于根据线性融合特征、交叉融合特征以及映射特征进行流失预测处理,得到目标对象在行为场景中的对象流失预测结果。
在一些实施例中,融合模块4552,还用于:对多个行为特征进行组合处理,得到互不相同的多个特征组合;对特征组合中的多个行为特征进行相积处理,得到相积行为特征;对特征组合中的多个行为特征分别对应的嵌入特征进行相积处理,得到权重;根据多个特征组合分别对应的权重,对多个特征组合分别对应的相积行为特征进行线性融合处理,得到交叉融合特征。
在一些实施例中,流失预测模块4554,还用于:对线性融合特征、交叉融合特征以及映射特征进行线性融合处理,得到流失预测特征;对流失预测特征进行非线性映射处理,得到目标对象在行为场景中的对象流失预测结果。
在一些实施例中,融合模块4552,还用于执行以下任意一种处理:对多个行为特征进行加权求和处理,得到线性融合特征;对多个行为特征进行加权平均处理,得到线性融合特征。
在一些实施例中,行为特征的种类包括经过独热编码处理的离散行为特征、以及经过离散化处理的连续行为特征;嵌入表示模块4551,还用于:针对任意一个经过独热编码处理的离散行为特征,执行以下处理:对任意一个经过独热编码处理的离散行为特征进行嵌入表示处理,得到离散嵌入特征;将经过离散化处理的连续行为特征作为连续嵌入特征。
在一些实施例中,行为特征的种类包括经过独热编码处理的离散行为特征、以及经过离散化处理及独热编码处理的连续行为特征;嵌入表示模块4551,还用于:对经过独热编码处理的离散行为特征进行嵌入表示处理,得到离散嵌入特征;对经过离散化处理及独热编码处理的连续行为特征进行嵌入表示处理,得到连续嵌入特征。
在一些实施例中,行为场景包括多个子场景;流失预测模块4554,还用于:对多个目标对象在任意一个子场景中的对象流失预测结果进行结果融合处理,得到任意一个子场景的子场景流失预测结果;根据多个子场景分别对应的子场景流失预测结果,对多个子场景进行筛选处理,得到预流失子场景;对预流失子场景中的行为奖励进行增益处理。
在一些实施例中,对象流失预测结果用于表示目标对象在行为场景中的流失概率;基于人工智能的流失处理装置455还包括增益模块,用于当流失概率大于流失概率阈值时,将目标对象作为预流失对象;对预流失对象在行为场景中的行为奖励进行增益处理。
在一些实施例中,基于人工智能的流失处理装置455还包括训练模块,用于:通过流失预测模型对样本对象在行为场景中的多个行为特征进行前向传播处理,得到样本对象在行为场景中的对象流失预测结果;根据样本对象的对象流失预测结果以及流失标签进行损失计算处理,得到损失值;其中,流失标签用于表示样本对象在行为场景中是否流失;根据损失值在流失预测模型中进行反向传播处理,以训练流失预测模型;其中,训练后的流失预测模型用于对目标对象在行为场景中的多个行为特征进行前向传播处理,得到目标对象在行为场景中的对象流失预测结果;前向传播处理包括嵌入表示处理、线性融合处理、交叉融合处理、线性映射处理、非线性映射处理以及流失预测处理。
在一些实施例中,训练模块还用于:根据损失值确定当前梯度;根据当前梯度以及历史梯度均值确定当前梯度均值,根据当前梯度以及历史梯度方差确定当前梯度方差;对当前梯度均值进行偏差纠正处理得到纠正梯度均值,对当前梯度方差进行偏差纠正处理得到纠正梯度方差;根据纠正梯度均值以及纠正梯度方差,更新流失预测模型的权重参数。
在一些实施例中,训练模块还用于:在第一时间窗口内对样本对象进行行为特征采集处理,得到多个行为特征;在第二时间窗口内对样本对象进行行为特征采集处理,得到多个待匹配行为特征;其中,第二时间窗口晚于第一时间窗口;将多个待匹配行为特征与对象流失条件进行匹配处理,并根据匹配结果确定流失标签;其中,多个行为特征以及流失标签用于训练流失预测模型;训练后的流失预测模型用于对目标对象在第三时间窗口的多个行为特征进行前向传播处理,得到目标对象在第四时间窗口的对象流失预测结果;其中,第一时间窗口与第二时间窗口之间的时间差等于第三时间窗口与第四时间窗口之间的时间差。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令(即可执行指令),该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行本申请实施例上述的基于人工智能的流失处理方法。
本申请实施例提供一种计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的基于人工智能的流失处理方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个电子设备上执行,或者在位于一个地点的多个电子设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个电子设备上执行。
以上,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。

Claims (12)

1.一种基于人工智能的流失处理方法,其特征在于,包括:
对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到所述多个行为特征分别对应的嵌入特征;
对所述多个行为特征进行线性融合处理得到线性融合特征;
对所述多个行为特征进行组合处理,得到互不相同的多个特征组合;
对所述特征组合中的多个行为特征进行相积处理,得到相积行为特征;
对所述特征组合中的多个行为特征分别对应的嵌入特征进行相积处理,得到权重;
根据所述多个特征组合分别对应的权重,对所述多个特征组合分别对应的相积行为特征进行线性融合处理,得到交叉融合特征;
对所述多个行为特征分别对应的嵌入特征进行线性映射处理及非线性映射处理,得到映射特征;
对所述线性融合特征、所述交叉融合特征以及所述映射特征进行线性融合处理,得到流失预测特征;
对所述流失预测特征进行非线性映射处理,得到所述目标对象在所述行为场景中的对象流失预测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述多个行为特征进行线性融合处理得到线性融合特征,包括:
执行以下任意一种处理:
对所述多个行为特征进行加权求和处理,得到线性融合特征;
对所述多个行为特征进行加权平均处理,得到线性融合特征。
3.根据权利要求1所述的方法,其特征在于,所述行为特征的种类包括经过独热编码处理的离散行为特征、以及经过离散化处理的连续行为特征;所述对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到所述多个行为特征分别对应的嵌入特征,包括:
针对任意一个经过独热编码处理的离散行为特征,执行以下处理:
对所述任意一个经过独热编码处理的离散行为特征进行嵌入表示处理,得到离散嵌入特征;
所述方法还包括:
将经过离散化处理的连续行为特征作为连续嵌入特征。
4.根据权利要求1所述的方法,其特征在于,所述行为特征的种类包括经过独热编码处理的离散行为特征、以及经过离散化处理及独热编码处理的连续行为特征;所述对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到所述多个行为特征分别对应的嵌入特征,包括:
对经过独热编码处理的离散行为特征进行嵌入表示处理,得到离散嵌入特征;
对经过离散化处理及独热编码处理的连续行为特征进行嵌入表示处理,得到连续嵌入特征。
5.根据权利要求1所述的方法,其特征在于,所述行为场景包括多个子场景;所述对所述流失预测特征进行非线性映射处理,得到所述目标对象在所述行为场景中的对象流失预测结果之后,所述方法还包括:
对多个目标对象在任意一个子场景中的对象流失预测结果进行结果融合处理,得到所述任意一个子场景的子场景流失预测结果;
根据所述多个子场景分别对应的子场景流失预测结果,对所述多个子场景进行筛选处理,得到预流失子场景;
对所述预流失子场景中的行为奖励进行增益处理。
6.根据权利要求1所述的方法,其特征在于,所述对象流失预测结果用于表示所述目标对象在所述行为场景中的流失概率;所述对所述流失预测特征进行非线性映射处理,得到所述目标对象在所述行为场景中的对象流失预测结果之后,所述方法还包括:
当所述流失概率大于流失概率阈值时,将所述目标对象作为预流失对象;
对所述预流失对象在所述行为场景中的行为奖励进行增益处理。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述对目标对象在行为场景中的多个行为特征进行嵌入表示处理之前,所述方法还包括:
通过流失预测模型对样本对象在所述行为场景中的多个行为特征进行前向传播处理,得到所述样本对象在所述行为场景中的对象流失预测结果;
根据所述样本对象的对象流失预测结果以及流失标签进行损失计算处理,得到损失值;其中,所述流失标签用于表示所述样本对象在所述行为场景中是否流失;
根据所述损失值在所述流失预测模型中进行反向传播处理,以训练所述流失预测模型;
其中,训练后的所述流失预测模型用于对所述目标对象在所述行为场景中的多个行为特征进行前向传播处理,得到所述目标对象在所述行为场景中的对象流失预测结果;所述前向传播处理包括嵌入表示处理、线性融合处理、交叉融合处理、线性映射处理、非线性映射处理以及流失预测处理。
8.根据权利要求7所述的方法,其特征在于,所述根据所述损失值在所述流失预测模型中进行反向传播处理,以训练所述流失预测模型,包括:
根据所述损失值确定当前梯度;
根据所述当前梯度以及历史梯度均值确定当前梯度均值,根据所述当前梯度以及历史梯度方差确定当前梯度方差;
对所述当前梯度均值进行偏差纠正处理得到纠正梯度均值,对所述当前梯度方差进行偏差纠正处理得到纠正梯度方差;
根据所述纠正梯度均值以及所述纠正梯度方差,更新所述流失预测模型的权重参数。
9.根据权利要求7所述的方法,其特征在于,所述通过流失预测模型对样本对象在所述行为场景中的多个行为特征进行前向传播处理之前,所述方法还包括:
在第一时间窗口内对所述样本对象进行行为特征采集处理,得到多个行为特征;
在第二时间窗口内对所述样本对象进行行为特征采集处理,得到多个待匹配行为特征;其中,所述第二时间窗口晚于所述第一时间窗口;
将所述多个待匹配行为特征与对象流失条件进行匹配处理,并根据匹配结果确定流失标签;
其中,所述多个行为特征以及所述流失标签用于训练所述流失预测模型;训练后的所述流失预测模型用于对所述目标对象在第三时间窗口的多个行为特征进行前向传播处理,得到所述目标对象在第四时间窗口的对象流失预测结果;
其中,所述第一时间窗口与所述第二时间窗口之间的时间差等于所述第三时间窗口与所述第四时间窗口之间的时间差。
10.一种基于人工智能的流失处理装置,其特征在于,所述装置包括:
嵌入表示模块,用于对目标对象在行为场景中的多个行为特征进行嵌入表示处理,得到所述多个行为特征分别对应的嵌入特征;
融合模块,用于对所述多个行为特征进行线性融合处理得到线性融合特征;对所述多个行为特征进行组合处理,得到互不相同的多个特征组合;对所述特征组合中的多个行为特征进行相积处理,得到相积行为特征;对所述特征组合中的多个行为特征分别对应的嵌入特征进行相积处理,得到权重;根据所述多个特征组合分别对应的权重,对所述多个特征组合分别对应的相积行为特征进行线性融合处理,得到交叉融合特征;
映射模块,用于对所述多个行为特征分别对应的嵌入特征进行线性映射处理及非线性映射处理,得到映射特征;
流失预测模块,用于对所述线性融合特征、所述交叉融合特征以及所述映射特征进行线性融合处理,得到流失预测特征;对所述流失预测特征进行非线性映射处理,得到所述目标对象在所述行为场景中的对象流失预测结果。
11.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至9任一项所述的基于人工智能的流失处理方法。
12.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1至9任一项所述的基于人工智能的流失处理方法。
CN202111226130.3A 2021-10-21 2021-10-21 基于人工智能的流失处理方法、装置及电子设备 Active CN113947246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111226130.3A CN113947246B (zh) 2021-10-21 2021-10-21 基于人工智能的流失处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111226130.3A CN113947246B (zh) 2021-10-21 2021-10-21 基于人工智能的流失处理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN113947246A CN113947246A (zh) 2022-01-18
CN113947246B true CN113947246B (zh) 2023-06-13

Family

ID=79332058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111226130.3A Active CN113947246B (zh) 2021-10-21 2021-10-21 基于人工智能的流失处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN113947246B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115779444B (zh) * 2022-03-03 2024-01-19 深圳市梦作坊科技有限公司 一种应用于人工智能的云游戏数据安全防护方法及服务器
CN117618918B (zh) * 2024-01-25 2024-04-19 腾讯科技(深圳)有限公司 虚拟场景处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428937A (zh) * 2020-04-09 2020-07-17 汉海信息技术(上海)有限公司 用户流失的预测方法、装置、电子设备及可读存储介质
CN111709714A (zh) * 2020-06-17 2020-09-25 腾讯云计算(北京)有限责任公司 基于人工智能的流失人员预测方法和装置
CN111932020A (zh) * 2020-08-14 2020-11-13 工银科技有限公司 客户流失预测方法和装置
CN112163165A (zh) * 2020-10-21 2021-01-01 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及计算机可读存储介质
CN112884515A (zh) * 2021-02-22 2021-06-01 上海汽车集团股份有限公司 用户流失的预测方法、装置及计算机存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110443266B (zh) * 2018-05-04 2022-06-24 上海商汤智能科技有限公司 对象预测方法及装置、电子设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428937A (zh) * 2020-04-09 2020-07-17 汉海信息技术(上海)有限公司 用户流失的预测方法、装置、电子设备及可读存储介质
CN111709714A (zh) * 2020-06-17 2020-09-25 腾讯云计算(北京)有限责任公司 基于人工智能的流失人员预测方法和装置
CN111932020A (zh) * 2020-08-14 2020-11-13 工银科技有限公司 客户流失预测方法和装置
CN112163165A (zh) * 2020-10-21 2021-01-01 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及计算机可读存储介质
CN112884515A (zh) * 2021-02-22 2021-06-01 上海汽车集团股份有限公司 用户流失的预测方法、装置及计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
点击预测的关键技术研究;陶竹林;宋格格;黄祥林;;中国传媒大学学报(自然科学版)(第06期);第75-78页 *

Also Published As

Publication number Publication date
CN113947246A (zh) 2022-01-18

Similar Documents

Publication Publication Date Title
US11429844B2 (en) Training policy neural networks using path consistency learning
CN110520868B (zh) 用于分布式强化学习的方法、程序产品和存储介质
CN113947246B (zh) 基于人工智能的流失处理方法、装置及电子设备
US10592822B1 (en) Universal artificial intelligence engine for autonomous computing devices and software applications
US20140087355A1 (en) Gaming platform for the development and execution of customized games and game components
US12099874B2 (en) Trade platform with reinforcement learning network and matching engine
US11144847B1 (en) Reinforcement learning using obfuscated environment models
US11237852B1 (en) Automated graphical user interface generation for goal seeking
CN112990958A (zh) 数据处理方法、装置、存储介质及计算机设备
CN114741423A (zh) 基于人工智能的内容推荐方法及装置
Fujii et al. Estimating counterfactual treatment outcomes over time in multi-vehicle simulation
Fuller et al. Testing the robustness of management decisions to uncertainty: Everglades restoration scenarios
CN117518907A (zh) 智能体的控制方法、装置、设备及存储介质
CN116943220A (zh) 一种游戏人工智能控制方法、装置、设备及存储介质
CN116977661A (zh) 一种数据处理方法、装置、设备、存储介质及程序产品
US11478716B1 (en) Deep learning for data-driven skill estimation
CN117618918B (zh) 虚拟场景处理方法、装置、电子设备及存储介质
US20240346404A1 (en) Techniques for utilizing video games to identify and recruit candidates for job positions
CN117522234B (zh) 基于数字孪生的车队物流指挥决策建模方法、装置及设备
CN110796263B (zh) 用于干预优化的系统和方法
Parsons A Partially Automated Process For the Generation of Believable Human Behaviors
Cheng Grid-like units help deep learning agent to navigate
CN118690076A (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN115115057A (zh) 可持续学习模型的训练方法、装置、设备及存储介质
CN117520667A (zh) 一种网络服务的账号处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant