CN115168740B - 一种基于大数据分析生成营销任务的方法和系统 - Google Patents

一种基于大数据分析生成营销任务的方法和系统 Download PDF

Info

Publication number
CN115168740B
CN115168740B CN202211081350.6A CN202211081350A CN115168740B CN 115168740 B CN115168740 B CN 115168740B CN 202211081350 A CN202211081350 A CN 202211081350A CN 115168740 B CN115168740 B CN 115168740B
Authority
CN
China
Prior art keywords
node
user
value
game
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211081350.6A
Other languages
English (en)
Other versions
CN115168740A (zh
Inventor
张莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Entertainment Interactive Technology Beijing Co ltd
Original Assignee
Entertainment Interactive Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Entertainment Interactive Technology Beijing Co ltd filed Critical Entertainment Interactive Technology Beijing Co ltd
Priority to CN202211081350.6A priority Critical patent/CN115168740B/zh
Publication of CN115168740A publication Critical patent/CN115168740A/zh
Application granted granted Critical
Publication of CN115168740B publication Critical patent/CN115168740B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及营销管理技术领域,具体涉及一种基于大数据分析生成营销任务的方法和系统。该方法包括:构建新游戏的标签序列并基于大数据获取已出厂游戏的标签序列,基于标签序列的相似度获取新游戏的同类别游戏;获取同类别游戏中每个已出厂游戏的所有用户以及每个用户的活跃度表征值和用户之间的互动值;构建每个已出厂游戏对应的用户关联图;基于用户关联图中每个节点的节点信息得到节点的度,根据每个节点的度进行模块化计算并对用户关联图进行图聚类得到多个节点类别;获取每个用户的用户推荐优先级和每个节点类别的类别推荐优先级;结合用户推荐优先级以及类别推荐优先级生成营销任务;营销任务的适用性更强且推广范围更大。

Description

一种基于大数据分析生成营销任务的方法和系统
技术领域
本发明涉及营销管理技术领域,具体涉及一种基于大数据分析生成营销任务的方法和系统。
背景技术
目前,大数据的应用越来越广,基于大数据的营销是大数据应用的重要领域;而基于大数据的营销需要对海量的用户数据进行分析处理,分析处理的过程称为用户画像,用户画像的目的是为用户打上一系列标签,用于标识用户的性别、年龄段、消费能力以及兴趣爱好等;营销过程则是基于标签对目标用户进行筛选,然后以适当地方式向目标用户发送指定内容。
以游戏推广作为实例,现有技术中存在的大多数营销方式是需要人工干预从而实现营销任务的生成,效率较低;因此出现了基于图神经网络辅助游戏营销任务生成的方法,但常用的图聚类在聚合周围节点时往往忽略不同节点之间的影响程度,并且没有考虑到自身信息造成的影响,分析结果误差较大,以至于生成的营销任务适用性较差。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种基于大数据分析生成营销任务的方法和系统,所采用的技术方案具体如下:
第一方面,本发明一个实施例提供了一种基于大数据分析生成营销任务的方法,该方法包括以下步骤:
构建新游戏的标签序列,所述新游戏为待营销的游戏;基于大数据获取已出厂游戏的标签序列,根据所述新游戏与已出厂游戏之间标签序列的相似度获取所述新游戏的同类别游戏;
获取同类别游戏中每个已出厂游戏的所有用户,获取每个用户的活跃度表征值以及任意两个用户之间的互动值;构建每个已出厂游戏对应的用户关联图,所述用户关联图中每个节点为一个用户,节点值为用户对应的活跃度表征值,节点之间的边值为对应两个用户之间的互动值;
基于所述用户关联图中每个节点的节点值以及节点对应连接边的边值得到所述节点的度,根据每个节点的度进行模块化计算,基于模块化计算对所述用户关联图进行图聚类得到多个节点类别;
基于每个节点的节点值以及节点对应连接边的边值获取所述节点的重要性,基于每个所述节点的重要性得到每个用户的用户重要度,根据每个用户的用户重要度得到用户推荐优先级,基于每个所述节点类别中所有用户的用户重要度获取类别推荐优先级;结合用户推荐优先级以及类别推荐优先级生成营销任务。
优选的,所述基于所述用户关联图中每个节点的节点值以及节点对应连接边的边值得到所述节点的度的步骤,包括:
计算所述用户关联图中相连接的两个节点对应节点值的均值,以所述均值作为两个节点之间边值的权值,计算所述权值与所述边值的乘积得到两个节点之间连接边的边权值;
每个节点对应的所有连接边的边权值之和为所述节点的度。
优选的,所述获取每个用户的活跃度表征值以及任意两个用户之间的互动值的步骤,包括:
获取每个用户的游戏向量,所述游戏向量包括每天的登录频率、登录次数、日均在线时长、消费额以及签到率;对所述游戏向量中每个元素进行归一化,计算归一化后游戏向量中所有元素的均值,所述均值为所述用户的活跃度表征值;
获取任意两个用户之间的互动向量,所述互动向量包括游戏值、关注值以及点赞值;获取所述互动向量中所有元素的平均值,所述平均值为两个用户的互动值。
优选的,所述基于每个节点的节点值以及节点对应连接边的边值获取所述节点的重要性的步骤,包括:
获取每个节点对应的所有连接边的边值之和,计算所述节点对应的节点值与边值之和的乘积,所述乘积为所述节点的重要性。
优选的,所述基于每个所述节点的重要性得到每个用户的用户重要度,根据每个用户的用户重要度得到用户推荐优先级的步骤,包括:
以已出厂游戏与新游戏之间标签序列的相似度作为所述已出厂游戏的权重,将所述权重与所述已出厂游戏中每个节点对应的重要性相乘,相乘之后的乘积为每个所述节点对应用户的用户重要度;
所述用户重要度越大,所述用户的用户推荐优先级越高。
优选的,所述基于每个所述节点类别中所有用户的用户重要度获取类别推荐优先级的步骤,包括:
获取每个所述节点类别中所有用户的用户重要度之和记为综合重要度,统计每个所述节点类别中所有节点的数量,计算所述综合重要度与所述数量的乘积;
所述乘积越大,所述节点类别的类别推荐优先级越高。
优选的,所述根据所述新游戏与已出厂游戏之间标签序列的相似度获取所述新游戏的同类别游戏的步骤,包括:
获取所述新游戏的标签序列与每个所述已出厂游戏的标签序列之间的交集和并集,交集为相同标签的数量,并集为所有标签的数量;计算交集与并集的比值为相似度;
相似度大于预设阈值的已出厂游戏为所述新游戏的同类别游戏。
优选的,所述结合用户推荐优先级以及类别推荐优先级生成营销任务的步骤,包括:
获取需要推荐的人数以及所有节点类别的数量,若需要推荐的人数不超过所有节点类别的数量,在所有的节点类别中依次从类别推荐优先级最高的开始,每个节点类别中选取一个用户进行推荐,直至达到推荐人数;每个节点类别中选取出的用户为当前节点类别中用户推荐优先级最大的用户;
若需要推荐的人数超过所有节点类别的数量,按照所有节点类别的类别推荐优先级从高到低进行推荐,每个节点类别中选取一个用户推荐优先级最大的用户;将已经被推荐的用户在对应节点类别中筛除;按照所有节点类别的类别推荐优先级从高到低再次进行推荐,每个推荐用户为当前节点类别中用户推荐优先级最大的用户,直至达到推荐人数;
根据所有被推荐的用户生成对应的营销任务。
优选的,所述游戏值、关注值以及点赞值的获取步骤,包括:
获取两个用户所有游戏场次中的交集和并集,基于交集的数量和并集的数量获取交并比为所述游戏值;所述交集的数量为两个用户一起游戏的游戏次数;
若两个用户相互关注,则关注值为1;若两个用户没有相互关注,则关注值为0;
获取两个用户之间点赞次数的比值,所述比值为两个用户之间点赞次数中的较小值与较大值的比值,所述比值为点赞值。
第二方面,本发明另一个实施例提供了一种基于大数据分析生成营销任务的系统,该系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器在执行所述计算机程序时实现如上述一种基于大数据分析生成营销任务的方法所述的步骤。
本发明具有如下有益效果:首先,通过大数据库获取所有已出厂游戏的标签序列,计算已出厂游戏与新游戏的标签序列之间的相似度从而得到新游戏的同类别游戏,对同类别游戏中的用户进行营销推广,保证了推广人群的精准度;其次,根据每个用户自身的活跃度信息以及用户与用户之间的互动信息构建用户关联图,进一步结合用户的活跃度信息以及用户之间的互动信息进行图聚类得到多个节点类别,考虑到用户与用户之间的影响程度以及自身信息,使得图聚类得到多个节点类别的结果更具有参考意义;最后,获取每个用户的用户推荐优先级以及每个节点类别的类别推荐优先级,通过类别推荐优先级以及用户推荐优先级共同选取推荐用户生成营销任务,保证了被推荐用户在所有用户之间的重要程度,生成的营销任务适用性更佳,推广范围更大。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于大数据分析生成营销任务的方法流程图;
图2为本发明一个实施例所提供的一种用户关联图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于大数据分析生成营销任务的方法和系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
本申请所适用的具体场景是对即将推出的新游戏进行用户推荐并生成营销任务,具体的,下面结合附图具体的说明本发明所提供的一种基于大数据分析生成营销任务的方法和系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种基于大数据分析生成营销任务的方法流程图,该方法包括以下步骤:
步骤S100,构建新游戏的标签序列,新游戏为待营销的游戏;基于大数据获取已出厂游戏的标签序列,根据新游戏与已出厂游戏之间标签序列的相似度获取新游戏的同类别游戏。
对于新推出的新游戏而言,往往在内测阶段有专业人员对游戏的类型进行标注,也就是为游戏分配标签作为新游戏的标签信息,标签包括武侠、格斗、休闲等类型,每种类型的标签采用不用的数字进行标记;新游戏即为待营销游戏,以新游戏被标注的标签构建该新游戏对应的标签序列。
进一步的,基于大量历史数据获取已出厂游戏对应的标签序列,已出厂游戏即为已经营销完成的游戏,通过新游戏与已出厂游戏之间标签序列的相似度获取该新游戏相同类别的已出厂游戏;相似度的获取方法为:获取新游戏的标签序列与每个已出厂游戏的标签序列之间的交集和并集,交集即为相同标签的数量,并集为所有标签类型的数量;计算交集与并集的比值,该比值即为该新游戏与已出厂游戏之间的相似度;当相似度大于预设阈值时,表明该新游戏与这个已出厂游戏为同类别游戏。
作为优选,本发明实施例中设置预设阈值为0.8,即已出厂游戏与新游戏的标签序列相似度大于0.8时,该新游戏与该已出厂游戏为同类别游戏。
以此类推,在多个已出厂游戏中获取待营销的新游戏对应的所有同类别游戏。
步骤S200,获取同类别游戏中每个已出厂游戏的所有用户,获取每个用户的活跃度表征值以及任意两个用户之间的互动值;构建每个已出厂游戏对应的用户关联图,用户关联图中每个节点为一个用户,节点值为用户对应的活跃度表征值,节点之间的边值为对应两个用户之间的互动值。
由步骤S100中得到新游戏的多个同类别游戏,获取所有同类别游戏对应的用户,根据每个用户对应的相关游戏信息表示每个用户的游戏向量,本发明实施例中游戏向量的元素包括用户每天的登录频率、登录次数、日均在线时长、消费额以及签到率;由此获取所有用户对应的游戏向量。
进一步的,由于游戏向量中每个位置元素的量纲不同,因此需要对游戏向量中的量纲进行统一,首先通过所有的用户对应的相关游戏信息获取每个元素对应的最大值,例如登录频率的最大值、登录次数的最大值、日均在线时长的最大值、消费额的最大值以及签到率的最大值,以每个元素的最大值作为对应元素的归一化基数,从而获取游戏向量中每个位置元素的归一化结果,以实现对游戏向量中每个位置元素的量纲统一。
然后对归一化后的游戏向量进行分析,获取每个用户对应的活跃度表征值,活跃度表征值的获取方法为:计算游戏向量中所有元素的均值,以该均值作为对应用户的活跃度表征值;活跃度表征值越大,表明该用户在此游戏中越活跃。
本发明实施例的目的是为了生成新游戏的营销任务,因此以新游戏的同类别游戏中所有的用户作为需要分析用户,从所有的用户中找出其中重要程度大的用户;对同类别游戏中的用户之间的关系进行分析构建用户关联图,同类别游戏中每个已出厂游戏对应一个用户关联图,用户关联图中每个节点即为一个用户,节点的节点值为每个用户对应的活跃度表征值。用户关联图用于反映玩此游戏的用户之间的联系;例如:用户A和用户B经常一起玩游戏,即用户A和用户B的互动频率较大;当用户A去玩另外一个游戏时,有较大概率会拉动用户B也去玩另外一个游戏;用户A与用户C的互动频率较大,而用户B与用户C之间的互动频率较小时,说明在该游戏中相比于用户B和用户C,用户A的重要性较大;当用户A玩游戏的频率减少时,有较大概率会使得用户B与用户C玩游戏的频率减少;因此用户A可以看作是具有带动作用的用户,与多个用户之间的关联性较强,且用户A的活跃度能够带动其他用户的活跃度,将类似于用户A的用户标记为主导用户,主导用户的重要程度较大。
在每个已出厂游戏对应的用户关联图中,重要程度大的节点主要分为两类:一类是节点值较大的节点,对应用户的活跃度较大;另外一类为与周边节点关联度大的节点,该类节点即为主导用户对应的节点;对于营销任务来说,活跃度高的用户能够提高游戏收益,而主导用户的作用是用来引流,尽可能的带动其他用户体验新的游戏。
在对不同已出厂游戏中的用户分析时,首先要对用户关联图中每个节点的重要性进行分析,此时用户关联图中每个节点的节点值为对应用户的活跃度表征值,而用户关联图中相互连接的节点表示的是存在互动信息的两个用户,本发明实施例中以用户与用户之间的互动值来作为对应节点之间的边值;节点之间的边值获取的具体方法为:
首先,构建用户与用户之间的互动向量以得到互动值;本发明实施例中用户与用户之间存在互动信息是指:两个用户之间存在一起玩游戏,互相关注以及点赞等行为;将用户之间的互动信息构成对应的互动向量,该互动向量中包括:游戏值、关注值以及点赞值;关注值的取值为0和1,两个用户之间相互关注时,关注值为1,未相互关注时,关注值为0;点赞值的获取是根据两个用户之间点赞次数的比值获取;游戏值的获取是基于两个用户之间游戏次数的交并比获取,作为一个示例,假设用户A一共玩了1000场游戏,其中700场游戏与用户B一起;用户B一共玩了1100场游戏,其中700场游戏与用户A一起;700场游戏中用户A对用户B点赞450次,用户B对用户A点赞600次,则用户A与用户B之间的游戏值为450/600=0.75;用户A与用户B之间游戏值为0.5,即用户A与用户B之间的交集是700,用户A与用户B之间的并集是1400,交并比为700/1400=0.5。
然后,获取任意两个存在互动信息的用户之间的互动向量,计算互动向量中所有元素的平均值,本发明实施例中将互动向量中所有元素的平均值作为这两个用户之间的互动值,即这两个用户对应节点之间的边值为互动值。
基于每个已出厂游戏中所有用户、用户对应的活跃度表征值以及用户之间的互动值构建完整的用户关联图。
步骤S300,基于用户关联图中每个节点的节点值以及节点对应连接边的边值得到节点的度,根据每个节点的度进行模块化计算,基于模块化计算对用户关联图进行图聚类得到多个节点类别。
具体的,由步骤S200中构建出每个已出厂游戏对应的用户关联图,通过对用户关联图进行聚类,对聚类后的用户关联图结合该已出厂游戏与新游戏之间的相似度评估每个用户的重要程度;聚类的目的是为了筛选出重要性大的用户,即在用户关联图中找出重要程度大的节点,由步骤S200中已知重要程度大的节点主要分为两类:一类是节点值较大的节点,对应用户的活跃度较大;另外一类为与周边节点关联度大的节点,该类节点即为主导用户对应的节点;因此基于这两类特征对用户关联图进行聚类,通过依次提高聚类的要求完成对重要性大的用户的筛选。
现有大多数进行图聚类的算法是格里-纽曼算法,但是格里-纽曼算法中节点值以及边值均没有实际值,仅仅是基于节点之间的相互连接关系进行聚类;而本发明实施例中的用户关联图内每个节点均对应节点值,且节点与节点之间也具有相应的边值,因此需要对格里-纽曼算法进行修改以适应本发明实施例中用户关联图的图聚类。
具体的,格里-纽曼算法中的模块化是用于衡量网络或图结构的度量,它衡量将网络划分为模块(也称为组、集群或社区)的强度;即模块化是不同节点之间的关联信息,因此可通过模块化的计算判断节点之间的关联性,以关联性作为后续图聚类的依据;现有格里-纽曼算法中模块化计算的公式为:
Figure 320157DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
表示模块值;
Figure 615134DEST_PATH_IMAGE004
表示图中边的数量;
Figure DEST_PATH_IMAGE005
表示节点标识;
Figure 264290DEST_PATH_IMAGE006
表示节点标识;
Figure DEST_PATH_IMAGE007
表示相连情况,如果节点
Figure 549778DEST_PATH_IMAGE005
与节点
Figure 113221DEST_PATH_IMAGE006
相连,则
Figure 964502DEST_PATH_IMAGE008
,否则
Figure DEST_PATH_IMAGE009
Figure 925505DEST_PATH_IMAGE010
表示节点
Figure 495027DEST_PATH_IMAGE005
的度;
Figure DEST_PATH_IMAGE011
表示节点
Figure 802773DEST_PATH_IMAGE006
的度;
Figure 774141DEST_PATH_IMAGE012
表示节点
Figure 437203DEST_PATH_IMAGE005
的簇标识;
Figure DEST_PATH_IMAGE013
表示节点
Figure 697283DEST_PATH_IMAGE006
的簇标识;
Figure 342809DEST_PATH_IMAGE014
的取值为0和1,当
Figure DEST_PATH_IMAGE015
时取值为1,当
Figure 496579DEST_PATH_IMAGE016
时取值为0。
本发明实施例的用户关联图中每个节点对应节点值,且节点之间具有边值,因此以节点值和边值对模块化过程中每个节点的度进行更新,即将每个节点对应的节点值以及节点与节点之间的边值赋予每个节点,本发明实施例中将节点值以及边值称为节点信息,将节点信息融入用户关联图中获取每个节点的度的方法为:
(1)由于节点之间的边值表示的是两个节点对应用户之间的互动值,互动值越大,关联性越强;每个节点的节点值表示的是用户对应的活跃度表征值,用户活跃度越大,则节点值越大;因此计算相连接的两个节点对应的节点值的均值,以该节点值的均值作为这两个节点对应用户的综合活跃度,以该综合活跃度作为这两个节点之间边值的权重。
(2)原有格里-纽曼算法中模块化计算时每个节点的度是有该节点对应的边得到的,即节点存在连接边的数量为该节点对应的度;通过上述(1)中将节点之间的综合活跃度作为边值的权值,由此可以对用户关联图中所有节点之间的边值进行更新,以该权值与边值的乘积得到新的边权值,由每个节点对应的所有连接边的边权值的和得到每个节点的度。
作为一个示例,请参阅图2,其示出一种用户关联图,包括节点x、节点y、节点z以及节点w;其中节点x的节点值为0.8,节点y的节点值为0.4,节点z的节点值为0.5,节点w的节点值为0.6;节点x与节点y之间的边值为0.4,节点x与节点z之间的边值为0.5,节点x与节点w之间的边值为0.5,节点z与节点w之间的边值为0.6;节点x与节点y之间的综合活跃度为0.6,节点x与节点z之间的综合活跃度为0.65,节点x与节点w之间的综合活跃度为0.7,节点z与节点w之间的综合活跃度为0.55;以节点之间的综合活跃度作为对应边值的权重得到边权值,则节点x与节点y之间的边权值为0.6*0.4=0.24,节点x与节点z之间的边权值为0.65*0.5=0.325,节点x与节点w之间的边权值为0.7*0.5=0.35,节点z与节点w之间的边权值为0.55*0.6=0.33;由此计算每个节点的度,节点x的度为0.24+0.35+0.325=0.915,节点y的度为0.24,节点z的度为0.325+0.33=0.655,节点w的度为0.35+0.33=0.68。
利用上述(1)和(2)的方法将节点信息融入用户关联图中,由此可基于用户关联图中每个节点更新的度进行模块化计算,即利用每个节点更新后的度代替公式中的
Figure DEST_PATH_IMAGE017
。通过节点更新后的度代入模块化计算公式中进行图聚类,图聚类的具体过程为现有技术,不再赘述。
需要说明的是,本发明实施例中图聚类过程迭代的截止条件与现有不同,具体是设置截止阈值,当某次迭代后,两个类别之间的边权值小于截止阈值时,这两个类别停止迭代,即不再参与后续的迭代聚类过程。
作为优选,本发明实施例中设置截止阈值为经验值0.01,即两个类别之间的边权值小于0.01时,这两个类别停止迭代。
通过多次的迭代操作将用户关联图划分为多个社区簇,将同一个社区簇内的节点作为同一个节点类别,同一个节点类别中的用户之间联系性较强,也即是同一个节点类别之间的相互影响较大,当同类别中存在某个用户参与了新游戏之后,有较大概率会带动该节点类别中其他用户也参与到新游戏之中。
步骤S400,基于每个节点的节点值以及节点对应连接边的边值获取节点的重要性,基于每个节点的重要性得到每个用户的用户重要度,根据每个用户的用户重要度得到用户推荐优先级,基于每个节点类别中所有用户的用户重要度获取类别推荐优先级;结合用户推荐优先级以及类别推荐优先级生成营销任务。
由步骤S300中对用户关联图进行图聚类得到多个节点类别,进一步计算每个节点类别中每个节点对应的重要程度;由于每个节点的重要程度主要由节点对应的节点值以及节点之间的边值反映,节点值越大,该节点对应的用户越活跃;节点之间的边值越大,节点对应的两个用户之间的互动越频繁,则节点对应的重要性越大;因此基于每个节点对应的节点信息计算对应节点的重要性,重要性的计算公式为:
Figure DEST_PATH_IMAGE019
其中,
Figure 363166DEST_PATH_IMAGE020
表示节点的重要性;
Figure DEST_PATH_IMAGE021
表示节点的节点值;
Figure 438438DEST_PATH_IMAGE022
表示节点对应的第
Figure 648839DEST_PATH_IMAGE005
条连接边的边值;
Figure DEST_PATH_IMAGE023
表示节点对应的所有连接边的数量。
节点的重要性越大,表明该节点的重要程度越大;以此类推,获取每个节点类别中每个节点对应重要性,即获取该已出厂游戏下每个用户对应的重要性;对每个节点类别中所有节点进行排序,排序的方法根据节点对应的重要性进行降序排列。
由步骤S100中得到了与新游戏同类别的多个已出厂游戏,且已知同类别游戏中每个已出厂游戏与新游戏之间标签序列的相似度,以该相似度作为每个已出厂游戏的权重,对每个已出厂游戏对应的所有用户的重要性进行更新,即将每个已出厂游戏中每个用户的重要性与该已出厂游戏对应的相似度相乘,从而达到对该已出厂游戏中每个用户的重要性更新的目的,将更新后的重要性记为用户重要度。
进一步的,获取类别推荐优先级,每个已出厂游戏的所有用户对应了多个节点类别,节点类别中人数越多,则该节点类别越具有推荐意义;每个节点类别的综合重要度越大,则该节点类别对应的推荐优先级越高;因此首先计算每个节点类别中所有用户对应的用户重要度的和记为综合重要度;进一步统计该节点类别中所有用户的数量,计算所有用户的数量与该综合重要度的乘积,乘积越大,该节点类别的类别推荐优先级越高。
相应的,本发明实施例根据每个节点类别中每个用户的用户重要度决定用户推荐优先级,用户重要度越大,则该用户的用户推荐优先级越大。
根据每个节点类别对应的类别推荐优先级以及每个用户对应的用户推荐优先级生成最佳的营销任务;根据所制定的推荐人数在所有的节点类别中选取用户进行推荐;在实际进行营销推荐时,首先获取与新游戏同类别的所有已出厂游戏中的节点类别的数量。
若需要推荐的人数不超过所有节点类别的数量,则在所有的节点类别中依次从类别推荐优先级最高的开始,每个节点类别中选取一个用户进行推荐,直至达到推荐人数;每个节点类别中选取出的用户为当前节点类别中用户推荐优先级最大的用户;以保证每个节点类别中都尽量有被推荐的用户,避免被推荐的主导用户所带动的人数重复,做到推荐效果的最大化。
若需要推荐的人数超过所有节点类别的数量,首先按照所有节点类别的类别推荐优先级从高到低进行推荐,每个节点类别中选取一个用户进行推荐,被推荐的该用户为当前节点类别中用户推荐优先级最大的用户;然后将每个节点类别中已经被推荐的用户在对应节点类别中筛除,按照所有节点类别的类别推荐优先级再次从高到低进行推荐,每个节点类别中选取一个用户进行推荐,被推荐的该用户为当前节点类别中除了筛除的用户之外用户推荐优先级最大的用户,以此类推,直至达到推荐人数停止选取。
根据选取出的所有被推荐的用户生成营销任务,以实现精准推广。
综上所述,本发明实施例中通过获取与新游戏同类别的多个已出厂游戏,然后对所有同类别的已出厂游戏中所有用户进行分析,获取每个用户对应的活跃度表征值以及用户与用户之间的互动值,然后以每个用户作为一个节点,活跃度表征值作为节点值,互动值作为边值构建用户关联图,通过对用户关联图进行图聚类得到其中多个节点类别,且图聚类的方法利用与本发明实施例更加适用的改进的格里-纽曼算法,进而将每个已出厂游戏对应的所有用户划分为多个节点类别;进一步获取每个用户对应的重要性,结合该已出厂游戏与新游戏之间的相似度对该已出厂游戏对应的每个用户的重要性进行更新得到用户重要度;根据每个节点类别中的用户重要度以及用户人数得到类别推荐优先级,根据用户重要度决定用户推荐优先级;最终根据需要推荐的人数在所有已出厂游戏的用户种选取主导用户进行推荐,主导用户的选取规则均是基于类别推荐优先级与用户推荐优先级决定的,最终生成最佳的营销任务;联合了用户之间的互动信息进行分析,增加了后续分析的可靠性,且基于用户推荐优先级和类别推荐优先级对营销任务生成,保证了效率的同时做到推荐效果最大化。
基于与上述方法实施例相同的发明构思,本发明实施例还提供了一种基于大数据分析生成营销任务的系统,该系统包括:存储器、处理器以及存储在所述存储器中并可在处理器上运行的计算机程序。处理器执行所述计算机程序时实现上述一种基于大数据分析生成营销任务的方法实施例中的步骤,例如图1所示的步骤。该一种基于大数据分析生成营销任务的方法在上述实施例中已经详细说明,不再赘述。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于大数据分析生成营销任务的方法,其特征在于,该方法包括以下步骤:
构建新游戏的标签序列,所述新游戏为待营销的游戏;基于大数据获取已出厂游戏的标签序列,根据所述新游戏与已出厂游戏之间标签序列的相似度获取所述新游戏的同类别游戏;
获取同类别游戏中每个已出厂游戏的所有用户,获取每个用户的活跃度表征值以及任意两个用户之间的互动值;构建每个已出厂游戏对应的用户关联图,所述用户关联图中每个节点为一个用户,节点值为用户对应的活跃度表征值,节点之间的边值为对应两个用户之间的互动值;
基于所述用户关联图中每个节点的节点值以及节点对应连接边的边值得到所述节点的度,根据每个节点的度进行模块化计算,基于模块化计算对所述用户关联图进行图聚类得到多个节点类别;
基于每个节点的节点值以及节点对应连接边的边值获取所述节点的重要性,基于每个所述节点的重要性得到每个用户的用户重要度,根据每个用户的用户重要度得到用户推荐优先级,基于每个所述节点类别中所有用户的用户重要度获取类别推荐优先级;结合用户推荐优先级以及类别推荐优先级生成营销任务;
其中,所述基于所述用户关联图中每个节点的节点值以及节点对应连接边的边值得到所述节点的度的步骤,包括:
计算所述用户关联图中相连接的两个节点对应节点值的均值,以所述均值作为两个节点之间边值的权值,计算所述权值与所述边值的乘积得到两个节点之间连接边的边权值;
每个节点对应的所有连接边的边权值之和为所述节点的度。
2.根据权利要求1所述的一种基于大数据分析生成营销任务的方法,其特征在于,所述获取每个用户的活跃度表征值以及任意两个用户之间的互动值的步骤,包括:
获取每个用户的游戏向量,所述游戏向量包括每天的登录频率、登录次数、日均在线时长、消费额以及签到率;对所述游戏向量中每个元素进行归一化,计算归一化后游戏向量中所有元素的均值,所述均值为所述用户的活跃度表征值;
获取任意两个用户之间的互动向量,所述互动向量包括游戏值、关注值以及点赞值;获取所述互动向量中所有元素的平均值,所述平均值为两个用户的互动值。
3.根据权利要求1所述的一种基于大数据分析生成营销任务的方法,其特征在于,所述基于每个节点的节点值以及节点对应连接边的边值获取所述节点的重要性的步骤,包括:
获取每个节点对应的所有连接边的边值之和,计算所述节点对应的节点值与边值之和的乘积,所述乘积为所述节点的重要性。
4.根据权利要求1所述的一种基于大数据分析生成营销任务的方法,其特征在于,所述基于每个所述节点的重要性得到每个用户的用户重要度,根据每个用户的用户重要度得到用户推荐优先级的步骤,包括:
以已出厂游戏与新游戏之间标签序列的相似度作为所述已出厂游戏的权重,将所述权重与所述已出厂游戏中每个节点对应的重要性相乘,相乘之后的乘积为每个所述节点对应用户的用户重要度;
所述用户重要度越大,所述用户的用户推荐优先级越高。
5.根据权利要求1所述的一种基于大数据分析生成营销任务的方法,其特征在于,所述基于每个所述节点类别中所有用户的用户重要度获取类别推荐优先级的步骤,包括:
获取每个所述节点类别中所有用户的用户重要度之和记为综合重要度,统计每个所述节点类别中所有节点的数量,计算所述综合重要度与所述数量的乘积;
所述乘积越大,所述节点类别的类别推荐优先级越高。
6.根据权利要求1所述的一种基于大数据分析生成营销任务的方法,其特征在于,所述根据所述新游戏与已出厂游戏之间标签序列的相似度获取所述新游戏的同类别游戏的步骤,包括:
获取所述新游戏的标签序列与每个所述已出厂游戏的标签序列之间的交集和并集,交集为相同标签的数量,并集为所有标签的数量;计算交集与并集的比值为相似度;
相似度大于预设阈值的已出厂游戏为所述新游戏的同类别游戏。
7.根据权利要求1所述的一种基于大数据分析生成营销任务的方法,其特征在于,所述结合用户推荐优先级以及类别推荐优先级生成营销任务的步骤,包括:
获取需要推荐的人数以及所有节点类别的数量,若需要推荐的人数不超过所有节点类别的数量,在所有的节点类别中依次从类别推荐优先级最高的开始,每个节点类别中选取一个用户进行推荐,直至达到推荐人数;每个节点类别中选取出的用户为当前节点类别中用户推荐优先级最大的用户;
若需要推荐的人数超过所有节点类别的数量,按照所有节点类别的类别推荐优先级从高到低进行推荐,每个节点类别中选取一个用户推荐优先级最大的用户;将已经被推荐的用户在对应节点类别中筛除;按照所有节点类别的类别推荐优先级从高到低再次进行推荐,每个推荐用户为当前节点类别中用户推荐优先级最大的用户,直至达到推荐人数;
根据所有被推荐的用户生成对应的营销任务。
8.根据权利要求2所述的一种基于大数据分析生成营销任务的方法,其特征在于,所述游戏值、关注值以及点赞值的获取步骤,包括:
获取两个用户所有游戏场次中的交集和并集,基于交集的数量和并集的数量获取交并比为所述游戏值;所述交集的数量为两个用户一起游戏的游戏次数;
若两个用户相互关注,则关注值为1;若两个用户没有相互关注,则关注值为0;
获取两个用户之间点赞次数的比值,所述比值为两个用户之间点赞次数中的较小值与较大值的比值,所述比值为点赞值。
9.一种基于大数据分析生成营销任务的系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器在执行所述计算机程序时,实现上述权利要求1-8任意一项所述方法的步骤。
CN202211081350.6A 2022-09-06 2022-09-06 一种基于大数据分析生成营销任务的方法和系统 Active CN115168740B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211081350.6A CN115168740B (zh) 2022-09-06 2022-09-06 一种基于大数据分析生成营销任务的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211081350.6A CN115168740B (zh) 2022-09-06 2022-09-06 一种基于大数据分析生成营销任务的方法和系统

Publications (2)

Publication Number Publication Date
CN115168740A CN115168740A (zh) 2022-10-11
CN115168740B true CN115168740B (zh) 2022-11-15

Family

ID=83481591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211081350.6A Active CN115168740B (zh) 2022-09-06 2022-09-06 一种基于大数据分析生成营销任务的方法和系统

Country Status (1)

Country Link
CN (1) CN115168740B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116827808B (zh) * 2023-08-30 2023-10-31 深圳市计通智能技术有限公司 一种基于工业物联网的多设备联合通讯系统、方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7853622B1 (en) * 2007-11-01 2010-12-14 Google Inc. Video-related recommendations using link structure
CN104217156A (zh) * 2013-06-03 2014-12-17 腾讯科技(深圳)有限公司 防止游戏外挂的方法及装置
CN107609063A (zh) * 2017-08-29 2018-01-19 重庆邮电大学 一种多标签分类的手机应用推荐系统及其方法
CN113780415A (zh) * 2021-09-10 2021-12-10 平安科技(深圳)有限公司 基于小程序游戏的用户画像生成方法、装置、设备及介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014049884A1 (en) * 2012-09-26 2014-04-03 DeNA Co., Ltd. System and method for providing a recommendation of a game based on a game-centric relationship graph
CN106407239A (zh) * 2015-08-03 2017-02-15 阿里巴巴集团控股有限公司 用于推荐及辅助推荐信息的方法及装置
CN106022877A (zh) * 2016-05-19 2016-10-12 华南理工大学 一种基于用户手游行为图谱的游戏推荐方法
CN106920125A (zh) * 2017-02-20 2017-07-04 浙江工商大学 基于点边权值影响的多级供应商网络演化方法
CN109978608A (zh) * 2019-03-05 2019-07-05 广州海晟科技有限公司 目标用户画像的营销标签分析提取方法及系统
CN110175291B (zh) * 2019-05-24 2021-09-07 武汉斗鱼网络科技有限公司 基于相似度计算的手游推荐方法、存储介质、设备及系统
CN110222267B (zh) * 2019-06-06 2023-07-25 中山大学 一种游戏平台信息推送方法、系统、存储介质及设备
CN113268589B (zh) * 2020-02-14 2023-09-22 腾讯科技(深圳)有限公司 关键用户识别方法、装置、可读存储介质和计算机设备
CN111953763B (zh) * 2020-08-06 2021-06-25 腾讯科技(深圳)有限公司 一种业务数据推送方法、装置及存储介质
CN114588633B (zh) * 2022-05-09 2022-10-04 深圳尚米网络技术有限公司 一种内容推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7853622B1 (en) * 2007-11-01 2010-12-14 Google Inc. Video-related recommendations using link structure
CN104217156A (zh) * 2013-06-03 2014-12-17 腾讯科技(深圳)有限公司 防止游戏外挂的方法及装置
CN107609063A (zh) * 2017-08-29 2018-01-19 重庆邮电大学 一种多标签分类的手机应用推荐系统及其方法
CN113780415A (zh) * 2021-09-10 2021-12-10 平安科技(深圳)有限公司 基于小程序游戏的用户画像生成方法、装置、设备及介质

Also Published As

Publication number Publication date
CN115168740A (zh) 2022-10-11

Similar Documents

Publication Publication Date Title
Strickert et al. Merge SOM for temporal data
Liu et al. Automated feature selection: A reinforcement learning perspective
US7062477B2 (en) Information-processing apparatus, information-processing method and storage medium
US20090138304A1 (en) Data Mining
Aouad et al. Market segmentation trees
CN114418035A (zh) 决策树模型生成方法、基于决策树模型的数据推荐方法
CN115168740B (zh) 一种基于大数据分析生成营销任务的方法和系统
Straton et al. Big social data analytics for public health: Predicting facebook post performance using artificial neural networks and deep learning
Dass et al. Introducing functional data analysis to managerial science
CN115423037A (zh) 一种基于大数据的用户分类方法及系统
CN117057852B (zh) 一种基于人工智能技术的互联网营销系统及方法
Bastanfard et al. Crowdsourcing of labeling image objects: an online gamification application for data collection
CN117312680A (zh) 一种基于用户-实体子图对比学习的资源推荐方法
CN112836750A (zh) 一种系统资源分配方法、装置及设备
CN112733035A (zh) 基于知识图谱的知识点推荐方法、装置、存储介质及电子装置
CN116664173A (zh) 一种基于大数据模型的竞品分析方法、终端及存储介质
Mazanec et al. Usage patterns of advanced analytical methods in tourism research 1988–2008: A six journal survey
CN110717653A (zh) 风险识别方法及装置和电子设备
Hu et al. A self-adaptive preference model based on dynamic feature analysis for interactive portfolio optimization
Reddy et al. Ensemble Approach on the Online Shopping Churn Prediction
CN111125541A (zh) 面向多用户的可持续多云服务组合的获取方法
US20230196196A1 (en) Non-transitory computer-readable recording medium, information processing method, and information processing device
CN112749335B (zh) 生命周期状态预测方法、装置、计算机设备和存储介质
CN115760200B (zh) 基于金融交易数据的用户画像构建方法
Dixon et al. A Bayesian approach to ranking private companies based on predictive indicators

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant