CN111582538B - 一种基于图神经网络的社群价值预测方法及系统 - Google Patents

一种基于图神经网络的社群价值预测方法及系统 Download PDF

Info

Publication number
CN111582538B
CN111582538B CN202010220441.8A CN202010220441A CN111582538B CN 111582538 B CN111582538 B CN 111582538B CN 202010220441 A CN202010220441 A CN 202010220441A CN 111582538 B CN111582538 B CN 111582538B
Authority
CN
China
Prior art keywords
community
user
value
information
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010220441.8A
Other languages
English (en)
Other versions
CN111582538A (zh
Inventor
李勇
金德鹏
张国祯
徐丰力
郁佳杰
徐裕键
张良伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Beigou Technology Co ltd
Tsinghua University
Original Assignee
Hangzhou Beigou Technology Co ltd
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Beigou Technology Co ltd, Tsinghua University filed Critical Hangzhou Beigou Technology Co ltd
Priority to CN202010220441.8A priority Critical patent/CN111582538B/zh
Publication of CN111582538A publication Critical patent/CN111582538A/zh
Application granted granted Critical
Publication of CN111582538B publication Critical patent/CN111582538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Molecular Biology (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种基于图神经网络的社群价值预测方法及系统,该方法包括:获取用户特征信息和用户交互信息;基于用户特征信息和用户交互信息将所有用户划分为不同的社群;将每个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个社群相对应的社群价值预测值;其中,每个社群所包含的原始特征信息包括组成所述社群的所有用户的用户特征信息和用户交互信息。本发明实施例,通过综合用户固有的特征信息和用户之间交互信息,构建包含多个层次结构特征的社群,并获取每个社群的原始特征信息生成表示向量后,基于多层次的神经网络模型分析,获取到社群价值预测值,有效的提高了预测的精度,减少了人力物力的消耗。

Description

一种基于图神经网络的社群价值预测方法及系统
技术领域
本发明涉及大数据分析技术领域,具体涉及一种基于图神经网络的社群价值预测方法及系统。
背景技术
社群价值预测(Community Value Prediction)是指对某个关系紧密的用户群体在未来一段时间段内的累积消费总和进行估计,其典型的应用场景可以为:在社交电商平台中,商家基于对每个用户群体的社群预测结果,对不同群体有针对性的通过外部干预手段来兑现或提升用户群的潜在价值,从而提升商家利润。譬如,可以对潜在价值较低的用户群体,有针对性的发放优惠券,从而提升用户价值。
在实际生产应用中,一方面,预测用户价值的出发点均为基于个体的层面,无法考虑群体中用户复杂的相互影响作用,从而无法适用于社交电商场景;另一方面,目前预测用户价值的方法主要基于人为的特征筛选,需要消耗大量人力物力,并且预测的精读高度取决于特征质量好坏,预测结果无法得到保证,从而带来了高昂的风险管理成本。
目前,用户价值预测方法主要包括两类,一类是基于统计学模型的方法,譬如利用负二项分布(Negative Binomial Distribution,简称NBD)建模人们的购买时间,再大致估计人们每个时间的购买金额,就能够得到未来购买价值。由于理论模型往往不足以刻画现实中人的复杂行为与各种外部影响因素,从而造成此类模型的准确率较低、泛化性能较差,且对于不同群体的用户可能需要不同的模型。另一类是基于机器学习的模型,主要包括基于支持向量机(Support Vector Machine,简称SVM),随机森林(Random Forest,简称RF)以及梯度提升树(Gradient Boosting Decision Tree,简称GBDT)构建模型进行机器学习。这一类方法均需要人为选择特征作为输入进行预测,由于方法的准确率很大程度上取决于特征的好坏,因此准确率同样不高,同时特征工程还需要花费较大的人力物力。不仅如此,上述两类方法均无法有效建模与利用社群的结构信息。
综上所述,由于在社交电商中,社群结构对社群价值有极大的影响作用,现有的用户价值预测方法主要存在以下缺陷:首先,预测效果高度依赖于特征工程的质量,不仅耗费人力物力,同时预测效果还难以得到保证。其次,预测目标均为从个体角度出发,如果将个体的预测结果相加得到群体的结果,将会带来预测误差的累加,使得预测效果无法得到保证。最后,对于社群多层次的结构信息(包括人与人之间的关系,社群的组织结构,以及社群间的相互关联三个层次)缺乏深入的考虑,无法有效建模和利用社群的结构信息。
有鉴于此,如何综合考虑社群结构信息,并设计实现一个端到端的模型是一个亟待解决的问题。
发明内容
针对现有技术中的问题,本发明实施例提供一种基于图神经网络的社群价值预测方法及系统,
第一方面,本发明实施例提供一种基于图神经网络的社群价值预测方法,包括:获取用户特征信息和用户交互信息;基于该用户特征信息和用户交互信息将所有用户划分为不同的社群;将每个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个社群相对应的社群价值预测值;其中,每个社群所包含的原始特征信息包括组成所述社群的所有用户的用户特征信息和用户交互信息。
作为可选地,上述基于用户特征信息和用户交互信息将所有用户划分为不同的社群,包括基于规则的划分方法或基于聚类的划分方法,其中:
基于规则的划分方法,具体可以为:根据用户特征信息和用户交互信息,确定所有用户中的中心用户;分别以每个中心用户为基础,以与中心用户存在直接交互关系的用户为组成,构建不同的社群;
基于聚类的划分方法,具体可以为:根据用户特征信息和用户交互信息,将每个用户建模为不同的节点、将用户之间的交互关系建模为边,构建社交网络图;采用图聚类算法对所述社交网络图进行聚类,构建不同的社群。
作为可选地,上述社群价值预测模型一般包括依次连接的特征提取与表示子模块、多聚合器MEL-GCN子模块、社群池化子模块和预测子模块,其中:
特征提取与表示子模块,用于将输入的原始特征信息进行编码映射至连续向量空间,获取用户个人特征矩阵和用户交互特征矩阵;
多聚合器MEL-GCN子模块,用于根据用户个人特征矩阵和用户交互特征矩阵,建模在每个社群内用户之间的交互关系以及在所有社群之间的交互关系对社群价值的影响,更新用户个人特征矩阵中的每个节点状态向量;
社群池化子模块,用于聚合每个社群中的每个节点状态向量,并映射为对应社群的表征向量;
预测子模块,用于根据所述社群的表征向量获取所述社群相对应的社群价值预测值。
作为可选地,上述特征提取与表示子模块,用于将输入的原始特征信息进行编码映射至连续向量空间,获取用户个人特征矩阵和用户交互特征矩阵,具体包括:将原始特征信息划分为离散特征信息和连续特征信息;根据离散特征信息的取值范围进行独热编码,将离散特征信息中包含的每个取值表示为只有一个维度为1,其余维度为0的n维向量,其中n为取值范围;对连续特征信息进行归一化至[0,1]区间;对经过独热编码处理的所述离散特征信息与经过归一化处理后的连续特征信息进行拼接后,经过全连接层映射至连续向量空间,获取用户个人特征矩阵和所述用户交互特征矩阵。
作为可选地,上述多聚合器MEL-GCN子模块主要包括基于蒙版边学习的GCN模型和多聚合器框架;其中,基于蒙版边学习的GCN模型包括边学习组件和至少一个基于蒙版边学习的图卷积组件;
多聚合器MEL-GCN子模块,主要用于根据用户个人特征矩阵和用户交互特征矩阵,建模在每个社群内用户之间的交互关系以及在所有社群之间的交互关系对社群价值的影响,更新用户个人特征矩阵中的每个节点状态向量,具体包括:
分别根据用户个人特征矩阵获取节点特征、根据用户交互特征矩阵获取边特征;利用边学习组件将每一对相邻节点的节点特征以及节点间的边特征进行拼接后,经过一个全连接层,获取到针对每一条边的蒙版向量;
利用可学习矩阵将所述蒙版向量的维度调整至于当前输入节点的节点状态向量的维度一致;
利用调整后的蒙版向量作为边控制器,利用GCN卷积网络模型聚合相邻节点,实现对用户个人特征矩阵中的每个节点状态向量的初步更新;
利用多聚合器框架,分别建模在每个社群内用户之间的交互关系对社群价值的社群内部影响,以及在所有社群之间的交互关系对社群价值的社群间影响;
综合每个节点的社群内部影响和社群间影响,实现对用户个人特征矩阵中的每个节点状态向量的更新。
作为可选地,上述利用调整后的蒙版向量作为边控制器,利用GCN卷积网络模型聚合相邻节点,其计算公式具体为:
Figure BDA0002425879630000041
其中,
Figure BDA0002425879630000042
为节点i更新后的状态向量,σ(·)是激活函数,/>
Figure BDA0002425879630000043
为返回节点i的邻居节点集合的函数,⊙代表按位点乘运算,Θl为模型参数,/>
Figure BDA0002425879630000051
为节点i更新前的状态向量,/>
Figure BDA0002425879630000052
为可学习矩阵,∈ij为蒙版向量。
作为可选地,上述社群池化子模块主要用于聚合每个社群中的每个节点状态向量,并映射为对应社群的表征向量,具体包括:
确定所述社群中的种子节点集合;将种子节点集合中的每个种子节点的状态向量与社群中的所有其它节点向量的状态向量进行逐一拼接,获取每个种子节点的拼接状态向量;利用全连接层对所有拼接状态向量进行处理,获取社群的表征向量。
作为可选地,上述预测子模块主要用于根据所述社群的表征向量获取所述社群相对应的社群价值预测值,具体包括:根据每个社群的表征向量构建社群表征矩阵;利用一个两层全连接神经网络作为预测器预测每个社群的社群价值预测值,具体计算公式为:
Figure BDA0002425879630000053
其中,pT,Wfc,bfc均为模型参数,
Figure BDA0002425879630000054
为社群价值预测值,HP为社群表征矩阵。
作为可选地,在上述将每个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型之前,还包括对社群价值预测模型进行预训练,具体包括:
对社群价值预测模型的超参数进行搜索调优,超参数主要包括学习速率、正则化系数以及特征空间大小等;利用预先建立的原始特征信息样本集和与每个原始特征信息样本一一对应的社群价值标签,对社群价值预测模型进行预训练,并通过预先建立的测试集对训练结果进行测试;在预训练的过程中,使用基于随机梯度下降的优化器,对社群价值预测模型中的模型参数进行更新,直至更新结果为收敛。
作为可选地,在获取每个社群相对应的社群价值预测值之后,还包括:获取每个社群价值预测值与真实值之间的平均绝对误差;以平均绝对误差为损失函数,并在损失函数加入模型参数的L2正则项,对社群价值预测模型进行训练。
作为可选地,上述以平均绝对误差为损失函数,并在损失函数加入模型参数的L2正则项,具体计算公式为:
Figure BDA0002425879630000061
其中,||·||为求二范数的运算,Θ表示模型所有参数的集合,λ为正则系数,
Figure BDA0002425879630000062
为包含所有模型参数的集合,C为训练集中的社群数目。y为真实值,/>
Figure BDA0002425879630000063
为社群价值预测值。
第二方面,本发明实施例还提供一种基于图神经网络的社群价值预测系统,所述识别系统主要包括:信息收取单元、社群划分单元和社群价值估算单元;其中,信息收取单元主要用于获取用户特征信息和用户交互信息。社群划分单元主要用于用户特征信息和用户交互信息将所有用户划分为不同的社群。其中,每个社群所包含的原始特征信息包括组成所述社群的所有用户的用户特征信息和用户交互信息。社群价值估算单元主要用于将每个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个社群相对应的社群价值预测值。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面任一所述的基于图神经网络的社群价值预测方法的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面任一所述的基于图神经网络的社群价值预测方法的步骤
由上述技术方案可知,本发明实施例提供的基于图神经网络的社群价值预测方法及系统,通过综合用户固有的特征信息和用户之间交互信息,构建包含多个层次结构特征的社群,并获取每个社群的原始特征信息生成表示向量后,基于多层次的神经网络模型分析,获取到社群价值预测值,有效的提高了预测的精度,减少了人力物力的消耗。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于图神经网络的社群价值预测方法的流程示意图;
图2是本发明实施例提供的另一种基于图神经网络的社群价值预测方法的流程示意图;
图3是本发明实施例提供的一种社群划分方法示意图;
图4是本发明实施例提供的一种社群价值预测模型构架示意图;
图5是本发明实施例提供的一种特征提取与表征模块工作原理示意图;
图6是本发明实施例提供的一种MEL-GCN模块工作原理示意图;
图7是本发明实施例提供的一种多聚合器框架工作原理示意图;
图8是本发明实施例提供的一种PCPool模块工作原理示意图;
图9是本发明实施例提供的一种基于图神经网络的社群价值预测系统的结构示意图;
图10是本发明实施例的一种设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一般来说,社群的结构信息主要包括三个层次:社群内人与人之间的关系、社群的组织结构以及社群间的相互关联。在社交电商中,购买行为大多数情况下很大原因是源自于社群中人与人的相互交流和分享,因此,社群结构很大程度上决定了分享等行为能够带来的影响力的大小和影响的范围,进而影响社群价值的高低。在本发明实施例提供的社群价值预测方法中,综合考虑了社群结构的各个层次的影响,即有效的利用多层次的社群结构信息建模预测社交电商中的社群价值,如图1所示,包括但不限于以下步骤:
步骤S1:获取用户特征信息和用户交互信息;
步骤S2:基于所述用户特征信息和用户交互信息将所有用户划分为不同的社群;
步骤S3:将每个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个社群相对应的社群价值预测值;
其中,每个社群所包含的原始特征信息包括组成所述社群的所有用户的用户特征信息和用户交互信息。
首先,可以基于电商平台所保存的所有历史数据,获取用户特征信息和用户交互信息。其中,用户特征信息一般包括用户基础信息(包括年龄、性别、注册时间、注册渠道等等)、用户历史购买信息等。用户交互信息则主要包括用户的社交关系信息、用户交互信息(包括诸如分享红包、分享商品等交互)。由于大部分社交电商平台通常能够基于其依托的社交平台获取大部分用户的社交关系信息。即使无法直接获取,也可以根据观测到的大部分用户包括分享红包、拼团等多种交互的信息通过交互重建用户交互信息。
进一步地,在本发明实施例的步骤S2中可以使用不同的社群划分方法,以基于预先获取的用户特征信息和用户交互信息,获取到社交关系联系紧密的社群。例如按照用户购买力、按照用户的购买类别、按照用户的购买习惯等等进行分类。其分类原理可以是基于规则的分类方法或者基于聚类的分类方法,对此本实施例不作具体的限定。其中,每个社群所包含的原始特征信息为组成社群的每个用户的用户特征信息和用户交互信息的综合。
进一步地,在本发明实施例中,预先构建一个社群价值预测模型,该模型的构建出发点是将社群价值预测问题表示为如下形式:已知社交电商中的用户社交网络结构G(在该社交网络结构中,用户被建模为节点,用户之间的关系被建模为边)、综合每个用户的用户特征信息以及用户交互信息所建立的用户个人属性特征矩阵Xv、用户间交互特征矩阵Xe,以及待研究的用户群集合
Figure BDA0002425879630000091
社群价值预测的任务是利用已知信息来学习一个映射函数F(·),从而预测未来一段时间的社群总购买额:
Figure BDA0002425879630000092
其中,y=[y1,y2,...,yc]T为模型对各个社群的社群价值的预测结果,c为社群总数,yk为第k个社群的社群价值预测值,XvK、XeK分别为第k个社群的用户个人属性特征矩阵以及用户间交互特征矩阵。
具体的,如图2所示,在本发明实施例提供的基于图神经网络的社群价值预测方法中,首先通过收集电商平台等大数据库中所保存的待研究的用户群集合中每个用户的用户特征信息和用户交互信息,完成数据获取的步骤;然后,基于所获取的信息之间的关联关系,进行社群的划分,即将上述待研究的用户群集合划分为多个社群。
进一步地,统计每个社群所包含的原始特征信息,以将每个原始特征信息输入至预先训练好的社群价值预测模型中,获取到每个社群的社群价值预测值。
进一步地,由于各个社群的社群价值会随着时间的推移得到更新,由此每隔一段时间可以实现对训练数据的更新,可以进一步训练模型,提升模型精度。在本实施例中,还可以将所获取到的每个社群的社群价值预测值作为历史数据进行保存,以便于后续的社群价值预测。
本发明实施例提供的基于图神经网络的社群价值预测方法,通过综合用户固有的特征信息和用户之间交互信息,构建包含多个层次结构特征的社群,并获取每个社群的原始特征信息生成表示向量后,基于多层次的神经网络模型分析,获取到社群价值预测值,有效的提高了预测的精度,减少了人力物力的消耗。
基于上述实施例的内容,作为一种可选的实施例,上述基于用户特征信息和用户交互信息将所有用户划分为不同的社群,可以是包括基于规则的划分方法或基于聚类的划分方法。
其中,基于规则的划分方法,具体为:根据用户特征信息和用户交互信息,确定所有用户中的中心用户;分别以每个中心用户为基础,以与中心用户存在直接交互关系的用户为组成,构建不同的社群。
其中,基于聚类的划分方法,具体为:根据用户特征信息和用户交互信息,将每个用户建模为不同的节点、将用户之间的交互关系建模为边,构建社交网络图;采用图聚类算法对所述社交网络图进行聚类,构建不同的社群。
首先,基于社交、电商等平台的历史大数据,获取到待研究的用户群集合中每个用户的用户特征信息以及用户交互信息。
考虑到在社交电商场景中,必然存在高度连接的中心用户,譬如拼团中经常发起拼团的用户,又或者社交电商中的店主用户等。其中,基于规则的划分方法,如图3所示,则是将与此类中心用户有直接社交关系的用户分入同一个社群,即形成了以中心用户为中心,以与中心用户存在直接交互关系的用户为组成,构建成不同的社群,其中社群的总数与中心用户的个数相同。
基于聚类的划分方法,则是先通过将每个用户建模为节点,将每个用户之间的交互关系建模为边,构建一张社交网络图。然后,采用图聚类算法中诸如Label PropagationAlgorithm等算法得到相应的社群划分结果。
本发明实施例提供的基于图神经网络的社群价值预测方法,通过综合待分析用户群中每个用户的用户特征信息以及用户之间的用户交互信息,即考虑了社群的结构信息中的多层次关联关系,完成社群的划分,进而实现不同社群的价值预测,有效的社群划分的准确性,提高了预测的精度。
基于上述实施例的内容,作为一种可选实施例,所建立的社群价值预测模型主要包括:依次连接的特征提取与表示子模块、多聚合器MEL-GCN子模块、社群池化子模块和预测子模块。
其中,特征提取与表示子模块主要用于将输入的原始特征信息进行编码映射至连续向量空间,获取用户个人特征矩阵和用户交互特征矩阵。
多聚合器MEL-GCN子模块主要用于根据用户个人特征矩阵和用户交互特征矩阵,建模在每个社群内用户之间的交互关系以及在所有社群之间的交互关系对社群价值的影响,更新用户个人特征矩阵中的每个节点状态向量。
社群池化子模块主要用于聚合每个社群中的每个节点状态向量,并映射为对应社群的表征向量。
预测子模块主要用于根据社群的表征向量获取所述社群相对应的社群价值预测值。
具体地,如图4所示,在本发明实施例中所建立的社群价值预测模型主要包括以下四个子模块:特征提取与表示子模块、多聚合器MEL-GCN子模块(全称:多聚合器蒙板边学习的图卷积神经网络模块)、社群池化子模块(全称:基于成对关系的社群池化模块,简称:PCPool模块)和预测子模块。
其中,特征提取与表示模块将输入模型的每个社群的原始特征信息映射到连续向量空间;多聚合器MEL-GCN模块基于图卷积神经网络(Graph Convolutional Network,简称GCN)建模了社群内人与人之间的交互关系的价值以及社群间的交互关系对社群价值的影响;PCPool模块基于成对池化操作辅助图神经网络提取社群内部结构信息,建模社群内结构对社群价值的影响,并输出学习到的每个社群的表征向量;预测模块利用社群表征向量预测社群未来的价值。
本发明实施例提供的基于图神经网络的社群价值预测方法,通过相应的子模块实现了对社群结构进行多层次(社群内人与人之间的关系、社群的组织结构、社群间的相互关联)的基于神经网络的建模,构建完整的社群价值预测模型,能够获得高精度社群价值预测结果,并减少社群预测所需的人力物力。
基于上述实施例的内容,作为一种可选实施例,上述特征提取与表示子模块用于将输入的所述原始特征信息进行编码映射至连续向量空间,获取用户个人特征矩阵和用户交互特征矩阵,具体包括以下实施内容:
将原始特征信息划分为离散特征信息和连续特征信息;根据离散特征信息的取值范围进行独热编码,将离散特征信息中包含的每个取值表示为只有一个维度为1,其余维度为0的n维向量,其中n为取值范围;对连续特征信息进行归一化至[0,1]区间;对经过独热编码处理的离散特征信息与经过归一化处理后的连续特征信息进行拼接后,经过全连接层映射至连续向量空间,获取用户个人特征矩阵和所述用户交互特征矩阵。
每个社群所包含的原始特征信息包括组成该社群的所有用户的用户特征信息和用户交互信息,通常来说,可以从平台历史数据中提取到的用户特征信息主要包含:年龄、性别、注册时长、注册渠道、用户历史12个月中每个月购买的金额等;所获取的用户交互特征主要包含每两个存在社交关系的用户对之间,历史12个月每个月的交互次数等。需要说明的是,上述原始特征信息为所有社交电商平台均能得到的最基础的特征,本发明实施例在具体应用时可以在此基础上添加其它特征,对此不作具体的限定。
由于上述原始特征信息既有离散特征(譬如性别),也有连续特征(譬如历史购买金额),为了使神经网络模型能够更好的学习各个特征对社群价值预测目标的影响以及各个特征之间的交互影响,则可以对原始特征信息先进行编码并将其映射到连续向量空间。
如图5所示,对于离散特征,可以根据其取值范围进行独热编码,即将原始特征中包含的每一个取值表示为只有一个维度为1,其余维度为0的n维向量,其中n表示原始特征的取值范围。
对于连续特征,可以将其归一化到0到1的区间,从而减少特征尺度不同所带来的影响。
进一步地,将变换后的离散特征信息与连续特征信息拼接后,利用一个全连接神经网络将拼接后的信息映射到一个连续向量空间。
具体地,由于原始特征信息包括用户特征信息和用户交互信息,可以将用户特征信息Xv和用户交互特征Xe分别输入至特征提取与表征模块,从而获取到所有用户个人属性特征向量组成的个人属性特征矩阵
Figure BDA0002425879630000131
以及所有用户间交互特征向量组成的用户间交互特征矩阵/>
Figure BDA0002425879630000132
其中N,L分别为总用户数和总用户关系数,dv,de分别为用户个人属性特征向量维度和交互特征向量维度。
本发明实施例提供的基于图神经网络的社群价值预测方法,针对原始特征信息中的离散特征信息和连续特征信息的差别,分别采用不同的映射处理方法,以使得提取的用户个人特征矩阵和用户交互特征矩阵,更准确的表征社群的原始特征信息,有效的提高了预测的精度。
基于上述实施例所述的内容,作为一种可选实施例,上述多聚合器MEL-GCN子模块主要包括基于蒙版边学习的GCN模型和多聚合器框架,基于蒙版边学习的GCN模型包括边学习组件和至少一个基于蒙版边学习的图卷积组件。
其中,所述多聚合器MEL-GCN子模块用于根据用户个人特征矩阵和用户交互特征矩阵,建模在每个所述社群内用户之间的交互关系以及在所有社群之间的交互关系对社群价值的影响,更新用户个人特征矩阵中的每个节点状态向量,具体包括:
分别根据用户个人特征矩阵获取节点特征、根据用户交互特征矩阵获取边特征;利用边学习组件将每一对相邻节点的所述节点特征以及节点间的边特征进行拼接后,经过一个全连接层,获取到针对每一条边的蒙版向量;利用可学习矩阵将蒙版向量的维度调整至于当前输入节点的节点状态向量的维度一致;利用调整后的蒙版向量作为边控制器,利用GCN卷积网络模型聚合相邻节点,实现对用户个人特征矩阵中的每个节点状态向量的初步更新;利用多聚合器框架,分别建模在每个社群内用户之间的交互关系对社群价值的社群内部影响,以及在所有社群之间的交互关系对社群价值的社群间影响;综合每个节点的所述社群内部影响和所述社群间影响,实现对用户个人特征矩阵中的每个节点状态向量的更新。
具体地,为了建模社交电商中人与人的关系对社群价值的影响,在本发明实施例中,通过构建了一个基于GCN的模型来实现。其中,GCN是一种能够有效提取图数据局部结构特征的模型,其核心思想是每个节点根据其邻居节点的当前状态向量更新并维护自己的状态向量。但是普通的GCN模型无法有效的利用边的特征,也无法有效的建模人与人之间的关系对结构带来的影响。因此,本实施例提供的方法,通过在普通GCN的基础上构建MEL-GCN模型,将人与人之间的关系建模为GCN中更新节点特征的控制器。
其中,MEL-GCN至模块中主要包括2个组件,如图6所示,为本发明实施例提供的一种边学习组件的结构示意图,该组件的输入为节点特征(即用户个人属性特征矩阵)
Figure BDA0002425879630000151
和边特征(即用户间交互特征矩阵)/>
Figure BDA0002425879630000152
对于每一对相邻的节点i和j,(i,j)∈E,E为网络中边的集合,此组件首先将节点i的特征
Figure BDA0002425879630000153
节点j的特征/>
Figure BDA0002425879630000154
和节点i与j间的交互特征/>
Figure BDA0002425879630000155
拼接起来。之后,利用一个两层线性网络学习得到针对每一条边的蒙版向量∈ij。其计算过程可以表示为:
Figure BDA0002425879630000156
其中,运算符(·||·)表示向量拼接操作,σ(·)为激活函数,具体实现时可以采用ReLU等函数,W (1),W (0)
Figure BDA0002425879630000157
为模型参数,需要注意的是∈ij≠∈ji
基于蒙版边学习的图卷积组件(Masked Edge Learning Convolution,简称MELConv),其核心创新是在传统GCN卷积的邻居节点聚合的步骤中,加入了一个基于边的控制器及蒙版向量∈ij
考虑到蒙版向量∈ij的维度可能与节点第l个卷积层的状态
Figure BDA0002425879630000158
的维度不一致,可以利用一个可学习矩阵/>
Figure BDA0002425879630000159
将∈ij的维度调整到与当前输入节点状态向量的维度一致,从而得到调整后的蒙版向量∈ij′。
进一步地,在节点i聚合邻居节点j的状态信息时,将其状态向量
Figure BDA00024258796300001510
与∈′ij按位点乘,从而起到控制器的效果。其计算过程可以表示为:
Figure BDA00024258796300001511
其中,
Figure BDA0002425879630000161
为节点i更新后的状态向量,σ(·)是激活函数,/>
Figure BDA0002425879630000162
为返回节点i的邻居节点集合的函数,⊙代表按位点乘运算,Θl为模型参数,/>
Figure BDA0002425879630000163
为节点i更新前的状态向量,/>
Figure BDA0002425879630000164
为可学习矩阵。
需要说明的是,在图6所示的MEL-GCN模块示意图中,仅以一个MELConv层作为示例,但其不作为为本发明实施例保护范围限定,在实际应用中,可以依次堆叠多个MELConv层以提升模型的表达能力。
进一步地,考虑到社群内部人与人之间的关系以及社群之间人与人之间的关系对社群价值预测所造成的影响是截然不同的,如图7所示,在本发明实施例中,提出了用多聚合器框架来分别建模社群内部的关系和社群间的关系。具体地,可以将社群内部的边和社群间的边区分开来,构建为2张不同的图,分别输入一个MEL-GCN模型,从而对社群内的边和社群间的边学习得到不同的参数,从而统计两者对社群价值带来的不同的影响。最后,更新节点状态时,将两个MEL-GCN模型的输出相加得到每一个节点的状态向量。
本发明实施例提供的基于图神经网络的社群价值预测方法,通过增加多聚合器框架,将社群内部的边和社群间的边区分,分别统计社群内部人与人之间的关系以及社群之间人与人之间的关系对社群价值预测所造成的影响,使得所最终建立的社群价值预测模型能够识别社群间的相互影响,提高了预测的精度。
基于上述实施例的内容,作为一种可选实施例,上述社群池化子模块(PCPool模块),用于聚合每个社群中的每个节点状态向量,并映射为对应社群的表征向量,具体包括:
确定社群中的种子节点集合;将种子节点集合中的每个种子节点的状态向量与社群中的所有其它节点向量的状态向量进行逐一拼接,获取每个种子节点的拼接状态向量;利用全连接层对所有拼接状态向量进行处理,获取社群的表征向量。
具体地,在多聚合器MEL-GCN模块获取到每个用户节点的状态向量后,需要将同一个社群的节点状态向量进行聚合,并映射为每个社群的表征向量。
由于社群内结构(譬如社群中边的稠密程度)对社群价值影响非常大,但已有的MEL-GCN结构并不能很好的建模此类高阶结构信息,本发明实施例提供的提出社群价值预测方法,采用PCPool模块来解决以上问题。
如图8所示,本发明实施例提供了一种PCPool模块的结构示意图,所述PCPool模块的核心思想是引入先验信息来作为监督信号辅助模型对重要社群结构信息的建模,具体而言包括两个步骤:
第一步,选取出每个社群中可能有重要结构作用的种子节点集合S。考虑到社交电商中,连接越多的用户潜在的用户价值越大,在本实施例中可以通过简单选取每个社群中前r%的度最大的节点作为种子节点。需要说明的是,上述选取种子节点的方法并不构成对本实施例保护范围的限定。
第二步,通过一个成对池化操作将节点状态向量映射为社群的表征向量。具体而言,以一个社群k为例,我们首先将种子节点集合中每个节点的状态向量
Figure BDA0002425879630000171
(j∈S)与社群中所有其他节点的状态向量/>
Figure BDA0002425879630000172
(i∈V)逐一拼接起来。之后,将得到的所有拼接结果输入一个全连接层后,加和获取到社群k的表征向量/>
Figure BDA0002425879630000173
这一过程可以用如下公式描述:
Figure BDA0002425879630000174
其中,σ(·)是激活函数,Ns,Nv分别是种子节点集合的大小和社群的大小,Wp和bp是模型参数。
基于上述实施例的内容,作为一种可选实施例,上述预测子模块,用于根据社群的表征向量获取社群相对应的社群价值预测值,具体包括:根据每个社群的表征向量构建社群表征矩阵;利用一个两层全连接神经网络作为预测器预测每个社群的社群价值预测值,具体计算公式为:
Figure BDA0002425879630000181
/>
其中,pT,Wfc,bfc均为模型参数,
Figure BDA0002425879630000182
为社群价值预测值,HP为社群表征矩阵。
具体地,本发明实施例在得到了包含多层次社群结构信息的社群表征矩阵
Figure BDA0002425879630000183
后,利用一个两层全连接神经网络作为预测器预测每个社群的社群价值/>
Figure BDA0002425879630000184
进一步地,作为可选实施例,在所述将每个所述社群所包含的原始特征信息输入至预先训练好的社群价值预测模型之前,还包括对所述社群价值预测模型进行预训练,具体包括:
对社群价值预测模型的超参数进行搜索调优,超参数可以包括学习速率、正则化系数以及特征空间大小等;利用预先建立的原始特征信息样本集和与每个原始特征信息样本一一对应的社群价值标签,对社群价值预测模型进行预训练,并通过预先建立的测试集对训练结果进行测试;在预训练的过程中,使用基于随机梯度下降的优化器,对社群价值预测模型中的模型参数进行更新,直至更新结果为收敛。
具体地,在对待研究的用户群集合进行价值预测之前,基于平台保存的所有历史数据可以获取用户的社交关系信息、用户交互信息(包括诸如分享红包、分享商品等交互)以及每个用户的基础信息和历史购买信息之后,首先将用户划分到对应社群,并随机将得到的社群按照8∶2的比例划分为训练数据和测试数据。基于训练数据对模型进行训练并测试数据筛选出较好的模型。最终,基于训练好的模型可以得到社群在未来一段时间的社群价值。各个社群的社群价值会随着时间的推移得到更新,由此每隔一段时间可以实现对训练数据的更新,可以进一步训练模型,提升模型精度。
需要说明的是,在模型训练过程中需要对超参数进行搜索调优(超参数包括学习速率β,正则化系数λ,特征空间大小d等)。在对网络的训练过程中,我们使用Adam优化器,一种基于随机梯度下降的优化器,对网络中各层的参数进行更新。
基于上述实施例的内容,作为一种可选实施例,在获取每个社群相对应的社群价值预测值之后,还包括:获取每个所述社群价值预测值与真实值之间的平均绝对误差;以获取的平均绝对误差为损失函数,并在所述损失函数加入模型参数的L2正则项,对社群价值预测模型进行训练。
具体地,考虑到模型训练的过程是一个回归问题,可以采用平均绝对误差(MeanAbsolute Error,简称MAE)作为损失函数L,通过最小化预测值与真实值之间的MAE来训练得到模型参数。
进一步地,为了减轻模型的过拟合,可以在损失函数中加入模型参数的l2正则项。其计算过程可以表示为:
Figure BDA0002425879630000191
其中,||·||为求二范数的运算,Θ表示模型所有参数的集合,λ为正则系数,
Figure BDA0002425879630000192
为包含所有模型参数的集合,C为训练集中的社群数目,y为真实值,/>
Figure BDA0002425879630000193
为社群价值预测值。
本发明实施例提供一种基于图神经网络的社群价值预测系统,如图9所示,主要包括,信息收取单元1、社群划分单元2和社群价值估算单元3,其中:
信息收取单元1主要用于获取用户特征信息和用户交互信息;社群划分单元2主要用于用户特征信息和用户交互信息将所有用户划分为不同的社群;其中,每个社群所包含的原始特征信息包括组成社群的所有用户的用户特征信息和用户交互信息。社群价值估算单元3主要用于将每个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个社群相对应的社群价值预测值。
需要说明的是,本发明实施例提供的基于图神经网络的社群价值预测系统在具体运行时,用于执行上述任一实施例所述的基于图神经网络的社群价值预测方法,在此不作一一赘述。
为了更清楚的说明本发明实施例所提供的基于图神经网络的社群价值预测系统,以下列两个具体实施方式为例进行说明:
具体实施例1:通过对2019年1月1日至2020年2月1日的用户交互数据、用户购买数据以及用户的基本信息进行分析,预测现有用户形成的社群在2020年2月份的价值。具体步骤包括:
第一步,使用者根据平台历史信息,获取用户特征信息,包括年龄,性别,用户类型(是否是店主),注册渠道,注册时长,成为店主时长,用户在每个月中购买商品的件数和金额。需要说明的是,部分用户没有填写年龄和性别信息,将此类用户按照第三类别处理(譬如性别的取值包括三类:男性,女性,未填写)。用户交互信息包括用户每个月中的交互次数。
第二步,使用者根据上述实施例所述的基于图神经网络的社群价值预测方法对用户进行社群划分。具体实施过程中,使用者将所有与店主直接相连的用户划分为同一社群,由此得到了所有用户所属的社群。
第三步,训练模型。由于需预测的是未来1个月的数据,因此,将已有数据划分为2个时间窗口:2019年1月1日至2020年1月1日的用户属性数据和用户交互作为模型输入来预测2020年1月1日至2020年2月1日的社群价值。使用者将所有社群按照8:2的比例随机划分为测试集与训练集后,将训练数据输入上述实施例所述的社群价值预测模型中对模型进行训练,并通过测试集数据筛选出预测准确率高,泛化能力强的模型。
第四部,使用者将2019年2月1日至2020年2月1日的用户属性数据和用户交互数据输入模型,得到2019年2月的社群价值的预测结果。
具体实施例2:通过对22019年6月1日至2020年2月1日的用户交互数据、用户购买数据以及用户的基本信息进行分析,预测现有用户形成的社群在2020年2月份的价值。具体步骤包括:
第一步,根据平台历史信息,获取用户特征信息,包括年龄,性别,用户类型(是否是店主),注册渠道,注册时长,成为店主时长,用户在每个月中购买商品的件数和金额。需要说明的是,部分用户没有填写年龄和性别信息,将此类用户按照第三类别处理(譬如性别的取值包括三类:男性,女性,未填写)。用户交互信息包括用户每个月中的交互次数。
第二步,使用者根据上述实施例所述的基于图神经网络的社群价值预测方法对用户进行社群划分。在具体实施中,使用者首先对发起拼团最多的用户做了一个排序,之后以这些用户为中心,利用半监督的LPA社群监测算法得到了所有用户社群的划分。
第三步,训练模型。由于需预测的是未来1个月的数据,因此,将已有数据划分为2个时间窗口:2019年6月1日至2020年1月1日的用户属性数据和用户交互作为模型输入来预测2020年1月1日至2020年2月1日的社群价值。使用者将所有社群按照8:2的比例随机划分为测试集与训练集后,将训练数据输入第四章第3节所述的社群价值预测模型中训练模型,并通过测试集数据筛选出预测准确率高,泛化能力强的模型。
第四部,使用者将2019年7月1日至2020年2月1日的用户属性数据和用户交互数据输入模型,得到2019年2月的社群价值的预测结果。
本发明实施例提供的基于图神经网络的社群价值预测系统,通过综合用户固有的特征信息和用户之间交互信息,构建包含多个层次结构特征的社群,并获取每个社群的原始特征信息生成表示向量后,基于多层次的神经网络模型分析,获取到社群价值预测值,有效的提高了预测的精度,减少了人力物力的消耗。
图10示例了一种电子设备的实体结构示意图,如图10所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行如下方法:获取用户特征信息和用户交互信息;基于该用户特征信息和用户交互信息将所有用户划分为不同的社群;将每个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个社群相对应的社群价值预测值;其中,每个社群所包含的原始特征信息包括组成所述社群的所有用户的用户特征信息和用户交互信息。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:获取用户特征信息和用户交互信息;基于该用户特征信息和用户交互信息将所有用户划分为不同的社群;将每个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个社群相对应的社群价值预测值;其中,每个社群所包含的原始特征信息包括组成所述社群的所有用户的用户特征信息和用户交互信息。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于图神经网络的社群价值预测方法,其特征在于,包括:
获取用户特征信息和用户交互信息;
基于所述用户特征信息和用户交互信息将所有用户划分为不同的社群;
将每个所述社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个所述社群相对应的社群价值预测值;
其中,每个所述社群所包含的原始特征信息包括组成所述社群的所有用户的用户特征信息和用户交互信息,
其中,所述基于所述用户特征信息和用户交互信息将所有用户划分为不同的社群,包括基于规则的划分方法或基于聚类的划分方法,其中:
所述基于规则的划分方法,具体为:根据所述用户特征信息和用户交互信息,确定所有用户中的中心用户;分别以每个所述中心用户为基础,以与所述中心用户存在直接交互关系的用户为组成,构建不同的社群;
所述基于聚类的划分方法,具体为:根据所述用户特征信息和用户交互信息,将每个用户建模为不同的节点、将用户之间的交互关系建模为边,构建社交网络图;采用图聚类算法对所述社交网络图进行聚类,构建不同的社群,
其中,所述社群价值预测模型包括依次连接的特征提取与表示子模块、多聚合器MEL-GCN子模块、社群池化子模块和预测子模块,其中:
所述特征提取与表示子模块,用于将输入的所述原始特征信息进行编码映射至连续向量空间,获取用户个人特征矩阵和用户交互特征矩阵;
所述多聚合器MEL-GCN子模块,用于根据所述用户个人特征矩阵和用户交互特征矩阵,建模在每个所述社群内用户之间的交互关系以及在所有社群之间的交互关系对社群价值的影响,更新所述用户个人特征矩阵中的每个节点状态向量;
所述社群池化子模块,用于聚合每个所述社群中的每个节点状态向量,并映射为对应社群的表征向量;
所述预测子模块,用于根据所述社群的表征向量获取所述社群相对应的社群价值预测值,
其中,提升社群中所述社群价值预测值较低的社群的用户价值;
所述社群池化子模块,用于聚合每个所述社群中的每个节点状态向量,并映射为对应社群的表征向量,具体包括:
确定所述社群中的种子节点集合;
将所述种子节点集合中的每个种子节点的状态向量与所述社群中的所有其它节点向量的状态向量进行逐一拼接,获取每个种子节点的拼接状态向量;
利用全连接层对所有所述拼接状态向量进行处理,获取所述社群的表征向量;
所述预测子模块,用于根据所述社群的表征向量获取所述社群相对应的社群价值预测值,具体包括:
根据每个所述社群的表征向量构建社群表征矩阵;
利用一个两层全连接神经网络作为预测器预测每个社群的社群价值预测值,具体计算公式为:
Figure FDA0004240790890000021
其中,pT,Wfc,bfc均为模型参数,
Figure FDA0004240790890000022
为社群价值预测值,HP为社群表征矩阵。
2.根据权利要求1所述的基于图神经网络的社群价值预测方法,其特征在于,所述特征提取与表示子模块,用于将输入的所述原始特征信息进行编码映射至连续向量空间,获取用户个人特征矩阵和用户交互特征矩阵,具体包括:
将所述原始特征信息划分为离散特征信息和连续特征信息;
根据所述离散特征信息的取值范围进行独热编码,将所述离散特征信息中包含的每个取值表示为只有一个维度为1,其余维度为0的n维向量,其中n为所述取值范围;
对所述连续特征信息进行归一化至[0,1]区间;
对经过独热编码处理的所述离散特征信息与经过归一化处理后的所述连续特征信息进行拼接后,经过全连接层映射至连续向量空间,获取所述用户个人特征矩阵和所述用户交互特征矩阵。
3.根据权利要求1所述的基于图神经网络的社群价值预测方法,其特征在于,所述多聚合器MEL-GCN子模块,包括基于蒙版边学习的GCN模型和多聚合器框架;其中,所述基于蒙版边学习的GCN模型包括边学习组件和至少一个基于蒙版边学习的图卷积组件;
所述多聚合器MEL-GCN子模块,用于根据所述用户个人特征矩阵和用户交互特征矩阵,建模在每个所述社群内用户之间的交互关系以及在所有社群之间的交互关系对社群价值的影响,更新所述用户个人特征矩阵中的每个节点状态向量,具体包括:
分别根据所述用户个人特征矩阵获取节点特征、根据所述用户交互特征矩阵获取边特征;
利用所述边学习组件将每一对相邻节点的所述节点特征以及节点间的所述边特征进行拼接后,经过一个全连接层,获取到针对每一条边的蒙版向量;
利用可学习矩阵将所述蒙版向量的维度调整至于当前输入节点的节点状态向量的维度一致;
利用调整后的蒙版向量作为边控制器,利用GCN卷积网络模型聚合相邻节点,实现对所述用户个人特征矩阵中的每个节点状态向量的初步更新;
利用所述多聚合器框架,分别建模在每个所述社群内用户之间的交互关系对社群价值的社群内部影响,以及在所有社群之间的交互关系对社群价值的社群间影响;
综合每个节点的所述社群内部影响和所述社群间影响,实现对所述用户个人特征矩阵中的每个节点状态向量的更新。
4.根据权利要求3所述的基于图神经网络的社群价值预测方法,其特征在于,所述利用调整后的蒙版向量作为边控制器,利用GCN卷积网络模型聚合相邻节点,其计算公式具体为:
Figure FDA0004240790890000041
其中,
Figure FDA0004240790890000042
为节点i更新后的状态向量,σ(·)是激活函数,/>
Figure FDA0004240790890000043
为返回节点i的邻居节点集合的函数,⊙代表按位点乘运算,Θl为模型参数,/>
Figure FDA0004240790890000044
为节点i更新前的状态向量,/>
Figure FDA0004240790890000045
为可学习矩阵,∈ij为蒙版向量。
5.根据权利要求1所述的基于图神经网络的社群价值预测方法,其特征在于,在所述将每个所述社群所包含的原始特征信息输入至预先训练好的社群价值预测模型之前,还包括对所述社群价值预测模型进行预训练,具体包括:
对所述社群价值预测模型的超参数进行搜索调优,所述超参数包括学习速率、正则化系数以及特征空间大小;
利用预先建立的原始特征信息样本集和与每个原始特征信息样本一一对应的社群价值标签,对所述社群价值预测模型进行预训练,并通过预先建立的测试集对训练结果进行测试;
在所述预训练的过程中,使用基于随机梯度下降的优化器,对所述社群价值预测模型中的模型参数进行更新,直至更新结果为收敛。
6.根据权利要求1所述的基于图神经网络的社群价值预测方法,其特征在于,在获取每个所述社群相对应的社群价值预测值之后,还包括:
获取每个所述社群价值预测值与真实值之间的平均绝对误差;
以所述平均绝对误差为损失函数,并在所述损失函数加入模型参数的L2正则项,对所述社群价值预测模型进行训练。
7.根据权利要求6所述的基于图神经网络的社群价值预测方法,其特征在于,所述以所述平均绝对误差为损失函数,并在所述损失函数加入模型参数的L2正则项,具体计算公式为:
Figure FDA0004240790890000051
其中,||·||为求二范数的运算,Θ表示模型所有参数的集合,λ为正则系数,
Figure FDA0004240790890000052
为包含所有模型参数的集合,C为训练集中的社群数目,y为真实值,/>
Figure FDA0004240790890000053
为社群价值预测值。
8.一种基于图神经网络的社群价值预测系统,其特征在于,包括:信息收取单元、社群划分单元和社群价值估算单元;
所述信息收取单元,用于获取用户特征信息和用户交互信息;
所述社群划分单元,用于所述用户特征信息和用户交互信息将所有用户划分为不同的社群;
其中,每个所述社群所包含的原始特征信息包括组成所述社群的所有用户的用户特征信息和用户交互信息;
所述社群价值估算单元,用于将每个所述社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个所述社群相对应的社群价值预测值;
其中,所述基于所述用户特征信息和用户交互信息将所有用户划分为不同的社群,包括基于规则的划分方法或基于聚类的划分方法,其中:
所述基于规则的划分方法,具体为:根据所述用户特征信息和用户交互信息,确定所有用户中的中心用户;分别以每个所述中心用户为基础,以与所述中心用户存在直接交互关系的用户为组成,构建不同的社群;
所述基于聚类的划分方法,具体为:根据所述用户特征信息和用户交互信息,将每个用户建模为不同的节点、将用户之间的交互关系建模为边,构建社交网络图;采用图聚类算法对所述社交网络图进行聚类,构建不同的社群,
其中,所述社群价值预测模型包括依次连接的特征提取与表示子模块、多聚合器MEL-GCN子模块、社群池化子模块和预测子模块,其中:
所述特征提取与表示子模块,用于将输入的所述原始特征信息进行编码映射至连续向量空间,获取用户个人特征矩阵和用户交互特征矩阵;
所述多聚合器MEL-GCN子模块,用于根据所述用户个人特征矩阵和用户交互特征矩阵,建模在每个所述社群内用户之间的交互关系以及在所有社群之间的交互关系对社群价值的影响,更新所述用户个人特征矩阵中的每个节点状态向量;
所述社群池化子模块,用于聚合每个所述社群中的每个节点状态向量,并映射为对应社群的表征向量;
所述预测子模块,用于根据所述社群的表征向量获取所述社群相对应的社群价值预测值,
其中,提升社群中所述社群价值预测值较低的社群的用户价值;
所述社群池化子模块,用于聚合每个所述社群中的每个节点状态向量,并映射为对应社群的表征向量,具体包括:
确定所述社群中的种子节点集合;
将所述种子节点集合中的每个种子节点的状态向量与所述社群中的所有其它节点向量的状态向量进行逐一拼接,获取每个种子节点的拼接状态向量;
利用全连接层对所有所述拼接状态向量进行处理,获取所述社群的表征向量;
所述预测子模块,用于根据所述社群的表征向量获取所述社群相对应的社群价值预测值,具体包括:
根据每个所述社群的表征向量构建社群表征矩阵;
利用一个两层全连接神经网络作为预测器预测每个社群的社群价值预测值,具体计算公式为:
Figure FDA0004240790890000071
其中,pT,Wfc,bfc均为模型参数,
Figure FDA0004240790890000072
为社群价值预测值,HP为社群表征矩阵。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于图神经网络的社群价值预测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述基于图神经网络的社群价值预测方法的步骤。
CN202010220441.8A 2020-03-25 2020-03-25 一种基于图神经网络的社群价值预测方法及系统 Active CN111582538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010220441.8A CN111582538B (zh) 2020-03-25 2020-03-25 一种基于图神经网络的社群价值预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010220441.8A CN111582538B (zh) 2020-03-25 2020-03-25 一种基于图神经网络的社群价值预测方法及系统

Publications (2)

Publication Number Publication Date
CN111582538A CN111582538A (zh) 2020-08-25
CN111582538B true CN111582538B (zh) 2023-07-04

Family

ID=72111464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010220441.8A Active CN111582538B (zh) 2020-03-25 2020-03-25 一种基于图神经网络的社群价值预测方法及系统

Country Status (1)

Country Link
CN (1) CN111582538B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112044082B (zh) * 2020-08-28 2021-11-30 腾讯科技(深圳)有限公司 一种信息检测方法、装置及计算机可读存储介质
CN112633559B (zh) * 2020-12-10 2022-08-09 中科人工智能创新技术研究院(青岛)有限公司 一种基于动态图卷积神经网络的社交关系预测方法及系统
CN112667920A (zh) * 2020-12-29 2021-04-16 复旦大学 基于文本感知的社交影响力预测方法、装置及设备
CN112819154B (zh) * 2021-01-20 2024-05-28 上海上湖信息技术有限公司 一种应用于图学习领域的预训练模型的生成方法及装置
CN113393017B (zh) * 2021-05-07 2022-08-23 浙江警官职业学院 一种基于个体复杂关系的监管场所安全预警方法及装置
CN113407659A (zh) * 2021-07-09 2021-09-17 上海明略人工智能(集团)有限公司 员工社区发现方法、系统、计算机和可读存储介质
CN113658718B (zh) * 2021-08-20 2024-02-27 清华大学 一种个体疫情防控方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793489A (zh) * 2014-01-16 2014-05-14 西北工业大学 一种在线社交网络中社群话题的发现方法
CN110442802A (zh) * 2019-08-06 2019-11-12 中国科学技术大学 一种社交用户的多行为偏好预测方法
CN110647590A (zh) * 2019-09-23 2020-01-03 税友软件集团股份有限公司 一种目标社群数据的识别方法及相关装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11170395B2 (en) * 2016-12-02 2021-11-09 Stack Fintech Inc. Digital banking platform and architecture

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793489A (zh) * 2014-01-16 2014-05-14 西北工业大学 一种在线社交网络中社群话题的发现方法
CN110442802A (zh) * 2019-08-06 2019-11-12 中国科学技术大学 一种社交用户的多行为偏好预测方法
CN110647590A (zh) * 2019-09-23 2020-01-03 税友软件集团股份有限公司 一种目标社群数据的识别方法及相关装置

Also Published As

Publication number Publication date
CN111582538A (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
CN111582538B (zh) 一种基于图神经网络的社群价值预测方法及系统
CN111695719A (zh) 一种用户价值预测方法及系统
CN112966114B (zh) 基于对称图卷积神经网络的文献分类方法和装置
CN113256367B (zh) 用户行为历史数据的商品推荐方法、系统、设备及介质
CN112418653A (zh) 一种基于机器学习算法的携号转网潜客识别系统及方法
CN111461225B (zh) 客户聚类系统及其方法
CN112163963B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN110110372B (zh) 一种用户时序行为自动切分预测方法
CN116401379A (zh) 金融产品数据推送方法、装置、设备及存储介质
CN111709225A (zh) 一种事件因果关系判别方法、装置和计算机可读存储介质
CN115062779A (zh) 基于动态知识图谱的事件预测方法及装置
Thakur et al. Artificial intelligence-based image classification techniques for hydrologic applications
CN113850654A (zh) 物品推荐模型的训练方法、物品筛选方法、装置和设备
CN116522232A (zh) 文档分类方法、装置、设备及存储介质
CN114896138B (zh) 一种基于复杂网络和图神经网络的软件缺陷预测方法
CN115345687A (zh) 一种跨网站商品对齐方法及装置
CN115240782A (zh) 药物属性预测方法、装置、电子设备及存储介质
Zhang et al. A two-stage rating prediction approach based on matrix clustering on implicit information
CN115187312A (zh) 基于深度学习的客户流失预测方法及系统
CN112884028A (zh) 一种系统资源调整方法、装置及设备
CN111950602A (zh) 一种基于随机梯度下降和多示例多标签学习的图像标引方法
CN114494753A (zh) 聚类方法、装置、电子设备及计算机可读存储介质
CN117009883B (zh) 对象分类模型构建方法、对象分类方法、装置和设备
AlHakeem et al. Iraqi Stock Market Prediction Using Hybrid LSTM and CNN Algorithm
CN117252665B (zh) 业务推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant