CN112131486B - 基于图卷积神经网络的电商网络平台用户社区发现方法 - Google Patents

基于图卷积神经网络的电商网络平台用户社区发现方法 Download PDF

Info

Publication number
CN112131486B
CN112131486B CN202010894175.7A CN202010894175A CN112131486B CN 112131486 B CN112131486 B CN 112131486B CN 202010894175 A CN202010894175 A CN 202010894175A CN 112131486 B CN112131486 B CN 112131486B
Authority
CN
China
Prior art keywords
community
node
network
nodes
commerce
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010894175.7A
Other languages
English (en)
Other versions
CN112131486A (zh
Inventor
杨旭华
王磊
周艳波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010894175.7A priority Critical patent/CN112131486B/zh
Publication of CN112131486A publication Critical patent/CN112131486A/zh
Application granted granted Critical
Publication of CN112131486B publication Critical patent/CN112131486B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于图卷积神经网络和相似性的电商网络平台用户社区发现方法,根据电商网络的用户数据,建立电商平台用户网络,基于
Figure DDA0002657913970000011
节点相似度指标计算网络中节点的相似度;根据节点相似度矩阵构建偏好网络;通过偏好网络的连通性划分初始社团,根据社团规模系数和社团稀疏性系数区分强社团;选择强社团中最大度节点作为社团的领导节点并给领导节点标记社团标签;结合图卷积神经网络在不规则图数据处理上的优势,使用图卷积神经网络模型训练电商网络预测节点的社团标签,形成最终的电商网络用户社团结构。本发明专利结合节点相似性和图卷积神经网络,提高了社团发现的速度和质量。

Description

基于图卷积神经网络的电商网络平台用户社区发现方法
技术领域
本发明涉及电商领域,是一种基于图卷积神经网络和相似性的电商网络平台用户社区发现方法。
背景技术
互联网的飞速发展推动了社会信息化、网络化发展,其中电商网络发展迅速,各式各样的电商网络层出不穷,互联网的发展同样推动了实体经济数字化的进程,其中最具代表性的就是电商网络的形成。电商网络是实体经济信息化的一种呈现方式,各行各业的产品售卖和服务售卖形成了庞大且丰富的电商网络。电商网络不仅包括提供商品和服务的商业用户,还包含购买商品和服务的普通用户,电商网络中的用户社区是电商网络中的一种非实体网络,社区内部的成员往往具有相同或相似的兴趣爱好,比如某社区内部成员都喜欢购买计算机类书籍。
在复杂的电商网络中发现网络社区可以帮助用户找到与自己兴趣相同或相仿的其他用户,可以帮助推荐系统根据不同的用户社区推荐对应主题的商品,更好的提升用户日活量,也可以根据用户需求更精准的投放广告。同时,社区发现对于官方平台对用户,内容等进行高效的管理具有重要意义。社区发现任务目的在于找到网络中的社区拓扑结构,但由于社交网络的复杂性,使用人工方法进行社区发现任务耗时且效率低下。
为了揭示社区结构,目前存在了多种社区发现算法,如基于模块度的算法,标签传播算法,随机游走算法等。这些方法划分的社区质量,对于用户的划分不够准确。
发明内容
为了克服目前在电商网络的社区发现算法划分社区的准确度不高等方面的不足,为了更加准确的在社交网络中发现高质量的用户社区结构,本发明提出了一种快速高效的基于图卷积神经网络和相似性的电商网络平台用户社区发现方法,不仅结合了网络的拓扑特征,也发挥了图卷积神经网络解决图数据的优势。
本发明解决其技术问题所采用的技术方案是:
一种基于图卷积神经网络的电商网络平台用户社区发现方法,包括以下步骤:
步骤一:根据电商网络的用户数据,构建电商用户网络模型G(V,E),V表示节点,E表示节点之间的连边,一个节点表示一个用户,电商网络共有N个用户,对应网络的N个节点,如果两个用户购买了同一类商品,则用户之间存在一条连边,A表示网络G的邻接矩阵;
步骤二:根据
Figure GDA0003279030240000021
节点相似度指标计算网络G中有连边节点对的相似度,构成相似度矩阵SimN×N,其中Simij表示节点i和节点j之间的相似度,
Figure GDA0003279030240000022
Γ(i)表示节点i的邻居节点,k(i)表示节点i的度大小,|Γ(i)∩Γ(j)|表示节点i和j的共同邻居个数;
步骤三:连接网络中任意节点和它的偏好节点,构建偏好网络GP(V,EP),其中一个节点的偏好节点指的是和该节点相似度最大的节点,连边集EP={ei,j|i,j∈V},其中ei,j表示节点i的最大相似度节点为j;
步骤四:把偏好网络GP(V,EP)每个互相连通的节点群作为一个社区,得到初始社区划分结果C={c1,c2,c3,…,ck},计算得到社区规模系数α={α123,…,αk},其中
Figure GDA0003279030240000023
|ci|表示社区ci中的节点数量,|V|表示网络中的节点数量;
步骤五:计算社区稀疏系数β={β123,…,βk},其中
Figure GDA0003279030240000024
表示社区ci的内部边数量,
Figure GDA0003279030240000025
表示社区ci的外部边数量;
步骤六:计算社区规模系数阈值
Figure GDA0003279030240000026
和社区稀疏系数阈值
Figure GDA0003279030240000027
其中|C|表示社区总个数,当社区满足社区规模系数和社区稀疏系数均大于阈值时,标记该社区为强社区,并且选择强社区中的最大度点作为该社区的领导节点,给领导节点分配社区标签,
步骤七:建立图卷积神经网络模型GCN(I,A),其中,单位矩阵I表示网络的特征矩阵,网络的邻接矩阵和单位矩阵作为模型的输入,GCN的最后一层采用softmax层输出每个类别的概率,输出概率最大的标签作为节点的预测标签ypredict,根据领导节点真实标签yL和预测标签ypredict计算交叉熵损失值Loss进行反向传播更新权重,当达到预设的最大迭代次数时停止训练,则Ylf表示每个节点的输出标签,把标签相同的节点划分为一个社区,得到用户的社区划分结果,其中损失函数
Figure GDA0003279030240000031
其中,Zlf表示softmax的输出概率,yL表示领导节点的标签。
本发明的技术构思为:基于节点相似性指标对网络进行连边数量的降维,生成偏好网络得到网络的初始社区划分,再结合图卷积神经网络对于图数据处理的优势,得到更加精确的社区划分结果。
本发明的有益效果为:结合了复杂网络拓扑特征和图卷积神经网络处理网络数据的精确性,提高了电商网络平台用户社区发现的质量。
附图说明
图1是一个简单的电商网络示意图,图中的节点表示电商网络中的用户,1,2,3,…,14为相应的用户编号,如果两个用户之间同时购买了同一类商品,则两个节点之间有一条连边。
具体实施方式
下面结合附图对本发明做进一步的说明。
参照图1,一种基于图卷积神经网络的电商网络平台用户社区发现方法,包括如下步骤:
步骤一:根据现有的电商网络用户数据,一个用户用一个节点表示,即图1中的圆点,1,2,3,…,14为相应的用户编号,如果两个用户同时购买一类商品,则两个用户之间有一条连边,如图1中的用户1和用户3因为都购买了网络科学类书籍,所以存在一条连边;构建具有N个节点的电商网络模型G(V,E),V表示节点集,E表示连边集;
步骤二:根据
Figure GDA0003279030240000041
节点相似度指标计算网络G中有连边节点对的相似度,构成相似度矩阵SimN×N,其中Simij表示节点i和节点j之间的相似度,
Figure GDA0003279030240000042
其中Γ(i)表示节点i的邻居节点,k(i)表示节点i的度大小,|Γ(i)∩Γ(j)|表示节点i和j的共同邻居个数;
步骤三:连接网络中任意节点和它的偏好节点,构建偏好网络GP(V,EP),其中一个节点的偏好节点指的是和该节点相似度最大的节点,连边集EP={ei,j|i,j∈V},其中ei,j表示节点i的最大相似度节点为j;
步骤四:把偏好网络GP(V,EP)每个互相连通的节点群作为一个社区,得到初始社区划分结果C={c1,c2,c3,…,ck},计算得到社区规模系数α={α123,…,αk},其中
Figure GDA0003279030240000043
|ci|表示社区ci中的节点数量,|V|表示网络中的节点数量;
步骤五:计算社区稀疏系数β={β123,…,βk},其中
Figure GDA0003279030240000044
表示社区ci的内部边数量,
Figure GDA0003279030240000045
表示社区ci的外部边数量;
步骤六:计算社区规模系数阈值
Figure GDA0003279030240000046
和社区稀疏系数阈值
Figure GDA0003279030240000047
其中|C|表示社区总个数,当社区满足社区规模系数和社区稀疏系数均大于阈值时,标记该社区为强社区,并且选择强社区中的最大度点作为该社区的领导节点,分配社区标签,
步骤七:建立图卷积神经网络模型GCN(I,A),其中,单位矩阵I表示网络的特征矩阵,网络的邻接矩阵和单位矩阵作为模型的输入,GCN的最后一层采用softmax层输出每个类别的概率,输出概率最大的标签作为节点的预测标签ypredict,根据领导节点真实标签yL和预测标签ypredict计算交叉熵损失值Loss进行反向传播更新权重,当达到预设的最大迭代次数时停止训练,则Ylf表示每个节点的输出标签,把标签相同的节点划分为一个社区,得到用户的社区划分结果,其中损失函数
Figure GDA0003279030240000051
其中,Zlf表示softmax的输出概率,yL表示领导节点的标签。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (1)

1.一种基于图卷积神经网络的电商网络平台用户社区发现方法,其特征在于:包括以下步骤:
步骤一:根据电商网络的用户数据,构建电商用户网络模型G(V,E),V表示节点,E表示节点之间的连边,一个节点表示一个用户,电商网络共有N个用户,对应网络的N个节点,如果两个用户购买了同一类商品,则用户之间存在一条连边,A表示网络G的邻接矩阵;
步骤二:根据
Figure FDA0003279030230000011
节点相似度指标计算网络G中有连边节点对的相似度,构成相似度矩阵SimN×N,其中Simij表示节点i和节点j之间的相似度,
Figure FDA0003279030230000012
Γ(i)表示节点i的邻居节点,k(i)表示节点i的度大小,|Γ(i)∩Γ(j)|表示节点i和j的共同邻居个数;
步骤三:连接网络中任意节点和它的偏好节点,构建偏好网络GP(V,Ep),其中一个节点的偏好节点指的是和该节点相似度最大的节点,连边集EP={ei,j|i,j∈V},其中ei,j表示节点i的最大相似度节点为j;
步骤四:把偏好网络GP(V,Ep)每个互相连通的节点群作为一个社区,得到初始社区划分结果C={c1,c2,c3,…,ck},计算得到社区规模系数α={α1,α2,α3,…,αk},其中
Figure FDA0003279030230000013
|ci|表示社区ci中的节点数量,|V|表示网络中的节点数量;
步骤五:计算社区稀疏系数β={β1,β2,β3,…,βk},其中
Figure FDA0003279030230000014
Figure FDA0003279030230000015
表示社区ci的内部边数量,
Figure FDA0003279030230000016
表示社区ci的外部边数量;
步骤六:计算社区规模系数阈值
Figure FDA0003279030230000017
和社区稀疏系数阈值
Figure FDA0003279030230000018
其中|C|表示社区总个数,当社区满足社区规模系数和社区稀疏系数均大于阈值时,标记该社区为强社区,并且选择强社区中的最大度点作为该社区的领导节点,给领导节点分配社区标签,
步骤七:建立图卷积神经网络模型GCN(I,A),其中,单位矩阵I表示网络的特征矩阵,网络的邻接矩阵和单位矩阵作为模型的输入,GCN的最后一层采用softmax层输出每个类别的概率,输出概率最大的标签作为节点的预测标签ypredict,根据领导节点真实标签yL和预测标签ypredict计算交叉熵损失值Loss进行反向传播更新权重,当达到预设的最大迭代次数时停止训练,则Ylf表示每个节点的输出标签,把标签相同的节点划分为一个社区,得到用户的社区划分结果,其中损失函数
Figure FDA0003279030230000021
其中,Zlf表示softmax的输出概率,yL表示领导节点的标签。
CN202010894175.7A 2020-08-31 2020-08-31 基于图卷积神经网络的电商网络平台用户社区发现方法 Active CN112131486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010894175.7A CN112131486B (zh) 2020-08-31 2020-08-31 基于图卷积神经网络的电商网络平台用户社区发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010894175.7A CN112131486B (zh) 2020-08-31 2020-08-31 基于图卷积神经网络的电商网络平台用户社区发现方法

Publications (2)

Publication Number Publication Date
CN112131486A CN112131486A (zh) 2020-12-25
CN112131486B true CN112131486B (zh) 2022-01-11

Family

ID=73848736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010894175.7A Active CN112131486B (zh) 2020-08-31 2020-08-31 基于图卷积神经网络的电商网络平台用户社区发现方法

Country Status (1)

Country Link
CN (1) CN112131486B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641920B (zh) * 2021-10-13 2022-02-18 中南大学 基于社区发现和图神经网络的商品个性化推荐方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106330541A (zh) * 2016-08-23 2017-01-11 浙江工业大学 一种基于二阶局部社团和偏好连接的预测网络未知连边的方法
CN108648095A (zh) * 2018-05-10 2018-10-12 浙江工业大学 一种基于图卷积网络梯度的节点信息隐藏方法
CN111460275A (zh) * 2020-01-15 2020-07-28 华中科技大学 一种面向社交网络的动态网络表示学习方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11526765B2 (en) * 2019-01-10 2022-12-13 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for a supra-fusion graph attention model for multi-layered embeddings and deep learning applications

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106330541A (zh) * 2016-08-23 2017-01-11 浙江工业大学 一种基于二阶局部社团和偏好连接的预测网络未知连边的方法
CN108648095A (zh) * 2018-05-10 2018-10-12 浙江工业大学 一种基于图卷积网络梯度的节点信息隐藏方法
CN111460275A (zh) * 2020-01-15 2020-07-28 华中科技大学 一种面向社交网络的动态网络表示学习方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于特征向量局部相似性的社区检测算法;杨旭华等;《计算机科学》;20200229;全文 *

Also Published As

Publication number Publication date
CN112131486A (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
US11163803B2 (en) Higher-order graph clustering
CN112232925A (zh) 一种融合知识图谱对商品进行个性化推荐的方法
CN112613602A (zh) 基于知识感知超图神经网络的推荐方法及系统
CN111563164A (zh) 一种基于图神经网络的特定目标情感分类方法
CN110795641B (zh) 基于表示学习的网络谣言传播控制方法
CN106844407B (zh) 基于数据集相关性的标签网络产生方法和系统
CN110837602A (zh) 基于表示学习和多模态卷积神经网络的用户推荐方法
CN106952167A (zh) 一种基于多元线性回归的餐饮业好友连边影响力预测方法
CN111274485A (zh) 一种基于社区发现的个性化推荐方法
CN109446414A (zh) 一种基于神经网络分类的软件信息站点快速标签推荐方法
CN115860880B (zh) 基于多层异质图卷积模型的个性化商品推荐方法及系统
US20230267317A1 (en) Sign-aware recommendation apparatus and method using graph neural network
CN114399251A (zh) 基于语义网和簇偏好的冷链物流推荐方法及装置
CN114065048A (zh) 基于多异构图图神经网络的物品推荐方法
CN110321492A (zh) 一种基于社区信息的项目推荐方法及系统
CN112102029A (zh) 一种基于知识图谱的长尾推荐计算方法
CN112131486B (zh) 基于图卷积神经网络的电商网络平台用户社区发现方法
CN107346333B (zh) 一种基于链路预测的在线社交网络好友推荐方法与系统
CN111581532A (zh) 一种基于随机块的社交网络交友推荐方法和系统
CN113239266B (zh) 基于局部矩阵分解的个性化推荐方法及系统
CN114254615A (zh) 组卷方法、装置、电子设备和存储介质
CN113342994A (zh) 一种基于无采样协作知识图网络的推荐系统
CN112905906A (zh) 一种融合局部协同与特征交叉的推荐方法及系统
CN112084418A (zh) 一种基于邻居信息和属性网络表征学习的微博用户社团发现方法
CN114385804A (zh) 一种基于元学习的异构图注意力神经网络的评论推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant