CN112132188B - 一种基于网络属性的电商用户分类方法 - Google Patents

一种基于网络属性的电商用户分类方法 Download PDF

Info

Publication number
CN112132188B
CN112132188B CN202010894196.9A CN202010894196A CN112132188B CN 112132188 B CN112132188 B CN 112132188B CN 202010894196 A CN202010894196 A CN 202010894196A CN 112132188 B CN112132188 B CN 112132188B
Authority
CN
China
Prior art keywords
calculating
nodes
user
network
commerce
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010894196.9A
Other languages
English (en)
Other versions
CN112132188A (zh
Inventor
杨旭华
陈孝则
许营坤
叶蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010894196.9A priority Critical patent/CN112132188B/zh
Publication of CN112132188A publication Critical patent/CN112132188A/zh
Application granted granted Critical
Publication of CN112132188B publication Critical patent/CN112132188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于网络属性的电商用户分类方法,根据电商用户的购物信息使用KNN建立初始网络模型,对初始网络模型使用变分自编码器进行编码解码,通过图卷积神经网络对电商用户数据进行节点分类训练,得到分类的结果。本发明考虑了电商节点之间的拓扑关系及电商数据的内部属性,有效利用了电商网络的相关性信息,分类准确性较高。

Description

一种基于网络属性的电商用户分类方法
技术领域
本发明涉及电商分类领域,特别是指一种基于网络属性的电商用户分类方法。
背景技术
随着互联网和电子商务的蓬勃发展,人类跨入了网络新时代,足不出户便能购买各地的商品。丰富的购物订单信息体现了用户多方面的数据,用户之间可以构成一张错综复杂的信息网络,利用这些数据能过够为我们生活提供了便利,更加准确地进行商品推荐,定位目标用户,为电商带来极大价值。
电商用户分类是指通过用户网络中已知的用户信息和部分用户的类别去预测电商用户网络中其他用户的类别。电商用户分类主要是基于电商网络的结构特性和电商用户的节点属性,给出节点类别的概率,然后与电商用户真实的分类标签进行对比,衡量算法的优劣性。由于电商数据庞大并且复杂,更新用户分类算法使得预测精度与效率达到满意程度就显得十分必要。由于用户之间的连边关系不能直接获得,在进行分类的同时构建一个可靠的用户网络描述用户之间的联系就显得非常重要。
发明内容
为了克服现有电商用户分类的方法没分类准确度较低、受噪声影响严重的不足,更全面地获取电商用户网络结构信息,提升现有算法的分类准确度,本发明提出了一种基于网络属性的电商用户分类方法。
本发明解决其技术问题所采用的技术具体步骤是:
一种基于网络属性的电商用户分类方法,包括如下步骤:
步骤1:统计每个电商用户包括收货地址,购买商品种类,以及金额等d项信息,用一个d维向量表示,则第i个电商用户信息向量表示为xi=[xi1,xi2,...,xid],其中第j项信息xij用一个one-hot向量表示,N个电商用户信息构成用户属性信息矩阵X={x1,x2,...,xN};计算任意两个向量的余弦相似度,进行KNN聚类,相似性高的节点之间添加边,从而得到初始的电商用户网络A,每个节点表示一个电商用户,两个节点之间如果有连边,表示这两个节点有较高的相似度;
步骤2:通过变分自编码器VGAE编码后,得到电商用户的节点嵌入向量Z=GCNμ(X,A)+∈GCNσ(X,A),GCN表示图卷积神经网络,∈是一个可调参数,GCNμ表示均值向量,GCNσ表示方差向量,再对Z进行解码,得到重建的用户网络
步骤3:计算重建的对称图网络其中
步骤4:计算本轮的电商网络结构
其中η为可调参数,表示融合新老结构的比重;
步骤5:计算嵌入向量Z的KL散度,得到图学习模块的损失值
其中,
其中,
KL[q||p]表示计算q和p的散度,q(Z|X,A)是GCN计算出的分布,p(Z)是标准高斯分布,α和β为可调参数;
步骤6:计算任意节点i,j之间的注意力系数中间值
其中,
f(·)表示的映射,W是权值矩阵;
步骤7:计算聚合每个电商用户的k阶邻居节点的相似性矩阵
其中,
M是过渡矩阵,D是邻接矩阵A*的度矩阵,Di是i节点的度;
步骤8:计算任意两个节点i,j之间的注意力系数
步骤9:计算任意节点i在分类模块第l层的节点嵌入向量
其中Γi表示i的邻居节点集合;
步骤10:计算半监督分类的损失值
其中表示最后一层输出,Yij是节点的标签,/>表示的是节点集中带有标签的节点;
步骤11:计算本轮迭代的最终损失
其中δ≥0是控制两者之间平衡的可调参数;
步骤12:将初始电商用户网络A更改为重复执行步骤2~步骤12,当/>小于指定的最小损失值后,结束计算,把/>作为电商用户的分类结果。
本发明的技术构思为:在电商数据中,当用户与用户之间不存在拓扑结构并且只有部分节点已经存在类别时,现有的分类算法准确率不高,本发明提出了考虑了高阶邻居的图注意力神经网络,结合了图学习模块,在对用户进行分类时训练原始图结构,从而提高分类的准确性和抗噪性。
本发明的有益效果表现在:考虑了电商节点之间的拓扑关系及电商数据的内部属性,有效利用了电商网络的相关性信息,分类准确性较高。
附图说明
图1为电商用户网络结构学习与电商用户分类流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图图1,一种基于网络属性的电商用户分类方法,包括如下步骤:
步骤1:统计每个电商用户包括收货地址,购买商品种类,以及金额等d项信息,用一个d维向量表示,则第i个电商用户信息向量表示为xi=[xi1,xi2,...,xid],其中第j项信息xij用一个one-hot向量表示,N个电商用户信息构成用户属性信息矩阵X={x1,x2,...,xN};计算任意两个向量的余弦相似度,进行KNN聚类,相似性高的节点之间添加边,从而得到初始的电商用户网络A,每个节点表示一个电商用户,两个节点之间如果有连边,表示这两个节点有较高的相似度;
步骤2:通过变分自编码器VGAE编码后,得到电商用户的节点嵌入向量Z=GCNμ(X,A)+∈GCNσ(X,A),GCN表示图卷积神经网络,∈是一个可调参数,GCNμ表示均值向量,GCNσ表示方差向量,再对Z进行解码,得到重建的用户网络
步骤3:计算重建的对称图网络其中
步骤4:计算本轮的电商网络结构
其中η为可调参数,表示融合新老结构的比重;
步骤5:计算嵌入向量Z的KL散度,得到图学习模块的损失值
其中,
其中,
KL[q||p]表示计算q和p的散度,q(Z|X,A)是GCN计算出的分布,p(Z)是标准高斯分布,α和β为可调参数;
步骤6:计算任意节点i,j之间的注意力系数中间值
其中,
f(·)表示的映射,W是权值矩阵;
步骤7:计算聚合每个电商用户的k阶邻居节点的相似性矩阵
其中,
M是过渡矩阵,D是邻接矩阵A*的度矩阵,Di是i节点的度;
步骤8:计算任意两个节点i,j之间的注意力系数
步骤9:计算任意节点i在分类模块第l层的节点嵌入向量
其中Γi表示i的邻居节点集合;
步骤10:计算半监督分类的损失值
其中表示最后一层输出,Yij是节点的标签,/>表示的是节点集中带有标签的节点;
步骤11:计算本轮迭代的最终损失
其中δ≥0是控制两者之间平衡的可调参数;
步骤12:将初始电商用户网络A更改为重复执行步骤2~步骤12,当/>小于指定的最小损失值后,结束计算,把/>作为电商用户的分类结果。

Claims (1)

1.一种基于网络属性的电商用户分类方法,其特征在于,所述方法包括如下步骤:
步骤1:统计每个电商用户包括收货地址,购买商品种类,以及金额d项信息,用一个d维向量表示,则第i个电商用户信息向量表示为xi=[xi1,xi2,…,xid],其中第j项信息xij用一个one-hot向量表示,N个电商用户信息构成用户属性信息矩阵X={x1,x2,…,xN};计算任意两个向量的余弦相似度,进行KNN聚类,相似性高的节点之间添加边,从而得到初始的电商用户网络A,每个节点表示一个电商用户,两个节点之间如果有连边,表示这两个节点有较高的相似度;
步骤2:通过变分自编码器VGAE编码后,得到电商用户的节点嵌入向量Z=GCNμ(X,A)+∈GCNσ(X,A),GCN表示图卷积神经网络,∈是一个可调参数,GCNμ表示均值向量,GCNσ表示方差向量,再对Z进行解码,得到重建的用户网络
步骤3:计算重建的对称图网络其中
步骤4:计算本轮的电商网络结构
其中η为可调参数,表示融合新老结构的比重;
步骤5:计算嵌入向量Z的KL散度,得到图学习模块的损失值
其中,
其中,
KL[q‖p]表示计算q和p的散度,q(Z|X,A)是GCN计算出的分布,p(Z)是标准高斯分布,α和β为可调参数;
步骤6:计算任意节点i,j之间的注意力系数中间值
其中,
f(·)表示的映射,W是权值矩阵;
步骤7:计算聚合每个电商用户的k阶邻居节点的相似性矩阵
其中,
M是过渡矩阵,D是邻接矩阵A*的度矩阵,Di是i节点的度;
步骤8:计算任意两个节点i,j之间的注意力系数
步骤9:计算任意节点i在分类模块第l层的节点嵌入向量
其中Γi表示i的邻居节点集合;
步骤10:计算半监督分类的损失值
其中表示最后一层输出,Yij是节点的标签,/>表示的是节点集中带有标签的节点;
步骤11:计算本轮迭代的最终损失
其中δ≥0是控制两者之间平衡的可调参数;
步骤12:将初始电商用户网络A更改为返回重复执行步骤2,当/>小于指定的最小损失值后,结束计算,把/>作为电商用户的分类结果。
CN202010894196.9A 2020-08-31 2020-08-31 一种基于网络属性的电商用户分类方法 Active CN112132188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010894196.9A CN112132188B (zh) 2020-08-31 2020-08-31 一种基于网络属性的电商用户分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010894196.9A CN112132188B (zh) 2020-08-31 2020-08-31 一种基于网络属性的电商用户分类方法

Publications (2)

Publication Number Publication Date
CN112132188A CN112132188A (zh) 2020-12-25
CN112132188B true CN112132188B (zh) 2024-04-16

Family

ID=73847679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010894196.9A Active CN112132188B (zh) 2020-08-31 2020-08-31 一种基于网络属性的电商用户分类方法

Country Status (1)

Country Link
CN (1) CN112132188B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733918B (zh) * 2020-12-31 2023-08-29 中南大学 基于注意力机制的图分类方法及化合物毒性预测方法
CN112990721B (zh) * 2021-03-24 2023-04-21 山西大学 一种基于缴费行为的电力用户价值分析方法及系统
CN113111134A (zh) * 2021-04-21 2021-07-13 山东省人工智能研究院 一种基于自编码和注意力机制的异构图节点特征嵌入方法
CN112926701B (zh) * 2021-05-10 2021-10-08 北京人人云图信息技术有限公司 一种基于gcn半监督的航空乘客的分类方法和系统及其设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019100723A1 (zh) * 2017-11-24 2019-05-31 华为技术有限公司 训练多标签分类模型的方法和装置
CN111046907A (zh) * 2019-11-02 2020-04-21 国网天津市电力公司 一种基于多头注意力机制的半监督卷积网络嵌入方法
CN111291212A (zh) * 2020-01-24 2020-06-16 复旦大学 基于图卷积神经网络的零样本草图图像检索方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019100723A1 (zh) * 2017-11-24 2019-05-31 华为技术有限公司 训练多标签分类模型的方法和装置
CN111046907A (zh) * 2019-11-02 2020-04-21 国网天津市电力公司 一种基于多头注意力机制的半监督卷积网络嵌入方法
CN111291212A (zh) * 2020-01-24 2020-06-16 复旦大学 基于图卷积神经网络的零样本草图图像检索方法和系统

Also Published As

Publication number Publication date
CN112132188A (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
CN112132188B (zh) 一种基于网络属性的电商用户分类方法
Darban et al. GHRS: Graph-based hybrid recommendation system with application to movie recommendation
CN112214685B (zh) 一种基于知识图谱的个性化推荐方法
CN107506480B (zh) 一种基于评论挖掘与密度聚类的双层图结构推荐方法
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN109062962B (zh) 一种融合天气信息的门控循环神经网络兴趣点推荐方法
WO2022152161A1 (zh) 混合图神经网络模型的训练、预测
CN113807422B (zh) 融合多特征信息的加权图卷积神经网络评分预测模型
CN112650929A (zh) 一种融入评论信息的图神经网络推荐方法
CN115860880B (zh) 基于多层异质图卷积模型的个性化商品推荐方法及系统
CN113850616A (zh) 基于深度图神经网络的客户生命周期价值预测方法
CN111562541A (zh) 一种应用cart算法实现电能表检测数据管理的软件平台
CN114254738A (zh) 双层演化的动态图卷积神经网络模型构建方法及应用
CN105868422A (zh) 一种基于弹性维特征向量优化抽取的协同过滤推荐方法
KR102358357B1 (ko) 시장규모추정장치 및 그 동작 방법
CN116541592A (zh) 向量生成方法、信息推荐方法、装置、设备及介质
CN114610967A (zh) 一种应用于用户画像领域的数据增广方法
CN112559877A (zh) 基于跨平台异构数据及行为上下文的ctr预估方法及系统
CN114117251B (zh) 一种智慧文博下融合多因素的矩阵分解个性化推荐方法
Müller et al. An Integrated Graph Neural Network for Supervised Non-obvious Relationship Detection in Knowledge Graphs.
CN117593044B (zh) 一种双角度的营销活动效果预测方法、介质及系统
CN114298118B (zh) 一种基于深度学习的数据处理方法、相关设备及存储介质
Joshi et al. A Personalized Video Recommendation Model Based on Multi-Graph Neural Network and Attention Mechanism
Zhang et al. Application of Genetically Optimized LVQ Neural Network in Trade Economic Forecasting
CN117194805A (zh) 基于深度图神经网络的多特征空间融合推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant