CN112132188B - 一种基于网络属性的电商用户分类方法 - Google Patents
一种基于网络属性的电商用户分类方法 Download PDFInfo
- Publication number
- CN112132188B CN112132188B CN202010894196.9A CN202010894196A CN112132188B CN 112132188 B CN112132188 B CN 112132188B CN 202010894196 A CN202010894196 A CN 202010894196A CN 112132188 B CN112132188 B CN 112132188B
- Authority
- CN
- China
- Prior art keywords
- calculating
- nodes
- user
- network
- commerce
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 18
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000005484 gravity Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 abstract 1
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于网络属性的电商用户分类方法,根据电商用户的购物信息使用KNN建立初始网络模型,对初始网络模型使用变分自编码器进行编码解码,通过图卷积神经网络对电商用户数据进行节点分类训练,得到分类的结果。本发明考虑了电商节点之间的拓扑关系及电商数据的内部属性,有效利用了电商网络的相关性信息,分类准确性较高。
Description
技术领域
本发明涉及电商分类领域,特别是指一种基于网络属性的电商用户分类方法。
背景技术
随着互联网和电子商务的蓬勃发展,人类跨入了网络新时代,足不出户便能购买各地的商品。丰富的购物订单信息体现了用户多方面的数据,用户之间可以构成一张错综复杂的信息网络,利用这些数据能过够为我们生活提供了便利,更加准确地进行商品推荐,定位目标用户,为电商带来极大价值。
电商用户分类是指通过用户网络中已知的用户信息和部分用户的类别去预测电商用户网络中其他用户的类别。电商用户分类主要是基于电商网络的结构特性和电商用户的节点属性,给出节点类别的概率,然后与电商用户真实的分类标签进行对比,衡量算法的优劣性。由于电商数据庞大并且复杂,更新用户分类算法使得预测精度与效率达到满意程度就显得十分必要。由于用户之间的连边关系不能直接获得,在进行分类的同时构建一个可靠的用户网络描述用户之间的联系就显得非常重要。
发明内容
为了克服现有电商用户分类的方法没分类准确度较低、受噪声影响严重的不足,更全面地获取电商用户网络结构信息,提升现有算法的分类准确度,本发明提出了一种基于网络属性的电商用户分类方法。
本发明解决其技术问题所采用的技术具体步骤是:
一种基于网络属性的电商用户分类方法,包括如下步骤:
步骤1:统计每个电商用户包括收货地址,购买商品种类,以及金额等d项信息,用一个d维向量表示,则第i个电商用户信息向量表示为xi=[xi1,xi2,...,xid],其中第j项信息xij用一个one-hot向量表示,N个电商用户信息构成用户属性信息矩阵X={x1,x2,...,xN};计算任意两个向量的余弦相似度,进行KNN聚类,相似性高的节点之间添加边,从而得到初始的电商用户网络A,每个节点表示一个电商用户,两个节点之间如果有连边,表示这两个节点有较高的相似度;
步骤2:通过变分自编码器VGAE编码后,得到电商用户的节点嵌入向量Z=GCNμ(X,A)+∈GCNσ(X,A),GCN表示图卷积神经网络,∈是一个可调参数,GCNμ表示均值向量,GCNσ表示方差向量,再对Z进行解码,得到重建的用户网络
步骤3:计算重建的对称图网络其中
步骤4:计算本轮的电商网络结构
其中η为可调参数,表示融合新老结构的比重;
步骤5:计算嵌入向量Z的KL散度,得到图学习模块的损失值
其中,
其中,
KL[q||p]表示计算q和p的散度,q(Z|X,A)是GCN计算出的分布,p(Z)是标准高斯分布,α和β为可调参数;
步骤6:计算任意节点i,j之间的注意力系数中间值
其中,
f(·)表示的映射,W是权值矩阵;
步骤7:计算聚合每个电商用户的k阶邻居节点的相似性矩阵
其中,
M是过渡矩阵,D是邻接矩阵A*的度矩阵,Di是i节点的度;
步骤8:计算任意两个节点i,j之间的注意力系数
步骤9:计算任意节点i在分类模块第l层的节点嵌入向量
其中Γi表示i的邻居节点集合;
步骤10:计算半监督分类的损失值
其中表示最后一层输出,Yij是节点的标签,/>表示的是节点集中带有标签的节点;
步骤11:计算本轮迭代的最终损失
其中δ≥0是控制两者之间平衡的可调参数;
步骤12:将初始电商用户网络A更改为重复执行步骤2~步骤12,当/>小于指定的最小损失值后,结束计算,把/>作为电商用户的分类结果。
本发明的技术构思为:在电商数据中,当用户与用户之间不存在拓扑结构并且只有部分节点已经存在类别时,现有的分类算法准确率不高,本发明提出了考虑了高阶邻居的图注意力神经网络,结合了图学习模块,在对用户进行分类时训练原始图结构,从而提高分类的准确性和抗噪性。
本发明的有益效果表现在:考虑了电商节点之间的拓扑关系及电商数据的内部属性,有效利用了电商网络的相关性信息,分类准确性较高。
附图说明
图1为电商用户网络结构学习与电商用户分类流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图图1,一种基于网络属性的电商用户分类方法,包括如下步骤:
步骤1:统计每个电商用户包括收货地址,购买商品种类,以及金额等d项信息,用一个d维向量表示,则第i个电商用户信息向量表示为xi=[xi1,xi2,...,xid],其中第j项信息xij用一个one-hot向量表示,N个电商用户信息构成用户属性信息矩阵X={x1,x2,...,xN};计算任意两个向量的余弦相似度,进行KNN聚类,相似性高的节点之间添加边,从而得到初始的电商用户网络A,每个节点表示一个电商用户,两个节点之间如果有连边,表示这两个节点有较高的相似度;
步骤2:通过变分自编码器VGAE编码后,得到电商用户的节点嵌入向量Z=GCNμ(X,A)+∈GCNσ(X,A),GCN表示图卷积神经网络,∈是一个可调参数,GCNμ表示均值向量,GCNσ表示方差向量,再对Z进行解码,得到重建的用户网络
步骤3:计算重建的对称图网络其中
步骤4:计算本轮的电商网络结构
其中η为可调参数,表示融合新老结构的比重;
步骤5:计算嵌入向量Z的KL散度,得到图学习模块的损失值
其中,
其中,
KL[q||p]表示计算q和p的散度,q(Z|X,A)是GCN计算出的分布,p(Z)是标准高斯分布,α和β为可调参数;
步骤6:计算任意节点i,j之间的注意力系数中间值
其中,
f(·)表示的映射,W是权值矩阵;
步骤7:计算聚合每个电商用户的k阶邻居节点的相似性矩阵
其中,
M是过渡矩阵,D是邻接矩阵A*的度矩阵,Di是i节点的度;
步骤8:计算任意两个节点i,j之间的注意力系数
步骤9:计算任意节点i在分类模块第l层的节点嵌入向量
其中Γi表示i的邻居节点集合;
步骤10:计算半监督分类的损失值
其中表示最后一层输出,Yij是节点的标签,/>表示的是节点集中带有标签的节点;
步骤11:计算本轮迭代的最终损失
其中δ≥0是控制两者之间平衡的可调参数;
步骤12:将初始电商用户网络A更改为重复执行步骤2~步骤12,当/>小于指定的最小损失值后,结束计算,把/>作为电商用户的分类结果。
Claims (1)
1.一种基于网络属性的电商用户分类方法,其特征在于,所述方法包括如下步骤:
步骤1:统计每个电商用户包括收货地址,购买商品种类,以及金额d项信息,用一个d维向量表示,则第i个电商用户信息向量表示为xi=[xi1,xi2,…,xid],其中第j项信息xij用一个one-hot向量表示,N个电商用户信息构成用户属性信息矩阵X={x1,x2,…,xN};计算任意两个向量的余弦相似度,进行KNN聚类,相似性高的节点之间添加边,从而得到初始的电商用户网络A,每个节点表示一个电商用户,两个节点之间如果有连边,表示这两个节点有较高的相似度;
步骤2:通过变分自编码器VGAE编码后,得到电商用户的节点嵌入向量Z=GCNμ(X,A)+∈GCNσ(X,A),GCN表示图卷积神经网络,∈是一个可调参数,GCNμ表示均值向量,GCNσ表示方差向量,再对Z进行解码,得到重建的用户网络
步骤3:计算重建的对称图网络其中
步骤4:计算本轮的电商网络结构
其中η为可调参数,表示融合新老结构的比重;
步骤5:计算嵌入向量Z的KL散度,得到图学习模块的损失值
其中,
其中,
KL[q‖p]表示计算q和p的散度,q(Z|X,A)是GCN计算出的分布,p(Z)是标准高斯分布,α和β为可调参数;
步骤6:计算任意节点i,j之间的注意力系数中间值
其中,
f(·)表示的映射,W是权值矩阵;
步骤7:计算聚合每个电商用户的k阶邻居节点的相似性矩阵
其中,
,
M是过渡矩阵,D是邻接矩阵A*的度矩阵,Di是i节点的度;
步骤8:计算任意两个节点i,j之间的注意力系数
步骤9:计算任意节点i在分类模块第l层的节点嵌入向量
其中Γi表示i的邻居节点集合;
步骤10:计算半监督分类的损失值
其中表示最后一层输出,Yij是节点的标签,/>表示的是节点集中带有标签的节点;
步骤11:计算本轮迭代的最终损失
其中δ≥0是控制两者之间平衡的可调参数;
步骤12:将初始电商用户网络A更改为返回重复执行步骤2,当/>小于指定的最小损失值后,结束计算,把/>作为电商用户的分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010894196.9A CN112132188B (zh) | 2020-08-31 | 2020-08-31 | 一种基于网络属性的电商用户分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010894196.9A CN112132188B (zh) | 2020-08-31 | 2020-08-31 | 一种基于网络属性的电商用户分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112132188A CN112132188A (zh) | 2020-12-25 |
CN112132188B true CN112132188B (zh) | 2024-04-16 |
Family
ID=73847679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010894196.9A Active CN112132188B (zh) | 2020-08-31 | 2020-08-31 | 一种基于网络属性的电商用户分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132188B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733918B (zh) * | 2020-12-31 | 2023-08-29 | 中南大学 | 基于注意力机制的图分类方法及化合物毒性预测方法 |
CN112990721B (zh) * | 2021-03-24 | 2023-04-21 | 山西大学 | 一种基于缴费行为的电力用户价值分析方法及系统 |
CN113111134A (zh) * | 2021-04-21 | 2021-07-13 | 山东省人工智能研究院 | 一种基于自编码和注意力机制的异构图节点特征嵌入方法 |
CN112926701B (zh) * | 2021-05-10 | 2021-10-08 | 北京人人云图信息技术有限公司 | 一种基于gcn半监督的航空乘客的分类方法和系统及其设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019100723A1 (zh) * | 2017-11-24 | 2019-05-31 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
CN111046907A (zh) * | 2019-11-02 | 2020-04-21 | 国网天津市电力公司 | 一种基于多头注意力机制的半监督卷积网络嵌入方法 |
CN111291212A (zh) * | 2020-01-24 | 2020-06-16 | 复旦大学 | 基于图卷积神经网络的零样本草图图像检索方法和系统 |
-
2020
- 2020-08-31 CN CN202010894196.9A patent/CN112132188B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019100723A1 (zh) * | 2017-11-24 | 2019-05-31 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
CN111046907A (zh) * | 2019-11-02 | 2020-04-21 | 国网天津市电力公司 | 一种基于多头注意力机制的半监督卷积网络嵌入方法 |
CN111291212A (zh) * | 2020-01-24 | 2020-06-16 | 复旦大学 | 基于图卷积神经网络的零样本草图图像检索方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112132188A (zh) | 2020-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112132188B (zh) | 一种基于网络属性的电商用户分类方法 | |
Darban et al. | GHRS: Graph-based hybrid recommendation system with application to movie recommendation | |
CN112214685B (zh) | 一种基于知识图谱的个性化推荐方法 | |
CN107506480B (zh) | 一种基于评论挖掘与密度聚类的双层图结构推荐方法 | |
CN111222332B (zh) | 一种结合注意力网络和用户情感的商品推荐方法 | |
CN109062962B (zh) | 一种融合天气信息的门控循环神经网络兴趣点推荐方法 | |
WO2022152161A1 (zh) | 混合图神经网络模型的训练、预测 | |
CN113807422B (zh) | 融合多特征信息的加权图卷积神经网络评分预测模型 | |
CN112650929A (zh) | 一种融入评论信息的图神经网络推荐方法 | |
CN115860880B (zh) | 基于多层异质图卷积模型的个性化商品推荐方法及系统 | |
CN113850616A (zh) | 基于深度图神经网络的客户生命周期价值预测方法 | |
CN111562541A (zh) | 一种应用cart算法实现电能表检测数据管理的软件平台 | |
CN114254738A (zh) | 双层演化的动态图卷积神经网络模型构建方法及应用 | |
CN105868422A (zh) | 一种基于弹性维特征向量优化抽取的协同过滤推荐方法 | |
KR102358357B1 (ko) | 시장규모추정장치 및 그 동작 방법 | |
CN116541592A (zh) | 向量生成方法、信息推荐方法、装置、设备及介质 | |
CN114610967A (zh) | 一种应用于用户画像领域的数据增广方法 | |
CN112559877A (zh) | 基于跨平台异构数据及行为上下文的ctr预估方法及系统 | |
CN114117251B (zh) | 一种智慧文博下融合多因素的矩阵分解个性化推荐方法 | |
Müller et al. | An Integrated Graph Neural Network for Supervised Non-obvious Relationship Detection in Knowledge Graphs. | |
CN117593044B (zh) | 一种双角度的营销活动效果预测方法、介质及系统 | |
CN114298118B (zh) | 一种基于深度学习的数据处理方法、相关设备及存储介质 | |
Joshi et al. | A Personalized Video Recommendation Model Based on Multi-Graph Neural Network and Attention Mechanism | |
Zhang et al. | Application of Genetically Optimized LVQ Neural Network in Trade Economic Forecasting | |
CN117194805A (zh) | 基于深度图神经网络的多特征空间融合推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |