CN112053210A - 一种基于商品社区分类的关联值传播方法、系统及设备 - Google Patents

一种基于商品社区分类的关联值传播方法、系统及设备 Download PDF

Info

Publication number
CN112053210A
CN112053210A CN202010955111.3A CN202010955111A CN112053210A CN 112053210 A CN112053210 A CN 112053210A CN 202010955111 A CN202010955111 A CN 202010955111A CN 112053210 A CN112053210 A CN 112053210A
Authority
CN
China
Prior art keywords
commodity
node
degree
association
community
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010955111.3A
Other languages
English (en)
Other versions
CN112053210B (zh
Inventor
慕畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Mengwang Video Co ltd
Original Assignee
Shenzhen Mengwang Video Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Mengwang Video Co ltd filed Critical Shenzhen Mengwang Video Co ltd
Priority to CN202010955111.3A priority Critical patent/CN112053210B/zh
Publication of CN112053210A publication Critical patent/CN112053210A/zh
Application granted granted Critical
Publication of CN112053210B publication Critical patent/CN112053210B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明方法提供的一种基于商品社区分类的关联值传播方法、系统及设备,本发明方法通过对商品节点进行群组划分,计算并获取关联度最大的商品节点群组;找到关联度最大商品节点群组的社区关联中心节点进行推荐;本发明方法既采纳关联推荐算法的优点,又将其“升维”,从整体上明晰整个购买行为构成的关系网络,从而将关联推荐技术与关系网络技术进行融合应用,在应用上,形成1+1>2的效果,解决了关系网络中的一元失真问题,获得最优的多元传播中心,从而真正有效地提高了投放效率。

Description

一种基于商品社区分类的关联值传播方法、系统及设备
技术领域
本发明涉及数据挖掘领域,尤其涉及一种基于商品社区分类的关联值传播方法、系统及设备。
背景技术
基于支持度,置信度与提升度的关联推荐,基于支持度,置信度与提升度的关联推荐,是数据挖掘领域常用的传统推荐算法,它基于商品或视频之间“共同出现”的概率与频次而对未来商品或视频是否会被购买或观看行为的算法。
基于支持度,置信度与提升度的关联推荐,其本质是基于“点”或几个点连成“线”的推荐方式。从而达到个体或局部最优,但局部最优并非整体最优,很可能出现局部最优是以牺牲整体推荐效果为代价,未从整体“面”上考虑。比如A,B两种商品,关联A购买数量是B的两倍,关联推荐会推荐A,但B商品购买一次后,会连带购买C,D,带来3件商品的销售,此时关联推荐就会有很大局限性,推荐不准确、效率低。
发明内容
本发明实施例的目的在于提供一种基于商品社区分类的关联值传播方法,旨在解决现有的关联推荐虽局部较优,但整体推荐效果不准确、效率低的问题。
本发明实施例的第一目的在于提供一种基于商品社区分类的关联值传播方法,所述方法包括:
统计有向同时购买的商品节点,创建触发与被触发商品节点数据表;
以商品节点为元素,推导k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量计算公式;k表示商品节点总数且k>0;m=1,2,……k;其中,每个组合称为一个商品节点群组;
统计k个元素的集合{G1,G2,G3……Gk}可划分的所有不同商品节点群组的总数量;
计算所有商品节点群组中,每个商品节点群组的关联度;
获取所有商品节点群组中,关联度最大的商品节点群组。
进一步地,所述基于商品品类的双层协同过滤推荐方法还包括以下步骤:
获取所述关联度最大的商品节点群组中,每个社区中关联度最大的触发商品节点,也称社区的关联中心节点;
所述商品节点群组内的每个子集称为该商品节点群组的一个社区;
推荐所述关联度最大的商品节点群组中,每个社区的关联中心节点所对应的商品。
进一步地,所述基于商品社区分类的关联值传播方法还包括步骤:
根据所述触发与被触发商品节点数据表,构建商品节点连接关系网络;
具体为:以商品为节点,商品之间的连接关系为边,商品之间有向同时购买的频次为边权值,构建商品连接关系网络;若商品节点Gi和Gj之间存在有向同时购买触发关系,则商品节点Gi和Gj之间添加一条连接边。
本发明实施例的第二目的在于提供一种基于商品社区分类的关联值传播系统,所述系统包括:
触发与被触发商品节点数据表创建模块,用于统计有向同时购买的商品节点,创建触发与被触发商品节点数据表;
商品节点群组数量计算公式推导模块,用于以商品节点为元素,推导k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量计算公式;k表示商品节点总数且k>0;m=1,2,……k;其中,每个组合称为一个商品节点群组,所述商品节点群组内的每个子集称为该商品节点群组的一个社区;
商品节点群组总数统计模块,用于统计k个元素的集合{G1,G2,G3……Gk}可划分的所有不同商品节点群组的总数量Q;
商品节点群组关联度计算装置,用于计算所有商品节点群组中,每个商品节点群组的关联度;
最大关联度商品节点群组获取模块,用于获取所有商品节点群组中,关联度最大的商品节点群组。
进一步地,所述基于商品社区分类的关联值传播系统还包括:
社区关联中心节点获取模块,用于获取所述关联度最大的商品节点群组中,每个社区中关联度最大的触发商品节点,也称社区的关联中心节点;
商品推荐模块,用于推荐所述关联度最大的商品节点群组中,每个社区的关联中心节点所对应的商品。
进一步地,所述基于商品社区分类的关联值传播系统还包括:
商品节点连接关系网络构建模块,与触发与被触发商品节点数据表创建模块相连,用于根据所述触发与被触发商品节点数据表,构建商品节点连接关系网络;
具体为:以商品为节点,商品之间的连接关系为边,商品之间有向同时购买的频次为边权值,构建商品连接关系网络;若商品节点Gi和Gj之间存在有向同时购买触发关系则商品节点Gi和Gj之间添加一条连接边;商品节点Gi和Gj之间还可存在间接连接关系,通过包含至少1个中间节点和至少2条连接边形成的路径相连,所述路径的数量至少一条;
本发明实施例的第三目的在于提供一种设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述基于商品社区分类的关联值传播方法的步骤。
本发明的有益效果
本发明方法提供的一种基于商品社区分类的关联值传播方法、系统及设备,本发明方法通过对商品节点进行群组划分,计算并获取关联度最大的商品节点群组;找到关联度最大商品节点群组的社区关联中心节点进行推荐;本发明方法既采纳关联推荐算法的优点,又将其“升维”,从整体上明晰整个购买行为构成的关系网络,从而将关联推荐技术与关系网络技术进行融合应用,在应用上,形成1+1>2的效果,解决了关系网络中的一元失真问题,获得最优的多元传播中心,从而真正有效地提高了投放效率。
附图说明
图1是本发明实施例提供的一种基于商品社区分类的关联值传播方法流程图;
图2是本发明实施例提供的计算每个商品节点群组的关联度方法流程图;
图3是本发明实施例提供的计算社区内包含的关联节点组的关联度的方法流程图;
图4是本发明实施例提供的获取关联度最大的商品节点群组中各社区的关联中心节点方法流程图;
图5是本发明实施例提供的关联度最大的商品节点群组中各商品节点的连接关系网络图;
图6是本发明实施例提供的基于商品社区分类的关联值传播系统结构图;
图7是本发明实施例提供的商品节点群组关联度计算装置结构图;
图8是本发明实施例提供的关联节点组关联度计算模块结构图;
图9是本发明实施例提供的关联度最大的商品节点群组中,社区关联中心节点计算模块结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本发明进行进一步详细说明,为了便于说明,仅示出了与本发明实施例相关的部分。应当理解,此处所描写的具体实施例,仅仅用于解释本发明,并不用以限制本发明,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据本发明实施例获得其他的等同实施例。
本发明方法提供的一种基于商品社区分类的关联值传播方法、系统及设备,本发明方法通过对商品节点进行群组划分,计算并获取关联度最大的商品节点群组;找到关联度最大商品节点群组的社区关联中心节点进行推荐;本发明方法既采纳关联推荐算法的优点,又将其“升维”,从整体上明晰整个购买行为构成的关系网络,从而将关联推荐技术与关系网络技术进行融合应用,在应用上,形成1+1>2的效果,解决了关系网络中的一元失真问题,获得最优的多元传播中心,从而真正有效地提高了投放效率。
图1是本发明实施例提供的一种基于商品社区分类的关联值传播方法流程图;所述方法包括:
Step1,统计有向同时购买的商品节点,创建触发与被触发商品节点数据表;
可选地,Step1之后还包括步骤:根据所述触发与被触发商品节点数据表,构建商品节点连接关系网络;
具体为:以商品为节点,商品之间的连接关系为边,商品之间有向同时购买的频次为边权值,构建商品连接关系网络;
若商品节点Gi和Gj之间存在有向同时购买触发关系(直接连接关系),则商品节点Gi和Gj之间添加一条连接边;商品节点Gi和Gj之间还可存在间接连接关系,通过包含至少1个中间节点和至少2条连接边形成的路径相连,所述路径的数量至少一条;
所述触发与被触发商品节点数据表包括字段:触发商品节点和被触发商品节点;
本发明实施例中,假设总共有k个商品节点,用集合G={G1,G2,…Gk}表示;
本发明实施例中,商品节点为具体的商品;譬如若商品平台为商超、电商等购物类平台,则商品节点可以为统一方便面这一商品,或怡宝矿泉水这一商品;若商品平台为视频或资讯信息流观看类平台,则商品节点可以为具体的一个短视频或一条新闻信息;购买还可表示点击、喜欢、已选择、已收藏、已加购物车等类似喜好选择情况;本领域的技术人员可以理解,不用于限制本发明的保护范围。
如表1所述为本发明实施例触发与被触发商品节点数据表;
触发商品节点 被触发商品节点
G<sub>1</sub> G<sub>2</sub>
G<sub>3</sub> G<sub>1</sub>
G<sub>4</sub> G<sub>3</sub>
G<sub>9</sub> G<sub>5</sub>
G<sub>6</sub> G<sub>2</sub>
表1
Step2,以商品节点为元素,推导k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量计算公式(即集合{G1,G2,G3……Gk}可划分为多少个不同的组合);k表示商品节点总数且k>0;m=1,2,……k;其中,每个组合称为一个商品节点群组,所述商品节点群组内的每个子集称为该商品节点群组的一个社区;
k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量计算公式为:T(k,m)=T(k-1,m-1)+m×T(k-1,m);
其中,T(k,m)表示k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量;
T(k,m)的计算公式推导方法如下:
当商品节点数k=1时,可划分为:
(A1)由m=1个子集组成的商品节点群组为:{{G1}};T(1,1)=1;
当商品节点数k=2时,可划分为:
(B1)由m=1个子集组成的商品节点群组为:{{G1,G2}};T(2,1)=1;
(B2)由m=2个子集组成的商品节点群组为:{{G1},{G2}};T(2,2)=1;
当商品节点数k=3时,可划分为:
(C1)由m=1个子集组成的商品节点群组为:{{G1,G2,G3}};T(3,1)=1;
(C2)由m=2个子集组成的商品节点群组有3个,分别为:{{G1,G2},{G3}},{{G1},{G2,G3}},{{G1,G3},{G2}};T(3,2)=3;
(C3)由m=3个子集组成的商品节点群组为:{{G1},{G2},{G3}};T(3,3)=1;
譬如,当k=3,m=2时,可划分为T(3,2)=3个商品节点群组,{{G1,G2},{G3}}为其中的一个商品节点群组,该商品节点群组包含2个社区:{G1,G2}和{G3};
若需统计T(4,2),则步骤为:
在(C1)里增加一个元素G4得到:{{G1,G2,G3},{G4}};
在(C2)里任意一个子集增加一个元素G4得到:{{G1,G2,G4},{G3}},{{G1,G2},{G3,G4}},{{G1,G4},{G2,G3}},{{G1},{G2,G3,G4}},{{G1,G3,G4},{G2}},{{G1,G3},{G2,G4}};
T(4,2)=7;
公式为:T(4,2)=T(3,1)+2×T(3,2)=1+2×3=7;
以此类推,T(4,3)=T(3,2)+3×T(3,3)=3+3×1=6;
推广为:T(k,m)=T(k-1,m-1)+m×T(k-1,m);
Step3,统计k个元素的集合{G1,G2,G3……Gk}可划分的所有不同商品节点群组的总数量Q;
计算公式为:
Figure BDA0002678330950000061
譬如,若商品节点总数k=4,则
Figure BDA0002678330950000062
Step4,计算所有商品节点群组中,每个商品节点群组的关联度;
图2是本发明实施例提供的计算每个商品节点群组的关联度的方法流程图,包括以下步骤:
S41,根据商品节点群组的各社区包含的商品节点,在商品节点数据表中选出各社区包含的触发商品节点与被触发商品节点组,也称关联节点组;所述触发商品节点与被触发商品节点同时属于同一社区;每个关联节点组包括两个商品节点;
本发明实施例中,假设某一个商品节点群组为:{{G1,G3,G6,G8},{G2,G5,G12,G13},{G4,G7,G9,G10,G11}},其包括3个社区:第一社区{G1,G3,G6,G8},第二社区{G2,G5,G12,G13},第三社区{G4,G7,G9,G10,G11};
第一社区{G1,G3,G6,G8}包含的6组触发商品节点与被触发商品节点如表2所示:
Figure BDA0002678330950000063
Figure BDA0002678330950000071
表2
S42,计算所述商品节点群组的各社区内包含的每组关联节点组(Gi,Gj)的关联度;
图3是本发明实施例提供的计算社区内包含的关联节点组的关联度的方法流程图,包括以下步骤::
S421:计算关联规则(Gi=>Gj)对应的支持度、置信度、提升度;
支持度:项集中Gi,Gj同时发生的概率,即同时发生Gi,Gj在总项集I中发生的概率。
Support(Gi=>Gj)=P(Gi∩Gj)/P(I)=num(Gi∩Gj)/num(I);
其中,Support(Gi=>Gj)表示关联规则(Gi=>Gj)的支持度;关联规则(Gi=>Gj)表示购买商品节点Gi触发购买商品节点Gj;P(Gi∩Gj)表示Gi,Gj同时在总项集里出现的概率;Gi,Gj表示项集中的项;I表示总项集;num()表示求总项集里特定项集出现的次数;num(Gi∩Gj)表示含有Gi和Gj的项集的个数(即次数);num(I)表示总项集的个数;i,j表示集合{G1,G2,…Gk}中商品节点的序号,1≤i≤k;1≤j≤k;
项集即项的集合,包含K个项的项集称为K项集;
本发明实施例中,譬如关联节点组{G1,G3}为一个2项集;关联规则(G1=>G3)表示购买商品节点G1触发购买商品节点G3;计算关联规则(G1=>G3)的支持度即计算同时购买商品节点G1和G3的次数占总项集数的比率,总项集为触发与被触发商品节点数据表中关联节点组的总数量;
置信度:项集中Gi发生的情况下,Gj发生的概率。表示在发生Gi的项集中,同时会发生Gj的可能性,即Gi和Gj同时发生的个数占仅仅Gi发生个数的比例,公式为:
Confidence(Gi=>Gj)=P(Gj|Gi)=P(Gi∩Gj)/P(Gi)
其中,Confidence(Gi=>Gj)表示关联规则(Gi=>Gj)的置信度;P(Gj|Gi)表示在发生Gi的项集中,同时会发生Gj的概率;P(Gi∩Gj)表示Gi,Gj同时在总项集里出现的概率,P(Gi)表示Gi在总项集里出现的概率;
提升度:表示含有Gi的条件下同时含有Gj的概率,与Gj总体发生的概率之比。
Lift(Gi→Gj)=P(Gj|Gi)/P(Gj)
其中,Lift(Gi=>Gj)表示关联规则(Gi=>Gj)的提升度;P(Gj)表示项集{Gj}在总项集里出现的概率;
提升度反映了关联规则中的Gi与Gj的相关性,提升度>1且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性,即相互独立。
S422:对关联规则(Gi=>Gj)的支持度,置信度,提升度进行归一化处理;
归一化处理公式为:
Figure BDA0002678330950000081
其中,fn分别表示归一化处理后的关联规则(Gi=>Gj)的支持度,置信度,提升度值,分别为f1,f2,f3;f分别表示归一化处理前的关联规则(Gi=>Gj)的支持度,置信度,提升度原始值;
S423:计算关联规则(Gi=>Gj)的关联值,即为关联节点组(Gi,Gj)的关联值;
r=w1f1+w2f2+w3f3
其中,r表示关联值,w1、w2、w3分别为支持度,置信度,提升度的权重,一般为1/3,1/3,1/3,也可以根据重要性和实际业务场景进行权重调整。
如表3为本发明实施例的商品购买关联规则推荐表;
序号 关联规则(项集) 支持度 至信度 提升度 联合度
1 G<sub>1</sub>=&gt;G<sub>3</sub> 1/11 1/2 1/4 0.09
2 G<sub>3</sub>=&gt;G<sub>8</sub> 1/11 1/2 1/3 0.10
3 G<sub>3</sub>=&gt;G<sub>6</sub> 1/11 1/2 1/4 0.09
4 G<sub>8</sub>=&gt;G<sub>1</sub> 1/11 1/2 1/3 0.10
5 G<sub>8</sub>=&gt;G<sub>3</sub> 1/11 1/4 1/6 0.07
6 G<sub>8</sub>=&gt;G<sub>6</sub> 2/11 2/6 2/2 0.17
表3
S43,计算所述各社区的关联度R(i);
所述社区的关联度为社区内包含的各组关联节点组的关联度之和;
本发明实施例中,第一社区{G1,G3,G6,G8}的关联度R(1)=R(G1->G3)+R(G3->G8)+R(G3->G6)+R(G8->G1)+R(G8->G3)+R(G8->G6);
其中,R(G1->G3)表示触发商品节点G1与被触发商品节点G3的关联度,以此类推;
S44,计算各商品节点群组的关联度;
各商品节点群组的关联度为各商品节点群组中包含的所有社区的关联度之和;
本发明实施例中,所述商品节点群组{{G1,G3,G6,G8},{G2,G5,G12,G13},{G4,G7,G9,G10,G11}}的关联度=第一社区{G1,G3,G6,G8}的关联度+第二社区{G2,G5,G12,G13}的关联度+第三社区{G4,G7,G9,G10,G11}的关联度;
Step5,获取所有商品节点群组中,关联度最大的商品节点群组。
所述关联度最大的的商品节点群组,即为最适合进行推广的商品节点群组;
进一步地,所述基于商品品类的双层协同过滤推荐方法还包括以下步骤:
Step6,获取所述关联度最大的商品节点群组中,每个社区中关联度最大的触发商品节点,也称社区的关联中心节点;
图4是本发明实施例提供的获取关联度最大的商品节点群组中各社区的关联中心节点方法流程图,包括以下步骤:
S61,统计关联度最大的商品节点群组中,每个社区中的触发商品节点;
本发明实施例中,某一社区包含的所有商品节点中,存在所有商品节点既是触发商品节点也是被触发商品节点,或部分商品节点仅仅是被触发商品节点;
S62,计算关联度最大的商品节点群组中,每个社区中的触发商品节点的关联度;
所述关联度最大的商品节点群组中,其中一社区的触发商品节点Gi的关联度为该社区中所有关联节点组中,触发商品节点为Gi的所有关联节点组的关联度之和;
本发明实施例中,假设所有商品节点群组中,链接度最大的商品节点群组{{G1,G3,G6,G8},{G2,G5,G12,G13},{G4,G7,G9,G10,G11}},其包括3个社区:第一社区{G1,G3,G6,G8},第二社区{G2,G5,G12,G13},第三社区{G4,G7,G9,G10,G11};其中第一社区{G1,G3,G6,G8}中的触发节点G8的关联度=R(G8->G1)+R(G8->G3)+R(G8->G6);
S63,获取所述社区中的关联度最大的触发商品节点,即为社区的关联中心节点;
Step7,推荐所述关联度最大的商品节点群组中,每个社区的关联中心节点所对应的商品;
如图5所示是本发明实施例提供的关联度最大的商品节点群组中各商品节点的连接关系网络图;
本发明实施列中,假设如图5所示是所有商品节点群组中,关联度最大的商品节点群组{{G1,G3,G6,G8},{G2,G5,G12,G13},{G4,G7,G9,G10,G11}},其包括3个社区{G1,G3,G6,G8},{G2,G5,G12,G13},{G4,G7,G9,G10,G11},第一社区{G1,G3,G6,G8}的关联中心节点为G8,第二社区{G2,G5,G12,G13}的关联中心节点为G5,第三社区{G4,G7,G9,G10,G11}的关联中心节点为G4;则在实际应用中,着重推送G8,G5,G4这3个节点对应的商品;
本发明实施中,社区划分是为了区域内传播更高效,社区与社区间的节点可能不进行传播;社区内触发商品节点的关联度高表示该节点在该社区传播度高;社区的触发商品节点关联度高表示该社区在该群组的传播度高;群组的关联度高表示该群组在所有群组中关联度高;通过投放关联度最高群组中各社区的关联中心节点,通过所述关联中心节点,传播到各关联中心节点所在的社区,从而实现所有社区的高效传播。
对应于上文实施例所述的基于商品社区分类的关联值传播方法,图6是本发明实施例提供的基于商品社区分类的关联值传播系统结构图;所述系统包括:
触发与被触发商品节点数据表创建模块,用于统计有向同时购买的商品节点,创建触发与被触发商品节点数据表;
所述触发与被触发商品节点数据表包括字段:触发商品节点和被触发商品节点;
商品节点群组数量计算公式推导模块,用于以商品节点为元素,推导k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量计算公式(即集合{G1,G2,G3……Gk}可划分为多少个不同的组合);k表示商品节点总数且k>0;m=1,2,……k;其中,每个组合称为一个商品节点群组,所述商品节点群组内的每个子集称为该商品节点群组的一个社区;
k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量计算公式为:T(k,m)=T(k-1,m-1)+m×T(k-1,m);
其中,T(k,m)表示k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量;
商品节点群组总数统计模块,用于统计k个元素的集合{G1,G2,G3……Gk}可划分的所有不同商品节点群组的总数量Q;
计算公式为:
Figure BDA0002678330950000111
商品节点群组关联度计算装置,用于计算所有商品节点群组中,每个商品节点群组的关联度;
最大关联度商品节点群组获取模块,用于获取所有商品节点群组中,关联度最大的商品节点群组。
进一步地,所述基于商品社区分类的关联值传播系统还包括
商品节点连接关系网络构建模块,与触发与被触发商品节点数据表创建模块相连,用于根据所述触发与被触发商品节点数据表,构建商品节点连接关系网络;
具体为:以商品为节点,商品之间的连接关系为边,商品之间有向同时购买的频次为边权值,构建商品连接关系网络;
若商品节点Gi和Gj之间存在有向同时购买触发关系(直接连接关系),则商品节点Gi和Gj之间添加一条连接边;商品节点Gi和Gj之间还可存在间接连接关系,通过包含至少1个中间节点和至少2条连接边形成的路径相连,所述路径的数量至少一条;
进一步地,k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量计算公式为:T(k,m)=T(k-1,m-1)+m×T(k-1,m);
其中,T(k,m)表示k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量;
T(k,m)的计算公式推导方法如下:
当商品节点数k=1时,可划分为:
(A1)由m=1个子集组成的商品节点群组为:{{G1}};T(1,1)=1;
当商品节点数k=2时,可划分为:
(B1)由m=1个子集组成的商品节点群组为:{{G1,G2}};T(2,1)=1;
(B2)由m=2个子集组成的商品节点群组为:{{G1},{G2}};T(2,2)=1;
当商品节点数k=3时,可划分为:
(C1)由m=1个子集组成的商品节点群组为:{{G1,G2,G3}};T(3,1)=1;
(C2)由m=2个子集组成的商品节点群组有3个,分别为:{{G1,G2},{G3}},{{G1},{G2,G3}},{{G1,G3},{G2}};T(3,2)=3;
(C3)由m=3个子集组成的商品节点群组为:{{G1},{G2},{G3}};T(3,3)=1;
譬如,当k=3,m=2时,可划分为T(3,2)=3个商品节点群组,{{G1,G2},{G3}}为其中的一个商品节点群组,该商品节点群组包含2个社区:{G1,G2}和{G3};
若需统计T(4,2),则步骤为:
在(C1)里增加一个元素G4得到:{{G1,G2,G3},{G4}};
在(C2)里任意一个子集增加一个元素G4得到:{{G1,G2,G4},{G3}},{{G1,G2},{G3,G4}},{{G1,G4},{G2,G3}},{{G1},{G2,G3,G4}},{{G1,G3,G4},{G2}},{{G1,G3},{G2,G4}};
T(4,2)=7;
公式为:T(4,2)=T(3,1)+2×T(3,2)=1+2×3=7;
以此类推,T(4,3)=T(3,2)+3×T(3,3)=3+3×1=6;
推广为:T(k,m)=T(k-1,m-1)+m×T(k-1,m);
进一步地,所述基于商品社区分类的关联值传播系统还包括
社区关联中心节点获取模块,用于获取所述关联度最大的商品节点群组中,每个社区中关联度最大的触发商品节点,也称社区的关联中心节点;
商品推荐模块,用于推荐所述关联度最大的商品节点群组中,每个社区的关联中心节点所对应的商品。
进一步地,图7是本发明实施例提供的商品节点群组关联度计算装置结构图;所述商品节点群组关联度度计算装置包括:
社区关联节点组选择模块,用于根据商品节点群组的各社区包含的商品节点,在商品节点数据表中选出各社区包含的触发商品节点与被触发商品节点组,也称关联节点组;所述触发商品节点与被触发商品节点同时属于同一社区;每个关联节点组包括两个商品节点;
关联节点组关联度计算模块,用于计算所述商品节点群组的各社区内包含的每组关联节点组(Gi,Gj)的关联度;
社区关联度计算模块,用于计算所述各社区的关联度R(i);
所述社区的关联度为社区内包含的各组关联节点组的关联度之和;
群组关联度计算模块,用于计算各商品节点群组的关联度;
各商品节点群组的关联度为各商品节点群组中包含的所有社区的关联度之和;
进一步地,图8是本发明实施例提供的关联节点组关联度计算模块结构图;所述关联节点组关联度计算模块包括
支持度、置信度、提升度计算模块,用于计算关联规则(Gi=>Gj)对应的支持度、置信度、提升度;
支持度:项集中Gi,Gj同时发生的概率,即同时发生Gi,Gj在总项集I中发生的概率。
Support(Gi=>Gj)=P(Gi∩Gj)/P(I)=num(Gi∩Gj)/num(I);
其中,Support(Gi=>Gj)表示关联规则(Gi=>Gj)的支持度;关联规则(Gi=>Gj)表示购买商品节点Gi触发购买商品节点Gj;P(Gi∩Gj)表示Gi,Gj同时在总项集里出现的概率;Gi,Gj表示项集中的项;I表示总项集;num()表示求总项集里特定项集出现的次数;num(Gi∩Gj)表示含有Gi和Gj的项集的个数(即次数);num(I)表示总项集的个数;i,j表示集合{G1,G2,…Gk}中商品节点的序号,1≤i≤k;1≤j≤k;
项集即项的集合,包含K个项的项集称为K项集;
本发明实施例中,譬如关联节点组{G1,G3}为一个2项集;关联规则(G1=>G3)表示购买商品节点G1触发购买商品节点G3;计算关联规则(G1=>G3)的支持度即计算同时购买商品节点G1和G3的次数占总项集数的比率,总项集为触发与被触发商品节点数据表中关联节点组的总数量;
置信度:项集中Gi发生的情况下,Gj发生的概率。表示在发生Gi的项集中,同时会发生Gj的可能性,即Gi和Gj同时发生的个数占仅仅Gi发生个数的比例,公式为:
Confidence(Gi=>Gj)=P(Gj|Gi)=P(Gi∩Gj)/P(Gi)
其中,Confidence(Gi=>Gj)表示关联规则(Gi=>Gj)的置信度;P(Gj|Gi)表示在发生Gi的项集中,同时会发生Gj的概率;P(Gi∩Gj)表示Gi,Gj同时在总项集里出现的概率,P(Gi)表示Gi在总项集里出现的概率;
提升度:表示含有Gi的条件下同时含有Gj的概率,与Gj总体发生的概率之比。
Lift(Gi→Gj)=P(Gj|Gi)/P(Gj)
其中,Lift(Gi=>Gj)表示关联规则(Gi=>Gj)的提升度;P(Gj)表示项集{Gj}在总项集里出现的概率;
提升度反映了关联规则中的Gi与Gj的相关性,提升度>1且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性,即相互独立。
归一化处理模块,用于对关联规则(Gi=>Gj)的支持度,置信度,提升度进行归一化处理;
归一化处理公式为:
Figure BDA0002678330950000131
其中,fn分别表示归一化处理后的关联规则(Gi=>Gj)的支持度,置信度,提升度值,分别为f1,f2,f3;f分别表示归一化处理前的关联规则(Gi=>Gj)的支持度,置信度,提升度原始值;
关联值计算模块,用于计算关联规则(Gi=>Gj)的关联值,即为关联节点组(Gi,Gj)的关联值;
r=w1f1+w2f2+w3f3
其中,r表示关联值,w1、w2、w3分别为支持度,置信度,提升度的权重,一般为1/3,1/3,1/3,也可以根据重要性和实际业务场景进行权重调整。
进一步地,图9是本发明实施例提供的关联度最大的商品节点群组中,社区关联中心节点获取模块结构图,包括
社区触发商品节点统计模块,用于统计关联度最大的商品节点群组中,每个社区中的触发商品节点;
社区触发商品节点关联度计算模块,用于计算关联度最大的商品节点群组中,每个社区中的触发商品节点的关联度;
所述关联度最大的商品节点群组中,其中一社区的触发商品节点Gi的关联度为该社区中所有关联节点组中,触发商品节点为Gi的所有关联节点组的关联度之和;
社区关联中心节点获取模块,用于获取所述社区中的关联度最大的触发商品节点,即为社区的关联中心节点;
本发明实施例还提供的一种终端设备,该实施例的终端设备包括:处理器、存储器以及存储在所述存储器中并可被在所述处理器上运行的计算机程序。所述处理器执行所述计算机程序时实现上述基于商品社区分类的关联值传播方法实施例中的步骤。或者,所述处理器执行所述计算机程序时实现上述各系统实施例中各单元的功能。
本领域的普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序指令相关硬件来完成的,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质可以为ROM、RAM、磁盘、光盘等。
上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种基于商品社区分类的关联值传播方法,其特征在于,所述方法包括:
统计有向同时购买的商品节点,创建触发与被触发商品节点数据表;
以商品节点为元素,推导k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量计算公式;k表示商品节点总数且k>0;m=1,2,……k;其中,每个组合称为一个商品节点群组;
统计k个元素的集合{G1,G2,G3……Gk}可划分的所有不同商品节点群组的总数量;
计算所有商品节点群组中,每个商品节点群组的关联度;
获取所有商品节点群组中,关联度最大的商品节点群组。
2.如权利要求1所述的基于商品社区分类的关联值传播方法,其特征在于,所述基于商品品类的双层协同过滤推荐方法还包括以下步骤:
获取所述关联度最大的商品节点群组中,每个社区中关联度最大的触发商品节点,也称社区的关联中心节点;
所述商品节点群组内的每个子集称为该商品节点群组的一个社区;
推荐所述关联度最大的商品节点群组中,每个社区的关联中心节点所对应的商品。
3.如权利要求2所述的基于商品社区分类的关联值传播方法,其特征在于,所述基于商品社区分类的关联值传播方法还包括步骤:
根据所述触发与被触发商品节点数据表,构建商品节点连接关系网络;
具体为:以商品为节点,商品之间的连接关系为边,商品之间有向同时购买的频次为边权值,构建商品连接关系网络;若商品节点Gi和Gj之间存在有向同时购买触发关系,则商品节点Gi和Gj之间添加一条连接边。
4.如权利要求1-2任一一项权利要求所述的基于商品社区分类的关联值传播方法,其特征在于,
所述触发与被触发商品节点数据表包括字段:触发商品节点和被触发商品节点。
5.如权利要求4所述的基于商品社区分类的关联值传播方法,其特征在于,所述k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量计算公式为:T(k,m)=T(k-1,m-1)+m×T(k-1,m);
其中,T(k,m)表示k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量;
所述统计k个元素的集合{G1,G2,G3……Gk}可划分的所有不同商品节点群组的总数量Q计算公式为:
Figure FDA0002678330940000021
6.如权利要求5所述的基于商品社区分类的关联值传播方法,其特征在于,所述计算所有商品节点群组中,每个商品节点群组的关联度的方法包括以下步骤:
根据商品节点群组的各社区包含的商品节点,在商品节点数据表中选出各社区包含的触发商品节点与被触发商品节点组,也称关联节点组;
计算所述商品节点群组的各社区内包含的每组关联节点组(Gi,Gj)的关联度;
计算所述各社区的关联度;
计算各商品节点群组的关联度;
所述触发商品节点与被触发商品节点同时属于同一社区;每个关联节点组包括两个商品节点。
7.如权利要求6所述的基于商品社区分类的关联值传播方法,其特征在于,所述计算所述商品节点群组的各社区内包含的每组关联节点组(Gi,Gj)的关联度包括以下步骤:
计算关联规则(Gi=>Gj)对应的支持度、置信度、提升度;
支持度:项集中Gi,Gj同时发生的概率,即同时发生Gi,Gj在总项集I中发生的概率;
Support(Gi=>Gj)=P(Gi∩Gj)/P(I)=num(Gi∩Gj)/num(I);
其中,Support(Gi=>Gj)表示关联规则(Gi=>Gj)的支持度;关联规则(Gi=>Gj)表示购买商品节点Gi触发购买商品节点Gj;P(Gi∩Gj)表示Gi,Gj同时在总项集里出现的概率;Gi,Gj表示项集中的项;I表示总项集;num()表示求总项集里特定项集出现的次数;num(Gi∩Gj)表示含有Gi和Gj的项集的个数(即次数);num(I)表示总项集的个数;i,j表示集合{G1,G2,…Gk}中商品节点的序号,1≤i≤k;1≤j≤k;项集即项的集合,包含K个项的项集称为K项集;
置信度:项集中Gi发生的情况下,Gj发生的概率。表示在发生Gi的项集中,同时会发生Gj的可能性,即Gi和Gj同时发生的个数占仅仅Gi发生个数的比例,公式为:
Confidence(Gi=>Gj)=P(Gj|Gi)=P(Gi∩Gj)/P(Gi);
其中,Confidence(Gi=>Gj)表示关联规则(Gi=>Gj)的置信度;P(Gj|Gi)表示在发生Gi的项集中,同时会发生Gj的概率;P(Gi∩Gj)表示Gi,Gj同时在总项集里出现的概率,P(Gi)表示Gi在总项集里出现的概率;
提升度:表示含有Gi的条件下同时含有Gj的概率,与Gj总体发生的概率之比;
Lift(Gi→Gj)=P(Gj|Gi)/P(Gj);
其中,Lift(Gi=>Gj)表示关联规则(Gi=>Gj)的提升度;P(Gj)表示项集{Gj}在总项集里出现的概率;
对关联规则(Gi=>Gj)的支持度,置信度,提升度进行归一化处理;
归一化处理公式为:
Figure FDA0002678330940000031
其中,fn分别表示归一化处理后的关联规则(Gi=>Gj)的支持度,置信度,提升度值,分别为f1,f2,f3;f分别表示归一化处理前的关联规则(Gi=>Gj)的支持度,置信度,提升度原始值;
计算关联规则(Gi=>Gj)的关联值,即为关联节点组(Gi,Gj)的关联值;
r=w1f1+w2f2+w3f3
其中,r表示关联值;w1、w2、w3分别为支持度、置信度、提升度的权重;
所述社区的关联度为社区内包含的各组关联节点组的关联度之和;
各商品节点群组的关联度为各商品节点群组中包含的所有社区的关联度之和。
8.如权利要求7所述的基于商品社区分类的关联值传播方法,其特征在于,所述获取关联度最大的商品节点群组中各社区的关联中心节点包括以下步骤:
统计关联度最大的商品节点群组中,每个社区中的触发商品节点;
计算关联度最大的商品节点群组中,每个社区中的触发商品节点的关联度;
所述关联度最大的商品节点群组中,其中一社区的触发商品节点Gi的关联度为该社区中所有关联节点组中,触发商品节点为Gi的所有关联节点组的关联度之和;
获取所述社区中的关联度最大的触发商品节点,即为社区的关联中心节点。
9.一种基于商品社区分类的关联值传播系统,其特征在于,所述系统包括:
触发与被触发商品节点数据表创建模块,用于统计有向同时购买的商品节点,创建触发与被触发商品节点数据表;
商品节点群组数量计算公式推导模块,用于以商品节点为元素,推导k个元素的集合{G1,G2,G3……Gk}可划分为由m个子集组成的不同组合的数量计算公式;k表示商品节点总数且k>0;m=1,2,……k;其中,每个组合称为一个商品节点群组,所述商品节点群组内的每个子集称为该商品节点群组的一个社区;
商品节点群组总数统计模块,用于统计k个元素的集合{G1,G2,G3……Gk}可划分的所有不同商品节点群组的总数量Q;
商品节点群组关联度计算装置,用于计算所有商品节点群组中,每个商品节点群组的关联度;
最大关联度商品节点群组获取模块,用于获取所有商品节点群组中,关联度最大的商品节点群组。
10.如权利要求9所述的基于商品社区分类的关联值传播系统,其特征在于,所述基于商品社区分类的关联值传播系统还包括:
社区关联中心节点获取模块,用于获取所述关联度最大的商品节点群组中,每个社区中关联度最大的触发商品节点,也称社区的关联中心节点;
商品推荐模块,用于推荐所述关联度最大的商品节点群组中,每个社区的关联中心节点所对应的商品。
11.如权利要求9所述的基于商品社区分类的关联值传播系统,其特征在于,所述基于商品社区分类的关联值传播系统还包括:
商品节点连接关系网络构建模块,与触发与被触发商品节点数据表创建模块相连,用于根据所述触发与被触发商品节点数据表,构建商品节点连接关系网络;
具体为:以商品为节点,商品之间的连接关系为边,商品之间有向同时购买的频次为边权值,构建商品连接关系网络;若商品节点Gi和Gj之间存在有向同时购买触发关系则商品节点Gi和Gj之间添加一条连接边;商品节点Gi和Gj之间还可存在间接连接关系,通过包含至少1个中间节点和至少2条连接边形成的路径相连,所述路径的数量至少一条。
12.如权利要求10所述的基于商品社区分类的关联值传播系统,其特征在于,所述商品节点群组关联度度计算装置包括:
社区关联节点组选择模块,用于根据商品节点群组的各社区包含的商品节点,在商品节点数据表中选出各社区包含的触发商品节点与被触发商品节点组,也称关联节点组;所述触发商品节点与被触发商品节点同时属于同一社区;每个关联节点组包括两个商品节点;
关联节点组关联度计算模块,用于计算所述商品节点群组的各社区内包含的每组关联节点组(Gi,Gj)的关联度;
社区关联度计算模块,用于计算所述各社区的关联度R(i);
所述社区的关联度为社区内包含的各组关联节点组的关联度之和;
群组关联度计算模块,用于计算各商品节点群组的关联度;
各商品节点群组的关联度为各商品节点群组中包含的所有社区的关联度之和。
13.如权利要求12所述的基于商品社区分类的关联值传播系统,其特征在于,所述关联节点组关联度计算模块包括
支持度、置信度、提升度计算模块,用于计算关联规则(Gi=>Gj)对应的支持度、置信度、提升度;
支持度:项集中Gi,Gj同时发生的概率,即同时发生Gi,Gj在总项集I中发生的概率。
Support(Gi=>Gj)=P(Gi∩Gj)/P(I)=num(Gi∩Gj)/num(I);
其中,Support(Gi=>Gj)表示关联规则(Gi=>Gj)的支持度;关联规则(Gi=>Gj)表示购买商品节点Gi触发购买商品节点Gj;P(Gi∩Gj)表示Gi,Gj同时在总项集里出现的概率;Gi,Gj表示项集中的项;I表示总项集;num()表示求总项集里特定项集出现的次数;num(Gi∩Gj)表示含有Gi和Gj的项集的个数(即次数);num(I)表示总项集的个数;i,j表示集合{G1,G2,…Gk}中商品节点的序号,1≤i≤k;1≤j≤k;项集即项的集合,包含K个项的项集称为K项集;
置信度:项集中Gi发生的情况下,Gj发生的概率。表示在发生Gi的项集中,同时会发生Gj的可能性,即Gi和Gj同时发生的个数占仅仅Gi发生个数的比例,公式为:
Confidence(Gi=>Gj)=P(Gj|Gi)=P(Gi∩Gj)/P(Gi)
其中,Confidence(Gi=>Gj)表示关联规则(Gi=>Gj)的置信度;P(Gj|Gi)表示在发生Gi的项集中,同时会发生Gj的概率;P(Gi∩Gj)表示Gi,Gj同时在总项集里出现的概率,P(Gi)表示Gi在总项集里出现的概率;
提升度:表示含有Gi的条件下同时含有Gj的概率,与Gj总体发生的概率之比;
Lift(Gi→Gj)=P(Gj|Gi)/P(Gj)
其中,Lift(Gi=>Gj)表示关联规则(Gi=>Gj)的提升度;P(Gj)表示项集{Gj} 在总项集里出现的概率;
归一化处理模块,用于对关联规则(Gi=>Gj)的支持度,置信度,提升度进行归一化处理;
归一化处理公式为:
Figure FDA0002678330940000061
其中,fn分别表示归一化处理后的关联规则(Gi=>Gj)的支持度,置信度,提升度值,分别为f1,f2,f3;f分别表示归一化处理前的关联规则(Gi=>Gj)的支持度,置信度,提升度原始值;
关联值计算模块,用于计算关联规则(Gi=>Gj)的关联值,即为关联节点组(Gi,Gj)的关联值;
r=w1f1+w2f2+w3f3
其中,r表示关联值;w1、w2、w3分别为支持度,置信度,提升度的权重。
14.如权利要求13所述的基于商品社区分类的关联值传播系统,其特征在于,社区关联中心节点获取模块结构图,包括
社区触发商品节点统计模块,用于统计关联度最大的商品节点群组中,每个社区中的触发商品节点;
社区触发商品节点关联度计算模块,用于计算关联度最大的商品节点群组中,每个社区中的触发商品节点的关联度;
所述关联度最大的商品节点群组中,其中一社区的触发商品节点Gi的关联度为该社区中所有关联节点组中,触发商品节点为Gi的所有关联节点组的关联度之和;
社区关联中心节点获取模块,用于获取所述社区中的关联度最大的触发商品节点,即为社区的关联中心节点。
15.一种设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述基于商品社区分类的关联值传播方法的步骤。
CN202010955111.3A 2020-09-11 2020-09-11 一种基于商品社区分类的关联值传播方法、系统及设备 Active CN112053210B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010955111.3A CN112053210B (zh) 2020-09-11 2020-09-11 一种基于商品社区分类的关联值传播方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010955111.3A CN112053210B (zh) 2020-09-11 2020-09-11 一种基于商品社区分类的关联值传播方法、系统及设备

Publications (2)

Publication Number Publication Date
CN112053210A true CN112053210A (zh) 2020-12-08
CN112053210B CN112053210B (zh) 2023-12-05

Family

ID=73611697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010955111.3A Active CN112053210B (zh) 2020-09-11 2020-09-11 一种基于商品社区分类的关联值传播方法、系统及设备

Country Status (1)

Country Link
CN (1) CN112053210B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117891857A (zh) * 2024-03-13 2024-04-16 广东工业大学 基于大数据的数据挖掘方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009289073A (ja) * 2008-05-29 2009-12-10 Nec Corp ユーザが要求するデータ項目間相関値の算出及び提供システムと方法
CN102737057A (zh) * 2011-04-14 2012-10-17 阿里巴巴集团控股有限公司 一种商品类目信息的确定方法及装置
CN103544632A (zh) * 2013-07-22 2014-01-29 杭州师范大学 一种网络商品个性化推荐方法及系统
CN105159918A (zh) * 2015-07-23 2015-12-16 常州大学 一种基于信任关联度的微博网络社区发现方法
CN105427125A (zh) * 2015-10-29 2016-03-23 电子科技大学 基于商品网络连接图的商品簇划分方法
CN110197390A (zh) * 2019-04-09 2019-09-03 深圳市梦网百科信息技术有限公司 一种基于关联规则关联度和经济值的推荐方法和系统
CN110288484A (zh) * 2019-04-02 2019-09-27 上海瀚之友信息技术服务有限公司 一种基于大数据平台的保险分类的用户推荐方法及系统
CN111046188A (zh) * 2019-11-15 2020-04-21 北京三快在线科技有限公司 用户偏好度确定方法、装置、电子设备及可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009289073A (ja) * 2008-05-29 2009-12-10 Nec Corp ユーザが要求するデータ項目間相関値の算出及び提供システムと方法
CN102737057A (zh) * 2011-04-14 2012-10-17 阿里巴巴集团控股有限公司 一种商品类目信息的确定方法及装置
CN103544632A (zh) * 2013-07-22 2014-01-29 杭州师范大学 一种网络商品个性化推荐方法及系统
CN105159918A (zh) * 2015-07-23 2015-12-16 常州大学 一种基于信任关联度的微博网络社区发现方法
CN105427125A (zh) * 2015-10-29 2016-03-23 电子科技大学 基于商品网络连接图的商品簇划分方法
CN110288484A (zh) * 2019-04-02 2019-09-27 上海瀚之友信息技术服务有限公司 一种基于大数据平台的保险分类的用户推荐方法及系统
CN110197390A (zh) * 2019-04-09 2019-09-03 深圳市梦网百科信息技术有限公司 一种基于关联规则关联度和经济值的推荐方法和系统
CN111046188A (zh) * 2019-11-15 2020-04-21 北京三快在线科技有限公司 用户偏好度确定方法、装置、电子设备及可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117891857A (zh) * 2024-03-13 2024-04-16 广东工业大学 基于大数据的数据挖掘方法及系统
CN117891857B (zh) * 2024-03-13 2024-05-24 广东工业大学 基于大数据的数据挖掘方法及系统

Also Published As

Publication number Publication date
CN112053210B (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
CN106708844A (zh) 一种用户群体的划分方法和装置
CN103092861B (zh) 一种商品代表图的选取方法和系统
CN110555172B (zh) 用户关系挖掘方法及装置、电子设备和存储介质
US11334758B2 (en) Method and apparatus of data processing using multiple types of non-linear combination processing
CN111126442B (zh) 一种物品关键属性生成方法、物品分类方法和装置
Wu et al. Mining association rules for low-frequency itemsets
CN114155067B (zh) 一种用户画像的建立方法及系统
CN112053210A (zh) 一种基于商品社区分类的关联值传播方法、系统及设备
CN111797319A (zh) 推荐方法、装置、设备及存储介质
CN108537569B (zh) 在线社交网络中人际关系感知的广告推送方法
CN110929172A (zh) 信息选择方法、装置、电子设备及可读存储介质
CN112200644B (zh) 欺诈用户识别方法、装置、计算机设备以及存储介质
US7890494B2 (en) System and/or method for processing events
CN112560105A (zh) 保护多方数据隐私的联合建模方法及装置
CN112788351B (zh) 一种目标直播间的识别方法、装置、设备和存储介质
CN112052403A (zh) 一种基于商品社区分类的链接度传播方法、系统及设备
CN111666481B (zh) 数据挖掘方法、装置、计算机可读介质及电子设备
CN104967643A (zh) 一种获取转移数据的方法及装置
CN104506895B (zh) 视频归类方法
CN115222483A (zh) 金融产品推荐方法、装置、电子设备及存储介质
CN110992153B (zh) 基于用户属性和商品类型的商品推荐方法、系统及设备
CN113657525B (zh) 基于KMeans的跨特征联邦聚类方法及相关设备
CN116228384A (zh) 一种数据处理方法、装置、电子设备及计算机可读介质
CN111026816B (zh) 基于知识图谱的高净值客户群识别方法、装置及存储介质
Tang et al. Hypergraph structure inference from data under smoothness prior

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant