CN113763014A - 物品共现关系确定方法和装置及判定模型获得方法和装置 - Google Patents
物品共现关系确定方法和装置及判定模型获得方法和装置 Download PDFInfo
- Publication number
- CN113763014A CN113763014A CN202110009669.7A CN202110009669A CN113763014A CN 113763014 A CN113763014 A CN 113763014A CN 202110009669 A CN202110009669 A CN 202110009669A CN 113763014 A CN113763014 A CN 113763014A
- Authority
- CN
- China
- Prior art keywords
- article
- occurrence
- item
- node
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 239000013598 vector Substances 0.000 claims abstract description 59
- 238000013528 artificial neural network Methods 0.000 claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 14
- 230000015654 memory Effects 0.000 claims description 23
- 238000005295 random walk Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 7
- 238000004883 computer application Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 26
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0224—Discounts or incentives, e.g. coupons or rebates based on user history
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提出一种物品共现关系确定方法和装置及判定模型获得方法和装置,涉及计算机应用领域。物品共现关系确定方法包括:获取待确定共现关系的第一物品对;获取第一物品对中每个物品的特征信息,包括基于每个物品所在的物品共现图确定的该物品的图嵌入向量,每个物品共现图基于具有共现关系的多个物品构建;将第一物品对中每个物品的特征信息输入物品共现关系判定模型进行处理,物品共现关系判定模型是利用物品共现历史数据训练深度神经网络得到的;获取物品共现关系判定模型输出的第一物品对是否具有共现关系的判定结果。利用物品共现关系判定模型,既能判定历史已知的物品共现关系,也能判定未知的物品共现关系,并且判定结果更加客观。
Description
技术领域
本公开涉及计算机应用领域,特别涉及一种物品共现关系确定方法和装置及判定模型获得方法和装置。
背景技术
在电子商务中,发现物品的共现关系,将具有共现关系的物品推荐给用户,可以帮助用户高效地选择物品。
在一些相关技术中,统计历史数据中物品对共现的次数,根据统计结果发现共现物品对。例如,统计订单历史数据中物品对被同时购买的次数,次数大于预设值的物品对作为同购物品对。
上述相关技术能够发现历史已知的物品共现关系,不能发掘未知的物品共现关系。
发明内容
本公开实施例的物品共现关系判定模型是利用物品共现历史数据训练深度神经网络得到的,既能判定历史已知的物品共现关系,也能判定未知的物品共现关系。
本公开一些实施例提出一种物品共现关系确定方法,包括:
获取待确定共现关系的第一物品对;
获取第一物品对中每个物品的特征信息,其中,每个物品的特征信息包括基于所述每个物品所在的物品共现图确定的所述每个物品的图嵌入向量,每个物品共现图基于具有共现关系的多个物品构建;
将第一物品对中每个物品的特征信息输入物品共现关系判定模型进行处理,其中,物品共现关系判定模型是利用物品共现历史数据训练深度神经网络得到的;
获取物品共现关系判定模型输出的第一物品对是否具有共现关系的判定结果。
在一些实施例中,利用物品共现历史数据训练深度神经网络得到物品共现关系判定模型包括:
获取物品共现历史数据中的带有共现关系标签的多个第二物品对;
获取每个第二物品对中每个物品的特征信息,其中,每个物品的特征信息包括基于所述每个物品所在的物品共现图确定的所述每个物品的图嵌入向量,每个物品共现图基于具有共现关系的多个物品构建;
将每个第二物品对中每个物品的特征信息输入深度神经网络进行预测;
根据深度神经网络输出的每个第二物品对是否具有共现关系的预测结果与相应的共现关系标签之间的差距信息,迭代地更新深度神经网络的参数,直至满足预设的训练终止条件,将训练后的深度神经网络作为物品共现关系判定模型。
在一些实施例中,构建物品共现图所基于的具有共现关系的多个物品包括:
在同一订单中出现的多个物品;以及
在同一用户的预设时间段内的不同订单中出现的多个物品。
在一些实施例中,根据设置的滑动窗口,将滑动窗口内的同一用户的预设时间段内的各个订单中的多个物品确定为具有共现关系的多个物品。
在一些实施例中,不同物品共现图中的属于同一个标准化产品单位的物品连接起来;或者,不同物品共现图中的库存量单位标题的相似度大于预设值的物品连接起来。
在一些实施例中,未出现在物品共现图中的冷启动物品的图嵌入向量根据与冷启动物品的相似度大于预设值的相似物品的图嵌入向量或者与冷启动物品属于同一标准化产品单位的物品的图嵌入向量中的至少一项确定。
在一些实施例中,基于所述每个物品所在的物品共现图确定所述每个物品的图嵌入向量包括:
针对所述每个物品所在的物品共现图中的任意边连接的第一物品节点和第二物品节点,根据第二物品节点的度确定权重调节因子,使得度越大,权重调节因子越小,利用权重调节因子对第一物品节点与第二物品节点之间的边的权重进行调节;
根据调节后的边的权重,从所述每个物品所在的物品共现图中的任意的第三物品节点开始随机游走,并根据随机游走得到的物品节点序列确定第三物品节点的图嵌入向量。
在一些实施例中,根据第二物品节点的度确定权重调节因子包括:
利用权重调节因子对第一物品节点与第二物品节点之间的边的权重进行调节包括:
在一些实施例中,根据随机游走得到的物品节点序列确定第三物品节点的图嵌入向量包括:
将从第三物品节点开始随机游走得到的物品节点序列输入到词向量模型进行处理,将词向量模型输出的向量作为第三物品节点的图嵌入向量。
在一些实施例中,物品共现历史数据包括有共现关系的第二物品对正样本和无共现关系的第二物品对负样本;
第二物品对正样本基于物品共现图中具有邻居关系的物品对获得;
第二物品对负样本从所有物品中随机采样获得。
本公开一些实施例提出一种物品共现关系判定模型获得方法,包括:
获取物品共现历史数据中的带有共现关系标签的多个第二物品对;
获取每个第二物品对中每个物品的特征信息,其中,每个物品的特征信息包括基于所述每个物品所在的物品共现图确定的所述每个物品的图嵌入向量,每个物品共现图基于具有共现关系的多个物品构建;
将每个第二物品对中每个物品的特征信息输入深度神经网络进行预测;
根据深度神经网络输出的每个第二物品对是否具有共现关系的预测结果与相应的共现关系标签之间的差距信息,迭代地更新深度神经网络的参数,直至满足预设的训练终止条件,将训练后的深度神经网络作为物品共现关系判定模型。
本公开一些实施例提出一种物品共现关系确定装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行物品共现关系确定方法。
本公开一些实施例提出一种物品共现关系判定模型获得装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行物品共现关系判定模型获得方法。
本公开一些实施例提出一种非瞬时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现物品共现关系确定方法或物品共现关系判定模型获得方法。
附图说明
下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍。根据下面参照附图的详细描述,可以更加清楚地理解本公开。
显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开一些实施例的物品共现图构建方法的流程示意图。
图2示出本公开一些实施例的基于物品共现图的随机游走方法的流程示意图。
图3示出本公开一些实施例的权重调节因子与节点的度的关系曲线示意图。
图4示出本公开一些实施例的物品共现关系判定模型获得方法的流程示意图。
图5示出本公开一些实施例的物品共现关系确定方法的流程示意图。
图6示出本公开一些实施例的物品共现关系确定装置的示意图。
图7示出本公开一些实施例的物品共现关系确定装置的示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。
除非特别说明,否则,本公开中的“第一”“第二”等描述用来区分不同的对象,并不用来表示大小或时序等含义。
物品共现关系是指在一定的业务场景中,不同物品经常共同出现,这些物品称为具有共现关系的物品对。例如,在电子商务购物业务中,不同物品经常被同时购买,这些物品称为同购物品,此时共现关系表示为同购关系。本公开的共现关系并不限于所举示例。
图1示出本公开一些实施例的物品共现图构建方法的流程示意图。
如图1所示,该实施例的物品共现图构建方法包括:步骤110-120,根据业务需要,还可以包括步骤130-140。
在步骤110,根据历史数据,获取具有共现关系的多个物品。
在一些实施例中,具有共现关系的多个物品例如包括:在同一订单中出现的多个物品,还可以包括:在同一用户的预设时间段内的不同订单中出现的多个物品。从而,扩展物品共现关系数据,解决数据稀疏问题。
在一些实施例中,根据设置的滑动窗口,将滑动窗口内的同一用户的预设时间段内的各个订单中的多个物品确定为具有共现关系的多个物品。从而,基于滑动窗口选取物品共现关系数据,避免造成数据组合过多,防止出现数据量爆炸现象,减轻数据处理负荷。
例如,预设时间段假设为24小时,滑动窗口假设为2,假设某个用户在24小时内下了6个订单。在不设置滑动窗口的情况下,6个订单中的所有物品均可以作为具有共现关系的物品。在设置滑动窗口的情况下,可以将第1个订单和第2个订单中的所有物品作为具有共现关系的物品,将第3个订单和第4个订单中的所有物品作为具有共现关系的物品,将第5个订单和第6个订单中的所有物品作为具有共现关系的物品。
在步骤120,基于具有共现关系的多个物品,构建物品共现图。
在一个物品共现图中,以物品为节点,具有共现关系的两个物品之间存在连接两个物品节点的边,边的权重例如为该边所连接的两个物品共现的频次。节点的度为与该节点连接的其他节点的数量。
在实际运用中,物品共现图往往有多个,如果物品共现图数量过多的话,由于不同的物品共现图彼此之间是孤立的,所以物品共现图对于物品特征的表示效果不佳。为了改善该问题,还可以执行步骤130或140中的至少一个步骤,或者,在步骤130不具备执行条件时,再执行步骤140。
在步骤130,不同物品共现图中的属于同一个标准化产品单位(Standard ProductUnit,SPU)的物品连接起来。从而,将不同的物品共现图连通起来,形成更大的一个物品共现图。
例如,m个物品共现图{g1,g2,g3…,gm},不同物品共现图中的物品{sku1,sku2,sku3…,skuk}如果属于同一个SPU,把这k个物品两两组合连接起来,每个组合增加一条边,边的权重例如设置为1。
在步骤140,不同物品共现图中的库存量单位(Stock keeping unit,SKU)标题(即,物品标题)的相似度大于预设值的物品连接起来。从而,将不同的物品共现图连通起来,形成更大的一个物品共现图。
针对物品共现图{g1}中的任一个SKU标题1,从其他物品共现图(如{g2,g3…,gm}等)中,查找与SKU标题1相似度大于预设值的SKU标题x,可以限定符合条件的SKU标题x的数量,例如,选择相似度最大的两个SKU标题x,将SKU标题1与SKU标题x组合连接起来,每个组合增加一条边,边的权重例如设置为1。
从而,通过步骤110-120,构建物品共现图;通过步骤130或140中的至少一个步骤,提高不同的物品共现图的连通性,提高物品共现图对物品特征的表示效果。
图2示出本公开一些实施例的基于物品共现图的随机游走方法的流程示意图。
如图2所示,该实施例的随机游走方法包括:步骤210-230。
在步骤210,针对物品共现图中的任意边连接的第一物品节点和第二物品节点,根据第二物品节点的度确定权重调节因子,使得度越大,权重调节因子越小,度越小,权重调节因子越大。
在一些实施例中,根据第二物品节点的度确定权重调节因子包括:利用确定权重调节因子,其中,表示根据第二物品节点q的度dq确定的权重调节因子。图3示出了以dq为横坐标,以为纵坐标的曲线示意图。如图3,的范围是[1,2],在dq>2000时,
在步骤220,利用权重调节因子对第一物品节点与第二物品节点之间的边的权重进行调节。
在步骤230,根据调节后的边的权重,从物品共现图中指定的任意的第三物品节点开始随机游走,游走到的各个物品节点组成游走序列。
随机游走方法例如可以采用node2vec方法,node2vec采用Alias随机采样方法,时间复杂度为O(1),游走时偏向于权重较大的节点。例如,从p节点游走到q邻居节点的概率为:i表示p节点的各个邻居节点,邻居节点总数是N。
通过控制node2vec的参数p和参数q可以进行偏向深度优先游走(Depth-firstSampling,DFS)或广度优先游走(Breadth-first Sampling,BFS)的游走策略的控制。参数p控制重复访问刚刚访问过的节点的概率,若p较高,则访问刚刚访问过的节点的概率会变低。参数q控制着游走方向是向外还是向内,若大于1,随机游走倾向于访问和当前节点接近的节点(偏向BFS),若小于1,随机游走倾向于访问远离当前节点的节点(偏向DFS)。根据实验统计数据,广度优先游走会有更好效果;偏向于深度优先游走时,参数p固定为0.25时,q为4(相对于q为1或0.25)的情况效果较好,原因在于往回游走会带来节点附近的信息召回的效果更佳。
在边的权重调节之前,权重大的节点可能是百搭商品(或者说爆品),比如度比较高的商品,手机充值类商品、抽纸类商品、坚果炒货类商品等。在边的权重调节之后,度比较高的物品节点基于较小的权重调节因子使得其权重相对于其他度比较低的节点被调小,因此,被游走到的概率降低。
使用改进后的随机游走方法,抽样1000个游走序列,游走序列长度为40,百搭物品由之前的平均每个序列8.73个减少到3.42个,序列结果更符合共现目标。
从而,基于节点的度改进随机游走策略,降低节点度比较大的百搭物品被游走到的概率,提高通过游走所发现的共现物品的有效性,避免通过游走所发现的共现物品都是一些参见价值比较小的百搭物品。
基于物品共现图游走得到的游走序列有两个用途。用途一:游走序列中的相邻节点对是物品共现图中具有邻居关系和共现关系的物品对,因此,通过提取游走序列中的相邻节点对获得有共现关系的物品对,其可以作为训练数据的正样本。用途二:将从任意的某第三物品节点开始随机游走得到的物品节点序列(即游走序列)输入到词向量模型进行处理,将词向量模型输出的向量作为第三物品节点的图嵌入向量,从而得到第三物品节点的图嵌入(graph embedding)向量表示。词向量模型例如为word2vec,但不限于所举示例。
利用各个物品的图嵌入向量,可以判定物品共现关系。例如,根据任意两个物品的图嵌入向量之间的相似度(如cosine相似度),如果相似度大于设置的阈值,可以判定该两个物品具有共现关系,否则,可以判定该两个物品不具有共现关系。此外,相似度大于设置的阈值时,还可以辅助一些筛选策略,如共现次数应大于一定值等,若满足筛选策略,再判定该两个物品具有共现关系。相似度阈值的设置和筛选策略的设置都会影响物品共现关系的判定结果。为了使物品共现关系的判定结果更加客观,本公开还提出利用各个物品的图嵌入向量训练神经网络得到有监督的物品共现关系判定模型,并利用物品共现关系判定模型判定物品共现关系的方案,下面具体描述。
图4示出本公开一些实施例的物品共现关系判定模型获得方法的流程示意图。该方法利用物品共现历史数据训练深度神经网络(Deep Neural Networks,简称DNN)得到物品共现关系判定模型。
如图4所示,该实施例的方法包括:步骤410-440。
在步骤410,获取物品共现历史数据中的带有共现关系标签的多个第二物品对。
物品共现历史数据作为物品共现训练数据使用,其可以包括有共现关系的第二物品对正样本和无共现关系的第二物品对负样本。
第二物品对负样本例如从所有物品中随机采样获得,也即,从所有物品中随机地抽取一些物品对,这些物品对很大概率无共现关系。
第二物品对正样本例如基于物品共现图中具有邻居关系的物品对获得,也即,物品共现图中具有邻居关系的物品对可以作为第二物品对正样本。物品共现图中具有邻居关系的物品对例如可以通过前述的随机游走的方式来获得。
在步骤420,获取每个第二物品对中每个物品的特征信息。
每个物品的特征信息包括基于每个物品所在的物品共现图确定的每个物品的图嵌入向量,还可以包括物品的标题、类目、品牌等物品属性描述信息,但不限于所举示例。
如前所述,基于每个物品所在的物品共现图确定每个物品的图嵌入向量包括:针对每个物品所在的物品共现图中的任意边连接的第一物品节点和第二物品节点,根据第二物品节点的度确定权重调节因子,使得度越大,权重调节因子越小,度越小,权重调节因子越大;利用权重调节因子对第一物品节点与第二物品节点之间的边的权重进行调节;根据调节后的边的权重,从每个物品所在的物品共现图中的任意的第三物品节点开始随机游走,并根据随机游走得到的物品节点序列确定第三物品节点的图嵌入向量,例如,将从第三物品节点开始随机游走得到的物品节点序列输入到词向量模型进行处理,将词向量模型输出的向量作为第三物品节点的图嵌入向量。相关实现细节参考前述,这里不再赘述。
从而,基于节点的度改进随机游走策略,降低节点度比较大的百搭物品被游走到的概率,提高通过游走所发现的共现物品的有效性,避免通过游走所发现的共现物品都是一些参见价值比较小的百搭物品,进而提高图嵌入向量对物品特征的表示效果。
在步骤430,将每个第二物品对中每个物品的特征信息输入深度神经网络进行预测,输出每个第二物品对是否具有共现关系的预测结果。
在步骤440,根据深度神经网络输出的每个第二物品对是否具有共现关系的预测结果与相应的共现关系标签之间的差距信息,迭代地更新深度神经网络的参数,直至满足预设的训练终止条件,将训练后的深度神经网络作为物品共现关系判定模型。
深度神经网络例如包括嵌入层、多层感知器层、激活层等,具体可以参考相关技术。更新的深度神经网络的参数是深度神经网络需要通过训练优化的参数,例如,多层感知器层中的权重等参数,具体可以参考相关技术。
训练终止条件例如为达到预设的迭代次数,或者,预测结果与共现关系标签之间的差距信息小于预设值等。
从而,利用物品共现历史数据训练深度神经网络得到物品共现关系判定模型,该物品共现关系判定模型既能用来判定历史已知的物品共现关系,也能用来判定未知的物品共现关系,并且判定结果更加客观。
图5示出本公开一些实施例的物品共现关系确定方法的流程示意图。该方法利用物品共现关系判定模型判定物品共现关系。
如图5所示,该实施例的方法包括:步骤510-540。
在步骤510,获取待确定共现关系的第一物品对。
在步骤520,获取第一物品对中每个物品的特征信息。
每个物品的特征信息包括基于每个物品所在的物品共现图确定的每个物品的图嵌入向量(具体方法参考前述),还可以包括物品的标题、类目、品牌等物品属性描述信息,但不限于所举示例。
此外,如果第一物品对中包括未出现在任何物品共现图中的冷启动物品,例如新物品,冷启动物品的图嵌入向量根据与冷启动物品的相似度大于预设值的相似物品的图嵌入向量或者与冷启动物品属于同一标准化产品单位的物品的图嵌入向量中的至少一项确定。例如,将前述各个相关物品的图嵌入向量的平均值或加权平均值作为冷启动物品的图嵌入向量,权值可根据相关程度确定,例如,冷启动物品的相似物品的权值大于同一SPU的物品的权值。从而,解决冷启动物品的向量表示问题。
假设skux是冷启动物品,skuG为有图嵌入向量的商品集合。从skuG中召回skux的M(如TOP10)个相似物品的图嵌入向量{Vskuy1,Vskuy2,…,Vskuy10},这些物品的相似度均大于为相似度置信值;根据需要,还可以召回skux所属SPU下的N个其他物品的图嵌入向量{Vspu1,Vspu2,…,Vskun};则冷启动物品的图嵌入向量例如为:
在步骤530,将第一物品对中每个物品的特征信息输入物品共现关系判定模型进行处理。
其中,物品共现关系判定模型是利用物品共现历史数据训练深度神经网络得到的,具体参见前述。
在步骤540,获取物品共现关系判定模型输出的第一物品对是否具有共现关系的判定结果。
利用有监督的“物品共现关系判定模型”判定物品对是否具有共现关系,既能判定历史已知的物品共现关系,也能判定未知的物品共现关系,并且判定结果更加客观。
在一些应用例中,给定种子物品池,通过物品共现关系判定模型,从预设的物品集合中,召回与每个种子物品具有共现关系的目标共现物品(如目标同购物品)。如果待预测的物品对数据量极大,可以采用如局部敏感哈希(Locality Sensitive Hashing,LSH)等近邻相似算法过滤大部分物品对,大幅降低待处理的数量级。
物品共现关系判定模型是一种能够判定物品共现关系的通用模型。根据不同的应用场景,可以输入不同的待预测的种子物品池和待召回的物品集合。这些应用场景包括但不限于物品组合营销、跨品类营销、物品选择等场景。
例如,针对跨品类营销,输入品类不同的种子物品池(如品类1中的物品)和物品集合(如品类2中的物品),以发掘不同品类的共现物品对。又例如,针对物品组合营销,输入待组合的种子物品池和待召回的物品集合,以发掘能够与种子物品组合销售的共现物品。又例如,在为用户推荐凑单物品时,输入用户已经选中的物品作为种子物品,从待召回的物品集合(可以设置,例如,设置为用户经常购买或浏览过的品类的物品集合)中召回与用户已经选中的物品具有共现关系的共现物品作为凑单物品推荐给用户。
图6示出本公开一些实施例的物品共现关系确定装置的示意图。
如图6所示,该实施例的物品共现关系确定装置600包括:存储器610;以及耦接至存储器的处理器620,处理器620被配置为基于存储在存储器中的指令,执行任一些实施例的物品共现关系确定方法。
物品共现关系确定方法例如包括:获取待确定共现关系的第一物品对;获取第一物品对中每个物品的特征信息,其中,每个物品的特征信息包括基于每个物品所在的物品共现图确定的每个物品的图嵌入向量,每个物品共现图基于具有共现关系的多个物品构建;将第一物品对中每个物品的特征信息输入物品共现关系判定模型进行处理,其中,物品共现关系判定模型是利用物品共现历史数据训练深度神经网络得到的;获取物品共现关系判定模型输出的第一物品对是否具有共现关系的判定结果。
图7示出本公开一些实施例的物品共现关系确定装置的示意图。
如图7所示,该实施例的物品共现关系确定装置700包括:存储器710;以及耦接至存储器的处理器720,处理器720被配置为基于存储在存储器中的指令,执行任一些实施例的物品共现关系判定模型获得方法。
物品共现关系判定模型获得方法例如包括:获取物品共现历史数据中的带有共现关系标签的多个第二物品对;获取每个第二物品对中每个物品的特征信息,其中,每个物品的特征信息包括基于每个物品所在的物品共现图确定的每个物品的图嵌入向量,每个物品共现图基于具有共现关系的多个物品构建;将每个第二物品对中每个物品的特征信息输入深度神经网络进行预测;根据深度神经网络输出的每个第二物品对是否具有共现关系的预测结果与相应的共现关系标签之间的差距信息,迭代地更新深度神经网络的参数,直至满足预设的训练终止条件,将训练后的深度神经网络作为物品共现关系判定模型。
存储器610,710例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。
物品共现关系判定模型的训练和使用可由不同的装置(如600,700)分别完成,也可以由同一装置(如600)完成。当由同一装置600完成时,处理器620还可以执行任一些实施例的物品共现关系判定模型获得方法。
本公开实施例提出一种非瞬时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一些实施例的物品共现关系确定方法或者任一些实施例的物品共现关系判定模型获得方法。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机程序代码的非瞬时性计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本公开的较佳实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (18)
1.一种物品共现关系确定方法,其特征在于,包括:
获取待确定共现关系的第一物品对;
获取第一物品对中每个物品的特征信息,其中,每个物品的特征信息包括基于所述每个物品所在的物品共现图确定的所述每个物品的图嵌入向量,每个物品共现图基于具有共现关系的多个物品构建;
将第一物品对中每个物品的特征信息输入物品共现关系判定模型进行处理,其中,物品共现关系判定模型是利用物品共现历史数据训练深度神经网络得到的;
获取物品共现关系判定模型输出的第一物品对是否具有共现关系的判定结果。
2.根据权利要求1所述的方法,其特征在于,利用物品共现历史数据训练深度神经网络得到物品共现关系判定模型包括:
获取物品共现历史数据中的带有共现关系标签的多个第二物品对;
获取每个第二物品对中每个物品的特征信息,其中,每个物品的特征信息包括基于所述每个物品所在的物品共现图确定的所述每个物品的图嵌入向量,每个物品共现图基于具有共现关系的多个物品构建;
将每个第二物品对中每个物品的特征信息输入深度神经网络进行预测;
根据深度神经网络输出的每个第二物品对是否具有共现关系的预测结果与相应的共现关系标签之间的差距信息,迭代地更新深度神经网络的参数,直至满足预设的训练终止条件,将训练后的深度神经网络作为物品共现关系判定模型。
3.根据权利要求1或2所述的方法,其特征在于,构建物品共现图所基于的具有共现关系的多个物品包括:
在同一订单中出现的多个物品;以及
在同一用户的预设时间段内的不同订单中出现的多个物品。
4.根据权利要求3所述的方法,其特征在于,
根据设置的滑动窗口,将滑动窗口内的同一用户的预设时间段内的各个订单中的多个物品确定为具有共现关系的多个物品。
5.根据权利要求1或2所述的方法,其特征在于,
不同物品共现图中的属于同一个标准化产品单位的物品连接起来;或者,
不同物品共现图中的库存量单位标题的相似度大于预设值的物品连接起来。
6.根据权利要求1或2所述的方法,其特征在于,
未出现在物品共现图中的冷启动物品的图嵌入向量根据与冷启动物品的相似度大于预设值的相似物品的图嵌入向量或者与冷启动物品属于同一标准化产品单位的物品的图嵌入向量中的至少一项确定。
7.根据权利要求1或2所述的方法,其特征在于,基于所述每个物品所在的物品共现图确定所述每个物品的图嵌入向量包括:
针对所述每个物品所在的物品共现图中的任意边连接的第一物品节点和第二物品节点,根据第二物品节点的度确定权重调节因子,使得度越大,权重调节因子越小,利用权重调节因子对第一物品节点与第二物品节点之间的边的权重进行调节;
根据调节后的边的权重,从所述每个物品所在的物品共现图中的任意的第三物品节点开始随机游走,并根据随机游走得到的物品节点序列确定第三物品节点的图嵌入向量。
9.根据权利要求7所述的方法,其特征在于,根据随机游走得到的物品节点序列确定第三物品节点的图嵌入向量包括:
将从第三物品节点开始随机游走得到的物品节点序列输入到词向量模型进行处理,将词向量模型输出的向量作为第三物品节点的图嵌入向量。
10.根据权利要求2所述的方法,其特征在于,
物品共现历史数据包括有共现关系的第二物品对正样本和无共现关系的第二物品对负样本;
第二物品对正样本基于物品共现图中具有邻居关系的物品对获得;
第二物品对负样本从所有物品中随机采样获得。
11.一种物品共现关系判定模型获得方法,其特征在于,包括:
获取物品共现历史数据中的带有共现关系标签的多个第二物品对;
获取每个第二物品对中每个物品的特征信息,其中,每个物品的特征信息包括基于所述每个物品所在的物品共现图确定的所述每个物品的图嵌入向量,每个物品共现图基于具有共现关系的多个物品构建;
将每个第二物品对中每个物品的特征信息输入深度神经网络进行预测;
根据深度神经网络输出的每个第二物品对是否具有共现关系的预测结果与相应的共现关系标签之间的差距信息,迭代地更新深度神经网络的参数,直至满足预设的训练终止条件,将训练后的深度神经网络作为物品共现关系判定模型。
12.根据权利要求11所述的方法,其特征在于,
构建物品共现图所基于的具有共现关系的多个物品包括:
在同一订单中出现的多个物品;以及
在同一用户的预设时间段内的不同订单中出现的多个物品。
13.根据权利要求11所述的方法,其特征在于,
不同物品共现图中的属于同一个标准化产品单位的物品连接起来;或者,
不同物品共现图中的库存量单位标题的相似度大于预设值的物品连接起来。
14.根据权利要求11所述的方法,其特征在于,基于所述每个物品所在的物品共现图确定所述每个物品的图嵌入向量包括:
针对所述每个物品所在的物品共现图中的任意边连接的第一物品节点和第二物品节点,根据第二物品节点的度确定权重调节因子,使得度越大,权重调节因子越小,利用权重调节因子对第一物品节点与第二物品节点之间的边的权重进行调节;
根据调节后的边的权重,从所述每个物品所在的物品共现图中的任意的第三物品节点开始随机游走,并根据随机游走得到的物品节点序列确定第三物品节点的图嵌入向量。
15.根据权利要求11所述的方法,其特征在于,物品共现历史数据包括有共现关系的第二物品对正样本和无共现关系的第二物品对负样本;
第二物品对正样本基于物品共现图中具有邻居关系的物品对获得;
第二物品对负样本从所有物品中随机采样获得。
16.一种物品共现关系确定装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行权利要求1-10中任一项所述的物品共现关系确定方法。
17.一种物品共现关系判定模型获得装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行权利要求11-15中任一项所述的物品共现关系判定模型获得方法。
18.一种非瞬时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-10中任一项所述的物品共现关系确定方法或者权利要求11-15中任一项所述的物品共现关系判定模型获得方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110009669.7A CN113763014A (zh) | 2021-01-05 | 2021-01-05 | 物品共现关系确定方法和装置及判定模型获得方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110009669.7A CN113763014A (zh) | 2021-01-05 | 2021-01-05 | 物品共现关系确定方法和装置及判定模型获得方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113763014A true CN113763014A (zh) | 2021-12-07 |
Family
ID=78786314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110009669.7A Pending CN113763014A (zh) | 2021-01-05 | 2021-01-05 | 物品共现关系确定方法和装置及判定模型获得方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113763014A (zh) |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007048008A2 (en) * | 2005-10-21 | 2007-04-26 | Fair Isaac Corporation | Method and apparatus for retail data mining using pair-wise co-occurrence consistency |
CN104598629A (zh) * | 2015-02-05 | 2015-05-06 | 北京航空航天大学 | 基于流式图模型的社交网络突发事件检测方法 |
CN105760439A (zh) * | 2016-02-02 | 2016-07-13 | 西安交通大学 | 一种基于特定行为共现网络的人物共现关系图谱构建方法 |
US20170061330A1 (en) * | 2015-08-31 | 2017-03-02 | International Business Machines Corporation | Method, system and computer program product for learning classification model |
CN107145977A (zh) * | 2017-04-28 | 2017-09-08 | 电子科技大学 | 一种对在线社交网络用户进行结构化属性推断的方法 |
CN108898459A (zh) * | 2018-06-25 | 2018-11-27 | 中国联合网络通信集团有限公司 | 一种商品推荐方法及装置 |
CN109241412A (zh) * | 2018-08-17 | 2019-01-18 | 深圳先进技术研究院 | 一种基于网络表示学习的推荐方法、系统及电子设备 |
CN110322295A (zh) * | 2019-07-09 | 2019-10-11 | 北京百度网讯科技有限公司 | 关系强度确定方法及系统、服务器、计算机可读介质 |
CN111079014A (zh) * | 2019-12-17 | 2020-04-28 | 携程计算机技术(上海)有限公司 | 基于树结构的推荐方法、系统、介质和电子设备 |
CN111241419A (zh) * | 2020-01-09 | 2020-06-05 | 辽宁工程技术大学 | 一种基于用户关系嵌入模型的下一个兴趣点推荐方法 |
CN111310475A (zh) * | 2020-02-04 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 词义消歧模型的训练方法及装置 |
CN111369306A (zh) * | 2020-06-01 | 2020-07-03 | 北京搜狐新媒体信息技术有限公司 | 产品推荐的方法和装置 |
WO2020147595A1 (zh) * | 2019-01-16 | 2020-07-23 | 阿里巴巴集团控股有限公司 | 获取实体间关系表达的方法、系统和设备、广告召回系统 |
CN111507812A (zh) * | 2020-07-02 | 2020-08-07 | 成都晓多科技有限公司 | 一种基于属性和标题的商品搭配推荐方法及装置 |
CN111523918A (zh) * | 2019-02-02 | 2020-08-11 | 北京极智嘉科技有限公司 | 商品聚类的方法、装置、设备和存储介质 |
CN111611472A (zh) * | 2020-03-31 | 2020-09-01 | 清华大学 | 一种基于图卷积神经网络的捆绑推荐方法及系统 |
KR20200114969A (ko) * | 2019-08-01 | 2020-10-07 | 주식회사 페이크럭스컴퍼니 | 거래 이력 데이터의 클러스터링에 기초한 상품 추천 장치 및 방법 |
CN111798286A (zh) * | 2020-04-26 | 2020-10-20 | 北京沃东天骏信息技术有限公司 | 物品搭配方法、物品搭配模型的构建方法和计算机 |
WO2020244202A1 (zh) * | 2019-06-05 | 2020-12-10 | 北京极智嘉科技有限公司 | 订单处理方法、装置、设备和存储介质 |
CN112131345A (zh) * | 2020-09-22 | 2020-12-25 | 腾讯科技(深圳)有限公司 | 文本质量的识别方法、装置、设备及存储介质 |
-
2021
- 2021-01-05 CN CN202110009669.7A patent/CN113763014A/zh active Pending
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007048008A2 (en) * | 2005-10-21 | 2007-04-26 | Fair Isaac Corporation | Method and apparatus for retail data mining using pair-wise co-occurrence consistency |
CN104598629A (zh) * | 2015-02-05 | 2015-05-06 | 北京航空航天大学 | 基于流式图模型的社交网络突发事件检测方法 |
US20170061330A1 (en) * | 2015-08-31 | 2017-03-02 | International Business Machines Corporation | Method, system and computer program product for learning classification model |
CN105760439A (zh) * | 2016-02-02 | 2016-07-13 | 西安交通大学 | 一种基于特定行为共现网络的人物共现关系图谱构建方法 |
CN107145977A (zh) * | 2017-04-28 | 2017-09-08 | 电子科技大学 | 一种对在线社交网络用户进行结构化属性推断的方法 |
CN108898459A (zh) * | 2018-06-25 | 2018-11-27 | 中国联合网络通信集团有限公司 | 一种商品推荐方法及装置 |
CN109241412A (zh) * | 2018-08-17 | 2019-01-18 | 深圳先进技术研究院 | 一种基于网络表示学习的推荐方法、系统及电子设备 |
WO2020147595A1 (zh) * | 2019-01-16 | 2020-07-23 | 阿里巴巴集团控股有限公司 | 获取实体间关系表达的方法、系统和设备、广告召回系统 |
CN111523918A (zh) * | 2019-02-02 | 2020-08-11 | 北京极智嘉科技有限公司 | 商品聚类的方法、装置、设备和存储介质 |
WO2020244202A1 (zh) * | 2019-06-05 | 2020-12-10 | 北京极智嘉科技有限公司 | 订单处理方法、装置、设备和存储介质 |
CN110322295A (zh) * | 2019-07-09 | 2019-10-11 | 北京百度网讯科技有限公司 | 关系强度确定方法及系统、服务器、计算机可读介质 |
KR20200114969A (ko) * | 2019-08-01 | 2020-10-07 | 주식회사 페이크럭스컴퍼니 | 거래 이력 데이터의 클러스터링에 기초한 상품 추천 장치 및 방법 |
CN111079014A (zh) * | 2019-12-17 | 2020-04-28 | 携程计算机技术(上海)有限公司 | 基于树结构的推荐方法、系统、介质和电子设备 |
CN111241419A (zh) * | 2020-01-09 | 2020-06-05 | 辽宁工程技术大学 | 一种基于用户关系嵌入模型的下一个兴趣点推荐方法 |
CN111310475A (zh) * | 2020-02-04 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 词义消歧模型的训练方法及装置 |
CN111611472A (zh) * | 2020-03-31 | 2020-09-01 | 清华大学 | 一种基于图卷积神经网络的捆绑推荐方法及系统 |
CN111798286A (zh) * | 2020-04-26 | 2020-10-20 | 北京沃东天骏信息技术有限公司 | 物品搭配方法、物品搭配模型的构建方法和计算机 |
CN111369306A (zh) * | 2020-06-01 | 2020-07-03 | 北京搜狐新媒体信息技术有限公司 | 产品推荐的方法和装置 |
CN111507812A (zh) * | 2020-07-02 | 2020-08-07 | 成都晓多科技有限公司 | 一种基于属性和标题的商品搭配推荐方法及装置 |
CN112131345A (zh) * | 2020-09-22 | 2020-12-25 | 腾讯科技(深圳)有限公司 | 文本质量的识别方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
邵英玮;张敏;马为之;王晨阳;刘奕群;马少平;: "融合商品潜在互补性发现的个性化推荐方法", 软件学报, no. 04, 14 January 2020 (2020-01-14), pages 1090 - 1100 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109408731B (zh) | 一种多目标推荐方法、多目标推荐模型生成方法以及装置 | |
CN109460793B (zh) | 一种节点分类的方法、模型训练的方法及装置 | |
CN111611472B (zh) | 一种基于图卷积神经网络的捆绑推荐方法及系统 | |
CN109829775B (zh) | 一种物品推荐方法、装置、设备及可读存储介质 | |
CN111681067B (zh) | 基于图注意力网络的长尾商品推荐方法及系统 | |
US10459975B1 (en) | Method and system for creating an automatic video summary | |
CN107391542B (zh) | 一种基于文件知识图谱的开源软件社区专家推荐方法 | |
CN112000819A (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
US20240152732A1 (en) | Training and prediction of hybrid graph neural network model | |
CN106709076B (zh) | 基于协同过滤的社交网络推荐装置及方法 | |
CN112100504B (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN112948625B (zh) | 一种基于属性异质信息网络嵌入的电影推荐方法 | |
Wang et al. | Aspect-ratio-preserving multi-patch image aesthetics score prediction | |
CN113268656A (zh) | 一种用户推荐方法、装置、电子设备及计算机存储介质 | |
CN116830100A (zh) | 具有自适应阈值的邻域选择推荐系统 | |
CN113761359B (zh) | 数据包推荐方法、装置、电子设备和存储介质 | |
CN112907334B (zh) | 一种对象推荐方法及装置 | |
CN110969090A (zh) | 基于深度神经网络的水果品质识别方法及装置 | |
CN115905687A (zh) | 基于元学习图神经网络面向冷启动的推荐系统及方法 | |
CN115982467A (zh) | 一种去偏化用户多兴趣推荐方法、装置及存储介质 | |
CN113886632B (zh) | 一种基于动态规划的视频检索匹配方法 | |
JP2022539423A (ja) | 画像特徴抽出及びネットワークの訓練方法、装置並びに機器 | |
US20220058448A1 (en) | Image selection from a database | |
CN113763014A (zh) | 物品共现关系确定方法和装置及判定模型获得方法和装置 | |
CN110083732B (zh) | 图片检索方法、装置及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |