CN112950321A - 一种物品推荐方法和装置 - Google Patents
一种物品推荐方法和装置 Download PDFInfo
- Publication number
- CN112950321A CN112950321A CN202110260190.0A CN202110260190A CN112950321A CN 112950321 A CN112950321 A CN 112950321A CN 202110260190 A CN202110260190 A CN 202110260190A CN 112950321 A CN112950321 A CN 112950321A
- Authority
- CN
- China
- Prior art keywords
- user
- item
- graph
- users
- article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 53
- 238000013528 artificial neural network Methods 0.000 claims abstract description 40
- 239000013598 vector Substances 0.000 claims description 64
- 238000010586 diagram Methods 0.000 claims description 53
- 230000008569 process Effects 0.000 claims description 33
- 238000012549 training Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 9
- 239000000126 substance Substances 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 239000008267 milk Substances 0.000 description 3
- 210000004080 milk Anatomy 0.000 description 3
- 235000013336 milk Nutrition 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种物品推荐方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取业务场景数据,其中,业务场景数据中包含待推荐物品;判断业务场景数据中是否包含种子用户,其中,种子用户为已经对待推荐物品进行操作的用户;若是,则基于知识图谱和图神经网络算法,获取种子用户对应的相似用户,确定相似用户为可扩展用户;若否,则基于知识图谱,获取待推荐物品对应的相似物品,确定相似物品对应的邻居用户为可扩展用户;将待推荐物品推荐至可扩展用户。该实施方式对于有种子用户的业务场景和无种子用户的业务场景,能够采用不同的方式确定可扩展人群,提升物品推荐的准确性,商家和用户的体验较好。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种物品推荐方法和装置。
背景技术
随着线上购物平台的不断发展,物品推荐系统成为电子商务中的重要组成部分。在物品推荐的过程中,将对某物品感兴趣的用户称为种子用户,通过种子用户进行人群扩展,获得可扩展用户,向可扩展用户推荐该物品。现有技术,可以采用判别式模型和图标签传播方法进行人群扩展。
但是,判别式模型和图标签传播方法适用于有种子用户的情况。在种子用户很少或者无种子用户的情况下,需要依赖人工规则来构建正负样本,会带来噪声问题,导致扩展人群不足或不准确,降低物品推荐的准确性,并且带给商家和用户不好的体验。以及,现有技术没有充分利用物品以及用户之间丰富的关联关系。
发明内容
有鉴于此,本发明实施例提供一种物品推荐方法和装置,对于有种子用户的业务场景和无种子用户的业务场景,能够采用不同的方式确定可扩展人群,提升物品推荐的准确性,商家和用户的体验较好。
为实现上述目的,根据本发明实施例的一个方面,提供了一种物品推荐方法。
本发明实施例的一种物品推荐方法,包括:获取业务场景数据,其中,所述业务场景数据中包含待推荐物品;判断所述业务场景数据中是否包含种子用户,其中,所述种子用户为已经对所述待推荐物品进行操作的用户;若是,则基于知识图谱和图神经网络算法,获取所述种子用户对应的相似用户,确定所述相似用户为可扩展用户;若否,则基于所述知识图谱,获取所述待推荐物品对应的相似物品,确定所述相似物品对应的邻居用户为可扩展用户;将所述待推荐物品推荐至所述可扩展用户。
可选地,所述基于知识图谱和图神经网络算法,获取所述种子用户对应的相似用户,包括:基于所述知识图谱对应的用户关系图,将所述种子用户作为正样本、非种子用户作为负样本,并结合用户的画像数据,利用图神经网络算法进行模型训练,获得所述种子用户对应的特征向量和所述非种子用户对应的特征向量;根据所述种子用户对应的特征向量和所述非种子用户对应的特征向量,计算所述种子用户与所述非种子用户之间的相似值;根据计算的所述种子用户与所述非种子用户之间的相似值,从所述非种子用户中,选择所述种子用户对应的相似用户;其中,所述非种子用户为所述用户关系图中所述种子用户之外的用户,且所述非种子用户的数量为一个或多个。
可选地,所述基于所述知识图谱,获取所述待推荐物品对应的相似物品,确定所述相似物品对应的邻居用户为可扩展用户,包括:判断所述待推荐物品是否在所述知识图谱对应的用户物品关系图中;若是,则基于所述用户物品关系图和图神经网络算法,获取所述相似物品;若否,则基于所述用户物品关系图,并根据所述待推荐物品的特定属性标签,获取所述相似物品;从所述用户物品关系图中,获取所述相似物品对应的邻居用户,确定所述邻居用户为所述可扩展用户。
可选地,所述基于所述用户物品关系图和图神经网络算法,获取所述相似物品,包括:基于所述用户物品关系图,并结合用户的画像数据和物品的属性数据,利用图神经网络算法进行模型训练,获得所述待推荐物品对应的特征向量和其他物品对应的特征向量;根据所述待推荐物品对应的特征向量和所述其他物品对应的特征向量,计算所述待推荐物品与所述其他物品之间的相似值;根据计算的所述待推荐物品与所述其他物品之间的相似值,从所述其他物品中,选择所述待推荐物品对应的相似物品;其中,所述其他物品为所述用户物品关系图中所述待推荐物品之外的物品,且所述其他物品的数量为一个或多个。
可选地,所述基于所述用户物品关系图,并根据所述待推荐物品的特定属性标签,获取所述相似物品,包括:根据物品的属性数据,从所述用户物品关系图中,选择具有所述特定属性标签的物品,确定选择的物品为所述相似物品。
可选地,所述知识图谱是按照如下过程构建的:获取用户历史行为数据;根据所述用户历史行为数据,获取用户与物品之间的关系;根据所述用户历史行为数据中的用户订单数据,获取用户与地址之间的关系、以及物品与地址之间的关系;根据所述用户与物品之间的关系、所述用户与地址之间的关系和所述物品与地址之间的关系,构建以用户、物品和地址为节点的知识图谱。
可选地,在构建以用户、物品和地址为节点的知识图谱之后,所述方法还包括:将用户的画像数据添加至所述知识图谱中,以及,将物品的属性数据添加至所述知识图谱中。
可选地,所述用户关系图是按照如下过程生成的:获取所述知识图谱中的全部用户;针对所述全部用户中的每个用户,从所述知识图谱中,获取与所述用户具有共同邻居的用户,然后计算所述用户与获取的用户之间的相似值,以得到所述全部用户之间的相似值;根据所述全部用户之间的相似值,生成所述用户关系图。
可选地,所述计算所述用户与获取的用户之间的相似值,包括:确定所述用户与所述获取的用户对应的共同邻居;根据所述知识图谱,统计所述共同邻居对应的节点数;根据所述用户与所述共同邻居之间的关系、所述获取的用户与所述共同邻居之间的关系、以及所述共同邻居对应的节点数,并结合设置的权重,计算所述用户与所述获取的用户之间的相似值。
可选地,所述用户物品关系图是按照如下过程生成的:根据所述知识图谱,获取所述用户与物品之间的关系;根据所述用户与物品之间的关系,结合设置的权重,计算用户与物品之间的关联值;根据所述用户与物品之间的关联值,生成所述用户物品关系图。
可选地,所述图神经网络算法为GraphSAGE算法。
为实现上述目的,根据本发明实施例的又一个方面,提供了一种物品推荐装置。
本发明实施例的一种物品推荐装置,包括:获取模块,用于获取业务场景数据,其中,所述业务场景数据中包含待推荐物品;判断模块,用于判断所述业务场景数据中是否包含种子用户,其中,所述种子用户为已经对所述待推荐物品进行操作的用户;第一确定模块,用于若是,则基于知识图谱和图神经网络算法,获取所述种子用户对应的相似用户,确定所述相似用户为可扩展用户;第二确定模块,用于若否,则基于所述知识图谱,获取所述待推荐物品对应的相似物品,确定所述相似物品对应的邻居用户为可扩展用户;推荐模块,用于将所述待推荐物品推荐至所述可扩展用户。
可选地,所述第一确定模块还用于:基于所述知识图谱对应的用户关系图,将所述种子用户作为正样本、非种子用户作为负样本,并结合用户的画像数据,利用图神经网络算法进行模型训练,获得所述种子用户对应的特征向量和所述非种子用户对应的特征向量;根据所述种子用户对应的特征向量和所述非种子用户对应的特征向量,计算所述种子用户与所述非种子用户之间的相似值;根据计算的所述种子用户与所述非种子用户之间的相似值,从所述非种子用户中,选择所述种子用户对应的相似用户;其中,所述非种子用户为所述用户关系图中所述种子用户之外的用户,且所述非种子用户的数量为一个或多个。
可选地,所述第二确定模块还用于:判断所述待推荐物品是否在所述知识图谱对应的用户物品关系图中;若是,则基于所述用户物品关系图和图神经网络算法,获取所述相似物品;若否,则基于所述用户物品关系图,并根据所述待推荐物品的特定属性标签,获取所述相似物品;从所述用户物品关系图中,获取所述相似物品对应的邻居用户,确定所述邻居用户为所述可扩展用户。
可选地,所述第二确定模块还用于:基于所述用户物品关系图,并结合用户的画像数据和物品的属性数据,利用图神经网络算法进行模型训练,获得所述待推荐物品对应的特征向量和其他物品对应的特征向量;根据所述待推荐物品对应的特征向量和所述其他物品对应的特征向量,计算所述待推荐物品与所述其他物品之间的相似值;根据计算的所述待推荐物品与所述其他物品之间的相似值,从所述其他物品中,选择所述待推荐物品对应的相似物品;其中,所述其他物品为所述用户物品关系图中所述待推荐物品之外的物品,且所述其他物品的数量为一个或多个。
可选地,所述第二确定模块还用于:根据物品的属性数据,从所述用户物品关系图中,选择具有所述特定属性标签的物品,确定选择的物品为所述相似物品。
可选地,所述装置还包括图谱构建模块,用于:获取用户历史行为数据;根据所述用户历史行为数据,获取用户与物品之间的关系;根据所述用户历史行为数据中的用户订单数据,获取用户与地址之间的关系、以及物品与地址之间的关系;根据所述用户与物品之间的关系、所述用户与地址之间的关系和所述物品与地址之间的关系,构建以用户、物品和地址为节点的知识图谱。
可选地,所述图谱构建模块还用于:将用户的画像数据添加至所述知识图谱中,以及,将物品的属性数据添加至所述知识图谱中。
可选地,所述图谱构建模块还用于:获取所述知识图谱中的全部用户;针对所述全部用户中的每个用户,从所述知识图谱中,获取与所述用户具有共同邻居的用户,然后计算所述用户与获取的用户之间的相似值,以得到所述全部用户之间的相似值;根据所述全部用户之间的相似值,生成所述用户关系图。
可选地,所述图谱构建模块还用于:确定所述用户与所述获取的用户对应的共同邻居;根据所述知识图谱,统计所述共同邻居对应的节点数;根据所述用户与所述共同邻居之间的关系、所述获取的用户与所述共同邻居之间的关系、以及所述共同邻居对应的节点数,并结合设置的权重,计算所述用户与所述获取的用户之间的相似值。
可选地,所述图谱构建模块还用于:根据所述知识图谱,获取所述用户与物品之间的关系;根据所述用户与物品之间的关系,结合设置的权重,计算用户与物品之间的关联值;根据所述用户与物品之间的关联值,生成所述用户物品关系图。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种电子设备。
本发明实施例的一种电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明实施例的物品推荐方法。
为实现上述目的,根据本发明实施例的还一个方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现本发明实施例的物品推荐方法。
上述发明中的一个实施例具有如下优点或有益效果:对于有种子用户的业务场景和无种子用户的业务场景,能够采用不同的方式确定可扩展人群,接着向可扩展人群推荐待推荐物品,解决了现有技术在种子用户很少或者无种子用户的情况下,依赖人工规则构建正负样本带来的噪声问题,能够得到满足需求的扩展人群,提升物品推荐的准确性,商家和用户的体验较好。此外,在确定可扩展用户的过程中,利用了以用户、物品和地址为节点的知识图谱,解决了现有技术没有充分利用物品以及用户之间丰富的关联关系,充分利用了物品和用户的交互关系、用户画像数据和物品属性数据。以及,对于有种子用户的业务场景,结合了知识图谱和图神经网络算法,进一步提高了物品推荐的准确性。并且,对于无种子用户的业务场景,采用了多跳查询的方式,先利用知识图谱获取待推荐物品对应的相似物品,然后确定相似物品对应的邻居用户为可扩展用户。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的物品推荐方法的主要步骤的示意图;
图2是根据本发明实施例的知识图谱的构建过程的示意图;
图3是根据本发明实施例的知识图谱的结构示意图;
图4是根据本发明实施例的基于知识图谱和图神经网络算法,获取种子用户对应的相似用户的主要过程的示意图;
图5是根据本发明实施例生成的用户关系图的结构示意图;
图6是根据本发明实施例的通过待推荐物品确定可扩展用户的主要过程的示意图;
图7是根据本发明实施例生成的用户物品关系图的结构示意图;
图8是根据本发明实施例的物品推荐的方法的主要过程的示意图;
图9是根据本发明实施例的物品推荐装置的主要模块的示意图;
图10是本发明实施例可以应用于其中的示例性系统架构图;
图11是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的物品推荐方法的主要步骤的示意图。
如图1所示,物品推荐方法的主要步骤可以包括:
步骤S101,获取业务场景数据;
步骤S102,判断业务场景数据中是否包含种子用户,若是,则执行步骤S103,若否,则执行步骤S104;
步骤S103,基于知识图谱和图神经网络算法,获取种子用户对应的相似用户,确定相似用户为可扩展用户;
步骤S104,基于知识图谱,获取待推荐物品对应的相似物品,确定相似物品对应的邻居用户为可扩展用户;
步骤S105,将待推荐物品推荐至可扩展用户。
其中,业务场景是指进行物品推荐的场景。业务场景数据可以理解为计划进行物品推荐时,获取到的与物品推荐有关的数据。该业务场景数据中包含待推荐物品,也就是说,通过业务场景数据,可以确定需要推荐的物品。此外,业务场景数据可以为想要进行物品推荐的商家提供的数据。比如,电商平台上的某商家A计划推广物品P1,那么业务场景数据可以为商家A提供的物品P1、也可以为商家A提供的近期购买过物品P1的用户。
业务场景可以包括有种子用户的场景和无种子用户的场景。有种子用户的场景是指业务场景数据中包含种子用户。其中,种子用户为已经对待推荐物品进行操作的用户,如已经购买过待推荐物品的用户、已经收藏过待推荐物品的用户、或者已经关注过待推荐物品的用户等。比如,业务场景数据为商家A提供的近一周内购买过物品P1的用户,那么可以认为业务场景数据中包含种子用户,该种子用户为近一周内购买过物品P1的用户。无种子用户的场景是指业务场景数据中不包含种子用户,如业务场景数据为商家A提供的需要进行推荐的物品集合,那么该业务场景数据中不包含种子用户。
本发明实施例提供的物品推荐方法,针对不同的业务场景,可以采用不同的方式获取到可扩展用户,进而向可扩展用户推荐待推荐物品。因此,在步骤S101获取到业务场景数据后,通过步骤S102判断业务场景数据是否包含种子用户。
如果业务场景数据中包含种子用户,那么可以基于知识图谱和图神经网络算法,获取种子用户对应的相似用户,即与种子用户相似的用户,然后确定获取到的相似用户为可扩展用户。如果业务场景数据中不包含种子用户,那么可以基于知识图谱,获取待推荐物品对应的相似物品,即与待推荐物品相似的物品,接着利用知识图谱,查询到相似物品对应的邻居用户,确定查询到的邻居用户为可扩展用户。其中,知识图谱可以理解为一种揭示实体之间关系的语义网络。本发明实施例中,知识图谱是指对用户历史行为数据进行分析,得到的以用户、物品和地址为节点的关系图,即知识图谱中的实体为用户、物品和地址,以及通过知识图谱,可以得到用户、物品和地址之间的关系。
需要注意的是,在获取到可扩展用户后,可以对可扩展用户的数量验证,判断获取到的可扩展用户的数量是否满足需求。比如,商家A规定了需要向至少100个用户推荐物品P1,但是得到的扩展用户数量为50个。那么,对于有种子用户的场景,那么可以重新获取种子用户对应的相似用户;对于无种子用户的场景,那么可以重新获取待推荐物品对应的相似物品。最后,在确定可扩展用户后,可以向可扩展用户推荐待推荐物品。
根据本发明实施例的物品推荐的方法,对于有种子用户的业务场景和无种子用户的业务场景,能够采用不同的方式确定可扩展人群,接着向可扩展人群推荐待推荐物品,解决了现有技术在种子用户很少或者无种子用户的情况下,依赖人工规则构建正负样本带来的噪声问题,能够得到满足需求的扩展人群,提升物品推荐的准确性,商家和用户的体验较好。此外,在确定可扩展用户的过程中,利用了以用户、物品和地址为节点的知识图谱,解决了现有技术没有充分利用物品以及用户之间丰富的关联关系,充分利用了物品和用户的交互关系、用户画像数据和物品属性数据。以及,对于有种子用户的业务场景,结合了知识图谱和图神经网络算法,进一步提高了物品推荐的准确性。并且,对于无种子用户的业务场景,采用了多跳查询的方式,先利用知识图谱获取待推荐物品对应的相似物品,然后确定相似物品对应的邻居用户为可扩展用户。
通过上文得知,对于有种子用户的场景和无种子用户的场景,均需要基于知识图谱确定可扩展用户,因此,知识图谱在本发明实施例的物品推荐方法中有重要作用。图2是根据本发明实施例的知识图谱的构建过程的示意图。如图2所示,知识图谱的构建过程可以包括步骤S201至步骤S204。
步骤S201:获取用户历史行为数据。
其中,用户历史行为数据可以是一段时间内电商平台上的用户行为数据,如近三个月的电商平台上的用户行为数据。用户历史行为数据可以包括:用户订单数据、用户点击物品的数据、用户收藏物品的数据、用户关注物品的数据、用户加购物品的数据、用户搜索物品的数据等与用户操作行为相关的数据。其中,用户订单数据可以是指用户购买物品的次数,用户点击物品的数据可以指用户点击物品的次数,用户加购物品的数据可以是指用户将物品加入购物车的次数。
步骤S202:根据用户历史行为数据,获取用户与物品之间的关系。也就是说,通过用户历史行为数据,可以得到用户与物品之间的关系,如用户B1购买了物品P1,用户B2点击了物品P2和P4。
步骤S203:根据用户历史行为数据中的用户订单数据,获取用户与地址之间的关系、以及物品与地址之间的关系。其中,用户订单数据中包括地址数据,如用户B1购买了物品P1,将该物品P1的收货地址为C1。因此,通过用户订单数据,可以得到用户与地址之间的关系、以及物品与地址之间的关系。
步骤S204:根据用户与物品之间的关系、用户与地址之间的关系和物品与地址之间的关系,构建以用户、物品和地址为节点的知识图谱。
本发明实施例中,知识图谱的节点包括用户、物品和地址。如果通过用户历史行为数据得到,某用户与某物品存在交互关系,如该用户购买过该物品,则该用户与该物品之间会建立起关系类型对应的边,即在知识图谱中,将该用户与该物品连接起来,标注该用户与该物品之间的关系。类似地,如果某物品与某地址存在关系,则在知识图谱中,将该用户与该物品连接起来,标注该物品与该地址之间的关系。同理,如果某用户与某地址存在关系,则在知识图谱中,将该用户与该地址连接起来,并表明该用户与该地址之间的关系。
图3是根据本发明实施例的知识图谱的结构示意图。通过图3,可以得到用户B1、B2、B3和B4,物品P1、P2、P3、P4和P5,以及地址C1和C2之间的关系。具体关系为,用户B1购买了物品P1,且收货地址为C1,用户B1收藏了物品P2;用户B2点击了物品P2和P4,用户B2购买了物品P5,且收货地址为C1;用户B3购买了物品P1,且收货地址为C2,用户B3关注了物品P3;用户B4将物品P3加入购物车,搜索了物品P5。
此外,在构建以用户、物品和地址为节点的知识图谱之后,还可以将用户的画像数据添加至知识图谱中,以及,将物品的属性数据添加至知识图谱中。在用户标签中,补充用户的画像数据,如用户的年龄、职业、性别等。在物品标签中,补充物品的属性数据,如物品的品牌、品类、体积等。本发明实施例中,将用户的画像数据和物品的属性数据添加至知识图谱中,从而可以直观地从知识图谱中得到用户信息和物品信息,提高用户使用体验。
接下来,详细说明对于有种子用户的场景和无种子用户的场景,基于知识图谱确定可扩展用户的过程。
(一)有种子用户的场景
图4是根据本发明实施例的基于知识图谱和图神经网络算法,获取种子用户对应的相似用户的主要过程的示意图。如图4所示,获取种子用户对应的相似用户的主要过程可以包括:
步骤S401,基于知识图谱对应的用户关系图,将种子用户作为正样本、非种子用户作为负样本,并结合用户的画像数据,利用图神经网络算法进行模型训练,获得种子用户对应的特征向量和非种子用户对应的特征向量;
步骤S402,根据种子用户对应的特征向量和非种子用户对应的特征向量,计算种子用户与非种子用户之间的相似值;
步骤S403,根据计算的种子用户与非种子用户之间的相似值,从非种子用户中,选择种子用户对应的相似用户。
非种子用户为用户关系图中种子用户之外的用户,且非种子用户的数量为一个或多个。比如,业务场景数据为购买过物品P1的用户B1和B3,那么种子用户为B1和B3,非种子用户为B2和B4。
用户关系图是指通过知识图谱得到的,用户与用户之间的关系图。本发明实施例可以按照如下过程生成用户关系图:
(1)获取知识图谱中的全部用户,如图3中的用户B1、B2、B3和B4。
(2)针对全部用户中的每个用户,从知识图谱中,获取与该用户具有共同邻居的用户,然后计算该用户与获取的用户之间的相似值,以得到全部用户之间的相似值。
对知识图谱中的每个用户进行分析,得到该用户与其他用户之间的相似值。具体的,针对每个用户,获取到与该用户具有共同邻居的用户,然后计算该用户与获取的用户之间的相似值。对于某节点来说,邻居是指与该节点相连的节点,如图3中,用户B1的邻居为物品P1、P2和地址C1。共同邻居是指如果两个或两个以上节点具有相同的邻居,那么相同的邻居为这两个或两个以上节点的共同邻居。图3可以看出,用户B1和用户B2具有共同邻居,即物品P2和地址C1,那么需要计算用户B1和用户B2之间的相似值。
进一步地,计算该用户与获取的用户之间的相似值,包括:确定该用户与获取的用户对应的共同邻居;根据知识图谱,统计共同邻居对应的节点数;根据该用户与共同邻居之间的关系、获取的用户与共同邻居之间的关系、以及共同邻居对应的节点数,并结合设置的权重,计算该用户与获取的用户之间的相似值。
共同邻居对应的节点数是指与该共同邻居连接的节点的数量,如图3中,物品P2对应的节点数为2,地址C1对应的节点数为4。考虑到用户与物品之间的不同关系,反应的用户对物品的喜好程度是不同的。所以,在计算用户之间的相似值的过程中,可以为用户与物品之间的不同关系设置不同的权重,如设置点击关系、收藏关系、购买关系的权重比为1:2:3。另外,也可以为用户与地址之间的关系设置权重。因此,得到如下所示的用户之间的相似值的计算公式:
其中,sim(a,b)表示用户a和用户b之间的相似值;degree(c)表示用户a和用户b的共同邻居c对应的节点数;((a,c)∈edgelist,w1)表示c为用户a的邻居,且用户a和c之间的关系的权重值为w1;((b,c)∈edgelist,w2)表示c为用户b的邻居,且用户a和b之间的关系的权重值为w2。
综上,如果两个用户存在共同邻居,那么可以按照上述公式,计算得到两个用户之间的相似值;如果两个用户不存在共同邻居,那么可以认为这两个用户之间的相似值为0。因此,可以获得全部用户之间的相似值,即每两个用户之间的相似值。
(3)根据全部用户之间的相似值,生成用户关系图。
图5是根据本发明实施例生成的用户关系图的结构示意图。通过图3得到,用户B1与B2之间存在共同邻居,用户B1和B3之间存在共同邻居,用户B2和B4之间存在共同邻居,用户B3和B4之间存在共同邻居,所以可以得到图5所示的用户关系图。在图5中,还可以标注用户之间的相似值为d1、d2、d3和d4。
图神经网络是一种直接在图结构上运行的神经网络。本发明实施例可以采用GraphSAGE算法(即,一种图神经网络算法),该算法可以将图中的每个节点用其邻居节点的聚合重新表示。
对于有种子用户的场景,基于用户关系图,将种子用户作为正样本、非种子用户作为负样本,利用GraphSAGE算法进行有监督学习,其损失函数可以为:
其中,N表示用户的数量,即种子用户和非种子用户的总数;y表示用户对待推荐物品的喜爱程度,正样本对应的y为1,负样本对应y为0;zu为用户u的表示;p(zu)表示预测的用户u对应的概率值,即预测用户u对待推荐物品的喜爱程度。
GraphSAGE算法的核心操作包括两个步骤:第一步,融合目标邻域的特征,如融合邻居节点的特征;第二步,将融合的目标邻域的特征与节点本身的特征进行拼接,更新每个节点的特征。具体公式为:
其中,表示融合节点i的邻居节点得到的特征;xj表示节点j的特征,xi表示节点i的特征;Ni表示节点i的邻居节点;aggregate()表示进行特征融合;yi为更新后的节点i的特征;σ为激活函数;concat()表示进行特征拼接;W表示网络权重。另外,aggregate()可以采用最大池化、平均池化等方法。将上述第一步和第二步重复执行K次,即迭代更新每个节点的特征,从而可以实现每个节点与该节点的K度邻居的特征进行融合。
另外,在基于用户关系图和GraphSAGE算法获得节点的特征向量的过程中,还可以结合用户的画像数据,从而可以更好的表示用户的特征,以便提高后续计算的种子用户与非种子用户之间的相似值的准确性。另外,由于电商数据更新比较频繁,时不时会有新的节点加入,重复训练整个网络代价较大。当有新的节点加入时,聚合方式的提出可以使GraphSAGE无需重复训练,以便获取最新的特征向量。也即,按照已经学到的聚合方式,把新加入的节点的特征聚合起来即可。
在步骤S401中,基于用户关系图和GraphSAGE算法,并结合用户的画像数据,获得用户关系图中每个用户对应的特征向量,即得到种子用户对应的特征向量和非种子用户对应的特征向量。然后,在步骤S402中,利用得到的特征向量,计算种子用户与非种子用户之间的相似值。接着,在步骤S403中,根据计算的相似值,从非种子用户中选择种子用户对应的相似用户。具体的,可以设置第一相似度阈值,如果种子用户与非种子用户之间的相似值大于第一相似度阈值,则确定非种子用户为种子用户的对应的相似用户。当然,也可以根据可扩展用户的需求数量,设置第一相似度阈值。
需要注意的是,种子用户的数量可以为一个或多个,非种子用户的数量也可以为一个或多个。因此,需要计算每个种子用户与每个非种子用户之间的相似值,然后得到该种子用户对应的相似用户。如种子用户为B1和B3,非种子用户为B2和B4,那么需要计算用户B1与用户B2之间的相似值、用户B1与用户B4之间的相似值,进而可以判断用户B2和B4是否为用户B1对应的相似用户。并且,还需要计算用户B3与用户B2之间的相似值、用户B3与用户B4之间的相似值,进而可以判断用户B2和B4是否为用户B3对应的相似用户。
综上,针对有种子用户的场景,有监督地训练用户网络,获得用户的特征向量,使得网络拓补结构中相似的用户更接近,能够直接利用种子用户获取到可扩展用户。
(二)无种子用户的场景
图6是根据本发明实施例的通过待推荐物品确定可扩展用户的主要过程的示意图。如图6所示,通过待推荐物品确定可扩展用户的主要过程的可以包括步骤S601至步骤S604。
步骤S601:判断待推荐物品是否在知识图谱对应的用户物品关系图中,若是,则执行步骤S602,若否,则执行步骤S603。
其中,用户物品关系图是指通过知识图谱得到的,用户与物品之间的关系图。本发明实施例可以按照如下过程生成用户物品关系图:
(1)根据知识图谱,获取用户与物品之间的关系,如用户与物品之间为购买关系、用户与物品之间为点击关系、用户与物品之间为收藏关系;
(2)根据用户与物品之间的关系,结合设置的权重,计算用户与物品之间的关联值。
其中,用户与物品之间的关联值可以理解为用户对物品的喜爱程度。考虑到用户与物品之间的不同关系,反应的用户对物品的喜好程度是不同的。所以,在计算用户对物品的喜爱程度的过程中,可以为用户与物品之间的不同关系设置不同的权重,如设置点击关系、收藏关系、购买关系的权重比为1:2:3。
(3)根据用户与物品之间的关联值,生成用户物品关系图。
图7是根据本发明实施例生成的用户物品关系图的结构示意图。通过图3得到,用户B1与物品P1、P2之间存在关系,用户B2与物品P2、P4、P5之间存在关系,用户B3与物品P1、P3之间存在关系,用户B4与物品P3、P5之间存在关系,所以可以得到图7所示的用户物品关系图。在图7中,还可以标注用户物品之间的关联值为f1至f9。
步骤S602:基于用户物品关系图和图神经网络算法,获取相似物品。
如果待推荐物品在知识图谱对应的用户物品关系图中,那么可以利用GraphSAGE算法,获取待推荐物品对应的相似物品。具体实现为:
(1)基于用户物品关系图,并结合用户的画像数据和物品的属性数据,利用图神经网络算法进行模型训练,获得待推荐物品对应的特征向量和其他物品对应的特征向量。其中,其他物品为用户物品关系图中待推荐物品之外的物品,且其他物品的数量为一个或多个。
对于无种子用户的场景,基于用户物品关系图,利用GraphSAGE算法进行无监督学习,其损失函数可以为:
其中,zu为节点u的特征向量,zv为节点v的特征向量,u和v共同出现在一定长度的随机游走中,本发明实施例中,可以认为节点v为节点u的邻居节点;σ为激活函数;vn为不与节点u共同出现的负样本,即可以认为vn为节点u的非邻居节点;pn为负样本的概率分布;Q为负样本的数量。
上文已经说明GraphSAGE算法的核心操作,此处不再重复说明。本发明实施例,可以基于用户物品关系图和GraphSAGE算法,获得用户物品关系图中,每个物品对应的特征向量和每个用户对应的特征向量。此外,在生成特征向量的过程中,还可以结合用户的画像数据和物品的属性数据,从而可以更好的表示物品的特征和用户的特征,以便提高计算的待推荐物品与其他物品之间的相似值的准确性。
(2)根据待推荐物品对应的特征向量和其他物品对应的特征向量,计算待推荐物品与其他物品之间的相似值。
(3)根据计算的待推荐物品与其他物品之间的相似值,从其他物品中,选择待推荐物品对应的相似物品。
在得到待推荐物品对应的特征向量和其他物品对应的特征向量后,利用得到的特征向量,计算待推荐物品与其他物品之间的相似值,然后根据计算的相似值,从其他物品中选择待推荐物品对应的相似物品。具体的,可以设置第二相似度阈值,如果待推荐物品与其他物品之间的相似值大于第二相似度阈值,则确定其他物品为待推荐物品的对应的相似物品。当然,也可以根据可扩展用户的需求数量,设置第二相似度阈值。需要注意的是,待推荐物品的数量可以为一个或多个,其他物品的数量也可以为一个或多个。因此,需要计算每个待推荐物品与每个其他物品之间的相似值,然后得到该待推荐物品对应的相似物品。
步骤S603:基于用户物品关系图,并根据待推荐物品的特定属性标签,获取相似物品。
如果待推荐物品不在知识图谱对应的用户物品关系图中,那么可以指定待推荐物品的特定属性标签,然后根据物品的属性数据,从用户物品关系图中,选择具有特定属性标签的物品,确定选择的物品为相似物品。比如,待推荐物品为某品牌的中高端奶粉,且用户物品关系图中没有该品牌的中高端奶粉,那么可以定位到该用户物品关系图中存在的其他品牌的中高端奶粉。
步骤S604:从用户物品关系图中,获取相似物品对应的邻居用户,确定邻居用户为可扩展用户。
在获得待推荐物品对应的相似物品后,可以从用户物品关系图中,查询到与相似物品发生过交互行为的用户,即相似物品对应的邻居用户,确定邻居用户为可扩展用户。
综上,针对无种子用户、且待推荐物品在知识图谱对应的用户物品关系图中的场景,能够无监督地训练用户物品网络,获得用户的特征向量和物品的特征向量,使得网络拓补结构中相似的物品更接近,然后基于待推荐物品和相似物品,在用户物品关系图中扩展人群。针对无种子用户、且待推荐物品不在知识图谱对应的用户物品关系图中的场景,能够采用待推荐物品的特定属性标签,在用户物品关系图中进行多跳查询,先在用户物品关系图中确定相似物品,后进行人群扩展。
图8是根据本发明实施例的物品推荐的方法的主要过程的示意图。如图8所示,物品推荐的方法的主要过程可以包括:
步骤S801,获取业务场景数据;
步骤S802,判断业务场景数据中是否包含种子用户,若是,则执行步骤S803,若否,则执行步骤S806;
步骤S803,基于知识图谱对应的用户关系图,将种子用户作为正样本、非种子用户作为负样本,并结合用户的画像数据,利用GraphS AGE算法进行模型训练,获得种子用户对应的特征向量和非种子用户对应的特征向量;
步骤S804,根据种子用户对应的特征向量和非种子用户对应的特征向量,计算种子用户与非种子用户之间的相似值;
步骤S805,根据计算的种子用户与非种子用户之间的相似值,从非种子用户中,选择种子用户对应的相似用户,确定相似用户为可扩展用户;
步骤S806,判断待推荐物品是否在知识图谱对应的用户物品关系图中,若是,则执行步骤S807,若否,则执行步骤S810;
步骤S807,基于用户物品关系图,并结合用户的画像数据和物品的属性数据,利用GraphSAGE算法进行模型训练,获得待推荐物品对应的特征向量和其他物品对应的特征向量;
步骤S808,根据待推荐物品对应的特征向量和其他物品对应的特征向量,计算待推荐物品与其他物品之间的相似值;
步骤S809,根据计算的待推荐物品与其他物品之间的相似值,从其他物品中,选择待推荐物品对应的相似物品;
步骤S810,根据物品的属性数据,从用户物品关系图中,选择具有特定属性标签的物品,确定选择的物品为待推荐物品对应的相似物品;
步骤S811,从用户物品关系图中,获取相似物品对应的邻居用户,确定邻居用户为可扩展用户;
步骤S812,将待推荐物品推荐至可扩展用户。
其中,业务场景数据中包含待推荐物品,且待推荐物品的数量为一个或多个;种子用户为已经对待推荐物品进行操作的用户,种子用户的数量为一个或多个;非种子用户为用户关系图中种子用户之外的用户,且非种子用户的数量为一个或多个;其他物品为用户物品关系图中待推荐物品之外的物品,且其他物品的数量为一个或多个。还有,上文已经详细说明知识图谱、用户关系图和用户物品关系图,此外不再重复描述。
综上,对于有种子用户的场景,可以基于用户关系图,利用Graph SAGE算法进行有监督学习,并结合用户的画像数据,获取种子用户对应的相似用户,确定相似用户为可扩展用户;对于无种子用户的场景,可以基于用户物品关系图,采用多跳查询的方式确定可扩展用户,即首先确定待推荐物品对应的相似物品,然后确定相似物品对应的邻居用户为可扩展用户。并且,若待推荐物品在用户物品关系图中,可以基于用户物品关系图,利用GraphSAGE算法进行有监督学习,并结合用户的画像数据和物品的属性数据,获取待推荐物品对应的相似物品;若待推荐物品不在用户物品关系图中,可以指定待推荐物品的特定属性标签,从用户物品关系图中,选择具有特定属性标签的物品,确定选择的物品为待推荐物品对应的相似物品。
另外,由于待推荐物品的数量为一个或多个,因此,业务场景数据可以包含部分待推荐物品对应的种子用户。此时,对于存在种子用户的待推荐物品,按照有种子用户的场景,获取该待推荐物品对应的可扩展用户;对于不存在种子用户的待推荐物品,按照无种子用户的场景,获取该待推荐物品对应的可扩展用户。
根据本发明实施例的物品推荐方法,对于有种子用户的业务场景和无种子用户的业务场景,能够采用不同的方式确定可扩展人群,接着向可扩展人群推荐待推荐物品,解决了现有技术在种子用户很少或者无种子用户的情况下,依赖人工规则构建正负样本带来的噪声问题,能够得到满足需求的扩展人群,提升物品推荐的准确性,商家和用户的体验较好。此外,在确定可扩展用户的过程中,利用了以用户、物品和地址为节点的知识图谱,解决了现有技术没有充分利用物品以及用户之间丰富的关联关系,充分利用了物品和用户的交互关系、用户画像数据和物品属性数据。以及,对于有种子用户的业务场景,结合了知识图谱和图神经网络算法,进一步提高了物品推荐的准确性。并且,对于无种子用户的业务场景,采用了多跳查询的方式,先利用知识图谱获取待推荐物品对应的相似物品,然后确定相似物品对应的邻居用户为可扩展用户。
图9是根据本发明实施例的物品推荐装置的主要模块的示意图。如图9所示,物品推荐装置900的主要模块可以包括:获取模块901、判断模块902、第一确定模块903、第二确定模块904和推荐模块905。
其中,获取模块901可用于:获取业务场景数据,其中,业务场景数据中包含待推荐物品;判断模块902可用于:判断业务场景数据中是否包含种子用户,其中,种子用户为已经对待推荐物品进行操作的用户;第一确定模块903可用于:若是,则基于知识图谱和图神经网络算法,获取种子用户对应的相似用户,确定相似用户为可扩展用户;第二确定模块904可用于:若否,则基于知识图谱,获取待推荐物品对应的相似物品,确定相似物品对应的邻居用户为可扩展用户;推荐模块905可用于:将待推荐物品推荐至可扩展用户。
作为本发明的实施例,第一确定模块903还可用于:基于知识图谱对应的用户关系图,将种子用户作为正样本、非种子用户作为负样本,并结合用户的画像数据,利用图神经网络算法进行模型训练,获得种子用户对应的特征向量和非种子用户对应的特征向量;根据种子用户对应的特征向量和非种子用户对应的特征向量,计算种子用户与非种子用户之间的相似值;根据计算的种子用户与非种子用户之间的相似值,从非种子用户中,选择种子用户对应的相似用户;其中,非种子用户为用户关系图中种子用户之外的用户,且非种子用户的数量为一个或多个。
作为本发明的实施例,第二确定模块904还可用于:判断待推荐物品是否在知识图谱对应的用户物品关系图中;若是,则基于用户物品关系图和图神经网络算法,获取相似物品;若否,则基于用户物品关系图,并根据待推荐物品的特定属性标签,获取相似物品;从用户物品关系图中,获取相似物品对应的邻居用户,确定邻居用户为可扩展用户。
作为本发明的实施例,第二确定模块904还可用于:基于用户物品关系图,并结合用户的画像数据和物品的属性数据,利用图神经网络算法进行模型训练,获得待推荐物品对应的特征向量和其他物品对应的特征向量;根据待推荐物品对应的特征向量和其他物品对应的特征向量,计算待推荐物品与其他物品之间的相似值;根据计算的待推荐物品与其他物品之间的相似值,从其他物品中,选择待推荐物品对应的相似物品;其中,其他物品为用户物品关系图中待推荐物品之外的物品,且其他物品的数量为一个或多个。
作为本发明的实施例,第二确定模块904还可用于:根据物品的属性数据,从用户物品关系图中,选择具有特定属性标签的物品,确定选择的物品为相似物品。
从图9可以看出,物品推荐装置900还可以包括图谱构建模块906。该图谱构建模块906可用于:获取用户历史行为数据;根据用户历史行为数据,获取用户与物品之间的关系;根据用户历史行为数据中的用户订单数据,获取用户与地址之间的关系、以及物品与地址之间的关系;根据用户与物品之间的关系、用户与地址之间的关系和物品与地址之间的关系,构建以用户、物品和地址为节点的知识图谱。
作为本发明的实施例,图谱构建模块906还可用于:将用户的画像数据添加至知识图谱中,以及,将物品的属性数据添加至知识图谱中。
作为本发明的实施例,图谱构建模块906还可用于:获取知识图谱中的全部用户;针对全部用户中的每个用户,从知识图谱中,获取与用户具有共同邻居的用户,然后计算用户与获取的用户之间的相似值,以得到全部用户之间的相似值;根据全部用户之间的相似值,生成用户关系图。
作为本发明的实施例,图谱构建模块906还可用于:确定用户与获取的用户对应的共同邻居;根据知识图谱,统计共同邻居对应的节点数;根据用户与共同邻居之间的关系、获取的用户与共同邻居之间的关系、以及共同邻居对应的节点数,并结合设置的权重,计算用户与获取的用户之间的相似值。
作为本发明的实施例,图谱构建模块906还可用于:根据知识图谱,获取用户与物品之间的关系;根据用户与物品之间的关系,结合设置的权重,计算用户与物品之间的关联值;根据用户与物品之间的关联值,生成用户物品关系图。
根据本发明实施例的物品推荐装置,对于有种子用户的业务场景和无种子用户的业务场景,能够采用不同的方式确定可扩展人群,接着向可扩展人群推荐待推荐物品,解决了现有技术在种子用户很少或者无种子用户的情况下,依赖人工规则构建正负样本带来的噪声问题,能够得到满足需求的扩展人群,提升物品推荐的准确性,商家和用户的体验较好。此外,在确定可扩展用户的过程中,利用了以用户、物品和地址为节点的知识图谱,解决了现有技术没有充分利用物品以及用户之间丰富的关联关系,充分利用了物品和用户的交互关系、用户画像数据和物品属性数据。以及,对于有种子用户的业务场景,结合了知识图谱和图神经网络算法,进一步提高了物品推荐的准确性。并且,对于无种子用户的业务场景,采用了多跳查询的方式,先利用知识图谱获取待推荐物品对应的相似物品,然后确定相似物品对应的邻居用户为可扩展用户。
图10示出了可以应用本发明实施例的物品推荐方法或物品推荐装置的示例性系统架构1000。
如图10所示,系统架构1000可以包括终端设备1001、1002、1003,网络1004和服务器1005。网络1004用以在终端设备1001、1002、1003和服务器1005之间提供通信链路的介质。网络1004可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备1001、1002、1003通过网络1004与服务器1005交互,以接收或发送消息等。终端设备1001、1002、1003可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器1005可以是提供各种服务的服务器,例如,对作为用户利用终端设备1001、1002、1003进行物品推荐的过程中,提供支持的后台管理服务器(仅为示例);再例如,服务器1005可以完成本发明实施例的物品推荐。
需要说明的是,本发明实施例所提供的物品推荐方法一般由服务器1005执行,相应地,物品推荐装置一般设置于服务器1005中。
应该理解,图10中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图11,其示出了适于用来实现本发明实施例的终端设备的计算机系统1100的结构示意图。图11示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图11所示,计算机系统1100包括中央处理单元(CPU)1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。在RAM 1103中,还存储有系统1100操作所需的各种程序和数据。CPU 1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
以下部件连接至I/O接口1105:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被中央处理单元(CPU)1101执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、判断模块、第一确定模块、第二确定模块和推荐模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取业务场景数据的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取业务场景数据,其中,业务场景数据中包含待推荐物品;判断业务场景数据中是否包含种子用户,其中,种子用户为已经对待推荐物品进行操作的用户;若是,则基于知识图谱和图神经网络算法,获取种子用户对应的相似用户,确定相似用户为可扩展用户;若否,则基于知识图谱,获取待推荐物品对应的相似物品,确定相似物品对应的邻居用户为可扩展用户;将待推荐物品推荐至可扩展用户。
根据本发明实施例的技术方案,对于有种子用户的业务场景和无种子用户的业务场景,能够采用不同的方式确定可扩展人群,接着向可扩展人群推荐待推荐物品,解决了现有技术在种子用户很少或者无种子用户的情况下,依赖人工规则构建正负样本带来的噪声问题,能够得到满足需求的扩展人群,提升物品推荐的准确性,商家和用户的体验较好。此外,在确定可扩展用户的过程中,利用了以用户、物品和地址为节点的知识图谱,解决了现有技术没有充分利用物品以及用户之间丰富的关联关系,充分利用了物品和用户的交互关系、用户画像数据和物品属性数据。以及,对于有种子用户的业务场景,结合了知识图谱和图神经网络算法,进一步提高了物品推荐的准确性。并且,对于无种子用户的业务场景,采用了多跳查询的方式,先利用知识图谱获取待推荐物品对应的相似物品,然后确定相似物品对应的邻居用户为可扩展用户。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (14)
1.一种物品推荐方法,其特征在于,包括:
获取业务场景数据,其中,所述业务场景数据中包含待推荐物品;
判断所述业务场景数据中是否包含种子用户,其中,所述种子用户为已经对所述待推荐物品进行操作的用户;
若是,则基于知识图谱和图神经网络算法,获取所述种子用户对应的相似用户,确定所述相似用户为可扩展用户;
若否,则基于所述知识图谱,获取所述待推荐物品对应的相似物品,确定所述相似物品对应的邻居用户为可扩展用户;
将所述待推荐物品推荐至所述可扩展用户。
2.根据权利要求1所述的方法,其特征在于,所述基于知识图谱和图神经网络算法,获取所述种子用户对应的相似用户,包括:
基于所述知识图谱对应的用户关系图,将所述种子用户作为正样本、非种子用户作为负样本,并结合用户的画像数据,利用图神经网络算法进行模型训练,获得所述种子用户对应的特征向量和所述非种子用户对应的特征向量;
根据所述种子用户对应的特征向量和所述非种子用户对应的特征向量,计算所述种子用户与所述非种子用户之间的相似值;
根据计算的所述种子用户与所述非种子用户之间的相似值,从所述非种子用户中,选择所述种子用户对应的相似用户;其中,
所述非种子用户为所述用户关系图中所述种子用户之外的用户,且所述非种子用户的数量为一个或多个。
3.根据权利要求1所述的方法,其特征在于,所述基于所述知识图谱,获取所述待推荐物品对应的相似物品,确定所述相似物品对应的邻居用户为可扩展用户,包括:
判断所述待推荐物品是否在所述知识图谱对应的用户物品关系图中;
若是,则基于所述用户物品关系图和图神经网络算法,获取所述相似物品;
若否,则基于所述用户物品关系图,并根据所述待推荐物品的特定属性标签,获取所述相似物品;
从所述用户物品关系图中,获取所述相似物品对应的邻居用户,确定所述邻居用户为所述可扩展用户。
4.根据权利要求3所述的方法,其特征在于,所述基于所述用户物品关系图和图神经网络算法,获取所述相似物品,包括:
基于所述用户物品关系图,并结合用户的画像数据和物品的属性数据,利用图神经网络算法进行模型训练,获得所述待推荐物品对应的特征向量和其他物品对应的特征向量;
根据所述待推荐物品对应的特征向量和所述其他物品对应的特征向量,计算所述待推荐物品与所述其他物品之间的相似值;
根据计算的所述待推荐物品与所述其他物品之间的相似值,从所述其他物品中,选择所述待推荐物品对应的相似物品;其中,
所述其他物品为所述用户物品关系图中所述待推荐物品之外的物品,且所述其他物品的数量为一个或多个。
5.根据权利要求3所述的方法,其特征在于,所述基于所述用户物品关系图,并根据所述待推荐物品的特定属性标签,获取所述相似物品,包括:
根据物品的属性数据,从所述用户物品关系图中,选择具有所述特定属性标签的物品,确定选择的物品为所述相似物品。
6.根据权利要求1至5任一所述的方法,其特征在于,所述知识图谱是按照如下过程构建的:
获取用户历史行为数据;
根据所述用户历史行为数据,获取用户与物品之间的关系;
根据所述用户历史行为数据中的用户订单数据,获取用户与地址之间的关系、以及物品与地址之间的关系;
根据所述用户与物品之间的关系、所述用户与地址之间的关系和所述物品与地址之间的关系,构建以用户、物品和地址为节点的知识图谱。
7.根据权利要求6所述的方法,其特征在于,在构建以用户、物品和地址为节点的知识图谱之后,所述方法还包括:
将用户的画像数据添加至所述知识图谱中,以及,将物品的属性数据添加至所述知识图谱中。
8.根据权利要求6所述的方法,其特征在于,所述用户关系图是按照如下过程生成的:
获取所述知识图谱中的全部用户;
针对所述全部用户中的每个用户,从所述知识图谱中,获取与所述用户具有共同邻居的用户,然后计算所述用户与获取的用户之间的相似值,以得到所述全部用户之间的相似值;
根据所述全部用户之间的相似值,生成所述用户关系图。
9.根据权利要求8所述的方法,其特征在于,所述计算所述用户与获取的用户之间的相似值,包括:
确定所述用户与所述获取的用户对应的共同邻居;
根据所述知识图谱,统计所述共同邻居对应的节点数;
根据所述用户与所述共同邻居之间的关系、所述获取的用户与所述共同邻居之间的关系、以及所述共同邻居对应的节点数,并结合设置的权重,计算所述用户与所述获取的用户之间的相似值。
10.根据权利要求6所述的方法,其特征在于,所述用户物品关系图是按照如下过程生成的:
根据所述知识图谱,获取所述用户与物品之间的关系;
根据所述用户与物品之间的关系,结合设置的权重,计算用户与物品之间的关联值;
根据所述用户与物品之间的关联值,生成所述用户物品关系图。
11.根据权利要求1至4任一所述的方法,其特征在于,所述图神经网络算法为GraphSAGE算法。
12.一种物品推荐装置,其特征在于,包括:
获取模块,用于获取业务场景数据,其中,所述业务场景数据中包含待推荐物品;
判断模块,用于判断所述业务场景数据中是否包含种子用户,其中,所述种子用户为已经对所述待推荐物品进行操作的用户;
第一确定模块,用于若是,则基于知识图谱和图神经网络算法,获取所述种子用户对应的相似用户,确定所述相似用户为可扩展用户;
第二确定模块,用于若否,则基于所述知识图谱,获取所述待推荐物品对应的相似物品,确定所述相似物品对应的邻居用户为可扩展用户;
推荐模块,用于将所述待推荐物品推荐至所述可扩展用户。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-11中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110260190.0A CN112950321A (zh) | 2021-03-10 | 2021-03-10 | 一种物品推荐方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110260190.0A CN112950321A (zh) | 2021-03-10 | 2021-03-10 | 一种物品推荐方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112950321A true CN112950321A (zh) | 2021-06-11 |
Family
ID=76229112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110260190.0A Pending CN112950321A (zh) | 2021-03-10 | 2021-03-10 | 一种物品推荐方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112950321A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113688329A (zh) * | 2021-08-25 | 2021-11-23 | 平安国际智慧城市科技股份有限公司 | 基于医疗服务的信息推送方法、装置、设备及存储介质 |
EP4254298A1 (en) * | 2022-03-29 | 2023-10-04 | Rakuten Group, Inc. | Information processing apparatus, information processing method, and program thereof |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017084362A1 (zh) * | 2015-11-18 | 2017-05-26 | 百度在线网络技术(北京)有限公司 | 模型生成方法、推荐方法及对应装置、设备和存储介质 |
CN108733798A (zh) * | 2018-05-17 | 2018-11-02 | 电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN110929136A (zh) * | 2018-08-30 | 2020-03-27 | 北京京东尚科信息技术有限公司 | 一种个性化推荐方法和装置 |
CN110955834A (zh) * | 2019-11-27 | 2020-04-03 | 西北工业大学 | 一种知识图谱驱动的个性化精准推荐方法 |
CN111539786A (zh) * | 2020-04-15 | 2020-08-14 | 清华大学 | 条件注意力网络及其在个性化推荐中的应用方法及装置 |
CN111651678A (zh) * | 2020-06-18 | 2020-09-11 | 达而观信息科技(上海)有限公司 | 一种基于知识图谱的个性化推荐方法 |
CN111784455A (zh) * | 2020-06-30 | 2020-10-16 | 腾讯科技(深圳)有限公司 | 一种物品推荐方法及推荐设备 |
CN112101984A (zh) * | 2020-08-16 | 2020-12-18 | 复旦大学 | 一种融合用户微观行为和知识图谱的会话推荐模型 |
-
2021
- 2021-03-10 CN CN202110260190.0A patent/CN112950321A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017084362A1 (zh) * | 2015-11-18 | 2017-05-26 | 百度在线网络技术(北京)有限公司 | 模型生成方法、推荐方法及对应装置、设备和存储介质 |
CN108733798A (zh) * | 2018-05-17 | 2018-11-02 | 电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN110929136A (zh) * | 2018-08-30 | 2020-03-27 | 北京京东尚科信息技术有限公司 | 一种个性化推荐方法和装置 |
CN110955834A (zh) * | 2019-11-27 | 2020-04-03 | 西北工业大学 | 一种知识图谱驱动的个性化精准推荐方法 |
CN111539786A (zh) * | 2020-04-15 | 2020-08-14 | 清华大学 | 条件注意力网络及其在个性化推荐中的应用方法及装置 |
CN111651678A (zh) * | 2020-06-18 | 2020-09-11 | 达而观信息科技(上海)有限公司 | 一种基于知识图谱的个性化推荐方法 |
CN111784455A (zh) * | 2020-06-30 | 2020-10-16 | 腾讯科技(深圳)有限公司 | 一种物品推荐方法及推荐设备 |
CN112101984A (zh) * | 2020-08-16 | 2020-12-18 | 复旦大学 | 一种融合用户微观行为和知识图谱的会话推荐模型 |
Non-Patent Citations (2)
Title |
---|
刘君良;李晓光;: "个性化推荐系统技术进展", 计算机科学, no. 07, pages 52 - 60 * |
吴国栋;查志康;涂立静;陶鸿;宋福根;: "图神经网络推荐研究进展", 智能系统学报, no. 01, pages 20 - 30 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113688329A (zh) * | 2021-08-25 | 2021-11-23 | 平安国际智慧城市科技股份有限公司 | 基于医疗服务的信息推送方法、装置、设备及存储介质 |
EP4254298A1 (en) * | 2022-03-29 | 2023-10-04 | Rakuten Group, Inc. | Information processing apparatus, information processing method, and program thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180342004A1 (en) | Cumulative success-based recommendations for repeat users | |
Costa-Montenegro et al. | Which App? A recommender system of applications in markets: Implementation of the service for monitoring users’ interaction | |
CN109829116B (zh) | 一种内容推荐方法、装置、服务器及计算机可读存储介质 | |
CN109471978B (zh) | 一种电子资源推荐方法及装置 | |
EP4242955A1 (en) | User profile-based object recommendation method and device | |
CN109034853B (zh) | 基于种子用户寻找相似用户方法、装置、介质和电子设备 | |
CN112182360A (zh) | 具有有限数据可用性的个性化推荐器 | |
CN110555172A (zh) | 用户关系挖掘方法及装置、电子设备和存储介质 | |
CN112950321A (zh) | 一种物品推荐方法和装置 | |
CN111783810A (zh) | 用于确定用户的属性信息的方法和装置 | |
Hao et al. | Mobile cloud services recommendation: a soft set-based approach | |
CN110399564B (zh) | 帐号分类方法和装置、存储介质及电子装置 | |
CN115423555A (zh) | 一种商品推荐方法、装置、电子设备及存储介质 | |
CN112749323A (zh) | 一种构建用户画像的方法和装置 | |
CN113610610B (zh) | 基于图神经网络和评论相似度的会话推荐方法和系统 | |
US20160217490A1 (en) | Automatic Computation of Keyword Bids For Pay-Per-Click Advertising Campaigns and Methods and Systems Incorporating The Same | |
CN114119123A (zh) | 信息推送的方法和装置 | |
CN110490682B (zh) | 分析商品属性的方法和装置 | |
CN113495991A (zh) | 一种推荐方法和装置 | |
US20120265588A1 (en) | System and method for recommending new connections in an advertising exchange | |
CN115599990A (zh) | 一种知识感知结合深度强化学习的跨域推荐方法及系统 | |
CN111475737B (zh) | 用户推荐方法、装置、电子设备、存储介质 | |
CN113450167A (zh) | 一种商品推荐方法和装置 | |
CN113111133A (zh) | 用户分类的方法和装置 | |
CN113763080A (zh) | 推荐物品的确定方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |