CN116308687B - 基于知识图谱的商品信息推荐方法、电子设备及存储介质 - Google Patents
基于知识图谱的商品信息推荐方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116308687B CN116308687B CN202310573113.XA CN202310573113A CN116308687B CN 116308687 B CN116308687 B CN 116308687B CN 202310573113 A CN202310573113 A CN 202310573113A CN 116308687 B CN116308687 B CN 116308687B
- Authority
- CN
- China
- Prior art keywords
- store
- category
- stores
- user
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000006399 behavior Effects 0.000 claims description 55
- 239000013598 vector Substances 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 41
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101150064138 MAP1 gene Proteins 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 101150077939 mapA gene Proteins 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及互联网技术领域,公开了一种基于知识图谱的商品信息推荐方法、电子设备及存储介质。通过构建以店铺和用户为节点的第一图谱,第一图谱中的边设置在具有访问关系的用户和店铺之间,每个边赋予第一权重值;构建第二图谱;第二图谱中的节点为第一图谱中的各店铺和用户集,第二图谱中的边设置在具有访问关系的用户集和店铺之间,每个边赋予第二权重值;保留第二图谱中呈闭环连接的所有环形图形成第三图谱,确定第三图谱中相邻两个店铺之间对应的店铺类别访问顺序;选择一个环形图中的店铺类别作为第一候选店铺类别;将所属第一候选店铺类别的店铺中的商品信息推荐给目标用户,以实现主动向用户推荐商品信息的目的。
Description
技术领域
本发明实施例涉及互联网技术领域,特别涉及一种基于知识图谱的商品信息推荐方法、电子设备及存储介质。
背景技术
随着电商平台不断向用户提供完善、便捷和高效的销售服务,越来越多的用户更偏向在电商平台购买商品。电商平台相对于传统实体商店具备一个明显优点就是可以同时展示、销售的商品种类不受限制。但同时,由于电商平台上入驻的店铺很多、可选择的商品也很多,这给用户在寻找商品时带来一定烦恼。为此,很多电商平台会主动向用户推荐商品,用户若对推荐的商品感兴趣,便可快速进入购买环节,不仅为用户提供了购物便利,而且增加了电商平台的销售业绩。
目前,商品推荐的方法一般是通过用户历史搜索过的关键词或已经浏览过的商品信息在电商平台的数据库中检索,把检索到的商品作为推荐商品推荐给用户。然而,电商平台使用的检索服务一般是基于商品的分类搭建的,这样容易导致最后推荐给用户的商品仅仅是该用户以往购买过或者与购买过的是相同类别的商品,对于普通用户来说再次购买这些商品的可能性较低,而且这种推荐商品的方式也不利于对该用户在其他类别商品的购买环节的挖掘,从而使得商品推荐的成功率较低。
发明内容
本发明实施方式的目的在于提供一种基于知识图谱的商品信息推荐方法、电子设备及存储介质,能够向用户提供贴合用户需求的种类多样化的商品,提高商品推荐的成功率。
为解决上述技术问题,本发明的实施方式提供了一种基于知识图谱的商品信息推荐方法,包括:
对电商平台上入驻的店铺的特征信息进行聚类,确定每个店铺所属的店铺类别;
获取用户在所述电商平台上访问店铺时的行为信息;
构建以所述店铺和所述用户为节点的第一图谱,所述第一图谱中的边设置在具有访问关系的用户和店铺之间,每个边赋予第一权重值,所述第一权重值通过该边所对应的访问关系中的行为信息所反映的用户对店铺的偏好度确定;
针对所述第一图谱中每两个店铺,统计与所述两个店铺之间均存在有边的第一用户组建用户集;
构建第二图谱;所述第二图谱中的节点为所述第一图谱中的各店铺和组建得到的各用户集,所述第二图谱中的边设置在具有访问关系的用户集和店铺之间,每个边赋予第二权重值,该第二权重值为该边所包含的所有用户与店铺之间对应边的第一权重值之和;
保留所述第二图谱中呈闭环连接的所有环形图形成第三图谱,确定所述第三图谱中相邻两个店铺之间对应的店铺类别访问顺序;
根据目标用户在所述电商平台最近访问的店铺的特征信息和各所述店铺类别包含的店铺的特征信息之间的相似度,确定目标用户在所述电商平台最近访问的店铺类别,以及相邻访问的两个店铺对应的店铺类别访问顺序;
根据位于所述第三图谱的各所述环形图中的和所述目标用户最近访问的两组店铺类别之间的相似度和两组店铺类别的店铺类别访问顺序之间的相似度,选择一个所述环形图中所包含的店铺类别作为第一候选店铺类别;
将所属所述第一候选店铺类别的店铺中的商品信息推荐给所述目标用户。
本发明的实施方式还提供了一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的基于知识图谱的商品信息推荐方法。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的基于知识图谱的商品信息推荐方法。
本发明实施方式相对于现有技术而言,通过对电商平台上入驻的店铺的特征信息进行聚类,确定每个店铺所属的店铺类别;获取用户在电商平台上访问店铺时的行为信息;构建以店铺和用户为节点的第一图谱,第一图谱中的边设置在具有访问关系的用户和店铺之间,每个边赋予第一权重值,第一权重值通过该边所对应的访问关系中的行为信息所反映的用户对店铺的偏好度确定;针对第一图谱中每两个店铺,统计与两个店铺之间均存在有边的第一用户组建用户集;构建第二图谱;第二图谱中的节点为第一图谱中的各店铺和组建得到的各用户集,第二图谱中的边设置在具有访问关系的用户集和店铺之间,每个边赋予第二权重值,该第二权重值为该边所包含的所有用户与店铺对应边的第一权重值之和;保留第二图谱中呈闭环连接的所有环形图形成第三图谱,确定第三图谱中相邻两个店铺之间对应的店铺类别访问顺序;根据目标用户在电商平台最近访问的店铺的特征信息和各店铺类别包含的店铺的特征信息之间的相似度,确定目标用户在电商平台最近访问的店铺类别,以及相邻访问的两个店铺对应的店铺类别访问顺序;根据位于第三图谱的各环形图中的和所述目标用户最近访问的两组店铺类别之间的相似度和两组店铺类别的店铺类别访问顺序之间的相似度,选择一个环形图中所包含的店铺类别作为第一候选店铺类别;将所属第一候选店铺类别的店铺中的商品信息推荐给目标用户,以实现主动向用户推荐商品信息的目的。本方案中利用每个用户可以顺序访问多个店铺,而每个店铺又可以同时被多个用户同时访问的这种关联传递方式生成图谱,实现通过多个用户群将多个店铺关联形成环形图、进而根据店铺所属的店铺类别将多种店铺类型进行关联形成环形图,而这种闭环图恰恰体现了店铺之间、店铺类型之间隐含的关联访问的时间顺序关系;因此在确定目标用户也存在与环形图中店铺类别相似和店铺类别访问顺序相似的访问店铺经历时,可以及时向目标用户提供环形图中涵盖的店铺类别的店铺中的商品信息;以店铺类别为推荐维度相较于以商品为推荐维度所推荐的商品信息内容会更丰富,甚至可以跨越目标用户近期访问的所有商品类别,从而向用户提供贴合用户需求的种类更多样化的商品,提高商品推荐的成功率。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据本发明实施方式的基于知识图谱的商品信息推荐方法的具体流程图;
图2是根据本发明实施方式的第一图谱的结构示意图;
图3是根据本发明实施方式的行为特征向量的组成示意图;
图4是根据本发明实施方式的第二图谱的结构示意图;
图5是根据本发明实施方式的第三图谱的结构示意图;
图6是根据本发明实施方式的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的一实施方式涉及一种基于知识图谱的商品信息推荐方法,其执行主体为电商平台或者与电商平台通过网络通信连接的服务器。如图1所示,本实施例提供的基于知识图谱的商品信息推荐方法包括如下步骤。
步骤101:对电商平台上入驻的店铺的特征信息进行聚类,确定每个店铺所属的店铺类别。
其中,店铺的特征信息可以是用于描述店铺特点的信息,例如包括但不局限于店铺的经营类目,店铺所经营商品的商品类别、商品风格、价格区间、适用场景等维度的信息。
电商平台可以从电商平台的卖家系统中,通过获取卖家在系统平台注册店铺时的注册数据、卖家日常经营店铺产生的日志数据和/或直接对店铺经营页面的文字、图片等信息内容进行图像识别、文字提取的方式,获取上述用于描述店铺特点的各维度的文字信息,将各维度的文字信息进行拼接组合从而形成每个店铺的特征信息。
具体地,电商平台在获取到电商平台上入驻的所有或者部分店铺的特征信息后,可以根据特征信息之间的相似性,将这些店铺进行聚类,从而将这些店铺分别划分到聚类后一个的店铺类别中。本实施例中对聚类过程使用的聚类算法不做限定,例如可以采用划分法、层次法、密度算法、图论聚类法、网格算法、模型算法等。其中业界最常用的是划分法中的K-MEANS算法。
在一个例子中,对电商平台上入驻的店铺的特征信息进行聚类,确定每个店铺所属的店铺类别的过程可通过如下步骤实现。
步骤一:对电商平台上入驻的各店铺的特征信息进行编码形成店铺特征向量。
具体地,对电商平台上入驻的各店铺的特征信息进行编码采用的编码方式可以包括但不局限于one-hot、word2Vec等编码方式;对店铺的特征信息中每个维度的特征信息分别进行编码,然后将各维度对应的编码后的数字码按一定顺序进行拼接,从而形成一个多维向量,该多维向量被作为相应店铺对应的店铺特征向量。
步骤二:对各店铺的店铺特征向量进行聚类,得到多个店铺类别和每个店铺类别对应的店铺类别中心向量,标注各店铺所属的店铺类别。
具体地,可将各店铺对应的店铺特征向量在多维空间坐标系中对应的坐标点进行聚类,确定出多个类别空间区域,每个类别空间区域对应一个店铺类别(可以对每个店铺类别进行编号,如店铺类别1、店铺类别2,…)、每个类别空间区域的中心点对应的店铺特征向量作为该店铺类别的店铺类别中心向量。位于类别空间区域中的店铺特征向量对应的店铺所属于该类别空间对应的店铺类别。基于此,在对各店铺的店铺特征向量进行聚类后,可确定和标注出各店铺所属的店铺类别。
在本例子中,采用聚类的方式确定每个店铺所属的店铺类别既快速又准确。
步骤102:获取用户在电商平台上访问店铺时的行为信息。
其中,用户在电商平台上访问店铺时可以对店铺进行多种不同的行为操作,这些行为操作基于操作内容的不同大致可以分为但不局限于如下行为类别:成功购买、加购物车、关注店铺、收藏商品、浏览商品、退换货和投诉。其中成功购买、加购物车、关注店铺、收藏商品、浏览商品都是用户对店铺具有的情感上积极、满意的行为操作,这些行为类别相对反映出了用户对于店铺的较好的偏好度;而其中退换货和投诉都是用户对店铺具有的情感上消极、不满意的行为操作,这些行为类别相对反映出了用户对于店铺的较不好甚至是反感负向的偏好度。
具体地,电商平台可以从买家系统中通过爬取买家访问店铺时产生的日志数据和/或直接对买家访问的商品页面的文字、图片等信息内容进行图像识别、文字提取的方式,获取上述用于描述用户访问店铺时的各行为类别的行为信息,将各行为类别的文字信息进行拼接组合从而形成用户在访问店铺时的行为信息。
步骤103:构建以店铺和用户为节点的第一图谱,第一图谱中的边设置在具有访问关系的用户和店铺之间,每个边赋予第一权重值,第一权重值通过该边所对应的访问关系中的行为信息所反映的用户对店铺的偏好度确定。
如图2所示,为本步骤中所构建的第一图谱的样例图,图中S1~ S5分别为店铺、P1~P5分别为用户。从图中可以看出,第一图谱中的边仅设置出现在具有访问关系的用户和店铺之间,而店铺和店铺之间、用户和用户之间是不存在边(访问关系)的。每个边根据该边所对应的用户访问店铺的行为信息所反映的用户对店铺的偏好度可以设置一权重值,即第一权重值。第一权重值体现了用户对店铺的偏好度,当第一权重值取正值时,表征用户是喜好该店铺的,而且正值越大表征用户喜好该店铺的程度越深;反之,当第一权重值取负值时,表征用户是不喜好该店铺的,而且负值的绝对值越大表征用户不喜好该店铺的程度越深。第一权重值取0,表征用户既不喜好也不讨厌该店铺。用户针对店铺执行不同行为类别的操作时所体现的用户对该店铺喜好或者不喜好的程度不同,例如各行为类别对应的偏好度从好到坏的排序可以是:成功购买>加购物车>关注店铺>收藏商品>浏览商品>退换货>投诉。通过将用户访问店铺时的行为操作所属的行为类别所对应的偏好度进行量化叠加即可得到第一权重值,进而通过第一权重值反映用户对该店铺的偏好度,偏好度越好对应的第一权重值越大,偏好度越不好对应的第一权重值越小,甚至为负值。
在一个例子中,行为信息所反映的用户对店铺的偏好度可通过以下过程确定。
步骤一:对用户访问店铺的行为信息按访问店铺的行为类别依次进行编码和拼接形成用户访问店铺的行为特征向量;访问店铺的行为类别至少包括:成功购买、加购物车、关注店铺、收藏商品、浏览商品、退换货和投诉;每个行为类别所对应的编码值为该行为类别的执行次数。
具体地,从用户访问店铺的行为信息中统计访问该店铺的行为类别的执行次数,例如:成功购买(10次)、加购物车(12次)、关注店铺(1次)、收藏商品(23次)、浏览商品(7次)、退换货(1次)和投诉(0次);然后以各行为类别的执行次数作为编码值依次进行编码和拼接从而得到如图3所示的用户访问店铺的行为特征向量(10120123070100)。该特征向量中每个行为类别的执行次数用两位数字进行表示(形如XX),在具体应用场景中可以各行为类别中的最大执行次数来确定表示执行次数的位数,本实施例对此不做限制。
步骤二:将行为特征向量中各行为类别的编码值与预设的各行为类别对应的权重系数进行加权计算,并将得到的权值作为用户对店铺的偏好度。
例如,根据前述各行为类别对应的偏好度从好到坏的排序可以定义各行为类别对应的权重系数的排序与偏好度的排序一致,即权重系数排序为:成功购买(0.5)>加购物车(0.4)>关注店铺(0.3)>收藏商品(0.2)>浏览商品(0.1)>0>退换货(-0.1)>投诉(-0.2),沿用图3中的例子,将行为特征向量(10120123070100)中各行为类别的编码值与预设的各行为类别对应的权重系数进行加权计算,并将得到的权值(如加权平均值或者加权和值)作为用户对店铺的偏好度,从而实现偏好度的量化。
步骤104:针对第一图谱中每两个店铺,统计与两个店铺之间均存在有边的第一用户组建用户集。
例如针对图2中的第一图谱,可以对其中每两个店铺之间均存在有边的用户,即第一用户进行统计,统计结果为:S1和S2之间存在P2、S1和S4之间存在P5、S1和S5之间存在P1、S4和S5之间存在P3和P4、S3和S5之间存在P3。如此,可以形成5个用户集,其分别包含的用户为:P2、P5、P1、(P3和P4)、P3。
步骤105:构建第二图谱;第二图谱中的节点为第一图谱中的各店铺和组建得到的各用户集,第二图谱中的边设置在具有访问关系的用户集和店铺之间,每个边赋予第二权重值,该第二权重值为该边所包含的所有用户与店铺之间对应边的第一权重值之和。
例如,沿用图2中第一图谱的例子,基于该第一图谱所构建的第二图谱如图4所示,图4中第二图谱中的节点包括第一图谱中的所有店铺:S1~ S5,以及在上一步骤104中组建的5个用户集:P2、P5、P1、(P3和P4)、P3。需要说明的以P2为例,在图2和图4中均出现了P2这个节点,但其在不同图中表达的含义不同,在图2中P2表示一个用户P2作为一个节点,在图4中表示一个用户集作为一个节点,该用户集仅包含一个用户P2。
相应的,第二图谱中的边将维持图2中的访问关系,即仅设置在具有访问关系的用户集和店铺之间,唯一区别的是图2中每个用户对应一个边,图4中是以用户集为单位对应一个边,例如P3和P4所组建的用户集整体与店铺S4和店铺S5之间分别具有一个边。图4中每个边被赋予第二权重值,该第二权重值为该边所包含的所有用户与店铺之间对应边的第一权重值之和。例如图4中,用户集P1与S1之间的边所被赋的第二权重值等于图2中用户P1与S1之间边的第一权重值(图4中用户集P1仅包含一个用户P1),而图4中用户集(P3、P4)与S4之间的边所被赋的第二权重值等于图2中用户P3与S4之间边的第一权重值加上用户P4与S4之间边的第一权重值的和值(图4中用户集节点(P3、P4)包含两个用户P3和P4。
步骤106:保留第二图谱中呈闭环连接的所有环形图形成第三图谱,确定第三图谱中相邻两个店铺之间对应的店铺类别访问顺序。
例如以图4中的第二图谱为例,保留其中呈闭环连接的所有环形图,包括环形图中的节点已经节点之间的边,被保留的部分如图5所示,保留下来的图谱被作为第三图谱。可以看出,图5中的第三图普中包含三个环形图,其分别是:P1、S1、P5、S4、(P3、P4)、S5,P1、S1、P5、S4、P3、S5,S4、P3、S5、(P3、P4)所形成的三个环形图。
每个店铺都所属某一个店铺类别,根据第三图谱中每相邻两个店铺之间的用户集中的用户整体访问这两个店铺的先后顺序,将该先后顺序可以确定为这两个店铺的访问顺序,而根据两个店铺各自所属的店铺类别又可以确定出一组店铺类别访问顺序。
在实际应用场景中还可以通过其他方式,比如提取用户集中部分重要用户整体访问这两个店铺的先后顺序来确定这两个店铺对应的店铺类别访问顺序,或者直接按环形图的一个环绕方向默认指定这两个店铺对应的店铺类别访问顺序。总之,本实施例中对确定第三图谱中相邻两个店铺之间对应的店铺类别访问顺序的方法和结果均不做限定。
在一个例子中,保留第二图谱中呈闭环连接的所有环形图形成第三图谱,确定第三图谱中相邻两个店铺之间对应的店铺类别访问顺序的过程可通过如下步骤实现。
步骤一:保留第二图谱中呈闭环连接的且包含至少三个用户集的环形图形成第三图谱。
具体地,在执行上述保留方案时,可以保留第二图谱中呈闭环连接的且包含至少三个用户集的环形图形成第三图谱。选择保留包含至少三个用户集的环形图形成第三图谱,可以更加丰富第三图谱中每个环形图所能涵盖的店铺类型。
例如图4中,如果选择保留包含至少三个用户集的环形图,那么最终保留的仅是图5中由P1、S1、P5、S4、P3、S5所形成的环形图。
步骤二:根据环形图中相邻两个店铺之间的用户集中的用户访问该两个店铺的时间顺序确定该两个店铺之间的店铺访问顺序,并根据该两个店铺的店铺类别确定该两个店铺之间的店铺类别访问顺序。
具体地,在上述众多确定第三图谱中相邻两个店铺之间对应的店铺类别访问顺序的方式中,可以先根据环形图中相邻两个店铺之间的用户集中的用户访问该两个店铺的时间顺序确定该两个店铺之间的店铺访问顺序,然后再根据该两个店铺的店铺类别确定该两个店铺之间的店铺类别访问顺序。
在一个例子中,上述根据环形图中相邻两个店铺之间的用户集中的用户访问该两个店铺的时间顺序确定该两个店铺之间的店铺访问顺序的过程可通过如下步骤实现:
步骤a:比较环形图中相邻两个店铺之间的用户集中用户访问该两个店铺的时间顺序的次数差值。
例如,环形图中连接某两个店铺(店铺1、店铺2)的用户集中包括10个用户,该10个用户访问这两个店铺的时间顺序中,先访问店铺1再访问店铺2的这个时间顺序对应的访问次数为m次,先访问店铺2再访问店铺1的这个时间顺序对应的访问次数为n次(m+n=10)。则用户访问该两个店铺的时间顺序的次数差值为|m-n|。其中|*|为对*取绝对值。
步骤b:如果次数差值大于第二阈值,则选择次数较多的用户访问该两个店铺的时间顺序作为该两个店铺之间的店铺访问顺序;如果次数差值不大于第二阈值,则选择用户访问该两个店铺的两个时间顺序分别作为该两个店铺之间的店铺访问顺序。
例如该次数差值可以取4次,如果上述次数差值|m-n|大于4次,则说明访问该两个店铺1和店铺2店铺的时间顺序彼此相差悬殊,用户集有明确的店铺访问顺序,此时应遵循该店铺访问顺序,即选择次数较多的用户访问该两个店铺的时间顺序作为该两个店铺之间的店铺访问顺序。例如m-n>4,则选择m所对应的先访问店铺1再访问店铺2的这个时间顺序作为店铺1和店铺2之间的店铺访问顺序。如果上述次数差值|m-n|不大于4次,则说明访问该两个店铺1和店铺2店铺的时间顺序彼此相差不大,用户集没有明确的店铺访问顺序,此时应平等选择这两个店铺访问顺序,即将用户访问该两个店铺的时间顺序均作为该两个店铺之间的店铺访问顺序。例如m-n≤5,则选择先访问店铺1再访问店铺2以及先访问店铺2再访问店铺1这两个时间顺序作为店铺1和店铺2之间的店铺访问顺序。
步骤107:根据目标用户在电商平台最近访问的店铺的特征信息和各店铺类别包含的店铺的特征信息之间的相似度,确定目标用户在电商平台最近访问的店铺类别,以及相访问的两个店铺对应的店铺类别访问顺序。
其中,目标用户可以为在电商平台上注册的任一用户,电商平台可以定期采取目标用户在电商平台近期访问的店铺的特征信息,并确定访问的这些店铺所属的店铺类别。其中关于目标用户访问的店铺的特征信息的采集过程可参考前面关于店铺的特征信息的采集过程。将这些店铺的特征信息与前面的聚类形成的各店铺类别中所包含的店铺的特征信息进行相似度比较,可以确定出目标用户访问的这些店铺所属的店铺类别。例如可将目标用户访问的这些店铺得特征信息经前述的编码和拼接形成店铺特征向量,然后将这些店铺特征向量分别与上述各每个店铺类别对应的店铺类别中心向量进行相似度比较,确定目标用户访问的这些店铺所属的店铺类别。
步骤108:根据位于第三图谱的各所述环形图中的和目标用户最近访问的两组店铺类别之间的相似度和两组店铺类别的店铺类别访问顺序之间的相似度,选择一个环形图中所包含的店铺类别作为第一候选店铺类别。
具体地,可以将第三图谱中的各环形图中所包含的店铺类别,与目标用户最近访问的所有店铺类别之间进行相似度比较,确定出最为相似的多个环形图;同时将第三图谱中的各环形图中所包含的店铺类别之间的店铺类别访问顺序,与目标用户最近访问的所有店铺类别之间的店铺类别访问顺序之间进行相似度比较,确定出最为相似的多个环形图;然后综合考虑经过这两个相似度比较过程所确定的环形图,从所有确定出的环形图中选择一个环形图,并在选择的环形图所包含的店铺类别中选择一个店铺类别作为第一候选店铺类别。
在一个例子中,本步骤可通过如下过程确定第一候选店铺类别。
步骤一:选择两组店铺类别之间的相似度和两组店铺类别的所述店铺类别访问顺序之间的相似度中整体相似度最大的多个环形图,从多个环形图中选择一个包含目标用户最近访问的最后一个店铺类别的环形图作为候选环形图。
具体的,在经过上述两个相似度比较过程后,遵循整体相似度最高的原则,从确定的两组环形图中分别提取相同或者相似的一对或者多对环形图(每对环形图包含两个环形图且两个环形图分别来自上述两组环形图中),从这一对或者多对环形图中选择一个包含目标用户最近访问的最后一个店铺类别的环形图(该环形图中的至少一个店铺节点属于该店铺类别)作为候选环形图。
在一个例子中,确定候选环形图的过程可以是:
c,选择上述两组店铺类别之间的相似度和所述两组店铺类别的所述店铺类别访问顺序之间的相似度中整体相似度最大的多个环形图,该多个环形图中均包含所述目标用户最近访问的最后一个店铺类别,且与所述最后一个店铺类别具有店铺类别访问顺序的店铺类别位于在后顺位。
作为上述过程的进一步优化,在确定上述多个环形图时,除了可以明确限定该多个环形图中均包含目标用户最近访问的最后一个店铺类别之外,还可以限定与该最后一个店铺类别具有店铺类别访问顺序的店铺类别位于在后顺位。即在该店铺类别访问顺序中是先访问该最后一个店铺类别,而后再访问与该最后一个店铺类别具有店铺类别访问顺序的另一个店铺类别。
d,从上述多个环形图中选择一个环形图作为候选环形图。
具体地,在经过步骤c之后确定的多个环形图中,选择一个环形图作为候选环形图。
步骤二:从候选环形图中选择与最后一个店铺类别具有店铺类别访问顺序的店铺类别作为第一候选店铺类别。
具体地,从候选环形图中确定与上述最后一个店铺类别具有店铺类别访问顺序的所有店铺类别,然后从中选择一个店铺类别作为第一候选店铺类别。
可优化的,在上述步骤c、d的基础上,从候选环形图中选择与最后一个店铺类别具有店铺类别访问顺序的店铺类别作为第一候选店铺类别,可以是从该候选环形图中选择与最后一个店铺类别具有店铺类别访问顺序且位于在后顺位的店铺类别作为所述第一候选店铺类别。
具体地,可以从上述候选环形图中选择与上述最后一个店铺类别具有店铺类别访问顺序且位于在后顺位的店铺类别作为第一候选店铺类别。这样就可以更加遵循实际的店铺类别访问顺序进行后续店铺中商品信息的推荐。
步骤109:将所属第一候选店铺类别的店铺中的商品信息推荐给目标用户。
具体地,根据已分类的各店铺类别中所包含的店铺,可以在所属第一候选店铺类别的店铺中选择具体的商品信息推荐给目标用户,具体是推荐到目标用户在电商平台所使用的账号页面中。
此外作为补充,在将所属第一候选店铺类别的店铺中的商品信息推荐给目标用户之后,还可以执行:从候选环形图中选择第一候选店铺类别以外的其他店铺类别作为第二候选店铺类别;并将所属第二候选店铺类别的店铺中的商品信息推荐给目标用户,从而更加丰富所推荐的店铺类别所对应的店铺中的商品信息。
相较于相关技术,本实施例中利用每个用户可以顺序访问多个店铺,而每个店铺又可以同时被多个用户同时访问的这种关联传递方式生成图谱,实现通过多个用户群将多个店铺关联形成闭环图、进而根据店铺所属的店铺类别将多种店铺类型进行关联形成闭环图,而这种闭环图恰恰体现了店铺之间、店铺类型之间隐含的关联访问的时间顺序关系;因此在确定目标用户也存在与闭环图中店铺类别相似和店铺类别访问顺序相似的访问店铺经历时,可以及时向目标用户提供闭环图中涵盖的店铺类别的店铺中的商品信息;以店铺类别为推荐维度相较于以商品为推荐维度所推荐的商品信息内容会更丰富,甚至可以跨越目标用户近期访问的所有商品类别,从而向用户提供贴合用户需求的种类更多样化的商品,提高商品推荐的成功率。
本发明的另一实施方式涉及一种电子设备,如图6所示,包括至少一个处理器202;以及,与至少一个处理器202通信连接的存储器201;其中,存储器201存储有可被至少一个处理器202执行的指令,指令被至少一个处理器202执行,以使至少一个处理器202能够执行上述任一方法实施例。
其中,存储器201和处理器202采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器202和存储器201的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器202处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器202。
处理器202负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器201可以被用于存储处理器202在执行操作时所使用的数据。
本发明另一实施例涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (10)
1.一种基于知识图谱的商品信息推荐方法,其特征在于,包括:
对电商平台上入驻的店铺的特征信息进行聚类,确定每个店铺所属的店铺类别;
获取用户在所述电商平台上访问店铺时的行为信息;
构建以所述店铺和所述用户为节点的第一图谱,所述第一图谱中的边设置在具有访问关系的用户和店铺之间,每个边赋予第一权重值,所述第一权重值通过该边所对应的访问关系中的行为信息所反映的用户对店铺的偏好度确定;
针对所述第一图谱中每两个店铺,统计与所述两个店铺之间均存在有边的第一用户组建用户集;
构建第二图谱;所述第二图谱中的节点为所述第一图谱中的各店铺和组建得到的各用户集,所述第二图谱中的边设置在具有访问关系的用户集和店铺之间,每个边赋予第二权重值,该第二权重值为该边所包含的所有用户与店铺之间对应边的第一权重值之和;
保留所述第二图谱中呈闭环连接的所有环形图形成第三图谱,确定所述第三图谱中相邻两个店铺之间对应的店铺类别访问顺序;
根据目标用户在所述电商平台最近访问的店铺的特征信息和各所述店铺类别包含的店铺的特征信息之间的相似度,确定目标用户在所述电商平台最近访问的店铺类别,以及相邻访问的两个店铺对应的店铺类别访问顺序;
根据位于所述第三图谱的各所述环形图中的和所述目标用户最近访问的两组店铺类别之间的相似度和两组店铺类别的店铺类别访问顺序之间的相似度,选择一个所述环形图中所包含的店铺类别作为第一候选店铺类别;
将所属所述第一候选店铺类别的店铺中的商品信息推荐给所述目标用户。
2.根据权利要求1所述的方法,其特征在于,所述对电商平台上入驻的店铺的特征信息进行聚类,确定每个店铺所属的店铺类别,包括:
对电商平台上入驻的各店铺的所述特征信息进行编码形成店铺特征向量;
对各店铺的所述店铺特征向量进行聚类,得到多个店铺类别和每个店铺类别对应的店铺类别中心向量,标注各店铺所属的店铺类别。
3.根据权利要求2所述的方法,其特征在于,所述行为信息所反映的用户对店铺的偏好度通过以下过程确定:
对用户访问店铺的所述行为信息按访问店铺的行为类别依次进行编码和拼接形成用户访问店铺的行为特征向量;所述访问店铺的行为类别至少包括:成功购买、加购物车、关注店铺、收藏商品、浏览商品、退换货和投诉;每个行为类别所对应的编码值为该行为类别的执行次数;
将所述行为特征向量中各行为类别的编码值与预设的各行为类别对应的权重系数进行加权计算,并将得到的权值作为所述用户对店铺的偏好度。
4.根据权利要求3所述的方法,其特征在于,所述保留所述第二图谱中呈闭环连接的所有环形图形成第三图谱,确定所述第三图谱中相邻两个店铺之间对应的店铺类别访问顺序,包括:
保留所述第二图谱中呈闭环连接的且包含至少三个用户集的环形图形成所述第三图谱;
根据所述环形图中相邻两个店铺之间的用户集中的用户访问该两个店铺的时间顺序确定该两个店铺之间的店铺访问顺序,并根据该两个店铺的店铺类别确定该两个店铺之间的店铺类别访问顺序。
5.根据权利要求4所述的方法,其特征在于,所述根据所述环形图中相邻两个店铺之间的用户集中的用户访问该两个店铺的时间顺序确定该两个店铺之间的店铺访问顺序,包括:
比较所述环形图中相邻两个店铺之间的用户集中用户访问该两个店铺的时间顺序的次数差值;
如果所述次数差值大于第二阈值,则选择次数较多的所述用户访问该两个店铺的时间顺序作为该两个店铺之间的店铺访问顺序;如果所述次数差值不大于所述第二阈值,则选择用户访问该两个店铺的两个时间顺序分别作为该两个店铺之间的店铺访问顺序。
6.根据权利要求5所述的方法,其特征在于,所述根据位于所述第三图谱的各所述环形图中的和所述目标用户最近访问的两组店铺类别之间的相似度和两组店铺类别的所述店铺类别访问顺序之间的相似度,选择一个所述环形图中所涵盖的店铺类别作为第一候选店铺类别,包括:
选择所述两组店铺类别之间的相似度和所述两组店铺类别的所述店铺类别访问顺序之间的相似度中整体相似度最大的多个环形图,从所述多个环形图中选择一个包含所述目标用户最近访问的最后一个店铺类别的环形图作为候选环形图;
从所述候选环形图中选择与所述最后一个店铺类别具有店铺类别访问顺序的店铺类别作为所述第一候选店铺类别。
7.根据权利要求6所述的方法,其特征在于,所述选择所述两组店铺类别之间的相似度和所述两组店铺类别的所述店铺类别访问顺序之间的相似度中整体相似度最大的多个环形图,从所述多个环形图中选择一个包含所述目标用户最近访问的最后一个店铺类别的环形图作为候选环形图,包括:
选择所述两组店铺类别之间的相似度和所述两组店铺类别的所述店铺类别访问顺序之间的相似度中整体相似度最大的多个环形图,该多个环形图中均包含所述目标用户最近访问的最后一个店铺类别,且与所述最后一个店铺类别具有店铺类别访问顺序的店铺类别位于在后顺位;
从所述多个环形图中选择一个环形图作为候选环形图;
所述从所述候选环形图中选择与所述最后一个店铺类别具有店铺类别访问顺序的店铺类别作为所述第一候选店铺类别,包括:
从所述候选环形图中选择与所述最后一个店铺类别具有店铺类别访问顺序且位于在后顺位的店铺类别作为所述第一候选店铺类别。
8.根据权利要求7所述的方法,其特征在于,所述将所属所述第一候选店铺类别的店铺中的商品信息推荐给所述目标用户之后,还包括:
从所述候选环形图中选择所述第一候选店铺类别以外的其他店铺类别作为第二候选店铺类别;
将所属所述第二候选店铺类别的店铺中的商品信息推荐给所述目标用户。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8中任一所述的基于知识图谱的商品信息推荐方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一所述的基于知识图谱的商品信息推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310573113.XA CN116308687B (zh) | 2023-05-22 | 2023-05-22 | 基于知识图谱的商品信息推荐方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310573113.XA CN116308687B (zh) | 2023-05-22 | 2023-05-22 | 基于知识图谱的商品信息推荐方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116308687A CN116308687A (zh) | 2023-06-23 |
CN116308687B true CN116308687B (zh) | 2023-07-18 |
Family
ID=86836298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310573113.XA Active CN116308687B (zh) | 2023-05-22 | 2023-05-22 | 基于知识图谱的商品信息推荐方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116308687B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021208583A1 (zh) * | 2020-04-16 | 2021-10-21 | 北京三快在线科技有限公司 | 推荐信息生成方法、装置、电子设备及可读存储介质 |
WO2022156529A1 (zh) * | 2021-01-21 | 2022-07-28 | 北京电解智科技有限公司 | 企业用户的商品推荐方法和装置 |
CN115018593A (zh) * | 2022-06-30 | 2022-09-06 | 广州欢聚时代信息科技有限公司 | 独立站点商品推荐方法及其装置、设备、介质、产品 |
CN115439192A (zh) * | 2022-10-18 | 2022-12-06 | 康键信息技术(深圳)有限公司 | 医疗商品信息的推送方法及装置、存储介质、计算机设备 |
CN115587875A (zh) * | 2022-11-10 | 2023-01-10 | 广州科拓科技有限公司 | 基于均衡感知注意力网络的纺织品电商推荐方法及装置 |
WO2023284516A1 (zh) * | 2021-07-16 | 2023-01-19 | 腾讯科技(深圳)有限公司 | 基于知识图谱的信息推荐方法、装置、设备、介质及产品 |
-
2023
- 2023-05-22 CN CN202310573113.XA patent/CN116308687B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021208583A1 (zh) * | 2020-04-16 | 2021-10-21 | 北京三快在线科技有限公司 | 推荐信息生成方法、装置、电子设备及可读存储介质 |
WO2022156529A1 (zh) * | 2021-01-21 | 2022-07-28 | 北京电解智科技有限公司 | 企业用户的商品推荐方法和装置 |
WO2023284516A1 (zh) * | 2021-07-16 | 2023-01-19 | 腾讯科技(深圳)有限公司 | 基于知识图谱的信息推荐方法、装置、设备、介质及产品 |
CN115018593A (zh) * | 2022-06-30 | 2022-09-06 | 广州欢聚时代信息科技有限公司 | 独立站点商品推荐方法及其装置、设备、介质、产品 |
CN115439192A (zh) * | 2022-10-18 | 2022-12-06 | 康键信息技术(深圳)有限公司 | 医疗商品信息的推送方法及装置、存储介质、计算机设备 |
CN115587875A (zh) * | 2022-11-10 | 2023-01-10 | 广州科拓科技有限公司 | 基于均衡感知注意力网络的纺织品电商推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116308687A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109033101B (zh) | 标签推荐方法及装置 | |
CN108108380B (zh) | 搜索排序方法、搜索排序装置、搜索方法和搜索装置 | |
CA2309940A1 (en) | System and method for dynamic profiling of users in one-to-one applications and for validating user rules | |
CN108805598A (zh) | 相似度信息确定方法、服务器及计算机可读存储介质 | |
US10896458B2 (en) | Method, system, and computer-readable medium for product and vendor selection | |
CN112102029B (zh) | 一种基于知识图谱的长尾推荐计算方法 | |
CN111949887A (zh) | 物品推荐方法、装置及计算机可读存储介质 | |
CN112907334B (zh) | 一种对象推荐方法及装置 | |
CN111400507A (zh) | 实体匹配方法及其装置 | |
CN111914188A (zh) | 推荐目标用户的选择方法、系统、设备及存储介质 | |
CN108389113B (zh) | 一种协同过滤推荐方法和系统 | |
CN111125491A (zh) | 商品信息的搜索方法和装置、存储介质及电子装置 | |
CN111310046A (zh) | 对象推荐方法及装置 | |
CN111078997A (zh) | 一种资讯推荐方法及装置 | |
US20090077093A1 (en) | Feature Discretization and Cardinality Reduction Using Collaborative Filtering Techniques | |
KR102518389B1 (ko) | 고객 빅데이터를 활용한 상품 추천 방법, 장치 및 시스템 | |
CN116308683B (zh) | 基于知识图谱的服装品牌定位推荐方法、设备及存储介质 | |
CN112036987A (zh) | 确定推荐商品的方法和装置 | |
CN116308687B (zh) | 基于知识图谱的商品信息推荐方法、电子设备及存储介质 | |
CN114282119B (zh) | 一种基于异构信息网络的科技信息资源检索方法及系统 | |
CN110781399A (zh) | 一种跨平台的信息推送方法和装置 | |
CN115860865A (zh) | 商品组合构造方法及其装置、设备、介质、产品 | |
CN111460300B (zh) | 网络内容推送方法、装置及存储介质 | |
CN110928920B (zh) | 一种基于改进位置社交的知识推荐方法、系统及存储介质 | |
CN114861079A (zh) | 一种融合商品特征的协同过滤推荐方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |