CN113822735A - 货品推荐方法、装置及存储介质和电子设备 - Google Patents
货品推荐方法、装置及存储介质和电子设备 Download PDFInfo
- Publication number
- CN113822735A CN113822735A CN202110208523.5A CN202110208523A CN113822735A CN 113822735 A CN113822735 A CN 113822735A CN 202110208523 A CN202110208523 A CN 202110208523A CN 113822735 A CN113822735 A CN 113822735A
- Authority
- CN
- China
- Prior art keywords
- goods
- item
- category
- image
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 239000013598 vector Substances 0.000 claims abstract description 100
- 238000000605 extraction Methods 0.000 claims abstract description 55
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 50
- 238000013136 deep learning model Methods 0.000 claims description 35
- 238000012549 training Methods 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 14
- 241000531116 Blitum bonus-henricus Species 0.000 claims description 10
- 235000008645 Chenopodium bonus henricus Nutrition 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Evolutionary Computation (AREA)
- Accounting & Taxation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提出货品推荐方法、装置及可读存储介质和电子设备。方法包括:预先提取可选货品集中每个货品的图像文本联合特征;当要为第一货品推荐相似货品时,采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,根据第一货品与可选货品集中每个货品的图向量特征,分别计算第一货品与可选货品集中每个货品的相似度,得到第一货品的初始推荐货品集;根据初始推荐货品集中每个货品的图像文本联合特征以及第一货品的图像文本联合特征,计算第一货品与初始推荐货品集中每个货品的相似度,按照相似度的从高到低,对初始推荐货品集中的货品进行排序,得到第一货品的最终推荐货品集。本发明实施例提高了货品推荐速度和准确性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及货品推荐方法、装置及存储介质和电子设备。
背景技术
对网购平台而言,对用户进行货品推荐是一项非常重要的内容。目前,货品推荐首选机器学习方法,主要有基于内容的货品属性、基于用户的协同过滤、混合推荐、深度学习建模等机器学习方法。
基于内容的货品属性的机器学习方法需要手工设计特征,依赖于自然语言处理的知识得到用户的偏好。
基于用户的协同过滤的机器学习方法无需依赖手工设计特征,可以通过自动学习嵌入向量,得到货品隐向量表达。旨在用统计技术寻找与目标用户有相同喜好的“邻居”,根据目标用户的社群行为,向目标用户进行推荐,可帮助用户找到新类别的有惊喜的物品。
混合推荐的机器学习方法是为了解决上述两种方法各自的缺点而产生的,但其在处理一定数据规模,多源异构数据类型以及数据噪音方面仍然有一定的局限性。
采用深度学习建模的机器学习方法,虽然能够处理多源异构数据,将非结构化数据转化为嵌入(Embedding)特征向量的表达,但货品属性的输入层表达也仅限于货品id或各级类目id,输入信息有限,因此在学习的过程中也很难对货品属性在高维空间上进行充分的表达。同时深度学习倾向于大的数据规模,且算法的可解释性较差。特别针对非结构化数据的处理,即特征向量层的引入,使得模型参数的调整更加困难。
无论采用上述任何一种机器学习方法,数据源质量在一定程度上对模型的预测结果有很大的影响,尤其是在货品规模较大且类别繁杂时对于模型的训练时间及预测结果都有一定的制约性,因此,对数据集的选择以及数据源的确定有较高要求。
发明内容
本发明实施例提出货品推荐方法、装置及可读存储介质和电子设备,以提高货品推荐速度和准确性。
本发明实施例的技术方案是这样实现的:
一种货品推荐方法,该方法包括:
预先提取可选货品集中每个货品的图像文本联合特征;
当要为第一货品推荐相似货品时,采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,根据第一货品与可选货品集中每个货品的图向量特征,计算第一货品与可选货品集中每个货品的相似度,得到第一货品的初始推荐货品集;
根据初始推荐货品集中每个货品的图像文本联合特征以及第一货品的图像文本联合特征,计算第一货品与初始推荐货品集中每个货品的相似度,按照相似度的从高到低,对初始推荐货品集中的货品进行排序,得到第一货品的最终推荐货品集。
所述预先提取可选货品集中每个货品的图像文本联合特征包括:
采用词向量特征提取算法提取可选货品集中每个货品的词向量特征;
根据每个货品的词向量特征,将可选货品集中所有货品分成多个类别,得到每个类别下的子货品集;
对每个类别下的子货品集,采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征。
所述采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征之前,进一步包括:
针对每个类别,预先采集该类别的训练集,该类别的训练集中包含该类别的多个货品的属性信息,其中,属性信息为货品的图像信息和文本信息;针对每个类别,采用该类别的训练集对深度学习模型进行训练,训练完毕,得到用于提取该类别的货品的图像文本联合特征的深度学习模型;
所述采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征包括:
对于该类别下的子货品集中每个货品,将该货品的图像信息和文本信息输入已训练好的该类别的深度学习模型,深度学习模型的输出即为该货品的图像文本联合特征。
所述深度学习模型为自编码器网络。
所述词向量特征提取算法为item2Vec算法。
所述图向量特征提取算法为Graph2Vec算法。
一种货品推荐装置,该装置包括:
图像文本联合特征提取模块,用于预先提取可选货品集中每个货品的图像文本联合特征;
推荐计算模块,用于当要为第一货品推荐相似货品时,采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,根据第一货品和可选货品集中每个货品的图向量特征,计算每个货品与第一货品的相似度,得到第一货品的初始推荐货品集;根据初始推荐货品集中每个货品的图像文本联合特征以及第一货品的图像文本联合特征,计算第一货品与初始推荐货品集中每个货品的相似度,按照相似度的从高到低,对初始推荐货品集中的货品进行排序,得到第一货品的最终推荐货品集。
所述图像文本联合特征提取模块具体用于,
采用词向量特征提取算法提取可选货品集中每个货品的词向量特征;
根据每个货品的词向量特征,将所有货品分成多个类别,得到每个类别下的子货品集;
对每个类别下的子货品集,采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征。
一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行如上任一项所述的货品推荐方法的步骤。
一种电子设备,包括如上所述的非瞬时计算机可读存储介质、以及可访问所述非瞬时计算机可读存储介质的所述处理器。
本发明实施例通过预先提取可选货品集中每个货品的图像文本联合特征,减少了货品推荐时长,且,在进行货品推荐时,先采用图向量特征提取算法提取可选货品集中每个货品的图向量特征,以获取初始货品推荐集,不仅保证了推荐货品的数据源为可选货品集中的所有货品,即保证了推荐结果的可靠性,且由于图向量特征提取算法的计算速度较快,也保证了推荐速度,之后再采用预先提取到的货品的图像文本联合特征对初始货品推荐集中的货品进行精确排序,从而进一步保证了推荐结果的可靠性和准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的货品推荐方法流程图;
图2为本发明另一实施例提供的货品推荐方法流程图;
图3为本发明实施例提供的货品的嵌入向量的可视化示意图;
图4为本发明实施例采用的自编码器网络的工作原理图;
图5为本发明又一实施例提供的货品推荐方法流程图;
图6为本发明实施例提供的货品推荐装置的结构示意图;
图7为本发明实施例提供的一种电子设备的示例性结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其他步骤或单元。
下面以具体实施例对本发明的技术方案进行详细说明。下面几个具体实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
本发明实施例提出一种货品推荐方法。预先提取可选货品集中每个货品的图像文本联合特征;当要为第一货品推荐相似货品时,采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,根据第一货品和可选货品集中每个货品的图向量特征,计算第一货品与可选货品集中每个货品的相似度,得到第一货品的初始推荐货品集;根据初始推荐货品集中每个货品的图像文本联合特征以及第一货品的图像文本联合特征,计算第一货品与初始推荐货品集中每个货品的相似度,按照相似度的从高到低,对初始推荐货品集中的货品进行排序,得到第一货品的最终推荐货品集。通过预先提取可选货品集中每个货品的图像文本联合特征,减少了货品推荐时长,且,在进行货品推荐时,先采用图向量特征提取算法提取可选货品集中每个货品的图向量特征,以获取初始货品推荐集,不仅保证了推荐货品的数据源为可选货品集中的所有货品,即保证了推荐结果的可靠性,且由于图向量特征提取算法的计算速度较快,也保证了推荐速度,之后再采用预先提取到的货品的图像文本联合特征对初始货品推荐集中的货品进行精确排序,从而进一步保证了推荐结果的可靠性和准确性。
图1为本发明一实施例提供的货品推荐方法流程图,其具体步骤如下:
步骤101:预先提取可选货品集中每个货品的图像文本联合特征。
步骤102:当要为第一货品推荐相似货品时,采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,根据第一货品和可选货品集中每个货品的图向量特征,计算第一货品与可选货品集中每个货品的相似度,得到第一货品的初始推荐货品集。
具体地,可将可选货品集中与第一货品的相似度大于预设相似度阈值的货品作为初始推荐货品,或者,在可选货品集中选择与第一货品的相似度最高的预设数目个货品作为初始推荐货品。
步骤103:根据初始推荐货品集中每个货品的图像文本联合特征以及第一货品的图像文本联合特征,计算初始推荐货品集中每个货品与第一货品的相似度,按照相似度的从高到低,对初始推荐货品集中的货品进行排序,得到第一货品的最终推荐货品集。
上述实施例的有益技术效果如下:
一、由于预先提取了可选货品集中每个货品的图像文本联合特征,因此,使得图像文本联合特征的提取过程不占用货品推荐时长,从而减少了货品推荐时长;
二、在进行货品推荐时,先采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,由于图向量特征提取算法的计算速度很快,因此虽然是对可选货品集中的每个货品都进行图向量特征提取,但仍然能够保证推荐时长的快速性;且,由于图向量特征提取算法的数据源是可选货品集中的所有货品,因此也保证了推荐的可靠性和准确性;
三、在根据图向量特征计算第一货品与可选货品集中每个货品的相似度后,得到第一货品的初始推荐货品集,然后再根据已经预先提取的货品的图像文本联合特征,对初始推荐货品集中的货品进行精确排序,得到最终推荐给用户的推荐货品集,由于图像文本联合特征能够最大化地对货品属性进行多模态的表征,因此,保证了最终推荐给用户的推荐货品集的可靠性和准确性。
从而上述实施例不仅最大化地提高了货品推荐速度,且最大化地保证了货品推荐的可靠性和准确性。
图2为本发明另一实施例提供的货品推荐方法流程图,其具体步骤如下:
步骤201:采用词向量特征提取算法提取可选货品集中每个货品的词向量特征。
这里的可选货品集可以是某一网购平台的数据库中的所有货品的集合。考虑到:很长时间内没有被任何用户浏览的货品,该货品被推荐的概率也很低,则为了减少计算量,可不对该货品进行特征提取。因此,本步骤中,可先根据用户id(标识)和会话id等,在数据库中搜索最近预设时长内(如:最近一个月内)被用户浏览的货品,对搜索到的每个货品采用词向量特征提取算法提取该货品的词向量特征。
词向量特征提取算法可以采用item2Vec算法。
步骤202:根据每个货品的词向量特征,将所有货品分成多个类别,得到每个类别下的子货品集。
例如,根据可选货品集中每个货品的词向量特征,计算货品之间的相似度,将相似度大于预设阈值的货品作为同一类别。每个类别的货品构成一个该类别的子货品集。
实际应用中,可使用余弦相似度来表示货品之间的相似度,公式如下:
其中,item_x、item_y分别表示货品x、y,Sxy表示货品x、y之间的相似度,xi、yi表示由item2vec算法求得的货品的嵌入(Embedding)向量在第i维度上的量度,n为由item2vec算法求得的货品的嵌入(Embedding)向量的总维度。
图3为货品的嵌入向量的可视化示意图,图中颜色相近的货品即为相似度高的货品,可选入同一类别。
也可通过如下方式划分货品的类别:
在可选货品集中还未划定类别的货品中随机选取一个货品item_s,则在可选货品集中剩余的还未划定类别的货品中选择与货品item_s相似度大于预设阈值或者选择相似度最高的预设数目个货品,得到与该货品属于同一类别的所有货品。
步骤203:对每个类别下的子货品集,采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征。
将每个货品的图像信息和文本信息输入到已训练好的该类别的深度学习模型,模型的输出即为该货品的图像文本联合特征。
由于采用图像、文本这些高层特征描述货品属性时,可以对货品属性进行较为精准的概括。但在实际计算时,如何将货品属性的高层表达转为底层特征,同时确保有效信息损失最小是货品属性嵌入向量计算的关键点。货品属性的来源不同,对于图像、文本分别计算得到低维空间的特征向量,在底层特征表示往往具有较大的差别。尽管目前已出现深度学习预训练视觉-语言的框架,大多数是对特定场景进行预训练的,如图文匹配或者图文问答,均可转化为有监督的学习。而本发明中,图像文本属性融合的目的是为了将货品属性信息最大化,因此是一种无监督的学习方式,因此本发明实施例中的深度学习模型可以采用自编码器网络,向量的联合表示会将多个模态的信息共同映射到一个统一的多模态向量空间。
其中,货品的文本信息包括:货品的基本信息、规格参数及扩展信息等,考虑到多模态学习中信息的互补性及有效性,本发明实施例中可以货品标题作为货品的文本信息;货品的图像信息可以货品详情页的图像表示。
图4为自编码器网络的工作原理图,如图4示,自编码器网络的训练过程如下:
将货品的图像信息和文本信息分别作为输入经过自编码器网络的编码网络进行编码,将编码之后的特征向量(图像向量+文本向量)进行拼接,然后由解码网络进行解码并分别对图像和文本进行重建,重建后的图像、文本和输入图像、文本越接近,网络越优。
经过训练过程得到编码网络,留待后续提取货品的图像文本联合特征用。此后,在提取货品的图像和文本联合特征时只需编码网络,从输入层到隐藏层,再从隐藏层到输出层,编码过程中可以获得货品的图像文本的联合表征信息,作为货品的图像文本的分布表示向量,该向量即为货品属性的多模态特征向量,本发明实施例中称为货品的图像文本联合特征。
步骤204:当要为第一货品推荐相似货品时,采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,根据第一货品和可选货品集中每个货品的图向量特征,计算第一货品与可选货品集中每个货品的相似度,得到第一货品的初始推荐货品集。
由于可选货品集中的货品的数量众多,而图向量特征提取算法的计算速度较快,因此,先采用图向量特征提取算法对可选货品集中的每个货品进行图向量特征的提取,以快速得到第一货品的初始推荐货品集。
图向量特征提取算法可以采用Graph2Vec算法。
步骤205:根据初始推荐货品集中每个货品的图像文本联合特征以及第一货品的图像文本联合特征,计算第一货品与初始推荐货品集中每个货品的相似度,按照相似度的从高到低,对初始推荐货品集中的货品进行排序,得到第一货品的最终推荐货品集。
考虑到:图向量特征提取算法虽然计算速度快,但是精确度不是特别高,而,由于初始推荐货品集中货品之间的相似度高,因此在实际的推荐场景中往往不容易区分,货品的图像文本联合特征能够对货品的特征进行多模态的表达,特征表达精确度更高,因此,步骤205中,进一步根据货品的图像文本联合特征计算第一货品与初始推荐货品集中每个货品的相似度,并根据相似度对初始推荐货品集中的货品进行排序,从而保证了推荐结果的可靠性和准确性。
图5为本发明又一实施例提供的货品推荐方法流程图,其具体步骤如下:
步骤501:针对每个类别,预先采集该类别的训练集,该类别的训练集中包含该类别的多个货品的属性信息,其中,属性信息为货品的图像信息和文本信息;针对每个类别,采用该类别的训练集对深度学习模型进行训练,训练完毕,得到用于提取该类别的货品的图像文本联合特征的深度学习模型。
深度学习模型可以采用自编码器网络。
通过对每个类别的深度学习模型分别进行训练,使得训练过程的数据规模相对较小,训练过程更加高速、高效。
步骤502:采用词向量特征提取算法提取可选货品集中每个货品的词向量特征。
这里的可选货品集可以是某一网购平台的数据库中的所有货品的集合。考虑到:很长时间内没有被任何用户浏览的货品,该货品被推荐的概率也很低,则为了减少计算量,可不对该货品进行特征提取。因此,本步骤中,可先在数据库中搜索最近预设时长内(如:最近一个月内)被用户浏览的货品,对搜索到的每个货品采用词向量特征提取算法提取该货品的词向量特征。
步骤503:根据每个货品的词向量特征,将所有货品分成多个类别,得到每个类别下的子货品集。
即,根据可选货品集中每个货品的词向量特征,计算货品之间的相似度,将相似度大于预设阈值的货品作为同一类别。每个类别的货品构成一个该类别的子货品集。
步骤504:对于每个类别下的子货品集中的每个货品,将该货品的图像信息和文本信息输入已训练好的该类别的深度学习模型,深度学习模型的输出即为该货品的图像文本联合特征。
步骤505:当要为第一货品推荐相似货品时,采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,根据第一货品和可选货品集中每个货品的图向量特征,计算第一货品与可选货品集中每个货品的相似度,得到第一货品的初始推荐货品集。
图向量特征提取算法可以采用Graph2Vec算法。
步骤506:根据初始推荐货品集中每个货品的图像文本联合特征以及第一货品的图像文本联合特征,计算第一货品与初始推荐货品集中每个货品的相似度,按照相似度的从高到低,对初始推荐货品集中的货品进行排序,得到第一货品的最终推荐货品集。
通过上述实施例,实现了对用于提取该类别的货品的图像文本联合特征的深度学习模型的建立。
图6为本发明实施例提供的货品推荐装置的结构示意图,该装置主要包括:图像文本联合特征提取模块61和推荐计算模块62,其中:
图像文本联合特征提取模块61,用于预先提取可选货品集中每个货品的图像文本联合特征。
推荐计算模块62,用于当要为第一货品推荐相似货品时,采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,根据第一货品和可选货品集中每个货品的图向量特征,计算每个货品与第一货品的相似度,得到第一货品的初始推荐货品集;根据图像文本联合特征提取模块61预先提取的初始推荐货品集中每个货品的图像文本联合特征以及第一货品的图像文本联合特征,计算第一货品与初始推荐货品集中每个货品的相似度,按照相似度的从高到低,对初始推荐货品集中的货品进行排序,得到第一货品的最终推荐货品集。
一可选实施例中,图像文本联合特征提取模块61具体用于,采用词向量特征提取算法提取可选货品集中每个货品的词向量特征;根据每个货品的词向量特征,将所有货品分成多个类别,得到每个类别下的子货品集;对每个类别下的子货品集,采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征。
一可选实施例中,图像文本联合特征提取模块61进一步用于:针对每个类别,预先采集该类别的训练集,该类别的训练集中包含该类别的多个货品的属性信息,其中,属性信息为货品的图像信息和文本信息;针对每个类别,采用该类别的训练集对深度学习模型进行训练,训练完毕,得到用于提取该类别的货品的图像文本联合特征的深度学习模型;
且,图像文本联合特征提取模块61采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征包括:对于该类别下的子货品集中每个货品,将该货品的图像信息和文本信息输入已训练好的该类别的深度学习模型,深度学习模型的输出即为该货品的图像文本联合特征。
一可选实施例中,图像文本联合特征提取模块61采用的深度学习模型为自编码器网络。
一可选实施例中,图像文本联合特征提取模块61采用的词向量特征提取算法为item2Vec算法。
一可选实施例中,推荐计算模块62采用的图向量特征提取算法为Graph2Vec算法。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储指令,所述指令在由处理器执行时可执行如上所述货品推荐方法中的步骤。实际应用中,所述的计算机可读介质可以是上述实施例各设备/装置/系统所包含的,也可以是单独存在,而未装配入该设备/装置/系统中。其中,在计算机可读存储介质中存储指令,其存储的指令在由处理器执行时可执行如上货品推荐方法中的步骤。
根据本申请公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件,或者上述的任意合适的组合,但不用于限制本申请保护的范围。在本申请公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
如图7所示,本发明实施例还提供一种电子设备。如图7所示,其示出了本发明实施例所涉及的电子设备的结构示意图,具体来讲:
该电子设备可以包括一个或一个以上处理核心的处理器71、一个或一个以上计算机可读存储介质的存储器72以及存储在存储器上并可在处理器上运行的计算机程序。在执行所述存储器72的程序时,可以实现上述货品推荐方法。
具体的,实际应用中,该电子设备还可以包括电源73、输入输出单元74等部件。本领域技术人员可以理解,图7中示出的电子设备的结构并不构成对该电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器71是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器72内的软件程序和/或模块,以及调用存储在存储器72内的数据,执行服务器的各种功能和处理数据,从而对该电子设备进行整体监控。
存储器72可用于存储软件程序以及模块,即上述计算机可读存储介质。处理器71通过运行存储在存储器72的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器72可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器72可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器72还可以包括存储器控制器,以提供处理器71对存储器72的访问。
该电子设备还包括给各个部件供电的电源73,可以通过电源管理系统与处理器71逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源73还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入输出单元74,该输入单元输出74可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。该输入单元输出74还可以用于显示由用户输入的信息或提供给用户的信息以及各种图像用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。
本申请附图中的流程图和框图,示出了按照本申请公开的各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或者代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应该注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同附图中所标准的顺序发生。例如,两个连接地表示的方框实际上可以基本并行地执行,它们有时也可以按照相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或者流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本申请中。特别地,在不脱离本申请精神和教导的情况下,本申请的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,所有这些组合和/或结合均落入本申请公开的范围。
本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思路,并不用于限制本申请。对于本领域的技术人员来说,可以依据本发明的思路、精神和原则,在具体实施方式及应用范围上进行改变,其所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种货品推荐方法,其特征在于,该方法包括:
预先提取可选货品集中每个货品的图像文本联合特征;
当要为第一货品推荐相似货品时,采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,根据第一货品与可选货品集中每个货品的图向量特征,计算第一货品与可选货品集中每个货品的相似度,得到第一货品的初始推荐货品集;
根据初始推荐货品集中每个货品的图像文本联合特征以及第一货品的图像文本联合特征,计算第一货品与初始推荐货品集中每个货品的相似度,按照相似度的从高到低,对初始推荐货品集中的货品进行排序,得到第一货品的最终推荐货品集。
2.根据权利要求1所述的方法,其特征在于,所述预先提取可选货品集中每个货品的图像文本联合特征包括:
采用词向量特征提取算法提取可选货品集中每个货品的词向量特征;
根据每个货品的词向量特征,将可选货品集中所有货品分成多个类别,得到每个类别下的子货品集;
对每个类别下的子货品集,采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征。
3.根据权利要求2所述的方法,其特征在于,所述采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征之前,进一步包括:
针对每个类别,预先采集该类别的训练集,该类别的训练集中包含该类别的多个货品的属性信息,其中,属性信息为货品的图像信息和文本信息;针对每个类别,采用该类别的训练集对深度学习模型进行训练,训练完毕,得到用于提取该类别的货品的图像文本联合特征的深度学习模型;
所述采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征包括:
对于该类别下的子货品集中每个货品,将该货品的图像信息和文本信息输入已训练好的该类别的深度学习模型,深度学习模型的输出即为该货品的图像文本联合特征。
4.根据权利要求3所述的方法,其特征在于,所述深度学习模型为自编码器网络。
5.根据权利要求2所述的方法,其特征在于,所述词向量特征提取算法为item2Vec算法。
6.根据权利要求1所述的方法,其特征在于,所述图向量特征提取算法为Graph2Vec算法。
7.一种货品推荐装置,其特征在于,该装置包括:
图像文本联合特征提取模块,用于预先提取可选货品集中每个货品的图像文本联合特征;
推荐计算模块,用于当要为第一货品推荐相似货品时,采用图向量特征提取算法提取第一货品和可选货品集中每个货品的图向量特征,根据第一货品和可选货品集中每个货品的图向量特征,计算每个货品与第一货品的相似度,得到第一货品的初始推荐货品集;根据初始推荐货品集中每个货品的图像文本联合特征以及第一货品的图像文本联合特征,计算第一货品与初始推荐货品集中每个货品的相似度,按照相似度的从高到低,对初始推荐货品集中的货品进行排序,得到第一货品的最终推荐货品集。
8.根据权利要求7所述的装置,其特征在于,所述图像文本联合特征提取模块具体用于,
采用词向量特征提取算法提取可选货品集中每个货品的词向量特征;
根据每个货品的词向量特征,将所有货品分成多个类别,得到每个类别下的子货品集;
对每个类别下的子货品集,采用已训练好的该类别的深度学习模型提取该类别下的子货品集中每个货品的图像文本联合特征。
9.一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储指令,其特征在于,所述指令在由处理器执行时使得所述处理器执行如权利要求1至6中任一项所述的货品推荐方法的步骤。
10.一种电子设备,其特征在于,包括如权利要求9所述的非瞬时计算机可读存储介质、以及可访问所述非瞬时计算机可读存储介质的所述处理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110208523.5A CN113822735A (zh) | 2021-02-24 | 2021-02-24 | 货品推荐方法、装置及存储介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110208523.5A CN113822735A (zh) | 2021-02-24 | 2021-02-24 | 货品推荐方法、装置及存储介质和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113822735A true CN113822735A (zh) | 2021-12-21 |
Family
ID=78912461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110208523.5A Pending CN113822735A (zh) | 2021-02-24 | 2021-02-24 | 货品推荐方法、装置及存储介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113822735A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103544216A (zh) * | 2013-09-23 | 2014-01-29 | Tcl集团股份有限公司 | 一种结合图像内容和关键字的信息推荐方法及系统 |
CN104298749A (zh) * | 2014-10-14 | 2015-01-21 | 杭州淘淘搜科技有限公司 | 一种图像视觉和文本语义融合商品检索方法 |
US9129216B1 (en) * | 2013-07-15 | 2015-09-08 | Xdroid Kft. | System, method and apparatus for computer aided association of relevant images with text |
CN108920641A (zh) * | 2018-07-02 | 2018-11-30 | 北京理工大学 | 一种信息融合个性化推荐方法 |
CN110827112A (zh) * | 2019-09-16 | 2020-02-21 | 中国平安人寿保险股份有限公司 | 深度学习的商品推荐方法、装置、计算机设备及存储介质 |
CN111581510A (zh) * | 2020-05-07 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 分享内容处理方法、装置、计算机设备和存储介质 |
KR102155768B1 (ko) * | 2019-10-02 | 2020-09-14 | 한경훈 | 학습을 통하여 진화하는 질의응답 데이터 셋을 이용한 쇼핑몰 질의응답 추천 서비스 제공 방법 |
CN111915400A (zh) * | 2020-07-30 | 2020-11-10 | 广州大学 | 一种基于深度学习的个性化服装推荐方法、装置 |
CN112232929A (zh) * | 2020-11-05 | 2021-01-15 | 南京工业大学 | 一种多模态下的互补物品的多样性推荐列表生成方法 |
-
2021
- 2021-02-24 CN CN202110208523.5A patent/CN113822735A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9129216B1 (en) * | 2013-07-15 | 2015-09-08 | Xdroid Kft. | System, method and apparatus for computer aided association of relevant images with text |
CN103544216A (zh) * | 2013-09-23 | 2014-01-29 | Tcl集团股份有限公司 | 一种结合图像内容和关键字的信息推荐方法及系统 |
CN104298749A (zh) * | 2014-10-14 | 2015-01-21 | 杭州淘淘搜科技有限公司 | 一种图像视觉和文本语义融合商品检索方法 |
CN108920641A (zh) * | 2018-07-02 | 2018-11-30 | 北京理工大学 | 一种信息融合个性化推荐方法 |
CN110827112A (zh) * | 2019-09-16 | 2020-02-21 | 中国平安人寿保险股份有限公司 | 深度学习的商品推荐方法、装置、计算机设备及存储介质 |
KR102155768B1 (ko) * | 2019-10-02 | 2020-09-14 | 한경훈 | 학습을 통하여 진화하는 질의응답 데이터 셋을 이용한 쇼핑몰 질의응답 추천 서비스 제공 방법 |
CN111581510A (zh) * | 2020-05-07 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 分享内容处理方法、装置、计算机设备和存储介质 |
CN111915400A (zh) * | 2020-07-30 | 2020-11-10 | 广州大学 | 一种基于深度学习的个性化服装推荐方法、装置 |
CN112232929A (zh) * | 2020-11-05 | 2021-01-15 | 南京工业大学 | 一种多模态下的互补物品的多样性推荐列表生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Fashion iq: A new dataset towards retrieving images by natural language feedback | |
CN112632385B (zh) | 课程推荐方法、装置、计算机设备及介质 | |
US11151143B2 (en) | Recommendation engine using inferred deep similarities for works of literature | |
CN111460130B (zh) | 信息推荐方法、装置、设备和可读存储介质 | |
CN107578292B (zh) | 一种用户画像构建系统 | |
US11423234B2 (en) | Content generation using target content derived modeling and unsupervised language modeling | |
CN111723784B (zh) | 一种风险视频识别方法、装置和电子设备 | |
CN112632403B (zh) | 推荐模型的训练方法、推荐方法、装置、设备和介质 | |
CN112052356B (zh) | 多媒体分类方法、装置和计算机可读存储介质 | |
Wagner et al. | Semantic stability in social tagging streams | |
CN111639255B (zh) | 搜索关键词的推荐方法、装置、存储介质及电子设备 | |
CN111737494B (zh) | 智能学习系统的知识图谱生成方法 | |
CN109784365B (zh) | 一种特征选择方法、终端、可读介质及计算机程序 | |
CN113283238B (zh) | 文本数据处理的方法和装置、电子设备和存储介质 | |
CN110852047A (zh) | 一种文本配乐方法、装置、以及计算机存储介质 | |
CN110795544B (zh) | 内容搜索方法、装置、设备和存储介质 | |
CN112231554A (zh) | 一种搜索推荐词生成方法、装置、存储介质和计算机设备 | |
CN113822735A (zh) | 货品推荐方法、装置及存储介质和电子设备 | |
CN113590914B (zh) | 信息处理方法、装置、电子设备和存储介质 | |
CN113378826B (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN115774797A (zh) | 视频内容检索方法、装置、设备和计算机可读存储介质 | |
Zhao et al. | Lsif: A system for large-scale information flow detection based on topic-related semantic similarity measurement | |
CN115130453A (zh) | 互动信息生成方法和装置 | |
CN113392220A (zh) | 一种知识图谱生成方法、装置、计算机设备及存储介质 | |
CN111143582A (zh) | 一种双索引实时更新联想词的多媒体资源推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |