CN113962773A - 同款商品聚合方法及其装置、设备、介质、产品 - Google Patents

同款商品聚合方法及其装置、设备、介质、产品 Download PDF

Info

Publication number
CN113962773A
CN113962773A CN202111233771.1A CN202111233771A CN113962773A CN 113962773 A CN113962773 A CN 113962773A CN 202111233771 A CN202111233771 A CN 202111233771A CN 113962773 A CN113962773 A CN 113962773A
Authority
CN
China
Prior art keywords
commodity
same
similarity
style
category label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111233771.1A
Other languages
English (en)
Inventor
钟媛媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huaduo Network Technology Co Ltd
Original Assignee
Guangzhou Huaduo Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huaduo Network Technology Co Ltd filed Critical Guangzhou Huaduo Network Technology Co Ltd
Priority to CN202111233771.1A priority Critical patent/CN113962773A/zh
Publication of CN113962773A publication Critical patent/CN113962773A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0629Directed, with specific intent or strategy for generating comparisons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Abstract

本申请涉及电商信息技术领域,公开一种同款商品聚合方法及其装置、设备、介质、产品,所述方法包括:获取商品数据库中商品对象的类目标签,所述类目标签为调用预训练的商品分类模型对商品对象的商品信息进行分类所得;获取商品对象的商品信息相对应的综合特征向量,计算同一类目标签下两两商品对象构成的商品组合之间的相似度,所述综合特征向量为所述商品分类模型所提取的深层语义特征表示;筛选出每个类目标签下相似度超过预设阈值的所述商品组合作为同款商品组合;对所有同款商品组合进行聚合,获得每个类目标签相对应的同款商品列表。本申请能够实现精准聚合同款的商品,并以此构建同款商品列表,提升用户体验。

Description

同款商品聚合方法及其装置、设备、介质、产品
技术领域
本申请涉及电商信息技术领域,尤其涉及一种同款商品聚合方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。
背景技术
电商平台上展示的商品界面上常见同款商品罗列现象,使同款商品大幅占用用户终端设备的图形用户界面的有限显示空间,导致影响买家用户浏览各种不同款式的购物体验,也影响商品推荐成功率。现有技术中的一种解决方式是,电商平台后台服务器预先根据各商品对象的商品主图或者商品标题的近似性,进行同款商品判断并以此将同款商品进行聚合,用于响应平台用户触发的为指定商品获取其同款聚合的商品事件,推送与商品对应的同款商品集合至用户终端设备的图形用户界面,所述同款商品集合为与所述商品为同款的多个同款商品构成的集合,在图形用户界面上的展示方式多为轮播方式展示,进而优化了商品界面展示上同款商品重复出现的问题。
一般而言多数电商平台的商品同款聚合通常采用商品对之间的文本信息作为特征,根据特征是否近似进行是否同款的判断,或者根据两个商品是否有重合图片做同款判断,通常导致出现一些问题,具体而言,如基于图片匹配的方法效果比较局限,两个商品展示照片的拍摄角度不同就可能导致商品同款的识别失败,而其所述两个商品标题描述接近一致,显而易见的商品实际应该是同款,但由于最终判断依据仅借助图片匹配维度欠缺对标题文本匹配维度分析导致商品同款判断失误。
为了使得同款的商品能够精准的被识别进行聚合减少占用商品展示的图形界面同款商品占用的空间,并以此构造同款商品列表供于用户参考,提升用户体验,本申请人对此做出相应的探索。
发明内容
本申请的目的在于满足用户需求而提供一种同款商品聚合方法及其相应的装置、计算机设备、非易失性存储介质以及计算机程序产品。
为满足本申请的各个目的,本申请采用如下技术方案:
使用本申请的目的而提供的一种同款商品聚合方法,包括如下步骤:
获取商品数据库中商品对象的类目标签,所述类目标签为调用预训练的商品分类模型对商品对象的商品信息进行分类所得;
获取商品对象的商品信息相对应的综合特征向量,计算同一类目标签下两两商品对象构成的商品组合之间的相似度,所述综合特征向量为所述商品分类模型所提取的深层语义特征表示;
筛选出每个类目标签下相似度超过预设阈值的所述商品组合作为同款商品组合;
对所有同款商品组合进行聚合,获得每个类目标签相对应的同款商品列表。
扩展的实施例中,所述商品分类模型执行如下用于生成所述商品对象的类目标签,包括如下步骤:
获取商品数据库中商品对象的商品信息,所述商品信息包括标题文本及商品图片;
分别对所述标题文本和商品图片提取其相应的文本特征向量和图片特征向量;
根据所述文本特征向量和/或图片特征向量对商品对象进行分类,获得该商品对象相应的类目标签;
将所述文本特征向量和/或图片特征向量存储为关联于相应的商品对象的所述综合特征向量。
深化的实施例中,将所述文本特征向量和/或图片特征向量存储为关联于相应的商品对象的所述综合特征向量,包括如下步骤:
调用预设的文本特征提取模型,对所述商品信息进行文本特征提取,获得其文本特征向量;
调用预设的图片特征提取模型,对所述商品信息进行图像特征提取,获取其图片特征向量;
将图片特征向量归一化为维度与所述文本特征向量相同的单个高维向量后,与该文本特征向量进行拼接获得综合特征向量。
进一步的实施例中,获取商品对象的商品信息相对应的综合特征向量,计算同一类目标签下两两商品对象构成的商品组合之间的相似度,包括如下步骤:
获取商品对象预存储的综合特征向量;
计算同一类目标签下两两商品对象所构成的商品组合中两个综合特征向量之间的余弦距离作为两两商品对象之间的相似度;
存储各类目标签下各个商品组合中两两商品对象之间的所述相似度。
进一步的实施例中,筛选出每个类目标签下相似度超过预设阈值的所述商品组合作为同款商品组合,包括如下步骤:
确定预设阈值;
获取同一类目标签下的商品组合对应的相似度,并与所述预设阈值比较;
当所述商品组合相应的相似度超过所述预设阈值,确定所述商品组合为同款商品组合。
深化的实施例中,确定所述预设阈值,包括如下步骤:
随机获取一批商品组合的相似度获取其属于同款或非同款的人工标注信息,从而确定相应的两个数据集;
根据相似度对该两个数据集进行正态分布统计,确定两个相应的正态分布曲线的交点相对应的相似度为第一阈值;
获取预先给定的第二阈值;
比较第一阈值与第二阈值,以其中最高者为所述的预设阈值。
进一步的实施例中,对所有同款商品组合进行聚合,获得每个类目标签相对应的同款商品列表,包括如下步骤:
针对每个类目标签,适用最大贪心匹配算法选出多个相似商品家族,每个相似商品家族为同一商品对象对应的多个同款商品组合构成的集合而包括多个商品对象,不同的相似商品家族所包含的商品对象互不相同;
确定同一相似商品家族中具有最大库存量的商品为代表商品,余者为被代表商品;
将每个相似商品家族转换为同款商品列表。
适应本申请的目的而提出的一种同款商品聚合装置,其包括:
类目标签获取模块:用于获取商品数据库中商品对象的类目标签,所述类目标签为调用预训练的商品分类模型对商品对象的商品信息进行分类所得;
相似度计算模块:用于获取商品对象的商品信息相对应的综合特征向量,计算同一类目标签下两两商品对象构成的商品组合之间的相似度,所述综合特征向量为所述商品分类模型所提取的深层语义特征表示;
同款商品筛选模块:用于筛选出每个类目标签下相似度超过预设阈值的所述商品组合作为同款商品组合;
列表生成模块:用于对所有同款商品组合进行聚合,获得每个类目标签相对应的同款商品列表。
进一步实施例中,所述类目标签获取模块,包括:
商品信息获取子模块,用于获取商品数据库中商品对象的商品信息,所述商品信息包括标题文本及商品图片;
特征向量提取子模块,用于分别对所述标题文本和商品图片提取其相应的文本特征向量和图片特征向量;
类目标签生成子模块,用于根据所述文本特征向量和/或图片特征向量对商品对象进行分类,获得该商品对象相应的类目标签;
综合特征向量子模块,用于将所述文本特征向量和/或图片特征向量存储为关联于相应的商品对象的所述综合特征向量。
进一步实施例中,综合特征向量模块,包括:
文本特征向量子模块,用于调用预设的文本特征提取模型,对所述商品信息进行文本特征提取,获得其文本特征向量;
图片特征向量子模块,用于调用预设的图片特征提取模型,对所述商品信息进行图像特征提取,获取其图片特征向量;
综合特征向量子模块,用于将图片特征向量归一化为维度与所述文本特征向量相同的单个高维向量后,与该文本特征向量进行拼接获得综合特征向量。
进一步实施例中,所述相似度计算模块,包括:
综合特征向量获取子模块,用于获取商品对象预存储的综合特征向量;
余弦距离计算子模块,用于相似度计算计算同一类目标签下两两商品对象所构成的商品组合中两个综合特征向量之间的余弦距离作为两两商品对象之间的相似度;
存储子模块,用于存储各类目标签下各个商品组合中两两商品对象之间的所述相似度。
进一步实施例中,所述同款商品筛选模块,包括:
阈值确认子模块,用于确定预设阈值;
阈值比较子模块,用于获取同一类目标签下的商品组合对应的相似度,并与所述预设阈值比较;
同款确认子模块,用于当所述商品组合相应的相似度超过所述预设阈值,确定所述商品组合为同款商品组合。
进一步实施例中,所述阈值确认子模块,包括:
数据集确认单元,用于随机获取一批商品组合的相似度获取其属于同款或非同款的人工标注信息,从而确定相应的两个数据集;
第一阈值单元,用于根据相似度对该两个数据集进行正态分布统计,确定两个相应的正态分布曲线的交点相对应的相似度为第一阈值;
第二阈值单元,用于获取预先给定的第二阈值;
阈值比较单元,用于比较第一阈值与第二阈值,以其中最高者为所述的预设阈值。
进一步实施例中,获得同款商品列表模块,包括:
相似商品家族子模块,用于针对每个类目标签,适用最大贪心匹配算法选出多个相似商品家族,每个相似商品家族为同一商品对象对应的多个同款商品组合构成的集合而包括多个商品对象,不同的相似商品家族所包含的商品对象互不相同;
代表商品确认子模块,用于确定同一相似商品家族中具有最大库存量的商品为代表商品,余者为被代表商品;
列表生成子模块,用于将每个相似商品家族转换为同款商品列表。
适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的同款商品聚合方法的步骤。
适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的同款商品聚合方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
适应本申请的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述同款商品聚合方法的步骤。
相对于现有技术,本申请的优势如下:
本申请结合商品图片和标题文本两个维度,分别提取商品对象对应所述两个维度的语义特征构建综合特征向量,对两两商品对象构成的商品组合的相似度计算并将其与预设阈值进行比较获得同款商品组合,对所述同款商品组合中的商品对象根据商品对象的最大库存量进行排序,并使用贪心算法选出代表商品对应的商品对象及被代表的商品对象按前述排序构建同款商品列表,所述代表商品为同款商品对应的最大库存量中的库存量最大且排行列表首位。由于结合所述两个维度深层语义特征信息,所得商品信息对应的深层语义特征信息更为丰富以及据此计算的相似度更为准确,精准聚合同款的商品。根据同款列表中的最大库存量排序,便于需要采购大量商品的买家用户快速决策直接选购代表商品或列表上前几位的商品。
本申请据以商品对象对应的商品图片和标题文本两个维度,对信息的综合程度较高且全面,能够精确聚合同款的商品,并建立了同款商品列表供买家用户参考,提升了用户体验。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的同款商品聚合方法的典型实施例的流程示意图;
图2为本申请的实施例中生成商品对象的类目标签的流程示意图;
图3为本申请的实施例中构造综合特征向量过程的流程示意图;
图4为本申请的实施例中根据综合特征向量计算相似度的流程示意图;
图5为本申请的实施例中筛选同款商品组合的流程示意图;
图6为本申请的实施例中构造预设阈值的流程示意图;
图7为本申请的实施例中构造同款商品列表过程的流程示意图;
图8为本申请的同款商品聚合装置的典型实施例的原理框图;
图9为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用。本领域技术人员应当理解,只要设备运行资源适格,均可用作所述神经网络模型相应的模型训练设备和模型运行设备。某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种同款商品聚合方法,可被编程为计算机程序产品,部署于终端设备和/或服务器中运行而实现,藉此,客户端可以网页程序或应用程序的形式访问该计算机程序产品运行后开放的用户界面,实现人机交互。
请参阅图1,本申请揭示的一种同款商品聚合方法,在其典型实施例中,包括步骤S1100至S1400,具体如下:
步骤S1100,获取商品数据库中商品对象的类目标签,所述类目标签为调用预训练的商品分类模型对商品对象的商品信息进行分类所得;
本申请所适应的一个应用场景,是电商平台中的某一个商家实例希望电商平台为其指定的商品对象提供同款商品列表,由于所述指定商品对象和所述同款商品列表隶属同一类目标签,为此,电商平台首先需要为该商家实例指定的商品对象获取商品数据库中其对应的类目标签,用于后续获取与所述指定商品对象隶属同一类目标签下的同款商品列表。具体而言,电商平台可以响应该商家实例的相关请求而获取商家实例为同款商品列表而指定的商品对象的类目标签,确认该商品对象的类目标签后,基于该商品对象的类目标签获取其相应的同一类目标签下的同款商品列表。
所述同款商品列表为与商品对象同一类目标签下相似度相对较高的多个商品对象根据一定的排序构建的商品列表。
所述商品信息为商品数据库中存储所述商品对象对应的图片和文本信息,其中,文本信息包括商品对象的用于显要显示的标题信息、用于介绍商品详情的内容信息、用于描述商品特征的属性信息等,图片信息包括商品对象的用于显要显示的商品主图、用于介绍商品详情的详情图片。
所述类目标签为电商平台的商品分类框架类目树的分类路径,所述类目树由多级类目逐层展开,每一级均包括多个类目标签,父级的类目标签包括多个子级的类目标签,由此构成“类目树”,类目树通常包括三级、四级,一般不超过五级。所述类目树中各层次分别对应多个类目标签,对于一个商品对象而言,多层次分类结构中的各个类目标签构成其分类路径,且该分类路径中的各类目标签之间具有层次隶属关系。
步骤S1200,获取商品对象的商品信息相对应的综合特征向量,计算同一类目标签下两两商品对象构成的商品组合之间的相似度,所述综合特征向量为所述商品分类模型所提取的深层语义特征表示;
所述综合特征向量为调用商品分类模型所提取的商品信息中的相对应的标题文本和图片信息语义特征后生成的图片特征向量和文本特征向量,通过对所述图片特征向量和文本特征向量进行拼接构成综合特征向量,并将所述综合特征向量矩阵化关联对应的商品对象存储到商品数据库中,用于后续步骤调用相似度计算模型对两两商品对象的相似度计算。
所述相似度为根据指定的商品对象的类目标签,获取商品数据库中对应所述类目标签的商品对象并获取其对应的综合特征向量,调用Faiss框架构建索引表征商品对象间相似度,基于所述商品对象之间对应的综合特征向量,计算同一类目标签下所述获取的商品对象与所述指定的商品对象两两商品对象构成的商品组合之间的相似度,根据所述商品组合及其计算得出的相似度构建相似度列表存储到数据库中,用于后续通过以所述相似度为索引值检索并获取相似度列表中对应的商品组合。
步骤S1300,筛选出每个类目标签下相似度超过预设阈值的所述商品组合作为同款商品组合;
所述预设阈值为经由对两组互斥的同款数据集和非同款数据集中的各个商品组合的相似度进行统计得出的阈值和人工制定的阈值进行比较,当所述统计得出的阈值比所述人工制定的阈值要大则确定预设阈值为统计得出的阈值,反之则确定预设阈值为人工制定的阈值。
获取每个类目标签下的两两商品对象构成的商品组合的相似度,判断所述商品组合的相似度是否超过预设阈值,筛选出超过预设阈值的商品组合为同款商品组合。
步骤S1400,对所有同款商品组合进行聚合,获得每个类目标签相对应的同款商品列表。
获取同一类目标签下的同款商品组合进行聚合构建同款商品列表,并将其关联当前类目标签进行存储,依照上述的逻辑得到每个类目标签相对应的同款商品列表。
本实施例综合了商品对象的标题文本和商品图片相对应的特征信息,实现了多模态信息融合,在此基础上,根据融合成的综合特征信息进行相似度计算处理,实现了电商平台中各商品对象之间的相似度计算,由于其相似度计算基础不局限于图片信息,而是依赖于图片特征信息及文本特征信息拼接而得的综合特征信息,信息量丰富,信息颗粒度更为精细,因此可以更为快速得到准确度高的相似度值,有利于提高电商平台中商品同款聚合、找相似商品、相似商品系统自动推送等效率。
请参阅图2,扩展的实施例中,所述商品分类模型执行如下用于生成所述商品对象的类目标签的步骤S1510至S1540:
步骤S1510,获取商品数据库中商品对象的商品信息,所述商品信息包括标题文本及商品图片;
电商平台的服务器获取商品对象的商品信息用于生成所述商品对象的类目标签,所述商品对象的商品信息,一个实施例中可以是获取商家实例自身的商品数据库中的商品对象的商品信息,另一实施例中可以是获取电商平台自身的商品数据库中的商品对象的商品信息。无论何种方式,只要是用于本申请的服务器可以获得商品对象对应的商品信息,便可根据所述商品信息进行后续步骤生成所述商品对象的类目标签。
所述商品信息包括标题文本和商品图片,标题文本主要采用商品对象的中表征商品属性的一项或多项的描述信息,商品图片主要采用是包含该商品对象的产品外观的主要图片。一般而言可以按照预设的数量和内容需求获取标题文本及商品图片,例如标题文本可以规定为包含商品对象的标题信息中所有属性项的属性信息、商品图片可以只选取其主要用于表征产品外观的商品主图,具体如何实施,本领域技术人员可以在此基础上灵活变通处理。
步骤S1520,分别对所述标题文本和商品图片提取其相应的文本特征向量和图片特征向量;
为了从所述商品对象中的标题文本和商品图片中提取出相应的特征信息,可以借助经由预训练的多种神经网络模型来实现特征表示,使所述的特征信息能够包含相应的摘要文本和商品图片的深层语义信息。例如可以采用Bert之类的模型来实现标题文本的分词及其中特征信息的提取,采用Resnet之类的模型来实现商品图片中的特征信息的提取。不局限于此处的示例,理论上任何适于从所述商品图片和标题文本中提取出深层语义信息的网络模型,均可用于本申请中实现相应的特征提取处理,最终,获得与标题文本相对应的文本特征向量以及商品图片相对应的图片特征向量。
步骤S1530,根据所述文本特征向量和/或图片特征向量对商品对象进行分类,获得该商品对象相应的类目标签;
为了获得商品对象相应的类目标签,可对所述文本特征向量和图片特征向量进行取舍,并调用相应的预设分类的神经网络模型获得分类结果信息,所述分类结果信息中包含商品对象映射到电商平台的类目树中的各层次各分类标签的相似度信息,并且根据各层次分类标签的隶属关系对其相似度进行优选,确定所述商品对象的至少一个分类路径,最终获得所述商品对象相应的类目标签。
一种实施例中,所述商品对象的标题文本中表征商品SKU属性对应的文本描述大体全面且表述准确,因此可单独适用标题文本相对应的文本特征向量,相应地,调用预设的文本特征模型获得所述文本特征向量,该文本特征向量具备表征商品属性的深层语义特征,故此可借助Softmax之类的多分类器对该文本特征向量进行分类,获得所述商品对象相应的类目标签。
另一种实施例中,所述商品对象的商品图片直观反映产品外观,因此可单独适用商品图片相对应的图片特征向量,相应地,调用预设的图片特征模型获得所述图片特征向量,该图片特征向量具备表征商品属性的深层语义特征,故此可借助Softmax之类的分类器对该图片特征向量进行分类,获得所述商品对象相应的类目标签。
再一实施例中,考虑到单独依靠所述商品对象的标题文本或商品图片,恐不能全面表示出商品对象相对应的完整深层语义信息,为此可借助前两实施例的文本特征模型和图片特征模型,分别提取出所述商品对象的标题文本和商品图片相对应的文本特征向量和图片特征向量,将两者简单拼接成为综合特征向量,然后,同理借助Softmax之类的多分类器对该综合特征向量进行分类,获得所述商品对象相应的类目标签。
确认商品对象相应的类目标签后,将所述类目标签关联对应的商品对象存储到商品数据库中,以便根据所述类目标签获取对应的商品对象。
步骤S1540,将所述文本特征向量和/或图片特征向量存储为关联于相应的商品对象的所述综合特征向量。
根据本申请的典型实施例,可以变通实施而构成多个变通实施例,主要在于对所述文本和图片特征向量选取不同而导致所得的综合特征向量内容不同,具体而言,这些变通实施例中可以采用文本特征向量和图片特征向量拼接构成综合特征向量,也可单独使用文本特征向量或图片特征向量构成所述的综合特征向量,也即是说,本申请并不严格要求在本申请中使用图片特征向量和文本特征向量构成所述综合特征向量,而是可以由本领域技术人员对所述图片特征向量和文本特征向量进行灵活取舍,也理应可以实现本申请的同款商品聚合的目的。当然,对应的,适应此处的各个变通实施例,在使用相似度计算模型对综合特征向量进行相似度计算的阶段,也作出相应的变通,即根据相应的综合特征向量调用相应的模型进行相应的相似度计算。
将所述综合特征向量关联相应的商品对象进行存储至商品数据库中,便于快速通过商品对象检索获取对应的综合特征向量,用于计算商品对象之间的相似度和/或商品分类。
请参阅图3,深化的实施例中,步骤S1540、将所述文本特征向量和/或图片特征向量存储为关联于相应的商品对象的所述综合特征向量,包括如下步骤:
步骤S1541,调用预设的文本特征提取模型,对所述商品信息进行文本特征提取,获得其文本特征向量;
为了获得所述商品信息的文本特征向量,可以对所述商品信息中的标题文本信息进行预处理,根据常用的电商商品属性文本词典筛选标题文本信息中表征商品属性的文本信息,然后,调用Bert的文本模型将所述文本信息进行文本特征提取并embedding化获得标题文本信息对应的文本特征向量。
步骤S1542,调用预设的图片特征提取模型,对所述商品信息进行图像特征提取,获取其图片特征向量;
为了获得所述商品信息中的图片特征向量,可以对所述商品信息中商品图片进行预处理,也可借助常见的图片预处理操作,例如借助Yolo网络模型对其进行商品定位、去除图片噪声等,然后,调用Resnet的图片特征模型对商品图片中直观反映产品外观的语义特征进行提取以获得商品信息中的图片对应的图片特征向量。
步骤S1543,将图片特征向量归一化为维度与所述文本特征向量相同的单个高维向量后,与该文本特征向量进行拼接获得综合特征向量。
所述Bert模型提取出来的文本特征向量通常是一个高维的行向量,而图片特征向量则为多行多列的矩阵,因此,为了方便两者的特征拼接,可以将所述的图片特征向量归一化为行向量,该行向量的维度与所述文本特征向量的维度相同,然后按图片特征向量的行列关系顺序将其中各行各列的元素填充到该归一化行向量中即可完成归一化构造,至此便实现了图片特征向量与文本特征向量是尺度的统一,进而将两者进行简单的特征拼接,便可构造出综合特征向量,该综合特征向量显然实现了所述文本特征向量及所述图片特征向量的特征信息的融合。
本实施例进一步借助的文本特征模型及图片特征模型为商品对象提取标题文本和商品图片相对应的深层语义特征,最后,以简单拼接的方式实现了对文本特征向量和图片特征向量深层语义特征,可见所获得的综合特征向量实际上是极大程度包含了商品对象各方面的信息,准确并丰富的表征商品对象,为商品对象之间的相似度计算准确度提供坚实的基础。
请参阅图4,进一步的实施例中,步骤S1200、获取商品对象的商品信息相对应的综合特征向量,计算同一类目标签下两两商品对象构成的商品组合之间的相似度,包括如下步骤:
步骤S1210,获取商品对象预存储的综合特征向量;
获取商品数据库中关联商品对象预存储的类目标签,并根据所述类目标签与商品对象之间的关联存储关系,获取商品数据库中的商品对象对应的类目标签为所述类目标签的多个商品对象,之后,根据所述综合特征向量和商品对象之间的关联存储关系,获取商品对象对应的综合特征向量,最终,获得多个基于同一类目标签下的商品对象以及其对应的综合特征向量。
步骤S1220,计算同一类目标签下两两商品对象所构成的商品组合中两个综合特征向量之间的余弦距离作为两两商品对象之间的相似度;
根据同一类目标签下的商品对象对应的综合特征向量,通过faiss框架提供的接口构造所述各综合特征向量之间的索引,进一步通过其提供的相似度计算接口,应用余弦相似度算法计算所述索引的值,从而快速计算各个两两商品对象所构成的商品组合之间的余弦距离,同理计算出各类目标签下的所述商品组合的余弦距离,并且所得的所述余弦距离作为两两商品对象所构成的商品组合之间的相似度。
所述余弦距离计算为,根据两两商品对象的综合特征向量的点积除以所述综合特征向量对应的模长的积所得的值进行归一化,最终所得的余弦距离的值范围为0-1,极限分别是0和1,当余弦距离值为1此时重合所述综合向量之间的夹角为0,代表两两商品对象相似度为1,当余弦距离值为0此时分开所述综合向量之间的夹角为180度,代表两两商品相似度为0,余弦距离值越大两者越相似度越高,反之值越小两者差异越大相似度越低。
步骤S1230,存储各类目标签下各个商品组合中两两商品对象之间的所述相似度。
各两两商品对象所构成的商品组合对应的相似度关联其所属的类目标签进行存储,同理存储各类目标签下各个所述商品组合中两两商品对象之间的所述相似度。便于通过检索类目标签,获得属于所述类目标签下的商品组合的相似度。
本实施例中借助了faiss框架来实现两两商品对象构成的商品组合的相似度的快速计算,且能够降低本申请技术方案的实现成本,提升运行效率。
请参阅图5,进一步的实施例中,步骤S1300、筛选出每个类目标签下相似度超过预设阈值的所述商品组合作为同款商品组合,包括如下步骤:
步骤S1310,确定预设阈值;
获取预设阈值,所述预设阈值为两两商品对象构成的商品组合的相似度的判定条件,用于作为与各商品对象的相似度做判断的同一维度下的界限。
步骤S1320,获取同一类目标签下的商品组合对应的相似度,并与所述预设阈值比较;
根据类目标签和隶属同一类目标签的商品组合的关联存储关系,获取商品数据库中同一类目标签的商品组合,并以所述商品组合和其对应的相似度关联存储关系,最终获得同一类目标签下的各商品组合对应的相似度,并与所述预设阈值进行比较。同理获取类目标签下的各商品组合对应的相似度与所述预设阈值进行比较。
步骤S1330,当所述商品组合相应的相似度超过所述预设阈值,确定所述商品组合为同款商品组合。
根据同一类目标签下的商品组合相应的相似度与所述预设阈值进行同一维度的比较,当前者的相似度超过后者,则确定所述同一类目标签下的商品组合为同款商品组合,同理据此获取每个类目标签下的所述同款商品组合。
本实施例中的两两商品对象构成的商品组合通过判断其对应的相似度与预设阈值确定彼此是否同款,相对于简单地对各所述商品组合相似度从高到低进行排序选取其中的前十几个判断为同款,更为科学客观。
请参阅图6,深化的实施例中,步骤S1310、确定所述预设阈值,包括如下步骤:
步骤S1311,随机获取一批商品组合的相似度获取其属于同款或非同款的人工标注信息,从而确定相应的两个数据集;
随机获取一批商品组合,通过人工标注是否同款得到同款的商品组合的数据集和非同款商品组合的数据集。获取商品组合中的商品对象对应的综合特征向量,根据所述综合特征向量通过faiss模块快速计算商品对象之间的余弦距离作为相互构成的商品组合的相似度,同理计算出同款商品组合的数据集和非同款商品组合的数据集中的对应的各商品组合的相似度。
步骤S1312,根据相似度对该两个数据集进行正态分布统计,确定两个相应的正态分布曲线的交点相对应的相似度为第一阈值;
根据所述同款商品组合的数据集和非同款商品组合的数据集的商品组合相似度及所述相似度对应的商品组合个数两个维度进行数据统计,以商品组合的相似度作为X轴,以所述相似度对应的商品组合个数作为Y轴,根据统计学知识可得所述两个数据集中的数据构成的曲线符合正态分布据此计算出所述曲线的交点相对应的相似度作为第一阈值。
步骤S1313,获取预先给定的第二阈值;
为了避免最终预设阈值过小,此处预先人工设定第二阈值为0.8,所述人工设定的第二阈值作为预设阈值的最低下限阈值(具体预设阈值需根据本实施例中下述步骤实现),两两商品对象构成的商品组合对应的相似度至少超过第二阈值即0.8,才可判定为同款商品组合,此处所述第二阈值由本领域的技术人员根据业务需求可进行灵活变通。所述预先人工设定的第二阈值用于避免最终的预设阈值太小导致无法作为判断商品组合中的商品对象为同款的依据。
步骤S1314,比较第一阈值与第二阈值,以其中最高者为所述的预设阈值。
比较第一阈值和第二阈值,所述第一阈值比第二阈值大时确认第一阈值为所述的预设阈值,所述第二阈值比第一阈值大时确认第二阈值为所述的预设阈值。为使所述的预设阈值更具备判断商品组合中的商品对象为同款依据的目的,当所述第二阈值比第一阈值要大时,可选的放弃人工预先设定的第二阈值,可更换其他批的商品组合以上述同理的方式多次获得第一阈值,直至第一阈值大于第二阈值获取第一阈值为所述的预设阈值,本技术领域的技术人员据此进行灵活的变通。
本实施例中界定了预设阈值的实现,所述预设阈值通过对两两商品对象构成的商品组合对应的相似度进行统计分析得出第一阈值,人工设定第二阈值进行保证预设阈值下限,选出第一阈值和第二阈值中的最大者为预设阈值,即保证了预设阈值不会太小影响根据预设阈值判断是否为同款商品的判断结果准确性,又保证了所得预设阈值足够高且适合所述预设阈值与大多数所述商品组合对应的相似度比较的应用场景,获得高相似度的商品组合判定为同款商品组合。
请参阅图7,进一步的实施例中,步骤S1400、对所有同款商品组合进行聚合,获得每个类目标签相对应的同款商品列表,包括如下步骤:
步骤S1410,针对每个类目标签,适用最大贪心匹配算法选出多个相似商品家族,每个相似商品家族为同一商品对象对应的多个同款商品组合构成的集合而包括多个商品对象,不同的相似商品家族所包含的商品对象互不相同;
获取每个类目标签对应的同款商品组合构建同款商品集合,将所述同款商品集合按照商品库存量进行排序,选择一个同款商品集合开始适用最大贪心匹配算法选出其中的代表商品和被代表商品,去除当前已确认的代表商品和被代表商品,重复前述逻辑对另一同款商品集合选出其代表商品和被代表商品,直至获得各同款商品集合中的唯一的代表商品和被代表商品且各同款商品集合中的代表商品和被代表商品各不相同以此构建相似商品家族。
所述各个相似商品家族为多个同一商品对象对应与其同款的商品对象两两商品对象构成同款商品组合的集合其中包含多个商品对象即唯一的代表商品和被代表商品,不同的相似商品家族中的所述商品对象互不相同。
步骤S1420,确定同一相似商品家族中具有最大库存量的商品为代表商品,余者为被代表商品;
获取各个相似商品家族中的商品对象对应的商品最大库存量,并对所述各个同一相似商品家族中的商品对象按照其对应的商品最大库存量大到小进行排序,将具有最大库存量的商品确认为代表商品,余者确认为被代表商品。
步骤S1430,将每个相似商品家族转换为同款商品列表。
所述相似商品家族以最大库存量排序,根据排序所得的所述代表商品和所述被代表商品的序列构建对应的同款商品列表。
同理对每个相似商品家族以上述相同的逻辑进行处理,获得每个类目标签相对应的同款商品列表。
一种实施例中,为方便进行人机交互,所述同款商品列表被构造为以其中的代表商品进行突出显示,而其他被代表商品则在该代表商品被用户触控时展开显示,从而在界面上获得聚合显示的效果。在此基础上,将同款商品列表推送至用户终端设备的图形用户界面即可供用户访问。
本实施例中同款商品聚合构建同款商品列表,简化了图形界面中同款商品占用的空间,尤其方便在移动设备的有限界面空间中进行信息输出,方便用户参考同款商品列表中的代表商品和被代表商品,快速了解同款商品中库存量大的商品,提升了价格比较低或具备价格优势而通常采购量比较大的商品采购率,且提升了用户体验,增加用户黏性。
进一步,可以通过将上述各实施例所揭示的方法中的各个步骤进行功能化,构造出本申请的一种同款商品聚合装置,按照这一思路,请参阅图8,其中的一个典型实施例中,该装置包括:类目标签获取模块1100:用于获取商品数据库中商品对象的类目标签,所述类目标签为调用预训练的商品分类模型对商品对象的商品信息进行分类所得;相似度计算模块1200:用于获取商品对象的商品信息相对应的综合特征向量,计算同一类目标签下两两商品对象构成的商品组合之间的相似度,所述综合特征向量为所述商品分类模型所提取的深层语义特征表示;同款商品筛选模块1300:用于筛选出每个类目标签下相似度超过预设阈值的所述商品组合作为同款商品组合;列表生成模块1400:用于对所有同款商品组合进行聚合,获得每个类目标签相对应的同款商品列表。
进一步实施例中,所述类目标签获取模块1100包括如下子模块:
商品信息获取子模块:用于获取商品数据库中商品对象的商品信息,所述商品信息包括标题文本及商品图片;特征向量提取子模块:用于分别对所述标题文本和商品图片提取其相应的文本特征向量和图片特征向量;类目标签生成子模块:用于根据所述文本特征向量和/或图片特征向量对商品对象进行分类,获得该商品对象相应的类目标签;综合特征向量子模块:用于将所述文本特征向量和/或图片特征向量存储为关联于相应的商品对象的所述综合特征向量。
进一步实施例中,综合特征向量模块,包括:
文本特征向量子模块,用于调用预设的文本特征提取模型,对所述商品信息进行文本特征提取,获得其文本特征向量;用于图片特征向量子模块,调用预设的图片特征提取模型,对所述商品信息进行图像特征提取,获取其图片特征向量;综合特征向量子模块,用于将图片特征向量归一化为维度与所述文本特征向量相同的单个高维向量后,与该文本特征向量进行拼接获得综合特征向量。
进一步实施例中,所述相似度计算模块1200包括如下子模块:
综合特征向量获取子模块:用于获取商品对象预存储的综合特征向量;余弦距离计算子模块:用于相似度计算计算同一类目标签下两两商品对象所构成的商品组合中两个综合特征向量之间的余弦距离作为两两商品对象之间的相似度;存储子模块:用于存储各类目标签下各个商品组合中两两商品对象之间的所述相似度。
进一步实施例中,所述同款商品筛选模块1300包括如下子模块:
阈值确认子模块:用于确定预设阈值;阈值比较子模块:用于获取同一类目标签下的商品组合对应的相似度,并与所述预设阈值比较;同款确认子模块:用于当所述商品组合相应的相似度超过所述预设阈值,确定所述商品组合为同款商品组合。
进一步实施例中,所述阈值确认子模块,包括:
数据集确认单元,用于随机获取一批商品组合的相似度获取其属于同款或非同款的人工标注信息,从而确定相应的两个数据集;第一阈值单元,用于根据相似度对该两个数据集进行正态分布统计,确定两个相应的正态分布曲线的交点相对应的相似度为第一阈值;第二阈值单元,用于获取预先给定的第二阈值;阈值比较单元,比较第一阈值与第二阈值,以其中最高者为所述的预设阈值。
进一步实施例中,获得同款商品列表模块,包括:
相似商品家族子模块,用于针对每个类目标签,适用最大贪心匹配算法选出多个相似商品家族,每个相似商品家族为同一商品对象对应的多个同款商品组合构成的集合而包括多个商品对象,不同的相似商品家族所包含的商品对象互不相同;代表商品确认子模块,用于确定同一相似商品家族中具有最大库存量的商品为代表商品,余者为被代表商品;列表生成子模块,用于将每个相似商品家族转换为同款商品列表。
为解决上述技术问题,本申请实施例还提供一种计算机设备,用于运行根据所述数据更新方法所实现的计算机程序。具体请参阅图9,图9为本实施例计算机设备基本结构框图。
如图9所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种数据更新方法或数据调度方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种数据更新方法或数据调度方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行本发明的货源推荐装置中的类目标签获取模块1100,相似度计算模块1200,同款商品筛选模块1300,列表生成模块1400的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有数据更新装置或数据调度装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种非易失性存储介质,所述的数据更新方法或数据调度方法被编写成计算机程序,以计算机可读指令的形式存储于该存储介质中,计算机可读指令被一个或多个处理器执行时,意味着该程序在计算机中的运行,由此使得一个或多个处理器执行上述任一实施例数据更新方法或数据调度方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述同款商品聚合方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请能够为商家快速准确聚合同款商品,减少商品展示所需占用的图形用户界面空间,提升电商平台中用户选购商品的用户体验。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种同款商品聚合方法,其特征在于,包括如下步骤:
获取商品数据库中商品对象的类目标签,所述类目标签为调用预训练的商品分类模型对商品对象的商品信息进行分类所得;
获取商品对象的商品信息相对应的综合特征向量,计算同一类目标签下两两商品对象构成的商品组合之间的相似度,所述综合特征向量为所述商品分类模型所提取的深层语义特征表示;
筛选出每个类目标签下相似度超过预设阈值的所述商品组合作为同款商品组合;
对所有同款商品组合进行聚合,获得每个类目标签相对应的同款商品列表。
2.根据权利要求1所述的同款商品聚合方法,其特征在于,所述商品分类模型执行如下用于生成所述商品对象的类目标签的步骤:
获取商品数据库中商品对象的商品信息,所述商品信息包括标题文本及商品图片;
分别对所述标题文本和商品图片提取其相应的文本特征向量和图片特征向量;
根据所述文本特征向量和/或图片特征向量对商品对象进行分类,获得该商品对象相应的类目标签;
将所述文本特征向量和/或图片特征向量存储为关联于相应的商品对象的所述综合特征向量。
3.根据权利要求2所述的同款商品聚合方法,其特征在于,将所述文本特征向量和/或图片特征向量存储为关联于相应的商品对象的所述综合特征向量,包括如下步骤:
调用预设的文本特征提取模型,对所述商品信息进行文本特征提取,获得其文本特征向量;
调用预设的图片特征提取模型,对所述商品信息进行图像特征提取,获取其图片特征向量;
将图片特征向量归一化为维度与所述文本特征向量相同的单个高维向量后,与该文本特征向量进行拼接获得综合特征向量。
4.根据权利要求1所述的同款商品聚合方法,其特征在于,获取商品对象的商品信息相对应的综合特征向量,计算同一类目标签下两两商品对象构成的商品组合之间的相似度,包括如下步骤:
获取商品对象预存储的综合特征向量;
计算同一类目标签下两两商品对象所构成的商品组合中两个综合特征向量之间的余弦距离作为两两商品对象之间的相似度;
存储各类目标签下各个商品组合中两两商品对象之间的所述相似度。
5.根据权利要求1所述的同款商品聚合方法,其特征在于,筛选出每个类目标签下相似度超过预设阈值的所述商品组合作为同款商品组合,包括如下步骤:
确定预设阈值;
获取同一类目标签下的商品组合对应的相似度,并与所述预设阈值比较;
当所述商品组合相应的相似度超过所述预设阈值,确定所述商品组合为同款商品组合。
6.根据权利要求5所述的同款商品聚合方法,其特征在于,确定所述预设阈值,包括如下步骤:
随机获取一批商品组合的相似度获取其属于同款或非同款的人工标注信息,从而确定相应的两个数据集;
根据相似度对该两个数据集进行正态分布统计,确定两个相应的正态分布曲线的交点相对应的相似度为第一阈值;
获取预先给定的第二阈值;
比较第一阈值与第二阈值,以其中最高者为所述的预设阈值。
7.根据权利要求1至6中任意一项所述的同款商品聚合方法,其特征在于,对所有同款商品组合进行聚合,获得每个类目标签相对应的同款商品列表,包括如下步骤:
针对每个类目标签,适用最大贪心匹配算法选出多个相似商品家族,每个相似商品家族为同一商品对象对应的多个同款商品组合构成的集合而包括多个商品对象,不同的相似商品家族所包含的商品对象互不相同;
确定同一相似商品家族中具有最大库存量的商品为代表商品,余者为被代表商品;
将每个相似商品家族转换为同款商品列表。
8.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7任意一项中所述方法的步骤。
CN202111233771.1A 2021-10-22 2021-10-22 同款商品聚合方法及其装置、设备、介质、产品 Pending CN113962773A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111233771.1A CN113962773A (zh) 2021-10-22 2021-10-22 同款商品聚合方法及其装置、设备、介质、产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111233771.1A CN113962773A (zh) 2021-10-22 2021-10-22 同款商品聚合方法及其装置、设备、介质、产品

Publications (1)

Publication Number Publication Date
CN113962773A true CN113962773A (zh) 2022-01-21

Family

ID=79466405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111233771.1A Pending CN113962773A (zh) 2021-10-22 2021-10-22 同款商品聚合方法及其装置、设备、介质、产品

Country Status (1)

Country Link
CN (1) CN113962773A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114219589A (zh) * 2022-02-21 2022-03-22 浙江口碑网络技术有限公司 虚拟实体对象的生成和页面显示方法、装置和电子设备
CN114971814A (zh) * 2022-06-24 2022-08-30 浪潮通用软件有限公司 一种采购系统的商品组装的方法、装置、设备及介质
CN115545808A (zh) * 2022-12-02 2022-12-30 广州数说故事信息科技有限公司 电商商品的数据对齐方法、装置和设备
CN116778011A (zh) * 2023-05-22 2023-09-19 阿里巴巴(中国)有限公司 图像生成方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114219589A (zh) * 2022-02-21 2022-03-22 浙江口碑网络技术有限公司 虚拟实体对象的生成和页面显示方法、装置和电子设备
CN114219589B (zh) * 2022-02-21 2023-02-10 浙江口碑网络技术有限公司 虚拟实体对象的生成和页面显示方法、装置和电子设备
CN114971814A (zh) * 2022-06-24 2022-08-30 浪潮通用软件有限公司 一种采购系统的商品组装的方法、装置、设备及介质
CN115545808A (zh) * 2022-12-02 2022-12-30 广州数说故事信息科技有限公司 电商商品的数据对齐方法、装置和设备
CN116778011A (zh) * 2023-05-22 2023-09-19 阿里巴巴(中国)有限公司 图像生成方法

Similar Documents

Publication Publication Date Title
CN113962773A (zh) 同款商品聚合方法及其装置、设备、介质、产品
US8645291B2 (en) Encoding of data for processing in a spatial and temporal memory system
US8825565B2 (en) Assessing performance in a spatial and temporal memory system
US20230102337A1 (en) Method and apparatus for training recommendation model, computer device, and storage medium
US20130054552A1 (en) Automated search for detecting patterns and sequences in data using a spatial and temporal memory system
CN114663197A (zh) 商品推荐方法及其装置、设备、介质、产品
CN114638646A (zh) 广告投放推荐方法及其装置、设备、介质、产品
CN113869048A (zh) 商品对象搜索方法及其装置、设备、介质、产品
CN112256977B (zh) 组件化商品推荐方法、计算设备和计算机存储介质
CN113850201A (zh) 跨模态商品分类方法及其装置、设备、介质、产品
CN113918554A (zh) 商品数据清洗方法及其装置、设备、介质、产品
CN115018549A (zh) 广告文案生成方法及其装置、设备、介质、产品
CN115545832A (zh) 商品搜索推荐方法及其装置、设备、介质
CN113793182A (zh) 商品对象推荐方法及其装置、设备、介质、产品
CN113792786A (zh) 商品对象自动分类方法及其装置、设备、介质、产品
CN113689233A (zh) 广告投放选品方法及其相应的装置、设备、介质
CN115099854A (zh) 广告文案创作方法及其装置、设备、介质、产品
CN114626926A (zh) 商品搜索类目识别方法及其装置、设备、介质、产品
CN112989182B (zh) 信息处理方法、装置、信息处理设备及存储介质
CN113806537A (zh) 商品类目分类方法及其装置、设备、介质、产品
CN113627995A (zh) 商品推荐列表更新方法及其装置、设备、介质、产品
CN111225009A (zh) 用于生成信息的方法和装置
CN116823404A (zh) 商品组合推荐方法及其装置、设备、介质
CN115292603A (zh) 商品搜索方法及其装置、设备、介质
CN116029793A (zh) 商品推荐方法及其装置、设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination