CN110648206A - 商品属性识别方法、装置、电子设备及可读存储介质 - Google Patents

商品属性识别方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN110648206A
CN110648206A CN201910896809.XA CN201910896809A CN110648206A CN 110648206 A CN110648206 A CN 110648206A CN 201910896809 A CN201910896809 A CN 201910896809A CN 110648206 A CN110648206 A CN 110648206A
Authority
CN
China
Prior art keywords
commodity
attribute
identified
attribute identification
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910896809.XA
Other languages
English (en)
Inventor
黄楷
梁新敏
陈羲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miaozhen Information Technology Co Ltd
Miaozhen Systems Information Technology Co Ltd
Original Assignee
Miaozhen Systems Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miaozhen Systems Information Technology Co Ltd filed Critical Miaozhen Systems Information Technology Co Ltd
Priority to CN201910896809.XA priority Critical patent/CN110648206A/zh
Publication of CN110648206A publication Critical patent/CN110648206A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0627Directed, with specific intent or strategy using item specifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种商品属性识别方法、装置、电子设备及可读存储介质,涉及互联网技术领域。该方法包括:基于构建的异构信息网络获取待识别商品的特征信息;根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果。该方案通过异构信息网络来获得待识别商品的特征信息,直接可根据待识别商品的特征信息来对待识别商品进行属性识别,获得属性识别结果,而无需人工进行属性识别,减少了人力资源的耗费。

Description

商品属性识别方法、装置、电子设备及可读存储介质
技术领域
本申请涉及互联网技术领域,具体而言,涉及一种商品属性识别方法、装置、电子设备及可读存储介质。
背景技术
随着电商行业的发展,给用户的生活带来了极大的便利。电商平台通常会在允许客户为其所售卖的商品添加对应的属性信息,如商品的种类、受众人群、颜色等,使得用户便于根据商品的属性信息进行商品分类搜索。
但是由于商品的种类和数目繁多,且每种商品具有多种属性信息,而目前往往需要人工去识别商品的属性,然后再为每个商品添加对应的属性信息,需要耗费大量的人力资源。
发明内容
本申请实施例的目的在于提供一种商品属性识别方法、装置、电子设备及可读存储介质,用以改善现有技术中通过人工识别大量商品的属性信息导致大量人力资源耗费的问题。
第一方面,本申请实施例提供了一种商品属性识别方法,包括:基于构建的异构信息网络获取待识别商品的特征信息;根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果。
在上述实现过程中,通过异构信息网络来获得待识别商品的特征信息,直接可根据待识别商品的特征信息来对待识别商品进行属性识别,获得属性识别结果,而无需人工进行属性识别,减少了人力资源的耗费。
可选地,所述基于构建的异构信息网络获取待识别商品的特征信息,包括:确定所述待识别商品在所述异构信息网络中的元路径,其中,所述元路径为包含有所述待识别商品的用户行为路径;基于所述元路径获取所述待识别商品的特征信息。
在上述实现过程中,通过基于异构信息网络中的元路径来获得待识别商品的特征信息,无需对待识别商品进行特征识别,该方式即可简单快速获得待识别商品的特征信息。
可选地,所述基于所述元路径获取所述待识别商品的特征信息,包括:通过嵌入表示模型获得所述待识别商品在所述元路径中的嵌入表达信息,其中,所述嵌入表达信息为所述待识别商品的特征信息。
在上述实现过程中,通过嵌入表示模型获得待识别商品的嵌入表达信息,使得该待识别商品的特征信息可以学习到待识别商品所在的元路径中其邻居节点的特征信息。
可选地,所述基于构建的异构信息网络获取待识别商品的特征信息之前,还包括:获取用户对多个商品中每个商品对应的行为类型信息;基于所述行为类型信息构建所述异构信息网络。
在上述实现过程中,通过预先基于用户对商品的行为类型信息构建异构信息网络,使得便于可以基于异构信息网络提取商品的特征信息。
可选地,所述行为类型信息包括点击商品行为、购买商品行为以及将商品加入购物车行为中的至少一种。
可选地,所述根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果,包括:将所述待识别商品的特征信息输入至预先训练的多个属性识别模型中,通过所述多个属性识别模型对所述待识别商品进行属性识别,获得多个初始属性识别结果;基于所述多个初始属性识别结果确定所述待识别商品最终的属性识别结果。
在上述实现过程中,通过属性识别模型对待识别商品进行属性识别,然后从多个初始属性识别结果中确定最终的属性识别结果,从而可以更为准确地获得待识别商品的属性。
可选地,所述基于所述多个初始属性识别结果确定所述待识别商品最终的属性识别结果,包括:对所述多个初始属性识别结果进行筛选,获得所述待识别商品最终的属性识别结果。
在上述实现过程中,从多个初始属性识别结果中筛选出最终的属性识别结果,从而可以将初始属性识别结果中不准确的属性识别结果进行剔除,获得较为准确的最终的属性识别结果。
可选地,每个所述初始属性识别结果包括属性对应的概率值,所述对所述多个初始属性识别结果进行筛选,获得所述待识别商品最终的属性识别结果,包括:筛选出所述多个初始属性识别结果中的属性对应的概率值大于预设值的目标属性,所述目标属性为所述待识别商品最终的属性识别结果。
在上述实现过程中,从多个初始属性识别结果中筛选出概率值较大的目标属性,使得属性识别的准确性更高。
可选地,每个所述属性识别模型为二分类逻辑回归模型。
可选地,所述根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果之后,还包括:为所述待识别商品添加所述属性识别结果中对应的属性。
在上述实现过程中,为待识别商品添加对应的属性,而无需人工进行属性添加,减少了人力资源的耗费。
第二方面,本申请实施例提供了一种商品属性识别装置,包括:
特征信息获取模块,用于基于构建的异构信息网络获取待识别商品的特征信息;
属性识别模块,用于根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果。
可选地,所述特征信息获取模块,用于确定所述待识别商品在所述异构信息网络中的元路径,其中,所述元路径为包含有所述待识别商品的用户行为路径;基于所述元路径获取所述待识别商品的特征信息。
可选地,所述特征信息获取模块,还用于通过嵌入表示模型获得所述待识别商品在所述元路径中的嵌入表达信息,其中,所述嵌入表达信息为所述待识别商品的特征信息。
可选地,所述装置还包括:
异构信息网络构建模块,用于获取用户对多个商品中每个商品对应的行为类型信息;基于所述行为类型信息构建所述异构信息网络。
可选地,所述行为类型信息包括点击商品行为、购买商品行为以及将商品加入购物车行为中的至少一种。
可选地,所述属性识别模块,用于将所述待识别商品的特征信息输入至预先训练的多个属性识别模型中,通过所述多个属性识别模型对所述待识别商品进行属性识别,获得多个初始属性识别结果;基于所述多个初始属性识别结果确定所述待识别商品最终的属性识别结果。
可选地,所述属性识别模块,用于对所述多个初始属性识别结果进行筛选,获得所述待识别商品最终的属性识别结果。
可选地,每个所述初始属性识别结果包括属性对应的概率值,所述属性识别模块,用于筛选出所述多个初始属性识别结果中的属性对应的概率值大于预设值的目标属性,所述目标属性为所述待识别商品最终的属性识别结果。
可选地,每个所述属性识别模型为二分类逻辑回归模型。
可选地,所述装置还包括:
属性添加模块,用于为所述待识别商品添加所述属性识别结果中对应的属性。
第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种电子设备的结构示意图;
图2为本申请实施例提供的一种信息网络的示意图;
图3为本申请实施例提供的一种异构信息网络的示意图;
图4为本申请实施例提供的一种商品属性识别方法的流程图;
图5为本申请实施例提供的一种元路径的示意图;
图6为本申请实施例提供的一种商品属性识别装置的结构框图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供的商品属性识别方法,可以通过构建的异构信息网络获取商品的特征信息,然后根据特征信息对商品进行属性识别,获得属性识别结果,而无需人工进行属性识别,减少了人力资源的耗费,并且,本方案无需对商品进行自然语言处理或图像识别来获得商品的特征信息,而是直接从异构信息网络中即可获得对应的商品的特征信息,实现对商品属性的识别,简单快捷。
请参照图1,图1为本申请实施例提供的一种电子设备的结构示意图,所述电子设备可以包括:至少一个处理器110,例如CPU,至少一个通信接口120,至少一个存储器130和至少一个通信总线140。其中,通信总线140用于实现这些组件直接的连接通信。其中,本申请实施例中设备的通信接口120用于与其他节点设备进行信令或数据的通信。存储器130可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器130可选的还可以是至少一个位于远离前述处理器的存储装置。存储器130中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器110执行时,电子设备执行下述图4所示方法过程。例如,存储器130可以用于存储异构信息网络以及商品的特征信息等,处理器110可用于通过构建的异构信息网络获取商品的特征信息,然后根据特征信息对商品进行属性识别,获得属性识别结果。
在介绍本申请的具体实施例之前,先对异构信息网络进行简单介绍。
信息网络可以用一个有向图G=(V,E)来表示,其中,V代表对象集,E代表连接集,并且用映射函数φ:V→A来表示每一个object v∈V属于对象类型集合A:φ(v)∈A,用映射函数
Figure BDA0002209701250000061
表示每条边e∈E属于边的类型集合如图2所示。
如果|A|>1或|R|>1,即节点的类型或边的类型大于1时,则该信息网络为异构信息网络,或者简称为异构网络,否则为同构网络。
异构信息网络的概要图即用类型表示,图中的节点和边都可以有不同的类型,节点可以代表不同类型的实体,如本申请实施例中代表用户、商品等,边代表不同类型的关系,如点击、购买、加入购物车等。本申请实施例中通过获取多个商品中每个商品的行为类型信息,对每种不同的行为类型信息定义为概要图中不同的边,其中,行为类型信息可以是指用户在电商平台上针对商品的操作行为类型,如行为类型信息包括点击商品行为、购买商品行为、浏览商品行为以及将商品加入购物车行为中的至少一种,即可基于用户的行为类型信息构建异构信息网络,其中,异构信息网络可以通过开源库neo4j或者networkx构建,构建的异构信息网络可以如图3所示。
其中,获取用户的行为类型信息可以是多个用户在特定时间段内的行为类型信息,如一周或者一个月等。
请参照图4,图4为本申请实施例提供的一种商品属性识别方法的流程图,该方法包括如下步骤:
步骤S110:基于构建的异构信息网络获取待识别商品的特征信息。
其中,待识别商品是指需要进行属性识别的任一商品,待识别商品的特征信息可以是指待识别商品在异构信息网络中的嵌入表达特征,即嵌入表示。在进行嵌入表示时,异构信息网络中的节点本身及其邻居节点的属性或特征编码进向量中,从而引入了更多特征信息,从而使得在邻居节点间共享了一些特征或参数,这样就使得各个商品可以学习到邻居商品对应的特征信息,如属性,例如,如用户访问了商品a,然后接着访问商品b,则认为商品b和商品a可能属性相同。所以,通过获取待识别商品的特征信息则可从异构信息网络中学习到该待识别商品相邻的其他商品的属性信息。
步骤S120:根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果。
在上述获得待识别商品的特征信息后,由于该待识别商品的特征信息中可能包含有其他商品的属性信息,则可基于该待识别商品的特征信息对待识别商品进行属性识别,从而可获得待识别商品的相关属性。
其中,商品的属性可以理解为商品具有的特征属性,如某个商品为运动衣,则其属性可以为运动,如某个商品为薯片,则其属性可以为零食、食品等。当然,每个商品的属性还可以为其他,如颜色、受众人群等,且每个商品的属性可以为一个,也可以为多个,这些属性可以预先定义,即预先定义多个属性,如运动、食品、零食、医疗设备、健身器材等属性。在获得待识别商品的特征信息后,可以对待识别商品的特征信息进行分析,从而可以获得特征信息所对应的属性即可。
在上述实现过程中,可以通过构建的异构信息网络获取商品的特征信息,然后根据特征信息对商品进行属性识别,获得属性识别结果,而无需人工进行属性识别,减少了人力资源的耗费,并且,本方案无需对商品进行自然语言处理或图像识别来获得商品的特征信息,而是直接从异构信息网络中即可获得对应的商品的特征信息,实现对商品属性的识别,简单快捷。
作为一种示例,基于异构信息网络获取待识别商品的特征信息的过程可以为:确定待识别商品在异构信息网络中的元路径,其中,该元路径为包含有待识别商品的用户行为路径,然后基于该元路径获取待识别商品的特征信息。
其中,异构信息网络和传统网络的区别在于异构信息网络有类型的对象和连接,网络模式能够提供异构信息网络的高级描述。网络模式是定义在对象类型A和关系类型R上的一个有向图,是信息网络的元描述S=(A,R),包含对象类型的映射φ:V→A和关系类型的映射
Figure BDA0002209701250000091
其中,元路径是定义在网络模式上的链接两类对象的一条路径,形式化定义为
Figure BDA0002209701250000092
定义类型A1和AL之间的混合连接R=R1·R2·...·RL,其中,·表示关系之间的复合算子,L是元路径的长度,即元路径的长度为关系R的个数,Ai表示对象类型,Ri表示关系类型。如图3所示,方框内表示节点,即对象类型,边表示行为类型信息,即各个节点之间的关系类型,即本申请实施例中的元路径可以理解为包含有商品节点的路径,如商品a的元路径可以示例为
Figure BDA0002209701250000093
Figure BDA0002209701250000094
可以理解地,对于每个商品的元路径可以有多条,且每个商品对应的元路径可能相同,如商品c的元路径也可包括有
Figure BDA0002209701250000095
其中,可以对异构信息网络进行随机游走,以获得多条元路径,然后从多条元路径中提取出包含有待识别商品的元路径。例如,可以基于上述异构信息网络对应的概要图,利用广度优先遍历算法来获取元路径,如可以采用广度优先遍历算法在概要图中从用户类型节点出发直到另一个商品类型节点结束。而实际应用中,由于概要图中可能存在双向边,遍历算法不会自然结束,所以可以指定元路径的长度作为约束条件,当遍历的路径长度超过该长度时停止遍历。
如图5所示为元路径的示意图,其中,对于商品a,其元路径可以为用户A点击商品a,或者用户B点击商品a,或者点击商品a,或者用户B点击商品a加入购物车商品b等多条包含有该商品a的元路径。
在获得包含有待识别商品的元路径后,可以获取每条元路径中每个商品的低维度嵌入表达信息,即获取每个商品的特征信息,可以通过异构网络表示学习进行获取。
异构网络表示学习是给定一个异构网络G,然后将图中的节点v表示成一个低维向量X∈R|V|×d,d<<|V|,用于学习出图中节点的结构和语义相关性。而为了从异构信息网络中获取商品这样的特征信息,可以采用网络表示学习法,也就是网络嵌入方法,网络嵌入方法是获得一个隐式表达矩阵在同一个向量空间来表达异构信息网络中的节点,即网络嵌入方法的中心思想就是找到一种映射函数,该函数将网络中的每个节点转换为低维度的潜在表示。
所以,可以使用网络表示学习方法获取异构信息网络中各个商品节点的特征向量,其中网络表示学习方法可以采用嵌入表示模型来获得待识别商品在元路径中的嵌入表达信息(即特征信息),例如,嵌入表示模型可以为深度游走(Deep Walk,DW)模型、大规模信息网络嵌入(Large-scale Information Network Embedding,LINE)模型、Node2vec模型、结构深层网络嵌入(structural Deep Network Embedding,SDNE)模型中的一种。其中,采用具体的嵌入表示模型进行嵌入表达信息的获取在此不详细介绍。
由于可以预先对嵌入表示模型进行训练,在训练过程中,给定两个商品节点,以两个商品的嵌入表达信息为标签数据,输入两个商品共同出现的概率,以此来训练嵌入表示模型,使得两个商品节点共同出现的概率与其在元路径中出现的概率尽量相等,误差最小,其中,概率的表达式如
Figure BDA0002209701250000101
其中,P(Oi,Oj)表示两个商品共同出现的概率,Vi,Vj分别为两个商品的嵌入表达信息。由此,可通过训练好的嵌入表示模型输入两个商品共同出现的概率,以通过模型输出两个商品的嵌入表达信息。
由此,可直接通过嵌入表示模型获得待识别商品的特征信息,使得该待识别商品的特征信息可以学习到待识别商品所在的元路径中其邻居节点的特征信息。
作为一种示例,在对待识别商品进行属性识别时,可以将待识别商品的特征信息输入至预先训练的多个属性识别模型中,通过多个属性识别模型对待识别商品进行属性识别,获得多个初始属性识别结果,然后基于多个初始属性识别结果确定待识别商品的最终的属性识别结果。
其中,由于每个商品可能具有多个属性,例如,运动和篮球等,这些属性预测属于非互斥二分类问题,所以,需要预先训练多个属性识别模型,即针对每种属性均对应训练一个属性识别模型,然后分别将待识别商品的特征信息输入每个属性识别模型中,由每个属性识别模型对待识别商品进行属性识别,从而获得对应的初始属性识别结果。
作为一种示例,每个属性识别模型可以为二分类逻辑回归模型,具体可以如K近邻法(k-Nearest Neighbor,KNN)、支持向量机(Support Vector Machine,SVM)等。
由于可预先针对商品的每种属性对属性识别模型进行训练,如获取属于同一种属性的多个商品,将商品的特征信息作为属性识别模型的输入数据,将商品的属性作为属性识别模型的标签数据,对属性识别模型进行训练,在训练完成后,即可利用训练完成的属性识别模型对待识别商品进行属性识别。其中,对属性识别模型的训练过程在此不做详细介绍。
在上述实现过程中,通过属性识别模型对待识别商品进行属性识别,然后从多个初始属性识别结果中确定最终的属性识别结果,从而可以更为准确地获得待识别商品的属性。
由于每个属性识别模型输出的结果为对待识别商品的属性的预测结果,所以还可以对多个初始属性识别结果进行筛选,获得待识别商品最终的属性识别结果。
例如,可以将多个初始属性识别结果中不符合要求的属性识别结果进行剔除,剩下的初始识别结果为待识别商品最终的属性识别结果。例如,属性识别模型1输出的初始属性识别结果为运动属性,属性识别模型2输出的初始属性识别结果为篮球属性,属性识别模型3输出的初始属性识别结果为食品属性,属性识别模型4输出的初始属性识别结果为健身属性,所以,可以对这些初始属性识别结果进行分析,如分析获得属性识别模型3输出的属性结果明显与其他属性识别模型输出的属性识别结果不相关,则可知属性识别模型3输出的属性识别结果可能为错误的结果,所以,可以剔除属性识别模型3输出的属性识别结果,其他属性识别模型输出的属性识别结果可作为待识别商品最终的属性识别结果。
在上述实现过程中,从多个初始属性识别结果中筛选出最终的属性识别结果,从而可以将初始属性识别结果中不准确的属性识别结果进行剔除,获得较为准确的最终的属性识别结果。
另外,属性识别模型输出的初始属性识别结果包括属性对应的概率值,则可以筛选多个初始属性识别结果中的属性对应的概率值大于预设值的目标属性,该目标属性为待识别商品最终的属性识别结果。
例如,属性识别模型1输出的属性为运动属性对应的概率值:0.9,属性识别模型2输出的属性为篮球属性对应的概率值:0.4,属性识别模型3输出的属性为球类属性对应的概率值:0.6,若预设值设置为0.5,则可筛选出概率值大于0.5的属性,由此可获得目标属性包括运动属性与球类属性,该目标属性即为待识别商品最终的属性识别结果。
另外,预设值可以根据实际需求进行设置,如为了获得更准确的属性,可以将预设值设置较高一些。当然,预设值还可以为各个属性对应的概率值的平均值,如上述的预设值即可为0.63,如此,则目标属性为运动属性。
在上述实现过程中,从多个初始属性识别结果中筛选出概率值较大的目标属性,使得属性识别的准确性更高。
作为一种示例,在获得待识别商品的属性识别结果后,可为所述待识别商品添加所述属性识别结果中对应的属性。
例如,在获得上述的待识别商品最终的属性识别结果包括的目标属性为运动属性和球类属性,则可以为待识别商品添加运动属性和球类属性,由此无需人工进行属性添加,减少了人力资源的耗费。
另外,在为每个商品添加其对应的属性后,可以获取用户的行为记录,以为用户进行商品推荐,例如,可以获取用户在电商平台上的行为记录,对其行为记录进行分析,以分析获得其感兴趣的商品的属性,从而可对该用户进行相关属性的商品的推荐,例如,若某一段时间内用户经常浏览属性为“短袖上衣”的商品,则可针对该用户推荐属性相同或相关的其他商品,如属性为“短袖衬衫”、“短袖蕾丝上衣”之类的商品。由此,可通过上述过程识别出商品的属性后,在对用户进行商品推荐时,可基于商品的属性更加准确地为用户进行相关商品的推荐。
或者,用户一般在进行商品搜索时,一般会基于商品的属性进行搜索,如用户输入“秋衣”的信息进行搜索,表示该用户想要搜索属性为“秋衣”之类的商品,则可基于该属性获取与该属性相同或相关的其他属性的商品,则可基于用户输入的信息为该用户返回对应的商品,从而在识别商品的属性后,可以更加准确地为用户返回对应的搜索结果。
请参照图6,图6为本申请实施例提供的一种商品属性识别装置200的结构框图,该装置200可以是电子设备上的模块、程序段或代码。应理解,该装置200与上述图4方法实施例对应,能够执行图4方法实施例涉及的各个步骤,该装置200具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。
可选地,该装置200包括:
特征信息获取模块210,用于基于构建的异构信息网络获取待识别商品的特征信息;
属性识别模块220,用于根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果。
可选地,所述特征信息获取模块210,用于确定所述待识别商品在所述异构信息网络中的元路径,其中,所述元路径为包含有所述待识别商品的用户行为路径;基于所述元路径获取所述待识别商品的特征信息。
可选地,所述特征信息获取模块210,还用于通过嵌入表示模型获得所述待识别商品在所述元路径中的嵌入表达信息,其中,所述嵌入表达信息为所述待识别商品的特征信息。
可选地,所述装置200还包括:
异构信息网络构建模块,用于获取多个商品中每个商品对应的行为类型信息;基于所述行为类型信息构建所述异构信息网络。
可选地,所述行为类型信息包括点击商品行为、购买商品行为以及将商品加入购物车行为中的至少一种。
可选地,所述属性识别模块220,用于将所述待识别商品的特征信息输入至预先训练的多个属性识别模型中,通过所述多个属性识别模型对所述待识别商品进行属性识别,获得多个初始属性识别结果;基于所述多个初始属性识别结果确定所述待识别商品最终的属性识别结果。
可选地,所述属性识别模块220,用于对所述多个初始属性识别结果进行筛选,获得所述待识别商品最终的属性识别结果。
可选地,每个所述初始属性识别结果包括属性对应的概率值,所述属性识别模块220,用于筛选出所述多个初始属性识别结果中的属性对应的概率值大于预设值的目标属性,所述目标属性为所述待识别商品最终的属性识别结果。
可选地,每个所述属性识别模型为二分类逻辑回归模型。
可选地,所述装置200还包括:
属性添加模块,用于为所述待识别商品添加所述属性识别结果中对应的属性。
本申请实施例提供一种可读存储介质,所述计算机程序被处理器执行时,执行如图4所示方法实施例中电子设备所执行的方法过程。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如,包括:基于构建的异构信息网络获取待识别商品的特征信息;根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果。
综上所述,本申请实施例提供一种商品属性识别方法、装置、电子设备及可读存储介质,该方法通过异构信息网络来获得待识别商品的特征信息,直接可根据待识别商品的特征信息来对待识别商品进行属性识别,获得属性识别结果,而无需人工进行属性识别,减少了人力资源的耗费。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (13)

1.一种商品属性识别方法,其特征在于,包括:
基于构建的异构信息网络获取待识别商品的特征信息;
根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果。
2.根据权利要求1所述的方法,其特征在于,所述基于构建的异构信息网络获取待识别商品的特征信息,包括:
确定所述待识别商品在所述异构信息网络中的元路径,其中,所述元路径为包含有所述待识别商品的用户行为路径;
基于所述元路径获取所述待识别商品的特征信息。
3.根据权利要求2所述的方法,其特征在于,所述基于所述元路径获取所述待识别商品的特征信息,包括:
通过嵌入表示模型获得所述待识别商品在所述元路径中的嵌入表达信息,其中,所述嵌入表达信息为所述待识别商品的特征信息。
4.根据权利要求1所述的方法,其特征在于,所述基于构建的异构信息网络获取待识别商品的特征信息之前,还包括:
获取多个商品中每个商品对应的行为类型信息;
基于所述行为类型信息构建所述异构信息网络。
5.根据权利要求4所述的方法,其特征在于,所述行为类型信息包括点击商品行为、购买商品行为以及将商品加入购物车行为中的至少一种。
6.根据权利要求1所述的方法,其特征在于,所述根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果,包括:
将所述待识别商品的特征信息输入至预先训练的多个属性识别模型中,通过所述多个属性识别模型对所述待识别商品进行属性识别,获得多个初始属性识别结果;
基于所述多个初始属性识别结果确定所述待识别商品最终的属性识别结果。
7.根据权利要求6所述的方法,其特征在于,所述基于所述多个初始属性识别结果确定所述待识别商品最终的属性识别结果,包括:
对所述多个初始属性识别结果进行筛选,获得所述待识别商品最终的属性识别结果。
8.根据权利要求7所述的方法,其特征在于,每个所述初始属性识别结果包括属性对应的概率值,所述对所述多个初始属性识别结果进行筛选,获得所述待识别商品最终的属性识别结果,包括:
筛选出所述多个初始属性识别结果中的属性对应的概率值大于预设值的目标属性,所述目标属性为所述待识别商品最终的属性识别结果。
9.根据权利要求6所述的方法,其特征在于,每个所述属性识别模型为二分类逻辑回归模型。
10.根据权利要求1-9任一所述的方法,其特征在于,所述根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果之后,还包括:
为所述待识别商品添加所述属性识别结果中对应的属性。
11.一种商品属性识别装置,其特征在于,包括:
特征信息获取模块,用于基于构建的异构信息网络获取待识别商品的特征信息;
属性识别模块,用于根据所述待识别商品的特征信息对所述待识别商品进行属性识别,获得属性识别结果。
12.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-10任一所述方法中的步骤。
13.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-10任一所述方法中的步骤。
CN201910896809.XA 2019-09-20 2019-09-20 商品属性识别方法、装置、电子设备及可读存储介质 Pending CN110648206A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910896809.XA CN110648206A (zh) 2019-09-20 2019-09-20 商品属性识别方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910896809.XA CN110648206A (zh) 2019-09-20 2019-09-20 商品属性识别方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN110648206A true CN110648206A (zh) 2020-01-03

Family

ID=68992532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910896809.XA Pending CN110648206A (zh) 2019-09-20 2019-09-20 商品属性识别方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN110648206A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257737A (zh) * 2020-06-29 2021-01-22 北京沃东天骏信息技术有限公司 异常商品对象的识别方法、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140279263A1 (en) * 2013-03-13 2014-09-18 Truecar, Inc. Systems and methods for providing product recommendations
CN105469263A (zh) * 2014-09-24 2016-04-06 阿里巴巴集团控股有限公司 一种商品推荐方法及装置
CN107103514A (zh) * 2017-04-25 2017-08-29 北京京东尚科信息技术有限公司 商品性别标签确定方法和装置
CN107862561A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种基于图片属性提取建立用户兴趣库的方法及设备
US20190095973A1 (en) * 2017-09-28 2019-03-28 International Business Machines Corporation Desirability of product attributes
CN109766955A (zh) * 2019-02-12 2019-05-17 深圳乐信软件技术有限公司 性别识别方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140279263A1 (en) * 2013-03-13 2014-09-18 Truecar, Inc. Systems and methods for providing product recommendations
CN105469263A (zh) * 2014-09-24 2016-04-06 阿里巴巴集团控股有限公司 一种商品推荐方法及装置
CN107103514A (zh) * 2017-04-25 2017-08-29 北京京东尚科信息技术有限公司 商品性别标签确定方法和装置
CN107862561A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种基于图片属性提取建立用户兴趣库的方法及设备
US20190095973A1 (en) * 2017-09-28 2019-03-28 International Business Machines Corporation Desirability of product attributes
CN109766955A (zh) * 2019-02-12 2019-05-17 深圳乐信软件技术有限公司 性别识别方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257737A (zh) * 2020-06-29 2021-01-22 北京沃东天骏信息技术有限公司 异常商品对象的识别方法、设备及存储介质

Similar Documents

Publication Publication Date Title
US9449326B2 (en) Web site accelerator
CN111444334B (zh) 数据处理方法、文本识别方法、装置及计算机设备
US10664888B2 (en) Method and system for attribute extraction from product titles using sequence labeling algorithms
US11550856B2 (en) Artificial intelligence for product data extraction
CN113449187B (zh) 基于双画像的产品推荐方法、装置、设备及存储介质
CN110580489B (zh) 一种数据对象的分类系统、方法以及设备
Bakaev et al. Auto-extraction and integration of metrics for web user interfaces
JP2009193098A (ja) 情報処理装置、情報処理方法、およびプログラム
Zhong et al. Predicting pinterest: Automating a distributed human computation
CN113592605B (zh) 基于相似产品的产品推荐方法、装置、设备及存储介质
CN113781149A (zh) 信息推荐方法、装置、计算机可读存储介质及电子设备
CN110489613B (zh) 协同可视数据推荐方法及装置
CN112307337A (zh) 基于标签知识图谱的关联推荐方法、装置及计算机设备
CN111523315B (zh) 数据处理方法、文本识别方法、装置及计算机设备
CN115659008A (zh) 大数据信息反馈的信息推送系统、方法、电子设备及介质
CN116308683B (zh) 基于知识图谱的服装品牌定位推荐方法、设备及存储介质
CN110648206A (zh) 商品属性识别方法、装置、电子设备及可读存储介质
WO2022003392A1 (en) System and method for automatic detection of webpage zones of interest
CN115618126A (zh) 搜索处理方法、系统、计算机可读存储介质及计算机设备
CN115204971A (zh) 产品推荐方法、装置、电子设备及计算机可读存储介质
CN112307298B (zh) 个人品牌标签的生成方法及其装置
CN108805290B (zh) 一种实体类别的确定方法及装置
CN112632275A (zh) 基于个人文本信息的人群聚类数据处理方法、装置及设备
CN112069423A (zh) 一种信息推荐方法、装置、存储介质及计算机设备
CN112989020A (zh) 信息处理方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200103

RJ01 Rejection of invention patent application after publication