CN107292365B - 商品标签的绑定方法、装置、设备及计算机可读存储介质 - Google Patents

商品标签的绑定方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN107292365B
CN107292365B CN201710500889.3A CN201710500889A CN107292365B CN 107292365 B CN107292365 B CN 107292365B CN 201710500889 A CN201710500889 A CN 201710500889A CN 107292365 B CN107292365 B CN 107292365B
Authority
CN
China
Prior art keywords
commodity
target
label
binding
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710500889.3A
Other languages
English (en)
Other versions
CN107292365A (zh
Inventor
余路
刘源旭
史南胜
梁婵婵
李廷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710500889.3A priority Critical patent/CN107292365B/zh
Publication of CN107292365A publication Critical patent/CN107292365A/zh
Application granted granted Critical
Publication of CN107292365B publication Critical patent/CN107292365B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • G06K17/0016Selecting or retrieving of images by means of their associated code-marks, e.g. coded microfilm or microfiche

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种商品标签的绑定方法、装置、设备及计算机可读存储介质。该方法包括:根据商品分类中商品的第一商品信息确定第一标签以及第一标签的关联词汇;基于主题与商品分类的绑定关系确定目标标签关联的目标商品,目标标签为任意一个第一标签;判断目标商品的第二商品信息与目标标签的关联词汇的匹配比例是否大于阈值;如果目标商品的第二商品信息与目标标签的关联词汇的匹配比例大于阈值,则将目标商品与目标标签进行绑定。本发明实施例能够实现准确的为目标商品添加标签,省略运营人员手工操作成本的同时也避免了人工带来的错误率,提高商品标签的绑定效率。

Description

商品标签的绑定方法、装置、设备及计算机可读存储介质
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种商品标签的绑定方法、装置、设备及计算机可读存储介质。
背景技术
当前电子商务网站(如百度糯米)已经从单一化的团购运营模式转变为区分垂直业务的精细化运营模式。由于仍然基于团购的分类体系,各垂直业务商品类别的划分粒度较粗,因而没法为用户提供精细化查找的功能。
现有技术为通过人工为商品添加标签,使得用户可通过标签进行精细化查找。但是在商品数量级较大时,人工为每个商品绑定标签的行为费时费力。此外,O2O(Online ToOffline,在线离线/线上到线下)领域类通常使用非标准化的标签,即没有固定标准衡量的定制化商品标签(如服务特色、适宜人群等),非标准化标签通过人工判断的误差率较高。
发明内容
本发明提供一种商品标签的绑定方法、装置、设备及计算机可读存储介质,以实现提高商品标签准确度,提高标签添加效率。
第一方面,本发明实施例提供了一种商品标签的绑定方法,包括:
根据商品分类中商品的第一商品信息确定第一标签以及第一标签的关联词汇;
基于主题与商品分类的绑定关系确定目标标签关联的目标商品,目标标签为任意一个第一标签;
判断目标商品的第二商品信息与目标标签的关联词汇的匹配比例是否大于阈值;
如果目标商品的第二商品信息与目标标签的关联词汇的匹配比例大于阈值,则将目标商品与目标标签进行绑定。
第二方面,本发明实施例还提供了一种商品标签的绑定装置,包括:
关联词汇确定单元,用于根据商品分类中商品的第一商品信息确定第一标签以及第一标签的关联词汇;
目标商品确定单元,用于基于主题与商品分类的绑定关系确定目标标签关联的目标商品,目标标签为任意一个第一标签;
匹配比例判断单元,用于判断目标商品的第二商品信息与目标标签的关联词汇的匹配比例是否大于阈值;
商品标签绑定单元,用于如果目标商品的第二商品信息与目标标签的关联词汇的匹配比例大于阈值,则将目标商品与目标标签进行绑定。
第三方面,本发明实施例还提供了一种设备,设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面所示的商品标签的绑定方法。
第三方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所示的商品标签的绑定方法。
本发明实施例能够根据商品的第一商品信息确定出用于描述商品特征的第一标签以及第一标签的关联词汇,然后针对每个第一标签(即目标标签)基于主题与商品分类的绑定关系找到目标标签能够描述的同类的目标商品,然后根据目标商品的第二商品信息与该目标标签的关联词的匹配比例确定过是否将第一标签与目标商品进行绑定。现有技术由人工对每个发布的商品添加标签,操作效率低且添加的标签存在误差。本发明实施例由于关联词为目标标签的关联词汇,且关联词与目标商品的第二商品信息匹配,因此使用与关联词对应的目标标签与目标商品进行绑定时,能够实现准确的为目标商品添加标签,省略运营人员手工操作成本的同时也避免了人工带来的错误率,提高商品标签的绑定效率。
附图说明
图1是本发明实施例一中的一种商品标签的绑定方法的流程图;
图2是本发明实施例二中的一种商品标签的绑定方法的流程图;
图3是本发明实施例三中的一种商品标签的绑定装置的结构示意图;
图4是本发明实施例四中的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种商品标签的绑定方法的流程图,本实施例可适用于电子购物时为商品绑定标签的情况,该方法可以由提供电子商务功能的服务器或用户进行电子购物的终端来执行,其中用户进行电子购物的终端可以为智能手机、平板电脑或个人电脑(personal computer,PC)等。该方法具体包括如下步骤:
步骤110、根据商品分类中商品的第一商品信息确定第一标签以及第一标签的关联词汇。
可选的,第一商品信息包括商品标题和商品详细描述。商品标题为显示在终端商品列表中的信息。商品详细描述为商家提供的用于描述商品属性的信息,商品描述可以包括下述内容中的至少一个:商品规格、商品的有效日期、商品使用方法、商品作用、商品供应商、商品促销信息。
针对每个商品分类(又称商品细分类别),获取该商品分类中每个商品的第一商品信息,对第一商品信息进行分词处理后,根据分词后得到多个词汇的出现频次得到每个商品分类对应的多个第一标签,以及每个第一标签对应的至少一个关联词汇。可选的,商品分类还可以是垂直分类。
具体的,针对每个商品分类,获取该商品分类中全部N个商品的第一商品信息,得到N个第一商品信息。对N个第一商品信息进行分词处理,并统计分词得到的每个词汇在N个第一商品信息中出现的频次。将出现频次较高的M(M<N)个词汇确定为第一标签,得到M个第一标签。然后,这对每个第一标签X在M个第一标签中查找该第一标签X的关联词汇。
本发明实施例提供了一种标签的格式,标签包括标签标识、标签名称、所属主题、是否展示、展示权重以及关联词汇。相应的,在生成标签时,为标签配置下述至少一个字段:标签标识字段、标签名称字段、所属主题字段、关联词字段、展示方式字段和展示权限字段。
可选的,第一标签对应的词汇为标签名称。标签标识用于唯一标识标签。是否展示标识是否将标签展示在用户交互界面中。展示权重表示在展示时标签出现的顺序;可选的,展示权重越高标签展示顺序越靠前。关联词汇用于记载从第一商品信息中得到的与标签的标签名称存在关联的关联词汇。
步骤120、基于主题与商品分类的绑定关系确定目标标签关联的目标商品,目标标签为任意一个第一标签。
本发明各实施例可基于商品垂直业务分类下的商品展示结构及其对应的商品细分类别进行商品标签的绑定。可根据商品分类、商品类型以及商品来源对商品进行分类,得到多个垂直业务。其中,每个垂直业务会挂接到多个商品细分类别上,即用户进入每个垂直分类后,为用户展示该垂直分类涵盖的多个商品细分类别。商品类型包括实物商品和服务商品。例如:商品类型包括:物流商品、到店服务、上门服务、预约服务等。商品来源表示商品的供应商,商品来源包括电商自营、第三方商品等。
示例性的,分类得到的垂直业务为:美食、电影演出、酒店、外卖、休闲娱乐、火车票/机票、充值中心、旅游、聚会、丽人、亲子、购物、KTV、汽车、自助餐、结婚、生活服务、代金券等。
以美食垂直分类为例,进入美食垂直分类后,展示美食垂直分类挂接的商品细分类别。例如:自助餐、火锅、小吃快餐、西餐、中餐、聚餐、外卖、甜点饮品、烧烤银行特惠等。
进入到任意一个美食垂直分类挂接的商品细分类别后,显示该类别包含的具体商品信息。例如,用户点击自助餐后,显示自助餐细分类别对应的多个商品信息。每个商品信息对应一个商家公布的自助餐信息。
每个标签具有所属主题属性,在所属主题中记载有该标签隶属的主题。例如:所属主题为“身体部位”,标签名称为“头部”、“颈部”、“腿部”等。一个所属主题对应多个标签,每个标签只对应一个所属主题。
创建主题时首先将主题名称填写到隶属于该主题的各个标签中,主题支持修改和删除操作。当删除主题时,同步删除主题对应的全部标签。当对主题中某个标签进行删除或修改时,仅对该条标签进行删除或修改。
然后,建立主题与商品分类之间对应关系。商品分类和主题之间可以是多对多关系,即一个商品分类可以绑定多个主题,同时一个主题也可以被多个商品分类所绑定。当商品分类绑定了某个主题时,即表明该商品分类可以被主题所代表的标签维度所描述。
根据实际使用需求,可以将步骤110中根据商品分类中商品的第一商品信息确定第一标签以及第一标签的关联词汇,替换为根据垂直业务中商品的第一商品信息确定第一标签以及第一标签的关联词汇。可选的,建立主题与垂直业务之间对应关系,商品分类和主题之间可以是多对多关系。当垂直分类绑定了某个主题时,即表明该商品分类可以被主题所代表的标签维度所描述。
优选的,将目标标签对应的主题所绑定的商品分类包含的商品作为目标商品,其中,每个主题对应至少一个商品分类,每个商品分类对应至少一个主题。
对每个第一标签分别执行下述步骤:将选定的第一标签作为目标标签。在步骤110确定了目标标签以及目标标签的关联词汇后,根据标签所属主题以及主题与垂直业务(或商品分类)的对应关系,可查找到该垂直业务(或商品分类)下的商品。将查找到的商品确定为目标标签关联的目标商品。
步骤130、判断目标商品的第二商品信息与目标标签的关联词汇的匹配比例是否大于阈值。
所述第二商品信息包括商品标题、商品详细描述、消费提示以及商品所属的门店信息。第二商品信息涵盖用于描述商品的信息,若第二商品信息与目标标签的管理词汇匹配,则可统计目标商品的商品描述中关键词所占比例,如果该比例大于阈值,则确定目标标签是否适合用于描述该目标商品。预设比例可以为百分之十。
首先对目标商品的第二商品信息进行分词处理,得到多个分词词汇。获取目标标签对应的关联词汇。判断得到的多个分词词汇中出现的关联词汇,并统计这些关联词汇的出现次数。针对每个关联词汇,判断关联词汇的出现次数是否大于阈值。
进一步的,为了提高准确定,可以将目标标签的标签名称添加到关联词汇中进行匹配比例的判断。
进一步的,当检测到目标商品发布或目标商品的商品信息被修改时,判断所述目标商品的第二商品信息与所述目标标签的关联词汇的匹配比例是否大于阈值。
当目标商品进行发布或者目标商品的商品信息被修改时,重新对目标商品对应的目标标签进行更新,以提高数据的实时性和可靠性。
步骤140、如果目标商品的第二商品信息与目标标签的关联词汇的匹配比例大于阈值,则将目标商品与目标标签进行绑定。
将目标商品与目标标签进行绑定后,用户可根据标签选择目标商品。或者,服务商根据用户输入的检索词为查找相应目标标签,并根据目标标签查找目标商品。
进一步的,在标签与商品进行绑定后,可以对建立的绑定关系进行修改或删除,也可人工添加商品与标签的绑定关系。使得调整之后商品和标签的绑定关系可以实时的反应到线上(例如检索列表页的标签筛选)。
可选的,当标签的匹配规则发生修改时,会触发离线任务重新计算该标签绑定的所有商品;(2)商品发布或修改时,会实时计算该商品所绑定的所有标签。
本实施例能够根据商品的第一商品信息确定出用于描述商品特征的第一标签以及第一标签的关联词汇,然后针对每个第一标签(即目标标签)基于主题与商品分类的绑定关系找到目标标签能够描述的同类的目标商品,然后根据目标商品的第二商品信息与该目标标签的关联词的匹配比例确定过是否将第一标签与目标商品进行绑定。现有技术由人工对每个发布的商品添加标签,操作效率低且添加的标签存在误差。本发明实施例由于关联词为目标标签的关联词汇,且关联词与目标商品的第二商品信息匹配,因此使用与关联词对应的目标标签与目标商品进行绑定时,能够实现准确的为目标商品添加标签,省略运营人员手工操作成本的同时也避免了人工带来的错误率,提高商品标签的绑定效率。
实施例二
图2为本发明实施例二提供的一种商品标签的绑定方法的流程图,作为对实施例一的进一步说明,步骤110、根据商品分类中商品的第一商品信息确定第一标签以及所述第一标签的关联词汇,可通过下属步骤进行实施:
步骤111、从商品分类中商品的第一商品信息中抽取高频词汇,将所述高频词汇作为候选标签。
对第一商品信息进行分词处理,得到多个分词词汇。统计每个分词词汇出现的次数。根据出现次数对分词词汇进行排序,根据排序结果选取出现次数大于预设数量的分词词汇作为高频词汇。其中,预设数量大于2,优选为3-10次。
进一步的,对所述高频词汇进行筛选,滤除所述高频词汇中的噪点。
噪点包括商品描述中通用的连词、形容词等。例如“的”、“好”等。噪点的可以根据经验确定。
步骤112、计算目标候选标签与其他候选标签的互信息。
其中,所述其他候选标签为所述商品分类中商品的第一商品信息对应的候选标签中除所述目标候选标签以外的候选标签。
获取每个高频词汇的在第一商品信息中的概率分布值。假设目标候选标签为X,任意一个候选标签为Y,则该候选标签X与目标候选标签Y的互信息可通过下述公式进行计算:
Figure BDA0001333650430000091
其中,P(x,y)为两个随机变量(x,y)的联合分布,P(x)为x的边际分布,P(y)为y的边际分布,I(x;y)为联合分布P(x,y)与乘机分布P(x)P(y)的相对熵。
步骤113、根据所述互信息从所述其他候选标签中确定所述目标候选标签的关联词汇。
通过计算互信息能够从多个候选标签中查找到与目标标签具有一定关联的关联词汇。
本发明实施例能够根据第一商品信息确定出第一标签以及每个第一标签对应的关联词汇,根据互信息确定的关联词汇能够准确的确定关联词汇,提高商品标签绑定的准确性。
实施例三
图3为本发明实施例三提供的一种商品标签的绑定装置的结构示意图,该装置用于实施实施例一和实施例二所示的方法,包括:
关联词汇确定单元101,用于根据商品分类中商品的第一商品信息确定第一标签以及第一标签的关联词汇;
目标商品确定单元102,用于基于主题与商品分类的绑定关系确定目标标签关联的目标商品,目标标签为任意一个第一标签;
匹配比例判断单元103,用于判断目标商品的第二商品信息与目标标签的关联词汇的匹配比例是否大于阈值;
商品标签绑定单元104,用于如果目标商品的第二商品信息与目标标签的关联词汇的匹配比例大于阈值,则将目标商品与目标标签进行绑定。
进一步的,关联词汇确定单元101用于:
从商品分类中商品的第一商品信息中抽取高频词汇,将高频词汇作为候选标签;
计算目标候选标签与其他候选标签的互信息,其他候选标签为商品分类中商品的第一商品信息对应的候选标签中除目标候选标签以外的候选标签;
根据互信息从其他候选标签中确定目标候选标签的关联词汇。
进一步的,关联词汇确定单元101还用于,在计算目标候选标签与其他候选标签的互信息之前,对高频词汇进行筛选,滤除高频词汇中的噪点。
进一步的,目标商品确定单元102用于:
将目标标签对应的主题所绑定的商品分类包含的商品作为目标商品,其中,每个主题对应至少一个商品分类,每个商品分类对应至少一个主题。
进一步的,匹配比例判断单元103用于:
当检测到目标商品发布或目标商品的商品信息被修改时,判断目标商品的第二商品信息与目标标签的关联词汇的匹配比例是否大于阈值。
本发明实施例所提供的商品标签的绑定装置可执行本发明任意实施例所提供的商品标签的绑定方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性设备12的框图。图4显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
该设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所提供的商品标签的绑定方法。
如图4所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的商品标签的绑定方法。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例所提供的商品标签的绑定方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (12)

1.一种商品标签的绑定方法,其特征在于,包括:
从商品分类中商品的第一商品信息中抽取高频词汇,将所述高频词汇作为候选标签;
计算第一标签与其他候选标签的互信息,所述第一标签为任意一个候选标签,所述其他候选标签为所述商品分类中商品的第一商品信息对应的候选标签中除所述第一标签以外的标签;
根据所述互信息从所述其他候选标签中确定所述第一标签的关联词汇;
基于主题与商品分类的绑定关系确定目标标签关联的目标商品,所述目标标签为任意一个第一标签;所述目标商品为所述目标标签对应的主题所绑定的商品分类包含的商品,每个主题对应至少一个商品分类,每个商品分类对应至少一个主题;
判断所述目标商品的第二商品信息与所述目标标签的关联词汇的匹配比例是否大于阈值;
如果所述目标商品的第二商品信息与所述目标标签的关联词汇的匹配比例大于阈值,则将所述目标商品与所述目标标签进行绑定。
2.根据权利要求1所述的商品标签的绑定方法,其特征在于,在计算第一标签与其他候选标签的互信息之前,还包括:
对所述高频词汇进行筛选,滤除所述高频词汇中的噪点。
3.根据权利要求1所述的商品标签的绑定方法,其特征在于,所述基于主题与商品分类的绑定关系确定与所述目标标签关联的目标商品,包括:
将目标标签对应的主题所绑定的商品分类包含的商品作为目标商品,其中,每个主题对应至少一个商品分类,每个商品分类对应至少一个主题。
4.根据权利要求1所述的商品标签的绑定方法,其特征在于,所述判断所述目标商品的第二商品信息与所述目标标签的关联词汇的匹配比例是否大于阈值,包括:
当检测到目标商品发布或目标商品的商品信息被修改时,判断所述目标商品的第二商品信息与所述目标标签的关联词汇的匹配比例是否大于阈值。
5.根据权利要求1所述的商品标签的绑定方法,其特征在于,所述第一商品信息包括商品标题和商品详细描述;所述第二商品信息包括商品标题、商品详细描述、消费提示以及商品所属的门店信息。
6.根据权利要求1所述的商品标签的绑定方法,其特征在于,还包括:为标签配置下述至少一个字段:标签标识字段、标签名称字段、所属主题字段、关联词字段、展示方式字段和展示权限字段。
7.一种商品标签的绑定装置,其特征在于,包括:
关联词汇确定单元,用于从商品分类中商品的第一商品信息中抽取高频词汇,将所述高频词汇作为候选标签;计算第一标签与其他候选标签的互信息,所述第一标签为任意一个候选标签,所述其他候选标签为所述商品分类中商品的第一商品信息对应的候选标签中除所述第一标签以外的标签;根据所述互信息从所述其他候选标签中确定所述第一标签的关联词汇;
目标商品确定单元,用于基于主题与商品分类的绑定关系确定目标标签关联的目标商品,所述目标标签为任意一个第一标签;所述目标商品为所述目标标签对应的主题所绑定的商品分类包含的商品,每个主题对应至少一个商品分类,每个商品分类对应至少一个主题;
匹配比例判断单元,用于判断所述目标商品的第二商品信息与所述目标标签的关联词汇的匹配比例是否大于阈值;
商品标签绑定单元,用于如果所述目标商品的第二商品信息与所述目标标签的关联词汇的匹配比例大于阈值,则将所述目标商品与所述目标标签进行绑定。
8.根据权利要求7所述的商品标签的绑定装置,其特征在于,所述关联词汇确定单元还用于,在计算目标候选标签与其他候选标签的互信息之前,对所述高频词汇进行筛选,滤除所述高频词汇中的噪点。
9.根据权利要求7所述的商品标签的绑定装置,其特征在于,所述目标商品确定单元用于:
将目标标签对应的主题所绑定的商品分类包含的商品作为目标商品,其中,每个主题对应至少一个商品分类,每个商品分类对应至少一个主题。
10.根据权利要求7所述的商品标签的绑定装置,其特征在于,所述匹配比例判断单元用于:
当检测到目标商品发布或目标商品的商品信息被修改时,判断所述目标商品的第二商品信息与所述目标标签的关联词汇的匹配比例是否大于阈值。
11.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的商品标签的绑定方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的商品标签的绑定方法。
CN201710500889.3A 2017-06-27 2017-06-27 商品标签的绑定方法、装置、设备及计算机可读存储介质 Active CN107292365B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710500889.3A CN107292365B (zh) 2017-06-27 2017-06-27 商品标签的绑定方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710500889.3A CN107292365B (zh) 2017-06-27 2017-06-27 商品标签的绑定方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN107292365A CN107292365A (zh) 2017-10-24
CN107292365B true CN107292365B (zh) 2021-01-08

Family

ID=60098001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710500889.3A Active CN107292365B (zh) 2017-06-27 2017-06-27 商品标签的绑定方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN107292365B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427749B (zh) * 2018-03-12 2021-06-18 上海哔哩哔哩科技有限公司 商品标签管理方法、服务器及商品标签管理系统
CN108665345B (zh) * 2018-05-07 2021-11-09 北京科码先锋互联网技术股份有限公司 标签映射方法
CN109492216A (zh) * 2018-09-19 2019-03-19 平安科技(深圳)有限公司 水帖自动鉴别及审批方法、装置及计算机可读存储介质
CN109670080A (zh) * 2018-12-21 2019-04-23 深圳创维数字技术有限公司 一种影视标签的确定方法、装置、设备及存储介质
CN111833118A (zh) * 2019-04-10 2020-10-27 拉扎斯网络科技(上海)有限公司 商户信息确定方法、装置、电子设备和非易失性存储介质
CN112232061A (zh) * 2019-06-28 2021-01-15 傲基科技股份有限公司 内容处理方法、电子设备和计算机可读存储介质
CN111626808A (zh) * 2020-02-26 2020-09-04 京东数字科技控股有限公司 数据处理方法和装置、存储介质和电子装置
CN111767738A (zh) * 2020-03-30 2020-10-13 北京沃东天骏信息技术有限公司 一种标签校验方法、装置、设备和存储介质
CN113743430A (zh) * 2020-05-29 2021-12-03 北京沃东天骏信息技术有限公司 标签匹配度检测模型的建立方法及装置、存储介质及设备
CN114463067B (zh) * 2022-02-11 2022-11-11 深圳市聚商鼎力网络技术有限公司 一种基于大数据的用户浏览行为的用户兴趣建模方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324708A (zh) * 2013-06-18 2013-09-25 哈尔滨工程大学 一种长文本到短文本的迁移学习方法
CN103678335A (zh) * 2012-09-05 2014-03-26 阿里巴巴集团控股有限公司 商品标识标签的方法、装置及商品导航的方法
CN103793381A (zh) * 2012-10-26 2014-05-14 北京品友互动信息技术有限公司 一种分类筛选的方法和装置
CN103927309A (zh) * 2013-01-14 2014-07-16 阿里巴巴集团控股有限公司 一种对业务对象标注信息标签的方法及装置
US8856645B2 (en) * 2009-03-20 2014-10-07 Xerox Corporation Generating formatted documents based on collected data content
CN104281572A (zh) * 2013-07-01 2015-01-14 中国科学院计算技术研究所 一种基于互信息的目标匹配方法及其系统
CN104573130A (zh) * 2015-02-12 2015-04-29 北京航空航天大学 基于群体计算的实体解析方法及装置
CN105740404A (zh) * 2016-01-28 2016-07-06 上海晶赞科技发展有限公司 标签关联方法及装置
KR20160133180A (ko) * 2015-05-12 2016-11-22 장일웅 라벨을 이용한 정품인증시스템
CN106778862A (zh) * 2016-12-12 2017-05-31 上海智臻智能网络科技股份有限公司 一种信息分类方法及装置
CN106874279A (zh) * 2015-12-11 2017-06-20 腾讯科技(深圳)有限公司 生成应用类别标签的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI356315B (en) * 2007-10-16 2012-01-11 Inst Information Industry Method and system for constructing data tag based

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8856645B2 (en) * 2009-03-20 2014-10-07 Xerox Corporation Generating formatted documents based on collected data content
CN103678335A (zh) * 2012-09-05 2014-03-26 阿里巴巴集团控股有限公司 商品标识标签的方法、装置及商品导航的方法
CN103793381A (zh) * 2012-10-26 2014-05-14 北京品友互动信息技术有限公司 一种分类筛选的方法和装置
CN103927309A (zh) * 2013-01-14 2014-07-16 阿里巴巴集团控股有限公司 一种对业务对象标注信息标签的方法及装置
CN103324708A (zh) * 2013-06-18 2013-09-25 哈尔滨工程大学 一种长文本到短文本的迁移学习方法
CN104281572A (zh) * 2013-07-01 2015-01-14 中国科学院计算技术研究所 一种基于互信息的目标匹配方法及其系统
CN104573130A (zh) * 2015-02-12 2015-04-29 北京航空航天大学 基于群体计算的实体解析方法及装置
KR20160133180A (ko) * 2015-05-12 2016-11-22 장일웅 라벨을 이용한 정품인증시스템
CN106874279A (zh) * 2015-12-11 2017-06-20 腾讯科技(深圳)有限公司 生成应用类别标签的方法及装置
CN105740404A (zh) * 2016-01-28 2016-07-06 上海晶赞科技发展有限公司 标签关联方法及装置
CN106778862A (zh) * 2016-12-12 2017-05-31 上海智臻智能网络科技股份有限公司 一种信息分类方法及装置

Also Published As

Publication number Publication date
CN107292365A (zh) 2017-10-24

Similar Documents

Publication Publication Date Title
CN107292365B (zh) 商品标签的绑定方法、装置、设备及计算机可读存储介质
CN108154401B (zh) 用户画像刻画方法、装置、介质和计算设备
US10546005B2 (en) Perspective data analysis and management
US20170200205A1 (en) Method and system for analyzing user reviews
US10824630B2 (en) Search and retrieval of structured information cards
US11361030B2 (en) Positive/negative facet identification in similar documents to search context
US8799193B2 (en) Method for training and using a classification model with association rule models
CN111815421B (zh) 税务政策处理方法、装置、终端设备及存储介质
CN110084658B (zh) 物品匹配的方法和装置
CN110766486A (zh) 确定物品类目的方法和装置
WO2019072098A1 (zh) 一种识别核心产品词的方法和系统
CN111538774A (zh) 数据存储及展示方法、系统、设备及存储介质
CN110942392A (zh) 一种业务数据处理方法、装置、设备和介质
CN111310065A (zh) 一种社交推荐方法、装置、服务器及存储介质
CN110674404A (zh) 链接信息生成方法、装置、系统、存储介质及电子设备
CN110598108A (zh) 一种搜索词推荐方法、装置、设备及存储介质
US20140172825A1 (en) Content and object metadata based search in e-reader environment
US10055478B2 (en) Perspective data analysis and management
US10552502B2 (en) Pickup article cognitive fitment
US20150347564A1 (en) Category name extraction device, category name extraction method, and category name extraction program
US9646083B2 (en) Web 2.0 system and method for dynamic categorization of heterogeneous and regulated enterprise assets
US20210295036A1 (en) Systematic language to enable natural language processing on technical diagrams
CN112785234A (zh) 货物推荐方法、装置、设备及存储介质
CN112989175A (zh) 一种物品推送方法、装置、设备及介质
JP7054275B1 (ja) 判定装置、プログラム、及び判定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant