CN111625694A - 多级标签处理方法、装置及计算机设备 - Google Patents

多级标签处理方法、装置及计算机设备 Download PDF

Info

Publication number
CN111625694A
CN111625694A CN202010507039.8A CN202010507039A CN111625694A CN 111625694 A CN111625694 A CN 111625694A CN 202010507039 A CN202010507039 A CN 202010507039A CN 111625694 A CN111625694 A CN 111625694A
Authority
CN
China
Prior art keywords
node
tag
target
label
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010507039.8A
Other languages
English (en)
Other versions
CN111625694B (zh
Inventor
李福洋
徐晓健
严洁
栾英英
童楚婕
彭勃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202010507039.8A priority Critical patent/CN111625694B/zh
Publication of CN111625694A publication Critical patent/CN111625694A/zh
Application granted granted Critical
Publication of CN111625694B publication Critical patent/CN111625694B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提出了一种多级标签处理方法、装置及计算机设备,依据不同业务场景下各产品的不同标签之间的关联关系构建标签二叉树,使其包含的各节点的左分支节点与相应节点之间的关联关系的类型一致,右分支节点与相应节点之间的关联关系的类型一致,便于标签管理与维护,且相对于传统的二叉树结构,该标签二叉树中节点之间的层次更加清晰,在响应目标产品的标签向量化请求过程中,能够更加快速且准确地得到目标产品具有的各目标标签在标签二叉树中分别对应的目标关联节点,如祖先节点和/或子节点,以便利用各目标关联节点所表示的标签,依次构成该目标产品的标签向量,以满足后续应用需求。

Description

多级标签处理方法、装置及计算机设备
技术领域
本申请涉及数据处理技术领域,更具体地说是涉及一种多级标签处理方法、装置及计算机设备。
背景技术
在如今的互联网大数据时代,为了提高客服服务质量,各应用平台通常会对输出的产品配置标签,如产品的类型、各种属性、主题、关键词等信息,以便通过该标签,实现应用平台具有的大量产品的快速查找。
在实际应用中,对于应用平台上的每一个产品,往往会具有从不同角度确定的多个标签,且随着产品的日益丰富,产品的标签也会越来越多,对应于同一个产品通常会出现不同级别的多个标签。因此,如何管理产品的标签,并通过标签向量化满足产品应用需求,如产品分类需求、产品推荐需求等,成为本领域技术人员重点关注问题之一。
发明内容
有鉴于此,为了解决上述技术问题,本申请提供了以下技术方案:
一方面,本申请提出了一种多级标签处理方法,所述方法包括:
获取不同业务场景下各产品具有的标签,以及不同标签之间的关联关系,所述关联关系包括父子关系和兄弟关系;
利用不同标签之间的所述父子关系和所述兄弟关系,将获取的所述标签作为节点,构建标签二叉树,其中,所述标签二叉树中各节点的左分支节点与相应节点之间的关联关系的类型一致,右分支节点与相应节点之间的关联关系的类型一致;
响应目标产品的标签向量化请求,查询所述标签二叉树,得到所述目标产品具有的各目标标签分别对应的目标关联节点,所述目标关联节点包括相应目标标签在所述标签二叉树中的节点,向上查询到根节点所经过的节点,和/或向下查询到叶子节点所经过的节点;
利用所述各目标标签分别对应的所述目标关联节点,生成所述目标产品的标签向量。
可选的,所述方法还包括:
利用不同标签之间的所述父子关系,构建各所述右分支节点与相应父节点之间的关系链路。
可选的,所述响应目标产品的标签向量化请求,查询所述标签二叉树,得到所述目标产品具有的各目标标签分别对应的目标关联节点,包括:
响应目标产品的标签向量化请求,确定所述目标产品具有的目标标签;
确定所述目标标签在所述标签二叉树中的目标节点,查询所述标签二叉树中所述目标节点分别对应的各祖先节点,将所述祖先节点确定为相应目标节点对应的目标关联节点。
可选的,若各节点的左分支节点与相应节点之间的关联关系为父子关系,所述响应目标产品的标签向量化请求,查询所述标签二叉树,得到所述目标产品具有的各目标标签分别对应的目标关联节点,还包括:
遍历所述标签二叉树中所述目标节点的左分支节点直至叶子节点,将遍历到的所述目标节点的各目标子节点确定为目标关联节点;
所述利用所述各目标标签分别对应的所述目标关联节点,生成所述目标产品的标签向量,包括:
将所述各目标标签分别对应的各祖先节点以及所述目标子节点合并,生成所述目标产品的标签向量。
可选的,若各节点的左分支节点与相应节点之间的关联关系为父子关系,所述方法还包括:
响应标签增加请求,得到所述产品的新标签;
检测所述新标签的父标签在所述标签二叉树中所在节点的左分支节点是否为空;
若所述左分支节点为空,将所述新标签确定为该左分支节点;
若所述左分支节点不为空,将该左分支节点作为父节点,遍历所述父节点的右分支树中的各右分支节点,直至遍历到为空的目标右分支节点,将所述新标签确定为所述目标右分支节点。
可选的,若各节点的左分支节点与相应节点之间的关联关系为父子关系,所述方法还包括:
响应标签删除请求,确定待删除标签在所述标签二叉树的节点类型,所述节点类型包括叶子节点和分支节点;
若所述节点类型为所述叶子节点,删除所述标签二叉树中的所述待删除标签;
若所述节点类型为所述分支节点,检测所述待删除标签所在待删除节点存在左分支节点,且所述左分支节点不存在右分支节点和/或所述待删除节点不存在右分支节点,由该左分支节点替换所述待删除节点;
检测所述待删除标签所在待删除节点存在左分支节点和右分支节点,且所述左分支节点存在右分支节点,查询该所述左分支节点的右分支节点所在的右分支树中的叶子节点,将所述待删除节点的右分支节点作为该叶子节点的右分支节点,由所述左分支节点替换所述待删除节点;
检测所述待删除标签所在待删除节点不存在左分支节点,但存在右分支节点,由该右分支节点替换所述待删除节点。
又一方面,本申请还提出了一种多级标签处理装置,所述装置包括:
标签获取模块,用于获取不同业务场景下各产品具有的标签,以及不同标签之间的关联关系,所述关联关系包括父子关系和兄弟关系;
标签二叉树构建模块,用于利用不同标签之间的所述父子关系和所述兄弟关系,将获取的所述标签作为节点,构建标签二叉树,其中,所述标签二叉树中各节点的左分支节点与相应节点之间的关联关系的类型一致,右分支节点与相应节点之间的关联关系的类型一致;
祖先节点查询模块,用于响应目标产品的标签向量化请求,查询所述标签二叉树,得到所述目标产品具有的各目标标签分别对应的目标关联节点,所述目标关联节点包括相应目标标签在所述标签二叉树中的节点,向上查询到根节点所经过的节点,和/或向下查询到叶子节点所经过的节点;
标签向量生成模块,用于利用所述各目标标签分别对应的所述目标关联节点,生成所述目标产品的标签向量。
可选的,所述装置还包括:
关系链路构建模块,用于利用不同标签之间的所述父子关系,构建各所述右分支节点与相应父节点之间的关系链路。
可选的,若各节点的左分支节点与相应节点之间的关联关系为父子关系,所述装置还包括:
新标签得到模块,用于响应标签增加请求,得到所述产品的新标签;
第一检测模块,用于检测所述新标签的父标签在所述标签二叉树中所在节点的左分支节点是否为空;
第一确定模块,用于在第一检测模块的检测结果为所述左分支节点为空的情况下,将所述新标签确定为该左分支节点;
第二确定模块,用于在第一检测模块的检测结果为所述左分支节点不为空的情况下,将所述左分支节点作为父节点,遍历所述父节点的右分支树中的各右分支节点,直至遍历到为空的目标右分支节点,将所述新标签确定为所述目标右分支节点。
又一方面,本申请还提出了一种计算机设备,所述计算机设备包括:
存储器,用于存储实现如上述的多级标签处理方法的程序;
处理器,用于加载并执行所述存储器存储的所述程序,以实现如上述的多级标签处理方法的各步骤。
由此可见,与现有技术相比,本申请提供一种多级标签处理方法、装置及计算机设备,对于不同业务场景下各产品具有的标签,其通常会是大量各种级别的标签,本实施例将获取不同标签之间的关联关系,如父子关系、兄弟关系,从而利用该关联关系,构建标签二叉树,并使得该标签二叉树中各节点的左分支节点与相应节点之间的关联关系的类型一致,右分支节点与相应节点之间的关联关系的类型一致,这种二叉树数据结构的标签存储方式,相对于同一层存储,方便管理,且更有利于产品分类和细化;相对于传统的二叉树结构,本申请所构建的标签二叉树的层次更加清晰,节点之间的关系分布更加明确清晰,这样,在响应目标产品的标签向量化请求过程中,查询该标签二叉树,能够更加快速且准确地得到该目标产品具有的各目标标签对应的目标关联节点,如祖先节点和/或子节点,即快速且准确得到与目标产品相关联的标签,依次构成该目标产品的标签向量,以满足后续应用需求。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本申请提出的多级标签处理方法的一可选示例的流程示意图;
图2示出了本申请提出的多级标签处理方法中,构建的标签二叉树的一可选结构示意图;
图3示出了本申请提出的多级标签处理方法中,构建的标签二叉树的又一可选结构示意图;
图4示出了本申请提出的多级标签处理方法的又一可选示例的流程示意图;
图5示出了本申请提出的多级标签处理方法的又一可选示例的流程示意图;
图6示出了本申请提出的多级标签处理方法中,在标签二叉树增加新标签的一可选应用示意图;
图7示出了本申请提出的多级标签处理方法的又一可选示例的流程示意图;
图8a示出了本申请提出的多级标签处理方法中,在标签二叉树删除标签所在节点的一可选应用示意图;
图8b示出了本申请提出的多级标签处理方法中,在标签二叉树删除标签所在节点的又一可选应用示意图;
图8c示出了本申请提出的多级标签处理方法中,在标签二叉树删除标签所在节点的又一可选应用示意图;
图8d示出了本申请提出的多级标签处理方法中,在标签二叉树删除标签所在节点的又一可选应用示意图;
图9示出了本申请提出的多级标签处理装置的一可选示例的结构示意图;
图10示出了本申请提出的多级标签处理装置的又一种可选示例的结构示意图;
图11示出适用于本申请提出的多级标签处理方法的一种计算机设备实施例的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
应当理解,本申请中使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换该词语。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。以下术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
另外,本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
参照图1,为本申请提出的多级标签处理方法的一可选示例的流程示意图,该方法可以适用于计算机设备,该计算机设备可以是服务器,或者如台式电脑、笔记本电脑等电子设备,本申请对该计算机设备的产品类型不做限定,如图1所示,本实施例提出的多级标签处理方法可以包括:
步骤S11,获取不同业务场景下各产品具有的标签,以及不同标签之间的关联关系;
在实际应用中,每一个产品均可以具有一个或多个标签,可以依据实际情况,人工实现标签配置,或采用其他方式实现产品标签的配置,本申请对产品的标签配置方法不做限定。
举例说明,随着信息的多元化,目前的银行应用平台通常会推出很多视频类的优惠券,如A平台视频的VIP月卡、季卡、年卡等优惠券,B平台视频的VIP月卡、季卡、年卡等优惠券等等、C平台音乐的VIP月卡、季卡、年卡等优惠券、D平台音乐的VIP月卡、季卡、年卡等优惠券等等,可见,A平台视频和B平台视频均属于影视类,C平台音乐和D平台音乐均属于音乐类,当然,还可以包括如购物类、生活类等其他类别的优惠券,这些影视、音乐、购物、生活等标签可以认为是同一级别标签。
对上述标签做进一步细化,以影视为例,还可以分为喜剧、悲剧、历史剧、偶像剧、家庭伦理剧等标签,这类标签相对于影视标签属于下级标签,对每一个下级标签还可以进一步细化得到下下级标签等等,本实施例在此不做一一举例说明。
由此可见,对于同一产品来说,如电影A,其可能具有多个标签,如2018年上映、XX主演、XX导演、英文、3D、喜剧、影视等,且这多个标签可能属于同一级别,也可能属于不同级别,本申请可以将某产品的属于同一级别可以称为兄弟标签,将具有上下级关系的标签称为父子标签或祖先标签,具体可以依据具体上下级关系确定。基于此,本申请可以将不同标签之间的关联关系记为父子关系、兄弟关系等,本申请对该关联关系的内容及其确定方式不做限定。
应该理解的是,对于不同业务场景(其可以包括但并不局限于上文描述的业务场景),产品可能不同,对产品定义的标签及其范围也会所有差异,这可以依据实际情况确定,通常可以由相应领域的业务人员或开发人员等,来定义各产品的标签,并确定不同标签之间的关联关系,相对于普通用户来说,能够提高产品标签及其之间的关联关系的可靠性及准确性,进而保证后续能够利用产品的标签,可靠实现产品分类、推荐等应用需求。
步骤S12,利用不同标签之间的父子关系和兄弟关系,将获取的标签作为节点,构建标签二叉树。
需要说明的是,本实施例所构建的标签二叉树中,各节点的左分支节点与相应节点之间的关联关系的类型一致,右分支节点与相应节点之间的关联关系的类型一致。也就是说,若每个节点与其左分支节点之间可以都是父子关系(或兄弟关系),相应地,该节点与其右分支节点之间可以都是兄弟关系(或父子关系),从而使得整个标签二叉树中各层节点之间的关系更加清晰,便于后续标签查询和维护。
在一些实施例中,以节点的左分支节点为孩子节点,右分支节点为兄弟节点为例进行说明,在构建标签二叉树的过程中,可以先确定具有父子关系的标签组,再将每一个孩子标签保存在其父亲标签所在节点的左分支节点,将该父亲标签的兄弟标签保存在该父亲标签所在节点的右分支节点。
若某节点的标签具有多个兄弟标签,如上所述,可以将一兄弟标签保存在该节点的右分支节点中,并将其他兄弟标签保存在该右分支节点的右分支节点,依次类推,直至完成多个兄弟标签的保存。
若某节点的标签具有多个孩子标签,如上所述,可以将一孩子标签保存在该节点的左分支节点,并将其他孩子标签保存在该左分支节点的右分支节点,之后,可以按照上述方式,继续将剩余其他孩子标签保存在该右分支节点,甚至是右分支节点的右分支节点,直至完成多个孩子标签的保存。
举例说明,若标签A与标签B1、标签B2和标签B3均为父子关系,标签B1、标签B2和标签B3之间均为兄弟关系,标签A与标签A1、标签A2均为兄弟关系,标签B1与标签C为父子关系,按照上述规则所构建的标签二叉树如图2所示。
在又一些实施例中,为了方便后续标签查询应用中,能够快速且准确地找到祖先节点,本申请可以为每一个节点上增加一条链路,指向其副父标签所在的节点,主要是位于右分支节点中的各兄弟标签,可以利用不同标签之间的所述父子关系,构建各右分支节点与相应父节点之间的关系链路,以更新上图2所示的标签二叉树,得到如图3所示的标签二叉树,但并不局限于这种标签二叉树构建方式,且本申请对上述关系链路的具体构建方法不做限定。
如图3所示的标签二叉树,每一个节点均与其父亲节点关联,这样,在后续查询任一节点的所有祖先节点(即从根节点到该节点所经分支上的所有节点)时,能够快速且准确地实现祖先节点的查询,提高工作效率及查询准确性。
综上,本申请通过构建标签二叉树实现对标签的存储,相对于传统标签存储方式,即将所有标签视为同一级别放到同一层级进行存储的方式,甚至是现有的树结构,即将同一级别的标签存放在树中的同一层,本申请这种标签二叉树存储方式层次更加清晰,能够直观体现各标签之间的级别关系,方便标签管理及后续查询。
步骤S13,响应目标产品的标签向量化请求,查询该标签二叉树,得到目标产品具有的各目标标签分别对应的目标关联节点;
继上文描述,对于不同业务场景下产品的不同级别的标签,本申请按照上述标签二叉树的数据结构进行存储之后,在实际应用中,计算机设备获得针对目标产品的标签向量化请求,具体可以是在如产品分类、产品推荐等应用的过程中,需要对产品标签进行向量化处理时生成,之后,计算机设备可以解析该标签向量化请求,得到该目标产品当前具有的至少一个目标标签,确定该目标标签在标签二叉树中的位置,即确定目标标签所在的节点后,可以向上依次查找该节点对应的祖先节点,直至标签二叉树的根节点,也就是说,确定目标标签所在节点至根节点的父子关系路径,得到该父子关系路径包含的节点,并将目标标签所在节点对应的各祖先节点记为目标关联节点,本申请对步骤S13的具体实现过程不做详述。
在一些实施例中,查询上述目标关联节点过程中,除了查询目标标签所在节点的各祖先节点外,根据需要,还可以查询该目标标签所在节点的子节点,也就是说,可以从该目标标签在标签二叉树中的节点,向下查询到叶子节点所经过的节点,并将这些节点记为该目标标签的目标关联节点。
可见,上述目标标签对应的目标关联节点可以包括:该目标标签在标签二叉树中的节点对应的祖先节点和/或子节点,具体可以根据需求确定该目标关联节点的内容,本申请对此不做限定。
结合上文对标签二叉树的构建过程的描述,由于本申请构建的标签二叉树层次清晰,各标签之间的关联关系更加明确,极大提高了目标标签的各目标关联节点的查找效率及准确性。
对于一些与上层节点之间为兄弟关系的节点,在一些实施例中,可以利用上述构建的兄弟节点与其父亲节点之间的关系链路,快速确定该作为兄弟节点的目标标签对应的各目标关联节点。
步骤S14,利用各目标标签分别对应的目标关联节点,生成目标产品的标签向量。
本实施例在得到目标标签对应的所有祖先节点和/或子节点等多个目标关联节点之后,可以直接将每个目标标签对应的目标关联节点所具有的标签合并,得到该目标产品的标签向量,但并不局限于这种标签向量化实现方式。
举例说明:假设目标产品具有tag1和tag2两个目标标签,确定tag1和tag2在预先构建的上述标签二叉树中的目标节点后,若标签tag1查找到的目标关联节点所具有的标签依次为标签tag1、标签tag2和标签tag3,而标签tag2查找到的目标关联节点所具有的标签依次为标签tag2、标签tag5和tag8,那么,该目标产品在标签[tag1,tag2,…,tag8]之间向量化,所得到的标签向量可以为[1,1,1,0,10,0,1],但并不局限于此,本申请对标签向量的内容不做限定。
在实际应用中,得到目标产品的标签向量后,可以将其输入相应的模型进行处理,以得到针对目标产品的处理结果,如将标签向量输入分类模型,得到该目标产品的分类结果;将得到的多个产品各自的标签向量输入聚类模型(或推荐模型),实现对多个产品的分类结果(或推荐产品)等等,本申请在此不做一一详述。
可见,结合上文对标签二叉树的描述,由于祖先标签可以根据孩子标签自动查找,所以,在对产品的标签进行标注时,只需要标注产品的叶子标签,后续在构建产品的标签向量时,不再依赖于产品标注的标签,可以结合自动查找的所有关联标签构建,减少了人工标注工作量,且提高了标签向量构建效率及准确性,进而提高了利用该标签向量所得应用结果的可靠性。
综上所述,在本实施例中,对于不同业务场景下各产品具有的标签,其通常会是大量各种级别的标签,本实施例将获取不同标签之间的关联关系,如父子关系、兄弟关系,从而利用该关联关系,构建标签二叉树,并使得该标签二叉树中各节点的左分支节点与相应节点之间的关联关系的类型一致,右分支节点与相应节点之间的关联关系的类型一致,这种二叉树数据结构的标签存储方式,相对于同一层存储,方便管理,且更有利于产品分类和细化;相对于传统的二叉树结构,本申请所构建的标签二叉树的层次更加清晰,节点之间的关系分布更加明确清晰,这样,在响应目标产品的标签向量化请求过程中,查询该标签二叉树,能够更加快速且准确地得到该目标产品具有的各目标标签对应的目标关联节点,如祖先节点和/或子节点,即快速且准确得到与目标产品相关联的标签,依次构成该目标产品的标签向量,以满足后续应用需求。
参照4,为本申请提出的多级标签处理方法的又一可选示例的流程示意图,本实施例可以是对上述实施例提出的多级标签处理方法的一可选细化实现方式,如图4所示,该方法可以包括:
步骤S21,获取不同业务场景下各产品具有的标签,以及不同标签之间的关联关系;
关于步骤S21的实现过程,可以参照上述实施例步骤S11相应部分的描述,不再赘述。
步骤S22,将具有父子关系的标签组中的孩子标签作为父亲标签所在节点的左分支节点,将与该孩子标签或父亲标签具有兄弟关系的兄弟标签,作为相应标签所在节点的右分支节点,并构建各兄弟标签所在节点指向其父亲节点的关系链路,得到标签二叉树;
关于该标签二叉树的具体构建过程可以参照上述实施例相应部分的描述,并不局限于本实施例描述的这种构建方式,也就是说,任一节点与其左分支节点之间的关系并不局限于父子关系,也可以是兄弟关系,但这种情况下,需要该节点与其右分支节点之间为父子关系。所以说,本申请构建的标签二叉树中的所有左分支节点均可以是孩子节点(或兄弟节点),相应地,所有右分支节点均可以是兄弟节点(或孩子节点)。
其中,需要说明的是,在标签二叉树的构建过程中,若没有根节点的标签,按照上述规则生成树结构没有根节点的情况下,可以在该树结构中增加一根节点,这样,所有一级标签(即级别最高的标签)的父节点可以为该根节点,以使得所构成的标签二叉树完整。
步骤S23,响应目标产品的标签向量化请求,确定目标产品具有的目标标签;
关于标签向量化请求的生成方式,可以参照上述实施例相应部分的描述,本实施例不再赘述。
步骤S24,确定目标标签在标签二叉树中的目标节点,查询标签二叉树中该目标节点对应的各祖先节点;
由于某节点的祖先节点是指从根节点到该节点所经分支上的所有节点,而在从根节点向下遍历至该节点的过程中,通常是按照父子关系进行遍历,相应地,从该节点到根节点的遍历过程,也是按照节点之间的父子关系实现,具体过程不做描述。
步骤S25,遍历标签二叉树中各目标节点的左分支节点直至叶子节点,将遍历到的各左分支节点确定为目标子节点;
在实际应用中,在构建标签向量过程中,若需要产品的子标签一起向量化,可以按照本实施例步骤S25的方式,遍历各目标节点的左子树,即查找该目标阶段的左分支节点,继续向下一层查找该左分支节点的左分支节点,依次类推直至叶子节点,并将该左子树中的各左分支节点记为目标子节点。
应该理解的是,若标签二叉树中的右分支节点为子节点,本申请在执行步骤S25时,可以遍历目标节点的右子树,将该右子树中的各右分支节点记为目标节点,实现过程类似,本申请不再布局实施例描述。
另外,若不需要产品的子标签一起向量化,本申请得到目标节点的各祖先节点后,可以不用执行步骤S25,而直接执行步骤S26,且在这种情况下,可以直接将各目标节点的所有祖先节点合并,生成目标产品的标签向量,也就是说,该实施例中,目标标签的目标关联节点仅包含祖先节点,具体可以参照上述实施例相应部分的描述。
步骤S26,将各目标标签分别对应的各祖先节点以及目标子节点合并,生成目标产品的标签向量。
可见,本实施例中目标标签对应的目标关联节点包含祖先节点和子节点两类节点,且关于步骤S26的实现过程,与上述实施例相应部分目标关联节点直接合并,得到标签向量的实现过程类似,本申请不再详述。
综上,本实施例中,对于不同业务场景下产品的大量不同级别的标签,本申请将构建标签二叉树实现标签的存储与管理,要求该标签二叉树的所有左分支节点均为孩子节点,用来存放相应的孩子标签,右分支节点则为兄弟节点,用来存放与上一层节点(即对应左分支节点的父节点)所存放的标签之间为兄弟关系的兄弟标签,从而使的该标签二叉树结构更加层次分明,不仅有助于标签的有效管理,且在响应目标产品的标签向量化请求过程中,在确定该目标标签对应的目标节点后,能够自动查询该标签二叉树,快速且准确得到该各目标节点对应的所有祖先节点,以及构成其左子树的各左分支节点,构成该目标节点的目标关联节点,再利用多个目标关联节点各自对应的标签生成更加全面、准确的标签向量,以满足应用需求。
参照图5,为本申请提出的多级标签处理方法的又一可选示例的流程示意图,本实施例主要描述的是在构建好标签二叉树之后,如何实现对标签二叉树的维护,具体以增加新的标签为例进行说明,关于标签二叉树的构建过程,以及如何利用该标签二叉树,生成各目标产品的标签向量的实现过程,可以参照上述实施例相应部分的描述,本实施例不再详述。如图5所示,本实施例提出的多级标签处理方法可以包括:
步骤S31,响应标签增加请求,得到产品的新标签;
在实际应用中,对于构建的标签二叉树可以实现可视化,如用户可以向计算机设备发起查阅请求,以请求计算机设备将该标签二叉树信息反馈至用户的客户端进行展示,以供用户查看当前标签二叉树所包含的标签内容,进而确定用户需要添加的标签是否为新标签,即该标签二叉树中当前不存在的标签。
当然,本申请实际应用中,用户也可以将需要增加的新标签发送至计算机设备,由计算机设备自动验证标签二叉树中是否存在该新标签,若存在,可以向用户反馈该新标签已存在的提示信息,计算机设备不会响应该标签增加请求;若不存在,说明该新标签的确是产品新增加的标签,计算机设备才会将其添加到已构建的标签二叉树中,从而保证该标签二叉树中的每一个标签均具有唯一特性。需要说明,本申请对新标签的验证方式不做限定。
步骤S32,确定该新标签的父标签在标签二叉树中所在节点的左分支节点;
步骤S33,检测该左分支节点是否为空,若是,进入步骤S34;若否,执行步骤S35;
需要说明,本申请是以构建的标签二叉树中的左分支节点为孩子节点,右分支节点为兄弟节点的规则实现的,若标签二叉树中的左分支节点为兄弟节点,右分支节点为孩子节点,那么,在增加新标签时,可以对本实施例描述的各子节点的另一分支的子节点进行检测,将新标签添加到空的子节点中,具体实现过程类似,本实施例不再详述。
本实施例中,以上图3所示的标签二叉树为例,计算机设备可以先确定该新标签所对应的一个父标签,并确定该父标签在该标签二叉树中的节点,以父节点是节点A为例进行说明,由于该节点A的左分支节点为其孩子节点,若该孩子节点为空,就可以直接将该新标签作为该孩子节点,以符合上述标签二叉树构建规则。显然,图3所示的标签二叉树中节点A的左分支节点存在节点B1,不能直接添加新标签。
步骤S34,将新标签确定为该左分支节点;
按照上述分析,若新标签的父标签所在节点为节点B2,图3所示的标签二叉树中,该节点B2的左分支节点为空,这种情况下,如图6所示,可以直接将该新标签作为该节点B2的左分支节点,即图6中的节点D。
步骤S35,将该左分支节点作为父节点,遍历该父节点的右分支树中的各右分支节点,直至遍历到为空的目标右分支节点,将新标签确定为该目标右分支节点。
继上述分析,如上述图2和图3所示的标签二叉树,新标签的父标签所在节点A的左分支节点已经存在节点B1,说明该标签二叉中已存在该父标签的孩子标签,该新标签也作为该父标签的孩子标签,将使得该父标签的孩子标签的数量为多个,按照上文描述的标签二叉树的构建过程,即将兄弟标签保存在右分支节点中,所以,本实施例可以继续查询该节点B1的右分支节点是否为空,若为空,将该新标签作为该节点B1的右分支节点;若不为空,如图3所示,节点B1的右分支节点为节点B2,可以继续查询该节点B2的右分支节点为节点B3,仍不为空,继续查询该节点B3的右分支节点,此时,该节点B3的右分支节点为空,可以将该新标签作为该节点B3的右分支节点,即图6中的节点E。
需要说明,对于其他标签二叉树,也可以按照上述实施例描述的方式,实现标签的增加,本申请不做一一详述。
由此可见,由于本实施例构建的标签二叉树的左分支节点和右分支节点各自的节点类型固定,这样,在增加标签时,能够利用该标签二叉树中节点与左分支节点、右分支节点之间的关联关系,快速且准确地确定该新增标签在已有标签二叉树中的位置,且不会影响已有标签之间的关联关系。
参照图7,为本申请提出的多级标签处理方法的又一可选示例的流程示意图,本实施例主要描述的也是在构建好标签二叉树之后,如何实现对标签二叉树的维护,具体以删除标签为例进行说明,关于标签二叉树的构建过程,以及如何利用该标签二叉树,生成各目标产品的标签向量的实现过程,可以参照上述实施例相应部分的描述,本实施例不再详述。如图6所示,本实施例提出的多级标签处理方法可以包括:
步骤S41,响应标签删除请求,确定待删除标签在标签二叉树的节点类型;
本实施例中,该节点类型包括叶子节点和分支节点,该分支节点具体可以是该标签二叉树中根节点、父亲节点,也就是下层具有分支的节点。
步骤S42,检测待删除标签的节点类型是否为叶子节点,如果是,进入步骤S43;如果否,执行步骤S44;
步骤S43,删除该标签二叉树中的待删除标签;
应该理解的是,在树结构中,叶子节点作为最下层节点,其增加与删除不会影响其他节点之间的结构关系,所以,若待删除标签所在的待删除节点是标签二叉树的叶子节点,可以直接将该待删除节点删除;反之,若不是叶子节点,即为分支节点,若直接删除,会影响该节点的分支节点与该节点的父节点的关系,因此,本申请不会将分支节点直接删除。
步骤S44,检测待删除标签所在待删除节点是否存在左分支节点,若是,进入步骤S45;若否,执行步骤S410;
需要说明,本申请是以标签二叉树中的左分支节点为孩子节点,右分支节点为兄弟节点为例进行说明,对于左分支节点为兄弟节点,右分支节点为孩子节点的标签二叉树,其标签删除方式与本实施例类似,本申请不再详述。
步骤S45,检测所述待删除节点的左分支节点是否存在右分支节点,如果否,进入步骤S46;如果是,执行步骤S47;
步骤S46,由该左分支节点替换待删除节点;
步骤S47,检测待删除标签所在待删除节点是否存在右分支节点,如果是,进入步骤S48;如果否,执行步骤S46;继上述分析,由于本实施例中的左分支节点为孩子节点,该孩子节点与其父节点通常属于同类型(其可以是指细化后的类型)的标签,但与其兄弟节点可能属于不同类型的标签,所以,本申请可以使用孩子节点替换父节点的方式,实现对父节点的删除。
但是,若该待删除节点及其左分支节点均存在右分支节点的情况下,若直接由待删除节点的左分支节点替换该待删除节点,容易造成待删除节点的右分支节点和盖左分支节点的右分支节点的混乱,因此,本申请是在待删除节点的右分支节点,与待删除节点的左分支节点的右分支节点不同时存在的情况下,才会由待删除节点的左分支节点体会该待删除节点。
仍以上图3构建的标签二叉树结构为例,假设待删除标签的待删除节点为节点B1,按照上述删除规则,检测到该节点B1存在左分支节点C和右分支节点B2,但该左分支节点C不存在右分支节点,因此,本实施例可以使用该节点C替换节点B1,即将节点B1删除,并将节点C放置到节点B1原来的位置,如图8a所示。
参照图8b左侧图所示的标签二叉树,若待删除节点为节点C,其具有左分支节点D,但不具有右分支节点,而该左分支节点D具有右分支节点D1,按照上述分析,可以直接将左分支节点D替换成待删除节点C,如图8b右侧图所示的标签二叉树。步骤S48,查询该左分支节点的右分支节点所在的右分支树中的叶子节点;
步骤S49,将待删除节点的右分支节点作为该叶子节点的右分支节点,由该左分支节点替换待删除节点;
继上述分析,若待删除标签所在节点存在左分支节点和右分支节点,且该左分支节点也存在右分支节点,参照图8c左侧图所示的标签二叉树,以待删除节点为标签二叉树中的节点B1为例进行说明,其存在左分支节点C和右分支节点B2,且该左分支节点C存在右分支节点C1,按照上述处理,可以查询右分支节点C1的右分支树中的叶子节点C2,即从右分支节点C1向下顺次查询右分支节点,直至达到叶子节点C2,将待删除节点B1的右分支节点B2作为该叶子节点C2的右分支节点,即作为新的叶子节点,再由待删除节点B1的左分支节点C替换待删除节点B1,得到如图8c右侧图所示的标签二叉树。
步骤S410,由待删除节点的右分支节点替换待删除节点。
继上述分析,若待删除标签所在待删除节点不存在左分支节点,但待删除节点存在右分支节点的情况下,可以由该右分支节点替换待删除节点。参照图8d左侧图所示的标签二叉树,待删除节点为标签二叉树中的节点A1,其不存在左分支节点,但存在右分支节点A2,可以删除节点A1,并将节点A2放置到节点A1原来的位置,从而使节点A2的上层节点从节点A1变为节点A。
可见,在待删除节点同时具有左分支节点和右分支节点,或者只具有一个分支节点的情况下,均可以按照上文描述的方式,实现对待删除节点的删除,同时调整其分支节点的位置,即由其分支节点替换该待删除节点,关于标签二叉树中节点删除方式,并不局限于上文描述的方法。
参照图9,为本申请提出的多级标签处理装置的一可选示例的结构示意图,该装置可以适用于计算机设备,如图9所示,该多级标签处理装置可以包括:
标签获取模块11,用于获取不同业务场景下各产品具有的标签,以及不同标签之间的关联关系,所述关联关系包括父子关系和兄弟关系;
标签二叉树构建模块12,用于利用不同标签之间的所述父子关系和所述兄弟关系,将获取的所述标签作为节点,构建标签二叉树;
其中,所述标签二叉树中各节点的左分支节点与相应节点之间的关联关系的类型一致,右分支节点与相应节点之间的关联关系的类型一致。
在一些实施例中,上述多级标签处理装置还可以包括:
关系链路构建模块,用于利用不同标签之间的所述父子关系,构建各所述右分支节点与相应父节点之间的关系链路。
关联节点查询模块13,用于响应目标产品的标签向量化请求,查询所述标签二叉树,得到所述目标产品具有的各目标标签分别对应的目标关联节点,该目标关联节点可以包括相应目标标签在标签二叉树中的节点,向上查询到根节点所经过的节点,如各祖先节点;和/或向下查询到叶子节点所经过的节点,如子节点。
标签向量生成模块14,用于利用所述各目标标签分别对应的目标关联节点,生成所述目标产品的标签向量。
在一种可能的实现方式中,该关联节点查询模块13可以包括:
目标标签确定单元,用于响应目标产品的标签向量化请求,确定所述目标产品具有的目标标签;
祖先节点查询单元,用于确定所述目标标签在所述标签二叉树中的目标节点,查询所述标签二叉树中所述目标节点对应的各祖先节点,将该祖先节点确定为相应目标节点对应的目标关联节点。
在另一种可能的实现方式中,在上述标签二叉树中的各节点的左分支节点与相应节点之间的关联关系为父子关系的情况下,上述关联节点查询模块13还可以包括:
目标子节点遍历单元,用于遍历所述标签二叉树中所述目标节点的左分支节点直至叶子节点,将遍历到的目标节点的各目标子节点(即左分支节点)确定为目标关联节点;
相应地,上述标签向量生成模块14可以包括:
标签向量生成单元,用于将所述各目标标签分别对应的各祖先节点以及所述目标子节点合并,生成所述目标产品的标签向量。
在一些实施例中,在标签二叉树中的各节点的左分支节点与相应节点之间的关联关系为父子关系的情况下,如图10所示,上述多级标签处理装置还可以包括:
新标签得到模块15,用于响应标签增加请求,得到所述产品的新标签;
第一检测模块16,用于检测所述新标签的父标签在所述标签二叉树中所在节点的左分支节点是否为空;
第一确定模块17,用于在第一检测模块的检测结果为所述左分支节点为空的情况下,将所述新标签确定为该左分支节点;
第二确定模块18,用于在第一检测模块的检测结果为所述左分支节点不为空的情况下,将所述左分支节点作为父节点,遍历所述父节点的右分支树中的各右分支节点,直至遍历到为空的目标右分支节点,将所述新标签确定为所述目标右分支节点。
在又一些实施例中,在标签二叉树中的各节点的左分支节点与相应节点之间的关联关系为父子关系的情况下,上述多级标签处理装置还可以包括:
节点类型确定模块,用于响应标签删除请求,确定待删除标签在所述标签二叉树的节点类型,所述节点类型包括叶子节点和分支节点;
第一删除模块,用于在节点类型为所述叶子节点的情况下,删除所述标签二叉树中的所述待删除标签;
左分支节点检测模块,用于在节点类型为分支节点的情况下,检测所述待删除标签所在待删除节点是否存在左分支节点和右分支节点,以及该左分支节点是否存在右分支节点;
第二删除模块,用于在左分支节点检测模块的检测结果为,待删除节点存在左分支节点,且该左分支节点不存在右分支节点和/或待删除节点不存在右分支节点的情况下,由该左分支节点替换所述待删除节点;
第三删除模块,用于在左分支节点检测模块的检测结果为,待删除标签所在待删除节点存在左分支节点和右分支节点,且左分支节点存在右分支节点的情况下,查询该左分支节点的右分支节点所在的右分支树中的叶子节点,将待删除节点的右分支节点作为该叶子节点的右分支节点,由左分支节点替换所述待删除节点;
第三删除模块,用于在左分支节点检测模块的检测结果为,待删除节点不存在左分支节点的情况下,检测待删除节点存在右分支节点,由该右分支节点替换所述待删除节点。
需要说明的是,关于上述各装置实施例中的各种模块、单元等,均可以作为程序模块存储在存储器中,由处理器执行存储在存储器中的上述程序模块,以实现相应的功能,关于各程序模块及其组合所实现的功能,以及达到的技术效果,可以参照上述方法实施例相应部分的描述,本实施例不再赘述。
本申请还提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现上述多级标签处理方法的各步骤,具体实现过程可以参照上述方法实施例相应部分的描述。
参照图11,为本申请提出的一种适用于上述多级标签处理方法的计算机设备的硬件结构示意图,该计算机设备可以包括存储器21和处理器22,其中:
存储器21和处理器22均可以连接通信总线,以实现相互之间的数据交互,本申请对计算机设备内部的线路连接关系不做一一详述。
存储器21可以用于存储实现本申请提出的多级标签处理方法的程序。
本实施例中,该存储器21可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件或其他易失性固态存储器件等,本申请对该存储器21的类型及存储结构不做限定。
在一种可能的实现方式中,存储器21可以包括程序存储区和数据存储区,该程序存储区可以存储操作系统、以及至少一个功能(如标签查询)所需的应用程序、实现本申请提出的多级标签处理方法的程序等;数据存储区可以存储计算机设备使用过程中所产生的数据。
处理器33,可以用于加载并执行存储器22中存储的程序,以实现本申请任一可选实施例提出的多级标签处理方法的各个步骤,具体实现过程可以参照下文相应实施例相应部分的描述。
在一些实施例中,上述处理器22可以为中央处理器(Central Processing Unit,CPU)、特定应用集成电路(application-specific integrated circuit,ASIC)、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件等。
应该理解的是,图11所示的计算机设备的结构并不构成对本申请实施例中计算机设备的限定,在实际应用中,计算机设备可以包括比图11所示的更多或更少的部件,或者组合某些部件,本申请在此不做一一列举。
最后,需要说明的是,本说明书中各个实施例采用递进或并列的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、计算机设备而言,由于其与实施例公开的方法对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种多级标签处理方法,其特征在于,所述方法包括:
获取不同业务场景下各产品具有的标签,以及不同标签之间的关联关系,所述关联关系包括父子关系和兄弟关系;
利用不同标签之间的所述父子关系和所述兄弟关系,将获取的所述标签作为节点,构建标签二叉树,其中,所述标签二叉树中各节点的左分支节点与相应节点之间的关联关系的类型一致,右分支节点与相应节点之间的关联关系的类型一致;
响应目标产品的标签向量化请求,查询所述标签二叉树,得到所述目标产品具有的各目标标签分别对应的目标关联节点,所述目标关联节点包括相应目标标签在所述标签二叉树中的节点,向上查询到根节点所经过的节点,和/或向下查询到叶子节点所经过的节点;
利用所述各目标标签分别对应的所述目标关联节点,生成所述目标产品的标签向量。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用不同标签之间的所述父子关系,构建各所述右分支节点与相应父节点之间的关系链路。
3.根据权利要求2所述的方法,其特征在于,所述响应目标产品的标签向量化请求,查询所述标签二叉树,得到所述目标产品具有的各目标标签分别对应的目标关联节点,包括:
响应目标产品的标签向量化请求,确定所述目标产品具有的目标标签;
确定所述目标标签在所述标签二叉树中的目标节点,查询所述标签二叉树中所述目标节点对应的各祖先节点,将所述祖先节点确定为相应目标节点对应的目标关联节点。
4.根据权利要求3所述的方法,其特征在于,若各节点的左分支节点与相应节点之间的关联关系为父子关系,所述响应目标产品的标签向量化请求,查询所述标签二叉树,得到所述目标产品具有的各目标标签分别对应的目标关联节点,还包括:
遍历所述标签二叉树中所述目标节点的左分支节点直至叶子节点,将遍历到的所述目标节点的各目标子节点确定为目标关联节点;
所述利用所述各目标标签分别对应的目标关联节点,生成所述目标产品的标签向量,包括:
将所述各目标标签分别对应的各祖先节点以及所述目标子节点合并,生成所述目标产品的标签向量。
5.根据权利要求1~4任一项所述的方法,其特征在于,若各节点的左分支节点与相应节点之间的关联关系为父子关系,所述方法还包括:
响应标签增加请求,得到所述产品的新标签;
检测所述新标签的父标签在所述标签二叉树中所在节点的左分支节点是否为空;
若所述左分支节点为空,将所述新标签确定为该左分支节点;
若所述左分支节点不为空,将该左分支节点作为父节点,遍历所述父节点的右分支树中的各右分支节点,直至遍历到为空的目标右分支节点,将所述新标签确定为所述目标右分支节点。
6.根据权利要求1~4任一项所述的方法,其特征在于,若各节点的左分支节点与相应节点之间的关联关系为父子关系,所述方法还包括:
响应标签删除请求,确定待删除标签在所述标签二叉树的节点类型,所述节点类型包括叶子节点和分支节点;
若所述节点类型为所述叶子节点,删除所述标签二叉树中的所述待删除标签;
若所述节点类型为所述分支节点,检测所述待删除标签所在待删除节点存在左分支节点,且所述左分支节点不存在右分支节点和/或所述待删除节点不存在右分支节点,由该左分支节点替换所述待删除节点;
检测所述待删除标签所在待删除节点存在左分支节点和右分支节点,且所述左分支节点存在右分支节点,查询该左分支节点的右分支节点所在的右分支树中的叶子节点,将所述待删除节点的右分支节点作为该叶子节点的右分支节点,由所述左分支节点替换所述待删除节点;
检测所述待删除标签所在待删除节点不存在左分支节点,但存在右分支节点,由该右分支节点替换所述待删除节点。
7.一种多级标签处理装置,其特征在于,所述装置包括:
标签获取模块,用于获取不同业务场景下各产品具有的标签,以及不同标签之间的关联关系,所述关联关系包括父子关系和兄弟关系;
标签二叉树构建模块,用于利用不同标签之间的所述父子关系和所述兄弟关系,将获取的所述标签作为节点,构建标签二叉树,其中,所述标签二叉树中各节点的左分支节点与相应节点之间的关联关系的类型一致,右分支节点与相应节点之间的关联关系的类型一致;
关联节点查询模块,用于响应目标产品的标签向量化请求,查询所述标签二叉树,得到所述目标产品具有的各目标标签分别对应的目标关联节点,所述目标关联节点包括相应目标标签在所述标签二叉树中的节点,向上查询到根节点所经过的节点,和/或向下查询到叶子节点所经过的节点;
标签向量生成模块,用于利用所述各目标标签分别对应的所述目标关联节点,生成所述目标产品的标签向量。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
关系链路构建模块,用于利用不同标签之间的所述父子关系,构建各所述右分支节点与相应父节点之间的关系链路。
9.根据权利要求7或8所述的装置,其特征在于,若各节点的左分支节点与相应节点之间的关联关系为父子关系,所述装置还包括:
新标签得到模块,用于响应标签增加请求,得到所述产品的新标签;
第一检测模块,用于检测所述新标签的父标签在所述标签二叉树中所在节点的左分支节点是否为空;
第一确定模块,用于在第一检测模块的检测结果为所述左分支节点为空的情况下,将所述新标签确定为该左分支节点;
第二确定模块,用于在第一检测模块的检测结果为所述左分支节点不为空的情况下,将所述左分支节点作为父节点,遍历所述父节点的右分支树中的各右分支节点,直至遍历到为空的目标右分支节点,将所述新标签确定为所述目标右分支节点。
10.一种计算机设备,其特征在于,所述计算机设备包括:
存储器,用于存储实现如权利要求1~6任一项所述的多级标签处理方法的程序;
处理器,用于加载并执行所述存储器存储的所述程序,以实现如权利要求1~6任一项所述的多级标签处理方法的各步骤。
CN202010507039.8A 2020-06-05 2020-06-05 多级标签处理方法、装置及计算机设备 Active CN111625694B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010507039.8A CN111625694B (zh) 2020-06-05 2020-06-05 多级标签处理方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010507039.8A CN111625694B (zh) 2020-06-05 2020-06-05 多级标签处理方法、装置及计算机设备

Publications (2)

Publication Number Publication Date
CN111625694A true CN111625694A (zh) 2020-09-04
CN111625694B CN111625694B (zh) 2023-04-07

Family

ID=72258416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010507039.8A Active CN111625694B (zh) 2020-06-05 2020-06-05 多级标签处理方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN111625694B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113094560A (zh) * 2021-05-07 2021-07-09 国家电网有限公司大数据中心 基于数据中台的数据标签库构建方法、装置、设备及介质
CN113282804A (zh) * 2021-06-22 2021-08-20 北京锐安科技有限公司 关系图的调整方法、装置及存储介质
CN113361274A (zh) * 2021-06-29 2021-09-07 中国平安人寿保险股份有限公司 基于标签向量的意图识别方法、装置、电子设备及介质
CN113794579A (zh) * 2021-07-26 2021-12-14 奇安信科技集团股份有限公司 标签创建方法、装置、设备、系统与存储介质
CN116910372A (zh) * 2023-09-11 2023-10-20 腾讯科技(深圳)有限公司 信息推送模型处理方法和装置、信息推送方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039253A (zh) * 2006-03-17 2007-09-19 中兴通讯股份有限公司 一种实现三重内容可寻址存储器范围匹配的前缀扩展方法
CN105183911A (zh) * 2015-10-12 2015-12-23 国家电网公司 一种基于数据来源二叉树的电力系统异常数据溯源方法
US20190243811A1 (en) * 2018-02-05 2019-08-08 Fujitsu Limited Generation method, generation device, and computer-readable recording medium
CN110473082A (zh) * 2019-08-15 2019-11-19 中国银行股份有限公司 基于标签和判定树的科目处理方法及系统
US20200151190A1 (en) * 2018-11-08 2020-05-14 Fujitsu Limited Efficient discovery of a binary tree pattern from a large amount of binary tree data

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039253A (zh) * 2006-03-17 2007-09-19 中兴通讯股份有限公司 一种实现三重内容可寻址存储器范围匹配的前缀扩展方法
CN105183911A (zh) * 2015-10-12 2015-12-23 国家电网公司 一种基于数据来源二叉树的电力系统异常数据溯源方法
US20190243811A1 (en) * 2018-02-05 2019-08-08 Fujitsu Limited Generation method, generation device, and computer-readable recording medium
US20200151190A1 (en) * 2018-11-08 2020-05-14 Fujitsu Limited Efficient discovery of a binary tree pattern from a large amount of binary tree data
CN110473082A (zh) * 2019-08-15 2019-11-19 中国银行股份有限公司 基于标签和判定树的科目处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
雷向欣,胡运发,杨智应,刘勇,张凯: "基于互关联后继树的XML索引技术" *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113094560A (zh) * 2021-05-07 2021-07-09 国家电网有限公司大数据中心 基于数据中台的数据标签库构建方法、装置、设备及介质
CN113282804A (zh) * 2021-06-22 2021-08-20 北京锐安科技有限公司 关系图的调整方法、装置及存储介质
CN113361274A (zh) * 2021-06-29 2021-09-07 中国平安人寿保险股份有限公司 基于标签向量的意图识别方法、装置、电子设备及介质
CN113361274B (zh) * 2021-06-29 2023-07-25 中国平安人寿保险股份有限公司 基于标签向量的意图识别方法、装置、电子设备及介质
CN113794579A (zh) * 2021-07-26 2021-12-14 奇安信科技集团股份有限公司 标签创建方法、装置、设备、系统与存储介质
CN116910372A (zh) * 2023-09-11 2023-10-20 腾讯科技(深圳)有限公司 信息推送模型处理方法和装置、信息推送方法和装置
CN116910372B (zh) * 2023-09-11 2024-01-26 腾讯科技(深圳)有限公司 信息推送模型处理方法和装置、信息推送方法和装置

Also Published As

Publication number Publication date
CN111625694B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN111625694B (zh) 多级标签处理方法、装置及计算机设备
Zhu et al. Unsupervised entity resolution on multi-type graphs
CN104794242B (zh) 一种搜索方法
US20060218160A1 (en) Change control management of XML documents
US8661004B2 (en) Representing incomplete and uncertain information in graph data
US7672958B2 (en) Method and system to identify records that relate to a pre-defined context in a data set
CN102893281A (zh) 信息搜索设备、信息搜索方法、计算机程序和数据结构
US20200226651A1 (en) Methods and systems for product discovery in user generated content
CN108804458B (zh) 一种爬虫网页采集方法和装置
US11734324B2 (en) Systems and methods for high efficiency data querying
CN112672370B (zh) 网元指标数据的自动检测方法及系统、设备和存储介质
CN112463991A (zh) 历史行为数据的处理方法、装置、计算机设备及存储介质
CN110879799B (zh) 标注技术元数据的方法和装置
CN110929120B (zh) 管理技术元数据的方法和装置
Rei et al. Multimodal metadata assignment for cultural heritage artifacts
Vandic et al. A semantic clustering-based approach for searching and browsing tag spaces
KR102153259B1 (ko) 데이터 도메인 추천 방법 및 추천된 도메인을 이용하여 통합 데이터 저장소 관리 시스템을 구축하는 방법
CN104376000A (zh) 确定网页属性的方法及装置
JP2014021552A (ja) 業務文書処理システム、及びプログラム
EP2187320A2 (en) Apparatus and method for utilizing context to resolve ambiguous queries
US20090187585A1 (en) Comparing very large xml data
Wang et al. Measuring the similarity of PML documents with RFID–based sensors
CN114880483A (zh) 一种元数据知识图谱构建方法、存储介质及系统
CN111125483B (zh) 网页数据抽取模板生成方法、装置、计算机装置及存储介质
US10430775B1 (en) Validation and lookup techniques for rule-based data categorization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant