CN116894426A - 标签的标注及存储方法、装置及电子设备 - Google Patents

标签的标注及存储方法、装置及电子设备 Download PDF

Info

Publication number
CN116894426A
CN116894426A CN202310875771.4A CN202310875771A CN116894426A CN 116894426 A CN116894426 A CN 116894426A CN 202310875771 A CN202310875771 A CN 202310875771A CN 116894426 A CN116894426 A CN 116894426A
Authority
CN
China
Prior art keywords
main body
target
marked
label
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310875771.4A
Other languages
English (en)
Inventor
王云冲
孙会首
刘泽隶
李明达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shuguang Cloud Computing Group Co ltd
Original Assignee
Shuguang Cloud Computing Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shuguang Cloud Computing Group Co ltd filed Critical Shuguang Cloud Computing Group Co ltd
Priority to CN202310875771.4A priority Critical patent/CN116894426A/zh
Publication of CN116894426A publication Critical patent/CN116894426A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种标签的标注及存储方法、装置及电子设备。该方法包括:基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;根据标签计算规则、主体表以及元事件表,从待打标主体中筛选出符合标签计算规则的目标主体,并对目标主体标注标签名;对于进行标注后的目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。基于此,用户仅需要输入一定的交互信息,即可完成对所需标识的标签的标注,同时,按照全局唯一递增的方式为目标主体进行编号,并聚合存储为编号位图,采用位图的方式存储编号,便于后续的查询。

Description

标签的标注及存储方法、装置及电子设备
技术领域
本申请实施例涉及标签管理技术领域,尤其涉及一种标签的标注及存储方法、装置及电子设备。
背景技术
随着大数据技术的发展,对于数据分析的能力越来越强,其中,就有利用数据对主体刻画画像的手段,应用越来越广泛。利用数据对主体刻画画像通常是为主体标注标签,标签即为一个主体对象具有的特定属性或者特征行为。
目前,为主体对象标注标签以刻画画像时,通常依靠人工编写脚本来处理不同的数据表,然后将标签数据以大宽表的形式进行储存,以便于完成画像的刻画以及后续的查询。
但是,人工编写脚本的方式需要耗费大量的人力资源,而且大宽表之间的关联等操作会消耗大量算力资源,且操作速度较慢,给主体画像的刻画以及后续的标签查询带来一定的障碍。
发明内容
本申请实施例提供一种标签的标注及存储方法、装置及电子设备,以减少人力和算力资源的消耗,提高画像刻画以及标签查询的速度。
第一方面,本申请实施例提供了一种标签的标注及存储方法,所述方法包括:
基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;
根据所述标签计算规则、所述主体表以及所述元事件表,从所述待打标主体中筛选出符合所述标签计算规则的目标主体,并对所述目标主体标注所述标签名;
对于进行标注后的所述目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。
进一步的,所述基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则,包括:
根据用户输入的交互信息从所述主体表或者所述元事件表中选定目标字段,并将所述目标字段确定为待打标主体;
根据用户输入的交互信息生成本次打标的标签名以及标签计算规则。
基于上述步骤,根据用户输入的交互信息来确定标签名以及标签计算规则,能够更满足用户的实时需求。
进一步的,所述根据所述标签计算规则、所述主体表以及所述元事件表,从所述待打标主体中筛选出符合所述标签计算规则的目标主体,包括:
确定各待打标主体的主体标识;
对于任一待打标主体,关联所述主体表中所述待打标主体的主体标识对应的其他所有字段的字段值,得到所述待打标主体对应的主体属性;
关联所述元事件表中所述待打标主体的主体标识对应的其他所有字段的字段值,得到所述待打标主体对应的元事件属性;
对于任一待打标主体,判断所述待打标主体的主体属性和/或元事件属性是否满足所述标签计算规则,若满足,将所述待打标主体确定为目标主体。
上述步骤中,通过关联的方式,对主体属性以及元事件属性进行综合的筛选,确定出相应的目标主体,筛选效率更高。
进一步的,所述对于进行标注后的所述目标主体,按照全局唯一递增的方式进行编号,包括:
获取当前的最大编号值,并将REDIS中的唯一增量值初始化为所述最大编号值;
统计当前目标主体的数量,并根据所述目标主体的数量更新所述唯一增量值,以锁定当前目标主体所需的编号范围中的各个编号;
利用预设计算引擎在所述编号范围内,为每个所述目标主体分配各自对应的编号。
基于上述步骤,能够实现全局范围内,编号唯一,避免出现编号冲突。
进一步的,所述利用预设计算引擎在所述编号范围内,为每个所述目标主体分配各自对应的编号,包括:
将所有目标主体进行分批,得到预设数量的主体批次;
对于任一主体批次,从所述编号范围内划分出与所述主体批次中目标主体数量相一致的编号数量;
对各主体批次中的目标主体进行并行的编号分配。
基于上述步骤,能够实现分批次进行编号分配,从而提高编号分配的效率。
进一步的,所述基于编号与相应目标主体对编号进行聚合,得到编号位图,包括:
将编号与对应目标主体的主体标识进行映射,得到第一映射表,并将编号与对应的标签名进行映射,得到第二映射表;
利用所述第二映射表,将编号聚合为位图。
基于上述步骤,能够利用映射的第二映射表进行位图的聚合,位图的生成效率更高。
进一步的,所述方法还包括:
在对待查询标签名进行查询时,通过第二映射表确定所述待查询标签名对应的目标编号;
通过第一映射表确定目标编号对应的主体标识,并基于所述主体标识确定出对应的主体属性与元事件属性。
基于上述步骤,能够实现主体的快捷查询。
进一步的,所述方法还包括:
对所述标签名匹配标签老化策略,并基于所述标签老化策略对所述第二映射表中的标签以及对应的位图进行维护。
基于上述步骤,能够对标签进行老化,使位图更加符合标签的变化需求。
第二方面,本申请实施例还提供了一种标签的标注及存储装置,该标签的标注及存储装置包括:
打标信息获取模块,用于基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;
打标模块,用于根据所述标签计算规则、所述主体表以及所述元事件表,从所述待打标主体中筛选出符合所述标签计算规则的目标主体,并对所述目标主体标注所述标签名;
标签数据存储模块,用于对于进行标注后的所述目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。
第三方面,本申请实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本申请任一实施例提供的标签的标注及存储方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请任一实施例提供的标签的标注及存储方法。
本申请实施例的技术方案中,基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;根据所述标签计算规则、所述主体表以及所述元事件表,从所述待打标主体中筛选出符合所述标签计算规则的目标主体,并对所述目标主体标注所述标签名;对于进行标注后的所述目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。基于此,用户仅需要输入一定的交互信息,即可完成对所需标识的标签的标注,同时,按照全局唯一递增的方式为目标主体进行编号,并聚合存储为编号位图,采用位图的方式存储编号,便于后续的查询。
附图说明
图1为本申请实施例一提供的标签的标注及存储方法的流程示意图;
图2为本申请的实施例一提供的筛选目标主体的流程示意图;
图3为本申请的实施例一提供的为目标主体进行编号的流程示意图;
图4为本申请的实施例二提供的一种标签的标注及存储方法的流程示意图;
图5为本申请实施例三提供的一种标签的标注及存储装置的结构示意图;
图6为本申请实施例四提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
实施例一
图1为本申请实施例一提供的标签的标注及存储方法的流程示意图,本实施例可适用于标签的标注及存储的场景。该方法可以由标签的标注及存储装置来执行,该装置可采用硬件和/或软件的方式实现,并一般可以集成在具有数据运算能力的计算机等电子设备中,具体包括如下步骤:
步骤101、基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则。
本步骤中,主体表通常用于存储主体对象的基本信息,不同类型的主体对象的基本信息也有所不同,比如主体对象为人时,主体表中可以包含人的身份信息(即主体标识)、联系地址、联系方式等脱敏后的信息。
元事件表则用于存储主体对象所发生的一些行为或者事件,该表中,可以利用主体对象的主体标识来映射存储其对应的行为或者时间。需要说明的是,主体表以及元事件表中的数据需要经主体对象(主体对象为能够受隐私保护的主体时)同意后或者其他符合法律规定的情形才可以获取、存储以及使用,且在存储时需要经过脱敏处理。
另外,本步骤中用户输入的交互信息指的是本次进行标签标注时所需要的信息,具体包括了待打标主体的选择信息、标签名以及标签计算规则。其中,待打标主体的选择信息可以为用户从主体表中或者元事件表中选择的目标字段,标签名则可以是由人工输入的名称。
另外,标签计算规则可以有多种模式,比如,可以为SQL模式、上传文件打标模式或者自定义标签模式,其中自定义标签模式可以分为自定义静态标签模式和自定义动态标签模式,其中自定义静态标签指的是不需要设置周期、变化不大的标签任务,自定义动态标签指的是设置周期,并且计算结果会动态变化的任务。
需要说明的是,SQL模式可以为用户输入SQL语句的方式进行打标,比如能够释义出“包含某事件的主体”的SQL语句。上传文件打标模式则是可以由用户上传已经编辑好的打标程序块等文件。后续可以根据上述SQL语句以及打标程序块等文件完成打标。
另外,自定义静态标签模式则可以是。。。自定义动态标签模式则可以是。
具体的,本步骤可以先根据用户输入的交互信息从主体表或者元事件表中选定目标字段,并将目标字段确定为待打标主体;然后根据用户输入的交互信息生成本次打标的标签名以及标签计算规则。
在一个具体的例子中,用户选择主体表中的主体标识字段为目标字段,那么该目标字段便为待打标主体。
另外,在上述标签名确定之后,可以为标签名设置运行状态,比如运行状态可以包括上线和下线两种状态,系统在运行时,只会运行上线状态的标签名所对应的标签计算规则。
上线和下线两种状态的切换途径可以有定时和手动两种,定时即设定固定周期,将标签名的运行状态由下线转换为上线,手动则是在有需求时,由人工手动将标签名的运行状态由下线转换为上线。
需要说明的是,标签名刚生成时,其运行状态默认为下线状态,每次标签名对应的打标进程完成后,将其运行状态修改为下线状态。
步骤102、根据标签计算规则、主体表以及元事件表,从待打标主体中筛选出符合标签计算规则的目标主体,并对目标主体标注标签名。
本步骤中,筛选目标主体的方式可以参见图2,图2为本申请的实施例一提供的筛选目标主体的流程示意图。
如图2所示,筛选目标主体的过程可以包括:
步骤201、确定各待打标主体的主体标识。
由于主体标识通常为能够区分出各主体的唯一标识,因此,在选择待打标主体时,可以将主体标识确定为待打标主体,而本步骤中,即为获取主体标识具体的标识值。
步骤202、对于任一待打标主体,关联主体表中待打标主体的主体标识对应的其他所有字段的字段值,得到待打标主体对应的主体属性。
由于在主体表中,对于同一主体的相关信息,通常存储在同一行中,因此,可以将与主体标识处于同一行的其他所有字段的字段值,确定为该待打标主体所对应的字段值,并将其确定为待打标主体的主体属性。
在一个具体的例子中,待打标主体的主体属性具体可以表示为:主体标识={属性1,属性2,属性3,......,属性n},其中,n为正整数。
步骤203、关联元事件表中待打标主体的主体标识对应的其他所有字段的字段值,得到待打标主体对应的元事件属性。
本步骤与步骤202相似,元事件表中也会存储有主体标识,那么可以将主体标识同行的其他所有字段的字段值确定为该待打标主体所对应的字段值,并且将其确定为待打标主体的元事件属性。
在一个具体的例子中,待打标主体的主体属性具体可以表示为:主体标识={事件1,事件2,事件3,......,事件m},其中,m为正整数。
步骤204、对于任一待打标主体,判断待打标主体的主体属性和/或元事件属性是否满足标签计算规则,若满足,将待打标主体确定为目标主体。
本步骤中,标签计算规则可能涉及到主体属性,也可能涉及到元事件属性,还可能既涉及到主体属性又涉及到元事件属性。
因此,在判断待打标主体的主体属性和/或元事件属性是否满足标签计算规则,可以根据标签计算规则来确定出所需的主体属性和/元事件属性,比如,标签计算规则为属性1符合条件1,且发生了元事件q,此时,既涉及到了主体属性,也涉及到了元事件属性,因此,可以分别从主体属性和元事件属性入手确定相应的待打标主体是否为目标主体。
另外,在确定出目标主体后,还需要进行过滤,由于本次标签名的打标可能并非是首次运行,那么就会有已经打过此标签的主体,此时便可以查询出已打标签的主体,并从确定出的目标主体中将已打标签的主体过滤到,即可得到最终的目标主体。
需要说明的是,此处的查询过程会在后续步骤中进行说明,此处不再赘述。
步骤103、对于进行标注后的目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。
本步骤中,为了保证各主体的编号唯一,可以利用REIDS的自增量自带锁性质。具体的,可以参阅图3,图3为本申请的实施例一提供的为目标主体进行编号的流程示意图。
如图3所示,为目标主体进行编号的过程可以包括:
步骤301、获取当前的最大编号值,并将REDIS中的唯一增量值初始化为最大编号值。
本步骤中,获取当前的最大编号值可以通过CLICKHOUSE或DORIS进行查询,CLICKHOUSE或DORIS中存储了历史的编号值与历史标签名之间的映射表(即后续会提到的第二映射表),该第二映射表中会存储所有的编号值,此时将其中最大值查询出皆为本步骤获取的最大编号值。
另外,在REDIS中,存在唯一增量值KEY,REIDS的自增量时是在KEY的基础上进行增加的,因此,可以将KEY初始化为该最大编号值,以便于后续在该最大编号值的基础上进行自增,避免与历史编号重复。
步骤302、统计当前目标主体的数量,并根据目标主体的数量更新唯一增量值,以锁定当前目标主体所需的编号范围中的各个编号。
本步骤中,由于每个目标主体都会分配一个编号,因此,本步骤可以先统计当前目标主体的数量,然后在当前唯一增量值的基础上增加该数量,得到的值作为新的唯一增量值。
基于上述操作,该编号范围,即(前次唯一增量值,更新后的唯一增量值],其中的各个编号均会被锁定,仅用于对当前目标主体的编号进行分配,以此实现编号的全局唯一递增。
步骤303、利用预设计算引擎在编号范围内,为每个目标主体分配各自对应的编号。
为了提高编号分配的效率,可以将目标主体分为多个批次,然后并行分配编号。具体的,可以先将所有目标主体进行分批,得到预设数量的主体批次。其中,预设数量可以由人工进行预先设置,当然,也可以根据并行处理能力来进行动态的修改。
需要说明的是,根据并行处理能力来进行动态修改预设数量时,可以先获取当前空闲线程的数量,并将数量的80%(或者其他预设比例)确定为该预设数量。取部分空闲线程是为了预留出足够的线程供系统能够正常运行。
在一个具体的例子中,确定的预设数量可以为10,那么将目标主体平均分为10份,得到10个主体批次。
然后对于任一主体批次,从编号范围内划分出与主体批次中目标主体数量相一致的编号数量。经过此步骤,每个主体批次都会得到一个子编号范围,主体批次中的目标主体数量与相应的子编号范围中的编号数量相一致。
在经过上述过程之后,对各主体批次中的目标主体进行并行的编号分配,即可完成对所有目标主体的编号。
另外,得到编号位图时,可以先将编号与对应目标主体的主体标识进行映射,得到第一映射表,并将编号与对应的标签名进行映射,得到第二映射表;然后利用第二映射表,将编号聚合为位图。
具体的,位图中的各个编号对应的标签会体现在第二映射表中,位图中各个编号对应的主体标识会体现在第一映射表中,而第二映射表则可以存储在前述CLICKHOUSE或DORIS中。
另外,本申请还可以为标签匹配标签老化策略。具体的,可以在用户的交互信息中体现,可以预设多种标签老化策略,比如按照时间老化,按照运行次数老化等。
具体的,可以对标签名匹配标签老化策略,并基于标签老化策略对第二映射表中的标签以及对应的位图进行维护。具体维护可以为删除第二映射表以及位图中该标签名的相关内容。
本实施例还提供了基于上述位图、第一映射表及第二映射表进行查询的过程,比如,在对待查询标签名进行查询时,通过第二映射表确定待查询标签名对应的目标编号;通过第一映射表确定目标编号对应的主体标识,并基于主体标识确定出对应的主体属性与元事件属性。
在一个具体的实施例中,查询的场景可以但不仅限于包含如下场景:查询标签下的所有的主体的主体标识、查询标签命中的主体数量、查询符合某个或某些标签的所有主体。
本申请实施例的技术方案中,基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;根据标签计算规则、主体表以及元事件表,从待打标主体中筛选出符合标签计算规则的目标主体,并对目标主体标注标签名;对于进行标注后的目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。基于此,用户仅需要输入一定的交互信息,即可完成对所需标识的标签的标注,同时,按照全局唯一递增的方式为目标主体进行编号,并聚合存储为编号位图,采用位图的方式存储编号,便于后续的查询。
实施例二
图4为本申请的实施例二提供的一种标签的标注及存储方法的流程示意图。如图4所示,标签的标注及存储的过程可以包括:
步骤401、根据用户输入的交互信息从主体表或者元事件表中选定目标字段,并将目标字段确定为待打标主体。
步骤402、根据用户输入的交互信息生成本次打标的标签名以及标签计算规则。
步骤403、确定各待打标主体的主体标识;
步骤404、对于任一待打标主体,关联主体表中待打标主体的主体标识对应的其他所有字段的字段值,得到待打标主体对应的主体属性;
步骤405、关联元事件表中待打标主体的主体标识对应的其他所有字段的字段值,得到待打标主体对应的元事件属性;
步骤406、对于任一待打标主体,判断待打标主体的主体属性和/或元事件属性是否满足标签计算规则,若满足,将待打标主体确定为目标主体。
步骤407、对目标主体标注标签名。
步骤408、获取当前的最大编号值,并将REDIS中的唯一增量值初始化为最大编号值;
步骤409、统计当前目标主体的数量,并根据目标主体的数量更新唯一增量值,以锁定当前目标主体所需的编号范围中的各个编号;
步骤410、将所有目标主体进行分批,得到预设数量的主体批次;
步骤411、对于任一主体批次,从编号范围内划分出与主体批次中目标主体数量相一致的编号数量;
步骤412、对各主体批次中的目标主体进行并行的编号分配。
步骤413、将编号与对应目标主体的主体标识进行映射,得到第一映射表,并将编号与对应的标签名进行映射,得到第二映射表;
步骤414、利用第二映射表,将编号聚合为位图。
实施例三
图5为本申请实施例三提供的一种标签的标注及存储装置的结构示意图。本申请实施例所提供的标签的标注及存储装置可执行本申请任意实施例所提供的标签的标注及存储方法,具备执行方法相应的功能模块和有益效果。该装置可采用软件和/或硬件的方式实现,如图5所示,标签的标注及存储装置具体包括:打标信息获取模块501、打标模块502、标签数据存储模块503。
其中,打标信息获取模块,用于基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;
打标模块,用于根据标签计算规则、主体表以及元事件表,从待打标主体中筛选出符合标签计算规则的目标主体,并对目标主体标注标签名;
标签数据存储模块,用于对于进行标注后的目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。
申请实施例的技术方案中,基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;根据标签计算规则、主体表以及元事件表,从待打标主体中筛选出符合标签计算规则的目标主体,并对目标主体标注标签名;对于进行标注后的目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。基于此,用户仅需要输入一定的交互信息,即可完成对所需标识的标签的标注,同时,按照全局唯一递增的方式为目标主体进行编号,并聚合存储为编号位图,采用位图的方式存储编号,便于后续的查询。
进一步的,打标信息获取模块包括:
待打标主体确定单元,用于根据用户输入的交互信息从主体表或者元事件表中选定目标字段,并将目标字段确定为待打标主体;
打标信息获取单元,用于根据用户输入的交互信息生成本次打标的标签名以及标签计算规则。
进一步的,打标模块包括:
主体标识确定单元,用于确定各待打标主体的主体标识;
主体属性确定单元,用于对于任一待打标主体,关联主体表中待打标主体的主体标识对应的其他所有字段的字段值,得到待打标主体对应的主体属性;
元事件确定单元,用于关联元事件表中待打标主体的主体标识对应的其他所有字段的字段值,得到待打标主体对应的元事件属性;
目标主体确定单元,用于对于任一待打标主体,判断待打标主体的主体属性和/或元事件属性是否满足标签计算规则,若满足,将待打标主体确定为目标主体。
进一步的,标签数据存储模块包括:
初始化单元,用于获取当前的最大编号值,并将REDIS中的唯一增量值初始化为最大编号值;
编号锁定单元,用于统计当前目标主体的数量,并根据目标主体的数量更新唯一增量值,以锁定当前目标主体所需的编号范围中的各个编号;
编号分配单元,用于利用预设计算引擎在编号范围内,为每个目标主体分配各自对应的编号。
进一步的,编号分配单元包括:
主体批次确定子单元,用于将所有目标主体进行分批,得到预设数量的主体批次;
编号范围划分子单元,用于对于任一主体批次,从编号范围内划分出与主体批次中目标主体数量相一致的编号数量;
编号分配子单元,用于对各主体批次中的目标主体进行并行的编号分配。
进一步的,标签数据存储模块包括:
映射单元,用于将编号与对应目标主体的主体标识进行映射,得到第一映射表,并将编号与对应的标签名进行映射,得到第二映射表;
位图聚合单元,用于利用第二映射表,将编号聚合为位图。
进一步的,装置还包括:
查询模块,用于在对待查询标签名进行查询时,通过第二映射表确定待查询标签名对应的目标编号;
属性确定模块,用于通过第一映射表确定目标编号对应的主体标识,并基于主体标识确定出对应的主体属性与元事件属性。
进一步的,装置还包括:
标签老化模块,用于对标签名匹配标签老化策略,并基于标签老化策略对第二映射表中的标签以及对应的位图进行维护。
实施例四
图6为本申请实施例四提供的一种电子设备的结构示意图,如图6所示,该电子设备包括处理器610、存储器620、输入装置630和输出装置640;电子设备中处理器610的数量可以是一个或多个,图6中以一个处理器610为例;电子设备中的处理器610、存储器620、输入装置630和输出装置640可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器620作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的标签的标注及存储方法对应的程序指令/模块(例如,标签的标注及存储装置中的打标信息获取模块501、打标模块502、标签数据存储模块503)。处理器610通过运行存储在存储器620中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的标签的标注及存储方法:
基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;
根据标签计算规则、主体表以及元事件表,从待打标主体中筛选出符合标签计算规则的目标主体,并对目标主体标注标签名;
对于进行标注后的目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。
存储器620可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器620可进一步包括相对于处理器610远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实施例五
本申请实施例五还提供一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行一种标签的标注及存储方法,该方法包括:
基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;
根据标签计算规则、主体表以及元事件表,从待打标主体中筛选出符合标签计算规则的目标主体,并对目标主体标注标签名;
对于进行标注后的目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。
当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上的方法操作,还可以执行本申请任意实施例所提供的标签的标注及存储方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本申请可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
值得注意的是,上述搜索装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (10)

1.一种主体的标签标注及存储方法,其特征在于,所述方法包括:
基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;
根据所述标签计算规则、所述主体表以及所述元事件表,从所述待打标主体中筛选出符合所述标签计算规则的目标主体,并对所述目标主体标注所述标签名;
对于进行标注后的所述目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。
2.根据权利要求1所述的方法,其特征在于,所述基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则,包括:
根据用户输入的交互信息从所述主体表或者所述元事件表中选定目标字段,并将所述目标字段确定为待打标主体;
根据用户输入的交互信息生成本次打标的标签名以及标签计算规则。
3.根据权利要求1所述的方法,其特征在于,所述根据所述标签计算规则、所述主体表以及所述元事件表,从所述待打标主体中筛选出符合所述标签计算规则的目标主体,包括:
确定各待打标主体的主体标识;
对于任一待打标主体,关联所述主体表中所述待打标主体的主体标识对应的其他所有字段的字段值,得到所述待打标主体对应的主体属性;
关联所述元事件表中所述待打标主体的主体标识对应的其他所有字段的字段值,得到所述待打标主体对应的元事件属性;
对于任一待打标主体,判断所述待打标主体的主体属性和/或元事件属性是否满足所述标签计算规则,若满足,将所述待打标主体确定为目标主体。
4.根据权利要求1所述的方法,其特征在于,所述对于进行标注后的所述目标主体,按照全局唯一递增的方式进行编号,包括:
获取当前的最大编号值,并将REDIS中的唯一增量值初始化为所述最大编号值;
统计当前目标主体的数量,并根据所述目标主体的数量更新所述唯一增量值,以锁定当前目标主体所需的编号范围中的各个编号;
利用预设计算引擎在所述编号范围内,为每个所述目标主体分配各自对应的编号。
5.根据权利要求4所述的方法,其特征在于,所述利用预设计算引擎在所述编号范围内,为每个所述目标主体分配各自对应的编号,包括:
将所有目标主体进行分批,得到预设数量的主体批次;
对于任一主体批次,从所述编号范围内划分出与所述主体批次中目标主体数量相一致的编号数量;
对各主体批次中的目标主体进行并行的编号分配。
6.根据权利要求1所述的方法,其特征在于,所述基于编号与相应目标主体对编号进行聚合,得到编号位图,包括:
将编号与对应目标主体的主体标识进行映射,得到第一映射表,并将编号与对应的标签名进行映射,得到第二映射表;
利用所述第二映射表,将编号聚合为位图。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在对待查询标签名进行查询时,通过第二映射表确定所述待查询标签名对应的目标编号;
通过第一映射表确定目标编号对应的主体标识,并基于所述主体标识确定出对应的主体属性与元事件属性。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
对所述标签名匹配标签老化策略,并基于所述标签老化策略对所述第二映射表中的标签以及对应的位图进行维护。
9.一种标签的标注及存储装置,其特征在于,所述装置包括:
打标信息获取模块,用于基于预先获取的主体表、元事件表以及用户输入的交互信息,确定待打标主体、标签名以及标签计算规则;
打标模块,用于根据所述标签计算规则、所述主体表以及所述元事件表,从所述待打标主体中筛选出符合所述标签计算规则的目标主体,并对所述目标主体标注所述标签名;
标签数据存储模块,用于对于进行标注后的所述目标主体,按照全局唯一递增的方式进行编号,并基于编号与相应目标主体对编号进行聚合,得到编号位图。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的标签的标注及存储方法。
CN202310875771.4A 2023-07-17 2023-07-17 标签的标注及存储方法、装置及电子设备 Pending CN116894426A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310875771.4A CN116894426A (zh) 2023-07-17 2023-07-17 标签的标注及存储方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310875771.4A CN116894426A (zh) 2023-07-17 2023-07-17 标签的标注及存储方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN116894426A true CN116894426A (zh) 2023-10-17

Family

ID=88313268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310875771.4A Pending CN116894426A (zh) 2023-07-17 2023-07-17 标签的标注及存储方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116894426A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110297836A (zh) * 2019-07-11 2019-10-01 杭州云梯科技有限公司 基于压缩位图方式的用户标签存储方法和检索方法
CN112860899A (zh) * 2021-03-16 2021-05-28 中化现代农业有限公司 标签生成方法、装置、计算机设备和计算机可读存储介质
CN113157695A (zh) * 2021-03-29 2021-07-23 北京字节跳动网络技术有限公司 数据处理方法、装置、可读介质及电子设备
CN113313344A (zh) * 2021-04-13 2021-08-27 武汉烽火众智数字技术有限责任公司 一种融合多模式的标签体系构建方法和系统
CN113918605A (zh) * 2021-10-13 2022-01-11 咪咕文化科技有限公司 数据查询方法、装置、设备以及计算机存储介质
CN114297245A (zh) * 2021-11-30 2022-04-08 网易(杭州)网络有限公司 画像标签处理方法、装置、存储介质、处理器及电子装置
CN114398859A (zh) * 2022-01-04 2022-04-26 北京快确信息科技有限公司 一种数据标注方法、装置、电子设备及存储介质
CN114398410A (zh) * 2021-12-24 2022-04-26 中国农业银行股份有限公司 一种连续编号生成方法、装置、服务器集群及存储介质
WO2022095520A1 (zh) * 2020-11-05 2022-05-12 深圳壹账通智能科技有限公司 文档编辑方法、装置、服务器、终端和存储介质
CN114840519A (zh) * 2022-03-28 2022-08-02 烽台科技(北京)有限公司 一种数据打标签的方法、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110297836A (zh) * 2019-07-11 2019-10-01 杭州云梯科技有限公司 基于压缩位图方式的用户标签存储方法和检索方法
WO2022095520A1 (zh) * 2020-11-05 2022-05-12 深圳壹账通智能科技有限公司 文档编辑方法、装置、服务器、终端和存储介质
CN112860899A (zh) * 2021-03-16 2021-05-28 中化现代农业有限公司 标签生成方法、装置、计算机设备和计算机可读存储介质
CN113157695A (zh) * 2021-03-29 2021-07-23 北京字节跳动网络技术有限公司 数据处理方法、装置、可读介质及电子设备
CN113313344A (zh) * 2021-04-13 2021-08-27 武汉烽火众智数字技术有限责任公司 一种融合多模式的标签体系构建方法和系统
CN113918605A (zh) * 2021-10-13 2022-01-11 咪咕文化科技有限公司 数据查询方法、装置、设备以及计算机存储介质
CN114297245A (zh) * 2021-11-30 2022-04-08 网易(杭州)网络有限公司 画像标签处理方法、装置、存储介质、处理器及电子装置
CN114398410A (zh) * 2021-12-24 2022-04-26 中国农业银行股份有限公司 一种连续编号生成方法、装置、服务器集群及存储介质
CN114398859A (zh) * 2022-01-04 2022-04-26 北京快确信息科技有限公司 一种数据标注方法、装置、电子设备及存储介质
CN114840519A (zh) * 2022-03-28 2022-08-02 烽台科技(北京)有限公司 一种数据打标签的方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN107704527B (zh) 数据存储方法、装置及存储介质
CN102254012B (zh) 一种基于外存的图数据存储方法及子图查询方法
CN109344197B (zh) 基于大数据的分页下载方法和装置
CN105812175B (zh) 一种资源管理方法及资源管理设备
US9990403B2 (en) System and a method for reasoning and running continuous queries over data streams
CN116266183A (zh) 一种数据分析方法、装置、设备以及计算机存储介质
CN113326264A (zh) 数据处理方法、服务器及存储介质
CN112667860A (zh) 一种子图匹配方法、装置、设备及存储介质
CN111934899A (zh) 物联网用户信息的配置方法、装置、计算机设备
DE112012006412T5 (de) System zur verteilten Datensuche, Verfahren zur verteilten Datensuche und Managementcomputer
CN112052144B (zh) 信息管理方法、装置、电子设备及存储介质
CN116955538B (zh) 医疗字典数据匹配方法及装置、电子设备及存储介质
CN116894426A (zh) 标签的标注及存储方法、装置及电子设备
CN111858617A (zh) 用户查找方法和装置、计算机可读存储介质、电子设备
CN114553717B (zh) 一种网络节点划分方法、装置、设备及存储介质
Welke et al. HOPS: Probabilistic subtree mining for small and large graphs
CN113127207B (zh) 一种众包任务资源分配方法、装置、电子设备及存储介质
CN115168509A (zh) 风控数据的处理方法及装置、存储介质、计算机设备
CN114860806A (zh) 区块链的数据查询方法、装置、计算机设备和存储介质
Yu et al. Based on attribute order for dynamic attribute reduction in the incomplete information system
CN116932838B (zh) 基于数据库的数据查询、更新、存储方法和装置
CN112487035A (zh) 基于elasticsearch的标签存储和查询方法及装置
US10311156B2 (en) Information association and suggestion
CN103020276A (zh) 一种社交对象搜索方法及装置
CN115576593B (zh) 工业互联软件运行方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: 100193 5 floor, 36 building, No. 8 Northeast Road, Haidian District, Beijing.

Applicant after: Shuguang Cloud Computing Group Co.,Ltd.

Address before: 100193 5 floor, 36 building, No. 8 Northeast Road, Haidian District, Beijing.

Applicant before: Shuguang Cloud Computing Group Co.,Ltd.

Country or region before: China

CB02 Change of applicant information