CN111400554B - 一种统一标签库的接入方法及装置 - Google Patents

一种统一标签库的接入方法及装置 Download PDF

Info

Publication number
CN111400554B
CN111400554B CN201910000982.7A CN201910000982A CN111400554B CN 111400554 B CN111400554 B CN 111400554B CN 201910000982 A CN201910000982 A CN 201910000982A CN 111400554 B CN111400554 B CN 111400554B
Authority
CN
China
Prior art keywords
tag
unified
metadata
unified tag
definition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910000982.7A
Other languages
English (en)
Other versions
CN111400554A (zh
Inventor
张聪
赵耀红
邓超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910000982.7A priority Critical patent/CN111400554B/zh
Publication of CN111400554A publication Critical patent/CN111400554A/zh
Application granted granted Critical
Publication of CN111400554B publication Critical patent/CN111400554B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种统一标签库的接入方法及装置,属于大数据技术领域,所述接入方法包括:根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据;将与统一标签定义元数据对应的业务数据和统一标签定义元数据进行关联,得到统一标签目录树中统一标签业务数据;根据统一标签目录元数据、统一标签定义元数据和统一标签业务数据,生成统一标签目录树,统一标签目录树包含与每一系统对应的子树;建立包含统一标签目录树的统一标签库。能够实现标签统一,实现用户访问互联网行为数据的实时解析,提升业务与产品营销效率与准确性。

Description

一种统一标签库的接入方法及装置
技术领域
本发明涉及大数据技术领域,尤其涉及一种统一标签库的接入方法及装置。
背景技术
随着信息技术的快速发展,各种产品、图片、文字等内容越来越多地以互联网内容标签的形式出现。标签在互联网内容分类、互联网精准营销、互联网用户画像等多个方面的作用越来越明显。通过对海量的标签信息进行整理、管理和挖掘,能够分析出用户的兴趣点和偏好,利于产品优化和面向用户的个性化精准营销。
然而,针对目前的互联网内容,包括不同的行业和不同品类的商品,互联网内容供应商往往提供了多种可能相同或者相似的标签,不利于对标签进行分析,因此,为了支撑面向大数据的标签信息整合,实现提升标签信息分析的效率和准确性,需要实现外部内容标签与统一内部标签的自动匹配与集成,达到标签统一。
因此,如何建立统一标签库,提升标签信息分析的效率和准确性,是目前亟待解决的技术问题。
发明内容
有鉴于此,本发明提供一种统一标签库的接入方法及装置,用于解决目前的标签信息分析的效率和准确性低的问题。
为解决上述技术问题,第一方面,本发明提供一种统一标签库的接入方法,包括以下步骤:
根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据;所述统一标签目录元数据为所述统一标签目录树中节点间的层次结构信息;所述统一标签定义元数据包括标签的定义信息和所述标签所在节点的信息;
将与所述统一标签定义元数据对应的业务数据和所述统一标签定义元数据进行关联,得到所述统一标签目录树中与所述统一标签定义元数据关联的统一标签业务数据;
根据所述统一标签目录元数据、所述统一标签定义元数据和所述统一标签业务数据,生成所述统一标签目录树,所述统一标签目录树包含与每一所述系统对应的子树;
建立包含所述统一标签目录树的统一标签库。
优选的,所述根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据的步骤包括:
利用爬虫技术,获取所述至少一个系统的层次信息;
采用内容裁剪和/或标签融合技术,对所述层次信息进行处理,得到树状层次标签体系;
根据预设编码规则,对所述树状层次标签体系进行编码,得到所述统一标签目录元数据。
优选的,所述统一标签目录元数据包括以下至少之一:所述节点的编号、所述节点的名称和所述节点的父节点编号。
优选的,所述接入方法还包括:
根据所述统一标签定义元数据和所述统一标签业务数据,定位所述统一标签目录树中的标签。
优选的,所述统一标签定义元数据包括以下至少之一:标签编号、标签名称、标签频度、节点编号、标签数据接口表表名、标签数据接口表字段名、标签数据接口表关联主键。
优选的,所述统一标签业务数据为用户行为数据,包括以下至少之一:用户手机号码、标签编号、数据日期、标签权重。
优选的,每一所述系统的标签文件包括:系统标签目录元数据、系统标签定义元数据和系统标签业务数据;
其中,所述系统标签目录元数据为与所述系统对应的子树中节点间的层次结构信息;所述系统标签定义元数据包括所述子树中标签的定义信息和所述标签所在所述子树中节点的信息;所述系统标签业务数据为与所述系统标签定义元数据关联的业务数据。
优选的,所述至少一个系统包括以下至少之一:站点标签系统、电商标签系统和计算机应用程序APP标签系统。
优选的,所述建立包含所述统一标签目录树的统一标签库的步骤之后,还包括:
根据所述统一标签业务数据,生成与所述统一标签业务数据对应的用户的分析结果;
根据所述分析结果和预设标签模型,获取目标客户;
向所述目标客户发送推广信息。
第二方面,本发明还提供一种统一标签库的接入装置,包括:
第一生成模块,用于根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据;所述统一标签目录元数据为所述统一标签目录树中节点间的层次结构信息;所述统一标签定义元数据包括标签的定义信息和所述标签所在节点的信息;
获得模块,用于将与所述统一标签定义元数据对应的业务数据和所述统一标签定义元数据进行关联,得到所述统一标签目录树中与所述统一标签定义元数据关联的统一标签业务数据;
第二生成模块,用于根据所述统一标签目录元数据、所述统一标签定义元数据和所述统一标签业务数据,生成所述统一标签目录树,所述统一标签目录树包含与每一所述系统对应的子树;
建立模块,用于建立包含所述统一标签目录树的统一标签库。
优选的,所述第一生成模块,用于利用爬虫技术,获取所述至少一个系统的层次信息;采用内容裁剪和/或标签融合技术,对所述层次信息进行处理,得到树状层次标签体系;根据预设编码规则,对所述树状层次标签体系进行编码,得到所述统一标签目录元数据。
优选的,所述统一标签目录元数据包括以下至少之一:所述节点的编号、所述节点的名称和所述节点的父节点编号。
优选的,所述统一标签库的接入装置还包括:
定位模块,用于根据所述统一标签定义元数据和所述统一标签业务数据,定位所述统一标签目录树中的标签。
优选的,所述统一标签定义元数据包括以下至少之一:标签编号、标签名称、标签频度、节点编号、标签数据接口表表名、标签数据接口表字段名、标签数据接口表关联主键。
优选的,所述统一标签业务数据为用户行为数据,包括以下至少之一:用户手机号码、标签编号、数据日期、标签权重。
优选的,每一所述系统的标签文件包括:系统标签目录元数据、系统标签定义元数据和系统标签业务数据;
其中,所述系统标签目录元数据为与所述系统对应的子树中节点间的层次结构信息;所述系统标签定义元数据包括所述子树中标签的定义信息和所述标签所在所述子树中节点的信息;所述系统标签业务数据为与所述系统标签定义元数据关联的业务数据。
优选的,所述至少一个系统包括以下至少之一:站点标签系统、电商标签系统和计算机应用程序APP标签系统。
优选的,所述统一标签库的接入装置还包括:
分析模块,用于根据所述统一标签业务数据,生成与所述统一标签业务数据对应的用户的分析结果;
获取模块,用于根据所述分析结果和预设标签模型,获取目标客户;
发送模块,用于向所述目标客户发送推广信息。
第三方面,本发明还提供一种统一标签库的接入装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述处理器执行所述计算机程序时实现上述的接入方法。
第四方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的接入方法中的步骤。
本发明的上述技术方案的有益效果如下:
本发明实施例中,通过根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据、统一标签定义元数据和统一标签业务数据,从而生成包含与每一系统对应的子树的统一标签目录树,建立包含统一标签目录树的统一标签库,能够实现标签统一,根据用户访问互联网行为数据生产标签,实现用户访问互联网行为数据的实时解析,实现统一标签库与业务生产系统的松耦合和无缝接入,支撑业务生产系统的业务与产品营销效率与准确性,实时捕获自有业务与产品的潜在目标客户,利于公司对外业务与产品的营销推广与对内运营分析。
附图说明
图1为本发明实施例一的统一标签库的接入方法的流程示意图;
图2为本发明实施例的统一标签目录元数据的示意图;
图3-5为本发明实施例的统一标签定义元数据的示意图;
图6为本发明实施例的流量平台系统的系统标签目录元数据的示意图;
图7为本发明的具体应用场景的统一标签库的接入方法的流程示意图;
图8为本发明的具体应用场景的统一标签目录树的示意图;
图9为本发明实施例二的统一标签库的接入装置的结构示意图;
图10为本发明实施例三的统一标签库的接入装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1为本发明实施例一的统一标签库的接入方法的流程示意图,包括以下步骤:
步骤11:根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据;所述统一标签目录元数据为所述统一标签目录树中节点间的层次结构信息;所述统一标签定义元数据包括标签的定义信息和所述标签所在节点的信息;
步骤12:将与所述统一标签定义元数据对应的业务数据和所述统一标签定义元数据进行关联,得到所述统一标签目录树中与所述统一标签定义元数据关联的统一标签业务数据;
步骤13:根据所述统一标签目录元数据、所述统一标签定义元数据和所述统一标签业务数据,生成所述统一标签目录树,所述统一标签目录树包含与每一所述系统对应的子树;
步骤14:建立包含所述统一标签目录树的统一标签库。
本发明实施例提供的接入方法,能够实现标签统一,根据用户访问互联网行为数据生产标签,实现用户访问互联网行为数据的实时解析,实现统一标签库与业务生产系统的松耦合和无缝接入,支撑业务生产系统的业务与产品营销效率与准确性,实时捕获自有业务与产品的潜在目标客户,利于公司对外业务与产品的营销推广与对内运营分析。
本发明实施例中,统一标签库对标签文件的整合接入包括三部分内容,即统一标签目录数据中的统一标签目录元数据、统一标签定义元数据和统一标签业务数据,下面分别说明。
(1)统一标签目录元数据
简单来说,统一标签目录元数据为统一标签目录树中所有节点间的层次结构信息,基于统一标签目录元数据,统一标签库可生产相应的统一标签目录树。
优选的,所述统一标签目录元数据包括以下至少之一:所述节点的编号、所述节点的名称和所述节点的父节点编号。
其中,所述节点为所述统一标签目录树中任一节点。
具体请参阅表1,统一标签目录元数据包括统一标签目录树中任一节点的编号、该节点的名称和该节点的父节点编号。
表1
优选的,所述根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据的步骤包括:
利用爬虫技术,获取所述至少一个系统的层次信息;
采用内容裁剪和/或标签融合技术,对所述层次信息进行处理,得到树状层次标签体系;
根据预设编码规则,对所述树状层次标签体系进行编码,得到所述统一标签目录元数据。
举例来说,可以针对终端这一系统进行爬虫,获取到不同的终端品牌,获取每一终端品牌下的不同型号,得到终端系统的层次信息,如:标签间的隶属关系。采用内容裁剪和/或标签融合技术,对所述层次信息进行处理,得到树状层次标签体系。采用预设编码规则,能够得到编码后的统一标签目录元数据。
其中,预设编码规则可以为根据实际需求自行构建的编码规则,更为切合实际,灵活方便。
以图2为示例,图2是本发明实施例的统一标签目录元数据的示意图。每一节点与每一标签一一对应,根节点“系统”的编号为-1;节点“流量平台”的编号为101011,名称为流量平台,该节点的父节点为数字化服务,该节点的父节点编号为1010。图2中的虚线箭头表示两个节点中间还省略了若干节点。
(2)统一标签定义元数据
具体而言,统一标签定义元数据为接入统一标签库的标签定义信息。简单来说,统一标签定义元数据为统一标签目录树中与每一节点关联的结构信息,如:与节点对应的标签的信息、节点自身的信息(例如:该节点的编号、该节点的子节点信息)、与节点对应的标签关联的数据接口表的信息。
优选的,所述统一标签定义元数据包括以下至少之一:标签编号、标签名称、标签频度、节点编号、标签数据接口表表名、标签数据接口表字段名、标签数据接口表关联主键。
具体请参阅表2,统一标签定义元数据包含标签定义信息、标签所在节点信息、标签数据接口表信息。
表2
表2中,标签频度指按照预设周期(例如:每日或每月)统计标签的次数。
节点编号为标签所在统一标签目录树中节点的编号。
在本发明的一些优选实施例中,所述接入方法还包括:
根据所述统一标签定义元数据和所述统一标签业务数据,定位所述统一标签目录树中的标签。
举例来说,统一标签目录树中一统一标签定义元数据所在节点为A,与标签a关联,一统一标签业务数据也与标签a关联,从而,可以确定在统一标签目录树中标签a的具体位置,如:位于该统一标签目录树中节点A处。
本发明实施例中,每一标签与统一标签目录树中一节点唯一对应。
具体而言,统一标签目录树中的标签如图2-5所示,图3-5是本发明实施例的统一标签定义元数据的示意图。图3是根据流量平台系统生成的统一标签定义元数据的示意图,图4是根据终端系统生成的统一标签定义元数据的示意图,图5是根据数据管理平台(DataManagement Platform,DMP)系统生成的统一标签定义元数据的示意图。
其中,图3中的流量平台系统和图4中的终端系统为外部系统,图5中的数据管理平台系统为内部系统。
图3中,标签“流量平台”的名称为流量平台,所在节点的编号为101011,该节点的子节点包括:“视频”节点(编号为10101111)和“音乐”节点(编号为10101110)。
(3)统一标签业务数据
优选的,所述统一标签业务数据为用户行为数据,包括以下至少之一:用户手机号码、标签编号、数据日期、标签权重。
具体来说,统一标签业务数据为跟统一标签定义元数据关联的用户行为数据,请参阅表3。
表3
举例来说,请参阅图2、图4和表4,根据该用户对应的标签编码,得到该用户所对应的标签为小米,可以获取该节点的上级节点,如:数字化服务,可以推断出该用户是数字化服务的受众。
字段英文名 字段中文名
IMSI_ID 手机号码 158********
LABEL_ID 标签编码 10101010
DATA_DATE 数据日期 20181111
LABEL_WEIGHT 标签权重 10
表4
在本发明的一些优选实施例中,每一所述系统的标签文件包括:系统标签目录元数据、系统标签定义元数据和系统标签业务数据;
其中,所述系统标签目录元数据为与所述系统对应的子树中节点间的层次结构信息;所述系统标签定义元数据包括所述子树中标签的定义信息和所述标签所在所述子树中节点的信息;所述系统标签业务数据为与所述系统标签定义元数据关联的业务数据。
也就是说,每一系统的标签文件也包括三方面内容:系统标签目录元数据、系统标签定义元数据和系统标签业务数据,可以根据一系统的三方面内容,生成统一标签目录树中与该系统对应的子树。
以图6为示例,图6是本发明实施例的流量平台系统的系统标签目录元数据的示意图,其包括统一标签目录树中与流量平台系统对应的子树中根节点“流量平台”与节点“视频”、“音乐”、“小说”的层次结构信息,节点“视频”与叶节点“电影”、“动漫”的层次结构信息,节点“音乐”与叶节点“古典音乐”、“现代音乐”的层次结构信息,节点“小说”与叶节点“男生小说”、“女生小说”的层次结构信息。
系统标签定义元数据为与流量平台系统对应的子树中与每一节点关联的结构信息,如:与节点对应的标签的信息、节点自身的信息(例如:子树中该节点的编号)。
本发明实施例中,可以根据系统的原始数据获取系统标签目录元数据、系统标签定义元数据和系统标签业务数据,获取方法可以与统一标签目录元数据、统一标签定义元数据和统一标签业务数据的获取方法相同,本发明不再赘述。
本发明实施例中,系统的标签文件可以是按照目标编码规则进行编码的,建立统一标签库时按照预设编码规则再重新编码;当然,系统的标签文件也可以是未进行编码的,建立统一标签库时直接按照编码规则进行编码,本发明不作限定。
在本发明的一些优选实施例中,所述建立包含所述统一标签目录树的统一标签库的步骤之后,还包括:
根据所述统一标签业务数据,生成与所述统一标签业务数据对应的用户的分析结果;
根据所述分析结果和预设标签模型,获取目标客户;
向所述目标客户发送推广信息。
也就是说,根据用户访问互联网的行为数据,实时进行解析,生成该用户的分析结果,进而采用预设标签模型,实现业务潜在目标客户的挖掘与定位,向目标客户进行营销推广。
在本发明的一些优选实施例中,所述至少一个系统包括以下至少之一:站点标签系统、电商标签系统和计算机应用程序(Application,APP)标签系统。
也就是说,根据不同渠道(站点渠道、电商渠道和APP渠道)的原始数据,得到所述至少一个系统的标签文件,建立统一标签库。
在本发明的一具体应用场景中,请参阅图8,图8是本发明的具体应用场景的统一标签库的接入方法的流程示意图。统一标签库的接入流程如下:
第一阶段:部署Hadoop集群、Mapreduce、Hive、Spark、Redis、Storm、Mongodb等大数据处理与分析工具,对统一标签目录元数据、统一标签定义元数据和统一标签业务数据的接口进行接口内容、格式定义和技术方案设计,并分配用于生成统一标签目录元数据、统一标签定义元数据和统一标签业务数据的集群资源。
具体而言,可以通过安全文件传送协议(Secure File Transfer Protocol,SFTP)数据接入的方式,实现用户访问互联网行为数据实时标签化。
所述接口内容、格式定义和技术方案设计包括:确定统一标签目录元数据、统一标签定义元数据和统一标签业务数据中的字段、数据类型、连接、格式等。
第二阶段:建设统一标签库,具体包括:
1、用于生成统一标签目录元数据和统一标签定义元数据的层次结构数据开发与测试;
2、用于生成统一标签业务数据的开发与测试;
3、系统与统一标签库进行接口联调与集成测试;
4、改造建立用于文件传输协议(File Transfer Protocol,FTP)传输的数据接口,通过FTP传输数据,对统一标签目录元数据、统一标签定义元数据和统一标签业务数据进行测试、传送、校验、重传、管理等;
其中,校验不合格(如:丢失部分数据、数据格式不正确)需要进行重传,管理为定期删除数据、对数据进行加密等。
5、站点系统、电商系统、APP系统进行内容裁剪、统一标签元数据框架转换及标签元数据的开发与生成;
即,采用内容裁剪、标签融合技术,对统一标签目录元数据、统一标签定义元数据进行开发与生成测试。
6、站点系统、电商系统、APP系统进行全量内容裁剪、统一标签业务数据框架转换及统一标签业务数据的开发与生成;
7、其他定制化系统进行内容裁剪、统一标签业务数据框架转换及统一标签业务数据的开发与生成;
8、生产环境下隔离区(demilitarized zone,DMZ区)后台产生的站点系统、电商系统、APP系统的统一标签目录元数据文件和统一标签定义元数据文件生成;
9、生产环境下DMZ区后台产生的站点系统、电商系统、APP系统的统一业务数据文件生成。
具体而言,统一标签目录元数据、统一标签定义元数据和统一业务数据通常生成在非DMZ区,复制统一标签目录元数据、统一标签定义元数据和统一业务数据至DMZ区,即生成DMZ区的统一标签目录元数据文件、统一标签定义元数据文件和统一业务数据文件。
具体来说,图7中,以DMP系统、流量平台系统、终端系统为示例,根据每一系统的标签文件(标签文件都包括三方面内容:系统标签目录元数据、系统标签定义元数据和系统标签业务数据,且满足预设格式、数据类型等一系列条件),进行接口配置,基于BDPE工具配置,将数据分发至集群资源,建立统一标签库,该统一标签库包括统一标签目录树,该统一标签目录树包括:统一标签目录元数据、统一标签定义元数据和统一标签业务数据,并根据预设编码规则进行编码。生成的统一标签目录树如图8所示,该统一标签目录树80包括与DMP系统对应的子树81、与流量平台系统对应的子树82和与终端系统对应的子树83。
从而,能够在统一标签库中进行自动取数(实时获取用户访问互联网的行为数据),自助分析(实时进行解析,生成该用户的分析结果,获取目标客户),营销服务(向目标客户进行营销推广)。
本发明利用大数据技术,不仅能够实现外部互联网行业内容标签化,实现标签统一,且能够实时生产用户访问互联网行为数据的标签,并通过松耦合的微服务方式为业务生产系统提供实时快速获取潜在目标客户的解决方案,具有可扩展多个互联网行业,并支持实时挖掘自有业务和产品的目标客户功能,具有部署快捷、获客效率高、目标客户定位准等多个方面的优势。
请参阅图9,图9是本发明实施例二的统一标签库的接入装置的结构示意图,该统一标签库的接入装置90包括:
第一生成模块91,用于根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据;所述统一标签目录元数据为所述统一标签目录树中节点间的层次结构信息;所述统一标签定义元数据包括标签的定义信息和所述标签所在节点的信息;
获得模块92,用于将与所述统一标签定义元数据对应的业务数据和所述统一标签定义元数据进行关联,得到所述统一标签目录树中与所述统一标签定义元数据关联的统一标签业务数据;
第二生成模块93,用于根据所述统一标签目录元数据、所述统一标签定义元数据和所述统一标签业务数据,生成所述统一标签目录树,所述统一标签目录树包含与每一所述系统对应的子树;
建立模块94,用于建立包含所述统一标签目录树的统一标签库。
本发明实施例中,能够实现标签统一,根据用户访问互联网行为数据生产标签,实现用户访问互联网行为数据的实时解析,实现统一标签库与业务生产系统的松耦合和无缝接入,支撑业务生产系统的业务与产品营销效率与准确性,实时捕获自有业务与产品的潜在目标客户,利于公司对外业务与产品的营销推广与对内运营分析。
优选的,所述第一生成模块91,用于利用爬虫技术,获取所述至少一个系统的层次信息;采用内容裁剪和/或标签融合技术,对所述层次信息进行处理,得到树状层次标签体系;根据预设编码规则,对所述树状层次标签体系进行编码,得到所述统一标签目录元数据。
优选的,所述统一标签目录元数据包括以下至少之一:所述节点的编号、所述节点的名称和所述节点的父节点编号。
优选的,所述统一标签库的接入装置90还包括:
定位模块,用于根据所述统一标签定义元数据和所述统一标签业务数据,定位所述统一标签目录树中的标签。
优选的,所述统一标签定义元数据包括以下至少之一:标签编号、标签名称、标签频度、节点编号、标签数据接口表表名、标签数据接口表字段名、标签数据接口表关联主键。
优选的,所述统一标签业务数据为用户行为数据,包括以下至少之一:用户手机号码、标签编号、数据日期、标签权重。
优选的,每一所述系统的标签文件包括:系统标签目录元数据、系统标签定义元数据和系统标签业务数据;
其中,所述系统标签目录元数据为与所述系统对应的子树中节点间的层次结构信息;所述系统标签定义元数据包括所述子树中标签的定义信息和所述标签所在所述子树中节点的信息;所述系统标签业务数据为与所述系统标签定义元数据关联的业务数据。
优选的,所述至少一个系统包括以下至少之一:站点标签系统、电商标签系统和计算机应用程序APP标签系统。
优选的,所述统一标签库的接入装置90还包括:
分析模块,用于根据所述统一标签业务数据,生成与所述统一标签业务数据对应的用户的分析结果;
获取模块,用于根据所述分析结果和预设标签模型,获取目标客户;
发送模块,用于向所述目标客户发送推广信息。
具体工作过程与上述对应实施例一中的一致,故在此不再赘述,详细请参阅以上对应实施例中方法步骤的说明。
请参阅图10,图10是本发明实施例三的统一标签库的接入装置的结构示意图,该统一标签库的接入装置100包括处理器101、存储器102及存储在所述存储器102上并可在所述处理器101上运行的计算机程序;所述处理器101执行所述计算机程序时实现如下步骤:
根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据;所述统一标签目录元数据为所述统一标签目录树中节点间的层次结构信息;所述统一标签定义元数据包括标签的定义信息和所述标签所在节点的信息;
将与所述统一标签定义元数据对应的业务数据和所述统一标签定义元数据进行关联,得到所述统一标签目录树中与所述统一标签定义元数据关联的统一标签业务数据;
根据所述统一标签目录元数据、所述统一标签定义元数据和所述统一标签业务数据,生成所述统一标签目录树,所述统一标签目录树包含与每一所述系统对应的子树;
建立包含所述统一标签目录树的统一标签库。
本发明实施例中,能够实现标签统一,根据用户访问互联网行为数据生产标签,实现用户访问互联网行为数据的实时解析,实现统一标签库与业务生产系统的松耦合和无缝接入,支撑业务生产系统的业务与产品营销效率与准确性,实时捕获自有业务与产品的潜在目标客户,利于公司对外业务与产品的营销推广与对内运营分析。
优选的,所述处理器101执行所述计算机程序时实现如下步骤:
所述根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据的步骤包括:
利用爬虫技术,获取所述至少一个系统的层次信息;
采用内容裁剪和/或标签融合技术,对所述层次信息进行处理,得到树状层次标签体系;
根据预设编码规则,对所述树状层次标签体系进行编码,得到所述统一标签目录元数据。
优选的,所述统一标签目录元数据包括以下至少之一:所述节点的编号、所述节点的名称和所述节点的父节点编号。
优选的,所述处理器101执行所述计算机程序时实现如下步骤:
根据所述统一标签目录元数据和所述统一标签定义元数据,生成所述统一标签目录树中的标签。
优选的,所述统一标签定义元数据包括以下至少之一:标签编号、标签名称、标签频度、节点编号、标签数据接口表表名、标签数据接口表字段名、标签数据接口表关联主键。
优选的,所述统一标签业务数据为用户行为数据,包括以下至少之一:用户手机号码、标签编号、数据日期、标签权重。
优选的,每一所述系统的标签文件包括:系统标签目录元数据、系统标签定义元数据和系统标签业务数据;
其中,所述系统标签目录元数据为与所述系统对应的子树中节点间的层次结构信息;所述系统标签定义元数据包括所述子树中标签的定义信息和所述标签所在所述子树中节点的信息;所述系统标签业务数据为与所述系统标签定义元数据关联的业务数据。
优选的,所述至少一个系统包括以下至少之一:站点标签系统、电商标签系统和计算机应用程序APP标签系统。
优选的,所述处理器101执行所述计算机程序时实现如下步骤:
所述建立包含所述统一标签目录树的统一标签库的步骤之后,还包括:
根据所述统一标签业务数据,生成与所述统一标签业务数据对应的用户的分析结果;
根据所述分析结果和预设标签模型,获取目标客户;
向所述目标客户发送推广信息。
具体工作过程与上述对应实施例一中的一致,故在此不再赘述,详细请参阅以上对应实施例中方法步骤的说明。
本发明实施例四提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例一中接入方法中的步骤。具体工作过程与上述对应实施例一中的一致,故在此不再赘述,详细请参阅以上对应实施例中方法步骤的说明。
本发明实施例中的网络侧设备可以是全球移动通讯(Global System of Mobilecommunication,简称GSM)或码分多址(Code Division Multiple Access,简称CDMA)中的基站(Base Transceiver Station,简称BTS),也可以是宽带码分多址(Wideband CodeDivision Multiple Access,简称WCDMA)中的基站(NodeB,简称NB),还可以是LTE中的演进型基站(Evolutional Node B,简称eNB或eNodeB),或者中继站或接入点,或者未来5G网络中的基站等,在此并不限定。
本发明实施例中的终端可以是无线终端也可以是有线终端,无线终端可以是指向用户提供语音和/或其他业务数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。无线终端可以经无线接入网(Radio Access Network,简称RAN)与一个或多个核心网进行通信,无线终端可以是移动终端,如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语言和/或数据。例如,个人通信业务(PersonalCommunication Service,简称PCS)电话、无绳电话、会话发起协议(SessionInitiation Protocol,简称SIP)话机、无线本地环路(Wireless Local Loop,简称WLL)站、个人数字助理(PersonalDigital Assistant,简称PDA)等设备。无线终端也可以称为系统、订户单元(Subscriber Unit)、订户站(Subscriber Station),移动站(Mobile Station)、移动台(Mobile)、远程站(Remote Station)、远程终端(Remote Terminal)、接入终端(Access Terminal)、用户终端(User Terminal)、用户代理(User Agent)、终端(UserDevice or User Equipment),在此不作限定。
上述计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种统一标签库的接入方法,其特征在于,包括:
根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据;所述统一标签目录元数据为所述统一标签目录树中节点间的层次结构信息;所述统一标签定义元数据包括标签的定义信息和所述标签所在节点的信息;
将与所述统一标签定义元数据对应的业务数据和所述统一标签定义元数据进行关联,得到所述统一标签目录树中与所述统一标签定义元数据关联的统一标签业务数据;
根据所述统一标签目录元数据、所述统一标签定义元数据和所述统一标签业务数据,生成所述统一标签目录树,所述统一标签目录树包含与每一所述系统对应的子树;
建立包含所述统一标签目录树的统一标签库;
其中,所述根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据的步骤包括:
利用爬虫技术,获取所述至少一个系统的层次信息;
采用内容裁剪和/或标签融合技术,对所述层次信息进行处理,得到树状层次标签体系;
根据预设编码规则,对所述树状层次标签体系进行编码,得到所述统一标签目录元数据。
2.根据权利要求1所述的接入方法,其特征在于,所述统一标签目录元数据包括以下至少之一:所述节点的编号、所述节点的名称和所述节点的父节点编号。
3.根据权利要求1所述的接入方法,其特征在于,还包括:
根据所述统一标签定义元数据和所述统一标签业务数据,定位所述统一标签目录树中的标签。
4.根据权利要求1所述的接入方法,其特征在于,所述统一标签定义元数据包括以下至少之一:标签编号、标签名称、标签频度、节点编号、标签数据接口表表名、标签数据接口表字段名、标签数据接口表关联主键。
5.根据权利要求1所述的接入方法,其特征在于,所述统一标签业务数据为用户行为数据,包括以下至少之一:用户手机号码、标签编号、数据日期、标签权重。
6.根据权利要求1所述的接入方法,其特征在于,
每一所述系统的标签文件包括:系统标签目录元数据、系统标签定义元数据和系统标签业务数据;
其中,所述系统标签目录元数据为与所述系统对应的子树中节点间的层次结构信息;所述系统标签定义元数据包括所述子树中标签的定义信息和所述标签所在所述子树中节点的信息;所述系统标签业务数据为与所述系统标签定义元数据关联的业务数据。
7.根据权利要求1所述的接入方法,其特征在于,所述至少一个系统包括以下至少之一:站点标签系统、电商标签系统和计算机应用程序APP标签系统。
8.根据权利要求1所述的接入方法,其特征在于,所述建立包含所述统一标签目录树的统一标签库的步骤之后,还包括:
根据所述统一标签业务数据,生成与所述统一标签业务数据对应的用户的分析结果;
根据所述分析结果和预设标签模型,获取目标客户;
向所述目标客户发送推广信息。
9.一种统一标签库的接入装置,其特征在于,包括:
第一生成模块,用于根据至少一个系统的标签文件,生成统一标签目录树中统一标签目录元数据和统一标签定义元数据;所述统一标签目录元数据为所述统一标签目录树中节点间的层次结构信息;所述统一标签定义元数据包括标签的定义信息和所述标签所在节点的信息;
获得模块,用于将与所述统一标签定义元数据对应的业务数据和所述统一标签定义元数据进行关联,得到所述统一标签目录树中与所述统一标签定义元数据关联的统一标签业务数据;
第二生成模块,用于根据所述统一标签目录元数据、所述统一标签定义元数据和所述统一标签业务数据,生成所述统一标签目录树,所述统一标签目录树包含与每一所述系统对应的子树;
建立模块,用于建立包含所述统一标签目录树的统一标签库;
其中,所述第一生成模块,用于利用爬虫技术,获取所述至少一个系统的层次信息;采用内容裁剪和/或标签融合技术,对所述层次信息进行处理,得到树状层次标签体系;根据预设编码规则,对所述树状层次标签体系进行编码,得到所述统一标签目录元数据。
10.一种统一标签库的接入装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的接入方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至8任一项所述的接入方法中的步骤。
CN201910000982.7A 2019-01-02 2019-01-02 一种统一标签库的接入方法及装置 Active CN111400554B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910000982.7A CN111400554B (zh) 2019-01-02 2019-01-02 一种统一标签库的接入方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910000982.7A CN111400554B (zh) 2019-01-02 2019-01-02 一种统一标签库的接入方法及装置

Publications (2)

Publication Number Publication Date
CN111400554A CN111400554A (zh) 2020-07-10
CN111400554B true CN111400554B (zh) 2023-09-22

Family

ID=71428284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910000982.7A Active CN111400554B (zh) 2019-01-02 2019-01-02 一种统一标签库的接入方法及装置

Country Status (1)

Country Link
CN (1) CN111400554B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000849A (zh) * 2020-08-21 2020-11-27 河南中原消费金融股份有限公司 统一标签库管理方法、装置、设备及存储介质
CN112380811A (zh) * 2020-11-20 2021-02-19 广州欢网科技有限责任公司 word文本素材分级目录生成方法、装置及设备
CN113515644B (zh) * 2021-05-26 2023-05-26 中国医学科学院医学信息研究所 一种基于知识图谱的医院科技画像方法和系统
CN115203483B (zh) * 2022-07-15 2024-02-13 小米汽车科技有限公司 标签管理方法、装置、车辆、存储介质及芯片

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296445A (zh) * 2016-08-01 2017-01-04 国网浙江省电力公司 一种电力客户标签构建方法
CN107958008A (zh) * 2016-10-18 2018-04-24 中国移动通信有限公司研究院 一种统一标签库的更新方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090254585A1 (en) * 2008-04-02 2009-10-08 Oracle International Corporation Method for Associating Administrative Policies with User-Definable Groups of Files
US9992298B2 (en) * 2014-08-14 2018-06-05 International Business Machines Corporation Relationship-based WAN caching for object stores

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296445A (zh) * 2016-08-01 2017-01-04 国网浙江省电力公司 一种电力客户标签构建方法
CN107958008A (zh) * 2016-10-18 2018-04-24 中国移动通信有限公司研究院 一种统一标签库的更新方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孙丽弘 ; .基于移动数据业务大数据应用的用户行为标签库模型.现代电信科技.2016,(04),全文. *
林小晶 ; 杨立 ; 左春 ; .支持动态标准的政务元数据管理的研究与应用.计算机工程与设计.2008,(03),全文. *

Also Published As

Publication number Publication date
CN111400554A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN111400554B (zh) 一种统一标签库的接入方法及装置
TWI450119B (zh) 管理樹中之管理物件的定址方法及相關之裝置管理系統
CN103678531A (zh) 好友推荐方法和装置
CN103167428B (zh) 图片适配方法、手机报推送装置与系统
CN104702675A (zh) 用户事件的响应方法及装置
US20160283591A1 (en) Method for providing social activity integration service
CN115150970A (zh) 一种网络连接的方法及装置
CN101110858A (zh) 电信报表生成系统及方法
CN103036877A (zh) 一种基于tlv格式协议的编解码代码生成装置及方法
CN107370628A (zh) 基于埋点的日志处理方法及系统
Wang et al. Smart devices information extraction in home wi‐fi networks
CN206790531U (zh) 一种精准营销平台
CN107180114B (zh) 一种海事卫星通信话单解析方法和系统
US20230418847A1 (en) Methods and Systems for Querying Data Within a Geographical Boundary Using a Query Tool
CN106060847A (zh) 信号盲区的确定方法及系统
CN103079194A (zh) 业务适配方法、装置及系统
US10182307B2 (en) System for providing location-based social networking services to users of mobile devices
CN103841121A (zh) 一种基于本地文件的评论和互动系统及方法
CN109068286B (zh) 一种信息解析的方法、介质及设备
US9130827B2 (en) Sampling from distributed streams of data
CN109428774B (zh) 一种dpi设备的数据处理方法及相关的dpi设备
CN107529190B (zh) 用户数据获取系统和方法
CN116166640A (zh) 全球导航卫星观测数据实时采集与管理方法及系统
Diab Self-Organized Mobile Communication Technologies and Techniques for Network Optimization
WO2013063745A1 (en) On-demand video cut service

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant