CN110765101A - 标签的生成方法、装置、计算机可读存储介质及服务器 - Google Patents

标签的生成方法、装置、计算机可读存储介质及服务器 Download PDF

Info

Publication number
CN110765101A
CN110765101A CN201910848871.1A CN201910848871A CN110765101A CN 110765101 A CN110765101 A CN 110765101A CN 201910848871 A CN201910848871 A CN 201910848871A CN 110765101 A CN110765101 A CN 110765101A
Authority
CN
China
Prior art keywords
data
label
model
rule
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910848871.1A
Other languages
English (en)
Other versions
CN110765101B (zh
Inventor
张英海
阳怡进
卢海潮
李奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Tianyun Software Technology Co Ltd
Original Assignee
Hunan Tianyun Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Tianyun Software Technology Co Ltd filed Critical Hunan Tianyun Software Technology Co Ltd
Priority to CN201910848871.1A priority Critical patent/CN110765101B/zh
Publication of CN110765101A publication Critical patent/CN110765101A/zh
Application granted granted Critical
Publication of CN110765101B publication Critical patent/CN110765101B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请属于数据处理技术领域,提供了一种标签的生成方法、装置、计算机可读存储介质及服务器,该方法包括:导入系统中存储的元数据;所述元数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;对每一所述数据对象配置一个对应的数据模型;根据若干所述数据模型对应的属性之间的关联性,生成关系模型;将所述数据模型和所述关系模型存储在模型库中;根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。本申请实施例对导入的系统数据的预处理生成对应属性的数据模型和生成体现数据模型之间的业务关系的关系模型,解决标签生成过程中数据脚本无法反复使用的问题。

Description

标签的生成方法、装置、计算机可读存储介质及服务器
技术领域
本发明涉及数据处理的技术领域,尤其涉及一种标签的生成方法、装置、计算机可读存储介质及服务器。
背景技术
在互联网时代,各个行业例如金融行业中公司之间的线上业务往来以及客户在线上平台的业务办理等线上业务的高速发展,使得系统中存储有庞大的客户数据以及交易数据等数据。为实现对不同群体实现更精准的服务推送、服务设计以及客户行为分析,需对系统中大数据进行数据分析,其中比较常用的数据分析处理方法为数据标签化,按标签设计将数据打上标签。
现有的数据标签化方法采用SQL(结构化查询语言)生成标签,但此方法只面向专业技术人员,若条件更改则使用时需再次进行编程处理。并且SQL生成标签的过程中涉及的数据处理只以脚本的形式存在,无法直接提取反复使用。
发明内容
有鉴于此,本发明实施例提供了一种标签的生成方法、装置、计算机可读存储介质及服务器,以解决标签生成过程中数据脚本无法反复使用的问题。
本发明实施例的第一方面提供了一种标签的生成方法,包括:
导入系统中存储的元数据;所述元数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;
对每一所述数据对象配置一个对应的数据模型;
根据若干所述数据模型对应的属性之间的关联性,生成关系模型;
将所述数据模型和所述关系模型存储在模型库中;
根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。
在一个实施示例中,所述对每一所述数据对象配置一个对应的数据模型,包括:
对每一所述数据对象所包含的属性配置对应的数据项;所述数据项限定所述数据对象的属性信息和数据类型;
若所述数据项引用预设标准,根据所述预设标准的表述规则调整所述数据对象中数据项的属性信息;
根据调整后的数据项构建数据模型。
在一个实施示例中,所述对每一所述数据对象所包含的属性配置对应的数据项之后,还包括:
若所述数据项未设定引用预设标准,所述数据项包括具有与所述数据项的属性语义关联的属性信息的数据对象。
在一个实施示例中,所述根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据,包括:
根据预设的标签规则定义标签;所述标签规则包括标签属性;
根据所述标签从所述模型库中查找对应属性的所述数据模型进行标签计算,输出标签数据。
在一个实施示例中,所述根据预设的标签规则定义标签,包括:
获取预设的标签规则;
若需进行参数调控,根据调控指令生成参数信息;
根据所述标签规则和所述参数信息定义标签。
在一个实施示例中,在根据所述标签从所述模型库中查找对应属性的所述数据模型进行标签计算,输出标签数据之前,包括:
对预设的标签规则进行合法性校验;所述合法性校验包括标签名称合法性校验和规则合法性校验;
若校验通过,根据所述标签规则定义标签。
在一个实施示例中,在根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据之后,还包括:
获取所述关系模型,根据所述关系模型确定所述标签数据之间的关系,生成标签图谱
本发明实施例的第二方面提供了一种标签的生成装置,包括:
数据导入模块,用于导入系统中存储数据;所述数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;
数据模型建立模块,用于对每一所述数据对象配置一个对应的数据模型;
关系模型建立模块,用于根据若干所述数据模型对应的属性之间的关联性,生成关系模型;
存储模块,用于将所述数据模型和所述关系模型存储在模型库中;
标签计算模块,用于根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。
在一个实施示例中,所述数据模型建立模块包括:
数据项定义单元,用于对每一所述数据对象所包含的属性配置对应的数据项;所述数据项限定所述数据对象的属性信息和数据类型;
标准代码引用单元,用于若所述数据项引用预设标准,根据所述预设标准的表述规则调整所述数据对象中数据项的属性信息;
数据模型建立单元,用于根据调整后的数据项构建数据模型。
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述方法的步骤。
本发明实施例的第四方面提供了一种服务器,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面所述方法的步骤。
本发明实施例提供的一种标签的生成方法、装置、计算机可读存储介质及服务器,通过导入系统中的存储的元数据;所述元数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;对每一所述数据对象配置一个对应的数据模型;根据若干所述数据模型对应的属性之间的关联性,生成关系模型;将所述数据模型和所述关系模型存储在模型库中;根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。实现对导入的系统数据的预处理生成对应属性的数据模型和生成体现数据模型之间的业务关系的关系模型,以方便业务人员随时调用模型库中的数据模型和关系模型进行标签计算。还能够根据业务需求灵活调整标签规则,并通过调用模型库中预存的数据模型便捷快速的完成数据的贴标。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的标签的生成方法的流程示意图;
图2是本发明实施例一提供的数据模型的实施示例的示意图;
图3是本发明实施例二提供的标签的生成方法的流程示意图;
图4是本发明实施例二提供的标签规则定义的实施示例的示意图;
图5是本发明实施例三提供的标签的生成装置的结构示意图;
图6是本发明实施例五提供的服务器的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含一系列步骤或单元的过程、方法或系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,术语“第一”、“第二”和“第三”等是用于区别不同对象,而非用于描述特定顺序。
实施例一
如图1所示,是本发明实施例一提供的标签的生成方法的流程示意图。本实施例可适用于对各行业例如银行系统中的数据标签化的处理过程,可通过将业务人员配置的数据处理逻辑进行解析并转换为适用于SQL的技术语言进行标签计算,该方法可以由服务器执行。在本发明实施例中以该服务器作为执行主体进行说明,该方法具体包括如下步骤:
S110、导入系统中存储的元数据;所述元数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;
在互联网时代,各个行业例如金融行业中公司之间的线上业务往来以及客户在线上平台的业务办理等线上业务的高速发展,使得系统中存储有庞大的客户数据以及交易数据等数据即元数据。为实现不同的业务需求,可对系统中大数据进行数据标签化处理。其中,由于系统中存储有大量用户以及业务数据,在对数据进行分析处理前需对系统中的数据进行预处理,可选地,可为导入系统中所包含的元数据并根据每一数据具有的属性将数据整理归类。
具体地,导入存储的元数据(例如银行系统的数据)中可能包括若干个人客户信息(姓名、证件类型和证件号码等)和业务信息(交易时间、交易项目和交易金额等)等具有不同属性的数据对象,且每一属性具有对应的数据类型。例如姓名、证件类型、证件号码和籍贯等这一类的数据对象的属性为文本,则文本对应的数据类型为文本型而不是数字类型,限定具有该属性的数据对象不能进行加减乘除计算;例如交易金额这一类的数据对象的属性为金额,则金额对应的数据类型为数据类型,还可进一步根据金额类型限定数据类型为整型、双精度型等;例如日期这一类的数据对象的属性为日期,则日期对应的数据类型可为日期时间型。
S120、对每一所述数据对象配置一个对应的数据模型;
在导入系统中的存储数据后,根据数据中包括的若干属性对数据进行分类归档,将每一属性所包含的数据对象配置一个对应的数据模型,即构建若干数据模型,每一数据模型存放具有同类属性的数据,使得数据模型具有自身存放的数据对象的属性。
在一个实施示例中,配置数据模型的过程包括对每一所述数据对象所包含的属性配置对应的数据项;所述数据项限定所述数据对象的属性信息和数据类型。具体地,基于SQL实施环境,构建的数据模型可以数据表格的形式呈现。在数据模型中数据项是数据模型的主要组成部分,通过对每一数据对象所包含的属性配置对应的数据项,根据每一数据对象所包含的属性将数据对象归类至对应的多个数据项中,并且数据项限定了自身所包含的数据对象的属性信息和数据类型。其中,数据项限定的数据类型根据自身所包含的数据对象的属性确定,从而配置生成例如姓名、性别、证件类型、证件号码和籍贯等数据项。由于系统中存储的数据可能存在有人为输入数据或数据输入标准不统一的情况,导致数据对象的属性信息描述方式并未采用标准格式,例如性别属性的数据对象的属性信息可为男、女、妇女或男生等情况。为实现数据对象的属性信息的标准化,可预设标准;该预设标准限定数据对象的属性信息描述方式和数据标准。
在一个实施示例中,若所述数据项引用预设标准,根据所述预设标准的表述规则调整所述数据对象中数据项的属性信息。具体地,对每一数据对象所包含的属性配置对应的数据项后,可选择数据项是否引用预设标准,若数据项引用预设标准,则根据预设标准中限定的数据项的属性信息描述方式和数据标准调整每一数据对象中数据项的属性信息。例如将性别属性的数据对象的属性信息描述统一为男或女这两种情况。并且预设标准还限定数据项的数据标准,该数据标准可为针对证件类型包括身份证类型、户口本类型和军官证类型等几十种组合的国家通用数据标准,从而限定证件属性的数据项的属性信息即数据信息在此标准范围内。例如,若预设证件类型的数据项(如身份证数据项)引用预设标准则对应调整身份证数据项中数据的位数为18位,规范数据存储。
在另一个实施示例中,若所述数据项未设定引用预设标准,所述数据项包括具有与所述数据项的属性语义关联的属性信息的数据对象。具体地,若数据项未引用预设标准,则具有与数据项的属性语义相关联的属性信息的数据对象也包括在数据项中。例如,性别属性的数据对象的属性信息可为男、女、妇女或男生等情况,将具有与性别数据项的属性语义关联的性别描述词的数据对象均包括在内。
在一个实施示例中,当数据项根据引用预设标准的需求进行调整后,根据调整后的数据项构建对应的数据模型。具体地,进行数据合法性以及引用关系等的校验后,根据业务需求将对应的数据项组合成若干数据模型;例如将姓名、证件类型、证件号码和籍贯数据项组合构建为个人客户信息模型等。如图2所示,是数据模型的实施示例的示意图。可选地,可根据业务需求将客户标识、客户名称、客户称谓以及英文名称这几个数据项组合成个人客户基本信息模型。从而实现对导入的系统数据的预处理,将导入的数据中的无用数据筛除并将数据对象按对应的需求分类归档生成对应的若干数据模型。
S130、根据若干所述数据模型对应的属性之间的关联性,生成关系模型;
当根据预设的业务需求构建多个数据模型后,还可根据若干模型对应的属性之间的关联性生成关系模型,构成模型网。例如,个人客户信息模型与个人账户信息模型中均具有客户编号,一个客户可拥有多个账户,因此个人客户信息模型与个人账户信息模型的关系为一对多关系,可将客户编号作为关联字段,查找每一个人客户信息模型关联的个人账户信息模型,生成关系模型。从而通过关系模型体现数据模型之间的业务关系。
S140、将所述数据模型和所述关系模型存储在模型库中;
将根据预设需求构建的若干数据模型和根据若干数据模型对应属性的关联性生成的关系模型存储在模型库中,以方便业务人员随时调用模型库中的数据模型和关系模型进行标签计算。
S150、根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。
当业务人员需对系统数据进行标签计算时,可根据业务需求预先设定标签规则,例如业务人员所构建的所需标签对应的数据筛选条件;根据预设的标签规则生成可执行的SQL语句以及标签模板,在SQL实施环境中运行SQL语句查询模型库中的数据,从模型库中获取标签规则所需的数据模型进行标签计算,将计算筛选得到的数据填入标签模板后输出标签数据,从而获得业务人员所需的贴标数据。实现可根据业务需求灵活调整标签规则,并通过调用模型库中预存的数据模型便捷快速的完成对数据的贴标。
本发明实施例提供的一种标签的生成方法,通过导入系统中存储的元数据;所述元数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;对每一所述数据对象配置一个对应的数据模型;根据若干所述数据模型对应的属性之间的关联性,生成关系模型;将所述数据模型和所述关系模型存储在模型库中;根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。实现对导入的系统数据的预处理生成对应属性的数据模型和生成体现数据模型之间的业务关系的关系模型,以方便业务人员随时调用模型库中的数据模型和关系模型进行标签计算。还能够根据业务需求灵活调整标签规则,并通过调用模型库中预存的数据模型便捷快速的完成数据的贴标。
实施例二
如图3所示,是本发明实施例二提供的标签的生成方法的流程示意图。在实施例一的基础上,本实施例还提供了对标签的定义过程,从而实现根据业务需求灵活生成标签。
S210、导入系统中存储的元数据;所述元数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;
S220、对每一所述数据对象配置一个对应的数据模型;
S230、根据若干所述数据模型对应的属性之间的关联性,生成关系模型;
S240、将所述数据模型和所述关系模型存储在模型库中;
S250、根据预设的标签规则定义标签;所述标签规则包括标签属性;
服务器对导入的数据进行预处理时,构建对应属性的若干数据模型和根据若干数据模型之间的业务关联生成关联模型,并将得到的若干数据模型和关系模型存储于模型库,便于在业务人员进行标签计算时能够直接从模型库中调用数据模型。基于不同的业务需求,所需生成的标签不同。为解决面对不同需求业务人员无法随意操控SQL进行编程生成不同标签的问题,服务器可通过向业务人员开放标签规则定义功能,使得业务人员能够根据业务需求对所需标签的标签规则进行数据配置,然后将业务人员配置的数据处理逻辑进行解析并转换为适用于SQL的技术语言定义标签并进行标签计算。具体地,用户能够通过预设标签规则中的筛选条件、采用的数据模型和输出类型等进行标签自定义。例如若需生成“中年”标签,则需预先设置标签规则中数据筛选xx-xx年龄段的人即数据筛选条件,选用模型库中的年龄这一数据模型。实现将标签规则定义功能开放给用户或业务人员,操作简便,方便业务人员自主分析探索数据。
在一个实施示例中,业务员还能够对标签的各类参数进行调控,服务器获取预设的标签规则后,若判断用户对标签参数进行调整即需进行参数调控,根据调控指令生成参数信息;例如当业务员只需要某一时间段内的数据进行标签计算时可根据用户的具体的时间调控指令生成时间参数信息。具体地,在获取到预设的标签规则后,若需进行参数调控则结合根据调控指令生成的参数信息定义标签;若无需进行参数调控,则根据标签规则的逻辑设置直接定义标签,藉由标签列表实现。标签列表至少包括该表的标识、表名、表类型及有效性判定等。在本实施例中,经逻辑设置的对应数据标签参数列表均为适用于SQL的参数列表,其中相应的参数的字符类型等其他数据依据参数信息进行调整。
在一个实施示例中,在根据逻辑设置定义标签之前,还需对预设的标签规则进行合法性校验;所述合法性校验包括标签名称合法性校验和规则合法性校验等;当对标签规则中的逻辑设置校验通过时,根据标签规则和需参数调控时生成的参数信息定义标签。
S260、根据所述标签从所述模型库中查找对应属性的所述数据模型进行标签计算,输出标签数据;
根据预设的标签规则生成可执行的SQL语句以及标签列表,在SQL实施环境中运行SQL语句查询模型库中的数据,从模型库中获取标签规则所需的数据模型进行标签计算,将计算筛选得到的数据填入标签列表后输出标签数据,实现可根据业务需求灵活调整标签规则,并通过调用模型库中预存的数据模型便捷快速的完成对数据的贴标,输出贴标数据。如图4所示,是标签规则定义的实施示例的示意图。可选地,若业务员需要标签名称为60前客群的对应贴标数据,则可根据业务需求预设将该标签的标签规则,将数据筛选范围限定于模型库中个人客户基本信息模型,并在此模型中筛选出生日期数据项中出生年份小于1960年的客户信息。当服务器根据预设的标签规则进行标签计算时,可根据预设的标签规则生成可执行的SQL语句EXTRACT_YEAR(个人客户基本信息.出生日期)<1960,在SQL实施环境中运行SQL语句查询模型库中的数据,从模型库中获取标签规则所需的数据模型进行数据筛选。
S270、获取所述关系模型,根据所述关系模型确定所述标签数据之间的关系,生成标签图谱。
计算得到标签数据后,还能够调用模型库中存储的关系模型,从而根据关系模型确定标签数据之间的关系,生成标签图谱。
实施例三
图5是本发明实施例三提供的标签的生成装置的结构示意图。在实施例一或实施例二的基础上,本发明实施例还提供了一种标签的生成装置3,该装置包括:
数据导入模块301,用于导入系统中存储的元数据;所述元数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;
数据模型建立模块302,用于对每一所述数据对象配置一个对应的数据模型;
在一个实施示例中,对每一所述数据对象配置一个对应的数据模型时,数据模型建立模块302还包括:
数据项定义单元,用于对每一所述数据对象所包含的属性配置对应的数据项;所述数据项限定所述数据对象的属性信息和数据类型;
标准代码引用单元,用于若所述数据项引用预设标准,根据所述预设标准的表述规则调整所述数据对象中数据项的属性信息;
数据项配置单元,用于若所述数据项未设定引用预设标准,所述数据项包括具有与所述数据项的属性语义关联的属性信息的数据对象;
数据模型建立单元,用于根据调整后的数据项构建数据模型。
关系模型建立模块303,用于根据若干所述数据模型对应的属性之间的关联性,生成关系模型;
存储模块304,用于将所述数据模型和所述关系模型存储在模型库中;
标签计算模块305,用于根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。
在一个实施示例中,根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据时,标签计算模块305还包括:
标签定义单元,用于根据预设的标签规则定义标签;所述标签规则包括标签属性;
标签计算单元,用于根据所述标签从所述模型库中查找对应属性的所述数据模型进行标签计算,输出标签数据。
在一个实施例中,标签的生成装置还包括:
合法性校验模块,用于对预设的标签规则进行合法性校验;所述合法性校验包括标签名称合法性校验和规则合法性校验;
标签定义模块,用于若标签规则的合法性校验通过,根据所述标签规则定义标签。
本发明实施例提供的一种标签的生成装置,通过导入系统中的存储数据;所述数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;对每一所述数据对象配置一个对应的数据模型;根据若干所述数据模型对应的属性之间的关联性,生成关系模型;将所述数据模型和所述关系模型存储在模型库中;根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。实现对导入的系统数据的预处理生成对应属性的数据模型和生成体现数据模型之间的业务关系的关系模型,以方便业务人员随时调用模型库中的数据模型和关系模型进行标签计算。还能够根据业务需求灵活调整标签规则,并通过调用模型库中预存的数据模型便捷快速的完成数据的贴标。
实施例四
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现实施例一或实施例二中的标签的生成方法的步骤。
当然,本发明实施例所提供的一种处理器可执行指令的计算机可读存储介质,其处理器可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的标签的生成方法中的相关操作。
实施例五
图6是本发明实施例五提供的服务器的示意图。该实施例的服务器包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42,例如标签的生成方法的程序。所述处理器40执行所述计算机程序42时实现上述标签的生成方法实施例中的步骤,例如图1所示的步骤S110至S150或图2所示的步骤S210至S270。
示例性的,所述计算机程序42可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器41中,并由所述处理器40执行,以完成本申请。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序42在所述服务器4中的执行过程。例如,所述计算机程序42可以被分割成数据导入模块、数据模型建立模块、关系模型建立模块、存储模块和标签计算模块,各模块具体功能如下:
数据导入模块,用于导入系统中存储数据;所述数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;
数据模型建立模块,用于对每一所述数据对象配置一个对应的数据模型;
关系模型建立模块,用于根据若干所述数据模型对应的属性之间的关联性,生成关系模型;
存储模块,用于将所述数据模型和所述关系模型存储在模型库中;
标签计算模块,用于根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。
所述服务器可包括,但不仅限于,处理器40、存储器41以及存储在所述存储器41。本领域技术人员可以理解,图4仅仅是服务器4的示例,并不构成对服务器4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述控制装置还可以包括输入输出设备、网络接入设备、总线等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述服务器的内部存储单元,例如服务器4的硬盘或内存。所述存储器41也可以是服务器4的外部存储设备,例如服务器4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括服务器4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及服务器所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种标签的生成方法,其特征在于,包括:
导入系统中存储的元数据;所述元数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;
对每一所述数据对象配置一个对应的数据模型;
根据若干所述数据模型对应的属性之间的关联性,生成关系模型;
将所述数据模型和所述关系模型存储在模型库中;
根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。
2.如权利要求1所述的标签的生成方法,其特征在于,所述对每一所述数据对象配置一个对应的数据模型,包括:
对每一所述数据对象所包含的属性配置对应的数据项;所述数据项限定所述数据对象的属性信息和数据类型;
若所述数据项引用预设标准,根据所述预设标准的表述规则调整所述数据对象中数据项的属性信息;
根据调整后的数据项构建数据模型。
3.如权利要求2所述的标签的生成方法,其特征在于,所述对每一所述数据对象所包含的属性配置对应的数据项之后,还包括:
若所述数据项未设定引用预设标准,所述数据项包括具有与所述数据项的属性语义关联的属性信息的数据对象。
4.如权利要求3所述的标签的生成方法,其特征在于,所述根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据,包括:
根据预设的标签规则定义标签;所述标签规则包括标签属性;
根据所述标签从所述模型库中查找对应属性的所述数据模型进行标签计算,输出标签数据。
5.如权利要求4所述的标签的生成方法,其特征在于,所述根据预设的标签规则定义标签,包括:
获取预设的标签规则;
若需进行参数调控,根据调控指令生成参数信息;
根据所述标签规则和所述参数信息定义标签。
6.如权利要求5所述的标签的生成方法,其特征在于,在根据所述标签从所述模型库中查找对应属性的所述数据模型进行标签计算,输出标签数据之前,包括:
对预设的标签规则进行合法性校验;所述合法性校验包括标签名称合法性校验和规则合法性校验;
若校验通过,根据所述标签规则定义标签。
7.如权利要求6所述的标签的生成方法,其特征在于,在根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据之后,还包括:
获取所述关系模型,根据所述关系模型确定所述标签数据之间的关系,生成标签图谱。
8.一种标签的生成装置,其特征在于,包括:
数据导入模块,用于导入系统中存储的元数据;所述元数据包括具有若干属性的数据对象,且每一属性具有对应的数据类型;
数据模型建立模块,用于对每一所述数据对象配置一个对应的数据模型;
关系模型建立模块,用于根据若干所述数据模型对应的属性之间的关联性,生成关系模型;
存储模块,用于将所述数据模型和所述关系模型存储在模型库中;
标签计算模块,用于根据预设的标签规则从所述模型库中获取所需的所述数据模型进行标签计算,输出标签数据。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述标签的生成方法的步骤。
10.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述标签的生成方法的步骤。
CN201910848871.1A 2019-09-09 2019-09-09 标签的生成方法、装置、计算机可读存储介质及服务器 Active CN110765101B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910848871.1A CN110765101B (zh) 2019-09-09 2019-09-09 标签的生成方法、装置、计算机可读存储介质及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910848871.1A CN110765101B (zh) 2019-09-09 2019-09-09 标签的生成方法、装置、计算机可读存储介质及服务器

Publications (2)

Publication Number Publication Date
CN110765101A true CN110765101A (zh) 2020-02-07
CN110765101B CN110765101B (zh) 2022-08-02

Family

ID=69329559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910848871.1A Active CN110765101B (zh) 2019-09-09 2019-09-09 标签的生成方法、装置、计算机可读存储介质及服务器

Country Status (1)

Country Link
CN (1) CN110765101B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680219A (zh) * 2020-06-09 2020-09-18 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质
CN111949692A (zh) * 2020-07-30 2020-11-17 合肥森亿智能科技有限公司 基于dto的自定义指标配置方法、系统、设备和介质
CN113157978A (zh) * 2021-01-15 2021-07-23 浪潮云信息技术股份公司 数据的标签建立方法和装置
CN113313344A (zh) * 2021-04-13 2021-08-27 武汉烽火众智数字技术有限责任公司 一种融合多模式的标签体系构建方法和系统
CN113836146A (zh) * 2021-09-29 2021-12-24 五八同城信息技术有限公司 一种特征标签生成方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120159304A1 (en) * 2009-02-11 2012-06-21 Robert Eugene Listou System and method for contextual data modeling utilizing tags
CN108197132A (zh) * 2017-10-09 2018-06-22 国网陕西省电力公司 一种基于图数据库的电力资产画像构建方法及装置
CN109524070A (zh) * 2018-11-12 2019-03-26 北京懿医云科技有限公司 数据处理方法及装置、电子设备、存储介质
CN109656912A (zh) * 2018-12-13 2019-04-19 成都四方伟业软件股份有限公司 数据模型管控方法、装置及服务器
CN109766353A (zh) * 2018-11-30 2019-05-17 成都四方伟业软件股份有限公司 一种基于大数据多维属性动态生成标签的系统及工作方法
CN109919652A (zh) * 2019-01-17 2019-06-21 平安城市建设科技(深圳)有限公司 用户群体分类方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120159304A1 (en) * 2009-02-11 2012-06-21 Robert Eugene Listou System and method for contextual data modeling utilizing tags
CN108197132A (zh) * 2017-10-09 2018-06-22 国网陕西省电力公司 一种基于图数据库的电力资产画像构建方法及装置
CN109524070A (zh) * 2018-11-12 2019-03-26 北京懿医云科技有限公司 数据处理方法及装置、电子设备、存储介质
CN109766353A (zh) * 2018-11-30 2019-05-17 成都四方伟业软件股份有限公司 一种基于大数据多维属性动态生成标签的系统及工作方法
CN109656912A (zh) * 2018-12-13 2019-04-19 成都四方伟业软件股份有限公司 数据模型管控方法、装置及服务器
CN109919652A (zh) * 2019-01-17 2019-06-21 平安城市建设科技(深圳)有限公司 用户群体分类方法、装置、设备及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680219A (zh) * 2020-06-09 2020-09-18 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质
CN111680219B (zh) * 2020-06-09 2023-10-20 深圳市雅阅科技有限公司 内容推荐方法、装置、设备及可读存储介质
CN111949692A (zh) * 2020-07-30 2020-11-17 合肥森亿智能科技有限公司 基于dto的自定义指标配置方法、系统、设备和介质
CN113157978A (zh) * 2021-01-15 2021-07-23 浪潮云信息技术股份公司 数据的标签建立方法和装置
CN113313344A (zh) * 2021-04-13 2021-08-27 武汉烽火众智数字技术有限责任公司 一种融合多模式的标签体系构建方法和系统
CN113313344B (zh) * 2021-04-13 2023-03-31 武汉烽火众智数字技术有限责任公司 一种融合多模式的标签体系构建方法和系统
CN113836146A (zh) * 2021-09-29 2021-12-24 五八同城信息技术有限公司 一种特征标签生成方法、装置、电子设备及存储介质
CN113836146B (zh) * 2021-09-29 2024-04-26 五八同城信息技术有限公司 一种特征标签生成方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110765101B (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
CN110765101B (zh) 标签的生成方法、装置、计算机可读存储介质及服务器
CN106649890B (zh) 数据存储方法和装置
CN111930805B (zh) 一种信息挖掘方法及计算机设备
US20210089667A1 (en) System and method for implementing attribute classification for pii data
CN110929125A (zh) 搜索召回方法、装置、设备及其存储介质
CN111078776A (zh) 数据表的标准化方法、装置、设备及存储介质
US20190147104A1 (en) Method and apparatus for constructing artificial intelligence application
CN113435859A (zh) 信访件处理方法、装置、电子设备和计算机可读介质
CN116739626A (zh) 商品数据挖掘处理方法、装置、电子设备及可读介质
CN116090867A (zh) 指标规则生成方法、装置、电子设备及存储介质
CN115062117A (zh) 一种基于自然语言处理技术的文档自动生成分类的方法
CN111027832A (zh) 一种税务风险确定方法、装置及存储介质
CN108959289B (zh) 网站类别获取方法和装置
CN110765100B (zh) 标签的生成方法、装置、计算机可读存储介质及服务器
CN117273968A (zh) 一种跨业务线产品的会计凭证生成方法及其相关设备
CN109740130B (zh) 用于生成文件的方法和装置
CN111221690A (zh) 针对集成电路设计的模型确定方法、装置及终端
CN116450723A (zh) 数据提取方法、装置、计算机设备及存储介质
CN115984004A (zh) 信息关联方法、装置、设备及存储介质
CN114064976A (zh) 一种数据特征计算的方法、系统、电子装置和存储介质
CN113901075A (zh) 生成sql语句的方法、装置、计算机设备及存储介质
WO2018206819A1 (en) Data storage method and apparatus
CN114780688A (zh) 基于规则匹配的文本质检方法、装置、设备及存储介质
US20240220876A1 (en) Artificial intelligence (ai) based data product provisioning
CN116484060A (zh) 数据血缘关系分析方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 410000 Room 301, R&D Headquarters, Central South University Science Park, Yuelu Street, Yuelu District, Changsha City, Hunan Province

Applicant after: Tianyun Software Technology Co.,Ltd.

Address before: 410000 Room 301, R&D Headquarters, Central South University Science Park, Yuelu Street, Yuelu District, Changsha City, Hunan Province

Applicant before: Hunan Tianyun Software Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method, device, computer-readable storage medium, and server for generating labels

Effective date of registration: 20231226

Granted publication date: 20220802

Pledgee: Changsha Rural Commercial Bank Co Ltd University City Science and Technology Branch

Pledgor: Tianyun Software Technology Co.,Ltd.

Registration number: Y2023980074788