CN115525377B - 一种定性标签数据可视化方法、装置、电子设备及介质 - Google Patents

一种定性标签数据可视化方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN115525377B
CN115525377B CN202211188853.3A CN202211188853A CN115525377B CN 115525377 B CN115525377 B CN 115525377B CN 202211188853 A CN202211188853 A CN 202211188853A CN 115525377 B CN115525377 B CN 115525377B
Authority
CN
China
Prior art keywords
target
data
label
qualitative
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211188853.3A
Other languages
English (en)
Other versions
CN115525377A (zh
Inventor
宋依兰
叶田田
黄景华
王文鉴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongdian Jinxin Software Co Ltd
Original Assignee
Zhongdian Jinxin Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongdian Jinxin Software Co Ltd filed Critical Zhongdian Jinxin Software Co Ltd
Priority to CN202211188853.3A priority Critical patent/CN115525377B/zh
Publication of CN115525377A publication Critical patent/CN115525377A/zh
Application granted granted Critical
Publication of CN115525377B publication Critical patent/CN115525377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种定性标签数据可视化方法、装置、电子设备及介质,该方法包括:从系统候选标签中选取目标定性标签对应的目标定量标签;确定目标定量标签对应的目标数据的区间划分方式;按照区间划分方式从目标数据中划分出目标定性标签对应的数据区间,获取数据区间对应的特征项以及特征项对应的业务条件表达式;对特征项对应的业务条件表达式进行解析,获取特征项对应的业务规则表达式;利用业务规则表达式获取目标定性标签的数据可视化图形。通过采用上述定性标签数据可视化方法、装置、电子设备及介质,解决了定性标签的数据可视化图形的生成效率低、灵活性差的问题。

Description

一种定性标签数据可视化方法、装置、电子设备及介质
技术领域
本申请涉及互联网技术领域,具体而言,涉及一种定性标签数据可视化方法、装置、电子设备及介质。
背景技术
互联网服务提供商使用大数据技术采集有关用户的各类行为大数据,并通过大数据分析建立用户画像来抽象地描述一个用户的信息全貌,从而可以对用户进行个性化推荐、精准营销和广告投放等。各个领域对用户画像系统的需求越来越强烈,客户标签是用户画像的基础,对客户标签的需求逐步精细化,新增客户标签需求的相应时间越来越短,标签需求越来越多样化。
目前,通常是利用已创建的标签对离散型数值进行特征项分析,一旦有新增定性标签的需求就需要设计新的逻辑模型,然后对逻辑模型进行物理化后得到物理模型,利用物理模型生成新的定性标签的可视化图形,这导致了定性标签的数据可视化图形的生成效率低、灵活性差的问题。
发明内容
有鉴于此,本申请的目的在于提供一种定性标签数据可视化方法、装置、电子设备及介质,以解决定性标签的数据可视化图形的生成效率低、灵活性差的问题。
第一方面,本申请实施例提供了一种定性标签数据可视化方法,包括:
从系统候选标签中选取目标定性标签对应的目标定量标签;
确定目标定量标签对应的目标数据的区间划分方式;
按照区间划分方式从目标数据中划分出目标定性标签对应的数据区间,获取数据区间对应的特征项以及特征项对应的业务条件表达式;
对特征项对应的业务条件表达式进行解析,获取特征项对应的业务规则表达式;
利用业务规则表达式获取目标定性标签的数据可视化图形。
可选地,获取数据区间对应的特征项以及该特征项对应的业务条件表达式,包括:确定数据区间对应的特征项名称,由特征项名称以及数据区间构成特征项;获取目标定量标签的元数据信息,元数据信息包括目标定量标签的标签名称;将目标定量标签的标签名称与数据区间组合在一起,获取特征项对应的业务条件表达式。
可选地,区间划分方式包括百分比划分方式以及数值划分方式;按照区间划分方式从目标数据中划分出目标定性标签对应的数据区间,包括:若区间划分方式为百分比划分方式,确定至少一个百分比值,利用至少一个百分比值从目标数据中划分出目标定性标签对应的数据区间;若区间划分方式为数值划分方式,确定至少一个结束值,根据至少一个结束值从目标数据中划分出目标定性标签对应数据区间。
可选地,对特征项对应的业务条件表达式进行解析,获取特征项对应的业务规则表达式,包括:基于目标定量标签的元数据信息,获取目标定量标签对应的业务统计模板;对特征项对应的业务条件表达式进行解析,获取特征项对应的标签名称以及数据区间;将标签名称以及数据区间代入目标定量标签对应的业务统计模板,获取该特征项对应的业务规则表达式。
可选地,基于目标定量标签的元数据信息,获取目标定量标签对应的业务统计模板,包括:从元数据信息中获取目标定量标签对应的标签类目路径;选取标签类目路径对应的数据立方体作为目标数据立方体;获取目标数据立方体对应的业务统计模板。
可选地,数据区间包括多个,多个数据区间对应多个特征项;利用业务规则表达式获取目标定性标签的数据可视化图形,包括:针对每个特征项,对该特征项对应的业务规则表达式进行格式转换,获取转换后的业务规则表达式;对目标定量标签对应的目标数据执行转换后的业务规则表达式,获得该特征项对应的统计结果;利用可视化组件对不同特征项的统计结果、特征项名称以及业务条件表达式进行匹配显示,获得多个特征项可视化图像;由多个特征项可视化图像组合在一起构成目标定性标签的数据可视化图像。
可选地,在确定至少一个百分比值或者确定至少一个结束值之后,还包括:检查至少一个百分比值或者至少一个结束值是否为整型数值;若是整型数值,则允许对目标数据进行区间划分;若不是整型数值,则禁止对目标数据进行区间划分。
第二方面,本申请实施例还提供了一种定性标签数据可视化装置,所述装置包括:
标签获取模块,用于从系统候选标签中选取目标定性标签对应的目标定量标签;
划分方式确定模块,用于确定目标定量标签对应的目标数据的区间划分方式;
特征项获取模块,用于按照区间划分方式从目标数据中划分出目标定性标签对应的数据区间,获取数据区间对应的特征项以及特征项对应的业务条件表达式;
解析模块,用于对特征项对应的业务条件表达式进行解析,获取特征项对应的业务规则表达式;
可视化模块,用于利用业务规则表达式获取目标定性标签的数据可视化图形。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的定性标签数据可视化方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的定性标签数据可视化方法的步骤。
本申请实施例带来了以下有益效果:
本申请实施例提供的一种定性标签数据可视化方法、装置、电子设备及介质,能够从系统候选标签中选取目标定量标签,并根据确定的区间划分方式对目标数据进行划分获得定性标签对应的特征项以及特征项对应的业务条件表达式,利用业务条件表达式进行目标定性标签的数据可视化,无需重新建立逻辑模型,然后再将逻辑模型转换为物理模型,利用物理模型进行定性标签的数据可视化,与现有技术中的定性标签数据可视化方法相比,解决了定性标签的数据可视化图形的生成效率低、灵活性差的问题。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的定性标签数据可视化方法的流程图;
图2示出了本申请实施例所提供的定性标签数据可视化装置的结构示意图;
图3示出了本申请实施例所提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
值得注意的是,在本申请提出之前,互联网服务提供商使用大数据技术采集有关用户的各类行为大数据,并通过大数据分析建立用户画像来抽象地描述一个用户的信息全貌,从而可以对用户进行个性化推荐、精准营销和广告投放等。各个领域对用户画像系统的需求越来越强烈,客户标签是用户画像的基础,对客户标签的需求逐步精细化,新增客户标签需求的相应时间越来越短,标签需求越来越多样化。目前,通常是利用已创建的标签对离散型数值进行特征项分析,一旦有新增定性标签的需求就需要设计新的逻辑模型,然后对逻辑模型进行物理化后得到物理模型,利用物理模型生成新的定性标签的可视化图形,这导致了定性标签的数据可视化图形的生成效率低、灵活性差的问题。
基于此,本申请实施例提供了一种定性标签数据可视化方法,以提高定性标签的数据可视化图形的生成效率以及灵活性。
请参阅图1,图1为本申请实施例所提供的一种定性标签数据可视化方法的流程图。如图1所示,本申请实施例提供的定性标签数据可视化方法,包括:
步骤S101,从系统候选标签中选取目标定性标签对应的目标定量标签。
该步骤中,系统候选标签可指系统内置的标签,系统候选标签是已经创建的标签。
示例性的,系统可指标签系统,系统候选标签可以是用户标签。
系统候选标签包括不同类型的标签,标签类型包括但不限于统计类标签、算法类标签、属性类标签。
目标定性标签可指需要通过其他途径来实现量化的标签,示例性的,目标定性标签可以是高存款等级的客户。
目标定量标签可指可直接实现量化的标签,示例性的,目标定量标签可以是存款额度为10万的客户。
在本申请实施例中,通过对客户数据的数值分析及汇总,可得到多个统计类标签,在数据可视化平台的界面上,可以从下拉菜单展示的多个统计类标签中选取与目标定性标签对应的目标定量标签。以目标定性标签为高存款等级客户为例,则可将存款额度标签选取为目标定量标签。
需要说明的是,不同的定量标签已经被划分到不同的标签类目下,以存款额度为例,该定量标签归属于客户基本信息;以访问次数为例,该定量标签归属于客户行为,因此,将存款额度标签划分到基本信息这一标签类目下,将访问次数标签划分到客户行为这一标签类目下。
步骤S102,确定目标定量标签对应的目标数据的区间划分方式。
在该步骤中,目标数据可指目标定量标签对应的客户数据。
示例性的,以目标定量标签为存款额度标签为例,则目标数据指的是存款数额,以目标定量标签为个人年收入标签为例,则目标数据指的是个人年收入数额。
区间划分方式可指针对目标数据进行区间划分的划分方式,区间划分方式包括:百分比划分方式、数值划分方式。
百分比划分方式可指以百分比数值对目标数据进行划分的方式,其中,百分比数值的个数可以是一个,也可以是多个。
数值划分方式可指以输入的多个整型数值对目标数据进行划分的方式。
在本申请实施例中,可根据目标定性标签的具体内容来确定是以何种划分方式对目标数据进行区间划分。以上述示例为例,如果目标定性标签是高存款等级的用户,则可以根据高存款等级的定义确定存款额度这一目标定量标签的区间划分方式,例如:如果将存款数额占最高存款数额的80%~100%作为高存款等级,则可在界面中勾选百分比划分方式选项,将区间划分方式确定为百分比划分方式,如果将100万以上的存款数额作为高存款等级,则可在界面中勾选数值划分方式选项,将区间划分方式确定为数值划分方式。
步骤S103,按照区间划分方式从目标数据中划分出目标定性标签对应的数据区间,获取数据区间对应的特征项以及特征项对应的业务条件表达式。
该步骤中,特征项可指单个数据区间对应的标签,通过特征项将目标定量标签划分为多个子标签,特征项包括特征项名称、特征项对应的数据区间。
示例性的,特征项名称可以是高存款等级、中存款等级、低存款等级。
业务条件表达式可指当前特征项对应的数据区间的文字表达式。
业务条件表达式包括目标定量标签的标签名称以及对应的数据区间。
示例性的,业务条件表达式为个人存款金额10000以上。
在一可选实施例中,区间划分方式包括百分比划分方式以及数值划分方式;按照区间划分方式从目标数据中划分出目标定性标签对应的数据区间,包括:若区间划分方式为百分比划分方式,确定至少一个百分比值,利用该至少一个百分比值从目标数据中划分出目标定性标签对应的数据区间;若区间划分方式为数值划分方式,确定至少一个结束值,根据至少一个结束值从目标数据中划分出目标定性标签对应数据区间。
具体的,目标定性标签对应的数据区间可以是一个,也可以是多个,例如:将存款额度划分为高存款等级、中存款等级、低存款等级三个数据区间,下面以数据区间是多个为例介绍数据区间的划分方法。
如果是百分比划分方式,则可在界面中输入一个百分比数值,按照输入的百分比值将目标数据平均划分为多个区间,也可以输入多个百分比值,按照输入的多个百分比值将目标数据划分为多个区间,例如:输入一个20%,则将目标数据划分为五个区间,每个区间占总数的20%,如果输入两个百分比值20%以及50%,则将目标数据划分为三个区间,这三个区间分别是0至20%、20%至50%、50%至100%。
如果是数值划分方式,则需要依次输入多个划分数值,且第一次输入的划分数值是第一个数据区间的结束值,第一数据区间的起始值是默认数值,例如:目标数据的最小值。同时,该第一次输入的划分数值也是第二个数据区间的起始值,依次类推,输入N个值则可确定N+1个数据区间,且每个输入的划分值均是前一个数据区间的结束值,也是后一个数据区间的起始值,以保证数据区间的连续性。另外,还可以直接输入数据区间的起始值和结束值,利用确定的起始值和结束值直接确定数据区间的范围。其中,将起始值和结束值统称为划分数值。
在一可选实施例中,在确定至少一个百分比值或者确定至少一个结束值之后,还包括:检查至少一个百分比值或者至少一个结束值是否为整型数值;若是整型数值,则允许对目标数据进行区间划分;若不是整型数值,则禁止对目标数据进行区间划分。
具体的,每次输入划分数值或者百分比值时,都需要对该划分数值或者百分比值进行检测,检查该划分数值或者百分比值是否是整型数值,如果是整型数值则允许输入,并按照该划分数值或者百分比值对目标数据进行区间划分,如果不是整型数值则不允许输入,并给出提示信息。例如:百分比值为20%是允许进行区间划分的,但是20.5是不允许进行区间划分的。
在一可选实施例中,获取数据区间对应的特征项以及特征项对应的业务条件表达式,包括:确定数据区间对应的特征项名称,由特征项名称以及数据区间构成特征项;获取目标定量标签的元数据信息,元数据信息包括目标定量标签的标签名称;将目标定量标签的标签名称与数据区间组合在一起,获取特征项对应的业务条件表达式。
这里,元数据信息可指目标定量标签的标签信息,元数据信息用于识别及定位标签。
元数据信息包括但不限于:标签名称、标签分类、标签类型、标签状态、标签类目路径。
标签分类包括但不限于:属性类标签、统计类标签、算法类标签。
标签类型包括但不限于:编码类、字符类、数值类。
标签状态包括:新建、开发中、已生效、已失效、已停用。
标签类目路径可指标签所在类目的路径。
具体的,当划分的数据区间为多个时,每个数据区间对应一个特征项,针对每个特征项可在数据可视化平台的界面中设置该特征项的特征项名称以及数据区间,例如:针对存款额度标签设置高存款等级、中存款等级、低存款等级三个特征项名称,对应的数据区间分别为100万以上、10万至100万、10万以下,则可获得高存款等级:100万以上、中存款等级:10万至100万、低存款等级:10万以下三个特征项,然后,存款额度标签对应的元数据信息,将标签名称与三个数据区间组合在一起获得三个业务条件表达式分别为:存款额度100万以上、存款额度10万至100万、存款额度10万以下。
步骤S104,对特征项对应的业务条件表达式进行解析,获取特征项对应的业务规则表达式。
该步骤中,业务规则表达式可指业务条件表达式对应的SQL表达式。
示例性的,业务规则表达式可以是SQL语句,例如,业务条件表达式为个人年收入大于100000,则业务规则表达式为LBL_NM=“个人年收入”and LBL_CD>100000,其中,LBL_NM为个人年收入标签对应的数据立方体的标签字段的字段英文名称,LBL_CD为个人年收入标签对应的数据立方体的阈值字段的字段英文名称。
在一可选实施例中,对特征项对应的业务条件表达式进行解析,获取特征项对应的业务规则表达式,包括:基于目标定量标签的元数据信息,获取目标定量标签对应的业务统计模板;对特征项对应的业务条件表达式进行解析,获取特征项对应的标签名称以及数据区间;将标签名称以及数据区间代入目标定量标签对应的业务统计模板,获取该特征项对应的业务规则表达式。
这里,业务统计模板可指SQL统计模板,业务统计模板是能够对不同业务条件的数据进行统计。
示例性的,业务统计模板可以是统计满足业务条件的人数的模板。
业务统计模板中包括业务逻辑表达式,示例性的,业务逻辑表达式为LBL_NM=${LBL_NM}and LBL_CD=${LBL_CD},其中,${LBL_NM}以及${LBL_CD}均为替代符号,当确定标签的具体取值以及阈值的具体取值时,用标签的具体取值替换${LBL_NM},用阈值的具体取值替换${LBL_CD}。
具体的,当特征项为多个时,对每个特征项对应的业务条件表达式进行解析,确定每个特征项对应的标签名称和数据区间,且不同特征项对应标签名称是相同的,然后,将每个特征项对应的一组标签名称、数据区间代入业务统计模板的业务逻辑表达式中,可以得到不同特征项对应的多个业务规则表达式。
下面以一个特征项进行举例说明,该特征项为高存款等级:10万以上,对应的标签名称为存款额度,数据区间为10万以上,假设,业务逻辑表达式为LBL_NM=${LBL_NM}andLBL_CD=${LBL_CD},则代入标签名称以及数据区间后,得到的业务规则表达式包括以下内容:LBL_NM=“存款额度”and LBL_CD>100000。
在一可选实施例中,基于目标定量标签的元数据信息,获取目标定量标签对应的业务统计模板,包括:从元数据信息中获取目标定量标签对应的标签类目路径;选取标签类目路径对应的数据立方体作为目标数据立方体;获取目标数据立方体对应的业务统计模板。
这里,数据立方体可指多维数据模型,目标数据立方体是目标定量标签对应的数据模型。
示例性的,数据立方体可以包括报告日期、标签、客户号以及阈值等多个维度的数据,其中,报告日期指的是数据具体的生成日期,标签指的是客户的信息,例如:性别、年龄、职业等、客户号指的是客户的唯一标识,阈值指的是标签的具体取值,以性别标签为例,阈值为男、女、未知。
具体的,可以根据目标定量标签的序号确定该目标定量标签对应的原数据信息,元数据信息中包括了标签类目路径,利用标签类目路径查找该目标定量标签对应的数据立方体,每个数据立方体对应一个业务统计模板,获取该数据立方体对应的业务统计模板,利用该业务统计模板得到业务规则表达式。
其中,业务统计模板是根据数据立方体的元数据信息的构建的,业务统计模板的元数据信息中包括了标签字段的字段英文名称以及阈值字段的字段英文名称,例如:标签字段的字段英文名称为LBL_NM,阈值字段的字段英文名称为LBL_CD,利用标签字段的字段英文名称以及阈值字段的字段英文名称构建业务统计模板。
步骤S105,利用业务规则表达式获取目标定性标签的数据可视化图形。
该步骤中,数据可视化图形可指目标定性标签对应的数据的可视化图形。
在一可选实施例中,数据区间包括多个,多个数据区间对应多个特征项;利用业务规则表达式获取目标定性标签的数据可视化图形,包括:针对每个特征项,对该特征项对应的业务规则表达式进行格式转换,获取转换后的业务规则表达式;对目标定量标签对应的目标数据执行转换后的业务规则表达式,获得该特征项对应的统计结果;利用可视化组件对不同特征项的统计结果、特征项名称以及业务条件表达式进行匹配显示,获得多个特征项可视化图像;由多个特征项可视化图像组合在一起构成目标定性标签的数据可视化图像。
具体的,针对每个特征项对应的业务规则表达式,调用Kylin Api执行该业务规则表达式,然后,通过Calcite引擎将业务规则表达式解析成SQLnode,对SQLnode验证后将其转换成RelNode,RelNode是物理机器能够执行的SQL语句,最后执行该SQL即可获取该特征项对应的精确去重后的汇总结果。
利用可视化工具对该汇总结果进行展示,以目标定性标签包括高存款等级、中存款等级、低存款等级三个特征项为例,假设业务统计模板统计的是人数,每个特征项的统计结果分别是500人、1000人、2000人,则将高存款等级、个人存款数额100万以上、500人组合在一起得到高存款等级特征项的可视化图像;将中存款等级、个人存款数额10万至100万、1000人组合在一起得到中存款等级特征项的可视化图像;将低存款等级、个人存款数额10万以下、2000人组合在一起得到低存款等级特征项的可视化图像。由三个特征项可视化图像组合在一起得到目标定性标签的可视化。
可见,本申请能够实现对定性标签的自定义扩展以及对定性标签的区间范围进行自定义,为标签画像多样化呈现和客群画像多角度刻画打下基础;通过规则化配置快速生成新标签,简化了重新定义逻辑模型、物理模型,以及数据转换装载的复杂流程,缩短了定性标签的生成周期;通过派生的定性标签能够帮助业务人员理解业务定义,降低业务人员了解标签,使用标签的学习成本;通过派生的定性标签缩短数据标签化以及从提出功能到业务需求交付的周期。
与现有技术中定性标签数据可视化方法相比,本申请能够从系统候选标签中选取目标定量标签,并根据确定的区间划分方式对目标数据进行划分获得定性标签对应的特征项以及特征项对应的业务条件表达式,利用业务条件表达式进行目标定性标签的数据可视化,无需重新建立逻辑模型,然后再将逻辑模型转换为物理模型,利用物理模型进行定性标签的数据可视化,解决了定性标签的数据可视化图形的生成效率低、灵活性差的问题。
基于同一发明构思,本申请实施例中还提供了与定性标签数据可视化方法对应的定性标签数据可视化装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述定性标签数据可视化方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图2,图2为本申请实施例所提供的一种定性标签数据可视化装置的结构示意图。如图2中所示,定性标签数据可视化装置200包括:
标签获取模块201,用于从系统候选标签中选取目标定性标签对应的目标定量标签;
划分方式确定模块202,用于确定目标定量标签对应的目标数据的区间划分方式;
特征项获取模块203,用于按照区间划分方式从目标数据中划分出目标定性标签对应的数据区间,获取数据区间对应的特征项以及特征项对应的业务条件表达式;
解析模块204,用于对特征项对应的业务条件表达式进行解析,获取特征项对应的业务规则表达式;
可视化模块205,用于利用业务规则表达式获取目标定性标签的数据可视化图形。
请参阅图3,图3为本申请实施例所提供的一种电子设备的结构示意图。如图3中所示,所述电子设备300包括处理器310、存储器320和总线330。
所述存储器320存储有所述处理器310可执行的机器可读指令,当电子设备300运行时,所述处理器310与所述存储器320之间通过总线330通信,所述机器可读指令被所述处理器310执行时,可以执行如上述图1所示方法实施例中的定性标签数据可视化方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的定性标签数据可视化方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种定性标签数据可视化方法,其特征在于,包括:
从系统候选标签中选取目标定性标签对应的目标定量标签;
确定所述目标定量标签对应的目标数据的区间划分方式;
按照所述区间划分方式从所述目标数据中划分出目标定性标签对应的数据区间,获取所述数据区间对应的特征项以及特征项对应的业务条件表达式;
对特征项对应的业务条件表达式进行解析,获取所述特征项对应的业务规则表达式;
利用所述业务规则表达式获取目标定性标签的数据可视化图形。
2.根据权利要求1所述的方法,其特征在于,所述获取所述数据区间对应的特征项以及特征项对应的业务条件表达式,包括:
确定数据区间对应的特征项名称,由所述特征项名称以及数据区间构成特征项;
获取所述目标定量标签的元数据信息,所述元数据信息包括目标定量标签的标签名称;
将所述目标定量标签的标签名称与数据区间组合在一起,获取特征项对应的业务条件表达式。
3.根据权利要求1所述的方法,其特征在于,所述区间划分方式包括百分比划分方式以及数值划分方式;
所述按照所述区间划分方式从所述目标数据中划分出目标定性标签对应的数据区间,包括:
若所述区间划分方式为百分比划分方式,确定至少一个百分比值,利用至少一个百分比值从目标数据中划分出目标定性标签对应的数据区间;
若所述区间划分方式为数值划分方式,确定至少一个结束值,根据至少一个结束值从目标数据中划分出目标定性标签对应数据区间。
4.根据权利要求2所述的方法,其特征在于,所述对特征项对应的业务条件表达式进行解析,获取所述特征项对应的业务规则表达式,包括:
基于目标定量标签的元数据信息,获取目标定量标签对应的业务统计模板;
对特征项对应的业务条件表达式进行解析,获取特征项对应的标签名称以及数据区间;
将所述标签名称以及数据区间代入目标定量标签对应的业务统计模板,获取该特征项对应的业务规则表达式。
5.根据权利要求4所述的方法,其特征在于,所述基于目标定量标签的元数据信息,获取目标定量标签对应的业务统计模板,包括:
从所述元数据信息中获取目标定量标签对应的标签类目路径;
选取所述标签类目路径对应的数据立方体作为目标数据立方体;
获取所述目标数据立方体对应的业务统计模板。
6.根据权利要求2所述的方法,其特征在于,所述数据区间包括多个,多个数据区间对应多个特征项;
所述利用所述业务规则表达式获取目标定性标签的数据可视化图形,包括:
针对每个特征项,对该特征项对应的业务规则表达式进行格式转换,获得转换后的业务规则表达式;
对所述目标定量标签对应的目标数据执行所述转换后的业务规则表达式获得该特征项对应的统计结果;
利用可视化组件对不同特征项的统计结果、特征项名称以及业务条件表达式进行匹配显示,获取多个特征项可视化图像;
由多个特征项可视化图像组合在一起构成目标定性标签的数据可视化图像。
7.根据权利要求3所述的方法,其特征在于,在确定至少一个百分比值或者确定至少一个结束值之后,还包括:
检查至少一个百分比值或者至少一个结束值是否为整型数值;
若是整型数值,则允许对目标数据进行区间划分;
若不是整型数值,则禁止对目标数据进行区间划分。
8.一种定性标签数据可视化装置,其特征在于,包括:
标签获取模块,用于从系统候选标签中选取目标定性标签对应的目标定量标签;
划分方式确定模块,用于确定所述目标定量标签对应的目标数据的区间划分方式;
特征项获取模块,用于按照所述区间划分方式从所述目标数据中划分出目标定性标签对应的数据区间,获取所述数据区间对应的特征项以及特征项对应的业务条件表达式;
解析模块,用于对特征项对应的业务条件表达式进行解析,获取所述特征项对应的业务规则表达式;
可视化模块,用于利用所述业务规则表达式获取目标定性标签的数据可视化图形。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7中任一项所述的定性标签数据可视化方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的定性标签数据可视化方法的步骤。
CN202211188853.3A 2022-09-27 2022-09-27 一种定性标签数据可视化方法、装置、电子设备及介质 Active CN115525377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211188853.3A CN115525377B (zh) 2022-09-27 2022-09-27 一种定性标签数据可视化方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211188853.3A CN115525377B (zh) 2022-09-27 2022-09-27 一种定性标签数据可视化方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN115525377A CN115525377A (zh) 2022-12-27
CN115525377B true CN115525377B (zh) 2023-04-28

Family

ID=84700396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211188853.3A Active CN115525377B (zh) 2022-09-27 2022-09-27 一种定性标签数据可视化方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN115525377B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112631889A (zh) * 2020-12-31 2021-04-09 中国农业银行股份有限公司 针对应用系统的画像方法、装置、设备及可读存储介质
CN114840519A (zh) * 2022-03-28 2022-08-02 烽台科技(北京)有限公司 一种数据打标签的方法、设备及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112631889A (zh) * 2020-12-31 2021-04-09 中国农业银行股份有限公司 针对应用系统的画像方法、装置、设备及可读存储介质
CN114840519A (zh) * 2022-03-28 2022-08-02 烽台科技(北京)有限公司 一种数据打标签的方法、设备及存储介质

Also Published As

Publication number Publication date
CN115525377A (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
CN105893406A (zh) 群体用户画像方法及系统
US20200118014A1 (en) Adaptable Systems and Methods for Discovering Intent from Enterprise Data
CN111209400B (zh) 一种数据分析的方法及装置
CN108269122B (zh) 广告的相似度处理方法和装置
CN113449187A (zh) 基于双画像的产品推荐方法、装置、设备及存储介质
JP6653374B2 (ja) ユーザニーズを決定するための方法及び装置
CN114840531B (zh) 基于血缘关系的数据模型重构方法、装置、设备及介质
Jayatilaka et al. Knowledge extraction for semantic web using web mining
CN115018588A (zh) 产品推荐方法、装置、电子设备及可读存储介质
CN111680506A (zh) 数据库表的外键映射方法、装置、电子设备和存储介质
KR102299525B1 (ko) 제품 평가 마이닝 방법 및 이를 수행하는 장치
JP2019128925A (ja) 事象提示システムおよび事象提示装置
CN115545791B (zh) 一种客群画像生成方法、装置、电子设备及存储介质
CN115525377B (zh) 一种定性标签数据可视化方法、装置、电子设备及介质
CN112631889A (zh) 针对应用系统的画像方法、装置、设备及可读存储介质
CN117056619A (zh) 确定用户行为特征的方法和装置
CN116795978A (zh) 一种投诉信息处理方法、装置、电子设备及介质
CN113705201B (zh) 基于文本的事件概率预测评估算法、电子设备及存储介质
US20230214451A1 (en) System and method for finding data enrichments for datasets
GB2608112A (en) System and method for providing media content
CN110941709B (zh) 信息筛选方法、装置、电子设备及可读存储介质
CN115344774A (zh) 用户账号的筛选方法、装置及服务器
CN112200602A (zh) 用于广告推荐的神经网络模型训练方法及装置
CN111476511A (zh) 针对服务方所面临特定风险的数据展示方法及装置
CN111061924A (zh) 词组提取方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant