CN115545791B - 一种客群画像生成方法、装置、电子设备及存储介质 - Google Patents
一种客群画像生成方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115545791B CN115545791B CN202211291696.9A CN202211291696A CN115545791B CN 115545791 B CN115545791 B CN 115545791B CN 202211291696 A CN202211291696 A CN 202211291696A CN 115545791 B CN115545791 B CN 115545791B
- Authority
- CN
- China
- Prior art keywords
- expression
- target
- guest group
- analysis
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000014509 gene expression Effects 0.000 claims abstract description 243
- 238000004458 analytical method Methods 0.000 claims abstract description 113
- 238000010191 image analysis Methods 0.000 claims abstract description 18
- 238000012800 visualization Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 abstract description 4
- 238000012216 screening Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种客群画像生成方法、装置、电子设备及存储介质,该方法包括:确定待分析目标客群对应的客群表达式;选取目标标签,获取目标标签对应的全部阈值以及每个阈值对应的业务规则表达式;针对每个阈值,将该阈值对应的业务规则表达式与客群表达式通过并集操作符进行连接获得该阈值对应的联立表达式,利用联立表达式以及客群运算表达式构建该阈值对应的分析表达式;对待分析目标客群对应的数据执行分析表达式,获得该阈值对应的分析结果;对多个分析结果进行展示获得目标标签对应的可视化图表,生成可视化图表对应的客群画像分析报告。通过采用上述客群画像生成方法、装置、电子设备及存储介质,解决了客群画像生成效率低的问题。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种客群画像生成方法、装置、电子设备及存储介质。
背景技术
随着大数据时代的到来,数据正在迅速膨胀变大,它决定着企业的未来发展,随着时间的推移,人们越来越多地意识到数据对企业的重要性。对于商业企业来说,可以将数据分析应用到对客群(消费者)的画像上,以更精准的掌握消费客群的特征属性,从而更合理的做出客群决策。
目前,企业的业务更新迭代的速度越来越快,使得业务指标也随之快速变化,为了能全面、快速的掌握各个客群的特征属性,需要特定的客群画像分析工作人员以及IT部门提供画像生成支持,造成沟通成本高、画像生成效率低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种客群画像生成方法、装置、电子设备及存储介质,以解决客群画像生成效率低的问题。
第一方面,本申请实施例提供了一种客群画像生成方法,包括:
选取待分析目标客群,确定待分析目标客群对应的客群表达式,客群表达式是用于确定待分析目标客群的结构化查询语句;
选取表征待分析目标客群分析维度的目标标签,获取目标标签对应的全部阈值以及每个阈值对应的业务规则表达式;
针对每个阈值,将该阈值对应的业务规则表达式与客群表达式通过并集操作符进行连接获得该阈值对应的联立表达式,利用联立表达式以及客群运算表达式构建该阈值对应的分析表达式;
对待分析目标客群对应的数据执行分析表达式,获得该阈值对应的分析结果;
使用可视化组件对不同阈值对应的多个分析结果进行展示获得目标标签对应的可视化图表,并利用报告模板生成可视化图表对应的客群画像分析报告。
可选地,利用联立表达式以及客群运算表达式构建该阈值对应的分析表达式,包括:将客群表达式与该阈值对应的业务规则表达式作为运算参数代入客群运算表达式;基于联立表达式以及代入运算参数的客群运算表达式构建该阈值对应的分析表达式。
可选地,选取表征待分析目标客群分析维度的目标标签,获取目标标签对应的全部阈值以及每个阈值对应的业务规则表达式,包括:确定目标标签的统计模板以及全部阈值;针对每个阈值,将该阈值与统计模板、目标标签的标签名称相结合,获取该阈值对应的业务规则表达式。
可选地,确定目标标签的统计模板以及全部阈值,包括:确定目标标签对应的目标数据立方体;确定目标数据立方体对应的统计模板,从目标数据立方体对应的数据中获取目标标签对应的全部阈值。
可选地,统计模板包括第一业务逻辑表达式以及第二业务逻辑表达式,第一业务逻辑表达式是用于确定标签的表达式,第二业务逻辑表达式是用于确定标签取值范围的表达式;将该阈值与统计模板、目标标签的标签名称相结合,获取该阈值对应的业务规则表达式,包括:将标签名称代入第一业务逻辑表达式获得第一业务规则表达式;将阈值代入第二业务逻辑表达式获得第二业务规则表达式;将第一业务规则表达式以及第二业务规则表达式组合在一起获得该阈值对应的业务规则表达式。
可选地,使用可视化组件对不同阈值对应的多个分析结果进行展示获得目标标签对应的可视化图表,并利用报告模板生成可视化图表对应的客群画像分析报告,包括:针对每个阈值对应的分析结果,确定该分析结果是否超出设定标准值;若超出设定标准值,将该阈值以及对应的分析结果代入预设的文字描述模板中;将代入阈值以及分析结果的文字描述模板与预设图标结合生成客户画像分析报告。
可选地,选取表征待分析目标客群分析维度的目标标签,包括:从预设的多个候选标签中选择目标标签,或者,确定目标分析模板,将目标分析模板中的标签作为目标标签。
第二方面,本申请实施例还提供了一种客群画像生成装置,所述装置包括:
客群确定模块,用于选取待分析目标客群,确定待分析目标客群对应的客群表达式,客群表达式是用于确定待分析目标客群的结构化查询语句;
第一获取模块,用于选取表征待分析目标客群分析维度的目标标签,获取目标标签对应的全部阈值以及每个阈值对应的业务规则表达式;
第二获取模块,用于针对每个阈值,将该阈值对应的业务规则表达式与客群表达式通过并集操作符进行连接获得该阈值对应的联立表达式,利用联立表达式以及客群运算表达式构建该阈值对应的分析表达式;
结果生成模块,用于对待分析目标客群对应的数据执行分析表达式,获得该阈值对应的分析结果;
可视化模块,用于使用可视化组件对不同阈值对应的多个分析结果进行展示获得目标标签对应的可视化图表,并利用报告模板生成可视化图表对应的客群画像分析报告。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的客群画像生成方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的客群画像生成方法的步骤。
本申请实施例带来了以下有益效果:
本申请实施例提供的一种客群画像生成方法、装置、电子设备及存储介质,能够针对待分析的目标客群确定该目标客群对应的客群表达式,确定目标标签下每个阈值对应的分析表达式,通过执行不同阈值对应的多个分析表达式可获得多个分析结果,这些分析结果表征了目标客群在目标标签这一分析维度下不同阈值的分布情况,整个分析过程无需特定的客群画像分析工作人员以及IT部门提供技术支持,与现有技术中的客群画像生成方法相比,解决了客群画像生成效率低的问题。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的客群画像生成方法的流程图;
图2示出了本申请实施例所提供的客群画像生成装置的结构示意图;
图3示出了本申请实施例所提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
值得注意的是,在本申请提出之前,随着大数据时代的到来,数据正在迅速膨胀变大,它决定着企业的未来发展,随着时间的推移,人们越来越多地意识到数据对企业的重要性。对于商业企业来说,可以将数据分析应用到对客群(消费者)的画像上,以更精准的掌握消费客群的特征属性,从而更合理的做出客群决策。目前,企业的业务更新迭代的速度越来越快,使得业务指标也随之快速变化,为了能全面、快速的掌握各个客群的特征属性,需要特定的客群画像分析工作人员以及IT部门提供画像生成支持,造成沟通成本高、画像生成效率低的问题。
基于此,本申请实施例提供了一种客群画像生成方法,以提高客群画像的生成效率。
请参阅图1,图1为本申请实施例所提供的一种客群画像生成方法的流程图。如图1所示,本申请实施例提供的客群画像生成方法,包括:
步骤S101,选取待分析目标客群,确定待分析目标客群对应的客群表达式。
该步骤中,待分析目标客群可指待生成的客群画像对应的客群,待分析目标客群是被分析的对象。
客群表达式可指结构化查询语句,客群表达式是用于确定待分析目标客群的结构化查询语句。
示例性的,客群表达式可以是SQL语句。
在本申请实施例中,首先确定筛选条件,利用筛选条件对原始数据进行筛选获得待分析目标客群,根据筛选条件可以确定客群表达式。以待分析目标客群为累计贷款逾期3次的客户为例,则可以将累计贷款预期作为筛选标签,将3次作为标签阈值,由筛选标签以及标签阈值构成筛选条件,确定该筛选条件对应的包含SELECT关键字的SQL客群表达式。其中,以待分析目标客群为银行机构的客户为例,原始数据指的是银行结构的客户的基本信息数据、购买数据、储蓄数据、贷款数据等。
步骤S102,选取表征待分析目标客群分析维度的目标标签,获取目标标签对应的全部阈值以及每个阈值对应的业务规则表达式。
该步骤中,目标标签可指客群画像对应的分析维度,目标标签用于确定待分析目标客群的分析维度。
示例性的,目标标签可以是性别,对待分析目标客群中的男性人数和女性人数之间的分布比例进行分析,也可以是工作就业状态,对待分析目标客群中的在岗人数和失业人数之间的分布比例进行分析。
阈值可指标签的取值,示例性的,如果目标标签为性别则阈值包括:男、女、未知,如果目标标签为工作就业状态则阈值包括:在岗、失业。
可以将阈值理解为一个筛选条件,当客户对应的属性值符合该筛选条件时将该客户纳入到该阈值对应的分类下。
业务规则表达式可指结构化查询语句,业务规则表达式包括用于确定标签的第一业务规则表达式以及用于确定阈值的第二业务规则表达式。
示例性的,以性别为男性为例,该男性阈值对应的业务规则表达式包括LBL_NM=“性别”以及LBL_CD=“男”,其中,LBL_NM指的是标签字段的字段名称,LBL_CD指的是阈值字段的字段名称。
在本申请实施例中,对原始数据进行筛选处理可得到多个数据立方体,每个数据立方体对应一个标签,一个数据立方体是从原始数据中选取的若干维度的数据对应的数学立方。
以个人年收入标签为例,该标签对应个人年收入数据立方体,该数据立方体中可以是包括报告日期、客户号、个人年收入三个维度的数据立方体,也可以是包括报告日期、客户号、性别、个人年收入四个维度的数据立方体,数据立方体的具体维度可以根据实际情况进行选择。
每个数据立方体对应的多维数据可以通过查询SQL语句获得,因此,每个数据立方体对应一个查询SQL语句,即每个标签对应一个查询SQL语句,对查询SQL语句进行转换可以得到统计模板。
以性别标签为目标标签为例,该目标标签的全部阈值为男、女、未知,由于这些阈值对应的标签名称是相同的都是性别,因此,每个阈值对应的第一业务规则表达式也是相同的都是LBL_NM=“性别”,第二业务规则表达式分别是“LBL_CD=“男”、LBL_CD=“女”、LBL_CD=“未知”。针对每个阈值,在性别数据立方体对应的统计模板中通过Where关键字加入上述该阈值对应的第一业务规则表达式以及第二业务规则表达式就可以得到该阈值对应的业务规则表达式。
在一可选实施例中,选取表征待分析目标客群分析维度的目标标签,获取目标标签对应的全部阈值以及每个阈值对应的业务规则表达式,包括:确定目标标签的统计模板以及全部阈值;针对每个阈值,将该阈值与统计模板、目标标签的标签名称相结合,获取该阈值对应的业务规则表达式。
这里,统计模板可指统计数据的模板,统计模板用于获取统计数据。
示例性的,统计模板可以是SQL语句。
统计模板包括了要统计的具体数据项,例如:统计符合条件的人数。
作为示例,统计模板可以是统计分析维度下不同阈值对应的人数分布的SQL语句模板,例如:不同性别的人数分布比例。
具体的,确定待分析目标客群的目标标签后,获取该目标标签对应的统计模板以及全部阈值,以性别标签为目标标签为例,获取该性别标签对应的统计模板以及全部阈值,全部阈值包括:男、女、未知。然后,将统计模板与性别(标签名称)、男(阈值)结合得到第一个阈值对应的业务规则表达式;将统计模板与性别(标签名称)、女(阈值)结合得到第二个阈值对应的业务规则表达式;将统计模板与性别(标签名称)、未知(阈值)结合得到第三个阈值对应的业务规则表达式。
在一可选实施例中,确定目标标签的统计模板以及全部阈值,包括:确定目标标签对应的目标数据立方体;确定目标数据立方体对应的统计模板,从目标数据立方体对应的数据中获取目标标签对应的全部阈值。
这里,目标数据立方体可指目标标签对应的数据立方体,目标数据立方体中包括了目标标签的所有阈值。
查询模板可指查询目标数据立方体对应的所有数据的模板,示例性的,查询模板可以是SQL查询语句模板。
具体的,每个数据立方体对应一个查询SQL语句,该查询SQL语句是查询数据立方体对应的所有数据的SQL语句,在该查询SQL语句后加入第一业务逻辑表达式以及第二业务逻辑表达式,可以得到统计模板。
在选取目标标签之前已经建立了目标标签对应的数据立方体以及该数据立方体对应的统计模板,在选取目标标签后可以直接确定对应的目标数据立方体以及该目标数据立方体对应的统计模板,然后可从目标数据立方体对应的数据中查询该标签的全部阈值。
在一可选实施例中,统计模板包括第一业务逻辑表达式以及第二业务逻辑表达式,第一业务逻辑表达式是用于确定标签的表达式,第二业务逻辑表达式是用于确定标签取值范围的表达式;将该阈值与统计模板、目标标签的标签名称相结合,获取该阈值对应的业务规则表达式,包括:将标签名称代入第一业务逻辑表达式获得第一业务规则表达式;将阈值代入第二业务逻辑表达式获得第二业务规则表达式;将第一业务规则表达式以及第二业务规则表达式组合在一起获得该阈值对应的业务规则表达式。
这里,第一业务逻辑表达式可指确定分析维度所对应的标签名称的程序语句模板,示例性的,第一业务逻辑表达式可以是SQL语句。
作为示例,第一业务逻辑表达式为LBL_NM=${LBL_NM},其中,LBL_NM用于表征标签名称字段的字段名称,${LBL_NM}是表征标签名称的具体取值的抽象符号。
第二业务逻辑表达式可指确定标签的阈值的程序语句模板,示例性的,第二业务逻辑表达式可以是SQL语句。
作为示例,第二业务逻辑表达式为LBL_CD=${LBL_CD},其中,LBL_CD用于表征阈值字段的字段名称,${LBL_CD}是表征阈值的具体取值的抽象符号。
第一业务规则表达式可指确定具体标签名称的程序语句,示例性的,第一业务逻辑表达式可以是SQL语句。
作为示例,第一业务规则表达式为LBL_NM=“性别”。
第二业务规则表达式可指确定阈值具体取值的程序语句,示例性的,第二业务规则表达式可以是SQL语句。
作为示例,第二业务规则表达式为LBL_CD=“男”。
具体的,数据库中存储了数据立方体对应的各个字段的字段名称,这些字段包括标签名称字段、阈值字段、客户号字段、报告日期字段等,以标签名称字段为例,该字段的字段名称为LBL_NM,当目标标签为性别时,在该目标标签对应的统计模板中包括第一业务逻辑表达式LBL_NM=${LBL_NM}以及第二业务逻辑表达式LBL_CD=${LBL_CD},用性别替换${LBL_NM}得到第一业务规则表达式LBL_NM=“性别”,用男替换${LBL_CD}得到第二业务规则表达式LBL_CD=“男”,通过and关键字将第一业务规则表达式与第二业务规则表达式连接起来,得到该阈值男对应的业务规则表达式。
在一可选实施例中,选取表征待分析目标客群分析维度的目标标签,包括:从预设的多个候选标签中选择目标标签,或者,确定目标分析模板,将目标分析模板中的标签作为目标标签。
这里,候选标签可指已经建立的标签,候选标签用于作为客群画像分析的候选维度。
目标分析模板可指从候选分析模板中选择的模板,候选分析模板可指以往建立的分析模板,候选分析模板中包括了至少一个标签。
具体的,在客群画像系统界面中,左侧标签列表部分列举了多个候选标签,用户只要勾选候选标签则将该候选标签作为目标标签,同时,界面中还包括了分析模板按钮,点击分析模板按钮会弹出分析模板列表,可选择一个分析模板作为目标分析模板,并将目标分析模板中的标签作为目标标签。
步骤S103,针对每个阈值,将该阈值对应的业务规则表达式与客群表达式通过并集操作符进行连接获得该阈值对应的联立表达式,利用联立表达式以及客群运算表达式构建该阈值对应的分析表达式。
该步骤中,并集操作符可指SQL语言中的UNION操作符。
联立表达式可指SQL表达式,联立表达式是由多个表达式连接在一起得到的表达式。
联立表达式用于将某分析纬度下的具体阈值筛选条件以及目标客群联立在一起,表征目标客群中符合阈值筛选条件的统计结果。
客群运算表达式可指运算函数,示例性的,客群运算表达式为自定义的UDAF函数。
作为示例,客群运算表达式可以是进行除法运算,也可以是进行差值运算。
分析表达式可指包括运算函数以及联立表达式的结构化查询语句,分析表达式用于获取分析结果。
以客群运算表达式是除法运算函数、阈值等于男性为例,分析表达式的计算结果为男性人数占目标客群总人数的比例。
在一可选实施例中,利用联立表达式以及客群运算表达式构建该阈值对应的分析表达式,包括:将客群表达式与该阈值对应的业务规则表达式作为运算参数代入客群运算表达式;基于联立表达式以及代入运算参数的客群运算表达式构建该阈值对应的分析表达式。
这里,运算参数可指运算的参数,以客群运算表达式为进行除法运算为例,运算参数指的是除数和被除数。
具体的,以统计人数为例,性别标签共有三个阈值,分别是男、女、未知,则可依次获得业务规则表达式a、业务规则表达式b、业务规则表达式c,将这三个业务规则表达式分别与客群表达式进行连接获得三个联立表达式,分别是联立表达式a、联立表达式b、联立表达式c。同时,将这三个业务规则表达式以及客群表达式分别代入客群运算表达式,得到代入运算参数的客群运算表达式a、代入运算参数的客群运算表达式b以及代入运算参数的客群运算表达式c。
由联立表达式a与代入运算参数的客群运算表达式a构成分析表达式a;由联立表达式b与代入运算参数的客群运算表达式b构成分析表达式b;由联立表达式c与代入运算参数的客群运算表达式c构成分析表达式c,如此,可获得三个分析表达式。
另外,还可以在每个分析表达式中加入数据权限控制表达式,数据权限控制表达式也是SQL语句,用以控制当前用户可分析的数据,在未加入数据权限控制表达式时,是针对目标客群的所有数据进行画像分析,在加入数据权限控制表达式时,只能对目标客群中的符合管理权限的数据进行画像分析。
这里,可为不同用户设置不同的管理权限,该管理权限可以是针对银行机构的管理权限,也可以是针对地区的管理权限,以地区管理权限为例,地区分为省级管理权限、市级管理权限、县级管理权限,当为某个用户设置市级管理权限时,该用户只能在目标客群对应的数据中选取市级及市级以下的数据作为客群画像的分析数据。
对同一管理权限内的数据还可以进行进一步的划分,例如:市级管理权限中可以列举出多个城市的城市名称,选取不同的城市名称就可以圈选对应城市的数据作为客群画像分析的数据。
步骤S104,对待分析目标客群对应的数据执行分析表达式,获得该阈值对应的分析结果。
该步骤中,经过上述过程后已经得到了不同阈值对应的多个分析表达式,针对每个阈值执行该阈值对应的分析表达式,可以得到待分析目标客群中符合该阈值筛选条件的客户的统计数据与目标客群中所有客户的统计数据之间的关系。
假设,统计的是人数,目标标签为性别,客群运算表达式为除法运算,则执行分析表达式a可以获得目标客群中男性占总人数的比例,执行分析表达式b可以获得目标客群中女性占总人数的比例,执行分析表达式c可以获得目标客群中未知性别占总人数的比例。
步骤S105,使用可视化组件对不同阈值对应的多个分析结果进行展示获得目标标签对应的可视化图表,并利用报告模板生成可视化图表对应的客群画像分析报告。
该步骤中,假设计算得到男性占48%、女性占51%、未知占1%,则可以通过可视化组件Echarts对计算结果进行可视化展示,例如:以饼图、柱状图、扇形图、折线图进行展示。在得到可视化图表后,可以通过报告模板将可视化图表导出生成客群画像分析报告。
在一可选实施例中,使用可视化组件对不同阈值对应的多个分析结果进行展示获得目标标签对应的可视化图表,并利用报告模板生成可视化图表对应的客群画像分析报告,包括:针对每个阈值对应的分析结果,确定该分析结果是否超出设定标准值;若超出设定标准值,将该阈值以及对应的分析结果代入预设的文字描述模板中;将代入阈值以及分析结果的文字描述模板与预设图标结合生成客户画像分析报告。
这里,设定标准值可指设定的标准数值,设定标准用于确定分析结果是否为异常值或者过大的数值。
以上述示例为例,假设设定标准值为55%且计算得到男性占40%、女性占59%、未知占1%,则59%大于55%,因此将女性以及59%代入预设的文字描述模板中,再将该文字描述模板与预设的内置图标结合,以突出该项内容,导出后生成PDF格式的客户画像分析报告。
与现有技术中客群画像生成方法相比,本申请能够针对待分析的目标客群确定该目标客群对应的客群表达式,确定目标标签下每个阈值对应的分析表达式,通过执行不同阈值对应的多个分析表达式可获得多个分析结果,这些分析结果表征了目标客群在目标标签这一分析维度下不同阈值的分布情况,整个分析过程无需特定的客群画像分析工作人员以及IT部门提供技术支持,解决了客群画像生成效率低的问题。
基于同一发明构思,本申请实施例中还提供了与客群画像生成方法对应的客群画像生成装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述客群画像生成方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图2,图2为本申请实施例所提供的一种客群画像生成装置的结构示意图。如图2中所示,所述客群画像生成装置200包括:
客群确定模块201,用于选取待分析目标客群,确定待分析目标客群对应的客群表达式,客群表达式是用于确定待分析目标客群的结构化查询语句;
第一获取模块202,用于选取表征待分析目标客群分析维度的目标标签,获取目标标签对应的全部阈值以及每个阈值对应的业务规则表达式;
第二获取模块203,用于针对每个阈值,将该阈值对应的业务规则表达式与客群表达式通过并集操作符进行连接获得该阈值对应的联立表达式,利用联立表达式以及客群运算表达式构建该阈值对应的分析表达式;
结果生成模块204,用于对待分析目标客群对应的数据执行分析表达式,获得该阈值对应的分析结果;
可视化模块205,用于使用可视化组件对不同阈值对应的多个分析结果进行展示获得目标标签对应的可视化图表,并利用报告模板生成可视化图表对应的客群画像分析报告。
请参阅图3,图3为本申请实施例所提供的一种电子设备的结构示意图。如图3中所示,所述电子设备300包括处理器310、存储器320和总线330。
所述存储器320存储有所述处理器310可执行的机器可读指令,当电子设备300运行时,所述处理器310与所述存储器320之间通过总线330通信,所述机器可读指令被所述处理器310执行时,可以执行如上述图1所示方法实施例中的客群画像生成方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的客群画像生成方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种客群画像生成方法,其特征在于,包括:
选取待分析目标客群,确定所述待分析目标客群对应的客群表达式,所述客群表达式是用于确定待分析目标客群的结构化查询语句;
选取表征待分析目标客群分析维度的目标标签,获取所述目标标签对应的全部阈值以及每个阈值对应的业务规则表达式,阈值为标签的取值,业务规则表达式为结构化查询语句;
针对每个阈值,将该阈值对应的业务规则表达式与客群表达式通过并集操作符进行连接获得该阈值对应的联立表达式,利用所述联立表达式以及客群运算表达式构建该阈值对应的分析表达式,所述客群运算表达式为运算函数;
对待分析目标客群对应的数据执行所述分析表达式,获得该阈值对应的分析结果;
使用可视化组件对不同阈值对应的多个分析结果进行展示获得目标标签对应的可视化图表,并利用报告模板生成所述可视化图表对应的客群画像分析报告。
2.根据权利要求1所述的方法,其特征在于,所述利用所述联立表达式以及客群运算表达式构建该阈值对应的分析表达式,包括:
将所述客群表达式与该阈值对应的业务规则表达式作为运算参数代入客群运算表达式;
基于所述联立表达式以及代入运算参数的客群运算表达式构建该阈值对应的分析表达式。
3.根据权利要求1所述的方法,其特征在于,所述选取表征待分析目标客群分析维度的目标标签,获取所述目标标签对应的全部阈值以及每个阈值对应的业务规则表达式,包括:
确定所述目标标签的统计模板以及全部阈值;
针对每个阈值,将该阈值与所述统计模板、目标标签的标签名称相结合,获取该阈值对应的业务规则表达式。
4.根据权利要求3所述的方法,其特征在于,所述确定所述目标标签的统计模板以及全部阈值,包括:
确定所述目标标签对应的目标数据立方体;
确定所述目标数据立方体对应的统计模板,从所述目标数据立方体对应的数据中获取所述目标标签对应的全部阈值。
5.根据权利要求3所述的方法,其特征在于,所述统计模板包括第一业务逻辑表达式以及第二业务逻辑表达式,所述第一业务逻辑表达式是用于确定标签的表达式,所述第二业务逻辑表达式是用于确定标签取值范围的表达式;
所述将该阈值与所述统计模板、目标标签的标签名称相结合,获取该阈值对应的业务规则表达式,包括:
将所述标签名称代入第一业务逻辑表达式获得第一业务规则表达式;
将所述阈值代入第二业务逻辑表达式获得第二业务规则表达式;
将所述第一业务规则表达式以及第二业务规则表达式组合在一起获得该阈值对应的业务规则表达式。
6.根据权利要求1所述的方法,其特征在于,所述使用可视化组件对不同阈值对应的多个分析结果进行展示获得目标标签对应的可视化图表,并利用报告模板生成所述可视化图表对应的客群画像分析报告,包括:
针对每个阈值对应的分析结果,确定该分析结果是否超出设定标准值;
若超出设定标准值,将该阈值以及对应的分析结果代入预设的文字描述模板中;
将代入阈值以及分析结果的文字描述模板与预设图标结合生成客户画像分析报告。
7.根据权利要求1所述的方法,其特征在于,所述选取表征待分析目标客群分析维度的目标标签,包括:
从预设的多个候选标签中选择目标标签,或者,确定目标分析模板,将所述目标分析模板中的标签作为目标标签。
8.一种客群画像生成装置,其特征在于,包括:
客群确定模块,用于选取待分析目标客群,确定所述待分析目标客群对应的客群表达式,所述客群表达式是用于确定待分析目标客群的结构化查询语句;
第一获取模块,用于选取表征待分析目标客群分析维度的目标标签,获取所述目标标签对应的全部阈值以及每个阈值对应的业务规则表达式,阈值为标签的取值,业务规则表达式为结构化查询语句;
第二获取模块,用于针对每个阈值,将该阈值对应的业务规则表达式与客群表达式通过并集操作符进行连接获得该阈值对应的联立表达式,利用所述联立表达式以及客群运算表达式构建该阈值对应的分析表达式,所述客群运算表达式为运算函数;
结果生成模块,用于对待分析目标客群对应的数据执行所述分析表达式,获得该阈值对应的分析结果;
可视化模块,用于使用可视化组件对不同阈值对应的多个分析结果进行展示获得目标标签对应的可视化图表,并利用报告模板生成所述可视化图表对应的客群画像分析报告。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7中任一项所述的客群画像生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的客群画像生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211291696.9A CN115545791B (zh) | 2022-10-19 | 2022-10-19 | 一种客群画像生成方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211291696.9A CN115545791B (zh) | 2022-10-19 | 2022-10-19 | 一种客群画像生成方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115545791A CN115545791A (zh) | 2022-12-30 |
CN115545791B true CN115545791B (zh) | 2024-06-25 |
Family
ID=84736413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211291696.9A Active CN115545791B (zh) | 2022-10-19 | 2022-10-19 | 一种客群画像生成方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115545791B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117290182A (zh) * | 2023-09-26 | 2023-12-26 | 行吟信息科技(上海)有限公司 | 基于普罗米修斯系统的监控方法及相关产品 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111400599A (zh) * | 2020-03-17 | 2020-07-10 | 苏宁金融科技(南京)有限公司 | 一种用户群画像生成方法、装置及系统 |
CN112269805A (zh) * | 2020-11-18 | 2021-01-26 | 杭州米雅信息科技有限公司 | 数据处理方法、装置、设备及介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112035541A (zh) * | 2020-08-28 | 2020-12-04 | 平安科技(深圳)有限公司 | 客户画像方法、装置、计算机可读存储介质及终端设备 |
CN112069201A (zh) * | 2020-09-04 | 2020-12-11 | 北京百度网讯科技有限公司 | 目标数据的获取方法和装置 |
CN112396428B (zh) * | 2020-11-05 | 2023-04-07 | 北京易观智库网络科技有限公司 | 一种基于用户画像数据的客群分类管理方法及装置 |
-
2022
- 2022-10-19 CN CN202211291696.9A patent/CN115545791B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111400599A (zh) * | 2020-03-17 | 2020-07-10 | 苏宁金融科技(南京)有限公司 | 一种用户群画像生成方法、装置及系统 |
CN112269805A (zh) * | 2020-11-18 | 2021-01-26 | 杭州米雅信息科技有限公司 | 数据处理方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115545791A (zh) | 2022-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hwang et al. | Generalized structured component analysis: A component-based approach to structural equation modeling | |
Zhou et al. | Comparing MCDA aggregation methods in constructing composite indicators using the Shannon-Spearman measure | |
US20070106577A1 (en) | Apparatus and method for facilitating trusted business intelligence | |
CN111209400B (zh) | 一种数据分析的方法及装置 | |
Zhu et al. | Assessing the quality of large-scale data standards: A case of XBRL GAAP Taxonomy | |
CN115545791B (zh) | 一种客群画像生成方法、装置、电子设备及存储介质 | |
CN114840531B (zh) | 基于血缘关系的数据模型重构方法、装置、设备及介质 | |
US8935653B2 (en) | System advisor for requirements gathering and analysis in web solutions | |
CN116451074A (zh) | 目标对象的画像生成方法、装置、计算机设备、存储介质 | |
Dennis et al. | Functional data analysis of multi-species abundance and occupancy data sets | |
US11373198B2 (en) | Evaluation device, evaluation method, and evaluation program | |
CN115525377B (zh) | 一种定性标签数据可视化方法、装置、电子设备及介质 | |
CN112418260A (zh) | 模型训练方法、信息提示方法、装置、设备及介质 | |
US20130054597A1 (en) | Constructing an association data structure to visualize association among co-occurring terms | |
Li et al. | Incorporation of Social Media Data into Macroeconomic Forecast Systems: A Mixed Frequency Modelling Approach. | |
CN115600600B (zh) | 多对象标签体系的标签命名方法、装置、电子设备及介质 | |
CN117540107B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN115718825B (zh) | 一种时长标签的确定方法、装置及电子设备 | |
CN115563385B (zh) | 一种组合标签的生成方法及生成装置 | |
US11562185B2 (en) | Extraction method, extraction device, and computer-readable recording medium | |
JP2009211128A (ja) | シミュレーション装置及びシミュレーション方法及びプログラム | |
CN115840772A (zh) | 一种客群数据统计方法、装置、电子设备及存储介质 | |
Nießner | Reflections on Text Mining Approaches in Corporate Failure Prediction based on German Financial Statements | |
CN107193868B (zh) | 一种数据质量问题报告系统 | |
CN116108196A (zh) | 指标知识图谱的生成方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |