CN117151870B - 一种基于客群画像行为分析方法及系统 - Google Patents
一种基于客群画像行为分析方法及系统 Download PDFInfo
- Publication number
- CN117151870B CN117151870B CN202311419392.0A CN202311419392A CN117151870B CN 117151870 B CN117151870 B CN 117151870B CN 202311419392 A CN202311419392 A CN 202311419392A CN 117151870 B CN117151870 B CN 117151870B
- Authority
- CN
- China
- Prior art keywords
- data
- credit
- customer
- generate
- portrait
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 118
- 238000012216 screening Methods 0.000 claims abstract description 78
- 238000000034 method Methods 0.000 claims abstract description 67
- 238000012545 processing Methods 0.000 claims abstract description 54
- 238000013523 data management Methods 0.000 claims abstract description 30
- 238000007781 pre-processing Methods 0.000 claims abstract description 24
- 238000011156 evaluation Methods 0.000 claims description 106
- 238000004422 calculation algorithm Methods 0.000 claims description 50
- 210000002569 neuron Anatomy 0.000 claims description 45
- 238000009826 distribution Methods 0.000 claims description 39
- 238000003066 decision tree Methods 0.000 claims description 36
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000007621 cluster analysis Methods 0.000 claims description 29
- 238000005516 engineering process Methods 0.000 claims description 28
- 238000004140 cleaning Methods 0.000 claims description 23
- 230000004913 activation Effects 0.000 claims description 20
- 238000012795 verification Methods 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 17
- 238000010276 construction Methods 0.000 claims description 15
- 238000013480 data collection Methods 0.000 claims description 15
- 238000000611 regression analysis Methods 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 13
- 238000007619 statistical method Methods 0.000 claims description 9
- 238000012098 association analyses Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000012417 linear regression Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 5
- 238000013433 optimization analysis Methods 0.000 claims description 5
- 230000008602 contraction Effects 0.000 claims description 3
- 238000003384 imaging method Methods 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 abstract description 9
- 239000000047 product Substances 0.000 description 137
- 230000006399 behavior Effects 0.000 description 79
- 230000006870 function Effects 0.000 description 22
- 230000002349 favourable effect Effects 0.000 description 16
- 238000012549 training Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 14
- 230000011218 segmentation Effects 0.000 description 12
- 230000009471 action Effects 0.000 description 11
- 230000008901 benefit Effects 0.000 description 11
- 239000000284 extract Substances 0.000 description 10
- 238000000513 principal component analysis Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000009286 beneficial effect Effects 0.000 description 8
- 230000006872 improvement Effects 0.000 description 7
- 238000010219 correlation analysis Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000000556 factor analysis Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000013450 outlier detection Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2141—Access rights, e.g. capability lists, access control lists, access tables, access matrices
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及金融数据分析技术领域,尤其是涉及一种基于客群画像的行为分析方法及系统。所述方法包括以下步骤:获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行定量信息定性化处理,生成信贷用户画像原始数据;基于信贷用户画像原始数据进行目标客户数据筛选处理,生成模型特征预处理数据;获取大数据管理平台访问权限,基于大数据管理平台访问权限以及模型特征预处理数据进行信贷产品服务预测,实现客群画像的行为分析;本发明通过利用金融企业数据仓库访问权限获取金融企业仓库数据,并对金融企业仓库数据进行数据处理,以提高客群画像的行为分析的及时性和准确性。
Description
技术领域
本发明涉及金融数据分析技术领域,尤其是涉及一种基于客群画像行为分析方法及系统。
背景技术
在金融领域,了解客户的行为模式和特征对于制定有效的营销策略和个性化服务至关重要,客群画像是一种将客户进行分类和描述的方法,可以帮助金融机构深入了解不同客户群体的行为和需求,从而进行精准的营销和风险管理,然而,目前的客群画像方法存在数据分析效率低、信息提取不准确等问题,因此如何开发一种效率高、分析准确的客群画像行为分析方法及系统成为亟待解决的问题。
发明内容
有鉴于此,有必要提供一种基于客群画像行为分析方法及系统,以解决至少一个上述技术问题。
为实现上述目的,本发明提供一种基于客群画像行为分析方法,所述方法包括以下步骤:
步骤S1:获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行金融企业仓库数据访问,生成金融企业仓库数据;基于金融企业仓库数据进行数据集中,生成客群筛选集中数据集;基于客群筛选集中数据集利用K-means聚类分析进行数据样本分组,生成客群强相关数据;基于客群强相关数据进行定量信息定性化处理,生成信贷用户画像原始数据;
步骤S2:基于信贷用户画像原始数据利用客户决策树算法进行画像节点数据权重分配,生成用户画像权重分配数据,基于用户画像权重分配数据进行应用场景划分,生成应用场景数据,基于应用场景数据进行目标客户数据筛选处理,生成目标客户行为数据;
步骤S3:获取大数据管理平台访问权限,基于大数据管理平台访问权限进行用户信息数据获取,生成用户信息数据,基于目标客户行为数据以及用户信息数据进行数据匹配验证,生成目标客户关联数据,基于目标客户关联数据进行数据标准化处理,生成标准目标客户评估数据;
步骤S4:基于标准目标客户评估数据利用数据画像技术进行客户信贷产品服务推送,生成信贷产品服务反馈数据集,基于信贷产品服务反馈数据集利用回归分析进行统计信贷产品服务反馈,生成反馈数据;
步骤S5:基于反馈数据利用服务评估公式进行标准客户目标评估数据参数调整,生成信贷模型参数数据,基于信贷模型参数数据进行画像信贷推送模型构建,生成画像信贷推送模型,基于画像信贷推送模型进行信贷产品服务预测,实现客群画像的行为分析。
本发明提供了一种基于客群画像的行为分析方法,该方法通过访问金融企业数据仓库和应用数据分析技术,该系统能够获取和处理金融企业的数据,生成信贷用户画像原始数据。同时,通过数据集中、聚类分析、主成分分析等方法,能够从原始数据中提取出客群的强相关数据和定性主成分数据,为后续的信贷用户画像和预测分析提供基础数据。这些步骤的有益效果在于能够从海量金融数据中提取出关键信息,形成具有代表性和有价值的信贷用户画像原始数据,通过应用客户决策树算法和协同过滤算法,系统能够构建用户画像权重分配数据和业务场景数据,并进行特征提取和转换,生成业务特征工程数据。这些步骤的有益效果在于能够根据客户的特征和行为数据,构建客户决策树和业务场景数据,为信贷用户的个性化定制和精准推送提供基础,同时,通过特征工程的处理,能够对数据进行优化和降维,提高后续模型的建模效果和运行效率,通过应用大数据管理平台和关联分析算法,系统能够获取用户信息数据,进行数据预处理和清洗操作,生成外部清洗数据。同时,通过关联分析和嵌入方法,能够进行特征匹配和评估筛选,生成信贷特征选择数据。这些步骤的有益效果在于能够对原始数据进行清洗和预处理,去除噪声和冗余信息,提取出与信贷模型相关的特征数据,为建立高效的信贷模型提供输入数据,通过应用数据画像技术和回归分析,系统能够进行信贷客户筛选、聚类分析和潜在需求预测,生成信贷产品服务推送数据集和信贷产品服务反馈数据集。这些步骤的有益效果在于能够根据客户画像和行为分析结果,精准地筛选目标客户并预测其潜在需求,以及通过推送服务和收集反馈数据,实现对信贷产品服务的持续优化和改进,通过应用服务评估公式和循环神经网络模型,系统能够对信贷产品服务进行统计分析和优化,生成优化分析数据和画像信贷推送模型。这些步骤的有益效果在于能够基于反馈数据对信贷产品服务进行评估和优化,调整模型参数和神经网络结构,建立画像信贷推送模型,并通过预测和分析实现对客群行为的深入理解和精准预测,从金融企业数据中提取关键信息并构建客户画像,通过数据分析和模型预测实现对客群行为的分析和个性化服务的提供,从而提高信贷业务的效率和用户满意度。
优选地,步骤S1包括以下步骤:
步骤S11:获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行金融企业仓库数据访问,生成金融企业仓库访问数据;
步骤S12:基于金融企业仓库访问数据进行数据格式化处理,生成金融企业仓库数据;
步骤S13:基于金融企业仓库数据利用线性回归分析进行数据集中,生成客群筛选集中数据集;
步骤S14:基于客群筛选集中数据集利用K-means聚类分析进行数据样本分组,生成客群强相关数据;
步骤S15:基于客群强相关数据利用PCA技术构建特征矩阵,生成定性特征矩阵;
步骤S16:基于定性特征矩阵进行中心化处理,生成定性中心化数据;
步骤S17:基于定性中心化数据进行协方差计算,生成定性协方差矩阵;
步骤S18:基于定性协方差矩阵进行特征值分解,生成定性主成分数据;
步骤S19:基于定性主成分数据进行定量信息定性化,生成信贷用户画像原始数据。
本发明首先通过获取金融企业数据仓库访问权限,实现对金融企业数据仓库的访问,通过对金融企业仓库访问数据进行格式化处理,能够使数据呈现一致的格式和结构,通过利用线性回归分析对金融企业仓库数据进行数据集中,能够识别和捕捉数据中的潜在关联关系,生成的客群筛选集中数据集能够提供更准确和全面的数据视角,有助于揭示数据中的隐藏模式和趋势,通过使用K-means聚类分析对客群筛选集中数据集进行数据样本分组,能够将数据划分为具有相似特征和属性的子群,发现客群之间的相似性和差异性,从而生成客群强相关数据,为后续的客群分析和个性化推荐提供更精细化的数据基础,通过使用PCA技术构建特征矩阵,能够提取数据中的主要特征和信息,这有助于降低数据的维度,并捕捉数据中的重要变化模式,从而生成定性特征矩阵,为后续的数据分析和建模提供更简化和有效的数据表示,通过对定性特征矩阵进行中心化处理,能够消除数据中的平均值偏差,减少数据的冗余性,提高数据的稳定性和一致性,生成定性中心化数据,为后续的统计分析和模型构建提供更可靠的数据基础,通过对定性中心化数据进行协方差计算,能够衡量数据中变量之间的相关性,识别和分析数据中的相关模式和趋势,生成定性协方差矩阵,为后续的因子分析和模式识别提供更深入的数据基础,通过对定性协方差矩阵进行特征值分解,能够确定数据中的主要成分,识别和提取数据中的主要特征和变化模式,生成定性主成分数据,通过对定性主成分数据进行定量信息定性化,能够将定性数据转化为具有定量含义的数据,这有助于更好地理解和解释数据中的定性信息,生成信贷用户画像原始数据,为后续的用户分析和个性化推荐提供更具有实际意义的数据基础。
优选地,步骤S2包括以下步骤:
步骤S21:基于信贷用户画像原始数据利用客户决策树算法进行画像节点数据权重分配,生成用户画像权重分配数据;
步骤S22:基于用户画像权重分配数据利用协同过滤算法进行应用场景划分,生成应用场景数据;
步骤S23:基于应用场景数据进行业务场景数据特征提取及转换,生成应用场景特征数据;
步骤S24:基于应用场景特征数据进行回归计算,生成邻近场景特征数据;
步骤S25:基于邻近场景特征数据进行目标客户数据筛选处理,生成目标客户行为数据。
本发明通过将产品手册文本进行分词,将文本拆分成独立的词语单元,形成一个产品分词序列,对产品手册的内容进行细粒度的处理和分析,为后续的操作提供了更具体和可操作的数据基础,通过对产品分词序列进行停用词去除处理,去除那些在文本分析中不具有实际含义或无关紧要的常用词汇,从而得到更具代表性和有效性的典型产品分词序列,通过对典型产品分词序列进行词性标注,将每个词语与其对应的词性进行关联,从而获得更多关于词语语义和用法的信息,为后续的语义分析和处理提供更准确的基础,通过利用实体识别工具对词性标注分词序列进行处理,识别出文本中的实体信息,例如人名、地名、日期等。这样可以将产品手册中的重要实体信息提取出来,用于后续的问题回答和信息提供,通过获取产品手册文档的提取格式,并根据预设的代码指令集进行相应的数据提取操作,从产品手册中提取出与问答相关的数据,并将其整理成键值对的形式,以便于后续的问答处理和数据存储,通过获取产品手册文档的提取格式,并根据预设的代码指令集进行相应的数据提取操作,从产品手册中提取出与问答相关的数据,并将其整理成键值对的形式,以便于后续的问答处理和数据存储,通过利用语法分析工具对业务流程数据进行处理,识别出文本中的语法结构和关联关系,形成一个流程语法结构,这样可以更好地理解和分析业务流程,为后续的流程关键字提取和文本分类提供更准确的基础,通过运用关键字提取算法,从流程语法结构中提取出与业务流程相关的关键字,这样可以识别出业务流程中的重要步骤、关键词汇,为后续的流程分析和文本分类提供更有价值的信息,通过应用文本分类算法,对业务流程数据进行分类,将其归类到不同的流程类别中,这样可以根据业务流程的性质和特点,将文本进行整理和归纳,方便用户查询和理解,通过将分类流程文本和产品问答回复键值对存储到数据库中,形成问答回复数据的存储结构,这样可以快速检索和获取与用户问题相匹配的问答内容,提供准确和实用的产品问答服务。
优选地,步骤S21中的客户决策树算法具体为:
;
;
其中,为用户画像权重分配数据,为信贷用户画像原始数据,为客户决策树中的节点数量,为客户决策树中第个节点的节点权重,为节点决策函数,为数据收缩系数,为客户决策树中第个节点的节点阈值,为信贷用户画像原始数据中第个画像偏差值数据。
本发明利用一种客户决策树算法,该算法通过一系列决策树节点的决策函数构建用户画像权重分配数据,每个节点都有自己的权重、特征阈值和决策函数,用于对输入数据进行判断和分类,节点权重、特征阈值和决策函数的选择和调整是基于对数据特征的分析和理解,以及对数据分类的目标和要求进行最优化,该公式通过对信贷用户画像原始数据的输入,根据节点的特征值进行判断,根据节点决策函数的输出(0或1)来决定最终的用户画像权重分配数据,该公式首先利用决策树中第个节点的节点权重、节点决策函数以及数据收缩系数根据潜在关系构建函数;对于节点决策函数通过利用信贷用户画像原始数据中第个画像偏差值数据、决策树中第个节点的节点权重与决策树中第个节点的节点阈值进行阈值比对,当;时,取值为1,当;时,取值为0,该公式通过对决策树中的节点权重、特征阈值和决策函数的选择和调整,旨在根据不同特征的重要性和条件判断,最大程度地拟合数据并实现有效的分类和预测。
优选地,步骤S3的具体步骤为:
步骤S31:获取大数据管理平台访问权限,基于大数据管理平台访问权限进行用户信息数据获取,生成用户信息数据;
步骤S32:基于目标客户行为数据以及用户信息数据进行数据预处理与清洗操作,生成目标客户清洗数据;
步骤S33:基于目标客户关联数据利用关联分析算法进行特征匹配,生成目标客户关联数据;
步骤S34:基于验证数据集利用Embedded方法进行特征评估与筛选,生成目标客户评估数据;
步骤S35:基于目标客户评估数据进行数值标准化,生成标准目标客户评估数据。
标准客户目标评估数据本发明通过获取大数据管理平台访问权限,能够实现对大数据管理平台的访问,通过基于模型特征预处理数据以及用户信息数据进行数据预处理与清洗操作,能够使数据达到可用的状态,去除数据中的噪声、错误和重复项,生成外部清洗数据,提高数据的准确性和可信度,通过利用关联分析算法基于外部清洗数据进行特征匹配,能够识别和捕捉数据中的特征之间的关联关系,通过利用Embedded方法基于验证数据集进行特征评估与筛选,能够确定和选择对信贷模型建立具有重要影响的特征,生成信贷特征选择数据,为模型构建和训练提供更关键和有意义的特征信息,提高模型的预测准确性和解释能力,通过基于信贷特征选择数据进行数值标准化,能够将不同尺度和范围的数据转化为统一的标准值,消除不同特征之间的量纲差异,提高数据的可比性和模型训练的稳定性,生成标准客户目标评估数据,为后续的模型构建和评估提供更可靠和一致的数据基础,提供有效的大数据访问权限、清洗和预处理后的高质量数据、全面和准确的验证数据集、关键特征的评估和筛选结果,以及具有统一标准的标准客户目标评估数据,从而支持信贷模型的构建和应用。
优选地,步骤S33中的关联分析算法具体为:
;
其中,为验证数据集,为外部清洗数据中的用户群体个数,为第个群体中客户的个数,表示第个群体中第个客户的特征向量,表示第个群体的中心。
本发明利用一种关联分析算法,该算法基于欧氏距离的平方和计算了特征向量与群体中心之间的距离,该距离度量的原理是通过比较群体内部客户之间的特征相似性和不同群体之间的特征差异性,目标函数的最小化目标是使群体内部客户的特征向量尽可能接近群体中心,同时不同群体之间的特征向量尽可能远离,实现对特征的匹配和筛选,生成具有较高相似性的信贷特征选择数据,该算法中利用第个群体的中心,即所有客户特征向量的平均值,并且考虑了外部清洗数据中的用户群体个数、第个群体中客户的个数以及第个群体中第个客户的特征向量,通过利用函数关系;对特征进行匹配和距离度量,筛选出具有高相似性的信贷特征选择数据,获取验证数据集,对于验证数据集,它的含义为对于每个群体,它的内部客户的特征向量与群体中心的距离越小,说明它们在特征上越相似,而不同群体之间的距离越大,说明它们在特征上越不相似。
优选地,步骤S4的具体步骤为:
步骤S41:基于标准目标客户评估数据利用数据画像技术进行信贷客户筛选,生成信贷产品服务筛选数据集;
步骤S42:基于信贷产品服务筛选数据集利用聚类分析进行相似客户聚类,生成信贷客户聚类数据集;
步骤S43:基于信贷客户聚类数据集预测客户潜在需求,生成信贷潜在需求数据集;
步骤S44:基于信贷潜在需求数据集进行客户信贷产品服务推送,生成信贷产品服务推送数据集;
步骤S45:基于信贷产品服务推送数据集利用服务监测进行客户信贷产品服务反馈收集,生成信贷产品服务反馈数据集;
步骤S46:基于信贷产品服务反馈数据集利用回归分析进行统计信贷产品服务反馈,生成反馈数据。
本发明通过利用数据画像技术基于标准客户目标评估数据进行信贷客户筛选,能够根据客户的特征和行为模式识别和筛选出符合特定信贷需求的客户,有助于生成信贷产品服务筛选数据集,为后续的客户分类和个性化服务提供更精确和有效的数据基础,通过利用聚类分析基于信贷产品服务筛选数据集进行相似客户聚类,能够将具有相似特征和需求的客户划分为不同的群组,有助于生成信贷客户聚类数据集,为客户群体的分析和定制化服务提供更细致和精准的数据基础,通过基于信贷客户聚类数据集预测客户潜在需求,能够预测客户未来的信贷需求和行为,助于生成信贷潜在需求数据集,为精准营销和个性化推荐提供针对性和前瞻性。
优选地,步骤S5的具体步骤为:
步骤S51:基于反馈数据利用服务评估公式进行统计分析,生成优化分析数据;
步骤S52:基于优化分析数据进行标准客户目标评估数据参数调整,生成信贷模型参数数据;
步骤S53:根据标准客户目标评估数据进行模型神经元建立,生成模型神经元数据;
步骤S54:根据反馈数据对模型神经元数据进行线性加权,生成权重神经元数据;
步骤S55:对权重神经元数据进行softmax激活函数设置处理,生成激活神经元数据;
步骤S56:择取激活神经元数据作为画像信贷推送模型输入层数据,基于画像信贷推送模型输入层数据利用Adam优化进行数据循环网络模型建立,生成画像信贷推送模型;
步骤S57:择取信贷模型参数数据作为推送模型输入层数据,基于推送模型输入层数据以及画像信贷推送模型进行信贷产品服务预测,生成信贷产品服务预测数据,生成客群画像行为分析方法。
本发明通过基于反馈数据利用服务评估公式进行统计分析,能够对信贷产品服务的效果进行量化评估和分析,有助于生成优化分析数据,提供客观的服务评估结果和改进建议,为信贷产品服务的优化和决策提供有益的数据支持,通过基于优化分析数据进行标准客户目标评估数据参数调整,能够优化信贷模型的参数设置和调整,有助于生成信贷模型参数数据,提高信贷模型的预测准确性和性能,增强模型的可靠性和适应性,通过根据标准客户目标评估数据进行模型神经元建立,能够构建适应信贷特征的信贷模型参数数据,有助于生成信贷模型参数数据,为信贷模型的构建和训练提供具有相关性和准确性的数据基础,提高模型的表现力和预测能力,通过根据反馈数据对模型神经元数据进行线性加权,能够调整和加权模型中的神经元数据,有助于生成权重神经元数据,优化模型中不同神经元的重要性和影响力,提高模型的灵活性和适应性,通过对权重神经元数据进行softmax激活函数设置处理,能够对权重神经元进行非线性的激活和调整,有助于生成激活神经元数据,提高模型的非线性表达能力和适应性,增强模型的预测和推断能力,通过择取激活神经元数据作为模型输入层数据,利用Adam优化进行数据循环网络模型建立,能够构建具有循环和反馈机制的画像信贷推送模型,这有助于生成画像信贷推送模型,提供个性化的信贷产品服务推荐和决策支持,增强客户体验和满意度,通过择取信贷模型参数数据作为模型输入层数据,进行信贷产品服务预测,能够利用建立的模型对信贷产品服务进行预测和分析,生成客群画像行为分析方法,提供对客户群体行为的分析和预测,为信贷产品服务的个性化推荐和决策提供有益的数据支持。
优选地,步骤S51中的服务评估公式具体为:
;
其中,为优化分析数据,为标准客户目标评估数据的用户特征数据数量,CRu为客户信用等级变化,为客户信用等级变化的差值,Tu为客户被服务的总时间,为客户收益率,为客户反馈评价等级,为自然指数函数,为服务效率数据,为客户信用额度表征数据,为用户价值数据,为信贷产品服务的总业务时间,为最近一次客户服务期间的延迟时间,为客户服务总延迟时间。
本发明利用一种服务评估公式,该公式考虑了多个因素,如客户信用等级变化、客户的总服务时间、收益率、消费价值、忠诚度、关注程度以及服务延迟时间,通过计算这些因素的综合得分,可以得到优化分析数据,用于衡量信贷产品服务的质量和效果,公式中的各个项表示不同的服务评估因素,它们在整个公式中的权重和组合关系构成了函数关系,具体来说,公式中的第一项;表示客户信用等级变化与总服务时间的比值的累加和,用于衡量信用等级变化的影响,第二项表示客户的收益率与客户反馈评价等级的比值,用于衡量收益率对服务评估的影响,第三项;为消费价值范围内用于衡量消费价值的影响的数据,第四项表示客户服务期间的延迟时间与总延迟时间的比值,用于衡量延迟时间对服务评估的影响,公式通过利用标准客户目标评估数据的用户特征数据数量、客户信用等级变化CRu、客户信用等级变化的差值、客户被服务的总时间Tu、客户收益率、客户反馈评价等级、服务效率数据、客户信用额度表征数据、用户价值数据、信贷产品服务的总业务时间、最近一次客户服务期间的延迟时间、客户服务总延迟时间通过不同的加权和组合关系,构成了整个服务评估公式,计算各项的值并进行加和,可以得到最终的服务评估得分用于评估信贷产品服务的质量和效果。
本发明还提供了一种基于客群画像行为分析系统,包括:
信贷用户画像原始数据采集模块,用于获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行金融企业仓库数据访问,生成金融企业仓库数据;基于金融企业仓库数据进行数据集中,生成客群筛选集中数据集;基于客群筛选集中数据集利用K-means聚类分析进行数据样本分组,生成客群强相关数据;基于客群强相关数据进行定量信息定性化处理,生成信贷用户画像原始数据;
模型特征预处理数据准备模块,用于基于信贷用户画像原始数据利用客户决策树算法进行画像节点数据权重分配,生成用户画像权重分配数据,基于用户画像权重分配数据进行应用场景划分,生成应用场景数据,基于应用场景数据进行目标客户数据筛选处理,生成目标客户行为数据;
标准客户目标评估数据构建模块,用于获取大数据管理平台访问权限,基于大数据管理平台访问权限进行用户信息数据获取,生成用户信息数据,基于目标客户行为数据以及用户信息数据进行数据匹配验证,生成目标客户关联数据,基于目标客户关联数据进行数据标准化处理,生成标准目标客户评估数据;
反馈数据收集模块,用于基于标准目标客户评估数据利用数据画像技术进行客户信贷产品服务推送,生成信贷产品服务反馈数据集,基于信贷产品服务反馈数据集利用回归分析进行统计信贷产品服务反馈,生成反馈数据;
信贷产品服务预测模块,用于基于反馈数据利用服务评估公式进行标准客户目标评估数据参数调整,生成信贷模型参数数据,基于信贷模型参数数据进行画像信贷推送模型构建,生成画像信贷推送模型,基于画像信贷推送模型进行信贷产品服务预测,实现客群画像的行为分析。
本发明提供一种基于客群画像的行为分析系统,该系统能够实现本发明所述任意一种基于客群画像的行为分析方法,实现数据的获取、运算、生成,通过权限数据进行数据获取及处理,生成信贷用户画像原始数据,并对其中的图文信息按照已设计的指令顺序进行操作,生成预处理图文信息,再通过预处理图文信息进行反馈数据收集,生成反馈数据,根据反馈数据进行信贷产品服务预测,实现客群画像的行为分析,系统内部遵循设定的指令集完成方法运行步骤,推动完成基于客群画像的行为分析方法。
本发明提出了一种基于客群画像的行为分析方法,通过综合应用多学科多类型模型,解决了传统银行客群画像的行为分析中数据分析效率低、信息提取不准确的问题,实现了高效率、高准确性的基于客群画像的行为分析方法。
附图说明
图1为本发明一种基于客群画像行为分析方法的步骤流程示意图;
图2为步骤S1的详细实施步骤流程示意图;
图3为步骤S2的详细实施步骤流程示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于客群画像行为分析方法及系统。所述基于客群画像行为分析方法及系统的执行主体包括但不限于搭载该系统的:机械设备、数据处理平台、云服务器节点、网络传输设备等可看作本申请的通用计算节点。所述数据处理平台包括但不限于:音频管理系统、图像管理系统、信息管理系统至少一种。
请参阅图1至图3,本发明提供了一种基于客群画像行为分析方法,所述方法包括以下步骤:
步骤S1:获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行金融企业仓库数据访问,生成金融企业仓库数据,基于金融企业仓库数据进行数据集中,生成客群筛选集中数据集,基于客群筛选集中数据集利用K-means聚类分析进行数据样本分组,生成客群强相关数据,基于客群强相关数据进行定量信息定性化处理,生成信贷用户画像原始数据;
步骤S2:基于信贷用户画像原始数据利用客户决策树算法进行画像节点数据权重分配,生成用户画像权重分配数据,基于用户画像权重分配数据进行应用场景划分,生成应用场景数据,基于应用场景数据进行目标客户数据筛选处理,生成目标客户行为数据;
步骤S3:获取大数据管理平台访问权限,基于大数据管理平台访问权限进行用户信息数据获取,生成用户信息数据,基于目标客户行为数据以及用户信息数据进行数据匹配验证,生成目标客户关联数据,基于目标客户关联数据进行数据标准化处理,生成标准目标客户评估数据;
步骤S4:基于利用数据画像技术进行客户信贷产品服务推送,生成信贷产品服务反馈数据集,基于信贷产品服务反馈数据集利用回归分析进行统计信贷产品服务反馈,生成反馈数据;
标准客户目标评估数据标准客户目标评估数据步骤S5:基于反馈数据利用服务评估公式进行标准客户目标评估数据参数调整,生成信贷模型参数数据,基于信贷模型参数数据进行画像信贷推送模型构建,生成画像信贷推送模型,基于画像信贷推送模型进行信贷产品服务预测,实现客群画像的行为分析。
本发明提供了一种基于客群画像的行为分析方法,该方法通过访问金融企业数据仓库和应用数据分析技术,该系统能够获取和处理金融企业的数据,生成信贷用户画像原始数据。同时,通过数据集中、聚类分析、主成分分析等方法,能够从原始数据中提取出客群的强相关数据和定性主成分数据,为后续的信贷用户画像和预测分析提供基础数据。这些步骤的有益效果在于能够从海量金融数据中提取出关键信息,形成具有代表性和有价值的信贷用户画像原始数据,通过应用客户决策树算法和协同过滤算法,系统能够构建用户画像权重分配数据和业务场景数据,并进行特征提取和转换,生成业务特征工程数据。这些步骤的有益效果在于能够根据客户的特征和行为数据,构建客户决策树和业务场景数据,为信贷用户的个性化定制和精准推送提供基础,同时,通过特征工程的处理,能够对数据进行优化和降维,提高后续模型的建模效果和运行效率,通过应用大数据管理平台和关联分析算法,系统能够获取用户信息数据,进行数据预处理和清洗操作,生成外部清洗数据。同时,通过关联分析和嵌入方法,能够进行特征匹配和评估筛选,生成信贷特征选择数据。这些步骤的有益效果在于能够对原始数据进行清洗和预处理,去除噪声和冗余信息,提取出与信贷模型相关的特征数据,为建立高效的信贷模型提供输入数据,通过应用数据画像技术和回归分析,系统能够进行信贷客户筛选、聚类分析和潜在需求预测,生成信贷产品服务推送数据集和信贷产品服务反馈数据集。这些步骤的有益效果在于能够根据客户画像和行为分析结果,精准地筛选目标客户并预测其潜在需求,以及通过推送服务和收集反馈数据,实现对信贷产品服务的持续优化和改进,通过应用服务评估公式和循环神经网络模型,系统能够对信贷产品服务进行统计分析和优化,生成优化分析数据和画像信贷推送模型。这些步骤的有益效果在于能够基于反馈数据对信贷产品服务进行评估和优化,调整模型参数和神经网络结构,建立画像信贷推送模型,并通过预测和分析实现对客群行为的深入理解和精准预测,从金融企业数据中提取关键信息并构建客户画像,通过数据分析和模型预测实现对客群行为的分析和个性化服务的提供,从而提高信贷业务的效率和用户满意度。
本发明实施例中,请参考图1,所述基于客群画像的行为分析方法包括以下步骤:
步骤S1:获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行金融企业仓库数据访问,生成金融企业仓库数据,基于金融企业仓库数据进行数据集中,生成客群筛选集中数据集,基于客群筛选集中数据集利用K-means聚类分析进行数据样本分组,生成客群强相关数据,基于客群强相关数据进行定量信息定性化处理,生成信贷用户画像原始数据;
在本发明实施例中,例如通过建立授权机制,获得对金融企业数据仓库的访问权限,并通过数据查询、提取等操作,从数据仓库中获取所需的金融企业数据,将金融企业数据转化为一致的格式和结构,通过应用线性回归分析技术,对金融企业仓库数据进行数据集中操作,识别与客群筛选相关的数据集,通过建立统计模型和进行回归计算,可以对数据进行集中,筛选出与目标客群相关的数据集,利用K-means聚类分析方法对客群筛选集中数据集进行样本分组,将数据样本划分为具有相似特征的客群,通过测量数据之间的相似性,并将数据样本聚集成多个客群,将原始数据转化为更具代表性和可解释性的定性特征矩阵,对定性特征矩阵进行中心化处理,生成经过中心化处理的定性中心化数据,对定性中心化数据进行协方差计算,衡量不同特征之间的相关性,通过计算每对特征之间的协方差,可以得到一个对称的协方差矩阵,其中每个元素表示两个特征之间的相关程度,对定性协方差矩阵进行特征值分解生成定性主成分数据,其中每个主成分代表原始数据中的一个重要特征,将定性主成分数据与其他定量信息进行结合,生成更全面的信贷用户画像原始数据,通过整合定性主成分数据和其他用户信息,生成用于信贷分析和决策的信贷用户画像原始数据。
步骤S2:基于信贷用户画像原始数据利用客户决策树算法进行画像节点数据权重分配,生成用户画像权重分配数据,基于用户画像权重分配数据进行应用场景划分,生成应用场景数据,基于应用场景数据进行目标客户数据筛选处理,生成目标客户行为数据;
本发明实施例中,例如在客户决策树算法中,可以将用户画像原始数据中的各种特征作为输入,将原始的业务场景数据转化为更具有表达力和可分析性的业务特征工程数据,这些业务特征工程数据可以包括经过处理和转换的各种业务指标、统计数据或其他关键特征,用于后续的回归计算和分析,根据客户决策树算法能够对信贷用户画像原始数据中每个相关数据类别分类权重,例如银行评估用户行为的交易次数、交易金额较重要,则分配更高的权重,生成用户画像权重分配数据,根据用户画像权重分配数据预测或推断出的与目标业务相关的数据,基于邻近业务特征工程数据根据特定的筛选条件或规则从邻近业务特征工程数据中选取与目标客户相关的数据,这样生成的目标客户行为数据据可以包括经过筛选和预处理的客户数据,即目标客户的相关信息,用于后续的模型训练和预测分析。
步骤S3:获取大数据管理平台访问权限,基于大数据管理平台访问权限进行用户信息数据获取,生成用户信息数据,基于目标客户行为数据以及用户信息数据进行数据匹配验证,生成目标客户关联数据,基于目标客户关联数据进行数据标准化处理,生成标准目标客户评估数据;
本发明实施例中,例如通过获得合法的访问权限,可以连接到大数据管理平台,并从该平台获取包含用户信息的数据,这些用户信息可以包括个人或企业的基本信息、财务数据、信用历史,通过这一步骤,建立起一个包含丰富用户信息的数据集,在数据预处理过程中,可以对目标客户行为数据和用户信息数据进行清洗、去重、缺失值处理、异常值检测和修正等操作,例如用户信息数据对目标客户行为数据进行补充,目标客户行为数据对用户信息数据进行筛选,从而生成目标客户关联数据,其中包含了经过关联分析匹配的特征组合,这些特征组合可以用于后续的信贷模型验证和评估,使用Embedded方法可以生成目标客户评估数据,其中包含了经过筛选和评估的关键特征,这些特征可用于构建信贷模型,通过数值标准化方法(如Z-score标准化或Min-Max标准化),对目标客户评估数据进行归一化处理,将特征数据转化为具有统一尺度和范围的数值,生成标准客户目标评估数据,用于后续的模型训练和预测分析。
步骤S4:基于利用数据画像技术进行客户信贷产品服务推送,生成信贷产品服务反馈数据集,基于信贷产品服务反馈数据集利用回归分析进行统计信贷产品服务反馈,生成反馈数据;
本发明实施例中,例如使用数据画像技术,将标准客户目标评估数据与客户画像相结合,通过分析客户的个人特征、消费行为、偏好等信息,对客户进行筛选,识别出符合特定条件的潜在信贷客户,并生成信贷产品服务筛选数据集,使用聚类分析算法,对信贷产品服务筛选数据集中的客户进行相似性分析和聚类,生成信贷客户聚类数据集,其中包含了不同群体的相似客户,通过对信贷客户聚类数据集中的客户进行需求分析和预测,识别出不同客户群体的潜在需求,这些潜在需求可以包括购买力、贷款偏好、消费习惯等方面的信息。通过这一步骤,可以生成信贷潜在需求数据集,为后续的客户服务提供参考,根据信贷潜在需求数据集中的客户需求信息,可以针对不同的客户群体推送相应的信贷产品和服务,这些推送信息可以包括贷款产品、利率优惠、信用卡限额提升等,通过这一步骤,可以生成信贷产品服务推送数据集,用于向客户提供个性化的信贷产品推荐,对于向客户推送的信贷产品服务,可以设置服务监测机制,收集客户的反馈信息,使用回归分析方法,对信贷产品服务反馈数据集中的反馈信息进行统计分析,可以得出客户对信贷产品服务的整体评价和相关因素的影响程度,生成反馈数据,为信贷产品服务提供量化的评估和改进依据。
步骤S5:基于反馈数据利用服务评估公式进行标准客户目标评估数据参数调整,生成信贷模型参数数据,基于信贷模型参数数据进行画像信贷推送模型构建,生成画像信贷推送模型,基于画像信贷推送模型进行信贷产品服务预测,实现客群画像的行为分析。
本发明实施例中,例如通过收集客户的反馈数据,并利用特定的服务评估公式,对信贷产品服务的质量、效果等进行统计分析,生成优化分析数据,用于评估和改进信贷产品服务的效果和表现,根据优化分析数据的结果,可以对信贷模型的特征数据参数进行调整,这些参数可以包括模型权重、学习率等,生成经过调整的信贷模型参数数据,以提高模型的准确性和性能,基于信贷模型的特征数据,可以构建相应的模型神经元网络结构。这些神经元可以表示不同的特征变量或模型输入,生成信贷模型参数数据,为后续的模型构建和训练提供基础,根据反馈数据的重要性和影响程度,对模型神经元数据进行线性加权处理,赋予不同神经元的权重,生成权重神经元数据,为模型的训练和预测提供调整后的输入,对权重神经元数据应用softmax激活函数,以将神经元的权重值转化为概率分布,生成激活神经元数据,用于模型的进一步处理和分析,从激活神经元数据中选择适当的数据作为模型的输入层数据,利用Adam优化算法进行数据循环网络模型的建立和训练,生成画像信贷推送模型,用于预测客户的信贷需求和行为分析,选择经过调整的信贷模型参数数据作为模型的输入层数据,并利用该模型进行信贷产品服务的预测,生成预测数据,从而实现客群画像的行为分析。
本发明实施例中,请参阅图2,所述步骤S1的详细实施步骤包括:
步骤S11:获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行金融企业仓库数据访问,生成金融企业仓库访问数据;
步骤S12:基于金融企业仓库访问数据进行数据格式化处理,生成金融企业仓库数据;
步骤S13:基于金融企业仓库数据利用线性回归分析进行数据集中,生成客群筛选集中数据集;
步骤S14:基于客群筛选集中数据集利用K-means聚类分析进行数据样本分组,生成客群强相关数据;
步骤S15:基于客群强相关数据利用PCA技术构建特征矩阵,生成定性特征矩阵;
步骤S16:基于定性特征矩阵进行中心化处理,生成定性中心化数据;
步骤S17:基于定性中心化数据进行协方差计算,生成定性协方差矩阵;
步骤S18:基于定性协方差矩阵进行特征值分解,生成定性主成分数据;
步骤S19:基于定性主成分数据进行定量信息定性化,生成信贷用户画像原始数据。
本发明首先通过获取金融企业数据仓库访问权限,实现对金融企业数据仓库的访问,通过对金融企业仓库访问数据进行格式化处理,能够使数据呈现一致的格式和结构,通过利用线性回归分析对金融企业仓库数据进行数据集中,能够识别和捕捉数据中的潜在关联关系,生成的客群筛选集中数据集能够提供更准确和全面的数据视角,有助于揭示数据中的隐藏模式和趋势,通过使用K-means聚类分析对客群筛选集中数据集进行数据样本分组,能够将数据划分为具有相似特征和属性的子群,发现客群之间的相似性和差异性,从而生成客群强相关数据,为后续的客群分析和个性化推荐提供更精细化的数据基础,通过使用PCA技术构建特征矩阵,能够提取数据中的主要特征和信息,这有助于降低数据的维度,并捕捉数据中的重要变化模式,从而生成定性特征矩阵,为后续的数据分析和建模提供更简化和有效的数据表示,通过对定性特征矩阵进行中心化处理,能够消除数据中的平均值偏差,减少数据的冗余性,提高数据的稳定性和一致性,生成定性中心化数据,为后续的统计分析和模型构建提供更可靠的数据基础,通过对定性中心化数据进行协方差计算,能够衡量数据中变量之间的相关性,识别和分析数据中的相关模式和趋势,生成定性协方差矩阵,为后续的因子分析和模式识别提供更深入的数据基础,通过对定性协方差矩阵进行特征值分解,能够确定数据中的主要成分,识别和提取数据中的主要特征和变化模式,生成定性主成分数据,通过对定性主成分数据进行定量信息定性化,能够将定性数据转化为具有定量含义的数据,这有助于更好地理解和解释数据中的定性信息,生成信贷用户画像原始数据,为后续的用户分析和个性化推荐提供更具有实际意义的数据基础。
本发明实施例中,例如通过建立授权机制,获得对金融企业数据仓库的访问权限,并通过数据查询、提取等操作,从数据仓库中获取所需的金融企业数据,对从金融企业数据仓库中获取的原始数据进行清洗、转换和整理等处理操作,将数据转化为一致的格式和结构,通过应用线性回归分析技术,对金融企业仓库数据进行数据集中操作,识别与客群筛选相关的数据集,通过建立统计模型和进行回归计算,可以对数据进行集中,筛选出与目标客群相关的数据集,利用K-means聚类分析方法对客群筛选集中数据集进行样本分组,将数据样本划分为具有相似特征的客群,通过测量数据之间的相似性,并将数据样本聚集成多个客群,可以生成具有强相关性的客群数据,应用主成分分析(PCA)技术对客群强相关数据进行特征提取和降维操作,构建特征矩阵,通过计算数据的协方差矩阵、提取主成分等步骤,可以生成定性特征矩阵,其中每个特征代表数据中的一个重要方面,通过这一步骤,可以将原始数据转化为更具代表性和可解释性的定性特征矩阵,对定性特征矩阵进行中心化处理,以使数据均值为0,通过减去每个特征的均值,可以使数据集中在原点附近,减少不同特征尺度带来的影响,通过这一步骤,可以生成经过中心化处理的定性中心化数据,为后续的分析和建模提供更稳定和可比较的数据基础,对定性中心化数据进行协方差计算,衡量不同特征之间的相关性,通过计算每对特征之间的协方差,可以得到一个对称的协方差矩阵,其中每个元素表示两个特征之间的相关程度,对定性协方差矩阵进行特征值分解,得到特征值和对应的特征向量,通过排序特征值,可以确定主成分的重要程度,并选择具有最大特征值的特征向量作为定性主成分数据,通过这一步骤,可以生成定性主成分数据,其中每个主成分代表原始数据中的一个重要特征,将定性主成分数据与其他定量信息进行结合,生成更全面的信贷用户画像原始数据,通过整合定性主成分数据和其他用户信息,可以形成完整的用户画像,包括客户的特征、行为和偏好等方面的信息,生成用于信贷分析和决策的信贷用户画像原始数据。
本发明实施例中,请参阅图3,所述步骤S2的详细实施步骤包括:
步骤S21:基于信贷用户画像原始数据利用客户决策树算法进行画像节点数据权重分配,生成用户画像权重分配数据;
步骤S22:基于用户画像权重分配数据利用协同过滤算法进行应用场景划分,生成应用场景数据;
步骤S23:基于应用场景数据进行业务场景数据特征提取及转换,生成应用场景特征数据;
步骤S24:基于应用场景特征数据进行回归计算,生成邻近场景特征数据;
步骤S25:基于邻近场景特征数据进行目标客户数据筛选处理,生成目标客户行为数据。
本发明通过将产品手册文本进行分词,将文本拆分成独立的词语单元,形成一个产品分词序列,对产品手册的内容进行细粒度的处理和分析,为后续的操作提供了更具体和可操作的数据基础,通过对产品分词序列进行停用词去除处理,去除那些在文本分析中不具有实际含义或无关紧要的常用词汇,从而得到更具代表性和有效性的典型产品分词序列,通过对典型产品分词序列进行词性标注,将每个词语与其对应的词性进行关联,从而获得更多关于词语语义和用法的信息,为后续的语义分析和处理提供更准确的基础,通过利用实体识别工具对词性标注分词序列进行处理,识别出文本中的实体信息,例如人名、地名、日期等。这样可以将产品手册中的重要实体信息提取出来,用于后续的问题回答和信息提供,通过获取产品手册文档的提取格式,并根据预设的代码指令集进行相应的数据提取操作,从产品手册中提取出与问答相关的数据,并将其整理成键值对的形式,以便于后续的问答处理和数据存储,通过获取产品手册文档的提取格式,并根据预设的代码指令集进行相应的数据提取操作,从产品手册中提取出与问答相关的数据,并将其整理成键值对的形式,以便于后续的问答处理和数据存储,通过利用语法分析工具对业务流程数据进行处理,识别出文本中的语法结构和关联关系,形成一个流程语法结构,这样可以更好地理解和分析业务流程,为后续的流程关键字提取和文本分类提供更准确的基础,通过运用关键字提取算法,从流程语法结构中提取出与业务流程相关的关键字,这样可以识别出业务流程中的重要步骤、关键词汇,为后续的流程分析和文本分类提供更有价值的信息,通过应用文本分类算法,对业务流程数据进行分类,将其归类到不同的流程类别中,这样可以根据业务流程的性质和特点,将文本进行整理和归纳,方便用户查询和理解,通过将分类流程文本和产品问答回复键值对存储到数据库中,形成问答回复数据的存储结构,这样可以快速检索和获取与用户问题相匹配的问答内容,提供准确和实用的产品问答服务。
本发明实施例中,例如在客户决策树算法中,可以将信贷用户画像原始数据中的各种特征作为输入,通过决策树的分裂规则和节点划分策略,对于信贷用户画像原始数据中的每一个节点数据分配相应权重,也就是用户借贷过程中,每个指标分配相应权重,生成的用户画像权重分配数据可以包括各个用户的交易行为标签类别或属性信息,用于对用户进行分类和区分。使用协同过滤算法可以分析不同用户之间的相似性和关联性,根据用户的用户画像权重分配数据进行推荐和定制化服务,通过将用户的基础标签与其他用户的标签进行比较和匹配,可以生成针对不同用户的业务场景数据,包括推荐产品、个性化服务或特定业务需求等,通过对应用场景数据进行特征提取和转换,可以将原始的应用场景数据转化为更具有表达力和可分析性的应用场景特征数据,这些应用场景特征数据可以包括经过处理和转换的各种业务指标、统计数据或其他关键特征,用于后续的回归计算和分析,基于业务特征工程数据进行回归计算,生成邻近场景特征数据,例如,可以利用回归分析方法,基于业务特征工程数据建立回归模型,并对目标变量进行预测或推断,通过回归计算,可以生成邻近场景特征数据,即根据应用场景特征数据预测或推断出的与目标业务相关的数据。基于邻近场景特征数据进行目标客户数据筛选处理,生成模目标客户行为数据,例如,根据邻近业务特征工程数据可以进行目标客户的筛选和识别,即根据特定的筛选条件或规则从邻近业务特征工程数据中选取与目标客户相关的数据,这样生成的模型特征预处理数据可以包括经过筛选和预处理的客户数据,用于后续的模型训练和预测分析。
本发明实施例中,步骤S21中的客户决策树算法具体为:
;
;
其中,为用户画像权重分配数据,为信贷用户画像原始数据,为客户决策树中的节点数量,为客户决策树中第个节点的节点权重,为节点决策函数,为数据收缩系数,为客户决策树中第个节点的节点阈值,为信贷用户画像原始数据中第个画像偏差值数据。
本发明利用一种客户决策树算法,该算法通过一系列决策树节点的决策函数构建用户画像权重分配数据,每个节点都有自己的权重、特征阈值和决策函数,用于对输入数据进行判断和分类,节点权重、特征阈值和决策函数的选择和调整是基于对数据特征的分析和理解,以及对数据分类的目标和要求进行最优化,该公式通过对信贷用户画像原始数据的输入,根据节点的特征值进行判断,根据节点决策函数的输出(0或1)来决定最终的用户画像权重分配数据,该公式首先利用决策树中第个节点的节点权重、节点决策函数以及数据收缩系数根据潜在关系构建函数;对于节点决策函数通过利用信贷用户画像原始数据中第个画像偏差值数据、决策树中第个节点的节点权重与决策树中第个节点的节点阈值进行阈值比对,当;时,取值为1,当;时,取值为0,该公式通过对决策树中的节点权重、特征阈值和决策函数的选择和调整,旨在根据不同特征的重要性和条件判断,最大程度地拟合数据并实现有效的分类和预测。
本发明实施例中,步骤S3的具体步骤为:
步骤S31:获取大数据管理平台访问权限,基于大数据管理平台访问权限进行用户信息数据获取,生成用户信息数据;
步骤S32:基于目标客户行为数据以及用户信息数据进行数据预处理与清洗操作,生成目标客户清洗数据;
步骤S33:基于目标客户关联数据利用关联分析算法进行特征匹配,生成目标客户关联数据;
步骤S34:基于验证数据集利用Embedded方法进行特征评估与筛选,生成目标客户评估数据;
步骤S35:基于目标客户评估数据进行数值标准化,生成标准目标客户评估数据。
本发明通过获取大数据管理平台访问权限,能够实现对大数据管理平台的访问,通过基于模型特征预处理数据以及用户信息数据进行数据预处理与清洗操作,能够使数据达到可用的状态,去除数据中的噪声、错误和重复项,生成外部清洗数据,提高数据的准确性和可信度,通过利用关联分析算法基于外部清洗数据进行特征匹配,能够识别和捕捉数据中的特征之间的关联关系,通过利用Embedded方法基于验证数据集进行特征评估与筛选,能够确定和选择对信贷模型建立具有重要影响的特征,生成信贷特征选择数据,为模型构建和训练提供更关键和有意义的特征信息,提高模型的预测准确性和解释能力,通过基于信贷特征选择数据进行数值标准化,能够将不同尺度和范围的数据转化为统一的标准值,消除不同特征之间的量纲差异,提高数据的可比性和模型训练的稳定性,生成标准客户目标评估数据,为后续的模型构建和评估提供更可靠和一致的数据基础,提供有效的大数据访问权限、清洗和预处理后的高质量数据、全面和准确的验证数据集、关键特征的评估和筛选结果,以及具有统一标准的标准客户目标评估数据,从而支持信贷模型的构建和应用。
本发明实施例中,例如通过获得合法的访问权限,可以连接到大数据管理平台,并从该平台获取包含用户信息的数据,这些用户信息可以包括个人或企业的基本信息、财务数据、信用历史,通过这一步骤,建立起一个包含丰富用户信息的数据集,在数据预处理过程中,可以对模型特征预处理数据和用户信息数据进行清洗、去重、缺失值处理、异常值检测和修正等操作,这些预处理和清洗的步骤旨在确保数据的准确性、一致性和完整性,例如用户信息数据对目标客户行为数据进行补充,目标客户行为数据对用户信息数据进行筛选,从而生成目标客户清洗数据,使用关联分析算法,可以分析目标客户清洗数据中的特征之间的关联关系,并发现特征之间的频繁项集或关联规,生成目标客户关联数据,其中包含了经过关联分析匹配的特征组合,这些特征组合可以用于后续的信贷模型验证和评估,使用Embedded方法,可以对目标客户关联数据中的特征进行评估和筛选,选择最具有预测能力和相关性的特征,生成目标客户评估数据,其中包含了经过筛选和评估的关键特征,这些特征可用于构建信贷模型。通过数值标准化方法(如Z-score标准化或Min-Max标准化),可以对目标客户评估数据进行归一化处理,将特征数据转化为具有统一尺度和范围的数值,生成标准客户目标评估数据,用于后续的模型训练和预测分析。
优选地,步骤S33中的关联分析算法具体为:
其中,为验证数据集,为外部清洗数据中的用户群体个数,为第个群体中客户的个数,表示第个群体中第个客户的特征向量,表示第个群体的中心。
本发明利用一种关联分析算法,该算法基于欧氏距离的平方和计算了特征向量与群体中心之间的距离,该距离度量的原理是通过比较群体内部客户之间的特征相似性和不同群体之间的特征差异性,目标函数的最小化目标是使群体内部客户的特征向量尽可能接近群体中心,同时不同群体之间的特征向量尽可能远离,实现对特征的匹配和筛选,生成具有较高相似性的信贷特征选择数据,该算法中利用第个群体的中心,即所有客户特征向量的平均值,并且考虑了外部清洗数据中的用户群体个数、第个群体中客户的个数以及第个群体中第个客户的特征向量,通过利用函数关系对特征进行匹配和距离度量,筛选出具有高相似性的信贷特征选择数据,获取验证数据集,对于验证数据集,它的含义为对于每个群体,它的内部客户的特征向量与群体中心的距离越小,说明它们在特征上越相似,而不同群体之间的距离越大,说明它们在特征上越不相似。
本发明实施例中,步骤S4的具体步骤为:
步骤S41:基于标准客户目标评估数据利用数据画像技术进行信贷客户筛选,生成信贷产品服务筛选数据集;
步骤S42:基于信贷产品服务筛选数据集利用聚类分析进行相似客户聚类,生成信贷客户聚类数据集;
步骤S43:基于信贷客户聚类数据集预测客户潜在需求,生成信贷潜在需求数据集;
步骤S44:基于信贷潜在需求数据集进行客户信贷产品服务推送,生成信贷产品服务推送数据集;
步骤S45:基于信贷产品服务推送数据集利用服务监测进行客户信贷产品服务反馈收集,生成信贷产品服务反馈数据集;
步骤S46:基于信贷产品服务反馈数据集利用回归分析进行统计信贷产品服务反馈,生成反馈数据。
本发明通过利用数据画像技术基于标准客户目标评估数据进行信贷客户筛选,能够根据客户的特征和行为模式识别和筛选出符合特定信贷需求的客户,有助于生成信贷产品服务筛选数据集,为后续的客户分类和个性化服务提供更精确和有效的数据基础,通过利用聚类分析基于信贷产品服务筛选数据集进行相似客户聚类,能够将具有相似特征和需求的客户划分为不同的群组,有助于生成信贷客户聚类数据集,为客户群体的分析和定制化服务提供更细致和精准的数据基础,通过基于信贷客户聚类数据集预测客户潜在需求,能够预测客户未来的信贷需求和行为,助于生成信贷潜在需求数据集,为精准营销和个性化推荐提供针对性和前瞻性。
本发明实施例中,例如使用数据画像技术,可以将标准客户目标评估数据与客户画像相结合,通过分析客户的个人特征、消费行为、偏好等信息,对客户进行筛选,识别出符合特定条件的潜在信贷客户,并生成信贷产品服务筛选数据集,使用聚类分析算法,对信贷产品服务筛选数据集中的客户进行相似性分析和聚类,将具有相似特征和行为模式的客户归为一类,通过这一步骤,可以生成信贷客户聚类数据集,其中包含了不同群体的相似客户,通过对信贷客户聚类数据集中的客户进行需求分析和预测,可以识别出不同客户群体的潜在需求,这些潜在需求可以包括购买力、贷款偏好、消费习惯等方面的信息。通过这一步骤,可以生成信贷潜在需求数据集,为后续的客户服务提供参考,根据信贷潜在需求数据集中的客户需求信息,可以针对不同的客户群体推送相应的信贷产品和服务,这些推送信息可以包括贷款产品、利率优惠、信用卡限额提升等,通过这一步骤,可以生成信贷产品服务推送数据集,用于向客户提供个性化的信贷产品推荐,对于向客户推送的信贷产品服务,可以设置服务监测机制,收集客户的反馈信息。这些反馈信息可以包括客户满意度、投诉意见、服务评价,生成信贷产品服务反馈数据集,用于分析和改进信贷产品服务质量,使用回归分析方法,对信贷产品服务反馈数据集中的反馈信息进行统计分析,可以得出客户对信贷产品服务的整体评价和相关因素的影响程度,生成反馈数据,为信贷产品服务提供量化的评估和改进依据。
本发明实施例中,步骤S5的具体步骤为:
步骤S51:基于反馈数据利用服务评估公式进行统计分析,生成优化分析数据;
步骤S52:基于优化分析数据进行标准客户目标评估数据参数调整,生成信贷模型参数数据;
步骤S53:根据标准客户目标评估数据进行模型神经元建立,生成模型神经元数据;
步骤S54:根据反馈数据对模型神经元数据进行线性加权,生成权重神经元数据;
步骤S55:对权重神经元数据进行softmax激活函数设置处理,生成激活神经元数据;
步骤S56:择取激活神经元数据作为画像信贷推送模型输入层数据,基于画像信贷推送模型输入层数据利用Adam优化进行数据循环网络模型建立,生成画像信贷推送模型;
步骤S57:择取信贷模型参数数据作为推送模型输入层数据,基于推送模型输入层数据以及画像信贷推送模型进行信贷产品服务预测,生成信贷产品服务预测数据,生成客群画像行为分析方法。
本发明通过基于反馈数据利用服务评估公式进行统计分析,能够对信贷产品服务的效果进行量化评估和分析,有助于生成优化分析数据,提供客观的服务评估结果和改进建议,为信贷产品服务的优化和决策提供有益的数据支持,通过基于优化分析数据进行标准客户目标评估数据参数调整,能够优化信贷模型的参数设置和调整,有助于生成信贷模型参数数据,提高信贷模型的预测准确性和性能,增强模型的可靠性和适应性,通过根据标准客户目标评估数据进行模型神经元建立,能够构建适应信贷特征的信贷模型参数数据,有助于生成信贷模型参数数据,为信贷模型的构建和训练提供具有相关性和准确性的数据基础,提高模型的表现力和预测能力,通过根据反馈数据对模型神经元数据进行线性加权,能够调整和加权模型中的神经元数据,有助于生成权重神经元数据,优化模型中不同神经元的重要性和影响力,提高模型的灵活性和适应性,通过对权重神经元数据进行softmax激活函数设置处理,能够对权重神经元进行非线性的激活和调整,有助于生成激活神经元数据,提高模型的非线性表达能力和适应性,增强模型的预测和推断能力,通过择取激活神经元数据作为模型输入层数据,利用Adam优化进行数据循环网络模型建立,能够构建具有循环和反馈机制的画像信贷推送模型,这有助于生成画像信贷推送模型,提供个性化的信贷产品服务推荐和决策支持,增强客户体验和满意度,通过择取信贷模型参数数据作为模型输入层数据,进行信贷产品服务预测,能够利用建立的模型对信贷产品服务进行预测和分析,生成客群画像行为分析方法,提供对客户群体行为的分析和预测,为信贷产品服务的个性化推荐和决策提供有益的数据支持。
本发明实施例中,例如通过收集客户的反馈数据,并利用特定的服务评估公式,对信贷产品服务的质量、效果等进行统计分析,生成优化分析数据,用于评估和改进信贷产品服务的效果和表现,根据优化分析数据的结果,可以对信贷模型的特征数据参数进行调整。这些参数可以包括模型权重、学习率等,生成经过调整的信贷模型参数数据,以提高模型的准确性和性能,基于信贷模型的特征数据,可以构建相应的模型神经元网络结构。这些神经元可以表示不同的特征变量或模型输入,生成信贷模型参数数据,为后续的模型构建和训练提供基础,根据反馈数据的重要性和影响程度,对模型神经元数据进行线性加权处理,赋予不同神经元的权重,以更好地捕捉反馈数据对模型的影响,通过这一步骤,可以生成权重神经元数据,为模型的训练和预测提供调整后的输入,对权重神经元数据应用softmax激活函数,以将神经元的权重值转化为概率分布,生成激活神经元数据,用于模型的进一步处理和分析,从激活神经元数据中选择适当的数据作为模型的输入层数据,利用Adam优化算法进行数据循环网络模型的建立和训练,生成画像信贷推送模型,用于预测客户的信贷需求和行为分析,选择经过调整的信贷模型参数数据作为模型的输入层数据,并利用该模型进行信贷产品服务的预测,生成客群画像行为分析方法,用于了解客户行为、需求以及信贷产品服务的推荐和优化。
本发明实施例中,步骤S51中的服务评估公式具体为:
;
其中,为优化分析数据,为标准客户目标评估数据的用户特征数据数量,CRu为客户信用等级变化,为客户信用等级变化的差值,Tu为客户被服务的总时间,为客户收益率,为客户反馈评价等级,为自然指数函数,为服务效率数据,为客户信用额度表征数据,为用户价值数据,为信贷产品服务的总业务时间,为最近一次客户服务期间的延迟时间,为客户服务总延迟时间。
本发明利用一种服务评估公式,该公式考虑了多个因素,如客户信用等级变化、客户的总服务时间、收益率、消费价值、忠诚度、关注程度以及服务延迟时间,通过计算这些因素的综合得分,可以得到优化分析数据,用于衡量信贷产品服务的质量和效果,公式中的各个项表示不同的服务评估因素,它们在整个公式中的权重和组合关系构成了函数关系,具体来说,公式中的第一项;表示客户信用等级变化与总服务时间的比值的累加和,用于衡量信用等级变化的影响,第二项表示客户的收益率与客户反馈评价等级的比值,用于衡量收益率对服务评估的影响,第三项;为消费价值范围内用于衡量消费价值的影响的数据,第四项表示客户服务期间的延迟时间与总延迟时间的比值,用于衡量延迟时间对服务评估的影响,公式通过利用标准客户目标评估数据的用户特征数据数量、客户信用等级变化CRu、客户信用等级变化的差值、客户被服务的总时间Tu、客户收益率、客户反馈评价等级、服务效率数据、客户信用额度表征数据、用户价值数据、信贷产品服务的总业务时间、最近一次客户服务期间的延迟时间、客户服务总延迟时间通过不同的加权和组合关系,构成了整个服务评估公式,计算各项的值并进行加和,可以得到最终的服务评估得分用于评估信贷产品服务的质量和效果。
在本说明书的一个实施例中,提供了一种基于客群画像的行为分析系统,包括:
信贷用户画像原始数据采集模块,用于获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行金融企业仓库数据访问,生成金融企业仓库数据;基于金融企业仓库数据进行数据集中,生成客群筛选集中数据集;基于客群筛选集中数据集利用K-means聚类分析进行数据样本分组,生成客群强相关数据;基于客群强相关数据进行定量信息定性化处理,生成信贷用户画像原始数据;
模型特征预处理数据准备模块,用于基于信贷用户画像原始数据利用客户决策树算法进行画像节点数据权重分配,生成用户画像权重分配数据,基于用户画像权重分配数据进行应用场景划分,生成应用场景数据,基于应用场景数据进行目标客户数据筛选处理,生成目标客户行为数据;
标准客户目标评估数据构建模块,用于获取大数据管理平台访问权限,基于大数据管理平台访问权限进行用户信息数据获取,生成用户信息数据,基于目标客户行为数据以及用户信息数据进行数据匹配验证,生成目标客户关联数据,基于目标客户关联数据进行数据标准化处理,生成标准目标客户评估数据;
反馈数据收集模块,用于基于标准目标客户评估数据利用数据画像技术进行客户信贷产品服务推送,生成信贷产品服务反馈数据集,基于信贷产品服务反馈数据集利用回归分析进行统计信贷产品服务反馈,生成反馈数据;
信贷产品服务预测模块,用于基于反馈数据利用服务评估公式进行标准客户目标评估数据参数调整,生成信贷模型参数数据,基于信贷模型参数数据进行画像信贷推送模型构建,生成画像信贷推送模型,基于画像信贷推送模型进行信贷产品服务预测,实现客群画像的行为分析。
本发明提供一种基于客群画像的行为分析系统,该系统能够实现本发明所述任意一种基于客群画像的行为分析方法,实现数据的获取、运算、生成,通过权限数据进行数据获取及处理,生成信贷用户画像原始数据,并对其中的图文信息按照已设计的指令顺序进行操作,生成预处理图文信息,再通过预处理图文信息进行反馈数据收集,生成反馈数据,根据反馈数据进行信贷产品服务预测,实现客群画像的行为分析,系统内部遵循设定的指令集完成方法运行步骤,推动完成基于客群画像的行为分析方法。
本发明提出了一种基于客群画像的行为分析方法,通过综合应用多学科多类型模型,解决了传统银行客群画像的行为分析中数据分析效率低、信息提取不准确的问题,实现了高效率、高准确性的基于客群画像的行为分析方法。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。
Claims (5)
1.一种基于客群画像的行为分析方法,其特征在于,包括以下步骤:
步骤S1:获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行金融企业仓库数据访问,生成金融企业仓库数据;基于金融企业仓库数据进行数据集中,生成客群筛选集中数据集;基于客群筛选集中数据集利用K-means聚类分析进行数据样本分组,生成客群强相关数据;基于客群强相关数据进行定量信息定性化处理,生成信贷用户画像原始数据;
步骤S2:基于信贷用户画像原始数据利用客户决策树算法进行画像节点数据权重分配,生成用户画像权重分配数据,基于用户画像权重分配数据进行应用场景划分,生成应用场景数据,基于应用场景数据进行目标客户数据筛选处理,生成目标客户行为数据;步骤S2的具体步骤为:
步骤S21:基于信贷用户画像原始数据利用客户决策树算法进行画像节点数据权重分配,生成用户画像权重分配数据;
步骤S22:基于用户画像权重分配数据利用协同过滤算法进行应用场景划分,生成应用场景数据;
步骤S23:基于应用场景数据进行业务场景数据特征提取及转换,生成应用场景特征数据;
步骤S24:基于应用场景特征数据进行回归计算,生成邻近场景特征数据;
步骤S25:基于邻近场景特征数据进行目标客户数据筛选处理,生成目标客户行为数据;步骤S21中的客户决策树算法具体为:
;
;
其中,为用户画像权重分配数据,为信贷用户画像原始数据,为客户决策树中的节点数量,为客户决策树中第个节点的节点权重,为节点决策函数,为数据收缩系数,为客户决策树中第个节点的节点阈值,为信贷用户画像原始数据中第个画像偏差值数据;
步骤S3:获取大数据管理平台访问权限,基于大数据管理平台访问权限进行用户信息数据获取,生成用户信息数据,基于目标客户行为数据以及用户信息数据进行数据匹配验证,生成目标客户关联数据,基于目标客户关联数据进行数据标准化处理,生成标准目标客户评估数据;
步骤S4:基于标准目标客户评估数据利用数据画像技术进行客户信贷产品服务推送,生成信贷产品服务反馈数据集,基于信贷产品服务反馈数据集利用回归分析进行统计信贷产品服务反馈,生成反馈数据;
步骤S5:基于反馈数据利用服务评估公式进行标准客户目标评估数据参数调整,生成信贷模型参数数据,基于信贷模型参数数据进行画像信贷推送模型构建,生成画像信贷推送模型,基于画像信贷推送模型进行信贷产品服务预测,实现客群画像的行为分析;步骤S5的具体步骤为:
步骤S51:基于反馈数据利用服务评估公式进行统计分析,生成优化分析数据;
步骤S52:基于优化分析数据进行标准客户目标评估数据参数调整,生成信贷模型参数数据;
步骤S53:根据标准客户目标评估数据进行模型神经元建立,生成模型神经元数据;
步骤S54:根据反馈数据对模型神经元数据进行线性加权,生成权重神经元数据;
步骤S55:对权重神经元数据进行softmax激活函数设置处理,生成激活神经元数据;
步骤S56:择取激活神经元数据作为画像信贷推送模型输入层数据,基于画像信贷推送模型输入层数据利用Adam优化进行数据循环网络模型建立,生成画像信贷推送模型;
步骤S57:择取信贷模型参数数据作为推送模型输入层数据,基于推送模型输入层数据以及画像信贷推送模型进行信贷产品服务预测,生成信贷产品服务预测数据,生成客群画像行为分析方法;
步骤S51中的服务评估公式具体为:
;
其中,为优化分析数据,为标准客户目标评估数据的用户特征数据数量,为客户信用等级变化,为客户信用等级变化的差值,为客户被服务的总时间,为客户收益率,为客户反馈评价等级,为自然指数函数,为服务效率数据,为客户信用额度表征数据,为用户价值数据,为信贷产品服务的总业务时间,为最近一次客户服务期间的延迟时间,为客户服务总延迟时间。
2.根据权利要求1所述的方法,其特征在于,步骤S1的具体步骤为:
步骤S11:获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行金融企业仓库数据访问,生成金融企业仓库访问数据;
步骤S12:基于金融企业仓库访问数据进行数据格式化处理,生成金融企业仓库数据;
步骤S13:基于金融企业仓库数据利用线性回归分析进行数据集中,生成客群筛选集中数据集;
步骤S14:基于客群筛选集中数据集利用K-means聚类分析进行数据样本分组,生成客群强相关数据;
步骤S15:基于客群强相关数据利用PCA技术构建特征矩阵,生成定性特征矩阵;
步骤S16:基于定性特征矩阵进行中心化处理,生成定性中心化数据;
步骤S17:基于定性中心化数据进行协方差计算,生成定性协方差矩阵;
步骤S18:基于定性协方差矩阵进行特征值分解,生成定性主成分数据;
步骤S19:基于定性主成分数据进行定量信息定性化,生成信贷用户画像原始数据。
3.根据权利要求1所述的方法,其特征在于,步骤S3的具体步骤为:
步骤S31:获取大数据管理平台访问权限,基于大数据管理平台访问权限进行用户信息数据获取,生成用户信息数据;
步骤S32:基于目标客户行为数据以及用户信息数据进行数据预处理与清洗操作,生成目标客户清洗数据;
步骤S33:基于目标客户关联数据利用关联分析算法进行特征匹配,生成目标客户关联数据;
步骤S34:基于验证数据集利用Embedded方法进行特征评估与筛选,生成目标客户评估数据;
步骤S35:基于目标客户评估数据进行数值标准化,生成标准目标客户评估数据;步骤S33中的关联分析算法具体为:
;
其中,为验证数据集,为外部清洗数据中的用户群体个数,为第个群体中客户的个数,表示第个群体中第个客户的特征向量,表示第个群体的中心。
4.根据权利要求1所述的方法,其特征在于,步骤S4的具体步骤为:
步骤S41:基于标准目标客户评估数据利用数据画像技术进行信贷客户筛选,生成信贷产品服务筛选数据集;
步骤S42:基于信贷产品服务筛选数据集利用聚类分析进行相似客户聚类,生成信贷客户聚类数据集;
步骤S43:基于信贷客户聚类数据集预测客户潜在需求,生成信贷潜在需求数据集;
步骤S44:基于信贷潜在需求数据集进行客户信贷产品服务推送,生成信贷产品服务推送数据集;
步骤S45:基于信贷产品服务推送数据集利用服务监测进行客户信贷产品服务反馈收集,生成信贷产品服务反馈数据集;
步骤S46:基于信贷产品服务反馈数据集利用回归分析进行统计信贷产品服务反馈,生成反馈数据。
5.一种基于客群画像行为分析系统,其特征在于,用于执行权利要求1所述的基于客群画像的行为分析方法,该基于客群画像行为分析系统包括:
信贷用户画像原始数据采集模块,用于获取金融企业数据仓库访问权限,基于金融企业数据仓库访问权限进行金融企业仓库数据访问,生成金融企业仓库数据;基于金融企业仓库数据进行数据集中,生成客群筛选集中数据集;基于客群筛选集中数据集利用K-means聚类分析进行数据样本分组,生成客群强相关数据;基于客群强相关数据进行定量信息定性化处理,生成信贷用户画像原始数据;
模型特征预处理数据准备模块,用于基于信贷用户画像原始数据利用客户决策树算法进行画像节点数据权重分配,生成用户画像权重分配数据,基于用户画像权重分配数据进行应用场景划分,生成应用场景数据,基于应用场景数据进行目标客户数据筛选处理,生成目标客户行为数据;
标准客户目标评估数据构建模块,用于获取大数据管理平台访问权限,基于大数据管理平台访问权限进行用户信息数据获取,生成用户信息数据,基于目标客户行为数据以及用户信息数据进行数据匹配验证,生成目标客户关联数据,基于目标客户关联数据进行数据标准化处理,生成标准目标客户评估数据;
反馈数据收集模块,用于基于标准目标客户评估数据利用数据画像技术进行客户信贷产品服务推送,生成信贷产品服务反馈数据集,基于信贷产品服务反馈数据集利用回归分析进行统计信贷产品服务反馈,生成反馈数据;
信贷产品服务预测模块,用于基于反馈数据利用服务评估公式进行标准客户目标评估数据参数调整,生成信贷模型参数数据,基于信贷模型参数数据进行画像信贷推送模型构建,生成画像信贷推送模型,基于画像信贷推送模型进行信贷产品服务预测,实现客群画像的行为分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311419392.0A CN117151870B (zh) | 2023-10-30 | 2023-10-30 | 一种基于客群画像行为分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311419392.0A CN117151870B (zh) | 2023-10-30 | 2023-10-30 | 一种基于客群画像行为分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117151870A CN117151870A (zh) | 2023-12-01 |
CN117151870B true CN117151870B (zh) | 2024-03-19 |
Family
ID=88912387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311419392.0A Active CN117151870B (zh) | 2023-10-30 | 2023-10-30 | 一种基于客群画像行为分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117151870B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117725313B (zh) * | 2023-12-13 | 2024-08-13 | 广州运通科金技术有限公司 | 智能识别与推荐系统 |
CN117829885B (zh) * | 2024-03-05 | 2024-05-10 | 山东硕为思大数据科技有限公司 | 一种基于多维特征分析的商业订单数据监测处理方法 |
CN118051879B (zh) * | 2024-04-16 | 2024-06-11 | 杭州小策科技有限公司 | 海量数据下的人群画像分析方法及系统 |
CN118071513B (zh) * | 2024-04-16 | 2024-07-05 | 交通银行股份有限公司江西省分行 | 一种基于人工智能驱动的个性化银行资产管理方法及系统 |
CN118332197A (zh) * | 2024-06-14 | 2024-07-12 | 北京中关村科金技术有限公司 | 基于数字金融的大数据推送方法及系统 |
CN118521400A (zh) * | 2024-07-24 | 2024-08-20 | 杭银消费金融股份有限公司 | 一种面向下沉客群的小样本信用风险评分方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056407A (zh) * | 2016-06-03 | 2016-10-26 | 北京网智天元科技股份有限公司 | 基于用户行为分析的网银用户画像方法及设备 |
CN110135976A (zh) * | 2019-04-23 | 2019-08-16 | 上海淇玥信息技术有限公司 | 用户画像生成方法、装置、电子设备和计算机可读介质 |
CN112347372A (zh) * | 2020-10-30 | 2021-02-09 | 银盛支付服务股份有限公司 | 一种金融企业基于用户画像方案业务推广的方法 |
CN112948695A (zh) * | 2021-03-31 | 2021-06-11 | 中国工商银行股份有限公司 | 基于用户画像的普惠金融快贷产品推荐方法和装置 |
CN116452261A (zh) * | 2023-06-15 | 2023-07-18 | 深圳千亚商务科技有限公司 | 一种基于跨境电商服务平台的广告投放数据处理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070061245A1 (en) * | 2005-09-14 | 2007-03-15 | Jorey Ramer | Location based presentation of mobile content |
-
2023
- 2023-10-30 CN CN202311419392.0A patent/CN117151870B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056407A (zh) * | 2016-06-03 | 2016-10-26 | 北京网智天元科技股份有限公司 | 基于用户行为分析的网银用户画像方法及设备 |
CN110135976A (zh) * | 2019-04-23 | 2019-08-16 | 上海淇玥信息技术有限公司 | 用户画像生成方法、装置、电子设备和计算机可读介质 |
CN112347372A (zh) * | 2020-10-30 | 2021-02-09 | 银盛支付服务股份有限公司 | 一种金融企业基于用户画像方案业务推广的方法 |
CN112948695A (zh) * | 2021-03-31 | 2021-06-11 | 中国工商银行股份有限公司 | 基于用户画像的普惠金融快贷产品推荐方法和装置 |
CN116452261A (zh) * | 2023-06-15 | 2023-07-18 | 深圳千亚商务科技有限公司 | 一种基于跨境电商服务平台的广告投放数据处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117151870A (zh) | 2023-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117151870B (zh) | 一种基于客群画像行为分析方法及系统 | |
Anastasopoulos et al. | Machine learning for public administration research, with application to organizational reputation | |
CN105225135B (zh) | 潜力客户识别方法以及装置 | |
CN112070543B (zh) | 一种电商网站中评论质量的检测方法 | |
CN113379457A (zh) | 面向金融领域的智能营销方法 | |
CN111612519B (zh) | 一种识别金融产品潜在客户的方法、装置及存储介质 | |
CN113159881B (zh) | 一种数据聚类及b2b平台客户偏好获取方法、系统 | |
CN117668205B (zh) | 智慧物流客服处理方法、系统、设备及存储介质 | |
CN118132856B (zh) | 一种基于大数据的智能分析方法及系统 | |
CN116468460A (zh) | 基于人工智能的消费金融客户画像识别系统及其方法 | |
CN112836750A (zh) | 一种系统资源分配方法、装置及设备 | |
CN116883157A (zh) | 一种基于度量学习的小样本信用评估方法及系统 | |
CN115794803A (zh) | 一种基于大数据ai技术的工程审计问题监测方法与系统 | |
CN118014622A (zh) | 一种基于用户画像的广告推送方法及系统 | |
CN117746546A (zh) | 基于叫号器的服务业务办理方法及系统 | |
CN116629716A (zh) | 一种智能交互系统工效分析方法 | |
Ahan et al. | Social network analysis using data segmentation and neural networks | |
CN111506813A (zh) | 一种基于用户画像的遥感信息精准推荐方法 | |
CN116821759A (zh) | 类别标签的识别预测方法、装置和处理器及电子设备 | |
CN116167733A (zh) | 绩效评估方法、装置、设备及介质 | |
CN115712777A (zh) | 一种基于逻辑回归的文献推荐系统的排序方法 | |
CN114820074A (zh) | 基于机器学习的目标用户群体预测模型构建方法 | |
Hansen | Machine Learning for Economics and Policy | |
Setnes et al. | Fuzzy target selection in direct marketing | |
Fang | Enhanced Customer Analysis Based on Variations of Natural Language Processing Algorithms Implemented on Past E-Commerce Reviews |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |