CN111881190A - 基于客户画像的关键数据挖掘系统 - Google Patents

基于客户画像的关键数据挖掘系统 Download PDF

Info

Publication number
CN111881190A
CN111881190A CN202010776192.0A CN202010776192A CN111881190A CN 111881190 A CN111881190 A CN 111881190A CN 202010776192 A CN202010776192 A CN 202010776192A CN 111881190 A CN111881190 A CN 111881190A
Authority
CN
China
Prior art keywords
data
client
customer
matrix
financial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010776192.0A
Other languages
English (en)
Other versions
CN111881190B (zh
Inventor
花鲜美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Nanxun Co.,Ltd.
Original Assignee
Xiamen Lihan Information Technology Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Lihan Information Technology Service Co ltd filed Critical Xiamen Lihan Information Technology Service Co ltd
Priority to CN202010776192.0A priority Critical patent/CN111881190B/zh
Publication of CN111881190A publication Critical patent/CN111881190A/zh
Application granted granted Critical
Publication of CN111881190B publication Critical patent/CN111881190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出基于客户画像的关键数据挖掘系统,包括客户数据获取模块、客户数据分类模块、客户数据聚类分析模块以及客户画像数据输出模块。所述客户数据包括与客户有关的金融数据。客户数据分类模块用于基于所述金融数据的产生环境,对所述客户数据进行分类;客户数据聚类分析模块将所述客户数据分类模块分类后的客户数据进行分类存储后,建立数据聚类矩阵,进行数据聚类分析;客户画像数据输出模块,基于所述数据聚类分析的结果,输出每一个聚类数据的客户画像。本发明的技术方案能够基于客户数据的不同类别,利用数据矩阵稳定性原理,挖掘出有价值的客户数据从而分类别建立客户画像,在避免了数据处理的复杂性的同时,画像建模更有针对性。

Description

基于客户画像的关键数据挖掘系统
技术领域
本发明属于大数据处理技术领域,尤其涉及一种基于客户画像的关键数据挖掘系统。
背景技术
客户画像,又称用户画像,最早是在1998年交互设计之父Alan Cooper的著作《TheInmates Are Running the Asy-lum-Why High Tech Products Drive Us Crazy andHow to Restore the Sanity》中首次提出,他将用户画像定义为″基于用户真实数据的虚拟代表″。用户画像也称用户角色,是一种描绘目标用户、联系用户诉求和涉及方向的有效工具。
客户画像是客户的标识,用来确定如何对待这些客户——他们接受什么价位,喜欢什么样的产品,需要付出多少努力可以留住或者赢得这些客户。比如说一个客户:男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。这样一串描述即为用户画像的典型案例。如果用一句话来描述,即:用户信息标签化。
客户画像的核心工作是为用户打标签,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够″理解″人。因此,基于客户画像的数据挖掘技术能更方便的让人理解并且易于计算机处理,从而大大提高挖掘结论的实用性。
客户画像是建立许多数据挖掘项目的基础,客户画像的字段确定了客户在数据中的表示,同时也决定了数据挖掘模型的有效性和信息量。对事务的定期汇总组成了客户画像指标体系的大部分字段。
申请号为CN201811568454.3的中国发明专利申请提出客户画像构建方法,包括:获取目标对象的多个数据信息,每个数据信息包括:多个数据维度,每个数据维度包括一个或多个子标签。分别计算各子标签的信息价值IV值,根据各子标签的IV值,选择符合预设条件的数据维度作为入模标签。根据入模标签计算子标签评分,并根据子标签评分分别构建优质客户画像和劣质客户画像。实现了可以根据子标签评分来构建优质客户画像和劣质客户画像,以进一步实现对目标群体进行精准的业务推荐及服务。
申请号为CN202010446110.6的中国发明专利申请提出一种可视化展现与数据分析的客户画像系统,包括用户分析模块,投诉分析模块。其中,通过用户分析模块生成可视化结果发送至客户经理端,客户经理根据所述可视化结果进行用户走访,进而通过投诉分析模块,构建客户投诉倾向预测模型,将所述客户投诉倾向预测模型应用于未发生投诉行为的用户群中,识别出具有投诉倾向的用户群体的目标标识,并计算出潜在投诉风险概率,供客户经理作风险前防控参考,进而为大客户提供更加贴合的差异化、个性化客户服务,提高用户用电成本效益管控和客户关系管理水平,有效降低客户的投诉率。
然而,一方面,如前所述,用户画像是基于用户“真实数据“的虚拟代表,但是如何获取关键的真实数据,现有技术并未给出有效的解决方案;另一方面,在大数据时代,各个渠道获得的用户数据数量巨大并且存在巨大差异,即使对于同一个用户来说,不同渠道获得的用户数据也是属性完全不同的,如何基于获取渠道的不同分别给出渠道的用户画像,成为一个挑战。
发明内容
为解决上述技术问题,本发明提出基于客户画像的关键数据挖掘系统,包括客户数据获取模块、客户数据分类模块、客户数据聚类分析模块以及客户画像数据输出模块。所述客户数据包括与客户有关的金融数据。客户数据分类模块用于基于所述金融数据的产生环境,对所述客户数据进行分类;客户数据聚类分析模块将所述客户数据分类模块分类后的客户数据进行分类存储后,建立数据聚类矩阵,进行数据聚类分析;客户画像数据输出模块,基于所述数据聚类分析的结果,输出每一个聚类数据的客户画像。本发明的技术方案能够基于客户数据的不同类别,利用数据矩阵稳定性原理,挖掘出有价值的客户数据从而分类别建立客户画像,在避免了数据处理的复杂性的同时,画像建模更有针对性。
本发明上述系统可以实现基于客户画像的关键数据挖掘方法,并且可以通过计算机程序指令自动化实现,因此,本发明还提出一种计算机可读存储介质,其上存储有计算机程序指令,通过处理器和存储器执行所述程序指令,用于实现基于客户画像的关键数据挖掘方法。
具体来说,本发明提出的基于客户画像的关键数据挖掘系统,包括客户数据获取模块、客户数据分类模块、客户数据聚类分析模块以及客户画像数据输出模块。
其中,所述客户数据获取模块,用于获取实时产生的客户数据,所述客户数据包括与客户有关的金融数据;
所述金融数据包括客户登录数据、客户查询数据、客户支付数据以及客户登录环境数据;
所述金融数据的产生环境,包括移动终端、PC终端以及金融网点终端。
所述客户数据分类模块,用于基于所述金融数据的产生环境,对所述客户数据进行分类;
更具体的,作为本发明的第一个优点,将所述客户数据分为移动终端数据Md、PC终端数据Pd以及金融网点终端数据Fd。
作为本发明的第二个优点,所述客户数据聚类分析模块,用于将所述客户数据分类模块分类后的客户数据进行分类存储后,建立数据聚类矩阵,进行数据聚类分析;
所述客户画像数据输出模块,基于所述数据聚类分析的结果,输出每一个聚类数据的客户画像。
在本发明中,不同于现有技术的单纯获取用户数据,本发明还获取客户登录环境数据。
具体的,所述客户数据获取模块包括安装于所述移动终端、PC终端以及金融网点终端上的输入环境探测组件,所述输入环境探测组件用于在探测到客户登录所述移动终端或PC终端或者金融网点终端之后,采集所述客户登录环境数据;
所述客户登录环境数据包括客户登录所述移动终端或PC终端或者金融网点终端的时间起点、退出所述移动终端或PC终端或者金融网点终端的时间结束点、以及在所述时间起点和所述时间结束点之间的操作编辑动作参数;
所述操作编辑动作参数包括客户的返回操作、退出当前页面操作、删除操作以及页面停顿操作。
作为体现上述优点的关键技术手段,所述客户数据聚类分析模块,用于将所述客户数据分类模块分类后的客户数据进行分类存储后,建立数据聚类矩阵,进行数据聚类分析,具体包括:
针对每一类客户数据,建立m×n维的数据聚类矩阵matrixD;
其中m为每一类客户数据包含的不同客户的数量,n为每一类客户数据的客户ID对应的金融数据的属性数量。
本发明的上述数据聚类分析可以分别针对移动终端数据Md、PC终端数据Pd以及金融网点终端数据Fd分别执行矩阵稳定性的最大子矩阵分析过程。
作为其中一个方面,针对移动终端产生的金融数据,即针对移动终端数据Md,所述数据聚类矩阵matrixD具体如下:
Figure BDA0002618502650000051
其中,Dij为对应于第j个客户的第i个金融数据的向量化表示值。
所述建立数据聚类矩阵,进行数据聚类分析,具体包括:
针对所述数据聚类矩阵,对其进行最大子矩阵分析,直至获得稳定的最大子矩阵;
将所述稳定的最大子矩阵的对应的客户数据作为一个聚类数据。
针对移动终端产生的金融数据获得的所述数据聚类矩阵matrixD,对其进行最大子矩阵分析,直至获得稳定的最大子矩阵,具体包括如下步骤:
M1:获取所述数据聚类矩阵matrixD的行维度数m和列维度数n;
M2:设定所述最大子矩阵的阶数上限值Kmax=min{m,n};
M3:令k=Kmax;
M4:获取所述数据聚类矩阵matrixD的k阶子矩阵matrixDk;
M5:判断所述k阶子矩阵matrixDk是否稳定;
如果是,则确定所述k阶子矩阵matrixDk为所述稳定的最大子矩阵;
如果否,则令k=k-1,
判断k>2是否成立;
如果是,返回步骤M4。
作为一个实现方式,所述步骤M5判断所述k阶子矩阵matrixDk是否稳定,具体包括:
判断所述k阶子矩阵matrixDk的特征根是否满足预定条件。
在一个方面,针对所述数据聚类矩阵matrixD获得的稳定的最大子矩阵至少为一个。
在另一个方面,针对所述数据聚类矩阵matrixD获得的稳定的最大子矩阵为两个以上。
本发明的创造性优点至少体现在:
(1)根据客户数据的产生环境不同,将客户数据进行分类,基于分类分别执行客户画像构建,充分考虑了客户画像所依赖的数据来源因素;
(2)不仅获取客户数据本身,还获取产生客户数据的所述客户登录环境数据;
(3)对于某一类别的客户数据,执行最大子矩阵分析,使得获得的客户数据分组更为稳定,有利于群组客户画像的建模准确性。
(4)通过聚类实现分组客户画像数据获取,避免复杂的数据获取过程,能够降低数据处理的成本。
本发明的进一步优点将结合说明书附图在具体实施例部分进一步详细体现。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的基于客户画像的关键数据挖掘系统的模块组成图
图2是图1所述系统获取的客户数据的来源与具体内容示意图
图3是图1所述系统执行最大子矩阵分析的原理示意图
图4是图1所述系统中使用的k阶子矩阵的示意图。
具体实施方式
下面,结合附图以及具体实施方式,对发明做出进一步的描述。
参见图1,是本发明一个实施例的基于客户画像的关键数据挖掘系统的模块组成图。
图1所述所述关键数据挖掘系统包括客户数据获取模块、客户数据分类模块、客户数据聚类分析模块以及客户画像数据输出模块。
所述客户数据获取模块,用于获取实时产生的客户数据,所述客户数据包括与客户有关的金融数据;
所述客户数据分类模块,用于基于所述金融数据的产生环境,对所述客户数据进行分类;
所述客户数据聚类分析模块,用于将所述客户数据分类模块分类后的客户数据进行分类存储后,建立数据聚类矩阵,进行数据聚类分析;
所述客户画像数据输出模块,基于所述数据聚类分析的结果,输出每一个聚类数据的客户画像。
在图1基础上,参见图2。
图2是图1所述系统获取的客户数据的来源与具体内容示意图。
所述客户数据包括与客户有关的金融数据,具体包括:
所述金融数据包括客户登录数据、客户查询数据、客户支付数据以及客户登录环境数据。
客户登录数据包括客户登录ID、登录终端硬件参数、登录时间、登录地点等;
客户查询数据包括客户登录之后输入的查询关键词、查询页面、确认结果等;
客户支付数据包括客户登陆之后涉及交易、支付的数据,包括支付、转账等数据;
在图1-图2中,所述客户数据获取模块用于获取实时产生的客户数据,具体包括:
所述客户数据获取模块包括安装于所述移动终端、PC终端以及金融网点终端上的输入环境探测组件,所述输入环境探测组件用于在探测到客户登录所述移动终端或PC终端或者金融网点终端之后,采集所述客户登录环境数据;
所述客户登录环境数据包括客户登录所述移动终端或PC终端或者金融网点终端的时间起点、退出所述移动终端或PC终端或者金融网点终端的时间结束点、以及在所述时间起点和所述时间结束点之间的操作编辑动作参数;
所述操作编辑动作参数包括客户的返回操作、退出当前页面操作、删除操作以及页面停顿操作。
所述金融数据的产生环境,包括移动终端、PC终端以及金融网点终端。
基于图1-图2的实施例,所述客户数据分类模块,用于基于所述金融数据的产生环境,对所述客户数据进行分类,具体包括:
将所述客户数据分为移动终端数据Md、PC终端数据Pd以及金融网点终端数据Fd。
本发明的数据聚类分析可以分别针对移动终端数据Md、PC终端数据Pd以及金融网点终端数据Fd分别执行矩阵稳定性的最大子矩阵分析过程。
以其中的移动终端数据Md为例,参见图3。
针对移动终端产生的金融数据,即针对移动终端数据Md,所述数据聚类矩阵matrixD具体如下:
Figure BDA0002618502650000091
其中,Dij为对应于第j个客户的第i个金融数据的向量化表示值。
需要指出的是,根据客户画像的目的不同,以及客户数据的类型不同,可以采用各种不同的向量化表示方法,包括二值化编码方法、分值归一化方法、专家打分法以及量化法,本发明对此不作具体限制。
现有技术中,对于如何获取客户画像数据、如何处理客户画像数据、如何基于客户画像数据进行量化编码,都有详尽的介绍。这是因为,客户数据本身是不能被计算机识别的,必须通过一定的机器编码或者向量化方法转变为机器能够识别的形式或者语言,
例如,将客户登录时间向量化编码可以是:
[0:00-6:00]登录时间,表示为001;
[6:00-8:00]登录时间,表示为002;
……
诸如此类,可以建立不同客户数据组成的数据聚类矩阵matrixD。
更多的客户数据矩阵化方法以及数据向量化、编码方法,可以参见如下技术文献:
Pan B,Wang X,Song E,et al.CAMSPF:Cloud-assisted mobile serviceprovision framework supporting personalized user demands in pervasivecomputing environment[C]//Wireless Communications and Mobile ComputingConference.IEEE,2013:649-654.
丁伟,王题,刘新海,等.基于大数据技术的手机用户画像与征信研究[J].邮电设计技术2016(3):64-69
Danette Mc Gilvray,2008.Executing Data Quality Projects:Ten Steps toQuality Data and Trusted Information(TM),Morgan Kaufman.
Rodbard H W,Jellinger P S,Davidson J A,et al.Statement by an AmericanAssociation of Clinical Endocrinologists/American College of Endocrinologyconsensus panel on type 2diabetes mellitus:an algorithm for glycemic control[J].Endocrine Practice Official Journal of the American College ofEndocrinology&the American Association of Clinical Endocrinologists,2009,15(6):540.
所述建立数据聚类矩阵,进行数据聚类分析,具体包括:
针对所述数据聚类矩阵,对其进行最大子矩阵分析,直至获得稳定的最大子矩阵;
将所述稳定的最大子矩阵的对应的客户数据作为一个聚类数据。
针对移动终端产生的金融数据获得的所述数据聚类矩阵matrixD,对其进行最大子矩阵分析,直至获得稳定的最大子矩阵,具体包括如下步骤:
M1:获取所述数据聚类矩阵matrixD的行维度数m和列维度数n;
M2:设定所述最大子矩阵的阶数上限值Kmax=min{m,n};
M3:令k=Kmax;
M4:获取所述数据聚类矩阵matrixD的k阶子矩阵matrixDk;
M5:判断所述k阶子矩阵matrixDk是否稳定;
如果是,则确定所述k阶子矩阵matrixDk为所述稳定的最大子矩阵;
如果否,则令k=k-1,
判断k>2是否成立;
如果是,返回步骤M4。
作为一个实现方式,所述步骤M5判断所述k阶子矩阵matrixDk是否稳定,具体包括:
判断所述k阶子矩阵matrixDk的特征根是否满足预定条件。
首先,在本发明的各个实施例中,数据聚类矩阵matrixD的行维度数m和列维度数n是根据实际研究需要可以设定的;
列维度数n,一般是指每次获取的客户数据包含的不同客户ID的数量,即每次要对获取多少个不同客户的客户数据;
行维度数m,是指每次获得的客户数据中,要从中提取多少个不同属性。
一般说来,为保证数据的代表性,列维度数n一般大于行维度数m,即客户ID的数量较多,而行维度m较少,即m<n.
但是,在某些情况下,例如为了进行小样本分析,也可以选择较少的客户ID数,而提取较多的数据属性。即m>n;
当然,也可以设定m=n;此时,数据聚类矩阵就是一个n阶矩阵。
此时,所述数据聚类矩阵matrixD的k阶子矩阵matrixDk可以是2阶子矩阵、3阶子矩阵、……n阶子矩阵;
作为一个示意性的例子,参见图4,图4给出了所述系统中使用的k阶子矩阵的示意图。
图4中,所述数据聚类矩阵matrixD为5×5矩阵,其k阶子矩阵matrixDk可以是2阶子矩阵、3阶子矩阵、4阶子矩阵以及5阶子矩阵(5阶子矩阵即matrixD本身)。
此时,针对所述数据聚类矩阵matrixD获得的稳定的最大子矩阵为一个。
当然,针对m<n的普遍情况,此时,数据聚类矩阵并不是一个k阶矩阵。
例如如果m=5,n=8,此时:
Figure BDA0002618502650000131
Figure BDA0002618502650000132
也就是说,此时,针对所述数据聚类矩阵matrixD获得的稳定的最大子矩阵可以为两个以上。
无论如何,总可以获得一个行数和列数相等的子矩阵,然后继续进行稳定分析。
具体来说,可以分析该子矩阵的特征根绝对值是否均小于预定值,例如0.99,来判断该子矩阵是否稳定,该子矩阵的特征根绝对值均小于0.99,则该子矩阵稳定。
基于稳定的子矩阵包含的客户数据,可以确定针对该子矩阵包含的客户ID的客户画像,从而实现分组客户画像。
在已有客户数据基础上,如何得到客户画像,在本领域也有已知的方法,本发明在此不再赘述,例如可参见:
硕士论文:赵飞鸿.基于金融类客户画像的二分K均值算法分析研究与应用[D].中国科学院大学(工程管理与信息技术学院),2016.
硕士论文:杨志春.用户画像和智能推送技术的研究与应用[D].重庆大学,2018.
综上所述,本发明的技术方案能够根据客户数据的产生环境不同,将客户数据进行分类,基于分类分别执行客户画像构建,充分考虑了客户画像所依赖的数据来源因素;不仅获取客户数据本身,还获取产生客户数据的所述客户登录环境数据;对于某一类别的客户数据,执行最大子矩阵分析,使得获得的客户数据分组更为稳定,有利于群组客户画像的建模准确性;通过聚类实现分组客户画像数据获取,避免复杂的数据获取过程,能够降低数据处理的成本。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种基于客户画像的关键数据挖掘系统,所述关键数据挖掘系统包括客户数据获取模块、客户数据分类模块、客户数据聚类分析模块以及客户画像数据输出模块;
其特征在于:
所述客户数据获取模块,用于获取实时产生的客户数据,所述客户数据包括与客户有关的金融数据;
所述客户数据分类模块,用于基于所述金融数据的产生环境,对所述客户数据进行分类;
所述客户数据聚类分析模块,用于将所述客户数据分类模块分类后的客户数据进行分类存储后,建立数据聚类矩阵,进行数据聚类分析;
所述客户画像数据输出模块,基于所述数据聚类分析的结果,输出每一个聚类数据的客户画像;
其中,所述客户数据包括与客户有关的金融数据,具体包括:
所述金融数据包括客户登录数据、客户查询数据、客户支付数据以及客户登录环境数据;
所述金融数据的产生环境,包括移动终端、PC终端以及金融网点终端。
2.如权利要求1所述的基于客户画像的关键数据挖掘系统,其特征在于:
所述客户数据获取模块用于获取实时产生的客户数据,具体包括:
所述客户数据获取模块包括安装于所述移动终端、PC终端以及金融网点终端上的输入环境探测组件,所述输入环境探测组件用于在探测到客户登录所述移动终端或PC终端或者金融网点终端之后,采集所述客户登录环境数据;
所述客户登录环境数据包括客户登录所述移动终端或PC终端或者金融网点终端的时间起点、退出所述移动终端或PC终端或者金融网点终端的时间结束点、以及在所述时间起点和所述时间结束点之间的操作编辑动作参数;
所述操作编辑动作参数包括客户的返回操作、退出当前页面操作、删除操作以及页面停顿操作。
3.如权利要求1所述的基于客户画像的关键数据挖掘系统,其特征在于:
所述客户数据分类模块,用于基于所述金融数据的产生环境,对所述客户数据进行分类,具体包括:
将所述客户数据分为移动终端数据Md、PC终端数据Pd以及金融网点终端数据Fd。
4.如权利要求3所述的基于客户画像的关键数据挖掘系统,其特征在于:
所述客户数据聚类分析模块,用于将所述客户数据分类模块分类后的客户数据进行分类存储后,建立数据聚类矩阵,进行数据聚类分析,具体包括:
针对每一类客户数据,建立m×n维的数据聚类矩阵matrixD;
其中m为每一类客户数据包含的不同客户的数量,n为每一类客户数据的客户ID对应的金融数据的属性数量。
5.如权利要求4所述的基于客户画像的关键数据挖掘系统,其特征在于:
针对移动终端产生的金融数据,所述数据聚类矩阵matrixD具体如下:
Figure FDA0002618502640000021
其中,Dij为对应于第j个客户的第i个金融数据的向量化表示值。
6.如权利要求4所述的基于客户画像的关键数据挖掘系统,其特征在于:
所述建立数据聚类矩阵,进行数据聚类分析,具体包括:
针对所述数据聚类矩阵,对其进行最大子矩阵分析,直至获得稳定的最大子矩阵;
将所述稳定的最大子矩阵的对应的客户数据作为一个聚类数据。
7.如权利要求4所述的基于客户画像的关键数据挖掘系统,其特征在于:
针对移动终端产生的金融数据获得的所述数据聚类矩阵matrixD,对其进行最大子矩阵分析,直至获得稳定的最大子矩阵,具体包括如下步骤:
M1:获取所述数据聚类矩阵matrixD的行维度数m和列维度数n;
M2:设定所述最大子矩阵的阶数上限值Kmax=min{m,n};
M3:令k=Kmax;
M4:获取所述数据聚类矩阵matrixD的k阶子矩阵matrixDk;
M5:判断所述k阶子矩阵matrixDk是否稳定;
如果是,则确定所述k阶子矩阵matrixDk为所述稳定的最大子矩阵;
如果否,则令k=k-1,
判断k>2是否成立;
如果是,返回步骤M4。
8.如权利要求7所述的基于客户画像的关键数据挖掘系统,其特征在于:所述步骤M5判断所述k阶子矩阵matrixDk是否稳定,具体包括:
判断所述k阶子矩阵matrixDk的特征根是否满足预定条件。
9.如权利要求7所述的基于客户画像的关键数据挖掘系统,其特征在于:
针对所述数据聚类矩阵matrixD获得的稳定的最大子矩阵至少为一个。
10.如权利要求7所述的基于客户画像的关键数据挖掘系统,其特征在于:
针对所述数据聚类矩阵matrixD获得的稳定的最大子矩阵为两个以上。
CN202010776192.0A 2020-08-05 2020-08-05 基于客户画像的关键数据挖掘系统 Active CN111881190B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010776192.0A CN111881190B (zh) 2020-08-05 2020-08-05 基于客户画像的关键数据挖掘系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010776192.0A CN111881190B (zh) 2020-08-05 2020-08-05 基于客户画像的关键数据挖掘系统

Publications (2)

Publication Number Publication Date
CN111881190A true CN111881190A (zh) 2020-11-03
CN111881190B CN111881190B (zh) 2021-10-08

Family

ID=73211448

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010776192.0A Active CN111881190B (zh) 2020-08-05 2020-08-05 基于客户画像的关键数据挖掘系统

Country Status (1)

Country Link
CN (1) CN111881190B (zh)

Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699702A (zh) * 2013-12-09 2015-06-10 中国银联股份有限公司 数据挖掘及分类方法
CN106251204A (zh) * 2016-08-01 2016-12-21 张建中 一种基于大数据处理的跨境电子商务平台系统
CN106682079A (zh) * 2016-11-21 2017-05-17 云南电网有限责任公司电力科学研究院 一种基于聚类分析的用户用电行为检测方法
CN106909944A (zh) * 2017-03-01 2017-06-30 西北大学 一种人脸图片聚类的方法
US20170213153A1 (en) * 2016-01-22 2017-07-27 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for embedded unsupervised feature selection
US20170249661A1 (en) * 2016-02-25 2017-08-31 International Business Machines Corporation Generating Actionable Information from Customer-Related Data and Customer Labels
CN108171369A (zh) * 2017-12-21 2018-06-15 国家电网公司 基于客户用电差异化特性的短期负荷组合预测方法
CN108664558A (zh) * 2018-04-04 2018-10-16 山东科技大学 一种面向大规模用户的网络电视个性化推荐服务方法
CN109063979A (zh) * 2018-07-13 2018-12-21 四川享宇金信金融服务外包有限公司 一种风控模型构建方法
US20190050443A1 (en) * 2017-08-11 2019-02-14 International Business Machines Corporation Method and system for improving training data understanding in natural language processing
CN109359180A (zh) * 2018-09-20 2019-02-19 腾讯科技(深圳)有限公司 用户画像生成方法、装置、电子设备及计算机可读介质
CN109410029A (zh) * 2018-09-04 2019-03-01 深圳市佰仟金融服务有限公司 一种面向金融领域的反欺诈调查方法及系统
CN109685567A (zh) * 2018-12-20 2019-04-26 长沙理工大学 一种基于卷积神经网络和模糊聚类的用电客户画像新方法
CN109726740A (zh) * 2018-12-05 2019-05-07 国网浙江省电力公司湖州供电公司 一种基于聚类分析的行业用电行为分析方法
CN109766454A (zh) * 2019-01-18 2019-05-17 国家电网有限公司 一种投资者分类方法、装置、设备及介质
CN109829571A (zh) * 2019-01-11 2019-05-31 国网浙江省电力有限公司 一种基于多表融合数据的用户短期用电量预测方法
CN109903082A (zh) * 2019-01-24 2019-06-18 平安科技(深圳)有限公司 基于用户画像的聚类方法、电子装置及存储介质
CN110009527A (zh) * 2019-04-04 2019-07-12 国家电网有限公司 一种综合能源系统用户画像方法及系统
CN110110237A (zh) * 2017-12-19 2019-08-09 福建天泉教育科技有限公司 用户兴趣信息推荐方法、存储介质
CN110135976A (zh) * 2019-04-23 2019-08-16 上海淇玥信息技术有限公司 用户画像生成方法、装置、电子设备和计算机可读介质
CN110490729A (zh) * 2019-08-16 2019-11-22 南京汇银迅信息技术有限公司 一种基于用户画像模型的金融用户分类方法
CN111159258A (zh) * 2019-12-31 2020-05-15 科技谷(厦门)信息技术有限公司 一种基于聚类分析的客户分群实现方法
CN111198967A (zh) * 2019-12-20 2020-05-26 北京淇瑀信息科技有限公司 基于关系图谱的用户分组方法、装置及电子设备
CN111352962A (zh) * 2018-12-24 2020-06-30 网智天元科技集团股份有限公司 客户画像构建方法及装置

Patent Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699702A (zh) * 2013-12-09 2015-06-10 中国银联股份有限公司 数据挖掘及分类方法
US20170213153A1 (en) * 2016-01-22 2017-07-27 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for embedded unsupervised feature selection
US20170249661A1 (en) * 2016-02-25 2017-08-31 International Business Machines Corporation Generating Actionable Information from Customer-Related Data and Customer Labels
CN106251204A (zh) * 2016-08-01 2016-12-21 张建中 一种基于大数据处理的跨境电子商务平台系统
CN106682079A (zh) * 2016-11-21 2017-05-17 云南电网有限责任公司电力科学研究院 一种基于聚类分析的用户用电行为检测方法
CN106909944A (zh) * 2017-03-01 2017-06-30 西北大学 一种人脸图片聚类的方法
US20190050443A1 (en) * 2017-08-11 2019-02-14 International Business Machines Corporation Method and system for improving training data understanding in natural language processing
CN110110237A (zh) * 2017-12-19 2019-08-09 福建天泉教育科技有限公司 用户兴趣信息推荐方法、存储介质
CN108171369A (zh) * 2017-12-21 2018-06-15 国家电网公司 基于客户用电差异化特性的短期负荷组合预测方法
CN108664558A (zh) * 2018-04-04 2018-10-16 山东科技大学 一种面向大规模用户的网络电视个性化推荐服务方法
CN109063979A (zh) * 2018-07-13 2018-12-21 四川享宇金信金融服务外包有限公司 一种风控模型构建方法
CN109410029A (zh) * 2018-09-04 2019-03-01 深圳市佰仟金融服务有限公司 一种面向金融领域的反欺诈调查方法及系统
CN109359180A (zh) * 2018-09-20 2019-02-19 腾讯科技(深圳)有限公司 用户画像生成方法、装置、电子设备及计算机可读介质
CN109726740A (zh) * 2018-12-05 2019-05-07 国网浙江省电力公司湖州供电公司 一种基于聚类分析的行业用电行为分析方法
CN109685567A (zh) * 2018-12-20 2019-04-26 长沙理工大学 一种基于卷积神经网络和模糊聚类的用电客户画像新方法
CN111352962A (zh) * 2018-12-24 2020-06-30 网智天元科技集团股份有限公司 客户画像构建方法及装置
CN109829571A (zh) * 2019-01-11 2019-05-31 国网浙江省电力有限公司 一种基于多表融合数据的用户短期用电量预测方法
CN109766454A (zh) * 2019-01-18 2019-05-17 国家电网有限公司 一种投资者分类方法、装置、设备及介质
CN109903082A (zh) * 2019-01-24 2019-06-18 平安科技(深圳)有限公司 基于用户画像的聚类方法、电子装置及存储介质
CN110009527A (zh) * 2019-04-04 2019-07-12 国家电网有限公司 一种综合能源系统用户画像方法及系统
CN110135976A (zh) * 2019-04-23 2019-08-16 上海淇玥信息技术有限公司 用户画像生成方法、装置、电子设备和计算机可读介质
CN110490729A (zh) * 2019-08-16 2019-11-22 南京汇银迅信息技术有限公司 一种基于用户画像模型的金融用户分类方法
CN111198967A (zh) * 2019-12-20 2020-05-26 北京淇瑀信息科技有限公司 基于关系图谱的用户分组方法、装置及电子设备
CN111159258A (zh) * 2019-12-31 2020-05-15 科技谷(厦门)信息技术有限公司 一种基于聚类分析的客户分群实现方法

Also Published As

Publication number Publication date
CN111881190B (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
US11663254B2 (en) System and engine for seeded clustering of news events
CN108089843B (zh) 一种智能化的银行企业级需求管理系统
CN110162693B (zh) 一种信息推荐的方法以及服务器
US9965531B2 (en) Data storage extract, transform and load operations for entity and time-based record generation
EP3717984B1 (en) Method and apparatus for providing personalized self-help experience
US7912816B2 (en) Adaptive archive data management
CN111708949B (zh) 医疗资源的推荐方法及装置、电子设备、存储介质
CN108874992A (zh) 舆情分析方法、系统、计算机设备和存储介质
US10795895B1 (en) Business data lake search engine
CN106919997B (zh) 一种基于lda的电子商务的用户消费预测方法
CN111858560A (zh) 基于数据仓库的金融数据自动化测试与监控系统
CN111881190B (zh) 基于客户画像的关键数据挖掘系统
CN115860872A (zh) 一种目标物品确定方法、装置、电子设备及存储介质
CN111899057A (zh) 基于边缘云节点数据收集的客户画像数据聚类分析系统
CN112085566B (zh) 基于智能决策的产品推荐方法、装置及计算机设备
CN111400567B (zh) 一种基于ai的用户数据的处理方法、装置及系统
CN111881191B (zh) 移动互联网下的客户画像关键特征挖掘系统与方法
US20220374446A1 (en) Search engine using self-supervised learning and predictive models for searches based on partial information
Rebelo et al. Intent identification in unattended customer queries using an unsupervised approach
Awate et al. Mathematical Modelling and Deep Learning: Innovations in E-Commerce Sentiment Analysis
Fang et al. Tag-based Matrix Factorization Recommendation Based on Topic Detection Technology
CN117272048A (zh) 一种基于机器学习平台的数据集处理方法及装置
CN117371562A (zh) 圈客模型训练方法、信息推荐方法、装置、设备及介质
CN117112933A (zh) 一种利用人工智能生成市场研究报告的方法及系统
CN116975392A (zh) 运维信息推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210909

Address after: 361000 1-3F, Zone D, innovation building, software park, torch high tech Zone, Xiamen City, Fujian Province

Applicant after: Xiamen Nanxun Co.,Ltd.

Address before: Room 401, 166 Longshan Road, Siming District, Xiamen City, Fujian Province 361000

Applicant before: Xiamen LiHan Information Technology Service Co.,Ltd.

GR01 Patent grant
GR01 Patent grant