CN111159258A - 一种基于聚类分析的客户分群实现方法 - Google Patents
一种基于聚类分析的客户分群实现方法 Download PDFInfo
- Publication number
- CN111159258A CN111159258A CN201911421024.3A CN201911421024A CN111159258A CN 111159258 A CN111159258 A CN 111159258A CN 201911421024 A CN201911421024 A CN 201911421024A CN 111159258 A CN111159258 A CN 111159258A
- Authority
- CN
- China
- Prior art keywords
- label
- clustering
- customer
- client
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Fuzzy Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于聚类分析的客户分群实现方法,包括以下步骤:建立标签画像系统;获取待分群的客户数据集;选择客户标签,生成初始客户标签库;配置聚类数目K,并选择是否对初始客户标签库的标签进行降维;利用主成分分析法对待分析客户标签库中的连续型标签进行降维处理,对类别型标签进行One‑Hot编码,生成最终客户标签库;于最终客户标签库,利用k‑means++算法进行聚类分析,生成聚类结果并进行展示。本发明能够让业务人员从客户标签体系中筛选出客户标签作为聚类特征,并进行简单配置后,即可自动完成客户聚类分群,将聚类分群结果展示到前台,呈现给业务人员,整个过程操作简便,极大的节约了时间成本。
Description
技术领域
本发明涉及聚类分析技术领域,特别涉及一种基于聚类分析的客户分群实现方法。
背景技术
客户分群是指企业在明确的战略业务模式和特定的市场中,根据客户的属性、行为、需求、偏好以及价值等因素对客户进行分类,进而提供有针对性的产品,服务和销售模式。使用客户分群系统,能让业务人员在无需了解客户群体特征的情况下,对客户进行聚类,将聚类结果展示到前台,并为各客户群体打上类别标签,从而能够对每个群体制定差异化的营销和关怀策略。
传统的聚类分析算法需要数据分析专家,基于深厚的行业知识和对数据的理解,使用分析工具读取数据,进行人工特征工程,构建定制化机器学习算法。在整个过程中,步骤较为繁琐,业务人员无法单独完成,数据分析师需要根据不同业务背景与不同的业务组进行深入的交流以保证聚类结果符合业务逻辑。
发明内容
为解决上述问题,本发明提供了一种基于聚类分析的客户分群实现方法。
本发明采用以下技术方案:
一种基于聚类分析的客户分群实现方法,其包括以下步骤:
S1、建立标签画像系统,所述标签画像系统采用宽表形式存储,其包含有一组客户标签,所述客户标签包括连续型标签和类别型标签;
S2、获取待分群的客户数据集;
S3、基于业务背景,在标签画像系统里的标签列表中选择客户标签,生成初始客户标签库;
S4、配置聚类数目K,并选择是否对初始客户标签库的标签进行降维;
S5、利用主成分分析法对待分析客户标签库中的连续型标签进行降维处理,对类别型标签进行One-Hot编码,生成最终客户标签库;
S6、基于最终客户标签库,建立聚类分析模型,利用k-means++算法进行聚类分析,生成聚类结果并进行展示,所述聚类结果包括聚类后的各群体数量以及各群体标签的中心值。
优选地,步骤S1中所述的建立标签画像系统具体为:创建HBase表,然后将HBase表映射到Hive表。
优选地,步骤S5中所述的降维处理通过以下方法实现:
S51、对初始客户标签库中的连续型标签作为原始变量,进行进行标准化处理,令:
将p个原始变量X1,X2,…,Xp的总方差分解成p个相互独立的变量Y1,Y2,…,Yp的方差之和;
S52、建立贡献率计算模型如下:
S53、基于预先设定的贡献率阈值,利用所述贡献率计算模型计算累计贡献率达到贡献率阈值时的m值;
S54、根据获得的主成分变量的数量m值,得到:
其中,Yi为经降维处理后最终得到的连续型标签。
优选地,步骤S6中所述的利用k-means++算法进行聚类分析通过以下方法实现:
S61、选取k个聚类中心;
S62、针对客户数据集中的每个数据点,计算其到k个中心点的距离,并将其与距离最近的中心点关联,与同一中心点关联的所有数据点聚类成一组;
S63、计算每一组数据点的均值,并将该组对应的中心点移动到均值的位置;
S64、重复步骤S62、S63,直至中心点不再变化。
优选地,步骤S61中所述的选取k个聚类中心通过以下方法实现:
随机选取第一个聚类中心;
假定已经选取了n个聚类中心,0<n<k,则在选取第n+1个聚类中心时,距离当前n个聚类中心越远的点具有更高的选中概率。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
本发明能够让业务人员从客户标签体系中筛选出客户标签作为聚类特征,并进行简单配置后,即可自动完成客户聚类分群,将聚类分群结果展示到前台,呈现给业务人员,整个过程操作简便,极大的节约了时间成本。
附图说明
图1为本发明的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
参考图1所示,本发明公开了一种基于聚类分析的客户分群实现方法,其包括以下步骤:
S1、建立标签画像系统,标签画像系统采用宽表形式存储,先创建HBase表,然后将HBase表映射到Hive表。为便于理解,将标签画像系统示例如下:
字段名 | 说明 | 示例 |
PK_ARCH_NO | 客户唯一标识符,加密字符串 | 0a8e79872iuy34 |
LBL0000000000001 | 90天内订票数 | 20 |
LBL0000000000002 | 近五年乘机频次 | 30 |
…… | …… | …… |
标签画像系统包含有一组客户标签,其中:
PK_ARCH_NO为客户编号;LBLXXXXXXXXXXXXX为客户标签编号,将其作为宽表的字段名。
新增加一个客户标签时,宽表将相应地增加一个字段。由于业务累积,客户标签不断增加,在该表中能行成成百上千个字段。
客户标签包括连续型标签和类别型标签连续型标签(如近五年乘机频次)和类别型标签(如性别)。
S2、获取待分群的客户数据集。用户(业务人员)将需要进行分群的客户名单上传,一般而言为一列1万到100万的客户编号PK_ARCH_NO。
S3、基于业务背景,在标签画像系统里的标签列表中选择客户标签,生成初始客户标签库。业务人员根据具体业务背景,在标签画像系统里的标签列表中选取作为模型分析的合适的标签。系统过滤出勾选的标签,生成临时表(由Cust_tag_value表生成Cust_tag_value_tmp表,可视为Cust_tag_value的子表)作为初始客户标签库。
S4、配置聚类数目K(即需要把待分群的客户分为几个群体),并选择是否对初始客户标签库的标签进行降维。如果业务人员选择过多(如几十个)的客户标签作为聚类特征,则特征之间极有可能存在多重共线性,导致相关特征在距离计算中占据很高的权重,从而对聚类结果有负面影响。因此,业务人员可选择是否降维,以消除特征之间的多重共线性。
S5、利用主成分分析法对待分析客户标签库中的连续型标签进行降维处理,对类别型标签进行One-Hot编码,生成最终客户标签库。
主成分分析(PCA)通过将特征集缩减成一小部分能代表原始特征集最主要变化的主要特征分量,来实现高维数据到低维数据空间的映射。
在本步骤中,降维处理通过以下方法实现:
S51、对初始客户标签库中的连续型标签作为原始变量,进行进行标准化处理,令:
将p个原始变量X1,X2,…,Xp的总方差分解成p个相互独立的变量Y1,Y2,…,Yp的方差之和;
S52、建立贡献率计算模型如下:
S53、基于预先设定的贡献率阈值,利用贡献率计算模型计算累计贡献率达到贡献率阈值时的m值;
S54、根据获得的主成分变量的数量m值,得到:
其中,Yi为经降维处理后最终得到的连续型标签。
客户分群系统系统根据业务人员所选标签的类型,判断是否含有类别型标签(例:“性别”标签为类别型标签,其标签值可枚举,分别是“男性”、“女性”、“未知”)。若含有类别型标签,由于后续步骤中所采用的k-means++算法不支持类别型变量,则需要把类别型标签进行One-Hot编码,将编码后的特征作为聚类分析的特征。One-Hot编码是分类变量作为二进制向量的表示。例如上文中说的性别标签,共有“男性”、“女性”、“未知”三种状态,那么就可以编码为001、010和100,对于有N个状态的特征,经过one-hot编码后就会变成N个二元值,而其中只有一个为1。
S6、基于最终客户标签库,建立聚类分析模型,利用k-means++算法进行聚类分析,生成聚类结果并进行展示,聚类结果包括聚类后的各群体数量以及各群体标签的中心值。本步骤S6中的利用k-means++算法进行聚类分析通过以下方法实现:
S61、选取k个聚类中心;
S62、针对客户数据集中的每个数据点,计算其到k个中心点的距离,并将其与距离最近的中心点关联,与同一中心点关联的所有数据点聚类成一组;
S63、计算每一组数据点的均值,并将该组对应的中心点移动到均值的位置;
S64、重复步骤S62、S63,直至中心点不再变化。
优选地,步骤S61中的选取k个聚类中心通过以下方法实现:
随机选取第一个聚类中心;
假定已经选取了n个聚类中心,0<n<k,则在选取第n+1个聚类中心时,距离当前n个聚类中心越远的点具有更高的选中概率。
针对各群体标签的中心值,对连续型标签而言展示的是各群体该标签的均值,对类别型标签而言展示的是各群体该标签的标签值占比排名前三的标签值及其占比。
聚类结果展示给业务人员后,业务人员可根据各群体的各标签中心值对各群体的特征进行归纳总结并为各群体命名,作为对各细分群体制定营销策略的依据,最终实现精准营销。
与传统的客户分群模型开发冗长的特征工程相比,本发明具有如下优势:
(1)业务导向的自主化特征工程:业务人员能自助式筛取客户标签作为输入到算法端的变量。如果画像系统中尚未存在一些业务相关的重要特征变量,业务人员能拟定特定业务逻辑交由ETL专家实现数据逻辑将变量入库。该模式业务导向性极强,大大节省了传统分析师的时间成本(特征工程一般占据完整商业分析数据挖掘任务构建周期的70%-80%);
(2)自动化特征数据转换:业务人员只需勾选模型相关配置,即可实现特征转换,提升模型效果。
(3)自动化模型反复应用:基于上一步转换后的特征,自动化构建聚类模型,实现客户分群。业务人员可根据具体需求,对聚类后的某个群体再放入分群系统中进行聚类分析,完成进一步的群体细分,最终聚焦某个或者某几个较小的客户群体。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (5)
1.一种基于聚类分析的客户分群实现方法,其特征在于,包括以下步骤:
S1、建立标签画像系统,所述标签画像系统采用宽表形式存储,其包含有一组客户标签,所述客户标签包括连续型标签和类别型标签;
S2、获取待分群的客户数据集;
S3、基于业务背景,在标签画像系统里的标签列表中选择客户标签,生成初始客户标签库;
S4、配置聚类数目K,并选择是否对初始客户标签库的标签进行降维;
S5、利用主成分分析法对待分析客户标签库中的连续型标签进行降维处理,对类别型标签进行One-Hot编码,生成最终客户标签库;
S6、基于最终客户标签库,建立聚类分析模型,利用k-means++算法进行聚类分析,生成聚类结果并进行展示,所述聚类结果包括聚类后的各群体数量以及各群体标签的中心值。
2.如权利要求1所述的一种基于聚类分析的客户分群实现方法,其特征在于,步骤S1中所述的建立标签画像系统具体为:创建HBase表,然后将HBase表映射到Hive表。
3.如权利要求1或2所述的一种基于聚类分析的客户分群实现方法,其特征在于,步骤S5中所述的降维处理通过以下方法实现:
S51、对初始客户标签库中的连续型标签作为原始变量,进行进行标准化处理,令:
将p个原始变量X1,X2,…,Xp的总方差分解成p个相互独立的变量Y1,Y2,…,Yp的方差之和;
S52、建立贡献率计算模型如下:
S53、基于预先设定的贡献率阈值,利用所述贡献率计算模型计算累计贡献率达到贡献率阈值时的m值;
S54、根据获得的主成分变量的数量m值,得到:
其中,Yi为经降维处理后最终得到的连续型标签。
4.如权利要求1或2所述的一种基于聚类分析的客户分群实现方法,其特征在于,步骤S6中所述的利用k-means++算法进行聚类分析通过以下方法实现:
S61、选取k个聚类中心;
S62、针对客户数据集中的每个数据点,计算其到k个中心点的距离,并将其与距离最近的中心点关联,与同一中心点关联的所有数据点聚类成一组;
S63、计算每一组数据点的均值,并将该组对应的中心点移动到均值的位置;
S64、重复步骤S62、S63,直至中心点不再变化。
5.如权利要求4所述的一种基于聚类分析的客户分群实现方法,其特征在于,步骤S61中所述的选取k个聚类中心通过以下方法实现:
随机选取第一个聚类中心;
假定已经选取了n个聚类中心,0<n<k,则在选取第n+1个聚类中心时,距离当前n个聚类中心越远的点具有更高的选中概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911421024.3A CN111159258A (zh) | 2019-12-31 | 2019-12-31 | 一种基于聚类分析的客户分群实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911421024.3A CN111159258A (zh) | 2019-12-31 | 2019-12-31 | 一种基于聚类分析的客户分群实现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111159258A true CN111159258A (zh) | 2020-05-15 |
Family
ID=70560547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911421024.3A Pending CN111159258A (zh) | 2019-12-31 | 2019-12-31 | 一种基于聚类分析的客户分群实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111159258A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738331A (zh) * | 2020-06-19 | 2020-10-02 | 北京同邦卓益科技有限公司 | 用户分类方法及装置、计算机可读存储介质、电子设备 |
CN111881190A (zh) * | 2020-08-05 | 2020-11-03 | 厦门力含信息技术服务有限公司 | 基于客户画像的关键数据挖掘系统 |
CN112215655A (zh) * | 2020-10-13 | 2021-01-12 | 广东电网有限责任公司 | 一种客户画像的标签管理方法及系统 |
CN113191802A (zh) * | 2021-04-27 | 2021-07-30 | 中国石油天然气股份有限公司 | 一种基于聚类算法的天然气客户分析方法及系统 |
CN116226893A (zh) * | 2023-05-09 | 2023-06-06 | 北京明苑风华文化传媒有限公司 | 一种基于物联网客户营销信息管理系统 |
CN117575649A (zh) * | 2023-11-22 | 2024-02-20 | 中国人寿保险股份有限公司山东省分公司 | 一种基于多模型的客户画像判别方法、装置、设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020161763A1 (en) * | 2000-10-27 | 2002-10-31 | Nong Ye | Method for classifying data using clustering and classification algorithm supervised |
CN201017225Y (zh) * | 2006-12-22 | 2008-02-06 | 浙江大学 | 丙烯聚合生产数据检测及故障诊断装置 |
CN103618638A (zh) * | 2013-10-29 | 2014-03-05 | 国家电网公司 | 评估电力通信网检修方案的方法 |
CN106295969A (zh) * | 2016-08-02 | 2017-01-04 | 贵州电网有限责任公司信息中心 | 电力客户价值分群的一种加权K‑means方法 |
CN107977853A (zh) * | 2017-10-23 | 2018-05-01 | 重庆长安汽车股份有限公司 | 一种汽车企业客户流失建模与分析方法 |
CN108764663A (zh) * | 2018-05-15 | 2018-11-06 | 广东电网有限责任公司信息中心 | 一种电力客户画像生成管理的方法及系统 |
WO2019085343A1 (zh) * | 2017-10-31 | 2019-05-09 | 平安科技(深圳)有限公司 | 基于标签库的营销客户筛选方法、电子装置及存储介质 |
CN110363387A (zh) * | 2019-06-14 | 2019-10-22 | 平安科技(深圳)有限公司 | 基于大数据的画像分析方法、装置、计算机设备及存储介质 |
-
2019
- 2019-12-31 CN CN201911421024.3A patent/CN111159258A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020161763A1 (en) * | 2000-10-27 | 2002-10-31 | Nong Ye | Method for classifying data using clustering and classification algorithm supervised |
CN201017225Y (zh) * | 2006-12-22 | 2008-02-06 | 浙江大学 | 丙烯聚合生产数据检测及故障诊断装置 |
CN103618638A (zh) * | 2013-10-29 | 2014-03-05 | 国家电网公司 | 评估电力通信网检修方案的方法 |
CN106295969A (zh) * | 2016-08-02 | 2017-01-04 | 贵州电网有限责任公司信息中心 | 电力客户价值分群的一种加权K‑means方法 |
CN107977853A (zh) * | 2017-10-23 | 2018-05-01 | 重庆长安汽车股份有限公司 | 一种汽车企业客户流失建模与分析方法 |
WO2019085343A1 (zh) * | 2017-10-31 | 2019-05-09 | 平安科技(深圳)有限公司 | 基于标签库的营销客户筛选方法、电子装置及存储介质 |
CN108764663A (zh) * | 2018-05-15 | 2018-11-06 | 广东电网有限责任公司信息中心 | 一种电力客户画像生成管理的方法及系统 |
CN110363387A (zh) * | 2019-06-14 | 2019-10-22 | 平安科技(深圳)有限公司 | 基于大数据的画像分析方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
朱灵,毕道旺, 北京邮电大学出版社 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111738331A (zh) * | 2020-06-19 | 2020-10-02 | 北京同邦卓益科技有限公司 | 用户分类方法及装置、计算机可读存储介质、电子设备 |
CN111881190A (zh) * | 2020-08-05 | 2020-11-03 | 厦门力含信息技术服务有限公司 | 基于客户画像的关键数据挖掘系统 |
CN111881190B (zh) * | 2020-08-05 | 2021-10-08 | 厦门南讯股份有限公司 | 基于客户画像的关键数据挖掘系统 |
CN112215655A (zh) * | 2020-10-13 | 2021-01-12 | 广东电网有限责任公司 | 一种客户画像的标签管理方法及系统 |
CN112215655B (zh) * | 2020-10-13 | 2023-04-28 | 广东电网有限责任公司 | 一种客户画像的标签管理方法及系统 |
CN113191802A (zh) * | 2021-04-27 | 2021-07-30 | 中国石油天然气股份有限公司 | 一种基于聚类算法的天然气客户分析方法及系统 |
CN116226893A (zh) * | 2023-05-09 | 2023-06-06 | 北京明苑风华文化传媒有限公司 | 一种基于物联网客户营销信息管理系统 |
CN116226893B (zh) * | 2023-05-09 | 2023-08-01 | 北京明苑风华文化传媒有限公司 | 一种基于物联网客户营销信息管理系统 |
CN117575649A (zh) * | 2023-11-22 | 2024-02-20 | 中国人寿保险股份有限公司山东省分公司 | 一种基于多模型的客户画像判别方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111159258A (zh) | 一种基于聚类分析的客户分群实现方法 | |
CN106529968B (zh) | 一种基于交易数据的客户分类方法及其系统 | |
Zhao et al. | Uplift modeling with multiple treatments and general response types | |
Kumar et al. | Knowledge discovery from database using an integration of clustering and classification | |
KR20040101477A (ko) | 계층적 시각화를 통한 다차원 데이터의 뷰잉 | |
Arumawadu et al. | Mining Profitability of Telecommunication Custormers using K-Means Clustering | |
Zhao et al. | A practically competitive and provably consistent algorithm for uplift modeling | |
Rashedi et al. | An information theoretic approach to hierarchical clustering combination | |
CN112184484A (zh) | 一种电力用户差异化服务方法及系统 | |
Koul et al. | Customer segmentation techniques on e-commerce | |
Al Hammadi et al. | Data mining in education-an experimental study | |
CN115293919A (zh) | 面向社交网络分布外泛化的图神经网络预测方法及系统 | |
Brusco et al. | Integrating linear discriminant analysis, polynomial basis expansion, and genetic search for two-group classification | |
Luk et al. | Design of an intelligent customer identification model in e-commerce logistics industry | |
Syam et al. | Efficient similarity measure via Genetic algorithm for content based medical image retrieval with extensive features | |
CN110471854B (zh) | 一种基于高维数据混合约简的缺陷报告指派方法 | |
Chakrabarty et al. | RBM based joke recommendation system and joke reader segmentation | |
CN116934531A (zh) | 一种基于数据分析的酒类信息智能管理方法及系统 | |
Peyhardi et al. | Partitioned conditional generalized linear models for categorical responses | |
Jian-Xiang et al. | Application of genetic algorithm in document clustering | |
CN111159569A (zh) | 一种基于用户个性化特征的社交网络用户行为预测方法 | |
Hamzehei et al. | A new methodology to study customer electrocardiogram using RFM analysis and clustering | |
Modak | Pointwise norm-based clustering of data in arbitrary dimensional space | |
Branch | A case study of applying som in market segmentation of automobile insurance customers | |
Cruz et al. | A new encoding scheme for a bee-inspired optimal data clustering algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |