CN110909773A - 基于自适应粒子群的客户分类方法及系统 - Google Patents

基于自适应粒子群的客户分类方法及系统 Download PDF

Info

Publication number
CN110909773A
CN110909773A CN201911088225.6A CN201911088225A CN110909773A CN 110909773 A CN110909773 A CN 110909773A CN 201911088225 A CN201911088225 A CN 201911088225A CN 110909773 A CN110909773 A CN 110909773A
Authority
CN
China
Prior art keywords
particle swarm
particles
algorithm
adaptive
particle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911088225.6A
Other languages
English (en)
Other versions
CN110909773B (zh
Inventor
穆维松
李玥
冯建英
田东
褚晓泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Agricultural University
Original Assignee
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Agricultural University filed Critical China Agricultural University
Priority to CN201911088225.6A priority Critical patent/CN110909773B/zh
Publication of CN110909773A publication Critical patent/CN110909773A/zh
Application granted granted Critical
Publication of CN110909773B publication Critical patent/CN110909773B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种基于自适应粒子群的客户分类方法及系统,该方法包括:根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法;根据所述改进后的粒子群优化算法,对粒子位置进行更新,并对粒子位置进行越界处理,得到多个聚类中心;将多个聚类中心作为K‑Means聚类算法的初始聚类中心,得到自适应粒子群的客户分类模型;根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。本发明实施例提高了粒子群算法的收敛精度和效率,避免了局部极小值的问题,可以有效、准确地对消费客户进行划分。

Description

基于自适应粒子群的客户分类方法及系统
技术领域
本发明涉及客户分类管理技术领域,尤其涉及一种基于自适应粒子群的客户分类方法及系统。
背景技术
零售客户分类是零售业确定产品和服务的基础,是客户消费行为的直接反映,也是零售业与零售客户建立一对一营销,以及给零售客户提供个性化服务的前提。在激烈的市场竞争中,对零售企业客户进行分类,能够使零售企业提高竞争力和扩大市场份额,从而对某一个客户类别进行有针对性的资源分配。
K-means聚类算法是客户分类中常用的距离算法,该算法理论可靠、原理简单和运算速度快,对大规模数据挖掘具有高效性和可伸缩性,被广泛的应用于客户分类领域研究中。然而,现有K-Means聚类的也存在对初始值比较敏感,容易陷入局部最优解,需要预先指定聚类个数,以及不适合处理混合型数据等缺陷。
因此,现在亟需一种基于自适应粒子群的客户分类方法及系统来解决上述问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种基于自适应粒子群的客户分类方法及系统。
第一方面,本发明实施例提供了一种基于自适应粒子群的客户分类方法,包括:
根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法;
根据所述改进后的粒子群优化算法,对粒子位置进行更新,并对粒子位置进行越界处理,得到多个聚类中心;
将多个聚类中心作为K-Means聚类算法的初始聚类中心,得到自适应粒子群的客户分类模型;
根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
进一步地,所述根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法,包括:
根据粒子群当前迭代中粒子的搜索状态变化特征,构建惯性权重,所述搜索状态变化特征包括种群进化速度因子、种群聚集度因子和种群早熟收敛程度因子;
根据粒子群下一次迭代中粒子的搜索状态变化特征,对所述惯性权重进行调整,以得到改进后的粒子群优化算法;
其中,所述种群进化速度因子根据当前迭代的全局最优值和上一次迭代的全局最优值之间的比值得到;所述种群聚集度因子根据当前迭代的全局最优值和当前迭代的粒子适应度平均值之间的比值得到;所述种群早熟收敛程度因子根据当前迭代的全局最优值和当前迭代的粒子适应度平均值之间的差值得到。
进一步地,在所述根据粒子群当前迭代中粒子的搜索状态变化特征,构建惯性权重之后,所述方法还包括:
根据标准粒子群算法中自身学习因子和社会学习因子的变化特性,获取最优稳定性参数;
根据所述最优稳定性参数和惯性权重,构建改进后的粒子群优化算法的自身学习因子和社会学习因子。
进一步地,所述根据所述改进后的粒子群优化算法,对粒子位置进行更新,包括:
根据惯性遗忘因子和种群多样性因子,对粒子位置进行迭代更新,若满足预设收敛条件,则停止更新;所述惯性遗忘因子根据惯性权重和粒子当前位置获取得到,所述种群多样性因子根据粒子当前位置和粒子最优位置之间的离散程度获取得到。
进一步地,所述对粒子位置进行越界处理,包括:
根据粒子越界重置公式,对越界的粒子的当前位置进行重新设置,所述粒子越界重置公式为:
Figure BDA0002266075510000031
其中,xid表示越界重置后的第i个粒子第d维的位置,Xmax表示最大位置边界,Xmin表示最小位置边界,rand表示随机函数。
进一步地,在所述根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果之前,所述方法还包括:
对所述目标客户群的购买行为特征数据集进行预处理,得到预处理后的购买行为特征数据集,以使得所述自适应粒子群的客户分类模型对预处理后的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
第二方面,本发明实施例提供了一种基于自适应粒子群的客户分类系统,包括:
第一处理模块,用于根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法;
第二处理模块,用于根据所述改进后的粒子群优化算法,对粒子位置进行更新,并对粒子位置进行越界处理,得到多个聚类中心;
模型构建模块,用于将多个聚类中心作为K-Means聚类算法的初始聚类中心,得到自适应粒子群的客户分类模型;
客户分类模块,用于根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
进一步地,所述系统还包括:预处理模块,用于对所述目标客户群的购买行为特征数据集进行预处理,得到预处理后的购买行为特征数据集,以使得所述自适应粒子群的客户分类模型对预处理后的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
本发明实施例提供的一种基于自适应粒子群的客户分类方法及系统,通过采用不同策略调整惯性权重,对粒子群算法进行改进,提高了收敛精度和收敛效率,避免了局部极小值的问题,可以有效、准确地对消费客户进行划分,从而挖掘不同类别客户的价值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于自适应粒子群的客户分类方法的流程示意图;
图2为本发明实施例提供的基于自适应粒子群的客户分类系统的结构示意图;
图3为本发明实施例提供的电子设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对现有K-Means聚类算法依赖初始聚类中心的随机选取,导致极易陷入局部极值的缺点,可采用标准粒子群算法对其进行改进,粒子群算法在迭代前期具有较好的全局搜索能力,收敛速度较快;迭代后期具有较好的局部搜索能力,寻优精度较高。然而,现有的标准粒子群算法存在收敛精度低、收敛速度慢和易陷入局部极小值等问题,具体表现为:1、一般设置的参数是固定不变的,在迭代初期,种群很快地移动并聚集至较优解附近;在迭代后期,种群会在该区域内变得密集。由于迭代前后期种群更新过快,导致了算法容易出现早熟收敛现象,陷入局部极小值,难以跳出局部极值点,而且很难平衡收敛速度和寻优精度。2、容易受到粒子速度和位置更新的影响,算法的寻优精度和计算效率并不高,如果粒子速度始终保持较大,容易发生“越界”现象,造成粒子群发散,收敛不到最优解,导致全局搜索精度不高。
目前,粒子群算法的寻优性能在很大程度上取决于参数的设置,大多数研究集中在算法如何自适应调整惯性权重,从而平衡算法的全局搜索能力和局部搜索能力。如果惯性权重设置过大,虽然有利于全局寻优,且具有较强的探索能力,但粒子总是在探索新的区域,导致了粒子搜索分散,搜索效率较低,算法开销较大;如果惯性权重设置过小,虽然有利于局部寻优,且具有较强的开发能力,能够加速算法的收敛,但导致容易陷入局部最优解。同时,粒子群算法在寻优过程中,由于没有设置粒子边界条件约束,在整个寻优过程中粒子可能超出有效解的范围。因此,合理的惯性权重和粒子位置更新,是平衡算法全局探索和局部开发能力的关键,也是研究和改进标准粒子群优化算法性能的关键所在。
本发明实施例提出了一种基于自适应学习参数的改进粒子群优化算法,对客户消费数据进行聚类,可以有效、准确地对消费客户进行划分,从而挖掘不同类别客户的价值。
图1为本发明实施例提供的基于自适应粒子群的客户分类方法的流程示意图,如图1所示,本发明实施例提供了一种基于自适应粒子群的客户分类方法,包括:
步骤101,根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法;步骤101具体包括:
根据粒子群当前迭代中粒子的搜索状态变化特征,构建惯性权重,所述搜索状态变化特征包括种群进化速度因子、种群聚集度因子和种群早熟收敛程度因子;
根据粒子群下一次迭代中粒子的搜索状态变化特征,对所述惯性权重进行调整,以得到改进后的粒子群优化算法;
其中,所述种群进化速度因子根据当前迭代的全局最优值和上一次迭代的全局最优值之间的比值得到;所述种群聚集度因子根据当前迭代的全局最优值和当前迭代的粒子适应度平均值之间的比值得到;所述种群早熟收敛程度因子根据当前迭代的全局最优值和当前迭代的粒子适应度平均值之间的差值得到。
在本发明实施例中,惯性权重w是影响标准粒子群算法的重要因素,与种群进化速度、种群聚集合度和早熟收敛程度等因素密切相关。由于标准粒子群算法具有很大的随机性,为了更好地避免每个粒子在寻优过程中被淘汰或陷入局部极小值,本发明实施例将种群进化速度因子、种群聚集度因子、种群早熟收敛程度因子和种群多样性因子作为粒子的搜索状态变化特征,并根据当前粒子群的分布状态,自适应调整标准粒子群算法的惯性权重w和学习因子,并对粒子位置进行更新处理,重复利用种群信息进行自适应搜索,从而得到改进后的粒子群优化算法。
具体地,在本发明实施例中,种群进化速度因子是通过当前迭代的全局最优值和上一次迭代的全局最优值之间的比值得到。由于粒子早期飞行速度和进化速度较快,当经过若干次迭代之后,粒子群容易出现进化停滞现象,则表明粒子群算法出现停滞或获取到最优值。在本发明实施例中,当计算适应度函数的最小值时,种群进化速度因子对应的公式为:
Figure BDA0002266075510000071
当计算适应度函数的最小值时,种群进化速度因子对应的公式为:
Figure BDA0002266075510000072
其中,αk表示第k次迭代的种群进化速度因子,α∈(0,1],种群进化速度因子a考虑了以前迭代的运行状况,初始时,设置a=1;
Figure BDA0002266075510000073
表示第k次迭代的全局最优值,
Figure BDA0002266075510000074
表示第k-1次迭代的全局最优值,并且第k次迭代的全局最优值总是优于或等于第k-1次迭代的全局最优值。当a值越小,种群的进化速度越快,此时需要增加惯性权重w值,从而增强全局搜索能力,提高收敛速度;当a值越大,种群的进化速度越慢,直到a=1时,说明粒子群中的所有粒子具有同一性,惯性权重w应该减小,从而增强局部搜索能力。种群进化速度因子a值的增大或减小,说明粒子越靠近或越远离粒子群的当前最佳位置,即粒子的搜索范围也随之缩小或增加。
进一步地,在本发明实施例中,种群聚集度因子是通过当前迭代的全局最优值和当前迭代的粒子适应度平均值之间的比值得到的,该因子表示所有粒子当前的聚集程度。在标准粒子群算法中,早期的粒子分布较分散,当经过若干次迭代之后,粒子容易陷入局部最优或聚集到全局最优点。在本发明实施例中,当计算适应度函数的最小值时,种群聚集度因子对应的公式为:
Figure BDA0002266075510000075
当计算适应度函数的最大值时,种群聚集度因子对应的公式为:
Figure BDA0002266075510000076
其中,βk表示第k次迭代迭代的种群聚集度因子,β∈(0,1],种群聚集度因子β只考虑当前迭代的运行状况;
Figure BDA0002266075510000077
表示第k次迭代所有粒子适应度的平均值,
Figure BDA0002266075510000081
fi k表示第k次迭代中第i个粒子的适应度值,N表示有N个粒子,并且第k次迭代的全局最优值总是优于或等于第k次迭代中所有粒子适应度的平均值。对于靠近粒子群当前最佳位置的点(即β值较大,种群聚集度越高,β=1说明粒子群聚集到一个点上),算法容易进入局部最优,惯性权重w应该增大,从而使粒子尽量发散,扩大搜索范围,这样粒子群就容易跳出局部最优,提高粒子群的全局寻优能力;对于远离粒子群当前最佳位置的点(即β值较小,种群聚聚集度越低),代表种群多样性越强,应该减小惯性权重w来缩小粒子群搜索空间,从而提高粒子群的局部寻优能力和寻优精度。
进一步地,在本发明实施例中,种群早熟收敛程度因子是通过当前迭代的全局最优值和当前迭代的粒子适应度平均值之间的差值得到的。在粒子群算法运行过程中,如果粒子发现一个当前最优位置,其他粒子迅速向其靠拢,如果该最优位置为一局部最优点,粒子群就无法在解空间内重新搜索,导致算法陷入局部最优,出现了早熟收敛现象。种群早熟收敛程度表示在进化过程中,粒子多样性逐渐丧失,粒子群表现出强烈的趋同性,虽然收敛速度快,但容易发生早熟收敛现象。然而,降低粒子群的趋同性又会影响算法的收敛速度,在本发明实施例中,通过如下公式获取种群早熟收敛程度,公式为:
Figure BDA0002266075510000082
其中,γk表示第k次迭代的种群早熟收敛程度因子,种群早熟收敛程度因子γ值越小,说明种群越早趋于早熟收敛,在本发明实施例中,设置早熟收敛阈值为0.001;
Figure BDA0002266075510000083
表示对粒子适应度值优于
Figure BDA0002266075510000084
的所有粒子的平均适应度值。
在本发明实施例中,根据种群进化速度因子a、种群聚集度因子β和种群早熟收敛程度因子γ对惯性权重w进行动态调整,将权值与粒子寻优过程相结合,并通过种群早熟收敛程度调整权值,以达到调整种群多样性的目的。根据上述实施例的分析,惯性权重w值随着种群进化速度因子a的增大而减小,随着种群聚集度因子β的增大而增大。
具体地,在本发明实施例中,由于惯性权重w是标准粒子群算法的一个重要参数,对平衡算法的全局搜索能力和局部开发能力有着重要的作用,迭代初期较大的惯性权重w有利于全局搜索,并增加种群的多样性,能够以较快速度在大范围空间内逼近最优解;而后期粒子聚集程度较高,较小的惯性权重w可以提高算法的局部开发能力,提高算法的收敛精度。在现有改进的粒子群算法中,当惯性权重w满足线性或非线性递减规律时,算法的性能较好,但在现有的改进算法中,如果早期就找到全局最优点,则因其权重过大有可能跳出最优区域,因而不在其附近探索,从而降低最优点的搜寻能力,无法达到收敛;并且粒子在寻优的过程中,一步步靠近最低点,会导致算法收敛速度较慢。为克服标准粒子群算法固定参数的缺点,本发明实施例根据粒子自身的搜索特征和实际状态的变化来动态改变惯性权重w的大小,从而提高算法求解高维和多峰等复杂问题时的寻优精度和收敛速度。
进一步地,本发明实施例是基于高斯函数(Gaussian Function)在对称右侧区间内递减的思路对标准粒子群算法进行改进,使得改进后的粒子群优化算法在线性与非线性之间呈现良好的平滑过渡性,符合大多数标准群算法中惯性权重的设计要求(即迭代初期惯性权重w应较大,后期逐步减小)。在统计学与概率论中,高斯分布又称正态分布,也称“常态分布”,是一个连续型的分布函数,公式为:
Figure BDA0002266075510000091
并且,高斯函数是正态分布的密度函数,其概率密度函数对应的公式为:
Figure BDA0002266075510000092
其中,A表示曲线尖峰的高度,B表示尖峰中心的坐标,C表示标准方差,A、B与C为实常数,且A>0;μ表示概率分布的均值,决定了其位置(对应着整个分布的中心),﹣∞<μ<+∞;σ表示概率分布的标准差,决定了分布的幅度(对应于分布的宽度,σ越大越矮胖,σ越小越瘦高),σ>0。
基于高斯密度函数对称且右侧图形呈递减趋势的思路,满足粒子群算法取得较好性能时,惯性权重呈递减的规律。需要说明的是,惯性权重w值的递减变化应该在迭代初期和迭代后期变化缓慢,具体表现为:在迭代初期惯性权重能较长时间地取得较大的值,从而加强算法的全局搜索能力,提高搜索效率;在迭代后期能较长时间地取得较小的值,从而加强算法的局部搜索能力,提高搜索精度。从而保证粒子速度不会长时间上升,导致粒子飞出搜索空间,也不会迅速下降导致粒子停止移动,同时也避免了粒子容易陷入局部最优。根据上述实施例对惯性权重w的分析,惯性权重w取值与种群进化速度因子、种群聚集度因子和种群早熟收敛程度因子有着密切的关系:惯性权重w值随着种群进化速度变慢而减少,随着种群聚合度变高而增加。因此,在本发明实施例中,首先构建的集合J与种群进化速度因子a和种群聚集度因子β之间的映射关系,公式为:
Figure BDA0002266075510000101
基于高斯函数对称且右侧图形呈递减趋势的思路,根据上述集合J的映射关系,以及惯性权重w值的变化特性,构建惯性权重公式,公式为:
Figure BDA0002266075510000102
w∈[0,wmax);
其中,wmax表示最大惯性权重,本发明实施例设置为0.9;wmin表示最小惯性权重,本发明实施例设置为0.4;m和n表示经验常数;k表示第k次迭代次数;a表示种群进化速度因子;β表示种群聚集度因子;γ表示种群早熟收敛程度;
Figure BDA0002266075510000103
表示在第k次迭代中所有粒子适应度的平均值;
Figure BDA0002266075510000104
表示在第k次迭代中所有粒子适应度的最大值;
Figure BDA0002266075510000105
表示在第k次迭代中所有粒子适应度的最小值。当群体的最优适应值长时间未发生变化,说明粒子群很可能出现早熟收敛现象,根据惯性权重公式,应自适应地增大惯性权重w,以使粒子具有较大的速度,从而有效地跳出局部最优,避免早熟收敛,所以采用
Figure BDA0002266075510000111
Figure BDA0002266075510000112
否则采用线性递减惯性权重进行更新。迭代过程中,如果粒子比较发散,粒子之间的差异较大,平均粒子适应值和群体最小适应值之差比较大,
Figure BDA0002266075510000113
的比值较大,种群进化速度因子a较大,种群聚集度因子β较小,所以,惯性权重w需要减小,加强粒子局部搜索;后期,随着粒子快收敛,即出现“聚集”现象,算法容易陷入局部极值,
Figure BDA0002266075510000114
的比值较小,种群进化速度因子a变小,种群聚集度因子β变大,所以,惯性权重w需要增大,算法从局部极值区域中跳出,扩大粒子搜索范围,找到全局最优解。本发明实施例综合考虑种群进化速度、种群聚集度、种群早熟收敛程度和粒子适应值,使得改进后的粒子群优化算法在每次迭代后通过自适应调整粒子的惯性权重,这种改进策略可以在每一步迭代过程中都较好地平衡全局与局部搜索能力,在全局收敛和收敛速度之间得到很好的平衡。
在上述实施例的基础上,在所述根据粒子群当前迭代中粒子的搜索状态变化特征,构建惯性权重之后,所述方法还包括:
根据标准粒子群算法中自身学习因子和社会学习因子的变化特性,获取最优稳定性参数;
根据所述最优稳定性参数和惯性权重,构建改进后的粒子群优化算法的自身学习因子和社会学习因子。
在现有的标准粒子群算法中,搜索最优解时是由两个随机学习因子确定的,分别为自身学习因子c1和社会学习因子c2。当自身学习因子c1=0时,称为“无私型粒子群算法”,此时算法会迅速丧失种群多样性,易陷入局部最优而无法跳出;当社会学习因子c2=0时,称为“自我认知型粒子群算法”,此时算法完全没有信息的社会共享,会导致算法收敛速度缓慢;当自身学习因子c1和社会学习因子c2都等于0时,粒子会按照当前速度进行飞行,直到运动至边界处。而当自身学习因子c1和社会学习因子c2都不等于0时,称为“完全型粒子群算法”,此时算法更容易保持收敛速度和搜索效果的平衡,是较好的选择,其中,若自身学习因子c1大于社会学习因子c2,表示单个粒子单独寻优的时间大于全局寻优时间,将会导致粒子群在空间中搜索时间过长;若自身学习因子c1小于社会学习因子c2,表示粒子群全局寻优时间大于单个粒子单独寻优时间,将会导致粒子群过早的收敛于一个局部最优值。
基于上述实施例对自身学习因子c1和社会学习因子c2的分析,在本发明实施例中,对两个学习因子进行异步改变:在迭代初期,应增大自身学习因子c1,减小社会学习因子c2,因为在群体形成的初期,粒子个体对群体的认同度低,算法在进化过程中的很长一段时间内具有较强的“自我认知”能力,引导粒子向有良好信息的可行空间区域飞行,增强粒子的搜索范围,可以避免算法陷入局部最优,保证初期寻优的多样性;在迭代后期,应减小自身学习因子c1,增大社会学习因子c2,粒子个体对自身的认同度低,可以快速获得较强的“社会认知”能力,有助于局部精细搜索,使粒子快速收敛于全局最优值,保证了粒子群体的寻优收敛,从而提高算法的收敛精度和收敛速度。本发明实施例通过对标准粒子群优化算法的稳定性进行分析,并根据自身学习因子c1和社会学习因子c2的变化特性,构建改进后的粒子群优化算法的自身学习因子和社会学习因子。首先,构建粒子群的速度更新公式,在本发明实施例中,将问题空间简化为一维的,设置
Figure BDA0002266075510000121
r1和r2表示随机函数,针对粒子群中某一粒子i的运动过程,设置pbesti(i=1,2,…,N)和gbest在粒子i运动过程中保持不变,分别记为:pi和pg,则速度更新公式可表示为:
Figure BDA0002266075510000122
或,
Figure BDA0002266075510000123
位置更新公式为:
Figure BDA0002266075510000131
进一步地,在本发明实施例中,将公式
Figure BDA0002266075510000132
的时间项向下一次迭代推进一步,并将位置更新公式带入推进一步后的公式中,得到:
Figure BDA0002266075510000133
根据
Figure BDA0002266075510000134
得到
Figure BDA0002266075510000135
并带入至
Figure BDA0002266075510000136
中,从而消除公式中的
Figure BDA0002266075510000137
得到:
Figure BDA0002266075510000138
由此可知,粒子的速度变化过程是一个二阶差分方程,当设置的pi和pg为常数时,速度变化与pi和pg无关。基于上述实施例的公式转换,将速度更新公式带入到位置更新公式中,并消掉
Figure BDA0002266075510000139
可以得到位置变化过程,也是一个二阶差分方程,公式为:
Figure BDA00022660755100001310
进一步地,在标准粒子群算法中,稳定性指算法对于计算过程中的误差(舍入误差、截断误差等)不敏感,即稳定的算法能得到原问题的相邻问题的精确解,对于单个粒子在搜索空间的稳定性,无论从速度还是位置变化过程进行分析,这些的变化过程均可看作一个连续的过程,对应一个典型的二阶齐次线性微分方程,公式为:
Figure BDA00022660755100001311
Figure BDA00022660755100001312
其中,e1和e2为特征方程
Figure BDA00022660755100001313
的根。
在本发明实施例中,稳定性决定于特征根的位置,若特征根位于单位圆内(|e1,2|<1),则解是渐近稳定的。设置
Figure BDA0002266075510000141
因为c1和c2是非负常数,
Figure BDA0002266075510000142
所以,
Figure BDA0002266075510000143
进一步地,若存在两个实根,则
Figure BDA0002266075510000144
且|e1,2|<1,即:
Figure BDA0002266075510000145
或,
Figure BDA0002266075510000146
对上述公式进行求解,得到:
Figure BDA0002266075510000147
或,
Figure BDA0002266075510000148
若存在两个复根,则
Figure BDA0002266075510000149
且|e1,2|<1,即:
Figure BDA00022660755100001410
求解得到:
Figure BDA00022660755100001411
根据上述实施例对稳定性的分析过程可知,
Figure BDA00022660755100001412
Figure BDA00022660755100001413
所以,当c1,2=(w+3)/2时是稳定的。由于自身学习因子c1是递减的,可根据上述实施例的惯性权重公式获取得到;而社会学习因子c2是递增的,可根据上述实施例提供的惯性权重w公式,获取与社会学习因子c2对应的惯性权重w’,从而得到社会学习因子c2,公式分别为:
Figure BDA00022660755100001414
Figure BDA0002266075510000151
Figure BDA0002266075510000152
步骤102,根据所述改进后的粒子群优化算法,对粒子位置进行更新,并对粒子位置进行越界处理,得到多个聚类中心。其中,所述根据所述改进后的粒子群优化算法,对粒子位置进行更新,具体包括:
根据惯性遗忘因子和种群多样性因子,对粒子位置进行迭代更新,若满足预设收敛条件,则停止更新;所述惯性遗忘因子根据惯性权重和粒子当前位置获取得到,所述种群多样性因子根据粒子当前位置和粒子最优位置之间的离散程度获取得到。
在标准粒子群算法中,粒子位置的更新是通过当前位置
Figure BDA0002266075510000153
认知部分
Figure BDA0002266075510000154
和社会部分
Figure BDA0002266075510000155
完成的。然而,认知部分并没有向其他粒子传递信息,粒子间信息的共享是通过社会部分中的
Figure BDA0002266075510000156
实现的,除了
Figure BDA0002266075510000157
向其他粒子传递信息外,没有其他传递信息的机制。因此,个体最优粒子
Figure BDA0002266075510000158
和全局最优粒子
Figure BDA0002266075510000159
是两个非常重要的位置,它们对其他粒子的位置更新具有很大的影响。当迭代若干次后,所有粒子会趋向pg,但是,当pg是一个局部极值点时,种群多样性较差,这些粒子就很难跳出这个局极值点,从而出现“早熟收敛”现象,降低算法的全局搜索性能。
在本发明实施例中,为了避免种群多样性较差带来的“早熟”问题,采用惯性遗忘因子
Figure BDA00022660755100001510
给予粒子跳跃能力,并引入种群多样性因子εk,以增强种群的多样性,基于惯性遗忘因子和种群多样性因子的位置更新公式为:
Figure BDA00022660755100001511
在本发明实施例中,种群多样性因子表示种群中个体的相似程度,是通过粒子当前位置和粒子最优位置之间的离散程度获取得到。而粒子收敛位置的差别,和粒子的历代最优位置以及当代最优位置有关,表达了种群之间的差异以及达到收敛位置的难易程度。因此,种群多样性可采用粒子相似程度来度量,即粒子目前位置和历代最优位置以及当代最优位置的相似程度,公式为:
Figure BDA0002266075510000161
Figure BDA0002266075510000162
Figure BDA0002266075510000163
其中,εk表示第k次迭代的种群多样性因子,代表聚集距离变化的过程,ε∈(0,1],种群多样性因子ε考虑了以前迭代的运行状况;
Figure BDA0002266075510000164
表示第k次迭代的粒子位置与当前种群最优位置的平均距离;
Figure BDA0002266075510000165
表示第k次迭代的粒子位置与该粒子历史最优位置的平均距离;
Figure BDA0002266075510000166
表示第k次迭代的粒子i在第d维的位置;
Figure BDA0002266075510000167
表示第k次迭代的所有粒子在第d维的最优位置;
Figure BDA0002266075510000168
为表示第k-1次迭代的粒子i在第d维的位置。在本发明实施例中,采用已有平均聚集距离和当前平均聚集距离,若种群中所有粒子完全相同,则ε=1,多样性最差。
进一步地,基于惯性遗忘因子和种群多样性因子的位置更新公式,对于每一次迭代,w、c、r和ε均会变化。对现有位置更新公式的加权改进(添加了高斯扰动因子),使粒子前一次的位置对新位置的选择影响加大,可以有效地促使粒子跳出当前局部最优位置,扩大搜索空间,增加寻优机会;当现有算法出现种群多样性较差时(即ε接近于1时),引入种群多样性因子,用于控制粒子原位置对新粒子位置的影响度,在保证粒子在可行搜索空间内进行寻优的同时,减少了搜索过程中粒子位置选择的盲目性,可以较好地维护种群的多样性。而且该位置更新策略舍去了原始标准粒子群算法中的速度项,使得迭代方程也由原来的二阶降为一阶,提高算法优化效率。
进一步地,在本发明实施例中,对基于惯性遗忘因子和种群多样性因子的位置更新公式的算法随机收敛性进行分析,考虑粒子群系统处于停止状态,即粒子的个体最优粒子
Figure BDA0002266075510000171
和全局最优粒子
Figure BDA0002266075510000172
不再随时间变化,所以εk也不再随时间变化。在这种情况下,所有粒子独立进化,因此,仅需要考虑第i个粒子。同时,由于每个粒子也是独立更新,所以可仅考虑一维情况。不失一般性的条件下,可以省略粒子下标和维数,令
Figure BDA0002266075510000173
则可将上述基于惯性遗忘因子和种群多样性因子的位置更新公式转换为:
Figure BDA0002266075510000174
由于特征方程
Figure BDA0002266075510000175
收敛到一个稳定点的条件是
Figure BDA0002266075510000176
在这种情况下,
Figure BDA0002266075510000177
由于
Figure BDA0002266075510000178
Figure BDA0002266075510000179
是随机变量,则粒子群的平均行为可通过对
Figure BDA00022660755100001710
Figure BDA00022660755100001711
取期望获得,所以位置更新极限公式如下:
Figure BDA00022660755100001712
Figure BDA00022660755100001713
Figure BDA00022660755100001714
由于
Figure BDA00022660755100001715
即2w-2<c1+c2<2+2w,所以当收敛条件为2w-2<c1+c2<2+2w时,所以给定的条件满足c1,2>0,位置更新将收敛于
Figure BDA00022660755100001716
在上述实施例的基础上,所述对粒子位置进行越界处理,包括:
根据粒子越界重置公式,对越界的粒子的当前位置进行重新设置,所述粒子越界重置公式为:
Figure BDA0002266075510000181
其中,xid表示越界重置后的第i个粒子第d维的位置,Xmax表示最大位置边界,Xmin表示最小位置边界,rand表示随机函数。如果粒子位置超过设定的最大位置,则通过粒子越界重置公式,将新的位置设置为靠近最大位置处;同理,如果粒子位置超过设定的最小位置,则粒子越界重置公式将新的位置设置为靠近最小位置处,满足粒子原来位置的需求。
在本发明实施例中,当种群粒子的位置超过设定的范围,称为“越界”现象。在标准粒子群算法中,一般将粒子位置越界设置公式定义为:
Figure BDA0002266075510000182
然而,通过现有粒子位置越界设置公式可知,这种策略会导致粒子的该维坐标会长时间停留在边界,或在边界徘徊,这样不利于粒子位置的更新。若粒子出现“越界”现象,因此,根据本发明实施例提供的粒子越界重置公式,重新设置粒子的当前位置,能够使逃逸出去的粒子又回到种群中,而且其值也不再单一的确定为边界值,保证了如果粒子过多发生逃逸时新种群的多样性。
步骤103,将多个聚类中心作为K-Means聚类算法的初始聚类中心,得到自适应粒子群的客户分类模型;
步骤104,根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
在本发明实施例中,假设n个样本数据构成的样本数据集D={x1,x2,…,xn},其中,xi表示p维度的特征向量,ej表示第j(j=1,2,…,k,k表示簇的个数)个簇的聚类中心,dist(x,ej)表示数据对象x到对应的聚类中心ej的距离,通过K-Means聚类问题找到一个划分{E1,E2,…,Ek},使得总类内聚集度和E达到最小,公式为:
Figure BDA0002266075510000191
进一步地,当聚类中心确定后,可以由最近邻法则划分到最近的簇中。即数据对象xi(i=1,2,…,n)与聚类中心ej(j=1,2,…,k)之间的距离满足所有数据对象与该聚类中心的最小值,则数据对象xj属于该聚类,公式为:
Figure BDA0002266075510000192
在本发明实施例中,在使用改进的粒子群优化算法求解聚类问题时,每一个粒子就是问题的一个可行解,所有粒子组成的粒子群,即解集。根据对聚类结果理解的不同,对解集的描述可以由以下两种形式:一种是以簇C1,C2,…,Ck为解集;另一种是以聚类中心ej(j=1,2,…,k)为解集,即聚类结果。本发明实施例采用后者,即采用以聚类中心结合作为聚类问题的对应解,通过结合粒子群优化算法求出的解是K个聚类中心组成的最终解。根据上述实施例提供的改进后的粒子群优化算法,得到了粒子i的速度和位置更新公式,从而得到基于改进粒子群优化的K-Means聚类算法,该算法聚类效果的衡量通常与其适应值函数有关,然后,再通过粒子群的迭代以搜索到最佳的聚类中心。在本发明实施例中,采用的适应度函数为K-Means聚类的总类内聚集度和E的倒数,聚类目的是为了是相同类更相似,类之间不相似,即总类内聚集度和E达到最小,故粒子群适应度函数应达到最大,计算公式如下:
Figure BDA0002266075510000193
从而对目标客户群的购买行为特征数据集进行聚类处理,得到目标客户群的客户分类结果。
本发明实施例提供的一种基于自适应粒子群的客户分类方法,通过采用不同策略调整惯性权重,对粒子群算法进行改进,提高了收敛精度和收敛效率,避免了局部极小值的问题,可以有效、准确地对消费客户进行划分,从而挖掘不同类别客户的价值。
在本发明一实施例中,针对鲜食葡萄的客户人群进行说明,根据客户对鲜食葡萄的购买认知偏好与购买行为数据做实证分析。充分考虑样本的分散性与随机性,调查对象分为不同性别、年龄、受教育程度、职业性质、家庭规模以及家庭月平均收入情况。首先,确定客户特征,在零售鲜食葡萄的客户分类的实际应用中,不需要对全部的这些客户特征进行分析,在认识清楚数据特征的基础上,发现客户分类主要关注客户的消费价值观跟客户的相关关系,在本发明实施例中,主要研究家庭人均收入对鲜食葡萄消费价值观的影响,鲜食葡萄消费价值观包括对产品外观、品质、质量安全性等在内的量表题(共有14个特征属性),具体如表1所示:
表1鲜食葡萄购买行为价值观的特征数据
Figure BDA0002266075510000201
Figure BDA0002266075510000211
通过本发明实施例提供的自适应粒子群的客户分类方法,对上述鲜食葡萄购买行为价值观的特征数据进行聚类分析,从而得客户分类结果。
在上述实施例的基础上,在所述根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果之前,所述方法还包括:
对所述目标客户群的购买行为特征数据集进行预处理,得到预处理后的购买行为特征数据集,以使得所述自适应粒子群的客户分类模型对预处理后的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
在本发明实施例中,在对数据集进行聚类之前,需要对样本进行预处理,不仅可以提髙聚类的效果,还能够降低算法所需的运行时间,从而提高粒子群聚类算法的性能。在本发明实施例中,预处理主要是删除原始数据集中的无关数据、重复数据和平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值和异常值等。
图2为本发明实施例提供的基于自适应粒子群的客户分类系统的结构示意图,如图2所示,本发明实施例提供了一种基于自适应粒子群的客户分类系统,包括第一处理模块201、第二处理模块202、模型构建模块203和客户分类模块204,其中,第一处理模块用于根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法;第二处理模块用于根据所述改进后的粒子群优化算法,对粒子位置进行更新,并对粒子位置进行越界处理,得到多个聚类中心;模型构建模块用于将多个聚类中心作为K-Means聚类算法的初始聚类中心,得到自适应粒子群的客户分类模型;客户分类模块用于根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
本发明实施例提供的一种基于自适应粒子群的客户分类系统,通过采用不同策略调整惯性权重,对粒子群算法进行改进,提高了收敛精度和收敛效率,避免了局部极小值的问题,可以有效、准确地对消费客户进行划分,从而挖掘不同类别客户的价值。
在上述实施例的基础上,所述系统还包括:预处理模块,用于对所述目标客户群的购买行为特征数据集进行预处理,得到预处理后的购买行为特征数据集,以使得所述自适应粒子群的客户分类模型对预处理后的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
本发明实施例提供的系统是用于执行上述各方法实施例的,具体流程和详细内容请参照上述实施例,此处不再赘述。
图3为本发明实施例提供的电子设备结构示意图,参照图3,该电子设备可以包括:处理器(processor)301、通信接口(Communications Interface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行如下方法:根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法;根据所述改进后的粒子群优化算法,对粒子位置进行更新,并对粒子位置进行越界处理,得到多个聚类中心;将多个聚类中心作为K-Means聚类算法的初始聚类中心,得到自适应粒子群的客户分类模型;根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的基于自适应粒子群的客户分类方法,例如包括:根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法;根据所述改进后的粒子群优化算法,对粒子位置进行更新,并对粒子位置进行越界处理,得到多个聚类中心;将多个聚类中心作为K-Means聚类算法的初始聚类中心,得到自适应粒子群的客户分类模型;根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于自适应粒子群的客户分类方法,其特征在于,包括:
根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法;
根据所述改进后的粒子群优化算法,对粒子位置进行更新,并对粒子位置进行越界处理,得到多个聚类中心;
将多个聚类中心作为K-Means聚类算法的初始聚类中心,得到自适应粒子群的客户分类模型;
根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
2.根据权利要求1所述的基于自适应粒子群的客户分类方法,其特征在于,所述根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法,包括:
根据粒子群当前迭代中粒子的搜索状态变化特征,构建惯性权重,所述搜索状态变化特征包括种群进化速度因子、种群聚集度因子和种群早熟收敛程度因子;
根据粒子群下一次迭代中粒子的搜索状态变化特征,对所述惯性权重进行调整,以得到改进后的粒子群优化算法;
其中,所述种群进化速度因子根据当前迭代的全局最优值和上一次迭代的全局最优值之间的比值得到;所述种群聚集度因子根据当前迭代的全局最优值和当前迭代的粒子适应度平均值之间的比值得到;所述种群早熟收敛程度因子根据当前迭代的全局最优值和当前迭代的粒子适应度平均值之间的差值得到。
3.根据权利要求2所述的基于自适应粒子群的客户分类方法,其特征在于,在所述根据粒子群当前迭代中粒子的搜索状态变化特征,构建惯性权重之后,所述方法还包括:
根据标准粒子群算法中自身学习因子和社会学习因子的变化特性,获取最优稳定性参数;
根据所述最优稳定性参数和惯性权重,构建改进后的粒子群优化算法的自身学习因子和社会学习因子。
4.根据权利要求2所述的基于自适应粒子群的客户分类方法,其特征在于,所述根据所述改进后的粒子群优化算法,对粒子位置进行更新,包括:
根据惯性遗忘因子和种群多样性因子,对粒子位置进行迭代更新,若满足预设收敛条件,则停止更新;所述惯性遗忘因子根据惯性权重和粒子当前位置获取得到,所述种群多样性因子根据粒子当前位置和粒子最优位置之间的离散程度获取得到。
5.根据权利要求4所述的基于自适应粒子群的客户分类方法,其特征在于,所述对粒子位置进行越界处理,包括:
根据粒子越界重置公式,对越界的粒子的当前位置进行重新设置,所述粒子越界重置公式为:
Figure FDA0002266075500000021
其中,xid表示越界重置后的第i个粒子第d维的位置,Xmax表示最大位置边界,Xmin表示最小位置边界,rand表示随机函数。
6.根据权利要求1所述的基于自适应粒子群的客户分类方法,其特征在于,在所述根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果之前,所述方法还包括:
对所述目标客户群的购买行为特征数据集进行预处理,得到预处理后的购买行为特征数据集,以使得所述自适应粒子群的客户分类模型对预处理后的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
7.一种基于自适应粒子群的客户分类系统,其特征在于,包括:
第一处理模块,用于根据粒子群中粒子的搜索状态变化特征,对标准粒子群算法的惯性权重进行动态调整,得到改进后的粒子群优化算法;
第二处理模块,用于根据所述改进后的粒子群优化算法,对粒子位置进行更新,并对粒子位置进行越界处理,得到多个聚类中心;
模型构建模块,用于将多个聚类中心作为K-Means聚类算法的初始聚类中心,得到自适应粒子群的客户分类模型;
客户分类模块,用于根据所述自适应粒子群的客户分类模型对目标客户群的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
8.根据权利要求7所述的基于自适应粒子群的客户分类系统,其特征在于,所述系统还包括:预处理模块,用于对所述目标客户群的购买行为特征数据集进行预处理,得到预处理后的购买行为特征数据集,以使得所述自适应粒子群的客户分类模型对预处理后的购买行为特征数据集进行聚类处理,得到所述目标客户群的客户分类结果。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述基于自适应粒子群的客户分类方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述基于自适应粒子群的客户分类方法的步骤。
CN201911088225.6A 2019-11-08 2019-11-08 基于自适应粒子群的客户分类方法及系统 Active CN110909773B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911088225.6A CN110909773B (zh) 2019-11-08 2019-11-08 基于自适应粒子群的客户分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911088225.6A CN110909773B (zh) 2019-11-08 2019-11-08 基于自适应粒子群的客户分类方法及系统

Publications (2)

Publication Number Publication Date
CN110909773A true CN110909773A (zh) 2020-03-24
CN110909773B CN110909773B (zh) 2022-08-02

Family

ID=69816931

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911088225.6A Active CN110909773B (zh) 2019-11-08 2019-11-08 基于自适应粒子群的客户分类方法及系统

Country Status (1)

Country Link
CN (1) CN110909773B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111489021A (zh) * 2020-03-31 2020-08-04 黑龙江大学 一种基于粒子群优化bp神经网络的甜菜产量预测方法
CN112446435A (zh) * 2020-12-10 2021-03-05 长春理工大学 一种城市数据分类方法及系统
CN115529606A (zh) * 2021-06-25 2022-12-27 中国移动通信集团吉林有限公司 参数更新方法、系统以及电子设备
CN117172831A (zh) * 2023-11-02 2023-12-05 国网经济技术研究院有限公司 基于用户行为与数量演变的动态分群方法和系统
CN117493979A (zh) * 2023-12-29 2024-02-02 青岛智简尚达信息科技有限公司 一种基于数据处理的客户分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140172125A1 (en) * 2012-09-29 2014-06-19 Operation Technology, Inc. Dynamic parameter tuning using particle swarm optimization
CN108830372A (zh) * 2018-06-08 2018-11-16 湖北工业大学 一种解决旅行商问题的自适应粒子群优化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140172125A1 (en) * 2012-09-29 2014-06-19 Operation Technology, Inc. Dynamic parameter tuning using particle swarm optimization
CN108830372A (zh) * 2018-06-08 2018-11-16 湖北工业大学 一种解决旅行商问题的自适应粒子群优化方法

Non-Patent Citations (14)

* Cited by examiner, † Cited by third party
Title
BOŻENA BOROWSKA ET AL.: "Nonlinear inertia weight in particle swarm optimization》", 《IEEE XPLORE》 *
FENGLAN LUO: "《An Improved K-means Algorithm and Its Application in Customer Classification of Network Enterprises》", 《APPLIED MECHANICS AND MATERIALS》 *
I DEWA AYU AGUNG YUNITA PRIMANDARI ET AL.: "《Customer Segmentation Using Particle Swarm Optimization and K-Means Algorithm》", 《IDCTA》 *
何琼月 等: "基于聚集度与向量相似度的粒子群算法", 《计算机应用与软件》 *
周俊 等: "粒子群优化算法中惯性权重综述", 《广东电力》 *
姜文斌 等: "基于自适应权重法的K-means模型对遥感图像分割", 《计算机应用与软件》 *
封京梅: "一种改进的粒子群优化算法", 《云南民族大学学报(自然科学版)》 *
张选平 等: "一种动态改变惯性权的自适应粒子群算法", 《西安交通大学学报》 *
张锐 等: "基于动态改变惯性权自适应粒子群算法的电厂负荷分配研究", 《制造业自动化》 *
杨杰 等: "基于相似度的改进粒子群优化算法", 《计算机工程与应用》 *
熊智挺 等: "一种并行的自适应量子粒子群算法", 《计算机系统应用》 *
瞿小宁: "K均值聚类算法在商业银行客户分类中的应用", 《计算机仿真》 *
邵洪涛 等: "带变异算子的非线性惯性权重PSO算法", 《计算机技术与发展》 *
黄泽霞 等: "惯性权自适应调整的量子粒子群优化算法", 《上海交通大学学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111489021A (zh) * 2020-03-31 2020-08-04 黑龙江大学 一种基于粒子群优化bp神经网络的甜菜产量预测方法
CN112446435A (zh) * 2020-12-10 2021-03-05 长春理工大学 一种城市数据分类方法及系统
CN112446435B (zh) * 2020-12-10 2023-12-05 长春理工大学 一种城市数据分类方法及系统
CN115529606A (zh) * 2021-06-25 2022-12-27 中国移动通信集团吉林有限公司 参数更新方法、系统以及电子设备
CN117172831A (zh) * 2023-11-02 2023-12-05 国网经济技术研究院有限公司 基于用户行为与数量演变的动态分群方法和系统
CN117172831B (zh) * 2023-11-02 2024-01-23 国网经济技术研究院有限公司 基于用户行为与数量演变的动态分群方法和系统
CN117493979A (zh) * 2023-12-29 2024-02-02 青岛智简尚达信息科技有限公司 一种基于数据处理的客户分类方法

Also Published As

Publication number Publication date
CN110909773B (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
CN110909773B (zh) 基于自适应粒子群的客户分类方法及系统
CN113574325B (zh) 通过选择控制设置来控制环境的方法和系统
US11423295B2 (en) Dynamic, automated fulfillment of computer-based resource request provisioning using deep reinforcement learning
CN106548210B (zh) 基于机器学习模型训练的信贷用户分类方法及装置
CN107766929B (zh) 模型分析方法及装置
US10068186B2 (en) Model vector generation for machine learning algorithms
Sobolewski et al. Concept Drift Detection and Model Selection with Simulated Recurrence and Ensembles of Statistical Detectors.
CN109960808B (zh) 一种文本识别方法、装置、设备及计算机可读存储介质
CN113064879A (zh) 数据库参数调整方法、装置及计算机可读存储介质
US11699106B2 (en) Categorical feature enhancement mechanism for gradient boosting decision tree
US20220180209A1 (en) Automatic machine learning system, method, and device
Gramacy et al. Sequential design for optimal stopping problems
Makarova et al. Automatic termination for hyperparameter optimization
Wang et al. A new chaotic starling particle swarm optimization algorithm for clustering problems
CN113255873A (zh) 一种聚类天牛群优化方法、系统、计算机设备和存储介质
US11914672B2 (en) Method of neural architecture search using continuous action reinforcement learning
CN114417095A (zh) 一种数据集划分方法及装置
Abdelmoniem et al. On the impact of device and behavioral heterogeneity in federated learning
CN109978023A (zh) 面向高维大数据分析的特征选择方法及计算机存储介质
Gias et al. Samplehst: Efficient on-the-fly selection of distributed traces
CN111582429A (zh) 一种基于头脑风暴优化算法求解演化博弈问题的方法
CN116304518A (zh) 用于信息推荐的异质图卷积神经网络模型构建方法及系统
CN113222256A (zh) 一种基于mpso-lstm模型的股票预测方法及系统
Hui et al. A Novel Fuzzy Clustering Recommendation Algorithm Based on PSO
Limberg et al. Prototype-Based Online Learning on Homogeneously Labeled Streaming Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant