CN117312999A - 对象分类方法、装置、计算机设备和存储介质 - Google Patents

对象分类方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN117312999A
CN117312999A CN202311197095.6A CN202311197095A CN117312999A CN 117312999 A CN117312999 A CN 117312999A CN 202311197095 A CN202311197095 A CN 202311197095A CN 117312999 A CN117312999 A CN 117312999A
Authority
CN
China
Prior art keywords
cluster
target
target object
information
information set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311197095.6A
Other languages
English (en)
Inventor
张琳一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202311197095.6A priority Critical patent/CN117312999A/zh
Publication of CN117312999A publication Critical patent/CN117312999A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种对象分类方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取多个目标对象分别对应的对象信息集;分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征;对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征;基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到各个聚类簇分别对应的聚类分数;基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级。本方法属于人工智能技术领域,采用本方法能够提高对象分类的准确性。

Description

对象分类方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种对象分类方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着社会信息化程度的不断提高,企业越来越重视对用户进行价值分析,建立合理的用户价值评估体系,对庞大的用户群体进行分类,从而针对不同的用户群体分别制定不同的服务方案,提高企业收益。
传统方案是通过采集用户的用户行为信息,将用户行为信息对应的用户特征与根据历史经验划分好的每个用户类别对应的用户特征进行比对,将相似度最大的用户类别作为用户的用户类别,存在分类准确性低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高对象分类准确性的对象分类方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
本申请提供了一种对象分类方法。所述方法包括:
获取多个目标对象分别对应的对象信息集;对象信息集包括同一目标对象在资源转移指标和信用指标下分别对应的对象信息;
分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征;
对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征;
基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到各个聚类簇分别对应的聚类分数;
基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级。
本申请还提供了一种对象分类装置。所述装置包括:
对象信息集获取模块,用于获取多个目标对象分别对应的对象信息集;所述对象信息集包括同一目标对象在资源转移指标和信用指标下分别对应的对象信息;
目标对象特征提取模块,用于分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征;
对象聚类模块,用于对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征;
聚类分数确定模块,用于基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到所述各个聚类簇分别对应的聚类分数;
对象价值等级确定模块,用于基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到所述各个目标对象分别对应的对象价值等级。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述对象分类方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述对象分类方法的步骤。
一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述对象分类方法的步骤。
上述对象分类方法、装置、计算机设备、存储介质和计算机程序产品,通过获取多个目标对象分别对应的对象信息集,对象信息集包括同一目标对象在资源转移指标和信用指标下分别对应的对象信息。分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征。对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征。基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到各个聚类簇分别对应的聚类分数。基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级。这样,基于目标对象在资源转移指标和信用指标下分别对应的对象信息,提取目标对象对应的目标对象特征,能够使得目标对象特征更加准确和全面。进而对各个目标对象特征进行聚类得到多个聚类簇,根据各个聚类簇分别对应的聚类分数确定各个目标对分别对应的对象价值等级,能够有效提高对象分类的准确性。
附图说明
图1为一个实施例中对象分类方法的应用环境图;
图2为一个实施例中对象分类方法的流程示意图;
图3为一个实施例中获取对象信息集的流程示意图;
图4为一个实施例中对象分类装置的结构框图;
图5为另一个实施例中对象分类装置的结构框图;
图6为一个实施例中计算机设备的内部结构图;
图7为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的对象分类方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能电视、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端102以及服务器104可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
终端和服务器均可单独用于执行本申请实施例中提供的对象分类方法。
例如,终端获取多个目标对象分别对应的对象信息集,对象信息集包括同一目标对象在资源转移指标和信用指标下分别对应的对象信息。终端分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征。终端对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征。终端基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到各个聚类簇分别对应的聚类分数。终端基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级。
终端和服务器也可协同用于执行本申请实施例中提供的对象分类方法。
例如,终端向服务器发送对象分类请求。服务器基于对象分类请求中携带的目标对象标识,获取多个目标对象分别对应的对象信息集,对象信息集包括同一目标对象在资源转移指标和信用指标下分别对应的对象信息。服务器分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征。服务器对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征。服务器基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到各个聚类簇分别对应的聚类分数。服务器基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级。服务器将各个目标对象分别对应的对象价值等级发送至终端,终端可以对各个目标对象分别对应的对象价值等级进行展示。
在一个实施例中,如图2所示,提供了一种对象分类方法,以该方法应用于计算机设备为例进行说明,计算机设备可以是终端或服务器,由终端或服务器自身单独执行,也可以通过终端和服务器之间的交互来实现。对象分类方法包括以下步骤:
步骤S202,获取多个目标对象分别对应的对象信息集;对象信息集包括同一目标对象在资源转移指标和信用指标下分别对应的对象信息。
其中,目标对象是指待分类的对象,例如,目标对象可以是企业对应的客户群体中的客户、可以是商家对应的会员群体中的会员等。对象信息集是指包含对目标对象进行信息采集得到的对象信息的集合,用于作为对目标对象进行分类的信息依据,对象信息是指目标对象在某项指标下对应的具体的信息。
资源转移指标是指与资源转移相关的指标,例如,资源转移指标可以是资源转移高峰期、资源转移时间间隔、资源转移频率、资源转移量等,资源转移高峰期可以是目标对象在每个资源转移周期中进行资源转移次数最高的时间段,资源转移时间间隔可以是目标对象最近一次资源转移时间到现在的时间间隔,资源转移频率是指目标对象在每个资源转移周期内的资源转移的次数,资源转移量是指目标对象在每个资源转移周期内所转移的资源总量。
信用指标是指用于表征目标对象信用状况的指标。例如,当目标对象为银行客户时,信用指标为用于表征客户消费信用的指标,可以表征客户的个人履约能力、信用偿付历史、行为偏好和身份特质等多方面的信息,个人履约能力根据客户有无违约记录来确定,行为偏好根据客户是否存在大额消费或超前消费习惯来确定,客户身份特质根据客户有无工作来确定。
示例性地,计算机设备获取采集目标对象在资源转移指标和信用指标下分别对应的对象信息,得到目标对象对应的对象信息集。用同样的方式采集其他各个目标对象分别对应的对象信息集,得到多个目标对象分别对应的对象信息集。
步骤S204,分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征。
其中,目标对象特征是指基于目标对象对应的对象信息集提取的对象特征信息,能够表征目标对象在资源转移指标和信用指标下的对象信息。
示例性地,计算机设备从目标对象对应的对象信息集所包含的各个对象信息中,提取各个对象信息分别对应的特征值,即将对象信息转换为相应的特征值,基于各个特征值得到目标对象对应的目标对象特征。通过同样的方法提取其他各个目标对象分别对应的目标对象特征,得到各个目标对象分别对应的目标对象特征。
步骤S206,对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征。
其中,聚类簇是指对各个目标对象进行聚类后得到的、由多个相似的目标对象特征聚在一起形成的一个类簇。聚类中心特征是指聚类簇的中心点。
示例性地,计算机设备基于预设聚类数量对各个目标对象特征进行聚类,得到预设聚类数量的聚类簇和各个聚类簇分别对应的聚类中心特征。
具体地,可以从各个目标对象特征中随机选取预设聚类数量的目标对象特征作为中心点,计算其他各个目标对象特征分别与每个中心点之间的距离,例如,可以是计算目标对象特征和中心点之间的欧式距离。将每个目标对象特征划分至距离最短的中心点所在的簇,进而计算每个簇对应的质心作为下一次迭代的中心点,返回计算其他各个目标对象特征分别与每个中心点之间的距离的步骤执行,直至聚类结果不再发生变化,得到多个聚类簇和各个聚类簇分别对应的中心点,即各个聚类簇分别对应的聚类中心特征。
步骤S208,基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到各个聚类簇分别对应的聚类分数。
其中,聚类分数是指基于聚类簇对应的聚类中心特征确定的聚类簇对应的分数,用于表征聚类簇中的目标对象对应的对象价值。
示例性地,计算机设备根据预设的评分策略,将聚类簇对应的聚类中心特征转换为相应的聚类分数,得到各个聚类簇分别对应的聚类分数。
在一个实施例中,获取各个资源转移指标和信用指标分别对应的权重,基于各个指标分别对应的权重融合各个指标在聚类中心特征中分别对应的特征值,得到聚类中心特征对应的聚类分数,即聚类中心特征所对应的聚类簇的聚类分数。
步骤S210,基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级。
其中,对象价值是指对象能够带来的价值。例如,当对象为企业客户时,对象价值为客户能够为企业提供的价值,即根据客户消费行为、消费特征、信用特征等客户信息确定的客户能够为企业创造的价值,体现了客户对企业的重要性。根据各个目标对象分别对应的对象分数可以将各个目标对象划分为多个价值等级,目标对象对应的价值等级即为目标对象的对象价值等级。
示例性地,计算机设备基于各个聚类簇分别对应的聚类分数,将各个聚类簇划分至相应的对象价值等级,即确定每个聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级。
上述对象分类方法中,通过获取多个目标对象分别对应的对象信息集,对象信息集包括同一目标对象在资源转移指标和信用指标下分别对应的对象信息。分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征。对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征。基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到各个聚类簇分别对应的聚类分数。基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级。可见,本方法属于人工智能技术领域,基于目标对象在资源转移指标和信用指标下分别对应的对象信息,提取目标对象对应的目标对象特征,能够使得目标对象特征更加准确和全面。进而对各个目标对象特征进行聚类得到多个聚类簇,根据各个聚类簇分别对应的聚类分数确定各个目标对分别对应的对象价值等级,能够有效提高对象分类的准确性。
在一个实施例中,如图3所示,获取多个目标对象分别对应的对象信息集,包括:
步骤S302,获取多个初始对象分别对应的初始信息集。
步骤S304,融合各个初始信息集中同一指标对应的对象信息,得到第一参考信息集。
步骤S306,基于各个初始信息集分别与第一参考信息集之间的差异,在各个初始对象中过滤异常对象,得到多个目标对象。
步骤S308,基于第一参考信息集对目标对象对应的初始信息集中缺失的对象信息进行填充,得到各个目标对象分别对应的对象信息集。
其中,初始对象是指直接获取的初步获取的待分类的对象。初始信息集是指初步获取到的初始对象对应的信息集。初始对象可以为信息集中存在异常数据的对象、信息集中存在数据缺失的对象或信息集正常的对象。异常对象是指信息集中存在异常数据的初始对象。
第一参考信息集是指对多个初始信息集进行融合得到的信息集,能够表征初始信息集的一般水平,作为多个初始信息集的代表。
示例性地,计算机设备采集多个初始对象分别对应的初始信息集,基于同一指标在各个初始信息集中分别对应的对象信息,得到各个指标分别对应的参考信息。例如,可以对同一指标在各个初始信息集中分别对应的对象信息求均值,得到各个指标分别对应的参考信息,也可以将同一指标在各个初始信息集中分别对应的对象信息中的中位数确定为该指标对应的参考信息,等等。基于各个指标分别对应的参考信息得到第一参考信息集。
将初始信息集中的各个对象信息分别与第一参考信息集中相应的参考信息进行比对。若通过比对确定初始信息集中存在与参考信息差异大于预设倍数的对象信息,则确定初始信息集中的对象信息存在异常,将初始信息集所对应的初始对象确定为异常对象。在各个初始对象中过滤异常对象,得到各个目标对象。若目标对象对应的初始信息集中的对象信息存在缺失,则从第一参考信息中获取缺失的对象信息所属指标对应的对象信息,填充至目标对象对应的初始信息集中,得到目标对象对应的对象信息集,若目标对象对应的初始信息集中对象信息没有缺失,则将目标对象对应的初始信息集作为目标对象对应的对象信息集。
在一个实施例中,若初始对象对应的初始信息集中的对象信息无异常,且对象信息集中的对象信息存在缺失,确定对象信息集中的信息缺失程度,若缺失程度大于预设阈值时,将该初始对象作为异常对象,若缺失程度小于或等于预设阈值时,将该初始对象作为目标对象,并根据第一参考信息集对目标对象对应的初始信息集进行填充,得到目标对象对应的目标信息集。
上述实施例中,通过将各个初始信息集分别与第一参考信息集进行比对,可以有效过滤存在异常数据的初始信息集,进而根据第一参考信息集对存在信息缺失的初始信息集进行数据完善,能够使得填充得到目标信息集更加接近真实值,提高信息集的准确性。这样基于第一异常参考信息对异常的初始信息集进行过滤,并对存在缺失的初始信息集进行填充,能够得到更加完善准确的目标信息集,能够提高基于各个目标信息集进行对象分类的准确性。
在一个实施例中,分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征,包括:
对各个对象信息集中同一指标对应的对象信息进行归一化处理,得到各个对象信息集分别对应的特征值集;基于目标对象对应的特征值集确定目标对象对应的目标对象特征,得到各个目标对象分别对应的目标对象特征。
其中,特征值集是指包括对象信息集中的各个对象信息分别对应的特征值的集合,对象信息的特征值是指对对象信息进行归一化得到的数值。
示例性地,计算机设备对同一指标在各个对象信息集中分别对应的对象信息进行归一化处理,得到同一指标在各个对象信息集中分别对应的特征值。例如,统计同一指标在各个对象信息集中分别对应的对象信息,得到各个指标分别对应的取值区间,基于对象信息在相应指标的取值区间内所处的位置,确定对象信息对应的特征值。基于同一对象信息集中各个指标分别对应的特征值,得到各个对象信息集分别对应的特征值集。基于各个目标对象分别对应的特征值集得到各个目标对象分别对应的目标对象特征,例如,当目标对象的对象信息集中包括四个指标分别对应的对象信息时,基于各个指标分别对应的特征值,按预设顺序对各个指标进行组合,得到四维特征向量,即目标对象对应的目标对象特征。
上述实施例中,通过对同一指标对应的对象信息进行归一化处理,能够快速准确地将对象信息集转换为相应的目标对象特征,这样得到的目标对象特征能够简明准确地反应目标对象的特征信息,从而提高对象分类的准确性和效率。
在一个实施例中,基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到各个聚类簇分别对应的聚类分数,包括:
基于历史对象参考信息,分别对各个聚类簇对应的聚类中心特征进行特征转换,得到各个聚类簇分别对应的目标中心特征;历史对象参考信息包括资源转移指标和信用指标分别对应的对象参考信息,对象参考信息是基于多个历史对象在同一指标下对应的对象信息得到的;将各个目标中心特征输入聚类簇评分模型,得到各个聚类簇分别对应的聚类分数;聚类簇评分模型是基于多个聚类簇样本分别对应的目标中心特征和分数标签训练得到的。
其中,历史对象参考信息是指用于指示如何将聚类中心特征转换为对应的目标中心特征的参考信息。例如,历史参考信息可以是基于客户价值分析的历史经验确定的打分表,基于聚类中心特征中每个指标对应的特征值所处的区间,将特征值映射为相应的分值。资源转移指标对应的对象参考信息是指用于指示如何将资源转移指标在聚类中心特征中对应的特征值转换为相应的分值的参考信息。信用指标对应的对象参考信息是指用于指示如何将信用指标在聚类中心特征中对应的特征值转换为相应的分值的参考信息。
目标中心特征是指对聚类中心特征进行特征转换得到的转换后的特征,是更加准确的、聚类簇中心对应的对象特征。聚类簇评分模型是指用于根据聚类簇对应的聚类中心特征,预测聚类簇对应的聚类分数的模型。聚类簇样本是指已知聚类分数的聚类簇,聚类簇样本对应的已知的聚类分数为聚类簇样本对应的分数标签。
示例性地,根据资源转移指标对应的对象参考信息,将聚类中心特征中资源转移指标对应的特征值转换为相应的分值,根据信用指标对应的对象参考信息,将聚类中心特征中信用指标对应的特征值转换为相应的分值,得到聚类中心特征对应的目标中心特征。用相同的方法,将其他各个聚类簇分别对应的聚类中心特征转换为相应的目标中心特征,得到各个聚类簇分别对应的目标中心特征。获将各个聚类簇分别对应的目标中心特征输入训练好的聚类簇评分模型,得到各个聚类簇分别对应的聚类分数。
在一个实施例中,获取多个已知聚类分数的聚类簇样本,将聚类簇样本对应的目标中心特征输入初始的聚类簇评分模型,得到预测聚类分数,基于预测聚类分数和相应的分数标签之间的差异得到模型损失,基于模型损失调整聚类簇评分模型中的模型参数,从剩余的聚类簇样本中确定训练样本,返回将聚类簇样本对应的目标中心特征输入初始的聚类簇评分模型的步骤执行,直至模型收敛,得到收敛的聚类簇评分模型。
上述实施例中,根据历史对象参考信息,将聚类簇对应聚类中心特征转换为相应的分值,得到目标中心特征,这样得到的目标中心特征融合了对象分类的历史经验,能够使得基于目标中心特征进行对象分类的准确性得到提升。进而将各个目标中心特征输入聚类簇评分模型,能够快速准确地得到各个聚类簇分别对应的聚类分数,这样得到的聚类分数能够更加准确地反应聚类簇中的目标对象对应的对象价值。
在一个实施例中,基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级,包括:
获取价值等级划分信息;价值等级划分信息包括多个价值等级和各个价值等级分别对应的分数区间;将聚类簇对应的聚类分数落入的分数区间所属的价值等级,作为聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级。
其中,价值等级划分信息是指用于指示如何根据聚类簇对应的聚类分数,确定聚类簇包含的各个目标对象特征所属目标对象的对象价值等级的信息,包括多个价值等级以及各个价值等级分别对应的分数区间。例如,价值等级划分信息可以包括5个价值等级,当聚类分数对应的取值范围为[0,10]时,各个价值等级分别对应的分数区间可以为[0,2)、[2,4)、[4,6)、[6,8)、[8,10]。
示例性地,计算机设备获取价值等级划分信息,确定聚类簇对应的聚类分数落入的分数区间,将聚类簇对应的分数区间所属的价值等级作为聚类簇对应的对象价值等级,即聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级。用相同的方法,确定其他各个聚类簇分别对应的对象价值等级,从而得到各个聚类簇分别对应的对象价值等级,基于各个聚类簇分别对应的对象价值等级,得到各个目标对象分别对应的对象价值等级。
上述实施例中,基于价值等级划分信息,将各个聚类簇划分至对应的对象价值等级,能够将聚类分数相近的聚类簇划分至同一对象价值等级中,进一步提高对象分类的合理性和准确性。
在一个实施例中,资源转移指标包括资源转移时间间隔、资源转移频率、资源转移量中的至少一者,对象分类方法还包括:
基于各个目标对象分别对应的对象价值等级,确定各个目标对象分别对应的资源管理产品和对象服务策略;基于目标对象对应的对象服务策略,向目标对象对应的目标设备推送目标对象对应的资源管理产品。
其中,资源管理产品是指用于管理资源的产品,例如,资源管理产品可以是理财产品。对象服务策略是指为目标对象提供产品推荐服务的策略。例如,对于高价值客户,通过重点拜访或联系的方式来向客户推荐相应的资源管理产品,对于中价值客户,通过赠送相应资源管理产品对应的优惠券或积分的方式来推荐资源管理产品,对于低价值用户,通过推送相应资源管理产品对应的促销活动的方式来向客户推荐资源管理产品。目标对象对应的目标设备是指目标对象所使用的终端,可以是个人电脑、手机、平板等设备。
示例性地,计算机设备根据各个对象价值等级分别对应的资源管理产品和对象服务策略,确定每个目标对象分别对应的资源管理产品和对象服务策略。根据目标对象对应的对象服务策略,确定目标对象对应的资源管理产品的推送方式。根据目标对象对应的对象服务策略所指示的推送方式,将目标对象对应的资源管理产品推送至目标对象对应的目标设备。
上述实施例中,为不同对象价值等级分别设置相应的资源管理产品和对象服务策略,这样根据目标对象所属对象价值等级能够快速准确地确定最适合目标对象的资源管理产品和对象服务策略,基于最适合目标对象的对象服务策略向目标对象对应的目标设备推送相应的资源管理产品,能够提高资源管理产品的推送准确度和成功率。
在一个具体的实施例中,本申请提出的对象分类方法可以应用于银行后台系统,对银行客户进行客户价值分析,实现针对银行客户的客户分类。对象分类方法包括以下步骤:
1、收集客户信息集
银行后台系统采集多个客户分别对应的初始客户信息集。例如,客户信息集中包括可以包括RFM模型中的消费时间间隔(Recency)、消费频率(Frequency)和消费金额(Monetary),以及客户在银行系统中的个人信用信息。其中,个人信用信息包括客户的个人履约能力、客户行为偏好、客户身份特质。
2、数据处理
银行后台系统分析各个客户信息集中是否存在异常数据以及是否存在信息缺失,过滤存在异常数据的客户信息集,过滤信息缺失程度较大的客户信息集,对剩余的存在信息缺失的客户信息集采用平均数方法补全缺失数据,得到各个目标客户信息集。对各个目标客户信息进行特征提取,得到各个目标客户信息分别对应的客户特征向量。
3、聚类
银行后台系统在各个客户特征向量中随机设置k个中心点,利用欧氏距离计算剩下的各个客户特征向量分别与各个中心点之间的相异度,将各个客户特征向量划分到相异度最低的中心点所在的簇。计算每个簇的质心作为下一次迭代的中心点,返回利用欧氏距离计算剩下的各个客户特征向量分别与各个中心点之间的相异度的步骤执行,直至聚类结果不再变化。得到各个聚类簇和各个聚类簇分别对应的聚类中心向量。
4、客户价值分析
银行后台系统基于各个聚类簇分别对应的聚类中心向量,确定各个聚类簇分别对应的聚类分数,根据聚类簇对应的聚类分数确定聚类簇包含的各个客户特征向量所属的客户的对象价值等级,得到各个客户分别对应的客户价值等级。根据客户等级对客户提供不同的营销和服务策略,如对高价值客户进行重点营销,倾斜更多资源,提供会员便捷服务等;对重要保持客户制定增值服务,重点拜访或联系,推荐高投资高回报产品等;对一般价值客户维持客户忠诚度,采用赠送优惠券、积分等方式;对潜在客户可以进行一些小的促销活动,若客户短期内无消费需求可考虑放弃,避免投入过多资源造成浪费。
上述实施例中,在收集到大量的客户信息集后,对异常的客户信息集进行剔除,对存在缺失的客户信息集进行补全,能够降低异常的样本数据和缺失的样本数据对聚类效果产生的偏差影响,提高聚类的准确性。将传统的RFM模型加入了信用维度,使其更加适用于分辨银行业的客户价值,较之传统模型能够更加全面地反应客户的价值特征,同时采用K-Means聚类算法对客户进行分类,根据不同客群的价值高低提供更为个性化的服务,有利于更好地实现精准营销。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的对象分类方法的对象分类装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个对象分类装置实施例中的具体限定可以参见上文中对于对象分类方法的限定,在此不再赘述。
在一个实施例中,如图4所示,提供了一种对象分类装置,包括:对象信息集获取模块402、目标对象特征提取模块404、对象聚类模块406、聚类分数确定模块408和对象价值等级确定模块410,其中:
对象信息集获取模块402,用于获取多个目标对象分别对应的对象信息集;对象信息集包括同一目标对象在资源转移指标和信用指标下分别对应的对象信息。
目标对象特征提取模块404,用于分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征。
对象聚类模块406,用于对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征。
聚类分数确定模块408,用于基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到各个聚类簇分别对应的聚类分数。
对象价值等级确定模块410,用于基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级。
在一个实施例中,对象信息集获取模块402还用于:
获取多个初始对象分别对应的初始信息集;融合各个初始信息集中同一指标对应的对象信息,得到第一参考信息集;基于各个初始信息集分别与第一参考信息集之间的差异,在各个初始对象中过滤异常对象,得到多个目标对象;基于第一参考信息集对目标对象对应的初始信息集中缺失的对象信息进行填充,得到各个目标对象分别对应的对象信息集。
在一个实施例中,目标对象特征提取模块404还用于:
对各个对象信息集中同一指标对应的对象信息进行归一化处理,得到各个对象信息集分别对应的特征值集;基于目标对象对应的特征值集确定目标对象对应的目标对象特征,得到各个目标对象分别对应的目标对象特征。
在一个实施例中,聚类分数确定模块408还用于:
基于历史对象参考信息,分别对各个聚类簇对应的聚类中心特征进行特征转换,得到各个聚类簇分别对应的目标中心特征;历史对象参考信息包括资源转移指标和信用指标分别对应的对象参考信息,对象参考信息是基于多个历史对象在同一指标下对应的对象信息得到的;将各个目标中心特征输入聚类簇评分模型,得到各个聚类簇分别对应的聚类分数;聚类簇评分模型是基于多个聚类簇样本分别对应的目标中心特征和分数标签训练得到的。
在一个实施例中,对象价值等级确定模块410还用于:
获取价值等级划分信息;价值等级划分信息包括多个价值等级和各个价值等级分别对应的分数区间;将聚类簇对应的聚类分数落入的分数区间所属的价值等级,作为聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到各个目标对象分别对应的对象价值等级。
在一个实施例中,如图5所示,对象分类装置还包括:
对象服务模块502,用于基于各个目标对象分别对应的对象价值等级,确定各个目标对象分别对应的资源管理产品和对象服务策略;基于目标对象对应的对象服务策略,向目标对象对应的目标设备推送目标对象对应的资源管理产品。
上述对象分类装置,通过基于目标对象在资源转移指标和信用指标下分别对应的对象信息,提取目标对象对应的目标对象特征,能够使得目标对象特征更加准确和全面。进而对各个目标对象特征进行聚类得到多个聚类簇,根据各个聚类簇分别对应的聚类分数确定各个目标对分别对应的对象价值等级,能够有效提高对象分类的准确性。
上述对象分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储对象信息集、目标对象特征等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对象分类方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种对象分类方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6、7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种对象分类方法,其特征在于,所述方法包括:
获取多个目标对象分别对应的对象信息集;所述对象信息集包括同一目标对象在资源转移指标和信用指标下分别对应的对象信息;
分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征;
对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征;
基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到所述各个聚类簇分别对应的聚类分数;
基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到所述各个目标对象分别对应的对象价值等级。
2.根据权利要求1所述的方法,其特征在于,所述获取多个目标对象分别对应的对象信息集,包括:
获取多个初始对象分别对应的初始信息集;
融合所述各个初始信息集中同一指标对应的对象信息,得到第一参考信息集;
基于所述各个初始信息集分别与所述第一参考信息集之间的差异,在各个初始对象中过滤异常对象,得到多个目标对象;
基于所述第一参考信息集对目标对象对应的初始信息集中缺失的对象信息进行填充,得到各个目标对象分别对应的对象信息集。
3.根据权利要求1所述的方法,其特征在于,所述分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征,包括:
对所述各个对象信息集中同一指标对应的对象信息进行归一化处理,得到所述各个对象信息集分别对应的特征值集;
基于目标对象对应的特征值集确定目标对象对应的目标对象特征,得到各个目标对象分别对应的目标对象特征。
4.根据权利要求1所述的方法,其特征在于,所述基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到所述各个聚类簇分别对应的聚类分数,包括:
基于历史对象参考信息,分别对所述各个聚类簇对应的聚类中心特征进行特征转换,得到所述各个聚类簇分别对应的目标中心特征;所述历史对象参考信息包括所述资源转移指标和所述信用指标分别对应的对象参考信息,所述对象参考信息是基于多个历史对象在同一指标下对应的对象信息得到的;
将各个目标中心特征输入聚类簇评分模型,得到所述各个聚类簇分别对应的聚类分数;所述聚类簇评分模型是基于多个聚类簇样本分别对应的目标中心特征和分数标签训练得到的。
5.根据权利要求1所述的方法,其特征在于,所述基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到所述各个目标对象分别对应的对象价值等级,包括:
获取价值等级划分信息;所述价值等级划分信息包括多个价值等级和各个价值等级分别对应的分数区间;
将聚类簇对应的聚类分数落入的分数区间所属的价值等级,作为聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到所述各个目标对象分别对应的对象价值等级。
6.根据权利要求1所述的方法,其特征在于,所述资源转移指标包括资源转移时间间隔、资源转移频率、资源转移量中的至少一者,所述方法还包括:
基于所述各个目标对象分别对应的对象价值等级,确定所述各个目标对象分别对应的资源管理产品和对象服务策略;
基于目标对象对应的对象服务策略,向目标对象对应的目标设备推送目标对象对应的资源管理产品。
7.一种对象分类装置,其特征在于,所述装置包括:
对象信息集获取模块,用于获取多个目标对象分别对应的对象信息集;所述对象信息集包括同一目标对象在资源转移指标和信用指标下分别对应的对象信息;
目标对象特征提取模块,用于分别对各个对象信息集进行特征提取,得到各个目标对象分别对应的目标对象特征;
对象聚类模块,用于对各个目标对象特征进行聚类,得到多个聚类簇和各个聚类簇分别对应的聚类中心特征;
聚类分数确定模块,用于基于聚类簇对应的聚类中心特征确定聚类簇对应的聚类分数,得到所述各个聚类簇分别对应的聚类分数;
对象价值等级确定模块,用于基于聚类簇对应的聚类分数确定聚类簇包含的各个目标对象特征所属的目标对象的对象价值等级,得到所述各个目标对象分别对应的对象价值等级。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202311197095.6A 2023-09-15 2023-09-15 对象分类方法、装置、计算机设备和存储介质 Pending CN117312999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311197095.6A CN117312999A (zh) 2023-09-15 2023-09-15 对象分类方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311197095.6A CN117312999A (zh) 2023-09-15 2023-09-15 对象分类方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN117312999A true CN117312999A (zh) 2023-12-29

Family

ID=89254580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311197095.6A Pending CN117312999A (zh) 2023-09-15 2023-09-15 对象分类方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN117312999A (zh)

Similar Documents

Publication Publication Date Title
CN108648074B (zh) 基于支持向量机的贷款评估方法、装置及设备
KR101939554B1 (ko) 일시적 거래 한도 결정
CN110378786B (zh) 模型训练方法、违约传导风险识别方法、装置及存储介质
CN110580649B (zh) 一种商品潜力值的确定方法和装置
CN111340246A (zh) 用于企业智能决策分析的处理方法、装置和计算机设备
WO2015148422A1 (en) Recommendation system with dual collaborative filter usage matrix
EP4322031A1 (en) Recommendation method, recommendation model training method, and related product
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
WO2023103527A1 (zh) 一种访问频次的预测方法及装置
CN115062732A (zh) 基于大数据用户标签信息的资源共享合作推荐方法及系统
CN111078997B (zh) 一种资讯推荐方法及装置
CN114693409A (zh) 产品匹配方法、装置、计算机设备、存储介质和程序产品
CN117435130A (zh) 金融数据存储方法、装置、计算机设备和存储介质
CN116467525A (zh) 业务产品的推荐方法、装置、设备和存储介质
CN113837843B (zh) 产品推荐方法、装置、介质及电子设备
CN113327154B (zh) 基于大数据的电商用户讯息推送方法及系统
CN117312999A (zh) 对象分类方法、装置、计算机设备和存储介质
CN116861226A (zh) 一种数据处理的方法以及相关装置
US11887168B2 (en) Predicting the value of an asset using machine-learning techniques
CN117992241B (zh) 基于大数据的科技型中小企业银企对接服务系统及方法
CN112559897B (zh) 匹配关系的识别方法、装置及设备
CN117076962B (zh) 应用于人工智能领域的数据分析方法、装置及设备
Lohse Machine Learning in Banking: Exploring the feasibility of using consumer level bank transaction data for credit risk evaluation
CN116029828A (zh) 信息处理方法、装置和计算机设备
CN115659022A (zh) 资源推送数据处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination