CN116485446A - 业务数据的处理方法、装置、处理器以及电子设备 - Google Patents
业务数据的处理方法、装置、处理器以及电子设备 Download PDFInfo
- Publication number
- CN116485446A CN116485446A CN202310431481.0A CN202310431481A CN116485446A CN 116485446 A CN116485446 A CN 116485446A CN 202310431481 A CN202310431481 A CN 202310431481A CN 116485446 A CN116485446 A CN 116485446A
- Authority
- CN
- China
- Prior art keywords
- data
- service
- service data
- client
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 73
- 238000000034 method Methods 0.000 claims abstract description 48
- 230000015654 memory Effects 0.000 claims description 28
- 238000007781 pre-processing Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000002776 aggregation Effects 0.000 claims description 13
- 238000004220 aggregation Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 abstract description 13
- 238000003860 storage Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 230000008676 import Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 229910052500 inorganic mineral Inorganic materials 0.000 description 3
- 239000011707 mineral Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种业务数据的处理方法、装置、处理器以及电子设备。涉及金融科技领域,该方法包括:获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据;根据业务类型匹配业务预测模型类型,并将目标业务数据进行数据处理,得到特征数据;将特征数据输入业务预测模型类型下的M个预测模型中,输出M个预测结果,根据M个预测结果确定预测业务数据;在获取到目标客户的下一时间周期的实际业务数据的情况下,将预测业务数据与实际业务数据进行对比,得到对比结果,并根据对比结果对目标客户进行业务的调整。通过本申请,解决了相关技术中无法准确预测客户业务数据的问题。
Description
技术领域
本申请涉及金融科技领域,具体而言,涉及一种业务数据的处理方法、装置、处理器以及电子设备。
背景技术
随着经济发展,国内外进出口贸易也在迅速发展,进出口客户对于服务的需求也愈发增多,但是在进行交易的过程中由于互联网金融发展、他行业务竞争或办理业务数据情况受自身经营和复杂多变的外部因素等影响,可能带来部分企业客户业务流失。
金融机构需要通过分析业务流失情况对企业客户的服务进行个性化调整,在相关技术中,主要依靠业务专家经验积累,对熟悉的客户及业务类型等相应业务数据情况进行综合分析判断,或依靠有经验的对公业务经理对现有客户的走访及相应业务办理情况进行综合分析判断,从而发现可能存在的客户业务流失情况。但该方法过于依赖人工,并且估算的业务数据精准度较差,同时对于新增客户,由于缺乏足够的历史业务数据,导致专家无法准确预估企业合理的业务数据。
针对相关技术中无法准确预测客户业务数据的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种业务数据的处理方法、装置、处理器以及电子设备,以解决相关技术中无法准确预测客户业务数据的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种业务数据的处理方法。该方法包括:获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据;根据业务类型匹配业务预测模型类型,并将目标业务数据进行数据处理,得到特征数据;将特征数据输入业务预测模型类型下的M个预测模型中,输出M个预测结果,根据M个预测结果确定预测业务数据,其中,M为正整数;在获取到目标客户的下一时间周期的实际业务数据的情况下,将预测业务数据与实际业务数据进行对比,得到对比结果,并根据对比结果对目标客户进行业务的调整,其中,下一时间周期为与目标时间周期相邻的下一时间周期。
可选地,在获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据之前,该方法还包括:获取待测客户的客户属性类型,其中,客户属性类型用于指示待测客户是否为新增客户;在待测客户为新增客户的情况下,确定与待测客户处于同一个业务类型的客户,得到目标客户;在待测客户不为新增客户的情况下,将待测客户确定为目标客户。
可选地,预测模型通过以下方式训练得到:从数据库中获取所有客户在第一历史时间周期的第一业务数据以及第二历史时间周期的第二业务数据,其中,第二历史时间周期是第一历史时间周期的下一时间周期;对第一业务数据进行预处理,得到N个业务类型的输入样本数据,并对每个输入样本数据进行特征提取处理,得到N组样本特征数据,其中,N为正整数;对第二业务数据进行预处理,得到N个业务类型的输出样本数据;利用N组样本特征数据以及N个业务类型的输出样本数据训练M个预设预测模型,得到M个预测模型。
可选地,对第一业务数据进行预处理,得到N个业务类型的输入样本数据包括:将第一业务数据按照客户证件编号进行数据去重处理,得到去重后的第一业务数据,并按照客户证件编号对去重后的第一业务数据进行数据聚合,得到聚合后的第一业务数据,其中,聚合后的第一业务数据包含多组第一业务数据,每组第一业务数据为同一个客户证件编号关联的第一业务数据;确定聚合后的第一业务数据的N个业务类型,根据N个业务类型将聚合后的第一业务数据进行分类,得到N个业务类型的输入样本数据。
可选地,对每个输入样本数据进行特征提取处理,得到N组样本特征数据包括:对每个业务类型的输入样本数据进行特征的筛选,得到每一业务类型的X个目标特征,其中,X为正整数;对于每个业务类型的输入样本数据,根据X个目标特征对业务类型的输入样本数据进行聚类计算,得到每个目标特征关联的样本特征数据,由X个目标特征关联的样本特征数据构成业务类型的一组样本特征数据。
可选地,对第二业务数据进行预处理,得到N个业务类型的输出样本数据包括:将第二业务数据按照客户证件编号进行数据去重处理,得到去重后的第二业务数据,并按照客户证件编号对去重后的第二业务数据进行数据聚合,得到聚合后的第二业务数据,其中,聚合后的第二业务数据包含多组第二业务数据,每组第二业务数据是同一个客户证件编号关联的第二业务数据;确定聚合后的第二业务数据的N个业务类型,根据N个业务类型将聚合后的第二业务数据进行分类,得到N个业务类型的输出样本数据。
可选地,根据M个预测结果确定预测业务数据包括:确定每个预测模型的权重值;并利用每个预测模型的权重值对M个预测结果进行加权求和计算,得到预测业务数据。
为了实现上述目的,根据本申请的另一方面,提供了一种业务数据的处理装置。该装置包括:第一获取单元,用于获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据;匹配单元,用于根据业务类型匹配业务预测模型类型,并将目标业务数据进行数据处理,得到特征数据;输入单元,用于将特征数据输入业务预测模型类型下的M个预测模型中,输出M个预测结果,根据M个预测结果确定预测业务数据,其中,M为正整数;对比单元,用于在获取到目标客户的下一时间周期的实际业务数据的情况下,将预测业务数据与实际业务数据进行对比,得到对比结果,并根据对比结果对目标客户进行业务的调整,其中,下一时间周期为与目标时间周期相邻的下一时间周期。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时控制非易失性存储介质所在的设备执行一种业务数据的处理方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包含一个或多个处理器和存储器;存储器中存储有计算机可读指令,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种业务数据的处理方法。
通过本申请,采用以下步骤:获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据;根据业务类型匹配业务预测模型类型,并将目标业务数据进行数据处理,得到特征数据;将特征数据输入业务预测模型类型下的M个预测模型中,输出M个预测结果,根据M个预测结果确定预测业务数据,其中,M为正整数;在获取到目标客户的下一时间周期的实际业务数据的情况下,将预测业务数据与实际业务数据进行对比,得到对比结果,并根据对比结果对目标客户进行业务的调整,其中,下一时间周期为与目标时间周期相邻的下一时间周期,解决了相关技术中无法准确预测客户业务数据的问题,通过将不同业务类型的目标客户的历史业务数据输入对应类型的预测模型中,利用预测模型对目标客户的业务数据进行预测,进而达到了精准预测业务数据,并根据业务数据调整相应服务的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的业务数据的处理方法的流程图;
图2是根据本申请实施例提供的训练预测模型的流程图;
图3是根据本申请实施例提供的可选的业务数据的处理方法的示意图;
图4是根据本申请实施例提供的业务数据的处理装置的示意图;
图5是根据本申请实施例提供的电子设备的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的业务数据的处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据。
具体的,目标客户可以为主营进出口贸易的企业客户,业务类型可以为进出口农产品、进出口通信产品、进出口矿产资源、进出口高新技术产品等。
需要说明的是,目标业务数据是指该目标客户在某一时间周期内的基础数据,可以为客户基础属性数据、业务属性数据、时空关联属性数据,目标业务数据可以通过存储系统或地图软件等工具获得的,或从网络的相关新闻中提取的,在获取目标业务数据后,将其暂存至数据库中。
其中,客户基础属性数据可以包括企业证件编号、企业所有制类型、企业进出口类型、企业贸易经营范围、企业资产总额、企业营业总收入、企业利润总额、企业净利润、企业纳税总额、企业历年外管名录分类等数据;业务属性数据可以包括历年各单证产品办理笔数、历年各进口产品办理笔数、历年各出口产品办理笔数、历年单证业务总额(折美元)、历年进口产品业务总额(折美元)、历年出口产品业务总额(折美元)、历年各单证产品办理金额明细(折美元),历年单证业务交易对手个数,历年单证业务交易对手国别等数据;时空关联属性数据可以包括企业坐标、历年相同贸易类型企业数量、历年汇率变化明细、历年贸易商品国际市场价格走势明细、历年国际物流运费价格明细等数据。
步骤S102,根据业务类型匹配业务预测模型类型,并将目标业务数据进行数据处理,得到特征数据。
具体的,业务预测模型是指用于预测目标客户的业务数据的机器学习模型,具体的,预测目标时间周期相邻的下一时间周期的业务数据,可以包括K近邻(K-NearestNeighbor,KNN)回归算法、随机森林(Random Forest)回归算法、XGBoost(eXtremeGradient Boosting)回归算法、长短期记忆网络(Long Short-Term Memory,LSTM)算法、深度森林(deep forest)算法等多种,在预测该目标客户的预测业务数据前,需要先确定预测模型的类型。
进一步的,在将目标客户的目标业务数据输入预测模型前,需要对目标业务数据进行数据的去重、聚合、筛选等操作,进而得到特征数据。
步骤S103,将特征数据输入业务预测模型类型下的M个预测模型中,输出M个预测结果,根据M个预测结果确定预测业务数据,其中,M为正整数。
具体的,由于单个业务预测模型得到的预测结果准确性较低,因此需要多个业务预测模型进行预测,以提高结果的准确程度,将经过数据处理后的多个特征数据输入到该客户的业务类型对应的多个预测模型中,每个预测模型可以输出一个预测结果,再根据每个预测模型的权重数据计算得到该目标客户在目标时间周期的预测业务数据。
步骤S104,在获取到目标客户的下一时间周期的实际业务数据的情况下,将预测业务数据与实际业务数据进行对比,得到对比结果,并根据对比结果对目标客户进行业务的调整,其中,下一时间周期为与目标时间周期相邻的下一时间周期。
具体的,在得到多个预测模型输出的下一时间周期的预测业务数据后,经过一个时间周期的等待,获取了下一时间周期的实际业务数据,将两个业务数据进行对比,以判断客户的业务是否存在业务流失情况。
例如,目标时间周期为上一年的第一季度,下一时间周期为上一年的第二季度,当上一年的第二季度得到的实际业务数据明显小于预测业务数据的情况下,说明该目标客户发生了业务流失情况,则根据流失业务程度对服务进行调整,最大限度的保留老客户,例如通过增大贷款金额或降低利率等方式挽留客户;反之,若实际业务数据与预测业务数据差异不明显时,则表明服务未出现较大失误,并且针对该客户的服务无需进行大规模调整,则以该业务数据作为服务的宣传信息吸引新客户。
本申请实施例提供的业务数据的处理方法,通过获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据;根据业务类型匹配业务预测模型类型,并将目标业务数据进行数据处理,得到特征数据;将特征数据输入业务预测模型类型下的M个预测模型中,输出M个预测结果,根据M个预测结果确定预测业务数据,其中,M为正整数;在获取到目标客户的下一时间周期的实际业务数据的情况下,将预测业务数据与实际业务数据进行对比,得到对比结果,并根据对比结果对目标客户进行业务的调整,其中,下一时间周期为与目标时间周期相邻的下一时间周期,解决了相关技术中无法准确预测客户业务数据的问题,通过将不同业务类型的目标客户的历史业务数据输入对应类型的预测模型中,利用预测模型对目标客户的业务数据进行预测,进而达到了精准预测业务数据,并根据业务数据调整相应服务的效果。
可选地,在本申请实施例提供的业务数据的处理方法中,在获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据之前,该方法还包括:获取待测客户的客户属性类型,其中,客户属性类型用于指示待测客户是否为新增客户;在待测客户为新增客户的情况下,确定与待测客户处于同一个业务类型的客户,得到目标客户;在待测客户不为新增客户的情况下,将待测客户确定为目标客户。
由于新增客户缺乏足够的历史业务数据,无法利用该历史数据进行业务数据的预测,因此在计算客户的预测业务数据前,需要先判断数据库中是否存储有该客户的历史业务数据,也即判断该目标客户是否为新增客户,具体的,获取该客户的客户属性类型,根据客户属性类型确定该客户是否为新增客户,例如,根据客户的基础数据从行内系统中查询得到客户的客户属性类型为新增,则确定该客户为新增客户;反之,若客户属于已有客户,则将其作为目标客户,并通过获取目标客户的业务数据进行业务数据的预测。
进一步的,由于新增客户缺乏历史业务数据,因此当确定为新增客户时,根据该客户的业务类型筛选得到与该客户属于同一业务类型、业务数据平均值最接近并且不为新增客户的对照客户,以该客户历史业务数据作为新增客户的历史业务数据,并利用该历史业务数据计算特征数据,进而通过预测模型计算得到预测业务数据,以该预测业务数据作为新增客户的预测业务数据,并根据预测业务数据对新增客户进行服务调整。
预测模型是由客户的历史数据训练得到,图2是根据本申请实施例提供的训练预测模型的流程图,如图2所示,可选地,在本申请实施例提供的业务数据的处理方法中,预测模型通过以下方式训练得到:
步骤S201,从数据库中获取所有客户在第一历史时间周期的第一业务数据以及第二历史时间周期的第二业务数据,其中,第二历史时间周期是第一历史时间周期的下一时间周期;
步骤S202,对第一业务数据进行预处理,得到N个业务类型的输入样本数据,并对每个输入样本数据进行特征提取处理,得到N组样本特征数据,其中,N为正整数;
步骤S203,对第二业务数据进行预处理,得到N个业务类型的输出样本数据;
步骤S204,利用N组样本特征数据以及N个业务类型的输出样本数据训练M个预设预测模型,得到M个预测模型。
预测模型的训练是通过将历史的第一业务数据作为输入样本数据、第二业务数据作为输出样本数据训练预设预测模型得到,具体的,例如,第一历史时间周期可以为上一年的第一季度,第二历史时间周期可以为上一年的第二季度,在获取数据库中所有的第一业务数据以及第二业务数据后,对所有的第一业务数据和第二业务数据进行预处理,例如,预处理的方式可以包括:分析每个数据的日期范围,对于数据日期不足近一年的企业客户数据剔除处理;采用前后年份平均值方式进行缺失值的填充;采用正态分布3σ原则,将三倍于数据集的标准差的点设为异常数据,并进行删除。
进一步的,将预处理后的第一业务数据进行聚合操作,得到多个样本特征数据,再利用样本特征数据输入到预设预测模型中,根据输出结果与第二业务数据调整模型的参数,直至符合模型的需求,其中,聚合得到的特征可以包括历年进出口业务数据变化率,历年交易对手数量变化率,历年业务数据环比,历年业务金额环比等。
可选地,在本申请实施例提供的业务数据的处理方法中,对第一业务数据进行预处理,得到N个业务类型的输入样本数据包括:将第一业务数据按照客户证件编号进行数据去重处理,得到去重后的第一业务数据,并按照客户证件编号对去重后的第一业务数据进行数据聚合,得到聚合后的第一业务数据,其中,聚合后的第一业务数据包含多组第一业务数据,每组第一业务数据为同一个客户证件编号关联的第一业务数据;确定聚合后的第一业务数据的N个业务类型,根据N个业务类型将聚合后的第一业务数据进行分类,得到N个业务类型的输入样本数据。
在获得所有客户在第一历史时间周期的第一业务数据后,需要将该数据进行处理,具体的,客户证件编号是金融机构为每一位客户提供的唯一编号,获取的所有客户的每一个第一业务数据均包含一个客户证件编号,可以根据客户证件编号可以从中查找到属于该客户的业务数据,并执行删除该客户的业务数据中的重复冗余数据的操作,完成数据去重。
进一步的,筛查所有数据中是否包含缺失值,若存在缺失值区域,则利用近几年的平均值或中位数进行缺失值的填充,同时利用正态分布的3σ原则,对大于3σ的数据作为噪声数据,对其进行平滑处理,也即使数据分布趋于均匀,变得更可用,最后得到去重后的第一业务数据。
再进一步的,将属于同一客户证件编号的第一业务数据聚合为一组,得到多个聚合后的第一业务数据。再根据分类规则对聚合后的第一业务数据进行第一次分类,其中,分类规则可以包括经营范围相同的企业为一类或者相同销售额的企业为一类。例如,当以经营范围为分类标准时,共包含农产品、通信产品、矿产资源、高新技术产品四种类型,根据类型对所有客户进行分类得到4种业务类型的输入样本数据;当以每100万为一个区间座位分类标准时,对所有企业客户数据进行分类,将所有客户标记分为不同的大类。
获得分类的输入样本数据后,需要对每一业务类型的输入样本数据进行特征提取处理,可选地,在本申请实施例提供的业务数据的处理方法中,对每个输入样本数据进行特征提取处理,得到N组样本特征数据包括:对每个业务类型的输入样本数据进行特征的筛选,得到每一业务类型的X个目标特征,其中,X为正整数;对于每个业务类型的输入样本数据,根据X个目标特征对业务类型的输入样本数据进行聚类计算,得到每个目标特征关联的样本特征数据,由X个目标特征关联的样本特征数据构成业务类型的一组样本特征数据。
具体的,目标特征是指对目标客户的分类存在影响的特征数据,可以包括基本特征、生成序列关联特征、生成序列统计特征以及生成其他关联特征。其中,基本特征包括年份、客户名称、贸易商品名称、贸易金额、贸易交易笔数;生成序列关联特征包括相同贸易商品前一年交易量、相同贸易商品前两年交易量、相同贸易商品前三年交易量、相同贸易商品前四年交易量、相同贸易商品前五年交易量、前一年所有贸易商品交易量、前两年所有贸易商品交易量、前三年所有贸易商品交易量、前四年所有贸易商品交易量、前五年所有贸易商品交易量;生成序列统计特征包括近5年相同贸易商品交易量平均值、近4年相同贸易商品交易量平均值、近3年相同贸易商品交易量平均值、近2年相同贸易商品交易量平均值;生成其他关联特征包括近5年该客户交易对手数量,近5年该客户外管企业名录评级,近5年该客户在海关登记的进出口外贸交易总量。
进一步的,基于筛选出的目标特征,利用聚类算法对其进行聚类分析,聚类完成之后可以得到多个分组小类,并且每一客户均标记为具体的大类以及小类,其中,聚类算法可以为K-means算法,将每一个目标特征作为聚类中心,根据该聚类中心进行归类,得到目标特征关联的样本特征数据。
将第二历史时间周期的第二业务数据作为训练预测模型的输出数据,需要对其进行数据处理,,可选地,在本申请实施例提供的业务数据的处理方法中,对第二业务数据进行预处理,得到N个业务类型的输出样本数据包括:将第二业务数据按照客户证件编号进行数据去重处理,得到去重后的第二业务数据,并按照客户证件编号对去重后的第二业务数据进行数据聚合,得到聚合后的第二业务数据,其中,聚合后的第二业务数据包含多组第二业务数据,每组第二业务数据是同一个客户证件编号关联的第二业务数据;确定聚合后的第二业务数据的N个业务类型,根据N个业务类型将聚合后的第二业务数据进行分类,得到N个业务类型的输出样本数据。
具体的,第二历史时间周期可以为上一年的第二季度,第二历史事件周期的第二业务数据,对其进行预处理,预处理方式包括:分析每一数据的日期范围,对于数据日期不足一年的数据进行剔除处理,防止出现该数据没有历史数据作为对照的情况,并筛查所有数据中是否包含缺失值,若存在缺失值区域,则利用近几年的平均值或中位数进行缺失值的填充,同时利用正态分布的3σ原则,对大于3σ的数据进行删除或进行平滑处理,并根据客户证件编号执行删除客户的业务数据中重复冗余数据的操作,得到去重后的第二业务数据。
进一步的,再一次根据客户证件编号对去重后的第二业务数据进行聚合,得到聚合后的第二业务数据,例如,当以经营范围为分类标准时,共包含农产品、通信产品、矿产资源、高新技术产品四种类型,根据类型对第二业务数据进行分类得到4种业务类型的输出样本数据。
为了提高预测准确度,需要将多个预测模型得到的预测结果进行处理,可选地,在本申请实施例提供的业务数据的处理方法中,根据M个预测结果确定预测业务数据包括:确定每个预测模型的权重值;并利用每个预测模型的权重值对M个预测结果进行加权求和计算,得到预测业务数据。
具体的,在获得多个预测模型输出的预测结果后,为了获取最终的预测结果,需要对多个预测结果进行集成,也即需要计算得到每一预测结果的权重,再将每一个模型的权重与对应的预测结果进行加权求和计算,进而得到预测业务数据其中,确定权重的方式可以利用随机数算法获取得到。
需要说明的是,每一业务类型下游多个预测模型,在进行加权求和计算前,需要筛选出M个预测模型。具体的,在利用M个预测模型预测到M个预测结果之后,通过对每个预测模型的权重值进行降序排列,获取排列次序从前到后预设数量的预测模型,再利用加权求和计算得到预测业务数据。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种可选的业务数据的处理方法,图3是根据本申请实施例提供的可选的业务数据的处理方法的示意图,如图3所示,该方法包括:
在对业务数据进行预测的方法中包含数据处理、关联推理以及模型预测,其中,数据处理用于获取业务数据并对业务数据进行预处理;关联推理用于将预处理后的业务数据进行数据聚合,得到多个特征数据;模型预测用于将多个特征数据输入到预测模型中,得到多个预测结果,并根据预测结果判断客户业务数据的流失情况。
具体的,利用数据处理从数据库中获取该目标客户的基础属性数据、业务属性数据,并将其根据其中证件编号删除冗余数据以及进行数据聚合操作,得到预处理后的业务数据。
进一步的,将预处理后的业务数据输入关联推理中,利用该进行特征构建,通过利用K-means算法进行聚合分析,得到多个特征数据。
利用随机数算法为每一个预测模型分配权重,根据权重大小筛选出预设数量的预测模型,再将特征数据输入筛选出的预测模型中,由每个预测模型输出一个预测结果,最后利用筛选出的模型的权重与对应的预测结果进行加权求和计算,得到预测业务数据。
最后根据预测业务数据与实际获得的实际业务数据进行对比,判断该客户业务数据是否存在流失情况,若存在流失,则需要调整对该客户的服务。
通过利用预测模型对客户的业务数据进行预测,达到了有效业务数据并准确预测合理业务数据的效果。
本申请实施例还提供了一种业务数据的处理装置,需要说明的是,本申请实施例的业务数据的处理装置可以用于执行本申请实施例所提供的用于业务数据的处理方法。以下对本申请实施例提供的业务数据的处理装置进行介绍。
图4是根据本申请实施例提供的业务数据的处理装置的示意图,如图4所示,该装置包括:第一获取单元40、匹配单元41、输入单元42、对比单元43。
第一获取单元40,用于获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据。
匹配单元41,用于根据业务类型匹配业务预测模型类型,并将目标业务数据进行数据处理,得到特征数据。
输入单元42,用于将特征数据输入业务预测模型类型下的M个预测模型中,输出M个预测结果,根据M个预测结果确定预测业务数据,其中,M为正整数。
对比单元43,用于在获取到目标客户的下一时间周期的实际业务数据的情况下,将预测业务数据与实际业务数据进行对比,得到对比结果,并根据对比结果对目标客户进行业务的调整,其中,下一时间周期为与目标时间周期相邻的下一时间周期。
可选地,在本申请实施例提供的业务数据的处理装置中,该装置还包括:第二获取单元,用于在获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据之前,获取待测客户的客户属性类型,其中,客户属性类型用于指示待测客户是否为新增客户;第一确定单元,用于在待测客户为新增客户的情况下,确定与待测客户处于同一个业务类型的客户,得到目标客户;第二确定单元,用于在待测客户不为新增客户的情况下,将待测客户确定为目标客户。
可选地,在本申请实施例提供的业务数据的处理装置中,预测模型通过以下方式训练得到:获取模块,用于从数据库中获取所有客户在第一历史时间周期的第一业务数据以及第二历史时间周期的第二业务数据,其中,第二历史时间周期是第一历史时间周期的下一时间周期;第一处理模块,用于对第一业务数据进行预处理,得到N个业务类型的输入样本数据,并对每个输入样本数据进行特征提取处理,得到N组样本特征数据,其中,N为正整数;第二处理模块,用于对第二业务数据进行预处理,得到N个业务类型的输出样本数据;训练模块,用于利用N组样本特征数据以及N个业务类型的输出样本数据训练M个预设预测模型,得到M个预测模型。
可选地,在本申请实施例提供的业务数据的处理装置中,匹配单元41包括:第三处理模块,用于将第一业务数据按照客户证件编号进行数据去重处理,得到去重后的第一业务数据,并按照客户证件编号对去重后的第一业务数据进行数据聚合,得到聚合后的第一业务数据,其中,聚合后的第一业务数据包含多组第一业务数据,每组第一业务数据为同一个客户证件编号关联的第一业务数据;第一确定模块,用于确定聚合后的第一业务数据的N个业务类型,根据N个业务类型将聚合后的第一业务数据进行分类,得到N个业务类型的输入样本数据。
可选地,在本申请实施例提供的业务数据的处理装置中,匹配单元41包括:筛选模块,用于对每个业务类型的输入样本数据进行特征的筛选,得到每一业务类型的X个目标特征,其中,X为正整数;第一计算模块,用于对于每个业务类型的输入样本数据,根据X个目标特征对业务类型的输入样本数据进行聚类计算,得到每个目标特征关联的样本特征数据,由X个目标特征关联的样本特征数据构成业务类型的一组样本特征数据。
可选地,在本申请实施例提供的业务数据的处理装置中,匹配单元41包括:第四处理模块,用于将第二业务数据按照客户证件编号进行数据去重处理,得到去重后的第二业务数据,并按照客户证件编号对去重后的第二业务数据进行数据聚合,得到聚合后的第二业务数据,其中,聚合后的第二业务数据包含多组第二业务数据,每组第二业务数据是同一个客户证件编号关联的第二业务数据;第二确定模块,用于确定聚合后的第二业务数据的N个业务类型,根据N个业务类型将聚合后的第二业务数据进行分类,得到N个业务类型的输出样本数据。
可选地,在本申请实施例提供的业务数据的处理装置中,对比单元43包括:第二计算模块,用于确定每个预测模型的权重值;第三计算模块,用于并利用每个预测模型的权重值对M个预测结果进行加权求和计算,得到预测业务数据。
本申请实施例提供的业务数据的处理装置,通过第一获取单元40,用于获取目标客户的业务类型以及目标客户在目标时间周期的目标业务数据;匹配单元41,用于根据业务类型匹配业务预测模型类型,并将目标业务数据进行数据处理,得到特征数据;输入单元42,用于将特征数据输入业务预测模型类型下的M个预测模型中,输出M个预测结果,根据M个预测结果确定预测业务数据,其中,M为正整数;对比单元43,用于在获取到目标客户的下一时间周期的实际业务数据的情况下,将预测业务数据与实际业务数据进行对比,得到对比结果,并根据对比结果对目标客户进行业务的调整,其中,下一时间周期为与目标时间周期相邻的下一时间周期,解决了相关技术中无法准确预测客户业务数据的问题,通过将不同业务类型的目标客户的历史业务数据输入对应类型的预测模型中,利用预测模型对目标客户的业务数据进行预测,进而达到了精准预测业务数据,并根据业务数据调整相应服务的效果。
业务数据的处理装置包括处理器和存储器,上述第一获取单元40、匹配单元41、输入单元42、对比单元43等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决相关技术中无法准确预测客户业务数据的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现业务数据的处理方法。
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行业务数据的处理方法。
图5是根据本申请实施例提供的电子设备的示意图,如图5所示,本发明实施例提供了一种电子设备,电子设备50包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种业务数据的处理方法。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行一种业务数据的处理方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种业务数据的处理方法,其特征在于,包括:
获取目标客户的业务类型以及所述目标客户在目标时间周期的目标业务数据;
根据所述业务类型匹配业务预测模型类型,并将所述目标业务数据进行数据处理,得到特征数据;
将所述特征数据输入所述业务预测模型类型下的M个预测模型中,输出M个预测结果,根据所述M个预测结果确定预测业务数据,其中,M为正整数;
在获取到所述目标客户的下一时间周期的实际业务数据的情况下,将所述预测业务数据与所述实际业务数据进行对比,得到对比结果,并根据所述对比结果对所述目标客户进行业务的调整,其中,所述下一时间周期为与所述目标时间周期相邻的下一时间周期。
2.根据权利要求1所述的方法,其特征在于,在获取目标客户的业务类型以及所述目标客户在目标时间周期的目标业务数据之前,所述方法还包括:
获取待测客户的客户属性类型,其中,所述客户属性类型用于指示所述待测客户是否为新增客户;
在所述待测客户为所述新增客户的情况下,确定与所述待测客户处于同一个业务类型的客户,得到所述目标客户;
在所述待测客户不为所述新增客户的情况下,将所述待测客户确定为所述目标客户。
3.根据权利要求1所述的方法,其特征在于,所述预测模型通过以下方式训练得到:
从数据库中获取所有客户在第一历史时间周期的第一业务数据以及第二历史时间周期的第二业务数据,其中,所述第二历史时间周期是所述第一历史时间周期的下一时间周期;
对所述第一业务数据进行预处理,得到N个业务类型的输入样本数据,并对每个输入样本数据进行特征提取处理,得到N组样本特征数据,其中,N为正整数;
对所述第二业务数据进行预处理,得到N个业务类型的输出样本数据;
利用所述N组样本特征数据以及所述N个业务类型的输出样本数据训练M个预设预测模型,得到M个预测模型。
4.根据权利要求3所述的方法,其特征在于,对所述第一业务数据进行预处理,得到N个业务类型的输入样本数据包括:
将所述第一业务数据按照客户证件编号进行数据去重处理,得到去重后的第一业务数据,并按照客户证件编号对所述去重后的第一业务数据进行数据聚合,得到聚合后的第一业务数据,其中,所述聚合后的第一业务数据包含多组第一业务数据,每组第一业务数据为同一个客户证件编号关联的第一业务数据;
确定所述聚合后的第一业务数据的N个业务类型,根据所述N个业务类型将所述聚合后的第一业务数据进行分类,得到所述N个业务类型的输入样本数据。
5.根据权利要求3所述的方法,其特征在于,对每个输入样本数据进行特征提取处理,得到N组样本特征数据包括:
对每个业务类型的输入样本数据进行特征的筛选,得到每一业务类型的X个目标特征,其中,X为正整数;
对于每个业务类型的输入样本数据,根据所述X个目标特征对所述业务类型的输入样本数据进行聚类计算,得到每个目标特征关联的样本特征数据,由X个目标特征关联的样本特征数据构成所述业务类型的一组样本特征数据。
6.根据权利要求3所述的方法,其特征在于,对所述第二业务数据进行预处理,得到N个业务类型的输出样本数据包括:
将所述第二业务数据按照客户证件编号进行数据去重处理,得到去重后的第二业务数据,并按照客户证件编号对所述去重后的第二业务数据进行数据聚合,得到聚合后的第二业务数据,其中,所述聚合后的第二业务数据包含多组第二业务数据,每组第二业务数据是同一个客户证件编号关联的第二业务数据;
确定所述聚合后的第二业务数据的N个业务类型,根据所述N个业务类型将所述聚合后的第二业务数据进行分类,得到所述N个业务类型的输出样本数据。
7.根据权利要求1所述的方法,其特征在于,根据所述M个预测结果确定预测业务数据包括:
确定每个预测模型的权重值;
并利用每个预测模型的权重值对所述M个预测结果进行加权求和计算,得到所述预测业务数据。
8.一种业务数据的处理装置,其特征在于,包括:
第一获取单元,用于获取目标客户的业务类型以及所述目标客户在目标时间周期的目标业务数据;
匹配单元,用于根据所述业务类型匹配业务预测模型类型,并将所述目标业务数据进行数据处理,得到特征数据;
输入单元,用于将所述特征数据输入所述业务预测模型类型下的M个预测模型中,输出M个预测结果,根据所述M个预测结果确定预测业务数据,其中,M为正整数;
对比单元,用于在获取到所述目标客户的下一时间周期的实际业务数据的情况下,将所述预测业务数据与所述实际业务数据进行对比,得到对比结果,并根据所述对比结果对所述目标客户进行业务的调整,其中,所述下一时间周期为与所述目标时间周期相邻的下一时间周期。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的业务数据的处理方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的业务数据的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310431481.0A CN116485446A (zh) | 2023-04-20 | 2023-04-20 | 业务数据的处理方法、装置、处理器以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310431481.0A CN116485446A (zh) | 2023-04-20 | 2023-04-20 | 业务数据的处理方法、装置、处理器以及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116485446A true CN116485446A (zh) | 2023-07-25 |
Family
ID=87215060
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310431481.0A Pending CN116485446A (zh) | 2023-04-20 | 2023-04-20 | 业务数据的处理方法、装置、处理器以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116485446A (zh) |
-
2023
- 2023-04-20 CN CN202310431481.0A patent/CN116485446A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110837931B (zh) | 客户流失预测方法、装置及存储介质 | |
CN110400021B (zh) | 银行网点现金用量预测方法及装置 | |
CN111932044A (zh) | 一种基于机器学习的钢铁产品价格预测系统和方法 | |
CN116450951A (zh) | 业务推荐方法、装置、存储介质及电子设备 | |
CN114529400A (zh) | 一种消费贷款预授信评估方法、设备及介质 | |
CN116542747A (zh) | 产品推荐方法、装置、存储介质及电子设备 | |
CN116468273A (zh) | 客户风险识别方法及装置 | |
CN111667307B (zh) | 一种理财产品销量的预测方法及装置 | |
CN116821759A (zh) | 类别标签的识别预测方法、装置和处理器及电子设备 | |
CN115689713A (zh) | 异常风险数据处理方法、装置、计算机设备和存储介质 | |
Elrefai et al. | Using artificial intelligence in enhancing banking services | |
CN116485446A (zh) | 业务数据的处理方法、装置、处理器以及电子设备 | |
CN114741592A (zh) | 一种基于多模型融合的产品推荐方法、设备及介质 | |
CN114819944A (zh) | 云产品计费系统、方法、装置及设备 | |
CN114548620A (zh) | 物流准时保业务推荐方法、装置、计算机设备和存储介质 | |
CN113673789B (zh) | Atm现金流预测模型的训练方法、预测方法及装置 | |
CN111598256B (zh) | 目标客户的默搭购买行为的处理方法和装置 | |
CN117952688A (zh) | 商户的分类方法、装置及电子设备 | |
CN116485537A (zh) | 金融产品的选择方法、装置、处理器以及电子设备 | |
CN117454272A (zh) | 消费券的发放方法及装置、存储介质和电子设备 | |
CN116862613A (zh) | 产品推荐方法、装置、存储介质及电子设备 | |
CN116051169A (zh) | 评价方法、装置、非易失性存储介质及电子设备 | |
KR20210112974A (ko) | 시장 집중도를 이용한 브랜드 지수 생성 시스템 및 방법과 이를 위한 컴퓨터 프로그램 | |
CN116226740A (zh) | 客户维护方法、装置、处理器及电子设备 | |
CN118212002A (zh) | 一种客户生命周期预警方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |