CN112131479A - 数据的处理方法、装置、设备和存储介质 - Google Patents

数据的处理方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112131479A
CN112131479A CN202011060611.7A CN202011060611A CN112131479A CN 112131479 A CN112131479 A CN 112131479A CN 202011060611 A CN202011060611 A CN 202011060611A CN 112131479 A CN112131479 A CN 112131479A
Authority
CN
China
Prior art keywords
withdrawal
client
clients
probability
customer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011060611.7A
Other languages
English (en)
Inventor
唐圳
杨涵
刘博�
郑文琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202011060611.7A priority Critical patent/CN112131479A/zh
Publication of CN112131479A publication Critical patent/CN112131479A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Technology Law (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Cash Registers Or Receiving Machines (AREA)

Abstract

本发明公开了一种数据的处理方法、装置、设备和存储介质,所述方法包括:对金融产品的所有存量客户,通过考虑企业客户的经营内容以及行业标签,对于金融产品的存量客户中每个客户,基于经营内容以及行业标签采用训练得到的提款概率预估模型进行处理,得到用于表示客户获取该金融产品的意愿大小的提款概率,并将每个客户的提款概率进行推送。通过这种方式可以对存量客户的提款意愿进行量化分析,能够根据提款概率直观的确定每个客户的需求,并且该提款概率可用于指导对存量客户的维护和触达方式的选择,降低维护成本,提高效率。

Description

数据的处理方法、装置、设备和存储介质
技术领域
本发明涉及人工智能领域,尤其涉及一种数据的处理方法、装置、设备和存储介质。
背景技术
随着企业金融行业市场趋于饱和,单个新客户的挖掘成本越来越高,越来越多的企业贷款产品将目光聚焦于存量客户,如何经营存量客户是一个重要的环节。大部分企业贷款产品在存量用户的高度活跃期间会有客户经理跟踪等触达方式进行管理,而低活存量客户占比更大,是不可忽视的一部分,这些低存活量客户中也包括高提款意愿的客户和低提款意愿的客户,仅用短信等零成本触达方式转化效率低,一般常用的方式是采用电销触达方式进行触达。
目前主要的电销触达方式,是通过专门的客服人员,对每个客户进行电话联络,确定客户是否需要贷款产品,也就是通过人工一一沟通的方式对存量客户进行挖掘。然而,电销触达方式覆盖度小、成本高,对低提款意愿的客户进行电销触达会带来较高的成本,而遗漏了高提款意愿的客户没有及时触达容易错过客户的提款时间点。
综上所述,金融行业对存量客户的触达方式,成本高,效率低,目前现有技术中还没有合适的对存量客户进行分析的方案。
发明内容
本发明的主要目的在于提供一种数据的处理方法、装置、设备和存储介质,提供一种数据分析方案,旨在解决现有技术中对存量客户的触达方式,成本高,效率低的问题。
为实现上述目的,本发明提供一种数据的处理方法,包括:
获取金融产品的存量客户中每个客户的基础数据,每个客户的基础数据包括经营内容和行业标签;
根据每个客户的基础数据,采用提款概率预估模型,获取每个客户的提款概率,所述提款概率预估模型是根据LGBM模型训练的能够预测客户提款概率的模型,每个客户的提款概率用于表示所述客户获取所述金融产品的意愿大小;
推送所述每个客户的提款概率。
在一种具体实施方式中,所述获取金融产品的存量客户中每个客户的基础数据,包括:
针对所述存量客户中的每个客户,接收其他设备发送的经营数据;
对所述经营数据中进行分词处理和清洗处理,得到所述客户的经营内容和行业标签;其中,所述清洗处理包括剔除异常数据和剔除经营概率小于预设值的内容。
在一种具体实施方式中,每个客户的基础数据还包括所述客户的位置信息,所在地区的利率,额度信息。
在一种具体实施方式中,所述方法还包括:
根据每个客户的提款概率,对所述存量客户中的所有客户按照提款概率从高到低或者从低到高的顺序进行排序。
在一种具体实施方式中,所述方法还包括:
根据每个客户的提款概率,从所述存量客户中选取出提款概率最高的多个客户作为目标客户。
在一种具体实施方式中,所述方法还包括:
向服务人员的终端设备发送电销触达指示信息,所述电销触达指示信息用于指示所述服务人员对所述目标客户采用电销触达方式进行沟通。
在一种具体实施方式中,所述方法还包括:
获取对所述目标客户中每个客户进行电销触达的提款信息,每个客户对应的提款信息用于表示在预设时间段内所述客户是否提款;
将所述目标客户中提款信息指示在预设时间段内未进行提款的客户作为新的样本,对所述提款概率预估模型进行优化训练,得到新的提款概率预估模型。
在一种具体实施方式中,所述根据每个客户的基础数据,采用提款概率预估模型,获取每个客户的提款概率之前,所述方法还包括:
获取训练样本数据,所述训练样本数据中包括多个采用过电销触达方式的客户的基础数据以及提款信息,客户的提款信息用于表示所述客户在电销触达之后的预设时间段内是否提款;
将所述训练样本数据中,在电销触达之后预设时间段内提款的客户作为正样本,将在电销触达之后预设时间段内未提款的客户作为负样本,采用LGBM模型进行训练,得到所述提款概率预估模型。
在一种具体实施方式中,所述推送所述每个客户的提款概率,包括:
根据每个服务人员服务的客户名单,分别向每个服务人员的终端设备发送客户名单中的客户的提款概率。
本发明还提供一种数据的处理装置,包括:
获取模块,用于获取金融产品的存量客户中每个客户的基础数据,每个客户的基础数据包括经营内容和行业标签;
处理模块,用于根据每个客户的基础数据,采用提款概率预估模型,获取每个客户的提款概率,所述提款概率预估模型是根据LGBM模型训练的能够预测客户提款概率的模型,每个客户的提款概率用于表示所述客户获取所述金融产品的意愿大小;
推送模块,用于推送所述每个客户的提款概率。
本发明还提供一种电子设备,所述电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现第一方面任一实施方式所述的数据的处理方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一实施方式提供的数据的处理方法的步骤。
本发明中,对金融产品的所有存量客户,通过考虑企业客户的经营内容以及行业标签,对于金融产品的存量客户中每个客户,基于经营内容以及行业标签采用训练得到的提款概率预估模型进行处理,得到用于表示客户获取该金融产品的意愿大小的提款概率,并将每个客户的提款概率进行推送。通过这种方式可以对存量客户的提款意愿进行量化分析,能够根据提款概率直观的确定每个客户的需求,并且该提款概率可用于指导对存量客户的维护和触达方式的选择,降低维护成本,提高效率。
附图说明
图1为本发明提供的一种网络架构示意图;
图2为本发明提供的数据的处理方法实施例一的流程示意图;
图3为本发明提供的数据的处理方法实施例二的流程示意图;
图4为本发明提供的数据的处理方法实施例三的流程示意图;
图5为本发明提供的数据的处理方法实施例四的流程示意图;
图6为本发明提供的数据的处理方法实施例五的流程示意图;
图7为本发明提供的数据的处理方法实施例六的流程示意图;
图8为本发明提供的数据的处理装置实施例一的结构示意图;
图9为本发明提供的电子设备实施例一的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在目前的金融产品的行业,对于存量客户的维护和挖掘,仅用短信等零成本触达方式转化效率低,一般常用的方式是采用电销触达方式进行触达。然而,电销触达的方式成本较高,覆盖度小、对低提款意愿的客户进行电销触达容易浪费电销成本,而遗漏了高提款意愿的客户没有及时触达容易错过客户需求的时机。目前现有技术中还没有合适的对存量客户的分析方案。
基于上述问题,本发明提供一种数据的处理方法,在对存量客户进行分析的过程中,不仅仅考虑额度,利率,地区等因此,还考虑客户经营内容以及行业标签,通过长期的数据积累训练得到的提款概率模型,对前述的基础数据进行分析,得到表示客户提款意愿大小的提款概率,提供一种具体的对存量客户进行量化分析的方案,以解决现有技术中维护存量客户的成本高,效率低的问题。
发明人在分析上述问题的过程中发现,低活存量客户与企业贷款产品的互动行为较少,难以捕捉其行为特征。而且目前刻画企业客户的行业标签基本上都采用《国民经济行业分类》国家标准中规定的一千多种小类行业分类,而该国家标准中允许诸如“其他未列明批发业”等具体经营行业不明确的行业标签。经统计,该行业不明确的标签在企业金融产品的存量客户中占比近50%,无法得知其具体经营内容,不利于触达分析。基于此,本方案的主要构思是首先获取存量客户中每个客户实际经营内容,构建更详细粒度的行业标签,也就是说基于实际经营内容,以及客户的额度,利率,地区等综合因素,对存量客户进行分析,以确定其中高提款意愿的客户以及低提款意愿的客户,以指导后续的客户维护和触达方式的确定。
本发明提供的数据的处理方法可以应用在可以进行数据分析的服务器,计算机,智能终端等具有数据处理能力的电子设备中,对此本方案不做限制。
图1为本发明提供的一种网络架构示意图,如图1所示,该网络架构中,执行本发明提供的数据的处理方法的主体为电子设备,电子设备将通过互联网或者有线连接的方式从工商等企业经营数据提供方获取到每个客户具体的经营内容。该数据提供方可以是工商服务授权的数据服务器,也可以是授权存储数据的中间数据库等,对此本方案不限制。在该方案的实现中,电子设备需要的其他数据可以存储在自身的存储空间中,也可以存储在外部的数据库中,在电子设备需要数据时从数据库中访问获取即可。
具体的,图1中的电子设备在获取到需要的数据,并分析确定出每个客户提款概率之后,可以将这些客户的提款概率或者分析出需要每个服务人员进行电销触达的客户名单等发送给服务人员的终端设备,这里的服务人员可以是坐席,客服等,服务人员的终端设备为电脑,个人计算机等能够显示信息的设备,例如:图1中所示的个人计算机(PersonalComputer,PC),该显示设备可以用于显示该电子设备的分析结果,例如最终确定的客户的提款概率,或者选定的需要进行电销触达的客户名单等。
上述各个设备之间可以通过有线通信或者无线通信的方式进行数据传输,本方案不做限制。
下面以图1所示的架构应用在某金融产品的场景为例通过几个具体实施例对该数据的处理方法进行举例说明。
图2为本发明提供的数据的处理方法实施例一的流程示意图,如图2所示,本方案中,针对某一金融产品的存量客户,可以按照下面的方式分析确定每个客户的提款概率,该数据的处理方法包括以下步骤:
S101:获取金融产品的存量客户中每个客户的基础数据,每个客户的基础数据包括经营内容和行业标签。
在本步骤中,为了对存量客户进行分析,首先需要获取每个客户的基础数据,在该方案中,基础数据至少包括了经营内容和行业标签,这里的经营内容指的是客户实际经营的内容,并不包括在注册登记时填写的备选经营内容,行业标签指的也是根据具体经营内容确定的细分标签。
具体的实现中,该基础数据可以从授权的工商登记信息,或者税务登记信息等中获取到,可以实时从数据提供方获取,也可以将所有存量客户的基础数据获取到存储在本地,或者专门的数据库中,在使用时候从数据库中获取出来。
可选的,每个客户的基础数据还包括该客户的位置信息,所在地区的利率,额度信息等其他的信息。
S102:根据每个客户的基础数据,采用提款概率预估模型,获取每个客户的提款概率,提款概率预估模型是根据LGBM模型训练的能够预测客户提款概率的模型,每个客户的提款概率用于表示客户获取金融产品的意愿大小。
在本步骤中,在获取到了客户的基础数据之后,将这些基础数据作为输入,输入预先训练部署的提款概率预估模型进行计算,可以得到客户的提款概率,这个提款概率用于表示客户会获取该金融产品的意愿大小,例如,贷款业务,提款概率可表示用户办贷款的意愿大小。
在具体的实现中,客户的提款概率可以是0-1之间的数值,客户的提款概率数值越大(即越接近1)表示客户获取金融产品的意愿越大,客户的提款概率数值越小(即越接近0)表示客户获取金融产品的意愿越小。
在该方案中,该提款概率预估模型是预先根据轻量级梯度提升框架(LightGradient Boosting Machine,LGBM)模型,以及标定的样本数据进行训练得到的,样本数据包括大量的客户的基础数据以及提款信息,提款信息用于指示用户在预设的时间段内是否提款。该提款概率预估模型可以在该电子设备本地进行训练,训练后部署在概率预估方案中,或者也可以是在别的设备上进行训练后部署在该电子设备,本方案不做限制。
S103:推送每个客户的提款概率。
在本步骤中,在根据提款概率预估模型,基于客户的经营内容和行业标签等基础数据,预估得到客户的提款概率之后,可以将每个客户的提款概率推送给对应的服务人员,或者进行显示。以便服务人员能够直观的根据提款概率的数值确定客户获取某个金融产品的意愿。
在具体的推送过程中,一般的金融产品都有很多服务人员,每个服务人员维护的客户可能有所不同,因此,可以根据每个服务人员服务的客户名单,分别向每个服务人员的终端设备发送客户名单中的客户的提款概率。
也就是说,电子设备首先需要获取每个服务人员服务的客户名单,确定每个服务人员维护哪些客户,然后将预估得到的这些客户的提款概率发送给对应的服务人员,以便后续对客户进行维护管理等服务。
本实施例提供的数据的处理方法,对金融产品的所有存量客户,通过考虑企业客户的经营内容以及行业标签,对于金融产品的存量客户中每个客户,基于经营内容以及行业标签采用训练得到的提款概率预估模型进行处理,得到用于表示客户获取该金融产品的意愿大小的提款概率,并将每个客户的提款概率进行推送。通过这种方式可以对存量客户的提款意愿进行量化分析,能够根据提款概率直观的确定每个客户的需求,并且该提款概率可用于指导对存量客户的维护和触达方式的选择,降低维护成本,提高效率。
图3为本发明提供的数据的处理方法实施例二的流程示意图,如图3所示,在上述实施例的基础上,前述步骤S101中的获取金融产品的存量客户中每个客户的基础数据,包括:
S201:针对存量客户中的每个客户,接收其他设备发送的经营数据。
S202:对经营数据中进行分词处理和清洗处理,得到客户的经营内容和行业标签;其中,清洗处理包括剔除异常数据和剔除经营概率小于预设值的内容。
基于上述步骤,可知在具体的获取客户的基础数据时候,可以从数据提供方的设备获取到经营数据,例如从工商登记信息和税务登记信息中可以获取到企业客户的经营数据。一般来说,客户在登记的时候,除了主要经营内容,还会在括号中填写一个备选的可能经营的内容,但是实际上这部分对于刻画企业具体的经营内容意义不大。
因此,在获取到经营数据之后,可以对经营数据中的企业名称、经营范围进行分词,清洗掉行业标签或经营范围异常的数据(值为空等),并去除经营范围内括号与括号中的内容(该内容对于刻画企业具体经营行业意义不大,也就是经营概率小于预设值的内容),最后进行分词得到客户的经营内容和行业标签。
此外,每个客户的基础数据还包括所述客户的位置信息,所在地区的利率,额度信息。这些信息可以根据客户登记的营业地址确定,确定了位置信息之后,可从网络或者公开信息,或者银行数据中确定出客户所在地区的利率。
图4为本发明提供的数据的处理方法实施例三的流程示意图,如图4所示,在上述任一实施例的基础上,在将每个客户的提款概率进行推送之前,该数据的处理方法还包括:
S104:根据每个客户的提款概率,对存量客户中的所有客户按照提款概率从高到低或者从低到高的顺序进行排序。
本步骤中,在客户比较多的情况下,直接将每个客户的提款概率推送给服务人员,服务人员才查看时效率较低。因此将提款概率进行显示或者推送给服务人员之前,为了让服务人员能够更直观的确定出哪些客户的提款概率较高,可以将所有客户的提款概率按照从高到低或者从低到高的顺序进行排序。
本实施例提供的数据的处理方法,在预估到每个客户的提款概率之后,对客户根据提款概率大小进行排序,在服务人员查看时可以直观的确定哪些客户的提款意愿更强烈,有效指导后续客户的维护工作,提高处理效率。
图5为本发明提供的数据的处理方法实施例四的流程示意图,如图5所示,在上述任一实施例的基础上,该数据的处理方法还包括:
S105:根据每个客户的提款概率,从存量客户中选取出提款概率最高的多个客户作为目标客户。
在本步骤中,为了进一步提高服务人员维护存量客户的效率,电子设备也可以根据预设的规则总存量客户中选出目标客户,这些目标客户作为后续可电销触达的客户,直接展示给服务人员。
具体的,根据实际能够通过电销触达方式进行服务的客户数量,从所有存量客户中选择出提款概率最高的多个客户作为目标客户,这里目标客户的数量可以根据能够电销触达服务的客户数量确定,例如:存量客户有10万人,然而根据实际服务人员的情况,只能对其中1万人进行电销触达,那么则可以从存量客户中选择出提款概率最高的1万人作为目标客户。
可选的,在选出目标客户之后,还可以执行下面的步骤:
S106:向服务人员的终端设备发送电销触达指示信息,电销触达指示信息用于指示服务人员对目标客户采用电销触达方式进行沟通。
在本方案中,电子设备在确定出目标客户之后,可以直接向服务人员下达电销触达命令,指示服务人员向哪些客户进行电销触达。具体的实现中,电子设备可以向服务人员的终端设备发送电销触达指示信息,其中包括目标客户的名单。
本实施例提供的数据的处理方法,对存量客户的提款意愿进行量化分析,能够根据提款概率直观的确定每个客户的需求,并且电子设备可直接根据提款概率从存量客户中选择出进行电销触达的客户,并指示服务人员对这些目标客户进行维护和电销触达方式,不需要服务人员人工去挑选客户,进一步降低维护成本,提高效率。
图6为本发明提供的数据的处理方法实施例五的流程示意图,如图6所示,在上述任一实施例的基础上,在采用本发明提供的方案进行存量客户的分析之前,首先需要获取提款概率预估模型,该模型可以是在别的设备上训练好部署在该电子设备上的,也可以直接在该电子设备上进行训练,对此本方案不做限制。训练提款概率预估模型的过程具体包括以下步骤:
S301:获取训练样本数据,训练样本数据中包括多个采用过电销触达方式的客户的基础数据以及提款信息,客户的提款信息用于表示所述客户在电销触达之后的预设时间段内是否提款。
在本方案的实现中,需要预先获取到提款概率预估模型,该提款概率预估模型可以根据预先得到的训练样本数据进行训练,这些训练样本数据中包括客户的基础数据以及提款信息,基础数据中至少包括经营内容和行业标签。该经营内容和行业标签的获取方式与前述实施例中类似。可以从数据提供方的设备获取到经营数据,例如从工商登记信息和税务登记信息中可以获取到企业客户的经营数据。并在获取到经营数据之后,可以对经营数据中的企业名称、经营范围进行分词,清洗掉行业标签或经营范围异常的数据(值为空等),并去除经营范围内括号与括号中的内容(该内容对于刻画企业具体经营行业意义不大,也就是经营概率小于预设值的内容),最后进行分词得到客户的经营内容和行业标签。
基础数据中还可以包括客户的位置信息,所在地区的利率,额度信息。这些信息可以根据客户登记的营业地址确定,确定了位置信息之后,可从网络或者公开信息,或者银行数据中确定出客户所在地区的利率。
另外,这些训练样本数据中的客户均是进行电销触达之后一段时间(例如一个月,30天)内的客户,可以明确的确定这些客户是否进行了提款,也就是样本数据中还包括提款信息,客户的提款信息用于表示所述客户在电销触达之后的预设时间段内是否提款。
S302:将训练样本数据中,在电销触达之后预设时间段内提款的客户作为正样本,将在电销触达之后预设时间段内未提款的客户作为负样本,采用LGBM模型进行训练,得到提款概率预估模型。
在获取到训练样本数据之后,可将电销触达后进行了提款的客户作为正样本,例如:提款概率是1,将电销触达后未进行提款的客户作为负样本,例如提款概率设置为0。
将训练样本数据中的样本,采用LCBM模型进行训练,得到输入客户的基础数据能够预估计算出客户在接下来预设时间段内的提款概率的提款概率预估模型。
在该方案的实现中,应理解,在模型训练过程中,如果训练样本数据采用的电销触达之后1个月之内的提款信息作为样本,那么训练得到提款概率预估模型能够预估的是未来一个月内的提款概率。如果训练样本数据采用的电销触达之后2个月之内的提款信息作为样本,那么训练得到提款概率预估模型能够预估的是未来两个月内的提款概率。该提款概率预估模型具体能够预测的时间区间与训练时候采用的样本中提款信息的时间区间相关。
本实施例提供的数据处理方法,提供了一种具体的提款概率预估模型的训练方法,通过已确定提款信息的训练样本数据进行模型训练,得到可以对存量客户进行提款概率预估的提款概率预估模型,实现对存量客户的量化分析,能够直观的确定出客户的提款意愿,提高对客户的维护和管理的效率,降低成本。
图7为本发明提供的数据的处理方法实施例六的流程示意图,如图7所示,在前述实施例的基础上,当电子设备将得到的客户的提款概率之后,可以将每个客户的提款概率直接发送给不同的服务人员,也可以选择出需要通过电销触达的客户,并指示给服务人员,或者直接根据提款概率进行排序,排序后显示给服务人员之后,服务人员可以根据指示进行电销,并在一段时间之后可以确定电销触达的效果如何,即可以确定电销触达后的客户有没有提款。该数据的处理方法还包括:
S401:获取对目标客户中每个客户进行电销触达的提款信息,每个客户对应的提款信息用于表示在预设时间段内客户是否提款。
S402:将目标客户中提款信息指示在预设时间段内未进行提款的客户作为新的样本,对提款概率预估模型进行优化训练,得到新的提款概率预估模型。
在本方案中,在提款概率预估模型的使用过程中,还可以对其不断的进行优化,提高预估的准确度。具体的当在上述任一实施例中,将客户的提款概率进行推送,或者向服务人员发送了电销触发指示信息之后,服务人员将对提款概率高的客户进行电销触达,并且在电销触达之后的一个月或者其他时间间隔之后,可以确定出这些客户是否进行了提款,也就是能够得到电销触达的结果,即提款信息。
在得到提款信息之后,可将这些客户的基础数据和提款信息作为新的样本,继续对提款概率预估模型进行优化训练。具体的,对于那些模型预估错误的客户作为负样本,重新加入模型训练,不断提高提款概率预估模型的预估准确度。可选的,也可以将预估正确的客户作为正样本加入模型训练,增加训练样本的数量也可以进一步的提高提款概率预估模型的预估准确度。
在上述任一实施例的基础上,下面通过以企业贷款作为一种具体的金融产品为例,对本发明提供的数据处理方法进行举例说明。本发明提供的方案应用在企业贷款业务中,可在基于额度、利率、地区等因素外,从经营内容中挖掘企业实际经营内容,构建细粒度的行业标签,提前预测低活存量客户的提款意愿,对高提款意愿客户优先进行电销召回,具体流程如下:
(1),收集电销触达过的企业客户的基础数据、提款信息等作为初始数据。具体的可以从工商登记信息等数据中获取业务的经营范围,并对企业名称、经营范围进行分词,清洗掉行业标签或经营范围异常的数据(值为空等),并去除经营范围内括号与括号中的内容(该内容对于刻画企业具体经营行业意义不大),最后进行分词,得到经营内容和行业标签。
(2),以电销触达时间作为开始时间,以30天为界限(一般30天达到电销触达影响的最长时间),30天内有提款行为的企业客户作为正样本,未有提款行为的企业客户作为负样本,同时将开始时间作为特征之一;
(3),使用LGBM(Light Gradient Boosting Machine)模型训练存量客户提款概率预估模型;
(4),在具体对某些客户进行预测时,采用上述步骤训练得到的提款概率预估模型,以当前具体下发时间为开始时间点对存量客户提款概率进行预估,输入客户的基础数据以及额度,地区,利率等因素,得到客户的提款概率。如果预估的提款概率越高,则表示该客户未来30天的提款意愿越大;如果预估的提款概率越低,则表示该客户未来30天的提款意愿越小。一般来说预估得到的提款概率的数值可在0-1之间。
(5),经过线上测试后,服务人员已经根据预测出的提款概率对不同的客户进行了电销触达,并在30的周期内进行了验证,得到的预估的验证结果,此时可根据结果对模型进行进一步优化。具体的,对于那些模型预估错误的客户作为负样本,重新加入模型训练,不断提高提款概率预估模型的预估准确度。
可选的,也可以将预估正确的客户作为正样本加入模型训练,增加训练样本的数量也可以进一步的提高提款概率预估模型的预估准确度。
可选的,在该步骤中根据预预估的验证结果进行模型优化时,可以分别对预估正确和预估错误的客户样本进行加权,加权之后再进行模型训练。
基于上述任一实施例,可知本发明提供的数据处理方法,可以通过税务/工商等机构公开信息拉取存量企业客户的行业标签与经营内容,无需额外爬取资源,精准预估用户提款意愿,提取高提款意愿的用户进行针对性电销,提升电销资源的转化效率,优化随机抽取用户电销的成本。
并且,在该方案中从经营范围中挖掘具体经营内容,从经营内容维度把握客户的用户需求时间点,结合存量客户的额度、利率、地区与时间,多因素预估客户未来的提款意愿,解决了低活存量客户互动行为少以及行业信息不准确带来的运营成本损失。
同时,可以建立自动化系统,动态学习不同时间行业发展特征,矫正提款概率预测模型的预估偏差,增强用户提款意愿预估系统可用性和持续性。
图8为本发明提供的数据的处理装置实施例一的结构示意图,如图8所示,该数据的处理装置10,包括:
获取模块11,用于获取金融产品的存量客户中每个客户的基础数据,每个客户的基础数据包括所述经营内容和行业标签;
处理模块12,用于根据每个客户的基础数据,采用提款概率预估模型,获取每个客户的提款概率,所述提款概率预估模型是根据LGBM模型训练的能够预测客户提款概率的模型,每个客户的提款概率用于表示所述客户获取所述金融产品的意愿大小;
推送模块13,用于推送所述每个客户的提款概率。
本实施例提供的数据的处理装置,用于执行前述任一方法实施例的技术方案,其实现原理和技术效果类似,通过这种方式可以对存量客户的提款意愿进行量化分析,能够根据提款概率直观的确定每个客户的需求,并且该提款概率可用于指导对存量客户的维护和触达方式的选择,降低维护成本,提高效率。
在上述实施例的基础上,该数据的处理装置10的具体实施方式中,所述获取模块11具体用于:
针对所述存量客户中的每个客户,接收其他设备发送的经营数据;
对所述经营数据中进行分词处理和清洗处理,得到所述客户的经营内容和行业标签;其中,所述清洗处理包括剔除异常数据和剔除经营概率小于预设值的内容。
其中,每个客户的基础数据还包括所述客户的位置信息,所在地区的利率,额度信息。
可选的,所述处理模块12还用于:
根据每个客户的提款概率,对所述存量客户中的所有客户按照提款概率从高到低或者从低到高的顺序进行排序。
可选的,所述处理模块12还用于:
根据每个客户的提款概率,从所述存量客户中选取出提款概率最高的多个客户作为目标客户。
可选的,所述推送模块13还用于:
向服务人员的终端设备发送电销触达指示信息,所述电销触达指示信息用于指示所述服务人员对所述目标客户采用电销触达方式进行沟通。
可选的,所述处理模块12具体用于:
获取对所述目标客户中每个客户进行电销触达的提款信息,每个客户对应的提款信息用于表示在预设时间段内所述客户是否提款;
将所述目标客户中提款信息指示在预设时间段内未进行提款的客户作为新的样本,对所述提款概率预估模型进行优化训练,得到新的提款概率预估模型。
可选的,所述根据每个客户的基础数据,采用提款概率预估模型,获取每个客户的提款概率之前,所述处理模块12还用于:
获取训练样本数据,所述训练样本数据中包括多个采用过电销触达方式的客户的基础数据以及提款信息,客户的提款信息用于表示所述客户在电销触达之后的预设时间段内是否提款;
将所述训练样本数据中,在电销触达之后预设时间段内提款的客户作为正样本,将在电销触达之后预设时间段内未提款的客户作为负样本,采用LGBM模型进行训练,得到所述提款概率预估模型。
可选的,所述推送模块13具体用于:
根据每个服务人员服务的客户名单,分别向每个服务人员的终端设备发送客户名单中的客户的提款概率。
前述任一实施例提供的数据的处理装置,用于执行前述任一方法实施例的技术方案,其实现原理和技术效果类似,在此不再赘述。
图9为本发明提供的电子设备实施例一的结构示意图,如图9所示,该电子设备20包括:存储器22、处理器21及存储在所述存储器22上并可在所述处理器21上运行的计算机程序,所述计算机程序被所述处理器21执行时实现前述任一方法实施例提供的数据的处理方法的步骤。
可选的,电子设备20还可以包括与其他设备进行通信的接口23。
该电子设备20的上述各个器件之间可以通过总线连接。
存储器22可以是单独的存储单元,也可以是集成在处理器21中的存储单元。处理器21的数量为一个或者多个。
在上述在电子设备20的实现中,存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互,也就是存储器和处理器可以通过接口连接,也可以集成在一起。例如,这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接,如可以通过总线连接。存储器可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(ProgrammableRead-Only Memory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。进一步地,上述存储器内的软件程序以及模块还可包括操作系统,其可包括各种用于管理系统任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通信,从而提供其他软件组件的运行环境。
处理器21可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、图像处理器等,可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述任一方法实施例提供的数据的处理方法的步骤
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台电子设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (12)

1.一种数据的处理方法,其特征在于,包括:
获取金融产品的存量客户中每个客户的基础数据,每个客户的基础数据包括经营内容和行业标签;
根据每个客户的基础数据,采用提款概率预估模型,获取每个客户的提款概率,所述提款概率预估模型是根据轻量级梯度提升框架LGBM模型训练的能够预测客户提款概率的模型,每个客户的提款概率用于表示所述客户获取所述金融产品的意愿大小;
推送所述每个客户的提款概率。
2.根据权利要求1所述的方法,其特征在于,所述获取金融产品的存量客户中每个客户的基础数据,包括:
针对所述存量客户中的每个客户,接收其他设备发送的经营数据;
对所述经营数据中进行分词处理和清洗处理,得到所述客户的经营内容和行业标签;其中,所述清洗处理包括剔除异常数据和剔除经营概率小于预设值的内容。
3.根据权利要求1所述的方法,其特征在于,每个客户的基础数据还包括所述客户的位置信息,所在地区的利率,额度信息。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
根据每个客户的提款概率,对所述存量客户中的所有客户按照提款概率从高到低或者从低到高的顺序进行排序。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
根据每个客户的提款概率,从所述存量客户中选取出提款概率最高的多个客户作为目标客户。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
向服务人员的终端设备发送电销触达指示信息,所述电销触达指示信息用于指示所述服务人员对所述目标客户采用电销触达方式进行沟通。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
获取对所述目标客户中每个客户进行电销触达的提款信息,每个客户对应的提款信息用于表示在预设时间段内所述客户是否提款;
将所述目标客户中提款信息指示在预设时间段内未进行提款的客户作为新的样本,对所述提款概率预估模型进行优化训练,得到新的提款概率预估模型。
8.根据权利要求1至3任一项所述的方法,其特征在于,所述根据每个客户的基础数据,采用提款概率预估模型,获取每个客户的提款概率之前,所述方法还包括:
获取训练样本数据,所述训练样本数据中包括多个采用过电销触达方式的客户的基础数据以及提款信息,客户的提款信息用于表示所述客户在电销触达之后的预设时间段内是否提款;
将所述训练样本数据中,在电销触达之后预设时间段内提款的客户作为正样本,将在电销触达之后预设时间段内未提款的客户作为负样本,采用LGBM模型进行训练,得到所述提款概率预估模型。
9.根据权利要求1至3任一项所述的方法,其特征在于,所述推送所述每个客户的提款概率,包括:
根据每个服务人员服务的客户名单,分别向每个服务人员的终端设备发送客户名单中的客户的提款概率。
10.一种数据的处理装置,其特征在于,包括:
获取模块,用于获取金融产品的存量客户中每个客户的基础数据,每个客户的基础数据包括经营内容和行业标签;
处理模块,用于根据每个客户的基础数据,采用提款概率预估模型,获取每个客户的提款概率,所述提款概率预估模型是根据轻量级梯度提升框架LGBM模型训练的能够预测客户提款概率的模型,每个客户的提款概率用于表示所述客户获取所述金融产品的意愿大小;
推送模块,用于推送所述每个客户的提款概率。
11.一种电子设备,其特征在于,所述电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至9任一项所述的数据的处理方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的数据的处理方法的步骤。
CN202011060611.7A 2020-09-30 2020-09-30 数据的处理方法、装置、设备和存储介质 Pending CN112131479A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011060611.7A CN112131479A (zh) 2020-09-30 2020-09-30 数据的处理方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011060611.7A CN112131479A (zh) 2020-09-30 2020-09-30 数据的处理方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN112131479A true CN112131479A (zh) 2020-12-25

Family

ID=73843515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011060611.7A Pending CN112131479A (zh) 2020-09-30 2020-09-30 数据的处理方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112131479A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065946A (zh) * 2021-03-17 2021-07-02 上海浦东发展银行股份有限公司 一种信用卡证件过期客户分类促更新方法、装置及存储介质
CN113688385A (zh) * 2021-07-20 2021-11-23 电子科技大学 轻量级分布式入侵检测方法
CN116071103A (zh) * 2023-03-07 2023-05-05 天津金城银行股份有限公司 促使客户借款的方法、装置和电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120137529A (ko) * 2011-04-05 2012-12-24 문석진 판매시점에서의 거래촉진 시스템 및 방법
CN105160008A (zh) * 2015-09-21 2015-12-16 合一网络技术(北京)有限公司 一种定位推荐用户的方法及装置
CN106022508A (zh) * 2016-05-06 2016-10-12 陈丛威 预测线上理财平台的用户邀请好友行为的方法和装置
CN108460601A (zh) * 2017-11-27 2018-08-28 平安科技(深圳)有限公司 客户名单获取方法、装置、终端设备及存储介质
CN110109902A (zh) * 2019-03-18 2019-08-09 广东工业大学 一种基于集成学习方法的电商平台推荐系统
CN110363650A (zh) * 2019-06-27 2019-10-22 上海淇毓信息科技有限公司 一种存量用户动支意愿预测方法、装置和系统
CN111311401A (zh) * 2020-03-30 2020-06-19 百维金科(上海)信息科技有限公司 一种基于LightGBM的金融违约概率预测模型
CN111383094A (zh) * 2020-03-06 2020-07-07 深圳前海微众银行股份有限公司 产品服务全链驱动方法、设备及可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120137529A (ko) * 2011-04-05 2012-12-24 문석진 판매시점에서의 거래촉진 시스템 및 방법
CN105160008A (zh) * 2015-09-21 2015-12-16 合一网络技术(北京)有限公司 一种定位推荐用户的方法及装置
CN106022508A (zh) * 2016-05-06 2016-10-12 陈丛威 预测线上理财平台的用户邀请好友行为的方法和装置
CN108460601A (zh) * 2017-11-27 2018-08-28 平安科技(深圳)有限公司 客户名单获取方法、装置、终端设备及存储介质
CN110109902A (zh) * 2019-03-18 2019-08-09 广东工业大学 一种基于集成学习方法的电商平台推荐系统
CN110363650A (zh) * 2019-06-27 2019-10-22 上海淇毓信息科技有限公司 一种存量用户动支意愿预测方法、装置和系统
CN111383094A (zh) * 2020-03-06 2020-07-07 深圳前海微众银行股份有限公司 产品服务全链驱动方法、设备及可读存储介质
CN111311401A (zh) * 2020-03-30 2020-06-19 百维金科(上海)信息科技有限公司 一种基于LightGBM的金融违约概率预测模型

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱珏樟;: "客户购买行为建模分析预测", 现代计算机, no. 21, 25 July 2020 (2020-07-25) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065946A (zh) * 2021-03-17 2021-07-02 上海浦东发展银行股份有限公司 一种信用卡证件过期客户分类促更新方法、装置及存储介质
CN113688385A (zh) * 2021-07-20 2021-11-23 电子科技大学 轻量级分布式入侵检测方法
CN113688385B (zh) * 2021-07-20 2023-04-07 电子科技大学 轻量级分布式入侵检测方法
CN116071103A (zh) * 2023-03-07 2023-05-05 天津金城银行股份有限公司 促使客户借款的方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN112131479A (zh) 数据的处理方法、装置、设备和存储介质
JP4981146B2 (ja) クロスチャネル最適化システムおよび方法
CN111210335B (zh) 用户风险识别方法、装置及电子设备
CN111340558B (zh) 基于联邦学习的线上信息处理方法、装置、设备及介质
CN109214676B (zh) 一种业务订单处理方法、装置、服务器及存储介质
CN104823188A (zh) 针对在线系统中的用户动作的定制化预测器
CN112508694B (zh) 服务器处理资源额度申请的方法、装置及电子设备
JP2015225362A (ja) 分析装置および分析方法
CN111583018A (zh) 一种基于用户金融表现分析的授信策略管理方法、装置和电子设备
CN112017060A (zh) 为目标用户进行资源分配的方法、装置及电子设备
CN111382359A (zh) 基于强化学习的服务策略推荐方法、装置、电子设备
CN112016855A (zh) 基于关系网匹配的用户行业识别方法、装置和电子设备
CN115759433A (zh) 业务办理等待时长的确定方法、装置和服务器
CN113393299A (zh) 推荐模型训练方法、装置、电子设备和存储介质
CN112163154B (zh) 数据处理方法、装置、设备及存储介质
CN117391866A (zh) 一种数据处理方法、装置、设备及其存储介质
CN116664306A (zh) 风控规则的智能推荐方法、装置、电子设备及介质
CN112348661B (zh) 基于用户行为轨迹的服务策略分配方法、装置及电子设备
CN114282940A (zh) 用于意图识别的方法及装置、存储介质及电子设备
US20210397602A1 (en) Systems and methods for analyzing electronic data to determine faults in a transit system
CN112669136A (zh) 基于大数据的金融产品推荐方法、系统、设备及存储介质
CN114003567A (zh) 数据采集的方法及相关装置
CN112288475A (zh) 产品推荐方法、装置及电子设备
CN112527991A (zh) 信息处理方法、装置及介质
CN113344550B (zh) 一种流程处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination