CN111951050B - 理财产品推荐方法及装置 - Google Patents
理财产品推荐方法及装置 Download PDFInfo
- Publication number
- CN111951050B CN111951050B CN202010820402.1A CN202010820402A CN111951050B CN 111951050 B CN111951050 B CN 111951050B CN 202010820402 A CN202010820402 A CN 202010820402A CN 111951050 B CN111951050 B CN 111951050B
- Authority
- CN
- China
- Prior art keywords
- financial product
- feature
- client
- sample
- financial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Technology Law (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种理财产品推荐方法及装置,涉及人工智能技术领域,该方法包括:获取第一理财产品的客户推荐模型的特征空间;根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征;分别对所述第一理财产品的客户样本和所述第二理财产品的客户样本进行特征编码,得到合并后的客户样本;根据所述合并后的客户样本、所述特征空间以及预设的机器学习算法训练出所述第二理财产品的客户推荐模型。本发明有助于缩短新发行理财产品的客户推荐模型的训练时间。
Description
技术领域
本发明涉及人工智能技术领域,具体而言,涉及一种理财产品推荐方法及装置。
背景技术
随着互联网信息时代的到来,在线营销数据日益增多,理财产品不断向多样化发展。目前可以针对理财产品建立对应的理财产品推荐模型,理财产品推荐模型可以为理财经理推荐潜在客户,进而理财经理对客户进行营销。高效准确的推荐模型可以大大提高客户经理的营销效率,节省人力成本。目前理财产品推荐模型存在建模门槛高、建模周期长、数据孤岛、冷启动等问题,随着金融机构发行新的理财产品的频率变高,如何高效建立新产品的推荐模型,尽快为金融机构客户经理推荐精准的投资客户是本领域的一个问题。
发明内容
本发明为了解决上述背景技术中的技术问题,提出了一种理财产品推荐方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种理财产品推荐方法,该方法包括:
获取第一理财产品的客户推荐模型的特征空间;
根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征;
根据所述共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征生成所述第二理财产品对应的特征空间;
基于所述第二理财产品对应的特征空间分别对所述第一理财产品的客户样本和所述第二理财产品的客户样本进行特征编码,得到合并后的客户样本;
根据所述合并后的客户样本、所述第二理财产品对应的特征空间以及预设的机器学习算法训练出所述第二理财产品的客户推荐模型,以根据所述第二理财产品的客户推荐模型确定所述第二理财产品对应的推荐客户。
可选的,所述特征空间包含:连续型特征;
所述根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征,包括:
根据各所述连续型特征分别在所述第一理财产品的客户样本上的取值和在第二理财产品的客户样本上的取值分别计算每个所述连续型特征各自对应的群体稳定性指标;
根据所述群体稳定性指标确定所述第一理财产品与所述第二理财产品的共有的连续型特征。
可选的,所述特征空间包含:离散型特征;
所述根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征,包括:
判断离散型特征在所述第一理财产品的客户样本上的取值与该离散型特征在第二理财产品的客户样本上的取值是否垂直隔离;
若否,则判断该离散型特征为所述第一理财产品与所述第二理财产品的共有的离散型特征。
可选的,所述根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征,包括:
将所述特征空间中除去所述共有特征之外的其他特征分别作为所述第一理财产品的特有特征以及所述第二理财产品的特有特征。
可选的,所述根据所述群体稳定性指标确定所述第一理财产品与所述第二理财产品的共有的连续型特征,包括:
将群体稳定性指标小于预设阈值的连续型特征确定为所述第一理财产品与所述第二理财产品的共有的连续型特征。
可选的,所述基于所述第二理财产品对应的特征空间分别对所述第一理财产品的客户样本和所述第二理财产品的客户样本进行特征编码,包括:
仅对所述第一理财产品的客户样本和所述第二理财产品的客户样本中的特有特征进行特征编码。
可选的,该理财产品推荐方法,还包括:
获取所述第一理财产品的客户样本,其中,所述第一理财产品的客户样本包括正样本和负样本,所述正样本为在对客户进行营销后预设天数内购买所述第一理财产品的客户,所述负样本为在对客户进行营销后预设天数内未购买所述第一理财产品的客户;
根据所述客户样本采用自动机器学习方法训练出所述第一理财产品的客户推荐模型。
可选的,所述第一理财产品为结构性存款理财产品,所述第二理财产品为低风险基金投资产品。
可选的,所述预设的机器学习算法包括:Xgboost算法或GLM算法。
为了实现上述目的,根据本发明的另一方面,提供了一种理财产品推荐装置,该装置包括:
特征空间获取单元,用于获取第一理财产品的客户推荐模型的特征空间;
特征分类单元,用于根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征;
特征空间生成单元,用于根据所述共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征生成所述第二理财产品对应的特征空间;
样本合并单元,用于基于所述第二理财产品对应的特征空间分别对所述第一理财产品的客户样本和所述第二理财产品的客户样本进行特征编码,得到合并后的客户样本;
模型训练单元,用于根据所述合并后的客户样本、所述第二理财产品对应的特征空间以及预设的机器学习算法训练出所述第二理财产品的客户推荐模型,以根据所述第二理财产品的客户推荐模型确定所述第二理财产品对应的推荐客户。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述理财产品推荐方法中的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述理财产品推荐方法中的步骤。
本发明的有益效果为:本发明实施例根据现有理财产品的客户推荐模型采用迁移学习的方法训练出其他类似理财产品的客户推荐模型,缩短了新发布理财产品的客户推荐模型的训练时间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例理财产品推荐方法的第一流程图;
图2是本发明实施例确定第一理财产品与第二理财产品的共有的连续型特征的流程图;
图3是本发明实施例确定第一理财产品与第二理财产品的共有的离散型特征的流程图;
图4是本发明实施例训练第一理财产品的客户推荐模型的流程图;
图5是本发明实施例理财产品推荐方法的第二流程图;
图6是本发明实施例正负样本划分示意图;
图7是本发明实施例自动机器学习系统示意图;
图8是本发明实施例迁移学习的流程图;
图9是本发明实施例理财产品推荐装置的结构框图;
图10是本发明实施例特征分类及特征编码的示意图;
图11是本发明实施例计算机设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图1是本发明实施例理财产品推荐方法的第一流程图,如图1所示,本实施例的理财产品推荐方法包括步骤S101至步骤S105。
步骤S101,获取第一理财产品的客户推荐模型的特征空间。
在本发明实施例中,第一理财产品的客户推荐模型可以为采用现有任意一种方法训练出的客户推荐模型。在本发明实施例中,第一理财产品的客户推荐模型可以用f(X)表示,特征空间可以用X来表示。在本发明实施例中,特征空间X中包含多种特征,该特征为客户特征或客户相关特征,具体的特征可见下表1。在本发明实施例中,特征空间X中的特征根据类型可以分为:连续型特征和离散型特征。
步骤S102,根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征,其中,所述第二理财产品对应的特征空间与所述第一理财产品对应的特征空间相同。
在本发明实施例中,本发明以第一理财产品为源域,第二理财产品为目标域,采用迁移学习的方法根据第一理财产品(源域)的客户推荐模型训练出第二理财产品(目标域)的客户推荐模型。在本发明实施例中,在迁移学习开始前目标域延用源域模型的特征空间X,但特征空间X中的各特征在源域的客户样本中以及目标域的客户样本中的取值分布不同。
本步骤根据特征空间X中的各特征分别在第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定第一理财产品和第二理财产品的共有特征,特征空间X中除去所述共有特征之外的其他特征为特有特征,第一理财产品的特有特征和第二理财产品的特有特征相同,但分别为第一理财产品和第二理财产品均建立一个特有特征集。
在本发明实施例中,特征空间X中的特征根据类型可以分为:连续型特征和离散型特征。因此,所述共有特征中包括:共有的连续型特征和共有的离散型特征,同理,特有特征中也包括:特有的连续型特征和特有的离散型特征。
在本发明实施例中,第一理财产品可以为现有发行较早,客户样本较为充足的理财产品,其客户推荐模型已经采用现有技术的方法训练得出。而第二理财产品可以为新发行的理财产品或者客户样本量较少的理财产品,其采用现有的模型训练方法,训练周期很长,由于缺少客户样本模型的准确性难以保证。
在本发明一具体可选实施例中,所述第一理财产品为结构性存款理财产品,所述第二理财产品为低风险基金投资产品。结构性存款理财产品样本充足,低风险基金投资产品样本稀缺。结构性存款理财产品是保本型理财产品,将部分本金和固定利息分别投资金融衍生品或者贵金属。保本型结构性存款和低风险基金投资产品在产品特征和客户特征有很大的相似性,特征重叠较多。
步骤S103,根据所述共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征生成所述第二理财产品对应的特征空间。
在本发明实施例中,本步骤根据步骤S102的特征空间X的分类结果建立第二理财产品(目标域)对应的特征空间X′,该特征空间X′包含:第一理财产品(源域)与第二理财产品(目标域)的共有特征、第一理财产品(源域)的特有特征以及第二理财产品(目标域)的特有特征。
步骤S104,基于所述第二理财产品对应的特征空间分别对所述第一理财产品的客户样本和所述第二理财产品的客户样本进行特征编码,得到合并后的客户样本。
在本发明实施例中,本步骤将第一理财产品的客户样本和第二理财产品的客户样本统一编码到第二理财产品对应的特征空间X′中,合并客户样本,得到合并后的客户样本。
步骤S105,根据所述合并后的客户样本、所述第二理财产品对应的特征空间以及预设的机器学习算法训练出所述第二理财产品的客户推荐模型,以根据所述第二理财产品的客户推荐模型确定所述第二理财产品对应的推荐客户。
在本发明实施例中,迁移学习开始前目标域延用源域模型的特征空间X,但在训练第二理财产品的客户推荐模型时,采用上述步骤S103生成的第二理财产品对应的特征空间X′进行模型训练。
在本发明可选实施例中,本步骤中采用的机器学习算法可以为Xgboost算法或GLM算法,优选采用Xgboost算法。在本发明实施例中,本发明发现由于客户归属信息表和活期交易明细表中的客户特征对理财类产品的模型贡献交大。活期交易多为连续特征,同时参考结构性存款模型的组合特征重要性清单,显示组合特征也较高。Xgboost算法或GLM算法对连续性特征和组合特征表达能力较佳,因此本发明选用Xgboost算法或GLM算法进行模型训练。
由此可见,本发明通过引入迁移学习提升新发行理财产品客户推荐模型因数据稀疏性带来的模型效果欠佳问题,将成熟的理财产品的模型通过共享模型参数的方式迁移生成新产品的推荐模型。
图2是本发明实施例确定第一理财产品与第二理财产品的共有的连续型特征的流程图,如图2所示,本发明实施例的确定第一理财产品与第二理财产品的共有的连续型特征的流程包括步骤S201和步骤S202。
步骤S201,根据各所述连续型特征分别在所述第一理财产品的客户样本上的取值和在第二理财产品的客户样本上的取值分别计算每个所述连续型特征各自对应的群体稳定性指标。
在本发明实施例中,特征空间X中的特征根据类型可以分为:连续型特征和离散型特征。针对离散型特征,本发明通过计算各离散特征的群体稳定性指标(PopulationStability Index,PSI),根据各离散型特征各自的PSI来确定源域和目标域共有的连续型特征。
在本发明实施例中,一个连续型特征的PSI为根据该连续型特征在第一理财产品(源域)的客户样本上的取值以及该连续型特征在第二理财产品(目标域)的客户样本上的取值计算得出。在本发明一个实施例中,群体稳定性指标的计算公式可以为:
步骤S202,根据所述群体稳定性指标确定所述第一理财产品与所述第二理财产品的共有的连续型特征。
在本发明实施例中,本步骤具体可以为:将群体稳定性指标小于预设阈值的连续型特征确定为所述第一理财产品与所述第二理财产品的共有的连续型特征。
在本发明一个具体实施例中,所述预设阈值为0.25,即群体稳定性指标小于0.25的连续型特征为第一理财产品与第二理财产品的共有的连续型特征,群体稳定性指标大于且等于0.25的连续型特征为源域和目标域的特有特征。
图3是本发明实施例确定第一理财产品与第二理财产品的共有的离散型特征的流程图,如图3所示,本发明实施例的确定第一理财产品与第二理财产品的共有的离散型特征的流程包括步骤S301和步骤S302。
步骤S301,判断离散型特征在所述第一理财产品的客户样本上的取值与该离散型特征在第二理财产品的客户样本上的取值是否垂直隔离。
在本发明实施例中,针对离散型特征,本发明通过判断各离散型特征在源域和目标域的客户样本上的取值是否垂直隔离,来确定源域和目标域的共有的离散型特征。
在本发明实施例中,一个离散型特征在第一理财产品的客户样本上的取值与该离散型特征在第二理财产品的客户样本上的取值垂直隔离,表示该离散型特征在第一理财产品的客户样本中的特征值的集合与该离散型特征在第二理财产品的客户样本中的特征值的集合不存在交集。
步骤S302,若否,则判断该离散型特征为所述第一理财产品与所述第二理财产品的共有的离散型特征。
在本发明实施例中,确定源域和目标域的共有的连续型特征及共有的离散型特征的流程可以如图10所示。
在本发明一实施例中,上述步骤S103的基于所述共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征分别对所述第一理财产品的客户样本和所述第二理财产品的客户样本进行特征编码,得到合并后的客户样本,具体为:
仅对第一理财产品的客户样本和第二理财产品的客户样本中的特有特征进行特征编码,对共有特征不进行编码。
在本发明一个实施例中,进行特征编码的流程可见图10。在本发明中,对于源域和目标域共有特征,比如交易行为等,直接合并样本,不进行编码处理。对于源域和目标域的特有特征根据特征的类型分为离散特征编码和连续特征编码。
对于离散特征编码,本发明可以采用Count Encoding编码方式或者one hot编码方式,优选采用Count Encoding编码方式。
对于连续特征编码,本发明可以采用空间隔离的方式进行编码。
对于源域和目标域的特有特征,本方案的编码方式为对此类特征进行单独的空间隔离。源域的特有特征为一个空间,目标域的特有特征为一个空间。经此步骤后此类特征数量翻倍。本方案实现的方法为,特有特征被重命名为2个不同的特有特征分别代表源域特征和目标域特征。比如特有特征理财产品购买金额将被命名为理财产品购买金额_s(s表示源域)和理财产品购买金额_t(t表示目标域)。
本发明根据步骤S102的特征空间X的分类结果建立第二理财产品(目标域)对应的特征空间X′,特征空间X′包含:源域和目标域的共有特征对应的空间、源域的特有特征对应的空间以及目标域的特有特征对应的空间。本发明在将客户样本编码到特征空间X′中时,对于源域的一个客户样本,将该客户样本中的共有特征对应的特征值写入共有特征对应的空间中,将该客户样本中的特有特征对应的特征值写入源域的特有特征对应的空间中,在目标域的特有特征对应的空间中写入预设的标识表示没有数据。同理,对于目标域的一个客户样本,将该客户样本中的共有特征对应的特征值写入共有特征对应的空间中,将该客户样本中的特有特征对应的特征值写入目标域的特有特征对应的空间中,在源域的特有特征对应的空间中写入预设的标识。
图5是本发明实施例理财产品推荐方法的第二流程图,如图5所示,本实施例的理财产品推荐方法的流程包括:从预设的原始表中提取结构性存款理财产品对应的客户样本;将客户样本输入预设的AutoML系统中,AutoML系统根据客户样本自动训练出结构性存款理财产品的客户推荐模型;根据结构性存款理财产品的客户推荐模型采用迁移学习的方法训练出低风险基金投资产品的客户推荐模型。
在本发明可选实施例中,针对每个理财产品设定客户特征集,客户特征集中包含多个客户特征,客户特征集中包含的客户特征能够体现出对应的理财产品的客户的重要特征。每个客户的所有数据存储在对应的原始表中,本发明根据理财产品对应的客户特征集从客户的原始表中提取客户特征数据,组合形成客户样本。
在本发明可选实施例中,根据类型的不同原始表共有12张,如下表1所示,每张表中记载一个或多个客户特征。各原始表包含的客户特征具体为:
客户基本信息表包含客户编号和客户创建日期等特征;
个人客户信息表主要包含出生地、文化程度、职业职称、经济来源等特征;
第三方存管客户信息表包含券商信息、管理账户最大最小额度和余额、币种、印证转账标志等;
客户归属信息表包含客户经理属性(数量、归属机构)、资产、负债、违约和有效客户标志等;
个人客户资产地区月积数表包含内部机构号、资产月积数、活期和定期月积数、货币基金月积数、国债、黄金、公积金月积数等;
活期交易表包含活期交易次数和交易额、利息、余额、地区、币种等;
定期交易表包含开户金额、交易次数、余额、利率、存期、提取额(总、平均)、提取次数、到期利息等;
银证转账表包含交易业务日期、币种、交易金额、余额、交易发起方信息、冲正标志、券商信息等;
个人网银交易日志主要包含网银交易频数等特征;
结构性存款表包含客户信息号、营销日期、样本label等特征;
投资账户主协议关系表包含产品购买数量、网银交易频次、协议类型、手续费、渠道信息、协议有效期等。
表1
表1中的客户归属信息表和活期交易明细表尤为重要。客户特征集中的多数客户特征来源于此两张表。
图8是本发明实施例迁移学习的流程图,本实施例中的第一理财产品为结构性存款理财产品,第二理财产品为低风险基金投资产品,结构性存款理财产品为迁移学习的源域,低风险基金投资产品为迁移学习的目标域。如图8所示,本发明迁移学习的流程包括步骤S1至步骤S6。
步骤S1,获取通过AutoML训练的源域的模型f(X)。
步骤S2,获取源域的模型f(X)的特征空间X,目标域在迁移学习实现前沿用源域模型的特征空间X。
步骤S3,根据PSI指标对特征空间X进行分类。
步骤S4,将源域和目标域样本的统一编码到共有特征、源域特有特征和目标域特有特征三者并集对应的特征空间中X′,合并样本。
步骤S5,使用Xgboost算法或GLM算法训练模型。
步骤S6,生成目标域的模型f′(X′)。
图4是本发明实施例训练第一理财产品的客户推荐模型的流程图,如图4所示,上述第一理财产品的客户推荐模型的训练流程包括步骤S401和步骤S402。
步骤S401,获取所述第一理财产品的客户样本,其中,所述第一理财产品的客户样本包括正样本和负样本,所述正样本为在对客户进行营销后预设天数内购买所述第一理财产品的客户,所述负样本为在对客户进行营销后预设天数内未购买所述第一理财产品的客户。
在一实施例中,正负样本的划分可以如图6所示,如图6所示,上述预设天数为7天,本实施例将对客户进行营销后7内购买理财产品的客户样本定义为正样本,将对客户进行营销后7内未购买理财产品的客户样本定义为负样本。
步骤S402,根据所述客户样本采用自动机器学习方法训练出所述第一理财产品的客户推荐模型。
自动机器学习(Automatic Machine Learning,AutoML)为非机器学习专家的应用者提供了一种利用机器学习解决实际问题的一种方法,并且能够得到更好的效果。AutoML可以使得机器学习过程的一部分或全部工作自动化。一款AutoML软件通常整合了一些基础的机器学习算法如随机森林、通用线性模型、深度神经网络,能够根据数据的结果和任务类型自动选择并训练模型,并实现相应的算法,如回归、分类、聚类、基于时间序列的预测、机器视觉等。
本发明将客户样本输入到预设的自动机器学习系统中,进行自动模型训练,最终得到第一理财产品的客户推荐模型。
图7是本发明可选实施例自动机器学习系统示意图,如图7所示,本实施例自动机器学习系统包括:
数据预处理模块,用于完成数据表的自动拼接,设置主键关联主表和副表;根据清洗配置自动化清洗数据;数据筛选和样本拆分。
特征工程模块,用于完成时序特征、数值特征的自动抽取;特征自动分析;自动的组合特征和特征脚本生成。
算法选择模块和模型优化模块,实现了并行调用集成的推荐算法。算法选择和训练优化功能包括:(1)超参数空间搜索,常见的超参搜索方法有网格搜索和随机搜索,而随机搜索能够避免低权重因子带来的计算资源浪费,因此采用随机搜索更好。(2)模型学习,通过贝叶斯优化器来对参数进行调优,而贝叶斯优化器的概率模型可以根据算法的特点选择高斯、树形和深度神经网络算法。(3)采样,在参数调优阶段对参数进行采样目标是为了更快的接近参数最优值,采样的方法根据需要优化的目标也可以选择概率提升、期望提升、交叉熵和GP-UCB等采样方法。(4)超参评估。系统还实现了算法早停策略,即算法间比较,多个算法在并行训练数轮后,比较各自最大的AUC指标。算法内比较,某算法的训练曲线已趋近平缓接近收敛,则说明算法已经没有太大上升空间。根据前两个比较综合判断,停掉此算法。
在本发明可选实施例中,可以将第一理财产品的客户样本输入到图7所示的自动机器学习系统中,自动训练出第一理财产品的客户推荐模型。
从以上实施例可以看出,本发明利用AutoML的技术的优势,降低了建模门槛,使金融业务人员在不具备扎实的算法基础时,能够凭借其业务经验优势和对业务数据的熟悉度建模,缩短了建模周期。同时利用迁移学习技术共享样本充足的成熟金融产品模型,解决新发行投资产品的数据稀疏性限制,使客户经理在最短时间内,以最简洁的方式获得新发行产品的推荐模型,并根据此模型的推荐客户清单,实现高效获客。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
基于同一发明构思,本发明实施例还提供了一种理财产品推荐装置,可以用于实现上述实施例所描述的理财产品推荐方法,如下面的实施例所述。由于理财产品推荐装置解决问题的原理与理财产品推荐方法相似,因此理财产品推荐装置的实施例可以参见理财产品推荐方法的实施例,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图9是本发明实施例理财产品推荐装置的结构框图,如图9所示,本发明实施例理财产品推荐装置包括:
特征空间获取单元1,用于获取第一理财产品的客户推荐模型的特征空间;
特征分类单元2,用于根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征;
特征空间生成单元3,用于根据所述共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征生成所述第二理财产品对应的特征空间;
样本合并单元4,用于基于所述第二理财产品对应的特征空间分别对所述第一理财产品的客户样本和所述第二理财产品的客户样本进行特征编码,得到合并后的客户样本;
模型训练单元5,用于根据所述合并后的客户样本、所述第二理财产品对应的特征空间以及预设的机器学习算法训练出所述第二理财产品的客户推荐模型,以根据所述第二理财产品的客户推荐模型确定所述第二理财产品对应的推荐客户。
在本发明一个实施例中,所述特征空间包含:连续型特征。所述特征分类单元2包括:
群体稳定性指标计算模块,用于根据各所述连续型特征分别在所述第一理财产品的客户样本上的取值和在第二理财产品的客户样本上的取值分别计算每个所述连续型特征各自对应的群体稳定性指标;
第一共同特征确定模块,用于根据所述群体稳定性指标确定所述第一理财产品与所述第二理财产品的共有的连续型特征。
在本发明一个实施例中,所述第一共同特征确定模块,具体用于将群体稳定性指标小于预设阈值的连续型特征确定为所述第一理财产品与所述第二理财产品的共有的连续型特征。
在本发明一个实施例中,所述特征空间包含:离散型特征。所述特征分类单元2包括:
第二共同特征确定模块,用于判断离散型特征在所述第一理财产品的客户样本上的取值与该离散型特征在第二理财产品的客户样本上的取值是否垂直隔离;若否,则判断该离散型特征为所述第一理财产品与所述第二理财产品的共有的离散型特征。
在本发明一个实施例中,本发明实施例理财产品推荐装置包括:
客户样本获取单元,用于获取所述第一理财产品的客户样本,其中,所述第一理财产品的客户样本包括正样本和负样本,所述正样本为在对客户进行营销后预设天数内购买所述第一理财产品的客户,所述负样本为在对客户进行营销后预设天数内未购买所述第一理财产品的客户;
自动训练单元,用于根据所述客户样本采用自动机器学习方法训练出所述第一理财产品的客户推荐模型。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图11所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述理财产品推荐方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种理财产品推荐方法,其特征在于,包括:
获取第一理财产品的客户推荐模型的特征空间;
根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征;
根据所述共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征生成所述第二理财产品对应的特征空间;
基于所述第二理财产品对应的特征空间分别对所述第一理财产品的客户样本和所述第二理财产品的客户样本进行特征编码,得到合并后的客户样本;
根据所述合并后的客户样本、所述第二理财产品对应的特征空间以及预设的机器学习算法训练出所述第二理财产品的客户推荐模型,以根据所述第二理财产品的客户推荐模型确定所述第二理财产品对应的推荐客户。
2.根据权利要求1所述的理财产品推荐方法,其特征在于,所述特征空间包含:连续型特征;
所述根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征,包括:
根据各所述连续型特征分别在所述第一理财产品的客户样本上的取值和在第二理财产品的客户样本上的取值分别计算每个所述连续型特征各自对应的群体稳定性指标;
根据所述群体稳定性指标确定所述第一理财产品与所述第二理财产品的共有的连续型特征。
3.根据权利要求1所述的理财产品推荐方法,其特征在于,所述特征空间包含:离散型特征;
所述根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征,包括:
判断离散型特征在所述第一理财产品的客户样本上的取值与该离散型特征在第二理财产品的客户样本上的取值是否垂直隔离;
若否,则判断该离散型特征为所述第一理财产品与所述第二理财产品的共有的离散型特征。
4.根据权利要求1所述的理财产品推荐方法,其特征在于,所述根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征,包括:
将所述特征空间中除去所述共有特征之外的其他特征分别作为所述第一理财产品的特有特征以及所述第二理财产品的特有特征。
5.根据权利要求2所述的理财产品推荐方法,其特征在于,所述根据所述群体稳定性指标确定所述第一理财产品与所述第二理财产品的共有的连续型特征,包括:
将群体稳定性指标小于预设阈值的连续型特征确定为所述第一理财产品与所述第二理财产品的共有的连续型特征。
6.根据权利要求1所述的理财产品推荐方法,其特征在于,所述基于所述第二理财产品对应的特征空间分别对所述第一理财产品的客户样本和所述第二理财产品的客户样本进行特征编码,包括:
仅对所述第一理财产品的客户样本和所述第二理财产品的客户样本中的特有特征进行特征编码。
7.根据权利要求1所述的理财产品推荐方法,其特征在于,还包括:
获取所述第一理财产品的客户样本,其中,所述第一理财产品的客户样本包括正样本和负样本,所述正样本为在对客户进行营销后预设天数内购买所述第一理财产品的客户,所述负样本为在对客户进行营销后预设天数内未购买所述第一理财产品的客户;
根据所述客户样本采用自动机器学习方法训练出所述第一理财产品的客户推荐模型。
8.根据权利要求1所述的理财产品推荐方法,其特征在于,所述第一理财产品为结构性存款理财产品,所述第二理财产品为低风险基金投资产品。
9.根据权利要求1所述的理财产品推荐方法,其特征在于,所述预设的机器学习算法包括:Xgboost算法或GLM算法。
10.一种理财产品推荐装置,其特征在于,包括:
特征空间获取单元,用于获取第一理财产品的客户推荐模型的特征空间;
特征分类单元,用于根据所述特征空间中的各特征分别在所述第一理财产品的客户样本上的取值以及在第二理财产品的客户样本上的取值,确定所述第一理财产品和所述第二理财产品的共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征;
特征空间生成单元,用于根据所述共有特征、所述第一理财产品的特有特征以及所述第二理财产品的特有特征生成所述第二理财产品对应的特征空间;
样本合并单元,用于基于所述第二理财产品对应的特征空间分别对所述第一理财产品的客户样本和所述第二理财产品的客户样本进行特征编码,得到合并后的客户样本;
模型训练单元,用于根据所述合并后的客户样本、所述第二理财产品对应的特征空间以及预设的机器学习算法训练出所述第二理财产品的客户推荐模型,以根据所述第二理财产品的客户推荐模型确定所述第二理财产品对应的推荐客户。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9任一项所述的方法。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序在计算机处理器中执行时实现如权利要求1至9任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010820402.1A CN111951050B (zh) | 2020-08-14 | 2020-08-14 | 理财产品推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010820402.1A CN111951050B (zh) | 2020-08-14 | 2020-08-14 | 理财产品推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111951050A CN111951050A (zh) | 2020-11-17 |
CN111951050B true CN111951050B (zh) | 2023-08-11 |
Family
ID=73343315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010820402.1A Active CN111951050B (zh) | 2020-08-14 | 2020-08-14 | 理财产品推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111951050B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634048B (zh) * | 2020-12-30 | 2023-06-13 | 第四范式(北京)技术有限公司 | 一种反洗钱模型的训练方法及装置 |
CN113436023A (zh) * | 2021-07-06 | 2021-09-24 | 中国银行股份有限公司 | 基于区块链的理财产品推荐方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107578332A (zh) * | 2017-09-22 | 2018-01-12 | 深圳乐信软件技术有限公司 | 一种推荐现金商品的方法、装置、设备及存储介质 |
CN110796512A (zh) * | 2019-09-20 | 2020-02-14 | 平安科技(深圳)有限公司 | 产品信息推荐方法及装置、存储介质、计算机设备 |
WO2020140400A1 (zh) * | 2019-01-04 | 2020-07-09 | 平安科技(深圳)有限公司 | 基于用户行为的产品推荐方法、装置、设备及存储介质 |
-
2020
- 2020-08-14 CN CN202010820402.1A patent/CN111951050B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107578332A (zh) * | 2017-09-22 | 2018-01-12 | 深圳乐信软件技术有限公司 | 一种推荐现金商品的方法、装置、设备及存储介质 |
WO2020140400A1 (zh) * | 2019-01-04 | 2020-07-09 | 平安科技(深圳)有限公司 | 基于用户行为的产品推荐方法、装置、设备及存储介质 |
CN110796512A (zh) * | 2019-09-20 | 2020-02-14 | 平安科技(深圳)有限公司 | 产品信息推荐方法及装置、存储介质、计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111951050A (zh) | 2020-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Du et al. | CUS-heterogeneous ensemble-based financial distress prediction for imbalanced dataset with ensemble feature selection | |
KR102009309B1 (ko) | 금융상품 관리자동화 시스템 및 관리자동화 방법 | |
CN107958317A (zh) | 一种众包项目中选取众包参与人的方法和装置 | |
CN108898476A (zh) | 一种贷款客户信用评分方法和装置 | |
CN112926699A (zh) | 异常对象识别方法、装置、设备及存储介质 | |
CN109859052A (zh) | 一种投资策略的智能推荐方法、装置、存储介质和服务器 | |
CN111951050B (zh) | 理财产品推荐方法及装置 | |
CN109636482B (zh) | 基于相似度模型的数据处理方法及系统 | |
CN109377347B (zh) | 基于特征选择的网络信用预警方法、系统及电子设备 | |
CN109615504A (zh) | 产品推荐方法、装置、电子设备和计算机可读存储介质 | |
CN113011895A (zh) | 关联账户样本筛选方法、装置和设备及计算机存储介质 | |
CN111882420A (zh) | 响应率的生成方法、营销方法、模型训练方法及装置 | |
CN113807469A (zh) | 一种多能源用户价值预测方法、装置、存储介质和设备 | |
CN115423578A (zh) | 基于微服务容器化云平台的招投标方法和系统 | |
CN110796539A (zh) | 一种征信评估方法及装置 | |
CN113220885B (zh) | 一种文本处理方法和系统 | |
CN113159796A (zh) | 一种贸易合同验证方法及装置 | |
CN116821759A (zh) | 类别标签的识别预测方法、装置和处理器及电子设备 | |
CN109636627B (zh) | 基于区块链的保险产品管理方法、装置、介质及电子设备 | |
CN115186898A (zh) | 一种银行开户量预测方法及装置 | |
CN114926204A (zh) | 基于数据价值的数据处理装置及其方法 | |
CN114626940A (zh) | 数据分析方法、装置及电子设备 | |
CN114612239A (zh) | 基于算法、大数据、人工智能的股票舆情监测和风控系统 | |
CN111932310A (zh) | 一种银行产品的潜在对公客户挖掘方法及装置 | |
CN114154682A (zh) | 一种客户贷款收益率等级预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |