CN113656707A - 一种理财产品推荐方法、系统、存储介质及设备 - Google Patents
一种理财产品推荐方法、系统、存储介质及设备 Download PDFInfo
- Publication number
- CN113656707A CN113656707A CN202111027573.XA CN202111027573A CN113656707A CN 113656707 A CN113656707 A CN 113656707A CN 202111027573 A CN202111027573 A CN 202111027573A CN 113656707 A CN113656707 A CN 113656707A
- Authority
- CN
- China
- Prior art keywords
- neural network
- training
- network model
- self
- financial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Abstract
本发明属于理财产品推荐领域,提供了一种理财产品推荐方法、系统、存储介质及设备。其中,该方法包括获取理财用户数据;基于理财用户数据和训练完成的自编码神经网络模型,得到推荐理财产品类型;其中,自编码神经网络模型的训练过程为:采用理财用户数据预训练自编码神经网络模型;将理财用户数据及其若干个最近邻数据拼接构成训练数据;以预训练的自编码神经网络模型中的参数为初始值,利用训练数据继续训练自编码神经网络模型,直至到达最大迭代次数或者损失误差小于停止阈值。
Description
技术领域
本发明属于理财产品推荐领域,尤其涉及一种理财产品推荐方法、系统、存储介质及设备。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
随着5G的快速发展,样本的数量和属性都出现激增,比如金融发展总和分析评估,包括用户基础信息、不同信用评级、工作年限、交易类型等,需要针对不同地区采取不同政策,使经济发展更加平衡。面对如此庞大的数据量和高属性,并且样本内部隐含的特征不再明显,传统聚类算法已很难再处理此类数据。而深度神经网络(DNNs)具有非线性转换的特点,可以提取到更为抽象的数据特征,进而有利于聚类过程,因此大量的基于神经网络的深度聚类算法被提出。包括基于自动编码器(AE)的方法、基于变分自编码器(VAE)的方法,基于生成对抗网(GAN)的方法。其中AE作为一种最重要的无监督表示学习模型,它提供了一种从数据层到表示层的非线性映射,保证了最小的重构误差。因此,近年来成为一个研究热点。
尽管深度神经网络能够提取到高属性样本的深度特征信息,对数据挖掘大有助益,但是目前大部分深度聚类算法仅仅关注目标用户的金融数据全局结构,并没有考虑目标用户的金融数据样本局部相似度的有效信息,这对于目标用户的金融边界数据点的聚类结果划分是不充分的;并且目标用户的金融数据样本之间的亲和度矩阵作为一个很重要的衡量近邻标准,初始化不够精准对于目标用户所属人群的聚类结果也会产生很大的影响,进而无法为用户推荐出准确的理财产品。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种理财产品推荐方法及系统,其能够为用户推荐出准确的理财产品。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种理财产品推荐方法,其包括:
获取理财用户数据;
基于理财用户数据和训练完成的自编码神经网络模型,得到推荐理财产品类型;
其中,自编码神经网络模型的训练过程为:
采用理财用户数据预训练自编码神经网络模型;
将理财用户数据及其若干个最近邻数据拼接构成训练数据;
以预训练的自编码神经网络模型中的参数为初始值,利用训练数据继续训练自编码神经网络模型,直至到达最大迭代次数或者损失误差小于停止阈值。
进一步地,采用理财用户数据预训练自编码神经网络模型的过程中,当到达预训练设定的最大迭代次数或重构误差小于预训练设定的停止阈值。
进一步地,利用训练数据继续训练自编码神经网络模型的过程中,使用随机梯度下降法更新自编码神经网络模型的参数和聚类中心。
进一步地,所述自编码神经网络模型的损失函数包括输入到输出的误差、隐层特征做模糊聚类损失、理财用户数据与其最近邻数据之间的图约束项以及亲和度矩阵的熵项,所述亲和度矩阵使用高斯映射处理训练数据而得到。
进一步地,利用训练数据继续训练自编码神经网络模型的过程中,使用拉格朗日乘子法更新亲和度矩阵。
进一步地,所述理财用户数据的属性包括学历、收入、年龄、职业和地域分布。
进一步地,使用KNN算法处理得到理财用户数据的若干个最近邻数据。
本发明的第二个方面提供一种理财产品推荐系统,其包括:
理财用户数据获取模块,其用于获取理财用户数据;
推荐理财产品推荐模块,其用于基于理财用户数据和训练完成的自编码神经网络模型,得到推荐理财产品类型;
其中,自编码神经网络模型的训练过程为:
采用理财用户数据预训练自编码神经网络模型;
将理财用户数据及其若干个最近邻数据拼接构成训练数据;
以预训练的自编码神经网络模型中的参数为初始值,利用训练数据继续训练自编码神经网络模型,直至到达最大迭代次数或者损失误差小于停止阈值。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的理财产品推荐方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的理财产品推荐方法中的步骤。
与现有技术相比,本发明的有益效果是:
本发明提出的网络模型以及目标函数能够适应如今海量大数据聚类问题,尤其在金融行业信息分析、用户刻画的时候,能够充分利用用户金融信息的局部相似度与全局结构的有效信息提高聚类精度,更好的分析预测当前金融风险投资。另外,通过引入熵项自动调优约束项,进一步提高数据聚类的有效性,更智能化的为不同职业如个体户、私营企业主、学生、白领等用户推荐更适合的理财产品,如货币理财,权益类理财,保险理财,票据理财等。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例的高维金融数据集示例图;
图2是本发明实施例的理财产品推荐方法流程图;
图3是本发明实施例的网络结构图及损失函数计算示意图;
图4是本发明实施例的理财产品推荐系统结构示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
如图2所示,本实施例提供了一种理财产品推荐方法,其具体包括如下步骤:
S101:获取理财用户数据。
如图1所示,获取的理财用户数据Raw Data(RD),其中,个数为N,数据属性为D,如学历、收入、年龄、职业、地域分布等。
S102:基于理财用户数据和训练完成的自编码神经网络模型,得到推荐理财产品类型;
其中,自编码神经网络模型的训练过程为:
采用理财用户数据预训练自编码神经网络模型;
将理财用户数据及其若干个最近邻数据拼接构成训练数据;
以预训练的自编码神经网络模型中的参数为初始值,利用训练数据继续训练自编码神经网络模型,直至到达最大迭代次数或者损失误差小于停止阈值。
具体地,使用KNN算法处理理财用户数据RD,得到L个最近邻数据Neighbor Data(ND)后,与理财用户数据RD拼接构建成训练数据Training Data(TD)。
其中,自编码神经网络模型Auto-Encoder(AE)的构建过程为:
输入合适的batch尺寸,设置迭代次数epoch为2000,重构方法选择均方误差MSE来评估训练数据TD与重构结果之间差异程度,并设置停止阈值δ为10-6。其中的重构方法为均方误差(MSE)。
在一个或多个实施例中,采用理财用户数据预训练自编码神经网络模型的过程中,当到达预训练设定的最大迭代次数或重构误差小于预训练设定的停止阈值。
例如:将理财用户数据RD输入到AE模型进行预训练,当到达最大迭代次数或者重构误差小于停止阈值δ时,结束训练并保存网络参数权重W和偏置b。
在一个或多个实施例中,利用训练数据继续训练自编码神经网络模型的过程中,使用随机梯度下降法更新自编码神经网络模型的参数和聚类中心。
用户选择初始化K个聚类中心C的方法,加载网络参数权重W、偏置b,将训练数据TD输入到AE模型进行训练,求解重构损失,聚类损失,图约束和亲和度熵项约束,使用随机梯度下降法更新神经网络参数权重W、偏置b和聚类中心C,使用拉格朗日乘子法更新亲和度矩阵Sij;当到达最大迭代次数或者损失误差小于停止阈值δ时,结束训练并输出聚类精度。
聚类中心初始化方法为随机初始化、K-means初始化与模糊C均值初始化。
其中,亲和度矩阵Sij在求解过程中,一般可选择的操作数据对象可以是原始样本,也可以是初始聚类中得到的隶属度。距离度量可以采用核函数模型、欧氏距离模型等。其中基于核函数的方式应用最普遍,公式如下:
如图3所示,所述自编码神经网络模型的损失函数包括输入到输出的误差、隐层特征做模糊聚类损失、理财用户数据与其最近邻数据之间的图约束项以及亲和度矩阵的熵项,使用高斯映射处理训练数据TD,得到亲和度矩阵Sij。
其中,利用训练数据继续训练自编码神经网络模型的过程中,使用拉格朗日乘子法更新亲和度矩阵。
自编码器模型的训练过程包括如下步骤:
自编码器模型(AE)加载预训练神经网络参数权重W、偏置b,输入原始数据RD,神经网络经过前向传播计算得到隐层嵌入特征z,利用k-means算法处理可得到初始化聚类中心C。
通过for循环使基于自适应邻域图嵌入的深度聚类模型数据聚类算法的迭代epoch次数自增一;
通过公式和计算神经网络隐层嵌入特征z与聚类中心C的相似度和归一化,然后通过公式计算得到聚类层损失。其中,N是样本个数,K是聚类中心数。qij是采用student-T分布计算神经网络隐层嵌入特征zi与聚类中心cj得到,以此衡量两者的相似度;pij将qij指数提高到二次,对qij经过尖锐处理的分布。pij和qij构成的矩阵分别为P和Q。固定属性对N个qij求和,使按每个簇的频率归一化来计算。
通过梯度下降法,对隐层嵌入特征和聚类中心求偏导,
实施例二
如图4所示,本实施例提供了一种理财产品推荐系统,其具体包括如下模块:
理财用户数据获取模块,其用于获取理财用户数据;
推荐理财产品推荐模块,其用于基于理财用户数据和训练完成的自编码神经网络模型,得到推荐理财产品类型;
其中,自编码神经网络模型的训练过程为:
采用理财用户数据预训练自编码神经网络模型;
将理财用户数据及其若干个最近邻数据拼接构成训练数据;
以预训练的自编码神经网络模型中的参数为初始值,利用训练数据继续训练自编码神经网络模型,直至到达最大迭代次数或者损失误差小于停止阈值。
此处需要说明的是,本实施例的各个模块,与实施例一中的各个步骤一一对应,其具体实施过程相同,此处不再累述。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一所述的理财产品推荐方法中的步骤。
其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例一所述的理财产品推荐方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种理财产品推荐方法,其特征在于,包括:
获取理财用户数据;
基于理财用户数据和训练完成的自编码神经网络模型,得到推荐理财产品类型;
其中,自编码神经网络模型的训练过程为:
采用理财用户数据预训练自编码神经网络模型;
将理财用户数据及其若干个最近邻数据拼接构成训练数据;
以预训练的自编码神经网络模型中的参数为初始值,利用训练数据继续训练自编码神经网络模型,直至到达最大迭代次数或者损失误差小于停止阈值。
2.如权利要求1所述的理财产品推荐方法,其特征在于,采用理财用户数据预训练自编码神经网络模型的过程中,当到达预训练设定的最大迭代次数或重构误差小于预训练设定的停止阈值。
3.如权利要求1所述的理财产品推荐方法,其特征在于,利用训练数据继续训练自编码神经网络模型的过程中,使用随机梯度下降法更新自编码神经网络模型的参数和聚类中心。
4.如权利要求1所述的理财产品推荐方法,其特征在于,所述自编码神经网络模型的损失函数包括输入到输出的误差、隐层特征做模糊聚类损失、理财用户数据与其最近邻数据之间的图约束项以及亲和度矩阵的熵项,所述亲和度矩阵使用高斯映射处理训练数据而得到。
5.如权利要求4所述的理财产品推荐方法,其特征在于,利用训练数据继续训练自编码神经网络模型的过程中,使用拉格朗日乘子法更新亲和度矩阵。
6.如权利要求1所述的理财产品推荐方法,其特征在于,所述理财用户数据的属性包括学历、收入、年龄、职业和地域分布。
7.如权利要求1所述的理财产品推荐方法,其特征在于,使用KNN算法处理得到理财用户数据的若干个最近邻数据。
8.一种理财产品推荐系统,其特征在于,包括:
理财用户数据获取模块,其用于获取理财用户数据;
推荐理财产品推荐模块,其用于基于理财用户数据和训练完成的自编码神经网络模型,得到推荐理财产品类型;
其中,自编码神经网络模型的训练过程为:
采用理财用户数据预训练自编码神经网络模型;
将理财用户数据及其若干个最近邻数据拼接构成训练数据;
以预训练的自编码神经网络模型中的参数为初始值,利用训练数据继续训练自编码神经网络模型,直至到达最大迭代次数或者损失误差小于停止阈值。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的理财产品推荐方法中的步骤。
10.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的理财产品推荐方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111027573.XA CN113656707A (zh) | 2021-09-02 | 2021-09-02 | 一种理财产品推荐方法、系统、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111027573.XA CN113656707A (zh) | 2021-09-02 | 2021-09-02 | 一种理财产品推荐方法、系统、存储介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113656707A true CN113656707A (zh) | 2021-11-16 |
Family
ID=78493492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111027573.XA Pending CN113656707A (zh) | 2021-09-02 | 2021-09-02 | 一种理财产品推荐方法、系统、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113656707A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114297511A (zh) * | 2022-01-27 | 2022-04-08 | 中国农业银行股份有限公司 | 理财推荐方法、装置、系统和存储介质 |
-
2021
- 2021-09-02 CN CN202111027573.XA patent/CN113656707A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114297511A (zh) * | 2022-01-27 | 2022-04-08 | 中国农业银行股份有限公司 | 理财推荐方法、装置、系统和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11693388B2 (en) | Methods and apparatus for machine learning predictions of manufacturing processes | |
Benchaji et al. | Using genetic algorithm to improve classification of imbalanced datasets for credit card fraud detection | |
Joy et al. | Batch Bayesian optimization using multi-scale search | |
CN107230108A (zh) | 业务数据的处理方法及装置 | |
CN113298230B (zh) | 一种基于生成对抗网络的不平衡数据集的预测方法 | |
Mehmanpazir et al. | Development of an evolutionary fuzzy expert system for estimating future behavior of stock price | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
Antonelli et al. | Multi-objective evolutionary learning of granularity, membership function parameters and rules of Mamdani fuzzy systems | |
CN113656707A (zh) | 一种理财产品推荐方法、系统、存储介质及设备 | |
Rofik et al. | The Optimization of Credit Scoring Model Using Stacking Ensemble Learning and Oversampling Techniques | |
Shi et al. | Optimization and data mining for fracture prediction in geosciences | |
Santos et al. | An artificial intelligence method for improving upscaling in complex reservoirs | |
CN116993548A (zh) | 基于增量学习的LightGBM-SVM的教育培训机构信用评估方法及系统 | |
US11468352B2 (en) | Method and system for predictive modeling of geographic income distribution | |
Lim et al. | More powerful selective kernel tests for feature selection | |
CN110837853A (zh) | 一种快速分类模型构建方法 | |
CN116542701A (zh) | 一种基于cnn-lstm组合模型的碳价预测方法及系统 | |
CN115936773A (zh) | 一种互联网金融黑产识别方法与系统 | |
Ling et al. | Financial crisis prediction based on long-term and short-term memory neural network | |
He et al. | GA-based optimization of generative adversarial networks on stock price prediction | |
CN114529063A (zh) | 一种基于机器学习的金融领域数据预测方法、设备及介质 | |
CN112884028A (zh) | 一种系统资源调整方法、装置及设备 | |
Airan et al. | Linear machine: A novel approach to point location problem | |
Chen | Brain Tumor Prediction with LSTM Method | |
CN116862078B (zh) | 一种换电套餐用户逾期的预测方法、系统、装置及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |