CN113656707A

CN113656707A - 一种理财产品推荐方法、系统、存储介质及设备

Info

Publication number: CN113656707A
Application number: CN202111027573.XA
Authority: CN
Inventors: 周劲; 赵海潇; 韩士元; 王琳; 杜韬; 纪科; 张坤; 赵亚欧
Original assignee: University of Jinan
Current assignee: University of Jinan
Priority date: 2021-09-02
Filing date: 2021-09-02
Publication date: 2021-11-16

Abstract

本发明属于理财产品推荐领域，提供了一种理财产品推荐方法、系统、存储介质及设备。其中，该方法包括获取理财用户数据；基于理财用户数据和训练完成的自编码神经网络模型，得到推荐理财产品类型；其中，自编码神经网络模型的训练过程为：采用理财用户数据预训练自编码神经网络模型；将理财用户数据及其若干个最近邻数据拼接构成训练数据；以预训练的自编码神经网络模型中的参数为初始值，利用训练数据继续训练自编码神经网络模型，直至到达最大迭代次数或者损失误差小于停止阈值。

Description

一种理财产品推荐方法、系统、存储介质及设备

技术领域

本发明属于理财产品推荐领域，尤其涉及一种理财产品推荐方法、系统、存储介质及设备。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

随着5G的快速发展，样本的数量和属性都出现激增，比如金融发展总和分析评估，包括用户基础信息、不同信用评级、工作年限、交易类型等，需要针对不同地区采取不同政策，使经济发展更加平衡。面对如此庞大的数据量和高属性，并且样本内部隐含的特征不再明显，传统聚类算法已很难再处理此类数据。而深度神经网络(DNNs)具有非线性转换的特点，可以提取到更为抽象的数据特征，进而有利于聚类过程，因此大量的基于神经网络的深度聚类算法被提出。包括基于自动编码器(AE)的方法、基于变分自编码器(VAE)的方法，基于生成对抗网(GAN)的方法。其中AE作为一种最重要的无监督表示学习模型，它提供了一种从数据层到表示层的非线性映射，保证了最小的重构误差。因此，近年来成为一个研究热点。

尽管深度神经网络能够提取到高属性样本的深度特征信息，对数据挖掘大有助益，但是目前大部分深度聚类算法仅仅关注目标用户的金融数据全局结构，并没有考虑目标用户的金融数据样本局部相似度的有效信息，这对于目标用户的金融边界数据点的聚类结果划分是不充分的；并且目标用户的金融数据样本之间的亲和度矩阵作为一个很重要的衡量近邻标准，初始化不够精准对于目标用户所属人群的聚类结果也会产生很大的影响，进而无法为用户推荐出准确的理财产品。

发明内容

为了解决上述背景技术中存在的技术问题，本发明提供一种理财产品推荐方法及系统，其能够为用户推荐出准确的理财产品。

为了实现上述目的，本发明采用如下技术方案：

本发明的第一个方面提供一种理财产品推荐方法，其包括：

获取理财用户数据；

基于理财用户数据和训练完成的自编码神经网络模型，得到推荐理财产品类型；

其中，自编码神经网络模型的训练过程为：

采用理财用户数据预训练自编码神经网络模型；

将理财用户数据及其若干个最近邻数据拼接构成训练数据；

以预训练的自编码神经网络模型中的参数为初始值，利用训练数据继续训练自编码神经网络模型，直至到达最大迭代次数或者损失误差小于停止阈值。

进一步地，采用理财用户数据预训练自编码神经网络模型的过程中，当到达预训练设定的最大迭代次数或重构误差小于预训练设定的停止阈值。

进一步地，利用训练数据继续训练自编码神经网络模型的过程中，使用随机梯度下降法更新自编码神经网络模型的参数和聚类中心。

进一步地，所述自编码神经网络模型的损失函数包括输入到输出的误差、隐层特征做模糊聚类损失、理财用户数据与其最近邻数据之间的图约束项以及亲和度矩阵的熵项，所述亲和度矩阵使用高斯映射处理训练数据而得到。

进一步地，利用训练数据继续训练自编码神经网络模型的过程中，使用拉格朗日乘子法更新亲和度矩阵。

进一步地，所述理财用户数据的属性包括学历、收入、年龄、职业和地域分布。

进一步地，使用KNN算法处理得到理财用户数据的若干个最近邻数据。

本发明的第二个方面提供一种理财产品推荐系统，其包括：

理财用户数据获取模块，其用于获取理财用户数据；

推荐理财产品推荐模块，其用于基于理财用户数据和训练完成的自编码神经网络模型，得到推荐理财产品类型；

其中，自编码神经网络模型的训练过程为：

采用理财用户数据预训练自编码神经网络模型；

将理财用户数据及其若干个最近邻数据拼接构成训练数据；

本发明的第三个方面提供一种计算机可读存储介质。

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述所述的理财产品推荐方法中的步骤。

本发明的第四个方面提供一种计算机设备。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述所述的理财产品推荐方法中的步骤。

与现有技术相比，本发明的有益效果是：

本发明提出的网络模型以及目标函数能够适应如今海量大数据聚类问题，尤其在金融行业信息分析、用户刻画的时候，能够充分利用用户金融信息的局部相似度与全局结构的有效信息提高聚类精度，更好的分析预测当前金融风险投资。另外，通过引入熵项自动调优约束项，进一步提高数据聚类的有效性，更智能化的为不同职业如个体户、私营企业主、学生、白领等用户推荐更适合的理财产品，如货币理财，权益类理财，保险理财，票据理财等。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1是本发明实施例的高维金融数据集示例图；

图2是本发明实施例的理财产品推荐方法流程图；

图3是本发明实施例的网络结构图及损失函数计算示意图；

图4是本发明实施例的理财产品推荐系统结构示意图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

实施例一

如图2所示，本实施例提供了一种理财产品推荐方法，其具体包括如下步骤：

S101：获取理财用户数据。

如图1所示，获取的理财用户数据Raw Data(RD)，其中，个数为N，数据属性为D，如学历、收入、年龄、职业、地域分布等。

S102：基于理财用户数据和训练完成的自编码神经网络模型，得到推荐理财产品类型；

其中，自编码神经网络模型的训练过程为：

采用理财用户数据预训练自编码神经网络模型；

将理财用户数据及其若干个最近邻数据拼接构成训练数据；

具体地，使用KNN算法处理理财用户数据RD，得到L个最近邻数据Neighbor Data(ND)后，与理财用户数据RD拼接构建成训练数据Training Data(TD)。

其中，自编码神经网络模型Auto-Encoder(AE)的构建过程为：

输入合适的batch尺寸，设置迭代次数epoch为2000，重构方法选择均方误差MSE来评估训练数据TD与重构结果之间差异程度，并设置停止阈值δ为10^-6。其中的重构方法为均方误差(MSE)。

在一个或多个实施例中，采用理财用户数据预训练自编码神经网络模型的过程中，当到达预训练设定的最大迭代次数或重构误差小于预训练设定的停止阈值。

例如：将理财用户数据RD输入到AE模型进行预训练，当到达最大迭代次数或者重构误差小于停止阈值δ时，结束训练并保存网络参数权重W和偏置b。

在一个或多个实施例中，利用训练数据继续训练自编码神经网络模型的过程中，使用随机梯度下降法更新自编码神经网络模型的参数和聚类中心。

用户选择初始化K个聚类中心C的方法，加载网络参数权重W、偏置b，将训练数据TD输入到AE模型进行训练，求解重构损失，聚类损失，图约束和亲和度熵项约束，使用随机梯度下降法更新神经网络参数权重W、偏置b和聚类中心C，使用拉格朗日乘子法更新亲和度矩阵S_ij；当到达最大迭代次数或者损失误差小于停止阈值δ时，结束训练并输出聚类精度。

聚类中心初始化方法为随机初始化、K-means初始化与模糊C均值初始化。

其中，亲和度矩阵S_ij在求解过程中，一般可选择的操作数据对象可以是原始样本，也可以是初始聚类中得到的隶属度。距离度量可以采用核函数模型、欧氏距离模型等。其中基于核函数的方式应用最普遍，公式如下：

其中，σ与t都是预先定义的数值，通常情况设置为1，

是属于样本x_i的近邻x_j的集合。一般情况下，为了计算方便和衡量准确，我们对S_ij进行归一化处理。

如图3所示，所述自编码神经网络模型的损失函数包括输入到输出的误差、隐层特征做模糊聚类损失、理财用户数据与其最近邻数据之间的图约束项以及亲和度矩阵的熵项，使用高斯映射处理训练数据TD，得到亲和度矩阵S_ij。

其中，利用训练数据继续训练自编码神经网络模型的过程中，使用拉格朗日乘子法更新亲和度矩阵。

自编码器模型的训练过程包括如下步骤：

自编码器模型(AE)加载预训练神经网络参数权重W、偏置b，输入原始数据RD，神经网络经过前向传播计算得到隐层嵌入特征z，利用k-means算法处理可得到初始化聚类中心C。

通过for循环使基于自适应邻域图嵌入的深度聚类模型数据聚类算法的迭代epoch次数自增一；

通过公式

和

计算神经网络隐层嵌入特征z与聚类中心C的相似度和归一化，然后通过公式

计算得到聚类层损失。其中，N是样本个数，K是聚类中心数。q_ij是采用student-T分布计算神经网络隐层嵌入特征z_i与聚类中心c_j得到，以此衡量两者的相似度；p_ij将q_ij指数提高到二次，对q_ij经过尖锐处理的分布。p_ij和q_ij构成的矩阵分别为P和Q。

固定属性对N个q_ij求和，使按每个簇的频率归一化来计算。

通过公式

计算理财用户数据RD与最近邻数据ND之间的图约束项。其中，N是样本个数，K是聚类中心数，L是邻居个数。

通过公式

计算亲和度矩阵熵项；

通过梯度下降法，对隐层嵌入特征和聚类中心求偏导，

其中L＝L_r+αL_c+βL_g，是算法整体损失函数，α与β分别是调节聚类项和图约束项权重的参数。聚类中心c的更新公式为：

其中M为batchsize，λ为学习率。

通过梯度下降法，更新编码器权重

解码器权重更新公式为

代表重构损失，其中X_i代表理财用户数据Raw Data(RD)中第i条数据，

代表X_i经过神经网络计算得到的输出值；

代表聚类损失；

其中

衡量神经网络隐层嵌入特征z_i与聚类中心c_j的相似度，

对q_ij进行尖锐处理便于聚类层计算；

代表图约束损失。

每一轮for循环结束后，采用公式

对整体P进行更新。样本标签通过q_ij获得，公式如下：l_i＝arg max q_ij；

每一轮for循环结束后，采用拉格朗日乘子法对于亲和度矩阵S_ij的更新。公式为

每一轮for循环结束后，通过公式

计算输出聚类精度，其中l_n为数据点真实类别标签，c_n为样本中心类别。

实施例二

如图4所示，本实施例提供了一种理财产品推荐系统，其具体包括如下模块：

理财用户数据获取模块，其用于获取理财用户数据；

其中，自编码神经网络模型的训练过程为：

采用理财用户数据预训练自编码神经网络模型；

将理财用户数据及其若干个最近邻数据拼接构成训练数据；

此处需要说明的是，本实施例的各个模块，与实施例一中的各个步骤一一对应，其具体实施过程相同，此处不再累述。

实施例三

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述实施例一所述的理财产品推荐方法中的步骤。

其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

实施例四

本实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述实施例一所述的理财产品推荐方法中的步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种理财产品推荐方法，其特征在于，包括：

获取理财用户数据；

其中，自编码神经网络模型的训练过程为：

采用理财用户数据预训练自编码神经网络模型；

将理财用户数据及其若干个最近邻数据拼接构成训练数据；

2.如权利要求1所述的理财产品推荐方法，其特征在于，采用理财用户数据预训练自编码神经网络模型的过程中，当到达预训练设定的最大迭代次数或重构误差小于预训练设定的停止阈值。

3.如权利要求1所述的理财产品推荐方法，其特征在于，利用训练数据继续训练自编码神经网络模型的过程中，使用随机梯度下降法更新自编码神经网络模型的参数和聚类中心。

4.如权利要求1所述的理财产品推荐方法，其特征在于，所述自编码神经网络模型的损失函数包括输入到输出的误差、隐层特征做模糊聚类损失、理财用户数据与其最近邻数据之间的图约束项以及亲和度矩阵的熵项，所述亲和度矩阵使用高斯映射处理训练数据而得到。

5.如权利要求4所述的理财产品推荐方法，其特征在于，利用训练数据继续训练自编码神经网络模型的过程中，使用拉格朗日乘子法更新亲和度矩阵。

6.如权利要求1所述的理财产品推荐方法，其特征在于，所述理财用户数据的属性包括学历、收入、年龄、职业和地域分布。

7.如权利要求1所述的理财产品推荐方法，其特征在于，使用KNN算法处理得到理财用户数据的若干个最近邻数据。

8.一种理财产品推荐系统，其特征在于，包括：

理财用户数据获取模块，其用于获取理财用户数据；

其中，自编码神经网络模型的训练过程为：

采用理财用户数据预训练自编码神经网络模型；

将理财用户数据及其若干个最近邻数据拼接构成训练数据；

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一项所述的理财产品推荐方法中的步骤。

10.一种计算机设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如权利要求1-7中任一项所述的理财产品推荐方法中的步骤。