CN115358878A - 理财用户风险偏好等级分析方法及装置 - Google Patents

理财用户风险偏好等级分析方法及装置 Download PDF

Info

Publication number
CN115358878A
CN115358878A CN202211040120.5A CN202211040120A CN115358878A CN 115358878 A CN115358878 A CN 115358878A CN 202211040120 A CN202211040120 A CN 202211040120A CN 115358878 A CN115358878 A CN 115358878A
Authority
CN
China
Prior art keywords
financial
users
user
financing
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211040120.5A
Other languages
English (en)
Inventor
南晓停
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202211040120.5A priority Critical patent/CN115358878A/zh
Publication of CN115358878A publication Critical patent/CN115358878A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种理财用户风险偏好等级分析方法及装置,涉及人工智能技术领域,其中该方法包括:获取理财用户的历史行为数据和用户属性数据;从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征;基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征;将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级。本发明能够精准输出理财用户风险偏好等级,降低理财用户的投资风险。

Description

理财用户风险偏好等级分析方法及装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种理财用户风险偏好等级分析方法及装置。需要说明的是,本发明理财用户风险偏好等级分析方法及装置可用于人工智能技术领域,也可用于除人工智能技术领域之外的任意领域,本发明理财用户风险偏好等级分析方法及装置的应用领域不做限定。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前,手机银行几乎覆盖了银行网点的所有功能,用户足不出户就可以实现理财、转账汇款、消费等功能。其中,在理财模块,手机银行会对用户进行资产诊断,判断理财用户的风险偏好等级,进而为用户理财提供优化建议。然而,现有的资产诊断方式基本采用问卷测评方式获取用户的相关信息,然后根据相关规则计算得到理财用户风险偏好等级,最后依靠人工定义的固定规则进行评分判断。一方面由于需要用户回答年收入、家庭资产净值、投资比例、债务信息、投资目的等问题,隐私信息的泄露以及繁琐的流程会造成用户体验不佳;另一方面人工定义的固定规则太过死板,不能针对理财用户灵活的分析其风险偏好等级,且理财用户行为不断发生变化,若评分判断更新不及时,系统容易误判理财用户的风险偏好等级。
发明内容
本发明实施例提供一种理财用户风险偏好等级分析方法,用以智能化、精准化的分析理财用户的风险偏好等级,降低理财用户的投资风险,改善用户体验,该方法包括:
获取理财用户的历史行为数据和用户属性数据;
从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征;
基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征;
将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级;其中,ResNet风险偏好网络模型根据历史理财用户的数据特征和类别特征、历史理财用户历史购买的理财产品特征,以及历史理财用户的风险偏好等级训练得到。
本发明实施例还提供一种理财用户风险偏好等级分析装置,用以智能化、精准化的分析理财用户的风险偏好等级,降低理财用户的投资风险,改善用户体验,该装置包括:
数据获取模块,用于获取理财用户的历史行为数据和用户属性数据;
第一数据处理模块,用于从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征;
第二数据处理模块,用于基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征;
风险偏好等级分析模块,用于将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级;其中,ResNet风险偏好网络模型根据历史理财用户的数据特征和类别特征、历史理财用户历史购买的理财产品特征,以及历史理财用户的风险偏好等级训练得到。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述理财用户风险偏好等级分析方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述理财用户风险偏好等级分析方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述理财用户风险偏好等级分析方法。
本发明实施例中,获取理财用户的历史行为数据和用户属性数据;从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征;基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征;将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级;其中,ResNet风险偏好网络模型根据历史理财用户的数据特征和类别特征、历史理财用户历史购买的理财产品特征,以及历史理财用户的风险偏好等级训练得到。本发明实施例基于理财用户的历史行为数据、用户属性数据和历史购买的理财产品特征,利用预先训练好的ResNet风险偏好网络模型对理财用户的风险偏好等级进行分析,能够精准、高效的输出理财用户的风险偏好等级,降低理财用户的投资风险,并免去了理财用户填写问卷的流程,改善了用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中理财用户风险偏好等级分析方法的流程示意图;
图2为本发明实施例中理财用户风险偏好等级分析方法的一具体实施例;
图3为本发明实施例中理财用户风险偏好等级分析方法的一具体实施例;
图4为本发明实施例中理财用户风险偏好等级分析方法的一具体实施例;
图5为本发明实施例中理财用户风险偏好等级分析装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
首先对本发明中涉及的专业技术名词进行解释。
Embedding嵌入:直译为“嵌入”,常译为“向量化”或“向量映射”,主要作用是将稀疏向量映射为稠密向量,也就是用低维稠密向量“表示”一个对象,这个对象可以是一个产品、一个词等,便于上层神经网络处理。
One-hot独热编码:分类变量作为二进制向量的表示,首先将分类变量映射到整数值;然后,每个整数值表示为二进制向量,除了整数的索引之外,其它都是零值,只有该索引位的值为1,如[0,0,0,0,1,0]向量。
Word2vec词向量:一种词向量嵌入技术,将词向量化。假定句子中每个词与其相邻的词关系最密切,通过大量语料的训练来定量地度量词和词之间的关系。
Item2vec序列向量:类似于Word2vec,对于用户购买“序列”中的一个商品,也存在相应的向量嵌入技术,即Embedding嵌入技术。相比于Word2vec利用“词序列”生成词Embedding,Item2vec利用的“物品序列”是由特定用户的浏览、购买等行为产生的历史行为记录序列。
发明人发现,现有的资产诊断方式基本采用问卷测评方式获取用户的相关信息,然后根据相关规则计算得到理财用户风险偏好等级,最后依靠人工定义的固定规则进行评分判断。一方面由于需要用户回答年收入、家庭资产净值、投资比例、债务信息、投资目的等问题,隐私信息的泄露以及繁琐的流程会造成用户体验不佳;另一方面人工定义的固定规则太过死板,不能针对理财用户灵活的分析其风险偏好等级,且理财用户行为不断发生变化,若评分判断更新不及时,系统容易误判理财用户的风险偏好等级。基于此,发明人提出了理财用户风险偏好等级分析方法。
图1为本发明实施例中理财用户风险偏好等级分析方法的流程示意图,如图1所示,该方法包括:
步骤101、获取理财用户的历史行为数据和用户属性数据;
步骤102、从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征;
步骤103、基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征;
步骤104、将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级;其中,ResNet风险偏好网络模型根据历史理财用户的数据特征和类别特征、历史理财用户历史购买的理财产品特征,以及历史理财用户的风险偏好等级训练得到。
从图1所示流程可以看出,本发明实施例中,获取理财用户的历史行为数据和用户属性数据;从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征;基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征;将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级;其中,ResNet风险偏好网络模型根据历史理财用户的数据特征和类别特征、历史理财用户历史购买的理财产品特征,以及历史理财用户的风险偏好等级训练得到。本发明实施例基于理财用户的历史行为数据、用户属性数据和历史购买的理财产品特征,利用预先训练好的ResNet风险偏好网络模型对理财用户的风险偏好等级进行分析,能够精准、高效的输出理财用户的风险偏好等级,降低理财用户的投资风险,并免去了理财用户填写问卷的流程,改善了用户体验。
下面对每个步骤进行详细解释。
在步骤101中,获取理财用户的历史行为数据和用户属性数据。
首先,采用爬虫方式或者根据手机银行收集的理财用户信息、购买记录等历史行为日志数据,获取用户的历史行为数据和用户属性数据。
需要说明的是,本发明实施例中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
在一个实施例中,理财用户的历史行为数据包括:理财用户的交易频率、流水记录、理财产品购买历史、手机银行理财模块功能点击历史等其中之一或任意组合;理财用户的用户属性数据包括:理财用户的性别、年龄、职业、学历、地区、婚姻、手机银行客户等级(如大众客户、理财客户、财富管理客户、私人银行客户)、存款金额、个人信贷信息(如个人借款信息、个人还款信息、个人欠款信息)、个人财产信息(如个人收入、不动产、纳税额、公积金缴存金额)等其中之一或任意组合。需要说明的是,理财用户的历史行为数据和用户属性数据不仅限于以上内容,本发明实施例在此不做限定,仅做示例。
在步骤102中,从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征。
实施例中,在获取到理财用户的历史行为数据和用户属性数据之后,挖掘理财用户的数值特征和类别特征。具体的,首先将所有的理财用户的历史行为数据和用户属性数据进行分类,得到理财用户的数值型数据和类别型数据;进而挖掘得到理财用户的数值特征和类别特征。
如表1所示,示例性的列举了部分理财用户的数值特征和类别特征。
表1
Figure BDA0003820635340000061
在一个实施例中,从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征,包括进行如下预处理其中之一或任意组合:
对数值特征进行归一化处理;
将数值特征中的连续性特征离散化;
将类别特征以独热向量表示;
对异常值进行剔除;
将缺失数据设置为历史理财用户的对应数据项的均值,或将缺失数据进行预测填充。
实施例中,数据预处理,主要包括数据转换、缺失值处理、异常值处理等。对于数值特征和类别特征这两类特征采用不同的转换方式。
对于数值特征,进行归一化处理,如采用min-max标准化处理:
Figure BDA0003820635340000062
式中x代表某种数值特征的具体值,min代表所有样本数据中该类特征的最小值,max代表所有样本数据中该类特征的最大值;将连续性数值特征进行离散化处理,如采用“分桶策略”,区间分段策略进行离散化处理。
对于类别特征,采用One-hot独热编码向量表示,如性别特征,[0,1]表示男,[1,0]表示女。
通过观察各特征数据的分布,对异常值进行剔除。
对于理财用户缺失的数据,相应位置的数值可以设置为所有理财用户或者相同属性理财用户中对应项的均值,也可以采用随机森林方式或者众数方式进行预测填充。
在步骤103中,基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征。
理财用户的历史购买理财产品行为对于反映理财用户风险偏好等级至关重要,例如,激进型理财用户大概率偏爱购买风险大但收益多的理财产品,本例中,将理财用户历史购买的理财产品数据序列送入Item2vec浅层网络模型,采用Softmax分类函数及负采样机制进行网络训练,最终使用中间的隐层向量表示理财用户历史购买的理财产品特征。
在一个实施例中,当理财用户历史购买的理财产品数据序列长度小于阈值时,利用规则属性进行相似用户和相似理财产品的聚合处理,得到相似用户历史购买的理财产品数据序列;
将相似用户历史购买的理财产品数据序列输入Item2vec浅层网络模型,将Item2vec浅层网络模型的输出值作为理财用户历史购买的理财产品特征。
实施时,当理财用户历史购买的理财产品数据序列长度小于阈值时,该阈值可以由开发者定义,例如0、1、2,由于实际应用中大量理财用户在过去有效时间内购买过的理财产品数量一般较少,对于新的理财用户,暂无历史购买记录,其理财用户历史购买的理财产品数据序列长度即为0。针对这类问题,本发明实施例中利用规则属性进行相似理财用户和相似理财产品的聚合处理,得到相似用户历史购买的理财产品数据序列,将相似用户历史购买的理财产品数据序列输入Item2vec浅层网络模型,即输入Item2vec浅层网络模型的是某类理财用户的历史购买的理财产品数据序列,而不是某个理财用户的历史购买的理财产品数据序列。
实施例,利用规则属性进行相似用户和相似理财产品的聚合处理,得到相似用户历史购买的理财产品数据序列,包括:利用规则属性对相似用户的各类用户属性和理财产品的各类产品属性进行聚合处理。实施例中,引入理财产品属性来代替理财产品ID;引入理财用户属性来代替理财用户ID,进而解决数据稀疏性问题,其中产品ID代表产品的标识,用户ID代表用户身份的标识。
在一个实施例中,相似用户的各类用户属性包括:职业、学历、客户等级分类、产品购买次数、购买总金额、投资时间等其中之一或任意组合;理财产品的各类产品属性包括:产品类型、年收益率、起购金额、产品期限、风险等级、单位净值、产品币种等其中之一或任意组合。
理财产品属性如表2所示,可以用理财产品属性信息和分桶ID表示组成一个理财产品属性标识。例如,某个理财产品类型标记type是混合类1,起购金额amount为10元,年收益率rate为3.2%,产品期限term为1年,中风险等级grade为高,单位净值为1.002%,产品币种为人民币,则可用type1_amount2_rate3_term1_grade3_netunint2_code1表示该产品的属性标识。
表2
Figure BDA0003820635340000081
同理,理财用户属性也可用此方法处理,理财用户属性包括职业、学历、客户等级分类、产品购买次数、购买总金额、投资时间等,不再详细阐述。
有了理财用户属性标识与理财产品属性标识,可采用聚类的方式生成新的理财用户历史购买的理财产品数据序列,直接用理财用户属性代表用户ID,生成一个由所有该理财用户属性构成的理财用户历史购买的理财产品数据序列,即相似用户历史购买的理财产品数据序列,以此来解决理财用户历史购买理财产品的数据稀疏问题。
实施例中,基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征,包括:将理财用户历史购买的理财产品数据序列进行独热编码后输入Item2vec浅层网络模型,输出理财用户历史购买的理财产品特征。
例如,将相似用户历史购买的理财产品数据序列One-hot编码后输入Item2vec浅层网络模型,采用Softmax分类函数及负采样机制进行网络训练,最终使用中间的隐层向量表示理财用户历史购买的理财产品特征。图2为本发明实施例中理财用户风险偏好等级分析方法的一具体实施例,图2示出了Item2vec浅层网络模型示意图,由输入层、全连接层、隐层和输出层构成,借鉴于Word2vec模型,将词序列替换成产品序列,同样通过序列间关系学习到每个产品的特征表示,Item2vec浅层网络模型去除了“时间窗口”概念,摒弃了序列之间的空间关系,考虑序列中两两之间的条件概率。如图2所示,V表示输入的One-hot编码向量的维度,N为中间隐层神经元的节点个数,为便于理解,进行举例说明,对于有1000个类型的理财产品,那么输入X(X=x1,x2,...xv,V=1000)为1000维度的One-hot编码向量,xi代表第i个理财产品数据序列One-hot编码,中间神经元个数设定为300,则V=1000,N=300;Item2vec浅层网络模型输入为单个产品向量,输出采用经典的SoftMax分类函数预测所有产品出现的概率,概率较大的即为与输入产品较为相关的产品,因此输出为1000维度的向量Y(Y=y1,y2,...yv,V=1000),每一维度对应每个产品可能出现的概率,且输入权重矩阵为W1000×300,中间隐层特征H(H=h1,h2,...hN,N=300)由H=XT×W得到,其中T表示将输入向量转置,输出权重矩阵为W3'00×1000,最终输出向量Y(Y=y1,y2,...yv,V=1000)。根据One-hot特性,输入矩阵W1000×300每一行即为“压缩”后的理财产品特征表示,可以看出每个产品的特征表示从1000维度降为300维度,改善了数据稀疏性问题。
需强调的是,利用相似用户和相似理财产品的聚合处理来获取相似用户历史购买的理财产品数据序列,是为了解决数据稀疏性问题。引入了理财产品的更多属性,是为了更好地学习到理财产品的Embedding特征;将相似用户历史购买的理财产品数据序列送入Item2vec浅层网络模型,是为了压缩特征维度,若直接将种类繁多的理财产品One-hot编码后的特征送入ResNet风险偏好网络模型,大量0的存在容易导致网络学习不佳。
在以上的内容中,获取并处理好理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,执行到步骤104,将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级;其中,ResNet风险偏好网络模型根据历史理财用户的数据特征和类别特征、历史理财用户历史购买的理财产品特征,以及历史理财用户的风险偏好等级训练得到。
在此之前,需要提前构建并训练好ResNet风险偏好网络模型,在一个实施例中,ResNet风险偏好网络模型按如下方法得到:
将历史理财用户的数据特征离散化后进行独热编码,得到编码后的数据特征;
将历史理财用户的类别特征进行独热编码,得到编码后的类别特征;
将历史理财用户历史购买的理财产品特征求均值,得到理财产品特征均值;
将编码后的数据特征、编码后的类别特征和理财产品特征均值进行特征拼接后,结合历史理财用户的风险偏好等级,训练ResNet风险偏好网络模型。
图3为本发明实施例中理财用户风险偏好等级分析方法的一具体实施例,如图3所示,为预先构建的ResNet风险偏好网络模型示意图,ResNet风险偏好网络模型是一种残差网络模型,其中,残差网络因应用于图像特征提取而得名,ResNet风险偏好网络模型利用全连接层代替卷积层来搭建,这样更适合处理用户属性数据、行为数据;通过短路连接,将网络每个残差模块的输出与输入进行逐元素相加,并采用relu激活函数增加网络的非线性,增强深度网络的学习能力。具体的,首先,将特征x,送入权重层(本例中即全连接层),得到第一个权重层的输出特征F(x),接着将其送入非线性激活Relu函数,增加非线性表达;接着,将之前的第一个权重层的输出继续送入第二个权重层(本例中即全连接层)进行学习;关键的是,将第二个权重层的输出F(x)与输入特征x叠加,再次经过Relu非线性激活函数处理;最后通过Softmax分类函数输出概率分布,概率最大值所在列对应的类为所属风险偏好等级。从图3中可以看出,ResNet风险偏好网络模型在网络旁路加入了直连通道,允许保留前面网络层一定比例的输出,这种操作简单而有效,没有给网络带来过多的参数量和计算量,同时加快了网络收敛的速度,有效解决了由于层数加深而造成的“退化”问题。
实施例中,在获取历史理财用户的数据特征、历史理财用户的类别特征和历史理财用户历史购买的理财产品特征后,经过预处理,结合历史理财用户的风险偏好等级,对ResNet风险偏好网络模型进行训练,在训练阶段,使用交叉熵损失函数来监督模型,反向传播误差来不断优化模型参数。
在一个实施例中,将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级,包括:
将理财用户的数据特征离散化后进行独热编码,得到编码后的数据特征;
将理财用户的类别特征进行独热编码,得到编码后的类别特征;
将理财用户历史购买的理财产品特征求均值,得到理财产品特征均值;
将编码后的数据特征、编码后的类别特征和理财产品特征均值进行特征拼接后,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级。
图4为本发明实施例中理财用户风险偏好等级分析方法的一具体实施例,如图4所示,具体实施时,将理财用户的数据特征离散化后进行独热编码,将理财用户的类别特征进行独热编码,将理财用户历史购买的理财产品特征经过相似理财用户和相似理财产品的聚合处理后送入Item2vec浅层网络模型提取中间隐层的Embedding特征并对该所有Embedding特征求均值,将编码后的数据特征、编码后的类别特征和理财产品特征均值进行特征拼接后,输入ResNet风险偏好网络模型,最终,Softmax分类函数输出理财用户的风险偏好等级,风险偏好等级可以为第一级、第二级、第三级,第一级的理财风险小于第二级,第二级的理财风险小于第三级;又如可以称为:谨慎型、稳健型、平衡性、进取型、激进型等理财风险越来越高的等级。本发明实施例中,利用Item2vec浅层网络模型和相似理财用户、相似理财产品提取理财用户历史购买的理财产品特征,将理财用户历史购买的理财产品特征和挖掘的理财用户的数据特征、类别特征处理后输入ResNet风险偏好网络模型,最终精准、高效的输出理财用户的风险偏好等级,降低了理财用户的投资风险,改善了用户体验,同时解决了高维度稀疏性数据特征导致网络模型表达力不足的问题。
在一个实施例中,分析得到理财用户的风险偏好等级之后,还包括:
在理财用户购买理财产品时,对理财产品的类型与理财用户的风险偏好等级进行匹配;在不匹配时进行安全提示。
例如,可以将理财用户的风险偏好等级在手机银行的对应理财功能界面进行展示;在用户购买理财产品时,对理财产品的类型与理财用户的风险偏好等级进行匹配,若不匹配,弹窗进行安全提示;若匹配,则跳过安全提示界面。
在一个实施例中,分析得到理财用户的风险偏好等级之后,还包括:
在检测到理财用户的历史行为数据和用户属性数据发生变动时,重新执行所述理财用户风险偏好等级分析方法,分析得到理财用户新的风险偏好等级。
例如,手机银行前端对理财用户属性数据、行为数据进行数据采集,当检测到理财用户属性数据、行为数据发生变动,则重新进行风险偏好等级分析,并将最新风险偏好等级展示在手机银行的对应理财功能界面。
本发明实施例中还提供了一种用户风险偏好等级分析装置,如下面的实施例所述。由于该装置解决问题的原理与用户风险偏好等级分析方法相似,因此该装置的实施可以参见用户风险偏好等级分析方法的实施,重复之处不再赘述。
图5为本发明实施例中理财用户风险偏好等级分析装置的示意图,如图5所示,该装置包括:
数据获取模块501,用于获取理财用户的历史行为数据和用户属性数据;
第一数据处理模块502,用于从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征;
第二数据处理模块503,用于基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征;
风险偏好等级分析模块504,用于将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级;其中,ResNet风险偏好网络模型根据历史理财用户的数据特征和类别特征、历史理财用户历史购买的理财产品特征,以及历史理财用户的风险偏好等级训练得到。
在一个实施例中,理财用户的历史行为数据包括:
理财用户的交易频率、流水记录、理财产品购买历史、手机银行理财模块功能点击历史其中之一或任意组合;
理财用户的用户属性数据包括:
理财用户的性别、年龄、职业、学历、地区、婚姻、手机银行客户等级、存款金额、个人信贷信息、个人财产信息其中之一或任意组合。
在一个实施例中,第一数据处理模块502,具体用于:
进行如下预处理其中之一或任意组合:
对数值特征进行归一化处理;
将数值特征中的连续性特征离散化;
将类别特征以独热向量表示;
对异常值进行剔除;
将缺失数据设置为历史理财用户的对应数据项的均值,或将缺失数据进行预测填充。
在一个实施例中,第二数据处理模块503,具体用于:
在理财用户历史购买的理财产品数据序列长度小于阈值时,利用规则属性进行相似用户和相似理财产品的聚合处理,得到相似用户历史购买的理财产品数据序列;
将相似用户历史购买的理财产品数据序列输入Item2vec浅层网络模型,将Item2vec浅层网络模型的输出值作为理财用户历史购买的理财产品特征。
在一个实施例中,第二数据处理模块503,具体用于:
利用规则属性对相似用户的各类用户属性和理财产品的各类产品属性进行聚合处理;其中,相似用户的各类用户属性包括:职业、学历、客户等级分类、产品购买次数、购买总金额、投资时间其中之一或任意组合;理财产品的各类产品属性包括:产品类型、年收益率、起购金额、产品期限、风险等级、单位净值、产品币种其中之一或任意组合。
在一个实施例中,第二数据处理模块503,具体用于:
将理财用户历史购买的理财产品数据序列进行独热编码后输入Item2vec浅层网络模型,输出理财用户历史购买的理财产品特征。
在一个实施例中,本发明实施例中用户风险偏好等级分析装置还包括:
第三数据处理模块,用于将历史理财用户的数据特征离散化后进行独热编码,得到编码后的数据特征;将历史理财用户的类别特征进行独热编码,得到编码后的类别特征;将历史理财用户历史购买的理财产品特征求均值,得到理财产品特征均值;
ResNet风险偏好网络模型训练模块,用于将编码后的数据特征、编码后的类别特征和理财产品特征均值进行特征拼接后,结合历史理财用户的风险偏好等级,训练ResNet风险偏好网络模型。
在一个实施例中,风险偏好等级分析模块504,具体用于:
将理财用户的数据特征离散化后进行独热编码,得到编码后的数据特征;
将理财用户的类别特征进行独热编码,得到编码后的类别特征;
将理财用户历史购买的理财产品特征求均值,得到理财产品特征均值;
将编码后的数据特征、编码后的类别特征和理财产品特征均值进行特征拼接后,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级。
在一个实施例中,本发明实施例中用户风险偏好等级分析装置还包括:
理财安全提示模块,用于在风险偏好等级分析模块504分析得到理财用户的风险偏好等级之后,在理财用户购买理财产品时,对理财产品的类型与理财用户的风险偏好等级进行匹配;在不匹配时进行安全提示。
在一个实施例中,本发明实施例中用户风险偏好等级分析装置还包括:
检测更新模块,用于在风险偏好等级分析模块504分析得到理财用户的风险偏好等级之后,在检测到理财用户的历史行为数据和用户属性数据发生变动时,重新触发所述理财用户风险偏好等级分析装置,分析得到理财用户新的风险偏好等级。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述用户风险偏好等级分析方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述用户风险偏好等级分析方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述用户风险偏好等级分析方法。
本发明实施例中,获取理财用户的历史行为数据和用户属性数据;从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征;基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征;将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级;其中,ResNet风险偏好网络模型根据历史理财用户的数据特征和类别特征、历史理财用户历史购买的理财产品特征,以及历史理财用户的风险偏好等级训练得到。本发明实施例基于理财用户的历史行为数据、用户属性数据和历史购买的理财产品特征,利用预先训练好的ResNet风险偏好网络模型对理财用户的风险偏好等级进行分析,能够精准、高效的输出理财用户的风险偏好等级,降低理财用户的投资风险,并免去了理财用户填写问卷的流程,改善了用户体验。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (23)

1.一种理财用户风险偏好等级分析方法,其特征在于,包括:
获取理财用户的历史行为数据和用户属性数据;
从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征;
基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征;
将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级;其中,ResNet风险偏好网络模型根据历史理财用户的数据特征和类别特征、历史理财用户历史购买的理财产品特征,以及历史理财用户的风险偏好等级训练得到。
2.如权利要求1所述的方法,其特征在于,理财用户的历史行为数据包括:
理财用户的交易频率、流水记录、理财产品购买历史、手机银行理财模块功能点击历史其中之一或任意组合;
理财用户的用户属性数据包括:
理财用户的性别、年龄、职业、学历、地区、婚姻、手机银行客户等级、存款金额、个人信贷信息、个人财产信息其中之一或任意组合。
3.如权利要求1所述的方法,其特征在于,从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征,包括进行如下预处理其中之一或任意组合:
对数值特征进行归一化处理;
将数值特征中的连续性特征离散化;
将类别特征以独热向量表示;
对异常值进行剔除;
将缺失数据设置为历史理财用户的对应数据项的均值,或将缺失数据进行预测填充。
4.如权利要求1所述的方法,其特征在于,基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征,包括:
在理财用户历史购买的理财产品数据序列长度小于阈值时,利用规则属性进行相似用户和相似理财产品的聚合处理,得到相似用户历史购买的理财产品数据序列;
将相似用户历史购买的理财产品数据序列输入Item2vec浅层网络模型,将Item2vec浅层网络模型的输出值作为理财用户历史购买的理财产品特征。
5.如权利要求4所述的方法,其特征在于,利用规则属性进行相似用户和相似理财产品的聚合处理,得到相似用户历史购买的理财产品数据序列,包括:
利用规则属性对相似用户的各类用户属性和理财产品的各类产品属性进行聚合处理;其中,相似用户的各类用户属性包括:职业、学历、客户等级分类、产品购买次数、购买总金额、投资时间其中之一或任意组合;理财产品的各类产品属性包括:产品类型、年收益率、起购金额、产品期限、风险等级、单位净值、产品币种其中之一或任意组合。
6.如权利要求1所述的方法,其特征在于,基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征,包括:
将理财用户历史购买的理财产品数据序列进行独热编码后输入Item2vec浅层网络模型,输出理财用户历史购买的理财产品特征。
7.如权利要求1所述的方法,其特征在于,将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型之前,还包括:
将历史理财用户的数据特征离散化后进行独热编码,得到编码后的数据特征;
将历史理财用户的类别特征进行独热编码,得到编码后的类别特征;
将历史理财用户历史购买的理财产品特征求均值,得到理财产品特征均值;
将编码后的数据特征、编码后的类别特征和理财产品特征均值进行特征拼接后,结合历史理财用户的风险偏好等级,训练ResNet风险偏好网络模型。
8.如权利要求1所述的方法,其特征在于,将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级,包括:
将理财用户的数据特征离散化后进行独热编码,得到编码后的数据特征;
将理财用户的类别特征进行独热编码,得到编码后的类别特征;
将理财用户历史购买的理财产品特征求均值,得到理财产品特征均值;
将编码后的数据特征、编码后的类别特征和理财产品特征均值进行特征拼接后,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级。
9.如权利要求1所述的方法,其特征在于,分析得到理财用户的风险偏好等级之后,还包括:
在理财用户购买理财产品时,对理财产品的类型与理财用户的风险偏好等级进行匹配;在不匹配时进行安全提示。
10.如权利要求1所述的方法,其特征在于,分析得到理财用户的风险偏好等级之后,还包括:
在检测到理财用户的历史行为数据和用户属性数据发生变动时,重新执行所述理财用户风险偏好等级分析方法,分析得到理财用户新的风险偏好等级。
11.一种理财用户风险偏好等级分析装置,其特征在于,包括:
数据获取模块,用于获取理财用户的历史行为数据和用户属性数据;
第一数据处理模块,用于从理财用户的历史行为数据和用户属性数据中,挖掘理财用户的数值特征和类别特征;
第二数据处理模块,用于基于Item2vec浅层网络模型,提取理财用户历史购买的理财产品特征;
风险偏好等级分析模块,用于将理财用户的数据特征和类别特征、理财用户历史购买的理财产品特征,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级;其中,ResNet风险偏好网络模型根据历史理财用户的数据特征和类别特征、历史理财用户历史购买的理财产品特征,以及历史理财用户的风险偏好等级训练得到。
12.如权利要求11所述的装置,其特征在于,理财用户的历史行为数据包括:
理财用户的交易频率、流水记录、理财产品购买历史、手机银行理财模块功能点击历史其中之一或任意组合;
理财用户的用户属性数据包括:
理财用户的性别、年龄、职业、学历、地区、婚姻、手机银行客户等级、存款金额、个人信贷信息、个人财产信息其中之一或任意组合。
13.如权利要求11所述的装置,其特征在于,第一数据处理模块,具体用于:
进行如下预处理其中之一或任意组合:
对数值特征进行归一化处理;
将数值特征中的连续性特征离散化;
将类别特征以独热向量表示;
对异常值进行剔除;
将缺失数据设置为历史理财用户的对应数据项的均值,或将缺失数据进行预测填充。
14.如权利要求11所述的装置,其特征在于,第二数据处理模块,具体用于:
在理财用户历史购买的理财产品数据序列长度小于阈值时,利用规则属性进行相似用户和相似理财产品的聚合处理,得到相似用户历史购买的理财产品数据序列;
将相似用户历史购买的理财产品数据序列输入Item2vec浅层网络模型,将Item2vec浅层网络模型的输出值作为理财用户历史购买的理财产品特征。
15.如权利要求14所述的装置,其特征在于,第二数据处理模块,具体用于:
利用规则属性对相似用户的各类用户属性和理财产品的各类产品属性进行聚合处理;其中,相似用户的各类用户属性包括:职业、学历、客户等级分类、产品购买次数、购买总金额、投资时间其中之一或任意组合;理财产品的各类产品属性包括:产品类型、年收益率、起购金额、产品期限、风险等级、单位净值、产品币种其中之一或任意组合。
16.如权利要求14所述的装置,其特征在于,第二数据处理模块,具体用于:
将理财用户历史购买的理财产品数据序列进行独热编码后输入Item2vec浅层网络模型,输出理财用户历史购买的理财产品特征。
17.如权利要求11所述的装置,其特征在于,还包括:
第三数据处理模块,用于将历史理财用户的数据特征离散化后进行独热编码,得到编码后的数据特征;将历史理财用户的类别特征进行独热编码,得到编码后的类别特征;将历史理财用户历史购买的理财产品特征求均值,得到理财产品特征均值;
ResNet风险偏好网络模型训练模块,用于将编码后的数据特征、编码后的类别特征和理财产品特征均值进行特征拼接后,结合历史理财用户的风险偏好等级,训练ResNet风险偏好网络模型。
18.如权利要求11所述的装置,风险偏好等级分析模块,具体用于:
将理财用户的数据特征离散化后进行独热编码,得到编码后的数据特征;
将理财用户的类别特征进行独热编码,得到编码后的类别特征;
将理财用户历史购买的理财产品特征求均值,得到理财产品特征均值;
将编码后的数据特征、编码后的类别特征和理财产品特征均值进行特征拼接后,输入ResNet风险偏好网络模型,分析得到理财用户的风险偏好等级。
19.如权利要求11所述的装置,其特征在于,还包括:
理财安全提示模块,用于在风险偏好等级分析模块分析得到理财用户的风险偏好等级之后,在理财用户购买理财产品时,对理财产品的类型与理财用户的风险偏好等级进行匹配;在不匹配时进行安全提示。
20.如权利要求11所述的装置,其特征在于,还包括:
检测更新模块,用于在风险偏好等级分析模块分析得到理财用户的风险偏好等级之后,在检测到理财用户的历史行为数据和用户属性数据发生变动时,重新触发所述理财用户风险偏好等级分析装置,分析得到理财用户新的风险偏好等级。
21.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10任一所述方法。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至10任一所述方法。
23.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至10任一所述方法。
CN202211040120.5A 2022-08-29 2022-08-29 理财用户风险偏好等级分析方法及装置 Pending CN115358878A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211040120.5A CN115358878A (zh) 2022-08-29 2022-08-29 理财用户风险偏好等级分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211040120.5A CN115358878A (zh) 2022-08-29 2022-08-29 理财用户风险偏好等级分析方法及装置

Publications (1)

Publication Number Publication Date
CN115358878A true CN115358878A (zh) 2022-11-18

Family

ID=84005024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211040120.5A Pending CN115358878A (zh) 2022-08-29 2022-08-29 理财用户风险偏好等级分析方法及装置

Country Status (1)

Country Link
CN (1) CN115358878A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117057809A (zh) * 2023-10-12 2023-11-14 四川钱坤云智能科技有限公司 一种用户行为分析方法、系统、电子设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117057809A (zh) * 2023-10-12 2023-11-14 四川钱坤云智能科技有限公司 一种用户行为分析方法、系统、电子设备及介质

Similar Documents

Publication Publication Date Title
CN109255506B (zh) 一种基于大数据的互联网金融用户贷款逾期预测方法
Ji et al. A stock price prediction method based on deep learning technology
Keramati et al. A proposed classification of data mining techniques in credit scoring
Chen Classifying credit ratings for Asian banks using integrating feature selection and the CPDA-based rough sets approach
CN106447066A (zh) 一种大数据的特征提取方法和装置
Chen et al. Predicting default risk on peer-to-peer lending imbalanced datasets
CN106611375A (zh) 一种基于文本分析的信用风险评估方法及装置
CN106445988A (zh) 一种大数据的智能处理方法和系统
Ala’raj et al. A deep learning model for behavioural credit scoring in banks
CN111882420A (zh) 响应率的生成方法、营销方法、模型训练方法及装置
Dbouk et al. Towards a machine learning approach for earnings manipulation detection
Sina Mirabdolbaghi et al. Model optimization analysis of customer churn prediction using machine learning algorithms with focus on feature reductions
CN116402512B (zh) 一种基于人工智能的账户安全排查管理方法
Fu et al. A sentiment-aware trading volume prediction model for P2P market using LSTM
CN110782349A (zh) 一种模型训练方法和系统
Gao et al. Research on default prediction for credit card users based on XGBoost‐LSTM model
CN114782161A (zh) 识别风险用户的方法、装置、存储介质及电子装置
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
Zhu et al. Explainable prediction of loan default based on machine learning models
CN115080868A (zh) 产品推送方法、装置、计算机设备、存储介质和程序产品
CN114997916A (zh) 潜在用户的预测方法、系统、电子设备和存储介质
CN115358878A (zh) 理财用户风险偏好等级分析方法及装置
CN112199480B (zh) 一种基于bert模型的在线对话日志违规检测方法及系统
CN115496571A (zh) 一种基于介科学的可解释性发票虚开检测方法
CN109635289A (zh) 词条分类方法及审计信息抽取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination