CN116975679A - 金融系统用户识别模型训练及提供识别结果的方法、装置 - Google Patents
金融系统用户识别模型训练及提供识别结果的方法、装置 Download PDFInfo
- Publication number
- CN116975679A CN116975679A CN202310611705.6A CN202310611705A CN116975679A CN 116975679 A CN116975679 A CN 116975679A CN 202310611705 A CN202310611705 A CN 202310611705A CN 116975679 A CN116975679 A CN 116975679A
- Authority
- CN
- China
- Prior art keywords
- user
- feature
- cross
- behavior data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000012549 training Methods 0.000 title claims abstract description 46
- 239000011159 matrix material Substances 0.000 claims abstract description 188
- 238000013528 artificial neural network Methods 0.000 claims abstract description 43
- 230000007246 mechanism Effects 0.000 claims abstract description 31
- 230000006399 behavior Effects 0.000 claims description 195
- 239000013598 vector Substances 0.000 claims description 189
- 238000012545 processing Methods 0.000 claims description 88
- 230000003993 interaction Effects 0.000 claims description 44
- 238000004590 computer program Methods 0.000 claims description 31
- 238000013475 authorization Methods 0.000 claims description 18
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000012512 characterization method Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种金融系统用户识别模型训练方法、设备、介质和产品,涉及人工智能技术及金融科技领域。该方法包括:获取金融系统的用户行为数据样本和用户标签样本值;构建用户连续特征矩阵和用户类别特征矩阵,并分别输入基于深度神经网络的特征交叉模型和基于域矩阵因子分解机的特征交叉模型,获得第一交叉特征和第二交叉特征;将两者输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;将第三交叉特征输入待训练的用户识别模型,获取用户标签预测值;根据用户标签样本值和用户标签预测值,确定模型损失,调整待训练的用户识别模型的模型参数,直至模型损失满足预设条件。采用本方法能够获得具有更高精度和准确率的识别模型。
Description
技术领域
本申请涉及人工智能技术及金融科技领域,特别是涉及一种金融系统的用户识别模型训练方法、提供用户识别结果方法、计算机设备、存储介质和计算机程序产品。
背景技术
随着信息技术的发展,越来越多金融机构开始通过交互式的金融系统向用户提供服务。而为了提高用户的服务体验,通常会在得到用户授权的情况下根据用户提供的信息对用户进行识别,并得到对应的用户标签,再根据该标签为用户提供个性化的需求服务。
然而,目前金融系统对用户授权信息的分析过程通常采用基于机器学习算法构建简单的线性预测模型对用户进行识别,其一方面忽略了不同类型的用户信息之间复杂的交互关系,另一方面未对不同性质的用户信息进行针对性处理,导致预测模型对用户识别的准确率较低,难以有效提高用户的金融服务体验。
发明内容
基于此,有必要针对上述技术问题,提供一种金融系统用户识别模型训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种金融系统用户识别模型训练方法。方法包括:
获取金融系统的用户行为数据样本和用户行为数据样本对应的用户标签样本值;
基于用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵;
将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
将第三交叉特征输入待训练的用户识别模型,获取待训练的用户识别模型输出的用户标签预测值;
根据用户标签样本值和用户标签预测值,确定模型损失;
根据模型损失,调整待训练的用户识别模型的模型参数,直至模型损失满足预设条件时得到经训练的用户识别模型。
在其中一个实施例中,深度神经网络包括多个处理层;基于深度神经网络的特征交叉模型,用于将输入的用户连续特征矩阵转换为对应的向量并传输至深度神经网络的首个处理层,由首个处理层为输入的向量生成中间处理向量并传输至下一处理层,由各非首个处理层根据接收的中间处理向量生成新的中间处理向量并传递至下一处理层,直至由最后一个处理层生成中间处理向量作为第一交叉特征,
在其中一个实施例中,用户类别特征矩阵包括多个用户类别特征向量;基于域矩阵因子分解机的特征交叉模型,用于根据用户类别特征矩阵获取每个用户类别特征向量对应的用户类别特征域,根据用户类别特征域获取每两个用户类别特征域对应的域交互矩阵,根据用户类别特征矩阵和域交互矩阵获取每两个用户类别特征向量的交叉表征,根据多个交叉表征,获得第二交叉特征。
在其中一个实施例中,基于多层自注意力机制的特征交叉模型包括多层自注意力模块;其中,自注意力模块基于输入的向量生成交互关系向量和值权重向量,根据交互关系向量和值权重向量获得注意力交叉特征向量;基于多层自注意力机制的特征交叉模型,用于将第一交叉特征和第二交叉特征转化为对应的向量并输入首层自注意力模块,由首层自注意力模块获得注意力交叉特征向量并将该注意力交叉特征向量传输至下一层自注意力模块,继续由后续每层自注意力模块根据接收的注意力交叉特征向量生成新的注意力交叉特征向量,直至由最后一个自注意力模块生成的注意力交叉特征向量作为第三交叉特征。
在其中一个实施例中,基于用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵,包括:根据用户行为数据样本,提取多个子行为数据;根据多个子行为数据,获取衍生子行为数据;识别子行为数据和衍生子行为数据中的连续行为数据和类别行为数据,形成连续行为数据集和类别行为数据集;根据连续行为数据集构建用户连续特征矩阵,及根据类别行为数据集,构建用户类别特征矩阵。
在其中一个实施例中,根据类别行为数据集,构建用户类别特征矩阵,包括:对类别行为数据集中的类别行为数据进行词嵌入处理,形成用户类别特征向量;根据类别行为数据集对应的类别行为特征向量,构建用户类别特征矩阵。
第二方面,本申请还提供了一种金融系统中提供用户识别结果的方法。方法包括:
获得用户授权分析的用户行为数据后,根据用户行为数据,构建用户连续特征矩阵和用户类别特征矩阵;
将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
将第三交叉特征输入经训练的用户识别模型,获取经训练的用户识别模型输出的用户标签预测值;
根据用户标签预测值,得到用户的用户识别结果;
在用户进入的金融系统的页面中展示用户识别结果;
其中,经训练的用户识别模型根据上述中任一项的金融系统用户识别模型训练方法训练得到。
第三方面,本申请还提供了一种金融系统用户识别模型训练装置。装置包括:
获取模块,用于获取金融系统的用户行为数据样本和用户行为数据样本对应的用户标签样本值;
构建模块,用于基于用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵;
第一交叉模块,用于将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
第二交叉模块,用于将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
第三交叉模块,用于将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
预测模块,用于将第三交叉特征输入待训练的用户识别模型,获取待训练的用户识别模型输出的用户标签预测值;
损失确定模块,用于根据用户标签样本值和用户标签预测值,确定模型损失;
调整模块,用于根据模型损失,调整待训练的用户识别模型的模型参数,直至模型损失满足预设条件时得到经训练的用户识别模型。
第四方面,本申请还提供了一种金融系统中提供用户识别结果的装置。装置包括:
构建模块,用于获得用户授权分析的用户行为数据后,根据用户行为数据,构建用户连续特征矩阵和用户类别特征矩阵;
第一交叉模块,用于将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
第二交叉模块,用于将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
第三交叉模块,用于将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
预测模块,用于将第三交叉特征输入经训练的用户识别模型,获取经训练的用户识别模型输出的用户标签预测值;
识别模块,用于根据用户标签预测值,得到用户的用户识别结果;
展示模块,用于在用户进入的金融系统的页面中展示用户识别结果;
其中,经训练的用户识别模型根据上述中任一项的金融系统用户识别模型训练方法训练得到。
第五方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取金融系统的用户行为数据样本和用户行为数据样本对应的用户标签样本值;
基于用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵;
将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
将第三交叉特征输入待训练的用户识别模型,获取待训练的用户识别模型输出的用户标签预测值;
根据用户标签样本值和用户标签预测值,确定模型损失;
根据模型损失,调整待训练的用户识别模型的模型参数,直至模型损失满足预设条件时得到经训练的用户识别模型。
第六方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获得用户授权分析的用户行为数据后,根据用户行为数据,构建用户连续特征矩阵和用户类别特征矩阵;
将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
将第三交叉特征输入经训练的用户识别模型,获取经训练的用户识别模型输出的用户标签预测值;
根据用户标签预测值,得到用户的用户识别结果;
在用户进入的金融系统的页面中展示用户识别结果;
其中,经训练的用户识别模型根据上述中任一项的金融系统用户识别模型训练方法训练得到。
第七方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取金融系统的用户行为数据样本和用户行为数据样本对应的用户标签样本值;
基于用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵;
将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
将第三交叉特征输入待训练的用户识别模型,获取待训练的用户识别模型输出的用户标签预测值;
根据用户标签样本值和用户标签预测值,确定模型损失;
根据模型损失,调整待训练的用户识别模型的模型参数,直至模型损失满足预设条件时得到经训练的用户识别模型。
第八方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获得用户授权分析的用户行为数据后,根据用户行为数据,构建用户连续特征矩阵和用户类别特征矩阵;
将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
将第三交叉特征输入经训练的用户识别模型,获取经训练的用户识别模型输出的用户标签预测值;
根据用户标签预测值,得到用户的用户识别结果;
在用户进入的金融系统的页面中展示用户识别结果;
其中,经训练的用户识别模型根据上述中任一项的金融系统用户识别模型训练方法训练得到。
第九方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取金融系统的用户行为数据样本和用户行为数据样本对应的用户标签样本值;
基于用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵;
将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
将第三交叉特征输入待训练的用户识别模型,获取待训练的用户识别模型输出的用户标签预测值;
根据用户标签样本值和用户标签预测值,确定模型损失;
根据模型损失,调整待训练的用户识别模型的模型参数,直至模型损失满足预设条件时得到经训练的用户识别模型。
第十方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获得用户授权分析的用户行为数据后,根据用户行为数据,构建用户连续特征矩阵和用户类别特征矩阵;
将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
将第三交叉特征输入经训练的用户识别模型,获取经训练的用户识别模型输出的用户标签预测值;
根据用户标签预测值,得到用户的用户识别结果;
在用户进入的金融系统的页面中展示用户识别结果;
其中,经训练的用户识别模型根据上述中任一项的金融系统用户识别模型训练方法训练得到。
上述金融系统用户识别模型训练方法、装置、计算机设备、存储介质和计算机程序产品,能够基于用户行为数据样本中的数据分别构建用户连续特征矩阵和用户类别特征矩阵,利用基于深度神经网络的特征交叉模型对用户连续特征矩阵进行处理获得第一交叉特征,利用基于域矩阵因子分解机的特征交叉模型对用户类别特征矩阵进行处理获得第二交叉特征,再利用基于多层自注意力机制的特征交叉模型对第一交叉特征和第二交叉特征处理,获得第三交叉特征,并以第三交叉特征输入待训练的用户识别模型,根据模型得到的用户标签预测值和用户行为数据样本对应的用户标签确定模型损失并对模型调整。上述过程中一方面对用户行为数据样本中不同类型的行为数据都进行了交叉,可更好地挖掘其相互之间复杂的交互关系;另一方面针对用户行为数据样本中不同性质的数据,分别构建连续特征矩阵和类别特征矩阵,然后针对两个矩阵的特点,先使用不同的交叉方法对两者自身进行特征交叉,再将其得到的结果进行进一步的融合学习,其可以更好地对两种性质的数据进行处理,得到的第三交叉特征可以更真实地反映用户行为数据的特点,从而使用该第三交叉特征作为用户识别模型的输入,可以训练出对用户识别准确率更高的模型。而后续根据用户授权的信息使用该模型对用户标签进行预测,也可以为用户提供更准确的识别结果,并进而可提供更切合用户需求的个性化金融服务。
附图说明
图1为一个实施例中金融系统用户识别模型训练方法和金融系统中提供用户识别结果的方法的应用环境图;
图2为一个实施例中金融系统用户识别模型训练方法的流程示意图;
图3为一个实施例中金融系统用户识别模型训练方法的结构示意图;
图4为一个实施例中基于用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵的流程示意图;
图5为一个实施例中金融系统中提供用户识别结果的方法的流程示意图;
图6为一个实施例中金融系统用户识别模型训练装置的结构示意图;
图7为一个实施例中金融系统中提供用户识别结果的装置的结构示意图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本申请实施例提供的金融系统用户识别模型训练方法和金融系统中提供用户识别结果的方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。具体地,数据存储系统可以用于存储用户行为数据样本以及获用户授权分析的用户行为数据,金融系统的用户和工作人员可以通过终端102与金融系统进行交互,并启动识别模型的训练和识别过程,服务器104可以对用户行为数据样本以及用户授权的用户行为数据进行加工处理,并进一步进行模型训练或者利用模型进行识别。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种金融系统用户识别模型训练方法。请同时参阅图3,其为该方法使用的特征交叉模型的结构示意图。以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤S201,获取金融系统的用户行为数据样本和用户行为数据样本对应的用户标签样本值。
具体地,用户行为数据样本可以是来自金融系统的部分用户授权提供的信息,其中可以用户的个人信息以及用户的金融行为信息。其中个人信息可以包括用户的年龄、地区、职业、关联亲属、关联企业等,而金融行为信息可以包括用户在使用金融系统中产生的转账、消费、投资理财、第三方支付、公共缴费、保险、代发工资、持有产品等交易行为信息,以及用户自行提供的征信、存款、贷款等其他相关的金融行为信息,来自多个不同用户的授权信息可形成该用户行为数据样本。
进一步地,用户提供上述信息并授权分析时,也可同时提出自身对金融系统的服务体验评价以及希望获得的个性化服务,根据上述内容,可确定该用户对应的用户标签样本值。
步骤S202,基于用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵。
具体地,用户行为数据样本中的信息中存在多种不同性质的数据,例如,存款、消费等数据可以用数字直接反映用户在对应业务上的行为,其在连续的数值范围内可以有各种不同的取值;而地区、职业等数据则是用文字反映了用户在不同方面所属的类别。基于此,可以将用户行为数据样本中的第一种数据归为连续行为数据,将第二种数据归为类别行为数据。
而为了方便后续的特征交叉处理,在本步骤中可以将每个连续行为数据或类别行为数据转化为向量的形式,并分别形成用户连续特征矩阵和用户类别特征矩阵。具体地,对于连续行为数据,可以对每个数据进行归一化处理,并形成对应的向量,多个连续行为数据形成的向量可形成用户连续特征矩阵。而对于类别行为数据,则可以先将其文字表达转换为数值,然后再形成向量,并进一步地根据多个类别行为数据对应的向量形成用户类别特征矩阵。
进一步地,由于用户行为数据样本是来自于用户的授权数据,因此该不同用户提供的数据可能存在不同的缺漏或者是偏离统计范围等不适用于直接用于模型训练的情况。因此,在本步骤中还可以对用户行为数据样本进行预处理,例如某个用户提供了活期资产余额而未提供活期存款余额,则可以用活期资产余额对活期存款余额进行插补;又例如某个用户的个人消费额过高而不具有统计意义,则可以将其从用户行为数据样本中剔除。经过上述预处理后,可获得更适用于进行特征交叉以及模型训练的用户行为数据样本。
步骤S203,将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征。
具体地,该基于深度神经网络的特征交叉模型用于将步骤S202中获得的用户连续特征矩阵中的每个向量输入预训练的深度神经网络的第一层,然后经过深度神经网络的多层学习后,其最后一层输出的向量即为用户连续特征矩阵对应的第一交叉特征。该第一交叉特征可反映用户行为数据样本中不同的用户连续行为数据的交互关系。
步骤S204,将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征。
具体地,该基于域矩阵因子分解机的特征交叉模型用于将步骤S202中获得的用户类别特征矩阵中的每个向量映射至多特征域空间中,并根据不同特征域之间的交互关系,生成域交互矩阵,再利用域矩阵因子分解机对用户类别特征矩阵中不同向量之间的交互关系进行计算,并获得可以反映该交互关系的第二交叉特征。
步骤S205,将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征。
具体地,该基于多层自注意力机制的特征交叉模型包括多个自注意力模块,其将步骤S203和S204中获得的第一交叉特征和第二交叉特征输入第一个自注意力模块来学习其相互之间的交互关系,然后再将结果输入至下一个模块中,经过多个模块的处理,最后一个自注意力模块输出的结果即为第三交叉特征。该第三交叉特征可以综合反映包括用户连续行为数据和用户类别行为数据的多种不同类型的数据之间的交互关系。
步骤S206,将第三交叉特征输入待训练的用户识别模型,获取待训练的用户识别模型输出的用户标签预测值。
具体地,在本步骤中可以先根据具体要识别的目标构建待训练的用户识别模型。
示例性地,可以构建如下式所示的用户识别模型:
其中,WP,b表示模型参数,P为要输入该模型的第三交叉特征,表示识别模型的预测结果,δ为激活函数,其可以根据具体的识别目的以及数据的特点选择ReLu、Sigmoid等函数。
进一步地,将步骤S205中获得的第三交叉特征输入该构建好的模型中,即可为对应用户输出其用户标签预测值。
步骤S207,根据用户标签样本值和用户标签预测值,确定模型损失。
具体地,在本步骤中根据步骤S201中获得的用户标签样本值和步骤S206中获得用户标签预测值来确定模型损失。例如,可以对用户标签样本值和用户标签预测值进行比较,并根据两者的差异确定模型损失。
示例性地,在本实施例中,可采用基于交叉熵方法的损失函数来获取模型损失,该函数如下式所示:
其中R为用户的数量,yr表示第r个用户的用户标签样本值,为识别模型输出的第r个用户的用户标签预测值。
例如,对于“用户是否需要在金融系统中使用A服务”这一识别目的,用户标签样本值存在“需要”或“不需要”两种取值,则可以将用1和0指代两种取值;而用户识别模型则可以输出0到1之间的取值作为用户标签预测值。将两者输入上述损失函数后,即可确定模型损失。其中模型损失的数值越小,则该模型的识别准确率越高。
步骤S208,根据模型损失,调整待训练的用户识别模型的模型参数,直至模型损失满足预设条件时得到经训练的用户识别模型。
具体地,可以将用户行为数据样本分为多个批次,先使用第一批样本按照上述多个步骤获取用户识别模型的模型损失,然后对其模型参数进行调整,再使用第二批样本获取调整后的用户识别模型的模型损失,如此迭代多次,直至模型损失满足预设条件,例如小于等于一设定的数值,即可认为该用户识别模型已经完成训练。
上述金融系统用户识别模型训练方法中,一方面对用户行为数据样本中不同类型的行为数据都进行了交叉处理,可更好地挖掘其相互之间复杂的交互关系;另一方面针对用户行为数据样本中不同性质的数据,分别构建连续特征矩阵和类别特征矩阵,然后针对两个矩阵的特点,先使用不同的交叉方法对两者自身进行特征交叉,再将其得到的结果进行进一步的融合学习,其可以更好地对两种性质的数据进行处理,得到的第三交叉特征可以更真实地反映用户行为数据的特点,从而使用该第三交叉特征作为用户识别模型的输入,可以训练出对用户识别准确率更高的模型。而后续根据用户授权的信息使用该模型对用户标签进行预测,也可以为用户提供更准确的识别结果,并进而可提供更切合用户需求的个性化金融服务。
在一个实施例中,深度神经网络包括多个处理层;基于深度神经网络的特征交叉模型,用于将输入的用户连续特征矩阵转换为对应的向量并传输至深度神经网络的首个处理层,由首个处理层为输入的向量生成中间处理向量并传输至下一处理层,由各非首个处理层根据接收的中间处理向量生成新的中间处理向量并传递至下一处理层,直至由最后一个处理层生成中间处理向量作为第一交叉特征。
具体地,本实施例提供了一种在上述步骤S203中获得第一交叉特征的具体实施方式。
其中,该基于深度神经网络的特征交叉模型使用的深度神经网络包括多个处理层,其中每个处理层对输入的向量进行交叉运算,并输出中间处理向量;除了第一个和最后一个处理层外,每个处理层都以上一个处理层输出的中间处理向量作为输入,并将本层生成的中间处理向量输入至下一层。具体地,可用下式表示每一个处理层生成中间处理向量的过程:
其中表示为深度神经网络第l-1个处理层输出的中间处理向量,/>和bl为模型参数,/>表示深度神经网络第l层输出的中间处理向量。
而本实施例中的用户连续特征矩阵可以用下式表示:
其中N为子序列数量,即用户连续行为数据的个数,T为每个用户连续行为数据的维度,Dn={dn,1,...,dn,T}表示第n个用户连续行为数据向量。
将上述矩阵输入基于深度神经网络的特征交叉模型后,该模型从用户连续特征矩阵中提取不同的用户连续行为数据向量,并对其进行转换,使其成为适用于输入上述深度神经网络的向量,并将其作为深度神经网络的第一个处理层的输入。该过程可用下式表示:
使用上述方法将用户连续特征矩阵转换为对应的向量并输入至深度网络的第一个处理层后,经过多个处理层的运算,最后一个处理层输出的中间处理向量即为与用户连续行为数据对应的第一交叉特征。
本实施例从用户连续特征矩阵中提取出用户连续行为数据向量,并通过多层的深度神经网络对其进行处理,可以对各用户连续行为数据向量之间的交互关系进行特征自动学习组合,从而能够挖掘用户连续性行为数据中隐藏较深的特征及组合,可有效提高后续训练的用户识别模型的用户识别精度和用户识别准确率。
在一个实施例中,用户类别特征矩阵包括多个用户类别特征向量;基于域矩阵因子分解机的特征交叉模型,用于根据用户类别特征矩阵获取每个用户类别特征向量对应的用户类别特征域,根据用户类别特征域获取每两个用户类别特征域对应的域交互矩阵,根据用户类别特征矩阵和域交互矩阵获取每两个用户类别特征向量的交叉表征,根据多个交叉表征,获得第二交叉特征。
具体地,在本实施例中,用户类别特征矩阵可以用下式表示:
其中,M为用户类别特征向量的个数,K为每个用户类别特征向量的维度,Em={em,1,...,em,K}表示第m个用户类别特征向量。
其中,每个用户类别特征向量都有其所属的特征域。特征域是对用户类别特征向量的归类,其中一个特征域可以只包含一种用户类别特征向量,也可以包含多种用户类别特征向量。例如,以职业作为特征域,则该特征域只包含与职业对应的一种用户类别特征向量;而以用户属性作为特征域,则该特征域可以包含与地区、职业、兴趣等对应的多种用户类别特征向量。具体地,在本实施例中,分析人员可以根据金融业以及所使用的金融系统的特点,预先设定不同的特征域,并确认每个特征域包含的用户类别特征向量种类。
进一步地,完成特征域的设定后,可根据不同特征域之间的交互关系,设定域交互矩阵。该域交互矩阵包括多个子矩阵,每两个特征域之间的交互关系都可以由其中一个子矩阵反映。具体地,分析人员在设定特征域之后,可以根据金融业或者所使用的金融系统的业务特点,对不同特征域之间的关联情况进行分析,并进一步设置该域交互矩阵。
基于此,在上述步骤S204中将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型后,该模型先根据预先划分的特征域,获取每个用户类别特征向量对应的特征域,然后根据域交互矩阵,通过域矩阵因子分解机对用户类别特征矩阵中的任意两个用户类别特征向量进行特征交叉,并获得两者的交叉特征。进一步地,将该过程中获得的多个交叉表征结合,即可获得与用户类别行为数据对应的第二交叉特征。具体地,该过程可通过下式表示:
其中,Ei为第i个用户类别特征向量,Ej为第j个用户类别特征向量,Ii,j表示类别特征i与类别特征j的域交互矩阵参数,即两者各自所属的特征域在域交互矩阵中对应的子矩阵,Ei,j表示用户类别特征向量i与用户类别特征向量j间的交叉表征,M为用户类别特征向量个数,C表示用户类别行为数据对应的第二交叉特征。
本实施例针对用户类别行为数据具有多特征域且稀疏的特点,在特征交叉过程中引入域交互矩阵,将用户类别特征向量映射到多特征域空间中,再计算不同特征域的用户类别特征向量之间的交叉,可以更好地捕获用户类别行为数据之间的相互关系,从而有效提高后续训练的用户识别模型的用户识别精度和用户识别准确率。而且,域交互矩阵还可以使具有不同维度的用户类别特征向量都可以相互交叉,其在保证交叉效果的同时还可以减少部分用户类别特征向量的维度,从而可获得更低的时间复杂度和更少的内存占用。
在一个实施例中,基于多层自注意力机制的特征交叉模型包括多层自注意力模块;其中,自注意力模块基于输入的向量生成交互关系向量和值权重向量,根据交互关系向量和值权重向量获得注意力交叉特征向量;基于多层自注意力机制的特征交叉模型,用于将第一交叉特征和第二交叉特征转化为对应的向量并输入首层自注意力模块,由首层自注意力模块获得注意力交叉特征向量并将该注意力交叉特征向量传输至下一层自注意力模块,继续由后续每层自注意力模块根据接收的注意力交叉特征向量生成新的注意力交叉特征向量,直至由最后一个自注意力模块生成的注意力交叉特征向量作为第三交叉特征。
具体地,本实施例中使用的基于多层自注意力机制的特征交叉模型中包括基于Transformer的多层自注意力模块。
其中每一层自注意力模块都基于输入的向量进行运算,生成交互关系向量和值权重向量,并进一步根据交互关系向量和值权重向量生成注意力交叉特征向量。示例性地,该过程可以用下式表示:
其中,A为自注意力模块的处理过程,Q、K、V分别为自注意力模块的查询权重向量、键权重向量和值权重向量,dk表示查询权重向量Q和键权重向量K的维度。该过程中,注意力模块根据输入的向量计算得到Q、K、V三个向量,然后将查询权重向量Q与键权重向量K进行点乘计算,并通过softmax函数进行归一化处理以保证梯度稳定,获得交互关系向量。然后将交互关系向量与值权重向量V进行点乘计算并累加,获得该层自注意力模块对应的注意力交叉特征向量。
基于此,在上述步骤S205中,基于多层自注意力机制的特征交叉模型根据步骤S203和S204获得的第一交叉特征Ddnn和第二交叉特征C,将两者共同输入第一层自注意力模块中,并根据上述过程,生成该层对应的注意力交叉特征向量,再将其传入第二层自注意力模块中。按照该过程,每一层自注意力模块根据其接收的注意力交叉特征向量生成新的注意力交叉特征向量,直至得到由最后一个自注意力模块生成的注意力交叉特征向量,即为第三交叉特征P。
本实施例中通过多层自注意力模块对反映用户连续行为数据交互关系的第一交叉特征、反映用户类别行为数据交互关系的第二交叉特征进行进一步的融合学习,其可以对不同性质的用户行为数据之间的交互关系进行充分学习,从而可得到能更全面反映用户情况的第三交叉特征。以该第三交叉特征作为待训练的用户识别模型的输入,有助于训练出具有更高用户识别准确率和精度的模型。
在一个实施例中,如图4所示,基于用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵,包括以下步骤:
步骤S401,根据用户行为数据样本,提取多个子行为数据。
具体地,如上述实施例步骤S202中所述,用户行为数据样本中的信息中存在例如地区、职业、存款、消费等多种不同的数据,而用户提供的信息中同时也存在部分与用户识别模型的训练无关的数据,因此在步骤S401中首先在用户提供的数据中对不同的数据进行区分和识别,从中提取要用于进行模型训练的数据,其中每种数据即为一个子行为数据。
步骤S402,根据多个子行为数据,获取衍生子行为数据。
为了进一步提高后续训练的用户识别模型的精度,本步骤中根据步骤S401中获取的子行为数据进行特征衍生,获得衍生子行为数据,增加可用于模型训练的数据量。
具体地,本实施例中可以使用python的第三方库Pandas和Numpy对上一步获得的子行为数据进行处理,获得包括活跃账户占比、活期存款占总资产的比例、定期存款占总资产的比例、理财占总资产的比例、投资占总资产的比例以及线上交易情况占比等衍生子行为数据。
步骤S403,识别子行为数据和衍生子行为数据中的连续行为数据和类别行为数据,形成连续行为数据集和类别行为数据集。
具体地,在本步骤中可以对识别子行为数据和衍生子行为数据中的连续行为数据和类别行为数据进行辨别和区分,并根据区分结果分别形成连续行为数据集和类别行为数据集。可以使用计算机实现对连续行为数据和类别数据的区分。其中,考虑到计算机在直接识别文字表示的数据上可能存在的困难,可以先将文字表示的数据转换为数值,例如对于地区数据,可以用1表示国内,用2表示国外。完成上述转换后,计算机可对来自多个用户的子行为数据和衍生子行为数据进行分析,根据其中每个数据的取值是否可数,区分连续行为数据和类别行为数据,并将对应的数据放入连续行为数据集或类别行为数据集。
步骤S404,根据连续行为数据集构建用户连续特征矩阵,及根据类别行为数据集,构建用户类别特征矩阵。
根据上述步骤获得连续行为数据集和类别行为数据集后,即可以根据数据集中的数据分别构建用户连续特征矩阵和用户类别特征矩阵。
其中,对于连续行为数据集,可以对每个数据进行归一化处理,并形成对应的向量,多个连续行为数据形成的向量可形成用户连续特征矩阵。而对于其中的时间相关的连续行为数据,也可以将数据按时点划分,来构建对应的向量。根据连续行为数据集中所有连续行为数据对应的向量,即可构建用户连续特征矩阵。
而对于类别行为数据集,可以先将每个类别行为数据转化为数值,然后再根据该数值形成对应的向量;也可以使用独热向量的形式对类别行为数据进行编码,并转换为对应的向量。根据类别行为数据集中所有类别行为数据对应的向量,即可构建用户类别特征矩阵。
本实施例通过对用户授权提供的用户行为数据样本进行预处理和衍生,可以有效获得更丰富的用户行为数据,从而增加了后续可用于进行特征交叉的数据种类,有助于在后续处理中获得更能反映用户真实情况的交叉特征,从而可训练出具有更高用户识别精度的用户识别模型。进一步地,本实施例对以文字表示的用户行为数据进行了数值转换处理,从而使计算机可自动进行连续行为数据和类别行为数据的识别和区分,有利于提高训练过程的整体速度。
在一个实施例中,根据类别行为数据集,构建用户类别特征矩阵,包括:对类别行为数据集中的类别行为数据进行词嵌入处理,形成用户类别特征向量;根据类别行为数据集对应的类别行为特征向量,构建用户类别特征矩阵。
具体地,本实施例中针对类别行为数据集,可以使用Word2Vec或GloVa等词嵌入方法对每个类别行为数据进行处理,以生成该类别行为数据对应的类别行为特征向量。然后再根据类别行为数据集中所有类别行为数据对应的类别行为特征向量构建用户类别特征矩阵。
本实施例使用词嵌入的方法对类别行为数据进行处理,其可以更好地对数据中不同的词语进行表示,提高泛化能力。用该方法获得的类别行为特征向量可在后续的特征交叉过程中更好地反映不同的类别行为数据之间的交互关系,从而得到更具有代表性的交叉特征,并进而提高后续训练的用户识别模型的用户识别准确度和精度。
在一实施例中,如图5所示,本申请还提供了一种金融系统中提供用户识别结果的方法,可以应用于如图1所示的应用环境中的终端102,其包括以下步骤:
步骤S501,获得用户授权分析的用户行为数据后,根据用户行为数据,构建用户连续特征矩阵和用户类别特征矩阵。
步骤S502,将用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征。
步骤S503,将用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
步骤S504,将第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征。
步骤S505,将第三交叉特征输入经训练的用户识别模型,获取经训练的用户识别模型输出的用户标签预测值。
步骤S506,根据用户标签预测值,得到用户的用户识别结果。
步骤S507,在用户进入的金融系统的页面中展示用户识别结果。
其中,经训练的用户识别模型根据上述实施例中的方法训练得到。
具体地,本实施例中用户可以通过终端102与金融系统交互,通过金融系统的页面进行信息分析的授权,并录入除了已在系统中存储的信息外其他希望提供的信息。获得用户授权后,可将其录入的信息以及系统中存储的授权范围内的信息合并形成用户行为数据,并进一步应用本实施例中的方法为用户提供用户识别结果。
其中,步骤S501至S505中的具体处理过程可以采用上述实施例中步骤S202到S206中的方法实现,也可以使用其他实施例中的相关方法实现,此处不再赘述。
在步骤S506中,根据之前的步骤获得用户标签预测值后,可得到用户的识别结果。示例性地,对于“用户是否需要在金融系统中使用A服务”这一识别目的,在步骤S505中通过用户识别模型得到用户标签预测值后,可以根据该预测值大小转换成对应的用户识别结果,例如当用户标签预测值大于0.5,其识别结果即为“需要”。
根据上述过程获得用户识别结果后,在步骤S507中可以通过文字、图像等方式,在用户与金融系统的交互页面上展示该用户识别结果。金融系统可进一步根据用户对该用户识别结果的反馈向该用户提供个性化服务,提高用户的服务体验。
本实施例对用户授权分析的用户行为数据中不同性质的行为数据采用不同的特征交叉方法,获得其各自的交叉特征,再对两种数据对应的交叉特征做进一步的融合学习,可以获得能更真实地反映用户情况的交叉特征。进一步地,将该交叉特征输入通过上述方法训练得到的用户识别模型,可以得到具有更高准确率的用户识别结果,并进而可提供更切合用户需求的个性化金融服务
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的金融系统用户识别模型训练方法的金融系统用户识别模型训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个金融系统用户识别模型训练装置实施例中的具体限定可以参见上文中对于金融系统用户识别模型训练方法的限定,在此不再赘述。
在一个实施例中,如图6所示,提供了一种金融系统用户识别模型训练装置600,包括:
获取模块601,用于获取金融系统的用户行为数据样本和所述用户行为数据样本对应的用户标签样本值;
构建模块602,用于基于所述用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵;
第一交叉模块603,用于将所述用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
第二交叉模块604,用于将所述用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
第三交叉模块605,用于将所述第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
预测模块606,用于将所述第三交叉特征输入待训练的用户识别模型,获取所述待训练的用户识别模型输出的用户标签预测值;
损失确定模块607,用于根据所述用户标签样本值和用户标签预测值,确定模型损失;
调整模块608,用于根据所述模型损失,调整所述待训练的用户识别模型的模型参数,直至所述模型损失满足预设条件时得到经训练的用户识别模型。
一个实施例中,所述深度神经网络包括多个处理层;所述基于深度神经网络的特征交叉模型,用于将输入的所述用户连续特征矩阵转换为对应的向量并传输至深度神经网络的首个处理层,由所述首个处理层为输入的所述向量生成中间处理向量并传输至下一处理层,由各非首个处理层根据接收的中间处理向量生成新的中间处理向量并传递至下一处理层,直至由最后一个处理层生成中间处理向量作为所述第一交叉特征。
一个实施例中,所述用户类别特征矩阵包括多个用户类别特征向量;所述基于域矩阵因子分解机的特征交叉模型,用于根据所述用户类别特征矩阵获取每个用户类别特征向量对应的用户类别特征域,根据所述用户类别特征域获取每两个用户类别特征域对应的域交互矩阵,根据所述用户类别特征矩阵和域交互矩阵获取每两个用户类别特征向量的交叉表征,根据多个所述交叉表征,获得所述第二交叉特征。
一个实施例中,所述基于多层自注意力机制的特征交叉模型包括多层自注意力模块;其中,所述自注意力模块基于输入的向量生成交互关系向量和值权重向量,根据所述交互关系向量和值权重向量获得注意力交叉特征向量;所述基于多层自注意力机制的特征交叉模型,用于将所述第一交叉特征和第二交叉特征转化为对应的向量并输入首层自注意力模块,由首层自注意力模块获得注意力交叉特征向量并将该注意力交叉特征向量传输至下一层自注意力模块,继续由后续每层自注意力模块根据接收的注意力交叉特征向量生成新的注意力交叉特征向量,直至由最后一个自注意力模块生成的注意力交叉特征向量作为所述第三交叉特征。
一个实施例中,构建模块还用于根据所述用户行为数据样本,提取多个子行为数据;根据所述多个子行为数据,获取衍生子行为数据;识别所述子行为数据和衍生子行为数据中的连续行为数据和类别行为数据,形成连续行为数据集和类别行为数据集;根据所述连续行为数据集构建用户连续特征矩阵,及根据所述类别行为数据集,构建用户类别特征矩阵。
一个实施例中,构建模块还用于对所述类别行为数据集中的类别行为数据进行词嵌入处理,形成用户类别特征向量;根据所述类别行为数据集对应的类别行为特征向量,构建所述用户类别特征矩阵。
在一个实施例中,本申请还提供了一种用于实现上述所涉及的金融系统中提供用户识别结果的方法的金融系统中提供用户识别结果的装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个金融系统中提供用户识别结果装置实施例中的具体限定可以参见上文中对于金融系统中提供用户识别结果方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种金融系统中提供用户识别结果的装置700,包括:
构建模块701,用于获得用户授权分析的用户行为数据后,根据所述用户行为数据,构建用户连续特征矩阵和用户类别特征矩阵;
第一交叉模块702,用于将所述用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
第二交叉模块703,用于将所述用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
第三交叉模块704,用于将所述第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
预测模块705,用于将所述第三交叉特征输入经训练的用户识别模型,获取所述经训练的用户识别模型输出的用户标签预测值;
识别模块706,用于根据所述用户标签预测值,得到所述用户的用户识别结果;
展示模块707,用于在所述用户进入的金融系统的页面中展示所述用户识别结果;
其中,所述经训练的用户识别模型根据上述实施例中的方法训练得到。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种金融系统用户识别模型训练方法、金融系统中提供用户识别结果的方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (12)
1.一种金融系统用户识别模型训练方法,其特征在于,所述方法包括:
获取金融系统的用户行为数据样本和所述用户行为数据样本对应的用户标签样本值;
基于所述用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵;
将所述用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
将所述用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
将所述第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
将所述第三交叉特征输入待训练的用户识别模型,获取所述待训练的用户识别模型输出的用户标签预测值;
根据所述用户标签样本值和用户标签预测值,确定模型损失;
根据所述模型损失,调整所述待训练的用户识别模型的模型参数,直至所述模型损失满足预设条件时得到经训练的用户识别模型。
2.根据权利要求1所述的方法,其特征在于,所述深度神经网络包括多个处理层;所述基于深度神经网络的特征交叉模型,用于将输入的所述用户连续特征矩阵转换为对应的向量并传输至深度神经网络的首个处理层,由所述首个处理层为输入的所述向量生成中间处理向量并传输至下一处理层,由各非首个处理层根据接收的中间处理向量生成新的中间处理向量并传递至下一处理层,直至由最后一个处理层生成中间处理向量作为所述第一交叉特征。
3.根据权利要求1所述的方法,其特征在于,所述用户类别特征矩阵包括多个用户类别特征向量;
所述基于域矩阵因子分解机的特征交叉模型,用于根据所述用户类别特征矩阵获取每个用户类别特征向量对应的用户类别特征域,根据所述用户类别特征域获取每两个用户类别特征域对应的域交互矩阵,根据所述用户类别特征矩阵和域交互矩阵获取每两个用户类别特征向量的交叉表征,根据多个所述交叉表征,获得所述第二交叉特征。
4.根据权利要求1所述的方法,其特征在于,所述基于多层自注意力机制的特征交叉模型包括多层自注意力模块;其中,所述自注意力模块基于输入的向量生成交互关系向量和值权重向量,根据所述交互关系向量和值权重向量获得注意力交叉特征向量;
所述基于多层自注意力机制的特征交叉模型,用于将所述第一交叉特征和第二交叉特征转化为对应的向量并输入首层自注意力模块,由首层自注意力模块获得注意力交叉特征向量并将该注意力交叉特征向量传输至下一层自注意力模块,继续由后续每层自注意力模块根据接收的注意力交叉特征向量生成新的注意力交叉特征向量,直至由最后一个自注意力模块生成的注意力交叉特征向量作为所述第三交叉特征。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述基于所述用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵,包括:
根据所述用户行为数据样本,提取多个子行为数据;
根据所述多个子行为数据,获取衍生子行为数据;
识别所述子行为数据和衍生子行为数据中的连续行为数据和类别行为数据,形成连续行为数据集和类别行为数据集;
根据所述连续行为数据集构建用户连续特征矩阵,及根据所述类别行为数据集,构建用户类别特征矩阵。
6.根据权利要求5所述的方法,其特征在于,所述根据所述类别行为数据集,构建用户类别特征矩阵,包括:
对所述类别行为数据集中的类别行为数据进行词嵌入处理,形成用户类别特征向量;
根据所述类别行为数据集对应的类别行为特征向量,构建所述用户类别特征矩阵。
7.一种金融系统中提供用户识别结果的方法,其特征在于,所述方法包括:
获得用户授权分析的用户行为数据后,根据所述用户行为数据,构建用户连续特征矩阵和用户类别特征矩阵;
将所述用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
将所述用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
将所述第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
将所述第三交叉特征输入经训练的用户识别模型,获取所述经训练的用户识别模型输出的用户标签预测值;
根据所述用户标签预测值,得到所述用户的用户识别结果;
在所述用户进入的金融系统的页面中展示所述用户识别结果;
其中,所述经训练的用户识别模型根据权利要求1至6中任一项所述的方法训练得到。
8.一种金融系统用户识别模型训练装置,其特征在于,包括:
获取模块,用于获取金融系统的用户行为数据样本和所述用户行为数据样本对应的用户标签样本值;
构建模块,用于基于所述用户行为数据样本,构建用户连续特征矩阵和用户类别特征矩阵;
第一交叉模块,用于将所述用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
第二交叉模块,用于将所述用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
第三交叉模块,用于将所述第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
预测模块,用于将所述第三交叉特征输入待训练的用户识别模型,获取所述待训练的用户识别模型输出的用户标签预测值;
损失确定模块,用于根据所述用户标签样本值和用户标签预测值,确定模型损失;
调整模块,用于根据所述模型损失,调整所述待训练的用户识别模型的模型参数,直至所述模型损失满足预设条件时得到经训练的用户识别模型。
9.一种金融系统中提供用户识别结果的装置,其特征在于,包括:
构建模块,用于获得用户授权分析的用户行为数据后,根据所述用户行为数据,构建用户连续特征矩阵和用户类别特征矩阵;
第一交叉模块,用于将所述用户连续特征矩阵输入基于深度神经网络的特征交叉模型,获得第一交叉特征;
第二交叉模块,用于将所述用户类别特征矩阵输入基于域矩阵因子分解机的特征交叉模型,获得第二交叉特征;
第三交叉模块,用于将所述第一交叉特征和第二交叉特征输入基于多层自注意力机制的特征交叉模型,获得第三交叉特征;
预测模块,用于将所述第三交叉特征输入经训练的用户识别模型,获取所述经训练的用户识别模型输出的用户标签预测值;
识别模块,用于根据所述用户标签预测值,得到所述用户的用户识别结果;
展示模块,用于在所述用户进入的金融系统的页面中展示所述用户识别结果;
其中,所述经训练的用户识别模型根据权利要求1至6中任一项所述的方法训练得到。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
12.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310611705.6A CN116975679A (zh) | 2023-05-29 | 2023-05-29 | 金融系统用户识别模型训练及提供识别结果的方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310611705.6A CN116975679A (zh) | 2023-05-29 | 2023-05-29 | 金融系统用户识别模型训练及提供识别结果的方法、装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116975679A true CN116975679A (zh) | 2023-10-31 |
Family
ID=88475710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310611705.6A Pending CN116975679A (zh) | 2023-05-29 | 2023-05-29 | 金融系统用户识别模型训练及提供识别结果的方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116975679A (zh) |
-
2023
- 2023-05-29 CN CN202310611705.6A patent/CN116975679A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW201946013A (zh) | 基於lstm模型的信用風險預測方法及裝置 | |
CN109493199A (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
Li et al. | MAFH: Multilabel aware framework for bit-scalable cross-modal hashing | |
CN116975679A (zh) | 金融系统用户识别模型训练及提供识别结果的方法、装置 | |
CN114549174A (zh) | 用户行为预测方法、装置、计算机设备和存储介质 | |
CN115186890A (zh) | 预警方法、装置、计算机设备和存储介质 | |
CN114219184A (zh) | 产品交易数据预测方法、装置、设备、介质和程序产品 | |
CN116702024B (zh) | 流水数据类型识别方法、装置、计算机设备和存储介质 | |
CN117745337A (zh) | 产品生成方法、装置、计算机设备和存储介质 | |
CN118469713A (zh) | 银行交易流水向量化的数据预警方法、装置、计算机设备和可读存储介质 | |
CN118411228A (zh) | 产品推荐方法、装置、设备、存储介质和程序产品 | |
CN116860972A (zh) | 交互信息分类方法、装置、设备、存储介质和程序产品 | |
CN118568202A (zh) | 查询语句生成模型处理方法、装置和计算机设备 | |
CN116127183A (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN118013113A (zh) | 对象列表推荐方法、装置、电子设备及可读存储介质 | |
CN117112724A (zh) | 搜索推送方法、装置、设备、存储介质和计算机程序产品 | |
CN117786231A (zh) | 虚拟资源推荐方法、装置、计算机设备和存储介质 | |
CN115658899A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
CN116109406A (zh) | 用户借贷意愿的预测方法、装置、计算机设备和存储介质 | |
CN115239355A (zh) | 客户分类方法、装置、计算机设备和存储介质 | |
CN118245845A (zh) | 分类模型构建方法、对象分类方法、装置和计算机设备 | |
CN116894728A (zh) | 异常账户确定方法、装置、计算机设备和存储介质 | |
CN115454949A (zh) | 共享数据确定方法、装置、电子设备及存储介质 | |
CN118051215A (zh) | 程序生成方法、装置、计算机设备和存储介质 | |
CN117725442A (zh) | 需求方分类方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |