CN113468203A - 基于循环神经网络与注意力机制的金融用户画像方法 - Google Patents

基于循环神经网络与注意力机制的金融用户画像方法 Download PDF

Info

Publication number
CN113468203A
CN113468203A CN202110476016.XA CN202110476016A CN113468203A CN 113468203 A CN113468203 A CN 113468203A CN 202110476016 A CN202110476016 A CN 202110476016A CN 113468203 A CN113468203 A CN 113468203A
Authority
CN
China
Prior art keywords
financial
user
data
neural network
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110476016.XA
Other languages
English (en)
Other versions
CN113468203B (zh
Inventor
马明俊
杜德慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN202110476016.XA priority Critical patent/CN113468203B/zh
Publication of CN113468203A publication Critical patent/CN113468203A/zh
Application granted granted Critical
Publication of CN113468203B publication Critical patent/CN113468203B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于循环神经网络与注意力机制的金融用户画像方法,旨在通过提出面向金融领域的用户画像模型和构建方法,用于金融企业的用户分类、精准营销、用户行为研究等应用。该方法特点包括:对金融时序数据特征进行预处理;构建金融用户画像标签系统;通过Embedding机制将输入信息进行变换;使用循环神经网络与注意力机制,对金融用户画像进行建模,并聚焦于关键时刻的操作信息,最终得到金融用户画像的标签结果。本发明由于针对金融时序数据使用了了金融时序数据预处理、金融用户标签系统、金融特征向量Embedding机制、基于循环神经网络与用户时序操作的注意力机制的金融用户画像模型,能够取得较好的效率和准确率。

Description

基于循环神经网络与注意力机制的金融用户画像方法
技术领域
本发明涉及金融大数据、人工智能、深度学习,尤其是一种针对金融用户操作所产生的时序数据对其进行用户画像分类的方法。
背景技术
目前,随着互联网飞速发展,金融的业务、消费和产品发生了巨大的变革,金融企业不再像从前那样能够轻易接触到用户,并且随着国家金融改革的力度不断加深,人们产生了多元化的金融诉求,金融公司所提供的产品服务需要不断迭代以满足客户需求,因此催生出金融用户画像的需求,金融企业借助于用户画像技术,分析数据来了解客户、改进产品迎合客户习惯。如运营商对客户画像来对用户征信,信息安全部门利用日志来对用户画像分析其目标风险。然而,不同领域的用户画像需求都不太相同,包括数据来源、数据形式、用户画像标签、业务需求、应用场景各式各样,当前已有的金融用户画像方法都没有很好地针对金融用户的时序数据方面进行处理和分类。本发明结合循环神经网络模型和注意力机制的金融用户画像分类模型有效地对时序数据进行建模,并为重要时刻的金融用户行为分配更高的权重。
循环神经网络是一种用于处理时序数据的神经网络模型,它可以专门用于处理如x1,x2,...xt的序列。循环神经网络的优点是在模型的不同部分共享参数,使得模型能够拓展到不同长度的样本,对于相互依赖性很强的数据流形式,循环神经网络具有天然的优势,帮助系统获取上下文信息。因此循环神经网络经常被应用于处理序列数据上,如文本情感分析、语音识别、机器翻译、股票走势预测。
Embedding层是深度学习实验中经常会遇到的一个模型层,主要是为了解决one-hot编码带来的稀疏矩阵问题,Embedding层还可以捕捉特征之间的关系、降低特征维度、变离散为连续向量,它使得深度神经网络的应用更加广泛,极大地推动了深度学习的发展。
神经网络中的注意力机制是解决深度学习中信息超载问题的一种资源分配方案。深度学习模型的复杂程度与存储的信息量成正比,庞大的金融数据量带来了数据负担,产生数据过载的问题,使用基于时序操作的注意力机制可以在众多任务重聚焦于关键信息,过滤掉低价值信息,提高任务处理的效率和准确性。
发明内容
本发明的目的是为了解决金融领域的用户画像问题,提供一种基于循环神经网络与注意力机制的金融用户画像方法,该方法采用注意力机制和循环神经网络对金融用户画像分析,使用Embedding层、循环神经网络模型以及注意力机制对金融用户特征以及行为特征进行分类预测,有效地提高了金融用户画像模型的准确性、可用性、可拓展性。
实现本发明目的的具体技术方案是:
一种基于循环神经网络与注意力机制的金融用户画像方法,特点是使用数据预处理技术对金融时序操作数据进行预处理,通过可视化技术、聚类算法构建金融用户画像标签系统,使用Embedding机制、循环神经网络模型以及用户操作注意力机制对金融用户特征以及行为特征进行分类预测,该方法包括如下具体步骤:
A:使用金融时序数据预处理技术对金融时序操作数据进行数据变换,得到金融特征向量;其中,金融特征向量包括用户操作信息及控件信息;
B:结合金融领域知识、专家经验及业务需求上层指导,使用可视化技术、聚类算法构建出金融用户标签系统;
C:使用Embedding机制对金融特征向量进行变换,生成一种更为稠密的金融特征向量;
D:将所述稠密的金融特征向量输入到融合了循环神经网络和用户操作注意力机制的金融用户画像模型中,输出金融用户画像标签结果值,并更新准确率;其中,准确率的初始值为0%;
E:迭代执行步骤C和步骤D,直至金融用户画像准确率至少80%终止。
所述步骤A具体包括:
A1:对金融时序数据进行清洗和补齐操作,得到清洗和补齐的金融时序数据;
A2:对清洗和补齐后的金融时序数据进一步使用数据标准化操作,得到标准化金融时序数据;
A3:根据标准化金融时序数据,生成隐含的用户操作信息,隐含的用户操作特征与原有的金融时序数据共同构成金融特征向量;
A4:将金融特征向量按照七比三的比例进行分割,分成训练集和测试集。
所述步骤A1中,对金融时序数据的清洗和补齐操作是以时间戳为依据的;具体包括:
A11:使用MYSQL连接查询语句、条件查询语句及删除语句,剔除冗余数据;
A12:使用MYSQL连接查询语句、条件查询语句及删除语句,剔除不一致数据;
A13:使用MYSQL连接查询语句、条件查询语句及插入语句,补齐缺失数据。
步骤A3中所述生成隐含的用户操作特征,具体包括:
A31:生成统计类的用户操作特征,包括鼠标点击频率及交易频率;
A32:生成复合操作类的用户操作特征,包括截图命令及窗口切换。
步骤B所述使用可视化技术、聚类算法构建出金融用户标签系统,具体包括:
B1:使用可视化方法对金融特征数据进行展示分析,从中选取特征构成金融用户事实类标签;金融用户操作数据的事实类标签包含某个操作视图停留时间、某个产品的购买时间段及控件点击频率;金融用户基础数据的内容包括年龄段及出身地城市;
B2:使用聚类算法对金融特征数据进行聚类计算,选取聚类结果中占比高的金融特征向量,得到学习类标签;
B3:从金融公司的业务需求说明书中提取出现频率高的关键词,构建金融营销模型类标签。
所述步骤C具体包括:
C1:针对金融特征向量中的控件信息,使用Embedding机制进行变换得到控件信息的稠密向量;
C2:通过计算控件信息的稠密向量的平均值,得到用户操作信息的稠密向量。
所述步骤D具体包括:
D1:将用户操作信息的稠密向量输出到循环神经网络,由循环神经网络迭代地输出隐藏层向量;
D2:将循环神经网络的每一个时间步输出的隐藏层向量作为注意力机制的输入,对金融用户操作在“时间”维度进行注意力的学习,计算得到时序操作相似度权值;
D3:注意力机制进一步对隐藏层向量与时序操作相似度权值进行加权计算,输出一组多维向量,再通过SoftMax函数对这组多维向量归一化得到金融用户画像标签结果;
D4:通过对金融用户画像模型的标签值输出,更新准确率;其中,准确率的初始值为0%。
本发明结合注意力机制和循环神经网络对金融用户画像进行分析,对金融时序数据进行了预处理操作,并针对金融时序数据的特点,使用了Embedding层对时序数据的多维特征进行降维,使用循环网络模型对用户画像标签进行分类预测,使用注意力机制在时间维度对金融序列数据进行权重分配,有效地提高了金融用户画像模型的准确性、可用性、可拓展性。
附图说明
图1为本发明的流程图;
图2为金融时序特征数据分类示意图;
图3为数据集分割流程图;
图4为使用Embedding机制学习控件信息的向量关系示意图;
图5为金融用户画像模型的神经网络结构图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述实施例。
本发明提出了一种基于循环神经网络与注意力机制的金融用户画像方法,具体步骤如下:
A:使用金融时序数据预处理技术对金融时序操作数据进行数据变换,得到金融特征向量;其中,金融特征向量包括用户操作信息及控件信息;
B:结合金融领域知识、专家经验及业务需求上层指导,使用可视化技术、聚类算法构建出金融用户标签系统;
C:使用Embedding机制对金融特征向量进行变换,生成一种更为稠密的金融特征向量;
D:将所述稠密的金融特征向量输入到融合了循环神经网络和用户操作注意力机制的金融用户画像模型中,输出金融用户画像标签结果值,并更新准确率;其中,准确率的初始值为0%;
E:迭代执行步骤C和步骤D,直至金融用户画像准确率至少80%终止。
所述步骤A,具体包括:
A1:对金融时序数据进行清洗和补齐操作,得到清洗和补齐的金融时序数据;
A2:对清洗和补齐后的金融时序数据进一步使用数据标准化操作,得到标准化金融时序数据;
A3:根据标准化金融时序数据,生成隐含的用户操作信息,隐含的用户操作特征与原有的金融时序数据共同构成金融特征向量;
A4:如图3所示,将金融特征向量按照七比三的比例进行分割,分成训练集和测试集。
本发明所述步骤A1中,对金融时序数据的清洗和补齐操作是以时间戳为依据的。
所述步骤A1,具体包括:
A11:使用MYSQL连接查询语句、条件查询语句及删除语句,剔除冗余数据;
A12:使用MYSQL连接查询语句、条件查询语句及删除语句,剔除不一致数据;
A13:使用MYSQL连接查询语句、条件查询语句及插入语句,补齐缺失数据。
所述步骤A3,具体包括:
A31:生成统计类的用户操作特征,包括鼠标点击频率及交易频率;
A32:生成复合操作类的用户操作特征,包括截图命令及窗口切换。
所述步骤B,具体包括:
B1:使用可视化方法对金融特征数据进行展示分析,从中选取特征构成金融用户事实类标签;金融用户操作数据的事实类标签包含某个操作视图停留时间、某个产品的购买时间段及控件点击频率;金融用户基础数据的内容包括年龄段及出身地城市;
B2:使用聚类算法对金融特征数据进行聚类计算,选取聚类结果中占比高的金融特征向量,得到学习类标签;
B3:从金融公司的业务需求说明书中提取出现频率高的关键词,构建金融营销模型类标签。
所述步骤C,具体包括:
C1:针对金融特征向量中的控件信息,使用Embedding机制进行变换得到控件信息的稠密向量;
C2:通过计算控件信息的稠密向量的平均值,得到用户操作信息的稠密向量。
本发明所述步骤C2中,金融时序数据的用户Embedding层是通过行为历史中的控件Embedding平均或者聚类得到。
所述步骤D,具体包括:
D1:将用户操作信息的稠密向量输出到循环神经网络,由循环神经网络迭代地输出隐藏层向量;
D2:将循环神经网络的每一个时间步输出的隐藏层向量作为注意力机制的输入,对金融用户操作在“时间”维度进行注意力的学习,计算得到时序操作相似度权值;
D3:注意力机制进一步对隐藏层向量与时序操作相似度权值进行加权计算,输出一组多维向量,再通过SoftMax函数对这组多维向量归一化得到金融用户画像标签结果;
D4:通过对金融用户画像模型的标签值输出,更新准确率;其中,准确率的初始值为0%。
实施例
如图1,基于循环神经网络与注意力机制的金融用户画像方法,包括以下步骤:
A:使用金融时序数据预处理技术对金融时序操作数据进行数据变换,得到金融特征向量;其中,金融特征向量包括用户操作信息及控件信息;
B:结合金融领域知识、专家经验及业务需求上层指导,使用可视化技术、聚类算法构建出金融用户标签系统;
C:使用Embedding机制对金融特征向量进行变换,生成一种更为稠密的金融特征向量;
D:将所述稠密的金融特征向量输入到融合了循环神经网络和用户操作注意力机制的金融用户画像模型中,输出金融用户画像标签结果值,并更新准确率;其中,准确率的初始值为0%;
E:迭代执行步骤C和步骤D,直至金融用户画像准确率至少80%终止。
所述步骤A包括如下步骤:
A1:金融时序数据进行清洗和补齐操作,清洗操作和补齐操作如下:
对于金融时序数据中的冗余数据,相应的MYSQL操作命令如下:
delete from USR_CTRL_CLICK_ONEDAY_INFO where timestamp in(selecttimestamp from people group by timestamp having count(timestamp)>1)and IDnotin(select min(ID)from people group by timestamp having count(timestamp)>1);
其中USR_CTRL_CLICK_ONEDAY_INFO为一天的用户点击记录,ID表示用户ID,timestamp表示时间戳,上述操作的含义为:删除USR_CTRL_CLICK_ONEDAY_INFO数据表中时间戳相同的操作记录,只保留其中一条ID最小的记录。
对于金融时序数据中的不一致数据,相应的MYSQL操作命令同上;
对于金融时序数据中的缺失数据,以times属性为例,相应缺失数据补齐的MYSQL操作命令如下:
update USR_CTRL_CLICK_ONEDAY_INFO set times=(select round(avg(times),1)from USR_CTRL_CLICK_ONEDAY_INFO2)where times=”;
A2:金融时序数据的规范化与标准化。规范化操作将非数值类型的变量转换成数值类型,通过独热编码的方式,假如共有3种操作风格“激进”、“平稳”、“中庸”,则将每个类别编码为长度为3的向量,其中“激进”被编码为[0,0,1],“平稳”被编码为[0,1,0],“中庸”被编码为[1,0,0];
标准化操作将数值类变量处理使得每个特征中的数值平均为0,标准差变为1。
A3:根据标准化金融时序数据,生成隐含的用户操作信息,隐含的用户操作特征与原有的金融时序数据共同构成金融特征向量;
对于统计类用户操作特征的隐含信息,以鼠标点击频率统计为例,MYSQL查询命令如下:
Selectcount(click_action=1)from USR_CTRL_ONEDAY_INFO;
对于复合类用户操作特征的隐含信息,如截图命令为快捷键“CTRL+ALT+A”,其判断方式为查看表记录中这三个键盘是否被监控到同时按下,其MYSQL查询命令如下:
Selectcount(keyboard_ctrl=1and keyboard_alt=1and keyboard_A=1)fromUSR_CTRL_CLICK_ONEDAY_INFO;
其中,keyboard_ctrl用来查询键盘CTRL是否被按下,keyboard_alt用来查询键盘ALT是否被按下,keyboard_A用来查询键盘A是否被按下。
所述步骤B包括以下步骤:
B1:使用可视化方法对金融特征数据进行展示分析,从中选取特征构成金融用户事实类标签;如图2所示,金融时序特征数据包含自然属性类统计标签和规则标签,金融用户操作数据的事实类标签包含某个操作视图停留时间、某个产品的购买时间段及控件点击频率;金融用户基础数据的内容包括年龄段及出身地城市;
其中,可视化可以通过Tableau工具对事实类数据用树状图、饼状图进行展示。
B2:使用聚类算法对金融特征数据进行聚类计算,选取聚类结果中占比高的金融特征向量,得到学习类标签;
B3:从金融公司的业务需求说明书中提取出现频率高的关键词,构建金融营销模型类标签。
所述步骤C包括以下步骤:
步骤C1,针对金融特征向量中的控件信息,使用Embedding机制进行变换得到控件信息的稠密向量,如图4所示,使用Embedding机制还能够揭示每个控件操作之间的潜在关系。
假设用户操作信息中有一个长度为T的历史记录为w1,w2,...,wT,对于控件信息而言,Embedding机制的优化目标为:
Figure BDA0003047126620000081
其中条件概率定义为:
Figure BDA0003047126620000082
采用负采样的方法进行训练,记
Figure BDA0003047126620000083
是正样本,h是隐向量,Wneg是负样本集合,
Figure BDA0003047126620000084
是负样本控件向量,优化函数为:
Figure BDA0003047126620000085
然后通过上述Embedding机制的优化函数,将金融特征向量中的控件信息进行变换得到控件信息的稠密向量,通过计算控件信息的稠密向量的平均值,得到用户操作信息的稠密向量:
Figure BDA0003047126620000086
其中EMU表示用户操作信息的稠密向量,
Figure BDA0003047126620000088
为第i个控件的稠密向量,K为用户操作信息中所包含的控件数量。
所述步骤D包括以下步骤:
如图5所示,将Embedding层输出到金融分类模型的循环神经网络层,以一种循环神经网络LSTM(Long-ShortTermMemory)为例,对其输入稠密的金融特征向量,输出隐藏层向量。
将循环神经网络层的每一个时间步输出的隐藏层向量[h1,h2...hT]作为注意力模型的输入,对金融用户操作在“时间”维度进行注意力学习,计算时序操作相似度权值at,单元信息ct乘上相似度权值,得到新的单元信息。
Figure BDA0003047126620000087
注意力模型输出一组多维向量,将该向量经过全连接层进行变换,再通过SoftMax函数进行归一化处理并加权最终得到分类结果。仍然以操作风格“激进”、“平稳”、“中庸”为例,SoftMax函数输出向量[0.1,0.8,0.1],金融用户画像标签结果值就为“平稳”,表示该用户为操作“平稳”的选手。并更新当前轮次的准确率:
Figure BDA0003047126620000091
准确率定义为金融用户画像标签结果值正确的个数在总样本中的占比。
所述步骤E则迭代执行步骤C和步骤D,直至金融用户画像准确率至少80%终止。

Claims (7)

1.一种基于循环神经网络与注意力机制的金融用户画像方法,其特征在于,该方法包括如下具体步骤:
A:使用金融时序数据预处理技术对金融时序操作数据进行数据变换,得到金融特征向量;其中,金融特征向量包括用户操作信息及控件信息;
B:结合金融领域知识、专家经验及业务需求上层指导,使用可视化技术、聚类算法构建出金融用户标签系统;
C:使用Embedding机制对金融特征向量进行变换,生成一种更为稠密的金融特征向量;
D:将所述稠密的金融特征向量输入到融合了循环神经网络和用户操作注意力机制的金融用户画像模型中,输出金融用户画像标签结果值,并更新准确率;其中,准确率的初始值为0%;
E:迭代执行步骤C和步骤D,直至金融用户画像准确率至少80%终止。
2.根据权利要求1所述的基于循环神经网络与注意力机制的金融用户画像方法,其特征在于,所述步骤A具体包括:
A1:对金融时序数据进行清洗和补齐操作,得到清洗和补齐的金融时序数据;
A2:对清洗和补齐后的金融时序数据进一步使用数据标准化操作,得到标准化金融时序数据;
A3:根据标准化金融时序数据,生成隐含的用户操作信息,隐含的用户操作特征与原有的金融时序数据共同构成金融特征向量;
A4:将金融特征向量按照七比三的比例进行分割,分成训练集和测试集。
3.根据权利要求2所述的基于循环神经网络与注意力机制的金融用户画像方法,其特征在于,所述步骤A1中,对金融时序数据的清洗和补齐操作是以时间戳为依据的;
具体包括:
A11:使用MYSQL连接查询语句、条件查询语句及删除语句,剔除冗余数据;
A12:使用MYSQL连接查询语句、条件查询语句及删除语句,剔除不一致数据;
A13:使用MYSQL连接查询语句、条件查询语句及插入语句,补齐缺失数据。
4.根据权利要求2所述基于循环神经网络与注意力机制的金融用户画像方法,其特征在于,步骤A3中所述生成隐含的用户操作特征,具体包括:
A31:生成统计类的用户操作特征,包括鼠标点击频率及交易频率;
A32:生成复合操作类的用户操作特征,包括截图命令及窗口切换。
5.根据权利要求1所述的基于循环神经网络与注意力机制的金融用户画像方法,其特征在于,步骤B所述使用可视化技术、聚类算法构建出金融用户标签系统,具体包括:
B1:使用可视化方法对金融特征数据进行展示分析,从中选取特征构成金融用户事实类标签;金融用户操作数据的事实类标签包含某个操作视图停留时间、某个产品的购买时间段及控件点击频率;金融用户基础数据的内容包括年龄段及出身地城市;
B2:使用聚类算法对金融特征数据进行聚类计算,选取聚类结果中占比高的金融特征向量,得到学习类标签;
B3:从金融公司的业务需求说明书中提取出现频率高的关键词,构建金融营销模型类标签。
6.根据权利要求1所述的基于循环神经网络与注意力机制的金融用户画像方法,其特征在于,所述步骤C具体包括:
C1:针对金融特征向量中的控件信息,使用Embedding机制进行变换得到控件信息的稠密向量;
C2:通过计算控件信息的稠密向量的平均值,得到用户操作信息的稠密向量。
7.根据权利要求1所述的基于循环神经网络与注意力机制的金融用户画像方法,其特征在于,所述步骤D具体包括:
D1:将用户操作信息的稠密向量输出到循环神经网络,由循环神经网络迭代地输出隐藏层向量;
D2:将循环神经网络的每一个时间步输出的隐藏层向量作为注意力机制的输入,对金融用户操作在“时间”维度进行注意力的学习,计算得到时序操作相似度权值;
D3:注意力机制进一步对隐藏层向量与时序操作相似度权值进行加权计算,输出一组多维向量,再通过SoftMax函数对这组多维向量归一化得到金融用户画像标签结果;
D4:通过对金融用户画像模型的标签值输出,更新准确率;其中,准确率的初始值为0%。
CN202110476016.XA 2021-04-29 2021-04-29 基于循环神经网络与注意力机制的金融用户画像方法 Active CN113468203B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110476016.XA CN113468203B (zh) 2021-04-29 2021-04-29 基于循环神经网络与注意力机制的金融用户画像方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110476016.XA CN113468203B (zh) 2021-04-29 2021-04-29 基于循环神经网络与注意力机制的金融用户画像方法

Publications (2)

Publication Number Publication Date
CN113468203A true CN113468203A (zh) 2021-10-01
CN113468203B CN113468203B (zh) 2022-10-04

Family

ID=77870531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110476016.XA Active CN113468203B (zh) 2021-04-29 2021-04-29 基于循环神经网络与注意力机制的金融用户画像方法

Country Status (1)

Country Link
CN (1) CN113468203B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117422530A (zh) * 2023-12-19 2024-01-19 深圳华强电子交易网络有限公司 电子元器件信息推送方法、装置及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145006A (zh) * 2019-12-26 2020-05-12 南京三百云信息科技有限公司 基于用户画像的汽车金融反欺诈模型训练方法和装置
CN111428026A (zh) * 2020-02-20 2020-07-17 西安电子科技大学 一种多标签文本分类处理方法及系统、信息数据处理终端
CN111475546A (zh) * 2020-04-09 2020-07-31 大连海事大学 一种基于双阶段注意力机制生成对抗网络的金融时间序列预测方法
CN111581368A (zh) * 2019-02-19 2020-08-25 中国科学院信息工程研究所 一种基于卷积神经网络的面向智能专家推荐的用户画像方法
CN112016616A (zh) * 2020-08-27 2020-12-01 西华大学 一种高频金融时序序列多类别预测方法
CN112416956A (zh) * 2020-11-19 2021-02-26 重庆邮电大学 一种基于bert和独立循环神经网络的问句分类方法
CN112560277A (zh) * 2020-12-23 2021-03-26 华东师范大学 一种基于领域特定建模语言adsml的汽车自动驾驶场景建模方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581368A (zh) * 2019-02-19 2020-08-25 中国科学院信息工程研究所 一种基于卷积神经网络的面向智能专家推荐的用户画像方法
CN111145006A (zh) * 2019-12-26 2020-05-12 南京三百云信息科技有限公司 基于用户画像的汽车金融反欺诈模型训练方法和装置
CN111428026A (zh) * 2020-02-20 2020-07-17 西安电子科技大学 一种多标签文本分类处理方法及系统、信息数据处理终端
CN111475546A (zh) * 2020-04-09 2020-07-31 大连海事大学 一种基于双阶段注意力机制生成对抗网络的金融时间序列预测方法
CN112016616A (zh) * 2020-08-27 2020-12-01 西华大学 一种高频金融时序序列多类别预测方法
CN112416956A (zh) * 2020-11-19 2021-02-26 重庆邮电大学 一种基于bert和独立循环神经网络的问句分类方法
CN112560277A (zh) * 2020-12-23 2021-03-26 华东师范大学 一种基于领域特定建模语言adsml的汽车自动驾驶场景建模方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117422530A (zh) * 2023-12-19 2024-01-19 深圳华强电子交易网络有限公司 电子元器件信息推送方法、装置及电子设备
CN117422530B (zh) * 2023-12-19 2024-03-26 深圳华强电子交易网络有限公司 电子元器件信息推送方法、装置及电子设备

Also Published As

Publication number Publication date
CN113468203B (zh) 2022-10-04

Similar Documents

Publication Publication Date Title
CN113345080A (zh) 一种供应商画像建模方法及系统
CN112836509A (zh) 一种专家系统知识库构建方法及系统
CN115688920A (zh) 知识抽取方法、模型的训练方法、装置、设备和介质
CN116861924A (zh) 基于人工智能的项目风险预警方法及系统
CN116468460A (zh) 基于人工智能的消费金融客户画像识别系统及其方法
CN113468203B (zh) 基于循环神经网络与注意力机制的金融用户画像方法
CN113157853B (zh) 问题挖掘方法、装置、电子设备及存储介质
CN113032676B (zh) 基于微反馈的推荐方法和系统
CN113674846A (zh) 基于lstm网络的医院智慧服务舆情监控平台
CN111626331B (zh) 一种自动化行业分类装置及其工作方法
CN117237095A (zh) 基于大数据分析的小微金融行业风险预警与监测平台
CN110705638A (zh) 一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法
CN115994684A (zh) 一种企业风险的评估方法、装置、计算机设备及介质
CN115034762A (zh) 一种岗位推荐方法、装置、存储介质、电子设备及产品
CN115619245A (zh) 一种基于数据降维方法的画像构建和分类方法及系统
CN112328899B (zh) 信息处理方法、信息处理装置、存储介质与电子设备
Zhang et al. Extending associative classifier to detect helpful online reviews with uncertain classes
CN113723093B (zh) 人员管理策略推荐方法、装置、计算机设备及存储介质
CN117172232B (zh) 审计报告生成方法、装置、设备和存储介质
CN116186702B (zh) 基于协同注意力的恶意软件分类方法和装置
CN115187130B (zh) 基于鼠标运动轨迹判断工作效率的方法和装置
CN114298427B (zh) 企业属性数据预测方法、装置、电子设备及存储介质
CN117893239A (zh) 基于人工智能的商品价格预测方法及系统
CN115374862A (zh) 信息处理方法及装置、电子设备和存储介质
CN117196842A (zh) 基于因果关系图神经网络的股票特征分析系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant