CN111415236B - 基于云计算的区块链大数据金融用户标签估计方法及系统 - Google Patents

基于云计算的区块链大数据金融用户标签估计方法及系统 Download PDF

Info

Publication number
CN111415236B
CN111415236B CN202010184768.4A CN202010184768A CN111415236B CN 111415236 B CN111415236 B CN 111415236B CN 202010184768 A CN202010184768 A CN 202010184768A CN 111415236 B CN111415236 B CN 111415236B
Authority
CN
China
Prior art keywords
network
consumption
feature
correlation coefficient
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010184768.4A
Other languages
English (en)
Other versions
CN111415236A (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI NEWTOUCH SOFTWARE Co.,Ltd.
Original Assignee
Shanghai Newtouch Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Newtouch Software Co ltd filed Critical Shanghai Newtouch Software Co ltd
Priority to CN202010184768.4A priority Critical patent/CN111415236B/zh
Publication of CN111415236A publication Critical patent/CN111415236A/zh
Application granted granted Critical
Publication of CN111415236B publication Critical patent/CN111415236B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于云计算的区块链大数据金融用户标签估计方法及系统,所述方法包括:云计算终端爬虫得到用户的多项消费数据,将多项所述消费数据发送至客户端;其中,消费数据包括消费项目、消费时间、消费金额;客户端获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签;客户端将用户标签存储到区块链中。通过采用以上方案,依照消费项目、消费时间、消费金额输入上述的标签估计模型中,得到的用户标签可以准确反映用户的消费情况。

Description

基于云计算的区块链大数据金融用户标签估计方法及系统
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种基于云计算的区块链大数据金融用户标签估计方法及系统。
背景技术
用户的维护对于运营商来说是一个重要指标。然而,用户的流动性大,可控性差,银行、证券公司等金融服务运营商需要对用户进行维护,就需要了解用户的消费习惯和动作。一般的,金融服务运营商通常对用户进行标签化,然后针对不同的标签类别的用户采用相对应的维护措施。
现有技术中,主要依靠用户的消费动作来确定用户的标签,主要采用的方法有对用户的消费动作数据进行清洗,挑选运营商认为有用的消费动作数据作为预测用户标签的依托。然而用户的每一个动作都是有意义的,如果剔除掉用户的一些消费动作数据,仅仅挑选部分消费动作数据作为预测用户标签的依托,每个用户的消费动作数据项目是一样的,得出的用户标签并不能准确反映出用户的消费、理财情况。而且,每个用户的消费动作数据是不一致的,每个用户的消费事项是有区别的,因此,每个用户都采用相同的消费动作数据项目作为用户标签的确定基准数据,确定出的用户标签并不能准确反映出用户的消费、理财情况,在大数据时代,大数据用户多,要对准确获得每个用户的用户标签也不容易。
发明内容
本发明的目的在于提供了一种基于云计算的区块链大数据金融用户标签估计方法及系统,用以至少解决现有技术中存在的上述问题。
第一方面,本发明实施例提供了一种基于云计算的区块链大数据金融用户标签估计方法,包括:
云计算终端爬虫得到用户的多项消费数据,将多项所述消费数据发送至客户端;消费数据包括消费项目、消费时间、消费金额;
客户端获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签;
客户端将用户标签存储到区块链中。
可选的,客户端获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签,具体为:
客户端依次输入标签估计模型中,标签估计模型包括特征分离估计网络、相关系数网络、特征预测网络、金额权值网络和标签配置网络;
客户端依次输入标签估计模型中具体为:
按照消费时间的先后顺序,依次将消费数据的消费项目和消费金额作为特征分离估计网络,特征分离估计网络根据消费项目得到项目初特征,根据消费金额和消费项目得到金额特征;相关系数网络根据两个相邻的特征分离估计网络输出的项目初特征,获得两个消费时间相邻的消费项目之间的相关系数,特征预测网络根据相关系数和项目初特征获得每个消费项目的项目终特征;
金额权值网络根据金额特征获得金额权值;
标签配置网络根据项目终特征和金额权值得到用户的用户标签。
可选的,标签估计模型包括多个特征分离估计网络、多个相关系数网络、多个特征预测网络、多个金额权值网络和一个标签配置网络;特征分离估计网络的数量与消费数据的数量一致;多个特征分离估计网络与多个相关系数网络一一对应,多个相关系数网络与多个特征预测网络一一对应,多个金额权值网络与多个特征预测网络一一对应;
特征预测网络的输入是与其对应的特征分离估计网络相邻的特征分离估计网络的输出。
可选的,一一对应的特征分离估计网络、特征预测网络、金额权值网络作为一组网络连,每组网络连对应一个消费数据,若输入的消费数据的数量大于网络连的数量不相同,标签估计模型自动增加网络连,构建更加庞大的标签估计模型,以使消费数据的数量等于网络连的数量。
可选的,多个特征分离估计网络包括第一特征分离估计网络、第二特征分离估计网络和第三特征分离估计网络,多个相关系数网络包括第一相关系数网络、第二相关系数网络和第三相关系数网络,多个特征预测网络包括第一特征预测网络、第二特征预测网络和第三特征预测网络,多个金额权值网络包括第一金额权值网络、第二金额权值网络和第三金额权值网络;消费数据包括第一数据、第二数据和第三数据,第一数据是用户的消费数据中消费时间最早的消费数据;第二数据的消费时间晚于第一数据的消费时间,第三数据的消费时间晚于第二数据的消费时间;
按照消费时间的先后顺序,依次将消费数据的消费项目和消费金额作为特征分离估计网络,特征分离估计网络根据消费项目得到项目初特征,根据消费金额和消费项目得到金额特征,包括:
将第一数据输入第一特征分离估计网络中,第一特征分离估计网络根据第一数据的消费项目得到第一项目初特征,根据第一数据的消费金额和消费项目得到第一金额特征;将第二数据输入第二特征分离估计网络中,第二特征分离估计网络根据第二数据的消费项目得到第二项目初特征,根据第二数据的消费金额和消费项目得到第二金额特征;将第三数据输入第三特征分离估计网络中,第三特征分离估计网络根据第三数据的消费项目得到第三项目初特征,根据第三数据的消费金额和消费项目得到第三金额特征。
可选的,相关系数网络根据两个相邻的特征分离估计网络输出的项目初特征,获得两个消费时间相邻的消费项目之间的相关系数,特征预测网络根据相关系数和项目初特征获得每个消费项目的项目终特征;金额权值网络根据金额特征获得金额权值;包括:
第一相关系数网络根据第一项目初特征和第二项目初特征,得到第一特征分离估计网络与第二特征分离估计网络的第一相关系数;第一特征预测网络根据第一相关系数和第一项目初特征得到第一项目终特征;第一金额权值网络根据第一金额特征获得第一金额权值;
第二相关系数网络根据第一项目初特征、第二项目初特征和第三项目初特征,得到第二特征分离估计网络与第一特征分离估计网络和第三特征分离估计网络的第二相关系数;第二特征预测网络根据第二相关系数和第二项目初特征得到第二项目终特征;第二金额权值网络根据第二金额特征获得第二金额权值;
第三相关系数网络根据第三项目初特征和第二项目初特征,得到第三特征分离估计网络与第二特征分离估计网络的第三相关系数;第三特征预测网络根据第三相关系数和第三项目初特征得到第三项目终特征;第三金额权值网络根据第三金额特征获得第三金额权值。
可选的,标签配置网络根据项目终特征和金额权值得到用户的用户标签,包括:
标签配置网络根据以第一金额权值、第二金额权值和第三金额权值作为加权取值,对第一项目终特征、第二项目终特征和第三项目终特征进行加权融合,得到用户的用户标签。
第二方面,本发明实施例提供了一种基于云计算的区块链大数据金融用户标签估计系统,包括:
云计算终端,用于爬虫得到用户的多项消费数据,将多项所述消费数据发送至客户端;消费数据包括消费项目、消费时间、消费金额;
客户端,用于获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签;
客户端,还用于将用户标签存储到区块链中。
可选的,客户端获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签,具体为:
客户端依次输入标签估计模型中,标签估计模型包括特征分离估计网络、相关系数网络、特征预测网络、金额权值网络和标签配置网络;
客户端依次输入标签估计模型中具体为:
按照消费时间的先后顺序,依次将消费数据的消费项目和消费金额作为特征分离估计网络,特征分离估计网络根据消费项目得到项目初特征,根据消费金额和消费项目得到金额特征;相关系数网络根据两个相邻的特征分离估计网络输出的项目初特征,获得两个消费时间相邻的消费项目之间的相关系数,特征预测网络根据相关系数和项目初特征获得每个消费项目的项目终特征;
金额权值网络根据金额特征获得金额权值;
标签配置网络根据项目终特征和金额权值得到用户的用户标签。
可选的,标签估计模型包括多个特征分离估计网络、多个相关系数网络、多个特征预测网络、多个金额权值网络和一个标签配置网络;特征分离估计网络的数量与消费数据的数量一致;多个特征分离估计网络与多个相关系数网络一一对应,多个相关系数网络与多个特征预测网络一一对应,多个金额权值网络与多个特征预测网络一一对应;
特征预测网络的输入是与其对应的特征分离估计网络相邻的特征分离估计网络的输出。
相较于现有技术,本发明达到的有益效果是:
本发明实施例提供了一种基于云计算的区块链大数据金融用户标签估计方法及系统,所述方法包括:云计算终端爬虫得到用户的多项消费数据,将多项所述消费数据发送至客户端;其中,消费数据包括消费项目、消费时间、消费金额;客户端获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签;客户端将用户标签存储到区块链中。通过采用以上方案,依照消费项目、消费时间、消费金额输入上述的标签估计模型中,得到的用户标签可以准确反映用户的消费情况。
附图说明
图1是本发明实施例提供的一种基于云计算的区块链大数据金融用户标签估计方法的流程图。
图2是本发明实施例提供的标签估计模型的结构示意图。
图3是本发明实施例提供的一种基于云计算的区块链大数据金融用户标签估计系统的示意图。
图中标记:基于云计算的区块链大数据金融用户标签估计系统200;客户端210;云计算终端220;区块链300。
具体实施方式
下面结合附图,对本发明作详细的说明。
本发明实施例提供了一种基于云计算的区块链大数据金融用户标签估计方法,如图1所示,基于云计算的区块链大数据金融用户标签估计方法包括:
S101:云计算终端爬虫得到用户的多项消费数据,将多项所述消费数据发送至客户端。其中,消费数据包括消费项目、消费时间、消费金额。
S102:客户端获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签。
S103:客户端将用户标签存储到区块链中。
通过采用以上方案,依照消费项目、消费时间、消费金额输入上述的标签估计模型中,得到的用户标签可以准确反映用户的消费情况。
其中,客户端获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签,具体为:客户端依次输入标签估计模型中,标签估计模型包括特征分离估计网络、相关系数网络、特征预测网络、金额权值网络和标签配置网络,客户端依次输入标签估计模型中具体为:按照消费时间的先后顺序,依次将消费数据的消费项目和消费金额作为特征分离估计网络,特征分离估计网络根据消费项目得到项目初特征,根据消费金额和消费项目得到金额特征;相关系数网络根据两个相邻的特征分离估计网络输出的项目初特征,获得两个消费时间相邻的消费项目之间的相关系数,特征预测网络根据相关系数和项目初特征获得每个消费项目的项目终特征;金额权值网络根据金额特征获得金额权值;标签配置网络根据项目终特征和金额权值得到用户的用户标签。
如此,得到的用户标签考虑到了用户在一段时间的消费行为,同时,每一个消费行为的消费情况(项目终特征反映了用户的消费行为的情况)会受到之前和之后的消费行为的影响,因为用户在消费时,会根据历史的消费记录调整后面的消费记录,今天的消费行为也会受到对未来的消费行为的规划的影响,因此,特征预测网络根据项目初特征获得两个消费时间相邻的消费项目之间的相关系数,根据相关系数和项目初特征获得每个消费项目的项目终特征,得到的项目终特征可以准确反映了用户的消费行为的情况。
在本发明实施例中,如图2所示,标签估计模型包括多个特征分离估计网络、多个相关系数网络、多个特征预测网络、多个金额权值网络和一个标签配置网络;特征分离估计网络的数量与消费数据的数量一致;多个特征分离估计网络与多个相关系数网络一一对应,多个相关系数网络与多个特征预测网络一一对应,多个金额权值网络与多个特征预测网络一一对应;特征预测网络的输入是与其对应的特征分离估计网络相邻的特征分离估计网络的输出。一一对应的特征分离估计网络、相关系数网络、特征预测网络、金额权值网络作为一组网络连,每组网络连对应一个消费数据。
在本发明实施例中,若输入的消费数据的数量与网络连的数量不相同,标签估计模型可以自动增加网络连,构建更加庞大的标签估计模型。例如,输入的消费数据有5个,而网络连只有4个,那么自动增加标签估计模型中的网络连,并将增加的网络连按照标签估计模型中原有的网络连的连接方式连接,构成更一个包括5组网络连的标签估计模型,以使得得到的用户标签能够全面考虑到所有的消费数据带来的影响。
作为一个实施例,具体的,例如,某个用户有3个消费数据,3个消费数据依照消费时间的排序依次是第一数据、第二数据和第三数据。
客户端先检测标签估计模型中有多少个网络连,若签估计模型中的网络连的数量小于消费数据的数量3,则自动增加网络连的数量,并按照上述的检测标签估计模型的结构生成规模更大的检测标签估计模型,即生成有网络连的数量等于消费数据的数量的标签估计模型。增加后的标签估计模型包括第一网络连、第二网络连、第三网络连。多个特征分离估计网络包括第一特征分离估计网络、第二特征分离估计网络和第三特征分离估计网络,多个相关系数网络包括第一相关系数网络、第二相关系数网络和第三相关系数网络,多个特征预测网络包括第一特征预测网络、第二特征预测网络和第三特征预测网络,多个金额权值网络包括第一金额权值网络、第二金额权值网络和第三金额权值网络。
第一网络连对应的包括第一特征分离估计网络、第一相关系数网络、第一特征预测网络和第一金额权值网络,第二网络连对应的包括第二特征分离估计网络、第二相关系数网络、第二特征预测网络和第二金额权值网络,第三网络连对应的包括第三特征分离估计网络、第三相关系数网络、第三特征预测网络和第三金额权值网络。第一数据是用户的消费数据中消费时间最早的消费数据。第二数据的消费时间晚于第一数据的消费时间,第三数据的消费时间晚于第二数据的消费时间。
第一数据输入第一特征分离估计网络中,第一特征分离估计网络根据第一数据的消费项目得到第一项目初特征,根据第一数据的消费金额和消费项目得到第一金额特征。第二数据输入第二特征分离估计网络中,第二特征分离估计网络根据第二数据的消费项目得到第二项目初特征,根据第二数据的消费金额和消费项目得到第二金额特征。第三数据输入第三特征分离估计网络中,第三特征分离估计网络根据第三数据的消费项目得到第三项目初特征,根据第三数据的消费金额和消费项目得到第三金额特征。
第一相关系数网络根据第一项目初特征和第二项目初特征,得到第一特征分离估计网络与第二特征分离估计网络的第一相关系数。第一特征预测网络根据第一相关系数和第一项目初特征得到第一项目终特征。第一金额权值网络根据第一金额特征获得第一金额权值。
第二相关系数网络根据第一项目初特征、第二项目初特征和第三项目初特征,得到第二特征分离估计网络与第一特征分离估计网络和第三特征分离估计网络的第二相关系数。第二特征预测网络根据第二相关系数和第二项目初特征得到第二项目终特征。第二金额权值网络根据第二金额特征获得第二金额权值。
第三相关系数网络根据第三项目初特征和第二项目初特征,得到第三特征分离估计网络与第二特征分离估计网络的第三相关系数。第三特征预测网络根据第三相关系数和第三项目初特征得到第三项目终特征。第三金额权值网络根据第三金额特征获得第三金额权值。
标签配置网络根据以第一金额权值、第二金额权值和第三金额权值作为加权取值,对第一项目终特征、第二项目终特征和第三项目终特征进行加权融合,得到用户的用户标签。
其中,第一特征分离估计网络根据第一数据的消费项目得到第一项目初特征,具体为:对第一数据的消费项目添加情感因子,情感因子是一串字,用于预测消费项目的情感倾向,对添加了情感因子后的第一数据的消费项目进行语义分析,得到第一项目初特征。如此第一项目初特征可以预测出用户的消费行为是冲动型的消费行为还是理智计划的消费行为。
根据第一数据的消费金额和消费项目得到第一金额特征,具体为:
T1=t1+cos((t1-T)*π)
其中,T1表示第一金额特征,t1表示第一数据的消费金额,T表示第一数据的消费项目的平均消费金额,第一数据的消费项目的平均消费金额从区块链数据库中获得,π=3.14159。通过采用以上方案,能够避免因为第一数据的消费金额的异常带来的影响,保持第一金额特征的稳定性和可靠性(不过度偏离平均消费水平)。
同样的,第二金额特征和第三金额特征与第一金额特征的计算方式类似,在此不再赘述。
第一相关系数网络根据第一项目初特征和第二项目初特征,得到第一特征分离估计网络与第二特征分离估计网络的第一相关系数,具体为:将第一项目初特征和第二项目初特征分别转换成第一词向量和第二词向量,计算所述第一词向量与所述第二词向量之间的相似度,并将相似度作为第一相关系数。
第一特征预测网络根据第一相关系数和第一项目初特征得到第一项目终特征,具体为:将第一项目初特征转换成第一词向量,将第一词向量第一角度旋转,得到第一项目终特征。如此,第一项目初特征进行微调,得到的第一项目终特征可以准确表示用户的消费类目情况。其中,第一角度为:
Figure BDA0002413772540000091
其中,
Figure BDA0002413772540000092
表示第一角度,q1表示第一相关系数。
第一金额权值网络根据第一金额特征获得第一金额权值,具体为:p1=T1-T,其中,p1为第一金额权值。
第二相关系数网络根据第一项目初特征、第二项目初特征和第三项目初特征,得到第二特征分离估计网络与第一特征分离估计网络和第三特征分离估计网络的第二相关系数,具体为:将第一项目初特征、第二项目初特征和第三项目初特征分别转换成第一词向量、第二词向量和第三词向量,计算所述第一词向量与所述第二词向量之间的第一相似度,计算所述第三词向量与所述第二词向量之间的第二相似度;计算第一金额特征与第二金额特征之间的第一差值,以及第二金额特征与第三金额特征之间的第二差值,按照下述公式计算得到第二相关系数:
Figure BDA0002413772540000093
其中,q2表示第二相关系数,V1表示第一相似度,V2表示第二相似度,d1表示第一差值,d2表示第二差值。
第二特征预测网络根据第二相关系数和第二项目初特征得到第二项目终特征,具体为:将第二项目初特征转换成第二词向量,将第二词向量第二角度旋转,得到第二项目终特征。如此,第二项目初特征进行微调,得到的第二项目终特征可以准确表示用户的消费类目情况。其中,第二角度为:
Figure BDA0002413772540000101
其中,
Figure BDA0002413772540000102
表示第二角度,q2表示第二相关系数。
第二金额权值网络根据第二金额特征获得第二金额权值,具体为:p2=T2-V,其中,T2表示第二金额特征,p2为第二金额权值,V为第二数据的消费项目的消费金额平均值。
第三相关系数网络根据第三项目初特征和第二项目初特征,得到第三特征分离估计网络与第二特征分离估计网络的第三相关系数。具体为:将第二项目初特征和第三项目初特征分别转换成第二词向量和第三词向量,计算所述第三词向量与所述第二词向量之间的第二相似度,以第二相似度作为第二相关系数。
第三特征预测网络根据第三相关系数和第三项目初特征得到第三项目终特征,具体为将第三项目初特征转换成第三词向量,将第三词向量第三角度旋转,得到第三项目终特征。如此,第三项目初特征进行微调,得到的第三项目终特征可以准确表示用户的消费类目情况。其中,第三角度为:
Figure BDA0002413772540000103
其中,
Figure BDA0002413772540000104
表示第三角度,q3表示第三相关系数。
第三金额权值网络根据第三金额特征获得第三金额权值,具体为:p3=T3-W,其中,T3表示第三金额特征,p3为第三金额权值,W为第三数据的消费项目的消费金额平均值。
标签配置网络根据以第一金额权值、第二金额权值和第三金额权值作为加权取值,对第一项目终特征、第二项目终特征和第三项目终特征进行加权融合,得到用户的用户标签,具体
将第一项目终特征、第二项目终特征和第三项目终特征分别转换成第一词向量、第二词向量和第三词向量,以第一金额权值、第二金额权值和第三金额权值作为加权取值,对第一词向量、第二词向量和第三词向量进行加权求和,得到融合词向量,将融合词向量进行语义分析,得到用户的用户标签。具体按照公式获得融合词向量:
Figure BDA0002413772540000105
其中,H表示融合词向量,N1、N2、N3分别表示第一词向量、第二词向量和第三词向量。如此,得到的用户标签可以准确表征和描述用户的消费特征和消费行为情况。
通过采用以上方案,本发明实施例提出的标签估计模型不需要采用大量的历史数据进行训练,节省了资源,同时因为不依赖于历史数据的训练,其适应性好,对不同的用户,只要获得用户的消费数据,标签估计模型自动根据消费数据的数量调整标签估计模型的规模,以使标签估计模型与用户匹配,能够准确获得用户的用户标签。
本发明实施例还提供了一种基于云计算的区块链大数据金融用户标签估计系统200,用于执行上述的基于云计算的区块链大数据金融用户标签估计方法,如图3所示,所述系统包括客户端210和云计算终端220,其中:
云计算终端220,用于爬虫得到用户的多项消费数据,将多项所述消费数据发送至客户端210;消费数据包括消费项目、消费时间、消费金额;
客户端210,用于获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签;
客户端210,还用于将用户标签存储到区块链300中。
可选的,客户端210获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签,具体为:
客户端210依次输入标签估计模型中,标签估计模型包括特征分离估计网络、相关系数网络、特征预测网络、金额权值网络和标签配置网络。
客户端210依次输入标签估计模型中具体为:按照消费时间的先后顺序,依次将消费数据的消费项目和消费金额作为特征分离估计网络,特征分离估计网络根据消费项目得到项目初特征,根据消费金额和消费项目得到金额特征;相关系数网络根据两个相邻的特征分离估计网络输出的项目初特征,获得两个消费时间相邻的消费项目之间的相关系数,特征预测网络根据相关系数和项目初特征获得每个消费项目的项目终特征;金额权值网络根据金额特征获得金额权值;标签配置网络根据项目终特征和金额权值得到用户的用户标签。
标签估计模型包括多个特征分离估计网络、多个相关系数网络、多个特征预测网络、多个金额权值网络和一个标签配置网络;特征分离估计网络的数量与消费数据的数量一致;多个特征分离估计网络与多个相关系数网络一一对应,多个相关系数网络与多个特征预测网络一一对应,多个金额权值网络与多个特征预测网络一一对应;特征预测网络的输入是与其对应的特征分离估计网络相邻的特征分离估计网络的输出。
其中,所述的每个执行的步骤的具体方式如上基于云计算的区块链大数据金融用户标签估计方法所述,在此不再赘述。

Claims (3)

1.一种基于云计算的区块链大数据金融用户标签估计方法,其特征在于,包括:
云计算终端爬虫得到用户的多项消费数据,将多项所述消费数据发送至客户端;消费数据包括消费项目、消费时间、消费金额;
客户端获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签;
客户端将用户标签存储到区块链中;
客户端获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签,具体为:
客户端依次输入标签估计模型中,标签估计模型包括特征分离估计网络、相关系数网络、特征预测网络、金额权值网络和标签配置网络;
客户端依次输入标签估计模型中具体为:
按照消费时间的先后顺序,依次将消费数据的消费项目和消费金额作为特征分离估计网络,特征分离估计网络根据消费项目得到项目初特征,根据消费金额和消费项目得到金额特征;相关系数网络根据两个相邻的特征分离估计网络输出的项目初特征,获得两个消费时间相邻的消费项目之间的相关系数,特征预测网络根据相关系数和项目初特征获得每个消费项目的项目终特征;
金额权值网络根据金额特征获得金额权值;
标签配置网络根据项目终特征和金额权值得到用户的用户标签;
相关系数网络根据两个相邻的特征分离估计网络输出的项目初特征,获得两个消费时间相邻的消费项目之间的相关系数,特征预测网络根据相关系数和项目初特征获得每个消费项目的项目终特征;金额权值网络根据金额特征获得金额权值;包括:
第一相关系数网络根据第一项目初特征和第二项目初特征,得到第一特征分离估计网络与第二特征分离估计网络的第一相关系数;第一特征预测网络根据第一相关系数和第一项目初特征得到第一项目终特征;第一金额权值网络根据第一金额特征获得第一金额权值;第一特征预测网络根据第一相关系数和第一项目初特征得到第一项目终特征具体为:将第一项目初特征转换成第一词向量,将第一词向量第一角度旋转,得到第一项目终特征;其中,第一角度为:
Figure FDA0002956797100000021
其中,
Figure FDA0002956797100000022
表示第一角度,q1表示第一相关系数;
第二相关系数网络根据第一项目初特征、第二项目初特征和第三项目初特征,得到第二特征分离估计网络与第一特征分离估计网络和第三特征分离估计网络的第二相关系数;第二特征预测网络根据第二相关系数和第二项目初特征得到第二项目终特征;第二金额权值网络根据第二金额特征获得第二金额权值;
第三相关系数网络根据第三项目初特征和第二项目初特征,得到第三特征分离估计网络与第二特征分离估计网络的第三相关系数;第三特征预测网络根据第三相关系数和第三项目初特征得到第三项目终特征;第三金额权值网络根据第三金额特征获得第三金额权值;
第一相关系数网络根据第一项目初特征和第二项目初特征,得到第一特征分离估计网络与第二特征分离估计网络的第一相关系数,具体为:将第一项目初特征和第二项目初特征分别转换成第一词向量和第二词向量,计算所述第一词向量与所述第二词向量之间的相似度,并将相似度作为第一相关系数;
标签估计模型包括多个特征分离估计网络、多个相关系数网络、多个特征预测网络、多个金额权值网络和一个标签配置网络;特征分离估计网络的数量与消费数据的数量一致;多个特征分离估计网络与多个相关系数网络一一对应,多个相关系数网络与多个特征预测网络一一对应,多个金额权值网络与多个特征预测网络一一对应;
特征预测网络的输入是与其对应的特征分离估计网络相邻的特征分离估计网络的输出;
一一对应的特征分离估计网络、特征预测网络、金额权值网络作为一组网络连,每组网络连对应一个消费数据,若输入的消费数据的数量大于网络连的数量不相同,标签估计模型自动增加网络连,构建更加庞大的标签估计模型,以使消费数据的数量等于网络连的数量;
多个特征分离估计网络包括第一特征分离估计网络、第二特征分离估计网络和第三特征分离估计网络,多个相关系数网络包括第一相关系数网络、第二相关系数网络和第三相关系数网络,多个特征预测网络包括第一特征预测网络、第二特征预测网络和第三特征预测网络,多个金额权值网络包括第一金额权值网络、第二金额权值网络和第三金额权值网络;消费数据包括第一数据、第二数据和第三数据,第一数据是用户的消费数据中消费时间最早的消费数据;第二数据的消费时间晚于第一数据的消费时间,第三数据的消费时间晚于第二数据的消费时间;
按照消费时间的先后顺序,依次将消费数据的消费项目和消费金额作为特征分离估计网络,特征分离估计网络根据消费项目得到项目初特征,根据消费金额和消费项目得到金额特征,包括:
将第一数据输入第一特征分离估计网络中,第一特征分离估计网络根据第一数据的消费项目得到第一项目初特征,根据第一数据的消费金额和消费项目得到第一金额特征;将第二数据输入第二特征分离估计网络中,第二特征分离估计网络根据第二数据的消费项目得到第二项目初特征,根据第二数据的消费金额和消费项目得到第二金额特征;将第三数据输入第三特征分离估计网络中,第三特征分离估计网络根据第三数据的消费项目得到第三项目初特征,根据第三数据的消费金额和消费项目得到第三金额特征。
2.根据权利要求1所述的方法,其特征在于,标签配置网络根据项目终特征和金额权值得到用户的用户标签,包括:
标签配置网络根据以第一金额权值、第二金额权值和第三金额权值作为加权取值,对第一项目终特征、第二项目终特征和第三项目终特征进行加权融合,得到用户的用户标签。
3.一种基于云计算的区块链大数据金融用户标签估计系统,其特征在于,包括:
云计算终端,用于爬虫得到用户的多项消费数据,将多项所述消费数据发送至客户端;消费数据包括消费项目、消费时间、消费金额;
客户端,用于获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签;
客户端,还用于将用户标签存储到区块链中;
客户端获得每两个消费时间相邻的消费项目之间的相关系数,根据所述相关系数和所述消费项目得到项目特征;根据项目特征和消费金额,获得用户的用户标签,具体为:
客户端依次输入标签估计模型中,标签估计模型包括特征分离估计网络、相关系数网络、特征预测网络、金额权值网络和标签配置网络;
客户端依次输入标签估计模型中具体为:
按照消费时间的先后顺序,依次将消费数据的消费项目和消费金额作为特征分离估计网络,特征分离估计网络根据消费项目得到项目初特征,根据消费金额和消费项目得到金额特征;相关系数网络根据两个相邻的特征分离估计网络输出的项目初特征,获得两个消费时间相邻的消费项目之间的相关系数,特征预测网络根据相关系数和项目初特征获得每个消费项目的项目终特征;
金额权值网络根据金额特征获得金额权值;
标签配置网络根据项目终特征和金额权值得到用户的用户标签;
相关系数网络根据两个相邻的特征分离估计网络输出的项目初特征,获得两个消费时间相邻的消费项目之间的相关系数,特征预测网络根据相关系数和项目初特征获得每个消费项目的项目终特征;金额权值网络根据金额特征获得金额权值;包括:
第一相关系数网络根据第一项目初特征和第二项目初特征,得到第一特征分离估计网络与第二特征分离估计网络的第一相关系数;第一特征预测网络根据第一相关系数和第一项目初特征得到第一项目终特征;第一金额权值网络根据第一金额特征获得第一金额权值;
第二相关系数网络根据第一项目初特征、第二项目初特征和第三项目初特征,得到第二特征分离估计网络与第一特征分离估计网络和第三特征分离估计网络的第二相关系数;第二特征预测网络根据第二相关系数和第二项目初特征得到第二项目终特征;第二金额权值网络根据第二金额特征获得第二金额权值;
第三相关系数网络根据第三项目初特征和第二项目初特征,得到第三特征分离估计网络与第二特征分离估计网络的第三相关系数;第三特征预测网络根据第三相关系数和第三项目初特征得到第三项目终特征;第三金额权值网络根据第三金额特征获得第三金额权值;
第一相关系数网络根据第一项目初特征和第二项目初特征,得到第一特征分离估计网络与第二特征分离估计网络的第一相关系数,具体为:将第一项目初特征和第二项目初特征分别转换成第一词向量和第二词向量,计算所述第一词向量与所述第二词向量之间的相似度,并将相似度作为第一相关系数;
其中,第一特征预测网络根据第一相关系数和第一项目初特征得到第一项目终特征,具体为:将第一项目初特征转换成第一词向量,将第一词向量第一角度旋转,得到第一项目终特征;其中,第一角度为:
Figure FDA0002956797100000051
其中,
Figure FDA0002956797100000052
表示第一角度,q1表示第一相关系数;
标签估计模型包括多个特征分离估计网络、多个相关系数网络、多个特征预测网络、多个金额权值网络和一个标签配置网络;特征分离估计网络的数量与消费数据的数量一致;多个特征分离估计网络与多个相关系数网络一一对应,多个相关系数网络与多个特征预测网络一一对应,多个金额权值网络与多个特征预测网络一一对应;
特征预测网络的输入是与其对应的特征分离估计网络相邻的特征分离估计网络的输出;
一一对应的特征分离估计网络、特征预测网络、金额权值网络作为一组网络连,每组网络连对应一个消费数据,若输入的消费数据的数量大于网络连的数量不相同,标签估计模型自动增加网络连,构建更加庞大的标签估计模型,以使消费数据的数量等于网络连的数量;
多个特征分离估计网络包括第一特征分离估计网络、第二特征分离估计网络和第三特征分离估计网络,多个相关系数网络包括第一相关系数网络、第二相关系数网络和第三相关系数网络,多个特征预测网络包括第一特征预测网络、第二特征预测网络和第三特征预测网络,多个金额权值网络包括第一金额权值网络、第二金额权值网络和第三金额权值网络;消费数据包括第一数据、第二数据和第三数据,第一数据是用户的消费数据中消费时间最早的消费数据;第二数据的消费时间晚于第一数据的消费时间,第三数据的消费时间晚于第二数据的消费时间;
按照消费时间的先后顺序,依次将消费数据的消费项目和消费金额作为特征分离估计网络,特征分离估计网络根据消费项目得到项目初特征,根据消费金额和消费项目得到金额特征,包括:
将第一数据输入第一特征分离估计网络中,第一特征分离估计网络根据第一数据的消费项目得到第一项目初特征,根据第一数据的消费金额和消费项目得到第一金额特征;将第二数据输入第二特征分离估计网络中,第二特征分离估计网络根据第二数据的消费项目得到第二项目初特征,根据第二数据的消费金额和消费项目得到第二金额特征;将第三数据输入第三特征分离估计网络中,第三特征分离估计网络根据第三数据的消费项目得到第三项目初特征,根据第三数据的消费金额和消费项目得到第三金额特征。
CN202010184768.4A 2020-03-17 2020-03-17 基于云计算的区块链大数据金融用户标签估计方法及系统 Active CN111415236B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010184768.4A CN111415236B (zh) 2020-03-17 2020-03-17 基于云计算的区块链大数据金融用户标签估计方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010184768.4A CN111415236B (zh) 2020-03-17 2020-03-17 基于云计算的区块链大数据金融用户标签估计方法及系统

Publications (2)

Publication Number Publication Date
CN111415236A CN111415236A (zh) 2020-07-14
CN111415236B true CN111415236B (zh) 2021-09-14

Family

ID=71494277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010184768.4A Active CN111415236B (zh) 2020-03-17 2020-03-17 基于云计算的区块链大数据金融用户标签估计方法及系统

Country Status (1)

Country Link
CN (1) CN111415236B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204603B (zh) * 2021-05-21 2024-02-02 中国光大银行股份有限公司 金融数据资产的类别标注方法及装置
CN113935787A (zh) * 2021-12-15 2022-01-14 山东柏源技术有限公司 基于关联规则挖掘算法的财务信息管理系统
CN114897517B (zh) * 2022-07-18 2022-09-27 山东美丽乡村云计算有限公司 基于区块链的文旅消费数据管理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107316200B (zh) * 2016-04-26 2020-07-03 阿里巴巴集团控股有限公司 一种分析用户行为周期的方法和装置
CN109615432A (zh) * 2018-12-14 2019-04-12 成都德迈安科技有限公司 基于大数据的消费者行为画像工具
CN110264270B (zh) * 2019-06-20 2020-09-01 京东数字科技控股有限公司 一种行为预测方法、装置、设备和存储介质
CN110503531B (zh) * 2019-08-30 2022-04-19 中国科学技术大学 时序感知的动态社交场景推荐方法

Also Published As

Publication number Publication date
CN111415236A (zh) 2020-07-14

Similar Documents

Publication Publication Date Title
CN111415236B (zh) 基于云计算的区块链大数据金融用户标签估计方法及系统
Krapp et al. Forecasting product returns in closed‐loop supply chains
US8473432B2 (en) Issue resolution in expert networks
CN110310163A (zh) 一种精准制定营销策略的方法、设备及可读介质
CN111160968A (zh) Sku级别商品销量预测方法及装置
CN104572734A (zh) 问题推荐方法、装置及系统
WO2022100518A1 (zh) 一种基于用户画像的物品推荐方法和装置
US20190080352A1 (en) Segment Extension Based on Lookalike Selection
US11651291B2 (en) Real-time predictions based on machine learning models
Chen et al. Exploration and mining evaluation system and price prediction of uranium resources
CN115146764A (zh) 一种预测模型的训练方法、装置、电子设备及存储介质
CN114971716A (zh) 服务接口质量评估方法及其装置、设备、介质、产品
Ilonen et al. Toward automatic forecasts for diffusion of innovations
CN103649942A (zh) 利用参数估计的零售预估
Xu et al. Machine learning-driven apps recommendation for energy optimization in green communication and networking for connected and autonomous vehicles
US20210241047A1 (en) Determining rationale for a prediction of a machine learning based model
CN107644042B (zh) 软件程序点击率预估排序方法及服务器
CN111724241A (zh) 基于动态边特征增强的图注意力网络的企业发票虚开检测方法
CN113779116B (zh) 对象排序方法、相关设备及介质
CN115631008B (zh) 商品推荐方法、装置、设备及介质
CN115293818A (zh) 广告投放选品方法及其装置、设备、介质
Meng et al. Classification of customer service tickets in power system based on character and word level semantic understanding
CN104778636A (zh) 船舶装备维修保障信息服务推荐方法
US11966927B2 (en) Multi-task deep learning of customer demand
CN115392521A (zh) 基于深度学习的用户类型识别方法、装置、服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210820

Address after: 200127 4th to 6th floors, No. 98, Lane 91, Eshan Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai (Building 1, software park)

Applicant after: SHANGHAI NEWTOUCH SOFTWARE Co.,Ltd.

Address before: 15 / F, block a, building 1, Shangding international, hi tech Zone, Chengdu, Sichuan 610000

Applicant before: Yang Jiumei

GR01 Patent grant
GR01 Patent grant