CN114282003A - 基于知识图谱的金融风险预警方法及装置 - Google Patents

基于知识图谱的金融风险预警方法及装置 Download PDF

Info

Publication number
CN114282003A
CN114282003A CN202111444695.9A CN202111444695A CN114282003A CN 114282003 A CN114282003 A CN 114282003A CN 202111444695 A CN202111444695 A CN 202111444695A CN 114282003 A CN114282003 A CN 114282003A
Authority
CN
China
Prior art keywords
financial
knowledge
graph
preset
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111444695.9A
Other languages
English (en)
Inventor
陈尚志
朱祖恩
陈浩欣
魏晓聪
邱馥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202111444695.9A priority Critical patent/CN114282003A/zh
Publication of CN114282003A publication Critical patent/CN114282003A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请实施例提供一种基于知识图谱的金融风险预警方法及装置,方法包括:对金融业务数据进行数据预处理并构建得到金融知识图谱;根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量;根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量;通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,并根据所述特征融合结果和预设风险评分函数确定对应的金融风险;本申请能够高效、准确、全面得进行金融风险预警。

Description

基于知识图谱的金融风险预警方法及装置
技术领域
本申请涉及人工智能知识图谱技术领域,具体涉及一种基于知识图谱的金融风险预警方法及装置。
背景技术
现有技术中的金融贷款预警策略是通过领域内专家根据先验知识和规范条例来制定一些规则来判断当前贷款人是否面临金融资金使用不规范或无法偿还的风险。
发明人发现,随着金融数据量的日益庞大,现有技术中的方式需要消耗大量的人力和时间成本,同时,贷款资金的流向也变的更广、更深,专家难以快速挖掘出在贷款资金流向过程中产生的隐含关联关系,因此难以判断当前金融贷款是否存在较大风险。
发明内容
针对现有技术中的问题,本申请提供一种基于知识图谱的金融风险预警方法及装置,能够高效、准确、全面得进行金融风险预警。
为了解决上述问题中的至少一个,本申请提供以下技术方案:
第一方面,本申请提供一种基于知识图谱的金融风险预警方法,包括:
对金融业务数据进行数据预处理并构建得到金融知识图谱;
根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量;
根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量;
通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,并根据所述特征融合结果和预设风险评分函数确定对应的金融风险。
进一步地,所述对金融业务数据进行数据预处理并构建得到金融知识图谱,包括:
对经过数据清洗后的金融业务数据按照业务类型进行分类处理,得到经过所述分类处理后的半结构化的金融业务数据,并根据预设抽取规则对所述金融业务数据进行知识抽取,得到金融业务知识;
根据预设图数据库和所述金融业务知识中的金融业务节点以及各所述金融业务节点之间的关联关系,构建得到金融知识图谱。
进一步地,所述根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量,包括:
根据预设关系图卷积神经网络模型、所述金融知识图谱中各金融业务节点之间的关联关系类型和有向边方向进行局部邻域信息聚合操作,得到各金融业务节点和相应关联关系的拓扑特征向量。
进一步地,所述根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量,包括:
根据预设自注意力模型对所述金融知识图谱中的各金融业务节点和关联关系进行映射,构建得到对应的词向量;
根据所述词向量与设定随机词向量矩阵的乘积确定对应的语义特征向量。
进一步地,在所述据所述词向量与设定随机词向量矩阵的乘积确定对应的语义特征向量之后,还包括:
根据预设交叉熵损失函数来对所述语义特征向量进行损失值计算,并根据计算得到的损失值和预设反向传播算法对所述随机词向量矩阵进行参数训练和参数迭代,得到经过所述参数训练和参数迭代后的随机词向量矩阵。
进一步地,所述通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,包括:
通过深度神经网络多层感知机对所述拓扑特征向量和所述语义特征向量进行线性运算,将所述拓扑特征向量和所述语义特征向量映射至同一向量空间,得到特征融合结果。
第二方面,本申请提供一种基于知识图谱的金融风险预警装置,包括:
知识图谱构建模块,用于对金融业务数据进行数据预处理并构建得到金融知识图谱;
拓扑特征确定模块,用于根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量;
语义特征确定模块,用于根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量;
特征融合风险评估模块,用于通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,并根据所述特征融合结果和预设风险评分函数确定对应的金融风险。
进一步地,所述知识图谱构建模块包括:
知识抽取单元,用于对经过数据清洗后的金融业务数据按照业务类型进行分类处理,得到经过所述分类处理后的半结构化的金融业务数据,并根据预设抽取规则对所述金融业务数据进行知识抽取,得到金融业务知识;
图谱构建单元,用于根据预设图数据库和所述金融业务知识中的金融业务节点以及各所述金融业务节点之间的关联关系,构建得到金融知识图谱。
进一步地,所述拓扑特征确定模块包括:
局部邻域信息聚合单元,用于根据预设关系图卷积神经网络模型、所述金融知识图谱中各金融业务节点之间的关联关系类型和有向边方向进行局部邻域信息聚合操作,得到各金融业务节点和相应关联关系的拓扑特征向量。
进一步地,所述语义特征确定模块包括:
词向量构建单元,用于根据预设自注意力模型对所述金融知识图谱中的各金融业务节点和关联关系进行映射,构建得到对应的词向量;
语义特征抽取单元,用于根据所述词向量与设定随机词向量矩阵的乘积确定对应的语义特征向量。
进一步地,所述语义特征确定模块还包括:
损失训练单元,用于根据预设交叉熵损失函数来对所述语义特征向量进行损失值计算,并根据计算得到的损失值和预设反向传播算法对所述随机词向量矩阵进行参数训练和参数迭代,得到经过所述参数训练和参数迭代后的随机词向量矩阵。
进一步地,所述特征融合风险评估模块,包括:
特征融合单元,用于通过深度神经网络多层感知机对所述拓扑特征向量和所述语义特征向量进行线性运算,将所述拓扑特征向量和所述语义特征向量映射至同一向量空间,得到特征融合结果。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的基于知识图谱的金融风险预警方法的步骤。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的基于知识图谱的金融风险预警方法的步骤。
第五方面,本申请提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现所述的基于知识图谱的金融风险预警方法的步骤。
由上述技术方案可知,本申请提供一种基于知识图谱的金融风险预警方法及装置,通过综合考虑知识图谱中的拓扑特征向量和语义特征向量,提高了金融风险预警的准确性,且通过多层感知深度神经网络模型对拓扑特征向量和语义特征向量进行特征融合,并根据特征融合结果和预设风险评分函数确定对应的金融风险,由此能够高效、准确、全面得进行金融风险预警。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中的基于知识图谱的金融风险预警方法的流程示意图之一;
图2为本申请实施例中的基于知识图谱的金融风险预警方法的流程示意图之二;
图3为本申请实施例中的基于知识图谱的金融风险预警方法的流程示意图之三;
图4为本申请实施例中的基于知识图谱的金融风险预警装置的结构图之一;
图5为本申请实施例中的基于知识图谱的金融风险预警装置的结构图之二;
图6为本申请实施例中的基于知识图谱的金融风险预警装置的结构图之三;
图7为本申请实施例中的基于知识图谱的金融风险预警装置的结构图之四;
图8为本申请实施例中的基于知识图谱的金融风险预警装置的结构图之五;
图9为本申请实施例中的基于知识图谱的金融风险预警装置的结构图之六;
图10为本申请实施例中的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
值得注意的是,本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
考虑到现有技术中的方式需要消耗大量的人力和时间成本,同时,金融资金的流向也变的更广、更深,专家难以快速挖掘出在金融资金流向过程中产生的隐含关联关系,因此难以判断当前金融是否存在较大风险的问题,本申请提供一种基于知识图谱的金融风险预警方法及装置,通过综合考虑知识图谱中的拓扑特征向量和语义特征向量,提高了金融风险预警的准确性,且通过多层感知深度神经网络模型对拓扑特征向量和语义特征向量进行特征融合,并根据特征融合结果和预设风险评分函数确定对应的金融风险,由此能够高效、准确、全面得进行金融风险预警。
为了能够高效、准确、全面得进行金融风险预警,本申请提供一种基于知识图谱的金融风险预警方法的实施例,参见图1,所述基于知识图谱的金融风险预警方法具体包含有如下内容:
步骤S101:对金融业务数据进行数据预处理并构建得到金融知识图谱。
可选的,本申请中所述的金融业务数据是指金融领域内的常见业务数据,例如贷款业务数据,同理,所述金融知识图谱也可以具体为贷款知识图谱。
可选的,对所述金融业务数据进行的数据预处理包括但不限于:数据清洗、数据分类以及知识抽取。
其中,所述数据清洗可以采用现有技术中的数据清洗技术实现。
所述数据分类是指将金融业务数据按照业务类型进行分类处理,例如将金融业务数据分为金融客户信息、金融产品信息、金融合同信息等多种类的数据,这些数据主要以关系型数据库中的结构化数据为主。
可以理解的是,在所述金融业务数据具体为贷款业务数据时,所述贷款业务数据可以分为贷款客户信息、贷款产品信息、贷款合同信息等多种类的数据。
所述知识抽取可以在经过上述数据清洗和/或数据分类后得到半结构化的金融业务数据,然后通过预设抽取规则进行知识抽取,从而得到金融业务知识。
可以理解的是,所述金融业务知识为用于构成金融知识图谱的一条三元组结构数据,三元组是知识图谱中知识的组织方式,通常表示为<头实体,关系,尾实体>的结构形式,例如在具体到一种贷款业务知识的三元组中,<A公司,借款,B银行>代表了A公司向B银行进行贷款这一贷款业务知识。
可选的,本申请可以通过预设图数据库(例如Neo4J图数据库)结合所述金融业务知识中的金融业务节点以及各所述金融业务节点之间的关联关系构建得到金融知识图谱。
可以理解的是,所述金融业务节点即为金融知识图谱中的实体,用于表示金融业务信息,且各个金融业务节点之间由一有向边连接,有向边分别用于表示其连接的两个金融业务节点各自对应的金融业务信息之间的关联关系,所述金融业务信息就是实体包含的属性(金融账号,金融金额,征信记录,交易明细等),关联关系是两个实体之间发生的动作或事件,其种类主要有(借款、还款、担保等)。
步骤S102:根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量。
可以理解的是,在金融知识图谱中,一条金融知识代表着一条事实,通常以三元组形式的结构表示,为了能够使后续模型可以理解和运算金融知识图谱中的金融知识,本申请可以将事实由自然语言转化为特征向量,这个过程通常也称为嵌入。为了能够完成这一过程,本申请可以从拓扑角度构建事实信息编码器,以确定金融知识图谱的拓扑特征向量(包括实体嵌入向量和关系嵌入向量)。
可选的,本申请可以通过一预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,以确定对应的拓扑特征向量。
可选的,本申请的关系图卷积神经网络模型可以根据所述金融知识图谱中各金融业务节点之间的关联关系类型和有向边方向进行局部邻域信息聚合操作,得到各金融业务节点和相应关联关系的拓扑特征向量,具体聚合函数可以为:
Figure BDA0003383701240000071
其中,R代表关系集合、N代表节点集合、
Figure BDA0003383701240000072
是正则项、W是当前层的参数、h是节点对应层的特征、j代表邻居节点集合中的节点、i代表当前图卷积的层数、r代表关系集合中的关系。
步骤S103:根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量。
可以理解的是,金融知识图谱中蕴含着大量的文本信息,例如实体名称、描述、属性等,这些信息对金融风险预警有着重要意义,例如,当房地产行业面临巨大危机时,所有名称、属性或描述中与房地产相关的节点可能都面临这一定的风险,因此,本申请可以使用预设语言模型(例如KG-Bert语言模型)提取节点的语义特征。
可选的,KG-Bert语言模型针对金融知识图谱中的三元组结构,可以将头实体、关系、尾实体看作是一句话的主语、谓语、宾语,并且本申请可以进一步使用预设自注意力模型(例如Transformer自注意力模型)将实体和关系映射成词向量,从而捕获整个三元组的语义特征,所述词向量用于调用和训练模型。
可选的,本申请可以根据预设自注意力模型对所述金融知识图谱中的各金融业务节点和关联关系进行映射,构建得到对应的词向量,然后与一设定随机词向量矩阵的乘积确定对应的语义特征向量,具体步骤可以为:
(1)构建词汇表
(2)构建one-hot向量(即词向量)
(3)构建词向量矩阵(数值随机)
(4)通过one-hot向量与词向量矩阵相乘可以获取到one-hot向量对应的那个词向量(即语义特征向量)
步骤S104:通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,并根据所述特征融合结果和预设风险评分函数确定对应的金融风险。
可以理解的是,多层感知机就是一个深度神经网络,是由参数矩阵构成的。由于拓扑特征向量和语义特征向量的向量空间不同,因此本申请可以通过多层感知机对其进行线性运算,将这两个特征映射到同一个向量空间中,以此实现特征融合,并根据所述特征融合结果和一预设风险评分函数确定对应的金融风险。
可选的,本申请所述的风险评分函数例如为Softmax函数,其实质为一个激活函数,能够将多个神经元的输出映射到(0,1)区间内,并保证其所有输出的总和为1,该风险评分函数的输出结果可以看成概率,从而来进行多分类任务。
Softmax函数公式具体如下:
Figure BDA0003383701240000081
最终输出为S向量,S中每个维度的数值代表了其对应的类别信息的多少,Softmax函数分别将每一个维度的数值的指数与所有元素数值的指数和进行比值,算出其对应的类别的概率,由此可以作为本申请当前金融知识图谱(即金融业务数据)的金融风险评分,通过与评分阈值的数值比较即可确定对应的金融风险。
从上述描述可知,本申请实施例提供的基于知识图谱的金融风险预警方法,能够通过综合考虑知识图谱中的拓扑特征向量和语义特征向量,提高了金融风险预警的准确性,且通过多层感知深度神经网络模型对拓扑特征向量和语义特征向量进行特征融合,并根据特征融合结果和预设风险评分函数确定对应的金融风险,由此能够高效、准确、全面得进行金融风险预警。
为了能够准确构建金融知识图谱,在本申请的基于知识图谱的金融风险预警方法的一实施例中,参见图2,上述步骤S101还可以具体包含如下内容:
步骤S201:对经过数据清洗后的金融业务数据按照业务类型进行分类处理,得到经过所述分类处理后的半结构化的金融业务数据,并根据预设抽取规则对所述金融业务数据进行知识抽取,得到金融业务知识。
步骤S202:根据预设图数据库和所述金融业务知识中的金融业务节点以及各所述金融业务节点之间的关联关系,构建得到金融知识图谱。
可选的,对所述金融业务数据进行的数据预处理包括但不限于:数据清洗、数据分类以及知识抽取。
其中,所述数据清洗可以采用现有技术中的数据清洗技术实现。
所述数据分类是指将金融业务数据按照业务类型进行分类处理,例如将金融业务数据分为金融客户信息、金融产品信息、金融合同信息等多种类的数据,这些数据主要以关系型数据库中的结构化数据为主。
所述知识抽取可以在经过上述数据清洗和/或数据分类后得到半结构化的金融业务数据,然后通过预设抽取规则进行知识抽取,从而得到金融业务知识。
可以理解的是,所述金融业务知识为用于构成金融知识图谱的一条三元组结构数据,三元组是知识图谱中知识的组织方式,通常表示为<头实体,关系,尾实体>的结构形式,例如在具体到一种贷款业务知识的三元组中,<A公司,借款,B银行>代表了A公司向B银行进行贷款这一贷款业务知识。
可选的,本申请可以通过预设图数据库(例如Neo4J图数据库)结合所述金融业务知识中的金融业务节点以及各所述金融业务节点之间的关联关系构建得到金融知识图谱。
可以理解的是,所述金融业务节点即为金融知识图谱中的实体,用于表示金融业务信息,且各个金融业务节点之间由一有向边连接,有向边分别用于表示其连接的两个金融业务节点各自对应的金融业务信息之间的关联关系。
为了能够准确得到知识图谱中的拓扑特征向量,在本申请的基于知识图谱的金融风险预警方法的一实施例中,上述步骤S102还可以具体包含如下内容:
根据预设关系图卷积神经网络模型、所述金融知识图谱中各金融业务节点之间的关联关系类型和有向边方向进行局部邻域信息聚合操作,得到各金融业务节点和相应关联关系的拓扑特征向量。
可选的,本申请的关系图卷积神经网络模型可以根据所述金融知识图谱中各金融业务节点之间的关联关系类型和有向边方向进行局部邻域信息聚合操作,得到各金融业务节点和相应关联关系的拓扑特征向量,具体聚合函数可以为:
Figure BDA0003383701240000091
其中,R代表关系集合、N代表节点集合、
Figure BDA0003383701240000092
是正则项、W是当前层的参数、h是节点对应层的特征、j代表邻居节点集合中的节点、i代表当前图卷积的层数、r代表关系集合中的关系。
为了能够准确得到知识图谱中的语义特征向量,在本申请的基于知识图谱的金融风险预警方法的一实施例中,参见图3,上述步骤S103还可以具体包含如下内容:
步骤S301:根据预设自注意力模型对所述金融知识图谱中的各金融业务节点和关联关系进行映射,构建得到对应的词向量。
步骤S302:根据所述词向量与设定随机词向量矩阵的乘积确定对应的语义特征向量。
可选的,本申请可以使用预设语言模型(例如KG-Bert语言模型)提取节点的语义特征。KG-Bert语言模型针对金融知识图谱中的三元组结构,可以将头实体、关系、尾实体看作是一句话的主语、谓语、宾语,并且本申请可以进一步使用预设自注意力模型(例如Transformer自注意力模型)将实体和关系映射成词向量,从而捕获整个三元组的语义特征,所述词向量用于调用和训练模型。
可选的,本申请可以根据预设自注意力模型对所述金融知识图谱中的各金融业务节点和关联关系进行映射,构建得到对应的词向量,然后与一设定随机词向量矩阵的乘积确定对应的语义特征向量,具体步骤可以为:
(1)构建词汇表
(2)构建one-hot向量(即词向量)
(3)构建词向量矩阵(数值随机)
(4)通过one-hot向量与词向量矩阵相乘可以获取到one-hot向量对应的那个词向量(即语义特征向量)
为了能够提高语义提取的准确性,在本申请的基于知识图谱的金融风险预警方法的一实施例中,在上述步骤S302之后,还可以具体包含如下内容:
根据预设交叉熵损失函数来对所述语义特征向量进行损失值计算,并根据计算得到的损失值和预设反向传播算法对所述随机词向量矩阵进行参数训练和参数迭代,得到经过所述参数训练和参数迭代后的随机词向量矩阵。
可选的,由于上述词向量矩阵初始为随机数值,因此本申请可以根据预设交叉熵损失函数来对所述语义特征向量进行损失值计算,并反向传播回随机词向量矩阵进行参数训练和根据训练结果进行参数迭代,以使本申请的随机词向量矩阵更加准确。
为了能够准确进行特征融合,在本申请的基于知识图谱的金融风险预警方法的一实施例中,上述步骤S103还可以具体包含如下内容:
通过深度神经网络多层感知机对所述拓扑特征向量和所述语义特征向量进行线性运算,将所述拓扑特征向量和所述语义特征向量映射至同一向量空间,得到特征融合结果。
可以理解的是,多层感知机就是一个深度神经网络,是由参数矩阵构成的。由于拓扑特征向量和语义特征向量的向量空间不同,因此本申请可以通过多层感知机对其进行线性运算,将这两个特征映射到同一个向量空间中,以此实现特征融合,并根据所述特征融合结果和一预设风险评分函数确定对应的金融风险。
为了能够高效、准确、全面得进行金融风险预警,本申请提供一种用于实现所述基于知识图谱的金融风险预警方法的全部或部分内容的基于知识图谱的金融风险预警装置的实施例,参见图4,所述基于知识图谱的金融风险预警装置具体包含有如下内容:
知识图谱构建模块10,用于对金融业务数据进行数据预处理并构建得到金融知识图谱。
拓扑特征确定模块20,用于根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量。
语义特征确定模块30,用于根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量。
特征融合风险评估模块40,用于通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,并根据所述特征融合结果和预设风险评分函数确定对应的金融风险。
从上述描述可知,本申请实施例提供的基于知识图谱的金融风险预警装置,能够通过综合考虑知识图谱中的拓扑特征向量和语义特征向量,提高了金融风险预警的准确性,且通过多层感知深度神经网络模型对拓扑特征向量和语义特征向量进行特征融合,并根据特征融合结果和预设风险评分函数确定对应的金融风险,由此能够高效、准确、全面得进行金融风险预警。
为了能够准确构建金融知识图谱,在本申请的基于知识图谱的金融风险预警装置的一实施例中,参见图5,所述知识图谱构建模块10包括:
知识抽取单元11,用于对经过数据清洗后的金融业务数据按照业务类型进行分类处理,得到经过所述分类处理后的半结构化的金融业务数据,并根据预设抽取规则对所述金融业务数据进行知识抽取,得到金融业务知识。
图谱构建单元12,用于根据预设图数据库和所述金融业务知识中的金融业务节点以及各所述金融业务节点之间的关联关系,构建得到金融知识图谱。
为了能够准确得到知识图谱中的拓扑特征向量,在本申请的基于知识图谱的金融风险预警装置的一实施例中,参见图6,所述拓扑特征确定模块20包括:
局部邻域信息聚合单元21,用于根据预设关系图卷积神经网络模型、所述金融知识图谱中各金融业务节点之间的关联关系类型和有向边方向进行局部邻域信息聚合操作,得到各金融业务节点和相应关联关系的拓扑特征向量。
为了能够准确得到知识图谱中的语义特征向量,在本申请的基于知识图谱的金融风险预警装置的一实施例中,参见图7,所述语义特征确定模块30包括:
词向量构建单元31,用于根据预设自注意力模型对所述金融知识图谱中的各金融业务节点和关联关系进行映射,构建得到对应的词向量。
语义特征抽取单元32,用于根据所述词向量与设定随机词向量矩阵的乘积确定对应的语义特征向量。
为了能够提高语义提取的准确性,在本申请的基于知识图谱的金融风险预警装置的一实施例中,参见图8,所述语义特征确定模块30还包括:
损失训练单元33,用于根据预设交叉熵损失函数来对所述语义特征向量进行损失值计算,并根据计算得到的损失值和预设反向传播算法对所述随机词向量矩阵进行参数训练和参数迭代,得到经过所述参数训练和参数迭代后的随机词向量矩阵。
为了能够准确进行特征融合,在本申请的基于知识图谱的金融风险预警装置的一实施例中,参见图9,所述特征融合风险评估模块40包括:
特征融合单元41,用于通过深度神经网络多层感知机对所述拓扑特征向量和所述语义特征向量进行线性运算,将所述拓扑特征向量和所述语义特征向量映射至同一向量空间,得到特征融合结果。
从硬件层面来说,为了能够高效、准确、全面得进行金融风险预警,本申请提供一种用于实现所述基于知识图谱的金融风险预警方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现基于知识图谱的金融风险预警装置与核心业务系统、用户终端以及相关数据库等相关设备之间的信息传输;该逻辑控制器可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该逻辑控制器可以参照实施例中的基于知识图谱的金融风险预警方法的实施例,以及基于知识图谱的金融风险预警装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
可以理解的是,所述用户终端可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在实际应用中,基于知识图谱的金融风险预警方法的部分可以在如上述内容所述的电子设备侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
图10为本申请实施例的电子设备9600的系统构成的示意框图。如图10所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图10是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,基于知识图谱的金融风险预警方法功能可以被集成到中央处理器9100中。其中,中央处理器9100可以被配置为进行如下控制:
步骤S101:对金融业务数据进行数据预处理并构建得到金融知识图谱。
步骤S102:根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量。
步骤S103:根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量。
步骤S104:通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,并根据所述特征融合结果和预设风险评分函数确定对应的金融风险。
从上述描述可知,本申请实施例提供的电子设备,通过综合考虑知识图谱中的拓扑特征向量和语义特征向量,提高了金融风险预警的准确性,且通过多层感知深度神经网络模型对拓扑特征向量和语义特征向量进行特征融合,并根据特征融合结果和预设风险评分函数确定对应的金融风险,由此能够高效、准确、全面得进行金融风险预警。
在另一个实施方式中,基于知识图谱的金融风险预警装置可以与中央处理器9100分开配置,例如可以将基于知识图谱的金融风险预警装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现基于知识图谱的金融风险预警方法功能。
如图10所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图10中所示的所有部件;此外,电子设备9600还可以包括图10中没有示出的部件,可以参考现有技术。
如图10所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
本申请的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的基于知识图谱的金融风险预警方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的基于知识图谱的金融风险预警方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤S101:对金融业务数据进行数据预处理并构建得到金融知识图谱。
步骤S102:根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量。
步骤S103:根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量。
步骤S104:通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,并根据所述特征融合结果和预设风险评分函数确定对应的金融风险。
从上述描述可知,本申请实施例提供的计算机可读存储介质,通过综合考虑知识图谱中的拓扑特征向量和语义特征向量,提高了金融风险预警的准确性,且通过多层感知深度神经网络模型对拓扑特征向量和语义特征向量进行特征融合,并根据特征融合结果和预设风险评分函数确定对应的金融风险,由此能够高效、准确、全面得进行金融风险预警。
本申请的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的基于知识图谱的金融风险预警方法中全部步骤的一种计算机程序产品,该计算机程序/指令被处理器执行时实现所述的基于知识图谱的金融风险预警方法的步骤,例如,所述计算机程序/指令实现下述步骤:
步骤S101:对金融业务数据进行数据预处理并构建得到金融知识图谱。
步骤S102:根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量。
步骤S103:根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量。
步骤S104:通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,并根据所述特征融合结果和预设风险评分函数确定对应的金融风险。
从上述描述可知,本申请实施例提供的计算机程序产品,通过综合考虑知识图谱中的拓扑特征向量和语义特征向量,提高了金融风险预警的准确性,且通过多层感知深度神经网络模型对拓扑特征向量和语义特征向量进行特征融合,并根据特征融合结果和预设风险评分函数确定对应的金融风险,由此能够高效、准确、全面得进行金融风险预警。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种基于知识图谱的金融风险预警方法,其特征在于,所述方法包括:
对金融业务数据进行数据预处理并构建得到金融知识图谱;
根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量;
根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量;
通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,并根据所述特征融合结果和预设风险评分函数确定对应的金融风险。
2.根据权利要求1所述的基于知识图谱的金融风险预警方法,其特征在于,所述对金融业务数据进行数据预处理并构建得到金融知识图谱,包括:
对经过数据清洗后的金融业务数据按照业务类型进行分类处理,得到经过所述分类处理后的半结构化的金融业务数据,并根据预设抽取规则对所述金融业务数据进行知识抽取,得到金融业务知识;
根据预设图数据库和所述金融业务知识中的金融业务节点以及各所述金融业务节点之间的关联关系,构建得到金融知识图谱。
3.根据权利要求1所述的基于知识图谱的金融风险预警方法,其特征在于,所述根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量,包括:
根据预设关系图卷积神经网络模型、所述金融知识图谱中各金融业务节点之间的关联关系类型和有向边方向进行局部邻域信息聚合操作,得到各金融业务节点和相应关联关系的拓扑特征向量。
4.根据权利要求1所述的基于知识图谱的金融风险预警方法,其特征在于,所述根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量,包括:
根据预设自注意力模型对所述金融知识图谱中的各金融业务节点和关联关系进行映射,构建得到对应的词向量;
根据所述词向量与设定随机词向量矩阵的乘积确定对应的语义特征向量。
5.根据权利要求4所述的基于知识图谱的金融风险预警方法,其特征在于,在所述据所述词向量与设定随机词向量矩阵的乘积确定对应的语义特征向量之后,还包括:
根据预设交叉熵损失函数来对所述语义特征向量进行损失值计算,并根据计算得到的损失值和预设反向传播算法对所述随机词向量矩阵进行参数训练和参数迭代,得到经过所述参数训练和参数迭代后的随机词向量矩阵。
6.根据权利要求1所述的基于知识图谱的金融风险预警方法,其特征在于,所述通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,包括:
通过深度神经网络多层感知机对所述拓扑特征向量和所述语义特征向量进行线性运算,将所述拓扑特征向量和所述语义特征向量映射至同一向量空间,得到特征融合结果。
7.一种基于知识图谱的金融风险预警装置,其特征在于,包括:
知识图谱构建模块,用于对金融业务数据进行数据预处理并构建得到金融知识图谱;
拓扑特征确定模块,用于根据预设关系图卷积神经网络模型对所述金融知识图谱进行局部邻域信息聚合操作,确定对应的拓扑特征向量;
语义特征确定模块,用于根据预设语言模型对所述金融知识图谱进行语义特征提取,确定对应的语义特征向量;
特征融合风险评估模块,用于通过多层感知深度神经网络模型对所述拓扑特征向量和所述语义特征向量进行特征融合,并根据所述特征融合结果和预设风险评分函数确定对应的金融风险。
8.根据权利要求7所述的基于知识图谱的金融风险预警装置,其特征在于,所述知识图谱构建模块包括:
知识抽取单元,用于对经过数据清洗后的金融业务数据按照业务类型进行分类处理,得到经过所述分类处理后的半结构化的金融业务数据,并根据预设抽取规则对所述金融业务数据进行知识抽取,得到金融业务知识;
图谱构建单元,用于根据预设图数据库和所述金融业务知识中的金融业务节点以及各所述金融业务节点之间的关联关系,构建得到金融知识图谱。
9.根据权利要求7所述的基于知识图谱的金融风险预警装置,其特征在于,所述拓扑特征确定模块包括:
局部邻域信息聚合单元,用于根据预设关系图卷积神经网络模型、所述金融知识图谱中各金融业务节点之间的关联关系类型和有向边方向进行局部邻域信息聚合操作,得到各金融业务节点和相应关联关系的拓扑特征向量。
10.根据权利要求7所述的基于知识图谱的金融风险预警装置,其特征在于,所述语义特征确定模块包括:
词向量构建单元,用于根据预设自注意力模型对所述金融知识图谱中的各金融业务节点和关联关系进行映射,构建得到对应的词向量;
语义特征抽取单元,用于根据所述词向量与设定随机词向量矩阵的乘积确定对应的语义特征向量。
11.根据权利要求10所述的基于知识图谱的金融风险预警装置,其特征在于,所述语义特征确定模块还包括:
损失训练单元,用于根据预设交叉熵损失函数来对所述语义特征向量进行损失值计算,并根据计算得到的损失值和预设反向传播算法对所述随机词向量矩阵进行参数训练和参数迭代,得到经过所述参数训练和参数迭代后的随机词向量矩阵。
12.根据权利要求7所述的基于知识图谱的金融风险预警装置,其特征在于,所述特征融合风险评估模块包括:
特征融合单元,用于通过深度神经网络多层感知机对所述拓扑特征向量和所述语义特征向量进行线性运算,将所述拓扑特征向量和所述语义特征向量映射至同一向量空间,得到特征融合结果。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6任一项所述的基于知识图谱的金融风险预警方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述的基于知识图谱的金融风险预警方法的步骤。
15.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至6任一项所述的基于知识图谱的金融风险预警方法的步骤。
CN202111444695.9A 2021-11-30 2021-11-30 基于知识图谱的金融风险预警方法及装置 Pending CN114282003A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111444695.9A CN114282003A (zh) 2021-11-30 2021-11-30 基于知识图谱的金融风险预警方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111444695.9A CN114282003A (zh) 2021-11-30 2021-11-30 基于知识图谱的金融风险预警方法及装置

Publications (1)

Publication Number Publication Date
CN114282003A true CN114282003A (zh) 2022-04-05

Family

ID=80870368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111444695.9A Pending CN114282003A (zh) 2021-11-30 2021-11-30 基于知识图谱的金融风险预警方法及装置

Country Status (1)

Country Link
CN (1) CN114282003A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114780619A (zh) * 2022-06-07 2022-07-22 国网浙江省电力有限公司金华供电公司 一种自动工程审价审计数据的异常预警方法
CN115345727A (zh) * 2022-08-19 2022-11-15 中电金信软件有限公司 一种识别欺诈贷款申请的方法及装置
CN115641202A (zh) * 2022-10-28 2023-01-24 中山大学 基于知识图谱和图计算的小贷行业团体借贷风险测度方法
CN116094827A (zh) * 2023-01-18 2023-05-09 支付宝(杭州)信息技术有限公司 基于拓扑增强的安全风险鉴别方法与系统
CN116579618A (zh) * 2023-07-13 2023-08-11 吉贝克信息技术(北京)有限公司 基于风险管理的数据处理方法、装置、设备及存储介质
WO2023226228A1 (zh) * 2022-05-27 2023-11-30 福建天甫电子材料有限公司 用于电子级双氧水制备的智能化有毒有害气体报警系统
CN117408584A (zh) * 2023-12-07 2024-01-16 国网智能电网研究院有限公司 碳资产运营数据模型构建方法、装置、设备及介质
CN117876103A (zh) * 2024-03-12 2024-04-12 杭银消费金融股份有限公司 一种人行征信用户画像搭建方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023226228A1 (zh) * 2022-05-27 2023-11-30 福建天甫电子材料有限公司 用于电子级双氧水制备的智能化有毒有害气体报警系统
CN114780619A (zh) * 2022-06-07 2022-07-22 国网浙江省电力有限公司金华供电公司 一种自动工程审价审计数据的异常预警方法
CN115345727A (zh) * 2022-08-19 2022-11-15 中电金信软件有限公司 一种识别欺诈贷款申请的方法及装置
CN115641202A (zh) * 2022-10-28 2023-01-24 中山大学 基于知识图谱和图计算的小贷行业团体借贷风险测度方法
CN116094827A (zh) * 2023-01-18 2023-05-09 支付宝(杭州)信息技术有限公司 基于拓扑增强的安全风险鉴别方法与系统
CN116579618A (zh) * 2023-07-13 2023-08-11 吉贝克信息技术(北京)有限公司 基于风险管理的数据处理方法、装置、设备及存储介质
CN116579618B (zh) * 2023-07-13 2023-09-22 吉贝克信息技术(北京)有限公司 基于风险管理的数据处理方法、装置、设备及存储介质
CN117408584A (zh) * 2023-12-07 2024-01-16 国网智能电网研究院有限公司 碳资产运营数据模型构建方法、装置、设备及介质
CN117876103A (zh) * 2024-03-12 2024-04-12 杭银消费金融股份有限公司 一种人行征信用户画像搭建方法及系统

Similar Documents

Publication Publication Date Title
CN114282003A (zh) 基于知识图谱的金融风险预警方法及装置
EP4131083A2 (en) Method and apparatus for generating federated learning model
CN113592568B (zh) 一种商机挖掘方法、装置、计算机设备及存储介质
CN107832794A (zh) 一种卷积神经网络生成方法、车系识别方法及计算设备
CN111932267A (zh) 企业金融服务风险预测方法及装置
CN111159358A (zh) 多意图识别训练和使用方法及装置
EP4198906A1 (en) Image generation based on ethical viewpoints
CN112801775A (zh) 客户信用评价方法及装置
CN112837149A (zh) 一种企业信贷风险的识别方法和装置
US11816443B2 (en) Method, device, and storage medium for generating response
US20230070966A1 (en) Method for processing question, electronic device and storage medium
US20230085599A1 (en) Method and device for training tag recommendation model, and method and device for obtaining tag
CN116485527A (zh) 一种金融信用风险分析方法及装置
KR102519878B1 (ko) 금융기관 신용공여 사업에서의 인공지능 기반 리스크 관리 솔루션을 제공하기 위한 장치, 방법 및 명령을 기록한 기록 매체
CN116978370A (zh) 语音处理方法、装置、计算机设备和存储介质
CN115496734A (zh) 视频内容的质量评价方法、网络训练方法和装置
CN114781368A (zh) 业务需求安全处理方法及装置
CN114662452A (zh) 去隐私化的文本标签分析方法及装置
CN113901789A (zh) 基于门控空洞卷积和图卷积的方面级情感分析方法及系统
CN113190679A (zh) 关系确定方法、装置、电子设备和存储介质
CN114490996B (zh) 意图识别方法、装置、计算机设备和存储介质
CN116681513A (zh) 企业资产数据处理方法及装置
CN115034884A (zh) 交易数据处理方法及装置
CN113902554A (zh) 基于机器学习的用户分类方法、装置及系统
CN117056810A (zh) 群体分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination