CN110335131A - 基于树的相似度匹配的金融风险控制方法及装置 - Google Patents

基于树的相似度匹配的金融风险控制方法及装置 Download PDF

Info

Publication number
CN110335131A
CN110335131A CN201910482205.0A CN201910482205A CN110335131A CN 110335131 A CN110335131 A CN 110335131A CN 201910482205 A CN201910482205 A CN 201910482205A CN 110335131 A CN110335131 A CN 110335131A
Authority
CN
China
Prior art keywords
tree
standard
real trade
similar
term vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910482205.0A
Other languages
English (en)
Other versions
CN110335131B (zh
Inventor
朱新新
翟毅腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910482205.0A priority Critical patent/CN110335131B/zh
Publication of CN110335131A publication Critical patent/CN110335131A/zh
Application granted granted Critical
Publication of CN110335131B publication Critical patent/CN110335131B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Technology Law (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于树的相似度匹配的金融风险控制方法及装置。所述方法包括:根据标准树与至少一个实际交易树的节点,确定深度与所述标准树相同的实际交易树;根据所述深度相同的标准树与实际交易树之间的树结构匹配指数,确定结构与所述标准交易树相似的实际交易树;根据所述结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,计算所述结构相似的实际交易树与标准树之间的最终相似值;根据所述结构相似的实际交易树与标准树之间的最终相似值,确定所述实际交易树是否为风险树。

Description

基于树的相似度匹配的金融风险控制方法及装置
技术领域
本说明书涉及计算机领域。
背景技术
在计算机领域中,树是一种重要的非线性数据结构,直观地看,它是数据元素(在树中称为结点)按分支关系组织起来的结构,很象自然界中的树那样。
树结构中含有一些重要的概念。例如,树结构的“度”,也即是宽度,简单地说,就是结点的分支数。以组成该树各结点中最大的度作为该树的度。又例如,树结构的“深度”,是指组成该树各结点的最大层次,具体的,根结点的层次为1,其他结点的层次等于它的父结点的层次数加1。其中,节点的层次是指:从根开始定义起,根为第1层,根的子节点为第2层,以此类推。
目前,在资金交易流程的管理中也引入了树结构。但是,通过具体使用的方式却只能够针对特定结构的树,并且尚未具体地涉及到存储在书的节点上的文本信息。
发明内容
本说明书提供了一种基于树的相似度匹配的金融风险控制方法及装置,能够更好地适应各种树的不同层和节点的结构,以及各种树的节点的不同的存储信息的文本结构,从而更加及时有效地发现金融交易的风险。
为了解决上述问题,本申请公开了一种基于树的相似度匹配的金融风险控制方法,包括:
根据标准树与至少一个实际交易树的节点,确定深度与该标准树相同的实际交易树;
根据该深度相同的标准树与实际交易树之间的树结构匹配指数,确定结构与该标准交易树相似的实际交易树;
根据该结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,计算该结构相似的实际交易树与标准树之间的最终相似值;
根据该结构相似的实际交易树与标准树之间的最终相似值,确定该实际交易树是否为风险树。
在一个优选例中,该根据该结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,计算该结构相似的实际交易树与标准树之间的最终相似值的步骤,包括:
分别计算该结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,并分别生成该结构相似的实际交易树与标准树的相应的词向量矩阵;
根据该结构相似的实际交易树的词向量矩阵与该标准树的相应的词向量矩阵,计算该结构相似的实际交易树与标准树之间的最终相似值。
在一个优选例中,该根据该结构相似的实际交易树的词向量矩阵与该标准树的相应的词向量矩阵,计算该结构相似的实际交易树与标准树之间的最终相似值的步骤,包括:
采用滑动窗口的方式对该结构相似的实际交易树与标准树的词向量进行比较,确定该标准树的词向量的矩阵中的每一个词向量与结构相似的实际交易树的最大相似值;
通过对标准树的词向量的矩阵中的每一个词向量与结构相似的实际交易树的最大相似值进行累加,获得结构相似的标准树与实际交易树之间的最大相似值的滑动累计值;
依次地分别对该结构相似的标准树与实际交易树的词向量的矩阵中的每一组i个连续的词向量组,以滑动窗口的方式进行依次比较,获得结构相似的标准树与实际交易树的每一组i个连续的词向量组之间的最大相似值,其中,该标准树的词向量矩阵中的词向量的数量为N,i为2至N之间的自然数;
对该结构相似的标准树与实际交易树之间的最大相似值的滑动累计值,与该结构相似的标准树与实际交易树的每一组i个连续的词向量组之间的最大相似值进行累加,获得该结构相似的标准树与实际交易树之间的最终相似值。
在一个优选例中,该根据标准树与至少一个实际交易树的节点,确定深度与该标准树相同的实际交易树的步骤,包括:
分别确定该标准树与该实际交易树的每一层的每一个节点对应的节点编码,其中,该节点编码包含父节点编号和子节点编号;
通过比较该标准树与该实际交易树的节点编码的位数,确定深度与该标准树相同的实际交易树。
在一个优选例中,该根据该深度相同的标准树与实际交易树之间的树结构匹配指数,确定结构与该标准交易树相似的实际交易树的步骤,包括:
确定该深度相同的实际交易树与标准树之间的树结构匹配指数;
对该深度相同的实际交易树与标准树之间的树结构匹配指数与阈值进行比较,将小于该阈值的树结构匹配指数所对应的实际交易树确定为结构与该标准树相似的实际交易树。
在一个优选例中,该确定该深度相同的实际交易树与标准树之间的树结构匹配指数的步骤,包括:
根据预先设置的每一个层次的节点对应的层匹配权重,计算该深度相同的实际交易树中,每一个未出现在该标准树中的节点相应的节点匹配指数;
对该深度相同的实际交易树中的未出现在该标准树中的所有的节点相应的节点匹配指数进行求和,确定该深度相同的实际交易树与标准树之间的树结构匹配指数。
在一个优选例中,该根据预先设置的每一个层次的节点对应的层匹配权重的步骤中,该层匹配权重由底层到最上层依次增加。
在一个优选例中,该根据该结构相似的实际交易树与标准树之间的最终相似值,确定该实际交易树是否为风险树的步骤,包括:
将与该标准树的最终相似值最高的该实际交易树确定为最终的相似树;将其它该实际交易树确定为风险树。
本申请还公开了一种基于树的相似度匹配的金融风险控制装置,包括:
深度相同确定模块,用于根据标准树与至少一个实际交易树的节点,确定深度与该标准树相同的实际交易树;
结构相似确定模块,用于根据该深度相同的标准树与实际交易树之间的树结构匹配指数,确定结构与该标准交易树相似的实际交易树;
最终相似值模块,用于根据该结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,计算该结构相似的实际交易树与标准树之间的最终相似值;
风险树确定模块,用于根据该结构相似的实际交易树与标准树之间的最终相似值,确定该实际交易树是否为风险树。
本申请还公开了一种基于树的相似度匹配的金融风险控制设备,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行该计算机可执行指令时实现如前文描述的方法中的步骤。
本申请还公开了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。
本说明书实施方式中,首先比较标准树与实际交易树的树结构,并确定结构与所述标准交易树相似的实际交易树,再进一步比较标准树与这些实际交易树每一个节点上的存储信息之间的相似程度,不但实现了结构与内容的双重比对,提高了比对的准确程度,而且能够适应不同的层和节点的结构。
并且,在对每一个节点的存储信息的相似度进行评估时,通过滑动窗口的方式,考虑了标准树的词向量矩阵中每一个词向量以及每组i个连续的词向量与实际交易树中的每一个词向量以及每组i个连续的词向量之间的相似值,并取最大相似值进行累加,能够更好地评估标准树与实际交易树的节点的存储信息之间的相似程度。
并且,在对标准树与实际交易树的结构相似度进行评估时,层匹配权重由底层到最上层依次增加,能够更准确地描述树结构上的相似程度。
综上,本申请可以更好地适应各种树的不同层和节点的结构,以及各种树的节点的不同的存储信息的文本结构,从而更加及时有效地发现金融交易的风险。
本说明书中记载了大量的技术特征,分布在各个技术方案中,如果要罗列出本申请所有可能的技术特征的组合(即技术方案)的话,会使得说明书过于冗长。为了避免这个问题,本说明书上述发明内容中公开的各个技术特征、在下文各个实施方式和例子中公开的各技术特征、以及附图中公开的各个技术特征,都可以自由地互相组合,从而构成各种新的技术方案(这些技术方案均应该视为在本说明书中已经记载),除非这种技术特征的组合在技术上是不可行的。例如,在一个例子中公开了特征A+B+C,在另一个例子中公开了特征A+B+D+E,而特征C和D是起到相同作用的等同技术手段,技术上只要择一使用即可,不可能同时采用,特征E技术上可以与特征C相组合,则,A+B+C+D的方案因技术不可行而应当不被视为已经记载,而A+B+C+E的方案应当视为已经被记载。
附图说明
图1是本说明书中的实施方式中的作为标准树的A树结构示意图;
图2是本说明书中的实施方式中的作为实际交易树的B树结构示意图;
图3是本说明书中的实施方式中的作为实际交易树的C树结构示意图;
图4是根据本说明书第一实施方式的基于树的相似度匹配的金融风险控制方法的流程示意图;
图5是根据本说明书第一实施方式的基于树的相似度匹配的金融风险控制方法的局部流程示意图;
图6是根据本说明书第一实施方式的基于树的相似度匹配的金融风险控制方法的局部流程示意图;
图7是根据本说明书第二实施方式的基于树的相似度匹配的金融风险控制装置的结构示意图。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
首先,需要指出,在本申请的具体应用场景下,资金交易流程会以树结构的形式存储,其中树节点存储每个交易环节的文本信息。
具体的,树的每一层节点分别表示资金交易流程中的资金所在的位置,每一个节点存储每个交易环节的文本信息,下文中称为存储信息,包括:账户名称、交易额度、交易操作等。
本申请中提到的标准树,表示资金流的正确模式的树,是按照业务定义提前确定的。换句话说,标准树是为了符合利益,时效,合规性,在产品接入的时候提前就设定好了。
本申请中提到的实际交易树,表示资金流的实际流动模式的树,是按照实际发生的流动情况确定的。
例如,如图1-图3所示,分别是不同结构的A树、B树和C树,其中,A树为标准树,B树和C树为实际交易树。本申请提出的方法,旨在快速确定A树、B树和C树中,结构相似树,并通过比对对应节点的存储信息,及时发现直径交易流程的各个环节可能存在的错误,有效进行风险防范。
具体的,根据本申请的原理,首先通过比对实际交易树与标准树中的每一层的节点的编码,确定实际交易树中与标准树结构相似的树,然后,进一步比对结构相似的实际交易树与标准树的各个节点的存储信息的相似度,由此,及时有效地发现资金交易环节的错误,起到风险防范的作用。
进一步的,本申请的方法包括实际交易树与标准树的树结构相似度的判别以及节点的存储信息的相似度的判别。
具体的,在判别树结构相似度的过程中,对树的每一层的每一个节点编码,然后通过对实际交易树与标准树的节点编码的比对,确定它们的树结构匹配指数,该树结构匹配指数的值越小,说明实际交易树与标准树的结构相似度越高,反之,则说明实际交易树与标准树的结构相似度越低。需指出,本申请中,对树的每一层的每一个节点编码相似度的计算中,层匹配权重由底层到最上层依次增加。
具体的,在判别结构相似的实际交易树的节点的存储信息与标准树的节点的存储信息的相似度的过程中,利用滑动窗口比较的方式,计算结构相似的实际交易树与标准树的节点的存储信息的最终相似值,并将最终相似值的值最高的树确定为最终相似树。相应的,其它实际交易树则确定为风险树。
下面将结合附图对本说明书的实施方式作进一步地详细描述。
本说明书的第一实施方式涉及一种基于树的相似度匹配的金融风险控制方法,其流程如图4所示,该方法包括以下步骤:
首先,通过步骤110-120,根据标准树与至少一个实际交易树的节点,确定深度与所述标准树相同的实际交易树。具体如下:
步骤110:分别确定所述标准树与所述实际交易树的每一层的每一个节点对应的节点编码,其中,所述节点编码包含父节点编号和子节点编号。
举例来说,图3中的C树结构图中,对于编码131表示的节点来说,它的父节点编号为13,它是父节点13的第1个子节点,即,子节点编号为1。又例如,图1中的A树结构图中,对于编码122表示的节点来说,它的父节点编号为12,它是父节点12的第2个子节点,即,子节点编号为2。
需指出,根据本申请的实施方式,还可以通过其它方式进行节点编码,不限于上述具体方式。
步骤120:通过比较所述标准树与所述实际交易树的节点编码的位数,确定深度与所述标准树相同的实际交易树,作为相同深度的实际交易树。
具体的,如图1-3所述,A树、B树和C树的深度可以由它们最底层的节点编码的位数表示,例如,A树最底层的节点编码的位数为3,B树最底层的节点编码的位数为3,C树最底层的节点编码的位数也为3。因此,A树、B树和C树的深度相同。
需指出,根据本申请的实施方式,还可以通过其它方式对标准树与实际交易树的深度进行比较,不限于上述具体方式。
上述具体方式的好处在于,能够方便地对标准树与实际交易树的深度进行比较。
下文中,为方便表述,将与所述标准树的深度相同的实际交易树统称为相同深度的实际交易树。
接下来,通过130-140,根据所述深度相同的标准树与实际交易树之间的树结构匹配指数,确定结构与所述标准交易树相似的实际交易树。具体如下:
步骤130:确定所述深度相同的实际交易树与标准树之间的树结构匹配指数。
具体的,如图5所示,步骤130进一步包含以下子步骤:
步骤1302:根据预先设置的每一个层次的节点对应的层匹配权重,计算所述深度相同的实际交易树中,每一个未出现在所述标准树中的节点相应的节点匹配指数,其中,所述层匹配权重由底层到最上层依次增加。
步骤1304:对所有的所述深度相同的实际交易树中的未出现在所述标准树中的节点相应的节点匹配指数进行求和,确定所述深度相同的实际交易树与标准树之间的树结构匹配指数。
具体的,如图1-3所述,A树为标准树,B树和C树为与所述标准树,即,A树的深度相同的实际交易树。预先设置节点对应的各层的层匹配权重为N-n,其中,N代表树的总层数,n代表该节点(或该节点编码)对应的层数,也就是说,层数越高,层匹配权重越大,层数越低,层匹配权重越小。在这种情况下,节点匹配指数Px的计算公式为:Px=N-n+1。进一步的,树结构匹配指数P的计算公式为:P=∑Px,即,所有未出现在所述标准树中的节点对应的节点匹配指数之和。
例如,如图2所示,B树的总层数为3,在第3层有未出现在A树中的节点编码为123,因此,节点匹配指数P123=N-n+1=3-3+1=1,B与A树之间的树结构匹配指数P=P123=1。
又例如,如图3所示,C树的总层数为3,在第2层有未出现在A树中的节点编码为13,在第3层有未出现在A树中的节点编码为131和132,因此,节点编码位13的节点匹配指数P13=N-n+1=3-2+1=2,节点编码位131的节点匹配指数P131=N-n+1=3-3+1=1,节点编码位132的节点匹配指数P132=N-n+1=3-3+1=1。因此,C与A树之间的树结构匹配指数P=P13+P131+P132=2+1+1=4。
需指出,根据本申请的实施方式,还可以通过其它方式确定深度相同的实际交易树与标准树之间的树结构匹配指数,不限于上述具体方式。
上述具体方式的好处在于,层匹配权重由底层到最上层依次增加,能更准确的描述标准树与实际交易树在结构上的相似的程度。
步骤140:对所述深度相同的实际交易树与标准树之间的树结构匹配指数与阈值进行比较,将小于所述阈值的树结构匹配指数所对应的实际交易树确定为结构与所述标准树相似的实际交易树。
通过从上面的步骤可以理解,与所述标准树的深度相同的实际交易树与所述标准树之间的树结构匹配指数越小,两者结构越相似,该实际交易树也越接近于标准树,反之,则两者结构区别越大,实际交易树越可能存在问题和风险。
因此,在本步骤中,通过预先设置树结构匹配指数的阈值,调整和确定实际交易树与标准树的匹配要求,并对所述深度相同的实际交易树与标准树之间的树结构匹配指数与阈值进行比较,如果树结构匹配指数小于阈值,表示该相同深度的实际交易树与标准树足够相似,则可以确定该实际交易树为结构相似的实际交易树。
例如,在本实施例中,将阈值设置为3,而图2中的B树与A树之间的树结构匹配指数为2,则B树为结构与所述标准树相似的实际交易树
需指出,根据本申请的实施方式,还可以根据具体情况,将阈值设置为其它的值,不限于上述具体的值。
上述具体方式的好处在于,可以更加灵活地根据风险防范的实际要求,对实际交易树与标准树的相似程度的要求进行及时调整,适应具体应用场景的需要。
接下来,对于每一个结构相似的实际交易树,执行以下进一步的操作。
首先通过步骤150-160,根据所述结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,计算所述结构相似的实际交易树与标准树之间的最终相似值。具体如下:
步骤150:分别计算所述结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,并分别生成所述结构相似的实际交易树与标准树的相应的词向量矩阵。
具体的,在本步骤中,对结构相似的实际交易树的每一个节点上的存储信息的词向量,按照从左到右,从上到下的顺序编码,生成所述词向量的矩阵。同样,对标准树的每一个节点上的存储信息的词向量,也通过相同方式,生成所述标准树的词向量的矩阵。
例如,对于标准树,即,图1中的A树,生成的词向量的矩阵可以写为:
[value1A,value2A,value3A,value4A,value5A,value6A,value7A]
其中,每一个valueA都表示该标准树,即,A树的一个词向量。
又例如,对于结构相似的实际交易树,即,图2中的B树,生成的词向量的矩阵可以写为:
[value1B,value2B,value3B,value4B,value5B,value6B,value7B,value8B]
其中,每一个valueB都表示该像是结构的实际交易树,即,B树的一个词向量。
步骤160:根据所述结构相似的实际交易树的词向量矩阵与所述标准树的相应的词向量矩阵,计算所述结构相似的实际交易树与标准树之间的最终相似值。
具体的,在本实施例中,标准树,即,A树的词向量长度小于结构相似的实际交易树,即,B树的词向量长度。
需指出,本申请的实施方式中,采用滑动窗口的方式对结构相似的实际交易树与所述标准树的词向量进行比较,确定标准树的词向量的矩阵中的每一个词向量与结构相似的实际交易树的最大相似值。这样做的好处在于,能够更好地适应结构相似的实际交易树与所述标准树的词向量不等长的情况。
具体的,本步骤进一步包含以下步骤:
步骤1602:采用欧氏距离的方式,依次计算标准树,即,A树的词向量的矩阵中的每一个词向量与结构相似的实际交易树,即,B树的词向量的矩阵中的所有的词向量的相似度的值,并确定标准树的词向量的矩阵中的每一个词向量与结构相似的实际交易树的词向量的矩阵中的所有的词向量的相似度中的最大值,作为标准树的词向量的矩阵中的每一个词向量与结构相似的实际交易树的最大相似值,并记为sim_max(value1A),sim_max(value2A),…sim_max(value7A)。
需指出,欧氏距离,是指对于标准树的词向量矩阵中的一个词向量与结构相似的实际交易树的词向量矩阵中的一个词向量,取词向量的差的平方和,然后再开根号,由于欧氏距离是现有技术,在此不做赘述。
步骤1604:通过对标准树的词向量的矩阵中的每一个词向量与结构相似的实际交易树的最大相似值进行累加,获得结构相似的标准树与实际交易树之间的最大相似值的滑动累计值,并记为
步骤1606:假设标准树的词向量矩阵中的词向量的数量为N,则依次地分别对标准树的词向量的矩阵中的i(i为2-N之间的自然数)个连续的词向量组,即,2个连续的词向量、3个连续的词向量、…i个连续的词向量,相应地与结构相似的实际交易树的词向量矩阵中的i个连续的词向量组,即,2个连续的词向量、3个连续的词向量、…i个连续的词向量,以上述滑动窗口的方式进行依次比较,获得结构相似的标准树与实际交易树的每一组i个连续的词向量组之间的最大相似值。
步骤1608:对结构相似的标准树与实际交易树之间的最大相似值的滑动累计值与结构相似的标准树与实际交易树的每一组i个连续的词向量组之间的最大相似值进行累加,获得结构相似的标准树与实际交易树之间的最终相似值,并记为
需指出,在本申请的实施例中,也可以通过其它方式对所述结构相似的实际交易树与标准树的节点上的存储信息之间的相似程度进行评估,不限于以上具体方式。
步骤170:根据所述结构相似的实际交易树与标准树的最终相似值,确定所述实际交易树是否为风险树。
具体的,将与所述标准树的最终相似值最高的所述实际交易树确定为最终的相似树;将其它所述实际交易树确定为风险树。
需指出,在本申请的实施例中,也可以通过其它方式,基于最终相似值评估实际交易树是否为风险树,不限于以上具体方式。
根据上述实施例的基于树的相似度匹配的金融风险控制方法,首先比较标准树与实际交易树的树结构,并确定结构与所述标准交易树相似的实际交易树,再进一步比较标准树与这些实际交易树每一个节点上的存储信息之间的相似程度,实现了结构与内容的双重比对,不但能够适应不同树的节点和存储信息的树结构与树内容,并且提高了比对的准确程度。
并且,在对每一个节点的存储信息的相似度进行评估时,通过滑动窗口的方式,考虑了标准树的词向量矩阵中每一个词向量以及每组i个连续的词向量与实际交易树中的每一个词向量以及每组i个连续的词向量之间的相似值,并取最大相似值进行累加,能够更好地评估标准树与实际交易树的节点的存储信息之间的相似程度。
并且,在对标准树与实际交易树的结构相似度进行评估时,层匹配权重由底层到最上层依次增加,能够更准确地描述结构上的相似程度。
本说明书的第二实施方式涉及一种基于树的相似度匹配的金融风险控制装置,其结构如图7所示,该基于树的相似度匹配的金融风险控制装置包括:深度相同确定模块、结构相似确定模块、最终相似值模块,和风险树确定模块。具体如下:
深度相同确定模块,用于根据标准树与至少一个实际交易树的节点,确定深度与所述标准树相同的实际交易树。
结构相似确定模块,用于根据所述深度相同的标准树与实际交易树之间的树结构匹配指数,确定结构与所述标准交易树相似的实际交易树。
最终相似值模块,用于根据所述结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,计算所述结构相似的实际交易树与标准树之间的最终相似值。
风险树确定模块,用于根据所述结构相似的实际交易树与标准树之间的最终相似值,确定所述实际交易树是否为风险树。
第一实施方式是与本实施方式相对应的方法实施方式,第一实施方式中的技术细节可以应用于本实施方式,本实施方式中的技术细节也可以应用于第一实施方式。
需要说明的是,本领域技术人员应当理解,上述基于树的相似度匹配的金融风险控制装置的实施方式中所示的各模块的实现功能可参照前述基于树的相似度匹配的金融风险控制方法的相关描述而理解。上述基于树的相似度匹配的金融风险控制装置的实施方式中所示的各模块的功能可通过运行于处理器上的程序(可执行指令)而实现,也可通过具体的逻辑电路而实现。本说明书实施例上述基于树的相似度匹配的金融风险控制装置如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本说明书各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本说明书实施例不限制于任何特定的硬件和软件结合。
相应地,本说明书实施方式还提供一种计算机可读存储介质,其中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现本说明书的各方法实施方式。计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于,相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
此外,本说明书实施方式还提供一种基于树的相似度匹配的金融风险控制设备,其中包括用于存储计算机可执行指令的存储器,以及,处理器;该处理器用于在执行该存储器中的计算机可执行指令时实现上述各方法实施方式中的步骤。其中,该处理器可以是中央处理单元(Central Processing Unit,简称“CPU”),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,简称“DSP”)、专用集成电路(Application SpecificIntegrated Circuit,简称“ASIC”)等。前述的存储器可以是只读存储器(read-onlymemory,简称“ROM”)、随机存取存储器(random access memory,简称“RAM”)、快闪存储器(Flash)、硬盘或者固态硬盘等。本发明各实施方式所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
需要说明的是,在本专利的申请文件中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利的申请文件中,如果提到根据某要素执行某行为,则是指至少根据该要素执行该行为的意思,其中包括了两种情况:仅根据该要素执行该行为、和根据该要素和其它要素执行该行为。多个、多次、多种等表达包括2个、2次、2种以及2个以上、2次以上、2种以上。
在本说明书提及的所有文献都被认为是整体性地包括在本说明书的公开内容中,以便在必要时可以作为修改的依据。此外应理解,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

Claims (11)

1.一种基于树的相似度匹配的金融风险控制方法,其特征在于,包括:
根据标准树与至少一个实际交易树的节点,确定深度与所述标准树相同的实际交易树;
根据所述深度相同的标准树与实际交易树之间的树结构匹配指数,确定结构与所述标准交易树相似的实际交易树;
根据所述结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,计算所述结构相似的实际交易树与标准树之间的最终相似值;
根据所述结构相似的实际交易树与标准树之间的最终相似值,确定所述实际交易树是否为风险树。
2.如权利要求1所述的方法,其特征在于,所述根据所述结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,计算所述结构相似的实际交易树与标准树之间的最终相似值的步骤,包括:
分别计算所述结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,并分别生成所述结构相似的实际交易树与标准树的相应的词向量矩阵;
根据所述结构相似的实际交易树的词向量矩阵与所述标准树的相应的词向量矩阵,计算所述结构相似的实际交易树与标准树之间的最终相似值。
3.如权利要求2所述的方法,其特征在于,所述根据所述结构相似的实际交易树的词向量矩阵与所述标准树的相应的词向量矩阵,计算所述结构相似的实际交易树与标准树之间的最终相似值的步骤,包括:
采用滑动窗口的方式对所述结构相似的实际交易树与标准树的词向量进行比较,确定所述标准树的词向量的矩阵中的每一个词向量与结构相似的实际交易树的最大相似值;
通过对标准树的词向量的矩阵中的每一个词向量与结构相似的实际交易树的最大相似值进行累加,获得结构相似的标准树与实际交易树之间的最大相似值的滑动累计值;
依次地分别对所述结构相似的标准树与实际交易树的词向量的矩阵中的每一组i个连续的词向量组,以滑动窗口的方式进行依次比较,获得结构相似的标准树与实际交易树的每一组i个连续的词向量组之间的最大相似值,其中,所述标准树的词向量矩阵中的词向量的数量为N,i为2至N之间的自然数;
对所述结构相似的标准树与实际交易树之间的最大相似值的滑动累计值,与所述结构相似的标准树与实际交易树的每一组i个连续的词向量组之间的最大相似值进行累加,获得所述结构相似的标准树与实际交易树之间的最终相似值。
4.如权利要求1所述的方法,其特征在于,所述根据标准树与至少一个实际交易树的节点,确定深度与所述标准树相同的实际交易树的步骤,包括:
分别确定所述标准树与所述实际交易树的每一层的每一个节点对应的节点编码,其中,所述节点编码包含父节点编号和子节点编号;
通过比较所述标准树与所述实际交易树的节点编码的位数,确定深度与所述标准树相同的实际交易树。
5.如权利要求1所述的方法,其特征在于,所述根据所述深度相同的标准树与实际交易树之间的树结构匹配指数,确定结构与所述标准交易树相似的实际交易树的步骤,包括:
确定所述深度相同的实际交易树与标准树之间的树结构匹配指数;
对所述深度相同的实际交易树与标准树之间的树结构匹配指数与阈值进行比较,将小于所述阈值的树结构匹配指数所对应的实际交易树确定为结构与所述标准树相似的实际交易树。
6.如权利要求5所述的方法,其特征在于,所述确定所述深度相同的实际交易树与标准树之间的树结构匹配指数的步骤,包括:
根据预先设置的每一个层次的节点对应的层匹配权重,计算所述深度相同的实际交易树中,每一个未出现在所述标准树中的节点相应的节点匹配指数;
对所述深度相同的实际交易树中的未出现在所述标准树中的所有的节点相应的节点匹配指数进行求和,确定所述深度相同的实际交易树与标准树之间的树结构匹配指数。
7.如权利要求6所述的方法,其特征在于,所述根据预先设置的每一个层次的节点对应的层匹配权重的步骤中,所述层匹配权重由底层到最上层依次增加。
8.如权利要求1所述的方法,其特征在于,所述根据所述结构相似的实际交易树与标准树之间的最终相似值,确定所述实际交易树是否为风险树的步骤,包括:
将与所述标准树的最终相似值最高的所述实际交易树确定为最终的相似树;将其它所述实际交易树确定为风险树。
9.一种基于树的相似度匹配的金融风险控制装置,其特征在于,包括:
深度相同确定模块,用于根据标准树与至少一个实际交易树的节点,确定深度与所述标准树相同的实际交易树;
结构相似确定模块,用于根据所述深度相同的标准树与实际交易树之间的树结构匹配指数,确定结构与所述标准交易树相似的实际交易树;
最终相似值模块,用于根据所述结构相似的实际交易树与标准树的每一个节点上的存储信息的词向量,计算所述结构相似的实际交易树与标准树之间的最终相似值;
风险树确定模块,用于根据所述结构相似的实际交易树与标准树之间的最终相似值,确定所述实际交易树是否为风险树。
10.一种基于树的相似度匹配的金融风险控制设备,其特征在于,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行所述计算机可执行指令时实现如权利要求1至8中任意一项所述的方法中的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如权利要求1至8中任意一项所述的方法中的步骤。
CN201910482205.0A 2019-06-04 2019-06-04 基于树的相似度匹配的金融风险控制方法及装置 Active CN110335131B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910482205.0A CN110335131B (zh) 2019-06-04 2019-06-04 基于树的相似度匹配的金融风险控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910482205.0A CN110335131B (zh) 2019-06-04 2019-06-04 基于树的相似度匹配的金融风险控制方法及装置

Publications (2)

Publication Number Publication Date
CN110335131A true CN110335131A (zh) 2019-10-15
CN110335131B CN110335131B (zh) 2023-12-05

Family

ID=68140806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910482205.0A Active CN110335131B (zh) 2019-06-04 2019-06-04 基于树的相似度匹配的金融风险控制方法及装置

Country Status (1)

Country Link
CN (1) CN110335131B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932148A (zh) * 2020-09-14 2020-11-13 平安国际智慧城市科技股份有限公司 智慧城市评估方法、装置、计算机设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120066125A1 (en) * 2010-09-13 2012-03-15 Jianjie Ma Computer-based collective intelligence recommendations for transaction review
CN107491534A (zh) * 2017-08-22 2017-12-19 北京百度网讯科技有限公司 信息处理方法和装置
CN107844608A (zh) * 2017-12-06 2018-03-27 湖南大学 一种基于词向量的句子相似度比较方法
CN107918778A (zh) * 2016-10-11 2018-04-17 阿里巴巴集团控股有限公司 一种信息匹配方法及相关装置
CN108268441A (zh) * 2017-01-04 2018-07-10 科大讯飞股份有限公司 句子相似度计算方法和装置及系统
CN108876102A (zh) * 2018-05-04 2018-11-23 阿里巴巴集团控股有限公司 一种风险交易挖掘方法、装置及设备
CN109345388A (zh) * 2018-09-20 2019-02-15 百度在线网络技术(北京)有限公司 区块链智能合约验证方法、装置及存储介质
CN109559232A (zh) * 2019-01-03 2019-04-02 深圳壹账通智能科技有限公司 交易数据处理方法、装置、计算机设备和存储介质
CN109559218A (zh) * 2018-11-07 2019-04-02 北京先进数通信息技术股份公司 一种异常交易的确定方法、装置及存储介质
CN109615153A (zh) * 2017-09-26 2019-04-12 阿里巴巴集团控股有限公司 商家风险评估方法、装置、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120066125A1 (en) * 2010-09-13 2012-03-15 Jianjie Ma Computer-based collective intelligence recommendations for transaction review
CN107918778A (zh) * 2016-10-11 2018-04-17 阿里巴巴集团控股有限公司 一种信息匹配方法及相关装置
CN108268441A (zh) * 2017-01-04 2018-07-10 科大讯飞股份有限公司 句子相似度计算方法和装置及系统
CN107491534A (zh) * 2017-08-22 2017-12-19 北京百度网讯科技有限公司 信息处理方法和装置
CN109615153A (zh) * 2017-09-26 2019-04-12 阿里巴巴集团控股有限公司 商家风险评估方法、装置、设备及存储介质
CN107844608A (zh) * 2017-12-06 2018-03-27 湖南大学 一种基于词向量的句子相似度比较方法
CN108876102A (zh) * 2018-05-04 2018-11-23 阿里巴巴集团控股有限公司 一种风险交易挖掘方法、装置及设备
CN109345388A (zh) * 2018-09-20 2019-02-15 百度在线网络技术(北京)有限公司 区块链智能合约验证方法、装置及存储介质
CN109559218A (zh) * 2018-11-07 2019-04-02 北京先进数通信息技术股份公司 一种异常交易的确定方法、装置及存储介质
CN109559232A (zh) * 2019-01-03 2019-04-02 深圳壹账通智能科技有限公司 交易数据处理方法、装置、计算机设备和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAN YAN: "Authentication of spatio-textual similarity join queries in untrusted cloud environments", 《SECURITY AND COMMUNICATION NETWORKS》, pages 5518 - 5532 *
R. RAMYA: "An efficient Minkowski distance-based matching with Merkle hash tree authentication for biometric recognition in cloud computing", 《SOFT COMPUTING》, pages 13423 - 13431 *
崔宁宁: "移动k-支配最近邻查询验证研究", 《计算机学报》, vol. 41, no. 8, pages 1781 - 1796 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932148A (zh) * 2020-09-14 2020-11-13 平安国际智慧城市科技股份有限公司 智慧城市评估方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN110335131B (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
CN113836227B (zh) 一种基于区块链的资产申购方法、装置及电子设备
CN106156151B (zh) 互联网操作事件的风险识别方法及装置
Rehm et al. Taking a longer-term look at M&A value creation
CN108171601B (zh) 区块链溯源追踪方法、装置和系统
CN109657696A (zh) 多任务监督学习模型训练、预测方法和装置
WO2018142753A1 (ja) ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム
CN107679856A (zh) 基于交易的业务控制方法和装置
CN112015909B (zh) 知识图谱的构建方法及装置、电子设备、存储介质
Gondzio et al. Hedging options under transaction costs and stochastic volatility
CN111539811A (zh) 风险账户的识别方法及装置
CN109325055A (zh) 业务关联数据表的筛选及核对方法、装置、电子设备
CN108346098A (zh) 一种风控规则挖掘的方法及装置
CN114187112A (zh) 账户风险模型的训练方法和风险用户群体的确定方法
CN111882426A (zh) 业务风险分类器训练方法、装置、设备及存储介质
CN109583731A (zh) 一种风险识别方法、装置及设备
WO2020177477A1 (zh) 一种信用服务推荐方法、装置及设备
CN110335131A (zh) 基于树的相似度匹配的金融风险控制方法及装置
CN116308738B (zh) 一种模型训练的方法、业务风控的方法及装置
CN109598478A (zh) 一种风测结果描述文案的生成方法、装置及电子设备
CN108241675A (zh) 数据处理方法及装置
CN114444097A (zh) 基于区块链的用户准入方法、装置、电子设备及存储介质
CN111523995A (zh) 一种模型迁移的特征值确定方法、装置及设备
CN117436877B (zh) 一种基于区块链的交易隐私保护方法
Atolia et al. Solving the unit root problem in models with an exogenous world market interest rate
Fujinuma et al. Proposal of Credit Risk Model Using Machine Learning in Motorcycle Sales

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman, British Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant