CN111475566A - 一种区块链资金可疑交易模式的识别方法及装置 - Google Patents

一种区块链资金可疑交易模式的识别方法及装置 Download PDF

Info

Publication number
CN111475566A
CN111475566A CN201911408663.6A CN201911408663A CN111475566A CN 111475566 A CN111475566 A CN 111475566A CN 201911408663 A CN201911408663 A CN 201911408663A CN 111475566 A CN111475566 A CN 111475566A
Authority
CN
China
Prior art keywords
suspicious
entity
cluster
transaction
addresses
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911408663.6A
Other languages
English (en)
Inventor
曹一新
吴小川
孙亮
干泽俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongan Information Technology Service Co Ltd
Original Assignee
Zhongan Information Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongan Information Technology Service Co Ltd filed Critical Zhongan Information Technology Service Co Ltd
Priority to CN201911408663.6A priority Critical patent/CN111475566A/zh
Publication of CN111475566A publication Critical patent/CN111475566A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种区块链资金可疑交易模式的识别方法及装置,其中方法包括:根据区块链各地址之间的交易关系以及所述地址与操作实体之间的对应关系,构建实体集群;识别所述地址中的可疑地址,根据所述实体集群中可疑地址的数量以及所述操作实体的交易记录中接收到的可疑资金的额度,将所述实体集群确定为可疑实体集群;根据所述可疑实体集群中所述操作实体之间的交易关系,识别区块链资金可疑交易模式。本发明实施例实现了通过确定可疑地址,识别交易记录中的地址的操作实体,构建出实体集群,并识别可疑实体集群,从而基于可疑实体集群挖掘区块链资金可疑交易模式。

Description

一种区块链资金可疑交易模式的识别方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种区块链资金可疑交易模式的识别方法及装置。
背景技术
区块链虚拟货币是以区块链技术为底层支撑技术的交换介质。虚拟货币在实际运行之中,区块链网络中的各节点和参与使用网络的用户都不设身份限制,参与交易的用户可仅由一串公钥地址生成区块链网络的账户地址,且用户的账户地址的数量不设上限,因而在实际的虚拟货币的交易中,用户可隐匿真实身份,注册多个账户,这就给了不法分子以可乘之机,利用区块链虚拟货币进行资金可疑交易等违法金融活动,影响金融秩序和金融安全。
为了应对区块链虚拟货币存在的问题,现有技术中已经出现了多种识别资金可疑交易模式的解决方案,其主要原理是利用已经公开的资金可疑交易信息与区块链上交易记录进行对比,直接确定资金可疑交易地址和资金可疑交易行为,从而识别出存在资金可疑交易嫌疑的交易记录,这中方法导致了我们只能从已经确认的资金可疑交易信息中识别资金可疑交易交易记录,对交易风险的评估过于局限,若公开的资金可疑交易信息较少,则只能识别出个别的资金可疑交易交易记录,无法形成集群效应,识别出资金可疑交易模型。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种区块链资金可疑交易模式的识别方法及装置。所述技术方案如下:
一方面,提供了一种区块链资金可疑交易模式的识别方法,所述方法包括:
根据区块链各地址之间的交易关系以及所述地址与操作实体之间的对应关系,构建实体集群;
识别所述地址中的可疑地址,根据所述实体集群中可疑地址的数量以及所述操作实体的交易记录中接收到的可疑资金的额度,将所述实体集群确定为可疑实体集群;
根据所述可疑实体集群中所述操作实体之间的交易关系,识别区块链资金可疑交易模式。
进一步地,根据区块链各地址之间的交易关系以及所述地址与操作实体之间的对应关系,构建实体集群包括:
根据所述地址与所述操作实体之间的对应关系,将所述地址映射为对应的所述操作实体,将所述地址间交易记录中的资金转移映射为所述操作实体的资金转移;
以所述操作实体作为节点,所述资金转移的路线作为连接所述操作实体的边,构建网络图;
利用社群分类方法对所述操作实体进行分类,构建所述实体集群。
进一步地,根据所述实体集群中可疑地址的数量以及所述操作实体的交易记录中接收到的可疑资金的额度,将所述实体集群确定为可疑实体集群包括:
将所述实体集群中可疑地址数量的占比作为集群评估指标,利用所述集群评估指标将所述实体集群确定为初步可疑实体集群,并将所述初步可疑实体集群中所述可疑地址向其它非可疑地址发送的交易确定为可疑交易;
将所有所述操作实体在所述可疑交易中接收到的可疑资金额度与其在所有交易记录中接收到的总资金额度的比值作为调整所述集群评估指标的参考值,利用调整后的所述集群评估指标确定所述可疑实体集群。
进一步地,所述可疑交易的确定还包括:
利用可疑交易识别模型预测识别出所述可疑交易。
进一步地,所述可疑交易的确定还包括:
将交易记录的所属实体集群以及将所述交易记录与所述可疑交易识别模型的可疑交易预测结果对比,将属于所述可疑实体集群或者包含在所述可疑交易预测结果中的所述交易记录确定为所述可疑交易。
进一步地,利用调整后的所述集群评估指标确定所述可疑实体集群包括:
基于所述参考值构建区分度评估指标,调整所述集群评估指标更新所述参考值,将所述区分度评估指标最优时的所述集群评估指标作为调整后的所述集群评估指标,确定所述可疑实体集群。
进一步地,识别所述实体集群中的可疑地址包括:
利用可疑地址识别模型预测识别出所述可疑地址。
进一步地,对于所述可疑地址识别模型预测识别出的所述可疑地址,识别所述实体集群中的可疑地址还包括:
计算所述操作实体所含的所述可疑地址在其所含地址总数中的占比,若所述可疑地址的占比大于可疑实体识别指标,则将所述操作实体确定为可疑实体,将其所含的所有的地址确定为可疑地址,若所述可疑地址的占比小于非可疑实体识别指标,则将所述操作实体确定为非可疑实体,将其所含的所有的地址确定为非可疑地址。
进一步地,所述方法还包括:通过调节所述可疑实体识别指标和/或所述非可疑实体识别指标使所述可疑地址识别模型的可疑地址识别评估指标达到最优,所述可疑地址识别评估指标是评估所述可疑地址识别模型预测效果的衡量指标。
另一方面,提供了一种区块链资金可疑交易模式的识别装置,所述装置包括:
集群构建模块,用于根据区块链各地址之间的交易关系以及所述地址与操作实体之间的对应关系,构建实体集群;
可疑集群确定模块,用于识别地址中的可疑地址,根据所述实体集群中可疑地址的数量以及所述操作实体的交易记录中接收到的可疑资金的额度,将所述实体集群确定为可疑实体集群;
资金可疑交易模式识别模块,用于根据所述可疑实体集群中所述操作实体之间的交易关系,识别区块链资金可疑交易模式。
进一步地,所述集群构建模块,包括:
映射模块,用于根据所述地址与所述操作实体之间的对应关系,将所述地址映射为对应的所述操作实体,将所述地址间交易记录中的资金转移映射为所述操作实体的资金转移;
网络图构建模块,用于以所述操作实体作为节点,所述资金转移的路线作为连接所述操作实体的边,构建网络图;
模型分类模块,用于利用社群分类方法对所述操作实体进行分类,构建所述实体集群。
进一步地,所述可疑集群确定模块,包括:
初步可疑实体集群识别模块,用于将所述实体集群中可疑地址数量的占比作为集群评估指标,利用所述集群评估指标将所述实体集群确定为初步可疑实体集群,并将所述初步可疑实体集群中可疑地址向其它非可疑地址发送的交易确定为可疑交易;
集群评估指标调整模块,用于将所有所述操作实体在所述可疑交易中接收到的可疑资金额度与其在所有交易记录中接收到的总资金额度的比值作为调整所述集群评估指标的参考值,利用调整后的所述集群评估指标确定所述可疑实体集群。
进一步地,所述集群评估指标调整模块,包括:
可疑交易识别模块,用于利用可疑交易识别模型预测识别出所述可疑交易。
进一步地,所述可疑交易识别模块,具体用于:
将交易记录的所属实体集群以及将所述交易记录与所述可疑交易识别模型的可疑交易预测结果对比,将属于所述可疑实体集群或者包含在所述可疑交易预测结果中的所述交易记录确定为所述可疑交易。
进一步地,所述集群评估指标调整模块,具体用于:
基于所述参考值构建区分度评估指标,调整所述集群评估指标更新所述参考值,将所述区分度评估指标最优时的所述集群评估指标作为调整后的所述集群评估指标,确定所述可疑实体集群。
进一步地,所述可疑集群确定模块还包括:
可疑地址识别模块,用于利用可疑地址识别模型预测识别出所述可疑地址。
进一步地,所述可疑地址识别模块,包括:
识别结果调整模块,用于计算所述操作实体所含的所述可疑地址在其所含地址总数中的占比,若所述可疑地址的占比大于可疑实体识别指标,则将所述操作实体确定为可疑实体,将其所含的所有的地址确定为可疑地址,若所述可疑地址的占比小于非可疑实体识别指标,则将所述操作实体确定为非可疑实体,将其所含的所有的地址确定为非可疑地址。
进一步地,所述识别结果调整模块,包括:
可疑地址识别评估指标调整模块,用于通过调节所述可疑实体识别指标和/ 或所述非可疑实体识别指标优化所述可疑地址识别模型的可疑地址识别评估指标,所述可疑地址识别评估指标是评估所述可疑地址识别模型预测效果的衡量指标。
本发明实施例提供的技术方案带来的有益效果是:
1、本发明实施例实现了通过确定可疑地址,识别交易记录中的地址的操作实体,构建出实体集群,并识别可疑实体集群,从而基于可疑实体集群挖掘区块链资金可疑交易模式;
2、本发明实施例有利于不仅仅依靠已知的资金可疑交易信息,结合预测手段主动识别出可疑地址,进而能够更全面地构建实体集群,提高可疑实体集群的识别准确率,提高资金可疑交易模式的可靠性。
3、本发明实施例在利用机器学习模型进行可疑地址和可疑实体集群识别过程中,利用合理自恰的处理手段实现阈值的自动确定,同时使识别效果达到最佳。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的区块链资金可疑交易模式的识别方法流程图;
图2是本发明实施例提供的网络图示意图;
图3是本发明实施例提供的区块链资金可疑交易模式的识别装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中,识别区块链上可疑的资金可疑交易交易通常是将已知的资金可疑交易交易信息与区块链上交易记录中的交易信息作对比,将存在一致性信息的交易记录定为可疑的资金可疑交易交易。由此可见现有技术中对可疑资金可疑交易交易的识别主要依赖事后信息,导致可疑资金可疑交易交易识别滞后,无法进行事前的预测,更无法根据事前预测出的资金可疑交易交易进行资金可疑交易模式的预测和识别。因此,本发明实施例提出了一种区块链资金可疑交易模式的识别方法和装置,本发明公开的技术方案通过构建实体集群,并结合实体集群中的预测得到的可疑地址数量以及可疑资金的额度识别可疑实体集群,进而挖掘出操作实体集群中的资金可疑交易模式,从而解决了现有技术中仅根据公开信息确定的可疑地址和可疑交易进行资金可疑交易模式识别带来的局限性。
本发明实施例公开的具体技术方案如下所述:
如图1所示,本发明实施例公开的一种区块链资金可疑交易模式的识别方法包括:
S1、获取区块链上交易记录中的地址与操作实体之间的对应关系,为交易记录中的地址确定操作实体。
上述步骤中交易记录中的地址包括交易记录中涉及到的资金的发送节点地址和资金的接收节点地址。操作实体为交易记录中的地址的实际操作运行人员、公司或者组织。获取交易记录中的地址与操作实体之间的对应关系可以根据已经公开的资金可疑交易交易记录中的地址的实际操作实体确定,也可以基于已知的操作实体的资金可疑交易行为特征对交易记录的地址的操作实体进行推断。
由于发起一笔交易需要拥有发送地址的私钥进行签名,因此当一笔交易记录中存在多个发送地址时,可将该多个发送地址确定为同一个操作实体。若任意两笔交易记录的操作实体存在相同的地址,则将其合并成一个新的操作实体,并更新地址与新操作实体的对应关系。对能够找到操作实体的交易记录中涉及到的地址赋予实体标签。
S2、结合地址已知的真实身份与预测的真实身份,识别可疑地址。
可疑地址即为有资金可疑交易行为嫌疑的地址。在识别可疑地址的过程中本发明实施例提供两种方法,一种是根据地址已知的真实身份直接获取,另一种是利用机器学习模型预测地址的真实身份,两种方法结合使用,实现对区块链中地址的全面评估。
对于第一种可疑地址的识别方法,包括:
S21、将交易记录中的地址的真实身份与公开的资金可疑交易信息中的身份信息对比,若存在一致的身份信息,则将其对应的地址确定为可疑地址。
交易记录中的地址的真实身份为已知信息,可以是从多种渠道获得,本发明实施例不作限制。
对于第二种可疑地址的识别方法,包括:
S22、利用可疑地址识别模型预测识别出可疑地址。
上述方法中,可疑地址识别模型是基于机器学习方法构建的,具体可以是神经网络模型。可疑地址识别模型经过已知的可疑地址信息和非可疑地址信息预先训练,能够从地址对应的交易记录中抽取该地址的行为特征,并根据行为特征识别出可疑地址。
进一步地,为了能够扩大可疑地址的识别范围,优化可疑地址识别模型的预测结果的评估指标,本发明实施例还提供了根据地址与操作实体之间的对应关系优化可疑地址识别评估指标的方法:
S221、计算操作实体包括的可疑地址在其所包括的地址总数中的占比,若该占比大于可疑实体识别指标,则将该操作实体确定为可疑实体,并将该可疑实体所包括的所有地址确定为可疑地址;相应地,所该占比小于非可疑实体识别指标,则将该操作实体确定为非可疑实体,并将该非可疑实体包含的所有的地址确定为非可疑地址。在确定可疑地址后,为可疑地址赋予可疑标签。
上述方法通过预先设定的可疑实体指标和非可疑实体指标,扩大了可疑地址和非可疑地址的识别范围。同时,通过调节可疑实体指标和/或非可疑实体指标使可疑地址识别模型的可疑地址识别评估指标达到最优,可疑地址识别评估指标是可疑地址识别模型衡量预测结果准确性的指标。具体地,可以根据已知的真正可疑地址的数量计算预测结果的精确率(即为识别出的可疑地址中真正可疑地址的比例),召回率(真正可疑地址被准确识别出来的比例,即为预测结果中被识别为真的真正可疑地址数与所有真正可疑地址数的比例),可以选择f1-score、f2-score、f0.5-score中的任意一种作为可疑地址识别模型的评估指标,f1-score、f2-score、f0.5-score均是基于精确率和召回率构建的综合指标,是精确率和召回率的调和平均数。其中f1-score认为召回率和精确率同等重要,其最大值为1,最小值为0;f2-score认为召回率的重要程度是精确率的2倍,而 f0.5-score认为召回率的重要程度是精确率的一半。更高的精确率能减少错误地将非可疑识别地址视为可疑,多在重视维系客户关系的场景下使用,更高的召回率则尽量避免漏网之鱼,多在监管场景下使用,可疑地址识别模型的评估指标给出介于两者之间的综合评估。可以同时调节可疑实体指标和非可疑实体指标,或者单独调节可疑实体指标或非可疑实体指标,根据场景需求使某一评估指标达到最大,以优化可疑地址识别模型的识别结果。
S3、基于交易记录中各地址之间的交易关系以及地址与操作实体之间的对应关系构件实体集群。
需要说明的是:上述方法中S1、S2和S3的执行顺序不分先后。可以先确定地址的操作实体后,再确定可疑地址,最后构建实体集群。为了缩短运算时间,也可以先构建实体集群,然后为实体集群中的地址确定操作实体以及确定可疑地址,本发明实施例不作限制。
S31、根据地址与操作实体之间的对应关系,将地址映射为对应的操作实体,将交易记录中的资金在地址之间的资金转移映射为操作实体的资金转移。
S32、以操作实体作为节点,资金转移的路线作为连接操作实体的边,构建网络图。
S33、利用社群分类方法对操作实体进行分类,构建实体集群。
下面对S32中构件网络图的方法举例说明,地址A、B、E对应的操作实体均为甲,地址C对应的操作实体为乙,地址D、F对应的操作实体为丙,地址G 对应的操作实体为丁,其各地址之间的资金转移关系为:A→B、A→F、B→G、 G→C、C→D、D→F、F→E、G→A、C→B,则其对应的操作实体之间的资金转移关系实际为:甲→甲、甲→丙、甲→丁、丁→乙、丁→丙、丙→丙、丙→甲、丁→甲、乙→甲。最终构建的网络图如图2所示。
对于S33中的社群分类方法可以是基于模块性指标的快速压缩社群探测算法(即B算法),或者是在B算法基础上进行改进形成的K算法,或者是基于交互特征的层次聚类算法,或者是基于层级聚类的社群发掘算法。本发明实施例中对具体使用的社群分类方法不作限制,主要在于根据各操作实体的行为特征进行的分类分析,进而将各地址对应的操作实体归入对应的实体集群中。
实体集群构建完成后,为各地址赋予集群标签。
S4、统计实体集群中可疑地址的数量,若可疑地址的数量的占比满足预设的初步可疑集群指标,则将实体集群确定为初步可疑实体集群,将所述初步可疑实体集群中所述可疑地址向其它非可疑地址发送的交易确定为可疑交易。
实体集群中包括多个操作实体,每个操作实体均有对应的地址,因此若实体集群中可疑地址的数量多,则说明实体集群中可能存在资金可疑交易交易。预设的数量条件可以是可疑地址占实体集群中地址的总数量的比重。
S5、将所有操作实体在可疑交易中接收到的可疑资金额度与其在所有交易中接收的总的资金额度的比值作为调整集群评估指标的参考值,利用调整后的所述集群评估指标确定所述可疑实体集群。
需要说明的是,S5是对S4在可疑实体集群识别过程中的补充。S4中仅以可疑地址的数量作为识别可疑实体集群的唯一指标,忽视了实体集群中各地址对涉及资金可疑交易的可疑交易的参与程度,若该实体集群中可疑地址数量较多但参与程度较小也不宜片面地将该实体集群确定为可疑实体集群,S5正是将操作实体在可疑交易中接收到的可疑资金额度在其交易总额度的占比作为衡量操作实体对资金可疑交易活动的参与程度的衡量指标,弥补了S4的片面性问题。
在S5计算接收到的可疑资金额度与其在所有交易中接收的总的资金额度的比值(即调整集群评估指标的参考值)的过程中,为了准确找到可疑资金,需要先确定可疑交易,S4中给出了确定可疑交易的一种方法,即通过识别初步可疑实体集群确定可疑交易,除此之外,本发明实施例另外一种基于机器学习模型的可疑交易识别方法,具体如下:
S51、利用可疑交易识别模型预测识别出所述可疑交易。
需要说明的是,可疑交易识别模型是预先经过已知的可疑交易和非可疑交易训练的。基于上述确定可疑交易的两种方法,便会存在属于初步可疑实体集群不属于可疑交易识别模型识别结果的交易记录,或者属于可疑交易识别模型识别结果但不属于初步可疑实体集群的交易记录,因此需要将上述情况的交易记录进行识别,具体如下:
S52、将交易记录的所属实体集群以及将交易记录与可疑交易识别模型的可疑交易预测结果对比,将属于可疑实体集群或者包含在所述可疑交易预测结果中的所述交易记录确定为所述可疑交易。
S53、利用参考值调整可疑集群指标,并利用调整后的可疑集群指标识别可疑实体集群包括:
基于所述参考值构建区分度评估指标,例如:分别计算可疑实体集群和非可疑实体集群的参考值的平均值,两个平均值差值越大,说明可疑实体集群和非可疑实体集群的区分度越高。若区分度过低,则可以通过调整所述集群评估指标更新所述参考值,将所述区分度评估指标最优时即区分度最高时的所述集群评估指标作为调整后的集群评估指标,用于确定所述可疑实体集群。
需要说明的是:本发明实施例中,除了上述确定可疑交易的方法之外,还可以根据已公开的可疑交易信息直接确认可疑交易。
S6、根据可疑实体集群中各操作实体之间的交易关系,识别区块链资金可疑交易模式。
实体集群中各操作实体代替地址作为实体集群中的节点。对于可疑实体集群内的区块链资金可疑交易模式的识别和挖掘,首先根据各节点的历史交易记录挖掘资金的发送实体和接收实体,从而得到各操作实体的资金进出情况,也得出了资金的流转路线,也就得知了资金如何被周转、拆分,从而识别出可疑实体集群中的区块链资金可疑交易模式。
本发明实施例在结合交易记录中的地址的实际操作实体与可疑地址,利用集群分析的方法,确定可疑集群,识别资金可疑交易模式,实现了对区块链中资金可疑交易模式的主动识别,而不仅仅是根据已知的资金可疑交易地址,逐步勾画资金可疑交易模式,有利于对区块链中资金可疑交易模式的预测分析。
如3图所示,为了实现上述公开的区块链资金可疑交易模式的识别方法,本发明实施例还公开一种区块链资金可疑交易模式的识别装置,包括:
操作实体确定模块1,用于执行方法步骤S1,获取区块链上交易记录中的地址与操作实体之间的对应关系,为交易记录中的地址确定操作实体。
可疑地址识别模块2,用于执行方法步骤S2,结合地址已知的真实身份与预测的真实身份,识别可疑地址。
集群构建模块3,用于执行方法步骤S3,基于交易记录中的地址与操作实体之间的对应关系构件实体集群。
初步可疑交易识别模块4,用于执行方法步骤S4,统计实体集群中可疑地址的数量,若可疑地址的数量的占比满足预设的初步可疑集群指标,则将实体集群确定为初步可疑实体集群,将初步可疑实体集群中可疑地址向非可疑地址发送的交易确定为可疑交易。
集群评估指标调整模块5,用于执行方法步骤S5,将所有操作实体在可疑交易中接收到的可疑资金额度与其在所有交易中接收的总的资金额度的比值作为调整集群评估指标的参考值,利用调整后的所述集群评估指标确定所述可疑实体集群。
需要说明的是,上述各模块中,初步可疑实体集群识别模块和集群评估指标调整模块,属于可疑集群识别模块7。
具体用于执行方法步骤S53,基于所述参考值构建区分度评估指标,调整所述集群评估指标更新所述参考值,将所述区分度评估指标最优时的所述集群评估指标作为调整后的所述集群评估指标,用于确定所述可疑实体集群
资金可疑交易模式识别模块6,用于执行方法步骤S6,根据可疑实体集群中各操作实体之间的交易关系,识别区块链资金可疑交易模式。
更具体地,可疑地址识别模块2,包括:
直接识别模块21,用于执行方法步骤S21,将交易记录中的地址的真实身份与公开的资金可疑交易信息中的身份信息对比,若存在一致的身份信息,则将其对应的地址确定为可疑地址。
模型预测识别模块22,用于执行方法步骤S22,利用可疑地址识别模型预测识别出可疑地址。
其中模型预测识别模块22,包括:识别结果调整模块221,用于计算操作实体所含的可疑地址在其所含地址总数中的占比,若可疑地址的占比大于可疑实体识别指标,则将操作实体确定为可疑实体,将其所含的所有的地址确定为可疑地址,若可疑地址的占比小于非可疑实体识别指标,则将操作实体确定为非可疑实体,将其所含的所有的地址确定为非可疑地址。
识别结果调整模块221,包括:可疑地址识别评估指标调整模块2211,用于通过调整所述可疑实体识别指标和/或所述非可疑实体识别指标优化所述可疑地址识别模型的可疑地址识别评估指标,所述可疑地址识别评估指标是所述可疑地址识别模型判断能否输出预测结果的衡量标准。
集群构建模块3,包括:
映射模块31,用于执行步骤S31,根据地址与操作实体之间的对应关系,将地址映射为对应的操作实体,将地址间交易记录中的资金转移映射为操作实体的资金转移;
网络图构建模块32,用于执行步骤S32,以操作实体作为节点,资金转移的路线作为连接所述操作实体的边,构建网络图;
模型分类模块33,用于执行步骤S33,利用社群分类方法对操作实体进行分类,构建所述实体集群。
集群评估指标调整模块5,包括:
可疑交易识别模块51,用于执行方法步骤S51,利用可疑交易识别模型预测识别出所述可疑交易。以及用于执行方法步骤S52,将属于可疑实体集群或者包含在所述可疑交易预测结果中的所述交易记录确定为所述可疑交易。
本发明实施例公开的区块链资金可疑交易模式的识别装置,能够实现上述公开的区块链资金可疑交易模式的识别方法,实现区块链模式的主动识别。具体地,操作实体确定模块1将确定的地址和操作实体的对应关系发送至可疑地址识别模块2和集群构建模块3,可疑地址识别模块2根据地址和操作实体的对应关系识别可疑地址,集群构建模块2根据地址和操作实体的对应关系完成集群构建,可疑集群识别模块7根据可疑地址在实体集群中识别可疑集群,识别出的可疑集群通过资金可疑交易模式6识别模块识别出资金可疑交易模式。
本发明实施例提供的技术方案带来的有益效果是:
1、本发明实施例实现了通过确定可疑地址,识别交易记录中的地址的操作实体,构建出实体集群,并识别可疑实体集群,从而基于可疑实体集群挖掘区块链资金可疑交易模式;
2、本发明实施例有利于不仅仅依靠已知的资金可疑交易信息,结合预测手段主动识别出可疑地址,进而能够更全面地构件实体集群,提高可疑实体集群的识别准确率,提高资金可疑交易模式的可靠性。
3、本发明实施例在利用机器学习模型进行可疑地址和可疑实体集群识别过程中,利用合理的处理手段实现阈值的自动确定,同时使识别效果达到最佳。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种区块链资金可疑交易模式的识别方法,其特征在于,包括:
根据区块链各地址之间的交易关系以及所述地址与操作实体之间的对应关系,构建实体集群;
识别所述地址中的可疑地址,根据所述实体集群中可疑地址的数量以及所述操作实体的交易记录中接收到的可疑资金的额度,将所述实体集群确定为可疑实体集群;
根据所述可疑实体集群中所述操作实体之间的交易关系,识别区块链资金可疑交易模式。
2.如权利要求1所述的一种区块链资金可疑交易模式的识别方法,其特征在于,根据区块链各地址之间的交易关系以及所述地址与操作实体之间的对应关系,构建实体集群包括:
根据所述地址与所述操作实体之间的对应关系,将所述地址映射为对应的所述操作实体,将所述地址间交易记录中的资金转移映射为所述操作实体的资金转移;
以所述操作实体作为节点,所述资金转移的路线作为连接所述操作实体的边,构建网络图;
利用社群分类方法对所述操作实体进行分类,构建所述实体集群。
3.如权利要求1所述的一种区块链资金可疑交易模式的识别方法,其特征在于,根据所述实体集群中可疑地址的数量以及所述操作实体的交易记录中接收到的可疑资金的额度,将所述实体集群确定为可疑实体集群包括:
将所述实体集群中可疑地址数量的占比作为集群评估指标,利用所述集群评估指标将所述实体集群确定为初步可疑实体集群,并将所述初步可疑实体集群中所述可疑地址向其它非可疑地址发送的交易确定为可疑交易;
将所有所述操作实体在所述可疑交易中接收到的可疑资金额度与其在所有交易记录中接收到的总资金额度的比值作为调整所述集群评估指标的参考值,利用调整后的所述集群评估指标确定所述可疑实体集群。
4.如权利要求3所述的一种区块链资金可疑交易模式的识别方法,其特征在于,所述可疑交易的确定还包括:
利用可疑交易识别模型预测识别出所述可疑交易。
5.如权利要求4所述的一种区块链资金可疑交易模式的识别方法,其特征在于,所述可疑交易的确定还包括:
将交易记录的所属实体集群以及将所述交易记录与所述可疑交易识别模型的可疑交易预测结果对比,将属于所述可疑实体集群或者包含在所述可疑交易预测结果中的所述交易记录确定为所述可疑交易。
6.如权利要求3所述的一种区块链资金可疑交易模式的识别方法,其特征在于,利用调整后的所述集群评估指标确定所述可疑实体集群包括:
基于所述参考值构建区分度评估指标,调整所述集群评估指标更新所述参考值,将所述区分度评估指标最优时的所述集群评估指标作为调整后的所述集群评估指标,确定所述可疑实体集群。
7.如权利要求1~6中任意一项所述的一种区块链资金可疑交易模式的识别方法,其特征在于,识别所述实体集群中的可疑地址包括:
利用可疑地址识别模型预测识别出所述可疑地址。
8.如权利要求7所述的一种区块链资金可疑交易模式的识别方法,其特征在于,对于所述可疑地址识别模型预测识别出的所述可疑地址,识别所述实体集群中的可疑地址还包括:
计算所述操作实体所含的所述可疑地址在其所含地址总数中的占比,若所述可疑地址的占比大于可疑实体识别指标,则将所述操作实体确定为可疑实体,将其所含的所有的地址确定为可疑地址,若所述可疑地址的占比小于非可疑实体识别指标,则将所述操作实体确定为非可疑实体,将其所含的所有的地址确定为非可疑地址。
9.如权利要求8所述的一种区块链资金可疑交易模式的识别方法,其特征在于,所述方法还包括:通过调节所述可疑实体识别指标和/或所述非可疑实体识别指标优化所述可疑地址识别模型的可疑地址识别评估指标,所述可疑地址识别评估指标是评估所述可疑地址识别模型预测效果的衡量指标。
10.一种区块链资金可疑交易模式识别装置,其特征在于,包括:
集群构建模块,用于根据区块链各地址之间的交易关系以及所述地址与操作实体之间的对应关系,构建实体集群;
可疑集群确定模块,用于识别地址中的可疑地址,根据所述实体集群中可疑地址的数量以及所述操作实体的交易记录中接收到的可疑资金的额度,将所述实体集群确定为可疑实体集群;
资金可疑交易模式识别模块,用于根据所述可疑实体集群中所述操作实体之间的交易关系,识别区块链资金可疑交易模式。
CN201911408663.6A 2019-12-31 2019-12-31 一种区块链资金可疑交易模式的识别方法及装置 Pending CN111475566A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911408663.6A CN111475566A (zh) 2019-12-31 2019-12-31 一种区块链资金可疑交易模式的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911408663.6A CN111475566A (zh) 2019-12-31 2019-12-31 一种区块链资金可疑交易模式的识别方法及装置

Publications (1)

Publication Number Publication Date
CN111475566A true CN111475566A (zh) 2020-07-31

Family

ID=71746350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911408663.6A Pending CN111475566A (zh) 2019-12-31 2019-12-31 一种区块链资金可疑交易模式的识别方法及装置

Country Status (1)

Country Link
CN (1) CN111475566A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114492383A (zh) * 2021-12-20 2022-05-13 北京邮电大学 一种数字货币交易地址的实体名称识别方法和装置
CN116596532A (zh) * 2022-11-07 2023-08-15 北京天德科技有限公司 一种基于实时可疑交易识别和监管区块链钱包的监管方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107085812A (zh) * 2016-12-06 2017-08-22 雷盈企业管理(上海)有限公司 区块链数字资产的反洗钱系统及方法
CN108537546A (zh) * 2018-04-11 2018-09-14 北京奇虎科技有限公司 基于地址树的节点身份追踪方法、装置及计算设备
CN110363510A (zh) * 2019-06-05 2019-10-22 西安电子科技大学 一种基于区块链的加密货币用户特征挖掘、异常用户检测方法
CN110619511A (zh) * 2019-09-18 2019-12-27 腾讯科技(深圳)有限公司 电子票据处理方法、装置、可读存储介质和计算机设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107085812A (zh) * 2016-12-06 2017-08-22 雷盈企业管理(上海)有限公司 区块链数字资产的反洗钱系统及方法
CN108537546A (zh) * 2018-04-11 2018-09-14 北京奇虎科技有限公司 基于地址树的节点身份追踪方法、装置及计算设备
CN110363510A (zh) * 2019-06-05 2019-10-22 西安电子科技大学 一种基于区块链的加密货币用户特征挖掘、异常用户检测方法
CN110619511A (zh) * 2019-09-18 2019-12-27 腾讯科技(深圳)有限公司 电子票据处理方法、装置、可读存储介质和计算机设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114492383A (zh) * 2021-12-20 2022-05-13 北京邮电大学 一种数字货币交易地址的实体名称识别方法和装置
CN116596532A (zh) * 2022-11-07 2023-08-15 北京天德科技有限公司 一种基于实时可疑交易识别和监管区块链钱包的监管方法

Similar Documents

Publication Publication Date Title
CN107633265B (zh) 用于优化信用评估模型的数据处理方法及装置
Coşer et al. PREDICTIVE MODELS FOR LOAN DEFAULT RISK ASSESSMENT.
CN109087079B (zh) 数字货币交易信息分析方法
Ogwueleka Data mining application in credit card fraud detection system
WO2021254027A1 (zh) 一种可疑社团的识别方法、装置、存储介质和计算机设备
CN103473786A (zh) 基于多目标模糊聚类的灰度图像分割方法
CN104321794A (zh) 一种使用多维评级来确定一实体的未来商业可行性的系统和方法
CN111145027A (zh) 一种疑似洗钱交易识别方法及装置
US20220383322A1 (en) Clustering-based data selection for optimization of risk predictive machine learning models
CN110930038A (zh) 一种贷款需求识别方法、装置、终端及存储介质
CN111475566A (zh) 一种区块链资金可疑交易模式的识别方法及装置
CN114782051A (zh) 基于多特征学习的以太坊钓鱼诈骗账户检测装置及方法
KR102113347B1 (ko) 인공지능을 이용한 암호화폐 계좌 분류 방법, 장치 및 컴퓨터프로그램
CN114862587A (zh) 异常交易账户的识别方法、装置及计算机可读存储介质
CN112232950A (zh) 针对借贷风险的评估方法及装置、设备、计算机可读存储介质
CN113393316B (zh) 基于海量大数据、核心算法的贷款全过程精准风控及管理系统
CN112085586B (zh) 一种基于密集子图的银行信用卡反套现方法
CN110930242B (zh) 一种可信度预测方法、装置、设备和存储介质
CN112966728A (zh) 一种交易监测的方法及装置
CN109919626B (zh) 一种高风险银行卡的识别方法及装置
CN116821759A (zh) 类别标签的识别预测方法、装置和处理器及电子设备
CN105930430A (zh) 一种基于非累积属性的实时欺诈检测方法及装置
KR102336462B1 (ko) 신용평가정보 제공 장치 및 방법
CN114331463A (zh) 基于线性回归模型的风险识别方法及其相关设备
Biscarri et al. A Mining Framework to Detect Non-technical Losses in Power Utilities.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination