CN111652732A - 一种基于交易图匹配的比特币异常交易实体识别方法 - Google Patents

一种基于交易图匹配的比特币异常交易实体识别方法 Download PDF

Info

Publication number
CN111652732A
CN111652732A CN202010460583.1A CN202010460583A CN111652732A CN 111652732 A CN111652732 A CN 111652732A CN 202010460583 A CN202010460583 A CN 202010460583A CN 111652732 A CN111652732 A CN 111652732A
Authority
CN
China
Prior art keywords
transaction
address
abnormal
entity
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010460583.1A
Other languages
English (en)
Other versions
CN111652732B (zh
Inventor
沈蒙
桑安琪
祝烈煌
孙润庚
张璨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202010460583.1A priority Critical patent/CN111652732B/zh
Publication of CN111652732A publication Critical patent/CN111652732A/zh
Application granted granted Critical
Publication of CN111652732B publication Critical patent/CN111652732B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/04Payment circuits
    • G06Q20/06Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme
    • G06Q20/065Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme using e-cash
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • G06Q20/3823Payment protocols; Details thereof insuring higher security of transaction combining multiple encryption tools for a transaction
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Computer Security & Cryptography (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种基于交易图匹配的比特币异常交易实体识别方法,属于区块链应用安全技术领域。所述方法,包含:1)处理比特币历史交易详细数据并进行地址聚类,构建地址集群数据集;2)基于交易输入及输出地址、交易时间戳和交易金额提取比特币异常交易实体输入和输出特征;3)构建比特币历史交易详细信息交易图;4)构建比特币异常交易实体的输入交易模式和输出交易模式;5)在3)构建的交易图中,利用子图匹配根据4)的比特币异常交易实体交易模式,分别对比特币异常交易实体的输入和输出交易模式进行匹配检测,从而识别出比特币异常交易实体。所述方法利用子图匹配使得异常交易实体直观且有效,协助降低比特币投资者的市场投资风险。

Description

一种基于交易图匹配的比特币异常交易实体识别方法
技术领域
本发明涉及一种基于交易图匹配的比特币异常交易实体识别方法,旨在根据比特币异常交易实体特征,采用交易图匹配的方式,对比特币场景下的异常交易实体进行识别,属于区块链应用安全技术领域。
背景技术
区块链是应用于加密货币的底层技术,具有开放性和匿名性,所以截至目前,有大量围绕加密货币去匿名,试图挖掘用户隐私的研究。早期的加密货币去匿名研究主要集中在比特币上。通过采用目前所熟知的“多输入”聚类规则和找零地址的方式进行交易实体识别。随着区块链技术的应用越来越成熟,也陆续出现了针对其他加密货币的去匿名研究工作。包括Ripple瑞波币、Dash达世币、Monero门罗币和Zcash零币的单币种传统去匿名工作,以及跨多个币种和结合暗网的去匿名工作。
但是现有的针对加密货币的去匿名研究工作,并不能阻止正在不断增多的非法异常加密货币交易实体。所以,从区块链交易中识别出特殊的交易模式,从而发现相关的异常交易实体是一个非常值得探索的问题。
本发明主要关注比特币异常交易实体。比特币独特的自身属性,如用户数量多、交易规模大、地址匿名化,使得界定与识别上述异常交易实体面临诸多挑战。首先,由于一个交易实体会生成多个比特币地址,使得整个账本数据中涵盖了大量不重复的比特币地址。同时这些地址也都涉及了海量的比特币交易详情。因此识别比特币异常交易实体这一过程需要基于海量复杂的比特币交易数据,分析效率低、计算量大。第二,比特币的整体交易模式为多对多,即输入和输出地址均存在一个或多个。这种交易模式使得交易中的输入和输出地址之间缺乏显式的链接。同时这种弱链接也更有效地在大量交易数据中模糊了潜在比特币异常交易实体的特征,使得难以通过分析地址链接的方式识别基于比特币的异常交易实体。
本发明以比特币地址集群为单位进行探索研究。根据比特币异常交易实体的交易特征构建交易模式后,构建交易图,然后利用子图匹配技术来进行比特币异常交易实体的识别。此识别方法有利于规范加密货币市场及其内部的交易实体。同时,能为用户提供更加安全的服务,以及更加健康的投资环境。
发明内容
本发明考虑在比特币场景下识别异常交易实体、规范交易实体、保障网络空间安全的需求,根据比特币异常交易实体特征,采用交易图匹配的方式,对比特币场景下的异常交易实体进行识别,提出了一种基于交易图匹配的比特币异常交易实体识别方法。
所述基于交易图匹配的比特币异常交易实体识别方法,包含如下步骤:
步骤1,处理比特币历史交易详细数据,并进行地址聚类,构建地址集群数据集,具体为:
步骤1.1,对比特币历史交易详细数据进行处理并解析,得到交易ID、交易输入地址、交易输出地址、交易时间戳和交易金额;
步骤1.2,将步骤1.1处理解析得到的交易ID、交易输入地址、交易输出地址,采用传统地址聚类方法进行地址聚类得到多个地址集群,再基于得到的地址集群构建地址集群数据集;
其中,采用传统地址聚类方法进行地址聚类为先应用“多输入”比特币地址聚类方法进行地址聚类,再采用找零地址聚类方法进行地址聚类;
步骤2,从交易输入地址、交易输出地址、交易时间戳和交易金额四方面,提取比特币异常交易实体输入特征和输出特征,具体为:
步骤2.1,从交易输入地址、交易时间戳和交易金额三方面,提取比特币异常交易实体输入特征,具体包括输入特征一、输入特征二和输入特征三;且所述的输入特征一到输入特征三,具体获取方式如下:
输入特征一:交易时间戳在一定时间段内,大量交易实体接收到交易金额非常相近的交易;
其中,大量是指步骤1.2地址聚类得到的多个地址集群所涉及的交易实体个数的2%以上;非常相近是指交易金额的浮动范围在±30%以内;
输入特征二:满足输入特征一的交易输入地址属于一个或一组地址集群;
输入特征三:满足输入特征一和输入特征二的交易整体表现出一定的发散性;
步骤2.2,从交易输出地址、交易时间戳和交易金额三方面,提取比特币异常交易实体输出特征,具体包括输出特征一、输出特征二和输出特征三;且所述的输出特征一到输出特征三,具体获取方式如下:
输出特征一:交易时间戳在一定时间段内,存在大量交易实体向一个或几个地址集群进行交易,即大量交易的交易输出地址仅属于一个或几个地址集群;
其中,大量是指步骤1.2地址聚类得到的多个地址集群所涉及的交易实体个数的2%以上;
输出特征二:满足输出特征一的交易金额平均值远高于交易金额正常值;
其中,远高于是指交易金额平均值为交易金额正常值的5倍以上;
输出特征三:满足输出特征一和输出特征二的交易整体表现出一定的汇聚性;
步骤3,构建比特币历史交易详细信息交易图;
其中,构建的详细信息交易图满足定义G=(N,E,W);
其中,N代表一组节点,即是一组m1或一组m2;E是对应连接N的一组边,即(m1,v1)或(v2,m2);W是一组边的权重函数,即E中每条边的权重都是沿这条边转移的比特币总量之和;
步骤3,具体为:将一个地址集群定义为有向图中的一个节点b,同时,有向图中的每条边e都代表了两个节点间的至少一笔交易;当由地址集群m1向地址集群v1产生了一笔发送交易时,则存在一个有向边(m1,v1);当由地址集群m2从地址集群v2获得了一笔接收交易时,则存在一个有向边(v2,m2);这些有向边都具有权重,此值等于沿此边进行的一笔或多笔交易所转移的比特币总量加权;
其中,一笔交易是一笔发送交易及一笔接收交易中的一种,且一笔发送交易或一笔接收交易均采用四元组的形式来表示,即(bs,br,w,d);
其中,bs和br分别表示交易的发送方地址集群和接收方地址集群,w表示此交易的交易金额,单位为BTC,d是交易中地址集群的角色标识;也就是当此笔交易中的发送方地址集群存在比特币异常交易实体时,d被赋0值;当此笔交易中的接收方地址集群存在比特币异常交易实体时,d被赋1值;其余情况d被赋值为-1;
步骤4,根据步骤2提取的比特币异常交易实体输入特征和输出特征,构建比特币异常交易实体的输入交易模式和输出交易模式,具体为:
步骤4.1,根据步骤2.1提取的比特币异常交易实体输入特征,构建比特币异常交易实体的输入交易模式,具体为:
判断交易图中的节点b及其边是否同时满足:e的方向为(m1,v1);w(1±Gap)的出度数≥A;这A笔交易的交易时间戳最大差值≤T1;若此b及其边满足以上要求,则标记此b为比特币异常交易实体;同时更新其作为bs的交易元组中的d,赋值为0;并且比特币异常交易实体其实是具有实际意义的比特币异常交易实体地址集群,所以其中所包含的比特币地址也被标记为比特币异常交易实体地址;
其中,Gap为步骤2.1输入特征一中的相近交易金额的浮动范围,满足Gap∈[0,0.5];A表示满足步骤2.1比特币异常交易实体输入特征的输出数量下限;T1表示一段时间;
步骤4.2,根据步骤2.2提取的比特币异常交易实体输出特征,构建比特币异常交易实体的输出交易模式,具体为:
判断交易图中的节点b及其边同时满足:e的方向为(v2,m2);w/c≥Gmul的入度数≥B;这B笔交易的交易时间戳最大差值≤T2;若此b及其边满足以上要求,则标记此b为比特币异常交易实体;同时更新其作为br的交易元组中的d,赋值为1;并且比特币异常交易实体其实是具有实际意义的比特币异常交易实体地址集群,所以其中所包含的比特币地址也被标记为比特币异常交易实体地址;
其中,c为步骤2.2输出特征二中的交易金额正常值,即该节点历史平均接收交易金额;Gmul表示步骤2.2输出特征二中,交易金额平均值远高于交易金额正常值需满足的倍数;B表示满足步骤2.2比特币异常交易实体输出特征的输入数量下限;T2表示一段时间;
步骤5,在步骤3构建的交易图中,利用子图匹配算法,根据步骤4的比特币异常交易实体交易模式,分别对比特币异常交易实体的输入交易模式和输出交易模式进行匹配检测,从而识别出比特币异常交易实体。
有益效果
所提出的一种基于交易图匹配的比特币异常交易实体识别方法,对于实现基于比特币的异常交易实体识别,具有以下有益效果:
(1)所述识别方法根据比特币异常交易实体的输入交易模式和输出交易模式,将地址集群与比特币异常交易实体进行关联,适用于对比特币中的异常交易实体进行识别;
(2)所述识别方法基于交易图,利用子图匹配技术,为识别比特币中的异常交易实体提出直观且有效的方法;
(3)通过实验分析验证此识别方法有效,帮助降低比特币投资者的市场投资风险,并对加密货币市场及其内部的交易实体进行规范。
附图说明
图1是本发明一种基于交易图匹配的比特币异常交易实体识别方法的工作流程图;
图2是本发明一种基于交易图匹配的比特币异常交易实体识别方法的比特币异常交易实体输入交易模式示意图;
图3是本发明一种基于交易图匹配的比特币异常交易实体识别方法的比特币异常交易实体输出交易模式示意图。
具体实施方式
下面结合附图和实施例,具体说明本发明“一种基于交易图匹配的比特币异常交易实体识别方法”的过程。应当指出,本发明的实施不限于以下实施例,对本发明所做任何形式上的变通或改变将落入本发明保护范围。
实施例1
本实施例是将所述基于交易图匹配的比特币异常交易实体识别方法应用于粉尘注入场景,验证所述方法在输入交易模式下的有效性。此实施例以满足比特币异常交易实体输入交易模式的粉尘注入场景为例,为了简化描述,以交易平台实体和普通钱包用户实体两类交易实体为例。在粉尘注入场景下,1个交易平台实体X会对多个普通钱包用户实体S分别产生一笔发送交易。其中交易平台实体X会分别向多个普通钱包用户实体S的比特币地址发送粉尘,这里粉尘是指微量的币,即一笔发送交易的手续费大于此笔交易1/3的交易金额。交易平台实体X会利用粉尘,通过关联每个普通钱包用户实体S的比特币地址,获得与此普通钱包用户实体S相关的其他普通钱包用户实体的比特币地址,从而破坏比特币本身的匿名性。
针对上述不安全的情况,提出了一种基于交易图匹配的比特币异常交易实体识别方法,所述方法依托的工作流程如图1所示。
依托于图1中的工作流程,具体实施所述方法时,采取如下步骤:
步骤A,处理比特币历史交易详细数据,并进行地址聚类,构建地址集群数据集,具体为:
步骤A.1,从BTC.com获取比特币历史交易详细数据,利用自定义的Python脚本对获得的比特币历史交易详细数据进行解析,得到交易ID、交易输入地址、交易输出地址、交易时间戳交易金额和交易手续费;
步骤A.2,把步骤A.1处理解析得到的交易ID、交易输入地址、交易输出地址,使用传统的“多输入”比特币地址和找零地址聚类规则,将属于同一个实体,包括但不限于交易平台实体或者普通钱包用户实体的地址进行聚类;
步骤B,构建比特币历史交易详细信息交易图:利用步骤A.1解析后的比特币历史交易详细数据构建交易图;
其中比特币历史交易详细数据包括交易输入地址、交易输出地址、交易时间戳和交易金额;得到的交易图共有25,853个节点,节点包括交易平台实体和普通钱包用户实体,其中的5642个是通过传统地址聚类方法得到的交易平台实体地址集群和普通钱包用户实体地址集群;交易图中的49,474条边,包含72,550个不同的节点间关系,节点间关系包括交易平台实体与交易平台实体之间、交易平台实体与普通钱包用户实体之间、普通钱包用户实体与普通钱包用户实体之间的发送交易和接收交易;
步骤C,根据比特币异常交易实体输入特征,构建比特币异常交易实体的输入交易模式,具体为:交易图中的交易平台实体节点b及其边同时满足,e的方向为(m1,v1),w(1±Gap)的出度数≥A,这A笔交易的交易时间戳最大差值≤T1
其中,参数A取值为40、T1取值为1天到30天内、Gap取值为0.1;若此交易平台实体,以及其与普通钱包用户实体或交易平台实体的交易满足以上要求,则标记此交易平台实体为比特币异常交易实体;同时更新其作为bs的交易元组中的d,赋值为0;交易平台实体的输入交易模式示意图如图2所示;
其中,不同填充的节点和不同宽度的箭头共同表示交易平台实体的输入交易模式,节点分为镂空填充的交易平台实体和实心填充的普通钱包用户实体两类,箭头包括交易平台实体发送给普通钱包用户实体的交易、交易平台实体发送给交易平台实体的交易和普通钱包用户实体发送给普通钱包用户实体的交易;图2中用大圆圈圈起来的一个或多个地址,表示拥有共同所有权的地址集群,其中地址包含交易平台实体地址和普通钱包用户实体地址两类,地址集群包括交易平台实体地址集群和普通钱包用户实体地址集群两类;图2中用箭头的宽度表示两个地址集群之间的交易金额,即交易金额大的箭头宽,交易金额小的箭头窄,其中两个地址集群之间是指交易平台实体和普通钱包用户实体之间、交易平台实体和交易平台实体之间和普通钱包用户实体和普通钱包用户实体之间;此交易模式代表存在共享所有权的交易平台实体地址集群向集群外的其他普通钱包用户实体地址进行发送交易的资金流量;
步骤D,利用子图匹配算法,在步骤B的交易图中,对步骤C的交易平台实体的输入交易模式进行匹配检测,从而识别出进行粉尘注入的交易平台实体,即比特币异常交易实体;
其中识别出的1个交易平台实体,在1天内分别对3602个普通钱包用户实体进行发送交易,且每笔交易的交易金额均为0.00000546比特币,交易手续费也均大于交易金额,说明识别出的交易平台实体为进行粉尘注入的交易平台实体。因此,所述基于交易图匹配的比特币异常交易实体识别方法在输入交易模式下是有效的。
实施例2
本实施例是将所述基于交易图匹配的比特币异常交易实体识别方法应用于勒索场景,验证所述方法在输出交易模式下的有效性。此实施例以满足比特币异常交易实体输出交易模式的勒索场景为例,为了简化描述,以异常个人实体和普通个人实体两类交易实体为例。在勒索场景下,1个异常个人实体Y会从多个普通个人实体S分别获得一笔接收交易。其中多个普通个人实体S会分别向该异常个人实体Y的比特币地址发送比特币,从而实现异常个人实体Y对多个普通个人实体S的比特币资产的非法占有。
针对上述不安全的情况,提出了一种基于交易图匹配的比特币异常交易实体识别方法,所述方法依托的工作流程如图1所示。
依托于图1中的工作流程,具体实施所述方法时,采取如下步骤:
步骤A,处理比特币历史交易详细数据,并进行地址聚类,构建地址集群数据集,具体为:
步骤A.1,从BTC.com获取比特币历史交易详细数据,利用自定义的Python脚本对获得的比特币历史交易详细数据进行解析,得到交易ID、交易输入地址、交易输出地址、交易时间戳交易金额;
步骤A.2,把步骤A.1处理解析得到的交易ID、交易输入地址、交易输出地址,使用传统的“多输入”比特币地址和找零地址聚类规则,将属于同一个实体,包括但不限于异常个人实体或者普通个人实体的地址进行聚类;
步骤B,构建比特币历史交易详细信息交易图:利用步骤A.1解析后的比特币历史交易详细数据构建交易图;
其中比特币历史交易详细数据包括交易输入地址、交易输出地址、交易时间戳和交易金额;得到的交易图共有25,853个节点,节点包括异常个人实体、交易平台实体和普通个人实体,其中的5642个是通过传统地址聚类方法得到的异常个人实体地址集群、交易平台实体地址集群和普通个人实体地址集群;交易图中的49,474条边,包含72,550个不同的节点间关系,节点间关系包括异常个人实体与普通个人实体之间、交易平台实体与交易平台实体之间、交易平台实体与普通个人实体之间、普通个人实体与普通个人实体之间的发送交易和接收交易;
步骤C,根据比特币异常交易实体输出特征,构建比特币异常交易实体的输出交易模式,具体为:交易图中的异常个人实体节点b及其边同时满足:e的方向为(v2,m2);w/c≥Gmul的入度数≥B;这B笔交易的交易时间戳最大差值≤T2
其中,参数B取值为40、T2取值为1天到60天内、Gmul取值为10;若此异常个人实体,以及其与普通个人实体的交易满足以上要求,则标记此异常个人实体为比特币异常交易实体;同时更新其作为br的交易元组中的d,赋值为1;异常个体实体的输出交易模式示意图如图3所示;
其中不同填充的节点和不同宽度的箭头共同表示异常个人实体的输出交易模式,节点分为镂空填充的异常个人实体和实心填充的普通个人实体两类,箭头包括异常个人实体接收来自普通个人实体的交易和普通个人实体发送给普通个人实体的交易;图3中用大圆圈圈起来的一个或多个地址,表示拥有共同所有权的地址集群,其中地址包含异常个人实体和普通个人实体地址两类,地址集群包括异常个人实体地址集群和普通个人实体地址集群两类;图3中用箭头的宽度表示两个地址集群之间的交易金额,即交易金额大的箭头宽,交易金额小的箭头窄,其中两个地址集群之间是指异常个人实体和普通个人实体之间、普通个人实体和普通个人实体之间;此交易模式代表存在共享所有权的异常个人实体地址集群从集群外的其他普通个人实体地址获得接收交易的资金流量;
步骤D,利用子图匹配算法,在步骤B的交易图中,对步骤C的异常个人实体的输出交易模式进行匹配检测,从而识别出进行勒索的异常个人实体,即比特币异常交易实体;
其中,识别出的1个异常个人实体,在2个月内共获得来自350个普通个人实体的接收交易,交易总金额为51.9比特币,说明识别出的异常个人实体为进行勒索的异常个人实体。因此,所述基于交易图匹配的比特币异常交易实体识别方法在输出交易模式下是有效的。
以上所述结合附图和实施例描述了本发明的实施方式,但是对于本领域技术人员来说,在不脱离本专利原理的前提下,还能够做出若干改进,这些也是为属于本专利的保护范围。

Claims (7)

1.一种基于交易图匹配的比特币异常交易实体识别方法,其特征在于:包含如下步骤:
步骤1,处理比特币历史交易详细数据,并进行地址聚类,构建地址集群数据集,具体为:
步骤1.1,对比特币历史交易详细数据进行处理并解析,得到交易ID、交易输入地址、交易输出地址、交易时间戳和交易金额;
步骤1.2,将步骤1.1处理解析得到的交易ID、交易输入地址、交易输出地址,采用传统地址聚类方法进行地址聚类得到多个地址集群,再基于得到的地址集群构建地址集群数据集;
步骤2,从交易输入地址、交易输出地址、交易时间戳和交易金额四方面,提取比特币异常交易实体输入特征和输出特征,具体为:
步骤2.1,从交易输入地址、交易时间戳和交易金额三方面,提取比特币异常交易实体输入特征,具体包括输入特征一、输入特征二和输入特征三;且所述的输入特征一到输入特征三,具体获取方式如下:
输入特征一:交易时间戳在一定时间段内,大量交易实体接收到交易金额非常相近的交易;
输入特征二:满足输入特征一的交易输入地址属于一个或一组地址集群;
输入特征三:满足输入特征一和输入特征二的交易整体表现出一定的发散性;
步骤2.2,从交易输出地址、交易时间戳和交易金额三方面,提取比特币异常交易实体输出特征,具体包括输出特征一、输出特征二和输出特征三;且所述的输出特征一到输出特征三,具体获取方式如下:
输出特征一:交易时间戳在一定时间段内,存在大量交易实体向一个或几个地址集群进行交易,即大量交易的交易输出地址仅属于一个或几个地址集群;
输出特征二:满足输出特征一的交易金额平均值远高于交易金额正常值;
输出特征三:满足输出特征一和输出特征二的交易整体表现出一定的汇聚性;
步骤3,构建比特币历史交易详细信息交易图;
其中,构建的详细信息交易图满足定义G=(N,E,W);
其中,N代表一组节点,即是一组m1或一组m2;E是对应连接N的一组边,即(m1,v1)或(v2,m2);W是一组边的权重函数,即E中每条边的权重都是沿这条边转移的比特币总量之和;
步骤3,具体为:将一个地址集群定义为有向图中的一个节点b,同时,有向图中的每条边e都代表了两个节点间的至少一笔交易;当由地址集群m1向地址集群v1产生了一笔发送交易时,则存在一个有向边(m1,v1);当由地址集群m2从地址集群v2获得了一笔接收交易时,则存在一个有向边(v2,m2);这些有向边都具有权重,此值等于沿此边进行的一笔或多笔交易所转移的比特币总量加权;
步骤4,根据步骤2提取的比特币异常交易实体输入特征和输出特征,构建比特币异常交易实体的输入交易模式和输出交易模式,具体为:
步骤4.1,根据步骤2.1提取的比特币异常交易实体输入特征,构建比特币异常交易实体的输入交易模式,具体为:
判断交易图中的节点b及其边是否同时满足:e的方向为(m1,v1);w(1±Gap)的出度数≥A;这A笔交易的交易时间戳最大差值≤T1;若此b及其边满足以上要求,则标记此b为比特币异常交易实体;同时更新其作为bs的交易元组中的d,赋值为0;并且比特币异常交易实体其实是具有实际意义的比特币异常交易实体地址集群,所以其中所包含的比特币地址也被标记为比特币异常交易实体地址;
其中,Gap为步骤2.1输入特征一中的相近交易金额的浮动范围,满足Gap∈[0,0.5];A表示满足步骤2.1比特币异常交易实体输入特征的输出数量下限;T1表示一段时间;
步骤4.2,根据步骤2.2提取的比特币异常交易实体输出特征,构建比特币异常交易实体的输出交易模式,具体为:
判断交易图中的节点b及其边同时满足:e的方向为(v2,m2);w/c≥Gmul的入度数≥B;这B笔交易的交易时间戳最大差值≤T2;若此b及其边满足以上要求,则标记此b为比特币异常交易实体;同时更新其作为br的交易元组中的d,赋值为1;并且比特币异常交易实体其实是具有实际意义的比特币异常交易实体地址集群,所以其中所包含的比特币地址也被标记为比特币异常交易实体地址;
其中,c为步骤2.2输出特征二中的交易金额正常值,即该节点历史平均接收交易金额;Gmul表示步骤2.2输出特征二中,交易金额平均值远高于交易金额正常值需满足的倍数;B表示满足步骤2.2比特币异常交易实体输出特征的输入数量下限;T2表示一段时间;
步骤5,在步骤3构建的交易图中,利用子图匹配算法,根据步骤4的比特币异常交易实体交易模式,分别对比特币异常交易实体的输入交易模式和输出交易模式进行匹配检测,从而识别出比特币异常交易实体。
2.根据权利要求1所述的一种基于交易图匹配的比特币异常交易实体识别方法,其特征在于:步骤1.2中,采用传统地址聚类方法进行地址聚类为先应用“多输入”比特币地址聚类方法进行地址聚类,再采用找零地址聚类方法进行地址聚类。
3.根据权利要求1所述的一种基于交易图匹配的比特币异常交易实体识别方法,其特征在于:输入特征一获取方式中,大量是指步骤1.2地址聚类得到的多个地址集群所涉及的交易实体个数的2%以上。
4.根据权利要求1所述的一种基于交易图匹配的比特币异常交易实体识别方法,其特征在于:输入特征一获取方式中,非常相近是指交易金额的浮动范围在±30%以内。
5.根据权利要求1所述的一种基于交易图匹配的比特币异常交易实体识别方法,其特征在于:输出特征一获取方式中,大量是指步骤1.2地址聚类得到的多个地址集群所涉及的交易实体个数的2%以上。
6.根据权利要求1所述的一种基于交易图匹配的比特币异常交易实体识别方法,其特征在于:输入特征一获取方式中,输出特征二获取方式中,远高于是指交易金额平均值为交易金额正常值的5倍以上。
7.根据权利要求1所述的一种基于交易图匹配的比特币异常交易实体识别方法,其特征在于:步骤3中,一笔交易是一笔发送交易及一笔接收交易中的一种,且一笔发送交易或一笔接收交易均采用四元组的形式来表示,即(bs,br,w,d);
其中,bs和br分别表示交易的发送方地址集群和接收方地址集群,w表示此交易的交易金额,单位为BTC,d是交易中地址集群的角色标识;也就是当此笔交易中的发送方地址集群存在比特币异常交易实体时,d被赋0值;当此笔交易中的接收方地址集群存在比特币异常交易实体时,d被赋1值;其余情况d被赋值为-1。
CN202010460583.1A 2020-05-26 2020-05-26 一种基于交易图匹配的比特币异常交易实体识别方法 Active CN111652732B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010460583.1A CN111652732B (zh) 2020-05-26 2020-05-26 一种基于交易图匹配的比特币异常交易实体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010460583.1A CN111652732B (zh) 2020-05-26 2020-05-26 一种基于交易图匹配的比特币异常交易实体识别方法

Publications (2)

Publication Number Publication Date
CN111652732A true CN111652732A (zh) 2020-09-11
CN111652732B CN111652732B (zh) 2023-05-12

Family

ID=72348378

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010460583.1A Active CN111652732B (zh) 2020-05-26 2020-05-26 一种基于交易图匹配的比特币异常交易实体识别方法

Country Status (1)

Country Link
CN (1) CN111652732B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686654A (zh) * 2021-01-21 2021-04-20 北京工业大学 区块链数字货币交易的识别方法、装置、电子设备及存储介质
CN112700332A (zh) * 2021-01-11 2021-04-23 北京金色大数据有限公司 一种基于图计算的比特币账户聚类方法
CN112699964A (zh) * 2021-01-13 2021-04-23 成都链安科技有限公司 模型构建方法、系统、装置、介质、交易身份识别方法
CN112801783A (zh) * 2020-12-31 2021-05-14 北京知帆科技有限公司 一种基于数字货币交易特征的实体识别方法及装置
CN114564525A (zh) * 2022-04-28 2022-05-31 支付宝(杭州)信息技术有限公司 基于用户交易数据挖掘用户意图的方法和装置
CN114677217A (zh) * 2022-03-14 2022-06-28 北京交通大学 一种基于子图匹配的面向以太坊的异常交易行为检测方法
CN116308365A (zh) * 2023-05-10 2023-06-23 北京理工大学 一种基于最大权重匹配的门罗币去匿名化攻击方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019083107A1 (ko) * 2017-10-26 2019-05-02 (주)네오프레임 중개 기반 가상통화 거래 시스템
US20190385175A1 (en) * 2018-06-15 2019-12-19 Wells Fargo Bank, N.A. Risk detection of false customer information
CN110689343A (zh) * 2018-07-05 2020-01-14 北京果仁宝软件技术有限责任公司 基于有向无环图的交易验证方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019083107A1 (ko) * 2017-10-26 2019-05-02 (주)네오프레임 중개 기반 가상통화 거래 시스템
US20190385175A1 (en) * 2018-06-15 2019-12-19 Wells Fargo Bank, N.A. Risk detection of false customer information
CN110689343A (zh) * 2018-07-05 2020-01-14 北京果仁宝软件技术有限责任公司 基于有向无环图的交易验证方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHENG BAOKUN 等: ""Identifying the vulnerabilities of bitcoin anonymous mechanism based on address clustering"", 《SCIENCE CHINA INFORMATION SCIENCES》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112801783A (zh) * 2020-12-31 2021-05-14 北京知帆科技有限公司 一种基于数字货币交易特征的实体识别方法及装置
CN112700332A (zh) * 2021-01-11 2021-04-23 北京金色大数据有限公司 一种基于图计算的比特币账户聚类方法
CN112699964A (zh) * 2021-01-13 2021-04-23 成都链安科技有限公司 模型构建方法、系统、装置、介质、交易身份识别方法
CN112686654A (zh) * 2021-01-21 2021-04-20 北京工业大学 区块链数字货币交易的识别方法、装置、电子设备及存储介质
CN114677217A (zh) * 2022-03-14 2022-06-28 北京交通大学 一种基于子图匹配的面向以太坊的异常交易行为检测方法
CN114564525A (zh) * 2022-04-28 2022-05-31 支付宝(杭州)信息技术有限公司 基于用户交易数据挖掘用户意图的方法和装置
CN114564525B (zh) * 2022-04-28 2022-07-29 支付宝(杭州)信息技术有限公司 基于用户交易数据挖掘用户意图的方法和装置
CN116308365A (zh) * 2023-05-10 2023-06-23 北京理工大学 一种基于最大权重匹配的门罗币去匿名化攻击方法
CN116308365B (zh) * 2023-05-10 2023-09-19 北京理工大学 一种基于最大权重匹配的门罗币去匿名化攻击方法

Also Published As

Publication number Publication date
CN111652732B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN111652732A (zh) 一种基于交易图匹配的比特币异常交易实体识别方法
Pourhabibi et al. Fraud detection: A systematic literature review of graph-based anomaly detection approaches
KR102185191B1 (ko) 암호화폐 거래 분석 방법 및 시스템
De Roux et al. Tax fraud detection for under-reporting declarations using an unsupervised machine learning approach
CN110363510B (zh) 一种基于区块链的加密货币用户特征挖掘、异常用户检测方法
US12020258B2 (en) Method, use thereof, computer program product and system for fraud detection
Richhariya et al. A survey on financial fraud detection methodologies
CN109816532B (zh) 一种基于区块链技术的资产数字化锚定系统
CN111145027A (zh) 一种疑似洗钱交易识别方法及装置
Lata et al. A comprehensive survey of fraud detection techniques
Wu et al. Managing security outsourcing in the presence of strategic hackers
CN113902037A (zh) 非正常银行账户识别方法、系统、电子设备及存储介质
Sharma et al. WLI-FCM and artificial neural network based cloud intrusion detection system
Salau et al. Data cooperatives for neighborhood watch
Maidamwar et al. Implementation of network intrusion detection system using artificial intelligence: Survey
Badawi et al. Detection of money laundering in bitcoin transactions
Song et al. Blockchain data analysis from the perspective of complex networks: Overview
Lv et al. Research on modeling of e-banking fraud account identification based on federated learning
Apparao et al. Financial statement fraud detection by data mining
Reddy et al. Utilization of AI for streamlining and optimizing credit decision process and security access loan risks in the banking sector
Zhang et al. CLTracer: a cross-ledger tracing framework based on address relationships
Zhao et al. Detecting fake reviews via dynamic multimode network
Qi et al. Blockchain Data Mining With Graph Learning: A Survey
Duman et al. A comparison of classification models on credit card fraud detection with respect to cost-based performance metrics
Islam An efficient technique for mining bad credit accounts from both olap and oltp

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant