CN112700332A - 一种基于图计算的比特币账户聚类方法 - Google Patents

一种基于图计算的比特币账户聚类方法 Download PDF

Info

Publication number
CN112700332A
CN112700332A CN202110031717.2A CN202110031717A CN112700332A CN 112700332 A CN112700332 A CN 112700332A CN 202110031717 A CN202110031717 A CN 202110031717A CN 112700332 A CN112700332 A CN 112700332A
Authority
CN
China
Prior art keywords
graph
node
transaction
data
bitcoin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110031717.2A
Other languages
English (en)
Other versions
CN112700332B (zh
Inventor
李江华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Golden Big Data Co ltd
Original Assignee
Beijing Golden Big Data Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Golden Big Data Co ltd filed Critical Beijing Golden Big Data Co ltd
Priority to CN202110031717.2A priority Critical patent/CN112700332B/zh
Publication of CN112700332A publication Critical patent/CN112700332A/zh
Application granted granted Critical
Publication of CN112700332B publication Critical patent/CN112700332B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/04Payment circuits
    • G06Q20/06Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme
    • G06Q20/065Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme using e-cash
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/30Payment architectures, schemes or protocols characterised by the use of specific devices or networks
    • G06Q20/36Payment architectures, schemes or protocols characterised by the use of specific devices or networks using electronic wallets or electronic money safes
    • G06Q20/367Payment architectures, schemes or protocols characterised by the use of specific devices or networks using electronic wallets or electronic money safes involving electronic purses or money safes
    • G06Q20/3678Payment architectures, schemes or protocols characterised by the use of specific devices or networks using electronic wallets or electronic money safes involving electronic purses or money safes e-cash details, e.g. blinded, divisible or detecting double spending
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/389Keeping log of transactions for guaranteeing non-repudiation of a transaction

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于图计算的比特币账户聚类方法,包括以下步骤:下载运行比特币节点的客户端,并同步整个网络数据,提取比特币的交易数据;将交易数据解析成结构化数据,并收集结构化数据中的特征参数;将结构化数据的特征参数倒入数据集群中;使用图计算服务对数据集群的所有特征参数进行扫描和特征学习,得出比特币聚类结果;本发明通过提供部署在多个区域骨干网络上的数据集群服务,在集群服务中运行多个比特币对交易网络,然后使用图计算服务对整个网络的全量数据进行扫描和特征学习,最后做出聚类结果。

Description

一种基于图计算的比特币账户聚类方法
技术领域
本发明涉及区块链领域账户技术领域,具体涉及一种基于图计算的比特币账户聚类方法。
背景技术
比特币具有一个全球共享的分布式、去中心化、去信任的账本系统,由计算机生成的一串串复杂代码构成,是目前为止区块链技术最成功的应用.比特币可以由任何人发送给任何一个其他的人,无论他们是否在同一个城市或国家。比特币账号是匿名的,无法被审查。与传统的资金交易系统相比,比特币交易具有较强的匿名性,很难进行有效管理,因此正在被广泛用于一些违法行为和黑市交易,例如枪支贩卖和毒品交易等。在基于区块链技术的数字货币中,通常采用基于公钥的钱包地址作为用户在区块链网络上的假名,不同用户之间的交易通过这种假名实现,这种假名通常由用户自由生成,与用户身份特征无关,因此很难通过分析交易数据推测用户的身份信息,此外,区块链数字货币系统允许用户自由生成多个钱包地址,用户可以采用不同的钱包地址进行交易,以便减少单个钱包地址携带的用户交易特征。
因此,通过分析交易记录从大量假名中找出隶属于同一个用户的假名,并分析出特定用户的交易规律,有助于推测用户的身份信息,对于遏制各类基于比特币的犯罪行为有重要作用。
现有技术方案大都是基于K-means,DBSCAN等监督学习算法然后进行多次遍历计算而得。这些算法都离不开人为事先输入一些我们知道都主体控制的一些账户,然后逐步去遍历和这些账户有关的所有交易记录。它的准确性受限于主动给的地址和遍历次数。且整个交易网络里面,除去已经知道的主体以外,其实还有很多看不见的主体,这些主体可能从事着很多不法行为,因此如何能够智能自动的发现所有的这些异常主体组织以及且控制的所有账户,是计算比特币账户聚类的研究方向。
发明内容
本发明的目的在于提供一种基于图计算的比特币账户聚类方法,以解决现有技术中的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种基于图计算的比特币账户聚类方法,包括以下步骤:
步骤100、下载运行比特币节点的客户端,并同步整个网络数据,提取比特币的交易数据;
步骤200、将所述交易数据解析成结构化数据,并收集所述结构化数据中的特征参数;
步骤300、将所述结构化数据的特征参数倒入数据集群中;
步骤400、使用图计算服务对所述数据集群的所有特征参数进行扫描和特征学习,得出比特币聚类结果。
作为本发明的一种优选方案,在所述步骤200中,所述结构化数据的特征参数包括每项交易数据的发起人钱包地址、接收人钱包地址、交易发起时间和交易结束时间;
所述数据集群中的结构化数据之间形成定点和边的拓扑关系,所述发起人钱包地址和接收人钱包地址为定点,所述交易发起时间和交易结束时间分别为两个定点之间的边数据;
所有的所述结构化数据之间的特征参数构建成超大图网络,所述图计算服务对所述超大图网络的定点进行相关性聚类遍历以得到所述超大图网络的联通子图。
作为本发明的一种优选方案,在所述步骤400中,所述图计算服务对所述数据集群的所有数据进行扫描和特征学习的实现步骤具体为:
步骤401、收集比特币交易的每一项交易数据,并且确定每一项交易数据的发起人和接收人,且所述发起人和接收人通过定点和边点关系建立交易模型并形成具有交易关系的拓扑网络图;
步骤402、确定所述拓扑网络图的每一个节点编号并建立比特币账户字典,将所述节点编号当做每一项交易的节点组号;
步骤403、根据组号之间的推理重演再分组,重新确定节点组号直至找到所述组号祖先以保证比特币账户字典中每个节点的节点组号一致,确定所述比特币的聚类结果。
作为本发明的一种优选方案,在步骤401中,一项所述交易数据内的发起人同时可作为另一项交易的接收人,且一项交易内的接收人同时可作为另一项交易的发起人,且所述超大图网络由于所有交易的发起人和接收人关系形成拓扑关系;
利用图计算系统计算出每个定点A,A1,A2……连接的多个定点B、 B1、B2……,再对多个定点B、B1、B2……进行溯源来确定同一个用户的多个接收人钱包地址,在以多个定点B、B1、B2……为第一视角来确定与其连接的多个定点A,A1,A2……,通过对多个定点A,A1,A2……进行溯源来确定属于同一个用户的发起人钱包地址。
作为本发明的一种优选方案,在步骤402中,确定所述拓扑网络图的每一个节点编号的实现步骤为:
设定所述拓扑网络图每一条连线的两个节点编号,每一个连线上的两个节点编号分别为一项交易的发起人编号和该项交易的接收人编号;
设定扫描顺序,按序扫描所述拓扑网络图以建立比特币账户字典,并确定所述拓扑网络图的节点组号。
作为本发明的一种优选方案,确定所述拓扑网络图的节点组号的方式具体为:选择节点编号当做节点组号,具体的实现规则为:
选择每一条连线的任意一个节点编号当做这条连线上两个节点的组号;
从所述比特币账户字典内选择已经有了节点的组号。
作为本发明的一种优选方案,按序扫描所述拓扑网络图以建立比特币账户字典的实现步骤为:
第一,优先确定拓扑网络图的定点关系,即确定两个定点之间的发起人和接收人,这样可以确定每项交易的矢量关系,在建立比特币账户字典时,账户字典内的每个集合即为一项交易记录,其中将发起人定义为一个集合的第一个元素,而将接收人定义为一个集合的第二个元素。
第二,自定义选择所述拓扑网络图的扫描顺序,根据所述拓扑网络图的节点组号的实现规则确定节点组号。
作为本发明的一种优选方案,按序扫描所述拓扑网络图后,建立比特币账户字典的实现步骤为:
确定对拓扑网络图的扫描顺序后,可以选择一个集合内的任一个节点编号作为节点组号;
初步扫描所述拓扑网络图的第一条连线,并选择第一条连线的两个节点编号中的一个作为节点组号,根据节点组号的大小顺序来建立第一个比特币账户字典;
扫描所述超大图网络的第二条连线,并选择第一条连线的两个节点编号中的一个作为节点组号,将节点组号按序生成新元素且将所述新元素添加到所述第一个所述比特币账户字典内形成第二个所述比特币账户字典;
重复扫描所述超大图网络的其他连线,依次生成新元素且将所述新元素添加到所述第一个所述比特币账户字典内以最终形成包含所有节点编号的比特币账户字典。
作为本发明的一种优选方案,在步骤403中,初步建立的所述比特币账户字典内包含每一条连线的节点编号,当所有节点编号对应的组号不一致时,则认定所述拓扑网络图内的所有节点编号不连通且未完成分组。
作为本发明的一种优选方案,当认定所述超大图网路内的所有节点编号不连通且未完成分组时,重复步骤402和步骤403,重新遍历所述拓扑网络图时,利用图计算的超步迭代模型对每个节点得到的所述节点组号再次深度寻找组号,直至所有节点的所述节点组号均相同。
本发明与现有技术相比较具有如下有益效果:
本发明通过提供部署在多个区域骨干网络上的数据集群服务,在集群服务中运行多个比特币对交易网络,然后使用图计算服务对整个网络的全量数据进行扫描和特征学习,最后做出聚类结果。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的比特币账户聚类方法的流程示意图;
图2为本发明实施例提供的超大图网络的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种基于图计算的比特币账户聚类方法,本实施方式主要提供一种全量扫描分析整个比特币区块链的交易网络的技术方案,能够精准的识别所有的主体单位,并能够对这些主体单位交易行为进行画像,对有异常的组织进行重点监控,从而达到维护行业安全,健康发展的目的。
“图计算”是以“图论”为基础的对现实世界的一种“图”结构的抽象表达,以及在这种数据结构上的计算模式。通常,在图计算中,基本的数据结构表达就是:G=(V,E,D);V=vertex(顶点或者节点);E=edge(边); D=data(权重)。
图数据结构很好的表达了数据之间的关联性,因此,很多应用中出现的问题都可以抽象成图来表示,以图论的思想或者以图为基础建立模型来解决问题。
而在本实施方式中,由于区块链数字货币系统允许用户自由生成多个钱包地址,用户可以采用不同的钱包地址进行交易,以便减少单个钱包地址携带的用户交易特征,因此,通过分析交易记录从大量假名中找出隶属于同一个用户的假名,并分析出特定用户的交易规律,有助于推测用户的身份信息。
具体包括以下步骤:
步骤100、下载运行比特币节点的客户端,并同步整个网络数据,提取比特币的交易数据;
步骤200、将所述交易数据解析成结构化数据,并收集所述结构化数据中的特征参数。
在此步骤中,所述结构化数据的特征参数包括每项交易数据的发起人钱包地址、接收人钱包地址、交易发起时间和交易结束时间;
所述数据集群中的结构化数据之间形成定点和边的拓扑关系,所述发起人钱包地址和接收人钱包地址为定点,所述交易发起时间和交易结束时间分别为两个定点之间的边数据。
所有的所述结构化数据之间的特征参数构建成超大图网络,所述图计算服务对所述超大图网络的定点进行相关性聚类遍历以得到所述超大图网络的联通子图。
超大图网络由大量的定点以及连接两个定点的边组成,且在正常的区块链数字货币系统中,一个个体仅申请一个钱包地址进行交易,而只有在非法操作的目的才会申请大量的钱包地址进行交易,以减少单个钱包地址携带的用户交易特征,基于此,本实施方式利用图计算先从超大图网络内截取多个联通子图。
同一个联通子图内的某一个定点与其他的定点之间存在一对多的关系,因此也就是说与同一个定点连接的多个定点可能属于同一个用户,通过对多个定点进行遍历溯源和监控,从而可以有效的推测同一个用户的身份信息。
步骤300、将所述结构化数据的特征参数倒入数据集群中。
步骤400、使用图计算服务对所述数据集群的所有特征参数进行扫描和特征学习,得出比特币聚类结果。
在所述步骤400中,所述图计算服务对所述数据集群的所有数据进行扫描和特征学习的实现步骤具体为:
步骤401、收集比特币交易的每一项交易数据,并且确定每一项交易数据的发起人和接收人,且所述发起人和接收人通过定点和边点关系建立交易模型并形成具有交易关系的拓扑网络图。
一项所述交易数据内的发起人同时可作为另一项交易的接收人,且一项交易内的接收人同时可作为另一项交易的发起人,且所述超大图网络由于所有交易的发起人和接收人关系形成拓扑关系。
此步骤中的拓扑网络图即为前文中的联通子图,本实施方式利用图计算系统,计算出每个定点A,A1,A2……(即发起人钱包地址)连接的多个定点B、B1、B2……(即接收人钱包地址),再对多个定点B、B1、B2……进行溯源来确定同一个用户的多个接收人钱包地址,在以多个定点B、B1、B2…… (即接收人钱包地址)为第一视角来确定与其连接的多个定点A,A1,A2……,通过对多个定点A,A1,A2……进行溯源来确定属于同一个用户的发起人钱包地址。
步骤402、确定所述拓扑网络图的每一个节点编号并建立比特币账户字典,将所述节点编号当做每一项交易的节点组号。
首先,设定所述拓扑网络图每一条连线的两个节点编号,每一个连线上的两个节点编号分别为一项交易的发起人编号和该项交易的接收人编号;
然后,设定扫描顺序,按序扫描所述拓扑网络图以建立比特币账户字典,并确定所述拓扑网络图的节点组号。
另外,按序扫描所述拓扑网络图以建立比特币账户字典的实现步骤为:
第一,优先确定拓扑网络图的定点关系,即确定两个定点之间的发起人和接收人,这样可以确定每项交易的矢量关系,在建立比特币账户字典时,账户字典内的每个集合即为一项交易记录,其中将发起人定义为一个集合的第一个元素,而将接收人定义为一个集合的第二个元素。
第二,自定义选择所述拓扑网络图的扫描顺序,根据所述拓扑网络图的节点组号的实现规则确定节点组号。
一个拓扑网络图的两个相邻的定点均可以产生一个集合,而对多个集合的扫描顺序可以根据用户自定义选择。
其中,确定所述拓扑网络图的节点组号的方式具体为:选择节点编号当做节点组号,具体的实现规则为:可以选择每一条连线的任意一个节点编号当做这条连线上两个节点的组号;也可以直接从所述比特币账户字典内选择认定某一个节点编号作为节点的组号。
另外,按序扫描所述拓扑网络图的每一条连线,且依次建立每一条连线的比特币账户字典。
具体的,建立比特币账户字典的实现步骤为:
①确定对拓扑网络图的扫描顺序后,可以选择一个集合内的任一个节点编号作为节点组号;
②初步扫描所述拓扑网络图的第一条连线,并选择第一条连线的两个节点编号中的一个作为节点组号,根据节点组号的大小顺序来建立第一个比特币账户字典;
③扫描所述超大图网络的第二条连线,并选择第一条连线的两个节点编号中的一个作为节点组号,将节点组号按序生成新元素且将所述新元素添加到所述第一个所述比特币账户字典内形成第二个所述比特币账户字典;
④重复扫描所述超大图网络的其他连线,依次生成新元素且将所述新元素添加到所述第一个所述比特币账户字典内以最终形成包含所有节点编号的比特币账户字典。
例如图2所示,两个拓扑网络图存在的矢量关系为(c1,c2)、(c1,c4)、(c2, c3),以及(b1,b2)、(b2,b3);设定按照(c1,c2)–>(c1,c4)–>(c2,c3)–>(b1, b2)–>(b2,b3)的顺序扫这个图,选择节点编号当做节点组号的实现规则,假设都选择小的节点编号作为节点组号。
扫到第1条边(c1,c2)时,建立字典{c1:c1,c2:c1}
扫到第2条边(c1,c4)时,建立字典{c1:c1,c2:c1,c4:c1}
扫到第3条边(c2,c3)时,建立字典{c1:c1,c2:c1,c3:c2,c4:c1}
扫到第4条边(b1,b2)时,建立字典{c1:c1,c2:c1,c3:c2,c4:c1,b1:b1, b2:b1}
扫到第5条边(b2,b3)时,建立字典{c1:c1,c2:c1,c3:c2,c4:c1,b1:b1, b2:b1,b3:b2}
当完全扫描成功后,初步建立了一个比特币账户字典,里面包括拓扑网络图的每一个节点,可以看到,节点c3的组号为c2,和节点c1、c2、c4不一致。按照当前的结果,c3被认定为与其它3个c节点都不连通。所以目前还没有完成分组。为了解决这个问题,当我们再次遍历字典时,需要对每个节点得到的组号再次进行寻找组号的操作,直到得到的组号完全相同。
也就是说,优先选择节点组号后,建立的比特币账户字典包含了拓扑网络图的每一个节点,且还可以对比每个集合对应的节点组号,如果一个比特币账户字典内的节点组号不同,则认为该节点与同一个网络拓扑图内的其他节点不连通,因此还没有找到网络拓扑图的节点组号,即该节点无法推断与其连接的其他节点是否由同一个账户持有,因此为了解决这个问题,当我们再次遍历字典时,需要对每个节点得到的组号再次进行寻找组号的操作,直到得到的每个集合内的节点组号相同。
步骤403、根据组号之间的推理重演再分组,重新确定节点组号直至找到所述组号祖先以保证比特币账户字典中每个节点的节点组号一致,确定所述比特币的聚类结果。
在步骤403中,初步建立的所述比特币账户字典内包含每一条连线的节点编号,当所有节点编号对应的组号不一致时,则认定所述拓扑网络图内的所有节点编号不连通且未完成分组。
当认定所述拓扑网络图内的所有节点编号不连通且未完成分组时,重复步骤402和步骤403,重新遍历所述拓扑网络图时,利用图计算的超步迭代模型对每个节点得到的所述节点组号再次深度寻找组号,直至所有节点的所述节点组号均相同,图计算的超步迭代模型的计算过程是由一系列被称为“超步”的迭代组成的。
在每个超步中,每个顶点上面都会并行执行用户自定义的函数,该函数描述了一个顶点V在一个超步s中需要执行的操作
该函数可以读取前一个超步(S-1)中其他顶点发送给顶点V的消息,执行相应计算后,修改顶点V及其出射边的状态,然后沿着顶点V的出射边发送消息给其他顶点,而且,一个消息可能经过多条边的传递后被发送到任意已知ID 的目标顶点上去这些消息将会在下一个超步(S+1)中被目标顶点接收,然后象上述过程一样开始下一个超步(S+1)的迭代过程。
当节点组号相同时,则认为与其连接的其他节点可通过溯源的方式监控是否有同一个用户持有。
因此本发明的具体方案通过提供部署在多个区域骨干网络上的数据集群服务,然后在这个集群服务中运行比特币交易网络,再使用图计算服务对整个网络对全量数据进行扫描和特征学习,最后做出聚类结果。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (10)

1.一种基于图计算的比特币账户聚类方法,其特征在于,包括以下步骤:
步骤100、下载运行比特币节点的客户端,并同步整个网络数据,提取比特币的交易数据;
步骤200、将所述交易数据解析成结构化数据,并收集所述结构化数据中的特征参数;
步骤300、将所述结构化数据的特征参数倒入数据集群中;
步骤400、使用图计算服务对所述数据集群的所有特征参数进行扫描和特征学习,得出比特币聚类结果。
2.根据权利要求1所述的一种基于图计算的比特币账户聚类方法,其特征在于,在所述步骤200中,所述结构化数据的特征参数包括每项交易数据的发起人钱包地址、接收人钱包地址、交易发起时间和交易结束时间;
所述数据集群中的结构化数据之间形成定点和边的拓扑关系,所述发起人钱包地址和接收人钱包地址为定点,所述交易发起时间和交易结束时间分别为两个定点之间的边数据;
所有的所述结构化数据之间的特征参数构建成超大图网络,所述图计算服务对所述超大图网络的定点进行相关性聚类遍历以得到所述超大图网络的联通子图。
3.根据权利要求2所述的一种基于图计算的比特币账户聚类方法,其特征在于,在所述步骤400中,所述图计算服务对所述数据集群的所有数据进行扫描和特征学习的实现步骤具体为:
步骤401、收集比特币交易的每一项交易数据,并且确定每一项交易数据的发起人和接收人,且所述发起人和接收人通过定点和边点关系建立交易模型并形成具有交易关系的拓扑网络图;
步骤402、确定所述拓扑网络图的每一个节点编号并建立比特币账户字典,将所述节点编号当做每一项交易的节点组号;
步骤403、根据组号之间的推理重演再分组,重新确定节点组号直至找到所述组号祖先以保证比特币账户字典中每个节点的节点组号一致,确定所述比特币的聚类结果。
4.根据权利要求3所述的一种基于图计算的比特币账户聚类方法,其特征在于,在步骤401中,一项所述交易数据内的发起人同时可作为另一项交易的接收人,且一项交易内的接收人同时可作为另一项交易的发起人,且所述超大图网络由于所有交易的发起人和接收人关系形成拓扑关系;
利用图计算系统计算出每个定点A,A1,A2……连接的多个定点B、B1、B2……,再对多个定点B、B1、B2……进行溯源来确定同一个用户的多个接收人钱包地址,在以多个定点B、B1、B2……为第一视角来确定与其连接的多个定点A,A1,A2……,通过对多个定点A,A1,A2……进行溯源来确定属于同一个用户的发起人钱包地址。
5.根据权利要求3所述的一种基于图计算的比特币账户聚类方法,其特征在于,在步骤402中,确定所述拓扑网络图的每一个节点编号的实现步骤为:
设定所述拓扑网络图每一条连线的两个节点编号,每一个连线上的两个节点编号分别为一项交易的发起人编号和该项交易的接收人编号;
设定扫描顺序,按序扫描所述拓扑网络图以建立比特币账户字典,并确定所述拓扑网络图的节点组号。
6.根据权利要求5所述的一种基于图计算的比特币账户聚类方法,其特征在于,确定所述拓扑网络图的节点组号的方式具体为:选择节点编号当做节点组号,具体的实现规则为:
选择每一条连线的任意一个节点编号当做这条连线上两个节点的组号;
从所述比特币账户字典内选择已经有了节点的组号。
7.根据权利要求5所述的一种基于图计算的比特币账户聚类方法,其特征在于,按序扫描所述拓扑网络图以建立比特币账户字典的实现步骤为:
第一,优先确定拓扑网络图的定点关系,即确定两个定点之间的发起人和接收人,这样可以确定每项交易的矢量关系,在建立比特币账户字典时,账户字典内的每个集合即为一项交易记录,其中将发起人定义为一个集合的第一个元素,而将接收人定义为一个集合的第二个元素;
第二,自定义选择所述拓扑网络图的扫描顺序,根据所述拓扑网络图的节点组号的实现规则确定节点组号。
8.根据权利要求5所述的一种基于图计算的比特币账户聚类方法,其特征在于,按序扫描所述拓扑网络图后,建立比特币账户字典的实现步骤为:
确定对拓扑网络图的扫描顺序后,可以选择一个集合内的任一个节点编号作为节点组号;
初步扫描所述拓扑网络图的第一条连线,并选择第一条连线的两个节点编号中的一个作为节点组号,根据节点组号的大小顺序来建立第一个比特币账户字典;
扫描所述超大图网络的第二条连线,并选择第一条连线的两个节点编号中的一个作为节点组号,将节点组号按序生成新元素且将所述新元素添加到所述第一个所述比特币账户字典内形成第二个所述比特币账户字典;
重复扫描所述超大图网络的其他连线,依次生成新元素且将所述新元素添加到所述第一个所述比特币账户字典内以最终形成包含所有节点编号的比特币账户字典。
9.根据权利要求5所述的一种基于图计算的比特币账户聚类方法,其特征在于,在步骤403中,初步建立的所述比特币账户字典内包含每一条连线的节点编号,当所有节点编号对应的组号不一致时,则认定所述拓扑网络图内的所有节点编号不连通且未完成分组。
10.根据权利要求9所述的一种基于图计算的比特币账户聚类方法,其特征在于,当认定所述超大图网路内的所有节点编号不连通且未完成分组时,重复步骤402和步骤403,重新遍历所述拓扑网络图时,利用图计算的超步迭代模型对每个节点得到的所述节点组号再次深度寻找组号,直至所有节点的所述节点组号均相同。
CN202110031717.2A 2021-01-11 2021-01-11 一种基于图计算的比特币账户聚类方法 Active CN112700332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110031717.2A CN112700332B (zh) 2021-01-11 2021-01-11 一种基于图计算的比特币账户聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110031717.2A CN112700332B (zh) 2021-01-11 2021-01-11 一种基于图计算的比特币账户聚类方法

Publications (2)

Publication Number Publication Date
CN112700332A true CN112700332A (zh) 2021-04-23
CN112700332B CN112700332B (zh) 2022-02-25

Family

ID=75513877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110031717.2A Active CN112700332B (zh) 2021-01-11 2021-01-11 一种基于图计算的比特币账户聚类方法

Country Status (1)

Country Link
CN (1) CN112700332B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114119026A (zh) * 2022-01-26 2022-03-01 成都无糖信息技术有限公司 一种虚拟货币交易追踪溯源方法及系统
CN115860933A (zh) * 2022-11-17 2023-03-28 北京理工大学 基于集成学习和图核分类技术的比特币混合服务检测方法
CN116611838A (zh) * 2023-07-18 2023-08-18 湖南益友新材料有限公司 基于区块链的环保混凝土降碳制品碳足迹核算方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150066613A1 (en) * 2011-07-18 2015-03-05 Tiger T G Zhou Internet-based platform and mobile web-based platform combining online and offline gaming, advertising, mobile and wearable digital currency tokens, and commerce providing free games, free products, and free services free of interchange fees
CN109784013A (zh) * 2017-11-14 2019-05-21 阿里巴巴集团控股有限公司 一种信息识别的方法、装置以及设备
CN109918584A (zh) * 2019-03-25 2019-06-21 中国科学院自动化研究所 比特币交易所地址识别方法、系统、装置
CN111008836A (zh) * 2019-11-15 2020-04-14 哈尔滨工业大学(深圳) 一种基于可监管区块链的隐私安全转账支付方法、装置、系统及存储介质
JP2020067853A (ja) * 2018-10-25 2020-04-30 マツダ株式会社 仮想通貨管理装置及び仮想通貨管理方法
CN111104571A (zh) * 2019-11-20 2020-05-05 中山大学 一种基于比特币交易时序序列相似性的用户聚类方法
CN111383005A (zh) * 2018-12-29 2020-07-07 北京知帆科技有限公司 数字货币流向追踪方法及装置
CN111445243A (zh) * 2020-03-17 2020-07-24 北京达龙上东文化艺术传播有限责任公司 一种用于数字货币的钱包终端、货币交易系统、交易方法
CN111652732A (zh) * 2020-05-26 2020-09-11 北京理工大学 一种基于交易图匹配的比特币异常交易实体识别方法
CN111882446A (zh) * 2020-07-28 2020-11-03 哈尔滨工业大学(威海) 一种基于图卷积网络的异常账户检测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150066613A1 (en) * 2011-07-18 2015-03-05 Tiger T G Zhou Internet-based platform and mobile web-based platform combining online and offline gaming, advertising, mobile and wearable digital currency tokens, and commerce providing free games, free products, and free services free of interchange fees
CN109784013A (zh) * 2017-11-14 2019-05-21 阿里巴巴集团控股有限公司 一种信息识别的方法、装置以及设备
JP2020067853A (ja) * 2018-10-25 2020-04-30 マツダ株式会社 仮想通貨管理装置及び仮想通貨管理方法
CN111383005A (zh) * 2018-12-29 2020-07-07 北京知帆科技有限公司 数字货币流向追踪方法及装置
CN109918584A (zh) * 2019-03-25 2019-06-21 中国科学院自动化研究所 比特币交易所地址识别方法、系统、装置
CN111008836A (zh) * 2019-11-15 2020-04-14 哈尔滨工业大学(深圳) 一种基于可监管区块链的隐私安全转账支付方法、装置、系统及存储介质
CN111104571A (zh) * 2019-11-20 2020-05-05 中山大学 一种基于比特币交易时序序列相似性的用户聚类方法
CN111445243A (zh) * 2020-03-17 2020-07-24 北京达龙上东文化艺术传播有限责任公司 一种用于数字货币的钱包终端、货币交易系统、交易方法
CN111652732A (zh) * 2020-05-26 2020-09-11 北京理工大学 一种基于交易图匹配的比特币异常交易实体识别方法
CN111882446A (zh) * 2020-07-28 2020-11-03 哈尔滨工业大学(威海) 一种基于图卷积网络的异常账户检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郁鸣辰: "面向取证场景的社交网络用户身份识别研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114119026A (zh) * 2022-01-26 2022-03-01 成都无糖信息技术有限公司 一种虚拟货币交易追踪溯源方法及系统
CN114119026B (zh) * 2022-01-26 2022-04-01 成都无糖信息技术有限公司 一种虚拟货币交易追踪溯源方法及系统
CN115860933A (zh) * 2022-11-17 2023-03-28 北京理工大学 基于集成学习和图核分类技术的比特币混合服务检测方法
CN116611838A (zh) * 2023-07-18 2023-08-18 湖南益友新材料有限公司 基于区块链的环保混凝土降碳制品碳足迹核算方法
CN116611838B (zh) * 2023-07-18 2023-09-22 湖南益友新材料有限公司 基于区块链的环保混凝土降碳制品碳足迹核算方法

Also Published As

Publication number Publication date
CN112700332B (zh) 2022-02-25

Similar Documents

Publication Publication Date Title
CN112700332B (zh) 一种基于图计算的比特币账户聚类方法
CN107193894B (zh) 数据处理方法、个体识别方法及相关装置
CN109741173B (zh) 可疑洗钱团伙的识别方法、装置、设备及计算机存储介质
CN112543176A (zh) 一种异常网络访问检测方法、装置、存储介质及终端
CN110213164B (zh) 一种基于拓扑信息融合的识别网络关键传播者的方法及装置
CN112100250B (zh) 数据处理方法及装置
CN105574649B (zh) 一种基于多阶段MapReduce模型的纳税人偷漏税嫌疑群组检测方法
CN112256981A (zh) 一种基于线性和非线性传播的谣言检测方法
CN111325417A (zh) 实现隐私保护的多方协同更新业务预测模型的方法及装置
CN113064953B (zh) 基于邻居信息聚合的区块链地址聚类方法及装置
CN112615888A (zh) 一种网络攻击行为的威胁评估方法及装置
CN110224859A (zh) 用于识别团伙的方法和系统
Xueshuo et al. AWAP: Adaptive weighted attribute propagation enhanced community detection model for bitcoin de-anonymization
CN104965846A (zh) MapReduce平台上的虚拟人建立方法
Tao et al. Structural identity representation learning for blockchain-enabled metaverse based on complex network analysis
El Ayeb et al. Community detection for mobile money fraud detection
CN112235254B (zh) 一种高速主干网中Tor网桥的快速识别方法
CN106156256A (zh) 一种用户信息分类透传方法及系统
CN115293872A (zh) 建立风险识别模型的方法及对应装置
CN110310138A (zh) 一种确定用户关系的方法及装置
Trehan Self-healing using virtual structures
CN113051144B (zh) 一种智能合约推荐方法及装置
CN115277260B (zh) 一种物联网云平台脆弱性检测方法及系统
CN116484026B (zh) 基于知识图谱的人物关系推理方法、装置及电子设备
CN109712010A (zh) 发现社团的方法和装置、计算设备、可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant