CN110363510A - 一种基于区块链的加密货币用户特征挖掘、异常用户检测方法 - Google Patents
一种基于区块链的加密货币用户特征挖掘、异常用户检测方法 Download PDFInfo
- Publication number
- CN110363510A CN110363510A CN201910488285.0A CN201910488285A CN110363510A CN 110363510 A CN110363510 A CN 110363510A CN 201910488285 A CN201910488285 A CN 201910488285A CN 110363510 A CN110363510 A CN 110363510A
- Authority
- CN
- China
- Prior art keywords
- user
- transaction
- address
- feature
- block chain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/04—Payment circuits
- G06Q20/06—Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme
- G06Q20/065—Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme using e-cash
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/382—Payment protocols; Details thereof insuring higher security of transaction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Engineering & Computer Science (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于区块链的特征挖掘技术领域,公开了一种基于区块链的加密货币用户特征挖掘、异常用户检测方法,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息;采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;然后提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。本发明针对区块链加密货币的匿名性,从区块链中提取有价值的结果,检测用户的异常交易,有助于对加密货币洗钱等违法事件的监管。
Description
技术领域
本发明属于区块链的特征挖掘技术领域,尤其涉及一种基于区块链的加密货币用户特征挖掘、异常用户检测方法。
背景技术
目前,最接近的现有技术:大多是基于无监督机器学习的加密货币交易匿名性分析,包括使用K-means聚类、无监督支持向量机等算法,对真实的数据进行异常检测。这些方法的缺陷在于:首先,没有对原始的交易数据进行启发式用户地址聚类,没有完全将用户所持有的地址划分到用户地址集合当中,因而导致用户集群范围的精确度降低;其次,这些方法没有对用户进行详细的特征挖掘,没有明确给出正常用户与异常用户的划分条件;然后,这些方法使用的算法缺乏估计密度的能力;最后,这些方法异常交易的检测效果不佳,成功率在10%左右,并且是在不考虑混币服务的前提下。
使用本发明所述一种基于区块链的加密货币用户特征挖掘、异常用户检测方法,首先,使用了启发式用户地址聚类方法,能够全面的将用户持有地址划分到其地址集合中,提高了后续建模的精确性;其次,对用户特征进行了详细的挖掘,包括十个方面的特征,丰富的描述了用户存在的各种特点,并且给出正常用户与异常用户的6个划分条件,对后续用户聚类得到的集群分类起关键作用;然后,使用高斯混合模型对用户进行聚类,该算法是基于概率的算法,从密度估计角度进行聚类;最后,在考虑混币服务的情况下,异常交易检测成功率提高到30%左右。
近年来,政府和其他政治机构也对加密货币的不可追溯性非常关切,因为缺乏一个监督和监管加密货币的中央机构,会给社会带来洗钱等非法活动的风险。2018年3月26日,欧洲刑警组织破获一超大规模涉及加密货币洗钱的网络犯罪团伙,在5年时间里,他们总计盗取全球银行约10亿欧元,并将非法收益转化为加密货币。由此可见,建立对加密货币洗钱的监管是非常迫切和重要的。
综上所述,现有技术存在的问题是:对加密货币用户特征挖掘不全面的问题,异常交易检测的效果不佳的问题。
解决上述技术问题的难度和意义:针对加密货币的匿名性,基于区块链的特征挖掘及异常检测,其实是极富挑战性的。第一,加密货币是分布式的,没有任何中央机构对其进行管制,交易数据复杂、不易解析。第二,每个用户拥有任意数量的地址,找出用户的所有地址难度极高,对算力的要求也非常高,因此需要优良的用户地址聚类方法。第三,目前加密货币用户特征类别模糊,需要大量数据统计分析,区分正常用户与异常用户特征,从而进行异常检测。因此,研究区块链的用户特征挖掘以及异常用户检测具有深远的实践意义。
发明内容
针对现有技术存在的问题,本发明提供了一种基于区块链的加密货币用户特征挖掘、异常用户检测方法。
本发明是这样实现的,一种基于区块链的加密货币用户特征挖掘、异常用户检测方法,所述基于区块链的加密货币用户特征挖掘、异常用户检测方法括以下步骤:
步骤一,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳;
步骤二,采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;
步骤三,提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;
步骤四,使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
进一步,所述步骤一获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳具体包括:
首先,从BlockChair获取区块链交易原始数据,包括inputs、outputs和transactions三个部分;
然后,将三个部分的原始数据进行处理整合;
最后,获取交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息。
进一步,所述步骤二采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号具体包括:
首先,判断交易类型是否为产量交易;
然后,识别非产量交易输出地址中的找零地址;
最后,更新用户地址集合。
进一步,所述找零地址的特征有:
特征一:作为输出地址的情况通常只有一次;
特征二:不会同时出现在一笔交易的输入地址和输出地址;
特征三:一笔交易的输出地址不能只有找零地址。
识别交易t的找零地址a的算法如下:
1)地址a只作为一次交易t的输出;
2)交易t不是产量交易;
3)对于a′∈Inputs(t),不存在a′∈Outputs(t),即交易t不是“自我找零”交易;
4)对于a′∈Outputs(t),不存在a′≠a但a′只作为一次交易的输出,即对于交易的所有输出,条件1)只对a满足。
其中,Inputs(t)为交易的输入地址集合,Outputs(t)为交易的输出地址集合。
进一步,所述更新用户地址集合方法具体包括:
若交易为产量交易:
1)若且Outputs(t)≠Addr(u),则继续遍历交易;
2)若则新建Addr(u),使Addr(u)=Outputs(t);
若交易为非产量交易:
1)若且Inputs(t)≠Addr(u),则更新Addr(u),使Addr(u)=Addr(u)∪Inputs(t)∪ChangeAddr(t);
2)若则新建Addr(u),使Addr(u)=Inputs(t)∪ChangeAddr(t)。
其中,Addr(u)为用户u的地址集合,ChangeAddr(t)为交易t中的找零地址。
进一步,所述步骤三的提取用户特征、用户特征分类,用户特征具体包括:
特征一:地址数,表示用户拥有的地址数量;
特征二:交易数,表示用户出现的交易数量;
特征三:平均输入地址数,表示用户地址在交易中作为输入地址的平均数量;
特征四:平均输出地址数,表示用户地址在交易中作为输出地址的平均数量;
特征五:用户入度,表示用户作为接收方,其发送方的数量;
特征六:用户出度,表示用户作为发送方,其接收方的数量;
特征七:平均接收金额,表示用户地址在交易中平均接收加密货币的金额;
特征八:平均发送金额,表示用户地址在交易中平均发送加密货币的金额;
特征九:用户活跃时间范围,表示用户第一笔交易到最近一次交易的时间间隔;
特征十:地址平均活跃时间范围,表示用户地址的第一笔交易到最近一次交易的平均时间间隔。
用户特征分类分为正常用户和可疑用户,正常用户分为消费者、长期投资者、短期投资者和早期采用者;可疑用户分为洗钱者和盗窃者。具体划分条件包括:
消费者:地址数应该小于或等于平均值;平均发送和接收金额应该基本持平,并且金额接近中值;
长期投资者:较长的用户活跃时间范围和地址平均活跃时间范围;交易数应该较低并且平均接收金额应该较高;
短期投资者:交易数应该较高;地址平均活跃时间范围较短;
早期采用者:很长的用户活跃时间范围;交易量接近中值;
洗钱者:显著高的平均输入地址数和平均输出地址数并且地址具有一次性特点;平均接收和发送金额基本持平并且较低;显著短的地址平均活跃时间范围;
盗窃者:地址数较高;地址之间具有稳定的加密货币转移交易;平均接收和发送金额基本持平;地址平均活跃时间范围较短。
进一步,所述步骤四使用高斯混合模型对用户进行聚类:
其中,πk是权值因子,它表示在训练集中数据点属于类别Zk的概率,μk是集群中心,∑k是协方差矩阵。
从用户特征数据集中筛选出符合正常用户特征的数据点作为训练集,然后将整个用户特征数据集作为测试集。
最后,将聚类出的不同集群特征与用户分类的特征对比,找出异常集群,进而在异常集群中找出疑似异常的用户。
本发明的另一目的在于提供一种基于所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法的基于区块链的特征挖掘及异常检测系统,所述基于区块链的特征挖掘及异常检测系统包括:
预处理模块,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息;
用户处理模块,采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;
特征提取模块,提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;
异常检测模块,使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
本发明的另一目的在于提供一种应用所述基于区块链的加密货币用户特征挖掘、异常用户检测方法的信息数据处理终端。
本发明的另一目的在于提供一种应用所述基于区块链的加密货币用户特征挖掘、异常用户检测方法的异常用户检测系统。
综上所述,本发明的优点及积极效果为:本发明通过对加密货币区块链交易数据的处理,得到特征挖掘所需的基本交易信息;提供了一种启发式用户地址聚类方法,能够尽可能地将用户拥有的地址与用户id对应。本发明使用高斯混合模型对用户进行聚类,根据用户分类的特征,成功找出疑似异常的用户。本发明的部分实验结果如图6所示,包括了2012年3月第一周的51482个用户的降维后聚类情况,图(a)为每个集群的用户数量柱状图,图(b)可以看出左上角3个蓝色圆点与其他点偏离程度很大,根据用户分类特征归为可疑用户,最后成功找到一个用户为异常用户。本发明提供基于区块链的加密货币用户特征挖掘、异常用户检测方法,有助于检测加密货币洗钱等非法事件以及监管,对缺乏中心机构管理的加密货币市场的维护具有深远的实践意义。
附图说明
图1是本发明实施例提供的基于区块链的加密货币用户特征挖掘、异常用户检测方法流程图。
图2是本发明实施例提供的数据预处理阶段示意图。
图3是本发明实施例提供的用户处理阶段示意图。
图4是本发明实施例提供的特征挖掘阶段示意图。
图5是本发明实施例提供的异常检测阶段示意图。
图6是本发明实施例提供的用户聚类结果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合附图对本发明的应用原理作详细的描述。
如图1所示,本发明实施例提供的基于区块链的加密货币用户特征挖掘、异常用户检测方法包括以下步骤:
S101:预处理模块,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息;
S102:用户处理模块,采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;
S103:特征挖掘模块,提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;
S104:异常检测模块,使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
下面结合附图对本发明的应用原理作详细的描述。
如图2-图5所示,本发明包括数据预处理阶段、用户处理阶段、特征挖掘阶段以及异常检测四个阶段。
(1)数据预处理阶段:
如图2,在预处理阶段,首先,从BlockChair获取区块链交易原始数据,包括inputs、outputs和transactions三个部分;然后,将三个部分的原始数据进行处理整合;最后,获取交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息。
(2)用户处理阶段:
如图3,描述了本发明的数据处理阶段。首先,判断交易类型是否为产量交易;然后,识别非产量交易输出地址中的找零地址;最后,更新用户地址集合。
其中,找零地址的特征,具体如下:
特征一:作为输出地址的情况通常只有一次;
特征二:不会同时出现在一笔交易的输入地址和输出地址(不需考虑“自我找零”的情况);
特征三:一笔交易的输出地址不能只有找零地址。
其中,识别交易t的找零地址a的算法如下:
1)地址a只作为一次交易t的输出;
2)交易t不是产量交易;
3)对于a′∈Inputs(t),不存在a′∈Outputs(t),即交易t不是“自我找零”交易;
4)对于a′∈Outputs(t),不存在a′≠a但a′只作为一次交易的输出,即对于交易的所有输出,条件1)只对a满足。
其中,Inputs(t)为交易的输入地址集合,Outputs(t)为交易的输出地址集合。
其中,更新用户地址集合方法具体包括:
若交易为产量交易:
1)若且Outputs(t)≠Addr(u),则继续遍历交易;
2)若则新建Addr(u),使Addr(u)=Outputs(t);
若交易为非产量交易:
1)若且Inputs(t)≠Addr(u),则更新Addr(u),使Addr(u)=Addr(u)∪Inputs(t)∪ChangeAddr(t);
2)若则新建Addr(u),使Addr(u)=Inputs(t)∪ChangeAddr(t)。
其中,Addr(u)为用户u的地址集合,ChangeAddr(t)为交易t中的找零地址。
(3)特征挖掘阶段:
如图4,描述了用户特征挖掘阶段。包括提取用户特征、用户特征分析及数据统计、用户特征分类。
其中,用户特征具体包括:
特征一:地址数,表示用户拥有的地址数量;
特征二:交易数,表示用户出现的交易数量;
特征三:平均输入地址数,表示用户地址在交易中作为输入地址的平均数量;
特征四:平均输出地址数,表示用户地址在交易中作为输出地址的平均数量;
特征五:用户入度,表示用户作为接收方,其发送方的数量;
特征六:用户出度,表示用户作为发送方,其接收方的数量;
特征七:平均接收金额,表示用户地址在交易中平均接收加密货币的金额;
特征八:平均发送金额,表示用户地址在交易中平均发送加密货币的金额;
特征九:用户活跃时间范围,表示用户第一笔交易到最近一次交易的时间间隔;
特征十:地址平均活跃时间范围,表示用户地址的第一笔交易到最近一次交易的平均时间间隔。
其中,用户特征数据统计包括:特征平均值、中值、最小值和最大值。
其中,用户特征分类分为正常用户和可疑用户,正常用户分为消费者、长期投资者、短期投资者和早期采用者;可疑用户分为洗钱者和盗窃者。具体划分条件包括:
消费者:地址数应该小于或等于平均值;平均发送和接收金额应该基本持平,并且金额接近中值;
长期投资者:较长的用户活跃时间范围和地址平均活跃时间范围;交易数应该较低并且平均接收金额应该较高;
短期投资者:交易数应该较高;地址平均活跃时间范围较短;
早期采用者:很长的用户活跃时间范围;交易量接近中值;
洗钱者:显著高的平均输入地址数和平均输出地址数并且地址具有一次性特点;平均接收和发送金额基本持平并且较低;显著短的地址平均活跃时间范围;
盗窃者:地址数较高;地址之间具有稳定的加密货币转移交易;平均接收和发送金额基本持平;地址平均活跃时间范围较短。
(4)异常检测阶段:
如图5,描述了异常检测阶段。包括使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
其中,使用高斯混合模型对用户进行聚类:
其中,πk是权值因子,它表示在训练集中数据点属于类别Zk的概率,μk是集群中心,∑k是协方差矩阵。
从用户特征数据集中筛选出符合正常用户特征的数据点作为训练集,然后将整个用户特征数据集作为测试集。
最后,将聚类出的不同集群特征与用户分类的特征对比,找出异常集群,进而在异常集群中找出疑似异常的用户。
本发明通过对加密货币区块链交易数据的处理,得到特征挖掘所需的基本交易信息。本发明提供了一种启发式用户地址聚类方法,能够尽可能地将用户拥有的地址与用户id对应。本发明使用高斯混合模型对用户进行聚类,根据用户分类的特征,成功找出疑似异常的用户。本发明提供基于区块链的加密货币用户特征挖掘、异常用户检测方法,有助于检测加密货币洗钱等非法事件以及监管,对缺乏中心机构管理的加密货币市场的维护具有深远的实践意义。
如图6,显示了用户聚类过程的部分结果,包括了2012年3月第一周的51482个用户的降维后聚类情况,图(a)为每个集群的用户数量柱状图,图(b)可以看出左上角3个蓝色圆点与其他点偏离程度很大,根据用户分类特征归为可疑用户,最后成功找到一个用户为异常用户。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述基于区块链的加密货币用户特征挖掘、异常用户检测方法包括以下步骤:
步骤一,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳;
步骤二,采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;
步骤三,提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;
步骤四,使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
2.如权利要求1所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述步骤一获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳具体包括:
首先,从BlockChair获取区块链交易原始数据,包括inputs、outputs和transactions三个部分;
然后,将三个部分的原始数据进行处理整合;
最后,获取交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息。
3.如权利要求1所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述步骤二采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号具体包括:
首先,判断交易类型是否为产量交易;
然后,识别非产量交易输出地址中的找零地址;
最后,更新用户地址集合。
4.如权利要求3所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述找零地址的特征有:
特征一:作为输出地址的情况通常只有一次;
特征二:不会同时出现在一笔交易的输入地址和输出地址;
特征三:一笔交易的输出地址不能只有找零地址;
识别交易t的找零地址a的算法如下:
1)地址a只作为一次交易t的输出;
2)交易t不是产量交易;
3)对于a′∈Inputs(t),不存在a′∈Outputs(t),即交易t不是“自我找零”交易;
4)对于a′∈Outputs(t),不存在a′≠a但a′只作为一次交易的输出,即对于交易的所有输出,条件1)只对a满足;
其中,Inputs(t)为交易的输入地址集合,Outputs(t)为交易的输出地址集合。
5.如权利要求3所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述更新用户地址集合方法具体包括:
若交易为产量交易:
1)若且Outputs(t)≠Addr(u),则继续遍历交易;
2)若则新建Addr(u),使Addr(u)=Outputs(t);
若交易为非产量交易:
1)若且Inputs(t)≠Addr(u),则更新Addr(u),使Addr(u)=Addr(u)∪Inputs(t)∪ChangeAddr(t);
2)若则新建Addr(u),使Addr(u)=Inputs(t)∪ChangeAddr(t);
其中,Addr(u)为用户u的地址集合,ChangeAddr(t)为交易t中的找零地址。
6.如权利要求1所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述步骤三的提取用户特征、用户特征分类,用户特征具体包括:
特征一:地址数,表示用户拥有的地址数量;
特征二:交易数,表示用户出现的交易数量;
特征三:平均输入地址数,表示用户地址在交易中作为输入地址的平均数量;
特征四:平均输出地址数,表示用户地址在交易中作为输出地址的平均数量;
特征五:用户入度,表示用户作为接收方,其发送方的数量;
特征六:用户出度,表示用户作为发送方,其接收方的数量;
特征七:平均接收金额,表示用户地址在交易中平均接收加密货币的金额;
特征八:平均发送金额,表示用户地址在交易中平均发送加密货币的金额;
特征九:用户活跃时间范围,表示用户第一笔交易到最近一次交易的时间间隔;
特征十:地址平均活跃时间范围,表示用户地址的第一笔交易到最近一次交易的平均时间间隔;
用户特征分类分为正常用户和可疑用户,正常用户分为消费者、长期投资者、短期投资者和早期采用者;可疑用户分为洗钱者和盗窃者。具体划分条件包括:
消费者:地址数应该小于或等于平均值;平均发送和接收金额应该基本持平,并且金额接近中值;
长期投资者:较长的用户活跃时间范围和地址平均活跃时间范围;交易数应该较低并且平均接收金额应该较高;
短期投资者:交易数应该较高;地址平均活跃时间范围较短;
早期采用者:很长的用户活跃时间范围;交易量接近中值;
洗钱者:显著高的平均输入地址数和平均输出地址数并且地址具有一次性特点;平均接收和发送金额基本持平并且较低;显著短的地址平均活跃时间范围;
盗窃者:地址数较高;地址之间具有稳定的加密货币转移交易;平均接收和发送金额基本持平;地址平均活跃时间范围较短。
7.如权利要求1所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法,其特征在于,所述步骤四使用高斯混合模型对用户进行聚类:
其中,πk是权值因子,它表示在训练集中数据点属于类别Zk的概率,μk是集群中心,∑k是协方差矩阵;
从用户特征数据集中筛选出符合正常用户特征的数据点作为训练集,然后将整个用户特征数据集作为测试集;
最后,将聚类出的不同集群特征与用户分类的特征对比,找出异常集群,进而在异常集群中找出疑似异常的用户。
8.一种如权利要求1所述的基于区块链的加密货币用户特征挖掘、异常用户检测方法的基于区块链的特征挖掘及异常检测系统,其特征在于,所述基于区块链的特征挖掘及异常检测系统包括:
预处理模块,获取区块链加密货币的交易数据,对交易数据进行处理,得到交易id、发送方假名、接收方假名、交易加密货币数量和交易时间戳等交易基本信息;
用户处理模块,采用基于启发式的加密货币地址聚类方法将用户的假名进行聚类,同时将用户进行编号;
特征提取模块,提取用户特征,并对其进行分析、数据统计,将不同类型的用户特征进行分类,区分正常用户与异常用户特征;
异常检测模块,使用高斯混合模型对用户进行聚类,根据用户分类的特征,找出疑似异常的用户。
9.一种应用权利要求1~7任意一项所述基于区块链的加密货币用户特征挖掘、异常用户检测方法的信息数据处理终端。
10.一种应用权利要求1~7任意一项所述基于区块链的加密货币用户特征挖掘、异常用户检测方法的异常用户检测系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910488285.0A CN110363510B (zh) | 2019-06-05 | 2019-06-05 | 一种基于区块链的加密货币用户特征挖掘、异常用户检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910488285.0A CN110363510B (zh) | 2019-06-05 | 2019-06-05 | 一种基于区块链的加密货币用户特征挖掘、异常用户检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110363510A true CN110363510A (zh) | 2019-10-22 |
CN110363510B CN110363510B (zh) | 2022-09-06 |
Family
ID=68215678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910488285.0A Active CN110363510B (zh) | 2019-06-05 | 2019-06-05 | 一种基于区块链的加密货币用户特征挖掘、异常用户检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110363510B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111475566A (zh) * | 2019-12-31 | 2020-07-31 | 众安信息技术服务有限公司 | 一种区块链资金可疑交易模式的识别方法及装置 |
CN111507723A (zh) * | 2020-06-18 | 2020-08-07 | 海南安迈云网络技术有限公司 | 一种数字资产管理交易加密的方法 |
CN111552609A (zh) * | 2020-04-12 | 2020-08-18 | 西安电子科技大学 | 一种异常状态检测方法、系统、存储介质、程序、服务器 |
CN111667318A (zh) * | 2020-06-18 | 2020-09-15 | 广州市九重天信息科技有限公司 | 一种基于区块链特征的虚拟货币价格波动溯源方法 |
CN114445225A (zh) * | 2022-01-28 | 2022-05-06 | 上海对外经贸大学 | 基于区块链的洗钱交易行为识别方法 |
CN116611829A (zh) * | 2023-07-21 | 2023-08-18 | 山东美丽乡村云计算有限公司 | 一种基于区块链的消费监管系统 |
CN117395162A (zh) * | 2023-12-12 | 2024-01-12 | 中孚信息股份有限公司 | 利用加密流量识别操作系统的方法、系统、设备及介质 |
CN117910025A (zh) * | 2024-03-20 | 2024-04-19 | 神州数码融信云技术服务有限公司 | 一种金融服务数据安全存储保护方法 |
CN118070201A (zh) * | 2024-04-22 | 2024-05-24 | 湖南高阳通联信息技术有限公司 | 基于区块链的第三方支付异常交易检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180293576A1 (en) * | 2017-04-05 | 2018-10-11 | Samsung Sds Co., Ltd. | System for custom currency transaction based on blockchain and operating method thereof |
CN108737430A (zh) * | 2018-05-25 | 2018-11-02 | 全链通有限公司 | 区块链节点的加密通信方法和系统 |
CN108805747A (zh) * | 2018-06-13 | 2018-11-13 | 山东科技大学 | 一种基于半监督学习的异常用电用户检测方法 |
CN109684118A (zh) * | 2018-12-10 | 2019-04-26 | 深圳前海微众银行股份有限公司 | 异常数据的检测方法、装置、设备及计算机可读存储介质 |
-
2019
- 2019-06-05 CN CN201910488285.0A patent/CN110363510B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180293576A1 (en) * | 2017-04-05 | 2018-10-11 | Samsung Sds Co., Ltd. | System for custom currency transaction based on blockchain and operating method thereof |
CN108737430A (zh) * | 2018-05-25 | 2018-11-02 | 全链通有限公司 | 区块链节点的加密通信方法和系统 |
CN108805747A (zh) * | 2018-06-13 | 2018-11-13 | 山东科技大学 | 一种基于半监督学习的异常用电用户检测方法 |
CN109684118A (zh) * | 2018-12-10 | 2019-04-26 | 深圳前海微众银行股份有限公司 | 异常数据的检测方法、装置、设备及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
毛洪亮等: "基于启发式的比特币地址聚类方法", 《北京邮电大学学报》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111475566A (zh) * | 2019-12-31 | 2020-07-31 | 众安信息技术服务有限公司 | 一种区块链资金可疑交易模式的识别方法及装置 |
CN111552609B (zh) * | 2020-04-12 | 2022-03-11 | 西安电子科技大学 | 一种异常状态检测方法、系统、存储介质、程序、服务器 |
CN111552609A (zh) * | 2020-04-12 | 2020-08-18 | 西安电子科技大学 | 一种异常状态检测方法、系统、存储介质、程序、服务器 |
CN111667318B (zh) * | 2020-06-18 | 2023-03-03 | 广州市九重天信息科技有限公司 | 一种基于区块链特征的虚拟货币价格波动溯源方法 |
CN111667318A (zh) * | 2020-06-18 | 2020-09-15 | 广州市九重天信息科技有限公司 | 一种基于区块链特征的虚拟货币价格波动溯源方法 |
CN111507723A (zh) * | 2020-06-18 | 2020-08-07 | 海南安迈云网络技术有限公司 | 一种数字资产管理交易加密的方法 |
CN114445225A (zh) * | 2022-01-28 | 2022-05-06 | 上海对外经贸大学 | 基于区块链的洗钱交易行为识别方法 |
CN116611829A (zh) * | 2023-07-21 | 2023-08-18 | 山东美丽乡村云计算有限公司 | 一种基于区块链的消费监管系统 |
CN116611829B (zh) * | 2023-07-21 | 2023-11-14 | 山东美丽乡村云计算有限公司 | 一种基于区块链的消费监管系统 |
CN117395162A (zh) * | 2023-12-12 | 2024-01-12 | 中孚信息股份有限公司 | 利用加密流量识别操作系统的方法、系统、设备及介质 |
CN117395162B (zh) * | 2023-12-12 | 2024-02-23 | 中孚信息股份有限公司 | 利用加密流量识别操作系统的方法、系统、设备及介质 |
CN117910025A (zh) * | 2024-03-20 | 2024-04-19 | 神州数码融信云技术服务有限公司 | 一种金融服务数据安全存储保护方法 |
CN117910025B (zh) * | 2024-03-20 | 2024-05-24 | 神州数码融信云技术服务有限公司 | 一种金融服务数据安全存储保护方法 |
CN118070201A (zh) * | 2024-04-22 | 2024-05-24 | 湖南高阳通联信息技术有限公司 | 基于区块链的第三方支付异常交易检测方法 |
CN118070201B (zh) * | 2024-04-22 | 2024-07-19 | 湖南高阳通联信息技术有限公司 | 基于区块链的第三方支付异常交易检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110363510B (zh) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110363510A (zh) | 一种基于区块链的加密货币用户特征挖掘、异常用户检测方法 | |
CN112053221A (zh) | 一种基于知识图谱的互联网金融团伙欺诈行为检测方法 | |
Xing et al. | Employing latent dirichlet allocation for fraud detection in telecommunications | |
US12020258B2 (en) | Method, use thereof, computer program product and system for fraud detection | |
CN106131017B (zh) | 基于可信计算的云计算信息安全可视化系统 | |
CN110110093A (zh) | 一种基于知识图谱的识别方法、装置、电子设备及存储介质 | |
US9280658B2 (en) | System and method for systematic detection of fraud rings | |
CN112668614B (zh) | 一种反洗钱研判方法 | |
Liu et al. | A scan statistics based suspicious transactions detection model for anti-money laundering (AML) in financial institutions | |
Savage et al. | Detection of money laundering groups: Supervised learning on small networks | |
CN111145027A (zh) | 一种疑似洗钱交易识别方法及装置 | |
CN115759640A (zh) | 一种智慧城市的公共服务信息处理系统及方法 | |
CN113487241A (zh) | 企业环保信用等级的分类方法、装置、设备及存储介质 | |
Weiss | Data mining in the telecommunications industry | |
Torra | Privacy in data mining | |
CN112185083A (zh) | 一种重复报警判断方法 | |
CN113919415A (zh) | 一种基于无监督算法的异常群组检测方法 | |
Leite et al. | Network Analysis for Financial Fraud Detection. | |
CN115222531A (zh) | 案件分析的方法、装置及系统 | |
CN114493858A (zh) | 一种非法资金转移可疑交易监测方法及相关组件 | |
CN114021637A (zh) | 一种基于度量空间下去中心化应用加密流量分类方法及装置 | |
CN117688055B (zh) | 一种基于关联网络分析技术的保险黑产识别与应对系统 | |
Il-Agure | Anomalies in link mining based on mutual information | |
CN111105303A (zh) | 基于增量式网络表征学习的网络借贷欺诈检测方法 | |
CN116705340B (zh) | 一种基于区块链的公共卫生智慧监测系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |