CN113469816A - 基于多组学技术的数字货币识别方法、系统和存储介质 - Google Patents
基于多组学技术的数字货币识别方法、系统和存储介质 Download PDFInfo
- Publication number
- CN113469816A CN113469816A CN202111029375.7A CN202111029375A CN113469816A CN 113469816 A CN113469816 A CN 113469816A CN 202111029375 A CN202111029375 A CN 202111029375A CN 113469816 A CN113469816 A CN 113469816A
- Authority
- CN
- China
- Prior art keywords
- transaction
- transaction data
- data
- network
- technology
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000005516 engineering process Methods 0.000 title claims abstract description 67
- 238000001514 detection method Methods 0.000 claims abstract description 40
- 238000003062 neural network model Methods 0.000 claims abstract description 33
- 238000004458 analytical method Methods 0.000 claims abstract description 29
- 230000004186 co-expression Effects 0.000 claims abstract description 23
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 23
- 238000004088 simulation Methods 0.000 claims abstract description 9
- 238000010801 machine learning Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 42
- 230000006870 function Effects 0.000 claims description 16
- 230000003993 interaction Effects 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 abstract description 5
- 230000010354 integration Effects 0.000 abstract description 3
- 239000011159 matrix material Substances 0.000 description 20
- 239000013598 vector Substances 0.000 description 20
- 238000004900 laundering Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000012706 support-vector machine Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005295 random walk Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000013090 high-throughput technology Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明公开的一种基于多组学技术的数字货币识别方法、系统和存储介质,其中方法包括:基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据;通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据;将所述数字资产交易数据输入到训练好的非法交易神经网络模型中,以得到模拟输出结果,进而提取交易识别结果。本发明通过多组学研究以明确交易账户的类型以及交易的具体流程,通过多层次与高通量组学数据的整合分析,可以精准追踪到问题账户,快速高效且准确性高;同时利用分布式机器学习可以大幅提高计算效率与使用延展性。
Description
技术领域
本发明涉及数字货币技术领域,更具体的,涉及一种基于多组学技术的数字货币识别方法、系统和存储介质。
背景技术
数字货币因其基于数学和密码学原理的强大安全性而越来越受欢迎,可是,数字货币的出现和扩散使用户能够规避法定货币,并在花钱或收款 (BTC) 时避免审查,一方面,这种伪匿名允许用户隐藏他们的财富并保留他们的隐私,另一方面,它允许用户在没有当局找到肇事者的情况下从事非法活动。
某些反洗钱解决方案机构能够通过采取「可视化资金流向」、「智能追踪」、「主体识别」三大功能,准确定位到相关的洗钱交易账户,帮助警方抓获犯罪嫌疑人,采用聚类分析和多组学技术后可增加追踪效率。
随着高通量技术的发展,我们能够通过最先进的数据库获取大量的有关数字货币信息和数据,洗钱账户在可视化资金流向、智能追踪、主体识别几个方面都有各自的特点,但是,收集有关生账户信息时,账户和交易系统的复杂性、技术限制、大量的样本和相对较少的变量会影响现有技术的发挥,具体包括应用质量低、数据安全隐患大以及数据共享难等问题。
发明内容
鉴于上述问题,本发明的目的是提供一种基于多组学技术的数字货币识别方法、系统和存储介质,能够对问题账户进行快速高效识别,精准追踪洗钱交易账户。
本发明第一方面提供了一种基于多组学技术的数字货币识别方法,包括以下步骤:
基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据;
通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据;
将所述数字资产交易数据输入到训练好的非法交易神经网络模型中,以得到模拟输出结果,进而提取交易识别结果。
本方案中,所述基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据,具体为:
将一组账户表示为一个节点,并将所述节点边缘定义为预设时间内与所述相邻节点的总交易量;
基于基因共表达网络技术构建所述相似度比较网络,以将所有成对的所述数字资产交易数据连接到同一个网络上;
通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据。
本方案中,所述通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据,具体为:
基于大数据检测基因组学与其他高通量组学数据的相互作用关系;
通过识别所述相互作用关系中的共变组件与连接关系,得到所述相邻节点间的条件依赖性以及所述相似度比较网络中功能关联的底层网络结构。
所述通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据,具体为:
通过所述多层异构网络整合不同类型的交易数据集以解决数据缺失以及特定数据集缺失的交易情形;
通过所述图卷积技术进行嵌入所述多层异构网络,以对数字资产交易数据进行分类,并提取确定的交易情形。
所述非法交易神经网络模型训练方法为:
获取历史检测数据的非法交易数据与合法交易数据;
将所述历史检测数据的非法交易数据与合法交易数据进行预处理,得到训练样本集;
将所述训练样本集输入至初始化的所述非法交易神经网络模型中训练;
获取输出结果的准确率;
若所述准确率大于预设的准确率阈值,则停止训练,得到所述非法交易神经网络模型。
本方案中,所述方法还包括:利用分布式机器学习技术对所述交易数据集进行扩展。
本发明第二方面还提供一种基于多组学技术的数字货币识别系统,包括存储器和处理器,所述存储器中包括基于多组学技术的数字货币识别方法程序,所述基于多组学技术的数字货币识别方法程序被所述处理器执行时实现如下步骤:
基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据;
通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据;
将所述数字资产交易数据输入到训练好的非法交易神经网络模型中,以得到模拟输出结果,进而提取交易识别结果。
本方案中,所述基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据,具体为:
将一组账户表示为一个节点,并将所述节点边缘定义为预设时间内与所述相邻节点的总交易量;
基于基因共表达网络技术构建所述相似度比较网络,以将所有成对的所述数字资产交易数据连接到同一个网络上;
通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据。
本方案中,所述通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据,具体为:
基于大数据检测基因组学与其他高通量组学数据的相互作用关系;
通过识别所述相互作用关系中的共变组件与连接关系,得到所述相邻节点间的条件依赖性以及所述相似度比较网络中功能关联的底层网络结构。
所述通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据,具体为:
通过所述多层异构网络整合不同类型的交易数据集以解决数据缺失以及特定数据集缺失的交易情形;
通过所述图卷积技术进行嵌入所述多层异构网络,以对数字资产交易数据进行分类,并提取确定的交易情形。
所述非法交易神经网络模型训练方法为:
获取历史检测数据的非法交易数据与合法交易数据;
将所述历史检测数据的非法交易数据与合法交易数据进行预处理,得到训练样本集;
将所述训练样本集输入至初始化的所述非法交易神经网络模型中训练;
获取输出结果的准确率;
若所述准确率大于预设的准确率阈值,则停止训练,得到所述非法交易神经网络模型。
本方案中,所述方法还包括:利用分布式机器学习技术对所述交易数据集进行扩展。
本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括机器的一种基于多组学技术的数字货币识别方法程序,所述基于多组学技术的数字货币识别方法程序被处理器执行时,实现如上述任一项所述的一种基于多组学技术的数字货币识别方法的步骤。
本发明公开的一种基于多组学技术的数字货币识别方法、系统和存储介质,通过多组学研究以明确交易账户的类型以及交易的具体流程,通过多层次与高通量组学数据的整合分析,可以精准追踪到问题账户,快速高效且准确性高;同时利用分布式机器学习可以大幅提高计算效率与使用延展性。
附图说明
图1示出了本发明一种基于多组学技术的数字货币识别方法的流程图;
图2示出了本发明一种基于多组学技术的数字货币识别系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本申请一种基于多组学技术的数字货币识别方法的流程图。
如图1所示,本申请公开了一种基于多组学技术的数字货币识别方法,包括以下步骤:
S102,基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据;
S104,通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据;
S106,将所述数字资产交易数据输入到训练好的非法交易神经网络模型中,以得到模拟输出结果,进而提取交易识别结果。
需要说明的是,基于基因共表达网络技术的相似性网络(SN)是将一组账户表示为一个顶点(例如,控股公司下的账户,或通过聚类推断共享一个所有者的账户),并将所述顶点边缘定义为一段时间内与相邻节点的总交易量,这是现行的数字资产活动取证分析的主要方法,本申请基于所述基因共表达网络技术结合最小二乘法与负二项式回归相结合来构建所述相似度比较网络;利用所述多层异构网络从网络中的每个节点开始计算节点邻域以整合不同类型的交易数据集,并利用所述图卷积技术的自动编码器根据每个账户的邻域来学习节点嵌入以获取所述数字资产交易数据,进而将所述数字资产交易数据作为所述非法交易神经网络模型输入,以得到所述模拟输出结果,进而提取交易识别结果,获取问题账户,进而提取其账户的交易数据以获取账户洗钱的证据。
根据本发明实施例,所述基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据,具体为:
将一组账户表示为一个节点,并将所述节点边缘定义为预设时间内与所述相邻节点的总交易量;
基于基因共表达网络技术构建所述相似度比较网络,以将所有成对的所述数字资产交易数据连接到同一个网络上;
通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据。
需要说明的是,所述相似度比较网络的计算式如下:
根据本发明实施例,所述通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据,具体为:
基于大数据检测基因组学与其他高通量组学数据的相互作用关系;
通过识别所述相互作用关系中的共变组件与连接关系,得到所述相邻节点间的条件依赖性以及所述相似度比较网络中功能关联的底层网络结构。
需要说明的是,利用基因组学和其他高通量组学数据从大规模观察中检测各数据间相互作用,并通过识别所述共变组件和连接关系,以得到所考虑节点之间的条件依赖性,并且可以发现表示功能关联的底层网络结构。
值得一提的是,获取到所述底层网络结构后,就可以对问题账户的交易网络进行提取,以对其进行交易的账户逐一识别,挖掘更多的问题账户。
根据本发明实施例,所述通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据,具体为:
通过所述多层异构网络整合不同类型的交易数据集以解决数据缺失以及特定数据集缺失的交易情形;
通过所述图卷积技术进行嵌入所述多层异构网络,以对数字资产交易数据进行分类,并提取确定的交易情形。
需要说明的是,本申请在无向多路异构网络上利用重启随机游走( RWR) 算法,从网络中的每个节点开始计算节点邻域,并应用 Skip-gram 算法,根据节点的 RWR 排名学习网络中节点的潜在特征,在多组学场景中,利用具有两种不同类型节点的多层无向网络,RWR的稳态分布来生成网络中节点的邻域,公式如下:
其中,是所述重新启动概率(即,RWR移动到起始的节点),表示时刻节点的概
率分布向量,表示时刻节点的概率分布向量,表示起始时刻节点的概率分布
向量是网络的跃迁矩阵,这是由邻接矩阵的列正规化计算的转移矩阵的网络。
值得一提的是,上式方程将达到无向网络的稳定状态是时,的大小将影响 RWR
算法的收敛速度,其中较大的会导致快速收敛到稳态并限制随机游走的扩散,其中,稳态
分布可以用作网络中从初始节点开始的节点的邻近向量。
根据本发明实施例,所述非法交易神经网络模型训练方法为:
获取历史检测数据的非法交易数据与合法交易数据;
将所述历史检测数据的非法交易数据与合法交易数据进行预处理,得到训练样本集;
将所述训练样本集输入至初始化的所述非法交易神经网络模型中训练;
获取输出结果的准确率;
若所述准确率大于预设的准确率阈值,则停止训练,得到所述非法交易神经网络模型。
需要说明的是,非法交易神经网络模型需要大量的历史数据进行训练,数据量越大,则结果越准确,本申请中的非法交易神经网络模型可以通过历史检测数据的非法交易数据与合法交易数据作为输入进行训练,当然,在进行神经网络模型训练时,不仅要通过历史检测数据的非法交易数据与合法交易数据进行训练,还需要结合确定的问题账户进行训练,通过大量试验数据与真实数据比对,得到的结果也会更加准确,进而使得非法交易神经网络的输出结果更加准确。优选地,所述准确率阈值一般设置为90%。
进一步地,本申请利用图卷积自动编码器根据每个账户的邻域来学习节点嵌入,使用度归一化邻接矩阵作为神经网络训练的卷积矩阵,定义为:
根据本发明实施例,所述方法还包括:利用分布式机器学习技术对所述交易数据集进行扩展。
需要说明的是,所述交易数据集首先被分成许多段,然后,为每个段独立训练SVM,即支持向量机(Support Vector Machine),由于每个段中的支持向量可能不是全局支持向量,因此将来自两个段的支持向量通过另一个 SVM 进行组合,以过滤掉非支持向量,这以类似树的方式进行,直到只剩下一组支持向量,然后可以将支持向量反馈到第一层,并且在 SVM 级联上的多次迭代保证将解决方案带到全局最优,并且通常级联上只有一次迭代就足以产生足够好的解决方案。
值得一提的是,所述方法还通过预设函数对账户类别进行预测,具体为:
使用预设函数对所述数字资产交易数据进行识别以输出不同类别的概率值;
基于所述概率值判断当前交易数据的归属,其中,所述交易数据的归属包括合法交易与非法交易。
需要说明的是,使用log_softmax函数作为所述预设函数对所述数字资产交易数据进行步进,得到不同类别的概率值,其中,若所述合法交易的概率值低于70%,则将其判断为问题账户数据,若非法交易概率值高于30%,则将其判断为问题账户数据,以从所述数字资产交易数据在识别出问题交易,进而提取出问题账户,对洗钱等犯罪行为进行精准追踪定位。
图2示出了本发明一种基于多组学技术的数字货币识别系统的框图。
如图2所示,本发明公开了一种基于多组学技术的数字货币识别系统,包括存储器和处理器,所述存储器中包括基于多组学技术的数字货币识别方法程序,所述基于多组学技术的数字货币识别方法程序被所述处理器执行时实现如下步骤:
基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据;
通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据;
将所述数字资产交易数据输入到训练好的非法交易神经网络模型中,以得到模拟输出结果,进而提取交易识别结果。
需要说明的是,基于基因共表达网络技术的相似性网络(SN)是将一组账户表示为一个顶点(例如,控股公司下的账户,或通过聚类推断共享一个所有者的账户),并将所述顶点边缘定义为一段时间内与相邻节点的总交易量,这是现行的数字资产活动取证分析的主要方法,本申请基于所述基因共表达网络技术结合最小二乘法与负二项式回归相结合来构建所述相似度比较网络;利用所述多层异构网络从网络中的每个节点开始计算节点邻域以整合不同类型的交易数据集,并利用所述图卷积技术的自动编码器根据每个账户的邻域来学习节点嵌入以获取所述数字资产交易数据,进而将所述数字资产交易数据作为所述非法交易神经网络模型输入,以得到所述模拟输出结果,进而提取交易识别结果,获取问题账户,进而提取其账户的交易数据以获取账户洗钱的证据。
根据本发明实施例,所述基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据,具体为:
将一组账户表示为一个节点,并将所述节点边缘定义为预设时间内与所述相邻节点的总交易量;
基于基因共表达网络技术构建所述相似度比较网络,以将所有成对的所述数字资产交易数据连接到同一个网络上;
通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据。
需要说明的是,所述相似度比较网络的计算式如下:
根据本发明实施例,所述通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据,具体为:
基于大数据检测基因组学与其他高通量组学数据的相互作用关系;
通过识别所述相互作用关系中的共变组件与连接关系,得到所述相邻节点间的条件依赖性以及所述相似度比较网络中功能关联的底层网络结构。
需要说明的是,利用基因组学和其他高通量组学数据从大规模观察中检测各数据间相互作用,并通过识别所述共变组件和连接关系,以得到所考虑节点之间的条件依赖性,并且可以发现表示功能关联的底层网络结构。
值得一提的是,获取到所述底层网络结构后,就可以对问题账户的交易网络进行提取,以对其进行交易的账户逐一识别,挖掘更多的问题账户。
根据本发明实施例,所述通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据,具体为:
通过所述多层异构网络整合不同类型的交易数据集以解决数据缺失以及特定数据集缺失的交易情形;
通过所述图卷积技术进行嵌入所述多层异构网络,以对数字资产交易数据进行分类,并提取确定的交易情形。
需要说明的是,本申请在无向多路异构网络上利用重启随机游走( RWR) 算法,从网络中的每个节点开始计算节点邻域,并应用 Skip-gram 算法,根据节点的 RWR 排名学习网络中节点的潜在特征,在多组学场景中,利用具有两种不同类型节点的多层无向网络,RWR的稳态分布来生成网络中节点的邻域,公式如下:
其中,是所述重新启动概率(即,RWR移动到起始的节点),表示时刻节点的概
率分布向量,表示时刻节点的概率分布向量,表示起始时刻节点的概率分布
向量是网络的跃迁矩阵,这是由邻接矩阵的列正规化计算的转移矩阵的网络。
值得一提的是,上式方程将达到无向网络的稳定状态是时,的大小将影响 RWR
算法的收敛速度,其中较大的会导致快速收敛到稳态并限制随机游走的扩散,其中,稳态
分布可以用作网络中从初始节点开始的节点的邻近向量。
根据本发明实施例,所述非法交易神经网络模型训练方法为:
获取历史检测数据的非法交易数据与合法交易数据;
将所述历史检测数据的非法交易数据与合法交易数据进行预处理,得到训练样本集;
将所述训练样本集输入至初始化的所述非法交易神经网络模型中训练;
获取输出结果的准确率;
若所述准确率大于预设的准确率阈值,则停止训练,得到所述非法交易神经网络模型。
需要说明的是,非法交易神经网络模型需要大量的历史数据进行训练,数据量越大,则结果越准确,本申请中的非法交易神经网络模型可以通过历史检测数据的非法交易数据与合法交易数据作为输入进行训练,当然,在进行神经网络模型训练时,不仅要通过历史检测数据的非法交易数据与合法交易数据进行训练,还需要结合确定的问题账户进行训练,通过大量试验数据与真实数据比对,得到的结果也会更加准确,进而使得非法交易神经网络的输出结果更加准确。优选地,所述准确率阈值一般设置为90%。
进一步地,本申请利用图卷积自动编码器根据每个账户的邻域来学习节点嵌入,使用度归一化邻接矩阵作为神经网络训练的卷积矩阵,定义为:
根据本发明实施例,所述方法还包括:利用分布式机器学习技术对所述交易数据集进行扩展。
需要说明的是,所述交易数据集首先被分成许多段,然后,为每个段独立训练SVM,即支持向量机(Support Vector Machine),由于每个段中的支持向量可能不是全局支持向量,因此将来自两个段的支持向量通过另一个 SVM 进行组合,以过滤掉非支持向量,这以类似树的方式进行,直到只剩下一组支持向量,然后可以将支持向量反馈到第一层,并且在 SVM 级联上的多次迭代保证将解决方案带到全局最优,并且通常级联上只有一次迭代就足以产生足够好的解决方案。
值得一提的是,所述方法还通过预设函数对账户类别进行预测,具体为:
使用预设函数对所述数字资产交易数据进行识别以输出不同类别的概率值;
基于所述概率值判断当前交易数据的归属,其中,所述交易数据的归属包括合法交易与非法交易。
需要说明的是,使用log_softmax函数作为所述预设函数对所述数字资产交易数据进行步进,得到不同类别的概率值,其中,若所述合法交易的概率值低于70%,则将其判断为问题账户数据,若非法交易概率值高于30%,则将其判断为问题账户数据,以从所述数字资产交易数据在识别出问题交易,进而提取出问题账户,对洗钱等犯罪行为进行精准追踪定位。
本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括机器的一种基于多组学技术的数字货币识别方法程序,所述基于多组学技术的数字货币识别方法程序被处理器执行时,实现如上述任一项所述的一种基于多组学技术的数字货币识别方法的步骤。
本发明公开的一种基于多组学技术的数字货币识别方法、系统和存储介质,通过多组学研究以明确交易账户的类型以及交易的具体流程,通过多层次与高通量组学数据的整合分析,可以精准追踪到问题账户,快速高效且准确性高;同时利用分布式机器学习可以大幅提高计算效率与使用延展性。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (10)
1.一种基于多组学技术的数字货币识别方法,其特征在于,包括以下步骤:
基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据;
通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据;
将所述数字资产交易数据输入到训练好的非法交易神经网络模型中,以得到模拟输出结果,进而提取交易识别结果。
2.根据权利要求1所述的一种基于多组学技术的数字货币识别方法,其特征在于,所述基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据,具体为:
将一组账户表示为一个节点,并将所述节点边缘定义为预设时间内与所述相邻节点的总交易量;
基于基因共表达网络技术构建所述相似度比较网络,以将所有成对的所述数字资产交易数据连接到同一个网络上;
通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据。
3.根据权利要求2所述的一种基于多组学技术的数字货币识别方法,其特征在于, 所述通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据,具体为:
基于大数据检测基因组学与其他高通量组学数据的相互作用关系;
通过识别所述相互作用关系中的共变组件与连接关系,得到所述相邻节点间的条件依赖性以及所述相似度比较网络中功能关联的底层网络结构。
4.根据权利要求1所述的一种基于多组学技术的数字货币识别方法,其特征在于,所述通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据,具体为:
通过所述多层异构网络整合不同类型的交易数据集以解决数据缺失以及特定数据集缺失的交易情形;
通过所述图卷积技术进行嵌入所述多层异构网络,以对数字资产交易数据进行分类,并提取确定的交易情形。
5.根据权利要求1所述的一种基于多组学技术的数字货币识别方法,其特征在于,所述非法交易神经网络模型训练方法为:
获取历史检测数据的非法交易数据与合法交易数据;
将所述历史检测数据的非法交易数据与合法交易数据进行预处理,得到训练样本集;
将所述训练样本集输入至初始化的所述非法交易神经网络模型中训练;
获取输出结果的准确率;
若所述准确率大于预设的准确率阈值,则停止训练,得到所述非法交易神经网络模型。
6.根据权利要求1所述的一种基于多组学技术的数字货币识别方法,其特征在于,所述方法还包括:利用分布式机器学习技术对所述交易数据集进行扩展。
7.一种基于多组学技术的数字货币识别系统,其特征在于,包括存储器和处理器,所述存储器中包括基于多组学技术的数字货币识别方法程序,所述基于多组学技术的数字货币识别方法程序被所述处理器执行时实现如下步骤:
基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据;
通过预设的多层异构网络整合不同类型的交易数据集,并通过预设的图卷积技术进行嵌入以获取数字资产交易数据;
将所述数字资产交易数据输入到训练好的非法交易神经网络模型中,以得到模拟输出结果,进而提取交易识别结果。
8.根据权利要求7所述的一种基于多组学技术的数字货币识别系统,其特征在于,所述基于基因共表达网络技术构建相似度比较网络,并通过大数据进行相关性检测分析得到所述相似度比较网络相邻节点间的交易数据,具体为:
将一组账户表示为一个节点,并将所述节点边缘定义为预设时间内与所述相邻节点的总交易量;
基于基因共表达网络技术构建所述相似度比较网络,以将所有成对的所述数字资产交易数据连接到同一个网络上;
通过大数据进行相关性检测分析,得到所述相邻节点间的交易数据。
9.根据权利要求7所述的一种基于多组学技术的数字货币识别系统,其特征在于,所述非法交易神经网络模型训练方法为:
获取历史检测数据的非法交易数据与合法交易数据;
将所述历史检测数据的非法交易数据与合法交易数据进行预处理,得到训练样本集;
将所述训练样本集输入至初始化的所述非法交易神经网络模型中训练;
获取输出结果的准确率;
若所述准确率大于预设的准确率阈值,则停止训练,得到所述非法交易神经网络模型。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括一种基于多组学技术的数字货币识别方法程序,所述基于多组学技术的数字货币识别方法程序被处理器执行时,实现如权利要求1至6中任一项所述的一种基于多组学技术的数字货币识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111029375.7A CN113469816A (zh) | 2021-09-03 | 2021-09-03 | 基于多组学技术的数字货币识别方法、系统和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111029375.7A CN113469816A (zh) | 2021-09-03 | 2021-09-03 | 基于多组学技术的数字货币识别方法、系统和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113469816A true CN113469816A (zh) | 2021-10-01 |
Family
ID=77868030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111029375.7A Pending CN113469816A (zh) | 2021-09-03 | 2021-09-03 | 基于多组学技术的数字货币识别方法、系统和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469816A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114005236A (zh) * | 2021-10-09 | 2022-02-01 | 泰山学院 | 基于物联网的森林火灾检测方法、系统和可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103471A (zh) * | 2017-03-28 | 2017-08-29 | 上海瑞麒维网络科技有限公司 | 基于区块链确定交易合法性的方法及装置 |
CN109615524A (zh) * | 2019-01-08 | 2019-04-12 | 平安科技(深圳)有限公司 | 洗钱犯罪团伙的识别方法、装置、计算机设备及存储介质 |
CN110046993A (zh) * | 2018-12-15 | 2019-07-23 | 深圳壹账通智能科技有限公司 | 非法所得合法化行为监测方法、系统、计算机装置及介质 |
CN110211634A (zh) * | 2018-02-05 | 2019-09-06 | 深圳华大基因科技服务有限公司 | 一种多组学数据联合分析的方法 |
CN111311416A (zh) * | 2020-02-28 | 2020-06-19 | 杭州云象网络技术有限公司 | 一种基于多通道图和图神经网络的区块链洗钱节点检测方法 |
US20210248448A1 (en) * | 2020-02-12 | 2021-08-12 | Feedzai - Consultadoria e Inovação Tecnólogica, S.A. | Interleaved sequence recurrent neural networks for fraud detection |
CN113269647A (zh) * | 2021-06-08 | 2021-08-17 | 上海交通大学 | 基于图的交易异常关联用户检测方法 |
-
2021
- 2021-09-03 CN CN202111029375.7A patent/CN113469816A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103471A (zh) * | 2017-03-28 | 2017-08-29 | 上海瑞麒维网络科技有限公司 | 基于区块链确定交易合法性的方法及装置 |
CN110211634A (zh) * | 2018-02-05 | 2019-09-06 | 深圳华大基因科技服务有限公司 | 一种多组学数据联合分析的方法 |
CN110046993A (zh) * | 2018-12-15 | 2019-07-23 | 深圳壹账通智能科技有限公司 | 非法所得合法化行为监测方法、系统、计算机装置及介质 |
CN109615524A (zh) * | 2019-01-08 | 2019-04-12 | 平安科技(深圳)有限公司 | 洗钱犯罪团伙的识别方法、装置、计算机设备及存储介质 |
US20210248448A1 (en) * | 2020-02-12 | 2021-08-12 | Feedzai - Consultadoria e Inovação Tecnólogica, S.A. | Interleaved sequence recurrent neural networks for fraud detection |
CN111311416A (zh) * | 2020-02-28 | 2020-06-19 | 杭州云象网络技术有限公司 | 一种基于多通道图和图神经网络的区块链洗钱节点检测方法 |
CN113269647A (zh) * | 2021-06-08 | 2021-08-17 | 上海交通大学 | 基于图的交易异常关联用户检测方法 |
Non-Patent Citations (2)
Title |
---|
CHUNYU WANG ET AL.: ""A Cancer Survival Prediction Method Based on Graph Convolutional Network"", 《IEEE TRANSACTIONS ON NANOBIOSCIENCE》 * |
汪涛 等: ""基因共表达网络的构建及分析方法研究综述"", 《智能计算机与应用》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114005236A (zh) * | 2021-10-09 | 2022-02-01 | 泰山学院 | 基于物联网的森林火灾检测方法、系统和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Electricity theft detection in power grids with deep learning and random forests | |
Gong et al. | Change detection in synthetic aperture radar images based on deep neural networks | |
CN107872436B (zh) | 一种账号识别方法、装置及系统 | |
US8543522B2 (en) | Automatic rule discovery from large-scale datasets to detect payment card fraud using classifiers | |
Nguyen et al. | A proposed model for card fraud detection based on Catboost and deep neural network | |
CN113011889B (zh) | 账号异常识别方法、系统、装置、设备及介质 | |
CN113283909B (zh) | 一种基于深度学习的以太坊钓鱼账户检测方法 | |
CN112287020A (zh) | 一种基于图分析的大数据挖掘方法 | |
CN111062444A (zh) | 信用风险预测方法、系统、终端及存储介质 | |
CN113641906A (zh) | 基于资金交易关系数据实现相似目标人员识别处理的系统、方法、装置、处理器及其介质 | |
CN115688024A (zh) | 基于用户内容特征和行为特征的网络异常用户预测方法 | |
CN116307671A (zh) | 风险预警方法、装置、计算机设备、存储介质 | |
Sheng et al. | Network traffic anomaly detection method based on chaotic neural network | |
CN113343123B (zh) | 一种生成对抗多关系图网络的训练方法和检测方法 | |
CN110347669A (zh) | 基于流式大数据分析的风险防范方法 | |
CN113469816A (zh) | 基于多组学技术的数字货币识别方法、系统和存储介质 | |
CN111352926A (zh) | 数据处理的方法、装置、设备及可读存储介质 | |
CN112818868A (zh) | 基于行为序列特征数据的违规用户识别方法和装置 | |
Fakiha | Forensic Credit Card Fraud Detection Using Deep Neural Network | |
CN116633589A (zh) | 社交网络中恶意账户检测方法、设备及存储介质 | |
CN116361488A (zh) | 一种基于知识图谱挖掘风险对象的方法及装置 | |
CN113259369B (zh) | 一种基于机器学习成员推断攻击的数据集认证方法及系统 | |
Alsharkawi et al. | Improved Poverty Tracking and Targeting in Jordan Using Feature Selection and Machine Learning | |
CN115170334A (zh) | 一种反洗钱模型的训练方法及装置 | |
CN114519605A (zh) | 广告点击欺诈检测方法、系统、服务器和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211001 |
|
RJ01 | Rejection of invention patent application after publication |