CN111754345B - 一种基于改进随机森林的比特币地址分类方法 - Google Patents
一种基于改进随机森林的比特币地址分类方法 Download PDFInfo
- Publication number
- CN111754345B CN111754345B CN202010560006.XA CN202010560006A CN111754345B CN 111754345 B CN111754345 B CN 111754345B CN 202010560006 A CN202010560006 A CN 202010560006A CN 111754345 B CN111754345 B CN 111754345B
- Authority
- CN
- China
- Prior art keywords
- feature
- features
- address
- learner
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/04—Payment circuits
- G06Q20/06—Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme
- G06Q20/065—Private payment circuits, e.g. involving electronic currency used among participants of a common payment scheme using e-cash
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/389—Keeping log of transactions for guaranteeing non-repudiation of a transaction
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于改进随机森林的比特币地址分类方法。其包括构建特征集、构成数据集、获得带有标签的样本集、初始化学习器的参数、迭代学习器及获取关键特征等步骤。本发明从比特币市场监管角度将判断用户是否参与非法交易问题转变成比特币地址分类问题,有助于完善市场监管;直接通过区块链历史交易记录获取样本集,这样就大大降低了数据的收集难度;能够以84%左右的准确率对比特币地址进行分类,仅仅只需要很少的统计特征;不仅能很好的对地址进行分类,同时对构建的大量统计特征进行去冗余,当学习器完成最终的训练之后,就能获得最终需要提取的关键特征,这对于一个需要进行识别的地址而言,既减少了数据收集时间,也降低了地址分类的时间开销。
Description
技术领域
本发明属于数据挖掘和机器学习技术领域,特别是涉及一种基于改进随机森林的比特币地址分类方法。
背景技术
随着数字货币市场的不断发展,比特币作为数字货币中的典型代表,应用越来越广泛。比特币地址是用户参与服务的唯一身份标识,但是由于比特币本身具有匿名性特点,这也为诸如洗钱等非法活动提供了便利。在这种情况下,为了更好地了解比特币的用途,通过比特币地址来说明用户交易行为显得至关重要,但比特币的匿名性却为此带来了挑战,因此如何在系统中快速对一个比特币地址进行分类,即利用较少的统计特征,从而判断该地址是被非法用户所有还是属于正常交易地址,是解决比特币市场难于监管的一个重要方法。
目前,比特币地址的分类方法包括以下几种:
交易图分析法:目前最常用的比特币地址分类方法就是交易图分析法,常见的一种构图方法是将交易视为图的点集,图的边表示两笔交易间经过某一地址所流通的比特币数量,利用历史交易记录,从而能够构建出整个交易图,从交易图中能够提取比特币地址的一系列统计特征,利用常用的机器学习分类算法就能以较高的准确率对地址进行分类,一般情况下交易图越完善,即越接近实际所有的交易,分类的准确率会越高,通常准确率都在90%以上,实际上不同的研究者出于不同的目的会选择不一样的构图方式,但无疑最终都会形成一张超大的图。
启发式地址聚类法:启发式地址聚类在一定程度上也能够识别一个比特币地址,该方法基于一个经典的假设:在同一笔交易中,所有的输入地址都是由一个用户所掌握的。由于比特币系统协议会在交易的过程中自动生成找零地址,用于接收交易中的找零资金,因此进一步的地址聚类方法会将找零地址与输入地址折叠成一个更大的交易实体,只要其中的一个地址类别暴露就可以对该交易实体所有的地址进行识别。
机器学习分类方法:目前一部分研究人员着力于直接从交易历史记录中提取相关地址的统计特征,区别于交易图分析法大大减少了构图工作量,利用经典的机器学习分类方法也能够以较高的准确率对地址进行识别,通常准确率在80%以上。
但现有的交易图分析法收集数据方法过于繁复,需要先利用比特币历史交易记录根据自己定义的构图规则形成一张图,再从中提取特征,往往不同的研究者构图的方法各不相同,但无疑最终都会形成一张超大的图,同时现有的多分类方法中对于地址提取的特征较多,使数据收集的难度过大,耗费时间过长,这为快速分类一个比特币地址制造了难度。
现有的基于启发式的地址聚类方法存在两个缺陷:一是该方法只针对特定类型交易地址有效,如多个交易输入可以被聚成一类,但是对于单一输入的交易,当该输入地址在未来交易记录中从未出现过时,将无法归类到任何一类。二是基于找零地址的启发式聚类方法由于受到比特币协议的变化,如找零地址使用比特币钱包自动生成的新地址或用户指定的新地址,因此该方法不能完全聚类出交易输入用户控制的地址群。
现有的机器学习分类方法对于从交易历史记录中提取什么特征,提取多少特征尚未形成一致观点,因此不同的研究人员会提取到不同数量和不同种类的特征,事实上这种盲选特征会造成实际特征中有很多的冗余特征,增加了学习器的训练开销,无法为一个需要分类的地址的特征提取提供参考。
发明内容
为了解决上述问题,本发明的目的在于提供了一种基于改进随机森林的比特币地址分类方法。
为了达到上述目的,本发明提供的基于改进随机森林的比特币地址分类方法包括按顺序进行的下列步骤:
S1:从区块链的历史交易记录中提取地址原始特征并添加到现有机器学习分类方法所使用的特征集中,构建一个更大的特征集;
S2:解析原始区块数据而获得比特币地址,并从上述构建的特征集中提取出与地址相关的统计特征信息而构成数据集,所获得数据集的大小与操作者选取的时间段以及在这个时间段交易数量的多少有关;
S3:利用爬虫技术,为上述数据集打上标签,从而获得带有标签的样本集,并根据需要将地址分为多个不同的类别;
S4:初始化学习器的参数,包括随机森林参数基分类器数量L、利用特征分裂节点时候选特征子集的数量l,以及算法准确率变化阈值δ;
S5:初始化学习器中的重要特征集不重要特征集特征向量和算法准确率集合其中重要特征集用于保留需要提取的关键特征,用于暂存当前未被标记为重要的特征,特征向量表示每个样本中的属性集合,算法准确率集合用于记录每一轮算法的准确率;
S6:用上述带有标签的样本集迭代上述初始化后的学习器,直到算法准确率变化范围超过算法准确率变化阈值δ;
S8:在实际应用中,对于任一需要分类的地址,只需从比特币交易记录中提取出少量的关键特征,然后将这些关键特征输入到上述已训练好的学习器中,学习器的输出即为该比特币地址的交易类型分类。
在S1中,所述的从区块链的历史交易记录中提取地址原始特征并添加到现有机器学习分类方法所使用的特征集中,构建一个更大的特征集的具体方法如下:
S101:设定如下用于提取地址原始特征的规则:地址存活时间单位为天,存活时间不足24小时视为1天,其余情况下存活天数向下取整;对于存在自找零交易,即给定地址同时出现在交易的输入和输出中,将其视为对应于该地址的输出交易;为了保留原始信息同时降低提取特征的困难,将比特币交易的数量单位设定为BTC;
S102:按照上述规则,从区块链的历史交易记录中提取包括截至目前为止地址存活时间在内的地址原始特征;
S103:对上述地址原始特征进行线性组合。
在S6中,所述的用上述带有标签的样本集迭代上述初始化后的学习器,直到算法准确率变化范围超过算法准确率变化阈值δ的具体方法如下:
S60201:每一个基分类器在分裂节点i的时候,先根据以下公式计算该分裂节点的信息熵:
其中P(c)表示在该分裂节点地址类别为c的概率;
S60202:根据上述信息熵计算分裂节点i的特征候选子集中每一个特征j的分裂评分,计算公式如下:
S60203:利用上述分裂评分计算每个特征j在每一个基分类器ζ中的局部权重:
其中N_node表示基分类器ζ中非叶子节点的数量;
S60204:利用袋外数据算出每一个基分类器ζ的分类准确率,进而按下式计算出每一个基分类器ζ的权重:
其中accζ表示基分类器ζ的分类准确率;
S60205:基于上述局部权重和基分类器的权重计算出每个特征j在整个随机森林中的全局权重:
本发明提供的基于改进随机森林的比特币地址分类方法具有如下有益效果:(1)从比特币市场监管角度将判断用户是否参与非法交易问题转变成比特币地址分类问题,有助于完善市场监管;(2)本发明直接通过区块链的历史交易记录获取样本集,而不需要先去形成一张超大的交易图,再从图中提取特征,这样就大大降低了数据的收集难度;(3)基于改进随机森林的比特币地址分类方法能够以84%左右的准确率对比特币地址进行分类,仅仅只需要很少的统计特征;(4)地址分类方法不仅能很好的对地址进行分类,同时对构建的大量统计特征进行去冗余,当学习器完成最终的训练之后,就能获得最终需要提取的关键特征,这对于一个需要进行识别的地址而言,既减少了数据收集时间,也降低了地址识别的时间开销。
附图说明
图1为本发明提供的基于改进随机森林的比特币地址分类方法流程图。
图2为本发明提供的获取带有标签的数据集流程图。
图3为本发明提供的算法迭代训练过程流程图。
图4为本发明提供的计算每个特征的全局权重流程图。
图5为本发明提供的特征集和特征向量更新过程流程图。
具体实施方式
下面结合附图和具体实施例对本发明提供的基于改进随机森林的比特币地址分类进行详细说明。
如图1—图5所示,本发明提供的基于改进随机森林的比特币地址分类方法包括按顺序进行的下列步骤:
S1:从区块链的历史交易记录中提取地址原始特征并添加到现有机器学习分类方法所使用的特征集中,构建一个更大的特征集;
具体方法如下:
S101:设定如下用于提取地址原始特征的规则:地址存活时间单位为天,存活时间不足24小时视为1天,其余情况下存活天数向下取整;对于存在自找零交易,即给定地址同时出现在交易的输入和输出中,将其视为对应于该地址的输出交易;为了保留原始信息同时降低提取特征的困难,将比特币交易的数量单位设定为BTC;
S102:按照上述规则,从区块链的历史交易记录中提取包括截至目前为止地址存活时间在内的地址原始特征;
S103:对上述地址原始特征进行线性组合,以进一步丰富统计特征,如该地址每天转出多少BTC。
S2:解析原始区块数据而获得比特币地址,并从上述构建的特征集中提取出与地址相关的统计特征信息而构成数据集,所获得数据集的大小与操作者选取的时间段以及在这个时间段交易数量的多少有关;
S3:利用爬虫技术,为上述数据集打上标签,从而获得带有标签的样本集,并根据需要将地址分为多个不同的类别;
S4:初始化学习器的参数,包括随机森林参数基分类器数量L、利用特征分裂节点时候选特征子集的数量l,以及算法准确率变化阈值δ;
S5:初始化学习器中的重要特征集不重要特征集特征向量和算法准确率集合其中重要特征集用于保留需要提取的关键特征,用于暂存当前未被标记为重要的特征,特征向量表示每个样本中的属性集合,算法准确率集合用于记录每一轮算法的准确率;
S6:用上述带有标签的样本集迭代上述初始化后的学习器,直到算法准确率变化范围超过算法准确率变化阈值δ;
具体方法如下:
S60201:每一个基分类器在分裂节点i的时候,先根据以下公式计算该分裂节点的信息熵:
其中P(c)表示在该分裂节点地址类别为c的概率;
S60202:根据上述信息熵计算分裂节点i的特征候选子集中每一个特征j的分裂评分,计算公式如下:
S60203:利用上述分裂评分计算每个特征j在每一个基分类器ζ中的局部权重:
其中N_node表示基分类器ζ中非叶子节点的数量;
S60204:利用袋外数据算出每一个基分类器ζ的分类准确率,进而按下式计算出每一个基分类器ζ的权重:
其中accζ表示基分类器ζ的分类准确率;
S60205:基于上述局部权重和基分类器的权重计算出每个特征j在整个随机森林中的全局权重:
S8:在实际应用中,对于任一需要分类的地址,只需从比特币交易记录中提取出少量的关键特征,然后将这些关键特征输入到上述已训练好的学习器中,学习器的输出即为该比特币地址的交易类型分类。
Claims (2)
1.一种基于改进随机森林的比特币地址分类方法,其特征在于:所述的比特币地址分类方法包括按顺序进行的下列步骤:
S1:从区块链的历史交易记录中提取地址原始特征并添加到现有机器学习分类方法所使用的特征集中,构建一个更大的特征集;
S2:解析原始区块数据而获得比特币地址,并从构建的特征集中提取出与地址相关的统计特征信息而构成数据集,所获得数据集的大小与操作者选取的时间段以及在这个时间段交易数量的多少有关;
S3:利用爬虫技术,为上述数据集打上标签,从而获得带有标签的样本集,并根据需要将地址分为多个不同的类别;
S4:初始化学习器的参数,包括随机森林参数基分类器数量L、利用特征分裂节点时候选特征子集的数量l,以及算法准确率变化阈值δ;
S5:初始化学习器中的重要特征集不重要特征集特征向量和算法准确率集合其中重要特征集用于保留需要提取的关键特征,用于暂存当前未被标记为重要的特征,特征向量表示每个样本中的属性集合,算法准确率集合用于记录每一轮算法的准确率;
S6:用上述带有标签的样本集迭代上述初始化后的学习器,直到算法准确率变化范围超过算法准确率变化阈值δ;
S8:在实际应用中,对于任一需要分类的地址,只需从比特币交易记录中提取出少量的关键特征,然后将这些关键特征输入到上述已训练好的学习器中,学习器的输出即为比特币地址的交易类型分类;
在S6中,所述的用上述带有标签的样本集迭代上述初始化后的学习器,直到算法准确率变化范围超过算法准确率变化阈值δ的具体方法如下:
S602:计算在该轮训练中每一个特征j的全局权重w(j);
在S602中,所述的计算在该轮训练中每一个特征j的全局权重w(j)的具体方法如下:
S60201:每一个基分类器在分裂节点i的时候,先根据以下公式计算分裂节点的信息熵:
其中P(c)表示在分裂节点地址类别为c的概率;
S60202:根据上述信息熵计算分裂节点i的特征候选子集中每一个特征j的分裂评分,计算公式如下:
S60203:利用上述分裂评分计算每个特征j在每一个基分类器ζ中的局部权重:
其中N_node表示基分类器ζ中非叶子节点的数量;
S60204:利用袋外数据算出每一个基分类器ζ的分类准确率,进而按下式计算出每一个基分类器ζ的权重:
其中accζ表示基分类器ζ的分类准确率;
S60205:基于上述局部权重和基分类器的权重计算出每个特征j在整个随机森林中的全局权重:
2.根据权利要求1所述的基于改进随机森林的比特币地址分类方法,其特征在于:在S1中,所述的从区块链的历史交易记录中提取地址原始特征并添加到现有机器学习分类方法所使用的特征集中,构建一个更大的特征集的具体方法如下:
S101:设定如下用于提取地址原始特征的规则:地址存活时间单位为天,存活时间不足24小时视为1天,其余情况下存活天数向下取整;对于存在自找零交易,即给定地址同时出现在交易的输入和输出中,将其视为对应于该地址的输出交易;为了保留原始信息同时降低提取特征的困难,将比特币交易的数量单位设定为BTC;
S102:按照上述规则,从区块链的历史交易记录中提取包括截至目前为止地址存活时间在内的地址原始特征;
S103:对上述地址原始特征进行线性组合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010560006.XA CN111754345B (zh) | 2020-06-18 | 2020-06-18 | 一种基于改进随机森林的比特币地址分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010560006.XA CN111754345B (zh) | 2020-06-18 | 2020-06-18 | 一种基于改进随机森林的比特币地址分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111754345A CN111754345A (zh) | 2020-10-09 |
CN111754345B true CN111754345B (zh) | 2022-03-18 |
Family
ID=72676498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010560006.XA Active CN111754345B (zh) | 2020-06-18 | 2020-06-18 | 一种基于改进随机森林的比特币地址分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111754345B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801783A (zh) * | 2020-12-31 | 2021-05-14 | 北京知帆科技有限公司 | 一种基于数字货币交易特征的实体识别方法及装置 |
CN112699964A (zh) * | 2021-01-13 | 2021-04-23 | 成都链安科技有限公司 | 模型构建方法、系统、装置、介质、交易身份识别方法 |
CN112861123B (zh) * | 2021-01-26 | 2022-02-08 | 中山大学 | 一种比特币恶意地址识别方法及装置 |
CN114911925A (zh) * | 2021-02-10 | 2022-08-16 | 中国人民银行数字货币研究所 | 一种区块链地址分类方法和装置 |
CN113052577B (zh) * | 2021-03-12 | 2024-08-09 | 北京工业大学 | 一种区块链数字货币虚拟地址的类别推测方法及系统 |
CN113177596B (zh) * | 2021-04-30 | 2024-03-22 | 中国人民银行数字货币研究所 | 一种区块链地址分类方法和装置 |
CN113190730B (zh) * | 2021-04-30 | 2024-07-30 | 中国人民银行数字货币研究所 | 一种区块链地址的分类方法及装置 |
CN113177784B (zh) * | 2021-05-31 | 2022-05-03 | 清华大学 | 地址类型识别方法及装置 |
CN113535847B (zh) * | 2021-06-22 | 2024-07-02 | 中国人民银行数字货币研究所 | 区块链地址分类的方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985583A (zh) * | 2018-06-27 | 2018-12-11 | 中国银行股份有限公司 | 基于人工智能的金融数据风险控制方法及装置 |
CN109102176A (zh) * | 2018-07-25 | 2018-12-28 | 珠海宏桥高科技有限公司 | 一种基于区块链的贸易金融评估方法及装置 |
CN109918584A (zh) * | 2019-03-25 | 2019-06-21 | 中国科学院自动化研究所 | 比特币交易所地址识别方法、系统、装置 |
CN109961148A (zh) * | 2019-04-03 | 2019-07-02 | 陕西医链区块链集团有限公司 | 一种使用随机森林算法实现区块链生产节点的选择方法 |
CN110705683A (zh) * | 2019-10-12 | 2020-01-17 | 腾讯科技(深圳)有限公司 | 随机森林模型的构造方法、装置、电子设备及存储介质 |
CN110751554A (zh) * | 2019-09-20 | 2020-02-04 | 暨南大学 | 区块链中数字货币的智能监测方法及系统 |
-
2020
- 2020-06-18 CN CN202010560006.XA patent/CN111754345B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985583A (zh) * | 2018-06-27 | 2018-12-11 | 中国银行股份有限公司 | 基于人工智能的金融数据风险控制方法及装置 |
CN109102176A (zh) * | 2018-07-25 | 2018-12-28 | 珠海宏桥高科技有限公司 | 一种基于区块链的贸易金融评估方法及装置 |
CN109918584A (zh) * | 2019-03-25 | 2019-06-21 | 中国科学院自动化研究所 | 比特币交易所地址识别方法、系统、装置 |
CN109961148A (zh) * | 2019-04-03 | 2019-07-02 | 陕西医链区块链集团有限公司 | 一种使用随机森林算法实现区块链生产节点的选择方法 |
CN110751554A (zh) * | 2019-09-20 | 2020-02-04 | 暨南大学 | 区块链中数字货币的智能监测方法及系统 |
CN110705683A (zh) * | 2019-10-12 | 2020-01-17 | 腾讯科技(深圳)有限公司 | 随机森林模型的构造方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
"Blockchain-based decentralized and secure keyless signature scheme for smart grid";Hongwei Zhang;《Energy》;20191231;全文 * |
"区块链在数字资产交易领域中的创新应用";严振亚等;《区块链》;20200131(第1期);全文 * |
"基于区块链的信息资源共享系统研究";王跃虎;《图书情报导刊》;20180531;第3卷(第5期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111754345A (zh) | 2020-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111754345B (zh) | 一种基于改进随机森林的比特币地址分类方法 | |
WO2019238109A1 (zh) | 一种故障根因分析的方法及装置 | |
CN112199608B (zh) | 基于网络信息传播图建模的社交媒体谣言检测方法 | |
CN108009249B (zh) | 针对不平衡数据的融合用户行为规则的垃圾评论过滤方法 | |
CN106776538A (zh) | 企业非标准格式文档的信息提取方法 | |
CN105373606A (zh) | 一种改进c4.5决策树算法下的不平衡数据抽样方法 | |
CN104915879A (zh) | 基于金融数据的社会关系挖掘的方法及装置 | |
CN107169059A (zh) | 一种基于相似变精度粗糙集模型的知识推送规则提取方法 | |
CN111325248A (zh) | 降低贷前业务风险的方法及系统 | |
Gerhana et al. | Comparison of naive Bayes classifier and C4. 5 algorithms in predicting student study period | |
CN104850868A (zh) | 一种基于k-means和神经网络聚类的客户细分方法 | |
CN111986027A (zh) | 基于人工智能的异常交易处理方法、装置 | |
CN114022269A (zh) | 一种公共信用领域企业信用风险评估方法 | |
CN111641608A (zh) | 异常用户识别方法、装置、电子设备及存储介质 | |
CN108920446A (zh) | 一种工程文本的处理方法 | |
CN103886030A (zh) | 基于代价敏感决策树的信息物理融合系统数据分类方法 | |
CN111047428B (zh) | 基于少量欺诈样本的银行高风险欺诈客户识别方法 | |
CN111967973B (zh) | 银行客户数据处理方法及装置 | |
CN112950350A (zh) | 一种基于机器学习的贷款产品推荐方法及系统 | |
CN111984842A (zh) | 银行客户数据处理方法及装置 | |
CN116680325A (zh) | 基于属性关联性的时序记录链接数据匹配方法及装置 | |
CN109308565B (zh) | 人群绩效等级识别方法、装置、存储介质及计算机设备 | |
CN114048796A (zh) | 一种改进型硬盘故障预测方法及装置 | |
CN112818215A (zh) | 产品数据的处理方法、装置、设备及存储介质 | |
CN111191688A (zh) | 一种用户分期期数管理方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |