CN115239488A - 一种比特币交易地址的标签判断方法和装置 - Google Patents

一种比特币交易地址的标签判断方法和装置 Download PDF

Info

Publication number
CN115239488A
CN115239488A CN202210567247.6A CN202210567247A CN115239488A CN 115239488 A CN115239488 A CN 115239488A CN 202210567247 A CN202210567247 A CN 202210567247A CN 115239488 A CN115239488 A CN 115239488A
Authority
CN
China
Prior art keywords
label
data source
score
tag
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210567247.6A
Other languages
English (en)
Inventor
宋雨宸
石瑞生
兰丽娜
时金桥
田传用
王学宾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202210567247.6A priority Critical patent/CN115239488A/zh
Publication of CN115239488A publication Critical patent/CN115239488A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Technology Law (AREA)
  • General Engineering & Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种比特币交易地址的标签判断方法和装置,所述方法包括:对于具有多个标签的比特币交易地址,基于共同输入启发式方法计算每个标签的准确度;确定出为所述比特币交易地址提供标签的所有数据源;对于每个标签,根据各数据源的评价指标计算该标签的数据源得分;根据每个标签的准确度和数据源得分,计算每个标签的评分;将评分最高的标签判断为该比特币交易地址的可信标签。应用本发明能提高对比特币交易地址的标签判断的准确性,达到对比特币交易地址的真实身份识别的目的。

Description

一种比特币交易地址的标签判断方法和装置
技术领域
本发明涉及计算机技术领域,特别是指一种比特币交易地址的标签判断方法和装置。
背景技术
对比特币交易中的匿名交易地址进行标注,从而可以确定匿名用户的真实身份。目前,对交易地址进行标注的方法,主要是应用比特币地址聚类进行交易层的身份溯源,使用启发式方法将属于同一个实体的多个比特币地址归类到一个地址集群。目前比特币交易中的交易地址聚类最常用的方法包括,共同输入法、找零地址启发式方法等。
例如,应用共同输入法可以识别出多输入交易,将多输入交易的多个输入的交易地址聚类到一个集群,作为识别出的同一用户所拥有的交易地址。
然而,在实际情况中,从互联网环境中采集到的数字货币地址标签具有大量的冲突情况,上文所述的系统不支持同一地址具有多源标签冲突的消解。
现有技术提出了多元融合数据的真值发现算法,该算法将数据源分为相互独立和相互关联两种情况,并基于已知真值的数据集计算每个数据源的精确率、召回率、误报率等参数,基于贝叶斯规则得出计算每条数据为真的概率公式,在多个公开数据集中计算数据的可信程度。
本发明的发明人发现,目前已有的真值发现算法大多基于数据源的质量,进行比特币交易地址的标签判断,准确性较低。
发明内容
有鉴于此,本发明的目的在于提出一种比特币交易地址的标签判断方法和装置,以提高对比特币交易地址的标签判断的准确性。
基于上述目的,本发明提供一种比特币交易地址的标签判断方法,包括:
对于具有多个标签的比特币交易地址,基于共同输入启发式方法计算每个标签的准确度;
确定出为所述比特币交易地址提供标签的所有数据源;
对于每个标签,根据各数据源的评价指标计算该标签的数据源得分;
根据每个标签的准确度和数据源得分,计算每个标签的评分;
将评分最高的标签判断为该比特币交易地址的可信标签。
3.其中,所述基于共同输入启发式方法计算每个标签的准确度,具体包括:
查找该比特币交易地址的共同输入地址,并统计共同输入地址的数量n;
对于每个标签,统计共同输入地址中标注该标签的地址的数量m,并根据统计的数量m与n的比值确定该标签的准确度。
其中,所述根据各数据源的评价指标计算该标签的数据源得分,具体包括:
对于每个数据源,根据该数据源是否提供该标签的情况,以及该数据源的评价指标,计算该数据源的评分;
将各数据源的评分进行连乘,得到该标签的数据源得分。
其中,所述根据该数据源是否提供该标签的情况,以及该数据源的评价指标,计算该数据源的评分,具体包括:
若该数据源为提供该标签的数据源,则计算该数据源的评分为r/q;否则计算该数据源的评分为(1-r)/(1-q);
其中,r、q分别表示该数据源的评价指标中的召回率、误报率。
本发明还提供一种比特币交易地址的标签判断装置,包括:
标签准确度计算模块,用于对于具有多个标签的比特币交易地址,基于共同输入启发式方法计算每个标签的准确度;
标签数据源得分计算模块,用于确定出为所述比特币交易地址提供标签的所有数据源;并对于每个标签,根据各数据源的评价指标计算该标签的数据源得分;
标签评分模块,用于根据每个标签的准确度和数据源得分,计算每个标签的评分;
可信标签判断模块,用于将评分最高的标签判断为该比特币交易地址的可信标签。
本发明还提供一种电子设备,包括中央处理单元、信号处理和存储单元,以及存储在信号处理和存储单元上并可在中央处理单元上运行的计算机程序,其中,所述中央处理单元执行如上所述的比特币交易地址的标签判断方法。
本发明的技术方案中,对于具有多个标签的比特币交易地址,基于共同输入启发式方法计算每个标签的准确度;确定出为所述比特币交易地址提供标签的所有数据源;对于每个标签,根据各数据源的评价指标计算该标签的数据源得分;根据每个标签的准确度和数据源得分,计算每个标签的评分;将评分最高的标签判断为该比特币交易地址的可信标签。从而针对开源情报采集的标签存在大量标签冲突问题,本发明技术方案融合了真值发现算法与比特币交易地址的特点,根据标签数据来源的质量、共同输入标签的数量等参数,为每个地址标签进行评分;将评分最高的标签作为比特币交易地址的可信标签进行标注,从而提高比特币交易地址标签标注的准确性,达到对比特币交易地址的真实身份识别的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种比特币交易地址的标签判断方法流程图;
图2为本发明实施例提供的一种计算数据源的评价指标的方法流程图;
图3为本发明实施例提供的一种比特币交易地址的标签判断装置的内部结构框图;
图4为本发明实施例提供的一种电子设备硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,除非另外定义,本发明实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
本发明的发明人发现,现有的真值发现算法大多基于数据源的质量,计算出数据源的召回率和误报率等参数对数据的正确性进行评估,没有结合数据本身的特征进行评估,因此,对比特币交易地址的标签判断准确性较低。
基于开源情报采集的标签存在大量标签冲突问题,为此,本发明技术方案设计了一种标签评分算法,融合了真值发现算法与比特币交易地址的特点,根据标签数据来源的质量、共同输入标签的数量等参数,为每个地址标签进行评分;将评分最高的标签作为比特币交易地址的可信标签进行标注,从而提高比特币交易地址标签标注的准确性,达到对比特币交易地址的真实身份识别的目的。
下面结合附图详细说明本发明实施例的技术方案。
由于同一比特币交易地址,在不同的维度,可能属于不同的实体,如某社交平台用户可能使用某交易平台的地址,在这种情况下需要对地址进行多维度标注。本实例的核心思想是,对从开源情报和事件中采集到的原始标签,分为多个维度进行存储,从而准确刻画该地址在各个维度所属的实体。
由于从多种开源信息来源中采集到的原始标签中,存在大量不同维度的地址标签,本发明设计了多维度标签存储结构。根据地址标签描述的不同类型,将地址标签分为以下维度进行存储:
平台维度:在平台层面对比特币交易地址的描述,如地址属于某个数字货币交易平台或某交易市场。
用户维度:在社交平台用户层面对比特币交易地址的描述,如地址某个社交平台或通讯软件账户,或某邮箱账号等。
矿池维度:在矿池维度对比特币交易地址的描述,如地址属于某数字货币矿池。
其他维度:除去平台维度、用户维度、矿池维度的其它的比特币交易地址的标签,如欺诈服务等。
同一比特币交易地址可能有不同维度的标签,称为多维度标签。
本发明设计了一种基于多维标签结构和标签动态评分算法的比特币地址交易标注和使用方法,能够基于标签数据来源、共同输入地址标签等信息对比特币地址标签进行评分,针对同一地址有多个标签的情况,可以准确描述冲突并消解,以确定最可信的标签。
基于开源情报采集的标签存在大量标签冲突问题,为此,本发明提供了一种比特币交易地址的标签判断方法,融合了真值发现算法与比特币交易地址的特点,根据标签数据来源的质量、共同输入标签的数量等参数,为每个地址标签进行评分。当某个地址在同一维度具有多个标签时,根据该方法判断地址的可信标签;该方法具体流程,如图1所示,包括如下步骤:
步骤S101:对于具有多个标签的比特币交易地址,基于共同输入启发式方法计算每个标签的准确度。
本步骤中,查找该比特币交易地址的共同输入地址,并统计共同输入地址的数量n;对于每个标签,统计共同输入地址中标注该标签的地址的数量m,并根据统计的数量m与n的比值确定该标签的准确度。
具体地,将所述比特币交易地址作为目标地址,查找该目标地址作为输入的所有比特币交易,从查找出的比特币交易中提取出与目标地址进行过共同输入的所有其它比特币交易地址作为该目标地址的共同输入地址。
将共同输入地址的数量记为n;对于目标地址的一个标签,将共同输入地址中,具有与该标签相同的地址数量记为m,则计算出该标签的共同输入权重为
Figure BDA0003658033110000061
作为该标签的准确度;
如果目标地址不存在共同输入地址,或所有的共同输入地址均没有标签,那么,将目标地址的每个标签的准确度设置为1,即MI=1。
步骤S102:对于每个标签,根据各数据源的评价指标计算该标签的数据源得分。
本步骤中,确定出为所述比特币交易地址提供标签的所有数据源;对于其中任意一个数据源,根据如下方法计算该数据源的评分:针对所述比特币交易地址的每个标签,判断该数据源是否为所述比特币交易地址提供了该标签的信息;根据该数据源是否为所述比特币交易地址提供该标签的情况,以及该数据源的评价指标,计算该数据源的评分:若该数据源为所述比特币交易地址提供了该标签,则计算该数据源的评分为r/q;否则计算该数据源的评分为(1-r)/(1-q);其中,r、q分别表示该数据源的评价指标中的召回率、误报率。
进而将各数据源的评分进行连乘,得到该标签的数据源得分μ,如公式1所示:
Figure BDA0003658033110000071
其中,Si表示第i个数据源,St表示为所述比特币交易地址提供了该标签的数据源的集合,
Figure BDA0003658033110000072
表示确定出的所有数据源中没有为所述比特币交易地址提供该标签的数据源的集合;ri、qi分别表示数据源Si的召回率、误报率。
步骤S103:根据每个标签的准确度和数据源得分,计算每个标签的评分。
本步骤中,对于每个标签,根据如下公式2计算该标签的评分:
Figure BDA0003658033110000073
其中,Pr表示该标签的评分,μ表示该标签的数据源得分,MI表示该标签的准确度,α为设置的概率阈值。
步骤S104:将评分最高的标签判断为该比特币交易地址的可信标签。
本步骤中,根据标签的评分对标签进行排序,将评分最高的标签判断为该比特币交易地址的可信标签。
上述各数据源的评价指标可以根据如下方法计算,具体流程如图2所示,包括如下步骤:
步骤S201:对于每个数据源,选取用于计算该数据源的评价指标的数据集;
本步骤中,对于每个数据源,从该数据源中随机选取N个比特币交易地址;对于每个选取的比特币交易地址,使用API(应用程序接口)获取公开的区块链浏览器(如,欧科云链OkLink)对该比特币交易地址标注的标签。将选取的比特币交易地址及其标签,作为该数据源的数据集。
其中,本领域技术人员可以根据经验设置N的值,比如设置N=100。
步骤S202:基于选取的数据集,计算每个数据源的评价指标;
本步骤中,基于选取的数据集,计算每个数据源的评价指标;数据源的评价指标可以包括精确率(precision)、召回率(recall)、误报率(FPR)三个指标;
具体地,第i个数据源Si的评价指标:精确率
Figure BDA0003658033110000081
其中,TP表示该数据源Si的数据集中正确数据的数量;TP+FP表示该数据集中数据的的总数量;
第i个数据源Si的评价指标:召回率
Figure BDA0003658033110000082
其中,TP+FN表示所有数据源的数据集中正确数据的数量;
第i个数据源Si的评价指标:误报率
Figure BDA0003658033110000083
当数据源标签信息更新时,重新选取数据集计算数据源的评价指标。
基于上述的比特币交易地址的标签判断方法,本发明实施例提供的一种比特币交易地址的标签判断装置,其内部结构如图3所示,包括:标签准确度计算模块301、标签数据源得分计算模块302、标签评分模块303、可信标签判断模块304;
其中,标签准确度计算模块301用于对于具有多个标签的比特币交易地址,基于共同输入启发式方法计算每个标签的准确度;具体地,标签准确度计算模块301查找该比特币交易地址的共同输入地址,并统计共同输入地址的数量n;对于每个标签,统计共同输入地址中标注该标签的地址的数量m,并根据统计的数量m与n的比值确定该标签的准确度。
标签数据源得分计算模块302用于确定出为所述比特币交易地址提供标签的所有数据源;并对于每个标签,根据各数据源的评价指标计算该标签的数据源得分;具体地,标签数据源得分计算模块302确定出为所述比特币交易地址提供标签的所有数据源;进而对于每个标签,针对每个数据源,根据该数据源是否提供该标签的情况,以及该数据源的评价指标,计算该数据源的评分;将各数据源的评分进行连乘,得到该标签的数据源得分。
标签评分模块303用于根据每个标签的准确度和数据源得分,计算每个标签的评分;具体地,标签评分模块303可以根据上述公式2计算标签的评分。
可信标签判断模块304用于将评分最高的标签判断为该比特币交易地址的可信标签。
上述的比特币交易地址的标签判断装置中各模块的功能的实现方法可参考上述图1所示流程各步骤中的方法,此处不再赘述。
图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的比特币交易地址的标签判断方法。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,可以与非线性接收机相连,从非线性接收机接收信息,实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本发明的技术方案中,对于具有多个标签的比特币交易地址,基于共同输入启发式方法计算每个标签的准确度;确定出为所述比特币交易地址提供标签的所有数据源;对于每个标签,根据各数据源的评价指标计算该标签的数据源得分;根据每个标签的准确度和数据源得分,计算每个标签的评分;将评分最高的标签判断为该比特币交易地址的可信标签。从而针对开源情报采集的标签存在大量标签冲突问题,本发明技术方案融合了真值发现算法与比特币交易地址的特点,根据标签数据来源的质量、共同输入标签的数量等参数,为每个地址标签进行评分;将评分最高的标签作为比特币交易地址的可信标签进行标注,从而提高比特币交易地址标签标注的准确性,达到对比特币交易地址的真实身份识别的目的。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种比特币交易地址的标签判断方法,其特征在于,包括:
对于具有多个标签的比特币交易地址,基于共同输入启发式方法计算每个标签的准确度;
确定出为所述比特币交易地址提供标签的所有数据源;
对于每个标签,根据各数据源的评价指标计算该标签的数据源得分;
根据每个标签的准确度和数据源得分,计算每个标签的评分;
将评分最高的标签判断为该比特币交易地址的可信标签。
2.根据权利要求1所述的方法,其特征在于,所述基于共同输入启发式方法计算每个标签的准确度,具体包括:
查找该比特币交易地址的共同输入地址,并统计共同输入地址的数量n;
对于每个标签,统计共同输入地址中标注该标签的地址的数量m,并根据统计的数量m与n的比值确定该标签的准确度。
3.根据权利要求1所述的方法,其特征在于,所述根据各数据源的评价指标计算该标签的数据源得分,具体包括:
对于每个数据源,根据该数据源是否提供该标签的情况,以及该数据源的评价指标,计算该数据源的评分;
将各数据源的评分进行连乘,得到该标签的数据源得分。
4.根据权利要求3所述的方法,其特征在于,所述根据该数据源是否提供该标签的情况,以及该数据源的评价指标,计算该数据源的评分,具体包括:
若该数据源为提供该标签的数据源,则计算该数据源的评分为r/q;否则计算该数据源的评分为(1-r)/(1-q);
其中,r、q分别表示该数据源的评价指标中的召回率、误报率。
5.根据权利要求4所述的方法,其特征在于,所述根据计算的每个标签的准确度和数据源得分,确定每个标签的评分,具体包括:
对于每个标签,根据如下公式计算该标签的评分:
Figure FDA0003658033100000021
其中,Pr表示该标签的评分,μ表示该标签的数据源得分,MI表示该标签的准确度,α为设置的概率阈值。
6.一种比特币交易地址的标签判断装置,其特征在于,包括:
标签准确度计算模块,用于对于具有多个标签的比特币交易地址,基于共同输入启发式方法计算每个标签的准确度;
标签数据源得分计算模块,用于确定出为所述比特币交易地址提供标签的所有数据源;并对于每个标签,根据各数据源的评价指标计算该标签的数据源得分;
标签评分模块,用于根据每个标签的准确度和数据源得分,计算每个标签的评分;
可信标签判断模块,用于将评分最高的标签判断为该比特币交易地址的可信标签。
7.根据权利要求6所述的装置,其特征在于,
所述标签准确度计算模块具体用于查找该比特币交易地址的共同输入地址,并统计共同输入地址的数量n;对于每个标签,统计共同输入地址中标注该标签的地址的数量m,并根据统计的数量m与n的比值确定该标签的准确度。
8.根据权利要求6所述的装置,其特征在于,
所述标签数据源得分计算模块具体用于确定出为所述比特币交易地址提供标签的所有数据源;进而对于每个标签,针对每个数据源,根据该数据源是否提供该标签的情况,以及该数据源的评价指标,计算该数据源的评分;将各数据源的评分进行连乘,得到该标签的数据源得分。
9.根据权利要求6所述的装置,其特征在于,
所述标签评分模块具体用于对于每个标签,根据如下公式计算该标签的评分:
Figure FDA0003658033100000031
其中,Pr表示该标签的评分,μ表示该标签的数据源得分,MI表示该标签的准确度,α为设置的概率阈值。
10.一种电子设备,包括中央处理单元、信号处理和存储单元,以及存储在信号处理和存储单元上并可在中央处理单元上运行的计算机程序,其特征在于,所述中央处理单元执行所述程序时实现如权利要求1-5任一所述的方法。
CN202210567247.6A 2022-05-23 2022-05-23 一种比特币交易地址的标签判断方法和装置 Pending CN115239488A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210567247.6A CN115239488A (zh) 2022-05-23 2022-05-23 一种比特币交易地址的标签判断方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210567247.6A CN115239488A (zh) 2022-05-23 2022-05-23 一种比特币交易地址的标签判断方法和装置

Publications (1)

Publication Number Publication Date
CN115239488A true CN115239488A (zh) 2022-10-25

Family

ID=83667901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210567247.6A Pending CN115239488A (zh) 2022-05-23 2022-05-23 一种比特币交易地址的标签判断方法和装置

Country Status (1)

Country Link
CN (1) CN115239488A (zh)

Similar Documents

Publication Publication Date Title
US10216558B1 (en) Predicting drive failures
JP6402653B2 (ja) 物体認識装置、物体認識方法、およびプログラム
TW202008237A (zh) 針對新場景的預測模型訓練方法及裝置
CN110704677B (zh) 一种节目推荐方法、装置、可读存储介质及终端设备
CN106462633B (zh) 将相关的稀疏数据高效存储在搜索索引中
CN116386801B (zh) 基于聚类算法构建患者身份标识的方法、装置及电子设备
CN116823409B (zh) 一种基于目标搜索数据的智能筛选方法及系统
US20230205755A1 (en) Methods and systems for improved search for data loss prevention
CN109034199B (zh) 数据处理方法及装置、存储介质和电子设备
CN111814481B (zh) 购物意图识别方法、装置、终端设备及存储介质
CN113849702A (zh) 一种确定目标数据的方法、装置、电子设备及存储介质
US20190130034A1 (en) Fingerprint clustering for content-based audio recognition
CN108804917B (zh) 一种文件检测方法、装置、电子设备及存储介质
CA3052775A1 (en) Method, apparatus, medium and electronic device for analysis of user stability
CN110009056B (zh) 一种社交账号的分类方法及分类装置
CN109727056B (zh) 金融机构推荐方法、设备、存储介质及装置
CN115239488A (zh) 一种比特币交易地址的标签判断方法和装置
CN116310994A (zh) 一种视频片段提取方法、装置、电子设备及介质
CN115470190A (zh) 一种多存储池数据分类存储方法、系统与电子设备
US20160147902A1 (en) Data provision device, data provision method, and data provision program
CN110059272B (zh) 一种页面特征识别方法和装置
CN114816518A (zh) 基于simhash的源代码中开源成分筛选识别方法及系统
CN114297235A (zh) 风险地址识别方法、系统及电子设备
CN114139547A (zh) 知识融合方法、装置、设备、系统及介质
CN113868373A (zh) 一种词云生成方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination