CN116089402B - 一种区块链资产数据智能处理系统 - Google Patents

一种区块链资产数据智能处理系统 Download PDF

Info

Publication number
CN116089402B
CN116089402B CN202310364429.8A CN202310364429A CN116089402B CN 116089402 B CN116089402 B CN 116089402B CN 202310364429 A CN202310364429 A CN 202310364429A CN 116089402 B CN116089402 B CN 116089402B
Authority
CN
China
Prior art keywords
data
time
chain
redundancy
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310364429.8A
Other languages
English (en)
Other versions
CN116089402A (zh
Inventor
郭洪峰
陈晓兰
安起光
任敏
张新
沈万芳
宗高峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Finance and Economics
Original Assignee
Shandong University of Finance and Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Finance and Economics filed Critical Shandong University of Finance and Economics
Priority to CN202310364429.8A priority Critical patent/CN116089402B/zh
Publication of CN116089402A publication Critical patent/CN116089402A/zh
Application granted granted Critical
Publication of CN116089402B publication Critical patent/CN116089402B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/217Database tuning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/835Timestamp
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及用于电子数字数据处理技术领域,具体涉及一种区块链资产数据智能处理系统,包括:通过对区块链时序数据进行时间窗口划分,分析区块链时序数据的各个时间窗口中无匹配数据点的异常程度,获得多个时间窗口子序列的第一冗余度,综合获得区块链时序数据的冗余度。本发明通过分析链上和链下的交易记录数据,提出了一种相较于常规区块链数据冗余度评价方法更准确的区块链数据冗余度分析和计算方法,能够避免因为时间戳不一致导致对实际冗余数据的不准确评估,保障区块链数据的安全性。

Description

一种区块链资产数据智能处理系统
技术领域
本发明涉及电子数字数据处理技术领域,具体涉及一种区块链资产数据智能处理系统。
背景技术
区块链数据存储过程中的数据冗余直接影响着链上资产动态定价的效率。因此,多数情况下都需要考虑减少数据冗余,减少数据存储空间,提升链上数据运行效率。但是在有些情况下,还需要考虑适当增加数据冗余度,如对数据冗余性编码可以防止数据的丢失与错误。因此,数据的冗余度评估是数据处理的关键基础。
在进行冗余度评估的过程中,需要根据数据的比较结果评估链上和链下资产数据的冗余度。如果数据在链上和链下都存在,并且它们是匹配一致的,则冗余度评估将是高的。如果数据只存在于链上或链下,则冗余度评估将是低的。
对于链上与链下数据是否一致,需要通过以下方式进行评估:
1. 比较哈希值:在区块链中,每个区块都有一个唯一的哈希值。通过链上和链下数据的哈希值进行比较以确认是否相同。如果相同则认为是一致的。
2. 比较交易记录:在比较链上和链下数据时,可以查看他们所对应的交易记录。比较交易记录可以确定它们是否匹配。如果交易时间相同,则认为交易时间一致。
交易记录通常由交易参与方的钱包地址、交易金额、交易时间等信息组成。
在对交易记录进行比较的过程中,如果链上和链下交易记录的顺序不同,则会因为时间戳的不一致将原本的冗余数据判断为不冗余,会造成冗余度的错误评估。所以在进行冗余度评估之前需要对因网络延迟导致的交易记录时间戳不一致进行检测,并正确判断每个区块链数据的冗余度。
发明内容
本发明提供一种区块链资产数据智能处理系统,以解决现有的问题。
本发明的一种区块链资产数据智能处理系统采用如下技术方案:
本发明一个实施例提供了一种区块链资产数据智能处理系统,系统包括:
区块链数据获取模块:获取链上和链下资产交易记录时序数据,将获得的链上和链下资产交易记录时序数据分别记为链上时序数据和链下时序数据,将链上时序数据和链下时序数据统称为区块链时序数据,并将区块链时序数据中的序列元素记为数据点;
数据切片模块:将区块链时序数据划分为多个时间窗口子序列;
第一冗余度模块:利用时间戳和哈希值将链上时序数据和链下时序数据进行匹配,将在同一时间戳与链下时序数据的哈希值不同的链上时序数据中的数据点记为无匹配数据点,将与无匹配数据点的哈希值相同的链下时序数据的数据点记为哈希数据点;
将无匹配数据点与对应哈希数据点的时间戳之间的差异记为时间跨度,并将时间戳之间的全部无匹配数据点与时间戳区间内的全部数据点的数量比例关系作为第一比例关系;
利用第一比例关系对时间跨度进行加权处理获得第一程度;
利用无匹配数据点与哈希数据点之间的匹配数量和时间戳获得跨度线数量曲线,根据跨度线数量曲线中的最值获得曲线密集峰区间,将时间跨度对应区间与曲线密集峰区间的中点的差值记为时间区间距离;
根据时间区间距离与预设时间窗口长度、时间跨度以及曲线密集峰区间长度的比例关系获得第二程度;
将第一程度和第二程度之间的乘积记为冗余度校正因子,将时间戳相同且哈希值相同的数据点与时间窗口内数据点的数量比例关系作为第二比例关系;
利用冗余度校正因子对第二比例关系进行乘积校正获得第一冗余度;
第二冗余度模块:将多个时间窗口子序列中无匹配数据点的数量作为权重因子,将权重因子与第一冗余度的权重融合结果作为第二冗余度;
冗余度调整模块:根据第二冗余度完成对区块链时序数据整体的冗余度评估,并根据冗余度对区块链数据进行冗余度调整,实现对区块链数据的智能处理。
进一步的,所述时间窗口子序列,获取方法如下:
按照预设时间窗口长度利用时间窗口法将链上时序数据和链下时序数据进行时间切片,划分为多个时间窗口子序列。
进一步的,所述第一程度,获取方法如下:
Figure SMS_1
其中,
Figure SMS_2
表示在时间窗口子序列中的第i个无匹配数据点到与其对应的第j个哈希数据点的时间戳区间中的全部数据点数量,/>
Figure SMS_3
表示在时间窗口子序列中的第i个无匹配数据点到与其具有相同交易记录哈希值的第j个数据点的时间戳区间中的全部无匹配数据点的数量,将/>
Figure SMS_4
记为第一比例关系,/>
Figure SMS_5
表示在时间窗口子序列中的第i个无匹配数据点到与其具有相同交易记录哈希值的第j个数据点的时间戳的归一化后的时间跨度。
进一步的,所述曲线密集峰区间,获取方法如下:
利用链上时序数据中的无匹配数据点的哈希值,在时间窗口子序列范围内遍历搜索链下时序数据中与无匹配数据点的哈希值相同的数据点进行哈希匹配,统计不同时间戳下链上时序数据和链下时序数据中数据点进行哈希匹配时每一个时间戳下存在的匹配数量,建立以时间戳为横轴,以每一个时间戳下存在的匹配数量为纵轴,获得跨度线数量曲线,并获取跨度线数量曲线的两个最小值,将两个最小值所包含的区间作为曲线密集峰区间。
进一步的,获取方法如下:
Figure SMS_6
其中,时间区间距离
Figure SMS_7
表示通过时间区间的中点之间的时间间距作为两个时间区间的距离;
曲线密集峰区间
Figure SMS_8
表示通过时间跨度线的数量进行整体划分得到的曲线密集峰区间;
Figure SMS_9
表示时间窗口子序列中的第i个链上无匹配数据点到与链下其具有相同交易记录哈希值的第j个数据点的时间戳的时间跨度;
跨度区间
Figure SMS_10
表示时间窗口子序列中的第i个链上无匹配数据点到与链下其具有相同交易记录哈希值的第j个数据点的时间戳所包含的区间;
Figure SMS_11
表示预设时间窗口长度,曲线密集峰区间长度/>
Figure SMS_12
表示曲线密集峰区间的区间长度。
进一步的,所述第一冗余度,获取方法如下:
Figure SMS_13
其中,第一冗余度Y表示在链上时序数据和链下时序数据的每个时间窗口子序列的数据冗余程度,
Figure SMS_14
表示时间窗口子序列中的数据点数量;冗余数据点的数量/>
Figure SMS_15
表示时间窗口子序列的链上时序数据的数据点与链下时序数据的数据点之间的时间戳对应且哈希值相同的数据点数量,/>
Figure SMS_16
表示时间戳不匹配的第i个链上数据点的第一程度;/>
Figure SMS_17
表示时间窗口子序列中第i个无匹配数据点的第二程度。
进一步的,所述第二冗余度,包括的具体步骤如下:
Figure SMS_18
其中,
Figure SMS_19
表示对区块链时序数据划分的第m个时间窗口子序列,权重因子/>
Figure SMS_20
表示待判断冗余度的区块链数据所划分的时间窗口子序列中第m个时间窗口子序列中的无匹配数据点的数量,/>
Figure SMS_21
表示第m个时间窗口子序列的第一冗余度。
本发明的技术方案的有益效果是:
(1)基于本发明所述的通过无匹配数据点在时间切片中的分布特征判断时间切片时间窗口子序列中数据点的异常重要性,并根据异常重要性计算时间切片时间窗口子序列中链上链下交易记录数据的冗余度,相较于直接通过时间切片中的交易记录一致性进行冗余度判断,可以避免因为网络延迟出现的时间戳不一致导致的冗余度误判,使对链上链下交易记录数据的冗余度评估更加准确。
(2)基于本发明所述的通过无匹配数据点在时间窗口子序列中的局部分布特征获取每一个无匹配数据点的第一程度并通过第一程度表示无匹配数据点在冗余度计算中的重要程度从而使得时间窗口法中的冗余度计算更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种区块链资产数据智能处理系统的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出一种区块链资产数据智能处理系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种区块链资产数据智能处理系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种区块链资产数据智能处理系统的模块流程图,该系统包括以下模块:
区块链数据获取模块:获取待进行链上链下资产交易记录冗余度评估的区块链数据,获取区块链数据中所有数据点的时间戳和哈希值。
对于链上的资产数据交易记录数据,记录中每一笔交易作为一个数据点,数据点包含时间戳,交易哈希值,交易类型,交易双方信息以及交易金额等信息。对于全部交易记录数据可以根据时间戳形成时间序列数据。
本实施例中用于评估链上链下资产数据交易记录冗余度的数据即为链上链下的交易记录时序数据。根据实际时间所形成时间轴,每一个交易记录都根据其时间戳在对应的时间点上有一个数据点,该数据点中包含了交易记录中的其余信息。存储的数据结构为字典结构。
获取用于进行冗余度评估的链上和链下资产交易记录时序数据,将链上和链下资产交易记录时序数据分别记为链上时序数据和链下时序数据,将链上时序数据和链下时序数据统称为区块链时序数据,并将区块链时序数据中的序列元素记为数据点,并获取每个数据点的哈希值。
数据切片模块:获取时间窗口法中的窗口长度,通过窗口长度对时序数据进行时间切片,获取到全部时间窗口子序列。
1.对于链上时序数据和链下时序数据的冗余度评估,根据常用的时间窗口法,首先需要按照预设时间窗口长度对链上时序数据和链下时序数据进行时间切片,在确定窗口大小之后则是根据预设时间窗口长度对链上时序数据进行时间切片,将链上时序数据划分为若干个时间窗口子序列。在对比中链上时序数据因为具有不可篡改与去中心化的特点,所以以链上时序数据的预设时间窗口长度为标准对链下时序数据也进行时间切片。
2.在对链上时序数据和链下时序数据进行时间切片后,则需要对每一个时间窗口子序列进行冗余度的评估,本实施例通过无匹配数据点的分布特征消除因为网络延迟出现的交易记录时间戳不一致导致的冗余度计算不准确的问题。通过无匹配的数据点在时间窗口子序列中的局部密度与数量进行无匹配数据点的第一程度的衡量,从而在通过交易记录的一致性进行冗余度计算时消除这些数据点的影响。
3.在获取到每个时间窗口子序列的冗余度之后,因为每一个时间窗口子序列对于整体的冗余度影响是不同的,对于其中交易记录频率更高的时间窗口子序列的冗余度信息是更重要的,所以进一步通过对时间窗口子序列的冗余度信息重要程度进行衡量,从而获取到准确的整体链上时序数据和链下时序数据交易记录的冗余度。
在确定预设时间窗口长度时,需要根据具体的应用场景和数据特点来确定合适的长度,可以根据数据更新频率、数据稳定性和数据量等因素进行评估和测试,以找到最佳的预设时间窗口长度。
本实施例中将预设时间窗口长度记为
Figure SMS_22
,此处预设时间窗口长度/>
Figure SMS_23
为1小时。
根据预设时间窗口长度,对链上数据进行时间序列切片。
时间戳匹配的具体实现:在时间戳匹配过程中,需要对链上时序数据和链下时序数据中数据点的时间戳进行比对和匹配,本实施例中采用哈希匹配。即链上时序数据和链下时序数据的数据点所包含的交易记录中的哈希值一致时,则认为交易记录是一致的,将在同一时间戳与链下时序数据的哈希值不同的链上时序数据中的数据点记为无匹配数据点。
获取链上时序数据中数据点的时间戳在链下时序数据中无对应的时间戳:在匹配过程中,可能会出现链上时序数据中数据点的时间戳和链下时序数据的数据点无对应的时间戳的情况。这可能是由于链上数据与链下数据的不一致性导致的。
至此,获得时间窗口法中的预设时间窗口长度,通过预设时间窗口长度对链上时序数据和链下时序数据进行时间切片,获得各个时间窗口子序列以及时间窗口子序列中的无匹配数据点。
第一冗余度模块:对于每个时间窗口子序列,通过其中无匹配数据点的分布特征获取到数据点的第一程度和第二程度,根据第一程度获取时间窗口子序列的第一冗余度。
对于每一个链下时序数据的时间窗口子序列,通过时间窗口子序列中的无匹配数据点的分布特征获得每个无匹配数据点的第一程度。该步骤的逻辑过程:
在实际场景中因为网络延迟出现的链上数据点在链下没有匹配是因为两条交易记录的时间戳不一致。当存在网络延迟时,考虑到实际情况,链上数据在一个局部范围中不会只有一个数据点无匹配,那么在链上无匹配数据点中,可以根据其局部密度来对该无匹配数据点的第一程度进行衡量,对于两个交易记录的哈希值一致但不同时间戳的数据点,时间戳之间的差异越大则该交易记录存在着更高的异常性(该异常表示为异常交易)。
另外,将与无匹配数据点的哈希值相同的链下时序数据的数据点记为哈希数据点,将无匹配数据点与哈希数据点两个时间戳之间包含的区间记为无匹配数据点与哈希数据点的时间戳区间,时间戳区间的长度记为时间跨度。
在时间窗口子序列中的第i个无匹配数据点到与其具有相同交易记录哈希值的第j个数据点的时间戳的差值绝对值记为时间跨度
Figure SMS_24
,在时间窗口子序列中的第i个无匹配数据点到与其具有相同交易记录哈希值的所有数据点的对应的时间跨度进行线性归一化获得归一化后的时间跨度/>
Figure SMS_25
所述的,对于时间戳不匹配的第i个链上数据点的第一程度
Figure SMS_26
的计算方式如下:
Figure SMS_27
其中,
Figure SMS_28
表示在时间窗口子序列中的第i个无匹配数据点到与其对应的第j个哈希数据点的时间戳区间中的全部数据点数量,/>
Figure SMS_29
表示在时间窗口子序列中的第i个无匹配数据点到与其具有相同交易记录哈希值的第j个数据点的时间戳区间中的全部无匹配数据点的数量,将/>
Figure SMS_30
记为第一比例关系,/>
Figure SMS_31
表示在时间窗口子序列中的第i个无匹配数据点到与其具有相同交易记录哈希值的第j个数据点的时间戳的归一化后的时间跨度。
上式中通过无匹配数据点到与其具有相同交易哈希值的数据点之间的时间区间作为局部区域,通过该区域中的无匹配数据点的数量进行局部密度的衡量。并通过两个具有相同交易记录哈希值的时间跨度在局部米的基础上进一步进行异常的衡量。第一程度
Figure SMS_32
反映了在区块链时序数据中无匹配数据点的异常性对区块链时序数据的冗余度评估的影响程度,即无匹配数据点在时间戳上的延迟程度以及无匹配数据点在时间窗口子序列中的数据量占比,在上式中将时间跨度在整个冗余度评估的所有时间窗口(时间窗口子序列)中的存在的具有相同交易哈希值的数据点之间的时间跨度通过线性归一化进行异常性的判断,并根据无匹配数据点的异常性对冗余度评估的影响程度的判断。
在获取到时间窗口子序列中每个不匹配数据点的第一程度
Figure SMS_33
之后,即获取了对于时间窗口子序列中的每个不匹配数据点对于冗余度的影响的大小。但是在实际使用中,因为在对时间序列进行时间切片时,是根据固定的预设时间窗口长度进行划分,那么对于每一个时间窗口子序列中的无匹配数据点的分布是未知的。在一个时间窗口子序列中存在着若干个链上无链下匹配数据点(无匹配数据点),对于这个数据点在整个时间窗口子序列中寻找与其交易记录哈希值相同的数据点,这两个数据点也就形成了对应关系,这两个数据点的时间跨度连线也就形成了时间跨度线。
通过单个时间窗口子序列中每个数据点上方的时间跨度线的数量形成跨度线数量曲线,即每个时间戳对应的是该时间戳上方的时间跨度线的数量,
通过获取跨度线数量曲线中最小值与第二最小值作为闭区间端点,端点所包含区域作为主要的密集峰区间,将该区间记为曲线密集峰区间
Figure SMS_34
,曲线密集峰区间反映了发生网络延迟程度最高的部分时间段,对于一个时间窗口子序列中每一个无匹配数据点的时间跨度线的位置进行无匹配数据点对曲线密集峰区间的第二程度的衡量。
对于一个时间窗口子序列中每一个链下数据点上方的时间跨度线数量即可进行时间窗口子序列中时间跨线位置的重要性衡量。对于每一个数据点的时间跨度根据整个时间窗口子序列中的时间跨线数量曲线的局部极小值,局部极小值将时间窗口子序列的截断为密集峰的区间,对于时间窗口子序列中的每个无匹配数据点的时间跨度,当其越偏离主要延迟区域则该无匹配数据点对于该时间窗口子序列的冗余度的第一程度则越小。
对于第i个无匹配数据点的时间跨度
Figure SMS_35
其对应的对主要延迟区域的第二程度
Figure SMS_36
的计算方式:
Figure SMS_37
其中,时间区间距离
Figure SMS_38
表示通过时间区间的中点之间的时间间距作为两个时间区间的距离;曲线密集峰区间/>
Figure SMS_39
表示通过时间跨度线的数量进行整体划分得到的曲线密集峰区间,在本实施例中表示的是在时间窗口子序列中无匹配数据点所在的主要区间,也就是在一个时间窗口子序列中确定到的一个无匹配数据点密集区域,在一个时间窗口子序列中这个区域中即为这个时间窗口子序列的时间段中存在网络延迟的主要区域;时间跨度
Figure SMS_40
表示时间窗口子序列中的第i个链上无匹配数据点到第j个链下哈希数据点的时间戳的差值绝对值,即跨度区间的时间跨度;跨度区间/>
Figure SMS_41
表示时间窗口子序列中的第i个链上无匹配数据点与第j个链下哈希数据点的时间戳所包含的区间;/>
Figure SMS_42
表示预设时间窗口长度;曲线密集峰区间长度/>
Figure SMS_43
表示曲线密集峰区间的区间长度。
在获取到单个时间窗口子序列中通过第二程度优化后的第一程度之后,既可以通过第一程度对该时间窗口子序列的链上链下时序数据冗余度进行调整。
以任意一个时间窗口子序列为例,该时间窗口子序列的第一冗余度计算方式如下:
Figure SMS_44
其中,
Figure SMS_45
表示时间窗口子序列中的数据点数量;冗余数据点的数量/>
Figure SMS_46
表示时间窗口子序列中的数据点中的时间戳对应交易记录相同的数据点数量;第二比例关系/>
Figure SMS_47
表示链上时序数据和链下时序数据在该时间窗口子序列中冗余数据点在整个时间窗口子序列中数据点数量的占比,是评估区块链数据的冗余度常用的评估方法;第一程度/>
Figure SMS_48
表示第i个无匹配数据点的第一程度;第二程度/>
Figure SMS_49
表示时间窗口子序列中第i个无匹配数据点的第二程度,将/>
Figure SMS_50
记为冗余度校正因子,表示对第二比例关系的调整校正,将区块链时序数据的多个时间窗口子序列的第一冗余度Y记为/>
Figure SMS_51
,表示第m个时间窗口子序列的第一冗余度,第一冗余度表示区块链时序数据中时间窗口子序列的数据冗余度。
对于时间窗口子序列中每一个无匹配数据点的冗余度校正因子的均值作为时间窗口子序列中第二比例关系
Figure SMS_52
的校正因子。以此进行对时间窗口子序列中数据的冗余度的衡量,从而避免本实施例中核心问题所述的冗余度衡量问题。
1.基于上式所述通过数据点的局部密度进行无匹配数据点的第一程度衡量,并在此基础上通过时间跨度对数据点的第一程度相较于传统的通过交易哈希值的相同判断来对无匹配数据点进行冗余的判断,通过数据点对于网络延迟的符合性衡量无匹配数据点对冗余度判断的重要性(即上述第一程度)。并进一步根据实际场景中网络延迟的数据点时间跨度间隔越高则说明该交易记录越存在异常,根据数据点之间的时间跨度进一步优化无匹配数据点对于冗余度衡量的第一程度。
2.基于上式所述的通过时间窗口子序列中的无匹配数据点的主要区间与每一个无匹配数据点的时间跨度线区间的距离衡量进行无匹配数据点与主要延迟区间的第二程度计算,相较于单独通过时间跨度线的长度的第一程度衡量,可以进一步通过时间窗口子序列中的网络延迟发生的密集区域进行无匹配数据点在时间窗口子序列中对冗余度的第一程度衡量。从而避免因为时间窗口固定长度划分导致的对于时间窗口子序列中的网络延迟主要发生区域以外的数据点在冗余度计算中影响过大导致的冗余度计算不准确。在实际的冗余度计算过程中,通过上式可以达到时间窗口子序列的冗余度计算可以避免局部无匹配数据点数量少的异常数据点影响冗余度,并且避免了在此基础上存在的时间窗口子序列中偏离主要的网络延迟区间的数据点在冗余度计算中的影响。在消除这些数据点的影响后从而的到准确的时间窗口子序列冗余度。
至此,对于每个时间窗口子序列,通过其中无匹配数据点的分布特征获取到数据点的第一程度,根据第一程度获取时间窗口子序列的冗余度。
第二冗余度模块:对于全部时间窗口子序列,通过每个时间窗口子序列的交易记录分布特征获取时间窗口子序列的第一冗余度,并以此获取链上链下资产交易记录的第二冗余度。
在获取到单个时间窗口子序列的冗余度之后,因为每个时间窗口子序列中所包含的交易记录数量是不同的,也就是数据记录频率不同,所以对于不同的时间窗口子序列,其在整体上的冗余度贡献程度是不同的,对于数据更密集的时间窗口子序列在整体均值计算的过程中更重要,所以根据每个时间窗口子序列的数据点数量对每个时间窗口子序列进行加权平均以获取整体的链上时序数据和链下时序数据冗余度,其计算过程如下:
Figure SMS_53
其中,
Figure SMS_54
表示对区块链时序数据划分的第m个时间窗口子序列,权重因子/>
Figure SMS_55
表示待判断冗余度的区块链数据所划分的时间窗口子序列中第m个时间窗口子序列中的无匹配数据点的数量,/>
Figure SMS_56
表示第m个时间窗口子序列的第一冗余度。
上式所述的通过每个时间窗口子序列中的无匹配数据点的数量在所有时间窗口子序列中的softmax归一化权重对每一个时间窗口子序列的冗余度进行加权并通过所有时间窗口子序列的均值获取整体的冗余度衡量结果。
至此,对于全部时间窗口子序列,通过每个时间窗口子序列的交易记录分布特征获取时间窗口子序列的重要程度,并以此获取链上链下资产交易记录的冗余度。
至此,对链上时序数据和链下时序数据中无匹配的数据点进行分析,消除因网络延迟造成的冗余度评估异常,获取到准确的链上时序数据和链下时序数据冗余度。
冗余度调整模块:通过准确的链上时序数据和链下时序数据冗余度进行冗余度调整,以实现区块链数据冗余度调控、保证平衡资产动态定价效率与链上数据安全性。
在获取到链上时序数据和链下时序数据的冗余度之后,依据资产动态定价的指标体系,进行特点分析与目标分析,探索数据在链上和链下运行的区别,通过链上链下融合的仿真模拟,进行数据的冗余度评估,发现市场数据在冗余度方面的不同特点,在链上链下融合的资产动态定价中进行必要的数据冗余度处理。
具体根据冗余度对区块链中的数据进行处理的方法为:
首先,设置预设阈值为0.6,当所获取的区块链数据的冗余度大于预设阈值时,认为该区块链的数据冗余度过高,会降低链上数据的运行效率,因此就需要减少数据冗余;
其次,由于状态数据是需要参与到区块共识的,所以可以删除旧区块的状态数据,另外,同时对上链数据进行限控,控制链码的数据量上升速度,减低上链数据冗余度,减轻链码维护成本并减小占用的存储空间,具体限控的过程为:当区块链数据的冗余度大于预设阈值时,将接下来需要连接到区块链上的区块记为目标区块,当目标区块中的数据点的哈希值与区块链中数据点的哈希值相同时,将目标区块的数据点的时间戳进行重新分配后再将其连接到区块链上,以限控上链数据。
需要说明的是:
在获取到链上链下资产数据的冗余度之后,依据资产动态定价的指标体系,进行特点分析与目标分析,探索数据在链上和链下运行的区别,通过链上链下融合的仿真模拟,进行数据的冗余度评估,发现市场数据在冗余度方面的不同特点,在链上链下融合的资产动态定价中进行必要的数据冗余度处理。
基于区块链的链上链下冗余度评估可以影响链上资产的动态定价。可以考虑到下述不同情况下的资产:
链上资产的供应量:链上链下冗余度评估可以影响链上资产的供应量。如果链下存在大量与链上资产相似的资产,链上资产的供应量可能会增加,导致其价格下降。相反,如果链下没有很多相似的资产,链上资产的供应量可能会减少,导致其价格上涨。
链上资产的流动性:链上链下冗余度评估可以影响链上资产的流动性。如果链下存在大量与链上资产相似的资产,链上资产的流动性可能会减少,因为持有链上资产的人可能会转而持有链下资产。相反,如果链下没有很多相似的资产,链上资产的流动性可能会增加,因为持有链上资产的人可能无法在其他地方获得类似的资产。
链上资产的价值:链上链下冗余度评估可以影响链上资产的价值。如果链下存在大量与链上资产相似的资产,链上资产的价值可能会下降,因为人们可以在链下获得更便宜的资产。相反,如果链下没有很多相似的资产,链上资产的价值可能会上涨,因为它们是相对稀缺的。
这些因素可能会影响链上资产的动态定价。例如,如果链上资产的供应量增加,可能会导致价格下降,反之亦然。如果链上资产的流动性降低,可能会导致价格上涨,反之亦然。因此,实际场景中的链上链下数据的冗余性评估可以基于上述的多方面情况进行动态资产定价,并根据资产动态定价目的进行链上链下数据冗余度的处理。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种区块链资产数据智能处理系统,其特征在于,系统包括:
区块链数据获取模块:获取链上和链下资产交易记录时序数据,将获得的链上和链下资产交易记录时序数据分别记为链上时序数据和链下时序数据,将链上时序数据和链下时序数据统称为区块链时序数据,并将区块链时序数据中的序列元素记为数据点;
数据切片模块:将区块链时序数据划分为多个时间窗口子序列;
第一冗余度模块:利用时间戳和哈希值将链上时序数据和链下时序数据进行匹配,将在同一时间戳下与链下时序数据的哈希值不同的链上时序数据中的数据点记为无匹配数据点,将与无匹配数据点的哈希值相同的链下时序数据的数据点记为哈希数据点;
将无匹配数据点与对应哈希数据点的时间戳之间的差异记为时间跨度,并将时间戳之间的全部无匹配数据点与时间戳区间内的全部数据点的数量比例关系作为第一比例关系;
利用第一比例关系对时间跨度进行加权处理获得第一程度;
利用无匹配数据点与哈希数据点之间的匹配数量和时间戳获得跨度线数量曲线,根据跨度线数量曲线中的最值获得曲线密集峰区间,将时间跨度对应区间与曲线密集峰区间的中点的差值记为时间区间距离;
根据时间区间距离与预设时间窗口长度、时间跨度以及曲线密集峰区间长度的比例关系获得第二程度;
将第一程度和第二程度之间的乘积记为冗余度校正因子,将时间戳相同且哈希值相同的数据点与时间窗口内数据点的数量比例关系作为第二比例关系;
利用冗余度校正因子对第二比例关系进行乘积校正获得第一冗余度;
第二冗余度模块:将多个时间窗口子序列中无匹配数据点的数量作为权重因子,将权重因子与第一冗余度的权重融合结果作为第二冗余度;
冗余度调整模块:根据第二冗余度完成对区块链时序数据整体的冗余度评估,并根据冗余度对区块链数据进行冗余度调整,实现对区块链数据的智能处理;
所述曲线密集峰区间,获取方法如下:
利用链上时序数据中的无匹配数据点的哈希值,在时间窗口子序列范围内遍历搜索链下时序数据中与无匹配数据点的哈希值相同的数据点进行哈希匹配,统计不同时间戳下链上时序数据和链下时序数据中数据点进行哈希匹配时每一个时间戳下存在的匹配数量,建立以时间戳为横轴,以每一个时间戳下存在的匹配数量为纵轴,获得跨度线数量曲线,并获取跨度线数量曲线的两个最小值,将两个最小值所包含的区间作为曲线密集峰区间。
2.根据权利要求1所述一种区块链资产数据智能处理系统,其特征在于,所述时间窗口子序列,获取方法如下:
按照预设时间窗口长度利用时间窗口法将链上时序数据和链下时序数据进行时间切片,划分为多个时间窗口子序列。
3.根据权利要求1所述一种区块链资产数据智能处理系统,其特征在于,所述第一程度,获取方法如下:
Figure QLYQS_1
其中,/>
Figure QLYQS_2
表示在时间窗口子序列中的第i个无匹配数据点到与其对应的第j个哈希数据点的时间戳区间中的全部数据点数量,/>
Figure QLYQS_3
表示在时间窗口子序列中的第i个无匹配数据点到与其具有相同交易记录哈希值的第j个哈希数据点的时间戳区间中的全部无匹配数据点的数量,将/>
Figure QLYQS_4
记为第一比例关系,/>
Figure QLYQS_5
表示在时间窗口子序列中的第/>
Figure QLYQS_6
个无匹配数据点到与其具有相同交易记录哈希值的第/>
Figure QLYQS_7
个哈希数据点的时间戳的归一化后的时间跨度。
4.根据权利要求1所述一种区块链资产数据智能处理系统,其特征在于,所述第二程度,获取方法如下:
Figure QLYQS_8
其中,时间区间距离/>
Figure QLYQS_9
表示通过时间区间的中点之间的时间间距作为两个时间区间的距离;
曲线密集峰区间
Figure QLYQS_10
表示通过时间跨度线的数量进行整体划分得到的曲线密集峰区间;
Figure QLYQS_11
表示时间窗口子序列中的第i个链上无匹配数据点到与链下其具有相同交易记录哈希值的第j个哈希数据点的时间戳的时间跨度;
跨度区间
Figure QLYQS_12
表示时间窗口子序列中的第i个无匹配数据点到与链下其具有相同交易记录哈希值的第j个哈希数据点的时间戳所包含的区间;
Figure QLYQS_13
表示预设时间窗口长度,曲线密集峰区间长度/>
Figure QLYQS_14
表示曲线密集峰区间的区间长度。
5.根据权利要求1所述一种区块链资产数据智能处理系统,其特征在于,所述第一冗余度,获取方法如下:
Figure QLYQS_15
其中,第一冗余度Y表示在链上时序数据和链下时序数据的每个时间窗口子序列的数据冗余程度,/>
Figure QLYQS_16
表示时间窗口子序列中的数据点数量;冗余数据点的数量/>
Figure QLYQS_17
表示时间窗口子序列的链上时序数据的数据点与链下时序数据的数据点之间的时间戳对应且哈希值相同的数据点数量,/>
Figure QLYQS_18
表示时间窗口子序列中第/>
Figure QLYQS_19
个无匹配数据点的第一程度;/>
Figure QLYQS_20
表示时间窗口子序列中第/>
Figure QLYQS_21
个无匹配数据点的第二程度。
6.根据权利要求1所述一种区块链资产数据智能处理系统,其特征在于,所述第二冗余度,包括的具体步骤如下:
Figure QLYQS_22
其中,/>
Figure QLYQS_23
表示对区块链时序数据划分的时间窗口子序列的数量,权重因子/>
Figure QLYQS_24
表示待判断冗余度的区块链数据所划分的时间窗口子序列中第/>
Figure QLYQS_25
个时间窗口子序列中的无匹配数据点的数量,/>
Figure QLYQS_26
表示第/>
Figure QLYQS_27
个时间窗口子序列的第一冗余度。
CN202310364429.8A 2023-04-07 2023-04-07 一种区块链资产数据智能处理系统 Active CN116089402B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310364429.8A CN116089402B (zh) 2023-04-07 2023-04-07 一种区块链资产数据智能处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310364429.8A CN116089402B (zh) 2023-04-07 2023-04-07 一种区块链资产数据智能处理系统

Publications (2)

Publication Number Publication Date
CN116089402A CN116089402A (zh) 2023-05-09
CN116089402B true CN116089402B (zh) 2023-06-16

Family

ID=86204837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310364429.8A Active CN116089402B (zh) 2023-04-07 2023-04-07 一种区块链资产数据智能处理系统

Country Status (1)

Country Link
CN (1) CN116089402B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263014A (zh) * 2019-05-15 2019-09-20 广州致链科技有限公司 面向时序型数据的区块链存储系统及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022087497A1 (en) * 2020-10-22 2022-04-28 Assent Compliance, Inc. Multi-dimensional product information analysis, management, and application systems and methods
CN113434602A (zh) * 2021-07-21 2021-09-24 金泰(深圳)科技文化有限公司 一种基于区块链的学分银行自助系统
CN116049315A (zh) * 2023-01-18 2023-05-02 广东开放大学(广东理工职业学院) 一种区块链存储方法、系统、装置及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263014A (zh) * 2019-05-15 2019-09-20 广州致链科技有限公司 面向时序型数据的区块链存储系统及方法

Also Published As

Publication number Publication date
CN116089402A (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
CN110471024A (zh) 一种基于量测数据分析的智能电表在线远程校验方法
CN108446711A (zh) 一种基于迁移学习的软件缺陷预测方法
US20220083839A1 (en) Accuracy compensation method for discharge caustic alkali concentration measuring device in evaporation process
JP2023525946A (ja) 単一の負荷ジャンプに基づいて測定領域の誤差解析を行う方法及びシステム、記憶媒体
CN110568397B (zh) 一种基于mcu软件的电能表校正方法及系统
CN112150205A (zh) 价格预测方法及装置、电子设备
CN113672606A (zh) 油色谱监测数据质量评价方法
CN116089402B (zh) 一种区块链资产数据智能处理系统
CN111998918A (zh) 一种误差校正方法、误差校正装置及流量传感系统
CN110287537A (zh) 用于频标输出跳变检测的抗野值自适应卡尔曼滤波方法
CN111711192A (zh) 一种支撑台区线损精益化管理的实时线损分析方法及系统
CN114118636A (zh) 一种基于多模型选优的汽车备件需求预测系统
CN111932044A (zh) 一种基于机器学习的钢铁产品价格预测系统和方法
CN102342582A (zh) 扫描检测头检测精度的校验方法与系统、计算处理装置
CN117054958A (zh) 一种基于大数据的电能表初始固有误差优化偏移范围的方法
CN114861969A (zh) 一种基于lstm的电力系统振荡风险预测方法
CN115932706A (zh) 一种电能表数据分析方法、电能表以及存储介质
CN115207909A (zh) 一种台区拓扑识别方法、装置、设备及存储介质
CN112001552B (zh) 一种基于用电量序列的月度售电量预测方法
CN114781128A (zh) 一种利用人工智能技术的芯片寿命预测系统及方法
CN111047352A (zh) 一种渐进式电力现货市场运营效率测度方法及系统
CN117150400A (zh) 一种煤质煤流实时跟踪方法及系统
CN108460495A (zh) 一种数据处理方法及装置
Fangmann et al. Statistical approaches for assessment of climate change impacts on low flows: temporal aspects
CN117592829A (zh) 一种考虑电力数据时间同步误差的碳流分布评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant