CN116684192A - 一种区块链负样本数据上链校验方法、设备及介质 - Google Patents
一种区块链负样本数据上链校验方法、设备及介质 Download PDFInfo
- Publication number
- CN116684192A CN116684192A CN202310810174.3A CN202310810174A CN116684192A CN 116684192 A CN116684192 A CN 116684192A CN 202310810174 A CN202310810174 A CN 202310810174A CN 116684192 A CN116684192 A CN 116684192A
- Authority
- CN
- China
- Prior art keywords
- data
- node
- target
- verification
- sample data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012795 verification Methods 0.000 title claims abstract description 151
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000013524 data verification Methods 0.000 claims abstract description 28
- 230000002159 abnormal effect Effects 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 claims description 2
- 238000012549 training Methods 0.000 description 15
- 238000012935 Averaging Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/12—Applying verification of the received information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提供了一种区块链负样本数据上链校验方法、设备及介质,该方法包括:响应于接收到目标数据节点发送的待校验样本数据的流量特征,确定数据流量包所需数量集A;获取目标数据节点对待校验样本数据进行验证所需的b个目标数据流量包;若MAX(A)>b,则确定数据校验值集W;若(∑n m=1Wm)/n≥W0,则将待校验样本数据上链。本发明通过获取每一第一数据节点所需的数据流量包的数量,并根据目标数据节点所需的数据流量包的数量与第一数据节点所需数据流量包的最大数量的比对结果,来发送相应数量的数据流量包,保证了每个第一数据节点都可以根据自己的验证策略来对待检验数据进行验证,提高了数据验证的准确率。
Description
技术领域
本发明涉及数据校验领域,特别是涉及一种区块链负样本数据上链校验方法、设备及介质。
背景技术
共享区块链为不同节点共同维护的区块链,当其中一个节点需要将数据上传至共享区块链时,需要共享区块链上的其他所有节点对此数据进行校验,校验通过后,才能允许此数据上传至共享区块链中,来保证共享区块链中的数据的安全性。
目前的区块链数据上链校验通过训练模型来实现,模型的训练需要数据来支持,而区块链的每个节点为了对自己的数据进行保密,就会在区块链上先上传一个基础模型,每个节点上传数据后,由其他节点进行验证,验证通过后,模型才会训练成功。所以,目前的通过训练模型实现区块链数据上链校验的方法所需要的训练数据量过大,只有训练数据量足够的情况下,才能实现对模型的训练。而当共享区块链中要存储的数据为负样本时,由于负样本的数量较少,导致模型在训练时所需的训练数据达不到数量要求,无法应用现有的区块链数据上链校验方法对训练数据量少的区块链数据进行校验,且在背书节点的数量过多时,由于每个背书节点的验证策略不同,所需的流量特征的数量也不同,所以,如何对训练样本数据量少且背书节点所需流量特征不同的区块链进行上链校验成为亟需解决的技术问题。
发明内容
有鉴于此,本发明提供一种区块链负样本数据上链校验方法、设备及介质,至少部分解决现有技术中存在的技术问题,本发明采用的技术方案为:
根据本申请的一个方面,提供一种区块链负样本数据上链校验方法,应用于区块链平台,区块链平台连接有目标数据节点和n个第一数据节点,第一数据节点为与区块链平台连接的非目标数据节点的背书节点,目标数据节点连接有目标数据接收端口,目标数据接收端口用于接收目标设备主机发送的数据流量包,区块链平台用于存储负样本数据。
所述区块链负样本数据上链校验方法包括如下步骤:
S100、响应于接收到目标数据节点发送的待校验样本数据的流量特征,获取每一第一数据节点进行数据验证所需的数据流量包的数量,得到数据流量包所需数量集A=(A1,A2,...,Am,...,An);其中,m=1,2,...,n;Am为第m个第一数据节点进行数据验证所需的数据流量包的数量;
S200、获取目标数据节点对待校验样本数据进行验证所需的b个目标数据流量包,得到目标数据流量包集C=(C1,C2,...,Ca,...,Cb);其中,a=1,2,...,b;Ca为目标数据节点对待校验样本数据进行验证所需的第a个目标数据流量包;C1,C2,...,Ca,...,Cb为目标数据接收端口接收到的目标设备主机发送的连续的数据流量包;
S300、若MAX(A)>b,则获取目标设备主机发送的处于C1之前的MAX(A)-b个数据流量包以及处于Cb之后的MAX(A)-b个数据流量包,并将处于C1之前的MAX(A)-b个数据流量包确定为第一数据流量包,以及将处于Cb之后的MAX(A)-b个数据流量包确定为第二数据流量包;其中,MAX()为预设的最大值确定函数;
S400、将MAX(A)-b个第一数据流量包、MAX(A)-b个第二数据流量包、b个目标数据流量包发送至每一第一数据节点;
S500、接收每一第一数据节点发送的根据第一数据流量包、第二数据流量包和目标数据流量包得到的待校验样本数据对应的数据校验值,得到数据校验值集W=(W1,W2,...,Wm,...,Wn);其中,Wm为第m个第一数据节点发送的待校验样本数据对应的数据校验值;
S600、若(∑n m=1Wm)/n≥W0,则将待校验样本数据确定为负样本数据,并将待校验样本数据进行上链;其中,W0为预设校验异常阈值。
在本申请的一种示例性实施例中,步骤S500包括:
S510、接收每一第一数据节点发送的根据第一数据流量包、第二数据流量包和目标数据流量包得到的待校验样本数据对应的第一特征验证值,得到第一特征验证值集Y=(Y1,Y2,...,Ym,...,Yn);其中,Ym为第m个第一数据节点发送的待校验样本数据对应的第一特征验证值;
S520、根据每一第一数据节点的历史校验准确率,确定对应的第一数据节点的置信度,得到置信度集T=(T1,T2,...,Tm,...,Tn);其中,Tm为第m个第一数据节点的置信度;
S530、根据Ym和Tm,确定第m个第一数据节点发送的待校验样本数据对应的数据校验值Wm=Tm*Ym。
在本申请的一种示例性实施例中,步骤S520包括:
S521、获取每一第一数据节点的历史校验准确率,得到历史校验准确率集Z=(Z1,Z2,...,Zm,...,Zn);Zm=Zm1/Zm2;其中,Zm为第m个第一数据节点的历史校验准确率,Zm1为第m个第一数据节点的历史校验准确次数,Zm2为第m个第一数据节点的历史校验总次数;
S522、遍历Z,若Zm<Z0,则将0确定为第m个第一数据节点的置信度Tm;否则,将第一数据节点确定为第二数据节点,并执行步骤S523;其中,Z0为预设历史校验准确率阈值;
S523、对j个第二数据节点的历史校验准确率U1,U2,...,Ui,...,Uj进行归一化处理,得到第i个第二数据节点的置信度Ei;其中,i=1,2,...,j;j≤n;Ui为第i个第二数据节点的历史校验准确率;
S524、将Ei确定为对应的第一数据节点的置信度。
在本申请的一种示例性实施例中,步骤S300还包括:
S310、若MAX(A)≤b,则将b个目标数据流量包发送至每一第一数据节点;
S320、接收每一第一数据节点发送的根据目标数据流量包得到的待校验样本数据对应的数据校验值,得到数据校验值集W=(W1,W2,...,Wm,...,Wn);其中,Wm为第m个第一数据节点发送的待校验样本数据对应的数据校验值,并执行步骤S600。
在本申请的一种示例性实施例中,目标数据节点对应有目标编码策略;
目标数据节点用于执行以下方法:
S010、实时获取目标数据接收端口接收的目标设备主机发送的待校验样本数据的数据流量包;
S011、从待校验样本数据的数据流量包中提取对应的流量特征;
S012、根据目标编码策略,对待校验样本数据的流量特征进行自验证处理,得到自验证结果;
S013、若自验证结果为待校验样本数据为异常数据,则将待校验样本数据的流量特征发送至区块链平台。
在本申请的一种示例性实施例中,每一第一数据节点均对应有第一编码策略,n个第一数据节点对应的第一编码策略为Q1,Q2,...,Qm,...,Qn,其中,Qm为第m个第一数据节点对应的第一编码策略;
第m个第一数据节点用于执行以下方法:
S020、响应于接收到区块链平台发送的待校验样本数据对应的第一数据流量包、第二数据流量包、目标数据流量包;
S021、根据Qm,对待校验样本数据对应的第一数据流量包、第二数据流量包、目标数据流量包中的流量特征进行验证处理,得到对应的第一特征验证值Ym;
S022、将Ym发送至区块链平台。
在本申请的一种示例性实施例中,步骤S600还包括:
S610、若H0<(∑n m=1Wm)/n<W0,则将待校验样本数据确定为可疑数据,并执行步骤S611;其中,H0为预设校验正常阈值;
S611、若W1,W2,...,Wm,...,Wn中存在小于等于H0或大于等于W0的数据校验值,则对W1,W2,...,Wm,...,Wn进行方差处理,得到数据校验方差X;
S612、若X≥X0,则将待校验样本数据进行上链;否则,将待校验样本数据存储至与目标数据节点连接的目标数据库中;其中,X0为预设方差阈值。
在本申请的一种示例性实施例中,步骤S600还包括:
S620、若(∑n m=1Wm)/n≤H0,则将待校验样本数据确定为正样本数据,并将待校验样本数据存储至与目标数据节点连接的目标数据库中。
根据本申请的一个方面,提供一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现前述的区块链负样本数据上链校验方法。
根据本申请的一个方面,提供一种电子设备,包括处理器和前述的非瞬时性计算机可读存储介质。
本发明至少具有以下有益效果:
本发明通过获取每一第一数据节点在进行数据验证时所需的数据流量包的数量,并将目标数据节点进行数据验证时所需的数据流量包的数量b与第一数据节点所需数据流量包的最大数量MAX(A)进行比对,若MAX(A)>b,则表示目标数据节点不是所需流量包数量最大的数据节点,存在比目标数据节点所需流量包数量多的第一数据节点,为了保证所有第一数据节点都能通过区块链平台发送的数据流量包来进行验证,就要使目标数据节点发送的数据流量包的数量达到第一数据节点所需流量包的最大数量,故以目标数据流量包为中间流量包,向前获取MAX(A)-b个数据流量包,向后获取MAX(A)-b个数据流量包,并将此2MAX(A)-b个数据流量包发送至每一第一数据节点,使每一第一数据节点根据接收到的数据流量包自行提取所需的流量特征,来进行待校验样本数据的验证,保证了每个第一数据节点都可以根据自己的验证策略来对待检验数据进行验证,提高了数据验证的准确率。与现有技术的训练模型进行数据上链相比,本发明无需训练样本数据,且不公开每个第一数据节点的第一编码策略,在保证每个数据节点的数据保密的同时,确保了数据的上链校验的安全。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的区块链负样本数据上链校验方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
若要向共享区块链中存储数据,就需要得到区块链的背书节点的数据校验,背书节点的背书策略通过区块链的智能合约确定,当背书节点对数据进行校验通过后,才能将数据进行上链,以确保上链数据的安全。现有的通过训练模型来对数据进行上链校验的方法在模型训练时需要大量的样本数据,而当区块链中存储的是负样本这类的数据量小的数据时,则无法进行模型的训练,或训练出的模型的误差较大,达不到实现上链校验的标准,且在背书节点的数量过多时,由于每个背书节点的验证策略不同,所需的流量特征的数量也不同,所以,就需提出一种可以应用于样本数据量少、背书节点数量多且保证数据安全的区块链负样本数据上链校验方法。
一种区块链负样本数据上链校验方法,应用于区块链平台,区块链平台连接有目标数据节点和n个第一数据节点,第一数据节点为与区块链平台连接的非目标数据节点的背书节点,目标数据节点连接有目标数据接收端口,目标数据节点对应有目标编码策略,每一第一数据节点均对应有第一编码策略,n个第一数据节点对应的第一编码策略为Q1,Q2,...,Qm,...,Qn,其中,Qm为第m个第一数据节点对应的第一编码策略,目标数据接收端口用于接收目标设备主机发送的数据流量包,区块链平台用于存储负样本数据,由于本发明要解决的技术问题为针对样本数据量较少且背书节点较多时如何对区块链数据进行上链校验,而在实际工作中,负样本的数量较少,负样本即在实际工作中发生异常的数据,而用户又要公开负样本,以使区块链上的每个数据节点都能查看到负样本,来进行异常数据统计分析,所以,本发明中的区块链存储的样本数据选用负样本。
目标数据节点为与区块链平台连接的任一数据节点,当数据节点要将数据传输至区块链平台时,将该数据节点确定为目标数据节点,目标数据节点将要上传至区块链平台的数据为待校验样本数据,在区块链平台接收到目标数据节点发送的待校验样本数据的流量特征时,表示此待校验样本数据为通过了目标数据节点的验证的数据,即目标数据节点认为此待校验样本数据为异常数据。
一种区块链负样本数据上链校验方法,如图1所示,包括如下步骤:
S100、响应于接收到目标数据节点发送的待校验样本数据的流量特征,获取每一第一数据节点进行数据验证所需的数据流量包的数量,得到数据流量包所需数量集A=(A1,A2,...,Am,...,An);其中,m=1,2,...,n;Am为第m个第一数据节点进行数据验证所需的数据流量包的数量;
由于每个第一数据节点在进行待校验样本数据的验证时所需的数据流量包的数量不同,所以,通过获取每个第一数据节点所需的数据流量包的数量,来确定发送的数据流量包的数量。
S200、获取目标数据节点对待校验样本数据进行验证所需的b个目标数据流量包,得到目标数据流量包集C=(C1,C2,...,Ca,...,Cb);其中,a=1,2,...,b;Ca为目标数据节点对待校验样本数据进行验证所需的第a个目标数据流量包;C1,C2,...,Ca,...,Cb为目标数据接收端口接收到的目标设备主机发送的连续的数据流量包;
S300、若MAX(A)>b,则获取目标设备主机发送的处于C1之前的MAX(A)-b个数据流量包以及处于Cb之后的MAX(A)-b个数据流量包,并将处于C1之前的MAX(A)-b个数据流量包确定为第一数据流量包,以及将处于Cb之后的MAX(A)-b个数据流量包确定为第二数据流量包;其中,MAX()为预设的最大值确定函数;
S310、若MAX(A)≤b,则将b个目标数据流量包发送至每一第一数据节点;
S320、接收每一第一数据节点发送的根据目标数据流量包得到的待校验样本数据对应的数据校验值,得到数据校验值集W=(W1,W2,...,Wm,...,Wn);其中,Wm为第m个第一数据节点发送的待校验样本数据对应的数据校验值,并执行步骤S600;
S330、在目标数据流量包的流量特征中增加目标特征标识,并执行步骤S400;
目标特征标识用于展示目标数据流量包中的流量特征,即具有目标特征标识的流量特征为目标数据流量包的流量特征,通过设置目标特征标识,可以使每一第一数据节点在接收到数据流量包后,得知哪些流量特征是目标数据节点在进行数据验证时所使用的流量特征,便于第一数据节点根据目标数据流量包的流量特征找到自己所需的流量特征。
S400、将MAX(A)-b个第一数据流量包、MAX(A)-b个第二数据流量包、b个目标数据流量包发送至每一第一数据节点;
由于要保证上传至区块链平台的待校验样本数据的安全,以及进一步确定待校验样本数据是否为负样本数据,故将通过目标数据节点验证的待校验样本数据的第一数据流量包、目标数据流量包和第二数据流量包发送至第一数据节点,由每一第一数据节点对待校验样本数据的数据流量包中的流量特征进行进一步验证,由于每个第一数据节点都要进行验证,所以,当自验证结果为待校验样本数据为异常数据时,将待校验样本数据的流量特征发送至每一第一数据节点,第一数据节点可以为区块链平台连接的非目标数据节点的数据节点,也可以为区块链平台对应的背书节点。
若MAX(A)>b,则表示目标数据节点不是所需流量包数量最大的数据节点,存在比目标数据节点所需流量包数量多的第一数据节点,由于每个第一数据节点所要进行数据验证所需的数据流量包的数量不同,即所需的待校验样本数据的流量特征的数量不同,所以为了保证所有第一数据节点都能通过区块链平台发送的数据流量包来进行验证,就要使目标数据节点发送的数据流量包的数量达到第一数据节点所需流量包的最大数量,但又不确定每个第一数据节点所需的数据流量包的数量和具体的验证所需的流量特征,所以,以目标数据流量包为中间流量包,向前获取MAX(A)-b个数据流量包,向后获取MAX(A)-b个数据流量包,并将此2MAX(A)-b个数据流量包发送至每一第一数据节点,使每一第一数据节点根据接收到的数据流量包自行提取所需的流量特征,来进行待校验样本数据的验证,保证了每个第一数据节点都可以根据自己的验证策略来对待检验数据进行验证,提高了数据验证的准确率;若MAX(A)≤b,则表示目标数据节点为所有数据节点中所需数据流量包数量最大的数据节点,故只需要将b个目标数据流量包发送至每一第一数据节点即可,可以保证每一第一数据节点均能从目标数据流量包中提取相应的流量特征来进行验证。
S500、接收每一第一数据节点发送的根据第一数据流量包、第二数据流量包和目标数据流量包得到的待校验样本数据对应的数据校验值,得到数据校验值集W=(W1,W2,...,Wm,...,Wn);其中,Wm为第m个第一数据节点发送的待校验样本数据对应的数据校验值;
进一步,步骤S500包括:
S510、接收每一第一数据节点发送的根据第一数据流量包、第二数据流量包和目标数据流量包得到的待校验样本数据对应的第一特征验证值,得到第一特征验证值集Y=(Y1,Y2,...,Ym,...,Yn);其中,Ym为第m个第一数据节点发送的待校验样本数据对应的第一特征验证值;
S520、根据每一第一数据节点的历史校验准确率,确定对应的第一数据节点的置信度,得到置信度集T=(T1,T2,...,Tm,...,Tn);其中,Tm为第m个第一数据节点的置信度;
在确定每一第一数据节点对应的第一特征验证值后,要保证待校验样本数据的最终验证结果的准确性,就要对所有第一数据节点进行权重划分,根据每一第一数据节点的历史校验准确率,来确定对应的第一数据节点的置信度,通过第一数据节点的置信度,表示对应的第一数据节点在待校验样本数据的最终验证结果中所占的比重,置信度越大,表示对应的第一数据节点的验证结果在待校验样本数据的最终验证结果中的比重越大,即其对应的第一数据节点的验证结果的可参考性越大。
其中,步骤S520包括:
S521、获取每一第一数据节点的历史校验准确率,得到历史校验准确率集Z=(Z1,Z2,...,Zm,...,Zn);Zm=Zm1/Zm2;其中,Zm为第m个第一数据节点的历史校验准确率,Zm1为第m个第一数据节点的历史校验准确次数,Zm2为第m个第一数据节点的历史校验总次数;
历史校验准确率表示对应的第一数据节点的历史校验准确次数所占的比例,历史校验准确率越大,表示对应的第一数据节点的历史校验准确次数越多,说明对应的第一数据节点的校验越为准确。
S522、遍历Z,若Zm<Z0,则将0确定为第m个第一数据节点的置信度Tm;否则,将第一数据节点确定为第二数据节点,并执行步骤S523;其中,Z0为预设历史校验准确率阈值;
通过每一第一数据节点的历史校验准确率,来确定对应的第一数据节点的置信度,若历史校验准确率小于预设历史校验准确率阈值,则表示其对应的第一数据节点的历史校验准确的次数过少,则不考虑其对待校验样本数据的验证结果,将0确定为其对应的置信度,若历史校验准确率大于等于预设历史校验准确率阈值,则表示其对应的第一数据节点的历史校验准确次数过多,其对待校验样本数据的验证结果具有参考价值。
S523、对j个第二数据节点的历史校验准确率U1,U2,...,Ui,...,Uj进行归一化处理,得到第i个第二数据节点的置信度Ei;其中,i=1,2,...,j;j≤n;Ui为第i个第二数据节点的历史校验准确率;
将所有第二数据节点的历史校验准确率做归一化处理,得到每个第二数据节点的置信度,归一化处理为了使每个第二数据节点根据其历史校验准确率,得到的置信度不同,历史校验准确率越大,对应的第二数据节点的置信度越大。
S524、将Ei确定为对应的第一数据节点的置信度。
为了便于后续步骤的进行,将确定出的第二数据节点的置信度再确定为对应的第一数据节点的置信度。
S530、根据Ym和Tm,确定第m个第一数据节点发送的待校验样本数据对应的数据校验值Wm=Tm*Ym;
S600、若(∑n m=1Wm)/n≥W0,则将待校验样本数据确定为负样本数据,并将待校验样本数据进行上链;其中,W0为预设校验异常阈值;
在确定出每个第一数据节点对待校验样本数据的数据校验值后,对所有数据校验值取平均值,若其大于等于预设校验异常阈值,则表示第一数据节点对待校验样本数据的最终验证结果为待校验样本数据为异常数据,可以将待校验样本数据上链。
S610、若H0<(∑n m=1Wm)/n<W0,则将待校验样本数据确定为可疑数据,并执行步骤S611;其中,H0为预设校验正常阈值;
若所有数据校验值的平均值大于预设校验正常阈值且小于预设校验异常阈值,则表示待校验样本数据为可疑数据,再通过进一步确认其安全性,来确定其是否需要上链。
S620、若(∑n m=1Wm)/n≤H0,则将待校验样本数据确定为正样本数据,并将待校验样本数据存储至与目标数据节点连接的目标数据库中;
若所有数据校验值的平均值小于等于预设校验正常阈值,则表示第一数据节点对待校验样本数据的验证结果为待校验样本数据为正常数据,即正样本数据,不上链,并将其存储至目标数据库中。
S611、若W1,W2,...,Wm,...,Wn中存在小于等于H0或大于等于W0的数据校验值,则对W1,W2,...,Wm,...,Wn进行方差处理,得到数据校验方差X;
若所有第一数据节点的数据校验值中存在表示待校验样本数据为正常数据或异常数据的数据校验结果,则表示若干个第一数据节点的数据校验结果不一致,存在分歧,则对所有数据校验值做方差处理,得到对应的方差,通过方差来判断待校验样本数据是否上链。
若所有数据校验值都表示待校验样本数据为可疑数据,则说明所有第一数据节点对待校验样本数据的验证结果是一致的,待校验样本数据为可疑数据,不上链。
S612、若X≥X0,则将待校验样本数据进行上链;否则,将待校验样本数据存储至与目标数据节点连接的目标数据库中;其中,X0为预设方差阈值。
若得到的方差大于等于预设方差阈值,则表示第一数据节点对待校验样本数据的验证结果的分歧较大,待校验样本数据具有参考价值,则将其上链,反之,若得到的方差小于预设方差阈值,则表示第一数据节点对待校验样本数据的验证结果的分歧较小,其不具有参考价值,则不上链,将其存储至目标数据库中,便于后续对其进行分析。
其中,目标数据节点用于执行以下方法:
S010、实时获取目标数据接收端口接收的目标设备主机发送的待校验样本数据的数据流量包;
S011、从待校验样本数据的数据流量包中提取对应的流量特征;
S012、根据目标编码策略,对待校验样本数据的流量特征进行自验证处理,得到自验证结果;
S013、若自验证结果为待校验样本数据为异常数据,则将待校验样本数据的流量特征发送至区块链平台;
S0131、若自验证结果为待校验样本数据为可疑数据,则将待校验样本数据确定为待校验可疑数据,并将待校验可疑数据的流量特征发送至区块链平台。
对待校验样本数据进行自验证处理,自验证处理根据目标数据节点的目标编码策略对待校验样本数据的流量特征进行分析而确定处理结果,目标编码策略为目标数据节点的编码方法,即数据验证方法,自验证处理为目标数据节点对其要上传至区块链平台的待校验样本数据进行的验证处理方法,根据目标编码策略对待校验样本数据的流量特征进行分析处理,得到自验证结果,对待校验样本数据的流量特征的分析处理的方法由目标编码策略而定,自验证结果分为异常数据、正常数据和可疑数据,异常数据即表示待校验样本数据为异常数据,待校验样本数据为负样本数据,正常数据表示待校验样本数据为正常数据,待校验样本数据为正样本数据,可疑数据表示待校验样本数据为可疑数据,其界定在正常数据和异常数据之间。
若自验证结果为待校验样本数据为异常数据,则表示待校验样本数据为负样本数据,即可以上传至区块链平台的数据,为了确保待校验样本数据为异常数据的正确性,还需要所有第一数据节点的验证,所以,将自验证结果为异常数据的待校验样本数据的流量特征发送至区块链平台。
若自验证结果为待校验样本数据为正常数据,则表示待校验样本数据为正常数据,由于区块链平台要存储的是负样本数据,所以,当待校验样本数据为正常数据时,将待校验样本数据存储至目标数据库中,以便于后续对正常数据的分析。
其中,第m个第一数据节点用于执行以下方法:
S020、响应于接收到区块链平台发送的待校验样本数据对应的第一数据流量包、第二数据流量包、目标数据流量包;
S021、根据Qm,对待校验样本数据对应的第一数据流量包、第二数据流量包、目标数据流量包中的流量特征进行验证处理,得到对应的第一特征验证值Ym;
当目标数据节点的自验证结果为待校验样本数据为异常数据时,要对其进行进一步的数据验证,即通过目标数据节点对应的区块链平台连接的其他非目标数据节点的第一数据节点对待校验样本数据进行验证,由于每个第一数据节点的第一编码策略可能不同,所以就要获取每一第一数据节点的第一编码策略,第一编码策略为对应的第一数据节点的数据验证方法。
根据每一第一数据节点的第一编码策略,对待校验样本数据的流量特征进行验证处理,得到每一第一数据节点对待校验样本数据的第一特征验证值,第一特征验证值为对应的第一数据节点对待校验样本数据进行验证得到的数值,表示其对应的第一数据节点对待校验样本数据的验证结果,第一特征验证值越大,表示其对应的第一数据节点对待校验样本数据的验证结果为异常数据的可能性越大。
S022、将Ym发送至区块链平台。
区块链平台的执行方法还包括:
S014、当接收到待校验可疑数据的流量特征时,将待校验可疑数据的流量特征发送至每一第二数据节点;
若自验证结果为待校验样本数据为可疑数据,则表示待校验样本数据的数据安全性待定,要对其进行验证,来确定其是否为上链数据,故将其流量特征发送至每一第二数据节点,第二数据节点为历史校验准确率大于等于预设历史校验准确率阈值的第一数据节点,历史校验准确率表示对应的第一数据节点的历史校验准确的概率,历史校验准确率越大,越表示对应的第一数据节点的校验成功次数越多,越能说明对应的第一数据节点的校验成功率大,为了保证对可疑数据的验证结果的准确,就要通过第二数据节点对待校验样本数据进行验证,所以将待校验样本数据的流量特征发送至每一第二数据节点。
S015、接收每一第二数据节点发送的待校验可疑数据对应的第二特征验证值,得到第二特征验证值集K=(K1,K2,...,Ki,...,Kj);其中,Ki为第i个第二数据节点发送的待校验可疑数据对应的第二特征验证值;
第二特征验证值为第二数据节点根据其对应的第二编码策略对待校验可疑数据进行验证而得到的,第二编码策略为对应的第二数据节点的数据验证方法,由于每个第二数据节点的第二编码策略可能不同,且为了确保每个第二编码策略的数据保密,就要让每个第二数据节点根据各自的第二编码策略分别对待校验可疑数据进行验证。
每个第二数据节点根据对应的第二编码策略对待校验可疑数据的流量特征进行验证处理,得到每个第二数据节点对应的第二特征验证值,第二特征验证值表示对应的第二数据节点对待校验可疑数据的流量特征进行验证的异常值,第二特征验证值越大,表示对应的第二数据节点对待校验可疑数据验证为异常数据的可能性越大。
S016、将1/j确定为每一第二数据节点的置信度;
为了保证第二数据节点对待校验可疑数据的验证结果的准确性,且由于第二数据节点为校验准确率较大的数据节点,默认其之间校验正确的误差较小,所以,无需对其进行不同置信度的划分,故将每个第二数据节点的置信度确定为相同值,置信度即对应的第二数据节点的权重,通过权重,来影响每一第二数据节点在待校验可疑数据的最终验证结果中所占的比例。
S017、确定第i个第二数据节点的数据校验值Bi=Ki*(1/j);
在确定了第二数据节点的第二特征验证值和置信度后,根据第二特征验证值和置信度,确定对应的第二数据节点的数据校验值,数据校验值为对应的第二数据节点在结合了其置信度后得到的对待校验可疑数据的验证结果的数值。
S018、若(∑j i=1Bi)/j≥W0,则将待校验可疑数据确定为负样本数据,并将待校验可疑数据进行上链;
在确定出每个第二数据节点的数据校验值后,取所有第二数据节点的数据校验值的平均值作为待校验可疑数据的最终校验结果,将其与预设校验异常阈值进行判断,若其大于等于预设校验异常阈值,则表示第二数据节点作出的校验结果为待校验可疑数据为异常数据,即认为区块链平台连接的大部分背书节点都认为待校验可疑数据为负样本数据,可以将其上链。
S019、若(∑j i=1Bi)/j≤H0,则将待校验可疑数据确定为正样本数据,并将待校验可疑数据存储至与目标数据节点连接的目标数据库中。
若待校验可疑数据的最终校验值小于预设校验正常阈值,则表示第二数据节点作出的校验结果为待校验可疑数据为正常数据,未通过校验,不符合区块链平台的数据上链规则,不可将其上链,但由于其为正常数据,为了便于后续对正常数据的分析,所以将其存储至目标数据库中。
本发明根据目标数据节点的目标编码策略,对待校验样本数据进行自验证处理,若自验证结果为待校验样本数据为异常数据,则表示待校验样本数据为负样本数据,通过获取每一第一数据节点在进行数据验证时所需的数据流量包的数量,并将目标数据节点进行数据验证时所需的数据流量包的数量b与第一数据节点所需数据流量包的最大数量MAX(A)进行比对,若MAX(A)>b,则表示目标数据节点不是所需流量包数量最大的数据节点,存在比目标数据节点所需流量包数量多的第一数据节点,为了保证所有第一数据节点都能通过区块链平台发送的数据流量包来进行验证,就要使目标数据节点发送的数据流量包的数量达到第一数据节点所需流量包的最大数量,故以目标数据流量包为中间流量包,向前获取MAX(A)-b个数据流量包,向后获取MAX(A)-b个数据流量包,并将此2MAX(A)-b个数据流量包发送至每一第一数据节点,使每一第一数据节点根据接收到的数据流量包自行提取所需的流量特征,来进行待校验样本数据的验证,保证了每个第一数据节点都可以根据自己的验证策略来对待检验数据进行验证,提高了数据验证的准确率,每一第一数据节点根据对应的第一编码策略,对流量特征进行验证处理,得到每一第一数据节点对应的第一特征验证值,再根据每一第一数据节点的历史校验准确率确定对应的置信度,根据置信度和对应的第一特征验证值,确定每个第一数据节点的数据校验值,若所有数据校验值的平均值大于等于预设校验异常阈值,则表示待校验样本数据通过了数据验证,将其上链。本发明通过对接收到的待校验样本数据进行自验证,确定其为异常数据后,由每个第一数据节点根据其对应的第一编码策略对待校验样本数据进行验证,来确定待校验样本数据是否为负样本数据,根据每个第一数据节点的置信度确定数据校验值,最后确定待校验样本数据是否上链,与现有技术的训练模型进行数据上链相比,本发明无需训练样本数据,且不公开每个第一数据节点的第一编码策略,在保证每个数据节点的数据保密的同时,确保了数据的上链校验的安全。
本发明的实施例还提供了一种非瞬时性计算机可读存储介质,该存储介质可设置于电子设备之中以保存用于实现方法实施例中一种方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述实施例提供的方法。
本发明的实施例还提供了一种电子设备,包括处理器和前述的非瞬时性计算机可读存储介质。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。
Claims (10)
1.一种区块链负样本数据上链校验方法,其特征在于,应用于区块链平台,所述区块链平台连接有目标数据节点和n个第一数据节点,所述第一数据节点为与所述区块链平台连接的非目标数据节点的背书节点,所述目标数据节点连接有目标数据接收端口,所述目标数据接收端口用于接收目标设备主机发送的数据流量包,所述区块链平台用于存储负样本数据;
所述区块链负样本数据上链校验方法包括如下步骤:
S100、响应于接收到所述目标数据节点发送的待校验样本数据的流量特征,获取每一所述第一数据节点进行数据验证所需的数据流量包的数量,得到数据流量包所需数量集A=(A1,A2,...,Am,...,An);其中,m=1,2,...,n;Am为第m个所述第一数据节点进行数据验证所需的数据流量包的数量;
S200、获取所述目标数据节点对所述待校验样本数据进行验证所需的b个目标数据流量包,得到目标数据流量包集C=(C1,C2,...,Ca,...,Cb);其中,a=1,2,...,b;Ca为所述目标数据节点对所述待校验样本数据进行验证所需的第a个目标数据流量包;C1,C2,...,Ca,...,Cb为所述目标数据接收端口接收到的所述目标设备主机发送的连续的数据流量包;
S300、若MAX(A)>b,则获取所述目标设备主机发送的处于C1之前的MAX(A)-b个数据流量包以及处于Cb之后的MAX(A)-b个数据流量包,并将处于C1之前的MAX(A)-b个数据流量包确定为第一数据流量包,以及将处于Cb之后的MAX(A)-b个数据流量包确定为第二数据流量包;其中,MAX()为预设的最大值确定函数;
S400、将MAX(A)-b个所述第一数据流量包、MAX(A)-b个所述第二数据流量包、b个所述目标数据流量包发送至每一所述第一数据节点;
S500、确定每一所述第一数据节点发送的根据所述第一数据流量包、所述第二数据流量包和所述目标数据流量包得到的所述待校验样本数据对应的数据校验值,得到数据校验值集W=(W1,W2,...,Wm,...,Wn);其中,Wm为第m个所述第一数据节点发送的所述待校验样本数据对应的数据校验值;
S600、若(∑n m=1Wm)/n≥W0,则将所述待校验样本数据确定为负样本数据,并将所述待校验样本数据进行上链;其中,W0为预设校验异常阈值。
2.根据权利要求1所述的区块链负样本数据上链校验方法,其特征在于,所述步骤S500包括:
S510、接收每一所述第一数据节点发送的根据所述第一数据流量包、所述第二数据流量包和所述目标数据流量包得到的所述待校验样本数据对应的第一特征验证值,得到第一特征验证值集Y=(Y1,Y2,...,Ym,...,Yn);其中,Ym为第m个所述第一数据节点发送的所述待校验样本数据对应的第一特征验证值;
S520、根据每一所述第一数据节点的历史校验准确率,确定对应的所述第一数据节点的置信度,得到置信度集T=(T1,T2,...,Tm,...,Tn);其中,Tm为第m个所述第一数据节点的置信度;
S530、根据Ym和Tm,确定第m个所述第一数据节点发送的所述待校验样本数据对应的数据校验值Wm=Tm*Ym。
3.根据权利要求2所述的区块链负样本数据上链校验方法,其特征在于,所述步骤S520包括:
S521、获取每一所述第一数据节点的历史校验准确率,得到历史校验准确率集Z=(Z1,Z2,...,Zm,...,Zn);Zm=Zm1/Zm2;其中,Zm为第m个第一数据节点的历史校验准确率,Zm1为第m个第一数据节点的历史校验准确次数,Zm2为第m个第一数据节点的历史校验总次数;
S522、遍历Z,若Zm<Z0,则将0确定为第m个所述第一数据节点的置信度Tm;否则,将所述第一数据节点确定为第二数据节点,并执行步骤S523;其中,Z0为预设历史校验准确率阈值;
S523、对j个所述第二数据节点的历史校验准确率U1,U2,...,Ui,...,Uj进行归一化处理,得到第i个所述第二数据节点的置信度Ei;其中,i=1,2,...,j;j≤n;Ui为第i个所述第二数据节点的历史校验准确率;
S524、将Ei确定为对应的第一数据节点的置信度。
4.根据权利要求1所述的区块链负样本数据上链校验方法,其特征在于,所述步骤S300还包括:
S310、若MAX(A)≤b,则将b个所述目标数据流量包发送至每一所述第一数据节点;
S320、接收每一所述第一数据节点发送的根据所述目标数据流量包得到的所述待校验样本数据对应的数据校验值,得到数据校验值集W=(W1,W2,...,Wm,...,Wn);其中,Wm为第m个所述第一数据节点发送的所述待校验样本数据对应的数据校验值,并执行步骤S600。
5.根据权利要求1所述的区块链负样本数据上链校验方法,其特征在于,所述目标数据节点对应有目标编码策略;
所述目标数据节点用于执行以下方法:
S010、实时获取所述目标数据接收端口接收的目标设备主机发送的待校验样本数据的数据流量包;
S011、从所述待校验样本数据的数据流量包中提取对应的流量特征;
S012、根据所述目标编码策略,对所述待校验样本数据的流量特征进行自验证处理,得到自验证结果;
S013、若所述自验证结果为所述待校验样本数据为异常数据,则将所述待校验样本数据的流量特征发送至所述区块链平台。
6.根据权利要求2所述的区块链负样本数据上链校验方法,其特征在于,每一所述第一数据节点均对应有第一编码策略,n个所述第一数据节点对应的第一编码策略为Q1,Q2,...,Qm,...,Qn,其中,Qm为第m个所述第一数据节点对应的第一编码策略;
第m个所述第一数据节点用于执行以下方法:
S020、响应于接收到所述区块链平台发送的所述待校验样本数据对应的所述第一数据流量包、所述第二数据流量包、所述目标数据流量包;
S021、根据Qm,对所述待校验样本数据对应的所述第一数据流量包、所述第二数据流量包、所述目标数据流量包中的流量特征进行验证处理,得到对应的第一特征验证值Ym;
S022、将Ym发送至所述区块链平台。
7.根据权利要求1所述的区块链负样本数据上链校验方法,其特征在于,所述步骤S600还包括:
S610、若H0<(∑n m=1Wm)/n<W0,则将所述待校验样本数据确定为可疑数据,并执行步骤S611;其中,H0为预设校验正常阈值;
S611、若W1,W2,...,Wm,...,Wn中存在小于等于H0或大于等于W0的数据校验值,则对W1,W2,...,Wm,...,Wn进行方差处理,得到数据校验方差X;
S612、若X≥X0,则将所述待校验样本数据进行上链;否则,将所述待校验样本数据存储至与所述目标数据节点连接的目标数据库中;其中,X0为预设方差阈值。
8.根据权利要求7所述的区块链负样本数据上链校验方法,其特征在于,所述步骤S600还包括:
S620、若(∑n m=1Wm)/n≤H0,则将所述待校验样本数据确定为正样本数据,并将所述待校验样本数据存储至与所述目标数据节点连接的目标数据库中。
9.一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,其特征在于,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-8中任意一项的所述区块链负样本数据上链校验方法。
10.一种电子设备,其特征在于,包括处理器和权利要求9中所述的非瞬时性计算机可读存储介质。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310810174.3A CN116684192A (zh) | 2023-07-04 | 2023-07-04 | 一种区块链负样本数据上链校验方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310810174.3A CN116684192A (zh) | 2023-07-04 | 2023-07-04 | 一种区块链负样本数据上链校验方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116684192A true CN116684192A (zh) | 2023-09-01 |
Family
ID=87781024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310810174.3A Pending CN116684192A (zh) | 2023-07-04 | 2023-07-04 | 一种区块链负样本数据上链校验方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116684192A (zh) |
-
2023
- 2023-07-04 CN CN202310810174.3A patent/CN116684192A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111191767B (zh) | 一种基于向量化的恶意流量攻击类型的判断方法 | |
CN110166462B (zh) | 访问控制方法、系统、电子设备及计算机存储介质 | |
CN109740689B (zh) | 一种图像语义分割的错误标注数据筛选方法及系统 | |
JP6823501B2 (ja) | 異常検知装置、異常検知方法及びプログラム | |
CN112711757B (zh) | 一种基于大数据平台的数据安全集中管控方法及系统 | |
CN111131314A (zh) | 网络行为的检测方法、装置、计算机设备和存储介质 | |
JP2018148350A (ja) | 閾値決定装置、閾値決定方法及びプログラム | |
CN112738109A (zh) | 一种Web攻击的检测方法及装置 | |
CN111970229A (zh) | 一种针对多种攻击方式的can总线数据异常检测方法 | |
CN111586028B (zh) | 一种异常登录的评估方法、装置、服务器和存储介质 | |
CN111209564B (zh) | 一种云平台安全状态预测方法、装置、设备及存储介质 | |
CN114333317B (zh) | 一种交通事件的处理方法、装置、电子设备及存储介质 | |
CN116938683B (zh) | 一种基于网络安全异常检测的网络路径分析系统及方法 | |
CN116743637B (zh) | 一种异常流量的检测方法、装置、电子设备及存储介质 | |
CN116684192A (zh) | 一种区块链负样本数据上链校验方法、设备及介质 | |
CN112532645A (zh) | 一种物联网设备运行数据监测方法、系统及电子设备 | |
CN116866025A (zh) | 一种流量数据校验方法、电子设备及存储介质 | |
CN116684191A (zh) | 一种基于多节点的数据上链校验方法、电子设备及存储介质 | |
CN115622793A (zh) | 一种攻击类型识别方法、装置、电子设备及存储介质 | |
CN112232338B (zh) | 核保理赔过程的资料录入方法、装置、设备及存储介质 | |
CN116760615A (zh) | 一种数据上链校验方法、电子设备及存储介质 | |
CN114363082A (zh) | 网络攻击检测方法、装置、设备及计算机可读存储介质 | |
CN115001771B (zh) | 基于自动更新的验证码防御方法、系统、设备及存储介质 | |
CN113239075A (zh) | 一种施工数据自检方法及系统 | |
CN112801214B (zh) | 基于鼠类识别终端与云计算平台交互的老鼠数量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |