CN114969274B - 一种基于区块链预言机的数据处理系统 - Google Patents

一种基于区块链预言机的数据处理系统 Download PDF

Info

Publication number
CN114969274B
CN114969274B CN202210909405.1A CN202210909405A CN114969274B CN 114969274 B CN114969274 B CN 114969274B CN 202210909405 A CN202210909405 A CN 202210909405A CN 114969274 B CN114969274 B CN 114969274B
Authority
CN
China
Prior art keywords
data
semantic analysis
text
server
analysis server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210909405.1A
Other languages
English (en)
Other versions
CN114969274A (zh
Inventor
唐红武
伍彬
薄满辉
曲新奎
佟业新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Mobile Technology Co Ltd
Original Assignee
China Travelsky Mobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Mobile Technology Co Ltd filed Critical China Travelsky Mobile Technology Co Ltd
Priority to CN202210909405.1A priority Critical patent/CN114969274B/zh
Publication of CN114969274A publication Critical patent/CN114969274A/zh
Application granted granted Critical
Publication of CN114969274B publication Critical patent/CN114969274B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供一种基于区块链预言机的数据处理系统,包括:文本信息管理服务器、区块链平台、语义分析服务器;区块链平台包括区块链数据存储服务器、智能合约和预言机;文本信息管理服务器与智能合约通信连接,语义分析服务器与预言机通信连接;文本信息管理服务器连接有若干客户端,文本信息管理服务器能够响应于客户端的文本发布请求,生成对应的待处理数据并发送至区块链平台。本申请提供的数据处理系统,区块链平台能够通过智能合约和预言机,从语义分析服务器确定文本发布请求是否符合发布规则,以使文本信息管理服务器判断是否对文本发布请求对应的文本数据进行发布。同时,文本信息管理服务器能够通过区块链数据存储服务器中的数据进行追溯。

Description

一种基于区块链预言机的数据处理系统
技术领域
本申请涉及区块链数据处理领域,尤其涉及一种基于区块链预言机的数据处理系统。
背景技术
很多网站或APP都具有发表评论的功能。但由于现今网络使用用户的增加,经常会有用户发表不当言论。故而网站或APP的运营方,都会对待发布的评论内容进行分析,确定评论内容是否合规。但这些网站和APP大多只能进行实时审核,很难做到评论的追溯。
发明内容
有鉴于此,本申请提供一种基于区块链预言机的数据处理系统,至少部分解决现有技术中存在的问题。
根据本申请的一个方面,提供一种基于区块链预言机的数据处理系统,包括:文本信息管理服务器、区块链平台、语义分析服务器;所述区块链平台包括区块链数据存储服务器、智能合约和预言机;所述文本信息管理服务器与所述智能合约通信连接,所述语义分析服务器与所述预言机通信连接,所述智能合约和所述预言机均与所述区块链数据存储服务器通讯连接;所述文本信息管理服务器连接有若干客户端,所述文本信息管理服务器能够响应于所述客户端的文本发布请求,生成对应的待处理数据并发送至区块链平台;
所述区块链平台用于执行以下步骤:
S100,所述智能合约接收所述文本信息管理服务器上传的待处理数据A=(UserID,DataID,Data);其中,UserID为所述待处理数据对应的用户的标识信息,DataID为所述待处理数据对应的文本发布请求的标识信息,Data为所述待处理数据对应的文本发布请求中的文本数据;
S200,所述智能合约通过所述预言机,将Data发送至所述语义分析服务器;
S300,所述预言机根据所述语义分析服务器返回的语义分析结果,生成判断结果R,并将R发送至所述智能合约;所述判断结果R用于表示Data是否符合文本发布规则;
S400,根据待处理数据A和判断结果R,生成上链数据B=(UserID,DataID,R);
S500,将所述上链数据B存储至所述区块链数据存储服务器;
其中,所述文本信息管理服务器能够通过所述区块链平台访问所述区块链数据存储服务器。
本申请提供的一种基于区块链预言机的数据处理系统,文本信息管理服务器每收到一个文本发布请求后,都会生成对应的待处理数据并发送至区块链平台。区块链平台的智能合约会将待处理数据内的文本数据通过预言机发送至语义分析服务器。并根据语义分析服务器返回的语义分析结果,生成判断结果R。并最终只将UserID,DataID,R进行数据上链(即将上链数据B存储至区块链数据存储服务器)。如此,使得文本信息管理服务器能够根据UserID和DataID从区块链数据存储服务器获知文本发布请求对应的文本数据是否符合文本发布规则,并以此判断是否对文本数据进行发布。同时,智能合约仅将Data发送至语义分析服务器,使得语义分析服务器的运营方只能获取到文本数据的本身内容,并无法得知每一文本数据实际是由谁编辑的,故而能够保护发布文本的用户的隐私。进一步的,智能合约也仅将UserID,DataID,R进行数据上链,使得其他能够访问区块链数据存储服务器的设备(文本信息管理服务器以外的设备)也无法从区块链数据存储服务器获知每个用户都发表了什么内容,进一步提高了用户信息的隐私性。同时,由于上链数据B中包含了每一待处理数据A对应的UserID,DataID,R,故而,使得文本信息管理服务器能够通过区块链数据存储服务器内存储的数据进行文本发布的追溯。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本实施例提供的一种基于区块链预言机的数据处理系统中区块链平台执行的步骤的流程图。
具体实施方式
下面结合附图对本申请实施例进行详细描述。
需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合;并且,基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
根据本申请的一个方面,提供一种基于区块链预言机的数据处理系统,包括:文本信息管理服务器、区块链平台、语义分析服务器,语义分析服务器中配置有NLP算法和文本发布规则;所述区块链平台包括区块链数据存储服务器、智能合约和预言机;所述文本信息管理服务器与所述智能合约通信连接,所述语义分析服务器与所述预言机通信连接,所述智能合约和所述预言机均与所述区块链数据存储服务器通讯连接。
所述文本信息管理服务器连接有若干客户端,所述文本信息管理服务器能够响应于所述客户端的文本发布请求(例如评论发布请求),生成对应的待处理数据并发送至区块链平台。
所述区块链平台用于执行以下步骤:
S100,所述智能合约接收所述文本信息管理服务器上传的待处理数据A=(UserID,DataID,Data)。其中,UserID为所述待处理数据对应的用户的标识信息,DataID为所述待处理数据对应的文本发布请求的标识信息,Data为所述待处理数据对应的文本发布请求中的文本数据(如评论实际内容对应的文本数据)。
S200,所述智能合约通过所述预言机,将Data发送至所述语义分析服务器。具体的,智能合约对A进行拆解,将其中的Data提取出来并发送给预言机。预言机将Data发送至与其具有通讯连接关系的语义分析服务器。
S300,所述预言机根据所述语义分析服务器返回的语义分析结果,生成判断结果R,并将R发送至所述智能合约。所述判断结果R用于表示Data是否符合文本发布规则。
S400,根据待处理数据A和判断结果R,生成上链数据B=(UserID,DataID,R)。
S500,将所述上链数据B存储至所述区块链数据存储服务器。
其中,所述文本信息管理服务器能够通过所述区块链平台访问所述区块链数据存储服务器。以及所述文本信息管理服务器根据所述上链数据B确定是否对Data进行发布。具体的,当B中的R=1时,进行发布;R=0时,不进行发布。
本申请提供的一种基于区块链预言机的数据处理系统,文本信息管理服务器每收到一个文本发布请求后,都会生成对应的待处理数据并发送至区块链平台。区块链平台的智能合约会将待处理数据内的文本数据通过预言机发送至语义分析服务器。并根据语义分析服务器返回的语义分析结果,生成判断结果R。并最终只将UserID,DataID,R进行数据上链(即将上链数据B存储至区块链数据存储服务器)。如此,使得文本信息管理服务器能够根据UserID和DataID从区块链数据存储服务器获知文本发布请求对应的文本数据是否符合文本发布规则,并以此判断是否对文本数据进行发布。同时,智能合约仅将Data发送至语义分析服务器,使得语义分析服务器的运营方只能获取到文本数据的本身内容,并无法得知每一文本数据实际是由谁编辑的,故而能够保护发布文本的用户的隐私。进一步的,智能合约也仅将UserID,DataID,R进行数据上链,使得其他能够访问区块链数据存储服务器的设备(文本信息管理服务器以外的设备)也无法从区块链数据存储服务器获知每个用户都发表了什么内容,进一步提高了用户信息的隐私性。同时,由于上链数据B中包含了每一待处理数据A对应的UserID,DataID,R,故而,使得文本信息管理服务器能够通过区块链数据存储服务器内存储的数据进行文本发布的追溯。
在本申请的一种示例性实施例中,所述语义分析服务器为多个,任意两个语义分析服务器间使用的语义分析算法不同。多个语义分析服务器可以由多个服务提供方进行提供。
每一所述语义分析服务器具有对应的当前置信度C1,C2,...,Cn,C1+C2+...+Cn=1。其中,Ci为第i个语义分析服务器对应的当前置信度,i=1,2,...,n,n为所述语义分析服务器的数量。所述语义分析结果用于表示Data是否符合文本发布规则,所述语义分析结果为0或1。若所述语义分析结果为0,则表示Data不符合文本发布规则;若所述语义分析结果为1,则表示Data符合文本发布规则。其中,文本发布规则可以由文本信息管理服务器进行设置,具体可以包括若存在违禁词语则不发布,或情感表达负面则不发布等。
所述步骤S200包括:
S210,所述智能合约通过所述预言机,将Data发送至每一所述语义分析服务器;
所述步骤S300包括:
S310,所述预言机接收每一所述语义分析服务器返回的语义分析结果P1,P2,...,Pn,Pi为第i个语义分析服务器返回的语义分析结果;
S320,获取K=∑n x=1Px*Cx;
S330,若K≥k1,则R=1;若K<k1,则R=0;k1为预设的第一判断阈值;R=0,则表示Data不符合文本发布规则;R=1,则表示Data符合文本发布规则;
S340,将R发送至所述智能合约。
由于每一语义分析服务器使用的语义分析算法存在不同,故而,它们对同一个文本数据得出的语义分析结果也可能会存在不同,本实施例为了在这种情况下依然能够保证文本信息管理服务器能够完成对是否发布Data的判断。通过每一语义分析服务器返回的语义分析结果以及每一语义分析服务器对应的当前置信度确定出K。使得K能够综合表示出Data符合文本发布规则的程度。并根据预设的第一判断阈值k1,确定出最终的判断结果R。具体的,经过大量的数据测试,当k1的取值范围为[0.6,0.9]时,判断结果R的准确率更高,优选的,k1=0.8。
在本申请的一种示例性实施例中,C1=C2=...=Cn。如此,K的值能够反应出每一所述语义分析服务器返回的语义分析结果P1,P2,...,Pn内,认为Data符合文本发布规则的语义分析服务器的占比。故而当k1为0.8时,则表示,只有当80%或以上的语义分析服务器判定Data符合文本发布规则时,才会将R设置为1。以此提高判断结果的准确性。
但在实际实施过程中,每一语义分析服务器所使用的的语义分析算法的性能和准确性是存在差异的。故而,仅通过认为Data符合文本发布规则的语义分析服务器的占比来决定判断结果的最终值会存在一定的风险。如认为Data符合文本发布规则的语义分析服务器所使用的语义分析算法都是对当前的Data的语义类型的处理能力较弱的算法的情况。同时,由于语义分析服务器的功能提供方可能会夸大自身语义分析服务器语义分析的能力,故而直接使用功能提供方提供的数据确定每一语义分析服务器的当前置信度也是存在风险的。
为解决上述问题,在本申请的一种示例性实施例中,每一所述语义分析服务器对应的当前置信度通过以下步骤获得:
S610,获取原始样本数据集GData=(GData1,GData2,...,GDatam),标记结果集GR=(GR1,GR2,...,GRm)。其中,GDataj为第j个原始样本数据,GRj为第j个原始样本数据的标记结果,若GRj=0,则表示GDataj不符合文本发布规则;GRj=1,则表示Data符合文本发布规则;j=1,2,...,m,m为原始样本数据的数量。原始样本数据可以是工作人员进行收集或模拟生成的数据。每一原始样本数据均有对应的标记结果。
S620,将GData发送至每一语义分析服务器。
S630,接收每一语义分析服务器返回的分析结果集GP1,GP2,...,GPn,GPi=(GPi1,GPi2,...,GPim)。其中,GPi为第i个语义分析服务器返回的分析结果集,GPij为第i个语义分析服务器对GDataj返回的样本语义分析结果。
S630,根据GR和每一语义分析服务器返回的分析结果集确定每一语义分析服务器对应的样本分析准确率L1,L2,...,Ln;Li=Li1/m。其中,Li为第i个语义分析服务器对应的样本分析准确率,Li1为GPi中样本语义分析结果与GR中对应的标记结果为相同的数量。
S640,根据L1,L2,...,Ln,确定C1,C2,...,Cn。具体的,可以通过公式Ci=Li/∑n x= 1Lx,确定出C1,C2,...,Cn。
本实施例中,通过让每一语义分析服务器对同样的原始样本数据集进行语义分析,并通过每一语义分析服务器返回的分析结果集和标记结果集,能够确定出每一语义分析服务器对应的样本分析准确率。然后根据每一语义分析服务器对应的样本分析准确率确定出相应的当前置信度,如此,可以合理的得到每一语义分析服务器对应的当前置信度。
在本申请的一种示例性实施例中,所述区块链平台还用于执行以下步骤:
S710,从区块链数据存储服务器内获取时间窗口内的历史上链数据,得到历史上链数据集E=(E1,E2,...,Ep),其中,时间窗口内第q个历史上链数据Eq=(EUserIDq,EDataIDq,ERq),EUserIDq为Eq对应的用户的标识信息,EDataIDq为Eq对应的文本发布请求的标识信息,ERq为Eq对应的文本发布请求对应的历史判断结果;q=1,2,...,p;p为时间窗口内的历史上链数据的个数;。
由于原始样本数据是工作人员进行收集或模拟生成的数据。但工作人员数量和工作精力,会导致原始样本数据中的数据可能会存在错误或片面的情况。为了避免这一情况,本实施例中,每到达设定时间点(例如每月1号的12点),会从区块链数据存储服务器内获取时间窗口内的历史上链数据,得到历史上链数据集E。其中,时间窗口的长度可以根据相邻两个设定时间点的时间间隔进行确定(如设定时间点为每月1号的12点,则相邻两个设定时间点的时间间隔为1个月,则时间窗口的结束时间可以为当前时间,长度可以为1个月)。
S720,对E中每一历史上链数据进行拆解,得到历史标识集F=(F1,F2,...,Fp),Fq=(EUserIDq,EDataIDq)和历史判断结果集U=(ER1,ER2,...,ERp);其中,Fq为Eq对应的历史标识。
S730,将F发送至每一语义分析服务器;以使所述语义分析服务器根据F从文本信息管理服务器获取每一历史上链数据对应的文本数据,并对每一文本数据进行语义分析,得到复验语义分析结果。
由于区块链数据存储服务器中不包含相关的文本数据,故而,仅能够将每一历史上链数据对应的文本发布请求和用户的标识信息发送至每一语义分析服务器。以使语义分析服务器能够根据文本发布请求和用户的标识信息获取每一历史上链数据对应的文本数据并进行语义分析。
S740,接收每一语义分析服务器返回的复验分析结果集Y1,Y2,...,Yn,Yi=(Yi1,Yi2,...,Yip);其中,Yi为第i个语义分析服务器对应的复验分析结果集,Yiq为第i个语义分析服务器对第q个历史上链数据对应的文本数据的复验语义分析结果。
S750,根据U和每一语义分析服务器返回的复验分析结果集确定每一语义分析服务器对应的复验分析准确率EL1,EL2,...,ELn;ELi=ELi1/p;其中,ELi为第i个语义分析服务器对应的复验分析准确率,ELi1为Yi中复验语义分析结果与U中对应的历史判断结果为相同的数量。
S760,根据EL1,EL2,...,ELn,确定每一语义分析服务器对应的第一置信度EC1,EC2,...ECn;其中,ECi=ELi/∑n x=1ELx。
S770,根据EC1,EC2,...,ECn、C1,C2,...Cn和预设的修改规则,得到每一语义分析服务器对应的第二置信度FC1,FC2,...,FCn;其中,所述预设的修改规则为若|Ci-ECi|>k2,则令FCi=ECi;否则,FCi=Ci;k2为预设的第二判断阈值。其中,k2=0.2/n。
S780,根据FC1,FC2,...,FCn和预设的数值转换规则更新C1,C2,...Cn;
其中,数值转换规则为:Ci=FCi/∑n x=1FCx。
本实施例中,通过|Ci-ECi|是否大于k2判断是否要改变Ci对应的具体值,使得在每一语义分析服务器的当前置信度变化小于k2时不会改变对应的Ci。如此能够减少数据处理量。同时,若语义分析服务器的第一置信度与当前置信度差距较小时,并不说明语义分析服务器的算法有了有效提升,而是有可能仅仅是因为历史上链数据对应文本数据中适合其处理的文本数据占比较大造成的,此时若直接根据这种第一置信度改变当前置信度是对其他的语义分析服务器的不公平。故而,本实施例中通过k2的设定,判断出明确的是由于算法优化导致的第一置信度上升或下降的语义分析服务器,并改变其对应的当前置信度。
同时,由于对第二置信度的确定过程中,有些是直接与对应的第一置信度相同,有些是与当前置信度相同,故而会导致FC1+FC2+...+FCn≠1的情况出现。若直接用第二置信度更新当前置信度,会使得整个系统的最终判断产生错误。故而本实施例通过Ci=FCi/∑n x=1FCx对当前置信度进行更新,使得更新后的当前置信度的和保持为1,避免系统处理出现错误。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
根据本申请的这种实施方式的电子设备。电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:上述至少一个处理器、上述至少一个储存器、连接不同系统组件(包括储存器和处理器)的总线。
其中,所述储存器存储有程序代码,所述程序代码可以被所述处理器执行,使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
储存器可以包括易失性储存器形式的可读介质,例如随机存取储存器(RAM)和/或高速缓存储存器,还可以进一步包括只读储存器(ROM)。
储存器还可以包括具有一组(至少一个)程序模块的程序/实用工具,这样的程序模块包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线可以为表示几类总线结构中的一种或多种,包括储存器总线或者储存器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
电子设备也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口进行。并且,电子设备还可以通过网络适配器与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器通过总线与电子设备的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本申请的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本申请示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (7)

1.一种基于区块链预言机的数据处理系统,其特征在于,包括:文本信息管理服务器、区块链平台、语义分析服务器;所述区块链平台包括区块链数据存储服务器、智能合约和预言机;所述文本信息管理服务器与所述智能合约通信连接,所述语义分析服务器与所述预言机通信连接,所述智能合约和所述预言机均与所述区块链数据存储服务器通讯连接;所述文本信息管理服务器连接有若干客户端,所述文本信息管理服务器能够响应于所述客户端的文本发布请求,生成对应的待处理数据并发送至区块链平台;
所述区块链平台用于执行以下步骤:
S100,所述智能合约接收所述文本信息管理服务器上传的待处理数据A=(UserID,DataID,Data);其中,UserID为所述待处理数据对应的用户的标识信息,DataID为所述待处理数据对应的文本发布请求的标识信息,Data为所述待处理数据对应的文本发布请求中的文本数据;
S200,所述智能合约通过所述预言机,将Data发送至所述语义分析服务器;
S300,所述预言机根据所述语义分析服务器返回的语义分析结果,生成判断结果R,并将R发送至所述智能合约;所述判断结果R用于表示Data是否符合文本发布规则;
S400,根据待处理数据A和判断结果R,生成上链数据B=(UserID,DataID,R);
S500,将所述上链数据B存储至所述区块链数据存储服务器;
其中,所述文本信息管理服务器能够通过所述区块链平台访问所述区块链数据存储服务器;
所述语义分析服务器为多个,任意两个语义分析服务器间使用的语义分析算法不同;每一所述语义分析服务器具有对应的当前置信度C1,C2,...,Cn,C1+C2+...+Cn=1;其中,Ci为第i个语义分析服务器对应的当前置信度,i=1,2,...,n,n为所述语义分析服务器的数量;所述语义分析结果用于表示Data是否符合文本发布规则,所述语义分析结果为0或1;若所述语义分析结果为0,则表示Data不符合文本发布规则;若所述语义分析结果为1,则表示Data符合文本发布规则;
所述步骤S200包括:
S210,所述智能合约通过所述预言机,将Data发送至每一所述语义分析服务器;
所述步骤S300包括:
S310,所述预言机接收每一所述语义分析服务器返回的语义分析结果P1,P2,...,Pn,Pi为第i个语义分析服务器返回的语义分析结果;
S320,获取K=∑n x=1Px*Cx;
S330,若K≥k1,则R=1;若K<k1,则R=0;k1为预设的第一判断阈值;R=0,则表示Data不符合文本发布规则;R=1,则表示Data符合文本发布规则;
S340,将R发送至所述智能合约。
2.根据权利要求1所述的数据处理系统,其特征在于,每一所述语义分析服务器对应的当前置信度通过以下步骤获得:
S610,获取原始样本数据集GData=(GData1,GData2,...,GDatam),标记结果集GR=(GR1,GR2,..., GRm),其中,GDataj为第j个原始样本数据,GRj为第j个原始样本数据的标记结果,若GRj=0,则表示GDataj不符合文本发布规则;GRj=1,则表示Data符合文本发布规则;j=1,2,...,m,m为原始样本数据的数量;
S620,将GData发送至每一语义分析服务器;
S630,接收每一语义分析服务器返回的分析结果集GP1,GP2,...,GPn,GPi=(GPi1,GPi2,...,GPim);其中,GPi为第i个语义分析服务器返回的分析结果集,GPij为第i个语义分析服务器对GDataj返回的样本语义分析结果;
S630,根据GR和每一语义分析服务器返回的分析结果集确定每一语义分析服务器对应的样本分析准确率L1,L2,...,Ln;Li=Li1/m;其中,Li为第i个语义分析服务器对应的样本分析准确率,Li1为GPi中样本语义分析结果与GR中对应的标记结果为相同的数量;
S640,根据L1,L2,..., Ln,确定C1,C2,...,Cn;其中,Ci=Li/∑n x=1Lx。
3.根据权利要求2所述的数据处理系统,其特征在于,所述区块链平台还用于执行以下步骤:
S710,从区块链数据存储服务器内获取时间窗口内的历史上链数据,得到历史上链数据集E=(E1,E2,...,Ep),其中,时间窗口内第q个历史上链数据Eq=(EUserIDq,EDataIDq,ERq),EUserIDq为Eq对应的用户的标识信息,EDataIDq为Eq对应的文本发布请求的标识信息,ERq为Eq对应的文本发布请求对应的历史判断结果;q=1,2,...,p;p为时间窗口内的历史上链数据的个数;
S720,对E中每一历史上链数据进行拆解,得到历史标识集F=(F1,F2,...,Fp),Fq=(EUserIDq,EDataIDq)和历史判断结果集U=(ER1,ER2,...,ERp);其中,Fq为Eq对应的历史标识;
S730,将F发送至每一语义分析服务器以使所述语义分析服务器根据F从文本信息管理服务器获取每一历史上链数据对应的文本数据,并对每一文本数据进行语义分析,得到复验语义分析结果;
S740,接收每一语义分析服务器返回的复验分析结果集Y1,Y2,...,Yn,Yi=(Yi1,Yi2,...,Yip);其中,Yi为第i个语义分析服务器对应的复验分析结果集,Yiq为第i个语义分析服务器对第q个历史上链数据对应的文本数据的复验语义分析结果;
S750,根据U和每一语义分析服务器返回的复验分析结果集确定每一语义分析服务器对应的复验分析准确率EL1,EL2,...,ELn;ELi=ELi1/p;其中,ELi为第i个语义分析服务器对应的复验分析准确率,ELi1为Yi中复验语义分析结果与U中对应的历史判断结果为相同的数量;
S760,根据EL1,EL2,...,ELn,确定每一语义分析服务器对应的第一置信度EC1,EC2,...,ECn;其中,ECi=ELi/∑n x=1ELx;
S770,根据EC1,EC2,...,ECn、C1,C2,...,Cn和预设的修改规则,得到每一语义分析服务器对应的第二置信度FC1,FC2,...,FCn;其中,所述预设的修改规则为若|Ci-ECi|>k2,则令FCi=ECi;否则,FCi=Ci;k2为预设的第二判断阈值;
S780,根据FC1,FC2,...,FCn和预设的数值转换规则更新C1,C2,...,Cn;
其中,数值转换规则为:Ci=FCi/∑n x=1FCx。
4.根据权利要求1所述的数据处理系统,其特征在于,k1的取值范围为[0.6,0.9]。
5.根据权利要求4所述的数据处理系统,其特征在于,k1=0.8。
6.根据权利要求1所述的数据处理系统,其特征在于,C1=C2=...=Cn。
7.根据权利要求1所述的数据处理系统,其特征在于,所述文本信息管理服务器根据所述上链数据B确定是否对Data进行发布。
CN202210909405.1A 2022-07-29 2022-07-29 一种基于区块链预言机的数据处理系统 Active CN114969274B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210909405.1A CN114969274B (zh) 2022-07-29 2022-07-29 一种基于区块链预言机的数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210909405.1A CN114969274B (zh) 2022-07-29 2022-07-29 一种基于区块链预言机的数据处理系统

Publications (2)

Publication Number Publication Date
CN114969274A CN114969274A (zh) 2022-08-30
CN114969274B true CN114969274B (zh) 2022-10-25

Family

ID=82970429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210909405.1A Active CN114969274B (zh) 2022-07-29 2022-07-29 一种基于区块链预言机的数据处理系统

Country Status (1)

Country Link
CN (1) CN114969274B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116361271B (zh) * 2023-05-09 2024-01-23 中航信移动科技有限公司 一种区块链数据修改迁移方法、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401903B (zh) * 2020-06-03 2020-09-11 腾讯科技(深圳)有限公司 区块链消息处理方法、装置、计算机以及可读存储介质
CN111953648A (zh) * 2020-06-22 2020-11-17 北京欧链科技有限公司 基于区块链预言机的数据处理方法、装置及电子设备
CN114066655A (zh) * 2021-11-16 2022-02-18 工银科技有限公司 预言机数据的聚合方法及装置

Also Published As

Publication number Publication date
CN114969274A (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
WO2021057318A1 (zh) 一种业务进度监控方法、装置、系统及计算机可读存储介质
US20200241872A1 (en) Systems and Methods for Automating and Monitoring Software Development Operations
CN109461023B (zh) 流失用户挽回方法及装置、电子设备、存储介质
CN109522190B (zh) 异常用户行为识别方法及装置、电子设备、存储介质
CN110827157B (zh) 数据处理方法与装置、存储介质、电子设备
CN111950600B (zh) 一种预测逾期用户资源返还表现的方法、装置和电子设备
CN114969274B (zh) 一种基于区块链预言机的数据处理系统
CN111245642A (zh) 一种获取多系统之间的依赖关系的方法、装置和电子设备
CN115034596A (zh) 一种风险传导预测方法、装置、设备和介质
CN115936895A (zh) 基于人工智能的风险评估方法、装置、设备及存储介质
CN117931583B (zh) 一种设备集群运行状态预测方法、电子设备及存储介质
CN111681094B (zh) 一种监测资源策略异常的方法、装置和电子设备
CN111625587B (zh) 数据共享装置
CN111681032B (zh) 一种配置附加资源的方法、装置和电子设备
CN115065563B (zh) 一种基于区块链预言机的民航数据处理系统
CN111967806B (zh) 基于定期回扫的用户风险更新方法、装置和电子设备
CN114710390A (zh) 针对互联网系统的监控告警方法及系统、设备及介质
CN110209883B (zh) 一种用户历史数据有效性判断的方法及装置
CN112801688A (zh) 估值失败原因的定位方法和装置
CN117332160B (zh) 一种多目标标识的显示方法、存储介质及电子设备
CN116820539B (zh) 一种基于互联网的系统软件运行维护系统及方法
CN117726147B (zh) 一种基于适配度的服务器管理方法、电子设备及存储介质
CN113568600B (zh) 一种应用架构属性信息管理方法、装置和电子设备
CN113761431B (zh) 一种校验页面完整性的方法和装置
CN117034210B (zh) 一种事件画像的生成方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant