CN113761559A - 一种基于区块链的ai培训数据存储管理系统 - Google Patents

一种基于区块链的ai培训数据存储管理系统 Download PDF

Info

Publication number
CN113761559A
CN113761559A CN202111048022.1A CN202111048022A CN113761559A CN 113761559 A CN113761559 A CN 113761559A CN 202111048022 A CN202111048022 A CN 202111048022A CN 113761559 A CN113761559 A CN 113761559A
Authority
CN
China
Prior art keywords
data
module
training
information
subsystem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111048022.1A
Other languages
English (en)
Inventor
薛敏
喻飞
郑楠
胡彭
邢书
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hope Think Tank Nanjing Information Technology Co ltd
Original Assignee
Hope Think Tank Nanjing Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hope Think Tank Nanjing Information Technology Co ltd filed Critical Hope Think Tank Nanjing Information Technology Co ltd
Priority to CN202111048022.1A priority Critical patent/CN113761559A/zh
Publication of CN113761559A publication Critical patent/CN113761559A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/062Securing storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0652Erasing, e.g. deleting, data cleaning, moving of data to a wastebasket
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Human Computer Interaction (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Storage Device Security (AREA)

Abstract

本发明属于数据存储管理领域,具体公开了一种基于区块链的AI培训数据存储管理系统,包括信息录入子系统,用于提供培训数据的录入、调用以及提取、汇总、存储,并对外提供统一接口对接不同培训机构的内部培训档案系统;记录存储子系统,用于记录系统上的所有操作记录,包括但不限于信息录入、数据资料转让,以及数据汇总记录;数据转让子系统,用于将区块链账户下任一培训数据信息进行账户转移;权限管理子系统,用于添加、删除、修改和查询用户的权限范围以及系统的各项参数设置。本发明能保证信息存储的安全性与可靠性,系统采用智能化信息设备,降低人力成本投入,提高工作效率。

Description

一种基于区块链的AI培训数据存储管理系统
技术领域
本发明涉及数据存储管理领域,具体为一种基于区块链的AI培训数据存储管理系统。
背景技术
区块链技术,是比特币的底层技术,是一种去中心化的分布式账本技术,能安全存储数据,信息不可篡改、公开透明。区块链的交易确认由区块上的所有节点共识完成,共识成功后打包写入区块。区块链存储区块链网络上所有交易,任意节点都有一本完整的账本,从而保证信息不可篡改,实现信息共享、提高信息流通的效率。
智能合约,区块链上的智能合约是指由Solidity、LLL等语言编写和编译并运行与区块链上的一串二进制代码,通过智能合约可以实现在区块链上的数据存储、读写以及一些逻辑操作,目前大部分的区块链应用都是基于智能合约来运行的。智能合约使用的Solidity语言是图灵完备的,可以实现应用业务逻辑的所有操作。
随着社会就业竞争的加剧,求职者对自身的职业技能与专业素养的要求越来越高,催生了各类培训机构如雨后春笋般产生,诸如英语培训、计算机培训、金融从业资格培训等。目前针对培训数据的数据管理存在一定的难点,导致数据的存储、访问等存在问题。
发明内容
本发明的目的在于提供一种基于区块链的AI培训数据存储管理系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于区块链的AI培训数据存储管理系统,包括:
信息录入子系统,用于提供培训数据的录入、调用以及提取、汇总、存储,并对外提供统一接口对接不同培训机构的内部培训档案系统;
记录存储子系统,用于记录系统上的所有操作记录,包括但不限于信息录入、数据资料转让,以及数据汇总记录;记录存储子系统包括操作记录模块、操作异常检测模块,其中操作记录模块在每次操作会自动触发,记录内容包括操作者的区块链账户信息、操作参数和操作的时间戳;所述操作异常检测模块用于获取各个预设时间区间内用户对应的操作记录序列,各个操作记录序列中包括若干条按照操作时间顺序排列的操作记录数据,操作记录数据包括操作内容数据及操作时间数据;
数据转让子系统,用于将区块链账户下任一培训数据信息进行账户转移;
权限管理子系统,用于添加、删除、修改和查询用户的权限范围以及系统的各项参数设置。
优选的,信息录入子系统包括录入模块、数据提取模块、数据调用模块、数据汇总模块以及存储模块,其中录入模块提供培训数据录入的界面以及窗口,录入模块形式包括但不限于文字、图片以及语音;所述数据提取模块用于对录入的信息进行提取,包括对文字信息的语义校正、智能拼接提取;对图片信息进行OCR识别,并对识别的文本信息执行语义校正、文本判断、拼接处理;对语音进行特征提取以及段落提取,提取语音段落并分析翘舌音、平舌音、元音、鼻音特征点,及普通话、方言、外语语音特征点,以及唇腭裂语音的特征点,并进行发音数据分析处理。
优选的,数据调用模块通过统一接口对接不同培训机构的内部培训数据管理系统,并调用不同机构的培训数据管理系统,对培训相关的各项数据进行提取;所述数据汇总模块接收录入的信息数据以及调用的数据,并将其进行数据整理、汇总,由存储模块对其进行分类别、分层级、分标签进行存储。
优选的,操作异常检测模块根据各个用户操作记录数据中的操作时间信息,计算各所述操作记录序列中各相邻两个所述操作记录数据之间的操作时间间隔,根据计算得到的所有操作时间间隔,确定所述操作时间间隔对应的累计分布数据;以及根据所述累计分布数据及预先确定的分割规则,分别将各个所述操作记录序列分割成若干个操作记录数据组,并分别从各个所述操作记录数据组中提取出对应的若干个操作内容数据形成操作内容序列,通过对操作内容进行序列转换成对应的特征向量,并按照预设的分析规则对转换得到的特征向量进行分析,并将满足预设异常行为条件的特征向量标记为异常向量。
优选的,数据转让子系统具有公钥模块、哈希计算模块、目标数据产生模块,公钥模块用于在当前发生转让时,获取下一个节点的公钥,当前转让为当前节点将目标数据转让至所述下一个节点的转让,公钥模块还对目标数据进行加密,得到当前加密后的目标数据;所述哈希计算模块对加密后的目标数据进行哈希运算,得到哈希处理数据;所述目标数据产生模块用于在区块链产生当前区块,当前区块的区块体中写有所述当前哈希数据,目标数据产生模块利用私钥对加密后的目标数据进行解密,得到目标数据。
与现有技术相比,本发明的有益效果是:
本发明基于区块链去中心化、可追溯、不可篡改的特性构建数据管理系统,保证信息的安全性与可靠性,系统采用智能化信息设备,降低人力成本投入,提高工作效率。而且系统引入操作异常检测模块,对用户异常行为识别的灵敏度更高,保障所获取到的加密后数据确实为本次转让的数据,保障了所获取到的数据的真实性。
附图说明
图1为本发明的结构示意图;
图2为本发明的结构示意图。
图中:1、信息录入子系统;101、录入模块;102、数据提取模块;103、数据调用模块;104、数据汇总模块;105、存储模块;2、记录存储子系统;201、操作记录模块;202、操作异常检测模块;3、数据转让子系统;301、公钥模块;302、哈希计算模块;303、目标数据产生模块;4、权限管理子系统。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本发明提供一种技术方案:一种基于区块链的AI培训数据存储管理系统,包括:
信息录入子系统1,用于提供培训数据的录入、调用以及提取、汇总、存储,并对外提供统一接口对接不同培训机构的内部培训档案系统;信息录入子系统1包括录入模块101、数据提取模块102、数据调用模块103、数据汇总模块104以及存储模块105,其中录入模块101提供培训数据录入的界面以及窗口,录入模块101的录入形式包括但不限于文字、图片以及语音;所述数据提取模块102用于对录入的信息进行提取,包括对文字信息的语义校正、智能拼接提取;对图片信息进行OCR识别,并对识别的文本信息执行语义校正、文本判断、拼接处理;对语音进行特征提取以及段落提取,提取语音段落并分析翘舌音、平舌音、元音、鼻音特征点,及普通话、方言、外语语音特征点,以及唇腭裂语音的特征点,并进行发音数据分析处理;数据调用模块103通过统一接口对接不同培训机构的内部培训数据管理系统,并调用不同机构的培训数据管理系统,对培训相关的各项数据进行提取;所述数据汇总模块104接收录入的信息数据以及调用的数据,并将其进行数据整理、汇总,由存储模块105对其进行分类别、分层级、分标签进行存储;
记录存储子系统2,用于记录系统上的所有操作记录,包括但不限于信息录入、数据资料转让,以及数据汇总记录;
数据转让子系统3,用于将区块链账户下任一培训数据信息进行账户转移;
权限管理子系统4,用于添加、删除、修改和查询用户的权限范围以及系统的各项参数设置。
在本实施例中,记录存储子系统2包括操作记录模块201、操作异常检测模块202,其中操作记录模块201在每次操作会自动触发,记录内容包括操作者的区块链账户信息、操作参数和操作的时间戳;所述操作异常检测模块用于获取各个预设时间区间内用户对应的操作记录序列,各个操作记录序列中包括若干条按照操作时间顺序排列的操作记录数据,操作记录数据包括操作内容数据及操作时间数据。操作异常检测模块202根据各个用户操作记录数据中的操作时间信息,计算各所述操作记录序列中各相邻两个所述操作记录数据之间的操作时间间隔,根据计算得到的所有操作时间间隔,确定所述操作时间间隔对应的累计分布数据;以及根据所述累计分布数据及预先确定的分割规则,分别将各个所述操作记录序列分割成若干个操作记录数据组,并分别从各个所述操作记录数据组中提取出对应的若干个操作内容数据形成操作内容序列,通过对操作内容进行序列转换成对应的特征向量,并按照预设的分析规则对转换得到的特征向量进行分析,并将满足预设异常行为条件的特征向量标记为异常向量。
在本实施例中,数据转让子系统3具有公钥模块301、哈希计算模块302、目标数据产生模块303,公钥模块301用于在当前发生转让时,获取下一个节点的公钥,当前转让为当前节点将目标数据转让至所述下一个节点的转让,公钥模块301还对目标数据进行加密,得到当前加密后的目标数据;所述哈希计算模块302对加密后的目标数据进行哈希运算,得到哈希处理数据;所述目标数据产生模块303用于在区块链产生当前区块,当前区块的区块体中写有所述当前哈希数据,目标数据产生模块303利用私钥对加密后的目标数据进行解密,得到目标数据。
在本实施例中,本发明基于区块链去中心化、可追溯、不可篡改的特性构建数据管理系统,保证信息的安全性与可靠性,系统采用智能化信息设备,降低人力成本投入,提高工作效率。而且系统引入操作异常检测模块202,对用户异常行为识别的灵敏度更高,保障所获取到的加密后数据确实为本次转让的数据,保障了所获取到的数据的真实性。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种基于区块链的AI培训数据存储管理系统,其特征在于,包括:
信息录入子系统(1),用于提供培训数据的录入、调用以及提取、汇总、存储,并对外提供统一接口对接不同培训机构的内部培训档案系统;
记录存储子系统(2),用于记录系统上的所有操作记录,包括但不限于信息录入、数据资料转让,以及数据汇总记录;
数据转让子系统(3),用于将区块链账户下任一培训数据信息进行账户转移;
权限管理子系统(4),用于添加、删除、修改和查询用户的权限范围以及系统的各项参数设置。
2.根据权利要求1所述的一种基于区块链的AI培训数据存储管理系统,其特征在于,所述信息录入子系统(1)包括录入模块(101)、数据提取模块(102)、数据调用模块(103)、数据汇总模块(104)以及存储模块(105),其中录入模块(101)提供培训数据录入的界面以及窗口,录入模块(101)的录入形式包括但不限于文字、图片以及语音;所述数据提取模块(102)用于对录入的信息进行提取,包括对文字信息的语义校正、智能拼接提取;对图片信息进行OCR识别,并对识别的文本信息执行语义校正、文本判断、拼接处理;对语音进行特征提取以及段落提取,提取语音段落并分析翘舌音、平舌音、元音、鼻音特征点,及普通话、方言、外语语音特征点,以及唇腭裂语音的特征点,并进行发音数据分析处理。
3.根据权利要求2所述的一种基于区块链的AI培训数据存储管理系统,其特征在于,所述数据调用模块(103)通过统一接口对接不同培训机构的内部培训数据管理系统,并调用不同机构的培训数据管理系统,对培训相关的各项数据进行提取;所述数据汇总模块(104)接收录入的信息数据以及调用的数据,并将其进行数据整理、汇总,由存储模块(105)对其进行分类别、分层级、分标签进行存储。
4.根据权利要求1所述的一种基于区块链的AI培训数据存储管理系统,其特征在于,所述记录存储子系统(2)包括操作记录模块(201)、操作异常检测模块(202),其中操作记录模块(201)在每次操作会自动触发,记录内容包括操作者的区块链账户信息、操作参数和操作的时间戳;所述操作异常检测模块用于获取各个预设时间区间内用户对应的操作记录序列,各个操作记录序列中包括若干条按照操作时间顺序排列的操作记录数据,操作记录数据包括操作内容数据及操作时间数据。
5.根据权利要求4所述的一种基于区块链的AI培训数据存储管理系统,其特征在于,所述操作异常检测模块(202)根据各个用户操作记录数据中的操作时间信息,计算各所述操作记录序列中各相邻两个所述操作记录数据之间的操作时间间隔,根据计算得到的所有操作时间间隔,确定所述操作时间间隔对应的累计分布数据;以及根据所述累计分布数据及预先确定的分割规则,分别将各个所述操作记录序列分割成若干个操作记录数据组,并分别从各个所述操作记录数据组中提取出对应的若干个操作内容数据形成操作内容序列,通过对操作内容进行序列转换成对应的特征向量,并按照预设的分析规则对转换得到的特征向量进行分析,并将满足预设异常行为条件的特征向量标记为异常向量。
6.根据权利要求1所述的一种基于区块链的AI培训数据存储管理系统,其特征在于,所述数据转让子系统(3)具有公钥模块(301)、哈希计算模块(302)、目标数据产生模块(303),公钥模块(301)用于在当前发生转让时,获取下一个节点的公钥,当前转让为当前节点将目标数据转让至所述下一个节点的转让,公钥模块(301)还对目标数据进行加密,得到当前加密后的目标数据;所述哈希计算模块(302)对加密后的目标数据进行哈希运算,得到哈希处理数据;所述目标数据产生模块(303)用于在区块链产生当前区块,当前区块的区块体中写有所述当前哈希数据,目标数据产生模块(303)利用私钥对加密后的目标数据进行解密,得到目标数据。
CN202111048022.1A 2021-09-08 2021-09-08 一种基于区块链的ai培训数据存储管理系统 Pending CN113761559A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111048022.1A CN113761559A (zh) 2021-09-08 2021-09-08 一种基于区块链的ai培训数据存储管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111048022.1A CN113761559A (zh) 2021-09-08 2021-09-08 一种基于区块链的ai培训数据存储管理系统

Publications (1)

Publication Number Publication Date
CN113761559A true CN113761559A (zh) 2021-12-07

Family

ID=78793814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111048022.1A Pending CN113761559A (zh) 2021-09-08 2021-09-08 一种基于区块链的ai培训数据存储管理系统

Country Status (1)

Country Link
CN (1) CN113761559A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670950A (zh) * 2018-10-29 2019-04-23 平安科技(深圳)有限公司 基于区块链的交易监听方法、装置、设备和存储介质
CN109741162A (zh) * 2018-09-03 2019-05-10 上海奥若拉信息科技集团有限公司 基于区块链的个人征信数据存储、处理、分享方法及系统
CN111177273A (zh) * 2019-12-31 2020-05-19 杭州趣链科技有限公司 一种基于区块链的培训学费托管系统
CN111861425A (zh) * 2020-08-05 2020-10-30 交通银行股份有限公司 一种基于区块链的个人履历共享系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741162A (zh) * 2018-09-03 2019-05-10 上海奥若拉信息科技集团有限公司 基于区块链的个人征信数据存储、处理、分享方法及系统
CN109670950A (zh) * 2018-10-29 2019-04-23 平安科技(深圳)有限公司 基于区块链的交易监听方法、装置、设备和存储介质
CN111177273A (zh) * 2019-12-31 2020-05-19 杭州趣链科技有限公司 一种基于区块链的培训学费托管系统
CN111861425A (zh) * 2020-08-05 2020-10-30 交通银行股份有限公司 一种基于区块链的个人履历共享系统

Similar Documents

Publication Publication Date Title
CA3122638C (en) Methods, devices and systems for data augmentation to improve fraud detection
US9870351B2 (en) Annotating embedded tables
CN111859966A (zh) 一种面向网络威胁情报的标注语料生成方法及电子装置
CN103164515A (zh) 计算机系统涉密文件知识库搜索方法
CN115116082B (zh) 一种基于ocr识别算法的一键成档系统
CN109446299A (zh) 基于事件识别的搜索电子邮件内容的方法及系统
CN113139876A (zh) 风险模型训练方法、装置、计算机设备及可读存储介质
CN115934926A (zh) 信息提取方法、装置、计算机设备、存储介质
CN107169011A (zh) 基于人工智能的网页原创性识别方法、装置及存储介质
US20210319184A1 (en) Recognition of sensitive terms in textual content using a relationship graph of the entire code and artificial intelligence on a subset of the code
CN113761559A (zh) 一种基于区块链的ai培训数据存储管理系统
Kopev et al. Tweety at SemEval-2018 task 2: Predicting emojis using hierarchical attention neural networks and support vector machine
CN113448918B (zh) 一种企业科研成果管理方法及管理平台、设备、存储介质
CN114495138A (zh) 一种智能文档识别与特征提取方法、装置平台和存储介质
US20220270008A1 (en) Systems and methods for enhanced risk identification based on textual analysis
CN107392750A (zh) 一种企业财务数据存储管理方法
WO2023233467A1 (ja) 情報識別装置、情報識別方法、および、プログラム
US11681734B2 (en) Organizing fragments of meaningful text
KR102550868B1 (ko) 교원 업적 검증 시스템
CN110674254B (zh) 基于深度学习和统计提取模型的智能合同信息提取方法
KR101671300B1 (ko) 문서 유출 경위 분석 시스템
Jieying et al. Electronic Evidence Preservation and Traceability Method Based on Blockchain Smart Contract
CN117009319A (zh) 基于大语言模型的数据库操作方法、系统及存储介质
CN114330336A (zh) 一种基于左右信息熵和互信息的新词发现方法以及装置
Jin et al. WordErrorSim: An Adversarial Examples Generation Method in Chinese by Erroneous Knowledge

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination