CN111597418B - 一种基于大数据的档案数据存储系统 - Google Patents

一种基于大数据的档案数据存储系统 Download PDF

Info

Publication number
CN111597418B
CN111597418B CN202010478176.3A CN202010478176A CN111597418B CN 111597418 B CN111597418 B CN 111597418B CN 202010478176 A CN202010478176 A CN 202010478176A CN 111597418 B CN111597418 B CN 111597418B
Authority
CN
China
Prior art keywords
data set
archive
target
file
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010478176.3A
Other languages
English (en)
Other versions
CN111597418A (zh
Inventor
张雷珍
胡振翰
任苗苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Guangsha College of Applied Construction Technology
Original Assignee
Zhejiang Guangsha College of Applied Construction Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Guangsha College of Applied Construction Technology filed Critical Zhejiang Guangsha College of Applied Construction Technology
Priority to CN202010478176.3A priority Critical patent/CN111597418B/zh
Publication of CN111597418A publication Critical patent/CN111597418A/zh
Application granted granted Critical
Publication of CN111597418B publication Critical patent/CN111597418B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Abstract

本发明涉及一种基于大数据的档案数据存储系统,包括档案数据存储控制装置和档案数据存储中心,档案数据存储控制装置包括身份验证模块、档案录入模块、档案分类模块、档案加密模块、档案存储模块、档案提取模块、档案解密模块、档案比较模块和档案输出模块,身份验证通过之后,对档案数据进行分类、加密并存储在对应的存储模块中,当进行档案提取时,根据待提取的档案数据集名称从对应的存储模块中得到加密档案数据集并进行加密,经过档案比较判断之后,若满足条件,则输出。该档案数据存储系统能够提升档案数据存储的安全性,并能够保证提取得到的档案数据集没有被破坏或者被篡改。

Description

一种基于大数据的档案数据存储系统
技术领域
本发明涉及一种基于大数据的档案数据存储系统。
背景技术
近年来,各行业信息化进程不断加快,各级各类档案部门的纸质档案数字化工作进度也不断加快,使得数字化档案的发展越来越迅速。在数字化档案发展过程中,档案数据的存储至关重要,现有的档案数据存储系统通常直接将档案数存储在光盘或者存储硬盘中,缺乏相关的存储管理策略,导致档案数据的存储安全性差,易出现档案数据被盗或者被篡改的情况。
发明内容
本发明的目的在于提供一种基于大数据的档案数据存储系统,用于解决现有的档案数据存储系统对档案数据的存储的安全性差的问题。
为了解决上述问题,本发明采用以下技术方案:
一种基于大数据的档案数据存储系统,包括:
档案数据存储控制装置;以及
档案数据存储中心;
所述档案数据存储控制装置包括身份验证模块、档案录入模块、档案分类模块、档案加密模块、档案存储模块、档案提取模块、档案解密模块、档案比较模块和档案输出模块;
所述身份验证模块用于对档案录入人员进行身份验证,当身份验证通过后,所述档案录入模块用于录入档案数据;
所述档案分类模块用于根据预设的分类机制对录入的档案数据进行分类,得到N个不同档案类别的档案数据集,各档案数据集包括至少一个档案数据;其中,N≥2;
所述档案加密模块对各档案数据集进行加密,得到各加密档案数据集;
所述档案数据存储中心包括N个存储模块,各存储模块包括主存储单元和备份存储单元;
所述档案存储模块内置有各加密档案数据集与各存储模块的对应关系,所述各加密档案数据集与各存储模块的对应关系包括加密档案数据集与主存储单元的对应关系以及加密档案数据集与备份存储单元的对应关系,其中,所述加密档案数据集与主存储单元的对应关系具体为:每一个加密档案数据集仅与一个存储模块中的主存储单元建立映射关系,且各加密档案数据集与各主存储单元一一对应;所述加密档案数据集与备份存储单元的对应关系具体为:每一个加密档案数据集与两个存储模块中的备份存储单元建立映射关系;
所述档案存储模块根据所述加密档案数据集与主存储单元的对应关系将各加密档案数据集存储在对应的主存储单元内,所述档案存储模块根据所述加密档案数据集与备份存储单元的对应关系将各加密档案数据集备份在对应的备份存储单元内;
所述档案提取模块内置有所述各加密档案数据集与各存储模块的对应关系;
所述档案提取模块接收档案提取指令,所述档案提取指令包括与待提取的档案数据集相对应的档案数据集名称,所述档案提取模块根据所述待提取的档案数据集相对应的档案数据集名称和所述各加密档案数据集与各存储模块的对应关系确定所述待提取的档案数据集对应的一个主存储单元以及两个备份存储单元,然后从对应的一个主存储单元得到第一目标加密档案数据集,从对应的两个备份存储单元中得到第二目标加密档案数据集和第三目标加密档案数据集;
所述档案解密模块分别对所述第一目标加密档案数据集、第二目标加密档案数据集和第三目标加密档案数据集进行解密,得到第一目标档案数据集、第二目标档案数据集和第三目标档案数据集;
所述档案比较模块比较所述第一目标档案数据集、第二目标档案数据集和第三目标档案数据集;
若所述第一目标档案数据集、第二目标档案数据集和第三目标档案数据集为相同的档案数据集,则所述档案输出模块输出所述第一目标档案数据集。
优选地,所述档案比较模块比较所述第一目标档案数据集、第二目标档案数据集和第三目标档案数据集,具体为:
所述第一目标档案数据集、第二目标档案数据集和第三目标档案数据集内的各档案数据均按照相同的排列规则进行排列;
所述档案比较模块比较所述第一目标档案数据集的特征参量、第二目标档案数据集的特征参量和第三目标档案数据集的特征参量,其中,特征参量包括对应目标档案数据集内的档案数据个数、各个档案数据的大小以及各档案数据的档案数据名称;
相应地,若所述第一目标档案数据集内的档案数据个数、第二目标档案数据集内的档案数据个数和第三目标档案数据集内的档案数据个数相同,且所述第一目标档案数据集内各个档案数据的大小、第二目标档案数据集内各个档案数据的大小和第三目标档案数据集内各个档案数据的大小均对应相同,且所述第一目标档案数据集内各档案数据的档案数据名称、第二目标档案数据集内各档案数据的档案数据名称和第三目标档案数据集内各档案数据的档案数据名称均对应相同,则判定所述第一目标档案数据集、第二目标档案数据集和第三目标档案数据集为相同的档案数据集。
优选地,所述身份验证模块具体用于:
接收档案录入人员的目标脸部图像信息;
将所述目标脸部图像信息与预设的脸部图像数据库中的各脸部图像信息进行比对,得到所述目标脸部图像信息与所述脸部图像数据库中的各脸部图像信息的相似度;其中,所述脸部图像数据库包括至少一个具有档案录入权限的人员的脸部图像信息;
比较各相似度与预设相似度阈值;
若某一个相似度大于或者等于所述预设相似度阈值,则判定身份验证通过;若所有的相似度均小于所述预设相似度阈值,则判定身份验证不通过;
当身份验证通过后,所述档案录入模块录入档案数据。
优选地,所述档案提取模块接收所述档案提取指令之前,获取提取人员的身份验证信息;将所述提取人员的身份验证信息输入到预设的身份信息数据库中,判断所述提取人员的身份验证信息是否是所述身份信息数据库中的某一个身份信息;
若所述提取人员的身份验证信息是所述身份信息数据库中的某一个身份信息,则接收所述档案提取指令。
本发明的技术效果包括:将录入的档案数据进行分类,得到至少两个档案数据集,并进行加密,得到加密档案数据集,加密能够提升档案数据存储的安全性;将加密档案数据集存储在对应的一个主存储单元中,并备份在对应的两个不同的备份存储单元中,也就是说,每一个加密档案数据集均存储在三个不同的存储位置,在进行后续档案数据提取时,根据提取指令从一个主存储单元和两个备份存储单元中得到三个目标加密档案数据集,解密后得到三个目标加密档案数据集,对这三个目标加密档案数据集进行比较,若这三个目标档案数据集是相同的档案数据集,表示待提取的档案数据集在存储过程中没有被破坏或者被篡改,则输出待提取的档案数据集。因此,本发明提供的基于大数据的档案数据存储系统通过相应的存储管理策略提升档案数据存储的安全性,并且,在提取时通过比较各目标档案数据集,从而确定待提取的档案数据集是否有效,保证提取得到的档案数据集没有被破坏或者被篡改。
附图说明
图1是基于大数据的档案数据存储系统的结构原理图。
具体实施方式
本实施例提供一种基于大数据的档案数据存储系统,该档案数据存储系统包括档案数据存储控制装置和档案数据存储中心。其中,档案数据存储控制装置可以是电脑设备、服务器设备或者智能终端等计算机设备;档案数据存储中心可以是存储系统,比如服务器中的存储系统。档案数据存储控制装置和档案数据存储中心可以是软件形式的,也可以是硬件形式的。
本实施例不对该档案数据存储系统的应用场景做限定,比如:该档案数据存储系统可以应用在学校中,用于管理所有学生的档案,那么,该档案数据存储系统中的档案数据存储控制装置可以为学校档案室中用于管理档案的计算机设备,档案数据存储中心可以是学校档案室中的服务器设备;也可以应用在大型企业中,用于管理该企业的所有职工的档案,那么,该档案数据存储系统中的档案数据存储控制装置可以为企业档案管理室中的用于管理档案的计算机设备,档案数据存储中心可以是该计算机设备所配套的存储系统,或者企业档案管理室中专门设置的服务器设备。
如图1所示,档案数据存储控制装置包括身份验证模块、档案录入模块、档案分类模块、档案加密模块、档案存储模块、档案提取模块、档案解密模块、档案比较模块和档案输出模块。
在档案数据录入之前,需要通过身份验证模块对档案录入人员进行身份验证,以保证档案录入人员具有录入权限,防止无关人员随意操作而导致档案数据被盗或者被篡改。
身份验证模块对档案录入人员进行身份验证,当身份验证通过后,档案录入模块录入档案数据。本实施例给出身份验证模块的一种具体身份验证过程,包括:
接收档案录入人员的目标脸部图像信息,相应地,档案数据存储控制装置就需要设置有摄像头等图像采集设备,通过图像采集设备采集档案录入人员的目标脸部图像信息。
身份验证模块预设有一个脸部图像数据库,该脸部图像数据库包括至少一个具有档案录入权限的人员的脸部图像信息,具体个数由实际需要进行设置。
将目标脸部图像信息与预设的脸部图像数据库中的各脸部图像信息进行比对,得到目标脸部图像信息与脸部图像数据库中的各脸部图像信息的相似度。
比较各相似度与预设相似度阈值,其中,预设相似度阈值由实际需要进行设置,比如:95%。
若存在某一个相似度大于或者等于预设相似度阈值,表示目标脸部图像信息与该相似度对应的脸部图像信息高度相似,则判定身份验证通过;若所有的相似度均小于预设相似度阈值,则判定身份验证不通过。
作为其他的实施方式,还可以通过采集档案录入人员的指纹信息进行身份验证,通过指纹信息进行身份验证的实现过程与上述中的通过脸部图像进行身份验证的实现过程同理,不再赘述。
当身份验证通过后,档案录入人员录入档案数据,档案录入模块接收到录入的档案数据。
档案分类模块根据预设的分类机制对录入的档案数据进行分类,得到N个不同档案类别的档案数据集,各档案数据集包括至少一个档案数据,其中,N≥2。
分类机制由具体的应用场景决定,比如:若应用在学校中,那么,分类机制可以按照年级的不同或者班级的不同对学生的档案数据进行分类,将相同年级或者相同班级的学生档案数据划分为一类;若应用在企业中,那么,分类机制可以按照企业部门的不同对职工档案数据进行分类,将相同部门的职工档案数据划分为一类。
经过分类之后,得到至少两个不同档案类别的档案数据集,各档案数据集包括至少一个档案数据,各档案数据集中的档案数据为同一类的档案数据。比如:若应用在学校中,比如大学,那么,按照年级的不同将档案数据分为四个不同的档案类别,分别是:大一年级学生的档案数据集、大二年级学生的档案数据集、大三年级学生的档案数据集和大四年级学生的档案数据集,各档案数据集包括至少一个档案数据,比如:大一年级学生的档案数据集包括的各档案数据均是大一年级学生的档案数据。若应用在企业中,那么,按照部门的不同将档案数据分为三个不同的档案类别,分别是:生产部门的职工的档案数据集、后勤部门的职工的档案数据集和管理部门的职工的档案数据集,各档案数据集包括至少一个档案数据,比如:生产部门的职工的档案数据集包括的各档案数据均是生产部门的职工的档案数据。另外,还可以将各档案数据集进行压缩,得到数据压缩包,便于后期的存储、加密和解密。
得到各档案数据集之后,档案加密模块对各档案数据集进行加密,得到加密档案数据集。其中,档案加密模块中的档案加密算法可以为现有技术中已公开的数据加密算法(比如对称加密算法或者非对称加密算法),由于对数据按照相应的数据加密算法进行加密,以得到加密数据,属于常规技术手段,不再赘述。对于任意一个档案数据集,由档案加密模块进行加密之后,得到加密档案数据集。
档案数据存储中心包括N个存储模块,即包括与档案数据集相同个数的存储模块,各存储模块包括主存储单元和备份存储单元。存储模块具有以下几种实现方式:(1)各存储模块为存储硬盘中的不同存储区域,那么,主存储单元和备份存储单元为存储区域中划分的两个子区域;(2)每一个存储模块均是独立的存储硬盘,不同的存储模块为不同的存储硬盘,那么,主存储单元和备份存储单元为存储硬盘中划分的两个存储区域;(3)每一个存储模块均是独立的存储设备,每一个存储设备包括两个存储硬盘,一个存储硬盘是主存储单元,另一个存储硬盘是备份存储单元。应当理解,不管存储模块是何种实现方式,均需要保证主存储单元和备份存储单元的容量充足,满足数据存储需要。
应当理解,档案数据存储控制装置与档案数据存储中心通信交互,可以有线通信交互,也可以无线通信交互。
档案存储模块内置有各加密档案数据集与各存储模块的对应关系,各加密档案数据集与各存储模块的对应关系包括加密档案数据集与主存储单元的对应关系以及加密档案数据集与备份存储单元的对应关系。
加密档案数据集与主存储单元的对应关系具体为:每一个加密档案数据集仅与一个存储模块中的主存储单元建立映射关系,且各加密档案数据集与各主存储单元一一对应。也就是说,一个加密档案数据集只对应一个存储模块中的主存储单元,且各加密档案数据集与各主存储单元一一对应,比如:第一个加密档案数据集只对应第一个存储模块中的主存储单元,也就只能存储在第一个存储模块中的主存储单元中;第二个加密档案数据集只对应第二个存储模块中的主存储单元,也就只能存储在第二个存储模块中的主存储单元中,以此类推。为了清楚表示加密档案数据集与存储模块中的主存储单元之间的对应关系,以A表示第一个加密档案数据集的加密档案数据集名称,B表示第二个加密档案数据集的加密档案数据集名称,C表示第三个加密档案数据集的加密档案数据集名称,将各存储模块进行编号,比如以阿拉伯数字1、2、3等等进行表示,再以a和b分别表示主存储单元和备份存储单元,那么,表1给出加密档案数据集与主存储单元的对应关系的一种具体实施方式。
表1
加密档案数据集名称 主存储单元编号
A 1-a
B 2-a
C 3-a
表1中,主存储单元编号1-a表示第一个存储模块的主存储单元,主存储单元编号2-a表示第二个存储模块的主存储单元,主存储单元编号3-a表示第三个存储模块的主存储单元。因此,第一个加密档案数据集与第一个存储模块的主存储单元相对应,第二个加密档案数据集与第二个存储模块的主存储单元相对应,第三个加密档案数据集与第三个存储模块的主存储单元相对应。
应当理解,各加密档案数据集所对应的主存储单元不做限定,由实际需要进行设置,但是不管怎样设置,均需要满足:各加密档案数据集与各主存储单元一一对应,即不同的加密档案数据集对应不同存储模块中的主存储单元。
加密档案数据集与备份存储单元的对应关系具体为:每一个加密档案数据集与两个存储模块中的备份存储单元建立映射关系。也就是说,一个加密档案数据集对应两个存储模块中的备份存储单元,比如:第一个加密档案数据集对应第一个存储模块中的备份存储单元和第二个存储模块中的备份存储单元,或者对应第二个存储模块中的备份存储单元和第三个存储模块中的备份存储单元,相应地,第一个加密档案数据集备份在第一个存储模块中的备份存储单元和第二个存储模块中的备份存储单元中,或者备份在第二个存储模块中的备份存储单元和第三个存储模块中的备份存储单元中;第二个加密档案数据集对应第一个存储模块中的备份存储单元和第三个存储模块中的备份存储单元,或者对应第二个存储模块中的备份存储单元和第三个存储模块中的备份存储单元,相应地,第二个加密档案数据集备份在第一个存储模块中的备份存储单元和第三个存储模块中的备份存储单元中,或者备份在第二个存储模块中的备份存储单元和第三个存储模块中的备份存储单元中,以此类推。应当理解,对于任意一个加密档案数据集,其对应的其中一个备份存储单元可以与其对应的主存储单元同属于一个存储模块,或者,其对应的两个备份存储单元与其对应的主存储单元均不属于同一个存储模块。
因此,一个加密档案数据集对应两个不同的存储模块中的备份存储单元,并且,这两个不同的存储模块不做具体限定,由实际需要进行设置。为了清楚表示加密档案数据集与存储模块中的备份存储单元之间的对应关系,与上文主存储单元同理,以A表示第一个加密档案数据集的加密档案数据集名称,B表示第二个加密档案数据集的加密档案数据集名称,C表示第三个加密档案数据集的加密档案数据集名称,将各存储模块进行编号,比如以阿拉伯数字1、2、3等等进行表示,再以a和b分别表示主存储单元和备份存储单元,那么,表2给出加密档案数据集与备份存储单元的对应关系的一种具体实施方式。
表2
Figure BDA0002516485350000101
表2中,备份存储单元编号1-b表示第一个存储模块的备份存储单元,备份存储单元编号2-b表示第二个存储模块的备份存储单元,备份存储单元编号3-b表示第三个存储模块的备份存储单元。因此,第一个加密档案数据集与第一个存储模块中的备份存储单元和第二个存储模块中的备份存储单元相对应;第二个加密档案数据集与第一个存储模块中的备份存储单元和第三个存储模块中的备份存储单元相对应;第三个加密档案数据集与第二个存储模块中的备份存储单元和第三个存储模块中的备份存储单元相对应。
档案存储模块根据上述中的加密档案数据集与主存储单元的对应关系将各加密档案数据集存储在对应的主存储单元内,以表1为例,第一个加密档案数据集存储在第一个存储模块的主存储单元中,第二个加密档案数据集存储在第二个存储模块的主存储单元中,第三个加密档案数据集存储在第三个存储模块的主存储单元中。并且,档案存储模块根据上述中的加密档案数据集与备份存储单元的对应关系将各加密档案数据集存储在对应的备份存储单元内,以表2为例,第一个加密档案数据集备份在第一个存储模块中的备份存储单元和第二个存储模块中的备份存储单元中,第二个加密档案数据集备份在第一个存储模块中的备份存储单元和第三个存储模块中的备份存储单元中,第三个加密档案数据集存储在第二个存储模块中的备份存储单元和第三个存储模块中的备份存储单元中。
因此,对于任意一个加密档案数据集,存储在三个不同位置,即:存储在某一个存储模块中的主存储单元中,同时备份在某两个存储模块中的备份存储单元中。
当提取人员需要提取档案数据时,为了提升档案数据提取的安全性,档案提取模块先获取提取人员的身份验证信息,然后将提取人员的身份验证信息输入到预设的身份信息数据库中,判断提取人员的身份验证信息是否是身份信息数据库中的某一个身份信息,若提取人员的身份验证信息是身份信息数据库中的某一个身份信息,则档案提取模块接收提取人员的档案提取指令。其中,身份验证信息可以是指纹信息,那么,身份验证过程为:将提取人员的指纹信息输入到预设的指纹信息数据库中,该指纹信息数据库包括至少一个具有档案提取权限的人员的指纹信息,将提取人员的指纹信息与指纹信息数据库中的每一个指纹信息进行比对,得到各指纹相似度,然后比较各指纹相似度与预设指纹相似度阈值,若存在某一个指纹相似度大于或者等于预设指纹相似度阈值,则判定提取人员的指纹信息是指纹信息数据库中的某一个指纹信息;若所有的指纹相似度均小于预设指纹相似度阈值,则判定提取人员的指纹信息不是指纹信息数据库中的某一个指纹信息。若提取人员的指纹信息是指纹信息数据库中的某一个指纹信息,则身份验证通过,档案提取模块接收提取人员的档案提取指令。
档案提取指令由相应的信息输入设备输入,比如键盘。档案提取指令包括与待提取的档案数据集相对应的档案数据集名称,比如大一年级学生的档案数据集相对应的档案数据集名称“大一年级学生的档案数据集”。
为了便于档案的调取,档案提取模块也内置有各加密档案数据集与各存储模块的对应关系,该各加密档案数据集与各存储模块的对应关系在上文中已给出了详细描述,不再赘述。
档案提取模块根据待提取的档案数据集相对应的档案数据集名称和各加密档案数据集与各存储模块的对应关系确定待提取的档案数据集对应的一个主存储单元以及两个备份存储单元,比如:若待提取的档案数据集相对应的档案数据集名称为B,根据表1和表2,确定档案数据集名称为B对应的主存储单元编号为2-a,两个备份存储单元编号分别是1-b和3-b,即待提取的档案数据集存储在主存储单元2-a中,并备份在备份存储单元1-b和3-b中。
然后档案提取模块从确定得到的主存储单元得到加密档案数据集,该加密档案数据集为第一目标加密档案数据集,并从确定得到的两个备份存储单元中得到两个加密档案数据集,分别是第二目标加密档案数据集和第三目标加密档案数据集。
档案解密模块分别对得到的第一目标加密档案数据集、第二目标加密档案数据集和第三目标加密档案数据集进行解密,对应得到第一目标档案数据集、第二目标档案数据集和第三目标档案数据集,具体地:对第一目标加密档案数据集进行解密,得到第一目标档案数据集,对第二目标加密档案数据集进行解密,得到第二目标档案数据集,对第三目标加密档案数据集进行解密,得到第三目标档案数据集。其中,档案解密模块内置有档案解密算法,该档案解密算法与档案加密模块中的档案加密算法相对应,能够解密由档案加密模块加密得到的加密档案数据集。由于档案加密模块中的加密算法属于常规技术手段,相应地,档案解密模块中的解密算法也属于常规技术手段,不再赘述。
档案比较模块比较第一目标档案数据集、第二目标档案数据集和第三目标档案数据集,以确定第一目标档案数据集、第二目标档案数据集和第三目标档案数据集是否是相同的档案数据集。作为一个具体实施方式,以下给出一种具体的比较过程:
由于第一目标档案数据集、第二目标档案数据集和第三目标档案数据集中均包括至少一个档案数据,那么,将第一目标档案数据集、第二目标档案数据集和第三目标档案数据集内的各档案数据均按照相同的排列规则进行排列,作为一个具体实施方式:按照各档案数据的档案数据名称的第一个字拼音的首字母的先后顺序进行排列,那么,各档案数据名称的排列顺序就确定了,相应地,得到各个档案数据名称对应的档案数据的大小之后,各档案数据的大小也按照上述排列顺序进行排列。比如:以两个档案数据名称来举例说明,分别为“张三的档案数据”和“李四的档案数据”,由于“张三的档案数据”的第一个字拼音的首字母为Z,“李四的档案数据”的第一个字拼音的首字母为L,那么,这两个档案数据的排列顺序为“李四的档案数据”、“张三的档案数据”,即“张三的档案数据”排在“李四的档案数据”之后,而且,若“张三的档案数据”对应的档案数据的大小为100kb,“李四的档案数据”对应的档案数据的大小为95kb,则这两个档案数据的大小的排列顺序为95kb、100kb。
第一目标档案数据集、第二目标档案数据集和第三目标档案数据集内的各档案数据均按照相同的排列规则进行排列之后,档案比较模块比较第一目标档案数据集的特征参量、第二目标档案数据集的特征参量和第三目标档案数据集的特征参量,其中,特征参量包括对应目标档案数据集内的档案数据个数、各个档案数据的大小以及各档案数据的档案数据名称,即档案比较模块比较第一目标档案数据集内的档案数据个数、第二目标档案数据集内的档案数据个数和第三目标档案数据集内的档案数据个数是否相同,比较第一目标档案数据集内各个档案数据的大小、第二目标档案数据集内各个档案数据的大小和第三目标档案数据集内各个档案数据的大小是否对应相同,比较第一目标档案数据集内各档案数据的档案数据名称、第二目标档案数据集内各档案数据的档案数据名称和第三目标档案数据集内各档案数据的档案数据名称是否对应相同。
其中,比较第一目标档案数据集内各个档案数据的大小、第二目标档案数据集内各个档案数据的大小和第三目标档案数据集内各个档案数据的大小是否对应相同,具体地:比较第一目标档案数据集内第一个档案数据的大小、第二目标档案数据集内第一个档案数据的大小和第三目标档案数据集内第一个档案数据的大小是否相同,比较第一目标档案数据集内第二个档案数据的大小、第二目标档案数据集内第二个档案数据的大小和第三目标档案数据集内第二个档案数据的大小是否相同,比较第一目标档案数据集内第三个档案数据的大小、第二目标档案数据集内第三个档案数据的大小和第三目标档案数据集内第三个档案数据的大小是否相同,以此类推,直至比较第一目标档案数据集内最后一个档案数据的大小、第二目标档案数据集内最后一个档案数据的大小和第三目标档案数据集内最后一个档案数据的大小是否相同。
比较第一目标档案数据集内各档案数据的档案数据名称、第二目标档案数据集内各档案数据的档案数据名称和第三目标档案数据集内各档案数据的档案数据名称是否对应相同,具体地:比较第一目标档案数据集内第一个档案数据的档案数据名称、第二目标档案数据集内第一个档案数据的档案数据名称和第三目标档案数据集内第一个档案数据的档案数据名称是否相同,比较第一目标档案数据集内第二个档案数据的档案数据名称、第二目标档案数据集内第二个档案数据的档案数据名称和第三目标档案数据集内第二个档案数据的档案数据名称是否相同,比较第一目标档案数据集内第三个档案数据的档案数据名称、第二目标档案数据集内第三个档案数据的档案数据名称和第三目标档案数据集内第三个档案数据的档案数据名称是否相同,以此类推,直至比较第一目标档案数据集内最后一个档案数据的档案数据名称、第二目标档案数据集内最后一个档案数据的档案数据名称和第三目标档案数据集内最后一个档案数据的档案数据名称是否相同。
若第一目标档案数据集内的档案数据个数、第二目标档案数据集内的档案数据个数和第三目标档案数据集内的档案数据个数相同,且第一目标档案数据集内各个档案数据的大小、第二目标档案数据集内各个档案数据的大小和第三目标档案数据集内各个档案数据的大小均对应相同,且第一目标档案数据集内各档案数据的档案数据名称、第二目标档案数据集内各档案数据的档案数据名称和第三目标档案数据集内各档案数据的档案数据名称均对应相同,表示第一目标档案数据集、第二目标档案数据集和第三目标档案数据集的特征参量完全相同,则判定第一目标档案数据集、第二目标档案数据集和第三目标档案数据集为相同的档案数据集;否则,判定第一目标档案数据集、第二目标档案数据集和第三目标档案数据集不是相同的档案数据集。
比如:第一目标档案数据集、第二目标档案数据集和第三目标档案数据集内的各档案数据均按照各档案数据的档案数据名称的第一个字拼音的首字母的先后顺序进行排列,各档案数据的排列顺序均为“李四的档案数据”、“王五的档案数据”、“张三的档案数据”,若第一目标档案数据集中的这三个档案数据的大小依次为95kb、106kb、100kb,第二目标档案数据集中的这三个档案数据的大小依次为95kb、106kb、100kb,第三目标档案数据集中的这三个档案数据的大小依次为95kb、106kb、100kb,那么,由于第一目标档案数据集内的档案数据个数、第二目标档案数据集内的档案数据个数和第三目标档案数据集内的档案数据个数均为3,个数相同,且第一目标档案数据集内各个档案数据的大小、第二目标档案数据集内各个档案数据的大小和第三目标档案数据集内各个档案数据的大小均对应相同,且第一目标档案数据集内各档案数据的档案数据名称、第二目标档案数据集内各档案数据的档案数据名称和第三目标档案数据集内各档案数据的档案数据名称均对应相同,则判定第一目标档案数据集、第二目标档案数据集和第三目标档案数据集为相同的档案数据集。
再比如:第一目标档案数据集、第二目标档案数据集和第三目标档案数据集内的各档案数据均按照各档案数据的档案数据名称的第一个字拼音的首字母的先后顺序进行排列,各档案数据的排列顺序均为“李四的档案数据”、“王五的档案数据”、“张三的档案数据”,若第一目标档案数据集中的这三个档案数据的大小依次为95kb、80kb、100kb,第二目标档案数据集中的这三个档案数据的大小依次为95kb、106kb、100kb,第三目标档案数据集中的这三个档案数据的大小依次为95kb、106kb、100kb,那么,由于第一目标档案数据集内第二个档案数据的大小与第二目标档案数据集内第二个档案数据的大小和第三目标档案数据集内第二个档案数据的大小不同,表示第一目标档案数据集内第二个档案数据可能被破坏或者被篡改,则判定第一目标档案数据集、第二目标档案数据集和第三目标档案数据集不是相同的档案数据集。
再比如:第一目标档案数据集、第二目标档案数据集和第三目标档案数据集内的各档案数据均按照各档案数据的档案数据名称的第一个字拼音的首字母的先后顺序进行排列,第一目标档案数据集内的各档案数据的排列顺序为“李四的档案数据”、“杨一的档案数据”、“张三的档案数据”,第二目标档案数据集和第三目标档案数据集内的各档案数据的排列顺序均为“李四的档案数据”、“王五的档案数据”、“张三的档案数据”,第一目标档案数据集中的这三个档案数据的大小依次为95kb、106kb、100kb,第二目标档案数据集中的这三个档案数据的大小依次为95kb、106kb、100kb,第三目标档案数据集中的这三个档案数据的大小依次为95kb、106kb、100kb,由于第一目标档案数据集内第二个档案数据的档案数据名称与第二目标档案数据集内第二个档案数据的档案数据名称和第三目标档案数据集内第二个档案数据的档案数据名称不相同,表示第一目标档案数据集内第二个档案数据可能被破坏或者被篡改,则判定第一目标档案数据集、第二目标档案数据集和第三目标档案数据集不是相同的档案数据集。
若第一目标档案数据集、第二目标档案数据集和第三目标档案数据集为相同的档案数据集,则档案输出模块输出第一目标档案数据集。应当理解,档案输出模块向相关设备输出第一目标档案数据集,即待提取的档案数据集,比如输出到相关显示屏上,或者输出到外部设备,以供提取人员进行后续处理。
上述实施例仅以一种具体的实施方式说明本发明的技术方案,任何对本发明进行的等同替换及不脱离本发明精神和范围的修改或局部替换,其均应涵盖在本发明权利要求保护的范围之内。

Claims (3)

1.一种基于大数据的档案数据存储系统,其特征在于,包括:
档案数据存储控制装置;以及
档案数据存储中心;
所述档案数据存储控制装置包括身份验证模块、档案录入模块、档案分类模块、档案加密模块、档案存储模块、档案提取模块、档案解密模块、档案比较模块和档案输出模块;
所述身份验证模块用于对档案录入人员进行身份验证,当身份验证通过后,所述档案录入模块用于录入档案数据;
所述档案分类模块用于根据预设的分类机制对录入的档案数据进行分类,得到N个不同档案类别的档案数据集,各档案数据集包括至少一个档案数据;其中,N≥2;
所述档案加密模块对各档案数据集进行加密,得到各加密档案数据集;
所述档案数据存储中心包括N个存储模块,各存储模块包括主存储单元和备份存储单元;
所述档案存储模块内置有各加密档案数据集与各存储模块的对应关系,所述各加密档案数据集与各存储模块的对应关系包括加密档案数据集与主存储单元的对应关系以及加密档案数据集与备份存储单元的对应关系,其中,所述加密档案数据集与主存储单元的对应关系具体为:每一个加密档案数据集仅与一个存储模块中的主存储单元建立映射关系,且各加密档案数据集与各主存储单元一一对应;所述加密档案数据集与备份存储单元的对应关系具体为:每一个加密档案数据集与两个存储模块中的备份存储单元建立映射关系;每一个加密档案数据集均存储在三个不同的存储位置;
所述档案存储模块根据所述加密档案数据集与主存储单元的对应关系将各加密档案数据集存储在对应的主存储单元内,所述档案存储模块根据所述加密档案数据集与备份存储单元的对应关系将各加密档案数据集备份在对应的备份存储单元内;
所述档案提取模块内置有所述各加密档案数据集与各存储模块的对应关系;
所述档案提取模块接收档案提取指令,所述档案提取指令包括与待提取的档案数据集相对应的档案数据集名称,所述档案提取模块根据所述待提取的档案数据集相对应的档案数据集名称和所述各加密档案数据集与各存储模块的对应关系确定所述待提取的档案数据集对应的一个主存储单元以及两个备份存储单元,然后从对应的一个主存储单元得到第一目标加密档案数据集,从对应的两个备份存储单元中得到第二目标加密档案数据集和第三目标加密档案数据集;
所述档案解密模块分别对所述第一目标加密档案数据集、第二目标加密档案数据集和第三目标加密档案数据集进行解密,得到第一目标档案数据集、第二目标档案数据集和第三目标档案数据集;
所述档案比较模块比较所述第一目标档案数据集、第二目标档案数据集和第三目标档案数据集;
若所述第一目标档案数据集、第二目标档案数据集和第三目标档案数据集为相同的档案数据集,则所述档案输出模块输出所述第一目标档案数据集;
所述档案比较模块比较所述第一目标档案数据集、第二目标档案数据集和第三目标档案数据集,具体为:
所述第一目标档案数据集、第二目标档案数据集和第三目标档案数据集内的各档案数据均按照相同的排列规则进行排列;
所述档案比较模块比较所述第一目标档案数据集的特征参量、第二目标档案数据集的特征参量和第三目标档案数据集的特征参量,其中,特征参量包括对应目标档案数据集内的档案数据个数、各个档案数据的大小以及各档案数据的档案数据名称;
相应地,若所述第一目标档案数据集内的档案数据个数、第二目标档案数据集内的档案数据个数和第三目标档案数据集内的档案数据个数相同,且所述第一目标档案数据集内各个档案数据的大小、第二目标档案数据集内各个档案数据的大小和第三目标档案数据集内各个档案数据的大小均对应相同,且所述第一目标档案数据集内各档案数据的档案数据名称、第二目标档案数据集内各档案数据的档案数据名称和第三目标档案数据集内各档案数据的档案数据名称均对应相同,则判定所述第一目标档案数据集、第二目标档案数据集和第三目标档案数据集为相同的档案数据集。
2.根据权利要求1所述的基于大数据的档案数据存储系统,其特征在于,所述身份验证模块具体用于:
接收档案录入人员的目标脸部图像信息;
将所述目标脸部图像信息与预设的脸部图像数据库中的各脸部图像信息进行比对,得到所述目标脸部图像信息与所述脸部图像数据库中的各脸部图像信息的相似度;其中,所述脸部图像数据库包括至少一个具有档案录入权限的人员的脸部图像信息;
比较各相似度与预设相似度阈值;
若某一个相似度大于或者等于所述预设相似度阈值,则判定身份验证通过;若所有的相似度均小于所述预设相似度阈值,则判定身份验证不通过;
当身份验证通过后,所述档案录入模块录入档案数据。
3.根据权利要求1所述的基于大数据的档案数据存储系统,其特征在于,所述档案提取模块接收所述档案提取指令之前,获取提取人员的身份验证信息;将所述提取人员的身份验证信息输入到预设的身份信息数据库中,判断所述提取人员的身份验证信息是否是所述身份信息数据库中的某一个身份信息;
若所述提取人员的身份验证信息是所述身份信息数据库中的某一个身份信息,则接收所述档案提取指令。
CN202010478176.3A 2020-05-29 2020-05-29 一种基于大数据的档案数据存储系统 Active CN111597418B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010478176.3A CN111597418B (zh) 2020-05-29 2020-05-29 一种基于大数据的档案数据存储系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010478176.3A CN111597418B (zh) 2020-05-29 2020-05-29 一种基于大数据的档案数据存储系统

Publications (2)

Publication Number Publication Date
CN111597418A CN111597418A (zh) 2020-08-28
CN111597418B true CN111597418B (zh) 2022-04-19

Family

ID=72184294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010478176.3A Active CN111597418B (zh) 2020-05-29 2020-05-29 一种基于大数据的档案数据存储系统

Country Status (1)

Country Link
CN (1) CN111597418B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112784239B (zh) * 2021-01-22 2022-05-27 南京汇智互娱网络科技有限公司 一种基于人工智能的电子竞技运营信息管理系统
CN113486144A (zh) * 2021-05-28 2021-10-08 南方电网数字电网研究院有限公司 一种数字档案收录方法、系统、装置和存储介质
CN113401558A (zh) * 2021-07-23 2021-09-17 边有鑫 药剂送出系统和药剂送出装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491495A (zh) * 2018-03-19 2018-09-04 合肥泓泉档案信息科技有限公司 一种档案数字化管理系统
CN109255251A (zh) * 2018-10-31 2019-01-22 安徽中科智链信息科技有限公司 基于区块链技术的档案数据保护系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7472275B2 (en) * 2003-06-13 2008-12-30 Michael Arnouse System and method of electronic signature verification

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491495A (zh) * 2018-03-19 2018-09-04 合肥泓泉档案信息科技有限公司 一种档案数字化管理系统
CN109255251A (zh) * 2018-10-31 2019-01-22 安徽中科智链信息科技有限公司 基于区块链技术的档案数据保护系统及方法

Also Published As

Publication number Publication date
CN111597418A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN111597418B (zh) 一种基于大数据的档案数据存储系统
US10659218B2 (en) System and method for detecting anomalies in examinations
US7690032B1 (en) Method and system for confirming the identity of a user
US9589181B2 (en) Person search method and device for searching person staying on platform
CN105787324A (zh) 一种计算机信息安全系统
CN112069543B (zh) 一种基于大数据的档案智能分析管理系统
CN112084474A (zh) 一种企业档案管理方法、系统、存储介质和电子设备
CN114117513A (zh) 与特定受众共享数据
CN111611460A (zh) 一种基于区块链的档案管理方法
CN111597406A (zh) 一种基于大数据的档案管理系统
CN111611459B (zh) 一种基于区块链的档案数据保护方法
CN116680617A (zh) 基于使用权限等级的数据保密性检测方法及系统
EP2254093B1 (en) Method and system for confirming the identity of a user
CN211669640U (zh) 一种军队科技声像档案管理系统
Borse et al. Advantages of blockchain in digital forensic evidence management
CN113849566A (zh) 一种基于区块链的诉讼证据存证存储系统
CN111784511A (zh) 一种基于人工智能的银行业务管理系统
CN112863652A (zh) 一种医学影像数据存证系统
JPH05290149A (ja) 指紋照合認証方式及びその装置
Pocs Legally compatible design of future biometric systems for crime prevention
CN116756760B (zh) 一种可搜索的数据库加密系统及其方法
CN112800840B (zh) 一种人脸识别管理系统和方法
CN115375255A (zh) 一种工程造价数据中心管理系统及装置
AU2009227510B2 (en) Method and system for confirming the identity of a user
CN117725604A (zh) 基于人工智能的电网数据安全分级方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant