CN115391089A - 基于ai要素读取的档案管理及风险检测处理方法、系统 - Google Patents

基于ai要素读取的档案管理及风险检测处理方法、系统 Download PDF

Info

Publication number
CN115391089A
CN115391089A CN202210666922.0A CN202210666922A CN115391089A CN 115391089 A CN115391089 A CN 115391089A CN 202210666922 A CN202210666922 A CN 202210666922A CN 115391089 A CN115391089 A CN 115391089A
Authority
CN
China
Prior art keywords
emergency backup
file
area
backup object
archive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210666922.0A
Other languages
English (en)
Other versions
CN115391089B (zh
Inventor
杨建福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Jingsheng Hangxing Technology Co ltd
Original Assignee
Hangzhou Jingsheng Hangxing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Jingsheng Hangxing Technology Co ltd filed Critical Hangzhou Jingsheng Hangxing Technology Co ltd
Priority to CN202210666922.0A priority Critical patent/CN115391089B/zh
Publication of CN115391089A publication Critical patent/CN115391089A/zh
Application granted granted Critical
Publication of CN115391089B publication Critical patent/CN115391089B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于AI要素读取的档案管理及风险检测处理方法、系统,通过对机房以特定方式作了空间划分,无权限人员进入机房后必然进入预先设置的探测范围区域和站位区内,监控范围无死角,在进入探测范围区域和站位区内后,平台开始自动匹配无权限人员可能意图破坏的第一紧急备份对象和第二紧急备份对象,然后取第一紧急备份对象和第二紧急备份对象的并集作为紧急备份对象,然后再根据每个紧急备份对象与无权限人员当前所处位置的距离由短到长为算力由大到小分配的依据,为每个紧急备份对象分配或更新相应的档案备份算力后开始或继续进行紧急备份,在算力有限时间紧迫的条件下,使得档案备份更有针对性,尽可能的挽回更多地档案数据。

Description

基于AI要素读取的档案管理及风险检测处理方法、系统
技术领域
本发明涉及档案管理风险检测、处理技术领域,具体涉及一种基于AI要素读取的档案管 理及风险检测处理方法、系统。
背景技术
用户档案通常被保存在服务器中,不同的用户通常具有专属的档案存储服务器,这些档 案存储服务器通常被档案存储服务商安装在同一个机房内。为了节省空间,数量众多的服务 器通常以如图1所示的矩阵形式排布安装在机房内,入口直行走廊的同一侧的服务器行、列 对齐,且行与行之间,列与列之间的间隔距离相同。图1中所示的排布安装在入口直行走廊 同侧的服务器为5行2列,仅作为一个示例,可根据机房大小等实际情况设置多行多列。图 1中所示的每个服务器为每个用户的专属服务器,为了便于区分,档案存储服务商通常在专 属服务器的机柜贴上专属标签,比如“杭州市拱墅区人社局专属服务器”。在需要对服务器进 行维护时,通过这些贴附的标签可以快速找到待维护的服务器。
在档案管理中,最大的风险是人为破坏,人为破坏直接的方式是到机房找对待破坏的服 务器进行物理破坏,物理破坏的服务器被修复的可能性相当于线上攻击的破坏方式更低。当 监测系统监测到存储于服务器中的档案数据有被损风险时的处置方式通常为,对存储在服务 器中的档案数据进行紧急备份。但对于这种人为到机房现场进行物理破坏的情形,如何快速 锁定闯入人员待破坏的服务器对象,以便于能够尽可能早的接入对待破坏对象的档案数据备 份,挽回尽可能多的档案数据成为档案管理安全监测技术领域的一道技术难题。
另外,通常情况下,与各服务器通信连接的紧急备份平台的算力是有限的,当判定疑似 待破坏对象的数量较大时,如果按照平均分配的方式分配算力,可能出现紧急备份平台对无 权限人员真实想破坏的服务器算力分配不足的问题,导致对可能真实想破坏的服务器的数据 备份速度过低,挽回数据量有限。
发明内容
本发明以提供了一种基于AI要素读取的档案管理及风险检测处理方法、系统,根据待备 份服务器与进入机房的无权限人员的距离表征档案被损风险的严重程度,并根据风险变换和 风险大小程度的变换,及时调整档案备份的算力,以在算力有限的情形下,尽最大可能更有 针对性地备份更多的档案数据,以降低损失。
为达此目的,本发明采用以下技术方案:
提供一种基于AI要素读取的档案管理及风险检测处理方法,步骤包括:
S1,安装在机房内的各服务器按照预设的档案挂接方法进行档案挂接;
S2,设置在机房入口处的监控识别到无权限人员闯入机房后,平台进入紧急备份待命状 态;
S3,沿入口直行走廊长度方向设置的探测设备探测到所述无权限人员进入其探测范围区 域内时,所述平台根据所进入的所述探测范围区域的编号与紧急备份对象的绑定关系匹配出 第一紧急备份对象;
S4,贴附在各所述第一紧急备份对象上的距离传感器探测所贴附的所述第一紧急备份对 象与所述无权限人员间的距离并生成距离信息发送给所述平台,所述平台以所述距离由短到 长表征存储在每个所述第一紧急备份对象中的档案被损风险由重到轻的程度,然后按照档案 被损风险的严重程度为每个所述第一紧急备份对象分配数据备份的算力;
S5,所述平台终止每个所述第一紧急备份对象当前进行的档案挂接进程,然后按照分配 的算力开始对存储于每个所述第一紧急备份对象中的档案进行紧急备份;
S6,判断所述无权限人员是否进入到与其初始进入的所述探测范围区域位于所述入口直 行走廊同侧的站位区内,
若是,则转入步骤S7;
若否,则保持步骤S4所分配的算力继续对每个所述第一紧急备份对象进行紧急备份,或 在所述无权限人员进入到位于所述入口直行走廊另一侧的对应所述探测范围区域后,返回步 骤S3,根据所述无权限人员此时进入的所述探测范围区域的编号与所述第一紧急备份对象的 绑定关系,重新匹配所述第一紧急备份对象;
S7,所述平台根据所述站位区与第二紧急备份对象的绑定关系,匹配出第二紧急备份对 象;
S8,取所述第一紧急备份对象和所述第二紧急备份对象的并集作为紧急备份对象;
S9,根据每个所述紧急备份对象和所述无权限人员当前所处的定位位置信息,计算每个 所述紧急备份对象与所述无权限人员当前所处位置的距离,并以距离由短到长表征存储在每 个所述紧急备份对象中的档案被损风险由重到轻的程度,然后按照档案被损风险由重到轻为 每个所述紧急备份对象更新由大到小的数据备份算力,
S10,所述平台终止每个所述紧急备份对象当前进行的档案挂接进程,然后按照更新的算 力对存储在每个所述紧急备份对象中的档案进行紧急备份。
作为优选,步骤S2中所述的所述探测设备为红外幕帘。
作为优选,步骤S4或S9中,为每个所述紧急备份对象分配或更新算力的方式通过以下 公式(1)表达:
Figure BDA0003691894880000031
公式(1)中,hi表示第i个所述紧急备份对象分得的算力;
Li表示贴附在第i个所述紧急备份对象上的所述距离传感器探测到的与所述无权限人员 间的距离;
n表示所述平台匹配出的所述紧急备份对象的数量;
H表示所述平台具有的备份数据的总算力。
作为优选,与所述探测范围区域邻接的第一服务器以及排布在所述第一服务器的前、后、 左或前、后、右侧的第二服务器为与所述探测范围区域的编号具有绑定关系的各所述第一紧 急备份对象。
作为优选,布设在所述入口直行走廊的每一侧呈行呈列排列的各服务器间的行距和列宽 均相同,且所述机房内的所有所述服务器呈行呈列排列且行距和列宽均相同,所述探测范围 区域的划设方法包括步骤:
A1,取所述入口直行走廊宽度的中间点,然后以所述中间点为起始点沿所述入口直行走 廊的长度方向画得一条中间线;
A2,沿按列排列在所述机房的左区域的靠近所述入口直行走廊的第一廊长的各所述服务 器的侧边画得一条与所述第一廊长平行且等长的第一侧边,并沿按列排列在所述机房的右区 域的靠近所述入口直行走廊的第二廊长的各所述服务器的侧边画得一条与所述第二廊长平行 且等长的第二侧边;
A3,沿在所述机房内呈行排列的背离所述机房入口的各所述服务器的长边画得若干条相 互间平行的平行线,所述中间线、所述第一侧边和若干条所述平行线围合得到位于所述机房 的所述左区域的若干个所述探测范围区域;所述中间线、所述第二侧边和若干条所述平行线 围合得到位于所述机房的所述右区域的若干个所述探测范围区域。
作为优选,柜门相对的两个服务器之间形成的相对位置区域形成为所述站位区,每个所 述站位区的地面贴附有唯一的站位区编号,安装在每个所述站位区上方的摄像头在所述无权 限人员落入监控的所述站位区后,自动识别站位区编号并上传给所述平台。
作为优选,步骤S1中所述的档案挂接方法步骤包括:
S11,所述服务器对获取到的每个档案文件夹的档号和文件夹名称分别按预设的档号编码 规则和文件夹命名规则,将每个所述档案文件夹的档号和文件夹名称分别分离为多级分类编 码区域和多级分类命名区域,关联每个档号的第a级分类编码区域记为
Figure BDA0003691894880000041
关联每个文件夹 名称的第b级分类命名区域记为
Figure BDA0003691894880000042
S12,对每个
Figure BDA0003691894880000043
和每个
Figure BDA0003691894880000044
按预设字体尺寸进行放大后,计算每个
Figure BDA0003691894880000045
和每个
Figure BDA0003691894880000046
的字母和 /或数字和/或中文汉字的悬空点距离长度和值,分别记为Va、Vb并存储;
S13,计算关联每个所述档案文件夹的档号和文件夹名称的悬空点距离长度和值,分别记 为VDH、VMC并存储;
S14,将每个所述档案文件夹的档号对应的VDH,以及文件夹名称对应的VMC映射到档案 目录数据库中元数据的对应所处位置处,并记录元数据位置与数据库中存储的所述档案文件 夹的对应关系;
S15,获取待进行档案挂接的档案文件的档案号和文件名称,过滤掉档案号和文件名称中 的特定个人信息后,按照预设的所述档号编码规则和所述文件夹命名规则,分别将所述档案 号和所述文件名称分离为多级分类编码区域和多级分类命名区域,然后计算关联所述档案文 件的所述档案号和所述文件名称分别对应的悬空点距离长度和值,分别记为V′DH、V′MC
S16,计算V′DH与存储在所述档案目录数据库中的所有所述档案文件夹的档号对应的VDH的相似度,记为SDH;并计算V′MC与存储在所述档案目录数据库中的所有所述档案文件夹的文 件夹名称对应的VMC的相似度,记为SMC
S17,根据SDH和SMC,计算关联所述档案文件的相似度S;
S18,提取大于预设的相似度阈值的每个所述相似度S所对应的所述档案文件夹的档号和 文件夹名称并展示给用户;
S19,所述用户选定欲挂接的所述档案文件夹后,基于所选定的所述档案文件夹在所述档 案目录数据库中的元数据位置与存储在所述数据库中的所述档案文件夹的对应关系,提取出 所述档案文件夹,然后将所述档案文件自动挂接到所提取的所述档案文件夹中。
作为优选,步骤S12中,Va通过以下方法步骤计算而得:
A1,以相同尺寸的矩形框框选住每个分类编码区域
Figure BDA0003691894880000047
中的每个字母和/或数字,框选住 的字母和/或或数字在所述矩形框内位置居中;
A2,遍历每个字母和/或数字在所述矩形框内的悬空点,记为
Figure BDA0003691894880000048
并定位到所在的第i个 所述矩形框的中心位点,记为
Figure BDA0003691894880000049
A3,计算每个所述矩形框内的每个悬空点
Figure BDA0003691894880000051
与其中心位点
Figure BDA0003691894880000052
的距离,记为
Figure BDA0003691894880000053
A4,通过以下公式(2)计算第a级分类编码区域中的每个所述矩形框的悬空点距离长度 和值
Figure BDA0003691894880000054
并存储:
Figure BDA0003691894880000055
A5,通过以下公式(3)计算Va并存储:
Figure BDA0003691894880000056
公式(2)-(3)中,r表示第a级分类编码区域中的第i个所述矩形框内的字母或数字的 第r个悬空点;
R表示第a级分类编码区域中的第i个所述矩形框内的字母或数字的悬空点
Figure BDA00036918948800000518
的数量;
n表示在第a级分类编码区域中框选字母或数字的所述矩形框的数量;
Vb通过以下方法步骤计算而得:
B1,以相同尺寸的矩形框框选住分类命名区域
Figure BDA0003691894880000057
中的每个字母和/或数字和/或中文汉 字,框选住的字母和/或数字/或中文汉字在所述矩形框内位置居中;
B2,以步骤A2-A4所述的方式计算出第b级分类命名区域中框选字母和/或数字的每个所 述矩形框的悬空点距离长度和值,记为
Figure BDA0003691894880000058
并存储,
Figure BDA0003691894880000059
表示第b级分类命名区域中的第j个用于 框选字母或数字的所述矩形框的悬空点距离长度和值,并提取每个中文汉字的部首后遍历每 个部首在所述矩形框内的悬空点,记为
Figure BDA00036918948800000510
并定位到所在的第k个所述矩形框的中心位点,记 为
Figure BDA00036918948800000511
B3,计算框选中文汉字的每个所述矩形框内的每个悬空点
Figure BDA00036918948800000512
与其中心位点
Figure BDA00036918948800000513
的距离,记 为
Figure BDA00036918948800000514
B4,通过以下公式(4)计算第b级分类编码区域中的每个框选中文汉字的所述矩形框的 悬空点距离长度和值
Figure BDA00036918948800000515
并存储:
Figure BDA00036918948800000516
公式(4)中,s表示第b级分类命名区域中的第k个所述矩形框内的中文汉字的部首的第s个 悬空点;
S表示第b级分类命名区域中的第k个所述矩形框内的中文汉字的部首的悬空点
Figure BDA00036918948800000517
的数 量;
B5,通过以下公式(5)计算Vb并存储:
Figure BDA0003691894880000061
公式(5)中,J表示第b级分类命名区域中框选字母和/或数字的所述矩形框的数量;
K示第b级分类命名区域中框选中文汉字的所述矩形框的数量。
作为优选,步骤S13中,通过以下公式(6)计算VDH、VMC
Figure BDA0003691894880000062
公式(6)中,A表示关联所述档案文件夹的档号中的分类编码区域的数量;
B表示关联所述档案文件夹的文件夹名称中的分类命名区域的数量;
步骤S16中,通过以下公式(7)计算相似度SDH、SMC
Figure BDA0003691894880000063
步骤S17中,通过以下公式(8)计算关联所述档案文件的所述相似度S:
S=w1×SDH+w2×SMC,w1+w2=1公式(8)
公式(8)中,w1、w2分别表示SDH、SMC在计算所述相似度S时所占的权重。
本发明还提供了一种基于AI要素的档案管理及风险检测处理系统,可实现所述的档案管 理及风险检测处理方法,所述系统包括:
档案挂接模块,用于提供给安装在机房内的各服务器按照预设的档案挂接方法进行档案 挂接;
监控模块,设置在所述机房的入口处,用于在监控识别到无权限人员闯入所述机房后生 成紧急备份待命指令发送给紧急备份平台;
所述紧急备份平台,通信连接所述监控模块和各所述服务器,用于在接收到所述紧急备 份待命指令后进入紧急备份状态,并在达到紧急备份条件时,按照分配给待进行档案紧急备 份的各所述服务器相对应的算力对存储在各所述服务器中的档案进行紧急备份;
若干个探测模块,通信连接所述紧急备份平台,每个所述探测模块沿所述机房的入口直 行走廊长度方向设置,每个所述探测模块具有对应的探测范围区域,用于探测所述无权限人 员是否进入其探测范围区域内,并在判定所述无权限人员进入其探测范围内时生成第一绑定 关系匹配信号发送给所述紧急备份平台,所述第一绑定关系匹配信号中包含所述探测模块的 所述探测范围区域的编号;
所述紧急备份平台根据接收到的所述第一绑定关系匹配信号中的所述探测范围区域的编 号与紧急备份对象的绑定关系匹配出第一紧急备份对象;
若干个传感模块,每个所述服务器的顶部位置贴附有至少一个所述传感模块,每个所述 传感模块通信连接所述紧急备份平台,所述传感模块用于探测所贴附的所述第一紧急备份对 象与所述无权限人员间的距离并生成距离信息发送给所述紧急备份平台;
所述紧急备份平台以所述距离由短到长表征存储在每个所述第一紧急备份对象中的档案 被损风险由重到轻的程度,然后按照档案被损风险的严重程度为每个所述第一紧急备份对象 分配数据备份的算力并生成第一档案挂接终止指令发送给每个所述第一紧急备份对象,每个 所述第一紧急备份对象接收到所述第一档案挂接终止指令后终止当前进行的档案挂接进程, 然后所述紧急备份平台按照分配的算力开始对存储于每个所述第一紧急备份对象中的档案进 行紧急备份;
站位区人员进入判断模块,连接所述紧急备份平台,用于判断所述无权限人员是否进入 到与其初始进入的所述探测范围区域位于所述入口执行走廊同侧的站位区内,
若是,则生成第二绑定关系匹配信号并输出;
若否,则不生成所述第二绑定关系匹配信号;
所述紧急备份平台接收到所述第二绑定关系匹配信号后,根据预设的所述站位区与第二 紧急备份对象的绑定关系,匹配出第二紧急备份对象;
并集计算模块,连接所述紧急备份平台,用于取所述第一紧急备份对象和所述第二紧急 备份对象的并集作为紧急备份对象;
距离计算模块,连接所述并集计算模块和所述紧急备份平台,用于根据每个所述紧急备 份对象和所述无权限人员当前所处的定位位置信息,计算每个所述紧急备份对象与所述无权 限人员当前所处位置的距离;
所述紧急备份平台以所述距离计算模块计算的距离由短到长表征存储在每个所述紧急备 份对象中的档案被损风险由重到轻的程度,然后按照档案被损风险由重到轻为每个所述紧急 备份对象更新由大到小的数据备份算力并生成第二档案挂接终止指令发送给每个所述紧急备 份对象,每个所述紧急备份对象接收到所述第二档案挂接终止指令后终止当前进行的档案挂 接进程,然后所述紧急备份平台按照更新的算力对存储在每个所述紧急备份对象中的档案进 行紧急备份。
本发明具有以下有益效果:
1、提供的档案挂接方法,通过计算待挂接电子档案的档案号中的每个分类编码区域或计 算文件名称中的每个分类命名区域的悬空点距离长度和值,对档号间的相同位置处的分类编 码区域以及文件名称间的相同位置处的分类命名区域的差异进行了放大,并通过每个分类编 码区域和每个分类命名区域分别对应的悬空点距离长度和值,去计算每个档案号和每个文件 名称分别对应的悬空点距离长度和值,并以该和值与数据库中的每个档案文件夹的对应和值 作相似度计算,由于对每个区域的差异作了放大处理,相似度计算结果更加精准,能够更准 确地匹配出待挂接的电子档案对应的电子档案文件夹,提高了电子档案挂接效率,并提高电 子档案挂接准确度,减少了电子档案挂接工作量。
2、对机房以特定方式作了空间划分,无权限人员进入机房后必然进入预先设置的探测范 围区域内,探测范围区域无死角,在进入探测范围区域内后,平台开始自动匹配无权限人员 可能意图破坏的第一紧急备份对象,并根据无权限人员当前落入的探测范围区域的编号与紧 急备份对象的绑定关系快速匹配出第一紧急备份对象,然后根据每个第一紧急备份对象与无 权限人员当前所处位置的距离由短到长为算力分配由大到小的依据,为每个第一紧急备份对 象分配相应的档案备份算力后开始进行紧急备份,档案备份更有针对性。
3、在无权限人员寻找待破坏的服务器时,必然进入事先划设的站位区,并且当感应到无 权限人员落入到相应站位区后,平台根据站位区与第二紧急备份对象的绑定关系,快速匹配 出第二紧急备份对象,然后取第一紧急备份对象和第二紧急备份对象的并集作为紧急备份对 象,且根据每个紧急备份对象与无权限人员当前所处位置的具有由短到长为算力分配由大到 小的依据,为每个紧急备份对象分配或调整相应的档案备份算力后开始或继续进行紧急备份, 进一步提升了档案备份的针对性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附 图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域 普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是在机房中排布的档案存储服务器的布置方式示意图;
图2是本发明对图1所示的机房进行空间划分后的若干个探测范围区域和站位区的布设 图;
图3是本发明实施例提供的基于AI要素读取的档案管理及风险检测处理方法的实现步骤 图;
图4是本发明一实施例提供的基于档案智能化的档案挂接管理方法的实现步骤图;
图5是对字符“S”作悬空点距离长度计算的示意图;
图6是对字符“Y”作悬空点距离长度计算的示意图;
图7是对中文字符“杭”的部首进行悬空点距离长度计算的示意图;
图8是对中文字符“州”的部首进行悬空点距离长度计算的示意图;
图9是本发明一实施例提供的基于AI要素读取的的档案管理及风险检测处理系统的结构 示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利 的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表 实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理 解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中, 需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关 系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或 暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位 置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员 而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间 的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一 体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连, 可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言, 可以具体情况理解上述术语在本发明中的具体含义。
首先需要说明的是,本发明实施例提供的基于AI要素读取的档案管理及风险检测处理方 法的实现必须事先完成对机房空间的探测范围区域以及站位区的划定,否则对无权限人员意 图破坏的服务器对象的识别准确度会大打折扣,所以首先对本申请事先划分机房空间,得到 机房内若干个探测范围区域以及站位区区域的方式进行阐述:
请参照图2,首先确保布设在入口直行走廊100的每一侧呈行呈列排列的各服务器200 间的行距和列宽均相同,且机房内的所有服务器呈行呈列排列且行距和列宽也均相同,然后 开始对探测范围区域进行划设,划设方法包括:
步骤A1,取入口直行走廊宽度的中间点1,然后以该中间点1为起始点沿入口直行走廊 100的长度方向画得一条中间线300;
步骤A2,沿按列排列在机房的左区域10的靠近入口直行走廊100的第一廊长的各服务 器的侧边画得一条与第一廊长平行且等长的第一侧边400,并沿按列排列在机房的右区域20 的靠近入口直行走廊100的第二廊长102的各服务器的侧边画得一条与第二廊长平行且等长 的第二侧边500;
步骤A3,沿在机房内呈行排列的背离机房入口的各服务器的长边画得若干条相互间平行 的平行线600,中间线300、第一侧边400和若干条平行线600为何得到位于机房的左区域 10的若干个探测范围区域30;中间线300、第二侧边400和若干条平行线600为何得到位于 机房的右区域20的若干个探测范围区域40.
面对机房入口700处安装有一具有人脸识别功能的摄像头,无权限人员进入机房后,该 摄像头自动采集人脸图像并与有权限进入机房的人员进行人脸匹配,若匹配不成功,则判定 有无权限的人员闯入,生成紧急备份待命信号发安能给紧急备份平台,紧急备份平台接收到 该信号后进入紧急备份待命状态。
另外,如图2所示,本申请划定柜门相对的两个服务器之间形成的相对位置区域为站位 区,每个站位区的地面贴附有唯一的站位区编号,安装在每个站位区上方的摄像头在无权限 人员落入监控的站位区后,自动识别站位区编号并上传给平台,平台将根据该站位区编号与 第二紧急备份对象的绑定关系,快速匹配出第二紧急备份对象。
由图2可知,人员进入机房后,必然行经事先划设的至少1个探测范围区域。如果要对 服务器进行操作,又必然走出探测范围区域进入事先划设的某个站位区内,因此本申请利用 欲破坏服务器的无权限人员必然出入探测范围区域和站位区的因素,为每个探测范围区域绑 定了第一紧急备份对象,同时为每个站位区绑定了第二紧急备份对象,以便于无权限人员进 入某个探测范围区域或某个站位区时能够快速匹配出相应的紧急备份对象,在算力有限的情 形下,为这些匹配出的紧急备份对象有限进行档案自动备份,提升了档案紧急备份的针对性, 有利于在算力有限时尽可能多的对最具被破坏风险的紧急备份对象进行档案紧急备份。
紧急备份对象与探测范围区域以及与站位区的绑定关系是否合理直接关系到紧急备份的 针对性,这里的绑定实质是对无权限人员破坏哪个或哪些服务器的意图识别。为了方便辨识 每个服务器的所属方,通常会在服务器的机柜上贴附所属方信息,比如某个服务器的归属方 为杭州市拱墅区人社局,无权限人员同样也根据这些归属信息找寻希望破坏的服务器。无权 限人员在找寻待破坏的服务器时,会不断落入不同的站位区和不同的探测范围区域,一般而 言,落入某个站位区后再离开这个站位区前往其他站位区,表示在之前落入的该站位区附近 安装的服务器并非是意图破坏的服务器对象,此时应该释放算力将释放后的算力分配给具有 最大可能性被破坏的服务器。因此本申请要解决的两个核心技术问题是:1、怎么相对快速且 准确地识别出意图破坏的服务器对象。2、在无权限人员行走路径不断变换的情形下,如何更 有针对性的分配算力,以尽可能多且更有针对性的备份数据。
为了解决第一个问题,本申请提供的方式是对每个探测范围区域绑定对应的第一紧急备 份对象,对每个站位区绑定对应的第二紧急备份对象。对每个探测范围区域进行第一紧急备 份对象绑定的方式具体为:与探测范围区域邻接的第一服务器以及排布在第一服务器的前、 后、左或者前、后、右侧的第二服务器为与该探测范围区域的编号具有绑定关系的各第一紧 急备份对象。例如如图2所示,与“左2”表示的这个探测范围区域30邻接的第一服务器为 P1,由P1在机房内的左区域10中,在左区域10中,其右侧没有安装其他的服务器,则根据 规则,取其前、后、左侧的第二服务器P2与其本身作为与“左2”这个探测范围区域的编号 具有绑定关系的第一紧急备份对象,即与编号为“左2”的这个探测范围区域具有绑定关系 的第一紧急备份对象为图2中所示的一个P1和3个P2。
对每个站位区进行第二紧急备份对象绑定的方式为:将安装在站位区的前、后、左、右 侧的服务器作为与站位区具有绑定关系的第二紧急备份对象。例如,如图2所示,当监控到 无权限人员进入“4号站位区”时,将“4号站位区”的前方的服务器(图2中标号为“服务 器2”)、后方的服务器(图2中标号为“服务器4”)、左方(无左方)、右方的服务器(图2 中编号为“服务器1”、“服务器3”两个服务器)作为第二紧急备份对象。
当无权限人员首先进入“左2”这个探测范围区域,然后经过“3号站位区”落入“4号站位区时”,根据本申请预设的规则,将取落入“左2”探测范围区域时匹配的第一紧急备份对象,即图2中的服务器1、3、4、5,以及落入“4号站位区”时匹配的第二紧急备份对象, 即图2中所示的服务器1、2、3、4的并集为紧急备份对象,即将服务器1、2、3、4、5作为 紧急备份对象。而当无权限人员进入图2中的“6号站位区”时,则将服务器1、3、4、5、6 作为紧急备份对象,所以本申请中紧急备份对象是根据无权限人员的行走轨迹进行变换的, 而并非是固定的,因为例如无权限人员从“4号站位区”进入到“6号站位区时”,基本不会 再折回去破坏服务器2,此时释放对服务器2的档案备份算力,以将释放的算力分配给更有 可能被破坏的服务器。这里需要说明的是,当无权限人员重新进入某个探测范围区域时,对 于第一紧急备份对象的匹配将重新进行,因此第一紧急备份对象和第二紧急备份对象的并集 是浮动变化的,这样可以解决无权限人员例如从“4号站位区”行走到“6号站位区”后,图 2中所示的服务器1还是认定为紧急备份对象,实际上,此时服务器1被破坏的概率已经很 低,算力应该被释放,本申请通过每次进入探测范围区域后对第一紧急备份对象进行重新匹 配的方式很好地解决了这个问题。
AI要素的核心是算法、硬件和数据,本实施例围绕采用的算法、硬件和数据对提供的基 于AI要素读取的档案管理及风险检测处理方法进行具体阐述。
请参照图3,本实施例提供的基于AI要素读取的档案管理及风险检测处理方法包括:
步骤S1,安装在机房内的各服务器按照预设的档案挂接方法进行档案挂接;本发明为了 提升档案挂接的速率和准确度,提供了一套创新的档案挂接方法,如图4所示,具体实现过 程包括:
步骤S11,对获取到的每个档案文件夹的档号和文件夹名称分别按预设的档号编码规则 和文件夹命名规则,将每个所述档案文件夹的档号和文件夹名称分别分离为多级分类编码区 域和多级分类命名区域,关联每个档号的第a级分类编码区域记为
Figure BDA0003691894880000121
关联每个文件夹名称 的第b级分类命名区域记为
Figure BDA0003691894880000122
例如,某个档案文件夹的档号为“CSZM-HZGS-1-2022-05-11”,其档号编码规则为:一级 分类编码区域表示文件夹类型,例如“CSZM”中文含义表示“出生证明”;二级分类编码区域 表示地区,例如“HZGS”中文含义表示“杭州拱墅”;三级分类编码区域表示姓名,例如“1” 表示男性;四级分类编码区域表示日期,例如“2022-05-11”表示2022年5月11日。根据上述的档号编码规则,可以将“CSZM-HZGS-1-2022-05-11”分离为“CSZM”“HZGS”“1” “2022-05-11”四个分别对应
Figure BDA0003691894880000123
的分类编码区域。
又比如,某个档案文件夹的文件夹名称为“20220511杭州拱墅男性出生证明”,其文件 夹名称命名规则为:一级分类命名区域表示日期,即“20220511”表示日期;二级分类命名 区域表示地区,即“杭州拱墅”表示地区;三级分类命名区域表示性别,即“男性”表示性 别;四级分类命名区域表示文件夹类型,即“出生证明”表示文件夹类别。
根据上述的档案文件夹命名规则,可以将“20220511杭州拱墅男性出生证明”分离为 “20220511”“杭州拱墅”“男性”“出生证明”四个分类命名区域。
S12,对每个
Figure BDA0003691894880000131
和每个
Figure BDA0003691894880000132
按预设字体尺寸进行放大后,计算每个
Figure BDA0003691894880000133
和每个
Figure BDA0003691894880000135
的字母和 /或数字和/或中文汉字的悬空点距离长度和值,分别记为Va、Vb并存储;
这里需要说明的是,对每个
Figure BDA0003691894880000136
和每个
Figure BDA0003691894880000137
按预设字体尺寸进行放大是悬空点距离长度和 值计算的必要步骤。对每个
Figure BDA0003691894880000138
和每个
Figure BDA0003691894880000139
按预设字体尺寸进行放大后,
Figure BDA00036918948800001310
Figure BDA00036918948800001311
中的每个字 符被同比例放大,字符中的悬空点同样被等比例放大,悬空点与字符中心点的距离也被等比 例放大,有利于后续的悬空点距离长度和值的计算。
本实施例中,Va通过以下方法步骤计算而得:
A1,以相同尺寸的矩形框框选住每个分类编码区域
Figure BDA00036918948800001312
中的每个字母和/或数字,框选住 的字母和/或或数字在矩形框内位置居中;
A2,遍历每个字母和/或数字在矩形框内的悬空点,记为
Figure BDA00036918948800001313
并定位到所在的第i个矩形 框的中心位点,记为
Figure BDA00036918948800001314
悬空点和中心位点的示意请参照图5、图6;
A3,计算每个矩形框内的每个悬空点
Figure BDA00036918948800001315
与其中心位点
Figure BDA00036918948800001316
的距离,记为
Figure BDA00036918948800001317
如图5中标记 的
Figure BDA00036918948800001318
A4,通过以下公式(1)计算第a级分类编码区域中的每个矩形框的悬空点距离长度和值
Figure BDA00036918948800001319
并存储:
Figure BDA00036918948800001320
A5,通过以下公式(2)计算Va并存储:
Figure BDA00036918948800001321
公式(1)-(2)中,r表示第a级分类编码区域中的第i个矩形框内的字母或数字的第r个 悬空点;
R表示第a级分类编码区域中的第i个矩形框内的字母或数字的悬空点
Figure BDA00036918948800001322
的数量;
n表示在第a级分类编码区域中框选字母或数字的矩形框的数量。
Vb通过以下方法步骤计算而得:
B1,以相同尺寸的矩形框框选住分类命名区域
Figure BDA00036918948800001323
中的每个字母和/或数字和/或中文汉 字,框选住的字母和/或数字/或中文汉字在矩形框内位置居中;
B2,以步骤A2-A4所述的方式计算出第b级分类命名区域中框选字母和/或数字的每个矩 形框的悬空点距离长度和值,记为
Figure BDA0003691894880000141
并存储,
Figure BDA0003691894880000142
表示第b级分类命名区域中的第j个用于框选 字母或数字的矩形框的悬空点距离长度和值,并提取每个中文汉字的部首后遍历每个部首在 矩形框内的悬空点,记为
Figure BDA0003691894880000143
(如图7中对于“杭”的部首标记的
Figure BDA0003691894880000144
以及如图8中对于“州” 的部首标记的
Figure BDA0003691894880000145
),并定位到所在的第k个矩形框的中心位点,记为
Figure BDA0003691894880000146
B3,计算框选中文汉字的每个矩形框内的每个悬空点
Figure BDA0003691894880000147
与其中心位点
Figure BDA0003691894880000148
的距离,记为
Figure BDA0003691894880000149
(如图7中标记的
Figure BDA00036918948800001410
);
B4,通过以下公式(3)计算第b级分类编码区域中的每个框选中文汉字的矩形框的悬空 点距离长度和值
Figure BDA00036918948800001411
并存储:
Figure BDA00036918948800001412
公式(3)中,s表示第b级分类命名区域中的第k个矩形框内的中文汉字的部首的第s个悬 空点;
S表示第b级分类命名区域中的第k个矩形框内的中文汉字的部首的悬空点
Figure BDA00036918948800001413
的数量;
B5,通过以下公式(4)计算Vb并存储:
Figure BDA00036918948800001414
公式(4)中,J表示第b级分类命名区域中框选字母和/或数字的矩形框的数量;
K示第b级分类命名区域中框选中文汉字的矩形框的数量。
本实施例中,通过计算中文汉字的部首中的悬空点与中心位点的距离长度来表征中文汉 字与中文汉字间的差异特征,并对文件名称或文件夹名称中的中文字符的悬空点距离长度特 征组合为组合特征后来表征两个文件名称中的中文字符段间的差异特征,该组合的差异特征 对中文字符段间的差异作了放大处理,基于该组合差异特征能够快速匹配到两个待挂接的电 子档案的文件名称与数据库中的电子档案文件夹的文件夹名称的相似度,大幅提升了电子档 案的挂接效率。且以组合差异特征为相似度匹配的依据,由于组合差异特征考虑了文件名称 中每个中文汉字的部首悬空点距离长度差异特征,综合了所有中文汉字部首的差异,中文字 符段的差异被方法,因此,本申请虽仅考虑了汉字的部首差异特征,但相比较现有的以汉字 整体作为相似度匹配对象的汉字相似度匹配,对匹配结果的准确度影响不大,但却大幅提升 了匹配速度。
步骤S12中,另外需要说明的是,识别英文字符、数字、中文汉字中的悬空点的方法采 用的是现有的方法,其识别原理其实非常简单,例如,由于如图2-5中所示的悬空点中表征 字符信息的像素非连续,因此只要识别出表征字符信息的非连续像素点作为悬空点即可。
步骤S13,计算关联每个所述档案文件夹的档号和文件夹名称的悬空点距离长度和值, 分别记为VDH、VMC并存储;
本实施例中,通过以下公式(5)计算VDH、VMC
Figure BDA0003691894880000151
公式(5)中,A表示关联档案文件夹的档号中的分类编码区域的数量;
B表示关联档案文件夹的文件夹名称中的分类命名区域的数量。
S14,将每个档案文件夹的档号对应的VDH,以及文件夹名称对应的VMC映射到档案目录 数据库中元数据的对应所处位置处,并记录元数据位置与数据库中存储的档案文件夹的对应 关系;
S15,获取待进行档案挂接的档案文件的档案号和文件名称,过滤掉档案号和文件名称中 的特定个人信息后,例如,“CSZM-HZGS-1-2022-05-11-GAOXIAOSONG”中的“GAOXIAOSONG” 为人员姓名,为特定个人信息,这个特定个人信息对于电子档案的档案号与电子档案文件夹 的档号的相似度匹配没有任何意义,反而会增加匹配时间,因此需要过滤掉,然后按照预设 的档号编码规则和文件夹命名规则,分别将档案号和文件名称分离为多级分类编码区域和多 级分类命名区域,然后计算关联档案文件的档案号和文件名称分别对应的悬空点距离长度和 值,分别记为V′DH、V′MC,计算方式同VDH、VMC的计算,在此不再赘述;
S16,计算V′DH与存储在档案目录数据库中的所有档案文件夹的档号对应的VDH的相似度, 记为SDH;并计算V′MC与存储在档案目录数据库中的所有档案文件夹的文件夹名称对应的VMC的相似度,记为SMC
具体地,通过以下公式(6)计算相似度SDH、SMC
Figure BDA0003691894880000152
S17,根据SDH和SMC,计算关联档案文件的相似度S;
具体地,通过以下公式(7)计算关联所述档案文件的所述相似度S:
S=w1×SDH+w2×SMC,w1+w2=1公式(7)
公式(7)中,w1、w2分别表示SDH、SMC在计算所述相似度S时所占的权重。
S18,提取大于预设的相似度阈值的每个相似度S所对应的档案文件夹的档号和文件夹名 称并展示给用户;
S19,用户选定欲挂接的档案文件夹后,基于所选定的档案文件夹在档案目录数据库中的 元数据位置与存储在数据库中的档案文件夹的对应关系,提取出档案文件夹,然后将档案文 件自动挂接到所提取的档案文件夹中。
请继续参照图3,本实施例提供的基于AI要素读取的档案管理及风险检测处理方法还包 括:
步骤S2,设置在机房入口处的监控识别到无权限人员闯入机房后,平台进入紧急备份待 命状态;
S3,沿入口直行走廊长度方向设置的探测设备(优选为红外幕帘)探测到无权限人员进 入其探测范围区域内时,平台根据所进入的探测范围区域的编号与紧急备份对象的绑定关系 匹配出第一紧急备份对象,第一紧急备份对象如何匹配在上述内容中已作了阐述,在此不再 赘述;
S4,贴附在各第一紧急备份对象上的距离传感器探测所贴附的第一紧急备份对象与无权 限人员间的距离并生成距离信息发送给平台,平台以距离由短到长表征存储在每个第一紧急 备份对象中的档案被损风险由重到轻的程度,然后按照档案被损风险的严重程度为每个第一 紧急备份对象分配数据备份的算力;
S5,平台终止每个第一紧急备份对象当前进行的档案挂接进程,然后按照分配的算力开 始对存储于每个第一紧急备份对象中的档案进行紧急备份;
S6,判断无权限人员是否进入到与其初始进入的探测范围区域位于入口直行走廊同侧的 站位区内(如果无权限人员进入入口直行走廊另一侧的探测范围区域内,比如从图2所示的 “左2”探测范围区域进入到“右2”探测范围区域而并非进入“3号站位区”,则返回步骤 S3重新计算第一紧急备份对象),
若是,则转入步骤S7;
若否,则保持步骤S4所分配的算力继续对每个第一紧急备份对象进行紧急备份,或返回 步骤S3,根据无权限人员进入到的位于入口直行走廊另一侧的探测范围区域的编号与第一紧 急备份对象的绑定关系重新匹配第一紧急备份对象;
S7,平台根据站位区与第二紧急备份对象的绑定关系,匹配出第二紧急备份对象;
S8,取第一紧急备份对象和第二紧急备份对象的并集作为紧急备份对象;
S9,根据每个紧急备份对象和无权限人员当前所处的定位位置信息,计算每个紧急备份 对象与无权限人员当前所处位置的距离(每个紧急备份对象的安装位置是固定的,所以可以 事先获取每个紧急备份对象的坐标位置,无权限人员的所处位置的坐标信息可以通过安装在 每个站位区上方的摄像头通过采集无权限人员落入站位区后的图像并识别出站位区编号,并 根据实现录入的站位区编号与站位区坐标位置快速匹配出站位区坐标位置(视为无权限人员 当前所处位置),然后根据紧急备份对象的坐标位置和无权限人员的当前所处位置信息可以计 算得到两者间的距离,也可以通过距离传感器直接探测得到),并以距离由短到长表征存储在 每个紧急备份对象中的档案被损风险由重到轻的程度,然后按照档案被损风险由重到轻为每 个紧急备份对象更新由大到小的数据备份算力,
S10,平台终止每个紧急备份对象当前进行的档案挂接进程,然后按照更新的算力对存储 在每个紧急备份对象中的档案进行紧急备份。
步骤S4和步骤S9中,为每个紧急备份对象分配或更新算力的方式通过以下公式(8)表 达:
Figure BDA0003691894880000171
公式(8)中,hi表示第i个紧急备份对象分得的算力;
Li表示贴附在第i个紧急备份对象上的距离传感器探测到的与无权限人员间的距离;
n表示平台匹配出的紧急备份对象的数量;
H表示平台具有的备份数据的总算力。
本发明还提供了一种基于AI要素的档案管理及风险检测处理系统,可实现所述的档案 管理及风险检测处理方法,如图9所示,该系统包括:
档案挂接模块,用于提供给安装在机房内的各服务器按照预设的档案挂接方法进行档案 挂接;
监控模块,设置在机房的入口处,用于在监控识别到无权限人员闯入机房后生成紧急备 份待命指令发送给紧急备份平台;
紧急备份平台,通信连接监控模块和各服务器,用于在接收到紧急备份待命指令后进入 紧急备份状态,并在达到紧急备份条件时,按照分配给待进行档案紧急备份的各服务器相对 应的算力对存储在各服务器中的档案进行紧急备份;
若干个探测模块,通信连接紧急备份平台,每个探测模块沿机房的入口直行走廊长度方 向设置,每个探测模块具有对应的探测范围区域,用于探测无权限人员是否进入其探测范围 区域内,并在判定无权限人员进入其探测范围内时生成第一绑定关系匹配信号发送给紧急备 份平台,第一绑定关系匹配信号中包含探测模块的探测范围区域的编号;
紧急备份平台根据接收到的第一绑定关系匹配信号中的探测范围区域的编号与紧急备份 对象的绑定关系匹配出第一紧急备份对象;
若干个传感模块,每个服务器的顶部位置贴附有至少一个传感模块,每个传感模块通信 连接紧急备份平台,传感模块用于探测所贴附的第一紧急备份对象与无权限人员间的距离并 生成距离信息发送给紧急备份平台;
紧急备份平台以所述距离由短到长表征存储在每个第一紧急备份对象中的档案被损风险 由重到轻的程度,然后按照档案被损风险的严重程度为每个第一紧急备份对象分配数据备份 的算力并生成第一档案挂接终止指令发送给每个第一紧急备份对象,每个第一紧急备份对象 接收到第一档案挂接终止指令后终止当前进行的档案挂接进程,然后紧急备份平台按照分配 的算力开始对存储于每个第一紧急备份对象中的档案进行紧急备份;
站位区人员进入判断模块,连接紧急备份平台,用于判断无权限人员是否进入到与其初 始进入的探测范围区域位于入口执行走廊同侧的站位区内,
若是,则生成第二绑定关系匹配信号并输出;
若否,则不生成所述第二绑定关系匹配信号;
紧急备份平台接收到第二绑定关系匹配信号后,根据预设的站位区与第二紧急备份对象 的绑定关系,匹配出第二紧急备份对象;
并集计算模块,连接紧急备份平台,用于取第一紧急备份对象和第二紧急备份对象的并 集作为紧急备份对象;
距离计算模块,连接并集计算模块和紧急备份平台,用于根据每个紧急备份对象和无权 限人员当前所处的定位位置信息,计算每个紧急备份对象与无权限人员当前所处位置的距离;
紧急备份平台以距离计算模块计算的距离由短到长表征存储在每个紧急备份对象中的档 案被损风险由重到轻的程度,然后按照档案被损风险由重到轻为每个紧急备份对象更新由大 到小的数据备份算力并生成第二档案挂接终止指令发送给每个紧急备份对象,每个紧急备份 对象接收到第二档案挂接终止指令后终止当前进行的档案挂接进程,然后紧急备份平台按照 更新的算力对存储在每个紧急备份对象中的档案进行紧急备份。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领 域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换 只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求 书所使用的一些术语并不是限制,仅仅是为了便于描述。

Claims (10)

1.一种基于AI要素读取的档案管理及风险检测处理方法,其特征在于,步骤包括:
S1,安装在机房内的各服务器按照预设的档案挂接方法进行档案挂接;
S2,设置在机房入口处的监控识别到无权限人员闯入机房后,平台进入紧急备份待命状态;
S3,沿入口直行走廊长度方向设置的探测设备探测到所述无权限人员进入其探测范围区域内时,所述平台根据所进入的所述探测范围区域的编号与紧急备份对象的绑定关系匹配出第一紧急备份对象;
S4,贴附在各所述第一紧急备份对象上的距离传感器探测所贴附的所述第一紧急备份对象与所述无权限人员间的距离并生成距离信息发送给所述平台,所述平台以所述距离由短到长表征存储在每个所述第一紧急备份对象中的档案被损风险由重到轻的程度,然后按照档案被损风险的严重程度为每个所述第一紧急备份对象分配数据备份的算力;
S5,所述平台终止每个所述第一紧急备份对象当前进行的档案挂接进程,然后按照分配的算力开始对存储于每个所述第一紧急备份对象中的档案进行紧急备份;
S6,判断所述无权限人员是否进入到与其初始进入的所述探测范围区域位于所述入口直行走廊同侧的站位区内,
若是,则转入步骤S7;
若否,则保持步骤S4所分配的算力继续对每个所述第一紧急备份对象进行紧急备份,或在所述无权限人员进入到位于所述入口直行走廊另一侧的对应所述探测范围区域后,返回步骤S3,根据所述无权限人员此时进入的所述探测范围区域的编号与所述第一紧急备份对象的绑定关系,重新匹配所述第一紧急备份对象;
S7,所述平台根据所述站位区与第二紧急备份对象的绑定关系,匹配出第二紧急备份对象;
S8,取所述第一紧急备份对象和所述第二紧急备份对象的并集作为紧急备份对象;
S9,根据每个所述紧急备份对象和所述无权限人员当前所处的定位位置信息,计算每个所述紧急备份对象与所述无权限人员当前所处位置的距离,并以距离由短到长表征存储在每个所述紧急备份对象中的档案被损风险由重到轻的程度,然后按照档案被损风险由重到轻为每个所述紧急备份对象更新由大到小的数据备份算力,
S10,所述平台终止每个所述紧急备份对象当前进行的档案挂接进程,然后按照更新的算力对存储在每个所述紧急备份对象中的档案进行紧急备份。
2.根据权利要求1所述的基于AI要素读取的档案管理及风险检测处理方法,其特征在于,步骤S2中所述的所述探测设备为红外幕帘。
3.根据权利要求1所述的基于AI要素读取的档案管理及风险检测处理方法,其特征在于,步骤S4或S9中,为每个所述紧急备份对象分配或更新算力的方式通过以下公式(1)表达:
Figure FDA0003691894870000021
公式(1)中,hi表示第i个所述紧急备份对象分得的算力;
Li表示贴附在第i个所述紧急备份对象上的所述距离传感器探测到的与所述无权限人员间的距离;
n表示所述平台匹配出的所述紧急备份对象的数量;
H表示所述平台具有的备份数据的总算力。
4.根据权利要求1所述的基于AI要素读取的档案管理及风险检测处理方法,其特征在于,与所述探测范围区域邻接的第一服务器以及排布在所述第一服务器的前、后、左或前、后、右侧的第二服务器为与所述探测范围区域的编号具有绑定关系的各所述第一紧急备份对象。
5.根据权利要求1所述的基于AI要素读取的档案管理及风险检测处理方法,其特征在于,布设在所述入口直行走廊的每一侧呈行呈列排列的各服务器间的行距和列宽均相同,且所述机房内的所有所述服务器呈行呈列排列且行距和列宽均相同,所述探测范围区域的划设方法包括步骤:
A1,取所述入口直行走廊宽度的中间点,然后以所述中间点为起始点沿所述入口直行走廊的长度方向画得一条中间线;
A2,沿按列排列在所述机房的左区域的靠近所述入口直行走廊的第一廊长的各所述服务器的侧边画得一条与所述第一廊长平行且等长的第一侧边,并沿按列排列在所述机房的右区域的靠近所述入口直行走廊的第二廊长的各所述服务器的侧边画得一条与所述第二廊长平行且等长的第二侧边;
A3,沿在所述机房内呈行排列的背离所述机房入口的各所述服务器的长边画得若干条相互间平行的平行线,所述中间线、所述第一侧边和若干条所述平行线围合得到位于所述机房的所述左区域的若干个所述探测范围区域;所述中间线、所述第二侧边和若干条所述平行线围合得到位于所述机房的所述右区域的若干个所述探测范围区域。
6.根据权利要求1所述的基于AI要素读取的档案管理及风险检测处理方法,其特征在于,柜门相对的两个服务器之间形成的相对位置区域形成为所述站位区,每个所述站位区的地面贴附有唯一的站位区编号,安装在每个所述站位区上方的摄像头在所述无权限人员落入监控的所述站位区后,自动识别站位区编号并上传给所述平台。
7.根据权利要求1所述的基于AI要素读取的档案管理及风险检测处理方法,其特征在于,步骤S1中所述的档案挂接方法步骤包括:
S11,所述服务器对获取到的每个档案文件夹的档号和文件夹名称分别按预设的档号编码规则和文件夹命名规则,将每个所述档案文件夹的档号和文件夹名称分别分离为多级分类编码区域和多级分类命名区域,关联每个档号的第a级分类编码区域记为
Figure FDA0003691894870000031
关联每个文件夹名称的第b级分类命名区域记为
Figure FDA0003691894870000032
S12,对每个
Figure FDA0003691894870000033
和每个
Figure FDA0003691894870000034
按预设字体尺寸进行放大后,计算每个
Figure FDA0003691894870000035
和每个
Figure FDA0003691894870000036
的字母和/或数字和/或中文汉字的悬空点距离长度和值,分别记为Va、Vb并存储;
S13,计算关联每个所述档案文件夹的档号和文件夹名称的悬空点距离长度和值,分别记为VDH、VMC并存储;
S14,将每个所述档案文件夹的档号对应的VDH,以及文件夹名称对应的VMC映射到档案目录数据库中元数据的对应所处位置处,并记录元数据位置与数据库中存储的所述档案文件夹的对应关系;
S15,获取待进行档案挂接的档案文件的档案号和文件名称,过滤掉档案号和文件名称中的特定个人信息后,按照预设的所述档号编码规则和所述文件夹命名规则,分别将所述档案号和所述文件名称分离为多级分类编码区域和多级分类命名区域,然后计算关联所述档案文件的所述档案号和所述文件名称分别对应的悬空点距离长度和值,分别记为V′DH、V′MC
S16,计算V′DH与存储在所述档案目录数据库中的所有所述档案文件夹的档号对应的MDH的相似度,记为SDH;并计算V′MC与存储在所述档案目录数据库中的所有所述档案文件夹的文件夹名称对应的VMC的相似度,记为SMC
S17,根据SDH和SMC,计算关联所述档案文件的相似度S;
S18,提取大于预设的相似度阈值的每个所述相似度S所对应的所述档案文件夹的档号和文件夹名称并展示给用户;
S19,所述用户选定欲挂接的所述档案文件夹后,基于所选定的所述档案文件夹在所述档案目录数据库中的元数据位置与存储在所述数据库中的所述档案文件夹的对应关系,提取出所述档案文件夹,然后将所述档案文件自动挂接到所提取的所述档案文件夹中。
8.根据权利要求7所述的基于AI要素读取的档案管理及风险检测处理方法,其特征在于,步骤S12中,Va通过以下方法步骤计算而得:
A1,以相同尺寸的矩形框框选住每个分类编码区域
Figure FDA0003691894870000041
中的每个字母和/或数字,框选住的字母和/或或数字在所述矩形框内位置居中;
A2,遍历每个字母和/或数字在所述矩形框内的悬空点,记为
Figure FDA0003691894870000042
并定位到所在的第i个所述矩形框的中心位点,记为
Figure FDA0003691894870000043
A3,计算每个所述矩形框内的每个悬空点
Figure FDA0003691894870000044
与其中心位点
Figure FDA0003691894870000045
的距离,记为
Figure FDA0003691894870000046
A4,通过以下公式(2)计算第a级分类编码区域中的每个所述矩形框的悬空点距离长度和值
Figure FDA0003691894870000047
并存储:
Figure FDA0003691894870000048
A5,通过以下公式(3)计算Va并存储:
Figure FDA0003691894870000049
公式(2)-(3)中,r表示第a级分类编码区域中的第i个所述矩形框内的字母或数字的第r个悬空点;
R表示第a级分类编码区域中的第i个所述矩形框内的字母或数字的悬空点
Figure FDA00036918948700000410
的数量;
n表示在第a级分类编码区域中框选字母或数字的所述矩形框的数量;
Vb通过以下方法步骤计算而得:
B1,以相同尺寸的矩形框框选住分类命名区域
Figure FDA00036918948700000411
中的每个字母和/或数字和/或中文汉字,框选住的字母和/或数字/或中文汉字在所述矩形框内位置居中;
B2,以步骤A2-A4所述的方式计算出第b级分类命名区域中框选字母和/或数字的每个所述矩形框的悬空点距离长度和值,记为
Figure FDA00036918948700000412
并存储,
Figure FDA00036918948700000413
表示第b级分类命名区域中的第j个用于框选字母或数字的所述矩形框的悬空点距离长度和值,并提取每个中文汉字的部首后遍历每个部首在所述矩形框内的悬空点,记为
Figure FDA00036918948700000414
并定位到所在的第k个所述矩形框的中心位点,记为
Figure FDA00036918948700000415
B3,计算框选中文汉字的每个所述矩形框内的每个悬空点
Figure FDA00036918948700000416
与其中心位点
Figure FDA00036918948700000417
的距离,记为
Figure FDA00036918948700000418
B4,通过以下公式(4)计算第b级分类编码区域中的每个框选中文汉字的所述矩形框的悬空点距离长度和值
Figure FDA0003691894870000051
并存储:
Figure FDA0003691894870000052
公式(4)中,s表示第b级分类命名区域中的第k个所述矩形框内的中文汉字的部首的第s个悬空点;
S表示第b级分类命名区域中的第k个所述矩形框内的中文汉字的部首的悬空点
Figure FDA0003691894870000053
的数量;
B5,通过以下公式(5)计算Vb并存储:
Figure FDA0003691894870000054
公式(5)中,J表示第b级分类命名区域中框选字母和/或数字的所述矩形框的数量;
K示第b级分类命名区域中框选中文汉字的所述矩形框的数量。
9.根据权利要求7所述的基于AI要素读取的档案管理及风险检测处理方法,其特征在于,步骤S13中,通过以下公式(6)计算VDH、VMC
Figure FDA0003691894870000055
公式(6)中,A表示关联所述档案文件夹的档号中的分类编码区域的数量;
B表示关联所述档案文件夹的文件夹名称中的分类命名区域的数量;
步骤S16中,通过以下公式(7)计算相似度SDH、SMC
Figure FDA0003691894870000056
步骤S17中,通过以下公式(8)计算关联所述档案文件的所述相似度S:
S=w1×SDH+w2×SMC,w1+w2=1 公式(8)
公式(8)中,w1、w2分别表示SDH、SMC在计算所述相似度S时所占的权重。
10.一种基于AI要素的档案管理及风险检测处理系统,可实现如权利要求1-9任意一项所述的档案管理及风险检测处理方法,其特征在于,包括:
档案挂接模块,用于提供给安装在机房内的各服务器按照预设的档案挂接方法进行档案挂接;
监控模块,设置在所述机房的入口处,用于在监控识别到无权限人员闯入所述机房后生成紧急备份待命指令发送给紧急备份平台;
所述紧急备份平台,通信连接所述监控模块和各所述服务器,用于在接收到所述紧急备份待命指令后进入紧急备份状态,并在达到紧急备份条件时,按照分配给待进行档案紧急备份的各所述服务器相对应的算力对存储在各所述服务器中的档案进行紧急备份;
若干个探测模块,通信连接所述紧急备份平台,每个所述探测模块沿所述机房的入口直行走廊长度方向设置,每个所述探测模块具有对应的探测范围区域,用于探测所述无权限人员是否进入其探测范围区域内,并在判定所述无权限人员进入其探测范围内时生成第一绑定关系匹配信号发送给所述紧急备份平台,所述第一绑定关系匹配信号中包含所述探测模块的所述探测范围区域的编号;
所述紧急备份平台根据接收到的所述第一绑定关系匹配信号中的所述探测范围区域的编号与紧急备份对象的绑定关系匹配出第一紧急备份对象;
若干个传感模块,每个所述服务器的顶部位置贴附有至少一个所述传感模块,每个所述传感模块通信连接所述紧急备份平台,所述传感模块用于探测所贴附的所述第一紧急备份对象与所述无权限人员间的距离并生成距离信息发送给所述紧急备份平台;
所述紧急备份平台以所述距离由短到长表征存储在每个所述第一紧急备份对象中的档案被损风险由重到轻的程度,然后按照档案被损风险的严重程度为每个所述第一紧急备份对象分配数据备份的算力并生成第一档案挂接终止指令发送给每个所述第一紧急备份对象,每个所述第一紧急备份对象接收到所述第一档案挂接终止指令后终止当前进行的档案挂接进程,然后所述紧急备份平台按照分配的算力开始对存储于每个所述第一紧急备份对象中的档案进行紧急备份;
站位区人员进入判断模块,连接所述紧急备份平台,用于判断所述无权限人员是否进入到与其初始进入的所述探测范围区域位于所述入口执行走廊同侧的站位区内,
若是,则生成第二绑定关系匹配信号并输出;
若否,则不生成所述第二绑定关系匹配信号;
所述紧急备份平台接收到所述第二绑定关系匹配信号后,根据预设的所述站位区与第二紧急备份对象的绑定关系,匹配出第二紧急备份对象;
并集计算模块,连接所述紧急备份平台,用于取所述第一紧急备份对象和所述第二紧急备份对象的并集作为紧急备份对象;
距离计算模块,连接所述并集计算模块和所述紧急备份平台,用于根据每个所述紧急备份对象和所述无权限人员当前所处的定位位置信息,计算每个所述紧急备份对象与所述无权限人员当前所处位置的距离;
所述紧急备份平台以所述距离计算模块计算的距离由短到长表征存储在每个所述紧急备份对象中的档案被损风险由重到轻的程度,然后按照档案被损风险由重到轻为每个所述紧急备份对象更新由大到小的数据备份算力并生成第二档案挂接终止指令发送给每个所述紧急备份对象,每个所述紧急备份对象接收到所述第二档案挂接终止指令后终止当前进行的档案挂接进程,然后所述紧急备份平台按照更新的算力对存储在每个所述紧急备份对象中的档案进行紧急备份。
CN202210666922.0A 2022-06-13 2022-06-13 基于ai要素读取的档案管理及风险检测处理方法、系统 Active CN115391089B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210666922.0A CN115391089B (zh) 2022-06-13 2022-06-13 基于ai要素读取的档案管理及风险检测处理方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210666922.0A CN115391089B (zh) 2022-06-13 2022-06-13 基于ai要素读取的档案管理及风险检测处理方法、系统

Publications (2)

Publication Number Publication Date
CN115391089A true CN115391089A (zh) 2022-11-25
CN115391089B CN115391089B (zh) 2023-06-23

Family

ID=84116824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210666922.0A Active CN115391089B (zh) 2022-06-13 2022-06-13 基于ai要素读取的档案管理及风险检测处理方法、系统

Country Status (1)

Country Link
CN (1) CN115391089B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107833125A (zh) * 2017-11-01 2018-03-23 五华县企正科技信息咨询有限公司 一种客户资料影像管理系统
WO2018126742A1 (zh) * 2017-01-05 2018-07-12 福建亿榕信息技术有限公司 存量档案电子化批量处理方法、系统及存储介质
CN110458489A (zh) * 2019-07-05 2019-11-15 宁波海上鲜信息技术有限公司 仓库监管方法、系统、存储介质及其智能终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018126742A1 (zh) * 2017-01-05 2018-07-12 福建亿榕信息技术有限公司 存量档案电子化批量处理方法、系统及存储介质
CN107833125A (zh) * 2017-11-01 2018-03-23 五华县企正科技信息咨询有限公司 一种客户资料影像管理系统
CN110458489A (zh) * 2019-07-05 2019-11-15 宁波海上鲜信息技术有限公司 仓库监管方法、系统、存储介质及其智能终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
罗敏;: "九五二台电子档案安全存贮环境建设" *

Also Published As

Publication number Publication date
CN115391089B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
US9977971B2 (en) Role-based tracking and surveillance
Salimi et al. Visual-based trash detection and classification system for smart trash bin robot
CN108009482A (zh) 一种提高人脸识别效率方法
CN111368772B (zh) 身份识别方法、装置、设备及存储介质
CN107909033A (zh) 基于监控视频的嫌疑人快速追踪方法
CN102222283A (zh) 人脸识别的数据管理系统
CN109815775A (zh) 一种基于人脸属性的人脸识别方法及系统
CN107424273A (zh) 一种无人超市的管理方法
KR102043922B1 (ko) Cctv 분할 운영시스템 및 그 운영방법
CN107977439A (zh) 一种人脸图像库构建方法
CN109784231A (zh) 安防信息管理方法、装置及存储介质
CN106778636A (zh) 身份验证方法及装置
CN107491728A (zh) 一种基于边缘计算模型的人脸侦测方法及装置
CN117423121B (zh) 一种基于区块链的族谱数据智能化管理系统及方法
CN107480625A (zh) 一种基于人脸识别的身份鉴别方法
CN104392232A (zh) 一种交通场景下视频元数据的校正方法
US20210034861A1 (en) Document fingerprint for fraud detection
CN103258222A (zh) 小区智能物管系统
CN115391089A (zh) 基于ai要素读取的档案管理及风险检测处理方法、系统
CN115544508A (zh) 一种基于大数据的计算机系统安全管理系统及方法
CN117131448A (zh) 基于大数据的窃电用户智能识别系统及方法
CN106649367A (zh) 检测关键词推广程度的方法和装置
US20230259549A1 (en) Extraction of feature point of object from image and image search system and method using same
Anekar et al. Automated gate system using number plate recognition (NPR)
CN114783097A (zh) 一种医院防疫管理系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant