CN115620303B - 人事档案智慧管理系统 - Google Patents

人事档案智慧管理系统 Download PDF

Info

Publication number
CN115620303B
CN115620303B CN202211253424.XA CN202211253424A CN115620303B CN 115620303 B CN115620303 B CN 115620303B CN 202211253424 A CN202211253424 A CN 202211253424A CN 115620303 B CN115620303 B CN 115620303B
Authority
CN
China
Prior art keywords
image
feature
training
paper
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211253424.XA
Other languages
English (en)
Other versions
CN115620303A (zh
Inventor
杨建福
周哲亮
胡坚
周阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Jingsheng Hangxing Technology Co ltd
Original Assignee
Hangzhou Jingsheng Hangxing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Jingsheng Hangxing Technology Co ltd filed Critical Hangzhou Jingsheng Hangxing Technology Co ltd
Priority to CN202211253424.XA priority Critical patent/CN115620303B/zh
Publication of CN115620303A publication Critical patent/CN115620303A/zh
Application granted granted Critical
Publication of CN115620303B publication Critical patent/CN115620303B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19127Extracting features by transforming the feature space, e.g. multidimensional scaling; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及智能检测领域,其具体地公开了一种人事档案智慧管理系统,其通过采用基于深度学习的人工智能检测技术来提取出待检测纸质档案图像和参考纸质档案图像中的高维隐含特征分布信息,进一步再通过距离度量工具来度量所述待检测纸质档案图像隐含特征和所述参考纸质档案图像隐含特征之间的特征差异性,并以此来进行所述待检测纸质档案图像的质量评估。这样,能够智能且准确地对于扫描后的纸质档案图像进行质量检测,以此来判断扫描后的档案图像清晰度是否满足后续的应用需求。

Description

人事档案智慧管理系统
技术领域
本申请涉及智能检测领域,且更为具体地,涉及一种人事档案智慧管理系统。
背景技术
要实现数字化管理,就存在要将以往纸质人事档案文件转换为计算机可识别的文字,实现录入、存储。纸介质文档信息进行数字化处理后,可以保存到可存储设备上,具有存储、管理和共享等功能,还可以减少文档库房占地,节省资源。
纸质档案数字化的操作流程包括档案的分类整理、图像扫描、文字录入以及存储入库等步骤。其中图像扫描要使图像清晰,文字录入以及存储入库时要对人事档案电子文件进行安全加固确保其真实完整。
在图像扫描步骤中,扫描的纸质档案图像的清晰度以及完整性是实现人事档案数字化管理的关键,但是,现有的方案中只能依靠人工来进行扫描图像的质量评估,将人工判断未合格的扫描档案进行重新扫描。这样不仅会浪费大量的人工时间,还会导致人工评估的准确度并不高,导致扫描的档案图像质量并不能够满足后续的应用需求。
因此,期望一种人事档案智慧管理系统,其能够对扫描的纸质档案图像进行质量评估,以确保其能够满足后续的应用需求。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种人事档案智慧管理系统,其通过采用基于深度学习的人工智能检测技术来提取出待检测纸质档案图像和参考纸质档案图像中的高维隐含特征分布信息,进一步再通过距离度量工具来度量所述待检测纸质档案图像隐含特征和所述参考纸质档案图像隐含特征之间的特征差异性,并以此来进行所述待检测纸质档案图像的质量评估。这样,能够智能且准确地对于扫描后的纸质档案图像进行质量检测,以此来判断扫描后的档案图像清晰度是否满足后续的应用需求。
根据本申请的一个方面,提供了一种人事档案智慧管理系统,其包括:
纸质档案图像采集单元,用于获取参考纸质档案图像和待检测纸质档案图像,其中,所述参考纸质档案图像具有满足预定标准的图像质量;
图像质量统计特征提取单元,用于提取所述参考纸质档案图像的多个参考统计特征,所述多个参考统计特征包括均值、标准差、平均梯度和熵;
统计特征编码单元,用于将所述多个参考统计特征通过Clip模型的序列编码器以得到参考统计特征向量;
图像编码单元,用于将所述参考纸质档案图像通过所述Clip模型的图像编码器以得到参考图像特征向量;
图像编码优化单元,用于使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;
检测档案编码单元,用于将所述待检测纸质档案图像通过所述Clip模型以得到优化检测图像特征矩阵;
度量单元,用于将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量;以及
管理结果生成单元,用于将所述度量特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测纸质档案图像的图像质量是否满足预定要求。
在上述人事档案智慧管理系统中,所述统计特征编码单元,进一步用于:第一尺度特征提子取单元,用于将所述参考统计特征通过Clip模型的序列编码器的第一卷积层以得到第一邻域尺度参考统计特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;第二尺度特征提取子单元,用于将所述参考统计特征通过Clip模型的序列编码器的第二卷积层以得到第二邻域尺度参考统计特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及,多尺度特征融合子单元,用于将所述第一邻域尺度参考统计特征向量和所述第二邻域尺度参考统计特征向量进行级联以得到所述参考统计特征向量。
在上述人事档案智慧管理系统中,所述第一尺度特征提子取单元,进一步用于:使用所述Clip模型的序列编码器的第一卷积层以如下公式对所述参考统计特征进行一维卷积编码以得到第一邻域尺度参考统计特征向量;
其中,所述公式为:
Figure GDA0004138635970000031
其中,a为第一卷积核在x方向上的宽度、F(a)为第一卷积核参数向量、G(x-a)为与卷积核函数运算的局部向量矩阵,w为第一卷积核的尺寸,X表示所述参考统计特征。所述第二尺度特征提取子单元,进一步用于:使用所述Clip模型的序列编码器的第二卷积层以如下公式对所述参考统计特征进行一维卷积编码以得到所述第二邻域尺度参考统计特征向量;
其中,所述公式为:
Figure GDA0004138635970000032
其中,b为第二卷积核在x方向上的宽度、F(b)为第二卷积核参数向量、G(x-b)为与卷积核函数运算的局部向量矩阵,m为第二卷积核的尺寸,X表示所述参考统计特征。
在上述人事档案智慧管理系统中,所述图像编码单元,进一步用于:使用所述Clip模型的图像编码器的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述Clip模型的图像编码器的最后一层的输出为所述参考图像特征向量,所述Clip模型的图像编码器的第一层的输入为所述参考纸质档案图像。
在上述人事档案智慧管理系统中,所述图像编码优化单元,进一步用于:使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;
其中,所述公式为:
Figure GDA0004138635970000033
其中Vs表示所述参考统计特征向量,
Figure GDA0004138635970000034
表示所述参考统计特征向量的转置向量,Vb表示所述参考图像特征向量,Mb表示所述优化参考图像特征矩阵,
Figure GDA0004138635970000035
表示向量相乘。
在上述人事档案智慧管理系统中,所述度量单元,包括:使用所述基于关系网络的距离度量器的第一全连接层对所述优化检测图像特征矩阵进行全连接编码以得到检测特征向量;使用所述基于关系网络的距离度量器的第二全连接层对所述优化参考图像特征矩阵进行全连接编码以得到参考特征向量;以及,使用所述基于关系网络的距离度量器的差分层计算所述检测特征向量和所述参考特征向量的按位置差分以得到所述度量特征向量。
在上述人事档案智慧管理系统中,所述管理结果生成单元,进一步用于:使用所述分类器以如下公式对所述度量特征向量进行处理以生成分类结果;其中,所述公式为:O=softmax{(Mc,Bc)|X},其中,Mc为权重矩阵,Bc为偏置向量,X为所述度量特征向量。
在上述人事档案智慧管理系统中,还包括用于对所述Clip模型和所述分类器进行训练的训练模块;其中,所述训练模块,包括:训练纸质档案图像采集单元,用于获取训练数据,所述训练数据包括训练参考纸质档案图像和训练待检测纸质档案图像,以及,所述训练待检测纸质档案图像的图像质量是否满足预定要求的真实值,其中,所述训练参考纸质档案图像具有满足预定标准的图像质量;训练图像质量统计特征提取单元,用于提取所述训练参考纸质档案图像的多个训练参考统计特征,所述多个训练参考统计特征包括均值、标准差、平均梯度和熵;训练统计特征编码单元,用于将所述多个训练参考统计特征通过所述Clip模型的序列编码器以得到训练参考统计特征向量;训练图像编码单元,用于将所述训练参考纸质档案图像通过所述Clip模型的图像编码器以得到训练参考图像特征向量;训练图像编码优化单元,用于使用所述Clip模型的优化编码器来基于所述训练参考统计特征向量对所述训练参考图像特征向量的特征编码进行优化以得到训练优化参考图像特征矩阵;训练检测档案编码单元,用于将所述训练待检测纸质档案图像通过所述Clip模型以得到训练优化检测图像特征矩阵;训练度量单元,用于将所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵通过所述基于关系网络的距离度量器以得到训练度量特征向量;以及,分类损失函数值计算单元,用于将所述训练度量特征向量通过所述分类器以得到分类损失函数值;抑制损失函数值计算单元,用于计算所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵的特征提取模式消解的抑制损失函数值;以及,训练单元,用于以所述特征提取模式消解的抑制损失函数值和所述分类损失函数值的加权和作为损失函数值对所述Clip模型和所述分类器进行训练。
在上述人事档案智慧管理系统中,所述抑制损失函数值计算单元,进一步用于:以如下公式计算所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵的所述特征提取模式消解的抑制损失函数值;
其中,所述公式为:
Figure GDA0004138635970000051
Figure GDA0004138635970000052
其中V1和V2分别是所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵展开后得到的特征向量,且M1和M2分别是所述分类器对于所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵展开后得到的特征向量的权重矩阵,
Figure GDA0004138635970000053
表示向量的二范数的平方,‖·‖F表示矩阵的F范数,
Figure GDA0004138635970000054
表示按位置减法,log表示以2为底的对数函数值。
根据本申请的另一方面,提供了一种人事档案智慧管理方法,其包括:
获取参考纸质档案图像和待检测纸质档案图像,其中,所述参考纸质档案图像具有满足预定标准的图像质量;
提取所述参考纸质档案图像的多个参考统计特征,所述多个参考统计特征包括均值、标准差、平均梯度和熵;
将所述多个参考统计特征通过Clip模型的序列编码器以得到参考统计特征向量;
将所述参考纸质档案图像通过所述Clip模型的图像编码器以得到参考图像特征向量;
使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;
将所述待检测纸质档案图像通过所述Clip模型以得到优化检测图像特征矩阵;
将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量;以及
将所述度量特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测纸质档案图像的图像质量是否满足预定要求。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的人事档案智慧管理方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的人事档案智慧管理方法。
与现有技术相比,本申请提供的一种人事档案智慧管理系统,其通过采用基于深度学习的人工智能检测技术来提取出待检测纸质档案图像和参考纸质档案图像中的高维隐含特征分布信息,进一步再通过距离度量工具来度量所述待检测纸质档案图像隐含特征和所述参考纸质档案图像隐含特征之间的特征差异性,并以此来进行所述待检测纸质档案图像的质量评估。这样,能够智能且准确地对于扫描后的纸质档案图像进行质量检测,以此来判断扫描后的档案图像清晰度是否满足后续的应用需求。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1图示了根据本申请实施例的人事档案智慧管理系统的框图;
图2图示了根据本申请实施例的人事档案智慧管理系统的框图;
图3图示了根据本申请实施例的人事档案智慧管理系统中推断模块的系统架构图;
图4图示了根据本申请实施例的人事档案智慧管理系统中统计特征编码单元的框图;
图5图示了根据本申请实施例的人事档案智慧管理系统中图像编码过程的流程图;
图6图示了根据本申请实施例的人事档案智慧管理系统中训练模块的系统架构图;
图7图示了根据本申请实施例的人事档案智慧管理方法的流程图;
图8图示了根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
场景概述
如上所述,要实现数字化管理,就存在要将以往纸质人事档案文件转换为计算机可识别的文字,实现录入、存储。纸介质文档信息进行数字化处理后,可以保存到可存储设备上,具有存储、管理和共享等功能,还可以减少文档库房占地,节省资源。
纸质档案数字化的操作流程包括档案的分类整理、图像扫描、文字录入以及存储入库等步骤。其中图像扫描要使图像清晰,文字录入以及存储入库时要对人事档案电子文件进行安全加固确保其真实完整。
在图像扫描步骤中,扫描的纸质档案图像的清晰度以及完整性是实现人事档案数字化管理的关键,但是,现有的方案中只能依靠人工来进行扫描图像的质量评估,将人工判断未合格的扫描档案进行重新扫描。这样不仅会浪费大量的人工时间,还会导致人工评估的准确度并不高,导致扫描的档案图像质量并不能够满足后续的应用需求。因此,期望一种人事档案智慧管理系统,其能够对扫描的纸质档案图像进行质量评估,以确保其能够满足后续的应用需求。
相应地,考虑到为了能够在图像扫描后自动地对扫描的纸质档案图像进行质量评估以确保其能够满足后续的应用需求,可以对于扫描后的检测纸质档案图像与标准的参考纸质档案图像进行特征比对,进而来进行扫描后的档案图像质检。具体地,在本申请的技术方案中,采用基于深度学习的人工智能检测技术来提取出待检测纸质档案图像和参考纸质档案图像中的高维隐含特征分布信息,进一步再通过距离度量工具来度量所述待检测纸质档案图像隐含特征和所述参考纸质档案图像隐含特征之间的特征差异性,并以此来进行所述待检测纸质档案图像的质量评估。这样,能够智能且准确地对于扫描后的纸质档案图像进行质量检测,以使得扫描后的档案图像质量能够满足后续的应用需求。
具体地,在本申请的技术方案中,首先,获取参考纸质档案图像和待检测纸质档案图像,其中,所述参考纸质档案图像具有满足预定标准的图像质量。接着,对于所述参考纸质档案图像,将所述参考纸质档案图像通过Clip模型的图像编码器中进行图像编码处理,以提取出所述参考纸质档案图像中的局部隐含特征在高维空间中的特征分布信息,从而得到参考图像特征向量。
然后,考虑到在对于纸质档案图像的质量进行检测时,需要关注于所述纸质档案图像的质量特征信息,也就是,需要聚焦于所述纸质档案图像中的特定统计特征信息。因此,如果能够通过以所述纸质档案图像中的统计特征的隐含特征信息和所述纸质档案图像中的高维隐含特征分布信息进行相结合,显然能够提高后续对于扫描图像的质检准确性。基于此,在本申请的技术方案中,进一步提取所述参考纸质档案图像的多个参考统计特征,所述多个参考统计特征包括均值、标准差、平均梯度和熵。进一步地,将所述多个参考统计特征通过Clip模型的序列编码器以得到参考统计特征向量,也就是,以所述Clip模型的序列编码器的多尺度邻域特征提取模块来对于所述多个参考统计特征进行多尺度编码,以分别提取出所述多个参考统计特征中的各个参考统计特征的多尺度邻域关联特征,从而得到参考统计特征向量。
接着,使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵。也就是,以所述Clip模型的优化编码器融合所述参考统计特征中的多尺度邻域关联特征和所述参考图像隐含特征,以此来优化所述参考纸质档案图像的特征分布质量信息的表达,从而得到优化参考图像特征矩阵。特别地,在本申请的一个具体示例中,所述Clip模型的优化编码器可以使用向量相乘的方式来对所述参考统计特征向量和所述参考图像特征向量进行优化编码。
同样地,对于所述待检测纸质档案图像,也将其按照如上所述步骤来进行高维隐含特征提取,也就是,将所述待检测纸质档案图像通过所述Clip模型中进行特征挖掘,以提取出所述待检测纸质档案图像中的隐含特征分布质量信息,从而得到优化检测图像特征矩阵。
进一步地,为了能够在高维特征空间中对于所述参考纸质档案图像和所述待检测纸质档案图像中的图像质量进行检测以此来判断扫描图像是否满足要求,需要将所述参考纸质档案图像的质量特征和所述待检测纸质档案图像的质量特征进行差异性比较来确定待检测纸质档案的扫描图像质量。具体地,在本申请的技术方案中,将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量,也就是,利用作为距离度量模型的关系网络来度量所述参考图像隐含特征和所述检测图像隐含特征之间的特征差异性来得到度量特征向量。应可以理解,这里,并非基于距离公式来进行所述优化参考图像特征矩阵和所述优化检测图像特征矩阵之间的差异度量,而是基于训练完成的关系网络作为距离度量工具来更为精准地度量所述检测图像特征和所述参考图像特征之间的差异性,以更好地进行质检。
然后,将所述度量特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测纸质档案图像的图像质量是否满足预定要求。也就是,以所述度量特征向量作为分类特征向量来进行分类处理,以得到用于表示待检测纸质档案图像的图像质量是否满足预定要求的分类结果。这样,能够基于图像质量来判断扫描图像是否满足要求,以满足后续数字化应用要求。
在将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量时,期望所述优化参考图像特征矩阵和所述优化检测图像特征矩阵的特征分布尽量保持一致,以提高度量特征向量的计算的准确度。但是,由于所述优化参考图像特征矩阵和所述优化检测图像特征矩阵是通过单独的CLIP模型得到的,因此在训练过程中,分类器的分类损失函数在梯度反向传播时会分别通过所述两个分支CLIP模型,从而可能由于异常的梯度发散导致所述CLIP模型的特征提取模式的消解,从而影响所述度量特征向量的分类结果的准确性。
因此,优选地,引入针对所述优化参考图像特征矩阵和所述优化检测图像特征矩阵的特征提取模式消解的抑制损失函数,表示为:
Figure GDA0004138635970000091
Figure GDA0004138635970000092
这里,V1和V2分别是所述优化参考图像特征矩阵和所述优化检测图像特征矩阵展开后得到的特征向量,M1和M2分别是所述分类器对于所述优化参考图像特征矩阵和所述优化检测图像特征矩阵展开后得到的特征向量的权重矩阵,‖·‖F表示矩阵的F范数,且
Figure GDA0004138635970000093
表示向量的二范数的平方。
具体地,在保持所述优化参考图像特征矩阵V1和所述优化检测图像特征矩阵V2的特征分布的一致性的同时,通过进一步以交叉熵形式使得分类器相对于不同特征向量的权重矩阵的差异分布与特征向量的真实的特征差异分布保持一致,来保证梯度反向传播时的定向导数在梯度传播的分支点附近得到正则化。也就是,将梯度针对所述两个单独的CLIP模型的特征提取模式进行过加权,这样,就对特征提取模式的消解进行了抑制,提升了所述优化参考图像特征矩阵V1和所述优化检测图像特征矩阵V2的特征提取能力,也就相应提升了所述度量特征向量的分类结果的准确性。这样,能够智能且准确地对于扫描后的纸质档案图像进行质量检测,以使得扫描后的档案图像质量能够满足后续的应用需求。
基于此,本申请提出了一种人事档案智慧管理系统,其包括:纸质档案图像采集单元,用于获取参考纸质档案图像和待检测纸质档案图像,其中,所述参考纸质档案图像具有满足预定标准的图像质量;图像质量统计特征提取单元,用于提取所述参考纸质档案图像的多个参考统计特征,所述多个参考统计特征包括均值、标准差、平均梯度和熵;统计特征编码单元,用于将所述多个参考统计特征通过Clip模型的序列编码器以得到参考统计特征向量;图像编码单元,用于将所述参考纸质档案图像通过所述Clip模型的图像编码器以得到参考图像特征向量;图像编码优化单元,用于使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;检测档案编码单元,用于将所述待检测纸质档案图像通过所述Clip模型以得到优化检测图像特征矩阵;度量单元,用于将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量;以及,管理结果生成单元,用于将所述度量特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测纸质档案图像的图像质量是否满足预定要求。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1图示了根据本申请实施例的人事档案智慧管理系统的框图。如图1所示,根据本申请实施例的人事档案智慧管理系统300包括推断模块,其中,所述推断模块包括:纸质档案图像采集单元310;图像质量统计特征提取单元320;统计特征编码单元330;图像编码单元340;图像编码优化单元350;检测档案编码单元360;度量单元370;以及,管理结果生成单元380。
其中,所述纸质档案图像采集单元310,用于获取参考纸质档案图像和待检测纸质档案图像,其中,所述参考纸质档案图像具有满足预定标准的图像质量;所述图像质量统计特征提取单元320,用于提取所述参考纸质档案图像的多个参考统计特征,所述多个参考统计特征包括均值、标准差、平均梯度和熵;所述统计特征编码单元330,用于将所述多个参考统计特征通过Clip模型的序列编码器以得到参考统计特征向量;所述图像编码单元340,用于将所述参考纸质档案图像通过所述Clip模型的图像编码器以得到参考图像特征向量;所述图像编码优化单元350,用于使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;所述检测档案编码单元360,用于将所述待检测纸质档案图像通过所述Clip模型以得到优化检测图像特征矩阵;所述度量单元370,用于将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量;以及,所述管理结果生成单元380,用于将所述度量特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测纸质档案图像的图像质量是否满足预定要求。
图3图示了根据本申请实施例的人事档案智慧管理系统中推断模块的系统架构图。如图3所示,在所述人事档案智慧管理系统300的系统架构中,在推断过程中,首先通过所述纸质档案图像采集单元310获取参考纸质档案图像和待检测纸质档案图像,其中,所述参考纸质档案图像具有满足预定标准的图像质量;所述图像质量统计特征提取单元320提取所述纸质档案图像采集单元310获取的参考纸质档案图像的多个参考统计特征,所述多个参考统计特征包括均值、标准差、平均梯度和熵;所述统计特征编码单元330将所述图像质量统计特征提取单元320提取的多个参考统计特征通过Clip模型的序列编码器以得到参考统计特征向量;其次,所述图像编码单元340将所述纸质档案图像采集单元310获取的参考纸质档案图像通过所述Clip模型的图像编码器以得到参考图像特征向量;接着,所述图像编码优化单元350使用所述Clip模型的优化编码器来基于所述统计特征编码单元330生成的参考统计特征向量对所述图像编码单元340生成的参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;然后,所述检测档案编码单元360将所述纸质档案图像采集单元310获取的待检测纸质档案图像通过所述Clip模型以得到优化检测图像特征矩阵;所述度量单元370将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量;进而,所述管理结果生成单元380将所述度量特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测纸质档案图像的图像质量是否满足预定要求。
具体地,在所述人事档案智慧管理系统300的运行过程中,所述纸质档案图像采集单元310,用于获取参考纸质档案图像和待检测纸质档案图像,其中,所述参考纸质档案图像具有满足预定标准的图像质量。应可以理解,在数字化管理中,扫描的纸质档案图像的清晰度以及完整性是实现人事档案数字化管理的关键,考虑到为了能够在图像扫描后自动地对扫描的纸质档案图像进行质量评估以确保其能够满足后续的应用需求,可以对于扫描后的检测纸质档案图像与标准的参考纸质档案图像进行特征比对,进而来进行扫描后的档案图像质检。因此,在本申请的技术方案中,通过扫描设备获取扫描后的待检测纸质档案图像,以及获取参考纸质档案图像,其中,所述参考纸质档案图像具有满足预定标准的图像质量。
具体地,在所述人事档案智慧管理系统300的运行过程中,所述图像质量统计特征提取单元320,用于提取所述参考纸质档案图像的多个参考统计特征,所述多个参考统计特征包括均值、标准差、平均梯度和熵。考虑到在对于纸质档案图像的质量进行检测时,需要关注于所述纸质档案图像的质量特征信息,也就是,需要聚焦于所述纸质档案图像中的特定统计特征信息。因此,如果能够通过以所述纸质档案图像中的统计特征的隐含特征信息和所述纸质档案图像中的高维隐含特征分布信息进行相结合,显然能够提高后续对于扫描图像的质检准确性。基于此,在本申请的技术方案中,进一步提取所述参考纸质档案图像的多个参考统计特征,所述多个参考统计特征包括均值、标准差、平均梯度和熵。
具体地,在所述人事档案智慧管理系统300的运行过程中,所述统计特征编码单元330,用于将所述多个参考统计特征通过Clip模型的序列编码器以得到参考统计特征向量。在本申请的技术方案中,将所述多个参考统计特征通过Clip模型的序列编码器以得到参考统计特征向量,也就是,以所述Clip模型的序列编码器的多尺度邻域特征提取模块来对于所述多个参考统计特征进行多尺度编码,以分别提取出所述多个参考统计特征中的各个参考统计特征的多尺度邻域关联特征,从而得到参考统计特征向量。
图4图示了根据本申请实施例的人事档案智慧管理系统中统计特征编码单元的框图。如图4所示,所述统计特征编码单元330,包括:第一尺度特征提子取单元331,用于将所述参考统计特征通过Clip模型的序列编码器的第一卷积层以得到第一邻域尺度参考统计特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;第二尺度特征提取子单元332,用于将所述参考统计特征通过Clip模型的序列编码器的第二卷积层以得到第二邻域尺度参考统计特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及,多尺度特征融合子单元333,用于将所述第一邻域尺度参考统计特征向量和所述第二邻域尺度参考统计特征向量进行级联以得到所述参考统计特征向量。其中,所述第一尺度特征提子取单元,进一步用于:使用所述Clip模型的序列编码器的第一卷积层以如下公式对所述参考统计特征进行一维卷积编码以得到第一邻域尺度参考统计特征向量;
其中,所述公式为:
Figure GDA0004138635970000131
其中,a为第一卷积核在x方向上的宽度、F(a)为第一卷积核参数向量、G(x-a)为与卷积核函数运算的局部向量矩阵,w为第一卷积核的尺寸,X表示所述参考统计特征。所述第二尺度特征提取子单元,进一步用于:使用所述Clip模型的序列编码器的第二卷积层以如下公式对所述参考统计特征进行一维卷积编码以得到所述第二邻域尺度参考统计特征向量;
其中,所述公式为:
Figure GDA0004138635970000132
其中,b为第二卷积核在x方向上的宽度、F(b)为第二卷积核参数向量、G(x-b)为与卷积核函数运算的局部向量矩阵,m为第二卷积核的尺寸,X表示所述参考统计特征。
具体地,在所述人事档案智慧管理系统300的运行过程中,所述图像编码单元340,用于将所述参考纸质档案图像通过所述Clip模型的图像编码器以得到参考图像特征向量。也就是,对于所述参考纸质档案图像,将所述参考纸质档案图像通过Clip模型的图像编码器中进行图像编码处理,以提取出所述参考纸质档案图像中的局部隐含特征在高维空间中的特征分布信息,从而得到参考图像特征向量。
图5图示了根据本申请实施例的人事档案智慧管理系统中图像编码过程的流程图。如图5所示,在所述图像编码过程中,包括:S210,对输入数据进行卷积处理以得到卷积特征图;S220,对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图;以及,S230,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述Clip模型的图像编码器的最后一层的输出为所述参考图像特征向量,所述Clip模型的图像编码器的第一层的输入为所述参考纸质档案图像。
具体地,在所述人事档案智慧管理系统300的运行过程中,所述图像编码优化单元350,用于使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵。也就是,以所述Clip模型的优化编码器融合所述参考统计特征中的多尺度邻域关联特征和所述参考图像隐含特征,以此来优化所述参考纸质档案图像的特征分布质量信息的表达,从而得到优化参考图像特征矩阵。特别地,在本申请的一个具体示例中,所述Clip模型的优化编码器可以使用向量相乘的方式来对所述参考统计特征向量和所述参考图像特征向量进行优化编码。更具体地,所述图像编码优化单元,进一步用于:使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;
其中,所述公式为:
Figure GDA0004138635970000141
其中Vs表示所述参考统计特征向量,
Figure GDA0004138635970000142
表示所述参考统计特征向量的转置向量,Vb表示所述参考图像特征向量,Mb表示所述优化参考图像特征矩阵,
Figure GDA0004138635970000143
表示向量相乘。
具体地,在所述人事档案智慧管理系统300的运行过程中,所述检测档案编码单元360,用于将所述待检测纸质档案图像通过所述Clip模型以得到优化检测图像特征矩阵。也就是,将所述待检测纸质档案图像通过所述Clip模型中进行特征挖掘,以提取出所述待检测纸质档案图像中的隐含特征分布质量信息,从而得到优化检测图像特征矩阵。更具体地,在本申请的技术方案中,使用所述Clip模型的图像编码器的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行沿通道维度的池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述Clip模型的图像编码器的最后一层的输出为所述优化检测图像特征矩阵,所述Clip模型的图像编码器的第一层的输入为所述待检测纸质档案图像。
具体地,在所述人事档案智慧管理系统300的运行过程中,所述度量单元370,用于将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量。应可以理解,为了能够在高维特征空间中对于所述参考纸质档案图像和所述待检测纸质档案图像中的图像质量进行检测以此来判断扫描图像是否满足要求,需要将所述参考纸质档案图像的质量特征和所述待检测纸质档案图像的质量特征进行差异性比较来确定待检测纸质档案的扫描图像质量。具体地,在本申请的技术方案中,将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量,也就是,利用作为距离度量模型的关系网络来度量所述参考图像隐含特征和所述检测图像隐含特征之间的特征差异性来得到度量特征向量。应可以理解,这里,并非基于距离公式来进行所述优化参考图像特征矩阵和所述优化检测图像特征矩阵之间的差异度量,而是基于训练完成的关系网络作为距离度量工具来更为精准地度量所述检测图像特征和所述参考图像特征之间的差异性,以更好地进行质检。在本申请的一个具体示例中,所述度量单元,包括:使用所述基于关系网络的距离度量器的第一全连接层对所述优化检测图像特征矩阵进行全连接编码以得到检测特征向量;使用所述基于关系网络的距离度量器的第二全连接层对所述优化参考图像特征矩阵进行全连接编码以得到参考特征向量;以及,使用所述基于关系网络的距离度量器的差分层计算所述检测特征向量和所述参考特征向量的按位置差分以得到所述度量特征向量。
具体地,在所述人事档案智慧管理系统300的运行过程中,所述管理结果生成单元380,用于将所述度量特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测纸质档案图像的图像质量是否满足预定要求。也就是,将所述度量特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测纸质档案图像的图像质量是否满足预定要求。也就是,以所述度量特征向量作为分类特征向量来进行分类处理,以得到用于表示待检测纸质档案图像的图像质量是否满足预定要求的分类结果。这样,能够基于图像质量来判断扫描图像是否满足要求,以满足后续数字化应用要求。在本申请的一个具体示例中,所述管理结果生成单元,进一步用于:使用所述分类器以如下公式对所述度量特征向量进行处理以生成分类结果;其中,所述公式为:
O=softmax{(Mc,Bc)|X},其中,Mc为权重矩阵,Bc为偏置向量,X为所述度量特征向量。
应可以理解,在利用上述神经网络模型进行推断之前,需要对所述Clip模型和所述分类器进行训练。也就是说,在本申请的人事档案智慧管理系统中,还包括训练模块,用于对所述Clip模型和所述分类器进行训练。
图2图示了根据本申请实施例的人事档案智慧管理系统的框图。如图2所示,根据本申请实施例的人事档案智慧管理系统300,还包括训练模块400,所述训练模块包括:训练纸质档案图像采集单元410;训练图像质量统计特征提取单元420;训练统计特征编码单元430;训练图像编码单元440;训练图像编码优化单元450;训练检测档案编码单元460;训练度量单元470;分类损失函数值计算单元480;抑制损失函数值计算单元490;以及,训练单元500。
其中,所述训练纸质档案图像采集单元410,用于获取训练数据,所述训练数据包括训练参考纸质档案图像和训练待检测纸质档案图像,以及,所述训练待检测纸质档案图像的图像质量是否满足预定要求的真实值,其中,所述训练参考纸质档案图像具有满足预定标准的图像质量;所述训练图像质量统计特征提取单元420,用于提取所述训练参考纸质档案图像的多个训练参考统计特征,所述多个训练参考统计特征包括均值、标准差、平均梯度和熵;所述训练统计特征编码单元430,用于将所述多个训练参考统计特征通过所述Clip模型的序列编码器以得到训练参考统计特征向量;所述训练图像编码单元440,用于将所述训练参考纸质档案图像通过所述Clip模型的图像编码器以得到训练参考图像特征向量;所述训练图像编码优化单元450,用于使用所述Clip模型的优化编码器来基于所述训练参考统计特征向量对所述训练参考图像特征向量的特征编码进行优化以得到训练优化参考图像特征矩阵;所述训练检测档案编码单元460,用于将所述训练待检测纸质档案图像通过所述Clip模型以得到训练优化检测图像特征矩阵;所述训练度量单元470,用于将所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵通过所述基于关系网络的距离度量器以得到训练度量特征向量;以及,所述分类损失函数值计算单元480,用于将所述训练度量特征向量通过所述分类器以得到分类损失函数值;所述抑制损失函数值计算单元490,用于计算所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵的特征提取模式消解的抑制损失函数值;以及,所述训练单元500,用于以所述特征提取模式消解的抑制损失函数值和所述分类损失函数值的加权和作为损失函数值对所述Clip模型和所述分类器进行训练。
图6图示了根据本申请实施例的人事档案智慧管理系统中训练模块的系统架构图。如图6所示,在所述人事档案智慧管理系统300的系统架构中,在训练过程中,首先通过所述训练纸质档案图像采集单元410获取训练数据,所述训练数据包括训练参考纸质档案图像和训练待检测纸质档案图像,以及,所述训练待检测纸质档案图像的图像质量是否满足预定要求的真实值,其中,所述训练参考纸质档案图像具有满足预定标准的图像质量;所述训练图像质量统计特征提取单元420提取所述训练纸质档案图像采集单元410获取的训练参考纸质档案图像的多个训练参考统计特征,所述多个训练参考统计特征包括均值、标准差、平均梯度和熵;所述训练统计特征编码单元430将所述训练图像质量统计特征提取单元420提取的多个训练参考统计特征通过所述Clip模型的序列编码器以得到训练参考统计特征向量;接着,所述训练图像编码单元440将所述训练纸质档案图像采集单元410获取的训练参考纸质档案图像通过所述Clip模型的图像编码器以得到训练参考图像特征向量;所述训练图像编码优化单元450使用所述Clip模型的优化编码器来基于所述训练统计特征编码单元430生成的训练参考统计特征向量对所述训练图像编码单元440生成的训练参考图像特征向量的特征编码进行优化以得到训练优化参考图像特征矩阵;同时,所述训练检测档案编码单元460将所述训练纸质档案图像采集单元410获取的训练待检测纸质档案图像通过所述Clip模型以得到训练优化检测图像特征矩阵;所述训练度量单元470将所述训练图像编码优化单元450得到的训练优化参考图像特征矩阵和所述训练检测档案编码单元460得到的训练优化检测图像特征矩阵通过所述基于关系网络的距离度量器以得到训练度量特征向量;然后,所述分类损失函数值计算单元480将所述训练度量单元470生成的训练度量特征向量通过所述分类器以得到分类损失函数值;所述抑制损失函数值计算单元490计算所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵的特征提取模式消解的抑制损失函数值;进而,所述训练单元500以所述特征提取模式消解的抑制损失函数值和所述分类损失函数值的加权和作为损失函数值对所述Clip模型和所述分类器进行训练。
特别地,在本申请的技术方案中,在将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量时,期望所述优化参考图像特征矩阵和所述优化检测图像特征矩阵的特征分布尽量保持一致,以提高度量特征向量的计算的准确度。但是,由于所述优化参考图像特征矩阵和所述优化检测图像特征矩阵是通过单独的CLIP模型得到的,因此在训练过程中,分类器的分类损失函数在梯度反向传播时会分别通过所述两个分支CLIP模型,从而可能由于异常的梯度发散导致所述CLIP模型的特征提取模式的消解,从而影响所述度量特征向量的分类结果的准确性。
因此,优选地,引入针对所述优化参考图像特征矩阵和所述优化检测图像特征矩阵的特征提取模式消解的抑制损失函数,表示为:
Figure GDA0004138635970000181
Figure GDA0004138635970000182
其中V1和V2分别是所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵展开后得到的特征向量,且M1和M2分别是所述分类器对于所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵展开后得到的特征向量的权重矩阵,
Figure GDA0004138635970000183
表示向量的二范数的平方,‖·‖F表示矩阵的F范数,
Figure GDA0004138635970000184
表示按位置减法,log表示以2为底的对数函数值。
具体地,在保持所述优化参考图像特征矩阵V1和所述优化检测图像特征矩阵V2的特征分布的一致性的同时,通过进一步以交叉熵形式使得分类器相对于不同特征向量的权重矩阵的差异分布与特征向量的真实的特征差异分布保持一致,来保证梯度反向传播时的定向导数在梯度传播的分支点附近得到正则化。也就是,将梯度针对所述两个单独的CLIP模型的特征提取模式进行过加权,这样,就对特征提取模式的消解进行了抑制,提升了所述优化参考图像特征矩阵V1和所述优化检测图像特征矩阵V2的特征提取能力,也就相应提升了所述度量特征向量的分类结果的准确性。这样,能够智能且准确地对于扫描后的纸质档案图像进行质量检测,以使得扫描后的档案图像质量能够满足后续的应用需求。
综上,根据本申请实施例的人事档案智慧管理系统300被阐明,其通过采用基于深度学习的人工智能检测技术来提取出待检测纸质档案图像和参考纸质档案图像中的高维隐含特征分布信息,进一步再通过距离度量工具来度量所述待检测纸质档案图像隐含特征和所述参考纸质档案图像隐含特征之间的特征差异性,并以此来进行所述待检测纸质档案图像的质量评估。这样,能够智能且准确地对于扫描后的纸质档案图像进行质量检测,以此来判断扫描后的档案图像清晰度是否满足后续的应用需求。
如上所述,根据本申请实施例的人事档案智慧管理系统可以实现在各种终端设备中。在一个示例中,根据本申请实施例的人事档案智慧管理系统300可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该人事档案智慧管理系统300可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该人事档案智慧管理系统300同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该人事档案智慧管理系统300与该终端设备也可以是分立的设备,并且该人事档案智慧管理系统300可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性方法
图7图示了根据本申请实施例的人事档案智慧管理方法的流程图。如图7所示,根据本申请实施例的人事档案智慧管理方法,包括步骤:S110,获取参考纸质档案图像和待检测纸质档案图像,其中,所述参考纸质档案图像具有满足预定标准的图像质量;S120,提取所述参考纸质档案图像的多个参考统计特征,所述多个参考统计特征包括均值、标准差、平均梯度和熵;S130,将所述多个参考统计特征通过Clip模型的序列编码器以得到参考统计特征向量;S140,将所述参考纸质档案图像通过所述Clip模型的图像编码器以得到参考图像特征向量;S150,使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;S160,将所述待检测纸质档案图像通过所述Clip模型以得到优化检测图像特征矩阵;S170,将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量;以及,S180,将所述度量特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测纸质档案图像的图像质量是否满足预定要求。
在一个示例中,在上述人事档案智慧管理方法中,所述步骤S130,包括:将所述参考统计特征通过Clip模型的序列编码器的第一卷积层以得到第一邻域尺度参考统计特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;将所述参考统计特征通过Clip模型的序列编码器的第二卷积层以得到第二邻域尺度参考统计特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及,将所述第一邻域尺度参考统计特征向量和所述第二邻域尺度参考统计特征向量进行级联以得到所述参考统计特征向量。其中,将所述参考统计特征通过Clip模型的序列编码器的第一卷积层以得到第一邻域尺度参考统计特征向量,包括:使用所述Clip模型的序列编码器的第一卷积层以如下公式对所述参考统计特征进行一维卷积编码以得到第一邻域尺度参考统计特征向量;
其中,所述公式为:
Figure GDA0004138635970000201
其中,a为第一卷积核在x方向上的宽度、F(a)为第一卷积核参数向量、G(x-a)为与卷积核函数运算的局部向量矩阵,w为第一卷积核的尺寸,X表示所述参考统计特征。所述将所述参考统计特征通过Clip模型的序列编码器的第二卷积层以得到第二邻域尺度参考统计特征向量,包括:使用所述Clip模型的序列编码器的第二卷积层以如下公式对所述参考统计特征进行一维卷积编码以得到所述第二邻域尺度参考统计特征向量;
其中,所述公式为:
Figure GDA0004138635970000202
其中,b为第二卷积核在x方向上的宽度、F(b)为第二卷积核参数向量、G(x-b)为与卷积核函数运算的局部向量矩阵,m为第二卷积核的尺寸,X表示所述参考统计特征。
在一个示例中,在上述人事档案智慧管理方法中,所述步骤S140,包括:使用所述Clip模型的图像编码器的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述Clip模型的图像编码器的最后一层的输出为所述参考图像特征向量,所述Clip模型的图像编码器的第一层的输入为所述参考纸质档案图像。
在一个示例中,在上述人事档案智慧管理方法中,所述步骤S150,包括:使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;
其中,所述公式为:
Figure GDA0004138635970000203
其中Vs表示所述参考统计特征向量,
Figure GDA0004138635970000204
表示所述参考统计特征向量的转置向量,Vb表示所述参考图像特征向量,Mb表示所述优化参考图像特征矩阵,
Figure GDA0004138635970000205
表示向量相乘。
在一个示例中,在上述人事档案智慧管理方法中,所述步骤S170,包括:使用所述基于关系网络的距离度量器的第一全连接层对所述优化检测图像特征矩阵进行全连接编码以得到检测特征向量;使用所述基于关系网络的距离度量器的第二全连接层对所述优化参考图像特征矩阵进行全连接编码以得到参考特征向量;以及,使用所述基于关系网络的距离度量器的差分层计算所述检测特征向量和所述参考特征向量的按位置差分以得到所述度量特征向量。
在一个示例中,在上述人事档案智慧管理方法中,所述步骤S180,包括:使用所述分类器以如下公式对所述度量特征向量进行处理以生成分类结果;其中,所述公式为:
O=softmax{(Mc,Bc)|X},其中,Mc为权重矩阵,Bc为偏置向量,X为所述度量特征向量。
综上,根据本申请实施例的人事档案智慧管理方法被阐明,其通过采用基于深度学习的人工智能检测技术来提取出待检测纸质档案图像和参考纸质档案图像中的高维隐含特征分布信息,进一步再通过距离度量工具来度量所述待检测纸质档案图像隐含特征和所述参考纸质档案图像隐含特征之间的特征差异性,并以此来进行所述待检测纸质档案图像的质量评估。这样,能够智能且准确地对于扫描后的纸质档案图像进行质量检测,以此来判断扫描后的档案图像清晰度是否满足后续的应用需求。
示例性电子设备
下面,参考图8来描述根据本申请实施例的电子设备。
图8图示了根据本申请实施例的电子设备的框图。
如图8所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的人事档案智慧管理系统中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如参考统计特征向量等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图8中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性系统”部分中描述的根据本申请各种实施例的人事档案智慧管理方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性系统”部分中描述的根据本申请各种实施例的人事档案智慧管理方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (6)

1.一种人事档案智慧管理系统,其特征在于,包括:
纸质档案图像采集单元,用于获取参考纸质档案图像和待检测纸质档案图像,其中,所述参考纸质档案图像具有满足预定标准的图像质量;
图像质量统计特征提取单元,用于提取所述参考纸质档案图像的多个参考统计特征,所述多个参考统计特征包括均值、标准差、平均梯度和熵;
统计特征编码单元,用于将所述多个参考统计特征通过Clip模型的序列编码器以得到参考统计特征向量;
图像编码单元,用于将所述参考纸质档案图像通过所述Clip模型的图像编码器以得到参考图像特征向量;
图像编码优化单元,用于使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;
检测档案编码单元,用于将所述待检测纸质档案图像通过所述Clip模型以得到优化检测图像特征矩阵;
度量单元,用于将所述优化参考图像特征矩阵和所述优化检测图像特征矩阵通过基于关系网络的距离度量器以得到度量特征向量;以及
管理结果生成单元,用于将所述度量特征向量通过分类器以得到分类结果,所述分类结果用于表示待检测纸质档案图像的图像质量是否满足预定要求;
其中,所述度量单元,包括:
使用所述基于关系网络的距离度量器的第一全连接层对所述优化检测图像特征矩阵进行全连接编码以得到检测特征向量;
使用所述基于关系网络的距离度量器的第二全连接层对所述优化参考图像特征矩阵进行全连接编码以得到参考特征向量;以及
使用所述基于关系网络的距离度量器的差分层计算所述检测特征向量和所述参考特征向量的按位置差分以得到所述度量特征向量;
还包括用于对所述Clip模型和所述分类器进行训练的训练模块;
其中,所述训练模块,包括:
训练纸质档案图像采集单元,用于获取训练数据,所述训练数据包括训练参考纸质档案图像和训练待检测纸质档案图像,以及,所述训练待检测纸质档案图像的图像质量是否满足预定要求的真实值,其中,所述训练参考纸质档案图像具有满足预定标准的图像质量;
训练图像质量统计特征提取单元,用于提取所述训练参考纸质档案图像的多个训练参考统计特征,所述多个训练参考统计特征包括均值、标准差、平均梯度和熵;
训练统计特征编码单元,用于将所述多个训练参考统计特征通过所述Clip模型的序列编码器以得到训练参考统计特征向量;
训练图像编码单元,用于将所述训练参考纸质档案图像通过所述Clip模型的图像编码器以得到训练参考图像特征向量;
训练图像编码优化单元,用于使用所述Clip模型的优化编码器来基于所述训练参考统计特征向量对所述训练参考图像特征向量的特征编码进行优化以得到训练优化参考图像特征矩阵;
训练检测档案编码单元,用于将所述训练待检测纸质档案图像通过所述Clip模型以得到训练优化检测图像特征矩阵;
训练度量单元,用于将所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵通过所述基于关系网络的距离度量器以得到训练度量特征向量;以及
分类损失函数值计算单元,用于将所述训练度量特征向量通过所述分类器以得到分类损失函数值;
抑制损失函数值计算单元,用于计算所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵的特征提取模式消解的抑制损失函数值;以及
训练单元,用于以所述特征提取模式消解的抑制损失函数值和所述分类损失函数值的加权和作为损失函数值对所述Clip模型和所述分类器进行训练;
其中,所述抑制损失函数值计算单元,进一步用于:以如下公式计算所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵的所述特征提取模式消解的抑制损失函数值;
其中,所述公式为:
Figure FDA0004128408690000021
Figure FDA0004128408690000022
其中V1和V2分别是所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵展开后得到的特征向量,且M1和M2分别是所述分类器对于所述训练优化参考图像特征矩阵和所述训练优化检测图像特征矩阵展开后得到的特征向量的权重矩阵,
Figure FDA0004128408690000031
表示向量的二范数的平方,‖·‖F表示矩阵的F范数,
Figure FDA0004128408690000033
表示按位置减法,log表示以2为底的对数函数值。
2.根据权利要求1所述的人事档案智慧管理系统,其特征在于,所述统计特征编码单元,进一步用于:
第一尺度特征提取子单元,用于将所述参考统计特征通过Clip模型的序列编码器的第一卷积层以得到第一邻域尺度参考统计特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;
第二尺度特征提取子单元,用于将所述参考统计特征通过Clip模型的序列编码器的第二卷积层以得到第二邻域尺度参考统计特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及
多尺度特征融合子单元,用于将所述第一邻域尺度参考统计特征向量和所述第二邻域尺度参考统计特征向量进行级联以得到所述参考统计特征向量。
3.根据权利要求2所述的人事档案智慧管理系统,其特征在于,
所述第一尺度特征提取子单元,进一步用于:使用所述Clip模型的序列编码器的第一卷积层以如下公式对所述参考统计特征进行一维卷积编码以得到第一邻域尺度参考统计特征向量;
其中,所述公式为:
Figure FDA0004128408690000032
其中,a为第一卷积核在x方向上的宽度、F(a)为第一卷积核参数向量、G(x-a)为与卷积核函数运算的局部向量矩阵,w为第一卷积核的尺寸,X表示所述参考统计特征;
所述第二尺度特征提取子单元,进一步用于:使用所述Clip模型的序列编码器的第二卷积层以如下公式对所述参考统计特征进行一维卷积编码以得到所述第二邻域尺度参考统计特征向量;
其中,所述公式为:
Figure FDA0004128408690000041
其中,b为第二卷积核在x方向上的宽度、F(b)为第二卷积核参数向量、G(x-b)为与卷积核函数运算的局部向量矩阵,m为第二卷积核的尺寸,X表示所述参考统计特征。
4.根据权利要求3所述的人事档案智慧管理系统,其特征在于,所述图像编码单元,进一步用于:使用所述Clip模型的图像编码器的各层在层的正向传递中分别对输入数据进行:
对输入数据进行卷积处理以得到卷积特征图;
对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图;以及
对所述池化特征图进行非线性激活以得到激活特征图;
其中,所述Clip模型的图像编码器的最后一层的输出为所述参考图像特征向量,所述Clip模型的图像编码器的第一层的输入为所述参考纸质档案图像。
5.根据权利要求4所述的人事档案智慧管理系统,其特征在于,所述图像编码优化单元,进一步用于:使用所述Clip模型的优化编码器来基于所述参考统计特征向量对所述参考图像特征向量的特征编码进行优化以得到优化参考图像特征矩阵;
其中,所述公式为:
Figure FDA0004128408690000042
其中Vs表示所述参考统计特征向量,
Figure FDA0004128408690000043
表示所述参考统计特征向量的转置向量,Vb表示所述参考图像特征向量,Mb表示所述优化参考图像特征矩阵,
Figure FDA0004128408690000044
表示向量相乘。
6.根据权利要求5所述的人事档案智慧管理系统,其特征在于,所述管理结果生成单元,进一步用于:使用所述分类器以如下公式对所述度量特征向量进行处理以生成分类结果;
其中,所述公式为:
O=softmax{(Mc,Bc)|X},其中,Mc为权重矩阵,Bc为偏置向量,X为所述度量特征向量。
CN202211253424.XA 2022-10-13 2022-10-13 人事档案智慧管理系统 Active CN115620303B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211253424.XA CN115620303B (zh) 2022-10-13 2022-10-13 人事档案智慧管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211253424.XA CN115620303B (zh) 2022-10-13 2022-10-13 人事档案智慧管理系统

Publications (2)

Publication Number Publication Date
CN115620303A CN115620303A (zh) 2023-01-17
CN115620303B true CN115620303B (zh) 2023-05-09

Family

ID=84861996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211253424.XA Active CN115620303B (zh) 2022-10-13 2022-10-13 人事档案智慧管理系统

Country Status (1)

Country Link
CN (1) CN115620303B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187294B (zh) * 2023-04-24 2023-07-07 开元华创科技(集团)有限公司 信息化检测实验室电子文件快速生成方法及系统
CN116744511B (zh) * 2023-05-22 2024-01-05 杭州行至云起科技有限公司 智能调光调色照明系统及其方法
CN117648349B (zh) * 2024-01-29 2024-04-09 河北省中医院 档案调用方法及平台

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114926835A (zh) * 2022-05-20 2022-08-19 京东科技控股股份有限公司 文本生成、模型训练方法和装置
CN115115914A (zh) * 2022-06-07 2022-09-27 腾讯科技(深圳)有限公司 信息识别方法、装置以及计算机可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257572B (zh) * 2020-10-20 2022-02-01 神思电子技术股份有限公司 一种基于自我注意力机制的行为识别方法
CN113821822A (zh) * 2021-06-21 2021-12-21 腾讯科技(深圳)有限公司 图像处理方法、系统、装置、设备及存储介质
CN113963087B (zh) * 2021-10-12 2023-10-27 北京百度网讯科技有限公司 图像处理方法、图像处理模型训练方法、装置及存储介质
CN114330475A (zh) * 2021-10-29 2022-04-12 腾讯科技(深圳)有限公司 内容匹配方法、装置、设备、存储介质及计算机程序产品
CN114677185B (zh) * 2022-05-26 2022-10-18 深圳市虎瑞科技有限公司 智慧大屏广告智能推荐系统及其推荐方法
CN114782882B (zh) * 2022-06-23 2022-12-13 杭州电子科技大学 基于多模态特征融合的视频目标行为异常检测方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114926835A (zh) * 2022-05-20 2022-08-19 京东科技控股股份有限公司 文本生成、模型训练方法和装置
CN115115914A (zh) * 2022-06-07 2022-09-27 腾讯科技(深圳)有限公司 信息识别方法、装置以及计算机可读存储介质

Also Published As

Publication number Publication date
CN115620303A (zh) 2023-01-17

Similar Documents

Publication Publication Date Title
CN115620303B (zh) 人事档案智慧管理系统
JP4504702B2 (ja) 文書処理装置、文書処理方法、および文書処理プログラム
CN115203380A (zh) 基于多模态数据融合的文本处理系统及其方法
CN116797533B (zh) 电源适配器的外观缺陷检测方法及其系统
CN116015837A (zh) 用于计算机网络信息安全的入侵检测方法及系统
CN116309580B (zh) 基于磁应力的油气管道腐蚀检测方法
CN116089648B (zh) 基于人工智能的档案管理系统及方法
CN111581926A (zh) 文案生成方法、装置、设备和计算机可读存储介质
CN116343301B (zh) 基于人脸识别的人员信息智能校验系统
CN116579618B (zh) 基于风险管理的数据处理方法、装置、设备及存储介质
CN115471216B (zh) 智慧实验室管理平台的数据管理方法
CN117077075A (zh) 用于环境保护的水质监测系统及其方法
CN116308754A (zh) 一种银行信贷风险预警系统及其方法
CN112800217A (zh) 基于向量关联性矩阵的政务事务处理报告的智能评估方法
CN112465805A (zh) 用于钢筋冲压折弯的质量检测的神经网络的训练方法
CN117521641A (zh) 基于自然语言处理的文本自动校对系统及方法
CN116238125A (zh) 注射器注塑成型生产用产品质量监控方法及系统
CN116216234A (zh) 基于视频的输煤系统智能监控系统及其方法
CN114741697A (zh) 恶意代码分类方法、装置、电子设备和介质
CN112686882A (zh) 用于已架设在管道支撑架上的管道的稳定情况的检测方法
CN116187294B (zh) 信息化检测实验室电子文件快速生成方法及系统
CN111127502A (zh) 生成实例掩码的方法、装置及电子设备
CN116307446B (zh) 服装供应链管理系统
CN113850085B (zh) 企业的等级评估方法、装置、电子设备及可读存储介质
CN116821745B (zh) 智能线切割慢走丝设备的控制方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant