CN114138709A - 基于云档案一体化平台实现的馆室一体化管理 - Google Patents
基于云档案一体化平台实现的馆室一体化管理 Download PDFInfo
- Publication number
- CN114138709A CN114138709A CN202111367472.7A CN202111367472A CN114138709A CN 114138709 A CN114138709 A CN 114138709A CN 202111367472 A CN202111367472 A CN 202111367472A CN 114138709 A CN114138709 A CN 114138709A
- Authority
- CN
- China
- Prior art keywords
- information
- character
- archive
- file
- request information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于云档案一体化平台实现的馆室一体化管理,包括:基于SAAS构建覆盖区域内所有档案馆和档案室的云档案一体化平台;云档案一体化平台包括:信息采集模块,用于采集档案馆和档案室的请求信息;信息验证模块,用于对请求信息进行身份验证;数据互传模块,用于根据请求信息将档案室、档案馆的数据互传;信息反馈模块,用于根据互传结果反馈信息至档案馆和档案室;本发明以SAAS的思路,构建覆盖区域内所有馆室的档案服务平台,使档案馆和各档案室在同一平台内运营档案业务,直接有效解决多系统信息交互问题。
Description
技术领域
本发明涉及档案管理技术领域,尤其涉及一种基于云档案一体化平台实现的馆室一体化管理。
背景技术
目前,市面上的档案产品,一般为数字档案馆或数字档案室,面向的对象一般只有单个档案馆或单个档案室,忽视了馆与室之间的督导、管理关系,多馆、多室的情况极少,难以满足目前国内档案行业信息化建设的发展需求,比如分类方案、保管期限范围、档案元数据应由档案馆统一筹划;独立建设系统后需要做系统间的信息交互用以约束大多数业务功能,建设成本高,潜在问题多,操作时延长,任何一方的系统发生升级更新都必须考虑是否影响对方系统;因此,亟需一种基于云档案一体化平台实现的馆室一体化管理,用于解决独立建设系统后需要做系统间的信息交互用以约束大多数业务功能,建设成本高,潜在问题多,操作时延长,任何一方的系统发生升级更新都必须考虑是否影响对方系统的问题。
发明内容
本发明提供一种基于云档案一体化平台实现的馆室一体化管理,用于解决独立建设系统后需要做系统间的信息交互用以约束大多数业务功能,建设成本高,潜在问题多,操作时延长,任何一方的系统发生升级更新都必须考虑是否影响对方系统的问题。
一种基于云档案一体化平台实现的馆室一体化管理,包括:基于SAAS构建覆盖区域内所有档案馆和档案室的云档案一体化平台;云档案一体化平台包括:
信息采集模块,用于采集档案馆和档案室的请求信息;
信息验证模块,用于对请求信息进行身份验证;
数据互传模块,用于根据请求信息将档案室、档案馆的数据互传;
信息反馈模块,用于根据互传结果反馈信息至档案馆和档案室。
作为本发明的一种实施例,云档案一体化平台还包括:
数据存储模块,用于采集所有档案馆和档案室的数据并根据档案室的不同和档案馆的不同分别进行分类存储。
作为本发明的一种实施例,信息采集模块包括:
档案室信息采集单元,用于采集档案室发送的第一请求信息;
档案馆信息采集单元,用于采集档案馆发送的第二请求信息;
采集信息发送单元,用于将第一请求信息或第二请求信息发送至信息验证模块。
作为本发明的一种实施例,信息验证模块包括:
信息获取单元,用于获取信息采集模块采集的请求信息;
信息辨认单元,用于辨认请求信息的信息类型和采集请求信息中携带的身份信息,信息类型包括第一请求信息和第二请求信息;
信息验证单元,用于根据预存身份信息库中的身份验证信息验证请求信息是否为真实请求信息;
验证信息发送单元,用于当请求信息为真实请求信息时将请求信息发送至数据互传模块。
作为本发明的一种实施例,信息验证单元执行包括如下操作:
获取信息辨认单元辨认得到的请求信息的信息类型,确定选取的预存身份信息库的信息库类型,其中,信息库类型包括档案室信息库类型和档案馆信息库类型;
将信息辨认单元采集到的请求信息中携带的身份信息与选定信息库类型的预存身份信息库中的身份验证信息进行比对,得到比对结果。
作为本发明的一种实施例,比对过程包括:
若选定信息库类型的预存身份信息库中存在与请求信息中携带的身份信息相同的身份验证信息,则判定请求信息为真实请求信息;
否则,则判定请求信息不为真实请求信息。
作为本发明的一种实施例,数据互传模块包括:
互传请求接收单元,用于接收信息验证模块发送的为真实请求信息的请求信息;
互传请求分析单元,用于分析请求信息的互传类型和业务需求,其中,互传类型包括档案室传输至档案馆类型和档案馆传输至档案室类型;
数据调动单元,用于根据互传类型和业务需求将数据存储模块内的对应档案数据进行相应调动;
互传结果发送单元,用于当数据调动单元调动结束后发送互动结果至信息反馈模块。
作为本发明的一种实施例,信息反馈模块包括:
结果接收单元,用于接收数据互传模块发送的互传结果;
结果分析单元,用于根据互传结果生成对应的反馈信息;
信息反馈单元,用于将反馈信息反馈至对应的档案室和档案馆。
作为本发明的一种实施例,云档案一体化平台还包括:档案录入模块;
档案录入模块包括档案识别单元和档案归档单元;
档案识别单元,用于对待识别档案的档案内容进行识别,得到档案内容;
档案归档单元,用于将档案识别单元识别的档案内容进行整理归档;
档案识别单元执行包括如下操作:
获取待识别的档案,判断待识别的档案类型;档案类型包括图片档案和文字档案;
若待识别的档案类型为文字档案,将文字档案发送至档案归档单元进行整理归档;
若待识别的档案类型为图片档案,将图片档案分割为若干带有序号的文字图片;文字图片中仅包含一个文字;其中,每个文字图片的序号均不同且有规律;
获取文字识别模型;
根据文字图片和文字识别模型,获得文字识别模型的特征层的若干个输出节点分别对应的、与图片档案对应的特征图;
根据特征层对应的激活率,确定进行采样的目标分布,根据目标分布对若干个特征图进行若干次采样,得到若干采样特征图集合;采样特征图集合中包含对若干特征图进行采样后得到的采样特征图,采样特征图集合中的采样特征图符合目标分布;
将同一个采样特征图集合中的若干采样特征图进行加权求和,得到权和特征图;根据权和特征图和全卷积网络进行上采样,得到与文字图片内的文字笔画尺寸比例相同的文字预测特征图;
对文字预测特征图中的每一元素的元素值进行SOFTMAX处理,得到文字图片中每一元素对应的像素点对应的概率分布,确定文字图片对应的文字识别概率;
根据文字图片中的每一像素点确定像素点在文字识别概率的若干概率分布中对应同一文字的概率,将若干概率的平均值确定为像素点对应于同一文字的文字概率;
针对文字图片中的每一像素点将像素点对应的最大的文字概率的文字确定为该像素点对应的文字;
获取文字图片中所有像素点对应的文字,得到每个文字对应的文字概率作为第二文字概率,形成第二文字概率集,第二文字概率集中包括若干文字和与其对应的第二文字概率;若第二文字概率集中的最大的第二文字概率小于预设第二文字概率,将最大的第二文字概率对应的文字进行不确定标记后作为识别文字;
若第二文字概率集中的最大的第二文字概率大于等于预设第二文字概率,将最大的第二文字概率对应的文字作为识别文字;
将识别文字和与识别文字对应的文字图片上的序号进行关联,并根据序号将所有识别文字进行重组,得到文字档案。
档案归档单元执行包括如下操作:
获取档案识别单元发送的文字档案,判断文字档案中是否存在不确定标记;
若存在,则发送提示信息至工作人员,并将文字档案进行待修改标记;
若不存在,则将文字档案进行整理并自动归档。
作为本发明的一种实施例,档案归档单元还包括:辅助识别子单元;
辅助识别子单元,用于对文字档案中存在不确定标记的识别文字进行辅助识别;
辅助识别子单元执行包括如下操作:
确定存在不确定标记的识别文字,获取档案识别单元中识别文字对应的第二文字概率集;
获取第二文字概率集中的所有文字,将所有文字依次代替识别文字在文字档案中的位置,得到若干替换句;
将若干替换句分别输入预设的基于深度学习的语义识别模型中,得到若干第一识别结果;
基于预设的语义逻辑集合对若干第一识别结果进行语义逻辑异常判断,获取若干第一识别结果进行语义逻辑异常判断后不存在语义逻辑异常的第二识别结果;
将所有第二识别结果对应的替换句呈现给工作人员。
本发明的有益效果为:
馆室一体化,以SAAS化的思路,构建覆盖区域内所有馆室的档案服务平台,使档案馆和各档案室在同一平台内运营档案业务,馆室、配置、业务都可直接触达,比如档案馆可直接在平台内进行分类方案控制、业务督导,档案室移交数据不需进行大批量数据传输,档案馆可在同平台内直接接收,直接有效解决多系统信息交互问题。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理的云档案一体化平台示意图1;
图2为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理的云档案一体化平台示意图2;
图3为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理中信息采集模块的模块示意图;
图4为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理中信息验证模块的模块示意图;
图5为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理中信息验证单元执行操作的流程图;
图6为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理中数据互传模块的模块示意图;
图7为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理中信息反馈模块的模块示意图;
图8为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理的云档案一体化平台示意图3;
图9为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理中档案录入模块的模块示意图;
图10为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理中档案归档单元的单元示意图;
图11为本发明实施例中一种基于云档案一体化平台实现的馆室一体化管理中辅助识别子单元执行操作的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参阅图1、图2,本发明实施例提供了一种基于云档案一体化平台实现的馆室一体化管理,包括:
基于SAAS构建覆盖区域内所有档案馆和档案室的云档案一体化平台;云档案一体化平台包括:
信息采集模块1,用于采集档案馆和档案室的请求信息;
信息验证模块2,用于对请求信息进行身份验证;
数据互传模块3,用于根据请求信息将档案室、档案馆的数据互传;
信息反馈模块4,用于根据互传结果反馈信息至档案馆和档案室;
数据存储模块5,用于采集所有档案馆和档案室的数据并根据档案室的不同和档案馆的不同分别进行分类存储;
上述技术方案的工作原理为:基于SAAS(Software-as-a-Service软件即服务)的思想构建覆盖区域内所有档案馆和档案室的云档案一体化平台,使档案馆和各档案室在同一平台内运营档案业务,馆室、配置、业务都可直接触达,比如档案馆可直接在平台内进行分类方案控制、业务督导,档案室移交数据不需进行大批量数据传输,档案馆可在同平台内直接接收,该云档案一体化平台包括信息采集模块、信息验证模块、数据互传模块、信息反馈模块和数据存储模块,其中,信息采集用于采集档案馆和各档案室发送的请求信息,该请求信息包括但不限于分类方案控制、数据移交等请求信息;信息验证模块对采集到的请求信息进行身份验证,有益于提高云档案一体化平台内部数据的安全性;数据互传模块用于根据请求信息将相应档案室和档案馆的数据进行互传,此处的互传优选指的是将档案室和档案馆的数据在云档案一体化平台内进行互传,即数据依旧存储在云档案一体化平台内,只是数据存储分类产生了变化;信息反馈模块用于根据互传结果反馈信息至档案馆和档案室,反馈的信息包括但不限于请求已执行信息、请求驳回信息等反馈信息;数据存储模块用于采集所有档案馆和档案室的数据并根据档案室的不同和档案馆的不同分别进行分类存储,即从哪一个档案室或档案馆采集到的信息则单独建立一个存储分类用于存储该档案室或档案馆的信息;采集操作优选为实时操作;
上述技术方案的有益效果为:通过云档案一体化平台有益于解决多系统信息交互问题。
请参阅图3,在一个实施例中,信息采集模块1包括:
档案室信息采集单元101,用于采集档案室发送的第一请求信息;
档案馆信息采集单元102,用于采集档案馆发送的第二请求信息;
采集信息发送单元103,用于将第一请求信息或第二请求信息发送至信息验证模块2;
上述技术方案的工作原理和有益效果为:档案室和档案馆发送的请求信息种类存在区别,如档案馆发送的请求信息一般为分类方案控制请求信息、业务督导请求信息等信息,而档案室发送的请求信息一般为数据移交请求信息等信息,分别建立档案室信息采集单元和档案馆信息采集单元,对档案室和档案馆的请求信息分别进行采集,有益于减少采集请求信息时发生采集错误的可能性。
请参阅图4、图5,在一个实施例中,信息验证模块2包括:
信息获取单元201,用于获取信息采集模块采集的请求信息;
信息辨认单元202,用于辨认请求信息的信息类型和采集请求信息中携带的身份信息,信息类型包括第一请求信息和第二请求信息;
信息验证单元203,用于根据预存身份信息库中的身份验证信息验证请求信息是否为真实请求信息;
验证信息发送单元204,用于当请求信息为真实请求信息时将请求信息发送至数据互传模块;
更进一步地,信息验证单元203执行包括如下操作:
S2031:获取信息辨认单元辨认得到的请求信息的信息类型,确定选取的预存身份信息库的信息库类型,其中,信息库类型包括档案室信息库类型和档案馆信息库类型;
S2032:将信息辨认单元采集到的请求信息中携带的身份信息与选定信息库类型的预存身份信息库中的身份验证信息进行比对,得到比对结果;
S2033:若选定信息库类型的预存身份信息库中存在与请求信息中携带的身份信息相同的身份验证信息,则判定请求信息为真实请求信息;
S2034:若选定信息库类型的预存身份信息库中不存在与请求信息中携带的身份信息相同的身份验证信息,则判定请求信息不为真实请求信息;
上述技术方案的工作原理和有益效果为:信息验证模块用于验证获取到的请求信息是否为区域内档案室或档案馆真实发送出来的请求信息,保障云档案一体化平台内部档案数据的安全性;信息验证模块包括信息获取单元,信息辨认单元,信息验证单元,验证信息发送单元;信息获取单元用于获取信息采集模块采集的请求信息;信息辨认单元用于辨认请求信息的信息类型和采集请求信息中携带的身份信息,信息类型包括第一请求信息和第二请求信息,身份信息优选为每个档案馆或档案室预先设置好的编码信息,每个编码信息均不同且仅对应一个档案室或档案馆;信息验证单元用于根据预存身份信息库中的身份验证信息验证请求信息是否为真实请求信息,优选的,预存身份信息库中包含的身份验证信息即所有的编码信息;信息验证单元执行包括如下操作:获取信息辨认单元辨认得到的请求信息的信息类型,确定选取的预存身份信息库的信息库类型,其中,信息库类型包括档案室信息库类型和档案馆信息库类型;档案室信息库类型优选存储有区域内所有档案室的编码信息,档案馆信息库类型优选存储有区域内所有档案馆的编码信息,将信息库类型进行分类有益于提高信息验证单元验证效率;将信息辨认单元采集到的请求信息中携带的身份信息与选定信息库类型的预存身份信息库中的身份验证信息进行比对,得到比对结果;若选定信息库类型的预存身份信息库中存在与请求信息中携带的身份信息相同的身份验证信息,则判定请求信息为真实请求信息;否则,则判定请求信息不为真实请求信息;验证信息发送单元用于当请求信息为真实请求信息时将请求信息发送至数据互传模块。
请参阅图6,在一个实施例中,数据互传模块3包括:
互传请求接收单元301,用于接收信息验证模块2发送的为真实请求信息的请求信息;
互传请求分析单元302,用于分析请求信息的互传类型和业务需求,其中,互传类型包括档案室传输至档案馆类型和档案馆传输至档案室类型;
数据调动单元303,用于根据互传类型和业务需求将数据存储模块内的对应档案数据进行相应调动;
互传结果发送单元304,用于当数据调动单元303调动结束后发送互动结果至信息反馈模块;
上述技术方案的工作原理和有益效果为:数据互传模块包括互传请求接收单元、互传请求分析单元、数据调动单元和互动结果发送单元;其中,互传请求接收单元用于接收信息验证模块发送的为真实请求信息的请求信息;互传请求分析单元用于分析请求信息的互传类型和业务需求,其中,互传类型包括档案室传输至档案馆类型和档案馆传输至档案室类型,业务需求包括但不限于分类方案控制、业务督导、数据移交、保管期限范围筹划等;数据调动单元用于根据互传类型和业务需求将数据存储模块内的对应档案数据进行相应调动,例如互传类型为档案室传输至档案馆类型、业务需求为档案元数据移交,则将对应需要移交的档案室中的元数据移交至对应档案馆进行存储;互传结果发送单元用于当数据调动单元调动结束后发送互动结果至信息反馈模块,互动结果包括请求信息已执行等结果;基于数据互传模块,使得各档案室和档案馆之间的信息交互可以直接进行,且操作时延短,建设成本低。
请参阅图7,在一个实施例中,信息反馈模块4包括:
结果接收单元401,用于接收数据互传模块发送的互传结果;
结果分析单元402,用于根据互传结果生成对应的反馈信息;
信息反馈单元403,用于将反馈信息反馈至对应的档案室和档案馆;
上述技术方案的工作原理和有益效果为:信息反馈模块根据互传结果生成对应的反馈信息至对应的档案室和档案馆,如根据请求信息已执行的互传结果生成请求信息已执行的反馈信息至对应的档案室和档案馆,完善信息交互的过程,使得档案室和档案馆的每次操作都能得到回应,有效避免工作人员不确定请求是否执行从而发送重复请求信息。
请参阅图8、图9,在一个实施例中,云档案一体化平台还包括:档案录入模块6;
档案录入模块包括档案识别单元601和档案归档单元602;
档案识别单元601,用于对待识别档案的档案内容进行识别,得到档案内容;
档案归档单元602,用于将档案识别单元识别的档案内容进行整理归档;
档案识别单元601执行包括如下操作:
获取待识别的档案,判断待识别的档案类型;档案类型包括图片档案和文字档案;
若待识别的档案类型为文字档案,将文字档案发送至档案归档单元进行整理归档;
若待识别的档案类型为图片档案,将图片档案分割为若干带有序号的文字图片;文字图片中仅包含一个文字;其中,每个文字图片的序号均不同且有规律;
获取文字识别模型;
根据文字图片和文字识别模型,获得文字识别模型的特征层的若干个输出节点分别对应的、与图片档案对应的特征图;
根据特征层对应的激活率,确定进行采样的目标分布,根据目标分布对若干个特征图进行若干次采样,得到若干采样特征图集合;采样特征图集合中包含对若干特征图进行采样后得到的采样特征图,采样特征图集合中的采样特征图符合目标分布;
将同一个采样特征图集合中的若干采样特征图进行加权求和,得到权和特征图;根据权和特征图和全卷积网络进行上采样,得到与文字图片内的文字笔画尺寸比例相同的文字预测特征图;
对文字预测特征图中的每一元素的元素值进行SOFTMAX处理,得到文字图片中每一元素对应的像素点对应的概率分布,确定文字图片对应的文字识别概率;
根据文字图片中的每一像素点确定像素点在文字识别概率的若干概率分布中对应同一文字的概率,将若干概率的平均值确定为像素点对应于同一文字的文字概率;
针对文字图片中的每一像素点将像素点对应的最大的文字概率的文字确定为该像素点对应的文字;
获取文字图片中所有像素点对应的文字,得到每个文字对应的文字概率作为第二文字概率,形成第二文字概率集,第二文字概率集中包括若干文字和与其对应的第二文字概率;若第二文字概率集中的最大的第二文字概率小于预设第二文字概率,将最大的第二文字概率对应的文字进行不确定标记后作为识别文字;
若第二文字概率集中的最大的第二文字概率大于等于预设第二文字概率,将最大的第二文字概率对应的文字作为识别文字;
将识别文字和与识别文字对应的文字图片上的序号进行关联,并根据序号将所有识别文字进行重组,得到文字档案。
档案归档单元602执行包括如下操作:
获取档案识别单元发送的文字档案,判断文字档案中是否存在不确定标记;
若存在,则发送提示信息至工作人员,并将文字档案进行待修改标记;
若不存在,则将文字档案进行整理并自动归档;
上述技术方案的工作原理为:档案录入模块包括档案识别单元和档案归档单元,档案识别单元,用于对待识别档案的档案内容进行识别,得到档案内容;档案归档单元,用于将档案识别单元识别的档案内容进行整理归档;其中,档案识别单元执行包括如下操作:获取待识别的档案,判断待识别的档案类型;档案类型包括图片档案和文字档案;若待识别的档案类型为文字档案,将文字档案发送至档案归档单元进行整理归档;若待识别的档案类型为图片档案,将图片档案分割为若干带有序号的文字图片;文字图片中仅包含一个文字;其中,每个文字图片的序号均不同且有规律,每张文字图片优选为单位为1的正方形图片;获取文字识别模型;根据文字图片和文字识别模型,获得文字识别模型的特征层的若干个输出节点分别对应的、与图片档案对应的特征图;根据特征层对应的激活率,确定进行采样的目标分布,优选的,该目标分布优选为伯努利分布,在该激活率w确定的情况下,该目标分布可以表示为Bernoulli(1-w);根据目标分布对若干个特征图进行若干次采样,得到若干采样特征图集合;更进一步地,得到采样特征图集合的方法优选为gx=σ(gy-1|fx,hx),fx~Bernoulli(1-w);其中,gx为采样特征图集合,gy-1为表征该特征层的对应的多个特征图,fx为表示特征层对应的权重,hx为表示特征层对应的dorpout的掩码,σ为(gy-1|fx,hx)的σ域;该采样特征图集合中包含对若干特征图进行采样后得到的采样特征图,采样特征图集合中的采样特征图符合目标分布;将同一个采样特征图集合中的若干采样特征图进行加权求和,得到权和特征图;根据权和特征图和全卷积网络进行上采样,得到与文字图片内的文字笔画尺寸比例相同的文字预测特征图;优选的,在全卷积网络中,基于卷积神经网络中的最后一个全连接层被替换为卷积层,采用卷积层对最后一个卷积神经网络中的最后一个卷积层的特征图进行上采样,使该特征图恢复到输入图片相同的尺寸,即获得该文字预测特征图;对文字预测特征图中的每一元素的元素值进行SOFTMAX处理,得到文字图片中每一元素对应的像素点对应的概率分布,确定文字图片对应的文字识别概率;根据文字图片中的每一像素点确定像素点在文字识别概率的若干概率分布中对应同一文字的概率,将若干概率的平均值确定为像素点对应于同一文字的文字概率;针对文字图片中的每一像素点将像素点对应的最大的文字概率的文字确定为该像素点对应的文字;获取文字图片中所有像素点对应的文字,得到每个文字对应的文字概率作为第二文字概率,形成第二文字概率集,第二文字概率集中包括若干文字和与其对应的第二文字概率;若第二文字概率集中的最大的第二文字概率小于预设第二文字概率,将最大的第二文字概率对应的文字进行不确定标记后作为识别文字;若第二文字概率集中的最大的第二文字概率大于等于预设第二文字概率,将最大的第二文字概率对应的文字作为识别文字;其中,预设第二文字概率优选为80%;将识别文字和与识别文字对应的文字图片上的序号进行关联,并根据序号将所有识别文字进行重组,得到文字档案;档案归档单元执行包括如下操作:获取档案识别单元发送的文字档案,判断文字档案中是否存在不确定标记;若存在,则发送提示信息至工作人员,并将文字档案进行待修改标记;若不存在,则将文字档案进行整理并自动归档;
上述技术方案的有益效果为:当手写档案需要录入云档案一体化平台时,依靠人工识别键入的方式效率低下且费时费力,但因手写档案的字体与标准字体存在差异,导致机器识别正确率低,从而导致录入档案的完整性较低;通过档案录入模块,结合机器识别和人工识别,对手写档案中识别出来的文字进行文字概率判断,将机器识别手写档案中存在识别精度不高的文字进行不确定标记,便于后续人工识别处理,相较于全人工识别有益于提高档案录入效率,相较于全机器识别有益于提高档案录入的完整性和正确率。
请参阅图10、图11,在一个实施例中,档案归档单元602还包括:辅助识别子单元6021;
辅助识别子单元6021,用于对文字档案中存在不确定标记的识别文字进行辅助识别;
辅助识别子单元6021执行包括如下操作:
S60211:确定存在不确定标记的识别文字,获取档案识别单元中识别文字对应的第二文字概率集;
S60212:获取第二文字概率集中的所有文字,将所有文字依次代替识别文字在文字档案中的位置,得到若干替换句;
S60213:将若干替换句分别输入预设的基于深度学习的语义识别模型中,得到若干第一识别结果;
S60214:基于预设的语义逻辑集合对若干第一识别结果进行语义逻辑异常判断,获取若干第一识别结果进行语义逻辑异常判断后不存在语义逻辑异常的第二识别结果;
S60215:将所有第二识别结果对应的替换句呈现给工作人员;
上述技术方案的工作原理为:档案归档单元还包括:辅助识别子单元;辅助识别子单元,用于对文字档案中存在不确定标记的识别文字进行辅助识别;辅助识别子单元执行包括如下操作:确定存在不确定标记的识别文字,获取档案识别单元中识别文字对应的第二文字概率集;获取第二文字概率集中的所有文字,将所有文字依次代替识别文字在文字档案中的位置,得到若干替换句;将若干替换句分别输入预设的基于深度学习的语义识别模型中,得到若干第一识别结果;其中,基于深度学习的语义识别模型的构建为本领域中的常规技术,在此不再赘述;基于预设的语义逻辑集合对若干第一识别结果进行语义逻辑异常判断,获取若干第一识别结果进行语义逻辑异常判断后不存在语义逻辑异常的第二识别结果;将所有第二识别结果对应的替换句呈现给工作人员,便于工作人员进行识别;
上述技术方案的有益效果为:当工作人员对文字档案中存在不确定文字进行识别时,当该文字档案对应的图片档案中该文字的字体过于潦草导致工作人员也无法准确识别时,通过辅助识别子单元,向工作人员提高多个对于该文字的可能性结果,便于工作人员快速准确识别该文字,提高档案录入效率和档案录入准确性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种基于云档案一体化平台实现的馆室一体化管理,其特征在于,包括:基于SAAS构建覆盖区域内所有档案馆和档案室的云档案一体化平台;所述云档案一体化平台包括:
信息采集模块,用于采集档案馆和档案室的请求信息;
信息验证模块,用于对请求信息进行身份验证;
数据互传模块,用于根据请求信息将档案室、档案馆的数据互传;
信息反馈模块,用于根据互传结果反馈信息至档案馆和档案室。
2.根据权利要求1所述的一种基于云档案一体化平台实现的馆室一体化管理,其特征在于,所述云档案一体化平台还包括:
数据存储模块,用于采集所有档案馆和档案室的数据并根据档案室的不同和档案馆的不同分别进行分类存储。
3.根据权利要求1所述的一种基于云档案一体化平台实现的馆室一体化管理,其特征在于,所述信息采集模块包括:
档案室信息采集单元,用于采集档案室发送的第一请求信息;
档案馆信息采集单元,用于采集档案馆发送的第二请求信息;
采集信息发送单元,用于将所述第一请求信息或所述第二请求信息发送至所述信息验证模块。
4.根据权利要求1所述的一种基于云档案一体化平台实现的馆室一体化管理,其特征在于,所述信息验证模块包括:
信息获取单元,用于获取所述信息采集模块采集的请求信息;
信息辨认单元,用于辨认所述请求信息的信息类型和采集所述请求信息中携带的身份信息,所述信息类型包括第一请求信息和第二请求信息;
信息验证单元,用于根据预存身份信息库中的身份验证信息验证所述请求信息是否为真实请求信息;
验证信息发送单元,用于当所述请求信息为真实请求信息时将所述请求信息发送至所述数据互传模块。
5.根据权利要求4所述的一种基于云档案一体化平台实现的馆室一体化管理,其特征在于,所述信息验证单元执行包括如下操作:
获取所述信息辨认单元辨认得到的所述请求信息的信息类型,确定选取的预存身份信息库的信息库类型,其中,所述信息库类型包括档案室信息库类型和档案馆信息库类型;
将所述信息辨认单元采集到的所述请求信息中携带的身份信息与选定信息库类型的预存身份信息库中的身份验证信息进行比对,得到比对结果。
6.根据权利要求5所述的一种基于云档案一体化平台实现的馆室一体化管理,其特征在于,比对过程包括:
若所述选定信息库类型的预存身份信息库中存在与所述请求信息中携带的身份信息相同的身份验证信息,则判定所述请求信息为真实请求信息;
否则,则判定所述请求信息不为真实请求信息。
7.根据权利要求1所述的一种基于云档案一体化平台实现的馆室一体化管理,其特征在于,所述数据互传模块包括:
互传请求接收单元,用于接收信息验证模块发送的为真实请求信息的请求信息;
互传请求分析单元,用于分析请求信息的互传类型和业务需求,其中,所述互传类型包括档案室传输至档案馆类型和档案馆传输至档案室类型;
数据调动单元,用于根据所述互传类型和所述业务需求将数据存储模块内的对应档案数据进行相应调动;
互传结果发送单元,用于当数据调动单元调动结束后发送互动结果至信息反馈模块。
8.根据权利要求1所述的一种基于云档案一体化平台实现的馆室一体化管理,其特征在于,所述信息反馈模块包括:
结果接收单元,用于接收所述数据互传模块发送的互传结果;
结果分析单元,用于根据所述互传结果生成对应的反馈信息;
信息反馈单元,用于将所述反馈信息反馈至对应的档案室和档案馆。
9.根据权利要求1所述的一种基于云档案一体化平台实现的馆室一体化管理,其特征在于,所述云档案一体化平台还包括:档案录入模块;
所述档案录入模块包括档案识别单元和档案归档单元;
所述档案识别单元,用于对待识别档案的档案内容进行识别,得到档案内容;
所述档案归档单元,用于将所述档案识别单元识别的档案内容进行整理归档;
所述档案识别单元执行包括如下操作:
获取待识别的档案,判断待识别的档案类型;所述档案类型包括图片档案和文字档案;
若所述待识别的档案类型为文字档案,将所述文字档案发送至档案归档单元进行整理归档;
若所述待识别的档案类型为图片档案,将所述图片档案分割为若干带有序号的文字图片;所述文字图片中仅包含一个文字;其中,每个文字图片的序号均不同且有规律;
获取文字识别模型;
根据所述文字图片和所述文字识别模型,获得所述文字识别模型的特征层的若干个输出节点分别对应的、与所述图片档案对应的特征图;
根据所述特征层对应的激活率,确定进行采样的目标分布,根据所述目标分布对若干个所述特征图进行若干次采样,得到若干采样特征图集合;所述采样特征图集合中包含对若干特征图进行采样后得到的采样特征图,所述采样特征图集合中的采样特征图符合所述目标分布;
将同一个所述采样特征图集合中的若干采样特征图进行加权求和,得到权和特征图;根据所述权和特征图和全卷积网络进行上采样,得到与所述文字图片内的文字笔画尺寸比例相同的文字预测特征图;
对所述文字预测特征图中的每一元素的元素值进行SOFTMAX处理,得到所述文字图片中每一元素对应的像素点对应的概率分布,确定所述文字图片对应的文字识别概率;
根据所述文字图片中的每一像素点确定所述像素点在所述文字识别概率的若干概率分布中对应同一文字的概率,将若干所述概率的平均值确定为所述像素点对应于所述同一文字的文字概率;
针对所述文字图片中的每一像素点将所述像素点对应的最大的文字概率的文字确定为该像素点对应的文字;
获取所述文字图片中所有像素点对应的文字,得到每个文字对应的文字概率作为第二文字概率,形成第二文字概率集,所述第二文字概率集中包括若干文字和与其对应的第二文字概率;若所述第二文字概率集中的最大的第二文字概率小于预设第二文字概率,将所述最大的第二文字概率对应的文字进行不确定标记后作为识别文字;
若所述第二文字概率集中的最大的第二文字概率大于等于预设第二文字概率,将所述最大的第二文字概率对应的文字作为识别文字;
将识别文字和与所述识别文字对应的文字图片上的序号进行关联,并根据所述序号将所有识别文字进行重组,得到文字档案。
所述档案归档单元执行包括如下操作:
获取所述档案识别单元发送的文字档案,判断所述文字档案中是否存在不确定标记;
若存在,则发送提示信息至工作人员,并将所述文字档案进行待修改标记;
若不存在,则将所述文字档案进行整理并自动归档。
10.根据权利要求9所述的一种基于云档案一体化平台实现的馆室一体化管理,其特征在于,所述档案归档单元还包括:辅助识别子单元;
所述辅助识别子单元,用于对文字档案中存在不确定标记的识别文字进行辅助识别;
所述辅助识别子单元执行包括如下操作:
确定所述存在不确定标记的识别文字,获取所述档案识别单元中所述识别文字对应的第二文字概率集;
获取所述第二文字概率集中的所有文字,将所有文字依次代替所述识别文字在所述文字档案中的位置,得到若干替换句;
将所述若干替换句分别输入预设的基于深度学习的语义识别模型中,得到若干第一识别结果;
基于预设的语义逻辑集合对若干所述第一识别结果进行语义逻辑异常判断,获取若干所述第一识别结果进行语义逻辑异常判断后不存在语义逻辑异常的第二识别结果;
将所有所述第二识别结果对应的替换句呈现给工作人员。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111367472.7A CN114138709A (zh) | 2021-11-18 | 2021-11-18 | 基于云档案一体化平台实现的馆室一体化管理 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111367472.7A CN114138709A (zh) | 2021-11-18 | 2021-11-18 | 基于云档案一体化平台实现的馆室一体化管理 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114138709A true CN114138709A (zh) | 2022-03-04 |
Family
ID=80390493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111367472.7A Pending CN114138709A (zh) | 2021-11-18 | 2021-11-18 | 基于云档案一体化平台实现的馆室一体化管理 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114138709A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115796793A (zh) * | 2022-12-12 | 2023-03-14 | 中国水利水电科学研究院 | 一种档案数字化转化及管理方法、系统及存储介质 |
-
2021
- 2021-11-18 CN CN202111367472.7A patent/CN114138709A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115796793A (zh) * | 2022-12-12 | 2023-03-14 | 中国水利水电科学研究院 | 一种档案数字化转化及管理方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109815339B (zh) | 基于TextCNN知识抽取方法、装置、计算机设备及存储介质 | |
WO2020000688A1 (zh) | 财务风险验证处理方法、装置、计算机设备及存储介质 | |
CN111695439A (zh) | 图像结构化数据提取方法、电子装置及存储介质 | |
CN112861648B (zh) | 文字识别方法、装置、电子设备及存储介质 | |
US11475055B2 (en) | Artificial intelligence based method and apparatus for determining regional information | |
CN110166522B (zh) | 服务器识别方法、装置、可读存储介质和计算机设备 | |
CN102654874A (zh) | 单据数据管理方法及系统 | |
CN112380870A (zh) | 用户意图分析方法、装置、电子设备及计算机存储介质 | |
CN106898173A (zh) | 学生作业在线实时审阅系统 | |
CN115130711A (zh) | 一种数据处理方法、装置、计算机及可读存储介质 | |
CN113570286A (zh) | 基于人工智能的资源分配方法、装置、电子设备及介质 | |
CN111260214B (zh) | 核电站预留工单领料方法、装置、设备及存储介质 | |
CN113723926A (zh) | 结合rpa和ai的银行流水处理方法、装置及电子设备 | |
CN114138709A (zh) | 基于云档案一体化平台实现的馆室一体化管理 | |
CN114282882B (zh) | 素材工单审核方法、装置、设备及存储介质 | |
US11754748B2 (en) | Temperature prediction system | |
CN109063155B (zh) | 语言模型参数确定方法、装置和计算机设备 | |
CN110929032A (zh) | 一种软件系统的用户需求处理系统及处理方法 | |
CN117911039A (zh) | 售后服务系统的控制方法、设备及存储介质 | |
CN116340516A (zh) | 实体关系的聚类提取方法、装置、设备及存储介质 | |
CN112182413B (zh) | 一种基于教学大数据的智能推荐方法及服务器 | |
CN113901817A (zh) | 文档分类方法、装置、计算机设备和存储介质 | |
CN112884440A (zh) | 核电试验中的试验工序执行方法、装置和计算机设备 | |
CN113221984A (zh) | 用户酒驾行为分析预测方法、装置、设备及存储介质 | |
CN111984777A (zh) | 基于自然语言处理的生产系统上报问题处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |