CN117453852B - 基于云端存储的档案更新管理方法 - Google Patents
基于云端存储的档案更新管理方法 Download PDFInfo
- Publication number
- CN117453852B CN117453852B CN202311794832.0A CN202311794832A CN117453852B CN 117453852 B CN117453852 B CN 117453852B CN 202311794832 A CN202311794832 A CN 202311794832A CN 117453852 B CN117453852 B CN 117453852B
- Authority
- CN
- China
- Prior art keywords
- classification
- keywords
- determining
- accuracy
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 238000012216 screening Methods 0.000 claims description 25
- 238000011156 evaluation Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000011160 research Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Library & Information Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于云端存储的档案更新管理方法,属于档案管理技术领域,具体包括:获取云端存储的不同的分类号下的电子档案,并根据电子档案的关键词的提取结果进行不同的分类号下的待选关键词的确定,获取待选关键词在不同的分类号下的匹配的档案的数量以及匹配可信度,并结合待选关键词的匹配的可信电子档案进行待选关键词在不同的分类号下的分类准确率的确定,基于分类准确率进行可信关键词以及可信关键词的匹配分类号的确定,并根据不同档案与待选关键词和可信关键词的匹配情况进行不同档案的档案分类准确率以及问题分类档案的确定,基于问题分类档案输出更新建议,从而进一步实现了对档案的可靠更新。
Description
技术领域
本发明属于档案管理技术领域,尤其涉及一种基于云端存储的档案更新管理方法。
背景技术
档案管理机构随着管理年限的增加,其内部存储和管理档案的数量日益庞大,随着档案量的增加,不免会存在档案分类区域不准确的问题,因此如何实现对档案的存储问题的识别并自动更新成为亟待解决的技术问题。
为了解决上述技术问题,现有技术方案中往往需要通过人工排查的方式进行实现,不仅处理效率难以满足要求,同时随着档案数量的增加,也使得对档案的存储问题的识别变成难以完成的工作任务。
为解决云端存储的电子档案的存储问题的识别和更新处理的技术问题,本发明提供了一种基于云端存储的档案更新管理方法。
发明内容
为实现本发明目的,本发明采用如下技术方案:
根据本发明的一个方面,提供了一种基于云端存储的档案更新管理方法。
一种基于云端存储的档案更新管理方法,其特征在于,具体包括:
S1获取云端存储的不同的电子档案的检索记录,并根据所述检索记录进行包含分类号的检索条件的检索记录的确定,将其作为匹配检索记录;
S2将所述匹配检索记录的分类号作为检索分类号,基于不同的匹配检索记录的电子档案的浏览数据和借阅数据确定所述电子档案在所述检索分类号下的分类可信度,利用分类可信度进行可信电子档案的确定;
S3获取云端存储的不同的分类号下的电子档案,并根据所述电子档案的关键词的提取结果进行不同的分类号下的待选关键词的确定,获取所述待选关键词在不同的分类号下的匹配的电子档案的匹配可信度,并结合所述待选关键词的匹配的可信电子档案确定所述待选关键词在不同的分类号下的分类准确率;
S4基于所述分类准确率进行可信关键词以及可信关键词的匹配分类号的确定,并根据与所述待选关键词和可信关键词的匹配情况确定电子档案的档案分类准确率,通过档案分类准确率进行问题分类档案的认定和更新建议的输出。
本发明的有益效果在于:
1、通过基于不同的匹配检索记录的电子档案的浏览数据和借阅数据进行电子档案在检索分类号下的分类可信度以及可信电子档案的确定,从而实现了从含有检索分类号的检索记录的角度对电子档案的分类可信度的评估,充分考虑到由于分类准确与否导致的检索结果的匹配准确性的差异,实现了对分类准确的可信电子档案的准确筛选。
2、通过结合待选关键词的匹配的可信电子档案进行待选关键词在不同的分类号下的分类准确率的确定,既考虑到不同的待选关键词的匹配的电子档案的数量以及匹配可信度,同时还考虑到可信电子档案的数量导致的匹配准确性的差异,实现了不同的待选关键词的分类准确情况的准确评估。
3、通过根据不同档案与待选关键词和可信关键词的匹配情况进行不同档案的档案分类准确率以及问题分类档案的确定,实现了从不同档案的关键词的匹配结果对档案分类准确率的评估,充分考虑到不同的档案的关键词由于与待选关键词以及可信关键词的匹配情况,实现了对问题分类档案的筛选,从而为实现对问题分类档案的更新管理奠定了基础。
进一步的技术方案在于,所述浏览检索记录根据电子档案管理系统的历史检索数据进行确定。
进一步的技术方案在于,所述分类号根据所述档案分类标引规则或者电子档案管理机构的内部分类规则进行确定。
进一步的技术方案在于,根据所述电子档案的关键词的提取结果进行不同的分类号下的待选关键词的确定,具体包括:
根据电子档案的关键词的提取结果进行所述分类号下的关键词的匹配的档案的数量的确定,并基于所述匹配的档案的数量以及所述分类号下的电子档案的数量的比值进行所述待选关键词的确定。
进一步的技术方案在于,所述待选关键词在所述分类号下的分类准确率的取值范围在0到1之间,其中所述待选关键词在所述分类号下的分类准确率越高,则所述待选关键词在所述分类号下的分类结果越准确。
第二方面,本发明提供了一种基于云端存储的档案更新管理系统,采用上述的一种基于云端存储的档案更新管理方法,其特征在于,具体包括:
检索记录筛选模块,档案区分模块,准确率评估模块,档案分类模块;
所述检索记录筛选模块负责获取云端存储的不同的电子档案的检索记录,并根据所述检索记录进行包含分类号的检索条件的检索记录的确定,将其作为匹配检索记录;
所述档案区分模块负责将所述匹配检索记录的分类号作为检索分类号,基于不同的匹配检索记录的电子档案的浏览数据和借阅数据进行所述电子档案在所述检索分类号下的分类可信度以及可信电子档案的确定;
所述准确率评估模块负责获取云端存储的不同的分类号下的电子档案,并根据所述电子档案的关键词的提取结果进行不同的分类号下的待选关键词的确定,获取所述待选关键词在不同的分类号下的匹配的档案的数量以及匹配可信度,并结合所述待选关键词的匹配的可信电子档案进行所述待选关键词在不同的分类号下的分类准确率的确定;
所述档案分类模块负责基于所述分类准确率进行可信关键词以及可信关键词的匹配分类号的确定,并根据不同档案与所述待选关键词和所述可信关键词的匹配情况进行不同档案的档案分类准确率以及问题分类档案的确定,基于所述问题分类档案输出更新建议。
其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显;
图1是一种基于云端存储的档案更新管理方法的流程图;
图2是电子档案在检索分类号下的分类可信度的确定的方法的流程图;
图3是待选关键词在分类号下的分类准确率的确定的方法的流程图;
图4是档案的档案分类准确率的确定的方法的流程图;
图5是一种基于云端存储的档案更新管理系统的框架图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
现有的电子档案在进行存储时,往往有其对应的分类号,从而提升电子档案的检索效率,但是一旦电子档案的分类号确定后,一般无法进行更新管理,特别是电子档案的存档数量较多时,此时进行电子档案的分类号的更新管理,通过人力的方式根本无法完成更新任务,因此如何实现对分类号存在问题的电子档案的识别并进行更新管理成为亟待解决的技术问题。
为了解决上述技术问题,采用以下技术方案:
首先不同的电子档案的检索记录,并根据检索记录进行包含分类号的检索条件的检索记录的确定,将其作为匹配检索记录;
然后将匹配检索记录的分类号作为检索分类号,基于不同的匹配检索记录的电子档案的浏览数据和借阅数据进行电子档案在检索分类号下的分类可信度以及可信电子档案的确定,具体的可以通过匹配检索记录中存在浏览或者借阅的数量与匹配检索记录的数量的比值进行电子档案在检索分类号下的分类可信度的确定,并将分类可信度较高的电子档案作为可信电子档案;
然后获取云端存储的不同的分类号下的电子档案,并根据电子档案的关键词的提取结果将分类号下的关键词的匹配的电子档案的数量较多的关键词作为待选关键词,并根据待选关键词在不同的分类号下的匹配的档案的数量以及匹配可信度、待选关键词的匹配的可信电子档案进行待选关键词在不同的分类号下的分类准确率的确定,具体的可以通过匹配的可信电子档案的比例与匹配可信度的平均值的乘积进行待选关键词在不同的分类号下的分类准确率的确定;
最后将分类准确率较高的作为可信关键词,并将其对应的分类号作为匹配分类号,并根据不同档案与待选关键词和可信关键词的匹配情况进行不同档案的档案分类准确率以及问题分类档案的确定,具体的可以通过可信关键词的匹配的数量以及待选关键词的匹配的数量进行档案分类准确率,并将档案分类准确率存在问题的电子档案作为问题分类档案,并根据问题分类档案进行输出,并根据问题分类档案的关键词的匹配情况进行建议分类号的输出,从而进行分类号的更新处理。
具体的,在其中的一个档案管理机构中,档案的分类包括科技档案、文书档案、科研档案、基建档案、设备档案、人事档案、干部人事档案、会计档案等,现有的档案在接收处理时,例如《实行负面清单的管理制度的指导意见》,由于其对应的是科研管理的负面清单的管理制度,因此本质上应该将其划分至科技档案,但是在接收过程中自动将其划分至文书档案。
根据关键词的提取结果得到其关键词 科研项目、负面清单、管理制度,其中在包含分类区域的检索记录中的浏览次数较多的档案例如《关于某类科研项目的管理的指导意见》在科研档案的浏览使用人数较多,则将类似于《关于某类科研项目的管理的指导意见》作为科研档案下的可信电子档案;
在科研档案下的关键词包括科研项目、负面清单、管理制度,其中科研项目、负面清单、管理制度分别匹配的电子档案的数量为100个、10个、60个,同时科研项目、负面清单、管理制度匹配的可信电子档案的数量为30个、2个、20个,则此时的科研项目、负面清单、管理制度匹配的分类准确率为0.9、0.2、0.6。
然后上述的《实行负面清单的管理制度的指导意见》中的关键词包括科研项目、负面清单、管理制度匹配,其中科研项目在科研档案的分类准确率为0.9,因此可以判定为此时分类存在问题,需要将其移动至科研档案。
以下将从方法类实施例和系统类实施例两个角度进行进一步描述。
为解决上述问题,根据本发明的一个方面,如图1所示,提供了一种基于云端存储的档案更新管理方法,其特征在于,具体包括:
S1获取云端存储的不同的电子档案的检索记录,并根据所述检索记录进行包含分类号的检索条件的检索记录的确定,将其作为匹配检索记录;
需要说明的是,所述浏览检索记录根据电子档案管理系统的历史检索数据进行确定。
具体的,所述分类号根据所述档案分类标引规则或者电子档案管理机构的内部分类规则进行确定。
S2将所述匹配检索记录的分类号作为检索分类号,基于不同的匹配检索记录的电子档案的浏览数据和借阅数据确定所述电子档案在所述检索分类号下的分类可信度,利用分类可信度进行可信电子档案的确定;
在其中的一个可能的实施例中,如图2所示,上述步骤S2中的所述电子档案在所述检索分类号下的分类可信度的确定的方法为:
S21获取电子档案在所述匹配检索记录下的浏览次数和借阅次数,并根据所述浏览次数以及借阅次数进行所述电子档案的基础分类可信度的确定,并判断所述基础分类可信度是否大于预设可信度,若是,则进入下一步骤,若否,则进入步骤S24;
在其中的一个可能的实施例中,根据所述浏览次数所对应的预设浏览次数区间以及借阅次数所对应的预设借阅次数区间确定在浏览次数下的分类可信度和在借阅次数下的分类可信度,然后根据在浏览次数下的分类可信度和在借阅次数下的分类可信度的数量和进行所述电子档案的基础分类可信度的确定。
S22基于所述匹配检索记录进行所述匹配检索记录所对应的检索人数的确定,并判断所述检索人数是否满足要求,若是,则将所述基础分类可信度作为所述电子档案在所述检索分类号下的分类可信度,若否,则进入下一步骤;
具体的,当检索人数较多时,则确定检索人数满足要求。
S23获取在不同的匹配检索次数下的电子档案的浏览次数和借阅数据,并基于电子档案的浏览次数和借阅数据进行不同的匹配检索次数下的检索匹配度的确定,判断检索匹配度满足要求的匹配检索次数是否满足要求,若是,则将所述基础分类可信度作为所述电子档案在所述检索分类号下的分类可信度,若否,则进入下一步骤;
需要说明的是,检索匹配度根据是否借阅以及浏览次数进行确定,具体的,当存在借阅时,则确定其检索匹配度为1,当不存在借阅时,则通过浏览次数与预设浏览次数的比值进行检索匹配度的确定。
S24确定检索匹配度满足要求的匹配检索次数以及对应的检索人数,并结合不同的匹配检索次数下的检索匹配度以及检索人数进行所述电子档案的修正可信度的确定,基于所述修正可信度以及基础分类可信度进行所述电子档案在所述检索分类号下的分类可信度的确定。
在其中的一个可能的实施例中,根据不同的检索人员的不同的匹配检索次数的检索匹配度以及检索匹配度满足要求的匹配检索次数的检索匹配度进行不同的检索人数的综合检索匹配度的确定,具体的可以通过检索匹配度满足要求的匹配检索次数的检索匹配度的数量和匹配检索次数的检索匹配度的数量和的占比进行综合检索匹配度的确定,然后根据不同的检索人员的综合检索匹配度的权重和归一化处理后得到所述电子档案在所述检索分类号下的分类可信度。
具体的,所述预设可信度根据所述电子档案的平均浏览次数进行确定,其中所述电子档案的平均浏览次数越多,则所述电子档案的预设可信度越大。
在另外的一个可能的实施例中,上述步骤S2中的所述电子档案在所述检索分类号下的分类可信度的确定的方法为:
获取电子档案在所述匹配检索记录下的浏览次数和借阅次数,并根据所述浏览次数以及借阅次数进行所述电子档案的基础分类可信度的确定;
获取在不同的匹配检索次数下的电子档案的浏览次数和借阅数据,并基于电子档案的浏览次数和借阅数据进行不同的匹配检索次数下的检索匹配度的确定;
确定检索匹配度满足要求的匹配检索次数以及对应的检索人数,当所述检索匹配度满足要求的匹配检索次数以及对应的检索人数均符合预设条件要求时:
将所述基础分类可信度作为所述电子档案在所述检索分类号下的分类可信度;
当所述检索匹配度满足要求的匹配检索次数以及对应的检索人数任意一项不符合预设条件要求时:
确定检索匹配度满足要求的匹配检索次数以及对应的检索人数,并结合不同的匹配检索次数下的检索匹配度以及检索人数进行所述电子档案的修正可信度的确定,基于所述修正可信度以及基础分类可信度进行所述电子档案在所述检索分类号下的分类可信度的确定。
S3获取云端存储的不同的分类号下的电子档案,并根据所述电子档案的关键词的提取结果进行不同的分类号下的待选关键词的确定,获取所述待选关键词在不同的分类号下的匹配的电子档案的匹配可信度,并结合所述待选关键词的匹配的可信电子档案确定所述待选关键词在不同的分类号下的分类准确率;
具体的,根据所述电子档案的关键词的提取结果进行不同的分类号下的待选关键词的确定,具体包括:
根据电子档案的关键词的提取结果进行所述分类号下的关键词的匹配的档案的数量的确定,并基于所述匹配的档案的数量以及所述分类号下的电子档案的数量的比值进行所述待选关键词的确定。
在其中的一个可能的实施例中,如图3所示,上述步骤S3中的所述待选关键词在分类号下的分类准确率的确定的方法为:
S31获取所述待选关键词在所述分类号下的匹配的档案的数量,并根据匹配的档案的数量以及匹配可信度确定所述分类号下的匹配的档案的综合匹配可信度,基于所述综合匹配可信度以及所述分类号下的档案的数量进行所述分类下的待选关键词的分类基准准确率的确定;
S32获取所述待选关键词的匹配的可信电子档案,并基于所述待选关键词的匹配的可信电子档案的数量确定所述待选关键词在所述分类号下是否准确,若是,则根据所述分类基准准确率进行所述待选关键词在所述分类号下的分类准确率的确定,若否,则进入下一步骤;
S33确定所述待选关键词在所述分类号下匹配的可信电子档案的数量比例,并结合所述可信电子档案的数量以及匹配可信度进行所述待选关键词的可信电子档案的综合匹配可信度的确定;
S34通过所述待选关键词的匹配的电子档案的数量以及匹配可信度进行分类基准准确率的权重值的确定,通过待选关键词的匹配的可信电子档案的数量以及匹配可信度进行所述综合匹配可信度的权重值的确定,并结合所述分类基准准确率以及综合匹配可信度进行所述待选关键词在所述分类号下的分类准确率的确定。
需要说明的是,所述待选关键词在所述分类号下的分类准确率的取值范围在0到1之间,其中所述待选关键词在所述分类号下的分类准确率越高,则所述待选关键词在所述分类号下的分类结果越准确。
在另外的一个可能的实施例中,上述步骤S3中的所述待选关键词在分类号下的分类准确率的确定的方法为:
获取所述待选关键词在所述分类号下的匹配的档案的数量,并根据匹配的档案的数量以及匹配可信度确定所述分类号下的匹配的档案的综合匹配可信度,基于综合匹配可信度以及所述分类号下的档案的数量进行所述分类下的待选关键词的分类基准准确率的确定;
当所述分类基准准确率小于预设准确率时:
获取所述待选关键词的匹配的可信电子档案,当所述待选关键词的匹配的可信电子档案的数量小于预设档案数量时:则根据所述分类基准准确率进行所述待选关键词在所述分类号下的分类准确率的确定;
当所述分类基准准确率不小于预设准确率或者当所述待选关键词的匹配的可信电子档案的数量不小于预设档案数量时:
确定所述待选关键词在所述分类号下匹配的可信电子档案的数量比例,并结合所述可信电子档案的数量以及匹配可信度进行所述待选关键词的可信电子档案的综合匹配可信度的确定;
通过所述待选关键词的匹配的电子档案的数量以及匹配可信度进行分类基准准确率的权重值的确定,通过待选关键词的匹配的可信电子档案的数量以及匹配可信度进行所述综合匹配可信度的权重值的确定,并结合所述分类基准准确率以及综合匹配可信度进行所述待选关键词在所述分类号下的分类准确率的确定。
S4S4基于所述分类准确率进行可信关键词以及可信关键词的匹配分类号的确定,并根据与所述待选关键词和可信关键词的匹配情况确定电子档案的档案分类准确率,通过档案分类准确率进行问题分类档案的认定和更新建议的输出。
在其中的一个可能的实施例中,上述步骤S4中的所述档案的档案分类准确率的确定的方法为:
获取所述档案的关键词,并根据所述档案的关键词进行所述档案的待选关键词的匹配数量以及匹配待选关键词的确定,通过所述匹配待选关键词的分类准确率进行所述档案在当前分类号下的分类准确率的和的确定,并基于所述分类准确率的数量和确定所述档案的档案分类的推荐准确率的确定;
当所述档案的档案分类的推荐准确率不满足要求时:
确定所述档案为问题分类档案,并将所述推荐准确率作为所述档案的档案分类准确率;
当所述档案的档案分类的推荐准确率满足要求时:
获取所述档案在当前分类号下的不同的匹配待选关键词的分类准确率,并基于所述分类准确率对所述匹配待选关键词进行筛选得到有效关键词,通过所述有效关键词的数量、不同的有效关键词在当前分类号下的分类准确率进行所述档案在当前分类号下的筛选准确率的确定;
当所述档案在当前分类号下的筛选准确率不满足要求时:
确定所述档案为问题分类档案,并将所述筛选准确率作为所述档案的档案分类准确率;
当所述档案在当前分类号下的筛选准确率满足要求时:
获取所述档案在当前分类号下的匹配的可信关键词的数量以及不同的可信关键词在当前分类号下的分类准确率,并结合所述的筛选准确率和推荐准确率确定所述档案的档案分类准确率。
在其中的一个可能的实施例中,如图4所示,上述步骤S4中的所述档案的档案分类准确率的确定的方法为:
获取所述档案的关键词以及所述档案的当前分类号,并根据所述档案的关键词与所述待选关键词的匹配情况确定所述档案的关键词中是否存在当前分类号下的匹配的可信关键词,若是,则进入下一步骤,若否,则确定所述档案为问题分类档案;
根据所述档案的关键词与所述待选关键词的匹配情况进行所述档案的待选关键词的匹配数量以及匹配待选关键词的确定,通过所述匹配待选关键词的分类准确率进行所述档案在当前分类号下的分类准确率的和的确定,并基于所述分类准确率的数量和确定所述档案的档案分类的推荐准确率的确定,判断所述档案的档案分类的推荐准确率是否满足要求,若是,则进入下一步骤,若否,则确定所述档案为问题分类档案,并将所述推荐准确率作为所述档案的档案分类准确率;
获取所述档案在当前分类号下的不同的匹配待选关键词的分类准确率,并基于所述分类准确率对所述待选关键词进行筛选得到有效关键词,通过所述有效关键词的数量、不同的有效关键词在当前分类号下的分类准确率进行所述档案在当前分类号下的筛选准确率的确定,判断所述档案在当前分类号下的筛选准确率是否满足要求,若否,则确定所述档案为问题分类档案,并将所述筛选准确率作为所述档案的档案分类准确率,若是,则进入下一步骤;
获取所述档案在当前分类号下的匹配的可信关键词的数量以及不同的可信关键词在当前分类号下的分类准确率,并结合所述的筛选准确率和推荐准确率确定所述档案的档案分类准确率。
需要说明的是,所述更新建议包括更新推荐分类号以及不同的更新推荐分类号的推荐的档案分类准确率。
第二方面,如图5所示,本发明提供了一种基于云端存储的档案更新管理系统,采用上述的一种基于云端存储的档案更新管理方法,其特征在于,具体包括:
检索记录筛选模块,档案区分模块,准确率评估模块,档案分类模块;
所述检索记录筛选模块负责获取云端存储的不同的电子档案的检索记录,并根据所述检索记录进行包含分类号的检索条件的检索记录的确定,将其作为匹配检索记录;
所述档案区分模块负责将所述匹配检索记录的分类号作为检索分类号,基于不同的匹配检索记录的电子档案的浏览数据和借阅数据进行所述电子档案在所述检索分类号下的分类可信度以及可信电子档案的确定;
所述准确率评估模块负责获取云端存储的不同的分类号下的电子档案,并根据所述电子档案的关键词的提取结果进行不同的分类号下的待选关键词的确定,获取所述待选关键词在不同的分类号下的匹配的档案的数量以及匹配可信度,并结合所述待选关键词的匹配的可信电子档案进行所述待选关键词在不同的分类号下的分类准确率的确定;
所述档案分类模块负责基于所述分类准确率进行可信关键词以及可信关键词的匹配分类号的确定,并根据不同档案与所述待选关键词和所述可信关键词的匹配情况进行不同档案的档案分类准确率以及问题分类档案的确定,基于所述问题分类档案输出更新建议。
通过以上实施例,本发明取得以下有益效果:
1、通过基于不同的匹配检索记录的电子档案的浏览数据和借阅数据进行电子档案在检索分类号下的分类可信度以及可信电子档案的确定,从而实现了从含有检索分类号的检索记录的角度对电子档案的分类可信度的评估,充分考虑到由于分类准确与否导致的检索结果的匹配准确性的差异,实现了对分类准确的可信电子档案的准确筛选。
2、通过结合待选关键词的匹配的可信电子档案进行待选关键词在不同的分类号下的分类准确率的确定,既考虑到不同的待选关键词的匹配的电子档案的数量以及匹配可信度,同时还考虑到可信电子档案的数量导致的匹配准确性的差异,实现了不同的待选关键词的分类准确情况的准确评估。
3、通过根据不同档案与待选关键词和可信关键词的匹配情况进行不同档案的档案分类准确率以及问题分类档案的确定,实现了从不同档案的关键词的匹配结果对档案分类准确率的评估,充分考虑到不同的档案的关键词由于与待选关键词以及可信关键词的匹配情况,实现了对问题分类档案的筛选,从而为实现对问题分类档案的更新管理奠定了基础。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (7)
1.一种基于云端存储的档案更新管理方法,其特征在于,具体包括:
获取云端存储的不同的电子档案的检索记录,并根据所述检索记录进行包含分类号的检索条件的检索记录的确定,将其作为匹配检索记录;
将所述匹配检索记录的分类号作为检索分类号,基于不同的匹配检索记录的电子档案的浏览数据和借阅数据确定所述电子档案在所述检索分类号下的分类可信度,利用分类可信度进行可信电子档案的确定;
获取云端存储的不同的分类号下的电子档案,并根据所述电子档案的关键词的提取结果进行不同的分类号下的待选关键词的确定,获取所述待选关键词在不同的分类号下的匹配的电子档案的匹配可信度,并结合所述待选关键词的匹配的可信电子档案确定所述待选关键词在不同的分类号下的分类准确率;
基于所述分类准确率进行可信关键词以及可信关键词的匹配分类号的确定,并根据与所述待选关键词和可信关键词的匹配情况确定电子档案的档案分类准确率,通过档案分类准确率进行问题分类档案的认定和更新建议的输出;
所述电子档案在所述检索分类号下的分类可信度的确定的方法为:
S21获取电子档案在所述匹配检索记录下的浏览次数和借阅次数,并根据所述浏览次数以及借阅次数进行所述电子档案的基础分类可信度的确定,并判断所述基础分类可信度是否大于预设可信度,若是,则进入下一步骤,若否,则进入步骤S24;
S22基于所述匹配检索记录进行所述匹配检索记录所对应的检索人数的确定,并判断所述检索人数是否满足要求,若是,则将所述基础分类可信度作为所述电子档案在所述检索分类号下的分类可信度,若否,则进入下一步骤;
S23获取在不同的匹配检索次数下的电子档案的浏览次数和借阅数据,并基于电子档案的浏览次数和借阅数据进行不同的匹配检索次数下的检索匹配度的确定,判断检索匹配度满足要求的匹配检索次数是否满足要求,若是,则将所述基础分类可信度作为所述电子档案在所述检索分类号下的分类可信度,若否,则进入下一步骤;
S24确定检索匹配度满足要求的匹配检索次数以及对应的检索人数,并结合不同的匹配检索次数下的检索匹配度以及检索人数进行所述电子档案的修正可信度的确定,基于所述修正可信度以及基础分类可信度进行所述电子档案在所述检索分类号下的分类可信度的确定;
所述待选关键词在分类号下的分类准确率的确定的方法为:
获取所述待选关键词在所述分类号下的匹配的档案的数量,并根据匹配的档案的数量以及匹配可信度确定所述分类号下的匹配的档案的综合匹配可信度,基于所述综合匹配可信度以及所述分类号下的档案的数量进行所述分类下的待选关键词的分类基准准确率的确定;
获取所述待选关键词的匹配的可信电子档案,并基于所述待选关键词的匹配的可信电子档案的数量确定所述待选关键词在所述分类号下是否准确,若是,则根据所述分类基准准确率进行所述待选关键词在所述分类号下的分类准确率的确定,若否,则进入下一步骤;
确定所述待选关键词在所述分类号下匹配的可信电子档案的数量比例,并结合所述可信电子档案的数量以及匹配可信度进行所述待选关键词的可信电子档案的综合匹配可信度的确定;
通过所述待选关键词的匹配的电子档案的数量以及匹配可信度进行分类基准准确率的权重值的确定,通过待选关键词的匹配的可信电子档案的数量以及匹配可信度进行所述综合匹配可信度的权重值的确定,并结合所述分类基准准确率以及综合匹配可信度进行所述待选关键词在所述分类号下的分类准确率的确定;
所述档案的档案分类准确率的确定的方法为:
获取所述档案的关键词,并根据所述档案的关键词进行所述档案的待选关键词的匹配数量以及匹配待选关键词的确定,通过所述匹配待选关键词的分类准确率进行所述档案在当前分类号下的分类准确率的和的确定,并基于所述分类准确率的数量和确定所述档案的档案分类的推荐准确率的确定;
当所述档案的档案分类的推荐准确率不满足要求时:
确定所述档案为问题分类档案,并将所述推荐准确率作为所述档案的档案分类准确率;
当所述档案的档案分类的推荐准确率满足要求时:
获取所述档案在当前分类号下的不同的匹配待选关键词的分类准确率,并基于所述分类准确率对所述匹配待选关键词进行筛选得到有效关键词,通过所述有效关键词的数量、不同的有效关键词在当前分类号下的分类准确率进行所述档案在当前分类号下的筛选准确率的确定;
当所述档案在当前分类号下的筛选准确率不满足要求时:
确定所述档案为问题分类档案,并将所述筛选准确率作为所述档案的档案分类准确率;
当所述档案在当前分类号下的筛选准确率满足要求时:
获取所述档案在当前分类号下的匹配的可信关键词的数量以及不同的可信关键词在当前分类号下的分类准确率,并结合所述的筛选准确率和推荐准确率确定所述档案的档案分类准确率。
2.如权利要求1所述的基于云端存储的档案更新管理方法,其特征在于,所述检索记录根据电子档案管理系统的历史检索数据进行确定。
3.如权利要求1所述的基于云端存储的档案更新管理方法,其特征在于,所述分类号根据所述档案分类标引规则或者电子档案管理机构的内部分类规则进行确定。
4.如权利要求1所述的基于云端存储的档案更新管理方法,其特征在于,所述预设可信度根据所述电子档案的平均浏览次数进行确定,其中所述电子档案的平均浏览次数越多,则所述电子档案的预设可信度越大。
5.如权利要求1所述的基于云端存储的档案更新管理方法,其特征在于,根据所述电子档案的关键词的提取结果进行不同的分类号下的待选关键词的确定,具体包括:
根据电子档案的关键词的提取结果进行所述分类号下的关键词的匹配的档案的数量的确定,并基于所述匹配的档案的数量以及所述分类号下的电子档案的数量的比值进行所述待选关键词的确定。
6.如权利要求1所述的基于云端存储的档案更新管理方法,其特征在于,所述待选关键词在所述分类号下的分类准确率的取值范围在0到1之间,其中所述待选关键词在所述分类号下的分类准确率越高,则所述待选关键词在所述分类号下的分类结果越准确。
7.一种基于云端存储的档案更新管理系统,采用权利要求1-6任一项所述的一种基于云端存储的档案更新管理方法,其特征在于,具体包括:
检索记录筛选模块,档案区分模块,准确率评估模块,档案分类模块;
所述检索记录筛选模块负责获取云端存储的不同的电子档案的检索记录,并根据所述检索记录进行包含分类号的检索条件的检索记录的确定,将其作为匹配检索记录;
所述档案区分模块负责将所述匹配检索记录的分类号作为检索分类号,基于不同的匹配检索记录的电子档案的浏览数据和借阅数据确定所述电子档案在所述检索分类号下的分类可信度,利用分类可信度进行可信电子档案的确定;
所述准确率评估模块负责获取云端存储的不同的分类号下的电子档案,并根据所述电子档案的关键词的提取结果进行不同的分类号下的待选关键词的确定,获取所述待选关键词在不同的分类号下的匹配的电子档案的匹配可信度,并结合所述待选关键词的匹配的可信电子档案确定所述待选关键词在不同的分类号下的分类准确率;
所述档案分类模块负责基于所述分类准确率进行可信关键词以及可信关键词的匹配分类号的确定,并根据与所述待选关键词和可信关键词的匹配情况确定电子档案的档案分类准确率,通过档案分类准确率进行问题分类档案的认定和更新建议的输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311794832.0A CN117453852B (zh) | 2023-12-25 | 2023-12-25 | 基于云端存储的档案更新管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311794832.0A CN117453852B (zh) | 2023-12-25 | 2023-12-25 | 基于云端存储的档案更新管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117453852A CN117453852A (zh) | 2024-01-26 |
CN117453852B true CN117453852B (zh) | 2024-04-16 |
Family
ID=89580335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311794832.0A Active CN117453852B (zh) | 2023-12-25 | 2023-12-25 | 基于云端存储的档案更新管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117453852B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117892204B (zh) * | 2024-03-15 | 2024-05-28 | 杭州易康信科技有限公司 | 一种适用于政务服务的档案分类管理方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020207431A1 (zh) * | 2019-04-12 | 2020-10-15 | 智慧芽信息科技(苏州)有限公司 | 文献分类方法、装置、设备及存储介质 |
CN112487150A (zh) * | 2020-12-11 | 2021-03-12 | 航天信息股份有限公司 | 档案管理方法、系统、存储介质及电子设备 |
CN114996365A (zh) * | 2022-05-17 | 2022-09-02 | 深圳市聚英达信息技术有限公司 | 一种用于档案整理的档案分类系统 |
CN116451200A (zh) * | 2023-06-14 | 2023-07-18 | 浙江星汉信息技术股份有限公司 | 一种基于云端存储的加密式档案资料的检索方法 |
CN116975314A (zh) * | 2023-09-25 | 2023-10-31 | 浙江星汉信息技术股份有限公司 | 一种电子档案智能查询方法与系统 |
-
2023
- 2023-12-25 CN CN202311794832.0A patent/CN117453852B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020207431A1 (zh) * | 2019-04-12 | 2020-10-15 | 智慧芽信息科技(苏州)有限公司 | 文献分类方法、装置、设备及存储介质 |
CN112487150A (zh) * | 2020-12-11 | 2021-03-12 | 航天信息股份有限公司 | 档案管理方法、系统、存储介质及电子设备 |
CN114996365A (zh) * | 2022-05-17 | 2022-09-02 | 深圳市聚英达信息技术有限公司 | 一种用于档案整理的档案分类系统 |
CN116451200A (zh) * | 2023-06-14 | 2023-07-18 | 浙江星汉信息技术股份有限公司 | 一种基于云端存储的加密式档案资料的检索方法 |
CN116975314A (zh) * | 2023-09-25 | 2023-10-31 | 浙江星汉信息技术股份有限公司 | 一种电子档案智能查询方法与系统 |
Non-Patent Citations (2)
Title |
---|
Optimizing Document Classification: Unleashing the Power of Genetic Algorithms;Mustafa, Ghulam et al.;IEEE ACCESS;20230704;第83136-83149页 * |
分类号与关键词相结合的标引方法;戴璞;;中国档案;19931231(11);第29-30页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117453852A (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109815314B (zh) | 一种意图识别方法、识别设备及计算机可读存储介质 | |
CN117453852B (zh) | 基于云端存储的档案更新管理方法 | |
AU2022201654A1 (en) | System and engine for seeded clustering of news events | |
CN102567464B (zh) | 基于扩展主题图的知识资源组织方法 | |
CN110674840B (zh) | 一种多方证据关联模型构建方法和证据链提取方法及装置 | |
TWI710917B (zh) | 資料處理方法及裝置 | |
TWI571756B (zh) | 用以分析瀏覽記錄及其文件之方法及其系統 | |
CN113722478B (zh) | 多维度特征融合相似事件计算方法、系统及电子设备 | |
CN110569273A (zh) | 一种基于相关性排序的专利检索系统及方法 | |
CN109299040A (zh) | 一种基于大数据的文件存储空间智能分配方法 | |
CN114092056A (zh) | 项目管理方法、装置、电子设备、存储介质及产品 | |
CN116975314B (zh) | 一种电子档案智能查询方法与系统 | |
US8533150B2 (en) | Search index generation apparatus | |
CN106649492A (zh) | 一种经济法学法条查询系统 | |
CN111538903B (zh) | 搜索推荐词确定方法、装置、电子设备及计算机可读介质 | |
CN107992524B (zh) | 一种专家信息搜索及领域评分计算方法 | |
CN114648010A (zh) | 数据表标准化方法、装置、设备及计算机存储介质 | |
CN113392184A (zh) | 一种相似文本的确定方法、装置、终端设备及存储介质 | |
TWI240876B (en) | Portable database search agent processing system | |
US11449516B2 (en) | Ranking of documents belonging to different domains based on comparison of descriptors thereof | |
CN117763109B (zh) | 一种用于档案全文检索的数据核查方法 | |
CN107480271A (zh) | 基于抽样查找和索引查找的人群画像方法及系统 | |
US20150046472A1 (en) | Weight adjustment in a probabilistic matching system based on external demographic data | |
CN115563306A (zh) | 信息抽取处理方法、设备、介质及产品 | |
CN114443120A (zh) | 一种智能埋点管理系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |