CN112463896A - 档案编目数据处理方法、装置、计算设备及存储介质 - Google Patents
档案编目数据处理方法、装置、计算设备及存储介质 Download PDFInfo
- Publication number
- CN112463896A CN112463896A CN202011442640.XA CN202011442640A CN112463896A CN 112463896 A CN112463896 A CN 112463896A CN 202011442640 A CN202011442640 A CN 202011442640A CN 112463896 A CN112463896 A CN 112463896A
- Authority
- CN
- China
- Prior art keywords
- attribute
- mode
- item
- items
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 11
- 238000006243 chemical reaction Methods 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000013507 mapping Methods 0.000 claims description 52
- 238000004891 communication Methods 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 13
- 230000014759 maintenance of location Effects 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种档案编目数据处理方法、装置、计算设备及存储介质。本方案能够将以第一模式记录的档案编目数据转换为以第二模式记录的档案编目数据,实现档案编目模式的自动转换,从而提升档案编目模式的转换效率,降低转换成本,保障转换精准度,并且本方案简单易行,适于大规模应用与实施。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种档案编目数据处理方法、装置、计算设备及存储介质。
背景技术
档案编目是指档案馆(室)对档案进行著录、标引和组织、制作目录等。目前,随着科技及社会的发展,档案编目数据通常以电子表格等方式呈现。
然而,由于不同机构其档案编目标准不同,即使同一机构其档案编目模式也存在多种,例如同一机构中通常会采用卷内文件目录模式、案卷目录模式以及在编制文书、实物、录音录像等所采用的“组件”模式等等。
目前,当档案编目发生转换时,通常需由人工将数据逐条逐项录入或导入,且都需要逐条逐项核对。然而,采用该种方法其效率低下,人工成本高,而且其录入错误率高,更不适于大规模应用与实施。
发明内容
为解决上述问题,本发明提出了一种档案编目数据处理方法、装置、计算设备及存储介质。
第一个方面,本发明提供了一种档案编目数据处理方法,包括:
响应于用户的模式转换操作,获取以第一模式记录的档案编目数据;
将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项;其中,第二模式中与第一模式相同的属性项为第一类属性项,第二模式中与第一模式不同的属性项为第二类属性项;
针对于任一第一类属性项,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项;
针对于任一第二类属性项,基于预设映射表,从第一模式的属性项中查找出与该第二类属性项关联的属性项,根据第一模式中所述关联的属性项的属性值以及该第二类属性项与所述关联的属性项的关联关系,计算该第二类属性项的属性值。
可选的,所述预设映射表中存储有不同属性项之间的关联关系。
可选的,所述方法还包括:获取预设标准库中的档案编目标准数据;
对所述档案编目标准数据进行语义识别,以识别出档案编目标准数据中的命名实体;
根据命名实体之间的连接词语义,识别命名实体间的关联关系;
根据所述命名实体以及所述命名实体间的关联关系,生成包含不同属性项之间的关联关系的预设映射表。
可选的,所述方法还包括:获取预设标注库中新写入的档案编目标准数据;
将所述新写入的档案编目标准数据输入至预先训练好的属性关系识别模型中;
获取所述属性关系识别模型输出的包含不同属性项之间的关联关系的预设映射表。
可选的,所述方法还包括:监测预设标准库中的数据变更操作,根据所述数据变更操作更新所述预设映射表。
可选的,所述属性项包括以下项中的至少一种:
档号、序号、文件编号、题名、责任者、日期、页数、备注、全宗号、属类代码、实体分类名称、项目号、项目名称、案卷号、保管期限、以及分类号。
可选的,在获取以第一模式记录的档案编目数据之后,所述方法还包括:
对所述档案编目数据进行校验,判断所述档案编目数据中是否存在无效数据;
若是,则生成相应的反馈信息。
第二个方面,本发明提供了一种档案编目数据处理装置,包括:
获取模块,用于响应于用户的模式转换操作,获取以第一模式记录的档案编目数据;
匹配模块,用于将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项;其中,第二模式中与第一模式相同的属性项为第一类属性项,第二模式中与第一模式不同的属性项为第二类属性项;
第一执行模块,用于针对于任一第一类属性项,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项;
第二执行模块,用于针对于任一第二类属性项,基于预设映射表,从第一模式的属性项中查找出与该第二类属性项关联的属性项,根据第一模式中所述关联的属性项的属性值以及该第二类属性项与所述关联的属性项的关联关系,计算该第二类属性项的属性值。
可选的,所述预设映射表中存储有不同属性项之间的关联关系。
可选的,所述装置还包括:映射表生成模块,用于获取预设标准库中的档案编目标准数据;
对所述档案编目标准数据进行语义识别,以识别出档案编目标准数据中的命名实体;
根据命名实体之间的连接词语义,识别命名实体间的关联关系;
根据所述命名实体以及所述命名实体间的关联关系,生成包含不同属性项之间的关联关系的预设映射表。
可选的,所述装置还包括:映射表生成模块,用于获取预设标注库中新写入的档案编目标准数据;
将所述新写入的档案编目标准数据输入至预先训练好的属性关系识别模型中;
获取所述属性关系识别模型输出的包含不同属性项之间的关联关系的预设映射表。
可选的,所述装置还包括:更新模块,用于监测预设标准库中的数据变更操作,根据所述数据变更操作更新所述预设映射表。
可选的,所述属性项包括以下项中的至少一种:档号、序号、文件编号、题名、责任者、日期、页数、备注、全宗号、属类代码、实体分类名称、项目号、项目名称、案卷号、保管期限、以及分类号。
可选的,所述装置还包括:校验模块,用于在获取以第一模式记录的档案编目数据之后,对所述档案编目数据进行校验,判断所述档案编目数据中是否存在无效数据;若是,则生成相应的反馈信息。
第三个方面,本发明提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述档案编目数据处理方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述档案编目数据处理方法对应的操作。
根据本发明提供的档案编目数据处理方法、装置、计算设备及存储介质,首先获取以第一模式记录的档案编目数据;将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项;其中,第二模式中与第一模式相同的属性项为第一类属性项,第二模式中与第一模式不同的属性项为第二类属性项;进一步针对于任一第一类属性项,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项;而针对于任一第二类属性项,基于预设映射表,从第一模式的属性项中查找出与该第二类属性项关联的属性项,根据第一模式中所述关联的属性项的属性值以及该第二类属性项与所述关联的属性项的关联关系,计算该第二类属性项的属性值。采用本方案,能够实现档案编目模式的自动转化,从而提升档案编目模式的转换效率,降低转换成本,提高转换精准度,并且,本方案简单易行,适于大规模应用与实施。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明实施例一提供的一种档案编目数据处理方法的流程示意图;
图2a示出了一种卷内文件目录模式的示意图;
图2b示出了一种卷内文件机读目录模式的示意图;
图3示出了根据本发明实施例二提供的一种档案编目数据处理方法的流程示意图;
图4示出了根据本发明实施例三提供的一种档案编目数据处理装置的功能结构示意图;
图5示出了根据本发明实施例五提供的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
实施例一
图1示出了根据本发明实施例一提供的一种档案编目数据处理方法的流程示意图。如图1所示,该方法包括:
步骤S110:响应于用户的模式转换操作,获取以第一模式记录的档案编目数据。
本实施例中,第一模式为转换前的模式,第二模式为转换后的模式。其中,本实施例对第一模式及第二模式的具体类型不作限定。该第一模式或第二模式可以包括以下模式中的至少一种:卷内文件目录模式、卷内文件机读目录模式、案卷目录模式、以及案卷机读目录模式等等。
进一步地,本实施例对用户的模式转换操作不作限定,该模式转换操作可以为针对于转换控件的点击操作,也可以为语音控制、手势控制等操作,还可以为快捷键操作等等。
在监测到用户的模式转换操作之后,响应于该操作,获取当前已经以第一模式记录的档案编目数据。可选的,在获取以第一模式记录的档案编目数据之后,可以对该档案编目数据进行校验,判断档案编目数据中是否存在无效数据,其中,该无效数据包括:空值数据、乱码数据、格式错误数据等等。若确定出存在无效数据,则生成相应的反馈信息,并在页面中展示该反馈信息,以供用户及时对无效数据进行修改。
步骤S120:将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项。
第一模式与第二模式中均包含有至少一个属性项,该属性项标识了对应数据所属的类别。在实际的实施过程中,档案编目数据通常以表格的方式呈现,则第一模式及第二模式中的属性项为表格中每一列或每一行的列名或行名。其中,属性项包括以下项中的至少一种:档号、序号、文件编号、题名、责任者、日期、页数、备注、全宗号、属类代码、实体分类名称、项目号、项目名称、案卷号、保管期限、以及分类号等等;其中,在实际的实施过程中,属类代码通常标识了其所对应的属类类别。
第一模式与第二模式隶属于不同的模式,两者所包含的属性项上存在不同。则在实际的实施过程中,将第一模式中的属性项与第二模式中的属性项进行匹配,从而识别出第二模式中与第一模式相同的属性项,即识别出第二模式中的第一类属性项;并识别出第二模式中与第一模式不同的属性项,即识别出第二模式中的第二类属性项。
在一种可选的实施方式中,在匹配过程中,可通过字符匹配的方式判断两个属性项名称是否相同,若相同,则表明该两个属性项相同;和/或,预先为属性项分配对应的唯一ID,继而在匹配过程中,根据属性项对应的唯一ID来快速准确地识别出第二模式中的第一类属性项及第二类属性项。
步骤S130:针对于任一第一类属性项,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项。
本步骤中,可将第一模式与第二模式中相同的部分,直接批量赋值至第二模式。
步骤S140:针对于任一第二类属性项,基于预设映射表,从第一模式的属性项中查找出与该第二类属性项关联的属性项,根据第一模式中关联的属性项的属性值以及该第二类属性项与关联的属性项的关联关系,计算该第二类属性项的属性值。
本实施例对步骤S130及步骤S140的具体执行顺序不作限定,两者可并发执行,又或者可按照相应的次序顺次执行。
其中,预设映射表中存储有不同属性项之间的关联关系。从而针对于任一第二类属性项,根据该预设映射表,确定出第一模式中与该第二类属性项关联的属性项,继而根据预设映射表中记录的该第二类属性项与该关联的属性项的关联关系,采用对应的计算方式计算出该第二类属性项的属性值。
在一种可选的实施方式中,本实施例在将属性值写入第二模式对应属性项下时,需校验属性值格式是否与第二模式对应属性项设置的格式一致,若不一致,则对属性值进行格式转换后写入第二模式对应属性项中;若一致,则直接将属性值写入第二模式对应属性项中。
在又一种可选的实施方式中,本实施例可对第一模式和/或第二模式中的属性值进行纠错处理,如检测第一模式和/或第二模式属性值中是否存在空值,和/或是否存在明显拼写错误等等。并在检测出相应错误后,展示错误提示框,以供用户对该错误进行纠正。
在再一种可选的实施方式中,本实施例可为用户提供手动录入属性值入口,并未便于属性值的快速录入,还提供有“复制到底”及“删除到底”的控件,从而便于将某属性项下后续其他属性值直接复制为当前选定的属性值,又或者,批量化删除某属性项下后续其他属性值。
以下以一具体示例来阐明步骤S110-步骤S140的实施过程:
图2a为卷内文件目录模式的档案编目模板,其中,在卷内文件目录模式中,包含有档号、保管期限、序号、文件编号、文件题名、责任者、日期、页数、备注共9个属性项。用户可以以该卷内文件目录模式录入档案编目数据。进一步,页面中还呈现有模式转换控件,如图2a中在页面右方呈现有“生成卷内文件机读目录”及“生成案卷目录”的模式转换控件。当用户点击“生成卷内文件机读目录”的模式转换控件后,触发以卷内文件目录模式向卷内文件机读目录模式的转换,并执行步骤S110获取卷内文件目录模式(即第一模式)的档案编目数据;进一步执行步骤S120,将卷内文件目录模式的属性项与卷内文件机读目录模式(第二模式)的属性项进行匹配,其中,如图2b所示,卷内文件机读目录模式的属性性包括:档号、保管期限、序号、文件编号、文件题名、责任者、日期、页数、备注、全宗号、属类代号、实体分类名称、项目号、项目名称、案卷盒号、以及文件级档号。通过两个模式的属性项的匹配,能够确定卷内文件机读目录模式中与卷内文件目录模式相同的属性项(即第一类属性项),以及卷内文件机读目录模式中与卷内文件目录模式不同的属性项(即第二类属性项),本示例中,第一类属性项包括:档号、保管期限、序号、文件编号、文件题名、责任者、日期、页数、以及备注;第二类属性项包括:全宗号、属类代号、实体分类名称、项目号、项目名称、案卷盒号、以及文件级档号。进一步执行步骤S130及步骤S140,在步骤S130执行过程中,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项,其中,属性值具体为属性项的具体数据,如属性项为档号,其属性值可以包括X026-JJ1·01-0001-0001。在步骤S140执行过程中,根据预设映射表中存储有不同属性项之间的关联关系,来计算第二类属性项的属性值。例如,预设映射表中记录了档号与全宗号、属类代号、项目号、及案卷号(又可称为案卷盒号)的对应关系为“档号=全宗号-属类代号·项目号-案卷盒号”,则若卷内文件目录模式中属性项为档号的属性值为“X026-JJ1·01-0001-0001”,则在转换后,卷内文件机读目录模式中属性项为全宗号、属类代号、项目号、及案卷盒号所对应的属性值分别为X026,JJ1,01,0001,以及0001。进一步地,如图2b所示,本实施例还提供有“复制到底”及“删除到底”功能项,通过用户对该功能控件的点击操作,能够触发数据的批量复制及批量删除。
由此可见,本实施例响应于用户的模式转换操作,获取以第一模式记录的档案编目数据;将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项;进一步针对于任一第一类属性项,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项;针对于任一第二类属性项,基于预设映射表,从第一模式的属性项中查找出与该第二类属性项关联的属性项,根据第一模式中所述关联的属性项的属性值以及该第二类属性项与所述关联的属性项的关联关系,计算该第二类属性项的属性值。采用本方案,能够将以第一模式记录的档案编目数据转换为以第二模式记录的档案编目数据,实现档案编目模式的自动转换,从而提升档案编目模式的转换效率,降低转换成本,提高转换精度,并且本方案简单易行,适于大规模应用与实施。
实施例二
图3示出了根据本发明实施例二提供的一种档案编目数据处理方法的流程示意图。其中,本实施例所提供的方法是针对于实施例一中档案编目数据处理方法的进一步优化。
如图3所示,该方法包括:
步骤S310:获取预设标准库中的档案编目标准数据,基于该档案编目标准数据生成预设映射表。
其中,预设标准库中的档案编目标准数据可以为本机构标准库中存储的关于档案编目标准的相关文件,也可以为官方平台发布的档案编目标准的相关文件。例如,档案编目标准数据包含有:档号构成规则,项目号与项目名称的映射关系等等。
进一步地,可采用以下方式中的一种或多种的结合来基于该档案编目标准数据生成预设映射表。
方式一:获取预设标准库中的档案编目标准数据,对档案编目标准数据进行语义识别,以识别出档案编目标准数据中的命名实体;根据命名实体之间的连接词语义,识别命名实体间的关联关系;根据命名实体以及命名实体间的关联关系,生成包含不同属性项之间的关联关系的预设映射表。例如,一条档案编目标准数据为“文件档号由案卷档号及序号构成”,通过对该语义识别,识别出该数据中的命名实体包括“文件档号”、“案卷档号”及“序号”,其中,“文件档号”与“案卷档号”及“序号”连接词为“由……构成”,从而确定出“文件档号”与“案卷档号”及“序号”为包含的关系,从而可以在映射表中存储该条数据对应的映射数据,即存储“文件档号=案卷档号+序号”。
方式二:获取预设标注库中新写入的档案编目标准数据,将新写入的档案编目标准数据输入至预先训练好的属性关系识别模型中,并获取属性关系识别模型输出的包含不同属性项之间的关联关系的预设映射表。为了提高属性项间关联关系的精确度,本方式中预先构建有属性关系识别模型,该属性关系识别模型包括输入层、全连接层、RELU层、池化层及输出层。其中,属性关系识别模型可将非结构化的档案编目标准数据转换为预设长度的向量,并利用向量集通过神经网络的学习得到属性项之间的关联关系。在获得训练好的属性关系识别模型后,每当有新写入的档案编目标准数据时,可利用该属性关系识别模型进行属性项之间的关联关系的预测,继而根据预测结果生成预设映射表。
在一种可选的实施方式中,为节约存储资源,预设映射表中以树状结构存储属性项数据。例如,以案卷档号为根节点,全宗号、属类代号、项目号、及案卷盒号分别作为案卷档号的子节点,而项目名称作为项目号的子节点。
进一步可选的,在预设映射表中以树状结构存储属性项数据的基础上,为了提升查找效率,建立各节点的索引表,根据该索引表能够快速地查找到对应的属性项的位置。
在又一种可选的实施方式中,可监测预设标准库中的数据变更操作,根据数据变更操作更新预设映射表。当档案编目标准发生变化时,能够在监测到预设标准库中的数据变更操作,根据该数据表更操作识别变更的属性项及其对应的关联关系,继而更新预设映射表。
步骤S320:响应于用户的模式转换操作,获取以第一模式记录的档案编目数据,将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项;将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项;基于预设映射表,计算第二类属性项的属性值。
其中,本步骤的具体实施过程可参照实施例一中相应部分的描述,本实施例在此不做赘述。
由此可见,本实施例采用语义识别及机器学习的方式,将预设标准库中的档案编目标准数据自动转换为预设映射表,从而提升预设映射表的生成效率,并具有较高的准确度。此外,本实施例能够将以第一模式记录的档案编目数据转换为以第二模式记录的档案编目数据,实现档案编目模式的自动转换,从而提升档案编目模式的转换效率,降低转换成本,提高转换精准度,并且,本方案简单易行,适于大规模应用与实施。
实施例三
图4示出了根据本发明实施例三提供的一种档案编目数据处理装置的功能结构示意图。如图4所示,该装置400包括:获取模块410、匹配模块420、第一执行模块430以及第二执行模块440。
获取模块410,用于响应于用户的模式转换操作,获取以第一模式记录的档案编目数据;
匹配模块420,用于将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项;其中,第二模式中与第一模式相同的属性项为第一类属性项,第二模式中与第一模式不同的属性项为第二类属性项;
第一执行模块430,用于针对于任一第一类属性项,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项;
第二执行模块440,用于针对于任一第二类属性项,基于预设映射表,从第一模式的属性项中查找出与该第二类属性项关联的属性项,根据第一模式中所述关联的属性项的属性值以及该第二类属性项与所述关联的属性项的关联关系,计算该第二类属性项的属性值。
可选的,所述预设映射表中存储有不同属性项之间的关联关系。
可选的,所述装置还包括:映射表生成模块,用于获取预设标准库中的档案编目标准数据;
对所述档案编目标准数据进行语义识别,以识别出档案编目标准数据中的命名实体;
根据命名实体之间的连接词语义,识别命名实体间的关联关系;
根据所述命名实体以及所述命名实体间的关联关系,生成包含不同属性项之间的关联关系的预设映射表。
可选的,所述装置还包括:映射表生成模块,用于获取预设标注库中新写入的档案编目标准数据;
将所述新写入的档案编目标准数据输入至预先训练好的属性关系识别模型中;
获取所述属性关系识别模型输出的包含不同属性项之间的关联关系的预设映射表。
可选的,所述装置还包括:更新模块,用于监测预设标准库中的数据变更操作,根据所述数据变更操作更新所述预设映射表。
可选的,所述属性项包括以下项中的至少一种:档号、序号、文件编号、题名、责任者、日期、页数、备注、全宗号、属类代码、实体分类名称、项目号、项目名称、案卷号、保管期限、以及分类号。
可选的,所述装置还包括:校验模块,用于在获取以第一模式记录的档案编目数据之后,对所述档案编目数据进行校验,判断所述档案编目数据中是否存在无效数据;若是,则生成相应的反馈信息。
其中,本实施例中各模块的具体实施过程可参照实施例一和/或实施例二中相应部分的描述,本实施例在此不做赘述。
由此可见,本实施例能够将以第一模式记录的档案编目数据转换为以第二模式记录的档案编目数据,实现档案编目模式的自动转换,从而提升档案编目模式的转换效率,降低转换成本,提高转换精度,并且,本方案简单易行,适于大规模应用与实施。
实施例四
本发明实施例四提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的档案编目数据处理方法。
由此可见,本实施例能够将以第一模式记录的档案编目数据转换为以第二模式记录的档案编目数据,实现档案编目模式的自动转换,从而提升档案编目模式的转换效率,降低转换成本,提高转换精度,并且,本方案简单易行,适于大规模应用与实施。
实施例五
图5示出了根据本发明实施例五提供的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图5所示,该计算设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。处理器502,用于执行程序510,具体可以执行上述任一方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(Application Specific IntegratedCircuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行如下操作:
响应于用户的模式转换操作,获取以第一模式记录的档案编目数据;
将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项;其中,第二模式中与第一模式相同的属性项为第一类属性项,第二模式中与第一模式不同的属性项为第二类属性项;
针对于任一第一类属性项,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项;
针对于任一第二类属性项,基于预设映射表,从第一模式的属性项中查找出与该第二类属性项关联的属性项,根据第一模式中所述关联的属性项的属性值以及该第二类属性项与所述关联的属性项的关联关系,计算该第二类属性项的属性值。
在一种可选的实施方式中,所述预设映射表中存储有不同属性项之间的关联关系。
在一种可选的实施方式中,程序510具体可以用于使得处理器502执行如下操作:
获取预设标准库中的档案编目标准数据;
对所述档案编目标准数据进行语义识别,以识别出档案编目标准数据中的命名实体;
根据命名实体之间的连接词语义,识别命名实体间的关联关系;
根据所述命名实体以及所述命名实体间的关联关系,生成包含不同属性项之间的关联关系的预设映射表。
在一种可选的实施方式中,程序510具体可以用于使得处理器502执行如下操作:
获取预设标注库中新写入的档案编目标准数据;
将所述新写入的档案编目标准数据输入至预先训练好的属性关系识别模型中;
获取所述属性关系识别模型输出的包含不同属性项之间的关联关系的预设映射表。
在一种可选的实施方式中,程序510具体可以用于使得处理器502执行如下操作:
监测预设标准库中的数据变更操作,根据所述数据变更操作更新所述预设映射表。
在一种可选的实施方式中,所述属性项包括以下项中的至少一种:
档号、序号、文件编号、题名、责任者、日期、页数、备注、全宗号、属类代码、实体分类名称、项目号、项目名称、案卷号、保管期限、以及分类号。
在一种可选的实施方式中,程序510具体可以用于使得处理器502执行如下操作:
在获取以第一模式记录的档案编目数据之后,对所述档案编目数据进行校验,判断所述档案编目数据中是否存在无效数据;若是,则生成相应的反馈信息。
由此可见,本实施例能够将以第一模式记录的档案编目数据转换为以第二模式记录的档案编目数据,实现档案编目模式的自动转换,从而提升档案编目模式的转换效率,降低转换成本,提高转换精度,并且,本方案简单易行,适于大规模应用与实施。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (10)
1.一种档案编目数据处理方法,其特征在于,包括:
响应于用户的模式转换操作,获取以第一模式记录的档案编目数据;
将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项;其中,第二模式中与第一模式相同的属性项为第一类属性项,第二模式中与第一模式不同的属性项为第二类属性项;
针对于任一第一类属性项,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项;
针对于任一第二类属性项,基于预设映射表,从第一模式的属性项中查找出与该第二类属性项关联的属性项,根据第一模式中所述关联的属性项的属性值以及该第二类属性项与所述关联的属性项的关联关系,计算该第二类属性项的属性值。
2.根据权利要求1所述的方法,其特征在于,所述预设映射表中存储有不同属性项之间的关联关系。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取预设标准库中的档案编目标准数据;
对所述档案编目标准数据进行语义识别,以识别出档案编目标准数据中的命名实体;
根据命名实体之间的连接词语义,识别命名实体间的关联关系;
根据所述命名实体以及所述命名实体间的关联关系,生成包含不同属性项之间的关联关系的预设映射表。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取预设标注库中新写入的档案编目标准数据;
将所述新写入的档案编目标准数据输入至预先训练好的属性关系识别模型中;
获取所述属性关系识别模型输出的包含不同属性项之间的关联关系的预设映射表。
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
监测预设标准库中的数据变更操作,根据所述数据变更操作更新所述预设映射表。
6.根据权利要求1-4中任一项所述的方法,其特征在于,所述属性项包括以下项中的至少一种:
档号、序号、文件编号、题名、责任者、日期、页数、备注、全宗号、属类代码、实体分类名称、项目号、项目名称、案卷号、保管期限、以及分类号。
7.根据权利要求1-4中任一项所述的方法,其特征在于,在获取以第一模式记录的档案编目数据之后,所述方法还包括:
对所述档案编目数据进行校验,判断所述档案编目数据中是否存在无效数据;
若是,则生成相应的反馈信息。
8.一种档案编目数据处理装置,其特征在于,包括:
获取模块,用于响应于用户的模式转换操作,获取以第一模式记录的档案编目数据;
匹配模块,用于将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项;其中,第二模式中与第一模式相同的属性项为第一类属性项,第二模式中与第一模式不同的属性项为第二类属性项;
第一执行模块,用于针对于任一第一类属性项,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项;
第二执行模块,用于针对于任一第二类属性项,基于预设映射表,从第一模式的属性项中查找出与该第二类属性项关联的属性项,根据第一模式中所述关联的属性项的属性值以及该第二类属性项与所述关联的属性项的关联关系,计算该第二类属性项的属性值。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的档案编目数据处理方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的档案编目数据处理方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011442640.XA CN112463896B (zh) | 2020-12-08 | 2020-12-08 | 档案编目数据处理方法、装置、计算设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011442640.XA CN112463896B (zh) | 2020-12-08 | 2020-12-08 | 档案编目数据处理方法、装置、计算设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112463896A true CN112463896A (zh) | 2021-03-09 |
CN112463896B CN112463896B (zh) | 2024-02-23 |
Family
ID=74800907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011442640.XA Active CN112463896B (zh) | 2020-12-08 | 2020-12-08 | 档案编目数据处理方法、装置、计算设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112463896B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116932463A (zh) * | 2023-09-13 | 2023-10-24 | 浙江星汉信息技术股份有限公司 | 一种档案智能鉴定方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020152194A1 (en) * | 2001-04-13 | 2002-10-17 | Sathyanarayan Ramaprakash H. | File archival |
TW559789B (en) * | 2001-04-12 | 2003-11-01 | Hitachi Ltd | File management method, file management device and recording medium |
US20050076042A1 (en) * | 2003-10-07 | 2005-04-07 | Stakutis Christopher John | Method, system, and program for archiving files |
TW200725316A (en) * | 2005-12-23 | 2007-07-01 | Inventec Besta Co Ltd | File format transformation system and method |
US20130151481A1 (en) * | 2011-12-07 | 2013-06-13 | Tacit Knowledge, Inc. | System, apparatus and method for generating arrangements of data based on similarity for cataloging and analytics |
CN104361111A (zh) * | 2014-11-28 | 2015-02-18 | 青岛大学 | 一种档案自动编研方法 |
CN105590165A (zh) * | 2015-12-17 | 2016-05-18 | 山东尚德软件股份有限公司 | 一种业务数据转换为电子档案的实现方法 |
CN105630923A (zh) * | 2015-12-23 | 2016-06-01 | 浪潮软件股份有限公司 | 一种实现档案管理信息化的方法 |
US10019462B1 (en) * | 2011-12-30 | 2018-07-10 | Emc Corporation | System and method of hierarchical archive management |
-
2020
- 2020-12-08 CN CN202011442640.XA patent/CN112463896B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW559789B (en) * | 2001-04-12 | 2003-11-01 | Hitachi Ltd | File management method, file management device and recording medium |
US20020152194A1 (en) * | 2001-04-13 | 2002-10-17 | Sathyanarayan Ramaprakash H. | File archival |
US20050076042A1 (en) * | 2003-10-07 | 2005-04-07 | Stakutis Christopher John | Method, system, and program for archiving files |
TW200725316A (en) * | 2005-12-23 | 2007-07-01 | Inventec Besta Co Ltd | File format transformation system and method |
US20130151481A1 (en) * | 2011-12-07 | 2013-06-13 | Tacit Knowledge, Inc. | System, apparatus and method for generating arrangements of data based on similarity for cataloging and analytics |
US10019462B1 (en) * | 2011-12-30 | 2018-07-10 | Emc Corporation | System and method of hierarchical archive management |
CN104361111A (zh) * | 2014-11-28 | 2015-02-18 | 青岛大学 | 一种档案自动编研方法 |
CN105590165A (zh) * | 2015-12-17 | 2016-05-18 | 山东尚德软件股份有限公司 | 一种业务数据转换为电子档案的实现方法 |
CN105630923A (zh) * | 2015-12-23 | 2016-06-01 | 浪潮软件股份有限公司 | 一种实现档案管理信息化的方法 |
Non-Patent Citations (1)
Title |
---|
常兰会: "人民法院诉讼档案形成规律研究", 《信息科技》, 15 June 2011 (2011-06-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116932463A (zh) * | 2023-09-13 | 2023-10-24 | 浙江星汉信息技术股份有限公司 | 一种档案智能鉴定方法及系统 |
CN116932463B (zh) * | 2023-09-13 | 2023-12-29 | 浙江星汉信息技术股份有限公司 | 一种档案智能鉴定方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112463896B (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110955416B (zh) | 接口文档生成方法、装置、设备和计算机存储介质 | |
CN110413738B (zh) | 一种信息处理方法、装置、服务器及存储介质 | |
US8468146B2 (en) | System and method for creating search index on cloud database | |
US20110282861A1 (en) | Extracting higher-order knowledge from structured data | |
CN111159982B (zh) | 文档编辑方法、装置、电子设备及计算机可读存储介质 | |
CN113220657B (zh) | 数据处理方法、装置及计算机设备 | |
CN111427577A (zh) | 代码处理方法、装置及服务器 | |
JP2020119544A (ja) | 知識グラフにおけるデータモデルを取得する方法、装置、機器及び媒体 | |
CN116560683A (zh) | 软件更新方法、装置、设备及存储介质 | |
CN112347324B (zh) | 一种文档查询方法、装置、电子设备及存储介质 | |
CN111984262A (zh) | 微信层叠样式表文件的处理方法、装置、设备及存储介质 | |
CN112463896B (zh) | 档案编目数据处理方法、装置、计算设备及存储介质 | |
CN112445905A (zh) | 一种信息处理方法和装置 | |
EP4053713A1 (en) | Question and answer method and apparatus based on knowledge graph | |
CN112559331A (zh) | 测试方法和装置 | |
CN111522627B (zh) | 一种Docker镜像管理方法、装置、设备及介质 | |
CN115600556B (zh) | 一种文档的目录信息推荐方法及系统 | |
CN116483735B (zh) | 一种代码变更的影响分析方法、装置、存储介质及设备 | |
JP5696280B1 (ja) | 用語統一システム及び用語統一プログラム、並びに用語統一方法 | |
US11809398B1 (en) | Methods and systems for connecting data with non-standardized schemas in connected graph data exchanges | |
US9038049B2 (en) | Automated discovery of resource definitions and relationships in a scripting environment | |
CN118504487A (zh) | 命令执行方法、装置、设备及存储介质 | |
CN118227130A (zh) | 确定页面元素的开发组件的方法、设备、介质和程序产品 | |
CN113268193A (zh) | 笔记页的移动方法、电子设备及计算机存储介质 | |
CN115374085A (zh) | 数据库初始化方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |