CN109359878B - 档案数据处理方法、计算机装置及计算机可读存储介质 - Google Patents
档案数据处理方法、计算机装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109359878B CN109359878B CN201811261294.8A CN201811261294A CN109359878B CN 109359878 B CN109359878 B CN 109359878B CN 201811261294 A CN201811261294 A CN 201811261294A CN 109359878 B CN109359878 B CN 109359878B
- Authority
- CN
- China
- Prior art keywords
- data
- file
- record
- archive
- acquiring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种流程化档案数据数字化处理方法、计算机装置和计算机可读存储介质。流程化档案数据数字化处理方法包括显示档案出库窗口,获取档案出库明细数据,生成档案加工任务。确定档案加工任务,获取档案卷内目录数据。读取档案影像数据,并对读取到的档案影像数据进行字符识别,获取档案关键信息。获取档案一录数据,判断档案一录数据的关键信息与字符识别后所提取的档案关键信息是否一致。如是,获取档案二录数据,并判断档案二录数据与档案一录数据是否一致;如是,进行著录数据质检,判断著录数据是否正确;如是,将著录数据存储到档案数据库中。计算机装置执行计算机程序时实现上述的方法。计算机可读存储介质被读取时实现上述的方法。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种流程化档案数据数字化处理方法、计算机装置及计算机可读存储介质。
背景技术
随着计算机网络技术的快速发展,档案数字化已成为档案工作发展的必然趋势。档案数字化不仅可以节省档案存贮空间,缓解库房压力,又可以妥善解决档案的利用问题,减少因对档案原件频繁使用而造成的磨损,有利于保护档案原件。按照科学的方法、统一的数据标准进行档案数据著录,根据原始纸质档案对现有档案系统中的电子记录进行校对、补正,实现各种形式的档案记录一致性、电子数据的完整性,各种数据之间逻辑严密性,最终达到提高档案利用效率的目标。
现有的档案数据著录,一般由数据著录人员直接在档案管理系统中校对、补正,档案数据的准性确与数据著录人员素质息息相关,主要存在以下缺点:
(1)由于馆藏档案量巨大,很容易出现张冠李戴的情况,也就是实物档案与电子数据不匹配的情况,档案管理系统无法识别并中止操作。
(2)在数据著录的过程中,由于数据著录人员失误或理解错误,无法避免数据指标录入错误的情况,档案管理系统也不能给出及时的提示。
因此,针对现有技术的不足,有必要设计一种关于流程化档案数据的数字化处理方法,提高档案数据关联的正确性以及档案数据著录过程中的正确性。
发明内容
本发明的第一目的在于提供一种流程化档案数据数字化处理方法。
本发明的第二目的在于提供一种计算机装置。
本发明的第三目的在于提供一种计算机可读存储介质。
为实现上述的第一目的,本发明提供的流程化档案数据数字化处理方法包括:显示档案出库窗口,获取档案出库明细数据,生成档案加工任务。确定档案加工任务,获取档案卷内目录数据。读取档案影像数据,并对读取到的档案影像数据进行字符识别,获取档案关键信息。获取档案一录数据,判断档案一录数据的关键信息与字符识别后所提取的档案关键信息是否一致。如是,获取档案二录数据,并判断档案二录数据与档案一录数据是否一致。如是,进行著录数据质检,判断著录数据是否正确;如是,将著录数据存储在档案数据库中。
优选的,读取档案影像数据后,将档案影像数据按确定的命名规则存储在文件夹中,再对读取到的影像数据进行字符识别。
优选的,档案关键信息包括档案编号、用户姓名和档案类别等基本信息。
优选的,若档案二录数据与档案一录数据不一致,判断档案一录数据是否正确;如是,重新获取档案二录数据。
优选的,进行著录数据质检,判断著录数据是否正确的步骤包括:获取档案系统差异值,判断档案系统差异值与档案影像数据是否一致;如是,确认著录数据正确。
优选的,获取档案系统差异值的步骤包括:获取档案系统数据,计算档案系统数据与著录数据的差异值。
优选的,进行著录数据质检,判断著录数据是否正确的步骤还包括:若档案系统差异值与档案影像数据一致,确认档案系统数据错误,并修改档案系统数据。
为实现上述的第二目的,本发明提供的计算机装置包括处理器和存储器,处理器用于执行存储器中存储的计算机程序时实现如上述方案中的流程化档案数据数字化处理方法。
为实现上述的第三目的,本发明提供的计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述方案中的流程化档案数据数字化处理方法。
相对于现有技术,上述方案提供的流程化档案数据数字化处理方法、计算机装置和计算机可读存储介质的有益效果在于:基于两录一校进行档案数据著录,改变了传统的在档案管理系统中校对、补正的模式。在数据著录过程中,先通过光学字符识别技术(OCR)提取出档案数据的关键信息,再进行档案数据一录,并将一录数据的关键信息与OCR提取出来的关键信息比对,确定一录数据的关键信息是否正确;然后进行数据二录,并将二录的数据与一录数据进行全面比对,确定二录数据与一录数据完全一致后进行数据质检,将著录数据与档案系统数据比对,获取档案系统差异值,根据档案系统差异值判断著录数据是否正确,最终实现档案数据入库。本发明数据著录过程中先后智能校验、比对和提醒,大大提高数据关联的正确性及数据著录的准确性。通过最终的数据入库,实现各种形式的档案记录一致性、电子数据的完整性,各种数据之间逻辑严密性,最终达到提高档案利用效率的目标。
附图说明
图1是本发明流程化档案数据数字化处理方法实施例的流程图。
以下结合附图及实施例对本发明作进一步说明。
具体实施方式
流程化档案数据数字化处理方法实施例
本实施例是依据档案原件进行档案数据著录,通过数字化加工,将档案数据以一定的逻辑顺序存储到数据库中,提高档案数据的使用效率,减少档案原件的使用频率,保护档案原件。本实施例中的选用的档案是不动产登记档案,档案原件为不动产的业务档案。档案数据即不动产登记案卷中所记载相关信息,如不动产主体,客体和权利等。
参见图1,本实施例的流程化档案数据数字化处理方法进行档案数据著录时,首先执行步骤S1,显示档案出库窗口,获取档案出库明细数据,生成档案加工任务。
其中,显示档案出库窗口后,获取多个档案的出库明细数据,如档案的出库批次号、出库日期、档案所属单位等,并将出库明细数据在档案出库窗口中显示,从而在档案出库窗口生成多个具有具体出库明细单的档案加工任务。
执行步骤S2,确定具体的档案加工任务,即将步骤S1中的多个档案加工任务中的一个确定为当前的档案加工任务。确定当前档案加工任务后,获取档案卷内目录数据。档案卷内目录数据,即档案的整套目录中,档案各部分目录的具体数据,如某一部分目录在档案中的总页数、页码范围和起始页号等。例如,档案的卷内目录包括“房产所有权证存根”、“产权登记审批书”、“契税证据”等目录,“房产所有权证存根”的目录数据包括:页数为两页,页码范围为第2至第3页,起始页号为第2页等。确定档案卷内目录数据,是为了使在接下来的比对判断环节中能够准确地进行数据比对。
执行步骤S3,读取档案影像数据,并对读取到的档案影像数据进行字符识别,并且提取所识别的字符,获取档案关键信息。
在步骤S3中,扫描仪或摄像头等具有图像获取功能的电子设备生成各纸质档案的影像后,存储模块获取档案影像数据,将档案影像数据按确定的命名规则存储在指定文件夹中,并在挂载档案影像数据后,由OCR处理模块读取存储模块中的档案影像数据,并对读取到的档案影像数据进行字符识别,通过对档案影像数据进行旋转、纠偏、去污等处理步骤,提取所识别的字符,并从提取到的字符中获取档案关键信息。其中,档案关键信息包括档案编号、档案的用户姓名、档案类别等基本信息。该类的基本信息具有清晰、OCR识别准确度高的特点。
获取档案关键信息后,执行步骤S4,获取档案一录数据。档案一录数据,即数据获取模块第一次获取到的档案的全部数据,包括步骤S3中的档案关键信息以及档案的其他数据,如不动产登记案卷中记载的主体,客体、权利等。
获取档案一录数据后,执行步骤S5,判断档案一录数据中的关键信息与步骤S3中通过OCR字符识别所提取的档案关键信息是否一致。若两者不一致,则提示错误,返回步骤S4,数据获取模块重新获取档案一录数据。档案一录数据中的关键信息与步骤S3中的由OCR字符识别所提取的档案关键信息一致后,再跳转至下一著录步骤。
当档案一录数据中的关键信息与步骤S3中的通过OCR字符识别所提取的档案关键信息一致后,执行步骤S6,获取档案二录数据。档案二录数据为数据获取模块第二次获取到的档案的全部数据。这是因为在步骤S4中档案一录数据只进行档案关键信息的比对判断,档案一录数据中的除关键信息外的其他数据未进行比对判断,并不能确保档案一录数据中的除关键信息外的其他数据的准确性。因此,需要获取档案二录数据,并通过将档案二录数据与档案一录数据进行比对判断,从而确保档案数据的准确度。
数据获取模块获取档案二录数据,执行步骤S7,判断档案二录数据与档案一录数据是否一致。判断过程为全面比对,即将档案二录数据中的每一个数据都与档案一录数据中所对应的每一数据进行一一比对判断。
若档案二录数据与档案一录数据不一致,则判断属于档案一录数据错误或属于档案二录数据错误。若判断结果为档案一录数据错误,则返回步骤S4,同时显示“数据二录值”窗口,并在“数据二录值”窗口中生成第一差异值;其中,第一差异值为档案二录数据与档案一录数据的不同数据,即正确的档案数据;然后,根据第一差异值,重新获取正确的档案一录数据。若判断结果为档案二录数据错误,显示“数据一录值”窗口,并在“数据一录值”窗口中生成第二差异值,第二差异值为档案一录数据与档案二录数据的不同数据,即档案一录数据中的正确档案数据。然后,根据第二差异值重新获取档案二录数据。
当档案一录数据与档案二录数据完全一致后,执行步骤S8,进行著录数据质检,判断著录数据是否正确。著录数据,即最终确定的档案著录数据,亦即档案二录数据与档案一录数据完全一致后最终确定的档案数据。
著录数据质检,判断著录数据是否正确的步骤包括:
获取档案系统差异值的步骤;获取档案系统数据,计算档案系统数据与著录数据的差异值,该差异值即为档案系统差异值,亦即档案系统数据与著录数据的不同之处。其中,档案系统数据为其他的外部数据,即在外部的档案系统中所存储的档案数据。在本步骤中通过数据读取模块读取到档案系统数据,然后通过数据处理模块计算档案系统数据与著录数据的差异值(即档案系统差异值)。
判断档案系统差异值与档案影像数据是否一致的步骤;若档案系统差异值与档案影像数据一致,确认档案系统数据错误,并修改档案系统数据,使档案系统数据与著录数据一致;若档案系统差异值与档案影像数据不一致,确认著录数据错误,并返回步骤S6,重新获取正确的档案二录数据(即著录数据)。
著录数据确认正确后,执行步骤S9,进行著录数据入库,将著录数据存储到档案数据库中,最终完成档案数据著录的整个过程。
计算机装置实施例:
本实施例的计算机装置包括有处理器、存储器以及存储在存储器中并可在处理器上运行的计算机程序,例如用于实现上述档案数据著录方法的信息处理程序。处理器执行计算机程序时实现上述实施例的流程化档案数据数字化处理方法的各个步骤。
本发明所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分。
存储器可用于存储计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现终端设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
计算机可读存储介质实施例:
本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述实施例的流程化档案数据数字化处理方法的各个步骤。
其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述仅为本发明的较佳实施例,并不用以限制本发明。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.流程化档案数据数字化处理方法,其特征在于,该方法包括:
显示档案出库窗口,获取档案出库明细数据,生成档案加工任务;
确定档案加工任务,获取档案卷内目录数据;
读取档案影像数据,并对读取到的所述档案影像数据进行字符识别,获取档案关键信息,所述档案关键信息包括档案编号、用户姓名和档案类别;
获取档案一录数据,判断所述档案一录数据的关键信息与字符识别后所提取的档案关键信息是否一致,如不一致,重新获取档案一录数据,如一致,获取档案二录数据,并判断所述档案二录数据与所述档案一录数据是否一致,如是,进行著录数据质检;
判断著录数据是否正确,如是,将著录数据存储在档案数据库中。
2.根据权利要求1所述的流程化档案数据数字化处理方法,其特征在于:
读取所述档案影像数据后,将所述档案影像数据按确定的命名规则存储在文件夹中,再对读取到的所述档案影像数据进行字符识别。
3.根据权利要求1或2所述的流程化档案数据数字化处理方法,其特征在于:
若所述档案二录数据与所述档案一录数据不一致,判断所述档案一录数据是否正确;如是,重新获取档案二录数据。
4.根据权利要求1或2所述的流程化档案数据数字化处理方法,其特征在于,所述进行著录数据质检,判断著录数据是否正确的步骤包括:
获取档案系统差异值:获取档案系统数据,计算所述档案系统数据与所述著录数据的差异值,判断所述档案系统差异值与所述档案影像数据是否一致;如是,确认所述著录数据正确。
5.根据权利要求4所述的流程化档案数据数字化处理方法,其特征在于,所述进行著录数据质检,判断著录数据是否正确的步骤还包括:
若所述档案系统差异值与所述档案影像数据一致,确认所述档案系统数据错误并修改所述档案系统数据。
6.一种计算机装置,包括处理器和存储器,其特征在于:所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至5中任一项所述的流程化档案数据数字化处理方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的流程化档案数据数字化处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811261294.8A CN109359878B (zh) | 2018-10-26 | 2018-10-26 | 档案数据处理方法、计算机装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811261294.8A CN109359878B (zh) | 2018-10-26 | 2018-10-26 | 档案数据处理方法、计算机装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109359878A CN109359878A (zh) | 2019-02-19 |
CN109359878B true CN109359878B (zh) | 2021-02-02 |
Family
ID=65346819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811261294.8A Active CN109359878B (zh) | 2018-10-26 | 2018-10-26 | 档案数据处理方法、计算机装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109359878B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113377902A (zh) * | 2021-05-28 | 2021-09-10 | 南方电网数字电网研究院有限公司 | 一种数字档案著录配置方法、系统、装置和存储介质 |
CN113469168A (zh) * | 2021-07-23 | 2021-10-01 | 山西慧图同创科技有限公司 | 一种基于数字病案进行智能自动著录的服务方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3191217B2 (ja) * | 1990-09-17 | 2001-07-23 | 株式会社日立製作所 | Ocr認識システム |
JP2005071116A (ja) * | 2003-08-25 | 2005-03-17 | Fuji Xerox Co Ltd | 変換サービス支援システム及び、変換方法 |
CN102968426B (zh) * | 2012-07-04 | 2014-02-05 | 南京斯谱蓝自动化科技有限公司 | 档案综合管理系统 |
CN103870826B (zh) * | 2014-03-31 | 2017-10-13 | 深圳市远行科技股份有限公司 | 一种电子档案扫描识别建档的方法及系统 |
CN105550370B (zh) * | 2016-01-26 | 2019-03-26 | 平安科技(深圳)有限公司 | 录入方法及录入系统 |
CN107800917A (zh) * | 2017-12-15 | 2018-03-13 | 定远县网萌电子商务有限公司 | 档案数字化加工智能化工艺流水线平台 |
-
2018
- 2018-10-26 CN CN201811261294.8A patent/CN109359878B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109359878A (zh) | 2019-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210406830A1 (en) | Systems, methods and apparatus for form building | |
US10733434B2 (en) | Method and system for accurately detecting, extracting and representing redacted text blocks in a document | |
US9454545B2 (en) | Automated field position linking of indexed data to digital images | |
CN112052749A (zh) | 档案的归档方法、装置、电子设备及计算机可读存储介质 | |
US11182544B2 (en) | User interface for contextual document recognition | |
CN110888881B (zh) | 图片关联方法、装置、计算机设备及存储介质 | |
CN110321142B (zh) | 一种接口文档更新方法、装置、电子设备及存储介质 | |
CN109739957B (zh) | 基于数据处理的单据信息录入方法、装置、设备及存储介质 | |
CN115116068B (zh) | 一种基于ocr的档案智能归档系统 | |
CN109359878B (zh) | 档案数据处理方法、计算机装置及计算机可读存储介质 | |
CN110457332B (zh) | 一种信息处理方法及相关设备 | |
CN116547944A (zh) | 署名生成装置、认证装置和程序 | |
CN112508717A (zh) | 一种影像信息的审核方法、装置、电子设备及存储介质 | |
CN111784423A (zh) | 发票匹配方法、装置、电子设备和存储介质 | |
CN109324963B (zh) | 自动测试收益结果的方法及终端设备 | |
CN109460318B (zh) | 一种可回滚档案采集数据的导入方法、计算机装置及计算机可读存储介质 | |
CN111428497A (zh) | 一种自动抽取出资信息的方法、装置及设备 | |
CN116798061A (zh) | 一种票据审核识别方法、装置、终端和存储介质 | |
CN115019325A (zh) | 一种基于图像识别的业务处理方法及装置、存储介质 | |
CN113742287B (zh) | 基于数据中台的档案数据归档方法、计算机装置及计算机可读存储介质 | |
CN117194100A (zh) | 文件的修复方法、装置、终端设备和可读存储介质 | |
US11875109B1 (en) | Machine learning (ML)-based system and method for facilitating correction of data in documents | |
CN116680259A (zh) | 一种数据核对方法、装置、设备及存储介质 | |
TWM655760U (zh) | 用於處理發票資料的系統 | |
CN116702709A (zh) | 文档的标准化处理方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |