CN201222256Y - 一种数字化集成加工的档案系统 - Google Patents

一种数字化集成加工的档案系统 Download PDF

Info

Publication number
CN201222256Y
CN201222256Y CNU200820050824XU CN200820050824U CN201222256Y CN 201222256 Y CN201222256 Y CN 201222256Y CN U200820050824X U CNU200820050824X U CN U200820050824XU CN 200820050824 U CN200820050824 U CN 200820050824U CN 201222256 Y CN201222256 Y CN 201222256Y
Authority
CN
China
Prior art keywords
file
metadata
storage server
archives
scanning device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNU200820050824XU
Other languages
English (en)
Inventor
江善东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Wanwei Botong Information Technology Co., Ltd.
Original Assignee
DONGGUAN WANWEI NETWORK TECHNOLOGY INFORMATION Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DONGGUAN WANWEI NETWORK TECHNOLOGY INFORMATION Co Ltd filed Critical DONGGUAN WANWEI NETWORK TECHNOLOGY INFORMATION Co Ltd
Priority to CNU200820050824XU priority Critical patent/CN201222256Y/zh
Application granted granted Critical
Publication of CN201222256Y publication Critical patent/CN201222256Y/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本实用新型涉及档案管理技术领域,尤其设计一种数字化集成加工的档案系统。本实用新型包括,用于扫描纸质文件并获得电子文件的扫描设备,用于将所述电子文件进行图像处理并获得图像文件的图像处理设备,用于将所述图像文件识别为元数据的数据识别设备,用于保存档案数据库的档案存储服务器,用于将所述元数据填入档案数据库相应栏目的数据处理设备;扫描设备与图像处理设备连接,图像处理设备与数据识别设备连接,数据处理设备与数据识别设备、档案存储服务器连接。本技术方案对纸质文件进行扫描,并自动识别元数据,把元数据保存到对应的档案数据库中,从而节省人力物力,降低档案管理成本。

Description

一种数字化集成加工的档案系统
技术领域
本实用新型涉及档案管理技术领域,尤其设计一种数字化集成加工的档案系统。
背景技术
档案管理对于政府机关或企事业单位来说,是一项非常重要的工作。档案包括各类公文,例如已经归档的收文、发文、签报、会议纪要、通告、申请、大事记等文件。管理的档案种类包括,文书档案、科技档案、照片档案、实物档案、声像档案、会计档案等。
传统的档案信息一般用纸质文档存储在档案室里面,查找检索起来非常费时,存储档案空间很大,维护起来不方便;备份档案需要使用大量的资源,而且人工处理可能产生差错。于是,近年来提出了档案信息数字化。档案信息数字化就是把纸质文档通过扫描,录入信息到计算机数据库中,使用计算机存储档案信息,数字化的好处是,检索快捷方便、容易实时同步备份、存储空间小,维护方便、安全。
现有的档案管理方案,首先人工将文件内容录入到档案数据库中,然后人工使用扫描仪对纸质文件进行扫描转换为电子文件,保存到文件数据库以备校对。现有的档案管理方案存在需要花费大量人力物力的问题,档案管理成本高。
实用新型内容
本实用新型提供一种可以降低档案管理成本的数字化集成加工的档案系统。
一种数字化集成加工的档案系统,包括:用于扫描纸质文件并获得电子文件的扫描设备,用于将电子文件进行图像处理并获得图像文件的图像处理设备,用于将图像文件识别为元数据的数据识别设备,用于保存档案数据库的档案存储服务器,用于将元数据填入档案数据库相应栏目的数据处理设备;扫描设备与图像处理设备连接,图像处理设备与数据识别设备连接,数据处理设备与数据识别设备、档案存储服务器连接。
其中,进一步包括用于保存电子文件的文件存储服务器,和用于将电子文件与档案数据库挂接的电子文件挂接设备,文件存储服务器和扫描设备连接,电子文件挂接设备与文件存储服务器、档案存储服务器连接。
其中,数据识别设备为使用反向传播神经网络算法的数据识别设备。
其中,扫描设备为平板式扫描仪。
其中,扫描设备为文件扫描仪。
从以上的技术方案可以看出,本实用新型的数字化集成加工的档案系统包括,用于扫描纸质文件并获得电子文件的扫描设备,用于将电子文件进行图像处理并获得图像文件的图像处理设备,用于将图像文件识别为元数据的数据识别设备,用于保存档案数据库的档案存储服务器,用于将元数据填入档案数据库相应栏目的数据处理设备;扫描设备与图像处理设备连接,图像处理设备与数据识别设备连接,数据处理设备与数据识别设备、档案存储服务器连接;本技术方案对纸质文件进行扫描,并自动识别元数据,把元数据保存到对应的档案数据库中,从而节省人力物力,降低档案管理成本。
附图说明
图1为本实用新型实施例的档案系统示意图。
具体实施方式
请参考图1,为本实用新型实施例的档案系统示意图。
本实施例的数字化集成加工的档案系统,包括:用于扫描纸质文件并获得电子文件的扫描设备101,用于将电子文件进行图像处理并获得图像文件的图像处理设备102,用于将图像文件识别为元数据的数据识别设备103,用于保存档案数据库的档案存储服务器105,用于将元数据填入档案数据库相应栏目的数据处理设备104;扫描设备101与图像处理设备102连接,图像处理设备102与数据识别设备103连接,数据处理设备104与数据识别设备103、档案存储服务器105连接。本技术方案对纸质文件进行扫描,并自动识别元数据,把元数据保存到对应的档案数据库中,从而节省人力物力,降低档案管理成本。
在本实施例中,扫描设备101为平板式扫描仪或文件扫描仪,当然也可以是其它类型的扫描仪,扫描设备101对纸质文件进行扫描,获得该纸质文件的电子文件;扫描设备101将电子文件传输给图像处理设备102。
因为纸质差异和扫描条件等因素的影响,扫描出来的电子文件可能不符合识别的要求,需要使用图像处理设备102对电子文件进行图像处理,获得符合识别要求的图像文件。对图像的处理包括:自动倾斜校正,去黑边,去白页,加粗,将A3切割为A4等。
图像处理设备102将图像文件发送给数据识别设备103。本实施例的数据识别设备103使用的是光学字符识别(OCR,Optical Character Recognition)方式,通过扫描获取纸张上的文字图像信息,可以利用不同识别算法来分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中。OCR是一种快捷、省力的文字识别方式,OCR不仅能识别黑白印刷体汉字,还能识别灰度和彩色印刷体汉字,识别速度很快,识别正确率达到99%以上;可识别宋体、黑体、楷体等多种字体的简、繁体;可对多种字体、不同字号的混排进行识别。OCR还能识别图像、表格。
上述数据识别设备103可以为使用反向传播(BP,back propagation)神经网络算法的数据识别设备103;即使用BP神经网络算法来分析文字形态特征,判断出汉字的标准编码。BP神经网络算法,是一个单向传播的多层前馈网络,输入信号从输入层节点,依次传过各隐含层节点,然后传到输出层节点,每一层节点的输出只影响下一层节点的输入,使用该算法的识别效果好。
上述元数据为以栏目为单元的字段。因为档案数据库有自身存储的规则,每个栏目对应特定的字段,在识别出元数据后,数据处理设备104将元数据填入档案存储服务器105的档案数据库相应栏目。比如政府文件通常包括标题和文号,把标题和文号作为元数据,填入档案数据库相应栏目。
为了保存原始的电子文件和将电子文件与档案数据库挂接,本实施例的档案系统进一步包括用于保存电子文件的文件存储服务器107,和用于将电子文件与档案数据库挂接的电子文件挂接设备106,文件存储服务器107和扫描设备101连接,从扫描设备101中获取电子文件,电子文件挂接设备106与文件存储服务器107、档案存储服务器105连接。当对档案数据库里面的数据有疑义时,可以调出相应的电子文件进行复核。
以上内容仅为本实用新型的较佳实施例,对于本领域的普通技术人员,依据本实用新型的思想,在具体实施方式及应用范围上均会有改变之处,本说明书内容不应理解为对本实用新型的限制。

Claims (5)

1.一种数字化集成加工的档案系统,其特征在于,包括:用于扫描纸质文件并获得电子文件的扫描设备,用于将所述电子文件进行图像处理并获得图像文件的图像处理设备,用于将所述图像文件识别为元数据的数据识别设备,用于保存档案数据库的档案存储服务器,用于将所述元数据填入档案数据库相应栏目的数据处理设备;扫描设备与图像处理设备连接,图像处理设备与数据识别设备连接,数据处理设备与数据识别设备、档案存储服务器连接。
2.根据权利要求1所述的数字化集成加工的档案系统,其特征在于,进一步包括用于保存所述电子文件的文件存储服务器,和用于将所述电子文件与档案数据库挂接的电子文件挂接设备,文件存储服务器和扫描设备连接,电子文件挂接设备与文件存储服务器、档案存储服务器连接。
3.根据权利要求1所述的数字化集成加工的档案系统,其特征在于,所述数据识别设备为使用反向传播神经网络算法的数据识别设备。
4.根据权利要求1至3任意一项所述的数字化集成加工的档案系统,其特征在于,所述扫描设备为平板式扫描仪。
5.根据权利要求1至3任意一项所述的数字化集成加工的档案系统,其特征在于,所述扫描设备为文件扫描仪。
CNU200820050824XU 2008-07-18 2008-07-18 一种数字化集成加工的档案系统 Expired - Fee Related CN201222256Y (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNU200820050824XU CN201222256Y (zh) 2008-07-18 2008-07-18 一种数字化集成加工的档案系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNU200820050824XU CN201222256Y (zh) 2008-07-18 2008-07-18 一种数字化集成加工的档案系统

Publications (1)

Publication Number Publication Date
CN201222256Y true CN201222256Y (zh) 2009-04-15

Family

ID=40575759

Family Applications (1)

Application Number Title Priority Date Filing Date
CNU200820050824XU Expired - Fee Related CN201222256Y (zh) 2008-07-18 2008-07-18 一种数字化集成加工的档案系统

Country Status (1)

Country Link
CN (1) CN201222256Y (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101986292A (zh) * 2009-07-28 2011-03-16 国际商业机器公司 根据图像处理表单的方法和系统
CN102968426A (zh) * 2012-07-04 2013-03-13 南京斯谱蓝自动化科技有限公司 档案综合管理系统
CN103093298A (zh) * 2012-06-18 2013-05-08 北京航星永志科技有限公司 一种图像或影像文件的多版本数字档案管理与应用方法
CN105260759A (zh) * 2015-11-03 2016-01-20 无锡同春新能源科技有限公司 录入老年人个体的下肢护理数据的信息资料的rfid
CN105868306A (zh) * 2016-03-25 2016-08-17 西安网域电子科技有限公司 一种基于扫描仪的二维码自动识别挂接方法及系统
CN107729576A (zh) * 2017-11-28 2018-02-23 北京筑业志远软件开发有限公司 档案的管理方法和系统
CN111709694A (zh) * 2019-11-27 2020-09-25 西安泾渭数联信息技术有限公司 档案动态更新装置及其方法
CN114449125A (zh) * 2022-01-19 2022-05-06 湖北华钦麒科技有限公司 一种基于档案信息资源规划的档案整理与数字化加工系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101986292A (zh) * 2009-07-28 2011-03-16 国际商业机器公司 根据图像处理表单的方法和系统
CN101986292B (zh) * 2009-07-28 2014-05-21 国际商业机器公司 根据图像处理表单的方法和系统
CN103093298A (zh) * 2012-06-18 2013-05-08 北京航星永志科技有限公司 一种图像或影像文件的多版本数字档案管理与应用方法
CN103093298B (zh) * 2012-06-18 2015-12-02 北京航星永志科技有限公司 一种图像或影像文件的多版本数字档案管理与应用方法
CN102968426A (zh) * 2012-07-04 2013-03-13 南京斯谱蓝自动化科技有限公司 档案综合管理系统
CN102968426B (zh) * 2012-07-04 2014-02-05 南京斯谱蓝自动化科技有限公司 档案综合管理系统
CN105260759A (zh) * 2015-11-03 2016-01-20 无锡同春新能源科技有限公司 录入老年人个体的下肢护理数据的信息资料的rfid
CN105868306A (zh) * 2016-03-25 2016-08-17 西安网域电子科技有限公司 一种基于扫描仪的二维码自动识别挂接方法及系统
CN107729576A (zh) * 2017-11-28 2018-02-23 北京筑业志远软件开发有限公司 档案的管理方法和系统
CN111709694A (zh) * 2019-11-27 2020-09-25 西安泾渭数联信息技术有限公司 档案动态更新装置及其方法
CN114449125A (zh) * 2022-01-19 2022-05-06 湖北华钦麒科技有限公司 一种基于档案信息资源规划的档案整理与数字化加工系统

Similar Documents

Publication Publication Date Title
CN201222256Y (zh) 一种数字化集成加工的档案系统
US11126839B2 (en) Document clustering and reconstruction
US5903904A (en) Iconic paper for alphabetic, japanese and graphic documents
US7340112B2 (en) Labeling system and methodology
US6243501B1 (en) Adaptive recognition of documents using layout attributes
WO2022057707A1 (zh) 文本识别方法、图像识别分类方法、文档识别处理方法
US6023528A (en) Non-edit multiple image font processing of records
CN100517372C (zh) 自动创建索引的图像形成装置及其方法
US9378205B1 (en) System and method for managing and sharing pharmaceutical clinical trial regulatory documents
CN102081615A (zh) 一种基于档案信息资源规划的档案整理与数字化加工系统
CN112052749A (zh) 档案的归档方法、装置、电子设备及计算机可读存储介质
CN102915437A (zh) 文本信息识别方法及系统
CN105335453B (zh) 图像分文档方法
CN114021543B (zh) 基于表格结构解析的文档比对分析方法及系统
US20100202015A1 (en) Image processing apparatus, image processing method, program, and storage medium
CN104346415A (zh) 图像文档命名的方法
CN201570028U (zh) 一种电子文件归档管理的系统
CN1245935A (zh) 名片全自动识别录入与检索系统
CN112633042A (zh) 一种数字化档案管理系统及方法
CN115116082A (zh) 一种基于ocr识别算法的一键成档系统
KR20060001392A (ko) 문자 인식을 이용한 내용검색 기반의 문서 이미지 저장 방법
CN201570062U (zh) 一种基于档案信息资源规划的档案整理与数字化加工系统
CN112464907A (zh) 一种文档处理系统及方法
Maderlechner et al. Classification of documents by form and content
CN102591878A (zh) 技术标准的数字化处理方法

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: GUANGDONG WANVE BOTONG INFORMATION TECHNOLOGY CO.,

Free format text: FORMER NAME: DONGGUAN WANWEI NETWORK TECHNOLOGY INFORMATION CO., LTD.

CP03 Change of name, title or address

Address after: 523123, Guangdong City, Dongguan Province, the first international block No. 02, 11, Guangdong, world wide Broadcom Information Technology Co., Ltd.

Patentee after: Guangdong Wanwei Botong Information Technology Co., Ltd.

Address before: 523071, Guangdong City, Dongguan Province, the United States Road, the first international B block 1102, Dongguan City Wide Web Technology Information Co., Ltd.

Patentee before: Dongguan Wanwei Network Technology Information Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090415

Termination date: 20170718

CF01 Termination of patent right due to non-payment of annual fee