CN102637268A - 数字档案馆系统 - Google Patents

数字档案馆系统 Download PDF

Info

Publication number
CN102637268A
CN102637268A CN2012100889651A CN201210088965A CN102637268A CN 102637268 A CN102637268 A CN 102637268A CN 2012100889651 A CN2012100889651 A CN 2012100889651A CN 201210088965 A CN201210088965 A CN 201210088965A CN 102637268 A CN102637268 A CN 102637268A
Authority
CN
China
Prior art keywords
module
retrieval
server
digital
digital archives
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100889651A
Other languages
English (en)
Inventor
罗渊
王航
赵俊辉
侯彦文
丁镇涛
陈云川
毛正雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YUNNAN YUANXIN TECHNOLOGY Co Ltd
Original Assignee
YUNNAN YUANXIN TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YUNNAN YUANXIN TECHNOLOGY Co Ltd filed Critical YUNNAN YUANXIN TECHNOLOGY Co Ltd
Priority to CN2012100889651A priority Critical patent/CN102637268A/zh
Publication of CN102637268A publication Critical patent/CN102637268A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

数字档案馆系统,本发明由数字档案馆存储系统、数字档案馆服务器、客户端依序连接构成。本发明将公司总部和基层各单位、部门,将各种档案数据信息化,信息数据档案化,档案业务流程计算机化、网络化,建立起了企业对内、横向、纵向的信息传送渠道;把分散于不同载体,不同地理位置的信息资源以数字化的形式存储,以高度有序的企业综合档案信息资源为处理核心,为企业生产、管理和决策提供可靠的档案信息服务的超大规模、分布式数字信息系统。

Description

数字档案馆系统
技术领域
本系统属于档案数据信息化,信息数据档案化,档案业务流程计算机化、网络化领域。
背景技术
目前档案信息数字化还不能够很好的达到统一存放、备份、利用的目的,存在应用模式分散,可利用的数字化信息有限、档案信息共享性差、没有形成电网公司全部统一的档案业务支撑运行平台,检索内容单一且范围比有限等等问题
基于集中模式下的数字档案业务应用平台, 对于提高数字资源利用,保证档案信息数据的集中性、一致性、完备性、可靠性,都将起着举足轻重的作用,为全面信息化建设与发展奠定良好的基础。
为了更好的提供数字档案的查询效率,引入了新的技术。全文检索是一种快速的字串匹配系统,为了获得良好的检索效果,使用了一系列知识词典,根据用途,总共包括了八种词典:分词词典(SEGMENT)、附加分词词典(SEGMENTEX)、停用词典(STOP)、附加停用词典(STOPEX)、稀疏词典(SPARSE)、主题词典(THESAURUS)、同义词典(SYNONYM)、反义词典(ANTONYM)。其中,分词词典、附加分词词典、停用词典、附加停用词典和稀疏词典是用来建立数据库的索引并进行查询的词典,统称为索引词典;主题词典、同义词典和反义词典是用于智能扩展检索的词典,统称为辅助知识词典。同时,引入了两种索引类型:B+树索引和倒排(INVERT)索引。这两种类型的索引相辅相成,互为补充。针对中文索引,索引策略有按中文词检索的索引策略、按中文字检索的索引策略、按用户自定义关键词的索引策略,以及二元组索引策略。
发明内容
本发明的目的正是为了克服上述现有档案信息数字化还不能够很好的达到统一存放、备份、利用的目的,而提供一种应用模式集中,可利用的数字化信息广泛、档案信息共享性好、能够形成电网公司全部统一的档案业务支撑运行平台,检索内容途径多样化且范围宽广的数字档案馆系统。
本发明的目的是通过如下技术方案来实现的。
数字档案馆系统,本发明由数字档案馆存储系统、数字档案馆服务器、客户端依序连接构成;其中,数字档案馆存储系统分别由设置的专题管理模块、文档检索模块、借阅管理模块、公告管理模块、系统管理模块构成;专题管理模块内分别设置有个人专题模块和系统专题模块;文档检索模块内分别设置有模糊检索模块、精确检索模块和目录检索模块;
数字档案馆服务器由数据服务模块、应用服务模块、Web服务器依序连接构成,其中,数据服务模块内分别设置有文本检索系统模块、中文知识管理工具包模块、关系数据库内容检索引擎模块;应用服务模块内分别设置有EJB服务器和流程引擎服务器;
数字档案馆服务器依序通过交换机、防火墙、Internet与客户端连接。
其功能模块包括如下内容:
1)专题管理模块:专题管理下又包括个人专题、系统专题,其中系统专题只能由系统管理员进行编辑,其他人员具有浏览的权限;而个人专题则可以进行个性化设置,具有增加、修改、删除、查询的权限;同时,每个专题下又包括很多文件,点击文件名称,能够查阅文件的详情;
2)文档检索模块:文档检索包括3个部分,分别是模糊检索、精确检索和目录检索;模糊检索是通过输入关键字,查询系统中发文、收文、刊物、签报、合同等跟关键字匹配的公文,并呈现所有符合条件的条目;精确检索是明确被查找对象的分类的情况下,通过关键字段及属性组合,对信息进行精确查询和定位的功能;目录检索功能是对上架的馆藏档案进行检索,不涉及到其它数据库,能够按照任意的档案条目信息进行检索的功能;
3)借阅管理模块:借阅管理提供数字档案、图书文件的借阅功能,包括借阅申请、借阅审批和档案归还;对于某一档案,未开放查看权限的用户,只能查看该档案的档案名、关键字、摘要等主要信息;
4)公告管理模块:公告管理为数字档案馆管理员在系统中对公告的管理平台,通过此平台,能够实现对数字档案馆公告的起草、发布与删除;
5) 系统管理模块:系统管理主要提供角色、人员的编辑功能,同时借阅流程的配置、修改也在此功能模块中实现。
本发明的有益效果是:
1.  基于成本优化的查询算法(索引分区技术, 多线程并行运算技术,面向全文检索的Cache技术), 使得G级数据库查询速度达到亚秒级,并支持大量并发用户的同时访问。
2.  提供分布式检索和负载均衡集群服务器,支持数据库一对多的单向镜像, 提高系统的并发访问性能,在保证系统性能可用的情况下降低总的拥有成本 。
3.   多线程设计,支持SMP体系结构。
4.   支持跨平台计算:支持NT4.0, Linux, Sun Solaris,IBM AIX, HP-UX,Compaq True Unix, SGI IRIX,SCO Unix。
5.  除了提供规范的C/C++ API外,还提供COM和JavaBeans组件, 可以使用符合工业标准的开发工具进行快速开发(ASP和JSP)。
6.  支持Unicode(WCS2)。
7.  领先的中文信息处理技术:内嵌汉语自动分词系统,支持按词索引、按字索引、按关键词索引、二元组索引、字词混合索引、词根索引语言,大大提高检索的准确性和响应时间。
8. 检索信息快、准而且全:允许使用文中的任意字、词、句和片段进行检索,提供了基于文献内容而不仅仅是文献外部特征的全文检索手段。所提供的按词和按用户自定义关键词进行索引和检索,以及基于知识词典的扩展检索功能,满足了特殊应用领域的高查准率和高查全率的要求。
9.  检索功能强大:全方位检索手段,提供了多达48种检索运算符。包括外部特征与正文内容的各种逻辑组合检索、位置检索、二次检索、渐进检索、历史检索、词根检索、大小写敏感检索、概念检索、对检索结果按与检索表达式的相关性和重要性程度排序等。
10.  安全性好: 具有系统级、数据库级、记录级和字段级四级安全控制机制。
下面结合附图及实施例进一步阐述本发明内容。
附图说明
图1为本发明连接结构示意图。
具体实施方式
数字档案馆系统,本发明由数字档案馆存储系统、数字档案馆服务器、客户端依序连接构成;其中,数字档案馆存储系统分别由设置的专题管理模块、文档检索模块、借阅管理模块、公告管理模块、系统管理模块构成;专题管理模块内分别设置有个人专题模块和系统专题模块;文档检索模块内分别设置有模糊检索模块、精确检索模块和目录检索模块;
数字档案馆服务器由数据服务模块、应用服务模块、Web服务器依序连接构成,其中,数据服务模块内分别设置有文本检索系统模块、中文知识管理工具包模块、关系数据库内容检索引擎模块;应用服务模块内分别设置有EJB服务器和流程引擎服务器;
数字档案馆服务器依序通过交换机、防火墙、Internet与客户端连接。
本发明其功能模块包括如下内容:
1)专题管理模块:专题管理下又包括个人专题、系统专题,其中系统专题只能由系统管理员进行编辑,其他人员具有浏览的权限;而个人专题则可以进行个性化设置,具有增加、修改、删 除、查询的权限;同时,每个专题下又包括很多文件,点击文件名称,能够查阅文件的详情;
2)文档检索模块:文档检索包括3个部分,分别是模糊检索、精确检索和目录检索;模糊检索是通过输入关键字,查询系统中发文、收文、刊物、签报、合同等跟关键字匹配的公文,并呈现所有符合条件的条目;精确检索是明确被查找对象的分类的情况下,通过关键字段及属性组合,对信息进行精确查询和定位的功能;目录检索功能是对上架的馆藏档案进行检索,不涉及到其它数据库,能够按照任意的档案条目信息进行检索的功能;
3)借阅管理模块:借阅管理提供数字档案、图书文件的借阅功能,包括借阅申请、借阅审批和档案归还;对于某一档案,未开放查看权限的用户,只能查看该档案的档案名、关键字、摘要等主要信息;
4)公告管理模块:公告管理为数字档案馆管理员在系统中对公告的管理平台,通过此平台,能够实现对数字档案馆公告的起草、发布与删除;
5)系统管理模块:系统管理主要提供角色、人员的编辑功能,同时借阅流程的配置、修改也在此功能模块中实现。

Claims (1)

1.数字档案馆系统,其特征是,由数字档案馆存储系统、数字档案馆服务器、客户端依序连接构成;其中,数字档案馆存储系统分别由设置的专题管理模块、文档检索模块、借阅管理模块、公告管理模块、系统管理模块构成;专题管理模块内分别设置有个人专题模块和系统专题模块;在文档检索模块内分别设置有模糊检索模块、精确检索模块和目录检索模块;
数字档案馆服务器由数据服务模块、应用服务模块、Web服务器依序连接构成,其中,数据服务模块内分别设置有文本检索系统模块、中文知识管理工具包模块、关系数据库内容检索引擎模块;在应用服务模块内分别设置有EJB服务器和流程引擎服务器;
数字档案馆服务器依序通过交换机、防火墙、Internet与客户端连接。
CN2012100889651A 2012-03-30 2012-03-30 数字档案馆系统 Pending CN102637268A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100889651A CN102637268A (zh) 2012-03-30 2012-03-30 数字档案馆系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100889651A CN102637268A (zh) 2012-03-30 2012-03-30 数字档案馆系统

Publications (1)

Publication Number Publication Date
CN102637268A true CN102637268A (zh) 2012-08-15

Family

ID=46621656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100889651A Pending CN102637268A (zh) 2012-03-30 2012-03-30 数字档案馆系统

Country Status (1)

Country Link
CN (1) CN102637268A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745304A (zh) * 2013-12-19 2014-04-23 镇江锐捷信息科技有限公司 一种数字化档案资料管理方法
CN107330077A (zh) * 2017-07-01 2017-11-07 广东电网有限责任公司信息中心 一种数字档案馆档案的检索方法
CN109615327A (zh) * 2018-12-06 2019-04-12 贵州电网有限责任公司 一种财务档案管理系统
CN109872802A (zh) * 2017-12-05 2019-06-11 深圳市易特科信息技术有限公司 区域医学影像存储系统及存储方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1845108A (zh) * 2005-04-06 2006-10-11 江苏省电力公司 数字档案馆工程档案模板及其操控运行方法
CN102147896A (zh) * 2011-05-04 2011-08-10 湖北省电力公司电力试验研究院 电网输电线路特殊区域地理信息管理数字化系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1845108A (zh) * 2005-04-06 2006-10-11 江苏省电力公司 数字档案馆工程档案模板及其操控运行方法
CN102147896A (zh) * 2011-05-04 2011-08-10 湖北省电力公司电力试验研究院 电网输电线路特殊区域地理信息管理数字化系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745304A (zh) * 2013-12-19 2014-04-23 镇江锐捷信息科技有限公司 一种数字化档案资料管理方法
CN107330077A (zh) * 2017-07-01 2017-11-07 广东电网有限责任公司信息中心 一种数字档案馆档案的检索方法
CN107330077B (zh) * 2017-07-01 2020-07-14 广东电网有限责任公司信息中心 一种数字档案馆档案的检索方法
CN109872802A (zh) * 2017-12-05 2019-06-11 深圳市易特科信息技术有限公司 区域医学影像存储系统及存储方法
CN109615327A (zh) * 2018-12-06 2019-04-12 贵州电网有限责任公司 一种财务档案管理系统

Similar Documents

Publication Publication Date Title
Dong et al. Indexing dataspaces
CN100437585C (zh) 基于倒排表进行检索提示的方法
WO2007002412A2 (en) Systems and methods for retrieving data
CN103412933A (zh) 一种云搜索平台
CN102004775A (zh) 一种基于智能搜索的福富企业搜索引擎技术
CN101894143A (zh) 一种联邦检索及检索结果集成展现方法及系统
Cheng et al. Supporting entity search: a large-scale prototype search engine
CN102637268A (zh) 数字档案馆系统
CN101887417A (zh) 一种搜索方法
CN116034349A (zh) 列式分析存储格式的半结构化数据的概率文本索引
Shakhovska et al. Big Data Model" Entity and Features"
Qian et al. An evaluation of Lucene for keywords search in large-scale short text storage
Li et al. Application research of machine learning method based on distributed cluster in information retrieval
Han et al. Design and implementation of elasticsearch for media data
Gao et al. Supporting a social media observatory with customizable index structures: Architecture and performance
邝砾 et al. Using inverted indexing to facilitate composition-oriented semantic service discovery
CN102597969A (zh) 带属性的键值存储的数据库管理装置及其键值存储结构的高速缓存装置
Truică et al. A scalable document-based architecture for text analysis
Zhu et al. Semantic-distance based evaluation of ranking queries over relational databases
Zhou et al. A distributed text mining system for online web textual data analysis
Nguyen Bridging semantic gaps in information retrieval: Context-based approaches
Stamou et al. Exploring Balkanet Shared Ontology for Multilingual Conceptual Indexing.
CN202084035U (zh) 一种检索系统
Qi et al. Network electronic record management based on linked data
Liu Development of Comprehensive Archives Management Information System Based on B/S Structure

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120815