CN101520804B - 基于sql数据库的文件检索系统与方法 - Google Patents
基于sql数据库的文件检索系统与方法 Download PDFInfo
- Publication number
- CN101520804B CN101520804B CN2009101060850A CN200910106085A CN101520804B CN 101520804 B CN101520804 B CN 101520804B CN 2009101060850 A CN2009101060850 A CN 2009101060850A CN 200910106085 A CN200910106085 A CN 200910106085A CN 101520804 B CN101520804 B CN 101520804B
- Authority
- CN
- China
- Prior art keywords
- file
- excel
- index file
- sql database
- sql
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于SQL数据库的文件检索系统及方法。其中,该文件检索系统包括:获取记载了多个底层文件的文件名和摘要信息、且为Excel格式的Excel索引文件的文件上传模块;提取Excel索引文件中每个底层文件的超链接并对应保存至在Excel索引文件中的一个新增列,且将每个Excel索引文件对应处理为一个SQL数据表文件的SQL数据处理模块;存储每个Excel索引文件对应的SQL数据表文件的SQL数据库;提供用户输入检索条件,根据检索条件检索SQL数据库,并将检索结果显示给用户的检索模块。本发明将每个Excel索引文件统一转换至SQL数据库进行管理,具有操作简单、快速检索的优点,提高了文件管理和检索效率。
Description
技术领域
本发明涉及一种信息检索系统,尤其是涉及一种基于SQL数据库的文件检索系统与方法。
背景技术
大中型企业有众多细分的部门,各个部门一般采取Microsoft Office Excel软件生成Excel文件记载本部门的工作进度、销售状况等信息,并将Excel文件配合企业内部的局域网进行文件的挂网共享及检索查阅,各类挂网的Excel文件作为数据库提供查阅服务。
一般而言,企业的文件架构一般分为3层:第一层为底层文件,该底层文件即为原始签发文件,有原件及电子文件两种形式保存,该电子文件格式可为任何格式的文件,且文件名符合企业统一的命名规则,为查阅者最终查找的目标文件;第二层为索引文件,该索引文件统一使用Excel文件建立,按类别将底层文件的文件名及重要信息一条一条的记录在对应索引文件中,并结合Excel超链接功能链接原始文件,供查阅者搜索到记录后直接点击其链接查阅源文件,此Excel索引文件起数据库管理作用,提供文件查阅服务;第三层为索引文件总目录,此文件为第二层索引文件的汇总,体现企业文件体系架构及便于查阅者快捷进入二层索引文件进行查询。
上述使用Excel总索引表、表内超链接实际文件并挂网的模式管理共享类电子档文件,尽管满足查阅者基本的文件查阅,但其存在如下缺陷:
1、由于Excel软件自身缺陷、文件行数最大不能超过65535行,且行数越多打开越慢,只适合小型的文件存储及检索系统;
2、因不同类型或同类型不同年份造成第二层Excel索引文件多、文件结构复杂,如要在上百个Excel文件中按关键字查找想要的内容,需要一个个打开查询,检索速度慢,实现很困难;
3、由于Excel自身缺陷而存在文件架构复杂,导致因检索过程复杂而效率较低。检索某一文件需经过一系列步骤:如先要进入企业内部网找到部门文件夹,在上百个不同类别的索引文件中找到某一类索引文件并打开,找到指定文件及路径,再点击查看源文件,整个过程复杂繁琐、耗时长,并且常常因文件系统结构复杂而找不到所要的文件。
因此,如何克服目前Excel文件自身缺陷而存在文件架构复杂和检索过程复杂等缺陷,构建一种准确、快速和便捷查阅文件的检索系统,已成为当前急需解决的技术难题之一。
发明内容
本发明提出一种基于SQL数据库的文件检索系统与方法,通过将每个Excel索引文件统一转换至SQL数据库进行检索管理,从而解决目前基于Excel文件的检索系统存在多个Excel文件不能同时检索、Excel自身行数限制导致信息量少和检索速度慢等缺陷的技术问题。
为解决本发明的技术问题,本发明采用了如下技术方案:一种基于SQL数据库的文件检索系统,其包括:
获取记载了多个底层文件的文件名和摘要信息、且为Excel格式的Excel索引文件的文件上传模块;
提取Excel索引文件中每个底层文件的超链接并对应保存至在Excel索引文件中的一个新增列,且将每个Excel索引文件对应处理为一个SQL数据表文件的SQL数据处理模块;
存储每个Excel索引文件对应的SQL数据表文件的SQL数据库;
提供用户输入检索条件,根据检索条件检索SQL数据库,并将检索结果显示给用户的检索模块。
其中,所述文件上传模块包括:
由用户选择Excel索引文件的路径和文件名进行上传的手动上传文件模块;
通过监控Excel索引文件的更新时间属性信息,当判断更新时间发生改变时自动将该Excel索引文件上传的自动更新文件模块。
而所述检索结果为二层显示结构,其第一层为符合检索条件的文件表格,第二层为对应文件表格中每个文件符合检索条件的记录;且所述记录包括链接至一个底层文件的超链接。
另外,本发明公开一基于SQL数据库的文件检索方法,其包括:
获取记载了多个底层文件的文件名和摘要信息、且为Excel格式的Excel索引文件;
提取Excel索引文件中每个底层文件的超链接并对应保存至在Excel索引文件中的一个新增列,且将每个Excel索引文件对应处理为SQL数据库中的一个SQL数据表文件;
提供用户输入检索条件,根据检索条件检索SQL数据库,并将检索结果显示给用户。
与现有技术相比,本发明具有如下有益效果:
1、本发明通过建立基于SQL数据库来使系统数据源脱离原各类Excel报表模式,统一转换到SQL数据库模式管理,由此解决了Excel文件管理模式存在多Excel文件不能同时检索、Excel自身行数限制导致信息量少、操作速度慢以及因不熟悉文件架构查找文件难等问题,从而达到准确、快速、便捷查阅文件的目的。
2、本发明采取一个Excel索引文件对应上传生成一个SQL数据表文件,因此数据上传时无需考虑各Excel索引文件间的内容差异以及各类文件体系结构之间的差异,使系统的通用性强;且更新数据时,无需判断文件中的具体更新数据,摒弃逐条添加或删除的低效率数据更新方式,只需对该Excel索引文件对应的SQL数据表进行删除与生成。
3、上传Excel索引文件是以自动实时更新文件方式与手动上传文件方式相结合,上传方式灵活且人性化。
4、SQL数据处理模块可自动提取Excel索引文件中的超链接,搜索显示方式采取二层显示结构,即第一层显示符合条件的文件表格,第二层显示该文件表格中一个具体文件中的符合条件的记录,通过每一个记录对应的超链接即可链接至底层文件进行查阅,方便了用户操作与查阅。
附图说明
图1是本发明的系统结构示意图;
图2是本发明的部分流程示意图。
具体实施方式
本发明是在目前企业基于Excel文件的三层文件架构的基础上,将第二层的Excel索引文件一转换到数据库模式管理,使系统数据源脱离原各类Excel报表模式,并能兼容当前文件架构及Excel文件挂网操作方式,实现性能稳定和处理速度较快的文件检索系统。
如图1所示,本发明的文件检索系统1架设于局域网或城域网中的一台个人电脑或服务器之上,其通过以太网或虚拟专网(Virtual Private Network,VPN)连接不同部门或不同单位的专用服务器2,该专用服务器2上包括使用Excel文件建立的Excel索引文件;文件检索系统1通过文件上传模块11将专用服务器2上的Excel索引文件上传,由SQL数据处理模块12将每一个上传的Excel索引文件处理成SQL数据库13之中生成一一对应的SQL数据表文件,用户通过检索模块14输入的关键字进行检索,通过检索结果中提供的超链接功能链接原始文件(底层文件)。
其中,Excel索引文件按类别将底层文件(包括原件及电子文件两种形式存,该电子文件格式可为任何格式的文件,且文件名符合企业统一的命名规则,为查阅者最终查找的目标文件)的文件名及重要信息(比如摘要信息)一条一条的记录在对应索引文件中,并结合Excel超链接功能链接原始文件,供查阅者搜索到记录后直接点击其链接查阅源文件,此Excel索引文件起数据库管理作用,提供文件查阅服务。
另外,文件上传模块11包括:以手动方式控制将Excel索引文件上传的手动上传文件模块111,以及通过检测该文件的更新时间属性进行文件的自动更新上传,实现了无人员介入自动实时更新文件的自动更新文件模块112。结合图2所示,若由手动上传文件模块111采用手动上传,则处理流程为步骤S201至步骤S204;若由自动更新文件模块112进行自动上传,则处理流程为步骤S205至步骤S208。
步骤S201:人工选择需要上传的Excel索引文件,获得文件的路径和文件名。
步骤S202:询问用户是否需要更改Excel索引文件的文件名。如用户选择更改,则转步骤S203,否则赚步骤S204。
步骤S203:用户输入新的文件名进行文件名修改,即后续步骤中将按修改后的文件名生成对应该文件名的SQL数据表。比如,将原文件名“**.xls”修改为“****.xls”,则在步骤S22中生成的SQL数据表文件为“****.dbo”。
步骤S204:经用户确认后开始上传Excel索引文件,将Excel索引文件通过网络从专用服务器2复制到文件检索系统1的临时文件夹或临时存储器。
步骤S205:系统预先将需要实时更新的Excel索引文件进行统一归类,按文件逐一访问的方式,监控每个文件的更新时间属性。
步骤S206:判断Excel索引文件的更新时间属性是否发生改变,从而判断出Excel索引文件是否作了更新处理。
步骤S207:若当前Excel索引文件的更新时间属性没发生改变,则访问下一个Excel索引文件进行监控与判断处理。
步骤S208:若当前Excel索引文件的更新时间属性发生改变,则将该Excel索引文件上传,将Excel索引文件通过网络从专用服务器2复制到文件检索系统1的临时文件夹或临时存储器。
而SQL数据处理模块12处理Excel索引文件的过程如步骤S21和步骤S22:
步骤S21:SQL数据处理模块12从文件检索系统1的临时文件夹或临时存储器中获取上传的Excel索引文件,调用Microsoft Office Excel软件打开Excel索引文件,提取该Excel索引文件中记录的底层文件对应的超链接,并在该Excel索引文件新增一列一一对应保存各个底层文件对应的超链接,以便客户用户通过检索模块14检索时,能通过检索结果中的超链接,直接点击该超链接能够查阅对应的底层文件;并于处理完毕后保存文件,退出Excel软件。
步骤S22:将处理好的Excel索引文件生成SQL数据库中一个对应的SQL数据表文件。
当然,对SQL数据库13可进行添加记录、修改记录和删除记录的操作。添加记录即为向SQL数据库13中添加一个SQL数据表文件,具体处理流程如图2所示。若需要修改或删除SQL数据库13中一项记录时,由于每个SQL数据表文件对应一个Excel索引文件,因此,只需要先在SQL数据库13中删除对应的一个SQL数据表文件,再按照图2所示步骤上传更新后的Excel索引文件,生成一个新的SQL数据表文件。
因此,本发明是基于一个企业中各个部门文件架构及文件本身构成的差异性,多个Excel索引文件上传时无法将所有数据集成到一个SQL数据表中,所以采取一个Excel索引文件对应生成一个SQL数据表的数据管理方式存放数据,使得系统的通用性强,系统无需考虑各单位部门文件架构及文件本身差异,直接将一个Excel索引文件对应生成一个SQL数据表即可;同时也简化了对数据库的管理,如需更新数据时,无需判断Excel索引文件中的具体更新数据,摒弃逐条添加或删除的低效率数据更新方式,只需对该Excel索引文件对应的SQL数据表进行整体删除与生成即可。
另外,检索模块14提供用户进行信息检索的精简检索界面,实现了如谷歌、百度搜索模式的关键字搜索,检索的内容即为对应传入SQL数据库13的Excel索引文件。检索模块14支持包含、不包含搜索和多关键字搜索;检索方式支持与、或、非、精确及模糊搜索;检索范围支持所有文件和指定文件搜索。
由于搜索对象为对应所有Excel索引文件的SQL数据库13,而Excel索引文件只是记载了底层文件的名字及相应的摘要信息,因此,搜索结果可以采用二层显示结构:首先搜索出符合条件的文件并显示在“文件表格”中,再点击“文件表格”中的一个文件名,该文件中符合条件的记录将显示在“内容表格”中。用户即选择“内容表格”中的一条记录即链接到源文件进行查阅,从而使检索系统性能稳定、速度快。
综上,本发明通过建立基于SQL数据库来使系统数据源脱离原各类Excel报表模式,统一转换到SQL数据库模式管理,由此解决了Excel文件管理模式存在多Excel文件不能同时检索、Excel自身行数限制导致信息量少、操作速度慢以及因不熟悉文件架构查找文件难等问题,从而达到准确、快速、便捷查阅文件的目的。相比现有技术而言,本发明还具有如下有益技术效果:
1、本发明采取一个Excel索引文件对应上传生成一个SQL数据表文件,因此数据上传时无需考虑各Excel索引文件间的内容差异以及各类文件体系结构之间的差异,使系统的通用性强;且更新数据时,无需判断文件中的具体更新数据,摒弃逐条添加或删除的低效率数据更新方式,只需对该Excel索引文件对应的SQL数据表进行删除与生成。
2、上传Excel索引文件是以自动实时更新文件方式与手动上传文件方式相结合,上传方式灵活且人性化。
3、检索模块的搜索功能全面,搜索内容支持包含、不包含搜索,并支持多关键字搜索;搜索方式支持与、或、非、精确和模糊搜索;搜索范围支持所有文件或指定文件搜索,从而方便用户使用。
4、SQL数据处理模块可自动提取Excel索引文件中的超链接,搜索显示方式采取二层显示结构,即第一层显示符合条件的文件表格,第二层显示该文件表格中一个具体文件中的符合条件的记录,通过每一个记录对应的超链接即可链接至底层文件进行查阅,方便了用户操作与查阅。
Claims (8)
1.一种基于SQL数据库的文件检索系统,其特征在于包括:
获取记载了多个底层文件的文件名和摘要信息、且为Excel格式的Excel索引文件的文件上传模块;
提取Excel索引文件中每个底层文件的超链接并对应保存至Excel索引文件中的一个新增列,且将每个Excel索引文件对应处理为一个SQL数据表文件的SQL数据处理模块;
存储每个Excel索引文件对应的SQL数据表文件的SQL数据库;
提供用户输入检索条件,根据检索条件检索SQL数据库,并将检索结果显示给用户的检索模块。
2.根据权利要求1所述基于SQL数据库的文件检索系统,其特征在于,所述文件上传模块包括:
由用户选择Excel索引文件的路径和文件名进行上传的手动上传文件模块;
通过监控Excel索引文件的更新时间属性信息,当判断更新时间发生改变时自动将该Excel索引文件上传的自动更新文件模块。
3.根据权利要求1所述基于SQL数据库的文件检索系统,其特征在于,所述检索结果为二层显示结构,其第一层为符合检索条件的文件表格,第二层为对应文件表格中每个文件符合检索条件的记录。
4.根据权利要求3所述基于SQL数据库的文件检索系统,其特征在于,所述记录包括链接至一个底层文件的超链接。
5.一基于SQL数据库的文件检索方法,其特征在于包括:
获取记载了多个底层文件的文件名和摘要信息、且为Excel格式的Excel索引文件;
提取Excel索引文件中每个底层文件的超链接并对应保存至Excel索引文件中的一个新增列,且将每个Excel索引文件对应处理为SQL数据库中的一个SQL数据表文件;
提供用户输入检索条件,根据检索条件检索SQL数据库,并将检索结果显示给用户。
6.根据权利要求5所述基于SQL数据库的文件检索方法,其特征在于,获取Excel索引文件的方式包括:
从用户选择的路径和文件名获取对应的Excel索引文件;
通过监控Excel索引文件的更新时间属性信息,当判断更新时间发生改变时,自动通过网络复制该Excel索引文件。
7.根据权利要求5所述基于SQL数据库的文件检索方法,其特征在于,所述检索结果为二层显示结构,其第一层为符合检索条件的文件表格,第二层为对应文件表格中每个文件符合检索条件的记录。
8.根据权利要求7所述基于SQL数据库的文件检索方法,其特征在于,所述记录包括链接至一个底层文件的超链接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009101060850A CN101520804B (zh) | 2009-03-20 | 2009-03-20 | 基于sql数据库的文件检索系统与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009101060850A CN101520804B (zh) | 2009-03-20 | 2009-03-20 | 基于sql数据库的文件检索系统与方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101520804A CN101520804A (zh) | 2009-09-02 |
CN101520804B true CN101520804B (zh) | 2011-08-03 |
Family
ID=41081393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009101060850A Expired - Fee Related CN101520804B (zh) | 2009-03-20 | 2009-03-20 | 基于sql数据库的文件检索系统与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101520804B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102739692A (zh) * | 2011-03-31 | 2012-10-17 | 新奥特(北京)视频技术有限公司 | 一种应用于体育赛事信息系统中的报表上传方法和装置 |
CN102339318A (zh) * | 2011-10-24 | 2012-02-01 | Tcl集团股份有限公司 | 一种文件系统管理方法及系统 |
CN105468785A (zh) * | 2015-12-24 | 2016-04-06 | 张梅云 | 一种计算机文件管理方法 |
CN106021215A (zh) * | 2016-05-18 | 2016-10-12 | 广东源恒软件科技有限公司 | 一种财税数据的自动抽取方法及系统 |
CN111104443A (zh) * | 2018-11-30 | 2020-05-05 | 中国航空工业集团公司沈阳飞机设计研究所 | 一种基于Excel表格的供方软件过程和产品监控方法 |
CN109831323B (zh) * | 2019-01-15 | 2022-04-05 | 网宿科技股份有限公司 | 服务器信息的管理方法、管理系统及服务器 |
CN113377550A (zh) * | 2020-02-25 | 2021-09-10 | 西安诺瓦星云科技股份有限公司 | 用于内容复用的引擎工具、引擎系统及编辑工具 |
CN111949619B (zh) * | 2020-07-21 | 2024-04-26 | 苏州元核云技术有限公司 | 动态目录生成方法、系统、电子设备及存储介质 |
CN113535642A (zh) * | 2021-08-05 | 2021-10-22 | 统信软件技术有限公司 | 一种文件搜索方法及计算设备 |
-
2009
- 2009-03-20 CN CN2009101060850A patent/CN101520804B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101520804A (zh) | 2009-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101520804B (zh) | 基于sql数据库的文件检索系统与方法 | |
US9223817B2 (en) | Virtual repository management | |
US7698323B1 (en) | Method and system for accessing and managing information | |
US20070192374A1 (en) | Virtual repository management to provide functionality | |
US8626727B2 (en) | Systems and methods for providing a map of an enterprise system | |
US7774301B2 (en) | Use of federation services and transformation services to perform extract, transform, and load (ETL) of unstructured information and associated metadata | |
US20060248129A1 (en) | Method and device for managing unstructured data | |
US20080270462A1 (en) | System and Method of Uniformly Classifying Information Objects with Metadata Across Heterogeneous Data Stores | |
US10970300B2 (en) | Supporting multi-tenancy in a federated data management system | |
US20150127609A1 (en) | Plural architecture master data management | |
US10515069B2 (en) | Utilization of a concept to obtain data of specific interest to a user from one or more data storage locations | |
Singh et al. | A survey on dataspace | |
CN105468785A (zh) | 一种计算机文件管理方法 | |
US9767222B2 (en) | Information sets for data management | |
CN105574192A (zh) | 一种计算机文件检索方法 | |
CN105453086B (zh) | 从一个或多个数据存储位置获得用户特定关注数据的概念利用 | |
US20200065401A1 (en) | User-specific dynamic context folders | |
CN112015725B (zh) | 一种数据管理方法和装置 | |
US12013822B1 (en) | Discovery of data sets | |
EP1979817B1 (en) | Virtual repository management to provide functionality | |
US8903849B2 (en) | Cross-platform data preservation | |
Wang | Library Information Resource Management Based on Metadata Storage | |
WO2024020054A1 (en) | Personal information management system having graph-based management and storage architecture | |
CN116542614A (zh) | 一种智能项目申报管理平台 | |
Chen et al. | Research on Workflow-Based Quality Information Active Sharing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110803 Termination date: 20150320 |
|
EXPY | Termination of patent right or utility model |