CN102930060A - 一种数据库快速索引的方法及装置 - Google Patents

一种数据库快速索引的方法及装置 Download PDF

Info

Publication number
CN102930060A
CN102930060A CN2012104916427A CN201210491642A CN102930060A CN 102930060 A CN102930060 A CN 102930060A CN 2012104916427 A CN2012104916427 A CN 2012104916427A CN 201210491642 A CN201210491642 A CN 201210491642A CN 102930060 A CN102930060 A CN 102930060A
Authority
CN
China
Prior art keywords
file
database
retrieved
index list
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012104916427A
Other languages
English (en)
Other versions
CN102930060B (zh
Inventor
孙振辉
刘富堂
徐德军
栾晓岩
邢轻
吴国庆
高轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201210491642.7A priority Critical patent/CN102930060B/zh
Publication of CN102930060A publication Critical patent/CN102930060A/zh
Application granted granted Critical
Publication of CN102930060B publication Critical patent/CN102930060B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种数据库快速索引的方法及装置,相应的方法包括:根据预先设置的策略对数据库中的文件进行分类,并按文件类型将所述数据库中的文件划分成若干个子数据库;根据所述子数据库的数目建立所述数据库的索引目录,并将用户输入的待检索文件的类型作为关键词对所述索引目录进行检索。本发明通过采用将文件分类的方法建立子数据库,并建立相应的索引目录,再根据用户输入的待检索文件的类型作为关键词进行检索,具有较高的检索效率并且占用的资源较少。

Description

一种数据库快速索引的方法及装置
技术领域
本发明涉及一种数据库快速索引的方法及装置,属于数据存储技术领域。
背景技术
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。随着信息技术和市场的发展,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。
数据库是依照某种数据模型组织起来并存放二级存储器中的数据集合。这种数据集合具有如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务,其数据结构独立于使用它的应用程序,对数据的增、删、改和检索由统一软件进行管理和控制。数据库是数据管理的高级阶段,它是由文件管理系统发展起来的。
由于数据库中存储的文件类型多种多样,如word文档、excel表格、txt文档等,如果在每次检索数据库中的某个文件时都进行全库扫描,导致检索效率较低并且占用资源较多;而如果通过程序查询数据库,遇到程序死锁或键值出现错误时,也会导致跳转成全库检索,仍然无法提高检索效率
发明内容
本发明为解决在现有的数据库索引技术中存的当检索程序错误而跳转或直接采用全库扫描时导致的检索效率较低并且占用资源较多的问题。为此,本发明提出了如下的技术方案:
一种数据库快速索引的方法,包括:
根据预先设置的策略对数据库中的文件进行分类,并按文件类型将所述数据库中的文件划分成若干个子数据库;
根据所述子数据库的数目建立所述数据库的索引目录,并将用户输入的待检索文件的类型作为关键词对所述索引目录进行检索。
一种数据库快速索引的装置,包括:
子库划分单元,用于根据预先设置的策略对数据库中的文件进行分类,并按文件类型将所述数据库中的文件划分成若干个子数据库;
文件类型检索单元,用于根据所述子数据库的数目建立所述数据库的索引目录,并将用户输入的待检索文件的类型作为关键词对所述索引目录进行检索。
本发明通过采用将文件分类的方法建立子数据库,并建立相应的索引目录,再根据用户输入的待检索文件的类型作为关键词进行检索,具有较高的检索效率并且占用的资源较少。
附图说明
图1是本发明的具体实施方式提供的数据库快速索引的方法的流程示意图;
图2是本发明的具体实施方式提供的增加用户输入的待检索文件不包括文件类型的检索策略的数据库快速索引的方法的流程示意图;
图3是本发明的具体实施方式提供的数据库快速索引的装置的结构示意图;
图4是本发明的具体实施方式提供的增加文件名检索单元和索引目录重建立单元的数据库快速索引的装置的结构示意图。
具体实施方式
本发明的具体实施方式提供了一种数据库快速索引的方法,包括根据预先设置的策略对数据库中的文件进行分类,并按文件类型将所述数据库中的文件划分成若干个子数据库;根据所述子数据库的数目建立所述数据库的索引目录,并将用户输入的待检索文件的类型作为关键词对所述索引目录进行检索。
进一步地,该方法还可以包括若用户输入的待检索文件不包括文件类型,则按预定的规则建立所述数据库的索引目录,并将用户输入的待检索文件的文件名作为关键词对所述索引目录进行检索;以及,若所述数据库中的至少一个文件的类型改变,则重新建立所述数据库的索引目录。
为了更清楚的说明本发明的具体实施方式提供的一种数据库快速索引的方法,可以应到已有的Oracle数据库、SQL数据库、Access数据库以及INFOBANK数据库等中,现结合说明书附图对相应的数据库快速索引的方法进行详细说明,如图1所示,该方法具体可以包括:
步骤11,根据预先设置的策略对数据库中的文件进行分类,并按文件类型将所述数据库中的文件划分成若干个子数据库。
具体的,对数据库中文件的分类可包括多种策略,在本具体实施方式中可采用按文件后缀名分类(如exe文件、txt文件、avi文件等)、按文件的类型分类(如文档文件、图形文件、多媒体文件等)或者按文件的大小分类(如1M以下为小型文件、1M~1G为中型文件、1G以上为大型文件等)。分类完成后,对数据库按分类的数量建立相应数量的子数据库,每个子数据库都单独具备数据库的相关功能。划分完成的子数据库的目录可作为一个单独的文件保存在数据库中,以供用户查询。
步骤12,根据所述子数据库的数目建立所述数据库的索引目录,并将用户输入的待检索文件的类型作为关键词对所述索引目录进行检索。
具体的,当有用户对数据库进行检索时,可将保存有子数据库的目录的文件作为索引目录为用户提供检索功能,在检索过程中,将用户输入的待检索文件的类型作为关键词对所述索引目录进行检索,则能够获得待检索文件在索引目录中对应的子数据库的名称,然后再在相应的子数据库中直接对待检索文件进行检索即可获得相应的内容,上述检索过程首先排除了与待检索文件不同类型的文件,使检索范围大幅度缩小,从而提高检索效率及减少占用的资源。
进一步地,若用户输入的待检索文件不包括文件类型,则无法根据待检索文件的类型进行检索。这是因为:在一些情况下用户并不知道待检索文件的类型,甚至不知道待检索文件的确切名称,因此无法确定待检索文件的类型,只能通过模糊检索。此时上述步骤11-步骤12记载的技术方案并不能为用户提供完整的检索方案,因此需要重新制定检索规则。在本具体实施方式中,如图2所示,在步骤12的基础上进一步增加了:
步骤13,若用户输入的待检索文件不包括文件类型,则按预定的规则建立所述数据库的索引目录,并将用户输入的待检索文件的文件名作为关键词对所述索引目录进行检索。
预定的规则可以按文件的执行主体进行分类,例如将后缀名为.exe、.bat、.com等格式的文件划分为一类,因为该类文件可直接由windows操作系统识别并执行,而不需要第三方软件;将后缀名为.doc、.xls、.vsd等文件划分为一类,因为该类文件可由Office系列软件识别并执行;将后缀名为.avi、.mp3、.rmvb等文件划分为一类,因为该类文件可由现有的通用音频视频解码器识别并执行;将后缀名为.bmp、.jpeg、.png等文件划分为一类,因为该类文件可由现有的通用图形解码器识别并执行;由特定的第三方功能软件(如PDF、PSD、RAR等功能软件)识别并执行的文件也可单独划分为一类。将分类后的文件分别作为子数据库建立索引目录,再将用户输入的待检索文件的文件名作为关键词对每个索引目录进行检索,可获得相应的内容,避免了在无任何策略时对全库检索的缺陷。
另外,如图2所示,在步骤13的基础上还可以进一步增加:
步骤14,若所述数据库中的至少一个文件的类型改变,则重新建立所述数据库的索引目录。该技术方案是为了进一步提高检索的准确性,能够实时调整数据库的索引目录,使用户检索到最准确的内容。
采用本具体实施方式提高的技术方案,通过采用将文件分类的方法建立子数据库,并建立相应的索引目录,再根据用户输入的待检索文件的类型作为关键词进行检索,具有较高的检索效率并且占用的资源较少。
本发明的具体实施方式还提供了一种数据库快速索引的装置,如图3所示,具体可以包括:
子库划分单元31,用于根据预先设置的策略对数据库中的文件进行分类,并按文件类型将所述数据库中的文件划分成若干个子数据库;
文件类型检索单元32,用于根据所述子数据库的数目建立所述数据库的索引目录,并将用户输入的待检索文件的类型作为关键词对所述索引目录进行检索。
优选的,如图4所示,所述装置还可以包括:
文件名检索单元33,用于若用户输入的待检索文件不包括文件类型,则按预定的规则建立所述数据库的索引目录,并将用户输入的待检索文件的文件名作为关键词对所述索引目录进行检索。
优选的,如图4所示,所述装置还可以包括:
索引目录重建立单元34,用于若所述数据库中的至少一个文件的类型改变,则重新建立所述数据库的索引目录。
上述装置中包含的各单元的处理功能的具体实施方式在之前的方法实施方式中已经描述,在此不再重复描述。采用本具体实施方式提高的技术方案,通过采用将文件分类的方法建立子数据库,并建立相应的索引目录,再根据用户输入的待检索文件的类型作为关键词进行检索,具有较高的检索效率并且占用的资源较少。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (6)

1.一种数据库快速索引的方法,其特征在于,包括:
根据预先设置的策略对数据库中的文件进行分类,并按文件类型将所述数据库中的文件划分成若干个子数据库;
根据所述子数据库的数目建立所述数据库的索引目录,并将用户输入的待检索文件的类型作为关键词对所述索引目录进行检索。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若用户输入的待检索文件不包括文件类型,则按预定的规则建立所述数据库的索引目录,并将用户输入的待检索文件的文件名作为关键词对所述索引目录进行检索。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述数据库中的至少一个文件的类型改变,则重新建立所述数据库的索引目录。
4.一种数据库快速索引的装置,其特征在于,包括:
子库划分单元,用于根据预先设置的策略对数据库中的文件进行分类,并按文件类型将所述数据库中的文件划分成若干个子数据库;
文件类型检索单元,用于根据所述子数据库的数目建立所述数据库的索引目录,并将用户输入的待检索文件的类型作为关键词对所述索引目录进行检索。
5.根据权利要求4所述的装置,其特征在于,所述装置还包括:
文件名检索单元,用于若用户输入的待检索文件不包括文件类型,则按预定的规则建立所述数据库的索引目录,并将用户输入的待检索文件的文件名作为关键词对所述索引目录进行检索。
6.根据权利要求4所述的装置,其特征在于,所述装置还包括:
索引目录重建立单元,用于若所述数据库中的至少一个文件的类型改变,则重新建立所述数据库的索引目录。
CN201210491642.7A 2012-11-27 2012-11-27 一种数据库快速索引的方法及装置 Expired - Fee Related CN102930060B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210491642.7A CN102930060B (zh) 2012-11-27 2012-11-27 一种数据库快速索引的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210491642.7A CN102930060B (zh) 2012-11-27 2012-11-27 一种数据库快速索引的方法及装置

Publications (2)

Publication Number Publication Date
CN102930060A true CN102930060A (zh) 2013-02-13
CN102930060B CN102930060B (zh) 2016-05-04

Family

ID=47644857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210491642.7A Expired - Fee Related CN102930060B (zh) 2012-11-27 2012-11-27 一种数据库快速索引的方法及装置

Country Status (1)

Country Link
CN (1) CN102930060B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239586A (zh) * 2014-10-16 2014-12-24 北京奇虎科技有限公司 一种处理信息物料文件的方法和装置
CN105302669A (zh) * 2015-10-23 2016-02-03 浙江工商大学 一种云备份过程中数据去重的方法和系统
CN106446269A (zh) * 2016-10-19 2017-02-22 广东小天才科技有限公司 一种数据存储的方法及系统
CN106649678A (zh) * 2016-12-15 2017-05-10 咪咕文化科技有限公司 一种数据处理方法及系统
CN107168966A (zh) * 2016-03-07 2017-09-15 阿里巴巴集团控股有限公司 一种搜索引擎索引构建方法及装置
CN108460075A (zh) * 2017-12-28 2018-08-28 上海顶竹通讯技术有限公司 一种文件内容检索方法及系统
CN109063215A (zh) * 2018-10-16 2018-12-21 成都四方伟业软件股份有限公司 数据检索方法及装置
CN109344265A (zh) * 2018-09-10 2019-02-15 新华三大数据技术有限公司 一种资源管理方法及装置
CN110990430A (zh) * 2019-11-29 2020-04-10 广西电网有限责任公司 一种大规模数据并行处理系统
CN111045994A (zh) * 2019-12-25 2020-04-21 山东方寸微电子科技有限公司 一种基于kv数据库的文件分类检索方法及系统
CN111143587A (zh) * 2019-12-24 2020-05-12 深圳云天励飞技术有限公司 一种数据检索方法、装置及电子设备
CN111901684A (zh) * 2020-07-30 2020-11-06 深圳市康冠科技股份有限公司 一种文件分类方法及相关装置
CN112633686A (zh) * 2020-12-22 2021-04-09 华中科技大学同济医学院附属协和医院 一种医疗系统劳务派遣管理系统及其工作方法
CN117555858A (zh) * 2023-12-14 2024-02-13 河北因朵科技有限公司 一种数字档案安全型存储及检索系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1845032A (zh) * 2005-04-06 2006-10-11 杭州波导软件有限公司 一种移动终端用户使用权限分级管理实现方法
CN101930444A (zh) * 2009-06-18 2010-12-29 鸿富锦精密工业(深圳)有限公司 影像搜寻系统及方法
CN102387422A (zh) * 2010-08-31 2012-03-21 青岛海信电器股份有限公司 数字媒体播放器及其文件搜索方法、电视机
US20120179709A1 (en) * 2011-01-11 2012-07-12 Wataru Nakano Apparatus, method and program product for searching document

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1845032A (zh) * 2005-04-06 2006-10-11 杭州波导软件有限公司 一种移动终端用户使用权限分级管理实现方法
CN101930444A (zh) * 2009-06-18 2010-12-29 鸿富锦精密工业(深圳)有限公司 影像搜寻系统及方法
CN102387422A (zh) * 2010-08-31 2012-03-21 青岛海信电器股份有限公司 数字媒体播放器及其文件搜索方法、电视机
US20120179709A1 (en) * 2011-01-11 2012-07-12 Wataru Nakano Apparatus, method and program product for searching document

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239586B (zh) * 2014-10-16 2018-10-09 北京奇虎科技有限公司 一种处理信息物料文件的方法和装置
CN104239586A (zh) * 2014-10-16 2014-12-24 北京奇虎科技有限公司 一种处理信息物料文件的方法和装置
CN105302669B (zh) * 2015-10-23 2019-04-30 浙江工商大学 一种云备份过程中数据去重的方法和系统
CN105302669A (zh) * 2015-10-23 2016-02-03 浙江工商大学 一种云备份过程中数据去重的方法和系统
CN107168966A (zh) * 2016-03-07 2017-09-15 阿里巴巴集团控股有限公司 一种搜索引擎索引构建方法及装置
CN107168966B (zh) * 2016-03-07 2020-10-20 创新先进技术有限公司 一种搜索引擎索引构建方法及装置
CN106446269A (zh) * 2016-10-19 2017-02-22 广东小天才科技有限公司 一种数据存储的方法及系统
CN106649678A (zh) * 2016-12-15 2017-05-10 咪咕文化科技有限公司 一种数据处理方法及系统
CN106649678B (zh) * 2016-12-15 2020-07-10 咪咕文化科技有限公司 一种数据处理方法及系统
CN108460075A (zh) * 2017-12-28 2018-08-28 上海顶竹通讯技术有限公司 一种文件内容检索方法及系统
CN108460075B (zh) * 2017-12-28 2021-11-30 上海顶竹通讯技术有限公司 一种文件内容检索方法及系统
CN109344265A (zh) * 2018-09-10 2019-02-15 新华三大数据技术有限公司 一种资源管理方法及装置
CN109063215A (zh) * 2018-10-16 2018-12-21 成都四方伟业软件股份有限公司 数据检索方法及装置
CN110990430A (zh) * 2019-11-29 2020-04-10 广西电网有限责任公司 一种大规模数据并行处理系统
CN111143587A (zh) * 2019-12-24 2020-05-12 深圳云天励飞技术有限公司 一种数据检索方法、装置及电子设备
CN111045994A (zh) * 2019-12-25 2020-04-21 山东方寸微电子科技有限公司 一种基于kv数据库的文件分类检索方法及系统
CN111045994B (zh) * 2019-12-25 2023-08-22 山东方寸微电子科技有限公司 一种基于kv数据库的文件分类检索方法及系统
CN111901684A (zh) * 2020-07-30 2020-11-06 深圳市康冠科技股份有限公司 一种文件分类方法及相关装置
CN112633686A (zh) * 2020-12-22 2021-04-09 华中科技大学同济医学院附属协和医院 一种医疗系统劳务派遣管理系统及其工作方法
CN117555858A (zh) * 2023-12-14 2024-02-13 河北因朵科技有限公司 一种数字档案安全型存储及检索系统

Also Published As

Publication number Publication date
CN102930060B (zh) 2016-05-04

Similar Documents

Publication Publication Date Title
CN102930060B (zh) 一种数据库快速索引的方法及装置
CN100458779C (zh) 扩展索引的方法
CN103902623B (zh) 用于在存储系统上存取文件的方法和系统
CN101446984B (zh) 一种文件存储方法、装置及文件删除方法和装置
US8799291B2 (en) Forensic index method and apparatus by distributed processing
CN102169507A (zh) 一种分布式实时搜索引擎
CN103064906B (zh) 文件管理方法及装置
US20110265177A1 (en) Search result presentation
CN104239377A (zh) 跨平台的数据检索方法及装置
CN107491487A (zh) 一种全文数据库架构及位图索引创建、数据查询方法、服务器及介质
US9026519B2 (en) Clustering web pages on a search engine results page
CN102024019B (zh) 一种分布式文件系统中基于后缀树的目录组织方法
KR101744892B1 (ko) 시계열 계층 인덱싱을 이용한 데이터 검색 시스템 및 데이터 검색 방법
CN104391941A (zh) 一种快速构建常用文件全文检索工具的方法
CN105404660A (zh) 多级数据存储方法及装置、多级数据结构、信息检索方法
CN101963993B (zh) 一种数据库单表记录快速查找的方法
CN103473324A (zh) 基于非结构化数据存储的多维业务属性检索装置及方法
CN107704633A (zh) 一种文件迁移的方法和系统
EP2541437A1 (en) Data base indexing
CN102609531B (zh) 一种根据关键字反查文件的方法
Liu et al. A study of entity search in semantic search workshop
CN104834663A (zh) 面向光盘库的全文检索系统
KR100912129B1 (ko) 객체 파일 시스템을 이용한 비정형 데이터 관리 방법 및장치
Нікітін et al. Combined indexing method in nosql databases
CN108959308A (zh) 一种应对可追加数据的索引方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160504

Termination date: 20161127

CF01 Termination of patent right due to non-payment of annual fee