CN102483765B - 文件搜索系统和程序 - Google Patents
文件搜索系统和程序 Download PDFInfo
- Publication number
- CN102483765B CN102483765B CN2010800406725A CN201080040672A CN102483765B CN 102483765 B CN102483765 B CN 102483765B CN 2010800406725 A CN2010800406725 A CN 2010800406725A CN 201080040672 A CN201080040672 A CN 201080040672A CN 102483765 B CN102483765 B CN 102483765B
- Authority
- CN
- China
- Prior art keywords
- search
- file
- index
- full
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Abstract
本发明提供了文件搜索系统和程序,其通过对于其中应当允许全文搜索的文件和全文搜索不必要的文件共存的文件搜索环境,创建在应当允许全文搜索的文件和全文搜索不必要的文件之间的不同的索引文件,来进行高效的搜索。对于其中文件搜索服务器1、文件服务器4和客户端3通过通信线路9可通信地互相连接的文件搜索系统,文件搜索服务器1包括:元数据搜索装置,其被适配为在接收到来自客户端3的搜索请求时,基于条件搜索表达式从索引2文件22选择元数据匹配记录;全文搜索装置,其被适配为基于条件搜索表达式和元数据匹配记录,通过参考关键词执行关于索引1文件21的搜索;传输装置,其被适配为将搜索结果传输至客户端3;和类似的装置。
Description
技术领域
本发明涉及提前对接受搜索的文件创建索引文件,并且通过参考索引文件来搜索文件的文件搜索系统和程序。
背景技术
近年来,信息的数字化发展迅速。过去,数字化主要涉及将待参考的数据存储在文件和DB(数据库)中,以使企业、对外办事处等等的计算机系统进行核心操作,这样的数据包括银行账户、城市/城镇/村庄居民登记等等。
另一方面,目前,在诸如企业等等的组织的日常经营中创建的各种文档作为文档文件存储在每个员工的客户端PC(个人计算机)上,并且作为电子邮件附件传输至其他的客户端PC,或存储在文件服务器上作为整个组织的共享信息。此外,存储在文件服务器上的文档文件被各个员工参考,并且有时被复制到客户端PC和在客户端PC上更新。
因为大量的数字信息因此分布和存储在各种计算机上,所以完全一样或相似的数字信息最终在组织内大量地存在。此外,各种数字信息的存储量也在继续增长。
另一方面,在组织内,例如,经常出现的情况是人们可能希望参考其存储位置未知的数字信息,例如当需要由已经离开组织的前员工在过去创建的文档文件时等等。在这样的情况下,通常的做法是,使用预期在关心的文档文件中找到的关键词通过全文搜索等等来搜索文档文件等等。
顺便说一下,如果要在组织内的所有的计算机中搜索数字信息,那么每个员工的客户端PC还将必须允许来自所有的员工的访问,这在安全性方面是不期望的。因此,通常的作法是将要在整个组织中共享的数字信息存储在预定的文件服务器上。
然而,即使文档文件等等被存储在多个预定的文件服务器上,如果人们在每次需要文档文件时搜索存储在文件服务器上的所有文件,那么将需要大量的时间执行文件I/O(输入/输出)等等。
由于该原因,在专利文献1中已知以下技术,其中,对于存储在文件服务器上的文档文件等等,用于搜索的相对少量的信息(索引信息),例如存储位置、关键词等等被作为索引文件存储。具体地,通过创建索引文件,可以在搜索期间通过一次文件I/O获得与多个文件相关的索引信息,由此避免针对每个文档文件执行文件I/O的需要等等。作为结果,可以缩短在文件搜索期间的响应时间,并且可以减小文件服务器上的负荷。
引用列表
专利文献
专利引用1:日本专利公布(特开昭)No.2003-162545A
发明概述
技术问题
然而,为了通过诸如专利文献1中公开的技术进行文件搜索,必需创建所有接受搜索的文件的索引文件。
虽然索引信息的储存容量与实际的文件相比是相对小的,但是为了能够通过关键词进行全文搜索,必需的是分析文件中含有的关键词并且将它们存储在索引信息中。因此,当文件中含有的关键词的数量增加时,相应地需要更大的容量。因此,当待接受搜索的文件的数量增加时,索引文件的储存容量变得更大。
现在考虑例如在组织内的文件搜索,即使当文件存储在共享的文件服务器上时,经常的情况是每个部门具有对有限的文件夹等等的访问权限,文件存储在这些有限的文件夹下等等,并且在其中进行搜索。在这样的情况下,经常采用的方法是文件夹被给予例如“work report文件夹”和类似的名称,并且符合这些名称的文件被存储在相应的文件夹中,即将文件以文件夹的方式进行分类的方法。此外,在这样的情况下,由于可以通过按照文件夹的树形结构检索到所关心的文件,所以几乎不需要通过关键词的全文搜索。
因此,即使文件存储在错误的文件夹中,只要具有关于文件的意图、标题等等的小容量的索引文件,那么通过参考索引文件中的索引信息,搜索经常是可能的。
换句话说,对于在组织内创建的诸如文档等等的文件,只要具有关于文件的意图、标题等等的小容量的索引文件,那么搜索经常是可能的。另一方面,例如,对于从组织的外部获得的文件,例如专利文件、技术论文等等,或对于在组织外部的服务器例如web服务器等等上存在的文件,还经常为了在获得它们时未打算的目的而参考它们,经常需要通过关键词进行全文搜索。
因此,考虑在组织内的文件搜索,具有应当允许全文搜索的文件以及全文搜索对于其而言不必要的文件。这不但适用于组织,而且适用于例如由个人进行的文件搜索。
考虑到以上的情况,本发明的一个目的是,提供文件搜索系统和程序,其通过关于其中应当允许全文搜索的文件和全文搜索不必要的文件共存的文件搜索环境,创建在应当允许全文搜索的文件和全文搜索不必要的文件之间的不同的索引文件,来进行有效的搜索。
问题的解决方案
为了解决上述的问题,本发明提供以下的配置。
本发明的第一方面提供文件搜索系统,在所述文件搜索系统中,文件搜索服务器、文件服务器和客户端通过有线通信线路或无线通信线路可通信地互相连接,所述文件搜索服务器包括:
索引1创建装置,其被适配为从连接于所述文件服务器的存储设备上的接受搜索的文件创建索引1文件,并将至少包括文件名、文件路径、访问权限和关键词的索引1记录存储在所述索引1文件中;
索引2创建装置,其被适配为从接受搜索的文件创建索引2文件,并将包括系统元数据、标准元数据和用户定义的元数据的索引2记录存储在所述索引2文件中,所述系统元数据至少包括文件名和文件路径;
分析装置,其被适配为在接收到来自所述客户端的搜索请求时分析包括在所述搜索请求中的条件搜索表达式并且确定是否执行元数据搜索;
元数据搜索装置,其被适配为,如果确定要执行元数据搜索,那么基于所述条件搜索表达式从所述索引2文件的所述索引2记录选择匹配条件的元数据匹配记录;
确定装置,其被适配为,在执行元数据搜索之后或如果确定没有元数据搜索要执行,确定是否基于所述条件搜索表达式执行全文搜索;
全文搜索装置,其被适配为,如果确定要执行全文搜索,那么基于所述条件搜索表达式和所述元数据匹配记录通过参考所述关键词执行关于所述索引1文件的搜索;以及
传输装置,其被适配为,如果执行全文搜索,那么将作为检索到的关键词匹配记录的索引1记录的每个数据细目传输至所述客户端,并且如果确定没有全文搜索要执行,那么将所述元数据匹配记录传输至所述客户端。
本发明的第二方面提供根据所述第一方面的所述文件搜索系统,其中
所述文件搜索服务器包括:
索引1搜索装置,其被适配为在所述索引1文件中搜索;以及
其他搜索装置,其被适配为执行另一种搜索,
所述其他搜索装置包括:
提取装置,其被适配为,如果确定要执行全文搜索,那么从所述条件搜索表达式提取全文搜索条件;以及
传输装置,其被适配为将所提取的全文搜索条件与所述元数据匹配记录的文件路径以及从所述客户端接收的用户ID共同地传输至所述索引1搜索装置,并且
所述索引1搜索装置包括:
参考装置,其被适配为,在从所述其他搜索装置接收到所述全文搜索条件与所述元数据匹配记录的文件路径以及所述用户ID时,关于所有接收的所述元数据匹配记录的文件路径,参考其文件路径被设置为相同的值的所述索引1记录,以基于这些记录的访问权限确定所述接收的用户ID是否具有访问权限;以及
确定装置,其被适配为,如果确定具有访问权限,那么确定这些记录的所述关键词是否满足所述全文搜索条件。
本发明的第三方面提供根据所述第二方面的所述文件搜索系统,其中,代替其中所述文件搜索服务器包括所述索引1创建装置和所述索引1搜索装置的配置,
另外提供可通信地连接于所述通信线路的第二文件搜索服务器,所述第二文件搜索服务器包括所述索引1创建装置和所述索引1搜索装置。
本发明的第四方面提供根据所述第三方面的所述文件搜索系统,还包括通过因特网可通信地连接于所述通信线路的web服务器,其中
所述索引1创建装置包括被适配为通过web搜罗创建关于存储在所述web服务器的存储设备上的接受搜索的文件的所述索引1文件的装置,并且
所述索引1搜索装置包括被适配为在由所述索引1创建装置创建的所述索引1文件中进行搜索的装置。
本发明的第五方面提供用于文件搜索系统的文件搜索系统程序,在所述文件搜索系统中,文件搜索服务器、文件服务器和客户端通过有线通信线路或无线通信线路可通信地互相连接,其中使所述文件搜索服务器执行:
索引1创建功能,其适于从连接于所述文件服务器的存储设备上的接受搜索的文件创建索引1文件,并将至少包括文件名、文件路径、访问权限和关键词的索引1记录存储在所述索引1文件中;
索引2创建功能,其适于从接受搜索的文件创建索引2文件,并将包括系统元数据、标准元数据和用户定义的元数据的索引2记录存储在所述索引2文件中,所述系统元数据至少包括文件名和文件路径;
分析功能,其适于在接收到来自所述客户端的搜索请求时分析包括在所述搜索请求中的条件搜索表达式并且确定是否执行元数据搜索;
元数据搜索功能,其适于,如果确定要执行元数据搜索,那么基于所述条件搜索表达式从所述索引2文件的所述索引2记录选择匹配条件的元数据匹配记录;
确定功能,其适于,在执行元数据搜索之后或如果确定没有元数据搜索要执行,则确定是否基于所述条件搜索表达式执行全文搜索;
全文搜索功能,其适于,如果确定要执行全文搜索,那么基于所述条件搜索表达式和所述元数据匹配记录通过参考所述关键词进行关于所述索引1文件的搜索;以及
传输功能,其适于,如果执行了全文搜索,那么将作为检索到的关键词匹配记录的索引1记录的每个数据细目传输至所述客户端,并且如果确定没有全文搜索要执行,那么将所述元数据匹配记录传输至所述客户端。
本发明的第六方面提供根据所述第五方面的所述文件搜索系统程序,其中
使所述文件搜索服务器执行:
索引1搜索功能,其适于在所述索引1文件中搜索;以及
其他搜索功能,其适于执行另一种搜索,
所述其他搜索功能使所述文件搜索服务器执行:
提取功能,其适于,如果确定要执行全文搜索,那么从所述条件搜索表达式提取全文搜索条件;以及
传输功能,其适于将所提取的全文搜索条件与所述元数据匹配记录的文件路径以及从所述客户端接收的用户ID共同地传输至所述索引1搜索功能,并且
所述索引1搜索功能使所述文件搜索服务器执行:
参考功能,其适于,在从所述其他搜索功能接收到所述全文搜索条件与所述元数据匹配记录的文件路径以及所述用户ID时,关于所有接收的所述元数据匹配记录的文件路径,参考其文件路径被设置为相同的值的所述索引1记录,以基于这些记录的访问权限确定所述接收的用户ID是否具有访问权限;以及
确定功能,其适于,如果确定具有访问权限,那么确定这些记录的所述关键词是否满足所述全文搜索条件。
本发明的第七方面提供根据所述第六方面的所述文件搜索系统程序,其中,代替使所述文件搜索服务器执行所述索引1创建功能和所述索引1搜索功能,
另外提供可通信地连接于所述通信线路的第二文件搜索服务器,使所述第二文件搜索服务器执行所述索引1创建功能和所述索引1搜索功能。
本发明的第八方面提供根据所述第七方面的所述文件搜索系统程序,其中所述文件搜索系统还包括通过因特网可通信地连接于所述通信线路的web服务器,其中
所述索引1创建功能使所述第二文件搜索服务器执行适于通过web搜罗创建关于存储在所述web服务器的存储设备上的接受搜索的文件的所述索引1文件的功能,并且
所述索引1搜索功能使所述第二文件搜索服务器执行适于在由所述索引1创建功能创建的所述索引1文件中进行搜索的功能。
本发明的有利的效果
根据本发明,可能的是提供文件搜索程序,其通过关于其中应当允许全文搜索的文件和全文搜索不必要的文件共存的文件搜索环境,创建在应当允许全文搜索的文件和全文搜索不必要的文件之间的不同的索引文件,来进行有效的搜索。
附图简述
图1是根据本发明的实施例1的文件搜索系统的系统配置图。
图2是根据本发明的实施例1的索引1文件的数据结构图。
图3是根据本发明的实施例1的索引2文件的数据结构图。
图4是根据本发明的实施例1的系统元数据的数据结构图。
图5是根据本发明的实施例1的标准元数据的数据结构图。
图6是根据本发明的实施例1的虚拟类定义文件的数据结构图。
图7是根据本发明的实施例1的关联定义文件的数据结构图。
图8是示出了根据本发明的实施例1的索引1创建程序的操作的流程图。
图9是示出了根据本发明的实施例1的索引2创建程序的操作的流程图。
图10是示出了根据本发明的实施例1的搜索请求程序的操作的流程图。
图11是示出了根据本发明的实施例1的搜索程序的操作的流程图。
图12是示出了根据本发明的实施例1的索引1搜索程序的操作的流程图。
图13是示出了根据本发明的实施例1的登录屏幕的实施例的图。
图14是示出了根据本发明的实施例1的搜索请求屏幕的实施例的图。
图15是示出了根据本发明的实施例1的搜索请求屏幕的实施例的图,并且其中提供了树形视图。
图16是示出了根据本发明的实施例1的搜索程序等等的操作的流程图,所述搜索程序关于复合搜索。
图17是示出了根据本发明的实施例1的搜索请求屏幕上的搜索结果的显示内容的实施例的图。
图18是示出了根据本发明的实施例1的搜索请求屏幕上的关联搜索结果的显示内容的实施例的图。
图19是根据本发明的实施例2的文件搜索系统的系统配置图。
实施方案的描述
本发明的实施方案在下文参考示出了实施例的附图描述。
注意,上文提到的文件搜索服务器、第二文件搜索服务器、文件服务器、客户端和web服务器是计算机,并且上文提到的各种装置是通过使计算机的CPU加载和执行所需要的计算机程序而实现的装置,并且其流程图在图8至图12中以及在图16中示出。
此外,在下文的描述中,术语“文件”是指任何类型的接受浏览、查看/收听、电子邮件传输/接收、复制到外部存储介质等等的电子数据,并且除非另有说明,应当不仅包括诸如文档文件、图像文件等等的文件,而且包括整个数据库、数据库中的单个记录等等。
实施例1
图1是根据本发明的实施例1的文件搜索系统的系统配置图。
<整个文件搜索系统的配置/功能>
实施例1中的文件搜索系统是其中文件搜索服务器1、文件服务器4和客户端3借助于有线通信线路或无线通信线路9例如LAN(局域网)等等可通信地连接的系统。虽然在此文件搜索服务器1、文件服务器4和客户端3中的每个仅示出了一个,但是其中的每个还可以具有两个或更多个。此外,通信线路9不以任何方式被限于LAN,并且还可以是例如WAN(广域网)、因特网或其组合。
通过这样的配置,如将在下文详细地讨论的,文件搜索服务器1能够收集存储在文件服务器4上的文件的名称等等,并且创建和存储索引文件。然后客户端3能够将文件搜索请求(在下文有时简写为“搜索请求”)传输至文件搜索服务器1,并且文件搜索服务器1能够通过参考上文提到的索引文件执行文件搜索并且将文件搜索结果(在下文有时简写为“搜索结果”)传输至客户端3。
<客户端3的配置/功能>
客户端3是诸如个人计算机等等的设备,并且可通信地连接于输入设备32和显示设备33。输入设备32可以是诸如键盘、鼠标等等的设备,并且通过操作输入设备32,客户端3的操作者能够指示由客户端3执行的过程。换句话说,输入设备32用作客户端3的输入装置。
显示设备33可以是诸如液晶显示器、打印机等等的设备,并且显示或打印出由客户端3执行的过程的结果等等。换句话说,显示设备33用作客户端3的显示装置和/或输出装置。此外,虽然未在图中示出,但是客户端3具有内置的或外部连接的包括磁盘等等的存储设备。客户端3的存储设备和主存储设备等等虽然未示出,但是用作客户端3的存储装置。
客户端3包括,虽然未示出,CPU(中央处理单元)、主存储设备等等。CPU,虽然未示出,通过将存储在存储设备上的诸如搜索请求程序31等等的程序加载到主存储器中并且执行其操作码来执行各种过程。此外,在执行诸如搜索请求程序31等等的应用程序的操作码时,CPU有时还执行诸如OS(操作系统)等等的程序的操作码。因为与这样的程序执行相关的技术是熟知的,所以在下文的描述和在附图中,为了防止与程序执行相关的描述变得冗长的目的,将提供描述,如同搜索请求程序31等等主要执行过程。注意,每个程序的功能还可以通过电子设备或通过电子设备和固件的组合等等实现。
当接收到由客户端3的操作者通过输入设备32输入的文件搜索条件和文件搜索指令(例如搜索其文件名是“work report”的文件的指令)时,搜索请求程序31创建条件搜索表达式,并且将含有条件搜索表达式的搜索请求传输至文件搜索服务器1。此外,从文件搜索服务器1传输至客户端3的搜索结果被接收和显示在显示设备33上。搜索请求程序31可以是与实施例1相关的原始程序,或其还可以是例如web浏览器。如果web浏览器被用作搜索请求程序31,那么在后面描述的文件搜索服务器1的搜索程序13可以是例如web应用程序。
<文件服务器4的配置/功能>
文件服务器4是诸如个人计算机等等的设备,并且可通信地连接于存储设备42。存储设备42是诸如磁盘等等的设备,并且被内置或外部连接于文件服务器4。在图1中,示出了一个存储设备42连接于文件服务器4的实施例。然而,在现实中,更常见的情况是两个或更多个存储设备42连接于文件服务器4。此外,两个或更多个存储设备42还经常可切换地连接于两个或更多个文件服务器4。
虽然各种文件存储在存储设备42上,但是在这些文件中,接受在后面描述的文件搜索服务器1的索引创建的那些文件被称为图1中的“接受搜索的文件43”。换句话说,并非有称为接受搜索的文件43的特定的文件。而是,接受搜索的文件43可以例如是存储在存储设备42上的所有的文件,或存储在存储设备42上的文件的一部分,例如在特定的文件夹内的所有的文件等等。
文件服务器4包括文件管理程序41。文件管理程序41管理存储在存储设备42上的文件的存储位置等等,包括接受搜索的文件43的存储位置。此外,文件管理程序41还包括从文件搜索服务器1接收文件的存储位置等等的功能、读取存储在该存储位置处的接受搜索的文件43等等的功能、以及将该文件的存储内容传输至文件搜索服务器1的功能。
<文件搜索服务器1的配置/功能>
文件搜索服务器1是诸如个人计算机等等的设备,并且可通信地连接于存储设备2。
存储设备2是诸如磁盘等等的设备,并且被内置或外部连接于文件服务器1。虽然在图1中示出了一个存储设备2连接于文件搜索服务器1的实施例,但是还可以具有两个或更多个存储设备2。文件服务器1的存储设备2和主存储设备(虽然未示出)等等用作文件服务器1的存储装置。
索引1文件21、索引2文件22、虚拟类定义文件23和关联定义文件24存储在存储设备2上。这些文件的存储内容等等将在下文结合文件搜索服务器1的功能的描述进行描述。
文件搜索服务器1包括索引1创建程序11、索引2创建程序12、搜索程序13和索引1搜索程序14。
索引1创建程序11在预定的时间,例如每天的相同时间,参考接受搜索的文件43,并且创建索引1文件21。如将在下文描述的,在索引1文件21中存储了文件名、从文件内容提取的关键词等等。
哪些文件将作为接受搜索的文件43可以通过例如如下过程指定,虽然未在附图中示出,提前将存储设备42的一个或多个文件路径(例如“/etc/usr1/”等等)存储在存储设备2上,并且使这些文件路径下的文件成为接受搜索的文件43。注意,例如当具有两个或更多个存储设备42时,文件路径可以存储为使得其包括关于它们指向哪个存储设备的信息,等等。通过由此创建索引1文件21,可以通过参考索引1文件21执行文件搜索,由此使得没必要在每次进行搜索时参考接受搜索的文件43,并且由此缩短了处理搜索所耗费的时间。
注意,在创建索引1文件21之后,在由此通过参考索引1文件21进行搜索时,如果接受搜索的文件43被删除或修改(例如,如果关于其文件名是“work report”的文件创建了索引1文件21,并且这些文件然后被删除)并且在索引1文件21中进行搜索,那么所获得的搜索结果将不同于在接受搜索的文件43中进行搜索时获得的搜索结果(即,当参考索引1文件21时,其将表现为好像其文件名是“work report”的文件存在,即使这样的文件在接受搜索的文件43中不存在)。因此,如上文描述的,可以安排索引1创建程序11在预定的时间例如每日的相同时间等执行处理。通过这样的安排,索引1文件21可以被定期地更新,由此防止其严重地偏离接受搜索的文件43。
此外,通过缩短索引1创建程序11执行处理的间隔(例如通过安排每小时执行一次处理),可以进一步减小索引1文件21与接受搜索的文件43的偏离。然而,缩短索引1创建程序11执行处理的间隔就是缩短所有的接受搜索的文件43经历I/O的间隔。因此,在决定索引1创建程序11执行处理的间隔时,文件服务器4的性能等等必须也被考虑在内。
例如,有效的方法可以是如下的方法,其中对于文件服务器4,在给定的期间内持续地监测CPU的使用率、I/O频率等等的程序运行,并且如果在给定的期间内CPU的使用率、I/O频率等等落入预定的值以下,那么这一事实将传输至索引1创建程序11,并且索引1创建程序11开始处理,等等。可选择地,其可以这种情况,对于文件服务器4,持续地监测关于接受搜索的文件43的I/O的程序运行,并且在每次接受搜索的文件43中的任何文件更新等等时,这一事实将通知给索引1创建程序11,并且更新在索引1文件21内的并且与相关文件有关的索引信息。
如同索引1创建程序11,索引2创建程序12也在预定的时间,例如每天的相同时间,参考接受搜索的文件43,并且创建索引2文件22。在实施例1中,如将在下文描述的,在索引2文件22中存储了存储在文件中的文档的从文件内容确定的题目等等。换句话说,虽然索引1文件21的存储内容和索引2文件22的存储内容可以部分地重叠,但它们不是完全地相同的。
哪些文件将作为接受搜索的文件43可以通过如下方法指定,如同索引1创建程序11,提前将存储设备42的一个或多个文件路径(例如“/etc/usr1/”等等)存储在存储设备2上,并且使这些文件路径下的文件成为接受搜索的文件43。索引1创建程序11的接受搜索的文件43和索引2创建程序12的接受搜索的文件43可以是相同的、部分重叠的或完全不同的。
注意,在通过参考如此创建的索引2文件22执行搜索时,如通过参考索引1文件21执行搜索时的情况一样,出现了索引2文件22的存储内容有时偏离接受搜索的文件43的内容的问题。此外,如同索引1创建程序11,该问题可以通过缩短索引2创建程序12执行处理的间隔等等而解决。
此外,还出现以下问题,当索引1文件21和索引2文件22的创建时间不同时,索引1文件21和索引2文件22的内容有时不一致。一种用于解决该问题的方法将是协调索引1创建程序11和索引2创建程序12的索引文件创建过程的开始时间。具体地,例如,其可以被安排为在索引2创建程序12即将开始索引文件创建过程之前,将索引文件创建过程开始请求传输至索引1创建程序11,并且索引1创建程序11在接收该请求时开始索引文件创建过程。
即使当索引文件创建过程开始时间被协调时,虽然接受搜索的文件43中的每个的参考时间不一定被协调,但是索引1文件21和索引2文件22的内容之间的细微差异将不导致使用它们进行搜索中的严重问题。因此,只要协调了索引文件创建过程的开始时间,那么在很大程度上,在实践中将不会出现问题。
然而,在需要绝对防止索引1文件21和索引2文件22的内容之间出现所有和任何差异的情况下,其可以被安排为例如,对于文件服务器4,持续地监测关于接受搜索的文件43的I/O的程序运行,并且在每次更新接受搜索的文件43时,更新在索引1文件21和索引2文件22内的与相关的文件有关的信息。
在文件搜索服务器1接收到来自客户端3的搜索请求时激活搜索程序13,并且执行文件搜索。具体地,参考索引1文件21和索引2文件22中的一个或两个以确定是否存在匹配搜索请求的条件搜索表达式的文件。如果存在,那么包括匹配的文件的文件名等等的搜索结果被传输至客户端3。
在此,如果必需参考索引1文件21,那么搜索程序13将条件搜索表达式传输至索引1搜索程序14。索引1搜索程序14参考索引1文件21,并且确定是否存在匹配所接收的条件搜索表达式的文件。换句话说,索引1搜索程序14是补充搜索程序13的部分搜索功能的程序。如将在下文讨论的,在实施例1中,当客户端3的操作者请求所谓的全文搜索时,通过索引1搜索程序14执行搜索。通过将全文搜索功能与搜索程序13本身的功能分开,如索引1搜索程序14,可以使用各种已经存在的全文搜索程序。例如,可以从搜索请求确定搜索的意图,例如是请求搜索社会科学的领域内的文档还是请求搜索自然科学的领域内的文档等等,并且通过索引1搜索程序14执行适合于搜索的意图的全文搜索。
搜索程序13具有通过对接受搜索的文件43按照存储在索引2文件22中的文档题目等等进行分类来创建树形层次的功能(下文称为“虚拟分类功能”)。换句话说,其具有对索引2记录220进行分类的功能,并且在进行虚拟分类时,其参考其中定义了分类条件等等的虚拟类定义文件23。自然地,将具有创建、更新等虚拟类定义文件23的程序。然而,由于其不是直接地与本发明相关,所以在下文将基于已经创建了虚拟类定义文件23的假设提供描述。
此外,搜索程序13具有通过参考存储设备42上的接受搜索的文件43的存储位置(存储在索引2文件22中)创建树形层次的功能(下文称为“物理层次创建功能”)。
此外,搜索程序13具有搜索与搜索结果相关联的文件的功能(下文称为“关联搜索功能”),并且在执行关联搜索时,其参考其中定义了关联搜索条件等等的关联定义文件24。自然地,将具有创建、更新等关联定义文件24的程序。然而,由于其不是直接地与本发明相关,所以在下文将基于已经创建了关联定义文件24的假设提供描述。
<每个文件的配置/功能>
图2是关于实施例1的索引1文件21的数据结构图。
索引1文件21包括相应于各个接受搜索的文件43的索引1记录210。换句话说,从创建索引1记录210时起,每个索引1记录210与每个接受搜索的文件43具有一一对应的关系。
每个索引1记录210包括各种数据细目,包括文件名211、文件路径212、访问权限213和关键词214。
文件名211被设置为相应的接受搜索的文件43的文件名,例如“workreport1.doc”。
文件路径212被设置为相应的接受搜索的文件43的绝对路径,例如“//etc/usr1/workreport1.doc”(即“workreport1.doc”在“etc”文件夹内“usr1”文件夹内,“etc”文件夹直接在根目录下)。注意,可能的是,通过文件路径212可以识别接受搜索的文件43在存储设备42上的存储位置。然而,如果多个存储设备42连接于文件服务器4,那么指定具体的存储设备42、逻辑卷名等等的识别信息还可以被设置作为文件路径212的一部分或作为与文件路径212分开的数据细目。此外,还可以通过除了文件的绝对路径之外的信息来识别接受搜索的文件43的存储位置,例如相对于预定的文件的相对路径或文件所存储的地点的逻辑块号。可以提供用这些数据细目代替文件路径212的索引1记录210或除了文件路径212以外还有这些数据细目。
访问权限213被设置为关于相应的接受搜索的文件43设置的访问权限。具体地,其被设置为例如由文件服务器4的文件管理程序41等等授予的、并且作为文件属性信息(例如,在UNIX(注册商标)中使用的表示关于所有者、组或其他用户的参考、更新或执行的权限的三位数值(例如777等等))存储的访问权限。
关键词214被设置为从相应的接受搜索的文件43的内容提取的关键词。可以通过各种句法分析方法提取一个或多个关键词,例如,如果文本串“site”的多个实例包含在接受搜索的文件43的内容中,那么提取“site”,并且关键词214可以被设置为“site”。通常,多个词语等等被存储在关键词214中,并且每个索引1记录210的大小的大部分用于关键词214。
注意,除了上述之外,其他的文件属性信息,例如文件的创建者等等,也可以被包括作为索引1记录210的数据细目。
如此创建的索引1记录210(索引信息)由索引1搜索程序14参考,如上文描述的。
图3是关于实施例1的索引2文件22的数据结构图。
索引2文件22包括相应于各个接受搜索的文件43的索引2记录220。换句话说,从创建索引2记录220时起,每个索引2记录220与每个接受搜索的文件43具有一一对应的关系。
每个索引2记录220包括系统元数据221、标准元数据222和用户定义的元数据223。系统元数据221由索引2创建程序12设置,并且用户不能够直接地修改其设置。在另一方面,虽然标准元数据222由索引2创建程序12设置,但是用户可以使用文件搜索服务器1的元数据修改程序(虽然未在图1中示出)直接地修改其设置。此外,用户定义的元数据223是用户定义数据结构并且设置/修改数据内容的数据项。
索引2创建程序12不包括在用户定义的元数据223的设置中。
图4是关于实施例1的系统元数据221的数据结构图。
系统元数据221包括文件ID 221a、文件名221b和文件路径221c。
每个文件ID 221a被设置为可以唯一地识别相应的接受搜索的文件43的ID(标识符)。具体地,例如,其可以被设置为在每次创建新的接受搜索的文件43的索引2记录220时从1开始的序列号。
如同索引1记录210的文件名211,每个文件名221b被设置为相应的接受搜索的文件43的文件名,例如“workreport1.doc”。
如同索引1记录210的文件路径212,每个文件路径221c被设置为相应的接受搜索的文件43的绝对路径,例如“//etc/usr1/workreport1.doc”。
注意,除了上述之外,其他的文件属性信息,例如文件的创建者、访问权限等等,也可以被包括作为系统元数据221的数据项。
图5是关于实施例1的标准元数据222的数据结构图。
标准元数据222包括标题222a、文档写入日期222b和安全等级222c。
标题222a被设置为存储在相应的接受搜索的文件43中的文档等等的标题,例如“work report”。具体地,索引2创建程序12,例如,创建该文件的在其打印时将出现的显示图像,假设打印在第一页的顶部的、其字体大小大于其他文本的文本串是文档等等的标题,并且将标题222a设置为该文本串。
文档写入日期222b被设置为存储在相应的接受搜索的文件43中的文档等等写入的日期,例如“2009年8月5日”。具体地,索引2创建程序12,例如,假设如果打印该文件,则将打印在第一页的顶部处的文本串,即相似于创建日期的文本串,例如含有词语“创建”、“1月”、“2月”、“3月”等等的文本串是文档等等的写入日期,并且将文档写入日期222b设置为该写入日期。
安全等级222c被设置为存储在相应的接受搜索的文件43中的文档等等的机密性水平,例如“绝密”、“秘密”等等。具体地,索引2创建程序12,例如,从包含在该文件中的文本串中提取可能指示需要的机密性的文本串,例如“小心处理”、“不得复制”等等,从提取的文本串的内容、数量等等确定机密性水平,并且将安全等级222c设置为该机密性水平。
注意,除了上述之外,从接受搜索的文件43的显示图像(如果打印的话,将显示出来)可识别的其他信息等等,如文档的存储时间段也可以被包括作为标准元数据222的数据细目。
如此创建的索引2记录220(索引信息)由搜索程序13参考,如上文描述的。
图6是关于实施例1的虚拟类定义文件23的数据结构图。
虚拟类定义文件23包括一个或多个虚拟类定义记录230。
每个虚拟类定义记录230包括如下数据细目:虚拟类ID 231、显示名称232、条件233和上级虚拟类ID 234。
虚拟类ID 231被设置为可以唯一地识别虚拟类定义记录230的值,例如“1”、“2”等等。
显示名称232被设置为该虚拟类的名称,例如“标题”、“work report”等等。
条件233被设置为该虚拟类的分类条件,例如“没有条件”、“在标题222a中包括(文本串)‘work report’”等等。如果分类条件被设置为“没有条件”,那么其表示没有被分类在该虚拟类中的索引2记录220。如果分类条件被设置为索引2记录220的某个条件,那么其表示满足该条件的那些记录将被分类在该虚拟类中。因此,可以具有一个索引2记录220将被分类在两个或更多个虚拟类中的情况,以及其不被分类在任何虚拟类中的情况。
如将在下文讨论的,虚拟类定义记录230由搜索程序13参考,并且显示名称232以及满足那些显示名称232的条件233的索引2记录220的文件名221b以树形层次显示在显示设备33上。因此,可以具有一个索引2记录220将显示在树中的两个或更多个地方的情况,以及其将不显示在树中的任何地方的情况。
上级虚拟类标识234被设置为可以唯一地识别该虚拟类定义记录230的上级虚拟类定义记录230的值,例如“0(没有上级虚拟类记录)”、“1”等等。
例如,假设以下情况,即其中其虚拟类ID 231、显示名称232、条件233和上级虚拟类ID 234被分别设置为“1”、“标题”、“没有条件”和“0(没有上级虚拟类记录)”的虚拟类定义记录230以及其中它们被分别设置为“2”、“work report”、“在标题222a中包括‘work report’”和“1”的虚拟类定义记录230,并且具有其标题222a包括“work report”的四个索引2记录220,它们的文件名221b分别是“workreport1.doc”、“workreport2.doc”、“workreport3.doc”和“report.doc”,则树形视图将显示在显示设备33上,如同在名称为“标题”的文件夹内具有名称为“workreport”的文件夹,并且如同四个文件“workreport1.doc”、“workreport2.doc”、“workreport3.doc”和“report.doc”包含在该名称为“work report”的文件夹内(见图15中D1402)。
图7是关于实施例1的关联定义文件24的数据结构图。
关联定义文件24包括一个或多个关联定义记录240。
每个关联定义记录240包括如下数据细目:关联定义ID 241、显示名称242和条件243。
关联定义ID 241被设置为可以唯一地识别关联定义记录240的值,例如“1”、“2”等等。
显示名称242被设置为该关联定义的名称,例如“标题”等等。
条件243被设置为该虚拟类的分类条件,例如“标题222a等于相关的搜索结果”等等。
例如,假设以下情况,即具有其关联定义ID 241、显示名称242和条件243分别被设置为“1”、“标题”和“标题222a等于即时搜索结果”的关联定义记录240,其中具有其标题222a包括“work report”的四个索引2记录220,其中它们的文件名221b分别是“workreport1.doc”、“workreport2.doc”、“workreport3.doc”和“report.doc”,并且其中“workreport1.doc”作为搜索结果显示在显示设备33上,则词语“标题”也将显示,并且当点击词语“标题”时,通过关联将检索到三个文件“workreport2.doc”、“workreport3.doc”和“report.doc”(见图17和图18中的D1405)。
注意,条件243可以被设置为各种条件,例如“‘copy~’是检索到的文件的文件名的前缀”、“数字是检索到的文件的文件名的后缀”等等。
如以上的,实施例1的文件搜索系统的配置/功能的描述完成。在下文,将参考各种程序的流程图描述实施例1的文件搜索系统的操作。
<各种程序的操作>
图8是示出了实施例1的索引1创建程序11的操作的流程图。
一旦过程开始,那么索引1创建程序11创建等等接受搜索的文件43的索引1记录210(S801)。
具体地,例如,文件管理程序41被请求读取和传输包括在预定义的文件路径(例如“/etc/usr1/”)中的文件。然后,如果从文件管理程序41接收到文件,那么确定是否存在其文件路径212被设置为所获得的文件的文件路径(例如“/etc/usr1/workreport1.doc”)的索引1记录210。然后,如果这样的索引1记录210不存在,那么从所获得的文件提取关键词,并且通过分别将其文件名211、文件路径212、访问权限213和关键词214设置为该文件的文件名、文件路径、访问权限和提取的关键词而添加索引1记录210。另一方面,如果这样的索引1记录210存在,那么更新该索引1记录210的访问权限213和关键词214(下文称为“记录接受更新”)。
在对预定义的文件路径下的所有的文件执行以上的过程之后,如果具有任何除了新创建的索引1记录210(没有成为接受更新的记录)之外的索引1记录210,那么这些索引1记录210被删除。
注意,用于创建等等索引1记录210的方法不限于上文描述的方法。例如,一旦过程开始,那么可以删除索引1文件21,可以请求文件管理程序41读取和传输包括在预定义的文件路径(例如“/etc/usr1/”)中的文件,并且可以针对所接收的文件创建索引1记录210。
如上文描述的,在实施例1的实施方案中,在每次索引1创建程序11进行处理时,与各个接受搜索的文件43具有一一对应的关系的索引1记录210在处理时被创建。
图9是示出了实施例1的索引2创建程序12的操作的流程图。
一旦过程开始,那么索引2创建程序12创建等等接受搜索的文件43的索引2记录220(S901)。因为该过程的具体内容相似于索引1创建程序11的具体内容,所以将在下文仅解释不同的点。
首先,如上文描述的,索引2创建程序12的接受搜索的文件43不需要与索引1创建程序11的那些相同。例如,存储在存储设备42上的所有文件都可以是索引1创建程序11的接受搜索的文件43,而存储在存储设备42上的文件的一部分(例如,仅客户端3的操作者定期地参考的文件)是索引2创建程序12的接受搜索的文件43。通过这样的安排,可以在后文描述的搜索过程中通过仅在索引2文件22中惯常地搜索来限制作为搜索结果显示的文件的数量,而另一方面通过根据需要在索引1文件21中搜索使通常不参考的文件显示作为搜索结果成为可能。
相反地,存储在存储设备42上的文件的一部分(例如其中术语被相对严格地使用的文档文件,例如研究报告、法院判决等等)可以是索引1创建程序11的接受搜索的文件43,而存储在存储设备42上的所有文件都是索引2创建程序12的接受搜索的文件43。通过这样的安排,所使用的其定义含糊的术语等等(其中相对可能的是,即使这些术语等等匹配搜索关键词,并且相关的文件作为搜索结果显示,这些文件也不是所寻找的那些文件)作为索引1记录210的关键词214被提取的可能性减小。因此,可能的是,保持索引1文件21的容量相对小,而同时当在后文描述的搜索过程中执行通过关键词的全文搜索时,增加期望的文件作为搜索结果显示的可能性。
此外,通过下文的安排,也可以避免索引2记录220的不必需的更新。例如,更新日期和时间可以作为索引2记录220的数据细目而提供,并且在每次创建/更新索引2记录220时,其可以被设置为执行过程时的日期和时间。当索引2创建程序12试图更新索引2记录220时,索引2记录220的更新日期和时间以及接受搜索的文件43的更新日期和时间(其通常由文件管理程序41设置作为文件属性信息的一个细目)可以彼此比较,并且如果接受搜索的文件43的更新日期和时间更近,由于具有该接受搜索的文件43的内容在索引2记录220创建之后被修改的可能性,则其接受更新。此外,如果提供访问权限作为索引2记录220的数据细目,当索引2创建程序12试图更新索引2记录220时,索引2记录220的访问权限以及接受搜索的文件43的访问权限可以彼此比较,并且如果它们不同的话,其可以接受更新。
此外,在更新索引2记录220时,索引2创建程序12确定标准元数据222的设置是否使用上文提到的元数据修改程序被直接地修改,并且如果它们被直接地修改过,那么不更新标准元数据222。为了做到这一点,例如,“直接修改状态”可以被提供作为元数据222的数据细目,并且可以在索引2记录220创建时被设置为“没有直接修改”,然后在通过元数据修改程序直接修改的情况下被设置为“直接地修改过”。注意,索引2创建程序12不更新用户定义的元数据223。
可以另外提供“直接修改之后的文件更新状态”作为标准元数据222的数据细目,并且在索引2记录220由索引2创建程序12创建时被设置为“没有更新”。当索引2创建程序12更新索引2记录220时,确定该索引2记录220是否使用元数据修改程序被直接地修改过,并且如果其被直接地修改过并且如果相应的接受搜索的文件43的内容被修改过,那么“直接修改之后的文件更新状态”可以被设置为“已更新”。
因此,当客户端3的操作者使用元数据修改程序参考该索引2记录220时,或如下文描述的在显示文件搜索结果时,可以通知:在显示设备33上显示的文件的内容在标准元数据222直接修改之后被更新,并且客户端3的操作者能够确定是否必需再次执行标准元数据222的直接修改。
如上文描述的,在实施例1的实施方案中,在每次索引2创建程序12执行处理时,与各个接受搜索的文件43具有一一对应的关系的索引2记录220在处理时被创建。
图10是示出了实施例1的搜索请求程序31的操作的流程图。
搜索请求程序31由客户端3的操作者使用输入设备32激活。
一旦被激活,那么搜索请求程序31执行登录过程(S1001)。具体地,登录屏幕(例如在图13中示出的登录屏幕)显示在显示设备33上,客户端3的操作者使用输入设备32输入他/她的用户ID和密码并且按下“提交”按钮,此时确定所输入的用户ID和密码是否是有效的。注意,这样的登录过程本身是熟知的技术,因此将不提供进一步的描述。
如果确定输入的用户ID和密码是有效的,那么搜索请求程序31将搜索请求屏幕显示在显示设备33上(S1002)。
搜索请求屏幕的显示实施例(D1401)在图14中示出。在图14中,搜索请求屏幕包括虚拟类显示部分(D1402)、物理文件夹显示部分(D1403),搜索条件部分(D1404)、搜索结果部分(D1405)和“搜索”按钮、“编辑元数据”按钮和“结束”按钮。
在显示搜索请求屏幕时,搜索请求程序31使用搜索程序13的虚拟分类功能来显示虚拟类显示部分(D1402)。具体地,搜索请求程序31请求搜索程序13传输虚拟类的初始显示内容。搜索程序13将虚拟类定义记录230中的其上级虚拟类ID 234被设置为“0(没有上级虚拟类记录)”的记录(即最高的虚拟类定义记录230)的显示名称232传输至搜索请求程序31。搜索请求程序31将所接收的显示名称显示在虚拟类显示部分(D1402)中。此外,搜索请求程序31在每个显示名称232之前显示一个“+”符号被方块包围的图形。如将在下文描述的,通过执行诸如使用鼠标在这些图形上点击等等操作,客户端3的操作者能够显示其他的虚拟类以及包括在这些虚拟类下的文件。
例如,假设以下情况,即具有其虚拟类ID 231、显示名称232、条件233和上级虚拟类ID 234分别被设置为“1”、“标题”、“没有条件”和“0(没有上级虚拟类记录)”的虚拟类定义记录230以及相似地分别被设置为“2”、“work report”“在标题222a中含有‘work report’”和“1”的虚拟类定义记录230,并且具有其标题222a含有“work report”的四个索引2记录220,它们的文件名221b分别是“workreport1.doc”、“workreport2.doc”、“workreport3.doc”和“report.doc”。当虚拟类显示部分(D1402)中的显示在“标题”之前的“+”符号被方块包围的图形被点击时,虽然未在附图中示出,但是显示其中如同名称为“work report”的文件夹包含在名称为“标题”的文件夹内的树形视图。此外,当在“workreport”之前显示的其中“+”符号被方块包围的图形被点击时,如图15中的虚拟类显示部分(D1402)中所示的,显示一树形视图,其中如同名称为“work report”的文件夹存在于名称为“标题”的文件夹内,并且如同四个文件,即“workreport1.doc”,“workreport2.doc”,“workreport3.doc”和“report.doc”包含在该名称为“work report”的文件夹内。
此外,在显示搜索请求屏幕时,搜索请求程序31使用搜索程序13的物理层次创建功能显示物理文件夹显示部分(D1403)。具体地,搜索请求程序31请求搜索程序13传输物理文件夹的初始显示内容。搜索程序13通过参考索引2记录220的文件路径221c创建文件夹的树形层次,并且将在树的最高层的文件夹的名称传输至搜索请求程序31。搜索请求程序31将所接收的文件夹名称显示在物理文件夹显示部分(D1403)中。此外,搜索请求程序31在每个文件夹名称之前显示其中“+”符号被方块包围的图形。通过执行诸如使用鼠标在这些图形上点击等等操作,客户端3的操作者能够显示其他的文件夹以及包含在这些文件夹中的文件。
注意,搜索条件部分(D1404)和搜索结果部分(D1405)的显示内容在图14中示出,并且在搜索结果部分(D1405)没有显示搜索结果。
客户端3的操作者使用输入设备32将各种细目输入搜索条件部分(D1404)中。输入搜索条件部分(D1404)的细目成为搜索条件。例如,如果“site”被输入“全文”中并且“work report”被输入“标题”中,那么将搜索其索引1记录210中的关键词214被设置为“site”且其索引2记录220中的标题222a被设置为“work report”的文件,并且搜索结果将可滚动地显示在搜索结果部分(D1405)中。
对于搜索条件部分(D1404)中的各种细目,通过允许各种输入方法,可以提高搜索的容易性。例如,在“全文”中,例如“无site”、“site和work”等等可以允许逻辑表达式输入。注意,搜索条件部分(D1404)中的输入细目不需要以任何方式被限制于在附图中示出的细目,并且可以根据索引1文件21和索引2文件22中的数据细目例如访问权限、安全等级等等来决定。
在显示搜索请求屏幕(S1002)之后,搜索请求程序31等待搜索按钮、编辑元数据按钮或结束按钮按下(S1003、S1004)。当搜索按钮被按下时,即当检测到搜索请求(S1003中为“是”)时,执行搜索过程(S1005、S1006、S1007)。此外,当结束按钮被按下时,即当检测到结束请求(S1004中为“是”)时,过程终止。
注意,虽然未在图10中示出,但是在编辑元数据按钮被按下时搜索请求程序31执行元数据编辑过程。具体地,其请求客户端3的操作者指定待编辑的文件,显示所指定的文件的标准元数据222和用户定义的元数据223的当前设置,并且使用由客户端3的操作者输入的内容修改标准元数据222和用户定义的元数据223的设置。此时,如上文描述的,如果标准元数据222中的直接修改之后的文件更新状态被设置为“已更新”,那么指示该效果的消息可以显示在显示设备33上。
当检测到搜索请求时,搜索请求程序31将搜索条件部分(D1404)的输入内容(搜索条件)传输至搜索程序13(S1005)。例如,如果“site”被输入在“全文”中并且“work report”被输入在“标题”中,那么诸如“全文=site,标题=work report”的条件搜索表达式被创建并且与通过登录屏幕输入的用户ID共同地传输至搜索程序13。在此,条件搜索表达式是由搜索程序13解释的表达式,并且可以根据允许搜索程序13解释的语法规则等等创建。
在条件搜索表达式传输至搜索程序13之后,搜索请求程序31等待,直到从搜索程序13接收到搜索结果(S1006)。在接收到搜索结果后,搜索请求程序31将搜索结果显示在搜索请求屏幕上的搜索结果部分(D1405)中(S1007),并且再次等待搜索按钮等等被按下(S1003、S1004)。
图11是示出了实施例1的搜索程序13的操作的流程图。
在文件搜索服务器1接收到来自客户端3的搜索请求时由文件搜索服务器1激活搜索程序13。
搜索程序13首先分析搜索请求中含有的条件搜索表达式以确定是否必需执行元数据搜索,即通过参考索引2文件22中的系统元数据221等等执行搜索(S1101)。例如,如果条件搜索表达式是“全文=site,标题=workreport”,那么确定必需通过参考系统元数据222的标题222a执行搜索。
如果确定要执行元数据搜索(S1101中为“是”),那么搜索程序13基于索引2文件22执行搜索(S1102)。具体地,从条件搜索表达式提取与系统元数据221等等有关的条件,并且选择与该条件匹配的索引2记录220(下文称为“与元数据匹配的记录”)。
例如,如果条件搜索表达式是“全文=site,标题=work report”,那么选择其在标准元数据222中的标题222a被设置为“work report”的索引2记录220。
在执行元数据搜索(S1102)之后或如果确定没有元数据搜索要被执行(S1101中为“否”),搜索程序13确定是否必需执行全文搜索,即通过参考索引1文件21中的关键词214执行搜索(S1103)。例如,如果条件搜索表达式是“全文=site,标题=work report”,那么确定必需通过参考关键词214执行搜索。
如果确定要执行全文搜索(S1103中为“是”),那么搜索程序13基于索引1文件21执行全文搜索(S1104)。具体地,从条件搜索表达式提取全文搜索条件并且将其与元数据匹配记录的文件路径221c以及从搜索请求程序31接收的用户ID共同地传输至索引1搜索程序14。如将在下文描述的,索引1搜索程序14通过参考所接收的全文搜索条件等等执行搜索,并且将应当最终作为搜索结果的索引1记录210(下文称为“关键词匹配记录”)的文件路径221c传输至搜索程序13。
如果确定没有全文搜索要被执行(S1103中为“否”),那么搜索程序13使元数据匹配记录传输到搜索请求程序31,而如果执行了全文搜索(S1104),那么搜索程序13使关键词匹配记录传输到搜索请求程序31。搜索程序13将已经接受传输的索引2记录220的每个数据细目传输至搜索请求程序31(S1105)。
在传输之后,搜索程序13终止过程。
图12是示出了实施例1的索引1搜索程序14的操作的流程图。
索引1搜索程序14在元数据匹配记录的索引1记录210中搜索(S1201)。具体地,关于从搜索程序13接收的所有的元数据匹配记录的文件路径221c,参考其文件路径212被分别设置为相同的值的索引1记录210,并且基于相关的记录的访问权限213,确定从搜索程序13接收的用户ID是否具有访问权限。此外,如果确定其具有访问权限,那么确定相关记录的关键词214是否满足从搜索程序13接收的全文搜索条件。
索引1搜索程序14将满足以上的条件的文件路径221c传输至搜索程序13(S1202),并且终止过程。
顺便说一下,如果各种已经存在的全文搜索程序要用作索引1搜索程序14,那么相应于这些索引1搜索程序14的程序也将必须用于索引1创建程序11。在这样的情况下,通常,与索引1文件21相关的接受搜索的文件43将不同于与索引2文件22相关的接受搜索的文件43。因此,即使,例如,与索引2文件22相关的接受搜索的文件43被设置为由客户端3的操作者频繁地使用的文件,如果客户端3的操作者仅请求全文搜索,由于将在索引1文件21中执行搜索,不被频繁地使用的文件也将终止作为搜索结果显示。
虽然可能具有优选这样的搜索的情况,但是还具有不优选这样的搜索的情况。因此,如果仅要执行全文搜索,那么可以通过搜索请求屏幕指定仅针对其创建索引2文件22的接受搜索的文件43要接受搜索(即,仅针对其创建元数据的文件要接受搜索),或者索引1文件21的所有接受搜索的文件43都要接受搜索,而与索引2文件22无关(即还没有创建元数据的文件也要接受搜索)。
当这样安排时,如果指定还没有创建元数据的文件也要接受搜索,那么索引1搜索程序14如上文描述地操作。另一方面,如果指定仅创建了元数据的文件要接受搜索,那么索引1搜索程序14选择(即使没有请求元数据搜索(图11中S1101中为“否”)索引2文件22的所有索引2记录220作为元数据匹配记录,并且将这些记录的文件路径221c与全文搜索条件和从搜索请求程序31接收的用户ID共同地传输至索引1搜索程序14。
<关于在执行元数据搜索和全文搜索的情况中的处理的附加描述>
如上文描述的,使用实施例1的文件搜索系统,仅在客户端3的操作者请求全文搜索时使用索引1文件21执行搜索。顺便提一下,与不执行全文搜索的情况相比,全文搜索所耗费的处理时间通常更长。因此,从客户端3的操作者请求搜索的时刻至显示搜索结果的时刻的等待时间变得更长。因此,优选的是,应当防止客户端3的操作者必须等待出乎意料地长的时间。
下文提供关于搜索程序13等等的操作的描述,当这些措施在执行元数据搜索和全文搜索的情况(下文称为“复合搜索(compound search)”)中有效时执行所述操作。
图16是示出了关于实施例1的复合搜索中的搜索程序13等等的操作的流程图。
图16中的S1650至S1655示出了在复合搜索期间在图11中的S1104和S1105中由搜索程序13执行的过程的细节。S1601至S1607示出了相应于该过程的在图10中的S1006和S1007中的由搜索请求程序31执行的过程的细节。
搜索程序13将搜索结果的数量(即通过元数据搜索检索到的元数据匹配记录的数量)与预定义的数量(下文称为“最大检索数量”)进行比较(S1650)。
然后,如果元数据匹配记录的数量,即接受全文搜索的记录的数量,大于最大检索数量(S1650中为“是”),那么用于确认是否继续该过程的消息被传输至搜索请求程序31(S1651),并且等待,直到从搜索请求程序31接收到关于搜索过程是否要继续的确认结果(S1652)。
在从搜索程序13接收到用于确认是否继续搜索过程的消息后,搜索请求程序31将该消息显示在显示设备33上并且请求客户端3的操作者响应是否继续执行搜索过程(S1601)。具体地,例如,确认消息以及“继续搜索”按钮和“取消”按钮可以通过弹出对话框显示,并且其可以等待,直到按钮中的一个被点击。
如果客户端3的操作者通过点击“取消”按钮等等指示取消搜索(S1602中为“否”),那么搜索请求程序31将“取消搜索”指令传输至搜索程序13并且终止过程(S1603)。因此,搜索请求程序31不显示任何搜索结果并且再次等待搜索按钮等等在搜索请求屏幕上按下(图10中S1003和S1004)。
如果客户端3的操作者通过点击“继续搜索”按钮等等指示继续搜索(S1602中为“是”),那么搜索请求程序31将“继续搜索”指令传输至搜索程序13,虽然未在图中明确地示出,并且等待直到从搜索程序13接收到搜索结果。
在从搜索请求程序31接收到“取消搜索”指令或“继续搜索”指令后,搜索程序13根据接收的指令改变过程(S1652)。具体地,如果接收到“取消搜索”指令(S1652中为“否”),那么过程终止,而如果接收到“继续搜索”指令(S1652中为“是”),那么通过将元数据匹配记录中的最大检索数量的记录的文件路径221c、全文搜索条件以及从搜索请求程序31接收的用户ID传输至索引1搜索程序14而导致执行全文搜索(S1653)。
注意,如果接受全文搜索的记录的数量等于或小于最大检索数量(S1650中为“否”),那么用于确认是否继续该过程的消息不被传输至搜索请求程序31,并且通过将元数据匹配记录的文件路径221c、全文搜索条件以及从搜索请求程序31接收的用户ID传输至索引1搜索程序14而导致执行全文搜索(S1653)。
一旦全文搜索结束,那么搜索程序13将关键词匹配记录的每个数据细目传输至搜索请求程序31(S1654)。此时,关于是针对所有元数据匹配记录执行了全文搜索还是仍然具有没有对其执行全文搜索的元数据匹配记录的确认也被传输。
然后,搜索程序13确定在搜索结果部分(D1405)中补充显示是否可行(S1655)。具体地,如果仍然具有对于其尚未执行全文搜索的元数据匹配记录,并且如果传输至搜索请求程序31的搜索结果的累积总数小于预定义作为搜索请求屏幕(D1401)上的搜索结果部分(D1405)中的可显示的数量的数量(下文称为“最大显示数量”)(S1655中为“是”),那么其再次等待,直到从搜索请求程序31接收到关于搜索过程是否要继续的确认结果(S1652)。另一方面,如果在搜索结果部分(D1405)中补充显示是不可能的(S1655中为“否”),那么搜索程序13终止过程。
在从搜索程序13接收到搜索结果后,搜索请求程序31将搜索结果显示在搜索结果部分(D1405)中。注意,如上文描述的,只要在搜索结果部分(D1405)中补充显示是可能的,那么关于元数据匹配记录的全文搜索被重复地执行。因此,搜索结果将补充显示在搜索结果部分(D1405)中。例如,如果第一次全文搜索的结果包括三个查找发现(hit)并且第二次全文搜索的搜索结果包括四个查找发现,那么七个查找发现的搜索结果显示在搜索结果部分(D1405)中。
然后,搜索请求程序31确定是否仍然具有任何对于其尚未执行全文搜索的元数据匹配记录(如上文描述的,关于是已经针对所有元数据匹配记录执行了全文搜索还是仍然具有对于其尚未执行全文搜索的元数据匹配记录的确认消息从搜索程序13传输)以及在搜索结果部分(D1405)中补充显示是否是可能的(S1606)。如果仍然具有对于其尚未执行全文搜索的元数据匹配记录并且在搜索结果部分(D1405)中补充显示是可能的(S1606中为“是”),那么用于确认是否继续该过程的消息显示在显示设备33上(S1607),并且客户端3的操作者被再次请求对关于是否要继续搜索过程做出响应(S1602)。
另一方面,如果已经关于所有元数据匹配记录执行了全文搜索或如果在搜索结果部分(D1405)中补充显示是不可能的(S1606中为“否”),那么搜索请求程序31终止过程(S1603)。因此,搜索请求程序31将搜索结果显示在搜索结果部分(D1405)中直至该点,并且再次等待搜索按钮等等按下(图10中S1003和S1004)。
因此,当接受全文搜索的记录的数量大于最大检索数量时,将询问客户端3的操作者是否要继续搜索过程,并且如果指示“继续搜索”,那么执行全文搜索。因此,如果察觉搜索时间较长,那么客户端3的操作者可以暂时取消搜索过程,并且例如通过进一步细化元数据搜索条件来执行搜索。
此外,根据最大检索数量的单位重复地执行全文搜索,并且在每次执行全文搜索时补充显示搜索结果。因此,客户端3的操作者能够在相对短的时间内接连地检查搜索结果。
<有关关联搜索的补充描述>
图17是示出了关于实施例1的显示在搜索结果部分(D1405)中的内容的实施例的图。在图17中,显示了文件名和文件路径。然而,也可以显示索引2记录220等等的其他的数据细目,例如标题、文档写入日期等等。也是可能的是,例如,在索引2记录220中设置每个接受搜索的文件43的内容的一部分,并且使其显示。
此外,在图17中的被虚线包围的关联搜索指令部分(D1701)中,具有关联定义记录240的显示名称242被设置到其的显示名称。在图17中的实施例中,存在其显示名称242被分别设置为“标题”和″写入日期″的关联定义记录240,并且显示这些显示名称242。
在这些情况下,当客户端3的操作者点击例如显示“标题”的部分时,搜索请求程序31请求搜索程序13执行与“标题”相关的关联搜索。具体地,将与没有显示在显示设备33上但是从搜索程序13接收的搜索结果的文件相关的文件标识221a、以及与“标题”相关的关联定义ID 241与关联搜索请求共同地传输至搜索程序13。
在接收到关联搜索请求后,搜索程序13参考被设置为接收的关联定义ID 241的关联定义记录240的条件243,根据条件243被设置的条件在索引2记录220中搜索,并且将搜索结果传输至搜索请求程序31。
例如,假设以下情况,即存在其关联定义ID 241、显示名称242和条件243被分别设置为“1”、“标题”和“标题222a等于相关的搜索结果”的关联定义记录240,其中具有四个在它们的标题222a中含有“workreport”的索引2记录220,其中它们的文件名221b分别是“workreport1.doc”,“workreport2.doc”,“workreport3.doc”和“report.doc”,并且其中“workreport1.doc”被作为搜索结果显示在显示设备33上,词语“标题”将显示在关联搜索指令部分(D1701)中。当客户端3的操作者点击词语“标题”时,搜索请求程序31将“workreport1.doc”的文件ID和关联定义ID(“1”)传输至搜索程序13。然后,搜索程序13参考其关联定义ID 241是“1”的关联定义记录240的条件243,并且由于其被设置为″标题222a等于即时的搜索结果″,搜索程序13基于接收的文件ID获得“workreport1.doc”的标题222a,检索到三个在它们的标题222a中含有(与“workreport1.doc”相同)“work report”的文件,即“workreport2.doc”,“workreport3.doc”和“report.doc”,并且将搜索结果传输至搜索请求程序31。然后,如图18中所示的,搜索请求程序31将关联搜索结果显示在搜索结果部分(D1405)中。
注意,还可能的是,不对关联搜索结果可以显示的查找发现的数量设置任何具体的限制,并且还可能的是,例如,仅显示最多五个查找发现,并且如果结果超出五个查找发现,那么将其显示在另一个屏幕上。
根据本发明的文件搜索系统不以任何方式被限于上文提到的实施例1,并且可以各种形式实施。一个这样的实施例在下文描述。
实施例2
<文件搜索系统的另一个实施方案>
图19是根据本发明的实施例2的文件搜索系统的系统配置图。
在实施例2中,与实施例1不同,文件搜索服务器1不包括索引1创建程序11和索引1搜索程序14。
代替地,文件搜索服务器5(相应于上文提到的第二文件搜索服务器)是诸如个人计算机等等的设备,通过通信线路9可通信地连接于客户端3、文件服务器4、web服务器7和文件搜索服务器1。文件搜索服务器5包括索引1创建程序11和索引1搜索程序14。此外,索引1文件21不存储在文件搜索服务器1的存储设备2上,而是存储在文件搜索服务器5的存储设备6上。
实施例2和实施例1的配置之间的显著差异如上文所述。
在实施例2的文件搜索系统中,借助于通信线路9,客户端3、文件服务器4、web服务器7、文件搜索服务器1和文件搜索服务器5通过因特网可通信地互相连接。通过这样的配置,例如,如果给定的组织具有存储在被建立在数据中心处的文件服务器4上的文件,那么通过创建关于存储在文件服务器4上的接受搜索的文件43的索引2文件22、虚拟类定义文件23和关联定义文件24,可以执行元数据搜索、虚拟类显示、物理文件夹显示和关联搜索。此外,对于存储在该组织不管理的web服务器7的存储设备72上的接受搜索的文件73,文件搜索服务器5的索引1创建程序11可以通过web服务器程序71,例如Apache(注册商标)等等,通过普遍地称为web搜罗的方式,创建索引1文件21,由此使全文搜索成为可能。
此外,对于实施例2,文件搜索服务器5不需要建立在执行文件搜索的组织中,并且可以使用现有的文件搜索服务器的功能执行全文搜索等等。因此,可以构建高度灵活且可扩展的搜索系统。
参考符号列表
1、5 文件搜索服务器
3 客户端
4 文件服务器
7 Web服务器
9 通信线路
21 索引1文件
22 索引2文件
42,72 存储设备
43、73 接受搜索的文件
210 索引1记录
211、221b 文件名
212、221c 文件路径
213 访问权限
214 关键词
220 索引2记录
221 系统元数据
222 标准元数据
223 用户定义的元数据
Claims (8)
1.一种文件搜索系统,在所述文件搜索系统中,文件搜索服务器、文件服务器和客户端通过有线通信线路或无线通信线路可通信地互相连接,所述文件搜索服务器包括:
索引1创建装置,其被适配为从连接于所述文件服务器的存储设备上的接受搜索的文件创建索引1文件,并将至少包括文件名、文件路径、访问权限和关键词的索引1记录存储在所述索引1文件中;
索引2创建装置,其被适配为从接受搜索的文件创建索引2文件,并将包括系统元数据、标准元数据和用户定义的元数据的索引2记录存储在所述索引2文件中,所述系统元数据至少包括文件名和文件路径;
分析装置,其被适配为在接收到来自所述客户端的搜索请求时分析包括在所述搜索请求中的条件搜索表达式并且确定是否执行元数据搜索;
元数据搜索装置,其被适配为,如果确定要执行元数据搜索,那么基于所述条件搜索表达式从所述索引2文件的所述索引2记录选择匹配条件的元数据匹配记录;
确定装置,其被适配为,在执行元数据搜索之后或如果确定没有元数据搜索要执行,确定是否基于所述条件搜索表达式执行全文搜索;
全文搜索装置,其被适配为,如果确定要执行全文搜索,那么基于所述条件搜索表达式和所述元数据匹配记录通过参考所述关键词执行关于所述索引1文件的搜索;以及
传输装置,其被适配为,如果执行了全文搜索,那么将作为检索到的关键词匹配记录的索引1记录的每个数据细目传输至所述客户端,并且如果确定没有全文搜索要执行,那么将所述元数据匹配记录传输至所述客户端,
其中,
如果除了所述元数据搜索以外确定要执行所述全文搜索,则所述全文搜索装置在根据由所述元数据搜索装置选择的所述元数据匹配记录在所述元数据搜索中限定的搜索范围内执行所述全文搜索。
2.根据权利要求1所述的文件搜索系统,其中
所述文件搜索服务器包括:
索引1搜索装置,其被适配为在所述索引1文件中搜索;以及
其他搜索装置,其被适配为执行另一种搜索,
所述其他搜索装置包括:
提取装置,其被适配为,如果确定要执行全文搜索,那么从所述条件搜索表达式提取全文搜索条件;以及
传输装置,其被适配为将所提取的全文搜索条件与所述元数据匹配记录的文件路径以及从所述客户端接收的用户ID共同地传输至所述索引1搜索装置,并且
所述索引1搜索装置包括:
参考装置,其被适配为,在从所述其他搜索装置接收到所述全文搜索条件与所述元数据匹配记录的文件路径以及所述用户ID时,关于所有接收的所述元数据匹配记录的文件路径,参考其文件路径被设置为相同的值的所述索引1记录,以基于这些记录的访问权限确定所述接收的用户ID是否具有访问权限;以及
确定装置,其被适配为,如果确定具有访问权限,那么确定这些记录的所述关键词是否满足所述全文搜索条件。
3.根据权利要求2所述的文件搜索系统,其中,代替所述文件搜索服务器包括所述索引1创建装置和所述索引1搜索装置的配置,
另外提供可通信地连接于所述通信线路的第二文件搜索服务器,所述第二文件搜索服务器包括所述索引1创建装置和所述索引1搜索装置。
4.根据权利要求3所述的文件搜索系统,还包括通过因特网可通信地连接于所述通信线路的web服务器,其中
所述索引1创建装置包括被适配为通过web搜罗创建关于存储在所述web服务器的存储设备上的接受搜索的文件的所述索引1文件的装置,并且
所述索引1搜索装置包括被适配为在由所述索引1创建装置创建的所述索引1文件中进行搜索的装置。
5.一种用于文件搜索系统的文件搜索方法,在所述文件搜索系统中,文件搜索服务器、文件服务器和客户端通过有线通信线路或无线通信线路可通信地互相连接,所述方法包括使所述文件搜索服务器执行以下步骤:
索引1创建步骤,其包括从连接于所述文件服务器的存储设备上的接受搜索的文件创建索引1文件,并将至少包括文件名、文件路径、访问权限和关键词的索引1记录存储在所述索引1文件中;
索引2创建步骤,其包括从接受搜索的文件创建索引2文件,并将包括系统元数据、标准元数据和用户定义的元数据的索引2记录存储在所述索引2文件中,所述系统元数据至少包括文件名和文件路径;
分析步骤,其包括在接收到来自所述客户端的搜索请求时分析包括在所述搜索请求中的条件搜索表达式并且确定是否执行元数据搜索;
元数据搜索步骤,其包括,如果确定要执行元数据搜索,那么基于所述条件搜索表达式从所述索引2文件的所述索引2记录选择匹配条件的元数据匹配记录;
确定步骤,其包括,在执行元数据搜索之后或如果确定没有元数据搜索要执行,则确定是否基于所述条件搜索表达式执行全文搜索;
全文搜索步骤,其包括,如果确定要执行全文搜索,那么基于所述条件搜索表达式和所述元数据匹配记录通过参考所述关键词进行关于所述索引1文件的搜索;以及
传输步骤,其包括,如果执行了全文搜索,那么将作为检索到的关键词匹配记录的索引1记录的每个数据细目传输至所述客户端,并且如果确定没有全文搜索要执行,那么将所述元数据匹配记录传输至所述客户端,
其中,
如果除了所述元数据搜索以外确定要执行所述全文搜索,则所述全文搜索步骤包括在根据由所述元数据搜索步骤选择的所述元数据匹配记录在所述元数据搜索中限定的搜索范围内执行所述全文搜索。
6.根据权利要求5所述的文件搜索方法,还包括使所述文件搜索服务器执行以下步骤:
索引1搜索步骤,其包括在所述索引1文件中搜索;以及
其他搜索步骤,其包括执行另一种搜索,
所述其他搜索步骤使所述文件搜索服务器执行以下步骤:
提取步骤,其包括,如果确定要执行全文搜索,那么从所述条件搜索表达式提取全文搜索条件;以及
传输步骤,其包括将所提取的全文搜索条件与所述元数据匹配记录的文件路径以及从所述客户端接收的用户ID共同地传输至所述索引1搜索步骤,并且
所述索引1搜索步骤使所述文件搜索服务器执行以下步骤:
参考步骤,其包括,在从所述其他搜索步骤接收到所述全文搜索条件与所述元数据匹配记录的文件路径以及所述用户ID时,关于所有接收的所述元数据匹配记录的文件路径,参考其文件路径被设置为相同的值的所述索引1记录,以基于这些记录的访问权限确定所述接收的用户ID是否具有访问权限;以及
确定步骤,其包括,如果确定具有访问权限,那么确定这些记录的所述关键词是否满足所述全文搜索条件。
7.根据权利要求6所述的文件搜索方法,其中,代替使所述文件搜索服务器执行所述索引1创建步骤和所述索引1搜索步骤,
另外提供可通信地连接于所述通信线路的第二文件搜索服务器,使所述第二文件搜索服务器执行所述索引1创建步骤和所述索引1搜索步骤。
8.根据权利要求7所述的文件搜索方法,其中所述文件搜索系统还包括通过因特网可通信地连接于所述通信线路的web服务器,其中
所述索引1创建步骤使所述第二文件搜索服务器执行适于通过web搜罗创建关于存储在所述web服务器的存储设备上的接受搜索的文件的所述索引1文件的步骤,并且
所述索引1搜索步骤使所述第二文件搜索服务器执行适于在由所述索引1创建步骤创建的所述索引1文件中进行搜索的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009217344A JP2011065546A (ja) | 2009-09-18 | 2009-09-18 | ファイル検索システム及びプログラム |
JP2009-217344 | 2009-09-18 | ||
PCT/JP2010/005435 WO2011033734A1 (en) | 2009-09-18 | 2010-09-03 | File search system and program |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102483765A CN102483765A (zh) | 2012-05-30 |
CN102483765B true CN102483765B (zh) | 2013-12-11 |
Family
ID=43758349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800406725A Expired - Fee Related CN102483765B (zh) | 2009-09-18 | 2010-09-03 | 文件搜索系统和程序 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20120173511A1 (zh) |
EP (1) | EP2478452B1 (zh) |
JP (1) | JP2011065546A (zh) |
CN (1) | CN102483765B (zh) |
WO (1) | WO2011033734A1 (zh) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120215819A1 (en) * | 2011-02-23 | 2012-08-23 | International Business Machines Corporation | Tool for removing inactive objects |
JP5535993B2 (ja) * | 2011-07-20 | 2014-07-02 | ビッグローブ株式会社 | 記憶装置共有システムおよび記憶装置共用方法 |
JP5945408B2 (ja) * | 2011-12-08 | 2016-07-05 | シャープ株式会社 | 関連コンテンツ検索システム、端末、および関連コンテンツ検索方法 |
KR101672349B1 (ko) * | 2011-12-27 | 2016-11-07 | 한국전자통신연구원 | 파일 클라우드 서비스 장치 및 방법 |
JP5953851B2 (ja) * | 2012-03-19 | 2016-07-20 | 富士ゼロックス株式会社 | 文書管理装置及びプログラム |
WO2013145129A1 (ja) * | 2012-03-27 | 2013-10-03 | 富士通株式会社 | データベース管理方法、プログラム、および情報処理装置 |
US11487707B2 (en) * | 2012-04-30 | 2022-11-01 | International Business Machines Corporation | Efficient file path indexing for a content repository |
GB2507037A (en) | 2012-10-16 | 2014-04-23 | Ibm | Software application discovery using variable frequency file system scanning |
US8914356B2 (en) | 2012-11-01 | 2014-12-16 | International Business Machines Corporation | Optimized queries for file path indexing in a content repository |
US9323761B2 (en) | 2012-12-07 | 2016-04-26 | International Business Machines Corporation | Optimized query ordering for file path indexing in a content repository |
US9762630B2 (en) * | 2013-02-06 | 2017-09-12 | Elaine Lu | Systems and methods for parents' connection and communication platform |
US10104019B2 (en) * | 2014-05-27 | 2018-10-16 | Magnet Forensics Inc. | Systems and methods for locating application-specific data on a remote endpoint computer |
US9785712B1 (en) * | 2014-06-20 | 2017-10-10 | Amazon Technologies, Inc. | Multi-index search engines |
US10965748B2 (en) * | 2015-06-19 | 2021-03-30 | Lenovo (Singapore) Pte. Ltd. | Creating and using document pedigree data |
CN105022819A (zh) * | 2015-07-15 | 2015-11-04 | 魅族科技(中国)有限公司 | 一种文件保存的方法及装置 |
CN105354318A (zh) * | 2015-11-13 | 2016-02-24 | 北京金山安全软件有限公司 | 一种文件查找方法及装置 |
CN105468785A (zh) * | 2015-12-24 | 2016-04-06 | 张梅云 | 一种计算机文件管理方法 |
JP6700927B2 (ja) * | 2016-04-15 | 2020-05-27 | キヤノン株式会社 | 画像処理システム、画像処理装置、画像処理方法、及び、プログラム |
JP2018005509A (ja) * | 2016-06-30 | 2018-01-11 | キヤノン株式会社 | 情報処理装置、制御方法、及びプログラム |
CN107145530A (zh) * | 2017-04-18 | 2017-09-08 | 北京明朝万达科技股份有限公司 | 一种基于附加数据的文档检索方法及系统 |
US11023419B2 (en) * | 2018-08-13 | 2021-06-01 | Sap Se | Folder key management |
CN111026710A (zh) * | 2019-12-11 | 2020-04-17 | 华南师范大学 | 一种数据集的检索方法及系统 |
CN112860978B (zh) * | 2021-03-31 | 2024-05-17 | 中国工商银行股份有限公司 | 全局搜索方法和装置 |
CN114090515B (zh) * | 2022-01-21 | 2022-07-05 | 亿次网联(杭州)科技有限公司 | 文件搜索方法、终端设备及存储介质 |
JP7251876B1 (ja) * | 2022-03-14 | 2023-04-04 | Necプラットフォームズ株式会社 | サーバ装置、サーバ装置の制御方法、及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6985948B2 (en) * | 2000-03-29 | 2006-01-10 | Fujitsu Limited | User's right information and keywords input based search query generating means method and apparatus for searching a file |
CN101136027A (zh) * | 2006-09-01 | 2008-03-05 | 横河电机株式会社 | 用于数据库索引、搜索和数据检索的系统和方法 |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2929963B2 (ja) * | 1995-03-15 | 1999-08-03 | 松下電器産業株式会社 | 文書検索装置および単語索引作成方法および文書検索方法 |
JPH08272806A (ja) * | 1995-04-03 | 1996-10-18 | Nippon Steel Corp | データベース検索システム |
US6304872B1 (en) * | 1998-08-13 | 2001-10-16 | Tornado Technology Co. Ltd. | Search system for providing fulltext search over web pages of world wide web servers |
JP2000315209A (ja) * | 1999-04-30 | 2000-11-14 | Ricoh Co Ltd | 画像ファイリング装置、画像ファイリング方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7181438B1 (en) * | 1999-07-21 | 2007-02-20 | Alberti Anemometer, Llc | Database access system |
US6516337B1 (en) * | 1999-10-14 | 2003-02-04 | Arcessa, Inc. | Sending to a central indexing site meta data or signatures from objects on a computer network |
JP2001344245A (ja) * | 2000-03-29 | 2001-12-14 | Fujitsu Ltd | 情報処理装置 |
AU2001255219A1 (en) * | 2000-04-04 | 2001-10-23 | Globalscape, Inc. | Method and system for conducting a full text search on a client system by a server system |
US6782380B1 (en) * | 2000-04-14 | 2004-08-24 | David Victor Thede | Method and system for indexing and searching contents of extensible mark-up language (XML) documents |
US6782383B2 (en) * | 2001-06-18 | 2004-08-24 | Siebel Systems, Inc. | System and method to implement a persistent and dismissible search center frame |
NO316480B1 (no) * | 2001-11-15 | 2004-01-26 | Forinnova As | Fremgangsmåte og system for tekstuell granskning og oppdagelse |
JP4490012B2 (ja) | 2001-11-26 | 2010-06-23 | 富士通株式会社 | ファイル検索装置、ファイル検索プログラム |
JP2003323427A (ja) * | 2002-05-02 | 2003-11-14 | Nippon Telegr & Teleph Corp <Ntt> | Xml情報検索装置と方法、該方法の実行プログラム、および該方法の実行プログラムを記録した記録媒体 |
US7702666B2 (en) * | 2002-06-06 | 2010-04-20 | Ricoh Company, Ltd. | Full-text search device performing merge processing by using full-text index-for-registration/deletion storage part with performing registration/deletion processing by using other full-text index-for-registration/deletion storage part |
EP1645976A3 (en) * | 2002-07-23 | 2006-04-26 | Samsung Electronics Co., Ltd. | Index structure of metadata, method for providing indices of metadata, and metadata searching method and apparatus using the indices of metadata |
EP1411448A3 (en) * | 2002-10-17 | 2007-12-05 | Matsushita Electric Industrial Co., Ltd. | Data searching apparatus |
EP1671235A4 (en) * | 2003-09-23 | 2007-10-24 | Amazon Com Inc | CUSTOMIZED RESEARCH BANK WITH HIGH-PERFORMANCE CAPABILITIES FOR ACCESSING ELECTRONIC TEXT IMAGES ON THE BASIS OF MEMBERSHIP OF THE CORRESPONDING PHYSICAL TEXT |
FR2860886B1 (fr) * | 2003-10-14 | 2005-12-23 | Commissariat Energie Atomique | Dispositif de deplacement de particules |
US7376642B2 (en) * | 2004-03-30 | 2008-05-20 | Microsoft Corporation | Integrated full text search system and method |
US7730012B2 (en) * | 2004-06-25 | 2010-06-01 | Apple Inc. | Methods and systems for managing data |
US7461064B2 (en) * | 2004-09-24 | 2008-12-02 | International Buiness Machines Corporation | Method for searching documents for ranges of numeric values |
US20060074980A1 (en) * | 2004-09-29 | 2006-04-06 | Sarkar Pte. Ltd. | System for semantically disambiguating text information |
JP2006178599A (ja) * | 2004-12-21 | 2006-07-06 | Fuji Xerox Co Ltd | 文書検索装置および方法 |
US7392253B2 (en) * | 2005-03-03 | 2008-06-24 | Microsoft Corporation | System and method for secure full-text indexing |
US8417693B2 (en) * | 2005-07-14 | 2013-04-09 | International Business Machines Corporation | Enforcing native access control to indexed documents |
US7668825B2 (en) * | 2005-08-26 | 2010-02-23 | Convera Corporation | Search system and method |
US8600997B2 (en) * | 2005-09-30 | 2013-12-03 | International Business Machines Corporation | Method and framework to support indexing and searching taxonomies in large scale full text indexes |
US20070162481A1 (en) * | 2006-01-10 | 2007-07-12 | Millett Ronald P | Pattern index |
US20080086453A1 (en) * | 2006-10-05 | 2008-04-10 | Fabian-Baber, Inc. | Method and apparatus for correlating the results of a computer network text search with relevant multimedia files |
US8250075B2 (en) * | 2006-12-22 | 2012-08-21 | Palo Alto Research Center Incorporated | System and method for generation of computer index files |
JP2008217600A (ja) * | 2007-03-06 | 2008-09-18 | Fujitsu Ltd | 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体 |
US7849065B2 (en) * | 2007-07-20 | 2010-12-07 | Microsoft Corporation | Heterogeneous content indexing and searching |
US8442994B1 (en) * | 2007-09-14 | 2013-05-14 | Google Inc. | Custom search index data security |
US8965881B2 (en) * | 2008-08-15 | 2015-02-24 | Athena A. Smyros | Systems and methods for searching an index |
US8364714B2 (en) * | 2009-06-08 | 2013-01-29 | International Business Machines Corporation | Servicing query with access path security in relational database management system |
-
2009
- 2009-09-18 JP JP2009217344A patent/JP2011065546A/ja active Pending
-
2010
- 2010-09-03 WO PCT/JP2010/005435 patent/WO2011033734A1/en active Application Filing
- 2010-09-03 CN CN2010800406725A patent/CN102483765B/zh not_active Expired - Fee Related
- 2010-09-03 EP EP10816849.3A patent/EP2478452B1/en active Active
- 2010-09-03 US US13/496,505 patent/US20120173511A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6985948B2 (en) * | 2000-03-29 | 2006-01-10 | Fujitsu Limited | User's right information and keywords input based search query generating means method and apparatus for searching a file |
CN101136027A (zh) * | 2006-09-01 | 2008-03-05 | 横河电机株式会社 | 用于数据库索引、搜索和数据检索的系统和方法 |
Non-Patent Citations (1)
Title |
---|
JP特开平8-272806A 1996.10.18 |
Also Published As
Publication number | Publication date |
---|---|
EP2478452A1 (en) | 2012-07-25 |
WO2011033734A1 (en) | 2011-03-24 |
EP2478452B1 (en) | 2018-12-19 |
JP2011065546A (ja) | 2011-03-31 |
CN102483765A (zh) | 2012-05-30 |
US20120173511A1 (en) | 2012-07-05 |
EP2478452A4 (en) | 2015-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102483765B (zh) | 文件搜索系统和程序 | |
JP4739455B2 (ja) | 文書管理方法 | |
CN100587658C (zh) | 可搜索控制模板功能的基于任务的界面 | |
JP3907161B2 (ja) | キーワード検索方法、キーワード検索端末、コンピュータプログラム | |
RU2427896C2 (ru) | Аннотирование документов в совместно работающих приложениях данными в разрозненных информационных системах | |
CN101211365A (zh) | 用于建立搜索索引的方法和系统 | |
JP2005018754A (ja) | 関連付けを有するコンピュータオブジェクトの共有 | |
CA2698179A1 (en) | Document search tool | |
JP5592747B2 (ja) | ファイル検索装置およびファイル検索プログラム | |
KR101272656B1 (ko) | 태그 기반 파일 관리 방법 및 그 시스템 | |
US20060116992A1 (en) | Internet search environment number system | |
JP2012159917A (ja) | 文書管理システム、文書管理方法、及びプログラム | |
Gutteridge | GNU EPrints 2 overview | |
JP4133549B2 (ja) | 構造化文書ファイル管理装置および構造化文書ファイル管理方法 | |
CN101419611A (zh) | 用于在xml数据库上执行操作的方法 | |
Politze | Ontology based semantic data management for pandisciplinary research projects | |
De Smet | Some ISIS-Software history and technical background on the new FOSS integrated library system ABCD | |
JP2011134264A (ja) | 画面データ変換装置、画面データ変換方法、及びプログラム | |
Mazurek et al. | Distributed digital libraries platform in the PIONIER network | |
JP2007272777A (ja) | 情報処理装置、情報処理方法 | |
JP2005310184A (ja) | 情報格納検索装置 | |
JP4111508B2 (ja) | データ属性管理方法 | |
Martin et al. | First Thoughts on a Data Lake Architecture for an Open Search Infrastructure | |
JP2001075847A (ja) | 電子ファイリングシステム及びファイル管理方法 | |
Schranz | OmniPaper: Towards a Universal Standard Model for Efficient Information Retrieval. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20131211 Termination date: 20160903 |
|
CF01 | Termination of patent right due to non-payment of annual fee |