CN101523391A - 信息检索系统和信息检索方法及程序 - Google Patents

信息检索系统和信息检索方法及程序 Download PDF

Info

Publication number
CN101523391A
CN101523391A CNA2007800373698A CN200780037369A CN101523391A CN 101523391 A CN101523391 A CN 101523391A CN A2007800373698 A CNA2007800373698 A CN A2007800373698A CN 200780037369 A CN200780037369 A CN 200780037369A CN 101523391 A CN101523391 A CN 101523391A
Authority
CN
China
Prior art keywords
catalogue
retrieval
mentioned
differentiation
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800373698A
Other languages
English (en)
Inventor
菅真树
梶木善裕
山川聪
鸟居隆史
金子裕治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN101523391A publication Critical patent/CN101523391A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures

Abstract

提供一种检索对象的信息源每日变化的系统,其中,如果用户进行与过去进行的检索操作同等的操作,则能以与以前相同的方法找到相同的信息。目录登记单元(2)把检索处理中使用的目录作为按照时间序列进行区分后的区分目录来登记,检索单元(3)只读入比成为指定了的检索基点的时点早的目录而进行检索处理,进行基于某过去时点的检索处理。

Description

信息检索系统和信息检索方法及程序
技术领域
[关联申请的记载]
本发明基于日本专利申请:特愿2006—275169号(平成18年10月6日申请)的优先权主张,该申请的全部记载内容以引用的方式编入、记载于本发明中。
本发明涉及信息检索系统、信息检索方法及信息检索用程序,特别是涉及可实现以过去的观点为基础的检索的信息检索系统、信息检索方法及信息检索用程序。
背景技术
随着以Google(注册商标)等为代表的Web检索系统的普及,对电子文件等的全文检索系统已经通用。用户日常地进行采用检索系统来检索信息的工作。
现在,在对电子文件等的全文检索系统中,是预先制作用于高速检索的目录(索引),采用该目录来检索电子文件,这种结构成为主流。这样的信息检索系统的例子记载于专利文献1、非专利文献1。
作为制作目录的技术,公知的是采用N—gram的方式、词素分析方式(非专利文献1)。
根据这些方式制作的目录,一般是非压缩的,为原文档的200~300%的容量,需要大容量。
还有,存在难以动态地更新该目录的问题。
检索处理是采用该目录来进行的,所以用户能得到制作或更新了目录的时点的检索对象的数据的状态所对应的检索结果。
例如,如果目录是基于1日前的时点的检索对象数据而制作的,则其后对检索对象数据增加或更新了的状态不反映在检索结果中。
因而,要求尽可能实时地把检索对象的数据放入目录中。这样的技术记载于专利文献1、专利文献2。
专利文献1披露了制作与新登记的文档文件对应的目录而将其放入存储器中,文档检索部利用存储器中存放的新文档数据的目录数据和盘装置中存放的已有文档文件的目录数据两者来检索文档文件的文档检索装置。还有,专利文献2披露了在目录中登记新文档时将其登记在比主目录小的副目录中,检索时访问、检索各目录,合计其结果作为检索结果的文档检索装置。
专利文献1:特开平9—223152号公报(第1页)
专利文献2:特开平7—146880号公报
非专利文献1:北研二、津田和彦、獅々堀正幹著、「情報検索アルゴリズム」共立出版、2002年1月1日、pp.6、pp.160~179
发明内容
发明要解决的课题
以上的专利文献及非专利文献的披露事项以引用的方式编入、记载于本说明书中。以下给出本发明所涉及的关联技术的分析。以前及现行的信息检索系统具有下列记载的问题点。
即,即使用户进行与过去进行的检索查询同样的操作,有时也不能以与以前相同方法找到信息。
其原因是,在成为检索对象的信息源每日增加/变更的系统中,检索用目录也会每日追加/更新,所以即使用户进行的检索查询相同,检索系统也会送回不同的检索结果。
用户为了找到过去发现的文件、Web上的信息源,可以考虑预先存储该文件的路径、URI(Uniform Resource Identifier)。
但是,用户一般不存储文件的路径、URI,而是只存储怎么找到信息的。
具体而言,像现在这样,在检索引擎通用的状况下,只预先存储对检索引擎输入了的检索查询,再次进行检索。
例如,像「3日前以○○这样的关键字检索而找到的那个网页」那样预先存储。
然而,检索引擎的目录每日更新/增加,所以即使用户用同样的关键字进行检索,也会得到不同的检索结果。因此,有时不能再次找到以前得到的文件、信息。
有可能出现想得到与过去时点相同的检索结果这样的来自用户的需要。
因此,本发明是鉴于上述课题而全新地提出的,其主要目的在于提供可实现以过去的基点为基础的检索的信息检索系统、方法、程序。
用于解决课题的方案
本申请所披露的发明,为了解决上述课题,大致为以下构成。
在本发明所涉及的信息检索系统中,在目录存放单元中,作为信息检索用的目录,预先准备按时间序列进行区分后的区分目录,
具有基于检索要求中指定的条件,从按照时间序列进行区分后的多个区分目录中,选择对应的区分目录,利用上述选择到的区分目录进行检索的单元。
在本发明所涉及的信息检索系统中,具备:作为文档检索用的目录,把按时间序列进行区分而成的区分目录登记在目录存放单元中的目录登记单元;作为检索条件,输入成为检索基点的时间或契机信息的检索条件输入单元;以及基于输入了的成为检索基点的上述信息,从上述目录存放单元中,选择性地读入过去的区分目录,进行检索处理的检索单元。
在本发明中,如果未指定输入成为检索基点的时间信息,则上述检索单元利用上述目录存放单元中登记的最新目录和过去的区分目录的全部进行检索。
在本发明中,也可以是具备把区分、登记目录的契机通知上述目录登记单元的区分契机通知单元的构成。
在本发明中,也可以是具备与检索对象的文档的备份相关联,把区分目录的契机通知上述目录登记单元的单元的构成。
在本发明中,如果在多个目录中存放了对同一文档的目录数据,则上述检索单元优先对新的目录进行处理。
在本发明中,上述目录登记单元从存放文档的文档存放单元中读出目录中登记的文档,进行为在目录中登记所需的既定的事前处理,对最新目录进行登记,在进行目录的区分处理时,判断是不是目录区分的契机,如果是目录区分的契机,则把现在的最新目录的目录设定为区分目录之一后,把最新目录制作成空的,把该空的最新目录作为上述目录登记单元的目录登记处。
在本发明中,上述目录存放单元中记录的上述区分目录包含过去时点的信息检索中利用的既定的属性信息,选择与上述过去时点对应的区分目录进行检索,从而能自由输出以上述过去时点的属性信息为基础的信息检索结果。
在本发明所涉及的方法中,作为信息检索用的目录,预先准备按时间序列进行区分而成的区分目录,
基于检索要求中指定的条件,从按时间序列进行区分后的多个区分目录中,选择对应的区分目录,利用选择到的区分目录进行检索。
在本发明所涉及的方法中,包括:
作为文档检索用的目录,把按时间序列进行区分后的区分目录登记在目录存放单元中的目录登记工序;
作为检索条件,输入成为检索基点的时间或契机信息的工序;以及
基于输入了的成为检索基点的上述信息,从上述目录存放单元中,选择性地读入过去的区分目录,进行检索处理的工序。
在本发明所涉及的方法中,如果未指定输入检索的基点时间信息,则利用上述目录存放单元中登记的全部目录进行检索。
在本发明中,包括把区分目录的契机通知上述目录登记工序的工序。
在本发明所涉及的方法中,包括与检索对象的文档的备份相关联,把区分目录的契机通知上述目录登记工序的工序。
在本发明所涉及的计算机程序中,包括使计算机执行以下处理的程序:
作为文档检索用的目录,把按照时间序列进行区分而成的区分目录登记在目录存放单元中的处理;
作为检索条件,输入成为检索基点的时间或契机信息的处理;以及
基于输入了的成为检索基点的上述信息,从上述目录存放单元中,选择过去的区分目录,进行检索的处理。
发明效果
根据本发明,能实现以过去的基点为基础的检索处理。
其原因是,在本发明中,预先按时间序列来区分、记录目录,只用比过去的基点早的目录进行检索处理。
附图说明
[图1]是表示本发明的第1实施方式的构成的框图。
[图2]是表示本发明的第1实施方式中的目录的管理例的图。
[图3]是表示本发明的第1实施方式中的检索处理动作的流程图。
[图4]是表示本发明的第1实施方式中的检索处理动作的目录读入处理的图。
[图5]是表示本发明的第1实施方式中的对目录的追加处理的流程图。
[图6]是表示本发明的第1实施方式的动作的流程图。
[图7]是表示作为本发明的第1实施方式的变形例而进行时间序列分析功能的说明的图。
[图8]是表示本发明的第2实施方式的构成的框图。
[图9]是表示本发明的第2实施方式中的与备份单元联合的目录区分的动作的流动的流程图。
[图10]是表示本发明的第2实施方式中的检索处理动作的流程图。
[图11]是表示本发明的第2实施方式中的检索处理中的目录读入处理的图。
[图12]是表示本发明的第3实施方式的构成的框图。
符号说明
1 文档存放单元
2 目录登记单元
3 检索单元
4 检索条件输入单元
5 检索结果输出单元
6 备份单元
7 区分契机通知单元
8 目录管理单元
10 最新目录
11~17 区分目录
100 过去目录存放部
具体实施方式
其次,参照附图来详细说明为实施本发明的最佳方式。
图1是表示本发明的第1实施方式的构成的图。参照图1,具备文档存放单元1、目录登记单元2、检索单元3、检索条件输入单元4、检索结果输出单元5和过去目录存放部100。
过去目录存放部100包括区分目录11~14。区分目录11~14在图1中是4个的构成,不过数量没有限制。
这些单元各自大致按以下方式动作。
文档存放单元1完成保持检索对象的文档的功能。文档存放单元1,例如可以列举
·用户所保持的个人计算机的硬盘装置,
·NAS(Network Attached Storage)等外部装置,
·WWW(World Wide Web),
·Intranet(企业内的网页群)等。
检索对象的文档有上述存放单元内存在的网页、办公室文档等电子文档、数据库内的结构化了的信息等。
目录登记单元2具有制作文档存放单元1所保持的检索对象的文档的目录而将其登记在最新目录10中的功能。
检索单元3利用区分目录10~14的目录进行检索处理。检索关键字、检索的时点(对什么时点的文档群进行检索)等检索条件从检索条件输入单元4中获取。检索处理的结果交给检索结果输出单元5。
检索条件输入单元4指定
·用于检索的检索关键字、
·成为检索基点的信息
等检索条件,完成向检索单元3交付的功能。成为检索基点的信息例如是年月日或者时、分等时间信息,此外也可以是与时间关联的事件等契机信息。
作为检索条件输入单元4的一个例子,例如,可以采用从用户的Web浏览器上输入的检索关键字的输入框等。
检索结果输出单元5完成获取检索单元3所进行的检索处理的结果,将其作为检索结果向用户输出的功能。作为检索结果输出单元5的一个例子,例如,可以采用在用户的Web浏览器上输出检索结果一览的软件。
另外,目录登记单元2、检索单元3、检索条件输入单元4和检索结果输出单元5是通过在计算机下动作的程序控制来实现其功能、处理。
最新目录10及过去目录存放部100中包含的区分目录11~14是用于检索处理的目录。根据某种契机按时间序列区分了该目录。
其中,把最新的更新部分的区分目录作为最新目录10。
目录登记单元2把新文档或更新文档进行目录化,总是登记到最新目录10中。
另外,在图1中,过去的区分目录是合计4个的构成,不过,区分目录的数量没有限制,每次按时间序列进行区分时增加。
最新目录10、区分目录11~14保存于存储器、磁盘装置等存储装置中。
作为保存的形式,有
·通常文件的形式,
·数据库上的记录
等。
最新目录10、区分目录11~14可以分别保存于不同的存储装置中,也可以保存于相同的存储装置中。
图2是用于说明目录管理的一实施例的示意图。图2的例子是按时间序列来区分目录,按1日1回区分目录。图2的例子中的现在日期为「5/11」,
·现在的文档的目录登记在最新目录10中进行。
作为区分目录,应该是
·1日前的「5/10」所登记的部分保存于右邻的区分目录11中,
·2日前的「5/9」所登记的部分保存于区分目录12中。
这样,把过去的最新目录直接作为区分目录依次保持。
随着时间流逝,过去的目录会不断增加。
在区分某个确定了的目录的契机,新制作最新部分的目录(目录登记单元2登记目录的对象)。
并且,到此为止属于最新部分的目录的目录(最新目录10)作为第2新的目录,成为区分目录之一。
也可以通过变更目录登记单元2向登记处的登记路径来实现该结构。
还有,也可以把最新目录10的数据复制到过去目录存放部100中,制作新的区分目录,空出最新目录10来实现。
另外,不问最新目录10及区分目录11~17的物理的或逻辑的存储位置。
其次,参照图3的流程图,详细说明本实施方式的检索处理动作。
首先,用户通过检索条件输入单元4输入检索条件(图3的步骤S101)。
作为检索条件,输入
·通常的检索查询的信息(检索的关键字等)和,
·如果需要,成为检索处理的基点的日时的信息(称为「基点信息」)。
该基点信息是进行基于过去观点的检索处理时所需的信息。
基于过去观点的检索处理是例如在想得到与3日前进行的检索处理完全同等的结果时,进行基于3日前的信息的检索。
其次,检索单元3确认是否输入了基点信息(步骤S102)。
未输入基点信息时(步骤S102的“否”分支),检索单元3读取全部目录进行检索(步骤S103)。
对于步骤S103的处理,就图4所示的例子进行说明。
假定区分目录有11到17。此时,从最新目录10到区分目录17,读取全部目录进行检索处理。
这时,在对同一文档进行了更新时,多个目录中会存放同一文档所对应的目录数据,不过,总是新的目录优先(在图4中,左侧存在的目录优先)。
在步骤S103中,检索单元3基于读取(Read)到的目录信息,执行检索处理(步骤S104)。然后,检索单元3向检索结果输出单元5通知检索结果。
步骤S102为“是”时(输入了基点信息),检索单元3读取指定了的规定信息以前的目录进行检索(步骤S105)。
对于步骤S105的动作,就图4所示的例子进行说明。
此次,假定基点信息是输入了「5/8」。此时,基于「5/8」的目录进行检索处理,所以检索单元3从「5/8」部分的区分目录12进行目录读入。
即,不读入登记了最新的更新部分(「5/10」以后的信息)的最新目录10和登记了「5/9」部分的区分目录11,而是读入其他全部目录进行检索处理。
这时,与步骤S103同样,在对同一文档进行了更新时,多个目录中会存放同一文档所对应的目录数据,不过,总是新的目录优先(在图4中,左侧存在的目录优先)。
以这样的结构进行检索处理,就能基于基点信息中输入了的时间时点上的目录的数据,进行检索处理。
作为本发明的实施方式的变形,也可以是在步骤S105或S103的检索处理中,不全部读取过去的区分目录。
例如,读入最新目录10到区分目录14,不读入比其早的区分目录。
这样,最新部分到「5/6」的更新变更部分就成为检索对象,其以前的更新变更部分不作为检索对象。
读取至何种程度的过去的区分目录,是与检索性能的权衡。
读取至何种程度的过去的区分目录,例如,可根据以下方法决定。
(A)检索条件输入单元4指定「检索多少日前为止变更了的文档」,或者
(B)检索单元3预先决定进行读入的目录的界限大小,不读入其以上的区分目录
等。
(B)的方法可以考虑由进行检索处理的服务器的缓存器大小来决定等实施方式。
采用该变形能提高检索处理性能。
其原因在于作为决定检索处理性能的一个因素而读入的目录容量。
其次,说明在本发明的第1实施方式中为进行检索处理的事前准备。
在本实施方式中,为进行检索处理,需要
·检索对象的文档的目录化,和
·目录的区分处理
这样2个处理。按顺序说明该处理动作。
首先,参照图5的流程图来说明检索对象的文档的目录登记处理的动作。
最初,目录登记单元2从文档存放单元1中读出目录中登记的文档(作为检索对象的文档)(图5的步骤S201)。
其次,进行为在目录中登记的处理的事前处理(步骤S202)。
该事前处理以作为目录手法的一方式的转置转置文件法为例,包括以下处理。
·读出检索对象的文档而提取文本,从该文本中提取目录中登记的索引语。
·识别该索引语的出现位置、回数等。
目录化方法的详细情况记载于非专利文献1等文献中,所以省略。
最后,目录登记单元2把通过事前处理变得清楚了的目录中登记所用的信息向目录10登记(步骤S203)。
在最新目录10中该检索对象的文档的信息不存在时,进行新追加的处理。
在最新目录10中该检索对象的文档的信息存在时,进行更新的处理。
另外,在通常的检索目录的制作中,对于新制作和更新、删除,进行目录的更新处理。
对于新制作和更新,如上所述,而对于删除,则是针对最新目录10,把删除文档的目录做成空的,进行登记的处理,不删除过去的区分目录11以后的。
其次,参照图6的流程图来说明目录区分处理的动作。
另外,该目录区分处理可以由目录登记单元2进行,也可以另外准备管理目录的单元来进行。
首先,判断是不是目录区分的契机(图6的步骤S301)。
区分目录的契机,例如,
·作为定期性区分,可以预先确定时刻、星期几,
·也可以按目录的尺寸来决定而进行区分。
如果不是目录区分契机,则不需要目录区分处理,所以在本处理流程中什么都不进行。
如果是目录区分的契机,则把作为现在最新目录10的目录作为区分目录之一(步骤S302)。
该实施例有各种方法,例如有
·把最新目录10物理地或者逻辑地复制到过去目录存放部100中,
·重新命名最新目录10,将其作为区分目录对待,
·变更目录登记单元2的登记处的目录
等。
最后,把新的最新目录10重新制作成空的(步骤S303)。
把该最新目录10作为以后的目录登记单元2的登记处的目录。
另外,目录的区分处理可以按这样的图6的流程进行,也可以根据来自其他某个单元的通知,作为事件进行区分处理。
例如,如果每日0点区分目录,则另外准备在每日0点发送用于要求目录的区分处理的通知的单元,把该通知向区分处理担当的单元通知。0点以前的昨天的最新目录成为最新的过去的区分目录,把新的最新目录10作为以后的目录登记单元2的登记处,制作1日部分的区分目录。
另外,后述的本发明的第2实施方式是这种结构所涉及的一个例子。
还有,目录区分处理不是必须由目录登记单元2来进行,也可以另外准备只另外进行目录区分的单元。各自选择最适合的安装方法即可。
对本发明的第1实施方式的作用效果进行说明。
为了实现基于过去某时点的检索处理,需要预先全部保持过去时点的目录,不过,在第1实施方式中是按时间序列进行区分而保持目录,基于输入了的基点信息来变更读取的目录,所以具有能削减过去目录的保持容量的效果。
还有,在只保持最新部分的目录的方法中也是,预先保持过去的检索结果,因而能实现同样的事情,不过,它只针对过去实际进行了的检索,不能送回过去观点下的检索结果。
在本实施方式中,即使过去不进行检索查询,也能实现基于过去观点的检索。
还有,最新目录10只存放最新登记部分的目录,所以容量可以小些。即,仅最新登记部分的目录作为差分被存放。相对于成为基准的过去的1个区分目录,以后的区分目录仅差分信息被积蓄。因此,能在高速存储装置(半导体存储器等)中存放,所以能高速地进行目录的追加更新处理等。
对于本发明的第1实施方式的变形(其2)进行说明。本发明的第1实施方式的变形2是按时间序列来分析检索结果。
应用本发明的第1实施方式,能得到以下功能。
·某检索查询所对应的检索结果的时间序列推移的显示,
·同一文档的某检索查询所对应的检索名次的推移的显示。
以图7为例进行说明,若这样进行变更了成为检索处理的对象的目录的检索处理,则能得到每个日期的检索结果。
归结、合计该检索结果,就能实现上述功能。
另外,在本实施方式中,各区分目录是按照目录登记时的日时等而按时间序列进行区分的,不过,也可以是与此不同,基于在目录的制作中所参照的文档的属性(例如类型标记等),按区分目录进行区分的构成。
其次,对于本发明的第2实施方式,参照附图详细进行说明。参照图8,本发明的第2实施方式是在图1所示的第1实施方式的基础上,包括备份单元6和区分契机通知单元7。
除这2个单元以外,与上述第1实施方式同样,所以省略说明。备份单元6和区分契机通知单元7大致按以下方式动作。
备份单元6是预先制作、存储文档存放单元1中存放的数据的备份(预备)的单元。
备份单元6是用于把文档存放单元1中存放的数据复原为某契机的数据的单元,实际列举把整个数据或变更部分的复制定期地保存在存储装置中的单元为例。
还有,在称为「快拍」那样的把表示盘内的数据的位置的指针信息予以记录的结构中,不具有实际的数据的复制,能在某一时点复原文档存放单元1的数据的单元也看作备份单元6之一。
还有,此外,也可以把能访问
·CDP(Continuous Data Protection;连续性数据保护)控制软件,或者
·数据库软件,
·报表软件
那样的过去数据的数据保护手法作为备份单元6来利用。
CDP是每次数据被更新时把其变更内容按时间序列保存起来的数据保护手法,跟踪、捕捉向存储器的数据写入,在数据更新发生了时,把其变更内容在二次存储器(变更履历数据库)中做成报表。
这样,过去任何时点的数据都能再现(Any Point InTime(APIT)Recovery),能避免数据损失。
这相当于以秒单位持续取得追加备份。
在快拍中,数据仅能以数十分的量级复原,而在CDP中,能以数秒水平设定数据的修复地点。
另外,只根据数据的变更履历的记录,不能复原整个实数据,所以作为开始地点,是进行整个体积的重复,按时间序列来记录该重复所对应的变更履历的构成)。
作为CDP的类型,有
·块型,
·文件型,
·用途型。
块型是按物理盘或逻辑体积水平的块单位来跟踪数据变更。
文件型是按文件水平来跟踪数据变更。
用途型是根据登录信息、API来识别特定用途的动态,按文件更新、事件单位来跟踪。
跟踪频度,如果是块单位,则例如以秒单位以上为最小单位,文件型、用途型则例如以每个文件、事件更新为最小单位。
向二次存储器的写入有同步型、非同步型。
另外,作为CDP软件,有市售的TimeSpring公司的「TimDataTM」(商标)等。
区分契机通知单元7是通知由备份单元6对文档存放单元1的数据的复制(或复原能的点)予以保持的契机的一部分或全部的单元。
按照该通知的契机,目录登记单元2进行目录的区分。
具体而言,假定备份单元6是1日1回,每日0点进行备份,则区分契机通知单元7是每日0点向目录登记单元2指示目录的区分。
对于本发明的第2实施方式中的与备份系统联合而区分目录的动作的流动,参照图9进行说明。
首先,备份单元6取得文档存放单元1中保持的数据的备份(图9的步骤S401)。
作为具体实施例,可以列举从文档存放单元1的存储装置中读入备份时点的数据,将其存储在备份单元的存储装置中。
其次,区分契机通知单元7把备份单元6取得备份的契机向目录登记单元2(担任目录区分处理的单元)通知(步骤S402)。
最后,目录登记单元2进行目录区分处理(步骤S403)。
关于目录区分处理,与上述第1实施方式相同。
在基于本发明的第2实施方式的系统中,除能实现以与上述第1实施方式同样的过去的基点为基础的检索之外,还能实现对备份数据的检索处理。
参照图10的流程图,对于本实施方式的检索处理动作详细进行说明。
首先,用户通过检索条件输入单元4而输入检索条件(图10的步骤S501)。
在检索条件中,指定或选择
·通常的检索查询的信息(检索的关键字等),
·根据需要,检索对象的备份数据的种类(或备份采取时间)。
如果每日0点开始备份,则作为检索条件的时间信息,可以输入年月日信息,或者如果按月、周有几次备份,则可以把几月的第几次的备份以前或者以后等的备份事件信息指定为过去信息。另外,作为成为检索基点的条件,也可以以时间的范围或者逻辑式来给出。
其次,检索单元3进行检索处理,不过,其最初是确认是不是指定了备份数据的种类(步骤S502)。
如果未选择备份数据(为“否”时),则检索单元3全部读取目录而进行检索处理(步骤S503)。
该处理与第1实施方式同样,因而省略说明。
基于在步骤S503中读入的目录信息,完成检索处理(步骤S505)。
检索单元3向检索结果输出单元5通知检索结果。
如果步骤S502为“是”(指定了备份数据时),则读检索单元3读取指定了的备份数据的采取时点以前的目录而进行检索(步骤S504)。
对于步骤S504的动作,以图11为例进行说明。
图11是表示目录的区分情况的图。是1日取1回备份的系统,按备份的契机来区分目录。
在该情况下,从按「5/9」采取到的备份到按「5/10」取备份的更新反映在区分目录11中。
此次,若要对按「5/9」取得的备份数据进行检索处理,则检索单元3读入区分目录12以后的区分目录,进行检索处理。
另外,在上述例子中,以采取到全备份的系统为前提,不过,同样,也可以进行对按「5/9」采取到的差分备份数据的检索。
以图11为例进行说明,检索单元3只读入区分目录12,进行检索处理。
另外,在检索单元3的检索处理(步骤S504)或者检索结果输出单元5进行的结果的输出处理阶段(步骤S505)中,需要改写检索结果到文件的路径(URI、文件名等)。
其前提是,检索目录中存放的到检索对象文档的路径存在于文档存放单元1中。
这是因为到备份单元中记录的检索对象文档的路径是基于由备份单元决定的规则,所以备份单元6把该变换规则事前向检索单元3或检索结果输出单元5通知。
图8的构成是由检索单元3(步骤S504)进行路径变换的情况。
本发明的第2实施方式的变形可以进行对于在过去的目录中找到的文件把参照处变更为备份处的CDP软件那样的变动。
还有,在本发明的第2实施方式中的检索处理(图10的步骤S503及S504)中,可以按能在检索中找到旧版文档的方式把第2实施方式予以变形。
在本发明的第2实施方式中,在图10的步骤S503及S504中,与上述第1实施方式同样,对于多个区分目录中存在的同一文档的目录,检索单元3在读入的范围按最新的区分目录优先的方式动作。
在本发明的第2实施方式的变形中,对于在任意一个区分目录中找到的文档,把文档的路径(参照处)变更为备份单元6中的存储处。
并且,即使找到多个同一文档的目录,在检索结果中也是提示其两者。
另外,也可以把在区分目录中找到的文档的全部的路径变更到备份的路径,不过也可以是,如果该文档是最新的(在比找到的区分目录新的目录中,该文档不存在时),则不变更路径,而是直接提示文档存放单元1的路径,如果在备份单元6中找到的文档存在,则按备份单元6中的存储处来变更该文档的路径。
为提供对由备份单元采取到的备份数据的检索功能,现状是需要对备份数据制作目录。
但是,利用本实施方式,具有只依靠对主要的文档存放单元1的目录,就能实现对备份数据的检索功能的效果。
在此情况下,不需要对备份数据的目录登记处理,所以能削减目录所需的存储容量以及计算处理所需的计算机资源。
对于过去的区分目录,把检索找到的文档的参照处作为备份单元所存储的场所,因而本发明的检索系统,与CDP同样,具有能访问过去的履历的效果。还有,能实现基于过去的状态的检索,所以能以只在文件的过去某时点存在的单词等进行检索。
其次,对于本发明的第3实施方式,参照附图详细进行说明。在本发明的第3实施方式中,是合并过去的区分目录的构成。
参照图12,本发明的第3实施方式,是在图1所示的上述第1实施方式的基础上,包括目录管理单元8。
除此以外,与上述第1实施方式相同,所以省略说明。
另外,也可以设为在图8所示的上述第2实施方式中增加目录管理单元8的构成,来实现第3实施方式。
目录管理单元8大致按以下方式动作。目录管理单元8具有访问区分目录中的单个或多个,合并区分目录,将其作为1个区分目录的功能。
关于合并区分目录的情况,列举转置文件法所涉及的目录制作方式为例,它是把包含多个的同一文档的目录,留下新的一方作为1个,把多个转置文件设为1个转置文件。
合并区分目录的处理可以考虑按以下条件进行。
·区分目录超过一定数时,
·区分目录超过一定容量时,
·区分目录早于一定期间时。
根据本实施方式,通过合并区分目录,能使检索处理性能高速化。
其原因是,通过合并区分目录,改善了多次读取同一文档的目录这样的目录的非效率性。
对于本发明的第3发明的实施方式的变形进行说明。
在第1实施方式的变形中,若在中途停止过去的区分目录的读入,则不能检索找到过去的文件,为解决这样的问题,在本变形中,完成计算机中的超高速缓冲存储器那样的目录的动作。在本变形中,目录管理单元8具有以下功能。
目录管理单元8读入最新目录及区分目录11~15,提取目录中包含的几个文档而制作新的区分目录。
并且,该区分目录与通常的区分目录分开对待,即使在检索处理时中途停止读入,也必定读入。
从区分目录中选择的文档按一定的规则提取即可。该规则例如可以考虑以下例子。
·一定期间以上未更新,而来自用户的READ频繁进行的文档,
·用户指定为重要的文档,
·特定的关键字包含在文档内的文档。
在第1实施方式的变形中会出现检索不找到过去的文件的问题,而按以上方式,即使目录管理单元8选择到的文档未更新,也不会在检索中找不到,这是其具有的效果。
另外,在上述各实施方式及其变形例中,作为目录中记录的信息(属性信息),如果记录了后边不能再计算或者难以再计算的信息,则能按照该目录的属性,在追溯到过去的环境下实现基于过去时点的文档群特征的信息检索。作为目录中记录的后边不能再计算或者难以再计算的信息的例子,可以列举检索结果的排序中利用的关键字的频度等数值数据、表示文档的重要度等的分值等。若在过去时点记录这种信息,则在后边的信息检索中可输出与过去的检索时同样的排序的检索结果。
在本发明中,如果在目录中只记录后边能再计算的信息,则能有效地执行对过去时点的文档的信息检索。在这里,「信息检索的有效执行」是指可削减根据保持完全的过去的目录的存储容量、备份等再生成目录的计算量等。作为后边能再计算的信息的例子,有关键字及其出现文档的对应信息等。
上述不能再计算的目录信息(静态分值信息)和能再计算的目录信息存放在别的存储区域时,把两者按时间序列进行区分,就能适用本发明。图1中表示关于时间轴具有一个系列的区分目录(10~14)的构成,不过,在本发明中,当然也可以是关于时间轴具有多个系列的区分目录的构成。即,在把目录配置在多个存储区域中的系统中也能适用本发明。在该情况下,对于多个存储区域的目录,分别设置按时间序列进行区分后的多个系列的区分目录。
对于上述各实施方式的作用效果进行说明。
(A)能实现基于过去基点的检索处理。其原因是,在上述实施方式中,是预先按时间序列区分、记录了目录,只利用比过去基点早的目录进行检索处理的构成。
(B)还有,在具有上述效果的情况下,能高速地进行目录的追加更新处理等。其原因是,在上述实施方式中,成为追加更新对象的目录是只记录一定期间的追加更新部分的区分后的目录,所以容量可以小些。因此,能存放在高速的存储装置(半导体存储器等)中,能高速地进行目录的追加更新处理等。
(C)再有,可抑制降低目录的保持容量的增加。其原因是,为了实现基于过去某时点的检索处理,需要预先全部保持过去时点的目录,而在上述实施方式中,是按时间序列区分、保持目录,基于输入了的基点信息来变更目录。
(D)再有,不需要对备份数据制作目录。其原因是,在上述实施方式中,使得目录区分的契机和备份取得的契机相同,把检索结果的参照处变更为备份数据,就能不准备别的目录而实现对备份数据的检索。在此情况下,不需要对备份数据的目录登记处理,所以对于备份装置能削减目录化所需的存储容量以及计算处理所需的计算机资源。
根据本发明,例如能适用于
·World Wide Web中存在的信息检索系统,或者
·对组织内的信息(局域网的Web或者组织中的信息系统、数据库、存储器等所保持的信息)的信息检索系统的用途。即,本发明当然也可以是在检索引擎等中具备上述实施方式的信息检索系统。
还有,本发明也可适用于为了某种分析而保持中间数据的信息处理系统。
本发明也可适用于对备份、存档数据的检索系统的用途。例如,可以使数据挖掘处理或进行文本挖掘处理的挖掘装置成为具备权利要求1等本发明的信息检索系统的构成。或者,可以使携带通信终端(手机)成为具备权利要求1等本发明的信息检索系统的构成。或者,可以使音乐(声音)/图像(动画)等媒体再现装置成为具备权利要求1等本发明的信息检索系统的构成。或者,可以使管理名单信息的装置成为具备权利要求1等本发明的信息检索系统的构成。或者,可以使卡拉OK装置成为具备权利要求1等本发明的信息检索系统的构成。在这些装置中,例如如果是按照目录的属性来实现基于过去时点的属性信息的信息检索的构成,则用户进行与过去进行的检索操作同等的操作时,能以与以前相同的方法找到相同的信息。
以上就上述实施例说明了本发明,不过,本发明不只限于上述实施例的构成,而是当然包括本领域技术人员在本发明的范围内所能做的各种变形、修正。
权利要求书(按照条约第19条的修改)
1.(删除)
2.(删除)
3.(删除)
4.(删除)
5.(删除)
6.(删除)
7.(删除)
8.(删除)
9.(删除)
10.(删除)
11.(删除)
12.(删除)
13.(删除)
14.(删除)
15.(删除)
16.(删除)
17.(删除)
18.(增加)一种信息检索系统,其特征为,具备目录登记单元,作为信息检索用的目录把按时间序列进行区分而成的区分目录登记在目录存放单元中,从存储文档的文档存放单元读出在目录中登记的文档,进行为在目录中登记所需的既定的事前处理,如果在登记对象的区分目录内不存在登记对象的文档的信息,则把上述事前处理中取得的用于在目录中登记的信息追加登记在登记对象的区分目录中。
19.(增加)一种信息检索系统,其特征为,具备:检索条件输入单元,作为检索条件输入成为检索基点的时间或契机信息;以及检索单元,基于上述检索条件,从作为信息检索用的目录而按时间序列进行区分的多个区分目录中选择对应的区分目录,利用上述选择的区分目录进行检索。
20.(增加)根据权利要求18所述的信息检索系统,其特征为,具备:
检索条件输入单元,作为检索条件输入成为检索基点的时间或契机信息;以及
检索单元,基于上述检索条件,从按时间序列进行区分的多个区分目录中选择对应的区分目录,利用上述选择的区分目录进行检索。
21.(增加)根据权利要求18或20所述的信息检索系统,其特征为,如果在上述登记对象的区分目录中存在登记对象的文档的信息,则上述目录登记单元利用在上述事前处理中取得的用于在目录中登记的信息来更新登记上述登记对象的区分目录。
22.(增加)根据权利要求19或20所述的信息检索系统,其特征为,如果在多个目录中存放有对同一文档的目录数据,则上述检索单元优先对新的目录进行处理。
23.(增加)根据权利要求19、20、22中任意一项所述的信息检索系统,其特征为,如果未指定输入上述成为检索基点的信息,则上述检索单元利用上述目录存放单元中登记的最新目录和过去的区分目录的全部进行检索。
24.(增加)根据权利要求18、20、21中任意一项所述的信息检索系统,其特征为,具备区分契机通知单元,把区分、登记目录的契机向上述目录登记单元通知。
25.(增加)根据权利要求18、20、21、24中任意一项所述的信息检索系统,其特征为,具备与成为目录的制作对象的文档的备份相关联,把区分、登记目录的契机向上述目录登记单元通知的单元。
26.(增加)根据权利要求18、20、21、24、25中任意一项所述的信息检索系统,其特征为,
上述目录登记单元从存储文档的文档存放单元中读出目录中登记的文档,进行为在目录中登记所需的既定的事前处理,并对最新目录进行登记,
在进行目录的区分处理时,判断是不是目录区分的契机,如果是目录区分的契机,则把现在的最新目录的目录设定为区分目录之一后,把最新目录制作成空的,把该空的最新目录作为上述目录登记单元的目录登记处。
27.(增加)根据权利要求18、20、21、24至26中任意一项所述的信息检索系统,其特征为,
上述目录存放单元中记录的上述区分目录包含过去时点的信息检索中利用的既定的属性信息,
选择与上述过去时点对应的区分目录进行检索,从而自由输出基于上述过去时点的属性信息的信息检索结果。
28.(增加)根据权利要求18、20、21、24至27中任意一项所述的信息检索系统,其特征为,
具备上述文档存放单元的备份单元,
并具备与上述文档存放单元的备份相关联,把区分目录的契机向上述目录登记单元通知的单元。
29.(增加)根据权利要求28所述的信息检索系统,其特征为,具备在提示上述检索结果时,在上述备份单元的存储处设定文档的路径的单元。
30.(增加)根据权利要求18至29中任意一项所述的信息检索系统,其特征为,上述区分目录保持文档的分值信息。
31.(增加)根据权利要求18至30中任意一项所述的信息检索系统,其特征为,具备合并上述区分目录的目录管理单元。
32.(增加)一种信息检索方法,其特征为,包括目录登记工序,作为信息检索用的目录把按时间序列进行区分而成的区分目录予以登记,此时,从存储文档的文档存放单元中读出在目录中登记的文档,进行为在目录中登记所需的既定的事前处理,如果在登记对象的区分目录内不存在登记对象的文档的信息,则把上述事前处理中取得的用于在目录中登记的信息追加登记在登记对象的区分目录中。
33.(增加)一种信息检索方法,其特征为,具备:
检索条件输入工序,作为检索条件输入成为检索基点的时间或契机信息;以及
检索工序,基于上述检索条件,从作为信息检索用的目录而按时间序列进行区分后的多个区分目录中选择对应的区分目录,利用上述选择的区分目录进行检索。
34.(增加)根据权利要求32所述的信息检索方法,其特征为,具备:
检索条件输入工序,作为检索条件输入成为检索基点的时间或契机信息;以及
检索工序,基于上述检索条件,从按时间序列进行区分后的多个区分目录中选择对应的区分目录,利用上述选择的区分目录进行检索。
35.(增加)根据权利要求32或34所述的信息检索方法,其特征为,在上述目录登记工序中,如果在上述登记对象的区分目录中存在登记对象的文档的信息,则利用在上述事前处理中取得的用于在目录中登记的信息来更新登记上述登记对象的区分目录。
36.(增加)根据权利要求33或34所述的信息检索方法,其特征为,如果在多个目录中存放有对同一文档的目录数据,则在上述检索工序中优先对新的目录进行处理。
37.(增加)根据权利要求32、34至36中任意一项所述的信息检索方法,其特征为,如果未指定输入检索的基点时间信息,则利用上述目录存放单元中登记的全部目录进行检索。
38.(增加)根据权利要求32、34至37中任意一项所述的信息检索方法,其特征为,具备把区分目录的契机向上述目录登记工序通知的工序。
39.(增加)根据权利要求32、34至38中任意一项所述的信息检索方法,其特征为,具备与检索对象的文档的备份相关联,把区分目录的契机向上述目录登记工序通知的工序。
40.(增加)一种程序,其特征为,使计算机执行如下目录登记处理:该目录登记处理是作为信息检索用的目录把按时间序列进行区分而成的区分目录予以登记的处理,并且从存储文档的文档存放单元中读出在目录中登记的文档,进行为在目录中登记所需的既定的事前处理,如果在登记对象的区分目录内不存在登记对象的文档的信息,则把上述事前处理中取得的用于在目录中登记的信息追加登记在登记对象的区分目录中。
41.(增加)一种程序,其特征为,使计算机执行以下处理:
检索条件输入处理,作为检索条件输入成为检索基点的时间或契机信息;以及
检索处理,基于上述检索条件,从按时间序列进行区分后的多个区分目录中选择对应的区分目录,利用选择的区分目录进行检索。
42.(增加)根据权利要求40所述的程序,其特征为,使计算机执行以下处理:
检索条件输入处理,作为检索条件输入成为检索基点的时间或契机信息;以及
检索处理,基于上述检索条件,从按时间序列进行区分后的多个区分目录中选择对应的区分目录,利用选择的区分目录进行检索。
43.(增加)根据权利要求40或42所述的程序,其特征为,在上述目录登记处理中,如果在上述登记对象的区分目录中存在登记对象的文档的信息,则利用在上述事前处理中取得的用于在目录中登记的信息来更新登记上述登记对象的区分目录。
44.(增加)根据权利要求41或42所述的程序,其特征为,如果在多个目录中存放有对同一文档的目录数据,则上述检索处理中优先对新的目录进行处理。

Claims (17)

1.一种信息检索系统,其特征为,
在目录存放单元中,作为信息检索用的目录,预先准备按时间序列进行区分而成的区分目录,
具有基于检索要求中指定的条件,从按照时间序列进行区分后的多个区分目录中,选择对应的区分目录,利用上述选择到的区分目录进行检索的检索单元。
2.根据权利要求1所述的信息检索系统,其特征为,具备:
作为文档检索用的目录,把按时间序列进行区分而成的区分目录登记在目录存放单元中的目录登记单元;以及
作为检索条件,输入成为检索基点的时间或契机信息的检索条件输入单元,
上述检索单元基于上述输入了的成为检索基点的上述信息,从上述目录存放单元中,选择性地读入过去的区分目录,进行检索处理。
3.根据权利要求1或2所述的信息检索系统,其特征为,如果未指定输入上述成为检索基点的时间信息,则上述检索单元利用上述目录存放单元中登记的最新目录和过去的区分目录的全部进行检索。
4.根据权利要求2所述的信息检索系统,其特征为,具备把区分、登记目录的契机通知上述目录登记单元的区分契机通知单元。
5.根据权利要求2所述的信息检索系统,其特征为,具备与成为目录的制作对象的文档的备份相关联,把区分、登记目录的契机通知上述目录登记单元的单元。
6.根据权利要求2所述的信息检索系统,其特征为,如果在多个目录中存放了对同一文档的目录数据,则上述检索单元优先对新的目录进行处理。
7.根据权利要求2所述的信息检索系统,其特征为,上述目录登记单元从存放文档的文档存放单元中读出目录中登记的文档,进行为在目录中登记所需的既定的事前处理,对最新目录进行登记,
在进行目录的区分处理时,判断是不是目录区分的契机,如果是目录区分的契机,则把现在的最新目录的目录设定为区分目录之一后,把最新目录制作成空的,把该空的最新目录作为上述目录登记单元的目录登记处。
8.根据权利要求1或2所述的信息检索系统,其特征为,
上述目录存放单元中记录的上述区分目录包含过去时点的信息检索中利用的既定的属性信息,
选择与上述过去时点对应的区分目录进行检索,从而能自由输出以上述过去时点的属性信息为基础的信息检索结果。
9.根据权利要求2所述的信息检索系统,其特征为,
具备存放检索对象的文档的文档存放单元,
上述目录登记单元制作上述文档存放单元所保持的检索对象的文档的目录,将其作为区分目录,登记在上述目录存放单元中。
10.根据权利要求9所述的信息检索系统,其特征为,
具备上述文档存放单元的备份单元,
具备与上述文档存放单元的备份相关联,把区分目录的契机向上述目录登记单元通知的单元。
11.一种信息检索方法,其特征为,
作为信息检索用的目录,预先准备按时间序列进行区分而成的区分目录,
基于检索要求中指定的条件,从按时间序列进行区分后的多个区分目录中,选择对应的区分目录,利用选择到的区分目录进行检索。
12.根据权利要求11所述的信息检索方法,其特征为,包括:
作为文档检索用的目录,把按时间序列进行区分而成的区分目录登记在目录存放单元中的目录登记工序;以及
作为检索条件,输入成为检索的基点的时间或契机信息的工序,
基于输入了的成为上述检索的基点的上述信息,从上述目录存放单元中,选择性地读入过去的区分目录,进行检索处理。
13.根据权利要求11或12所述的信息检索方法,其特征为,如果未指定输入检索的基点时间信息,则利用上述目录存放单元中登记的全部目录进行检索。
14.根据权利要求12所述的信息检索方法,其特征为,包括把区分目录的契机通知上述目录登记工序的工序。
15.根据权利要求12所述的信息检索方法,其特征为,包括与检索对象的文档的备份相关联,把区分目录的契机通知上述目录登记工序的工序。
16.一种程序,其特征为,使计算机执行以下处理:
作为文档检索用的目录,预先准备按照时间序列进行区分而成的区分目录,
基于检索要求中指定的条件,从按时间序列进行区分后的多个区分目录中,选择对应的区分目录,利用选择到的区分目录进行检索。
17.根据权利要求16所述的程序,其特征为,
使计算机执行以下处理:
作为文档检索用的目录,把按照时间序列进行区分而成的区分目录登记在目录存放单元中的处理;
作为检索条件,输入成为检索的基点的时间或契机信息的处理;以及
基于输入了的成为上述检索基点的上述信息,从上述目录存放单元中,选择过去的区分目录,进行检索的处理。
CNA2007800373698A 2006-10-06 2007-10-02 信息检索系统和信息检索方法及程序 Pending CN101523391A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP275169/2006 2006-10-06
JP2006275169 2006-10-06

Publications (1)

Publication Number Publication Date
CN101523391A true CN101523391A (zh) 2009-09-02

Family

ID=39282751

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800373698A Pending CN101523391A (zh) 2006-10-06 2007-10-02 信息检索系统和信息检索方法及程序

Country Status (4)

Country Link
US (1) US8301603B2 (zh)
JP (1) JP5218060B2 (zh)
CN (1) CN101523391A (zh)
WO (1) WO2008044542A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109643303A (zh) * 2016-10-17 2019-04-16 日本电信电话株式会社 数据处理装置以及数据处理方法

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831214B (zh) 2006-10-05 2017-05-10 斯普兰克公司 时间序列搜索引擎
JP2010079601A (ja) * 2008-09-26 2010-04-08 Hitachi Software Eng Co Ltd 多世代ファイル探索システム
WO2010055901A1 (ja) * 2008-11-14 2010-05-20 日本電気株式会社 情報処理システムと方法並びにプログラム
US8538188B2 (en) * 2009-08-04 2013-09-17 Mitre Corporation Method and apparatus for transferring and reconstructing an image of a computer readable medium
US8682886B2 (en) 2012-05-18 2014-03-25 Splunk Inc. Report acceleration using intermediate summaries of events
EP2907034A4 (en) * 2012-10-12 2016-05-18 A9 Com Inc INDEX CONFIGURATION FOR SEARCHABLE DATA IN A NETWORK
US9507750B2 (en) * 2012-10-12 2016-11-29 A9.Com, Inc. Dynamic search partitioning
US9047326B2 (en) 2012-10-12 2015-06-02 A9.Com, Inc. Index configuration for searchable data in network
US9087055B2 (en) * 2013-01-28 2015-07-21 International Business Machines Corporation Segmenting documents within a full text index
US10225136B2 (en) 2013-04-30 2019-03-05 Splunk Inc. Processing of log data and performance data obtained via an application programming interface (API)
US10997191B2 (en) 2013-04-30 2021-05-04 Splunk Inc. Query-triggered processing of performance data and log data from an information technology environment
US10318541B2 (en) 2013-04-30 2019-06-11 Splunk Inc. Correlating log data with performance measurements having a specified relationship to a threshold value
US10019496B2 (en) 2013-04-30 2018-07-10 Splunk Inc. Processing of performance data and log data from an information technology environment by using diverse data stores
US10614132B2 (en) 2013-04-30 2020-04-07 Splunk Inc. GUI-triggered processing of performance data and log data from an information technology environment
US10346357B2 (en) 2013-04-30 2019-07-09 Splunk Inc. Processing of performance data and structure data from an information technology environment
US10353957B2 (en) 2013-04-30 2019-07-16 Splunk Inc. Processing of performance data and raw log data from an information technology environment
US10445187B2 (en) * 2014-12-12 2019-10-15 Actifio, Inc. Searching and indexing of backup data sets
US11609933B1 (en) 2018-07-18 2023-03-21 Amazon Technologies, Inc. Atomic partition scheme updates to store items in partitions of a time series database
US10983954B2 (en) 2019-05-24 2021-04-20 Hydrolix Inc. High density time-series data indexing and compression
CN114205631A (zh) * 2021-10-28 2022-03-18 浙江大华技术股份有限公司 视频存储、目录生成、迁移方法、装置、设备和介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07146880A (ja) 1993-11-22 1995-06-06 Nippon Steel Corp 文書検索装置及び方法
US5778395A (en) * 1995-10-23 1998-07-07 Stac, Inc. System for backing up files from disk volumes on multiple nodes of a computer network
JPH09223152A (ja) 1996-02-16 1997-08-26 Toshiba Corp 文書検索装置
US6175835B1 (en) * 1996-07-26 2001-01-16 Ori Software Development, Ltd. Layered index with a basic unbalanced partitioned index that allows a balanced structure of blocks
JPH1049419A (ja) * 1996-08-02 1998-02-20 Nec Corp インデックス二重化による複数時点データ管理方式
JPH10154090A (ja) * 1996-11-22 1998-06-09 Mitsubishi Electric Corp データ管理システム
US6067541A (en) * 1997-09-17 2000-05-23 Microsoft Corporation Monitoring document changes in a file system of documents with the document change information stored in a persistent log
EP0920038A1 (de) * 1997-11-25 1999-06-02 Electrowatt Technology Innovation AG Schaltung zur Überwachung eines Wechselstromschalters
JP4208326B2 (ja) * 1999-03-05 2009-01-14 株式会社リコー 情報索引装置
JP4126843B2 (ja) * 2000-03-31 2008-07-30 株式会社日立製作所 データ管理方法および装置並びにデータ管理プログラムを格納した記録媒体
US20030101183A1 (en) * 2001-11-26 2003-05-29 Navin Kabra Information retrieval index allowing updating while in use
US6920460B1 (en) * 2002-05-29 2005-07-19 Oracle International Corporation Systems and methods for managing partitioned indexes that are created and maintained by user-defined indexing schemes
JP2004178070A (ja) 2002-11-25 2004-06-24 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法及び情報検索装置並びにプログラム
US7254580B1 (en) * 2003-07-31 2007-08-07 Google Inc. System and method for selectively searching partitions of a database
US7225208B2 (en) * 2003-09-30 2007-05-29 Iron Mountain Incorporated Systems and methods for backing up data files
US7849063B2 (en) * 2003-10-17 2010-12-07 Yahoo! Inc. Systems and methods for indexing content for fast and scalable retrieval
US7293016B1 (en) * 2004-01-22 2007-11-06 Microsoft Corporation Index partitioning based on document relevance for document indexes
US7567959B2 (en) * 2004-07-26 2009-07-28 Google Inc. Multiple index based information retrieval system
US7672979B1 (en) * 2005-04-22 2010-03-02 Symantec Operating Corporation Backup and restore techniques using inconsistent state indicators
US20070043705A1 (en) * 2005-08-18 2007-02-22 Emc Corporation Searchable backups
US8051045B2 (en) * 2005-08-31 2011-11-01 Sap Ag Archive indexing engine
US7941419B2 (en) * 2006-03-01 2011-05-10 Oracle International Corporation Suggested content with attribute parameterization
US20080091744A1 (en) * 2006-10-11 2008-04-17 Hidehisa Shitomi Method and apparatus for indexing and searching data in a storage system
US7747589B2 (en) * 2007-03-12 2010-06-29 Microsoft Corporation Transaction time indexing with version compression
US8171003B2 (en) * 2007-06-06 2012-05-01 Kunio Kamimura Method and apparatus for changing reference of database

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109643303A (zh) * 2016-10-17 2019-04-16 日本电信电话株式会社 数据处理装置以及数据处理方法

Also Published As

Publication number Publication date
WO2008044542A1 (fr) 2008-04-17
US8301603B2 (en) 2012-10-30
JPWO2008044542A1 (ja) 2010-02-12
US20100088318A1 (en) 2010-04-08
JP5218060B2 (ja) 2013-06-26

Similar Documents

Publication Publication Date Title
CN101523391A (zh) 信息检索系统和信息检索方法及程序
CN102667772B (zh) 文件级分级存储管理系统、方法和设备
JP5233233B2 (ja) 情報検索システム、情報検索用インデックスの登録装置、情報検索方法及びプログラム
EP3170106B1 (en) High throughput data modifications using blind update operations
CN103605805B (zh) 一种海量时序数据的存储方法
CN100476710C (zh) 在数据存储器中保持临时数据的系统和方法
CN102339315B (zh) 一种广告数据的索引更新方法和系统
CN101765831B (zh) 数据库不一致的处理方法
CN100377112C (zh) 磁盘驱动器、其控制方法以及磁盘伪造的探测方法
CN104040481A (zh) 用于融合、存储和检索增量式备份数据的方法和系统
CN103460197A (zh) 计算机系统、文件管理方法以及元数据服务器
CN103176754A (zh) 一种海量小文件读取存储方法
JP6916442B2 (ja) データ処理装置およびデータ処理プログラム
CN110109910A (zh) 数据处理方法及系统、电子设备和计算机可读存储介质
CN107766374A (zh) 一种海量小文件存储读取的优化方法和系统
CN107665219A (zh) 一种日志管理方法及装置
CN105045850A (zh) 云存储日志文件系统中垃圾数据回收方法
CN105302488B (zh) 一种存储系统的数据写入方法及系统
CN105512325B (zh) 多版本数据索引的更新、删除与建立方法及装置
CN116186085A (zh) 一种基于缓存梯度冷热数据分层机制的键值存储系统及方法
CN107220248A (zh) 一种用于存储数据的方法和装置
JP6006740B2 (ja) インデックス管理装置
WO2012081165A1 (ja) データベース管理装置及びデータベース管理方法
US11803525B2 (en) Selection and movement of data between nodes of a distributed storage system
CN115168403A (zh) 数据处理方法以及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20090902