CN105512339A - 一种文件检索器及检索方法 - Google Patents

一种文件检索器及检索方法 Download PDF

Info

Publication number
CN105512339A
CN105512339A CN201511028086.XA CN201511028086A CN105512339A CN 105512339 A CN105512339 A CN 105512339A CN 201511028086 A CN201511028086 A CN 201511028086A CN 105512339 A CN105512339 A CN 105512339A
Authority
CN
China
Prior art keywords
file
index
participle
information
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201511028086.XA
Other languages
English (en)
Inventor
张学连
谭求强
滕行哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netac Technology Co Ltd
Original Assignee
Netac Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netac Technology Co Ltd filed Critical Netac Technology Co Ltd
Priority to CN201511028086.XA priority Critical patent/CN105512339A/zh
Publication of CN105512339A publication Critical patent/CN105512339A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种文件检索器及检索方法,该文件检索器包括:文件监视模块,用于对保存在磁盘中的文件系统进行监视,以发现当前文件系统中出现的新增文件;分词索引模块,用于根据预设电子词典中记录的分词数据库,对新增文件进行相应的分词索引处理,并将相应的分词索引信息添加到预设的索引信息列表;其中,索引信息列表存储在磁盘中,包括索引文件列表和索引分词列表;指令接收模块,用于接收用户终端输入的文件搜索指令;其中,文件搜索指令中包括相应的搜索词;检索响应模块,用于从索引文件列表中筛选出与搜索词相对应的索引文件信息,并将索引文件信息返回至用户终端。本申请提高了文件的索引化程度,进而提升了文件检索精度。

Description

一种文件检索器及检索方法
技术领域
本发明涉及文件检索技术领域,特别涉及一种文件检索器及检索方法。
背景技术
当前,为了方便用户对磁盘等存储器件中保存的文件进行检索,市场上逐渐出现了一些文件检索器。然而,这些文件检索器对文件进行索引化时,相应的索引化程度较低,从而影响了文件检索的检索精度,导致用户体验较差。
综上所述可以看出,如何提高文件的索引化程度,以提升文件检索精度是目前亟待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种文件检索器及检索方法,提高了文件的索引化程度,从而提升了文件检索精度。其具体方案如下:
一种文件检索器,包括:
文件监视模块,用于对保存在磁盘中的文件系统进行监视,以发现当前所述文件系统中出现的新增文件;
分词索引模块,用于根据预设电子词典中记录的分词数据库,对所述新增文件进行相应的分词索引处理,并将相应的分词索引信息添加到预设的索引信息列表;其中,所述索引信息列表存储在所述磁盘中,包括索引文件列表和索引分词列表;
指令接收模块,用于接收用户终端输入的文件搜索指令;其中,所述文件搜索指令中包括相应的搜索词;
检索响应模块,用于从所述索引文件列表中筛选出与所述搜索词相对应的索引文件信息,并将所述索引文件信息返回至所述用户终端。
优选的,所述文件监视模块包括:
目录添加单元,用于当向所述文件系统中写入新文件时,向所述文件系统的文件目录中添加与该新文件对应的文件名;
索引文件缓存单元,用于对所述索引文件列表进行缓存,得到相应的索引文件缓存列表;
第一监视单元,用于对所述文件系统中是否存在第一类型文件进行实时监视,当所述文件系统中存在第一类型文件,则将该第一类型文件确定为新增文件;其中,第一类型文件为文件名存在于所述文件目录中,而不存在于所述索引文件缓存列表中的文件。
优选的,所述分词索引模块包括:
分词索引单元,用于根据所述分词数据库,对所述新增文件进行相应的分词索引处理,得到相应的索引文件信息和索引分词信息;
第一信息添加单元,用于将所述分词索引单元得到的索引文件信息添加至所述索引文件列表;
第二信息添加单元,用于将所述分词索引单元得到的索引分词信息添加至所述索引分词列表。
优选的,所述检索响应模块包括:
索引分词缓存单元,用于对所述索引分词列表进行缓存,得到相应的索引分词缓存列表;
第一筛选单元,用于从所述索引分词缓存列表中筛选出与所述搜索词相对应的索引分词信息;
第二筛选单元,用于从所述索引文件缓存列表中筛选出与所述第一筛选单元筛选出的索引分词信息相对应的索引文件信息,并将该索引文件信息返回至所述用户终端。
优选的,所述文件监视模块还包括:
第二监视单元,用于实时监视所述索引文件缓存列表中是否包含第二类型文件所对应的文件名;其中,所述第二类型文件为文件名存在于所述索引文件缓存列表中,而不存在于所述文件目录中的文件;
信息删除单元,用于当所述索引文件缓存列表中包含第二类型文件所对应的文件名,则删除所述索引文件缓存列表中与该文件名所对应的索引文件信息。
优选的,所述文件检索器,还包括:
分词索引启动控制模块,用于对当前所述文件系统的工作负载进行实时监测,当所述文件系统的工作负载小于预设负载时,生成分词索引启动控制指令,并将所述分词索引启动控制指令发送至所述分词索引模块,以控制所述分词索引模块启动对所述文件系统中出现的新增文件进行分词索引处理。
优选的,所述文件检索器,还包括:
词典更新模块,用于为用户提供词典更新接口,通过所述词典更新接口,接收用户输入的词典更新信息,并利用所述词典更新信息对所述电子词典进行更新;其中,所述词典更新信息包括新增分词信息、分词修改信息或分词删除信息。
本发明还公开了一种文件检索方法,包括:
对保存在磁盘中的文件系统进行监视,以发现当前所述文件系统中出现的新增文件;
根据预设电子词典中记录的分词数据库,对所述新增文件进行相应的分词索引处理,并将相应的分词索引信息添加到预设的索引信息列表;其中,所述索引信息列表存储在所述磁盘中,包括索引文件列表和索引分词列表;
接收用户终端输入的文件搜索指令;其中,所述文件搜索指令中包括相应的搜索词;
从所述索引文件列表中筛选出与所述搜索词相对应的索引文件信息,并将所述索引文件信息返回至所述用户终端。
优选的,所述文件检索方法,还包括:
对当前所述文件系统的工作负载进行实时监测,当所述文件系统的工作负载小于预设负载时,生成分词索引启动控制指令,并利用所述分词索引启动控制指令,以触发对所述文件系统中出现的新增文件进行分词索引处理。
优选的,所述文件检索方法,还包括:
为用户提供词典更新接口,通过所述词典更新接口,接收用户输入的词典更新信息,并利用所述词典更新信息对所述电子词典进行更新;其中,所述词典更新信息包括新增分词信息、分词修改信息或分词删除信息。
本发明中,文件检索器包括:文件监视模块,用于对保存在磁盘中的文件系统进行监视,以发现当前文件系统中出现的新增文件;分词索引模块,用于根据预设电子词典中记录的分词数据库,对新增文件进行相应的分词索引处理,并将相应的分词索引信息添加到预设的索引信息列表;其中,索引信息列表存储在磁盘中,包括索引文件列表和索引分词列表;指令接收模块,用于接收用户终端输入的文件搜索指令;其中,文件搜索指令中包括相应的搜索词;检索响应模块,用于从索引文件列表中筛选出与搜索词相对应的索引文件信息,并将索引文件信息返回至用户终端。可见,本发明根据电子词典中记录的分词数据库,对磁盘中出现的新增文件进行分词索引处理,由于电子词典记录了大量日常常用词语,所以,以电子词典中的词语库作为分词数据库能够大幅提升词语的细分程度,由此相应地提高了文件的索引化程度,进而提升了文件检索精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种文件检索器应用结构示意图;
图2为本发明实施例公开的一种具体的文件检索器应用结构示意图;
图3为本发明实施例公开的一种文件检索方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种文件检索器,参见图1所示,该文件检索器包括:
文件监视模块11,用于对保存在磁盘中的文件系统进行监视,以发现当前文件系统中出现的新增文件;
分词索引模块12,用于根据预设电子词典中记录的分词数据库,对新增文件进行相应的分词索引处理,并将相应的分词索引信息添加到预设的索引信息列表;其中,索引信息列表存储在磁盘中,包括索引文件列表和索引分词列表;在本实施方式中,分词索引处理为对新增文件的内容从后到前的倒序进行提词,按照汉语习惯能组成词组的按照词组处理,不能组成词组的按照单字处理。
指令接收模块13,用于接收用户终端输入的文件搜索指令;其中,文件搜索指令中包括相应的搜索词;
检索响应模块14,用于从索引文件列表中筛选出与搜索词相对应的索引文件信息,并将索引文件信息返回至用户终端。
需要说明的是,在对上述各个模块进行开发时,可优先采用C语言进行开发,相对于Java语言,由于C语言更接近于机器语言,所以可使得开发出来的各个模块具有更高的运行速度。
可见,本发明实施例根据电子词典中记录的分词数据库,对磁盘中出现的新增文件进行分词索引处理,由于电子词典记录了大量日常常用词语,所以,以电子词典中的词语库作为分词数据库能够大幅提升词语的细分程度,由此相应地提高了文件的索引化程度,进而提升了文件检索精度。
本发明实施例公开了一种具体的文件检索器,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
参见图2所示,本实施例中,文件监视模块11具体可以包括目录添加单元111、索引文件缓存单元112和第一监视单元113;其中,
目录添加单元111,用于当向文件系统中写入新文件时,向文件系统的文件目录中添加与该新文件对应的文件名;
索引文件缓存单元112,用于对索引文件列表进行缓存,得到相应的索引文件缓存列表;
第一监视单元113,用于对文件系统中是否存在第一类型文件进行实时监视,当文件系统中存在第一类型文件,则将该第一类型文件确定为新增文件;其中,第一类型文件为文件名存在于文件目录中,而不存在于索引文件缓存列表中的文件。
另外,本实施例中的分词索引模块12具体可以包括分词索引单元121、第一信息添加单元122和第二信息添加单元123;其中,
分词索引单元121,用于根据分词数据库,对新增文件进行相应的分词索引处理,得到相应的索引文件信息和索引分词信息;
第一信息添加单元122,用于将分词索引单元121得到的索引文件信息添加至索引文件列表;
第二信息添加单元123,用于将分词索引单元121得到的索引分词信息添加至索引分词列表。
本实施例中,检索响应模块14具体包括索引分词缓存单元141、第一筛选单元142和第二筛选单元143;其中,
索引分词缓存单元141,用于对索引分词列表进行缓存,得到相应的索引分词缓存列表;
第一筛选单元142,用于从索引分词缓存列表中筛选出与搜索词相对应的索引分词信息;
第二筛选单元143,用于从索引文件缓存列表中筛选出与第一筛选单元142筛选出的索引分词信息相对应的索引文件信息,并将该索引文件信息返回至用户终端。
为了避免已删除的文件被用户检索到,本实施例中的文件监视模块还可以进一步包括第二监视单元和信息删除单元;其中,
第二监视单元,用于实时监视索引文件缓存列表中是否包含第二类型文件所对应的文件名;其中,第二类型文件为文件名存在于索引文件缓存列表中,而不存在于文件目录中的文件;
信息删除单元,用于当索引文件缓存列表中包含第二类型文件所对应的文件名,则删除索引文件缓存列表中与该文件名所对应的索引文件信息。
参见图2所示,为了避免在文件系统高负荷的工作状态下进行分词索引操作,本实施例中的文件检索器,还可以进一步包括:
分词索引启动控制模块15,用于对当前文件系统的工作负载进行实时监测,当文件系统的工作负载小于预设负载时,生成分词索引启动控制指令,并将分词索引启动控制指令发送至分词索引模块12,以控制分词索引模块12启动对文件系统中出现的新增文件进行分词索引处理。
为了方便用户能够对电子词典中的词语库进行动态更新,本实施例中的文件检索器,还可以进一步包括:
词典更新模块16,用于为用户提供词典更新接口,通过词典更新接口,接收用户输入的词典更新信息,并利用词典更新信息对电子词典进行更新;其中,词典更新信息包括新增分词信息、分词修改信息或分词删除信息。
本发明实施例还公开了一种文件检索方法,参见图3所示,该方法包括:
步骤S31:对保存在磁盘中的文件系统进行监视,以发现当前文件系统中出现的新增文件;
步骤S32:根据预设电子词典中记录的分词数据库,对新增文件进行相应的分词索引处理,并将相应的分词索引信息添加到预设的索引信息列表;其中,索引信息列表存储在磁盘中,包括索引文件列表和索引分词列表;在本实施方式中,分词索引处理为对新增文件的内容从后到前的倒序进行提词,按照汉语习惯能组成词组的按照词组处理,不能组成词组的按照单字处理。步骤S33:接收用户终端输入的文件搜索指令;其中,文件搜索指令中包括相应的搜索词;
步骤S34:从索引文件列表中筛选出与搜索词相对应的索引文件信息,并将索引文件信息返回至用户终端。
为了避免在文件系统高负荷的工作状态下进行分词索引操作,本实施例中的方法还可以进一步包括:对当前文件系统的工作负载进行实时监测,当文件系统的工作负载小于预设负载时,生成分词索引启动控制指令,并利用分词索引启动控制指令,以触发对文件系统中出现的新增文件进行分词索引处理。
为了方便用户能够对电子词典中的词语库进行动态更新,本实施例中的方法还可以进一步包括:为用户提供词典更新接口,通过词典更新接口,接收用户输入的词典更新信息,并利用词典更新信息对电子词典进行更新;其中,词典更新信息包括新增分词信息、分词修改信息或分词删除信息。
关于上述各个步骤更加具体的内容可参考前述实施例公开的相应内容,在此不再一一赘述。
可见,本发明实施例根据电子词典中记录的分词数据库,对磁盘中出现的新增文件进行分词索引处理,由于电子词典记录了大量日常常用词语,所以,以电子词典中的词语库作为分词数据库能够大幅提升词语的细分程度,由此相应地提高了文件的索引化程度,进而提升了文件检索精度。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种文件检索器及检索方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种文件检索器,其特征在于,包括:
文件监视模块,用于对保存在磁盘中的文件系统进行监视,以发现当前所述文件系统中出现的新增文件;
分词索引模块,用于根据预设电子词典中记录的分词数据库,对所述新增文件进行相应的分词索引处理,并将相应的分词索引信息添加到预设的索引信息列表;其中,所述索引信息列表存储在所述磁盘中,包括索引文件列表和索引分词列表;
指令接收模块,用于接收用户终端输入的文件搜索指令;其中,所述文件搜索指令中包括相应的搜索词;
检索响应模块,用于从所述索引文件列表中筛选出与所述搜索词相对应的索引文件信息,并将所述索引文件信息返回至所述用户终端。
2.根据权利要求1所述的文件检索器,其特征在于,所述文件监视模块包括:
目录添加单元,用于当向所述文件系统中写入新文件时,向所述文件系统的文件目录中添加与该新文件对应的文件名;
索引文件缓存单元,用于对所述索引文件列表进行缓存,得到相应的索引文件缓存列表;
第一监视单元,用于对所述文件系统中是否存在第一类型文件进行实时监视,当所述文件系统中存在第一类型文件,则将该第一类型文件确定为新增文件;其中,第一类型文件为文件名存在于所述文件目录中,而不存在于所述索引文件缓存列表中的文件。
3.根据权利要求2所述的文件检索器,其特征在于,所述分词索引模块包括:
分词索引单元,用于根据所述分词数据库,对所述新增文件进行相应的分词索引处理,得到相应的索引文件信息和索引分词信息;
第一信息添加单元,用于将所述分词索引单元得到的索引文件信息添加至所述索引文件列表;
第二信息添加单元,用于将所述分词索引单元得到的索引分词信息添加至所述索引分词列表。
4.根据权利要求3所述的文件检索器,其特征在于,所述检索响应模块包括:
索引分词缓存单元,用于对所述索引分词列表进行缓存,得到相应的索引分词缓存列表;
第一筛选单元,用于从所述索引分词缓存列表中筛选出与所述搜索词相对应的索引分词信息;
第二筛选单元,用于从所述索引文件缓存列表中筛选出与所述第一筛选单元筛选出的索引分词信息相对应的索引文件信息,并将该索引文件信息返回至所述用户终端。
5.根据权利要求4所述的文件检索器,其特征在于,所述文件监视模块还包括:
第二监视单元,用于实时监视所述索引文件缓存列表中是否包含第二类型文件所对应的文件名;其中,所述第二类型文件为文件名存在于所述索引文件缓存列表中,而不存在于所述文件目录中的文件;
信息删除单元,用于当所述索引文件缓存列表中包含第二类型文件所对应的文件名,则删除所述索引文件缓存列表中与该文件名所对应的索引文件信息。
6.根据权利要求1至5任一项所述的文件检索器,其特征在于,还包括:
分词索引启动控制模块,用于对当前所述文件系统的工作负载进行实时监测,当所述文件系统的工作负载小于预设负载时,生成分词索引启动控制指令,并将所述分词索引启动控制指令发送至所述分词索引模块,以控制所述分词索引模块启动对所述文件系统中出现的新增文件进行分词索引处理。
7.根据权利要求1至5任一项所述的文件检索器,其特征在于,还包括:
词典更新模块,用于为用户提供词典更新接口,通过所述词典更新接口,接收用户输入的词典更新信息,并利用所述词典更新信息对所述电子词典进行更新;其中,所述词典更新信息包括新增分词信息、分词修改信息或分词删除信息。
8.一种文件检索方法,其特征在于,包括:
对保存在磁盘中的文件系统进行监视,以发现当前所述文件系统中出现的新增文件;
根据预设电子词典中记录的分词数据库,对所述新增文件进行相应的分词索引处理,并将相应的分词索引信息添加到预设的索引信息列表;其中,所述索引信息列表存储在所述磁盘中,包括索引文件列表和索引分词列表;
接收用户终端输入的文件搜索指令;其中,所述文件搜索指令中包括相应的搜索词;
从所述索引文件列表中筛选出与所述搜索词相对应的索引文件信息,并将所述索引文件信息返回至所述用户终端。
9.根据权利要求8所述的文件检索方法,其特征在于,还包括:
对当前所述文件系统的工作负载进行实时监测,当所述文件系统的工作负载小于预设负载时,生成分词索引启动控制指令,并利用所述分词索引启动控制指令,以触发对所述文件系统中出现的新增文件进行分词索引处理。
10.根据权利要求8所述的文件检索方法,其特征在于,还包括:为用户提供词典更新接口,通过所述词典更新接口,接收用户输入的词典更新信息,并利用所述词典更新信息对所述电子词典进行更新;其中,所述词典更新信息包括新增分词信息、分词修改信息或分词删除信息。
CN201511028086.XA 2015-12-31 2015-12-31 一种文件检索器及检索方法 Pending CN105512339A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511028086.XA CN105512339A (zh) 2015-12-31 2015-12-31 一种文件检索器及检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511028086.XA CN105512339A (zh) 2015-12-31 2015-12-31 一种文件检索器及检索方法

Publications (1)

Publication Number Publication Date
CN105512339A true CN105512339A (zh) 2016-04-20

Family

ID=55720319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511028086.XA Pending CN105512339A (zh) 2015-12-31 2015-12-31 一种文件检索器及检索方法

Country Status (1)

Country Link
CN (1) CN105512339A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930470A (zh) * 2016-04-25 2016-09-07 安徽富驰信息技术有限公司 一种基于特征权重分析技术的文件检索方法
CN108446336A (zh) * 2018-02-27 2018-08-24 平安科技(深圳)有限公司 机构名称的智能搜索方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136016A (zh) * 2006-09-01 2008-03-05 北大方正集团有限公司 一种全文检索系统的索引在线更新方法
CN102819592A (zh) * 2012-08-08 2012-12-12 河海大学 一种基于Lucene的桌面搜索系统及方法
US20120317105A1 (en) * 2009-09-21 2012-12-13 Zte Corporation Method and Apparatus for Updating Index and Sequencing Search Results Based on Updated Index in Terminal
CN103177127A (zh) * 2013-04-18 2013-06-26 陶光毅 基于光盘库的数据库存储系统及利用该系统的方法
CN104077385A (zh) * 2014-06-27 2014-10-01 北京海泰方圆科技有限公司 一种文件的分类及检索方法
CN104834664A (zh) * 2015-02-02 2015-08-12 北京理工大学 面向光盘库的全文检索系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136016A (zh) * 2006-09-01 2008-03-05 北大方正集团有限公司 一种全文检索系统的索引在线更新方法
US20120317105A1 (en) * 2009-09-21 2012-12-13 Zte Corporation Method and Apparatus for Updating Index and Sequencing Search Results Based on Updated Index in Terminal
CN102819592A (zh) * 2012-08-08 2012-12-12 河海大学 一种基于Lucene的桌面搜索系统及方法
CN103177127A (zh) * 2013-04-18 2013-06-26 陶光毅 基于光盘库的数据库存储系统及利用该系统的方法
CN104077385A (zh) * 2014-06-27 2014-10-01 北京海泰方圆科技有限公司 一种文件的分类及检索方法
CN104834664A (zh) * 2015-02-02 2015-08-12 北京理工大学 面向光盘库的全文检索系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
熊回香 等: "基于词索引的中文全文检索关键技术及其发展方向", 《中国图书馆学报(双月刊)》 *
高雪霞 等: "基于词典知识库的快速检索算法研究", 《德州学院学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930470A (zh) * 2016-04-25 2016-09-07 安徽富驰信息技术有限公司 一种基于特征权重分析技术的文件检索方法
CN105930470B (zh) * 2016-04-25 2019-03-26 安徽富驰信息技术有限公司 一种基于特征权重分析技术的文件检索方法
CN108446336A (zh) * 2018-02-27 2018-08-24 平安科技(深圳)有限公司 机构名称的智能搜索方法、装置、设备及存储介质
CN108446336B (zh) * 2018-02-27 2019-11-05 平安科技(深圳)有限公司 机构名称的智能搜索方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111460285B (zh) 信息处理方法、装置、电子设备和存储介质
CN104951512A (zh) 一种基于互联网的舆情数据采集方法及系统
CN106911757A (zh) 一种业务信息的推送方法和装置
KR20130049111A (ko) 분산 처리를 이용한 포렌식 인덱스 방법 및 장치
CN102915344B (zh) 一种sql语句处理方法及装置
CN112672184A (zh) 一种视频审核及发布方法
CN104965914A (zh) 一种页面显示方法及装置
CN107832440B (zh) 一种数据挖掘方法、装置、服务器及计算机可读存储介质
CN106933640A (zh) 在移动终端的浏览器内加载Web页面的方法及系统
CN108848244A (zh) 一种分页显示的方法及装置
CN104850241A (zh) 一种在移动终端中进行文字输入的方法及移动终端
CN105183768A (zh) 一种文件管理方法、装置和终端设备
CN103778128A (zh) 一种列表信息的绘制方法和装置
CN109582305B (zh) 用于移动应用页面元素的编码方法、装置及电子设备
CN106815274B (zh) 基于Hadoop的日志数据挖掘方法及系统
CN104765526A (zh) 一种过滤候选词条的方法与装置
CN103106234A (zh) 一种网页内容搜索方法和装置
CN102508884A (zh) 热点事件与实时评论的获取方法及装置
CN106055315A (zh) 批量任务的处理方法及系统
CN111666383A (zh) 信息处理方法、装置、电子设备及计算机可读存储介质
CN105512339A (zh) 一种文件检索器及检索方法
CN107391650A (zh) 一种文档的结构化拆分方法,装置及系统
CN108874808A (zh) 一种页面元素联动方法、装置及服务器
CN107025259A (zh) 一种详情页面的打开方法、设备以及移动终端
CN108959294B (zh) 一种访问搜索引擎的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160420