CN103164491B - 一种数据处理和检索的方法及设备 - Google Patents

一种数据处理和检索的方法及设备 Download PDF

Info

Publication number
CN103164491B
CN103164491B CN201110427898.7A CN201110427898A CN103164491B CN 103164491 B CN103164491 B CN 103164491B CN 201110427898 A CN201110427898 A CN 201110427898A CN 103164491 B CN103164491 B CN 103164491B
Authority
CN
China
Prior art keywords
data
dbms information
dbms
information
data acquisition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110427898.7A
Other languages
English (en)
Other versions
CN103164491A (zh
Inventor
孙容容
朱傲
徐剑波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Pku Founder Information Industry Group Co ltd
Peking University Founder Group Co Ltd
Founder Apabi Technology Ltd
Original Assignee
Founder Information Industry Holdings Co Ltd
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Founder Information Industry Holdings Co Ltd, Peking University Founder Group Co Ltd, Beijing Founder Apabi Technology Co Ltd filed Critical Founder Information Industry Holdings Co Ltd
Priority to CN201110427898.7A priority Critical patent/CN103164491B/zh
Publication of CN103164491A publication Critical patent/CN103164491A/zh
Application granted granted Critical
Publication of CN103164491B publication Critical patent/CN103164491B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及计算机技术领域,特别涉及一种数据处理和检索的方法及设备,用以解决现有技术中存在的检索的效率比较低,检索速度比较慢的问题。本发明实施例数据处理的方法包括:根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,其中N是正整数;根据第N级数据信息对应的数据策略,从第N级数据信息对应的数据集合中检索对应的数据;将检索到的所有数据分配相同的标识,并建立检索所使用的第N级数据信息、标识和数据的对应关系。由于从第N级数据信息对应的数据集合中检索对应的数据,从而提高了检索的效率和速度;进一步提高了检索的性能。

Description

一种数据处理和检索的方法及设备
技术领域
本发明涉及计算机技术领域,特别涉及一种数据处理和检索的方法及设备。
背景技术
检索是指从文献资料、网络信息等信息集合中查找到自己需要的信息或资料的过程。为了进行检索,通常需要对资料进行索引。传统文献资料需要提取题名、作者、出版年、主题词等作为索引,而在网络时代,计算机可以对全文进行索引,即文中每一个词都能成为检索点。
全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。
功能上全文检索系统需要具有建立索引,处理查询返回结果集,增加索引,优化索引结构等功能。结构上具有索引引擎,查询引擎,文本分析引擎和对外接口等。
随着全球范围内数据库中存储的数据量急剧增加,人们已经可以很容易的获得各种信息,但是如何突破海量数据检索效率的瓶颈,对这些数据进行处理和分析,实现在海量数据中快速地检索数据,满足用户实时性检索的需求一直是个问题。
综上所述,目前检索的效率比较低,检索速度比较慢。
发明内容
本发明实施例提供一种数据处理和检索的方法及设备,用以解决现有技术中存在的检索的效率比较低,检索速度比较慢的问题。
本发明实施例提供的一种数据处理的方法,包括:
根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,其中N是正整数;
根据第N级数据信息对应的数据策略,从第N级数据信息对应的数据集合中检索对应的数据;
将检索到的所有数据分配相同的标识,并建立检索所使用的第N级数据信息、标识和数据的对应关系;
其中,根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,包括:
在收到用户的指令后,或在设定的时间到达时,根据第N级数据信息和检索范围的对应关系,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合;
根据第N级数据信息和检索范围的对应关系,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,包括:
确定上次提取出第N级数据信息对应的数据集合的时刻到当前时刻之间,第N-1级数据信息的数据集合中发生变化的数据;
根据第N级数据信息和检索范围的对应关系,从发生变化的数据中提取出第N级数据信息对应的数据,并将提取的数据置于第N级数据信息对应的数据集合中。
本发明实施例提供的一种基于本发明实施例的数据处理方法进行数据检索的方法,包括:
根据数据信息和标识的对应关系,确定用户需要检索的数据信息对应的标识;
根据标识和数据的对应关系,确定用户需要检索的数据信息对应的标识对应的数据;
从确定的数据中进行数据检索。
本发明实施例提供的一种数据处理的设备,包括:
第一处理模块,用于根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,其中N是正整数;
第二处理模块,用于根据第N级数据信息对应的数据策略,从第N级数据信息对应的数据集合中检索对应的数据;
建立模块,用于将检索到的所有数据分配相同的标识,并建立检索所使用的第N级数据信息、标识和数据的对应关系;
其中,根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,包括:
在收到用户的指令后,或在设定的时间到达时,根据第N级数据信息和检索范围的对应关系,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合;
根据第N级数据信息和检索范围的对应关系,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,包括:
确定上次提取出第N级数据信息对应的数据集合的时刻到当前时刻之间,第N-1级数据信息的数据集合中发生变化的数据;
根据第N级数据信息和检索范围的对应关系,从发生变化的数据中提取出第N级数据信息对应的数据,并将提取的数据置于第N级数据信息对应的数据集合中。
本发明实施例提供的一种基于本发明实施例的数据处理方法进行数据检索的设备,包括:
第一确定模块,用于根据数据信息和标识的对应关系,确定用户需要检索的数据信息对应的标识;
第二确定模块,用于根据标识和数据的对应关系,确定用户需要检索的数据信息对应的标识对应的数据;
检索模块,用于从确定的数据中进行数据检索。
由于从第N级数据信息对应的数据集合中检索对应的数据,从而提高了检索的效率和速度;进一步提高了检索的性能。
附图说明
图1为本发明实施例数据处理的方法流程示意图;
图2为本发明实施例设置数据信息的示意图;
图3为本发明实施例进行数据检索的方法流程示意图;
图4为本发明实施例数据处理的设备的结构示意图;
图5为本发明实施例进行数据检索的设备的结构示意图。
具体实施方式
本发明实施例从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,根据第N级数据信息对应的数据策略,从第N级数据信息对应的数据集合中检索对应的数据,并将检索到的所有数据分配相同的标识,并建立检索所使用的第N级数据信息、标识和数据的对应关系。由于从第N级数据信息对应的数据集合中检索对应的数据,从而提高了检索的效率和速度。
下面结合说明书附图对本发明实施例作进一步详细描述。
如图1所示,本发明实施例数据处理的方法包括下列步骤:
步骤101、根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,其中N是正整数;
步骤102、根据第N级数据信息对应的数据策略,从第N级数据信息对应的数据集合中检索对应的数据;
步骤103、将检索到的所有数据分配相同的标识,并建立检索所使用的第N级数据信息、标识和数据的对应关系。
在实施中,用户会预先设置数据信息具体设置几级以及每集有几个数据信息可以根据用户需要进行设定。
比如可以按照图2的方式设置:
第一级数据信息:金融行业库;
其中,金融行业库还对应多个第二级数据信息:法律法规、金融监管、银行业、保险业、证券业和其他金融业;
其中,第二级数据信息法律法规还对应多个第三级数据信息:财政法、金融法和经济法;
其中,第二级数据信息金融监管还对应多个第三级数据信息:金融综合监管、市场准入监管、运营监管、市场退出监管和外汇监管。
在实施中,每个数据信息都会对应一个数据集合,在为检索所使用的第N级数据信息、标识和数据的对应关系进行前期检索时只需要对每个数据信息对应的数据集合进行检索即可。
较佳地,步骤101中,若N是1,第一级数据信息对应的第N-1级数据信息的数据集合是数据库中的所有数据。也就是说,对于第一级数据信息对应的数据集合是从数据库的所有数据中确定的。
对于非第一级数据信息的数据信息对应的数据集合是从其上一级的数据信息对应的数据集合中确定的。
比如第二级数据信息对应的数据集合是从其对应的第一级数据信息的数据集合中确定的。以图2为例,法律法规对应的数据集合是从金融行业库对应的数据集合中确定的。
比如第三级数据信息对应的数据集合是从其对应的第二级数据信息的数据集合中确定的。以图2为例,财政法对应的数据集合是从法律法规对应的数据集合中确定的。
在实施中,本发明实施例的数据集合包括但不限于下列数据中的至少一种:
图书、报纸、年鉴。
较佳地,步骤101中,在确定了对应的数据集合后,还需要进一步查看用户是否输入检索范围。
若用户输入检索范围,将用户输入的检索范围作为第N级数据信息对应的检索范围,然后根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合。
比如用户输入金融行业库对应的检索范围是X图书中第10~200页中所有与金融有关的内容,则从数据库中提取出X图书中的第10~200页所有与金融有关的内容作为金融行业库对应的数据集合。
比如用户输入法律法规对应的检索范围是X图书中的第10~15页中所有与金融有关的内容,则从金融行业库对应的数据集合中提取出X图书中的第10~15页中所有与金融有关的内容。
比如用户输入法律法规对应的检索范围是Y1出版社和Y2出版社,则从金融行业库对应的数据集合中提取出Y1出版社和Y2出版社的所有图书。
若用户未输入检索范围,将第N-1级数据信息对应的检索范围作为第N级数据信息对应的检索范围,然后根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合。
比如用户输入金融行业库对应的检索范围是X图书中第10~200页中所有与金融有关的内容,则从数据库中提取出X图书中的第10~200页所有与金融有关的内容作为金融行业库对应的数据集合。
用户未输入法律法规对应的检索范围,则将金融行业库对应的检索范围作为法律法规对应的检索范围。由于将金融行业库对应的检索范围作为法律法规对应的检索范围,所以法律法规对应的数据集合与金融行业库对应的数据集合也相同。
比如金融行业库对应的数据集合是X图书中第10~200页中所有与金融有关的内容,由于法律法规对应的检索范围是X图书中第10~200页中所有与金融有关的内容,所以法律法规对应的数据集合与金融行业库对应的数据集合也相同。
较佳地,数据信息对应的数据策略可以包括检索策略和/或文本挖掘策略,具体可以根据用户需要进行设定。
比如用户可以设置一些关键词作为检索策略;还可以设置一些筛选条件作为检索策略,例如数据录入时间,数据的作者等。在实施中,筛选条件和关键词可以组合使用,也可以单独使用。
比如用户可以设置分类要求、主题词等作为文本挖掘策略。
其中,每个数据信息都会对应一个数据策略,不同的数据信息对应的数据策略可以相同也可以不同,步骤102中,根据数据信息对应的数据策略,从步骤101中确定的数据信息对应的数据集合中检索对应的数据。
在检索到数据后,步骤103中会针对同一个数据信息检索到的数据分配同一个标识,不同的数据信息对应的标识不同,这样实际上就建立了数据信息和标识之间,以及标识和数据之间的对应关系。
较佳地,触发进行数据处理的方式有很多,下面列举几种:
方式一、手动触发。
具体的,在收到用户的指令后,开始执行步骤101。比如用户在需要进行前期检索时可以点击执行按钮,在确定用户点击执行按钮后开始执行步骤101。
方式二、自动执行。
具体的,用户可以预先设定一段时间,这个时间可以是具体的时间,比如10:30分,则在10:30分时,开始执行步骤101;还可以设置具体的时间的同时再设置次数,比如5次,则在10:30分时,开始执行步骤101,并循环执行5次。
这个时间还可以是一段时间,比如30分钟,则每30分钟,开始执行步骤101,也就是说周期执行步骤101。
如果每次进行前期检索时都从第N-1级数据信息的数据集合中所有数据中提取出对应的数据,随着数据量的增加,检索的效率也会越来越低。一种较佳的方式是:步骤101中,确定上次提取出第N级数据信息对应的数据集合的时刻到当前时刻之间,第N-1级数据信息的数据集合中发生变化的数据;
根据第N级数据信息和检索范围的对应关系,从发生变化的数据中提取出第N级数据信息对应的数据,并将提取的数据置于第N级数据信息对应的数据集合中。
这里的发生变化是指新增加的数据或修改的数据。
如果是修改的数据,则将提取的数据置于第N级数据信息对应的数据集合中后,还需要删除对应未修改的数据。
比如第N-1级数据信息的数据集合中有A、B、C、D和E,如果B、C和D发生了变化,则只需要从B、C和D中提取第N级数据信息对应的数据。假设提取了B和C,当前第N级数据信息对应的数据集合包括A和未修改的B,则将B和C加入第N级数据信息对应的数据集合后,还需要删除未修改的B,最后第N级数据信息对应的数据集合包括A、B和C。
本发明实施例数据处理的方案是在用户检索之前,可以灵活、快速地将相关数据根据定义的数据进行检索,提高用户检索的效率,快速的为用户提供服务
在本发明实施例数据处理的方法基础上,本发明实施例还提供了一种进行数据检索的方法。
如图3所示,本发明实施例进行数据检索的方法包括下列步骤:
步骤301、根据数据信息和标识的对应关系,确定用户需要检索的数据信息对应的标识;
步骤302、根据标识和数据的对应关系,确定用户需要检索的数据信息对应的标识对应的数据;
步骤303、从确定的数据中进行数据检索。
其中,图1和图3可以合成一个流程,形成一个数据检索的方法,即先执行步骤101~步骤103,然后执行步骤301~步骤303。
以图2为例,假如用户需要检索的数据信息是财政法,关键词是财政,则查找财政法对应的标识,然后从该标识对应数据中查找符合关键词是财政的数据,并显示给用户。
上述内容中在检索时是以关键词为例进行说明,根据需要还可以根据发明人设定的检索条件进行检索。
若本发明实施例的方案应用到报纸数据,由于报纸数据实时性更新的特征,在用户根据自己的兴趣定义数据的特征集合后,本发明实施例会对每天更新的剪报资源进行快速的筛选,为符合特征定义的数据记录特征标识并传送给剪报系统,保证了资源的实时更新,为用户实时的提供个性化定制的数字剪报服务。
本发明实施例还可以应用于出版社、报社、图书馆、企事业单位等多种行业,包括数字出版、数字图书馆等多种业务:
出版社可以利用本发明实施例进行图书章节试读、章节重组、试题题库、专业数据库包装等;
报社可以利用本发明实施例进行报纸新闻行业包装、剪报服务等;
图书馆可以利用本发明实施例进行馆藏特色资源库建设、资源深度加工;
企事业单位可以利用本发明实施例进行竞争信息监控。
基于同一发明构思,本发明实施例中还提供了一种数据处理的设备,由于该设备解决问题的原理与发明实施例数据处理的方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
如图4所示,本发明实施例数据处理的设备包括:第一处理模块41、第二处理模块42和建立模块43。
第一处理模块41,用于根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,其中N是正整数;
第二处理模块42,用于根据第N级数据信息对应的数据策略,从第N级数据信息对应的数据集合中检索对应的数据;
建立模块43,用于将检索到的所有数据分配相同的标识,并建立检索所使用的第N级数据信息、标识和数据的对应关系。
较佳地,若N是1,则第N级数据信息对应的第N-1级数据信息的数据集合是数据库中的所有数据。
较佳地,第一处理模块41根据下列步骤确定第N级数据信息对应的检索范围:
若用户输入检索范围,将用户输入的检索范围作为第N级数据信息对应的检索范围;
若用户未输入检索范围,将第N-1级数据信息对应的检索范围作为第N级数据信息对应的检索范围。
较佳地,第一处理模块41在收到用户的指令后,根据第N级数据信息和检索范围的对应关系,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合;或
较佳地,第一处理模块41在设定的时间到达时,根据第N级数据信息和检索范围的对应关系,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合。
较佳地,第一处理模块41确定上次提取出第N级数据信息对应的数据集合的时刻到当前时刻之间,第N-1级数据信息的数据集合中发生变化的数据;根据第N级数据信息和检索范围的对应关系,从发生变化的数据中提取出第N级数据信息对应的数据,并将提取的数据置于第N级数据信息对应的数据集合中。
基于同一发明构思,本发明实施例中还提供了一种进行数据检索的设备,由于该设备解决问题的原理与发明实施例进行数据检索的方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
如图5所示,本发明实施例进行数据检索的设备包括:第一确定模块51、第二确定模块52和检索模块53。
第一确定模块51,用于根据数据信息和标识的对应关系,确定用户需要检索的数据信息对应的标识;
第二确定模块52,用于根据标识和数据的对应关系,确定用户需要检索的数据信息对应的标识对应的数据;
检索模块53,用于从确定的数据中进行数据检索。
在实施中,图4和图5设备中的模块可以合在一个设备中,根据需要使用不同的模块。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种数据处理的方法,其特征在于,该方法包括:
根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,其中N是正整数;
根据第N级数据信息对应的数据策略,从第N级数据信息对应的数据集合中检索对应的数据;
将检索到的所有数据分配相同的标识,并建立检索所使用的第N级数据信息、标识和数据的对应关系;
其中,根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,包括:
在收到用户的指令后,或在设定的时间到达时,根据第N级数据信息和检索范围的对应关系,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合;
根据第N级数据信息和检索范围的对应关系,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,包括:
确定上次提取出第N级数据信息对应的数据集合的时刻到当前时刻之间,第N-1级数据信息的数据集合中发生变化的数据;
根据第N级数据信息和检索范围的对应关系,从发生变化的数据中提取出第N级数据信息对应的数据,并将提取的数据置于第N级数据信息对应的数据集合中。
2.如权利要求1所述的方法,其特征在于,若N是1,则第N级数据信息对应的第N-1级数据信息的数据集合是数据库中的所有数据。
3.如权利要求1所述的方法,其特征在于,第N级数据信息对应的检索范围是根据下列步骤确定的:
将用户输入的检索范围作为第N级数据信息对应的检索范围,或将第N-1级数据信息对应的检索范围作为第N级数据信息对应的检索范围。
4.一种基于权利要求1的数据处理方法进行数据检索的方法,其特征在于,该方法包括:
根据数据信息和标识的对应关系,确定用户需要检索的数据信息对应的标识;
根据标识和数据的对应关系,确定用户需要检索的数据信息对应的标识对应的数据;
从确定的数据中进行数据检索。
5.一种数据处理的设备,其特征在于,该设备包括:
第一处理模块,用于根据第N级数据信息对应的检索范围,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,其中N是正整数;
第二处理模块,用于根据第N级数据信息对应的数据策略,从第N级数据信息对应的数据集合中检索对应的数据;
建立模块,用于将检索到的所有数据分配相同的标识,并建立检索所使用的第N级数据信息、标识和数据的对应关系;
其中,所述第一处理模块具体用于:在收到用户的指令后,或在设定的时间到达时,根据第N级数据信息和检索范围的对应关系,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合;
根据第N级数据信息和检索范围的对应关系,从第N级数据信息对应的第N-1级数据信息的数据集合中提取出第N级数据信息对应的数据集合,包括:
确定上次提取出第N级数据信息对应的数据集合的时刻到当前时刻之间,第N-1级数据信息的数据集合中发生变化的数据;
根据第N级数据信息和检索范围的对应关系,从发生变化的数据中提取出第N级数据信息对应的数据,并将提取的数据置于第N级数据信息对应的数据集合中。
6.一种基于权利要求1的数据处理方法进行数据检索的设备,其特征在于,该设备包括:
第一确定模块,用于根据数据信息和标识的对应关系,确定用户需要检索的数据信息对应的标识;
第二确定模块,用于根据标识和数据的对应关系,确定用户需要检索的数据信息对应的标识对应的数据;
检索模块,用于从确定的数据中进行数据检索。
CN201110427898.7A 2011-12-19 2011-12-19 一种数据处理和检索的方法及设备 Expired - Fee Related CN103164491B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110427898.7A CN103164491B (zh) 2011-12-19 2011-12-19 一种数据处理和检索的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110427898.7A CN103164491B (zh) 2011-12-19 2011-12-19 一种数据处理和检索的方法及设备

Publications (2)

Publication Number Publication Date
CN103164491A CN103164491A (zh) 2013-06-19
CN103164491B true CN103164491B (zh) 2016-03-30

Family

ID=48587585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110427898.7A Expired - Fee Related CN103164491B (zh) 2011-12-19 2011-12-19 一种数据处理和检索的方法及设备

Country Status (1)

Country Link
CN (1) CN103164491B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528872B (zh) * 2016-12-06 2019-09-24 北京至上泽思信息技术有限公司 一种在大数据环境下的数据搜索方法
CN108280046A (zh) * 2017-11-30 2018-07-13 深圳市科列技术股份有限公司 一种电池数据处理的方法、电池数据服务器及用户终端
CN110119512A (zh) * 2019-05-21 2019-08-13 杭州凡闻科技有限公司 数字剪报制作方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1356655A (zh) * 2000-11-28 2002-07-03 皇家菲利浦电子有限公司 在分层对象结构中的搜索方法
CN101005531A (zh) * 2007-01-30 2007-07-25 华为技术有限公司 质检方法、质检设备及质检系统
CN101063975A (zh) * 2007-02-15 2007-10-31 刘二中 电子文本处理与检索的方法和系统
CN101093496A (zh) * 2006-06-23 2007-12-26 微软公司 多级关联存储结构及其存储方法
CN101106602A (zh) * 2006-07-14 2008-01-16 北京上行逶式信息公司 移动电话的多级信息查询技术
CN101799827A (zh) * 2010-03-11 2010-08-11 浙江大学 基于层次化结构的视频素材库管理方法
CN101840400A (zh) * 2009-03-19 2010-09-22 北大方正集团有限公司 一种多级分类检索方法及系统
CN102087669A (zh) * 2011-03-11 2011-06-08 北京汇智卓成科技有限公司 基于语义关联的智能搜索引擎系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1356655A (zh) * 2000-11-28 2002-07-03 皇家菲利浦电子有限公司 在分层对象结构中的搜索方法
CN101093496A (zh) * 2006-06-23 2007-12-26 微软公司 多级关联存储结构及其存储方法
CN101106602A (zh) * 2006-07-14 2008-01-16 北京上行逶式信息公司 移动电话的多级信息查询技术
CN101005531A (zh) * 2007-01-30 2007-07-25 华为技术有限公司 质检方法、质检设备及质检系统
CN101063975A (zh) * 2007-02-15 2007-10-31 刘二中 电子文本处理与检索的方法和系统
CN101840400A (zh) * 2009-03-19 2010-09-22 北大方正集团有限公司 一种多级分类检索方法及系统
CN101799827A (zh) * 2010-03-11 2010-08-11 浙江大学 基于层次化结构的视频素材库管理方法
CN102087669A (zh) * 2011-03-11 2011-06-08 北京汇智卓成科技有限公司 基于语义关联的智能搜索引擎系统

Also Published As

Publication number Publication date
CN103164491A (zh) 2013-06-19

Similar Documents

Publication Publication Date Title
CN108509547B (zh) 一种信息管理方法、信息管理系统及电子设备
Wang et al. Mapdupreducer: detecting near duplicates over massive datasets
CN104715064B (zh) 一种实现在网页上标注关键词的方法和服务器
US8478756B2 (en) Contextual document attribute values
CN105095231A (zh) 一种呈现搜索结果的方法和装置
US9928300B2 (en) Artificial intelligence article analysis interface
CN103617174A (zh) 一种基于云计算的分布式搜索方法
JP2016194921A (ja) キュレートされたコンテンツ内の古くなったアイテムの除去
CN106503274A (zh) 一种数据整合与搜索方法及服务器
EP3762834A1 (en) System and method for searching based on text blocks and associated search operators
CN112000929A (zh) 一种跨平台数据分析方法、系统、设备及可读存储介质
CN107644050A (zh) 一种基于solr的Hbase的查询方法及装置
CN113407785A (zh) 一种基于分布式储存系统的数据处理方法和系统
CN111666383A (zh) 信息处理方法、装置、电子设备及计算机可读存储介质
CN113407495A (zh) 一种基于simhash的文件相似度判定方法及系统
WO2015084757A1 (en) Systems and methods for processing data stored in a database
US11334592B2 (en) Self-orchestrated system for extraction, analysis, and presentation of entity data
Maciołek et al. Cluo: Web-scale text mining system for open source intelligence purposes
CN115145871A (zh) 文件查询方法、装置和电子设备
CN103164491B (zh) 一种数据处理和检索的方法及设备
CN106202552A (zh) 基于云计算的数据搜索方法
CN104462552A (zh) 问答页面核心词提取方法和装置
WO2016000511A1 (zh) 互联网稀有资源的挖掘方法及装置
Holzmann et al. Universal distant reading through metadata proxies with archivespark
CN106776772B (zh) 一种数据检索的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: FOUNDER INFORMATION INDUSTRY HOLDING CO., LTD. BEI

Free format text: FORMER OWNER: BEIJING FOUNDER APABI TECHNOLOGY CO., LTD.

Effective date: 20130902

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20130902

Address after: 100871 Beijing, Haidian District into the house road, founder of the building on the 9 floor, No. 298

Applicant after: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Applicant after: FOUNDER INFORMATION INDUSTRY HOLDINGS Co.,Ltd.

Applicant after: FOUNDER APABI TECHNOLOGY Ltd.

Address before: 100871 Beijing, Haidian District into the house road, founder of the building on the 9 floor, No. 298

Applicant before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Applicant before: FOUNDER APABI TECHNOLOGY Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 9 floor

Patentee after: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee after: PKU FOUNDER INFORMATION INDUSTRY GROUP CO.,LTD.

Patentee after: FOUNDER APABI TECHNOLOGY Ltd.

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 9 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: FOUNDER INFORMATION INDUSTRY HOLDINGS Co.,Ltd.

Patentee before: FOUNDER APABI TECHNOLOGY Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220914

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: FOUNDER APABI TECHNOLOGY Ltd.

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 9 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: PKU FOUNDER INFORMATION INDUSTRY GROUP CO.,LTD.

Patentee before: FOUNDER APABI TECHNOLOGY Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160330