CN104298685A - 实现异构系统统一检索的方法及装置 - Google Patents

实现异构系统统一检索的方法及装置 Download PDF

Info

Publication number
CN104298685A
CN104298685A CN201310303489.5A CN201310303489A CN104298685A CN 104298685 A CN104298685 A CN 104298685A CN 201310303489 A CN201310303489 A CN 201310303489A CN 104298685 A CN104298685 A CN 104298685A
Authority
CN
China
Prior art keywords
information
article
data
retrieval
tables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310303489.5A
Other languages
English (en)
Inventor
胡勇
徐建
任广永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201310303489.5A priority Critical patent/CN104298685A/zh
Publication of CN104298685A publication Critical patent/CN104298685A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及检索技术领域,公开了一种实现异构系统统一检索的方法及装置,该方法包括:接收用户输入的检索信息;根据所述检索信息生成查询语句;根据所述查询语句从数据表中进行全文检索,所述数据表包括定时从多个不同的系统中采集的文章信息;展现检索结果。利用本发明,可以实现针对各种数据类型的检索,满足企业信息系统的检索需求。

Description

实现异构系统统一检索的方法及装置
技术领域
本发明涉及检索技术领域,具体涉及一种实现异构系统统一检索的方法及装置。 
背景技术
在企业内部往往存在多套业务系统应用,每个系统中都存在大量的异构的数字资源,这些资源在物理位置上可能是集中式的,也可能是分布式的。一般来说,这些系统都分别拥有自己的检索系统,这样虽说给开发和管理上带来方便,但是却给用户在同时检索各种资源时造成了极大的不便。 
因此需要一种统一检索的方法和系统,将各业务系统检索与全文检索相结合,实现针对各种数据类型的检索,满足企业信息系统的检索需求。 
发明内容
本发明提供一种实现异构系统统一检索的方法及装置,以实现针对各种数据类型的检索,满足企业信息系统的检索需求。 
为此,本发明提供如下技术方案: 
一种实现异构系统统一检索的方法,包括: 
接收用户输入的检索信息; 
根据所述检索信息生成查询语句; 
根据所述查询语句从数据表中进行全文检索,所述数据表包括定时从多个不同的系统中采集的文章信息; 
展现检索结果。 
优选地,所述检索信息包括:查询关键词;所述方法还包括: 
在根据所述检索信息生成查询语句之前,检查所述关键词是否为敏感词语; 
如果是,则向用户返回空的查询结果。 
优选地,所述检索信息还包括:查询条件。 
优选地,所述文章信息包括:文章属性信息字段和文章分类信息字段; 
所述文章属性信息字段包括:标识,标题,标题图片,内容,状态,创建时间,作者,更新时间,链接地址; 
所述文章分类信息字段包括:栏目,来源。 
优选地,所述方法还包括: 
采用多线程方式分别采集不同系统中的文章信息,并将采集的文章信息写入所述数据表中。 
可选地,不同线程采集文章信息的周期相同或不同。 
优选地,所述方法还包括: 
记录所述数据表的更新时间。 
一种实现异构系统统一检索的装置,包括: 
检索信息接收模块,用于接收用户输入的检索信息; 
查询语句生成模块,用于根据所述检索信息生成查询语句; 
检索模块,用于根据所述查询语句从数据表中进行全文检索,所述数据表包括定时从多个不同的系统中采集的文章信息; 
展现模块,用于展现检索结果。 
优选地,所述检索信息包括:查询关键词;所述装置还包括: 
过滤模块,用于在所述查询语句生成模块根据所述检索信息生成查询语句之前,检查所述关键词是否为敏感词语,如果是,则向用户返回空的查询结果。 
优选地,所述装置还包括: 
采集模块,用于采用多线程方式分别采集不同系统中的文章信息,并将采集的文章信息写入或更新到所述数据表中。 
可选地,不同线程采集文章信息的周期相同或不同。 
优选地,所述装置还包括: 
日志模块,用于记录所述数据表的更新时间。 
本发明实施例提供的实现异构系统统一检索的方法及装置,通过预先对不同系统数据的采集整理,形成本地格式统一、结构清晰的数据存储,该存储可以按照需求建立各种分类体系,进行再组织和管理。将数据存储作为专业的全文检索引擎数据源,从而可以使用户通过统一的界面发出检索请求,实现针对 各种数据类型的检索,提高检索的效率,满足企业信息系统的检索需求。 
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。 
图1是本发明实施例实现异构系统统一检索的方法的流程图; 
图2是本发明实施例实现异构系统统一检索的装置的一种结构示意图; 
图3是本发明实施例中提供的一种用户检索界面示意图; 
图4是本发明实施例实现异构系统统一检索的装置的一种具体应用结构示意图。 
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。 
为了实现统一检索,可以让各业务系统提供检索接口,数据库系统可以直接通过数据库接口软件,使得统一检索系统与各业务系统进行连接。在同时检索的业务系统数量较少时,此技术可以解决异构检索问题,但是当业务系统达到一定数量时,处理速度很难保证。 
为此,本发明实施例提供一种实现异构系统统一检索的方法及装置,能够引入专业的全文检索引擎,提高检索的效率和准确性,提供统一的检索界面,方便用户发出检索请求,浏览检索结果。 
如图1所示,是本发明实施例实现异构系统统一检索的方法的流程图,包括以下步骤: 
步骤101,接收用户输入的检索信息。 
所述检索信息可以只包括查询关键词,也可以同时包括查询关键词和查询条件,比如,可以是限定时间,指定频道、分类和排序方式等条件。当然,可以只有一个查询条件,也可以同时包括多个查询条件,对此本发明实施例不做 限定。 
具体地,可以以ASPX页面作为用户检索的界面,负责接收用户输入的检索信息。 
另外,为了避免用户对一些违法或不良的词语的查询产生不好的影响,在本发明方法的另一实施例中,还可以在根据所述检索信息生成查询语句之前,检查所述关键词是否为敏感词语(比如,违法、不良和低俗等词语),如果是,则向用户返回空的查询结果。 
所述敏感词语可以预先存储在一个文件中,在过滤时,查找用户输入的查询关键词是否包含在该文件中;如果是,则说明该查询关键词属于敏感词,此时查询结果为空;如果不是,则继续执行后面的步骤。 
步骤102,根据所述检索信息生成查询语句。 
前面提到,用户输入的检索信息可以包括查询关键词,还可以包括查询条件,而且其中的查询关键词及查询条件可以有多个,对此,可以通过语法分析,生成查询语句。比如,去除用户输入的检索信息中的连接词,对查询关键词之间的空格解析为逻辑或,不同的关键词将自动分配不同的背景色等。 
步骤103,根据所述查询语句从数据表中进行全文检索,所述数据表包括定时从多个不同的系统中采集的文章信息。 
为了实现异构系统检索,本发明实施例的方法提供了基于数据表的数据存储,即将待检索的信息存放在一张关系数据表中,该表的信息标识,来源字段来自其它多个不同结构的数据表或系统。 
这样,尽管不同系统的文章自身存储结构不同,但在本发明实施例中,预先将检索需要的字段信息存储到同一张数据表的相同字段中,从而使文章格式统一,方便操作和维护。 
在实际应用中,数据表中的字段可以包括文章属性信息字段和文章分类信息字段。文章属性信息字段可以包括:标识,标题,标题图片,内容,状态,创建时间,作者,更新时间,链接地址等。文章分类信息字段可以包括:栏目,来源等,这些字段有助于按分类进行检索。其中,来源字段可以用来标识来自不同的系统。如果是同类型的数据库表中的文章,来源字段记录的可以是表名,文章从这些指定的表迁移过来。如果是其它形式来源的文章,如xml,服务或 不同类型的数据库,来源字段记录的可以是标识。 
为了更好地对所述数据表进行管理,还可以对数据表的操作进行记录。记录的内容比如可以包括:数据表的更新时间、操作的性质(比如添加、修改、删除)。 
需要说明的是,在实际应用中,可以采用多线程方式分别采集不同系统中的文章信息,并将采集的文章信息写入所述数据表中,而且不同线程采集文章信息的周期相同或不同。 
具体地,每个采集任务的执行程序可以以插件形式提供,方便扩展。即增加新的待检索异构系统,如果已有插件程序无法从该新系统提供的接口获取数据填充入数据表,可以编写新的插件。所述插件中需要调用的异构系统的接口有两个,一是按设定的起止时间读取文章列表,文章列表的字段要与数据表中的字段基本一致;二是文章列表的删改日志记录。前者用来执行按时间段迁移文章,后者用来同步文章列表创建后可能发生的变化。两个任务的定时执行的周期可以根据文章增加、删改频率进行调整,频率越低,周期可以设置的越长一些。 
在进行检索时,具体可以通过线性表的二分查找算法,对数据表进行全文检索,提取其中与关键词和查询条件匹配的检索结果。 
步骤104,展现检索结果。 
具体地,可以以方便的查看方式展现检索,比如,可以按频道、分类和时间对检索结果进行筛选。另外,检索结果中还可以提供摘要超链接,该超链接可以链接到子系统界面查看明细。当然,也可以有其它展现方式,对此本发明实施例不做限定。 
本发明实施例提供的实现异构系统统一检索的方法,通过预先对不同系统数据的采集整理,形成本地格式统一、结构清晰的数据存储,该存储可以按照需求建立各种分类体系,进行再组织和管理。将数据存储作为专业的全文检索引擎数据源,从而可以使用户通过统一的界面发出检索请求,实现针对各种数据类型的检索,提高检索的效率,满足企业信息系统的检索需求。 
相应地,本发明实施例还提供一种实现异构系统统一检索的装置,如图2所示,是该装置的一种结构示意图。 
在该实施例中,所述装置包括:检索信息接收模块201,查询语句生成模块202,检索模块203和展现模块204。其中: 
检索信息接收模块201,用于接收用户输入的检索信息。 
所述检索信息可以包括查询关键词,还可以包括查询条件,比如,可以是限定时间,指定频道、分类和排序方式等条件。当然,可以只有一个查询条件,也可以同时包括多个查询条件,对此本发明实施例不做限定。 
具体地,可以以ASPX页面作为用户检索的界面,负责接收用户输入的检索信息,如图3所示。 
查询语句生成模块202,用于根据所述检索信息生成查询语句。 
具体地,查询语句生成模块202可以通过语法分析,生成查询语句。比如,去除用户输入的检索信息中的连接词,对查询关键词之间的空格解析为逻辑或,不同的关键词将自动分配不同的背景色等。 
检索模块203,用于根据所述查询语句从数据表中进行全文检索,所述数据表包括定时从多个不同的系统中采集的文章信息。 
展现模块204,用于展现检索结果。 
本发明实施例提供的实现异构系统统一检索的装置,通过预先对不同系统数据的采集整理,形成本地格式统一、结构清晰的数据存储,该存储可以按照需求建立各种分类体系,进行再组织和管理。将数据存储作为专业的全文检索引擎数据源,从而可以使用户通过统一的界面发出检索请求,实现针对各种数据类型的检索,提高检索的效率,满足企业信息系统的检索需求。 
需要说明的是,在本发明另一实施例中,所述装置还可进一步包括:采集模块(未图示),用于采用多线程方式分别采集不同系统中的文章信息,并将采集的文章信息写入或更新到所述数据表中,不同线程采集文章信息的周期相同或不同。具体采集过程及方式可以参照前面本发明方法实施例中的描述,在此不再赘述。 
另外,为了避免用户对一些违法或不良的词语的查询产生不好的影响,在本发明装置的另一实施例中,还可进一步包括:过滤模块(未图示),用于在查询语句生成模块202根据所述检索信息生成查询语句之前,检查所述关键词是否为敏感词汇,如果是,则向用户返回空的查询结果。 
可以在根据所述检索信息生成查询语句之前,检查所述关键词是否为敏感词语(比如,违法、不良和低俗等词语),如果是,则向用户返回空的查询结果。 
另外,为了更好地对所述数据表进行管理,在本发明装置的另一实施例中,还可进一步包括:日志模块(未图示),用于对数据表的操作进行记录。记录的内容比如可以包括:数据表的更新时间、操作的性质(比如添加、修改、删除)。 
需要说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。 
如图4所示,是本发明实施例实现异构系统统一检索的装置的一种具体应用结构示意图。 
在该结构中,采集模块采用多线程方式周期性地采集不同系统中的文章信息,并将采集的文章信息写入或更新到所述数据表中。 
全文检索引擎负责向用户提供检索界面,接收用户输入的检索信息,对所述检索信息进行敏感词过滤和关键词配色等操作,生成查询语句,根据查询语句从数据表中进行全文检索,并将得到的检索结果展现给用户。用户还可以通过全文检索引擎提供的界面浏览检索结果。 
检索结果的展现可以有多种方式,比如可以按频道、分类和时间对检索结果进行筛选。另外,检索结果中还可以提供摘要超链接,该超链接可以链接到子系统界面查看明细。当然,也可以有其它展现方式,对此本发明实施例不做限定。 
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是 物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。 
以上对本发明实施例进行了详细介绍,本文中应用了具体实施方式对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及设备;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。 

Claims (12)

1.一种实现异构系统统一检索的方法,其特征在于,包括:
接收用户输入的检索信息;
根据所述检索信息生成查询语句;
根据所述查询语句从数据表中进行全文检索,所述数据表包括定时从多个不同的系统中采集的文章信息;
展现检索结果。
2.根据权利要求1所述的方法,其特征在于,所述检索信息包括:查询关键词;所述方法还包括:
在根据所述检索信息生成查询语句之前,检查所述关键词是否为敏感词语;
如果是,则向用户返回空的查询结果。
3.根据权利要求2所述的方法,其特征在于,所述检索信息还包括:查询条件。
4.根据权利要求1所述的方法,其特征在于,
所述文章信息包括:文章属性信息字段和文章分类信息字段;
所述文章属性信息字段包括:标识,标题,标题图片,内容,状态,创建时间,作者,更新时间,链接地址;
所述文章分类信息字段包括:栏目,来源。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
采用多线程方式分别采集不同系统中的文章信息,并将采集的文章信息写入所述数据表中。
6.根据权利要求5所述的方法,其特征在于,不同线程采集文章信息的周期相同或不同。
7.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
记录所述数据表的更新时间。
8.一种实现异构系统统一检索的装置,其特征在于,包括:
检索信息接收模块,用于接收用户输入的检索信息;
查询语句生成模块,用于根据所述检索信息生成查询语句;
检索模块,用于根据所述查询语句从数据表中进行全文检索,所述数据表包括定时从多个不同的系统中采集的文章信息;
显示模块,用于展现检索结果。
9.根据权利要求8所述的装置,其特征在于,所述检索信息包括:查询关键词;所述装置还包括:
过滤模块,用于在所述查询语句生成模块根据所述检索信息生成查询语句之前,检查所述关键词是否为敏感词语,如果是,则向用户返回空的查询结果。
10.根据权利要求8或9所述的装置,其特征在于,所述装置还包括:
采集模块,用于采用多线程方式分别采集不同系统中的文章信息,并将采集的文章信息写入或更新到所述数据表中。
11.根据权利要求10所述的装置,其特征在于,不同线程采集文章信息的周期相同或不同。
12.根据权利要求8或9所述的装置,其特征在于,所述装置还包括:
日志模块,用于记录所述数据表的更新时间。
CN201310303489.5A 2013-07-18 2013-07-18 实现异构系统统一检索的方法及装置 Pending CN104298685A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310303489.5A CN104298685A (zh) 2013-07-18 2013-07-18 实现异构系统统一检索的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310303489.5A CN104298685A (zh) 2013-07-18 2013-07-18 实现异构系统统一检索的方法及装置

Publications (1)

Publication Number Publication Date
CN104298685A true CN104298685A (zh) 2015-01-21

Family

ID=52318413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310303489.5A Pending CN104298685A (zh) 2013-07-18 2013-07-18 实现异构系统统一检索的方法及装置

Country Status (1)

Country Link
CN (1) CN104298685A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341274A (zh) * 2017-08-31 2017-11-10 郑州云海信息技术有限公司 一种全文搜索引擎及数据检索方法
CN111930823A (zh) * 2020-09-27 2020-11-13 武汉中科通达高新技术股份有限公司 一种数据查询方法、装置、数据中台和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101141370A (zh) * 2007-10-09 2008-03-12 南京财经大学 基于网格服务的电力企业实时数据处理方法
CN102567418A (zh) * 2010-12-23 2012-07-11 北大方正集团有限公司 一种数据整合、搜索的方法及装置
CN102567378A (zh) * 2010-12-28 2012-07-11 上海杉达学院 基于异构数据的信息检索系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101141370A (zh) * 2007-10-09 2008-03-12 南京财经大学 基于网格服务的电力企业实时数据处理方法
CN102567418A (zh) * 2010-12-23 2012-07-11 北大方正集团有限公司 一种数据整合、搜索的方法及装置
CN102567378A (zh) * 2010-12-28 2012-07-11 上海杉达学院 基于异构数据的信息检索系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
陆阳: "《Eclipse RCP与Spring OSGi技术详解与最佳实践》", 31 January 2013 *
陈建伟 等: "《ASP动态网站开发基础教程》", 31 May 2012 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341274A (zh) * 2017-08-31 2017-11-10 郑州云海信息技术有限公司 一种全文搜索引擎及数据检索方法
CN111930823A (zh) * 2020-09-27 2020-11-13 武汉中科通达高新技术股份有限公司 一种数据查询方法、装置、数据中台和存储介质

Similar Documents

Publication Publication Date Title
US11741057B2 (en) Unified data object management system and the method
CN102521416B (zh) 数据关联查询方法和数据关联查询装置
US10719560B2 (en) System for identifying, associating, searching and presenting documents based on relation combination
Madhavan et al. Harnessing the deep web: Present and future
US9009201B2 (en) Extended database search
US11226976B2 (en) Systems and methods for graphical exploration of forensic data
US8396894B2 (en) Integrated repository of structured and unstructured data
US10719559B2 (en) System for identifying, associating, searching and presenting documents based on time sequentialization
US9146994B2 (en) Pivot facets for text mining and search
US9753960B1 (en) System, method, and computer program for dynamically generating a visual representation of a subset of a graph for display, based on search criteria
US8924373B2 (en) Query plans with parameter markers in place of object identifiers
CN102164186B (zh) 一种实现云搜索服务的方法及系统
CN106294695A (zh) 一种面向实时大数据搜索引擎的实现方法
CN103020322A (zh) 查询方法
KR20160053933A (ko) 스마트 검색 정제 기법
CN106503274A (zh) 一种数据整合与搜索方法及服务器
CN104714974A (zh) 一种查询语句解析与再处理的方法和装置
CN103914488A (zh) 文档的采集、标识、关联、搜索及展现的系统
CN116049153B (zh) 数据库的数据处理方法、装置、电子设备及存储介质
CN102508884A (zh) 热点事件与实时评论的获取方法及装置
US8996512B2 (en) Search engine optimization using a find operation
CN104298685A (zh) 实现异构系统统一检索的方法及装置
CN105740251B (zh) 一种总线式整合不同内容源的方法和系统
US20090132493A1 (en) Method for retrieving and editing HTML documents
KR100775852B1 (ko) 응용 프로그램의 자원 검색 시스템 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150121

RJ01 Rejection of invention patent application after publication