CN102110104B - 索引库的建立方法、检索方法和索引库的更新方法 - Google Patents

索引库的建立方法、检索方法和索引库的更新方法 Download PDF

Info

Publication number
CN102110104B
CN102110104B CN200910243575.5A CN200910243575A CN102110104B CN 102110104 B CN102110104 B CN 102110104B CN 200910243575 A CN200910243575 A CN 200910243575A CN 102110104 B CN102110104 B CN 102110104B
Authority
CN
China
Prior art keywords
authority
information
index
user
index field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200910243575.5A
Other languages
English (en)
Other versions
CN102110104A (zh
Inventor
孙赓
闫进兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Apabi Technology Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN200910243575.5A priority Critical patent/CN102110104B/zh
Publication of CN102110104A publication Critical patent/CN102110104A/zh
Application granted granted Critical
Publication of CN102110104B publication Critical patent/CN102110104B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种索引库的建立方法、检索方法和索引库的更新方法,其中,该索引库的建立方法包括:在索引库中为每一个资源单元建立一个权限索引字段,其中,一个权限索引字段由多个权限信息构成。根据本发明,使用了包括了多个权限信息的权限索引字段来对资源单元的使用进行分类,并在权限信息发生改变时,只需对单个权限索引字段进行更新,从而实现了快速更新的目标,使权限检索库在数据更新时尽可能快速的完成。

Description

索引库的建立方法、检索方法和索引库的更新方法
技术领域
本发明涉及检索技术领域,具体而言,涉及一种索引库的建立方法、检索方法和索引库的更新方法。
背景技术
检索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供搜索服务的系统。
从使用者的角度看,检索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给检索引擎后,检索引擎就会返回与用户输入的内容相关的信息列表。
检索引擎有各种各样的形式,包括新闻检索引擎,Blog检索引擎,杂志期刊检索引擎,购物检索引擎,专业检索引擎,儿童检索引擎,企业内部检索引擎,电子商务检索引擎,旅游检索引擎等。
目前,互联网上的检索引擎都是面向所有用户的,每个用户搜索获得的信息内容都一样。然而,当一个公司或企业提供搜索服务时,他们希望对部分信息资源进行保护,也就是只对部分用户开放。特别企业内部搜索,每个部门的人只能搜索到属于这个部门范围的信息资源,而不能跨部门,跨权限的获取信息。现在的检索引擎还不具备这个功能,不能满足公司,企业和个人多样化的需求。
为了解决上述问题,已经出现一些与权限检索相关的技术及应用,用于对受控内容的检索提供给有偿用户使用,如基于访问控制列表的权限检索引擎技术。该技术主要是利用ACL(Access ControlList)创建检索权限控制列表,在权限检索时利用检索的资源库与ACL相结合的查询算法检索出符合权限条件的资源。关联字段采用多字段方式,因此在数据更新及权限更新时既需要进行多字段更新也需要更新ACL相关信息,导致整体更新执行效率不高,对检索效率也有很大影响,因此不适合执行实时更新。
针对相关的权限检索技术更新效率不高的问题,目前尚未提出有效的解决方案。
发明内容
针对相关的权限检索技术更新效率不高的问题而提出本发明,为此,本发明的主要目的在于提供一种索引库的建立方法、检索方法和索引库的更新方法,以解决上述问题至少之一。
为了实现上述目的,根据本发明的一个方面,提供了一种索引库的建立方法,其包括:在索引库中为每一个资源单元建立一个权限索引字段,其中,一个权限索引字段由多个权限信息构成。
为了实现上述目的,根据本发明的另一方面,提供了一种检索方法,其包括:根据用户的信息获取索引库中与该用户的权限对应的资源单元,其中,预先在索引库中为每一个资源单元建立一个权限索引字段,一个权限索引字段由多个权限信息构成;在获取的资源单元中进行检索。
为了实现上述目的,根据本发明的又一方面,提供了一种索引库的更新方法,其包括:根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段,其中,预先在索引库中为每一个资源单元建立一个权限索引字段,一个权限索引字段由多个权限信息构成。
根据本发明,使用了包括了多个权限信息的权限索引字段来对资源单元的使用进行分类,并在权限信息发生改变时,只需对单个权限索引字段进行更新,从而实现了快速更新的目标,使权限检索库在数据更新时尽可能快速的完成,使数据更新与权限更新基本达到同步,并在更新时减少系统资源的消耗,减少对检索引擎工作效率的影响。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的为索引字段存储示意图;
图2是根据本发明实施例的检索方法的流程图;
图3是根据本发明实施例的检索方法的详细流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
方法实施例
根据本发明的实施例,提供了一种索引库的建立方法,也就是,在索引库中为每一个资源单元建立一个权限索引字段,其中,所述权限索引字段由多个权限信息构成。
图1是根据本发明实施例的为索引字段存储示意图。如图1所示,可以将一个索引字段作为权限索引字段,构成该权限索引字段的权限信息可以包括:用户的标识、用户的IP地址,或用户的帐号。
优选的,上述多个权限信息可以以字符串拼接的方式构成权限索引字段。
例如,在检索引擎创建检索索引库时,为每一个资源单元建立一个独立的权限索引字段,该权限索引字段保存所有需要执行权限验证的权限信息,如用户的部门id,用户的IP地址,用户的账号等,这些权限信息按照字符串拼接的方式保存在本字段中,例如:
172.18.19.1`172.18.19.255_123456_ORGNO1,192.18.19.1`192.18.19.255_654321_ORGNO2
在检索时,通过特定的检索语句加上特定的检索算法根据上述权限索引字段来过滤权限范围之外的数据。
上述检索算法可以是通用的多分类检索算法,例如可以把每个用户权限信息看作一个资源分类,来实现资源的多分类检索,这时,检索算法为:提取索引值与权限索引字段中的权限信息作对比,如对比成功,则将与该权限索引字段对应的资源放入检索结果中返回给用户。
在权限数据或权限信息更新时,则可以直接更新上述权限索引字段。
根据本发明的实施例,还提供了一种检索方法。
图2是根据本发明实施例的检索方法的流程图。如图2所示,根据本发明实施例的检索方法包括:
S202,根据用户的信息获取索引库中与该用户的权限对应的资源单元,其中,预先在上述索引库中为每一个资源单元建立一个权限索引字段,上述权限索引字段由多个权限信息构成;
S204,在获取的上述资源单元中进行检索。
优选的,根据用户的信息获取索引库中与该用户的权限对应的资源单元包括:将上述用户的信息与上述索引库中的每一个权限索引字段进行比较;在上述用户的信息与上述权限索引字段中的一个或多个权限信息相同时,则获取该权限索引字段所对应的资源单元。
相应的,上述多个权限信息以字符串拼接的方式构成上述权限索引字段。
相应的,上述权限信息可以包括:用户的标识、用户的IP地址,或用户的帐号。
图3是根据本发明实施例的检索方法的详细流程图。如图3所示。在检索引擎创建或者更新内容资源索引库的索引信息时,将用户权限信息按照字符串拼接的方式存入检索引擎的权限字段。用户在做检索时,将用户权限信息放入检索查询请求中,检索引擎通过权限字段对比用户的权限信息,如果用户权限信息与索引保存的权限信息符合则将此条资源信息作为可被检索的对象,然后按照用户的其他检索条件过滤检索资源,最终返回满足用户权限信息的检索资源结果。
根据本发明的实施例,还提供了一种索引库的更新方法。
该索引库的更新方法包括:根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段,其中,预先在上述索引库中为每一个资源单元建立一个权限索引字段,上述权限索引字段由多个权限信息构成。
对于上述根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段,可以首先在索引库中查找包含有所述权限信息的权限索引字段;然后,根据待更新的权限信息在索引库中更新与该查找出的权限索引字段。
根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段可以包括:将上述待更新的权限信息增加到上述权限索引字段中;或者从上述权限索引字段中删除上述待更新的权限信息。
同样,上述多个权限信息以字符串拼接的方式构成上述权限索引字段。
下面将结合实例对本发明实施例的实现过程进行详细描述。
在提供给订阅机构的读报系统的应用中,该应用的数据使用有以下特点:
1、数据量大,需要进行全文检索
2、不同机构订阅的报纸不同,按照用户的权限提供相应报刊数据的检索服务。
3、每天都有大量的报纸数据需要更新,让用户及时阅读到已订阅的内容。
在用户订阅报纸资源时,将机构ID更新到检索库的权限索引字段中,如果有多个机构都订阅了该资源,则在索引库中与该资源对应的权限索引字段保存为多个机构ID,如ORGID1,ORGID2...,并且这些权限信息以字符串形式保存到该权限索引字段中。
当机构ORGID1的用户检索报纸内容时,检索条件将ORGID1传递给检索引擎,检索引擎将所有权限索引字段中包含了“ORGID1”的资源作为检索源,然后对该检索源进行检索,从而机构ID为ORGID1的用户只能检索到标记了ORGID1的所有资源,实现权限检索功能。
当该资源被新的机构ORGID3订阅后,检索引擎会根据该待更新的权限信息ORGID3来更新权限索引字段。例如,将该待更新的权限信息ORGID3增加到对应的权限索引字段中,使该权限索引字段更新成为ORGID1,ORGID2,ORGID3......,例如,更新后的权限索引字段为:ORGID1_ORGID2_ORGID3。由于只需要更新权限索引字段,从而使得更新速度很快,在订阅成功后ORGID3的用户很快就能检索到本机构订阅的数据。
当该资源被机构ORGID3退订时,检索引擎会根据待更新的权限信息ORGID3来更新与其对应的权限索引字段。例如,从该权限索引字段中删除该待更新的权限信息ORGID3,以使该权限索引字段更新成为ORGID1,ORGID2,......。
同样,当已经订阅的机构报纸有内容更新时,新入检索库的内容资源会直接在权限字段上打上订阅机构的标记,因此新入库的数据可以实时的被有权限用户检索到。
根据本发明,使用了包括了多个权限信息的权限索引字段来对资源单元的使用进行分类,并在权限信息发生改变时,只需对单个权限索引字段进行更新,从而实现了快速更新的目标,使权限检索库在数据更新时尽可能快速的完成,使数据更新与权限更新基本达到同步,并在更新时减少系统资源的消耗,减少对检索引擎工作效率的影响。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种索引库的建立方法,其特征在于,包括:
在索引库中为每一个资源单元建立一个独立的权限索引字段,其中,一个权限索引字段由多个需要执行权限验证的权限信息构成;
其中,用户在做全文检索时,将用户权限信息放入检索查询请求中,检索引擎通过所述权限索引字段对比所述用户权限信息,如果所述用户权限信息与所述权限索引字段中的权限信息符合,则将此条资源信息作为被检索的对象,然后按照用户的其他检索条件过滤检索资源,最终返回满足所述权限信息的检索资源结果,
其中,在检索时,通过检索语句加上检索算法根据所述权限索引字段来过滤权限范围之外的数据,所述检索算法为提取索引值与所述权限索引字段中的所述权限信息作对比,如对比成功,则将与所述权限索引字段对应的资源放入所述检索资源结果中返回给用户;
在检索引擎创建或更新内容资源索引库的索引信息时,将多个所述用户权限信息按照字符串拼接的方式存入所述检索引擎的权限索引字段,在权限数据或所述权限信息更新时,直接更新所述权限索引字段。
2.根据权利要求1所述的方法,其特征在于,所述权限信息包括:
用户的标识、用户的IP地址,或用户的帐号。
3.一种检索方法,其特征在于,包括:
根据用户的信息获取索引库中与该用户的权限对应的资源单元,其中,预先在所述索引库中为每一个资源单元建立一个独立的权限索引字段,一个权限索引字段由多个需要执行权限验证的权限信息构成;
在获取的所述资源单元中进行检索;
其中,所述方法包括如下步骤:用户在做全文检索时,将用户权限信息放入检索查询请求中,检索引擎通过所述权限索引字段对比所述用户权限信息,如果所述用户权限信息与所述权限索引字段中的权限信息符合,则将此条资源信息作为被检索的对象,然后按照用户的其他检索条件过滤检索资源,最终返回满足所述权限信息的检索资源结果,
其中,在检索时,通过检索语句加上检索算法根据所述权限索引字段来过滤权限范围之外的数据;
所述检索算法为提取索引值与所述权限索引字段中的所述权限信息作对比,如对比成功,则将与所述权限索引字段对应的资源放入所述检索资源结果中返回给用户,
在检索引擎创建或更新内容资源索引库的索引信息时,将多个所述用户权限信息按照字符串拼接的方式存入所述检索引擎的权限索引字段,在权限数据或所述权限信息更新时,直接更新所述权限索引字段。
4.根据权利要求3所述的方法,其特征在于,根据用户的信息获取索引库中与该用户的权限对应的资源单元包括:
将所述用户的信息与所述索引库中的每一个权限索引字段进行比较;
在所述用户的信息与所述权限索引字段中的一个或多个权限信息相同时,获取该权限索引字段所对应的资源单元。
5.根据权利要求3或4所述的方法,其特征在于,所述权限信息包括:用户的标识、用户的IP地址,或用户的帐号。
6.一种索引库的更新方法,其特征在于,包括:
根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段,其中,预先在所述索引库中为每一个资源单元建立一个独立的权限索引字段,一个权限索引字段由多个需要执行权限验证的权限信息构成;
在根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段之前,所述方法还包括:用户在做全文检索时,将用户权限信息放入检索查询请求中,检索引擎通过所述权限索引字段对比所述用户权限信息,如果所述用户权限信息与所述权限索引字段中的权限信息符合,则将此条资源信息作为被检索的对象,然后按照用户的其他检索条件过滤检索资源,最终返回满足所述权限信息的检索资源结果,
其中,在检索时,通过检索语句加上检索算法根据所述权限索引字段来过滤权限范围之外的数据;
所述检索算法为提取索引值与所述权限索引字段中的所述权限信息作对比,如对比成功,则将与所述权限索引字段对应的资源放入所述检索资源结果中返回给用户,
在检索引擎创建或更新内容资源索引库的索引信息时,将多个所述用户权限信息按照字符串拼接的方式存入所述检索引擎的权限索引字段,在权限数据或所述权限信息更新时,直接更新所述权限索引字段。
7.根据权利要求6所述的方法,其特征在于,根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段的步骤包括:
将所述待更新的权限信息增加到所述权限索引字段中;或者
从所述权限索引字段中删除所述待更新的权限信息。
CN200910243575.5A 2009-12-28 索引库的建立方法、检索方法和索引库的更新方法 Expired - Fee Related CN102110104B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910243575.5A CN102110104B (zh) 2009-12-28 索引库的建立方法、检索方法和索引库的更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910243575.5A CN102110104B (zh) 2009-12-28 索引库的建立方法、检索方法和索引库的更新方法

Publications (2)

Publication Number Publication Date
CN102110104A CN102110104A (zh) 2011-06-29
CN102110104B true CN102110104B (zh) 2016-12-14

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6611840B1 (en) * 2000-01-21 2003-08-26 International Business Machines Corporation Method and system for removing content entity object in a hierarchically structured content object stored in a database
US6625619B1 (en) * 2000-03-15 2003-09-23 Building Systems Design, Inc. Electronic taxonomy for construction product information
CN101221584A (zh) * 2008-02-01 2008-07-16 北大方正集团有限公司 搜索引擎、搜索方法和系统
CN101320373A (zh) * 2008-06-13 2008-12-10 华中科技大学 网站支撑数据库安全搜索引擎系统
CN101520800A (zh) * 2009-03-27 2009-09-02 华中科技大学 一种基于密文的安全全文索引和检索系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6611840B1 (en) * 2000-01-21 2003-08-26 International Business Machines Corporation Method and system for removing content entity object in a hierarchically structured content object stored in a database
US6625619B1 (en) * 2000-03-15 2003-09-23 Building Systems Design, Inc. Electronic taxonomy for construction product information
CN101221584A (zh) * 2008-02-01 2008-07-16 北大方正集团有限公司 搜索引擎、搜索方法和系统
CN101320373A (zh) * 2008-06-13 2008-12-10 华中科技大学 网站支撑数据库安全搜索引擎系统
CN101520800A (zh) * 2009-03-27 2009-09-02 华中科技大学 一种基于密文的安全全文索引和检索系统

Similar Documents

Publication Publication Date Title
US9043358B2 (en) Enterprise search over private and public data
US8224851B2 (en) Tag creation system
Yan et al. P‐Rank: An indicator measuring prestige in heterogeneous scholarly networks
CN101911042B (zh) 用户的浏览器历史的相关性排序
US7953775B2 (en) Sharing tagged data on the internet
CN104516910B (zh) 在客户端服务器环境中推荐内容
CN108776671A (zh) 一种网络舆情监控系统及方法
CN100424704C (zh) 基于密文的全文检索系统
CN110245470A (zh) 智能数据脱敏方法、装置、计算机设备和存储介质
CN101583945A (zh) 提供虚拟的真正简单聚合(rss)订阅源
EP3245569A1 (en) Record level data security
CN111966866A (zh) 一种数据资产管理的方法和装置
US20110184956A1 (en) Accessing digitally published content using re-indexing of search results
CN113297457A (zh) 一种高精准性的信息资源智能推送系统及推送方法
CN103984747B (zh) 屏幕信息处理方法和装置
CN101221584A (zh) 搜索引擎、搜索方法和系统
JP2003108440A (ja) データ公開方法、データ公開プログラム、データ公開装置
JP5488271B2 (ja) 検索装置
CN103823805A (zh) 基于社区的相关帖推荐系统及推荐方法
CN102110104B (zh) 索引库的建立方法、检索方法和索引库的更新方法
JP3702268B2 (ja) 情報検索システム、情報検索方法およびプログラム
KR20010057067A (ko) 온라인 맞춤 정보의 검색 관리 시스템 및 그 방법
KR101109425B1 (ko) 문서 관리 시스템
US20140129586A1 (en) Managing internet searches based on database query results
JP2008197700A (ja) 文書管理システムおよび文書管理方法

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220620

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: FOUNDER APABI TECHNOLOGY Ltd.

Address before: 100871, Beijing, Haidian District, Cheng Fu Road, No. 298, Zhongguancun Fangzheng building, 5 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: FOUNDER APABI TECHNOLOGY Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161214