CN102110104A - 索引库的建立方法、检索方法和索引库的更新方法 - Google Patents

索引库的建立方法、检索方法和索引库的更新方法 Download PDF

Info

Publication number
CN102110104A
CN102110104A CN 200910243575 CN200910243575A CN102110104A CN 102110104 A CN102110104 A CN 102110104A CN 200910243575 CN200910243575 CN 200910243575 CN 200910243575 A CN200910243575 A CN 200910243575A CN 102110104 A CN102110104 A CN 102110104A
Authority
CN
China
Prior art keywords
authority
index field
index
user
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200910243575
Other languages
English (en)
Other versions
CN102110104B (zh
Inventor
孙赓
闫进兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Founder Apabi Technology Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Apabi Technology Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN200910243575.5A priority Critical patent/CN102110104B/zh
Priority claimed from CN200910243575.5A external-priority patent/CN102110104B/zh
Publication of CN102110104A publication Critical patent/CN102110104A/zh
Application granted granted Critical
Publication of CN102110104B publication Critical patent/CN102110104B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)

Abstract

本发明公开了一种索引库的建立方法、检索方法和索引库的更新方法,其中,该索引库的建立方法包括:在索引库中为每一个资源单元建立一个权限索引字段,其中,一个权限索引字段由多个权限信息构成。根据本发明,使用了包括了多个权限信息的权限索引字段来对资源单元的使用进行分类,并在权限信息发生改变时,只需对单个权限索引字段进行更新,从而实现了快速更新的目标,使权限检索库在数据更新时尽可能快速的完成。

Description

索引库的建立方法、检索方法和索引库的更新方法
技术领域
本发明涉及检索技术领域,具体而言,涉及一种索引库的建立方法、检索方法和索引库的更新方法。
背景技术
检索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供搜索服务的系统。
从使用者的角度看,检索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给检索引擎后,检索引擎就会返回与用户输入的内容相关的信息列表。
检索引擎有各种各样的形式,包括新闻检索引擎,Blog检索引擎,杂志期刊检索引擎,购物检索引擎,专业检索引擎,儿童检索引擎,企业内部检索引擎,电子商务检索引擎,旅游检索引擎等。
目前,互联网上的检索引擎都是面向所有用户的,每个用户搜索获得的信息内容都一样。然而,当一个公司或企业提供搜索服务时,他们希望对部分信息资源进行保护,也就是只对部分用户开放。特别企业内部搜索,每个部门的人只能搜索到属于这个部门范围的信息资源,而不能跨部门,跨权限的获取信息。现在的检索引擎还不具备这个功能,不能满足公司,企业和个人多样化的需求。
为了解决上述问题,已经出现一些与权限检索相关的技术及应用,用于对受控内容的检索提供给有偿用户使用,如基于访问控制列表的权限检索引擎技术。该技术主要是利用ACL(Access ControlList)创建检索权限控制列表,在权限检索时利用检索的资源库与ACL相结合的查询算法检索出符合权限条件的资源。关联字段采用多字段方式,因此在数据更新及权限更新时既需要进行多字段更新也需要更新ACL相关信息,导致整体更新执行效率不高,对检索效率也有很大影响,因此不适合执行实时更新。
针对相关的权限检索技术更新效率不高的问题,目前尚未提出有效的解决方案。
发明内容
针对相关的权限检索技术更新效率不高的问题而提出本发明,为此,本发明的主要目的在于提供一种索引库的建立方法、检索方法和索引库的更新方法,以解决上述问题至少之一。
为了实现上述目的,根据本发明的一个方面,提供了一种索引库的建立方法,其包括:在索引库中为每一个资源单元建立一个权限索引字段,其中,一个权限索引字段由多个权限信息构成。
为了实现上述目的,根据本发明的另一方面,提供了一种检索方法,其包括:根据用户的信息获取索引库中与该用户的权限对应的资源单元,其中,预先在索引库中为每一个资源单元建立一个权限索引字段,一个权限索引字段由多个权限信息构成;在获取的资源单元中进行检索。
为了实现上述目的,根据本发明的又一方面,提供了一种索引库的更新方法,其包括:根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段,其中,预先在索引库中为每一个资源单元建立一个权限索引字段,一个权限索引字段由多个权限信息构成。
根据本发明,使用了包括了多个权限信息的权限索引字段来对资源单元的使用进行分类,并在权限信息发生改变时,只需对单个权限索引字段进行更新,从而实现了快速更新的目标,使权限检索库在数据更新时尽可能快速的完成,使数据更新与权限更新基本达到同步,并在更新时减少系统资源的消耗,减少对检索引擎工作效率的影响。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的为索引字段存储示意图;
图2是根据本发明实施例的检索方法的流程图;
图3是根据本发明实施例的检索方法的详细流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
方法实施例
根据本发明的实施例,提供了一种索引库的建立方法,也就是,在索引库中为每一个资源单元建立一个权限索引字段,其中,所述权限索引字段由多个权限信息构成。
图1是根据本发明实施例的为索引字段存储示意图。如图1所示,可以将一个索引字段作为权限索引字段,构成该权限索引字段的权限信息可以包括:用户的标识、用户的IP地址,或用户的帐号。
优选的,上述多个权限信息可以以字符串拼接的方式构成权限索引字段。
例如,在检索引擎创建检索索引库时,为每一个资源单元建立一个独立的权限索引字段,该权限索引字段保存所有需要执行权限验证的权限信息,如用户的部门id,用户的IP地址,用户的账号等,这些权限信息按照字符串拼接的方式保存在本字段中,例如:
172.18.19.1`172.18.19.255_123456_ORGNO1,192.18.19.1`192.18.19.255_654321_ORGNO2
在检索时,通过特定的检索语句加上特定的检索算法根据上述权限索引字段来过滤权限范围之外的数据。
上述检索算法可以是通用的多分类检索算法,例如可以把每个用户权限信息看作一个资源分类,来实现资源的多分类检索,这时,检索算法为:提取索引值与权限索引字段中的权限信息作对比,如对比成功,则将与该权限索引字段对应的资源放入检索结果中返回给用户。
在权限数据或权限信息更新时,则可以直接更新上述权限索引字段。
根据本发明的实施例,还提供了一种检索方法。
图2是根据本发明实施例的检索方法的流程图。如图2所示,根据本发明实施例的检索方法包括:
S202,根据用户的信息获取索引库中与该用户的权限对应的资源单元,其中,预先在上述索引库中为每一个资源单元建立一个权限索引字段,上述权限索引字段由多个权限信息构成;
S204,在获取的上述资源单元中进行检索。
优选的,根据用户的信息获取索引库中与该用户的权限对应的资源单元包括:将上述用户的信息与上述索引库中的每一个权限索引字段进行比较;在上述用户的信息与上述权限索引字段中的一个或多个权限信息相同时,则获取该权限索引字段所对应的资源单元。
相应的,上述多个权限信息以字符串拼接的方式构成上述权限索引字段。
相应的,上述权限信息可以包括:用户的标识、用户的IP地址,或用户的帐号。
图3是根据本发明实施例的检索方法的详细流程图。如图3所示。在检索引擎创建或者更新内容资源索引库的索引信息时,将用户权限信息按照字符串拼接的方式存入检索引擎的权限字段。用户在做检索时,将用户权限信息放入检索查询请求中,检索引擎通过权限字段对比用户的权限信息,如果用户权限信息与索引保存的权限信息符合则将此条资源信息作为可被检索的对象,然后按照用户的其他检索条件过滤检索资源,最终返回满足用户权限信息的检索资源结果。
根据本发明的实施例,还提供了一种索引库的更新方法。
该索引库的更新方法包括:根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段,其中,预先在上述索引库中为每一个资源单元建立一个权限索引字段,上述权限索引字段由多个权限信息构成。
对于上述根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段,可以首先在索引库中查找包含有所述权限信息的权限索引字段;然后,根据待更新的权限信息在索引库中更新与该查找出的权限索引字段。
根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段可以包括:将上述待更新的权限信息增加到上述权限索引字段中;或者从上述权限索引字段中删除上述待更新的权限信息。
同样,上述多个权限信息以字符串拼接的方式构成上述权限索引字段。
下面将结合实例对本发明实施例的实现过程进行详细描述。
在提供给订阅机构的读报系统的应用中,该应用的数据使用有以下特点:
1、数据量大,需要进行全文检索
2、不同机构订阅的报纸不同,按照用户的权限提供相应报刊数据的检索服务。
3、每天都有大量的报纸数据需要更新,让用户及时阅读到已订阅的内容。
在用户订阅报纸资源时,将机构ID更新到检索库的权限索引字段中,如果有多个机构都订阅了该资源,则在索引库中与该资源对应的权限索引字段保存为多个机构ID,如ORGID1,ORGID2...,并且这些权限信息以字符串形式保存到该权限索引字段中。
当机构ORGID1的用户检索报纸内容时,检索条件将ORGID1传递给检索引擎,检索引擎将所有权限索引字段中包含了“ORGID1”的资源作为检索源,然后对该检索源进行检索,从而机构ID为ORGID1的用户只能检索到标记了ORGID1的所有资源,实现权限检索功能。
当该资源被新的机构ORGID3订阅后,检索引擎会根据该待更新的权限信息ORGID3来更新权限索引字段。例如,将该待更新的权限信息ORGID3增加到对应的权限索引字段中,使该权限索引字段更新成为ORGID1,ORGID2,ORGID3......,例如,更新后的权限索引字段为:ORGID1_ORGID2_ORGID3。由于只需要更新权限索引字段,从而使得更新速度很快,在订阅成功后ORGID3的用户很快就能检索到本机构订阅的数据。
当该资源被机构ORGID3退订时,检索引擎会根据待更新的权限信息ORGID3来更新与其对应的权限索引字段。例如,从该权限索引字段中删除该待更新的权限信息ORGID3,以使该权限索引字段更新成为ORGID1,ORGID2,......。
同样,当已经订阅的机构报纸有内容更新时,新入检索库的内容资源会直接在权限字段上打上订阅机构的标记,因此新入库的数据可以实时的被有权限用户检索到。
根据本发明,使用了包括了多个权限信息的权限索引字段来对资源单元的使用进行分类,并在权限信息发生改变时,只需对单个权限索引字段进行更新,从而实现了快速更新的目标,使权限检索库在数据更新时尽可能快速的完成,使数据更新与权限更新基本达到同步,并在更新时减少系统资源的消耗,减少对检索引擎工作效率的影响。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种索引库的建立方法,其特征在于,包括:
在索引库中为每一个资源单元建立一个权限索引字段,其中,所述一个权限索引字段由多个权限信息构成。
2.根据权利要求1所述的方法,其特征在于,所述多个权限信息以字符串拼接的方式构成所述一个权限索引字段。
3.根据权利要求1或2所述的方法,其特征在于,所述权限信息包括:用户的标识、用户的IP地址,或用户的帐号。
4.一种检索方法,其特征在于,包括:
根据用户的信息获取索引库中与该用户的权限对应的资源单元,其中,预先在所述索引库中为每一个资源单元建立一个权限索引字段,所述一个权限索引字段由多个权限信息构成;
在获取的所述资源单元中进行检索。
5.根据权利要求4所述的方法,其特征在于,根据用户的信息获取索引库中与该用户的权限对应的资源单元包括:
将所述用户的信息与所述索引库中的每一个权限索引字段进行比较;
在所述用户的信息与所述权限索引字段中的一个或多个权限信息相同时,获取该权限索引字段所对应的资源单元。
6.根据权利要求4或5所述的方法,其特征在于,所述多个权限信息以字符串拼接的方式构成所述一个权限索引字段。
7.根据权利要求4或5所述的方法,其特征在于,所述权限信息包括:用户的标识、用户的IP地址,或用户的帐号。
8.一种索引库的更新方法,其特征在于,包括:
根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段,其中,预先在所述索引库中为每一个资源单元建立一个权限索引字段,所述一个权限索引字段由多个权限信息构成。
9.根据权利要求8所述的方法,其特征在于,根据待更新的权限信息在索引库中更新与该权限信息对应的权限索引字段的步骤包括:
将所述待更新的权限信息增加到所述权限索引字段中;或者
从所述权限索引字段中删除所述待更新的权限信息。
10.根据权利要求8或9所述的方法,其特征在于,所述多个权限信息以字符串拼接的方式构成所述一个权限索引字段。
CN200910243575.5A 2009-12-28 索引库的建立方法、检索方法和索引库的更新方法 Expired - Fee Related CN102110104B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910243575.5A CN102110104B (zh) 2009-12-28 索引库的建立方法、检索方法和索引库的更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910243575.5A CN102110104B (zh) 2009-12-28 索引库的建立方法、检索方法和索引库的更新方法

Publications (2)

Publication Number Publication Date
CN102110104A true CN102110104A (zh) 2011-06-29
CN102110104B CN102110104B (zh) 2016-12-14

Family

ID=

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799648A (zh) * 2012-06-28 2012-11-28 用友软件股份有限公司 检索装置和检索方法
CN104268298A (zh) * 2014-10-27 2015-01-07 中电海康集团有限公司 一种创建数据库索引及其查询的方法
CN104346359A (zh) * 2013-07-29 2015-02-11 深圳市腾讯计算机系统有限公司 一种存储索引的方法和装置
CN104618410A (zh) * 2013-11-04 2015-05-13 腾讯科技(北京)有限公司 资源推送方法和装置
CN106383688A (zh) * 2016-11-24 2017-02-08 中青冠岳科技(北京)有限公司 基于即时通信软件对公众评论进行分类显示的方法与系统
CN113792195A (zh) * 2021-11-15 2021-12-14 太平金融科技服务(上海)有限公司深圳分公司 跨系统的数据获取方法、装置、计算机设备和存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799648A (zh) * 2012-06-28 2012-11-28 用友软件股份有限公司 检索装置和检索方法
CN104346359A (zh) * 2013-07-29 2015-02-11 深圳市腾讯计算机系统有限公司 一种存储索引的方法和装置
CN104618410A (zh) * 2013-11-04 2015-05-13 腾讯科技(北京)有限公司 资源推送方法和装置
CN104618410B (zh) * 2013-11-04 2019-06-07 腾讯科技(北京)有限公司 资源推送方法和装置
CN104268298A (zh) * 2014-10-27 2015-01-07 中电海康集团有限公司 一种创建数据库索引及其查询的方法
CN104268298B (zh) * 2014-10-27 2018-05-04 中电海康集团有限公司 一种创建数据库索引及其查询的方法
CN106383688A (zh) * 2016-11-24 2017-02-08 中青冠岳科技(北京)有限公司 基于即时通信软件对公众评论进行分类显示的方法与系统
CN113792195A (zh) * 2021-11-15 2021-12-14 太平金融科技服务(上海)有限公司深圳分公司 跨系统的数据获取方法、装置、计算机设备和存储介质
CN113792195B (zh) * 2021-11-15 2022-03-18 太平金融科技服务(上海)有限公司深圳分公司 跨系统的数据获取方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
US8555018B1 (en) Techniques for storing data
CN100430951C (zh) 向用户/组授予访问控制列表所有权的访问控制系统和方法
US7958126B2 (en) Techniques for including collection items in search results
CN101714172B (zh) 一种支持访问控制的索引结构的检索方法
US7464084B2 (en) Method for performing an inexact query transformation in a heterogeneous environment
CN101448002B (zh) 一种数字资源的访问方法及设备
US9043358B2 (en) Enterprise search over private and public data
EP3245569B1 (en) Record level data security
CN105144159A (zh) Hive表链接
CN103348344A (zh) 图形数据的复合语句索引
CN103023982A (zh) 一种云存储客户端的低延迟元数据访问方法
CN103597474A (zh) 对列入访问控制表的文档进行的高效索引和搜索
CN103150320A (zh) 用于电子发布内容的系统和方法
CN103116642A (zh) 电力系统知识管理及应用的调度百科系统
WO2022035613A1 (en) Data exchange availability, listing visibility, and listing fulfillment
CN101963993B (zh) 一种数据库单表记录快速查找的方法
CN111177700A (zh) 行级权限的控制方法及装置
JP4031264B2 (ja) フィルタリング管理方法、フィルタリング管理プログラム、フィルタリング装置のフィルタリング管理方法、およびフィルタリング装置用フィルタリング管理プログラム
Sarkar et al. Query language support for timely data deletion
CN101221584A (zh) 搜索引擎、搜索方法和系统
EP0910828B1 (en) Storage system and storage method for distributed storage
CN102214214B (zh) 数据关系的处理方法、装置及移动通讯终端
CN103823805A (zh) 基于社区的相关帖推荐系统及推荐方法
EP4083819A1 (en) Sharing of data share metrics to customers
KR20010057067A (ko) 온라인 맞춤 정보의 검색 관리 시스템 및 그 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220620

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: FOUNDER APABI TECHNOLOGY Ltd.

Address before: 100871, Beijing, Haidian District, Cheng Fu Road, No. 298, Zhongguancun Fangzheng building, 5 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: FOUNDER APABI TECHNOLOGY Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161214

CF01 Termination of patent right due to non-payment of annual fee