CN102262633A - 一种面向全文检索的结构化数据安全检索方法 - Google Patents

一种面向全文检索的结构化数据安全检索方法 Download PDF

Info

Publication number
CN102262633A
CN102262633A CN2010101890017A CN201010189001A CN102262633A CN 102262633 A CN102262633 A CN 102262633A CN 2010101890017 A CN2010101890017 A CN 2010101890017A CN 201010189001 A CN201010189001 A CN 201010189001A CN 102262633 A CN102262633 A CN 102262633A
Authority
CN
China
Prior art keywords
business datum
guid
retrieval
user
access control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010101890017A
Other languages
English (en)
Other versions
CN102262633B (zh
Inventor
吴余龙
秦林勇
沈启星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Lilong information Polytron Technologies Inc
Original Assignee
WUHAN LILO SOFT CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUHAN LILO SOFT CO Ltd filed Critical WUHAN LILO SOFT CO Ltd
Priority to CN2010101890017A priority Critical patent/CN102262633B/zh
Publication of CN102262633A publication Critical patent/CN102262633A/zh
Application granted granted Critical
Publication of CN102262633B publication Critical patent/CN102262633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

一种面向全文检索的结构化数据安全检索方法,包括a)根据检索用户提供的关键词在索引中提取检索记录;b)从所述检索记录中取出一条业务数据的内容和GUID,并获取当前检索用户的GUID;c)将取出的业务数据的GUID与数据访问控制表中业务数据的GUID进行匹配;d)将当前检索用户的GUID与数据访问控制表中匹配成功的业务数据对应的用户GUID进行匹配,若匹配成功则将该业务数据放在检索结果中,若匹配不成功则删除检索记录中的该条业务数据;e)判断检索记录中是否还有业务数据,如果判断结果为是则返回步骤b)。本发明提供的检索方法使得业务数据权限发生变化不必变更索引也可实现安全检索,可大大提高检索的方便性。

Description

一种面向全文检索的结构化数据安全检索方法
技术领域
本发明涉及计算机搜索引擎信息检索技术领域,具体是一种面向全文检索的结构化数据安全检索方法。
背景技术
当前随着政府信息化的不断发展,其业务数据也成海量形式增长,全文检索在政府信息化中的应用日趋广泛。然而这些业务信息都以数据库为媒介存储,同时业务数据本身在类型和访问权限也上才存在差异,如公文、通知公告、会议纪要以及通讯录等信息,不同的用户群体对业务数据拥有不同的访问权限。以会议纪要为例,只有上级领导和指定人员才能接触到这些数据,其他人员无权访问,因此全文检索系统需要具有按约束条件检索某些信息来实现安全检索。
目前各类全文检索系统也提供了安全检索的功能,其解决方案为:
全文检索系统通常由信息抓取、分词、索引和检索四个部分构成,其中索引是对数据重新编排的重要过程,因此实现安全检索可通过将数据的权限、分级等约束条件同时记录到索引中,当用户检索信息时,根据用户所属的权限从索引中提取相应的数据。
大多数全文检索系统采用上述方法来实现安全检索,这种将数据约束条件写入索引的方式尽管能解决安全性的问题,然而一旦数据的约束条件发生变化,索引也要随之更改。众所周知,一旦索引建成后在一定时间段内是不会变更的,同时用户在检索的过程中也不允许索引发生改变。如果业务数据A的约束条件发生变化,例如将之前具有访问权限的用户B设置为不能访问,这样在短时间内如果不具访问权限的用户B进行检索,由于业务数据A的约束条件并不能立即在索引中体现,这样导致不具备访问权限的用户B依然会检索到业务数据A并且访问,导致数据泄漏或者其他不安全问题的发生。
发明内容
本发明提供一种面向全文检索的结构化数据安全检索方法,可在业务数据的约束条件发生变化时,在不变更索引的情况下保证检索的安全性。
本发明提供一种面向全文检索的结构化数据安全检索方法,包括
a)根据检索用户提供的关键词在索引中提取检索记录,所述检索记录包括业务数据的内容和全球唯一标识符(Globally UniqueIdentifier,GUID);
b)从所述检索记录中取出一条业务数据的内容和GUID,并获取当前检索用户的GUID;
c)将取出的业务数据的GUID与数据访问控制表中业务数据的GUID进行匹配,若匹配成功表明该业务数据设置有访问权限,所述数据访问控制表包括业务数据的GUID、与业务数据的GUID对应的用户GUID及约束条件;
d)将当前检索用户的GUID与数据访问控制表中匹配成功的业务数据对应的用户GUID进行匹配,若匹配成功则将该业务数据放在检索结果中;若匹配不成功则删除检索记录中的该条业务数据;
e)判断检索记录中是否还有业务数据,如果判断结果为是则返回步骤b),如果判断结果为否则结束流程。
本发明提供的检索方法通过在数据库中设置数据访问控制表,将根据关键词在索引中提取的初步检索记录在数据访问控制表中作进一步筛选,将与数据访问控制表匹配的检索结果呈现给当前检索用户,若匹配不成功则删除检索记录中的该条业务数据,这样业务数据权限的变更可通过数据访问控制表进行实时变更,业务数据的权限的变化不对全文检索的索引产生影响,即业务数据权限的变化不必变更索引也可实现安全检索,可大大提高检索的方便性。
附图说明
图1是本发明面向全文检索的结构化数据安全检索方法的流程示意图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述。
图1所示为本发明面向全文检索的结构化数据安全检索方法的流程示意图,包括如下步骤:
步骤1:在数据库中建立数据访问控制表,所述数据访问控制表包括业务数据的GUID、与业务数据的GUID对应的用户GUID及约束条件,所述约束条件是业务数据对应的用户对于业务数据的访问权限,例如读权限、写权限、下载权限等。业务数据包括公文、通知公告、会议纪要以及通讯录等一系列业务数据资源,通过结构化数据记录方式可将上述数据存储在数据库中。不同类型的业务数据存储在不同的数据表中,数据表包含业务数据的GUID、业务数据内容等信息。
假设“关于xxx的通知”为业务数据DataA,如果业务数据DataA是带权限的数据,且与业务数据DataA对应的有3个具有访问权限的用户,建立的数据访问控制表的形式如下:
DataA的GUID;
对于A用户(A用户GUID),对DataA可读;
对于B用户(B用户GUID),对DataA可读、可写;
对于C用户(C用户GUID),对DataA可读、可下载;
类似地,对于其他需要设置访问权限的业务数据也可根据上述形式设置,最终对所有需要设置访问权限的业务数据业务数据在数据库中建立数据访问控制表。
步骤2:根据检索用户提供的关键词在索引中提取检索记录,所述检索记录包括业务数据的内容和GUID。
其中索引是利用全文检索系统将整合后的业务数据通过索引器建立的,包括对数据进行预处理分词、建立索引文件等,全文检索中的索引创建过程不属于本发明所阐述的范围,在此不再详细叙述;索引应包含业务数据在数据库中对应的GUID、数据内容和时间等基础数据。用户提供关键词后,根据关键词在预先建立的索引中提取检索记录,所述检索记录为检索到的业务数据在索引中的一部分基础数据,例如业务数据的内容和GUID。
步骤3:从所述检索记录中取出一条业务数据的内容和GUID,并获取当前检索用户的GUID。
步骤2中的检索记录是根据关键词得到的一个初步的检索结果,其还不能立即显示给检索用户,还需要进一步与步骤1中建立的数据访问控制表作进一步地匹配和筛选。具体的,从步骤2的检索记录中取出一条业务数据,同时获取当前发出检索请求的用户的GUID。因为检索记录中的每条记录包括业务数据的内容及该业务数据的GUID,所以从检索记录中取出的这条业务数据也包含该条业务数据的内容和GUID。具体选取的方式可是是顺序选取,也可以是随机选取,在此不做限定。
步骤4:将取出的业务数据的GUID与所述数据访问控制表中业务数据的GUID进行匹配,若匹配成功则表明该业务数据设置有访问权限。
具体的,将取出的业务数据的GUID与步骤1建立的数据访问控制表中所有业务数据的GUID进行匹配,若匹配成功则表示该业务数据设置有访问权限,即该业务数据是需要有相关权限的用户才可以访问的,如果匹配不成功则表明据访问控制表没有对该业务数据进行访问限制,可以不做处理。假设取出的业务数据为“关于xxx的通知”的DataA,因为数据访问控制表中存在DataA的GUID,因此从检索记录中取出的业务数据DataA的GUID可以在数据访问控制表中找到匹配的GUID。
步骤5:将当前检索用户的GUID与数据访问控制表中匹配成功的业务数据对应的用户GUID进行匹配,若匹配成功则将该业务数据放在检索结果中;若匹配不成功则删除检索记录中的该条业务数据。
假设当前发出检索请求的为用户A,根据步骤1中数据访问控制表的描述,用户A对于DataA具有可读权限,因此当前检索用户A的GUID与数据访问控制表中DataA对应的用户是可以匹配成功的,此时表明当前检索的用户可以对DataA进行访问,然后将该业务数据A放在检索结果中,检索结果现在可以呈现给用户显示,例如业务数据DataA的内容就可呈现给用户A显示,由于设置给用户A的为读权限,用户A可以浏览整个业务数据DataA的内容。如果当前检索用户为D,因为数据访问控制表中DataA没有对用户D设置权限,说明用户D不具备对DataA的访问权限,此时用户D的GUID与数据访问控制表中DataA对应用户的GUID匹配就不成功,因此业务数据DataA并不在最后的检索结果中,并且将DataA从检索记录中删除,由此可实现安全检索的目的。
步骤6:判断检索记录中是否还有业务数据,如果判断结果为是,则表明检索记录中还有业务数据,返回步骤3进行下一轮的匹配和筛选;如果判断结果为否,则表明检索记录中所有的业务数据都已经过数据访问控制表的筛选,可以结束整个检索流程。
在实际应用过程中,如果需要解除某业务数据的访问权限,只需在数据访问控制表中删除该业务数据记录即可,无需再执行其他操作。例如,某领导之前将“关于xxx的通知”的DataA设置为对用户A可读,但是后来发现用户A是另一科室的成员,是不应该访问该业务数据的,现在通过将数据访问控制表业务数据DataA对应的用户A的记录删除,其更改是实时的,在数据访问控制表更改后,用户A下次检索业务数据DataA时,根据前面步骤的描述,在检索结果中就不会出现业务数据DataA的内容了,从而可以对业务数据访问权限进行实时更改,相对于现有技术不需要更改索引即可实现安全检索。
如果需要对某条业务数据添加访问权限,可在数据访问控制表中直接添加该业务数据的访问控制信息,例如授权访问的用户及约束条件等。例如,若现在需要增加用户D对业务数据DataA可读的访问权限,只需要在数据访问控制表中添加如下记录:
DataA的GUID;
对于D用户(D用户GUID),对DataA可读;
即可,下次用户D检索时即可在检索结果中呈现DataA的内容。
相应的,对于某条业务数据约束条件的更改也可实时进行,例如将DataA对于用户A的可读权限修改为可读可下载权限,只需要在数据访问控制表中做如下更改即可:
DataA的GUID;
对于A用户(A用户GUID),对DataA可读、可下载;
相对于之前的检索,检索结果不仅呈现DataA的内容,还提供可下载的文档供用户A下载。
本发明提供的检索方法通过在数据库中设置数据访问控制表,将根据关键词在索引中提取的初步检索记录在数据访问控制表中作进一步筛选,将与数据访问控制表匹配的检索结果呈现给当前检索用户,若匹配不成功则删除检索记录中的该条业务数据,这样业务数据权限的变更可通过数据访问控制表进行实时变更,业务数据的权限的变化不对全文检索的索引产生影响,即业务数据权限的变化不必变更索引也可实现安全检索,可大大提高检索的方便性,业务数据的约束条件的变化对用户来说是透明的,也是实时的,可达到所见即所得的效果。
可以理解的是,本发明的安全检索方法在普通检索领域也可以适用,并不限定在全文检索领域。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (3)

1.一种面向全文检索的结构化数据安全检索方法,其特征在于:包括
a)根据检索用户提供的关键词在索引中提取检索记录,所述检索记录包括业务数据的内容和全球唯一标识符(Globally UniqueIdentifier,GUID);
b)从所述检索记录中取出一条业务数据的内容和GUID,并获取当前检索用户的GUID;
c)将取出的业务数据的GUID与数据访问控制表中业务数据的GUID进行匹配,若匹配成功表明该业务数据设置有访问权限,所述数据访问控制表包括业务数据的GUID、与业务数据的GUID对应的用户GUID及约束条件;
d)将当前检索用户的GUID与数据访问控制表中匹配成功的业务数据对应的用户GUID进行匹配,若匹配成功则将该业务数据放在检索结果中;若匹配不成功则删除检索记录中的该条业务数据;
e)判断检索记录中是否还有业务数据,如果判断结果为是则返回步骤b),如果判断结果为否则结束流程。
2.如权利要求1所述的检索方法,其特征在于:在步骤b)之前还包括步骤:
a)在数据库中建立所述数据访问控制表。
3.如权利要求1所述的检索方法,其特征在于:所述约束条件是业务数据对应的用户对于业务数据的访问权限。
CN2010101890017A 2010-05-27 2010-05-27 一种面向全文检索的结构化数据安全检索方法 Active CN102262633B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101890017A CN102262633B (zh) 2010-05-27 2010-05-27 一种面向全文检索的结构化数据安全检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101890017A CN102262633B (zh) 2010-05-27 2010-05-27 一种面向全文检索的结构化数据安全检索方法

Publications (2)

Publication Number Publication Date
CN102262633A true CN102262633A (zh) 2011-11-30
CN102262633B CN102262633B (zh) 2012-11-28

Family

ID=45009263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101890017A Active CN102262633B (zh) 2010-05-27 2010-05-27 一种面向全文检索的结构化数据安全检索方法

Country Status (1)

Country Link
CN (1) CN102262633B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102790651A (zh) * 2012-06-19 2012-11-21 杭州联汇数字科技有限公司 一种传统广播和多媒体内容同步播放系统及方法
CN102968501A (zh) * 2012-12-07 2013-03-13 福建亿榕信息技术有限公司 一种通用的全文搜索方法
CN103823902A (zh) * 2014-03-18 2014-05-28 南京新模式软件集成有限公司 一种电子文件安全检索的方法
CN104376067A (zh) * 2014-11-13 2015-02-25 北京海泰方圆科技有限公司 一种索引文件的录入和基于该索引文件的检索方法
CN105340240A (zh) * 2013-01-29 2016-02-17 惠普发展公司,有限责任合伙企业 用于共享文件存储的方法和系统
CN105516361A (zh) * 2016-01-21 2016-04-20 韩松 一种基于移动终端的远程监控系统和方法
CN110968602A (zh) * 2019-11-29 2020-04-07 曙光信息产业股份有限公司 一种数据的查询方法、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010007128A1 (en) * 1999-12-22 2001-07-05 International Business Machines Corporation Security mechanism providing access control for locally-held data
CN1932816A (zh) * 2006-09-30 2007-03-21 华中科技大学 基于密文的全文检索系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010007128A1 (en) * 1999-12-22 2001-07-05 International Business Machines Corporation Security mechanism providing access control for locally-held data
CN1932816A (zh) * 2006-09-30 2007-03-21 华中科技大学 基于密文的全文检索系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102790651A (zh) * 2012-06-19 2012-11-21 杭州联汇数字科技有限公司 一种传统广播和多媒体内容同步播放系统及方法
CN102790651B (zh) * 2012-06-19 2015-06-24 杭州联汇数字科技有限公司 一种传统广播和多媒体内容同步播放系统及方法
CN102968501A (zh) * 2012-12-07 2013-03-13 福建亿榕信息技术有限公司 一种通用的全文搜索方法
CN102968501B (zh) * 2012-12-07 2016-02-17 福建亿榕信息技术有限公司 一种通用的全文搜索方法
CN105340240A (zh) * 2013-01-29 2016-02-17 惠普发展公司,有限责任合伙企业 用于共享文件存储的方法和系统
CN103823902A (zh) * 2014-03-18 2014-05-28 南京新模式软件集成有限公司 一种电子文件安全检索的方法
CN104376067A (zh) * 2014-11-13 2015-02-25 北京海泰方圆科技有限公司 一种索引文件的录入和基于该索引文件的检索方法
CN104376067B (zh) * 2014-11-13 2018-07-20 北京海泰方圆科技股份有限公司 一种索引文件的录入和基于该索引文件的检索方法
CN105516361A (zh) * 2016-01-21 2016-04-20 韩松 一种基于移动终端的远程监控系统和方法
CN110968602A (zh) * 2019-11-29 2020-04-07 曙光信息产业股份有限公司 一种数据的查询方法、装置及存储介质

Also Published As

Publication number Publication date
CN102262633B (zh) 2012-11-28

Similar Documents

Publication Publication Date Title
CN102262633B (zh) 一种面向全文检索的结构化数据安全检索方法
EP3788533B1 (en) Protecting personally identifiable information (pii) using tagging and persistence of pii
US9223817B2 (en) Virtual repository management
CN101218590B (zh) 处理源自不同后台仓库的对文档的搜索请求的方法和系统
US8548997B1 (en) Discovery information management system
CN102521734B (zh) 在基于对话的电子邮件系统中显示扩展的消息
CN102027471B (zh) 改进的搜索引擎
US20130283231A1 (en) Method and System for Compiling a Unique Sample Code for an Existing Digital Sample
JP2010529554A5 (zh)
KR20130067304A (ko) 개인 메타데이터를 처리하기 위한 방법
CN105468785A (zh) 一种计算机文件管理方法
CN101963993B (zh) 一种数据库单表记录快速查找的方法
US8639707B2 (en) Retrieval device, retrieval system, retrieval method, and computer program for retrieving a document file stored in a storage device
US8819048B1 (en) Virtual repository management to provide retention management services
CN102073805A (zh) 计算机系统及内容管理方法
JP4807364B2 (ja) 情報管理装置
JP5783010B2 (ja) インデックス管理プログラム、インデックス管理装置及び検索システム
JP5017405B2 (ja) 規程管理装置及びプログラム
JP2007065778A (ja) 文書管理システム
WO2013184563A2 (en) Systems and methods for providing context search filtering
WO2022249259A1 (ja) 検索方法、検索プログラム、および情報処理装置
JP2007058457A (ja) 電子メールのアドレス帳共有システム及びその方法
CN111400556A (zh) 数据查询方法及装置、计算机设备、存储介质
CN117235010A (zh) 一种招投标文档图表标题分类管理方法和系统
KR100737646B1 (ko) 전자 메일의 주소장 공유 시스템 및 그 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: WUHAN LILOSOFT INFORMATION TECHNOLOGY CO., LTD.

Free format text: FORMER NAME: WUHAN LILO SOFT CO., LTD.

CP03 Change of name, title or address

Address after: Jiang Road, Hubei province 430023 Jianghan Jianghan District of Wuhan City Economic Development Zone No. 6 Phoenix cloud base 3 building 302 room

Patentee after: Wuhan Lilong information Polytron Technologies Inc

Address before: Jiang Xing Lu 430023 Hubei province Jianghan District of Wuhan City No. 6 Building No. four 5-6

Patentee before: Wuhan Lilo Soft Co., Ltd.