CN102968501B - 一种通用的全文搜索方法 - Google Patents
一种通用的全文搜索方法 Download PDFInfo
- Publication number
- CN102968501B CN102968501B CN201210525753.5A CN201210525753A CN102968501B CN 102968501 B CN102968501 B CN 102968501B CN 201210525753 A CN201210525753 A CN 201210525753A CN 102968501 B CN102968501 B CN 102968501B
- Authority
- CN
- China
- Prior art keywords
- search
- data
- user
- file
- operation system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000013475 authorization Methods 0.000 claims abstract description 44
- 238000002360 preparation method Methods 0.000 claims abstract description 6
- 230000001960 triggered effect Effects 0.000 claims abstract description 4
- 238000001914 filtration Methods 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 4
- 230000009897 systematic effect Effects 0.000 abstract description 2
- 238000007726 management method Methods 0.000 description 21
- 230000008859 change Effects 0.000 description 10
- 230000007547 defect Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000002195 synergetic effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Abstract
本发明提供一种通用的全文搜索方法,包括数据准备阶段:以业务系统作为分类条件建立多个分类信息数据表,各分类信息数据表之间两两设置关联描述字段;索引创建阶段:业务系统提交电子文件到电子文件管理平台时,将触发该电子文件管理平台的索引创建装置,开始抽取电子文件内容,并分别建立该电子文件的元数据索引库和内容索引库,并建立元数据索引库和内容索引库的关联关系,通过元数据索引库进行访问授权控制;数据搜索阶段:通过所述分类信息数据表及其关联描述字段对分类检索进行授权控制和用户认证。从而实现了在同一个系统中可以灵活设置搜索访问权限,满足了多种方式的授权访问控制要求,可以实现用户对不需要授权的文件的访问。
Description
【技术领域】
本发明涉及一种全文搜索方法。
【背景技术】
随着企业信息化建设的逐步深入和发展,企业中存在大量的结构化数据(指存储在关系型数据库中,可以用二维表结构来表达的数据类型)和非结构化数据(或叫电子文件,与结构化数据相比,不便于采用二维表结构来表达的数据类型即称为非结构化数据,可包括各种主流格式的办公文档、图片、XML、HTML、各类报表、图像和音频)。其中70%的数据都是非结构化数据,现在越来越多的企业中的非结构化数据都是采用集中存储的方式,也就是将各业务系统的电子文件数据集中存在的一个平台上,如:将ERP(EnterpriseResourcePlanning企业资源计划系统)系统的合同、人资、协同办公系统的公文集中存储在同一个非结构化管理平台,这些资源中包含有大量有益于企业提升综合效益的信息,都是企业的重要资产。这些电子文件通常都有密级要求,也就是说并非企业中的所有用户都有权访问这些电子文件,只有部分用户才能接触到该电子文件。
鉴于以上问题,搜索引擎搜索存储在同一平台的电子文件,通过有效的资源控制手段,保证授权资源电子文件的访问控制和检索需求,这样才能保证密级电子文件的存储安全,同时又不影响授权用户的访问要求。目前业内主要通过如下几种方法来实现这种权限访问控制:
1、由业务系统本身依据登录的权限进行判断:也就是只要有权限登录系统,就有权限访问搜索到的任何信息,因此所有的用户都有可能看到授权范围以外的信息,故本方法存在较大的缺陷和不足。
2.通过分类条件过滤方法来实现对搜索数据的访问控制:建立统一的信息分类体系,并对所有数据进行分类标注,数据的检索及授权都基于这一分类体系,可以提前为用户指定其可以访问的数据分类范围,在获得用户提交的检索请求后,根据用户的授权范围,对检索条件中指定的分类条件进行过滤,确保检索操作被限定在用户授权的范围内。但本方法对访问控制的最小单位是数据分类,无法实现基于单条数据记录级别的访问控制。如公开日为2008.07.16,公开号为CN101221584,申请号为200810057417.6的中国发明揭示了一种“搜索引擎、搜索方法和系统”,一方面提供一种搜索引擎,包括:访问控制单元,用于根据用户信息确定搜索范围;搜索单元,用于根据所述搜索范围进行搜索。相应地提供一种搜索方法,包括如下步骤:根据用户信息确定搜索范围;根据所述搜索范围进行搜索。并且还提供一种搜索系统,包括资源库系统,还包括访问控制单元,用于根据用户信息确定搜索范围;搜索引擎,用于根据所述搜索范围对所述资源库系统进行搜索。其是使用分类方法对授权对象进行分类,然后给用户定义授权分类,用户只能检索分类中的授权对象,但无法解决细粒度、记录集的授权。
3.采用对搜索结果集进行过滤的控制方法:即在检索操作完成后对搜索结果进行过滤的一种控制方法。具体为在获取检索结果集后,对其中的数据逐条进行授权判断,只返回用户授权范围内的结果数据。采用本方法是,只有对结果集内所有的数据都完成授权判断后,才能计算出本次检索有效的命中结果数。当结果集较大时,完成对所有结果的授权判断将成为制约检索性能的瓶颈。如公开日为2011.11.30,公开号为CN102262633A,申请号为201010189001.7的中国发明一种面向全文检索的结构化数据安全检索方法,包括a)根据检索用户提供的关键词在索引中提取检索记录;b)从所述检索记录中取出一条业务数据的内容和GUID,并获取当前检索用户的GUID;c)将取出的业务数据的GUID与数据访问控制表中业务数据的GUID进行匹配;d)将当前检索用户的GUID与数据访问控制表中匹配成功的业务数据对应的用户GUID进行匹配,若匹配成功则将该业务数据放在检索结果中,若匹配不成功则删除检索记录中的该条业务数据;e)判断检索记录中是否还有业务数据,如果判断结果为是则返回步骤b)。该发明提供的检索方法使得业务数据权限发生变化不必变更索引也可实现安全检索,可大大提高检索的方便性。但其采用对结果集的过滤控制方法,将所有授权数据创建唯一的GUID,再将GUID授权给用户,建立授权列表;然后与通过搜索引擎检索出的结果进行比较,如果搜索出的记录GUID存在在授权列表中,就判定为有权访问的记录,否则则删除该搜索记录。该方法的一个较大的缺陷就是当检索数据较大时,会严重影响搜索性能。
4.通过扩充检索条件的方法:即在检索条件中增加用户相关的属性,再通过这些属性过滤掉授权范围外的数据,用户的属性可以是用户名、所属用户组、被授予的角色等。对数据的存储结构进行修改,增加字段来存储被授权访问此数据的用户范围。在创建索引的过程,将授权信息和数据一起创建索引,然后在检索过程中,将用户属性设置为扩展的检索条件,并于授权字段的内容进行比较,从而实现对内容的授权访问。由于检索条件扩充方法将授权信息与数据信息存储在一起,如果进行频繁的授权更新,可能引起较大量的数据更新操作。同时在索引更新过程中,也会导致授权被访问的现象。无法保证全文检索电子文件授权信息的实时性的要求。如申请号为:200710052025.6的中国发明一种基于访问控制的安全搜索引擎系统,包括数据库服务器、单点登录模块、用户信息描述模块、爬行器模块、查询检索模块和索引库。系统根据资源安全级别对用户信息进行描述;爬行器获取爬行受控资源的权限并采集受安全控制的资源内容;按照用户的查询关键字以及用户的安全等级返回对应的可访问的资源列表;由于不同用户在不同网站上具有不同的权限,搜索引擎根据单点登录信息获取用户的身份信息,并使其能够在访问检索结果资源时不再需要登录操作。本发明通过用户信息描述建立受控资源内容索引,根据用户身份实现个性化的网络搜索引擎,并简化用户访问搜索结果的过程,使搜索引擎返回的结果不仅具有极强的针对性,而且安全控制严格,用户操作简便。
又如申请号为200910087250.2的中国发明提供了搜索引擎系统,包括:索引数据库,用于储存数据索引信息,供搜索引擎使用;权限映射信息装置,通过权限有关非交互接口连接至业务系统,储存权限映射信息;搜索规则配置装置,用于配置搜索规则;搜索引擎,通过权限无关非交互接口与业务系统连接,有选择地监听业务系统的业务数据变更事件,权限无关非交互接口用于处理业务数据变更事件,搜索引擎工作时读取权限映射信息和所述搜索规则,在所述业务系统发生业务数据变更事件时,所述搜索引擎判断是否引起数据索引变化,如果结果为是,则获取与所述数据索引变化相关的数据变更列表,并产生新的虚拟变更列表。根据本发明的搜索引擎系统改善了传统ERP查询在用户输入上的交互特性。
再如申请号为201110178557.0的中国发明公开了一种基于实时权限控制的企业管理软件搜索引擎集成方法,属于管理软件业务数据搜索领域。该方法分为关键字索引和关键字搜索两个阶段:在关键字索引时搜索引擎将通用维度信息爬取到索引条目的属性中;在关键字搜索时管理软件系统中操作用户与搜索引擎中的用户会话绑定,对关键字的搜索请求连同所属通用维度信息一并传入搜索引擎,搜索引擎通过关键字及通用维度信息先对搜索结果进行第一次过滤,对于返回的结果调用管理软件权限过滤服务进行实时过滤。与现有技术相比,本发明的基于实时权限控制的企业管理软件搜索引擎集成方法具有安全、实时、高效的特点。
上述三个发明均是通过在检索条件中扩展字段属性,扩展字段被索引构造器构建到索引中,当用户通过关键字进行检索时,将用户的授权扩展字段做为检索条件,通过这些属性过滤掉授权范围外的数据。该方法在用户授权字段的条件发生变化时,需要重新构建索引,而在重新构建索引时,如果这是用户检索该数据时,无法保证被授权的数据不会被访问,且频繁的构建索引在大数据量的情况下,将严重影响性能。
综上所述,不管是独立采用哪种方法都存在不同的缺陷,分类条件过滤方法综合性能表现较好,但其无法实现基于记录级别的访问控制,这影响了其在授权访问控制较严格的场景下应用。结果集过滤和检索条件扩充方法都可以实现基于记录级的访问控制。结果集过滤法在关键词检索时性能较好,但较易受到授权比例等因素的影响。检索条件扩充方法在全文检索中具有较好的性能表现,但在重建索引过程中将出现访问控制的真空期。
【发明内容】
本发明要解决的技术问题,在于提供一种通用的全文搜索方法,通过改进各种检索方法,实现基于记录级的访问控制的全文检索技术。
本发明是这样实现的:一种通用的全文搜索方法,包括
步骤10、数据准备阶段:以业务系统作为分类条件建立多个分类信息数据表,各分类信息数据表之间两两设置关联描述字段;该分类信息数据表包括:
业务系统注册表AppTable,包括业务系统AppID、业务系统编号AppCode、业务系统名称AppName以及业务系统IP地址的描述字段;
分类用户信息表AppUserTable,包括用户UserID、用户编号UserCode、用户名称UserName以及业务系统编号AppCode的描述字段;
用户角色信息表UserRole,包括角色RoleID、角色名称RoleName、用户编号UserCode以及UserID的描述字段;
角色授权文档表RoleFile,包括RoleID、角色名称RoleName以及文件名称File的描述字段;
步骤20、索引创建阶段:业务系统提交电子文件到电子文件管理平台时,将触发该电子文件管理平台的索引创建装置,开始抽取电子文件内容,并分别建立该电子文件的元数据索引库和内容索引库,以及建立元数据索引库和内容索引库的关联关系,通过元数据索引库进行访问授权控制;所述电子文件元数据包含用户编号UserCode、角色RoleID、文件名称File、业务系统编号AppCode;
步骤30、数据搜索阶段:具体包括:
步骤31、提出搜索请求,并提交IP地址、用户编号及搜索条件;
步骤32、依据用户编号从分类用户信息表AppUserTable获取AppCode;
步骤33、判断用户是否为直接用户,若是,则添加搜索条件项Permission=N,将搜索条件提交到搜索引擎,进行检索,并返回搜索结果后结束;若否,则依据AppCode查询业务系统注册表AppTable的IP地址,搜索系统检测搜索请求的IP地址,进入下一步骤;所述直接用户为可以通过电子文件管理平台提供的搜索界面直接搜索数据的用户;
步骤34、判断搜索请求的IP地址是否与业务系统注册表AppTable的IP地址一致,若否,则结束;若是,则限制搜索范围为指定的AppCode;
步骤35、依据用户编号查询用户角色信息表UserRole的RoleName;
步骤36、判断是否查询到RoleName,若否,则指定AppCode、搜索条件,提交搜索引擎,进行检索查询,并直接返回搜索结果后结束;若是,则指定AppCode、RoleName、搜索条件提交搜索引擎,进行检索查询,并返回搜索结果,然后进入下一步骤;
步骤37、检测对应的角色授权是否发生变化,并在索引重建中,若否,直接返回搜索结果后结束;若是,则进入下一步骤;
步骤38、查询角色授权文档表RoleFile对应的File,过滤搜索结果,如果搜索结果列表中的文件在RoleFile定义的集合中,则为授权访问的文件,然后授权搜索结果数据后结束。
进一步的,所述AppID为空表示用户为直接用户而非业务系统用户;所述步骤33中的判断用户是否为直接用户即判断AppID是否为空。
进一步的,如果电子文件管理平台的直接用户搜索数据,则搜索条件构造装置将会自动新增构造搜索条件Permission=N,如果为授权用户搜索数据,则搜索条件构造装置不会增加搜索条件Permission字段的任何信息,代表该用户有权访问所有数据,授权数据的过滤由其他条件加以过滤。
本发明具有如下优点:本发明实现了一种通用的搜索授权方式,在同一个系统中可以灵活设置搜索访问权限,满足了多种方式的授权访问控制要求,可以实现用户对不需要授权的文件的访问,同时也可以通过分类授权的方式满足多业务系统同时存储在同一个平台下的搜索请求。通过角色授权的字段扩展的方式满足了记录集授权搜索的访问控制,也解决了在重新授权的情况下,出现非授权用户访问授权数据的缺陷。本发明可以部署在一个业务系统下的搜索,也可以满足多业务系统同时使用的要求。
【附图说明】
下面参照附图结合实施例对本发明作进一步的说明。
图1为本发明方法系统架构图。
图2为本发明方法整体流程图。
图3为本发明方法索引创建阶段流程图。
图4为本发明方法数据搜索阶段一实施例的具体流程图。
【具体实施方式】
如图1所示,本发明的系统中,包括一电文件管理平台、内容抽取器、内容库、索引创建装置、索引库、搜索引擎、搜索条件构造装置、认证模块、结果集过滤装置以及授权安全装置,所有的业务系统都将其电子文件集成存储在电子文件管理平台中,业务系统(如:协同办公、ERP等)不再继续存储电子文件;电子文件管理平台对外提供搜索服务,该服务不仅仅提供给业务系统的用户使用,同时电子文件管理平台也开发搜索服务给直接用户(即可以通过电子文件管理平台提供的搜索界面直接搜索数据)。由于电子文件进行集中的管理,所以需要对数据进行分类管理,如协同办公的用户,无法检索到ERP或其他业务系统的电子文件;协同办公系统内部的电子文件也需要进行隔离访问授权控制(如:研发部门不能访问财务部门的公文)。电子文件管理平台的直接用户又可以访问协同办公的开放部分的数据,如公司的通知、发文等。内容抽取器把存储在电子文件管理平台的电子文件的内容抽取为可识别的文本内容,然后按业务系统为分类条件建立内容库,然后通过索引创建装置创建索引库,搜索引擎通过索引库建设用户提交的搜索请求并返回搜索结果。
如图2至图4所示,本发明的通用的全文搜索方法,包括
步骤10、数据准备阶段:以业务系统作为分类条件建立多个分类信息数据表,各分类信息数据表之间两两设置关联描述字段;该分类信息数据表包括:
业务系统注册表AppTable,包括业务系统AppID、业务系统编号AppCode、业务系统名称AppName以及业务系统IP地址的描述字段;其构成可表示为下表:
分类用户信息表AppUserTable,包括用户UserID、用户编号UserCode、用户名称UserName以及业务系统编号AppCode的描述字段;其构成可表示为下表:
用户角色信息表UserRole,包括RoleID、角色名称RoleName、用户编号UserCode以及UserID的描述字段;其构成可表示为下表:
角色授权文档表RoleFile,包括RoleID、角色名称RoleName以及File的描述字段;针对每一个存储在电子文件平台的文件建立,其构成可表示为下表:
步骤20、索引创建阶段:如图3所示,业务系统提交电子文件到电子文件管理平台时,将触发索引创建装置,开始抽取电子文件内容,并分别建立该电子文件的元数据索引库和内容索引库,并建立元数据索引库和内容索引库的关联关系,通过元数据索引库进行访问授权控制;所述电子文件元数据包含用户编号UserCode、角色RoleID、文件名称File、业务系统编号AppCode;业务系统提交电子文件元数据,授权安全装置将电子文件元数据中的角色RoleID、文件名称等,自动维护进数据准备阶段的角色授权文档表。通过元数据索引库进行访问授权控制是因为电子文件和元数据是对应关联的,也就是说每个电子文件都有其对应的元数据,所以可以在业务系统在提交电子文件给电子文件管理平台时,将自身要控制的权限信息(如用户名、部门名称等)提交到电子文件管理平台,电子文件管理平台对元数据创建索引,在业务系统提交搜索请求时,通过搜索引擎先搜索元数据索引库,是否有权限访问,然后再检索内容库。
步骤30、数据搜索阶段:通过所述分类信息数据表及其关联描述字段对分类检索进行授权控制和用户认证。该数据搜索阶段通过对前期的数据的准备和维护,以及对存储在电子文件管理平台中的电子文件进行内容抽取、创建索引,电子文件管理平台已经具备搜索基础。业务应用系统提交搜索请求,平台先使用应用编号,校验访问用户类型,然后构造搜索条件。平台提取业务的标识信息(如在具体实施例中可采用名称为角色名),提交搜索引擎搜索检索内容,平台检测标识信息是否变动,如果有变动,则启动结果集过滤装置开始过滤搜索内容,访问搜索结果。
如图4所示,该阶段的一实施例具体包括:
步骤31、提出搜索请求,并提交IP地址、用户编号及搜索条件;
步骤32、依据用户编号从分类用户信息表AppUserTable获取AppCode;
步骤33、判断用户是否为直接用户,若是,则添加搜索条件项Permission=N,将搜索条件提交到搜索引擎,进行检索,并返回搜索结果后结束;若否,则依据AppCode查询业务系统注册表AppTable的IP地址,搜索系统检测搜索请求的IP地址,进入下一步骤;
步骤34、判断搜索请求的IP地址是否与业务系统注册表AppTable的IP地址一致,若否,则结束;若是,则限制搜索范围为指定的AppCode;
步骤35、依据用户编号查询用户角色信息表UserRole的RoleName;
步骤36、判断是否查询到RoleName,若否,则指定AppCode、搜索条件,提交搜索引擎,进行检索查询,并直接返回搜索结果后结束;若是,则指定AppCode、RoleName、搜索条件提交搜索引擎,进行检索查询,并返回搜索结果,然后进入下一步骤;
步骤37、检测对应的角色授权是否发生变化,并在索引重建中,若否,直接返回搜索结果后结束;若是,则进入下一步骤;
步骤38、查询角色授权文档表RoleFile对应的File,过滤搜索结果,如果搜索结果列表中的文件在RoleFile定义的集合中,则为授权访问的文件,然后授权搜索结果数据后结束。
其中,本实施例是采用所述AppID为空来表示用户为直接用户而非业务系统用户;由此,所述步骤33中的判断用户是否为直接用户即可通过判断AppID是否为空来实现。
本实施例通过AppCode实现对搜索分类数据的控制,通过RoleName实现对记录集数据的搜索访问控制,通过RoleFile的匹配实现在RoleName授权发生变化的情况下,可以对因授权的真空期无法完成授权的时所产生的非授权用户可以访问授权数据的缺陷进行了有效的规避。本实施例中如果用户无AppCode关联则代表该用户为直接用户,其只能访问无授权的数据。本发明中授权数据和非授权数据,是通过搜索扩展字段进行控制,如有授权的数据则扩展字段标识为“Y”,不需要授权的数据则在扩展字段中标识为“N”,如下表为元数据索引表:
本实施例中如果电子文件管理平台的直接用户搜索数据,则搜索条件构造装置将会自动新增构造搜索条件Permission=N,如果为授权用户搜索数据,则搜索条件构造装置不会增加搜索条件Permission字段的任何信息,代表该用户有权访问所有数据,授权数据的过滤由其他条件加以过滤。
记录级的授权访问控制是通过RoleName进行控制的,如果在UserRole中用户没有定义RoleName则代表该用户不需要记录集的访问控制。当在RoleName发生变化的情况下,如Role1对应的文件File1,当File1被授权给Role2时,在文件File1没有重建索引之前,File1的索引中依然指向Role1的授权,也就是这时User1依然可以访问到该数据,这就是重建索引时的授权真空期。本方案中在File1授权发生变化时,触发授权变化事件,授权变化事件会修正RoleFile中的授权信息,把File1对应的RoleName从Role1变成Role2,当通过RoleName=Role1过滤后的搜索数据依然包含有File1,经过结果集过滤装置,再次进行过滤时表RoleFile中的File1已经是Role2了,发现不是Role1,过滤掉File1,保证授权数据不会被非授权用户所访问,从而修正索引重建阶段的缺陷。因经过了RoleName的过滤,搜索集合的数据也大大减小,极大提升了在结果集大数据量下的访问控制性能效率。
由于本发明中,业务系统的电子文件是集中存储在同一个平台,现行的方案都会因为不同业务系统授权的角色名称相同,而出现业务系统A的数据被业务系统B检索到,导致非授权访问。如业务系统A的用户User1的角色名称为RoleA,电子文件File1,业务系统B的用户User2的角色名称也是RoleA,电子文件File2,现行的方案采用的是扩展字段的方案进行检索记录的过滤,也就是在File1、File2索引中存储RoleA;如下表中的索引记录:
文件 | 索引字段 |
File1 | RoleA |
File2 | RoleA |
但检索条件为Role=RoleA是就可能检索出File1、File2。而本发明对其进行改进,在索引记录中新增索引字段,也就是之前的分类AppCode,如下表:
在上述检索数据时,由于存在分类搜索范围条件AppCode,有效的解决了索引重名导致的非授权用户访问控制失效的问题。极大的提高了搜索的安全性。
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
Claims (3)
1.一种通用的全文搜索方法,其特征在于:包括
步骤10、数据准备阶段:以业务系统作为分类条件建立多个分类信息数据表,各分类信息数据表之间两两设置关联描述字段;该分类信息数据表包括:
业务系统注册表AppTable,包括业务系统AppID、业务系统编号AppCode、业务系统名称AppName以及业务系统IP地址的描述字段;
分类用户信息表AppUserTable,包括用户UserID、用户编号UserCode、用户名称UserName以及业务系统编号AppCode的描述字段;
用户角色信息表UserRole,包括角色RoleID、角色名称RoleName、用户编号UserCode以及UserID的描述字段;
角色授权文档表RoleFile,包括RoleID、角色名称RoleName以及文件名称File的描述字段;
步骤20、索引创建阶段:业务系统提交电子文件到电子文件管理平台时,将触发该电子文件管理平台的索引创建装置,开始抽取电子文件内容,并分别建立该电子文件的元数据索引库和内容索引库,以及建立元数据索引库和内容索引库的关联关系,通过元数据索引库进行访问授权控制;所述电子文件元数据包含用户编号UserCode、角色RoleID、文件名称File、业务系统编号AppCode;
步骤30、数据搜索阶段:具体包括:
步骤31、提出搜索请求,并提交IP地址、用户编号及搜索条件;
步骤32、依据用户编号从分类用户信息表AppUserTable获取AppCode;
步骤33、判断用户是否为直接用户,若是,则添加搜索条件项Permission=N,将搜索条件提交到搜索引擎,进行检索,并返回搜索结果后结束;若否,则依据AppCode查询业务系统注册表AppTable的IP地址,搜索系统检测搜索请求的IP地址,进入下一步骤;所述直接用户为可以通过电子文件管理平台提供的搜索界面直接搜索数据的用户;
步骤34、判断搜索请求的IP地址是否与业务系统注册表AppTable的IP地址一致,若否,则结束;若是,则限制搜索范围为指定的AppCode;
步骤35、依据用户编号查询用户角色信息表UserRole的RoleName;
步骤36、判断是否查询到RoleName,若否,则指定AppCode、搜索条件,提交搜索引擎,进行检索查询,并直接返回搜索结果后结束;若是,则指定AppCode、RoleName、搜索条件提交搜索引擎,进行检索查询,并返回搜索结果,然后进入下一步骤;
步骤37、检测对应的角色授权是否发生变化,并在索引重建中,若否,直接返回搜索结果后结束;若是,则进入下一步骤;
步骤38、查询角色授权文档表RoleFile对应的File,过滤搜索结果,如果搜索结果列表中的文件在RoleFile定义的集合中,则为授权访问的文件,然后授权搜索结果数据后结束。
2.根据权利要求1所述的一种通用的全文搜索方法,其特征在于:所述AppID为空表示用户为直接用户而非业务系统用户;所述步骤33中的判断用户是否为直接用户即判断AppID是否为空。
3.根据权利要求1所述的一种通用的全文搜索方法,其特征在于:如果电子文件管理平台的直接用户搜索数据,则搜索条件构造装置将会自动新增构造搜索条件Permission=N,如果为授权用户搜索数据,则搜索条件构造装置不会增加搜索条件Permission字段的任何信息,代表该用户有权访问所有数据,授权数据的过滤由其他条件加以过滤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210525753.5A CN102968501B (zh) | 2012-12-07 | 2012-12-07 | 一种通用的全文搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210525753.5A CN102968501B (zh) | 2012-12-07 | 2012-12-07 | 一种通用的全文搜索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102968501A CN102968501A (zh) | 2013-03-13 |
CN102968501B true CN102968501B (zh) | 2016-02-17 |
Family
ID=47798639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210525753.5A Active CN102968501B (zh) | 2012-12-07 | 2012-12-07 | 一种通用的全文搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102968501B (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103823902A (zh) * | 2014-03-18 | 2014-05-28 | 南京新模式软件集成有限公司 | 一种电子文件安全检索的方法 |
CN104361066A (zh) * | 2014-11-04 | 2015-02-18 | 福建亿榕信息技术有限公司 | 一种基于权限的非结构化全文检索系统 |
CN104699777B (zh) * | 2015-03-10 | 2019-06-11 | 中国联合网络通信集团有限公司 | 大数据分析挖掘管理面与业务面的关联方法及系统 |
CN106681999B (zh) * | 2015-11-05 | 2021-01-26 | 阿里巴巴集团控股有限公司 | 一种数据表查询方法及设备 |
CN107515878B (zh) * | 2016-06-16 | 2020-12-22 | 苏宁云计算有限公司 | 一种数据索引的管理方法及装置 |
CN107515886B (zh) * | 2016-06-17 | 2020-11-24 | 阿里巴巴集团控股有限公司 | 一种数据表的识别方法、装置和系统 |
CN106203794A (zh) * | 2016-06-30 | 2016-12-07 | 成都生辉电子科技有限公司 | 一种基于大数据处理的客户管理系统 |
CN106407450A (zh) * | 2016-09-30 | 2017-02-15 | 网易(杭州)网络有限公司 | 文件搜索方法及装置 |
CN107862098A (zh) * | 2017-12-21 | 2018-03-30 | 中通服公众信息产业股份有限公司 | 一种基于全文检索的关联对象检索方法 |
CN110008234B (zh) * | 2019-04-11 | 2021-09-24 | 北京百度网讯科技有限公司 | 一种业务数据搜索方法、装置及电子设备 |
CN110147350A (zh) * | 2019-05-22 | 2019-08-20 | 深圳市网心科技有限公司 | 文件查找方法、装置、电子设备及存储介质 |
US11361001B2 (en) * | 2019-06-27 | 2022-06-14 | Sigma Computing, Inc. | Search using data warehouse grants |
CN110968602A (zh) * | 2019-11-29 | 2020-04-07 | 曙光信息产业股份有限公司 | 一种数据的查询方法、装置及存储介质 |
CN111159285B (zh) * | 2019-12-05 | 2023-04-21 | 北京机电工程研究所 | 一种基于分布式索引服务部署的企业跨系统检索方法 |
CN111046131B (zh) * | 2019-12-27 | 2023-09-26 | 杭州依图医疗技术有限公司 | 一种文档处理方法及装置 |
CN114398320A (zh) * | 2020-04-30 | 2022-04-26 | 华为技术有限公司 | 一种分布式数据搜索方法和索引文件的共享方法 |
CN111914066B (zh) * | 2020-08-17 | 2024-02-02 | 山东合天智汇信息技术有限公司 | 多源数据库全局搜索方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101042699A (zh) * | 2007-04-28 | 2007-09-26 | 华中科技大学 | 基于访问控制的安全搜索引擎系统 |
CN101221584A (zh) * | 2008-02-01 | 2008-07-16 | 北大方正集团有限公司 | 搜索引擎、搜索方法和系统 |
CN101576920A (zh) * | 2009-06-19 | 2009-11-11 | 用友软件股份有限公司 | 搜索引擎系统 |
CN102214235A (zh) * | 2011-06-29 | 2011-10-12 | 浪潮集团山东通用软件有限公司 | 一种基于实时权限控制的企业管理软件搜索引擎集成方法 |
CN102262633A (zh) * | 2010-05-27 | 2011-11-30 | 武汉力龙数码信息科技有限公司 | 一种面向全文检索的结构化数据安全检索方法 |
-
2012
- 2012-12-07 CN CN201210525753.5A patent/CN102968501B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101042699A (zh) * | 2007-04-28 | 2007-09-26 | 华中科技大学 | 基于访问控制的安全搜索引擎系统 |
CN101221584A (zh) * | 2008-02-01 | 2008-07-16 | 北大方正集团有限公司 | 搜索引擎、搜索方法和系统 |
CN101576920A (zh) * | 2009-06-19 | 2009-11-11 | 用友软件股份有限公司 | 搜索引擎系统 |
CN102262633A (zh) * | 2010-05-27 | 2011-11-30 | 武汉力龙数码信息科技有限公司 | 一种面向全文检索的结构化数据安全检索方法 |
CN102214235A (zh) * | 2011-06-29 | 2011-10-12 | 浪潮集团山东通用软件有限公司 | 一种基于实时权限控制的企业管理软件搜索引擎集成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102968501A (zh) | 2013-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102968501B (zh) | 一种通用的全文搜索方法 | |
CN107342992B (zh) | 一种系统权限管理方法、装置及计算机可读存储介质 | |
EP2405607B1 (en) | Privilege management system and method based on object | |
CN100476828C (zh) | 基于访问控制的安全搜索引擎系统 | |
CN101320373B (zh) | 网站支撑数据库安全搜索引擎系统 | |
Priebe et al. | Towards OLAP security design—survey and research issues | |
US20090063448A1 (en) | Aggregated Search Results for Local and Remote Services | |
US7237119B2 (en) | Method, system and computer program for managing user authorization levels | |
CN106202452A (zh) | 大数据平台的统一数据资源管理系统与方法 | |
US9720923B2 (en) | System for providing user privilege information associated with secured data | |
CN101371490A (zh) | 用于实现上下文相关的文件安全的方法和装置 | |
CN102333090A (zh) | 一种内控堡垒主机及安全访问内网资源的方法 | |
CN101441688A (zh) | 一种用户权限分配方法和一种用户权限控制方法 | |
WO2018036324A1 (zh) | 一种智慧城市信息共享的方法和装置 | |
CN102622356B (zh) | 一种关联地理位置信息的百科知识系统 | |
CN101847155A (zh) | 包括访问受保护的xml数据的xml数据库的管理系统 | |
CN111966866A (zh) | 一种数据资产管理的方法和装置 | |
CN103188249A (zh) | 集中权限管理系统及其授权方法和鉴权方法 | |
CN111680041A (zh) | 面向异构数据的安全高效存取方法 | |
CN110968894A (zh) | 一种针对游戏业务数据的细粒度访问控制方案 | |
CN102063466A (zh) | 基于策略的数据库强制访问控制方法及其系统 | |
CN101493872A (zh) | 基于分类方法的细粒度权限管理方法 | |
JP2009003549A (ja) | データ管理装置およびデータ管理方法、データ管理プログラム、データ管理プログラム記憶媒体 | |
Mont et al. | Privacy policy enforcement in enterprises with identity management solutions | |
CN1534427B (zh) | 访问管理系统和访问管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |