CN112639786B - 智能地标 - Google Patents
智能地标 Download PDFInfo
- Publication number
- CN112639786B CN112639786B CN201880097090.7A CN201880097090A CN112639786B CN 112639786 B CN112639786 B CN 112639786B CN 201880097090 A CN201880097090 A CN 201880097090A CN 112639786 B CN112639786 B CN 112639786B
- Authority
- CN
- China
- Prior art keywords
- data field
- derived
- data
- level
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 81
- 230000004044 response Effects 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 51
- 238000009795 derivation Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 8
- 238000013479 data entry Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000007792 addition Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 101100134058 Caenorhabditis elegans nth-1 gene Proteins 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Abstract
提供了数据安全分级的系统和方法。一种可由计算机实施的用于数据安全分级的示例性方法可以包括:接收访问查询数据字段的请求;从安全级别表中搜索所述查询数据字段;响应于从所述安全级别表中搜索到所述查询数据字段,从所述安全级别表中获得与所述查询数据字段相对应的安全级别;以及响应于未从所述安全级别表中搜索到所述查询数据字段,至少基于谱系树和所述安全级别表来确定与所述查询数据字段相对应的安全级别。所述谱系树可以将所述查询数据字段追溯到一个或多个源数据字段,并且所述安全数据级别表可以包括与所述一个或多个源数据字段相对应的一个或多个安全级别。
Description
相关申请
本申请要求于2018年7月16日提交的名为“用于数据安全分级的系统和方法(System and Method for Data Security Grading)”的第16/036,865号美国非临时申请案的权益,该申请的内容通过引用以其全文并入本文。
技术领域
本公开总体上涉及用于数据安全分级的方法和装置。
背景技术
数据安全对于可以不断生成新数据的大多数大规模在线操作至关重要。随着数据量的迅速扩展,向数据字段分配适当的安全级别变得极具挑战。传统的基于规则的方法不足以处理每天产生的不断增长的新数据集。在许多其它挑战中,现有的表或数据字段具有由不同用户创建的名称,并且相对其内容通常不直观。进一步地,数据集的内容可能不时更改,这需要重写已创建的规则。因此,当前的技术无法及时将数据字段分级到适当的安全级别,这使在线数据暴露于显著的风险中。
发明内容
本公开的各个实施例可以包含用于数据安全分级的系统、方法和非暂时性计算机可读介质。根据一方面,一种可由计算机实施的用于数据安全分级的示例性方法可以包括:接收访问查询数据字段的请求;从安全级别表中搜索所述查询数据字段;响应于从所述安全级别表中搜索到所述查询数据字段,从所述安全级别表中获得与所述查询数据字段相相对应的安全级别;以及响应于未从所述安全级别表中搜索到所述查询数据字段,至少基于谱系树和所述安全级别表来确定与所述查询数据字段相对应的安全级别。所述谱系树可将所述查询数据字段追溯到一个或多个源数据字段,并且所述安全数据级别表可以包括与所述一个或多个源数据字段相对应的一个或多个安全级别。
在一些实施例中,所述谱系树可以追溯派生数据字段到一个或多个第一级父级数据字段,每一个第一级父级数据字段是所述源数据字段或第一级派生数据字段,并且所述派生数据字段基于派生函数从所述一个或多个第一级父级数据字段派生;对于所述第一级派生数据字段,所述谱系树可以追溯所述第一级派生数据字段到一个或多个第二级父级数据字段,每一个第二级父级数据字段是所述源数据字段或第二级派生数据字段,并且所述第一级派生数据字段基于另一个派生函数从所述一个或多个第二级父级数据字段派生;所述追溯可以在任何派生数据字段上复制,直到追溯到源数据字段中的一个或多个为止;以及所述谱系树包括所述派生函数。
在一些实施例中,至少基于所述谱系树和所述安全级别表来确定与所述查询数据字段相对应的所述安全级别可以包括:对于任何级别的每一个派生数据字段,至少基于(1)所述派生数据字段的所述派生函数和(2)所述派生数据字段的所述第一级父级数据字段的安全级别,获得所述派生数据字段的安全级别,以及确定所述派生数据字段中的一个与所述查询数据字段相对应,并将所述确定的派生数据字段的安全级别用作所述查询数据字段的安全级别。
在一些实施例中,所获得的派生数据字段的安全级别是所述派生数据字段的所述第一级父级数据字段的所述安全级别中的最高安全级别。
根据另一方面,一种可由计算机实施的用于数据安全分级的方法可以包括:根据一个或多个规则将数据空间中的一个或多个源数据字段分级为一个或多个安全级别,所述数据空间进一步包括一个或多个派生数据字段,每一个派生数据字段含有从一个或多个父级数据字段派生的数据,其中,所述父级数据字段是所述源数据字段或另一个派生数据字段;对于查询数据字段,记录用于产生所述查询数据字段的SQL(结构化查询语言)语句;解析所述SQL语句;基于所述所解析的SQL语句的构造谱系树,所述谱系树将所述查询数据字段追溯到一个或多个父级数据字段;以及至少基于所述谱系树和所述查询数据字段的所述一个或多个父级数据字段的一个或多个安全级别来确定所述查询数据字段的安全级别。
在一些实施例中,至少基于所述谱系树和所述查询数据字段的所述一个或多个父级数据字段的所述一个或多个安全级别来确定所述查询数据字段的所述安全级别可以包括:(1)基于一个或多个对应的第N个派生函数和所述一个或多个源数据字段的所述安全级别,确定与从所述谱系树中的所述一个或多个源数据字段派生的一个或多个第N级派生数据字段相对应的一个或多个第N个安全级别;(2)基于一个或多个对应的第N-1个派生函数和所述一个或多个源数据字段的安全级别和/或所述一个或多个第N个安全级别确定与从在所述谱系树中的所述一个或多个源数据字段和/或所述第N级派生数据字段派生的一个或多个第N-1级派生数据字段相对应的一个或多个第N-1个安全级别;以及在所述谱系树中朝向查询数据字段重复步骤(2),以确定所述查询数据字段的所述安全级别。
在一些实施例中,解析SQL语句可以包括将所述SQL语句转换为抽象语法树,并且基于所述所解析的SQL语句来构造所述谱系树可以包括:遍历所述抽象语法树以识别所述查询数据字段与所述源数据字段和/或派生数据字段中的一个或多个之间的派生关系。
在一些实施例中,所述查询数据字段和所述派生数据字段的安全级别可以基于直接的父级数据字段确定。
根据另一方面,一种用于数据安全分级的系统可以包括处理器,被配置为:接收访问查询数据字段的请求;从安全级别表中搜索所述查询数据字段;响应于从所述安全级别表中搜索到所述查询数据字段,从所述安全级别表中获得与所述查询数据字段相相对应的安全级别;以及响应于未从所述安全级别表中搜索到所述查询数据字段,至少基于谱系树和所述安全级别表来确定与所述查询数据字段相对应的安全级别。所述谱系树可追溯所述查询数据字段到一个或多个源数据字段,并且所述安全数据级别表可以包括与所述一个或多个源数据字段相对应的一个或多个安全级别。
根据另一方面,一种用于数据安全分级的系统可以包括处理器,被配置为:根据一个或多个规则将数据空间中的一个或多个源数据字段分级为一个或多个安全级别,所述数据空间进一步包括一个或多个派生数据字段,每一个派生数据字段含有从一个或多个父级数据字段派生的数据,其中,所述父级数据字段是所述源数据字段或另一个派生数据字段;对于查询数据字段,记录用于产生所述查询数据字段的SQL(结构化查询语言)语句;解析所述SQL语句;基于所解析的SQL语句构造谱系树,所述谱系树追溯所述查询数据字段到一个或多个父级数据字段;以及至少基于所述谱系树和所述查询数据字段的所述一个或多个父级数据字段的一个或多个安全级别来确定所述查询数据字段的安全级别。
根据另一方面,耦接到处理器的非暂时性计算机可读存储介质可以包括指令,所述指令在由所述处理器执行时使所述处理器执行用于数据安全分级的方法。所述方法可以包括:接收访问查询数据字段的请求;从安全级别表中搜索所述查询数据字段;响应于从所述安全级别表中搜索到所述查询数据字段,从所述安全级别表中获得与所述查询数据字段相相对应的安全级别;以及响应于未从所述安全级别表中搜索到所述查询数据字段,至少基于谱系树和所述安全级别表确定与所述查询数据字段相对应的安全级别。所述谱系树可追溯所述查询数据字段到一个或多个源数据字段,并且所述安全数据级别表可以包括与所述一个或多个源数据字段相对应的一个或多个安全级别。
根据另一方面,耦接到处理器的非暂时性计算机可读存储介质可以包括指令,所述指令在由所述处理器执行时使所述处理器执行用于数据安全分级的方法。所述方法可以包括:根据一个或多个规则将数据空间中的一个或多个源数据字段分级为一个或多个安全级别,所述数据空间进一步包括一个或多个派生数据字段,每一个派生数据字段含有从一个或多个父级数据字段派生的数据,其中,所述父级数据字段是所述源数据字段或另一个派生数据字段;对于查询数据字段,记录用于产生所述查询数据字段的SQL(结构化查询语言)语句;解析所述SQL语句;基于所述所解析的SQL语句构造谱系树,所述谱系树追溯所述查询数据字段到一个或多个父级数据字段;以及至少基于所述谱系树和所述查询数据字段的所述一个或多个父级数据字段的一个或多个安全级别来确定所述查询数据字段的安全级别。
根据另一方面,一种可由计算机实施的用于数据安全分级的方法可以包括:(1)接收与查询数据字段相关联的查询,以及(2)基于所述查询数据字段的一个或多个直接的上级数据字段的一个或多个相应的安全级别,以及从所述一个或多个直接的上级数据字段中的数据派生所述查询数据字段中的数据的派生函数,确定所述查询数据字段的安全级别。
在一些实施例中,步骤(2)可以包括:(3)对于是源数据字段的所述一个或多个直接的上级数据字段中的每一个,将与所述每一个源数据字段相关联的安全级别应用于步骤(2)的确定;以及(4)对于不是源数据字段的所述一个或多个直接的上级数据字段中的每一个,重复步骤(2),将所述直接的上级数据字段作为查询数据字段,直到所述直接的上数据字段的仅获得源数据字段,并应用步骤(3)。
本文公开的所述系统、方法和非暂时性计算机可读介质的这些和其它特征,以及结构的相关元件的操作和功能的方法以及部件的组合和制造的节约措施将参考附图并考虑以下描述和所附权利要求后变得更加明显,所有这些都构成本说明书的一部分,其中相同的附图标记表示各个图中的对应部分。然而,应清楚地理解,附图仅用于说明和描述的目的,并不旨在作为本发明的限制的定义。
附图说明
在所附权利要求中具体阐述了本发明技术的各个实施例的某些特征。通过参考以下利用本发明的原理的示例性实施例和附图的详细描述,可以更好地理解该技术的特征和优点,在附图中:
图1示出了根据各个实施例的用于数据安全分级的示例性环境。
图2示出了根据各个实施例的用于数据安全分级的示例性系统。
图3A示出了根据各个实施例的用于数据安全分级的示例性谱系树。
图3B示出了根据各个实施例的用于数据安全分级的另一个示例性谱系树。
图4A示出了根据各个实施例的用于数据安全分级的示例性方法的流程图。
图4B示出了根据各个实施例的用于数据安全分级的另一个示例性方法的流程图。
图4C示出了根据各个实施例的用于数据安全分级的另一个示例性方法的流程图。
图5示出了其中可以实施本文描述的实施例中的任何实施例的示例性计算机系统的框图。
具体实施方式
现有的基于规则的数据安全分级方法不足以为大量可能发生更改的数据提供保护。严格基于数据字段的特征或属性的传统规则通常在数据内容更改时失去其效果。进一步地,规则中通常调用的表或字段名称可能不正确地或不足以捕获对应的数据内容。因此,现有的数据安全分级技术要求不断更新规则,但是仍然使存储的数据处于潜在的风险之下。
所公开的用于数据安全分级的系统和方法至少减轻了当前技术中的上述缺点。在各个实施例中,可以从一定数量的包括源数据字段的源数据集创建包括派生数据字段的一些派生数据集,并且可以从一个或多个现有派生数据集和/或源数据集创建更多派生数据集。示例性数据空间可以包括数千个源数据字段和数百万个派生数据字段。为了有效地对这些派生数据字段进行分级,所公开的方法可以将数据谱系合并到分级过程中,其中,数据谱系可以直接地或经由一个或多个中间派生数据字段追溯每一个派生数据字段到确定的安全级别的一个或多个源数据字段。通过所公开的方法,针对源数据字段分级的安全级别可以根据其派生关系自动地通过各种级别中的中间派生数据字段而传播,以到达所查询的任何派生数据字段,并且可以响应于派生关系或数据内容的任何变化而动态地调整。因此,所公开的方法避免不断创建用于新添加的或新改变的派生数据字段的传统分级规则,并且可以防止依赖于表或字段名称的错误分级。总体而言,可以显著地提高数据安全。
图1示出了根据各个实施例的用于数据安全分级的示例性环境100。如图1所示,示例性系统100可以包括至少一个计算系统102,计算系统包含一个或多个处理器104和存储器106。存储器106可以是非暂时性的并且是计算机可读的。存储器106可以存储指令,当指令由一个或多个处理器104执行时,使一个或多个处理器104执行本文描述的各种操作。系统102可以实施为如移动电话、平板电脑、服务器、计算机、可穿戴装置(智能手表)等各种装置或在其上实施。系统102可以安装有合适的软件(例如,数据传输程序等)和/或硬件(例如,有线连接、无线连接等)以访问系统100的其它装置。
系统100可以包含系统102可访问的一个或多个数据存储(例如,数据存储108)和一个或多个计算装置(例如,计算装置109)。在一些实施例中,系统102可以被配置为从数据存储108(例如,云数据库)和/或计算装置109(例如,服务器、移动电话、车辆计算机)获得数据。
系统100可以进一步包含耦接到系统102的一个或多个计算装置(例如,计算装置107)。在一些实施例中,系统107可以被实施为服务器、移动电话、车辆计算机、平板电脑、可穿戴装置(智能手表)等。
在一些实施例中,系统102和计算装置(例如,计算装置109)中的一个或多个可以集成在单个装置或系统中。可替代地,系统102和一个或多个计算设备可以作为单独的装置而运行。一个或多个数据存储(例如,数据存储108)可以在系统102可访问的任何地方,例如,在存储器106中、在计算装置109中、在耦接到系统102的另一个装置(例如,网络存储装置)或另一个存储位置(例如,基于云的存储系统、网络文件系统等)等中。系统102可以被实现为单个系统或彼此耦合的多个系统。包括各种源数据集和派生数据集的数据空间可以由单个系统提供或分布在多个系统上。通常,系统102、计算装置109、数据存储108和系统107可以能够通过进行数据通信的一个或多个有线或无线网络(例如,因特网)彼此通信。
图2示出了根据各个实施例的用于数据安全分级的示例性系统200。图2中所示的并且在下面呈现的操作旨在是说明性的。在各个实施例中,系统102可以被配置为实施数据空间(例如,数据仓库)。数据空间可以包括从数据仓库外部的系统(例如,从数据存储108或计算装置109)收集的数据,并且根据源数据字段(例如,表格中存储的雇员姓名、薪水或其它数据字段)来组织。在一些实施例中,数据字段可以被视为存储各种数据条目的数据表中的列。系统102可以被配置为实施本文描述的各种数据安全分级步骤和方法。
在各个实施例中,计算装置107可以向系统102查询数据空间中的某个数据或某个数据字段的安全级别。可替代地,计算装置107可以向系统102查询数据空间中的某个数据。系统102可以例如基于登录信息来认证计算装置107的当前用户,并且确定当前用户的认证是否满足所查询的数据的安全级别。对应地,系统102可以返回数据或拒绝访问并返回对应的结果。
在一些实施例中,系统102可以接收访问某个数据字段(“查询数据字段”)的请求。数据字段可以与存储在存储器106和/或各种其它存储空间中的数据空间(例如,数据仓库)的数据条目的类别相关联。数据空间可以以各种格式(例如,表格数据集)存储数据并且由数据字段来组织数据。例如,对于数据字段“雇员姓名”,数据字段中的对应的数据可以包括“John Doe”、“Luke Webb”等。当用户查询数据字段中的部分或全部数据时,需要用数据字段的安全级别来确定所认证的用户是否有权访问数据。在此,系统102可以从安全级别表中搜索查询数据字段。安全级别表可以存储在存储器106中,或者以其它方式可被处理器104访问。安全级别表可以包括各种源数据字段的安全级别。例如,从数据仓库外部的系统收集的原始数据可以被视为源数据,并分配有对应的源数据字段。源数据字段的安全级别可以基于规则来确定。例如,用于对源数据字段进行分级的一个规则可以是,在其字段名称中含有单词“ID”的任何数据字段都被分配最高安全级别。本领域普通技术人员可以理解应用各种其它替代方法来对源数据字段的安全级别进行分级。
在此,在搜索安全级别表之后,系统102可以,响应于从安全级别表中搜索到查询数据字段,从安全级别表中获得与查询数据字段相相对应的安全级别。响应于未从安全级别表中搜索到查询数据字段,至少基于谱系树(lineage tree)和安全级别表来确定与查询数据字段相对应的安全级别。所述谱系树可追溯所述查询数据字段到一个或多个源数据字段,并且所述安全数据级别表可以包括与所述一个或多个源数据字段相对应的一个或多个安全级别。如所描述的,数据空间可以包括源数据字段和派生数据字段。某些派生数据字段可以各自从源数据字段中的一个或多个获得,并且更多派生数据字段可以各自从现有派生数据字段中的一个或多个和/或源数据字段中的一个或多个获得。因此,如果需要,任何派生数据字段都可以在一个或多个末端通过中间派生数据字段的层进行追溯,以最终到达其谱系树中的一个或多个源数据字段。进一步地,每一个派生可以对应于派生函数,并且派生函数可以与一个或多个父级数据字段的一个或多个安全级别到子级数据字段的安全级别的安全级别的转换相关联。因此,一个或多个源数据字段的安全级别可以用于获得下一层派生数据字段的安全级别,并且递归应用于下一层以获得所有派生数据字段的安全级别。
参考图3A,图3A示出了根据各个实施例的用于数据安全分级的示例性谱系树。图3A所示的和以下呈现的操作旨在是说明性的。此图示出了派生数据字段D0的谱系树。在此图中,所有源数据字段均以圆形表示,并且所有派生数据字段均以正方形表示。可以将源数据字段视为谱系树的根,并且可以将派生数据字段视为分支或叶子。在一些实施例中,谱系树可以追溯派生数据字段(例如,数据字段D0)到紧接在数据字段D0上方的一个或多个第一级父级数据字段(例如,数据字段D1A、D1B和O1)。每一个第一级父级数据字段可以是源数据字段(例如O1)或第一级派生数据字段(例如数据字段D1A和D1B),并且派生数据字段可以基于派生函数从一个或多个第一级父级数据字段派生。对于第一级派生数据字段,谱系树可以追溯第一级派生数据字段到一个或多个第二级父级数据字段(例如,追溯数据字段D1A到数据字段D2A,追溯数据字段D1B到数据字段D2A和O2),每一个第二级父级数据字段是源数据字段或第二级派生数据字段,并且第一级派生数据字段基于另一个派生函数从一个或多个第二级父级数据字段派生。所述追溯可以在任何派生数据字段上复制,直到追溯到源数据字段中的一个或多个为止(例如,数据字段D2A可以进一步追溯到O3和O1,并且不需要从源数据字段进行进一步追溯)。派生数据字段的各种级别与数据字段D0相关。也就是说,级别可以是谱系树中到达数据字段D0所需的箭头路径的数量。每一个箭头可指代与派生函数相对应的派生,从父级数据字段指向子级数据字段(任何源或派生数据字段都可以是父级数据字段,并且只有派生数据字段可以是子级数据字段)。派生函数可以是如用户指定的任何算法或等同物,如求和、加法、乘积、计数等。例如,数据字段D1A可以是数据字段D2A中的数据条目的总和。又例如,数据字段D2A和数据字段O2可以具有相同数目的条目,并且数据字段D1B可以是D2A的数据条目和O2的数据条目的一对一相加。
进一步地,谱系树可以包括派生函数,每一个派生函数与从对应的一个或多个父级数据字段到子级数据字段的安全级别转换相关联。这种对应的关系可以存储在表中。例如,对于求和函数(将两个或多个父级数据字段中的条目求和到子级数据字段中),将父级数据字段中的最高数据安全级别传递给子级数据字段的安全级别。也就是说,所获得的派生数据字段的安全级别可以是第一级父级数据字段的安全级别中的最高安全级别。又例如,对于计数函数(对父级数据字段中的数据条目进行计数以获得子级数据字段),可以将子级数据字段的安全级别设置为任意低级别。因此,至少基于谱系树和安全级别表来确定与查询数据字段相对应的安全级别可以包括:对于任意级别的每一个派生数据字段,至少基于(1)派生数据字段的派生函数和(2)派生数据字段的第一级父级数据字段的安全级别,获得派生数据字段的安全级别。可以逐层递归地应用这种确定算法,以最终链接到位于谱系树的根处的安全级别表中源数据字段的已知安全级别,因此通过插入源字段的安全级别可获得数据字段D0的安全级别。进一步地,可以随数据的任何变化(例如,数据条目的变化、派生函数的变化、数据字段的添加等)自动且动态地更新任何派生数据字段的安全级别。
在一些实施例中,至少基于谱系树和安全级别表来确定与查询数据字段相对应的安全级别可以进一步包括:确定与查询数据字段相对应的派生数据字段中的一个(例如,数据字段D0),并将确定的派生数据字段的安全级别用作查询数据字段的安全级别。也就是说,如果查询数据字段为D0,则可以调用D0的安全级别来处理查询。在一些其它实施例中,如上所述,如果查询数据字段与安全级别表中的存储的数据字段匹配,则可以直接从安全级别表中获得与存储的数据字段相对应的安全级别作为与查询数据字段相对应的安全级别。
返回参考图2,为了准确地返回查询数据字段的安全级别,系统102可以被配置为预先执行各步骤。在一些实施例中,系统102可以根据一个或多个规则来将数据空间中的一个或多个源数据字段分级为一个或多个安全级别。如上所述,除了源数据字段之外,数据空间可以进一步包括一个或多个派生数据字段,每一个派生数据字段含有从一个或多个父级数据字段派生的数据,其中,父级数据字段是源数据字段或另一个派生数据字段。在接收到对查询数据字段的查询时,系统102可以记录用于产生查询数据字段的SQL(结构化查询语言)语句。例如,SQL语句可以包括对现有的派生数据字段中的数据条目的数量进行计数,并且所计数的数量可以成为新的派生数据字段。所述记录可以实时执行。然后,系统102可以解析SQL语句(例如,通过将SQL语句转换为抽象语法树),并基于所解析的SQL语句构造谱系树,谱系树将查询数据字段追溯到一个或多个父级数据字段。例如,为了解析SQL语句,系统102可以将SQL语句转换为抽象语法树,并且为了构造谱系树,系统102可以遍历所述抽象语法树以识别查询数据字段与源数据字段和/或派生数据字段中的一个或多个之间的派生关系。因此,系统102可至少基于谱系树和查询数据字段的一个或多个父级数据字段的一个或多个安全级别来确定查询数据字段的安全级别。
参考图3B,图3B示出了根据各个实施例的用于数据安全分级的另一个示例性谱系树。图3B所示和以下呈现的操作旨在是说明性的。图3B中的符号与如上所述的图3A中的符号类似。图3B中所示的谱系树可以被认为是图3A所示的谱系树的概括。在一些实施例中,为了至少基于谱系树和查询数据字段的一个或多个父级数据字段的一个或多个安全级别来确定查询数据字段的安全级别,系统102可以:(1)基于一个或多个对应的第N个派生函数和一个或多个源数据字段的安全级别,确定与从谱系树中的一个或多个源数据字段派生的一个或多个第N级派生数据字段相对应的一个或多个第N个安全级别;(2)基于一个或多个对应的第N-1个派生函数和一个或多个源数据字段的安全级别和/或一个或多个第N个安全级别,确定与从在谱系树中的一个或多个源数据字段和/或第N级派生数据字段派生的一个或多个第N-1级派生数据字段相对应的一个或多个第N-1个安全级别;以及在谱系树中朝向查询数据字段重复步骤(2),以确定查询数据字段的安全级别。在此,可以基于直接的父级数据字段(直接指向子级数据字段的父级数据字段)确定查询数据字段和派生数据字段的安全级别。例如,可以从源数据字段的安全级别获得第N级数据字段的安全级别,可以从第N级数据字段的安全级别获得第N-1级数据字段的安全级别,依此类推以获得D0的安全级别。在此图中,子级数据字段的级别比其父级数据字段的最低级别低一级。例如,数据字段D(N-1)B从源数据字段OC和派生数据字段DNB派生。由于第N级数据字段DNB在数据字段D(N-1)B的所有父级数据字段中最低(此处,原始级别>第N级>第N-1级…>第1级),数据字段D(N-1)B的级别为第N-1级。
如此,可以基于其谱系树追溯到一个或多个源数据字段的安全级别来确定任何派生数据字段的安全级别。在数据空间中,各单独的谱系树都可以捕获对应的派生数据字段的动态变化。由于源数据字段的数量可能比派生数据字段更稳定并且数量更少,因此可以预先完成源数据字段的分级并将其应用于谱系树中,以根据各级别的派生函数获得派生数据字段的安全级别。
图4A示出了根据本公开的各个实施例的示例性方法400的流程图。方法400可以在包含例如图1的环境100的各种环境中实施。示例性方法400可以由系统102的一个或多个组件(例如,处理器104、存储器106)来实施。示例性方法400可以由类似于系统102的多个系统(例如,计算机)来实施。以下呈现的方法400的操作旨在是说明性的。取决于实施方式,示例性方法400可以包含以各种顺序或并行执行的附加的、更少的或替代的步骤。
在框402,可以接收访问查询数据字段的请求。在框404,可以从安全级别表中搜索查询数据字段。在框406,响应于从安全级别表中搜索到查询数据字段,可以从安全级别表中获得与查询数据字段相对应的安全级别。在框408,响应于未从安全级别表中搜索到查询数据字段,可以至少基于谱系树和安全级别表来确定与查询数据字段相对应的安全级别。所述谱系树可以将所述查询数据字段追溯到一个或多个源数据字段,并且所述安全数据级别表可以包括与所述一个或多个源数据字段相对应的一个或多个安全级别。
图4B示出了根据本公开的各个实施例的示例性方法410的流程图。方法410可以在包含例如图1的环境100的各种环境中实施。示例性方法410可以由系统102的一个或多个组件(例如,处理器104、存储器106)来实施。示例性方法410可以由类似于系统102的多个系统(例如,计算机)来实施。以下呈现的方法410的操作旨在是说明性的。取决于实施方式,示例性方法410可以包含以各种顺序或并行执行的附加的、更少的或替代的步骤。
在框412,可以根据一个或多个规则将数据空间中的一个或多个源数据字段分级为一个或多个安全级别,数据空间进一步包括一个或多个派生数据字段,每一个派生数据字段含有从一个或多个父级数据字段派生的数据,其中,父级数据字段是源数据字段或另一个派生数据字段。在框414,对于查询数据字段,可以记录用于产生查询数据字段的SQL(结构化查询语言)语句。在框416,可以解析SQL语句。在框418,可以基于所解析的SQL语句构造谱系树,谱系树追溯查询数据字段到一个或多个父级数据字段。在框419,可以至少基于谱系树和查询数据字段的一个或多个父级数据字段的一个或多个安全级别来确定查询数据字段的安全级别。
图4C示出了根据本公开的各个实施例的示例性方法420的流程图。方法420可以在包含例如图1的环境100的各种环境中实施。示例性方法420可以由系统102的一个或多个组件(例如,处理器104、存储器106)来实施。示例性方法420可以由类似于系统102的多个系统(例如,计算机)来实施。以下呈现的方法420的操作旨在是说明性的。取决于实施方式,示例性方法420可以包含以各种顺序或并行执行的附加的、更少的或替代的步骤。
在框422,可以接收与查询数据字段相关联的查询。例如,查询可以调用查询数据字段中的某个数据、查询数据字段的某个属性等。在框424,可以基于以下项目来确定查询数据字段的安全级别:查询数据字段的一个或多个直接的上级数据字段的一个或多个相应的安全级别,以及从一个或多个直接的上级数据字段中的数据派生查询数据字段中的数据的派生函数。如上所述,可以将查询数据字段追溯到其第一级父级数据字段(一个或多个直接的上级数据字段),其可以包含源数据字段和/或第一级派生数据字段。可以分别对第一级派生数据字段类似地追溯到其一个或多个直接的上级数据字段,并且每一次向前追溯可以在源数据字段处结束。在此,当接收到查询数据字段时,可以动态生成并获得中间数据字段(查询数据字段的谱系树中,不是源数据字段和查询数据字段的数据字段)的安全级别,并且可以不必预先存储和搜索所述安全级别。在一些实施例中,对于是源数据字段的一个或多个直接的上级数据字段中的每一个,可以将与每一个源数据字段相关联的安全级别应用于框424确定。对于不是源数据字段的一个或多个直接的上级数据字段中的每一个,可以重复框424,将直接的上级数据字段作为查询数据字段,直到直接的上级数据字段仅获得的源数据字段,并且可以应用框424确定与每一个源数据字段相关联的安全级别。
本文描述的技术由一个或多个专用计算装置实施。专用计算装置可以是硬连线的以执行技术,或可以包含电路系统或数字电子装置,如一个或多个被持续编程以执行这些技术的专用集成电路(ASIC)或现场可编程门阵列(FPGA),或可以包含一个或多个被编程为执行根据固件、存储器、其它存储器或组合中的程序指令中的技术的硬件处理器。这种专用计算装置还可将定制的硬连线逻辑电路、ASIC或FPGA与定制编程相结合以实现技术。专用计算装置可以是结合硬连线和/或程序逻辑来实施技术的台式计算机系统、服务器计算机系统、便携式计算机系统、手持式装置、网络装置或任何其它装置或装置的组合。一个或多个计算装置通常通过操作系统软件来控制和协调。传统的操作系统控制和调度用于执行的计算机进程、执行存储器管理、提供文件系统、网络、I/O服务,以及提供用户界面功能性,如图形用户界面(“GUI”)等。
图5是示出了可以在其上实施本文描述的实施例中的任何实施例的计算机系统500的框图。系统500可以对应于如上所述的系统102。计算机系统500包含用于传送信息的总线502或其它通信机构、一个或多个与总线502耦接以处理信息的硬件处理器504。例如,一个或多个硬件处理器504可以是一个或多个通用微处理器。一个或多个处理器504可以对应于如上所述的处理器104。
计算机系统500还包含主存储器506,如随机存取存储器(RAM)、高速缓存和/或其它动态存储设备,这些存储器与总线502耦接以存储将由处理器504执行的信息和指令。主存储器506还可用于在执行要由处理器504执行的指令期间来存储临时变量或其它中间信息。当存储在处理器504可访问的存储介质中时,这些指令使计算机系统500成为被定制成执行指令中指定的操作的专用机器。计算机系统500进一步包含与总线502耦接的只读存储器(ROM)508或其它静态存储设备,其用于存储处理器504的静态信息和指令。如磁盘、光盘或USB拇指驱动器(闪存驱动器)等存储设备510被提供并耦接到总线502,以存储信息和指令。主存储器506、ROM 508和/或存储设备510可以对应于如上所述的存储器106。
计算机系统500可使用定制的硬连线逻辑、一个或多个ASIC或FPGA、固件和/或程序逻辑来实施本文描述的技术,这些技术与计算机系统相结合使计算机系统500成为专用机器或将该系统编程为专用机器。根据一个实施例,本文的技术是通过计算机系统500响应于一个或多个处理器504执行在主存储器506中含有的一个或多个指令的一个或多个序列而执行的。这些指令可从另一个存储介质(如,存储设备510)读入主存储器506。执行在主存储器506中含有的指令序列使得一个或多个处理器504执行本文所述的处理步骤。在替代实施例中,可使用硬连线电路来代替软件指令或与软件指令结合使用。
主存储器506、ROM 508和/或存储设备510可以包含非暂时性存储介质。如本文所使用的术语“非暂时性介质”和类似术语是指存储使机器以特定方式操作的数据和/或指令的任何介质。这种非暂时性介质可以包括非易失性介质和/或易失性介质。非易失性介质包括例如光盘或磁盘,比如,存储设备510。易失性介质包含动态存储器,如主存储器506。例如,非暂时性介质的常见形式包含例如:软驱、软盘、硬盘、固态硬盘、磁带或任何其它磁数据存储介质、CD-ROM、任何其它光学数据存储介质、任何有孔图案的物理介质、RAM、PROM和EPROM、FLASH-EPROM、NVRAM、任何其它存储器芯片或盒式磁带,以及其网络版本。
计算机系统500还包含与总线502耦接的网络接口518。网络接口518提供与连接至一个或多个本地网络的一个或多个网络链路耦接的双向数据通信。例如,网络接口518可以是综合业务数字网(ISDN)卡、电缆调制解调器、卫星调制解调器或提供与对应类型的电话线的数据之间的通信连接调制解调器。再例如,网络接口518可以是局域网(LAN)卡,以提供与兼容LAN(或与WAN通信的WAN组件)的数据通信连接。还可使用无线链路。在任何这种实施方式中,网络接口518发送和接收携带表示各种类型信息的数字数据流的电信号、电磁信号或光信号。
计算机系统500可通过一个或多个网络、网络链路和网络接口518来发送消息和接收数据,包含发送和接收程序代码。在互联网实例中,服务器可通过互联网、ISP、本地网络和网络接口518来发送用于应用程序的所请求的代码。
所接收到的代码可由处理器504在被接收时执行,和/或存储在存储设备510或其它非易失性存储器中以供稍后执行。
前面部分中描述的流程、方法和算法中的每一个可通过由包括计算机硬件的一个或多个计算机系统或计算机处理器执行的代码模块来实现,并完全或部分实现自动化。所述流程和算法可部分或全部地在专用电路中实施。
上述各种特征和过程可彼此独立地使用,或可以各种方式组合使用。所有可能的组合和子组合都旨在落入本公开的范围内。另外,在一些实施方式中可省略某些方法或流程框。本文描述的方法和过程也不限于任何特定顺序,且与其相关的方框或状态可以适当的其它顺序来执行。例如,所描述的框或状态可以不同于具体公开的顺序来执行,或多个框或状态可在单个框或状态中组合。示例性框或状态可串行、并行或以某种其它方式来执行。可向所公开的示例性实施例中添加框或状态或从其中移除框或状态。本文描述的示例性系统和组件可与所描述的不同地来进行配置。例如,与所公开的示例性实施例相比,可添加、移除或重新布置元素。
本文描述的示例性方法的各种操作可以至少部分地通过算法来执行。算法可以包括在存储于存储器(例如,上述非暂时性计算机可读存储介质)中的程序代码或指令中。所述算法可以包括机器学习算法。在一些实施例中,机器学习算法可以不明确地对计算机进行编程以执行功能,而是从训练数据中学习以制作执行所述功能的预测模型。
本文描述的示例性方法的各种操作可以至少部分地由临时配置(例如,通过软件配置)或永久配置为执行相关操作的一个或多个处理器来执行。无论是临时配置还是永久配置,这种处理器可以构成运行为执行本文描述的一个或多个操作或功能的处理器实施的引擎。
类似地,本文描述的方法可以至少部分地由处理器实施,一个或多个特定处理器是硬件的实例。例如,方法的操作中的至少一些可以由一个或多个处理器或处理器实施的引擎执行。此外,一个或多个处理器还可以在“云计算”环境中或作为“软件即服务”(SaaS)运行以支持相关操作的执行。例如,至少一些操作可以由一组计算机(作为包含处理器的机器的实例)执行,这些操作可以通过网络(例如,互联网)和通过一个或多个适当的接口(例如,应用程序接口(API))访问。
某些操作的执行可以分布在处理器之间,不仅驻留在单个机器中,而且部署在多个机器。在一些示例性实施例中,处理器或处理器实施的引擎可以位于单独的地理位置中(例如,在家庭环境、办公室环境或服务器场内)。在其它示例性实施例中,处理器或处理器实施的引擎可以跨多个地理位置分布。
在整个说明书中,多个示例可实施被描述为单个示例的组件、操作或结构。尽管一个或多个方法的个别操作被示出并描述为单独的操作,但是可同时执行单独的操作中的一个或多个,且不需要以所示的顺序来执行这些操作。示例性配置中作为单独的组件展示的结构与功能性可以实施为组合结构或组件。类似地,作为单一组件展示的结构与功能可以实施为多个分离的组件。这些结构和功能及附加的变化、改动、添加及提高属于本文主题的范围。
尽管已经参考具体的示例性实施例描述了主题的概述,但是在不脱离本公开的实施例的更宽范围的情况下,可对这些实施例进行各种修改和改变。仅仅是为了方便,本发明中的主题的这些实施例可单独地或共同地通过术语“发明”来提及,如果事实上披露了多于一个披露或概念,则无意自愿将本申请的范围限制于任何单一的公开内容或概念。
本文示出的实施例被充分详细地描述,以使本领域技术人员能够实践所公开的教导。可以使用并从中派生出其它实施例,使得可以在不脱离本公开的范围的情况下进行结构和逻辑上的替换和改变。因此,具体实施方式不应被视为具有限制意义,且各个实施例的范围仅由所附权利要求以及这些权利要求所赋予的等同物的全部范围来限定。
本文描述的和/或在附图中描绘的流程图中的任何过程描述、元件或框都应被理解为潜在地表示包含用于实施过程中具体的逻辑功能或步骤的一个或多个可执行指令的模块、段或代码部分。如本领域技术人员所理解的,替代实施方式包含在本文描述的实施例的范围内,其中,可以根据所涉及的功能性来,从所示出或所讨论的元件或功能中删除元件或功能、打乱元件或功能的执行次序(包含基本上同时地或以相反的顺序)。
如本文所使用的,术语“或”可以以包括性或排它性的意义来解释。此外,可以提供本文中描述为单个示例的资源、操作或结构的多个示例。另外,各种资源、操作、引擎和数据存储之间的边界在某种程度上是任意的,并且在具体的说明性配置的上下文中说明了特定操作。功能性的其它分配被设想,并且其它分配可以落入本公开的各个实施例的范围内。通常,在示例性配置中表示为单独资源的结构和功能性可以实施为组合结构或资源。类似地,表示为单个资源的结构和功能性可以实施为多个分离的资源。这些和其它变体、修改、添加和提高落入如所附权利要求所表示的本公开的实施例的范围内。因此,说明书和附图被认为是说明性的而不是限制性的。
除非在所用上下文中另外明确说明或另外理解,否则条件性语言(如“能够”、“可能”、“也许”或“可以”等)通常旨在传达某些实施方式包含,而其它实施例不包含,某些特征、元件和/或步骤。因此,这种条件性语言通常不旨在暗示特征、元件和/或步骤以任何方式必须用于一个或多个实施例,或者一个或多个实施例必然包含用于确定以下的逻辑:在有或没有用户输入或提示的情况下,是否这些特征、元件和/或步骤包含在任何特定实施例中或将在其中执行。
Claims (16)
1.一种可由计算机实施的用于数据安全分级的方法,所述方法包括:
接收访问查询数据字段的请求;
从安全级别表中搜索所述查询数据字段;
响应于从所述安全级别表中搜索到所述查询数据字段,从所述安全级别表中获取与所述查询数据字段相相对应的安全级别;以及
响应于未从所述安全级别表中搜索到所述查询数据字段,至少基于谱系树和所述安全级别表确定与所述查询数据字段相对应的安全级别,其中:
所述谱系树追溯所述查询数据字段到一个或多个源数据字段;以及
所述安全级别表包括与所述一个或多个源数据字段相对应的一个或多个安全级别;
其中,所述谱系树追溯派生数据字段到一个或多个第一级父级数据字段,每一个第一级父级数据字段是所述源数据字段或第一级派生数据字段,并且所述派生数据字段基于派生函数从所述一个或多个第一级父级数据字段派生;
对于所述第一级派生数据字段,所述谱系树追溯所述第一级派生数据字段到一个或多个第二级父级数据字段,每一个第二级父级数据字段是所述源数据字段或第二级派生数据字段,并且所述第一级派生数据字段基于另一个派生函数从所述一个或多个第二级父级数据字段派生;
所述追溯在任意派生数据字段上复制,直到追溯到所述源数据字段中的一个或多个为止;以及
所述谱系树包括所述派生函数。
2.根据权利要求1所述的方法,其中,至少基于谱系树和所述安全级别表,确定与所述查询数据字段相对应的安全级别包括:
对于任意级别的每一个派生数据字段,至少基于(1)所述派生数据字段的所述派生函数和(2)所述派生数据字段的所述第一级父级数据字段的安全级别,获取所述派生数据字段的安全级别;以及
确定与所述查询数据字段相对应的所述派生数据字段中的一个,并将所确定的派生数据字段的安全级别作为所述查询数据字段的安全级别。
3.根据权利要求2所述的方法,其中:
所述所确定的派生数据字段的安全级别是所述派生数据字段的所述第一级父级数据字段的安全级别中的最高安全级别。
4.一种可由计算机实施的用于数据安全分级的方法,所述方法包括:
根据一个或多个规则将数据空间中的一个或多个源数据字段分级为一个或多个安全级别,所述数据空间进一步包括一个或多个派生数据字段,每一个派生数据字段含有从一个或多个父级数据字段派生的数据,其中,所述父级数据字段是所述源数据字段或另一个派生数据字段;
对于查询数据字段,记录用于产生所述查询数据字段的SQL(结构化查询语言)语句;
解析所述SQL语句;
基于所解析的SQL语句的构造谱系树,所述谱系树追溯所述查询数据字段到一个或多个父级数据字段;以及
至少基于所述谱系树和所述查询数据字段的所述一个或多个父级数据字段的一个或多个安全级别,确定所述查询数据字段的安全级别;
其中,解析所述SQL语句包括将所述SQL语句转换为抽象语法树;以及
基于所解析的SQL语句构造谱系树包括:遍历所述抽象语法树以识别所述查询数据字段与所述源数据字段和/或派生数据字段中的一个或多个之间的派生关系。
5.根据权利要求4所述的方法,其中,至少基于所述谱系树和所述查询数据字段的所述一个或多个父级数据字段的所述一个或多个安全级别,确定所述查询数据字段的安全级别包括:
(1)基于一个或多个对应的第N个派生函数和所述一个或多个源数据字段的安全级别,确定一个或多个第N级派生数据字段相对应的一个或多个第N个安全级别,所述第N级派生数据字段派生自所述谱系树中的所述一个或多个源数据字段;
(2)基于一个或多个对应的第N-1个派生函数和所述一个或多个源数据字段的所述安全级别和/或所述一个或多个第N个安全级别,确定一个或多个第N-1级派生数据字段相对应的一个或多个第N-1个安全级别,所述第N-1级派生数据字段派生自所述谱系树中的所述一个或多个源数据字段和/或所述第N级派生数据字段;以及
在所述谱系树中朝向所述查询数据字段重复步骤(2),以确定所述查询数据字段的安全级别。
6.根据权利要求4所述的方法,其中:
所述查询数据字段和所述派生数据字段的所述安全级别基于直接的父级数据字段确定。
7.一种用于数据安全分级的系统,包括处理器,所述处理器被配置为:
接收访问查询数据字段的请求;
从安全级别表中搜索所述查询数据字段;
响应于从所述安全级别表中搜索到所述查询数据字段,从所述安全级别表中获取与所述查询数据字段相相对应的安全级别;以及
响应于未从所述安全级别表中搜索到所述查询数据字段,至少基于谱系树和所述安全级别表确定与所述查询数据字段相对应的安全级别,其中:
所述谱系树追溯所述查询数据字段到一个或多个源数据字段;以及
所述安全级别表包括与所述一个或多个源数据字段相对应的一个或多个安全级别;
其中,所述谱系树追溯派生数据字段到一个或多个第一级父级数据字段,每一个第一级父级数据字段是所述源数据字段或第一级派生数据字段,并且所述派生数据字段基于派生函数从所述一个或多个第一级父级数据字段派生;
对于所述第一级派生数据字段,所述谱系树追溯所述第一级派生数据字段到一个或多个第二级父级数据字段,每一个第二级父级数据字段是所述源数据字段或第二级派生数据字段,并且所述第一级派生数据字段基于另一个派生函数从所述一个或多个第二级父级数据字段派生;
所述追溯在任意派生数据字段上复制,直到追溯到所述源数据字段中的一个或多个为止;以及
所述谱系树包括所述派生函数。
8.根据权利要求7所述的系统,其中,为了至少基于所述谱系树和所述安全级别表,确定与所述查询数据字段对应的安全级别,所述处理器被配置为:
对于任意级别的所述每一个派生数据字段,至少基于(1)所述派生数据字段的所述派生函数和(2)所述派生数据字段的所述第一级父级数据字段的安全级别,获取所述派生数据字段的安全级别;以及
确定与所述查询数据字段相对应的所述派生数据字段中的一个,并将所确定的派生数据字段的安全级别作为所述查询数据字段的安全级别。
9.根据权利要求8所述的系统,其中:
所述所确定的派生数据字段的安全级别是所述派生数据字段的所述第一级父级数据字段的安全级别中的最高安全级别。
10.一种用于数据安全分级的系统,包括处理器,所述处理器被配置为:
根据一个或多个规则将数据空间中的一个或多个源数据字段分级为一个或多个安全级别,所述数据空间进一步包括一个或多个派生数据字段,每一个派生数据字段含有从一个或多个父级数据字段派生的数据,其中,所述父级数据字段是所述源数据字段或另一个派生数据字段;
对于查询数据字段,记录用于产生所述查询数据字段的SQL(结构化查询语言)语句;
解析所述SQL语句;
基于所解析的SQL语句构造谱系树,所述谱系树追溯所述查询数据字段到一个或多个父级数据字段;以及
至少基于所述谱系树和所述查询数据字段的所述一个或多个父级数据字段的一个或多个安全级别确定所述查询数据字段的安全级别;
其中,为了解析所述SQL语句,所述处理器被配置为将所述SQL语句转换为抽象语法树;以及
为了基于所解析的SQL语句构造所述谱系树,所述处理器被配置为遍历所述抽象语法树以识别所述查询数据字段与所述源数据字段和/或派生数据字段中的一个或多个之间的派生关系。
11.根据权利要求10所述的系统,其中,为了至少基于所述谱系树和所述查询数据字段的所述一个或多个父级数据字段的所述一个或多个安全级别确定所述查询数据字段的所述安全级别,所述处理器被配置为:
(1)基于一个或多个对应的第N个派生函数和所述一个或多个源数据字段的安全级别,确定一个或多个第N级派生数据字段相对应的一个或多个第N个安全级别,所述第N级派生数据字段派生自所述谱系树中的所述一个或多个源数据字段;
(2)基于一个或多个对应的第N-1个派生函数和所述一个或多个源数据字段的所述安全级别和/或所述一个或多个第N个安全级别,确定一个或多个第N-1级派生数据字段相对应的一个或多个第N-1个安全级别,所述第N-1级派生数据字段派生自所述谱系树中的所述一个或多个源数据字段和/或所述第N级派生数据字段;以及
在所述谱系树中朝向所述查询数据字段重复步骤(2),以确定所述查询数据字段的安全级别。
12.根据权利要求10所述的系统,其中:
所述查询数据字段和所述派生数据字段的所述安全级别基于直接的父级数据字段确定。
13.一种可由计算机实施的用于数据安全分级的方法,所述方法包括:
(1)接收与查询数据字段相关联的查询;以及
(2)基于以下来确定所述查询数据字段的安全级别:查询数据字段的一个或多个直接的上级数据字段的一个或多个相应的安全级别,以及从一个或多个直接的上级数据字段中的数据派生查询数据字段中的数据的派生函数;
其中,所述直接的上级数据字段为第一级父级数据字段,步骤(2)包括:
基于谱系树追溯所述查询数据字段对应的派生数据字段到一个或多个所述第一级父级数据字段,每一个第一级父级数据字段是源数据字段或第一级派生数据字段,并且所述派生数据字段基于所述派生函数从所述一个或多个第一级父级数据字段派生;
对于所述第一级派生数据字段,所述谱系树追溯所述第一级派生数据字段到一个或多个第二级父级数据字段,每一个第二级父级数据字段是所述源数据字段或第二级派生数据字段,并且所述第一级派生数据字段基于另一个派生函数从所述一个或多个第二级父级数据字段派生;以及
所述谱系树包括所述派生函数。
14.根据权利要求13所述的方法,其中,步骤(2)包括:
(3)对于是源数据字段的所述一个或多个直接的上级数据字段中的每一个,将与每一个所述源数据字段相关联的安全级别应用于步骤(2)的确定;以及
(4)对于不是源数据字段的所述一个或多个直接的上级数据字段中的每一个,重复步骤(2),将所述直接的上级数据字段作为查询数据字段,直到对所述直接的上级数据字段仅获得源数据字段,并应用步骤(3)。
15.一种用于数据安全分级的系统,包括处理器,所述处理器被配置为:
(1)接收与查询数据字段相关联的查询;以及
(2)基于以下来确定所述查询数据字段的安全级别:查询数据字段的一个或多个直接的上级数据字段的一个或多个相应的安全级别,以及从一个或多个直接的上级数据字段中的数据派生查询数据字段中的数据的派生函数;
其中,所述直接的上级数据字段为第一级父级数据字段,所述处理器被配置为:
基于谱系树追溯所述查询数据字段对应的派生数据字段到一个或多个所述第一级父级数据字段,每一个第一级父级数据字段是源数据字段或第一级派生数据字段,并且所述派生数据字段基于所述派生函数从所述一个或多个第一级父级数据字段派生;
对于所述第一级派生数据字段,所述谱系树追溯所述第一级派生数据字段到一个或多个第二级父级数据字段,每一个第二级父级数据字段是所述源数据字段或第二级派生数据字段,并且所述第一级派生数据字段基于另一个派生函数从所述一个或多个第二级父级数据字段派生;以及
所述谱系树包括所述派生函数。
16.根据权利要求15所述的系统,其中,为了确定所述查询数据字段的所述安全级别,所述处理器被配置为:
(3)对于是源数据字段的所述一个或多个直接的上级数据字段中的每一个,将与每一个所述源数据字段相关联的安全级别应用于步骤(2)的确定;以及
(4)对于不是源数据字段的所述一个或多个直接的上级数据字段中的每一个,重复步骤(2),将所述直接的上级数据字段作为查询数据字段,直到对所述直接的上级数据字段仅获得源数据字段,并应用步骤(3)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/036,865 US10922430B2 (en) | 2018-07-16 | 2018-07-16 | System and method for data security grading |
US16/036,865 | 2018-07-16 | ||
PCT/US2018/068075 WO2020018144A1 (en) | 2018-07-16 | 2018-12-29 | System and method for data security grading |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112639786A CN112639786A (zh) | 2021-04-09 |
CN112639786B true CN112639786B (zh) | 2024-07-16 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200050968A1 (en) | Interactive interfaces for machine learning model evaluations | |
US10387801B2 (en) | Method of and system for generating a prediction model and determining an accuracy of a prediction model | |
US9454599B2 (en) | Automatic definition of entity collections | |
EP3161635B1 (en) | Machine learning service | |
US10318882B2 (en) | Optimized training of linear machine learning models | |
Poorthuis et al. | Making big data small: strategies to expand urban and geographical research using social media | |
US10452702B2 (en) | Data clustering | |
WO2021114810A1 (zh) | 基于图结构的公文推荐方法、装置、计算机设备及介质 | |
US20150100605A1 (en) | Determining collection membership in a data graph | |
WO2018121198A1 (en) | Topic based intelligent electronic file searching | |
Gupta et al. | Faster as well as early measurements from big data predictive analytics model | |
US10311093B2 (en) | Entity resolution from documents | |
CN112070550A (zh) | 基于搜索平台的关键词确定方法、装置、设备及存储介质 | |
US11449628B2 (en) | System and method for data security grading | |
CN112639786B (zh) | 智能地标 | |
CN112348041A (zh) | 日志分类、日志分类训练方法及装置、设备、存储介质 | |
US20150286700A1 (en) | Recording medium having stored thereon database access control program, method for controlling database access, and information processing apparatus | |
Singh | NoSQL: A new horizon in big data | |
US11436220B1 (en) | Automated, configurable and extensible digital asset curation tool | |
US11500933B2 (en) | Techniques to generate and store graph models from structured and unstructured data in a cloud-based graph database system | |
Glumenko et al. | Characteristics of the development of an it project for creation of open educational resource | |
US20240012827A1 (en) | Cleaning and organizing schemaless semi-structured data for extract, transform, and load processing | |
Guo | Distributed Time Series Analytics | |
Albawi et al. | Review Previous Solutions To Query Based Uncertain Object Determining | |
Bagwari et al. | Indexing optimizations on Hadoop |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |