CN117677942A - 数据治理系统和方法 - Google Patents
数据治理系统和方法 Download PDFInfo
- Publication number
- CN117677942A CN117677942A CN202280042839.4A CN202280042839A CN117677942A CN 117677942 A CN117677942 A CN 117677942A CN 202280042839 A CN202280042839 A CN 202280042839A CN 117677942 A CN117677942 A CN 117677942A
- Authority
- CN
- China
- Prior art keywords
- data
- assets
- asset
- criteria
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 163
- 238000013523 data management Methods 0.000 title description 10
- 238000012545 processing Methods 0.000 claims abstract description 189
- 238000004891 communication Methods 0.000 claims description 62
- 238000003860 storage Methods 0.000 claims description 44
- 230000004044 response Effects 0.000 claims description 30
- 238000005067 remediation Methods 0.000 abstract description 6
- 238000012552 review Methods 0.000 description 76
- 238000005516 engineering process Methods 0.000 description 65
- 230000008569 process Effects 0.000 description 25
- 239000000470 constituent Substances 0.000 description 19
- 238000010586 diagram Methods 0.000 description 14
- 238000007726 management method Methods 0.000 description 9
- 230000008520 organization Effects 0.000 description 9
- 230000002688 persistence Effects 0.000 description 9
- 238000012795 verification Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 238000012550 audit Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000005055 memory storage Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Abstract
一些实施例涉及一种与由数据处理系统管理的多个数据资产的治理结合使用的方法,该方法包括:使用至少一个计算机硬件处理器执行以下操作:访问包括第一数据标准的数据治理策略(例如,通过获得关于存储在数据库系统中的第一标准的信息);至少部分地通过使用至少一个数据资产准则从由该数据处理系统管理的多个数据资产中自动选择满足该至少一个数据资产准则的一个或多个数据资产来生成第一数据资产集合;将该第一数据资产集合与该第一数据标准相关联;以及验证该第一数据资产集合中的一个或多个数据资产中的至少一个是否符合该第一数据标准。
Description
相关申请的交叉引用
本申请根据35U.S.C.119(e)要求于2021年6月15日提交的名称为“DATAGOVERNANCE SYSTEMS AND METHODS[数据治理系统和方法]”的美国临时专利申请号63/210,951以及于2021年12月31日提交的名称为“DATA GOVERNANCE SYSTEMS ANDMETHODS[数据治理系统和方法]”的美国临时专利申请号63/295,693的优先权权益,这些美国临时专利申请中的每一个特此通过援引以其全文并入本文。
技术领域
本披露的各方面涉及用于由数据处理系统管理的数据的数据治理技术。具体地,本披露的各方面提供了用于高效地验证由数据处理系统管理的数据资产是否符合一个或多个数据治理策略的技术。
背景技术
现代数据处理系统管理大量数据(例如,数百万、数十亿或数万亿条数据记录)并管理这些数据的访问方式(例如,创建、更新、读取或删除)。由数据处理系统管理的数据可以是任何合适的类型。例如,由数据处理系统管理的数据可以包括交易、文档、表格、文件或任何其他合适类型的数据。作为另一示例,由数据处理系统管理的数据可以包括“元数据”,元数据是包含关于(例如,存储在同一数据处理系统和/或另一数据处理系统中的)其他数据的信息的数据。例如,数据处理系统可以存储关于存储在信用卡公司数据库的表中的信用卡交易数据的元数据。这种元数据的非限制性示例包括指示以下各项的信息:存储器中的表的大小;表的创建时间;表的最后更新时间;表中的行和/或列的数量;表的存储位置;谁有权对数据表进行读取、更新、删除或执行任何其他合适的(多个)动作。
发明内容
一些实施例提供了一种用于确定由数据处理系统管理的数据是否符合数据治理策略的方法。该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对。该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则。该方法包括:使用至少一个计算机硬件处理器执行以下操作:接收指示用于将数据资产纳入第一数据资产集合中的至少一个准则的用户输入;通过从该多个数据资产中自动识别满足该至少一个准则的数据资产来生成该第一数据资产集合;从该数据治理策略的一个或多个数据标准中选择第一数据标准;将该第一数据标准与该第一数据资产集合相关联;以及至少部分地通过验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
在一些实施例中,该至少一个准则指示数据资产中的至少一个属性为满足该至少一个准则而必须具有的至少一个值。在一些实施例中,该方法进一步包括:从该数据的一个或多个数据标准中选择第二数据标准;将该第二数据标准与该第一数据资产集合相关联;以及至少部分地通过验证该第一数据资产集合中的数据资产是否满足由该第二数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
在一些实施例中,该方法进一步包括:在验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指定的一个或多个规则之前,使用该至少一个准则来更新该第一数据资产集合。在一些实施例中,使用该至少一个准则来更新该第一数据资产集合包括:识别该多个数据资产中不在该第一数据资产集合中且满足该至少一个准则的至少一个数据资产;以及响应于识别到满足该至少一个准则的至少一个数据资产,将该至少一个数据资产添加到该数据资产集合。在一些实施例中,使用该至少一个数据资产准则来更新第一动态数据资产集合包括:识别该第一数据资产集合中不再满足该至少一个数据资产准则的至少一个数据资产;以及响应于识别到不满足该至少一个数据资产准则的至少一个数据资产,从该第一数据资产集合中移除该至少一个数据资产。
在一些实施例中,将该第一数据标准与该第一数据资产集合相关联包括:通过图形用户界面(GUI)接收指示从多个数据资产集合中选择该第一数据资产集合的用户输入;以及响应于接收到该用户输入,将该第一数据标准与该第一数据资产集合相关联。在一些实施例中,将该第一数据标准与该第一数据资产集合相关联包括:通过图形用户界面(GUI)接收指示选择该第一数据标准的用户输入;以及响应于接收到该用户输入,将该第一数据标准与该第一数据资产集合相关联。在一些实施例中,该GUI显示表示多个数据资产集合的GUI元素,并且该用户输入通过指示选择这些GUI元素之一来指示选择该第一数据资产集合。在一些实施例中,在选择该第一数据资产集合之后,该GUI显示指示满足该至少一个准则的一个或多个数据资产的信息。在一些实施例中,该GUI包括允许用户搜索满足该至少一个准则的数据资产的界面。
在一些实施例中,该方法进一步包括:生成显示该第一数据资产集合中的至少一些数据资产的列表的第一GUI;生成显示关于该第一数据标准的信息的第一GUI,该信息包括该第一数据资产集合的指示;通过该第一GUI接收指示选择该至少一些数据资产的列表中的数据资产的用户输入;以及响应于接收到该用户输入,生成显示关于所选数据资产的信息的第二GUI。
在一些实施例中,验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指示的一个或多个规则包括针对该第一数据资产集合中的至少一个数据资产进行以下操作:基于该至少一个数据资产的至少一个属性来识别用于确定该至少一个数据资产是否满足由该第一数据标准指示的一个或多个规则的用户;通过通信网络向与该用户相关联的计算设备发送关于该至少一个数据资产和该第一数据标准的信息;以及通过该通信网络从与该用户相关联的计算设备接收指示该至少一个数据资产是否满足由该第一数据标准指示的一个或多个规则的信息。
在一些实施例中,验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指示的一个或多个规则包括针对该第一数据资产集合中的至少一些数据资产中的每项特定数据资产进行以下操作:基于该特定数据资产的至少一个属性来识别用于确定该特定数据资产是否满足由该第一数据标准指示的一个或多个规则的用户;通过通信网络向与该用户相关联的计算设备发送关于该特定数据资产和该第一数据标准的信息;以及通过该通信网络从与该用户相关联的计算设备接收指示该特定数据资产是否满足由该第一数据标准指示的一个或多个规则的信息。在一些实施例中,指示该特定数据资产是否满足由该第一数据标准指示的一个或多个规则的信息包括该用户关于该特定数据资产是否满足由该第一数据标准指示的一个或多个规则的证明。
在一些实施例中,验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指示的一个或多个规则包括自动这些验证数据资产是否满足由该第一数据标准指示的一个或多个规则。在一些实施例中,该方法进一步包括:接收指示用于将数据资产纳入第二数据资产集合中的至少一个第二准则的用户输入;通过从该多个数据资产中自动识别满足用于将数据资产纳入该第二数据资产集合的该至少一个第二准则的数据资产来生成该第二数据资产集合;从该数据治理策略的一个或多个数据标准中选择第二数据标准;将该第二数据标准与该第二数据资产集合相关联;以及至少部分地通过验证该第二数据资产集合中的数据资产是否满足由该第二数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
在一些实施例中,该方法进一步包括:从该数据治理策略的一个或多个数据标准中选择第二数据标准;将该第二数据标准与该第一数据资产集合相关联;以及至少部分地通过验证该第一数据资产集合中的数据资产是否满足由该第二数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。在一些实施例中,将该第一数据标准与该第一数据资产集合相关联包括将该第一数据资产集合的指示存储在该第一数据标准中。在一些实施例中,由该数据处理系统管理的数据所管理的数据包括与企业系统中的数据相关联的信息。
一些实施例提供了一种存储指令的非暂态计算机可读存储介质。这些指令当由至少一个计算机硬件处理器执行时,使得该至少一个计算机硬件处理器执行用于确定由数据处理系统管理的数据是否符合数据治理策略的方法。该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对。该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则。该方法包括:接收指示用于将数据资产纳入第一数据资产集合中的至少一个准则的用户输入;通过从该多个数据资产中自动识别满足该至少一个准则的数据资产来生成该第一数据资产集合;从该数据治理策略的一个或多个数据标准中选择第一数据标准;将该第一数据标准与该第一数据资产集合相关联;以及至少部分地通过验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
一些实施例提供了一种用于确定由数据处理系统管理的数据是否符合数据治理策略的系统。该数据处理系统将数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对。该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则。该系统包括:至少一个计算机硬件处理器;以及存储有指令的至少一个非暂态计算机可读存储介质,这些指令当由该至少一个计算机硬件处理器执行时使得该至少一个计算机硬件处理器执行以下操作:接收指示用于将数据资产纳入第一数据资产集合中的至少一个准则的用户输入;通过从该多个数据资产中自动识别满足该至少一个准则的数据资产来生成该第一数据资产集合;从该数据治理策略的一个或多个数据标准中选择第一数据标准;将该第一数据标准与该第一数据资产集合相关联;以及至少部分地通过验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
一些实施例提供了一种用于确定由数据处理系统管理的数据是否符合数据治理策略的方法。该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对。该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则。该一个或多个数据标准各自与一个或多个数据资产集合相关联。该一个或多个数据标准包括与该一个或多个数据资产集合中的第一数据资产集合相关联的第一数据标准。该方法包括:使用至少一个计算机硬件处理器执行以下操作:访问来自与该第一数据标准相关联的第一数据资产集合的第一数据资产;基于该第一数据资产中的数据识别用于证明该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一用户;通过通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第一数据标准的信息;通过该通信网络从该第一计算设备获得第一输入,该第一输入指示该第一用户关于该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一证明;以及使用指示该第一证明的第一输入来确定由该数据处理系统管理的数据是否符合该数据治理策略。
在一些实施例中,该至少一个准则指示数据资产中的至少一个属性为满足该至少一个准则而必须具有的至少一个值。在一些实施例中,该方法进一步包括:访问来自该第一数据资产集合的第二数据资产;基于该第二数据资产的至少一个属性-值对来识别用于证明该第二数据资产是否满足由该第一数据标准指示的一个或多个规则的第二用户;通过该通信网络向与该第二用户相关联的第二计算设备发送关于该第二数据资产和该第一数据标准的信息;通过该通信网络从该第二计算设备获得第二输入,该第二输入指示该第二用户关于该第二数据资产是否满足由该第一数据标准指示的一个或多个规则的第二证明;以及使用指示该第二证明的第二输入来确定由该数据处理系统管理的数据是否符合该数据治理策略。
在一些实施例中,识别用于证明该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一用户包括:将由该第一数据资产的至少一个属性-值对指示的一个或多个用户识别为负责管理该第一数据资产;以及从该一个或多个用户中选择该第一用户。在一些实施例中,获得指示第一证明的第一用户输入包括通过GUI获得该第一用户输入。在一些实施例中,该方法进一步包括通过该通信网络从该第一计算设备获得指示该第一用户关于该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一证明的证据的信息。
在一些实施例中,该方法进一步包括跟踪关于第一数据资产集合中的数据资产是否满足由该第一数据标准指示的一个或多个规则的多个证明。在一些实施例中,该方法进一步包括生成指示这些证明的完成程度的GUI元素。在一些实施例中,该方法进一步包括生成该第一数据资产的第一证明对象;以及将指示该第一证明的信息存储在该第一证明对象中。在一些实施例中,该方法进一步包括将该第一数据标准与该第一数据资产的关联存储在该第一证明对象中。
在一些实施例中,该第一证明指示该第一数据资产满足该第一数据标准、部分满足该第一标准、未定义、不满足该第一标准、或者该第一数据标准不适用于该第一数据资产。在一些实施例中,该第一数据资产集合与该一个或多个数据标准中的第二数据标准相关联,并且该方法进一步包括:基于该第一数据资产的至少一个属性-值对来识别用于证明该第一数据资产是否满足由该第二数据标准指示的一个或多个规则的第一用户;通过该通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第二数据标准的信息;通过该通信网络从该第一计算设备获得第二输入,该第二输入指示该第一用户关于该第一数据资产是否满足由该第二数据标准指示的一个或多个规则的第二证明;以及使用指示该第二证明的第二输入来确定由该数据处理系统管理的数据是否符合该数据治理策略。
一些实施例提供了一种存储指令的非暂态计算机可读存储介质。这些指令当由至少一个计算机硬件处理器执行时,使得该至少一个计算机硬件处理器执行用于确定由数据处理系统管理的数据是否符合数据治理策略的方法。该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对。该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则。该一个或多个数据标准各自与一个或多个数据资产集合相关联。该一个或多个数据标准包括与该一个或多个数据资产集合中的第一数据资产集合相关联的第一数据标准。该方法包括:访问来自与该第一数据标准相关联的第一数据资产集合的第一数据资产;基于该第一数据资产中的数据识别用于证明该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一用户;通过通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第一数据标准的信息;通过该通信网络从该第一计算设备获得第一输入,该第一输入指示该第一用户关于该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一证明;以及使用指示该第一证明的第一输入来确定由该数据处理系统管理的数据是否符合该数据治理策略。
一些实施例提供了一种用于确定由数据处理系统管理的数据是否符合数据治理策略的系统。该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对。该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则。该一个或多个数据标准各自与一个或多个数据资产集合相关联。该一个或多个数据标准包括与该一个或多个数据资产集合中的第一数据资产集合相关联的第一数据标准。该系统包括:至少一个计算机硬件处理器;以及存储有指令的至少一个非暂态计算机可读存储介质,这些指令当由该至少一个计算机硬件处理器执行时使得该至少一个计算机硬件处理器执行以下操作:访问来自与该第一数据标准相关联的第一数据资产集合的第一数据资产;基于该第一数据资产中的数据识别用于证明该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一用户;通过通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第一数据标准的信息;通过该通信网络从该第一计算设备获得第一输入,该第一输入指示该第一用户关于该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一证明;以及使用指示该第一证明的第一输入来确定由该数据处理系统管理的数据是否符合该数据治理策略。
一些实施例提供了一种与由数据处理系统管理的多个数据资产的治理结合使用的方法。该方法包括:使用至少一个计算机硬件处理器执行以下操作:访问包括第一数据标准的数据治理策略;至少部分地通过使用至少一个数据资产准则从由该数据处理系统管理的多个数据资产中自动选择满足该至少一个数据资产准则的一个或多个数据资产来生成第一数据资产集合;将该第一数据资产集合与该第一数据标准相关联;以及验证该第一数据资产集合中的一个或多个数据资产中的至少一个是否符合该第一数据标准。
在一些实施例中,该第一数据资产集合中的一个或多个数据资产中的至少一个包括第一数据资产,并且该验证包括:基于该第一数据资产的至少一个属性识别用于证明该第一数据资产是否符合该第一数据标准的第一用户。在一些实施例中,该方法进一步包括使用该至少一个数据资产准则来更新该第一数据资产集合。在一些实施例中,使用该至少一个数据资产准则来更新第一数据资产集合包括:识别该多个数据资产中不在该第一数据资产集合中且满足该至少一个数据资产准则的一个或多个数据资产;以及响应于识别到满足该至少一个数据资产准则的一个或多个数据资产,将该一个或多个数据资产添加到该第一数据资产集合。在一些实施例中,使用该至少一个数据资产准则来更新第一数据资产集合包括:识别该第一数据资产集合中不再满足该至少一个数据资产准则的一个或多个数据资产;以及响应于识别到不满足该至少一个数据资产准则的一个或多个数据资产,从该第一数据资产集合中移除该一个或多个数据资产。
在一些实施例中,该方法进一步包括:至少部分地通过使用至少一个其他数据资产准则从该多个数据资产中自动选择满足该至少一个其他数据资产准则的一个或多个数据资产来生成第二数据资产集合;将该第二数据资产集合与该第一数据标准相关联;以及验证该第二数据资产集合中的一个或多个数据资产中的至少一个是否符合该第一数据标准。在一些实施例中,该数据治理策略包括第二数据标准并且该方法进一步包括:至少部分地通过使用至少一个其他数据资产准则从该多个数据资产中自动选择满足该至少一个其他数据资产准则的一个或多个数据资产来生成第二数据资产集合;将该第二数据资产集合与该第二数据标准相关联;以及验证该第二数据资产集合中的一个或多个数据资产中的至少一个是否符合该第二数据标准。
在一些实施例中,该数据治理策略包括第二数据标准,并且该方法进一步包括:将该第一数据资产集合与该第二数据标准相关联;以及验证该第一数据资产集合中的至少一个数据资产是否符合该第二数据标准。在一些实施例中,将该第一数据资产集合与该第一数据标准相关联包括将该第一数据资产集合的指示存储在该第一数据标准中。在一些实施例中,使用该第一至少一个数据资产准则来生成第一数据资产集合包括:从由该数据处理系统管理的多个数据资产中识别满足该至少一个数据资产准则的一个或多个数据资产;以及将所识别的一个或多个数据资产包括在该第一数据资产集合中。
在一些实施例中,将该第一数据资产集合与该第一数据标准相关联包括:通过图形用户界面(GUI)接收指示要将该第一数据资产集合与该第一数据标准相关联的用户输入。在一些实施例中,该GUI显示表示多个数据资产集合的GUI元素,并且该用户输入通过选择这些GUI元素之一来指示选择该第一数据资产集合。在一些实施例中,在选择该第一数据资产集合之后,该GUI显示指示满足该至少一个数据资产准则的一个或多个数据资产的信息。在一些实施例中,该GUI包括允许用户搜索满足该至少一个数据资产准则的数据资产的界面。
在一些实施例中,该第一数据资产集合包括多个数据资产,该方法进一步包括:生成显示该第一数据资产集合中的多个数据资产中的至少一些数据资产的列表的第一GUI;生成显示关于该第一数据标准的信息的第一GUI,该信息包括该第一数据资产集合的指示;通过该第一GUI接收指示选择该至少一些数据资产的列表中的数据资产的用户输入;以及响应于接收到该用户输入,生成显示关于所选数据资产的信息的第二GUI。在一些实施例中,该数据治理策略包括多个数据标准,该方法进一步包括:生成显示关于该数据治理策略的信息的第一GUI,关于该数据治理策略的信息包括该第一数据标准的指示;生成显示该多个数据标准中的至少一些数据标准的列表的第一GUI,该至少一些数据标准包括该第一数据标准;通过该第一GUI接收指示从该列表中选择该第一数据标准的用户输入;以及响应于接收到该用户输入,生成显示关于该第一数据标准的信息的第二GUI。
一些实施例提供了一种与由数据处理系统管理的多个数据资产的治理结合使用的系统。该系统包括:至少一个计算机硬件处理器;以及存储有指令的至少一个非暂态计算机可读存储介质,这些指令当由该至少一个计算机硬件处理器执行时使得该至少一个硬件处理器执行以下操作:访问包括第一数据标准的数据治理策略;至少部分地通过使用至少一个数据资产准则从由该数据处理系统管理的多个数据资产中自动选择满足该至少一个数据资产准则的一个或多个数据资产来生成第一数据资产集合;将该第一数据资产集合与该第一数据标准相关联;以及验证该第一数据资产集合中的一个或多个数据资产中的至少一个是否符合该第一数据标准。
一些实施例提供了一种存储指令的非暂态计算机可读存储介质。这些指令当由至少一个计算机硬件处理器执行时,使得该至少一个计算机硬件处理器执行以下操作:访问包括第一数据标准的数据治理策略;至少部分地通过使用至少一个数据资产准则从由数据处理系统管理的多个数据资产中自动选择满足该至少一个数据资产准则的一个或多个数据资产来生成第一数据资产集合;将该第一数据资产集合与该第一数据标准相关联;以及验证该第一数据资产集合中的一个或多个数据资产中的至少一个是否符合该第一数据标准。
一些实施例提供了一种方法,该方法包括:使用至少一个计算机硬件处理器验证由该数据处理系统管理的数据资产是否符合包括与第一数据资产相关联的第一数据标准的数据治理策略,该验证包括:基于该第一数据资产的至少一个属性识别用于证明该第一数据资产是否符合该第一数据标准的第一用户;通过通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第一数据标准的信息;通过该通信网络从该第一计算设备获得第一输入,该第一输入指示该第一用户关于该第一数据资产是否符合该第一数据标准的第一证明;以及基于指示该第一证明的输入来验证该第一数据资产是否符合该第一数据标准。
在一些实施例中,识别用于证明该第一数据资产是否符合该第一数据标准的第一用户包括确定该第一用户负责管理该第一数据资产。在一些实施例中,确定该第一用户负责管理该第一数据资产包括访问与该数据资产相关联的指示该第一用户负责该第一数据资产的信息。
在一些实施例中,该第一数据标准与第二数据资产相关联,并且该方法进一步包括:基于该第二数据资产的至少一个属性识别用于证明该第二数据资产是否符合该第二数据标准的第二用户;通过该通信网络向与该第二用户相关联的第二计算设备发送关于该第二数据资产和该第一数据标准的信息;通过该通信网络从该第二计算设备获得第二输入,该第二输入指示该第二用户关于该第二数据资产是否符合该第一数据标准的第二证明;以及基于该第二证明验证该第二数据资产是否符合该第二数据标准。
在一些实施例中,该数据治理策略包括与第二数据资产相关联的第二数据标准,并且该方法进一步包括:基于该第二数据资产的至少一个属性识别用于证明该第一数据资产是否符合该第二数据标准的第二用户;通过该通信网络向与该第二用户相关联的第二计算设备发送关于该第二数据资产和该第二数据标准的信息;通过该通信网络从该第二计算设备获得第二输入,该第二输入指示该第二用户关于该第二数据资产是否符合该第二数据标准的第二证明;以及基于该第二证明验证该第二数据资产是否符合该第二数据标准。
在一些实施例中,该数据治理策略包括与第二数据资产相关联的第二数据标准,并且该方法进一步包括:基于该第二数据资产的至少一个属性识别用于证明该第一数据资产是否符合该第二数据标准的第一用户;通过该通信网络向该第一计算设备发送关于该第二数据资产和该第二数据标准的信息;通过该通信网络从该第一计算设备获得第二输入,该第二输入指示该第一用户关于该第二数据资产是否符合该第二数据标准的第二证明;以及基于该第二证明验证该第二数据资产是否符合该第二数据标准。
在一些实施例中,该方法进一步包括生成第一证明对象,以及将指示该第一证明的第一输入存储在该第一证明对象中。在一些实施例中,该方法进一步包括将该第一数据标准与该第一数据资产的关联存储在该第一证明对象中。在一些实施例中,获得指示第一证明的第一用户输入包括通过GUI获得该第一用户输入。在一些实施例中,该GUI显示指示该第一标准与该第一数据资产的关联的信息。在一些实施例中,该第一证明指示该第一数据资产符合该第一数据标准、部分符合该第一标准、未定义、不适用、或不符合该第一标准。在一些实施例中,该方法进一步包括通过该通信网络从该第一计算设备获得指示该第一证明的证据的信息。
一些实施例提供了一种系统。该系统包括:至少一个计算机硬件处理器;以及存储有指令的至少一个非暂态计算机可读存储介质,这些指令当由该至少一个计算机硬件处理器执行时使得该至少一个硬件处理器执行以下操作:使用至少一个计算机硬件处理器验证由该数据处理系统管理的数据资产是否符合包括与第一数据资产相关联的第一数据标准的数据治理策略,该验证包括:基于该第一数据资产的至少一个属性识别用于证明该第一数据资产是否符合该第一数据标准的第一用户;通过通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第一数据标准的信息;通过该通信网络从该第一计算设备获得第一输入,该第一输入指示该第一用户关于该第一数据资产是否符合该第一数据标准的第一证明;以及基于指示该第一证明的输入来验证该第一数据资产是否符合该第一数据标准。
一些实施例提供了一种存储指令的非暂态计算机可读存储介质。这些指令当由至少一个计算机硬件处理器执行时,使得该至少一个计算机硬件处理器执行以下操作:使用至少一个计算机硬件处理器验证由该数据处理系统管理的数据资产是否符合包括与第一数据资产相关联的第一数据标准的数据治理策略,该验证包括:基于该第一数据资产的至少一个属性识别用于证明该第一数据资产是否符合该第一数据标准的第一用户;通过通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第一数据标准的信息;通过该通信网络从该第一计算设备获得第一输入,该第一输入指示该第一用户关于该第一数据资产是否符合该第一数据标准的第一证明;以及基于指示该第一证明的输入来验证该第一数据资产是否符合该第一数据标准。
一些实施例提供了一种用于处理由数据处理系统管理的数据资产的方法。该方法包括:使用至少一个计算机硬件处理器执行以下操作:访问多个数据标准,每个数据标准指定数据资产为满足该数据标准而必须满足的一个或多个规则;生成多个数据资产集合,每个数据资产集合包括数据集合,该生成包括对于每个数据资产集合,使用至少一个数据资产准则从由该数据处理系统管理的多个数据资产中自动选择满足该至少一个数据资产准则的一个或多个数据资产;将每个数据资产集合与该多个数据标准中的一个或多个相关联;通过进行以下操作验证每个数据资产集合中的一个或多个数据资产中的至少一个是否符合一个或多个相关联的数据标准中的每一个:对于每个数据资产集合中的一个或多个数据资产中的至少一个数据资产中的每一个,基于该数据资产的至少一个属性识别用于证明该数据资产是否符合该数据标准的用户;确定与所识别的用户相关联的计算设备;通过通信网络向与所识别用户相关联的所识别计算设备发送关于该数据资产和该数据标准的信息;通过该通信网络从该计算设备获得输入,该输入指示该用户关于该数据资产是否符合该数据标准的证明;以及基于指示该证明的输入来验证该数据资产是否符合该数据标准。
在一些实施例中,针对不同数据资产集合识别的至少一些用户是不同的。在一些实施例中,该数据处理系统进一步包括用于每个用户的队列,并且该方法进一步包括存储要由相应用户执行的证明队列,这些证明包括关于一个或多个数据资产和一个或多个相关联的数据标准的信息。
以上是非限制性总结。
附图说明
将参考以下附图描述各个方面和实施例。应当理解,附图不一定按比例绘制。出现在多个附图中的项在其出现的所有附图中由相同或相似的附图标记指示。
图1示出了实施用于数据资产的传统数据治理技术的系统的简图10。
图2A示出了根据本文描述的技术的一些实施例的数据处理系统100的简图。
图2B示出了根据本文描述的技术的一些实施例的促进图2A的数据处理系统100中的数据治理的示例系统。
图2C示出了根据本文描述的技术的一些实施例的在对数据资产进行更新之后的图2B的系统。
图2D示出了根据本文描述的技术的一些实施例的图2B的系统如何获得证明的示例。
图2E示出了根据本文描述的技术的一些实施例的合规项目的示例图形用户界面(GUI)。
图2F示出了图示根据本文描述的技术的一些实施例的促进数据处理系统100中的治理的示例系统的各部件之间的交互的简图。
图3示出了图示根据本文描述的技术的一些实施例的示例合规项目的生成的简图。
图4A示出了根据本文描述的技术的一些实施例的数据治理策略232和作为构成要素的数据标准234的示例。
图4B示出了根据本文描述的技术的一些实施例的合规项目238和作为构成要素的合规审查122的示例。
图5A是图示根据本文描述的技术的一些实施例的可以在其中使用数据处理系统100的示例环境200的简图。
图5B示出了图示根据本文描述的技术的一些实施例的示例数据处理系统100的各方面的框图。
图6示出了根据本文描述的技术的一些实施例的与由数据处理系统管理的数据资产的治理结合使用的示例过程600的流程图。
图7示出了根据本文描述的技术的一些实施例的验证由系统管理的数据资产是否符合包括与数据资产相关联的数据标准的数据治理策略的示例过程700的流程图。
图8是根据本文描述的技术的一些实施例的显示关于数据治理策略的信息的示例图形用户界面(GUI)800的图示。
图9是根据本文描述的技术的一些实施例的显示关于数据标准的信息的示例图形用户界面(GUI)900的图示。
图10是根据本文描述的技术的一些实施例的允许用户从现有数据资产集合的列表中选择数据资产集合以与数据标准相关联的示例图形用户界面(GUI)1000的图示。
图11是根据本文描述的技术的一些实施例的允许用户创建新的数据资产集合以与数据标准相关联的示例图形用户界面(GUI)1100的图示。
图12是根据本文描述的技术的一些实施例的允许用户创建新的数据资产集合以与数据标准相关联的示例图形用户界面(GUI)1200的图示。
图13是根据本文描述的技术的一些实施例的显示关于数据标准的信息的示例图形用户界面(GUI)1300的图示。
图14是根据本文描述的技术的一些实施例的显示关于合规项目的信息的示例图形用户界面(GUI)1400的图示。
图15是根据本文描述的技术的一些实施例的显示关于合规审查的信息的示例图形用户界面(GUI)1500的图示。
图16是根据本文描述的技术的一些实施例的显示关于证明的信息的示例图形用户界面(GUI)1600的图示。
图17是根据本文描述的技术的一些实施例的显示关于多个合规项目的信息的示例图形用户界面(GUI)1700的图示。
图18是根据本文描述的技术的一些实施例的显示关于合规项目的证明状态的信息的示例图形用户界面(GUI)1800的图示。
图19是根据本文描述的技术的一些实施例的允许用户对一个或证明执行编辑的示例图形用户界面(GUI)1900的图示。
图20是根据本文描述的技术的一些实施例的允许用户签署一个或多个证明的示例图形用户界面(GUI)2000的图示。
图21是根据本文描述的技术的一些实施例的显示关于与数据资产相关的证明的信息的示例图形用户界面(GUI)2100的图示。
图22是可以用于实施本文描述的技术的一些实施例的说明性计算系统2200的框图。
具体实施方式
发明人开发了允许高效验证由数据处理系统管理的数据资产是否符合数据治理策略的新技术。
“数据资产”可以是由数据处理系统管理的任何合适的数据集合。例如,数据资产可以包括一个或多个数据记录、一个或多个数据集、一个或多个文档、一个或多个交易、一个或多个文件、一个或多个表格、和/或前述任一项的集合。作为另一示例,在一些实施例中,数据资产可以包括一个或多个数据实体。在一些这样的实施例中,数据处理系统可以使用数据实体来管理至少一些数据,这些数据实体被用来使用面向对象的范例来组织数据。与面向对象的编程涉及类及其实例的方式类似,可以为数据处理系统配置数据实体的定义并且使用数据实体的实例和数据实体的定义来管理数据。
在一些实施例中,数据资产可以包括数据以及关于数据的信息。在一些实施例中,关于数据的信息可以存储在属性-值对中。例如,数据资产可以包括具有值的一个或多个属性,并且关于数据资产中的数据的信息可以包括属性的值。数据资产可以由数据处理系统以任何合适的格式和/或使用任何合适的(多个)数据结构来存储,因为本文描述的技术的各方面在这方面不受限制。
在一些实施例中,数据处理系统可以管理组织(例如,跨国公司(例如,金融机构、公用事业公司、汽车公司、电子公司等)或其他企业或组织)的数据资产。大型组织可能具有大量数据资产,因此,在一些实施例中,数据处理系统可以用于管理该组织的大量(例如,数百万、数十亿或数万亿)数据资产。
例如,在一些实施例中,数据处理系统可以被配置为管理数百万或数十亿的数据资产。在一些这样的实施例中,数据处理系统可以用于企业环境中的元数据管理,由此数据资产存储关于存储在全球分布式信息技术(IT)基础设施(包括许多数据库、数据仓库、数据湖等)上的各个数据集(例如,表格、交易、文档、数据记录等)的信息。在这种情况下,数据资产可以存储关于对应数据集的信息,如例如数据集的创建时间、存储位置、其大小、允许编辑数据集的(多个)用户的身份、标识哪些应用程序使用数据集的信息、标识数据敏感级别的信息等。由于大型组织(例如,诸如银行或信用卡公司等金融机构、诸如电话或电力公司等公用事业公司)通常会管理数百万或数十亿个这样的数据集,因此可能有数百万或数十亿个将由数据处理系统管理的存储有关于这种数据集的信息的数据资产。由于在这种示例应用中,数据处理系统将存储关于其他数据的信息(有时称为“元数据”),因此这种示例应用可以称为“元数据管理”。然而,应当理解,本文描述的技术不限于用于元数据管理的数据处理系统,并且可以应用于使用数据资产来管理数据的任何数据处理系统,而不管所管理的数据是元数据还是任何其他类型的数据。
在组织的数据的背景下,数据治理是指用于管理和/或管控组织的数据的各个方面的流程、策略、过程和标准,包括但不限于数据质量和完整性、数据安全性、数据隐私、数据版本管理、数据沿袭和数据更改的可追溯性、数据可用性和有用性、和/或组织的数据和/或其管理的任何其他合适的方面。
组织可以通过建立管控由数据处理系统管理的数据的数据治理策略来实施数据治理。在一些实施例中,本文描述的技术提供了一种使得组织的成员能够指定一个或多个数据治理策略的系统,每个数据治理策略包括一个或多个数据标准。数据治理策略可以包括任何合适数量的数据标准(例如,至少一个数据标准、至少两个数据标准、至少5个数据标准、至少10个数据标准、1到50个之间的数据标准、10到100个之间的数据标准、或这些范围内的任何其他合适的范围)。在一些实施例中,数据标准可以指定数据资产为满足数据标准而必须满足的一个或多个规则。通过满足数据标准,数据资产可以至少部分地符合该数据标准所属的数据治理策略(每个数据标准可以是一个或多个数据治理策略的一部分)。数据治理策略及其作为构成要素的数据标准可以由数据处理系统以任何合适的方式(例如,以任何合适的(多个)格式、使用任何合适的(多个)数据结构)来存储,因为本文描述的技术的各方面在这方面不受限制。
作为说明性示例,数据治理策略可以规定由数据处理系统管理的数据中的社会安全号码应当遵循一致的格式。数据治理策略可以包括要求社会安全号码以“NNN-NN-NNNN”的格式存储的数据标准,其中N代表0到9之间的数字。作为另一示例,数据治理策略可以规定应用程序仅使用来自可信源的数据。数据治理策略可以包括指定允许应用程序使用其中的数据的可信源列表的数据标准。作为另一示例,数据治理策略可以规定敏感数据必须满足一个或多个安全准则,并且作为构成要素的数据标准可能要求将数据资产存储在防止外部数据访问的系统上。本文提供了数据治理策略和作为构成要素的数据标准的附加示例。
在实践中,如上所述,组织可能有许多数据治理策略,并且每个策略都有许多数据标准。组织可能拥有可以应用数据治理策略和数据标准的数百万或数十亿的数据资产。例如,诸如银行机构等组织可能拥有存储在全球多个不同位置上的数百万或数十亿数据资产(例如,客户记录、交易记录和/或账户记录)。作为另一示例,诸如电话公司等组织可能拥有存储在全球多个不同位置上的数百万或数十亿数据资产(例如,电话呼叫记录、数据使用记录、客户信息和/或账户信息)。验证由数据处理系统管理的大量(例如,数百万或数十亿)数据资产是否符合各种数据治理策略及其作为构成要素的数据标准是一项重大技术挑战。由于数据资产中的至少一些数据可能会被更新,因此数据资产是动态的,这一事实使这一挑战变得更加复杂。例如,当数据资产包括属性-值对时,一个或多个属性值可能会改变。因此,数据资产可能在一个时间点符合一个或多个数据标准,但在以后的时间点不符合这些数据标准之一。例如,数据资产与特定数据标准的合规性可能取决于数据资产中的属性值,并且如果该属性值改变,则先前合规的数据资产可能不再合规(或反之亦然)。
图1示出了实施用于数据资产16的传统数据治理技术的系统的简图10。如图1所示,该系统包括多个数据治理规则,包括数据治理规则12A、12B、12C、12D。合规管理者18负责手动地将数据治理规则12A、12B、12C、12D中的每一个与可以由系统管理的数百万个数据资产16中的一个或多个相关联。简图10所示的系统将要求合规管理者18将每个数据资产与适用的(多个)数据治理规则相关联。在图1的示例中,合规管理者18手动地将治理规则12A与数据资产16A相关联、将治理规则12B与数据资产16C相关联、将数据治理规则12C与数据资产16D相关联并且将治理规则12D与数据资产16F相关联。
在数据处理系统中,可能存在大量(例如,数千、数百万或更多)数据治理规则所适用的数据资产。此外,数据资产可能会更新,使得新的数据资产可能需要由不同的数据治理规则来治理,和/或数据资产可能不再由数据治理规则来治理。例如,如果治理规则12A不再适用于数据资产16A,则必须手动移除关联。作为另一示例,如果数据资产16D被更新使得治理规则12B适用于数据资产16D,则数据资产16D将必须手动与治理规则12B相关联。因此,该系统无法响应于数据资产的改变而动态地将数据资产与适用的数据治理规则相关联。此外,合规管理者18可能未能将治理规则与治理规则所适用的所有数据资产相关联。在图1的示例中,治理规则12A可能适用于数据资产16B。然而,合规管理者18未能将治理规则12A与数据资产16B相关联。在另一示例中,治理规则12C可能适用于数据资产16E。然而,合规管理者18未能将治理规则12C与数据资产16E相关联。
在图1的系统中,将治理规则12A、12B、12C、12D与相应数据资产相关联的合规管理者18然后还负责确定数据资产是否符合与它们相关联的治理规则。在具有数千甚至数百万个治理规则与数据资产的关联的系统中,合规管理者18可能无法确定系统的数据资产是否符合其适用的治理规则。如图1所示,合规管理者18无法提供关于数据资产是否符合其适用的治理规则的任何指示。此外,合规管理者18可能不是了解特定数据资产以确定该数据资产是否符合适用治理规则的人。因此,该系统无法有效确定数据资产是否符合治理规则。
为了解决上述挑战,发明人开发了一种系统,该系统允许高效验证由数据处理系统管理的数据资产是否符合数据治理策略及其作为构成要素的数据标准。该系统部分地通过使用以下过程实现这一目标:(1)数据处理系统自动将数据资产与适用的数据治理策略和/或数据标准相关联的过程(例如,基于数据资产中数据的值执行关联);以及(2)数据处理系统(a)自动识别要审查数据资产与一个或多个数据标准的合规性的用户(“证明人”)并(b)通过使用户能够证明数据资产是否符合数据治理策略及其作为构成要素的标准的工作流来指导已识别的用户的过程。
在一些实施例中,为了将数据资产与适用的数据治理策略和数据标准相关联,该系统可以被配置为生成数据资产集合,并且将数据资产集合与一个或多个数据标准相关联。数据资产集合可以以任何合适的方式生成。例如,在一些实施例中,该系统可以被配置为使用可以定义数据资产集合的一个或多个准则来生成数据资产集合,使得该数据集合包括满足该一个或多个准则的那些资产并且排除不满足该一个或多个准则的数据资产。例如,在一些实施例中,该系统可以使用一个或多个准则通过从由数据处理系统管理的多个数据资产中选择满足一个或多个准则的那些数据资产来自动生成数据集合。
在一些实施例中,用于将数据资产包括到数据资产集合中的准则可以包括关于数据资产的一个或多个属性的条件。在一些实施例中,针对(多个)属性中的每个属性,该准则可以指示数据资产中的属性为满足该准则而必须具有的一个或多个值。例如,该系统可以将如由其(多个)属性值指示的相同类型的数据资产(例如,信用评分数据资产、客户ID数据资产和/或借记账户数据资产)分组到同一数据资产集合中。作为另一示例,存储与如由其(多个)属性值指示的特定地区或位置(例如,美国、欧洲、日本等)相关联的信息的数据资产可以被分组到同一数据资产集合中。作为又一示例,该系统可以将与如由其(多个)属性值指示的相同系统或相同应用相关联的数据资产分组到同一数据资产集合中。作为又一示例,该系统可以将与如由其(多个)属性值指示的公共安全级别(例如,包含个人可识别信息(PII)的所有资产)相关联的数据资产分组到同一数据资产集合中。更一般地,数据资产可以具有属性值,并且该系统可以基于针对属性值指定的准则将数据资产分组到数据资产集合中(例如,将对于一个或多个属性具有相同或相似值的数据资产分组到同一数据资产集合中,将具有一个或多个特定值或落入指定值范围的一个或多个属性的数据资产分组到同一数据资产集合中等)。在一些实施例中,该系统可以被配置为将数据资产分组到零个、一个、或多个数据资产集合中,因为本文描述的技术的各方面在这方面不受限制。
在一些实施例中,在生成一个或多个数据资产集合之后,该系统可以基于对由数据处理系统管理的数据资产的更新来动态地更新(多个)数据资产集合。例如,当在数据资产被更新之后,更新后的数据资产不再满足被纳入数据资产集合中的准则时,数据处理系统可以从数据资产集合中移除数据资产。作为另一示例,当在数据资产被更新之后,更新后的数据资产满足用于将数据资产包括在数据资产集合中的一个或多个准则时,数据处理系统可以将数据资产添加到数据资产集合。因此,数据治理策略以及数据标准与数据资产的关联可以是动态的并且保持最新以反映数据资产的最新状态。在一些实施例中,该系统可以被配置为周期性地更新数据资产集合。例如,该系统可以根据预定的时间表更新数据资产集合。在一些实施例中,该系统可以被配置为响应于事件来更新数据资产集合。例如,该系统可以响应于用户和/或系统正在访问数据资产集合来更新数据资产集合(例如,结合对数据资产集合内的资产与一个或多个数据标准的合规性的验证)。在一些实施例中,该系统可以被配置为当创建用于确定数据资产集合的合规性的合规项目时更新数据资产集合。该系统可以进一步被配置为在创建数据资产集合之后冻结该数据资产集合(例如,直到合规项目完成)。
在一些实施例中,为了高效地验证数据资产是否符合与包括该数据资产的数据资产集合相关联的数据标准,该系统自动识别用于证明数据资产是否符合适用的数据标准的用户。该系统可以使用来自数据资产的信息来识别用户。在一些实施例中,数据资产可以将其中存储的数据组织成一个或多个属性,这些属性可以具有不同的值,比如数字、字符串或对其他数据资产的引用。数据资产的一个或多个属性可以直接或间接指示对该数据资产负责的用户。该系统可以使用数据资产的属性值自动识别用于证明数据资产是否符合数据标准的用户(例如,由数据资产的“业务数据管理专员”属性指示的用户)。该系统可以向所识别的用户提供关于数据资产和适用的数据标准的信息(例如,通过图形用户界面(GUI))。所识别的用户:(1)可以查看关于数据标准的信息(例如,规则或要求)和关于数据资产的信息(例如,数据资产的属性值);并且(2)证明数据资产是否符合数据标准(例如,满足数据标准的规则和/或要求)。例如,该系统可以提供一个或多个工作流,通过该工作流,用户可以查看关于数据资产和数据标准的信息并提交证明。该系统可以进一步允许和/或要求用户提供证据(例如,文件、声明、链接或其他信息)以支持所提交的证明。该证据可以用于随后确认证明是否正确。
在一些实施例中,本文描述的数据处理系统使得能够定义和监控大规模的合规项目。数据处理系统可以使用合规项目来管理对多个数据资产是否符合一个或多个数据标准的验证。合规项目提供了一种机制,通过该机制可以跨多个计算设备来实施工作流。该系统可以使用这些工作流从用户获得关于数据资产是否符合一个或多个数据标准的信息。在一些实施例中,该信息可以包括用户关于数据资产是否符合(多个)数据标准的证明(例如,通过满足由(多个)数据标准指定的规则)。合规项目可以包括关于数据资产是否符合相应的数据标准和数据治理策略的多个证明。在一些实施例中,该系统可以被配置为将工作流分发给与不同计算设备相关联的多个不同用户。因此,该系统可以将验证分发在多个计算设备上。该系统可以生成关于合规项目的进展的统计数据(例如,其中已完成和未完成的证明的百分比)。因此,合规项目提供了高效的工具和界面,通过该工具和界面,数据处理系统可以管理对数据标准和数据治理策略的合规性验证。
本文描述的是用于数据处理系统中的数据治理的改进技术。具体地,该系统通过数据资产集合来维护数据标准与数据标准所应用的数据资产之间的动态关联。该系统基于数据资产的改变(例如,基于数据资产属性值的改变)来更新数据资产集合。因此,该系统可以维护数据标准与适用数据资产的更新关联。另外,该系统使用数据资产中存储的信息自动识别用于证明数据资产是否符合适用的数据标准的用户。该系统可以使用所识别的用户来创建和管理合规项目,通过该合规项目可以比传统的数据治理系统更高效地验证数据资产是否符合数据标准。
一些实施例涉及一种与由数据处理系统管理的多个数据资产的治理结合使用的方法,该方法包括:使用至少一个计算机硬件处理器执行以下操作:访问包括第一数据标准的数据治理策略(例如,通过获得关于存储在数据库系统中的第一标准的信息);至少部分地通过使用至少一个数据资产准则从由该数据处理系统管理的多个数据资产中自动选择满足该至少一个数据资产准则的一个或多个数据资产来生成第一数据资产集合;将该第一数据资产集合与该第一数据标准相关联;以及验证该第一数据资产集合中的一个或多个数据资产中的至少一个是否符合该第一数据标准。
在一些实施例中,该第一数据资产集合中的一个或多个数据资产中的至少一个包括第一数据资产,并且其中,该验证包括:基于该第一数据资产的至少一个属性识别用于证明该第一数据资产是否符合该第一数据标准的第一用户(例如,负责第一数据资产的人)。
在一些实施例中,该方法包括使用至少一个数据资产准则来更新第一数据资产集合(例如,以反映由数据处理系统管理的数据资产的最新状态)。在一些实施例中,使用该至少一个数据资产准则来更新第一数据资产集合包括:识别该多个数据资产中不在该第一数据资产集合中且满足该至少一个数据资产准则的一个或多个数据资产;以及响应于识别到满足该至少一个数据资产准则的一个或多个数据资产,将该一个或多个数据资产添加到该第一数据资产集合。在一些实施例中,使用该至少一个数据资产准则来更新第一数据资产集合包括:识别该第一数据资产集合中不再满足该至少一个数据资产准则的一个或多个数据资产;以及响应于识别到不满足该至少一个数据资产准则的一个或多个数据资产,从该第一数据资产集合中移除该一个或多个数据资产。
在一些实施例中,该方法包括:至少部分地通过使用至少一个其他数据资产准则从该多个数据资产中自动选择满足该至少一个其他数据资产准则的一个或多个数据资产来生成第二数据资产集合;将该第二数据资产集合与该第一数据标准相关联;以及验证该第二数据资产集合中的一个或多个数据资产中的至少一个是否符合该第一数据标准。
在一些实施例中,该数据治理策略包括第二数据标准并且该方法进一步包括:至少部分地通过使用至少一个其他数据资产准则从该多个数据资产中自动选择满足该至少一个其他数据资产准则的一个或多个数据资产来生成第二数据资产集合;将该第二数据资产集合与该第二数据标准相关联;以及验证该第二数据资产集合中的一个或多个数据资产中的至少一个是否符合该第二数据标准。
在一些实施例中,该数据治理策略包括第二数据标准,并且该方法进一步包括:将该第一数据资产集合与该第二数据标准相关联;以及验证该第一数据资产集合中的至少一个数据资产是否符合该第二数据标准。在一些实施例中,将该第一数据资产集合与该第一数据标准相关联包括将该第一数据资产集合的指示存储在该第一数据标准中。例如,该第一数据标准可以存储对第一数据资产集合的引用。
在一些实施例中,使用该第一至少一个数据资产准则来生成第一数据资产集合包括:从由该数据处理系统管理的多个数据资产中识别满足该至少一个数据资产准则的一个或多个数据资产;以及将所识别的一个或多个数据资产包括在该第一数据资产集合中。
在一些实施例中,将该第一数据资产集合与该第一数据标准相关联包括:通过图形用户界面(GUI)接收指示要将该第一数据资产集合与该第一数据标准相关联的用户输入。在一些实施例中,该GUI显示表示多个数据资产集合的GUI元素,并且该用户输入通过选择这些GUI元素之一来指示选择该第一数据资产集合。在一些实施例中,在选择该第一数据资产集合之后,该GUI显示指示满足该至少一个数据资产准则的一个或多个数据资产的信息。在一些实施例中,该GUI包括允许用户搜索满足该至少一个数据资产准则的数据资产的界面。
在一些实施例中,该第一数据资产集合包括多个数据资产,该方法进一步包括:生成显示该第一数据资产集合中的多个数据资产中的至少一些数据资产的列表的第一GUI;生成显示关于该第一数据标准的信息的第一GUI,该信息包括该第一数据资产集合的指示;通过该第一GUI接收指示选择该至少一些数据资产的列表中的数据资产的用户输入;以及响应于接收到该用户输入,生成显示关于所选数据资产的信息的第二GUI。
在一些实施例中,该数据治理策略包括多个数据标准,并且该方法进一步包括:生成显示关于该数据治理策略的信息的第一GUI,关于该数据治理策略的信息包括该第一数据标准的指示;生成显示该多个数据标准中的至少一些数据标准的列表的第一GUI,该至少一些数据标准包括该第一数据标准;通过该第一GUI接收指示从该列表中选择该第一数据标准的用户输入;以及响应于接收到该用户输入,生成显示关于该第一数据标准的信息的第二GUI。
一些实施例使用至少一个计算机硬件处理器验证由该数据处理系统管理的数据资产是否符合包括与第一数据资产相关联的第一数据标准的数据治理策略,该验证包括:基于该第一数据资产的至少一个属性识别用于证明该第一数据资产是否符合该第一数据标准的第一用户(例如,谁负责第一数据资产);通过通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第一数据标准的信息;通过该通信网络从该第一计算设备获得第一输入,该第一输入指示该第一用户关于该第一数据资产是否符合该第一数据标准的第一证明;以及基于指示该第一证明的输入来验证该第一数据资产是否符合该第一数据标准。
在一些实施例中,识别用于证明该第一数据资产是否符合该第一数据标准的第一用户包括确定该第一用户负责管理该第一数据资产(例如,基于第一数据资产的属性值)。在一些实施例中,确定该第一用户负责管理该第一数据资产包括访问与该数据资产相关联的指示该第一用户负责该第一数据资产的信息。
在一些实施例中,该第一数据标准与第二数据资产相关联,并且该方法进一步包括:基于该第二数据资产的至少一个属性识别用于证明该第二数据资产是否符合该第二数据标准的第二用户;通过该通信网络向与该第二用户相关联的第二计算设备发送关于该第二数据资产和该第一数据标准的信息;通过该通信网络从该第二计算设备获得第二输入,该第二输入指示该第二用户关于该第二数据资产是否符合该第一数据标准的第二证明;以及基于该第二证明验证该第二数据资产是否符合该第二数据标准。
在一些实施例中,该数据治理策略包括与第二数据资产相关联的第二数据标准,并且该方法包括:基于该第二数据资产的至少一个属性识别用于证明该第一数据资产是否符合该第二数据标准的第二用户;通过该通信网络向与该第二用户相关联的第二计算设备发送关于该第二数据资产和该第二数据标准的信息;通过该通信网络从该第二计算设备获得第二输入,该第二输入指示该第二用户关于该第二数据资产是否符合该第二数据标准的第二证明;以及基于该第二证明验证该第二数据资产是否符合该第二数据标准。
在一些实施例中,该数据治理策略包括与第二数据资产相关联的第二数据标准,并且该方法包括:基于该第二数据资产的至少一个属性识别用于证明该第一数据资产是否符合该第二数据标准的第一用户;通过该通信网络向该第一计算设备发送关于该第二数据资产和该第二数据标准的信息;通过该通信网络从该第一计算设备获得第二输入,该第二输入指示该第一用户关于该第二数据资产是否符合该第二数据标准的第二证明;以及基于该第二证明验证该第二数据资产是否符合该第二数据标准。
在一些实施例中,该方法包括生成第一证明对象,以及将指示该第一证明的第一输入存储在该第一证明对象中。在一些实施例中,该方法包括将该第一数据标准与该第一数据资产的关联存储在该第一证明对象中。
在一些实施例中,获得指示第一证明的第一用户输入包括通过GUI获得该第一用户输入。在一些实施例中,该GUI显示指示该第一标准与该第一数据资产的关联的信息。在一些实施例中,该第一证明指示该第一数据资产符合该第一数据标准、部分符合该第一标准、或不符合该第一标准。在一些实施例中,该方法包括通过该通信网络从该第一计算设备获得指示该第一证明的证据的信息。
本文描述的技术可以以多种方式中的任何一种来实施,因为这些技术不限于任何特定的实施方式。本文提供实施细节的示例仅用于说明目的。此外,本文披露的技术可以单独使用或以任何合适的组合使用,因为本文描述的技术的方面不限于使用任何特定技术或技术组合。
图2A示出了根据本文描述的技术的一些实施例的数据处理系统100的简图。如图2A所示,数据处理系统100包括数据治理策略102、数据资产106和合规项目120。
数据处理系统100可以被配置为使用数据治理策略102来治理由数据处理系统100管理的数据资产106。更具体地,每个数据治理策略102包括一组一个或多个作为构成要素的数据标准。可以基于数据资产与其相关数据标准的合规性来确定数据资产与数据治理策略的合规性。数据处理系统100可以包括任意数量的数据治理策略。在一些实施例中,数据治理策略102可以提供对数据处理系统100的数据资产的管控,并且数据治理策略102的数据标准可以是特定规则,当满足这些特定规则时,表明与数据治理策略102的指导原则一致。本文参考图4A描述了示例数据治理策略和作为构成要素的数据标准。
如图2A所示,数据处理系统100管理数据资产106。在一些实施例中,数据处理系统100可以被配置为管理数千、数百万或数十亿的数据资产。在一些实施例中,每个数据资产可以存储一组属性值。例如,每个数据资产可以存储一组属性值。尽管图2A的示例实施例图示了数据处理系统100的数据存储设备中的数据资产106,但在一些实施例中,至少一些数据资产106可以存储在其他系统中。数据处理系统100可以被配置为访问存储在其他系统中的数据资产。
在一些实施例中,数据处理系统100可以被配置为使用合规项目120来确定数据资产106与数据治理策略102的合规性。数据处理系统100可以被配置为创建合规项目以确定一个或多个数据资产106是否符合一个或多个数据标准。在一些实施例中,数据处理系统100可以被配置为创建合规项目以确定与数据治理策略的合规性。合规项目可以允许用户(例如,合规管理者118)管理为确定数据资产与数据治理策略的合规性而需要执行的数据资产审查。如本文更详细讨论的,在一些实施例中,合规项目可以包括数据资产符合适用数据标准的证明,这些证明被组织成一项或多项合规审查。数据处理系统100可以被配置为将这些证明指派给用户来执行。因此,合规项目120在各种不同用户之间分发与确定数据资产106与数据治理策略102的合规性相关联的任务。
如图2A所示,各种类型的用户与数据处理系统100交互。这样的用户包括合规管理者118、策略管理者114和证明人116A、116B。
在一些实施例中,策略管理者114负责创建数据处理系统100的数据治理策略。策略管理者114可以创建数据治理策略及其(多个)作为构成要素的数据标准。例如,策略管理者114可以通过以下方式创建数据治理策略:(1)定义数据治理策略;以及(2)确定将包括在数据治理策略中的一个或多个数据标准(例如,用于确定数据资产是否符合数据治理策略)。策略管理者114可以通过命名和描述数据治理策略来定义数据治理策略。策略管理者114可以进一步命名和定义数据治理策略的(多个)数据标准。策略管理者114可以进一步确定每个数据标准应用于哪些数据资产,并且将每个数据标准与其适用的数据资产相关联。如本文参考图2B所描述的,策略管理者114可以通过将数据标准与数据资产的一个或多个集合(本文中也称为“(多个)数据资产集合”)相关联来将数据标准与数据资产相关联。
在一些实施例中,合规管理者118负责验证数据资产106是否符合数据治理策略102。合规管理者118可以使用合规项目120来确定数据资产106是否符合数据治理策略102。更具体地,合规管理者118可以使用合规项目来管理关于数据资产是否符合数据治理策略102的数据标准的证明。如本文参考图2D至图2E所描述的,可以将证明指派给各种不同的用户(本文中也称为“证明人”)(例如,证明人116A、116B)。
在合规项目中,一些实施例的系统可以将数据资产与适用的数据标准配对,并将其提供给证明人116A、116B以供他们证明数据资产是否符合其适用的数据标准。证明人116A、116B负责审查数据资产及其适用的数据标准以确定数据资产是否符合应用数据标准。证明人116A、116B可以提供指示他们的证明的输入。在一些实施例中,该系统可以进一步要求证明人116A提供除证明之外的信息,比如支持证明的注解和/或证据。
图2B示出了根据本文描述的技术的一些实施例的促进图2A的数据处理系统100中的数据治理的示例系统。如参考图2A所描述的,每个数据治理策略102包括相应的一组数据标准。在图2B的示例中,数据治理策略102A包括数据标准104A和数据标准104B,而数据治理策略102B包括数据标准104C和数据标准104D。如每个数据治理策略102A、102B中的三个点所指示的,数据治理策略102A、102B可以包括图2B中未示出的一个或多个其他数据标准。每个数据治理策略可以具有任何合适数量的数据标准(例如,一个、两个、三个、至少五个、至少十个、至少20个、1到10个、5到20个、1到30个、或这些范围内的任何其他合适的范围)。虽然图2B的示例示出了每个数据治理策略具有一组不同的数据标准,但在一些实施例中,数据治理策略可以共享数据标准。例如,除了数据治理策略102A之外,数据标准104A还可以被包括在数据治理策略102B中。
作为说明性示例,数据治理策略102A可以规定输入到应用程序的数据必须来自可信源。数据治理策略102A的数据标准104A可以指示应用程序所使用的数据必须来自可信源列表;并且(2)数据标准104B可能表明应用程序所使用的社会安全号码必须来自特定数据库。数据治理策略102B可以规定用户识别号必须遵循标准格式。数据标准104C可以指示社会安全号码必须具有“NNN-NN-NNNN”格式,其中N是0到9之间的数字。数据标准104D可以指示电话号码必须具有“(NNN)NNN-NNNN”格式,其中N是0到9之间的数字。因此,数据标准102A、102B、104A、104B提供了表明数据资产遵循数据治理策略102、104的具体合规要求。
如图2B所示,该系统将数据资产106组织成数据资产集合110A、110B、110C。该系统可以被配置为使用相应的一组一个或多个数据资产准则来生成每个数据资产集合。在图2B的示例中,使用数据资产准则112A生成数据资产集合110A,使用数据资产准则112B生成数据资产集合110B,并且使用数据资产准则112C生成数据资产集合110C。该系统可以配置为通过以下方式使用一组准则生成数据资产集合:(1)识别数百万数据资产106中满足这些准则的数据资产;以及(2)将所识别的数据资产作为数据资产集合的成员。例如,数据资产准则112A可以包括数据资产源自美国以在应用程序中使用的准则,数据资产准则112B可以包括数据资产包括客户的社会安全号码的准则,并且数据资产准则112C可以包括数据资产包括巴西人的联系信息的准则。该系统可以使用这些组数据资产准则112A、112B、112C来生成:(1)包括包含源自美国的信息的数据资产的数据资产集合110A;(2)包括包含客户的社会安全号码的数据资产的数据资产集合110B;以及(3)包括包含巴西人的联系信息的数据资产的数据资产集合110C。在图2B的示例中,数据资产集合110A包括数据资产106A、106B、106C,数据资产集合110B包括数据资产106C、106D,并且数据资产集合110C包括数据资产106E。
如数据资产集合110A、110B、110C中的每个数据资产的图案填充部分所指示的,数据资产集合110A、110B、110C中的数据资产满足对应的数据资产准则112A、112B、112C。例如,数据资产106A、106B、106C满足数据资产准则112A,如竖直线图案所示。数据资产106C、106D满足数据资产准则112B,如水平线图案所示。数据资产106C包括水平线和竖直线的图案,因为它满足数据资产准则112A和数据资产准则112B。数据资产106E包括对角线图案,因为它满足数据资产准则112C。
如图2B所示的示例中,在一些实施例中,数据资产可以是多个数据资产集合的成员。在图2B中,数据资产106C是数据资产集合110A和数据资产集合110B两者的成员。继续前面的示例,数据资产106C可以包括源自美国的社会安全号码,并且因此是数据资产集合110A和数据资产集合110B两者的成员。在一些实施例中,该系统可以将数据标准与多个数据资产集合相关联。例如,该系统可以进一步将数据标准104B与数据资产集合110C相关联。
策略管理者114可以将数据标准与该数据标准所应用于的数据资产集合相关联。如图2B所示的示例,策略管理者114可以通过将数据标准与用于生成数据资产集合的数据资产准则相关联来将数据标准与数据资产集合相关联。例如,策略管理者114可以通过从列表中选择数据资产集合来将数据标准与数据资产集合相关联。在另一示例中,策略管理者114可以:(1)创建定义新数据资产集合的一组数据资产准则;以及(2)将数据标准与新数据资产集合相关联。因此,策略管理者114不需要手动将每个数据标准与各个数据资产106相关联。在图2B的示例中,策略管理者114经由数据资产准则112A将数据标准104A与数据资产集合110A相关联,经由数据资产准则112B将数据标准104B与数据资产集合110B相关联,经由数据资产准则112B将数据标准104C与数据资产集合110B相关联,并且经由数据资产准则112C将数据标准104D与数据资产集合110C相关联。
如图2B所示,作为将数据标准与数据资产集合相关联的补充或替代,该系统可以进一步被配置为将数据标准直接与数据资产相关联。在图2B的示例中,策略管理者114已将数据标准104C与数据资产106F相关联。该系统可以使用数据标准104C与数据资产106F的关联来确定数据资产106F是否符合数据标准104C。数据资产106F不属于图2B中所示的任何数据资产集合110A、110B、110C,如其缺少图案填充所指示的。
如图2B所示,该系统使用数据资产准则作为数据标准与数据标准所应用的数据资产之间的抽象层。通过创建这一抽象层,该系统提供了数据标准与数据资产之间的动态关联。当数据资产不再满足与数据资产集合相对应的一组数据资产准则时,该系统可以不再将数据资产包括在数据资产集合中。这进而又移除了其与数据资产集合所关联的(多个)数据标准的关联。同样,当数据资产被更新以满足与数据资产集合相对应的一组数据资产准则时,该系统可以将数据资产包括在数据资产集合中,并因此自动将数据资产与任何适用的(多个)数据标准相关联。
在一些实施例中,数据资产集合110A、110B、110C可以是动态的。该系统可以被配置为响应于数据资产的更新来更新每个数据资产集合的成员资格。例如,该系统可以基于(多个)数据资产是否满足定义数据资产集合的一个或多个准则来向数据资产集合添加一个或多个数据资产和/或从数据资产集合中移除一个或多个数据资产。图2C示出了根据本文描述的技术的一些实施例的在对一些数据资产进行更新之后的图2B的系统。在图2C的示例中,数据资产106E已被更新,使得其不再满足数据资产准则112C并且满足数据资产准则112B。结果,数据资产集合110B的成员资格已被更新为包括数据资产106E,并且数据资产集合110C的成员资格已被更新为不包括数据资产106E。在一些实施例中,该系统可以被配置为周期性地确定数据资产集合的成员资格(例如,每小时、每天、每周、每月或其他合适的周期)。在一些实施例中,该系统可以被配置为响应于动作来确定数据资产集合的成员资格。例如,当创建合规项目时,该系统可以确定数据资产集合的成员资格。在另一示例中,当用户请求查看关于数据资产集合和/或相关联的数据标准的信息时,该系统可以确定数据资产集合的成员资格。
图2D示出了根据本文描述的技术的一些实施例的图2B的系统如何获得数据资产是否符合数据标准的证明的示例。如图2D所示的示例中,该系统在通过证明人116A的证明队列132提供给证明人116A的证明中将数据标准与对应的数据资产进行配对。证明队列132可以是将由证明人116A执行的一组证明。例如,该系统可以存储要由用户执行的证明队列。如图2D所示,该系统可以被配置为通过将数据标准与跟该数据标准相关联(例如,经由对应的数据资产准则)的数据资产集合中的一个或多个数据资产进行配对来生成证明。在图2D的示例中,该系统将数据标准104A与数据资产106A进行配对、将数据标准104A与数据资产106C进行配对、并且将数据标准104B与数据资产106C进行配对。该系统可以被配置为基于图2B中所示的数据标准104A与数据资产集合110A的关联以及数据标准104B与数据资产集合110B的关联来确定配对。
该系统可以被配置为通过以下方式将证明添加到证明队列132:(1)确定证明人116A是否负责执行证明;以及(2)当确定证明人116A负责证明时,将证明添加到证明队列132。在一些实施例中,该系统可以被配置为基于来自证明中所涉及的数据资产的信息来确定证明人116A负责证明。例如,数据资产可以存储指示负责管理数据资产的用户(例如,数据管理专员)的属性。在该示例中,该系统可以基于确定由该属性指示的用户是证明人116A来确定证明人116A负责。在一些实施例中,该系统可以被配置为基于来自另一用户的输入来确定证明人116A负责证明。例如,合规管理者118可以提供指示证明人116A负责证明的输入。该系统可以被配置为将信息发送到与证明人116A相关联的计算设备。例如,该系统可以通过通信网络(例如,因特网)将信息发送到计算设备。该信息包括关于在被指派给证明人116A的证明中配对的数据标准和数据资产的信息。
图2D进一步图示了示例图形用户界面(GUI),证明人116A将通过该图形用户界面来执行证明。在图2D的示例中,该GUI示出了数据资产106A是否符合数据标准104A的证明140A。该GUI向证明人116A提供对数据标准104A和数据资产106A的访问,使得证明人116A可以确定合规性。在一些实施例中,该GUI可以提供对关于数据标准104A的信息的访问。例如,该GUI可以显示数据标准104A的名称和/或描述。在另一示例中,该GUI可以向证明人116A提供链接,当该链接被选择时,将用户引导至显示关于数据标准104A的信息的GUI。在一些实施例中,该GUI可以提供关于数据资产106A的访问信息。例如,该GUI可以显示数据资产106A的属性值、数据资产106A的名称、数据资产106A的描述和/或关于数据资产106A的其他信息。在另一示例中,该GUI可以向证明人116A提供链接,当该链接被选择时,将证明人116A引导至显示关于数据资产106A的信息的GUI。
如图2D所示,该GUI包括用户可以输入证明140A的证明信息142A的区段。证明信息142A包括指示数据资产106A是否符合数据标准104A的输入144A。如图2D所示,证明人116A可以选择“是”或“否”来指示证明。在一些实施例中,输入144A可以允许用户提供指示数据资产106A符合数据标准104A、不符合数据标准104A、部分符合数据标准104A、或数据资产106A仍在审查中的输入。证明信息142A进一步包括注解144B,证明人116A可以在其中输入证明的进一步注解。在图2D的示例中,该GUI提供了用户可以在其中输入注解的文本字段。在一些实施例中,用户可以通过语音、文本输入或任何其他合适的输入机制来提供注解144B。证明信息142A进一步包括证据144C。在一些实施例中,证明人116A可能需要提供支持关于数据资产106A是否满足数据标准104A的证明的证据144C。在图2D的示例中,证明人116A可以上传文件以支持数据资产106A是否满足数据标准104A的输入144A。在一些实施例中,证据144C可以包括文档、文件、屏幕截图、图像、文本、音频数据和/或作为证明140A的证据的其他数据。图2D的GUI进一步提供了“提交证明”按钮144D,证明人116A可以选择该按钮来提交证明140A(例如,在输入证明信息142A之后)。该系统可以响应于按钮144D的选择来更新系统中的证明140A。例如,该系统可以将证明信息142A上传到存储关于证明140A的信息的数据对象中。
在一些实施例中,该系统可以被配置为使用证明140A来验证数据资产106A是否符合数据标准104A。该系统可以被配置为当证明信息142A指示数据资产106A符合数据标准104A时确定数据资产106A符合数据标准104A。该系统可以被配置为当证明信息142A指示数据资产106A不符合数据标准104A时确定数据资产106A不符合数据标准104A。该系统可以被配置为当证明信息142A指示数据资产106A部分符合数据标准104A时确定数据资产106A部分符合数据标准104A。在一些实施例中,该系统可以被配置为从证明人116A的计算设备获得证明信息142A。在一些实施例中,该系统可以被配置为生成证明对象,并将证明信息142A存储在证明对象中。证明对象可以提供验证记录以供参考(例如,供合规管理者118审查)。
图2E示出了根据本文描述的技术的一些实施例的合规项目120A的示例图形用户界面。在一些实施例中,系统可以向合规管理者118提供图2E所示的GUI,以供合规管理者118确定数据资产与数据治理策略的合规性。例如,该系统可以创建合规项目120A以确定数据资产是否符合数据治理策略102A。在图2E的示例中,合规项目120A包括合规审查122A、122B。合规审查122A用于确定数据资产与数据标准104A的合规性,并且合规审查122B用于确定数据资产与数据标准104B的合规性。本文参考图3和图7描述了用于生成合规项目的示例技术。
如图2E所示,合规审查122A包括证明140。证明140可以包括针对与数据标准104A相关联的(多个)数据资产集合中的每个数据资产的证明。在图2E的示例中,证明140包括证明140A、140B、140C。证明140A包括数据标准104A与数据资产106A的配对以及证明信息142A。证明140B包括数据标准104A与数据资产106B的配对以及证明信息142B。证明140C包括数据标准104A与数据资产106C的配对以及证明信息142C。如图2E所示,证明140A、140B、140C中的每一个被指派给相应的证明人116A、116B、116A。证明信息可以由证明人如本文参考图2D所描述的那样来提供。
如图2E所示,合规审查122B包括证明150。证明150可以包括针对与数据标准104B相关联的(多个)数据资产集合中的每个数据资产的证明。在图2E的示例中,证明150包括证明150A、150B。证明150A包括数据标准104B与数据资产106C的配对以及证明信息152A。证明150B包括数据标准104B与数据资产106D的配对。如图2E所示,证明150A、150B中的每一个被指派给相应的证明人116A、116C。证明信息可以由证明人如本文参考图2D所描述的那样来提供。证明150B不包括证明信息,因为证明人116C可能尚未提交任何证明信息。例如,证明150B可以位于证明人116C的证明队列中,但是尚未由证明人116C执行。在另一示例中,证明人116C可能尚未选择GUI中的“提交证明”按钮来提交证明信息。
图2E的GUI包括合规项目120A和合规审查122A、122B的状态指示。项目状态121A指示合规项目120A的合规审查的已完成百分比。在图2E的示例中,合规项目120A的合规审查的75%已完成。合规审查122A的审查状态124A指示其已100%完成。这可以表明合规审查122A的所有证明140均已完成。合规审查122B的审查状态124B指示其已完成50%。这可以表明合规审查122B的证明150的50%已完成。在一些实施例中,该系统可以使用审查状态124A、124B来确定项目状态121A。在图2E的示例中,该系统可以对指示100%完成的审查状态124A与指示50%的审查状态124B进行平均以获得指示75%的项目状态121A。
图2F示出了图示根据本文描述的技术的一些实施例的数据处理系统100的各部件之间的交互的简图。如图2F所示,数据治理策略102A、102B的数据标准通过相应的一组数据资产准则112与数据资产106的相应集合相关联。例如,策略管理者114可以将数据标准104A、104B、104C、104D与数据资产准则相关联,如本文参考图2B所描述的。该系统可以使用数据资产集合来生成合规项目120。合规管理者118可以使用合规项目120来确定数据资产与数据治理策略102A、102B的合规性,如本文参考图2E所描述的。如图2E所示,每个合规项目包括一项或多项合规审查,每项合规审查均包括一个或多个证明。证明人可以提交证明信息,该系统将证明信息存储在证明中。证明人116A提交证明140A的证明信息142A,如本文参考图2C所描述的。
图3示出了图示根据本文描述的技术的一些实施例的示例合规项目120A的生成的简图。如图3所描绘的过程可以由本文参考图2A至图2F描述的数据处理系统100的数据治理系统来执行。该系统可以生成合规项目120A以验证数据资产集合的一个或多个数据资产是否符合一个或多个数据标准。
如图3所示,该系统首先生成合规项目120A。在生成合规项目120之后,该系统使用图2B所示的数据治理系统来识别数据资产集合110A与数据标准104A的关联。该系统可以被配置为使用数据资产集合110A与数据标准104A的关联来识别要在合规项目120A中审查的资产。在一些实施例中,该系统可以被配置为使用与数据资产集合110A相对应的数据资产准则112A来识别数据资产。该系统可以被配置为将数据资产106A、数据资产2 106B和数据资产106C识别为满足数据资产准则112A(例如,数据资产包括源自美国的数据)。所识别的数据资产可以是在某个时间点被确定为数据资产集合110A的成员的那些数据资产。例如,该系统可以使用在生成合规项目120A时的数据资产的属性来确定数据资产是否是数据资产集合110A的成员。在另一示例中,该系统可以使用先前确定的数据资产集合110A的成员资格来识别数据资产。
如图3所示,数据资产106A、106B、106C中的每一者与一个或多个用户相关联。数据资产106A与(多个)用户202A相关联,数据资产106B与(多个)用户202B相关联,并且数据资产106C与(多个)用户202C相关联。在一些实施例中,该系统可以使用数据资产中的数据来识别负责数据资产的用户。例如,数据资产可以包括标识用户的属性。在一些实施例中,用户可以是负责管理数据资产的用户。例如,用户可以是被指定为数据资产的“业务数据管理专员”的用户。标识符(例如,姓名、标识号或其他标识符)可以作为属性值存储在数据资产中。
在识别数据资产集合110A与数据标准104A的关联之后,该系统识别用于证明数据资产106A、106B、106C是否符合数据标准104A的用户。在一些实施例中,该系统可以被配置为自动将由数据资产106A、106B、106C中的每一者的属性(例如,业务数据管理专员)指示的用户识别为用于证明数据资产106A、106B、106C是否符合数据标准104A的用户。如图3所示,系统识别到:(1)用于证明数据资产106A是否符合数据标准104A的证明人116A;(2)用于证明数据资产106B是否符合数据标准104A的证明人116B;以及(3)用于证明数据资产106C是否符合数据标准104A的证明人116A。
在一些实施例中,该系统可以被配置为向每个用户提供信息以执行证明(例如,如本文参考图2D所描述的)。在图3的示例中,该系统可以向证明人116A提供指示数据标准104A的信息以及关于数据资产106A和数据资产106C的信息(例如,属性值)。该系统可以向证明人116B提供指示数据标准104A的信息和关于数据资产2 106B的信息(例如,属性值)。例如,该系统可以在证明人的相应队列中向证明人提供证明。证明人可以使用诸如本文参考图2D所描述的GUI来执行证明。
图4A示出了根据本文描述的技术的一些实施例的数据治理策略232和作为构成要素的数据标准234的示例。数据治理策略232可以包括图4B中未示出的其他数据标准,如数据治理策略232中的点所示。数据治理策略232包括名称232A“敏感数据应按照所有治理标准进行处理和存储。”数据治理策略进一步包括描述232B“敏感数据是满足一个或六个不同准则的数据”。在一些实施例中,数据治理策略232可以进一步包括数据治理策略232的数据标准的列表。在一些实施例中,数据治理策略232可以包括对数据标准的引用。
数据标准234包括名称234A“机密数据只能存储在无外部数据访问的系统上”。数据标准234包括描述234B:“标记为‘机密’的数据集只能存储在经过IT安全认证的系统上,以防止任何外部数据访问”。数据标准234包括确认与数据标准234的合规性所需的证明证据234C的指示:“存储机密数据集以及任何未发生实质性变换的直接源或目标数据集(如由谱系标识)的系统必须链接IT安全认证”。数据标准234包括与数据标准234相关联的数据资产集合的列表234D(例如,“机密数据集”)。如图4A所示的示例中,数据标准234通过与对应于机密数据集237的数据资产准则236的关联而与数据资产集合机密数据集237相关联。数据标准234可以与数据资产准则236和/或机密数据集237相关联,如本文参考图2B所描述的。
图4B示出了根据本文描述的技术的一些实施例的合规项目238和作为构成要素的合规审查240的示例。合规项目238可以包括图4B中未示出的其他合规审查,如其中的点所示。合规项目238包括名称238A:“季度数据处理审查”。合规项目238包括描述238B:“审查对敏感数据集的处理并证明其与所有适用的数据标准的合规性”。在一些实施例中,合规项目238可以进一步包括作为合规项目238的一部分的合规审查的列表。
合规审查240包括名称240A:“公司机密数据集”。合规审查240进一步包括描述240B:“证明标记为机密的每个数据集与每个适用的数据标准的合规性”。合规审查240进一步包括合规审查240可以与之关联的(多个)数据资产集合的列表240C。在图2E的示例中,列表240C包括数据资产集合“机密数据集”。数据资产集合可以是与跟合规审查240相关联的数据标准相关联的数据资产集合。合规审查240进一步包括作为合规审查240的一部分的证明的列表240D(例如,与“数据标准A”配对的“机密数据集1”以及与“数据标准A”配对的“机密数据集2”)。证明240D包括相应的证明信息和证明人。
图5A是图示根据本文描述的技术的一些实施例的可以在其中使用数据处理系统100的示例环境200的简图。图5A的示例是数据处理系统100用于元数据管理的实施方式。应当理解,本文描述的技术不限于应用于任何特定类型的数据,并且可以在使用数据资产来管理数据的任何数据处理系统内使用,而不管所管理的数据是元数据还是任何其他类型的数据(例如,交易、文件、数据记录、表格等)。
图5A图示了包括系统209A、209B、209C的企业系统。系统209A、209B、209C可以分布在多个地理位置(例如,不同的城市、国家、大陆等)。系统209A、209B、209C中的每一个可以存储大量数据(例如,存储在一个或多个数据库系统、数据仓库、数据湖等中)。例如,系统209A、209B、209C可以是全球银行的企业系统的组成部分,其中,系统209A位于美国,系统209B位于巴西,并且系统209C位于欧洲。
如图2A所示的示例实施例中,系统209A、209B、209C中的每一个包括各自的一组计算设备。例如,每个系统可以包括一个或多个服务器、用户设备和/或数据库。在企业系统的操作期间,系统209A、209B、209C中的每一个可以生成和/或存储大量数据(例如,数太字节的数据)。例如,企业系统可以用于信用卡公司,其中,系统209A、209B、209C中的每一个生成和/或存储交易数据、信用评分和/或任何其他合适的数据。在另一示例中,企业系统可以用于银行,其中,系统209A、209B、209C中的每一个生成和/或存储关于银行记录、贷款、账户持有人的数据和/或任何其他合适的数据。在另一示例中,企业系统可以用于电话公司,其中,系统209A、209B、209C中的每一个生成和/或存储关于电话呼叫、文本消息、数据使用的数据和/或任何其他合适的数据。
在一些实施例中,系统209A、209B、209C可以被配置为存储(例如,企业系统的)数据。系统209A、209B、209C中的每一个可以包括数据库、数据仓库、数据湖和/或任何其他数据库系统。系统209A、209B、209C可以是任何合适类型(相同类型或不同类型)的数据库系统。例如,这些系统中的每一个可以包括一个或多个关系数据库系统(例如,ORACLE、SQLSERVER等)。作为另一示例,在一些实施例中,这些系统中的每一个可以包括一种或多种其他类型的数据库系统(例如,非关系(例如,NoSQL)数据库系统、多文件系统或任何其他合适类型的数据库系统)。
在图2A的示例实施例中,数据处理系统100存储描述存储在系统209A、209B、209C中的数据的信息207。在这个意义上,信息207可以被认为是元数据。元数据可以包括关于存储在企业系统209A、209B、209C中的数据的多种类型的信息中的任何一种。例如,元数据可以包括关于处理数据的系统、在企业系统上执行的用于处理数据的软件应用程序、和/或应用程序存储数据的规则的信息。在另一示例中,元数据可以包括关于整个企业软件系统中的数据的信息,比如数据是如何生成的;数据的大小;数据的描述;哪个(哪些)用户被允许对数据进行读取、更新、创建、删除或执行任何其他动作;和/或关于数据的任何其他合适信息。
在一些实施例中,数据处理系统100可以被配置为使用数据资产来管理元数据。例如,数据处理系统100可以存储用于由企业系统存储的多个数据集(例如,表格)中的每一个的数据资产。每个这样的数据资产可以存储关于数据集的信息(例如,数据集的创建或更新时间;数据集的存储位置;数据集的大小;允许对数据集进行读取、编辑、删除或执行任何其他合适的动作的用户的身份;标识哪些软件应用程序使用了数据集的信息;标识数据集中的数据的敏感度级别的信息;和/或任何其他合适的元数据)。作为另一示例,数据处理系统100可以存储用于企业系统中的表格的各列的数据资产。每个这样的数据资产可以存储关于列的信息(例如,列中的值的含义;谁被授权读取、写入、更新和/或删除列中的值;列中的条目的允许值范围;和/或任何其他合适的元数据)。作为又一示例,数据处理系统100可以存储用于被配置为由企业系统的某个系统或设备部分执行的多个软件应用程序中的每一个的数据资产。这样的数据资产可以存储关于软件应用程序的信息(例如,软件应用程序处理哪些数据集、应用程序将其输出放在哪里、应用程序的功能的描述、应用程序的版本、应用程序对数据和/或其他应用程序的依赖性、在哪里可以找到应用程序的可执行文件、和/或任何其他合适的元数据)。作为又一示例,数据处理系统100可以存储用于作为企业系统的一部分的多个系统中的每一个的数据资产。
从前述中可以容易地理解,在这样的元数据管理场景中,数据处理系统100可以管理数百万或数十亿这样的数据资产,这就是为什么高效地验证数据资产是否符合适用的数据标准是重要的。
在一些实施例中,数据处理系统100可以被配置为从各个系统209A、209B、209C获得关于数据的信息。例如,数据处理系统100可以在系统209A、209B、209C的数据库中查询各个系统209A、209B、209C的元数据。在一些实施例中,数据处理系统100可以被配置为使用从系统209A、209B、209C获得的信息来生成元数据(例如,通过在数据库系统中查询元数据)。在一些实施例中,数据处理系统100可以被配置为存储关于存储在系统209A、209B、209C中的数据的元数据。例如,系统209A、209B、209C各自可以是数据湖、数据仓库、数据库系统或其他类型的系统。如本文所述,可以使用数据资产来存储元数据。
在一些实施例中,数据处理系统100可以被配置为将数据治理策略和/或数据标准存储为数据处理系统100的数据资产。例如,数据处理系统100可以将数据治理策略102A存储为数据资产。数据资产可以包括信息(例如,存储在一个或多个属性字段中)。数据资产可以存储指示数据治理策略102A的数据标准104A、104B的信息。例如,数据资产可以存储对数据标准104A、104B的引用,这些数据标准可以各自被存储为由数据处理系统100管理的相应数据资产。存储数据治理策略的数据资产(“数据治理策略资产”)可以存储包括数据治理策略的文本描述的信息。例如,数据治理策略资产可以包括策略的声明。存储数据标准的数据资产(“数据标准资产”)可以包括对与数据治理策略的合规性度量的文本描述。例如,数据标准104A的数据标准资产可以包括数据资产的合规性度量的文本描述(例如,数据资产必须来自可信源列表之一)。
数据处理系统100可以被配置为将数据标准与一个或多个数据资产集合相关联,如本文参考图2B所描述的。在一些实施例中,数据处理系统100可以被配置为通过存储数据标准与数据资产集合的关联来将数据标准与数据资产集合相关联。例如,该系统可以存储数据标准104A与数据资产集合110A的关联。该系统可以存储数据资产集合110A的指示作为数据标准104A的数据标准资产的一部分。例如,数据标准资产可以包括列出相关联的数据资产集合的字段。数据标准104A的数据标准资产可以在该字段中列出数据资产集合110A。在一些实施例中,数据标准资产可以包括对与数据标准相关联的一个或多个数据资产集合的(多个)引用。
在一些实施例中,数据处理系统100可以被配置为动态更新数据资产集合的成员资格。数据处理系统100可以被配置为通过以下方式确定数据资产集合在某个时间点的成员资格:(1)使用定义数据资产集合的一个或多个准则来选择一个或多个数据资产;以及(2)将所选择的(多个)数据资产包括在数据资产集合中。在一些实施例中,数据处理系统100可以被配置为当要对数据资产集合中的数据资产执行证明时更新数据资产集合的成员资格(例如,以提供针对其执行证明的数据资产的更新列表)。在一些实施例中,数据处理系统100可以被配置为周期性地更新数据资产集合的成员资格(例如,每天一次、每周一次、每月一次、或其他合适的时间间隔)。在一些实施例中,数据处理系统100可以被配置为响应于命令(例如,由用户输入的命令)来更新数据资产集合的成员资格。
在一些实施例中,针对数据标准与数据资产的配对而识别的用户可以承担证明数据资产是否符合数据标准的任务。数据处理系统100可以被配置为将关于数据资产和数据标准的信息发送到与用户相关联的计算设备。数据处理系统100可以被配置为从计算设备接收指示用户关于数据资产是否符合数据标准的证明的输入。在一些实施例中,数据处理系统100可以被配置为生成工作流,通过该工作流,用户可以查看关于数据资产和数据标准的信息并提供输入。在一些实施例中,数据处理系统100可以被配置为提供引导用户完成证明过程的图形用户界面(GUI)。该系统可以被配置为基于指示证明的输入来验证数据资产是否符合数据标准。
在一些实施例中,该系统可以被配置为生成证明对象。证明对象可以存储所识别的用户与数据标准和数据资产的配对的关联。例如,数据处理系统100可以将用户与数据标准和数据资产的配对的关联存储在证明对象中。在一些实施例中,证明对象可以被存储为数据处理系统100的数据资产(“证明数据资产”)。在一些实施例中,数据处理系统100可以被配置为使用证明对象来跟踪合规审查和/或合规项目的状态。该系统可以将证明的状态和/或结果存储在证明对象中。该系统可以被配置为基于其中的证明的状态(例如,由证明对象指示)来确定合规审查和/或合规项目的状态。在一些实施例中,该系统可以被配置为确定合规审查和/或合规项目的证明的统计数据。统计数据可以提供对数据处理系统100中的数据策略和/或数据标准的合规性的验证的视图。例如,用户可以查看诸如合规项目的数量、合规审查的数量、合规审查或项目的完成百分比、合规审查或项目的未完成百分比、以及其他统计数据等信息。
图5B示出了图示根据本文描述的技术的一些实施例的示例数据处理系统100的各方面的框图。数据处理系统100包括图形用户界面(GUI)模块210、数据治理系统220和数据持久层230。
在一些实施例中,GUI模块210可以通过生成用户可以通过其与数据处理系统100进行交互的各种GUI来允许用户与数据处理系统100交互。GUI模块210包括定义用户界面(UI)模块212、合规UI模块214和证明UI模块216。
在一些实施例中,定义UI模块212可以被配置为生成允许定义数据处理系统100中的数据治理策略、数据标准和数据资产集合的GUI。该GUI可以允许策略管理者(例如,策略管理者114)定义数据治理策略。例如,该GUI可以允许策略管理者创建新的数据治理策略并定义数据治理策略(例如,数据治理策略的指导原则或管控)。该GUI可以允许策略管理者生成一个或多个数据标准作为数据治理策略的一部分。该GUI可以允许策略管理者创建新的数据标准。该GUI可以允许策略管理者输入数据标准的规则和/或要求(例如,社会安全号码遵循NNN-NN-NNNN的标准格式,其中N是0到9之间的数字)。该GUI可以允许合规管理者(例如,合规管理者118)提供指示数据标准与一个或多个数据资产集合的关联的输入。例如,该GUI可以允许合规管理者从先前生成的数据资产集合的列表中选择数据标准所应用的一个或多个数据资产集合。
在一些实施例中,定义UI模块212可以被配置为生成允许策略管理者创建新的数据资产集合的GUI。该GUI可以允许策略管理者通过该GUI提供指示数据处理系统100可以用来生成数据资产集合的一个或多个准则的输入。例如,该GUI可以允许用户指定包括位置、数据资产类型、应用、地区、大小、名称的准则和/或可以由数据处理系统100用来生成数据资产集合的其他准则。
在一些实施例中,定义UI模块212可以被配置为生成显示关于数据治理策略的信息的GUI。该GUI可以显示数据治理策略的名称、该策略规定的管控、和/或数据治理策略的一个或多个数据标准。在一些实施例中,该GUI可以允许用户导航到数据治理策略的数据标准(例如,通过提供到显示关于数据标准的信息的GUI的链接)。在一些实施例中,定义UI模块212可以被配置为生成显示关于数据标准的信息的GUI。该GUI可以显示数据标准的名称、数据标准的合规性度量、与数据标准相关联的(多个)数据资产集合、和/或数据标准所属的数据治理策略。该GUI可以允许用户查看(多个)数据资产集合中的数据资产的列表。例如,该GUI可以允许用户选择数据资产集合,并且作为响应,显示所选数据资产集合中的数据资产的列表。
在一些实施例中,合规UI模块214可以被配置为生成允许合规管理者(例如,合规管理者118)创建合规项目的GUI。该GUI可以允许用户通过该GUI提供指示要在合规项目中验证的数据治理策略和/或(多个)数据标准的输入。该GUI可以进一步允许合规管理者生成合规项目的一项或多项合规审查。例如,该GUI可以允许合规管理者选择要为其生成(多个)合规项目的(多个)数据标准。在另一示例中,该GUI可以允许合规管理者选择要为其生成(多个)合规项目的(多个)数据资产。合规UI模块214可以被配置为生成可以允许合规管理者查看关于合规项目的合规审查的信息的GUI。该GUI可以显示合规项目的名称、数据标准的指示(例如,名称、合规性度量等)、数据资产的指示(例如,名称)、和/或其他信息。
在一些实施例中,合规UI模块214可以被配置为生成允许合规管理者查看关于所生成的合规项目的信息的GUI(例如,如图2E所示)。例如,该GUI可以显示合规项目的名称、合规项目的合规审查列表、合规项目的证明列表、合规项目的状态(例如,基于其作为构成要素的合规审查的状态来确定)、关于合规项目的统计数据(例如,数据资产的数量、数据标准、已完成的证明百分比、未完成的证明百分比等)、和/或关于合规项目的其他信息。该GUI可以向合规管理者提供合规项目的状态的图形视图。例如,该GUI可以显示指示作为合规项目的一部分的一项或多项合规审查的状态和/或合规项目整体的状态的图形元素。在一些实施例中,合规UI模块214可以被配置为生成允许合规管理者查看关于合规审查的信息的GUI。例如,该GUI可以显示合规审查的证明列表、与审查相关联的数据标准、和/或与合规审查相关联的数据资产。
在一些实施例中,证明UI模块216可以被配置为生成证明人可以通过其来执行证明的GUI(例如,如本文参考图2D所描述的)。该GUI可以允许证明人查看关于数据标准和数据资产的信息。例如,该GUI可以允许证明人导航到显示关于数据标准的信息(例如,合规性度量)的GUI以及显示关于数据资产的信息(例如,属性值)的GUI。该GUI可以被配置为允许用户输入信息作为证明的一部分。例如,该GUI可以允许证明人提供文本声明、附加文件、指示对另一数据资产的引用、和/或提供其他信息。在一些实施例中,该GUI可以向证明人提供选项列表,证明人可以从该选项列表中选择以提供指示证明的输入。例如,选项列表可以包括以下输入:数据资产符合数据标准、数据资产未能符合数据标准、数据资产部分符合数据标准、证明未定义、或数据标准不适用。在一些实施例中,该GUI可以允许证明人创建票证(例如,当数据资产不符合数据标准时)以解决不合规的数据资产。
如图5B所示,该GUI的模块210可以向数据治理系统220提交数据请求216。数据治理系统可以提供数据218。模块210可以使用数据218将信息填入GUI中。例如,模块210可以使用数据218来显示关于使用数据218的数据治理策略、数据标准、数据资产集合、数据资产、合规项目或合规审查的信息。
如图2F所示,数据处理系统100的数据治理系统220包括定义模块222、合规模块224和证明模块226。
在一些实施例中,定义模块222可以被配置为生成数据治理策略、作为构成要素的数据标准、和/或数据资产集合。定义模块222可以被配置为将数据资产集合与数据标准相关联(例如,如本文参考图2B所描述的)。在一些实施例中,定义模块222可以被配置为将数据治理策略和/或数据标准存储为数据处理系统100的数据资产。定义模块222可以被配置为例如将关于数据治理策略的信息(例如,管控声明、名称、作为构成要素的数据标准)存储为数据资产中的属性值。定义模块222可以被配置为例如将关于数据标准的信息(例如,名称、合规性度量的描述、相关联的(多个)数据资产集合的列表、和/或对数据治理策略的引用)存储为数据资产的属性值。
在一些实施例中,定义模块222可以被配置为生成数据资产集合。定义模块222可以被配置为使用(例如,由通过GUI的用户输入指示的)一个或多个准则来生成数据资产集合。定义模块222可以被配置为使用一个或多个准则来选择由数据处理系统100管理的数据资产中满足一个或多个准则的一个或多个数据资产。定义模块222可以被配置为将所选择的(多个)数据资产包括在数据资产集合中。在一些实施例中,定义模块222可以被配置为更新数据资产集合。定义模块222可以被配置为在选择数据资产集合中的(多个)数据资产之后通过以下方式更新数据资产集合:(1)识别满足一个或多个准则的一个或多个数据资产;以及(2)将所识别的(多个)数据资产包括在数据资产集合中。所识别的(多个)数据资产可能与先前存在于数据资产集合中的(多个)数据资产不同(例如,由于对一个或多个数据资产的更新)。
在一些实施例中,定义模块222可以被配置为存储数据标准与一个或多个数据资产集合的关联。例如,定义模块222可以将(多个)数据资产集合的列表存储在数据标准资产的字段中。在一些实施例中,定义模块222可以被配置为将对(多个)数据资产集合的引用存储在数据标准资产的字段中。
在一些实施例中,合规模块224可以被配置为管理与数据治理策略和/或数据标准的合规性的验证。合规模块224可以被配置为生成合规项目和作为构成要素的合规审查(例如,合规项目238和合规审查122、246)。合规模块224可以被配置为将数据标准与它们所应用的数据资产进行配对。合规模块224可以被配置为通过以下方式将数据标准与数据资产进行配对:(1)识别与数据标准相关联的数据资产集合(例如,通过定义模块222);以及(2)将数据标准与数据资产集合中的每个数据资产进行配对。合规模块224可以进一步被配置为识别用于数据标准与数据资产的配对的用户。合规模块224可以被配置为使用来自数据资产的信息(例如,指示负责数据资产的用户的属性值)来自动识别与数据标准和数据资产的配对相关联(例如,以执行证明)的用户。
在一些实施例中,合规模块224可以被配置为生成合规项目。在一些实施例中,合规模块224可以被配置为生成合规项目来管理与数据治理策略的合规性的验证。合规项目可以包括对数据治理策略的相应数据标准的合规审查。例如,合规项目可以包括针对数据治理策略的每个数据标准的合规审查。在另一示例中,合规项目可以包括针对与数据治理策略的(多个)数据标准相关联的每个数据资产集合的合规审查。合规模块224可以被配置为进一步为数据资产与适用数据标准的每个配对生成证明对象。合规模块224可以识别用于执行数据资产符合适用的数据标准的证明的用户。
在一些实施例中,合规模块222可以被配置为确定关于合规项目的信息。例如,合规模块222可以被配置为确定合规项目和/或其作为构成要素的合规审查的状态。合规模块222可以被配置为基于合规审查内的一个或多个证明的状态来确定合规审查的状态。例如,合规模块222可以确定合规审查和/或合规项目中完成或未完成的证明数量,合规模块222可以基于此来确定合规审查和/或合规项目的状态。在一些实施例中,当数据资产是否符合数据标准的证明已被确定(例如,由来自计算设备的输入指示)时,合规模块222可以确定证明已完成。在一些实施例中,对于不符合和/或部分符合数据标准的数据资产,可能进一步需要合规模块222执行动作以确定证明已完成。例如,合规模块222可以要求为不合规和/或部分合规的数据资产创建票证。
在一些实施例中,证明模块226可以被配置为获得数据资产是否符合数据标准的证明。在一些实施例中,证明模块226可以被配置为通过获得指示用户关于数据资产是否符合数据标准的证明的输入(例如,通过由证明UI模块216生成的GUI接收)来获得证明。证明模块226可以被配置为生成存储指示证明的信息的证明对象。在一些实施例中,证明对象可以进一步存储由证明模块226确定的证明的状态(例如,已完成或未完成)。在一些实施例中,证明模块226可以被配置为引导证明人完成用于执行证明的处理流程。例如,处理流程可以向证明人202C提供关于数据标准、数据资产和证明人可以通过其指示证明的机制的信息。证明模块226可以进一步存储与证明相关联的信息。例如,证明模块226可以在证明对象中存储作为证明证据的数据和/或证明人关于证明的声明。
在一些实施例中,数据治理系统220可以被配置为访问由数据处理系统100存储(例如,在数据持久层230中)的数据。如图5B所示,数据治理系统220可以被配置为向数据持久层230提交数据请求226并且响应于数据请求226接收数据。在一些实施例中,数据治理系统220可以被配置为提交对数据的查询。例如,数据治理系统220可以提交对数据的SQL查询。在一些实施例中,数据228可以是由请求指定的数据。例如,数据228可以是在查询中请求的一个或多个值。
在一些实施例中,可以以供应商特定的方式来定制查询。例如,不同的供应商(例如,MICROSOFT、ORACLE、IBM、POSTGRESQL等)可以实施不同的SQL方言和/或提供对SQL标准的扩展。在这种情况下,可以使用由目标数据库系统实施的语法和/或命令(例如,使用由ORACLE实施的任何特殊语法和/或命令)来为目标数据库系统(例如,ORACLE)生成可执行查询。另外或可替代地,查询可以包括对可以使用目标数据库系统支持的查询的优化。因此,在一些实施例中,针对一种类型的数据库的查询(例如,针对MICROSOFT SQL SERVER数据库的可执行SQL查询)可能不同于针对另一种类型的数据库的查询(例如,针对IBM DB2的可执行SQL查询),即使这两个查询都将从相同的底层中间表示生成。
如图5B所示,数据持久层230存储数据资产106、数据治理策略102、数据标准104、合规项目120、合规审查122和证明130。在一些实施例中,数据持久层230可以包括用于存储数据的数据存储区。在一些实施例中,数据存储区可以包括关系数据库系统,使得数据可以存储在关系数据库系统的表格中。然而,数据存储区不限于关系数据库系统,因为数据存储区可以被配置为以任何合适的方式存储数据。例如,数据存储区可以包括面向对象的数据库、分布式数据库、NoSQL数据库和/或任何其他合适的数据库。在一些实施例中,数据治理策略102、数据标准104、合规项目120、合规审查122和/或证明130可以被存储为数据资产。
在一些实施例中,数据持久层230中的每一者可以包括以一种或多种任何合适类型的格式存储数据的一个或多个存储设备。例如,数据存储区的(多个)存储设备部分可以使用一个或多个数据库表、电子表格文件、纯文本文件和/或任何其他合适格式(例如,大型机的本机格式)的文件来存储数据。(多个)存储设备可以是任何合适的类型,并且可以包括一个或多个服务器、一个或多个数据库系统、一个或多个便携式存储设备、一个或多个非易失性存储设备、一个或多个易失性存储设备、和/或被配置为用于电子地存储数据的任何其他(多个)设备。在数据存储区包括多个存储设备的实施例中,这些存储设备可以共同位于一个物理位置中(例如,在一个建筑物中)或分布在多个物理位置(例如,在多个建筑物中,在不同的城市、州或国家)。这些存储设备可以被配置为用于使用任何合适类型的一个或多个网络来彼此通信,因为本文描述的技术的各方面在这方面不受限制。
在一些实施例中,数据持久层230可以被配置为将数据资产存储为数据实体实例。因此,数据资产可以是由数据实体定义的数据实体实例。例如,数据处理系统100可以包括定义数据治理策略、数据标准、合规项目、合规审查和/或证明的数据实体。关于数据治理策略、数据标准、合规项目和合规审查的信息可以存储在各个数据实体的实例中。
在一些实施例中,数据资产106可以包括由数据处理系统100管理的数据资产。数据资产106可以存储例如关于系统(例如,企业系统)的数据集的元数据。在一些实施例中,数据治理策略102可以包括数据治理策略的定义。例如,数据治理策略102可以包括数据资产的管控声明。数据治理策略102可以包括作为构成要素的数据标准。例如,数据治理策略102可以包括构成数据治理策略102的数据标准104。
在一些实施例中,数据标准104包括数据标准的定义(例如,名称和/或规则或标准)。数据标准104可以进一步包括相关联的(多个)数据资产集合的列表。数据标准104可以进一步包括对数据治理策略以及正在其中验证数据标准104的合规项目和/或审查的引用。数据标准104可以进一步包括描述。
在一些实施例中,合规项目120可以包括关于合规项目所针对的数据治理策略的信息。合规项目120可以包括合规项目120的合规审查的列表。合规项目120可以包括作为合规项目120的一部分的数据标准和/或证明。合规项目120可以进一步包括合规项目120的状态。在一些实施例中,合规项目120包括关于负责合规项目的各方面的用户(例如,项目所有者和/或证明人)的信息。
在一些实施例中,合规审查122可以包括关于与合规审查相关联的数据标准的信息。合规审查122可以进一步包括关于合规审查122的数据资产的信息。例如,合规审查122可以包括来自数据资产的信息和/或对数据资产的引用。合规审查122可以进一步包括状态。在一些实施例中,合规审查可以包括关于负责合规审查的(多个)用户(例如,项目管理者)的信息。
在一些实施例中,证明130可以包括关于作为证明130的主题的数据资产和数据标准的信息。例如,证明可以包括关于数据标准的合规性度量的信息和关于数据资产的信息。证明可以包括对数据标准和/或数据资产的引用。在一些实施例中,证明包括证明的状态(例如,已完成、未完成、已开始、进行中)。在一些实施例中,证明包括要执行证明的证明人的指示。
图6示出了根据本文描述的技术的一些实施例的与由数据处理系统(例如,数据处理系统100)管理的数据资产的治理结合使用的示例过程600的流程图。过程600可以由任何合适的计算设备来执行。例如,过程600可以由本文参考图2A至图2F描述的数据处理系统100执行。
过程600开始于框602,其中,该系统访问包括数据标准的数据治理策略。该系统可以被配置为通过访问定义数据治理策略的信息来访问数据治理策略。例如,该系统可以通过访问来自数据资产的信息来访问数据治理策略,该数据资产存储有关于数据治理策略的信息(例如,作为构成要素的(多个)数据标准的描述和列表)。作为说明性示例,该系统可以向数据持久层发送请求(例如,查询)以获得关于数据治理策略的信息。该信息可以包括关于数据标准的信息。
在一些实施例中,该系统可以被配置为生成数据治理策略的数据标准。例如,该系统可以被配置为通过生成与数据治理策略相关联的新数据资产来生成数据标准。新数据资产可以存储关于数据治理策略的数据标准的信息。然后系统可以访问所生成的数据标准。
接下来,过程600进行到框604,其中,该系统通过使用一个或多个数据资产准则从数据资产中进行选择来生成数据资产集合。在一些实施例中,数据资产可以是由数据处理系统(例如,数据处理系统100)管理的数据资产。该系统可以配置为通过以下方式从数据资产中进行选择:(1)识别满足一个或多个准则的一个或多个数据资产;以及(2)选择所识别的(多个)数据资产。例如,该系统可以使用一个或多个准则来执行搜索以识别(多个)数据资产。作为说明性示例,对于银行系统,一个或多个准则可以包括:(1)该数据资产是“信用评分”数据资产;以及(2)数据资产存储有关于美国居民的信息。在该示例中,该系统可以识别美国居民的“信用评分”数据资产。该系统可以将所识别的(多个)数据资产包括在数据资产集合中。
在一些实施例中,数据资产集合可以是先前生成的,并且在框604处,该系统可以被配置为更新数据资产集合。该系统可以配置为通过以下方式更新数据资产集合:(1)识别满足一个或多个准则的一个或多个数据资产;以及(2)选择所识别的(多个)数据资产。所识别的(多个)数据资产可以与先前包括在数据资产集合中的(多个)数据资产不同(例如,作为数据资产更新的结果)。该系统可以被配置为更新数据资产集合以包括所识别的(多个)数据资产。因此,数据资产集合可以反映数据资产的当前状态。
在一些实施例中,该系统可以被配置为获得一个或多个准则。该系统可以被配置为通过接收指示一个或多个准则的用户输入(例如,通过GUI)来获得一个或多个准则。例如,该系统可以接收指示对搜索和/或筛选GUI中的选择的用户输入以指示一个或多个准则。
接下来,过程600进行到框606,其中,该系统将数据资产集合与数据标准相关联。在一些实施例中,该系统可以被配置为通过存储数据资产集合与数据标准的关联来将数据资产集合与数据标准相关联。例如,该系统可以将对数据资产集合的引用存储在数据标准中(例如,存储在系统的数据标准资产中)。在一些实施例中,将数据资产集合与数据标准相关联可以包括将数据标准与用于生成数据资产集合的一组数据资产准则相关联。例如,该系统可以在数据标准中存储对该组数据资产准则的引用。
在一些实施例中,该系统可以被配置为响应于命令将数据资产集合与数据标准相关联。该命令可以是指示将数据资产集合与数据标准相关联的命令的用户输入。例如,该系统可以通过GUI接收指示命令的用户输入。响应于接收到命令,该系统可以将数据资产集合与数据标准相关联。在一些实施例中,该系统可以被配置为接收指示从(例如,由系统先前生成的)一个或多个数据资产集合的列表中选择数据资产集合的用户输入。例如,该系统可以接收从对表示相应数据资产集合的GUI元素的选择中选择表示数据资产集合的GUI元素。
接下来,过程600进行到框608,其中,该系统验证数据资产集合的一个或多个数据资产是否符合数据标准。该系统可以被配置为通过执行本文参考图7描述的过程700来验证数据资产的(多个)数据资产是否符合数据标准。
图7示出了根据本文描述的技术的一些实施例的验证由系统管理的数据资产是否符合包括与数据资产相关联的数据标准的数据治理策略的示例过程700的流程图。过程700可以由任何合适的计算设备来执行。例如,过程700可以由本文参考图2A至图2F描述的数据处理系统100执行。
过程700开始于框702,其中,该系统识别用于证明数据资产是否符合数据标准的用户。在一些实施例中,该系统可以被配置为使用来自数据资产的信息来识别用户。例如,数据资产可以包括指示负责数据资产的人员的属性值。该系统可以将用户识别为属性值所指示的人。该系统因此可以将这个人自动确定为证明人。
在一些实施例中,该系统可以被配置为生成包括一项或多项合规审查的合规项目(例如,如本文参考图3所描述的)。该系统可以识别用户以将该用户与合规审查中数据资产与数据标准的配对相匹配。用户可以被指派到该配对以执行证明。
接下来,过程700进行到框704,其中,该系统将关于数据资产和数据标准的信息发送到计算设备。计算设备可以与用户相关联。在一些实施例中,该系统可以被配置为通过通信网络(例如,因特网)将关于数据资产和数据标准的信息发送到计算设备。
在一些实施例中,该系统可以被配置为获得关于数据资产和数据标准的信息。该系统可以被配置为通过向存储数据资产和数据标准的数据库系统(例如,数据持久层230)发送请求(例如,查询)来获得该信息。该系统可以被配置为响应于发送请求而接收关于数据资产和数据标准的信息。
接下来,过程700进行到框706,其中,该系统从计算设备获得指示用户关于数据资产是否符合数据标准的证明的输入。在一些实施例中,该系统可以被配置为向用户提供(例如,通过GUI和/或工作流)一个或多个选项。例如,这些选项可以是数据资产未能符合数据标准、部分符合数据标准、不符合数据标准、或者数据标准不适用。该系统可以被配置为接收指示选择选项的输入。在一些实施例中,该系统可以被配置为获得证明信息,该证明信息包括指示用户关于数据资产是否符合数据标准的证明的输入。在一些实施例中,证明信息可以包括其他信息,比如注解和证据(例如,(多个)文件、(多个)文档、(多个)链接和/或其他合适的证据)。
在一些实施例中,该系统可以被配置为存储证明的记录。在一些实施例中,该系统可以被配置为将证明的记录存储在证明对象中。例如,证明对象可以包括一个或多个字段和/或属性。该系统可以被配置为将证明的指示存储在字段或属性中。
接下来,过程700进行到框708,其中,该系统基于证明来验证数据资产是否符合数据标准。例如,如果用户指示数据资产完全符合或部分符合数据标准的证明,则系统可以确定数据资产符合数据标准。否则,该系统可以确定数据资产不符合数据资产。在另一示例中,仅当用户指示数据资产完全符合数据标准的证明时,该系统才可以确定数据资产符合数据标准。否则,该系统可以确定数据资产不符合数据资产。
在一些实施例中,该系统可以被配置为将指示证明的信息存储在证明对象(例如,其是合规审查的一部分)中。在一些实施例中,该系统可以被配置为基于证明来更新证明、合规审查和/或合规项目的状态。例如,该系统可以更新合规审查、合规项目和/或证明的完成百分比以指示证明已完成。
图8是根据本文描述的技术的一些实施例的显示关于数据治理策略的信息的示例图形用户界面(GUI)800的图示。GUI 800示出了包括名称为“关键数据元素(CDE)处理”的策略802以及该策略的描述804的信息。GUI 800还显示了数据治理策略的作为构成要素的数据标准的列表806。列表806包括数据标准的描述808。
图9是根据本文描述的技术的一些实施例的显示关于数据标准的信息的示例图形用户界面(GUI)900的图示。GUI 900显示了数据标准所属的数据治理策略(例如,其信息在图8的GUI 800中显示)的指示902。GUI 900显示了标准的名称904和标准的定义906。GUI900显示了与数据标准相关联的数据资产集合的列表908。如图9所示的示例中,当从列表908中选择数据资产集合时,GUI 900显示数据资产集合的(多个)资产的列表910。
图10是根据本文描述的技术的一些实施例的允许用户从现有数据资产集合的列表中选择数据资产集合以与数据标准相关联的示例图形用户界面(GUI)1000的图示。如指示对“选择现有集合”的选择的图形元素1002所指示的,GUI 1000显示先前生成的可以从中选择以与数据标准相关联的数据资产集合的列表1004。GUI 1000显示了与所列出的数据资产集合相关联的选择准则1005。如图10所示的示例中,当从列表1004中选择数据资产集合时,GUI 1000显示所选数据资产集合的(多个)数据资产的列表1006。
图11是根据本文描述的技术的一些实施例的允许用户创建新的数据资产集合以与数据标准相关联的示例图形用户界面(GUI)1100的图示。如GUI元素1102所指示的,GUI1100允许用户创建新的数据资产集合。GUI 1100允许用户指示资产类型1104并选择特定数据资产1106。GUI 1100显示了将出现在新数据资产集合中的资产1108的列表。
图12是根据本文描述的技术的一些实施例的允许用户创建新的数据资产集合以与数据标准相关联的另一图形用户界面(GUI)1200的示例的图示。如GUI元素1202所指示的,用户已选择创建新的数据资产集合。GUI 1200允许用户指示用于生成数据资产集合的一个或多个准则。GUI 1200允许用户指示数据资产类型1204。在图12的示例中,所选择的数据资产类型是“业务数据元素”。GUI 1200允许用户指示数据资产集合的地区准则1206。在图12的示例中,所指示的地区是“美国”。GUI 1200进一步基于用户指示的准则来显示将包括在数据资产集合中的数据资产的列表1208。
图13是根据本文描述的技术的一些实施例的显示关于数据标准的信息的示例图形用户界面(GUI)1300的图示。GUI 1300显示了数据标准所属的数据治理策略的指示1302。GUI 1300显示了数据标准的名称1304、数据标准的定义1306、以及表明数据资产是否满足数据标准所需的证据的描述1308。GUI 1300显示了与GUI 1300相关联的数据资产集合的列表1310。如图13所示,GUI 1300显示了从列表1310中选择的数据资产集合中的数据资产的列表1312。
图14是根据本文描述的技术的一些实施例的显示关于合规项目的信息的示例图形用户界面(GUI)1400的图示。GUI 1400显示了合规项目的名称1402、合规项目的描述1404、以及合规项目的时间段1406(例如,合规项目将在其中完成)。GUI 1400进一步显示了合规项目的项目所有者1407。GUI 1400显示了作为合规项目的一部分的合规审查的列表1408。该列表包括每项合规审查的描述1410、与每项合规审查相关联的标准1412的名称、以及合规审查的状态1414。如图14所示,状态1414可以是指示合规项目的当前状态的图形元素。
图15是根据本文描述的技术的一些实施例的显示关于合规审查的信息的示例图形用户界面(GUI)1500的图示。GUI 1500显示了合规审查是其一部分的合规项目的指示1502。GUI 1500显示了合规审查的名称1504、合规审查的描述1506、以及合规审查的时间段1508(例如,合规审查将在其中完成)。GUI 1500进一步显示了合规审查的项目所有者1507和/或合规审查是其一部分的合规项目。如图15所示,GUI 1500显示了将作为合规审查的一部分执行的证明的列表1510。列表1510包括证明的标识符1512和要为其执行证明的数据资产的名称1514。GUI 1500显示了数据资产是否满足标准(例如,根据证明来确定)的状态1516。
图16是根据本文描述的技术的一些实施例的显示关于证明的信息的示例图形用户界面(GUI)1600的图示。GUI 1600显示了关于证明所来自的合规项目的信息,包括合规项目的名称1602、合规项目的时间段1604、以及该证明是其一部分的合规审查的名称1606。GUI 1600进一步显示了关于与证明相关联的人员的信息,包括合规项目所有者1608和一个或多个主题专家1610。GUI 1600进一步显示了关于要用来执行证明的数据标准的信息1310。如图16所示,关于数据标准的信息1610包括数据标准的名称、数据标准所属的数据治理策略的名称、数据标准的描述(例如,数据标准的要求规则)、以及证明数据资产符合数据标准所需的证据的描述。GUI 1600进一步显示了证明信息1612。证明信息1612包括状态(例如,“正在评估资产”)和注解(例如,“我已经审查了数据并且该数据集被正确地列为包含PII”)。GUI 1600提供了用户可以通过其来提交证明GUI部分1614。例如,用户可以提供用于证明与证明相关联的数据资产是否符合与证明相关联的数据标准的声明。
图17是根据本文描述的技术的一些实施例的显示关于正在进行的(多个)合规项目的信息的示例图形用户界面(GUI)1700的图示。GUI 1700显示了正在进行的合规项目的列表1702。该列表可以是可扩展列表,其中当选择合规项目时,GUI 1700显示该合规项目的合规审查。例如,在图17的示例中,该GUI显示了1700列表1702中的所选合规项目的合规审查的列表1706。GUI 1700进一步显示了指示合规项目的状态的GUI元素1704和指示合规审查的状态的GUI元素1708。GUI 1700进一步显示了正在进行的合规项目的证明的列表1710。列表1710可以按状态(例如,“未开始”、“需要票证”、“已完成”)来划分。
图18是根据本文描述的技术的一些实施例的显示关于合规项目的证明状态的信息的示例图形用户界面(GUI)1800的图示。GUI 1800提供用户可以通过其查看证明(例如,所有证明或一个或多个合规项目的证明)的界面。GUI 1800提供了用户可以通过其来筛选证明的筛选器1808。例如,如图18所示,GUI 1800可以允许用户基于合规项目、指示的证明(例如,不满足数据标准、不适用、部分符合数据标准、未定义、以及符合数据标准,如图18所示)进行筛选。GUI 1800可以进一步允许用户基于证明状态(例如,需要关注或签署)和主题专家进行筛选。GUI 1800基于所选准则来显示证明的列表1802。GUI 1800显示要对其执行每个证明的资产的列表1804,以及针对每个证明要进行证明的标准1810的列表。GUI 1800还显示了所列出的证明的状态的列表1806。
图19是根据本文描述的技术的一些实施例的允许用户对从图18的GUI 1800中选择的一个或多个证明执行编辑的示例图形用户界面(GUI)1900的图示。GUI 1900允许用户编辑所选择的(多个)证明的属性。这些属性包括注解、证明评估、项目所有者、审查所有者、主题专家和文本证据。在图19的示例中,用户已经选择了注解1902和证明评估1904。GUI1900提供了用户可以用来指示证明评估的可选选项1906。GUI 1900为用户提供文本输入1908以在所选择的(多个)证明中提供注解。
图20是根据本文描述的技术的一些实施例的允许用户签署一个或多个证明的示例图形用户界面(GUI)2000的图示。GUI 2000显示所选择的(多个)证明的列表2002。GUI2000向用户提供选项2008以签署或提交对所选择的(多个)证明的证明。
图21是根据本文描述的技术的一些实施例的显示关于数据资产的信息的示例图形用户界面(GUI)2100的图示。GUI 1800显示了数据资产的名称2102。GUI 2100进一步显示了涉及数据资产的(多个)证明的列表2104。GUI 2100显示了(多个)证明的(多个)数据标准的列表2106。GUI 2100进一步显示了列表2104的证明的状态列表2108。
示例计算机系统
图22展示了可以在其上实施本文描述的技术的合适计算系统环境2200的示例。计算系统环境2200仅是合适的计算环境的一个示例,并且不旨在对本文描述的技术的使用或功能的范围提出任何限制。也不应当将计算环境2200解释为具有与示例性操作环境2200中展示的部件中的任何一个或组合相关的任何依赖性或要求。
本文描述的技术与许多其他通用或专用计算系统环境或配置一起操作。可以适合与本文描述的技术一起使用的众所周知的计算系统、环境和/或配置的示例包括但不限于个人计算机、服务器计算机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品、网络PC、小型计算机、大型计算机、包括上述系统或设备中任一个的分布式计算环境等。
计算环境可以执行计算机可执行指令,比如程序模块。通常,程序模块包括执行特定任务或实施特定抽象数据类型的例程、程序、对象、部件、数据结构等。本文描述的技术还可以在分布式计算环境中实践,其中任务由通过通信网络链接的远程处理设备执行。在分布式计算环境中,程序模块可以位于包括存储器存储设备的本地和远程计算机存储介质中。
参照图22,用于实施本文描述的技术的示例性系统包括呈计算机2200形式的通用计算设备。计算机2210的部件可以包括但不限于处理单元2220、系统存储器2230、以及将包括系统存储器的各种系统部件耦接到处理单元2220的系统总线2221。系统总线2221可以是包括存储器总线或存储器控制器、外围总线和使用各种总线架构中的任何架构的本地总线的若干类型的总线结构中的任何总线结构。通过举例而非限制,这样的架构包括工业标准架构(ISA)总线、微通道架构(MCA)总线、增强ISA(ELISA)总线、视频电子标准协会(VESA)本地总线、以及外围部件互连(PCI)总线(也称为夹层(Mezzanine)总线)。
计算机2210通常包括各种计算机可读介质。计算机可读介质可以是可由计算机2210访问的任何可用介质,并且包括易失性和非易失性、可移除和不可移除介质。通过举例而非限制,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以任何方法或技术实施的用于存储比如计算机可读指令、数据结构、程序模块、或其他数据等信息的易失性和非易失性介质、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存存储器或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储设备、磁带盒、磁带、磁盘存储设备或其他磁存储设备、或者可以用于存储期望信息并可以由计算机2210访问的任何其他介质。通信介质通常以比如载波或其他传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其他数据,并且包括任何信息传递介质。术语“已调制数据信号”是指以编码信号中的信息的这种方式使其特性中的一个或多个被设置或改变的信号。通过举例而非限制,通信介质包括有线介质(比如有线网络或直接有线连接)以及无线介质(比如声学、RF、红外线及其他无线介质)。上述中的任一个的组合也应包括在计算机可读介质的范围内。
系统存储器2230包括呈易失性和/或非易失性存储器形式的计算机存储介质,比如只读存储器(ROM)2231和随机存取存储器(RAM)2232。包含比如在启动期间帮助在计算机2210内的元件之间传输信息的基本例程的基本输入/输出系统2233(BIOS)通常存储在ROM2231中。RAM 2232通常包含可由处理单元2220立即访问和/或当前操作的数据和/或程序模块。作为示例且非限制,图22示出了操作系统2234、应用程序2235、其他程序模块2236和程序数据2237。
计算机2210还可以包括其他可移除/不可移除、易失性/非易失性计算机存储介质。仅作为示例,图22示出了读取或写入不可移除的非易失性磁介质的硬盘驱动器2241、读取或写入可移除非易失性存储器2252(比如闪存存储器)的闪存驱动器2251、以及读取或写入可移除的非易失性光盘2256(比如CD ROM或其他光学介质)的光盘驱动器2255。可以用于示例性操作环境中的其他可移除/不可移除、易失性/非易失性计算机存储介质包括但不限于磁带盒、闪存存储器卡、数字多功能盘、数字录像带、固态RAM、固态ROM等。硬盘驱动器2241通常通过比如接口2240等不可移除存储器接口连接到系统总线2221,并且磁盘驱动器2251和光盘驱动器2255通常由比如接口2250等可移除存储器接口连接到系统总线2221。
上面描述和在图22中展示的驱动器及其相关联的计算机存储介质为计算机2210提供了对计算机可读指令、数据结构、程序模块和其他数据的存储。例如,在图22中,硬盘驱动器2241被示为存储操作系统2244、应用程序2245、其他程序模块2246和程序数据2247。注意,这些部件与操作系统2234、应用程序2235、其他程序模块2236以及程序数据2237可以是相同或不同的。这里给予了操作系统2244、应用程序2245、其他程序模块2246和程序数据2247不同的附图标记,以展示至少它们是不同的副本。行动者可以通过如键盘2262和指向设备2261(通常称为鼠标、轨迹球或触摸板)的输入设备将命令和信息输入到计算机2210中。其他输入设备(未示出)可以包括麦克风、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪等。这些和其他输入设备通常通过耦接到系统总线的用户输入接口2260连接到处理单元2220,但可以由比如并行端口、游戏端口或通用串行总线(USB)等其他接口和总线结构来连接。监视器2291或其他类型的显示设备也经由比如视频接口2290等接口连接到系统总线2221。除了监视器之外,计算机还可以包括可通过输出外围接口2295连接的其他外围输出设备,比如扬声器2297和打印机2296。
计算机2210可以使用与一个或多个远程计算机(比如远程计算机2280)的逻辑连接在联网环境中操作。远程计算机2280可以是个人计算机、服务器、路由器、网络PC、对等设备、或其他常见网络节点,并且通常包括上面相对于计算机2210描述的元件中的许多或全部,尽管在图22中仅展示了存储器存储设备2281。图22中描绘的逻辑连接包括局域网(LAN)2281和广域网(WAN)2283,但是还可以包括其他网络。这样的联网环境在办公室、企业范围计算机网络、内联网和因特网中是普遍的。
当在LAN联网环境中使用时,计算机2210通过网络接口或适配器2280连接到LAN2281。当在WAN联网环境中使用时,计算机2210通常包括调制解调器2282或用于通过比如因特网等WAN 2283建立通信的其他装置。调制解调器2282可以是内置的或外置的,其可以经由行动者输入接口2260或其他适当的机制连接到系统总线2221。在联网环境中,相对于计算机2210描绘的程序模块或是其部分可以存储在远程存储器存储设备中。作为示例且非限制,图22展示了远程应用程序2285驻留在存储器设备2281上。应当理解,所示出的网络连接是示例性的,并且可以使用在计算机之间建立通信链路的其他手段。
如此描述了本文描述的技术的至少一个实施例的若干方面之后,应当理解,本领域技术人员会容易想到各种改变、修改以及改进。
此类改变、修改以及改进意在成为本披露的部分,并且意在处于本披露的精神与范围之中。进一步地,尽管指示了本文描述的技术的优点,但应当理解,并非本文描述的技术的每个实施例都将包括每个描述的优点。一些实施例可以不实施在本文中描述为有利的任何特征,并且在一些情况下,可以实施描述的特征中的一个或多个以实现进一步的实施例。因此,前文描述和附图仅是通过举例的方式。
本文描述的技术的上述实施例可以以多种方式中的任一种来实施。例如,实施例可以使用硬件、软件或其组合实施。当以软件实施时,可以在任何合适的处理器或处理器的集合上执行软件代码,无论该软件代码是提供在单个计算机中还是分布在多个计算机当中。这类处理器可以被实施为集成电路(其中集成电路部件中具有一个或多个处理器),包括名称为比如CPU芯片、GPU芯片、微处理器、微控制器或协处理器的本领域已知的市售集成电路部件。可替代地,处理器可以以定制电路系统(比如ASIC)或者通过配置可编程逻辑设备产生的半定制电路系统来实施。作为又一替代方案,处理器可以是较大电路或半导体设备的一部分,无论是市售的、半定制的还是定制的。作为具体示例,一些市售微处理器具有多个核,使得这些核中的一个或子集可以构成处理器。然而,处理器可以使用任何合适形式的电路系统来实施。
进一步地,应当理解,计算机可以体现为多种形式中的任何形式,比如机架式计算机、台式计算机、膝上型计算机或平板计算机。另外,计算机可以嵌入在通常不被认为是计算机但具有合适的处理能力的设备中,该设备包括个人数字助理(PDA)、智能手机或任何其他合适的便携式或固定式电子设备。
而且,计算机可以具有一个或多个输入设备和输出设备。这些设备可以尤其用于呈现用户接口。可以用于提供用户接口的输出设备的示例包括用于对输出进行视觉呈现的打印机或显示屏,以及扬声器或用于对输出进行听觉呈现的其他声音生成设备。可以用于用户接口的输入设备的示例包括键盘和指向设备,比如鼠标、触摸板以及数字化平板。作为另一示例,计算机可以通过语音识别或以其他听觉格式接收输入信息。
这样的计算机可以由采用任何合适的形式的一个或多个网络来互连,该一个或多个网络包括局域网或广域网,比如企业网或因特网。这样的网络可以基于任何合适的技术并且可以根据任何合适的协议来操作,并且可以包括无线网络、有线网络或光纤网络。
此外,本文中概括的各种方法或过程可以被编码为在采用各种操作系统或平台中的任一种的一个或多个处理器上可执行的软件。另外,这种软件可以使用多种合适的编程语言和/或编程或脚本工具中的任一种来编写,并且还可以被编译为可执行的机器语言代码或在框架或虚拟机上执行的中间代码。
在这方面,本文描述的技术的各方面可以被体现为用一个或多个程序进行编码的计算机可读存储介质(或多个计算机可读介质)(例如,计算机存储器、一个或多个软盘、压缩光盘(CD)、光盘、数字视频盘(DVD)、磁带、闪存存储器、现场可编程门阵列或其他半导体设备中的电路配置、或其他有形计算机存储介质),该一个或多个程序在一个或多个计算机或其他处理器上执行时执行实施上文描述的各种实施例的方法。如从前文示例将清楚明白,计算机可读存储介质可以将信息保留足够的时间,以便提供采用非暂态形式的计算机可执行指令。这种计算机可读存储介质可以是可运送的,使得其上存储的一个或多个程序可以加载到一个或多个不同的计算机或其他处理器上,以实施如上文描述的技术的各个方面。如本文使用的,术语“计算机可读存储介质”仅涵盖可被看作是制品(即,制造物品)或机器的非暂态计算机可读介质。可替代地或另外地,本文描述的技术的各方面可以体现为除计算机可读存储介质之外的计算机可读介质,诸如传播信号。
术语“程序”或“软件”在本文中在一般意义上使用,以指代任何类型的计算机代码或计算机可执行指令集,这些计算机可执行指令集可以被用来对计算机或其他处理器进行编程以实施如上文描述的技术的各个方面。另外,应该理解,根据该实施例的一个方面,当被执行时执行本文描述的技术的方法的一个或多个计算机程序不必驻留在单个计算机或处理器上,但可以按照模块的方式分布在多个不同的计算机或处理器中以实施本文描述的技术的各个方面。
计算机可执行指令可以呈由一个或多个计算机或其他设备执行的许多形式,比如程序模块。通常,程序模块包括执行特定任务或实施特定抽象数据类型的例程、程序、对象、部件、数据结构等。典型地,程序模块的功能在不同实施例中可以根据需要进行组合或分配。
此外,数据结构可以以任何合适的形式存储在计算机可读介质中。为了简化说明,可以将数据结构示出为具有通过数据结构中的位置而相关的字段。这样的关系同样可以通过为用于字段的存储指派传达字段之间关系的计算机可读介质中的位置来实现。然而,可以使用任何合适的机制来建立数据结构的字段中的信息之间的关系,包括通过使用指针、标签、或建立数据元素之间的关系的其他机制。
本文描述的技术的不同方面可以单独使用、组合使用、或以前文所述的实施例中未确切描述的多种布置使用,并且因此在其应用中不局限于其在前文描述中所阐述或附图中所展示的部件的细节和布置。例如,一个实施例中描述的方面可以以任何方式与其他实施例中描述的方面组合。
此外,本文描述的技术可以体现为一种方法,本文提供了该方法的示例,包括参考图3和图7。作为这些方法中的任一种方法的一部分而执行的动作可以以任何合适的方式排序。因此,可以构造实施例,在这些实施例中,动作以与所示的顺序不同的顺序执行,这些动作可以包括同时执行一些动作,即使这些动作在说明性实施例中被示出为连续动作。
进一步地,一些动作被描述为由“行动者”或“用户”做出。应当理解,“行动者”或“用户”不必是单个个人,并且在一些实施例中,可归因于“行动者”或“用户”的动作可以由个人团队和/或个人与计算机辅助工具或其他机构的组合来执行。
在权利要求中使用诸如“第一”、“第二”、“第三”等序数术语来修饰权利要求要素本身并不意味着一个权利要求要素相对于另一个权利要求要素的任何优先权、优越性或顺序、或方法的动作执行的时间顺序,而是仅用作标签以将具有特定名称的一个权利要求要素与具有相同名称(但使用了序数术语)的另一个要素区分开来以区分权利要求要素。
而且,在本文中使用的措辞和术语是用于描述的目的,而不应当被视为是限制性的。本文使用的“包括(including)”、“包括(comprising)”或“具有(having)”、“包含(containing)”、“涉及(involving)”及其变型旨在涵盖其后所列的多项及其等效形式、以及附加项。
Claims (36)
1.一种用于确定由数据处理系统管理的数据是否符合数据治理策略的方法,该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对,该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则,该方法包括:
使用至少一个计算机硬件处理器执行以下操作:
接收指示用于将数据资产纳入第一数据资产集合中的至少一个准则的用户输入;
通过从该多个数据资产中自动识别满足该至少一个准则的数据资产来生成该第一数据资产集合;
从该数据治理策略的一个或多个数据标准中选择第一数据标准;
将该第一数据标准与该第一数据资产集合相关联;以及
至少部分地通过验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
2.如权利要求1所述的方法,其中该至少一个准则指示数据资产中的至少一个属性为满足该至少一个准则而必须具有的至少一个值。
3.如权利要求1或任何其他前述权利要求所述的方法,进一步包括:
从该数据的一个或多个数据标准中选择第二数据标准;
将该第二数据标准与该第一数据资产集合相关联;以及
至少部分地通过验证该第一数据资产集合中的数据资产是否满足由该第二数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
4.如权利要求1或任何其他前述权利要求所述的方法,进一步包括:
在验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指定的一个或多个规则之前,使用该至少一个准则来更新该第一数据资产集合。
5.如权利要求4或任何其他前述权利要求所述的方法,其中,使用该至少一个准则来更新该第一数据资产集合包括:
识别该多个数据资产中不在该第一数据资产集合中且满足该至少一个准则的至少一个数据资产;以及
响应于识别到满足该至少一个准则的至少一个数据资产,将该至少一个数据资产添加到该数据资产集合。
6.如权利要求4或任何其他前述权利要求所述的方法,其中,使用该至少一个数据资产准则来更新该第一动态数据资产集合包括:
识别该第一数据资产集合中不再满足该至少一个数据资产准则的至少一个数据资产;以及
响应于识别到不满足该至少一个数据资产准则的至少一个数据资产,从该第一数据资产集合中移除该至少一个数据资产。
7.如权利要求1或任何其他前述权利要求所述的方法,其中,将该第一数据标准与该第一数据资产集合相关联包括:
通过图形用户界面(GUI)接收指示从多个数据资产集合中选择该第一数据资产集合的用户输入;以及
响应于接收到该用户输入,将该第一数据标准与该第一数据资产集合相关联。
8.如权利要求1或任何其他前述权利要求所述的方法,其中,将该第一数据标准与该第一数据资产集合相关联包括:
通过图形用户界面(GUI)接收指示选择该第一数据标准的用户输入;以及
响应于接收到该用户输入,将该第一数据标准与该第一数据资产集合相关联。
9.如权利要求8或任何其他前述权利要求所述的方法,其中,该GUI显示表示多个数据资产集合的GUI元素,并且该用户输入通过指示选择这些GUI元素之一来指示选择该第一数据资产集合。
10.如权利要求8或任何其他前述权利要求所述的方法,其中,在选择该第一数据资产集合之后,该GUI显示指示满足该至少一个准则的一个或多个数据资产的信息。
11.如权利要求8或任何其他前述权利要求所述的方法,其中,该GUI包括允许用户搜索满足该至少一个准则的数据资产的界面。
12.如权利要求1或任何其他前述权利要求所述的方法,进一步包括:
生成显示该第一数据资产集合中的至少一些数据资产的列表的第一GUI;
生成显示关于该第一数据标准的信息的第一GUI,该信息包括该第一数据资产集合的指示;
通过该第一GUI接收指示选择该至少一些数据资产的列表中的数据资产的用户输入;以及
响应于接收到该用户输入,生成显示关于所选数据资产的信息的第二GUI。
13.如权利要求1或任何其他前述权利要求所述的方法,其中,验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指示的一个或多个规则包括针对该第一数据资产集合中的至少一个数据资产进行以下操作:
基于该至少一个数据资产的至少一个属性来识别用于确定该至少一个数据资产是否满足由该第一数据标准指示的一个或多个规则的用户;
通过通信网络向与该用户相关联的计算设备发送关于该至少一个数据资产和该第一数据标准的信息;以及
通过该通信网络从与该用户相关联的计算设备接收指示该至少一个数据资产是否满足由该第一数据标准指示的一个或多个规则的信息。
14.如权利要求1或任何其他前述权利要求所述的方法,其中,验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指示的一个或多个规则包括针对该第一数据资产集合中的至少一些数据资产中的每项特定数据资产进行以下操作:
基于该特定数据资产的至少一个属性来识别用于确定该特定数据资产是否满足由该第一数据标准指示的一个或多个规则的用户;
通过通信网络向与该用户相关联的计算设备发送关于该特定数据资产和该第一数据标准的信息;以及
通过该通信网络从与该用户相关联的计算设备接收指示该特定数据资产是否满足由该第一数据标准指示的一个或多个规则的信息。
15.如权利要求14或任何其他前述权利要求所述的方法,其中,指示该特定数据资产是否满足由该第一数据标准指示的一个或多个规则的信息包括该用户关于该特定数据资产是否满足由该第一数据标准指示的一个或多个规则的证明。
16.如权利要求1或任何其他前述权利要求所述的方法,其中,验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指示的一个或多个规则包括自动这些验证数据资产是否满足由该第一数据标准指示的一个或多个规则。
17.如权利要求1或任何其他前述权利要求所述的方法,进一步包括:
接收指示用于将数据资产纳入第二数据资产集合中的至少一个第二准则的用户输入;
通过从该多个数据资产中自动识别满足用于将数据资产纳入该第二数据资产集合的该至少一个第二准则的数据资产来生成该第二数据资产集合;
从该数据治理策略的一个或多个数据标准中选择第二数据标准;
将该第二数据标准与该第二数据资产集合相关联;以及
至少部分地通过验证该第二数据资产集合中的数据资产是否满足由该第二数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
18.如权利要求1或任何其他前述权利要求所述的方法,进一步包括:
从该数据治理策略的一个或多个数据标准中选择第二数据标准;
将该第二数据标准与该第一数据资产集合相关联;以及
至少部分地通过验证该第一数据资产集合中的数据资产是否满足由该第二数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
19.如权利要求1或任何其他前述权利要求所述的方法,其中,将该第一数据标准与该第一数据资产集合相关联包括将该第一数据资产集合的指示存储在该第一数据标准中。
20.如权利要求1或任何其他前述权利要求所述的方法,其中,由该数据处理系统管理的数据所管理的数据包括与企业系统中的数据相关联的信息。
21.至少一种非暂态计算机可读存储介质,存储有处理器可执行指令,这些指令当由至少一个计算机硬件处理器执行时,使得该至少一个计算机硬件处理器执行用于确定由数据处理系统管理的数据是否符合数据治理策略的方法,该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对,该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则,该方法包括:
接收指示用于将数据资产纳入第一数据资产集合中的至少一个准则的用户输入;
通过从该多个数据资产中自动识别满足该至少一个准则的数据资产来生成该第一数据资产集合;
从该数据治理策略的一个或多个数据标准中选择第一数据标准;
将该第一数据标准与该第一数据资产集合相关联;以及
至少部分地通过验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
22.一种用于确定由数据处理系统管理的数据是否符合数据治理策略的系统,该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对,该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则,该系统包括:
至少一个计算机硬件处理器;以及
存储有指令的至少一个非暂态计算机可读存储介质,这些指令当由该至少一个计算机硬件处理器执行时使得该至少一个计算机硬件处理器执行以下操作:
接收指示用于将数据资产纳入第一数据资产集合中的至少一个准则的用户输入;
通过从该多个数据资产中自动识别满足该至少一个准则的数据资产来生成该第一数据资产集合;
从该数据治理策略的一个或多个数据标准中选择第一数据标准;
将该第一数据标准与该第一数据资产集合相关联;以及
至少部分地通过验证该第一数据资产集合中的数据资产是否满足由该第一数据标准指定的一个或多个规则来确定由该数据处理系统管理的数据是否符合该数据治理策略。
23.一种用于确定由数据处理系统管理的数据是否符合数据治理策略的方法,该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对,该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则,该一个或多个数据标准各自与一个或多个数据资产集合相关联,该一个或多个数据标准包括与该一个或多个数据资产集合中的第一数据资产集合相关联的第一数据标准,该方法包括:
使用至少一个计算机硬件处理器执行以下操作:
访问来自与该第一数据标准相关联的第一数据资产集合的第一数据资产;
基于该第一数据资产中的数据识别用于证明该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一用户;
通过通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第一数据标准的信息;
通过该通信网络从该第一计算设备获得第一输入,该第一输入指示该第一用户关于该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一证明;以及
使用指示该第一证明的第一输入来确定由该数据处理系统管理的数据是否符合该数据治理策略。
24.如权利要求23所述的方法,其中该至少一个准则指示数据资产中的至少一个属性为满足该至少一个准则而必须具有的至少一个值。
25.如权利要求23或任何其他前述权利要求所述的方法,进一步包括:
访问来自该第一数据资产集合的第二数据资产;
基于该第二数据资产的至少一个属性-值对来识别用于证明该第二数据资产是否满足由该第一数据标准指示的一个或多个规则的第二用户;
通过该通信网络向与该第二用户相关联的第二计算设备发送关于该第二数据资产和该第一数据标准的信息;
通过该通信网络从该第二计算设备获得第二输入,该第二输入指示该第二用户关于该第二数据资产是否满足由该第一数据标准指示的一个或多个规则的第二证明;以及
使用指示该第二证明的第二输入来确定由该数据处理系统管理的数据是否符合该数据治理策略。
26.如权利要求23或任何其他前述权利要求所述的方法,其中,识别用于证明该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一用户包括:
将由该第一数据资产的至少一个属性-值对指示的一个或多个用户识别为负责管理该第一数据资产;以及
从该一个或多个用户中选择该第一用户。
27.如权利要求23或任何其他前述权利要求所述的方法,其中,获得指示该第一证明的第一用户输入包括通过GUI获得该第一用户输入。
28.如权利要求23或任何其他前述权利要求所述的方法,进一步包括:
通过该通信网络从该第一计算设备获得指示该第一用户关于该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一证明的证据的信息。
29.如权利要求23或任何其他前述权利要求所述的方法,进一步包括:
跟踪关于该第一数据资产集合中的数据资产是否满足由该第一数据标准指示的一个或多个规则的多个证明。
30.如权利要求29或任何其他前述权利要求所述的方法,进一步包括:
生成指示这些证明的完成程度的GUI元素。
31.如权利要求23或任何其他前述权利要求所述的方法,进一步包括:
生成该第一数据资产的第一证明对象;以及
将指示该第一证明的信息存储在该第一证明对象中。
32.如权利要求31或任何其他前述权利要求所述的方法,进一步包括:
将该第一数据标准与该第一数据资产的关联存储在该第一证明对象中。
33.如权利要求23或任何其他前述权利要求所述的方法,其中,该第一证明指示该第一数据资产满足该第一数据标准、部分满足该第一标准、未定义、不满足该第一标准、或者该第一数据标准不适用于该第一数据资产。
34.如权利要求23或任何其他前述权利要求所述的方法,其中,该第一数据资产集合与该一个或多个数据标准中的第二数据标准相关联,并且该方法进一步包括:
基于该第一数据资产的至少一个属性-值对来识别用于证明该第一数据资产是否满足由该第二数据标准指示的一个或多个规则的第一用户;
通过该通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第二数据标准的信息;
通过该通信网络从该第一计算设备获得第二输入,该第二输入指示该第一用户关于该第一数据资产是否满足由该第二数据标准指示的一个或多个规则的第二证明;以及
使用指示该第二证明的第二输入来确定由该数据处理系统管理的数据是否符合该数据治理策略。
35.至少一种非暂态计算机可读存储介质,存储有处理器可执行指令,这些指令当由至少一个计算机硬件处理器执行时,使得该至少一个计算机硬件处理器执行用于确定由数据处理系统管理的数据是否符合数据治理策略的方法,该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对,该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则,该一个或多个数据标准各自与一个或多个数据资产集合相关联,该一个或多个数据标准包括与该一个或多个数据资产集合中的第一数据资产集合相关联的第一数据标准,该方法包括:
访问来自与该第一数据标准相关联的第一数据资产集合的第一数据资产;
基于该第一数据资产中的数据识别用于证明该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一用户;
通过通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第一数据标准的信息;
通过该通信网络从该第一计算设备获得第一输入,该第一输入指示该第一用户关于该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一证明;以及
使用指示该第一证明的第一输入来确定由该数据处理系统管理的数据是否符合该数据治理策略。
36.一种用于确定由数据处理系统管理的数据是否符合数据治理策略的系统,该数据处理系统将该数据存储在多个数据资产中,每个数据资产包括一个或多个属性-值对,该数据治理策略包括一个或多个数据标准,每个数据标准指示数据资产为满足该数据标准而必须满足的一个或多个规则,该一个或多个数据标准各自与一个或多个数据资产集合相关联,该一个或多个数据标准包括与该一个或多个数据资产集合中的第一数据资产集合相关联的第一数据标准,该系统包括:
至少一个计算机硬件处理器;以及
存储有指令的至少一个非暂态计算机可读存储介质,这些指令当由该至少一个计算机硬件处理器执行时使得该至少一个计算机硬件处理器执行以下操作:
访问来自与该第一数据标准相关联的第一数据资产集合的第一数据资产;
基于该第一数据资产中的数据识别用于证明该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一用户;
通过通信网络向与该第一用户相关联的第一计算设备发送关于该第一数据资产和该第一数据标准的信息;
通过该通信网络从该第一计算设备获得第一输入,该第一输入指示该第一用户关于该第一数据资产是否满足由该第一数据标准指示的一个或多个规则的第一证明;以及
使用指示该第一证明的第一输入来确定由该数据处理系统管理的数据是否符合该数据治理策略。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/210,951 | 2021-06-15 | ||
US202163295693P | 2021-12-31 | 2021-12-31 | |
US63/295,693 | 2021-12-31 | ||
PCT/US2022/032485 WO2022265884A1 (en) | 2021-06-15 | 2022-06-07 | Data governance systems and methods |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117677942A true CN117677942A (zh) | 2024-03-08 |
Family
ID=90068416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280042839.4A Pending CN117677942A (zh) | 2021-06-15 | 2022-06-07 | 数据治理系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117677942A (zh) |
-
2022
- 2022-06-07 CN CN202280042839.4A patent/CN117677942A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11144670B2 (en) | Data processing systems for identifying and modifying processes that are subject to data subject access requests | |
US10949170B2 (en) | Data processing systems for integration of consumer feedback with data subject access requests and related methods | |
US11875400B2 (en) | Systems, methods, and apparatuses for dynamically assigning nodes to a group within blockchains based on transaction type and node intelligence using distributed ledger technology (DLT) | |
US10346638B2 (en) | Data processing systems for identifying and modifying processes that are subject to data subject access requests | |
US10713387B2 (en) | Consent conversion optimization systems and related methods | |
US10353673B2 (en) | Data processing systems for integration of consumer feedback with data subject access requests and related methods | |
US10572236B2 (en) | System and method for updating or modifying an application without manual coding | |
US20190096020A1 (en) | Consent receipt management systems and related methods | |
US20180341784A1 (en) | Data processing systems for the identification and deletion of personal data in computer systems | |
US20220215125A1 (en) | Viewing, selecting, and triggering a data pipeline to derive a collaborative dataset | |
US20090313079A1 (en) | Managing access rights using projects | |
JP2006190279A (ja) | メタデータ駆動型ビジネス・ロジック(metadatadrivenbusinesslogic)処理のための方法および装置 | |
US10776514B2 (en) | Data processing systems for the identification and deletion of personal data in computer systems | |
US11645353B2 (en) | Data processing consent capture systems and related methods | |
AU2022293332A1 (en) | Data governance systems and methods | |
US20230145461A1 (en) | Receiving and integrating external data into a graphical user interface of an issue tracking system | |
US20220035946A1 (en) | Data processing systems for identifying and modifying processes that are subject to data subject access requests | |
CN117677942A (zh) | 数据治理系统和方法 | |
Schaefer et al. | Deciding how to decide: Using the Digital Preservation Storage Criteria | |
US20240086409A1 (en) | Techniques for pre-assignment validation of data managed by a data processing system | |
US20240073194A1 (en) | Systems and methods for providing a digital credentials registry | |
CN116802624A (zh) | 在数据处理系统中使用数据实体和继承管理数据的技术 | |
Saleem et al. | Generic and Personalized Web/Mobile Services by Abstracting and Specializing SQL Queries | |
WO2019036651A1 (en) | DATA PROCESSING SYSTEMS AND METHODS FOR ENABLING PEUPLER AND MANAGING A CENTRALIZED DATABASE OF PERSONAL DATA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |