CN102067106A - 通过确定子节点和父节点的度量值进行的数据质量跟踪 - Google Patents
通过确定子节点和父节点的度量值进行的数据质量跟踪 Download PDFInfo
- Publication number
- CN102067106A CN102067106A CN200980123317.1A CN200980123317A CN102067106A CN 102067106 A CN102067106 A CN 102067106A CN 200980123317 A CN200980123317 A CN 200980123317A CN 102067106 A CN102067106 A CN 102067106A
- Authority
- CN
- China
- Prior art keywords
- metric
- data
- node
- computer
- child
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 48
- 230000008569 process Effects 0.000 claims description 30
- 230000008859 change Effects 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 description 48
- 238000013500 data storage Methods 0.000 description 22
- 238000013442 quality metrics Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000013475 authorization Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Stored Programmes (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Abstract
一般地,一种方法包括:确定(502)一个或多个子节点的、与数据质量相关联的各度量值。基于所述子节点中至少一些子节点的度量值来确定(504)父节点的度量值,并且一个或多个父节点和一个或多个子节点之间的关系定义了层级。针对多个实例来重复(506)确定父节点的度量值的步骤。
Description
技术领域
本描述涉及数据质量跟踪。
背景技术
所存储的数据集经常包括事先不知道其各种特性的数据。例如,数据集的值的范围或典型值、数据集内不同字段之间的关系、或不同字段中各值之中的功能相关性可能是未知的。数据剖析(profiling)可以含有检验数据集的源以便确定这种特性。数据剖析系统的一个用途是基于数据剖析的结果来确定单一数据对象或整个数据集的数据质量的测量。
发明内容
在一个方面中,一般地,一种方法包括针对一个或多个子节点来确定与数据质量相关联的各度量值。基于所述子节点中至少一些子节点的度量值来确定父节点的度量值,并且一个或多个父节点和一个或多个子节点之间的关系定义了层级。针对多个实例来重复确定父节点的度量值的步骤。
各方面可以包括以下特征中的一个或多个特征。在确定父节点的度量值的步骤中使用的一个或多个子节点不具有子节点。生成表示了由所述子节点和父节点表示的数据的特性的剖析信息。所述子节点的度量值基于该剖析信息。该层级的安排由用户来指定。用户指定该剖析信息内的哪些数据字段将影响所述度量值的确定。用户选择一个或多个预先构造的因素,以影响所述度量值的确定。将所述各度量值和所述度量值表示为从0到100的数字。在连续线形图表上,作为时间的函数、针对所述多个实例中的每一个来显示所述一个或多个子节点的度量值或所述父节点的度量值中的一个或两者。该连续线形图表基于该剖析信息而自动地生成。该图表指示了用于管控所述度量值的确定的规则的改变。该图表指示了在确定父节点的度量值的步骤中使用的度量值的改变。
在另一方面中,一般地,一种计算机可读介质存储了用于在根据装置信号而获得值中使用的可执行指令,所述指令使得计算机确定一个或多个子节点的各度量值。基于所述子节点中至少一些子节点的度量值来确定父节点的度量值,其中一个或多个父节点和一个或多个子节点之间的关系定义了层级。针对多个实例来重复确定父节点的度量值的步骤。
各方面可以包括以下特征中的一个或多个特征。在确定父节点的度量值的步骤中使用的所述一个或多个子节点不具有子节点。生成表示了由所述子节点和父节点表示的数据的特性的剖析信息。所述子节点的度量值基于该剖析信息。该层级的安排由用户来指定。用户指定该剖析信息内的哪些数据字段将影响所述度量值的确定。用户选择一个或多个预先构造的因素,以影响所述度量值的确定。将所述各度量值和所述度量值表示为从0到100的数字。在连续线形图表上,作为时间的函数、针对所述多个实例中的每一个来显示所述一个或多个子节点的度量值或所述父节点的度量值中的一个或两者。该连续线形图表基于该剖析信息而自动地生成。该图表指示了用于管控度量值的确定的规则的改变。该图表指示了在确定父节点的度量值的步骤中使用的所述度量值的改变。
在另一方面中,一般地,一种系统包括用于确定一个或多个子节点的各度量值的部件。一种系统还包括用于基于所述子节点中至少一些子节点的度量值来确定父节点的度量值的部件,其中一个或多个父节点和一个或多个子节点之间的关系定义了层级。一种系统还包括用于针对多个实例来重复确定父节点的度量值的部件。
根据以下描述并根据权利要求,其他特征和优点将明显。
附图说明
图1是包括了剖析器引擎和数据质量引擎的系统的框图。
图2是示出了用于生成数据集的数据质量度量的处理的流程图。
图3示出了图形用户界面的示例。
图4是层级的示例。
图5是示出了用于生成表示了剖析信息的值的处理的流程图。
图6A是基于度量值对时间的图表。
图6B是基于总结报告的图表。
具体实施方式
参考图1,数据处理系统100包括剖析器引擎104,该剖析器引擎104用于处理来自对象数据储存库102的数据。对象数据储存库102中的数据对象例如可以包括与如记录格式所定义的记录的字段相关联的对象。通过用户界面106,用户110可以使得数据质量引擎108访问与对象数据储存库102内的对象相关联的所存储剖析信息(有时称作“字段剖析”)。数据质量引擎可以针对在对象数据储存库102中存储的对象生成与数据质量相关的信息(有时称作“度量值”或“数据质量度量”),并且可以通过用户界面106来向用户显示所生成的信息。
数据源112通常包括各种单独的数据源,所述数据源中的每一个可以具有唯一的存储格式和接口(例如,数据库表、电子数据表文件、纯文本文件、或主帧所使用的原生格式)。单独数据源可以处于该系统的本地(例如,被寄存(host)在同一计算机系统上),或者可以位于该系统的远程(例如,被寄存在经由局域或广域数据网络来访问的远程计算机上)。
对象数据储存库102包括与数据源112中的数据相关的信息。这种信息可以包括记录格式、以及用于确定这些记录中字段值的有效性的规范。可以按照各种方式来表示在数据源112内出现的各记录的不同字段之中的关系(例如,主键外键(primary-foreign key)关系)。例如,可以将在对象数据储存库102中的各数据对象之中存在的层级关系表示为层级。
对象数据储存库102可以用于存储关于要剖析的数据源112中的数据集的初始信息、以及关于这种数据集所获得的信息。通过剖析处理从这个数据集所导出的字段剖析也可以存储在对象数据储存库102中。
该系统100包括剖析器引擎104,该剖析器引擎104从对象数据储存库102中读取数据。当从数据源112中首次读取数据时,剖析器引擎104典型地以关于这个数据源中各记录的一些初始格式信息来开始。(要注意,在一些情形下,甚至可能不知道数据源的记录结构)。关于记录的初始信息可以包括表示了相异值(distinct value)的比特数(例如,16个比特(=2个字节))和值的顺序(所述值包括与记录字段相关联的值和与标签或定界符相关联的值)、以及由所述比特表示的值的类型(例如,字符串、有符号/无符号整数)。在存储于对象数据储存库102中的数据操纵语言(DML)文件中指定了关于数据源的记录的该信息。剖析器引擎104可以使用预定义的DML文件来自动地解析各种常见数据系统格式(例如,SQL表、XML文件、CSV文件)的数据、或者使用用于描述所定制数据系统格式的从对象数据储存库102中获得的DML文件。剖析器引擎104还可以生成用于用户所供应的SQL语句和XML图式的DML文件。
在剖析器引擎104初始读取该数据以前,该系统100可得到关于数据源记录的部分、可能不准确的初始信息。例如,与数据源相关联的COBOL字帖(copy book)可以作为所存储的数据而可得到,或者可以由用户110通过用户界面106而键入。通常,字段剖析是指通过对包含数据对象的数据集进行剖析而产生的关于这个数据对象的统计量的集合。字段剖析典型地包括关于其中计算剖析的日期的信息。
当剖析器引擎104从数据源中读取记录时,它对反映了该数据集内容的统计量和其他描述性信息进行计算。剖析器引擎104然后将这些统计量和描述性信息以“剖析”的形式而写入到对象数据储存库102中,该对象数据储存库102然后可以通过用户界面106或者访问对象数据储存库102的任何其他模块被检查。在一些情况下,该剖析中的统计量例如包括:每个字段中各值的直方图;最大、最小和平均值;以及最不常见值(least common value)和最常见值(most common value)的样本。
通过从数据源中进行读取而获得的统计量可以用于各种用途。这种用途可以包括发现不熟悉数据集的内容、构建与数据集相关联的元数据的集合、在购实或使用第三方数据之前检查所述数据、以及实现用于所收集数据的质量控制方案。
对象数据储存库102能够存储与每个所剖析的字段相关联的验证信息,例如作为用于对验证信息进行编码的验证规范。可替换地,验证信息可以存储在外部存储位置中并且由剖析器引擎104来检索。在对数据集进行剖析之前,验证信息可以针对每个字段来指定有效的数据类型。例如,如果字段是个人的“头衔”,则默认的有效值可以是作为“字符串”数据类型的任何值。用户也可以在对数据源进行剖析以前供应诸如“先生(Mr.)”、“夫人(Mrs.)”和“博士(Dr.)”之类的有效值,使得由剖析器引擎104所读取的任何其他值将被标识为无效的。从剖析运行中获得的信息也可以被用户用来针对具体字段来指定有效值。例如,用户可以在对数据集进行剖析之后发现值“女士(Ms.)”、和“Msr.”显现为常见值。用户可以将“女士”添加为有效值,并且作为数据清除选项来将值“Msr.”映射为值“Mrs.(夫人)”。因而,验证信息可以包括有效值和映射信息,以准许通过将无效值映射为有效值来清除所述无效值。当通过相继的剖析运行而发现了关于数据源的更多信息时,可以按照迭代的方式来着手进行数据源的剖析。
剖析器引擎104还可以生成可执行代码,以实现可以访问所剖析的数据系统的其他模块。这种代码的示例可以将值“Msr.”映射到“Mrs.(夫人)”作为到数据源的访问过程的一部分。
剖析器引擎104使用对象数据储存库102来组织并存储各种元数据和剖析偏好,并产生数据对象。对象数据储存库102可以存储一组剖析设置对象(其每一个用于与剖析工作相关的信息)、一组数据集对象(其每一个用于与数据集相关的信息)、以及一组DML文件(其每一个描述了具体的数据格式)。剖析设置对象包含用于由剖析器引擎104执行的剖析运行的偏好。用户110可以键入用于创建新剖析设置对象或者选择预存储的剖析设置对象的信息。
剖析设置对象包含对于数据集对象的参考。数据集设置对象包含数据集定位器,该数据集定位器使得剖析器引擎104能够定位要在一个或多个数据系统上剖析的数据,该一个或多个数据系统可在运行时环境内访问。数据集定位器典型地是路径/文件名、URL、表格名、SQL选择语句、或用于在多个位置上分布的数据集的路径/文件名和/或URL的列表。数据集对象可以可选地包含对于一个或多个DML文件的参考。
数据集对象包含对于字段对象集的参考。在要剖析的数据集的记录内,对于每个字段存在一个字段对象。一旦完成由剖析器引擎104执行的剖析运行,数据集剖析就与对应于被剖析了的数据集的数据集对象相关联。数据集剖析包含与该数据集相关的统计量(诸如,记录的总数和有效/无效记录的总数)、连同数据集被剖析的时间和数据、以及在剖析中使用的验证对象的版本。
字段对象可以可选地包含验证信息,剖析器引擎104可以将该验证信息用于确定对应字段的有效值,并且指定用于清除无效值(即,将无效值映射为有效值)的规则。字段对象还与剖析器引擎在完成剖析运行时存储的字段剖析相关联,该字段剖析包含与对应字段相关的统计量,诸如相异值、空值、和有效/无效值的数目。字段剖析还可以包括诸如最大、最小、最常见、和最不常见值之类的样本值。完整的“剖析”包括数据集剖析和用于所有被剖析字段的字段剖析。
可以将用于剖析器运行的其他用户偏好收集并存储在剖析设置对象或数据集对象中。例如,用户可以选择过滤器表达式,该过滤器表达式可以用于限制所剖析的字段或值的数目,其包括剖析所述值的随机样本(例如,1%)。
图2示出了过程200的示例的流程图,该过程200用于剖析数据集以为了各种目的中的任何目的来测试其质量,例如,所述各种目的包括在将数据集变形并加载到数据储存库中之前测试其质量。该过程200可以自动或手动地执行。用于测试数据集的质量的规则可以来自该数据集的先验知识,和/或可以来自对相似数据集(例如,来自与要测试的数据集相同源的数据集)执行的诸如过程200之类的剖析过程的结果。这些规则还可以由用户来定制(下面详细讨论)。该过程200可以由企业例如用于在导入或处理从企业伙伴发送的周期性(例如,每月的)数据反馈之前、对该数据进行剖析。因为这将使得该企业能够检测“不良”数据(例如,具有比阈值更高的无效值百分比的数据),所以它不会通过可以难以取消的动作而“污染”现有的数据储存库。
该过程200首先标识202要在一个或多个数据系统上测试的数据集,所述数据系统可以在运行时环境内进行访问。该过程200然后对该数据集(或该数据集的子集)运行204剖析,并且将字段剖析存储206在诸如对象数据储存库102(图1)之类的位置中。该过程基于该剖析的结果来执行208质量测试。例如,可以将在该数据集中特定常见值出现的百分比与在在先数据集中该常见值出现的百分比(基于在先剖析运行)进行比较,并且如果所述百分比彼此相差大于10%,则该质量测试失败。可以将该质量测试应用于已知为一贯出现(10%以内)的一系列数据集中的值。该过程200确定210该质量测试的结果,并且使用数据质量度量(也称为“数据质量测量”)来生成表示了所测试数据的质量的数据质量度量值。可以通过标识202另一数据集或在不同时间处标识202同一数据集来重复该过程。
在一些示例中,如下面更详细地描述的,可以根据层级来将该过程200应用于其度量值相关的数据对象。在确定数据对象(或数据对象组)的数据质量度量值时,该系统计算指示了数据质量的一些测量的单一值(例如,处于范围0-100中)。该数据质量度量的计算基于应用于该数据对象的字段剖析的函数。
图3示出了用于定义各个数据质量度量的图形用户界面300的示例。该图形用户界面300包括数据对象的名称304(称为“物理元素名称(PhysicalElement Name)”)、和所述数据对象是其一部分的数据集的名称302。下拉菜单306向用户给予使用简单、预先构造的测量(称为“数据质量测量”)的选项,以定义或部分地定义数据质量度量,该数据质量度量要用于生成数据质量度量值;例如在曾有效的字段剖析中找到的值的百分比。编辑按钮308允许用户经由表达式编辑器来定义惯例表达式,该表达式编辑器示出了包括在字段剖析内包含的所有数据字段的输入记录。这样,用户可以定制用于计算数据质量度量值的函数。
因为字段剖析可以包含有关两个数据对象之间的关系的信息,所以可能在这种跨字段信息方面定义数据质量度量。例如,可以在其与另一数据对象的百分比重叠方面定义数据对象的质量。同样,如果存在通过其来描述元素的有效性的多个准则,则可以在单一数据对象方面定义多个数据质量度量。
图4示出了度量值的安排。在该安排中,在层级400中组织所述度量值,该层级400包括父节点(例如,“顾客个人(Customer Personal)”节点402)和子节点(例如,“名字(First Name)”节点404)两者。父节点可以是父节点和子节点两者。例如,“顾客个人”节点402是关于“名字”节点404的父节点,但它又是“顾客信息”节点406的子节点。在该安排中,“名字”节点404也是“叶节点”,这是因为它不具有子节点。表示了度量值的所述节点之中的层级关系可以与可以存在于通过度量值来测量其质量的数据对象之中的任何层级关系无关。
对于该层级中的各个节点而言,用户110(图1)可以通过用户界面106(图1)来查看并安排数据质量度量。在诸如图4的示例之类的一些示例中,可以通过特别的界面来添加和删除数据元素,以及可以将该数据元素从该层级中的一个位置“拖拉”到另一位置。层级的安排可以对应于任何层级结构,诸如在组织内职责的层级。可以基于用于给定数据对象的所存储历史数据质量度量值(或者基于可以根据其计算数据质量度量值的所存储历史剖析信息)来计算数据质量历史,如下面更详细描述的,该数据质量历史用于随时间跟踪数据质量度量值。在给定节点的层级及其相关联的度量的情况下,数据质量历史的计算可以在请求查看和报告时、基于要求或所述两者的组合来执行。
在一些示例中,可以在数据质量度量的计算中使用层级。例如,为了计算父节点的数据质量度量值(或“度量值”),过程500确定502一个或多个子节点的度量值。该层级包含至少一个子节点和至少一个父节点。该处理500基于所述子节点中至少一些子节点的度量值来确定504父节点的度量值。父节点和子节点之间的关系定义了层级。该层级可以类似于图4的示例,并且可以由用户进行定制。在一些示例中,可以在计算任何数据质量度量之前确定该层级;即在一些实现中,步骤504可以在步骤502之前。该处理500针对多个实例来重复506确定父节点的度量值。
在给定各个数据质量度量和用于对应物理元素的字段剖析的集合(或计算数据质量度量值的一些其他方式)的情况下,可以产生度量值的时间序列。所得到的时间序列表示了所述度量值的历史,并且可以在所需要的基础上计算、或者被存储在对象数据储存库中以供稍后使用并与度量规范的表示相关联。在任一情况下,可以然后在数据剖析器用户界面中用图表来表示它。
在图6A中示出了用于绘制数据质量度量值对时间的图表的示例。图表600A示出了用于度量“顾客幸福感(Customer Happiness)”的所计算度量值的时间序列。如果用户将游标移动到图表600A中的点602A上,则对于所述点来显示日期和所计算的质量值。通过该图表上的暗点来标记其中验证规范从其先前值改变了的点,并且在所述点上移动游标将示出验证规范的改变。该图表上的点还可以示出以下实例,其中用于在该计算中使用的子节点的度量值已经改变;即当在该确定中使用不同子节点度量值时,该图表将标识其中改变出现的点。该图表还可以标识其中度量值计算的其他元素(诸如,用于计算所述值的度量的定义)已经改变的点。彩色圆点604A处于该图表的左上方,该彩色圆点604A用于将最新的数据质量总结为“良好”、“需要注意”、或“不好”(分别为绿色、黄色、或红色)。
可以将多个数据质量度量分组为“总结报告”,在图6B中可以看到该“总结报告”的示例。总结报告包括用于将多个数据质量度量值总结为单一值的规则,诸如与层级相关的上述方法。示例规则包括“最大值”、“最小值”和“平均值”。因此,总结报告还可以用于产生具有以下值的数据质量历史,所述值例如是用于在该报告内包含的所有数据质量度量的那些值的平均值。
除了各个数据质量度量之外,总结报告还可以包含其他总结报告,这导致了报告的层级,其中的每一个报告总结了它的元素。换言之,用于从属于第三父节点的两个父节点的度量值可以用于计算该第三父节点的度量值。
在给定用于总结报告的每个元素的度量值的时间序列的情况下,可以计算用于总结报告自身的度量值的时间序列。然后,可以用图表来表示该时间序列,并且将其与用于其组分的时间序列进行比较。在图6B中示出了总结报告“顾客信息(Customer Information)”。在该图表上方的表格中列出了在该总结报告内包含的度量。利用其最新的度量值、总结了如上所述的值的彩色原点、和与其历史对应的该图表的缩图来示出每一个度量。选择这些缩图图表之一将把所述图表的全尺寸版本叠加到用于“顾客信息”的图表之上。在该图示中,已经选择了“顾客互动(Customer Interactions)”,并且以蓝色来用图表表示它。
用户可由于多种原因(例如,可不关注所有所计算的字段剖析)而希望该时间序列可仅包括可计算度量值的子集。一些字段剖析可能已经基于部分数据被计算,同时一些字段剖析可能已经作为前往最终剖析结果的实验,且另一些字段剖析可能已经被错误地计算。因此,该时间序列的计算具有用于选定要包括哪些字段剖析的一些准则。一个示范准则在于总是针对每个历日(calendar day)来选定最新的可用字段剖析(例如,最近的字段剖析)。用户可以定义其中认为每个历日已经开始的日子中的时间,即,可以将历日的定义扩展为包括日子之间的任意时间边界。
字段剖析结果部分地取决于可以随时间改变的验证规范。因此,还利用应用于对应字段剖析的验证规范的版本来注释每个度量值。
各个度量值还取决于可以随时间改变的度量规范。因此,还利用在计算了该值时应用的度量的版本来注释每个度量值。
可以使用用于在计算机上执行的软件来实现上述方法。例如,该软件形成了用于在一个或多个已编程或可编程计算机系统(其可以具有诸如分布式、客户端/服务器、或网格之类的各种架构)上执行的一个或多个计算机程序中的过程,所述计算机系统中的每一个包括至少一个处理器、至少一个数据存储系统(例如,易失性和非易失性存储器和/或存储元件)、至少一个输入装置或端口、和至少一个输出装置或端口。该软件可以形成较大程序中的一个或多个模块,该较大程序例如是用于提供与图形的设计和配置相关的其他服务的程序。
可以在由通用或专用可编程计算机可读取的或在网络上传递(以传播信号编码)的介质或装置上向其中该软件执行的计算机提供该软件。可以在专用计算机上或者使用诸如协处理器之类的专用硬件来执行所有所述功能。可以以其中不同计算机执行由该软件指定的计算的不同部分的分布式方式来实现该软件。每个这种计算机程序优选地存储在可由通用或专用可编程计算机读取的存储介质或装置(例如,固态存储器或介质、或磁性或光学介质)上、或下载到所述存储介质或装置,以用于当由该计算机系统读取所述存储介质或装置以执行在这里描述的过程时,配置并操作该计算机。还可以认为本发明系统被实现为配置有计算机程序的计算机可读存储介质,其中如此配置的存储介质使得计算机系统在特定和预定义的方式中操作,以执行在这里描述的功能。
要理解,前述描述意欲进行说明、而不意欲限制本发明的范围,所述本发明的范围通过所附权利要求的范围来限定。其他实施例处于以下权利要求的范围内。
权利要求书(按照条约第19条的修改)
1.一种方法,包括:
确定一个或多个子节点的、与数据质量相关联的各度量值;
基于所述子节点中至少一些子节点的度量值来确定父节点的度量值,其中一个或多个父节点和一个或多个子节点之间的关系定义了层级;以及
针对确定的多个实例来重复确定父节点的度量值,其中,在所述多个实例中的至少两个实例中,在父节点与确定该父节点的度量值的步骤中使用的一个或多个子节点之间的关系在所述至少两个实例中相同。
2.根据权利要求1的方法,其中在确定父节点的度量值的步骤中使用的所述一个或多个子节点不具有子节点。
3.根据权利要求1的方法,还包括:生成表示由所述子节点和父节点表示的数据的特性的剖析信息。
4.根据权利要求3的方法,其中所述子节点的各度量值基于该剖析信息。
5.根据权利要求1的方法,其中所述层级的安排由用户来指定。
6.根据权利要求3的方法,其中用户指定所述剖析信息内的哪些数据字段将影响度量值的确定。
7.根据权利要求1的方法,其中用户选择一个或多个预先构造的因素,以影响度量值的确定。
8.根据权利要求1的方法,其中将所述各度量值和所述度量值表示为从0到100的数字。
9.根据权利要求1的方法,其中在连续线形图表上,作为时间的函数、针对所述多个实例中的每一个来显示所述一个或多个子节点的各度量值或所述父节点的度量值之一或两者。
10.根据权利要求9的方法,其中基于该剖析信息而自动地生成所述连续线形图表。
11.根据权利要求9的方法,其中该连续线形图表指示了用于管控度量值的确定的规则的改变。
12.根据权利要求9的方法,其中该连续线形图表指示了在确定父节点的度量值的步骤中使用的度量值的改变。
13.一种计算机可读介质,该计算机可读介质存储了用于在根据装置信号获得值中使用的可执行指令,所述指令使得计算机:
确定一个或多个子节点的各度量值;
基于所述子节点中至少一些子节点的度量值来确定父节点的度量值,其中一个或多个父节点和一个或多个子节点之间的关系定义了层级;以及
针对确定的多个实例来重复确定父节点的度量值,其中,在所述多个实例中的至少两个实例中,在父节点与确定该父节点的度量值的步骤中使用的一个或多个子节点之间的关系在所述至少两个实例中相同。
14.根据权利要求13的计算机可读介质,其中在确定父节点的度量值的步骤中使用的一个或多个子节点不具有子节点。
15.根据权利要求13的计算机可读介质,还包括:生成表示由所述子节点和父节点表示的数据的特性的剖析信息。
16.根据权利要求15的计算机可读介质,其中所述子节点的度量值基于所述剖析信息。
17.根据权利要求13的计算机可读介质,其中所述层级的安排由用户来指定。
18.根据权利要求15的计算机可读介质,其中用户指定所述剖析信息内的哪些数据字段将影响度量值的确定。
19.根据权利要求13的计算机可读介质,其中用户选择一个或多个预先构造的因素,以影响度量值的确定。
20.根据权利要求13的计算机可读介质,其中将所述各度量值和所述度量值表示为从0到100的数字。
21.根据权利要求13的计算机可读介质,其中在连续线形图表上,作为时间的函数、针对所述多个实例中的每一个来显示所述一个或多个子节点的各度量值或所述父节点的度量值之一或两者。
22.根据权利要求21的计算机可读介质,其中基于该剖析信息而自动地生成所述连续线形图表。
23.根据权利要求21的计算机可读介质,其中该连续线形图表指示了用于管控度量值的确定的规则的改变。
24.根据权利要求21的计算机可读介质,其中该连续线形图表指示了在确定父节点的度量值的步骤中使用的度量值的改变。
25.一种系统,包括:
用于确定一个或多个子节点的各度量值的部件;
用于基于所述子节点中至少一些子节点的度量值来确定父节点的度量值的部件,其中一个或多个父节点和一个或多个子节点之间的关系定义了层级;以及
用于针对确定的多个实例来重复确定父节点的度量值的部件,其中,在所述多个实例中的至少两个实例中,在父节点与确定该父节点的度量值的步骤中使用的一个或多个子节点之间的关系在所述至少两个实例中相同。
26.根据权利要求1的方法,其中针对所述多个实例中的每一个来确定一个或多个子节点的度量值或父节点的度量值之一或两者,并将其存储为表示了所述度量值的历史的时间序列。
Claims (25)
1.一种方法,包括:
确定一个或多个子节点的、与数据质量相关联的各度量值;
基于所述子节点中至少一些子节点的度量值来确定父节点的度量值,其中一个或多个父节点和一个或多个子节点之间的关系定义了层级;以及
针对多个实例来重复确定父节点的度量值。
2.根据权利要求1的方法,其中在确定父节点的度量值的步骤中使用的所述一个或多个子节点不具有子节点。
3.根据权利要求1的方法,还包括:生成表示由所述子节点和父节点表示的数据的特性的剖析信息。
4.根据权利要求3的方法,其中所述子节点的各度量值基于该剖析信息。
5.根据权利要求1的方法,其中所述层级的安排由用户来指定。
6.根据权利要求3的方法,其中用户指定所述剖析信息内的哪些数据字段将影响度量值的确定。
7.根据权利要求1的方法,其中用户选择一个或多个预先构造的因素,以影响度量值的确定。
8.根据权利要求1的方法,其中将所述各度量值和所述度量值表示为从0到100的数字。
9.根据权利要求1的方法,其中在连续线形图表上,作为时间的函数、针对所述多个实例中的每一个来显示所述一个或多个子节点的各度量值或所述父节点的度量值之一或两者。
10.根据权利要求9的方法,其中基于该剖析信息而自动地生成所述连续线形图表。
11.根据权利要求9的方法,其中该图表指示了用于管控度量值的确定的规则的改变。
12.根据权利要求9的方法,其中该图表指示了在确定父节点的度量值的步骤中使用的度量值的改变。
13.一种计算机可读介质,该计算机可读介质存储了用于在根据装置信号获得值中使用的可执行指令,所述指令使得计算机:
确定一个或多个子节点的各度量值;
基于所述子节点中至少一些子节点的度量值来确定父节点的度量值,其中一个或多个父节点和一个或多个子节点之间的关系定义了层级;以及
针对多个实例来重复确定父节点的度量值。
14.根据权利要求13的计算机可读介质,其中在确定父节点的度量值的步骤中使用的一个或多个子节点不具有子节点。
15.根据权利要求13的计算机可读介质,还包括:生成表示由所述子节点和父节点表示的数据的特性的剖析信息。
16.根据权利要求15的计算机可读介质,其中所述子节点的度量值基于所述剖析信息。
17.根据权利要求13的计算机可读介质,其中所述层级的安排由用户来指定。
18.根据权利要求15的计算机可读介质,其中用户指定所述剖析信息内的哪些数据字段将影响度量值的确定。
19.根据权利要求13的计算机可读介质,其中用户选择一个或多个预先构造的因素,以影响度量值的确定。
20.根据权利要求13的计算机可读介质,其中将所述各度量值和所述度量值表示为从0到100的数字。
21.根据权利要求13的计算机可读介质,其中在连续线形图表上,作为时间的函数、针对所述多个实例中的每一个来显示所述一个或多个子节点的各度量值或所述父节点的度量值之一或两者。
22.根据权利要求21的计算机可读介质,其中基于该剖析信息而自动地生成所述连续线形图表。
23.根据权利要求21的计算机可读介质,其中该图表指示了用于管控度量值的确定的规则的改变。
24.根据权利要求21的计算机可读介质,其中该图表指示了在确定父节点的度量值的步骤中使用的度量值的改变。
25.一种系统,包括:
用于确定一个或多个子节点的各度量值的部件;
用于基于所述子节点中至少一些子节点的度量值来确定父节点的度量值的部件,其中一个或多个父节点和一个或多个子节点之间的关系定义了层级;以及
用于针对多个实例来重复确定父节点的度量值的部件。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/143,362 US8046385B2 (en) | 2008-06-20 | 2008-06-20 | Data quality tracking |
US12/143,362 | 2008-06-20 | ||
PCT/US2009/047735 WO2009155392A1 (en) | 2008-06-20 | 2009-06-18 | Data quality tracking by determining metric values for child nodes and a parent node |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102067106A true CN102067106A (zh) | 2011-05-18 |
CN102067106B CN102067106B (zh) | 2015-03-04 |
Family
ID=41432336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980123317.1A Active CN102067106B (zh) | 2008-06-20 | 2009-06-18 | 通过确定子节点和父节点的度量值进行的数据质量跟踪 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8046385B2 (zh) |
EP (1) | EP2291764A4 (zh) |
JP (1) | JP5535203B2 (zh) |
KR (1) | KR101513110B1 (zh) |
CN (1) | CN102067106B (zh) |
AU (1) | AU2009260050C1 (zh) |
CA (1) | CA2728132C (zh) |
WO (1) | WO2009155392A1 (zh) |
Families Citing this family (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11881814B2 (en) | 2005-12-05 | 2024-01-23 | Solaredge Technologies Ltd. | Testing of a photovoltaic panel |
US10693415B2 (en) | 2007-12-05 | 2020-06-23 | Solaredge Technologies Ltd. | Testing of a photovoltaic panel |
US8963369B2 (en) | 2007-12-04 | 2015-02-24 | Solaredge Technologies Ltd. | Distributed power harvesting systems using DC power sources |
US11855231B2 (en) | 2006-12-06 | 2023-12-26 | Solaredge Technologies Ltd. | Distributed power harvesting systems using DC power sources |
US11309832B2 (en) | 2006-12-06 | 2022-04-19 | Solaredge Technologies Ltd. | Distributed power harvesting systems using DC power sources |
US11728768B2 (en) | 2006-12-06 | 2023-08-15 | Solaredge Technologies Ltd. | Pairing of components in a direct current distributed power generation system |
US11735910B2 (en) | 2006-12-06 | 2023-08-22 | Solaredge Technologies Ltd. | Distributed power system using direct current power sources |
US8013472B2 (en) | 2006-12-06 | 2011-09-06 | Solaredge, Ltd. | Method for distributed power harvesting using DC power sources |
US11569659B2 (en) | 2006-12-06 | 2023-01-31 | Solaredge Technologies Ltd. | Distributed power harvesting systems using DC power sources |
US11687112B2 (en) | 2006-12-06 | 2023-06-27 | Solaredge Technologies Ltd. | Distributed power harvesting systems using DC power sources |
US11296650B2 (en) | 2006-12-06 | 2022-04-05 | Solaredge Technologies Ltd. | System and method for protection during inverter shutdown in distributed power installations |
US8384243B2 (en) | 2007-12-04 | 2013-02-26 | Solaredge Technologies Ltd. | Distributed power harvesting systems using DC power sources |
US8319471B2 (en) | 2006-12-06 | 2012-11-27 | Solaredge, Ltd. | Battery power delivery module |
US11888387B2 (en) | 2006-12-06 | 2024-01-30 | Solaredge Technologies Ltd. | Safety mechanisms, wake up and shutdown methods in distributed power installations |
US8531055B2 (en) | 2006-12-06 | 2013-09-10 | Solaredge Ltd. | Safety mechanisms, wake up and shutdown methods in distributed power installations |
US8816535B2 (en) | 2007-10-10 | 2014-08-26 | Solaredge Technologies, Ltd. | System and method for protection during inverter shutdown in distributed power installations |
US8947194B2 (en) | 2009-05-26 | 2015-02-03 | Solaredge Technologies Ltd. | Theft detection and prevention in a power generation system |
US8473250B2 (en) | 2006-12-06 | 2013-06-25 | Solaredge, Ltd. | Monitoring of distributed power harvesting systems using DC power sources |
US8618692B2 (en) | 2007-12-04 | 2013-12-31 | Solaredge Technologies Ltd. | Distributed power system using direct current power sources |
US9112379B2 (en) | 2006-12-06 | 2015-08-18 | Solaredge Technologies Ltd. | Pairing of components in a direct current distributed power generation system |
US9088178B2 (en) | 2006-12-06 | 2015-07-21 | Solaredge Technologies Ltd | Distributed power harvesting systems using DC power sources |
US9130401B2 (en) | 2006-12-06 | 2015-09-08 | Solaredge Technologies Ltd. | Distributed power harvesting systems using DC power sources |
US8319483B2 (en) | 2007-08-06 | 2012-11-27 | Solaredge Technologies Ltd. | Digital average input current control in power converter |
WO2009072076A2 (en) | 2007-12-05 | 2009-06-11 | Solaredge Technologies Ltd. | Current sensing on a mosfet |
US11264947B2 (en) | 2007-12-05 | 2022-03-01 | Solaredge Technologies Ltd. | Testing of a photovoltaic panel |
US9291696B2 (en) | 2007-12-05 | 2016-03-22 | Solaredge Technologies Ltd. | Photovoltaic system power tracking method |
EP2232690B1 (en) | 2007-12-05 | 2016-08-31 | Solaredge Technologies Ltd. | Parallel connected inverters |
US8111052B2 (en) | 2008-03-24 | 2012-02-07 | Solaredge Technologies Ltd. | Zero voltage switching |
EP2294669B8 (en) | 2008-05-05 | 2016-12-07 | Solaredge Technologies Ltd. | Direct current power combiner |
WO2010065627A1 (en) | 2008-12-02 | 2010-06-10 | Ab Initio Software Llc | Visualizing relationships between data elements |
US10673222B2 (en) | 2010-11-09 | 2020-06-02 | Solaredge Technologies Ltd. | Arc detection and prevention in a power generation system |
GB2485527B (en) | 2010-11-09 | 2012-12-19 | Solaredge Technologies Ltd | Arc detection and prevention in a power generation system |
US10673229B2 (en) | 2010-11-09 | 2020-06-02 | Solaredge Technologies Ltd. | Arc detection and prevention in a power generation system |
US10230310B2 (en) | 2016-04-05 | 2019-03-12 | Solaredge Technologies Ltd | Safety switch for photovoltaic systems |
GB2486408A (en) | 2010-12-09 | 2012-06-20 | Solaredge Technologies Ltd | Disconnection of a string carrying direct current |
GB2483317B (en) | 2011-01-12 | 2012-08-22 | Solaredge Technologies Ltd | Serially connected inverters |
US8570005B2 (en) | 2011-09-12 | 2013-10-29 | Solaredge Technologies Ltd. | Direct current link circuit |
GB2498365A (en) | 2012-01-11 | 2013-07-17 | Solaredge Technologies Ltd | Photovoltaic module |
GB2498791A (en) | 2012-01-30 | 2013-07-31 | Solaredge Technologies Ltd | Photovoltaic panel circuitry |
US9853565B2 (en) | 2012-01-30 | 2017-12-26 | Solaredge Technologies Ltd. | Maximized power in a photovoltaic distributed power system |
GB2498790A (en) | 2012-01-30 | 2013-07-31 | Solaredge Technologies Ltd | Maximising power in a photovoltaic distributed power system |
GB2499991A (en) | 2012-03-05 | 2013-09-11 | Solaredge Technologies Ltd | DC link circuit for photovoltaic array |
US10115841B2 (en) | 2012-06-04 | 2018-10-30 | Solaredge Technologies Ltd. | Integrated photovoltaic panel circuitry |
US9542462B1 (en) | 2012-06-14 | 2017-01-10 | Google Inc. | Scaling high-level statistical languages to large, distributed datasets |
US9558230B2 (en) | 2013-02-12 | 2017-01-31 | International Business Machines Corporation | Data quality assessment |
US9548619B2 (en) | 2013-03-14 | 2017-01-17 | Solaredge Technologies Ltd. | Method and apparatus for storing and depleting energy |
US9941813B2 (en) | 2013-03-14 | 2018-04-10 | Solaredge Technologies Ltd. | High frequency multi-level inverter |
EP2779251B1 (en) | 2013-03-15 | 2019-02-27 | Solaredge Technologies Ltd. | Bypass mechanism |
US9576036B2 (en) * | 2013-03-15 | 2017-02-21 | International Business Machines Corporation | Self-analyzing data processing job to determine data quality issues |
CA2907874A1 (en) * | 2013-03-26 | 2014-10-02 | Staples, Inc. | On-site and in-store content personalization and optimization |
US9613322B2 (en) | 2013-04-02 | 2017-04-04 | Orbis Technologies, Inc. | Data center analytics and dashboard |
US9318974B2 (en) | 2014-03-26 | 2016-04-19 | Solaredge Technologies Ltd. | Multi-level inverter with flying capacitor topology |
US10459892B2 (en) | 2014-04-23 | 2019-10-29 | Qumulo, Inc. | Filesystem hierarchical aggregate metrics |
US9600504B2 (en) | 2014-09-08 | 2017-03-21 | International Business Machines Corporation | Data quality analysis and cleansing of source data with respect to a target system |
US11132336B2 (en) * | 2015-01-12 | 2021-09-28 | Qumulo, Inc. | Filesystem hierarchical capacity quantity and aggregate metrics |
US9836480B2 (en) | 2015-01-12 | 2017-12-05 | Qumulo, Inc. | Filesystem capacity and performance metrics and visualizations |
US11177663B2 (en) | 2016-04-05 | 2021-11-16 | Solaredge Technologies Ltd. | Chain of power devices |
US11018623B2 (en) | 2016-04-05 | 2021-05-25 | Solaredge Technologies Ltd. | Safety switch for photovoltaic systems |
US10095729B2 (en) | 2016-12-09 | 2018-10-09 | Qumulo, Inc. | Managing storage quotas in a shared storage system |
US10147040B2 (en) | 2017-01-20 | 2018-12-04 | Alchemy IoT | Device data quality evaluator |
US10318401B2 (en) | 2017-04-20 | 2019-06-11 | Qumulo, Inc. | Triggering the increased collection and distribution of monitoring information in a distributed processing system |
US11360936B2 (en) | 2018-06-08 | 2022-06-14 | Qumulo, Inc. | Managing per object snapshot coverage in filesystems |
US10534758B1 (en) | 2018-12-20 | 2020-01-14 | Qumulo, Inc. | File system cache tiers |
US11151092B2 (en) | 2019-01-30 | 2021-10-19 | Qumulo, Inc. | Data replication in distributed file systems |
US11461671B2 (en) | 2019-06-03 | 2022-10-04 | Bank Of America Corporation | Data quality tool |
US10860372B1 (en) | 2020-01-24 | 2020-12-08 | Qumulo, Inc. | Managing throughput fairness and quality of service in file systems |
US10795796B1 (en) | 2020-01-24 | 2020-10-06 | Qumulo, Inc. | Predictive performance analysis for file systems |
US11151001B2 (en) | 2020-01-28 | 2021-10-19 | Qumulo, Inc. | Recovery checkpoints for distributed file systems |
US10936551B1 (en) | 2020-03-30 | 2021-03-02 | Qumulo, Inc. | Aggregating alternate data stream metrics for file systems |
US10936538B1 (en) | 2020-03-30 | 2021-03-02 | Qumulo, Inc. | Fair sampling of alternate data stream metrics for file systems |
US11775481B2 (en) | 2020-09-30 | 2023-10-03 | Qumulo, Inc. | User interfaces for managing distributed file systems |
US11157458B1 (en) | 2021-01-28 | 2021-10-26 | Qumulo, Inc. | Replicating files in distributed file systems using object-based data storage |
US11461241B2 (en) | 2021-03-03 | 2022-10-04 | Qumulo, Inc. | Storage tier management for file systems |
US11567660B2 (en) | 2021-03-16 | 2023-01-31 | Qumulo, Inc. | Managing cloud storage for distributed file systems |
US11132126B1 (en) | 2021-03-16 | 2021-09-28 | Qumulo, Inc. | Backup services for distributed file systems in cloud computing environments |
US11669255B2 (en) | 2021-06-30 | 2023-06-06 | Qumulo, Inc. | Distributed resource caching by reallocation of storage caching using tokens and agents with non-depleted cache allocations |
US11294604B1 (en) | 2021-10-22 | 2022-04-05 | Qumulo, Inc. | Serverless disk drives based on cloud storage |
US11354273B1 (en) | 2021-11-18 | 2022-06-07 | Qumulo, Inc. | Managing usable storage space in distributed file systems |
US11599508B1 (en) | 2022-01-31 | 2023-03-07 | Qumulo, Inc. | Integrating distributed file systems with object stores |
US11722150B1 (en) | 2022-09-28 | 2023-08-08 | Qumulo, Inc. | Error resistant write-ahead log |
US11729269B1 (en) | 2022-10-26 | 2023-08-15 | Qumulo, Inc. | Bandwidth management in distributed file systems |
US11966592B1 (en) | 2022-11-29 | 2024-04-23 | Qumulo, Inc. | In-place erasure code transcoding for distributed file systems |
US11921677B1 (en) | 2023-11-07 | 2024-03-05 | Qumulo, Inc. | Sharing namespaces across file system clusters |
US11934660B1 (en) | 2023-11-07 | 2024-03-19 | Qumulo, Inc. | Tiered data storage with ephemeral and persistent tiers |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1258814A1 (en) * | 2001-05-17 | 2002-11-20 | Requisite Technology Inc. | Method and apparatus for analyzing the quality of the content of a database |
US20040181554A1 (en) * | 1998-06-25 | 2004-09-16 | Heckerman David E. | Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications |
US20070112875A1 (en) * | 2004-07-15 | 2007-05-17 | Hitachi, Ltd. | Method and apparatus for hierarchical storage management based on data value and user interest |
US20070255741A1 (en) * | 2006-04-28 | 2007-11-01 | Business Objects, S.A. | Apparatus and method for merging metadata within a repository |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11307412A (ja) * | 1998-04-20 | 1999-11-05 | Matsushita Electron Corp | 半導体製造データ処理方法 |
US6725227B1 (en) * | 1998-10-02 | 2004-04-20 | Nec Corporation | Advanced web bookmark database system |
JP2002288403A (ja) * | 2001-03-27 | 2002-10-04 | Ntt Comware Corp | プロジェクト管理システム、プロジェクト管理方法、及びプロジェクト管理プログラム |
US7120619B2 (en) * | 2003-04-22 | 2006-10-10 | Microsoft Corporation | Relationship view |
CN102982065B (zh) * | 2003-09-15 | 2016-09-21 | 起元科技有限公司 | 数据处理方法、数据处理装置及计算机可读存储介质 |
US7197502B2 (en) * | 2004-02-18 | 2007-03-27 | Friendly Polynomials, Inc. | Machine-implemented activity management system using asynchronously shared activity data objects and journal data items |
US7496583B2 (en) * | 2004-04-30 | 2009-02-24 | Microsoft Corporation | Property tree for metadata navigation and assignment |
EP2487599A1 (en) * | 2004-05-04 | 2012-08-15 | Boston Consulting Group, Inc. | Method and apparatus for selecting, analyzing and visualizing related database records as a network |
US7456840B2 (en) * | 2004-08-31 | 2008-11-25 | Oracle International Corporation | Displaying information using nodes in a graph |
US8176002B2 (en) * | 2005-03-24 | 2012-05-08 | Microsoft Corporation | Method and system for user alteration of the configuration of a data warehouse |
US8640086B2 (en) * | 2006-12-29 | 2014-01-28 | Sap Ag | Graphical user interface system and method for presenting objects |
US20080172629A1 (en) * | 2007-01-17 | 2008-07-17 | Microsoft Corporation | Geometric Performance Metric Data Rendering |
-
2008
- 2008-06-20 US US12/143,362 patent/US8046385B2/en active Active
-
2009
- 2009-06-18 WO PCT/US2009/047735 patent/WO2009155392A1/en active Application Filing
- 2009-06-18 JP JP2011514796A patent/JP5535203B2/ja active Active
- 2009-06-18 KR KR1020107028563A patent/KR101513110B1/ko active IP Right Grant
- 2009-06-18 CN CN200980123317.1A patent/CN102067106B/zh active Active
- 2009-06-18 CA CA2728132A patent/CA2728132C/en active Active
- 2009-06-18 EP EP09767701A patent/EP2291764A4/en not_active Ceased
- 2009-06-18 AU AU2009260050A patent/AU2009260050C1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040181554A1 (en) * | 1998-06-25 | 2004-09-16 | Heckerman David E. | Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications |
EP1258814A1 (en) * | 2001-05-17 | 2002-11-20 | Requisite Technology Inc. | Method and apparatus for analyzing the quality of the content of a database |
US20070112875A1 (en) * | 2004-07-15 | 2007-05-17 | Hitachi, Ltd. | Method and apparatus for hierarchical storage management based on data value and user interest |
US20070255741A1 (en) * | 2006-04-28 | 2007-11-01 | Business Objects, S.A. | Apparatus and method for merging metadata within a repository |
Also Published As
Publication number | Publication date |
---|---|
JP2011525282A (ja) | 2011-09-15 |
WO2009155392A1 (en) | 2009-12-23 |
AU2009260050C1 (en) | 2014-03-06 |
KR101513110B1 (ko) | 2015-04-17 |
CA2728132A1 (en) | 2009-12-23 |
AU2009260050A1 (en) | 2009-12-23 |
JP5535203B2 (ja) | 2014-07-02 |
US8046385B2 (en) | 2011-10-25 |
US20090319566A1 (en) | 2009-12-24 |
CN102067106B (zh) | 2015-03-04 |
CA2728132C (en) | 2017-02-21 |
EP2291764A1 (en) | 2011-03-09 |
EP2291764A4 (en) | 2012-10-31 |
KR20110031921A (ko) | 2011-03-29 |
AU2009260050B2 (en) | 2013-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102067106A (zh) | 通过确定子节点和父节点的度量值进行的数据质量跟踪 | |
Van Der Aalst | Process discovery from event data: Relating models and logs through abstractions | |
Măruşter et al. | Redesigning business processes: a methodology based on simulation and process mining techniques | |
JP2011503681A (ja) | データ記録を一致させるシステムの分析のための方法およびシステム | |
US11947567B2 (en) | System and method for computing and managing datasets using hierarchical analytics | |
US7941706B2 (en) | Autonomic resolution of system configuration | |
CN103646049A (zh) | 自动生成数据报表的方法及系统 | |
Theodorou et al. | Quality measures for ETL processes: from goals to implementation | |
US20160162539A1 (en) | Computer executable method of generating analysis data and apparatus performing the same and storage medium for the same | |
CN116541372A (zh) | 一种数据资产治理方法及系统 | |
US20220245125A1 (en) | Dataset multiplexer for data processing system | |
CN115292473A (zh) | 低代码方案中的扩展的选择性推荐和部署 | |
CN116561134A (zh) | 业务规则处理方法、装置、设备及存储介质 | |
CN113342786A (zh) | 一种基于模型管控的在线数据治理管理方法和系统 | |
Embury et al. | Incorporating domain-specific information quality constraints into database queries | |
Yaman et al. | Standards conformance metrics for geospatial linked data | |
US8005867B2 (en) | System and method for measuring the value of elements in an information repository | |
Burkert et al. | Compiling Personal Data and Subject Categories from App Data Models | |
Nikoo et al. | Clone detection for business process models | |
JP2023060106A (ja) | 機械学習モデル運用管理システム、運用管理方法及びコンピュータプログラム | |
Woodsford | Spatial Database Update and Validation—Current Advances in Theory and Technology | |
CN115934864A (zh) | 数据资产管理方法及相关装置 | |
CN117012327A (zh) | 用于报告交付数据的方法和装置 | |
CN117370160A (zh) | 代码审核方法、装置、计算机设备、存储介质和程序产品 | |
Liu et al. | A way to improve personalized recommendation system efficiency |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |