CN107633099B - 数据库一致性错误的重要度判定方法 - Google Patents

数据库一致性错误的重要度判定方法 Download PDF

Info

Publication number
CN107633099B
CN107633099B CN201710981214.5A CN201710981214A CN107633099B CN 107633099 B CN107633099 B CN 107633099B CN 201710981214 A CN201710981214 A CN 201710981214A CN 107633099 B CN107633099 B CN 107633099B
Authority
CN
China
Prior art keywords
function
edge
violation
dependent
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710981214.5A
Other languages
English (en)
Other versions
CN107633099A (zh
Inventor
刘海龙
成阿茹
李战怀
张国荣
张陶然
刘文洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201710981214.5A priority Critical patent/CN107633099B/zh
Publication of CN107633099A publication Critical patent/CN107633099A/zh
Application granted granted Critical
Publication of CN107633099B publication Critical patent/CN107633099B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据库一致性错误的重要度判定方法,用于解决现有方法实用性差的技术问题。技术方案是首先根据C‑Graph和D‑Graph的定义构建关系表的C‑Graph和D‑Graph超图,利用这两种超图描述数据库中关系表的属性之间的依赖关系以及属性值之间的依赖关系;再根据给出的函数依赖约束间关系的分类对表中的函数依赖约束关系进行归类;找出函数依赖违规并根据给出的函数依赖违规间关系的分类对函数依赖违规间的关系进行归类;利用公式计算函数依赖违规的效益值;根据计算得到的函数依赖违规效益值对函数依赖违规重要度进行排序。本发明降低了因修复一个函数依赖违规而引起另一些函数依赖违规带来的代价,实用性好。

Description

数据库一致性错误的重要度判定方法
技术领域
本发明属于计算机应用技术领域,具体涉及一种数据库一致性错误的重要度判定方法。
背景技术
文献"On approximating optimum repairs for functional dependencyviolations,DBLP,2009年53-62页"公开了一种通过最小化距离度量修复数据库中违反函数依赖的一致性错误的方法。该距离度量取决于数据库中修改元组的数量以及修改元组的权重,通过尽可能小的距离度量对数据库中的函数依赖进行值修复。该方法中对数据库的函数依赖修复主要考虑修改元组的数量以及修改元组的权重,并未考虑函数依赖之间的关系。函数依赖违规即违反函数依赖的情况,在实际中函数依赖违规之间不是相互独立的,其重要性也是不尽相同的。在数据库中,其中一些函数依赖违规比另一些更重要,一些函数依赖违规会引起另一些函数依赖违规。在修复数据库中函数依赖时,找出函数依赖违规之间的关系并且根据函数依赖违规的重要度对函数依赖进行修复,帮助用户找出函数依赖违规根本的原因,以更低的代价修复数据库中的函数依赖违规。
发明内容
为了克服现有方法实用性差的不足,本发明提供一种数据库一致性错误的重要度判定方法。该方法首先根据C-Graph和D-Graph的定义构建关系表的C-Graph和D-Graph超图,利用这两种超图描述数据库中关系表的属性之间的依赖关系以及属性值之间的依赖关系;再根据给出的函数依赖约束间关系的分类对表中的函数依赖约束关系进行归类;找出函数依赖违规并根据给出的函数依赖违规间关系的分类对函数依赖违规间的关系进行归类;利用公式计算函数依赖违规的效益值;根据计算得到的函数依赖违规效益值对函数依赖违规重要度进行排序。在修复数据库中的函数依赖违规时,找出函数依赖违规中根本的原因,以降低因修复一个函数依赖违规而引起另一些函数依赖违规带来的代价,实用性好。
本发明解决其技术问题所采用的技术方案:一种数据库一致性错误的重要度判定方法,其特点是包括以下步骤:
步骤一、对数据库中的关系表构建C-Graph和D-Graph超图。C-Graph给出数据库D上的函数依赖集合Σ,C-Graph GΣ=(V,E):Σi:Xi→Yi
Figure BDA0001439489770000021
Figure BDA0001439489770000022
U=X∪Y。对于Σ中的每一个Σi:Xi→Yi,有一个超边ei∈E,T(ei)=Xi且H(ei)=Yi。D-Graph:根据C-GraphGΣ和关系表R,GR=(V,E):t∈R,每一个节点Vi∈V被定义为Vi=(Ai,Fi),
Figure BDA0001439489770000023
对于每一个属性Ai∈U的不同的值,都有一个在V中标为(Ai,Fi)的节点。给出C-Graph边EΣ={TΣ(E),HΣ(E)},会产生许多条D-Graph边,每一个D-Graph边Ei∈E被定义为Ei={T(Ei),H(Ei),Ω(Ei)},其中
Figure BDA00014394897700000213
T(Ei).Ai=TΣ(E);
Figure BDA00014394897700000214
H(Ei).Ai=HΣ(E),
Figure BDA0001439489770000024
每一个
Figure BDA0001439489770000025
包含所有和
Figure BDA0001439489770000026
相关的元组的IDs,被定义为
Figure BDA0001439489770000027
函数依赖X→Y意味着X的值相同则Y值也必须相同,根据X的值将关系表中的数据分为不同的等价类,每一个等价类中,所有成员有相同的X值,其Y值相同或者不同。在D-Graph中有两种超边,一种是只有一个头结点及|H(E)|=1,另一种则是有多个头结点及|H(E)|>1,分别为B-arc边和
Figure BDA0001439489770000028
边。在D-Graph中,如果包含一个或者多个
Figure BDA0001439489770000029
边,意味着至少一个函数依赖等价类的左属性映射到多个等价类的右属性。若图中只包含B-arc边,意味着每一个等价类的左属性仅映射一个等价类的右属性,因此没有函数依赖违规。所以函数依赖违规检查转变为在D-Graph中查找
Figure BDA00014394897700000210
函数依赖违规修复问题转化为转换所有的
Figure BDA00014394897700000211
边为B-arc边,其目标是对所有违反函数依赖的元组集合排序即对函数依赖违规进行排序,因此问题转换为对D-Graph中所有
Figure BDA00014394897700000212
边进行排序。
X、Y:为关系表中的属性,U=X∪Y;
Σ:函数依赖集合;
V:为超图中节点的集合;
E:为超图中超边的集合;
H(e):表示超边的头结点;
T(e):表示超边的尾节点;
t:为表R中的元组;
Ai:是属性名且Ai∈U;
Fi:是t[Ai]的一个值;
步骤二、对不同函数依赖之间的关系进行分类。假设Σ集合为最小覆盖,Σi:X→Y和Σj:X'→Y',根据函数依赖最小覆盖的定义:
Figure BDA0001439489770000031
Figure BDA0001439489770000032
或者
Figure BDA0001439489770000033
Σi和Σj之间关系分为四类:
Figure BDA0001439489770000034
Σi和Σj中的属性表示如下:
Figure BDA0001439489770000035
Figure BDA0001439489770000036
如果Σi和Σj共享约束左边的一些属性,表示如下:
Figure BDA0001439489770000037
如果约束的右边属性值相同,表示如下:
Figure BDA0001439489770000038
Figure BDA0001439489770000039
如果约束左边和右边都有共享属性,表示如下:
Figure BDA00014394897700000310
Figure BDA00014394897700000311
Figure BDA00014394897700000312
如果Σi和Σj中的属性满足以下:
Figure BDA00014394897700000313
Figure BDA00014394897700000314
Figure BDA00014394897700000315
Figure BDA00014394897700000316
Figure BDA00014394897700000317
Figure BDA00014394897700000318
Figure BDA00014394897700000327
如果Σi和Σj中的属性满足以下:
Figure BDA00014394897700000319
Figure BDA00014394897700000320
Figure BDA00014394897700000321
Figure BDA00014394897700000322
Figure BDA00014394897700000323
Figure BDA00014394897700000324
Σ:函数依赖集合名称;
步骤三、找出关系表中的函数依赖违规并对不同函数依赖违规间的关系进行分类。假设当解决函数依赖违规问题时,仅修正函数依赖约束的右边属性的值。Σi和Σj之间的违规模式分为以下四类:
Figure BDA00014394897700000325
Figure BDA00014394897700000326
中解决其中一个约束的违规将不会影响另一个约束的违规,定义为
Figure BDA0001439489770000041
模式。
Figure BDA0001439489770000042
Figure BDA0001439489770000043
中当修正约束的右边属性的值时,将影响所有共享属性所在函数依赖约束的右属性的值,定义为
Figure BDA0001439489770000044
模式。
Figure BDA0001439489770000045
Figure BDA0001439489770000046
中修改约束右属性的值将影响另一个约束中违规的左属性的值,定义为
Figure BDA0001439489770000047
模式。
Figure BDA0001439489770000048
模式中分为以下几种情况:
Figure BDA0001439489770000049
假设
Figure BDA00014394897700000410
Figure BDA00014394897700000411
边且
Figure BDA00014394897700000412
边转变为B-arc影响
Figure BDA00014394897700000413
Figure BDA00014394897700000414
假设
Figure BDA00014394897700000415
Figure BDA00014394897700000416
边且
Figure BDA00014394897700000417
Figure BDA00014394897700000418
边转变为B-arc将自动使
Figure BDA00014394897700000419
转变为B-arc边。
Figure BDA00014394897700000420
假设
Figure BDA00014394897700000421
Figure BDA00014394897700000422
边且
Figure BDA00014394897700000423
Figure BDA00014394897700000424
边转变为B-arc将自动使
Figure BDA00014394897700000425
转变为B-arc边。
Figure BDA00014394897700000426
假设
Figure BDA00014394897700000427
是B-arc边且
Figure BDA00014394897700000428
Figure BDA00014394897700000429
Figure BDA00014394897700000430
Figure BDA00014394897700000431
边且
Figure BDA00014394897700000454
转变
Figure BDA00014394897700000432
边为B-arc将产生新的
Figure BDA00014394897700000433
Figure BDA00014394897700000434
Figure BDA00014394897700000435
假设
Figure BDA00014394897700000436
Figure BDA00014394897700000437
边且
Figure BDA00014394897700000438
Figure BDA00014394897700000439
无论转变
Figure BDA00014394897700000440
边为B-arc还是
Figure BDA00014394897700000441
边转变为B-arc都会将新的
Figure BDA00014394897700000442
Figure BDA00014394897700000443
Figure BDA00014394897700000444
模式中分为以下几种情况:
Figure BDA00014394897700000445
表示边从v开始,
Figure BDA00014394897700000446
表示边从v'开始,
Figure BDA00014394897700000447
U=e.T(e)-{v},U'=e'.T(e')-{v'}。
Figure BDA00014394897700000448
对于每一对e和e',假设
Figure BDA00014394897700000449
Figure BDA00014394897700000450
转变
Figure BDA00014394897700000451
Figure BDA00014394897700000452
会带来新的
Figure BDA00014394897700000453
边。
Figure BDA0001439489770000051
对于每一对e和e',假设
Figure BDA0001439489770000052
Figure BDA0001439489770000053
转变
Figure BDA0001439489770000054
Figure BDA0001439489770000055
会移动
Figure BDA0001439489770000056
中的元组从B-arc边e'到另一条B-arc边e。
Figure BDA0001439489770000057
对于每一对e和e',假设
Figure BDA0001439489770000058
Figure BDA00014394897700000531
转变
Figure BDA0001439489770000059
Figure BDA00014394897700000510
会移动
Figure BDA00014394897700000511
中的元组从
Figure BDA00014394897700000512
边e'到另一条B-arc边e。
Figure BDA00014394897700000513
对于每一对e和e',假设
Figure BDA00014394897700000514
Figure BDA00014394897700000515
转变
Figure BDA00014394897700000516
Figure BDA00014394897700000517
会移动
Figure BDA00014394897700000518
中的元组从
Figure BDA00014394897700000519
边e'到一条新
Figure BDA00014394897700000520
边e;若
Figure BDA00014394897700000521
转变
Figure BDA00014394897700000522
Figure BDA00014394897700000523
会移动
Figure BDA00014394897700000524
中的元组从
Figure BDA00014394897700000525
边e'到
Figure BDA00014394897700000526
边e。
Figure BDA00014394897700000527
对于每一对e和e',U≠U',转变
Figure BDA00014394897700000528
Figure BDA00014394897700000529
不影响另一条新边的形成。
步骤四、函数依赖违规重要度评估,忽视所有的代价模型,修正函数依赖违规可能给数据库带来一些消极和积极的影响。一个函数依赖违规修正可以给关系表R质量的提高带来一些效益,所以根据每一个违规带来的潜在效益来评估其重要性。用函数依赖违规修正操作前和操作后脏元组的改变数量来评估函数依赖违规的重要性。vio(Σ,R)Θvio(Σi,R,v)表示修正函数依赖违规vio(Σi,R,v)之后的函数依赖违规集合。|vio(Σ,R)|表示包括vio(Σ,R)的元组数量。因为vio(Σi,R,v)的消除可能削减脏元组的数量或者可能带来新的的脏元组,所以|vio(Σ,R)Θvio(Σi,R,v)|≥|vio(Σi,R,v)|或者|vio(Σ,R)Θvio(Σi,R,v)|≤|vio(Σi,R,v)|。|vio(Σi,R,v)|-|vio(Σ,R)Θvio(Σi,R,v)|评估关系表R中违规数量的改变和修正后的实例R',定义其改变量为Δ(vio(Σi,R,v)),违规的效益值计算公式如下:
Figure BDA00014394897700000530
违规不是孤立的,数据库中的一个函数依赖违规会影响另一个违规。当评估一个函数依赖违规修正所带来的效益时,不仅考虑函数依赖违规本身还要考虑函数依赖违规的演变因素。在公式(1)中评估一个函数依赖违规消除的潜在好处为函数依赖违规所在的关系表中元组消除或增加的比率。给出由约束集合Σ和关系表R创建的相关的D-Graph,假设
Figure BDA0001439489770000061
Figure BDA0001439489770000062
相关的违规vio(Σi,R,v)。
Figure BDA0001439489770000063
表示将
Figure BDA0001439489770000064
转变为B-arc后其他边的改变,下面讨论如何通过超图的属性计算公式(1)中的|Δ(vio(Σi,R,v))|。
Figure BDA0001439489770000065
假设约束Σi和其他约束的模式是
Figure BDA0001439489770000066
或者
Figure BDA0001439489770000067
清除这些函数依赖违规不会影响其他约束中的违规。所以当计算函数依赖违规vio(Σi,R,v)的|Δ(vio(Σi,R,v))|时,仅仅计算和其相关联的元组的数量,即
Figure BDA0001439489770000068
但是
Figure BDA0001439489770000069
边和其他的超边同时是
Figure BDA00014394897700000610
Figure BDA00014394897700000611
模式时,
Figure BDA00014394897700000612
是在这两个模式中超边影响的和,如公式(3)。
Figure BDA00014394897700000613
表示在
Figure BDA00014394897700000614
模式中对超边的影响,
Figure BDA00014394897700000615
表示在
Figure BDA00014394897700000616
模式中对超边的影响。
Figure BDA00014394897700000617
Figure BDA00014394897700000618
Figure BDA00014394897700000619
公式(4)中
Figure BDA00014394897700000620
为在
Figure BDA00014394897700000621
模式中函数依赖违规满足
Figure BDA00014394897700000622
时,转变
Figure BDA00014394897700000623
为B-arc边的改变量。
Figure BDA00014394897700000624
为在
Figure BDA00014394897700000625
模式中函数依赖违规满足
Figure BDA00014394897700000626
时,转变
Figure BDA00014394897700000627
为B-arc边的改变量。
Figure BDA00014394897700000628
为在
Figure BDA00014394897700000629
模式中函数依赖违规满足
Figure BDA00014394897700000630
时,转变
Figure BDA00014394897700000631
为B-arc边的改变量。
在公式(4)中当违规满足
Figure BDA00014394897700000632
时,改变量为0。
公式(5)中
Figure BDA0001439489770000071
为在
Figure BDA0001439489770000072
模式中函数依赖违规满足
Figure BDA0001439489770000073
时,转变
Figure BDA0001439489770000074
为B-arc边的改变量。
Figure BDA0001439489770000075
为在
Figure BDA0001439489770000076
模式中函数依赖违规满足
Figure BDA0001439489770000077
转变
Figure BDA0001439489770000078
为B-arc边的改变量。
在公式(5)中当违规满足
Figure BDA0001439489770000079
时改变量为0。
步骤五、对数据库中函数依赖违规重要度进行排序,根据步骤一得到关系表的C-Graph和D-Graph超图;通过步骤二得到函数依赖间的关系并对函数依赖间的关系进行分类;在步骤三找出关系表的所有函数依赖违规,并对函数依赖违规关系进行分类;在步骤四中根据步骤三的分类计算每一个函数依赖违规的效益值。当对函数依赖违规排序时,首先创建一个列表,当通过步骤四得到函数依赖违规的效益值,根据比较函数依赖违规效益值将违规插入到列表中。
本发明的有益效果是:该方法首先根据C-Graph和D-Graph的定义构建关系表的C-Graph和D-Graph超图,利用这两种超图描述数据库中关系表的属性之间的依赖关系以及属性值之间的依赖关系;再根据给出的函数依赖约束间关系的分类对表中的函数依赖约束关系进行归类;找出函数依赖违规并根据给出的函数依赖违规间关系的分类对函数依赖违规间的关系进行归类;利用公式计算函数依赖违规的效益值;根据计算得到的函数依赖违规效益值对函数依赖违规重要度进行排序。在修复数据库中的函数依赖违规时,找出函数依赖违规中根本的原因,以降低因修复一个函数依赖违规而引起另一些函数依赖违规带来的代价,实用性好。
下面结合附图和具体实施方式对本发明作详细说明。
附图说明
图1是本发明数据库一致性错误的重要度判定方法实施例中关系表的函数依赖图。
图2是本发明数据库一致性错误的重要度判定方法实施例中关系表的ConstraintGraph C-Graph超图。
图3是本发明数据库一致性错误的重要度判定方法实施例中关系表的Data GraphD-Graph超图。
具体实施方式
参照图1-3。本发明数据库一致性错误的重要度判定方法具体步骤如下:
关系表1
Figure BDA0001439489770000081
关系表2
Figure BDA0001439489770000082
步骤一、对数据库中的关系表构建C-Graph、D-Graph超图。
以关系表1为例,根据关系表1得到函数依赖A,B→E C,D→E,创建关系表1的C-Graph,如图2所示。根据关系表1和图2创建关系表1的D-Graph,如图3所示。
对数据库中的关系表构建C-Graph、D-Graph超图。C-Graph:给出数据库D上的函数依赖集合Σ,C-Graph GΣ=(V,E):Σi:Xi→Yi
Figure BDA0001439489770000083
对于Σ中的每一个Σi:Xi→Yi,有一个超边ei∈E,T(ei)=Xi且H(ei)=Yi。D-Graph:根据C-Graph GΣ和关系表R,GR=(V,E):t∈R,,每一个节点Vi∈V被定义为Vi=(Ai,Fi),
Figure BDA0001439489770000084
对于每一个属性Ai∈U的不同的值,都有一个在V中标为(Ai,Fi)的节点。给出C-Graph边EΣ={TΣ(E),HΣ(E)},会产生许多条D-Graph边,每一个D-Graph边Ei∈E被定义为Ei={T(Ei),H(Ei),Ω(Ei)},其中
Figure BDA00014394897700000910
T(Ei).Ai=TΣ(E);
Figure BDA00014394897700000911
H(Ei).Ai=HΣ(E),VEi∈H(Ei),每一个
Figure BDA0001439489770000091
包含所有和
Figure BDA0001439489770000092
相关的元组的IDs,被定义为
Figure BDA0001439489770000093
函数依赖X→Y意味着X的值相同则Y值也必须相同,根据X的值可以将关系表中的数据分为不同的等价类,每一个等价类中,所有成员有相同的X值,其Y值可能相同也可能不同。在D-Graph中有两种超边,一种是只有一个头结点及|H(E)|=1,另一种则是有多个头结点及|H(E)|>1,分别为B-arc边和
Figure BDA0001439489770000094
边。在D-Graph中,如果包含一个或者多个
Figure BDA0001439489770000095
边,意味着至少一个函数依赖等价类的左属性映射到多个等价类的右属性。若图中只包含B-arc边,意味着每一个等价类的左属性仅映射一个等价类的右属性,因此没有函数依赖违规。所以函数依赖违规检查转变为在D-Graph中查找
Figure BDA0001439489770000096
函数依赖违规修复问题转化为转换所有的
Figure BDA0001439489770000097
边为B-arc边,本专利的目标是对所有违反函数依赖的元组集合排序即对函数依赖违规进行排序,因此问题转换为对D-Graph中所有
Figure BDA0001439489770000098
边进行排序。
X、Y:为关系表中的属性,U=X∪Y;
Σ:函数依赖集合;
V:为超图中节点的集合;
E:为超图中超边的集合;
H(e):表示超边的头结点;
T(e):表示超边的尾节点;
t:为表R中的元组;
Ai:是属性名且Ai∈U;
Fi:是t[Ai]的一个值;
步骤二、对函数依赖之间的关系进行归类。
步骤一对函数依赖之间的关系进行了相应的分类,从关系表1中得到函数依赖A,B→E C,D→E。根据图2和步骤一所述函数依赖的分类对A,B→E C,D→E进行归类,函数依赖间的违规属于
Figure BDA0001439489770000099
对不同函数依赖之间的关系进行分类。假设Σ集合为最小覆盖,Σi:X→Y和Σj:X'→Y',根据函数依赖最小覆盖的定义:
Figure BDA0001439489770000101
Figure BDA0001439489770000102
或者
Figure BDA0001439489770000103
Σi和Σj之间关系分为四类:
Figure BDA0001439489770000104
Σi和Σj中的属性表示如下:
Figure BDA0001439489770000105
Figure BDA0001439489770000106
如果Σi和Σj共享约束左边的一些属性,表示如下:
Figure BDA0001439489770000107
Figure BDA0001439489770000108
如果约束的右边属性值相同,表示如下:
Figure BDA0001439489770000109
Figure BDA00014394897700001010
如果约束左边和右边都有共享属性,表示如下:
Figure BDA00014394897700001011
Figure BDA00014394897700001012
Figure BDA00014394897700001013
如果Σi和Σj中的属性满足以下:
Figure BDA00014394897700001014
Figure BDA00014394897700001015
Figure BDA00014394897700001016
Figure BDA00014394897700001017
Figure BDA00014394897700001018
Figure BDA00014394897700001019
Figure BDA00014394897700001020
如果Σi和Σj中的属性满足以下:
Figure BDA00014394897700001021
Figure BDA00014394897700001022
Figure BDA00014394897700001023
Figure BDA00014394897700001024
Figure BDA00014394897700001025
Figure BDA00014394897700001026
Σ:函数依赖集合名称
步骤三、找出违反函数依赖的集合并进行归类。
根据D-Graph超图和函数依赖A,B→E C,D→E,找到五组违反函数依赖的元组集合。在D-Graph超图中得到E1~E5
Figure BDA00014394897700001027
边,对应于关系表2中的函数依赖违规vio1~vio5。根据关系表1的C-Graph、D-Graph超图得到E1和E4满足
Figure BDA00014394897700001028
转变E1边为B-arc边,E4边将自动转变为B-arc边;E2和E5满足
Figure BDA00014394897700001029
E3和E6满足
Figure BDA0001439489770000111
E3转变为B-arc边会使E6变成
Figure BDA0001439489770000112
找出关系表中的函数依赖违规并对不同函数依赖违规间的关系进行分类。假设当解决函数依赖违规问题时,仅修正函数依赖约束的右边属性的值。Σi和Σj之间的违规模式分为以下四类:
Figure BDA0001439489770000113
Figure BDA0001439489770000114
中解决其中一个约束的违规将不会影响另一个约束的违规,定义为
Figure BDA0001439489770000115
模式。
Figure BDA0001439489770000116
Figure BDA0001439489770000117
中当修正约束的右边属性的值时,将影响所有共享属性所在函数依赖约束的右属性的值,定义为
Figure BDA0001439489770000118
模式。
Figure BDA0001439489770000119
Figure BDA00014394897700001110
中修改约束右属性的值将影响另一个约束中违规的左属性的值,定义为
Figure BDA00014394897700001111
模式。
Figure BDA00014394897700001112
模式中分为以下几种情况:
Figure BDA00014394897700001113
假设
Figure BDA00014394897700001114
Figure BDA00014394897700001115
边且
Figure BDA00014394897700001116
边转变为B-arc影响
Figure BDA00014394897700001117
Figure BDA00014394897700001118
假设
Figure BDA00014394897700001119
Figure BDA00014394897700001120
边且
Figure BDA00014394897700001121
Figure BDA00014394897700001122
边转变为B-arc将自动使
Figure BDA00014394897700001123
转变为B-arc边。
Figure BDA00014394897700001124
假设
Figure BDA00014394897700001125
Figure BDA00014394897700001126
边且
Figure BDA00014394897700001127
Figure BDA00014394897700001128
边转变为B-arc将自动使
Figure BDA00014394897700001129
转变为B-arc边。
Figure BDA00014394897700001130
假设
Figure BDA00014394897700001131
是B-arc边且
Figure BDA00014394897700001132
Figure BDA00014394897700001133
Figure BDA00014394897700001134
Figure BDA00014394897700001135
边且
Figure BDA00014394897700001136
.转变
Figure BDA00014394897700001137
边为B-arc将产生新的
Figure BDA00014394897700001138
Figure BDA00014394897700001139
Figure BDA00014394897700001140
假设
Figure BDA00014394897700001141
Figure BDA00014394897700001142
边且
Figure BDA00014394897700001143
Figure BDA00014394897700001144
无论转变
Figure BDA00014394897700001145
边为B-arc还是
Figure BDA00014394897700001146
边转变为B-arc都会将新的
Figure BDA00014394897700001147
Figure BDA00014394897700001148
Figure BDA0001439489770000121
模式中分为以下几种情况:
Figure BDA0001439489770000122
表示边从v开始,
Figure BDA0001439489770000123
表示边从v'开始,
Figure BDA0001439489770000124
U=e.T(e)-{v},U'=e'.T(e')-{v'}。
Figure BDA0001439489770000125
对于每一对e和e',假设
Figure BDA0001439489770000126
Figure BDA0001439489770000127
转变
Figure BDA0001439489770000128
Figure BDA0001439489770000129
会带来新的
Figure BDA00014394897700001210
边。
Figure BDA00014394897700001211
对于每一对e和e',假设
Figure BDA00014394897700001212
Figure BDA00014394897700001213
转变
Figure BDA00014394897700001214
Figure BDA00014394897700001215
会移动
Figure BDA00014394897700001216
中的元组从B-arc边e'到另一条B-arc边e。
Figure BDA00014394897700001217
对于每一对e和e',假设
Figure BDA00014394897700001218
Figure BDA00014394897700001219
,转变
Figure BDA00014394897700001220
Figure BDA00014394897700001221
会移动
Figure BDA00014394897700001222
中的元组从
Figure BDA00014394897700001223
边e'到另一条B-arc边e。
Figure BDA00014394897700001224
对于每一对e和e',假设|H(e)|>1∧|H(e')|>1∧U=U',若
Figure BDA00014394897700001225
转变
Figure BDA00014394897700001226
Figure BDA00014394897700001227
会移动
Figure BDA00014394897700001228
中的元组从
Figure BDA00014394897700001229
边e'到一条新
Figure BDA00014394897700001230
边e;若
Figure BDA00014394897700001231
转变
Figure BDA00014394897700001232
Figure BDA00014394897700001233
会移动
Figure BDA00014394897700001234
中的元组从
Figure BDA00014394897700001235
边e'到
Figure BDA00014394897700001236
边e。
Figure BDA00014394897700001237
对于每一对e和e',U≠U',转变
Figure BDA00014394897700001238
Figure BDA00014394897700001239
不影响另一条新边的形成。
步骤四、对函数依赖违规重要度进行评估,计算函数依赖违规的效益值。
根据公式(1)计算得到每一个违规的效益值,其中每一个违规的|Δ(vio(Σi,R,v))|计算根据公式(2)得到,根据公式(3)计算得到公式(2)中的
Figure BDA00014394897700001240
值。
函数依赖违规重要度评估,忽视所有的代价模型,修正函数依赖违规可能给数据库带来一些消极和积极的影响。一个函数依赖违规修正可以给关系表R质量的提高带来一些效益,所以根据每一个违规带来的潜在效益来评估其重要性。用函数依赖违规修正操作前和操作后脏元组的改变数量来评估函数依赖违规的重要性。vio(Σ,R)Θvio(Σi,R,v)表示修正函数依赖违规vio(Σi,R,v)之后的函数依赖违规集合。|vio(Σ,R)|表示包括vio(Σ,R)的元组数量。因为vio(Σi,R,v)的消除可能削减脏元组的数量或者可能带来新的的脏元组,所以|vio(Σ,R)Θvio(Σi,R,v)|≥|vio(Σi,R,v)|或者|vio(Σ,R)Θvio(Σi,R,v)|≤|vio(Σi,R,v)|。|vio(Σi,R,v)|-|vio(Σ,R)Θvio(Σi,R,v)|评估关系表R中违规数量的改变和修正后的实例R',定义其改变量为Δ(vio(Σi,R,v)),违规的效益值计算公式如下:
Figure BDA0001439489770000131
违规不是孤立的,数据库中的一个函数依赖违规会影响另一个违规。当评估一个函数依赖违规修正所带来的效益时,不仅考虑函数依赖违规本身还要考虑函数依赖违规的演变因素。在公式(1)中评估一个函数依赖违规消除的潜在好处为函数依赖违规所在的关系表中元组消除或增加的比率。给出由约束集合Σ和关系表R创建的相关的D-Graph,假设
Figure BDA0001439489770000132
Figure BDA0001439489770000133
相关的违规vio(Σi,R,v)。
Figure BDA0001439489770000134
表示将
Figure BDA0001439489770000135
转变为B-arc后其他边的改变,下面讨论如何通过超图的属性计算公式(1)中的|Δ(vio(Σi,R,v))|。
Figure BDA0001439489770000136
假设约束Σi和其他约束的模式是
Figure BDA0001439489770000137
或者
Figure BDA0001439489770000138
,清除这些函数依赖违规不会影响其他约束中的违规。所以当计算函数依赖违规vio(Σi,R,v)的|Δ(vio(Σi,R,v))|时,仅仅计算和其相关联的元组的数量,即
Figure BDA0001439489770000139
但是
Figure BDA00014394897700001320
边和其他的超边同时是
Figure BDA00014394897700001310
Figure BDA00014394897700001311
模式时,
Figure BDA00014394897700001312
是在这两个模式中超边影响的和,如公式(3)
Figure BDA00014394897700001313
表示在
Figure BDA00014394897700001314
模式中对超边的影响,
Figure BDA00014394897700001315
表示在
Figure BDA00014394897700001316
模式中对超边的影响。
Figure BDA00014394897700001317
Figure BDA00014394897700001318
Figure BDA00014394897700001319
公式(4)中
Figure BDA0001439489770000141
为在
Figure BDA0001439489770000142
模式中函数依赖违规满足
Figure BDA0001439489770000143
时,转变
Figure BDA0001439489770000144
为B-arc边的改变量。
Figure BDA0001439489770000145
为在
Figure BDA0001439489770000146
模式中函数依赖违规满足
Figure BDA0001439489770000147
时,转变
Figure BDA0001439489770000148
为B-arc边的改变量。
Figure BDA0001439489770000149
为在
Figure BDA00014394897700001410
模式中函数依赖违规满足
Figure BDA00014394897700001411
时,转变
Figure BDA00014394897700001412
为B-arc边的改变量。
在公式(4)中当违规满足
Figure BDA00014394897700001413
时,改变量为0。
公式(5)中
Figure BDA00014394897700001414
为在
Figure BDA00014394897700001415
模式中函数依赖违规满足
Figure BDA00014394897700001416
时,转变
Figure BDA00014394897700001417
为B-arc边的改变量。
Figure BDA00014394897700001418
为在
Figure BDA00014394897700001419
模式中函数依赖违规满足
Figure BDA00014394897700001420
转变
Figure BDA00014394897700001421
为B-arc边的改变量。
在公式(5)中当违规满足
Figure BDA00014394897700001422
时改变量为0。
步骤五、对数据库中函数依赖违规重要度进行排序。
新建一个列表,根据步骤四中得到函数依赖违规的效益值,比较函数依赖违规的效益值,并将其插入列表中。
对数据库中函数依赖违规重要度进行排序,根据步骤一得到关系表的C-Graph和D-Graph超图;通过步骤二得到函数依赖间的关系并对该关系进行分类;在步骤三找出关系表的所有函数依赖违规,并对函数依赖违规关系进行分类;在步骤四中根据步骤三的分类计算每一个函数依赖违规的效益值。当对函数依赖违规排序时,首先创建一个列表,当通过步骤四得到函数依赖违规的效益值,根据比较函数依赖违规效益值将违规插入到列表中。

Claims (1)

1.一种数据库一致性错误的重要度判定方法,其特征在于包括以下步骤:
步骤一、对数据库中的关系表构建C-Graph和D-Graph超图;C-Graph给出数据库D上的函数依赖集合Σ,C-Graph GΣ=(V,E):Σi:Xi→Yi
Figure FDA0002668236640000011
Figure FDA0002668236640000012
U=X∪Y;对于Σ中的每一个Σi:Xi→Yi,有一个超边ei∈E,T(ei)=Xi且H(ei)=Yi;D-Graph:根据C-Graph GΣ和关系表R,GR=(V,E):t∈R,每一个节点Vi∈V被定义为Vi=(Ai,Fi),
Figure FDA0002668236640000013
对于每一个属性Ai∈U的不同的值,都有一个在V中标为(Ai,Fi)的节点;给出C-Graph边EΣ={TΣ(E),HΣ(E)},会产生许多条D-Graph边,每一个D-Graph边Ei∈E被定义为Ei={T(Ei),H(Ei),Ω(Ei)},其中
Figure FDA0002668236640000014
T(Ei).Ai=TΣ(E);
Figure FDA0002668236640000015
H(Ei).Ai=HΣ(E),
Figure FDA0002668236640000016
每一个
Figure FDA0002668236640000017
包含所有和
Figure FDA0002668236640000018
相关的元组的IDs,被定义为
Figure FDA0002668236640000019
函数依赖X→Y意味着X的值相同则Y值也必须相同,根据X的值将关系表中的数据分为不同的等价类,每一个等价类中,所有成员有相同的X值,其Y值相同或者不同;在D-Graph中有两种超边,一种是只有一个头结点及|H(E)|=1,另一种则是有多个头结点及|H(E)|>1,分别为B-arc边和
Figure FDA00026682366400000110
边;在D-Graph中,如果包含一个或者多个
Figure FDA00026682366400000111
边,意味着至少一个函数依赖等价类的左属性映射到多个等价类的右属性;若图中只包含B-arc边,意味着每一个等价类的左属性仅映射一个等价类的右属性,因此没有函数依赖违规;所以函数依赖违规检查转变为在D-Graph中查找
Figure FDA00026682366400000112
函数依赖违规修复问题转化为转换所有的
Figure FDA00026682366400000113
边为B-arc边,其目标是对所有违反函数依赖的元组集合排序即对函数依赖违规进行排序,因此问题转换为对D-Graph中所有
Figure FDA00026682366400000114
边进行排序;
X、Y:为关系表中的属性,U=X∪Y;
Σ:函数依赖集合;
V:为超图中节点的集合;
E:为超图中超边的集合;
H(e):表示超边的头结点;
T(e):表示超边的尾节点;
t:为表R中的元组;
Ai:是属性名且Ai∈U;
Fi:是t[Ai]的一个值;
步骤二、对不同函数依赖之间的关系进行分类;假设Σ集合为最小覆盖,Σi:X→Y和Σj:X'→Y',根据函数依赖最小覆盖的定义:
Figure FDA0002668236640000021
Figure FDA0002668236640000022
或者
Figure FDA0002668236640000023
Σi和Σj之间关系分为四类:
Figure FDA0002668236640000024
和Σj中的属性表示如下:
Figure FDA0002668236640000025
Figure FDA0002668236640000026
如果Σi和Σj共享约束左边的一些属性,表示如下:
Figure FDA0002668236640000027
Figure FDA0002668236640000028
如果约束的右边属性值相同,表示如下:
Figure FDA0002668236640000029
Figure FDA00026682366400000210
如果约束左边和右边都有共享属性,表示如下:
Figure FDA00026682366400000211
Figure FDA00026682366400000212
Figure FDA00026682366400000213
如果Σi和Σj中的属性满足以下:
Figure FDA00026682366400000214
Figure FDA00026682366400000215
Figure FDA00026682366400000216
Figure FDA00026682366400000217
Figure FDA00026682366400000218
Figure FDA00026682366400000219
Figure FDA00026682366400000220
如果Σi和Σj中的属性满足以下:
Figure FDA00026682366400000221
Figure FDA00026682366400000222
Figure FDA00026682366400000223
Figure FDA00026682366400000224
Figure FDA00026682366400000225
Figure FDA00026682366400000226
Σ:函数依赖集合名称;
步骤三、找出关系表中的函数依赖违规并对不同函数依赖违规间的关系进行分类;假设当解决函数依赖违规问题时,仅修正函数依赖约束的右边属性的值;Σi和Σj之间的违规模式分为以下四类:
Figure FDA0002668236640000031
Figure FDA0002668236640000032
中解决其中一个约束的违规将不会影响另一个约束的违规,定义为
Figure FDA0002668236640000033
模式;
Figure FDA0002668236640000034
Figure FDA0002668236640000035
中当修正约束的右边属性的值时,将影响所有共享属性所在函数依赖约束的右属性的值,定义为
Figure FDA0002668236640000036
模式;
Figure FDA0002668236640000037
Figure FDA0002668236640000038
中修改约束右属性的值将影响另一个约束中违规的左属性的值,定义为
Figure FDA0002668236640000039
模式;
Figure FDA00026682366400000310
模式中分为以下几种情况:
Figure FDA00026682366400000311
假设
Figure FDA00026682366400000312
Figure FDA00026682366400000313
边且
Figure FDA00026682366400000314
边转变为B-arc影响
Figure FDA00026682366400000315
Figure FDA00026682366400000316
假设
Figure FDA00026682366400000317
Figure FDA00026682366400000318
边且
Figure FDA00026682366400000319
Figure FDA00026682366400000320
边转变为B-arc将自动使
Figure FDA00026682366400000321
转变为B-arc边;
Figure FDA00026682366400000322
假设
Figure FDA00026682366400000323
Figure FDA00026682366400000324
边且
Figure FDA00026682366400000325
Figure FDA00026682366400000326
边转变为B-arc将自动使
Figure FDA00026682366400000327
转变为B-arc边;
Figure FDA00026682366400000328
假设
Figure FDA00026682366400000329
是B-arc边且
Figure FDA00026682366400000330
Figure FDA00026682366400000331
Figure FDA00026682366400000332
Figure FDA00026682366400000333
边且
Figure FDA00026682366400000334
转变
Figure FDA00026682366400000335
边为B-arc将产生新的
Figure FDA00026682366400000336
Figure FDA00026682366400000337
Figure FDA00026682366400000338
假设
Figure FDA00026682366400000339
Figure FDA00026682366400000340
边且
Figure FDA00026682366400000341
Figure FDA00026682366400000342
无论转变
Figure FDA00026682366400000343
边为B-arc还是
Figure FDA00026682366400000344
边转变为B-arc都会将新的
Figure FDA00026682366400000345
Figure FDA00026682366400000346
Figure FDA00026682366400000347
模式中分为以下几种情况:
Figure FDA00026682366400000348
Figure FDA00026682366400000349
表示边从v开始,
Figure FDA00026682366400000350
表示边从v'开始,
Figure FDA00026682366400000351
U=e.T(e)-{v},U'=e'.T(e')-{v'};
Figure FDA0002668236640000041
对于每一对e和e',假设
Figure FDA0002668236640000042
Figure FDA0002668236640000043
转变
Figure FDA0002668236640000044
Figure FDA0002668236640000045
会带来新的
Figure FDA0002668236640000046
边;
Figure FDA0002668236640000047
对于每一对e和e',假设
Figure FDA0002668236640000048
Figure FDA0002668236640000049
转变
Figure FDA00026682366400000410
Figure FDA00026682366400000411
会移动
Figure FDA00026682366400000412
中的元组从B-arc边e'到另一条B-arc边e;
Figure FDA00026682366400000413
对于每一对e和e',假设
Figure FDA00026682366400000414
Figure FDA00026682366400000415
转变
Figure FDA00026682366400000416
Figure FDA00026682366400000417
会移动
Figure FDA00026682366400000418
中的元组从
Figure FDA00026682366400000419
边e'到另一条B-arc边e;
Figure FDA00026682366400000420
对于每一对e和e',假设|H(e)|>1∧|H(e')|>1∧U=U',若
Figure FDA00026682366400000421
转变
Figure FDA00026682366400000422
Figure FDA00026682366400000423
会移动
Figure FDA00026682366400000424
中的元组从
Figure FDA00026682366400000425
边e'到一条新
Figure FDA00026682366400000426
边e;若
Figure FDA00026682366400000427
转变
Figure FDA00026682366400000428
Figure FDA00026682366400000429
会移动
Figure FDA00026682366400000430
中的元组从
Figure FDA00026682366400000431
边e'到
Figure FDA00026682366400000432
边e;
Figure FDA00026682366400000433
对于每一对e和e',U≠U',转变
Figure FDA00026682366400000434
Figure FDA00026682366400000435
不影响另一条新边的形成;
步骤四、函数依赖违规重要度评估,忽视所有的代价模型,修正函数依赖违规可能给数据库带来一些消极和积极的影响;一个函数依赖违规修正可以给关系表R质量的提高带来一些效益,所以根据每一个违规带来的潜在效益来评估其重要性;用函数依赖违规修正操作前和操作后脏元组的改变数量来评估函数依赖违规的重要性;vio(Σ,R)Θvio(Σi,R,v)表示修正函数依赖违规vio(Σi,R,v)之后的函数依赖违规集合;|vio(Σ,R)|表示包括vio(Σ,R)的元组数量;因为vio(Σi,R,v)的消除可能削减脏元组的数量或者可能带来新的的脏元组,所以|vio(Σ,R)Θvio(Σi,R,v)|≥|vio(Σi,R,v)|或者|vio(Σ,R)Θvio(Σi,R,v)|≤|vio(Σi,R,v)|;|vio(Σi,R,v)|-|vio(Σ,R)Θvio(Σi,R,v)|评估关系表R中违规数量的改变和修正后的实例R',定义其改变量为Δ(vio(Σi,R,v)),违规的效益值计算公式如下:
Figure FDA0002668236640000051
违规不是孤立的,数据库中的一个函数依赖违规会影响另一个违规;当评估一个函数依赖违规修正所带来的效益时,不仅考虑函数依赖违规本身还要考虑函数依赖违规的演变因素;在公式(1)中评估一个函数依赖违规消除的潜在好处为函数依赖违规所在的关系表中元组消除或增加的比率;给出由约束集合Σ和关系表R创建的相关的D-Graph,假设
Figure FDA0002668236640000052
Figure FDA0002668236640000053
相关的违规vio(Σi,R,v);
Figure FDA0002668236640000054
表示将
Figure FDA0002668236640000055
转变为B-arc后其他边的改变,下面讨论如何通过超图的属性计算公式(1)中的|Δ(vio(Σi,R,v))|;
Figure FDA0002668236640000056
假设约束Σi和其他约束的模式是
Figure FDA0002668236640000057
或者
Figure FDA0002668236640000058
清除这些函数依赖违规不会影响其他约束中的违规;所以当计算函数依赖违规vio(Σi,R,v)的|Δ(vio(Σi,R,v))|时,仅仅计算和其相关联的元组的数量,即
Figure FDA0002668236640000059
但是
Figure FDA00026682366400000510
边和其他的超边同时是
Figure FDA00026682366400000511
Figure FDA00026682366400000512
模式时,
Figure FDA00026682366400000513
是在这两个模式中超边影响的和,如公式(3);
Figure FDA00026682366400000514
表示在
Figure FDA00026682366400000515
模式中对超边的影响,
Figure FDA00026682366400000516
表示在
Figure FDA00026682366400000517
模式中对超边的影响;
Figure FDA00026682366400000518
Figure FDA00026682366400000519
Figure FDA00026682366400000520
公式(4)中
Figure FDA00026682366400000521
为在
Figure FDA00026682366400000522
模式中函数依赖违规满足
Figure FDA00026682366400000523
时,转变
Figure FDA00026682366400000524
为B-arc边的改变量;
Figure FDA00026682366400000525
为在
Figure FDA00026682366400000526
模式中函数依赖违规满足
Figure FDA00026682366400000527
时,转变
Figure FDA00026682366400000528
为B-arc边的改变量;
Figure FDA00026682366400000529
为在
Figure FDA00026682366400000530
模式中函数依赖违规满足
Figure FDA00026682366400000531
时,转变
Figure FDA00026682366400000532
为B-arc边的改变量;
在公式(4)中当违规满足
Figure FDA0002668236640000061
时,改变量为0;
公式(5)中
Figure FDA0002668236640000062
为在
Figure FDA0002668236640000063
模式中函数依赖违规满足
Figure FDA0002668236640000064
时,转变
Figure FDA0002668236640000065
为B-arc边的改变量;
Figure FDA0002668236640000066
为在
Figure FDA0002668236640000067
模式中函数依赖违规满足
Figure FDA0002668236640000068
转变
Figure FDA0002668236640000069
为B-arc边的改变量;
在公式(5)中当违规满足
Figure FDA00026682366400000610
时改变量为0;
步骤五、对数据库中函数依赖违规重要度进行排序,根据步骤一得到关系表的C-Graph和D-Graph超图;通过步骤二得到函数依赖间的关系并对函数依赖间的关系进行分类;在步骤三找出关系表的所有函数依赖违规,并对函数依赖违规关系进行分类;在步骤四中根据步骤三的分类计算每一个函数依赖违规的效益值;当对函数依赖违规排序时,首先创建一个列表,当通过步骤四得到函数依赖违规的效益值,根据比较函数依赖违规效益值将违规插入到列表中。
CN201710981214.5A 2017-10-20 2017-10-20 数据库一致性错误的重要度判定方法 Expired - Fee Related CN107633099B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710981214.5A CN107633099B (zh) 2017-10-20 2017-10-20 数据库一致性错误的重要度判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710981214.5A CN107633099B (zh) 2017-10-20 2017-10-20 数据库一致性错误的重要度判定方法

Publications (2)

Publication Number Publication Date
CN107633099A CN107633099A (zh) 2018-01-26
CN107633099B true CN107633099B (zh) 2021-02-02

Family

ID=61104503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710981214.5A Expired - Fee Related CN107633099B (zh) 2017-10-20 2017-10-20 数据库一致性错误的重要度判定方法

Country Status (1)

Country Link
CN (1) CN107633099B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11080266B2 (en) * 2018-07-30 2021-08-03 Futurewei Technologies, Inc. Graph functional dependency checking
CN109669932B (zh) * 2018-10-22 2023-06-30 国网上海市电力公司 一种基于次序依赖的电力数据集修复方法
CN109885561A (zh) * 2019-01-03 2019-06-14 中国人民解放军国防科技大学 一种基于最大依赖集和属性相关性不一致数据清洗方法
CN110069480B (zh) * 2019-03-04 2022-06-24 广东恒睿科技有限公司 一种并行数据清洗方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473400B (zh) * 2013-08-27 2016-12-28 北京航空航天大学 基于层次依赖建模的软件fmea方法
US20170212755A1 (en) * 2016-01-22 2017-07-27 Hcl Technologies Limited System and method for computing a criticality metric of a unit of source code
CN106777127B (zh) * 2016-12-16 2020-05-26 中山大学 基于知识图谱的个性化学习过程的自动生成方法及系统

Also Published As

Publication number Publication date
CN107633099A (zh) 2018-01-26

Similar Documents

Publication Publication Date Title
CN107633099B (zh) 数据库一致性错误的重要度判定方法
WO2019238109A1 (zh) 一种故障根因分析的方法及装置
US11055307B2 (en) Automatic modeling method and classifier for OLAP data model
Berman et al. Lp-testing
Klinkmüller et al. Listen to me: Improving process model matching through user feedback
CN114281809B (zh) 一种多源异构数据清洗方法及装置
US20100235296A1 (en) Flow comparison processing method and apparatus
CN104573050A (zh) 一种基于Canopy聚类和BIRCH层次聚类的连续属性离散化方法
CN112364584B (zh) 一种基于分布式的静态时序分析方法
US7783657B2 (en) Search authoring metrics and debugging
CN107402859B (zh) 软件功能验证系统及其验证方法
Ehrlinger et al. A novel data quality metric for minimality
CN103970651A (zh) 基于组件安全属性的软件体系结构安全性评估方法
CN115081515A (zh) 能效评价模型构建方法、装置、终端及存储介质
CN109102138B (zh) 工作流网检验的异常片段提取方法、可读存储介质及终端
CN109977131A (zh) 一种房型匹配系统
CN110083815B (zh) 一种同义变量识别方法和系统
Prat-Pérez et al. How community-like is the structure of synthetically generated graphs?
CN108776697B (zh) 一种基于谓词的多源数据集清洗方法
CN101714142B (zh) 文件群集的合并方法
CN109492712A (zh) 建立互联网金融风控模型的方法
Silva et al. Classifying feature models maintainability based on machine learning algorithms
CN108469949B (zh) 一种基于差异比较对分析类图进行评价的方法
CN112632284A (zh) 用于未标注文本数据集的信息抽取方法及系统
CN110968576A (zh) 一种基于内容相关的数值型数据一致性清洗方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210202