CN110413658A - 一种基于关联规则的事实证据链构建方法 - Google Patents
一种基于关联规则的事实证据链构建方法 Download PDFInfo
- Publication number
- CN110413658A CN110413658A CN201910666343.4A CN201910666343A CN110413658A CN 110413658 A CN110413658 A CN 110413658A CN 201910666343 A CN201910666343 A CN 201910666343A CN 110413658 A CN110413658 A CN 110413658A
- Authority
- CN
- China
- Prior art keywords
- data
- missing
- evidence
- chain
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 230000009467 reduction Effects 0.000 claims abstract description 7
- 230000007812 deficiency Effects 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 14
- 238000013480 data collection Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 241001269238 Data Species 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 3
- 230000008859 change Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于关联规则的事实证据链构建方法,包含以下步骤:步骤1),基于证据链的缺失值归算算法,挖掘每个数据元组中缺失值的所有相关证据,然后结合这些相关证据构建证据链,进一步估计缺失值;步骤2),在置信度和支持度的基础上使用关联规则算法,建立证据关联强规则;包括建立条件小训练集,每条规则主体通过选取条件小训练集进行属性连接,最后用实例覆盖小训练集的每个实例,构建高质量分类器。本发明基于证据链的缺失值归算算法具有较高的计算精度,并且随着缺失值的增加或缺失值的位置变化,其计算精度也得到了保证。
Description
技术领域
本发明属于诉讼服务研究领域的数据挖掘技术领域,更具体地说,涉及一种基于关联规则的事实证据链构建方法。
背景技术
当事人负有对自己的诉讼主张提供适当证据予以证明的责任,如果未能及时提供证据或提供的证据不能足以支持其所主张的事实,那么将要承担该主张不能成立的风险。以民间借贷为例,通过调研案例,目前民间借贷纠纷中大多采用借条或借款合同的形式,但是问题仍有很多,如未表明借款条据的性质、债务人借款目的、实际收款方式,借款金额及期限仅用阿拉伯数字表示,送达地址不明确等,这些未标明或不明确的瑕疵造成债权人在维权的过程中,需要提供相应的证据,才能相互印证,形成完整的证据链。
证据链的构建对于案件事实的证明极为重要,它并不是证据的简单叠加,而是对证据的逻辑排列,证明案件事实的证据不仅需要互相印证,还需以一定的形式形成一个证据锁链来共同证明案件事实。
目前已有的相似技术,主要面向裁判文书基于对证据链的提取与分析,研究遵循法言法语及文书说理的自然语言处理技术,抽取裁判文书说理的相关语段,逆向构建证据链和文书说理逻辑关系,并通过计算机程序绘制可视化的证据链与文书说理逻辑图。
在实际应用中,该技术除极少数直接证据之外,绝大多数证据不可能与事实直接关联,意味着组合使用才能形成稳定牢固“链接”关系的两个及以上证据无法进行相互排列组合。
发明内容
针对现有技术存在的不足,本发明的目的在于提供了一种基于关联规则的事实证据链构建方法,设计合理,采用的是自动提取证据强规则、过滤弱规则的方法,最终建立一种基于关联规则的事实证据链构建方法,克服了现有证据链构建中两个及以上关系的“链接”无法进行逻辑组合的缺陷。
为实现上述目的,本发明提供了如下技术方案:
一种基于关联规则的事实证据链构建方法,其特征在于:包含以下步骤:
步骤1),基于证据链的缺失值归算算法,挖掘每个数据元组中缺失值的所有相关证据,然后结合这些相关证据构建证据链,进一步估计缺失值;
步骤2),在置信度和支持度的基础上使用关联规则算法,建立证据关联强规则;包括建立条件小训练集,每条规则主体通过选取条件小训练集进行属性连接,最后用实例覆盖小训练集的每个实例,构建高质量分类器。
作为一种优化的技术方案,步骤1)的具体步骤是:
步骤1.1),为数据集D为每个数据元组Dj确定唯一的标识Ik(1≤k≤m),然后给出每个不完整数据元组的缺失数据的位置Mh(1≤h≤n),以确定元组中哪个数据丢失,并输出标记的数据集。输出数据格式为(Ik,Mh,Dj);
步骤1.2),扫描步骤1.1创建的结果文件,以计算不完整数据元组Zj(1≤j≤m) 中的完整数据Rj的组合集合Sj,其结果将用作为估计缺失数据的证据链;输出数据格式为(Ik,Mh,Sj);
步骤1.3),根据完整数据元组和输出数据计算每个缺失元组中缺失值P的可能值的概率P(p);
在公式(1)中,K()表示计数,K(p)表示缺失值p的可能值在每个数据元组中相同缺失位置的出现次数,m表示数据元组的数量;
步骤1.4),对整个数据集中的每个数据元组计算完整数据组合C(y,u)的数据集的数量Oj,并将在以下步骤中用于丢失数据值估计的概率查询中;输出数据格式是(C(y,u),Oj);
步骤1.5),计算同一数据元组中不完整数据元组Zj(1≤j≤m)中的完整数据集 Sj和缺失数据的数量,即Tj;输出格式是(Sj,Mh,Vj(Ai),Tj)
Tj=K(Vj(Ai)(1≤j≤m,1≤i≤n)∪Sj(2)
步骤1.6),将步骤1.2中创建的估计缺失数据的证据链(Ik,Mh,Sj)与步骤1.3中输出的缺失数据的可能值(P,P(p))相关联;每个不完整数据元组Zj(1≤j≤m) 中的缺失数据的相关属性值组合C(y,u)和每个可能的填充值p在整个数据集中同时出现的概率P(p);输出数据格式是(C(y,u),Mh,p,P(p));
步骤1.7),计算不完整数据元组Zj(1≤j≤m)中的相关属性值组合数量Oj,其中缺失数据Vj(Ai)='?'(1≤j≤m,1≤i≤n)根据步骤1.4的结果文件;根据步骤1.5结果文件中的C(y,u)和p,在整个数据集中找到关联属性值组合和缺失数据可能值 p同时出现的次数Tj;根据可信度计算公式,得出缺失数据的证据链来估算缺失数据的插补值计算为:可以得出不完整数据元组Zj(1≤j≤m)中所有缺失数据的估值在相关属性值组合的集合Si的条件下取值的概率,选择置可信度最大的估计值作为最终插补值;
步骤1.8),根据步骤1.7中估算出的缺失数据可能取值,插补到原缺失数据集D中,得到完整缺失数据集。如图1所示。
作为一种优化的技术方案,步骤2)的具体步骤是:
步骤2.1),选取满足支持度的属性值对,构建每个属性值对的小训练集,
事实事实链X→Y的支持度公式:S(X→Y)=P(X,Y)/P(I)=Num(X∪Y)/Num(I)
其中,I表示总的证据事实集合。num()表示求证据集里特定证据集出现的次数。
步骤2.2),从每个训练集里提取好规则,表达式为;
其中|P|和|N|分别表示与当前规则匹配的正实例数和负实例数。当一个属性值加入当前规则后,|P*|和|N*|分别表示与规则匹配的正实例数和负实例数。
步骤2.3),采用实例覆盖技术覆盖小训练集的每个实例,构建具有较高质量的分类器。
由于采用了上述技术方案,与现有技术相比,本发明基于证据链的缺失值归算算法具有较高的计算精度,并且随着缺失值的增加或缺失值的位置变化,其计算精度也得到了保证。
附图说明
图1为本发明一种实施例中的算法时序图。
具体实施方式
实施例
一种基于关联规则的事实证据链构建方法,包含以下步骤:
步骤1),基于证据链的缺失值归算算法,挖掘每个数据元组中缺失值的所有相关证据,然后结合这些相关证据构建证据链,进一步估计缺失值。
如图1所示,步骤1)的具体步骤是:
步骤1.1),为数据集D为每个数据元组Dj确定唯一的标识Ik(1≤k≤m),然后给出每个不完整数据元组的缺失数据的位置Mh(1≤h≤n),以确定元组中哪个数据丢失,并输出标记的数据集。输出数据格式为(Ik,Mh,Dj);
步骤1.2),扫描步骤1.1创建的结果文件,以计算不完整数据元组Zj(1≤j≤m) 中的完整数据Rj的组合集合Sj,其结果将用作为估计缺失数据的证据链;输出数据格式为(Ik,Mh,Sj);
步骤1.3),根据完整数据元组和输出数据计算每个缺失元组中缺失值P的可能值的概率P(p);
在公式(1)中,K()表示计数,K(p)表示缺失值p的可能值在每个数据元组中相同缺失位置的出现次数,m表示数据元组的数量;
步骤1.4),对整个数据集中的每个数据元组计算完整数据组合C(y,u)的数据集的数量Oj,并将在以下步骤中用于丢失数据值估计的概率查询中;输出数据格式是(C(y,u),Oj);
步骤1.5),计算同一数据元组中不完整数据元组Zj(1≤j≤m)中的完整数据集 Sj和缺失数据的数量,即Tj;输出格式是(Sj,Mh,Vj(Ai),Tj)
Tj=K(Vj(Ai)(1≤j≤m,1≤i≤n)∪Sj (2)
步骤1.6),将步骤1.2中创建的估计缺失数据的证据链(Ik,Mh,Sj)与步骤1.3中输出的缺失数据的可能值(P,P(p))相关联;每个不完整数据元组Zj(1≤j≤m) 中的缺失数据的相关属性值组合C(y,u)和每个可能的填充值p在整个数据集中同时出现的概率P(p);输出数据格式是(C(y,u),Mh,p,P(p));
步骤1.7),计算不完整数据元组Zj(1≤j≤m)中的相关属性值组合数量Oj,其中缺失数据Vj(Ai)='?'(1≤j≤m,1≤i≤n)根据步骤1.4的结果文件;根据步骤1.5结果文件中的C(y,u)和p,在整个数据集中找到关联属性值组合和缺失数据可能值 p同时出现的次数Tj;根据可信度计算公式,得出缺失数据的证据链来估算缺失数据的插补值计算为:可以得出不完整数据元组Zj(1≤j≤m)中所有缺失数据的估值在相关属性值组合的集合Si的条件下取值的概率,选择置可信度最大的估计值作为最终插补值;
步骤1.8),根据步骤1.7中估算出的缺失数据可能取值,插补到原缺失数据集D中,得到完整缺失数据集。
步骤2),在置信度和支持度的基础上使用关联规则算法,建立证据关联强规则;包括建立条件小训练集,每条规则主体通过选取条件小训练集进行属性连接,最后用实例覆盖小训练集的每个实例,构建高质量分类器。
步骤2)的具体步骤是:
步骤2.1),选取满足支持度的属性值对,构建每个属性值对的小训练集,
事实事实链X→Y的支持度公式:S(X→Y)=P(X,Y)/P(I)=Num(X∪Y)/Num(I)
其中,I表示总的证据事实集合。num()表示求证据集里特定证据集出现的次数。
步骤2.2),从每个训练集里提取好规则,表达式为;
其中|P|和|N|分别表示与当前规则匹配的正实例数和负实例数。当一个属性值加入当前规则后,|P*|和|N*|分别表示与规则匹配的正实例数和负实例数。
步骤2.3),采用实例覆盖技术覆盖小训练集的每个实例,构建具有较高质量的分类器。
具体的流程是:
输入:训练集D=P∪N(P和N分别表示训练集中的正实例集和负实例集);
输出:由一系列规则组成的分类器R。
1 分类器
2 从D里选出支持度为1%的所有属性值对;
3 while对每个属性值对P
4 从训练集创建P的小训练集(P1和N1);
5 规则r←p;
6 while|P1|>1
7 N2←N1;
8 P2←P1;
9 while|N2|>0 and r.length<attribute.length
10 从P2中找出最好的P1;||根据公式:(1)
11 r←p1;
12 从P2和N2中删除与r不匹配的实例;
13 End
14 If con f(r)<0.5or与前期提取规则重复
15 r被剪枝掉;
16 R←R∪r;
17 从P1中删除与r匹配的实例;
18 End
19 End
20 return R
步骤2.1在具体流程中为:第2行~第4行,为每个属性值对创建小训练集,该训练集由正实例P1和负实例N1组成。
步骤2.2在具体流程中为:第9~13行,在该小训练集里提取出最好的规则。
步骤2.3在具体流程中为:第14~17行,减掉置信度不高和重复的规则,将提取到的规则加入分类器中,并删除规则覆盖的实例。
本发明基于证据链的缺失值归算算法具有较高的计算精度,并且随着缺失值的增加或缺失值的位置变化,其计算精度也得到了保证。
本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (3)
1.一种基于关联规则的事实证据链构建方法,其特征在于:包含以下步骤:
步骤1),基于证据链的缺失值归算算法,挖掘每个数据元组中缺失值的所有相关证据,然后结合这些相关证据构建证据链,进一步估计缺失值;
步骤2),在置信度和支持度的基础上使用关联规则算法,建立证据关联强规则;包括建立条件小训练集,每条规则主体通过选取条件小训练集进行属性连接,最后用实例覆盖小训练集的每个实例,构建高质量分类器。
2.根据权利要求1所述的一种基于关联规则的事实证据链构建方法,其特征在于:
步骤1)的具体步骤是:
步骤1.1),为数据集D为每个数据元组Dj确定唯一的标识Ik(1≤k≤m),然后给出每个不完整数据元组的缺失数据的位置Mh(1≤h≤n),以确定元组中哪个数据丢失,并输出标记的数据集。输出数据格式为(Ik,Mh,Dj);
步骤1.2),扫描步骤1.1创建的结果文件,以计算不完整数据元组Zj(1≤j≤m)中的完整数据Rj的组合集合Sj,其结果将用作为估计缺失数据的证据链;输出数据格式为(Ik,Mh,Sj);
步骤1.3),根据完整数据元组和输出数据计算每个缺失元组中缺失值P的可能值的概率P(p);
在公式(1)中,K()表示计数,K(p)表示缺失值p的可能值在每个数据元组中相同缺失位置的出现次数,m表示数据元组的数量;
步骤1.4),对整个数据集中的每个数据元组计算完整数据组合C(y,u)的数据集的数量Oj,并将在以下步骤中用于丢失数据值估计的概率查询中;输出数据格式是(C(y,u),Oj);
步骤1.5),计算同一数据元组中不完整数据元组Zj(1≤j≤m)中的完整数据集Sj和缺失数据的数量,即Tj;输出格式是(Sj,Mh,Vj(Ai),Tj)
Tj=K(Vj(Ai)(1≤j≤m,1≤i≤n)∪Sj(2)
步骤1.6),将步骤1.2中创建的估计缺失数据的证据链(Ik,Mh,Sj)与步骤1.3中输出的缺失数据的可能值(P,P(p))相关联;每个不完整数据元组Zj(1≤j≤m)中的缺失数据的相关属性值组合C(y,u)和每个可能的填充值p在整个数据集中同时出现的概率P(p);输出数据格式是(C(y,u),Mh,p,P(p));
步骤1.7),计算不完整数据元组Zj(1≤j≤m)中的相关属性值组合数量Oj,其中缺失数据Vj(Ai)='?'(1≤j≤m,1≤i≤n)根据步骤1.4的结果文件;根据步骤1.5结果文件中的C(y,u)和p,在整个数据集中找到关联属性值组合和缺失数据可能值p同时出现的次数Tj;根据可信度计算公式,得出缺失数据的证据链来估算缺失数据的插补值计算为:可以得出不完整数据元组Zj(1≤j≤m)中所有缺失数据的估值在相关属性值组合的集合Si的条件下取值的概率,选择置可信度最大的估计值作为最终插补值;
步骤1.8),根据步骤1.7中估算出的缺失数据可能取值,插补到原缺失数据集D中,得到完整缺失数据集。
3.根据权利要求1所述的一种基于关联规则的事实证据链构建方法,其特征在于:
步骤2)的具体步骤是:
步骤2.1),选取满足支持度的属性值对,构建每个属性值对的小训练集,
事实事实链X→Y的支持度公式:S(X→Y)=P(X,Y)/P(I)=Num(X∪Y)/Num(I)
其中,I表示总的证据事实集合。num()表示求证据集里特定证据集出现的次数。
步骤2.2),从每个训练集里提取好规则,表达式为;
其中|P|和|N|分别表示与当前规则匹配的正实例数和负实例数。当一个属性值加入当前规则后,|P*|和|N*|分别表示与规则匹配的正实例数和负实例数。
步骤2.3),采用实例覆盖技术覆盖小训练集的每个实例,构建具有较高质量的分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910666343.4A CN110413658A (zh) | 2019-07-23 | 2019-07-23 | 一种基于关联规则的事实证据链构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910666343.4A CN110413658A (zh) | 2019-07-23 | 2019-07-23 | 一种基于关联规则的事实证据链构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110413658A true CN110413658A (zh) | 2019-11-05 |
Family
ID=68362684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910666343.4A Pending CN110413658A (zh) | 2019-07-23 | 2019-07-23 | 一种基于关联规则的事实证据链构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110413658A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580310A (zh) * | 2020-12-28 | 2021-03-30 | 河北省讯飞人工智能研究院 | 一种缺失字/词的补全方法及电子设备 |
CN112700554A (zh) * | 2020-12-28 | 2021-04-23 | 北京清城睿现数字科技研究院有限公司 | 一种遗址建筑数字复原方法、装置、设备及可读存储介质 |
CN112926659A (zh) * | 2021-02-26 | 2021-06-08 | 平安普惠企业管理有限公司 | 实例异常判定方法、装置、计算机设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103760901A (zh) * | 2013-12-31 | 2014-04-30 | 北京泰乐德信息技术有限公司 | 一种基于关联规则分类器的轨道交通故障识别方法 |
CN105373894A (zh) * | 2015-11-20 | 2016-03-02 | 广州供电局有限公司 | 基于稽查数据的电力营销业务诊断模型的建立方法及系统 |
CN106529580A (zh) * | 2016-10-24 | 2017-03-22 | 浙江工业大学 | 结合edsvm的软件缺陷数据关联分类方法 |
CN106778048A (zh) * | 2017-03-10 | 2017-05-31 | 广州视源电子科技股份有限公司 | 数据处理的方法及装置 |
CN106919719A (zh) * | 2017-03-16 | 2017-07-04 | 南京邮电大学 | 一种面向大数据的信息补全方法 |
CN107704764A (zh) * | 2017-10-18 | 2018-02-16 | 广州华多网络科技有限公司 | 构建训练集的方法、装置、设备及人机识别的方法 |
CN108596758A (zh) * | 2018-05-03 | 2018-09-28 | 湖南大学 | 一种基于归类规则分类器的信用评级方法 |
CN109359176A (zh) * | 2018-09-10 | 2019-02-19 | 平安科技(深圳)有限公司 | 数据提取方法、装置、计算机设备和存储介质 |
-
2019
- 2019-07-23 CN CN201910666343.4A patent/CN110413658A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103760901A (zh) * | 2013-12-31 | 2014-04-30 | 北京泰乐德信息技术有限公司 | 一种基于关联规则分类器的轨道交通故障识别方法 |
CN105373894A (zh) * | 2015-11-20 | 2016-03-02 | 广州供电局有限公司 | 基于稽查数据的电力营销业务诊断模型的建立方法及系统 |
CN106529580A (zh) * | 2016-10-24 | 2017-03-22 | 浙江工业大学 | 结合edsvm的软件缺陷数据关联分类方法 |
CN106778048A (zh) * | 2017-03-10 | 2017-05-31 | 广州视源电子科技股份有限公司 | 数据处理的方法及装置 |
CN106919719A (zh) * | 2017-03-16 | 2017-07-04 | 南京邮电大学 | 一种面向大数据的信息补全方法 |
CN107704764A (zh) * | 2017-10-18 | 2018-02-16 | 广州华多网络科技有限公司 | 构建训练集的方法、装置、设备及人机识别的方法 |
CN108596758A (zh) * | 2018-05-03 | 2018-09-28 | 湖南大学 | 一种基于归类规则分类器的信用评级方法 |
CN109359176A (zh) * | 2018-09-10 | 2019-02-19 | 平安科技(深圳)有限公司 | 数据提取方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
崇卫之: "数据预处理机制的研究与系统构建", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580310A (zh) * | 2020-12-28 | 2021-03-30 | 河北省讯飞人工智能研究院 | 一种缺失字/词的补全方法及电子设备 |
CN112700554A (zh) * | 2020-12-28 | 2021-04-23 | 北京清城睿现数字科技研究院有限公司 | 一种遗址建筑数字复原方法、装置、设备及可读存储介质 |
CN112580310B (zh) * | 2020-12-28 | 2023-04-18 | 河北省讯飞人工智能研究院 | 一种缺失字/词的补全方法及电子设备 |
CN112700554B (zh) * | 2020-12-28 | 2024-04-12 | 北京清城睿现数字科技研究院有限公司 | 一种遗址建筑数字复原方法、装置、设备及可读存储介质 |
CN112926659A (zh) * | 2021-02-26 | 2021-06-08 | 平安普惠企业管理有限公司 | 实例异常判定方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110413658A (zh) | 一种基于关联规则的事实证据链构建方法 | |
CN110781317B (zh) | 事件图谱的构建方法、装置及电子设备 | |
CN105095419B (zh) | 一种面向微博特定类型用户的信息影响力最大化方法 | |
CN103729359B (zh) | 一种推荐搜索词的方法及系统 | |
CN103092911B (zh) | 一种融合社会标签相似度基于k近邻的协同过滤推荐系统 | |
CN103678613B (zh) | 一种计算影响力数据的方法与装置 | |
CN106503148A (zh) | 一种基于多知识库的表格实体链接方法 | |
CN104809117B (zh) | 视频数据聚合处理方法、聚合系统及视频搜索平台 | |
CN107145527A (zh) | 对齐异构社交网络中基于元路径的链路预测方法 | |
CN108829658A (zh) | 新词发现的方法及装置 | |
CN110457404A (zh) | 基于复杂异质网络的社交媒体账户分类方法 | |
CN103218375B (zh) | 一种poi信息补充方法及装置 | |
CN107609103A (zh) | 一种基于推特的事件检测方法 | |
CN111597331A (zh) | 一种基于贝叶斯网络的裁判文书分类方法 | |
CN106650487A (zh) | 基于多维敏感数据发布的多部图隐私保护方法 | |
CN109033132A (zh) | 利用知识图谱计算文本和主体相关度的方法以及装置 | |
CN109754258A (zh) | 一种基于个体行为建模的面向线上交易欺诈检测方法 | |
CN106844673A (zh) | 一种基于公安数据获取多维人员关系亲密度的方法及系统 | |
CN106411572A (zh) | 一种结合节点信息和网络结构的社区发现方法 | |
CN103279483B (zh) | 一种面向微博客的话题流行范围评估方法及系统 | |
CN108764943A (zh) | 基于资金交易网络的可疑用户监测分析方法 | |
CN104731887B (zh) | 一种协同过滤中的用户相似度度量方法 | |
CN103020083B (zh) | 需求识别模板的自动挖掘方法、需求识别方法及对应装置 | |
CN111475739A (zh) | 一种基于元路径的异质社交网络用户锚链接识别方法 | |
CN105589916B (zh) | 显式和隐式兴趣知识的提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191105 |
|
RJ01 | Rejection of invention patent application after publication |