CN110413658A - 一种基于关联规则的事实证据链构建方法 - Google Patents

一种基于关联规则的事实证据链构建方法 Download PDF

Info

Publication number
CN110413658A
CN110413658A CN201910666343.4A CN201910666343A CN110413658A CN 110413658 A CN110413658 A CN 110413658A CN 201910666343 A CN201910666343 A CN 201910666343A CN 110413658 A CN110413658 A CN 110413658A
Authority
CN
China
Prior art keywords
data
missing
evidence
chain
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910666343.4A
Other languages
English (en)
Inventor
柳畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongjing Baicheng Technology (beijing) Co Ltd
Original Assignee
Zhongjing Baicheng Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongjing Baicheng Technology (beijing) Co Ltd filed Critical Zhongjing Baicheng Technology (beijing) Co Ltd
Priority to CN201910666343.4A priority Critical patent/CN110413658A/zh
Publication of CN110413658A publication Critical patent/CN110413658A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于关联规则的事实证据链构建方法,包含以下步骤:步骤1),基于证据链的缺失值归算算法,挖掘每个数据元组中缺失值的所有相关证据,然后结合这些相关证据构建证据链,进一步估计缺失值;步骤2),在置信度和支持度的基础上使用关联规则算法,建立证据关联强规则;包括建立条件小训练集,每条规则主体通过选取条件小训练集进行属性连接,最后用实例覆盖小训练集的每个实例,构建高质量分类器。本发明基于证据链的缺失值归算算法具有较高的计算精度,并且随着缺失值的增加或缺失值的位置变化,其计算精度也得到了保证。

Description

一种基于关联规则的事实证据链构建方法
技术领域
本发明属于诉讼服务研究领域的数据挖掘技术领域,更具体地说,涉及一种基于关联规则的事实证据链构建方法。
背景技术
当事人负有对自己的诉讼主张提供适当证据予以证明的责任,如果未能及时提供证据或提供的证据不能足以支持其所主张的事实,那么将要承担该主张不能成立的风险。以民间借贷为例,通过调研案例,目前民间借贷纠纷中大多采用借条或借款合同的形式,但是问题仍有很多,如未表明借款条据的性质、债务人借款目的、实际收款方式,借款金额及期限仅用阿拉伯数字表示,送达地址不明确等,这些未标明或不明确的瑕疵造成债权人在维权的过程中,需要提供相应的证据,才能相互印证,形成完整的证据链。
证据链的构建对于案件事实的证明极为重要,它并不是证据的简单叠加,而是对证据的逻辑排列,证明案件事实的证据不仅需要互相印证,还需以一定的形式形成一个证据锁链来共同证明案件事实。
目前已有的相似技术,主要面向裁判文书基于对证据链的提取与分析,研究遵循法言法语及文书说理的自然语言处理技术,抽取裁判文书说理的相关语段,逆向构建证据链和文书说理逻辑关系,并通过计算机程序绘制可视化的证据链与文书说理逻辑图。
在实际应用中,该技术除极少数直接证据之外,绝大多数证据不可能与事实直接关联,意味着组合使用才能形成稳定牢固“链接”关系的两个及以上证据无法进行相互排列组合。
发明内容
针对现有技术存在的不足,本发明的目的在于提供了一种基于关联规则的事实证据链构建方法,设计合理,采用的是自动提取证据强规则、过滤弱规则的方法,最终建立一种基于关联规则的事实证据链构建方法,克服了现有证据链构建中两个及以上关系的“链接”无法进行逻辑组合的缺陷。
为实现上述目的,本发明提供了如下技术方案:
一种基于关联规则的事实证据链构建方法,其特征在于:包含以下步骤:
步骤1),基于证据链的缺失值归算算法,挖掘每个数据元组中缺失值的所有相关证据,然后结合这些相关证据构建证据链,进一步估计缺失值;
步骤2),在置信度和支持度的基础上使用关联规则算法,建立证据关联强规则;包括建立条件小训练集,每条规则主体通过选取条件小训练集进行属性连接,最后用实例覆盖小训练集的每个实例,构建高质量分类器。
作为一种优化的技术方案,步骤1)的具体步骤是:
步骤1.1),为数据集D为每个数据元组Dj确定唯一的标识Ik(1≤k≤m),然后给出每个不完整数据元组的缺失数据的位置Mh(1≤h≤n),以确定元组中哪个数据丢失,并输出标记的数据集。输出数据格式为(Ik,Mh,Dj);
步骤1.2),扫描步骤1.1创建的结果文件,以计算不完整数据元组Zj(1≤j≤m) 中的完整数据Rj的组合集合Sj,其结果将用作为估计缺失数据的证据链;输出数据格式为(Ik,Mh,Sj);
步骤1.3),根据完整数据元组和输出数据计算每个缺失元组中缺失值P的可能值的概率P(p);
在公式(1)中,K()表示计数,K(p)表示缺失值p的可能值在每个数据元组中相同缺失位置的出现次数,m表示数据元组的数量;
步骤1.4),对整个数据集中的每个数据元组计算完整数据组合C(y,u)的数据集的数量Oj,并将在以下步骤中用于丢失数据值估计的概率查询中;输出数据格式是(C(y,u),Oj);
步骤1.5),计算同一数据元组中不完整数据元组Zj(1≤j≤m)中的完整数据集 Sj和缺失数据的数量,即Tj;输出格式是(Sj,Mh,Vj(Ai),Tj)
Tj=K(Vj(Ai)(1≤j≤m,1≤i≤n)∪Sj(2)
步骤1.6),将步骤1.2中创建的估计缺失数据的证据链(Ik,Mh,Sj)与步骤1.3中输出的缺失数据的可能值(P,P(p))相关联;每个不完整数据元组Zj(1≤j≤m) 中的缺失数据的相关属性值组合C(y,u)和每个可能的填充值p在整个数据集中同时出现的概率P(p);输出数据格式是(C(y,u),Mh,p,P(p));
步骤1.7),计算不完整数据元组Zj(1≤j≤m)中的相关属性值组合数量Oj,其中缺失数据Vj(Ai)='?'(1≤j≤m,1≤i≤n)根据步骤1.4的结果文件;根据步骤1.5结果文件中的C(y,u)和p,在整个数据集中找到关联属性值组合和缺失数据可能值 p同时出现的次数Tj;根据可信度计算公式,得出缺失数据的证据链来估算缺失数据的插补值计算为:可以得出不完整数据元组Zj(1≤j≤m)中所有缺失数据的估值在相关属性值组合的集合Si的条件下取值的概率,选择置可信度最大的估计值作为最终插补值;
步骤1.8),根据步骤1.7中估算出的缺失数据可能取值,插补到原缺失数据集D中,得到完整缺失数据集。如图1所示。
作为一种优化的技术方案,步骤2)的具体步骤是:
步骤2.1),选取满足支持度的属性值对,构建每个属性值对的小训练集,
事实事实链X→Y的支持度公式:S(X→Y)=P(X,Y)/P(I)=Num(X∪Y)/Num(I)
其中,I表示总的证据事实集合。num()表示求证据集里特定证据集出现的次数。
步骤2.2),从每个训练集里提取好规则,表达式为;
其中|P|和|N|分别表示与当前规则匹配的正实例数和负实例数。当一个属性值加入当前规则后,|P*|和|N*|分别表示与规则匹配的正实例数和负实例数。
步骤2.3),采用实例覆盖技术覆盖小训练集的每个实例,构建具有较高质量的分类器。
由于采用了上述技术方案,与现有技术相比,本发明基于证据链的缺失值归算算法具有较高的计算精度,并且随着缺失值的增加或缺失值的位置变化,其计算精度也得到了保证。
附图说明
图1为本发明一种实施例中的算法时序图。
具体实施方式
实施例
一种基于关联规则的事实证据链构建方法,包含以下步骤:
步骤1),基于证据链的缺失值归算算法,挖掘每个数据元组中缺失值的所有相关证据,然后结合这些相关证据构建证据链,进一步估计缺失值。
如图1所示,步骤1)的具体步骤是:
步骤1.1),为数据集D为每个数据元组Dj确定唯一的标识Ik(1≤k≤m),然后给出每个不完整数据元组的缺失数据的位置Mh(1≤h≤n),以确定元组中哪个数据丢失,并输出标记的数据集。输出数据格式为(Ik,Mh,Dj);
步骤1.2),扫描步骤1.1创建的结果文件,以计算不完整数据元组Zj(1≤j≤m) 中的完整数据Rj的组合集合Sj,其结果将用作为估计缺失数据的证据链;输出数据格式为(Ik,Mh,Sj);
步骤1.3),根据完整数据元组和输出数据计算每个缺失元组中缺失值P的可能值的概率P(p);
在公式(1)中,K()表示计数,K(p)表示缺失值p的可能值在每个数据元组中相同缺失位置的出现次数,m表示数据元组的数量;
步骤1.4),对整个数据集中的每个数据元组计算完整数据组合C(y,u)的数据集的数量Oj,并将在以下步骤中用于丢失数据值估计的概率查询中;输出数据格式是(C(y,u),Oj);
步骤1.5),计算同一数据元组中不完整数据元组Zj(1≤j≤m)中的完整数据集 Sj和缺失数据的数量,即Tj;输出格式是(Sj,Mh,Vj(Ai),Tj)
Tj=K(Vj(Ai)(1≤j≤m,1≤i≤n)∪Sj (2)
步骤1.6),将步骤1.2中创建的估计缺失数据的证据链(Ik,Mh,Sj)与步骤1.3中输出的缺失数据的可能值(P,P(p))相关联;每个不完整数据元组Zj(1≤j≤m) 中的缺失数据的相关属性值组合C(y,u)和每个可能的填充值p在整个数据集中同时出现的概率P(p);输出数据格式是(C(y,u),Mh,p,P(p));
步骤1.7),计算不完整数据元组Zj(1≤j≤m)中的相关属性值组合数量Oj,其中缺失数据Vj(Ai)='?'(1≤j≤m,1≤i≤n)根据步骤1.4的结果文件;根据步骤1.5结果文件中的C(y,u)和p,在整个数据集中找到关联属性值组合和缺失数据可能值 p同时出现的次数Tj;根据可信度计算公式,得出缺失数据的证据链来估算缺失数据的插补值计算为:可以得出不完整数据元组Zj(1≤j≤m)中所有缺失数据的估值在相关属性值组合的集合Si的条件下取值的概率,选择置可信度最大的估计值作为最终插补值;
步骤1.8),根据步骤1.7中估算出的缺失数据可能取值,插补到原缺失数据集D中,得到完整缺失数据集。
步骤2),在置信度和支持度的基础上使用关联规则算法,建立证据关联强规则;包括建立条件小训练集,每条规则主体通过选取条件小训练集进行属性连接,最后用实例覆盖小训练集的每个实例,构建高质量分类器。
步骤2)的具体步骤是:
步骤2.1),选取满足支持度的属性值对,构建每个属性值对的小训练集,
事实事实链X→Y的支持度公式:S(X→Y)=P(X,Y)/P(I)=Num(X∪Y)/Num(I)
其中,I表示总的证据事实集合。num()表示求证据集里特定证据集出现的次数。
步骤2.2),从每个训练集里提取好规则,表达式为;
其中|P|和|N|分别表示与当前规则匹配的正实例数和负实例数。当一个属性值加入当前规则后,|P*|和|N*|分别表示与规则匹配的正实例数和负实例数。
步骤2.3),采用实例覆盖技术覆盖小训练集的每个实例,构建具有较高质量的分类器。
具体的流程是:
输入:训练集D=P∪N(P和N分别表示训练集中的正实例集和负实例集);
输出:由一系列规则组成的分类器R。
1 分类器
2 从D里选出支持度为1%的所有属性值对;
3 while对每个属性值对P
4 从训练集创建P的小训练集(P1和N1);
5 规则r←p;
6 while|P1|>1
7 N2←N1;
8 P2←P1;
9 while|N2|>0 and r.length<attribute.length
10 从P2中找出最好的P1;||根据公式:(1)
11 r←p1;
12 从P2和N2中删除与r不匹配的实例;
13 End
14 If con f(r)<0.5or与前期提取规则重复
15 r被剪枝掉;
16 R←R∪r;
17 从P1中删除与r匹配的实例;
18 End
19 End
20 return R
步骤2.1在具体流程中为:第2行~第4行,为每个属性值对创建小训练集,该训练集由正实例P1和负实例N1组成。
步骤2.2在具体流程中为:第9~13行,在该小训练集里提取出最好的规则。
步骤2.3在具体流程中为:第14~17行,减掉置信度不高和重复的规则,将提取到的规则加入分类器中,并删除规则覆盖的实例。
本发明基于证据链的缺失值归算算法具有较高的计算精度,并且随着缺失值的增加或缺失值的位置变化,其计算精度也得到了保证。
本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (3)

1.一种基于关联规则的事实证据链构建方法,其特征在于:包含以下步骤:
步骤1),基于证据链的缺失值归算算法,挖掘每个数据元组中缺失值的所有相关证据,然后结合这些相关证据构建证据链,进一步估计缺失值;
步骤2),在置信度和支持度的基础上使用关联规则算法,建立证据关联强规则;包括建立条件小训练集,每条规则主体通过选取条件小训练集进行属性连接,最后用实例覆盖小训练集的每个实例,构建高质量分类器。
2.根据权利要求1所述的一种基于关联规则的事实证据链构建方法,其特征在于:
步骤1)的具体步骤是:
步骤1.1),为数据集D为每个数据元组Dj确定唯一的标识Ik(1≤k≤m),然后给出每个不完整数据元组的缺失数据的位置Mh(1≤h≤n),以确定元组中哪个数据丢失,并输出标记的数据集。输出数据格式为(Ik,Mh,Dj);
步骤1.2),扫描步骤1.1创建的结果文件,以计算不完整数据元组Zj(1≤j≤m)中的完整数据Rj的组合集合Sj,其结果将用作为估计缺失数据的证据链;输出数据格式为(Ik,Mh,Sj);
步骤1.3),根据完整数据元组和输出数据计算每个缺失元组中缺失值P的可能值的概率P(p);
在公式(1)中,K()表示计数,K(p)表示缺失值p的可能值在每个数据元组中相同缺失位置的出现次数,m表示数据元组的数量;
步骤1.4),对整个数据集中的每个数据元组计算完整数据组合C(y,u)的数据集的数量Oj,并将在以下步骤中用于丢失数据值估计的概率查询中;输出数据格式是(C(y,u),Oj);
步骤1.5),计算同一数据元组中不完整数据元组Zj(1≤j≤m)中的完整数据集Sj和缺失数据的数量,即Tj;输出格式是(Sj,Mh,Vj(Ai),Tj)
Tj=K(Vj(Ai)(1≤j≤m,1≤i≤n)∪Sj(2)
步骤1.6),将步骤1.2中创建的估计缺失数据的证据链(Ik,Mh,Sj)与步骤1.3中输出的缺失数据的可能值(P,P(p))相关联;每个不完整数据元组Zj(1≤j≤m)中的缺失数据的相关属性值组合C(y,u)和每个可能的填充值p在整个数据集中同时出现的概率P(p);输出数据格式是(C(y,u),Mh,p,P(p));
步骤1.7),计算不完整数据元组Zj(1≤j≤m)中的相关属性值组合数量Oj,其中缺失数据Vj(Ai)='?'(1≤j≤m,1≤i≤n)根据步骤1.4的结果文件;根据步骤1.5结果文件中的C(y,u)和p,在整个数据集中找到关联属性值组合和缺失数据可能值p同时出现的次数Tj;根据可信度计算公式,得出缺失数据的证据链来估算缺失数据的插补值计算为:可以得出不完整数据元组Zj(1≤j≤m)中所有缺失数据的估值在相关属性值组合的集合Si的条件下取值的概率,选择置可信度最大的估计值作为最终插补值;
步骤1.8),根据步骤1.7中估算出的缺失数据可能取值,插补到原缺失数据集D中,得到完整缺失数据集。
3.根据权利要求1所述的一种基于关联规则的事实证据链构建方法,其特征在于:
步骤2)的具体步骤是:
步骤2.1),选取满足支持度的属性值对,构建每个属性值对的小训练集,
事实事实链X→Y的支持度公式:S(X→Y)=P(X,Y)/P(I)=Num(X∪Y)/Num(I)
其中,I表示总的证据事实集合。num()表示求证据集里特定证据集出现的次数。
步骤2.2),从每个训练集里提取好规则,表达式为;
其中|P|和|N|分别表示与当前规则匹配的正实例数和负实例数。当一个属性值加入当前规则后,|P*|和|N*|分别表示与规则匹配的正实例数和负实例数。
步骤2.3),采用实例覆盖技术覆盖小训练集的每个实例,构建具有较高质量的分类器。
CN201910666343.4A 2019-07-23 2019-07-23 一种基于关联规则的事实证据链构建方法 Pending CN110413658A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910666343.4A CN110413658A (zh) 2019-07-23 2019-07-23 一种基于关联规则的事实证据链构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910666343.4A CN110413658A (zh) 2019-07-23 2019-07-23 一种基于关联规则的事实证据链构建方法

Publications (1)

Publication Number Publication Date
CN110413658A true CN110413658A (zh) 2019-11-05

Family

ID=68362684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910666343.4A Pending CN110413658A (zh) 2019-07-23 2019-07-23 一种基于关联规则的事实证据链构建方法

Country Status (1)

Country Link
CN (1) CN110413658A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580310A (zh) * 2020-12-28 2021-03-30 河北省讯飞人工智能研究院 一种缺失字/词的补全方法及电子设备
CN112700554A (zh) * 2020-12-28 2021-04-23 北京清城睿现数字科技研究院有限公司 一种遗址建筑数字复原方法、装置、设备及可读存储介质
CN112926659A (zh) * 2021-02-26 2021-06-08 平安普惠企业管理有限公司 实例异常判定方法、装置、计算机设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103760901A (zh) * 2013-12-31 2014-04-30 北京泰乐德信息技术有限公司 一种基于关联规则分类器的轨道交通故障识别方法
CN105373894A (zh) * 2015-11-20 2016-03-02 广州供电局有限公司 基于稽查数据的电力营销业务诊断模型的建立方法及系统
CN106529580A (zh) * 2016-10-24 2017-03-22 浙江工业大学 结合edsvm的软件缺陷数据关联分类方法
CN106778048A (zh) * 2017-03-10 2017-05-31 广州视源电子科技股份有限公司 数据处理的方法及装置
CN106919719A (zh) * 2017-03-16 2017-07-04 南京邮电大学 一种面向大数据的信息补全方法
CN107704764A (zh) * 2017-10-18 2018-02-16 广州华多网络科技有限公司 构建训练集的方法、装置、设备及人机识别的方法
CN108596758A (zh) * 2018-05-03 2018-09-28 湖南大学 一种基于归类规则分类器的信用评级方法
CN109359176A (zh) * 2018-09-10 2019-02-19 平安科技(深圳)有限公司 数据提取方法、装置、计算机设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103760901A (zh) * 2013-12-31 2014-04-30 北京泰乐德信息技术有限公司 一种基于关联规则分类器的轨道交通故障识别方法
CN105373894A (zh) * 2015-11-20 2016-03-02 广州供电局有限公司 基于稽查数据的电力营销业务诊断模型的建立方法及系统
CN106529580A (zh) * 2016-10-24 2017-03-22 浙江工业大学 结合edsvm的软件缺陷数据关联分类方法
CN106778048A (zh) * 2017-03-10 2017-05-31 广州视源电子科技股份有限公司 数据处理的方法及装置
CN106919719A (zh) * 2017-03-16 2017-07-04 南京邮电大学 一种面向大数据的信息补全方法
CN107704764A (zh) * 2017-10-18 2018-02-16 广州华多网络科技有限公司 构建训练集的方法、装置、设备及人机识别的方法
CN108596758A (zh) * 2018-05-03 2018-09-28 湖南大学 一种基于归类规则分类器的信用评级方法
CN109359176A (zh) * 2018-09-10 2019-02-19 平安科技(深圳)有限公司 数据提取方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
崇卫之: "数据预处理机制的研究与系统构建", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580310A (zh) * 2020-12-28 2021-03-30 河北省讯飞人工智能研究院 一种缺失字/词的补全方法及电子设备
CN112700554A (zh) * 2020-12-28 2021-04-23 北京清城睿现数字科技研究院有限公司 一种遗址建筑数字复原方法、装置、设备及可读存储介质
CN112580310B (zh) * 2020-12-28 2023-04-18 河北省讯飞人工智能研究院 一种缺失字/词的补全方法及电子设备
CN112700554B (zh) * 2020-12-28 2024-04-12 北京清城睿现数字科技研究院有限公司 一种遗址建筑数字复原方法、装置、设备及可读存储介质
CN112926659A (zh) * 2021-02-26 2021-06-08 平安普惠企业管理有限公司 实例异常判定方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN110413658A (zh) 一种基于关联规则的事实证据链构建方法
CN110781317B (zh) 事件图谱的构建方法、装置及电子设备
CN105095419B (zh) 一种面向微博特定类型用户的信息影响力最大化方法
CN103729359B (zh) 一种推荐搜索词的方法及系统
CN103092911B (zh) 一种融合社会标签相似度基于k近邻的协同过滤推荐系统
CN103678613B (zh) 一种计算影响力数据的方法与装置
CN106503148A (zh) 一种基于多知识库的表格实体链接方法
CN104809117B (zh) 视频数据聚合处理方法、聚合系统及视频搜索平台
CN107145527A (zh) 对齐异构社交网络中基于元路径的链路预测方法
CN108829658A (zh) 新词发现的方法及装置
CN110457404A (zh) 基于复杂异质网络的社交媒体账户分类方法
CN103218375B (zh) 一种poi信息补充方法及装置
CN107609103A (zh) 一种基于推特的事件检测方法
CN111597331A (zh) 一种基于贝叶斯网络的裁判文书分类方法
CN106650487A (zh) 基于多维敏感数据发布的多部图隐私保护方法
CN109033132A (zh) 利用知识图谱计算文本和主体相关度的方法以及装置
CN109754258A (zh) 一种基于个体行为建模的面向线上交易欺诈检测方法
CN106844673A (zh) 一种基于公安数据获取多维人员关系亲密度的方法及系统
CN106411572A (zh) 一种结合节点信息和网络结构的社区发现方法
CN103279483B (zh) 一种面向微博客的话题流行范围评估方法及系统
CN108764943A (zh) 基于资金交易网络的可疑用户监测分析方法
CN104731887B (zh) 一种协同过滤中的用户相似度度量方法
CN103020083B (zh) 需求识别模板的自动挖掘方法、需求识别方法及对应装置
CN111475739A (zh) 一种基于元路径的异质社交网络用户锚链接识别方法
CN105589916B (zh) 显式和隐式兴趣知识的提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191105

RJ01 Rejection of invention patent application after publication