CN113641772A - 一种海量地理数据异常检测场景中的检测方法 - Google Patents

一种海量地理数据异常检测场景中的检测方法 Download PDF

Info

Publication number
CN113641772A
CN113641772A CN202110922698.2A CN202110922698A CN113641772A CN 113641772 A CN113641772 A CN 113641772A CN 202110922698 A CN202110922698 A CN 202110922698A CN 113641772 A CN113641772 A CN 113641772A
Authority
CN
China
Prior art keywords
abnormal
data
feature
geographic data
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110922698.2A
Other languages
English (en)
Other versions
CN113641772B (zh
Inventor
朱与墨
田鹏飞
储鑫淼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yijing Zhilian Beijing Technology Co Ltd
Original Assignee
Yijing Zhilian Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yijing Zhilian Beijing Technology Co Ltd filed Critical Yijing Zhilian Beijing Technology Co Ltd
Priority to CN202110922698.2A priority Critical patent/CN113641772B/zh
Publication of CN113641772A publication Critical patent/CN113641772A/zh
Application granted granted Critical
Publication of CN113641772B publication Critical patent/CN113641772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种海量地理数据异常检测场景中的检测方法,包括如下步骤:S1、海量数据特征处理;S2、构建异常检测模型;S3、输出异常数据,本发明基于孤立隔离法进行无监督异常检测处理,充分利用地理空间数据中矢量特征与连续特征的差异性引入不同的计算因子进行残差分析,优化异常检测模型的准确率,通过特征降维与特征转换将地理数据巧妙映射至二维,减少计算资源,使模型计算效率提升,实现了海量地理数据异常检测的目标,相比于传统的地理异常检测器与人工区域抽样检测方式,本异常检测模型检测出的异常样本更加高效与合理,并在极海量数据场景下效果更加合理且灵活,使数据评估与修复更加智能化,可谓一举多得之法。

Description

一种海量地理数据异常检测场景中的检测方法
技术领域
本发明涉及机器学习及空间数据异常检测技术领域,具体为一种海量地理数据异常检测场景中的检测方法。
背景技术
孤立隔离算法又称孤立隔离树,目前学术界对异常的定义存在多种分类,而数据源的差异与数据使用场景的变迁使异常检测方法也会有所不同,通过优化孤立隔离法,将容易被孤立的离群点逐步转化为在二维空间中分布稀疏且密度高的离群体较远的点位,从而表现出在特征空间中,分布稀疏的区域表示事件发生在该区域的概率很低,因而便可认为落在这些区域中的数据是异常;
利用机器学习中无监督学习的方法对海量地理数据进行异常检测预估,此方法可应用于数据评估场景,可以有效降低针对地理数据的评估成本,并结合异常检测分析从而极大提升线上海量地理数据的置信度与准确度,并可根据不同地理数据使用场景不断更新训练集与优化参数,但是目前缺少将海量地理数据通过智能化进行异常检测评估的方法。
发明内容
本发明提供一种海量地理数据异常检测场景中的检测方法,可以有效解决上述背景技术中提出如何将海量地理数据通过智能化进行异常检测评估的问题。
为实现上述目的,本发明提供如下技术方案:一种海量地理数据异常检测场景中的检测方法,包括如下步骤:
S1、海量数据特征处理;
S2、构建异常检测模型;
S3、输出异常数据。
根据上述技术方案,所述S1中,海量数据特征处理是指对获取的海量地理数据进行预处理,具体包括对海量地理数据进行特征切分、特征聚合和特征连续化处理;
在对海量地理数据进行特征切分和特征聚合处理后,通过对海量地理数据进行特征连续化的转化处理,实现将离散化的特征变换为连续化的特征。
根据上述技术方案,所述S2中,构建异常检测模型具体包括如下步骤:
A、构建孤立隔离树;
B、计算异常分数;
C、测试异常分数排序。
根据上述技术方案,所述A中,构建孤立隔离树是指在对数据特征进行连续化处理后,通过递归随机分割的方式建立完整的孤立隔离树,再利用构建的孤立隔离树(iTree)来对特征的相关性进行验证;
在具体的验证过程中,假设T是孤立隔离树中没有子节点的叶子节点或者是只有两个子节点(T1,Tn)的内部节点,每一步分割,都包含特征q和分割值p,将q<p<p的数据分到T1,将q≥p≥p的数据分到Tn。
根据上述技术方案,在步骤A中的验证过程中,给定n个样本数据集X={x1,…,xn},特征的维度为dd,为了构建一棵孤立隔离树,需要随机选择一个特征m及其分割值d,递归地分割样本数据集X,直到满足以下任意一个条件:
(1)、孤立隔离树达到了限制的高度;
(2)、节点上只有一个样本;
(3)、节点上的样本所有特征都相同。
根据上述技术方案,所述B中,计算异常分数是指在评判地理数据是否为异常值时,数据的异常分数将会切分成两部分进行:
(1)、连续特征异常检测因子;
(2)、矢量特征异常检测因子;
连续特征异常检测因子与样本集的孤立隔离树的平均路径长度成正相关,由此孤立隔离树平均路径长度便可通过公式进行计算。
根据上述技术方案,在步骤B中通过公式计算孤立隔离树平均路径长度时,假设给定一个包含m个样本的样本集,则孤立隔离树的平均路径长度的计算公式为:
c(m)=2F(m-1)-2(m-1)×m-1
在式中,F(m)为调和数,该值可以被估计为:ln(m)+0.5772156649,c(m)为给定样本数m时,孤立隔离树路径的长度平均值,用来标准化样本x的路径长度f(x),从而使连续特征的异常得分定义为:
Figure BDA0003207997210000031
从而生成连续特征异常分数。
根据上述技术方案,所述C中,在测试异常分数的排序时,通过矢量特征异常检测因子与球面欧几里得的距离算法结果成正相关的关系,将矢量特征属性获取质心再带入以下欧几里得的公式:
Figure BDA0003207997210000041
获得矢量特征的异常因子比。
根据上述技术方案,在步骤C中,通过公式获得矢量特征的异常因子比后,再将其通过统计映射的方法转换至异常分数区间,并将连续特征异常分数与矢量特征异常分数求和,从而获得地理数据异常检测分数;
再根据地理数据异常检测分数来进行排序,并利用映射分析可迅速识别出可能异常的数据。
根据上述技术方案,所述S3中,输出异常数据是指通过离群残差计算构建异常分数来进行异常分数排序,以此来筛选出可能异常的数据其异常特征,最后将筛选出的异常数据和异常特征输出即可。
与现有技术相比,本发明的有益效果:
本发明基于孤立隔离法进行无监督异常检测处理,能够充分利用地理空间数据中矢量特征与连续特征的差异性引入不同的计算因子进行残差分析,优化异常检测模型的准确率,通过特征降维与特征转换将地理数据巧妙映射至二维,减少计算资源,使模型计算效率大大提升,达到了海量地理数据异常检测的目标,实现了集成多种特征工程算法与空间距离算法的方式,通过聚合多种空间距离计算方法来提升准确度;
并且,本发明相比于传统的地理异常检测器与人工区域抽样检测方式,通过本异常检测模型检测出的异常样本更加高效与合理,并在极海量数据场景下效果更加合理且灵活,使数据评估与修复更加智能化,可谓一举多得之法。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明检测方法的流程框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:如图1所示,本发明提供一种技术方案,一种海量地理数据异常检测场景中的检测方法,包括如下步骤:
S1、海量数据特征处理;
S2、构建异常检测模型;
S3、输出异常数据。
基于上述技术方案,S1中,海量数据特征处理是指对获取的海量地理数据进行预处理,具体包括对海量地理数据进行特征切分、特征聚合和特征连续化处理;
在对海量地理数据进行特征切分和特征聚合处理后,通过对海量地理数据进行特征连续化的转化处理,实现将离散化的特征变换为连续化的特征。
基于上述技术方案,S2中,构建异常检测模型具体包括如下步骤:
A、构建孤立隔离树;
B、计算异常分数;
C、测试异常分数排序。
基于上述技术方案,A中,构建孤立隔离树是指在对数据特征进行连续化处理后,通过递归随机分割的方式建立完整的孤立隔离树,再利用构建的孤立隔离树(iTree)来对特征的相关性进行验证;
在具体的验证过程中,假设T是孤立隔离树中的一个没有子节点的叶子节点,每一步分割,都包含特征q和分割值p,将q<p<p的数据分到T1,将q≥p≥p的数据分到Tn。
基于上述技术方案,在步骤A中的验证过程中,给定n个样本数据集X={x1,…,xn},特征的维度为dd,为了构建一棵孤立隔离树,需要随机选择一个特征m及其分割值d,递归地分割样本数据集X,直到满足以下任意一个条件:
(1)、孤立隔离树达到了限制的高度;
(2)、节点上只有一个样本;
(3)、节点上的样本所有特征都相同。
基于上述技术方案,B中,计算异常分数是指在评判地理数据是否为异常值时,数据的异常分数将会切分成两部分进行:
(1)、连续特征异常检测因子;
(2)、矢量特征异常检测因子;
连续特征异常检测因子与样本集的孤立隔离树的平均路径长度成正相关,由此孤立隔离树平均路径长度便可通过公式进行计算。
基于上述技术方案,在步骤B中通过公式计算孤立隔离树平均路径长度时,假设给定一个包含m个样本的样本集,则孤立隔离树的平均路径长度的计算公式为:
c(m)=2F(m-1)-2(m-1)×m-1
在式中,F(m)为调和数,该值可以被估计为:ln(m)+0.5772156649,c(m)为给定样本数m时,孤立隔离树路径的长度平均值,用来标准化样本x的路径长度f(x),从而使连续特征的异常得分定义为:
Figure BDA0003207997210000071
从而生成连续特征异常分数。
基于上述技术方案,C中,在测试异常分数的排序时,通过矢量特征异常检测因子与球面欧几里得的距离算法结果成正相关的关系,将矢量特征属性获取质心再带入以下欧几里得的公式:
Figure BDA0003207997210000072
获得矢量特征的异常因子比。
基于上述技术方案,在步骤C中,通过公式获得矢量特征的异常因子比后,再将其通过统计映射的方法转换至异常分数区间,并将连续特征异常分数与矢量特征异常分数求和,从而获得地理数据异常检测分数;
再根据地理数据异常检测分数来进行排序,并利用映射分析可迅速识别出可能异常的数据。
基于上述技术方案,S3中,输出异常数据是指通过离群残差计算构建异常分数来进行异常分数排序,以此来筛选出可能异常的数据其异常特征,最后将筛选出的异常数据和异常特征输出即可。
实施例2:如图1所示,本发明提供一种技术方案,一种海量地理数据异常检测场景中的检测方法,包括如下步骤:
S1、海量数据特征处理;
S2、构建异常检测模型;
S3、输出异常数据。
基于上述技术方案,S1中,海量数据特征处理是指对获取的海量地理数据进行预处理,具体包括对海量地理数据进行特征切分、特征聚合和特征连续化处理;
在对海量地理数据进行特征切分和特征聚合处理后,通过对海量地理数据进行特征连续化的转化处理,实现将离散化的特征变换为连续化的特征。
基于上述技术方案,S2中,构建异常检测模型具体包括如下步骤:
A、构建孤立隔离树;
B、计算异常分数;
C、测试异常分数排序。
基于上述技术方案,A中,构建孤立隔离树是指在对数据特征进行连续化处理后,通过递归随机分割的方式建立完整的孤立隔离树,再利用构建的孤立隔离树(iTree)来对特征的相关性进行验证;
在具体的验证过程中,假设T是孤立隔离树中的一个只有两个子节点(T1,Tn)的内部节点,每一步分割,都包含特征q和分割值p,将q<p<p的数据分到T1,将q≥p≥p的数据分到Tn。
基于上述技术方案,在步骤A中的验证过程中,给定n个样本数据集X={x1,…,xn},特征的维度为dd,为了构建一棵孤立隔离树,需要随机选择一个特征m及其分割值d,递归地分割样本数据集X,直到满足以下任意一个条件:
(1)、孤立隔离树达到了限制的高度;
(2)、节点上只有一个样本;
(3)、节点上的样本所有特征都相同。
基于上述技术方案,B中,计算异常分数是指在评判地理数据是否为异常值时,数据的异常分数将会切分成两部分进行:
(1)、连续特征异常检测因子;
(2)、矢量特征异常检测因子;
连续特征异常检测因子与样本集的孤立隔离树的平均路径长度成正相关,由此孤立隔离树平均路径长度便可通过公式进行计算。
基于上述技术方案,在步骤B中通过公式计算孤立隔离树平均路径长度时,假设给定一个包含m个样本的样本集,则孤立隔离树的平均路径长度的计算公式为:
c(m)=2F(m-1)-2(m-1)×m-1
在式中,F(m)为调和数,该值可以被估计为:ln(m)+0.5772156649,c(m)为给定样本数m时,孤立隔离树路径的长度平均值,用来标准化样本x的路径长度f(x),从而使连续特征的异常得分定义为:
Figure BDA0003207997210000101
从而生成连续特征异常分数。
基于上述技术方案,C中,在测试异常分数的排序时,通过矢量特征异常检测因子与球面欧几里得的距离算法结果成正相关的关系,将矢量特征属性获取质心再带入以下欧几里得的公式:
Figure BDA0003207997210000102
获得矢量特征的异常因子比。
基于上述技术方案,在步骤C中,通过公式获得矢量特征的异常因子比后,再将其通过统计映射的方法转换至异常分数区间,并将连续特征异常分数与矢量特征异常分数求和,从而获得地理数据异常检测分数;
再根据地理数据异常检测分数来进行排序,并利用映射分析可迅速识别出可能异常的数据。
基于上述技术方案,S3中,输出异常数据是指通过离群残差计算构建异常分数来进行异常分数排序,以此来筛选出可能异常的数据其异常特征,最后将筛选出的异常数据和异常特征输出即可。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种海量地理数据异常检测场景中的检测方法,其特征在于:包括如下步骤:
S1、海量数据特征处理;
S2、构建异常检测模型;
S3、输出异常数据。
2.根据权利要求1所述的一种海量地理数据异常检测场景中的检测方法,其特征在于:所述S1中,海量数据特征处理是指对获取的海量地理数据进行预处理,具体包括对海量地理数据进行特征切分、特征聚合和特征连续化处理;
在对海量地理数据进行特征切分和特征聚合处理后,通过对海量地理数据进行特征连续化的转化处理,实现将离散化的特征变换为连续化的特征。
3.根据权利要求1所述的一种海量地理数据异常检测场景中的检测方法,其特征在于:所述S2中,构建异常检测模型具体包括如下步骤:
A、构建孤立隔离树;
B、计算异常分数;
C、测试异常分数排序。
4.根据权利要求3所述的一种海量地理数据异常检测场景中的检测方法,其特征在于:所述A中,构建孤立隔离树是指在对数据特征进行连续化处理后,通过递归随机分割的方式建立完整的孤立隔离树,再利用构建的孤立隔离树(iTree)来对特征的相关性进行验证;
在具体的验证过程中,假设T是孤立隔离树中的一个节点,它要么是没有子节点的叶子节点,要么是只有两个子节点(T1,Tn)的内部节点,每一步分割,都包含特征q和分割值p,将q<p<p的数据分到T1,将q≥p≥p的数据分到Tn。
5.根据权利要求4所述的一种海量地理数据异常检测场景中的检测方法,其特征在于:在步骤A中的验证过程中,给定n个样本数据集X={x1,…,xn},特征的维度为dd,为了构建一棵孤立隔离树,需要随机选择一个特征m及其分割值d,递归地分割样本数据集X,直到满足以下任意一个条件:
(1)、孤立隔离树达到了限制的高度;
(2)、节点上只有一个样本;
(3)、节点上的样本所有特征都相同。
6.根据权利要求3所述的一种海量地理数据异常检测场景中的检测方法,其特征在于:所述B中,计算异常分数是指在评判地理数据是否为异常值时,数据的异常分数将会切分成两部分进行:
(1)、连续特征异常检测因子;
(2)、矢量特征异常检测因子;
连续特征异常检测因子与样本集的孤立隔离树的平均路径长度成正相关,由此孤立隔离树平均路径长度便可通过公式进行计算。
7.根据权利要求6所述的一种海量地理数据异常检测场景中的检测方法,其特征在于:在步骤B中通过公式计算孤立隔离树平均路径长度时,假设给定一个包含m个样本的样本集,则孤立隔离树的平均路径长度的计算公式为:
c(m)=2F(m-1)-2(m-1)×m-1
在式中,F(m)为调和数,该值可以被估计为:ln(m)+0.5772156649,c(m)为给定样本数m时,孤立隔离树路径的长度平均值,用来标准化样本x的路径长度f(x),从而使连续特征的异常得分定义为:
Figure FDA0003207997200000031
从而生成连续特征异常分数。
8.根据权利要求3所述的一种海量地理数据异常检测场景中的检测方法,其特征在于:所述C中,在测试异常分数的排序时,通过矢量特征异常检测因子与球面欧几里得的距离算法结果成正相关的关系,将矢量特征属性获取质心再带入以下欧几里得的公式:
Figure FDA0003207997200000032
获得矢量特征的异常因子比。
9.根据权利要求8所述的一种海量地理数据异常检测场景中的检测方法,其特征在于:在步骤C中,通过公式获得矢量特征的异常因子比后,再将其通过统计映射的方法转换至异常分数区间,并将连续特征异常分数与矢量特征异常分数求和,从而获得地理数据异常检测分数;
再根据地理数据异常检测分数来进行排序,并利用映射分析可迅速识别出可能异常的数据。
10.根据权利要求1所述的一种海量地理数据异常检测场景中的检测方法,其特征在于:所述S3中,输出异常数据是指通过离群残差计算构建异常分数来进行异常分数排序,以此来筛选出可能异常的数据其异常特征,最后将筛选出的异常数据和异常特征输出即可。
CN202110922698.2A 2021-08-12 2021-08-12 一种海量地理数据异常检测场景中的检测方法 Active CN113641772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110922698.2A CN113641772B (zh) 2021-08-12 2021-08-12 一种海量地理数据异常检测场景中的检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110922698.2A CN113641772B (zh) 2021-08-12 2021-08-12 一种海量地理数据异常检测场景中的检测方法

Publications (2)

Publication Number Publication Date
CN113641772A true CN113641772A (zh) 2021-11-12
CN113641772B CN113641772B (zh) 2024-01-12

Family

ID=78420968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110922698.2A Active CN113641772B (zh) 2021-08-12 2021-08-12 一种海量地理数据异常检测场景中的检测方法

Country Status (1)

Country Link
CN (1) CN113641772B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446349A (zh) * 2018-03-08 2018-08-24 国网四川省电力公司电力科学研究院 一种gis异常数据的检测方法
CN109345137A (zh) * 2018-10-22 2019-02-15 广东精点数据科技股份有限公司 一种基于农业大数据的异常值检测方法
CN110414555A (zh) * 2019-06-20 2019-11-05 阿里巴巴集团控股有限公司 检测异常样本的方法及装置
CN111507470A (zh) * 2020-03-02 2020-08-07 上海金仕达软件科技有限公司 一种异常账户的识别方法及装置
CN112488716A (zh) * 2020-12-21 2021-03-12 北京航空航天大学 一种异常事件检测系统
CN112505549A (zh) * 2020-11-26 2021-03-16 西安电子科技大学 基于孤立森林算法的新能源汽车电池异常检测方法
CN112906744A (zh) * 2021-01-20 2021-06-04 湖北工业大学 一种基于孤立森林算法的故障单体电池识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446349A (zh) * 2018-03-08 2018-08-24 国网四川省电力公司电力科学研究院 一种gis异常数据的检测方法
CN109345137A (zh) * 2018-10-22 2019-02-15 广东精点数据科技股份有限公司 一种基于农业大数据的异常值检测方法
CN110414555A (zh) * 2019-06-20 2019-11-05 阿里巴巴集团控股有限公司 检测异常样本的方法及装置
CN111507470A (zh) * 2020-03-02 2020-08-07 上海金仕达软件科技有限公司 一种异常账户的识别方法及装置
CN112505549A (zh) * 2020-11-26 2021-03-16 西安电子科技大学 基于孤立森林算法的新能源汽车电池异常检测方法
CN112488716A (zh) * 2020-12-21 2021-03-12 北京航空航天大学 一种异常事件检测系统
CN112906744A (zh) * 2021-01-20 2021-06-04 湖北工业大学 一种基于孤立森林算法的故障单体电池识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李倩;韩斌;汪旭祥;: "基于模糊孤立森林算法的多维数据异常检测方法", 计算机与数字工程, no. 04, pages 133 - 137 *
许磊;王建新;: "基于模糊神经网络的异常网络数据挖掘算法", 计算机科学, no. 04, pages 79 - 82 *
赵?;李英娜;李川;杨莉;: "基于模糊聚类和孤立森林的用电数据异常检测", 陕西理工大学学报(自然科学版), no. 04, pages 43 - 48 *

Also Published As

Publication number Publication date
CN113641772B (zh) 2024-01-12

Similar Documents

Publication Publication Date Title
CN108921051B (zh) 基于循环神经网络注意力模型的行人属性识别网络及技术
CN111814704B (zh) 基于级联注意力与点监督机制的全卷积考场目标检测方法
CN107480705B (zh) 一种自来水管漏水检测方法
CN110335168B (zh) 基于gru优化用电信息采集终端故障预测模型的方法及系统
CN108667684B (zh) 一种基于局部向量点积密度的数据流异常检测方法
CN110703057A (zh) 基于数据增强和神经网络的电力设备局部放电诊断方法
CN110880019A (zh) 通过无监督域适应训练目标域分类模型的方法
CN110992059B (zh) 一种基于大数据的围串标行为识别分析方法
CN112232486A (zh) 一种yolo脉冲神经网络的优化方法
CN111008337A (zh) 一种基于三元特征的深度注意力谣言鉴别方法及装置
CN114821299B (zh) 一种遥感图像变化检测方法
CN115291091A (zh) 一种基于图神经网络的模拟电路故障诊断方法
CN110321493A (zh) 一种社交网络的异常检测与优化方法、系统及计算机设备
CN111652257A (zh) 一种样本数据清洗方法及系统
CN114048819A (zh) 基于注意力机制和卷积神经网络的配电网拓扑辨识方法
CN117787411A (zh) 一种基于关系图的局部-全局时序知识图谱推理方法
CN110544047A (zh) 一种不良数据辨识方法
CN114897085A (zh) 一种基于封闭子图链路预测的聚类方法及计算机设备
CN115114484A (zh) 异常事件检测方法、装置、计算机设备和存储介质
Li et al. Vaga: Towards accurate and interpretable outlier detection based on variational auto-encoder and genetic algorithm for high-dimensional data
WO2016112618A1 (zh) 一种基于距离的求解二维空间中代表性节点集的算法
CN117313516A (zh) 一种基于时空图嵌入的发酵产物预测方法
CN115713270B (zh) 一种同行互评异常评分检测及修正方法和装置
CN113641772A (zh) 一种海量地理数据异常检测场景中的检测方法
CN108615056A (zh) 一种基于可分解评分函数的树增强朴素贝叶斯分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: No. 1101, Floor 11, Office Building B, Suzhou Bay Central Plaza, 99 Youxiang Road, Wuzhong District, Suzhou, Jiangsu

Applicant after: Yijing Zhilian (Suzhou) Technology Co.,Ltd.

Address before: 3015, 3 / F, 6 Chuangye Road, Shangdi Information Industry base, Haidian District, Beijing 100085

Applicant before: Yijing Zhilian (Beijing) Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant