CN108446720A - 异常数据检测方法和系统 - Google Patents

异常数据检测方法和系统 Download PDF

Info

Publication number
CN108446720A
CN108446720A CN201810164603.3A CN201810164603A CN108446720A CN 108446720 A CN108446720 A CN 108446720A CN 201810164603 A CN201810164603 A CN 201810164603A CN 108446720 A CN108446720 A CN 108446720A
Authority
CN
China
Prior art keywords
data
various dimensions
obtains
abnormal
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810164603.3A
Other languages
English (en)
Inventor
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Qingrong Day (beijing) Technology Ltd By Share Ltd
Original Assignee
China Qingrong Day (beijing) Technology Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Qingrong Day (beijing) Technology Ltd By Share Ltd filed Critical China Qingrong Day (beijing) Technology Ltd By Share Ltd
Priority to CN201810164603.3A priority Critical patent/CN108446720A/zh
Publication of CN108446720A publication Critical patent/CN108446720A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供了一种异常数据检测方法和系统,涉及大数据应用与数据科学技术领域,采用大数据采集技术获取生产数据;对生产数据进行多维度特征提取,得到多维度特征数据;将多维度特征数据进行机器学习,得到异常数据集。本发明可以全面准确地检测异常数据,从而提高数据防控的安全性。

Description

异常数据检测方法和系统
技术领域
本发明涉及大数据应用与数据科学技术领域,尤其是异常数据检测方法和系统。
背景技术
信息技术在为各行业带来方便和快捷的同时,也伴随着新的风险和问题。风险管理是各行业核心竞争力之一,例如银行业,风险控制与数据安全一直是其重中之重。
但即便是在现今的大数据时代,数据安全领域依然局限在传统的基于规则和统计的业务风险防控和数据安全防控技术上。目前,国内各行业的数据安全中心,广泛采用基于规则和统计的规则引擎的方式抓取异常,但由于其局限性,使得检测结果不够全面和准确。
公开于该背景技术部分的信息仅仅旨在加深对发明的总体背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
有鉴于此,本发明的目的在于提供异常数据检测方法和系统,以解决采用基于规则和统计的规则引擎的方式抓取异常,使得检测结果不够全面和准确的问题。
第一方面,本发明实施例提供了一种异常数据检测方法,包括:
采用大数据采集技术获取生产数据;
对所述生产数据进行多维度特征提取,得到多维度特征数据;
将所述多维度特征数据进行机器学习,得到异常数据集。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述对所述生产数据进行多维度特征提取,得到多维度特征数据,包括:
将所述生产数据进行数字化特征提取,得到数字维度数据;
将所述数字维度数据进行特征转换,得到所述多维度特征数据。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述将所述数字维度数据进行特征转换,得到所述多维度特征数据包括:
将所述数字维度数据进行正则化,得到所述多维度特征数据;
或者;
将所述数字维度数据进行类别映射,得到所述多维度特征数据;
或者;
将所述数字维度数据进行函数变换,得到所述多维度特征数据。
结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述将所述数字维度数据进行函数变换,得到所述多维度特征数据包括:
获取所述数字维度数据的分布函数;
将所述数字维度数据的分布函数映射到传统分布函数,得到所述多维度特征数据;其中,所述传统分布函数包括线性函数。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述将所述多维度特征数据进行机器学习,得到异常数据集包括:
通过聚类机器学习模型将所述多维度特征数据进行聚类学习,得到多个数据集合;
从每个所述数据集合中选取异常数据点,得到所述异常数据集。
结合第一方面的第四种可能的实施方式,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述从每个所述数据集合中选取异常数据点,得到异常数据集,包括:
计算每个所述数据集合中的离群数据点,并对所述离群数据点进行异常度打分;
将异常度最高的离群数据点作为异常数据点,得到所述异常数据集。
第二方面,本发明实施例还提供一种异常数据检测系统,包括:
采集模块,采用大数据采集技术获取生产数据;
特征提取模块,用于对所述生产数据进行多维度特征提取,得到多维度特征数据;
机器学习模块,用于将所述多维度特征数据进行机器学习,得到异常数据集。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,所述特征提取模块包括:
数字化特征提取子模块,用于将所述生产数据进行数字化特征提取,得到数字维度数据;
特征转换子模块,用于将所述数字维度数据进行特征转换,得到所述多维度特征数据。
结合第二方面的第一种可能的实施方式,本发明实施例提供了第二方面的第二种可能的实施方式,其中,所述特征转换子模块包括:
第一特征转换单元,用于将所述数字维度数据进行正则化,得到所述多维度特征数据;
第二特征转换单元,用于将所述数字维度数据进行类别映射,得到所述多维度特征数据;
第三特征转换单元,用于将所述数字维度数据进行函数变换,得到所述多维度特征数据。
结合第二方面的第二种可能的实施方式,本发明实施例提供了第二方面的第三种可能的实施方式,其中,所述第三特征转换单元包括:
获取子单元,用于获取所述数字维度数据的分布函数;
映射子单元,用于将所述数字维度数据的分布函数映射到传统分布函数,得到所述多维度特征数据;其中,所述传统分布函数包括线性函数。
本发明实施例带来了以下有益效果:
本发明实施例提供了一种异常数据检测方法和系统,采用大数据采集技术获取生产数据;对生产数据进行多维度特征提取,得到多维度特征数据;将多维度特征数据进行机器学习,得到异常数据集。通过机器学习可以全面准确地检测异常数据,从而提高数据防控的安全性。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的异常数据检测方法流程图;
图2为本发明实施例提供的另一异常数据检测方法流程图;
图3为本发明实施例提供的又一异常数据检测方法流程图;
图4为本发明实施例提供的异常数据分布图。
图5为本发明实施例提供的异常数据检测系统示意图。
图标:
10-采集模块;20-特征提取模块;30-机器学习模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,国内各行业的数据安全中心,广泛采用基于规则和统计的规则引擎的方式抓取异常,但由于其局限性,使得检测结果不够全面和准确。
基于此,本发明实施例提供的一种异常数据检测方法和系统,可以全面准确地检测异常数据,从而提高数据防控的安全性。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种异常数据检测方法进行详细介绍。
实施例一
如图1所示,本实施例提供的一种异常数据检测方法,包括:
步骤S101,采用大数据采集技术获取生产数据;
这里的生产数据是指行业业务系统的各种数据,包括日志、数据库中的数据。例如,银行的业务系统数据包括网银系统数据、支付系统数据等等。采用大数据采集技术来抓取数据,包括多种采集方式。
步骤S102,对生产数据进行多维度特征提取,得到多维度特征数据;
由于生产数据包括多种业务领域或者路径分类,需要对其进行梳理,分为多个维度数据,并进行多维度特征提取。
步骤S103,将多维度特征数据进行机器学习,得到异常数据集。
具体地,对特征提取后的数据使用各种机器学习模型进行机器学习处理,输出异常数据集。输出的异常数据集同样存储在分布式大数据存储系统中。
需要说明的是,生产数据包括实时生产数据(流数据),非实时数据(批处理数据batch)。
具体地,如图2所示,步骤S102包括以下步骤:
步骤S1021,将生产数据进行数字化特征提取,得到数字维度数据;
特征提取步骤将自生产数据采集得到的任何字符,文本,数字,图像,音频,动力学信息等全部数字化,将蕴含经验的原始数信息全部转化为数据的数字维度。将转换后的数据继续存储在大数据分布式系统中。
数字化特征提取包括:首先采集并筛选出特征,然后根据相关性进行特征再提取。例如日期数据再提取,日期:2015年11月11日,可再提取其中三项特征:1.月份;2.是否周末;3.是否节日。即将生产数据转换为机器容易识别的特征数据。
步骤S1022,将数字维度数据进行特征转换,得到多维度特征数据。
本步骤中,对数字维度数据继续进行特征转换(即特征精取),将数字维度数据进行特征转换包括将数字维度数据进行正则化;或者将数字维度数据进行类别映射;或者将数字维度数据进行函数变换。需要说明的是,这里不仅限于正则化、类别映射以及函数变换,还包括其他特征转换方法。将特征精取后的数据同样方式存储在分布式大数据存储系统中。
具体地,将数字维度数据进行函数变换包括:获取数字维度数据的分布函数;将数字维度数据的分布函数映射到传统分布函数,得到多维度特征数据;其中,传统分布函数包括线性函数。包括以下步骤:
(1)使用传统数学统计工具,统计出各个转换后的数值维度的规律,找到其匹配的分布函数。
(2)将各维度的数值分布函数映射到传统分布函数上,最常用的方式是将其映射成为线性函数。
(3)将全部转换后的数据维度提供给机器学习模型。
无论是浅层学习还是深度学习,解决的问题种类大致分为:分类,聚类,回归,时序,对已存在异常库的异常检测,可使用有监督的分类方式的机器学习模型。我们的方法需要解决更广泛的问题,可以在未知任何异常行为信息的情况下发现异常,在此主体方向选择无监督的聚类方式建立机器学习模型。
具体地,如图3所示,步骤S103包括以下步骤:
步骤S1031,通过聚类机器学习模型将多维度特征数据进行聚类学习,得到多个数据集合;
步骤S1032,从每个数据集合中选取异常数据点,得到异常数据集。
从每个数据集合中选取异常数据点,得到异常数据集,包括:
计算每个数据集合中的离群数据点,并对离群数据点进行异常度打分;
将异常度最高的离群数据点作为异常数据点,得到异常数据集。
聚类模型的原理是将数据在N个维度的空间中自动聚合为大小不一的各个集合。此类模型有划分法,层次法,基于密度法,基于网格法,基于模型的方法等。它们的输出便是这些大小不一的数据集合。
我们的方法是利用传统聚类机器学习模型,完成聚类工作的同时,要找出偏离各个集合中心最为边远的数据。将它们定义为异常点。
例如图4,是使用PCA作图后可以看到在PCA1-PCA2象限中的数据分布,距离各个圆心越偏远,它的距离异常得分就越高。
本实施例的异常数据检测方法具有以下优点:无需事先建立知识库,直接标记异常数据;可以在全零基础之上总结规则;误报率极小。若结合强规则知识库印证,可达到误报率0;标注异常行为所包含的全部事件,直接准确抓取最大规模的异常事件;对未知规则的新型异常不会漏报,会作为离群数据标注,报出;对通过正常途径访问的异常行为不会漏报。
本实施例异常数据检测方法基于行为检测,不会对不同限制性规则的同类型异常做出不同判断。例如:传统规则方式抓网络攻击,所定义规则必须符合某网络攻击主机的IP才可将此攻击抓获,当攻击IP地址变化后,规则失效,而此方法对即使此攻击行为换IP,换用户,换时段,换地域等各种变形,均会将其准确抓取。
实施例二
图5示出了本发明实施例提供的异常数据检测系统示意图。
如图5所示,本实施例提供了一种异常数据检测系统,包括采集模块10、特征提取模块20以及机器学习模块30;
采集模块10,采用大数据采集技术获取生产数据;
特征提取模块20,用于对生产数据进行多维度特征提取,得到多维度特征数据;
机器学习模块30,用于将多维度特征数据进行机器学习,得到异常数据集。
进一步地,特征提取模块包20括数字化特征提取子模块和特征转换子模块;
数字化特征提取子模块,用于将生产数据进行数字化特征提取,得到数字维度数据;
特征转换子模块,用于将数字维度数据进行特征转换,得到多维度特征数据。
进一步地,特征转换子模块包括第一特征转换单元、第二特征转换单元以及第三特征转换单元;
第一特征转换单元,用于将数字维度数据进行正则化,得到多维度特征数据;
第二特征转换单元,用于将数字维度数据进行类别映射,得到多维度特征数据;
第三特征转换单元,用于将数字维度数据进行函数变换,得到多维度特征数据。
进一步地,第三特征转换单元包括获取子单元和映射子单元;
获取子单元,用于获取数字维度数据的分布函数;
映射子单元,用于将数字维度数据的分布函数映射到传统分布函数,得到多维度特征数据;其中,传统分布函数包括线性函数。
本发明实施例提供的异常数据检测系统,与上述实施例提供的异常数据检测方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
本发明实施例提供了一种异常数据检测方法和系统,采用大数据采集技术获取生产数据;对生产数据进行多维度特征提取,得到多维度特征数据;将多维度特征数据进行机器学习,得到异常数据集。通过机器学习可以全面准确地检测异常数据,从而提高数据防控的安全性。
本发明实施例还提供一种电子设备,包括存储器、处理器,存储器中存储有可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例提供的异常数据检测方法的步骤。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述实施例的异常数据检测方法的步骤。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明实施例所提供的进行异常数据检测方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种异常数据检测方法,其特征在于,包括:
采用大数据采集技术获取生产数据;
对所述生产数据进行多维度特征提取,得到多维度特征数据;
将所述多维度特征数据进行机器学习,得到异常数据集。
2.根据权利要求1所述的异常数据检测方法,其特征在于,所述对所述生产数据进行多维度特征提取,得到多维度特征数据,包括:
将所述生产数据进行数字化特征提取,得到数字维度数据;
将所述数字维度数据进行特征转换,得到所述多维度特征数据。
3.根据权利要求2所述的异常数据检测方法,其特征在于,所述将所述数字维度数据进行特征转换,得到所述多维度特征数据包括:
将所述数字维度数据进行正则化,得到所述多维度特征数据;
或者;
将所述数字维度数据进行类别映射,得到所述多维度特征数据;
或者;
将所述数字维度数据进行函数变换,得到所述多维度特征数据。
4.根据权利要求3所述的异常数据检测方法,其特征在于,所述将所述数字维度数据进行函数变换,得到所述多维度特征数据包括:
获取所述数字维度数据的分布函数;
将所述数字维度数据的分布函数映射到传统分布函数,得到所述多维度特征数据;其中,所述传统分布函数包括线性函数。
5.根据权利要求1所述的异常数据检测方法,其特征在于,所述将所述多维度特征数据进行机器学习,得到异常数据集包括:
通过聚类机器学习模型将所述多维度特征数据进行聚类学习,得到多个数据集合;
从每个所述数据集合中选取异常数据点,得到所述异常数据集。
6.根据权利要求5所述的异常数据检测方法,其特征在于,所述从每个所述数据集合中选取异常数据点,得到异常数据集,包括:
计算每个所述数据集合中的离群数据点,并对所述离群数据点进行异常度打分;
将异常度最高的离群数据点作为异常数据点,得到所述异常数据集。
7.一种异常数据检测系统,其特征在于,包括:
采集模块,采用大数据采集技术获取生产数据;
特征提取模块,用于对所述生产数据进行多维度特征提取,得到多维度特征数据;
机器学习模块,用于将所述多维度特征数据进行机器学习,得到异常数据集。
8.根据权利要求7所述的异常数据检测系统,其特征在于,所述特征提取模块包括:
数字化特征提取子模块,用于将所述生产数据进行数字化特征提取,得到数字维度数据;
特征转换子模块,用于将所述数字维度数据进行特征转换,得到所述多维度特征数据。
9.根据权利要求8所述的异常数据检测系统,其特征在于,所述特征转换子模块包括:
第一特征转换单元,用于将所述数字维度数据进行正则化,得到所述多维度特征数据;
第二特征转换单元,用于将所述数字维度数据进行类别映射,得到所述多维度特征数据;
第三特征转换单元,用于将所述数字维度数据进行函数变换,得到所述多维度特征数据。
10.根据权利要求9所述的异常数据检测系统,其特征在于,所述第三特征转换单元包括:
获取子单元,用于获取所述数字维度数据的分布函数;
映射子单元,用于将所述数字维度数据的分布函数映射到传统分布函数,得到所述多维度特征数据;其中,所述传统分布函数包括线性函数。
CN201810164603.3A 2018-02-27 2018-02-27 异常数据检测方法和系统 Pending CN108446720A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810164603.3A CN108446720A (zh) 2018-02-27 2018-02-27 异常数据检测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810164603.3A CN108446720A (zh) 2018-02-27 2018-02-27 异常数据检测方法和系统

Publications (1)

Publication Number Publication Date
CN108446720A true CN108446720A (zh) 2018-08-24

Family

ID=63192732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810164603.3A Pending CN108446720A (zh) 2018-02-27 2018-02-27 异常数据检测方法和系统

Country Status (1)

Country Link
CN (1) CN108446720A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109391620A (zh) * 2018-10-22 2019-02-26 武汉极意网络科技有限公司 异常行为判定模型的建立方法、系统、服务器及存储介质
CN109447651A (zh) * 2018-10-22 2019-03-08 武汉极意网络科技有限公司 业务风控检测方法、系统、服务器及存储介质
CN109814022A (zh) * 2019-01-02 2019-05-28 浙江大学 一种芯片老炼试验数据处理方法
CN110009519A (zh) * 2019-01-29 2019-07-12 上海七印信息科技有限公司 一种基于区块链社交平台的社群检测方法
CN111639497A (zh) * 2020-05-27 2020-09-08 北京东方通科技股份有限公司 一种基于大数据机器学习的异常行为发现方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101509839A (zh) * 2009-03-12 2009-08-19 上海交通大学 基于离群点挖掘的集群工业机器人故障诊断方法
CN104408547A (zh) * 2014-10-30 2015-03-11 浙江网新恒天软件有限公司 一种基于数据挖掘的医保欺诈行为的检测方法
CN106682067A (zh) * 2016-11-08 2017-05-17 浙江邦盛科技有限公司 一种基于交易数据的机器学习反欺诈监测系统
CN107391616A (zh) * 2017-07-04 2017-11-24 广西电网有限责任公司电力科学研究院 一种生产业务噪声数据检测和分离系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101509839A (zh) * 2009-03-12 2009-08-19 上海交通大学 基于离群点挖掘的集群工业机器人故障诊断方法
CN104408547A (zh) * 2014-10-30 2015-03-11 浙江网新恒天软件有限公司 一种基于数据挖掘的医保欺诈行为的检测方法
CN106682067A (zh) * 2016-11-08 2017-05-17 浙江邦盛科技有限公司 一种基于交易数据的机器学习反欺诈监测系统
CN107391616A (zh) * 2017-07-04 2017-11-24 广西电网有限责任公司电力科学研究院 一种生产业务噪声数据检测和分离系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
俞慧友: "湖南首台完全自主知识产权工业机器人实现产业化", 《科技日报》 *
刘权: "工业机器人网络安全应重视", 《网络安全和信息化》 *
刘金芳: "高度警惕工业机器人网络安全问题", 《中国信息化周报》 *
林武材: "大数据驱动的机器人信息物理融合系统的分析与设计方法", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
沈小波等: "人工智能等技术重塑机器人产业后者迎来大机会", 《信息与电脑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109391620A (zh) * 2018-10-22 2019-02-26 武汉极意网络科技有限公司 异常行为判定模型的建立方法、系统、服务器及存储介质
CN109447651A (zh) * 2018-10-22 2019-03-08 武汉极意网络科技有限公司 业务风控检测方法、系统、服务器及存储介质
CN109391620B (zh) * 2018-10-22 2021-06-25 武汉极意网络科技有限公司 异常行为判定模型的建立方法、系统、服务器及存储介质
CN109814022A (zh) * 2019-01-02 2019-05-28 浙江大学 一种芯片老炼试验数据处理方法
CN110009519A (zh) * 2019-01-29 2019-07-12 上海七印信息科技有限公司 一种基于区块链社交平台的社群检测方法
CN111639497A (zh) * 2020-05-27 2020-09-08 北京东方通科技股份有限公司 一种基于大数据机器学习的异常行为发现方法
CN111639497B (zh) * 2020-05-27 2021-01-15 北京东方通科技股份有限公司 一种基于大数据机器学习的异常行为发现方法

Similar Documents

Publication Publication Date Title
CN108446720A (zh) 异常数据检测方法和系统
CN104915879B (zh) 基于金融数据的社会关系挖掘的方法及装置
CN111639497B (zh) 一种基于大数据机器学习的异常行为发现方法
CN102282516B (zh) 异常检测方法及异常检测系统
CN111339297B (zh) 网络资产异常检测方法、系统、介质和设备
CN104112026B (zh) 一种短信文本分类方法及系统
US20210092160A1 (en) Data set creation with crowd-based reinforcement
CN110336838B (zh) 账号异常检测方法、装置、终端及存储介质
CN109817339A (zh) 基于大数据的患者分组方法和装置
CN103714086A (zh) 用于生成非关系数据库的模式的方法和设备
CN110362829A (zh) 结构化病历数据的质量评估方法、装置及设备
Bhattacharya Some Salient Aspects of Machine Learning Research: A Bibliometric Analysis.
CN103530312A (zh) 使用多方面足迹的用户标识的方法和系统
US7797264B2 (en) Detecting and displaying exceptions in tabular data
CN113762377A (zh) 网络流量识别方法、装置、设备及存储介质
CN115577701A (zh) 针对大数据安全的风险行为识别方法、装置、设备及介质
CN110046188A (zh) 业务处理方法及其系统
CN113538154A (zh) 风险对象的识别方法、装置、存储介质和电子设备
CN114448657B (zh) 一种配电通信网络安全态势感知与异常入侵检测方法
Patel et al. A comparative study of clustering data mining: Techniques and research challenges
CN112583847B (zh) 一种面向中小企业网络安全事件复杂分析的方法
CN110378569A (zh) 产业关系链构建方法、装置、设备及存储介质
CN113379469A (zh) 一种异常流量检测方法、装置、设备及存储介质
CN112631889A (zh) 针对应用系统的画像方法、装置、设备及可读存储介质
CN107527289A (zh) 一种投资组合行业配置方法、装置、服务器和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180824