CN112148763A - 无监督数据异常检测方法、装置及存储介质 - Google Patents

无监督数据异常检测方法、装置及存储介质 Download PDF

Info

Publication number
CN112148763A
CN112148763A CN201910574636.XA CN201910574636A CN112148763A CN 112148763 A CN112148763 A CN 112148763A CN 201910574636 A CN201910574636 A CN 201910574636A CN 112148763 A CN112148763 A CN 112148763A
Authority
CN
China
Prior art keywords
data
detected
dimensional
characteristic
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910574636.XA
Other languages
English (en)
Inventor
奚久洲
曲洪涛
张雯
祝浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JD Digital Technology Holdings Co Ltd
Original Assignee
JD Digital Technology Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JD Digital Technology Holdings Co Ltd filed Critical JD Digital Technology Holdings Co Ltd
Priority to CN201910574636.XA priority Critical patent/CN112148763A/zh
Publication of CN112148763A publication Critical patent/CN112148763A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本申请公开了一种无监督数据异常检测方法、装置及存储介质,及数据处理技术。其中,该方法包括:将多个待检测数据分别表达为多维特征;针对每一维特征,根据每个待检测数据的该维特征,提取该维特征的数据分布,并确定该维特征数据的数据分布的特异性参数;在多维特征中选取特异性参数最大的预定数量个特征作为目标特征;利用目标特征对待检测数据进行数据异常的检测,得到目标异常数据。本申请根据特异性参数准确地选择出数据异常的敏感度高的目标特征,在节省大量人力和时间资源的同时,具有良好的泛化能力和稳定性,且利用目标特征进行对数据异常的敏感度,在大大改进数据异常检测效果的同时,大幅节省了计算资源。

Description

无监督数据异常检测方法、装置及存储介质
技术领域
本申请涉及数据处理技术,特别是涉及一种无监督数据异常检测方法、装置及存储介质。
背景技术
数据异常检测技术广泛应用于金融、工业、网络等领域,例如使用数据异常检测技术进行数据挖掘、金融反欺诈等,用于从海量数据中检测出数值异常或代表了异常行为的数据。
现有技术通常采用无监督机器学习技术进行数据异常检测,然而,使用无监督机器学习技术进行数据异常检测的性能严重依赖于无监督机器学习技术中使用的特征对数据异常的敏感度。传统方法要么基于专家经验或有监督的机器学习技术进行特征选择,这种方式依赖于足够的先验知识,需要耗费大量的人力和时间,且很难具备良好的泛化能力和稳定性。要么通过引入过量的特征来提高数据异常检测的效果,但这种方法既无法保证有效信息的保留,又势必导致特征冗余,对数据异常检测效果的改进不显著且耗费大量无意义的计算资源。
发明内容
有鉴于此,本申请的主要目的在于提供一种无监督数据异常检测方法,该方法无需依赖人力,具有良好的泛化能力和稳定性,且可以准确的进行特征选择,在大大改进数据异常检测效果的同时,大幅节省了计算资源。
为了达到上述目的,本申请提出的技术方案为:
第一方面,本申请实施例提供了一种无监督数据异常检测方法,包括以下步骤:
将多个待检测数据分别表达为多维特征;
针对每一维特征,根据每个待检测数据的该维特征,提取该维特征的数据分布,并确定该维特征数据的数据分布的特异性参数;所述特异性参数用于表征每个待检测数据的该维特征与其余待检测数据的该维特征之间的差异;
在所述多维特征中选取所述特异性参数最大的预定数量个特征作为目标特征;
利用所述目标特征对所述待检测数据进行数据异常的检测,得到目标异常数据。
一种可能的实施方式中,所述特异性参数为度量数据分布的非高斯性的参数;其中,所述特异性参数包括:峰态系数或偏态系数。
一种可能的实施方式中,在所述特异性参数为峰态系数的情况下,所述确定该维特征数据的数据分布的特异性参数的步骤包括:
根据每个待检测数据的该维特征的数值,确定该维特征的平均数值;
根据所述平均数值、每个待检测数据的该维特征的数值和待检测数据的个数,确定所述峰态系数。
第二方面,基于相同的设计构思,本申请实施例提供了一种无监督数据异常检测装置,包括:
特征表达模块,用于将多个待检测数据分别表达为多维特征;
特异性计算模块,用于针对每一维特征,根据每个待检测数据的该维特征,提取该维特征的数据分布,并确定该维特征数据的数据分布的特异性参数;所述特异性参数用于表征每个待检测数据的该维特征与其余待检测数据的该维特征之间的差异;
特征选取模块,用于在所述多维特征中选取所述特异性参数最大的预定数量个特征作为目标特征;
异常检测模块,用于利用所述目标特征对所述待检测数据进行数据异常的检测,得到目标异常数据。
一种可能的实施方式中,所述特异性参数为度量数据分布的非高斯性的参数;其中,所述特异性参数包括:峰态系数或偏态系数。
一种可能的实施方式中,在所述特异性参数为峰态系数的情况下,所述特异性计算模块具体用于:
根据每个待检测数据的该维特征的数值,确定该维特征的平均数值;
根据所述平均数值、每个待检测数据的该维特征的数值和待检测数据的个数,确定所述峰态系数。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面及第一方面中任一种可能的实施方式的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面及第一方面中任一种可能的实施方式的步骤。
综上所述,本申请针对每个待检测数据的每一维特征,确定该维特征数据的数据分布的特异性参数,并选取多维特征中特异性参数最大的预定数量个特征作为目标特征,根据特异性参数,可以从待检测数据的多维特征中,准确的选择对数据异常的敏感度高的目标特征,且这一过程无需人力参与,在节省大量人力和时间资源的同时,具有良好的泛化能力和稳定性,另外,利用目标特征进行对数据异常的敏感度,在大大改进数据异常检测效果的同时,大幅节省了计算资源。
附图说明
图1为本申请实施例一的流程示意图;
图2为本申请实施例二的流程示意图;
图3为本申请实施例三的结构示意图;
图4为本申请实施例四的结构示意图。
具体实施方式
数据异常检测常采用无监督的机器学习技术,以求在没有先验知识和数据标签的情况下,能够有效的从全局数据中检测出具有异常表现的可疑数据对象,无监督的数据异常检测技术可以被广泛用于数据挖掘、金融反欺诈等诸多领域。然而数据异常检测的性能严重依赖于使用的特征对数据异常的敏感度。因此,合理的特征生成和特征选择技术成为改进数据异常检测技术性能的关键环节。
目前,数据异常检测应用的特征选择技术主要包括:
方法1、基于专家经验。此方法是由本领域内具有丰富业务经验的专家,结合自身经验对应用环境中异常数据的具体表现进行分析,进而人工设计的能够反映目标异常数据的一系列特征,完全依据人工完成对特征的选择。由于此方法从需要检测的目标异常数据出发进行的,往往能够较准确地选择出检测目标异常数据所需的特征。但正由于大量的人工干预,对于落入专家经验之外的新问题,此方法不具备泛化能力。同时这种依托人工经验的方法的有效性完全取决于专家的业务能力,每个不同的任务都需要投入人力重新设计,因此性能不稳定且难以进行推广应用。
方法2、基于主动学习。此方法要求已经积累了一定的异常数据标签,从而通过多次的不同特征组合,确定多个候选特征集。进而以主动学习的思想,利用每一个候选特征集进行数据异常检测,并根据数据异常检测性能的反馈,确定出有效的特征集。但此方法往往需要大量的实验才能取得成效,穷举所有的特征组合本身就成本过高以致不切实际,因此,此方法无法避免漏掉必要特征或加入冗余特征,往往只能取得次优解,且可解释性不强。
方法3、基于有监督的机器学习。此方法要求已经具备足够的先验知识,明确一部分数据存在异常,一部分数据不存在异常,进而通过有监督的机器学习技术计算各特征对异常的敏感度,寻找最能反映异常的特征集合的近似最优解。此种方法需要根据业务经验完成特征的设计工作,特征选择通过算法自动完成,跟方法1相比需要更少的人工参与,比方法1具有更好的泛化能力和稳定性。但此方法仍然需要人工参与,且仍需要大量的标签积累作为前提,在工业界普遍缺乏标签的情况下,从无到有的标签积累过程往往耗费大量的人力、物力和时间,因此此方法仍难以推广应用。
针对数据异常检测技术中尚未有无需先验知识的无监督特征选择技术,更没有具有泛化能力的技术解决方案的现状,本申请的核心发明点在于:确定每一维特征的数据分布特性,并基于数据分布特性定量地分析每一维特征对数据异常的敏感度。具体的,针对每个待检测数据的每一维特征,确定该维特征数据的数据分布的特异性参数,并选取多维特征中特异性参数最大的预定数量个特征作为目标特征,根据特异性参数,可以从待检测数据的多维特征中,准确的选择对数据异常的敏感度高的目标特征,且这一过程无需人力参与,同时也使得数据异常检测技术的每个环节都采用了无需人力介入的无监督机器学习技术,在节省大量人力和时间资源的同时,具有良好的泛化能力和稳定性,另外,利用目标特征进行对数据异常的敏感度,在大大改进数据异常检测效果的同时,大幅节省了计算资源。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本申请作进一步地详细描述。
实施例一
图1为本申请实施例一的流程示意图,如图1所示,该实施例主要包括:
S101:将多个待检测数据分别表达为多维特征。
具体的,可以采用任一种常用的特征提取与表达方法,将多个待检测数据分别表达为多维特征。上述多维特征可以为具有物理表达能力的特征;也可以不具有物理表达能力,仅仅是数值特征。
示例性的,将本申请实施例应用于检测社交网络中用户间的访问异常的应用场景时,可以通过大规模信息网络嵌入(Large-scale Information Network Embedding,LINE)方法、Deepwalk方法或结构深度网络嵌入(Structure Deep Network Embedding,SDNE)方法等无监督图嵌入技术,将加关注、访问、留言、点赞等行为数据转化为机器学习算法需要矩阵形式的特征,以完成特征选择的基础数据准备工作。例如将社交网络中的行为数据转化为图数据形式时,可以以用户为节点,以两个用户节点间的访问作为边构建用于表征用户间访问的图。进而利用图嵌入技术将用户间访问图数据嵌入到128维空间中,也就是将每个社交网络用户间的访问行为表达为128维特征,既完成数据的特征表达。
当然的,例如对文字数据进行异常检测时,可以利用词嵌入(Word Embedding)方法进行特征提取;应用于对图像数据进行异常检测时,可以利用特征提取技术提取图像的颜色、纹理、形状等特征;在其他应用场景,也可以通过相应的特征提取技术,提取每个待检测数据的多维特征。然而值得注意的是,在特征表达过程中,使用低阶近似的图嵌入技术以保留更多的局部特征信息往往有较好的效果。
S102:针对每一维特征,根据每个待检测数据的该维特征,提取该维特征的数据分布,并确定该维特征数据的数据分布的特异性参数;所述特异性参数用于表征每个待检测数据的该维特征与其余待检测数据的该维特征之间的差异。
采用数据分布评估每一维特征对数据异常的敏感度,是基于数据异常检测技术的基本原理进行的。数据异常检测技术主要基于以下两个对异常数据的定义:第一、异常数据和正常数据由不同的行为模式或数据模式产生,因此,异常数据和正常数据在某些性质上具有较大区别;第二、异常数据在数据全局中占比很小,即数据的整体是未被污染的。例如在社交网络数据中进行数据异常检测时,检测的对象是恶意盈利的异常用户。为了恶意盈利,异常用户与正常用户表现出不同的行为模式。大量异常用户会集中访问热度低的用户或话题,通过短时间内提高目标用户或话题在社交网络中的热度和置信度来骗取正常用户的点击和访问来实现获利。因此,异常访问行为与正常访问行为相比,有短时间大量集中访问的行为特点,且异常访问的对象有热度低的特点,在这两点上异常访问行为与正常访问行为有较大的区别。但就整个社交网络而言,这种异常访问行为是相对稀少的。
综上,能较好的体现异常用户行为的特征应该符合特异性的数据分布,该特征的数据分布中绝大多数数据的取值是相近的,但有异常的部分数据的取值与绝大多数数据的取值有显著的区别。因此,在使用特异性参数表征每个待检测数据的该维特征与其余待检测数据的该维特征之间的差异的情况下,能较好的体现异常用户行为的特征的数据分布的特异性参数的数值较大。
在部分应用场景下,例如在社交网络数据中进行数据异常检测时,可以利用高斯分布或正态分布度量特征对数据异常的敏感度,其数据分布越符合高斯分布或正态分布的特征,对数据异常的敏感度越低;在某些应用场景下,可以使用空间密度度量特征对数据异常的敏感度;在某些应用场景下,也可以应用信息熵度量特征对数据异常的敏感度。
S103:在所述多维特征中选取所述特异性参数最大的预定数量个特征作为目标特征。
根据特异性参数的数值可以定量的评估特征对数据异常的敏感度。因此,可以将特异性参数最大的预定数量个特征,作为进行数据异常检测的目标特征。例如,利用图嵌入技术将每个社交网络用户间的访问行为表达为128维特征的情况下,根据上述128维特征中,每一维特征的特异性参数,从上述128维特征中选择特异性参数的数值最大的预定数量个特征,例如从上述128维特征中选择特异性参数的数值最大的5-10个特征,作为进行数据异常检测的目标特征。
S104:利用所述目标特征对所述待检测数据进行数据异常的检测,得到目标异常数据。
这里,目标异常数据为上述多个待检测数据具有异常行为特征或异常数据特征的数据。
实施例二
本申请实施例二为无监督数据异常检测方法应用于对社交网络中的访问行为数据进行数据异常检测的应用场景的具体实施例,如图2所示,包括:
S201:将多个待检测数据分别表达为多维特征。
具体的,获取每个社交网络用户间的访问行为数据作为待检测数据,并利用图嵌入技术将每个社交网络用户间的访问行为数据表达为128维特征。
S202:针对每一维特征,根据每个待检测数据的该维特征,提取该维特征的高斯分布,并确定该维特征数据的数据分布的峰态系数。
在社交网络数据中,正常的访问数据符合高斯分布的特点,非高斯性越高的特征对数据异常的敏感度越高。因此,为了度量待检测数据的每一维特征的非高斯性,采用可以采用峰态系数或偏态系数等度量数据分布的非高斯性的参数作为特异性参数,也就是采用峰态系数或偏态系数等度量每一维特征是否具有对数据异常的高敏感度能力的参数作为特异性参数。以峰态系数为例,峰态系数表征了概率密度的数据分布曲线在平均值处峰值高低的特征数值,峰态系数反应了数据峰部的尖度。因此,峰态系数较大的数据,概率密度的数据分布呈现出的特点为,大多数数据处于相近的数值范围内,而存在少量的数据的数值与大多数数据的数值之间具有较大差异。
针对上述每个社交网络用户间的访问行为数据的128维特征,计算每一维特征的峰态系数。
具体的,针对每一维特征,可以采用下述步骤1和步骤2确定该维特征的峰态系数:
步骤1、根据每个待检测数据的该维特征的数值,确定该维特征的平均数值。
步骤2、根据所述平均数值、每个待检测数据的该维特征的数值和待检测数据的个数,确定所述峰态系数。
示例性的,针对每一维特征,可以采用下述公式(1)计算该维特征的峰态系数:
Figure BDA0002111747910000091
其中,n是社交网络用户的数量,也就是待检测数据的个数。xi是第i个用户对应的该维特征的数值,
Figure BDA0002111747910000092
是该维特征的平均数值。
同理,由于偏态系数为说明随机系列分配不对称程度的统计参数,偏态系数绝对值越大,数据偏斜越严重。因此,使用偏态系数,可以评价特征对数据异常的敏感度。采用偏态系数作为特异性参数时,可以采用任一种常用的偏态系数计算方法,此处不再赘述。
S203:针对每一维特征,选择峰态系数最大的预订数量个特征作为目标特征。
具体的,可以根据上述128维特征的峰态系数进行排序,选择峰态系数最大的预订数量个特征作为目标特征。例如,可以选取128维特征中峰态系数较大的5%作为目标特征,用于后续的数据异常检测。得到目标特征后,就完成了无监督的特征选择过程。
这里,特征选取的数量可以根据数据异常检测的具体场景决定,一般当选取比例在2%~20%间时,得到的目标特征可以较好地改进后续的数据异常检测的检测效果。特别的,当选取的目标特征的数量较少时,在大大改进数据异常检测效果的同时,大幅节省了计算资源,有效地降低了计算成本。
S204:利用目标特征对所述待检测数据进行数据异常的检测,得到目标异常数据。
这里,目标异常数据为在社交网络中,具有异常访问行为的用户。
基于相同的设计构思,本申请实施例还提供一种无监督数据异常检测装置、电子设备及可读存储介质。
实施例三
如图3所示,本申请实施例提供的一种无监督数据异常检测装置300,包括:
特征表达模块301,用于将多个待检测数据分别表达为多维特征;
特异性计算模块302,用于针对每一维特征,根据每个待检测数据的该维特征,提取该维特征的数据分布,并确定该维特征数据的数据分布的特异性参数;特异性参数用于表征每个待检测数据的该维特征与其余待检测数据的该维特征之间的差异;
特征选取模块303,用于在多维特征中选取特异性参数最大的预定数量个特征作为目标特征;
异常检测模块304,用于利用目标特征对待检测数据进行数据异常的检测,得到目标异常数据。
一种可能的实施方式中,数据分布包括高斯分布;在数据分布包括高斯分布的情况下,特异性参数包括:峰态系数或偏态系数。
一种可能的实施方式中,在特异性参数为峰态系数的情况下,特异性计算模块302具体用于:
根据每个待检测数据的该维特征的数值,确定该维特征的平均数值;
根据平均数值、每个待检测数据的该维特征的数值和待检测数据的个数,确定峰态系数。
实施例四
如图4所示,本申请实施例还提供一种电子设备400,包括存储器401、处理器402及存储在存储器401上并可在处理器402上运行的计算机程序,所述处理器402执行所述程序时可以用于实现本申请实施例一或实施例二中的步骤。
实施例五
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请实施例一或实施例二中的步骤。
综上所述,以上仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种无监督数据异常检测方法,其特征在于,包括:
将多个待检测数据分别表达为多维特征;
针对每一维特征,根据每个待检测数据的该维特征,提取该维特征的数据分布,并确定该维特征数据的数据分布的特异性参数;所述特异性参数用于表征每个待检测数据的该维特征与其余待检测数据的该维特征之间的差异;
在所述多维特征中选取所述特异性参数最大的预定数量个特征作为目标特征;
利用所述目标特征对所述待检测数据进行数据异常的检测,得到目标异常数据。
2.根据权利要求1所述的方法,其特征在于,所述特异性参数为度量数据分布的非高斯性的参数;其中,所述特异性参数包括:峰态系数或偏态系数。
3.根据权利要求2所述的方法,其特征在于,在所述特异性参数为峰态系数的情况下,所述确定该维特征数据的数据分布的特异性参数的步骤包括:
根据每个待检测数据的该维特征的数值,确定该维特征的平均数值;
根据所述平均数值、每个待检测数据的该维特征的数值和待检测数据的个数,确定所述峰态系数。
4.一种无监督数据异常检测装置,其特征在于,包括:
特征表达模块,用于将多个待检测数据分别表达为多维特征;
特异性计算模块,用于针对每一维特征,根据每个待检测数据的该维特征,提取该维特征的数据分布,并确定该维特征数据的数据分布的特异性参数;所述特异性参数用于表征每个待检测数据的该维特征与其余待检测数据的该维特征之间的差异;
特征选取模块,用于在所述多维特征中选取所述特异性参数最大的预定数量个特征作为目标特征;
异常检测模块,用于利用所述目标特征对所述待检测数据进行数据异常的检测,得到目标异常数据。
5.根据权利要求4所述的装置,其特征在于,所述特异性参数为度量数据分布的非高斯性的参数;其中,所述特异性参数包括:峰态系数或偏态系数。
6.根据权利要求5所述的装置,其特征在于,在所述特异性参数为峰态系数的情况下,所述特异性计算模块具体用于:
根据每个待检测数据的该维特征的数值,确定该维特征的平均数值;
根据所述平均数值、每个待检测数据的该维特征的数值和待检测数据的个数,确定所述峰态系数。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-3任一项所述的方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-3任一项所述的方法的步骤。
CN201910574636.XA 2019-06-28 2019-06-28 无监督数据异常检测方法、装置及存储介质 Pending CN112148763A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910574636.XA CN112148763A (zh) 2019-06-28 2019-06-28 无监督数据异常检测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910574636.XA CN112148763A (zh) 2019-06-28 2019-06-28 无监督数据异常检测方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN112148763A true CN112148763A (zh) 2020-12-29

Family

ID=73869287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910574636.XA Pending CN112148763A (zh) 2019-06-28 2019-06-28 无监督数据异常检测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112148763A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117592823A (zh) * 2024-01-19 2024-02-23 天津路联智通交通科技有限公司 一种土木建筑污水处理方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574322A (zh) * 2011-06-17 2016-05-11 财团法人工业技术研究院 生理参数指标运算系统及方法
CN106547852A (zh) * 2016-10-19 2017-03-29 腾讯科技(深圳)有限公司 异常数据检测方法及装置、数据预处理方法及系统
CN106982196A (zh) * 2016-01-19 2017-07-25 阿里巴巴集团控股有限公司 一种异常访问检测方法及设备
CN109583470A (zh) * 2018-10-17 2019-04-05 阿里巴巴集团控股有限公司 一种异常检测的解释特征确定方法和装置
CN109684118A (zh) * 2018-12-10 2019-04-26 深圳前海微众银行股份有限公司 异常数据的检测方法、装置、设备及计算机可读存储介质
CN109726737A (zh) * 2018-11-27 2019-05-07 武汉极意网络科技有限公司 基于轨迹的异常行为检测方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574322A (zh) * 2011-06-17 2016-05-11 财团法人工业技术研究院 生理参数指标运算系统及方法
CN106982196A (zh) * 2016-01-19 2017-07-25 阿里巴巴集团控股有限公司 一种异常访问检测方法及设备
CN106547852A (zh) * 2016-10-19 2017-03-29 腾讯科技(深圳)有限公司 异常数据检测方法及装置、数据预处理方法及系统
CN109583470A (zh) * 2018-10-17 2019-04-05 阿里巴巴集团控股有限公司 一种异常检测的解释特征确定方法和装置
CN109726737A (zh) * 2018-11-27 2019-05-07 武汉极意网络科技有限公司 基于轨迹的异常行为检测方法及装置
CN109684118A (zh) * 2018-12-10 2019-04-26 深圳前海微众银行股份有限公司 异常数据的检测方法、装置、设备及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117592823A (zh) * 2024-01-19 2024-02-23 天津路联智通交通科技有限公司 一种土木建筑污水处理方法及系统
CN117592823B (zh) * 2024-01-19 2024-03-29 天津路联智通交通科技有限公司 一种土木建筑污水处理方法及系统

Similar Documents

Publication Publication Date Title
US11562065B2 (en) Data breach detection
CN109844749B (zh) 一种基于图算法的节点异常检测方法、装置及存储装置
CN110378430B (zh) 一种基于多模型融合的网络入侵检测的方法及系统
CN105337985A (zh) 一种攻击检测方法及系统
Yun et al. An efficient mining algorithm for maximal weighted frequent patterns in transactional databases
CN111259397B (zh) 一种基于马尔科夫图和深度学习的恶意软件分类方法
CN108322428B (zh) 一种异常访问检测方法及设备
CN112884204B (zh) 网络安全风险事件预测方法及装置
CN113297840B (zh) 恶意流量账号检测方法、装置、设备和存储介质
CN113378899B (zh) 非正常账号识别方法、装置、设备和存储介质
CN111586028B (zh) 一种异常登录的评估方法、装置、服务器和存储介质
CN111507385A (zh) 一种可扩展的网络攻击行为分类方法
CN115632874A (zh) 一种实体对象的威胁检测方法、装置、设备及存储介质
CN112148763A (zh) 无监督数据异常检测方法、装置及存储介质
CN117272195A (zh) 基于图卷积注意力网络的区块链异常节点检测方法及系统
CN116611003A (zh) 一种变压器故障诊断方法、装置、介质
CN110889467A (zh) 一种公司名称匹配方法、装置、终端设备及存储介质
CN110472416A (zh) 一种网页恶意代码检测方法及相关装置
CN112333155B (zh) 一种异常流量的检测方法、系统、电子设备及存储介质
CN115941281A (zh) 一种基于双向时间卷积神经网络与多头自注意力机制的异常网络流量检测方法
US10698910B2 (en) Generating cohorts using automated weighting and multi-level ranking
CN114124564B (zh) 一种仿冒网站检测方法、装置、电子设备及存储介质
CN114978674B (zh) 一种爬虫识别增强的方法及装置、存储介质及电子设备
CN110096555B (zh) 一种分布式系统的表匹配处理方法及装置
CN115543950B (zh) 一种日志范化的数据处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone, 100176

Applicant before: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.

CB02 Change of applicant information