CN115150414A - 异常账号的检测方法、装置及计算机可读存储介质 - Google Patents

异常账号的检测方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN115150414A
CN115150414A CN202210749078.8A CN202210749078A CN115150414A CN 115150414 A CN115150414 A CN 115150414A CN 202210749078 A CN202210749078 A CN 202210749078A CN 115150414 A CN115150414 A CN 115150414A
Authority
CN
China
Prior art keywords
account
parameter
files
account numbers
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210749078.8A
Other languages
English (en)
Inventor
段赟
刘东鑫
汪来富
毕喜军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202210749078.8A priority Critical patent/CN115150414A/zh
Publication of CN115150414A publication Critical patent/CN115150414A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开提供了一种异常账号的检测方法、装置及计算机可读存储介质,涉及云存储领域,所述方法包括:获取多个账号中每个账号在预设时间段内对应的第一信息,第一信息包括IP地址、传输文件的容量和传输文件的数量中的至少一项,所传输文件包括上传文件和下载文件中的至少一种;根据每个账号对应的第一信息,确定每个账号对应的第二信息,第二信息包括至少一个参数,至少一个参数包括第一参数、第二参数和第三参数中的至少一项,第一参数与IP地址的数量正相关,第二参数与传输文件的容量正相关、且与传输文件的总容量负相关,第三参数与传输文件的数量正相关、且与传输文件的总数量负相关;根据每个账号对应的第二信息,确定多个账号中的异常账号。

Description

异常账号的检测方法、装置及计算机可读存储介质
技术领域
本公开涉及云存储技术领域,尤其是一种异常账号的检测方法、装置及计算机可读存储介质。
背景技术
公有云存储是一种基于网络的在线存储服务。公有云可以向用户提供数据的存储、共享、访问、备份等各种功能。
发明内容
发明人注意到,用户在使用公有云的情况下会出现数据上传、下载缓慢的问题;而从公有云服务商角度来看,云服务器会出现过量硬盘读写、过量硬盘空间占用的问题。
发明人进一步分析得知,出现上述问题的原因是存在非正常使用公有云的异常账号。异常账号往往上传、下载大量无意义的大文件数据,这一方面占用了网络资源,进而使正常使用公有云的用户的账号无法正常进行数据上传、下载;另一方面,使云服务器出现过量硬盘读写、过量硬盘空间占用的问题。因此,如果能确定异常账号将对解决上述问题有很大的帮助。
本公开实施例提出了如下解决方案,可以准确地确定异常账号。
根据本公开实施例的一方面,提供一种异常账号的检测方法,包括:获取多个账号中每个账号在预设时间段内对应的第一信息,所述第一信息包括互联网协议IP地址、传输文件的容量和所述传输文件的数量中的至少一项,所传输文件包括上传文件和下载文件中的至少一种;根据每个账号对应的第一信息,确定每个账号对应的第二信息,所述第二信息包括至少一个参数,所述至少一个参数包括第一参数、第二参数和第三参数中的至少一项,所述第一参数与IP地址的数量正相关,所述第二参数与所述传输文件的容量正相关、且与所述多个账号在所述预设时间段内所述传输文件的总容量负相关,所述第三参数与所述传输文件的数量正相关、且与所述多个账号在所述预设时间段内所述传输文件的总数量负相关;根据每个账号对应的第二信息,确定所述多个账号中的异常账号。
在一些实施例中,所述第一信息包括IP地址、所述传输文件的容量和所述传输文件的数量中的多项,所述第二信息包括所述第一参数、所述第二参数和所述第三参数中的多项。
在一些实施例中,所述第一信息包括IP地址、所述传输文件的容量和所述传输文件的数量,所述第二信息包括所述第一参数、所述第二参数和所述第三参数。
在一些实施例中,所述第一信息还包括第一组信息和第二组信息中的至少一组,其中:所述第一组信息包括存储容量和已使用存储容量;所述第二组信息包括存储文件的数量和所述存储文件中每类存储文件的数量。
在一些实施例中,根据每个账号对应的第一信息,确定每个账号对应的第二信息包括:根据所述第一组信息,确定所述多个账号中每个账号在预设时间段内的存储容量使用率,所述存储容量使用率与所述已使用存储容量正相关、且与所述存储容量负相关;其中,所述至少一个参数还包括第四参数、第五参数和第六参数中的至少一项,所述第四参数与所述存储容量使用率正相关、且与所述多个账号在预设时间段内的存储容量使用率的平均值负相关,所述第五参数与所述存储文件中每类存储文件的数量正相关、且与所述存储文件的数量负相关,所述第六参数与所述存储文件的数量正相关、且与所述多个账号在所述预设时间段内所述存储文件的总数量负相关。
在一些实施例中,所述第一参数是在所述预设时间段内的IP地址的变化率。
在一些实施例中,所述第二参数是factor-sizei
Figure BDA0003720574060000021
Figure BDA0003720574060000031
其中,load-sizei表示第i个账号对应的传输文件的容量,k表示所述多个账号的数量,n大于1。
在一些实施例中,所述第三参数是factor-numi
Figure BDA0003720574060000032
Figure BDA0003720574060000033
其中,load-numi表示第i个账号对应的传输文件的数量,k表示所述多个账号的数量,n大于1。
在一些实施例中,所述第四参数是cap-percent-factori
Figure BDA0003720574060000034
其中,
Figure BDA0003720574060000035
Figure BDA0003720574060000036
cap-usedi表示第i个账号对应的已使用存储容量,cap-sizei表示第i个账号对应的存储容量,k表示所述多个账号的数量。
在一些实施例中,所述第五参数是Xi
Figure BDA0003720574060000037
其中,X-numi表示第i个账号的存储文件类型为X的对应的存储文件的数量,file-numi表示第i个账号对应的存储文件的数量。
在一些实施例中,所述第六参数是factor-file-numi,
Figure BDA0003720574060000038
其中,file-numi表示第i个账号对应的存储文件的数量,k表示所述多个账号的数量,n大于1。
在一些实施例中,所述根据每个账号对应的第二信息,确定所述多个账号中的异常账号包括:构建每个账号对应的向量,所述向量中的元素包括所述至少一个参数;根据所述多个账号对应的多个向量,确定所述多个账号中的异常账号。
在一些实施例中,所述根据所述多个账号对应的多个向量,确定所述多个账号中的异常账号包括:对每个账号对应的向量进行聚类,得到聚类中心;根据第一集合和第二集合中的至少一个,确定所述多个账号中的异常账号,所述第一集合包括每个账号对应的向量到所述聚类中心的夹角余弦值,所述第二集合包括每个账号对应的向量与所述多个账号对应的多个向量的平均值的偏差值。
在一些实施例中,所述根据第一集合和第二集合中的至少一个,确定所述多个账号中的异常账号包括:确定所述第一集合中不大于第一参考数值的夹角余弦值对应的第一组账号;根据所述第一组账号确定所述多个账号中的异常账号。
在一些实施例中,所述根据所述第一组账号确定所述多个账号中的异常账号包括:确定所述第二集合中不大于第二参考数值的偏差值对应的第二组账号;根据所述第一组账号和所述第二组账号确定所述多个账号中的异常账号。
在一些实施例中,所述根据所述第一组账号和所述第二组账号确定所述多个账号中的异常账号包括:以所述第一组账号和所述第二组账号的交集中的账号作为所述多个账号中的异常账号。
在一些实施例中,所述聚类中心的数量为1。
根据本公开实施例的还一方面,提供一种异常账号的检测装置,包括获取模块,被配置为获取多个账号中每个账号在预设时间段内对应的第一信息,所述第一信息包括互联网协议IP地址、传输文件的容量和所述传输文件的数量中的至少一项,所传输文件包括上传文件和下载文件中的至少一种;第一确定模块,被配置为根据每个账号对应的第一信息,确定每个账号对应的第二信息,所述第二信息包括至少一个参数,所述至少一个参数包括第一参数、第二参数和第三参数中的至少一项,所述第一参数与IP地址的数量正相关,所述第二参数与所述传输文件的容量正相关、且与所述多个账号在所述预设时间段内所述传输文件的总容量负相关,所述第三参数与所述传输文件的数量正相关、且与所述多个账号在所述预设时间段内所述传输文件的总数量负相关;第二确定模块,被配置为根据每个账号对应的第二信息,确定所述多个账号中的异常账号。
根据本公开实施例的还一方面,提供一种异常账号的检测装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行上述任意一个实施例所述的方法。
根据本公开实施例的还一方面,提供一种计算机可读存储介质,包括计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述任意一个实施例所述的方法。
根据本公开实施例的还一方面,提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序被处理器执行时实现上述任意一个实施例所述的方法。
本公开实施例中,通过利用在预设时间段内账号的IP地址、传输文件的容量和传输文件的数量中的至少一项,进而得到与其对应的第一参数、第二参数和第三参数中的至少一项,进而根据至少一个参数确定出异常账号,从而可以准确地确定异常账号。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本公开一些实施例的异常账号的检测方法的流程示意图;
图2是根据本公开一些实施例的异常账号的检测装置的结构示意图;
图3是根据本公开另一些实施例的异常账号的检测装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
另外,在本公开的描述中,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性和顺序。类似地,虽然在附图中以特定次序描绘了操作,但是这不应该被理解为要求以所示的特定次序或者以顺序次序执行这样的操作,或者要求执行所有图示的操作以实现所希望的结果。在某些情况下,多任务处理和并行处理可以是有利的。
本公开所使用的与账号对应的信息均已经过脱敏处理,即通过与账号对应的信息不能反推出与账号对应的用户的隐私数据。
图1是根据本公开一些实施例的异常账号的检测方法的流程示意图。
在步骤102,获取多个账号中每个账号在预设时间段内对应的第一信息。这里,第一信息包括IP地址、传输文件的容量和传输文件的数量中的至少一项,所传输文件包括上传文件和下载文件中的至少一种。
在一些实施例中,传输文件的数量可以是上传文件的数量或下载文件的数量。在另一些实施例中,传输文件的数量可以是上传文件和下载文件的总数量。
在一些实施例中,传输文件的容量可以是上传文件的大小或下载文件的大小。在另一些实施例中,传输文件的容量可以是上传文件和下载文件的总大小。
在一些实施例中,第一信息包括IP地址、传输文件的容量和传输文件的数量中的一项。
在另一些实施例中,第一信息包括IP地址、传输文件的容量和传输文件的数量中的多项。例如,第一信息包括IP地址和传输文件的容量。又例如,第一信息包括IP地址和传输文件的数量。又例如,第一信息包括传输文件的容量和传输文件的数量。如此,有助于更准确地确定异常账号。
在又一些实施例中,第一信息包括IP地址、传输文件的容量和传输文件的数量。如此,有助于进一步准确地确定异常账号。
在步骤104,根据每个账号对应的第一信息,确定每个账号对应的第二信息。这里,第二信息包括至少一个参数,这至少一个参数包括第一参数、第二参数和第三参数中的至少一项。例如,第二信息包括第一参数。又例如,第二信息包括第二参数。又例如,第二信息包括第三参数。
具体而言,第一参数与IP地址的数量正相关,第二参数与传输文件的容量正相关、且与多个账号在预设时间段内传输文件的总容量负相关,第三参数与传输文件的数量正相关、且与多个账号在预设时间段内传输文件的总数量负相关。
作为一些实施方式,第一参数可以是在预设时间段内的IP地址的变化率(ip-ratei)。这里,计算IP地址变化率所利用的IP地址是经过去重的IP地址。例如,预设时间段Δt内的IP地址和时间戳(timestamp)为{IP1 t1,IP2 t2,IP3 t3,……,IPm tm},对其中的IP地址进行去重,统计IP地址的总数量(iptotal),这样的方式下,
Figure BDA0003720574060000081
作为一些实施方式,第二参数可以表示为:
Figure BDA0003720574060000082
其中,load-sizei表示第i个账号对应的传输文件的容量,k表示预设时间段内账号的总数量。
作为一些实施方式,第三参数可以表示为:
Figure BDA0003720574060000083
其中,load-numi表示第i个账号对应的传输文件的数量,k表示预设时间段内账号的总数量。
在一些实施例中,第二信息包括第一参数、第二参数和第三参数中的多项。例如,第二信息包括第一参数和第二参数。例如,第二信息包括第一参数和第三参数。例如,第二信息包括第二参数和第三参数。如此,有助于更准确地确定异常账号。
在另一些实施例中,第二信息包括第一参数、第二参数和第三参数。如此,有助于进一步准确地确定异常账号。
在步骤106,根据每个账号对应的第二信息,确定多个账号中的异常账号。
在一些实施例中,可以利用向量确定异常账号,在后续的实施例中将详细描述该方式。
如此,通过利用在预设时间段内账号的IP地址、传输文件的容量和传输文件的数量中的至少一项,进而得到与其对应的第一参数、第二参数和第三参数中的至少一项,进而根据至少一个参数确定出异常账号,从而一方面可以使正常使用公有云的账号正常进行数据上传、下载;另一方面,可以减少云服务器出现过量硬盘读写、过量硬盘空间占用的问题的发生。
在一些实施例中,步骤102中获取的第一信息还包括第一组信息和第二组信息中的至少一组。这里,第一组信息包括存储容量和已使用存储容量,第二组信息包括存储文件的数量和存储文件中每类存储文件的数量。
在一些实施例中,存储容量可以是某个账号在公有云的总存储空间,已使用存储容量可以是该账号在公有云中已使用的存储空间。
在一些实施例中,存储文件的类型可以包括文档、图片、音频和视频。
在一些实施例中,可以根据第一组信息,确定多个账号中每个账号在预设时间段内的存储容量使用率。这里,存储容量使用率与已使用存储容量正相关、且与存储容量负相关。
作为一些实施方式,存储容量使用率(cap-percenti)可以表示为:
Figure BDA0003720574060000091
其中,cap-usedi表示第i个账号对应的已使用存储容量,cap-sizei表示第i个账号对应的存储容量。
在一些实施例中,步骤104中确定的第二信息中的至少一个参数还包括第四参数、第五参数和第六参数中的至少一项,第四参数与存储容量使用率正相关、且与多个账号在预设时间段内的存储容量使用率的平均值负相关,第五参数与存储文件中每类存储文件的数量正相关、且与存储文件的数量负相关,第六参数与存储文件的数量正相关、且与多个账号在预设时间段内存储文件的总数量负相关。
作为一些实施方式,第四参数是账号存储容量使用率系数(cap-percent-factori):
Figure BDA0003720574060000092
其中,
Figure BDA0003720574060000093
k表示预设时间段内账号的总数量。
作为一些实施方式,第五参数是Xi
Figure BDA0003720574060000094
其中,X-numi表示第i个账号的存储文件类型为X的对应的存储文件的数量,file-numi表示第i个账号对应的存储文件的数量。
作为一些实施方式,第六参数可以表示为:
Figure BDA0003720574060000101
其中,file-numi表示第i个账号对应的存储文件的数量,k表示预设时间段内账号的总数量。
如此,可以考虑到每个账号的存储容量、已使用存储容量、存储文件的数量和存储文件中每类存储文件的数量,进而在后续确定第二信息的情况下得到考虑了更多因素的第二信息,从而可以提高确定异常账号的准确性。
作为又一些实施方式,第二参数是账号传输文件容量系数(factor-sizei):
Figure BDA0003720574060000102
其中,load-sizei表示第i个账号对应的传输文件的容量,k表示预设时间段内账号的总数量,n大于1。例如,n可以为10。
作为又一些实施方式,第三参数是账号传输文件数量系数(factor-numi):
Figure BDA0003720574060000103
其中,load-numi表示第i个账号对应的传输文件的数量,k表示预设时间段内账号的总数量,n大于1。例如,n可以为10。
作为又一些实施方式,第六参数是帐号文件数量系数(factor-file-numi):
Figure BDA0003720574060000104
其中,file-numi表示第i个账号对应的存储文件的数量,k表示预设时间段内账号的总数量,n大于1。例如,n可以为10。
如此,通过将底数大于1的对数值作为对应的参数的权重,进而使占比多的值(例如,load-sizei、load-numi、file-numi中的任意一项或多项)产生的影响更大,从而可以提高确定异常账号的准确性。
在一些实施例中,可以通过构建每个账号对应的向量并利用多个账号对应的多个向量,确定多个账号中的异常账号。这里,向量中的元素包括至少一个参数。
作为一些实施方式,可以对每个账号对应的向量进行聚类以得到聚类中心,根据第一集合和第二集合中的至少一个,确定多个账号中的异常账号。
这里,第一集合包括每个账号对应的向量到聚类中心的夹角余弦值,第二集合包括每个账号对应的向量与多个账号对应的多个向量的平均值的偏差值。
例如,第一集合包括的每个账号对应的向量到聚类中心的夹角余弦值可以是该向量和聚类中心的数量积与该向量的模和聚类中心的模的乘积的比值。
又例如,第二集合包括的每个账号对应的向量与多个账号对应的多个向量的平均值的偏差值可以是每个账号对应的向量与该平均值的欧氏距离。
如此,将每个账号对应的向量到聚类中心的夹角余弦值和每个账号对应的向量与多个账号对应的多个向量的平均值的偏差值归入两个不同的集合,即以两种不同的方式得到两个集合,进而在每个账号对应的向量中具有对应账号的数个特征的前提下,以数值的形式量化出账号的区别,从而可以进一步提高确定异常账号的准确性。
在一些实施例中,可以使用K均值聚类(K-means)算法对每个账号对应的向量进行聚类以得到聚类中心。
作为一些实施方式,K值可以设置为1,聚类将得到一个聚类中心(即,中心向量),该中心向量的每个特征为对应特征的平均值。
例如,对向量[a1,b1,c1]、向量[a2,b2,c2]、向量[a3,b3,c3]使用K值为1的K-means聚类得到的聚类中心为
Figure BDA0003720574060000111
Figure BDA0003720574060000112
如此,K值设置为1可以使聚类得到一个聚类中心,该聚类中心考虑了每个向量中所有的特征,从而可以进一步提高确定异常账号的准确性。
在一些实施例中,可以确定第一集合中不大于第一参考数值的夹角余弦值对应的第一组账号,根据第一组账号确定多个账号中的异常账号。
作为一些实施方式,可以对第一集合中的夹角余弦值进行排序,取不大于第一参考数值数量的夹角余弦值对应的账号作为多个账号中的异常账号。这里,排序例如可以是从小到大,即夹角余弦值越小(与聚类中心差距越大)的排位更靠前。
作为又一些实施方式,可以将第一集合中不大于第一参考数值的夹角余弦值对应的账号作为多个账号中的异常账号。
在一些实施例中,可以确定第二集合中不大于第二参考数值的偏差值对应的第二组账号,根据第二组账号确定多个账号中的异常账号。
作为一些实施方式,可以对第二集合中的偏差值进行排序,取不大于第二参考数值数量的偏差值对应的账号作为多个账号中的异常账号。这里,排序例如可以是从大到小,即偏差值越大(与平均值差距越大)的排位更靠前。
作为又一些实施方式,可以将第二集合中不大于第二参考数值的偏差值对应的账号作为多个账号中的异常账号。
如此,对夹角余弦值或偏差值形式量化出的账号区别以取不小于预定数量或排序的方式进行选择,进而确定多个账号中的异常账号,从而更准确地确定异常账号。
在一些实施例中,确定第二集合中不大于第二参考数值的偏差值对应的第二组账号,根据所第一组账号和第二组账号确定多个账号中的异常账号。
作为一些实施方式,以第一组账号和第二组账号的交集中的账号作为多个账号中的异常账号。
如此,对夹角余弦值和偏差值形式量化出的账号区别以取不小于预定数量和排序的方式进行选择,进而再以取交集的形式确定多个账号中的异常账号,从而进一步提高了确定异常账号的准确性。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于装置实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图2是根据本公开一些实施例的异常账号的检测装置的结构示意图。
如图2所示,异常账号的检测装置包括获取模块201,被配置为获取多个账号中每个账号在预设时间段内对应的第一信息,第一信息包括互联网协议IP地址、传输文件的容量和传输文件的数量中的至少一项,所传输文件包括上传文件和下载文件中的至少一种;第一确定模块202,被配置为根据每个账号对应的第一信息,确定每个账号对应的第二信息,第二信息包括至少一个参数,至少一个参数包括第一参数、第二参数和第三参数中的至少一项,第一参数与IP地址的数量正相关,第二参数与传输文件的容量正相关、且与多个账号在预设时间段内传输文件的总容量负相关,第三参数与传输文件的数量正相关、且与多个账号在预设时间段内传输文件的总数量负相关;第二确定模块203,被配置为根据每个账号对应的第二信息,确定多个账号中的异常账号。
图3是根据本公开又一些实施例的异常账号的检测装置的结构示意图。
如图3所示,异常账号的检测装置300包括存储器301以及耦接至该存储器301的处理器302,处理器302被配置为基于存储在存储器301中的指令,执行前述任意一个实施例的方法。
存储器301例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如可以存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。
异常账号的检测装置300还可以包括输入输出接口303、网络接口304、存储接口305等。这些接口303、304、305之间、以及存储器301与处理器302之间例如可以通过总线306连接。输入输出接口303为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口304为各种联网设备提供连接接口。存储接口305为SD卡、U盘等外置存储设备提供连接接口。
本公开实施例还提供了一种计算机可读存储介质,包括计算机程序指令,该计算机程序指令被处理器执行时实现上述任意一个实施例的方法。
本公开实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任意一个实施例的方法。
至此,已经详细描述了本公开的各实施例。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解,可由计算机程序指令实现流程图中一个流程或多个流程和/或方框图中一个方框或多个方框中指定的功能。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改或者对部分技术特征进行等同替换。本公开的范围由所附权利要求来限定。

Claims (21)

1.一种异常账号的检测方法,包括:
获取多个账号中每个账号在预设时间段内对应的第一信息,所述第一信息包括互联网协议IP地址、传输文件的容量和所述传输文件的数量中的至少一项,所传输文件包括上传文件和下载文件中的至少一种;
根据每个账号对应的第一信息,确定每个账号对应的第二信息,所述第二信息包括至少一个参数,所述至少一个参数包括第一参数、第二参数和第三参数中的至少一项,所述第一参数与IP地址的数量正相关,所述第二参数与所述传输文件的容量正相关、且与所述多个账号在所述预设时间段内所述传输文件的总容量负相关,所述第三参数与所述传输文件的数量正相关、且与所述多个账号在所述预设时间段内所述传输文件的总数量负相关;
根据每个账号对应的第二信息,确定所述多个账号中的异常账号。
2.根据权利要求1所述的方法,其中,所述第一信息包括IP地址、所述传输文件的容量和所述传输文件的数量中的多项,所述第二信息包括所述第一参数、所述第二参数和所述第三参数中的多项。
3.根据权利要求2所述的方法,其中,所述第一信息包括IP地址、所述传输文件的容量和所述传输文件的数量,所述第二信息包括所述第一参数、所述第二参数和所述第三参数。
4.根据权利要求1所述的方法,其中,所述第一信息还包括第一组信息和第二组信息中的至少一组,其中:
所述第一组信息包括存储容量和已使用存储容量;
所述第二组信息包括存储文件的数量和所述存储文件中每类存储文件的数量。
5.根据权利要求4所述的方法,其中,根据每个账号对应的第一信息,确定每个账号对应的第二信息包括:
根据所述第一组信息,确定所述多个账号中每个账号在预设时间段内的存储容量使用率,所述存储容量使用率与所述已使用存储容量正相关、且与所述存储容量负相关;
其中,所述至少一个参数还包括第四参数、第五参数和第六参数中的至少一项,所述第四参数与所述存储容量使用率正相关、且与所述多个账号在预设时间段内的存储容量使用率的平均值负相关,所述第五参数与所述存储文件中每类存储文件的数量正相关、且与所述存储文件的数量负相关,所述第六参数与所述存储文件的数量正相关、且与所述多个账号在所述预设时间段内所述存储文件的总数量负相关。
6.根据权利要求1-5任意一项所述的方法,其中,所述第一参数是在所述预设时间段内的IP地址的变化率。
7.根据权利要求1-5任意一项所述的方法,其中,所述第二参数是factor-sizei
Figure FDA0003720574050000021
其中,load-sizei表示第i个账号对应的传输文件的容量,k表示所述多个账号的数量,n大于1。
8.根据权利要求1-5任意一项所述的方法,其中,所述第三参数是factor-numi
Figure FDA0003720574050000022
其中,load-numi表示第i个账号对应的传输文件的数量,k表示所述多个账号的数量,n大于1。
9.根据权利要求5所述的方法,其中,所述第四参数是cap-percent-factori
Figure FDA0003720574050000031
其中,
Figure FDA0003720574050000032
Figure FDA0003720574050000033
cap-usedi表示第i个账号对应的已使用存储容量,cap-sizei表示第i个账号对应的存储容量,k表示所述多个账号的数量。
10.根据权利要求5所述的方法,其中,所述第五参数是Xi
Figure FDA0003720574050000034
其中,X-numi表示第i个账号的存储文件类型为X的对应的存储文件的数量,file-numi表示第i个账号对应的存储文件的数量。
11.根据权利要求5所述的方法,其中,所述第六参数是factor-file-numi
Figure FDA0003720574050000035
其中,file-numi表示第i个账号对应的存储文件的数量,k表示所述多个账号的数量,n大于1。
12.根据权利要求1-5任意一项所述的方法,其中,所述根据每个账号对应的第二信息,确定所述多个账号中的异常账号包括:
构建每个账号对应的向量,所述向量中的元素包括所述至少一个参数;
根据所述多个账号对应的多个向量,确定所述多个账号中的异常账号。
13.根据权利要求12所述的方法,其中,所述根据所述多个账号对应的多个向量,确定所述多个账号中的异常账号包括:
对每个账号对应的向量进行聚类,得到聚类中心;
根据第一集合和第二集合中的至少一个,确定所述多个账号中的异常账号,所述第一集合包括每个账号对应的向量到所述聚类中心的夹角余弦值,所述第二集合包括每个账号对应的向量与所述多个账号对应的多个向量的平均值的偏差值。
14.根据权利要求13所述的方法,其中,所述根据第一集合和第二集合中的至少一个,确定所述多个账号中的异常账号包括:
确定所述第一集合中不大于第一参考数值的夹角余弦值对应的第一组账号;
根据所述第一组账号确定所述多个账号中的异常账号。
15.根据权利要求14所述的方法,其中,所述根据所述第一组账号确定所述多个账号中的异常账号包括:
确定所述第二集合中不大于第二参考数值的偏差值对应的第二组账号;
根据所述第一组账号和所述第二组账号确定所述多个账号中的异常账号。
16.根据权利要求15所述的方法,其中,所述根据所述第一组账号和所述第二组账号确定所述多个账号中的异常账号包括:
以所述第一组账号和所述第二组账号的交集中的账号作为所述多个账号中的异常账号。
17.根据权利要求13所述的方法,其中,所述聚类中心的数量为1。
18.一种异常账号的检测装置,包括:
获取模块,被配置为获取多个账号中每个账号在预设时间段内对应的第一信息,所述第一信息包括互联网协议IP地址、传输文件的容量和所述传输文件的数量中的至少一项,所传输文件包括上传文件和下载文件中的至少一种;
第一确定模块,被配置为根据每个账号对应的第一信息,确定每个账号对应的第二信息,所述第二信息包括至少一个参数,所述至少一个参数包括第一参数、第二参数和第三参数中的至少一项,所述第一参数与IP地址的数量正相关,所述第二参数与所述传输文件的容量正相关、且与所述多个账号在所述预设时间段内所述传输文件的总容量负相关,所述第三参数与所述传输文件的数量正相关、且与所述多个账号在所述预设时间段内所述传输文件的总数量负相关;
第二确定模块,被配置为根据每个账号对应的第二信息,确定所述多个账号中的异常账号。
19.一种异常账号的检测装置,包括:
存储器;以及
耦接至所述存储器的处理器,被配置为基于存储在所述存储器中的指令,执行权利要求1-17任意一项所述的方法。
20.一种计算机可读存储介质,包括计算机程序指令,其中,所述计算机程序指令被处理器执行时实现权利要求1-17任意一项所述的方法。
21.一种计算机程序产品,包括计算机程序,其中,所述计算机程序被处理器执行时实现权利要求1-17任意一项所述的方法。
CN202210749078.8A 2022-06-29 2022-06-29 异常账号的检测方法、装置及计算机可读存储介质 Pending CN115150414A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210749078.8A CN115150414A (zh) 2022-06-29 2022-06-29 异常账号的检测方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210749078.8A CN115150414A (zh) 2022-06-29 2022-06-29 异常账号的检测方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN115150414A true CN115150414A (zh) 2022-10-04

Family

ID=83409417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210749078.8A Pending CN115150414A (zh) 2022-06-29 2022-06-29 异常账号的检测方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN115150414A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015032318A1 (zh) * 2013-09-03 2015-03-12 腾讯科技(深圳)有限公司 异常账号确定方法及装置
CN109698809A (zh) * 2017-10-20 2019-04-30 中移(苏州)软件技术有限公司 一种账号异常登录的识别方法及装置
CN111064719A (zh) * 2019-12-09 2020-04-24 北京神州绿盟信息安全科技股份有限公司 文件异常下载行为的检测方法及装置
CN111600874A (zh) * 2020-05-13 2020-08-28 奇安信科技集团股份有限公司 用户账号检测方法、装置、电子设备、介质和程序产品
CN114389875A (zh) * 2022-01-12 2022-04-22 国网山东省电力公司泰安供电公司 一种人机行为检测方法、系统、设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015032318A1 (zh) * 2013-09-03 2015-03-12 腾讯科技(深圳)有限公司 异常账号确定方法及装置
CN109698809A (zh) * 2017-10-20 2019-04-30 中移(苏州)软件技术有限公司 一种账号异常登录的识别方法及装置
CN111064719A (zh) * 2019-12-09 2020-04-24 北京神州绿盟信息安全科技股份有限公司 文件异常下载行为的检测方法及装置
CN111600874A (zh) * 2020-05-13 2020-08-28 奇安信科技集团股份有限公司 用户账号检测方法、装置、电子设备、介质和程序产品
CN114389875A (zh) * 2022-01-12 2022-04-22 国网山东省电力公司泰安供电公司 一种人机行为检测方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
US10114845B2 (en) Efficiently estimating compression ratio in a deduplicating file system
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
CN109492180A (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN109710780A (zh) 一种归档方法及装置
CN110087228B (zh) 一种业务套餐的确定方法及装置
WO2019061664A1 (zh) 电子装置、基于用户上网数据的产品推荐方法及存储介质
CN105335368B (zh) 一种产品聚类方法及装置
CN111046045A (zh) 处理数据倾斜的方法、装置、设备及存储介质
CN108876644B (zh) 一种基于社交网络的相似账号计算方法及装置
CN114780606B (zh) 一种大数据挖掘方法及系统
CN111984733A (zh) 基于区块链的数据传输方法、装置及存储介质
CN110083775B (zh) 一种推荐资源的配置方法及配置装置
CN108171570A (zh) 一种数据筛选方法、装置及终端
CN111694923A (zh) 基于名称映射的参数赋值方法、装置、计算机设备
WO2017095413A1 (en) Incremental automatic update of ranked neighbor lists based on k-th nearest neighbors
CN111737206B (zh) 一种文件重删处理方法、系统、终端及存储介质
CN111198961A (zh) 商品搜索方法、装置及服务器
CN110708361B (zh) 数字内容发布用户的等级确定系统、方法、装置及服务器
CN115150414A (zh) 异常账号的检测方法、装置及计算机可读存储介质
CN113342762B (zh) 针对商户好友的共享消息的智能处理方法及相关装置
CN112764935B (zh) 大数据处理方法、装置、电子设备及存储介质
CN113901417A (zh) 一种移动设备指纹生成方法及可读存储介质
CN113849125A (zh) 一种cdn服务器磁盘读取的方法、装置及系统
CN112685371A (zh) 基于大数据的文件存储空间分配方法、装置及存储介质
US20140351020A1 (en) Estimating the total sales over streaming bids

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination