CN112508630A - 异常会话群的检测方法、装置、计算机设备和存储介质 - Google Patents
异常会话群的检测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112508630A CN112508630A CN202110127014.XA CN202110127014A CN112508630A CN 112508630 A CN112508630 A CN 112508630A CN 202110127014 A CN202110127014 A CN 202110127014A CN 112508630 A CN112508630 A CN 112508630A
- Authority
- CN
- China
- Prior art keywords
- target
- group
- session
- session group
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请涉及一种异常会话群的检测方法、装置、计算机设备和存储介质。所述方法包括:获取目标会话群集合;获取目标会话群对应的推送内容操作记录集合;对推送内容操作记录集合中目标特征维度对应的操作特征进行聚合;基于目标会话群对应的目标操作特征集合对聚合得到的目标会话群集合进行群组划分,得到至少一个会话群组;从至少一个会话群组中确定异常会话群组,将异常会话群组所对应的目标会话群作为异常会话群。其中群组划分可以是基于人工智能的模型进行划分的,人工智能模型可以存储在云服务器中,从而提供人工智能云服务。上述方案,基于目标操作特征集合将相关联的会话群划分到同一会话群组中,可以得到异常会话群的准确检测结果。
Description
技术领域
本申请涉及网络技术领域,特别是涉及一种异常会话群的检测方法、装置、计算机设备和存储介质。
背景技术
随着网络技术的发展,用户可以通过网络进行内容推送例如广告投放等操作。广告主往往会通过各种途径实现广告的投放。目前,主要通过媒体、网站或软件等流量主来实现广告投放,以向网络用户展示广告。
然而,经常存在网络用户对推送的内容进行恶意点击等作弊行为。传统的方法中,主要是分析网络用户点击行为的转化率等指标来对异常网络用户进行检测,但是这种检测方法准确性低。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
基于此,有必要针对上述技术问题,提供一种异常会话群的检测方法、装置、计算机设备和存储介质。
一种异常会话群的检测方法,所述方法包括:获取目标会话群集合,所述目标会话群集合包括多个目标会话群;获取所述目标会话群对应的推送内容操作记录集合,所述推送内容操作记录集合包括多个推送内容操作记录,所述推送内容操作记录是响应于对所述目标会话群中的会话推送内容的操作生成的;对所述推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到所述目标会话群对应的目标操作特征集合;基于所述目标会话群对应的目标操作特征集合对所述目标会话群集合进行群组划分,得到至少一个会话群组;从所述至少一个会话群组中确定异常会话群组,将所述异常会话群组所对应的目标会话群作为异常会话群。
一种异常会话群的检测装置,所述装置包括:会话群集合获取模块,用于获取目标会话群集合,所述目标会话群集合包括多个目标会话群;记录集合获取模块,用于获取所述目标会话群对应的推送内容操作记录集合,所述推送内容操作记录集合包括多个推送内容操作记录,所述推送内容操作记录是响应于对所述目标会话群中的会话推送内容的操作生成的;操作特征聚合模块,用于对所述推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到所述目标会话群对应的目标操作特征集合;群组划分模块,用于基于所述目标会话群对应的目标操作特征集合对所述目标会话群集合进行群组划分,得到至少一个会话群组;异常会话群确定模块,用于从所述至少一个会话群组集合中确定异常会话群组,将所述异常会话群组所对应的目标会话群作为异常会话群。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取目标会话群集合,所述目标会话群集合包括多个目标会话群;获取所述目标会话群对应的推送内容操作记录集合,所述推送内容操作记录集合包括多个推送内容操作记录,所述推送内容操作记录是响应于对所述目标会话群中的会话推送内容的操作生成的;对所述推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到所述目标会话群对应的目标操作特征集合;基于所述目标会话群对应的目标操作特征集合对所述目标会话群集合进行群组划分,得到至少一个会话群组;从所述至少一个会话群组中确定异常会话群组,将所述异常会话群组所对应的目标会话群作为异常会话群。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取目标会话群集合,所述目标会话群集合包括多个目标会话群;获取所述目标会话群对应的推送内容操作记录集合,所述推送内容操作记录集合包括多个推送内容操作记录,所述推送内容操作记录是响应于对所述目标会话群中的会话推送内容的操作生成的;对所述推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到所述目标会话群对应的目标操作特征集合;基于所述目标会话群对应的目标操作特征集合对所述目标会话群集合进行群组划分,得到至少一个会话群组;从所述至少一个会话群组中确定异常会话群组,将所述异常会话群组所对应的目标会话群作为异常会话群。
上述异常会话群的检测方法、装置、计算机设备和存储介质,在进行异常会话群检测时,是通过获取多个目标会话群进行检测的,通过获取目标会话群对应的推送内容操作记录集合,按照目标特征维度提取推送内容操作记录集合中的操作特征,从而能够挖掘到各个目标特征维度中代表会话群的特征,将挖掘到的操作特征聚合到目标操作特征集合中,基于目标操作特征集合进行聚类,以对目标会话群集合进行群组划分,能将相关联的恶意会话群划分到同一会话群组中,据此确定的异常会话群组具有较高的准确性,提高了异常检测准确度。
附图说明
图1为一个实施例中异常会话群的检测方法的应用环境图;
图2为一个实施例中异常会话群的检测方法的流程示意图;
图3为一个实施例中聚合得到操作特征集合的过程示意图;
图4为另一个实施例中聚合得到操作特征集合的过程示意图;
图5为一个实施例中对群网络关系图进行群组划分的示意图;
图6为一个实施例中会话群组的结构示意图;
图7为另一个实施例中异常会话群的检测方法的流程示意图;
图8为在一个实施例中异常会话群的检测方法的流程示意图;
图9为一个实施例中异常会话群的检测装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的异常会话群的检测方法、装置、计算机设备和存储介质,可以通过云技术实现。其中,云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
在一个实施例中,可以通过云技术进行大数据处理,以实现异常会话群的检测方法、装置、计算机设备和存储介质。其中,大数据(Big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。具体地,获取会话群对应的推送内容操作记录集合,基于大数据的技术对推送内容操作记录集合进行处理以确定异常会话群,实现异常会话群的准确检测。
在一个实施例中,如本申请所公开的异常会话群的检测方法或装置,可以应用于服务器。其中多个服务器可组成为一区块链系统,而服务器为区块链系统中的节点。服务器可以将推送内容操作记录集合等数据记录到区块链中,以通过区块链的不可篡改性实现数据的可靠记录。也可以将所确定的异常会话群信息记录到区块链中,并基于区块链平台实现对异常会话群的可靠监督。
在一个实施例中,本申请提供的异常会话群的检测方法、装置、计算机设备和存储介质,可以通过人工智能技术实现。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。本申请实施例提供的方案涉及人工智能的机器学习或者图神经网络等技术,具体通过如下实施例进行说明。
本申请提供的异常会话群的检测方法,可以应用于如图1所示的应用环境中。该应用环境中包含终端102、终端104以及服务器106。终端102和终端104与服务器106通过网络进行通信。终端102和终端104中登录有属于同一会话群的用户。其中,终端102接收用户的触发信息向服务器106推送会话推送内容。服务器106控制终端102和终端104在界面上显示对应的会话推送内容。同一会话群中的另一用户通过终端104对会话推送内容进行点击等操作,此时终端104向服务器106发送推送内容操作记录。服务器106根据推送内容操作记录得到推送内容操作记录集合,基于推送内容操作记录集合对操作特征进行聚合得到目标操作特征集合,并基于多个会话群的目标操作特征集合对这些会话群进行群组划分,从划分得到的会话群组中确定异常会话群组,据此确定异常会话群。服务器106可以将所确定的异常会话群的相关信息存储至数据库108中,同时,可以基于数据库中的异常会话群进行网络资源限制等异常处理。
在一个实施例中,本申请提供的异常会话群的检测方法可以应用于服务器,也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,即内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
在一个实施例中,如图2所示,提供一种异常会话群的检测方法,以该方法应用于服务器为例,该方法包括以下步骤:
S202,获取目标会话群集合,目标会话群集合包括多个目标会话群。
其中,会话群可以指通过网络平台进行会话的网络用户群,可以是即时通信应用中用于会话的群。会话群中可以包括至少三个群成员,即包括至少三个用户。在会话群内,用户可以通过文本、语音或者视频等方式中的至少一种向会话群的对话框中输出会话信息,接收到会话信息的用户同样可以通过文本、语音或者视频等方式的至少一种向会话群输出会话信息,以实现会话交流。其中,文本方式可以包括网页链接的方式。对于网页链接这一会话形式,终端在显示对应的链接之后,可以通过链接对应的控件接收用户的点击操作以打开对应的网页,例如:用户在群内发送广告链接,群内的用户可以点击该广告链接,此时终端在界面显示对应的广告内容。
目标会话群可以指特定网络平台下的会话群,例如即时通信工具下的群。多个目标会话群可以指至少两个目标会话群。其中,获取目标会话群的实现方式可以为:获取活跃度大于预设活跃度阈值的会话群,例如会话消息数量大于预设数量的会话群;也可以是获取群规模大于预设群规模阈值的会话群。
S204,获取目标会话群对应的推送内容操作记录集合,推送内容操作记录集合包括多个推送内容操作记录,推送内容操作记录是响应于对目标会话群中的会话推送内容的操作生成的。
会话推送内容指的是在会话群中推送的会话消息。对于推送方式,如前所述,会话推送内容可以通过网页链接等方式实现。会话推送内容可以是指在内容展示主体中展示的文章、视频等。内容展示主体指的是对会话推送内容进行展示的主体,具体可以是目标会话群之外的对会话推送内容进行展示的主体,例如:可以是生成会话推送内容的公众号或者小程序等。还可以结合其他的信息来生成推送内容操作记录集合,以公众号为例,如果某个目标会话群中的用户均关注某一公众号,且对该公众号推送的广告进行点击等操作,则服务器可以据此获取到对应的推送内容操作记录,并生成推送内容操作记录集合。
目标会话群中出现会话推送内容后,目标会话群中的用户会对会话推送内容进行响应,例如:阅读、点击、删除或者转发等操作中的至少一种。因此,服务器可以在每一次接收到对会话推送内容的操作时记录不同特征维度下的操作特征,以生成与对应操作匹配的推送内容操作记录。其中,特征维度指的是对操作特征进行描述的角度,可以指操作特征的类型。特征维度可以包括:操作主体、操作主体所在的网络、操作主体所在的设备、操作时间或者操作编号等与操作主体相关的特征维度中的至少一项,还可以包括:推送内容对应的链接、内容展示主体或者会话用户等与会话推送内容相关的特征维度中的至少一项。其中,操作主体可以指触发阅读、点击、删除或者转发等操作的网络用户,该操作主体可以为目标会话群中的群成员。操作主体所在的网络可以指操作主体所对应的WIFI(无线宽带,WIFI也可以替换为其他网络形式)标识或者IP(Internet Protocol,网际互连协议)地址。操作主体所在的设备可以指操作主体所使用的终端设备,可以通过MAC(Media Access ControlAddress,物理地址)地址、设备型号等来表示。操作时间指的是操作主体执行操作时的时间,可以通过时间戳的方式表示。操作编号可以指在获取到针对会话推送内容的操作时服务器为操作生成的唯一性编号,以对不同操作进行区分。推送内容对应的链接指的是会话推送内容对应的网页链接,可以由产生会话推送内容的平台产生,该平台可以是会话群所在的网络平台也可以是会话群之外的网络平台。会话用户指的是发出会话推送内容的用户,可以指将会话推送内容从内容展示主体中转发至目标会话群的群成员。
在一个实施例中,服务器可以通过操作编号来对各个推送内容操作记录进行区分,即一个操作编号对应一个推送内容操作记录。基于此,在不止一个操作时,服务器可以针对性地获取到不止一个推送内容操作记录,进而可以将这些推送内容操作记录进行排列,以得到推送内容操作记录集合。
在一个实施例中,可以获取设定历史时间段内的推送内容操作记录集合。以基于历史时间段内的推送内容操作记录集合来确定异常会话群。其中,设定历史时间段可以是过去一周、过去一月或者过去一年等。
在一个实施例中,会话推送内容为预设类型的会话内容,例如可以是广告类型。可以根据会话推送内容的内容相关信息例如内容类型标识或者链接地址的至少一种确定会话推送内容为预设类型。例如,对于公众号推送的广告,对应有广告类型标识,则可以获取会话群中对应有广告类型标识的会话推送内容的操作记录集合,过滤非预设类型的操作记录集合,进而得到推送内容操作记录集合。
在一个实施例中,S204的实现过程可以为:获取设定时间段内各个目标会话群的多个推送内容操作记录,基于多个推送内容操作记录分别构建各个目标会话群对应的推送内容操作记录集合。
S206,对推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到目标会话群对应的目标操作特征集合。
在一个实施例中,推送内容操作记录集合中各个推送内容操作记录包含有至少一个特征维度对应的操作特征。其中,目标特征维度可以为推送内容操作记录对应的所有特征维度,也可以是随机选取的或者满足一定条件的部分特征维度。
在一个实施例中,目标特征维度可以指所对应的操作特征的数量满足数量阈值的特征维度。其中,数量阈值可以根据实际情况确定,例如:10或者20等。具体地,将所对应操作特征的数量小于数量阈值的特征维度确定为目标特征维度。
在一个实施例中,对推送内容操作记录集合中目标特征维度对应的操作特征进行聚合的实现方式可以为:从推送内容操作记录集合中提取各个目标特征维度对应的操作特征,每一目标特征维度对应的操作特征形成操作特征列表,基于各个目标特征维度对应的操作特征列表得到目标操作特征集合。
在一个实施例中,S206的实现方式可以为:服务器在推送内容操作记录集合的特征维度中确定目标特征维度,进而提取出这些目标特征维度对应的操作特征,将所提取的操作特征按照特定的方式排列在一起,例如:将所提取的操作特征通过列表的方式排列在一起,以实现对目标特征维度对应的操作特征进行聚合的目的,得到目标会话群对应的目标操作特征集合。
S208,基于目标会话群对应的目标操作特征集合对目标会话群集合进行群组划分,得到至少一个会话群组。
其中,会话群组指的是由会话群构成的组,一个会话群组中可以包含至少一个会话群。对目标会话群集合进行群组划分指的是将目标会话群集合中的目标会话群划分到对应的会话群组中,以使至少一个目标会话群被划分到一个会话群组中。群组划分可以通过聚类、社区划分等方式实现。其中,聚类可以采用K-means聚类、DBSCAN(Density-BasedSpatial Clustering of Applications with Noise)聚类或者层次聚类等算法。社区划分可以采用Fast Unfolding、LPA(Label Propagation Algorithm,标签传播算法)或者GN算法等算法。其中,K-means聚类(k均值聚类算法)是一种迭代求解的聚类分析算法。DBSCAN是基于密度的聚类算法。层次聚类算法按节点之间的相似度由高到低排序,逐步重新连接各个节点。Fast Unfolding算法是基于模块度对社区进行迭代划分的算法。LPA是一种基于标签传播的局部社区划分。GN算法的基本思想是不断的删除网络中具有相对于所有源节点的最大的边介数的边。
在一个实施例中,S208的实现过程可以为:基于目标会话群对应的目标操作特征集合对目标会话群集合进行群组划分,以将至少一个目标会话群划分至一个会话群组中,在完成群组划分后得到至少一个会话群组。
目标操作特征集合中的元素是聚合之后得到的操作特征,相对于分散的操作特征,能够更为明显地表征目标会话群对会话推送内容的响应特征。据此对目标会话群集合进行群组划分,能够使得划分得到的会话群组具有更高的代表性,进而可以更准确地确定出异常会话群组。
S210,从至少一个会话群组中确定异常会话群组,将异常会话群组所对应的目标会话群作为异常会话群。
在一个实施例中,从至少一个会话群组中确定异常会话群组的实现过程可以是:确定各个会话群组的目标会话群对应的推送内容操作记录集合,对推送内容操作记录集合中异常检测特征维度对应的操作特征进行数量统计,将统计得到的特征数量确定为各个会话群组对应的群组操作特征,进而基于群组操作特征在至少一个会话群组中确定异常会话群组。其中,异常检测特征维度指的是进行异常检测的特征维度,可以从推送内容操作记录集合对应的特征维度中选择得到。异常检测特征维度与目标特征维度可以相同也可以不同。在异常检测特征维度与目标特征维度不同的情况下,异常检测特征维度的确定过程可以为:从推送内容操作记录集合对应的特征维度中选择用于表征目标会话群规模的特征维度和用于表征操作频率的特征维度,作为异常检测特征维度。
在一个实施例中,从至少一个会话群组中确定异常会话群组的实现过程可以是:在至少一个会话群组中确定存在目标异常会话群的会话群组,如果存在,则判定对应的会话群组为异常会话群组,进而将异常会话群组所对应的目标会话群作为异常会话群。其中,目标异常会话群指的是预先确定的异常会话群。目标异常会话群的确定过程可以为:获取各个目标会话群的群成员,将这些群成员与预先确定的作弊群成员进行比对,当群成员中与作弊群成员匹配的目标群成员占比大于设定阈值时,判定对应的目标会话群为目标异常会话群。其中,作弊群成员可以是通过人工或者特定的对象类型识别算法来确定的异常群成员。
在一个实施例中,在确定异常会话群组之后,可以将异常会话群组全部或者部分目标会话群确定为异常会话群。对于将部分目标会话群确定为异常会话群的情况,可以至少通过以下方式来实现:1、确定异常会话群组对应的各个目标会话群的群规模,将群规模大于预设规模条件的目标会话群确定为异常会话群;2、确定异常会话群组对应的各个目标会话群的活跃度,将活跃度大于预设活跃度条件的目标会话群确定为异常会话群。其中,预设规模条件和预设活跃度条件可以根据实际情况确定,本申请实施例对此不做限制。
在一个实施例中,在确定异常会话群之后,可以对这些异常会话群进行异常响应处理。例如:可以向群主发出整改提示信息、限制这些异常会话群的网络资源、强制关闭这些异常会话群等。其中,限制网络资源的实现方式可以为限制异常会话群对应用程序中特定功能的使用权限。
在一个实施例中,S210的实现过程可以为:基于目标会话群的目标操作特征集合对至少一个会话群组进行异常会话群组识别,根据识别结果确定异常会话群组,进而将异常会话群组对应的所有目标会话群确定为异常会话群。
上述异常会话群的检测方法中,通过对操作特征进行聚合得到操作特征集合,能够挖掘到各个目标特征维度中代表会话群的特征,将最能代表会话群的特征聚合到目标操作特征集合中,基于目标操作特征集合进行聚类,以对目标会话群集合进行群组划分,能将相关联的恶意会话群划分到同一会话群组中,据此确定的异常会话群组具有较高的准确性,提高了异常检测准确度。
在某些广告投放场景下,会话群中会出现具有广告推送内容的链接,以实现广告在会话群中投放的目的。而广告收费方式可能会采用CPC的方式进行。其中,CPC是“CostPer Click”的英文缩写,表示每次广告点击的成本。在这种模式下广告主仅为用户点击广告的行为付费,而不再为广告的曝光付费,对广告主来说,CPC广告避免了只曝光不点击的风险。其中,广告主是指付费投放广告的用户或服务商,广告主希望每次付费的点击都是真实用户的有效点击,而非作弊点击。
如果会话群中的用户点击广告链接,则发出广告的流量主就可以基于点击操作向广告主收取广告费。而为了提高广告的投放效果,流量主可能会通过向会话群中转发公众号文章的链接等方式向会话群中的用户进行广告投放。
流量主即提供用户流量的载体,通常指媒体、网站或软件,例如:公众号和小程序等。在广告投放平台,流量主即指有一定粉丝量的公众号。通过公众号的底部广告位、文中广告位、互选广告位等实现广告在公众号上的投放。公众号和小程序开发者等可以申请开通广告位以成为流量主,当用户在公众号文章或小程序上曝光点击广告时,流量主可以得到分成收入。在一些按照点击扣费的广告(CPC广告)中,广告的点击量越大,流量主得到的收益越多。在广告曝光、点击、效果等环节,流量主可能会出于某种恶意的目的进行刷广告曝光、点击或效果等行为,这种非用户真实意图的恶意行为称为广告作弊。目前,广告作弊的方式大多数为真人作弊,黑产创建几十甚至成百上千会话群,聚集一群网赚用户,在群里面下发任务,以完成刷阅读或者刷点击等广告作弊行为。这些广告作弊行为对广告主会造成较大的经济损失,同时会扰乱经济市场秩序。因此,非常有必要对广告曝光、点击或效果等环节进行检查,判断广告曝光、点击或效果等是否正常,即,实现广告反作弊。
在一个实施例中,获取目标会话群集合,包括:获取用于识别会话推送内容的内容标识;在应用程序的会话群中,确定群会话中携带内容标识的目标会话群;根据目标会话群得到的目标会话群集合。
内容标识可以指对不同类型的推送内容进行区别化表示的标识,例如:日常聊天信息对应的内容标识为chat,广告对应的内容标识为advertisement,商务文件对应的内容标识为file,等。
在本申请实施例中,需要基于对特定类型的会话推送内容的操作记录来实现对会话群的群组划分。因此,上述实施例获取群会话中携带内容标识的目标会话群,进而基于所获取的目标会话群得到目标会话群集合。通过这样的方式就能使得目标会话群集合中的各个目标会话群中都出现了与内容标识对应的会话推送内容,进而可以基于各个目标会话群对对应会话推送内容的操作特征来检测异常会话群的目的。
在一个实施例中,内容标识为广告标识。通过这样的方式,能够使得目标会话群集合中都是在群会话中出现过广告的目标会话群,据此可以基于目标会话群对广告的操作特征确定目标会话群集合中目标会话群对广告的响应信息,以对目标会话群集合进行群组划分,确定异常会话群,以达到反广告作弊的目的。
在一个实施例中,可以在推送内容操作记录数据库中提取与会话群相关的推送内容操作记录,进而得到推送内容操作记录集合。进一步地,可以在推送内容操作记录数据库中提取与目标会话群集合中的目标会话群相关的推送内容操作记录,进而得到推送内容操作记录集合。具体地,可以从广告数据库中提取群场景下用户的广告点击记录,作为推送内容操作记录集合。
在一个实施例中,目标特征维度为多个,对推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到目标会话群对应的目标操作特征集合,包括:对推送内容操作记录集合中各个目标特征维度对应的操作特征进行聚合,得到各个目标特征维度分别对应的操作特征集合;根据集合中操作特征的数量筛选得到满足数量相关条件的操作特征集合,作为目标会话群对应的目标操作特征集合。
在一个实施例中,对推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,包括:对推送内容操作记录集合中各个目标特征维度对应的操作特征进行聚合,得到各个目标特征维度分别对应的操作特征集合。
其中,推送内容操作记录集合的其中一个示例如图3所示。图3中的推送内容操作记录集合包括3个推送内容操作记录,每个推送内容操作记录对应有各个目标特征维度下的操作特征。如图3左侧所示,各个推送内容操作记录对应有3个目标特征维度。将各个推送内容操作记录中目标特征维度1对应的操作特征提取出来,将目标特征维度2对应的操作特征提取出来,将目标特征维度3对应的操作特征提取出来,将这些所提取的操作特征分别作为目标会话群对应的操作特征集合,所得到的各个目标会话群对应的操作特征集合如图3右侧所示。
在一个实施例中,对推送内容操作记录集合按照目标特征维度对操作特征进行聚合得到各个目标特征维度分别对应的操作特征集合。
在一个实施例中,根据聚合之后的操作特征集合得到目标会话群对应的目标操作特征集合的实现过程可以为:根据目标会话群对应的各个操作特征集合中操作特征的数量筛选得到满足数量相关条件的操作特征集合,作为目标会话群对应的目标操作特征集合。
其中,数量相关条件指的是与操作特征的数量相关的条件,可以是数量大小应该满足的条件,也可以是按照数量排序后排列顺序应该满足的条件。
上述实施例中,对目标特征维度对应的操作特征进行聚合得到操作特征集合,并根据操作特征集合中操作特征的数量筛选满足条件的操作特征集合,得到目标操作特征集合。所得到的目标操作特征集合在特征维度和操作特征数量上均符合要求,能够有效表征目标会话群的特征,保证后续群组划分的有序进行,进而保证异常会话群的检测准确性。
发明人发现:在目标会话群中,如果群成员是正常的用户,则这些群成员对会话推送内容的操作会较为分散,以在群中投放广告为例,由于每个用户在每个流量主下看到的广告是随机出现的,因此用户的点击不会聚集在某些流量主发布的广告上。同时,正常用户只会对自己感兴趣的广告进行点击,因此不会对所有曝光过的广告进行点击,更不会只在某个群场景下聚集点击广告。而如果群成员是异常的用户(作弊用户),由于利益驱动,作弊用户会大量点击或集中在某些流量主发布的广告,这些现象使得作弊用户之间会出现协同行为,例如,在某500人的群中,480个用户所点击的公众号相同。
在本申请实施例中,可以将操作特征集合中操作特征的数量作为识别异常会话群的一个特征,如果某个操作特征集合中操作特征的数量较少,则说明对应目标会话群的操作较为集中,则对应的用户或者会话群很有可能是异常用户或者异常会话群。据此可以进行异常会话群的检测。
在一个实施例中,根据集合中操作特征的数量筛选得到满足数量相关条件的操作特征集合,作为目标会话群对应的目标操作特征集合,包括:将操作特征的数量小于数量阈值的操作特征集合,作为目标会话群对应的目标操作特征集合。
其中,数量阈值可以根据实际情况确定,例如为20、30等。具体的,通过数量阈值的比对可以提取操作特征的数量小于20的操作特征集合,作为目标会话群对应的目标操作特征集合。
上述实施例中,提取出操作特征数量小于数量阈值的操作特征集合,使得目标操作特征集合中的操作特征是尽可能集中的,进而可以准确表征对应的目标会话群是否为异常会话群。
在一个实施例中,根据集合中操作特征的数量筛选得到满足数量相关条件的操作特征集合,作为目标会话群对应的目标操作特征集合,包括:按照操作特征的数量从小到大的顺序,对操作特征集合进行排序;将排序在顺序阈值之前的操作特征集合作为目标会话群对应的目标操作特征集合。
其中,顺序阈值可以根据实际情况确定,例如2、3等。具体的,通过顺序阈值的比对可以提取排在前三的操作特征集合,作为目标会话群对应的目标操作特征集合。
在一个实施例中,目标会话群中各个目标特征维度对应的操作特征集合如图4所示,如图4中(a)所示,这些操作特征集合中操作特征的数量存在差别,按照操作特征的数量从小到大的顺序对操作特征集合进行排序,得到如图4中(b)所示的排列顺序,据此可以将排序在前三的操作特征集合作为目标会话群对应的目标操作特征集合,即,将排序在前三的目标特征维度1、3和4对应的操作特征集合作为目标会话群对应的目标操作特征集合。
上述实施例中,按照操作特征的数量从小到大的顺序,进而将排序在前的特定数量的操作特征集合作为目标会话群的目标操作特征集合,使得目标操作特征集合中的操作特征是尽可能集中的,进而可以准确表征对应的目标会话群是否为异常会话群。
在一个实施例中,对推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到目标会话群对应的目标操作特征集合,包括:将会话推送内容的内容展示主体所对应的主体特征维度作为目标特征维度;对推送内容操作记录集合中,主体特征维度对应的目标内容展示主体进行聚合,得到展示主体特征集合;基于展示主体特征集合得到目标会话群对应的目标操作特征集合。
其中,主体特征维度可以指内容展示主体对应的特征维度。
在一个实施例中,对主体特征维度对应的目标内容展示主体进行聚合的实现方式可以是:提取主体特征维度对应的目标内容展示主体,将这些目标内容展示主体按特定顺序排列在一个列表中,所得到的列表即为聚合得到的展示主体特征集合。
上述实施例中,提取主体特征维度对应的各个目标内容展示主体,将这些目标内容展示主体聚合在一起,能基于内容展示主体来表征目标会话群的特征,进而实现异常会话群的准确检测。
在一个实施例中,主体特征维度可以指流量主对应的特征维度。其中,在广告投放场景下,流量主可以参与广告的利润分成,相同广告曝光量下,点击率越高,分到的利润也越高,因而流量主有较强的作弊动机来提升点击率。
本申请实施例以流量主为主体特征维度,通过统计和分析针对网络广告的触发操作,基于流量主对广告的操作特征,对流量主的正常状态和异常状态进行评估,进而确定出异常会话群,在确定异常会话群的基础上还能确定出异常的流量主,可以准确挖掘出作弊团伙以及关系链,进而可以从根本上铲除作弊团伙,提高广告反作弊的效果。对于出现异常的流量主,可以及时地对其无效曝光行为进行制止。
在一个实施例中,对推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到目标会话群对应的目标操作特征集合,包括:将会话推送内容的会话用户所对应的用户特征维度作为目标特征维度;对推送内容操作记录集合中,用户特征维度对应的目标会话用户进行聚合,得到会话用户特征集合;基于会话用户特征集合得到目标会话群对应的目标操作特征集合。
其中,用户特征维度可以指会话用户对应的维度。在广告投放场景中,会话推送内容的会话用户可以指将广告信息发送至群会话中的用户。具体的,可以指将公众号等中的广告链接发送至群会话中的用户。
在一个实施例中,对用户特征维度对应的目标会话用户进行聚合的实现方式可以是:提取用户特征维度对应的目标会话用户,将这些目标会话用户按特定顺序排列在一个列表中,所得到的列表即为聚合得到的会话用户特征集合。
上述实施例中,提取用户特征维度对应的各个目标会话用户,将这些目标会话用户聚合在一起,能基于会话用户来表征目标会话群的特征,进而实现异常会话群的准确检测。
在一个实施例中,获取目标会话群对应的推送内容操作记录集合之前,还包括:接收推送内容转发指令,向目标会话群对应的用户终端发送会话推送内容;当产生对会话推送内容的操作时,生成推送内容操作记录。
其中,服务器可以接收会话用户发送的推送内容转发指令,并据此向目标会话群对应的用户终端发送会话推送内容。在发送会话推送内容后,可以基于目标会话群中的群成员的操作来生成推送内容操作记录。
上述实施例中,服务器在推送内容转发指令的触发下向目标会话群发送推送会话推送内容,能据此获取到推送内容操作记录,进而对该目标会话群进行分析,以确定其是否为异常会话群。
在一个实施例中,可以将会话推送内容的操作主体、操作主体所在的网络、操作主体所在的设备、操作时间和操作编号中至少一项所对应的特征维度作为目标特征维度。
上述实施例中,将各种与异常会话群识别相关的特征维度确定为目标特征维度,进而实现对对应操作特征的聚合,能通过更为全面的操作特征来表征目标会话群,进而实现对异常会话群的准确检测。
在一个实施例中,基于目标会话群对应的目标操作特征集合对目标会话群集合进行群组划分,得到至少一个会话群组,包括:将各个目标会话群作为目标节点,基于目标节点构建群网络关系图;对群网络关系图进行群组划分,得到至少一个会话群组。
其中,图(Graph)是由顶点的有穷非空集合和顶点之间边(也称为连边)的集合组成。图结构是研究数据元素之间的多对多的关系。在图结构中,任意两个元素之间可能存在关系。即节点之间的关系可以是任意的,图中任意元素之间都可能相关。群网络关系图可以是基于目标节点构建的图结构,在群网络关系图中,目标节点之间可以存在边,也可以不存在边。存在边表示会话群之间存在相关性,同时,不同的边对应的权重可能不同,也即不同的目标节点之间的相关性可能会存在差异。在一个实施例中,所构建的群网络关系图为图神经网络,可以基于图神经网络对群网络关系图进行处理,以更新群网络关系图中的边和权重,或者,对群网络关系图进行群组划分。
在一个实施例中,对群网络关系图进行群组划分的方式可以通过FastUnfolding、K-means等人工智能算法实现。
上述实施例中,通过构建群网络关系图的方式实现群组划分,能借助人工智能算法实现对会话群组的准确划分,进而可以得到异常会话群所在的团体。
在一个实施例中,基于目标会话群对应的目标操作特征集合对目标会话群集合进行群组划分,得到至少一个会话群组,包括:将各个目标会话群作为目标节点,基于目标节点对应的目标操作特征集合之间的重合特征数量得到目标节点之间的连接度;根据目标节点之间的连接度得到群网络关系图;对群网络关系图进行群组划分,得到至少一个会话群组。
具体地,群网络关系图用于表示目标会话群之间的相关度。边的连接度表示节点之间的连接紧密度,连接度越大,权重越大,则连接紧密度越大。
在一个实施例中,可以基于目标节点对应的目标操作特征集合之间的重合特征数量得到目标节点之间的相关度,进而将相关度确定为目标节点之间的连接度。
目标节点之间的连接度确定之后,就确定了目标节点之间的边,进而可以基于节点之间的边进行网络关系图的绘制,得到群网络关系图。之后对群网络关系图进行群组划分,得到至少一个会话群组。
上述实施例中,通过构建群网络关系图的方式对实现群组的划分,能借助人工智能算法实现对目标会话群集合的准确划分,进而将相关联的目标会话群划分至同一会话群组中,将不相关的目标会话群划分至不同会话群组中,能保证异常会话群的准确检测。
前述实施例中,在确定目标操作特征集合的基础上,基于目标操作特征集合对目标会话群集合进行群组划分,能基于目标会话群之间的相关度使得划分得到的会话群组中包含尽可能多的相关联会话群,也即,可以基于某个或某些异常会话群匹配到更多的会话群,将这些会话群划分到一个会话群组中,进而基于异常会话群组来确定其中包含的异常会话群,可以通过一次的异常检测实现打击更广范围的异常会话群的目的。
在一个实施例中,目标节点包括第一节点和第二节点,基于目标节点对应的目标操作特征集合之间的重合特征数量得到目标节点之间的连接度,包括:获取第一节点对应的目标操作特征集合与第二节点对应的目标操作特征集合之间的重合特征数量;获取第一节点对应的目标操作特征集合与第二节点对应的目标操作特征集合中的特征总数量;基于重合特征数量与特征总数量的差异,得到第一节点与第二节点之间的连接度,差异与连接度成负相关关系。
其中,重合特征数量的确定过程可以为:确定第一节点对应的目标操作特征集合与第二节点对应的目标操作特征集合之间的相同操作特征,将相同操作特征对应的数量作为重合特征数量。
特征总数量的确定过程可以为:确定第一节点对应的目标操作特征集合中操作特征对应的第一数量,确定第二节点对应的目标操作特征集合中操作特征对应的第二数量,将第一数量和第二数量的总和确定为特征总数量。
重合特征数量与特征总数量的差异可以指重合特征数量与特征总数量之间的差值或者比值等。进一步的,当重合特征数量与特征总数量之间的差异大时,表示第一节点和第二节点之间相同操作特征的数量较少,可以认为两者之间的相关性较弱,因此可以将第一节点和第二节点之间的连接度设置为一个较小的值,同理,当重合特征数量与特征总数量之间的差异小时,可以将第一节点和第二节点之间的连接度设置为一个较大的值。
在一个实施例中,如果第一节点和第二节点之间的连接度为0,则在群网络关系图中不为第一节点和第二节点设置边,或者将边的权重设置为0。这能够保证形成边的两个会话群有很强的聚集联系。
需要说明的是,在目标会话群为多个时,目标节点可以不仅仅包含第一节点和第二节点。当目标节点为两个以上时,可以参照计算第一节点与第二节点之间的连接度的方式计算两两目标节点之间的连接度,进而使得所构建的群网络关系图更为全面。
上述实施例中,基于特征数量来确定两个节点之间的相关度,得到群网络关系图中节点之间的连接度,能构建得到准确完整的群网络关系图,该群网络关系图能全面地表征各个目标会话群之间的相关度,据此可以对目标会话群集合进行准确的群组划分。
在一个实施例中,基于重合特征数量与特征总数量的差异,得到第一节点与第二节点之间的连接度,包括:计算重合特征数量占特征总数量的比值,将比值作为第一节点与第二节点之间的连接度。
上述实施例中,将重合特征数量占特征总数量的比值作为节点之间的连接度,所确定的群网络关系图能很好地表征节点之间相同操作特征的数量占比。在相同操作特征数量占比较高时,说明对应的目标会话群的操作特征较为集中。在广告投放场景中,相关联的目标会话群很有可能是异常会话群。因此,服务器将相同操作特征数量占比较高的目标会话群划分至一个会话群组中,使得所划分的会话群组具有较高的准确性。
在一个实施例中,对群网络关系图进行群组划分,得到至少一个会话群组,包括:获取群网络关系图中待划分的当前节点,将当前节点与对应的邻接节点组成当前节点群组,基于当前节点与邻接节点之间的连接度得到当前节点群组对应的模块度增量;当模块度增量大于增量阈值时,将当前节点群组中的节点合并为新的节点,得到更新后的群网络关系图;基于更新后的群网络关系图返回获取群网络关系图中待划分的当前节点,将当前节点与对应的邻接节点组成当前节点群组,基于当前节点与邻接节点之间的连接度得到当前节点群组对应的模块度增量,直至群网络关系图满足更新终止条件,得到目标群网络关系图;将目标群网络关系图中同一个节点对应的目标会话群划分在相同的会话群组中。
当前节点对应的邻接节点是指与当前节点存在边的节点。模块度用于衡量群组划分的好坏,将连接比较稠密的点划分在一个群组中时,模块度的值会变大,因此可以将使模块度最大的划分方式作为最优的群组划分方式。模块度增量是指:将当前节点与对应的邻接节点组成当前节点群组后,该当前节点群组的模块度相对于未组成当前节点群组的模块度的增量。即将当前节点加入到其邻接节点所在的节点群组所带来的模块度的收益。
在一个实施例中,基于当前节点与邻接节点之间的连接度得到当前节点群组对应的模块度增量,包括:计算当前节点群组对应的当前模块度;根据当前节点对应的节点连接度与邻接节点对应的节点连接度计算得到参考模块度;根据当前模块度与参考模块度的差异得到将当前节点与对应的邻接节点组成当前节点群组时,对应的模块度增量。
具体地,可以将当前节点群组中节点之间的边的连接度相加,得到当前节点群组对应的当前模块度,该模块度反映了当前节点群组的连接强度。当前节点对应的连接度根据与该节点连接的所有边的连接度计算得到,例如可以将与当前节点连接的所有边的连接度相加,得到当前节点对应的连接度。邻接节点对应的连接度根据与该节点连接的所有边的连接度计算得到,例如可以将与邻接节点连接的所有边的连接度相加,得到邻接节点对应的连接度。
在一些实施例中,可以将当前节点对应的连接度与邻接节点对应的连接度相乘,再除以群网络关系图对应的连接度之和,得到参考模块度。
在一个实施例中,增量阈值可以根据实际情况确定,可以为0、0.1、0.2等。当模块度增量小于或等于增量阈值时,可以判定满足更新终止条件,将此时的群网络关系图确定为目标群网络关系图。
在一个实施例中,由于目标群网络关系图中的节点可能是合并得到的,因此一个节点可以对应多个目标会话群,因此可以将同一个节点对应的目标会话群划分至相同的会话群组中。
在一个实施例中,对群网络关系图进行群组划分的示意图可以如图5所示。初始群网络关系图如图5中的(a)所示,该群网络关系图中包含多个目标节点,这些目标节点之间存在边,这些边对应有连接度,图中未标示各个边对应的连接度。经过第一次迭代之后,初始群网络关系图中的目标节点被整合为3个节点,得到已更新群网络关系图,如图5中的(c)所示。经过第二次迭代之后,群网络关系图中的节点被整合为2个节点,如图5中的(e)所示。此时群网络关系图满足更新终止条件,因此,所得到的目标群网络关系图中包含两个节点,将初始群网络关系图划分为了两个会话群组。对于第一次迭代,通过分析当前节点与对应的邻接节点之间的连接度,将初始群网络关系图中的目标节点用不同的灰度值表示,如图5中的(b)所示,各个目标节点都被填充了对应的灰度值,最终得到3个灰度值的节点群,将每一个节点群的节点合并为一个节点,就得到了如图5中的(c)所示的已更新群网络关系图。同理,在第二次迭代时,将已更新群网络关系图中的节点用不同的灰度值表示,如图5中的(d)所示,各个节点都被填充了对应的灰度值,最终得到2个灰度值的节点群,将每一个节点群的节点合并为一个节点,就得到了如图5中的(e)所示的目标群网络关系图。
上述实施例中,基于对群网络关系图进行迭代群组划分的方式能得到尽可能精简的目标群网络关系图,进而可以将强关联的目标会话群划分至相同的会话群组中,实现会话群组的准确划分。
在一个实施例中,如图6所示,通过对群网络关系图划分得到的会话群组包括A会话群组和B会话群组。A会话群组和B会话群组都对应有多个目标会话群。假设通过异常会话群组识别以后确定A会话群组为异常会话群组,则将A会话群组内部的目标会话群确定为异常会话群。如图6所示,将A会话群组内部的9个目标会话群均确定为异常会话群。通过这样的方式,不仅保证了异常会话群的检测准确性,还能一次性确定出9个异常会话群,异常会话群的确定效率非常高。
在一个实施例中,从至少一个会话群组中确定异常会话群组,将异常会话群组所对应的目标会话群作为异常会话群,包括:对会话群组中各个目标会话群对应的推送内容操作记录集合中,异常检测特征维度对应的操作特征进行统计,得到异常检测特征维度对应的特征数量;当基于异常检测特征维度的特征数量确定对应的会话群组为异常会话群组时,将异常会话群组所对应的目标会话群作为异常会话群。
异常检测特征维度对应的特征数量可以指异常检测特征维度对应的操作特征的数量,也可以指对操作特征对应的特征值进行运算得到的结果。基于特征数量能够确定出会话群组对会话推送内容的操作状态,进而可以准确确定出对应的会话群组是否为异常会话群。
上述实施例中,通过对异常检测特征维度对应的操作特征的分析,能准确确定出异常会话群组。
在一个实施例中,可以根据异常检测特征维度对应的特征数据确定对应的异常检测指标值,基于异常检测指标值确定异常会话群组。
其中,异常检测指标值指的是对会话群组进行异常性检测所用到的评估指标值。可以对异常检测特征维度对应的操作特征的操作特征值进行统计运算,将统计运算的结果确定为异常检测指标值。
在一个实施例中,当基于异常检测特征维度的特征数量确定对应的会话群组为异常会话群组时,将异常会话群组所对应的目标会话群作为异常会话群,包括:基于异常检测特征维度对应的特征数量,确定异常检测特征维度对应的异常检测指标值,异常检测特征维度对应的特征数量与异常检测指标值成正相关关系;当确定异常检测指标值大于指标值阈值时,确定对应的会话群组为异常会话群组,将异常会话群组所对应的目标会话群作为异常会话群。
异常检测特征维度对应的特征数量可以指操作量、操作率、内容展示主体数或者会话用户数等。在对广告进行点击的场景中,异常检测特征维度对应的特征数量可以指点击量、点击率、流量主数或者用户数等。
在一个实施例中,基于异常检测特征维度对应的特征数量确定异常检测特征维度对应的异常检测指标值,包括:对于某一会话群组,确定该会话群组中包含的目标会话群,确定这些目标会话群中的操作总次数,计算异常检测特征维度对应的特征数量相对于操作总次数的平均值,将平均值的计算结果确定为异常检测指标值。
在一些实施例中,还可以对异常检测特征维度对应的特征数量乘以一定的系数,将所得到的乘积确定为异常检测指标值。
指标值阈值的大小可以根据实际情况确定,本申请实施例对此不做限制。进一步地,异常检测指标值可以为一个以上,因此对应的指标值阈值也可以为一个以上。此时,可以在所有或者部分异常检测指标值大于对应的指标值阈值时,确定对应的会话群组为异常会话群组。
在一个实施例中,对于某一会话群组,确定会话群组对应的平均点击量、平均点击率、平均流量主数和平均用户数,当平均点击量大于点击量阈值、平均流量主数大于流量主数阈值且平均用户数大于用户数阈值时,判定该会话群组的群组规模符合异常会话群组对群组规模的要求,即会话群组的规模足够大,此时,如果平均点击率大于点击率阈值,判定该会话群组的操作频繁度满足异常会话群组对操作频繁度的要求,因此将该会话群组确定为异常会话群组。
上述实施例中,通过异常检测指标值来确定会话群组是否为异常会话群组,能通过简单的方式实现异常会话群组的检测,进而提高异常会话群的检测效率。
在一个实施例中,将异常会话群组所对应的目标会话群作为异常会话群之后,还包括:确定异常会话群对应的目标会话用户和目标内容展示主体;对目标会话用户和目标内容展示主体进行网络资源限制。
在一个实施例中,在广告投放场景下,目标会话用户可以指广告转发者,目标内容展示主体可以指流量主。在确定异常会话群之后,可以确定异常会话群对应的广告转发者和流量主,广告转发者和流量主都是异常会话群内的作弊用户,因此对这些用户进行网络资源限制。
在一个实施例中,还可以确定异常会话群对应的群成员,将对这些群成员进行网络资源限制。
上述实施例中,结合对异常会话群对应的异常用户进行网络资源限制,以打击异常用户,在广告投放场景下,能基于所确定的异常会话群有效打击作弊用户。
在一个实施例中,还可以基于异常会话群确定对应的流量主、转发者以及用户,基于异常会话群、流量主、转发者以及用户中的至少两项建立作弊关系链,基于作弊关系链进行线上的匹配组合打击。
在一个实施例中,如图7所示,提供了一种异常会话群的检测方法,以该方法应用于服务器为例进行说明,包括以下步骤:
S702,获取包括多个目标会话群的目标会话群集合。
S704,在推送内容操作记录数据库中提取与目标会话群集合中的目标会话群相关的推送内容操作记录,进而得到推送内容操作记录集合。
S706,将会话推送内容的内容展示主体所对应的主体特征维度和会话用户所对应的用户特征维度分别作为目标特征维度。
S708,对推送内容操作记录集合中各个目标特征维度对应的操作特征进行聚合,得到各个目标特征维度分别对应的操作特征集合。
S710,按照操作特征的数量从小到大的顺序,对操作特征集合进行排序。
S712,将排序在顺序阈值之前的操作特征集合作为目标会话群对应的目标操作特征集合。
S714,将各个目标会话群作为目标节点,基于目标节点对应的目标操作特征集合之间的重合特征数量得到目标节点之间的连接度。
S716,根据目标节点之间的连接度得到群网络关系图。
S718,对群网络关系图进行群组划分,得到至少一个会话群组。
S720,对会话群组中各个目标会话群对应的推送内容操作记录集合中异常检测特征维度对应的操作特征进行统计,得到异常检测特征维度对应的特征数量。
S722,基于异常检测特征维度对应的特征数量,确定异常检测特征维度对应的异常检测指标值。
S724,当确定异常检测指标值大于指标值阈值时,确定对应的会话群组为异常会话群组;将异常会话群组所对应的目标会话群作为异常会话群。
上述实施例提供的异常会话群的检测方法,通过对操作特征进行聚合得到操作特征集合,将最能代表会话群的特征聚合到目标操作特征集合中,基于目标操作特征集合将相关联的会话群划分到同一会话群组中,据此确定的异常会话群组具有较高的准确性,进而可以得到异常会话群的准确检测结果,同时,能一次性识别出多个异常会话群,保证异常会话群的识别效率。
本申请还提供一种应用场景,该应用场景应用上述的异常会话群的检测方法。具体地,如图8所示,该异常会话群的检测方法在该应用场景的应用如下:
S802,从广告数据库中提取群场景的用户在一周内的广告点击记录(即,前述推送内容操作记录集合)。
比如获取某个群内一批用户u的广告点击序列,得到推送内容操作记录:
用户u1,时间t1,链接ur1,转发者tr1,WIFI1,IP1,设备e1,流量主f1,点击c1;
用户u2,时间t2,链接ur2,转发者tr2,WIFI2,IP2,设备e2,流量主f2,点击c2;
……
用户un,时间tn,链接urn,转发者trn,WIFIn,IPn,设备en,流量主fn,点击cn。
上述广告点击序列中包含的元素即为广告点击序列对应的操作特征。各个广告点击序列对应的“点击”标识不同,即上述广告点击序列以“点击”来对广告点击记录进行区分。
其中,用户u是指在该群中的广告点击用户,而时间t是该用户点击广告的时间戳,转发者tr指的是将广告从其他场景转发到该群中的用户,WIFI指的是广告点击用户所使用的WIFI标识,IP指的是广告点击用户所使用网络的IP地址,设备e指的是广告点击用户所使用的终端设备,流量主f指的是提供用户流量的载体,点击c为广告点击用户点击对应广告时产生的点击标识(同一用户在不同时间下点击同一广告链接可以对应不同的点击标识)。
S804,从广告点击记录中提取出不同群的去重特征列表,按照列表长度从小到大排序,保留各个群的前K个强特征。其中,一个特征列表为一个特征维度。K的大小可以根据实际情况确定,例如为3、5等。
所确定的目标特征维度包括:流量主列表a1,转发者列表a2,链接列表a3,WIFI列表a4,IP列表a5,设备id列表a6。将各个特征维度对应的重复操作特征进行去重处理,得到如下的去重特征列表a:
流量主列表a1=[app1,app2,app3,…]
转发者列表a2=[pre_user1,pre_user2,pre_user3,…]
链接列表a3=[url1,url2,url3,…]
WIFI列表a4=[wifi1,wifi2,wifi3,…]
IP列表a5=[ip1,ip2,ip3,..]
设备id列表a6=[deviceid1,deviceid2,deviceid3,…]
在广告作弊场景中,长度越短的特征列表越异常,比如在多个群中,广告链接的转发者为少数几个或者IP为少数几个的群就有可能是作弊群。
基于此,将上述去重特征列表a按照列表中元素长度从小到大排序,保留排序后top3的去重特征列表。某个群最终的目标操作特征集合A可以为A=[a1,a2,a3]
S806,将各个群作为节点构建群网络关系图,并计算任意两个节点之间边的权重。
S808,基于群网络关系图中边的权重,采用社区划分算法对所有的群进行社区划分。其中,每个群可以分配至唯一的社区中。
S810,计算每个社区的异常检测指标值,基于异常检测指标值与指标值阈值的大小关系确定作弊社区。计算每个社区的平均点击量C1、平均流量主数C2、平均用户数C3以及平均点击率C4,作为异常检测指标值。判断某一社区的C1、C2、C3以及C4是否大于指定的指标值阈值,如果是,将该社区确定为作弊社区,对作弊社区对应的群进行打击。
其中,判断某一社区的C1、C2、C3以及C4是否大于指定的指标值阈值的过程可以为:如果平均点击量>=c1,平均流量主数>=c2,且平均用户数>=c3,说明该社区达到一定规模;此时对平均点击率进行判断,如果平均点击率>=c4,表明该社区有很强的作弊点击倾向。将对应的社区确定为作弊社区,即加入作弊团伙名单。优先打击作弊社区这部分头部流量。
S812,筛选出作弊社区内的群与流量主组合,将群与流量主对应的网络链路确定为作弊关系链,基于作弊关系链进行线上的匹配组合打击。
传统技术大多数是通过点击量、点击率等结果性的指标来筛选异常样本进而判断用户是否作弊,这样的方式确定的作弊用户覆盖率较低,且人工验证成本高。另外,传统技术中对用户进行聚类的算法聚类效果难以评估,不可预期,也无法提供作弊证据,也无法挖掘出作弊团伙以及关系链。
上述技术方案,综合使用了群场景下的多维广告特征,提高了广告作弊检测的准确率和覆盖率。同时属于无监督检测,无需事先的恶意样本。此外,可以直观挖掘出完整的广告作弊群的团伙关系链和运营人员,减少人工下钻作弊链的成本。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于与上述实施例中的异常会话群的检测方法相同的思想,本申请还提供异常会话群的检测装置,该装置可用于执行上述异常会话群的检测方法。为了便于说明,异常会话群的检测装置实施例的结构示意图中,仅仅示出了与本申请实施例相关的部分,本领域技术人员可以理解,图示结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在一个实施例中,如图9所示,提供了一种异常会话群的检测装置900,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:会话群集合获取模块902、记录集合获取模块904、操作特征聚合模块906、群组划分模块908和异常会话群确定模块910,其中:
会话群集合获取模块902,用于获取目标会话群集合,所述目标会话群集合包括多个目标会话群。
记录集合获取模块904,用于获取所述目标会话群对应的推送内容操作记录集合,所述推送内容操作记录集合包括多个推送内容操作记录,所述推送内容操作记录是响应于对所述目标会话群中的会话推送内容的操作生成的。
操作特征聚合模块906,用于对所述推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到所述目标会话群对应的目标操作特征集合。
群组划分模块908,用于基于所述目标会话群对应的目标操作特征集合对所述目标会话群集合进行群组划分,得到至少一个会话群组。
异常会话群确定模块910,用于从所述至少一个会话群组集合中确定异常会话群组,将所述异常会话群组所对应的目标会话群作为异常会话群。
上述异常会话群的检测装置中,通过对操作特征进行聚合得到操作特征集合,将最能代表会话群的特征聚合到目标操作特征集合中,基于目标操作特征集合将相关联的会话群划分到同一会话群组中,据此确定的异常会话群组具有较高的准确性,进而可以得到异常会话群的准确检测结果。
在一个实施例中,所述目标特征维度为多个,操作特征聚合模块,包括:操作特征聚合子模块,用于对所述推送内容操作记录集合中各个所述目标特征维度对应的操作特征进行聚合,得到各个所述目标特征维度分别对应的操作特征集合;操作特征筛选子模块,用于根据集合中操作特征的数量筛选得到满足数量相关条件的操作特征集合,作为所述目标会话群对应的目标操作特征集合。
在一个实施例中,操作特征筛选子模块,包括:第一特征集合确定单元,用于将操作特征的数量小于数量阈值的操作特征集合,作为所述目标会话群对应的目标操作特征集合。
在一个实施例中,操作特征筛选子模块,包括:操作特征排序单元,用于按照操作特征的数量从小到大的顺序,对操作特征集合进行排序;第二特征集合确定单元,用于将排序在顺序阈值之前的操作特征集合作为所述目标会话群对应的目标操作特征集合。
在一个实施例中,操作特征聚合模块,包括:第一特征维度确定子模块,用于将所述会话推送内容的内容展示主体所对应的主体特征维度作为目标特征维度;展示主体聚合子模块,用于对所述推送内容操作记录集合中,所述主体特征维度对应的目标内容展示主体进行聚合,得到展示主体特征集合;第一特征集合确定子模块,用于基于所述展示主体特征集合得到所述目标会话群对应的目标操作特征集合。
在一个实施例中,操作特征聚合模块,包括:第二特征维度确定子模块,用于将所述会话推送内容的会话用户所对应的用户特征维度作为目标特征维度;会话用户聚合子模块,用于对所述推送内容操作记录集合中,所述用户特征维度对应的目标会话用户进行聚合,得到会话用户特征集合;第二特征集合确定子模块,用于基于所述会话用户特征集合得到所述目标会话群对应的目标操作特征集合。
在一个实施例中,群组划分模块,包括:连接度确定子模块,用于将各个所述目标会话群作为目标节点,基于所述目标节点对应的目标操作特征集合之间的重合特征数量得到所述目标节点之间的连接度;关系图确定子模块,用于根据所述目标节点之间的连接度得到群网络关系图;群组划分子模块,用于对所述群网络关系图进行群组划分,得到至少一个会话群组。
在一个实施例中,所述目标节点包括第一节点和第二节点,连接度确定子模块,包括:重合特征数量确定单元,用于获取所述第一节点对应的目标操作特征集合与所述第二节点对应的目标操作特征集合之间的重合特征数量;特征总数量确定单元,用于获取所述第一节点对应的目标操作特征集合与所述第二节点对应的目标操作特征集合中的特征总数量;连接度确定单元,用于基于所述重合特征数量与所述特征总数量的差异,得到所述第一节点与所述第二节点之间的连接度,所述差异与所述连接度成负相关关系。
在一个实施例中,连接度确定单元,还用于计算所述重合特征数量占所述特征总数量的比值,将所述比值作为所述第一节点与所述第二节点之间的连接度。
在一个实施例中,群组划分子模块,包括:模块度增量确定单元,用于获取群网络关系图中待划分的当前节点,将所述当前节点与对应的邻接节点组成当前节点群组,基于当前节点与所述邻接节点之间的连接度得到所述当前节点群组对应的模块度增量;关系图更新单元,用于当所述模块度增量大于增量阈值时,将所述当前节点群组中的节点合并为新的节点,得到更新后的群网络关系图;关系图迭代单元,用于基于更新后的群网络关系图返回获取群网络关系图中待划分的当前节点,将所述当前节点与对应的邻接节点组成当前节点群组,基于当前节点与所述邻接节点之间的连接度得到所述当前节点群组对应的模块度增量,直至群网络关系图满足更新终止条件,得到目标群网络关系图;会话群组划分单元,用于将所述目标群网络关系图中同一个节点对应的目标会话群划分在相同的会话群组中。
在一个实施例中,异常会话群确定模块,包括:操作特征统计子模块,用于对所述会话群组中各个目标会话群对应的推送内容操作记录集合中,异常检测特征维度对应的操作特征进行统计,得到所述异常检测特征维度对应的特征数量;异常会话群确定子模块,用于当基于所述异常检测特征维度的特征数量确定对应的会话群组为异常会话群组时,将所述异常会话群组所对应的目标会话群作为异常会话群。
在一个实施例中,异常会话群确定子模块,包括:检测指标值确定单元,用于基于所述异常检测特征维度对应的特征数量,确定所述异常检测特征维度对应的异常检测指标值,所述异常检测特征维度对应的特征数量与所述异常检测指标值成正相关关系;异常会话群确定单元,用于当确定所述异常检测指标值大于指标值阈值时,确定对应的会话群组为异常会话群组,将所述异常会话群组所对应的目标会话群作为异常会话群。
关于异常会话群的检测装置的具体限定可以参见上文中对于异常会话群的检测方法的限定,在此不再赘述。上述异常会话群的检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储推送内容操作记录等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常会话群的检测方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种异常会话群的检测方法,其特征在于,所述方法包括:
获取目标会话群集合,所述目标会话群集合包括多个目标会话群;
获取所述目标会话群对应的推送内容操作记录集合,所述推送内容操作记录集合包括多个推送内容操作记录,所述推送内容操作记录是响应于对所述目标会话群中的会话推送内容的操作生成的;
对所述推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到所述目标会话群对应的目标操作特征集合;
基于所述目标会话群对应的目标操作特征集合对所述目标会话群集合进行群组划分,得到至少一个会话群组;
从所述至少一个会话群组中确定异常会话群组,将所述异常会话群组所对应的目标会话群作为异常会话群。
2.根据权利要求1所述的方法,其特征在于,所述目标特征维度为多个,所述对所述推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到所述目标会话群对应的目标操作特征集合,包括:
对所述推送内容操作记录集合中各个所述目标特征维度对应的操作特征进行聚合,得到各个所述目标特征维度分别对应的操作特征集合;
根据集合中操作特征的数量筛选得到满足数量相关条件的操作特征集合,作为所述目标会话群对应的目标操作特征集合。
3.根据权利要求2所述的方法,其特征在于,所述根据集合中操作特征的数量筛选得到满足数量相关条件的操作特征集合,作为所述目标会话群对应的目标操作特征集合,包括:
将操作特征的数量小于数量阈值的操作特征集合,作为所述目标会话群对应的目标操作特征集合。
4.根据权利要求2所述的方法,其特征在于,所述根据集合中操作特征的数量筛选得到满足数量相关条件的操作特征集合,作为所述目标会话群对应的目标操作特征集合,包括:
按照操作特征的数量从小到大的顺序,对操作特征集合进行排序;
将排序在顺序阈值之前的操作特征集合作为所述目标会话群对应的目标操作特征集合。
5.根据权利要求1所述的方法,其特征在于,所述对所述推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到所述目标会话群对应的目标操作特征集合,包括:
将所述会话推送内容的内容展示主体所对应的主体特征维度作为目标特征维度;
对所述推送内容操作记录集合中,所述主体特征维度对应的目标内容展示主体进行聚合,得到展示主体特征集合;
基于所述展示主体特征集合得到所述目标会话群对应的目标操作特征集合。
6.根据权利要求1所述的方法,其特征在于,所述对所述推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到所述目标会话群对应的目标操作特征集合,包括:
将所述会话推送内容的会话用户所对应的用户特征维度作为目标特征维度;
对所述推送内容操作记录集合中,所述用户特征维度对应的目标会话用户进行聚合,得到会话用户特征集合;
基于所述会话用户特征集合得到所述目标会话群对应的目标操作特征集合。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述基于所述目标会话群对应的目标操作特征集合对所述目标会话群集合进行群组划分,得到至少一个会话群组,包括:
将各个所述目标会话群作为目标节点,基于所述目标节点对应的目标操作特征集合之间的重合特征数量得到所述目标节点之间的连接度;
根据所述目标节点之间的连接度得到群网络关系图;
对所述群网络关系图进行群组划分,得到至少一个会话群组。
8.根据权利要求7所述的方法,其特征在于,所述目标节点包括第一节点和第二节点,所述基于所述目标节点对应的目标操作特征集合之间的重合特征数量得到所述目标节点之间的连接度,包括:
获取所述第一节点对应的目标操作特征集合与所述第二节点对应的目标操作特征集合之间的重合特征数量;
获取所述第一节点对应的目标操作特征集合与所述第二节点对应的目标操作特征集合中的特征总数量;
基于所述重合特征数量与所述特征总数量的差异,得到所述第一节点与所述第二节点之间的连接度,所述差异与所述连接度成负相关关系。
9.根据权利要求8所述的方法,其特征在于,所述基于所述重合特征数量与所述特征总数量的差异,得到所述第一节点与所述第二节点之间的连接度,包括:
计算所述重合特征数量占所述特征总数量的比值,将所述比值作为所述第一节点与所述第二节点之间的连接度。
10.根据权利要求7所述的方法,其特征在于,所述对所述群网络关系图进行群组划分,得到至少一个会话群组,包括:
获取群网络关系图中待划分的当前节点,将所述当前节点与对应的邻接节点组成当前节点群组,基于当前节点与所述邻接节点之间的连接度得到所述当前节点群组对应的模块度增量;
当所述模块度增量大于增量阈值时,将所述当前节点群组中的节点合并为新的节点,得到更新后的群网络关系图;
基于更新后的群网络关系图返回获取群网络关系图中待划分的当前节点,将所述当前节点与对应的邻接节点组成当前节点群组,基于当前节点与所述邻接节点之间的连接度得到所述当前节点群组对应的模块度增量,直至群网络关系图满足更新终止条件,得到目标群网络关系图;
将所述目标群网络关系图中同一个节点对应的目标会话群划分在相同的会话群组中。
11.根据权利要求1至6任一项所述的方法,其特征在于,所述从所述至少一个会话群组中确定异常会话群组,将所述异常会话群组所对应的目标会话群作为异常会话群,包括:
对所述会话群组中各个目标会话群对应的推送内容操作记录集合中,异常检测特征维度对应的操作特征进行统计,得到所述异常检测特征维度对应的特征数量;
当基于所述异常检测特征维度的特征数量确定对应的会话群组为异常会话群组时,将所述异常会话群组所对应的目标会话群作为异常会话群。
12.根据权利要求11所述的方法,其特征在于,所述当基于所述异常检测特征维度的特征数量确定对应的会话群组为异常会话群组时,将所述异常会话群组所对应的目标会话群作为异常会话群,包括:
基于所述异常检测特征维度对应的特征数量,确定所述异常检测特征维度对应的异常检测指标值,所述异常检测特征维度对应的特征数量与所述异常检测指标值成正相关关系;
当确定所述异常检测指标值大于指标值阈值时,确定对应的会话群组为异常会话群组,将所述异常会话群组所对应的目标会话群作为异常会话群。
13.一种异常会话群的检测装置,其特征在于,所述装置包括:
会话群集合获取模块,用于获取目标会话群集合,所述目标会话群集合包括多个目标会话群;
记录集合获取模块,用于获取所述目标会话群对应的推送内容操作记录集合,所述推送内容操作记录集合包括多个推送内容操作记录,所述推送内容操作记录是响应于对所述目标会话群中的会话推送内容的操作生成的;
操作特征聚合模块,用于对所述推送内容操作记录集合中目标特征维度对应的操作特征进行聚合,得到所述目标会话群对应的目标操作特征集合;
群组划分模块,用于基于所述目标会话群对应的目标操作特征集合对所述目标会话群集合进行群组划分,得到至少一个会话群组;
异常会话群确定模块,用于从所述至少一个会话群组集合中确定异常会话群组,将所述异常会话群组所对应的目标会话群作为异常会话群。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述方法的步骤。
15.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110127014.XA CN112508630B (zh) | 2021-01-29 | 2021-01-29 | 异常会话群的检测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110127014.XA CN112508630B (zh) | 2021-01-29 | 2021-01-29 | 异常会话群的检测方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112508630A true CN112508630A (zh) | 2021-03-16 |
CN112508630B CN112508630B (zh) | 2021-05-25 |
Family
ID=74953100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110127014.XA Active CN112508630B (zh) | 2021-01-29 | 2021-01-29 | 异常会话群的检测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112508630B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113537363A (zh) * | 2021-07-20 | 2021-10-22 | 北京奇艺世纪科技有限公司 | 一种异常对象检测方法及装置、电子设备及存储介质 |
CN113837879A (zh) * | 2021-09-14 | 2021-12-24 | 上证所信息网络有限公司 | 一种指数行情的异常检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103795612A (zh) * | 2014-01-15 | 2014-05-14 | 五八同城信息技术有限公司 | 即时通讯中的垃圾和违法信息检测方法 |
CN104765874A (zh) * | 2015-04-24 | 2015-07-08 | 百度在线网络技术(北京)有限公司 | 用于检测点击作弊的方法及装置 |
CN106934627A (zh) * | 2015-12-28 | 2017-07-07 | 中国移动通信集团公司 | 一种电商行业作弊行为的检测方法及装置 |
CN109285009A (zh) * | 2018-08-06 | 2019-01-29 | 北京三快在线科技有限公司 | 刷单识别方法和刷单识别装置 |
CN111899040A (zh) * | 2019-05-05 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 目标对象异常传播的检测方法、装置、设备及存储介质 |
-
2021
- 2021-01-29 CN CN202110127014.XA patent/CN112508630B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103795612A (zh) * | 2014-01-15 | 2014-05-14 | 五八同城信息技术有限公司 | 即时通讯中的垃圾和违法信息检测方法 |
CN104765874A (zh) * | 2015-04-24 | 2015-07-08 | 百度在线网络技术(北京)有限公司 | 用于检测点击作弊的方法及装置 |
CN106934627A (zh) * | 2015-12-28 | 2017-07-07 | 中国移动通信集团公司 | 一种电商行业作弊行为的检测方法及装置 |
CN109285009A (zh) * | 2018-08-06 | 2019-01-29 | 北京三快在线科技有限公司 | 刷单识别方法和刷单识别装置 |
CN111899040A (zh) * | 2019-05-05 | 2020-11-06 | 腾讯科技(深圳)有限公司 | 目标对象异常传播的检测方法、装置、设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113537363A (zh) * | 2021-07-20 | 2021-10-22 | 北京奇艺世纪科技有限公司 | 一种异常对象检测方法及装置、电子设备及存储介质 |
CN113537363B (zh) * | 2021-07-20 | 2023-12-15 | 北京奇艺世纪科技有限公司 | 一种异常对象检测方法及装置、电子设备及存储介质 |
CN113837879A (zh) * | 2021-09-14 | 2021-12-24 | 上证所信息网络有限公司 | 一种指数行情的异常检测方法 |
CN113837879B (zh) * | 2021-09-14 | 2023-12-19 | 上证所信息网络有限公司 | 一种指数行情的异常检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112508630B (zh) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10484413B2 (en) | System and a method for detecting anomalous activities in a blockchain network | |
Blondel et al. | A survey of results on mobile phone datasets analysis | |
US20210021616A1 (en) | Method and system for classifying data objects based on their network footprint | |
Xiang et al. | Modeling relationship strength in online social networks | |
Xu et al. | Mining community and inferring friendship in mobile social networks | |
JP2003523578A (ja) | ネットワーク上の対話の妥当性を決定するためのシステムおよび方法 | |
EP2578006A1 (en) | Classification of network users based on corresponding social network behavior | |
CN112508630B (zh) | 异常会话群的检测方法、装置、计算机设备和存储介质 | |
CN111435507A (zh) | 广告反作弊方法、装置、电子设备及可读存储介质 | |
US10218575B2 (en) | Provision, configuration and use of a telecommunications network | |
US20130211873A1 (en) | Determining a churn risk | |
Doyle et al. | Predicting complex user behavior from CDR based social networks | |
AlSuwaidan et al. | Toward information diffusion model for viral marketing in business | |
Mao et al. | TPS: A topological potential scheme to predict influential network nodes for intelligent communication in social networks | |
CN109213801A (zh) | 基于关联关系的数据挖掘方法和装置 | |
Mishra | Entity resolution in online multiple social networks (@ Facebook and LinkedIn) | |
Idrais et al. | Characterizing user behavior in Online Social Networks: Study of seasonal changes in the Moroccan community on Facebook | |
Perez et al. | A social network representation for collaborative filtering recommender systems | |
CN114445151A (zh) | 一种流量作弊对象的检测方法、装置、设备及存储介质 | |
Abd-Allah et al. | DyadChurn: customer churn prediction using strong social ties | |
Rahaman et al. | On the multi-stage influence maximization problem | |
Kpiebaareh et al. | User-connection behaviour analysis in service management using bipartite labelled property graph | |
Nasrullah | Detecting terrorist activity patterns using investigative data mining tool | |
Oliveira et al. | Do we need a perfect ground-truth for benchmarking Internet traffic classifiers? | |
CN113780413A (zh) | 群体风险识别方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40040649 Country of ref document: HK |