CN112087444B - 账号识别方法和装置、存储介质及电子设备 - Google Patents
账号识别方法和装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN112087444B CN112087444B CN202010923385.4A CN202010923385A CN112087444B CN 112087444 B CN112087444 B CN 112087444B CN 202010923385 A CN202010923385 A CN 202010923385A CN 112087444 B CN112087444 B CN 112087444B
- Authority
- CN
- China
- Prior art keywords
- session
- target
- account
- behavior
- target account
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 230000006399 behavior Effects 0.000 claims abstract description 303
- 238000012549 training Methods 0.000 claims description 66
- 230000003993 interaction Effects 0.000 claims description 53
- 230000015654 memory Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 13
- 230000002452 interceptive effect Effects 0.000 claims description 9
- 230000010354 integration Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 17
- 238000013473 artificial intelligence Methods 0.000 abstract description 12
- 230000008569 process Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及应用人工智能技术识别会话群组中恶意账号的方案,具体公开了一种账号识别方法和装置、存储介质及电子设备。其中,该方法包括:获取使用目标账号登录的会话应用客户端发送的用户行为数据,其中,用户行为数据包括目标账号关联的会话群组中产生的目标会话记录数据;从目标会话记录数据中提取目标账号对应的目标会话行为特征;基于目标会话行为特征获取目标账号对应的会话行为识别系数;在会话行为识别系数大于第一阈值的情况下,确定目标账号为执行恶意会话行为的恶意账号。本发明解决了相关技术提供的识别方法存在识别效率较低的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种账号识别方法和装置、存储介质及电子设备。
背景技术
为了达到营销目的,有很多营销平台会通过智能机器人对各个会话群组进行消息轰炸,如向各个会话群组频繁地发送骚扰广告或垃圾消息。这将使得会话群组的正常的用户账号受到很大干扰和影响。
但目前针对这类会话群组中执行这些恶意营销行为的对象账号,通常需要专门人员手动筛选出来,从而导致识别出这些账号的识别效率较低的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种账号识别方法和装置、存储介质及电子设备,以至少解决相关技术提供的识别方法存在识别效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种账号识别方法,包括:获取使用目标账号登录的会话应用客户端发送的用户行为数据,其中,上述用户行为数据包括上述目标账号关联的会话群组中产生的目标会话记录数据;从上述目标会话记录数据中提取上述目标账号对应的目标会话行为特征;基于上述目标会话行为特征获取上述目标账号对应的会话行为识别系数;在上述会话行为识别系数大于第一阈值的情况下,确定上述目标账号为执行恶意会话行为的恶意账号。
根据本发明实施例的另一方面,还提供了一种账号识别装置,包括:第一获取单元,用于获取使用目标账号登录的会话应用客户端发送的用户行为数据,其中,上述用户行为数据包括上述目标账号关联的会话群组中产生的目标会话记录数据;提取单元,用于从上述目标会话记录数据中提取上述目标账号对应的目标会话行为特征;第二获取单元,用于基于上述目标会话行为特征获取上述目标账号对应的会话行为识别系数;识别单元,用于在上述会话行为识别系数大于第一阈值的情况下,确定上述目标账号为执行恶意会话行为的恶意账号。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述账号识别方法。
根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的账号识别方法。
在本发明实施例中,基于从目标会话数据中提取的目标账号对应的目标会话行为特征,获取目标账号对应的会话行为识别系数,以便于利用该会话行为识别系数自动识别确定该目标账号是否为执行恶意会话行为的恶意账号,从而实现基于目标账号在关联的会话群组中的目标会话行为特征,来快速智能地识别出该目标账号是否为恶意账号,而无需再由专门运维人员来手动筛选出恶意账号,简化了对会话应用中的恶意账号的识别操作,提高了账号识别效率,进而克服了相关技术中账号识别效率较低的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的账号识别方法的硬件环境的示意图;
图2是根据本发明实施例的一种可选的账号识别方法的流程图;
图3是根据本发明实施例的一种可选的账号识别方法的示意图;
图4是根据本发明实施例的另一种可选的账号识别方法的示意图;
图5是根据本发明实施例的另一种可选的账号识别方法的流程图;
图6是根据本发明实施例的一种可选的账号识别方法的模型训练流程图;
图7是根据本发明实施例的又一种可选的账号识别方法的流程图;
图8是根据本发明实施例的一种可选的账号识别装置的结构示意图;
图9是根据本发明实施例的一种可选的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例应用人工智能技术识别会话群组中恶意账号的方案,具体通过如下实施例进行说明:
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
根据本发明实施例的一个方面,提供了一种账号识别方法,可选地,作为一种可选的实施方式,上述账号识别方法可以但不限于应用于如图1所示的硬件环境中的账号识别系统。其中,该账号识别系统中包括终端设备102、网络104、服务器106及终端设备108。其中,终端设备102中运行有使用账号ID-1登录的会话应用客户端,终端设备108中运行有使用账号ID-2登录的会话应用客户端,这里账号ID-1与账号ID-2为会话应用中同一会话群组的两个成员账号,该会话群组中还包括其他成员账号(图中未示出对应的会话应用客户端所在终端设备)。上述终端设备102中包括人机交互屏幕1022,处理器1024及存储器1026。人机交互屏幕1022用于呈现包含会话应用客户端的会话窗口的人机交互界面,还用于提供人机交互接口接收对人机交互界面执行的人机交互操作,以获取待交互的消息;处理器1024用于将消息通过服务器106发送给其他成员账号(如属于同一会话群组的终端设备108中的账号ID-2),或从服务器106中接收其他成员账号(如属于同一会话群组的终端设备108中的账号ID-2)发送的消息;存储器1026用于存储上述交互过程产生的会话记录数据。
此外,服务器106中包括数据库1062及处理引擎1064,数据库1062用于存储各个会话应用客户端发送的会话记录数据,处理引擎1064用于根据会话记录数据提取各自对应的会话行为特征,并将于该会话行为特征识别出各个账号是否为执行恶意会话行为的恶意账号,这里恶意会话行为可以包括但不限于:定期且高频地发布营销消息、广告消息或垃圾消息等非正常会话消息。
终端设备108中包括人机交互屏幕1082,处理器1084及存储器1086。人机交互屏幕1082用于呈现包含会话应用客户端的会话窗口的人机交互界面,还用于提供人机交互接口接收对人机交互界面执行的人机交互操作,以获取待交互的消息;处理器1084用于将上述消息通过服务器106发送给其他成员账号((如属于同一会话群组的终端设备102中的账号ID-1)),或从服务器106中接收其他成员账号(如属于同一会话群组的终端设备102中的账号ID-1)发送的消息;存储器1086用于存储上述交互过程产生的会话记录数据。
具体过程如以下步骤:如步骤S102,终端设备102将使用目标账号(如图1所示账号ID-1)登录的会话应用客户端中产生的用户行为数据通过网络104发送给服务器106,其中,这里用户行为数据包括账号ID-1在关联的会话群组中产生的目标会话记录数据。服务器106通过处理引擎1064将对上述目标会话记录数据执行以下步骤S104-S108:从目标会话记录数据中提取目标账号对应的目标会话行为特征;并基于该目标会话行为特征获取账号ID-1对应的会话行为识别系数。在该会话行为识别系数大于第一阈值的情况下,确定上述账号ID-1为恶意账号。然后如步骤S110,服务器106将通过网络104向上述会话群组中所有成员账号(如包括账号ID-1、账号ID-2及其他成员账号)所在终端设备发送提醒消息。例如,在账号ID-1在会话群组中发布消息“XXX”时,将在如图1中账号ID-1登录的会话应用客户端的人机交互屏幕1022所展示的会话窗口中展示提醒消息“ID-1为恶意账号”,且在如图1中账号ID-2登录的会话应用客户端的人机交互屏幕1082所展示的会话窗口中展示提醒消息“ID-1为恶意账号”。这里图中所示为示例,本实施例中对此不作任何限定。
需要说明的是,在本实施例中,在获取使用目标账号登录的会话应用客户端发送的用户行为数据之后,从其中包括的在关联的会话群组中产生的目标会话记录数据中提取目标账号对应的目标会话行为特征。然后,基于该目标会话行为特征获取目标账号对应的会话行为识别系数,并在该会话行为识别系数大于第一阈值的情况下,确定该目标账号为执行恶意会话行为的恶意账号。也就是说,基于从目标会话数据中提取的目标账号对应的目标会话行为特征,获取目标账号对应的会话行为识别系数,以便于利用该会话行为识别系数自动识别确定该目标账号是否为执行恶意会话行为的恶意账号,从而实现基于目标账号在关联的会话群组中的目标会话行为特征,来快速智能地识别出该目标账号是否为恶意账号,而无需再由专门运维人员来手动筛选出恶意账号,简化了对会话应用中的恶意账号的识别操作,提高了账号识别效率,进而克服了相关技术中账号识别效率较低的问题。
可选地,在本实施例中,上述终端设备可以是配置有目标客户端的终端设备,可以包括但不限于以下至少之一:手机(如Android手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、MID(Mobile Internet Devices,移动互联网设备)、PAD、台式电脑、智能电视等。目标客户端可以是即时通信应用客户端、社区空间共享应用客户端等配置有会话交互功能的应用客户端。上述网络可以包括但不限于:有线网络,无线网络,其中,该有线网络包括:局域网、城域网和广域网,该无线网络包括:蓝牙、WIFI及其他实现无线通信的网络。上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。
可选地,作为一种可选的实施方式,如图2所示,上述账号识别方法包括:
S202,获取使用目标账号登录的会话应用客户端发送的用户行为数据,其中,用户行为数据包括目标账号关联的会话群组中产生的目标会话记录数据;
S204,从目标会话记录数据中提取目标账号对应的目标会话行为特征;
S206,基于目标会话行为特征获取目标账号对应的会话行为识别系数;
S208,在会话行为识别系数大于第一阈值的情况下,确定目标账号为执行恶意会话行为的恶意账号。
可选地,在本实施例中,上述账号识别方法可以但不限于携带有智能会话交互功能的应用客户端,这里的应用客户端可以但不限于应用于多个领域,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等。也就是说,通过获取各个会话应用客户端发送的用户行为数据,以获取会话过程中目标账号在关联的会话群组中产生的目标会话记录数据,并从该目标会话记录数据中提取该目标账号的目标会话行为特征,从而实现基于该目标会话行为特征来智能分析出目标账号为执行恶意会话行为的恶意账号的会话行为识别系数。这里的恶意会话行为可以包括但不限于:由智能机器人定期且高频地在会话群组自动发布恶意聊天广告、恶意营销消息等。这里为示例,本实施例中对于在会话群组中对各个成员账号造成干扰的恶意会话行为的具体示例不作任何限定。
可选地,在本实施例中,上述基于目标会话行为特征获取目标账号对应的会话行为识别系数可以包括但不限于:利用预先基于各个样本会话行为数据的样本特征通过多次机器训练得到的会话行为识别模型,来对上述目标会话行为特征进行智能分析,得到与该目标会话行为特征匹配的会话行为识别系数,从而实现根据该会话行为识别系数与第一阈值的比对结果,来确定目标账号是否为恶意账号。
需要说明的是,在本实施例中,上述样本会话行为数据可以包括但不限于:第一目标时间段内没有被举报封号记录的第一账号在关联的第一样本会话群组中产生的正样本会话记录数据;第二目标时间段内被举报封号的次数大于第二阈值的第二账号在关联的第二样本会话群组中产生的负样本会话记录数据。从而实现利用正负双向样本来辅助模型训练,以提升模型训练的准确性。此外,在本实施例中,在得到会话行为识别模型之后,还可以但不限于利用各个会话应用客户端上报的投诉举报数据来对上述会话行为识别模型进行更新维护,如调整更新会话行为识别模型的样本库中的正样本会话记录数据和/或负样本会话记录数据,从而实现基于更新后的样本特征来得到识别更加精准地更新后的会话行为识别模型。
此外,在本实施例中,在确定目标账号为恶意账号之后,还可以包括但不限于执行以下至少一种处理:
1)在目标账号请求在目标会话群组中执行目标交互行为的情况下,对该目标会话群组中的各个成员账号登录的会话应用客户端发送提醒信息。
可选地,在本实施例中,这里的提醒信息可以包括但不限于在目标会话群组的会话窗口上显示弹窗,以显示该提醒信息;还可以但不限于在会话窗口内直接显示提醒信息。这里显示方式为示例,本实施例中对此不作任何限定。
需要说明的是,这里目标交互行为可以但不限于为目标账号将在目标会话群组中触发交互的行为,如入群行为或发布消息行为等。这里为示例,本实施例中对此不作任何限定。
2)在目标账号请求在目标会话群组中执行目标交互行为的情况下,对该目标会话群组中非目标账号的其他成员账号登录的会话应用客户端发送提醒信息。
也就是说,对非目标账号的其他成员账号提醒:该目标账号为恶意账号,其所发布的消息并非正常消息,以便于这些其他成员账号小心其所发布的消息内容,或将其剔除出当前会话群组。
3)对目标账号执行禁止操作处理。
需要说明的是,对于判定为恶意账号的目标账号进行权限限制,通过禁止其触发任何交互操作以使其无法对其他账号产生消息干扰。如这里的禁止操作可以包括但不限于:封号处理,使其无法发布消息,也无法对其他好友账号的社区空间进行访问或产生任何交互。此外,在本实施例中,上述禁止操作可以但不限于配置有对应的操作时长,如禁止操作(封号)7天。这里为示例,对于权限限制的操作还可以包括其他方式,本实施例中对此不作限定。
通过本申请提供的实施例,基于从目标会话数据中提取的目标账号对应的目标会话行为特征,获取目标账号对应的会话行为识别系数,以便于利用该会话行为识别系数自动识别确定该目标账号是否为执行恶意会话行为的恶意账号,从而实现基于目标账号在关联的会话群组中的目标会话行为特征,来快速智能地识别出该目标账号是否为恶意账号,而无需再由专门运维人员来手动筛选出恶意账号,简化了对会话应用中的恶意账号的识别操作,提高了账号识别效率,进而克服了相关技术中账号识别效率较低的问题。
作为一种可选的方案,在确定目标账号为执行恶意会话行为的恶意账号之后,还包括:
1)在目标账号请求在目标会话群组中执行目标交互行为的情况下,向目标会话群组中的各个成员账号登录的会话应用客户端发送提醒消息,其中,提醒消息用于提示目标账号为恶意账号;或者
2)对目标账号执行禁止操作处理。
需要说明的是,在本实施例中,上述目标会话群组可以但不限于为目标账号关联的多个会话群组中的任意一个会话群组。如可以从目标账号的会话列表中直接选择进入一个会话群组Q1后,即可直接展示会话群组Q1对应的会话窗口,并基于该会话窗口显示上述提醒信息;又如还可以临时请求加入一个新的会话群组Q2,在确认允许其进入该会话群组Q2之后,则可为目标账号创建新的会话窗口,以便于显示上述提醒信息,而对于会话群组Q2内其他成员账号则可直接展示会话窗口,并基于该会话窗口显示上述提醒信息。本实施例中对于目标会话群组的确定过程不作任何限定。
具体结合图3所示示例进行说明:假设目标账号ID-1被判定为恶意账号,则如图3(a)所示,可以在目标账号ID-1登录的会话应用客户端展示的目标会话群组的会话窗口的右下角显示可关闭的弹窗,并提示提醒信息“ID-1为恶意账号”;或者,在如图3(b)所示,在会话窗口的上端横幅显示可关闭的弹窗,并提示提醒信息“ID-1为恶意账号”。还可以如图3(c)所示,在目标会话群组的会话窗口内显示提醒信息“ID-1为恶意账号”。这里对于目标会话群组中的其他各个成员账号,对应的展示界面也可以参考如3(a)-图3(c)所示,这里不再赘述。
可选地,在本实施例中,在向目标会话群组中的各个成员账号登录的会话应用客户端发送提醒消息之前,还包括以下之一:
(1)在目标账号请求进入目标会话群组的情况下,确定目标账号请求执行目标交互行为;
(2)在目标账号请求在目标会话群组中发布消息的情况下,确定目标账号请求执行目标交互行为。
具体结合图4所示示例进行说明:仍假设目标账号ID-1被判定为恶意账号,则在目标账号请求进入目标会话群组时,如图4(a)所示,可以在目标账号ID-1所在目标会话群组中的成员账号ID-2登录的会话应用客户端展示的目标会话群组的会话窗口的右下角显示可关闭的弹窗,并在该弹窗中显示提醒信息“疑似恶意账号的ID-1加入群组”。如图4(b)所示,还可以在会话窗口内直接显示提醒信息“疑似恶意账号的ID-1加入群组”。这里对于目标会话群组中的其他各个成员账号,对应的展示界面也可以参考如4(a)-图4(b)所示,这里不再赘述。
通过本申请提供的实施例,在确定目标账号为执行恶意会话行为的恶意账号之后,可以执行以下至少一种处理:对在目标账号在目标会话群组中执行目标交互行为的情况下,则向目标会话群组中的各个成员账号登录的会话应用客户端发送提醒信息,以提示目标账号为恶意账号;对目标账号执行禁止操作处理。从而实现减少恶意账号对会话群组中的各个成员账号造成的消息干扰。
作为一种可选的方案,基于目标会话行为特征获取目标账号对应的会话行为识别系数包括:
S1,将目标会话行为特征输入会话行为识别模型,其中,会话行为识别模型为利用多个样本会话行为数据进行多次训练得到的识别模型,多个样本会话行为数据包括:白名单会话行为数据和黑名单会话行为数据,白名单会话行为数据为第一目标时间段内没有被举报封号记录的第一账号在关联的第一样本会话群组中产生的正样本会话记录数据;黑名单会话行为数据为第二目标时间段内被举报封号的次数大于第二阈值的第二账号在关联的第二样本会话群组中产生的负样本会话记录数据;
S2,在会话行为识别模型中对目标会话行为特征进行整合运算,得到识别结果,其中,识别结果包括会话行为识别系数。
例如,上述会话行为识别模型的处理过程具体可以结合图5所示示例进行说明:在获取到目标账号的用户行为数据中包括的在关联的会话群组中产生的目标会话记录数据502之后,如步骤S502,将该目标会话记录数据发送处理模块504,以执行步骤S504从中提取目标账号对应的目标会话行为特征。然后如步骤S506,将这里的目标会话行为特征输入会话行为识别模型506,以使其执行步骤S508,通过对该目标会话行为特征进行智能分析,以得到对应的会话行为识别系数(即用于指示目标账号为恶意账号的概率),然后如步骤S510,输出该会话行为识别系数,以便于对其进行进一步处理,如显示提醒信息或封号处理等。
需要说明的是,这里的会话行为识别模型可以但不限于人工智能技术中所使用的人工神经网络模型,如卷积神经网络模型(Convolutional Neural Network,CNN)、循环神经网络模型(Recurrent Neural Network,RNN)或其他深度学习神经网络。其中,CNN是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,包括卷积层和池化层。RNN是一种节点定向连接成环的人工神经网络,其内部状态可以展示动态时序行为,可以利用它内部的记忆来处理任意时序的输入序列。这里为示例,还可以采用其他基于svm分类器构建的模型,本实施例中对此不作限定。
可选地,在本实施例中,在获取使用目标账号登录的会话应用客户端发送的用户行为数据之前,还包括:获取多个样本会话行为数据;从每个样本会话行为数据中分别提取样本特征,其中,样本特征包括与白名单会话行为数据匹配的正样本特征,及与黑名单会话行为数据匹配的负样本特征;将样本特征依次输入训练中的会话行为识别模型,直至得到达到收敛条件的会话行为识别模型,其中,在正样本特征对应的第一训练识别结果与正样本标签的匹配度小于第一训练阈值的情况下,反馈调整训练中的会话行为识别模型中的权重;在负样本特征对应的第二训练识别结果和负样本标签的匹配度小于第二训练阈值的情况下,反馈调整训练中的会话行为识别模型中的权重,收敛条件包括以下之一:训练迭代次数达到第一训练阈值,训练中的会话行为识别模型连续N次输出的训练识别结果之间的差值小于第二训练阈值,N为正整数。
具体结合图6所示示例进行说明:多个样本会话行为数据中包括白名单会话行为数据602-1和黑名单会话行为数据602-2。假设上述白名单会话行为数据602-1包括:注册时长大于3年,且没有被具备封号记录的第一账号在关联的第一样本会话群组中产生的正样本会话记录数据,上述黑名单会话行为数据602-2包括:执行恶意会话行为被举报封号的次数大于3次的第二账号在关联的第二样本会话群组中产生的负样本会话记录数据。如步骤S602-1和S602-2,对样本会话行为数据进行预处理:对白名单会话行为数据提取会话行为特征,得到正样本特征,并对黑名单会话行为数据提取会话行为特征,得到负样本特征。然后如步骤S604,将上述样本特征存储到数据库(如mysql数据库)604。
然后,如步骤S606,将上述样本特征(包含正样本特征和负样本特征)依次发送训练中的会话行为识别模型606,以使其执行步骤S608,利用样本特征进行多次迭代,完成离线训练。在确定达到收敛条件时,如步骤S610,将该会话行为识别模型606上线,以应用到实际场景中解决恶意账号产生的消息干扰问题。
需要说明的是,上述收敛条件可以包括但不限于以下之一:1)会话行为识别模型的训练迭代次数达到预先配置的第一训练阈值;2)连续N次输出的训练识别结果之间的差值小于第二训练阈值。通过上述收敛条件来判定训练中的会话行为识别模型已完成离线训练,达到上线应用条件。
此外,在本实施例中,在会话行为识别模型的训练过程中,在正样本特征输入训练中的会话行为识别模型得到第一训练识别结果时,可以利用该第一训练识别结果和与正样本特征匹配的正样本标签进行匹配,若匹配度(如模型中损失函数计算得到的损失值)小于第一训练阈值,则表示正样本特征对应的账号为恶意账号的概率较大,而这与正样本标签不相符,则可通过反馈调整训练中的会话行为识别模型中的权重;而在负样本特征输入训练中的会话行为识别模型得到第二训练识别结果时,可以利用该第二训练识别结果和与负样本特征匹配的负样本标签进行匹配,若匹配度(如模型中损失函数计算得到的损失值)小于第二训练阈值,则表示负样本特征对应的账号为恶意账号的概率较小,而这与负样本标签不相符,则可通过反馈调整训练中的会话行为识别模型中的权重。
这里的反馈调整的方式可以包括但不限于:反向传播算法,(Backpropagation,简称BP)是误差反向传播简称,是一种与最优化方法(如梯度下降法)结合使用的,用来训练人工神经网络的方法,用于对网络中所有权重计算损失函数的梯度。
通过本申请提供的实施例,利用预先训练得到的会话行为识别模型来对目标账号的目标会话行为特征进行智能分析,以便于快速高效地识别出目标账号是否为恶意账号,而无需再由人为参与筛选,简化了账号识别操作,从而达到提高识别效率的目的。此外,在本实施例中,采用白名单和黑名单的方式来对会话行为识别模型进行全面地训练,以确保会话行为识别模型的识别结果的准确性。
作为一种可选的方案,在得到达到收敛条件的会话行为识别模型之后,还包括:
S1,在达到调整触发条件的情况下,获取更新后的白名单会话行为数据和更新后的黑名单会话行为数据,其中,更新后的白名单会话行为数据和更新后的黑名单会话行为数据是根据会话应用客户端发送的投诉举报数据进行更新所得到的;
S2,利用更新后的白名单会话行为数据和更新后的黑名单会话行为数据对会话行为识别模型进行更新调整。
可选地,在本实施例中,上述调整触发条件可以包括但不限于:1)定期调整。也就是在达到调整周期时,则触发调整更新当前正在使用的会话行为识别模型;2)实时监督会话行为识别模型的输出结果,在输出结果的准确率低于一定阈值时,则触发调整更新当前正在使用的会话行为识别模型。需要说明的是,在本实施例中,上述对会话行为识别模型进行更新调整的过程为离线更新,也就是说,更新数据库中存储的样本会话行为数据,得到更新后的白名单会话行为数据和更新后的黑名单会话行为数据,再利用更新后的白名单会话行为数据和更新后的黑名单会话行为数据,来重新通过训练得到会话行为识别模型,从而达到维护更新的目的。
可选地,在本实施例中,获取更新后的白名单会话行为数据和更新后的黑名单会话行为数据包括:
S12,获取会话应用客户端发送的投诉举报数据;
S14,在投诉举报数据指示原本识别为并非恶意账号的第一对象账号被举报已变更为恶意账号,且举报次数达到举报阈值的情况下,将第一对象账号产生的会话行为数据添加至黑名单会话行为数据;
S16,在投诉举报数据中指示原本识别为恶意账号的第二对象账号被投诉并非恶意账号的情况下,将第二对象账号产生的会话行为数据添加至白名单会话行为数据。
具体仍结合图6所示内容进行说明:假设在步骤S610,会话行为识别模型上线应用之后,可以获取各个会话应用客户端发送的投诉举报数据608。然后对上述投诉举报数据608进行分析,以更新数据库604中存储的样本会话行为数据,如步骤S612。具体如:在投诉举报数据指示原本识别为并非恶意账号的第一对象账号被举报已变更为恶意账号,且举报次数达到举报阈值的情况下,则将第一对象账号产生的会话行为数据添加至黑名单会话行为数据;而在投诉举报数据中指示原本识别为恶意账号的第二对象账号被投诉并非恶意账号的情况下,将第二对象账号产生的会话行为数据添加至白名单会话行为数据。
进一步,在根据上述过程更新数据库604中存储的数据后,再执行步骤S614,利用更新后的白名单会话行为数据和更新后的黑名单会话行为数据重新进行离线训练,以达到维护会话行为识别模型的目的。
通过本申请提供的实施例,在达到调整触发条件的情况下,对白名单会话行为数据和黑名单会话行为数据进行更新,从而实现利用更新后的白名单会话行为数据和更新后的黑名单会话行为数据,来对会话行为识别模型进行更新维护,以确保会话行为识别模型的识别结果的准确率,避免由于会话行为识别模型识别结果不准确导致对恶意账号的遗漏处理。
作为一种可选的方案,从目标会话记录数据中提取目标账号对应的目标会话行为特征包括以下至少之一:
1)从目标会话记录数据中提取目标账号的好友关系数据,并根据好友关系数据提取目标账号的好友关系特征,其中,好友关系特征用于指示在各个关联的会话群组中与目标账号建立有好友关系的成员账号所占的比率;
2)从目标会话记录数据中提取目标账号与各个账号之间的交互次数,并根据交互次数提取目标账号的交互次数特征,其中,交互次数特征用于指示目标账号与非群组账号进行会话交互的次数;
3)从目标会话记录数据中提取目标账号与各个会话账号之间的会话记录,并根据会话记录提取目标账号的会话内容特征,其中,会话内容特征包括用于指示目标账号所发布的消息内容的重复度的第一内容特征,及用于指示消息内容是否携带有链接号码的第二内容特征;
4)从目标会话记录数据中提取目标账号与各个会话账号之间的交互频率,并根据交互频率提取目标账号的交互频率特征,其中,交互频率特征用于指示目标账号发布消息的频率是否大于目标频率阈值;
5)从目标会话记录数据中提取目标账号的登录信息,并根据登录信息提取目标账号的登录特征,其中,登录特征包括用于指示目标账号在电脑端登录的次数与目标账号在移动终端登录的次数二者之间的差值;
6)从目标会话记录数据中提取目标账号的访问轨迹信息,并根据访问轨迹信息提取目标账号的访问特征,其中,访问特征包括用于指示目标账号访问会话窗口界面之外的其他界面的访问时长或访问次数;
7)从目标会话记录数据中提取目标账号管理的目标投诉举报数据,并根据目标投诉举报数据提取目标账号的投诉举报特征,其中,投诉举报特征包括用于指示目标账号被投诉举报的次数。
具体结合图7所示示例进行说明:假设终端设备702中运行有会话应用客户端7021,其中会话应用客户端7021使用目标账号登录,服务器704中包括:预处理模块7041、处理模块7042、识别模块7043、训练模块7044、样本采集模块7040及存储模块7045。具体执行识别过程如以下步骤:
如步骤S702,服务器704获取到终端设备702中运行的会话应用客户端7021发送的用户行为数据。
然后通过预处理模块7042对该用户行为数据中的会话记录数据进行预处理(即特征提取),以得到会话行为特征,并将会话行为特征存储到存储模块7045中的mysql数据库中。
这里的会话行为特征包括括以下至少之一:好友关系特征、交互次数特征、会话内容特征、交互频率特征、登录特征、访问特征及投诉举报特征。其中,
(1)好友关系特征:获取目标账号在各个关联的会话群组中的好友数量,并基于该好友数量确定其在会话群组中所占的比率,将该比率作为目标账号的好友关系特征。这里好友关系特征中所指示的比率越小,指示该目标账号为恶意账号的概率越大;
(2)交互次数特征:获取目标账号与个人账号(非群组账号)进行交互的次数,并将该次数作为目标账号的交互次数特征。这里交互次数特征所指示的次数为0的情况下,表示该目标账号并未一对一与好友进行过会话交互,则该目标账号为恶意账号的概率越大;
(3)会话内容特征:获取目标账号所发布的消息内容,并基于该消息内容确定用于指示目标账号所发布内容的重复度的第一内容特征,及用于指示是否携带有链接号码的第二内容特征。这里消息内容越单一,重复越高和/或内容携带有链接号码,指示该目标账号为恶意账号的概率越大;
(4)交互频率特征:获取目标账号所发布的消息内容的时间间隔和交互频率。这里交互频率特征指示时间间隔较短且分布均匀,交互频率越高,指示该目标账号为恶意账号的概率越大;
(5)登录特征:获取目标账号在不同设备登录的登录信息。这里登录特征指示电脑PC端登录次数大于移动终端登录次数,且二者次数的差值越大,指示该目标账号为恶意账号的概率越大;
(6)访问特征:获取目标账号的访问轨迹信息,如目标账号访问会话应用客户端中的会话窗口界面、社区共享空间界面等。这里访问特征指示目标账号仅访问了会话窗口界面,指示该目标账号为恶意账号的概率越大;
(7)投诉举报特征:目标账号被投诉举报的次数越大,指示该目标账号为恶意账号的概率越大。
上述为实施例,本实施例中对此不作任何限定。
进一步,如步骤S704,确定目标账号请求进入目标会话群组或在目标会话群组中发布消息,则可以在服务器704中实现以下过程:通过处理模块7042和识别模块7043对上述会话行为特征进行智能识别分析,以得到会话行为识别系数。假设得到该会话行为识别系数大于80分,则在步骤S706,返回处理结果:对目标会话群组中各个成员账号进行弹窗提醒,以提示该目标账号为恶意账号,或疑似恶意账号的目标账号加入群组等。又假设该会话行为识别系数大于90分,则在步骤S706,返回处理结果:通知会话应用客户端,其所使用的目标账号已经被做封号7天处理。
进一步,上述识别模块7043中所使用的会话行为识别模型是利用数据采集模块7040中采集到的样本会话行为数据,通过训练模块7044的多次迭代训练得到。
此外,在得到会话行为识别模型之后,还可以利用投诉举报数据对其进行更新训练,以定时维护和更新模型,被举报投诉是误判为恶意账号的会话行为数据可以加到白名单会话行为数据中,被多次举报的账号的会话行为数据也可以加入黑名单会话行为数据,从而扩大更新数据库中的样本会话行为数据,以重新训练。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述账号识别方法的账号识别装置。如图8所示,该装置包括:
1)第一获取单元802,用于获取使用目标账号登录的会话应用客户端发送的用户行为数据,其中,用户行为数据包括目标账号关联的会话群组中产生的目标会话记录数据;
2)提取单元804,用于从目标会话记录数据中提取目标账号对应的目标会话行为特征;
3)第二获取单元806,用于基于目标会话行为特征获取目标账号对应的会话行为识别系数;
4)识别单元808,用于在会话行为识别系数大于第一阈值的情况下,确定目标账号为执行恶意会话行为的恶意账号。
可选地,在本实施例中,上述账号识别装置可以但不限于携带有智能会话交互功能的应用客户端,这里的应用客户端可以但不限于应用于多个领域,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等。也就是说,通过获取各个会话应用客户端发送的用户行为数据,以获取会话过程中目标账号在关联的会话群组中产生的目标会话记录数据,并从该目标会话记录数据中提取该目标账号的目标会话行为特征,从而实现基于该目标会话行为特征来智能分析出目标账号为执行恶意会话行为的恶意账号的会话行为识别系数。这里的恶意会话行为可以包括但不限于:由智能机器人定期且高频地在会话群组自动发布恶意聊天广告、恶意营销消息等。这里为示例,本实施例中对于在会话群组中对各个成员账号造成干扰的恶意会话行为的具体示例不作任何限定。
具体的账号识别装置的实施例,可以参考上述方法实施例,本实施例中对此不再赘述。
本发明实施例的又一个方面,还提供了一种用于实施上述账号识别方法的电子设备,该电子设备可以是图1所示的服务器。本实施例以该电子设备为服务器为例来说明。如图9所示,该电子设备包括存储器902和处理器904,该存储器902中存储有计算机程序,该处理器904被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取使用目标账号登录的会话应用客户端发送的用户行为数据,其中,用户行为数据包括目标账号关联的会话群组中产生的目标会话记录数据;
S2,从目标会话记录数据中提取目标账号对应的目标会话行为特征;
S3,基于目标会话行为特征获取目标账号对应的会话行为识别系数;
S4,在会话行为识别系数大于第一阈值的情况下,确定目标账号为执行恶意会话行为的恶意账号。
可选地,本领域普通技术人员可以理解,图9所示的结构仅为示意,电子装置电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图9其并不对上述电子装置电子设备的结构造成限定。例如,电子装置电子设备还可包括比图9中所示更多或者更少的组件(如网络接口等),或者具有与图9所示不同的配置。
其中,存储器902可用于存储软件程序以及模块,如本发明实施例中的账号识别方法和装置对应的程序指令/模块,处理器904通过运行存储在存储器902内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的账号识别方法。存储器902可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器902可进一步包括相对于处理器904远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器902具体可以但不限于用于存储用户行为数据或会话行为特征等信息。作为一种示例,如图9所示,上述存储器902中可以但不限于包括上述账号识别装置中的第一获取单元802、提取单元804、第二获取单元806及识别单元808。此外,还可以包括但不限于上述账号识别装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置906用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置906包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置906为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器908,用于显示会话群组中的会话消息等相关信息;和连接总线910,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(P2P,Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述账号识别方法。其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取使用目标账号登录的会话应用客户端发送的用户行为数据,其中,用户行为数据包括目标账号关联的会话群组中产生的目标会话记录数据;
S2,从目标会话记录数据中提取目标账号对应的目标会话行为特征;
S3,基于目标会话行为特征获取目标账号对应的会话行为识别系数;
S4,在会话行为识别系数大于第一阈值的情况下,确定目标账号为执行恶意会话行为的恶意账号。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种账号识别方法,其特征在于,包括:
获取多个样本会话行为数据;从每个所述样本会话行为数据中分别提取样本特征,其中,所述样本特征包括与白名单会话行为数据匹配的正样本特征,及与黑名单会话行为数据匹配的负样本特征;将所述样本特征依次输入训练中的会话行为识别模型,直至得到达到收敛条件的所述会话行为识别模型,其中,在所述正样本特征对应的第一训练识别结果与正样本标签的匹配度小于第一训练阈值的情况下,反馈调整训练中的会话行为识别模型中的权重;在所述负样本特征对应的第二训练识别结果和负样本标签的匹配度小于第二训练阈值的情况下,反馈调整训练中的会话行为识别模型中的权重,所述收敛条件包括以下之一:训练迭代次数达到第一训练阈值,训练中的会话行为识别模型连续N次输出的训练识别结果之间的差值小于第二训练阈值,N为正整数;
获取使用目标账号登录的会话应用客户端发送的用户行为数据,其中,所述用户行为数据包括所述目标账号关联的会话群组中产生的目标会话记录数据;
从所述目标会话记录数据中提取所述目标账号对应的目标会话行为特征;
将所述目标会话行为特征输入所述会话行为识别模型,以基于所述目标会话行为特征获取所述目标账号对应的会话行为识别系数;
在所述会话行为识别系数大于第一阈值的情况下,确定所述目标账号为执行恶意会话行为的恶意账号。
2.根据权利要求1所述的方法,其特征在于,在确定所述目标账号为执行恶意会话行为的恶意账号之后,还包括:
在所述目标账号请求在目标会话群组中执行目标交互行为的情况下,向所述目标会话群组中的各个成员账号登录的会话应用客户端发送提醒消息,其中,所述提醒消息用于提示所述目标账号为所述恶意账号;或者
对所述目标账号执行禁止操作处理。
3.根据权利要求2所述的方法,其特征在于,在向所述目标会话群组中的各个成员账号登录的会话应用客户端发送提醒消息之前,还包括以下之一:
在所述目标账号请求进入所述目标会话群组的情况下,确定所述目标账号请求执行所述目标交互行为;
在所述目标账号请求在所述目标会话群组中发布消息的情况下,确定所述目标账号请求执行所述目标交互行为。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标会话行为特征获取所述目标账号对应的会话行为识别系数包括:
所述多个样本会话行为数据包括:所述白名单会话行为数据和所述黑名单会话行为数据,所述白名单会话行为数据为第一目标时间段内没有被举报封号记录的第一账号在关联的第一样本会话群组中产生的正样本会话记录数据;所述黑名单会话行为数据为第二目标时间段内被举报封号的次数大于第二阈值的第二账号在关联的第二样本会话群组中产生的负样本会话记录数据;
在所述会话行为识别模型中对所述目标会话行为特征进行整合运算,得到识别结果,其中,所述识别结果包括所述会话行为识别系数。
5.根据权利要求1所述的方法,其特征在于,在得到达到所述收敛条件的所述会话行为识别模型之后,还包括:
在达到调整触发条件的情况下,获取更新后的白名单会话行为数据和更新后的黑名单会话行为数据,其中,所述更新后的白名单会话行为数据和所述更新后的黑名单会话行为数据是根据所述会话应用客户端发送的投诉举报数据进行更新所得到的;
利用所述更新后的白名单会话行为数据和所述更新后的黑名单会话行为数据对所述会话行为识别模型进行更新调整。
6.根据权利要求5所述的方法,其特征在于,所述获取更新后的白名单会话行为数据和更新后的黑名单会话行为数据包括:
获取所述会话应用客户端发送的所述投诉举报数据;
在所述投诉举报数据指示原本识别为并非恶意账号的第一对象账号被举报已变更为恶意账号,且举报次数达到举报阈值的情况下,将所述第一对象账号产生的会话行为数据添加至所述黑名单会话行为数据;
在所述投诉举报数据中指示原本识别为恶意账号的第二对象账号被投诉并非恶意账号的情况下,将所述第二对象账号产生的会话行为数据添加至所述白名单会话行为数据。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述从所述目标会话记录数据中提取所述目标账号对应的目标会话行为特征包括以下至少之一:
从所述目标会话记录数据中提取所述目标账号的好友关系数据,并根据所述好友关系数据提取所述目标账号的好友关系特征,其中,所述好友关系特征用于指示在各个关联的会话群组中与所述目标账号建立有好友关系的成员账号所占的比率;
从所述目标会话记录数据中提取所述目标账号与各个账号之间的交互次数,并根据所述交互次数提取所述目标账号的交互次数特征,其中,所述交互次数特征用于指示所述目标账号与非群组账号进行会话交互的次数;
从所述目标会话记录数据中提取所述目标账号与各个会话账号之间的会话记录,并根据所述会话记录提取所述目标账号的会话内容特征,其中,所述会话内容特征包括用于指示所述目标账号所发布的消息内容的重复度的第一内容特征,及用于指示所述消息内容是否携带有链接号码的第二内容特征;
从所述目标会话记录数据中提取所述目标账号与各个会话账号之间的交互频率,并根据所述交互频率提取所述目标账号的交互频率特征,其中,所述交互频率特征用于指示所述目标账号发布消息的频率是否大于目标频率阈值;
从所述目标会话记录数据中提取所述目标账号的登录信息,并根据所述登录信息提取所述目标账号的登录特征,其中,所述登录特征包括用于指示所述目标账号在电脑端登录的次数与所述目标账号在移动终端登录的次数二者之间的差值;
从所述目标会话记录数据中提取所述目标账号的访问轨迹信息,并根据所述访问轨迹信息提取所述目标账号的访问特征,其中,所述访问特征包括用于指示所述目标账号访问会话窗口界面之外的其他界面的访问时长或访问次数;
从所述目标会话记录数据中提取所述目标账号管理的目标投诉举报数据,并根据所述目标投诉举报数据提取所述目标账号的投诉举报特征,其中,所述投诉举报特征包括用于指示所述目标账号被投诉举报的次数。
8.一种账号识别装置,其特征在于,包括:
第一获取单元,用于获取多个样本会话行为数据;从每个所述样本会话行为数据中分别提取样本特征,其中,所述样本特征包括与白名单会话行为数据匹配的正样本特征,及与黑名单会话行为数据匹配的负样本特征;将所述样本特征依次输入训练中的会话行为识别模型,直至得到达到收敛条件的所述会话行为识别模型,其中,在所述正样本特征对应的第一训练识别结果与正样本标签的匹配度小于第一训练阈值的情况下,反馈调整训练中的会话行为识别模型中的权重;在所述负样本特征对应的第二训练识别结果和负样本标签的匹配度小于第二训练阈值的情况下,反馈调整训练中的会话行为识别模型中的权重,所述收敛条件包括以下之一:训练迭代次数达到第一训练阈值,训练中的会话行为识别模型连续N次输出的训练识别结果之间的差值小于第二训练阈值,N为正整数;还用于获取使用目标账号登录的会话应用客户端发送的用户行为数据,其中,所述用户行为数据包括所述目标账号关联的会话群组中产生的目标会话记录数据;
提取单元,用于从所述目标会话记录数据中提取所述目标账号对应的目标会话行为特征;
第二获取单元,用于基于所述目标会话行为特征获取所述目标账号对应的会话行为识别系数;
识别单元,用于在所述会话行为识别系数大于第一阈值的情况下,确定所述目标账号为执行恶意会话行为的恶意账号。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至7任一项中所述的方法。
10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010923385.4A CN112087444B (zh) | 2020-09-04 | 2020-09-04 | 账号识别方法和装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010923385.4A CN112087444B (zh) | 2020-09-04 | 2020-09-04 | 账号识别方法和装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112087444A CN112087444A (zh) | 2020-12-15 |
CN112087444B true CN112087444B (zh) | 2022-02-22 |
Family
ID=73732030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010923385.4A Active CN112087444B (zh) | 2020-09-04 | 2020-09-04 | 账号识别方法和装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112087444B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113609276A (zh) * | 2021-08-26 | 2021-11-05 | 武汉夜莺科技有限公司 | 一种群组中客户的管理方法、装置及介质 |
CN114742479B (zh) * | 2022-06-10 | 2022-09-06 | 深圳竹云科技股份有限公司 | 账号识别方法、装置、服务器及存储介质 |
CN116112257B (zh) * | 2023-01-29 | 2024-07-26 | 北京神州泰岳软件股份有限公司 | 一种机器账号识别方法及装置 |
CN116776310B (zh) * | 2023-08-23 | 2024-01-05 | 深圳红途科技有限公司 | 用户账号自动识别方法、装置、计算机设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814149A (zh) * | 2010-05-10 | 2010-08-25 | 华中科技大学 | 一种基于在线学习的自适应级联分类器训练方法 |
CN105184226A (zh) * | 2015-08-11 | 2015-12-23 | 北京新晨阳光科技有限公司 | 数字识别方法和装置及神经网络训练方法和装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101631136A (zh) * | 2008-07-18 | 2010-01-20 | 华为技术有限公司 | 交互广告的实现方法、系统、终端设备和广告客户端 |
TWI457767B (zh) * | 2010-12-02 | 2014-10-21 | Univ Nat Taiwan Science Tech | 一種分辨垃圾郵件之方法 |
CN104065617B (zh) * | 2013-03-20 | 2018-09-28 | 腾讯科技(深圳)有限公司 | 一种骚扰邮件处理方法、装置和系统 |
CN104811424B (zh) * | 2014-01-26 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 恶意用户识别方法及装置 |
CN105654124B (zh) * | 2015-12-29 | 2020-03-24 | 大连楼兰科技股份有限公司 | 一种加快Adaboost训练速度与收敛速度的方法 |
CN106941440B (zh) * | 2016-01-04 | 2020-09-01 | 五八同城信息技术有限公司 | 一种会话反骚扰方法及装置 |
CN107305611B (zh) * | 2016-04-22 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置 |
CN108540431A (zh) * | 2017-03-03 | 2018-09-14 | 阿里巴巴集团控股有限公司 | 账号类型的识别方法、装置和系统 |
CN110197386B (zh) * | 2018-04-12 | 2022-02-08 | 腾讯科技(深圳)有限公司 | 媒体资源推送方法和装置、存储介质及电子装置 |
-
2020
- 2020-09-04 CN CN202010923385.4A patent/CN112087444B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814149A (zh) * | 2010-05-10 | 2010-08-25 | 华中科技大学 | 一种基于在线学习的自适应级联分类器训练方法 |
CN105184226A (zh) * | 2015-08-11 | 2015-12-23 | 北京新晨阳光科技有限公司 | 数字识别方法和装置及神经网络训练方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112087444A (zh) | 2020-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112087444B (zh) | 账号识别方法和装置、存储介质及电子设备 | |
Mazhar et al. | Analysis of IoT security challenges and its solutions using artificial intelligence | |
CN107330731B (zh) | 一种识别广告位点击异常的方法和装置 | |
CN112749749B (zh) | 基于分类决策树模型的分类方法、装置及电子设备 | |
US11295727B2 (en) | Conversation-based chatbot training | |
CN111291170B (zh) | 一种基于智能客服的会话推荐方法及相关装置 | |
CN116010684A (zh) | 物品推荐方法、装置及存储介质 | |
CN111835622B (zh) | 信息拦截方法、装置、计算机设备和存储介质 | |
CN114201516B (zh) | 一种用户画像构建的方法、信息推荐的方法以及相关装置 | |
CN106156362A (zh) | 一种针对预警提示自动提供解决方案的方法及装置 | |
CN113223121A (zh) | 视频生成方法、装置、电子设备及存储介质 | |
CN116701618A (zh) | 一种面向工业终端网络流量检测的图谱联邦学习隐私增强方法 | |
Banjanin et al. | Adaptive Modeling of Prediction of Telecommunications Network Throughput Performances in the Domain of Motorway Coverage | |
Rafique et al. | A graph theory based method to extract social structure in the society | |
Manasa et al. | Tweet spam detection using machine learning and swarm optimization techniques | |
CN113886526A (zh) | 会话处理方法、装置、设备及存储介质 | |
Ivaschenko et al. | Modeling of user behavior for social media analysis | |
Sharma et al. | Comparative analysis of different algorithms in link prediction on social networks | |
Nie et al. | Research on intelligent service of customer service system | |
CN113409096B (zh) | 目标对象识别方法、装置、计算机设备及存储介质 | |
Ho et al. | Discovering communities of users on social networks based on topic model combined with Kohonen network | |
CN111935259B (zh) | 目标帐号集合的确定方法和装置、存储介质及电子设备 | |
Cazares et al. | A Training Web Platform to Improve Cognitive Skills for Phishing Attacks Detection | |
Dharaniya et al. | Survey on interactive chatbot | |
Liu | Simulation Training Auxiliary Model Based on Neural Network and Virtual Reality Technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40035327 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |