CN106921565B - 一种垃圾信息识别的方法及装置 - Google Patents

一种垃圾信息识别的方法及装置 Download PDF

Info

Publication number
CN106921565B
CN106921565B CN201710202442.8A CN201710202442A CN106921565B CN 106921565 B CN106921565 B CN 106921565B CN 201710202442 A CN201710202442 A CN 201710202442A CN 106921565 B CN106921565 B CN 106921565B
Authority
CN
China
Prior art keywords
target
group
current target
information
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710202442.8A
Other languages
English (en)
Other versions
CN106921565A (zh
Inventor
陆瀛海
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201710202442.8A priority Critical patent/CN106921565B/zh
Publication of CN106921565A publication Critical patent/CN106921565A/zh
Application granted granted Critical
Publication of CN106921565B publication Critical patent/CN106921565B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]

Abstract

本发明实施例提供了一种垃圾信息识别的方法及装置,所述方法包括:判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前的目标群组以外的群组;当判断为是时,更新所述目标信息对应的第一迭代次数,并判断所述目标信息对应的第一迭代次数是否小于第一预设次数阈值,如果是,重新确定新的目标群组以及新的目标用户,并返回执行判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组以外的群组的步骤,如果否,判定所述目标信息为垃圾信息。这样,通过本发明实施例的方法可以有效地识别出扇形传播的垃圾信息,进而提高用户体验。

Description

一种垃圾信息识别的方法及装置
技术领域
本发明涉及网络算法的技术领域,特别是涉及一种垃圾信息识别的方法及装置。
背景技术
随着即时通信网络的兴起与发展,越来越多的网络用户通过即时通信软件记录生活、在即时通信软件上通过收发信息与其他网络用户进行互动交流,因此,在即时通信网络中会产生大量的信息在用户之间传播,同时,也会有垃圾信息发送给用户,严重影响了用户体验。目前,检测垃圾信息的算法都是基于对信息内容的分析与识别,进而识别出垃圾信息并对垃圾信息进行处理。
但是,有一类信息作为单个的信息出现时是不会认定为垃圾信息,这类信息从一个群组被转发到其他群组,然后被转发到更多的群组,这种扇形传播的方式使得这类消息影响越来越多的用户,因此也被认定为垃圾信息。然而,现有的垃圾信息的识别方法对这类扇形传播的垃圾信息无法识别。
发明内容
本发明实施例的目的在于提供一种垃圾信息识别的方法及装置,以解决对扇形传播的垃圾信息无法识别的问题。具体技术方案如下:
第一方面,本发明实施例提供了一种垃圾信息识别的方法,所述方法包括:
获取目标群组中的目标用户发出的目标信息;
判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前的目标群组以外的群组;
当判断为是时,更新所述目标信息对应的第一迭代次数,并判断所述目标信息对应的第一迭代次数是否小于第一预设次数阈值,如果是,将当前目标群组中的当前目标用户发出的所述目标信息对应的来源群组确定为新的目标群组,且将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并返回执行判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组以外的群组的步骤,如果否,判定所述目标信息为垃圾信息;
其中,所述更新所述目标信息对应的第一迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组以外的群组时次数加1。
可选地,所述判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组以外的群组的步骤,包括:
获得当前目标群组中的当前目标用户发出的所述目标信息的标识信息,所述标识信息中包含所述目标信息对应的来源方的ID;
判断所述来源方的ID是否为当前目标群组以外的群组的ID,如果是,表明当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组以外的群组。
可选地,所述方法还包括:
当判断为否时,判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组;
如果是,更新所述目标信息对应的第二迭代次数,并判断所述目标信息对应的第二迭代次数是否小于第二预设次数阈值,如果小于所述第二预设次数阈值,将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并返回执行判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组以外的群组,如果不小于所述第二预设次数阈值,判定所述目标信息为垃圾信息;
其中,所述更新所述目标信息对应的第二迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组时次数加1。
可选地,所述方法还包括:
对所述垃圾信息进行处理。
可选地,所述对所述垃圾信息进行处理的步骤,包括:
将所述垃圾信息提交至人工平台,由所述人工平台对所述垃圾信息进行处理;或者,
调用反垃圾程序,所述反垃圾程序用于阻止所述垃圾信息传递。
第二方面,本发明实施例提供了一种垃圾信息识别的装置,所述装置包括:
获取模块,用于获取目标群组中的目标用户发出的目标信息;
第一判断模块,用于判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前的目标群组以外的群组;
第一处理模块,用于当判定当前目标群组中的当前目标用户发出的所述目标信息来源于当前的目标群组以外的群组时,更新所述目标信息对应的第一迭代次数,并判断所述目标信息对应的第一迭代次数是否小于第一预设次数阈值;
确定模块,用于当判定所述目标信息对应的第一迭代次数小于所述第一预设次数阈值时,将当前目标群组中的当前目标用户发出的所述目标信息对应的来源群组确定为新的目标群组,且将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并触发所述第一判断模块,其中,所述更新所述目标信息对应的第一迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组以外的群组时次数加1;
第一判定模块,用于当判定所述目标信息对应的第一迭代次数不小于所述第一预设次数阈值时,判定所述目标信息为垃圾信息。
可选地,所述第一判断模块包括:
获得子模块,用于获得当前目标群组中的当前目标用户发出的所述目标信息的标识信息,所述标识信息中包含所述目标信息对应的来源方的ID;
第一判断子模块,用于判断所述来源方的ID是否为当前的目标群组以外的群组的ID,如果是,表明当前的目标群组中的当前目标用户发出的所述目标信息来源于当前的目标群组以外的群组。
可选地,所述装置还包括:
第二处理模块,用于当判定当前目标群组中的当前目标用户发出的所述目标信息不是来源于当前的目标群组以外的群组时,判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组;
第二判断模块,用于当判定当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组时,更新所述目标信息对应的第二迭代次数,并判断所述目标信息对应的第二迭代次数是否小于第二预设次数阈值,如果小于所述第二预设次数阈值,将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并触发所述第一判断模块,如果不小于所述第二预设次数阈值,判定所述目标信息为垃圾信息;
其中,所述更新所述目标信息对应的第二迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组时次数加1。
可选地,所述装置还包括:
处理模块,用于对所述垃圾信息进行处理。
可选地,所述处理模块包括:
提交子模块,用于将所述垃圾信息提交至人工平台,由所述人工平台对所述垃圾信息进行处理;或者,
调用子模块,用于调用反垃圾程序,所述反垃圾程序用于阻止所述垃圾信息传递。
本发明实施例提供的一种垃圾信息识别的方法中,通过获取目标群组中的目标用户发出的目标信息并判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前的目标群组以外的群组;当判断为是时,更新所述目标信息对应的第一迭代次数,并判断所述目标信息对应的第一迭代次数是否小于第一次数阈值,如果是,将当前的目标群组中的当前目标用户发出的所述目标信息对应的来源群组确定为新的目标群组,且将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并返回执行判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组以外的群组的步骤,如果否,判定所述目标信息为垃圾信息。这样,通过本发明实施例的方法可以有效地识别出扇形传播的垃圾信息,进而提高用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种垃圾信息识别的方法的一种流程图;
图2为本发明实施例提供的一种垃圾信息识别的方法的另一种流程图;
图3为本发明实施例提供的一种垃圾信息识别的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了有效地识别出扇形传播的垃圾信息,本发明实施例提供了一种垃圾信息识别的方法及装置。
下面首先对本发明实施例所提供的一种垃圾信息识别的方法进行介绍。
其中,本发明实施例所提供的一种垃圾信息识别的方法应用于服务器,尤其是即时通信网络、论坛等网络平台对应的服务器,服务器可以根据本实施例提供的识别方法对终端发送的信息进行检测,通过传播路径的方式有效地识别出垃圾信息,并从垃圾信息的源头阻止垃圾信息的传播。
并且,本发明实施例所提供的一种垃圾信息识别的方法基于信息的传播路径进而对信息进行识别,具体地,可以用于对扇形传播的信息进行识别,所谓扇形传播是指信息从一个群组被转发到其他群组,然后被转发到更多的群组。
需要说明的是,本实施例所提供的一种垃圾信息识别的方法基于信息的传播路径进行识别,可以有效地弥补现有技术中基于消息内容进行识别的方法的缺陷,当然,本领域技术人员可以理解的是,可以将本实施例所提供的垃圾信息识别方法与现有技术中基于消息内容识别的方法结合起来,应用于相应地服务器中,达到更好地识别效果。
如图1所示,本发明实施例所提供的一种垃圾信息识别的方法,可以包括如下步骤:
S101,获取目标群组中的目标用户发出的目标信息;
其中,目标群组为该识别方法应用的网络平台上的任一群组,获取的目标信息可以为该目标群组中的任一用户发出的任一信息,也就是说,可以获取该识别方法所应用的网络平台上的任一信息,进而对获取的信息进行判断是否为垃圾信息。
示例地,在爱奇艺论坛对应的服务器内应用本实施例提供的垃圾信息的识别方法,则可以将爱奇艺论坛中的任一版块作为目标群组,任一用户作为目标用户,例如将视频版块作为目标群组,用户A作为目标用户,进而从该视频版块中选取用户A发出的任一条信息作为待识别信息。
可以理解的是,本方法实施例中所获取的信息可以是文字、图片等形式,并且,文字和图片均可以为通过url(Uniform Resource Locator,统一资源定位符)形态或者经过编码的文字信息形态来传播。
S102,判断当前目标群组中的当前目标用户发出的该目标信息是否来源于当前的目标群组以外的群组,如果是,执行S103;
在获取到目标群组中的目标用户发出的目标信息之后,就可以对该目标信息进行判断,判断该目标信息是否来源于其他群组,并根据不同的判断结果执行不同的操作。具体的,如果判断结果为是,则可以执行S103;如果判断结果为否时,本实施例中可以不继续进行判断,而可以直接确定该目标信息不是垃圾信息。其中,目标信息从其他群组传播到目标群组的方式可以是由目标用户转发的方式、还可以是由目标用户通过复制粘贴的方式,当然,信息传播的方式并不局限于此。
其中,判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组以外的群组的一种具体实现方式可以是:
获得当前目标群组中的当前目标用户发出的所述目标信息的标识信息,所述标识信息中包含所述目标信息对应的来源方的ID;
判断所述来源方的ID是否为当前目标群组以外的群组的ID,如果是,表明当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组以外的群组。
其中,目标信息中的标识信息可以包括当前所在群组的ID、来源方的ID、目标用户的ID等,其中,ID可以为任何可区别于其他的唯一编码等,当目标信息是目标用户在目标群组原创的信息时,则来源方的ID可以为目标信息当前所在目标群组的ID、还可以为编辑该目标信息的目标用户的ID,而当目标信息在目标群组是非原创的,则来源方的ID为目标信息来源群组的ID。进而根据目标信息的标识信息中的来源方ID判断是否为当前的目标群组以外的任一群组的ID。
示例地,在爱奇艺论坛中视频版块为目标群组,从视频版块中获取一条信息作为待识别的目标信息,可以从该目标信息的标识信息中获取到该目标信息当前所在的视频版块的ID为G1,将该目标信息发送到视频版块的目标用户为C1,而当该目标信息为目标用户C1的原创信息并且为第一次出现,则该目标信息对应的来源方的ID为目标用户C1或者G1,此时可以判断出该目标信息不是来源于爱奇艺论坛中的其他板块。
而当该目标信息由目标用户C1从爱奇艺论坛中的电视版块转发过来的,其中,电视版块的ID为G2,则此时该目标信息对应的来源方的ID为G2,转发该目标信息的目标用户的ID为C1,判断出该目标信息来源于当前所在的视频版块以外的版块。
另外地,当该目标信息由目标用户C1从爱奇艺论坛中的电视版块复制粘贴过来的,该目标信息的标识信息包含了复制该目标信息时所在群组的ID,即该目标信息的对应的来源方的ID为G2,复制该目标信息的目标用户ID为C1,同样地,判断出该目标信息来源于当前所在的视频版块以外的版块。
S103,更新目标信息对应的第一迭代次数;
S104,判断该目标信息对应的第一迭代次数是否小于第一预设次数阈值,如果是,执行S105,否则,执行S106;
其中,所述更新所述目标信息对应的第一迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组以外的群组时次数加1。
第一迭代次数的计算方式可以将初始值设为0,每当判断出当前目标群组中的所述目标信息来源于当前目标群组以外的群组时,该第一迭代次数相应的次数加1,第一迭代次数可以表示目标信息被转发或者被复制粘贴的次数,因此,可以作为判断目标信息是否是垃圾信息的因素。
S105,将当前目标群组中的当前目标用户发出的目标信息对应的来源群组确定为新的目标群组,且将当前目标群组中的当前目标用户发出的目标信息对应的来源用户确定为新的目标用户,并返回执行S102;
其中,垃圾信息的判定标准可以是预先设定的第一预设次数阈值,第一预设次数阈值可以根据需求或者当前网络环境进行设定。并且,当计算出的第一迭代次数小于第一预设次数阈值时可以返回继续执行S102的判断操作,而当计算出的第一迭代次数不小于第一预设次数阈值时表示该目标信息为垃圾信息。
举例而言,当设定的第一预设次数阈值为2时,在爱奇艺论坛中,选定视频版块为目标群组,并从视频版块中获取一条信息M作为待识别的目标信息,可以从该目标信息M的标识信息中获取到该目标信息M当前所在的视频版块的ID为G1,将该目标信息M发送到视频版块的目标用户为C1,然后判断该目标信息M是否来源于视频版块以外的其他板块。当判断出该目标信息M来源于爱奇艺论坛的电视版块时,此时第一迭代次数变为1,其中,电视版块的ID为G2,同时判断当前的第一迭代次数是否小于预设次数阈值,可知当前第一迭代次数1小于第一预设次数阈值2,因此,将电视版块G2重新确定为新的目标群组,并将该目标信息M发送到电视板块G2的用户C2确定为新的目标用户,同时,重新判断电视版块G2中的目标信息M是否来源于电视版块G2以外的版块。同样地,当判断出电视版块G2中的该目标信息M来源于爱奇艺论坛的游戏版块时,此时第一迭代次数加1变为2,其中,游戏版块的ID为G3,同时判断此时的第一迭代次数是否小于第一预设次数阈值,可知此时第一迭代次数2等于第一预设次数阈值2,此时判定该目标信息M为垃圾信息。
S106,判定目标信息为垃圾信息。
需要说明的是,当判断出目标信息为垃圾信息之后可以停止继续执行迭代判断的步骤,即使当前目标群组中的当前目标用户发出的目标信息来源于当前的目标群组以外的群组。
在判断出垃圾信息之后,为了阻止该垃圾信息的继续传播,可以对垃圾信息进行处理。处理垃圾信息的方式可以为:将该垃圾信息提交至人工平台,由人工平台的工作人员对垃圾信息进行人工审核并进行相应地处理,例如,可以将垃圾信息进行等级划分,等级低的垃圾信息可以在限制的群组中转发或者限制该垃圾信息的转发次数,等级较高的垃圾信息则限制转发或者传播,等级最高的垃圾信息则会作删除处理。
另外,还可以在判断出垃圾信息之后,调用相应地反垃圾程序,同样地,反垃圾程序可以用于阻止垃圾信息的传递,或者删除垃圾信息。当然,对垃圾信息的处理并不局限于以上方法。
需要说明的是,本实施例提供的垃圾信息识别的方法是基于信息的传播路径,而现有技术中识别垃圾信息是基于信息内容,因此,在实际应用中,可以将本实施例提供的识别方法与现有技术中的识别方法结合使用,将会对垃圾信息的识别更全面更高效。示例地,当目标用户从其他群组复制了一条目标信息,在发送到目标群组之前对该目标信息进行了修改,此时可以用现有技术中信息内容识别的方法对修改的目标信息与原目标信息进行内容匹配,对于匹配度达到预设要求时再使用本实施例提供的基于传播路径的识别方法进行迭代判断,从而识别出垃圾信息。
本发明实施例提供的一种垃圾信息识别的方法基于信息的传播路径从而进行识别,在本方案中,通过获取目标群组中的目标用户发出的目标信息并判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前的目标群组以外的群组;当判断为是时,更新所述目标信息对应的第一迭代次数,并判断所述目标信息对应的第一迭代次数是否小于第一预设次数阈值,如果是,将当前的目标群组中的当前目标用户发出的所述目标信息对应的来源群组确定为新的目标群组,且将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并返回执行判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组以外的群组的步骤,如果否,判定所述目标信息为垃圾信息。这样,通过本发明实施例的方法可以有效地识别出扇形传播的垃圾信息,进而提高用户体验。
由于有些信息的来源可以是当前群组内其他用户,而该其他用户发出的该信息可以是来自于其他群组的或还是当前群组的另外用户,甚至该其他用户发出的该信息在来自于其他群组时,该其他群组中的该信息来源可以是另外的群组,这也是符合扇形传播的规律,因此,该信息也应该被判断为垃圾信息。基于该需求,为了有效地识别出在群组之间进行扇形传播的垃圾信息的同时能够识别出在群组内进行传播的垃圾信息,本发明实施例还提供了一种垃圾信息识别的方法。
如图2所示,本发明实施例所提供的一种垃圾信息识别的方法,可以包括如下步骤:
S201,获取目标群组中的目标用户发出的目标信息;
S202,判断当前目标群组中的当前目标用户发出的该目标信息是否来源于当前的目标群组以外的群组,如果是,执行S203,否则,执行S207;
在获取到目标群组中的目标用户发出的目标信息之后,就可以对该目标信息进行判断,判断该目标信息是否来源于其他群组,并根据不同的判断结果执行不同的操作。具体的,如果判断结果为是,则可以执行S203;如果判断结果为否时,可以执行S207。
S203,更新目标信息对应的第一迭代次数;
S204,判断该目标信息对应的第一迭代次数是否小于第一预设次数阈值,如果是,执行S205,否则,执行S206;
S205,将当前目标群组中的当前目标用户发出的目标信息对应的来源群组确定为新的目标群组,且将当前目标群组中的当前目标用户发出的目标信息对应的来源用户确定为新的目标用户,并返回执行S202;
S206,判定目标信息为垃圾信息。
本实施例中,S201至S206与上述实施例的S101至S106相似,在此不做赘述。
S207,判断当前目标群组中的当前目标用户发出的目标信息是否来源于当前目标群组,如果是,执行S208;
对于扇形传播的信息是从一个群传播到其他群,从而对用户产生影响,但是,即使不在群组之间传播而仅仅在群组内传播也同样会影响用户体验。因此,当判断出当前的目标群组中的当前目标用户发出的目标信息不是来源于当前的目标群组以外的群组时,继续判断当前的目标群组中的当前目标用户发出的目标信息是否来源于该目标群组,即判断该目标信息是不是在该目标群组内进行传播的。
示例地,当判断出视频版块中的目标信息不是来源于视频版块以外的其他版块时,继续判断该目标信息是不是由视频版块中的用户转发到视频版块中的。
S208,更新目标信息对应的第二迭代次数,并判断目标信息对应的第二迭代次数是否小于第二预设次数阈值,如果是,执行S209,否则,执行S210;
其中,更新目标信息对应的第二迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组时次数加1。
S209,将当前目标群组中的当前目标用户发出的目标信息对应的来源用户确定为新的目标用户,并返回S202;
当判断出目标信息是来源于该目标信息当前所在的目标群组时,继续判断该目标信息对应的第二迭代次数是否小于第二预设次数阈值,如果小于第二预设次数阈值,将当前目标群组中的当前目标用户发出的目标信息对应的来源用户确定为新的目标用户,示例地,在视频版块G1中,用户C1为目标用户,该用户C1发出的信息M为目标信息,并且设定第二预设次数阈值为2,当判断出用户C1在视频版块G1中发出的目标信息M来源于用户C2在视频版块G1中发出的信息M,此时第二迭代次数为1,可知当前第二迭代次数小于第二预设次数阈值2,将用户C2确定为新的目标用户。
S210,判定目标信息为垃圾信息。
示例地,目标群组为视频版块,目标信息A为视频版块中的目标用户X发出的一条信息,且设定第二预设次数阈值为1,当判断出该目标信息A来源于视频版块,继续判断该目标信息A对应的第二迭代次数是否小于第二预设次数阈值1,此时第二迭代次数为1,等于第二预设次数阈值,判定该目标信息A为垃圾信息。
需要说明的是,当第一迭代次数达到第一预设次数阈值时可以判定目标信息为垃圾信息,同样的,当第二迭代次数达到第二预设次数阈值时也可以判定目标信息为垃圾信息,其中,第一预设次数阈值与第二预设次数阈值可以设置为相同值或不同值。
而当判断出目标信息既不是来源于当前的目标群组以外的群组,也不是来源于当前的目标群组时,则可以判断出该目标信息为原创信息。
需要说明的是,当判断出多个群组的内容相同的信息来源于同一用户时,即使第一迭代次数小于第一预设次数阈值或者第二迭代次数小于第二预设次数阈值,同样可以判定该信息为垃圾信息。
通过本实施例提供的方案,不仅可以识别出在群组之间进行扇形传播的垃圾信息,还可以识别出在群组内进行传播的垃圾信息,更有效地提高了用户体验。
相应于上述提供的方法实施例,本发明实施例还提供了一种垃圾信息识别的装置,如图3所示,所述装置可以包括:
获取模块310,用于获取目标群组中的目标用户发出的目标信息;
第一判断模块320,用于判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前的目标群组以外的群组;
第一处理模块330,用于当判定当前目标群组中的当前目标用户发出的所述目标信息来源于当前的目标群组以外的群组时,更新所述目标信息对应的第一迭代次数,并判断所述目标信息对应的第一迭代次数是否小于第一预设次数阈值;
确定模块340,用于当判定所述目标信息对应的第一迭代次数小于第一预设次数阈值时,将当前目标群组中的当前目标用户发出的所述目标信息对应的来源群组确定为新的目标群组,且将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并触发所述第一判断模块320,其中,所述更新所述目标信息对应的第一迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组以外的群组时次数加1;
第一判定模块350,用于当判定所述目标信息对应的第一迭代次数不小于第一预设次数阈值时,判定所述目标信息为垃圾信息。
本实施例提供的一种垃圾信息识别的装置中,通过识别信息的传播路径从而确定出该信息是否为垃圾信息,这样,可以有效地识别出扇形传播的垃圾信息,进而提高用户体验。
可选地,在一种具体实现方式中,所述第一判断模块320包括:
获得子模块,用于获得当前目标群组中的当前目标用户发出的所述目标信息的标识信息,所述标识信息中包含所述目标信息对应的来源方的ID;
第一判断子模块,用于判断所述来源方的ID是否为当前的目标群组以外的群组的ID,如果是,表明当前的目标群组中的当前目标用户发出的所述目标信息来源于当前的目标群组以外的群组。
可选地,在一种具体实现方式中,所述装置还包括:
第二处理模块,用于当判定当前目标群组中的当前目标用户发出的所述目标信息不是来源于当前的目标群组以外的群组时,判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组;
第二判断模块,用于当判定当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组时,更新所述目标信息对应的第二迭代次数,并判断所述目标信息对应的第二迭代次数是否小于第二预设次数阈值,如果小于所述第二预设次数阈值,将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并触发所述第一判断模块320,如果不小于所述预设次数阈值,判定所述目标信息为垃圾信息。
其中,所述更新所述目标信息对应的第二迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组时次数加1。
可选地,在一种具体实现方式中,所述装置还包括:
处理模块,用于对所述垃圾信息进行处理。
可选地,在一种具体实现方式中,所述处理模块包括:
提交子模块,用于将所述垃圾信息提交至人工平台,由所述人工平台对所述垃圾信息进行处理;或者,
调用子模块,用于调用反垃圾程序,所述反垃圾程序用于阻止所述垃圾信息传递。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种垃圾信息识别的方法,其特征在于,所述方法应用于网络平台的服务器,所述方法包括:
获取目标群组中的目标用户发出的目标信息;所述目标群组为所述网络平台上的任一群组,所述目标用户为所述目标群组中的任一用户;
判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前的目标群组以外的群组;
当判断为是时,更新所述目标信息对应的第一迭代次数,并判断所述目标信息对应的第一迭代次数是否小于第一预设次数阈值,如果是,将当前目标群组中的当前目标用户发出的所述目标信息对应的来源群组确定为新的目标群组,且将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并返回执行判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组以外的群组的步骤,如果否,判定所述目标信息为垃圾信息;
其中,所述更新所述目标信息对应的第一迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组以外的群组时次数加1。
2.根据权利要求1所述的方法,其特征在于,所述判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组以外的群组的步骤,包括:
获得当前目标群组中的当前目标用户发出的所述目标信息的标识信息,所述标识信息中包含所述目标信息对应的来源方的ID;
判断所述来源方的ID是否为当前目标群组以外的群组的ID,如果是,表明当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组以外的群组。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当判断为否时,判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组;
如果是,更新所述目标信息对应的第二迭代次数,并判断所述目标信息对应的第二迭代次数是否小于第二预设次数阈值,如果小于所述第二预设次数阈值,将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并返回执行判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组以外的群组,如果不小于所述第二预设次数阈值,判定所述目标信息为垃圾信息;
其中,所述更新所述目标信息对应的第二迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组时次数加1。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述垃圾信息进行处理。
5.根据权利要求4所述的方法,其特征在于,所述对所述垃圾信息进行处理的步骤,包括:
将所述垃圾信息提交至人工平台,由所述人工平台对所述垃圾信息进行处理;或者,
调用反垃圾程序,所述反垃圾程序用于阻止所述垃圾信息传递。
6.一种垃圾信息识别的装置,其特征在于,所述装置应用于网络平台的服务器,所述装置包括:
获取模块,用于获取目标群组中的目标用户发出的目标信息;所述目标群组为所述网络平台上的任一群组,所述目标用户为所述目标群组中的任一用户;
第一判断模块,用于判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前的目标群组以外的群组;
第一处理模块,用于当判定当前目标群组中的当前目标用户发出的所述目标信息来源于当前的目标群组以外的群组时,更新所述目标信息对应的第一迭代次数,并判断所述目标信息对应的第一迭代次数是否小于第一预设次数阈值;
确定模块,用于当判定所述目标信息对应的第一迭代次数小于所述第一预设次数阈值时,将当前目标群组中的当前目标用户发出的所述目标信息对应的来源群组确定为新的目标群组,且将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并触发所述第一判断模块,其中,所述更新所述目标信息对应的第一迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组以外的群组时次数加1;
第一判定模块,用于当判定所述目标信息对应的第一迭代次数不小于所述第一预设次数阈值时,判定所述目标信息为垃圾信息。
7.根据权利要求6所述的装置,其特征在于,所述第一判断模块包括:
获得子模块,用于获得当前目标群组中的当前目标用户发出的所述目标信息的标识信息,所述标识信息中包含所述目标信息对应的来源方的ID;
第一判断子模块,用于判断所述来源方的ID是否为当前的目标群组以外的群组的ID,如果是,表明当前的目标群组中的当前目标用户发出的所述目标信息来源于当前的目标群组以外的群组。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二处理模块,用于当判定当前目标群组中的当前目标用户发出的所述目标信息不是来源于当前的目标群组以外的群组时,判断当前目标群组中的当前目标用户发出的所述目标信息是否来源于当前目标群组;
第二判断模块,用于当判定当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组时,更新所述目标信息对应的第二迭代次数,并判断所述目标信息对应的第二迭代次数是否小于第二预设次数阈值,如果小于所述第二预设次数阈值,将当前目标群组中的当前目标用户发出的所述目标信息对应的来源用户确定为新的目标用户,并触发所述第一判断模块,如果不小于所述第二预设次数阈值,判定所述目标信息为垃圾信息;
其中,所述更新所述目标信息对应的第二迭代次数的方式为当判断出当前目标群组中的当前目标用户发出的所述目标信息来源于当前目标群组时次数加1。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
处理模块,用于对所述垃圾信息进行处理。
10.根据权利要求9所述的装置,其特征在于,所述处理模块包括:
提交子模块,用于将所述垃圾信息提交至人工平台,由所述人工平台对所述垃圾信息进行处理;或者,
调用子模块,用于调用反垃圾程序,所述反垃圾程序用于阻止所述垃圾信息传递。
CN201710202442.8A 2017-03-30 2017-03-30 一种垃圾信息识别的方法及装置 Active CN106921565B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710202442.8A CN106921565B (zh) 2017-03-30 2017-03-30 一种垃圾信息识别的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710202442.8A CN106921565B (zh) 2017-03-30 2017-03-30 一种垃圾信息识别的方法及装置

Publications (2)

Publication Number Publication Date
CN106921565A CN106921565A (zh) 2017-07-04
CN106921565B true CN106921565B (zh) 2019-12-13

Family

ID=59460621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710202442.8A Active CN106921565B (zh) 2017-03-30 2017-03-30 一种垃圾信息识别的方法及装置

Country Status (1)

Country Link
CN (1) CN106921565B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927398A (zh) * 2014-05-07 2014-07-16 中国人民解放军信息工程大学 基于最大频繁项集挖掘的微博炒作群体发现方法
CN104080058A (zh) * 2014-06-16 2014-10-01 百度在线网络技术(北京)有限公司 信息处理方法及装置
CN104954360A (zh) * 2015-04-17 2015-09-30 腾讯科技(深圳)有限公司 分享内容屏蔽方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7814545B2 (en) * 2003-07-22 2010-10-12 Sonicwall, Inc. Message classification using classifiers
KR101092755B1 (ko) * 2009-11-24 2011-12-09 오기태 스팸 처리 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927398A (zh) * 2014-05-07 2014-07-16 中国人民解放军信息工程大学 基于最大频繁项集挖掘的微博炒作群体发现方法
CN104080058A (zh) * 2014-06-16 2014-10-01 百度在线网络技术(北京)有限公司 信息处理方法及装置
CN104954360A (zh) * 2015-04-17 2015-09-30 腾讯科技(深圳)有限公司 分享内容屏蔽方法及装置

Also Published As

Publication number Publication date
CN106921565A (zh) 2017-07-04

Similar Documents

Publication Publication Date Title
US8108477B2 (en) Message classification using legitimate contact points
US9634989B2 (en) Systems and methods for detecting undesirable network traffic content
US9729573B2 (en) Phishing campaign ranker
US10650194B2 (en) Method and system to automatically change or update the configuration or setting of a communication system
US20120296965A1 (en) Detecting potentially abusive action in an online social network
WO2020248658A1 (zh) 一种异常账户的检测方法及装置
US9942182B2 (en) System and method for cloud based IP mobile messaging spam detection and defense
US10110623B2 (en) Delaying phishing communication
CN108880972B (zh) 一种信息处理方法、服务器及终端
CA2911989C (en) Method, system and apparatus for dectecting instant message spam
CN104883671A (zh) 一种垃圾短信的判断方法及系统
CN112199412B (zh) 基于区块链的支付账单处理方法和区块链账单处理系统
JP2021532427A (ja) 分散型自動電話詐欺リスク管理
CN109547427B (zh) 黑名单用户识别方法、装置、计算机设备及存储介质
US9749359B2 (en) Phishing campaign ranker
CN106921565B (zh) 一种垃圾信息识别的方法及装置
CN110650097A (zh) 一种数据传播方法、装置以及计算机可读存储介质
CN112559595A (zh) 安全事件挖掘方法、装置、存储介质及电子设备
CN105359117A (zh) 邮件服务器、邮件发送/接收方法和邮件发送/接收程序
CN109120743B (zh) 联系人添加方法及装置、电子设备及存储介质
CN108574623B (zh) 一种恶意用户确定及阻止垃圾信息的方法及装置
CN111181927A (zh) 一种登录方法及服务端
CN106789899B (zh) 一种基于html5的跨域消息发送方法及装置
CN105704686A (zh) 一种基于短信的即时通讯方法、装置及系统
CN104660485B (zh) 一种消息处理方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant