CN109714242A - 垃圾邮件的识别方法和装置 - Google Patents

垃圾邮件的识别方法和装置 Download PDF

Info

Publication number
CN109714242A
CN109714242A CN201711007982.7A CN201711007982A CN109714242A CN 109714242 A CN109714242 A CN 109714242A CN 201711007982 A CN201711007982 A CN 201711007982A CN 109714242 A CN109714242 A CN 109714242A
Authority
CN
China
Prior art keywords
address
sender
relationship
target
recipient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711007982.7A
Other languages
English (en)
Inventor
黄福昌
李玉杰
贾小华
金永刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING 263 ENTERPRISE COMMUNICATION Co Ltd
Original Assignee
BEIJING 263 ENTERPRISE COMMUNICATION Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING 263 ENTERPRISE COMMUNICATION Co Ltd filed Critical BEIJING 263 ENTERPRISE COMMUNICATION Co Ltd
Priority to CN201711007982.7A priority Critical patent/CN109714242A/zh
Publication of CN109714242A publication Critical patent/CN109714242A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种垃圾邮件的识别方法和装置。该方法包括:获取目标邮件的目标发送方的发送邮件服务器的IP地址;判断第一IP地址集合和第二IP地址集合中是否均不存在目标发送方的发送邮件服务器的IP地址;若目标发送方的发送邮件服务器的IP地址不存在,则识别目标邮件为垃圾邮件。本发明以邮件的接收和发送双方存在的往复关系为特征,通过收集正常邮件的发送方的发送邮件服务器的IP地址作为识别垃圾邮件的依据,能够提高垃圾邮件的识别速率。

Description

垃圾邮件的识别方法和装置
技术领域
本发明涉及垃圾邮件识别技术,尤其涉及一种垃圾邮件的识别方法和装置。
背景技术
随着互联网的广泛普及,邮件已经成为常用的沟通工具之一,但用户常会收到各种垃圾邮件,严重影响用户对正常邮件的查收和处理。因此,识别出垃圾邮件也越来越重要。
垃圾邮件识别方法有很多,例如,关键字识别、贝叶斯概率识别、特征识别和模式识别等方法。这些垃圾邮件识别方法通常需要解析邮件,并对其内容进行过滤处理。然而,垃圾邮件的发送方为了避免垃圾邮件被识别,经常会变换邮件的内容或者增加干扰信息。采用现有的垃圾邮件识别方法会消耗过多对邮件解析和对其内容过滤的内存和时间,使得垃圾邮件识别方法的识别率降低。因此,现在亟需一种提高识别垃圾邮件速率的垃圾邮件识别方法。
发明内容
本发明提供一种垃圾邮件的识别方法和装置,以解决现有的垃圾邮件的识别方法由于邮件的解析过程和邮件内容的过滤过程而消耗过多内存和时间,导致识别速率降低的问题。
本发明提供一种垃圾邮件的识别方法,包括:
获取目标邮件的目标发送方的发送邮件服务器的IP地址;
判断第一IP地址集合和第二IP地址集合中是否均不存在所述目标发送方的发送邮件服务器的IP地址,其中所述第一IP地址集合用于存储至少一个具有往复关系对应的发送方的发送邮件服务器的IP地址,所述第二IP地址集合中存储有至少一个预设的仅有发送功能的发送方的发送邮件服务器的IP地址;
若所述目标发送方的发送邮件服务器的IP地址不存在,则识别所述目标邮件为垃圾邮件。
可选地,在所述判断第一IP地址集合和第二IP地址集合中是否均不存在所述目标发送方的发送邮件服务器的IP地址之前,所述方法还包括:
根据已接收邮件的接收方的邮箱地址,获取所述已接收邮件的接收方的发送邮件服务器中的发送关系集合,其中所述发送关系集合中存储有至少一个仅具有发送关系的发送关系子集,每个发送关系子集包括发送方的邮件地址和对应的接收方的邮箱地址;
获取所述已接收邮件的接收方的接收邮件服务器的接收关系集合,其中所述接收关系集合中存储有至少一个仅具有接收关系的接收关系子集,每个接收关系子集包括发送方的邮箱地址、对应的接收方的邮箱地址和对应的发送方的发送服务器的IP地址;
当任一发送关系子集中的发送方的邮箱地址与任一接收关系子集中的接收方的邮箱地址存在相同的第一邮箱地址,且同一所述发送关系子集中的接收方的邮箱地址与同一所述接收关系集合中的发送方的邮箱地址存在相同的第二邮箱地址时,确定所述第一邮箱地址对应的接收方与所述第二邮箱地址对应的发送方具有往复关系,或者,确定所述第一邮箱地址对应的发送方与所述第二邮箱地址对应的接收方具有往复关系,并将所述第二邮箱地址对应的所述接收关系子集中的发送方的发送邮件服务器的IP地址存储到所述第一IP地址集合中。
可选地,在所述判断第一IP地址集合和第二IP地址集合中是否均不存在所述目标发送方的发送邮件服务器的IP地址之前,所述方法还包括:
根据所述目标邮件的目标接收方的邮箱地址,确定所述目标接收方的发送邮件服务器的目标发送关系集合,其中所述目标发送关系集合中存储有至少一个仅与所述目标接收方具有发送关系的目标发送关系子集,每个目标发送关系子集包括发送方的邮件地址和所述目标接收方的邮箱地址;
判断模块,用于判断所述目标发送方的邮箱地址是否存在于所述目标发送关系集合中;
若是,则识别所述目标邮件为正常邮件。
可选地,若所述目标发送方的邮箱地址存在于所述目标发送关系集合中,所述方法还包括:
将所述目标发送方的发送邮件服务器的IP地址存储于所述第一IP地址集合中。
可选地,所述方法还包括:
若所述第一IP地址集合或者所述第二IP地址集合中存在所述目标发送方的发送邮件服务器的IP地址,则识别所述目标邮件为正常邮件。
本发明还提供一种垃圾邮件的识别装置,包括:
获取模块,用于获取目标邮件的目标发送方的发送邮件服务器的IP地址;
判断模块,用于判断第一IP地址集合和第二IP地址集合中是否均不存在所述目标发送方的发送邮件服务器的IP地址,其中所述第一IP地址集合用于存储至少一个具有往复关系对应的发送方的发送邮件服务器的IP地址,所述第二IP地址集合中存储有至少一个预设的仅有发送功能的发送方的发送邮件服务器的IP地址;
识别模块,用于在所述判断模块判断出所述目标发送方的发送邮件服务器的IP地址不存在时,识别所述目标邮件为垃圾邮件。
可选地,所述获取模块,还用于根据已接收邮件的接收方的邮箱地址,获取所述已接收邮件的接收方的发送邮件服务器中的发送关系集合,其中所述发送关系集合中存储有至少一个仅具有发送关系的发送关系子集,每个发送关系子集包括发送方的邮件地址和对应的接收方的邮箱地址;
所述获取模块,还用于获取所述已接收邮件的接收方的接收邮件服务器的接收关系集合,其中所述接收关系集合中存储有至少一个仅具有接收关系的接收关系子集,每个接收关系子集包括发送方的邮箱地址、对应的接收方的邮箱地址和对应的发送方的发送服务器的IP地址;
第一确定模块,用于当任一发送关系子集中的发送方的邮箱地址与任一接收关系子集中的接收方的邮箱地址存在相同的第一邮箱地址,且同一所述发送关系子集中的接收方的邮箱地址与同一所述接收关系集合中的发送方的邮箱地址存在相同的第二邮箱地址时,确定所述第一邮箱地址对应的接收方与所述第二邮箱地址对应的发送方具有往复关系,或者,确定所述第一邮箱地址对应的发送方与所述第二邮箱地址对应的接收方具有往复关系;
第一存储模块,用于将所述第二邮箱地址对应的所述接收关系子集中的发送方的发送邮件服务器的IP地址存储到所述第一IP地址集合中。
可选地,所述装置还包括:
第二确定模块,用于根据所述目标邮件的目标接收方的邮箱地址,确定所述目标接收方的发送邮件服务器的目标发送关系集合,其中所述目标发送关系集合中存储有至少一个仅与所述目标接收方具有发送关系的目标发送关系子集,每个目标发送关系子集包括发送方的邮件地址和所述目标接收方的邮箱地址;
所述判断模块,还用于判断所述目标发送方的邮箱地址是否存在于所述目标发送关系集合中;
所述识别模块,还用于若所述目标发送方的邮箱地址存在于所述目标发送关系集合中,则识别所述目标邮件为正常邮件。
可选地,第二存储模块,用于将所述目标发送方的发送邮件服务器的IP地址存储于所述第一IP地址集合中。
可选地,所述识别模块,还用于当所述第一IP地址集合或者所述第二IP地址集合中存在所述目标发送方的发送邮件服务器的IP地址时,识别所述目标邮件为正常邮件。
本发明提供的垃圾邮件的识别方法和装置,该方法通过判断具有往复行为的第一IP地址集合和仅有发送功能的正常发送方的第二IP地址集合中是否均不存在目标发送方的发送邮件服务器的IP地址。若目标发送方的发送邮件服务器的IP地址不存在,则识别目标邮件为垃圾邮件。本发明以正常邮件的接收方和发送方之间存在往复行为为特征,通过具有往复关系的对应的发送方的发送邮件服务器的IP地址集合中来识别邮件是否为垃圾邮件,同时还通过只具有发送邮件功能的发送方的发送邮件服务器的IP地址集合来排除正常邮件的发送方,能够避免将正常邮件识别成垃圾邮件的现象,从而大大提高了垃圾邮件的识别速率和正确率,解决现有的垃圾邮件识别方法由于邮件的解析过程和邮件内容的过滤过程会消耗过多内存和时间而导致识别速率降低的问题。
附图说明
图1为本发明提供的垃圾邮件的识别方法的场景示意图;
图2为本发明提供的垃圾邮件的识别方法的流程图一;
图3为本发明提供的垃圾邮件的识别方法的流程图二;
图4为本发明提供的垃圾邮件的识别方法的流程图三;
图5为本发明提供的垃圾邮件的识别装置的结构示意图一;
图6为本发明提供的垃圾邮件的识别装置的结构示意图二;
图7为本发明提供的垃圾邮件的识别装置的结构示意图三;
图8为本发明提供的垃圾邮件的识别装置的结构示意图四。
具体实施方式
图1为本发明提供的垃圾邮件的识别方法的场景示意图,如图1所示,邮件可通过接收邮件服务器接收由外域服务器或本域服务器发送的邮件,邮件可为通过发送邮件服务器向外域服务器或本域服务器发送的邮件。通常发送方会在外域服务器或本域服务器(即发送邮件服务器)上会发送大量的垃圾邮件。而且,正常邮件的行为是基于有来有往的往复行为。例如263.com的用户可以给163.com的用户发邮件,同时163.com的用户也可以给263.com的用户发邮件。但垃圾邮件却与正常邮件不一样,垃圾邮件的邮件地址通常是随机生成的,且无法回复垃圾邮件,因此,本实施例中可利用正常邮件的发送方和接收方存在往复关系的特征对接收到的邮件进行识别,以识别出该邮件是垃圾邮件还是正常邮件。
进一步地,一封邮件存在着接收方和发送方。若从接收方的角度出发,接收方可以发送邮件,也可以接收邮件。下面从接收方的角度出发,分析接收方发送邮件和接收邮件的具体过程。
一方面,当接收方(客户端)向发送方发送邮件时,接收方的发送邮件服务器会先获取该邮件,根据该邮件验证用户名和密码,以确认用户存在。在验证成功后,接收方的发送邮件服务器便可将该邮件发送给发送方,这样接收方和发送方之间存在着发送关系,且接收方的发送邮件服务器便可保存接收方的邮箱地址和发送方的邮箱地址。其中,本实施例中发送邮件服务器可为简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)服务器。本实施例对发送邮件服务器的具体形式和存储形式不做限定。
另一方面,当接收方(客户端)接收发送方发送的邮件时,接收方的接收邮件服务器会直接获取该邮件,这样接收方和发送方之间就存在着接收关系,且接收方的接收邮件服务器便可保存接收方的邮箱地址、发送方的邮箱地址以及对应的发送方的发送邮件服务器的IP地址。其中,本实施例中邮件服务器可为邮件交换(Mail Exchanger,MX)服务器。本实施例对接收邮件服务器的具体形式和存储形式不做限定。
本技术领域人员可以理解的是,本实施例中发送方向接收方发送邮件和接收邮件的过程跟上述接收方向发送方发送邮件和接收邮件的过程相同或相似,此处不再赘述。
图2为本发明提供的垃圾邮件的识别方法的流程图一,本实施例的执行主体可以为图1所示接收方的接收邮件服务器,如图2所示,本实施例垃圾邮件的识别方法包括:
S101、获取目标邮件的目标发送方的发送邮件服务器的IP地址。
具体地,在目标接收方接收到目标邮件时,本实施例中目标接收方的接收邮件服务器能够直接提取目标邮件中目标发送方的邮箱地址,从而确定目标发送方。接着,本实施例中目标接收方的接收邮件服务器可利用指令或函数从传输控制协议(TransmissionControl Protocol,TCP)中查询得到目标发送方的发送邮件服务器的IP地址。本实施例对目标接收方的获取方式不做限定。
S102、判断第一IP地址集合和第二IP地址集合中是否均不存在目标发送方的发送邮件服务器的IP地址,其中第一IP地址集合用于存储至少一个具有往复关系对应的发送方的发送邮件服务器的IP地址,第二IP地址集合中存储有至少一个预设的仅有发送功能的正常邮件服务商的发送邮件服务器的IP地址。
具体地,由于正常邮件的接收方和发送方是可以进行往复行为的,因此,本实施例中可将接收方和发送方具有往复关系对应的发送方的发送邮件服务器的IP地址存储在第一IP地址集合中。本实施例中对第一IP地址集合的具体存储形式不做限定。这样,目标接收方便可通过查看第一IP地址集合中是否存在目标邮件的目标发送方的发送邮件服务器的IP地址,来判断在目标接收方接收到目标邮件之前,目标接收方与目标发送方是否存在过邮件往复行为。
进一步地,对于一些发送方(比如,正常邮件服务商)只具有发送邮件的功能而不具有接收邮件的功能,虽然该发送方只能向目标接收方发送邮件,而无法接收目标接收方发送的邮件,但发送方发送的邮件为正常邮件。因此,目标接收方与该发送方之间仅存在接收关系,不存在发送关系,这样两者之间不存在往复行为,进而,该发送方的发送邮件服务器的IP地址不会包含在第一IP地址集合中。又由于该发送方发送的邮件为正常邮件,因此,本实施例中可人为的将这种类型的发送方的发送邮件服务器的IP地址存储在第二IP地址集合中。这样,第二IP地址集合中存储有至少一个预设的仅有发送功能的正常邮件服务商的发送邮件服务器的IP地址。本实施例中对第二IP地址集合的具体存储形式不做限定。这样,目标接收方可查看第二IP地址集合中是否存在目标邮件的目标发送方的发送邮件服务器的IP地址,便可判断出目标发送方是否为只具有发送功能的发送方,从而判断目标发送方发送的目标邮件是否不为垃圾邮件。
进一步地,本实施例中可通过判断第一IP地址集合和第二IP地址集合中是否均不存在目标发送方的发送邮件服务器的IP地址,即在与目标接收方存在往复关系对应的发送方的发送邮件服务器的IP地址集合以及一些白名单的正常发送方对应的发送邮件服务器的IP地址集合中查找目标发送方的发送邮件服务器的IP地址,从而判断目标邮件是垃圾邮件还是正常邮件。
S103、若目标发送方的发送邮件服务器的IP地址不存在,则识别目标邮件为垃圾邮件。
具体地,当目标发送方的发送邮件服务器的IP地址均不存在于第一IP地址集合和第二IP地址集合中时,本实施例中目标接收方便可识别出目标邮件为垃圾邮件。本实施例对第一IP地址集合和第二IP地址集合中目标发送方的发送邮件服务器的IP地址是否存在的先后判断顺序不做限定。
一种可行的实现方式,本实施例中会先判断第一IP地址集合是否不存在目标发送方的发送邮件服务器的IP地址,接着在第一IP地址集合不存在目标发送方的发送邮件服务器的IP地址时,再判断第二IP地址集合中是否不存在目标发送方的发送邮件服务器的IP地址,若第二IP地址集合中仍不存在目标发送方的发送邮件服务器的IP地址,则识别目标邮件为垃圾邮件。
另一种可行的实现方式,本实施例中会先判断第二IP地址集合不存在目标发送方的发送邮件服务器的IP地址,接着在第二IP地址集合不存在目标发送方的发送邮件服务器的IP地址时,再判断第一IP地址集合中是否不存在目标发送方的发送邮件服务器的IP地址,若第一IP地址集合中仍不存在目标发送方的发送邮件服务器的IP地址,则识别目标邮件为垃圾邮件。
这样,本实施例中能够以正常邮件的往复行为为特征,还充分且全面的考虑到只具有发送功能的正常邮件,从而降低了对垃圾邮件识别的误判率,使得对目标邮件为垃圾邮件识别具有双重保证,进而明显提高了垃圾邮件的识别准确率。
本实施例提供的垃圾邮件的识别方法,通过判断具有往复行为的第一IP地址集合和仅有发送功能的正常发送方的第二IP地址集合中是否均不存在目标发送方的发送邮件服务器的IP地址。若目标发送方的发送邮件服务器的IP地址不存在,则识别目标邮件为垃圾邮件。本实施例中以正常邮件的接收方和发送方之间存在往复行为为特征,通过具有往复关系的对应的发送方的发送邮件服务器的IP地址集合中来识别邮件是否为垃圾邮件,同时还通过只具有发送邮件功能的发送方的发送邮件服务器的IP地址集合来排除正常邮件的发送方,能够避免将正常邮件识别成垃圾邮件的现象,从而大大提高了垃圾邮件的识别速率和正确率,解决现有的垃圾邮件识别方法由于邮件的解析过程和邮件内容的过滤过程会消耗过多内存和时间而导致识别速率降低的问题。
继续结合图2,在S102中判断第一IP地址集合和第二IP地址集合中是否均不存在目标发送方的发生邮件服务器的IP地址时,由于第一IP地址集合中存储有往复关系的IP地址,且第二IP地址集合中存储有仅具有发生邮件功能的正常发送方的发送邮件服务器的IP地址,因此,可选地,若第一IP地址集合或者第二IP地址集合中存在目标发送方的发送邮件服务器的IP地址,则识别目标邮件为正常邮件。具体地,本实施例中第一IP地址集合和第二IP地址集合中只要有一个存在目标发送方的发生邮件服务器的IP地址,便能够判断目标邮件为正常邮件。
在上述图2实施例的基础上,由于第一IP地址集合是以正常邮件的接收方和发送方之间具有往复关系为特征的集合,因此,只有确定接收方和发送方具有往复关系,才能够将对应的发送方对应的发生邮件服务器的IP地址存储起来,进而才能得到第一IP地址集合。下面结合图3,对本实施例中第一IP地址集合的具体获取方式进行详细的说明。图3为本发明提供的垃圾邮件的识别方法的流程图二,如图3所示,该方法还包括:
S201、根据已接收邮件的接收方的邮箱地址,获取已接收邮件的接收方的发送邮件服务器中的发送关系集合,其中发送关系集合中存储有至少一个仅具有发送关系的发送关系子集,每个发送关系子集包括发送方的邮件地址和对应的接收方的邮箱地址。
具体地,无论对于接收方还是接收方而言,由于发送邮件服务器只对邮件的发送行为进行记录和信息存储,因此,发送关系集合中保存仅有发送关系的发送关系子集。本实施例中便可通过已接收邮件的邮箱地址来确定已接收邮件的接收方的发送邮件服务器,而且该发送邮件服务器还能够确定已接收邮件的发送方的邮箱地址和接收方的邮箱地址。
进一步地,本实施例可将已接收邮件的发送方的邮箱地址和接收方的邮箱地址存储于发送关系集合。本实施例中对于已接收邮件中的任一封,在接收方的发送邮件服务器的发送关系集合中只需将任一邮件的发送方的邮箱地址和接收方的邮箱地址存储在一起形成发送关系子集。本实施例中对发送关系子集的具体存储形式不做限定。
进一步地,由于该发送关系集合中存储有至少一个仅具有发送关系的发送关系子集,每个发送关系子集包括发送方的邮箱地址和接收方的邮箱地址,因此,设置的发送关系集合便可能够表明已接收邮件的接收方有向已接收邮件的发送方发送邮件的行为,即已接收邮件的接收方与已接收邮件的发送方存在着发送关系。
S202、获取已接收邮件的接收方的接收邮件服务器的接收关系集合,其中接收关系集合中存储有至少一个仅具有接收关系的接收关系子集,每个接收关系子集包括发送方的邮箱地址、对应的接收方的邮箱地址和对应的发送方的发送服务器的IP地址。
具体地,无论对于接收方还是接收方而言,由于接收邮件服务器只对邮件的接收行为进行记录和信息存储,因此,接收关系集合中保存仅有接收关系的接收关系子集。本实施例中已接收邮件的接收方的接收邮件服务器能够获取已接收邮件获取自身的邮箱地址、发送方的邮箱地址以及发送方的发送邮件服务器的IP地址进行保存。例如,在互联网通信中,一封邮件通常会存在发送方的邮箱地址和接收方的邮箱地址,在接收方收到邮件后,接收方的接收邮件服务器会通过自身的邮箱地址确定用户是否存在。当验证用户存在时,接收方就能够直接从邮件中提取双方的邮箱地址以及发送方的发送邮件服务器的IP地址。
进一步地,本实施例中已接收邮件的接收方的接收邮件服务器可将发送方的邮箱地址、接收方的邮箱地址和对应的发送方的发送服务器的IP地址存储于接收关系集合中。
进一步地,对于同一封邮件,其发送方对应的发送邮件服务器的IP地址可有一个,也可有多个,本实施例对此不做限定。因此,本实施例中在接收方的接收邮件服务器的接收关系集合中对于任一已接收邮件,若发送方的发送服务器的IP地址存在多个时,可将任一邮件对应的发送方的邮箱地址、接收方的邮箱地址以及发送方的发送服务器的IP地址存储为一条进行存储形成接收关系子集,也可将在相同的发送方的邮箱地址和相同的接收方的邮箱地址之后罗列发送方的发送服务器的IP地址来实现存储,进而形成接收关系子集。本实施例对接收关系子集的具体存储形式不做限定。
进一步地,由于该接收关系集合中存储有至少一个仅具有接收关系的接收关系子集,每个接收关系子集包括发送方的邮箱地址、接收方的邮箱地址和发送方的发送服务器的IP地址,因此,设置的接收关系集合便可能够表明已接收邮件的接收方有接收已接收邮件的发送方发送邮件的行为,即已接收邮件的接收方与已接收邮件的发送方存在着接收关系。
S203、当任一发送关系子集中的发送方的邮箱地址与任一接收关系子集中的接收方的邮箱地址存在相同的第一邮箱地址,且同一发送关系子集中的接收方的邮箱地址与同一接收关系集合中的发送方的邮箱地址存在相同的第二邮箱地址时,确定第一邮箱地址对应的接收方与第二邮箱地址对应的发送方具有往复关系,或者,确定第一邮箱地址对应的发送方与第二邮箱地址对应的接收方具有往复关系,并将第二邮箱地址对应的接收关系子集中的发送方的发送邮件服务器的IP地址存储到第一IP地址集合中。
具体地,由于发送邮件和接收邮件是两个相反的过程,任一发送关系子集中存储有发送方的邮箱地址和接收方的邮箱地址,任一接收关系子集中存储有发送方的邮箱地址、接收方的邮箱地址以及发送方的发送邮件服务器的IP地址,且发送关系子集的发送方对应于接收关系子集的接收方,发送关系子集的接收方对应于接收关系子集的发送方。因此,在确定任一发送关系子集的接收方为任一接收关系子集的发送方,同时同一发送关系子集的发送方为同一接收关系子集的接收方时,表明接收方与发送方之间不仅存在发送关系,还存在接收关系,即第一邮箱地址对应的接收方与第二邮箱地址对应的发送方具有往复关系,或者,第一邮箱地址对应的发送方与第二邮箱地址对应的接收方具有往复关系。
进一步地,在确定接收方与发送方之间存在往复关系时,本实施例便可将第二邮箱地址对应的接收关系子集中的发送方的发送邮件服务器的IP地址存储到第一IP地址集合中,实现对正常邮件的发送方的发送邮件服务器的IP地址的存储,便于通过接收到的其他邮件的发送方的发送邮件服务器的IP地址是否存在于第一IP地址集合中来识别邮件是否为垃圾邮件。
在上述图2的S102实施例的基础上,由于目标接收方的接收邮件服务器接收到目标邮件,因此,目标接收方与目标发送方之间便存在着接收关系,若目标发送方的邮箱地址还存在于发送关系集合中,则说明目标接收方与目标发送方之间还存在发送关系,这样目标接收方与目标发送方存在着往复关系,便可将目标发送方的发送邮件服务器的IP地址存储到第一IP地址集合中,以便于对其他邮件的识别。因此,为了提高识别垃圾邮件的速率,还可查询目标接收方与目标发送方之间是否存在发送关系,下面结合图4,对本实施例垃圾邮件的识别方法的具体实现方式进行详细说明。图4为本发明提供的垃圾邮件的识别方法的流程图三,如图4所示,该方法还包括:
S301、获取目标邮件的目标发送方的发送邮件服务器的IP地址。
其中,S201与图2实施例中的S101实现方式类似,本实施例此处不再赘述。
S302、根据目标邮件的目标接收方的邮箱地址,确定目标接收方的发送邮件服务器的目标发送关系集合,其中目标发送关系集合中存储有至少一个仅与目标接收方具有发送关系的目标发送关系子集,每个目标发送关系子集包括发送方的邮件地址和目标接收方的邮箱地址。
具体地,当目标接收方接收到目标发送方发送的目标邮件时,说明目标接收方与目标发送方存在着接收关系。因此,本实施例中目标接收方便可通过确定目标接收方的邮件地址是否存储在目标接收方的发送邮件服务器存储的发送关系集合中,来判断目标接收方与目标发送方是否存在往复关系。
S303、判断目标发送方的邮箱地址是否存在于目标发送关系集合中。若是,则执行S304;若否,则执行S306。
S304、识别目标邮件为正常邮件。
S305、将目标发送方的发送邮件服务器的IP地址存储于第一IP地址集合中。
具体地,在确定目标发送方的邮箱地址存储于发送关系集合中时,说明目标接收方与目标发送方之间有过发送邮件和接收邮件的行为,说明目标接收方与目标发送方已经存在有往复关系,因此,本实施例可将识别目标邮件为正常邮件,能够节省垃圾邮件识别的时间,并提高垃圾邮件识别的效率。而且,本实施例还可将目标发送方的发送邮件服务器的IP地址存储于第一IP地址集合中,补充第一IP地址集合的存储信息,使得第一IP地址集合存储更多的正常发送方的发送邮件服务器的IP地址,避免对垃圾邮件的失败引起误判的情况。
此处需要说明的是,本实施例中可先执行S304,再执行S305;亦可先执行S305,再执行S304;也可同时执行S304和S305。本实施例对执行S302与S303的先后顺序不做限定。
S306、判断第一IP地址集合和第二IP地址集合中是否均不存在目标发送方的发送邮件服务器的IP地址,其中第一IP地址集合用于存储至少一个具有往复关系对应的发送方的发送邮件服务器的IP地址,第二IP地址集合中存储有至少一个预设的仅有发送功能的正常邮件服务商的发送邮件服务器的IP地址。
S307、若目标发送方的发送邮件服务器的IP地址不存在,则识别目标邮件为垃圾邮件。
其中,S306、S307分别与图2实施例中的S102、S103实现方式类似,本实施例此处不再赘述。
具体地,本实施例中在确定目标接收方与目标发送方之间仅有接收关系而没有发送关系时,仍不能判断目标邮件为垃圾邮件,需要再判断目标邮件的目标发送方的发送邮件服务器的IP地址是否包含于第二IP地址集合中。并且,本实施例中对目标发送方的发送邮件服务器的IP地址是否均不存在于第一IP地址集合和第二IP地址集合的判断顺序不做限定,因此,本实施例还需执行S306来实现对目标邮件是否为垃圾邮件的识别过程,从而全面且准确的确定垃圾邮件,以提高垃圾邮件的识别率。
图5为本发明提供的垃圾邮件的识别装置的结构示意图一,图6为本发明提供的垃圾邮件的识别装置的结构示意图二,图7为本发明提供的垃圾邮件的识别装置的结构示意图三。如图5所示,本实施例的垃圾邮件的识别装置可以包括:
获取模块10,用于获取目标邮件的目标发送方的发送邮件服务器的IP地址;
判断模块20,用于判断第一IP地址集合和第二IP地址集合中是否均不存在所述目标发送方的发送邮件服务器的IP地址,其中所述第一IP地址集合用于存储至少一个具有往复关系对应的发送方的发送邮件服务器的IP地址,所述第二IP地址集合中存储有至少一个预设的仅有发送功能的发送方的发送邮件服务器的IP地址;
识别模块30,用于在所述判断模块20判断出所述目标发送方的发送邮件服务器的IP地址不存在,识别所述目标邮件为垃圾邮件。
如图6所示,可选地,所述获取模块10,还用于根据已接收邮件的接收方的邮箱地址,获取所述已接收邮件的接收方的发送邮件服务器中的发送关系集合,其中所述发送关系集合中存储有至少一个仅具有发送关系的发送关系子集,每个发送关系子集包括发送方的邮件地址和对应的接收方的邮箱地址;
所述获取模块10,还用于获取所述已接收邮件的接收方的接收邮件服务器的接收关系集合,其中所述接收关系集合中存储有至少一个仅具有接收关系的接收关系子集,每个接收关系子集包括发送方的邮箱地址、对应的接收方的邮箱地址和对应的发送方的发送服务器的IP地址;
第一确定模块41,用于当任一发送关系子集中的发送方的邮箱地址与任一接收关系子集中的接收方的邮箱地址存在相同的第一邮箱地址,且同一所述发送关系子集中的接收方的邮箱地址与同一所述接收关系集合中的发送方的邮箱地址存在相同的第二邮箱地址时,确定所述第一邮箱地址对应的接收方与所述第二邮箱地址对应的发送方具有往复关系,或者,确定所述第一邮箱地址对应的发送方与所述第二邮箱地址对应的接收方具有往复关系;
第一存储模块51,用于将所述第二邮箱地址对应的所述接收关系子集中的发送方的发送邮件服务器的IP地址存储到所述第一IP地址集合中。
如图7所示,可选地,所述装置还包括:
第二确定模块42,用于根据所述目标邮件的目标接收方的邮箱地址,确定所述目标接收方的发送邮件服务器的目标发送关系集合,其中所述目标发送关系集合中存储有至少一个仅与所述目标接收方具有发送关系的目标发送关系子集,每个目标发送关系子集包括发送方的邮件地址和所述目标接收方的邮箱地址;
所述判断模块20,还用于判断所述目标发送方的邮箱地址存在于所述目标发送关系集合中;
所述识别模块30,还用于若所述目标发送方的邮箱地址存在于所述目标发送关系集合中,则识别所述目标邮件为正常邮件。
可选地,第二存储模块52,用于将所述目标发送方的发送邮件服务器的IP地址存储于所述第一IP地址集合中。
可选地,所述识别模块30,还用于当所述第一IP地址集合或者所述第二IP地址集合中存在所述目标发送方的发送邮件服务器的IP地址时,识别所述目标邮件为正常邮件。
本发明实施例提供的垃圾邮件的识别装置,可执行上述方法实施例,其具体实现原理和技术效果,可参见上述方法实施例,本实施例此处不再赘述。
本发明中可以根据上述方法示例对垃圾邮件的识别装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本发明各实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明上述各方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图8为本发明提供的垃圾邮件的识别装置的结构示意图四。如图8所示,本实施例的垃圾邮件的识别装置可以包括:
处理器61;以及
存储器62,用于存储所述处理器61的可执行指令;
其中,所述处理器61配置为经由执行所述可执行指令来执行上述所述的垃圾邮件的识别方法。
本实施例的垃圾邮件的识别装置,可以用于执行本发明上述各方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种垃圾邮件的识别方法,其特征在于,包括:
获取目标邮件的目标发送方的发送邮件服务器的IP地址;
判断第一IP地址集合和第二IP地址集合中是否均不存在所述目标发送方的发送邮件服务器的IP地址,其中所述第一IP地址集合用于存储至少一个具有往复关系对应的发送方的发送邮件服务器的IP地址,所述第二IP地址集合中存储有至少一个预设的仅有发送功能的发送方的发送邮件服务器的IP地址;
若所述目标发送方的发送邮件服务器的IP地址不存在,则识别所述目标邮件为垃圾邮件。
2.根据权利要求1所述的方法,其特征在于,在所述判断第一IP地址集合和第二IP地址集合中是否均不存在所述目标发送方的发送邮件服务器的IP地址之前,所述方法还包括:
根据已接收邮件的接收方的邮箱地址,获取所述已接收邮件的接收方的发送邮件服务器中的发送关系集合,其中所述发送关系集合中存储有至少一个仅具有发送关系的发送关系子集,每个发送关系子集包括发送方的邮件地址和对应的接收方的邮箱地址;
获取所述已接收邮件的接收方的接收邮件服务器的接收关系集合,其中所述接收关系集合中存储有至少一个仅具有接收关系的接收关系子集,每个接收关系子集包括发送方的邮箱地址、对应的接收方的邮箱地址和对应的发送方的发送服务器的IP地址;
当任一发送关系子集中的发送方的邮箱地址与任一接收关系子集中的接收方的邮箱地址存在相同的第一邮箱地址,且同一所述发送关系子集中的接收方的邮箱地址与同一所述接收关系集合中的发送方的邮箱地址存在相同的第二邮箱地址时,确定所述第一邮箱地址对应的接收方与所述第二邮箱地址对应的发送方具有往复关系,或者,确定所述第一邮箱地址对应的发送方与所述第二邮箱地址对应的接收方具有往复关系,并将所述第二邮箱地址对应的所述接收关系子集中的发送方的发送邮件服务器的IP地址存储到所述第一IP地址集合中。
3.根据权利要求1所述的方法,其特征在于,在所述判断第一IP地址集合和第二IP地址集合中是否均不存在所述目标发送方的发送邮件服务器的IP地址之前,所述方法还包括:
根据所述目标邮件的目标接收方的邮箱地址,确定所述目标接收方的发送邮件服务器的目标发送关系集合,其中所述目标发送关系集合中存储有至少一个仅与所述目标接收方具有发送关系的目标发送关系子集,每个目标发送关系子集包括发送方的邮件地址和所述目标接收方的邮箱地址;
判断所述目标发送方的邮箱地址是否存在于所述目标发送关系集合中;
若是,则识别所述目标邮件为正常邮件。
4.根据权利要求3所述的方法,其特征在于,若所述目标发送方的邮箱地址存在于所述目标发送关系集合中,所述方法还包括:
将所述目标发送方的发送邮件服务器的IP地址存储于所述第一IP地址集合中。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第一IP地址集合或者所述第二IP地址集合中存在所述目标发送方的发送邮件服务器的IP地址,则识别所述目标邮件为正常邮件。
6.一种垃圾邮件的识别装置,其特征在于,包括:
获取模块,用于获取目标邮件的目标发送方的发送邮件服务器的IP地址;
判断模块,用于判断第一IP地址集合和第二IP地址集合中是否均不存在所述目标发送方的发送邮件服务器的IP地址,其中所述第一IP地址集合用于存储至少一个具有往复关系对应的发送方的发送邮件服务器的IP地址,所述第二IP地址集合中存储有至少一个预设的仅有发送功能的发送方的发送邮件服务器的IP地址;
识别模块,用于在所述判断模块判断出所述目标发送方的发送邮件服务器的IP地址不存在时,识别所述目标邮件为垃圾邮件。
7.根据权利要求6所述的装置,其特征在于,所述获取模块,还用于根据已接收邮件的接收方的邮箱地址,获取所述已接收邮件的接收方的发送邮件服务器中的发送关系集合,其中所述发送关系集合中存储有至少一个仅具有发送关系的发送关系子集,每个发送关系子集包括发送方的邮件地址和对应的接收方的邮箱地址;
所述获取模块,还用于获取所述已接收邮件的接收方的接收邮件服务器的接收关系集合,其中所述接收关系集合中存储有至少一个仅具有接收关系的接收关系子集,每个接收关系子集包括发送方的邮箱地址、对应的接收方的邮箱地址和对应的发送方的发送服务器的IP地址;
第一确定模块,用于当任一发送关系子集中的发送方的邮箱地址与任一接收关系子集中的接收方的邮箱地址存在相同的第一邮箱地址,且同一所述发送关系子集中的接收方的邮箱地址与同一所述接收关系集合中的发送方的邮箱地址存在相同的第二邮箱地址时,确定所述第一邮箱地址对应的接收方与所述第二邮箱地址对应的发送方具有往复关系,或者,确定所述第一邮箱地址对应的发送方与所述第二邮箱地址对应的接收方具有往复关系;
第一存储模块,用于将所述第二邮箱地址对应的所述接收关系子集中的发送方的发送邮件服务器的IP地址存储到所述第一IP地址集合中。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二确定模块,用于根据所述目标邮件的目标接收方的邮箱地址,确定所述目标接收方的发送邮件服务器的目标发送关系集合,其中所述目标发送关系集合中存储有至少一个仅与所述目标接收方具有发送关系的目标发送关系子集,每个目标发送关系子集包括发送方的邮件地址和所述目标接收方的邮箱地址;
所述判断模块,还用于判断所述目标发送方的邮箱地址是否存在于所述目标发送关系集合中;
所述识别模块,还用于若所述目标发送方的邮箱地址存在于所述目标发送关系集合中,则识别所述目标邮件为正常邮件。
9.根据权利要求8所述的装置,其特征在于,第二存储模块,用于将所述目标发送方的发送邮件服务器的IP地址存储于所述第一IP地址集合中。
10.根据权利要求6所述的装置,其特征在于,所述识别模块,还用于当所述第一IP地址集合或者所述第二IP地址集合中存在所述目标发送方的发送邮件服务器的IP地址时,识别所述目标邮件为正常邮件。
CN201711007982.7A 2017-10-25 2017-10-25 垃圾邮件的识别方法和装置 Pending CN109714242A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711007982.7A CN109714242A (zh) 2017-10-25 2017-10-25 垃圾邮件的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711007982.7A CN109714242A (zh) 2017-10-25 2017-10-25 垃圾邮件的识别方法和装置

Publications (1)

Publication Number Publication Date
CN109714242A true CN109714242A (zh) 2019-05-03

Family

ID=66252028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711007982.7A Pending CN109714242A (zh) 2017-10-25 2017-10-25 垃圾邮件的识别方法和装置

Country Status (1)

Country Link
CN (1) CN109714242A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1547143A (zh) * 2003-12-03 2004-11-17 勇 陈 防垃圾邮件的方法
US20040267886A1 (en) * 2003-06-30 2004-12-30 Malik Dale W. Filtering email messages corresponding to undesirable domains
CN101150535A (zh) * 2007-06-15 2008-03-26 腾讯科技(深圳)有限公司 一种电子邮件的过滤方法、装置及设备
CN101299729A (zh) * 2008-06-25 2008-11-05 哈尔滨工程大学 一种基于拓扑行为的垃圾邮件判定方法
CN101868794A (zh) * 2007-04-24 2010-10-20 英特卡斯汀集团 移动社交网络系统和方法
CN103179024A (zh) * 2013-03-18 2013-06-26 北京二六三企业通信有限公司 邮件过滤方法及装置
CN103873348A (zh) * 2014-02-14 2014-06-18 新浪网技术(中国)有限公司 电子邮件过滤方法和系统
CN105580333A (zh) * 2013-08-14 2016-05-11 丹尼尔·钱 评估可疑网络通信

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267886A1 (en) * 2003-06-30 2004-12-30 Malik Dale W. Filtering email messages corresponding to undesirable domains
CN1547143A (zh) * 2003-12-03 2004-11-17 勇 陈 防垃圾邮件的方法
CN101868794A (zh) * 2007-04-24 2010-10-20 英特卡斯汀集团 移动社交网络系统和方法
CN101150535A (zh) * 2007-06-15 2008-03-26 腾讯科技(深圳)有限公司 一种电子邮件的过滤方法、装置及设备
CN101299729A (zh) * 2008-06-25 2008-11-05 哈尔滨工程大学 一种基于拓扑行为的垃圾邮件判定方法
CN103179024A (zh) * 2013-03-18 2013-06-26 北京二六三企业通信有限公司 邮件过滤方法及装置
CN105580333A (zh) * 2013-08-14 2016-05-11 丹尼尔·钱 评估可疑网络通信
CN103873348A (zh) * 2014-02-14 2014-06-18 新浪网技术(中国)有限公司 电子邮件过滤方法和系统

Similar Documents

Publication Publication Date Title
EP2446411B1 (en) Real-time spam look-up system
CN103220213B (zh) 一种邮件过滤方法和装置
US20120131107A1 (en) Email Filtering Using Relationship and Reputation Data
US20090049141A1 (en) Tracking delivered e-mail
US7802304B2 (en) Method and system of providing an integrated reputation service
CN102710548A (zh) 跟踪电子邮件各收件人对邮件进行的操作的方法与系统
US8205264B1 (en) Method and system for automated evaluation of spam filters
JP2011034417A (ja) 迷惑メール判定装置及び迷惑メール判定方法及び迷惑メール判定プログラム
US20100017485A1 (en) Enforcing conformance in email content
WO2010038143A1 (en) Electronic communication control
WO2018149340A1 (zh) 回复电子邮件过程中确定收件人的方法和装置
CN108683589A (zh) 垃圾邮件的检测方法、装置及电子设备
JP4670049B2 (ja) 電子メールフィルタリングプログラム、電子メールフィルタリング方法、電子メールフィルタリングシステム
CN103179024A (zh) 邮件过滤方法及装置
US20120143960A1 (en) Related message detection and indication
KR20070056951A (ko) 전자 메일 메시지의 블라인드 카본 카피 수신인간의 상호인식
CN107453973B (zh) 一种甄别电子邮件发送者身份特征的方法和装置
CN109714242A (zh) 垃圾邮件的识别方法和装置
US20220182347A1 (en) Methods for managing spam communication and devices thereof
US9391942B2 (en) Symbolic variables within email addresses
US8516059B1 (en) System, method, and computer program product for communicating automatic response messages based on a policy
CN109218162A (zh) 邮件投递方法及装置
CN107835124B (zh) 邮件发送方法、装置及系统
CN110034996A (zh) 垃圾邮件识别方法、装置和系统
CN102843376A (zh) 一种防止垃圾邮件的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190503

RJ01 Rejection of invention patent application after publication