CN103442013A - 一种垃圾邮件计算机辅助处理方法及系统 - Google Patents

一种垃圾邮件计算机辅助处理方法及系统 Download PDF

Info

Publication number
CN103442013A
CN103442013A CN2013103936907A CN201310393690A CN103442013A CN 103442013 A CN103442013 A CN 103442013A CN 2013103936907 A CN2013103936907 A CN 2013103936907A CN 201310393690 A CN201310393690 A CN 201310393690A CN 103442013 A CN103442013 A CN 103442013A
Authority
CN
China
Prior art keywords
mail
characteristic information
spam
rubbish
fingerprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013103936907A
Other languages
English (en)
Inventor
陈颖棠
叶远鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MAIMAILTECH (BEIJING) CO Ltd
Original Assignee
MAIMAILTECH (BEIJING) CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MAIMAILTECH (BEIJING) CO Ltd filed Critical MAIMAILTECH (BEIJING) CO Ltd
Priority to CN2013103936907A priority Critical patent/CN103442013A/zh
Priority to PCT/CN2013/086168 priority patent/WO2015032121A1/zh
Publication of CN103442013A publication Critical patent/CN103442013A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种垃圾邮件计算机辅助处理方法,包括:辅助处理装置提取可疑邮件的人工审核结果;所述辅助处理装置根据人工审核结果提取特征信息;所述辅助处理装置将所述特征信息同步至反垃圾服务器数据库;反垃圾引擎根据所述反垃圾服务器数据库中的特征信息判断垃圾邮件。本发明还公开了一种垃圾邮件计算机辅助处理系统。采用本发明,根据人工审核结果提取特征信息,并将特征信息实时下发至反垃圾服务器数据库,实时生效,使反垃圾引擎根据最新的特征信息判断垃圾邮件,加强过滤效果。

Description

一种垃圾邮件计算机辅助处理方法及系统
技术领域
本发明涉及互联网技术领域,尤其涉及一种垃圾邮件计算机辅助处理方法及垃圾邮件计算机辅助处理系统。
背景技术
当前邮件系统广泛使用的垃圾邮件反馈方式是垃圾邮件举报功能以及将邮件反馈客服。
将在邮箱中垃圾邮件或误判邮件反馈给邮件系统,若该邮件系统采用的是智能反垃圾引擎的话,就会将这部分反馈邮件加到样本中,用于生成新的反垃圾引擎特征库。
但是,智能反垃圾引擎无法知道它对邮件的判定是否正确,只是知道这封邮件具有垃圾邮件的特征,较可能是垃圾邮件,应该将它归为垃圾邮件,等到有用户举报或投诉时才知道有邮件发生漏判或误判了。另外,对用户反馈的优先需要先经过人工分类,供下次反垃圾引擎学习生成新的垃圾特征库,之后才能过滤带有这部分特征的邮件,需要学习比较大量的样本才能得到新的特征库,其消耗的时间资源都是比较大的,生成的特征库也是比较大的,因此特征库的生成更新的时间间隔比较长。同时,依靠智能反垃圾引擎,人工纠正的结果无法影响当前引擎,只有在下次学习生成新的引擎数据后才能生效,这是个比较长的周期。
因此,如何解决反垃圾引擎误判以及漏判纠正问题,更好地过滤垃圾邮件以及降低误判的影响,已成为亟待解决的问题。
发明内容
本发明所要解决的技术问题在于,提供一种垃圾邮件计算机辅助处理方法及系统,可将特征信息实时下发至反垃圾服务器数据库,实时生效,使反垃圾引擎根据最新的特征信息判断垃圾邮件,既可以较早发现漏判的垃圾邮件,又可以及时的纠正误判邮件,更快的纠正智能反垃圾引擎的错误,加强过滤效果。
为了解决上述技术问题,本发明提供了一种垃圾邮件计算机辅助处理方法,包括:辅助处理装置提取可疑邮件的人工审核结果,所述人工审核结果包括误判邮件、漏判邮件、黑白名单规则;所述辅助处理装置根据人工审核结果提取特征信息,所述特征信息包括邮件指纹、邮件指纹所对应的判断类型、黑白名单规则;所述辅助处理装置将所述特征信息同步至反垃圾服务器数据库;反垃圾引擎根据所述反垃圾服务器数据库中的特征信息判断垃圾邮件。
作为上述方案的改进,所述辅助处理装置根据人工审核结果提取特征信息的方法包括:计算所述误判邮件的邮件指纹,并修改所述误判邮件的邮件指纹所对应的判断类型;计算所述漏判邮件的邮件指纹,并设置所述漏判邮件的邮件指纹所对应的判断类型;提取黑白名单规则。
相应地,本发明还提供了一种垃圾邮件计算机辅助处理系统,包括:辅助处理装置,用于提取可疑邮件的人工审核结果,根据人工审核结果提取特征信息,并将所述特征信息同步至反垃圾服务器数据库;反垃圾服务器数据库,用于存储特征信息;反垃圾引擎,用于根据所述反垃圾服务器数据库中的特征信息判断垃圾邮件;所述人工审核结果包括误判邮件、漏判邮件、黑白名单规则;所述特征信息包括邮件指纹、邮件指纹所对应的判断类型、黑白名单规则。
作为上述方案的改进,所述辅助处理装置包括:提取单元,用于提取可疑邮件的人工审核结果;特征单元,用于根据人工审核结果提取特征信息;同步单元,用于将所述特征信息同步至反垃圾服务器数据库。
作为上述方案的改进,所述特征单元包括:第一特征子单元,用于计算所述误判邮件的邮件指纹,并修改所述误判邮件的邮件指纹所对应的判断类型;第二特征子单元,用于计算所述漏判邮件的邮件指纹,并设置所述漏判邮件的邮件指纹所对应的判断类型;第三特征子单元,用于提取黑白名单规则。
实施本发明,具有如下有益效果:
可疑邮件经人工审核后,可主动发现漏判邮件、误判邮件,并可额外添加黑白名单规则。因此,根据人工审核结果提取特征信息,并将特征信息实时下发至反垃圾服务器数据库,实时生效,使反垃圾引擎根据最新的特征信息判断垃圾邮件,这样既可以较早发现漏判的垃圾邮件,又可以及时的纠正误判邮件,更快的纠正智能反垃圾引擎的错误,为规则的提取提供依据,更好的应对垃圾邮件的变化,不用等到下次反垃圾引擎学习生成新的特征库来纠正,加强过滤效果。
附图说明
图1是本发明一种垃圾邮件计算机辅助处理方法的第一实施例流程图;
图2是本发明一种垃圾邮件计算机辅助处理方法的第二实施例流程图;
图3是本发明一种垃圾邮件计算机辅助处理系统的结构示意图;
图4是本发明一种垃圾邮件计算机辅助处理系统中辅助处理装置的结构示意图;
图5是本发明一种垃圾邮件计算机辅助处理系统中辅助处理装置的另一结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
图1是本发明一种垃圾邮件计算机辅助处理方法的第一实施例流程图,包括:
S100、辅助处理装置提取可疑邮件的人工审核结果。
人工审核结果包括误判邮件、漏判邮件、黑白名单规则。
需要说明的是,可疑邮件经人工审核后,即可主动发现漏判邮件、误判邮件,并可额外添加黑白名单规则,形成人工审核结果。
辅助处理装置实时提取可疑邮件的人工审核结果,并对人工审核结果进行处理。
S101、所述辅助处理装置根据人工审核结果提取特征信息。
所述特征信息包括邮件指纹、邮件指纹所对应的判断类型、黑白名单规则。
需要说明的是,根据电子邮件中的文本计算邮件指纹,一封电子邮件对应一个邮件指纹。
S102、所述辅助处理装置将所述特征信息同步至反垃圾服务器数据库。
所述辅助处理装置对反垃圾服务器数据库中的特征信息进行实时更新,保证反垃圾服务器数据库的实时性。
S103、反垃圾引擎根据所述反垃圾服务器数据库中的特征信息判断垃圾邮件。
需要说明的是,反垃圾引擎根据所述特征信息判断垃圾邮件时,包括:根据黑白名单规则对电子邮件进行过滤;根据邮件指纹对电子邮件进行过滤,即将邮件指纹相似的电子邮件划分为同一类,若该类中某邮件为垃圾邮件,则该类中的所有电子邮件均为垃圾邮件。
图2是本发明一种垃圾邮件计算机辅助处理方法的第二实施例流程图,包括:
S200、辅助处理装置提取可疑邮件的人工审核结果。
人工审核结果包括误判邮件、漏判邮件、黑白名单规则。
需要说明的是,可疑邮件经人工审核后,即可主动发现漏判邮件、误判邮件,并可额外添加黑白名单规则,形成人工审核结果。
辅助处理装置实时提取可疑邮件的人工审核结果,并对人工审核结果进行处理。
S201、计算所述误判邮件的邮件指纹,并修改所述误判邮件的邮件指纹所对应的判断类型。
需要说明的是,根据电子邮件中的文本计算邮件指纹,一封电子邮件对应一个邮件指纹。
所述判断类型包括“正常邮件”、“垃圾邮件”。
S202、计算所述漏判邮件的邮件指纹,并设置所述漏判邮件的邮件指纹所对应的判断类型。
S203、提取黑白名单规则。
需要说明的是,所述步骤S201、S202、S203之间没有必然的前后顺序。
S204、所述辅助处理装置将所述特征信息同步至反垃圾服务器数据库。
所述辅助处理装置对反垃圾服务器数据库中的特征信息进行实时更新,保证反垃圾服务器数据库的实时性。
S205、反垃圾引擎根据所述反垃圾服务器数据库中的特征信息判断垃圾邮件。
例如,电子邮件A对应的邮件指纹为 A-fng,原判断类型为“垃圾邮件”,则对于与A相似的邮件都会判定为“垃圾邮件”。若经人工审核后发现A为误判邮件,则辅助处理装置将A改判为“正常邮件”,并将 A的特征信息同步至反垃圾服务器数据库,以后处理与A相似邮件(邮件指纹与A-fng相似的邮件)都会判定为“正常邮件”。假如A的邮件指纹不可靠(邮件内容过短,不宜生成邮件指纹),但A有其他明显特征,则辅助处理装置将这部分信息作为规则添加,规则同步至反垃圾服务器数据库,对应的反垃圾引擎会对符合规则的邮件直接判定。
这样既可以较早发现漏判的垃圾邮件,又可以及时的纠正误判邮件,更快的纠正智能反垃圾引擎的错误,为规则的提取提供依据,更好的应对垃圾邮件的变化加强过滤效果。
图3是本发明一种垃圾邮件计算机辅助处理系统1的结构示意图,如图3所示,垃圾邮件计算机辅助处理系统1包括:
辅助处理装置2,用于提取可疑邮件的人工审核结果,根据人工审核结果提取特征信息,并将所述特征信息同步至反垃圾服务器数据库3。
反垃圾服务器数据库3,用于存储特征信息。
反垃圾引擎4,用于根据所述反垃圾服务器数据库3中的特征信息判断垃圾邮件。
所述人工审核结果包括误判邮件、漏判邮件、黑白名单规则。
所述特征信息包括邮件指纹、邮件指纹所对应的判断类型、黑白名单规则。
因此,辅助处理装置2可实时根据人工审核结果提取特征信息,并将特征信息实时下发至反垃圾服务器数据库3,实时生效,使反垃圾引擎4根据最新的特征信息判断垃圾邮件,为规则的提取提供依据,加强过滤效果。
图4是本发明一种垃圾邮件计算机辅助处理系统1中辅助处理装置2的结构示意图,如图4所示,所述辅助处理装置2包括:
提取单元21,用于提取可疑邮件的人工审核结果。
特征单元22,用于根据人工审核结果提取特征信息。
同步单元23,用于将所述特征信息同步至反垃圾服务器数据库3。同步单元23对反垃圾服务器数据库3中的特征信息进行实时更新,保证反垃圾服务器数据库的实时性。
图5是本发明一种垃圾邮件计算机辅助处理系统1中辅助处理装置2的另一结构示意图,与图4不同的是,所述特征单元22包括:
第一特征子单元221,用于计算所述误判邮件的邮件指纹,并修改所述误判邮件的邮件指纹所对应的判断类型。
所述判断类型包括“正常邮件”、“垃圾邮件”。
第二特征子单元222,用于计算所述漏判邮件的邮件指纹,并设置所述漏判邮件的邮件指纹所对应的判断类型。
第三特征子单元223,用于提取黑白名单规则。
需要说明的是,所述第一特征子单元221、第二特征子单元222及第三特征子单元223相互独立,互不影响。
由上可知,可疑邮件经人工审核后,可主动发现漏判邮件、误判邮件,并可额外添加黑白名单规则。因此,提取单元21提取可疑邮件的人工审核结果后,特征单元22根据人工审核结果提取特征信息,并由同步单元23将特征信息实时下发至反垃圾服务器数据库3,实时生效,使反垃圾引擎4根据最新的特征信息判断垃圾邮件,这样既可以较早发现漏判的垃圾邮件,又可以及时的纠正误判邮件,更快的纠正智能反垃圾引擎的错误,为规则的提取提供依据,更好的应对垃圾邮件的变化,不用等到下次反垃圾引擎学习生成新的特征库来纠正,加强过滤效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (5)

1.一种垃圾邮件计算机辅助处理方法,其特征在于,包括
辅助处理装置提取可疑邮件的人工审核结果,所述人工审核结果包括误判邮件、漏判邮件、黑白名单规则;
所述辅助处理装置根据人工审核结果提取特征信息,所述特征信息包括邮件指纹、邮件指纹所对应的判断类型、黑白名单规则;
所述辅助处理装置将所述特征信息同步至反垃圾服务器数据库;
反垃圾引擎根据所述反垃圾服务器数据库中的特征信息判断垃圾邮件。
2.如权利要求1所述的垃圾邮件计算机辅助处理方法,其特征在于,所述辅助处理装置根据人工审核结果提取特征信息的方法包括:
计算所述误判邮件的邮件指纹,并修改所述误判邮件的邮件指纹所对应的判断类型;
计算所述漏判邮件的邮件指纹,并设置所述漏判邮件的邮件指纹所对应的判断类型;
提取黑白名单规则。
3.一种垃圾邮件计算机辅助处理系统,其特征在于,包括:
辅助处理装置,用于提取可疑邮件的人工审核结果,根据人工审核结果提取特征信息,并将所述特征信息同步至反垃圾服务器数据库;
反垃圾服务器数据库,用于存储特征信息;
反垃圾引擎,用于根据所述反垃圾服务器数据库中的特征信息判断垃圾邮件;
所述人工审核结果包括误判邮件、漏判邮件、黑白名单规则;
所述特征信息包括邮件指纹、邮件指纹所对应的判断类型、黑白名单规则。
4.如权利要求3所述的垃圾邮件计算机辅助处理系统,其特征在于,所述辅助处理装置包括:
提取单元,用于提取可疑邮件的人工审核结果;
特征单元,用于根据人工审核结果提取特征信息;
同步单元,用于将所述特征信息同步至反垃圾服务器数据库。
5.如权利要求4所述的垃圾邮件计算机辅助处理系统,其特征在于,所述特征单元包括:
第一特征子单元,用于计算所述误判邮件的邮件指纹,并修改所述误判邮件的邮件指纹所对应的判断类型;
第二特征子单元,用于计算所述漏判邮件的邮件指纹,并设置所述漏判邮件的邮件指纹所对应的判断类型;
第三特征子单元,用于提取黑白名单规则。
CN2013103936907A 2013-09-03 2013-09-03 一种垃圾邮件计算机辅助处理方法及系统 Pending CN103442013A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2013103936907A CN103442013A (zh) 2013-09-03 2013-09-03 一种垃圾邮件计算机辅助处理方法及系统
PCT/CN2013/086168 WO2015032121A1 (zh) 2013-09-03 2013-10-29 一种垃圾邮件计算机辅助处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013103936907A CN103442013A (zh) 2013-09-03 2013-09-03 一种垃圾邮件计算机辅助处理方法及系统

Publications (1)

Publication Number Publication Date
CN103442013A true CN103442013A (zh) 2013-12-11

Family

ID=49695678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013103936907A Pending CN103442013A (zh) 2013-09-03 2013-09-03 一种垃圾邮件计算机辅助处理方法及系统

Country Status (2)

Country Link
CN (1) CN103442013A (zh)
WO (1) WO2015032121A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388859A (zh) * 2008-09-16 2009-03-18 王玉冰 一种反垃圾邮件的系统及方法
CN101877680A (zh) * 2010-05-21 2010-11-03 电子科技大学 一种垃圾邮件发送行为控制系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295381B (zh) * 2008-06-25 2011-09-28 北京大学 一种垃圾邮件检测方法
CN101699818B (zh) * 2009-11-11 2012-07-04 海南电力试验研究所 一种反垃圾邮件管理系统和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388859A (zh) * 2008-09-16 2009-03-18 王玉冰 一种反垃圾邮件的系统及方法
CN101877680A (zh) * 2010-05-21 2010-11-03 电子科技大学 一种垃圾邮件发送行为控制系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邱明明等: ""一种个性化垃圾邮件识别系统的设计"", 《计算机技术与发展》 *

Also Published As

Publication number Publication date
WO2015032121A1 (zh) 2015-03-12

Similar Documents

Publication Publication Date Title
CN103441924B (zh) 一种基于短文本的垃圾邮件过滤方法及装置
CN105069056B (zh) 基于字符串匹配的身份证住址信息解析方法及系统
CN103473289A (zh) 一种通信地址补全的装置及方法
WO2019179010A1 (zh) 数据集获取方法、分类方法、装置、设备及存储介质
CN105634855B (zh) 网络地址的异常识别方法及装置
JP2011227889A (ja) 拡張されたエンティティ抽出を基礎とするメッセージ及び会話間の意味的類似性の計算方法
CN102790762A (zh) 基于url分类的钓鱼网站检测方法
CN108647357B (zh) 数据查询的方法及装置
CA2743273A1 (en) Method and device for intercepting junk mail
US10216837B1 (en) Selecting pattern matching segments for electronic communication clustering
CN105893615A (zh) 基于手机取证数据的机主特征属性挖掘方法及其系统
CN100556062C (zh) 基于多种ocr方案组合校验以准确提取数字的方法
CN113408281A (zh) 邮箱账号异常检测方法、装置、电子设备及存储介质
WO2011081755A2 (en) Electronic mail server and method for automatically generating address lists
CN107959587A (zh) 基于海量文件的处理结果日志合并装置及方法
CN108462624A (zh) 一种垃圾邮件的识别方法、装置以及电子设备
CN108574625A (zh) 应用测试邀请方法和装置
CN107992508B (zh) 一种基于机器学习的中文邮件签名提取方法及系统
CN106373279A (zh) 用于多表集抄系统的智能ic卡水表的通信方法
CN103442013A (zh) 一种垃圾邮件计算机辅助处理方法及系统
CN114372455A (zh) 通信地址的检测方法、装置、设备及介质
CN114168860A (zh) 一种基于网络特征的暗网站点用户关联方法及装置
CN110263082B (zh) 数据库的数据分布分析方法、装置、电子设备及存储介质
CN104933061B (zh) 字符串检测方法、装置及电子设备
CN106503744A (zh) 对聊天过程中的输入表情进行自动纠错的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20131211

RJ01 Rejection of invention patent application after publication