CN101534261B - 一种垃圾消息的识别方法、装置和系统 - Google Patents

一种垃圾消息的识别方法、装置和系统 Download PDF

Info

Publication number
CN101534261B
CN101534261B CN 200910131229 CN200910131229A CN101534261B CN 101534261 B CN101534261 B CN 101534261B CN 200910131229 CN200910131229 CN 200910131229 CN 200910131229 A CN200910131229 A CN 200910131229A CN 101534261 B CN101534261 B CN 101534261B
Authority
CN
China
Prior art keywords
message
communication
sender
spam
content
Prior art date
Application number
CN 200910131229
Other languages
English (en)
Other versions
CN101534261A (zh
Inventor
张利明
闻波
Original Assignee
阿里巴巴集团控股有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 阿里巴巴集团控股有限公司 filed Critical 阿里巴巴集团控股有限公司
Priority to CN 200910131229 priority Critical patent/CN101534261B/zh
Publication of CN101534261A publication Critical patent/CN101534261A/zh
Application granted granted Critical
Publication of CN101534261B publication Critical patent/CN101534261B/zh

Links

Abstract

本申请公开了一种垃圾消息的识别方法、装置和系统,该方法包括:提取通讯消息中的发送方信息;根据所述提取的发送方信息,判断所述通讯消息的发送方是否为可预期发送方,如果所述通讯消息的发送方不是所述可预期发送方,则识别所述通讯消息为垃圾消息,或继续对所述通讯消息进行识别。本申请通过判断通讯消息的发送方是否为可预期用户,进行垃圾消息的识别,降低了对垃圾消息的漏判率和误判率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。

Description

一种垃圾消息的识别方法、装置和系统

技术领域

[0001] 本申请涉及网络通信技术领域,特别涉及一种垃圾消息的识别方法、装置和系统。背景技术

[0002] 随着通信技术的发展,各种通讯系统的发明使用大大方便了用户之间的相互交流。两个或两个以上的客户端可以通过通讯网络进行连接,即时地传递文字、档案、语音和视频ィ目息。 [0003] 然而,在大量的通讯消息中存在着相当一部分无用的、甚至带有欺骗性质的垃圾消息,不仅给通讯系统中的服务器增加了额外的负担,也给处于客户端的用户造成了极其恶劣的影响。用户接收到垃圾消息后,需要花费大量的时间用于确认接收到的消息是否有用以及删除确认无用的垃圾消息,甚至还会由于大量的垃圾消息的聚集而错过正常消息的接收,严重干扰了用户之间的正常交流。同时,大量的垃圾消息也会影响即时通讯系统运营商的信誉,给网络监管带来困难,甚至会使运营商的生产环境短时间内瘫痪,使运营商蒙受巨额的经济损失。

[0004] 现有技术中,通常采用预设的关键词对接收到的通讯消息进行过滤,以识别垃圾消息,具体步骤包括:首先,通过对大量的垃圾消息的分析,总结垃圾消息中常用到的ー些关键词,组成关键词库,放置到即时通讯系统服务器或客户端中,关键词可以是“中奖”、“月艮装大甩卖”、“汇款”、“转让”等词语,在很大程度上表明该信息是以宣传、广告、诈骗等为目的的垃圾信息;其次,接收到通讯消息后,提取该通讯消息的消息内容,以供查验;最后,对照关键词库,查验接收到的通讯消息的信息内容中是否含有关键词库内存储的关键词,如果该消息内容中含有关键词,则判定该通讯消息为垃圾消息,对该通讯消息进行丢弃;如果该消息内容中不含有关键词,则判定该通讯消息为正常消息。

[0005] 另外,还采用预设的正则表达式(regular expression)对接收到的通讯消息的消息内容中的某种格式进行匹配,以识别垃圾消息。正则表达式描述了ー种字符串匹配的模式,可以用于检查ー个字符串是否含有某种子字符串、将匹配的子字符串做替换或者从某个字符串中取出符合某个条件的子字符串等。正则表达式判断消息内容中是否存在匹配的关键特征,如网址、电话号码、即时通讯联系号码等信息,如果消息内容中存在匹配的关键特征,则判定该通讯消息为垃圾消息。

[0006] 现有技术也可以对上述两种识别垃圾消息的方法进行组合,综合使用预设的关键词和正则表达式,过滤接收到的通讯消息,以识别垃圾消息。

[0007] 在实现本申请的过程中,发明人发现现有技术至少存在以下问题:

[0008] 现有技术中,通过对消息内容进行规则匹配识别垃圾消息,识别的准确率取决于关键词和正则表达式的设定是否合适。关键词和正则表达式一般是根据经验设定或者从已经标记为垃圾消息的消息中选取,具有一定的随意性,无法识别不在关键词范围内或关键词出现频率较低的垃圾消息。而符合垃圾消息的部分特征、但不属于垃圾消息的消息,却容易被误判为垃圾消息。例如,某些垃圾消息中包含“视频聊天”的词语,如果把“视频聊天”设定为关键词来识别垃圾消息,则用户希望邀请其他人进行视频聊天的、包含“视频聊天”的正常消息就会被误判为垃圾消息。因此,现有的垃圾消息的识别方法,仅仅对消息内容进行机械式的识别,没有考虑到消息发送的场景,对垃圾消息的识别结果存在很大的误判率和漏判率。

发明内容

[0009] 本申请提供一种垃圾消息的识别方法、装置和系统,提高了识别垃圾消息的准确率。

[0010] 本申请提供一种垃圾消息的识别方法,包括:

[0011] 提取通讯消息中的发送方信息;

[0012] 根据所述提取的发送方信息,判断所述通讯消息的发送方是否为可预期发送方,如果所述通讯消息的发送方不是所述可预期发送方,则识别所述通讯消息为垃圾消息,或继续对所述通讯消息进行识别。

[0013] 本申请还提供ー种通讯设备,包括:

[0014] 提取模块,用于提取通讯消息中的发送方信息;

[0015] 第一判断模块,用于根据所述提取模块提取的发送方信息,判断所述通讯消息的发送方是否为可预期发送方;

[0016] 识别模块,用于在所述第一判断模块判断所述通讯消息的发送方不是所述可预期发送方吋,识别所述通讯消息为垃圾消息,或继续对所述通讯消息进行识别。

[0017] 本申请还提供ー种通讯系统,包括:

[0018] 第一通讯设备,用于提取通讯消息中的发送方信息,根据所述提取的发送方信息,判断所述通讯消息的发送方是否为可预期发送方,在所述通讯消息的发送方不是所述可预期发送方时,将所述通讯消息标记为待识别消息,向第二通讯设备转发标记后的通讯消息;

[0019] 第二通讯设备,用于根据以下内容中的至少ー项,对接收到的来自所述第一通讯设备的通讯消息进行识别:

[0020] 预设的关键词列表、预设的正则表达式和预设的垃圾消息识别选项。

[0021] 本申请包括以下优点,由于通过判断通讯消息的发送方是否为可预期用户,进行垃圾消息的识别,降低了对垃圾消息的漏判率和误判率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。当然,实施本申请的任ー产品并不一定需要同时达到以上所述的所有优点。

附图说明

[0022] 为了更清楚地说明本申请或现有技术的技术方案,下面将对本申请或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的ー些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

[0023] 图I为本申请实施例一中的一种垃圾消息的识别方法流程图;

[0024] 图2为本申请实施例ニ中的一种垃圾消息的识别方法流程图;[0025] 图3为本申请实施例三中的一种垃圾消息的识别方法流程图;

[0026] 图4为本申请实施例四中的一种垃圾消息的识别方法流程图;

[0027] 图5为本申请实施例五中的一种垃圾消息的识别方法流程图;

[0028] 图6为本申请实施例六中的一种垃圾消息的识别方法流程图;

[0029] 图7为本申请实施例七中的ー种通讯设备结构示意图;

[0030] 图8为本申请实施例八中的一种通讯系统结构示意图。

具体实施方式

[0031] 本申请的主要思想包括,提取通讯消息中的发送方信息;根据提取的发送方信息,判断通讯消息的发送方是否为可预期发送方;如果通讯消息的发送方是可预期发送方,则识别该通讯消息为正常消息;如果通讯消息的发送方不是可预期发送方,则识别该通讯消息为垃圾消息,或继续对接收到的通讯消息进行识别。本申请实施例中,可以由发送客户端执行上述对垃圾消息的识别方法,对待发送的通讯消息进行识别;也可以由系统服务器执行上述对垃圾消息的识别方法,对中转的通讯消息进行识别;还可以由接收客户端执行上述对垃圾消息的识别方法,对接收到的通讯消息进行识别。不论在发送客户端、系统服务器或接收客户端执行上述对垃圾消息的识别方法,对垃圾消息的识别效果相同,均可以达到本申请的发明目的。

[0032] 下面将结合本申请实施例中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

[0033] 如图I所示,为本申请实施例一中的一种垃圾消息的识别方法流程图,包括以下步骤:

[0034] 步骤101,提取通讯消息中的发送方信息。

[0035] 本申请实施例中的通讯消息可以为IM(Instant Messaging,即时通讯)系统中的即时消息、SMS (Short Messaging Service,短消息业务)消息、MMS (Multimedia MessagingService,多媒体短信业务)消息或E-mail (electronicmail,电子邮件)等,通讯消息本身可以包括发送时间、发送方信息、接收方信息和消息内容等部分。通讯消息由发送客户端发送,经系统服务器转发到接收客户端。其中,接收方信息包括接收方名称、接收方ID (Identity,身份标识号码)和接收方地址等内容。

[0036] 系统服务器或接收客户端可以在接收到通讯消息后,提取通讯消息中的发送方信息,发送方信息可以包括发送方名称、发送方ID和发送方地址等内容。

[0037] 步骤102,根据提取的发送方信息,判断通讯消息的发送方是否为可预期发送方。

[0038] 如果通讯消息的发送方是可预期发送方,则执行步骤103 ;如果通讯消息的发送方不是可预期发送方,则执行步骤104。

[0039] 可预期发送方包括以下用户中的至少ー种:系统用户、通讯消息的接收方的好友用户和通讯消息的接收方主动联系过的非好友用户。

[0040] 判断通讯消息的发送方是否为可预期发送方,包括:获取系统用户名单、通信消息的接收方的好友用户名单和通讯消息接收方主动联系过的非好友用户名单;如果通讯消息、的发送方信息记录在系统用户名单、通信消息的接收方的好友用户名单和通讯消息接收方主动联系过的非好友用户名单的任ー项中,则判断通讯消息的发送方是可预期发送方。

[0041] 其中,系统用户为发送通讯消息的第三方用户,可以包括通讯服务提供商。系统用户向接收方发送的消息通常以通知或提醒的形式出现,接收方可以将系统用户作为可预期发送方。系统用户名单可以存储在系统服务器中,客户端识别垃圾消息时,可以向系统服务器查询系统用户名单,也可以接收来自系统服务器的系统用户名単。

[0042] 通讯消息的接收方的好友用户在向接收方发送通讯消息之前,与接收方建立好友关系,并通过接收方的身份认证,接收方可以将自身的好友用户作为可预期发送方。通信消息的接收方的好友用户名单可以存储在接收方客户端,系统服务器识别垃圾消息时,可以向接收方客户端查询接收方的好友用户名单,也可以接收来自接收方客户端的接收方的好友用户名单。

[0043] 通讯消息的接收方主动联系过的非好友用户在向接收方发送通讯消息之前,未与 接收方建立好友关系,但曾接收到该接收方发送的消息。通讯消息接收方主动联系过的非好友用户名单可以存储在接收方客户端,接收方客户端可以周期性地或事件触发性地将自身的好友用户信息和自身主动联系过的非好友用户信息上传到系统服务器,也可以接受系统服务器或其他客户端的查询,供系统服务器和其他客户端识别垃圾消息。

[0044] 步骤103,识别通讯消息为正常消息。

[0045] 如果通讯消息的发送方是可预期发送方,则识别该通讯消息为正常消息,并按照正常的流程处理该通讯消息。系统服务器识别接收到的通讯消息为正常消息后,可以对该通讯消息进行正常的转发;接收客户端识别接收到的通讯消息为正常消息后,可以按照该通讯消息进行相应的操作,并将该通讯消息的发送方加入到白名単。

[0046] 步骤104,识别通讯消息为垃圾消息,或继续对该通讯消息进行识别。

[0047] 如果通讯消息的发送方不是可预期发送方,则可以识别该通讯消息为垃圾消息,对该通讯消息进行丢弃处理,并将该通讯消息的发送方加入到黑名単;也可以继续对该通讯消息进行识别,识别方法可以包括使用预设的关键词列表、预设的正则表达式和预设的垃圾消息识别选项中的至少ー项进行识别。

[0048] 需要说明的是,本申请实施例可以根据实际需要对各个步骤顺序进行调整。上述使用预设的关键词列表、预设的正则表达式和预设的垃圾消息识别选项中的至少ー项识别垃圾消息的步骤,也可以在使用发送方信息识别垃圾消息的步骤之前执行。

[0049] 本申请包括以下优点,由于通过判断通讯消息的发送方是否为可预期用户,进行垃圾消息的识别,降低了对垃圾消息的漏判率和误判率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。当然,实施本申请的任ー产品并不一定需要同时达到以上所述的所有优点。

[0050] 如图2所示,为本申请实施例ニ中的一种垃圾消息的识别方法流程图,包括以下步骤:

[0051] 步骤201,发送客户端提取待发送的通讯消息中的发送方信息。

[0052] 发送客户端获取待发送的通讯消息后,可以不立即将该通讯消息发送到指定的客户端,而是提取该通讯消息中的发送方信息,以进行垃圾消息的识别。发送方信息可以包括发送方名称、发送方ID和发送方地址等内容。[0053] 步骤202,发送客户端根据提取的发送方信息,判断待发送的通讯消息的发送方是否为可预期发送方。

[0054] 如果待发送的通讯消息的发送方是可预期发送方,则执行步骤203 ;如果待发送的通讯消息的发送方不是可预期发送方,则执行步骤205。

[0055] 可预期发送方包括以下用户中的至少ー种:系统用户、通讯消息的接收方的好友用户和通讯消息的接收方主动联系过的非好友用户。

[0056] 系统中的客户端也可以将自身的好友用户信息和自身主动联系过的非好友用户信息,周期性地或事件触发性地上传到系统服务器。系统服务器也可以将上述从客户端接收到的信息,周期性地或事件触发性地发送到系统中的其他客户端,或者接受其他客户端的查询,供其他客户端进行垃圾消息的识别。发送客户端可以从待发送的通讯消息中提取接收方信息,井根据接收方信息从系统服务器查询接收方的好友用户信息和接收方主动联系过的非好友用户信息,进而判断待发送的通讯信息的发送方是否为接收方的可预期发送方。 [0057] 步骤203,发送客户端识别待发送的通讯消息为正常消息,将该通讯消息发送到系统服务器。

[0058] 如果通讯消息的发送方是可预期发送方,发送客户端识别该通讯消息为正常消息,并将该通讯消息发送到系统服务器。

[0059] 步骤204,系统服务器将接收到的通讯消息转发给接收客户端,或对接收到的通讯消息进行识别。

[0060] 系统服务器接收到发送方客户端发送的通讯消息后,可以提取该通讯消息中的接收方信息,并根据该接收方信息将该通讯消息转发给接收方客户端;也可以继续对接收到的通讯消息进行识别,识别方法可以包括使用预设的关键词列表、正则表达式和垃圾消息识别选项中的至少ー项进行识别。

[0061] 步骤205,发送客户端判断待发送的通讯消息的消息内容是否与预设的关键词列表匹配。

[0062] 如果待发送的通讯消息的消息内容与预设的关键词列表匹配,则执行步骤206 ;如果待发送的通讯消息的消息内容与预设的关键词列表不匹配,则执行步骤207。

[0063] 关键词列表可以包含各种用于宣传广告信息、恶意传播流言信息和不文明信息的垃圾消息中常用的关键词,例如,“服装大甩卖”、“转让门面店”、“中奖”、“请汇款”等用词,还可以包含ー些常用的英文广告词、英文不文明用语等。关键词列表可以由用户个性化设定,也可以由系统服务器下发到各个客户端。

[0064] 发送客户端对待发送的通讯消息提取消息内容,对照预设的关键词列表,查验该消息内容中是否包含关键词列表中相应的关键词,如果查验到该消息内容中包含相应的关键词,则该消息内容与预设的关键词列表匹配;如果查验到该消息内容中不包含相应的关键词,则该消息内容与预设的关键词列表不匹配。

[0065] 发送客户端还可以对提取的消息内容进行格式转换,将消息内容转换为统ー的格式,再进行查验,如全部转换为小写、半角格式,防止垃圾消息发送者对ー些关键词进行大、小写或全角、半角变换来规避查验。

[0066] 步骤206,发送客户端识别待发送的通讯消息为垃圾消息。[0067] 如果待发送的通讯消息的消息内容与预设的关键词列表匹配,即该消息内容中包含相应的关键词,则发送客户端识别待发送的通讯消息为垃圾消息,并对该待发送的通讯消息进行丢弃处理。

[0068] 步骤207,发送客户端判断待发送的通讯消息的消息内容是否符合预设的垃圾消息识别选项。

[0069] 如果待发送的通讯消息的消息内容符合预设的垃圾消息识别选项,则执行步骤203 ;如果待发送的通讯消息的消息内容不符合预设的垃圾消息识别选项,则执行步骤206。

[0070] 如果待发送的通讯消息的消息内容与预设的关键词列表不匹配,即该消息内容中不包含相应的关键词,则发送客户端可以提取待发送的通讯消息的消息内容,并判断提取到的消息内容是否符合预设的垃圾消息识别选项。

[0071] 预设的垃圾消息识别选项可以包括以下内容中的至少ー项:a、不允许出现电话号码山、不允许出现网络链接;c、不允许出现IM号码;d、不允许出现图片。用户可以根据自身的需求,个性化设定上述垃圾消息识别选项。

[0072] 需要说明的是,本申请实施例可以根据实际需要对各个步骤顺序进行调整。上述使用预设的垃圾消息识别选项识别垃圾消息的步骤,可以在使用预设的关键词列表识别垃圾消息的步骤之前执行;上述使用预设的关键词列表和预设的垃圾消息识别选项识别垃圾消息的步骤,也可以在使用发送方信息识别垃圾消息的步骤之前执行。当上述使用预设的关键词列表或预设的垃圾消息识别选项识别垃圾消息的步骤,在使用发送方信息识别垃圾消息的步骤之前执行时,若通讯消息的消息内容与预设的关键词列表匹配或消息内容不符合预设的垃圾消息识别选项,则暂时识别该通讯消息为垃圾消息,然后再通过判断该通讯消息的发送方是否是可预期用户进行进ー步确认。即,若该通讯消息的发送方不是可预期用户,则确认该通讯消息为垃圾消息,若该通讯消息的发送方是可预期用户,则更改该通讯消息为正常消息。作为本申请实施例的替换方案,若通讯消息的消息内容与预设的关键词列表匹配或消息内容不符合预设的垃圾消息识别选项,也可以直接识别该通讯消息为垃圾消息,并对该通讯消息作丢弃处理。

[0073] 本申请包括以下优点,通过发送客户端主动判断通讯消息的发送方是否为接收方的可预期用户,以及根据预设的关键词列表和垃圾消息识别选项进行垃圾消息的识别,降低了对垃圾消息的漏判率和误判率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。当然,实施本申请的任ー产品并不一定需要同时达到以上所述的所有优点。

[0074] 本申请的以上实施方式中,由发送客户端判断待发送的通讯消息的发送方是否为接收方的可预期用户,并结合预设的关键词列表和垃圾消息识别选项进行垃圾消息的识另IJ。本申请实施例中,还可以由系统服务器判断接收到的通讯消息的发送方是否为接收方的可预期用户,并由接收客户端根据预设的关键词列表和正则表达式进行垃圾消息的识另IJ。以下通过具体实施例进行详细描述。

[0075] 如图3所示,为本申请实施例三中的一种垃圾消息的识别方法流程图,包括以下步骤:

[0076] 步骤301,系统服务器接收发送客户端发送的通讯消息。

[0077] 通讯消息由发送客户端发送,经系统服务器转发到接收客户端,可以包括发送时间、发送方信息、接收方信息和消息内容等部分。

[0078] 步骤302,系统服务器提取接收到的通讯消息中的发送方信息。

[0079] 系统服务器接收到发送客户端发送的通讯消息后,可以不立即将该通讯消息转发到指定的客户端,而是提取该通讯消息中的发送方信息,以进行垃圾消息的识别。发送方信息可以包括发送方名称、发送方ID和发送方地址等内容。

[0080] 步骤303,系统服务器根据提取的发送方信息,判断接收到的通讯消息的发送方是否为可预期发送方。

[0081] 如果接收到的通讯消息的发送方是可预期发送方,则执行步骤304;如果接收到的通讯消息的发送方不是可预期发送方,则执行步骤306。

[0082] 可预期发送方包括以下用户中的至少ー种:系统用户、通讯消息的接收方的好友用户和通讯消息的接收方主动联系过的非好友用户。

[0083] 系统中的客户端也可以将自身的好友用户信息和自身主动联系过的非好友用户信息,周期性地或事件触发性地上传到系统服务器。系统服务器也可以将上述从客户端接收到的信息,周期性地或事件触发性地向系统中的其他客户端公布,供其他客户端进行垃圾消息的识别。系统服务器可以从接收到的通讯消息中提取接收方信息,井根据接收方信息查询接收方的好友用户信息和接收方主动联系过的非好友用户信息,进而判断接收到的通讯信息的发送方是否为接收方的可预期发送方。

[0084] 步骤304,系统服务器将接收到的通讯消息标记为正常消息,井向接收客户端转发标记后的通讯消息。

[0085] 如果接收到的通讯消息的发送方是可预期发送方,系统服务器识别该通讯消息为正常消息,并提取该通讯消息中的接收方信息,根据该接收方信息将该通讯消息转发给接收方客户端。接收客户端可以按照接收到的通讯消息进行相应的操作,不再对该通讯消息进行识别。

[0086] 步骤305,系统服务器将接收到的通讯消息标记为待识别消息,井向接收客户端转发标记后的通讯消息。

[0087] 如果接收到的通讯消息的发送方不是可预期发送方,系统服务器识别该通讯消息为待识别消息,并提取该通讯消息中的接收方信息,根据该接收方信息将该通讯消息转发给接收方客户端,由接收客户端继续对该通讯消息进行识别。接收客户端的识别方法可以包括使用预设的关键词列表、正则表达式和垃圾消息识别选项中的至少ー项进行识别。

[0088] 步骤306,接收客户端使用预设的关键词列表,对接收到的通讯消息的消息内容进行匹配,并获取与消息内容匹配的关键词的分值。

[0089] 关键词列表用于判断通讯消息中是否包含垃圾消息的特征词语,可以由用户个性化设定,也可以由系统服务器下发到各个客户端。每个关键词对应预设的分值,用于标示该关键词出现在垃圾消息中的可能性,不同关键词的分值可以相同或不同。

[0090] 接收客户端对接收到的通讯消息提取消息内容,对照预设的关键词列表,查验该消息内容中是否包含关键词列表中相应的关键词,如果查验到该消息内容中包含相应的关键词,则判断该消息内容与预设的关键词列表匹配,并获取与该消息内容匹配的关键词的分值。与消息内容匹配的正则表达式为ー个以上时,接收客户端可以获取所有与消息内容匹配的正则表达式的分值。[0091] 接收客户端还可以对提取的消息内容进行格式转换,将消息内容转换为统ー的格式,再进行查验,如全部转换为小写、半角格式,防止垃圾消息发送者对ー些关键词进行大、小写或全角、半角变换来规避查验。

[0092] 步骤307,接收客户端使用预设的正则表达式,对接收到的通讯消息的消息内容进行匹配,并获取与消息内容匹配的正则表达式的分值。

[0093] 正则表达式用于从消息内容中辨别某些关键特征,比如电话号码、网络链接或IM号码等。不同的正则表达式对应不同的关键特征,接收客户端可以通过特定的正则表达式,判断接收到的通讯消息的消息内容中是否包含特定的关键特征,如果该消息内容中包含该关键特征,则该消息内容与该关键特征对应的正则表达式匹配。

[0094] 正则表达式可以由用户个性化设定,也可以由系统服务器下发到各个客户端。每个正则表达式对应预设的分值,用于标示该正则表达式从消息内容中辨别的关键特征出现在垃圾消息中的可能性,不同关键词的分值可以相同或不同。与消息内容匹配的正则表达式为ー个以上时,接收客户端可以获取所有与消息内容匹配的正则表达式的分值。 [0095] 需要说明的是,本步骤与步骤306的执行顺序没有先后之分,即接收客户端可以在使用预设的关键词列表,对接收到的通讯消息的消息内容进行匹配之前或之后,使用预设的正则表达式,对接收到的通讯消息的消息内容进行匹配。

[0096] 步骤308,接收客户端根据与消息内容匹配的关键词和正则表达式的分值,获取该消息内容的匹配总分值。

[0097] 接收客户端将所有与消息内容匹配的关键词的分值和正则表达式的分值相加,SP可获取该消息内容的匹配总分值。

[0098] 步骤309,接收客户端判断消息内容的匹配总分值是否大于或等于预设的阈值。

[0099] 如果消息内容的匹配总分值大于或等于预设的阈值,则执行步骤310;如果消息内容的匹配总分值小于预设的阈值,则执行步骤311。

[0100] 上述阈值可以设置为固定值,也可以根据通讯消息的长度动态设置,即不同长度的通讯消息对应不同的阈值。

[0101] 步骤310,接收客户端识别接收到的通讯消息为垃圾消息。

[0102] 如果消息内容的匹配总分值大于或等于预设的阈值,则接收客户端识别接收到的通讯消息为垃圾消息,并对该通讯消息进行丢弃处理。

[0103] 步骤311,接收客户端识别接收到的通讯消息为正常消息。

[0104] 如果消息内容的匹配总分值小于预设的阈值,则接收客户端识别接收到的通讯消息为正常消息,并按照该通讯消息进行相应的操作。

[0105] 需要说明的是,本申请实施例可以根据实际需要对各个步骤顺序进行调整。上述使用预设的关键词列表和预设的正则表达式识别垃圾消息的步骤,也可以在使用发送方信息识别垃圾消息的步骤之前执行。当上述使用预设的关键词列表和预设的正则表达式识别垃圾消息的步骤,在使用发送方信息识别垃圾消息的步骤之前执行时,若通讯消息的消息内容与预设的关键词列表匹配或消息内容的匹配总分值大于或等于预设的阈值,则暂时识别该通讯消息为垃圾消息,然后再通过判断该通讯消息的发送方是否是可预期用户进行进一歩确认。即,若该通讯消息的发送方不是可预期用户,则确认该通讯消息为垃圾消息,若该通讯消息的发送方是可预期用户,则更改该通讯消息为正常消息。作为本申请实施例的替换方案,若通讯消息的消息内容与预设的关键词列表匹配或消息内容的匹配总分值大于或等于预设的阈值,也可以直接识别该通讯消息为垃圾消息,并对该通讯消息作丢弃处理。

[0106] 本申请包括以下优点,通过系统服务器判断通讯消息的发送方是否为接收方的可预期用户,并由接收客户端根据预设的关键词列表和正则表达式进行垃圾消息的识别,降低了对垃圾消息的漏判率和误判率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。当然,实施本申请的任ー产品并不一定需要同时达到以上所述的所有优点。

[0107] 如图4所示,为本申请实施例四中的一种垃圾消息的识别方法流程图,包括以下步骤:

[0108] 步骤401,客户端获取自身的可预期发送方信息。

[0109] 客户端运行后,可以从本地或者系统服务器获取自身的可预期发送方信息。客户端的可预期发送方包括系统用户、客户端的好友用户和客户端主动联系过的非好友用户中的至少ー项。

[0110] 步骤402,客户端根据自身发送的通讯消息中的接收方信息,更新自身的可预期发送方信息。

[0111] 客户端发送通讯消息时,可以根据步骤401获取的可预期发送方信息,确定该通讯消息的接收方的属性。如果该通讯消息的接收方不是该客户端的可预期发送方时,该客户端将该通讯消息的接收方信息添加到自身的可预期发送方信息中。

[0112] 具体地,客户端可以将该通讯消息的接收方设置为自身主动联系过的非好友用户,并记录该通讯消息的接收方信息,该接收方信息包括:接收方名称、接收方ID、接收方地址和最新联系时间等内容。其中,最新联系时间为客户端向该接收方发送通讯消息的时间。

[0113] 步骤403,客户端提取接收到的通讯消息中的发送方信息。

[0114] 客户端接收到通讯消息后,可以提取该通讯消息中的发送方信息,以进行垃圾消息的识别。发送方信息可以包括发送方名称、发送方ID和发送方地址等内容。

[0115] 步骤404,客户端根据提取的发送方信息,判断接收到的通讯消息的发送方是否为可预期发送方。

[0116] 如果接收到的通讯消息的发送方是可预期发送方,则执行步骤405 ;如果接收到的通讯消息的发送方不是可预期发送方,则执行步骤406。

[0117] 客户端可以将自身的好友用户信息和自身主动联系过的非好友用户信息,周期性地或事件触发性地上传到系统服务器。系统服务器也可以将上述从客户端接收到的信息,周期性地或事件触发性地向系统中的其他客户端公布,供其他客户端进行垃圾消息的识别。

[0118] 客户端可以首先判断该通讯消息的发送方是否为该客户端的好友用户,如果该发送方是该客户端的好友用户,则判断该发送方为可预期发送方;如果该发送方不是该客户端的好友用户,则继续判断该发送方是否为系统用户。

[0119] 如果该发送方是系统用户,则判断该发送方为可预期发送方;如果该发送方不是系统用户,则继续判断该发送方是否为该客户端主动联系过的非好友用户。

[0120] 如果该发送方不是该客户端主动联系过的非好友用户,则判断该发送方不是可预期发送方;如果该发送方是该客户端主动联系过的非好友用户,则查询该客户端与该发送方的最新联系时间,判断该发送方是否为该客户端在设定时间内主动联系过的非好友用户,即该发送方与该客户端的最新联系时间与当前时间之间的时间间隔是否超过预设时间间隔Tmax。

[0121] 如果该发送方与该客户端的最新联系时间与当前时间之间的时间间隔超过Tmax,则判断该发送方不是可预期发送方;如果该发送方与该客户端的最新联系时间与当前时间之间的时间间隔不超过Tmax,则判断该发送方是可预期发送方。

[0122] 需要说明的是,本步骤可以根据实际需要对各个判断顺序进行调整。

[0123] 步骤405,客户端识别接收到的通讯消息为正常消息。

[0124] 如果接收到的通讯消息的发送方是可预期发送方,客户端识别该通讯消息为正常消息,并按照该通讯消息进行相应的操作。

[0125] 步骤406,客户端判断接收到的通讯消息的消息内容是否与预设的关键词列表匹配。

[0126] 如果接收到的通讯消息的消息内容与预设的关键词列表匹配,则执行步骤407 ;如果接收到的通讯消息的消息内容与预设的关键词列表不匹配,则执行步骤408。

[0127] 客户端对接收到的通讯消息提取消息内容,对照预设的关键词列表,查验该消息内容中是否包含关键词列表中相应的关键词,如果查验到该消息内容中包含相应的关键词,则该消息内容与预设的关键词列表匹配;如果查验到该消息内容中不包含相应的关键词,则该消息内容与预设的关键词列表不匹配。

[0128] 客户端还可以对提取的消息内容进行格式转换,将消息内容转换为统一的格式,再进行查验,如全部转换为小写、半角格式,防止垃圾消息发送者对一些关键词进行大、小写或全角、半角变换来规避查验。

[0129] 步骤407,客户端识别接收到的通讯消息为垃圾消息。

[0130] 如果接收到的通讯消息的消息内容与预设的关键词列表匹配,即该消息内容中包含相应的关键词,则客户端识别接收到的通讯消息为垃圾消息,并对该接收到的通讯消息进行丢弃处理。

[0131] 步骤408,客户端判断接收到的通讯消息的消息内容是否符合预设的垃圾消息识别选项。

[0132] 如果接收到的通讯消息的消息内容符合预设的垃圾消息识别选项,则执行步骤405 ;如果接收到的通讯消息的消息内容不符合预设的垃圾消息识别选项,则执行步骤407。

[0133] 如果接收到的通讯消息的消息内容与预设的关键词列表不匹配,即该消息内容中不包含相应的关键词,则客户端可以提取接收到的通讯消息的消息内容,并判断提取到的消息内容是否符合预设的垃圾消息识别选项。

[0134] 需要说明的是,本申请实施例可以根据实际需要对各个步骤顺序进行调整。上述 使用预设的垃圾消息识别选项识别垃圾消息的步骤,可以在使用预设的关键词列表识别垃圾消息的步骤之前执行;上述使用预设的关键词列表和预设的垃圾消息识别选项识别垃圾消息的步骤,也可以在使用发送方信息识别垃圾消息的步骤之前执行。

[0135] 本申请包括以下优点,通过客户端根据发送的通讯消息中的接收方信息,更新自身的可预期发送方信息,并根据更新后的可预期发送方信息判断通讯消息的发送方是否为接收方的可预期用户,以及根据预设的关键词列表和垃圾消息识别选项进行垃圾消息的识另IJ,降低了对垃圾消息的漏判率和误判率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。当然,实施本申请的任ー产品并不一定需要同时达到以上所述的所有优点。

[0136] 需要说明的是,上述根据预设的关键词列表、正则表达式和垃圾消息识别选项进行垃圾消息的识别的流程,可以由系统服务器执行,也可以由系统服务器和客户端组合执行。上述根据预设的关键词列表、正则表达式和垃圾消息识别选项进行垃圾消息的识别的流程,与根据发送方信息进行垃圾消息的识别的流程之间,没有先后顺序之分。

[0137] 如图5所示,为本申请实施例五中的一种垃圾消息的识别方法流程图,包括以下步骤:

[0138] 步骤501,系统服务器设置黑名单列表和白名单列表。 [0139] 系统服务器识别垃圾消息的过程中,可以将被识别出的垃圾消息的发送方信息添加到黑名单列表中,还可以将被识别出的正常消息的发送方信息添加到白名单列表中。系统服务器可以周期性地或事件触发性地向系统中的客户端公布黑名单列表和白名单列表,供客户端识别垃圾消息。黑名单列表中的发送方信息包括垃圾消息发送方的名称、ID和地址等内容,白名单列表中的发送方信息包括正常消息发送方的名称、ID和地址等内容。

[0140] 客户端识别垃圾消息的过程中,也可以将被识别出的垃圾消息的发送方信息添加到黑名单列表中,将被识别出的正常消息的发送方信息添加到白名单列表中,并将上述黑名单列表和白名单列表周期性地或事件触发性地上传到系统服务器,供系统服务器识别垃圾消息。

[0141] 需要说明的是,上述黑名单列表和白名单列表也可以单独设置,即系统服务器可以只设置黑名单列表或只设置白名单列表。系统服务器只设置黑名单列表时,可以只根据黑名单列表识别垃圾消息;系统服务器只设置白名单列表时,可以只根据白名单列表识别垃圾消息。

[0142] 步骤502,系统服务器接收发送客户端发送的通讯消息。

[0143] 通讯消息由发送客户端发送,经系统服务器转发到接收客户端,可以包括发送时间、发送方信息、接收方信息和消息内容等部分。

[0144] 步骤503,系统服务器提取接收到的通讯消息中的发送方信息。

[0145] 系统服务器接收到发送客户端发送的通讯消息后,可以不立即将该通讯消息转发到指定的客户端,而是提取该通讯消息中的发送方信息,以进行垃圾消息的识别。发送方信息可以包括发送方名称、发送方ID和发送方地址等内容。

[0146] 步骤504,系统服务器判断提取到的发送方信息是否记录在白名单列表中。

[0147] 如果提取到的发送方信息记录在白名单列表中,则执行步骤505;如果提取到的发送方信息没有记录在白名单列表中,则执行步骤506。

[0148] 系统服务器提取接收到的通讯消息中的发送方信息后,可以从本地或客户端获取白名单列表,并判断提取到的发送方信息是否记录白名单列表中。

[0149] 步骤505,系统服务器识别接收到的通讯消息为正常消息。

[0150] 如果提取到的发送方信息记录在白名单列表中,则系统服务器判断接收到的通讯消息的发送方是可预期发送方,识别接收到的通讯消息为正常消息,并将该识别为正常消息的通讯消息转发给接收客户端。[0151] 接收客户端可以按照接收到的通讯消息进行相应的操作,不再对该通讯消息进行识别;也可以继续对该通讯消息进行识别。接收客户端的识别方法可以包括使用预设的关键词列表、正则表达式和垃圾消息识别选项中的至少一项进行识别。

[0152] 步骤506,系统服务器判断提取到的发送方信息是否记录在黑名单列表中。

[0153] 如果提取到的发送方信息记录在黑名单列表中,则执行步骤507 ;如果提取到的发送方信息没有记录在黑名单列表中,则执行步骤508。

[0154] 系统服务器提取接收到的通讯消息中的发送方信息后,可以从本 地或客户端获取黑名单列表,并判断提取到的发送方信息是否记录黑名单列表中。

[0155] 步骤507,系统服务器识别接收到的通讯消息为垃圾消息。

[0156] 如果提取到的发送方信息记录在黑名单列表中,则系统服务器识别接收到的通讯消息为垃圾消息,并将该识别为垃圾消息的通讯消息进行丢弃处理。

[0157] 步骤508,系统服务器使用预设的关键词列表,对接收到的通讯消息的消息内容进行匹配,并获取与消息内容匹配的关键词的分值。

[0158] 系统服务器对接收到的通讯消息提取消息内容,对照预设的关键词列表,查验该消息内容中是否包含关键词列表中相应的关键词,如果查验到该消息内容中包含相应的关键词,则判断该消息内容与预设的关键词列表匹配,并获取与该消息内容匹配的关键词的分值。与消息内容匹配的正则表达式为一个以上时,系统服务器可以获取所有与消息内容匹配的正则表达式的分值。

[0159] 系统服务器还可以对提取的消息内容进行格式转换,将消息内容转换为统一的格式,再进行查验,如全部转换为小写、半角格式,防止垃圾消息发送者对一些关键词进行大、小写或全角、半角变换来规避查验。

[0160] 步骤509,系统服务器使用预设的正则表达式,对接收到的通讯消息的消息内容进行匹配,并获取与消息内容匹配的正则表达式的分值。

[0161] 系统服务器可以通过特定的正则表达式,判断接收到的通讯消息的消息内容中是否包含特定的关键特征,如果该消息内容中包含该关键特征,则该消息内容与该关键特征对应的正则表达式匹配。

[0162] 正则表达式可以由用户个性化设定,也可以由系统服务器下发到各个客户端。每个正则表达式对应预设的分值,用于标示该正则表达式从消息内容中辨别的关键特征出现在垃圾消息中的可能性,不同关键词的分值可以相同或不同。与消息内容匹配的正则表达式为一个以上时,系统服务器可以获取所有与消息内容匹配的正则表达式的分值。

[0163] 需要说明的是,本步骤与步骤508的执行顺序没有先后之分,即系统服务器可以在使用预设的关键词列表,对接收到的通讯消息的消息内容进行匹配之前或之后,使用预设的正则表达式,对接收到的通讯消息的消息内容进行匹配。

[0164] 步骤510,系统服务器根据与消息内容匹配的关键词和正则表达式的分值,获取该消息内容的匹配总分值。

[0165] 系统服务器将所有与消息内容匹配的关键词的分值和正则表达式的分值相加,即可获取该消息内容的匹配总分值。

[0166] 步骤511,系统服务器判断消息内容的匹配总分值是否大于或等于预设的阈值。

[0167] 如果消息内容的匹配总分值大于或等于预设的阈值,则执行步骤507;如果消息内容的匹配总分值小于预设的阈值,则执行步骤505。

[0168] 上述阈值可以设置为固定值,也可以根据通讯消息的长度动态设置,即不同长度的通讯消息对应不同的阈值。

[0169] 需要说明的是,本申请实施例可以根据实际需要对各个步骤顺序进行调整。上述使用预设的关键词列表和预设的正则表达式识别垃圾消息的步骤,也可以在使用黑名单列表和白名单列表识别垃圾消息的步骤之前执行。

[0170] 本申请包括以下优点,由系统服务器根据设置的黑名单列表和白名单列表,以及预设的关键词列表和正则表达式进行垃圾消息的识别,降低了对垃圾消息的漏判率和误判 率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。

[0171] 如图6所示,为本申请实施例六中的一种垃圾消息的识别方法流程图,包括以下步骤:

[0172] 步骤601,发送客户端判断待发送的通讯消息的消息内容是否与预设的关键词列表匹配。

[0173] 如果待发送的通讯消息的消息内容与预设的关键词列表匹配,则执行步骤602;如果待发送的通讯消息的消息内容与预设的关键词列表不匹配,则执行步骤603。

[0174] 发送客户端对待发送的通讯消息提取消息内容,对照预设的关键词列表,查验该消息内容中是否包含关键词列表中相应的关键词,如果查验到该消息内容中包含相应的关键词,则该消息内容与预设的关键词列表匹配;如果查验到该消息内容中不包含相应的关键词,则该消息内容与预设的关键词列表不匹配。

[0175] 发送客户端还可以对提取的消息内容进行格式转换,将消息内容转换为统ー的格式,再进行查验,如全部转换为小写、半角格式,防止垃圾消息发送者对ー些关键词进行大、小写或全角、半角变换来规避查验。

[0176] 步骤602,发送客户端暂时识别待发送的通讯消息为垃圾消息。

[0177] 如果待发送的通讯消息的消息内容与预设的关键词列表匹配,即该消息内容中包含相应的关键词,则发送客户端暂时识别待发送的通讯消息为垃圾消息,并将该通讯消息发送到系统服务器,由系统服务器通过判断该通讯消息的发送方是否是可预期用户进行进ー步确认。

[0178] 做为步骤602的替代方案,如果待发送的通讯消息的消息内容与预设的关键词列表匹配,即该消息内容中包含相应的关键词,发送客户端可以直接识别待发送的通讯消息为垃圾消息,并对该通讯消息进行丢弃处理。

[0179] 步骤603,发送客户端将待发送的通讯消息发送给系统服务器。

[0180] 如果待发送的通讯消息的消息内容与预设的关键词列表不匹配,即该消息内容中不包含相应的关键词,则发送客户端将该待发送的通讯消息发送给系统服务器,由系统服务器继续判断该通讯消息是否为垃圾消息。

[0181] 步骤604,系统服务器判断接收到的通讯消息的消息内容是否符合预设的垃圾消息识别选项。

[0182] 如果接收到的通讯消息的消息内容符合预设的垃圾消息识别选项,则执行步骤606 ;如果接收到的通讯消息的消息内容不符合预设的垃圾消息识别选项,则执行步骤605。

[0183] 系统服务器接收到发送客户端发送的通讯消息后,可以提取接收到的通讯消息的消息内容,并判断提取到的消息内容是否符合预设的垃圾消息识别选项。

[0184] 步骤605,系统服务器暂时识别接收到的通讯消息为垃圾消息。

[0185] 如果接收到的通讯消息的消息内容不符合预设的垃圾消息识别选项,则系统服务器暂时识别接收到的通讯消息为垃圾消息,并将该通讯消息发送到接收客户端,由接收客户端通过判断该通讯消息的发送方是否是可预期用户进行进ー步确认。

[0186] 做为步骤605的替代方案,如果接收到 的通讯消息的消息内容不符合预设的垃圾消息识别选项,系统服务器可以直接识别接收到的通讯消息为垃圾消息,并对该垃圾消息做丢弃处理。

[0187] 步骤606,系统服务器将接收到的通讯消息转发给接收客户端。

[0188] 如果接收到的通讯消息的消息内容符合预设的垃圾消息识别选项,则系统服务器将该接收到的通讯消息转发给接收客户端,由接收客户端继续识别该通讯消息是否为垃圾消息。

[0189] 步骤607,接收客户端提取接收到的通讯消息中的发送方信息。

[0190] 接收客户端接收到系统服务器转发的通讯消息后,可以提取该通讯消息中的发送方信息,以进行垃圾消息的识别。发送方信息可以包括发送方名称、发送方ID和发送方地址等内容。

[0191] 步骤608,接收客户端根据提取的发送方信息,判断接收到的通讯消息的发送方是否为可预期发送方。

[0192] 如果接收到的通讯消息的发送方是可预期发送方,则执行步骤609 ;如果接收到的通讯消息的发送方不是可预期发送方,则执行步骤610。

[0193] 系统中的客户端也可以将自身的好友用户信息和自身主动联系过的非好友用户信息,周期性地或事件触发性地上传到系统服务器。系统服务器也可以将上述从客户端接收到的信息,周期性地或事件触发性地向系统中的其他客户端公布,供其他客户端进行垃圾消息的识别。

[0194] 步骤609,接收客户端识别接收到的通讯消息为正常消息。

[0195] 如果通讯消息的发送方是可预期发送方,接收客户端识别该通讯消息为正常消息,并按照该通讯消息进行相应的操作。

[0196] 步骤610,接收客户端识别接收到的通讯消息为垃圾消息。

[0197] 如果通讯消息的发送方不是可预期发送方,则接收客户端识别该通讯消息为垃圾消息,并对该通讯消息进行丢弃处理。

[0198] 需要说明的是,本申请实施例可以根据实际需要对各个步骤顺序进行调整。上述使用预设的垃圾消息识别选项识别垃圾消息的步骤,可以在使用预设的关键词列表识别垃圾消息的步骤之前执行。

[0199] 本申请包括以下优点,先后由发送客户端通过判断通讯消息的发送方是否为接收方的可预期用户、由系统服务器根据预设的关键词列表,以及由接收客户端根据垃圾消息识别选项进行垃圾消息的识别,降低了对垃圾消息的漏判率和误判率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。当然,实施本申请的任ー产品并不一定需要同时达到以上所述的所有优点。

[0200] 如图7所示,为本申请实施例七中的ー种通讯设备结构示意图,该通讯设备700,包括:

[0201] 提取模块701,用于提取通讯消息中的发送方信息。

[0202] 本申请实施例中的通讯消息可以为頂系统中的即时消息、SMS消息、丽S消息或E-maiI等,通讯消息本身可以包括发送时间、发送方信息、接收方信息和消息内容等部分。通讯消息由发送客户端发送,经系统服务器转发到接收客户端。其中,接收方信息包括接收方名称、接收方ID和接收方地址等内容,发送方信息可以包括发送方名称、发送方ID和发送方地址等内容。

[0203] 本申请实施例中的通讯设备为发送客户端时,提取模块701提取待发送的通讯消息中的发送方信息;通讯设备为系统服务器或接收客户端时,提取模块701提取接收到的通讯消息中的发送方信息。

[0204] 上述提取模块701是以上所述通讯设备700中负责提取通讯消息中的发送方信息的部分,可以是软件、硬件或两者的结合。

[0205] 第一判断模块702,用于根据提取模块701提取的发送方信息,判断通讯消息的发送方是否为可预期发送方。

[0206] 可预期发送方包括以下用户中的至少ー种:系统用户、通讯消息的接收方的好友用户和通讯消息的接收方主动联系过的非好友用户。

[0207] 第一判断模块702,还用于获取系统用户名单、通信消息的接收方的好友用户名单和通讯消息接收方主动联系过的非好友用户名单;如果通讯消息的发送方信息记录在系统用户名单、通信消息的接收方的好友用户名单和通讯消息接收方主动联系过的非好友用户名单的任ー项中,判断通讯消息的发送方是可预期发送方。

[0208] 其中,系统用户为发送通讯消息的第三方用户,可以包括通讯服务提供商。系统用户向接收方发送的消息通常以通知或提醒的形式出现,接收方可以将系统用户作为可预期发送方O

[0209] 通讯消息的接收方的好友用户在向接收方发送通讯消息之前,与接收方建立好友关系,并通过接收方的身份认证,接收方可以将自身的好友用户作为可预期发送方。

[0210] 通讯消息的接收方主动联系过的非好友用户在向接收方发送通讯消息之前,未与接收方建立好友关系,但曾接收到该接收方发送的消息。系统中的客户端也可以周期性地或事件触发性地将自身的好友用户信息和自身主动联系过的非好友用户信息上传到系统服务器,供系统服务器识别垃圾消息。

[0211] 上述第一判断模块702是以上所述通讯设备700中负责根据提取的发送方信息,判断通讯消息的发送方是否为可预期发送方的部分,可以是软件、硬件或两者的结合。

[0212] 识别模块703,用于在第一判断模块702判断通讯消息的发送方不是可预期发送方时,识别该通讯消息为垃圾消息,或继续对该通讯消息进行识别。

[0213] 识别模块703可以在通讯消息的发送方不是可预期发送方吋,识别该通讯消息为垃圾消息,对该通讯消息进行丢弃处理,并将该通讯消息的发送方加入到黑名单;也可以继续对该通讯消息进行识别,识别方法可以包括使用预设的关键词列表、预设的正则表达式和预设的垃圾消息识别选项中的至少ー项进行识别。[0214] 上述识别模块703是以上所述通讯设备700中负责在通讯消息的发送方不是可预期发送方时,识别该通讯消息为垃圾消息,或继续对该通讯消息进行识别的部分,可以是软件、硬件或两者的结合。

[0215] 上述通讯设备700,还包括:

[0216] 更新模块704,用于根据发送的通讯消息中的接收方信息,更新可预期发送方信

O

[0217] 更新模块704可以确定发送的通讯消息的接收方的属性,并在该通讯消息的接收方不是可预期发送方时,将该通讯消息的接收方信息添加到可预期发送方信息中。

[0218] 具体地,更新模块704可以将该通讯消息的接收方设置为主动联系过的非好友用户,并记录该通讯消息的接收方信息,该接收方信息包括:接收方名称、接收方ID、接收方地址和最新联系时间等内容。其中,最新联系时间为客户端向该接收方发送通讯消息的时 间。

[0219] 上述更新模块704是以上所述通讯设备700中负责根据发送的通讯消息中的接收方信息,更新可预期发送方信息的部分,可以是软件、硬件或两者的结合。

[0220] 设置模块705,用于设置黑名单列表和/或白名单列表,该黑名单列表中包括被识别出的垃圾消息的发送方信息,该白名单列表中包括被识别出的正常消息的发送方信息。

[0221] 设置模块705可以将被识别出的垃圾消息的发送方信息添加到黑名单列表中,还可以将被识别出的正常消息的发送方信息添加到白名单列表中。黑名单列表中的发送方信息包括垃圾消息发送方的名称、ID和地址等内容,白名单列表中的发送方信息包括正常消息发送方的名称、ID和地址等内容。

[0222] 上述设置模块705是以上所述通讯设备700中负责设置黑名单列表和/或白名单列表的部分,可以是软件、硬件或两者的结合。

[0223] 上述第一判断模块702,还用于在通讯消息的发送方信息记录在黑名单列表中吋,判断通讯消息的发送方不是可预期发送方;和/或

[0224] 在通讯消息的发送方信息记录在白名单列表中时,判断通讯消息的发送方是可预期发送方。

[0225] 上述通讯设备700,还包括:

[0226] 第二判断模块706,用于判断通讯消息的消息内容是否与预设的关键词列表匹配。

[0227] 关键词列表可以包含各种用于宣传广告信息、恶意传播流言信息和不文明信息的垃圾消息中常用的关键词,例如,“服装大甩卖”、“转让门面店”、“中奖”、“请汇款”等用词,还可以包含ー些常用的英文广告词、英文不文明用语等。关键词列表可以由用户个性化设定,也可以由系统服务器下发到各个客户端。

[0228] 第二判断模块706将通讯消息中的消息内容,对照预设的关键词列表,查验该消息内容中是否包含关键词列表中相应的关键词,如果查验到该消息内容中包含相应的关键词,则判断该消息内容与预设的关键词列表匹配;如果查验到该消息内容中不包含相应的关键词,则判断该消息内容与预设的关键词列表不匹配。

[0229] 第二判断模块706还可以对提取的消息内容进行格式转换,将消息内容转换为统一的格式,再进行查验,如全部转换为小写、半角格式,防止垃圾消息发送者对ー些关键词进行大、小写或全角、半角变换来规避查验。[0230] 上述第二判断模块706是以上所述通讯设备700中负责判断通讯消息的消息内容是否与预设的关键词列表匹配的部分,可以是软件、硬件或两者的结合。

[0231] 上述识别模块703,还用于在第二判断模块706判断通讯消息的消息内容与预设的关键词列表匹配时,识别该通讯消息为垃圾消息。

[0232] 上述通讯设备700,还包括:

[0233] 第三判断模块707,用于判断通讯消息的消息内容是否符合预设的垃圾消息识别选项。

[0234] 预设的垃圾消息识别选项可以包括以下内容中的至少ー项:a、不允许出现电话号码山、不允许出现网络链接;c、不允许出现IM号码;d、不允许出现图片。用户可以根据自 身的需求,个性化设定上述垃圾消息识别选项。

[0235] 上述第三判断模块707是以上所述通讯设备700中负责判断通讯消息的消息内容是否符合预设的垃圾消息识别选项的部分,可以是软件、硬件或两者的结合。

[0236] 上述识别模块703,还用于在第三判断模块707判断通讯消息的消息内容不符合预设的垃圾消息识别选项时,识别该通讯消息为垃圾消息。

[0237] 上述通讯设备700,还包括:

[0238] 第一匹配模块708,用于使用预设的关键词列表,对通讯消息的消息内容进行匹配,获取与该消息内容匹配的关键词的分值。

[0239] 关键词列表用于判断通讯消息中是否包含垃圾消息的特征词语,可以由用户个性化设定,也可以由系统服务器下发到各个客户端。每个关键词对应预设的分值,用于标示该关键词出现在垃圾消息中的可能性,不同关键词的分值可以相同或不同。

[0240] 上述第一匹配模块708是以上所述通讯设备700中负责使用预设的关键词列表,对通讯消息的消息内容进行匹配,获取与该消息内容匹配的关键词的分值的部分,可以是软件、硬件或两者的结合。

[0241] 第二匹配模块709,用于使用预设的正则表达式,对通讯消息的消息内容进行匹配,获取与该消息内容匹配的正则表达式的分值。

[0242] 正则表达式用于从消息内容中辨别某些关键特征,比如电话号码、网络链接或IM号码等。不同的正则表达式对应不同的关键特征,第二匹配模块709可以通过特定的正则表达式,判断接收到的通讯消息的消息内容中是否包含特定的关键特征,如果该消息内容中包含该关键特征,则该消息内容与该关键特征对应的正则表达式匹配。

[0243] 正则表达式可以由用户个性化设定,也可以由系统服务器下发到各个客户端。每个正则表达式对应预设的分值,用于标示该正则表达式从消息内容中辨别的关键特征出现在垃圾消息中的可能性,不同关键词的分值可以相同或不同。与消息内容匹配的正则表达式为ー个以上时,第二匹配模块709可以获取所有与消息内容匹配的正则表达式的分值。

[0244] 上述第二匹配模块709是以上所述通讯设备700中负责使用预设的正则表达式,对通讯消息的消息内容进行匹配,获取与该消息内容匹配的正则表达式的分值的部分,可以是软件、硬件或两者的结合。

[0245] 获取模块710,用于根据第一匹配模块708和第二匹配模块709获取的与消息内容匹配的关键词和正则表达式的分值,获取该消息内容的匹配总分值。

[0246] 获取模块710将所有与消息内容匹配的关键词的分值和正则表达式的分值相加,即可获取该消息内容的匹配总分值。

[0247] 上述获取模块710是以上所述通讯设备700中负责根据与消息内容匹配的关键词和正则表达式的分值,获取该消息内容的匹配总分值的部分,可以是软件、硬件或两者的结

ロ ο

[0248] 第四判断模块711,用于判断获取模块710获取的消息内容的匹配总分值是否大于或等于预设的阈值。

[0249] 上述阈值可以设置为固定值,也可以根据通讯消息的长度动态设置,即不同长度的通讯消息对应不同的阈值。

[0250] 上述第四判断模块711是以上所述通讯设备700中负责判断消息内容的匹配总分值是否大于或等于预设的阈值的部分,可以是软件、硬件或两者的结合。

[0251] 上述识别模块703,还用于在第四判断模块711判断消息内容的匹配总分值大于或等于预设的阈值时,识别该通讯消息为垃圾消息。

[0252] 上述模块可以分布于ー个装置,也可以分布于多个装置。上述模块可以合并为ー个模块,也可以进ー步拆分成多个子模块。

[0253] 本申请包括以下优点,通过判断通讯消息的发送方是否为可预期用户,进行垃圾消息的识别,降低了对垃圾消息的漏判率和误判率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。当然,实施本申请的任ー产品并不一定需要同时达到以上所述的所有优点。

[0254] 如图8所示,为本申请实施例八中的一种通讯系统结构示意图,包括:

[0255] 第一通讯设备810,用于提取通讯消息中的发送方信息,根据提取的发送方信息,判断通讯消息的发送方是否为可预期发送方,在该通讯消息的发送方不是可预期发送方时,将该通讯消息标记为待识别消息,通过网络向第二通讯设备820转发标记后的通讯消

ο

[0256] 通讯消息中的发送方信息可以包括发送方名称、发送方ID和发送方地址等内容,可预期发送方包括以下用户中的至少ー种:系统用户、通讯消息的接收方的好友用户和通讯消息的接收方主动联系过的非好友用户。

[0257] 第二通讯设备820,用于根据以下内容中的至少ー项,对接收到的来自第一通讯设备810的通讯消息进行识别:

[0258] 预设的关键词列表、预设的正则表达式和预设的垃圾消息识别选项。

[0259] 关键词列表可以包含各种用于宣传广告信息、恶意传播流言信息和不文明信息的垃圾消息中常用的关键词,可以由用户个性化设定,也可以由系统服务器下发到各个客户端。

[0260] 正则表达式用于从消息内容中辨别某些关键特征,比如电话号码、网络链接或IM号码等。不同的正则表达式对应不同的关键特征,可以通过特定的正则表达式,判断接收到的通讯消息的消息内容中是否包含特定的关键特征,如果该消息内容中包含该关键特征,则该消息内容与该关键特征对应的正则表达式匹配。正则表达式可以由用户个性化设定,也可以由系统服务器下发到各个客户端。每个正则表达式对应预设的分值,用于标示该正则表达式从消息内容中辨别的关键特征出现在垃圾消息中的可能性,不同关键词的分值可以相同或不同。与消息内容匹配的正则表达式为ー个以上时,接收客户端可以获取所有与、消息内容匹配的正则表达式的分值。

[0261] 预设的垃圾消息识别选项可以包括以下内容中的至少ー项:a、不允许出现电话号码山、不允许出现网络链接;c、不允许出现IM号码;d、不允许出现图片。用户可以根据自身的需求,个性化设定上述垃圾消息识别选项。

[0262] 上述第一通讯设备810,还用于在通讯消息的发送方是可预期发送方时,将该通讯消息标记为正常消息,通过网络向该第二通讯设备转发标记后的通讯消息。

[0263] 上述第一通讯设备810、第二通讯设备820可以分别为发送客户端和系统服务器,也可以分别为系统服务器和接收客户端。

[0264] 上述第二通讯设备820,还用于将识别后的通讯消息标记为待识别消息,通过网络向第三通讯设备830转发标记后的通讯消息。 [0265] 上述通讯系统,还包括:

[0266] 第三通讯设备830,用于对接收到的来自第二通讯设备820的通讯消息采用预设的关键词列表、预设的正则表达式和预设的垃圾消息识别选项中的至少ー种进行识别。

[0267] 上述第一通讯设备810、第二通讯设备820和第三通讯设备830,可以分别为发送客户端、系统服务器和接收客户端。

[0268] 本申请包括以下优点,通过判断通讯消息的发送方是否为可预期用户,进行垃圾消息的识别,降低了对垃圾消息的漏判率和误判率,提高了识别垃圾消息的准确率,进而增强了信息过滤的效果。当然,实施本申请的任ー产品并不一定需要同时达到以上所述的所有优点。

[0269] 为了描述的方便,以上所述通讯设备的各部分以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件或硬件中实现。

[0270] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是⑶-R0M,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。

[0271] 本领域技术人员可以理解附图只是ー个优选实施例的示意图,附图中的模块或流程并不一定是实施本申请所必须的。

[0272] 本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的ー个或多个装置中。上述实施例的模块可以合并为ー个模块,也可以进ー步拆分成多个子模块。

[0273] 上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

[0274] 以上公开的仅为本申请的几个具体实施例,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (24)

1. 一种垃圾消息的识别方法,其特征在于,包括: 提取通讯消息中的发送方信息; 根据所述提取的发送方信息,判断所述通讯消息的发送方是否为可预期发送方,所述判断通讯消息的发送方是否为可预期发送方,包括: 设置黑名单列表和/或白名单列表,所述黑名单列表中包括被识别出的垃圾消息的发送方信息,所述白名单列表中包括被识别出的正常消息的发送方信息; 如果所述通讯消息的发送方信息记录在所述黑名单列表中,则判断所述通讯消息的发送方不是可预期发送方;和/或 如果所述通讯消息的发送方信息记录在所述白名单列表中,则判断所述通讯消息的发送方是可预期发送方; 如果所述通讯消息的发送方不是所述可预期发送方,则识别所述通讯消息为垃圾消息,或继续对所述通讯消息进行识别; 所述继续对通讯消息进行识别,包括: 使用预设的关键词列表,对所述通讯消息的消息内容进行匹配,获取与所述消息内容匹配的关键词的分值; 使用预设的正则表达式,对所述通讯消息的消息内容进行匹配,获取与所述消息内容匹配的正则表达式的分值; 根据与所述消息内容匹配的关键词和正则表达式的分值,获取所述消息内容的匹配总分值; 判断所述消息内容的匹配总分值是否大于或等于预设的阈值; 如果所述消息内容的匹配总分值大于或等于所述预设的阈值,则识别所述通讯消息为垃圾消息。
2.如权利要求I所述的方法,其特征在于,所述判断通讯消息的发送方是否为可预期发送方之后,还包括: 如果所述通讯消息的发送方是所述可预期发送方,则识别所述通讯消息为正常消息。
3.如权利要求I或2所述的方法,其特征在干, 所述可预期发送方,包括以下用户中的至少ー种: 系统用户、所述通讯消息的接收方的好友用户和所述通讯消息的接收方主动联系过的非好友用户。
4.如权利要求3所述的方法,其特征在于,所述判断通讯消息的发送方是否为可预期发送方,包括: 获取系统用户名单、所述通讯消息的接收方的好友用户名单和所述通讯消息接收方主动联系过的非好友用户名单; 如果所述通讯消息的发送方信息记录在所述系统用户名单、所述通讯消息的接收方的好友用户名单和所述通讯消息接收方主动联系过的非好友用户名单的任ー项中,则判断所述通讯消息的发送方是可预期发送方。
5.如权利要求3所述的方法,其特征在干, 所述通讯消息的接收方主动联系过的非好友用户,包括所述通讯消息的接收方在设定时间内主动联系过的非好友用户。
6.如权利要求3所述的方法,其特征在于,还包括: 根据自身发送的通讯消息中的接收方信息,更新自身的可预期发送方信息。
7.如权利要求I所述的方法,其特征在于,所述继续对通讯消息进行识别,还包括: 判断所述通讯消息的消息内容是否与预设的关键词列表匹配; 如果所述通讯消息的消息内容与所述预设的关键词列表匹配,则识别所述通讯消息为垃圾消息。
8.如权利要求I所述的方法,其特征在于,所述提取通讯消息中的发送方信息之前,还包括: 判断所述通讯消息的消息内容是否与预设的关键词列表匹配; 如果所述通讯消息的消息内容与所述预设的关键词列表匹配,则暂时识别所述通讯消息为垃圾消息,或直接识别所述通讯消息为垃圾消息。
9.如权利要求7或8所述的方法,其特征在于,所述使用预设的关键词列表,对所述通讯消息的消息内容进行匹配之后,还包括: 如果所述通讯消息的消息内容与所述预设的关键词列表不匹配,则识别所述通讯消息为正常消息,或继续对所述通讯消息进行识别。
10.如权利要求I所述的方法,其特征在于,所述继续对通讯消息进行识别,还包括: 判断所述通讯消息的消息内容是否符合预设的垃圾消息识别选项; 如果所述通讯消息的消息内容不符合预设的垃圾消息识别选项,则识别所述通讯消息为垃圾消息。
11.如权利要求I所述的方法,其特征在于,所述提取通讯消息中的发送方信息之前,还包括: 判断所述通讯消息的消息内容是否符合预设的垃圾消息识别选项; 如果所述通讯消息的消息内容不符合预设的垃圾消息识别选项,则暂时识别所述通讯消息为垃圾消息,或直接识别所述通讯消息为垃圾消息。
12.如权利要求10或11所述的方法,其特征在于,所述垃圾消息识别选项,包括以下内容中的至少ー项: 不允许出现电话号码、不允许出现网络链接、不允许出现頂即时通讯号码和不允许出现图片。
13.如权利要求10或11所述的方法,其特征在于,所述判断通讯消息的消息内容是否符合预设的垃圾消息识别选项之后,还包括: 如果所述通讯消息的消息内容符合预设的垃圾消息识别选项,则识别所述通讯消息为正常消息,或继续对所述通讯消息进行识别。
14.如权利要求I所述的方法,其特征在于,所述提取通讯消息中的发送方信息之前,还包括: 使用预设的关键词列表,对所述通讯消息的消息内容进行匹配,获取与所述消息内容匹配的关键词的分值; 使用预设的正则表达式,对所述通讯消息的消息内容进行匹配,获取与所述消息内容匹配的正则表达式的分值; 根据与所述消息内容匹配的关键词和正则表达式的分值,获取所述消息内容的匹配总分值; 判断所述消息内容的匹配总分值是否大于或等于预设的阈值; 如果所述消息内容的匹配总分值大于或等于所述预设的阈值,则暂时识别所述通讯消息为垃圾消息,或直接识别所述通讯消息为垃圾消息。
15.如权利要求I或14所述的方法,其特征在于,所述判断消息内容的匹配总分值是否大于或等于预设的阈值之后,还包括: 如果所述消息内容的匹配总分值小于所述预设的阈值,则识别所述通讯消息为正常消息,或继续对所述通讯消息进行识别。
16. ー种通讯设备,其特征在于,包括: 提取模块,用于提取通讯消息中的发送方信息; 第一判断模块,用于根据所述提取模块提取的发送方信息,判断所述通讯消息的发送方是否为可预期发送方; 识别模块,用于在所述第一判断模块判断所述通讯消息的发送方不是所述可预期发送方吋,识别所述通讯消息为垃圾消息,或继续对所述通讯消息进行识别; 第一匹配模块,用于使用预设的关键词列表,对所述通讯消息的消息内容进行匹配,获取与所述消息内容匹配的关键词的分值; 第二匹配模块,用于使用预设的正则表达式,对所述通讯消息的消息内容进行匹配,获取与所述消息内容匹配的正则表达式的分值; 获取模块,用于根据所述第一匹配模块和所述第二匹配模块获取的与所述消息内容匹配的关键词和正则表达式的分值,获取所述消息内容的匹配总分值; 第四判断模块,用于判断所述获取模块获取的所述消息内容的匹配总分值是否大于或等于预设的阈值; 所述识别模块,还用于在所述第四判断模块判断所述消息内容的匹配总分值大于或等于所述预设的阈值时,识别所述通讯消息为垃圾消息。
17.如权利要求16所述的通讯设备,其特征在于,所述第一判断模块,还用于获取系统用户名单、所述通讯消息的接收方的好友用户名单和所述通讯消息接收方主动联系过的非好友用户名单; 如果所述通讯消息的发送方信息记录在所述系统用户名单、所述通讯消息的接收方的好友用户名单和所述通讯消息接收方主动联系过的非好友用户名单的任ー项中,判断所述通讯消息的发送方是可预期发送方。
18.如权利要求16所述的通讯设备,其特征在于,还包括: 更新模块,用于根据发送的通讯消息中的接收方信息,更新可预期发送方信息。
19.如权利要求16所述的通讯设备,其特征在于,还包括: 设置模块,用于设置黑名单列表和/或白名单列表,所述黑名单列表中包括被识别出的垃圾消息的发送方信息,所述白名单列表中包括被识别出的正常消息的发送方信息;所述第一判断模块,还用于在所述通讯消息的发送方信息记录在所述黑名单列表中时,判断所述通讯消息的发送方不是可预期发送方;和/或 在所述通讯消息的发送方信息记录在所述白名单列表中时,判断所述通讯消息的发送方是可预期发送方。
20.如权利要求16所述的通讯设备,其特征在于,还包括: 第二判断模块,用于判断所述通讯消息的消息内容是否与预设的关键词列表匹配; 所述识别模块,还用于在所述第二判断模块判断所述通讯消息的消息内容与所述预设的关键词列表匹配时,识别所述通讯消息为垃圾消息。
21.如权利要求16所述的通讯设备,其特征在于,还包括: 第三判断模块,用于判断所述通讯消息的消息内容是否符合预设的垃圾消息识别选项; 所述识别模块,还用于在所述第三判断模块判断所述通讯消息的消息内容不符合预设的垃圾消息识别选项时,识别所述通讯消息为垃圾消息。
22. —种通讯系统,其特征在于,包括: 第一通讯设备,用于提取通讯消息中的发送方信息,根据所述提取的发送方信息,判断所述通讯消息的发送方是否为可预期发送方,在所述通讯消息的发送方不是所述可预期发送方时,将所述通讯消息标记为待识别消息,向第二通讯设备转发标记后的通讯消息; 第二通讯设备,用于根据以下内容中的至少ー项,对接收到的来自所述第一通讯设备的通讯消息进行识别: 预设的关键词列表、预设的正则表达式和预设的垃圾消息识别选项。
23.如权利要求22所述的通讯系统,其特征在干, 所述第一通讯设备,还用于在所述通讯消息的发送方是所述可预期发送方吋,将所述通讯消息标记为正常消息,向所述第二通讯设备转发标记后的通讯消息。
24.如权利要求22所述的通讯系统,其特征在于,还包括: 第三通讯设备,用于对接收到的来自所述第二通讯设备的通讯消息采用预设的关键词列表、预设的正则表达式和预设的垃圾消息识别选项中的至少ー种进行识别; 所述第二通讯设备,还用于将识别后的所述通讯消息标记为待识别消息,向所述第三通讯设备转发标记后的通讯消息。
CN 200910131229 2009-04-10 2009-04-10 一种垃圾消息的识别方法、装置和系统 CN101534261B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200910131229 CN101534261B (zh) 2009-04-10 2009-04-10 一种垃圾消息的识别方法、装置和系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN 200910131229 CN101534261B (zh) 2009-04-10 2009-04-10 一种垃圾消息的识别方法、装置和系统
HK10102494.5A HK1134607A1 (en) 2009-04-10 2010-03-10 Method for recognizing junk message, apparatus and system thereof

Publications (2)

Publication Number Publication Date
CN101534261A CN101534261A (zh) 2009-09-16
CN101534261B true CN101534261B (zh) 2012-09-19

Family

ID=41104655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200910131229 CN101534261B (zh) 2009-04-10 2009-04-10 一种垃圾消息的识别方法、装置和系统

Country Status (2)

Country Link
CN (1) CN101534261B (zh)
HK (1) HK1134607A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102404127B (zh) * 2010-09-08 2014-06-11 腾讯科技(深圳)有限公司 新消息提醒的方法及装置
CN102594716B (zh) * 2011-01-17 2016-05-11 阿里巴巴集团控股有限公司 一种即时通信消息的传输方法、系统及设备
CN102316458B (zh) * 2011-09-15 2014-11-05 秦政 一种可疑垃圾短信判别的方法
CN103139155B (zh) * 2011-11-28 2016-09-28 阿里巴巴集团控股有限公司 举报信息的处理方法、设备及系统
CN102801859B (zh) * 2012-08-03 2014-05-07 陈伟 垃圾短信的识别方法、装置和具有该装置的移动通信终端
CN103793398B (zh) * 2012-10-30 2018-09-04 腾讯科技(深圳)有限公司 检测垃圾数据的方法和装置
CN103929350B (zh) 2013-01-16 2018-05-22 阿里巴巴集团控股有限公司 一种信息推送的方法、设备和系统
CN104239369A (zh) * 2013-06-24 2014-12-24 腾讯科技(深圳)有限公司 一种过滤网页广告的方法、装置和系统
CN104468945B (zh) * 2013-09-16 2017-08-29 联想(北京)有限公司 一种信息处理方法、装置及电子设备
CN103686642B (zh) * 2013-12-24 2017-01-25 中国联合网络通信集团有限公司 短消息发送方法及装置
CN104768138A (zh) * 2014-01-06 2015-07-08 刘丽萍 垃圾短信处理的方法和系统
CN105430623A (zh) * 2014-09-10 2016-03-23 中兴通讯股份有限公司 Rcs垃圾消息的监控方法、装置及系统
CN104243284B (zh) * 2014-09-19 2018-04-24 王淦坤 一种网络信息的传输方法及系统
CN104506382A (zh) * 2014-12-17 2015-04-08 百度在线网络技术(北京)有限公司 消息监控方法及系统
CN105119774B (zh) * 2015-07-30 2018-02-23 北京奇虎科技有限公司 骚扰信息识别方法、装置以及系统
CN106713254B (zh) * 2015-11-18 2019-08-06 中国科学院声学研究所 一种匹配正则集的生成及深度包检测方法
CN106921556A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 一种聊天信息的处理方法和服务器
CN106332028A (zh) * 2016-09-29 2017-01-11 努比亚技术有限公司 一种识别欺诈短信的方法及装置
CN106528680A (zh) * 2016-10-25 2017-03-22 智者四海(北京)技术有限公司 一种垃圾信息识别方法及装置
CN107256250A (zh) * 2017-06-08 2017-10-17 福建中金在线信息科技有限公司 一种图片处理方法、装置、服务器及存储介质
CN107819668A (zh) * 2017-10-17 2018-03-20 链家网(北京)科技有限公司 一种即时通信im防灌水方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101005648A (zh) 2007-01-16 2007-07-25 华为技术有限公司 短消息业务中心及发送短消息的方法
CN101222718A (zh) 2008-01-25 2008-07-16 中兴通讯股份有限公司 一种可拦截垃圾短消息的移动通信终端及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101005648A (zh) 2007-01-16 2007-07-25 华为技术有限公司 短消息业务中心及发送短消息的方法
CN101222718A (zh) 2008-01-25 2008-07-16 中兴通讯股份有限公司 一种可拦截垃圾短消息的移动通信终端及方法

Also Published As

Publication number Publication date
CN101534261A (zh) 2009-09-16
HK1134607A1 (en) 2013-02-15

Similar Documents

Publication Publication Date Title
EP1484893B1 (en) Origination/destination features and lists for spam prevention
US9288078B2 (en) Apparatus and methods for managing content exchange on a wireless device
EP1628448B1 (en) Spam filtering for mobile communication devices
CN101567889B (zh) 用于为网络提供漏洞利用保护的系统与方法
US20050108335A1 (en) Selective transmission of an email attachment
JP2008538636A (ja) 送信者を識別するシステムおよび方法
Oikarinen et al. Internet relay chat protocol
US8315178B2 (en) Method and system for wireless message-based advertising
JP4213667B2 (ja) マルチメディアメッセージをアーカイブする方法
JP2006178995A (ja) 迷惑メッセージの検出
US7103599B2 (en) Parsing of nested internet electronic mail documents
US9501746B2 (en) Systems and methods for electronic message analysis
US20050160144A1 (en) System and method for filtering network messages
EP1767010B1 (en) Method, system, and computer program products for content-based screening of MMS messages
US8271603B2 (en) Diminishing false positive classifications of unsolicited electronic-mail
US20050251848A1 (en) Multimedia message delivery optimisation
US20060026242A1 (en) Messaging spam detection
EP1376420A1 (en) Method and system for classifying electronic documents
CN1918865B (zh) 生成和处理可任意处理的电子邮件地址的方法和系统
US9800680B2 (en) File transfer system, device and method
EP1946503B1 (en) Messaging system
US7986964B2 (en) System and method for providing SMS2PSTN united messaging service using SMS/MMS gateway
KR20050000309A (ko) 개선된 스팸 검출 기술
JP4916316B2 (ja) 電子的通信のurlベース選別のための方法及びシステム
WO2005010692A2 (en) System and method for identifying and filtering junk e-mail messages or spam based on url content

Legal Events

Date Code Title Description
C06 Publication
C10 Request of examination as to substance
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1134607

Country of ref document: HK

C14 Granted
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1134607

Country of ref document: HK