CN105898722B - 一种非正常短信息的鉴别方法、装置和电子设备 - Google Patents

一种非正常短信息的鉴别方法、装置和电子设备 Download PDF

Info

Publication number
CN105898722B
CN105898722B CN201610202078.0A CN201610202078A CN105898722B CN 105898722 B CN105898722 B CN 105898722B CN 201610202078 A CN201610202078 A CN 201610202078A CN 105898722 B CN105898722 B CN 105898722B
Authority
CN
China
Prior art keywords
short message
distribution characteristics
default
bit distribution
improper
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610202078.0A
Other languages
English (en)
Other versions
CN105898722A (zh
Inventor
杨大业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201610202078.0A priority Critical patent/CN105898722B/zh
Publication of CN105898722A publication Critical patent/CN105898722A/zh
Priority to US15/474,655 priority patent/US10231129B2/en
Application granted granted Critical
Publication of CN105898722B publication Critical patent/CN105898722B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • H04W4/14Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • H04W12/128Anti-malware arrangements, e.g. protection against SMS fraud or mobile malware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/18Comparators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42382Text-based messaging services in telephone networks such as PSTN/ISDN, e.g. User-to-User Signalling or Short Message Service for fixed networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)
  • Technology Law (AREA)

Abstract

本申请公开一种非正常短信息的鉴别方法、装置和电子设备,所述方法包括:获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;并提取目标短信息的第三预设进制八位元分布特征;在此基础上,依据所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别目标短信息是否为非正常短信息。可见,本申请提供了一种基于短信息的预设进制八位元分布特征鉴别短信息的方案,在利用该方案进行短信息鉴别时不存在鉴别盲区,可有效提升非正常短信息的鉴别准确率。

Description

一种非正常短信息的鉴别方法、装置和电子设备
技术领域
本发明属于短信息服务技术领域,尤其涉及一种非正常短信息的鉴别方法、装置和电子设备。
背景技术
短信息服务是移动通信服务的重要组成部分,目前,由于通信诈骗的不断渗透以及监管漏洞的存在,垃圾短信、诈骗短信等非正常短信息日渐猖獗,为用户的短信息服务体验带来了困扰。
目前,一般通过短信息的发送方号码来鉴别短信息正常与否,具体地,例如,根据用户对短信息源手机号码的举报情况,将举报次数超过一定阈值的手机号码列为不被信任的黑名单号码,从而在用户收到来自所述黑名单号码的短信息时,将该信息鉴别为非正常信息并提醒用户。此种方式在举报前期(举报量未达设定阈值)或不法用户更换手机号码等情况下,无法对垃圾短信、诈骗短信等非正常短信息进行有效鉴别,从而导致非正常短信息的鉴别存在盲区,进而影响非正常短信息的鉴别准确率。
发明内容
有鉴于此,本发明的目的在于提供一种非正常短信息的鉴别方法、装置和电子设备,旨在克服现有技术的非正常短信息鉴别方法因存在盲区,而导致的鉴别准确率较低的问题。
为此,本发明公开如下技术方案:
一种非正常短信息的鉴别方法,包括:
获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;
提取目标短信息的第三预设进制八位元分布特征;
基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息。
上述方法,优选的,所述获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征包括:
获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
上述方法,优选的,所述基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息包括:
利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
计算所述第二匹配率与所述第一匹配率的比值;
如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
上述方法,优选的,短信息的所述八位元分布特征包括:短信息的预设进制序列中任意两个八位元之间的一阶相关概率。
上述方法,优选的,所述预设进制为十六进制。
上述方法,优选的,所述正常短信息鉴别模型和所述非正常短信息鉴别模型为一阶离散时间马科夫模型。
一种非正常短信息的鉴别装置,包括:
获取模块,用于获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;
提取模块,用于提取目标短信息的第三预设进制八位元分布特征;
鉴别模块,用于基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息。
上述装置,优选的,所述获取模块包括:
第一获取单元,用于获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
第二获取单元,用于获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
上述装置,优选的,所述鉴别模块包括:
第一计算单元,用于利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
第二计算单元,用于利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
第三计算单元,用于计算所述第二匹配率与所述第一匹配率的比值;
鉴别单元,用于如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
一种电子设备,包括如上所述的非正常短信息的鉴别装置。
由以上方案可知,本申请公开的非正常短信息的鉴别方法包括:获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;并提取目标短信息的第三预设进制八位元分布特征;在此基础上,依据所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别目标短信息是否为非正常短信息。可见,本申请提供了一种基于短信息的预设进制八位元分布特征鉴别短信息的方案,在利用该方案进行短信息鉴别时不存在鉴别盲区,可有效提升非正常短信息的鉴别准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本申请提供的一种非正常短信息的鉴别方法实施例一的流程图;
图2是本申请提供的一种非正常短信息的鉴别方法实施例二的流程图;
图3是本申请实施例二提供的鉴别模型训练以及基于训练出的鉴别模型进行短信息鉴别的处理过程示意图;
图4是本申请提供的一种非正常短信息的鉴别装置实施例三的结构示意图;
图5是本申请提供的一种非正常短信息的鉴别装置实施例四的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
参考图1,图1是本申请提供的一种非正常短信息的鉴别方法实施例一的流程图,所述方法可应用于电子设备,所述电子设备可以是智能手机、平板电脑等终端设备,如图1所示,所述方法可以包括以下步骤:
S101:获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征。
其中,所述预设进制可以是二进制或十六进制等进制形式,本实施例中所述预设进制具体选用十六进制。
任意一条短信息均对应一相应的十六进制八位元序列,本实施例中短信息的十六进制八位元分布特征包括:短信息的十六进制序列中任意两个八位元之间的一阶相关概率,具体可以表示为以下的式(1):
其中,t(k,l)表示八位元k与八位元l的一阶相关概率,k,l∈[0,255],且k,l为整数。
一般来说,在不同的短信息内容对应的不同十六进制八位元序列中,不同短信息的八位元一阶相关关系会存在概率分布上的差异,而正常短信息与垃圾短信、诈骗短信等非正常短信息往往由于在内容特征上具有鲜明不同,从而当表现在十六进制八位元序列中时,正常短信息、非正常短信息的八位元一阶相关概率也往往会存在显著差异,从而正常短信息与非正常短信息分别具有不同的十六进制八位元分布特征。对于式(1)中的T来说,正常短信息、非正常短信息的八位元一阶相关概率分别对应式(1)中所述T的不同取值:T1、T2
基于此,本申请依据短信息的十六进制八位元分布特征来对短信息的正常与否进行鉴别,鉴别过程的实施需要以正常短信息及非正常短信息的十六进制八位元分布特征为参考依据,因此,当需要对目标短信息进行鉴别时,需首先获取正常短信息的第一十六进制八位元分布特征及非正常短信息的第二十六进制八位元分布特征。
S102:提取目标短信息的第三预设进制八位元分布特征。
其中,可通过计算目标短信息的十六进制八位元序列中,任意两个八位元之间的一阶相关概率,来得到目标短信息的第三十六进制八位元分布特征,具体可表示为式(1)中所述T的一相应取值T3
S103:基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息。
在以上处理的基础上,本步骤继续将目标短信息的第三十六进制八位元分布特征(T3),分别与正常短信息的第一十六进制八位元分布特征(T1)及非正常短信息的第二十六进制八位元分布特征(T2)进行比对,并基于比对结果对目标短信息的正常与否进行鉴别。
由以上方案可知,本申请公开的非正常短信息的鉴别方法包括:获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;并提取目标短信息的第三预设进制八位元分布特征;在此基础上,依据所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别目标短信息是否为非正常短信息。可见,本申请提供了一种基于短信息的预设进制八位元分布特征鉴别短信息的方案,在利用该方案进行短信息鉴别时不存在鉴别盲区,可有效提升非正常短信息的鉴别准确率。
实施例二
参考图2,图2是本申请提供的一种非正常短信息的鉴别方法实施例二的流程图,本实施例中,所述步骤S101可以通过以下的步骤S201及S202实现:
S201:获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
S202:获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
本实施例选取一定数量的正常短信息以及一定数量的非正常短信息(可采用人工方式标注短信息正常与否),并利用所述正常短信息与所述非常短信息的十六进制八位元分布特征,来训练一阶离散时间马科夫模型,从而得到两套模型:正常短信息鉴别模型、非正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一十六进制八位元分布特征,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二十六进制八位元分布特征。
更具体地讲,所述正常短信息鉴别模型及所述非正常短信息鉴别模型分别包括式(1)中T的不同取值:T1、T2
从而,在需对目标短信息进行鉴别时,可首先获取预先训练的用于作为鉴别依据的所述两个模型:正常短信息鉴别模型、非正常短信息鉴别模型。
相对应地,所述步骤S103可以通过以下的步骤S203-S206实现:
S203:利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
S204:利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
S205:计算所述第二匹配率与所述第一匹配率的比值;
S206:如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
具体地,可将智能手机等终端设备的访问层接收到的新的短信息作为待鉴别的目标短信息,并将其分别输入至所述正常短信息鉴别模型及非正常短信息鉴别模型,之后,所述正常短信息鉴别模型计算并输出目标短信息的第三十六进制八位元分布特征(T3)与所述第一十六进制八位元分布特征(T1)之间的第一匹配率(或相似度)β1,所述非正常短信息鉴别模型计算并输出目标短信息的第三十六进制八位元分布特征(T3)与所述第二十六进制八位元分布特征(T2)之间的第二匹配率β2
在此基础上,判断β21是否达到预设阈值,如果达到,则鉴别出目标短信息为非正常短信息,否则,所述目标短信息则为正常短信息。
本实施例中,鉴别模型的训练以及基于训练出的鉴别模型进行短信息鉴别的过程具体可参考图3。
实施例三
参考图4,图4是本申请提供的一种非正常短信息的鉴别装置实施例三的结构示意图,所述装置可应用于电子设备,所述电子设备可以是智能手机、平板电脑等终端设备,如图4所示,所述装置可以包括:
获取模块100,用于获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征。
其中,所述预设进制可以是二进制或十六进制等进制形式,本实施例中所述预设进制具体选用十六进制。
任意一条短信息均对应一相应的十六进制八位元序列,本实施例中短信息的十六进制八位元分布特征包括:短信息的十六进制序列中任意两个八位元之间的一阶相关概率,具体可以表示为以下的式(1):
其中,t(k,l)表示八位元k与八位元l的一阶相关概率,k,l∈[0,255],且k,l为整数。
一般来说,在不同的短信息内容对应的不同十六进制八位元序列中,不同短信息的八位元一阶相关关系会存在概率分布上的差异,而正常短信息与垃圾短信、诈骗短信等非正常短信息往往由于在内容特征上具有鲜明不同,从而当表现在十六进制八位元序列中时,正常短信息、非正常短信息的八位元一阶相关概率也往往会存在显著差异,从而正常短信息与非正常短信息分别具有不同的十六进制八位元分布特征。对于式(1)中的T来说,正常短信息、非正常短信息的八位元一阶相关概率分别对应式(1)中所述T的不同取值:T1、T2
基于此,本申请依据短信息的十六进制八位元分布特征来对短信息的正常与否进行鉴别,鉴别过程的实施需要以正常短信息及非正常短信息的十六进制八位元分布特征为参考依据,因此,当需要对目标短信息进行鉴别时,需首先获取正常短信息的第一十六进制八位元分布特征及非正常短信息的第二十六进制八位元分布特征。
提取模块200,用于提取目标短信息的第三预设进制八位元分布特征。
其中,可通过计算目标短信息的十六进制八位元序列中,任意两个八位元之间的一阶相关概率,来得到目标短信息的第三十六进制八位元分布特征,具体可表示为式(1)中所述T的一相应取值T3
鉴别模块300,用于基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息。
在以上处理的基础上,本模块继续将目标短信息的第三十六进制八位元分布特征(T3),分别与正常短信息的第一十六进制八位元分布特征(T1)及非正常短信息的第二十六进制八位元分布特征(T2)进行比对,并基于比对结果对目标短信息的正常与否进行鉴别。
由以上方案可知,本申请公开的非正常短信息的鉴别装置,获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;并提取目标短信息的第三预设进制八位元分布特征;在此基础上,依据所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别目标短信息是否为非正常短信息。可见,本申请提供了一种基于短信息的预设进制八位元分布特征鉴别短信息的方案,在利用该方案进行短信息鉴别时不存在鉴别盲区,可有效提升非正常短信息的鉴别准确率。
实施例四
参考图5,图5是本申请提供的一种非正常短信息的鉴别装置实施例四的结构示意图,本实施例中,所述获取模块100包括:
第一获取单元101,用于获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
第二获取单元102,用于获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
本实施例选取一定数量的正常短信息以及一定数量的非正常短信息(可采用人工方式标注短信息正常与否),并利用所述正常短信息与所述非常短信息的十六进制八位元分布特征,来训练一阶离散时间马科夫模型,从而得到两套模型:正常短信息鉴别模型、非正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一十六进制八位元分布特征,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二十六进制八位元分布特征。
更具体地讲,所述正常短信息鉴别模型及所述非正常短信息鉴别模型分别包括式(1)中T的不同取值:T1、T2
从而,在需对目标短信息进行鉴别时,可首先获取预先训练的用于作为鉴别依据的所述两个模型:正常短信息鉴别模型、非正常短信息鉴别模型。
相对应地,参考图5,所述鉴别模块300包括:
第一计算单元301,用于利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
第二计算单元302,用于利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
第三计算单元303,用于计算所述第二匹配率与所述第一匹配率的比值;
鉴别单元304,用于如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
具体地,可将智能手机等终端设备的访问层接收到的新的短信息作为待鉴别的目标短信息,并将其分别输入至所述正常短信息鉴别模型及非正常短信息鉴别模型,之后,所述正常短信息鉴别模型计算并输出目标短信息的第三十六进制八位元分布特征(T3)与所述第一十六进制八位元分布特征(T1)之间的第一匹配率(或相似度)β1,所述非正常短信息鉴别模型计算并输出目标短信息的第三十六进制八位元分布特征(T3)与所述第二十六进制八位元分布特征(T2)之间的第二匹配率β2
在此基础上,判断β21是否达到预设阈值,如果达到,则鉴别出目标短信息为非正常短信息,否则,所述目标短信息则为正常短信息。
本实施例中,鉴别模型的训练以及基于训练出的鉴别模型进行短信息鉴别的过程具体可参考图3。
实施例五
本实施例五公开一种电子设备,所述电子设备可以是智能手机、平板电脑等终端设备,所述电子设备包括如实施例三或实施例四所公开的非正常短信息的鉴别装置。
由以上方案可知,本申请公开的电子设备,获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;并提取目标短信息的第三预设进制八位元分布特征;在此基础上,依据所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别目标短信息是否为非正常短信息。可见,本申请提供了一种基于短信息的预设进制八位元分布特征鉴别短信息的方案,在利用该方案进行短信息鉴别时不存在鉴别盲区,可有效提升非正常短信息的鉴别准确率。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
为了描述的方便,描述以上系统或装置时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种非正常短信息的鉴别方法,其特征在于,包括:
获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;
提取目标短信息的第三预设进制八位元分布特征;
基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息;
短信息的预设进制八位元分布特征包括:短信息的预设进制序列中任意两个八位元之间的一阶相关概率。
2.根据权利要求1所述的方法,其特征在于,所述获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征包括:
获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息包括:
利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
计算所述第二匹配率与所述第一匹配率的比值;
如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
4.根据权利要求1所述的方法,其特征在于,短信息的所述八位元分布特征包括:短信息的预设进制序列中任意两个八位元之间的一阶相关概率。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述预设进制为十六进制。
6.根据权利要求2-4任意一项所述的方法,其特征在于,所述正常短信息鉴别模型和所述非正常短信息鉴别模型为一阶离散时间马科夫模型。
7.一种非正常短信息的鉴别装置,其特征在于,包括:
获取模块,用于获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;
提取模块,用于提取目标短信息的第三预设进制八位元分布特征;
鉴别模块,用于基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息;
短信息的预设进制八位元分布特征包括:短信息的预设进制序列中任意两个八位元之间的一阶相关概率。
8.根据权利要求7所述的装置,其特征在于,所述获取模块包括:
第一获取单元,用于获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
第二获取单元,用于获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
9.根据权利要求8所述的装置,其特征在于,所述鉴别模块包括:
第一计算单元,用于利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
第二计算单元,用于利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
第三计算单元,用于计算所述第二匹配率与所述第一匹配率的比值;
鉴别单元,用于如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
10.一种电子设备,其特征在于,包括如权利要求7-9任意一项所述的非正常短信息的鉴别装置。
CN201610202078.0A 2016-03-31 2016-03-31 一种非正常短信息的鉴别方法、装置和电子设备 Active CN105898722B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610202078.0A CN105898722B (zh) 2016-03-31 2016-03-31 一种非正常短信息的鉴别方法、装置和电子设备
US15/474,655 US10231129B2 (en) 2016-03-31 2017-03-30 Malicious text message identification

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610202078.0A CN105898722B (zh) 2016-03-31 2016-03-31 一种非正常短信息的鉴别方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN105898722A CN105898722A (zh) 2016-08-24
CN105898722B true CN105898722B (zh) 2019-07-26

Family

ID=57013256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610202078.0A Active CN105898722B (zh) 2016-03-31 2016-03-31 一种非正常短信息的鉴别方法、装置和电子设备

Country Status (2)

Country Link
US (1) US10231129B2 (zh)
CN (1) CN105898722B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111935140B (zh) * 2020-08-10 2022-10-28 中国工商银行股份有限公司 异常报文识别方法及装置
CN112995155B (zh) * 2021-02-09 2023-04-07 中国工商银行股份有限公司 金融异常报文识别方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541899A (zh) * 2010-12-23 2012-07-04 阿里巴巴集团控股有限公司 一种信息识别方法及设备
CN103024746A (zh) * 2012-12-30 2013-04-03 清华大学 一种电信运营商垃圾短信处理系统及处理方法
CN103313248A (zh) * 2013-04-28 2013-09-18 北京小米科技有限责任公司 一种识别垃圾信息的方法和装置
CN103404086A (zh) * 2010-12-09 2013-11-20 阿尔卡特朗讯 通信网络中的垃圾信息报告和管理
CN103874033A (zh) * 2012-12-12 2014-06-18 上海粱江通信系统股份有限公司 一种基于中文分词识别不规则垃圾短信的方法
CN104702492A (zh) * 2015-03-19 2015-06-10 百度在线网络技术(北京)有限公司 垃圾消息模型训练方法、垃圾消息识别方法及其装置
CN105404670A (zh) * 2015-11-16 2016-03-16 北京奇虎科技有限公司 骚扰短信判别方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7966027B1 (en) * 2007-07-27 2011-06-21 Cellco Partnership Using an SMPP parameter for managing message content within a wireless network
JP4983671B2 (ja) * 2008-03-19 2012-07-25 沖電気工業株式会社 トラフィック分析装置、トラフィック分析方法及びトラフィック分析システム
CN101937466B (zh) * 2010-09-15 2011-11-30 任子行网络技术股份有限公司 网页邮箱识别分类方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103404086A (zh) * 2010-12-09 2013-11-20 阿尔卡特朗讯 通信网络中的垃圾信息报告和管理
CN102541899A (zh) * 2010-12-23 2012-07-04 阿里巴巴集团控股有限公司 一种信息识别方法及设备
CN103874033A (zh) * 2012-12-12 2014-06-18 上海粱江通信系统股份有限公司 一种基于中文分词识别不规则垃圾短信的方法
CN103024746A (zh) * 2012-12-30 2013-04-03 清华大学 一种电信运营商垃圾短信处理系统及处理方法
CN103313248A (zh) * 2013-04-28 2013-09-18 北京小米科技有限责任公司 一种识别垃圾信息的方法和装置
CN104702492A (zh) * 2015-03-19 2015-06-10 百度在线网络技术(北京)有限公司 垃圾消息模型训练方法、垃圾消息识别方法及其装置
CN105404670A (zh) * 2015-11-16 2016-03-16 北京奇虎科技有限公司 骚扰短信判别方法及装置

Also Published As

Publication number Publication date
US20170289815A1 (en) 2017-10-05
US10231129B2 (en) 2019-03-12
CN105898722A (zh) 2016-08-24

Similar Documents

Publication Publication Date Title
CN108616654B (zh) 消息提醒的方法、装置、终端及计算机可读存储介质
WO2004105332A3 (en) Method and apparatus for filtering email spam based on similarity measures
CN102368853B (zh) 通信事件处理方法及系统
CN108255555B (zh) 一种系统语言切换方法及终端设备
CN106534463B (zh) 一种陌生来电处理方法、装置、终端及服务器
CN108491720B (zh) 一种应用识别方法、系统以及相关设备
CN105677512B (zh) 一种数据处理方法、装置及电子设备
CN112770129B (zh) 基于直播的群聊建立方法、装置、服务器及介质
CN101600178A (zh) 垃圾信息确认方法和装置、终端
CN104040963A (zh) 用于使用字符串的频谱进行垃圾邮件检测的系统和方法
CN104883671A (zh) 一种垃圾短信的判断方法及系统
CN103258039B (zh) 一种微博伪造信息的检测方法
CN104184763A (zh) 一种反馈信息处理方法及系统、服务设备
CN106790727A (zh) 消息推送方法及装置
CN105898722B (zh) 一种非正常短信息的鉴别方法、装置和电子设备
CN104134439A (zh) 一种习惯用语的获取方法、装置及系统
CN105915440A (zh) 邮件识别方法及装置
CN103886238A (zh) 一种基于掌纹的账户登录方法及装置
CN109284594A (zh) 一种基于人脸检测的智能设备锁屏控制方法及装置
CN105323145A (zh) 恶意信息识别方法、恶意信息识别装置及系统
CN106899947A (zh) 短消息清理方法和装置
US20120260339A1 (en) Imposter Prediction Using Historical Interaction Patterns
CN102946400A (zh) 一种基于行为分析的海量短信内容安全过滤方法和系统
CN106713246A (zh) 一种应用程序页面劫持的检测方法、装置及移动终端
CN104144242A (zh) 一种信息处理方法、装置和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant