CN105898722A - 一种非正常短信息的鉴别方法、装置和电子设备 - Google Patents
一种非正常短信息的鉴别方法、装置和电子设备 Download PDFInfo
- Publication number
- CN105898722A CN105898722A CN201610202078.0A CN201610202078A CN105898722A CN 105898722 A CN105898722 A CN 105898722A CN 201610202078 A CN201610202078 A CN 201610202078A CN 105898722 A CN105898722 A CN 105898722A
- Authority
- CN
- China
- Prior art keywords
- short message
- bit distribution
- distribution characteristics
- improper
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
- H04W4/14—Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/212—Monitoring or handling of messages using filtering or selective blocking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/436—Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
- H04W12/128—Anti-malware arrangements, e.g. protection against SMS fraud or mobile malware
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/18—Comparators
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42382—Text-based messaging services in telephone networks such as PSTN/ISDN, e.g. User-to-User Signalling or Short Message Service for fixed networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Security & Cryptography (AREA)
- Human Computer Interaction (AREA)
- Information Transfer Between Computers (AREA)
- Technology Law (AREA)
Abstract
本申请公开一种非正常短信息的鉴别方法、装置和电子设备,所述方法包括:获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;并提取目标短信息的第三预设进制八位元分布特征;在此基础上,依据所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别目标短信息是否为非正常短信息。可见,本申请提供了一种基于短信息的预设进制八位元分布特征鉴别短信息的方案,在利用该方案进行短信息鉴别时不存在鉴别盲区,可有效提升非正常短信息的鉴别准确率。
Description
技术领域
本发明属于短信息服务技术领域,尤其涉及一种非正常短信息的鉴别方法、装置和电子设备。
背景技术
短信息服务是移动通信服务的重要组成部分,目前,由于通信诈骗的不断渗透以及监管漏洞的存在,垃圾短信、诈骗短信等非正常短信息日渐猖獗,为用户的短信息服务体验带来了困扰。
目前,一般通过短信息的发送方号码来鉴别短信息正常与否,具体地,例如,根据用户对短信息源手机号码的举报情况,将举报次数超过一定阈值的手机号码列为不被信任的黑名单号码,从而在用户收到来自所述黑名单号码的短信息时,将该信息鉴别为非正常信息并提醒用户。此种方式在举报前期(举报量未达设定阈值)或不法用户更换手机号码等情况下,无法对垃圾短信、诈骗短信等非正常短信息进行有效鉴别,从而导致非正常短信息的鉴别存在盲区,进而影响非正常短信息的鉴别准确率。
发明内容
有鉴于此,本发明的目的在于提供一种非正常短信息的鉴别方法、装置和电子设备,旨在克服现有技术的非正常短信息鉴别方法因存在盲区,而导致的鉴别准确率较低的问题。
为此,本发明公开如下技术方案:
一种非正常短信息的鉴别方法,包括:
获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;
提取目标短信息的第三预设进制八位元分布特征;
基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息。
上述方法,优选的,所述获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征包括:
获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
上述方法,优选的,所述基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息包括:
利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
计算所述第二匹配率与所述第一匹配率的比值;
如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
上述方法,优选的,短信息的所述八位元分布特征包括:短信息的预设进制序列中任意两个八位元之间的一阶相关概率。
上述方法,优选的,所述预设进制为十六进制。
上述方法,优选的,所述正常短信息鉴别模型和所述非正常短信息鉴别模型为一阶离散时间马科夫模型。
一种非正常短信息的鉴别装置,包括:
获取模块,用于获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;
提取模块,用于提取目标短信息的第三预设进制八位元分布特征;
鉴别模块,用于基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息。
上述装置,优选的,所述获取模块包括:
第一获取单元,用于获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
第二获取单元,用于获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
上述装置,优选的,所述鉴别模块包括:
第一计算单元,用于利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
第二计算单元,用于利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
第三计算单元,用于计算所述第二匹配率与所述第一匹配率的比值;
鉴别单元,用于如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
一种电子设备,包括如上所述的非正常短信息的鉴别装置。
由以上方案可知,本申请公开的非正常短信息的鉴别方法包括:获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;并提取目标短信息的第三预设进制八位元分布特征;在此基础上,依据所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别目标短信息是否为非正常短信息。可见,本申请提供了一种基于短信息的预设进制八位元分布特征鉴别短信息的方案,在利用该方案进行短信息鉴别时不存在鉴别盲区,可有效提升非正常短信息的鉴别准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本申请提供的一种非正常短信息的鉴别方法实施例一的流程图;
图2是本申请提供的一种非正常短信息的鉴别方法实施例二的流程图;
图3是本申请实施例二提供的鉴别模型训练以及基于训练出的鉴别模型进行短信息鉴别的处理过程示意图;
图4是本申请提供的一种非正常短信息的鉴别装置实施例三的结构示意图;
图5是本申请提供的一种非正常短信息的鉴别装置实施例四的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
参考图1,图1是本申请提供的一种非正常短信息的鉴别方法实施例一的流程图,所述方法可应用于电子设备,所述电子设备可以是智能手机、平板电脑等终端设备,如图1所示,所述方法可以包括以下步骤:
S101:获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征。
其中,所述预设进制可以是二进制或十六进制等进制形式,本实施例中所述预设进制具体选用十六进制。
任意一条短信息均对应一相应的十六进制八位元序列,本实施例中短信息的十六进制八位元分布特征包括:短信息的十六进制序列中任意两个八位元之间的一阶相关概率,具体可以表示为以下的式(1):
其中,t(k,l)表示八位元k与八位元l的一阶相关概率,k,l∈[0,255],且k,l为整数。
一般来说,在不同的短信息内容对应的不同十六进制八位元序列中,不同短信息的八位元一阶相关关系会存在概率分布上的差异,而正常短信息与垃圾短信、诈骗短信等非正常短信息往往由于在内容特征上具有鲜明不同,从而当表现在十六进制八位元序列中时,正常短信息、非正常短信息的八位元一阶相关概率也往往会存在显著差异,从而正常短信息与非正常短信息分别具有不同的十六进制八位元分布特征。对于式(1)中的T来说,正常短信息、非正常短信息的八位元一阶相关概率分别对应式(1)中所述T的不同取值:T1、T2。
基于此,本申请依据短信息的十六进制八位元分布特征来对短信息的正常与否进行鉴别,鉴别过程的实施需要以正常短信息及非正常短信息的十六进制八位元分布特征为参考依据,因此,当需要对目标短信息进行鉴别时,需首先获取正常短信息的第一十六进制八位元分布特征及非正常短信息的第二十六进制八位元分布特征。
S102:提取目标短信息的第三预设进制八位元分布特征。
其中,可通过计算目标短信息的十六进制八位元序列中,任意两个八位元之间的一阶相关概率,来得到目标短信息的第三十六进制八位元分布特征,具体可表示为式(1)中所述T的一相应取值T3。
S103:基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息。
在以上处理的基础上,本步骤继续将目标短信息的第三十六进制八位元分布特征(T3),分别与正常短信息的第一十六进制八位元分布特征(T1)及非正常短信息的第二十六进制八位元分布特征(T2)进行比对,并基于比对结果对目标短信息的正常与否进行鉴别。
由以上方案可知,本申请公开的非正常短信息的鉴别方法包括:获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;并提取目标短信息的第三预设进制八位元分布特征;在此基础上,依据所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别目标短信息是否为非正常短信息。可见,本申请提供了一种基于短信息的预设进制八位元分布特征鉴别短信息的方案,在利用该方案进行短信息鉴别时不存在鉴别盲区,可有效提升非正常短信息的鉴别准确率。
实施例二
参考图2,图2是本申请提供的一种非正常短信息的鉴别方法实施例二的流程图,本实施例中,所述步骤S101可以通过以下的步骤S201及S202实现:
S201:获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
S202:获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
本实施例选取一定数量的正常短信息以及一定数量的非正常短信息(可采用人工方式标注短信息正常与否),并利用所述正常短信息与所述非常短信息的十六进制八位元分布特征,来训练一阶离散时间马科夫模型,从而得到两套模型:正常短信息鉴别模型、非正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一十六进制八位元分布特征,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二十六进制八位元分布特征。
更具体地讲,所述正常短信息鉴别模型及所述非正常短信息鉴别模型分别包括式(1)中T的不同取值:T1、T2。
从而,在需对目标短信息进行鉴别时,可首先获取预先训练的用于作为鉴别依据的所述两个模型:正常短信息鉴别模型、非正常短信息鉴别模型。
相对应地,所述步骤S103可以通过以下的步骤S203-S206实现:
S203:利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
S204:利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
S205:计算所述第二匹配率与所述第一匹配率的比值;
S206:如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
具体地,可将智能手机等终端设备的访问层接收到的新的短信息作为待鉴别的目标短信息,并将其分别输入至所述正常短信息鉴别模型及非正常短信息鉴别模型,之后,所述正常短信息鉴别模型计算并输出目标短信息的第三十六进制八位元分布特征(T3)与所述第一十六进制八位元分布特征(T1)之间的第一匹配率(或相似度)β1,所述非正常短信息鉴别模型计算并输出目标短信息的第三十六进制八位元分布特征(T3)与所述第二十六进制八位元分布特征(T2)之间的第二匹配率β2。
在此基础上,判断β2/β1是否达到预设阈值,如果达到,则鉴别出目标短信息为非正常短信息,否则,所述目标短信息则为正常短信息。
本实施例中,鉴别模型的训练以及基于训练出的鉴别模型进行短信息鉴别的过程具体可参考图3。
实施例三
参考图4,图4是本申请提供的一种非正常短信息的鉴别装置实施例三的结构示意图,所述装置可应用于电子设备,所述电子设备可以是智能手机、平板电脑等终端设备,如图4所示,所述装置可以包括:
获取模块100,用于获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征。
其中,所述预设进制可以是二进制或十六进制等进制形式,本实施例中所述预设进制具体选用十六进制。
任意一条短信息均对应一相应的十六进制八位元序列,本实施例中短信息的十六进制八位元分布特征包括:短信息的十六进制序列中任意两个八位元之间的一阶相关概率,具体可以表示为以下的式(1):
其中,t(k,l)表示八位元k与八位元l的一阶相关概率,k,l∈[0,255],且k,l为整数。
一般来说,在不同的短信息内容对应的不同十六进制八位元序列中,不同短信息的八位元一阶相关关系会存在概率分布上的差异,而正常短信息与垃圾短信、诈骗短信等非正常短信息往往由于在内容特征上具有鲜明不同,从而当表现在十六进制八位元序列中时,正常短信息、非正常短信息的八位元一阶相关概率也往往会存在显著差异,从而正常短信息与非正常短信息分别具有不同的十六进制八位元分布特征。对于式(1)中的T来说,正常短信息、非正常短信息的八位元一阶相关概率分别对应式(1)中所述T的不同取值:T1、T2。
基于此,本申请依据短信息的十六进制八位元分布特征来对短信息的正常与否进行鉴别,鉴别过程的实施需要以正常短信息及非正常短信息的十六进制八位元分布特征为参考依据,因此,当需要对目标短信息进行鉴别时,需首先获取正常短信息的第一十六进制八位元分布特征及非正常短信息的第二十六进制八位元分布特征。
提取模块200,用于提取目标短信息的第三预设进制八位元分布特征。
其中,可通过计算目标短信息的十六进制八位元序列中,任意两个八位元之间的一阶相关概率,来得到目标短信息的第三十六进制八位元分布特征,具体可表示为式(1)中所述T的一相应取值T3。
鉴别模块300,用于基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息。
在以上处理的基础上,本模块继续将目标短信息的第三十六进制八位元分布特征(T3),分别与正常短信息的第一十六进制八位元分布特征(T1)及非正常短信息的第二十六进制八位元分布特征(T2)进行比对,并基于比对结果对目标短信息的正常与否进行鉴别。
由以上方案可知,本申请公开的非正常短信息的鉴别装置,获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;并提取目标短信息的第三预设进制八位元分布特征;在此基础上,依据所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别目标短信息是否为非正常短信息。可见,本申请提供了一种基于短信息的预设进制八位元分布特征鉴别短信息的方案,在利用该方案进行短信息鉴别时不存在鉴别盲区,可有效提升非正常短信息的鉴别准确率。
实施例四
参考图5,图5是本申请提供的一种非正常短信息的鉴别装置实施例四的结构示意图,本实施例中,所述获取模块100包括:
第一获取单元101,用于获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
第二获取单元102,用于获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
本实施例选取一定数量的正常短信息以及一定数量的非正常短信息(可采用人工方式标注短信息正常与否),并利用所述正常短信息与所述非常短信息的十六进制八位元分布特征,来训练一阶离散时间马科夫模型,从而得到两套模型:正常短信息鉴别模型、非正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一十六进制八位元分布特征,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二十六进制八位元分布特征。
更具体地讲,所述正常短信息鉴别模型及所述非正常短信息鉴别模型分别包括式(1)中T的不同取值:T1、T2。
从而,在需对目标短信息进行鉴别时,可首先获取预先训练的用于作为鉴别依据的所述两个模型:正常短信息鉴别模型、非正常短信息鉴别模型。
相对应地,参考图5,所述鉴别模块300包括:
第一计算单元301,用于利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
第二计算单元302,用于利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
第三计算单元303,用于计算所述第二匹配率与所述第一匹配率的比值;
鉴别单元304,用于如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
具体地,可将智能手机等终端设备的访问层接收到的新的短信息作为待鉴别的目标短信息,并将其分别输入至所述正常短信息鉴别模型及非正常短信息鉴别模型,之后,所述正常短信息鉴别模型计算并输出目标短信息的第三十六进制八位元分布特征(T3)与所述第一十六进制八位元分布特征(T1)之间的第一匹配率(或相似度)β1,所述非正常短信息鉴别模型计算并输出目标短信息的第三十六进制八位元分布特征(T3)与所述第二十六进制八位元分布特征(T2)之间的第二匹配率β2。
在此基础上,判断β2/β1是否达到预设阈值,如果达到,则鉴别出目标短信息为非正常短信息,否则,所述目标短信息则为正常短信息。
本实施例中,鉴别模型的训练以及基于训练出的鉴别模型进行短信息鉴别的过程具体可参考图3。
实施例五
本实施例五公开一种电子设备,所述电子设备可以是智能手机、平板电脑等终端设备,所述电子设备包括如实施例三或实施例四所公开的非正常短信息的鉴别装置。
由以上方案可知,本申请公开的电子设备,获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;并提取目标短信息的第三预设进制八位元分布特征;在此基础上,依据所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别目标短信息是否为非正常短信息。可见,本申请提供了一种基于短信息的预设进制八位元分布特征鉴别短信息的方案,在利用该方案进行短信息鉴别时不存在鉴别盲区,可有效提升非正常短信息的鉴别准确率。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
为了描述的方便,描述以上系统或装置时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种非正常短信息的鉴别方法,其特征在于,包括:
获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;
提取目标短信息的第三预设进制八位元分布特征;
基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息。
2.根据权利要求1所述的方法,其特征在于,所述获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征包括:
获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
3.根据权利要求2所述的额方法,其特征在于,所述基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息包括:
利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
计算所述第二匹配率与所述第一匹配率的比值;
如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
4.根据权利要求1所述的方法,其特征在于,短信息的所述八位元分布特征包括:短信息的预设进制序列中任意两个八位元之间的一阶相关概率。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述预设进制为十六进制。
6.根据权利要求2-4任意一项所述的方法,其特征在于,所述正常短信息鉴别模型和所述非正常短信息鉴别模型为一阶离散时间马科夫模型。
7.一种非正常短信息的鉴别装置,其特征在于,包括:
获取模块,用于获取正常短信息的第一预设进制八位元分布特征以及非正常短信息的第二预设进制八位元分布特征;
提取模块,用于提取目标短信息的第三预设进制八位元分布特征;
鉴别模块,用于基于所述第一预设进制八位元分布特征、所述第二预设进制八位元分布特征以及所述第三预设进制八位元分布特征,鉴别所述目标短信息是否为非正常短信息。
8.根据权利要求7所述的装置,其特征在于,所述获取模块包括:
第一获取单元,用于获取预先训练的正常短信息鉴别模型;其中,所述正常短信息鉴别模型包含用于鉴别正常短信息的第一预设进制八位元分布特征;
第二获取单元,用于获取预先训练的非正常短信息鉴别模型;其中,所述非正常短信息鉴别模型包含用于鉴别非正常短信息的第二预设进制八位元分布特征。
9.根据权利要求8所述的装置,其特征在于,所述鉴别模块包括:
第一计算单元,用于利用所述正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第一预设进制八位元分布特征的第一匹配率;
第二计算单元,用于利用所述非正常短信息鉴别模型,计算所述第三预设进制八位元分布特征与所述第二预设进制八位元分布特征的第二匹配率;
第三计算单元,用于计算所述第二匹配率与所述第一匹配率的比值;
鉴别单元,用于如果所述比值达到预设阈值,则鉴别出所述目标短信息为非正常短信息。
10.一种电子设备,其特征在于,包括如权利要求7-9任意一项所述的非正常短信息的鉴别装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610202078.0A CN105898722B (zh) | 2016-03-31 | 2016-03-31 | 一种非正常短信息的鉴别方法、装置和电子设备 |
US15/474,655 US10231129B2 (en) | 2016-03-31 | 2017-03-30 | Malicious text message identification |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610202078.0A CN105898722B (zh) | 2016-03-31 | 2016-03-31 | 一种非正常短信息的鉴别方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105898722A true CN105898722A (zh) | 2016-08-24 |
CN105898722B CN105898722B (zh) | 2019-07-26 |
Family
ID=57013256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610202078.0A Active CN105898722B (zh) | 2016-03-31 | 2016-03-31 | 一种非正常短信息的鉴别方法、装置和电子设备 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10231129B2 (zh) |
CN (1) | CN105898722B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111935140B (zh) * | 2020-08-10 | 2022-10-28 | 中国工商银行股份有限公司 | 异常报文识别方法及装置 |
CN112995155B (zh) * | 2021-02-09 | 2023-04-07 | 中国工商银行股份有限公司 | 金融异常报文识别方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102541899A (zh) * | 2010-12-23 | 2012-07-04 | 阿里巴巴集团控股有限公司 | 一种信息识别方法及设备 |
CN103024746A (zh) * | 2012-12-30 | 2013-04-03 | 清华大学 | 一种电信运营商垃圾短信处理系统及处理方法 |
CN103313248A (zh) * | 2013-04-28 | 2013-09-18 | 北京小米科技有限责任公司 | 一种识别垃圾信息的方法和装置 |
CN103404086A (zh) * | 2010-12-09 | 2013-11-20 | 阿尔卡特朗讯 | 通信网络中的垃圾信息报告和管理 |
CN103874033A (zh) * | 2012-12-12 | 2014-06-18 | 上海粱江通信系统股份有限公司 | 一种基于中文分词识别不规则垃圾短信的方法 |
CN104702492A (zh) * | 2015-03-19 | 2015-06-10 | 百度在线网络技术(北京)有限公司 | 垃圾消息模型训练方法、垃圾消息识别方法及其装置 |
CN105404670A (zh) * | 2015-11-16 | 2016-03-16 | 北京奇虎科技有限公司 | 骚扰短信判别方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7966027B1 (en) * | 2007-07-27 | 2011-06-21 | Cellco Partnership | Using an SMPP parameter for managing message content within a wireless network |
JP4983671B2 (ja) * | 2008-03-19 | 2012-07-25 | 沖電気工業株式会社 | トラフィック分析装置、トラフィック分析方法及びトラフィック分析システム |
CN101937466B (zh) * | 2010-09-15 | 2011-11-30 | 任子行网络技术股份有限公司 | 网页邮箱识别分类方法及系统 |
-
2016
- 2016-03-31 CN CN201610202078.0A patent/CN105898722B/zh active Active
-
2017
- 2017-03-30 US US15/474,655 patent/US10231129B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103404086A (zh) * | 2010-12-09 | 2013-11-20 | 阿尔卡特朗讯 | 通信网络中的垃圾信息报告和管理 |
CN102541899A (zh) * | 2010-12-23 | 2012-07-04 | 阿里巴巴集团控股有限公司 | 一种信息识别方法及设备 |
CN103874033A (zh) * | 2012-12-12 | 2014-06-18 | 上海粱江通信系统股份有限公司 | 一种基于中文分词识别不规则垃圾短信的方法 |
CN103024746A (zh) * | 2012-12-30 | 2013-04-03 | 清华大学 | 一种电信运营商垃圾短信处理系统及处理方法 |
CN103313248A (zh) * | 2013-04-28 | 2013-09-18 | 北京小米科技有限责任公司 | 一种识别垃圾信息的方法和装置 |
CN104702492A (zh) * | 2015-03-19 | 2015-06-10 | 百度在线网络技术(北京)有限公司 | 垃圾消息模型训练方法、垃圾消息识别方法及其装置 |
CN105404670A (zh) * | 2015-11-16 | 2016-03-16 | 北京奇虎科技有限公司 | 骚扰短信判别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20170289815A1 (en) | 2017-10-05 |
US10231129B2 (en) | 2019-03-12 |
CN105898722B (zh) | 2019-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102045978B1 (ko) | 얼굴 인증 방법, 장치 및 컴퓨터 기억매체 | |
US20170149830A1 (en) | Apparatus and method for automatically generating detection rule | |
CN104580133B (zh) | 恶意程序防护方法与系统及其过滤表格更新方法 | |
CN107908948B (zh) | 一种应用于安全风险控制的安卓app设备指纹生成方法 | |
CN105808583B (zh) | 文件类型识别方法及装置 | |
CN109903210B (zh) | 水印的去除方法、装置和服务器 | |
CN107315955A (zh) | 文件安全性识别方法和装置 | |
Chen et al. | Effective and adaptive algorithm for pepper‐and‐salt noise removal | |
CN110378276B (zh) | 车辆状态获取方法、装置、设备、及存储介质 | |
CN106470405A (zh) | 短信拦截方法和装置 | |
CN106815588A (zh) | 垃圾图片过滤方法及装置 | |
CN108197474A (zh) | 移动终端应用的分类和检测方法 | |
CN107770048A (zh) | 一种应用消息推送方法和装置 | |
CN105915440A (zh) | 邮件识别方法及装置 | |
CN107404740A (zh) | 安全的网络切换方法、装置及终端设备 | |
CN103886238A (zh) | 一种基于掌纹的账户登录方法及装置 | |
CN105898722A (zh) | 一种非正常短信息的鉴别方法、装置和电子设备 | |
CN105991574A (zh) | 风险行为监控方法及装置 | |
CN113495886A (zh) | 用于模型训练的污染样本数据的检测方法及装置 | |
CN106713246A (zh) | 一种应用程序页面劫持的检测方法、装置及移动终端 | |
CN103246846A (zh) | 检测定制rom的安全性的方法和装置 | |
CN102946400A (zh) | 一种基于行为分析的海量短信内容安全过滤方法和系统 | |
CN109144622B (zh) | 界面显示方法、终端及存储介质 | |
CN107256250A (zh) | 一种图片处理方法、装置、服务器及存储介质 | |
CN109474593A (zh) | 一种识别c&c周期性回连行为的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |