CN107295489A - 伪基站短信识别方法、装置、设备及存储介质 - Google Patents

伪基站短信识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN107295489A
CN107295489A CN201710508881.1A CN201710508881A CN107295489A CN 107295489 A CN107295489 A CN 107295489A CN 201710508881 A CN201710508881 A CN 201710508881A CN 107295489 A CN107295489 A CN 107295489A
Authority
CN
China
Prior art keywords
base station
short message
identified
anomalous identification
pseudo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710508881.1A
Other languages
English (en)
Other versions
CN107295489B (zh
Inventor
罗雪峰
王巍巍
彭程
陈春筝
黄庆伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710508881.1A priority Critical patent/CN107295489B/zh
Publication of CN107295489A publication Critical patent/CN107295489A/zh
Application granted granted Critical
Publication of CN107295489B publication Critical patent/CN107295489B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • H04W4/14Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/391Modelling the propagation channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/22Traffic simulation tools or models

Abstract

本发明实施例公开了一种伪基站短信识别方法、装置、设备及存储介质。所述伪基站短信识别方法包括:采用预先建立的短信异常识别模型对待识别短信进行异常识别;根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。本发明实施例通过预先建立的短信异常识别模型对待识别短信进行异常识别,并根据输出结果确定所述待识别短信是否为伪基站短信,可以提高伪基站短信的正确识别率。

Description

伪基站短信识别方法、装置、设备及存储介质
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种伪基站短信识别方法、装置、设备及存储介质。
背景技术
伪基站是一种高科技仪器,一般由主机和笔记本电脑组成,通过短信群发器、短信发信机等相关设备能够搜取以其为中心、一定半径范围内的手机卡信息,通过伪装成运营商的基站,任意冒用他人手机号码强行向用户手机发送诈骗、广告推销等短信息。从2014年开始,伪基站短信数量不断攀升,月均伪基站短信数量接近一亿条,2015年,全国伪基站短信数量达到23.2亿条,较2014年的11.9亿条,同比上涨95%。广告促销、色情违法、房产中介是伪基站短信的三大类型。
伪基站短信伪装性很高,往往冒充权威号码(如95588,10086)给用户发送欺骗性极高的诈骗短信,普通用户往往不能很好地分辨。近年来,伪基站电信诈骗案件层出不穷,因此,找到一个可靠地识别伪基站的方法是非常必要的。
目前,伪基站短信识别技术有如下几种:第一种,传统的伪基站识别技术,采用硬件设备,通过频率和功率探测周围的伪基站设备;第二种,客户端在收到短信时向云端发起一个业务请求,如果不能正常受到请求响应,则判断为伪基站短信。第三种,与第三方平台约定短信密语,第三方平台在发送短信时将携带该密语,如果在收到第三方平台短信时没有携带密语,则判断为伪基站短信。第四种,基于正常基站库来判断,如果用户收到短信的所接入的基站不在基站库中或者地理位置不正常,则判断为伪基站短信。
现有方法的主要问题在于:第一种方法,受限于硬件设备的成本,且探测距离有限,无法做到大范围的查找;第二种方法,不能很好地处理用户通过wifi连接到网络的情况;第三种方法,不是很灵活,对约定好的第三方平台外的伪基站短信无能为力。第四种方法,只是基于基站信息来判断,由于一些移动基站的存在,或者一些伪基站冒用正常基站的身份标识,会导致较多的误判和漏判。
发明内容
本发明实施例提供一种伪基站短信识别方法、装置、设备及存储介质,可以提高伪基站短信的正确识别率。
第一方面,本发明实施例提供了一种伪基站短信识别方法,该方法包括:
采用预先建立的短信异常识别模型对待识别短信进行异常识别;
根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
第二方面,本发明实施例还提供了一种伪基站短信识别装置,该装置包括:
异常识别模块,用于采用预先建立的短信异常识别模型对待识别短信进行异常识别;
伪基站短信确定模块,用于根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
第三方面,本发明实施例还提供了一种设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例任一所述的伪基站短信识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例任一所述的伪基站短信识别方法。
本发明实施例通过预先建立的短信异常识别模型对待识别短信进行异常识别,并根据输出结果确定所述待识别短信是否为伪基站短信,可以提高伪基站短信的正确识别率。
附图说明
图1是本发明实施例一提供的一种伪基站短信识别方法的流程图;
图2是本发明实施例二提供的一种伪基站短信识别方法的流程图;
图3是本发明实施例三提供的一种伪基站短信识别方法的流程图;
图4是本发明实施例四提供的一种伪基站短信识别方法的流程图;
图5是本发明实施例五提供的一种伪基站短信识别装置的结构图;
图6是本发明实施例六提供的一种计算机设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种伪基站短信识别方法的流程图,本实施例可适用于伪基站短信识别的情况,该方法可以由本发明实施例提供的伪基站短信识别装置来执行,该装置可采用软件和/或硬件的方式实现,该装置可集成在终端设备中或终端设备的应用端中。其中,终端设备可以为但不限于为移动终端(平板电脑或智能手机)。
其中,应用端可以为内嵌于终端设备中的某个客户端的插件,或者为所述终端设备的操作系统的插件,与内嵌于终端设备中的伪基站短信识别客户端或者终端设备的操作系统中的伪基站短信识别应用程序配合使用;应用端也可以为所述终端设备中一个独立的可提供伪基站短信识别的客户端,本实施例对此不进行限制。
如图1所述,本实施例的方法具体包括:
S101、采用预先建立的短信异常识别模型对待识别短信进行异常识别。
其中,短信异常识别模型基于待识别短信的文本特征对待识别短信进行伪基站短信识别,可预先根据已知伪基站短信的文本特征和/或已知正常短信的文本特征训练得到,使其具有伪基站短信识别能力。
S102、根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
其中,短信异常识别模型的输出结果可以为以下任意一种:伪基站短信、正常短信、为伪基站短信的概率和为正常短信的概率。当短信异常识别模型的输出结果是为伪基站短信的概率时,根据为伪基站短信的概率确定待识别短信是否为伪基站短信,例如,当为伪基站短信的概率大于预设概率(例如,90%)时,则确定待识别短信为伪基站短信,否则确定待识别短信为正常短信。当短信异常识别模型的输出结果是为正常短信的概率时,根据为正常短信的概率确定待识别短信是否为伪基站短信,例如,当为正常短信的概率小于预设概率(例如,90%)时,则确定待识别短信为伪基站短信,否则确定待识别短信为正常短信。
本实施例通过预先建立的短信异常识别模型对待识别短信进行异常识别,并根据输出结果确定所述待识别短信是否为伪基站短信,可以提高伪基站短信的正确识别率。
实施例二
图2是本发明实施例二提供的一种伪基站短信识别方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,进一步包括如下步骤:提取已知伪基站短信的文本特征和/或已知正常短信的文本特征,并进行标记;采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型。
相应的,本实施例的方法具体包括:
S201、提取已知伪基站短信的文本特征和/或已知正常短信的文本特征,并进行标记。
其中,提取的文本特征包括但不限于以下至少一种:短信内容、发送号码、发送时间等。
具体的,首先获取大量的已知伪基站短信和已知正常短信,例如,可采用现有技术的伪基站识别方法获取,或者人工获取。然后,提取已知伪基站短信的文本特征和/或已知正常短信的文本特征作为训练样本数据,并根据短信类型对样本数据进行标记,例如,伪基站短信对应的样本数据标记为1,正常短信对应的样本数据标记为0。
S202、采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型。
例如,可采用的机器学习算法包括但限于朴素贝叶斯算法、支持向量机算法和神经网络模型等。
为保证得到的短信异常识别模型的输出结果更为准确,本步骤可选的一种实施方式是,将标记后的文本特征划分为训练数据样本集和验证数据样本集;采用机器学习算法对所述训练数据样本集进行模型训练,得到初始短信异常识别模型;采用所述验证数据样本集对所述初始短信异常识别模型进行验证,若通过验证,则将所述初始短信异常识别模型作为所述短信异常识别模型。
具体的,首先采用机器学习算法对训练数据样本集进行模型训练,得到初始短信异常识别模型,然后将验证数据样本集输入初始短信异常识别模型进行识别,将初始短信异常识别模型的输出结果与验证数据样本集的标记进行比对,如果正确率达到100%,或者超过预设比例(例如95%),则认为初始短信异常识别模型通过验证,则将其作为最终的短信异常识别模型,如果初始短信异常识别模型未通过验证,则重新划分训练数据样本集和验证数据样本集,重新训练得到模型并验证,直至通过验证。
S203、采用短信异常识别模型对待识别短信进行异常识别。
S204、根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
本实施例通过提取已知伪基站短信的文本特征和/或已知正常短信的文本特征,并进行标记;采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型;并根据短信异常识别模型的输出结果确定待识别短信是否为伪基站短信,可以提高伪基站短信的正确识别率。
实施例三
图3是本发明实施例三提供的一种伪基站短信识别方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,进一步包括如下步骤:根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常;若确定所述基站异常,则触发执行对待识别短信进行短信异常识别的操作。
相应的,本实施例的方法具体包括:
S301、根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常。
若确定所述基站异常,则执行步骤S302,若确定所述基站正常,则确定所述待识别短信为正常短信,无需再执行伪基站短信识别。
本步骤可选的一种实施方式是,所述云端接口请求消息中包含基站信息,根据所述基站信息查询正常基站信息库;若在所述正常基站信息库中未查询到所述基站信息,则确定对应的基站异常,若在所述正常基站信息库中查询到所述基站信息。若在所述正常基站信息库中查询到所述基站信息,则确定对应基站的地理位置是否正常;若所述地理位置不正常,则确定所述基站异常,若所述地理位置正常,则确定对应的基站正常。
其中,所述正常基站信息库中包含基站信息和/或终端设备的定位信息。所述基站信息包含但不限于以下至少一项信息:移动国家号mcc、移动网络号码mnc、位置区码lac和基站标识cid。
具体可通过如下方式建立正常基站信息库:当用户请求云端接口时,在请求参数中携带终端设备(例如,手机)当前接入基站的信息,包括mcc、mnc、lac和cid这四个参数,且这四个参数可以唯一标识一个基站,以及当前终端设备的定位信息,包括文全球定位系统(Global Positioning System,GPS)信息或者周围wifi信息,当上传的数据中只有wifi信息时,云端处理模块可根据wifi的bssid标识反查出定位信息。并将基站的mcc|mnc|lac|cid以及当前定位信息、记录次数count(表示有几个用户接入基站)、持续时间duration作为键值对存储在数据库中,数据格式为mcc|mnc|lac|cid:[((latitude1,longitude1):(count1,duration1)),((latitude2,longitude2):(count2,duration2))],其中,count1和duration1为接入用户1和接入持续时间,latitude1和longitude1为接入用户1位置的经度和纬度,count2和duration2为接入用户2和接入持续时间,latitude2和longitude2为接入用户2位置的经度和纬度,当纪录次数和持续时间达到预设阈值,该对应的mcc|mnc|lac|cid:(latitude,longitude)写入正常基站信息库。因此,本实施例中的正常基站信息库不仅包含了基站信息,还包括了终端设备的定位信息,从而避免了伪基站冒用正常基站的身份标识导致的较多误判和漏判,能够更加准确的识别基站是否异常。
S302、若确定所述基站异常,采用预先建立的短信异常识别模型对待识别短信进行异常识别。
S303、根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
本实施例通过根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常,只有确定基站异常时,才触发执行对待识别短信进行短信异常识别的操作,进一步提高伪基站识别效率。
实施例四
图4是本发明实施例四提供的一种伪基站短信识别方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,进一步包括如下步骤:在所述终端设备接收到所述待识别短信时,确定所述终端设备当前使用的通信网络类型;根据所述网络通信类型触发执行对待识别短信进行短信异常识别的操作。
相应的,本实施例的方法具体包括:
S401、在所述终端设备接收到所述待识别短信时,确定所述终端设备当前使用的通信网络类型。
其中,通信网络类型包括但不限于移动网络类型和wifi网络类型。
S402、根据所述网络通信类型采用预先建立的短信异常识别模型对待识别短信进行异常识别。
具体的,若所述网络通信类型为移动网络类型,且采用所述移动网络类型首次请求云端接口失败后,则缓存所述待识别短信信息(例如,短信内容、接收短信时的基站信息及周边扫描到的wifi信息),待移动网络恢复后再次请求云端接口,并触发执行对待识别短信进行短信异常识别的操作;或所述网络通信类型为wifi网络类型,则触发执行对待识别短信进行短信异常识别的操作。
例如,当用户接收到短信时判断当前网络通信类型,如果是移动网络,则请求云端接口,如果超时失败,则在客户端缓存该条短信、接收短信时的基站信息及周边扫描到的wifi信息。待网络恢复后再请求云端接口,并触发执行对待识别短信进行短信异常识别的操作。如果识别为伪基站短信,则给用户发出预警,提示这条历史短信为伪基站短信;如果请求云端接口成功,则识别为非伪基站短信。当用户当前网络是wifi网络时,则请求云端接口,并触发执行对待识别短信进行短信异常识别的操作。如果识别为伪基站短信,给用户发出预警,提示用户注意风险。从而解决了现有技术中,在终端设备连接网络为wifi网络时,不能很好的进行伪基站识别的问题。
S403、根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
本实施例通过根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常,只有确定基站异常时,才触发执行对待识别短信进行短信异常识别的操作,进一步提高伪基站识别效率。
实施例五
图5是本发明实施例五提供的一种伪基站短信识别装置的结构图。本实施例可适用于伪基站短信识别的情况,该装置可采用软件和/或硬件的方式实现,该装置可集成在终端设备中或终端设备的应用端中。其中,终端设备可以为但不限于为移动终端(平板电脑或智能手机)。
其中,应用端可以为内嵌于终端设备中的某个客户端的插件,或者为所述终端设备的操作系统的插件,与内嵌于终端设备中的伪基站短信识别客户端或者终端设备的操作系统中的伪基站短信识别应用程序配合使用;应用端也可以为所述终端设备中一个独立的可提供伪基站短信识别的客户端,本实施例对此不进行限制。
如图5所示,所述装置包括:异常识别模块501和伪基站短信确定模块502,其中:
异常识别模块501用于采用预先建立的短信异常识别模型对待识别短信进行异常识别;
伪基站短信确定模块502用于根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
本实施例的伪基站短信识别装置用于执行上述各实施例的伪基站短信识别方法,其技术原理和产生的技术效果类似,这里不再赘述。
在上述各实施例的基础上,所述装置还包括:文本提取模块503和模型训练模块504;
文本提取模块503用于提取已知伪基站短信的文本特征和/或已知正常短信的文本特征,并进行标记;
模型训练模块504用于采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型。
在上述各实施例的基础上,所述模型训练模块504具体用于:将标记后的文本特征划分为训练数据样本集和验证数据样本集;采用机器学习算法对所述训练数据样本集进行模型训练,得到初始短信异常识别模型;采用所述验证数据样本集对所述初始短信异常识别模型进行验证,若通过验证,则将所述初始短信异常识别模型作为所述短信异常识别模型。
在上述各实施例的基础上,所述装置还包括:基站异常确定模块505;
基站异常确定模块505用于根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常;若确定所述基站异常,则触发执行对待识别短信进行短信异常识别的操作。
在上述各实施例的基础上,所述基站异常确定模块505具体用于:所述云端接口请求消息中包含基站信息,根据所述基站信息查询正常基站信息库;若在所述正常基站信息库中未查询到所述基站信息,则确定对应的基站异常。
在上述各实施例的基础上,所述基站异常确定模块505还用于:若在所述正常基站信息库中查询到所述基站信息,则确定对应基站的地理位置是否正常;若所述地理位置不正常,则确定所述基站异常。
在上述各实施例的基础上,所述装置还包括:网络类型确定模块506;
网络类型确定模块506用于在所述终端设备接收到所述待识别短信时,确定所述终端设备当前使用的通信网络类型;根据所述网络通信类型触发执行对待识别短信进行短信异常识别的操作。
在上述各实施例的基础上,所述网络类型确定模块具体用于:若所述网络通信类型为移动网络类型,且采用所述移动网络类型首次请求云端接口失败后,则触发执行对待识别短信进行短信异常识别的操作;或所述网络通信类型为wifi网络类型,则触发执行对待识别短信进行短信异常识别的操作。
在上述各实施例的基础上,所述正常基站信息库中包含基站信息和/或终端设备的定位信息。
在上述各实施例的基础上,所述基站信息包含以下至少一项信息:移动国家号mcc、移动网络号码mnc、位置区码lac和基站标识cid。
上述各实施例所提供的伪基站短信识别装置可执行本发明任意实施例所提供的伪基站短信识别方法,具备执行伪基站短信识别方法相应的功能模块和有益效果。
实施例六
图6为本发明实施例六提供的一种设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图6显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图6所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的伪基站短信识别方法:
采用预先建立的短信异常识别模型对待识别短信进行异常识别;
根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
进一步的,所述方法还包括:
提取已知伪基站短信的文本特征和/或已知正常短信的文本特征,并进行标记;
采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型。
进一步的,所述采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型包括:
将标记后的文本特征划分为训练数据样本集和验证数据样本集;
采用机器学习算法对所述训练数据样本集进行模型训练,得到初始短信异常识别模型;
采用所述验证数据样本集对所述初始短信异常识别模型进行验证,若通过验证,则将所述初始短信异常识别模型作为所述短信异常识别模型。
进一步的,所述方法还包括:
根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常;
若确定所述基站异常,则触发执行对待识别短信进行短信异常识别的操作。
进一步的,所述根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常包括:
所述云端接口请求消息中包含基站信息,根据所述基站信息查询正常基站信息库;
若在所述正常基站信息库中未查询到所述基站信息,则确定对应的基站异常。
进一步的,所述方法还包括:
若在所述正常基站信息库中查询到所述基站信息,则确定对应基站的地理位置是否正常;
若所述地理位置不正常,则确定所述基站异常。
进一步的,所述方法还包括:
在所述终端设备接收到所述待识别短信时,确定所述终端设备当前使用的通信网络类型;
根据所述网络通信类型触发执行对待识别短信进行短信异常识别的操作。
进一步的,所述根据所述网络通信类型触发执行对待识别短信进行短信异常识别的操作包括:
若所述网络通信类型为移动网络类型,且采用所述移动网络类型首次请求云端接口失败后,则缓存所述待识别短信信息,待移动网络恢复后再次请求云端接口,并触发执行对待识别短信进行短信异常识别的操作;或所述网络通信类型为wifi网络类型,则触发执行对待识别短信进行短信异常识别的操作。
进一步的,所述正常基站信息库中包含基站信息和/或终端设备的定位信息。
进一步的,所述基站信息包含以下至少一项信息:移动国家号mcc、移动网络号码mnc、位置区码lac和基站标识cid。
实施例七
本发明实施例7还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的伪基站短信识别方法:
采用预先建立的短信异常识别模型对待识别短信进行异常识别;
根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
进一步的,所述方法还包括:
提取已知伪基站短信的文本特征和/或已知正常短信的文本特征,并进行标记;
采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型。
进一步的,所述采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型包括:
将标记后的文本特征划分为训练数据样本集和验证数据样本集;
采用机器学习算法对所述训练数据样本集进行模型训练,得到初始短信异常识别模型;
采用所述验证数据样本集对所述初始短信异常识别模型进行验证,若通过验证,则将所述初始短信异常识别模型作为所述短信异常识别模型。
进一步的,所述方法还包括:
根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常;
若确定所述基站异常,则触发执行对待识别短信进行短信异常识别的操作。
进一步的,所述根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常包括:
所述云端接口请求消息中包含基站信息,根据所述基站信息查询正常基站信息库;
若在所述正常基站信息库中未查询到所述基站信息,则确定对应的基站异常。
进一步的,所述方法还包括:
若在所述正常基站信息库中查询到所述基站信息,则确定对应基站的地理位置是否正常;
若所述地理位置不正常,则确定所述基站异常。
进一步的,所述方法还包括:
在所述终端设备接收到所述待识别短信时,确定所述终端设备当前使用的通信网络类型;
根据所述网络通信类型触发执行对待识别短信进行短信异常识别的操作。
进一步的,所述根据所述网络通信类型触发执行对待识别短信进行短信异常识别的操作包括:
若所述网络通信类型为移动网络类型,且采用所述移动网络类型首次请求云端接口失败后,则缓存所述待识别短信信息,待移动网络恢复后再次请求云端接口,并触发执行对待识别短信进行短信异常识别的操作;或所述网络通信类型为wifi网络类型,则触发执行对待识别短信进行短信异常识别的操作。
进一步的,所述正常基站信息库中包含基站信息和/或终端设备的定位信息。
进一步的,所述基站信息包含以下至少一项信息:移动国家号mcc、移动网络号码mnc、位置区码lac和基站标识cid。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (22)

1.一种伪基站短信识别方法,其特征在于,包括:
采用预先建立的短信异常识别模型对待识别短信进行异常识别;
根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
提取已知伪基站短信的文本特征和/或已知正常短信的文本特征,并进行标记;
采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型。
3.根据权利要求2所述的方法,其特征在于,所述采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型包括:
将标记后的文本特征划分为训练数据样本集和验证数据样本集;
采用机器学习算法对所述训练数据样本集进行模型训练,得到初始短信异常识别模型;
采用所述验证数据样本集对所述初始短信异常识别模型进行验证,若通过验证,则将所述初始短信异常识别模型作为所述短信异常识别模型。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常;
若确定所述基站异常,则触发执行对待识别短信进行短信异常识别的操作。
5.根据权利要求4所述的方法,其特征在于,所述根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常包括:
所述云端接口请求消息中包含基站信息,根据所述基站信息查询正常基站信息库;
若在所述正常基站信息库中未查询到所述基站信息,则确定对应的基站异常。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若在所述正常基站信息库中查询到所述基站信息,则确定对应基站的地理位置是否正常;
若所述地理位置不正常,则确定所述基站异常。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述终端设备接收到所述待识别短信时,确定所述终端设备当前使用的通信网络类型;
根据所述网络通信类型触发执行对待识别短信进行短信异常识别的操作。
8.根据权利要求7所述的方法,其特征在于,所述根据所述网络通信类型触发执行对待识别短信进行短信异常识别的操作包括:
若所述网络通信类型为移动网络类型,且采用所述移动网络类型首次请求云端接口失败后,则缓存所述待识别短信信息,待移动网络恢复后再次请求云端接口,并触发执行对待识别短信进行短信异常识别的操作;或所述网络通信类型为wifi网络类型,则触发执行对待识别短信进行短信异常识别的操作。
9.根据权利要求5所述的方法,其特征在于,所述正常基站信息库中包含基站信息和/或终端设备的定位信息。
10.根据权利要求5、6和9任一项所述的方法,其特征在于,所述基站信息包含以下至少一项信息:移动国家号mcc、移动网络号码mnc、位置区码lac和基站标识cid。
11.一种伪基站短信识别装置,其特征在于,包括:
异常识别模块,用于采用预先建立的短信异常识别模型对待识别短信进行异常识别;
伪基站短信确定模块,用于根据所述短信异常识别模型的输出结果确定所述待识别短信是否为伪基站短信。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
文本提取模块,用于提取已知伪基站短信的文本特征和/或已知正常短信的文本特征,并进行标记;
模型训练模块,用于采用机器学习算法对标记后的文本特征进行训练到短信异常识别模型。
13.根据权利要求12所述的装置,其特征在于,所述模型训练模块具体用于:将标记后的文本特征划分为训练数据样本集和验证数据样本集;采用机器学习算法对所述训练数据样本集进行模型训练,得到初始短信异常识别模型;采用所述验证数据样本集对所述初始短信异常识别模型进行验证,若通过验证,则将所述初始短信异常识别模型作为所述短信异常识别模型。
14.根据权利要求11-13任一项所述的装置,其特征在于,所述装置还包括:
基站异常确定模块,用于根据接收所述待识别短信的终端设备发送的云端接口请求消息确定当前发送所述待识别短信的基站是否异常;若确定所述基站异常,则触发执行对待识别短信进行短信异常识别的操作。
15.根据权利要求14所述的装置,其特征在于,所述基站异常确定模块具体用于:所述云端接口请求消息中包含基站信息,根据所述基站信息查询正常基站信息库;若在所述正常基站信息库中未查询到所述基站信息,则确定对应的基站异常。
16.根据权利要求15所述的装置,其特征在于,所述基站异常确定模块还用于:若在所述正常基站信息库中查询到所述基站信息,则确定对应基站的地理位置是否正常;若所述地理位置不正常,则确定所述基站异常。
17.根据权利要求11所述的装置,其特征在于,所述装置还包括:
网络类型确定模块,用于在所述终端设备接收到所述待识别短信时,确定所述终端设备当前使用的通信网络类型;根据所述网络通信类型触发执行对待识别短信进行短信异常识别的操作。
18.根据权利要求17所述的装置,其特征在于,所述网络类型确定模块具体用于:若所述网络通信类型为移动网络类型,且采用所述移动网络类型首次请求云端接口失败后,则缓存所述待识别短信信息,待移动网络恢复后再次请求云端接口,并触发执行对待识别短信进行短信异常识别的操作;或所述网络通信类型为wifi网络类型,则触发执行对待识别短信进行短信异常识别的操作。
19.根据权利要求15所述的装置,其特征在于,所述正常基站信息库中包含基站信息和/或终端设备的定位信息。
20.根据权利要求15、16和19任一项所述的装置,其特征在于,所述基站信息包含以下至少一项信息:移动国家号mcc、移动网络号码mnc、位置区码lac和基站标识cid。
21.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一所述的伪基站短信识别方法。
22.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10中任一所述的伪基站短信识别方法。
CN201710508881.1A 2017-06-28 2017-06-28 伪基站短信识别方法、装置、设备及存储介质 Active CN107295489B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710508881.1A CN107295489B (zh) 2017-06-28 2017-06-28 伪基站短信识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710508881.1A CN107295489B (zh) 2017-06-28 2017-06-28 伪基站短信识别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN107295489A true CN107295489A (zh) 2017-10-24
CN107295489B CN107295489B (zh) 2020-06-16

Family

ID=60099932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710508881.1A Active CN107295489B (zh) 2017-06-28 2017-06-28 伪基站短信识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN107295489B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108449752A (zh) * 2018-03-15 2018-08-24 浙江大学 一种伪基站取证设备及基于射频指纹的伪基站远程取证方法
CN109325691A (zh) * 2018-09-27 2019-02-12 上海观安信息技术股份有限公司 异常行为分析方法、电子设备及计算机程序产品
CN109362079A (zh) * 2018-11-05 2019-02-19 北京小米移动软件有限公司 数据处理方法及装置
CN109379743A (zh) * 2018-11-05 2019-02-22 北京小米移动软件有限公司 短信识别方法及装置
CN110062385A (zh) * 2019-04-28 2019-07-26 努比亚技术有限公司 垃圾短信屏蔽方法、移动终端及可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024746A (zh) * 2012-12-30 2013-04-03 清华大学 一种电信运营商垃圾短信处理系统及处理方法
CN103906116A (zh) * 2014-03-12 2014-07-02 上海风格信息技术股份有限公司 判断验证伪基站的方法
CN104702492A (zh) * 2015-03-19 2015-06-10 百度在线网络技术(北京)有限公司 垃圾消息模型训练方法、垃圾消息识别方法及其装置
CN105228143A (zh) * 2014-06-13 2016-01-06 中国移动通信集团公司 一种垃圾短信鉴别方法、装置和终端
CN105631049A (zh) * 2016-02-17 2016-06-01 北京奇虎科技有限公司 一种识别诈骗短信的方法和系统
CN105912500A (zh) * 2016-03-30 2016-08-31 百度在线网络技术(北京)有限公司 机器学习模型生成方法和装置
CN106572451A (zh) * 2016-10-28 2017-04-19 努比亚技术有限公司 一种终端和伪基站短信识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024746A (zh) * 2012-12-30 2013-04-03 清华大学 一种电信运营商垃圾短信处理系统及处理方法
CN103906116A (zh) * 2014-03-12 2014-07-02 上海风格信息技术股份有限公司 判断验证伪基站的方法
CN105228143A (zh) * 2014-06-13 2016-01-06 中国移动通信集团公司 一种垃圾短信鉴别方法、装置和终端
CN104702492A (zh) * 2015-03-19 2015-06-10 百度在线网络技术(北京)有限公司 垃圾消息模型训练方法、垃圾消息识别方法及其装置
CN105631049A (zh) * 2016-02-17 2016-06-01 北京奇虎科技有限公司 一种识别诈骗短信的方法和系统
CN105912500A (zh) * 2016-03-30 2016-08-31 百度在线网络技术(北京)有限公司 机器学习模型生成方法和装置
CN106572451A (zh) * 2016-10-28 2017-04-19 努比亚技术有限公司 一种终端和伪基站短信识别方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108449752A (zh) * 2018-03-15 2018-08-24 浙江大学 一种伪基站取证设备及基于射频指纹的伪基站远程取证方法
CN108449752B (zh) * 2018-03-15 2020-04-03 浙江大学 一种伪基站取证设备及基于射频指纹的伪基站远程取证方法
CN109325691A (zh) * 2018-09-27 2019-02-12 上海观安信息技术股份有限公司 异常行为分析方法、电子设备及计算机程序产品
CN109325691B (zh) * 2018-09-27 2020-10-16 上海观安信息技术股份有限公司 异常行为分析方法、电子设备及计算机程序产品
CN109362079A (zh) * 2018-11-05 2019-02-19 北京小米移动软件有限公司 数据处理方法及装置
CN109379743A (zh) * 2018-11-05 2019-02-22 北京小米移动软件有限公司 短信识别方法及装置
CN109362079B (zh) * 2018-11-05 2023-09-12 北京小米移动软件有限公司 数据处理方法及装置
CN110062385A (zh) * 2019-04-28 2019-07-26 努比亚技术有限公司 垃圾短信屏蔽方法、移动终端及可读存储介质
CN110062385B (zh) * 2019-04-28 2023-06-02 深圳中网讯通技术有限公司 垃圾短信屏蔽方法、移动终端及可读存储介质

Also Published As

Publication number Publication date
CN107295489B (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
CN107295489A (zh) 伪基站短信识别方法、装置、设备及存储介质
CN107872772B (zh) 诈骗短信的检测方法及装置
CN107798110A (zh) 兴趣点地址校验方法、装置、服务器及存储介质
CN107273531A (zh) 电话号码分类识别方法、装置、设备及存储介质
US20130024215A1 (en) Insurance quoting application for handheld device
CN103150777A (zh) 一种移动考勤方法及系统
US9532216B2 (en) Method of authenticating user, server and mobile terminal performing the same
US10225687B2 (en) Content providing system based on location information recognition
CN108986789A (zh) 语音识别方法、装置、存储介质及电子设备
CN107958215A (zh) 一种防欺诈识别方法、装置、服务器及存储介质
US11914774B1 (en) Dynamic interface flow based on device location
CN109803232A (zh) 位置关系的确定方法及装置、设备及存储介质
CN113556167B (zh) 一种数据管理方法、装置、电子设备及存储介质
CN106464502A (zh) 用于通信装置的认证的方法和系统
CN107943724A (zh) 一种寻找外接设备的方法、装置、终端设备及存储介质
CN109657148B (zh) 针对上报poi的异常操作识别方法、装置、服务器和介质
CN114223222A (zh) 终端支付方法、装置、终端设备及计算机可读取存储介质
CN104038900A (zh) 一种定位方法和设备
CN108399546A (zh) 识别虚假定位的方法、装置、设备及存储介质
US20190274115A1 (en) Electronic device and method for determining entry of region of interest of electronic device
CN110909804B (zh) 基站异常数据的检测方法、装置、服务器和存储介质
CN113076533B (zh) 一种业务处理方法及装置
US20190295065A1 (en) Affiliated store labeling method, affiliated store labeling device, and affiliated store labeling system for wireless lan fingerprint
US9532167B2 (en) Mobile terminal, location information related content providing server, content panel display method, and mobile terminal program
CN106772480A (zh) 基于北斗短报文的定位终端、定位系统及定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant