CN107517463A - 一种电话号码的识别方法和装置 - Google Patents
一种电话号码的识别方法和装置 Download PDFInfo
- Publication number
- CN107517463A CN107517463A CN201610431411.5A CN201610431411A CN107517463A CN 107517463 A CN107517463 A CN 107517463A CN 201610431411 A CN201610431411 A CN 201610431411A CN 107517463 A CN107517463 A CN 107517463A
- Authority
- CN
- China
- Prior art keywords
- sample
- identified
- telephone number
- call
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/30—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
- H04L63/302—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information gathering intelligence information for situation awareness or reconnaissance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/30—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
- H04L63/308—Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information retaining data, e.g. retaining successful, unsuccessful communication attempts, internet access, or e-mail, internet telephony, intercept related information or call content
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Technology Law (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明实施例公开了一种电话号码的识别方法,该方法包括:获取待识别电话号码;根据所述待识别电话号码获取对应的属性信息;从所述属性信息中提取属性特征;将所述属性特征输入预设的识别模型,得到所述待识别电话号码的识别结果,其中,所述预设的识别模型以所述属性特征为分类参数,所述识别结果用于指示所述待识别电话号码是否为恶意号码。本发明实施例还同时公开了一种电话号码的识别装置。
Description
技术领域
本发明涉及移动通信技术领域,尤其涉及一种电话号码的识别方法和装置。
背景技术
现今,诈骗电话和诈骗短信日益增加,严重影响到了广大用户的财产安全和用户体验,为了减少恶意的电话呼叫和恶意短信,采用了一些识别恶意电话号码的方法。
在现有技术中,识别恶意电话号码的方法主要有两种,第一种是通过在手机上的软件,通过用户自发的去标记他们接收到的号码,服务器记录下大量用户的标记信息之后建立号码标记数据库,服务器用下发的方式提示终端用户所接收到的号码是否为恶意号码;第二种是利用语音识别技术,通过识别通话中是否出现关键语音语义,来识别出号码是否为恶意号码;然而,通过软件的方法,标记信息未必完全准确,并且数据更新滞后,通过语音识别技术的方法,需要对核心网进行改造,设备成本较高,并且仅适用于录音类诈骗电话,而且语音技术识别的准确性较低。
发明内容
有鉴于此,本发明实施例期望提供一种电话号码的识别方法的装置,以解决现有技术中存在的如何及时准确地识别出恶意的电话号码的技术问题,提高了用户的体验度,降低了诈骗事件发生的概率。
为达到上述目的,本发明的技术方案是这样实现的:
第一方面,本发明实施例提供一种电话号码的识别方法,包括:获取待识别电话号码;根据所述待识别电话号码获取对应的属性信息;从所述属性信息中提取属性特征;将所述属性特征输入预设的识别模型,得到所述待识别电话号码的识别结果,其中,所述预设的识别模型以所述属性特征为分类参数,所述识别结果用于指示所述待识别电话号码是否为恶意号码。
进一步地,所述属性信息包括通话行为信息和/或网络标记信息,所述根据所述待识别电话号码获取对应的属性信息,包括:根据所述待识别电话号码获取对应的话单,根据所述话单获取所述待识别电话号码的通话行为信息;和/或,根据所述待识别电话号码,在万维网上进行搜索,得到所述待识别电话号码的网络标记信息。
进一步地,所述属性特征包括通话行为特征,相应地,所述从所述属性信息中提取属性特征,包括:从所述待识别电话号码的通话行为信息中获取预设时间内的通话行为信息;从所述预设时间内的通话行为信息中提取通话行为特征,其中,所述通话行为特征包括呼叫次数、接通率、短通话比例、长通话比例。
进一步地,所述属性特征包括网络标记特征,相应地,所述从所述属性信息中提取属性特征,包括:从所述待识别电话号码的网络标记信息中提取网络标记特征,其中,所述网络标记特征包括:标记来源、标记人数或条数、电话号码类型。
进一步地,在所述将所述属性特征输入预设的识别模型,得到所述待识别电话号码的识别结果之前,所述方法还包括:确定所述样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于非恶意号码的样本,所述负样本为属于恶意号码的样本;获取样本的属性信息;从所述样本的属性信息中提取所述样本的属性特征;将所述样本属性特征输入设置的训练模型,得到训练结果,所述训练模型以所述属性特征为分类参数;判断所述训练结果是否符合所述样本的样本类型;如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
第二方面,本发明实施例提供电话号码的识别装置,包括:第一获取模块,用于获取待识别电话号码;第二获取模块,用于根据所述待识别电话号码获取对应的属性信息;提取模块,用于从所述属性信息中提取属性特征;识别模块,用于将所述属性特征输入预设的识别模型,得到所述待识别电话号码的识别结果,其中,所述预设的识别模型以所述属性特征为分类参数,所述识别结果用于指示所述待识别电话号码是否为恶意号码。
进一步地,所述属性信息包括通话行为信息和/或网络标记信息,所述第二获取模块具体用于:根据所述待识别电话号码获取对应的话单,根据所述话单获取所述待识别电话号码的通话行为信息;和/或,根据所述待识别电话号码,在万维网上进行搜索,得到所述待识别电话号码的网络标记信息。
进一步地,所述属性特征包括通话行为特征,相应地,所述提取模块具体用于:从所述待识别电话号码的通话行为信息中获取预设时间内的通话行为信息;从所述预设时间内的通话行为信息中提取通话行为特征,其中,所述通话行为特征包括呼叫次数、接通率、短通话比例、长通话比例。
进一步地,所述属性特征包括网络标记特征,相应地,所述提取模块具体还用于:从所述待识别电话号码的网络标记信息中提取网络标记特征,其中,所述网络标记特征包括:标记来源、标记人数或条数、电话号码类型。
进一步地,所述装置还包括:训练模块,用于在所述将所述属性特征输入预设的识别模型,得到所述待识别电话号码的识别结果之前,确定所述样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于非恶意号码的样本,所述负样本为属于恶意号码的样本;获取样本的属性信息;从所述样本的属性信息中提取所述样本的属性特征;将所述样本属性特征输入设置的训练模型,得到训练结果,所述训练模型以所述属性特征为分类参数;判断所述训练结果是否符合所述样本的样本类型;如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
本发明实施例所提供的电话号码的识别方法和装置,电话号码的识别装置获取待识别电话号码,根据待识别电话号码获取对应的属性信息,然后从属性信息中提取出属性特征,最后将属性特征输入预设的识别模型,通过预设的识别模型来得到待识别电话号码的识别结果,这样,识别模型以待识别电话号码的属性特征为分类参数,对待识别电话号码进行识别,由于获取到的属性特征可以反映出待识别电话号码的使用情况,所以,以属性特征为分类参数来识别可以增加识别结果的准确性,并且识别模型在接收到属性特征之后能够快速的得出识别结果,那么,对于用户来说,使用该方法可以及时准确地识别出恶意号码,提高了用户的体验度,降低了诈骗事件发生的概率。
附图说明
图1为本发明实施例中的电话号码的识别方法的流程示意图;
图2为本发明实施例中的识别模型的建立方法的流程示意图;
图3为本发明实施例中的电话号码的识别方法的一种实例的流程示意图;
图4为本发明实施例中的电话号码的识别装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明实施例提供一种电话号码的识别方法,该方法应用于电话号码的识别装置(以下简称为识别装置)。图1为本发明实施例中的电话号码的识别方法的流程示意图,如图1所示,该电话号码的识别方法包括:
S101:获取待识别电话号码;
这里,识别装置可以设置在核心网中,当呼叫终端发出呼叫,在被呼叫终端没有接收到呼叫终端的呼叫之前,当识别装置设置于核心网中时,呼叫终端的电话号码经基站发送至核心网中时,识别装置获取呼叫终端的电话号码,并将呼叫终端的电话号码作为待识别电话号码,对待识别电话号码进行识别;其中,上述呼叫终端可以为手机、固话、网络电话、伪基站,这里,本发明不做具体限定。
S102:根据待识别电话号码获取对应的属性信息;
其中,上述属性信息可以包括通话行为信息和/或网络标记信息,在一种实施例中,为了获取到与待识别电话号码对应的通话行为信息,S102可以包括:根据待识别电话号码获取对应的话单,根据话单获取待识别电话号码的通话行为信息;
其中,识别装置可以从运营商的服务器中获取到待识别电话号码对应的话单,话单中记录有待识别电话号码的通话记录,根据通话记录可以获取到待识别电话号码的通话行为信息,这里,通话行为信息可以为呼叫号码,呼叫时间,呼叫时长等等,这里,本发明不做具体限定。
在另一种实施例中,为了获取到网络标记信息,S102可以包括:根据待识别电话号码,在万维网上进行搜索,得到待识别电话号码的网络标记信息。
其中,识别装置自身可以在万维网上进行搜索,搜索可以采用网络爬虫的方式、或者利用搜索引擎进行关键词搜索的方式、或者采用自然语言处理的方式,例如,利用网络爬虫的方式是将上述的待识别电话号码放到网页爬虫程序中,然后爬虫程序会在www.baidu.com和www.so.com等搜索引擎中搜索待识别电话号码的信息,采用网络爬虫可以从万维网上抓取到更多的网络标记信息,进而提取出更加全面的网络标记特征,增加了识别结果的准确性,其中,网络标记信息可以为:被手机助手、号码通软件标记的信息,标记的人数,以及论坛、贴吧的网友反馈信息等等,另外,通过搜索来获取到的网络标记信息可以为文本信息、图片、视频等等;这里,本发明不做具体限定。
这里,需要说明的是,上述属性信息至少可以包括三种组成形式,那么,识别装置获取属性信息的方式至少可以通过以下三种方式来实现:
第一种,上述属性信息包括通话行为信息,那么,识别装置根据待识别电话号码获取通话行为信息,然后以通话行为信息为基础来识别待识别电话号码是否为恶意号码,由于通话行为信息可以反映出待识别电话号码的历史通话记录,以历史通话记录为基础来识别待识别电话号码使得识别结果更加准确。
第二种,上述属性信息包括网络标记信息,那么,识别装置根据待识别电话号码获取网络标记信息,然后以网络标记信息为基础来识别待识别电话号码是否为恶意号码,由于网络标记信息可以反映出网友对于待识别电话号码的评论信息,网友的评论信息具有覆盖面广的特点,那么以网友的评论信息为基础来识别待识别电话号码大大增加了识别结果的准确性。
第三种,上述属性信息包括通话行为信息和网络标记信息,那么,识别装置根据待识别电话号码不仅获取通话行为信息还要获取网络标记信息,然后以通话行为信息和网络标记信息为基础来识别待识别电话号码是否为恶意号码,通过获取到的两种信息来识别,由于获取到的属性信息的内容更多更全面,以此为基础来识别可以进一步地增强识别结果的准确性。
S103:从属性信息中提取属性特征;
识别装置获取到待识别电话号码的通话行为信息和网络标记信息,可以从通话行为信息和网络标记信息中提取出属性特征,该属性特征可以用于判定待识别电话号码是否为恶意号码。
上述属性特征包括通话行为特征,那么,在获取到通话行为信息后,为了从通话行为信息中提取出通话行为特征,S103可以包括:从待识别电话号码的通话行为信息中获取预设时间内的通话行为信息;从预设时间内的通话行为信息中提取通话行为特征,其中,通话行为特征包括呼叫次数、接通率、短通话比例、长通话比例。
这里,需要说明的是,为了提高识别装置的识别效率,在获取到待识别电话号码的通话行为信息之后,首先,获取预设时间内的通话行为信息,然后从预设时间内的通话行为信息中提取通话行为特征,这样,仅仅从预设时间内的通话行为信息中提取通话行为特征,提高了提取通话行为特征的效率,进而也就提高了识别装置的识别效率。
上述预设时间可以是一个固定周期,例如,一天之内的某一固定时间,上述通话行为特征具体还可以包括:呼叫密度、平均通话时长、小于15秒的通话比例、小于60秒的通话比例、小于5分钟的通话比例、大于10分钟的通话比例、是否近3天出现等等,这里,本发明不做具体限定。
上述属性特征包括网络标记特征,那么,在获取到网络标记信息后,为了从网络标记信息中提取出网络标记特征,S103可以包括:从待识别电话号码的网络标记信息中提取网络标记特征,其中,网络标记特征包括:标记来源、标记人数或条数、电话号码类型。
其中,在获取网络标记信息之后,通过统计的方法可以提取出网络标记特征,上述网络标记特征的标记来源可以包括:百度手机助手、论坛、360手机助手等等;上述标记人数或条数为每种标记来源的人数或条数;上述电话号码的类型包括:响一声电话、骚扰电话、诈骗电话、广告推销电话、保险理财电话、快递送餐电话、房产中介电话等等,这里,本发明对于标记来源和电话号码的类型不做具体限定。
S104:将属性特征输入预设的识别模型,得到待识别电话号码的识别结果。
其中,预设的识别模型以属性特征为分类参数,识别结果用于指示待识别电话号码是否为恶意号码。
在获取到属性特征之后,将属性特征输入至预设的识别模型中,由于识别模型是以属性特征为分类参数,所以,识别模型基于属性特征进行识别,可以得到识别结果,即可得知待识别电话号码是否为恶意号码;其中,上述识别模型可以为对机器学习算法进行模型训练来得到,利用上述识别模型对待识别电话号码进行识别,能够快速的识别出待识别号码是否为恶意号码;在一种可选的实施例中,为了得到识别模型,S104之前可以包括:
确定样本的样本类型,样本类型包括正样本和负样本,正样本为属于非恶意号码的样本,负样本为属于恶意号码的样本;获取样本的属性信息;从样本的属性信息中提取样本的属性特征;将样本属性特征输入设置的训练模型,得到训练结果,训练模型以属性特征为分类参数;判断训练结果是否符合样本的样本类型;如果训练结果不满足样本的样本类型,则调整训练模型的模型参数直至训练结果满足样本的样本类型,将训练结果满足样本的样本类型的训练模型作为预设的识别模型输出。
其中,在确定出样本之后,获取样本的属性信息的方法同上述S102,获取样本的通话行为信息和网络标记信息,然后从通话行为信息中提取出属性特征中的通话行为特征,从网络标记信息中提取出属性特征中的网络标记特征,获取属性特征的方法同S103,那么,将上述属性特征输入至训练模型中进行训练得到识别模型;其中,上述训练模型可以为机器学习算法,该机器学习算法可以包括:决策树算法、神经网络算法、支持向量机算法。
本发明实施例所提供的电话号码的识别方法,识别装置获取待识别电话号码,根据待识别电话号码获取对应的属性信息,然后从属性信息中提取出属性特征,最后将属性特征输入预设的识别模型,通过预设的识别模型来得到待识别电话号码的识别结果,这样,识别模型以待识别电话号码的属性特征为分类参数,对待识别电话号码进行识别,由于获取到的属性特征可以反映出待识别电话号码的使用情况,所以,以属性特征为分类参数来识别可以增加识别结果的准确性,并且识别模型在接收到属性特征之后能够快速的得出识别结果,那么,对于用户来说,使用该方法可以及时准确地识别出恶意号码,提高了用户的体验度,降低了诈骗事件发生的概率。
下面以具体实例来对上述一个或多个实施例中识别模型的建立方法进行说明。
图2为本发明实施例中的识别模型的建立方法的流程示意图,如图2所示,该建立方法包括:
S201:识别装置确定样本,样本的样本类型中包括正样本和负样本,正样本是在号码库中随机抽取的一定数量的非恶意频繁呼叫的电话号码,负样本为一定数量的已确认的恶意号码,恶意号码可以为投诉、回拨验证、公安系统转交的号码,将这两批号码作为样本;
S202:识别装置通过话单历史数据库获取上述样本的通话行为信息,并且利用网络爬虫获取样本的网络标记信息;
S203:识别装置从样本的通话行为信息中提取一段历史通话记录,统计每个号码的通话行为特征,每个号码的通话行为特征包括:呼叫密度、呼叫次数、接通率、平均通话时长、小于15秒的通话比例、小于60秒的通话比例、小于5分钟的通话比例、大于10分钟的通话比例、是否近3天出现;同时,电话号码的识别装置将样本中的每个号码放到网页爬虫程序中,爬虫程序会逐个将号码在www.baidu.com和www.so.com等搜索引擎中搜索待识别电话号码的信息,这些信息可以包括:被手机助手、号码通软件标记的信息,标记的人数,以及论坛、贴吧的网友反馈信息,然后将从获取到的网络标记信息进行分类,将网络标记信息通过文本挖掘得到三种网络标记特征,三种网络标记特征包括:标记来源、标记人数或条数、电话号码类型;
S204:识别装置将获取到的通话行为特征和网络标记特征输入有监督的机器学习算法中,得到训练结果,直至训练结果满足样本的样本类型;
S205:将训练结果满足样本的样本类型的训练模型作为预设的识别模型输出,即得到识别模型。
下面以具体实例来对上述一个或多个实施例中电话号码的识别方法进行说明。
图3为本发明实施例中的电话号码的识别方法的一种实例的流程示意图,如图3所示,该识别方法包括:
S301:识别装置获取待识别电话号码;
S302:识别装置从话单数据库中获取预设时间内的通话行为信息,且通过网络爬虫获取网络标记信息;
S303:识别装置从通话行为信息中提取出通话行为特征,且从网络标记信息中提取出网络标记特征;并将通话行为特征和网络标记特征输入识别模型;
S304:识别装置中的识别模型接收到通话行为特征和网络标记特征,对待识别电话号码进行识别;
S305:识别装置得到识别结果,其中,识别结果包括恶意号码和正常号码,将恶意号码根据预设的策略执行拦截。
基于上述识别方法,通过识别模型来对待识别电话号码进行识别,将属性特征输入识别模型使得一个号码的识别时长缩短,且识别的过程不受限于硬件设备等因素,提高了识别效率,可以解决海量号码的识别问题,该方法是基于待识别号码的属性信息,那么,识别装置只需获取到待识别电话号码的属性信息就可以快速对新出现号码进行识别,例如,在实际应用中,据统计,30%的恶意号码使用时间小于3天,采用现有技术的方法,由于新出现的恶意号码使用时间较短,用户未及时标记该号码,使得服务器中没有及时在恶意号码库中存储有该号码,而对于新出现的恶意号码采用本发明实施例提供的上述识别方法,识别装置在获取到新出现号码之后,获取近几天的通话行为信息和网络标记信息,并提取出通话行为特征和网络标记特征,最后识别模型以通话行为特征和网路标记特征为分类参数,对待识别电话号码进行识别,这样,可以快速准确的得到识别结果,那么,对于新出现的恶意号码可以及时准确地识别出来,弥补了现有技术中的不足,大大提高了恶意号码的识别效率。
基于同一发明构思,本实施例提供一种电话号码的识别装置,该装置可以设置于核心网中,图4为本发明实施例中的电话号码的识别装置的结构示意图,如图4所示,该电话号码的识别装置包括:第一获取模块41、第二获取模块42、提取模块43和识别模块44;
其中,第一获取模块41,用于获取待识别电话号码;第二获取模块42,用于根据待识别电话号码获取对应的属性信息;提取模块43,用于从属性信息中提取属性特征;识别模块44,用于将属性特征输入预设的识别模型,得到待识别电话号码的识别结果,其中,预设的识别模型以属性特征为分类参数,识别结果用于指示待识别电话号码是否为恶意号码。
属性信息包括通话行为信息和/或网络标记信息,为了获取到通话行为信息和网络标记信息,第二获取模块42具体用于:根据待识别电话号码获取对应的话单,根据话单获取待识别电话号码的通话行为信息;和/或,根据待识别电话号码,在万维网上进行搜索,得到待识别电话号码的网络标记信息。
属性特征包括通话行为特征,相应地,为了从属性信息中提取出通话行为特征,提取模块43具体用于:从待识别电话号码的通话行为信息中获取预设时间内的通话行为信息;从预设时间内的通话行为信息中提取通话行为特征,其中,通话行为特征包括呼叫次数、接通率、短通话比例、长通话比例。
属性特征包括网络标记特征,相应地,为了从属性信息中提取出网络标记特征,提取模块43具体还用于:从待识别电话号码的网络标记信息中提取网络标记特征,其中,网络标记特征包括:标记来源、标记人数或条数、电话号码类型。
为了得到识别模型,上述装置还包括:训练模块,用于在将属性特征输入预设的识别模型,得到待识别电话号码的识别结果之前,确定样本的样本类型,样本类型包括正样本和负样本,正样本为属于非恶意号码的样本,负样本为属于恶意号码的样本;获取样本的属性信息;从样本的属性信息中提取样本的属性特征;将样本属性特征输入设置的训练模型,得到训练结果,训练模型以属性特征为分类参数;判断训练结果是否符合样本的样本类型;如果训练结果不满足样本的样本类型,则调整训练模型的模型参数直至训练结果满足样本的样本类型,将训练结果满足样本的样本类型的训练模型作为预设的识别模型输出。
本发明实施例所提供的电话号码的识别装置,第一获取模块41获取待识别电话号码,第二获取模块42根据待识别电话号码获取对应的属性信息,然后提取模块43从属性信息中提取出属性特征,最后识别模块44将属性特征输入预设的识别模型,通过预设的识别模型来得到待识别电话号码的识别结果,这样,识别模型以待识别电话号码的属性特征为分类参数,对待识别电话号码进行识别,由于获取到的属性特征可以反映出待识别电话号码的使用情况,所以,以属性特征为分类参数来识别可以增加识别结果的准确性,并且识别模型在接收到属性特征之后能够快速的得出识别结果,那么,对于用户来说,使用该方法可以及时准确地识别出恶意号码,提高了用户的体验度,降低了诈骗事件发生的概率。
这里需要指出的是:以上装置实施例项的描述,与上述方法描述是类似的,具有同方法实施例相同的有益效果,因此不做赘述。对于本发明装置实施例中未披露的技术细节,本领域的技术人员请参照本发明方法实施例的描述而理解,为节约篇幅,这里不再赘述。
这里需要指出的是:
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种电话号码的识别方法,其特征在于,包括:
获取待识别电话号码;
根据所述待识别电话号码获取对应的属性信息;
从所述属性信息中提取属性特征;
将所述属性特征输入预设的识别模型,得到所述待识别电话号码的识别结果,其中,所述预设的识别模型以所述属性特征为分类参数,所述识别结果用于指示所述待识别电话号码是否为恶意号码。
2.根据权利要求1所述的方法,其特征在于,所述属性信息包括通话行为信息和/或网络标记信息,所述根据所述待识别电话号码获取对应的属性信息,包括:
根据所述待识别电话号码获取对应的话单,根据所述话单获取所述待识别电话号码的通话行为信息;
和/或,
根据所述待识别电话号码,在万维网上进行搜索,得到所述待识别电话号码的网络标记信息。
3.根据权利要求2所述的方法,其特征在于,所述属性特征包括通话行为特征,相应地,所述从所述属性信息中提取属性特征,包括:
从所述待识别电话号码的通话行为信息中获取预设时间内的通话行为信息;
从所述预设时间内的通话行为信息中提取通话行为特征,其中,所述通话行为特征包括呼叫次数、接通率、短通话比例、长通话比例。
4.根据权利要求2所述的方法,其特征在于,所述属性特征包括网络标记特征,相应地,所述从所述属性信息中提取属性特征,包括:
从所述待识别电话号码的网络标记信息中提取网络标记特征,其中,所述网络标记特征包括:标记来源、标记人数或条数、电话号码类型。
5.根据权利要求1所述的方法,其特征在于,在所述将所述属性特征输入预设的识别模型,得到所述待识别电话号码的识别结果之前,所述方法还包括:
确定所述样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于非恶意号码的样本,所述负样本为属于恶意号码的样本;
获取样本的属性信息;
从所述样本的属性信息中提取所述样本的属性特征;
将所述样本属性特征输入设置的训练模型,得到训练结果,所述训练模型以所述属性特征为分类参数;
判断所述训练结果是否符合所述样本的样本类型;
如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
6.一种电话号码的识别装置,其特征在于,包括:
第一获取模块,用于获取待识别电话号码;
第二获取模块,用于根据所述待识别电话号码获取对应的属性信息;
提取模块,用于从所述属性信息中提取属性特征;
识别模块,用于将所述属性特征输入预设的识别模型,得到所述待识别电话号码的识别结果,其中,所述预设的识别模型以所述属性特征为分类参数,所述识别结果用于指示所述待识别电话号码是否为恶意号码。
7.根据权利要求6所述的装置,其特征在于,所述属性信息包括通话行为信息和/或网络标记信息,所述第二获取模块具体用于:根据所述待识别电话号码获取对应的话单,根据所述话单获取所述待识别电话号码的通话行为信息;和/或,根据所述待识别电话号码,在万维网上进行搜索,得到所述待识别电话号码的网络标记信息。
8.根据权利要求7所述的装置,其特征在于,所述属性特征包括通话行为特征,相应地,所述提取模块具体用于:从所述待识别电话号码的通话行为信息中获取预设时间内的通话行为信息;从所述预设时间内的通话行为信息中提取通话行为特征,其中,所述通话行为特征包括呼叫次数、接通率、短通话比例、长通话比例。
9.根据权利要求7所述的装置,其特征在于,所述属性特征包括网络标记特征,相应地,所述提取模块具体还用于:从所述待识别电话号码的网络标记信息中提取网络标记特征,其中,所述网络标记特征包括:标记来源、标记人数或条数、电话号码类型。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
训练模块,用于在所述将所述属性特征输入预设的识别模型,得到所述待识别电话号码的识别结果之前,确定所述样本的样本类型,所述样本类型包括正样本和负样本,所述正样本为属于非恶意号码的样本,所述负样本为属于恶意号码的样本;
获取样本的属性信息;
从所述样本的属性信息中提取所述样本的属性特征;
将所述样本属性特征输入设置的训练模型,得到训练结果,所述训练模型以所述属性特征为分类参数;
判断所述训练结果是否符合所述样本的样本类型;
如果所述训练结果不满足所述样本的样本类型,则调整所述训练模型的模型参数直至所述训练结果满足所述样本的样本类型,将所述训练结果满足所述样本的样本类型的训练模型作为预设的识别模型输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610431411.5A CN107517463A (zh) | 2016-06-15 | 2016-06-15 | 一种电话号码的识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610431411.5A CN107517463A (zh) | 2016-06-15 | 2016-06-15 | 一种电话号码的识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107517463A true CN107517463A (zh) | 2017-12-26 |
Family
ID=60721422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610431411.5A Pending CN107517463A (zh) | 2016-06-15 | 2016-06-15 | 一种电话号码的识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107517463A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109327627A (zh) * | 2018-11-27 | 2019-02-12 | 深圳声笑科技有限公司 | 基于区块链的电话号码识别方法、装置及存储介质 |
CN109711984A (zh) * | 2019-01-23 | 2019-05-03 | 北京市天元网络技术股份有限公司 | 一种基于催收的贷前风险监控方法及装置 |
CN109995924A (zh) * | 2017-12-30 | 2019-07-09 | 中国移动通信集团贵州有限公司 | 欺诈电话识别方法、装置、设备及介质 |
CN109995925A (zh) * | 2019-02-27 | 2019-07-09 | 努比亚技术有限公司 | 一种骚扰电话识别方法、终端及计算机可读存储介质 |
CN110113748A (zh) * | 2019-05-07 | 2019-08-09 | 中国联合网络通信集团有限公司 | 骚扰电话监控方法、装置 |
CN110263157A (zh) * | 2019-05-24 | 2019-09-20 | 阿里巴巴集团控股有限公司 | 一种数据风险预测方法、装置及设备 |
CN110351731A (zh) * | 2018-04-08 | 2019-10-18 | 中兴通讯股份有限公司 | 一种手机号码防欺诈的方法及装置 |
CN110401779A (zh) * | 2018-04-24 | 2019-11-01 | 中国移动通信集团有限公司 | 一种识别电话号码的方法、装置和计算机可读存储介质 |
CN110572523A (zh) * | 2019-07-21 | 2019-12-13 | 天津五八到家科技有限公司 | 电话号码查询、拨打电话方法和设备 |
CN111432080A (zh) * | 2018-12-24 | 2020-07-17 | 北京奇虎科技有限公司 | 话单数据处理方法、电子设备及计算机可读存储介质 |
CN111654866A (zh) * | 2020-05-29 | 2020-09-11 | 北京合力思腾科技股份有限公司 | 移动通讯防诈骗的方法、装置及计算机存储介质 |
CN112261654A (zh) * | 2020-09-23 | 2021-01-22 | 中国地质大学(武汉) | 一种用于电信反欺诈中生成手机号白名单的方法及系统 |
CN110401780B (zh) * | 2018-04-25 | 2021-05-11 | 中国移动通信集团广东有限公司 | 一种识别诈骗电话的方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104320525A (zh) * | 2014-09-19 | 2015-01-28 | 小米科技有限责任公司 | 电话号码识别方法及装置 |
CN104717674A (zh) * | 2014-12-02 | 2015-06-17 | 北京奇虎科技有限公司 | 号码属性识别方法、装置、终端和服务器 |
CN105488025A (zh) * | 2015-11-24 | 2016-04-13 | 小米科技有限责任公司 | 模板构建方法和装置、信息识别方法和装置 |
-
2016
- 2016-06-15 CN CN201610431411.5A patent/CN107517463A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104320525A (zh) * | 2014-09-19 | 2015-01-28 | 小米科技有限责任公司 | 电话号码识别方法及装置 |
CN104717674A (zh) * | 2014-12-02 | 2015-06-17 | 北京奇虎科技有限公司 | 号码属性识别方法、装置、终端和服务器 |
CN105488025A (zh) * | 2015-11-24 | 2016-04-13 | 小米科技有限责任公司 | 模板构建方法和装置、信息识别方法和装置 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109995924A (zh) * | 2017-12-30 | 2019-07-09 | 中国移动通信集团贵州有限公司 | 欺诈电话识别方法、装置、设备及介质 |
CN110351731A (zh) * | 2018-04-08 | 2019-10-18 | 中兴通讯股份有限公司 | 一种手机号码防欺诈的方法及装置 |
CN110401779B (zh) * | 2018-04-24 | 2022-02-01 | 中国移动通信集团有限公司 | 一种识别电话号码的方法、装置和计算机可读存储介质 |
CN110401779A (zh) * | 2018-04-24 | 2019-11-01 | 中国移动通信集团有限公司 | 一种识别电话号码的方法、装置和计算机可读存储介质 |
CN110401780B (zh) * | 2018-04-25 | 2021-05-11 | 中国移动通信集团广东有限公司 | 一种识别诈骗电话的方法及装置 |
CN109327627A (zh) * | 2018-11-27 | 2019-02-12 | 深圳声笑科技有限公司 | 基于区块链的电话号码识别方法、装置及存储介质 |
CN111432080A (zh) * | 2018-12-24 | 2020-07-17 | 北京奇虎科技有限公司 | 话单数据处理方法、电子设备及计算机可读存储介质 |
CN109711984A (zh) * | 2019-01-23 | 2019-05-03 | 北京市天元网络技术股份有限公司 | 一种基于催收的贷前风险监控方法及装置 |
CN109995925A (zh) * | 2019-02-27 | 2019-07-09 | 努比亚技术有限公司 | 一种骚扰电话识别方法、终端及计算机可读存储介质 |
CN110113748A (zh) * | 2019-05-07 | 2019-08-09 | 中国联合网络通信集团有限公司 | 骚扰电话监控方法、装置 |
CN110113748B (zh) * | 2019-05-07 | 2022-08-02 | 中国联合网络通信集团有限公司 | 骚扰电话监控方法、装置 |
CN110263157A (zh) * | 2019-05-24 | 2019-09-20 | 阿里巴巴集团控股有限公司 | 一种数据风险预测方法、装置及设备 |
CN110572523A (zh) * | 2019-07-21 | 2019-12-13 | 天津五八到家科技有限公司 | 电话号码查询、拨打电话方法和设备 |
CN111654866A (zh) * | 2020-05-29 | 2020-09-11 | 北京合力思腾科技股份有限公司 | 移动通讯防诈骗的方法、装置及计算机存储介质 |
CN112261654A (zh) * | 2020-09-23 | 2021-01-22 | 中国地质大学(武汉) | 一种用于电信反欺诈中生成手机号白名单的方法及系统 |
CN112261654B (zh) * | 2020-09-23 | 2021-08-03 | 中国地质大学(武汉) | 一种用于电信反欺诈中生成手机号白名单的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107517463A (zh) | 一种电话号码的识别方法和装置 | |
CN110401779B (zh) | 一种识别电话号码的方法、装置和计算机可读存储介质 | |
CN109509021B (zh) | 基于行为轨迹的异常识别方法、装置、服务器及存储介质 | |
WO2017186090A1 (zh) | 通信号码处理方法及装置 | |
CN105306495B (zh) | 用户识别方法和装置 | |
CN102572839A (zh) | 一种控制语音通信的方法和系统 | |
CN110149266A (zh) | 垃圾邮件识别方法及装置 | |
CN107368856A (zh) | 恶意软件的聚类方法及装置、计算机装置及可读存储介质 | |
CN106487747A (zh) | 用户识别方法、系统、装置及处理方法、装置 | |
CN109194689B (zh) | 异常行为识别方法、装置、服务器及存储介质 | |
CN106713579A (zh) | 一种电话号码识别方法及装置 | |
CN108449482A (zh) | 号码识别的方法和系统 | |
CN108718306A (zh) | 一种异常流量行为判别方法和装置 | |
CN111131593A (zh) | 骚扰电话识别方法及其装置 | |
CN112001170A (zh) | 一种识别经过变形的敏感词的方法和系统 | |
CN110210858A (zh) | 一种基于智能终端识别的风控防护系统设计方法 | |
CN110362826A (zh) | 基于人工智能的期刊投稿方法、设备及可读存储介质 | |
CN102567534A (zh) | 互动产品用户生成内容拦截系统及其拦截方法 | |
CN107644106A (zh) | 自动挖掘业务中间人的方法、终端设备及存储介质 | |
CN110008980A (zh) | 识别模型生成方法、识别方法、装置、设备及存储介质 | |
CN101389085A (zh) | 基于发送行为的垃圾短消息识别系统及方法 | |
CN108121701A (zh) | 一种防骚扰的自动识别方法及其智能终端 | |
CN117119104B (zh) | 基于虚拟角色定向训练的电信诈骗主动检测处理方法 | |
CN109474755A (zh) | 基于排序学习和集成学习的异常电话主动预测方法及系统 | |
CN106550356A (zh) | 一种确定来电号码类型的方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171226 |
|
RJ01 | Rejection of invention patent application after publication |