CN113515612A - 一种黑产手机号识别方法及装置 - Google Patents

一种黑产手机号识别方法及装置 Download PDF

Info

Publication number
CN113515612A
CN113515612A CN202110698414.6A CN202110698414A CN113515612A CN 113515612 A CN113515612 A CN 113515612A CN 202110698414 A CN202110698414 A CN 202110698414A CN 113515612 A CN113515612 A CN 113515612A
Authority
CN
China
Prior art keywords
mobile phone
phone number
identified
fuzzy
accurate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110698414.6A
Other languages
English (en)
Other versions
CN113515612B (zh
Inventor
王智明
徐雷
陶冶
于城
边林
张立彤
辛秀
康洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202110698414.6A priority Critical patent/CN113515612B/zh
Publication of CN113515612A publication Critical patent/CN113515612A/zh
Application granted granted Critical
Publication of CN113515612B publication Critical patent/CN113515612B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/08Access security
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Technology Law (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供一种黑产手机号识别方法及装置,所述方法包括:接收终端发送的精准识别请求,所述精准识别请求携带待识别手机号、所述待识别手机号对应的登陆时间以及IP地址;获取所述待识别手机号关联的IMSI号以及对应的位置变化频率;根据预置的黑产账户库、所述登陆时间、所述IP地址、所述IMSI号以及所述位置变化频率对所述待识别手机号进行精准识别,并获得精准识别结果;向所述终端发送所述精准识别结果,所述精准识别结果用于指示所述待识别手机号在所述登陆时间是否为黑产手机号。该方法及装置能够解决现有的黑产手机号识别方法容易产生误判,识别准确度低的问题。

Description

一种黑产手机号识别方法及装置
技术领域
本发明涉及网络安全领域,尤其涉及一种黑产手机号识别方法及装置。
背景技术
黑产,指以互联网为媒介,以网络技术为主要手段,为计算机信息系统安全和网络空间管理秩序,甚至国家安全、社会政治稳定带来潜在威胁(重大安全隐患)的非法行为。
然而,现有的黑产手机号识别方法存在容易产生误判,识别准确度低的问题。
发明内容
本发明所要解决的技术问题是针对现有技术的上述不足,提供一种黑产手机号识别方法及装置,用以解决现有的黑产手机号识别方法容易产生误判,识别准确度低的问题。
第一方面,本发明实施例提供一种黑产手机号识别方法,包括:
接收终端发送的精准识别请求,所述精准识别请求携带待识别手机号、所述待识别手机号对应的登陆时间以及IP地址;
获取所述待识别手机号关联的IMSI号以及对应的位置变化频率;
根据预置的黑产账户库、所述登陆时间、所述IP地址、所述IMSI号以及所述位置变化频率对所述待识别手机号进行精准识别,并获得精准识别结果;
向所述终端发送所述精准识别结果,所述精准识别结果用于指示所述待识别手机号在所述登陆时间是否为黑产手机号。
优选地,所述黑产账户库中包括所有被标识为黑产的第一黑产手机号、与所述第一黑产手机号对应的IP地址、IMSI号以及黑产行为发生时间;
所述根据预置的黑产账户库、所述登陆时间、所述IP地址、所述IMSI号以及所述位置变化频率对所述待识别手机号进行精准识别,并获得精准识别结果,具体包括:
根据以下公式计算所述待识别手机号与所述黑产账户库中每个所述第一黑产手机号之间的精准匹配距离:
Figure BDA0003129460120000021
x=1,2,3,…,C
其中,C为所述黑产账户库中的第一黑产手机号的数量;
Figure BDA0003129460120000022
Figure BDA0003129460120000023
的转置;λ、γ为调整系数;A为自主调整时刻范围,
Figure BDA0003129460120000024
为所述登陆时间,
Figure BDA0003129460120000025
为所述黑产行为发生时间,
Figure BDA0003129460120000026
为所述待识别手机号对应的IP地址与IMSI号转换后的数值,
Figure BDA0003129460120000027
为所述黑产账户库中的第x个第一黑产手机号对应的IP地址与IMSI号转换后的数值,dx为所述待识别手机号与第x个第一黑产手机号之间的精准匹配距离,Lml为所述位置变化频率;
获取所有所述精准匹配距离中的最小值,并判断所述精准匹配距离中的最小值是否小于等于预置的精准匹配距离阀值;
若是,则确定所述待识别手机号在所述登陆时间为黑产手机号,否则,不为黑产手机号。
优选地,所述精准识别结果包括:所述待识别手机号、所述登陆时间、所述IP地址、所述IMSI号以及用于指示所述待识别手机号在所述登陆时间是否为黑产手机号的信息。
优选地,所述方法还包括:
接收终端发送的模糊识别请求,所述模糊识别请求携带所述待识别手机号;
根据所述黑产账户库对所述待识别手机号进行模糊识别,并获得模糊识别结果;
向所述终端发送所述模糊识别结果,所述模糊识别结果用于指示所述待识别手机号是否为黑产手机号。
优选地,所述根据所述黑产账户库对所述待识别手机号进行模糊识别,并获得模糊识别结果,具体包括:
根据以下公式计算所述待识别手机号与所述黑产账户库中每个所述第一黑产手机号之间的模糊匹配距离:
Figure BDA0003129460120000031
k=1,2,3,…,Ω
其中,Ω为所述黑产账户库中的第一黑产手机号的数量;i、j、t分别为所述待识别手机号的立体存储空间点的三维座标;Smi为所述待识别手机号的后8位,
Figure BDA0003129460120000032
为所述黑产账户库中的第k个第一黑产手机号的后8位,Dk(i,j,t)为所述待识别手机号与第k个第一黑产手机号之间的模糊匹配距离;
获取所有所述模糊匹配距离中的最小值,并判断所述模糊匹配距离中的最小值是否小于等于预置的模糊匹配距离阀值;
若是,则确定所述待识别手机号为黑产手机号,否则,不为黑产手机号。
优选地,所述黑产账户库是基于运营商的信令数据生成的。
第二方面,本发明实施例提供一种黑产手机号识别装置,包括:
第一接收模块,用于接收终端发送的精准识别请求,所述精准识别请求携带待识别手机号、所述待识别手机号对应的登陆时间以及IP地址;
第一获取模块,与所述第一接收模块连接,用于获取所述待识别手机号关联的IMSI号以及对应的位置变化频率;
精准识别模块,与所述第一获取模块连接,用于根据预置的黑产账户库、所述登陆时间、所述IP地址、所述IMSI号以及所述位置变化频率对所述待识别手机号进行精准识别,并获得精准识别结果;
第一发送模块,与所述精准识别模块连接,用于向所述终端发送所述精准识别结果,所述精准识别结果用于指示所述待识别手机号在所述登陆时间是否为黑产手机号。
优选地,所述黑产账户库中包括所有被标识为黑产的第一黑产手机号、与所述第一黑产手机号对应的IP地址、IMSI号以及黑产行为发生时间;
所述精准识别模块具体包括:
精准匹配距离单元,用于根据以下公式计算所述待识别手机号与所述黑产账户库中每个所述第一黑产手机号之间的精准匹配距离:
Figure BDA0003129460120000041
x=1,2,3,…,C
其中,C为所述黑产账户库中的第一黑产手机号的数量;
Figure BDA0003129460120000042
Figure BDA0003129460120000043
的转置;λ、γ为调整系数;A为自主调整时刻范围,
Figure BDA0003129460120000044
为所述登陆时间,
Figure BDA0003129460120000045
为所述黑产行为发生时间,
Figure BDA0003129460120000046
为所述待识别手机号对应的IP地址与IMSI号转换后的数值,
Figure BDA0003129460120000047
为所述黑产账户库中的第x个第一黑产手机号对应的IP地址与IMSI号转换后的数值,dx为所述待识别手机号与第x个第一黑产手机号之间的精准匹配距离,Lml为所述位置变化频率;
第一判断单元,用于获取所有所述精准匹配距离中的最小值,并判断所述精准匹配距离中的最小值是否小于等于预置的精准匹配距离阀值;
第一确定单元,用于若是,则确定所述待识别手机号在所述登陆时间为黑产手机号,否则,不为黑产手机号。
优选地,还包括:
第二接收模块,用于接收终端发送的模糊识别请求,所述模糊识别请求携带所述待识别手机号;
模糊识别模块,用于根据所述黑产账户库对所述待识别手机号进行模糊识别,并获得模糊识别结果;
第二发送模块,用于向所述终端发送所述模糊识别结果,所述模糊识别结果用于指示所述待识别手机号是否为黑产手机号。
第三方面,本发明实施例提供一种黑产手机号识别装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现上述第一方面所述的黑产手机号识别方法。
本发明实施例提供的黑产手机号识别方法及装置,在接收到终端发送的精准识别请求后,通过获取所述待识别手机号关联的IMSI号以及对应的位置变化频率,并根据预置的基于运营商信令数据生成的黑产账户库、登陆时间、IP地址、IMSI号以及位置变化频率对所述待识别手机号进行精准识别,能够获得精准识别结果,该精准识别结果用于指示所述待识别手机号在所述登陆时间是否为黑产手机号,从而解决了现有的黑产手机号识别方法容易产生误判,识别准确度低的问题。
附图说明
图1:为本发明实施例的一种黑产手机号识别方法的场景图;
图2:为本发明实施例1的一种黑产手机号识别方法的流程图;
图3:为本发明实施例2的一种黑产手机号识别装置的结构示意图;
图4:为本发明实施例3的一种黑产手机号识别装置的结构示意图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面将结合附图对本发明实施方式作进一步地详细描述。
可以理解的是,此处描述的具体实施例和附图仅仅用于解释本发明,而非对本发明的限定。
可以理解的是,在不冲突的情况下,本发明中的各实施例及实施例中的各特征可相互组合。
可以理解的是,为便于描述,本发明的附图中仅示出了与本发明相关的部分,而与本发明无关的部分未在附图中示出。
可以理解的是,本发明的实施例中所涉及的每个单元、模块可仅对应一个实体结构,也可由多个实体结构组成,或者,多个单元、模块也可集成为一个实体结构。
可以理解的是,在不冲突的情况下,本发明的流程图和框图中所标注的功能、步骤可按照不同于附图中所标注的顺序发生。
可以理解的是,本发明的流程图和框图中,示出了按照本发明各实施例的系统、装置、设备、方法的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可代表一个单元、模块、程序段、代码,其包含用于实现规定的功能的可执行指令。而且,框图和流程图中的每个方框或方框的组合,可用实现规定的功能的基于硬件的系统实现,也可用硬件与计算机指令的组合来实现。
可以理解的是,本发明实施例中所涉及的单元、模块可通过软件的方式实现,也可通过硬件的方式来实现,例如单元、模块可位于处理器中。
为了使本领域的技术人员更好地理解本发明实施例中的技术方案,下面先对本发明实施例中涉及的部分技术术语进行简单说明。
需要说明的是,本申请实施例描述的场景图是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
如图1所示,为本申请实施例提供的一种黑产手机号识别方法的场景图,其中,各部分说明如下:
(1)信令数据:指运营商独有的底层信令数据,信令是在无线通信系统中,除了传输用户信息之外,为使全网有轶序地工作,用来保证正常通信所需要的控制信号。信令数据可以包括:IP地址、手机号码、手机号码登录时间(年月日、时分秒)、关联的IMSI(International Mobile Subscriber Identity,国际移动用户识别码)号等信息;
(2)信令数据抽取、转换服务器:用于不间断的筛选信令数据中的手机号黑产账户并添加至黑产账户库中。本发明提供的黑产手机号识别方法基于信令溯源,信令溯源是基于呼叫建立、监控、拆除、分布式应用进程的信令数据进行回溯,以找到黑产的IP地址、手机号码等信息。
(3)黑产账户库:用于存储标识为黑产的手机号码账户及其关联信息,比如IP地址、黑产行为发生时间(年月日、时分秒)、关联的IMSI号等信息。
(4)网站/APP:用于提供与黑产识别系统交互的接口,用户可以通过终端设备上的网站/APP向黑产识别系统发送黑产识别请求,具体可以包括模糊识别请求和精准识别请求。
(5)黑产识别系统:用于根据用户的模糊识别请求和/或精准识别请求进行黑产识别,并反馈相应的模糊识别结果和/或精准识别结果。
基于图1所示的场景图,下面介绍本申请涉及的黑产手机号识别方法及装置的相关实施例。
实施例1:
本实施例提供一种黑产手机号识别方法,如图2所示,该方法包括:
步骤S102:接收终端发送的精准识别请求,精准识别请求携带待识别手机号、待识别手机号对应的登陆时间以及IP地址。
在本实施例中,用户可以通过终端设备上的网站/APP向黑产识别系统发送黑产识别请求,终端设备如手机,平板等,用户可以根据自身需求选择精准识别或模糊识别,比如,当用户需要精准识别时,可以通过该终端设备上的网站/APP向黑产识别系统发送精准识别请求,该精准识别请求携带待识别手机号、待识别手机号对应的登陆时间以及IP地址,该精准识别请求用于请求黑产识别系统验证该待识别手机号在所述登陆时间是否为黑产手机号。
在本实施例中,IP地址为待识别手机号通过电信接入网分配的IP地址,可以是IPV4地址或IPV6地址,登陆时间可以是待识别手机号登陆或访问网络或业务系统的时间,具体可以包括年月日时分秒信息。
步骤S104:获取待识别手机号关联的IMSI号以及对应的位置变化频率。
在本实施例中,IMSI号用于在全球的移动通信网中唯一识别一个移动用户,为国际辨认码,运营商数据库中预先存储有所有手机号关联的IMSI号以及对应的位置变化频率。
步骤S106:根据预置的黑产账户库、登陆时间、IP地址、IMSI号以及位置变化频率对待识别手机号进行精准识别,并获得精准识别结果。
在本实施例中,黑产账户库是基于运营商独有的底层信令数据生成的,其中包括所有被标识为黑产的第一黑产手机号、与第一黑产手机号对应的IP地址、IMSI号以及黑产行为发生时间。
可选地,根据预置的黑产账户库、登陆时间、IP地址、IMSI号以及位置变化频率对待识别手机号进行精准识别,并获得精准识别结果,具体可以包括:
根据以下公式计算待识别手机号与黑产账户库中每个第一黑产手机号之间的精准匹配距离:
Figure BDA0003129460120000081
x=1,2,3,…,C
其中,C为黑产账户库中的第一黑产手机号的数量;
Figure BDA0003129460120000082
Figure BDA0003129460120000083
的转置;λ、γ为调整系数;A为自主调整时刻范围,
Figure BDA0003129460120000084
为登陆时间,
Figure BDA0003129460120000085
为黑产行为发生时间,
Figure BDA0003129460120000086
为待识别手机号对应的IP地址与IMSI号转换后的数值,
Figure BDA0003129460120000087
为黑产账户库中的第x个第一黑产手机号对应的IP地址与IMSI号转换后的数值,dx为待识别手机号与第x个第一黑产手机号之间的精准匹配距离,Lml为位置变化频率;
获取所有精准匹配距离中的最小值,并判断精准匹配距离中的最小值是否小于等于预置的精准匹配距离阀值;
若是,则确定待识别手机号在登陆时间为黑产手机号,否则,不为黑产手机号。
在本实施例中,由于被标识为黑产的手机号并不一定自始至终均为黑产,可能在某一段时间被标识为黑产,在这段时间之后的时间均不为黑产,因此,通过上述精准匹配距离公式可以获得待识别手机号的精准识别结果,该精准识别结果可以包括:待识别手机号、登陆时间、IP地址、IMSI号以及是否为黑产等信息。需要说明的是,上述精准匹配距离公式仅是一种示例,本实施例也可以使用其他计算距离的公式来计算待识别手机号与黑产账户库中每个第一黑产手机号之间的精准匹配距离。
可选地,方法还可以包括:
接收终端发送的模糊识别请求,模糊识别请求携带待识别手机号;
根据黑产账户库对待识别手机号进行模糊识别,并获得模糊识别结果;
向终端发送模糊识别结果,模糊识别结果用于指示待识别手机号是否为黑产手机号。
在本实施例中,当黑产账户库中的数据达到TB以上级别时,精准识别的时间比较长,为了提高用户体验,黑产识别系统提供模糊识别功能,用户可以通过终端设备上的网站/APP向黑产识别系统发送待识别手机号,以向黑产识别系统发送模糊识别请求。需要说明的是,用户可以根据需要向黑产识别系统发送模糊识别请求和/或精准识别请求,比如,用户可以先向黑产识别系统发送模糊识别请求初步识别手机号是否为黑产,若为黑产,则可以进一步向黑产识别系统发送精准识别请求,以判断待识别手机号在某个登陆时间是否为黑产手机号。
可选地,根据黑产账户库对待识别手机号进行模糊识别,并获得模糊识别结果,具体可以包括:
根据以下公式计算待识别手机号与黑产账户库中每个第一黑产手机号之间的模糊匹配距离:
Figure BDA0003129460120000101
k=1,2,3,…,Ω
其中,Ω为黑产账户库中的第一黑产手机号的数量;i、j、t分别为待识别手机号的立体存储空间点的三维座标;Smi为待识别手机号的后8位,
Figure BDA0003129460120000102
为黑产账户库中的第k个第一黑产手机号的后8位,Dk(i,j,t)为待识别手机号与第k个第一黑产手机号之间的模糊匹配距离;
获取所有模糊匹配距离中的最小值,并判断模糊匹配距离中的最小值是否小于等于预置的模糊匹配距离阀值;
若是,则确定待识别手机号为黑产手机号,否则,不为黑产手机号。
在本实施例中,由于手机号后8位相同的概率非常低,为了进一步提高识别的速度,可以将待识别手机号的后8位与黑产账户库中的第一黑产手机号的后8位进行模糊匹配,以获取模糊识别结果。需要说明的是,上述模糊匹配距离公式仅是一种示例,本实施例也可以使用其他计算距离的公式来计算待识别手机号与黑产账户库中每个第一黑产手机号之间的模糊匹配距离。
步骤S108:向终端发送精准识别结果,精准识别结果用于指示待识别手机号在登陆时间是否为黑产手机号。
本发明实施例提供的黑产手机号识别方法,在接收到终端发送的精准识别请求后,通过获取所述待识别手机号关联的IMSI号以及对应的位置变化频率,并根据预置的基于运营商信令数据生成的黑产账户库、登陆时间、IP地址、IMSI号以及位置变化频率对所述待识别手机号进行精准识别,能够获得精准识别结果,该精准识别结果用于指示所述待识别手机号在所述登陆时间是否为黑产手机号,从而解决了现有的黑产手机号识别方法容易产生误判,识别准确度低的问题。
实施例2:
如图3所示,本实施例提供一种黑产手机号识别装置,包括:
第一接收模块12,用于接收终端发送的精准识别请求,精准识别请求携带待识别手机号、待识别手机号对应的登陆时间以及IP地址;
第一获取模块14,与第一接收模块12连接,用于获取待识别手机号关联的IMSI号以及对应的位置变化频率;
精准识别模块16,与第一获取模块14连接,用于根据预置的黑产账户库、登陆时间、IP地址、IMSI号以及位置变化频率对待识别手机号进行精准识别,并获得精准识别结果;
第一发送模块18,与精准识别模块16连接,用于向终端发送精准识别结果,精准识别结果用于指示待识别手机号在登陆时间是否为黑产手机号。
可选地,黑产账户库中包括所有被标识为黑产的第一黑产手机号、与第一黑产手机号对应的IP地址、IMSI号以及黑产行为发生时间;
精准识别模块16具体包括:
精准匹配距离单元,用于根据以下公式计算待识别手机号与黑产账户库中每个第一黑产手机号之间的精准匹配距离:
Figure BDA0003129460120000111
x=1,2,3,…,C
其中,C为黑产账户库中的第一黑产手机号的数量;
Figure BDA0003129460120000112
Figure BDA0003129460120000113
的转置;λ、γ为调整系数;A为自主调整时刻范围,
Figure BDA0003129460120000114
为登陆时间,
Figure BDA0003129460120000115
为黑产行为发生时间,
Figure BDA0003129460120000116
为待识别手机号对应的IP地址与IMSI号转换后的数值,
Figure BDA0003129460120000117
为黑产账户库中的第x个第一黑产手机号对应的IP地址与IMSI号转换后的数值,dx为待识别手机号与第x个第一黑产手机号之间的精准匹配距离,Lml为位置变化频率;
第一判断单元,用于获取所有精准匹配距离中的最小值,并判断精准匹配距离中的最小值是否小于等于预置的精准匹配距离阀值;
第一确定单元,用于若是,则确定待识别手机号在登陆时间为黑产手机号,否则,不为黑产手机号。
可选地,精准识别结果包括:待识别手机号、登陆时间、IP地址、IMSI号以及用于指示待识别手机号在登陆时间是否为黑产手机号的信息。
可选地,还可以包括:
第二接收模块,用于接收终端发送的模糊识别请求,模糊识别请求携带待识别手机号;
模糊识别模块,用于根据黑产账户库对待识别手机号进行模糊识别,并获得模糊识别结果;
第二发送模块,用于向终端发送模糊识别结果,模糊识别结果用于指示待识别手机号是否为黑产手机号。
可选地,模糊识别模块具体可以包括:
模糊匹配距离单元,用于根据以下公式计算待识别手机号与黑产账户库中每个第一黑产手机号之间的模糊匹配距离:
Figure BDA0003129460120000121
k=1,2,3,…,Ω
其中,Ω为黑产账户库中的第一黑产手机号的数量;i、j、t分别为待识别手机号的立体存储空间点的三维座标;Smi为待识别手机号的后8位,
Figure BDA0003129460120000122
为黑产账户库中的第k个第一黑产手机号的后8位,Dk(i,j,t)为待识别手机号与第k个第一黑产手机号之间的模糊匹配距离;
第二判断单元,用于获取所有模糊匹配距离中的最小值,并判断模糊匹配距离中的最小值是否小于等于预置的模糊匹配距离阀值;
第二确定单元,用于若是,则确定待识别手机号为黑产手机号,否则,不为黑产手机号。
可选地,黑产账户库是基于运营商的信令数据生成的。
实施例3:
如图4所示,本实施例提供一种黑产手机号识别装置,包括存储器21和处理器22,存储器21中存储有计算机程序,处理器22被设置为运行所述计算机程序以执行实施例1中的黑产手机号识别方法。
其中,存储器21与处理器22连接,存储器21可采用闪存或只读存储器或其他存储器,处理器22可采用中央处理器或单片机。
实施例2至实施例3提供的黑产手机号识别装置,在接收到终端发送的精准识别请求后,通过获取所述待识别手机号关联的IMSI号以及对应的位置变化频率,并根据预置的基于运营商信令数据生成的黑产账户库、登陆时间、IP地址、IMSI号以及位置变化频率对所述待识别手机号进行精准识别,能够获得精准识别结果,该精准识别结果用于指示所述待识别手机号在所述登陆时间是否为黑产手机号,从而解决了现有的黑产手机号识别方法容易产生误判,识别准确度低的问题。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

Claims (10)

1.一种黑产手机号识别方法,其特征在于,包括:
接收终端发送的精准识别请求,所述精准识别请求携带待识别手机号、所述待识别手机号对应的登陆时间以及IP地址;
获取所述待识别手机号关联的IMSI号以及对应的位置变化频率;
根据预置的黑产账户库、所述登陆时间、所述IP地址、所述IMSI号以及所述位置变化频率对所述待识别手机号进行精准识别,并获得精准识别结果;
向所述终端发送所述精准识别结果,所述精准识别结果用于指示所述待识别手机号在所述登陆时间是否为黑产手机号。
2.根据权利要求1所述的黑产手机号识别方法,其特征在于,所述黑产账户库中包括所有被标识为黑产的第一黑产手机号、与所述第一黑产手机号对应的IP地址、IMSI号以及黑产行为发生时间;
所述根据预置的黑产账户库、所述登陆时间、所述IP地址、所述IMSI号以及所述位置变化频率对所述待识别手机号进行精准识别,并获得精准识别结果,具体包括:
根据以下公式计算所述待识别手机号与所述黑产账户库中每个所述第一黑产手机号之间的精准匹配距离:
Figure FDA0003129460110000011
其中,C为所述黑产账户库中的第一黑产手机号的数量;
Figure FDA0003129460110000012
Figure FDA0003129460110000013
的转置;λ、γ为调整系数;A为自主调整时刻范围,
Figure FDA0003129460110000014
为所述登陆时间,
Figure FDA0003129460110000015
为所述黑产行为发生时间,
Figure FDA0003129460110000016
为所述待识别手机号对应的IP地址与IMSI号转换后的数值,
Figure FDA0003129460110000017
为所述黑产账户库中的第x个第一黑产手机号对应的IP地址与IMSI号转换后的数值,dx为所述待识别手机号与第x个第一黑产手机号之间的精准匹配距离,Lml为所述位置变化频率;
获取所有所述精准匹配距离中的最小值,并判断所述精准匹配距离中的最小值是否小于等于预置的精准匹配距离阀值;
若是,则确定所述待识别手机号在所述登陆时间为黑产手机号,否则,不为黑产手机号。
3.根据权利要求1所述的黑产手机号识别方法,其特征在于,所述精准识别结果包括:所述待识别手机号、所述登陆时间、所述IP地址、所述IMSI号以及用于指示所述待识别手机号在所述登陆时间是否为黑产手机号的信息。
4.根据权利要求1所述的黑产手机号识别方法,其特征在于,所述方法还包括:
接收终端发送的模糊识别请求,所述模糊识别请求携带所述待识别手机号;
根据所述黑产账户库对所述待识别手机号进行模糊识别,并获得模糊识别结果;
向所述终端发送所述模糊识别结果,所述模糊识别结果用于指示所述待识别手机号是否为黑产手机号。
5.根据权利要求4所述的黑产手机号识别方法,其特征在于,所述根据所述黑产账户库对所述待识别手机号进行模糊识别,并获得模糊识别结果,具体包括:
根据以下公式计算所述待识别手机号与所述黑产账户库中每个所述第一黑产手机号之间的模糊匹配距离:
Figure FDA0003129460110000021
其中,Ω为所述黑产账户库中的第一黑产手机号的数量;i、j、t分别为所述待识别手机号的立体存储空间点的三维座标;Smi为所述待识别手机号的后8位,
Figure FDA0003129460110000031
为所述黑产账户库中的第k个第一黑产手机号的后8位,Dk(i,j,t)为所述待识别手机号与第k个第一黑产手机号之间的模糊匹配距离;
获取所有所述模糊匹配距离中的最小值,并判断所述模糊匹配距离中的最小值是否小于等于预置的模糊匹配距离阀值;
若是,则确定所述待识别手机号为黑产手机号,否则,不为黑产手机号。
6.根据权利要求2所述的黑产手机号识别方法,其特征在于,所述黑产账户库是基于运营商的信令数据生成的。
7.一种黑产手机号识别装置,其特征在于,包括:
第一接收模块,用于接收终端发送的精准识别请求,所述精准识别请求携带待识别手机号、所述待识别手机号对应的登陆时间以及IP地址;
第一获取模块,与所述第一接收模块连接,用于获取所述待识别手机号关联的IMSI号以及对应的位置变化频率;
精准识别模块,与所述第一获取模块连接,用于根据预置的黑产账户库、所述登陆时间、所述IP地址、所述IMSI号以及所述位置变化频率对所述待识别手机号进行精准识别,并获得精准识别结果;
第一发送模块,与所述精准识别模块连接,用于向所述终端发送所述精准识别结果,所述精准识别结果用于指示所述待识别手机号在所述登陆时间是否为黑产手机号。
8.根据权利要求7所述的黑产手机号识别装置,其特征在于,所述黑产账户库中包括所有被标识为黑产的第一黑产手机号、与所述第一黑产手机号对应的IP地址、IMSI号以及黑产行为发生时间;
所述精准识别模块具体包括:
精准匹配距离单元,用于根据以下公式计算所述待识别手机号与所述黑产账户库中每个所述第一黑产手机号之间的精准匹配距离:
Figure FDA0003129460110000041
其中,C为所述黑产账户库中的第一黑产手机号的数量;
Figure FDA0003129460110000042
Figure FDA0003129460110000043
的转置;λ、γ为调整系数;A为自主调整时刻范围,
Figure FDA0003129460110000044
为所述登陆时间,
Figure FDA0003129460110000045
为所述黑产行为发生时间,
Figure FDA0003129460110000046
为所述待识别手机号对应的IP地址与IMSI号转换后的数值,
Figure FDA0003129460110000047
为所述黑产账户库中的第x个第一黑产手机号对应的IP地址与IMSI号转换后的数值,dx为所述待识别手机号与第x个第一黑产手机号之间的精准匹配距离,Lml为所述位置变化频率;
第一判断单元,用于获取所有所述精准匹配距离中的最小值,并判断所述精准匹配距离中的最小值是否小于等于预置的精准匹配距离阀值;
第一确定单元,用于若是,则确定所述待识别手机号在所述登陆时间为黑产手机号,否则,不为黑产手机号。
9.根据权利要求7所述的黑产手机号识别装置,其特征在于,还包括:
第二接收模块,用于接收终端发送的模糊识别请求,所述模糊识别请求携带所述待识别手机号;
模糊识别模块,用于根据所述黑产账户库对所述待识别手机号进行模糊识别,并获得模糊识别结果;
第二发送模块,用于向所述终端发送所述模糊识别结果,所述模糊识别结果用于指示所述待识别手机号是否为黑产手机号。
10.一种黑产手机号识别装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现如权利要求1-6中任一项所述的黑产手机号识别方法。
CN202110698414.6A 2021-06-23 2021-06-23 一种黑产手机号识别方法及装置 Active CN113515612B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110698414.6A CN113515612B (zh) 2021-06-23 2021-06-23 一种黑产手机号识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110698414.6A CN113515612B (zh) 2021-06-23 2021-06-23 一种黑产手机号识别方法及装置

Publications (2)

Publication Number Publication Date
CN113515612A true CN113515612A (zh) 2021-10-19
CN113515612B CN113515612B (zh) 2023-06-02

Family

ID=78066122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110698414.6A Active CN113515612B (zh) 2021-06-23 2021-06-23 一种黑产手机号识别方法及装置

Country Status (1)

Country Link
CN (1) CN113515612B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114553598A (zh) * 2022-04-22 2022-05-27 北京数业专攻科技有限公司 黑产手机号及黑产用户设备识别方法、系统及存储介质
CN114785546A (zh) * 2022-03-15 2022-07-22 上海聚水潭网络科技有限公司 一种基于业务日志和ip情报的ip溯源方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110294478A1 (en) * 2010-05-26 2011-12-01 Google Inc. Telephone Caller Classification
CN104917749A (zh) * 2015-04-15 2015-09-16 腾讯科技(深圳)有限公司 帐号注册方法及装置
US20170264591A1 (en) * 2016-03-14 2017-09-14 Palo Alto Research Center Incorporated System And Method For Proxy-Based Privacy Protection
CN110647522A (zh) * 2019-09-06 2020-01-03 中国建设银行股份有限公司 一种数据挖掘方法、装置及其系统
EP3644260A1 (en) * 2018-10-25 2020-04-29 Verint Americas Inc. System architecture for fraud detection
CN112533209A (zh) * 2020-12-10 2021-03-19 中国联合网络通信集团有限公司 黑产识别方法及黑产识别装置
CN112801837A (zh) * 2019-11-13 2021-05-14 腾讯科技(深圳)有限公司 设备聚类方法、装置、存储介质及电子设备
CN112954685A (zh) * 2021-01-29 2021-06-11 上海安恒时代信息技术有限公司 黑灰产手机号码识别方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110294478A1 (en) * 2010-05-26 2011-12-01 Google Inc. Telephone Caller Classification
CN104917749A (zh) * 2015-04-15 2015-09-16 腾讯科技(深圳)有限公司 帐号注册方法及装置
US20170264591A1 (en) * 2016-03-14 2017-09-14 Palo Alto Research Center Incorporated System And Method For Proxy-Based Privacy Protection
EP3644260A1 (en) * 2018-10-25 2020-04-29 Verint Americas Inc. System architecture for fraud detection
US20200137221A1 (en) * 2018-10-25 2020-04-30 Verint Americas Inc. System architecture for fraud detection
CN110647522A (zh) * 2019-09-06 2020-01-03 中国建设银行股份有限公司 一种数据挖掘方法、装置及其系统
CN112801837A (zh) * 2019-11-13 2021-05-14 腾讯科技(深圳)有限公司 设备聚类方法、装置、存储介质及电子设备
CN112533209A (zh) * 2020-12-10 2021-03-19 中国联合网络通信集团有限公司 黑产识别方法及黑产识别装置
CN112954685A (zh) * 2021-01-29 2021-06-11 上海安恒时代信息技术有限公司 黑灰产手机号码识别方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KRISTOFFER JENSEN等: "A big data analytics approach to combat telecommunication vulnerabilities", CLUSTER COMPUTING, pages 2363 *
叶平: "物联网数据在侵财案件侦防中的应用", 中国优秀硕士学位论文全文数据库 (社会科学Ⅰ辑), no. 10, pages 113 - 17 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114785546A (zh) * 2022-03-15 2022-07-22 上海聚水潭网络科技有限公司 一种基于业务日志和ip情报的ip溯源方法及系统
CN114785546B (zh) * 2022-03-15 2024-04-26 上海聚水潭网络科技有限公司 一种基于业务日志和ip情报的ip溯源方法及系统
CN114553598A (zh) * 2022-04-22 2022-05-27 北京数业专攻科技有限公司 黑产手机号及黑产用户设备识别方法、系统及存储介质
CN114553598B (zh) * 2022-04-22 2022-07-26 北京数业专攻科技有限公司 黑产手机号及黑产用户设备识别方法、系统及存储介质

Also Published As

Publication number Publication date
CN113515612B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
US10278114B2 (en) Systems, methods, and apparatus for geolocation platform mechanics
CN107819631B (zh) 一种设备异常检测方法、装置及设备
RU2704750C2 (ru) Системы и способы идентификации мобильных устройств
US10237272B2 (en) Methods, apparatus, and systems for identity authentication
US20190021067A1 (en) Geographic location positioning method and apparatus
CN113515612A (zh) 一种黑产手机号识别方法及装置
CN111935820B (zh) 基于无线网络的定位实现方法及相关设备
CN108810947B (zh) 基于ip地址的鉴别真实流量的服务器
CN111787075A (zh) 一种设备定位方法及装置
CN112039861B (zh) 风险识别方法、装置、电子设备和计算机可读存储介质
CN112533209A (zh) 黑产识别方法及黑产识别装置
CN111131493A (zh) 一种数据获取、用户画像生成方法、装置
CN109211250B (zh) 一种移动端的电子地图坐标自动转换的方法和装置
CN110674832B (zh) 互联网用户所属企业的识别方法、装置和终端
US20150140957A1 (en) Prepaid phone card charging
CN116471582A (zh) 一种基于人工智能的一人多卡用户识别方法及装置
CN109873836A (zh) 一种数据的风险评估方法及装置
CN111143644B (zh) 物联网设备的识别方法及装置
CN113220949A (zh) 一种隐私数据识别系统的构建方法及装置
CN108830103B (zh) 一种自动化生成用户隐私策略的方法及其装置、手持设备
CN113556748B (zh) 信令溯源识别方法、装置和系统
CN113905377A (zh) 鉴权方法及服务器
CN110636451B (zh) 信息管理方法及相关装置
CN115396329B (zh) 目标异网号码的确定方法、装置、设备及存储介质
CN110062019B (zh) 一种风险控制方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant