CN107819959B - 电话溯源方法和装置 - Google Patents

电话溯源方法和装置 Download PDF

Info

Publication number
CN107819959B
CN107819959B CN201610825057.4A CN201610825057A CN107819959B CN 107819959 B CN107819959 B CN 107819959B CN 201610825057 A CN201610825057 A CN 201610825057A CN 107819959 B CN107819959 B CN 107819959B
Authority
CN
China
Prior art keywords
call
signaling
calling
point
calling number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610825057.4A
Other languages
English (en)
Other versions
CN107819959A (zh
Inventor
李力卡
张慧嫦
严宇
邓勇
刘志军
陈庆年
付华峥
许盛宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201610825057.4A priority Critical patent/CN107819959B/zh
Publication of CN107819959A publication Critical patent/CN107819959A/zh
Application granted granted Critical
Publication of CN107819959B publication Critical patent/CN107819959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提出一种电话溯源方法和装置,涉及大数据领域。其中,本发明一种电话溯源方法包括:获取主叫号码的多条呼叫信令;根据呼叫信令确定主叫号码特征标签,主叫号码特征标签中包括呼叫信令的入局点和呼叫信令在各个入局点的分布情况,呼叫信令的采集区域和呼叫信令在各个采集区域的分布情况;根据主叫号码特征标签,基于预定策略确定主叫号码的边界入局点、边界采集区域信息。通过这样的方法,能够基于主叫号码的多条呼叫记录进行统计,实现主叫号码的溯源,无需针对该主叫呼叫全程逐段采集信令,且无需将采集的信令进行全程匹配操作,提高了实现主叫号码溯源的可能性,且提高了电话溯源的效率。

Description

电话溯源方法和装置
技术领域
本发明涉及大数据领域,特别是一种电话溯源方法和装置。
背景技术
电话溯源分析技术是确定网络中呼叫来源区域、来源交换局点的分析技术。在反骚扰诈骗电话中这是必不可少的能力,也是目前的技术难题。
目前溯源是基于信令系统实现的。由于电话在网络逐段转发,溯源时主要根据每段信令的六元组,包括具体呼叫的起止时间、主被叫、来去话局点等信息,进行关联串接。
现有的溯源分析技术存在以下一些问题,导致可用性较差,难以大规模应用:
1、信令数据要逐段全流程采集,全流程信令数据采集要求极高,但是这在跨域、大范围内实现是不太可能的,信息不完整则关联溯源失败。
2、数据关联成功率极低,多种信令协议、跨设备难以关联,同时会受到业务号码变换、各时间戳偏差等因素的严重影响;多种协议、多字段标识多参差不齐、处理耗时。
3、该方法分析效率低、消耗大,每个呼叫都要匹配N个经过的局*M个元组,计算量巨大。
发明内容
本发明的一个目的在于提高电话溯源的效率和成功率。
根据本发明的一个方面,提出一种电话溯源方法,包括:获取主叫号码的多条呼叫信令,呼叫信令中包括主叫号码信息、被叫号码信息、入局点信息、出局点信息,起始时间信息、结束时间信息;根据呼叫信令确定主叫号码特征标签,主叫号码特征标签中包括呼叫信令的入局点和呼叫信令在各个入局点的分布情况,和/或呼叫信令的采集区域和呼叫信令在各个采集区域的分布情况;根据主叫号码特征标签,基于预定策略确定主叫号码特征信息,其中,主叫号码特征信息包括主叫号码的边界入局点和/或边界采集区域信息。
可选地,预定策略包括:根据主叫号码特征标签中呼叫信令在各个入局点的分布情况确定入局点的特征权值;确定特征权值最大的入局点为边界入局点。
可选地,预定策略包括:根据主叫号码特征标签中呼叫信令在各个采集区域的分布情况确定采集区域的特征权值;确定特征权值最大的采集区域为边界采集区域。
可选地,统计呼叫信令,获取主叫号码特征标签包括:根据呼叫信令中的入局点信息统计呼叫的入局点;根据呼叫信令中各个入局点的呼叫数量确定呼叫信令在各个入局点的分布情况。
可选地,统计呼叫信令,获取主叫号码特征标签包括:根据在各个采集区域获取的呼叫信令的数量确定呼叫信令在各个采集区域的分布情况。
可选地,根据主叫号码特征标签,基于预定策略确定主叫号码特征信息还包括:根据边界入局点的类型确定呼叫类型;若边界入局点为网内普通局点,则呼叫类型为网内呼叫,边界入局点为来源局点,和/或边界采集区域为来源区域。
可选地,根据主叫号码特征标签,基于预定策略确定主叫号码特征信息还包括:若边界入局点为国际局,则呼叫类型为国际呼叫;若边界入局点为省际长途局,则呼叫类型为省际呼叫;和/或,若边界入局点为网间关口局,则呼叫类型为网间呼叫。
可选地,还包括:预处理呼叫信令,生成归一化预处理信息;统计呼叫信令,获取主叫号码特征标签包括:统计归一化预处理信息,获取主叫号码特征标签。
可选地,预处理呼叫信令,生成归一化预处理信息包括:对起始时间信息和结束时间信息相同,且入局点或出局点相同的呼叫信令进行去重操作。
可选地,预处理呼叫信令,生成归一化预处理信息包括:规范化呼叫信令的号码编码规则和/或局点的编码规则。
可选地,预处理呼叫信令,生成归一化预处理信息包括:获取每个呼叫信令的采集区域。
通过这样的方法,能够基于主叫号码的多条呼叫记录进行统计分析,实现主叫号码的溯源,无需针对一条呼叫全程采集信令,且无需将采集的信令进行全程匹配操作,提高了实现主叫号码溯源的可能性,且提高了电话溯源的效率。
根据本发明的另一个方面,提出一种电话溯源装置,包括:信令获取模块,用于获取主叫号码的多条呼叫信令,呼叫信令中包括主叫号码信息、被叫号码信息、入局点信息、出局点信息,起始时间信息、结束时间信息;特征标签获取模块,用于根据呼叫信令确定主叫号码特征标签,主叫号码特征标签中包括呼叫信令的入局点和/或呼叫信令的采集区域,以及呼叫信令在各个入局点和/或采集区域的分布情况;特征信息获取模块,用于根据主叫号码特征标签,基于预定策略确定主叫号码特征信息,其中,主叫号码特征信息包括主叫号码的边界入局点和/或边界采集区域信息。
可选地,预定策略包括:根据主叫号码特征标签中呼叫信令在各个采集区域的分布情况确定采集区域的特征权值;确定特征权值最大的采集区域为边界采集区域。
可选地,预定策略包括:根据主叫号码特征标签中呼叫信令在各个入局点的分布情况确定入局点的特征权值;确定特征权值最大的入局点为边界入局点。
可选地,特征标签获取模块用于:根据呼叫信令中的入局点信息统计呼叫的入局点;根据呼叫信令中各个入局点的呼叫数量确定呼叫信令在各个入局点的分布情况。
可选地,特征标签获取模块用于:根据在各个采集区域获取的呼叫信令的数量确定呼叫信令在各个采集区域的分布情况。
可选地,特征信息获取模块包括:呼叫类型确定单元,用于根据边界入局点的类型确定呼叫类型;来源确定单元,用于在边界入局点为网内普通局点时,确定呼叫类型为网内呼叫,边界入局点为来源局点,和/或边界采集区域为来源区域。
可选地,来源确定单元,还用于:当边界入局点为国际局时,确定呼叫类型为国际呼叫;当边界入局点为省际长途局时,确定呼叫类型为省际呼叫;和/或,当边界入局点为网间关口局时,确定呼叫类型为网间呼叫。
可选地,还包括:预处理模块,用于预处理呼叫信令,生成归一化预处理信息;特征标签获取模块用于统计归一化预处理信息,获取主叫号码特征标签。
可选地,预处理模块包括:去重单元,用于对起始时间信息和结束时间信息相同,且边界接入局或边界汇接局相同的呼叫信令进行去重操作。
可选地,预处理模块包括:规范化单元,用于规范化呼叫信令的号码编码规则和/或局点的编码规则。
可选地,预处理模块包括:采集区域获取单元,用于获取每个呼叫信令的采集区域。
这样的装置能够基于主叫号码的多条呼叫记录进行统计分析,实现主叫号码的溯源,无需针对每个呼叫全程逐段采集信令,且无需将采集的信令进行全程匹配操作,提高了实现主叫号码溯源的可能性,且提高了电话溯源的效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明的电话溯源方法的一个实施例的流程图。
图2为本发明的电话溯源方法中确定特征信息的一个实施例的流程图。
图3为本发明的电话溯源方法中确定特征标签的一个实施例的流程图。
图4为本发明的电话溯源方法的另一个实施例的流程图。
图5为本发明的电话溯源方法的应用场景的一个实施例的流程图。
图6为本发明的电话溯源装置的一个实施例的示意图。
图7为本发明的特征标签获取模块的一个实施例的示意图。
图8为本发明的电话溯源装置的另一个实施例的示意图。
图9为本发明的预处理模块的一个实施例的示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
本发明的电话溯源方法的一个实施例的流程图如图1所示。
在步骤101中,获取主叫号码的多条呼叫信令。由于呼叫过程中存在转接、续接的情况,因此同一呼叫在不同的局点均会存在呼叫信息。在一个实施例中,可以提取该主叫号码作为主叫在所有局点的全部呼叫信令,或者提取一段时间内该主叫号码作为主叫在所有局点的全部呼叫信令,或者提取一段时间内该主叫号码作为主叫,符合某一特征的呼叫信令。呼叫信令中包括主叫号码信息、被叫号码信息、入局点信息、出局点信息,起始时间信息、结束时间信息。在一个实施例中,还可以包括呼转号码信息。
在步骤102中,统计呼叫信令,获取主叫号码特征标签,主叫号码特征标签中包括主叫号码特征标签中包括呼叫信令的入局点和呼叫信令在各个入局点的分布情况,和/或呼叫信令的采集区域和呼叫信令在各个采集区域的分布情况,其中,入局点为在呼叫过程中位于网络管理域间呼叫转接、续接的局点。
在步骤103中,根据主叫号码特征标签,基于预定策略确定主叫号码特征信息,其中,主叫号码特征信息包括主叫号码的边界入局点、边界采集区域信息。边界入局点为一个呼叫在网内起始的局点,如网内呼叫的来源局点,或网间、国际呼叫中进入网内的局点。同理,边界采集区域信息为一个呼叫在网内起始的区域。在一个实施例中,可以根据获得的主叫号码特征标签进行大数据分析,通过统计分析呼叫信令的入局点、呼叫信令的采集区域分别确定主叫号码的边界入局点、边界采集区域。
通过这样的方法,能够基于主叫号码的多条呼叫记录进行统计分析,实现主叫号码的溯源,无需针对主叫呼叫全程逐段采集信令,且无需将采集的信令进行全程匹配操作,提高了实现主叫号码溯源的可能性,降低成本,且提高了电话溯源的效率。
在一个实施例中,可以根据在多个局点获取的呼叫信令的主叫号码为多个主叫号码分别生成主叫号码特征标签、生成主叫号码信息,实现对各个主叫号码的溯源,无需针对每个主叫呼叫全程逐段采集信令,且无需将采集的信令进行全程匹配操作,提高了实现主叫号码溯源的可能性,降低成本,且提高了电话溯源的效率。
本发明的电话溯源方法中确定特征信息的一个实施例的流程图如图2所示。
在步骤201中,根据主叫号码特征标签中呼叫信令在各个入局点的分布情况确定入局点的特征权值;根据主叫号码特征标签中呼叫信令在各个采集区域的分布情况确定采集区域的特征权值。以呼叫边界入局点作为根节点,随着呼叫拉远产生浓度稀释的效果,所有到达各自落地局点的呼叫的数量之和应与边界入局点的呼叫数量相等。以边界入局点的呼叫所占比例为100%,所有落地局点各自呼叫数量所占的百分比之和为100%,因此,呼叫数量在总呼叫数量中所占的比例能够反映边界入局点。同理,呼叫数量在总呼叫数量中所占的比例也能够反映边界入区域。入局点的呼叫次数越多、呼叫数量所占比例越大,其特征权值越高;采集区域的呼叫次数越多、呼叫数量所占比例越大,其特征权值越高。在步骤202中,确定特征权值最大的采集区域为边界采集区域。由于呼叫转接、续接过程中存在根节点数量最大,随着分支拉远浓度稀释的效果,因此越靠近边界采集区域的位置呼叫次数越多,越远离来源区域的位置呼叫次数越少,因此,可以确定特征权值最大的区域为来源局点。在一个实施例中,可以将采集区域进行续接,生成呼叫路径,确定源区域、经过区域、落地区域,其中,呼叫数量最多的区域为根,由此可以确定边界采集区域。在一个实施例中,可以利用排序、集合、聚类、决策树和/或线性回归的算法进行计算。
在步骤203中,确定特征权值最大的入局点为边界入局点。由于呼叫转接、续接过程中存在根节点数量最大,随着呼叫拉远浓度稀释的效果,因此越靠近边界入局点的位置呼叫次数越多,越远离来源局点的位置呼叫次数越少,因此,可以确定特征权值最大的边界入局点为来源局点。在一个实施例中,可以将入局点进行续接,生成呼叫路径,确定源局点、经过局点、落地局点,其中,呼叫数量最多的一端为路径的根,由此可以确定来源局点。在一个实施例中,可以利用排序、集合、聚类、决策树和/或线性回归等算法进行计算。
通过这样的方法,能够利用大数据统计分析的方式,通过计算多条主叫号码特征标签得到主叫号码呼叫的采集区域、入局点的分布情况,从而确定呼叫的来源局点、来源区域,实现电话溯源,无需实现单通呼叫的信令数据续接,提高了主叫号码溯源的可能性,提高了电话溯源的效率。
在一个实施例中,可以获取每条呼叫信令的采集区域。在统计呼叫信令,获取主叫号码特征标签时,可以确定每个采集区域的呼叫信令统计分布,确定呼叫信令在每个采集区域的业务比例。通过这样的方法,能够得到主叫号码作为主叫的呼叫在各个区域的分布情况,从而为确定边界采集区域提供数据基础。
在一个实施例中,在统计呼叫信令,获取主叫号码特征标签时,可以提取每条呼叫信令的入局点,并确定每个入局点的呼叫次数,确定呼叫信令在各个入局点的统计分布,确定在每个入局点的业务比例。通过这样的方法,能够得到主叫号码作为主叫的呼叫在各个入局点的分布情况,从而为确定边界入局点提供数据基础。
在一个实施例中,在确定主叫号码特征信息,确定边界入局点、边界采集区域时,可以根据边界入局点的种类判断呼叫类型。入局点可以包括端局、国际或省际长途局点、网间关口、平台等,呼叫的类型可以包括国际呼叫、省际呼叫、网间呼叫、网内呼叫等。当确定的边界入局点为普通的网内局点时,可以判断主叫号码为网内呼叫的用户,确定主叫号码的呼叫类型为网内呼叫,确定边界入局点为来源局点,边界采集区域为来源区域。当判断边界入局点为国际局时,则可以确定呼叫类型为国际呼叫;当判断边界入局点为省际长途局时,则可以确定呼叫类型为省际呼叫;当边界入局点为网间关口局时,则可以确定呼叫类型为网间呼叫。
通过这样的方法,能够确定呼叫的类型,当呼叫类型为网内呼叫时,能够确定呼叫的来源局点、来源区域;当呼叫类型为国际呼叫、网间呼叫时,可以及时联系其他运营商进行查询,从而提高溯源成功的可能性,在打击骚扰、诈骗电话的实践应用中具有重要意义。
本发明的电话溯源方法中确定特征标签的一个实施例的流程图如图3所示。
在步骤301中,根据边界入局点的种类判断呼叫类型。边界入局点可以包括端局、国际或省际长途局点、网间关口、平台等,呼叫的类型可以包括国际呼叫、省际呼叫、网间呼叫、网内呼叫等。
在步骤302中,当边界入局点为网内普通局点时,确定呼叫类型为网内呼叫。
在步骤303中,确定边界入局点为来源局点,边界采集区域为来源区域。
通过这样的方法,能够先确定每个呼叫信令的呼叫类型,在确定呼叫类型为网内呼叫的情况下,确定主叫号码的来源局点、来源区域,从而实现对网内呼叫的溯源,在打击骚扰、诈骗电话的实践应用中具有重要意义。
本发明的电话溯源方法的另一个实施例的流程图如图4所示。
在步骤401中,同时获取主叫号码的多条呼叫信令。由于呼叫过程中存在转接、续接的情况,因此同一呼叫在不同的局点均会存在呼叫信息。
在步骤402中,预处理呼叫信令,生成归一化预处理信息。
在步骤403中,统计归一化预处理信息,获取主叫号码特征标签,主叫号码特征标签中包括呼叫信令的入局点和呼叫信令在各个入局点的分布情况、呼叫信令的采集区域和呼叫信令在各个采集区域的分布情况。
在步骤404中,根据主叫号码特征标签,基于预定策略确定主叫号码特征信息,其中,主叫号码特征信息包括主叫号码的边界入局点、边界采集区域信息。
通过这样的方法,能先对呼叫信令进行预处理,再生成主叫号码特征标签,从而便于自动化提取信息,避免由于信令规则不统一造成的误统计、漏统计等,提高数据处理效率。
在一个实施例中,预处理可以包括信令清洗去重操作,按照一个呼叫在同区域内保留一条信令的原则订阅话单,如按入局点发话或出局点受话的单向话务,对起止时间主被叫及信令协议相同的去重,剔除呼转话单,以尽量避免区域内的重单影响统计分析,提高统计的准确性。
在一个实施例中,预处理可以包括对话单中主叫号码的格式规范化处理,分别统一主叫是国内固话、手机及国际号码等的编码规则,如固话符合区号为+7~8位2~8开头的电话号码,手机号码符合11位1开头的有效号码,国际号码符合00开头的号码,从而便于识别统一主叫号码的呼叫信令,避免漏统计的发生。
在一个实施例中,预处理可以包括对网络信息局点标识的归一化。如在同一区域局点具有七号信令点码、IP地址和移动网地址等多个网络ID的,按局点ID或名称统一,运营商网络、区域网络的ID也需要统一,唯一表示。通过这样的方法能够防止出现同一局点分别统计的情况,确保入局点统计的准确性。
在一个实施例中,预处理可以包括收集每个信令的采集区域(可以是省或地市)、用户漫游局点等区域等属性。通过这样的方法能够为采集区域信息的统计提供基础数据,从而便于实现边界采集区域的溯源。
在一个实施例中,预处理还可以包括采集信令的用户漫游局点信息、媒体IP地址信息等,在生成主叫号码特征标签时,可以将用户漫游局点信息、媒体IP地址信息直接映射在特征标签中,在生成主叫号码特征信息时,可以对用户漫游局点信息、媒体IP地址信息进行匹配,从而提高匹配的准确度,有助于整条呼叫路径的生成。
本发明的电话溯源方法的应用场景的一个实施例的示意如图5所示。主叫用户从A省经集团转接到B省、E省,假设呼叫最少经过A点和T点,以及B或E局点中的一个,其中T局为转接局。可以分A-T、T-B、T-E段分别采集同一主叫号码的呼叫信令,生成主叫号码特征标签。主叫号码特征标签中,A域呼叫数量>B域呼叫数量,A域呼叫数量>E域呼叫数量,A域呼叫数量=B域呼叫数量+E域呼叫数量,因此可确定主叫号码位于A域。
通过这样的方法,能够基于大数据技术,分布式计算基于呼叫、区域、入局点、局点类型等维度的信息,不受网络范围、协议种类、业务变换、时间偏差的影响,分析成功率极大提高,且极大的提高了处理速度;通过策略算法计算出主叫的来源区域、来源局点及话务类型等信息供查询,实现了主叫号码的快速溯源,提高了获取主叫号码来源局点的效率。
本发明的电话溯源装置的一个实施例的示意图如图6所示。其中,信令获取模块601能够获取主叫号码的多条呼叫信令。由于呼叫过程中存在转接、续接的情况,因此同一呼叫在不同的局点均会存在呼叫信息。在一个实施例中,可以提取该主叫号码作为主叫在所有局点的全部呼叫信令,或者提取一段时间内该主叫号码作为主叫在所有局点的全部呼叫信令,或者提取一段时间内该主叫号码作为主叫,符合某一特征的呼叫信令。呼叫信令中包括主叫号码信息、被叫号码信息、入局点信息、出局点信息,起始时间信息、结束时间信息。在一个实施例中,还可以包括呼转号码信息。特征标签获取模块602用于统计呼叫信令,获取主叫号码特征标签,主叫号码特征标签中包括主叫号码特征标签中包括呼叫信令的入局点和呼叫信令在各个入局点的分布情况,和/或呼叫信令的采集区域和呼叫信令在各个采集区域的分布情况,其中,入局点为在呼叫过程中位于网络管理域间呼叫转接、续接的局点。特征信息获取603用于根据主叫号码特征标签,基于预定策略确定主叫号码特征信息,其中,主叫号码特征信息包括主叫号码的边界入局点、边界采集区域信息。边界入局点为一个呼叫在网内起始的局点,如网内呼叫的来源局点,或网间、国际呼叫中进入网内的局点。同理,边界采集区域信息为一个呼叫在网内起始的区域。在一个实施例中,可以根据获得的主叫号码特征标签进行大数据分析,通过统计分析呼叫信令的入局点、呼叫信令的采集区域分别确定主叫号码的边界入局点、边界采集区域。
这样的装置能够基于主叫号码的多条呼叫记录进行统计,实现主叫号码的溯源,无需针对一条呼叫全程采集信令,且无需将采集的信令进行全程匹配操作,提高了实现主叫号码溯源的可能性,且提高了电话溯源的效率。
在一个实施例中,电话溯源装置可以根据在多个局点获取的呼叫信令的主叫号码为多个主叫号码分别生成主叫号码特征标签、生成主叫号码信息,实现对各个主叫号码的溯源,无需针对每个主叫呼叫全程逐段采集信令,且无需将采集的信令进行全程匹配操作,提高了实现主叫号码溯源的可能性,降低成本,且提高了电话溯源的效率。
在一个实施例中,特征信息获取603能够根据主叫号码特征标签中每个采集区域的呼叫次数、所占比例确定采集区域的特征权值;确定特征权值最大的采集区域为来源区域。由于呼叫转接、续接过程中存在根节点数量最大,随着分支拉远浓度稀释的效果,因此越靠近来源区域的位置呼叫次数越多,越远离来源区域的位置呼叫次数越少,因此,可以确定特征权值最大的区域为来源局点。在一个实施例中,可以将采集区域进行续接,生成呼叫路径,确定源区域、经过区域、落地区域,其中,呼叫数量最多、密度最大的区域为根,由此可以确定来源区域。在一个实施例中,可以利用排序、集合、聚类、决策树和/或线性回归等算法进行计算。在一个实施例中,可以先确定来源局点,将来源局点所在的区域作为来源区域。
这样的装置能够利用大数据分析的方式,通过计算多条主叫号码特征标签得到主叫号码呼叫的采集区域的量、分布比例等特征权值,从而确定呼叫的来源局点、来源区域,实现电话溯源,无需实现单通呼叫的信令数据续接,提高了主叫号码溯源的可能性,提高了电话溯源的效率。
在一个实施例中,特征信息获取603能够根据呼叫信令在各个入局点的分布情况确定入局点的特征权值;确定特征权值最大的边界入局点为来源局点。由于呼叫转接、续接过程中存在根节点数量最大,随着呼叫拉远浓度稀释的效果,因此越靠近边界入局点的位置呼叫次数越多,越远离边界入局点的位置呼叫次数越少,因此,可以确定特征权值最大的入局点为边界入局点。在一个实施例中,可以将入局点进行续接,生成呼叫路径,确定源局点、经过局点、落地局点,其中,呼叫数量最多的一端为路径的根,由此可以确定边界入局点。在一个实施例中,可以利用排序、集合、聚类、决策树和/或线性回归的算法进行计算。
这样的装置能够利用大数据分析的方式,通过计算多条主叫号码特征标签得到主叫号码呼叫的入局点的量、分布比例等特征权值,从而确定呼叫的边界入局点,实现电话溯源,无需实现单通呼叫的信令数据续接,提高了主叫号码溯源的可能性,提高了电话溯源的效率。
在一个实施例中,特征标签获取模块可以包括入局点统计单元,能够提取每条呼叫信令的入局点,并确定每个入局点的呼叫次数,确定呼叫信令在各个入局点的统计分布,确定在每个入局点的业务比例。这样的装置能够得到主叫号码作为主叫的呼叫在各个局点的分布情况,从而为确定边界入局点提供数据基础。
在一个实施例中,特征标签获取模块可以包括采集区域统计单元,能够确定每个采集区域的呼叫信令统计分布,确定呼叫信令在每个采集区域的业务比例。这样的装置能够得到主叫号码作为主叫的呼叫在各个区域的分布情况,从而为确定边界采集区域提供数据基础。
本发明的特征信息获取模块的一个实施例的示意图如图7所示。其中,呼叫类型确定单元701能够根据边界入局点的种类判断呼叫类型。入局点可以包括端局、国际或省际长途局点、网间关口、平台等,呼叫的类型可以包括国际呼叫、省际呼叫、网间呼叫、网内呼叫等。当确定的边界入局点为普通的网内局点时,来源确定单元702可以判断主叫号码为网内呼叫的用户,确定主叫号码的呼叫类型为网内呼叫,确定边界入局点为来源局点,边界采集区域为来源区域。当判断边界入局点为国际局时,来源确定单元702可以确定呼叫类型为国际呼叫;当判断边界入局点为省际长途局时,来源确定单元702可以确定呼叫类型为省际呼叫;当边界入局点为网间关口局时,来源确定单元702可以确定呼叫类型为网间呼叫。
这样的装置能够确定呼叫的类型,当呼叫类型为网内呼叫时,能够确定呼叫的来源局点、来源区域;当呼叫类型为国际呼叫、网间呼叫时,可以及时联系其他运营商进行查询,从而提高溯源成功的可能性,在打击骚扰、诈骗电话的实践应用中具有重要意义。
本发明的电话溯源装置的另一个实施例的示意图如图8所示。其中,信令获取模块801、特征标签获取模块802和特征信息获取803的结构和功能与图6的实施例中相似。电话溯源装置还可以包括预处理模块804,位于信令获取模块801与特征标签获取模块802之间,能够预处理呼叫信令,生成归一化预处理信息。特征标签获取模块802能够统计归一化预处理信息,获取主叫号码特征标签,主叫号码特征标签中包括呼叫信令的入局点和呼叫信令在各个入局点的分布情况、呼叫信令的采集区域和呼叫信令在各个采集区域的分布情况。
这样的装置能先对呼叫信令进行预处理,再生成主叫号码特征标签,从而便于自动化提取信息,避免由于信令规则不统一造成的误统计、漏统计等,提高数据处理效率。
本发明的预处理模块的一个实施例的示意图如图9所示。其中,去重单元901能够执行信令清洗去重操作,按照一个呼叫在同区域内保留一条信令的原则订阅话单,如按入局点发话或出局点受话的单向话务,对起止时间主被叫及信令协议相同的去重,剔除呼转话单,以尽量避免区域内的重单影响统计分析,提高统计的准确性。规范化单元902能够对话单中主叫号码的格式规范化处理,分别统一主叫是国内固话、手机及国际号码等的编码规则,从而便于识别统一主叫号码的呼叫信令,避免漏统计的发生;还可以对网络信息局点标识的归一化,如在同一区域局点具有七号信令点码、IP地址和移动网地址等多个网络ID的,按局点ID或名称统一,运营商网络、区域网络的ID也需要统一、唯一表示,从而防止出现同一局点分别统计的情况,确保入局点统计的准确性。采集区域获取单元903收集每个信令的采集区域(可以是省或地市)、用户漫游局点等区域等属性,从而能够为采集区域信息的统计提供基础数据,从而便于实现来源区域的溯源。
这样的装置能先对呼叫信令进行预处理,再生成主叫号码特征标签,从而便于自动化提取信息,避免由于信令规则不统一造成的误统计、漏统计等,提高统计的准确性。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。

Claims (14)

1.一种电话溯源方法,其特征在于,包括:
获取主叫号码的多条呼叫信令,所述呼叫信令中包括主叫号码信息、被叫号码信息、入局点信息、出局点信息,起始时间信息、结束时间信息;
根据所述呼叫信令确定主叫号码特征标签,所述主叫号码特征标签中包括所述呼叫信令的入局点和所述呼叫信令在各个所述入局点的分布情况,和/或所述呼叫信令的采集区域和所述呼叫信令在各个所述采集区域的分布情况;
根据所述主叫号码特征标签,基于预定策略确定主叫号码特征信息,其中,所述主叫号码特征信息包括所述主叫号码的边界入局点和/或边界采集区域信息。
2.根据权利要求1所述的方法,其特征在于,所述预定策略包括:
根据主叫号码特征标签中所述呼叫信令在各个所述入局点的分布情况确定所述入局点的特征权值;
确定特征权值最大的所述入局点为所述边界入局点;
和/或,
根据主叫号码特征标签中所述呼叫信令在各个所述采集区域的分布情况确定所述采集区域的特征权值;
确定特征权值最大的所述采集区域为所述边界采集区域。
3.根据权利要求2所述的方法,其特征在于,所述根据所述呼叫信令确定主叫号码特征标签包括:
根据所述呼叫信令中的所述入局点信息统计呼叫的入局点;
根据所述呼叫信令中各个所述入局点的呼叫数量确定所述呼叫信令在各个所述入局点的分布情况;
和/或,
根据在各个采集区域获取的所述呼叫信令的数量确定所述呼叫信令在各个所述采集区域的分布情况。
4.根据权利要求2所述的方法,其特征在于,所述根据所述主叫号码特征标签,基于预定策略确定主叫号码特征信息还包括:
根据所述边界入局点的类型确定呼叫类型;
若所述边界入局点为网内普通局点,则所述呼叫类型为网内呼叫,所述边界入局点为来源局点,和/或所述边界采集区域为来源区域。
5.根据权利要求4所述的方法,其特征在于,
所述根据所述主叫号码特征标签,基于预定策略确定主叫号码特征信息还包括:
若所述边界入局点为国际局,则所述呼叫类型为国际呼叫;
若所述边界入局点为省际长途局,则所述呼叫类型为省际呼叫;和/或
若所述边界入局点为网间关口局,则所述呼叫类型为网间呼叫。
6.根据权利要求1所述的方法,其特征在于,还包括:
预处理所述呼叫信令,生成归一化预处理信息;
所述根据所述呼叫信令确定主叫号码特征标签包括:统计所述归一化预处理信息,获取所述主叫号码特征标签。
7.根据权利要求6所述的方法,其特征在于,所述预处理所述呼叫信令,生成归一化预处理信息包括:
对起始时间信息和结束时间信息相同,且所述入局点和/或所述出局点相同的所述呼叫信令进行去重操作;
规范化所述呼叫信令的号码编码规则和/或局点的编码规则;和/或
获取每个所述呼叫信令的采集区域。
8.一种电话溯源装置,其特征在于,包括:
信令获取模块,用于获取主叫号码的多条呼叫信令,所述呼叫信令中包括主叫号码信息、被叫号码信息、入局点信息、出局点信息,起始时间信息、结束时间信息;
特征标签获取模块,用于根据所述呼叫信令确定主叫号码特征标签,所述主叫号码特征标签中包括所述呼叫信令的入局点和/或所述呼叫信令的采集区域,以及所述呼叫信令在各个所述入局点和/或所述采集区域的分布情况;
特征信息获取模块,用于根据所述主叫号码特征标签,基于预定策略确定主叫号码特征信息,其中,所述主叫号码特征信息包括所述主叫号码的边界入局点和/或边界采集区域信息。
9.根据权利要求8所述的装置,其特征在于,所述预定策略包括:
根据主叫号码特征标签中所述呼叫信令在各个所述采集区域的分布情况确定所述采集区域的特征权值;
确定特征权值最大的所述采集区域为所述边界采集区域;
和/或,
根据主叫号码特征标签中所述呼叫信令在各个所述入局点的分布情况确定所述入局点的特征权值;
确定特征权值最大的所述入局点为所述边界入局点。
10.根据权利要求9所述的装置,其特征在于,所述特征标签获取模块用于:
根据所述呼叫信令中的所述入局点信息统计呼叫的入局点;
根据所述呼叫信令中各个所述入局点的呼叫数量确定所述呼叫信令在各个所述入局点的分布情况;和/或,
根据在各个采集区域获取的所述呼叫信令的数量确定所述呼叫信令在各个所述采集区域的分布情况。
11.根据权利要求9所述的装置,其特征在于,所述特征信息获取模块包括:
呼叫类型确定单元,用于根据所述边界入局点的类型确定呼叫类型;
来源确定单元,用于在所述边界入局点为网内普通局点时,确定所述呼叫类型为网内呼叫,所述边界入局点为来源局点,和/或所述边界采集区域为来源区域。
12.根据权利要求11所述的装置,其特征在于,所述来源确定单元,还用于:
当所述边界入局点为国际局时,确定所述呼叫类型为国际呼叫;
当所述边界入局点为省际长途局时,确定所述呼叫类型为省际呼叫;和/或,
当所述边界入局点为网间关口局时,确定所述呼叫类型为网间呼叫。
13.根据权利要求8所述的装置,其特征在于,还包括:
预处理模块,用于预处理所述呼叫信令,生成归一化预处理信息;
所述特征标签获取模块用于统计所述归一化预处理信息,获取所述主叫号码特征标签。
14.根据权利要求13所述的装置,其特征在于,所述预处理模块包括:
去重单元,用于对起始时间信息和结束时间信息相同,且边界接入局或边界汇接局相同的所述呼叫信令进行去重操作;
规范化单元,用于规范化所述呼叫信令的号码编码规则和/或所述局点的编码规则;和/或
采集区域获取单元,用于获取每个所述呼叫信令的采集区域。
CN201610825057.4A 2016-09-14 2016-09-14 电话溯源方法和装置 Active CN107819959B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610825057.4A CN107819959B (zh) 2016-09-14 2016-09-14 电话溯源方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610825057.4A CN107819959B (zh) 2016-09-14 2016-09-14 电话溯源方法和装置

Publications (2)

Publication Number Publication Date
CN107819959A CN107819959A (zh) 2018-03-20
CN107819959B true CN107819959B (zh) 2019-12-31

Family

ID=61601556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610825057.4A Active CN107819959B (zh) 2016-09-14 2016-09-14 电话溯源方法和装置

Country Status (1)

Country Link
CN (1) CN107819959B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116261110B (zh) * 2022-12-06 2024-04-12 中国联合网络通信集团有限公司 Sdr数据的确定方法、装置以及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7447159B1 (en) * 2004-12-21 2008-11-04 At&T Corp. Method and apparatus for graphically displaying call signaling flows in a network
CN1867084B (zh) * 2006-03-08 2010-04-21 华为技术有限公司 信令处理方法
CN101094095A (zh) * 2006-06-21 2007-12-26 西安大唐电信有限公司 一种呼叫全过程的信令跟踪记录方法
US8843107B2 (en) * 2007-02-08 2014-09-23 Yp Interactive Llc Methods and apparatuses to connect users of mobile devices to advertisers
CN102131197B (zh) * 2010-01-20 2015-09-16 中兴通讯股份有限公司 一种在公共设备上接入网络的方法及系统
KR101338486B1 (ko) * 2010-12-21 2013-12-10 주식회사 케이티 I-wlan의 게이트웨이 및 그의 호 추적 방법
CN103888923B (zh) * 2012-12-19 2018-01-30 中国移动通信集团河南有限公司 应用于虚拟专用移动网的呼叫接续方法、系统及装置
CN104580651A (zh) * 2013-10-16 2015-04-29 中国移动通信集团湖南有限公司 一种呼叫处理方法及装置

Also Published As

Publication number Publication date
CN107819959A (zh) 2018-03-20

Similar Documents

Publication Publication Date Title
US7062024B2 (en) Telecommunication services reporting system
CN104301896B (zh) 诈骗短信智能监控告警系统和方法
CN101605018A (zh) 一种基于流的深度报文检测协议解码方法、设备及系统
CN103546343B (zh) 网络流量分析系统的网络流量展示方法和系统
CN101686444B (zh) 垃圾短信发送号码实时检测系统及方法
Murynets et al. Analysis and detection of SIMbox fraud in mobility networks
CN104093153A (zh) 一种基于信令路由分析实现伪号码呼叫甄别和拦截的方法及其系统
CN102378151B (zh) 信息共享平台及方法
CN101789899A (zh) 一种网络服务质量分析方法及系统
CN105451234A (zh) 一种基于信令交互数据的可疑号码分析方法及装置
CN102694895B (zh) 来电原因的判定方法及装置
CN107196812A (zh) 一种volte业务投诉的智能处理的方法及装置
CN111865628A (zh) 家宽故障影响用户的统计系统、方法、服务器和存储介质
CN107819959B (zh) 电话溯源方法和装置
CN114169438A (zh) 一种电信网络诈骗识别方法、装置、设备及存储介质
CN102905236B (zh) 一种垃圾短消息监控方法、装置及系统
CN110798379A (zh) 一种VoIP信令网关识别方法、装置及可读存储介质
KR101469283B1 (ko) 기업 네트워크 분석 시스템 및 그 방법
CN101409886B (zh) 一种关联彩信事件的方法
AT&T
CN102547711B (zh) 一种检测与拦截ip信令网络中骚扰电话的系统及方法
CN102421110B (zh) 端到端关联的实现方法和装置
Khan et al. Automatic Monitoring & Detection System (AMDS) for Grey Traffic
CN101448269A (zh) 一种确定呼叫失败原因的方法和系统
Kehelwala et al. Real-time grey call detection system using complex event processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant