CN112449063B - 话单稽查方法、装置、设备和介质 - Google Patents
话单稽查方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN112449063B CN112449063B CN201910811986.3A CN201910811986A CN112449063B CN 112449063 B CN112449063 B CN 112449063B CN 201910811986 A CN201910811986 A CN 201910811986A CN 112449063 B CN112449063 B CN 112449063B
- Authority
- CN
- China
- Prior art keywords
- call
- ticket
- time
- time window
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M15/00—Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
- H04M15/34—Charging, billing or metering arrangements for private branch exchanges
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M15/00—Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
- H04M15/41—Billing record details, i.e. parameters, identifiers, structure of call data record [CDR]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M15/00—Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
- H04M15/82—Criteria or parameters used for performing billing operations
- H04M15/8207—Time based data metric aspects, e.g. VoIP or circuit switched packet data
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了话单稽查方法、装置、设备和介质。该方法包括:获取源自第一交换机的第一话单集合和源自第二交换机的第二话单集合,其中,针对目标用户的通话,第一交换机和第二交换机各自生成相应的话单;生成第一话单集合中的第一话单和第二话单集合中的第二话单的匹配对集合,并计算匹配对集合的每一匹配对中的第一话单和第二话单的话单时间差,其中,每一匹配对中的第一话单和第二话单属于同一通话;基于分别与所有匹配对一一对应的多个话单时间差,确定最佳时间窗口;根据匹配对对应的话单时间差是否大于最佳时间窗口,确定匹配对对应的通话是否漏单。根据本发明实施例提供的方案,可以保证话单稽查的准确性。
Description
技术领域
本发明涉及通信领域,尤其涉及话单稽查方法、装置、设备和介质。
背景技术
在通信领域,为了方便通信运营商计费和结算,用户的每次通话均会产生包含本次通话信息的话单。在一些特点业务场景下,同一通话可能需要在不同源交换机中产生话单。若出现漏单现象,即话单本应该在多台交换机中生成话单,实际上却未完全生成相应的话单的现象,可能会对通信运营商的通信管理工作造成影响。
因此,在同一通话在不同源交换机中产生话单的情况下,为了避免漏单现象对通信管理工作的影响,需要一种话单稽查方法。
发明内容
本发明实施例提供的话单稽查方法、装置、设备和介质,可以保证话单稽查的准确性。
根据本发明实施例的一方面,提供一种话单稽查方法,包括:获取源自第一交换机的第一话单集合和源自第二交换机的第二话单集合,其中,针对目标用户的通话,第一交换机和第二交换机各自生成相应的话单;生成第一话单集合中的第一话单和第二话单集合中的第二话单的匹配对集合,并计算匹配对集合的每一匹配对中的第一话单和第二话单的话单时间差,其中,每一匹配对中的第一话单和第二话单属于同一通话;基于与所有匹配对对应的多个话单时间差,确定最佳时间窗口;根据匹配对对应的话单时间差是否大于最佳时间窗口,确定匹配对对应的通话是否漏单。
在一种可选的实施方式中,方法还包括:
从第一交换机获取与第一话单集合对应的第一原始详情话单集合,从第二交换机获取与第二话单集合对应的第二原始详情话单集合;
对第一原始详情话单集合的每一第一原始详情话单进行数据清洗,得到该第一原始详情话单的关键通话指标参数,基于该第一原始详情话单的关键通话指标参数,构造与该第一原始详情话单对应的第一话单;
对第二原始详情话单集合的每一第二原始详情话单进行数据清洗,得到该第二原始详情话单的关键通话指标参数,基于该第二原始详情话单的关键通话指标参数,构造与该第二原始详情话单对应的第二话单;
其中,关键通话指标参数包括通话相关方的身份标识信息和/或通话时间,通话时间包括通话起始时刻和/或通话结束时刻。
在一种可选的实施方式中,生成第一话单集合中的第一话单和第二话单集合中的第二话单的匹配对集合,具体包括:
将第一话单集合中对应同一通话相关方的第一话单,划分为一个第一话单子集合;
将第二话单集合中对应同一通话相关方的第二话单,划分为一个第二话单子集合;
构造对应同一通话相关方的第一话单子集合和第二话单子集合的笛卡尔乘积;
针对每一个笛卡尔乘积,将该笛卡尔乘积的每个元素作为第一话单和第二话单的候选匹配对,并计算每个候选匹配对对应的话单时间差,将该笛卡尔乘积内相同通话时长的候选匹配对分为一组,并将每一组候选匹配对中话单时间差最小的候选匹配对添加入匹配对集合。
在一种可选的实施方式中,计算匹配对集合的每一匹配对中的第一话单和第二话单的话单时间差,具体包括:
针对每一匹配对,获取第一话单记录的通话时间和第二话单记录的通话时间;
将第一话单记录的通话时间和第二话单记录的通话时间的差值,作为该匹配对对应的话单时间差;
其中,若通话时间包括通话起始时刻,话单时间差为第一话单记录的通话起始时刻与第二话单记录的通话起始时刻的差值,
若通话时间包括通话结束时刻,话单时间差为第一话单记录的通话结束时刻与第二话单记录的通话结束时刻的差值。
在一种可选的实施方式中,基于与所有匹配对对应的多个话单时间差,确定最佳时间窗口,具体包括:
获取与所有匹配对对应的多个话单时间差;
统计每一话单时间差对应的匹配对数目;
根据多个话单时间差,确定与各话单时间差对应的候选时间窗口,其中,候选时间窗口的起始时刻为零,候选时间窗口的时间跨度与对应的话单时间差相等;
针对任意一个候选时间窗口,将落入任意一个候选时间窗口内的所有话单时间差对应的匹配对数目之和,作为任意一个候选时间窗口的匹配对数目;
按照时间跨度从小到大的顺序对候选时间窗口排序,得到候选时间窗口序列;
在候选时间窗口序列中,依次确定当前候选时间窗口的匹配度与后一候选时间窗口的匹配度的变化量,若变化量小于第一预设阈值,将当前候选时间窗口确定为最佳时间窗口,
其中,当前候选时间窗口的匹配度等于当前候选时间窗口的匹配对数目除以理论最大匹配数得到的商值。
在一种可选的实施方式中,若变化量小于预设阈值,将当前候选时间窗口确定为最佳时间窗口之后,方法还包括:
验证最佳时间窗口具备正确性;
其中,验证最佳时间窗口具备正确性,具体包括:
针对时间跨度小于最佳时间窗口的候选时间窗口,确定对应的参考候选时间窗口的匹配度与该候选时间窗口的匹配度的变化量小于第二预设阈值,对应的参考候选时间窗口的时间跨度等于该候选时间窗口的时间跨度与最佳时间窗口的时间跨度之和。
在一种可选的实施方式中,根据匹配对对应的话单时间差是否大于最佳时间窗口,确定匹配对对应的通话是否漏单,具体包括:
若匹配对对应的话单时间差小于等于最佳时间窗口,确定匹配对对应的通话未漏单;
若匹配对对应的话单时间差大于最佳时间窗口,确定匹配对对应的通话漏单。
在一种可选的实施方式中,目标用户包括:附着于2G网络或3G网络的Volte网络用户
在一种可选的实施方式中,第一话单集合和第二话单集合的其中一者为计费话单的集合,另一者为结算话单的集合。
根据本发明实施例的另一方面,提供一种话单稽查装置,包括:话单集合获取模块,用于获取源自第一交换机的第一话单集合和源自第二交换机的第二话单集合,其中,针对目标用户的通话,第一交换机和第二交换机各自生成相应的话单;话单集合处理模块,用于生成第一话单集合中的第一话单和第二话单集合中的第二话单的匹配对集合,并计算匹配对集合的每一匹配对中的第一话单和第二话单的话单时间差,其中,每一匹配对中的第一话单和第二话单属于同一通话;时间窗口确定模块,用于基于与所有匹配对对应的多个话单时间差,确定最佳时间窗口;漏单判断模块,用于根据匹配对对应的话单时间差是否大于最佳时间窗口,确定匹配对对应的通话是否漏单。
在一种可选的实施方式中,装置还包括:
原始详情话单集合获取模块,用于从第一交换机获取与第一话单集合对应的第一原始详情话单集合,从第二交换机获取与第二话单集合对应的第二原始详情话单集合;
第一数据清洗模块,用于对第一原始详情话单集合的每一第一原始详情话单进行数据清洗,得到该第一原始详情话单的关键通话指标参数,基于该第一原始详情话单的关键通话指标参数,构造与该第一原始详情话单对应的第一话单;
第二数据清洗模块,用于对第二原始详情话单集合的每一第二原始详情话单进行数据清洗,得到该第二原始详情话单的关键通话指标参数,基于该第二原始详情话单的关键通话指标参数,构造与该第二原始详情话单对应的第二话单;
其中,关键通话指标参数包括通话相关方的身份标识信息和/或通话时间,通话时间包括通话起始时刻和/或通话结束时刻。
根据本发明实施例的又一方面,提供一种话单稽查设备,包括:
存储器,用于存储程序;处理器,用于运行存储器中存储的程序,以执行本发明实施例提供的话单稽查方法。
根据本发明实施例的再一方面,提供一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现本发明实施例提供的话单稽查方法。
根据本发明实施例中的话单稽查方法、装置、设备和介质,针对同一通话在不同交换机中产生话单的特定业务场景,在第一话单集合和第二话单集合中确定多个匹配对,并根据各匹配对中属于同一次特定通话的第一话单和第二话单的话单差,学习得到一个能够最佳时间窗口。由于最佳时间窗口能够表征话单时间差的合理范围取值,利用最佳时间窗口和各匹配对对应的话单时间差来判断特定通话是否漏单,能够保证话单稽查的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是示出根据本发明实施例的话单稽查方法的示意流程图;
图2示出了根据本发明另一实施例提供的话单稽查装置的结构示意图;
图3是本发明实施例中话单稽查设备的示例性硬件架构的结构图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
随着通信技术的发展,对通信话单的管理也日益趋于严格。每次通话结束都会在交换机中产生相应的话单,以供通信运营商根据话单进行计费和结算。在一些特定情况下,一次通话可能会同时在不同源的交换机中产生话单。作一个示例,计费话单和结算话单可能会分别产生于不同源的交换机中。例如,跨省漫游话单。作另一个示例,当长期演进语音承载(Voice over Long-Term Evolution,VoLTE)网络用户2/3G网络下进行通话时,本次通话会在应用服务器(Application Server,AS)交换机和传统交换机各生成一个话单。
在同一通话在不同源交换机产生话单的情况下,为了便于话单的管理,需要通过话单稽查来确定是否需要漏单。
为了更好的理解本发明,下面将结合附图,详细描述根据本发明实施例的话单稽查方法、装置、设备和介质,应注意,这些实施例并不用来限制本发明公开的范围。
图1是示出根据本发明实施例的话单稽查方法的示意流程图。如图1所示,本实施例中的话单稽查方法100可以包括S140至S170:
S140,获取源自第一交换机的第一话单集合和源自第二交换机的第二话单集合。其中,针对目标用户的通话,第一交换机和第二交换机各自生成相应的话单。
在本发明的一些实施例中,目标用户可以包括:附着于2G网络或3G网络的Volte网络用户。
根据上述实施例可知,附着于2G/3G网络的VoLTE网络用户在通话结束后,会分别在AS交换机和传统交换机产生话单。此时,可以将AS交换机产生的话单集合和传统交换机产生的话单集合的其中一者作为第一话单集合,另一者作为第二话单集合。
在本发明的另一些实施例中,第一话单集合和第二话单集合的其中一者为计费话单的集合,另一者为结算话单的集合。相应地,目标用户可以是对应的计费话单和结算话单源于不同交换机的用户。
在本发明的一些实施例中,第一话单集合和第二话单集合的具体形式可以为一个完整预设周期内的话单。相应地,S140可具体包括:每间隔预设周期,获取第一话单集合和第二话单集合。优选的,预设周期可以是一天。
在本发明的一些实施例中,为了规范第一话单和第二话单的格式,以及提高处理效率,步骤S140之前,话单稽查方法100还包括S110至S130:
S110,从第一交换机获取与第一话单集合对应的第一原始详情话单集合,从第二交换机获取与第二话单集合对应的第二原始详情话单集合。
在一些实施例中,原始详情话单集合是由多个原始详情话单组成的集合。其中,原始详情话单是通话结束后,根据通讯运营商所制定的话单格式所直接生成的话单的自然形态。
在一些实施例中,S110获取第一原始详情话单和第二原始详情话单之后,在执行S120之前,可以先存储第一原始详情话单和第二原始详情话单。
考虑到原始详情话单的日存储量高达数百G,传统数据库已经无法满足实时处理需求,在对原始详情话单的具体处理方式优选采用大数据分布式存储和分布式计算技术。具体地,先利用sqoop(即一款开源的工具)将第一原始详情话单和第二原始详情话单传输详单至分布式文件系统(Hadoop Distributed File System,HDFS),以便于后续过程中对原始详情话单进行存储和计算。
在一些实施例中,S110具体包括:数据的抽取、转换、加载和过滤等过程。数据的抽取、转换、加载及过滤过程均可以在hadoop系统上(即分布式系统基础架构)完成。具体地,可以利用映射-规约(Map-Reduce)程序对数据进行处理。
在本实施例中,通过使用Map-Reduce程序,能够提高数据的处理效率和计算速率。
在一个实施例中,数据过滤步骤的具体实施方式可以包括:根据原始详情话单中的部分字段从第一交换机的话单中提取出对应目标用户的第一原始详情话单。其中,第一交换机除原始详情话单之外,还有其他话单。其中,该部分字段表征能够反映话单类型的字段。
S120,对第一原始详情话单集合的每一第一原始详情话单进行数据清洗,得到该第一原始详情话单的关键通话指标参数,基于该第一原始详情话单的关键通话指标参数,构造与该第一原始详情话单对应的第一话单。
其中,关键通话指标参数包括通话相关方的身份标识信息和/或通话时间,
在一些实施例中,根据话单具体格式的不同,通话相关方可以是通话主叫方、通话被叫方、通话结算方。通话相关方可根据具体的通话场景和通话需求设置,在此并不限定。
在一些实施例中,通话相关方的身份标识信息能够表示能够证明通话相关方本人身份的凭证。可以是通话相关方的信息,也可以是通话相关方的通讯设备的信息。具体地,可以是国际移动用户识别码(International Mobile Subscriber IdentificationNumber,IMSI),通话相关方的移动用户号码簿号码(Mobile Directory Number,MDN),通讯设备的电子序列号(Electronic Serial Number,ESN)等,对此不做限定。
在一些实施例中,通话时间能够表示通话的时间信息。具体地,可以是通话时间节点的信息。优选地,通话时间包括通话起始时刻和/或通话结束时刻。
在一些实施例中,S120中的数据清洗步骤的具体实施方式包括:删除第一原始详情话单中的冗余字段信息,保留关键通话指标参数。
根据本实施例中,通过筛除冗余字段信息,能够减少后续话单稽查过程中的数据处理量,进而提高话单稽查的效率。尤其适合对海量话单数据的稽查。此外,在第一原始详情话单和第二原始详情话单具体格式不同的情况下,通过S120,能够使得清洗后第一话单和第二话单具备一致性和规范性。
S130,对第二原始详情话单集合的每一第二原始详情话单进行数据清洗,得到该第二原始详情话单的关键通话指标参数,基于该第二原始详情话单的关键通话指标参数,构造与该第二原始详情话单对应的第二话单。
在一些实施例中,S130的具体实施方式可参见S120的相关内容,在此不再赘述。
S150,生成第一话单集合中的第一话单和第二话单集合中的第二话单的匹配对集合,并计算匹配对集合的每一匹配对中的第一话单和第二话单的话单时间差。
其中,每一匹配对中的第一话单和第二话单属于同一通话。
在本发明的一些实施例中,针对任意一个匹配对中第一话单和第二话单,两个话单属于同一通话,则理论上两个话单所记录的关键通话指标参数相同。因此,可以根据第一话单的关键通话指标参数和第二话单的关键通话指标参数生成匹配对集合。
然而,由于可能因为各种原因导致两个交换机各自产生的话单之间存在时间差,若严格按照关键通话指标参数中的通话时间来确定对应同一通话的匹配对,则可能存在着话单误配、漏配等情况。而关键通话指标参数中的通话相关方的身份标识信息存在误差的可能性较小。因此,可以主要使用通话相关方的身份标识信息生成匹配对集合。
相应地,在一些实施例中,S150中的生成匹配对集合的具体实施方式,包括S151至S154:
S151,将第一话单集合中对应同一通话相关方的第一话单,划分为一个第一话单子集合。也就是说,通话相关方的身份标识信息相同的第一话单,可以划分为一个第一话单子集合。
作一个示例,若通话相关方A对应第一话单d1,d2,d3;通话相关方B对应第一话单d4,d5。则对应地,可以分别生成第一话单子集合DA=(d1,d2,d3),DB=(d4,d5)。
在一个实施例中,由于后续步骤S154中需要按照通话时长进行分组,相应地,S151的具体实施方式可以包括:
将第一话单集合中对应同一通话相关方、且通话时长相同的第一话单构造为一个第一话单子集合。
S152,将第二话单集合中对应同一通话相关方的第二话单,划分为一个第二话单子集合。
作一个示例,若通话相关方A对应第二话单v1,v2;通话相关方B对应第二话单v3,v4。则对应地,可以分别生成第二话单子集合VA=(v1,v2),VB=(v3,v4)。
在一个实施例中,由于后续步骤S154中需要按照通话时长进行分组,相应地,S152的具体实施方式可以包括:
将第二话单集合中对应同一通话相关方、且通话时长相同的第二话单构造为一个第二话单子集合。
S153,构造对应同一通话相关方的第一话单子集合和第二话单子集合的笛卡尔乘积。
在一些实施例中,S153的具体实施方式包括:从第一话单子集合中任选一个第一话单,以及,从对应同一通话相关方的第二话单子集合中任选一个第二话单,将该第一话单和该第二话单作为一个有序对,将所有可选择方案生成的有序对的集合作为该第一话单子集合和该第二话单子集合的笛卡尔乘积。其中,笛卡尔乘积的每个元素均为第一话单和第二话单组成的有序对。
其中,第一元素笛卡尔乘积的元素数量等于第一话单子集合中第一话单的数量和第二话单子集合中第二话单的数量的乘积。
作一个示例,继续以上述两个示例中通话相关方A对应的第一话单子集合DA=(d1,d2,d3)以及对应的第二话单子集合VA=(v1,v2)为例。若第一话单子集合DA和第二话单子集合VA的笛卡尔积为UA,则UA=(u1,u2,u3,u4,u5,u6)。
其中,u1=(d1,v1),u2=(d1,v2),u3=(d2,v1),u4=(d2,v2),u5=(d3,v1),u6=(d3,v2)。
S154,针对每一个笛卡尔乘积,将该笛卡尔乘积的每个元素作为第一话单和第二话单的候选匹配对,并计算每个候选匹配对对应的话单时间差,将该笛卡尔乘积内相同通话时长的候选匹配对分为一组,并将每一组候选匹配对中话单时间差最小的候选匹配对添加入匹配对集合。
在一个实施例中,候选匹配对表示其包含的第一话单和第二话单具备属于同一通话的可能性。
在一个具体的实施例中,为了便于后续过程的计算和处理,候选匹配对除了笛卡尔乘积的元素之外,还包括该元素对应的第一话单和第二话单之间的话单时间差。
作一个示例,继续参照上述示例,笛卡尔积UA=(u1,u2,u3,u4,u5,u6),具体地,u1=(d1,v1,Δt11),u2=(d1,v2,Δt12),u3=(d2,v1,Δt21),u4=(d2,v2,Δt22),u5=(d3,v1,Δt31),u6=(d3,v2,Δt32)。
其中,每个元素中的Δt为该元素中第一话单d和第二话单v的乘积。例如,Δt11为第一话单d1和第二话单v1的时间差。
针对每一组候选匹配对,按照对话单时间差从小到大的顺序,依次排列该组中的候选匹配对,并将每一组中第一个候选匹配对添加入匹配对集合。也就是说,每一组候选匹配对中,话单时间差最小的候选匹配对的第一话单和第二话单属于同一通话。
作一个示例,若u1、u3、u6的通话时长为30秒,则可以将三者作为第一小组。若u2、u4、u5的通话时长为2分11秒,则可以将三者作为第二小组。若第一小组中,按照话单时间差从小到大的次序,依次为u3、u6、u1;若第二小组中,按照话单时间差从小到大的次序,依次为u5、u4、u2。则将u3和u5添加入匹配对集合。
在本实施例中,由于可能通话相关方相同,则可能第一话单和第二话单也不属于相同的通话。例如,用户A在一天之内,可能会与用户B进行多次通话。此时,多次通话所产生的第一话单和第二话单的通话相关方相同,但是却可能属于不同的通话。然而,多次通话的通话时长相同的可能性却较低,因此,为了提高准确性,可以利用通话时长来进一步判断是否属于同一通话。
另外,在本实施例中,通过构建笛卡尔积,能够列出可能属于同一通话的第一话单和第二话单的所有候选匹配对,由于候选匹配对代表着所有可能属于同一通话的第一话单和第二话单的组合,再从候选匹配对中选出最可能属于同一通话的第一话单和第二话单的组合添加入匹配对集合,能够提高话单稽查的准确性。
另外,由于实际通话过程中,同一通话产生一个第一话单和一个第二话单,也就是说第一话单和第二话单具备一一对应关系,也相较于其他误匹配的第一话单和第二话单,理论上时间差最小。因此,通过S154能够准确、高效的确定属于同一通话的第一话单和第二话单。
此外,由于本方案计算量较小,可以满足海量话单数据的实时计算和动态评分需求。对话单稽查系统的开发及部署所需要的软、硬件平台无特殊限制和需求。
在另一些实施例中,S150中的计算匹配对集合的每一匹配对中的第一话单和第二话单的话单时间差,具体包括S155至S156:
S155,针对每一匹配对,获取第一话单记录的通话时间和第二话单记录的通话时间。
S156,将第一话单记录的通话时间和第二话单记录的通话时间的差值,作为该匹配对对应的话单时间差。
其中,若通话时间包括通话起始时刻,话单时间差为第一话单记录的通话起始时刻与第二话单记录的通话起始时刻的差值。
若通话时间包括通话结束时刻,话单时间差为第一话单记录的通话结束时刻与第二话单记录的通话结束时刻的差值。
通过步骤S155和S156,每一匹配对均对应一个话单时间差。
S160,基于与所有匹配对一一对应的多个话单时间差,确定最佳时间窗口。
其中,最佳时间窗口表示话单时间差的合理取值范围。例如,因第一交换机和第二交换机的时钟不同步而产生的时间差落入该合理取值范围。
在本发明的一些实施例中,S160的具体实施方式包括S161至S166:
S161,获取与所有匹配对一一对应的多个话单时间差。
作一个示例,若基于第一话单集合和第二话单集合生成的匹配对集合共包括N个匹配对P1、P2、……、PN。则S161中共获取N各话单时间差,分别为:与P1对应的话单时间差Δt1,与P2对应的话单时间差Δt2,……,与PN对应的话单时间差ΔtN。
S162,统计每一话单时间差对应的匹配对数目。
具体地,若M个匹配对的话单时间差相同,为Δt2,则Δt2对应的匹配对数据为M。
示例性的,若匹配对集合中共包括10个匹配对,10个匹配对对应的话单时间差分别为15毫秒、30毫秒、15毫秒、80毫秒、30毫秒、30毫秒、15毫秒、15毫秒、30毫秒、30毫秒。则话单时间差15毫秒对应的匹配对数目4,话单时间差30毫秒对应的匹配对数目5,话单时间差80毫秒对应的匹配对数目1。
需要说明的是,为了便于理解,本示例中以匹配对集合包括10个匹配对为例,实际的话单稽查中匹配对集合中的匹配对数目可能远远大于10。此外,本示例中话单时间差的大小以及波动范围,并不代表话单稽查过程中实际情况。
S163,根据多个话单时间差,确定与各话单时间差对应的候选时间窗口。
其中,候选时间窗口的起始时刻为零,候选时间窗口的时间跨度与对应的话单时间差相等。
在一个实施例中,若包括K个话单时间差,分别为Δt1,Δt2,……,ΔtK。则K个话单时间差分别对应K个候选时间窗口,分别为T1,T2,……,TK。其中,第i个话单时间差Δti对应的候选时间窗口的取值为[0,Δti],1≤i≤K。
作一个示例,继续参照上一示例,若话单时间差包括:15毫秒、30毫秒、80毫秒。则三个话单时间差对应的候选时间窗口分别为:[0,15毫秒],[0,30毫秒],[0,80毫秒]。
S164,针对任意一个候选时间窗口,将落入任意一个候选时间窗口内的所有话单时间差对应的匹配对数目之和,作为任意一个候选时间窗口的匹配对数目。
其中,针对某话单时间差对应的候选窗口,小于等于该话单时间差的各话单时间差对应的匹配对数目的和值,等于该候选时间窗口的匹配对数目4。
作一个示例,继续参照上一示例,针对候选时间窗口T1,T1=[0,15毫秒],其对应的匹配对数目为4。针对候选时间窗口T2,T2=[0,30毫秒],其对应的匹配对数目等于9。针对候选时间窗口T3,T3=[0,80毫秒],其对应的匹配对数目等于10。
S165,按照时间跨度从小到大的顺序对候选时间窗口排序,得到候选时间窗口序列。
示例性的,继续参照上一示例,时间窗口序列为:[0,15毫秒],[0,30毫秒],[0,80毫秒]。
S166,在候选时间窗口序列中,依次确定当前候选时间窗口的匹配度与后一候选时间窗口的匹配度的变化量,若变化量小于第一预设阈值,将当前候选时间窗口确定为最佳时间窗口。
其中,当前候选时间窗口的匹配度等于当前候选时间窗口的匹配对数目除以理论最大匹配数得到的商值。
作一个示例,针对当前候选时间窗口的匹配度,若当前候选时间窗口为Ti,则当前候选窗口对应的匹配度P(Ti)满足公式(1):
P(Ti)=S(Ti)/S (1)
其中,S(Ti)表示当前候选时间窗口的匹配对数目,S表示理论最大匹配数。
其中,理论最大匹配数S表征分别在第一话单集合中存在第一话单、以及在第二话单集合中存在第二话单的通话的总数。其中,理论最大匹配数S的取值可以是匹配对集合所含匹配对的总数。
作一个示例,针对当前候选时间窗口的匹配度与后一候选时间窗口的匹配度的变化量,为了便于说明,候选部分将该变化量简称为当前时间窗口的匹配度变化量。若当前候选时间窗口为Ti,当前候选窗口对应的匹配度为P(Ti),后一候选时间窗口的匹配度为P(Ti+1),若当前时间窗口的匹配度变化量gradP(Ti)=P(Ti+1)-P(Ti)。
其中,第一预设阈值为大于等于0且小于1的值。第一预设阈值可以根据具体工作场景和工作需求设定,对此不做限定。
需要说明的是,本发明实施例对海量话单数据分析后,得出规律:候选时间窗口序列中,各候选时间窗口的匹配度逐渐增大,各候选时间窗口的匹配度变化量逐渐递直至趋近于零。因此,第一预设阈值可以取近似于零的值。
通过步骤S161至S166,能够通过大量的话单时间差,学习一个能够表示话单时间差的合理取值范围的最佳时间窗口。利用最佳时间窗口来确定是否漏单,可以避免因时间窗口过大过小对漏单检测精度带来的影响,提高了漏单检测的精度。
需要说明的是,除了S161至S166所示的计算最佳时间窗口的方式之外,还可以是其他计算方式,例如,计算各话单时间差的概率分布,来确定最佳时间窗口等,对计算话单时间差的具体方式不作限定。
S170,根据匹配对对应的话单时间差是否大于最佳时间窗口,确定匹配对对应的特定通话是否漏单。
根据本发明实施例中的话单稽查方法,针对同一通话在不同交换机中产生话单的特定业务场景,在第一话单集合和第二话单集合中确定多个匹配对,并根据各匹配对中属于同一次特定通话的第一话单和第二话单的话单差,学习得到一个能够最佳时间窗口。由于最佳时间窗口能够表征话单时间差的合理范围取值,利用最佳时间窗口和各匹配对对应的话单时间差来判断特定通话是否漏单,能够保证话单稽查的准确性。
此外,本发明实施例仅通过通话相关方的身份标识信息、通话时长、通话起始时刻和通话结束时刻四个参数,即可实现话单稽查。能够减小系统的存储压力、计算压力,也能够提高处理效率和稽查速度。特别适用于对海量话单的处理。
在本发明的一些实施例中,S170具体包括S171和S172:
S171,若匹配对对应的话单时间差小于等于最佳时间窗口,确定匹配对对应的通话未漏单。
S172,若匹配对对应的话单时间差大于最佳时间窗口,确定匹配对对应的通话漏单。
其中,由于最佳时间差可以表示话单时间差的合理误差范围,针对任意匹配对,若该匹配对的话单时间差大于最佳时间窗口,则表明该匹配对的第一话单和第二话单不属于同一通话,即该通话发生了漏单现象。若该匹配对的话单时间差小于等于最佳时间窗口,则表明该匹配对的第一话单和第二话单属于同一通话,即该通话未漏单。
在一些实施例中,若判定匹配对对应的通话漏单,则向外发送用于指示该匹配对对应的通话漏单的告警消息,例如,可以向漏单处理平台、相关管理人员所持有的终端设备等发送该告警信息。此外,在发送告警信息后,可以利用其它方式再次判断该匹配对对应的通话是否漏单。例如,其它判别方式包括人工判别等,对此不做限定。
若再次判断结果为该匹配对对应的通话漏单,则可以将该匹配对的第一话单和第二话单添加入漏传话单数据集合中。若再次判断结果为该匹配对对应的通话未漏单,则确定该匹配对对应的通话未漏单,告警无效,解除警报。
其中,若判定匹配对对应的通话漏单,无论二次判断结果如何,均可以记录该匹配对的第一话单和第二话单。并将本核查周期内记录的第一话单和第二话单作为负样本,来辅助调整优化下一周期的话单稽查工作。
在本发明的一些实施例中,针对可能出现的局部最优的问题,存在着下述情况:若某一候选时间窗口的匹配度变化量小于第一预设阈值,但是该候选时间窗口之后的一个或多个候选时间窗口的匹配度变化量大于第一预设阈值。针对该情况,若将该候选时间窗口误选为最佳时间窗口,可能会存在着将部分通话误判为漏单的可能性。
相应地,S170之后,话单稽查方法100还包括:
S180,验证最佳时间窗口具备正确性。
其中,最佳时间窗口具备正确性表示,S170中选取的最佳时间窗口在候选时间窗口序列中最适合作为最佳时间窗口。优选地,时间跨度大于S170中选取的最佳时间窗口的候选时间窗口的匹配度变化量均小于等于第一预设阈值。
在一些实施例中,S180,具体包括:
针对时间跨度大于最佳时间窗口的候选时间窗口,确定参考候选时间窗口与该候选时间窗口的匹配对数目的变化量小于第二预设阈值,参考候选时间窗口的时间跨度等于该候选时间窗口的时间跨度与最佳时间窗口的时间跨度之和。在一个实施例中,第二预设阈值μ2为大于等于0且小于1的值。其中,第二预设阈值可以根据具体工作场景和工作需求设定,对此不做限定。
作一个示例,考虑到一定的误差容许范围,第二预设阈值可以是第一预设阈值μ1与误差容许系数δ的乘积。其中,误差容许系数δ大于等于1。
在一个实施例中,若最佳时间窗口为T0=[0,Δt0],且候选时间窗口序列中,时间跨度小于最佳时间窗口的候选时间窗口共有L个。则L个候选时间窗口的第j个候选时间窗口Tj=[0,Δtj]对应的参考候选时间窗口为
参考候选时间窗口的匹配度P(Tj+T0)与该候选时间窗口的匹配度P(Tj)的变化量为P(Tj+T0)-P(Tj)。
若P(Tj+T0)-P(Tj)<δ*μ1,则验证最佳时间窗口具备正确性。
在一个实施例中,参考候选时间窗口的匹配度,可以根据已有的候选时间窗口确定。示例性的,可以将候选窗口序列中,与参考时间窗口的时间跨度相差最小的候选时间窗口的匹配度。还可以由其他确定方式,本发明对此不做限定。
下面结合附图,详细介绍根据本发明实施例的装置。
基于相同的发明构思,本发明另一实施例提供的话单稽查装置。图2示出了根据本发明另一实施例提供的话单稽查装置的结构示意图。如图2所示,话单稽查装置200包括话单集合获取模块210、:
话单集合获取模块210,用于获取源自第一交换机的第一话单集合和源自第二交换机的第二话单集合,其中,针对目标用户的通话,第一交换机和第二交换机各自生成相应的话单。
话单集合处理模块220,用于生成第一话单集合中的第一话单和第二话单集合中的第二话单的匹配对集合,并计算匹配对集合的每一匹配对中的第一话单和第二话单的话单时间差,其中,每一匹配对中的第一话单和第二话单属于同一通话。
时间窗口确定模块230,用于基于分别与所有匹配对一一对应的多个话单时间差,确定最佳时间窗口。
漏单判断模块240,用于根据匹配对对应的话单时间差是否大于最佳时间窗口,确定匹配对对应的通话是否漏单。
根据本发明实施例中的话单稽查装置,针对同一通话在不同交换机中产生话单的特定业务场景,在第一话单集合和第二话单集合中确定多个匹配对,并根据各匹配对中属于同一次特定通话的第一话单和第二话单的话单差,学习得到一个能够最佳时间窗口。由于最佳时间窗口能够表征话单时间差的合理范围取值,利用最佳时间窗口和各匹配对对应的话单时间差来判断特定通话是否漏单,能够保证话单稽查的准确性。
在本发明的一些实施例中,话单稽查装置200还包括原始详情话单集合获取模块、第一数据清洗模块和第二数据清洗模块。
其中,原始详情话单集合获取模块,用于从第一交换机获取与第一话单集合对应的第一原始详情话单集合,从第二交换机获取与第二话单集合对应的第二原始详情话单集合;
第一数据清洗模块,用于对第一原始详情话单集合的每一第一原始详情话单进行数据清洗,得到该第一原始详情话单的关键通话指标参数,基于该第一原始详情话单的关键通话指标参数,构造与该第一原始详情话单对应的第一话单;
第二数据清洗模块,用于对第二原始详情话单集合的每一第二原始详情话单进行数据清洗,得到该第二原始详情话单的关键通话指标参数,基于该第二原始详情话单的关键通话指标参数,构造与该第二原始详情话单对应的第二话单;
其中,关键通话指标参数包括通话相关方的身份标识信息和/或通话时间,通话时间包括通话起始时刻和/或通话结束时刻。
在本发明的一些实施例中,话单集合处理模块220,具体用于:
将第一话单集合中对应同一通话相关方的第一话单,构造为一个第一话单子集合;
将第二话单集合中对应同一通话相关方的第二话单构造为一个第二话单子集合;
构造对应同一通话相关方的第一话单子集合和第二话单子集合的笛卡尔乘积;
针对每一个笛卡尔乘积,将该笛卡尔乘积的每个元素作为第一话单和第二话单的候选匹配对,并计算每个候选匹配对对应的话单时间差,将该笛卡尔乘积内相同通话时长的候选匹配对分为一组,并将每一组候选匹配对中话单时间差最小的候选匹配对添加入匹配对集合。
在本发明的一些实施例中,话单集合处理模块220,具体用于:
针对每一匹配对,获取第一话单记录的通话时间和第二话单记录的通话时间;
将第一话单记录的通话时间和第二话单记录的通话时间的差值,作为该匹配对对应的话单时间差;
其中,若通话时间包括通话起始时刻,话单时间差为第一话单记录的通话起始时刻与第二话单记录的通话起始时刻的差值,
若通话时间包括通话结束时刻,话单时间差为第一话单记录的通话结束时刻与第二话单记录的通话结束时刻的差值。
在本发明的一些实施例中,时间窗口确定模块230,具体包括:
时间差获取单元,用于获取与所有匹配对一一对应的多个话单时间差;
匹配对数目统计单元,用于统计每一话单时间差对应的匹配对数目;
候选时间窗口确定单元,用于根据多个话单时间差,确定与各话单时间差对应的候选时间窗口,其中,候选时间窗口的起始时刻为零,候选时间窗口的时间跨度与对应的话单时间差相等;
匹配对数目计算单元,用于针对任意一个候选时间窗口,将落入任意一个候选时间窗口内的所有话单时间差对应的匹配对数目之和,作为任意一个候选时间窗口的匹配对数目;
序列生成单元,用于按照时间跨度从小到大的顺序对候选时间窗口排序,得到候选时间窗口序列;
最佳时间窗口确定单元,用于在候选时间窗口序列中,依次确定当前候选时间窗口的匹配度与后一候选时间窗口的匹配度的变化量,若变化量小于第一预设阈值,将当前候选时间窗口确定为最佳时间窗口,
其中,当前候选时间窗口的匹配度等于当前候选时间窗口的匹配对数目除以理论最大匹配数得到的商值。
在一些实施例中,话单稽查装置200还包括:
最佳窗口验证模块,用于验证最佳时间窗口具备正确性;
其中,最佳窗口验证模块,具体用于:
针对时间跨度小于最佳时间窗口的候选时间窗口,确定对应的参考候选时间窗口的匹配度与该候选时间窗口的匹配度的变化量小于第二预设阈值,对应的参考候选时间窗口的时间跨度等于该候选时间窗口的时间跨度与最佳时间窗口的时间跨度之和。
在本发明的一些实施例中,漏单判断模块240,具体用于:
若匹配对对应的话单时间差小于等于最佳时间窗口,确定匹配对对应的通话未漏单;
若匹配对对应的话单时间差大于最佳时间窗口,确定匹配对对应的通话漏单。
在本发明的一些实施例中,目标用户包括:附着于2G网络或3G网络的Volte网络用户
在本发明的一些实施例中,第一话单集合和第二话单集合的其中一者为计费话单的集合,另一者为结算话单的集合。
根据本发明实施例的话单稽查装置的其他细节与以上结合图1描述的根据本发明实施例的话单稽查方法类似,在此不再赘述。
图3是本发明实施例中话单稽查设备的示例性硬件架构的结构图。
如图3所示,话单稽查设备300包括输入设备301、输入接口302、中央处理器303、存储器304、输出接口305、以及输出设备306。其中,输入接口302、中央处理器303、存储器304、以及输出接口305通过总线310相互连接,输入设备301和输出设备306分别通过输入接口302和输出接口305与总线310连接,进而与话单稽查设备300的其他组件连接。
具体地,输入设备301接收来自外部的输入信息,并通过输入接口302将输入信息传送到中央处理器303;中央处理器303基于存储器304中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器304中,然后通过输出接口305将输出信息传送到输出设备306;输出设备306将输出信息输出到话单稽查设备300的外部供用户使用。
也就是说,图3所示的话单稽查设备也可以被实现为包括:存储有计算机可执行指令的存储器;以及处理器,该处理器在执行计算机可执行指令时可以实现结合图1至图2描述的话单稽查设备的方法和装置。
在一个实施例中,图3所示的话单稽查设备300可以被实现为一种设备,该设备可以包括:存储器,用于存储程序;处理器,用于运行存储器中存储的程序,以执行本发明实施例的话单稽查方法。
本发明实施例还提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现本发明实施例的话单稽查方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
以上,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
Claims (12)
1.一种话单稽查方法,其特征在于,所述方法包括:
获取源自第一交换机的第一话单集合和源自第二交换机的第二话单集合,其中,针对目标用户的通话,所述第一交换机和所述第二交换机各自生成相应的话单;
生成第一话单集合中的第一话单和第二话单集合中的第二话单的匹配对集合,并计算所述匹配对集合的每一匹配对中的第一话单和第二话单的话单时间差,其中,每一匹配对中的第一话单和第二话单属于同一通话;
基于与所有所述匹配对对应的多个话单时间差,确定最佳时间窗口;
根据所述匹配对对应的话单时间差是否大于所述最佳时间窗口,确定所述匹配对对应的通话是否漏单;
所述生成第一话单集合中的第一话单和第二话单集合中的第二话单的匹配对集合,具体包括:
将所述第一话单集合中对应同一通话相关方的第一话单,划分为一个第一话单子集合;
将所述第二话单集合中对应同一通话相关方的第二话单,划分为一个第二话单子集合;
构造对应同一通话相关方的所述第一话单子集合和所述第二话单子集合的笛卡尔乘积;
针对每一个笛卡尔乘积,将该笛卡尔乘积的每个元素作为第一话单和第二话单的候选匹配对,并计算每个候选匹配对对应的话单时间差,将该笛卡尔乘积内相同通话时长的候选匹配对分为一组,并将每一组候选匹配对中话单时间差最小的候选匹配对添加入所述匹配对集合。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从所述第一交换机获取与所述第一话单集合对应的第一原始详情话单集合,从所述第二交换机获取与所述第二话单集合对应的第二原始详情话单集合;
对所述第一原始详情话单集合的每一第一原始详情话单进行数据清洗,得到该第一原始详情话单的关键通话指标参数,基于该第一原始详情话单的关键通话指标参数,构造与该第一原始详情话单对应的第一话单;
对所述第二原始详情话单集合的每一第二原始详情话单进行数据清洗,得到该第二原始详情话单的关键通话指标参数,基于该第二原始详情话单的关键通话指标参数,构造与该第二原始详情话单对应的第二话单;
其中,所述关键通话指标参数包括通话相关方的身份标识信息和/或通话时间,所述通话时间包括通话起始时刻和/或通话结束时刻。
3.根据权利要求1所述的方法,其特征在于,所述计算所述匹配对集合的每一匹配对中的第一话单和第二话单的话单时间差,具体包括:
针对所述每一匹配对,获取第一话单记录的通话时间和第二话单记录的通话时间;
将第一话单记录的通话时间和第二话单记录的通话时间的差值,作为该匹配对对应的话单时间差;
其中,若通话时间包括通话起始时刻,所述话单时间差为第一话单记录的通话起始时刻与第二话单记录的通话起始时刻的差值,
若通话时间包括通话结束时刻,所述话单时间差为第一话单记录的通话结束时刻与第二话单记录的通话结束时刻的差值。
4.根据权利要求1所述的方法,其特征在于,所述基于与所有所述匹配对对应的多个话单时间差,确定最佳时间窗口,具体包括:
获取与所有匹配对对应的多个话单时间差;
统计每一话单时间差对应的匹配对数目;
根据所述多个话单时间差,确定与各话单时间差对应的候选时间窗口,其中,所述候选时间窗口的起始时刻为零,所述候选时间窗口的时间跨度与对应的话单时间差相等;
针对任意一个候选时间窗口,将落入所述任意一个候选时间窗口内的所有话单时间差对应的匹配对数目之和,作为所述任意一个候选时间窗口的匹配对数目;
按照时间跨度从小到大的顺序对候选时间窗口排序,得到候选时间窗口序列;
在所述候选时间窗口序列中,依次确定当前候选时间窗口的匹配度与后一候选时间窗口的匹配度的变化量,若所述变化量小于第一预设阈值,将当前候选时间窗口确定为最佳时间窗口,
其中,所述当前候选时间窗口的匹配度等于所述当前候选时间窗口的匹配对数目除以理论最大匹配数得到的商值。
5.根据权利要求4所述的方法,其特征在于,所述若所述变化量小于预设阈值,将当前候选时间窗口确定为最佳时间窗口之后,所述方法还包括:
验证所述最佳时间窗口具备正确性;
其中,所述验证所述最佳时间窗口具备正确性,具体包括:
针对时间跨度小于所述最佳时间窗口的候选时间窗口,确定对应的参考候选时间窗口的匹配度与该候选时间窗口的匹配度的变化量小于第二预设阈值,所述对应的参考候选时间窗口的时间跨度等于该候选时间窗口的时间跨度与最佳时间窗口的时间跨度之和。
6.根据权利要求1所述的方法,其特征在于,所述根据所述匹配对对应的话单时间差是否大于所述最佳时间窗口,确定所述匹配对对应的通话是否漏单,具体包括:
若所述匹配对对应的话单时间差小于等于所述最佳时间窗口,确定所述匹配对对应的通话未漏单;
若所述匹配对对应的话单时间差大于所述最佳时间窗口,确定所述匹配对对应的通话漏单。
7.根据权利要求1所述的方法,其特征在于,所述目标用户包括:附着于2G网络或3G网络的Volte网络用户。
8.根据权利要求1所述的方法,其特征在于,所述第一话单集合和所述第二话单集合的其中一者为计费话单的集合,另一者为结算话单的集合。
9.一种话单稽查装置,其特征在于,所述装置包括:
话单集合获取模块,用于获取源自第一交换机的第一话单集合和源自第二交换机的第二话单集合,其中,针对目标用户的通话,所述第一交换机和所述第二交换机各自生成相应的话单;
话单集合处理模块,用于生成第一话单集合中的第一话单和第二话单集合中的第二话单的匹配对集合,并计算所述匹配对集合的每一匹配对中的第一话单和第二话单的话单时间差,其中,每一匹配对中的第一话单和第二话单属于同一通话;
时间窗口确定模块,用于基于与所有所述匹配对对应的多个话单时间差,确定最佳时间窗口;
漏单判断模块,用于根据所述匹配对对应的话单时间差是否大于所述最佳时间窗口,确定所述匹配对对应的通话是否漏单;
话单集合处理模块具体用于:
将所述第一话单集合中对应同一通话相关方的第一话单,划分为一个第一话单子集合;
将所述第二话单集合中对应同一通话相关方的第二话单,划分为一个第二话单子集合;
构造对应同一通话相关方的所述第一话单子集合和所述第二话单子集合的笛卡尔乘积;
针对每一个笛卡尔乘积,将该笛卡尔乘积的每个元素作为第一话单和第二话单的候选匹配对,并计算每个候选匹配对对应的话单时间差,将该笛卡尔乘积内相同通话时长的候选匹配对分为一组,并将每一组候选匹配对中话单时间差最小的候选匹配对添加入所述匹配对集合。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
原始详情话单集合获取模块,用于从所述第一交换机获取与所述第一话单集合对应的第一原始详情话单集合,从所述第二交换机获取与所述第二话单集合对应的第二原始详情话单集合;
第一数据清洗模块,用于对所述第一原始详情话单集合的每一第一原始详情话单进行数据清洗,得到该第一原始详情话单的关键通话指标参数,基于该第一原始详情话单的关键通话指标参数,构造与该第一原始详情话单对应的第一话单;
第二数据清洗模块,用于对第二原始详情话单集合的每一第二原始详情话单进行数据清洗,得到该第二原始详情话单的关键通话指标参数,基于该第二原始详情话单的关键通话指标参数,构造与该第二原始详情话单对应的第二话单;
其中,所述关键通话指标参数包括通话相关方的身份标识信息和/或通话时间,所述通话时间包括通话起始时刻和/或通话结束时刻。
11.一种话单稽查设备,其特征在于,所述设备包括:
存储器,用于存储程序;
处理器,用于运行所述存储器中存储的所述程序,以执行权利要求1-8任一权利要求所述的话单稽查方法。
12.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现权利要求1-8任一权利要求所述的话单稽查方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910811986.3A CN112449063B (zh) | 2019-08-30 | 2019-08-30 | 话单稽查方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910811986.3A CN112449063B (zh) | 2019-08-30 | 2019-08-30 | 话单稽查方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112449063A CN112449063A (zh) | 2021-03-05 |
CN112449063B true CN112449063B (zh) | 2022-05-13 |
Family
ID=74740831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910811986.3A Active CN112449063B (zh) | 2019-08-30 | 2019-08-30 | 话单稽查方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112449063B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103167202A (zh) * | 2011-12-19 | 2013-06-19 | 中国移动通信集团甘肃有限公司 | 一种不同源话单稽核方法和装置 |
CN109714494A (zh) * | 2019-01-03 | 2019-05-03 | 中国联合网络通信集团有限公司 | 话单生成方法及系统、话单生成服务器 |
-
2019
- 2019-08-30 CN CN201910811986.3A patent/CN112449063B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103167202A (zh) * | 2011-12-19 | 2013-06-19 | 中国移动通信集团甘肃有限公司 | 一种不同源话单稽核方法和装置 |
CN109714494A (zh) * | 2019-01-03 | 2019-05-03 | 中国联合网络通信集团有限公司 | 话单生成方法及系统、话单生成服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN112449063A (zh) | 2021-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109640312B (zh) | “黑卡”识别方法、电子设备及计算机可读取存储介质 | |
CN106682906B (zh) | 一种风险识别、业务处理方法和设备 | |
CN110457175B (zh) | 业务数据处理方法、装置、电子设备及介质 | |
CN108764951A (zh) | 用户相似度获得方法和装置、设备、存储介质 | |
CN112214577A (zh) | 目标用户的确定方法、装置、设备及计算机存储介质 | |
CN110969240A (zh) | 一种深度卷积神经网络的剪枝方法、装置、设备及介质 | |
US8413234B1 (en) | Communications-service fraud detection using special social connection | |
CN114155880A (zh) | 一种基于gbdt算法模型的非法语音识别方法及系统 | |
CN109951838B (zh) | 识别双卡槽双卡用户的方法、装置、设备及介质 | |
CN112449063B (zh) | 话单稽查方法、装置、设备和介质 | |
CN111371633A (zh) | 物联网卡使用异常的检测方法、装置、设备和介质 | |
CN115412868A (zh) | 用户话单计费方法、设备及介质、计费系统、账务系统 | |
CN110972091B (zh) | 通信计费方法、装置、设备、介质和终端 | |
CN114970495A (zh) | 人名消歧方法、装置、电子设备及存储介质 | |
CN114944950B (zh) | 实名认证方法以及装置 | |
CN115905145A (zh) | 文件处理方法、装置、设备及计算机存储介质 | |
CN111930808B (zh) | 一种利用键值匹配模型提高黑名单准确率的方法及系统 | |
CN110458707B (zh) | 基于分类模型的行为评估方法、装置及终端设备 | |
CN112839335A (zh) | 号码识别方法、装置、设备及介质 | |
CN109981540B (zh) | 防火墙数据优化方法、装置、计算机设备及可读存储介质 | |
CN113780407B (zh) | 一种数据检测方法、装置、电子设备及存储介质 | |
CN114866433B (zh) | 用户业务感知评估方法、装置、设备及计算机存储介质 | |
CN115994172B (zh) | 一种业务访问关系确定的方法、装置、设备及介质 | |
CN111949835B (zh) | 一种数据处理方法及装置 | |
CN112887491B (zh) | 用户缺失信息获取方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |