CN113225218A - 一种话单质量的核查方法和装置 - Google Patents
一种话单质量的核查方法和装置 Download PDFInfo
- Publication number
- CN113225218A CN113225218A CN202010081348.3A CN202010081348A CN113225218A CN 113225218 A CN113225218 A CN 113225218A CN 202010081348 A CN202010081348 A CN 202010081348A CN 113225218 A CN113225218 A CN 113225218A
- Authority
- CN
- China
- Prior art keywords
- fields
- call
- ticket
- call ticket
- dependency relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000003860 storage Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 16
- 230000004044 response Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 9
- 230000001419 dependent effect Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/02—Capturing of monitoring data
- H04L43/028—Capturing of monitoring data by filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M15/00—Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
- H04M15/41—Billing record details, i.e. parameters, identifiers, structure of call data record [CDR]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M15/00—Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
- H04M15/44—Augmented, consolidated or itemized billing statement or bill presentation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开一种话单质量的核查方法及装置,所述方法包括:获取根据业务数据生成的话单,所述话单中包含至少一个字段;对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种话单质量的核查方法和装置。
背景技术
通信网络中,可以根据通信业务数据生成话单,话单可以是指针对通信业务数据而记录的信息,也可以称为详单。比如,可以采集终端通话业务的数据、或数据传输业务的数据,从而生成对应的话单。由于话单中包含了多种表示业务数据的字段,所以是对业务进行各项指标分析的基础,比如可以根据话单中的字段,分析业务高峰时段的服务能力、容错能力等。
由于话单是分析业务能力的基础,所以话单的质量便会直接影响到对业务能力进行分析的准确性。是实际中,话单通常是根据采集终端的业务数据而生成的,所以可能出于不同原因存在不同的质量问题,比如不完整、不准确、不合规等。所以,对话单质量进行较为准确地核查,就成为提高话单质量的重要手段,另外也可以提升对业务能力进行分析的准确性。
发明内容
本发明实施例提供一种话单质量的核查方法和装置,用于较为准确地对话单质量进行核查。
为解决上述技术问题,本发明实施例是这样实现的:
本发明实施例采用下述技术方案:
一种话单质量的核查方法,包括:
获取根据业务数据生成的话单,所述话单中包含至少一个字段;
对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
一种话单质量的核查的装置,包括:获取单元、确定单元、以及核查单元,其中,
所述获取单元,用于获取根据业务数据生成的话单,所述话单中包含至少一个字段;
所述确定单元,用于对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
所述核查单元,用于根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取根据业务数据生成的话单,所述话单中包含至少一个字段;
对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取根据业务数据生成的话单,所述话单中包含至少一个字段;
对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
由以上实施例提供的技术方案可见,在获取到根据业务数据生成的话单后,可以对话单中的字段进行特征提取,并结合预先为话单建立的字段间的依赖关系,为不同的字段分别确定出对应的合理填充条件,从而可以据此分别对话单中的不同字段进行质量核查。
也即,在获取到话单后,根据话单中字段的特征,以及字段间的依赖关系,为不同字段分别确定出对应的合理填充条件,从而可以根据该条件,对话单中的字段进行质量核查。由于可以根据话单中字段自身的特征,确定核查标准,再对话单进行核查,从而可以较为准确地对话单质量进行核查。
附图说明
为了更清楚地说明本发明实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的话单质量的核查方法的流程示意图;
图2为本发明实施例提供的话单质量的核查方法的示意图;
图3为本发明实施例提供的话单质量的核查装置的结构示意图;
图4为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下结合附图,详细说明本发明中各实施例提供的技术方案。
实施例1
本实施例提供一种话单质量的核查方法,可以对话单的质量较为准确地进行核查。假设本方法的执行主体可以为服务端,则本方法的具体流程示意图如图1所示,包括:
步骤102:获取根据业务数据生成的话单。
在前文已经介绍,通信网络中,可以根据通信业务的数据生成不同的话单,比如,用户在结束通话业务后,可以产生主叫号码、被叫号码、通话时长、位置信息、基站标识等数据,用户在进行数据传输时,可以产生上行流量、下行流量、传输起止时间、请求时间、响应时间、传输协议、地址等数据。从而可以据此生成不同的话单。
具体可以基于DPI(Deep Packet Inspection,深度报文检测)采集业务数据并生成话单,而在生成话单时,则可以根据业务需求生成XDR格式的话单,这里XDR(ExternalData Representation,外部数据表示法)可以是一种标准数据序列化格式。需要说明的是,基于DPI采集并生成XDR话单可以是在特定的业务环境中,而在不同的业务环境中,还可以通过其他的采集方式,生成其他格式的话单,这里仅用于举例,不做限定。
由于业务中可以包含一种或多种业务数据,所以在生成话单后,话单中也可以包含至少一个字段。比如,针对数据传输的话单,其中可以包含上行流量、下行流量、传输起止时间、请求时间、响应时间、传输协议、地址等字段,每个字段中可以对应有不同的数据值。
在实际应用中,不同的业务类型可能对应包含不同字段的话单,例如通话业务和数据传输业务就由于不同的业务数据,导致生成的话单具有不同的字段。又如,针对数据传输业务而言,其中也可以根据不同的传输协议,被划分为不同的业务类型。所以在一种实施方式中,为了能够更加准确地对不同业务类型的话单进行质量核查,本步骤中,获取根据业务数据生成的话单,可以包括:获取根据业务数据生成的、特定业务类型话单。
具体地,比如可以获取通话业务类型的话单,或数据传输中某个特定传输协议的话单等。而获取的方式,可以是以不同业务类型对应的特定字段为依据,正如前文举例,数据传输业务的话单中可以有传输协议字段,所以可以根据某个传输协议,获取到这个传输协议的全部话单。
在实际应用中,由于通信资源是相对固定的,所以就可能由于终端的活跃情况导致出现高峰时段和低峰时段,而高峰时段和低峰时段的差异,则会体现在话单的某些字段上,比如流量和传输起止时间、请求时间、响应时间等,在高峰时段和低峰时段均会有较大差别,若将低峰时段的话单中的字段作为标准,来判断高峰时段的话单中的字段,则就会存在较大的误判的可能。所以为了能够降低误判的可能性,较为准确地对不同业务类型的话单进行质量核查,本步骤便可以根据预定的时间周期,获取根据业务数据生成的、特定业务类型话单。
具体地,可以将24小时根据实际统计出的高峰低峰时段,划分为多个时间周期。比如针对数据传输业务而言,可以将0点至6点、6点到9点、9点至17点、17点至24点划分为4个时间周期,在每个时间周期开始时,均可以获取上一个时间周期内,根据业务数据生成的、数据传输业务话单。而对于通话业务、或其他业务,也可以划分不同的时间周期。
步骤104:对获取到的话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件。
在前文已经介绍,话单中可以包含至少一个字段,而每个字段均可以有各自的特征。比如,不同字段可以对应有不同的数据格式,具体比如,针对数据传输业务而言,上行、下行流量可以通过数值进行表示、传输协议可以通过字符进行表示、而地址则可以通过IP(Internet Protocol,网际互连协议)地址或域名(Domain Name,又称网域)地址进行表示;又如,不同字段即使有相同的数据格式,也可以有不同的数据值范围,具体比如,上行、下行流量和请求、响应时间,虽然均可以通过数值(流量值和时间戳)进行表示,但由于数值单位、以及表达的意义不同,也会导致数值的范围差异较大,例如上行流量和下行流量可以是较大数值,比如100M、300M等,而响应时间是位数固定的数值。可见,不同的字段均可以有自身的特征。
在实际应用中,一些字段之间可能存在一定的依赖关系,比如,请求、响应时间与上行、下行流量,应用类型与传输协议等,可以理解地,在依赖关系中,若其中一个产生了业务数据,则另一个也可以产生业务数据,相应地,若其中一个未产生业务数据,则另一个也可以不产生业务数据。
所以在一种实施方式中,可以预先建立话单中字段之间的依赖关系,具体地,可以先获取到根据业务数据而生成的话单,利用特定的数据依赖算法、以及基于机器学习、深度神经网络等方式,挖掘话单中字段与字段之间的依赖关系,并建立依赖关系映射表。
这里,可以通过监督学习的方式,预先由工程人员创建一些具有依赖关系与无依赖关系的样本,通过机器学习的方式,建立话单中字段之间的依赖关系,从而通过人工参与机器学习结合的方式,建立字段间的依赖关系映射表。在实际中,也可以通过无监督学习的方式,挖掘字段之间的依赖关系。
可以理解地,由于不同字段均有自身的特征,那么根据话单中不同字段自身的特征,便可以挖掘出字段的数据值在何种填充方式下是较为合理的、何种填充方式下是不合理的。这里的合理可以至少包括完整性、合规性、以及准确性。
针对完整性而言,利用存在依赖关系的两个字段,通常可以在一定程度上检核数据的完整性,正如前文举例,请求、响应时间与上行、下行流量,若出现了下行流量,那么响应时间也应该具有一个数值,若响应时间为空,那么可能出现了数据完整性的问题。
针对合规性而言,由于不同字段具有不同的数据格式的特征,所以也可以据此核查不同字段,填充了哪种类型可以满足合规性,哪种类型无法满足。比如针对话单中的传输时长,应填充一个时间段,比如60s,1000s等,若填充了字符、或文本则可以确定出现了数据错误,又如地址应填充为IP地址、或域名地址,若填充了数值则可以确定出现了数据错误。
针对准确性而言,由于真实的地理、时间、或一些业务性能限制,可以在一定程度上表明,字段对应的值是否出现了偏差。比如,针对地址而言,若业务范围是国内,但填充的IP指向了国外,那么则说明出现了准确性问题。
可见,根据字段间的依赖关系,以及字段各自的特征,可以得到不同字段的合理填充条件,所以本步骤便可以对获取到的话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件。
具体地,可以通过分别统计多个话单中的不同字段的数据项,得到每个字段对应的合理填充,比如针对下行流量,可以通过数值统计的方式,确定出相应的合理范围,在核查阶段,若超出这一范围,则可以确定出现了准确性的问题;又如,根据依赖关系,统计当某个字段产生\或不产生业务数据时,另一依赖字段产生\或不产生业务数据的概率,或当某个字段为0时,另一个依赖字段为0的概率,等。
在实际应用中,通常可以根据话单中的字段测算出用于监督业务性能的各种指标,比如根据上行流量和下行流量,并结合传输时间,则可以测算上行速率和下行速率,从而可以用于评价网络服务能力,这里的指标可以是生成话单时采集到的,也可以是根据话单测算出的,比如DPI采集机在采集原始的业务数据时,可以测算一些指标,从而生成话单,但有可能在生成话单时出现了错误,所以也就可能导致测算出的指标是合理的,但测算指标的字段是错误的
在前文已经介绍,字段时间存在依赖关系,可以理解地,字段与指标之间也可以存在依赖关系,比如若存在上行流量,则也可以有上行速率,反之亦然。所以,也可以结合字段与指标之间的依赖关系,对字段的完整性、合理性、以及准确性进行核查。
具体地,根据指标与字段之间的依赖关系,可以确定字段是否完整,比如若存在下行速率,那么生成的话单中下行流量与传输时长、以及请求、响应时间均会有对应的值。在前文已经介绍,在高峰和低峰时段,数据传输业务的能力差别较大,比如在高峰时段,下行速率与上行速率普遍偏低,而低峰时段则普遍偏高,所以也可以对多个话单进行指标计算与统计,得到下行、上行速率的范围,从而可以对字段的准确性进行判断。
所以,在一种实施方式中,本步骤也可以包括:对获取到的话单中的字段进行特征提取,并结合预先建立的话单字段间、以及字段与指标间依赖关系,为不同字段分别确定对应的合理填充条件,这里的指标便可以是根据字段确定出的指标。
类似地,指标与指标之间也有可能存在依赖关系,比如,针对网页的响应延迟,与针对网页的传输协议可以同时出现,等。所以,在一种实施方式中,本步骤也可以包括:对获取到的话单中的字段进行特征提取,并结合预先建立的话单字段间、字段与指标间、以及指标与指标间的依赖关系,为不同字段分别确定对应的合理填充条件,这里的指标也可以是根据字段确定出的指标。由于一些指标可以反映业务能力,比如若高峰实现,下行速率是较低的,若出现非常高的,则很大可能是由于字段上下行流量数据准确性问题而导致,所以结合字段与指标、指标间的依赖关系,便可以更加准确地对字段进行质量核查。
在前述步骤已经介绍,不同的业务类型的话单,通常包含有不同的字段,所以当前述步骤获取根据业务数据生成的、特定业务类型话单时,本步骤就可以包括:对获取到的话单中的字段进行特征提取,并结合为该特定业务类型预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件。
具体地,通过为特定业务类型与预先建立话单字段间依赖关系,并为不同字段确定对应的合理填充条件,则可以较为准确地对特定类型的话单进行核查,从而可以满足针对不同业务类型话单的质量核查需求。
在实际应用中,话单中可能有很多维度的字段,然而出于不同的原因,话单中的字段可能存在冗余的情况,比如针对某个游戏类应用而言,可能用户打开后,并没有任何游戏操作,所以可能导致特定的传输协议下没有数据流量,那么与该特定传输协议具有依赖关系的字段均可以是冗余数据;又如,当某个或某几个字段出现特定的组合时,可以导致一些字段无参考意义,故也可以作为冗余数据,具体比如当响应延迟过大时,可能是由于网络信号干扰问题导致,所以可以预先设定一些冗余字段的对应关系,以便可以对话单进行数据清洗。
在识别冗余字段时,也可以预先结合神经网络,将正负样本、以及预先建立的字段间依赖关系进行输入,从而对神经网络进行训练,使训练后的神经网络可以识别出话单中的冗余字段。所以在一种实施方式中,为了能够对话单中的冗余字段进行精简,本步骤可以包括:根据预先建立的话单字段间依赖关系,对话单中的冗余字段进行过滤,生成精简后的话单;对该精简后的话单中的字段进行特征提取,并结合话单字段间依赖关系,为不同字段分别确定对应的合理条件。
具体地,在获取到根据业务数据生成的话单后,可以先利用训练后的神经网络,识别话单中的冗余字段,并对冗余字段进行过滤,从而生成精简后的话单。比如,可以将话单中的无效字段、全是0字段的话单、依赖字段为空的字段、依赖字段为0值的字段、或是计算指标中不涉及到的字段等一种或多种,作为冗余字段进行去除。据此则可以根据类似于前文的描述,对精简后的话单中的字段进行特征提取,并结合话单字段间依赖关系,为不同字段分别确定对应的合理填充条件。这里,可以将这些步骤称为数据清洗。
而在实际应用中,也可以结合业务类型,则可以对精简后的话单中的字段进行特征提取,并结合为该特定业务类型建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件。
这里的合理填充条件可以包括多种形式,比如可以是根据依赖字段的数据值,确定目标字段的数据值,也可以是根据统计获取到的多个话单而生成的数值范围,还可以是数据格式,比如XXX.XXX.XXX.XXX这类的IP地址,或XXX.XXX.XX这类的域名地址,等。
步骤106:根据确定出的合理填充条件,分别对话单中的字段进行质量核查。
在前述步骤中已经分别确定出了针对不同字段的合理填充条件,那么在本步骤便可以利用这个合理填充条件,分别对话单中的字段进行质量核查。而具体的核查目的,则可以是前文介绍的,至少包括核查话单的完整性、合规性、以及准确性等。
比如,针对话单的空数据核查可以是指当话单中的字段为空时,是否出现完整性问题,据此则可以根据依赖字段的值,进行核查;又如,还可以针对话单进行0值核查、合规核查、超限核查等。这里,0值核查,可以是字段本身为0时,依赖字段有数据且非0、且根据依赖字段非0、推断该字段本身是否为非0;合规核查,可以是字段本身有数值,但数值格式是否错误或带有非法字符;超限核查,可以是字段本身有数值,且数值格式正确不包含非法字符,或数值本身格式正确但偏离该字段合理取值范围。
根据前文介绍,为了能够过滤冗余字段,提高核查话单的准确性,可以对原始话单进行冗余字段过滤,生成精简后的话单,那么本步骤,便可以根据确定出的合理条件,分别对精简后的话单中的字段进行质量核查。
在实际应用中,为了能够将话单进行备案,通常可以将话单进行压缩存储,而为了达到对真实的话单进行存储,且节约存储空间的目的,本步骤还可以包括:对话单中过滤掉的冗余字段执行置空值处理,生成置空后的话单;对置空后的话单进行压缩存储。
具体地,虽然在前文将冗余字段进行了过滤,然而在实际应用中,真实的话单需要完整的维度,所以为了还原真实的话单中的字段,则可以将过滤掉的冗余字段执行置空值处理。比如可以将前文举例的话单中的无效字段、全是0字段的话单、依赖字段为空的字段、依赖字段为0值的字段、或是计算指标中不涉及到的字段等一种或多种,进行置空值,生成置空后的话单,从而可以对置空后的话单进行压缩存储,由于将冗余字段置空值后进行压缩存储,从而可以将真实的话单进行存储,还达到了节约存储资源的目的。
在实际应用中,对话单中的字段进行质量核查的步骤,与对话单进行压缩存储的步骤,无需明确的先后顺序,均可以在先,也可以同时执行。
在实际应用中,还可以根据话单进行指标测算,在进行指标测算时,可以根据原始的话单进行指标测算,也可以根据精简后的话单进行指标测算,还可以根据置空后的话单进行指标测算等,以满足对业务能力的评估需求。
如图2所示,为本方法提供的话单质量的核查方法的示意图,如图所示,可以先获取原始的话单集合,集合中可以包括多个话单,而话单中可以包含多个字段。根据字段间依赖关系,可以将话单中的冗余字段进行去除,从而生成精简后的话单集合。此后,可以对精简后的话单进行特征提取,并结合字段间依赖关系,为不同字段确定出对应的合理填充条件,据此则可以根据合理填充条件,对话单中的字段进行核查,具体则可以核查话单中字段的完整性、合规性、以及准确性。另外,对于精简后的话单集合,还可以通过对话单中的冗余字段置空值的方式,对话单进行压缩存储。
由以上实施例提供的方法可见,在获取到根据业务数据生成的话单后,可以对话单中的字段进行特征提取,并结合预先为话单建立的字段间的依赖关系,为不同的字段分别确定出对应的合理填充条件,从而可以据此分别对话单中的不同字段进行质量核查。
也即,在获取到话单后,根据话单中字段的特征,以及字段间的依赖关系,为不同字段分别确定出对应的合理填充条件,从而可以根据该条件,对话单中的字段进行质量核查。由于可以根据话单自身的特征,确定核查标准,再对话单进行核查,从而可以较为准确地对话单质量进行核查。
实施例2
基于相同的构思,本发明实施例2还提供一种话单质量的核查装置,可以对话单的质量较为准确地进行核查。假设本方法的执行主体可以为服务端。该装置的结构示意图如图3所示,包括:获取单元202、确定单元204、以及核查单元206,其中,
获取单元202,可以用于获取根据业务数据生成的话单,该话单中可以包含至少一个字段;
确定单元204,可以用于对话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
核查单元206,可以用于根据合理填充条件,分别对话单中的字段进行质量核查。
在一种实施方式中,获取单元202,可以用于:
获取根据业务数据生成的、特定业务类型话单;则
确定单元204,可以用于:
对话单中的字段进行特征提取,并结合为特定业务类型预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理条件。
在一种实施方式中,确定单元204,可以用于:
根据预先建立的话单字段间依赖关系,对话单中的冗余字段进行过滤,生成精简后的话单;
对精简后的话单中的字段进行特征提取,并结合话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;则
核查单元206,可以用于:
根据合理条件分别对精简后的话单中的字段进行质量核查。
在一种实施方式中,该装置还包括存储单元,可以用于:
对话单中过滤掉的冗余字段执行置空值处理,生成置空后的话单;
对置空后的话单进行压缩存储。
由以上实施例提供的装置可见,在获取到根据业务数据生成的话单后,可以对话单中的字段进行特征提取,并结合预先为话单建立的字段间的依赖关系,为不同的字段分别确定出对应的合理填充条件,从而可以据此分别对话单中的不同字段进行质量核查。
也即,在获取到话单后,根据话单中字段的特征,以及字段间的依赖关系,为不同字段分别确定出对应的合理填充条件,从而可以根据该条件,对话单中的字段进行质量核查。由于可以根据话单自身的特征,确定核查标准,再对话单进行核查,从而可以较为准确地对话单质量进行核查。
图4是本发明的一个实施例电子设备的结构示意图。在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成话单质量的核查执行装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取根据业务数据生成的话单,所述话单中包含至少一个字段;
对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
上述如本发明图3所示实施例提供的话单质量的核查装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图3所示实施例中话单质量的核查装置执行的方法,并具体用于执行:
获取根据业务数据生成的话单,所述话单中包含至少一个字段;
对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上系统时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品,该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (10)
1.一种话单质量的核查方法,其特征在于,包括:
获取根据业务数据生成的话单,所述话单中包含至少一个字段;
对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
2.如权利要求1所述的方法,其特征在于,获取根据业务数据生成的话单,包括:
获取根据业务数据生成的、特定业务类型话单;则
对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件,包括:
对所述话单中的字段进行特征提取,并结合为所述特定业务类型预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理条件。
3.如权利要求1所述的方法,其特征在于,对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件,包括:
根据预先建立的话单字段间依赖关系,对所述话单中的冗余字段进行过滤,生成精简后的话单;
对所述精简后的话单中的字段进行特征提取,并结合所述话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;则
根据所述合理条件分别对所述话单中的字段进行质量核查,包括:
根据所述合理条件分别对所述精简后的话单中的字段进行质量核查。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
对话单中过滤掉的冗余字段执行置空值处理,生成置空后的话单;
对所述置空后的话单进行压缩存储。
5.一种话单质量的核查装置,其特征在于,包括:获取单元、确定单元、以及核查单元,其中,
所述获取单元,用于获取根据业务数据生成的话单,所述话单中包含至少一个字段;
所述确定单元,用于对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
所述核查单元,用于根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
6.如权利要求5所述的装置,其特征在于,获取单元,用于:
获取根据业务数据生成的、特定业务类型话单;则
所述确定单元,用于:
对所述话单中的字段进行特征提取,并结合为所述特定业务类型预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理条件。
7.如权利要求5所述的装置,其特征在于,所述确定单元,用于:
根据预先建立的话单字段间依赖关系,对所述话单中的冗余字段进行过滤,生成精简后的话单;
对所述精简后的话单中的字段进行特征提取,并结合所述话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;则
所述核查单元,用于:
根据所述合理条件分别对所述精简后的话单中的字段进行质量核查。
8.如权利要求7所述的装置,其特征在于,所述装置还包括存储单元,用于:
对话单中过滤掉的冗余字段执行置空值处理,生成置空后的话单;
对所述置空后的话单进行压缩存储。
9.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取根据业务数据生成的话单,所述话单中包含至少一个字段;
对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
10.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取根据业务数据生成的话单,所述话单中包含至少一个字段;
对所述话单中的字段进行特征提取,并结合预先建立的话单字段间依赖关系,为不同字段分别确定对应的合理填充条件;
根据所述合理填充条件,分别对所述话单中的字段进行质量核查。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010081348.3A CN113225218A (zh) | 2020-02-06 | 2020-02-06 | 一种话单质量的核查方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010081348.3A CN113225218A (zh) | 2020-02-06 | 2020-02-06 | 一种话单质量的核查方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113225218A true CN113225218A (zh) | 2021-08-06 |
Family
ID=77085559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010081348.3A Pending CN113225218A (zh) | 2020-02-06 | 2020-02-06 | 一种话单质量的核查方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113225218A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115344565A (zh) * | 2022-08-19 | 2022-11-15 | 中国建设银行股份有限公司 | 流量数据质量检核方法、装置、电子设备及存储介质 |
CN116132204A (zh) * | 2021-11-09 | 2023-05-16 | 中国联合网络通信集团有限公司 | 数据处理方法、装置、电子设备和可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030108030A1 (en) * | 2003-01-21 | 2003-06-12 | Henry Gao | System, method, and data structure for multimedia communications |
CN105050068A (zh) * | 2015-06-16 | 2015-11-11 | 岳锐 | 一种计费话单记录检测校正方法、装置及话单处理系统 |
CN109005556A (zh) * | 2018-07-24 | 2018-12-14 | 武汉虹信技术服务有限责任公司 | 一种基于用户话单的4g网络质量优化方法与系统 |
CN110337059A (zh) * | 2018-03-30 | 2019-10-15 | 中国联合网络通信集团有限公司 | 一种用户家庭关系的分析算法、服务器及网络系统 |
-
2020
- 2020-02-06 CN CN202010081348.3A patent/CN113225218A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030108030A1 (en) * | 2003-01-21 | 2003-06-12 | Henry Gao | System, method, and data structure for multimedia communications |
CN105050068A (zh) * | 2015-06-16 | 2015-11-11 | 岳锐 | 一种计费话单记录检测校正方法、装置及话单处理系统 |
CN110337059A (zh) * | 2018-03-30 | 2019-10-15 | 中国联合网络通信集团有限公司 | 一种用户家庭关系的分析算法、服务器及网络系统 |
CN109005556A (zh) * | 2018-07-24 | 2018-12-14 | 武汉虹信技术服务有限责任公司 | 一种基于用户话单的4g网络质量优化方法与系统 |
Non-Patent Citations (1)
Title |
---|
李宝磊等: "TD-LTE信令数据准确性核查方法", 《电信工程技术与标准化》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116132204A (zh) * | 2021-11-09 | 2023-05-16 | 中国联合网络通信集团有限公司 | 数据处理方法、装置、电子设备和可读存储介质 |
CN116132204B (zh) * | 2021-11-09 | 2024-04-09 | 中国联合网络通信集团有限公司 | 数据处理方法、装置、电子设备和可读存储介质 |
CN115344565A (zh) * | 2022-08-19 | 2022-11-15 | 中国建设银行股份有限公司 | 流量数据质量检核方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106656536B (zh) | 一种用于处理服务调用信息的方法与设备 | |
CN109309596B (zh) | 一种压力测试方法、装置及服务器 | |
CN113190423B (zh) | 业务数据的监控方法、装置及系统 | |
CN109327353B (zh) | 业务流量确定方法、装置及电子设备 | |
CN112307057A (zh) | 数据的处理方法及装置、电子设备、计算机存储介质 | |
CN110706376B (zh) | 一种人流量统计方法和装置 | |
CN106445938B (zh) | 一种数据检测方法及装置 | |
CN109271453B (zh) | 一种数据库容量的确定方法和装置 | |
CN110046086B (zh) | 用于测试的期望数据生成方法及装置和电子设备 | |
CN113225218A (zh) | 一种话单质量的核查方法和装置 | |
CN112052078A (zh) | 一种耗时的确定方法和装置 | |
CN112241362A (zh) | 一种测试方法、装置、服务器及存储介质 | |
CN113596078A (zh) | 业务问题定位方法及装置 | |
CN114328122A (zh) | 一种io全生命周期时延监测方法及相关装置 | |
CN110503297B (zh) | 业务场景获取方法、装置、电子设备及介质 | |
CN110888811B (zh) | 代码覆盖率信息处理方法、装置、电子设备及介质 | |
CN112948262A (zh) | 一种系统测试方法、装置、计算机设备和存储介质 | |
CN111984519A (zh) | 一种用于业务系统的测试方法及其装置 | |
CN111324583B (zh) | 一种业务日志的分类方法及装置 | |
CN111309576A (zh) | 一种压力测试方法和装置 | |
CN110213123A (zh) | 一种流量监控方法、装置及设备 | |
CN115827374A (zh) | 应用日志的管理方法、装置、电子设备及可读存储介质 | |
CN110955760A (zh) | 判决结果的评价方法和相关装置 | |
CN113657635B (zh) | 一种预测通信用户流失的方法及电子设备 | |
CN113360553B (zh) | 一种数据冷热程度评估方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210806 |
|
RJ01 | Rejection of invention patent application after publication |