CN110717063A - 对ip电话录音文件进行校验与选择存档的方法、系统 - Google Patents

对ip电话录音文件进行校验与选择存档的方法、系统 Download PDF

Info

Publication number
CN110717063A
CN110717063A CN201910995212.0A CN201910995212A CN110717063A CN 110717063 A CN110717063 A CN 110717063A CN 201910995212 A CN201910995212 A CN 201910995212A CN 110717063 A CN110717063 A CN 110717063A
Authority
CN
China
Prior art keywords
data
recording
cdr
analysis result
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910995212.0A
Other languages
English (en)
Other versions
CN110717063B (zh
Inventor
沈禹
羌智锋
雷均
胡建军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eccom Network System Co Ltd
Original Assignee
Eccom Network System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eccom Network System Co Ltd filed Critical Eccom Network System Co Ltd
Priority to CN201910995212.0A priority Critical patent/CN110717063B/zh
Publication of CN110717063A publication Critical patent/CN110717063A/zh
Application granted granted Critical
Publication of CN110717063B publication Critical patent/CN110717063B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/61Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种对IP电话录音文件进行校验与选择存档的方法、系统,包括:CDR数据采集步骤:从IP PBX采集CDR数据;CDR数据分析步骤:分析采集的CDR数据,得到CDR数据分析结果;录音数据采集步骤:从录音系统采集录音数据;录音数据分析步骤:分析录音数据,得到录音数据分析结果;分析结果处理步骤:根据号码转换规则,对CDR数据分析结果和录音数据分析结果进行标准化处理。本发明可以快速发现录音系统可能存在的问题,减少因录音数据损坏或丢失造成的损失,解决不同录音系统间数据无法关联,难以对照查询的问题,可有效提升多套录音系统共同使用的便捷性和有效性。

Description

对IP电话录音文件进行校验与选择存档的方法、系统
技术领域
本发明涉及通信领域,具体地,涉及一种对IP电话录音文件进行校验与选择存档的方法、系统。尤其为一种用于IP电话系统录音文件有效性校验以及对多份不同来源录音文件比较、选择并存档的方法。
背景技术
当前,在企业通信、呼叫中心等业务领域,基于电路交换的传统电话系统已经逐步被淘汰,更加灵活、易于扩展、便于集成和部署的IP电话系统成为主流。电话录音是电话系统的一项主要应用功能之一。对于IP电话系统,有三种主流的录音方式,如下:
话机录音。这种方式下,录音动作由IP话机自身完成,通过在IP话机中内置的录音模块实现录音功能。这种方式的优点在于1—部署灵活性高,对网络环境完全没有要求;2—没有中心故障点,个别的设备故障不会造成整体性的录音数据损失。这种方式的限制在于1—要求专用话机设备,终端成本较高;2—话机本地容量有限,难以支持长时间大量的录音数据;3—数据零散,难以统一管理,无法与其他业务系统对接集成;4—完全不存在备份机制,单点故障。因以上限制,这种录音方式只在一些极小规模的用户场景中使用,或者作为其他录音方式的后备补充方案。
会议录音。这种方式下,改变了常规的IP电话呼叫媒体路径。一通电话由被录音话机—外部通话方的两方点对点呼叫,变成了被录音话机—电话录音系统—外部通话方的三方通话,三方形成会议的形式,录音系统作为一个静默的与会方获取电话通信数据并生成录音文件。这种方式的优点在于1—部署灵活,对网络结构没有特别要求;2—管理方便,可以通过统一的录音服务管理所有的录音文件和相关操作。这种方式的限制在于1—机制复杂,可靠性较差,故障率较高;2—因建立三方通话需要消耗大量媒体处理资源,总体系统开销较高;3—因需要修改通话路径,因此该录音方式与具体使用的IP电话系统耦合程度很高,适应不同厂商产品的会议录音设备通常无法通用;4—因进行多方通话的限制,会议录音系统一般只能做到主备方式工作,无法实现多活工作。会议录音方式是目前主流的IP电话录音方式之一。
镜像录音。这种方式下,通过专用设备或网络交换设备,复制了IP话机通信的IP媒体流,录音系统由复制得到的镜像媒体流数据生成录音文件。这种方式的优点在于1—机制简单,可靠性较高,镜像得到的媒体流数量不限,可通过多份镜像流实现录音系统的多活工作;2—管理方便,可以通过统一的录音服务管理所有的录音文件和相关操作;3—通用性好,一切使用标准通信协议的IP电话系统都可以使用相同的方式进行镜像录音。这种方式的限制在于1—不支持加密的通话,因被加密的IP媒体流无法解析出通话数据;2—部署复杂,对网络结构有特定要求。镜像录音方式是目前主流的IP电话录音方式之一。
在IP电话系统中,通话语音数据都通过IP网络传输,难免受到网络环境影响。相比传统电路交换电话系统采用的并线录音方式,基于IP网络的IP电话系统录音因受到网络延迟、丢包、抖动等影响,更容易出现录音文件缺损、丢失等事故,从而导致业务损失。任何单一的录音系统都难以避免因受到到网络环境影响或录音系统自身故障造成的录音数据损失。为尽可能提高IP电话系统录音的可靠性,减少因录音问题造成的业务损失,可行的方案有:一、提高录音系统自身可靠性,降低录音系统自身故障造成录音数据损失的可能。至少能够在出现损失时及时告警,避免损失扩大;二、同时部署多种不同方式的录音系统。因不同录音方式采用不同的录音原理,录音系统通过不同的数据来源获取录音数据,可以有效避免因各别网络节点或IP数据链路问题造成的录音数据损失。
要实现以上两点,前提在于:
(一)能够对录音生成的数据文件进行校验,验证其有效性;
(二)能够比较多种不同方式录音系统生成的录音数据文件,找到对应同一通呼叫的多个文件,并选择最佳录音记录。
在客服、呼叫中心以及如基金、证券、银行等特殊行业,长期可靠的电话录音不但是业务本身必须,也是法律规定的合规要求。由于IP电话系统依托于IP网络建设,同样建立在IP网络上针对IP电话的录音系统其可靠性一般也低于传统电路交换系统的并线录音。对于录音可靠性要求较高的用户一般选择部署多套异构的、不同录音方式的录音系统,以确保录音数据的完备。
本发明拟构造一种通过IP电话系统通话详细记录(Call Detail Record,以下简称为CDR),对录音数据文件进行校验,对不同来源的录音数据文件进行识别、比较、合并的方法。本发明要解决的技术问题体现在以下几点:
1)即时获取CDR并对比校验录音数据条目,发现异常或丢失的数据,以触发相关监控系统进行告警;
2)以CDR为基准,识别不同来源的录音数据文件所匹配的原始呼叫,并关联匹配同一原始呼叫的录音数据文件,实现多个录音数据来源的统一检索;
3)比对匹配同一原始呼叫的一组录音数据文件,选择最佳录音记录作为最终的录音数据文件存档。落选数据可在之后按计划删除,以降低录音长期保存的存储空间需求;
目前市场主流的IP电话系统品牌,如华为、AVAYA、Cisco等均可提供CDR,同时支持包括会议录音和镜像录音在内的多种录音方式。因此以CDR数据为基础,对多种方式来源的录音数据文件进行校验和处理的设计是可行的。
专利文献CN105630857A(申请号:201510718986.0)公开了一种录音文件的管理方法、录音文件的管理系统和终端,其中,录音文件的管理方法,包括:根据已存储的录音文件的属性信息,将已存储的录音文件划分为待删除的录音文件和待保留的录音文件;根据回收站的启动状态删除待删除的录音文件,或将待删除的录音文件转移至回收站。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种对IP电话录音文件进行校检与选择的存档方法、系统及介质。
根据本发明提供的一种对IP电话录音文件进行校验与选择存档的方法,包括:
CDR数据采集步骤:从IP PBX采集CDR数据;
CDR数据分析步骤:分析采集的CDR数据,得到CDR数据分析结果;
录音数据采集步骤:从录音系统采集录音数据;
录音数据分析步骤:分析录音数据,得到录音数据分析结果;
分析结果处理步骤:根据号码转换规则,对CDR数据分析结果和录音数据分析结果进行标准化处理;
分析结果比对步骤:比对CDR数据分析结果与录音数据分析结果,获得不匹配的录音数据条目;
数据分组步骤:对属于同一通呼叫的录音数据进行分组;
检索数据生成步骤:根据分组后的录音数据,生成统一检索数据;
数据打分步骤:根据数据比对的匹配程度打分,选出最优录音进行存档;
错误信息收集步骤:根据获得的不匹配的录音数据条目,收集错误信息。
优选地,所述CDR数据分析结果包括:每一通呼叫的ID、呼叫发生时间、接通时间、通话时长、音频编码、主叫号码、主叫地址、被叫号码、被叫地址,通过CDR数据,在不同系统间,唯一的识别一通呼叫;
所述录音数据分析结果包括:每一通被录音呼叫的录音ID、录音发生时间、结束时间、主叫号码、被叫号码、录音用户、录音文件路径,通过录音文件路径获取录音文件属性,包括文件编码和文件大小。
优选地,所述分析结果比对步骤包括:
步骤S1:比对CDR数据分析结果中各通呼叫接通时间点与各录音数据分析结果中录音发生时间点,以CDR数据分析结果为标准,若时间点误差小于预设误差,则视为匹配;
如匹配,则将匹配的数据分为一组,获得时间点误差分组数据,执行步骤S2;
如不匹配,则说明CDR数据记录的呼叫中出现未被录音的条目,判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
步骤S2:根据获得的时间点误差分组数据,比对一组记录中,CDR数据分析结果中各通呼叫的主叫号码与各录音数据分析结果中录音的主叫号码,以CDR数据分析结果为标准,若完全相同则视为匹配:
如匹配,则将匹配的数据分为一组,获得号码匹配分组数据,执行下一个步骤;
如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
步骤S3:根据获得的号码匹配分组数据,比对一组记录中,CDR数据分析结果中的通话时长与录音文件码率计算的录音文件大小,与录音文件属性中获取的文件大小是否匹配:若文件容量差异小于预设差异值,则视为匹配;如匹配,则将匹配的数据分为一组,获得文件容量分组数据,进入数据分组步骤继续执行;如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
所述计算的录音文件大小指:CDR通话时长*录音码率/8=录音文件容量。
优选地,所述数据分组步骤包括:对获得的文件容量分组数据进行整理,以CDR数据为基准,对齐一组分组数据中不同来源的录音数据,对齐的录音数据包括:录音开始时间、主叫号码和被叫号码;
所述检索数据生成步骤包括:以对齐的录音数据建立数据索引项;
所述数据打分步骤包括:根据文件容量差异进行打分,完全匹配为5分,每偏离1%减一分,至偏离5%则为0分,选择一组中得分最高的一条数据标记为最优,当有多条数据得分相同时,根据预先定义的录音系统的优先顺序选择最优;
所述错误信息收集步骤包括:对分析结果比对步骤中获得的不匹配的录音数据条目,判断数据来源的录音系统存在的问题,包括录音系统的运营情况和存在的故障点。
根据本发明提供的一种对IP电话录音文件进行校验与选择存档的系统,包括:
CDR数据采集模块:从IP PBX采集CDR数据;
CDR数据分析模块:分析采集的CDR数据,得到CDR数据分析结果;
录音数据采集模块:从录音系统采集录音数据;
录音数据分析模块:分析录音数据,得到录音数据分析结果;
分析结果处理模块:根据号码转换规则,对CDR数据分析结果和录音数据分析结果进行标准化处理;
分析结果比对模块:比对CDR数据分析结果与录音数据分析结果,获得不匹配的录音数据条目;
数据分组模块:对属于同一通呼叫的录音数据进行分组;
检索数据生成模块:根据分组后的录音数据,生成统一检索数据;
数据打分模块:根据数据比对的匹配程度打分,选出最优录音进行存档;
错误信息收集模块:根据获得的不匹配的录音数据条目,收集错误信息。
优选地,所述CDR数据分析结果包括:每一通呼叫的ID、呼叫发生时间、接通时间、通话时长、音频编码、主叫号码、主叫地址、被叫号码、被叫地址,通过CDR数据,在不同系统间,唯一的识别一通呼叫;
所述录音数据分析结果包括:每一通被录音呼叫的录音ID、录音发生时间、结束时间、主叫号码、被叫号码、录音用户、录音文件路径,通过录音文件路径获取录音文件属性,包括文件编码和文件大小。
优选地,所述分析结果比对模块包括:
模块S1:比对CDR数据分析结果中各通呼叫接通时间点与各录音数据分析结果中录音发生时间点,以CDR数据分析结果为标准,若时间点误差小于预设误差,则视为匹配;
如匹配,则将匹配的数据分为一组,获得时间点误差分组数据,调用模块S2;
如不匹配,则说明CDR数据记录的呼叫中出现未被录音的条目,判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
模块S2:根据获得的时间点误差分组数据,比对一组记录中,CDR数据分析结果中各通呼叫的主叫号码与各录音数据分析结果中录音的主叫号码,以CDR数据分析结果为标准,若完全相同则视为匹配:
如匹配,则将匹配的数据分为一组,获得号码匹配分组数据,调用模块S3;
如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
模块S3:根据获得的号码匹配分组数据,比对一组记录中,CDR数据分析结果中的通话时长与录音文件码率计算的录音文件大小,与录音文件属性中获取的文件大小是否匹配:若文件容量差异小于预设差异值,则视为匹配;如匹配,则将匹配的数据分为一组,获得文件容量分组数据,调用数据分组模块;如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
所述计算的录音文件大小指:CDR通话时长*录音码率/8=录音文件容量。
优选地,所述数据分组模块包括:对获得的文件容量分组数据进行整理,以CDR数据为基准,对齐一组分组数据中不同来源的录音数据,对齐的录音数据包括:录音开始时间、主叫号码和被叫号码;
所述检索数据生成模块包括:以对齐的录音数据建立数据索引项;
所述数据打分模块包括:根据文件容量差异进行打分,完全匹配为5分,每偏离1%减一分,至偏离5%则为0分,选择一组中得分最高的一条数据标记为最优,当有多条数据得分相同时,根据预先定义的录音系统的优先顺序选择最优;
所述错误信息收集模块包括:根据分析结果比对模块中获得的不匹配的录音数据条目,判断数据来源的录音系统存在的问题,包括:录音系统的运营情况和存在的故障点。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述中任一项所述的方法的步骤。
与现有技术相比,本发明具有如下的有益效果:
1、一般IP电话录音用户可以通过应用本发明所描述的方法,快速发现录音系统可能存在的问题,减少因录音数据损坏或丢失造成的损失。
2、本发明部署多套录音系统的用户可通过应用本发明所描述的方法,解决不同录音系统间数据无法关联,难以对照查询的问题。
3、本发明通过本发明所述方法建立统一索引,可有效提升多套录音系统共同使用的便捷性和有效性。
4、本发明通过本发明所述方法对多套录音系统的录音数据选择最优进行存档,可有效降低因长期保留额外录音数据文件造成的数据存储资源开销,提升资源的利用率,降低总体投入。
5、本发明对于多份不同来源的录音文件,通过与通话记录中获取的时长和录音发生时刻的比较,确认录音文件的关联性,并对文件进行选择存档,提高了录音可靠性并降低总体存储空间需求。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明提供的多种来源的IP电话录音文件进行校验比对与选择存档的流程示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
根据本发明提供的一种对IP电话录音文件进行校验与选择存档的方法,包括:
CDR数据采集步骤:从IP PBX采集CDR数据;
CDR数据分析步骤:分析采集的CDR数据,得到CDR数据分析结果;
录音数据采集步骤:从录音系统采集录音数据;
录音数据分析步骤:分析录音数据,得到录音数据分析结果;
分析结果处理步骤:根据号码转换规则,对CDR数据分析结果和录音数据分析结果进行标准化处理;
分析结果比对步骤:比对CDR数据分析结果与录音数据分析结果,获得不匹配的录音数据条目;
数据分组步骤:对属于同一通呼叫的录音数据进行分组;
检索数据生成步骤:根据分组后的录音数据,生成统一检索数据;
数据打分步骤:根据数据比对的匹配程度打分,选出最优录音进行存档;
错误信息收集步骤:根据获得的不匹配的录音数据条目,收集错误信息。
具体地,所述CDR数据分析结果包括:每一通呼叫的ID、呼叫发生时间、接通时间、通话时长、音频编码、主叫号码、主叫地址、被叫号码、被叫地址,通过CDR数据,在不同系统间,唯一的识别一通呼叫;
所述录音数据分析结果包括:每一通被录音呼叫的录音ID、录音发生时间、结束时间、主叫号码、被叫号码、录音用户、录音文件路径,通过录音文件路径获取录音文件属性,包括文件编码和文件大小。
具体地,所述分析结果比对步骤包括:
步骤S1:比对CDR数据分析结果中各通呼叫接通时间点与各录音数据分析结果中录音发生时间点,以CDR数据分析结果为标准,若时间点误差小于预设误差,则视为匹配;
如匹配,则将匹配的数据分为一组,获得时间点误差分组数据,执行步骤S2;
如不匹配,则说明CDR数据记录的呼叫中出现未被录音的条目,判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
步骤S2:根据获得的时间点误差分组数据,比对一组记录中,CDR数据分析结果中各通呼叫的主叫号码与各录音数据分析结果中录音的主叫号码,以CDR数据分析结果为标准,若完全相同则视为匹配:
如匹配,则将匹配的数据分为一组,获得号码匹配分组数据,执行下一个步骤;
如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
步骤S3:根据获得的号码匹配分组数据,比对一组记录中,CDR数据分析结果中的通话时长与录音文件码率计算的录音文件大小,与录音文件属性中获取的文件大小是否匹配:若文件容量差异小于预设差异值,则视为匹配;如匹配,则将匹配的数据分为一组,获得文件容量分组数据,进入数据分组步骤继续执行;如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
所述计算的录音文件大小指:CDR通话时长*录音码率/8=录音文件容量。
具体地,所述数据分组步骤包括:对获得的文件容量分组数据进行整理,以CDR数据为基准,对齐一组分组数据中不同来源的录音数据,对齐的录音数据包括:录音开始时间、主叫号码和被叫号码;
所述检索数据生成步骤包括:以对齐的录音数据建立数据索引项;
所述数据打分步骤包括:根据文件容量差异进行打分,完全匹配为5分,每偏离1%减一分,至偏离5%则为0分,选择一组中得分最高的一条数据标记为最优,当有多条数据得分相同时,根据预先定义的录音系统的优先顺序选择最优;
所述错误信息收集步骤包括:对分析结果比对步骤中获得的不匹配的录音数据条目,判断数据来源的录音系统存在的问题,包括录音系统的运营情况和存在的故障点。
本发明提供的对IP电话录音文件进行校验与选择存档的系统,可以通过本发明给的对IP电话录音文件进行校验与选择存档的方法的步骤流程实现。本领域技术人员可以将所述对IP电话录音文件进行校验与选择存档的方法,理解为所述对IP电话录音文件进行校验与选择存档的系统的一个优选例。
根据本发明提供的一种对IP电话录音文件进行校验与选择存档的系统,包括:
CDR数据采集模块:从IP PBX采集CDR数据;
CDR数据分析模块:分析采集的CDR数据,得到CDR数据分析结果;
录音数据采集模块:从录音系统采集录音数据;
录音数据分析模块:分析录音数据,得到录音数据分析结果;
分析结果处理模块:根据号码转换规则,对CDR数据分析结果和录音数据分析结果进行标准化处理;
分析结果比对模块:比对CDR数据分析结果与录音数据分析结果,获得不匹配的录音数据条目;
数据分组模块:对属于同一通呼叫的录音数据进行分组;
检索数据生成模块:根据分组后的录音数据,生成统一检索数据;
数据打分模块:根据数据比对的匹配程度打分,选出最优录音进行存档;
错误信息收集模块:根据获得的不匹配的录音数据条目,收集错误信息。
具体地,所述CDR数据分析结果包括:每一通呼叫的ID、呼叫发生时间、接通时间、通话时长、音频编码、主叫号码、主叫地址、被叫号码、被叫地址,通过CDR数据,在不同系统间,唯一的识别一通呼叫;
所述录音数据分析结果包括:每一通被录音呼叫的录音ID、录音发生时间、结束时间、主叫号码、被叫号码、录音用户、录音文件路径,通过录音文件路径获取录音文件属性,包括文件编码和文件大小。
具体地,所述分析结果比对模块包括:
模块S1:比对CDR数据分析结果中各通呼叫接通时间点与各录音数据分析结果中录音发生时间点,以CDR数据分析结果为标准,若时间点误差小于预设误差,则视为匹配;
如匹配,则将匹配的数据分为一组,获得时间点误差分组数据,调用模块S2;
如不匹配,则说明CDR数据记录的呼叫中出现未被录音的条目,判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
模块S2:根据获得的时间点误差分组数据,比对一组记录中,CDR数据分析结果中各通呼叫的主叫号码与各录音数据分析结果中录音的主叫号码,以CDR数据分析结果为标准,若完全相同则视为匹配:
如匹配,则将匹配的数据分为一组,获得号码匹配分组数据,调用模块S3;
如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
模块S3:根据获得的号码匹配分组数据,比对一组记录中,CDR数据分析结果中的通话时长与录音文件码率计算的录音文件大小,与录音文件属性中获取的文件大小是否匹配:若文件容量差异小于预设差异值,则视为匹配;如匹配,则将匹配的数据分为一组,获得文件容量分组数据,调用数据分组模块;如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
所述计算的录音文件大小指:CDR通话时长*录音码率/8=录音文件容量。
具体地,所述数据分组模块包括:对获得的文件容量分组数据进行整理,以CDR数据为基准,对齐一组分组数据中不同来源的录音数据,对齐的录音数据包括:录音开始时间、主叫号码和被叫号码;
所述检索数据生成模块包括:以对齐的录音数据建立数据索引项;
所述数据打分模块包括:根据文件容量差异进行打分,完全匹配为5分,每偏离1%减一分,至偏离5%则为0分,选择一组中得分最高的一条数据标记为最优,当有多条数据得分相同时,根据预先定义的录音系统的优先顺序选择最优;
所述错误信息收集模块包括:根据分析结果比对模块中获得的不匹配的录音数据条目,判断数据来源的录音系统存在的问题,包括:录音系统的运营情况和存在的故障点。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述中任一项所述的方法的步骤。
下面通过优选例,对本发明进行更为具体地说明。
优选例1:
如图1所示,根据本发明提供的对IP电话录音文件进行校验与选择存档的方法,包括:
步骤1:从IP PBX采集CDR数据。
采用与IP PBX系统对应的方式获取系统CDR数据。目前市场上主流的IP PBX品牌均可提供CDR数据,CDR数据的获取方式以FTP\SFTP协议为主,如Cisco、华为和AVAYA都支持采用FTP\SFTP协议获取CDR数据。
步骤2:分析CDR记录,提取每一通呼叫的详细信息,用于与后文所述录音数据信息进行对比。
典型的CDR数据可能包括如下信息字段(根据IP PBX品牌不同,所包含的字段可能有所不同):
通过分析上述CDR数据,能够获取每一通呼叫的ID、呼叫发生时间、接通时间、通话时长、音频编码、主叫号码、主叫地址、被叫号码、被叫地址等关键信息。通过这些信息,便可以在不同系统间,唯一的识别一通呼叫。
步骤3:从各个录音系统采集录音数据。
市场上常见的IP电话录音系统通常支持通过Web服务接口、数据库视图读取、SOAP协议等方式读取录音数据和录音文件。
步骤4:分析录音数据,提取每一通呼叫的录音数据信息。
典型的录音数据可能包括如下信息:
通过分析上述录音数据信息,可以获取每一通被录音呼叫的录音ID、录音发生时间、结束时间、主叫号码、被叫号码、录音用户、录音文件路径等信息。通过录音文件路径可以获取录音文件属性,包括文件编码、文件大小等。
步骤5:数据标准化。
由于IP PBX中可能存在各种号码转换规则,包括添加前缀、截取、号段转换等,这些规则可能导致CDR数据中体现的号码与录音数据中体现的号码不完全相同。因此需要根据号码转换规则,对CDR数据和录音数据进行标准化处理,确保数据中的号码通过相同的转化规则标准处理。
步骤6:比对CDR数据分析与录音数据分析结果。
分别获取CDR数据与录音数据的分析结果后,按如下顺序和描述进行比对。
1)比对CDR中各通呼叫接通时间点与各录音系统中录音发生时间点。以CDR数据
为标准,误差<=1s视为匹配。如匹配,则将匹配的数据分为一组进行后续比对。如出现不匹配,则说明CDR记录的呼叫中出现未被录音的条目,判断出现不匹配的录音系统发生录音数据异常
2)按1)中完成的分组,比对一组记录中,CDR中各通呼叫的主叫号码与各录音系统中录音的主叫号码。以CDR数据为标准,完全相同视为匹配。如匹配,则将匹配的数据分为一组进行后续比对。如出现不匹配,则判断出现不匹配的录音系统发生录音数据异常。
3)按2)中完成的进一步分组,比对一组记录中,通过CDR数据中的通话时长与录音文件码率计算的录音文件大小,与录音文件属性中获取的大小是否匹配。即:CDR通话时长(s)X录音码率(Kbit/s)/8=录音文件容量(KB)。文件容量差异<5%视为匹配。如匹配,则将匹配的数据分为一组进行后续处理。如出现不匹配,则判断出现不匹配的录音系统发生录音数据异常
步骤7:分组属于同一通呼叫的录音数据
对步骤6中分组的数据进行整理,以CDR数据为基准,对齐一组中不同来源的录音数据。可对齐的数据字段一般包括:录音开始时间、主叫号码、被叫号码等。录音数据中因来源不同所携带的不同录音厂商产品特有的字段忽略。
步骤8:生成统一检索数据
在步骤7中完成分组的数据中,以可对齐的数据字段建立数据索引项。
步骤9:根据数据比对的匹配程度打分,选出最优录音进行存档
在一组录音数据中,根据步骤6中3)的比对匹配程度进行打分。完全匹配为5分,每偏离1%减一分,至偏离5%则为0分。选择一组中得分最高的一条数据标记为最优,当有多条数据得分相同时,根据预先定义的录音系统的优先顺序选择最优。
根据该结果,可以选择仅保留最优录音数据结果进行存档,其余数据可视情况保留一段时间或删除,以释放存储空间,降低因长时间多分录音文件保留造成的额外资源开销。
步骤10:收集错误信息
对于步骤6中比对得出不匹配的录音数据条目,可判断其来源的录音系统可能存在问题。这些比对错误信息可供录音系统使用者用以判断录音系统的运行情况以及可能存在的故障点。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (9)

1.一种对IP电话录音文件进行校验与选择存档的方法,其特征在于,包括:
CDR数据采集步骤:从IP PBX采集CDR数据;
CDR数据分析步骤:分析采集的CDR数据,得到CDR数据分析结果;
录音数据采集步骤:从录音系统采集录音数据;
录音数据分析步骤:分析录音数据,得到录音数据分析结果;
分析结果处理步骤:根据号码转换规则,对CDR数据分析结果和录音数据分析结果进行标准化处理;
分析结果比对步骤:比对CDR数据分析结果与录音数据分析结果,获得不匹配的录音数据条目;
数据分组步骤:对属于同一通呼叫的录音数据进行分组;
检索数据生成步骤:根据分组后的录音数据,生成统一检索数据;
数据打分步骤:根据数据比对的匹配程度打分,选出最优录音进行存档;
错误信息收集步骤:根据获得的不匹配的录音数据条目,收集错误信息。
2.根据权利要求1所述的对IP电话录音文件进行校验与选择存档的方法,其特征在于,所述CDR数据分析结果包括:每一通呼叫的ID、呼叫发生时间、接通时间、通话时长、音频编码、主叫号码、主叫地址、被叫号码、被叫地址,通过CDR数据,在不同系统间,唯一的识别一通呼叫;
所述录音数据分析结果包括:每一通被录音呼叫的录音ID、录音发生时间、结束时间、主叫号码、被叫号码、录音用户、录音文件路径,通过录音文件路径获取录音文件属性,包括文件编码和文件大小。
3.根据权利要求1所述的对IP电话录音文件进行校验与选择存档的方法,其特征在于,所述分析结果比对步骤包括:
步骤S1:比对CDR数据分析结果中各通呼叫接通时间点与各录音数据分析结果中录音发生时间点,以CDR数据分析结果为标准,若时间点误差小于预设误差,则视为匹配;
如匹配,则将匹配的数据分为一组,获得时间点误差分组数据,执行步骤S2;
如不匹配,则说明CDR数据记录的呼叫中出现未被录音的条目,判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
步骤S2:根据获得的时间点误差分组数据,比对一组记录中,CDR数据分析结果中各通呼叫的主叫号码与各录音数据分析结果中录音的主叫号码,以CDR数据分析结果为标准,若完全相同则视为匹配:
如匹配,则将匹配的数据分为一组,获得号码匹配分组数据,执行下一个步骤;
如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
步骤S3:根据获得的号码匹配分组数据,比对一组记录中,CDR数据分析结果中的通话时长与录音文件码率计算的录音文件大小,与录音文件属性中获取的文件大小是否匹配:若文件容量差异小于预设差异值,则视为匹配;如匹配,则将匹配的数据分为一组,获得文件容量分组数据,进入数据分组步骤继续执行;如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
所述计算的录音文件大小指:CDR通话时长*录音码率/8=录音文件容量。
4.根据权利要求1所述的对IP电话录音文件进行校验与选择存档的方法,其特征在于,所述数据分组步骤包括:对获得的文件容量分组数据进行整理,以CDR数据为基准,对齐一组分组数据中不同来源的录音数据,对齐的录音数据包括:录音开始时间、主叫号码和被叫号码;
所述检索数据生成步骤包括:以对齐的录音数据建立数据索引项;
所述数据打分步骤包括:根据文件容量差异进行打分,完全匹配为5分,每偏离1%减一分,至偏离5%则为0分,选择一组中得分最高的一条数据标记为最优,当有多条数据得分相同时,根据预先定义的录音系统的优先顺序选择最优;
所述错误信息收集步骤包括:对分析结果比对步骤中获得的不匹配的录音数据条目,判断数据来源的录音系统存在的问题,包括录音系统的运营情况和存在的故障点。
5.一种对IP电话录音文件进行校验与选择存档的系统,其特征在于,包括:
CDR数据采集模块:从IP PBX采集CDR数据;
CDR数据分析模块:分析采集的CDR数据,得到CDR数据分析结果;
录音数据采集模块:从录音系统采集录音数据;
录音数据分析模块:分析录音数据,得到录音数据分析结果;
分析结果处理模块:根据号码转换规则,对CDR数据分析结果和录音数据分析结果进行标准化处理;
分析结果比对模块:比对CDR数据分析结果与录音数据分析结果,获得不匹配的录音数据条目;
数据分组模块:对属于同一通呼叫的录音数据进行分组;
检索数据生成模块:根据分组后的录音数据,生成统一检索数据;
数据打分模块:根据数据比对的匹配程度打分,选出最优录音进行存档;
错误信息收集模块:根据获得的不匹配的录音数据条目,收集错误信息。
6.根据权利要求5所述的对IP电话录音文件进行校验与选择存档的系统,其特征在于,所述CDR数据分析结果包括:每一通呼叫的ID、呼叫发生时间、接通时间、通话时长、音频编码、主叫号码、主叫地址、被叫号码、被叫地址,通过CDR数据,在不同系统间,唯一的识别一通呼叫;
所述录音数据分析结果包括:每一通被录音呼叫的录音ID、录音发生时间、结束时间、主叫号码、被叫号码、录音用户、录音文件路径,通过录音文件路径获取录音文件属性,包括文件编码和文件大小。
7.根据权利要求5所述的对IP电话录音文件进行校验与选择存档的系统,其特征在于,所述分析结果比对模块包括:
模块S1:比对CDR数据分析结果中各通呼叫接通时间点与各录音数据分析结果中录音发生时间点,以CDR数据分析结果为标准,若时间点误差小于预设误差,则视为匹配;
如匹配,则将匹配的数据分为一组,获得时间点误差分组数据,调用模块S2;
如不匹配,则说明CDR数据记录的呼叫中出现未被录音的条目,判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
模块S2:根据获得的时间点误差分组数据,比对一组记录中,CDR数据分析结果中各通呼叫的主叫号码与各录音数据分析结果中录音的主叫号码,以CDR数据分析结果为标准,若完全相同则视为匹配:
如匹配,则将匹配的数据分为一组,获得号码匹配分组数据,调用模块S3;
如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
模块S3:根据获得的号码匹配分组数据,比对一组记录中,CDR数据分析结果中的通话时长与录音文件码率计算的录音文件大小,与录音文件属性中获取的文件大小是否匹配:若文件容量差异小于预设差异值,则视为匹配;如匹配,则将匹配的数据分为一组,获得文件容量分组数据,调用数据分组模块;如不匹配,则判断出现不匹配的录音系统发生录音数据异常,获得不匹配的录音数据条目;
所述计算的录音文件大小指:CDR通话时长*录音码率/8=录音文件容量。
8.根据权利要求5所述的对IP电话录音文件进行校验与选择存档的系统,其特征在于,所述数据分组模块包括:对获得的文件容量分组数据进行整理,以CDR数据为基准,对齐一组分组数据中不同来源的录音数据,对齐的录音数据包括:录音开始时间、主叫号码和被叫号码;
所述检索数据生成模块包括:以对齐的录音数据建立数据索引项;
所述数据打分模块包括:根据文件容量差异进行打分,完全匹配为5分,每偏离1%减一分,至偏离5%则为0分,选择一组中得分最高的一条数据标记为最优,当有多条数据得分相同时,根据预先定义的录音系统的优先顺序选择最优;
所述错误信息收集模块包括:根据分析结果比对模块中获得的不匹配的录音数据条目,判断数据来源的录音系统存在的问题,包括:录音系统的运营情况和存在的故障点。
9.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
CN201910995212.0A 2019-10-18 2019-10-18 对ip电话录音文件进行校验与选择存档的方法、系统 Active CN110717063B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910995212.0A CN110717063B (zh) 2019-10-18 2019-10-18 对ip电话录音文件进行校验与选择存档的方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910995212.0A CN110717063B (zh) 2019-10-18 2019-10-18 对ip电话录音文件进行校验与选择存档的方法、系统

Publications (2)

Publication Number Publication Date
CN110717063A true CN110717063A (zh) 2020-01-21
CN110717063B CN110717063B (zh) 2022-02-11

Family

ID=69212873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910995212.0A Active CN110717063B (zh) 2019-10-18 2019-10-18 对ip电话录音文件进行校验与选择存档的方法、系统

Country Status (1)

Country Link
CN (1) CN110717063B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060215821A1 (en) * 2005-03-23 2006-09-28 Rokusek Daniel S Voice nametag audio feedback for dialing a telephone call
WO2007076991A1 (de) * 2005-12-23 2007-07-12 Tobias Kramer System und ein verfahren zum verwalten von musik-daten
US20090012792A1 (en) * 2006-12-12 2009-01-08 Harman Becker Automotive Systems Gmbh Speech recognition system
CN101681219A (zh) * 2007-06-21 2010-03-24 泰科电子公司 用于校准声学触摸屏的方法和系统
US20100208728A1 (en) * 2009-02-13 2010-08-19 Avaya Inc. Multi-Route Transmission of Packets Within a Network
CN102024033A (zh) * 2010-12-01 2011-04-20 北京邮电大学 一种自动检测音频模板并对视频分章的方法
US20150106091A1 (en) * 2013-10-14 2015-04-16 Spence Wetjen Conference transcription system and method
US20180342240A1 (en) * 2017-05-23 2018-11-29 Verbit Software Ltd. System and method for assessing audio files for transcription services
CN108924370A (zh) * 2018-07-23 2018-11-30 携程旅游信息技术(上海)有限公司 呼叫中心外呼语音波形分析方法、系统、设备及存储介质
US20180364967A1 (en) * 2017-06-16 2018-12-20 Krotos Ltd Method of generating an audio signal
CN109272129A (zh) * 2018-09-20 2019-01-25 重庆先特服务外包产业有限公司 呼叫中心业务管理系统
CN109313632A (zh) * 2016-04-22 2019-02-05 远程媒体有限责任公司 一种用于增强网络环境中数据处理的系统和方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060215821A1 (en) * 2005-03-23 2006-09-28 Rokusek Daniel S Voice nametag audio feedback for dialing a telephone call
WO2007076991A1 (de) * 2005-12-23 2007-07-12 Tobias Kramer System und ein verfahren zum verwalten von musik-daten
US20090012792A1 (en) * 2006-12-12 2009-01-08 Harman Becker Automotive Systems Gmbh Speech recognition system
CN101681219A (zh) * 2007-06-21 2010-03-24 泰科电子公司 用于校准声学触摸屏的方法和系统
US20100208728A1 (en) * 2009-02-13 2010-08-19 Avaya Inc. Multi-Route Transmission of Packets Within a Network
CN102024033A (zh) * 2010-12-01 2011-04-20 北京邮电大学 一种自动检测音频模板并对视频分章的方法
US20150106091A1 (en) * 2013-10-14 2015-04-16 Spence Wetjen Conference transcription system and method
CN109313632A (zh) * 2016-04-22 2019-02-05 远程媒体有限责任公司 一种用于增强网络环境中数据处理的系统和方法
US20180342240A1 (en) * 2017-05-23 2018-11-29 Verbit Software Ltd. System and method for assessing audio files for transcription services
US20180364967A1 (en) * 2017-06-16 2018-12-20 Krotos Ltd Method of generating an audio signal
CN108924370A (zh) * 2018-07-23 2018-11-30 携程旅游信息技术(上海)有限公司 呼叫中心外呼语音波形分析方法、系统、设备及存储介质
CN109272129A (zh) * 2018-09-20 2019-01-25 重庆先特服务外包产业有限公司 呼叫中心业务管理系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李智等: "层次分析法在ZigBee网络语音通信中的应用研究", 《通信技术》 *

Also Published As

Publication number Publication date
CN110717063B (zh) 2022-02-11

Similar Documents

Publication Publication Date Title
WO2020238066A1 (zh) 一种软件的压力测试方法、装置、存储介质和服务器
CN102804744B (zh) 用于记录基于VoIP网络的呼叫会话的分布式记录服务器体系结构
US7904555B2 (en) Systems and methods for flow signature formation and use
CN111752799A (zh) 一种业务链路跟踪方法、装置、设备及储存介质
CN107977473B (zh) 基于Logback的分布式系统日志的检索方法和系统
CN110928851B (zh) 处理日志信息的方法、装置、设备及存储介质
CN110162512A (zh) 一种日志检索方法、装置及存储介质
WO2007147327A1 (fr) Procédé, système et appareil de repérage de défaillance d&#39;un appareil de communication
CN110312046B (zh) 外呼数据优化方法、装置、计算机设备及存储介质
CN109522316A (zh) 日志处理方法、装置、设备和存储介质
CN110083581B (zh) 一种日志追溯的方法、装置、存储介质及计算机设备
US8868527B1 (en) Tracking switch transactions in a communications-networking environment
CN104836686B (zh) 一种生成服务器的配置文件的方法及装置
CN112416557B (zh) 调用关系的确定方法和装置、存储介质及电子装置
CN110717063B (zh) 对ip电话录音文件进行校验与选择存档的方法、系统
JP2009218775A (ja) コールセンタシステム
CN103312903B (zh) 调试录音方法及装置
CN109408480B (zh) 基于oracle多节点rac日志基于scn对齐读取的方法及系统
CN102045752B (zh) 用户媒体面跟踪方法及装置
CN111339100A (zh) 数据核对方法及装置
WO2017125001A1 (zh) 保护组处理方法和装置
CN113965489B (zh) 链路超时检测方法、装置、计算机设备和存储介质
CN113051152B (zh) 一种任务数据的生成方法、装置以及处理设备
CN101141209B (zh) 一种sdh网元数据恢复系统及其方法
JP2016152421A (ja) 通話録音システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant