CN110598008B - 录制数据的数据质检方法及装置、存储介质 - Google Patents

录制数据的数据质检方法及装置、存储介质 Download PDF

Info

Publication number
CN110598008B
CN110598008B CN201810607210.5A CN201810607210A CN110598008B CN 110598008 B CN110598008 B CN 110598008B CN 201810607210 A CN201810607210 A CN 201810607210A CN 110598008 B CN110598008 B CN 110598008B
Authority
CN
China
Prior art keywords
quality inspection
data
video
audio
content information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810607210.5A
Other languages
English (en)
Other versions
CN110598008A (zh
Inventor
曹富春
梁俊高
李同立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision System Technology Co Ltd
Original Assignee
Hangzhou Hikvision System Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision System Technology Co Ltd filed Critical Hangzhou Hikvision System Technology Co Ltd
Priority to CN201810607210.5A priority Critical patent/CN110598008B/zh
Publication of CN110598008A publication Critical patent/CN110598008A/zh
Application granted granted Critical
Publication of CN110598008B publication Critical patent/CN110598008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种录制数据的数据质检方法及装置、存储介质,属于多媒体数据处理技术领域。该方法包括:获取录制数据和与录制数据相关联的业务数据;根据业务数据确定录制数据对应的质检规则,质检规则中包括至少一个质检要点;从录制数据中提取内容信息;根据质检规则对内容信息进行数据检测,得到与至少一个质检要点对应的质检结果信息。本发明解决了相关技术中双录数据的质检过程耗费时间较长,导致双录数据的质检效率较低的问题。本发明用于对录制数据进行质检。

Description

录制数据的数据质检方法及装置、存储介质
技术领域
本发明涉及多媒体数据处理技术领域,特别涉及一种录制数据的数据质检方法及装置、存储介质。
背景技术
基于中国银行业监督管理委员会(简称银监会)、保险监督管理委员会(简称保监会)和中国证券监督管理委员会(简称证监会)等监管机构的政策要求,目前在理财业务、保险业务和证券业务等金融业务的办理过程中,均要求通过录音录像(即“双录”)的方式记录和保存金融业务办理过程中各个环节的双录数据(包括视频数据和音频数据),以实现销售行为可回放、重要信息可查询和问题责任可确认;同时,监管机构还要求对记录的双录数据进行真实性、完整性和准确性的检测。
相关技术中,通常由专业的质检人员对双录数据进行质检,由于质检人员需要观看完整的双录数据以实现对双录数据的质检,因此双录数据的质检过程耗费时间较长,导致双录数据的质检效率较低。
发明内容
本发明实施例提供了一种录制数据的数据质检方法及装置、存储介质,可以解决相关技术中双录数据的质检过程耗费时间较长,导致双录数据的质检效率较低的问题。所述技术方案如下:
第一方面,提供了一种录制数据的数据质检方法,所述录制数据是对客户服务过程进行录制得到的多媒体数据,所述方法包括:
获取所述录制数据和与所述录制数据相关联的业务数据;
根据所述业务数据确定所述录制数据对应的质检规则,所述质检规则中包括至少一个质检要点;
从所述录制数据中提取内容信息;
根据所述质检规则对所述内容信息进行数据检测,得到与所述至少一个质检要点对应的质检结果信息。
可选的,所述录制数据包括音频数据;
所述从所述录制数据中提取内容信息,包括:
从所述录制数据中提取音频数据;
对所述音频数据进行语音识别和/或语义理解,得到所述音频数据对应的话术内容信息;
根据所述质检规则对所述内容信息进行数据检测,包括:
根据所述至少一个质检要点中的音频质检要点,对所述话术内容信息进行数据检测。
可选的,所述音频质检要点包括话术模板,所述根据所述至少一个质检要点中的音频质检要点,对所述话术内容信息进行数据检测,包括:
将所述话术内容信息与所述话术模板进行匹配,确定所述话术内容信息与所述话术模板的话术匹配度。
可选的,所述音频质检要点包括至少一个关键词,所述根据所述至少一个质检要点中的音频质检要点,对所述话术内容信息进行数据检测,包括:
检测所述话术内容信息中是否包含所述至少一个关键词;
当所述话术内容信息中包含所有所述关键词时,确定所述话术内容信息符合所述音频质检要点。
可选的,所述音频质检要点包括至少一个敏感词,所述根据所述至少一个质检要点中的音频质检要点,对所述话术内容信息进行数据检测,包括:
检测所述话术内容信息中是否包含所述至少一个敏感词;
当所述话术内容信息中不包含任一所述敏感词时,确定所述话术内容信息符合所述音频质检要点。
可选的,所述录制数据包括视频数据;
所述从所述录制数据中提取内容信息,包括:
从所述录制数据中提取视频数据;
对所述视频数据进行视频结构化分析,得到所述视频数据中的人脸图像信息;
所述根据质检规则对所述内容信息进行数据检测,包括:
根据所述至少一个质检要点中的视频质检要点,对所述人脸图像信息进行数据检测。
可选的,所述业务数据包括客户照片,所述视频质检要点包括人脸匹配度,所述根据所述至少一个质检要点中的视频质检要点,对所述人脸图像信息进行数据检测,包括:
将所述人脸图像信息与所述客户照片进行人脸匹配,确定所述人脸图像信息与所述客户照片的人脸匹配度。
可选的,所述视频质检要点包括所述人脸图像信息的出现时间信息,所述根据所述至少一个质检要点中的视频质检要点,对所述人脸图像信息进行数据检测,包括:
确定所述人脸图像信息在所述录制数据中的出现时刻和出现时长中的至少一种。
可选的,所述根据所述业务数据确定所述录制数据对应的质检规则,包括:
根据所述业务数据中的产品信息,确定所述录制数据对应的产品类型,所述产品信息包括产品名称、产品代码和业务单号中的至少一种;
从质检规则库中获取所述产品类型对应的质检规则,所述质检规则库中包括不同产品类型对应的不同质检规则。
可选的,在所述从所述录制数据中提取内容信息之后,所述方法还包括:
根据所述录制数据和所述质检规则生成质检任务。
可选的,所述方法还包括:
显示结果展示页面,所述结果展示页面上显示有所述质检结果信息。
第二方面,提供了一种录制数据的数据质检装置,所述录制数据是对客户服务过程进行录制得到的多媒体数据,所述装置包括:
获取模块,用于获取所述录制数据和与所述录制数据相关联的业务数据;
确定模块,用于根据所述业务数据确定所述录制数据对应的质检规则,所述质检规则中包括至少一个质检要点;
提取模块,用于从所述录制数据中提取内容信息;
数据检测模块,用于根据所述质检规则对所述内容信息进行数据检测,得到与所述至少一个质检要点对应的质检结果信息。
可选的,所述录制数据包括音频数据;
所述提取模块,用于:
从所述录制数据中提取音频数据;
对所述音频数据进行语音识别和/或语义理解,得到所述音频数据对应的话术内容信息;
所述数据检测模块,用于:
根据所述至少一个质检要点中的音频质检要点,对所述话术内容信息进行数据检测。
可选的,所述音频质检要点包括话术模板,所述数据检测模块,用于:
将所述话术内容信息与所述话术模板进行匹配,确定所述话术内容信息与所述话术模板的话术匹配度。
可选的,所述音频质检要点包括至少一个关键词,所述数据检测模块,用于:
检测所述话术内容信息中是否包含所述至少一个关键词;
当所述话术内容信息中包含所有所述关键词时,确定所述话术内容信息符合所述音频质检要点。
可选的,所述音频质检要点包括至少一个敏感词,所述数据检测模块,用于:
检测所述话术内容信息中是否包含所述至少一个敏感词;
当所述话术内容信息中不包含任一所述敏感词时,确定所述话术内容信息符合所述音频质检要点。
可选的,所述录制数据包括视频数据;
所述提取模块,用于:
从所述录制数据中提取视频数据;
对所述视频数据进行视频结构化分析,得到所述视频数据中的人脸图像信息;
所述数据检测模块,用于:
根据所述至少一个质检要点中的视频质检要点,对所述人脸图像信息进行数据检测。
可选的,所述业务数据包括客户照片,所述视频质检要点包括人脸匹配度,所述数据检测模块,用于:
将所述人脸图像信息与所述客户照片进行人脸匹配,确定所述人脸图像信息与所述客户照片的人脸匹配度。
可选的,所述视频质检要点包括所述人脸图像信息的出现时间信息,所述数据检测模块,用于:
确定所述人脸图像信息在所述录制数据中的出现时刻和出现时长中的至少一种。
可选的,所述确定模块,用于:
根据所述业务数据中的产品信息,确定所述录制数据对应的产品类型,所述产品信息包括产品名称、产品代码和业务单号中的至少一种;
从质检规则库中获取所述产品类型对应的质检规则,所述质检规则库中包括不同产品类型对应的不同质检规则。
可选的,所述装置还包括:
生成模块,用于根据所述录制数据和所述质检规则生成质检任务。
可选的,所述装置还包括:
显示模块,用于显示结果展示页面,所述结果展示页面上显示有所述质检结果信息。
第三方面,提供了一种录制数据的数据质检装置,包括处理器和存储器,
其中,
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器上所存放的计算机程序,实现第一方面任一所述的录制数据的数据质检方法。
第四方面,提供了一种存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的录制数据的数据质检方法。
本发明实施例提供的技术方案带来的有益效果至少包括:
在获取录制数据后,从录制数据中提取内容信息,并根据与录制数据对应的质检规则对该内容信息进行数据检测,以得到与至少一个质检要点对应的质检结果信息。一方面,由于本发明实施例中,数据检测对象是从录制数据中提取出的内容信息,该内容信息的数据量小于录制数据的数据量,因此对该内容信息进行数据检测所耗费的时间少于相关技术中对完整的录制数据进行人工检测所耗费的时间;另一方面,采用计算机设备替代人工质检,计算机设备无需严格按照帧率对录制数据进行检测,且能够同时对多份双录数据进行检测,从而提高了录制数据的质检效率。
附图说明
图1是本发明实施例提供的一种录制数据的数据质检方法的流程图;
图2是本发明实施例提供的另一种录制数据的数据质检方法的流程图;
图3是本发明实施例提供的一种结果展示页面的显示示意图;
图4是本发明实施例提供的一种录制数据的数据质检装置的结构示意图;
图5是本发明实施例提供的另一种录制数据的数据质检装置的结构示意图;
图6是本发明实施例提供的又一种录制数据的数据质检装置的结构示意图;
图7是本发明实施例提供的一种计算机设备的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明实施例提供的录制数据的数据质检方法应用于计算机设备,该计算机设备可以是终端设备,例如智能手机、电脑、多媒体播放器或电子阅读器等;该计算机设备也可以是服务器,例如该计算机设备是一台服务器,或者是由若干台服务器组成的服务器集群,或者是一个云计算服务中心等。本发明实施例对计算机设备的具体类型不做限定。
在本发明实施例中,录制数据是对向客户提供金融业务服务的过程进行录制得到的多媒体数据。录制数据包括音频数据和视频数据中的至少一种。例如,当采用图像采集设备对向客户提供金融业务服务的过程进行录制时,得到的录制数据包括视频数据;当采用声音采集设备对向客户提供金融业务服务的过程进行录制时,得到的录制数据包括音频数据;当采用同时具备图像采集功能和声音采集功能的设备对向客户提供金融业务服务的过程进行录制时,得到的录制数据包括视频数据和音频数据,即该录制数据为双录数据。其中,本发明实施例中涉及的视频数据指视频帧对应的图像数据(不包含音频数据)。
可选的,向客户提供金融业务服务包括向客户介绍或销售金融产品,该金融产品的产品类型包括理财产品、保险产品和证券产品等。
图1是本发明实施例提供的一种录制数据的数据质检方法的流程图,该录制数据是对向客户提供金融业务服务的过程进行录制得到的多媒体数据,如图1所示,该方法包括:
步骤101、获取录制数据和与录制数据相关联的业务数据。
可选的,业务数据包括客户信息和产品信息,客户信息包括客户照片、客户姓名和客户证件号中的至少一种,产品信息包括产品名称、产品代码和业务单号中的至少一种。
步骤102、根据业务数据确定录制数据对应的质检规则,质检规则中包括至少一个质检要点。
其中,质检规则用于规范后期对录制数据进行数据质检的要点。质检规则包括音频质检要点和视频质检要点中的至少一种。可选的,不同的金融产品的产品类型对应的质检规则不同。
可选的,音频质检要点包括话术模板、关键词和敏感词中的至少一种;视频质检要点包括人脸匹配度和人脸图像信息的出现时间信息中的至少一种。
步骤103、从录制数据中提取内容信息。
可选的,当录制数据包括音频数据时,内容信息包括话术内容信息,话术内容信息指对音频数据进行音频处理后转换得到的文字信息;当录制数据包括视频数据时,内容信息包括人脸图像信息。
可选的,当录制数据是双录数据时,可以先对录制数据进行音视频剥离,即从录制数据中剥离出视频数据和音频数据,再分别从视频数据和音频数据中提取对应的内容信息;或者,当录制数据是双录数据时,也可以直接从录制数据中分别提取音频数据对应的内容信息和视频数据对应的内容信息,本发明实施例对此不做限定。
步骤104、根据质检规则对内容信息进行数据检测,得到与至少一个质检要点对应的质检结果信息。
可选的,质检结果信息包括音频质检要点对应的音频质检结果信息和视频质检要点对应的视频质检结果信息。音频质检结果信息包括话术匹配度、关键词匹配度和敏感词匹配度等;视频质检结果信息包括人脸匹配度、人脸图像信息在录制数据中的出现时刻和出现时长等。
可选的,在得到与至少一个质检要点对应的质检结果信息之后,计算机设备还可以对与该至少一个质检要点对应的质检结果信息进行汇总,得到录制数据的质检结论,进一步在结果展示页面上显示该质检结论。
综上所述,本发明实施例提供的录制数据的数据质检方法,在获取录制数据后,从录制数据中提取内容信息,并根据与录制数据对应的质检规则对该内容信息进行数据检测,以得到与至少一个质检要点对应的质检结果信息。一方面,由于本发明实施例中,数据检测对象是从录制数据中提取出的内容信息,该内容信息的数据量小于录制数据的数据量,因此对该内容信息进行数据检测所耗费的时间少于相关技术中对完整的录制数据进行数据检测所耗费的时间;另一方面,采用计算机设备替代人工质检,计算机设备无需严格按照帧率对录制数据进行检测,且能够同时对多份双录数据进行检测,从而提高了录制数据的质检效率。
图2是本发明实施例提供的另一种录制数据的数据质检方法的流程图,用于计算机设备,如图2所示,该方法包括:
步骤201、获取录制数据和与录制数据相关联的业务数据。
可选的,计算机设备从录制数据存储系统中获取录制文件以及与录制文件相关联的业务数据,该录制文件包括录制数据。其中,该录制数据存储系统可以是现有的双录系统,则该录制文件为双录文件。
可选的,业务数据包括客户信息和产品信息,客户信息包括客户照片、客户姓名和客户证件号中的至少一种,产品信息包括产品名称、产品代码和业务单号中的至少一种。
步骤202、根据业务数据确定录制数据对应的质检规则,质检规则中包括至少一个质检要点。
其中,至少一个质检要点可以包括音频质检要点和视频质检要点。
可选的,根据业务数据中的产品信息,确定录制数据对应的产品类型;从质检规则库中获取产品类型对应的质检规则,该质检规则库中包括不同产品类型对应的不同质检规则。
在本发明实施例中,各种产品类型对应的质检规则可以是根据质检要求预先配置的,该质检规则用于规范后期对录制数据进行数据质检的要点。示例的,理财产品对应质检规则A,保险产品对应质检规则B,证券产品对应质检规则C。其中,质检规则B中质检要点的覆盖内容应包括:业务人员提醒投保人注意即将开始录音录像,业务人员向投保人告知业务人员的身份信息及所属机构,业务人员向投保人告知如实填写投保信息及后果,以及业务人员向投保人说明保险责任等。
需要说明的是,本发明实施例提供的质检规则可以根据特定的业务场景灵活地制定,从而能够实现对对应不同产品类型的各种录制数据的质检。
步骤203、从录制数据中提取内容信息。
可选的,当录制数据包括音频数据,从录制数据中提取内容信息的过程包括:从录制数据中提取音频数据;对音频数据进行语音识别和/或语义理解,得到音频数据对应的话术内容信息。
可选的,当录制数据包括视频数据,从录制数据中提取内容信息的过程包括:从录制数据中提取视频数据;对视频数据进行视频结构化分析,得到视频数据中的人脸图像信息。
本发明实施例对语音识别、语义理解和视频结构化分析过程中所采用的算法的类型不做限定。
步骤204、根据录制数据和质检规则生成质检任务。
可选的,质检任务包括音频质检任务和视频质检任务。当质检任务中包括内容信息和质检规则时,音频质检任务包括话术内容信息和音频质检要点,视频质检任务包括人脸图像信息、客户照片和视频质检要点。
需要说明的是,计算机设备根据提取出的话术内容信息和人脸图像信息,对应生成音频质检任务和视频质检任务,便于将音频质检任务推送至音频分析模块,由音频分析模块对话术内容信息进行分析和检测,将视频质检任务推送至视频分析模块,由视频分析模块对人脸图像信息进行分析和检测。
可选的,步骤204也可以在步骤203之前执行,则质检任务中包括录制数据和质检规则。相应的,计算机设备在获取录制数据后,从录制数据中提取音频数据,基于音频数据和音频质检要点生成音频质检任务;从录制数据中提取视频数据,基于视频数据和视频质检要点生成视频质检任务。计算机设备在生成音频质检任务和视频质检任务后,分别将音频质检任务和视频质检任务推送至音频分析模块和视频分析模块,由音频分析模块从音频数据中提取话术内容信息,并对该话术内容信息进行分析和检测,由视频分析模块从视频数据中提取人脸图像信息,并对该人脸图像信息进行分析和检测。
步骤205、基于质检任务,根据质检规则对内容信息进行数据检测,得到与至少一个质检要点对应的质检结果信息。
当录制数据包括音频数据,根据质检规则对内容信息进行数据检测的方式,包括:根据至少一个质检要点中的音频质检要点,对话术内容信息进行数据检测。其中,音频质检要点可以包括话术模板、关键词和敏感词中的至少一种。
第一种情况,当音频质检要点包括话术模板,根据至少一个质检要点中的音频质检要点,对话术内容信息进行数据检测,包括:
将话术内容信息与话术模板进行匹配,确定话术内容信息与话术模板的话术匹配度。
可选的,质检结果信息中包括话术匹配度。
示例的,话术模板包括:“尊敬的xxx,您好,我们现在开始录音录像。我是xx机构的业务员xxx,请您如实填写信息,如您填写的信息有误,会造成xx的后果,您办理的这个业务的理赔项目包括xxx,需要承担一定的责任。”等。在得到话术内容信息后,将话术内容信息与该话术模板进行匹配,以确定话术内容信息与话术模板的话术匹配度,若话术内容信息中包含话术模板中的所有内容,则话术匹配度为100%。
可选的,可以预先设置话术匹配度阈值,当话术匹配度大于或等于该话术匹配度阈值时,确定话术内容信息符合该音频质检要点,当话术匹配度小于该话术匹配度阈值时,确定话术内容信息不符合该音频质检要点。相应的,质检结果信息可以包括话术匹配度是否符合该音频质检要点的结论。
第二种情况,当音频质检要点包括至少一个关键词,根据至少一个质检要点中的音频质检要点,对话术内容信息进行数据检测,包括:
检测话术内容信息中是否包含至少一个关键词;当话术内容信息中包含所有关键词时,确定话术内容信息符合该音频质检要点。
可选的,当话术内容信息中不包含任一关键词时,确定话术内容信息不符合音频质检要点;或者,当话术内容信息中包含的关键词与音频质检要点中关键词的匹配度低于预设的关键词匹配度阈值时,确定话术内容信息不符合音频质检要点。其中,话术内容信息中包含的关键词与音频质检要点中关键词的匹配度是指,话术内容信息中包含的关键词数量与音频质检要点中关键词数量的比值,例如,音频质检要点中的关键词数量为5,话术内容信息中包含的关键词数量为4,则话术内容信息中包含的关键词与音频质检要点中关键词的匹配度为80%。
可选的,质检结果信息中包括话术内容信息是否符合该音频质检要点的结论;进一步的,当话术内容信息中不包含某个关键词时,质检结果信息中还可以包括该关键词的内容。
第三种情况,当音频质检要点包括至少一个敏感词,根据至少一个质检要点中的音频质检要点,对话术内容信息进行数据检测,包括:
检测话术内容信息中是否包含至少一个敏感词;当话术内容信息中不包含任一敏感词时,确定话术内容信息符合该音频质检要点。
可选的,当话术内容信息中包含某一敏感词时,确定话术内容信息不符合音频质检要点。在本发明实施例中,敏感词是指不符合事实的词汇,例如保本等词汇。
可选的,质检结果信息中包括话术内容信息是否符合该音频质检要点的结论;进一步的,当话术内容信息中包含某个敏感词时,质检结果信息还可以包括该敏感词的内容。
当录制数据包括视频数据,根据质检规则对内容信息进行数据检测的方式,包括:根据至少一个质检要点中的视频质检要点,对人脸图像信息进行数据检测。其中,视频质检要点可以包括人脸匹配度和人脸图像信息的出现时间信息中的至少一种。
第一种情况,视频质检要点包括人脸匹配度,业务数据包括客户照片,根据至少一个质检要点中的视频质检要点,对人脸图像信息进行数据检测,包括:
将人脸图像信息与客户照片进行人脸匹配,确定人脸图像信息与客户照片的人脸匹配度。
可选的,质检结果信息中包括人脸匹配度。本发明实施例对人脸匹配度的计算方法不做限定。
可选的,可以预先设置人脸匹配度阈值,当人脸匹配度大于或等于该人脸匹配度阈值时,确定人脸图像信息符合该视频质检要点,当人脸匹配度小于该人脸匹配度阈值时,确定人脸图像信息不符合该视频质检要点。相应的,质检结果信息可以包括人脸匹配度是否符合该视频质检要点的结论。
需要说明的是,通过计算从录制数据中提取出的人脸图像信息与客户照片的人脸匹配度,可以检测录制数据存储系统中该录制数据对应的客户信息是否准确,以实现对录制数据的真实性和准确性的检测。
第二种情况,视频质检要点包括人脸图像信息的出现时间信息,根据至少一个质检要点中的视频质检要点,对人脸图像信息进行数据检测,包括:
确定人脸图像信息在录制数据中的出现时刻和出现时长中的至少一种。
可选的,质检结果信息包括人脸图像信息在录制数据中的出现时刻和出现时长中的至少一种。
可选的,当人脸图像信息在录制数据中的出现时长达到预设时长阈值时,确定人脸图像信息符合该视频质检要点,当人脸图像信息在录制数据中的出现时长未达到预设时长阈值时,确定人脸图像信息不符合该视频质检要点。相应的,质检结果信息可以包括人脸图像信息的出现时间是否符合该视频质检要点的结论。
在本发明实施例中,由于计算机设备无需严格按照帧率对录制数据进行检测,例如视频数据的帧率为35帧/秒(每秒内录制35帧图像),则人工质检的速度为35帧/秒,而计算机设备通过算法对该视频数据进行检测的速度可能能够达到100帧/秒;另外,由于计算机设备能够同时对多份双录数据进行分析和检测,即能够实现多个任务的并发处理,因此与人工质检相比,极大地提高了录制数据的质检效率。
步骤206、显示结果展示页面,该结果展示页面上显示有质检结果信息。
可选的,当计算机设备为具有显示功能的终端时,在计算机设备的显示界面上显示结果展示页面;当计算机设备为服务器或不具有显示功能的终端时,该计算机设备可以通过有线网络或无线网络与某一具有显示功能的终端连接,在该终端的显示界面上显示结果展示页面,以便于质检人员查看质检结果信息。
示例的,图3是本发明实施例提供的一种结果展示页面的显示示意图,如图3所示,假设质检规则包括音频质检要点和视频质检要点,音频质检要点包括话术匹配度、关键词和敏感词,视频质检要点包括人脸匹配度和人脸图像信息的出现时间信息,质检结果信息包括录制数据是否符合各个质检要点的结论,关键词和敏感词的不符合项,话术匹配度,人脸匹配度和人脸图像信息的出现时间信息。其中,关键词的不符合项指话术内容信息中未包含的音频质检要点中的关键词,敏感词的不符合项指话术内容信息中包含的音频质检要点中的敏感词,例如图3中的“保本”,人脸图像信息的出现时间信息“2018.02.06 8:03-9:15”表征该录制数据中人脸图像信息的出现时刻为2018年2月6日8时3分,出现时长为1小时12分,假设预设时长阈值为2小时,则该人脸图像信息的出现时间不符合质检要点。
本发明实施例对质检结果信息的展示方式不做限定,例如可以以如图3所示的表格汇总的方式展示质检结果信息,或者可以以统计图的方式展示质检结果信息等。
需要说明的是,通过显示结果展示页面,能够直观地显示质检结果信息,无需质检人员观看完整的录制数据即可完成对录制数据的质检,降低了全人工质检的人力成本,且能够实现对录制数据的全面质检,解决了相关技术中由于人工质检的工作量繁重,采用抽检的方式导致的质检盲区问题,从而提高了对录制数据的质检可靠性。
需要说明的是,本发明实施例提供的录制数据的数据质检方法步骤的先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本发明的保护范围之内,因此不再赘述。
综上所述,本发明实施例提供的录制数据的数据质检方法,在获取录制数据后,从录制数据中提取内容信息,并根据与录制数据对应的质检规则对该内容信息进行数据检测,以得到与至少一个质检要点对应的质检结果信息。一方面,由于本发明实施例中,数据检测对象是从录制数据中提取出的内容信息,该内容信息的数据量小于录制数据的数据量,因此对该内容信息进行数据检测所耗费的时间少于相关技术中对完整的录制数据进行数据检测所耗费的时间;另一方面,采用计算机设备替代人工质检,计算机设备无需严格按照帧率对录制数据进行检测,且能够同时对多份双录数据进行检测,从而提高了录制数据的质检效率;进一步的,通过显示结果展示页面直观地显示质检结果信息,无需质检人员观看完整的录制数据即可完成对录制数据的质检,降低了全人工质检的人力成本,且能够实现对录制数据的全面质检,解决了相关技术中由于人工质检的工作量繁重,采用抽检的方式导致的质检盲区问题,从而提高了对录制数据的质检可靠性。
图4是本发明实施例提供的一种录制数据的数据质检装置的结构示意图,该录制数据是对向客户提供金融业务服务的过程进行录制得到的多媒体数据,如图4所示,装置40包括:
获取模块401,用于获取录制数据和与录制数据相关联的业务数据。
确定模块402,用于根据业务数据确定录制数据对应的质检规则,质检规则中包括至少一个质检要点。
提取模块403,用于从录制数据中提取内容信息。
数据检测模块404,用于根据质检规则对内容信息进行数据检测,得到与至少一个质检要点对应的质检结果信息。
综上所述,本发明实施例提供的录制数据的数据质检装置,在通过获取模块获取录制数据后,通过提取模块从录制数据中提取内容信息,并通过数据检测模块根据与录制数据对应的质检规则对该内容信息进行数据检测,以得到与至少一个质检要点对应的质检结果信息。一方面,由于本发明实施例中,数据检测对象是从录制数据中提取出的内容信息,该内容信息的数据量小于录制数据的数据量,因此对该内容信息进行数据检测所耗费的时间少于相关技术中对完整的录制数据进行数据检测所耗费的时间;另一方面,采用计算机设备替代人工质检,计算机设备无需严格按照帧率对录制数据进行检测,且能够同时对多份双录数据进行检测,从而提高了录制数据的质检效率。
可选的,录制数据包括音频数据;提取模块,用于:
从录制数据中提取音频数据;
对音频数据进行语音识别和/或语义理解,得到音频数据对应的话术内容信息。
相应的,数据检测模块,用于:
根据至少一个质检要点中的音频质检要点,对话术内容信息进行数据检测。
可选的,音频质检要点包括话术模板,数据检测模块,用于:
将话术内容信息与话术模板进行匹配,确定话术内容信息与话术模板的话术匹配度。
可选的,音频质检要点包括至少一个关键词,数据检测模块,用于:
检测话术内容信息中是否包含至少一个关键词;
当话术内容信息中包含所有关键词时,确定话术内容信息符合音频质检要点。
可选的,音频质检要点包括至少一个敏感词,数据检测模块,用于:
检测话术内容信息中是否包含至少一个敏感词;
当话术内容信息中不包含任一敏感词时,确定话术内容信息符合音频质检要点。
可选的,录制数据包括视频数据;提取模块,用于:
从录制数据中提取视频数据;
对视频数据进行视频结构化分析,得到视频数据中的人脸图像信息。
相应的,数据检测模块,用于:
根据至少一个质检要点中的视频质检要点,对人脸图像信息进行数据检测。
可选的,业务数据包括客户照片,视频质检要点包括人脸匹配度,数据检测模块,用于:
将人脸图像信息与客户照片进行人脸匹配,确定人脸图像信息与客户照片的人脸匹配度。
可选的,视频质检要点包括人脸图像信息的出现时间信息,数据检测模块,用于:
确定人脸图像信息在录制数据中的出现时刻和出现时长中的至少一种。
可选的,确定模块,用于:
根据业务数据中的产品信息,确定录制数据对应的产品类型,产品信息包括产品名称、产品代码和业务单号中的至少一种;
从质检规则库中获取产品类型对应的质检规则,质检规则库中包括不同产品类型对应的不同质检规则。
可选的,如图5所示,装置40还包括:
生成模块405,用于根据录制数据和质检规则生成质检任务。
可选的,如图6所示,装置40还包括:
显示模块406,用于显示结果展示页面,结果展示页面上显示有质检结果信息。
综上所述,本发明实施例提供的录制数据的数据质检装置,在通过获取模块获取录制数据后,通过提取模块从录制数据中提取内容信息,并通过数据检测模块根据与录制数据对应的质检规则对该内容信息进行数据检测,以得到与至少一个质检要点对应的质检结果信息。一方面,由于本发明实施例中,数据检测对象是从录制数据中提取出的内容信息,该内容信息的数据量小于录制数据的数据量,因此对该内容信息进行数据检测所耗费的时间少于相关技术中对完整的录制数据进行数据检测所耗费的时间;另一方面,采用计算机设备替代人工质检,计算机设备无需严格按照帧率对录制数据进行检测,且能够同时对多份双录数据进行检测,从而提高了录制数据的质检效率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种录制数据的数据质检装置,包括处理器和存储器,
其中,
存储器,用于存储计算机程序;
处理器,用于执行存储器上所存放的计算机程序,实现如图1或图2所示的录制数据的数据质检方法。
示例的,图7是本发明实施例提供的一种计算机设备的框图,该计算机设备包括本发明实施例提供的录制数据的数据质检装置。该计算机设备500包括:处理器501、通信接口502、存储器503和通信总线504。
处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信。
存储器503,用于存储计算机程序5031。
处理器501,用于执行存储器503上所存储的计算机程序,实现如图1或图2所示的录制数据的数据质检方法。
存储器503可能包含高速随机存取存储器,也可能包含非不稳定的存储器,例如至少一个磁盘存储器。
本发明实施例提供了一种存储介质,该存储介质内存储有计算机程序,计算机程序被处理器执行时实现如图1或图2所示的录制数据的数据质检方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的可选实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种录制数据的数据质检方法,其特征在于,所述录制数据是对向客户提供金融业务服务的过程进行录制得到的多媒体数据,所述录制数据包括音频数据和视频数据,所述方法包括:
获取所述录制数据和与所述录制数据相关联的业务数据;
根据所述业务数据中的产品信息,确定所述录制数据对应的产品类型;从质检规则库中获取所述产品类型对应的质检规则,所述质检规则中包括至少一个质检要点,所述至少一个质检要点包括音频质检要点和视频质检要点,所述质检规则库中包括不同产品类型对应的不同质检规则;
对所述录制数据进行音视频剥离,剥离出所述视频数据和所述音频数据,从所述音频数据中提取对应的话术内容信息,从所述视频数据中提取对应的人脸图像信息;或者,从所述录制数据中分别提取所述音频数据对应的话术内容信息和所述视频数据对应的人脸图像信息;
根据所述音频质检要点,对所述话术内容信息进行数据检测,得到与所述音频质检要点对应的质检结果信息;
在所述视频质检要点包括人脸匹配度的情况下,将所述人脸图像信息与所述业务数据中的客户照片进行人脸匹配,确定所述人脸图像信息与所述业务数据中的客户照片的人脸匹配度;当所述人脸匹配度大于或等于人脸匹配度阈值时,确定所述人脸图像信息符合所述视频质检要点,当所述人脸匹配度小于所述人脸匹配度阈值时,确定所述人脸图像信息不符合所述视频质检要点,得到包括所述人脸匹配度是否符合所述视频质检要点的质检结果信息;
在所述视频质检要点包括所述人脸图像信息的出现时间信息的情况下,确定所述人脸图像信息在所述录制数据中的出现时长;当所述出现时长达到预设时长阈值时,确定所述人脸图像信息符合所述视频质检要点,当所述出现时长未达到所述预设时长阈值时,确定所述人脸图像信息不符合所述视频质检要点,得到包括所述出现时长是否符合所述视频质检要点的质检结果信息。
2.根据权利要求1所述的方法,其特征在于,所述从所述音频数据中提取对应的话术内容信息,包括:
对所述音频数据进行语音识别和/或语义理解,得到所述音频数据对应的话术内容信息。
3.根据权利要求2所述的方法,其特征在于,所述音频质检要点包括话术模板,所述根据所述音频质检要点,对所述话术内容信息进行数据检测,包括:
将所述话术内容信息与所述话术模板进行匹配,确定所述话术内容信息与所述话术模板的话术匹配度。
4.根据权利要求2所述的方法,其特征在于,所述音频质检要点包括至少一个关键词,所述根据所述音频质检要点,对所述话术内容信息进行数据检测,包括:
检测所述话术内容信息中是否包含所述至少一个关键词;
当所述话术内容信息中包含所有所述关键词时,确定所述话术内容信息符合所述音频质检要点。
5.根据权利要求2所述的方法,其特征在于,所述音频质检要点包括至少一个敏感词,所述根据所述音频质检要点,对所述话术内容信息进行数据检测,包括:
检测所述话术内容信息中是否包含所述至少一个敏感词;
当所述话术内容信息中不包含任一所述敏感词时,确定所述话术内容信息符合所述音频质检要点。
6.根据权利要求1所述的方法,其特征在于,所述从所述视频数据中提取对应的人脸图像信息,包括:
对所述视频数据进行视频结构化分析,得到所述视频数据中的人脸图像信息。
7.根据权利要求1至6任一所述的方法,其特征在于,所述产品信息包括产品名称、产品代码和业务单号中的至少一种。
8.根据权利要求1至6任一所述的方法,其特征在于,所述方法还包括:
显示结果展示页面,所述结果展示页面上显示有所述质检结果信息。
9.一种录制数据的数据质检装置,其特征在于,所述录制数据是对向客户提供金融业务服务的过程进行录制得到的多媒体数据,所述录制数据包括音频数据和视频数据,所述装置包括:
获取模块,用于获取所述录制数据和与所述录制数据相关联的业务数据;
确定模块,用于根据所述业务数据中的产品信息,确定所述录制数据对应的产品类型;从质检规则库中获取所述产品类型对应的质检规则,所述质检规则中包括至少一个质检要点,所述至少一个质检要点包括音频质检要点和视频质检要点,所述质检规则库中包括不同产品类型对应的不同质检规则;
提取模块,用于对所述录制数据进行音视频剥离,剥离出所述视频数据和所述音频数据,从所述音频数据中提取对应的话术内容信息,从所述视频数据中提取对应的人脸图像信息;或者,从所述录制数据中分别提取所述音频数据对应的话术内容信息和所述视频数据对应的人脸图像信息;
数据检测模块,用于根据所述音频质检要点,对所述话术内容信息进行数据检测,得到与所述音频质检要点对应的质检结果信息;在所述视频质检要点包括人脸匹配度的情况下,将所述人脸图像信息与所述业务数据中的客户照片进行人脸匹配,确定所述人脸图像信息与所述业务数据中的客户照片的人脸匹配度;当所述人脸匹配度大于或等于人脸匹配度阈值时,确定所述人脸图像信息符合所述视频质检要点,当所述人脸匹配度小于所述人脸匹配度阈值时,确定所述人脸图像信息不符合所述视频质检要点,得到包括所述人脸匹配度是否符合所述视频质检要点的质检结果信息;在所述视频质检要点包括所述人脸图像信息的出现时间信息的情况下,确定所述人脸图像信息在所述录制数据中的出现时长;当所述出现时长达到预设时长阈值时,确定所述人脸图像信息符合所述视频质检要点,当所述出现时长未达到所述预设时长阈值时,确定所述人脸图像信息不符合所述视频质检要点,得到包括所述出现时长是否符合所述视频质检要点的质检结果信息。
10.一种录制数据的数据质检装置,其特征在于,包括处理器和存储器,
其中,
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器上所存放的计算机程序,实现权利要求1至8任一所述的录制数据的数据质检方法。
11.一种存储介质,其特征在于,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一所述的录制数据的数据质检方法。
CN201810607210.5A 2018-06-13 2018-06-13 录制数据的数据质检方法及装置、存储介质 Active CN110598008B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810607210.5A CN110598008B (zh) 2018-06-13 2018-06-13 录制数据的数据质检方法及装置、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810607210.5A CN110598008B (zh) 2018-06-13 2018-06-13 录制数据的数据质检方法及装置、存储介质

Publications (2)

Publication Number Publication Date
CN110598008A CN110598008A (zh) 2019-12-20
CN110598008B true CN110598008B (zh) 2023-08-18

Family

ID=68849526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810607210.5A Active CN110598008B (zh) 2018-06-13 2018-06-13 录制数据的数据质检方法及装置、存储介质

Country Status (1)

Country Link
CN (1) CN110598008B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111741356B (zh) * 2020-08-25 2020-12-08 腾讯科技(深圳)有限公司 双录视频的质检方法、装置、设备及可读存储介质
CN113206996B (zh) * 2021-04-30 2023-04-07 中国工商银行股份有限公司 一种业务录制数据的质检方法及装置
CN113065879A (zh) * 2021-04-30 2021-07-02 中国工商银行股份有限公司 一种数据流质检方法及系统
CN113435349A (zh) * 2021-06-29 2021-09-24 建信金融科技有限责任公司 视频的质检方法和装置
CN115330359B (zh) * 2022-10-11 2023-01-17 湖北微模式科技发展有限公司 一种实现本地化双录质检稽核服务的方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103309907A (zh) * 2012-03-16 2013-09-18 上海安捷力信息系统有限公司 对不同来源的业务数据进行规范化处理的方法及系统
CN103825744A (zh) * 2014-03-13 2014-05-28 上海市数字证书认证中心有限公司 非现场个人数字证书申请方法及系统
CN105187674A (zh) * 2015-08-14 2015-12-23 上海银天下科技有限公司 服务录音的合规检查方法及装置
CN105701446A (zh) * 2014-12-11 2016-06-22 想象技术有限公司 执行对象检测
CN105975514A (zh) * 2016-04-28 2016-09-28 朱宇光 一种自动质检方法及系统
CN106023038A (zh) * 2016-05-31 2016-10-12 郑慧娟 一种基于官民企直通与便民服务平台系统及其实现方法
CN106530185A (zh) * 2016-11-11 2017-03-22 深圳前海微众银行股份有限公司 基于身份认证的业务办理方法、系统及身份认证平台
CN106610969A (zh) * 2015-10-21 2017-05-03 上海文广互动电视有限公司 基于多模态信息的视频内容审查系统及方法
CN107038582A (zh) * 2017-03-31 2017-08-11 福建升腾资讯有限公司 一种基于理财双录系统上的语音扩展应用方法
CN107093431A (zh) * 2016-02-18 2017-08-25 中国移动通信集团辽宁有限公司 一种对服务质量进行质检的方法及装置
CN107483916A (zh) * 2016-06-08 2017-12-15 北京市第中级人民法院 音视频档案质量检测系统的控制方法
CN108039008A (zh) * 2017-12-29 2018-05-15 英华达(南京)科技有限公司 智能视频监控方法、装置及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10248653B2 (en) * 2014-11-25 2019-04-02 Lionbridge Technologies, Inc. Information technology platform for language translation and task management
WO2017044737A1 (en) * 2015-09-11 2017-03-16 Powerscout, Inc. Spatial modeling and other data analytics enabled energy platform

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103309907A (zh) * 2012-03-16 2013-09-18 上海安捷力信息系统有限公司 对不同来源的业务数据进行规范化处理的方法及系统
CN103825744A (zh) * 2014-03-13 2014-05-28 上海市数字证书认证中心有限公司 非现场个人数字证书申请方法及系统
CN105701446A (zh) * 2014-12-11 2016-06-22 想象技术有限公司 执行对象检测
CN105187674A (zh) * 2015-08-14 2015-12-23 上海银天下科技有限公司 服务录音的合规检查方法及装置
CN106610969A (zh) * 2015-10-21 2017-05-03 上海文广互动电视有限公司 基于多模态信息的视频内容审查系统及方法
CN107093431A (zh) * 2016-02-18 2017-08-25 中国移动通信集团辽宁有限公司 一种对服务质量进行质检的方法及装置
CN105975514A (zh) * 2016-04-28 2016-09-28 朱宇光 一种自动质检方法及系统
CN106023038A (zh) * 2016-05-31 2016-10-12 郑慧娟 一种基于官民企直通与便民服务平台系统及其实现方法
CN107483916A (zh) * 2016-06-08 2017-12-15 北京市第中级人民法院 音视频档案质量检测系统的控制方法
CN106530185A (zh) * 2016-11-11 2017-03-22 深圳前海微众银行股份有限公司 基于身份认证的业务办理方法、系统及身份认证平台
CN107038582A (zh) * 2017-03-31 2017-08-11 福建升腾资讯有限公司 一种基于理财双录系统上的语音扩展应用方法
CN108039008A (zh) * 2017-12-29 2018-05-15 英华达(南京)科技有限公司 智能视频监控方法、装置及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Motion-based countermeasure against photo and video spoofing attacks in face recognition;Taiamiti Edmunds 等;《Journal of Visual Communication and Image Representation》;第50卷;314-332 *

Also Published As

Publication number Publication date
CN110598008A (zh) 2019-12-20

Similar Documents

Publication Publication Date Title
CN110598008B (zh) 录制数据的数据质检方法及装置、存储介质
CN110147726B (zh) 业务质检方法和装置、存储介质及电子装置
CN111741356B (zh) 双录视频的质检方法、装置、设备及可读存储介质
CN111683285B (zh) 文件内容识别方法、装置、计算机设备及存储介质
US11315366B2 (en) Conference recording method and data processing device employing the same
CN109361825A (zh) 会议纪要记录方法、终端及计算机存储介质
CN111597818B (zh) 呼叫质检方法、装置、计算机设备和计算机可读存储介质
CN107590150A (zh) 基于关键帧的视频分析实现方法及装置
CN112348005A (zh) 双录审核方法、装置、客户端设备及存储介质
CN113095202A (zh) 双录数据质检中的数据分段方法及装置
CN113221918A (zh) 目标检测方法、目标检测模型的训练方法及装置
CN113568934B (zh) 一种数据查询方法、装置、电子设备和存储介质
CN111666298A (zh) 基于flink的用户服务类别检测方法、装置、计算机设备
CN113095204B (zh) 双录数据质检方法、装置及系统
CN114722199A (zh) 基于通话录音的风险识别方法、装置、计算机设备及介质
CN113191787A (zh) 电信数据的处理方法、装置电子设备及存储介质
CN112419257A (zh) 文本录制视频清晰度检测方法、装置、计算机设备及存储介质
CN109524009B (zh) 基于语音识别的保单录入方法和相关装置
CN111695357A (zh) 文本标注方法及相关产品
CN109493868B (zh) 基于语音识别的保单录入方法和相关装置
CN113449506A (zh) 一种数据检测方法、装置、设备及可读存储介质
CN113095203A (zh) 双录数据质检中的客户签名检测方法及装置
CN111311197A (zh) 差旅数据处理方法及装置
CN113034337B (zh) 图像检测方法及相关装置
CN117877016A (zh) 视频文本提取方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant