CN112101311A - 基于人工智能的双录质检方法、装置、计算机设备及介质 - Google Patents

基于人工智能的双录质检方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN112101311A
CN112101311A CN202011275395.8A CN202011275395A CN112101311A CN 112101311 A CN112101311 A CN 112101311A CN 202011275395 A CN202011275395 A CN 202011275395A CN 112101311 A CN112101311 A CN 112101311A
Authority
CN
China
Prior art keywords
double
recording
video
detection
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011275395.8A
Other languages
English (en)
Inventor
刘微微
赵之砚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
OneConnect Financial Technology Co Ltd Shanghai
Original Assignee
OneConnect Financial Technology Co Ltd Shanghai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Financial Technology Co Ltd Shanghai filed Critical OneConnect Financial Technology Co Ltd Shanghai
Priority to CN202011275395.8A priority Critical patent/CN112101311A/zh
Publication of CN112101311A publication Critical patent/CN112101311A/zh
Priority to PCT/CN2021/123633 priority patent/WO2022100349A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/57Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Accounting & Taxation (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明涉及人工智能技术领域,提供一种基于人工智能的双录质检方法、装置、计算机设备及介质,包括:根据接收到的双录视频的双录请求配置多个双录环节;启动双录指令录制双录视频,并根据所述多个双录环节将所述双录视频分割为多个双录子视频;根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果;对每个双录子视频进行语音识别得到语音文本,并使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效;当确定每个双录环节均有效且每个双录子视频的多个检测结果均正确时,标记所述双录视频质检通过。本发明能够提高双录质检的效率,且避免双录视频造假。

Description

基于人工智能的双录质检方法、装置、计算机设备及介质
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于人工智能的双录质检方法、装置、计算机设备及介质。
背景技术
随着银保监会对金融行业监督与指导力度的加大,要求对保险销售行为实行现场同步录音录像(简称双录),记录和保存保险产品销售过程中的关键环节,从而为后续重要信息的查询、问题责任的认定提供依据。
发明人在实现本发明的过程中发现,现有的双录系统全程需20分钟左右,后台质检员在检查双录视频是否存在不合规的画面时需从头看到尾,耗费质检时间,导致质检效率较低。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的双录质检方法、装置、计算机设备及介质,能够提高双录质检的效率,且避免双录视频造假。
本发明的第一方面提供一种基于人工智能的双录质检方法,所述方法包括:
接收双录视频的双录请求,并根据所述双录请求配置多个双录环节;
启动双录指令录制双录视频,并根据所述多个双录环节将所述双录视频分割为多个双录子视频;
根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果;
对每个所述双录子视频进行语音识别得到语音文本,并使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效;
当确定每个双录环节均有效且每个双录子视频的多个检测结果均正确时,标记所述双录视频质检通过。
在一个可选的实施例中,所述根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果包括:
根据每个双录子视频的双录时间为每个双录子视频生成检测次数;
根据所述双录时间及所述检测次数计算检测帧率;
使用所述检测帧率从所述双录子视频中提取多个视频帧;
检测每个视频帧中是否存在人脸并识别每个人脸是否有效;
当确定每个视频帧中存在人脸且识别每个人脸有效时,得到第一检测结果;
当确定任意一个视频帧中不存在人脸及/或任意一个人脸无效时,得到第二检测结果。
在一个可选的实施例中,所述根据每个双录子视频的双录时间为每个双录子视频生成检测次数包括:
定义第一检测次数上下限及第二检测次数上下限;
计算每个双录子视频的双录时间与所述双录视频的双录时间的比值;
根据所述双录视频的双录时间与所述双录环节的数量计算得到平均比值;
比较所述比值与所述平均比值;
当所述比值大于或者等于所述平均比值时,在所述第一检测次数上下限对应的数值范围内生成第一随机数,作为所述比值对应的双录子视频的检测次数;
当所述比值小于所述平均比值时,在所述第二检测次数上下限对应的数值范围内生成第二随机数,作为所述比值对应的双录子视频的检测次数。
在一个可选的实施例中,所述识别每个人脸是否有效包括:
确定每个人脸对应的目标双录视频及确定所述目标双录视频对应的目标双录环节;
确定所述目标双录环节对应的双录对象;
获取所述双录对象的证件照;
计算每个人脸与对应的双录对象的证件照之间的相似度;
判断所述相似度是否大于预设相似度阈值;
当确定所述相似度大于所述预设相似度阈值时,确定所述人脸有效;
当确定所述相似度小于或者等于所述预设相似度阈值时,确定所述人脸无效。
在一个可选的实施例中,所述根据所述双录请求配置多个双录环节包括:
解析所述双录请求得到产品类型;
确定所述产品类型对应的多个流程节点;
根据所述多个流程节点为所述双录视频配置多个双录环节。
在一个可选的实施例中,所述使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效包括:
将所述关键词库中的每个关键词与对应的语音文本进行匹配得到匹配结果;
根据所有关键词对应的匹配结果得到所述对应的语音文本是否有效的结果;
根据所述语音文本是否有效的结果及所述双录环节对应的预设要求判断所述双录环节是否有效。
在一个可选的实施例中,所述方法还包括:
确定所述语音文本中检测成功的关键词对应的录制时间点;
在所述双录视频中标识所述录制时间点及所述录制时间点对应的关键词得到质检视频;
接收到质检员根据所述质检视频触发的双录通过的指令时,生成保险保单。
本发明的第二方面提供一种基于人工智能的双录质检装置,所述装置包括:
请求模块,用于接收双录视频的双录请求,并根据所述双录请求配置多个双录环节;
双录模块,用于启动双录指令录制双录视频,并根据所述多个双录环节将所述双录视频分割为多个双录子视频;
检测模块,用于根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果;
识别模块,用于对每个所述双录子视频进行语音识别得到语音文本,并使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效;
标记模块,用于当确定每个双录环节均有效且每个双录子视频的多个检测结果均正确时,标记所述双录视频质检通过。
本发明的第三方面提供一种计算机设备,所述计算机设备包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现所述的基于人工智能的双录质检方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于人工智能的双录质检方法。
综上所述,本发明所述的基于人工智能的双录质检方法、装置、计算机设备及介质,通过双录请求自动配置多个双录环节,在启动双录指令录制双录视频时,根据所述多个双录环节将所述双录视频分割为多个双录子视频,接着根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果,对每个所述双录子视频进行语音识别得到语音文本,并使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效,最后在确定每个双录环节均有效且所述多个监测结果均正确时,标记所述双录视频质检通过。双录质检效率较高,且由于根据每个双录子视频的双录时间进行人脸检测,使得人脸检测随机性加大,能够有效的杜绝保险销售过程的双录视频造假。
附图说明
图1是本发明实施例一提供的基于人工智能的双录质检方法的流程图。
图2是本发明实施例二提供的基于人工智能的双录质检装置的结构图。
图3是本发明实施例三提供的计算机设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明实施例提供的基于人工智能的双录质检方法由计算机设备执行,相应地,基于人工智能的双录质检装置运行于计算机设备中。
图1是本发明实施例一提供的基于人工智能的双录质检方法的流程图。所述基于人工智能的双录质检方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,接收双录视频的双录请求,并根据所述双录请求配置多个双录环节。
保险销售员为用户购买保险类型产品时,可以通过计算机设备中安装的保险类型应用程序触发双录指令生成双录请求,以请求计算机设备录制包括保险销售员及用户在内的双录视频,作为保险销售的证据。
计算机设备在接收到双录请求后,配置多个双录环节,通过所述多个双录环节来录制双录视频。
在一个可选的实施例中,所述根据所述双录请求配置多个双录环节包括:
解析所述双录请求得到产品类型;
确定所述产品类型对应的多个流程节点;
根据所述多个流程节点为所述双录视频配置多个双录环节。
由于保险销售员通过计算机设备中安装的保险类型应用程序发送的双录请求,因此双录请求中携带有保险类型应用程序的应用名。计算机设备接收到双录请求,对双录请求进行解析,得到应用程序的应用名及产品类型,从而根据本地存储的产品类型与流程节点数据库表确定出所销售的保险产品的产品类型对应的多个流程节点。
所述产品类型与流程节点数据库表中记录有不同的产品类型及每个产品类型对应的多个流程节点。示例性的,假设产品类型为银行保障保险产品,对应的流程节点为3个,其中,第一流程节点为保险销售员的产品介绍,第二流程节点为用户根据预设的智能问答进行的回答,第三流程节点为用户的电子签名。计算机设备根据第一流程节点配置的第一双录环节为录制保险销售员的产品介绍的双录视频,计算机设备根据第二流程节点配置的第二双录环节为录制用户根据预设的智能问答进行的回答的双录视频,计算机设备根据第三流程节点配置的第三双录环节为录制用户的电子签名的双录视频。
计算机设备通过解析双录请求为双录视频配置多个双录环节,实现了双录环节自动化配置的过程,双录环节的配置效率高。
S12,启动双录指令录制双录视频,并根据所述多个双录环节将所述双录视频分割为多个双录子视频。
计算机设备完成双录视频的双录环节的配置过程之后,在计算机设备上显示双录界面,所述双录界面上设置有双录虚拟图标,保险销售员可以通过点击或者触摸双录虚拟图标来启动双录指令录制双录视频。
计算机设备在录制双录视频的过程中,会记录双录视频的录制时间形成录制时间戳。所述录制时间戳记录了每个双录环节的开始时间节点及结束时间节点,根据每个双录环节的开始时间节点及结束时间节点对所述双录视频进行分割得到多个双录子视频,并将每个双录子视频与对应的双录环节进行关联。
S13,根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果。
双录视频包括了保险销售员及购买保险的用户的录音及录像,计算机设备可以使用预先训练好的人脸检测模型对每个双录子视频中的录像进行检测处理,得到人脸检测结果。
在一个可选的实施例中,所述根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果包括:
根据每个双录子视频的双录时间为每个双录子视频生成检测次数;
根据所述双录时间及所述检测次数计算检测帧率;
使用所述检测帧率从所述双录子视频中提取多个视频帧;
检测每个视频帧中是否存在人脸并识别每个人脸是否有效;
当确定每个视频帧中存在人脸且识别每个人脸有效时,得到第一检测结果;
当确定任意一个视频帧中不存在人脸及/或任意一个人脸无效时,得到第二检测结果。
该可选的实施例中,计算机设备根据每个双录子视频对应的双录环节的开始时间节点及结束时间节点计算每个双录视频的双录时间。
为了避免保险销售过程数据造假,计算机设备根据每个双录子视频的双录时间生成检测次数,从而根据检测次数确定如何从双录子视频中提取视频帧来进行人脸检测。根据双录时间能够为不同的双录子视频生成不同的检测次数,使得提取出的视频帧具有较大的随机性,从而使得对视频帧进行人脸检测也具有较大的随机性,能够有效的确保人脸检测的真实可靠。
计算机设备计算双录时间与检测次数之间的商即可得到检测帧率,例如,双录时间为5分钟,检测次数为10,则检测帧率为5分/10=30秒,即,每30秒从双录子视频中提取出一个视频帧。
计算机设备检测每个视频帧是否存在人脸,如果检测存在人脸,则进一步识别所述人脸是否有效,并根据每个视频帧中是否存在人脸及识别出的每个人脸是否有效得到不同的检测结果。所述第一检测结果用以表示双录子视频中的录像是有效的,所述第二检测结果用以表示双录子视频中的录像是无效的。
在一个可选的实施例中,所述根据每个双录子视频的双录时间为每个双录子视频生成检测次数包括:
定义第一检测次数上下限及第二检测次数上下限;
计算每个双录子视频的双录时间与所述双录视频的双录时间的比值;
根据所述双录视频的双录时间与所述双录环节的数量计算得到平均比值;
比较所述比值与所述平均比值;
当所述比值大于或者等于所述平均比值时,在所述第一检测次数上下限对应的数值范围内生成第一随机数,作为所述比值对应的双录子视频的检测次数;
当所述比值小于所述平均比值时,在所述第二检测次数上下限对应的数值范围内生成第二随机数,作为所述比值对应的双录子视频的检测次数。
其中,所述第一检测次数上下限为[x1,x2],所述第二检测次数上下限为[x3,x4],第一检测次数下限大于所述第二检测次数上限,即第二检测次数下限x3<第二检测次数上限x4<第一检测次数下限x1<第一检测次数上限x2。
示例性,假设有3个双录子视频,第一个双录子视频的双录时间为T1,第二个双录子视频的双录时间为T2,第三个双录子视频的双录时间为T3,则计算第一个双录子视频的双录时间T1与所述双录视频的双录时间(T1+T2+T3)的比值为B1=T1/(T1+T2+T3),计算第二个双录子视频的双录时间T2与所述双录视频的双录时间(T1+T2+T3)的比值为B2=T2/(T1+T2+T3),计算第三个双录子视频的双录时间T3与所述双录视频的双录时间(T1+T2+T3)的比值为B3=T3/(T1+T2+T3),根据所述双录视频的双录时间与所述双录环节的数量计算得到的平均比值为(T1+T2+T3)/3。
当某一个双录子视频对应的比值大于或者等于所述平均比值,表明该双录子视频相对而言属于较长的双录视频,因此可以提取出较多的视频帧;当某一个双录子视频对应的比值小于所述平均比值,表明该双录子视频相对而言属于较短的双录视频,因此可以提取出较少的视频帧。
该可选的实施例,通过在所述第一检测次数上下限对应的数值范围内生成第一随机数,能够使得生成的第一随机数较大,从而将所述第一随机数作为所述比值对应的双录子视频的检测次数时,能够提取出较多的视频帧,而通过在所述第二检测次数上下限对应的数值范围内生成第二随机数,能够使得生成的第二随机数较小,从而将所述第二随机数作为所述比值对应的双录子视频的检测次数时,能够提取出较少的视频帧。如此,能够自动的确定提取出的视频帧的数量,视频帧的提取效率较高。
在一个可选的实施例中,所述识别每个人脸是否有效包括:
确定每个人脸对应的目标双录视频及确定所述目标双录视频对应的目标双录环节;
确定所述目标双录环节对应的双录对象;
获取所述双录对象的证件照;
计算每个人脸与对应的双录对象的证件照之间的相似度;
判断所述相似度是否大于预设相似度阈值;
当确定所述相似度大于所述预设相似度阈值时,确定所述人脸有效;
当确定所述相似度小于或者等于所述预设相似度阈值时,确定所述人脸无效。
由于在保险销售的双录过程中,不同的双录环节对应不同的双录对象,因此计算机设备需要确定每个人脸对应的双录环节,从而确定双录环节对应的双录对象,根据双录对象识别所述人脸是否有效。示例性的,第一双录环节对应的双录对象为保险销售员,第二双录环节对应的双录对象为用户,第三双录环节对应的双录对象为用户。
所述证件照可以包括:身份证,驾驶证,护照等。人脸与对应的双录对象的证件照之间的相似度越大,表明人脸属于对应的双录对象的可能性就越大,人脸就有效;人脸与对应的双录对象的证件照之间的相似度越小,表明人脸属于对应的双录对象的可能性就越小,人脸就无效。
计算机设备在计算每个人脸与对应的双录对象的证件照之间的相似度之前,可以先对人脸图像与证件照进行预处理。所述预处理可以包括以下中的一种或多种:对准操作、光线补偿操作、图像灰度变换操作、直方图均衡化操作、归一化操作、中值滤波操作以及图像锐化等操作。对人脸图像与证件照进行预处理后,能够更加精确地计算相似度,从而提高检测人脸是否有效的准确率。
S14,对每个所述双录子视频进行语音识别得到语音文本,并使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效。
计算机设备可以使用预先训练好的隐马尔科夫HMM模型对每个双录子视频中的录音进行识别处理,得到语音文本;也可以使用语音识别技术对每个双录子视频中的录音进行识别处理,得到语音文本。
计算机设备中预先存储有不同的关键词库,不同的关键词库对应不同的双录环节。
相较于使用一个关键词库而言,本实施例使用不同的双录环节对应的关键词库来对对应双录环节的语音文本进行双录检测,双录环节对应的关键词库数据量较少,能够提高双录检测的检测效率;此外,为不同的双录环节建立不同的关键词库,使得关键词库中的关键词更具针对性,更符合双录环节,因此,通过双录环节对应的关键词来对语音文本进行双录检测,能够提高双录检测的检测质量。
在一个可选的实施例中,所述使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效包括:
将所述关键词库中的每个关键词与对应的语音文本进行匹配得到匹配结果;
根据所有关键词对应的匹配结果得到所述对应的语音文本是否有效的结果;
根据所述语音文本是否有效的结果及所述双录环节对应的预设要求判断所述双录环节是否有效。
示例性的,第一双录环节对应第一关键词库,所述第一关键词库中记录有多个第一关键词,例如,百分百保本,稳赚不赔,全部能报销等。第二双录环节对应第二关键词库,所述第二关键词库中记录有多个第二关键词,例如,同意,了解,确认,正确等。
计算机设备可以使用结巴分词工具对语音文本进行分词处理得到多个分词,然后将关键词库中的每一个关键词与对应的多个分词进行一一匹配,当从多个分词中匹配出了与所有关键词相同的目标分词时,说明语音文本中包括了对应的关键词库中的所有关键词,当从多个分词中未匹配出与所有关键词相同的目标分词时,说明语音文本中未包括对应的关键词库中的所有关键词。
对于第一双录环节,由于所述第一双录环节是为了确定保险销售员在保险销售过程中是否存在违规行为,那么,当所述第一双录环节对应的第一关键词库中的每个第一关键词与对应的语音文本不均匹配成功,则得到所述语音文本有效的结果及第一双录环节检测失败的结果;当所述第一双录环节对应的第一关键词库中的每个第一关键词与对应的语音文本均不匹配成功,则得到所述语音文本无效的结果及第一双录环节检测成功的结果。
对于第二双录环节,由于所述第二双录环节是为了确定用户在购买保险过程中是否清楚风险及是否真实自愿,那么,当所述第二双录环节对应的第二关键词库中的每个第二关键词与对应的语音文本均匹配成功,则得到所述语音文本有效的结果及第一双录环节检测成功的结果;当所述第二双录环节对应的第二关键词库中的每个第二关键词与对应的语音文本不均匹配成功,则得到所述语音文本无效的结果及第一双录环节检测失败的结果。
S15,当确定每个双录环节均有效且每个双录子视频的多个检测结果均正确时,标记所述双录视频质检通过。
计算机设备在确定所有双录环节对应的语音文本双录检测成功且每个双录环节对应的多个监测结果均正确时,确定保险销售流程合规,则显示电子签名界面。侦测到电子签名界面上接收到了电子签名后,结束双录并上传双录视频。
在一个可选的实施例中,所述方法还包括:
确定所述语音文本中检测成功的关键词对应的录制时间点;
在所述双录视频中标识所述录制时间点及所述录制时间点对应的关键词得到质检视频;
接收到质检员根据所述质检视频触发的双录通过的指令时,生成保险保单。
计算机设备在标记所述双录视频质检通过之后,确定所述语音文本中检测成功的关键词对应的录制时间点,并在所述双录视频中标识所述录制时间点及所述录制时间点对应的关键词,得到质检视频并上传质检视频供质检员进行人工质检。
该可选的实施例中,由于质检视频中标识有关键词及关键词对应的录制时间点,能够使得质检员在观看质检视频时快速定位出是否存在问题点,从而节省大量的人工审核时间,提升效率。
综上,本发明提供的方法,通过双录请求自动配置多个双录环节,在启动双录指令录制双录视频时,根据所述多个双录环节将所述双录视频分割为多个双录子视频,接着根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果,对每个所述双录子视频进行语音识别得到语音文本,并使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效,最后在确定每个双录环节均有效且所述多个监测结果均正确时,标记所述双录视频质检通过。双录质检效率较高,且由于根据每个双录子视频的双录时间进行人脸检测,使得人脸检测随机性加大,能够有效的杜绝保险销售过程的双录视频造假。
需要强调的是,为进一步保证上述质检通过的双录视频的私密性和安全性,上述质检通过的双录视频可存储于区块链的节点中。
图2是本发明实施例二提供的基于人工智能的双录质检装置的结构图。
在一些实施例中,所述基于人工智能的双录质检装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的双录质检装置20中的各个程序段的计算机程序可以存储于计算机设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)基于人工智能的双录质检的功能。
本实施例中,所述基于人工智能的双录质检装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:请求模块201、双录模块202、检测模块203、识别模块204、标记模块205及生成模块206。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述请求模块201,用于接收双录视频的双录请求,并根据所述双录请求配置多个双录环节。
保险销售员为用户购买保险类型产品时,可以通过计算机设备中安装的保险类型应用程序触发双录指令生成双录请求,以请求计算机设备录制包括保险销售员及用户在内的双录视频,作为保险销售的证据。
计算机设备在接收到双录请求后,配置多个双录环节,通过所述多个双录环节来录制双录视频。
在一个可选的实施例中,所述请求模块201根据所述双录请求配置多个双录环节包括:
解析所述双录请求得到产品类型;
确定所述产品类型对应的多个流程节点;
根据所述多个流程节点为所述双录视频配置多个双录环节。
由于保险销售员通过计算机设备中安装的保险类型应用程序发送的双录请求,因此双录请求中携带有保险类型应用程序的应用名。计算机设备接收到双录请求,对双录请求进行解析,得到应用程序的应用名及产品类型,从而根据本地存储的产品类型与流程节点数据库表确定出所销售的保险产品的产品类型对应的多个流程节点。
所述产品类型与流程节点数据库表中记录有不同的产品类型及每个产品类型对应的多个流程节点。示例性的,假设产品类型为银行保障保险产品,对应的流程节点为3个,其中,第一流程节点为保险销售员的产品介绍,第二流程节点为用户根据预设的智能问答进行的回答,第三流程节点为用户的电子签名。计算机设备根据第一流程节点配置的第一双录环节为录制保险销售员的产品介绍的双录视频,计算机设备根据第二流程节点配置的第二双录环节为录制用户根据预设的智能问答进行的回答的双录视频,计算机设备根据第三流程节点配置的第三双录环节为录制用户的电子签名的双录视频。
计算机设备通过解析双录请求为双录视频配置多个双录环节,实现了双录环节自动化配置的过程,双录环节的配置效率高。
所述双录模块202,用于启动双录指令录制双录视频,并根据所述多个双录环节将所述双录视频分割为多个双录子视频。
计算机设备完成双录视频的双录环节的配置过程之后,在计算机设备上显示双录界面,所述双录界面上设置有双录虚拟图标,保险销售员可以通过点击或者触摸双录虚拟图标来启动双录指令录制双录视频。
计算机设备在录制双录视频的过程中,会记录双录视频的录制时间形成录制时间戳。所述录制时间戳记录了每个双录环节的开始时间节点及结束时间节点,根据每个双录环节的开始时间节点及结束时间节点对所述双录视频进行分割得到多个双录子视频,并将每个双录子视频与对应的双录环节进行关联。
所述检测模块203,用于根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果。
双录视频包括了保险销售员及购买保险的用户的录音及录像,计算机设备可以使用预先训练好的人脸检测模型对每个双录子视频中的录像进行检测处理,得到人脸检测结果。
在一个可选的实施例中,所述检测模块203根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果包括:
根据每个双录子视频的双录时间为每个双录子视频生成检测次数;
根据所述双录时间及所述检测次数计算检测帧率;
使用所述检测帧率从所述双录子视频中提取多个视频帧;
检测每个视频帧中是否存在人脸并识别每个人脸是否有效;
当确定每个视频帧中存在人脸且识别每个人脸有效时,得到第一检测结果;
当确定任意一个视频帧中不存在人脸及/或任意一个人脸无效时,得到第二检测结果。
该可选的实施例中,计算机设备根据每个双录子视频对应的双录环节的开始时间节点及结束时间节点计算每个双录视频的双录时间。
为了避免保险销售过程数据造假,计算机设备根据每个双录子视频的双录时间生成检测次数,从而根据检测次数确定如何从双录子视频中提取视频帧来进行人脸检测。根据双录时间能够为不同的双录子视频生成不同的检测次数,使得提取出的视频帧具有较大的随机性,从而使得对视频帧进行人脸检测也具有较大的随机性,能够有效的确保人脸检测的真实可靠。
计算机设备计算双录时间与检测次数之间的商即可得到检测帧率,例如,双录时间为5分钟,检测次数为10,则检测帧率为5分/10=30秒,即,每30秒从双录子视频中提取出一个视频帧。
计算机设备检测每个视频帧是否存在人脸,如果检测存在人脸,则进一步识别所述人脸是否有效,并根据每个视频帧中是否存在人脸及识别出的每个人脸是否有效得到不同的检测结果。所述第一检测结果用以表示双录子视频中的录像是有效的,所述第二检测结果用以表示双录子视频中的录像是无效的。
在一个可选的实施例中,所述根据每个双录子视频的双录时间为每个双录子视频生成检测次数包括:
定义第一检测次数上下限及第二检测次数上下限;
计算每个双录子视频的双录时间与所述双录视频的双录时间的比值;
根据所述双录视频的双录时间与所述双录环节的数量计算得到平均比值;
比较所述比值与所述平均比值;
当所述比值大于或者等于所述平均比值时,在所述第一检测次数上下限对应的数值范围内生成第一随机数,作为所述比值对应的双录子视频的检测次数;
当所述比值小于所述平均比值时,在所述第二检测次数上下限对应的数值范围内生成第二随机数,作为所述比值对应的双录子视频的检测次数。
其中,所述第一检测次数上下限为[x1,x2],所述第二检测次数上下限为[x3,x4],第一检测次数下限大于所述第二检测次数上限,即第二检测次数下限x3<第二检测次数上限x4<第一检测次数下限x1<第一检测次数上限x2。
示例性,假设有3个双录子视频,第一个双录子视频的双录时间为T1,第二个双录子视频的双录时间为T2,第三个双录子视频的双录时间为T3,则计算第一个双录子视频的双录时间T1与所述双录视频的双录时间(T1+T2+T3)的比值为B1=T1/(T1+T2+T3),计算第二个双录子视频的双录时间T2与所述双录视频的双录时间(T1+T2+T3)的比值为B2=T2/(T1+T2+T3),计算第三个双录子视频的双录时间T3与所述双录视频的双录时间(T1+T2+T3)的比值为B3=T3/(T1+T2+T3),根据所述双录视频的双录时间与所述双录环节的数量计算得到的平均比值为(T1+T2+T3)/3。
当某一个双录子视频对应的比值大于或者等于所述平均比值,表明该双录子视频相对而言属于较长的双录视频,因此可以提取出较多的视频帧;当某一个双录子视频对应的比值小于所述平均比值,表明该双录子视频相对而言属于较短的双录视频,因此可以提取出较少的视频帧。
该可选的实施例,通过在所述第一检测次数上下限对应的数值范围内生成第一随机数,能够使得生成的第一随机数较大,从而将所述第一随机数作为所述比值对应的双录子视频的检测次数时,能够提取出较多的视频帧,而通过在所述第二检测次数上下限对应的数值范围内生成第二随机数,能够使得生成的第二随机数较小,从而将所述第二随机数作为所述比值对应的双录子视频的检测次数时,能够提取出较少的视频帧。如此,能够自动的确定提取出的视频帧的数量,视频帧的提取效率较高。
在一个可选的实施例中,所述识别每个人脸是否有效包括:
确定每个人脸对应的目标双录视频及确定所述目标双录视频对应的目标双录环节;
确定所述目标双录环节对应的双录对象;
获取所述双录对象的证件照;
计算每个人脸与对应的双录对象的证件照之间的相似度;
判断所述相似度是否大于预设相似度阈值;
当确定所述相似度大于所述预设相似度阈值时,确定所述人脸有效;
当确定所述相似度小于或者等于所述预设相似度阈值时,确定所述人脸无效。
由于在保险销售的双录过程中,不同的双录环节对应不同的双录对象,因此计算机设备需要确定每个人脸对应的双录环节,从而确定双录环节对应的双录对象,根据双录对象识别所述人脸是否有效。示例性的,第一双录环节对应的双录对象为保险销售员,第二双录环节对应的双录对象为用户,第三双录环节对应的双录对象为用户。
所述证件照可以包括:身份证,驾驶证,护照等。人脸与对应的双录对象的证件照之间的相似度越大,表明人脸属于对应的双录对象的可能性就越大,人脸就有效;人脸与对应的双录对象的证件照之间的相似度越小,表明人脸属于对应的双录对象的可能性就越小,人脸就无效。
计算机设备在计算每个人脸与对应的双录对象的证件照之间的相似度之前,可以先对人脸图像与证件照进行预处理。所述预处理可以包括以下中的一种或多种:对准操作、光线补偿操作、图像灰度变换操作、直方图均衡化操作、归一化操作、中值滤波操作以及图像锐化等操作。对人脸图像与证件照进行预处理后,能够更加精确地计算相似度,从而提高检测人脸是否有效的准确率。
所述识别模块204,用于对每个所述双录子视频进行语音识别得到语音文本,并使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效。
计算机设备可以使用预先训练好的隐马尔科夫HMM模型对每个双录子视频中的录音进行识别处理,得到语音文本;也可以使用语音识别技术对每个双录子视频中的录音进行识别处理,得到语音文本。
计算机设备中预先存储有不同的关键词库,不同的关键词库对应不同的双录环节。
相较于使用一个关键词库而言,本实施例使用不同的双录环节对应的关键词库来对对应双录环节的语音文本进行双录检测,双录环节对应的关键词库数据量较少,能够提高双录检测的检测效率;此外,为不同的双录环节建立不同的关键词库,使得关键词库中的关键词更具针对性,更符合双录环节,因此,通过双录环节对应的关键词来对语音文本进行双录检测,能够提高双录检测的检测质量。
在一个可选的实施例中,所述识别模块204使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效包括:
将所述关键词库中的每个关键词与对应的语音文本进行匹配得到匹配结果;
根据所有关键词对应的匹配结果得到所述对应的语音文本是否有效的结果;
根据所述语音文本是否有效的结果及所述双录环节对应的预设要求判断所述双录环节是否有效。
示例性的,第一双录环节对应第一关键词库,所述第一关键词库中记录有多个第一关键词,例如,百分百保本,稳赚不赔,全部能报销等。第二双录环节对应第二关键词库,所述第二关键词库中记录有多个第二关键词,例如,同意,了解,确认,正确等。
计算机设备可以使用结巴分词工具对语音文本进行分词处理得到多个分词,然后将关键词库中的每一个关键词与对应的多个分词进行一一匹配,当从多个分词中匹配出了与所有关键词相同的目标分词时,说明语音文本中包括了对应的关键词库中的所有关键词,当从多个分词中未匹配出与所有关键词相同的目标分词时,说明语音文本中未包括对应的关键词库中的所有关键词。
对于第一双录环节,由于所述第一双录环节是为了确定保险销售员在保险销售过程中是否存在违规行为,那么,当所述第一双录环节对应的第一关键词库中的每个第一关键词与对应的语音文本不均匹配成功,则得到所述语音文本有效的结果及第一双录环节检测失败的结果;当所述第一双录环节对应的第一关键词库中的每个第一关键词与对应的语音文本均不匹配成功,则得到所述语音文本无效的结果及第一双录环节检测成功的结果。
对于第二双录环节,由于所述第二双录环节是为了确定用户在购买保险过程中是否清楚风险及是否真实自愿,那么,当所述第二双录环节对应的第二关键词库中的每个第二关键词与对应的语音文本均匹配成功,则得到所述语音文本有效的结果及第一双录环节检测成功的结果;当所述第二双录环节对应的第二关键词库中的每个第二关键词与对应的语音文本不均匹配成功,则得到所述语音文本无效的结果及第一双录环节检测失败的结果。
所述标记模块205,用于当确定每个双录环节均有效且每个双录子视频的多个检测结果均正确时,标记所述双录视频质检通过。
计算机设备在确定所有双录环节对应的语音文本双录检测成功且每个双录环节对应的多个监测结果均正确时,确定保险销售流程合规,则显示电子签名界面。侦测到电子签名界面上接收到了电子签名后,结束双录并上传双录视频。
所述生成模块206,用于确定所述语音文本中检测成功的关键词对应的录制时间点;在所述双录视频中标识所述录制时间点及所述录制时间点对应的关键词得到质检视频;接收到质检员根据所述质检视频触发的双录通过的指令时,生成保险保单。
计算机设备在标记所述双录视频质检通过之后,确定所述语音文本中检测成功的关键词对应的录制时间点,并在所述双录视频中标识所述录制时间点及所述录制时间点对应的关键词,得到质检视频并上传质检视频供质检员进行人工质检。
该可选的实施例中,由于质检视频中标识有关键词及关键词对应的录制时间点,能够使得质检员在观看质检视频时快速定位出是否存在问题点,从而节省大量的人工审核时间,提升效率。
综上,本发明提供的装置,通过双录请求自动配置多个双录环节,在启动双录指令录制双录视频时,根据所述多个双录环节将所述双录视频分割为多个双录子视频,接着根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果,对每个所述双录子视频进行语音识别得到语音文本,并使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效,最后在确定每个双录环节均有效且所述多个监测结果均正确时,标记所述双录视频质检通过。双录质检效率较高,且由于根据每个双录子视频的双录时间进行人脸检测,使得人脸检测随机性加大,能够有效的杜绝保险销售过程的双录视频造假。
需要强调的是,为进一步保证上述质检通过的双录视频的私密性和安全性,上述质检通过的双录视频可存储于区块链的节点中。
参阅图3所示,为本发明实施例三提供的计算机设备的结构示意图。在本发明较佳实施例中,所述计算机设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图3示出的计算机设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述计算机设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述计算机设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述计算机设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述计算机设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的双录质检方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器32是所述计算机设备3的控制核心(Control Unit),利用各种接口和线路连接整个计算机设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行计算机设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的基于人工智能的双录质检方法的全部或者部分步骤;或者实现基于人工智能的双录质检装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(CentralProcessing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述计算机设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。装置实施例中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种基于人工智能的双录质检方法,其特征在于,所述方法包括:
接收双录视频的双录请求,并根据所述双录请求配置多个双录环节;
启动双录指令录制双录视频,并根据所述多个双录环节将所述双录视频分割为多个双录子视频;
根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果;
对每个所述双录子视频进行语音识别得到语音文本,并使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效;
当确定每个双录环节均有效且每个双录子视频的多个检测结果均正确时,标记所述双录视频质检通过。
2.如权利要求1所述的基于人工智能的双录质检方法,其特征在于,所述根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果包括:
根据每个双录子视频的双录时间为每个双录子视频生成检测次数;
根据所述双录时间及所述检测次数计算检测帧率;
使用所述检测帧率从所述双录子视频中提取多个视频帧;
检测每个视频帧中是否存在人脸并识别每个人脸是否有效;
当确定每个视频帧中存在人脸且识别每个人脸有效时,得到第一检测结果;
当确定任意一个视频帧中不存在人脸及/或任意一个人脸无效时,得到第二检测结果。
3.如权利要求2所述的基于人工智能的双录质检方法,其特征在于,所述根据每个双录子视频的双录时间为每个双录子视频生成检测次数包括:
定义第一检测次数上下限及第二检测次数上下限;
计算每个双录子视频的双录时间与所述双录视频的双录时间的比值;
根据所述双录视频的双录时间与所述双录环节的数量计算得到平均比值;
比较所述比值与所述平均比值;
当所述比值大于或者等于所述平均比值时,在所述第一检测次数上下限对应的数值范围内生成第一随机数,作为所述比值对应的双录子视频的检测次数;
当所述比值小于所述平均比值时,在所述第二检测次数上下限对应的数值范围内生成第二随机数,作为所述比值对应的双录子视频的检测次数。
4.如权利要求2所述的基于人工智能的双录质检方法,其特征在于,所述识别每个人脸是否有效包括:
确定每个人脸对应的目标双录视频及确定所述目标双录视频对应的目标双录环节;
确定所述目标双录环节对应的双录对象;
获取所述双录对象的证件照;
计算每个人脸与对应的双录对象的证件照之间的相似度;
判断所述相似度是否大于预设相似度阈值;
当确定所述相似度大于所述预设相似度阈值时,确定所述人脸有效;
当确定所述相似度小于或者等于所述预设相似度阈值时,确定所述人脸无效。
5.如权利要求1至4中任意一项所述的基于人工智能的双录质检方法,其特征在于,所述根据所述双录请求配置多个双录环节包括:
解析所述双录请求得到产品类型;
确定所述产品类型对应的多个流程节点;
根据所述多个流程节点为所述双录视频配置多个双录环节。
6.如权利要求5所述的基于人工智能的双录质检方法,其特征在于,所述使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效包括:
将所述关键词库中的每个关键词与对应的语音文本进行匹配得到匹配结果;
根据所有关键词对应的匹配结果得到所述对应的语音文本是否有效的结果;
根据所述语音文本是否有效的结果及所述双录环节对应的预设要求判断所述双录环节是否有效。
7.如权利要求6所述的基于人工智能的双录质检方法,其特征在于,所述方法还包括:
确定所述语音文本中检测成功的关键词对应的录制时间点;
在所述双录视频中标识所述录制时间点及所述录制时间点对应的关键词得到质检视频;
接收到质检员根据所述质检视频触发的双录通过的指令时,生成保险保单。
8.一种基于人工智能的双录质检装置,其特征在于,所述装置包括:
请求模块,用于接收双录视频的双录请求,并根据所述双录请求配置多个双录环节;
双录模块,用于启动双录指令录制双录视频,并根据所述多个双录环节将所述双录视频分割为多个双录子视频;
检测模块,用于根据每个双录子视频的双录时间按照预设规则进行多次人脸检测得到多个检测结果;
识别模块,用于对每个所述双录子视频进行语音识别得到语音文本,并使用每个双录环节对应的关键词库对所述双录环节对应的语音文本进行检测,根据所述检测得到的结果判断所述双录环节是否有效;
标记模块,用于当确定每个双录环节均有效且每个双录子视频的多个检测结果均正确时,标记所述双录视频质检通过。
9.一种计算机设备,其特征在于,所述计算机设备包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7中任意一项所述的基于人工智能的双录质检方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于人工智能的双录质检方法。
CN202011275395.8A 2020-11-16 2020-11-16 基于人工智能的双录质检方法、装置、计算机设备及介质 Pending CN112101311A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011275395.8A CN112101311A (zh) 2020-11-16 2020-11-16 基于人工智能的双录质检方法、装置、计算机设备及介质
PCT/CN2021/123633 WO2022100349A1 (zh) 2020-11-16 2021-10-13 基于人工智能的双录质检方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011275395.8A CN112101311A (zh) 2020-11-16 2020-11-16 基于人工智能的双录质检方法、装置、计算机设备及介质

Publications (1)

Publication Number Publication Date
CN112101311A true CN112101311A (zh) 2020-12-18

Family

ID=73784602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011275395.8A Pending CN112101311A (zh) 2020-11-16 2020-11-16 基于人工智能的双录质检方法、装置、计算机设备及介质

Country Status (2)

Country Link
CN (1) CN112101311A (zh)
WO (1) WO2022100349A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289321A (zh) * 2020-12-29 2021-01-29 平安科技(深圳)有限公司 讲解同步的视频高光处理方法、装置、计算机设备及介质
CN112351337A (zh) * 2021-01-04 2021-02-09 腾讯科技(深圳)有限公司 视频质检方法、装置、计算机设备和存储介质
CN113206996A (zh) * 2021-04-30 2021-08-03 中国工商银行股份有限公司 一种业务录制数据的质检方法及装置
CN113435349A (zh) * 2021-06-29 2021-09-24 建信金融科技有限责任公司 视频的质检方法和装置
CN113485668A (zh) * 2021-05-17 2021-10-08 广州佰锐网络科技有限公司 一种智能开户方法及系统
CN114493902A (zh) * 2022-02-15 2022-05-13 中国平安人寿保险股份有限公司 多模态信息异常监控方法、装置、计算机设备及存储介质
WO2022100349A1 (zh) * 2020-11-16 2022-05-19 深圳壹账通智能科技有限公司 基于人工智能的双录质检方法、装置、计算机设备及介质
CN118377812A (zh) * 2024-06-25 2024-07-23 宁波菊风系统软件有限公司 一种双录音视频文件质检方法及计算机可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115132179B (zh) * 2022-06-30 2024-08-27 中国建设银行股份有限公司 一种基于结构化模板的自动保险双录播报方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140232905A1 (en) * 2013-02-21 2014-08-21 Samsung Electronics Co., Ltd. Method for dual recording shooting and electronic device thereof
CN107610718A (zh) * 2017-08-29 2018-01-19 深圳市买买提乐购金融服务有限公司 一种对语音文件内容进行标记的方法及装置
CN109241334A (zh) * 2018-08-15 2019-01-18 平安科技(深圳)有限公司 音频关键字质检方法、装置、计算机设备及存储介质
CN109711996A (zh) * 2018-08-17 2019-05-03 深圳壹账通智能科技有限公司 保单双录文件质检方法、装置、设备及可读存储介质
CN109711655A (zh) * 2018-08-17 2019-05-03 深圳壹账通智能科技有限公司 双录质检方法、装置、设备及计算机可读存储介质
CN109729383A (zh) * 2019-01-04 2019-05-07 深圳壹账通智能科技有限公司 双录视频质量检测方法、装置、计算机设备和存储介质
CN110147926A (zh) * 2019-04-12 2019-08-20 深圳壹账通智能科技有限公司 一种业务类型的风险等级计算方法、存储介质及终端设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190138795A1 (en) * 2017-11-07 2019-05-09 Ooma, Inc. Automatic Object Detection and Recognition via a Camera System
CN111552833A (zh) * 2020-03-30 2020-08-18 深圳壹账通智能科技有限公司 智能双录方法、装置及存储介质
CN112101311A (zh) * 2020-11-16 2020-12-18 深圳壹账通智能科技有限公司 基于人工智能的双录质检方法、装置、计算机设备及介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140232905A1 (en) * 2013-02-21 2014-08-21 Samsung Electronics Co., Ltd. Method for dual recording shooting and electronic device thereof
CN107610718A (zh) * 2017-08-29 2018-01-19 深圳市买买提乐购金融服务有限公司 一种对语音文件内容进行标记的方法及装置
CN109241334A (zh) * 2018-08-15 2019-01-18 平安科技(深圳)有限公司 音频关键字质检方法、装置、计算机设备及存储介质
CN109711996A (zh) * 2018-08-17 2019-05-03 深圳壹账通智能科技有限公司 保单双录文件质检方法、装置、设备及可读存储介质
CN109711655A (zh) * 2018-08-17 2019-05-03 深圳壹账通智能科技有限公司 双录质检方法、装置、设备及计算机可读存储介质
CN109729383A (zh) * 2019-01-04 2019-05-07 深圳壹账通智能科技有限公司 双录视频质量检测方法、装置、计算机设备和存储介质
CN110147926A (zh) * 2019-04-12 2019-08-20 深圳壹账通智能科技有限公司 一种业务类型的风险等级计算方法、存储介质及终端设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LIUHUIDONG77: "烟草质量检测具体是如何随机抽样", 《百度知道-HTTPS://ZHIDAO.BAIDU.COM/QUESTION/398922581.HTML》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022100349A1 (zh) * 2020-11-16 2022-05-19 深圳壹账通智能科技有限公司 基于人工智能的双录质检方法、装置、计算机设备及介质
CN112289321A (zh) * 2020-12-29 2021-01-29 平安科技(深圳)有限公司 讲解同步的视频高光处理方法、装置、计算机设备及介质
CN112289321B (zh) * 2020-12-29 2021-03-30 平安科技(深圳)有限公司 讲解同步的视频高光处理方法、装置、计算机设备及介质
CN112351337A (zh) * 2021-01-04 2021-02-09 腾讯科技(深圳)有限公司 视频质检方法、装置、计算机设备和存储介质
CN112351337B (zh) * 2021-01-04 2022-02-01 腾讯科技(深圳)有限公司 视频质检方法、装置、计算机设备和存储介质
CN113206996A (zh) * 2021-04-30 2021-08-03 中国工商银行股份有限公司 一种业务录制数据的质检方法及装置
CN113206996B (zh) * 2021-04-30 2023-04-07 中国工商银行股份有限公司 一种业务录制数据的质检方法及装置
CN113485668A (zh) * 2021-05-17 2021-10-08 广州佰锐网络科技有限公司 一种智能开户方法及系统
CN113485668B (zh) * 2021-05-17 2024-05-10 广州佰锐网络科技有限公司 一种智能开户方法及系统
CN113435349A (zh) * 2021-06-29 2021-09-24 建信金融科技有限责任公司 视频的质检方法和装置
CN114493902A (zh) * 2022-02-15 2022-05-13 中国平安人寿保险股份有限公司 多模态信息异常监控方法、装置、计算机设备及存储介质
CN118377812A (zh) * 2024-06-25 2024-07-23 宁波菊风系统软件有限公司 一种双录音视频文件质检方法及计算机可读存储介质

Also Published As

Publication number Publication date
WO2022100349A1 (zh) 2022-05-19

Similar Documents

Publication Publication Date Title
CN112101311A (zh) 基于人工智能的双录质检方法、装置、计算机设备及介质
Mason et al. An investigation of biometric authentication in the healthcare environment
CN111949708B (zh) 基于时序特征提取的多任务预测方法、装置、设备及介质
CN112104626A (zh) 基于区块链的数据访问验证方法、装置、电子设备及介质
CN111950621A (zh) 基于人工智能的目标数据检测方法、装置、设备及介质
CN112634017A (zh) 远程开卡激活方法、装置、电子设备及计算机存储介质
CN115936886B (zh) 异构证券交易系统的失效检测方法、装置、设备及介质
CN113486316A (zh) 用户身份验证方法、装置、电子设备及可读存储介质
CN114245204B (zh) 基于人工智能的视频面签方法、装置、电子设备及介质
WO2022088805A1 (zh) 基于人工智能的线上信贷方法、装置、计算机设备及介质
CN113434542B (zh) 数据关系识别方法、装置、电子设备及存储介质
CN1655505A (zh) 一种银行柜员安全系统及方法
CN114418398A (zh) 场景任务开发方法、装置、设备及存储介质
CN112258197B (zh) 基于人工智能的账户管理方法、装置、终端及存储介质
CN111651452B (zh) 数据存储方法、装置、计算机设备及存储介质
CN112330432A (zh) 风险等级识别模型训练方法、识别方法、终端及存储介质
CN115222549A (zh) 风险评估处理方法、装置、计算机设备及存储介质
CN114627419A (zh) 基于多应用场景的视频质检方法、装置、设备及存储介质
CN114331661A (zh) 数据核验方法、装置、电子设备及存储介质
CN114187050A (zh) 卡券发放监控方法、装置、设备及存储介质
CN114757664A (zh) 区块链交易处理方法、装置、系统及存储介质
CN110348984B (zh) 不同交易渠道下的信用卡数据自动化输入方法及相关设备
CN113987351A (zh) 基于人工智能的智能推荐方法、装置、电子设备及介质
CN113221888A (zh) 车牌号管理系统测试方法、装置、电子设备及存储介质
US20240005688A1 (en) Document authentication using multi-tier machine learning models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201218

RJ01 Rejection of invention patent application after publication