CN110378562A - 语音质检方法、装置、计算机设备及存储介质 - Google Patents
语音质检方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN110378562A CN110378562A CN201910523393.7A CN201910523393A CN110378562A CN 110378562 A CN110378562 A CN 110378562A CN 201910523393 A CN201910523393 A CN 201910523393A CN 110378562 A CN110378562 A CN 110378562A
- Authority
- CN
- China
- Prior art keywords
- content
- preset
- quality inspection
- result
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000007689 inspection Methods 0.000 claims abstract description 155
- 230000008451 emotion Effects 0.000 claims abstract description 57
- 230000036651 mood Effects 0.000 claims abstract description 25
- 238000012795 verification Methods 0.000 claims abstract description 20
- 238000006243 chemical reaction Methods 0.000 claims abstract description 13
- 239000000284 extract Substances 0.000 claims abstract description 7
- 238000012790 confirmation Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 8
- 235000013399 edible fruits Nutrition 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 103
- 230000005611 electricity Effects 0.000 description 18
- 238000012545 processing Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012549 training Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000006854 communication Effects 0.000 description 5
- 238000005520 cutting process Methods 0.000 description 5
- 230000000246 remedial effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004321 preservation Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Acoustics & Sound (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Psychiatry (AREA)
- Hospice & Palliative Care (AREA)
- Child & Adolescent Psychology (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
Abstract
本发明公开了一种语音质检方法、装置、计算机设备及存储介质。所述方法包括:获取业务信息和语音数据;对语音数据进行文本转换,得到文本内容;从文本内容中提取业务属性内容,并对业务信息和业务属性内容是否一致进行校验,得到校验结果;将去除业务属性内容后的文本内容与预设的违规内容进行匹配,得到匹配结果;从语音数据中提取语音特征,并对语音特征进行情绪识别,得到情绪识别结果;若校验结果为校验成功,并且匹配结果为匹配失败,并且情绪识别结果属于预设的情绪标签,则质检通过。本发明的技术方案分别从业务信息的校验、违规内容的匹配和情绪识别三个方面综合分析得到全面客观的质检结果,提高了质检效率,降低了人力成本。
Description
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音质检方法、装置、计算机设备及存储介质。
背景技术
目前,金融机构在开展业务时,往往采用电销方式推广和销售业务产品,为了满足监管要求,需要对电销成功的销售录音进行质检,以检查业务坐席人员在电销过程中的沟通是否规范,是否存在对客户的误导或者欺骗客户等行为。
然而,现有的质检主要采用人工方式完成,通过专门的质检人员按照预设的质检规范对销售录音进行质检,人工质检的方式需要耗费较多的时间,效率低,并且在业务量不断增加的情况下,需要配备大量的质检人员,导致人力成本增加。
发明内容
本发明实施例提供一种语音质检方法、装置、计算机设备及存储介质,以解决目前人工语音质检的效率低、成本高的问题。
一种语音质检方法,包括:
按照预设的选取方式,从预设的数据库中获取已完成任务对应的业务信息和语音数据;
使用预设的语音识别模型,对所述语音数据进行文本转换,得到所述语音数据对应的文本内容;
根据预设的业务属性标识,从所述文本内容中提取所述业务属性标识对应的业务属性内容,并对所述业务信息和所述业务属性内容是否一致进行校验,得到校验结果;
将去除所述业务属性内容后的所述文本内容与预设的违规内容进行匹配,得到匹配结果;
从所述语音数据中提取语音特征,并使用预设的情绪识别模型对所述语音特征进行情绪识别,得到所述语音数据对应的情绪识别结果;
若所述校验结果为校验成功,并且所述匹配结果为匹配失败,并且所述情绪识别结果属于预设的情绪标签,则确认所述已完成任务对应的所述语音数据的质检结果为质检通过;
若所述校验结果为校验失败,或者所述匹配结果为匹配成功,或者所述情绪识别结果不属于所述预设的情绪标签,则确认所述已完成任务对应的所述语音数据的质检结果为质检不通过。
一种语音质检装置,包括:
数据获取模块,用于按照预设的选取方式,从预设的数据库中获取已完成任务对应的业务信息和语音数据;
语音转换模块,用于使用预设的语音识别模型,对所述语音数据进行文本转换,得到所述语音数据对应的文本内容;
内容校验模块,用于根据预设的业务属性标识,从所述文本内容中提取所述业务属性标识对应的业务属性内容,并对所述业务信息和所述业务属性内容是否一致进行校验,得到校验结果;
文本匹配模块,用于将去除所述业务属性内容后的所述文本内容与预设的违规内容进行匹配,得到匹配结果;
情绪识别模块,用于从所述语音数据中提取语音特征,并使用预设的情绪识别模型对所述语音特征进行情绪识别,得到所述语音数据对应的情绪识别结果;
质检成功模块,用于若所述校验结果为校验成功,并且所述匹配结果为匹配失败,并且所述情绪识别结果属于预设的情绪标签,则确认所述已完成任务对应的所述语音数据的质检结果为质检通过;
质检失败模块,用于若所述校验结果为校验失败,或者所述匹配结果为匹配成功,或者所述情绪识别结果不属于所述预设的情绪标签,则确认所述已完成任务对应的所述语音数据的质检结果为质检不通过。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音质检方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语音质检方法的步骤。
上述语音质检方法、装置、计算机设备及存储介质中,按照预设的抽取方式,从预设的数据库中抽取已完成任务对应的业务信息和语音数据;使用预设的语音识别模型,对语音数据进行文本转换,得到语音数据对应的文本内容,从文本内容中提取预设的业务属性标识对应的业务属性内容,并对业务信息和业务属性内容是否一致进行校验,得到校验结果;将去除业务属性内容后的文本内容与预设的违规内容进行匹配,得到匹配结果;从语音数据中提取语音特征,并使用预设的情绪识别模型对语音特征进行情绪识别,得到语音数据对应的情绪识别结果;若同时满足校验结果为校验成功,匹配结果为匹配失败,以及情绪识别结果满足预设的情绪标签,则确认已完成任务对应的语音数据的质检结果为质检通过,否则,确认已完成任务对应的语音数据的质检结果为质检不通过。实现了分别从业务信息的校验、违规内容的匹配和情绪识别三个方面进行检查,通过业务信息的校验确定语音数据中涉及的业务是否和实际生效的业务一致,通过违规内容的匹配确认语音数据中是否存在不礼貌或者疑似诈骗等违规话术,通过情绪识别确认业务人员对客户的沟通态度是否合规,然后根据三个方面的检查结果综合得到全面客观的质检结果,无需人工干预,提高了质检效率,并有效降低了人力成本。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中语音质检方法的一应用环境示意图;
图2是本发明一实施例中语音质检方法的一流程图;
图3是本发明一实施例中语音质检方法中步骤S4的一流程图;
图4是本发明一实施例中语音质检方法的步骤S42的一流程图;
图5是本发明一实施例中语音质检方法中对质检不通过的语音数据进行人工复检的一流程图;
图6是本发明一实施例中语音质检方法中根据质检结果调整每种业务类型对应的选取比例的一流程图;
图7是本发明一实施例中语音质检装置的一示意图;
图8是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的语音质检方法,可应用在如图1所示的应用环境中,该应用环境包括服务端和客户端,其中,服务端和应用客户端之间通过网络进行连接,该网络可以是有线网络或者无线网络,客户端具体包括但不限于各种个人计算机、笔记本电脑、智能手机和平板电脑和便携式可穿戴设备,服务端具体均可以用独立的服务器或者多个服务器组成的服务器集群实现。业务坐席人员通过客户端完成对客户的电销沟通,客户端记录电销沟通过程的语音数据和销售成功的业务信息,并将语音数据和业务信息对应保存到预设的数据库中,服务端从该预设的数据库中获取语音数据进行质检。
在一实施例中,如图2所示,提供一种语音质检方法,以该方法应用在图1中的服务端为例进行说明,具体包括步骤S1至步骤S7,详述如下:
S1:按照预设的选取方式,从预设的数据库中获取已完成任务对应的业务信息和语音数据。
在本实施例中,预设的数据库中保存有已完成任务对应的业务信息和语音数据,其中,已完成任务具体可以是通过电销方式销售成功的保单任务,业务信息具体可以是保单信息。数据库中的每一条记录对应一个已完成任务,该已完成任务可以通过任务标识信息进行标识,该任务标识信息用于唯一标识该已完成任务,在该已完成任务的记录信息中保存有该已完成任务对应的业务信息和语音数据。
其中,语音数据为业务坐席人员在通过电销方式与客户进行沟通时的通话录音。业务信息为客户购买的业务产品的属性信息,例如,当业务信息为保单信息时,该保单信息包括但不限于投保人信息、被保人信息,以及保险产品信息等,投保人信息具体可以包括投保人姓名、投保人身份证信息、投保人电话号码等,被保人信息具体可以包括被保人姓名、被保人身份证信息,以及被保人电话号码等,保险产品信息为客户成功购买的保险产品的具体内容,包括产品类型、产品名称、产品年限、产品缴费方式等。
需要说明的是,预设的选取方式具体可以是随机抽取的方式,也可以是按照比例进行抽取的方式,还可以是全部选取的方式,其具体可以根据实际应用的需要进行设置,此处不做限制。
具体地,服务端按照预设的选取方式,从数据库中获取已完成任务对应的业务信息和语音数据。
S2:使用预设的语音识别模型,对语音数据进行文本转换,得到语音数据对应的文本内容。
具体地,预设的语音识别模型用于将语音数据转换为文本内容,将步骤S1中得到的语音数据输入预设的语音识别模型,通过该语音识别模型对语音数据进行语音识别,输出语音数据对应的文本内容。
其中,预设的语音识别模型具体可以采用基于隐马尔可夫模型((Hidden MarkovModel,HMM)的语音识别算法,还可以采用基于由高斯混合模型(Gaussian Mixed Model,GMM)和隐马尔可夫模型组合而成的GMM-HMM模型的语音识别算法,但并不限于此,在本发明实施例中对语音识别模型的具体实现算法不做限制。
S3:根据预设的业务属性标识,从文本内容中提取业务属性标识对应的业务属性内容,并对业务信息和业务属性内容是否一致进行校验,得到校验结果。
具体地,业务坐席人员在与客户的电话沟通过程中,需按照话术规范向客户核对业务产品的属性信息,该业务产品具体可以是保险产品,属性信息包含业务属性标识和业务属性内容。例如,当业务产品为保险产品时,若投保人姓名是张三,那么业务坐席人员在向客户核对投保人姓名时,语音数据中需包含“投保人姓名是张三”的语音,其中,“投保人姓名是张三”即为业务属性内容。
预设的业务属性标识为预先设置的需要核对的属性信息中的业务属性标识,服务端根据预设的业务属性标识,从步骤S2得到的文本内容中查找该业务属性标识,若在文本内容中查找到该业务属性标识,则获取文本内容中该业务属性标识后预设长度的文本,并将该业务属性标识和该预设长度的文本作为该业务属性标识对应的业务属性内容。
需要说明的是,不同的业务属性标识对应的预设长度可以不同,例如,若业务属性标识为“投保人姓名”,则其对应的预设长度可以为5个字符,若业务属性标识为“投保人身份证信息”,则其对应的预设长度可以为20个字符。
服务端将从文本内容中获取到的业务属性标识对应的业务属性内容与业务信息进行比较,若在业务信息中查询到该业务属性内容,则确认校验结果为校验成功,若在业务信息中未查询到该业务属性内容,则确认校验结果为校验失败。
可以理解的是,预设的业务属性标识可以为一个或多个,服务端在进行校验时,当预设的业务属性标识为多个时,只有在业务信息中查询到每个业务属性标识对应的业务属性内容,才确认校验结果为校验成功,只要有一个业务属性标识对应的业务属性内容没有在业务信息中被查询到,即确认校验结果为校验失败。
进一步地,当校验结果为校验失败时,服务端将在业务信息中没有查询到的业务属性标识对应的业务属性内容作为校验失败原因,并与已完成任务对应保存。
S4:将去除业务属性内容后的文本内容与预设的违规内容进行匹配,得到匹配结果。
具体地,服务端根据步骤S3提取到的业务属性内容,将文本内容中的业务属性内容去除,得到剩余文本。
预设的违规内容为预先设置的根据话术规范确定的不符合话术规范要求的字、词、句等违规信息。
服务端将剩余文本与预设的违规内容进行匹配,匹配的方式具体可以是对剩余文本与违规内容进行文本字符比较,判断违规内容是否在剩余文本中出现,若违规内容在剩余文本中出现,则确认匹配结果为匹配成功,否则,若违规内容没有在剩余文本中出现,则确认匹配结果为匹配失败。
匹配的方式还可以是基于统计学的计算方法或者基于语义理解的计算方法计算剩余文本与违规内容之间的文本相似度,若文本相似度大于或等于预设的相似度阈值,则确认确认匹配结果为匹配成功,否则,若文本相似度小于预设的相似度阈值,则确认匹配结果为匹配失败。
其中,基于统计学的计算方法计算得到的文本相似度可以是剩余文本向量和违规内容向量之间的余弦相似度,或者剩余文本和违规内容之间的汉明距离,基于语义理解的计算方法可以依据预设的词典中语义层次结构关系中概念之间的上下位关系或同义关系进行计算。
可以理解的是,若匹配结果为匹配成功,则说明在文本内容中包含了不符合话术规范要求的字、词、句等违规信息,若匹配结果为匹配失败,则说明在文本内容中没有包含违规内容。
可以理解的是,预设的保违规内容可以包含多个违规信息,服务端在进行匹配时,只要在剩余文本中有一个违规信息被匹配到,则确认确认匹配结果为匹配成功,只有每个违规信息均没有在剩余文本中被匹配到,才确认匹配结果为匹配失败。
例如,根据话术规范要求预设的违规内容可以包括“随时全额退款”,在去除业务属性内容后的文本内容中,若存在“随时全额退款”的内容,则匹配结果为匹配成功。
进一步地,当匹配结果为匹配成功时,服务端将在剩余文本中被匹配到的违规信息作为匹配成功的结果数据,并与已完成任务对应保存。
S5:从语音数据中提取语音特征,并使用预设的情绪识别模型对语音特征进行情绪识别,得到语音数据对应的情绪识别结果。
具体地,服务端从语音数据中提取的语音特征包括但不限于韵律学特征、音质特征、基于谱的相关性分析特征和词汇特征。其中,韵律特征是指语音中除音质特征之外的音高变化,包括时长相关特征、基频相关特征、能量相关特征等;音质特征包括但不限于音量、音高和音色。基于谱的相关性分析特征用于体现声道形状变化和发声运动之间的相关性,包括但不限于线性预测倒谱系数(Linear Prediction Cepstrum Coefficient,LPCC)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)。词汇特征用于体现语音数据中词语的词性特征,包括但不限于积极词和消极词。
服务端通过对语音数据进行预加重处理,消除声门激励、口鼻辐射、传播时高频衰减的影响,增加语音信号高频分量的幅度,然后对预加重处理后的语音数据进行分帧、加窗、离散傅里叶变换、梅尔滤波和对数运算后,得到包含韵律学特征、音质特征、基于谱的相关性分析特征和词汇特征的语音特征向量。
服务端将语音特征向量输入预先训练好的情绪识别模型,该情绪识别模型通过对语音特征向量的分析,输出该语音特征向量对应的语音数据中的说话人携带的高兴、愤怒、悲伤、烦噪、气愤、平静等情绪,即语音数据对应的情绪识别结果。
预设的情绪识别模型具体可以是基于卷积神经网络(Convolutional NeuralNetworks,CNN)的深度学习模型,还可以是基于支持向量机(Support Vector Machine,SVM)的分类器模型,但并不限于此,在本发明实施例中对情绪识别模型的具体实现算法不做限制。
S6:若校验结果为校验成功,并且匹配结果为匹配失败,并且情绪识别结果属于预设的情绪标签,则确认已完成任务对应的语音数据的质检结果为质检通过。
在本实施例中,预设的情绪标签是根据情绪识别模型能够识别的情绪中国选取的符合话术规范要求的情绪,例如,若情绪识别模型能够识别的情绪为高兴、愤怒、悲伤、烦噪、气愤和平静,则预设的情绪标签可以设置为“高兴”和“平静”。
具体地,服务端根据步骤S3得到的校验结果,步骤S4得到的匹配结果,以及步骤S5得到的情绪识别结果,判断已完成任务对应的语音数据的质检结果。
服务端判断语音数据是否同时满足如下三个条件,若语音数据同时满足如下三个条件,则服务端确认已完成任务对应的语音数据的质检结果为质检通过:
(a1)步骤S3得到的校验结果为校验成功;
(a2)步骤S4得到的匹配结果为匹配失败;
(a3)步骤S5得到的情绪识别结果属于预设的情绪标签。
S7:若校验结果为校验失败,或者匹配结果为匹配成功,或者情绪识别结果不满足预设的情绪标签,则确认已完成任务对应的语音数据的质检结果为质检不通过。
具体地,服务端判断语音数据是否满足如下三个条件中的至少一条,若语音数据满足如下三个条件中的至少一条,则服务端确认已完成任务对应的语音数据的质检结果为质检不通过:
(b1)步骤S3得到的校验结果为校验失败;
(b2)步骤S4得到的匹配结果为匹配成功;
(b3)步骤S5得到的情绪识别结果不属于预设的情绪标签。
进一步地,若语音数据满足上述条件(b3),则服务端将情绪识别结果与已完成任务对应保存。
本实施例中,服务端按照预设的选取方式,从预设的数据库中获取已完成任务对应的业务信息和语音数据;使用预设的语音识别模型,对语音数据进行文本转换,得到语音数据对应的文本内容,从文本内容中提取预设的业务属性标识对应的业务属性内容,并对业务信息和业务属性内容是否一致进行校验,得到校验结果;将去除业务属性内容后的文本内容与预设的违规内容进行匹配,得到匹配结果;从语音数据中提取语音特征,并使用预设的情绪识别模型对语音特征进行情绪识别,得到语音数据对应的情绪识别结果;若同时满足校验结果为校验成功,匹配结果为匹配失败,以及情绪识别结果属于预设的情绪标签,则确认已完成任务对应的语音数据的质检结果为质检通过,否则,确认已完成任务对应的语音数据的质检结果为质检不通过。实现了分别从业务信息的校验、违规内容的匹配和情绪识别三个方面进行检查,通过业务信息的校验确定语音数据中涉及的业务是否和实际生效的业务一致,通过违规内容的匹配确认语音数据中是否存在不礼貌或者疑似诈骗等违规话术,通过情绪识别确认业务人员对客户的沟通态度是否符合要求,然后根据三个方面的检查结果综合得到全面客观的质检结果,无需人工干预,提高了质检效率,并有效降低了人力成本。
在一实施例中,如图3所示,在步骤S4中,将去除业务属性内容后的文本内容与预设的违规内容进行匹配,得到匹配结果,具体包括步骤S41至步骤S42,详述如下:
S41:对去除业务属性内容后的文本内容进行关键字提取,得到语义关键字。
具体地,采用预设的分词处理算法,对去除业务属性内容后的文本内容进行分词处理,得到若干单词。其中,分词处理算法具体可以采用基于字符串匹配的分词方法,或者采用基于统计语言模型的全切分方法,但并不限于此,在本发明实施例中对分词处理的方式不做具体限制。
其中,基于字符串匹配的分词方法按照一定的扫描策略对去除业务属性内容后的文本内容进行字符串切分,并将切分得到的字符串与预设的词典中的词条逐一进行匹配,若在词典中找到该词条,则匹配成功。根据扫描策略的不同,基于字符串匹配的分词方法可以分为正向匹配、逆向匹配以及双向匹配等不同的方式。基于统计语言模型的全切分方法首先切分出与预设的词典中的词条相匹配的所有可能的词,再运用统计语言模型决定最优的切分结果,它的优点在于可以解决分词中的歧义问题。
在得到若干单词后,采用有监督的机器学习模型为每个单词预测一个[K1,K2]之间的权重得分,其中,K1和K2均大于或等于零,并且K1小于K2,例如,K1=0,K2=1,即为每个单词预测一个[0,1]之间的权重得分,单词的权重得分越大则该单词重要性越高。有监督的机器学习模型可以采用训练数据自提取的方法进行模型训练,即从已经完成质检的语音数据对应的文本内容里自动挖掘训练数据进行模型训练,对训练数据进行特征提取,并基于逻辑回归算法对提取出的特征进行分析,预测训练数据中每个文本串的重要性,同时,有监督的机器学习模型还可以根据待质检的语音数据对应的文本内容进行自学习以不断进行模型完善,提高预测的准确度。
根据每个单词的权重得分,将权重得分大于预设的分数阈值的单词确定为语义关键字。
S42:将语义关键字与预设的违规内容进行文本字符匹配,若至少一个语义关键字与违规内容匹配,则确认匹配结果为匹配成功,否则确认匹配结果为匹配失败。
具体地,服务端将步骤S41得到的每个语义关键字与违规内容进行文本字符匹配,通过遍历违规内容中的每个文本字符,查询在违规内容中是否存在语义关键字的文本字符,若在违规内容中存在语义关键字的文本字符,则确认在违规内容中匹配到该语义关键字。
若至少有一个语义关键字的文本字符能在违规内容中被查询到,则确认匹配结果为匹配成功。
若每个语义关键字的文本字符均没有在违规内容中被查询到,则确认匹配结果为匹配失败。
本实施例中,通过对去除业务属性内容后的文本内容进行关键字提取,丢弃文本内容中的一些辅助词语,得到能够代表该文本内容中的实质内容的语义关键字,并将语义关键字与预设的违规内容进行文本字符匹配,只要有一个语义关键字与违规内容匹配,则确认匹配结果为匹配成功,否则确认匹配结果为匹配失败,实现了对语音数据进行违规内容的质检,通过语义关键字的匹配,快速准确的识别语音数据中可能存在的不符合话术规范的违规内容,从而提高质检效率和自动质检的准确性。
在一实施例中,如图4所示,在步骤S42中,将语义关键字与预设的违规内容进行文本字符匹配,若至少一个语义关键字与违规内容匹配,则确认匹配结果为匹配成功,否则确认匹配结果为匹配失败,具体包括步骤S421至步骤S422,详述如下:
S421:从预设的近义词词库中获取每个语义关键字的近义词,将每个语义关键字和每个近义词作为待匹配关键字。
具体地,预设的近义词词库中预先保存有在保险产品电销沟通过程中常用的各种关键词语及其对应的近义词,并且通过近义词集合的方式存储每个关键词语及其对应的近义词。
服务端首先根据步骤S41得到的语义关键字,从预设的近义词词库中查询该语义关键字,若查询到,则获取近义词词库中该语义关键字所在的近义词集合,将该近义词集合中的每个词语均作为待匹配关键字。
S422:将待匹配关键字与预设的违规内容进行文本字符匹配,若至少一个待匹配关键字与违规内容匹配,则确认匹配结果为匹配成功,否则确认匹配结果为匹配失败。
具体地,服务端将步骤S421得到的每个待匹配关键字与违规内容进行文本字符匹配,通过遍历违规内容中的每个文本字符,查询在违规内容中是否存在待匹配关键字的文本字符,若在违规内容中存在待匹配关键字的文本字符,则确认在违规内容中匹配到该待匹配关键字。
若至少有一个待匹配关键字的文本字符能在违规内容中被查询到,则确认匹配结果为匹配成功。
若每个待匹配关键字的文本字符均没有在违规内容中被查询到,则确认匹配结果为匹配失败。
本实施例中,通过从预设的近义词词库中获取每个语义关键字的近义词,将每个语义关键字和每个近义词作为待匹配关键字,采用待匹配关键字与违规内容进行文本字符匹配的方式,得到匹配结果,扩大了对违规内容的精准匹配范围,提高了匹配结果的准确性,进而提高自动质检的准确性。
在一实施例中,如图5所示,在步骤S7之后,还可以对质检不通过的语音数据进行人工复检,具体包括步骤S81至步骤S82,详述如下:
S81:若质检结果为质检不通过,则将已完成任务对应的业务信息和语音数据发送给已完成任务对应的业务人员,以使业务人员在预设的时间期限内对已完成任务的违规行为进行补救。
具体地,若已完成任务对应的语音数据的质检结果为质检不通过,将质检不通过的语音数据及已完成任务对应的业务信息发送给处理该已完成任务对应的业务人员,该业务人员具体可以是电销业务人员。
进一步地,服务端将保存的已完成任务对应的校验失败原因、匹配成功的结果数据,以及情绪识别结果作为质检不通过的原因同步发送给电销业务人员。
服务端可以通过邮件或即时消息等方式向电销业务人员发送语音数据、业务信息,以及质检不通过的原因等信息,电销业务人员根据接收到的信息,检查在处理该已完成的过程中与客户沟通时的违规行为,并在预设的时间期限内进行相应的补救,例如,通过回访客户进行及时的解释和澄清等。
其中,预设的时间期限也可以包含在服务端向电销业务人员发送的信息中,该时间期限可以设置为接收到服务端发送的信息开始三日内,但并不限于此,其具体可以根据实际应用的需要进行设置,此处不做限制。
S82:在到达预设的时间期限后,重新获取已完成任务对应的语音数据,并将业务信息和重新获取到的语音数据发送给预设的质检人员,以使质检人员对重新获取到的语音数据进行人工复检。
具体地,服务端在向电销业务人员发送语音数据、业务信息,以及质检不通过的原因等信息后,启动定时器进行计时,当到达预设的时间期限后,服务端重新获取已完成任务对应的语音数据。
若电销业务人在预设的时间期限内进行了相关的补救行为,则服务端重新获取到的语音数据包含了补救行为对应的语音内容,此时,服务端将该重新获取到的语音数据发送给预设的质检人员,由质检人员完成对重新获取到的语音数据的人工复检,检查电销业务人员的补救行为是否满足要求。
若自动语音质检出现了误判,电销业务人员在预设的时间期限内没有进行相关的补救行为,则服务端在到达预设的时间期限后重新获取到的语音数据仍然是原来的语音数据,此时,服务端将该语音数据发送给预设的质检人员,有质检人员进行人工复检,也能够纠正自动语音质检的误判,避免对电销业务人员的冤枉。
本实施例中,通过将质检不通过的语音数据及已完成任务对应的业务信息发送给处理该已完成任务的电销业务人员,让电销业务人员进行相应的补救,为电销业务人员提供了违规补救的机会;通过人工复检,一方面可以对电销业务人员的违规补救行为进行监督检查,另一方面也可以对自动语音质检可能出现的误判进行纠正,提高质检结果的准确性,同时,人工复检只需要关注质检不通过的语音数据,无需大量的人力,有效降低了人力成本,提高质检效率。
在一实施例中,如图6所示,在步骤S1中,按照预设的选取方式,从预设的数据库中获取已完成任务对应的业务信息和语音数据,具体包括步骤S11,详述如下:
S11:根据每种预设的业务类型对应的选取比例,从预设的数据库中获取每种业务类型的已完成任务对应的业务信息和语音数据。
在本实施例中,不同的业务类型可以对应不同的选取比例,其中,业务类型具体可以是保单类型,例如,寿险类型的保单对应的选取比例可以为30%,车险类型的保单应的选取比例可以为10%等,可以根据每种业务类型的实际业务数量设定其对应的选取比例,实际业务数量大的业务类型,其对应的选取比例可以较高,实际业务数量小的业务类型,其对应的选取比例可以较低。
具体地,服务端根据每种业务类型对应的选取比例,从预设的数据库中选取每种业务类型的已完成任务对应的业务信息和语音数据。
进一步地,在步骤S11的基础上,请继续参阅图6,在步骤S7之后,还可以根据质检结果调整每种业务类型对应的选取比例,具体包括步骤S91至步骤S92,详述如下:
S91:获取每种业务类型对应的质检结果为质检通过的结果数量,并根据该结果数量计算每种业务类型对应的质检通过率。
具体地,服务端根据从数据库中选出的每种业务类型的已完成任务对应的语音数据的质检结果,统计每种业务类型对应的质检结果为质检通过的结果数量,以及选取出的每种业务类型的已完成任务的任务数量,并将该结果数量与任务数量的比值作为该业务类型对应的质检通过率。
S92:根据质检通过率,调整每种业务类型对应的选取比例。
具体地,服务端根据每种业务类型对应的质检通过率,调整每种业务类型对应的选取比例,对于质检通过率高的业务类型,可以调低其对应的选取比例,反之,对于质检通过率高的业务类型,可以调高其对应的选取比例。
进一步地,服务端可以使用质检通过率与选取比例之间预设的函数关系,即选取比例随质检通过率增大而降低的反比例线性函数关系,计算之间通过率对应的选取比例。
需要说明的是,不同的业务类型与质检通过率之间的反比例线性程度可以相同也可以不相同,其具体可以根据实际应用的需要进行设置,此处不做限制。
本实施例中,服务端根据每种预设的业务类型对应的选取比例,从预设的数据库中获取每种业务类型的已完成任务对应的业务信息和语音数据,使得在选取质检对象时能够兼顾每种业务类型,并在质检完成后,根据质检结果计算每种业务类型对应的质检通过率,然后根据质检通过率,调整每种业务类型对应的选取比例,实现了根据质检结果灵活调整质检对象的选取数量,使得质检的覆盖范围更加合理,有利于提高质检命中率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种语音质检装置,该语音质检装置与上述实施例中语音质检方法一一对应。如图7所示,该语音质检装置包括:数据获取模块10、语音转换模块20、内容校验模块30、文本匹配模块40、情绪识别模块50、质检成功模块60和质检失败模块70。各功能模块详细说明如下:
数据获取模块10,用于按照预设的选取方式,从预设的数据库中获取已完成任务对应的业务信息和语音数据;
语音转换模块20,用于使用预设的语音识别模型,对语音数据进行文本转换,得到语音数据对应的文本内容;
内容校验模块30,用于根据预设的业务属性标识,从文本内容中提取业务属性标识对应的业务属性内容,并对业务信息和业务属性内容是否一致进行校验,得到校验结果;
文本匹配模块40,用于将去除业务属性内容后的文本内容与预设的违规内容进行匹配,得到匹配结果;
情绪识别模块50,用于从语音数据中提取语音特征,并使用预设的情绪识别模型对语音特征进行情绪识别,得到语音数据对应的情绪识别结果;
质检成功模块60,用于若校验结果为校验成功,并且匹配结果为匹配失败,并且情绪识别结果属于预设的情绪标签,则确认已完成任务对应的语音数据的质检结果为质检通过;
质检失败模块70,用于若校验结果为校验失败,或者匹配结果为匹配成功,或者情绪识别结果不属于预设的情绪标签,则确认已完成任务对应的语音数据的质检结果为质检不通过。
进一步地,文本匹配模块40包括:
关键字提取子模块401,用于对去除业务属性内容后的文本内容进行关键字提取,得到语义关键字;
字符匹配子模块402,用于将语义关键字与预设的违规内容进行文本字符匹配,若至少一个语义关键字与违规内容匹配,则确认匹配结果为匹配成功,否则确认匹配结果为匹配失败。
进一步地,字符匹配子模块402包括:
近义词获取单元4021,用于从预设的近义词词库中获取每个语义关键字的近义词,将每个语义关键字和每个近义词作为待匹配关键字;
近义词匹配单元4022,用于将待匹配关键字与预设的违规内容进行文本字符匹配,若至少一个待匹配关键字与违规内容匹配,则确认匹配结果为匹配成功,否则确认匹配结果为匹配失败。
进一步地,该语音质检装置还包括:
数据发送模块81,用于若质检结果为质检不通过,则将已完成任务对应的已完成信息和语音数据发送给已完成任务对应的业务人员,以使业务人员在预设的时间期限内对已完成任务的违规行为进行补救;
重新获取模块82,用于在到达预设的时间期限后,重新获取已完成任务对应的语音数据,并将业务信息和重新获取到的语音数据发送给预设的质检人员,以使质检人员对重新获取到的语音数据进行人工复检。
进一步地,数据获取模块10包括:
按比例获取子模块101,用于根据每种预设的业务类型对应的选取比例,从预设的数据库中获取每种业务类型的已完成任务对应的业务信息和语音数据;
并且,该语音质检装置还包括:
通过率计算模块91,用于获取每种业务类型对应的质检结果为质检通过的结果数量,并根据该结果数量计算每种业务类型对应的质检通过率;
比例调整模块92,用于根据质检通过率,调整每种业务类型对应的选取比例。
关于语音质检装置的具体限定可以参见上文中对于语音质检方法的限定,在此不再赘述。上述语音质检装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音质检方法。
在一实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中语音质检方法的步骤,例如图2所示的步骤S1至步骤S7。或者,处理器执行计算机程序时实现上述实施例中语音质检装置的各模块/单元的功能,例如图7所示模块10至模块70的功能。为避免重复,此处不再赘述。
在一实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中语音质检方法,或者,该计算机程序被处理器执行时实现上述装置实施例中语音质检装置中各模块/单元的功能。为避免重复,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种语音质检方法,其特征在于,所述语音质检方法包括:
按照预设的选取方式,从预设的数据库中获取已完成任务对应的业务信息和语音数据;
使用预设的语音识别模型,对所述语音数据进行文本转换,得到所述语音数据对应的文本内容;
根据预设的业务属性标识,从所述文本内容中提取所述业务属性标识对应的业务属性内容,并对所述业务信息和所述业务属性内容是否一致进行校验,得到校验结果;
将去除所述业务属性内容后的所述文本内容与预设的违规内容进行匹配,得到匹配结果;
从所述语音数据中提取语音特征,并使用预设的情绪识别模型对所述语音特征进行情绪识别,得到所述语音数据对应的情绪识别结果;
若所述校验结果为校验成功,并且所述匹配结果为匹配失败,并且所述情绪识别结果属于预设的情绪标签,则确认所述已完成任务对应的所述语音数据的质检结果为质检通过;
若所述校验结果为校验失败,或者所述匹配结果为匹配成功,或者所述情绪识别结果不属于所述预设的情绪标签,则确认所述已完成任务对应的所述语音数据的质检结果为质检不通过。
2.如权利要求1所述的语音质检方法,其特征在于,所述将去除所述业务属性内容后的所述文本内容与预设的违规内容进行匹配,得到匹配结果包括:
对去除所述业务属性内容后的所述文本内容进行关键字提取,得到语义关键字;
将所述语义关键字与所述预设的违规内容进行文本字符匹配,若至少一个所述语义关键字与所述违规内容匹配,则确认所述匹配结果为匹配成功,否则确认所述匹配结果为匹配失败。
3.如权利要求2所述的语音质检方法,其特征在于,所述将所述语义关键字与所述预设的违规内容进行文本字符匹配,若至少一个所述语义关键字与所述违规内容匹配,则确认所述匹配结果为匹配成功,否则确认所述匹配结果为匹配失败包括:
从预设的近义词词库中获取每个所述语义关键字的近义词,将每个所述语义关键字和每个所述近义词作为待匹配关键字;
将所述待匹配关键字与所述预设的违规内容进行文本字符匹配,若至少一个所述待匹配关键字与所述违规内容匹配,则确认所述匹配结果为所述匹配成功,否则确认所述匹配结果为所述匹配失败。
4.如权利要求1所述的语音质检方法,其特征在于,在所述若所述校验结果为校验失败,或者所述匹配结果为匹配成功,或者所述情绪识别结果不属于所述预设的情绪标签,则确认所述已完成任务对应的所述语音数据的质检结果为质检不通过之后,所述语音质检方法还包括:
若所述质检结果为质检不通过,则将所述已完成任务对应的所述业务信息和所述语音数据发送给所述已完成任务对应的业务人员,以使所述业务人员在预设的时间期限内对所述已完成任务的违规行为进行补救;
在到达所述预设的时间期限后,重新获取所述已完成任务对应的所述语音数据,并将所述业务信息和重新获取到的所述语音数据发送给预设的质检人员,以使所述质检人员对重新获取到的所述语音数据进行人工复检。
5.如权利要求1至4任一项所述的语音质检方法,其特征在于,所述按照预设的选取方式,从预设的数据库中获取已完成任务对应的业务信息和语音数据包括:
根据每种预设的业务类型对应的选取比例,从所述预设的数据库中获取每种所述业务类型的所述已完成任务对应的业务信息和语音数据;
并且,在所述若所述校验结果为校验失败,或者所述匹配结果为匹配成功,或者所述情绪识别结果不属于所述预设的情绪标签,则确认所述已完成任务对应的所述语音数据的质检结果为质检不通过之后,所述语音质检方法还包括:
获取每种所述业务类型对应的质检结果为质检通过的结果数量,并根据所述结果数量计算每种所述业务类型对应的质检通过率;
根据所述质检通过率,调整每种所述业务类型对应的所述选取比例。
6.一种语音质检装置,其特征在于,所述语音质检装置包括:
数据获取模块,用于按照预设的选取方式,从预设的数据库中获取已完成任务对应的业务信息和语音数据;
语音转换模块,用于使用预设的语音识别模型,对所述语音数据进行文本转换,得到所述语音数据对应的文本内容;
内容校验模块,用于根据预设的业务属性标识,从所述文本内容中提取所述业务属性标识对应的业务属性内容,并对所述业务信息和所述业务属性内容是否一致进行校验,得到校验结果;
文本匹配模块,用于将去除所述业务属性内容后的所述文本内容与预设的违规内容进行匹配,得到匹配结果;
情绪识别模块,用于从所述语音数据中提取语音特征,并使用预设的情绪识别模型对所述语音特征进行情绪识别,得到所述语音数据对应的情绪识别结果;
质检成功模块,用于若所述校验结果为校验成功,并且所述匹配结果为匹配失败,并且所述情绪识别结果属于预设的情绪标签,则确认所述已完成任务对应的所述语音数据的质检结果为质检通过;
质检失败模块,用于若所述校验结果为校验失败,或者所述匹配结果为匹配成功,或者所述情绪识别结果不属于所述预设的情绪标签,则确认所述保已完成任务对应的所述语音数据的质检结果为质检不通过。
7.如权利要求6所述的语音质检装置,其特征在于,所述文本匹配模块包括:
关键字提取子模块,用于对去除所述业务属性内容后的所述文本内容进行关键字提取,得到语义关键字;
字符匹配子模块,用于将所述语义关键字与所述预设的违规内容进行文本字符匹配,若至少一个所述语义关键字与所述违规内容匹配,则确认所述匹配结果为匹配成功,否则确认所述匹配结果为匹配失败。
8.如权利要求7所述的语音质检装置,其特征在于,所述字符匹配子模块包括:
近义词获取单元,用于从预设的近义词词库中获取每个所述语义关键字的近义词,将每个所述语义关键字和每个所述近义词作为待匹配关键字;
近义词匹配单元,用于将所述待匹配关键字与所述预设的违规内容进行文本字符匹配,若至少一个所述待匹配关键字与所述违规内容匹配,则确认所述匹配结果为所述匹配成功,否则确认所述匹配结果为所述匹配失败。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的语音质检方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的语音质检方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910523393.7A CN110378562B (zh) | 2019-06-17 | 2019-06-17 | 语音质检方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910523393.7A CN110378562B (zh) | 2019-06-17 | 2019-06-17 | 语音质检方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110378562A true CN110378562A (zh) | 2019-10-25 |
CN110378562B CN110378562B (zh) | 2023-07-28 |
Family
ID=68250479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910523393.7A Active CN110378562B (zh) | 2019-06-17 | 2019-06-17 | 语音质检方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110378562B (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956956A (zh) * | 2019-12-13 | 2020-04-03 | 集奥聚合(北京)人工智能科技有限公司 | 基于策略规则的语音识别方法及装置 |
CN111182409A (zh) * | 2019-11-26 | 2020-05-19 | 广东小天才科技有限公司 | 一种基于智能音箱的屏幕控制方法及智能音箱、存储介质 |
CN111312230A (zh) * | 2019-11-27 | 2020-06-19 | 南京创维信息技术研究院有限公司 | 用于语音对话平台的语音交互监测方法及装置 |
CN111508529A (zh) * | 2020-04-16 | 2020-08-07 | 深圳航天科创实业有限公司 | 一种动态可扩展的语音质检评分方法 |
CN111523317A (zh) * | 2020-03-09 | 2020-08-11 | 平安科技(深圳)有限公司 | 语音质检方法、装置、电子设备及介质 |
CN111917924A (zh) * | 2020-07-29 | 2020-11-10 | 上海博泰悦臻电子设备制造有限公司 | 客服语音质检方法及相关设备 |
CN112116457A (zh) * | 2020-09-29 | 2020-12-22 | 中国银行股份有限公司 | 一种银行柜面业务的监督方法、装置及设备 |
CN112633727A (zh) * | 2020-12-29 | 2021-04-09 | 清华大学 | 质量监控方法、装置、电子设备和存储介质 |
CN113011158A (zh) * | 2021-03-23 | 2021-06-22 | 北京百度网讯科技有限公司 | 信息异常检测方法、装置、电子设备和存储介质 |
CN113159584A (zh) * | 2021-04-25 | 2021-07-23 | 上海淇玥信息技术有限公司 | 一种基于质检的业务策略管理方法、装置和电子设备 |
CN113223532A (zh) * | 2021-04-30 | 2021-08-06 | 平安科技(深圳)有限公司 | 客服通话的质检方法、装置、计算机设备及存储介质 |
CN113449506A (zh) * | 2021-06-29 | 2021-09-28 | 未鲲(上海)科技服务有限公司 | 一种数据检测方法、装置、设备及可读存储介质 |
CN113723767A (zh) * | 2021-08-10 | 2021-11-30 | 上海浦东发展银行股份有限公司 | 一种基于语音交互数据的业务流程质检方法和装置 |
WO2022126969A1 (zh) * | 2020-12-15 | 2022-06-23 | 平安科技(深圳)有限公司 | 业务语音的质检方法、装置、设备及存储介质 |
CN114661928A (zh) * | 2022-03-14 | 2022-06-24 | 平安国际智慧城市科技股份有限公司 | 违规行为图像的检索方法、装置、设备及存储介质 |
CN115099829A (zh) * | 2022-06-15 | 2022-09-23 | 马上消费金融股份有限公司 | 数据处理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014000441A1 (zh) * | 2012-06-26 | 2014-01-03 | 华为技术有限公司 | 质检的处理方法和设备 |
CN107705807A (zh) * | 2017-08-24 | 2018-02-16 | 平安科技(深圳)有限公司 | 基于情绪识别的语音质检方法、装置、设备及存储介质 |
CN108763499A (zh) * | 2018-05-30 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于智能语音的呼叫质检方法、装置、设备及存储介质 |
CN109448730A (zh) * | 2018-11-27 | 2019-03-08 | 广州广电运通金融电子股份有限公司 | 一种自动语音质检方法、系统、装置及存储介质 |
CN109472207A (zh) * | 2018-10-11 | 2019-03-15 | 平安科技(深圳)有限公司 | 情绪识别方法、装置、设备及存储介质 |
-
2019
- 2019-06-17 CN CN201910523393.7A patent/CN110378562B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014000441A1 (zh) * | 2012-06-26 | 2014-01-03 | 华为技术有限公司 | 质检的处理方法和设备 |
CN107705807A (zh) * | 2017-08-24 | 2018-02-16 | 平安科技(深圳)有限公司 | 基于情绪识别的语音质检方法、装置、设备及存储介质 |
WO2019037382A1 (zh) * | 2017-08-24 | 2019-02-28 | 平安科技(深圳)有限公司 | 基于情绪识别的语音质检方法、装置、设备及存储介质 |
CN108763499A (zh) * | 2018-05-30 | 2018-11-06 | 平安科技(深圳)有限公司 | 基于智能语音的呼叫质检方法、装置、设备及存储介质 |
CN109472207A (zh) * | 2018-10-11 | 2019-03-15 | 平安科技(深圳)有限公司 | 情绪识别方法、装置、设备及存储介质 |
CN109448730A (zh) * | 2018-11-27 | 2019-03-08 | 广州广电运通金融电子股份有限公司 | 一种自动语音质检方法、系统、装置及存储介质 |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111182409A (zh) * | 2019-11-26 | 2020-05-19 | 广东小天才科技有限公司 | 一种基于智能音箱的屏幕控制方法及智能音箱、存储介质 |
CN111182409B (zh) * | 2019-11-26 | 2022-03-25 | 广东小天才科技有限公司 | 一种基于智能音箱的屏幕控制方法及智能音箱、存储介质 |
CN111312230A (zh) * | 2019-11-27 | 2020-06-19 | 南京创维信息技术研究院有限公司 | 用于语音对话平台的语音交互监测方法及装置 |
CN111312230B (zh) * | 2019-11-27 | 2023-10-20 | 南京创维信息技术研究院有限公司 | 一种用于语音对话平台的语音交互监测方法及装置 |
CN110956956A (zh) * | 2019-12-13 | 2020-04-03 | 集奥聚合(北京)人工智能科技有限公司 | 基于策略规则的语音识别方法及装置 |
CN111523317A (zh) * | 2020-03-09 | 2020-08-11 | 平安科技(深圳)有限公司 | 语音质检方法、装置、电子设备及介质 |
CN111523317B (zh) * | 2020-03-09 | 2023-04-07 | 平安科技(深圳)有限公司 | 语音质检方法、装置、电子设备及介质 |
CN111508529A (zh) * | 2020-04-16 | 2020-08-07 | 深圳航天科创实业有限公司 | 一种动态可扩展的语音质检评分方法 |
CN111917924A (zh) * | 2020-07-29 | 2020-11-10 | 上海博泰悦臻电子设备制造有限公司 | 客服语音质检方法及相关设备 |
CN112116457A (zh) * | 2020-09-29 | 2020-12-22 | 中国银行股份有限公司 | 一种银行柜面业务的监督方法、装置及设备 |
CN112116457B (zh) * | 2020-09-29 | 2024-02-23 | 中国银行股份有限公司 | 一种银行柜面业务的监督方法、装置及设备 |
WO2022126969A1 (zh) * | 2020-12-15 | 2022-06-23 | 平安科技(深圳)有限公司 | 业务语音的质检方法、装置、设备及存储介质 |
CN112633727A (zh) * | 2020-12-29 | 2021-04-09 | 清华大学 | 质量监控方法、装置、电子设备和存储介质 |
CN113011158A (zh) * | 2021-03-23 | 2021-06-22 | 北京百度网讯科技有限公司 | 信息异常检测方法、装置、电子设备和存储介质 |
CN113159584A (zh) * | 2021-04-25 | 2021-07-23 | 上海淇玥信息技术有限公司 | 一种基于质检的业务策略管理方法、装置和电子设备 |
CN113223532A (zh) * | 2021-04-30 | 2021-08-06 | 平安科技(深圳)有限公司 | 客服通话的质检方法、装置、计算机设备及存储介质 |
CN113223532B (zh) * | 2021-04-30 | 2024-03-05 | 平安科技(深圳)有限公司 | 客服通话的质检方法、装置、计算机设备及存储介质 |
CN113449506A (zh) * | 2021-06-29 | 2021-09-28 | 未鲲(上海)科技服务有限公司 | 一种数据检测方法、装置、设备及可读存储介质 |
CN113723767A (zh) * | 2021-08-10 | 2021-11-30 | 上海浦东发展银行股份有限公司 | 一种基于语音交互数据的业务流程质检方法和装置 |
CN114661928A (zh) * | 2022-03-14 | 2022-06-24 | 平安国际智慧城市科技股份有限公司 | 违规行为图像的检索方法、装置、设备及存储介质 |
CN115099829A (zh) * | 2022-06-15 | 2022-09-23 | 马上消费金融股份有限公司 | 数据处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110378562B (zh) | 2023-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110378562A (zh) | 语音质检方法、装置、计算机设备及存储介质 | |
CN110675288B (zh) | 智能辅助审判方法、装置、计算机设备及存储介质 | |
US10013972B2 (en) | System and method for identifying speakers | |
CN107104803A (zh) | 一种基于数字口令与声纹联合确认的用户身份验证方法 | |
CN109087205B (zh) | 舆情指数的预测方法及装置、计算机设备和可读存储介质 | |
CN109461073A (zh) | 智能识别的风险管理方法、装置、计算机设备及存储介质 | |
CN112468659B (zh) | 应用于电话客服的质量评价方法、装置、设备及存储介质 | |
CN114007131B (zh) | 视频监控方法、装置及相关设备 | |
CN110738998A (zh) | 基于语音的个人信用评估方法、装置、终端及存储介质 | |
CN109462482A (zh) | 声纹识别方法、装置、电子设备及计算机可读存储介质 | |
CN113688221A (zh) | 基于模型的话术推荐方法、装置、计算机设备和存储介质 | |
US11735188B2 (en) | System and method for detecting fraud rings | |
CN113314150A (zh) | 基于语音数据的情绪识别方法、装置及存储介质 | |
CN113064983B (zh) | 语义检测方法、装置、计算机设备及存储介质 | |
CN113469708B (zh) | 产品防伪处理方法、装置、计算机设备及存储介质 | |
CN114493902A (zh) | 多模态信息异常监控方法、装置、计算机设备及存储介质 | |
Barrington et al. | Single and multi-speaker cloned voice detection: from perceptual to learned features | |
Mirghafori et al. | An adaptive speaker verification system with speaker dependent a priori decision thresholds. | |
CN116886823A (zh) | 坐席质检方法、装置、设备及介质 | |
CN113051923B (zh) | 数据验证方法、装置、计算机设备和存储介质 | |
CN114239602A (zh) | 会话方法、装置和计算机程序产品 | |
Balipa et al. | Twins Voice Verification And Speaker Identification | |
CN113902544B (zh) | 基于声纹识别的智能核身方法、装置、电子设备及介质 | |
CN113345419B (zh) | 基于方言口音的语音转译方法、系统和可读存储介质 | |
CN113254621B (zh) | 坐席通话提示方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |