CN112052994A - 客诉升级预测方法、装置及电子设备 - Google Patents
客诉升级预测方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112052994A CN112052994A CN202010881626.3A CN202010881626A CN112052994A CN 112052994 A CN112052994 A CN 112052994A CN 202010881626 A CN202010881626 A CN 202010881626A CN 112052994 A CN112052994 A CN 112052994A
- Authority
- CN
- China
- Prior art keywords
- user
- complaint
- upgrade
- determining
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000003068 static effect Effects 0.000 claims abstract description 36
- 230000008451 emotion Effects 0.000 claims description 22
- 230000002996 emotional effect Effects 0.000 claims description 9
- 238000000926 separation method Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 4
- 238000009432 framing Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000013707 sensory perception of sound Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Child & Adolescent Psychology (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请提供了一种客诉升级预测方法、装置及电子设备,应用于语音处理领域,其中该方法通过获取用户与客服的语音通话信息,对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率,基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率,基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。即实现了客诉升级的自动化识别,此外,基于静态投诉升级概率与动态投诉升级概率确定所述用户是否进行客诉升级,能够提升客诉升级预测的准确性。
Description
技术领域
本申请涉及语音处理技术领域,具体而言,本申请涉及一种客诉升级预测方法、装置及电子设备。
背景技术
信用卡客诉升级,通常是指信用卡用户主观认为信用卡中心无法妥善解决其遇到的问题,从而越过卡中心提供的服务渠道,向企业上级领导、监管部门、媒体等渠道进行的投诉。引起信用卡客诉升级的原因一般包括以下几点,首先,客户对投诉处理要求高,想要问题立马得到解决、获得高额经济赔偿、精神损失补偿等卡中心难以接受的要求;其次,客户投诉的问题本身难以解决,卡中心无法解决或无法与客户达成一致,客户希望通过升级投诉向卡中心施压;最后,客户本身难以应付,升级投诉的客户常常善于抓住卡中心产品的瑕疵,卡中心难以应付。卡中心作为服务型的企业,如若对升级投诉的行为处理不当,常常会因为这些投诉升级造成名誉受损、媒体曝光等严重影响,因此,卡中心客服部门需要重点做好客户升级投诉的预防管理。传统预防客诉升级的方法,纯粹基于客服人员的判断,但是这样的人为判断,标准不统一,严重依赖客服人员经验,且准确率极低。
发明内容
本申请提供了一种客诉升级预测方法、装置及电子设备,用于实现客诉升级的自动识别,以及提升客诉升级识别的准确性,本申请采用的技术方案如下:
第一方面,提供了一种客诉升级预测方法,该方法包括,
获取用户与客服的语音通话信息;
对语音通话信息进行语音识别得到用户与客服的对话内容,并基于对话内容确定用户的投诉问题,以及基于投诉问题确定用户的静态投诉升级概率;
基于语音通话信息提取用户的声纹特征,并基于声纹特征确定用户的动态投诉升级概率;
基于静态投诉升级概率与动态投诉升级概率确定用户是否进行客诉升级。
可选地,所述基于所述对话内容确定用户的投诉问题,包括:
基于所述对话内容通过BERT算法确定用户的投诉问题。
可选地,所述基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率,包括:
确定所述用户的基础情绪声纹特征;
基于所述用户的基础情绪声纹特征与所述用户的声纹特征确定所述用户的动态升级概率。
可选地,该方法还包括:
确定所述用户之前是否来电;
如果所述用户之前来电,搜索用户情绪声纹特征库,确定所述用户的基础情绪声纹特征;
如果所述用户第一次来电,将所述通话语音信息中所述用户预定时间长度的起始语音声纹特征作为基础情绪声纹特征。
可选地,所述基于所述语音通话信息提取所述用户的声纹特征,包括:
对所述语音通话信息进行语音分离处理,得到所述用户的语音信息;
基于所述用户的语音信息提取得到所述用户的声纹特征。
可选地,所述基于所述用户的语音信息提取得到所述用户的声纹特征,包括:
基于所述用户的语音信息通过熵加权法提取得到所述用户的声纹特征。
第二方面,提供了一种客诉升级预测装置,该装置包括,
获取模块,用于获取用户与客服的语音通话信息;
第一确定模块,用于对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率;
第二确定模块,用于基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率;
第三确定模块,用于基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。
可选地,所述第一确定模块具体用于基于所述对话内容通过BERT算法确定用户的投诉问题。
可选地,所述第二确定模块包括:
第一确定单元,用于确定所述用户的基础情绪声纹特征;
第二确定单元,用于基于所述用户的基础情绪声纹特征与所述用户的声纹特征确定所述用户的动态升级概率。
可选地,该装置还包括:
第四确定模块,用于确定所述用户之前是否来电;以及用于如果所述用户之前来电,搜索用户情绪声纹特征库,确定所述用户的基础情绪声纹特征;以及用于如果所述用户第一次来电,将所述通话语音信息中所述用户预定时间长度的起始语音声纹特征作为基础情绪声纹特征。
可选地,所述第二确定模块包括:
语音分离单元,用于对所述语音通话信息进行语音分离处理,得到所述用户的语音信息;
提取单元,用于基于所述用户的语音信息提取得到所述用户的声纹特征。
可选地,所述提取单元,具体用于通过熵加权法提取得到所述用户的声纹特征。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行第一方面所示的客诉升级预测方法。
第四方面,提供了一种计算机可读存储介质,计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行第一方面所示的客诉升级预测方法。
本申请提供了一种客诉升级预测方法、装置及电子设备,与现有技术将通过人工的方式识别客诉升级相比,本申请通过获取用户与客服的语音通话信息,对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率,基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率,基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。即实现了客诉升级的自动化识别,此外,基于静态投诉升级概率与动态投诉升级概率确定所述用户是否进行客诉升级,能够提升客诉升级预测的准确性。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的及附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例的一种客诉升级预测方法的流程示意图;
图2为本申请实施例的一种客诉升级预测装置的结构示意图;
图3为本申请实施例的一种电子设备的结构示意图;
图4为本申请实施例的获取用户问题的BERT模型结构示意图;
图5为本申请实施例的声纹特征提取流程示意图。
具体实施方式
下面详细描述本申请的实施例,各实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件及组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件及它们的组。这里使用的措辞“及”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施一
本申请实施例提供了一种客诉升级预测方法,如图1所示,该方法可以包括以下步骤:
步骤S101,获取用户与客服的语音通话信息;
具体地,获取用户与客服的通话语音信息。具体地,该通话语音信息可以是用户进入客服渠道之后,用户与客服的通话语音信息。具体地,在用户进入客服渠道之前,可以先对用户是否可能投诉进行初始识别(如,根据用户基本信息和用户以前的投诉行为,通过DNN算法获取用户可能投诉的问题,以及投诉该问题的概率),如果投诉概率高,则分配至经验丰富的客服人员。
步骤S102,对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率;
具体地,通过语音识别方法对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率;其中,该语音识别方法可以是通过预训练的神经网络模型实现的;其中,基于大数据分析技术预先确定各个投诉问题对应的静态投诉升级概率。
示例性地,统计两年的用户问题和投诉概率的关系,用Q=(q1,q2,…,qm)表示用户投诉问题的集合,N=(nq1,nq2,…,nqm)表示每个投诉问题的投诉量,nqi表示问题qi的投诉数量,则,为问题qi的投诉升级概率为:
步骤S103,基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率;
具体地,通过相应的声纹特征提取方法提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率。
步骤S104,基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。
具体地,对静态投诉升级概率与动态投诉升级概率进行加权计算,确定客服是否升级。
示例性地,用PS表示用户的静态投诉升级概率,用PA表示用户的动态投诉升级概率,根据数据经验,用户最终的投诉升级概率P可表示为:
P=0.7*PS+0.3*PA 公式2
本申请实施例提供了一种客诉升级预测方法,与现有技术将通过人工的方式识别客诉升级相比,本申请通过获取用户与客服的语音通话信息,对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率,基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率,基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。即实现了客诉升级的自动化识别,此外,基于静态投诉升级概率与动态投诉升级概率确定所述用户是否进行客诉升级,能够提升客诉升级预测的准确性。
本申请实施例还提供了一种可能的实现方式,步骤S102的所述基于所述对话内容确定用户的投诉问题,包括:
步骤S1021(图中未示出),基于所述对话内容通过BERT算法确定用户的投诉问题。
示例性地,在用户进入客服渠道后,用户问题的预测则会采用基于BERT(Bidirectional Encoder Representations from Transformers)模型,通过上下文体现词的不同含义。BERT模型是由双向Transformer组成的一个特征抽取模型。Transformer所使用的注意力机制的核心思想是去计算一句话中每个词对这句话中所有词的相互关系,然后认为词与词的相互关系在一定程度上反应了这句话中不同词之间的关联性以及重要程度。BERT模型在训练过程中使用masked language model,随机遮挡输入中的一些tokens,进行预训练,同时增加句子级任务next sentence prediction,随机替换一些句子,利用上一句进行isNext/notNext的预测。通过这两项任务,使用大规模无标注语料进行优化,最后得到预训练好的BERT模型。本文模型以Google Bert Multilingual预训练模型为基础,包括12-layers,768-hidden size,12-heads,约1亿参数。问答模型利用用户的回答,对预训练模型进行做多分类任务,进行有监督训练,在预测置信度较低的语料中挑出错误标签进行重新标注,进行微调,在训练预测的平均错误率不再明显降低(约20到30epoch之后),模型停止微调,并得到问题识别模型。
本发明所使用的模型结构如图4所示,经语音转文本后的文本,通过one-hot编码预处理为文本向量,文本向量先通过12层attention网络,再通过一个全连接层,最后通过softmax层得到用户的问题。训练数据来自业务标注,总结的用户问题同样来自业务经验。
对于本申请实施例,解决了用户投诉问题的确定问题。
本申请实施例提供了一种可能的实现方式,步骤S103包括:
步骤S1031(图中未示出),确定所述用户的基础情绪声纹特征;
步骤S1032(图中未示出),基于所述用户的基础情绪声纹特征与所述用户的声纹特征确定所述用户的动态升级概率。
具体地,可以通过计算基础情绪声纹特征与所述用户的声纹特征的内积确定所述用户的动态升级概率。
示例性地,WMFCC=(M1,M2,M3,…,Mi,…,MN)表示用户一句话的WMFCC特征,用wi表示用户第i句话的声纹特征,则:
用wpr表示用户的标准声纹特征,用户的动态投诉概率为:
对于本申请实施例,解决了用户的动态投诉概率的具体确定问题。
本申请实施例提供了一种可能的实现方式,该方法还包括:
步骤S105(图中未示出),确定所述用户之前是否来电;
步骤S106(图中未示出),如果所述用户之前来电,搜索用户情绪声纹特征库,确定所述用户的基础情绪声纹特征;
步骤S107(图中未示出),如果所述用户第一次来电,将所述通话语音信息中所述用户预定时间长度的起始语音声纹特征作为基础情绪声纹特征。
示例性地,可以基于用户的手机号信息判断用户之前是否有来电。如果有来电,则从声纹数据库中提取该用户的标准情绪特征;如果没有来电,则提取用户的前三句话的声纹情绪特征,作为用户的基础情绪特征。
对于本申请实施例,解决了用户的基础情绪特征的确定问题。
本申请实施例提供了一种可能的实现方式,步骤S103的所述基于所述语音通话信息提取所述用户的声纹特征,包括:
步骤S1031(图中未示出),对所述语音通话信息进行语音分离处理,得到所述用户的语音信息;
步骤S1032(图中未示出),基于所述用户的语音信息提取得到所述用户的声纹特征。
具体地,可以通过相应的语音分离算法对语音通话信息进行语音分离,得到用户的语音信息。
具体地,可以通过WMFCC提取用户的声纹特征,基于所述用户的语音信息通过熵加权法提取得到所述用户的声纹特征。
其中,语音特征参数的提取对声纹识别至关重要。在声纹识别领域,最常用的是MFCC方法,但是该方法提取的具有低阶倒谱系数和特征成分的声纹特征,对音频文件的表达能力不强,为了平衡音频特征的敏感部分,本发明通过计算熵值来分析每个维特征参数对声纹表示的贡献,并通过熵加权法提取声纹特征,从而改善系统的识别精度。示例性地,识别流程图如图5所示:
预加重与分帧
为了消除发声过程中嘴唇和声带的影响,补偿被发声系统抑制的语音信号的高频部分并突出高频共振峰。因此,将一阶微分方程应用于语音样本以增加高频共振峰的幅度,把语音信号通过一个高通滤波器:
H(z)=1-kz-1 公式5
其中,k为预加重系数,其值在[0,1]之间,通常选用0.97。
在分帧步骤中,语音信号被分成N个采样帧。为了避免两个相邻帧的过度变化,相邻帧之间存在一个重叠区域,重叠区域包含M个采样帧,且M<N。一般都是讲音频信号进行分帧处理,假设每帧内都是平稳的,一般采用20-30ms为一帧,25%,50%,75%的重叠率。
加窗
加窗目的是减少信号不连续性,并使末端足够平滑以与起点连接。常用的窗函数就是汉明窗。假设分帧后的信号为Sn,其中n=1,…,N,加窗后的信号可表示为:
快速傅里叶变换
快速傅里叶变换(FFT)将N个样本从时域转换到频域,使用FFT是因为它是实现离散傅里叶变换(DFT)的快速算法,公式如下:
其中,sk为输入的语音信号,N为傅里叶变换的采样点。
Mel滤波分析
频域中有多个冗余信号,Mel滤波器组可以根据人耳的听力范围,简化频域的幅度。人耳对声音的感知不是线性的,用log的非线性关系可以更好地描述它。Mel频率与语音信号之间的关系如公式:
其中,Mel(f)为梅尔频率,f为信号的频率,单位为赫兹。
DCT变换
通过离散余弦变换计算MFCC,公式如下:
其中,N为滤波通道,mj为第j个梅尔滤波的强度。
参数加权
采用倒频谱系数的主要优点是它们彼此不相关。可以方便地分析每个阶的倒谱系数。但是与情绪信息相关的高频倒谱系数很小,不能有效区分,因此,本发明使用了熵方法提高特征对特征的描述能力。熵权法是一种计算相互独立变量之间权重的客观赋权方法。分量的权重根据计算分量的信息熵确定,熵值越大,携带的信息越少,分量的权重越小。相反,熵值越小,所携带的信息越多,分量的权重越大。
对于如下表示的声纹特征:
MFCC=(M1,M2,M3,…,Mi,…,MN) 公式10
其中,Mi=(meli(1),…,meli(j),…,meli(D))为MFCC中第i个特征。D为该特征的维度,N为帧数,meli(j)表示第i帧声纹特征的第j个特征向量。
首先,将特征归一化:
熵的定义如下:
计算MFCC各组成部分的重量,得到的新参数如下所示:
wMi=(w1·meli(1),…,wD·meli(D)) 公式14
即WMFCC的输出为
wmel=(w1·meli(1),…,wD·meli(D)) 公式15
实施例二
图2为本申请实施例提供的一种客诉升级预测装置,该装置20包括:获取模块201、第一确定模块202、第二确定模块203、第三确定模块204,其中,
获取模块201,用于获取用户与客服的语音通话信息;
第一确定模块202,用于对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率;
第二确定模块203,用于基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率;
第三确定模块204,用于基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。
本申请实施例提供了一种客诉升级预测装置,与现有技术将通过人工的方式识别客诉升级相比,本申请通过获取用户与客服的语音通话信息,对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率,基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率,基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。即实现了客诉升级的自动化识别,此外,基于静态投诉升级概率与动态投诉升级概率确定所述用户是否进行客诉升级,能够提升客诉升级预测的准确性。
本实施例的客诉升级预测装置可执行本申请上述实施例中提供的一种客诉升级预测方法,其实现原理相类似,此处不再赘述。
本申请实施例提供了一种可能的实现方式,所述第一确定模块具体用于基于所述对话内容通过BERT算法确定用户的投诉问题。
本申请实施例提供了一种可能的实现方式,具体地,所述第二确定模块包括:
第一确定单元,用于确定所述用户的基础情绪声纹特征;
第二确定单元,用于基于所述用户的基础情绪声纹特征与所述用户的声纹特征确定所述用户的动态升级概率。
本申请实施例提供了一种可能的实现方式,进一步地,该装置还包括:
第四确定模块,用于确定所述用户之前是否来电;以及用于如果所述用户之前来电,搜索用户情绪声纹特征库,确定所述用户的基础情绪声纹特征;以及用于如果所述用户第一次来电,将所述通话语音信息中所述用户预定时间长度的起始语音声纹特征作为基础情绪声纹特征。
本申请实施例提供了一种可能的实现方式,所述第二确定模块包括:
语音分离单元,用于对所述语音通话信息进行语音分离处理,得到所述用户的语音信息;
提取单元,用于基于所述用户的语音信息提取得到所述用户的声纹特征。
具体地,提取单元用于通过熵加权法提取得到所述用户的声纹特征。
本申请实施例提供了一种客诉升级预测装置,适用于上述实施例所示的方法,在此不再赘述。
实施例三
本申请实施例提供了一种电子设备,如图3所示,图3所示的电子设备30包括:处理器3001和存储器3003。其中,处理器3001和存储器3003相连,如通过总线3002相连。进一步地,电子设备30还可以包括收发器3003。需要说明的是,实际应用中收发器3004不限于一个,该电子设备30的结构并不构成对本申请实施例的限定。其中,处理器3001应用于本申请实施例中,用于实现图2所示的模块的功能。收发器3003包括接收机和发射机。
处理器3001可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器3001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线3002可包括一通路,在上述组件之间传送信息。总线3002可以是PCI总线或EISA总线等。总线3002可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器3003可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器3003用于存储执行本申请方案的应用程序代码,并由处理器3001来控制执行。处理器3001用于执行存储器3003中存储的应用程序代码,以实现图2所示实施例提供的客诉升级预测装置的功能。
本申请实施例提供了一种电子设备,与现有技术将通过人工的方式识别客诉升级相比,本申请通过获取用户与客服的语音通话信息,对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率,基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率,基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。即实现了客诉升级的自动化识别,此外,基于静态投诉升级概率与动态投诉升级概率确定所述用户是否进行客诉升级,能够提升客诉升级预测的准确性。
本申请实施例提供了一种电子设备适用于上述方法实施例。在此不再赘述。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述实施例中所示的方法。
本申请实施例提供了一种计算机可读存储介质,与现有技术将通过人工的方式识别客诉升级相比,本申请通过获取用户与客服的语音通话信息,对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率,基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率,基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。即实现了客诉升级的自动化识别,此外,基于静态投诉升级概率与动态投诉升级概率确定所述用户是否进行客诉升级,能够提升客诉升级预测的准确性。
本申请实施例提供了一种计算机可读存储介质适用于上述方法实施例。在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (9)
1.一种客诉升级预测方法,其特征在于,包括:
获取用户与客服的语音通话信息;
对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率;
基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率;
基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。
2.根据权利要求1所述的方法,其特征在于,所述基于所述对话内容确定用户的投诉问题,包括:
基于所述对话内容通过BERT算法确定用户的投诉问题。
3.根据权利要求1所述的方法,其特征在于,所述基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率,包括:
确定所述用户的基础情绪声纹特征;
基于所述用户的基础情绪声纹特征与所述用户的声纹特征确定所述用户的动态升级概率。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
确定所述用户之前是否来电;
如果所述用户之前来电,搜索用户情绪声纹特征库,确定所述用户的基础情绪声纹特征;
如果所述用户第一次来电,将所述通话语音信息中所述用户预定时间长度的起始语音声纹特征作为基础情绪声纹特征。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述基于所述语音通话信息提取所述用户的声纹特征,包括:
对所述语音通话信息进行语音分离处理,得到所述用户的语音信息;
基于所述用户的语音信息提取得到所述用户的声纹特征。
6.根据权利要求5所述的方法,其特征在于,所述基于所述用户的语音信息提取得到所述用户的声纹特征,包括:
基于所述用户的语音信息通过熵加权法提取得到所述用户的声纹特征。
7.一种客诉升级预测装置,其特征在于,该装置还包括:
获取模块,用于获取用户与客服的语音通话信息;
第一确定模块,用于对所述语音通话信息进行语音识别得到所述用户与所述客服的对话内容,并基于所述对话内容确定用户的投诉问题,以及基于所述投诉问题确定所述用户的静态投诉升级概率;
第二确定模块,用于基于所述语音通话信息提取所述用户的声纹特征,并基于所述声纹特征确定所述用户的动态投诉升级概率;
第三确定模块,用于基于所述静态投诉升级概率与所述动态投诉升级概率确定所述用户是否进行客诉升级。
8.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1至6任一项所述的客诉升级预测方法。
9.一种计算机可读存储介质,其特征在于,所述计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1至6中任一项所述的客诉升级预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010881626.3A CN112052994A (zh) | 2020-08-28 | 2020-08-28 | 客诉升级预测方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010881626.3A CN112052994A (zh) | 2020-08-28 | 2020-08-28 | 客诉升级预测方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112052994A true CN112052994A (zh) | 2020-12-08 |
Family
ID=73599469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010881626.3A Pending CN112052994A (zh) | 2020-08-28 | 2020-08-28 | 客诉升级预测方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112052994A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113342960A (zh) * | 2021-07-07 | 2021-09-03 | 上海华客信息科技有限公司 | 客户诉求处理方法、系统、设备及存储介质 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030202643A1 (en) * | 2002-04-29 | 2003-10-30 | Sbc Technology Resources, Inc. | System and method for automating customer slamming and cramming complaints |
CN103811009A (zh) * | 2014-03-13 | 2014-05-21 | 华东理工大学 | 一种基于语音分析的智能电话客服系统 |
CN104834849A (zh) * | 2015-04-14 | 2015-08-12 | 时代亿宝(北京)科技有限公司 | 基于声纹识别和人脸识别的双因素身份认证方法及系统 |
CN104835498A (zh) * | 2015-05-25 | 2015-08-12 | 重庆大学 | 基于多类型组合特征参数的声纹识别方法 |
CN107452385A (zh) * | 2017-08-16 | 2017-12-08 | 北京世纪好未来教育科技有限公司 | 一种基于语音的数据评价方法及装置 |
CN108550375A (zh) * | 2018-03-14 | 2018-09-18 | 鲁东大学 | 一种基于语音信号的情感识别方法、装置和计算机设备 |
KR20180120488A (ko) * | 2017-04-27 | 2018-11-06 | 한양대학교 산학협력단 | 텍스트 마이닝 기법을 활용한 고객 불만에 대한 분류 및 예측 방법 |
CN109087648A (zh) * | 2018-08-21 | 2018-12-25 | 平安科技(深圳)有限公司 | 柜台语音监控方法、装置、计算机设备及存储介质 |
CN109858702A (zh) * | 2019-02-14 | 2019-06-07 | 中国联合网络通信集团有限公司 | 客户升级投诉的预测方法、装置、设备及可读存储介质 |
CN109961248A (zh) * | 2017-12-25 | 2019-07-02 | 顺丰科技有限公司 | 运单投诉预测方法、装置、设备及其存储介质 |
CN109992653A (zh) * | 2019-03-27 | 2019-07-09 | 京东数字科技控股有限公司 | 信息处理方法和处理系统 |
CN110347840A (zh) * | 2019-07-18 | 2019-10-18 | 携程计算机技术(上海)有限公司 | 投诉文本类别的预测方法、系统、设备和存储介质 |
CN110378712A (zh) * | 2019-07-26 | 2019-10-25 | 上海秒针网络科技有限公司 | 一种投诉处理方法及装置 |
CN110570208A (zh) * | 2019-07-29 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 投诉预处理方法以及装置 |
CN110889526A (zh) * | 2018-09-07 | 2020-03-17 | 中国移动通信集团有限公司 | 一种用户升级投诉行为预测方法及系统 |
CN111340264A (zh) * | 2018-12-18 | 2020-06-26 | 中国移动通信集团广东有限公司 | 基于升级多差树模型的投诉升级预测方法及装置 |
CN111507513A (zh) * | 2020-04-10 | 2020-08-07 | 中国联合网络通信集团有限公司 | 潜在投诉用户预测方法、装置、电子设备及存储介质 |
-
2020
- 2020-08-28 CN CN202010881626.3A patent/CN112052994A/zh active Pending
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030202643A1 (en) * | 2002-04-29 | 2003-10-30 | Sbc Technology Resources, Inc. | System and method for automating customer slamming and cramming complaints |
CN103811009A (zh) * | 2014-03-13 | 2014-05-21 | 华东理工大学 | 一种基于语音分析的智能电话客服系统 |
CN104834849A (zh) * | 2015-04-14 | 2015-08-12 | 时代亿宝(北京)科技有限公司 | 基于声纹识别和人脸识别的双因素身份认证方法及系统 |
CN104835498A (zh) * | 2015-05-25 | 2015-08-12 | 重庆大学 | 基于多类型组合特征参数的声纹识别方法 |
KR20180120488A (ko) * | 2017-04-27 | 2018-11-06 | 한양대학교 산학협력단 | 텍스트 마이닝 기법을 활용한 고객 불만에 대한 분류 및 예측 방법 |
CN107452385A (zh) * | 2017-08-16 | 2017-12-08 | 北京世纪好未来教育科技有限公司 | 一种基于语音的数据评价方法及装置 |
CN109961248A (zh) * | 2017-12-25 | 2019-07-02 | 顺丰科技有限公司 | 运单投诉预测方法、装置、设备及其存储介质 |
CN108550375A (zh) * | 2018-03-14 | 2018-09-18 | 鲁东大学 | 一种基于语音信号的情感识别方法、装置和计算机设备 |
CN109087648A (zh) * | 2018-08-21 | 2018-12-25 | 平安科技(深圳)有限公司 | 柜台语音监控方法、装置、计算机设备及存储介质 |
CN110889526A (zh) * | 2018-09-07 | 2020-03-17 | 中国移动通信集团有限公司 | 一种用户升级投诉行为预测方法及系统 |
CN111340264A (zh) * | 2018-12-18 | 2020-06-26 | 中国移动通信集团广东有限公司 | 基于升级多差树模型的投诉升级预测方法及装置 |
CN109858702A (zh) * | 2019-02-14 | 2019-06-07 | 中国联合网络通信集团有限公司 | 客户升级投诉的预测方法、装置、设备及可读存储介质 |
CN109992653A (zh) * | 2019-03-27 | 2019-07-09 | 京东数字科技控股有限公司 | 信息处理方法和处理系统 |
CN110347840A (zh) * | 2019-07-18 | 2019-10-18 | 携程计算机技术(上海)有限公司 | 投诉文本类别的预测方法、系统、设备和存储介质 |
CN110378712A (zh) * | 2019-07-26 | 2019-10-25 | 上海秒针网络科技有限公司 | 一种投诉处理方法及装置 |
CN110570208A (zh) * | 2019-07-29 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 投诉预处理方法以及装置 |
CN111507513A (zh) * | 2020-04-10 | 2020-08-07 | 中国联合网络通信集团有限公司 | 潜在投诉用户预测方法、装置、电子设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113342960A (zh) * | 2021-07-07 | 2021-09-03 | 上海华客信息科技有限公司 | 客户诉求处理方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10878823B2 (en) | Voiceprint recognition method, device, terminal apparatus and storage medium | |
US10412223B2 (en) | Personalized support routing based on paralinguistic information | |
CN110827805B (zh) | 语音识别模型训练方法、语音识别方法和装置 | |
CN110457432A (zh) | 面试评分方法、装置、设备及存储介质 | |
CN108108357B (zh) | 口音转换方法及装置、电子设备 | |
CN113488024B (zh) | 一种基于语义识别的电话打断识别方法和系统 | |
CN110136726A (zh) | 一种语音性别的估计方法、装置、系统及存储介质 | |
CN113628627A (zh) | 一种基于结构化语音分析的电力行业客户服务质检系统 | |
CN110782902A (zh) | 音频数据确定方法、装置、设备和介质 | |
CN115273841A (zh) | 语音拒识方法、装置、服务设备及存储介质 | |
CN116631412A (zh) | 一种通过声纹匹配判断语音机器人的方法 | |
CN114610840A (zh) | 基于敏感词的账务监控方法、装置、设备及存储介质 | |
Nematollahi et al. | Speaker frame selection for digital speech watermarking | |
CN112052994A (zh) | 客诉升级预测方法、装置及电子设备 | |
Selvan et al. | Emotion detection on phone calls during emergency using ensemble model with hyper parameter tuning | |
Esmaili et al. | An automatic prolongation detection approach in continuous speech with robustness against speaking rate variations | |
Johar | Paralinguistic profiling using speech recognition | |
CN113506565B (zh) | 语音识别的方法、装置、计算机可读存储介质与处理器 | |
CN114582373A (zh) | 用于在人机对话中识别用户情绪的方法及装置 | |
Camarena-Ibarrola et al. | Speaker identification using entropygrams and convolutional neural networks | |
Korvel et al. | Comparative analysis of spectral and cepstral feature extraction techniques for phoneme modelling | |
Van et al. | Text-dependent Speaker Recognition System Based on Speaking Frequency Characteristics | |
CN112599114B (zh) | 一种语音识别方法及装置 | |
CN117935865B (zh) | 一种用于个性化营销的用户情感分析方法及系统 | |
Larsson Alm | Automatic Speech Quality Assessment in Unified Communication: A Case Study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |