CN116071079B - 一种基于客服通话语音的客户满意度预测方法 - Google Patents

一种基于客服通话语音的客户满意度预测方法 Download PDF

Info

Publication number
CN116071079B
CN116071079B CN202310322916.8A CN202310322916A CN116071079B CN 116071079 B CN116071079 B CN 116071079B CN 202310322916 A CN202310322916 A CN 202310322916A CN 116071079 B CN116071079 B CN 116071079B
Authority
CN
China
Prior art keywords
prediction
voice
customer
model
customer satisfaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310322916.8A
Other languages
English (en)
Other versions
CN116071079A (zh
Inventor
孙晓倩
王笑一
潘瑞平
刘露
王明珠
夏晓宇
叶柏峰
王迪
陈晓龙
孙丽蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Co ltd Customer Service Center
Original Assignee
State Grid Co ltd Customer Service Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Co ltd Customer Service Center filed Critical State Grid Co ltd Customer Service Center
Priority to CN202310322916.8A priority Critical patent/CN116071079B/zh
Publication of CN116071079A publication Critical patent/CN116071079A/zh
Application granted granted Critical
Publication of CN116071079B publication Critical patent/CN116071079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Water Supply & Treatment (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Public Health (AREA)
  • Child & Adolescent Psychology (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)

Abstract

一种基于客服通话语音的客户满意度预测方法,包括:S1、构建面向95598客服通话语音的语音识别深度学习模型;S2、获取95598客服通话语音资料和对应的客户满意度评价结果;S3、用训练集训练客户满意度预测底层模型;S4、构建预测风险可控的客户满意度预测模型;S5、将待预测的95598客服通话语音输入到客户满意度预测模型,得到客户满意度预测结果。本发明考虑客户在语音交流中存在的语音、语调、情感等信息,保证满意度预测的准确性;能够将预测结果和输入语音的各个部分进行关联,预测结果具备可解释性,能够对客户满意度预测结果在语音层面进行溯源分析;预测结果具备可靠性以及统计意义下的可解释性,适用于客户满意度预测这一风险厌恶型应用场景。

Description

一种基于客服通话语音的客户满意度预测方法
技术领域
本发明属于模式识别技术领域,具体涉及一种基于客服通话语音的客户满意度预测方法。
背景技术
在电力企业供电服务过程中,客户服务作为一项重要的经营活动,不仅关系到电力客户的切身利益和电力企业的经营效益,更影响到电力行业的社会责任与企业形象。随着电力体制改革和国家全面深化改革的纵深推进,营造良好的客户体验和客户满意度对电力企业管理水平提出了更大的挑战。95598全国供电服务热线作为重要的国家电网公司客服渠道,具有方便性和快捷性,已成为电力客户提供诉求的优选方式。
客户对95598客服服务是否满意,是国家电网有限公司客户服务中心的重点关注内容。通过预测客户满意度,能够在电话语音服务结束后,提前感知可能存在的不满意风险,及时跟进后续服务,避免客户投诉。
现有的客户满意度预测方法,主要基于95598客服通话结束后形成的工单文件信息构建预测模型,没有充分利用服务过程中产生的第一手语音资料,忽略了客户在语音交流中存在的语音、语调、情感等信息,而这些信息与客户对客服服务是否满意至关重要。此外,现有的预测方法的预测结果缺乏可靠性,无法对预测风险进行有效控制。
因此,为提高客户满意度预测的准确性和可靠性,亟需一种基于基于客服通话语音的客户满意度预测方法,直接通过通话语音预测客户满意度,且预测风险可控,以提升服务质量。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于客服通话语音的客户满意度预测方法,旨在直接通过客服通话语音资料,充分考虑客户在语音交流中存在的语音、语调、情感等信息,实现对客户满意度的精准预测,且预测结果的风险可控。
本发明解决其技术问题是通过以下技术方案实现的:
一种基于客服通话语音的客户满意度预测方法,其特征在于:所述预测方法的步骤为:
S1、构建面向95598客服通话语音的语音识别深度学习模型,所述语音识别深度学习模型包括语音特征提取器、编码器及解码器,所述语音特征提取器用于提取客服通话语音特征,所述编码器用于对所述语音特征进行深层编码并形成客服通话语音隐层表征,所述解码器用于将隐层表征解码成客服通话语音对应的中文文本;
S2、获取95598客服通话语音资料和对应的客户满意度评价结果,以所述95598客服通话语音资料为输入,以所述对应的客户满意度评价结果为输出,构建训练集、校验集及测试集,分别用于训练客户满意度预测底层模型、校准所述客户满意度预测底层模型进而形成预测风险可控的客户满意度预测模型、测试预测风险可控的客户满意度预测模型;
S3、用所述训练集训练客户满意度预测底层模型,所述客户满意度预测底层模型分为语音隐层表征提取器和语音隐层表征分类器,所述语音隐层表征提取器用于提取客服通话语音资料的隐层表征,通过所述面向95598客服通话语音的语音识别深度学习模型作用到客服通话语音资料得到的所述编码器的输出获得;所述语音隐层表征分类器使用深度神经网络实现,所述训练客户满意度预测底层模型即为通过所述训练集训练所述语音隐层表征分类器中的参数;
S4、用所述客户满意度预测底层模型及所述校验集,基于一致性风险控制方法构建预测风险可控的客户满意度预测模型;
S5、将待预测的95598客服通话语音输入到风险可控的客户满意度预测模型,得到客户满意度的预测结果。
而且,所述语音识别深度学习模型使用公开语音数据集进行预训练,并在95598客服通话语音数据上利用迁移学习对学习模型参数进行调整。
而且,所述训练集和校验集中的语音数据隐层表征使用数据增广技术进行数据扩充,以充分训练所述语音隐层表征分类器,所述数据增广技术为:
1)提取95598客服通话语音资料的声学特征,并在声学特征层面对数据进行增广,形成增广的声学特征数据;
2)将所述增广的声学特征数据输入到所述面向95598客服通话语音的语音识别深度学习模型,得到增广的95598客服通话语音资料的隐层表征;
3)以所述增广的95598客服通话语音资料的隐层表征为输入,所述对应的客户满意度评价结果为标签,对数据进行增广。
而且,所述语音隐层表征分类器使用具有注意力机制的Transformer编码器对所述95598客服通话语音资料的隐层表征进行进一步特征提取,所述Transformer编码器的输入端引入类别符号编码向量和位置嵌入向量,用于提高预测效果;将类别符号对应的Transformer编码向量送入单隐层全连接神经网络,并在输出端引入Softmax激活函数,输出各个类别的概率估计值,形成所述客户满意度预测底层模型。
而且,所述Transformer编码器的注意力机制采用点乘注意力和多头注意力,并通过所述类别符号编码向量与所述Transformer编码器输出的各语音的隐层表征的注意力大小,溯源分类结果和语音各部分的关系,增强所述预测风险可控的客户满意度预测模型的可解释性。
而且,所述类别符号编码向量和所述位置嵌入向量采用随机方式进行初始化,并通过训练过程确定最终参数。
而且,将客户满意度预测问题看做配备类别损失的分类问题,分类类别至少包含不满意和满意两个类别,对一类别c,其配备的类别损失记为l c ,用以度量第i个类别未被正确预测的情况下,预测模型造成的预测损失,预测模型的风险为预测模型在测试阶段预测损失的数学期望,可以通过所述测试集上的预测结果的平均损失进行度量,使用面向配备类别损失的分类问题的一致性风险控制方法,构建所述风险可控的客户满意度预测模型,由所述客户满意度预测底层模型和参数l构建待校准的客户满意度预测模型C λ ,对于任意一段95598客服通话语音x,C λ (x)为预测的类别集合,且满足如下单调性:
Figure SMS_1
x对应的类别为y,则对于预测结果C λ (x),其预测损失为L(y,C λ (x)),记所述校验集为{(x i ,y i )},i=1,¼,n,其中n为校验集样本量,则可根据校验集得到待校准的客户满意度预测模型C λ 在校验集上的风险估计值:
Figure SMS_2
根据一致性风险控制方法,确定最优参数l*如下:
Figure SMS_3
Figure SMS_4
α为根据具体应用场景,人为设定的风险上限,即要求所述客户满意度预测模型预测风险应低于α,预测风险可控;
所述待校准的客户满意度预测模型C λ 定义如下:
Figure SMS_5
其中:f c (x)为所述客户满意度预测底层模型对语音x属于类别c的概率估计值;
γ c 为度量类别c重要程度的参数;
所述预测损失L(y,C λ (x))定义如下:
Figure SMS_6
其中:Ⅱ(•)为指示函数;即若y不在预测结果C λ (x)当中,损失为l y ,反之为0,通过该损失度量预测结果不包含真实类别时造成的损失,可以直接设定为预测结果不包含真实类别时造成的经济损失。
本发明的优点和有益效果为:
1、本发明直接以95598客服通话语音资料为模型的输入资料,考虑了客户在语音交流中存在的语音、语调、情感等信息,而这些信息与客户对客服服务是否满意至关重要,能够保证满意度预测的准确性。
2、本发明采用基于注意力机制的Transformer分类器构建客户满意度预测模型,模型通过注意力强度,能够将预测结果和输入语音的各个部分进行关联,使模型得预测结果具备可解释性,能够对客户满意度预测结果在语音层面进行溯源分析。
3、本发明基于一致性风险控制方法得到客户满意度的预测结果,预测结果具备可靠性以及统计意义下的可解释性,适用于客户满意度预测这一风险厌恶型应用场景。
附图说明
图1为本发明基于客服通话语音的客户满意度预测方法流程图;
图2为本发明实施例中基于客服通话语音的客户满意度预测方法建模与检验过程的示意图。
实施方式
下面通过具体实施例对本发明作进一步详述,以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。
如图1所示,一种基于客服通话语音的客户满意度预测方法,建模与检验过程如图2所示,其创新之处在于:所述方法的步骤为:
S1、收集来自公开语音数据集AISHELL-1的音频数据和对应的文本标注,预训练一个中文语音识别模型。收集95598客服通话的音频数据和对应的文本标注,使用迁移学习技术,对所述预训练的中文语音识别模型参数进行微调,得到面向95598客服通话语音的语音识别深度学习模型。所述面向95598客服通话语音的语音识别深度学习模型包括语音特征提取器、编码器、解码器。所述语音特征提取器用于提取客服通话语音特征,所述编码器用于对所述语音特征进行深层编码,形成客服通话语音的隐层表征,所述解码器用于将所述隐层表征解码成客服通话语音对应的中文文本。
S2、收集95598客服通话的音频数据和对应的客户满意度评价结果,评价结果分为满意和不满意两种类别。将95598客服通话语音资料输入所述语音识别深度学习模型,通过所述编码器的输出得到95598客服通话语音资料的隐层表征资料。以所述隐层表征资料为输入,对应的客户满意度评价结果为标签,构建训练集、校验集和测试集,分别用于训练客户满意度预测底层模型,构建预测风险可控的客户满意度预测模型和测试预测风险可控的客户满意度预测模型。其中,所述训练集和校验集使用数据增广技术进行数据扩充,使用的数据增广技术为:
1)提取95598客服通话语音的声学特征,利用SpecAugment技术在声学特征层面对数据进行增广,形成增广的声学特征数据;
2)将所述增广的声学特征数据输入到所述面向95598客服通话语音的语音识别深度学习模型,得到增广的95598客服通话语音资料的隐层表征;
3)以所述增广的95598客服通话语音资料的隐层表征为输入,所述对应的客户满意度评价结果为标签,对数据集进行增广。
S3、用所述训练集训练一个客户满意度预测底层模型,所述客户满意度预测底层模型使用具有注意力机制的Transformer编码器对所述95598客服通话语音资料的隐层表征进行特征提取。Transformer编码器的注意力机制采用点乘注意力和多头注意力,并通过类别符号编码向量与所述编码器输出的各语音的隐层表征的注意力大小,溯源分类结果和语音的关联关系,增强模型的可解释性。所述Transformer编码器的输入端引入类别符号编码向量和位置嵌入向量,用于提高预测效果。所述类别符号编码向量和位置嵌入向量采用随机方式进行初始化,并通过训练过程确定最终参数。将类别符号对应的Transformer编码向量送入单隐层全连接神经网络,并在输出端引入Softmax激活函数,输出各个类别的概率估计值,形成客户满意度预测底层模型。使用交叉熵损失函数和Adam优化方法对客户满意度预测底层模型进行训练。本实施例中,Adam优化使用的学习率为0.00001,迭代轮数为100。
S4、将客户满意度预测问题看做配备类别损失的分类问题,并根据应用场景设置类别损失。其中分类的类别为满意和不满意两种类别。设输入语音
Figure SMS_7
对应的类别为y,若输入语音对应的是满意类别,记y=0,反之,记y=1。相应地,满意类别的损失记为l 0,用以度量客户在满意的情况下,客户满意度预测模型未能正确预测客户满意所造成的损失;不满意类别的损失记为l 1,用以度量客户在不满意的情况下,客户满意度预测模型未能正确预测客户不满意所造成的损失。本实施例中,设l 0=0.01,l 1=100,可以理解为模型未正确预测客户满意带来的经济损失为0.01万元,而未正确预测客户不满意带来的经济损失为100万元。
S5、为保障客户满意度预测模型的预测风险可控,基于所述客户满意度预测底层模型和所述校验集,使用面向配备类别损失的分类问题的一致性风险控制方法,构建预测风险可控的客户满意度预测模型。具体地,由所述客户满意度预测底层模型和参数l构建待校准的客户满意度预测模型C λ 。对于任意一段客服通话语音x,C λ (x)为预测的类别集合,其定义如下:
Figure SMS_8
其中:f c (x)为客户满意度预测底层模型对语音x属于类别c的概率估计值,γ c 为度量类别c重要程度的参数。本实施例中,分别取γ 0=l 0γ 1=l 1γ 0=1,γ 1=1,用以构建预测风险可控的客户满意度预测模型,用以验证考虑类别重要程度的预测风险可控的客户满意度预测模型的优势。
S6、定义待校准的客户满意度预测模型C λ 的预测损失如下:
Figure SMS_9
其中:Ⅱ(•)为指示函数,即若y不在预测结果C λ (x)当中,损失为l y ,反之为0。通过该损失度量预测结果不包含真实类别时造成的损失。根据所述预测损失,计算待校准的客户满意度预测模型C λ 在校验集上的风险估计值:
Figure SMS_10
并通过所述风险估计值确定最优参数l*如下:
Figure SMS_11
其中:
Figure SMS_12
α为人为设定的风险上限,即要求客户满意度预测模型预测结果的风险低于α。风险上限可根据实际应用取定,若取α=1,可以理解为要求客户满意度预测模型预测结果的平均经济损失不高于1万元。
以下为上述实施例的对比验证结果:
为了验证本发明的实际应用效果,本发明收集了178h的AISHELL-1公开语音数据和24.3h的95598客服通话语音数据构建所述面向95598客服通话语音的语音识别深度学习模型。另外,收集了906条95598客服通话资料和对应的客户满意度评价结果,评价结果包括满意和不满意两类。将所述906个数据按照6:2:2的比例分为训练集、校验集和测试集,分别用于训练客户满意度预测底层模型,构建预测风险可控的客户满意度预测模型和测试预测风险可控的客户满意度预测模型。
本实施例关注客户满意度预测模型的两个指标,其一为客户满意度预测模型在测试集上的预测风险,即客户满意度预测模型在测试集上的平均损失。若客户满意度预测模型在测试集上的预测风险不大于人为设定的风险上限α,则说明客户满意度预测模型具备预测风险可控的特性。其二为客户满意度预测模型预测类别标签集合的平均个数。在客户满意度预测模型预测风险可控的前提下,若客户满意度预测模型预测类别标签集合的平均个数越小,则说明客户满意度预测模型预测的信息量越大。因此,所述预测类别标签集合的平均个数指标越小越好。
1、本发明提出的客户满意度预测模型具备风险可控特性
本实施例的第一组实验结果,用于检验本发明提出的客户满意度预测模型是否具备风险可控特性。共有4个模型参与检验,模型CRC(γ c =1)为不采用样本增广策略训练客户满意度预测底层模型,且不考虑类别重要性并设γ 0=1,γ 1=1所构建的客户满意度预测模型;模型AugCRC(γ c =1)为采用样本增广策略训练客户满意度预测底层模型,且不考虑类别重要性并设γ 0=1,γ 1=1所构建的客户满意度预测模型;模型CRC(γ c =l c )为不采用样本增广策略训练客户满意度预测底层模型,且考虑类别重要性并设γ 0=l 0γ 1=l 1所构建的客户满意度预测模型;模型AugCRC(γ c =l c )为采用样本增广策略训练客户满意度预测底层模型,且考虑类别重要性并设γ 0=l 0γ 1=l 1所构建的客户满意度预测模型。实验共进行100次,并对测试集上的平均结果进行记录。为检验各模型的预测风险能够被人为设定的风险上限α所控制,分别取α为1、2、3、4、5,所构建的客户满意度预测模型在测试集上的预测风险如表1所示。
表1 各客户满意度预测模型在测试集上的预测风险
从表1可以看出,所有构建的客户满意度预测模型在测试集上的预测风险,均小于预先设定的风险上限α,说明本发明提出的客户满意度预测模型具备风险可控性,可以根据具体应用需求,事先设定风险上限,得到预测风险不高于风险上限的客户满意度预测模型。
2、本发明提出的客户满意度预测模型预测结果的信息量对比
本实施例的第二组实验结果,用于对比本发明提出的客户满意度预测模型的各具体实例模型预测结果的信息量对比,以说明对于数据增广的优选技术方案和考虑类别重要程度优选技术方案的优势。将本实施例得到的上述4个模型模型在测试集上预测标签的平均个数进行统计,得到如下表2。
表2 各客户满意度预测模型在测试集上的平均预测标签个数
首先,由表2横向对比可以看出,所有模型在测试集上的平均预测标签个数随着风险上限的增大而减小。结合表1可知,提高风险上限,对各模型的预测风险限制降低,致使各模型减少冗余预测标签、预测标签集合趋于明确化,预测信息量增加。这是风险控制预测模型的一般特性,即风险上限对模型的预测风险的控制具备一定强制性,在提高风险上限的过程中,强制各预测模型减少预测标签平均个数以增加预测信息量。虽然该过程会提高模型的预测风险,但由于预测风险可控,模型的预测风险始终保持在风险上限以下。因此,本发明提出的预测风险可控的客户满意度预测模型,需要根据具体要求对风险上限和模型预测信息量进行权衡。
此外,由表2纵向对比可以看出,使用增广数据技术得到的客户满意度预测模型,其预测结果的信息量要高于同等条件下,未使用增广数据技术得到的客户满意度预测模型的预测信息量,说明本发明提出的数据增广优选技术方案的优势。同样通过纵向对比可以看出,考虑类别重要程度的客户满意度预测模型的预测信息量,要整体高于未考虑类别重要程度的客户满意度预测模型的预测信息量,说明本发明提出的考虑类别重要程度的优选技术方案的优势。
最后,对于实验模型的选择,应综合考虑风险上限和预测结果的信息量,即风险上限尽量低,且预测结果的平均标签个数尽量接近1或在1以下。对于CRC(γ c =1)和AugCRC(γ c =1),由于两者平均预测标签个数在α=5时才接近1,所以只能选择α=5时的模型进行应用,但由表1可知,两者预测风险较高;对于CRC(γ c =l c )和AugCRC(γ c =l c ),由于两者在α=1时的平均预测标签个数即已达到1或在1以下,因此,两者均可使用α=1得到的模型进行应用。
经过以上分析,AugCRC(γ c =l c )在预测风险不大于1的情况下,平均预测标签个数小于1,且为4个模型中平均预测标签个数最小,预测信息量最大的模型。故而AugCRC(γ c =l c )为本实验中最优的客户满意度预测模型,其在满足预测风险可控的同时,预测标签集合冗余信息低,能够更好地进行实际应用。
尽管为说明目的公开了本发明的实施例和附图,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换、变化和修改都是可能的,因此,本发明的范围不局限于实施例和附图所公开的内容。

Claims (1)

1.一种基于客服通话语音的客户满意度预测方法,其特征在于:所述预测方法的步骤为:
S1、构建面向95598客服通话语音的语音识别深度学习模型,所述语音识别深度学习模型包括语音特征提取器、编码器及解码器,所述语音特征提取器用于提取客服通话语音特征,所述编码器用于对所述语音特征进行深层编码并形成客服通话语音隐层表征,所述解码器用于将隐层表征解码成客服通话语音对应的中文文本;
S2、获取95598客服通话语音资料和对应的客户满意度评价结果,以所述95598客服通话语音资料为输入,以所述对应的客户满意度评价结果为输出,构建训练集、校验集及测试集,分别用于训练客户满意度预测底层模型、校准所述客户满意度预测底层模型进而形成预测风险可控的客户满意度预测模型、测试预测风险可控的客户满意度预测模型;
S3、用所述训练集训练客户满意度预测底层模型,所述客户满意度预测底层模型分为语音隐层表征提取器和语音隐层表征分类器,所述语音隐层表征提取器用于提取客服通话语音资料的隐层表征,通过所述面向95598客服通话语音的语音识别深度学习模型作用到客服通话语音资料得到的所述编码器的输出获得;所述语音隐层表征分类器使用深度神经网络实现,所述训练客户满意度预测底层模型即为通过所述训练集训练所述语音隐层表征分类器中的参数;
S4、用所述客户满意度预测底层模型及所述校验集,基于一致性风险控制方法构建预测风险可控的客户满意度预测模型;
S5、将待预测的95598客服通话语音输入到风险可控的客户满意度预测模型,得到客户满意度的预测结果;
所述语音识别深度学习模型使用公开语音数据集进行预训练,并在95598客服通话语音数据上利用迁移学习对学习模型参数进行调整;
所述训练集和校验集中的语音数据隐层表征使用数据增广技术进行数据扩充,以充分训练所述语音隐层表征分类器,所述数据增广技术为:
1)提取95598客服通话语音资料的声学特征,并在声学特征层面对数据进行增广,形成增广的声学特征数据;
2)将所述增广的声学特征数据输入到所述面向95598客服通话语音的语音识别深度学习模型,得到增广的95598客服通话语音资料的隐层表征;
3)以所述增广的95598客服通话语音资料的隐层表征为输入,所述对应的客户满意度评价结果为标签,对数据进行增广;
所述语音隐层表征分类器使用具有注意力机制的Transformer编码器对所述95598客服通话语音资料的隐层表征进行进一步特征提取,所述Transformer编码器的输入端引入类别符号编码向量和位置嵌入向量,用于提高预测效果;将类别符号对应的Transformer编码向量送入单隐层全连接神经网络,并在输出端引入Softmax激活函数,输出各个类别的概率估计值,形成所述客户满意度预测底层模型;
所述Transformer编码器的注意力机制采用点乘注意力和多头注意力,并通过所述类别符号编码向量与所述Transformer编码器输出的各语音的隐层表征的注意力大小,溯源分类结果和语音各部分的关系,增强所述预测风险可控的客户满意度预测模型的可解释性;
所述类别符号编码向量和所述位置嵌入向量采用随机方式进行初始化,并通过训练过程确定最终参数;
将客户满意度预测问题看做配备类别损失的分类问题,分类类别至少包含不满意和满意两个类别,对一类别c,其配备的类别损失记为lc,用以度量第i个类别未被正确预测的情况下,预测模型造成的预测损失,预测模型的风险为预测模型在测试阶段预测损失的数学期望,可以通过所述测试集上的预测结果的平均损失进行度量,使用面向配备类别损失的分类问题的一致性风险控制方法,构建所述风险可控的客户满意度预测模型,由所述客户满意度预测底层模型和参数λ构建待校准的客户满意度预测模型Cλ,对于任意一段95598客服通话语音x,Cλ(x)为预测的类别集合,且满足如下单调性:
Figure FDA0004241562930000021
记x对应的类别为y,则对于预测结果Cλ(x),其预测损失为L(y,Cλ(x)),记所述校验集为{(xi,yi)},i=1,...,n,其中n为校验集样本量,则可根据校验集得到待校准的客户满意度预测模型Cλ在校验集上的风险估计值:
Figure FDA0004241562930000031
根据一致性风险控制方法,确定最优参数λ*如下:
Figure FDA0004241562930000032
其中:Λ为参数λ的搜索范围;
α为根据具体应用场景,人为设定的风险上限,即要求所述客户满意度预测模型预测风险应低于α,预测风险可控;
所述待校准的客户满意度预测模型Cλ定义如下:
cλ(x)={c:-γcfc(x)≤λ},
其中:fc(x)为所述客户满意度预测底层模型对语音x属于类别c的概率估计值;
γc为度量类别c重要程度的参数;
所述预测损失L(y,Cλ(x))定义如下:
Figure FDA0004241562930000033
其中:Ⅱ(·)为指示函数;即若y不在预测结果Cλ(x)当中,损失为ly,反之为0,通过该损失度量预测结果不包含真实类别时造成的损失,可以直接设定为预测结果不包含真实类别时造成的经济损失。
CN202310322916.8A 2023-03-30 2023-03-30 一种基于客服通话语音的客户满意度预测方法 Active CN116071079B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310322916.8A CN116071079B (zh) 2023-03-30 2023-03-30 一种基于客服通话语音的客户满意度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310322916.8A CN116071079B (zh) 2023-03-30 2023-03-30 一种基于客服通话语音的客户满意度预测方法

Publications (2)

Publication Number Publication Date
CN116071079A CN116071079A (zh) 2023-05-05
CN116071079B true CN116071079B (zh) 2023-06-23

Family

ID=86182267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310322916.8A Active CN116071079B (zh) 2023-03-30 2023-03-30 一种基于客服通话语音的客户满意度预测方法

Country Status (1)

Country Link
CN (1) CN116071079B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113219828A (zh) * 2021-04-22 2021-08-06 中国电子科技集团公司第二十九研究所 一种多通道模拟光模块增益一致性的控制方法
CN114998784A (zh) * 2022-05-25 2022-09-02 中国工商银行股份有限公司 一种客户满意度预测方法及装置
CN115327422A (zh) * 2022-09-05 2022-11-11 大连理工大学 基于充放电行为的电动公交动力电池健康度评价方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103811009A (zh) * 2014-03-13 2014-05-21 华东理工大学 一种基于语音分析的智能电话客服系统
CN107995370B (zh) * 2017-12-21 2020-11-24 Oppo广东移动通信有限公司 通话控制方法、装置及存储介质和移动终端
CN110942326A (zh) * 2018-09-25 2020-03-31 北京嘀嘀无限科技发展有限公司 一种用户满意度预测方法及装置、服务器
CN111178982B (zh) * 2020-01-02 2023-07-21 珠海格力电器股份有限公司 客户满意度的分析方法、存储介质和计算机设备
CN112217947B (zh) * 2020-10-10 2021-09-21 携程计算机技术(上海)有限公司 客服电话语音转录文本方法、系统、设备及存储介质
CN112801676A (zh) * 2021-02-04 2021-05-14 上海中通吉网络技术有限公司 一种快递行业呼叫中心服务方法、装置、设备及系统
CN114694680A (zh) * 2022-02-09 2022-07-01 北京佳讯飞鸿电气股份有限公司 话务员的服务评估方法、装置、存储介质及电子设备
CN115662401B (zh) * 2022-12-14 2023-03-10 国家电网有限公司客户服务中心 一种基于持续学习的客服通话语音识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113219828A (zh) * 2021-04-22 2021-08-06 中国电子科技集团公司第二十九研究所 一种多通道模拟光模块增益一致性的控制方法
CN114998784A (zh) * 2022-05-25 2022-09-02 中国工商银行股份有限公司 一种客户满意度预测方法及装置
CN115327422A (zh) * 2022-09-05 2022-11-11 大连理工大学 基于充放电行为的电动公交动力电池健康度评价方法

Also Published As

Publication number Publication date
CN116071079A (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
CN109496334B (zh) 用于评估语音质量的设备和方法
EP1995723B1 (en) Neuroevolution training system
CN110491416A (zh) 一种基于lstm和sae的电话语音情感分析与识别方法
CN109802862A (zh) 一种基于集合经验模态分解的组合型网络流量预测方法
CN104361894A (zh) 一种基于输出的客观语音质量评估的方法
US9786300B2 (en) Single-sided speech quality measurement
CN106558308A (zh) 一种互联网音频数据质量自动打分系统及方法
CN112307760A (zh) 基于深度学习的财务报告情感分析方法、装置及终端
CN115146700A (zh) 一种基于Transformer序列到序列模型的径流预测方法
CN110163419B (zh) 一种中小河流流域洪水预报的方法
CN110310199B (zh) 借贷风险预测模型的构建方法、系统及借贷风险预测方法
CN116071079B (zh) 一种基于客服通话语音的客户满意度预测方法
Shan et al. Non-intrusive speech quality assessment using deep belief network and backpropagation neural network
KR101862982B1 (ko) LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법
CN117592609A (zh) 渠系水利用系数的在线监测方法、监测终端及存储介质
CN115953245A (zh) 基于序列到图的股票趋势预测方法和装置
CN112561575B (zh) 一种ctr预估模型选择方法及装置
CN113159395A (zh) 一种基于深度学习的污水处理厂进水流量预测方法及系统
CN110111810B (zh) 基于卷积神经网络的语音人格预测方法
Engelbrecht et al. Sequential classifiers for the prediction of user judgments about spoken dialog systems
CN113035238A (zh) 音频评测方法、装置、电子设备和介质
Jayesh et al. Transformer Networks for Non-Intrusive Speech Quality Prediction.
Guohui et al. Real Time Speech Recognition Method for Online Complaints from Power Grid Customers Based on Improved Residual Network
CN111612324B (zh) 一种基于英语口语考试的多维度评估方法
CN117278674A (zh) 一种智能电话客服生成语音的质量测评方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant