CN109933658B - 客服通话分析方法及装置 - Google Patents
客服通话分析方法及装置 Download PDFInfo
- Publication number
- CN109933658B CN109933658B CN201910219277.6A CN201910219277A CN109933658B CN 109933658 B CN109933658 B CN 109933658B CN 201910219277 A CN201910219277 A CN 201910219277A CN 109933658 B CN109933658 B CN 109933658B
- Authority
- CN
- China
- Prior art keywords
- time length
- influence factor
- call
- duration
- customer service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 39
- 238000012360 testing method Methods 0.000 claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 36
- 238000000556 factor analysis Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims description 34
- 238000000034 method Methods 0.000 claims description 17
- 238000007689 inspection Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000009467 reduction Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本公开涉及客服服务领域,提供了一种客服通话分析方法,包括:将通话时长大于预设时长的客服通话转换为通话文本;在通话文本中标注出时长影响因素及各时长影响因素所占的比例,时长影响因素包括语气词过多、引导性语言过多、缺乏基本专业知识、无法理解客户描述和答非所问中的至少一种;将标注后的通话文本分为训练文本数据和测试文本数据;根据训练文本数据和测试文本数据生成时长影响因素识别准确率大于第一预设阈值的时长影响因素识别模型;根据时长影响因素识别模型对待识别客服通话进行分析,并生成与待识别客服通话对应的时长影响因素分析报告,时长影响因素分析报告包括降低客服通话时长建议信息。相应地还提供了一种客服通话分析装置。
Description
技术领域
本公开涉及客服服务领域,特别涉及客服通话分析方法及装置。
背景技术
目前电信运营仍需要大量的人工坐席为客户提供服务,如何降低客服通话时长及提高客服工作效率成为困扰运营商的一大难题,为了降低客服通话时长及提高客服工作效率,需对服务通话内容和通话时长间的关系进行分析。但由于运营商人工坐席服务客户的通话数据量庞大,通过人工方式无法有效分析出服务通话内容和通话时长间的关系,也即无法为降低客服通话时长及提高客服工作效率提出有效的解决方案。
应该注意,上面对技术背景的介绍只是为了方便对本公开的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本公开的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
本公开旨在至少解决现有技术中存在的技术问题之一,提出了一种客服通话分析方法及装置。
第一方面,本公开实施例提供了一种客服通话分析方法,包括:
将通话时长大于预设时长的客服通话转换为通话文本;
在通话文本中标注出时长影响因素及各时长影响因素所占的比例,所述时长影响因素包括语气词过多、引导性语言过多、缺乏基本专业知识、无法理解客户描述和答非所问中的至少一种;
将标注后的所述通话文本分为训练文本数据和测试文本数据;
根据所述训练文本数据和测试文本数据生成时长影响因素识别准确率大于第一预设阈值的时长影响因素识别模型;
根据所述时长影响因素识别模型对待识别客服通话进行分析,并生成与所述待识别客服通话对应的时长影响因素分析报告,所述时长影响因素分析报告包括降低客服通话时长建议信息。
在一些实施例中,将标注后的通话文本分为训练文本数据和测试文本数据的步骤具体包括:
对标注后的所述通话文本进行分词处理并统计出所述通话文本中的停用词;
去掉所述通话文本中的停用词并按照预设比例将所述通话文本分为训练文本数据和测试文本数据。
在一些实施例中,根据训练文本数据和测试文本数据生成时长影响因素识别准确率大于第一预设阈值的时长影响因素识别模型的步骤具体包括:
对所述训练文本数据和测试文本数据进行向量化处理;
通过监督学习的方式从向量化处理后的所述训练文本数据中提取出时长影响因素及每种时长影响因素的共同特征并根据提取出的所述时长影响因素及每种时长影响因素的共同特征生成时长影响因素识别模型;
根据所述测试数据文本及所述时长影响因素识别模型生成影响因素测试结果;
根据所述影响因素测试结果和通话文本中标注出的时长影响因素生成所述时长影响因素识别模型的时长影响因素识别准确率;
判断所述时长影响因素识别准确率是否大于第一预设阈值,若否,调整所述时长影响因素识别模型直至所述时长影响因素识别准确率大于第一预设阈值。
在一些实施例中,在根据时长影响因素识别模型对待识别客服通话进行分析之后还包括:
抽取部分所述待识别客服通话进行检验并生成时长影响因素检验识别结果;
根据所述时长影响因素检验识别结果调整所述时长影响因素识别模型直至所述时长影响因素识别模型的时长影响因素识别准确率大于第二预设阈值。
在一些实施例中,调整时长影响因素识别模型的步骤具体包括:
调整所述预设时长、时长影响因素识别模型中各参数的权重、时长影响因素标注方式及数量,以生成新的时长影响因素识别模型。
第二方面,本公开实施例提供了一种客服通话分析装置,包括:
转换模块,用于将通话时长大于预设时长的客服通话转换为通话文本;
标注模块,用于在通话文本中标注出时长影响因素及各时长影响因素所占的比例,所述时长影响因素包括语气词过多、引导性语言过多、缺乏基本专业知识、无法理解客户描述和答非所问中的至少一种;
处理模块,用于将标注后的所述通话文本分为训练文本数据和测试文本数据;
生成模块,用于根据所述训练文本数据和测试文本数据生成时长影响因素识别准确率大于第一预设阈值的时长影响因素识别模型;
分析生成模块,用于根据所述时长影响因素识别模型对待识别客服通话进行分析,并生成与所述待识别客服通话对应的时长影响因素分析报告,所述时长影响因素分析报告包括降低客服通话时长建议信息。
在一些实施例中,所述处理模块包括:
分词处理统计子模块,用于对标注后的所述通话文本进行分词处理并统计出所述通话文本中的停用词;
处理子模块,用于去掉所述通话文本中的停用词并按照预设比例将所述通话文本分为训练文本数据和测试文本数据。
在一些实施例中,所述生成模块包括:
向量化处理子模块,用于对所述训练文本数据和测试文本数据进行向量化处理;
提取生成子模块,用于通过监督学习的方式从向量化处理后的所述训练文本数据中提取出时长影响因素及每种时长影响因素的共同特征并根据提取出的所述时长影响因素及每种时长影响因素的共同特征生成时长影响因素识别模型;
第一生成子模块,用于根据所述测试数据文本及所述时长影响因素识别模型生成影响因素测试结果;
第二生成子模块,用于根据所述影响因素测试结果和通话文本中标注出的时长影响因素生成所述时长影响因素识别模型的时长影响因素识别准确率;
判断子模块,用于判断所述时长影响因素识别准确率是否大于第一预设阈值;
调整子模块,用于当判断出所述时长影响因素识别准确率小于或等于第一预设阈值时,调整所述时长影响因素识别模型直至所述时长影响因素识别准确率大于第一预设阈值。
在一些实施例中,所述客服通话分析装置还包括:
抽取生成模块,用于抽取部分所述待识别客服通话进行检验并生成时长影响因素检验识别结果;
调整模块,用于根据所述时长影响因素检验识别结果调整所述时长影响因素识别模型直至所述时长影响因素识别模型的时长影响因素识别准确率大于第二预设阈值。
在一些实施例中,所述调整子模块和调整模块具体用于调整所述预设时长、时长影响因素识别模型中各参数的权重、时长影响因素标注方式及数量,以生成新的时长影响因素识别模型。
本公开具有以下有益效果:
本公开提供的客服通话分析方法,根据时长影响因素识别模型对待识别客服通话进行分析,并生成与待识别客服通话对应的时长影响因素分析报告,时长影响因素分析报告包括降低客服通话时长建议信息。其能够根据识别模型分析客服工作,提出降低客服通话时长的建议,进而促进客服工作效率的提升和客服成本的降低。
参照后文的说明和附图,详细公开了本公开的特定实施方式,指明了本公开的原理可以被采用的方式。应该理解,本公开的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本公开的实施方式包括许多改变、修改和等同。
针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种客服通话分析方法的流程示意图;
图2为本公开实施例提供的另一种客服通话分析方法的流程示意图;
图3为本公开实施例提供的一种客服通话分析装置的结构示意图。
具体实施方式
为使本领域的技术人员更好地理解本公开的技术方案,下面结合附图对本公开中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
本领域技术技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
图1为本公开实施例提供的一种客服通话分析方法的流程示意图,该方法可由客服通话分析装置来执行,该客服通话分析装置可以通过软件和/或硬件的方式实现。如图1所示,该方法包括以下步骤:
步骤101、将通话时长大于预设时长的客服通话转换为通话文本。
步骤102、在通话文本中标注出时长影响因素及各时长影响因素所占的比例。
时长影响因素包括语气词过多、引导性语言过多、缺乏基本专业知识、无法理解客户描述和答非所问中的至少一种。
步骤103、将标注后的通话文本分为训练文本数据和测试文本数据。
步骤104、根据训练文本数据和测试文本数据生成时长影响因素识别准确率大于第一预设阈值的时长影响因素识别模型。
步骤105、根据时长影响因素识别模型对待识别客服通话进行分析,并生成与待识别客服通话对应的时长影响因素分析报告。
时长影响因素分析报告包括降低客服通话时长建议信息。
本实施例提供的该客服通话分析方法,根据时长影响因素识别模型对待识别客服通话进行分析,并生成与待识别客服通话对应的时长影响因素分析报告,时长影响因素分析报告包括降低客服通话时长建议信息。其能够根据识别模型分析客服工作,提出降低客服通话时长的建议,进而促进客服工作效率的提升和客服成本的降低。
图2为本公开实施例提供的另一种客服通话分析方法的流程示意图,该方法可由客服通话分析装置来执行,该客服通话分析装置可以通过软件和/或硬件的方式实现。如图2所示,该方法包括以下步骤:
步骤201、将通话时长大于预设时长的客服通话转换为通话文本。
如:预设时长为3分钟。
通话时长大于预设时长的客服通话为本实施例的客服通话分析方法的分析客体。通话文本与通话时长具有对应关系,可选地,通话文本具有通信文本信息,通信文本信息中可包括通话时长、通话标识和通话时间。
步骤202、在通话文本中标注出时长影响因素及各时长影响因素所占的比例。
时长影响因素包括语气词过多、引导性语言过多、缺乏基本专业知识、无法理解客户描述和答非所问中的至少一种。当通话文本中标注出多个时长影响因素时,根据各时长影响因素在通话文本中所占的篇幅生成各时长影响因素所占的比例。
标注时长影响因素的方式可以为现有的自然语言处理技术。
步骤203、对标注后的通话文本进行分词处理并统计出通话文本中的停用词。
停用词为英文字符、数字、数学字符、标点符号、使用频率特高的单汉字、语气词或过渡词等信息量较低的词。
步骤204、去掉通话文本中的停用词并按照预设比例将通话文本分为训练文本数据和测试文本数据。
基于通话文本中的停用词的统计结果,去掉通话文本中的停用词,以提升通信文本的处理效率,同时停用词使用的多少可以作为判断通话时长长短的因素之一。
预设比例可以为7:3,将去掉停用词的通信文本按照预设比例分为两部分,一部分为训练文本数据,一部分为测试文本数据。预设比例可根据实际场景进行适应性调整。
步骤205、对训练文本数据和测试文本数据进行向量化处理。
向量化处理方法可以为现有的文本向量化处理方法。
步骤206、通过监督学习的方式从向量化处理后的训练文本数据中提取出时长影响因素及每种时长影响因素的共同特征并根据提取出的时长影响因素及每种时长影响因素的共同特征生成时长影响因素识别模型。
时长影响因素识别模型能够基于时长影响因素的共同特征从文本中识别出时长影响因素及其类型。
步骤207、根据测试数据文本及时长影响因素识别模型生成影响因素测试结果。
具体地,将测试数据文本输入至时长影响因素识别模型后,输出影响因素测试结果。
步骤208、根据影响因素测试结果和通话文本中标注出的时长影响因素生成时长影响因素识别模型的时长影响因素识别准确率。
具体地,计算影响因素测试结果和通话文本中标注出的时长影响因素的相似度,相似度越大,时长影响因素识别准确率越大。
可选地,根据影响因素测试结果和测试数据文本中标注出的时长影响因素生成时长影响因素识别模型的时长影响因素识别准确率。
步骤209、判断时长影响因素识别准确率是否大于第一预设阈值,若否,执行步骤210;若是,执行步骤211。
第一预设阈值可以为80%。
步骤210、调整时长影响因素识别模型直至时长影响因素识别准确率大于第一预设阈值。
具体地,调整预设时长、时长影响因素识别模型中各参数的权重、时长影响因素标注方式及数量等,以生成新的时长影响因素识别模型,直至该新的时长影响因素识别模型的时长影响因素识别准确率大于第一预设阈值。
值得说明的是,当生成新的时长影响因素识别模型后,重复执行步骤206-步骤208,以判断新的时长影响因素识别模型的时长影响因素识别准确率是否大于第一预设阈值。
步骤211、根据时长影响因素识别模型对待识别客服通话进行分析,并生成与待识别客服通话对应的时长影响因素分析报告。
时长影响因素分析报告包括降低客服通话时长建议信息。
如:降低客服通话时长建议信息可以为减少语气词使用量、避免引导性语言、补充基本专业知识等。
步骤212、抽取部分待识别客服通话进行检验并生成时长影响因素检验识别结果。
步骤212中生成时长影响因素检验识别结果的方式可参见步骤207中生成影响因素测试结果的方式,此处不再赘述。
步骤213、根据时长影响因素检验识别结果调整时长影响因素识别模型直至时长影响因素识别模型的时长影响因素识别准确率大于第二预设阈值。
如:第二预设阈值为90%。
通过执行步骤212和步骤213能够进一步提升时长影响因素识别模型的识别准确率,在实际使用过程中,参与的待识别客服通话量越多,经调整后的时长影响因素识别模型的时长影响因素识别准确率越高。
应当注意,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本实施例提供的客服通话分析方法,基于自然语言处理技术生成时长影响因素识别模型,时长影响因素识别模型能够用于分析实际客服工作,并根据分析结果提出时长影响因素分析报告,时长影响因素分析报告中包括降低客服通话时长的建议,其能够促进客服工作效率的提升和客服成本的降低。
图3为本公开实施例提供的一种客服通话分析装置的结构示意图,如图3所示,该客服通话分析装置包括:转换模块11、标注模块12、处理模块13、生成模块14和分析生成模块15。
转换模块11用于将通话时长大于预设时长的客服通话转换为通话文本。标注模块12用于在通话文本中标注出时长影响因素及各时长影响因素所占的比例,时长影响因素包括语气词过多、引导性语言过多、缺乏基本专业知识、无法理解客户描述和答非所问中的至少一种。处理模块13用于将标注后的通话文本分为训练文本数据和测试文本数据。生成模块14用于根据训练文本数据和测试文本数据生成时长影响因素识别准确率大于第一预设阈值的时长影响因素识别模型。分析生成模块15用于根据时长影响因素识别模型对待识别客服通话进行分析,并生成与待识别客服通话对应的时长影响因素分析报告,时长影响因素分析报告包括降低客服通话时长建议信息。
进一步地,生成模块14包括:向量化处理子模块141、提取生成子模块142、第一生成子模块143、第二生成子模块144、判断子模块145和调整子模块146。
向量化处理子模块141用于对训练文本数据和测试文本数据进行向量化处理。提取生成子模块142用于通过监督学习的方式从向量化处理后的训练文本数据中提取出时长影响因素及每种时长影响因素的共同特征并根据提取出的时长影响因素及每种时长影响因素的共同特征生成时长影响因素识别模型。第一生成子模块143用于根据测试数据文本及时长影响因素识别模型生成影响因素测试结果。第二生成子模块144用于根据影响因素测试结果和通话文本中标注出的时长影响因素生成时长影响因素识别模型的时长影响因素识别准确率。判断子模块145用于判断时长影响因素识别准确率是否大于第一预设阈值。调整子模块146用于当判断出时长影响因素识别准确率小于或等于第一预设阈值时,调整时长影响因素识别模型直至时长影响因素识别准确率大于第一预设阈值。
进一步地,该客服通话分析装置还包括:抽取生成模块16和调整模块17。抽取生成模块16用于抽取部分待识别客服通话进行检验并生成时长影响因素检验识别结果。调整模块17用于根据时长影响因素检验识别结果调整时长影响因素识别模型直至时长影响因素识别模型的时长影响因素识别准确率大于第二预设阈值。
进一步地,调整子模块146和调整模块17具体用于调整预设时长、时长影响因素识别模型中各参数的权重、时长影响因素标注方式及数量,以生成新的时长影响因素识别模型。
本实施例提供的客服通话分析装置可用于实施本实施例提供的客服通话分析方法。
本实施例提供的客服通话分析装置,能够促进客服工作效率的提升和客服成本的降低。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本公开中应用了具体实施例对本公开的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本公开的方法及其核心思想;同时,对于本领域的一般技术人员,依据本公开的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本公开的限制。
Claims (8)
1.一种客服通话分析方法,其特征在于,包括:
将通话时长大于预设时长的客服通话转换为通话文本;
在通话文本中标注出时长影响因素及各时长影响因素所占的比例,所述时长影响因素包括语气词过多、引导性语言过多、缺乏基本专业知识、无法理解客户描述和答非所问中的至少一种;
将标注后的所述通话文本分为训练文本数据和测试文本数据;
根据所述训练文本数据和测试文本数据生成时长影响因素识别准确率大于第一预设阈值的时长影响因素识别模型;
根据所述时长影响因素识别模型对待识别客服通话进行分析,并生成与所述待识别客服通话对应的时长影响因素分析报告,所述时长影响因素分析报告包括降低客服通话时长建议信息;
所述根据训练文本数据和测试文本数据生成时长影响因素识别准确率大于第一预设阈值的时长影响因素识别模型的步骤,包括:
对所述训练文本数据和测试文本数据进行向量化处理;
通过监督学习的方式从向量化处理后的所述训练文本数据中提取出时长影响因素及每种时长影响因素的共同特征并根据提取出的所述时长影响因素及每种时长影响因素的共同特征生成时长影响因素识别模型;
根据所述测试文本数据及所述时长影响因素识别模型生成影响因素测试结果;
根据所述影响因素测试结果和通话文本中标注出的时长影响因素生成所述时长影响因素识别模型的时长影响因素识别准确率;
判断所述时长影响因素识别准确率是否大于第一预设阈值,若否,调整所述时长影响因素识别模型直至所述时长影响因素识别准确率大于第一预设阈值。
2.根据权利要求1所述的客服通话分析方法,其特征在于,将标注后的通话文本分为训练文本数据和测试文本数据的步骤具体包括:
对标注后的所述通话文本进行分词处理并统计出所述通话文本中的停用词;
去掉所述通话文本中的停用词并按照预设比例将所述通话文本分为训练文本数据和测试文本数据。
3.根据权利要求1所述的客服通话分析方法,其特征在于,在根据时长影响因素识别模型对待识别客服通话进行分析之后还包括:
抽取部分所述待识别客服通话进行检验并生成时长影响因素检验识别结果;
根据所述时长影响因素检验识别结果调整所述时长影响因素识别模型直至所述时长影响因素识别模型的时长影响因素识别准确率大于第二预设阈值。
4.根据权利要求1或3所述的客服通话分析方法,其特征在于,调整时长影响因素识别模型的步骤具体包括:
调整所述预设时长、时长影响因素识别模型中各参数的权重、时长影响因素标注方式及数量,以生成新的时长影响因素识别模型。
5.一种客服通话分析装置,其特征在于,包括:
转换模块,用于将通话时长大于预设时长的客服通话转换为通话文本;
标注模块,用于在通话文本中标注出时长影响因素及各时长影响因素所占的比例,所述时长影响因素包括语气词过多、引导性语言过多、缺乏基本专业知识、无法理解客户描述和答非所问中的至少一种;
处理模块,用于将标注后的所述通话文本分为训练文本数据和测试文本数据;
生成模块,用于根据所述训练文本数据和测试文本数据生成时长影响因素识别准确率大于第一预设阈值的时长影响因素识别模型;
分析生成模块,用于根据所述时长影响因素识别模型对待识别客服通话进行分析,并生成与所述待识别客服通话对应的时长影响因素分析报告,所述时长影响因素分析报告包括降低客服通话时长建议信息;
所述生成模块包括:
向量化处理子模块,用于对所述训练文本数据和测试文本数据进行向量化处理;
提取生成子模块,用于通过监督学习的方式从向量化处理后的所述训练文本数据中提取出时长影响因素及每种时长影响因素的共同特征并根据提取出的所述时长影响因素及每种时长影响因素的共同特征生成时长影响因素识别模型;
第一生成子模块,用于根据所述测试文本数据及所述时长影响因素识别模型生成影响因素测试结果;
第二生成子模块,用于根据所述影响因素测试结果和通话文本中标注出的时长影响因素生成所述时长影响因素识别模型的时长影响因素识别准确率;
判断子模块,用于判断所述时长影响因素识别准确率是否大于第一预设阈值;
调整子模块,用于当判断出所述时长影响因素识别准确率小于或等于第一预设阈值时,调整所述时长影响因素识别模型直至所述时长影响因素识别准确率大于第一预设阈值。
6.根据权利要求5所述的客服通话分析装置,其特征在于,所述处理模块包括:
分词处理统计子模块,用于对标注后的所述通话文本进行分词处理并统计出所述通话文本中的停用词;
处理子模块,用于去掉所述通话文本中的停用词并按照预设比例将所述通话文本分为训练文本数据和测试文本数据。
7.根据权利要求5所述的客服通话分析装置,其特征在于,所述客服通话分析装置还包括:
抽取生成模块,用于抽取部分所述待识别客服通话进行检验并生成时长影响因素检验识别结果;
调整模块,用于根据所述时长影响因素检验识别结果调整所述时长影响因素识别模型直至所述时长影响因素识别模型的时长影响因素识别准确率大于第二预设阈值。
8.根据权利要求5或7所述的客服通话分析装置,其特征在于,所述调整子模块和调整模块具体用于调整所述预设时长、时长影响因素识别模型中各参数的权重、时长影响因素标注方式及数量,以生成新的时长影响因素识别模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910219277.6A CN109933658B (zh) | 2019-03-21 | 2019-03-21 | 客服通话分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910219277.6A CN109933658B (zh) | 2019-03-21 | 2019-03-21 | 客服通话分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109933658A CN109933658A (zh) | 2019-06-25 |
CN109933658B true CN109933658B (zh) | 2021-05-11 |
Family
ID=66987902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910219277.6A Active CN109933658B (zh) | 2019-03-21 | 2019-03-21 | 客服通话分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109933658B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380381B (zh) * | 2020-11-13 | 2024-04-05 | 阳光保险集团股份有限公司 | 一种智能管理坐席的方法及装置、机器人及存储介质 |
CN112507072A (zh) * | 2020-12-07 | 2021-03-16 | 上海明略人工智能(集团)有限公司 | 基于对话的销售考评方法、系统及电子设备 |
CN112529599A (zh) * | 2020-12-18 | 2021-03-19 | 绿瘦健康产业集团有限公司 | 一种满意度分析方法、装置及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570708A (zh) * | 2016-10-31 | 2017-04-19 | 厦门快商通科技股份有限公司 | 一种智能客服知识库的管理方法及系统 |
CN108184032A (zh) * | 2016-12-07 | 2018-06-19 | 中国移动通信有限公司研究院 | 一种客服系统的服务方法及装置 |
CN109151218A (zh) * | 2018-08-21 | 2019-01-04 | 平安科技(深圳)有限公司 | 通话语音质检方法、装置、计算机设备及存储介质 |
CN109190652A (zh) * | 2018-07-06 | 2019-01-11 | 中国平安人寿保险股份有限公司 | 坐席分类管理方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160359779A1 (en) * | 2015-03-16 | 2016-12-08 | Boogoo Intellectual Property LLC | Electronic Communication System |
-
2019
- 2019-03-21 CN CN201910219277.6A patent/CN109933658B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570708A (zh) * | 2016-10-31 | 2017-04-19 | 厦门快商通科技股份有限公司 | 一种智能客服知识库的管理方法及系统 |
CN108184032A (zh) * | 2016-12-07 | 2018-06-19 | 中国移动通信有限公司研究院 | 一种客服系统的服务方法及装置 |
CN109190652A (zh) * | 2018-07-06 | 2019-01-11 | 中国平安人寿保险股份有限公司 | 坐席分类管理方法、装置、计算机设备和存储介质 |
CN109151218A (zh) * | 2018-08-21 | 2019-01-04 | 平安科技(深圳)有限公司 | 通话语音质检方法、装置、计算机设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
"Complex text processing by the temporal context machines";Juyang Weng et al.;《2009 IEEE 8th International Conference on Development and Learning》;20090728;第1-8页 * |
"客服系统话务模型分析";陈杰妹 等;《中国通信学会第六届学术年会论文集》;20091126;第449-454页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109933658A (zh) | 2019-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109933658B (zh) | 客服通话分析方法及装置 | |
CN108073600B (zh) | 一种智能问答交互方法、装置以及电子设备 | |
CN105468468A (zh) | 面向问答系统的数据纠错方法及装置 | |
CN111354340B (zh) | 数据标注准确度验证方法、装置、电子设备及存储介质 | |
CN111209363B (zh) | 语料数据处理方法、装置、服务器和存储介质 | |
CN111045902A (zh) | 服务器的压力测试方法及装置 | |
CN110689078A (zh) | 基于人格分类模型的人机交互方法、装置及计算机设备 | |
CN110222331A (zh) | 谎言识别方法及装置、存储介质、计算机设备 | |
CN112148852A (zh) | 一种智能客服方法、装置、存储介质及计算机设备 | |
CN113961424A (zh) | 分布式系统的故障预测方法以及故障预测装置 | |
CN111427996B (zh) | 一种人机交互文本中抽取日期时间的方法和装置 | |
CN111723182B (zh) | 一种用于漏洞文本的关键信息抽取方法及装置 | |
CN117556057A (zh) | 知识问答方法、向量数据库构建方法及装置 | |
CN110674628B (zh) | 文件模板生成方法及系统 | |
CN109165327B (zh) | 人机对话方法、装置及计算机可读存储介质 | |
CN110580899A (zh) | 语音识别方法及装置、存储介质、计算设备 | |
CN115906797A (zh) | 文本实体对齐方法、装置、设备及介质 | |
CN110910905A (zh) | 静音点检测方法及装置、存储介质、电子设备 | |
CN111723580B (zh) | 基于语音识别与图像识别的电力调度厂站信息图效验方法 | |
CN113239151A (zh) | 基于bart模型的口语理解数据增强方法、系统及设备 | |
CN109446527B (zh) | 一种无意义语料的分析方法及系统 | |
CN112000767A (zh) | 一种基于文本的信息抽取方法和电子设备 | |
CN112466324A (zh) | 一种情绪分析方法、系统、设备及可读存储介质 | |
CN111859148A (zh) | 主题的提取方法、装置、设备及计算机可读存储介质 | |
CN113254595B (zh) | 闲聊识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |