CN110287325A - 一种基于智能语音分析的电网客服业务推荐方法及装置 - Google Patents
一种基于智能语音分析的电网客服业务推荐方法及装置 Download PDFInfo
- Publication number
- CN110287325A CN110287325A CN201910577885.4A CN201910577885A CN110287325A CN 110287325 A CN110287325 A CN 110287325A CN 201910577885 A CN201910577885 A CN 201910577885A CN 110287325 A CN110287325 A CN 110287325A
- Authority
- CN
- China
- Prior art keywords
- keyword
- target
- business
- algorithm
- text information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000004458 analytical method Methods 0.000 title claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 87
- 238000013528 artificial neural network Methods 0.000 claims abstract description 43
- 230000015654 memory Effects 0.000 claims abstract description 6
- 238000000605 extraction Methods 0.000 claims description 33
- 230000007787 long-term memory Effects 0.000 claims description 25
- 239000000284 extract Substances 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 10
- 230000007774 longterm Effects 0.000 claims description 4
- 239000012141 concentrate Substances 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000004218 nerve net Anatomy 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Accounting & Taxation (AREA)
- Human Computer Interaction (AREA)
- Water Supply & Treatment (AREA)
- Multimedia (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于智能语音分析的电网客服业务推荐方法、装置、设备及计算机可读存储介质,包括:利用基于深度卷积长短期记忆神经网络的语音识别算法对目标用户语音进行识别,获取目标用户语音对应的文本信息;依据预建的关键词库,分别利用Text Rank算法与TF‑IDF算法提取文本信息的第一关键词集与第二关键词集,以确定文本信息的目标关键词集;利用基于N‑gram相似度的业务匹配算法对目标关键词集中的关键词与预建的备选业务库中的备选业务进行匹配,确定目标推荐业务,并将目标推荐业务发送至目标用户。本发明所提供的方法、装置、设备及计算机可读存储介质,提高了对客户的语音文本信息关键词提取的准确度及电网客服业务推荐的质量。
Description
技术领域
本发明涉及语音客服技术领域,特别是涉及一种基于智能语音分析的电网客服业务推荐方法、装置、设备以及计算机可读存储介质。
背景技术
目前,语音客服作为解决用户日常问题的重要窗口,已经日渐成为各大企业提升客户满意度必不可少的服务模式。传统的语音客服方式大多采用用户选择菜单进入对应服务业务的方式,然而这种方式会造成两个常见问题,一方面是用户等待时间过长,一方面是若选择菜单难以有效命中需求点则会导致用户不得不求助于人工客服,这将大大影响用户体验和降低服务的质量。
为了进一步提高服务的效率,有些语音客服选择智能分析的方式,将客户描述的问题作为输入,对分析结果进行关键词提取,再针对提取的关键词进行业务匹配。虽然这种方式比起传统的菜单选择方式能够为用户提供更具个性化的服务,并进一步提升用户满意度。但是,若针对分析结果提取的关键词不够准确,无法覆盖用户需求关键点,那么将会使后续的业务推荐质量大打折扣。此外,有些关键词提取算法应用候选关键词库进行关键词提取,若没有及时跟进用户关注点的变化和业务的迁移,并对候选关键词库进行动态更新,则也会造成业务推荐不准确的情况。
综上,现有技术方案存在如下的问题:(1)客服应答流程僵化,传统的备选业务模式无法满足日益复杂多变的客户需求,且难以快速解决客户难题。(2)语音提取的关键词不够全面准确,难以尽可能多地覆盖到客户需求的关键点。(3)用于关键词提取的备选词库缺少有效的动态更新,随着时间的推移和业务的变更难以有效进行关键词提取。
综上所述可以看出,如何提高对用户描述问题的语音文本关键词提取的准确性,从而提高电网客服业务推荐的质量是目前有待解决的问题。
发明内容
本发明的目的是提供一种基于智能语音分析的电网客服业务推荐方法、装置、设备以及计算机可读存储介质,以解决现有的语音客服由于对客户语音分析结果提取的关键词不准确,导致电网业务推荐质量较低的问题。
为解决上述技术问题,本发明提供一种基于智能语音分析的电网客服业务推荐的方法,包括:利用基于深度卷积长短期记忆神经网络的语音识别算法对目标用户语音进行识别,获取所述目标用户语音对应的文本信息;其中,所述基于深度卷积长短期记忆神经网络的语音识别算法由全连接卷积网络、长短期记忆神经网络与深度神经网络进行组合获得;依据预建的关键词库,分别利用Text Rank算法与TF-IDF算法提取所述文本信息的第一关键词集与第二关键词集,以确定所述文本信息的目标关键词集;利用预先构建的基于N-gram相似度的业务匹配算法对所述目标关键词集中的关键词与预建的备选业务库中的备选业务进行匹配,确定目标推荐业务,并将所述目标推荐业务发送至所述目标用户。
优选地,所述利用基于深度卷积长短期记忆神经网络的语音识别算法对目标用户语音进行识别,获取所述目标用户语音对应的文本信息包括:
将目标用户语音输入至全连接卷积网络后,将所述全连接卷积网络的输出结果输入至线性层;
将所述线性层的输出结果输入至长短期记忆神经网络后,将所述长短期记忆神经网络的输出结果输入至深度神经网络,通过所述深度神经网络输出所述目标用户语音的文本信息。
优选地,所述依据预建的关键词库,分别利用Text Rank算法与TF-IDF算法提取所述文本信息的第一关键词集与第二关键词集,以确定所述文本信息的目标关键词集包括:
利用Text Rank算法与预建的关键词库,提取所述文本信息的第一关键词集;
利用TF-IDF算法提取与所述关键词库,提取所述文本信息的第二关键词集;
对所述第一关键词集与所述第二关键词集进行取并操作,获得所述文本信息的目标关键词集。
优选地,所述利用预先构建的基于N-gram相似度的业务匹配算法对所述目标关键词集中的关键词与预建的备选业务库中的备选业务进行匹配,确定目标推荐业务包括:
对所述目标关键词集中的关键词与预建的备选业务库中的多个备选业务进行分别进行基于N-gram的相似度匹配,分别确定所述关键词集与所述多个备选业务之间的相似度;
选取与所述关键词集相似度最高的备选业务作为目标推荐业务。
优选地,还包括:
每隔预设时长对预设时间段内的用户咨询的问题进行文本聚类,确定热点问题;
提取所述热点问题的关键词,并根据所述热点问题的关键词对所述关键词库进行更新。
本发明还提供了一种基于智能语音分析的电网客服业务推荐装置,包括:
语音识别模块,用于利用基于深度卷积长短期记忆神经网络的语音识别算法对目标用户语音进行识别,获取所述目标用户语音对应的文本信息;其中,所述基于深度卷积长短期记忆神经网络的语音识别算法由全连接卷积网络、长短期记忆神经网络与深度神经网络进行组合获得;
关键词提取模块,用于依据预建的关键词库,分别利用Text Rank算法与TF-IDF算法提取所述文本信息的第一关键词集与第二关键词集,以确定所述文本信息的目标关键词集;
业务推荐模块,用于利用预先构建的基于N-gram相似度的业务匹配算法对所述目标关键词集中的关键词与预建的备选业务库中的备选业务进行匹配,确定目标推荐业务,并将所述目标推荐业务发送至所述目标用户。
优选地,所述关键词提取模块包括:
第一提取单元,用于利用Text Rank算法与预建的关键词库,提取所述文本信息的第一关键词集;
第二提取单元,用于利用TF-IDF算法提取与所述关键词库,提取所述文本信息的第二关键词集;
取并单元,用于对所述第一关键词集与所述第二关键词集进行取并操作,获得所述文本信息的目标关键词集。
优选地,所述业务推荐模块包括:
匹配单元,用于对所述目标关键词集中的关键词与预建的备选业务库中的多个备选业务进行分别进行基于N-gram的相似度匹配,分别确定所述关键词集与所述多个备选业务之间的相似度;
选取单元,用于选取与所述关键词集相似度最高的备选业务作为目标推荐业务。
本发明还提供了一种基于智能语音分析的电网客服业务推荐设备,包括:
存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种基于智能语音分析的电网客服业务推荐方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于智能语音分析的电网客服业务推荐方法的步骤。
本发明所提供的基于智能语音分析的电网客服业务推荐的方法,将目标用户语音输入至基于深度卷积层长短期记忆神经网络的语音识别算法,对所述目标用户语音进行智能识别,输出所述目标用户语音的文本信息。依据预先建立的关键词库,利用Text Rank算法提取所述文本信息的第一关键词集,利用TF-IDF算法提取所述文本信息的第二关键词集;结合所述第一关键词集与所述第二关键词集确定所述文本信息的目标关键词集。利用基于N-gram相似度的业务匹配算法,对所述目标关键词集中的关键词与预建的备选业务库中的多个备选业务进行分别进行基于N-gram的相似度匹配,从而选取与所述关键词库相似度最高的备选业务作为目标推荐业务,并将所述目标推荐业务发送至所述目标用户。本发明中所提供的电网客服业务推荐方法中,所提供的语音识别算法是由全连接卷积网络、长短期记忆神经网络与深度神经网络三种网络架构组成,可以提高对目标用户描述问题的语音识别的准确率。且本发明利用所述Text Rank算法与TF-IDF算法对智能语音识别后的文本信息进行关键词提取,相对于现有技术中的关键词提取技术,可以集成所述Text Rank算法与TF-IDF算法优点,同时可以使提取到的目标关键词集尽可能覆盖所述目标用户的需求点。最后基于N-gram相似度对所述目标关键词库与所述备选业务进行匹配,进一步的提高了电网客服业务推荐的质量。本发明所提供的方法,可以有效提高对目标用户语音对应的文本信息的关键词提取的准确性,从而提高了电网客服业务推荐的质量,优化了用户体验与电网客服的效率。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的基于智能语音分析的电网客服业务推荐方法的第一种具体实施例的流程图;
图2为基于深度卷积长短期记忆神经网络的语音识别算法的网络结构示意图;
图3为基于Text Rank算法、TF-IDF算法与关键词库的关键词提取算法流程图;
图4为基于N-gram相似度的业务匹配算法的流程图;
图5为本发明所提供的基于智能语音分析的电网客服业务推荐方法的第二种具体实施例的流程图;
图6为本发明实施例提供的一种基于智能语音分析的电网客服业务推荐装置的结构框图。
具体实施方式
本发明的核心是提供一种基于智能语音分析的电网客服业务推荐方法、装置、设备以及计算机可读存储介质,提高了对电网客户语音对应的文本信息的关键词提取的准确度以及电网客服业务推荐的指质量,优化用户体验,提高业务推荐的效率。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的基于智能语音分析的电网客服业务推荐方法的第一种具体实施例的流程图;具体操作步骤如下:
步骤S101:利用基于深度卷积长短期记忆神经网络的语音识别算法对目标用户语音进行识别,获取所述目标用户语音对应的文本信息;其中,所述基于深度卷积长短期记忆神经网络的语音识别算法由全连接卷积网络、长短期记忆神经网络与深度神经网络进行组合获得;
基于深度卷积长短期记忆神经网络的语音识别算法(CLDNN)由全连接卷积网络(CNN)、长短期记忆神经网络(LSTM)与深度神经网络(DNN)三种网络结构组成,所述CLDNN的网络结构如图2所示。
所述CNN包括输入层、卷积层、池化层与输出层。所述LSTM中有一个判断信息有用与否的“处理器”,这个处理器作用的结构被称为cell;一个cell当中被放置了三扇门,分别叫做输入门、遗忘门和输出门。一个信息进入LSTM的网络当中,可以根据规则来判断是否有用,只有符合算法认证的信息才会留下,不符的信息则通过遗忘门被遗忘。
所述CLDNN的输入层是时域相关的特征,CNN部分为两层CNN,第一层与第二层为滤波器。池化层采用max-pooling策略,第二层CNN不接池化层。由于CNN最后一层输出维度很大,所以在CNN后LSTM之前接一个线性层来降维。CNN后接LSTM层,可以使DNN输出信息更好地预测当前帧。最后,将LSTM的输出连接全连接DNN层。
所述CLDNN中通过连接CNN来减小频域变化,CNN的输出通过LSTM来减小时域变化。LSTM最后一层的输出输入到全连接DNN层,目的是将特征空间映射到更容易分类的输出层。实验证明,如果LSTM输入更好的特征其性能将得到提高,因此,用CNN来减小频域上的变化能使LSTM输入自适应性更强的特征,加入DNN增加隐层和输出层之间的深度能获得更强的预测能力。
步骤S102:依据预建的关键词库,分别利用Text Rank算法与TF-IDF算法提取所述文本信息的第一关键词集与第二关键词集,以确定所述文本信息的目标关键词集;
所述Text Rank算法的思想类似于Google推荐引擎中的PageRank算法,算法将文本中的语法单元视作图中的节点,如果两个语法单元存在一定语法关系,如共现,则这两个语法单元在图中就会有一条边相互连接,通过一定的迭代次数,最终不同的节点会有不同的权重,权重高的语法单元可以作为关键词。
所述Text Rank算法模型可以表示为一个有向有权图G=(V,E),由点集合V和边集合E组成,E是V×V的子集。图中任两点Vi,Vj之间边的权重为wji,对于一个给定的点(Vi,ln(Vi))为指向该点的点集合,Out(Vi)为点Vi指向的点集合。综上,所述Text Rank的计算公式如下:
其中,d为阻尼系数,取值范围为0至1,代表从图中某一特定点指向其他任意点的概率,一般取值为0.85。Vi为第i个节点,Vj为第j个节点,Vk为点Vi指向的点集合中的任一点,wjk则为点Vi指向的点Vk的边的权重。WS(Vi)为点Vi权重,WS(Vj)为点Vj权重。使用所述TextRank算法计算图中各点的权重时,需要给图中的点指定任意的初值,并递归计算直到收敛,即图中任意一点的误差率小于给定的极限值时就可以达到收敛,一般该极限值取0.0001。
在信息检索理论中,TF-IDF(Term Frequency-Inverse Document Frequency)是一种数值统计,用于反映一个词对于语料中某篇文档的重要性。在信息检索和文本挖掘领域,所述TF-IDF算法经常用于因子加权。所述TF-IDF算法的主要思想为:如果某个词在一篇文档中出现的频率高,即TF高;若在语料库中其他文档中很少出现,即DF值低,即IDF高,则认为这个词具有很好的类别区分能力。所述TF-IDF算法在实际中主要是将二者相乘,即TF*IDF,TF为词频(TermFrequency),表示词t在文档d中出现的频率;IDF为反文档频率(Inverse Document Frequency),表示语料库中包含词t的文档的数目的倒数。TF的计算公式为:
其中,count(t)为文档di中包含词t的个数;count(di)为所述文档di的词t的总数。
IDF的计算公式为:
其中,num(corpus)为表示语料库corpus中文档的总数,num(t)为语料库corpus中包含t的文档的数目。
所述Text Rank算法与所述TF-IDF算法均是基于文本本身来进行分析与关键词提取的。但这两种算法可能会导致提取的关键词与所述目标用户的关注点无关,比如提取的是出现频率较高的名词或语气词等。因此,有必要通过所述预先建立的关键词库来使提取到的关键词能够尽可能地覆盖用户关注点。
所述关键词库的建立主要通过专家知识和智能文本分析相结合的方法,首先通过业务专家与客服专家遴选出若干客服咨询的问题关键点,录入所述关键词库;再通过智能文本分析辅助的方法对海量用户咨询数据进行分析提取,再经过专家进一步遴选后录入所述关键词库。
本实施例所提供的关键词提取的方法,是基于所述Text Rank算法、所述TF-IDF算法与所述关键词库三种关键词提取算法结合得到的。将所述关键词库与所述Text Rank算法相结合,辅助所述Text Rank算法进行关键词提取,得到所述文本信息的第一关键词集。同时将所述关键词库与所述TF-IDF算法相结合,辅助所述TF-IDF算法进行关键词提取,得到所述文本信息的第二关键词库。最后,将所述第一关键词库与所述第二关键词库进行取并操作,去除重复的关键词,得到所述文本信息的目标关键词库,如图3所示。
本实施例中所提供的关键词提取的方法,可以去除所述目标用户语音文本信息中包含的过多无效信息,去粗存精留下所述文本信息中有用的信息。并且进行关键词提取后再进行下一步的业务匹配有利于降低算法时间复杂度。
步骤S103:利用预先构建的基于N-gram相似度的业务匹配算法对所述目标关键词集中的关键词与预建的备选业务库中的备选业务进行匹配,确定目标推荐业务,并将所述目标推荐业务发送至所述目标用户。
基于N-Gram模型定义的字符串相似度是一种模糊匹配方式,通过两个具有一定相似度的语段间的“差异”来衡量相似度。N-Gram相似度的计算是指按长度N切分语段得到词段,也就是语段中所有长度为N的子字符串。对于两个语段S和T,则可以从共有子串的数量上去定义两个语段的相似度。其计算公式如下:
Similarity=|GN(S)|+|GN(T)|-2*|GN(S)∩GN(T)|
其中,GN(S)与GN(T)分别为字符串S和T中N-Gram的集合,N一般取2或3。字符串距离越近,字符串S和T就越相似,当两个字符串完全相等时,距离为0。
所述基于N-gram相似度的业务匹配算法,对应提取到的目标关键词库,采取文本相似度分析的方法,运用N-gram相似度对所述关键词库中的关键词与多个备选业务进行匹配,选取相似度最高的业务作为所述目标推荐业务,所述基于N-gram相似度的业务匹配算法的工作流程如图4所示。所述目标推荐业务则可以作为客服人员解决用户咨询问题的重要参考,也可以直接推荐给客户作为解决方案。其中,所述备选业务需包含问题的详细描述及解决措施,而所有备选业务则通过分类存储构成业务库。
本实施例所提供的基于智能语音分析的电网客服业务推荐方法,对用户语音中描述的问题进行基于深度神经网络的智能识别,再将识别后的信息进行关键词提取,关键词提取将采用Text Rank算法、TF-IDF算法和关键词库相结合的办法,再对提取的关键词采用文本分析的方法与业务进行匹配,最后将最匹配的业务推荐给用户。本实施例所提供的电网客服业务推荐方法,将推荐技术应用于电网客服场景,代替传统的“菜单选择”模式,实现在线客服模式的创新,有利于优化用户体验与提高客服效率。
基于上述实施例,在本实施例中,每隔预设时长,对所述关键词库进行更新,以便可以有效保证关键词提取紧跟用户关注热点的迁移与业务的改变。请参考图5,图5为本发明所提供的基于智能语音分析的电网客服业务推荐方法的第二种具体实施例的流程图;具体操作步骤如下:
步骤S501:将目标客户语音输入至CLDNN的全连接卷积网络后,将所述全连接卷积网络的输出结果输入至线性层;
步骤S502:将所述线性层的输出结果输入至所述CLDNN的长短期记忆神经网络后,将所述长短期记忆神经网络的输出结果输入至所述CLDNN的深度神经网络,通过所述深度神经网络输出所述目标用户语音的文本信息;
步骤S503:利用Text Rank算法与预建的关键词库,提取所述文本信息的第一关键词集;
步骤S504:利用TF-IDF算法提取与所述关键词库,提取所述文本信息的第二关键词集;
步骤S505:对所述第一关键词集与所述第二关键词集进行取并操作,获得所述文本信息的目标关键词集;
步骤S506:对所述目标关键词集中的关键词与预建的备选业务库中的多个备选业务进行分别进行基于N-gram的相似度匹配,分别确定所述关键词集与所述多个备选业务之间的相似度;
步骤S507:选取与所述关键词集相似度最高的备选业务作为目标推荐业务,并将所述目标推荐业务发送至所述目标用户;
步骤S508:每隔预设时长对预设时间段内的用户咨询的问题进行文本聚类,确定热点问题;
步骤S509:提取所述热点问题的关键词,并根据所述热点问题的关键词对所述关键词库进行更新。
由于所述关键词库关系着关键词提取的质量,且随着时间的推移和业务的更替,用户产生的问题也会发生变化,因此针对关键词库的更新维护必不可少。在本实施例中,所述关键词库的更新维护方法可以采用专家知识与文本分析相结合的方法,定期将用户咨询的问题进行文本聚类,再将聚类中发现的热点问题进行关键词提取,再将提取到的关键词提供给业务专家进行筛选,最后将筛选到的关键词录入关键词库,重复的进行覆写,没有的直接插入。
请参考图6,图6为本发明实施例提供的一种基于智能语音分析的电网客服业务推荐装置的结构框图;具体装置可以包括:
语音识别模块100,用于利用基于深度卷积长短期记忆神经网络的语音识别算法对目标用户语音进行识别,获取所述目标用户语音对应的文本信息;其中,所述基于深度卷积长短期记忆神经网络的语音识别算法由全连接卷积网络、长短期记忆神经网络与深度神经网络进行组合获得;
关键词提取模块200,用于依据预建的关键词库,分别利用TextRank算法与TF-IDF算法提取所述文本信息的第一关键词集与第二关键词集,以确定所述文本信息的目标关键词集;
业务推荐模块300,用于利用预先构建的基于N-gram相似度的业务匹配算法对所述目标关键词集中的关键词与预建的备选业务库中的备选业务进行匹配,确定目标推荐业务,并将所述目标推荐业务发送至所述目标用户。
本实施例的基于智能语音分析的电网客服业务推荐装置用于实现前述的基于智能语音分析的电网客服业务推荐方法,因此基于智能语音分析的电网客服业务推荐装置中的具体实施方式可见前文中的基于智能语音分析的电网客服业务推荐方法的实施例部分,例如,语音识别模块100,关键词提取模块200,业务推荐模块300,分别用于实现上述基于智能语音分析的电网客服业务推荐方法中步骤S101,S102和S103,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本发明具体实施例还提供了一种基于智能语音分析的电网客服业务推荐设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种基于智能语音分析的电网客服业务推荐方法的步骤。
本发明具体实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于智能语音分析的电网客服业务推荐方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的基于智能语音分析的电网客服业务推荐方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种基于智能语音分析的电网客服业务推荐方法,其特征在于,包括:
利用基于深度卷积长短期记忆神经网络的语音识别算法对目标用户语音进行识别,获取所述目标用户语音对应的文本信息;其中,所述基于深度卷积长短期记忆神经网络的语音识别算法由全连接卷积网络、长短期记忆神经网络与深度神经网络进行组合获得;
依据预建的关键词库,分别利用Text Rank算法与TF-IDF算法提取所述文本信息的第一关键词集与第二关键词集,以确定所述文本信息的目标关键词集;
利用预先构建的基于N-gram相似度的业务匹配算法对所述目标关键词集中的关键词与预建的备选业务库中的备选业务进行匹配,确定目标推荐业务,并将所述目标推荐业务发送至所述目标用户。
2.如权利要求1所述的方法,其特征在于,所述利用基于深度卷积长短期记忆神经网络的语音识别算法对目标用户语音进行识别,获取所述目标用户语音对应的文本信息包括:
将目标用户语音输入至全连接卷积网络后,将所述全连接卷积网络的输出结果输入至线性层;
将所述线性层的输出结果输入至长短期记忆神经网络后,将所述长短期记忆神经网络的输出结果输入至深度神经网络,通过所述深度神经网络输出所述目标用户语音的文本信息。
3.如权利要求1所述的方法,其特征在于,所述依据预建的关键词库,分别利用TextRank算法与TF-IDF算法提取所述文本信息的第一关键词集与第二关键词集,以确定所述文本信息的目标关键词集包括:
利用Text Rank算法与预建的关键词库,提取所述文本信息的第一关键词集;
利用TF-IDF算法提取与所述关键词库,提取所述文本信息的第二关键词集;
对所述第一关键词集与所述第二关键词集进行取并操作,获得所述文本信息的目标关键词集。
4.如权利要求1所述的方法,其特征在于,所述利用预先构建的基于N-gram相似度的业务匹配算法对所述目标关键词集中的关键词与预建的备选业务库中的备选业务进行匹配,确定目标推荐业务包括:
对所述目标关键词集中的关键词与预建的备选业务库中的多个备选业务进行分别进行基于N-gram的相似度匹配,分别确定所述关键词集与所述多个备选业务之间的相似度;
选取与所述关键词集相似度最高的备选业务作为目标推荐业务。
5.如权利要求1-4任一项所述的方法,其特征在于,还包括:
每隔预设时长对预设时间段内的用户咨询的问题进行文本聚类,确定热点问题;
提取所述热点问题的关键词,并根据所述热点问题的关键词对所述关键词库进行更新。
6.一种基于智能语音分析的电网客服业务推荐装置,其特征在于,包括:
语音识别模块,用于利用基于深度卷积长短期记忆神经网络的语音识别算法对目标用户语音进行识别,获取所述目标用户语音对应的文本信息;其中,所述基于深度卷积长短期记忆神经网络的语音识别算法由全连接卷积网络、长短期记忆神经网络与深度神经网络进行组合获得;
关键词提取模块,用于依据预建的关键词库,分别利用Text Rank算法与TF-IDF算法提取所述文本信息的第一关键词集与第二关键词集,以确定所述文本信息的目标关键词集;
业务推荐模块,用于利用预先构建的基于N-gram相似度的业务匹配算法对所述目标关键词集中的关键词与预建的备选业务库中的备选业务进行匹配,确定目标推荐业务,并将所述目标推荐业务发送至所述目标用户。
7.如权利要求6所述的装置,其特征在于,所述关键词提取模块包括:
第一提取单元,用于利用Text Rank算法与预建的关键词库,提取所述文本信息的第一关键词集;
第二提取单元,用于利用TF-IDF算法提取与所述关键词库,提取所述文本信息的第二关键词集;
取并单元,用于对所述第一关键词集与所述第二关键词集进行取并操作,获得所述文本信息的目标关键词集。
8.如权利要求6所述的装置,其特征在于,所述业务推荐模块包括:
匹配单元,用于对所述目标关键词集中的关键词与预建的备选业务库中的多个备选业务进行分别进行基于N-gram的相似度匹配,分别确定所述关键词集与所述多个备选业务之间的相似度;
选取单元,用于选取与所述关键词集相似度最高的备选业务作为目标推荐业务。
9.一种基于智能语音分析的电网客服业务推荐设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述一种基于智能语音分析的电网客服业务推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述一种基于智能语音分析的电网客服业务推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910577885.4A CN110287325A (zh) | 2019-06-28 | 2019-06-28 | 一种基于智能语音分析的电网客服业务推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910577885.4A CN110287325A (zh) | 2019-06-28 | 2019-06-28 | 一种基于智能语音分析的电网客服业务推荐方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110287325A true CN110287325A (zh) | 2019-09-27 |
Family
ID=68020038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910577885.4A Pending CN110287325A (zh) | 2019-06-28 | 2019-06-28 | 一种基于智能语音分析的电网客服业务推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110287325A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929043A (zh) * | 2019-11-28 | 2020-03-27 | 北京智齿博创科技有限公司 | 业务问题提取方法及装置 |
CN111062599A (zh) * | 2019-12-09 | 2020-04-24 | 莆田学院 | 基于人员关系的人力资源调度模型训练、调度方法及装置 |
CN111291171A (zh) * | 2020-01-21 | 2020-06-16 | 南方电网能源发展研究院有限责任公司 | 一种危大工程风险数据搜索方法 |
CN111932296A (zh) * | 2020-07-20 | 2020-11-13 | 中国建设银行股份有限公司 | 一种产品推荐方法及装置、服务器、存储介质 |
CN112003989A (zh) * | 2020-08-26 | 2020-11-27 | 中国银行股份有限公司 | 坐席员的匹配方法、装置、电子设备及计算机存储介质 |
CN112148837A (zh) * | 2020-09-15 | 2020-12-29 | 珠海格力电器股份有限公司 | 维修方案的获取方法、装置、设备及存储介质 |
CN112418996A (zh) * | 2020-11-30 | 2021-02-26 | 珠海采筑电子商务有限公司 | 电梯供应商的推荐方法及系统 |
CN112579821A (zh) * | 2020-12-16 | 2021-03-30 | 北京影谱科技股份有限公司 | 一种基于实时语音输入的视频推荐方法、装置及计算设备 |
CN112738345A (zh) * | 2020-12-10 | 2021-04-30 | 南方电网数字电网研究院有限公司 | 用于业务管控智能语音的导航呼叫系统 |
CN112988998A (zh) * | 2021-03-15 | 2021-06-18 | 中国联合网络通信集团有限公司 | 应答方法及设备 |
CN113377928A (zh) * | 2021-08-11 | 2021-09-10 | 明品云(北京)数据科技有限公司 | 一种文本推荐方法、系统、设备及介质 |
CN113538048A (zh) * | 2021-07-12 | 2021-10-22 | 深圳市明源云客电子商务有限公司 | 需求信息获得方法、装置、终端设备以及存储介质 |
CN113779363A (zh) * | 2021-09-14 | 2021-12-10 | 广州汇通国信科技有限公司 | 一种基于深度神经网络的搜索优化方法及装置 |
CN114202303A (zh) * | 2021-11-09 | 2022-03-18 | 北京健康之家科技有限公司 | 业务数据的处理方法和系统 |
CN114219519A (zh) * | 2021-11-12 | 2022-03-22 | 国网辽宁省电力有限公司葫芦岛供电公司 | 一种结合企业发展规划和用户行为分析的业务处理方法 |
CN114697748A (zh) * | 2020-12-25 | 2022-07-01 | 深圳Tcl新技术有限公司 | 一种基于语音识别的视频推荐方法和计算机设备 |
CN115470705A (zh) * | 2022-09-19 | 2022-12-13 | 贵州航天云网科技有限公司 | 基于ai算法的智能业务建模方法 |
CN118297291A (zh) * | 2024-06-06 | 2024-07-05 | 上海通创信息技术股份有限公司 | 一种基于智能语音分析的电信客服业务推荐方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106933848A (zh) * | 2015-12-29 | 2017-07-07 | 中国移动通信集团公司 | 一种信息发送方法和装置 |
CN108492820A (zh) * | 2018-03-20 | 2018-09-04 | 华南理工大学 | 基于循环神经网络语言模型和深度神经网络声学模型的中文语音识别方法 |
CN109739969A (zh) * | 2018-12-29 | 2019-05-10 | 联想(北京)有限公司 | 答案生成方法和智能会话系统 |
CN109829810A (zh) * | 2018-12-13 | 2019-05-31 | 平安科技(深圳)有限公司 | 业务推荐方法、装置、计算机设备及存储介质 |
-
2019
- 2019-06-28 CN CN201910577885.4A patent/CN110287325A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106933848A (zh) * | 2015-12-29 | 2017-07-07 | 中国移动通信集团公司 | 一种信息发送方法和装置 |
CN108492820A (zh) * | 2018-03-20 | 2018-09-04 | 华南理工大学 | 基于循环神经网络语言模型和深度神经网络声学模型的中文语音识别方法 |
CN109829810A (zh) * | 2018-12-13 | 2019-05-31 | 平安科技(深圳)有限公司 | 业务推荐方法、装置、计算机设备及存储介质 |
CN109739969A (zh) * | 2018-12-29 | 2019-05-10 | 联想(北京)有限公司 | 答案生成方法和智能会话系统 |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929043B (zh) * | 2019-11-28 | 2023-02-24 | 北京智齿博创科技有限公司 | 业务问题提取方法及装置 |
CN110929043A (zh) * | 2019-11-28 | 2020-03-27 | 北京智齿博创科技有限公司 | 业务问题提取方法及装置 |
CN111062599A (zh) * | 2019-12-09 | 2020-04-24 | 莆田学院 | 基于人员关系的人力资源调度模型训练、调度方法及装置 |
CN111062599B (zh) * | 2019-12-09 | 2022-06-14 | 莆田学院 | 基于人员关系的人力资源调度模型训练、调度方法及装置 |
CN111291171B (zh) * | 2020-01-21 | 2023-05-16 | 南方电网能源发展研究院有限责任公司 | 一种危大工程风险数据搜索方法 |
CN111291171A (zh) * | 2020-01-21 | 2020-06-16 | 南方电网能源发展研究院有限责任公司 | 一种危大工程风险数据搜索方法 |
CN111932296A (zh) * | 2020-07-20 | 2020-11-13 | 中国建设银行股份有限公司 | 一种产品推荐方法及装置、服务器、存储介质 |
CN111932296B (zh) * | 2020-07-20 | 2024-05-28 | 中国建设银行股份有限公司 | 一种产品推荐方法及装置、服务器、存储介质 |
CN112003989A (zh) * | 2020-08-26 | 2020-11-27 | 中国银行股份有限公司 | 坐席员的匹配方法、装置、电子设备及计算机存储介质 |
CN112148837A (zh) * | 2020-09-15 | 2020-12-29 | 珠海格力电器股份有限公司 | 维修方案的获取方法、装置、设备及存储介质 |
CN112418996A (zh) * | 2020-11-30 | 2021-02-26 | 珠海采筑电子商务有限公司 | 电梯供应商的推荐方法及系统 |
CN112738345A (zh) * | 2020-12-10 | 2021-04-30 | 南方电网数字电网研究院有限公司 | 用于业务管控智能语音的导航呼叫系统 |
CN112579821A (zh) * | 2020-12-16 | 2021-03-30 | 北京影谱科技股份有限公司 | 一种基于实时语音输入的视频推荐方法、装置及计算设备 |
CN114697748B (zh) * | 2020-12-25 | 2024-05-03 | 深圳Tcl新技术有限公司 | 一种基于语音识别的视频推荐方法和计算机设备 |
CN114697748A (zh) * | 2020-12-25 | 2022-07-01 | 深圳Tcl新技术有限公司 | 一种基于语音识别的视频推荐方法和计算机设备 |
CN112988998A (zh) * | 2021-03-15 | 2021-06-18 | 中国联合网络通信集团有限公司 | 应答方法及设备 |
CN112988998B (zh) * | 2021-03-15 | 2023-06-16 | 中国联合网络通信集团有限公司 | 应答方法及设备 |
CN113538048A (zh) * | 2021-07-12 | 2021-10-22 | 深圳市明源云客电子商务有限公司 | 需求信息获得方法、装置、终端设备以及存储介质 |
CN113377928A (zh) * | 2021-08-11 | 2021-09-10 | 明品云(北京)数据科技有限公司 | 一种文本推荐方法、系统、设备及介质 |
CN113377928B (zh) * | 2021-08-11 | 2022-05-27 | 明品云(北京)数据科技有限公司 | 一种文本推荐方法、系统、设备及介质 |
CN113779363A (zh) * | 2021-09-14 | 2021-12-10 | 广州汇通国信科技有限公司 | 一种基于深度神经网络的搜索优化方法及装置 |
CN113779363B (zh) * | 2021-09-14 | 2023-12-22 | 广州汇通国信科技有限公司 | 一种基于深度神经网络的搜索优化方法及装置 |
CN114202303A (zh) * | 2021-11-09 | 2022-03-18 | 北京健康之家科技有限公司 | 业务数据的处理方法和系统 |
CN114219519A (zh) * | 2021-11-12 | 2022-03-22 | 国网辽宁省电力有限公司葫芦岛供电公司 | 一种结合企业发展规划和用户行为分析的业务处理方法 |
CN115470705A (zh) * | 2022-09-19 | 2022-12-13 | 贵州航天云网科技有限公司 | 基于ai算法的智能业务建模方法 |
CN115470705B (zh) * | 2022-09-19 | 2023-08-08 | 贵州航天云网科技有限公司 | 基于ai算法的智能业务建模方法 |
CN118297291A (zh) * | 2024-06-06 | 2024-07-05 | 上海通创信息技术股份有限公司 | 一种基于智能语音分析的电信客服业务推荐方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287325A (zh) | 一种基于智能语音分析的电网客服业务推荐方法及装置 | |
CN111310438B (zh) | 基于多粒度融合模型的中文句子语义智能匹配方法及装置 | |
Sun et al. | SIFRank: a new baseline for unsupervised keyphrase extraction based on pre-trained language model | |
CN109345399B (zh) | 理赔风险评估方法、装置、计算机设备及存储介质 | |
CN109344240B (zh) | 一种数据处理方法、服务器及电子设备 | |
WO2023029420A1 (zh) | 一种电力用户诉求筛选方法、系统、电子设备和存储介质 | |
CN110399385A (zh) | 一种用于小数据集的语义分析方法和系统 | |
CN111143576A (zh) | 一种面向事件的动态知识图谱构建方法和装置 | |
CN103605665A (zh) | 一种基于关键词的评审专家智能检索与推荐方法 | |
CN107180026B (zh) | 一种基于词嵌入语义映射的事件短语学习方法及装置 | |
CN110321561B (zh) | 一种关键词提取方法和装置 | |
CN109255012B (zh) | 机器阅读理解以及减少候选数据集规模的方法、装置 | |
CN111339249B (zh) | 一种联合多角度特征的深度智能文本匹配方法和装置 | |
CN104281565B (zh) | 语义词典构建方法和装置 | |
CN112836029A (zh) | 一种基于图的文档检索方法、系统及其相关组件 | |
CN115062135B (zh) | 一种专利筛选方法与电子设备 | |
CN113032552A (zh) | 一种基于文本摘要的政策要点抽取方法与提取系统 | |
CN113190593A (zh) | 一种基于数字人文知识图谱的搜索推荐方法 | |
CN108846033B (zh) | 特定领域词汇的发现及分类器训练方法和装置 | |
Midhunchakkaravarthy et al. | Feature fatigue analysis of product usability using Hybrid ant colony optimization with artificial bee colony approach | |
CN115033706A (zh) | 一种知识图谱自动补全和更新的方法 | |
Charitha et al. | Extractive document summarization using a supervised learning approach | |
CN110019763B (zh) | 文本过滤方法、系统、设备及计算机可读存储介质 | |
CN115129890A (zh) | 回馈数据图谱生成方法、生成设备、问答设备及冰箱 | |
US11822609B2 (en) | Prediction of future prominence attributes in data set |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190927 |