CN117594038B - 语音服务改进方法及系统 - Google Patents
语音服务改进方法及系统 Download PDFInfo
- Publication number
- CN117594038B CN117594038B CN202410078056.2A CN202410078056A CN117594038B CN 117594038 B CN117594038 B CN 117594038B CN 202410078056 A CN202410078056 A CN 202410078056A CN 117594038 B CN117594038 B CN 117594038B
- Authority
- CN
- China
- Prior art keywords
- service
- keyword
- similarity
- language
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000006872 improvement Effects 0.000 title claims abstract description 27
- 238000010219 correlation analysis Methods 0.000 claims description 11
- 238000003062 neural network model Methods 0.000 claims description 6
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 239000003814 drug Substances 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 7
- 229930186147 Cephalosporin Natural products 0.000 description 5
- 230000009471 action Effects 0.000 description 5
- 229940124587 cephalosporin Drugs 0.000 description 5
- 150000001780 cephalosporins Chemical class 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 206010011224 Cough Diseases 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 206010019233 Headaches Diseases 0.000 description 3
- 206010028748 Nasal obstruction Diseases 0.000 description 3
- 206010037660 Pyrexia Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000035622 drinking Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 231100000869 headache Toxicity 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 206010036790 Productive cough Diseases 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 206010062717 Increased upper airway secretion Diseases 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000017574 dry cough Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 208000026435 phlegm Diseases 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请涉及人工智能领域,公开了一种语音服务改进方法及系统,可以自动分析语音服务对话,有效地提升语音服务的效率和成功率。方法包括:捕获语音服务录音,将捕获到的语音服务录音识别分割为服务人员文字和服务对象文字。基于大语言模型,为识别到的服务对象文字匹配相应的服务语言模板,将识别到的服务人员文字与服务语言模板进行比较得到第一相似度S1。设定关键词集合K={k1,k2,…,ki,…kn},检测关键词集合中的各关键词在识别到的文字中出现的情况,得到第二相似度S2,第二相似度S2为:;第一相似度S1和第二相似度S2进行加权获得总相似度S,若总相似度S低于第一门限,且可统计指标高于第二门限,则将识别到的文字添加至服务语言模板形成新的服务语言模板。
Description
技术领域
本申请涉及人工智能领域,具体涉及一种语音服务改进方法及系统。
背景技术
本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是已被公开的现有技术。
随着电子商务的不断发展,传统的单一性客户服务方式——电话客户服务,由于受到时间地域等一些客观条件的限制,已经无法满足用户的需求,融合“客户服务、商品导购”等多种服务元素,将客户服务无缝的嵌入售前、售中、售后过程始终。客服人员通过电话服务系统及时响应用户需求,在用户遇到困难时提出指导性建议,及时解决用户在使用中遇到的各种问题。这种一对一在线客服方式不仅方便快捷,同时可以增加用户和客服人员进行对话的几率,用户可以更直观的获取所需信息。
目前,语音服务的监控和分析通常依赖以下技术手段和流程:
1.手机或其他录音设备:使用手机或专业录音设备记录语音服务对话。
2.录音后的质量控制抽查:事后随机选择录音,手动听取和评估语音服务质量。
3.定期的培训和评估:定期组织语音服务人员进行培训,并通过模拟或实际情境来评估他们的语音服务内容。
尽管现有技术手段能够在一定程度上帮助监控和改进语音服务,但它们存在以下不足:
1.自动化和智能化程度不足:依赖于人工操作录音和抽查,效率低下,容易遗漏关键互动。
2.缺乏系统性和实时性的分析:无法提供即时的反馈和分析,导致改进措施延迟实施。
3.数据驱动的优化和迭代能力有限:缺乏有效的数据分析支持,难以根据实际效果和客户反馈优化服务语言模板。
发明内容
本申请的目的在于提供一种语音服务改进方法及系统,可以自动分析语音服务对话,有效地提升语音服务的效率和成功率。
本申请公开了一种语音服务改进方法,包括:
捕获语音服务录音,将捕获到的所述语音服务录音识别分割为服务人员文字和服务对象文字;
基于大语言模型,为识别到的所述服务对象文字匹配相应的服务语言模板;
基于大语言模型,将识别到的所述服务人员文字与所述服务语言模板进行比较,得到第一相似度;
设定关键词集合K={k1,k2,…,ki…,kn},检测所述关键词集合中的各关键词在所述识别到的文字中出现的情况,得到第二相似度,所述第二相似度/>为:;其中,/>表示所述关键词集合中的第i个关键词,/>为所述关键词出现的权重系数,/>为所述关键词出现的顺序的权重系数,/>表示所述关键词/>在识别到的所述服务人员文字中是否出现,若出现,则/>=1,若没出现,则/>=0.5;/>表示所述关键词/>和所述关键词/>在识别到的所述服务人员文字中的出现顺序是否与所述服务语言模板中的顺序一致,若顺序一致,则/>=1,若顺序不一致,则/>=0.5;
对所述第一相似度和所述第二相似度/>进行加权获得总相似度/>,若所述总相似度/>低于第一门限,且可统计指标高于第二门限,则将识别到的所述服务人员文字添加至所述服务语言模板形成新的服务语言模板。
在一个优选例中,所述大语言模型为:基于Transformer的模型、基于自编码器的模型、序列到序列模型、递归神经网络模型或分层模型。
在一个优选例中,所述可统计指标为客户满意度。
在一个优选例中,所述可统计指标为问题解决率和/或服务成功率。
在一个优选例中,进一步包括:采用相关性分析所述语音服务中所述关键词的使用频率与所述可统计指标之间的关系;
确定所述关键词的使用频率与所述可统计指标之间是否为正相关。
在一个优选例中,所述相关性分析为皮尔逊相关系数。
本申请还公开了一种语音服务改进系统,包括:
语音捕获模块,用于捕获语音服务对话形成语音服务录音;
文字识别模块,用于将捕获到的所述语音服务录音识别分割为服务人员文字和服务对象文字;
大大语言模型模块,用于为识别到的所述服务对象文字匹配相应的服务语言模板,以及将识别到的所述服务人员文字与所述服务语言模板进行比较以获取第一相似度S1;
关键词检测模块,用于检测关键词集合K={k1,k2,…,ki…,kn}中的各关键词在所述识别到的文字中出现的情况,得到第二相似度,所述第二相似度/>为;其中,/>表示所述关键词集合中的第i个关键词,/>为所述关键词出现的权重系数,/>为所述关键词出现的顺序的权重系数,/>表示所述关键词/>在识别到的所述服务人员文字中是否出现,若出现,则/>=1,若没出现,则/>=0.5;/>表示所述关键词/>和所述关键词/>在识别到的所述服务人员文字中的出现顺序是否与所述服务语言模板中的顺序一致,若顺序一致,则/>=1,若顺序不一致,则/>=0.5;
加权模块,用于对所述第一相似度S1和所述第二相似度S2进行加权获得总相似度S;
服务语言模板改进模块,用于将所述总相似度低于第一门限,且可统计指标高于第二门限的所述服务人员文字添加至所述服务语言模板中形成新的服务语言模板。
在一个优选例中,所述大语言模型模块基于Transformer模型、基于自编码器模型、序列到序列模型、递归神经网络模型或分层模型。
在一个优选例中,所述可统计指标为客户满意度。
在一个优选例中,所述可统计指标为问题解决率和/或服务成功率。
在一个优选例中,还可以包括相关性分析模块,所述相关性分析模块用于分析所述语音服务中所述关键词的使用频率与所述可统计指标之间的关系,并确定所述关键词的使用频率与所述可统计指标之间是否为正相关。
在一个可选的实施例中,所述相关性分析模块中可以采用皮尔逊相关系数进行相关性分析。
本申请还公开了一种语音服务改进设备,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,与所述存储器耦合,用于在执行所述计算机可执行指令时实现如前文描述的方法中的步骤。
本申请还公开了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如前文描述的方法中的步骤。
本申请的实施方式中,通过录制语音服务过程当中的对话获得语音服务录音,并将语音服务录音转录为文字,使用大语言模型对转录的文字进行分析,比较实际的语音服务对话和服务语言模板,从而获得了第一相似度,另外设置了关键词集合,检测关键词集合中的关键词是否在实际的语音服务对话中是否出现,以及出现的顺序,从而得到了第二相似度,将第一相似度与第二相似度加权后,相似度低于第一门限但可统计数据高于第二门限的文字被录入到服务语言模板中形成新的语言模板,即实际的语音服务对话虽然与预设的服务语言模板不相似,仍然取得了预期的良好效果,将其并入原先的服务语言模板中可以进一步帮助完善服务语言模板。由于大语言模型的特性,也不再依赖于人工录音抽查,另外,也可以提供即时地反馈和分析,使改进措施即时实施,在获得了上述分析后的数据支撑,也可以更有效地调整服务语言模板,以极其有效的方式提高了服务的效率、成功率以及满意度等。
上述发明内容中公开的各个技术特征、在下文各个实施方式和例子中公开的各技术特征、以及附图中公开的各个技术特征,都可以自由地互相组合,从而构成各种新的技术方案(这些技术方案均应该视为在本说明书中已经记载),除非这种技术特征的组合在技术上是不可行的。例如,在一个例子中公开了特征A+B+C,在另一个例子中公开了特征A+B+D+E,而特征C和D是起到相同作用的等同技术手段,技术上只要择一使用即可,不可能同时采用,特征E技术上可以与特征C相组合,则,A+B+C+D的方案因技术不可行而应当不被视为已经记载,而A+B+C+E的方案应当视为已经被记载。
附图说明
图1是根据本申请的一个实施方式的语音服务改进方法的流程示意图。
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
部分概念的说明:
大语言模型(LLM, Large Language Model);是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。大语言模型由具有许多参数(通常数十亿个权重或更多)的神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模型在2018年左右出现,并在各种任务中表现出色。尽管这个术语没有正式的定义,但它通常指的是参数数量在数十亿或更多数量级的深度学习模型。大型语言模型是通用的模型,在广泛的任务中表现出色,而不是针对一项特定任务。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请的实施方式作进一步地详细描述。
本申请的第一实施方式涉及一种语音服务改进方法,其流程如图1所示,该方法包括以下步骤:
在步骤101中,捕获语音服务录音,将捕获到的语音服务录音识别分割为服务人员文字和服务对象文字。
在步骤102中,为识别到的服务对象文字匹配相应的服务语言模板。
在步骤103中,基于大语言模型,将识别到的服务人员文字与服务语言模板进行比较,得到第一相似度。
在步骤104中,设定关键词集合K={k1,k2,…,ki…,kn},检测关键词集合中的各关键词在识别到的文字中出现的情况,得到第二相似度,第二相似度/>为;其中,/>表示所述关键词集合中的第i个关键词,/>为所述关键词出现的权重系数,/>为所述关键词出现的顺序的权重系数,/>表示所述关键词/>在识别到的所述服务人员文字中是否出现,若出现,则/>=1,若没出现,则/>=0.5;/>表示所述关键词/>和所述关键词/>在识别到的所述服务人员文字中的出现顺序是否与所述服务语言模板中的顺序一致,若顺序一致,则/>=1,若顺序不一致,则/>=0.5;
在步骤105中,对第一相似度和第二相似度/>进行加权获得总相似度/>,若总相似度/>低于第一门限,且可统计指标高于第二门限,则将识别到的服务人员文字添加至服务语言模板形成新的服务语言模板。
在一个可选的实施例中,关键词出现的顺序的权重系数可以根据关键词和关键词之间的相关性程度进行调整。
在一个可选的实施例中,第一门限和第二门限是预先设定的值,可以根据实际情况及应用场景的需要进行设置。
在一个可选的实施例中,大语言模型为:基于Transformer的模型、基于自编码器的模型、序列到序列模型、递归神经网络模型或分层模型。
在一个可选的实施例中,可统计指标为客户满意度。
在一个可选的实施例中,可统计指标为问题解决率。
在一个可选的实施例中,可统计指标为服务成功率。
在一个可选的实施例中,可以采用相关性分析语音服务中关键词的使用频率与可统计指标之间的关系,并确定关键词的使用频率与可统计指标之间是否为正相关。
在一个可选的实施例中,可以采用皮尔逊相关系数进行相关性分析。
为了能够更好地理解本申请的技术方案,下面结合一个具体的例子来进行说明,该例子中罗列的细节主要是为了便于理解,不作为对本申请的保护范围的限制。
实施例1
一般地,具有预先设置好服务语言模板。例如顾客需要购药并了解某种症状药品的服用方法:
服务对象:您好,我需要买感冒药。
服务人员:您好,请问您目前有什么症状?比如咳嗽、头痛、或者发烧?咳痰是清状还是浊状?是否鼻塞?
服务对象:我的症状是咳嗽、头痛、不发烧、清状痰、鼻塞。
服务人员:根据您的症状,建议购买【品牌名】感冒药,它主要针对咳嗽、头痛、不发烧、清状痰、鼻塞的症状。
服务对象:那么怎么服用呢?
服务人员:您好,根据药品外包装上的说明,成人一日三次,一次一片,儿童一日一次,一次一片。
服务对象:好的,谢谢。
然而实际的对话过程中,服务对象和服务人员的对话并不会完全按照服务语言模板一模一样地进行,例如:
服务对象:你好,有药吗?
服务人员:你有什么症状?
服务对象:我头有点嗡嗡的,鼻子还堵住了,老是干咳。
服务人员:【品牌名】感冒药挺好的,很多人购买。
服务对象:怎么吃?
服务人员:你几岁?
服务对象:我36岁。
服务人员:一日三次,一次一片。
在语音服务过程中,对话开始时,使用内置或外接麦克风的设备(如手机)进行高质量录音获得语音服务录音,语音服务录音通过自动或手动的方式上传到云端服务器并集中管理。利用语音识别技术,将语音服务录音转换为文字,同事保持高准确度,应用说话人识别算法区分不同的说话对象:例如将服务人员与服务对象区分开来。
使用大语言模型对转录的服务对象文字进行分析,匹配出相应的服务语言模板,例如,当服务对象文字为:“怎么吃?”时,匹配出的服务语言模板为:“您好,根据药品外包装上的说明,成人一日三次,一次一片,儿童一日一次,一次一片。”
在大语言模型匹配出相应的服务语言模板后,将大语言模型与服务人员文字进行比对,获得第一相似度S1。在本例中,服务人员对于服务对象“怎么吃?”的回答为:“你几岁?”,服务语言模板中的关键词集合K={说明,成人,儿童},各关键词在服务人员文字中并未出现,因此=0.5,关键词顺序也与关键词模板中的顺序不一致,因此/>=0.5。根据第二相似度S2公式可以得出/>,/>和/>可以根据自身经验和实际情况等进行设置和调整。
将第一相似度和第二相似度进行加权获得总相似度S,S=α*S1+β*S2,其中α和β是本领域技术人员可以根据自身经验和实际情况等进行设置和调整的,将总相似度与预先设置的第一门限进行比较得到总相似度低于第一门限的结果,并且将可统计指标(客户满意度)与第二门限进行比较得到可统计指标高于第二门限的结果,则认定实际语音服务的内容同样具有较佳的效果,应将其纳入服务语言模板中形成新的语言模板。在实际服务过程中,服务对象也更偏好服务人员给出明确的回答,因此服务对象的服务语言发生改变却产生了较好的反馈,能够进一步地帮助改进服务语言模板,便于后续服务人员的服务改进优化。
实施例2
本实施方式也可用于对服务对象的服务质量进行内部评分,例如在客户需要购买头孢类抗生素场景的情况下,服务语言模板为:
服务对象:请问这抗生素怎么服用?
服务人员:您好,根据药品外包装上的说明,成人一日三次,一次一片,儿童一日一次,一次一片。另外,服用头孢类抗生素之前不能饮酒。
头孢和饮酒是相关性较强的两个关键词,可以设置较高的{头孢}和{饮酒}的关键词出现的权重系数,以及较高的关键词出现的顺序的权重系数,若服务人员在实际回答中没有提到{头孢}和{饮酒},基于大语言模型对比服务人员文字与服务语言模板得到的第一相似度S1
,并检测关键词集合中的各关键词在识别到的文字中出现的情况得到第二相似度S2,综合加权获得总相似度S后可以根据总相似度的高低对服务对象的服务质量进行评分,总相似度S越高,则代表服务对象的服务越规范,服务质量内部评分也越高。总相似度S越低,则代表服务人员文字与服务语言模板的差别越大,服务质量内部评分也越低,此时可以进一步根据可统计指标与第二门限进行比较后的结果判断实际服务人员的服务是否有效,将可统计指标与服务质量内部评分加权后也可获得服务人员的最终评分。
本申请的第二实施方式涉及一种语音服务改进系统,该系统包括:
语音捕获模块,用于捕获语音服务对话形成语音服务录音;
文字识别模块,用于将捕获到的语音服务录音识别分割为服务人员文字和服务对象文字;
大语言模型模块,用于为识别到的服务对象文字匹配相应的服务语言模板,以及将识别到的服务人员文字与服务语言模板进行比较以获取第一相似度S1;
关键词检测模块,用于检测关键词集合K={k1,k2,…,ki…,kn}中的各关键词在识别到的文字中出现的情况,得到第二相似度,第二相似度/>为;其中,/>表示所述关键词集合中的第i个关键词,/>为所述关键词出现的权重系数,/>为所述关键词出现的顺序的权重系数,/>表示所述关键词/>在识别到的所述服务人员文字中是否出现,若出现,则=1,若没出现,则/>=0.5;/>表示所述关键词/>和所述关键词/>在识别到的所述服务人员文字中的出现顺序是否与所述服务语言模板中的顺序一致,若顺序一致,则=1,若顺序不一致,则/>=0.5;
加权模块,用于对第一相似度S1和第二相似度S2进行加权获得总相似度S;
服务语言模板改进模块,用于将总相似度低于第一门限,且可统计指标高于第二门限的服务人员文字添加至服务语言模板中形成新的服务语言模板。
在一个可选的实施例中,大语言模型模块基于Transformer模型、基于自编码器模型、序列到序列模型、递归神经网络模型或分层模型。
在一个可选的实施例中,可统计指标为客户满意度。
在一个可选的实施例中,可统计指标为问题解决率。
在一个可选的实施例中,可统计指标为服务成功率。
在一个可选的实施例中,还可以包括相关性分析模块,用于分析语音服务中关键词的使用频率与可统计指标之间的关系,并确定关键词的使用频率与可统计指标之间是否为正相关。
在一个可选的实施例中,相关性分析模块中可以采用皮尔逊相关系数进行相关性分析。
第一实施方式是与本实施方式相对应的方法实施方式,第一实施方式中的技术细节可以应用于本实施方式,本实施方式中的技术细节也可以应用于第一实施方式。
此外,本申请的实施方式还提供一种语音服务改进设备,其中包括用于存储计算机可执行指令的存储器,以及,处理器;该处理器用于在执行该存储器中的计算机可执行指令时实现上述各方法实施方式中的步骤。其中,该处理器可以是中央处理器(CentralProcessing Unit,简称“CPU”)、图像处理 器(Graphic Processing Unit,简称“GPU”)、数字信号处理器(Digital Signal Processor,简称“DSP”)、微控制单元(MicrocontrollerUnit,简称“MCU”)、神经网络处理器(简称“NPU”)、专用集成电路(Application SpecificIntegrated Circuit,简称“ASIC”)、现成可编程门阵列(Field Programmable GateArray,简称“FPGA”)或者其他可编程逻辑器件等。前述的存储器可以是只读存储器(read-only memory,简称“ROM”)、随机存取存储器(random access memory,简称“RAM”)、快闪存储器(Flash)、硬盘或者固态硬盘等。本发明各实施方式所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
相应地,本申请的实施方式还提供一种计算机可读存储介质,其中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现本申请的各方法实施方式。计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于,相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
需要说明的是,在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本申请中,如果提到根据某要素执行某行为,则是指至少根据该要素执行该行为的意思,其中包括了两种情况:仅根据该要素执行该行为、和根据该要素和其它要素执行该行为。多个、多次、多种等表达包括2个、2次、2种以及2个以上、2次以上、2种以上。
在描述方法的步骤时使用的序号本身并不对这些步骤的顺序构成任何的限定。例如,序号大的步骤并非一定要在序号小的步骤之后执行,也可以是先执行序号大的步骤再执行序号小的步骤,还可以是并行执行,只要这种执行顺序对于本领域技术人员来说是合理的即可。又如,拥有连续编号序号的多个步骤(例如步骤101,步骤102,步骤103等)并不限制其他步骤可以在其间执行,例如步骤101和步骤102之间可以有其他的步骤。
本说明书包括本文所描述的各种实施例的组合。对实施例的单独提及(例如“一个实施例”或“一些实施例”或“优选实施例”);然而,除非指示为是互斥的或者本领域技术人员很清楚是互斥的,否则这些实施例并不互斥。应当注意的是,除非上下文另外明确指示或者要求,否则在本说明书中以非排他性的意义使用“或者”一词。
在本说明书提及的所有文献都被认为是整体性地包括在本申请的公开内容中,以便在必要时可以作为修改的依据。此外应理解,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
Claims (8)
1.一种语音服务改进方法,其特征在于,包括:
捕获语音服务录音,将捕获到的所述语音服务录音识别分割为服务人员文字和服务对象文字;
基于大语言模型,为识别到的所述服务对象文字匹配相应的服务语言模板;
基于大语言模型,将识别到的所述服务人员文字与所述服务语言模板进行比较,得到第一相似度S1;
设定关键词集合K={k1,k2,…,ki…,kn},检测所述关键词集合中的各关键词在所述识别到的文字中出现的情况,得到第二相似度S2,所述第二相似度S2为:;其中,/>表示所述关键词集合中的第i个关键词,/>为所述关键词出现的权重系数,/>为所述关键词出现的顺序的权重系数,/>表示所述关键词/>在识别到的所述服务人员文字中是否出现,若出现,则/>,若没出现,则/>;/>表示所述关键词/>和所述关键词/>在识别到的所述服务人员文字中的出现顺序是否与所述服务语言模板中的顺序一致,若顺序一致,则/>,若顺序不一致,则/>;
对所述第一相似度S1和所述第二相似度S2进行加权获得总相似度S,若所述总相似度S低于第一门限,且可统计指标高于第二门限,则将识别到的所述服务人员文字添加至所述服务语言模板形成新的服务语言模板,其中,所述可统计指标包括以下之一或其任意组合:客户满意度、问题解决率、服务成功率。
2.如权利要求1所述的语音服务改进方法,其特征在于,所述大语言模型为:基于Transformer的模型、基于自编码器的模型、序列到序列模型、递归神经网络模型或分层模型。
3.如权利要求2所述的语音服务改进方法,其特征在于,进一步包括:采用相关性分析所述语音服务中所述关键词的使用频率与所述可统计指标之间的关系;
确定所述关键词的使用频率与所述可统计指标之间是否为正相关。
4.如权利要求3所述的语音服务改进方法,其特征在于,所述相关性分析为皮尔逊相关系数。
5.一种语音服务改进系统,其特征在于,包括:
语音捕获模块,用于捕获语音服务对话形成语音服务录音;
文字识别模块,用于将捕获到的所述语音服务录音识别分割为服务人员文字和服务对象文字;
大语言模型模块,用于为识别到的所述服务对象文字匹配相应的服务语言模板,以及将识别到的所述服务人员文字与所述服务语言模板进行比较以获取第一相似度S1;
关键词检测模块,用于检测关键词集合K={k1,k2,…,ki…,kn}中的各关键词在所述识别到的文字中出现的情况,得到第二相似度S2,所述第二相似度S2为,其中,/>表示所述关键词集合中的第i个关键词,/>为所述关键词出现的权重系数,/>为所述关键词出现的顺序的权重系数,/>表示所述关键词/>在识别到的所述服务人员文字中是否出现,若出现,则/>,若没出现,则/>;/>表示所述关键词/>和所述关键词在识别到的所述服务人员文字中的出现顺序是否与所述服务语言模板中的顺序一致,若顺序一致,则/>,若顺序不一致,则/>;
加权模块,用于对所述第一相似度S1和所述第二相似度S2进行加权获得总相似度S;
服务语言模板改进模块,用于将所述总相似度S低于第一门限,且可统计指标高于第二门限的所述服务人员文字添加至所述服务语言模板中形成新的服务语言模板,其中,所述可统计指标包括以下之一或其任意组合:客户满意度、问题解决率、服务成功率。
6.如权利要求5所述的语音服务改进系统,其特征在于,所述大语言模型模块基于Transformer模型、基于自编码器模型、序列到序列模型、递归神经网络模型或分层模型。
7.一种语音服务改进设备,其特征在于,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,与所述存储器耦合,用于在执行所述计算机可执行指令时实现如权利要求1至4中任意一项所述的方法中的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如权利要求1至4中任意一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410078056.2A CN117594038B (zh) | 2024-01-19 | 2024-01-19 | 语音服务改进方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410078056.2A CN117594038B (zh) | 2024-01-19 | 2024-01-19 | 语音服务改进方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117594038A CN117594038A (zh) | 2024-02-23 |
CN117594038B true CN117594038B (zh) | 2024-04-02 |
Family
ID=89912046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410078056.2A Active CN117594038B (zh) | 2024-01-19 | 2024-01-19 | 语音服务改进方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117594038B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105681609A (zh) * | 2014-11-20 | 2016-06-15 | 中兴通讯股份有限公司 | 一种客服中心座席的辅助方法和装置 |
EA201800581A1 (ru) * | 2018-09-24 | 2020-03-31 | Общество С Ограниченной Ответственностью "Незабудка Софтвер" | Способ поиска в тексте совпадений с шаблонами |
CN112202978A (zh) * | 2020-08-24 | 2021-01-08 | 维知科技张家口有限责任公司 | 智能外呼系统、方法、计算机系统及存储介质 |
CN112468659A (zh) * | 2020-11-20 | 2021-03-09 | 平安普惠企业管理有限公司 | 应用于电话客服的质量评价方法、装置、设备及存储介质 |
WO2021135548A1 (zh) * | 2020-06-05 | 2021-07-08 | 平安科技(深圳)有限公司 | 语音的意图识别方法、装置、计算机设备及存储介质 |
CN113642335A (zh) * | 2021-08-16 | 2021-11-12 | 上海云从企业发展有限公司 | 银行双录场景的语言合规性检查方法、装置、设备和介质 |
CN114449105A (zh) * | 2021-12-27 | 2022-05-06 | 国网河南省电力公司郑州供电公司 | 基于语音的电力客户服务话务质检系统 |
CA3182191A1 (en) * | 2021-11-17 | 2023-05-17 | 10353744 Canada Ltd. | Voice quality inspection method and device, computer equipment and storage medium |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11586829B2 (en) * | 2020-05-01 | 2023-02-21 | International Business Machines Corporation | Natural language text generation from a set of keywords using machine learning and templates |
KR102434912B1 (ko) * | 2022-01-24 | 2022-08-23 | 주식회사 하이 | 신경언어장애를 개선하는 방법 및 장치 |
-
2024
- 2024-01-19 CN CN202410078056.2A patent/CN117594038B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105681609A (zh) * | 2014-11-20 | 2016-06-15 | 中兴通讯股份有限公司 | 一种客服中心座席的辅助方法和装置 |
EA201800581A1 (ru) * | 2018-09-24 | 2020-03-31 | Общество С Ограниченной Ответственностью "Незабудка Софтвер" | Способ поиска в тексте совпадений с шаблонами |
WO2021135548A1 (zh) * | 2020-06-05 | 2021-07-08 | 平安科技(深圳)有限公司 | 语音的意图识别方法、装置、计算机设备及存储介质 |
CN112202978A (zh) * | 2020-08-24 | 2021-01-08 | 维知科技张家口有限责任公司 | 智能外呼系统、方法、计算机系统及存储介质 |
CN112468659A (zh) * | 2020-11-20 | 2021-03-09 | 平安普惠企业管理有限公司 | 应用于电话客服的质量评价方法、装置、设备及存储介质 |
CN113642335A (zh) * | 2021-08-16 | 2021-11-12 | 上海云从企业发展有限公司 | 银行双录场景的语言合规性检查方法、装置、设备和介质 |
CA3182191A1 (en) * | 2021-11-17 | 2023-05-17 | 10353744 Canada Ltd. | Voice quality inspection method and device, computer equipment and storage medium |
CN114449105A (zh) * | 2021-12-27 | 2022-05-06 | 国网河南省电力公司郑州供电公司 | 基于语音的电力客户服务话务质检系统 |
Non-Patent Citations (1)
Title |
---|
基于多模态大语言模型的关系抽取研究;王震宇;数据分析与知识发现;20240117;第1-3页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117594038A (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10685648B2 (en) | Sensor fusion model to enhance machine conversational awareness | |
Schuller | Speech emotion recognition: Two decades in a nutshell, benchmarks, and ongoing trends | |
US11392970B2 (en) | Administering a digital survey over voice-capable devices | |
CN111462735A (zh) | 语音检测方法、装置、电子设备及存储介质 | |
CN109947984A (zh) | 一种针对儿童的内容推送方法及推送装置 | |
Shin et al. | More efficient processes for creating automated essay scoring frameworks: A demonstration of two algorithms | |
US20210034981A1 (en) | Method and apparatus for training image caption model, and storage medium | |
US20180260825A1 (en) | Automated feedback determination from attendees for events | |
CN112612898B (zh) | 文本分类的方法和装置 | |
CN107085717A (zh) | 一种家庭监控方法、服务端及计算机可读存储介质 | |
Xing et al. | Multi-modality hierarchical recall based on gbdts for bipolar disorder classification | |
Zhang | Voice keyword retrieval method using attention mechanism and multimodal information fusion | |
Xiang et al. | Spam detection in reviews using LSTM-based multi-entity temporal features | |
US20230048149A1 (en) | Audio Analysis for Text Generation | |
Gonzalez Villasanti et al. | Automatized analysis of children’s exposure to child-directed speech in reschool settings: Validation and application | |
CN116563829A (zh) | 一种驾驶员情绪识别方法、装置、电子设备和存储介质 | |
Vitevitch et al. | The influence of known-word frequency on the acquisition of new neighbours in adults: Evidence for exemplar representations in word learning | |
Tsai et al. | Sentiment analysis of pets using deep learning technologies in artificial intelligence of things system | |
CN113326868B (zh) | 一种用于多模态情感分类的决策层融合方法 | |
WO2024093578A1 (zh) | 语音识别方法、装置、电子设备、存储介质及计算机程序产品 | |
Das | A multimodal approach to sarcasm detection on social media | |
CN111966839B (zh) | 数据处理方法、装置、电子设备及计算机存储介质 | |
WO2021159756A1 (zh) | 基于多模态的响应义务检测方法、系统及装置 | |
Jones | Accuracy and variability in early spontaneous word production: The effects of age, frequency and neighbourhood density | |
CN117594038B (zh) | 语音服务改进方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |