CN111695360A - 语义分析方法、装置、电子设备及存储介质 - Google Patents
语义分析方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111695360A CN111695360A CN202010544163.1A CN202010544163A CN111695360A CN 111695360 A CN111695360 A CN 111695360A CN 202010544163 A CN202010544163 A CN 202010544163A CN 111695360 A CN111695360 A CN 111695360A
- Authority
- CN
- China
- Prior art keywords
- complaint
- voice
- label
- text
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 71
- 230000004044 response Effects 0.000 claims abstract description 89
- 230000000007 visual effect Effects 0.000 claims abstract description 82
- 238000000034 method Methods 0.000 claims abstract description 62
- 230000006854 communication Effects 0.000 claims abstract description 13
- 230000001186 cumulative effect Effects 0.000 claims description 26
- 230000008451 emotion Effects 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 23
- 230000037007 arousal Effects 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 9
- 230000008909 emotion recognition Effects 0.000 claims description 8
- 230000002996 emotional effect Effects 0.000 claims description 3
- 239000012634 fragment Substances 0.000 claims description 3
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 230000005540 biological transmission Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000012549 training Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000036651 mood Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Acoustics & Sound (AREA)
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请实施例提供了一种语义分析方法、装置、电子设备及存储介质,涉及自然语言处理技术领域。该方法包括:在通话过程中,获取用户输入的投诉语音;获取所述投诉语音对应的投诉文本;获取所述投诉文本对应的投诉标签;基于指定时间段内获取的投诉标签,建立可视化图表,所述可视化图表用于呈现所述指定时间段内获取的投诉标签的分布信息;显示所述可视化图表。本申请实施例通过将语音通话识别成文本,并对文本进行语义识别,确定文本对应的语义标签,并基于指定时间段内获取的投诉标签的分布信息,建立可视化图表并呈现,从而形成准确的分析报表,让运营分析更加有效,成本更低,并可提高投诉语音的应答效率,提升客服体验。
Description
技术领域
本申请涉及自然语言处理技术领域,更具体地,涉及一种语义分析方法、装置、电子设备及存储介质。
背景技术
随着人工智能的发展,客户服务领域也逐渐引入人工智能来提升客户服务体验,其中,处理客户投诉是客户服务中最重要的事项之一。但是,目前在对投诉对话进行识别时,用户的投诉语言可能与预设的标签无法完全对应,导致无法正确识别到用户的投诉原因,进而也使得对客户投诉的处理效率较低。
发明内容
本申请实施例提出了一种语义分析方法、装置、电子设备及存储介质,能够解决上述问题。
第一方面,本申请实施例提供了一种语义分析方法,应用于终端,所述方法包括:在通话过程中,获取用户输入的投诉语音;获取所述投诉语音对应的投诉文本;获取所述投诉文本对应的投诉标签;基于指定时间段内获取的投诉标签,建立可视化图表,所述可视化图表用于呈现所述指定时间段内获取的投诉标签的分布信息;显示所述可视化图表。
可选地,所述在通话过程中,获取用户输入的投诉语音,所述获取所述投诉语音对应的投诉文本,包括:在通话过程中,获取用户输入的投诉语音并传输至第一服务器,指示所述第一服务器对所述投诉语音进行语音识别得到所述投诉文本;获取所述第一服务器返回的所述投诉文本。
可选地,所述语义识别模型运行于第二服务器,所述获取所述投诉文本对应的投诉标签,包括:将所述投诉文本传输至所述第二服务器,指示所述第二服务器基于训练好的语义识别模型,对所述投诉文本进行语义识别得到所述投诉文本对应的投诉标签;获取所述第二服务器返回的所述投诉文本对应的投诉标签。
可选地,所述基于指定时间段内获取的投诉标签,建立可视化图表,包括:存储所述投诉标签至数据库;获取在指定时间段内存储于所述数据库的目标投诉标签;基于所述目标投诉标签的分布信息,建立可视化图表。
可选地,所述获取所述投诉文本对应的投诉标签之后,所述方法还包括:确定所述投诉标签对应的目标答复文本;基于所述目标答复文本生成答复语音;输出所述答复语音,以对所述投诉语音进行答复。
可选地,所述数据库存储有历史投诉记录,所述历史投诉记录包括存储的至少一个用户对应的投诉标签以及所述投诉标签对应的答复文本,所述确定所述投诉标签对应的目标答复文本,包括:基于所述历史投诉记录,确定每个用户基于所述投诉标签的投诉次数;将所述投诉次数由低到高的前指定数量个用户作为候选用户;从答复所述候选用户的答复文本中确定所述投诉标签对应的目标答复文本。
可选地,所述获取在指定时间段内存储于所述数据库的目标投诉标签,包括:确定所述投诉语音对应的用户;从所述数据库中查找在所述指定时间段内存储的所述用户对应的投诉标签,作为历史投诉标签,所述投诉标签用于确定所述用户的投诉原因;将所述历史投诉标签与所述投诉语音对应的投诉标签作为目标投诉标签。
可选地,所述获取在指定时间段内存储于所述数据库的目标投诉标签,包括:确定所述投诉语音对应的用户;从所述数据库中查找所述用户本次投诉通话对应的至少一个投诉标签,作为目标投诉标签。
可选地,所述确定所述投诉标签对应的目标答复文本,包括:若所述投诉标签的数量为多个时,根据每个所述投诉标签对所述投诉语音进行分段,得到每个所述投诉标签对应的投诉语音片段;确定每个投诉语音片段对应的答复优先级;按所述答复优先级依次确定多个所述投诉标签对应的目标答复文本,以基于所述目标答复文本的确定顺序依次对所述投诉语音进行答复。
可选地,所述确定每个投诉语音片段对应的答复优先级,包括:对每个所述投诉语音片段进行情绪识别得到对应的情绪参数,所述情绪参数包括唤起度与效价的至少一种;根据所述情绪参数由高至低的排序,确定每个所述投诉语音片段对应的答复优先级。
可选地,所述基于所述目标投诉标签的分布信息,建立可视化图表,包括:确定每个所述目标投诉标签对应的累计数量;根据每个所述目标投诉标签对应的累计数量以及所有目标投诉标签对应的总累计数量,确定每个目标投诉标签的统计参数,所述统计参数包括每个所述目标投诉标签对应的累计数量占所述总累计数量的占比、所述累计数量的变化率中的至少一个;生成所述统计参数对应的可视化图表。
第二方面,本申请实施例提供了一种语义分析系统,所述系统包括:终端和与所述终端连接的服务器;所述终端,用于在通话过程中,获取用户输入的投诉语音并传输至所述服务器;所述服务器,用于接收所述投诉语音,对所述投诉语音进行语音识别得到所述投诉文本,基于训练好的语义识别模型,确定所述投诉文本对应的投诉标签;所述终端,还用于基于指定时间段内获取的投诉标签,建立可视化图表,并显示所述可视化图表,所述可视化图表用于呈现所述指定时间段内获取的投诉标签的分布信息。
可选地,所述服务器包括第一服务器与第二服务器;所述第一服务器,用于接收所述投诉语音,对所述投诉语音进行语音识别得到所述投诉文本,并将所述投诉文本存储至所述第一数据库;所述第二服务器,用于从所述第一数据库中获取投诉文本,基于训练好的语义识别模型,确定所述投诉文本对应的投诉标签,并将所述投诉标签存储至所述第二数据库。
第三方面,本申请实施例提供了一种语义分析装置,应用于终端,该装置包括:语音获取模块,用于在通话过程中,获取用户输入的投诉语音;文本获取模块,用于获取所述投诉语音对应的投诉文本;标签获取模块,用于获取所述投诉文本对应的投诉标签;图表建立模块,用于基于指定时间段内获取的投诉标签,建立可视化图表,所述可视化图表用于呈现所述指定时间段内获取的投诉标签的分布信息;图表显示模块,用于显示所述可视化图表。
可选地,所述语音获取模块以及文本获取模块可包括:语音传输子模块以及文本获取子模块,其中:语音传输子模块,用于在通话过程中,获取用户输入的投诉语音并传输至第一服务器,指示所述第一服务器对所述投诉语音进行语音识别得到所述投诉文本;文本获取子模块,用于获取所述第一服务器返回的所述投诉文本。
可选地,所述语义识别模型运行于第二服务器,标签获取模块可包括:文本传输子模块以及标签获取子模块,其中:文本传输子模块,用于将所述投诉文本传输至所述第二服务器,指示所述第二服务器基于训练好的语义识别模型,对所述投诉文本进行语义识别得到所述投诉文本对应的投诉标签;标签获取子模块,用于获取所述第二服务器返回的所述投诉文本对应的投诉标签。
可选地,图表建立模块可包括:标签存储子模块、标签拉取子模块以及图表建立子模块,其中:标签存储子模块,用于存储所述投诉标签至数据库;标签拉取子模块,用于获取在指定时间段内存储于所述数据库的目标投诉标签;图表建立子模块,用于基于所述目标投诉标签的分布信息,建立可视化图表。
可选地,图表建立子模块可包括:数量确定单元、参数确定单元以及图表生成单元,其中:数量确定单元,用于确定每个所述目标投诉标签对应的累计数量;参数确定单元,用于根据每个所述目标投诉标签对应的累计数量以及所有目标投诉标签对应的总累计数量,确定每个目标投诉标签的统计参数,所述统计参数包括每个所述目标投诉标签对应的累计数量占所述总累计数量的占比、所述累计数量的变化率中的至少一个;图表生成单元,用于生成所述统计参数对应的可视化图表。
可选地,标签拉取子模块可包括:第一用户确定单元、历史标签确定单元以及第一目标确定单元,其中:第一用户确定单元,用于确定所述投诉语音对应的用户;历史标签确定单元,用于从所述数据库中查找在所述指定时间段内存储的所述用户对应的投诉标签,作为历史投诉标签,所述投诉标签用于确定所述用户的投诉原因;第一目标确定单元,用于将所述历史投诉标签与所述投诉语音对应的投诉标签作为目标投诉标签。
可选地,标签拉取子模块可包括:第二用户确定单元以及第二目标确定单元,其中:第二用户确定单元,用于确定所述投诉语音对应的用户;第二目标确定单元,用于从所述数据库中查找所述用户本次投诉通话对应的至少一个投诉标签,作为目标投诉标签。
可选地,所述获取所述投诉文本对应的投诉标签之后,语义分析装置还可包括:答复确定模块、答复生成模块以及答复输出模块,其中:答复确定模块,用于确定所述投诉标签对应的目标答复文本;答复生成模块,用于基于所述目标答复文本生成答复语音;答复输出模块,用于输出所述答复语音,以对所述投诉语音进行答复。
可选地,所述数据库存储有历史投诉记录,所述历史投诉记录包括存储的至少一个用户对应的投诉标签以及所述投诉标签对应的答复文本,答复确定模块可包括:次数确定子模块、候选确定子模块以及答复确定子模块,其中:次数确定子模块,用于基于所述历史投诉记录,确定每个用户基于所述投诉标签的投诉次数;候选确定子模块,用于将所述投诉次数由低到高的前指定数量个用户作为候选用户;答复确定子模块,用于从答复所述候选用户的答复文本中确定所述投诉标签对应的目标答复文本。
可选地,答复确定子模块可包括:语音分段单元、优先级确定单元以及顺序答复单元,其中:语音分段单元,用于若所述投诉标签的数量为多个,根据每个所述投诉标签对所述投诉语音进行分段,得到每个所述投诉标签对应的投诉语音片段;优先级确定单元,用于确定每个投诉语音片段对应的答复优先级;顺序答复单元,用于按所述答复优先级依次确定多个所述投诉标签对应的目标答复文本,以基于所述目标答复文本的确定顺序依次对所述投诉语音进行答复。
可选地,优先级确定单元可包括:情绪识别子单元以及情绪排序子单元,其中:情绪识别子单元,用于对每个所述投诉语音片段进行情绪识别得到对应的情绪参数,所述情绪参数包括唤起度与效价的至少一种;情绪排序子单元,用于根据所述情绪参数由高至低的排序,确定每个所述投诉语音片段对应的答复优先级。
第四方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时所述处理器执行上述第一方面所述的方法。
第五方面,本申请实施例提供了一种计算机可读取存储介质,该计算机可读取存储介质中存储有程序代码,该程序代码可被处理器调用执行如上述第一方面所述的方法。
本申请实施例提供了一种语义分析方法、装置、电子设备及存储介质,应用于终端,通过在通话过程中,获取用户输入的投诉语音,然后对投诉语音进行识别得到投诉语音对应的投诉文本,获取投诉文本对应的投诉标签,接着基于指定时间段内获取的投诉标签,建立可视化图表,其中,可视化图表用于呈现指定时间段内获取的投诉标签的分布信息,最后显示可视化图表。由此,通过将语音通话识别成文本,并对文本进行语义识别,确定文本对应的语义标签,并基于指定时间段内获取的投诉标签的分布信息,建立可视化图表并呈现,从而形成准确的分析报表,让运营分析更加有效,成本更低,并可提高投诉语音的应答效率,提升客服体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例提供的一种语义分析系统的示意图;
图2示出了本申请一个实施例提供的语义分析方法的流程示意图;
图3示出了本申请另一个实施例提供的语义分析方法的流程示意图;
图4示出了本申请又一个实施例提供的语义分析方法的流程示意图;
图5示出了本申请再一个实施例提供的语义分析方法的流程示意图;
图6示出了本申请一个示例性实施例提供的图5中步骤S460的流程示意图;
图7示出了本申请还一个实施例提供的语义分析方法的流程示意图;
图8示出了本申请又另一个实施例提供的语义分析方法的流程示意图;
图9示出了本申请再另一个实施例提供的语义分析方法的流程示意图;
图10示出了本申请再又一个实施例提供的语义分析方法的流程示意图;
图11示出了本申请再还一个实施例提供的语义分析方法的流程示意图;
图12示出了本申请一个示例性实施例提供的图11中步骤S950的流程示意图;
图13示出了本申请实施例提供的语义分析装置的结构框图;
图14示出了本申请实施例的用于执行根据本申请实施例的语义分析方法的电子设备的结构框图。
图15示出了本申请实施例的用于保存或者携带实现根据本申请实施例的语义分析方法的程序代码的存储单元。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
投诉对话中通常蕴含大量有价值的信息,如果可以从投诉对话中准确识别出用户的投诉原因,则可以提供更准确针对性的解决方案解决用户的投诉问题。但是目前市面上往往通过使用关键词识别技术来标签化关键信息,例如投诉对话“我无法上网”中的关键词为“无法上网”,那么就认为这个用户投诉的问题是无法上网,即对应标签为“无法上网”。
但是,仅利用关键词识别来从用户的投诉对话中识别出投诉原因,往往存在无法正确识别的问题,例如,从“我没办法上网”、“我应用程序登陆不了”这两句投诉对话中未包含关键词“无法上网”,所以如果仅利用关键词识别,则无法从前述两句投诉对话中识别出用户的投诉原因为无法上网。
另外,构建关键词往往需要通过穷举的方式来预存大量关键词,这需要耗费大量的人力投入,效率较低。
基于上述问题,发明人通过长期研究,提出了本申请实施例中的语义分析方法、装置、电子设备及存储介质,能够提高对用户语音中用户投诉原因的识别准确率和效率。
为便于更好的理解本申请实施例提供的语义分析方法、装置、电子设备及存储介质,下面先对适用于本申请实施例的应用环境进行描述。
请参阅图1,图1示出了本申请实施例提供的一种语义分析系统的示意图。本申请实施例提供的语义分析方法可以应用于如图1所示的语义分析系统10。语义分析系统10包括终端100以及服务器200。
其中,终端100可以是智能音箱、智能手机、平板电脑、膝上型便携计算机、台式计算机、可穿戴式电子设备或其他部署了语义分析装置的电子设备,在此不作限定。
在一些实施例中,终端100可以是实体机器人,也可以是虚拟机器人,用于提供电话语音服务,即终端100可用于与用户进行语音通话。
服务器200与终端100之间通过无线或者有线网络连接,以基于该网络连接实现终端100与服务器200之间的数据传输,传输的数据包括但不限于语音、文本、标签等各种形式的数据。
其中,服务器200可以是传统服务器,也可以是云端服务器,可以是一台服务器,也可以是由多台服务器构成的服务器集群,甚至是多台服务器构成的服务器中心。服务器200可用于为用户提供后台服务。
在一些实施方式中,语义分析装置也可以设置于终端100上,使得终端100无需依赖与服务器200建立通信即可实现与用户的交互,实现基于知识图谱的应答,此时交互系统10可以只包括终端100。
上述的应用环境仅为方便理解所作的示例,可以理解的是,本申请实施例不仅局限于上述应用环境。
下面将通过具体实施例对本申请实施例提供的语义分析方法、装置、电子设备及存储介质进行详细说明。
请参阅图2,图2示出了本申请一个实施例提供的语义分析方法的流程示意图,可应用于上述终端,下面将针对图2所示的流程进行详细的阐述。上述的语义分析方法具体地可以包括以下步骤:
步骤S110:在通话过程中,获取用户输入的投诉语音。
用户通过用户终端拨打热线电话投诉时,应答的客服的终端可在通话过程中,获取用户输入的投诉语音。其中,投诉语音为用户投诉时所输入的语音,例如,可以是用户拨打投诉热线电话时输入的语音,也可以是包含投诉关键词的语音等,在此不作限定。可以理解的是,投诉语音包含用户的投诉原因或者说投诉理由,比如无法上网、服务态度差等,本实施例对此不作限定。
在一些实施方式中,用户可基于用户终端输入投诉语音,该投诉语音传递至客服的终端,则终端可获取用户输入的投诉语音。
在另一些实施方式中,用户可基于用户终端输入投诉语音,并上传服务器,则客服的终端可从服务器获取用户输入的投诉语音。
步骤S120:获取投诉语音对应的投诉文本。
获取投诉语音后可对投诉语音进行语音识别,得到对应的投诉文本。其中,语音识别可基于语音识别(Automatic Speech Recognition,ASR)模型实现。
在一些实施方式中,语音识别模型可运行于终端,则无需网络也可本地实现对投诉语音的语音识别,获得对应的投诉文本。
在另一些实施方式中,语音识别模型也可运行于服务器,则终端可将获取的投诉语音传输至服务器,以得到服务器返回的投诉文本,由此,可不占用终端的存储空间,也降低对终端运算资源的消耗。具体实施方式可见后述实施例,在此不作赘述。
步骤S130:获取投诉文本对应的投诉标签。
终端获取投诉语音对应的投诉文本后,可获取投诉文本对应的投诉标签。其中,可基于语义识别模型根据投诉文本获取对应的投诉标签。
在一些实施方式中,语义识别模型可运行于终端,则无需网络也可本地实现对投诉语音的语义识别,获取投诉文本对应的投诉标签。
在另一些实施方式中,语义识别模型也可运行于服务器,则终端可将获取的投诉文本传输至服务器,以得到服务器返回的投诉标签,由此,可不占用终端的存储空间,也降低对终端运算资源的消耗。具体实施方式可见后述实施例,在此不作赘述。
步骤S140:基于指定时间段内获取的投诉标签,建立可视化图表。
其中,指定时间段可根据实际需要确定,也可以是程序预设,还可以是如客服人员、运营人员等相关人员自定义的,在此不作限定。例如,指定时间段可以是1min、10min、1天、1个月、1年等,本实施例对此不作限定。
终端可基于指定时间段内获取的投诉标签,建立可视化图表,其中,可视化图表可用于呈现指定时间段内获取的投诉标签的分布信息。例如,指定时间段是1个月,则可根据1个月内获取的投诉标签,来建立可视化图表。
另外,在一些实施方式中,基于指定时间段内多个用户的投诉标签,来建立指定时间段内多个用户的投诉标签所对应的可视化图表,则该可视化图表可反映指定时间段内整体的问题,从而可帮助运营人员进行监控和对产品进行针对性优化。其中,产品可以是系统、硬件、应用程序等,在此不作限定。由于运营人员在维护该产品时,往往需要根据用户的反馈来对产品进行监控和针对性优化,则本申请实施例通过建立可视化图表,可方便运营人员进行监控和针对性优化,提高对投诉的处理效率和准确率,并有利于产品优化的规划。
步骤S150:显示可视化图表。
建立可视化图表后,可显示该可视化图表,以呈现该可视化图表,供相关人员分析、监控和针对性优化。在一些实施方式中,可视化图表可在终端上显示,也可由终端发送至其他电子设备,由其他电子设备进行显示,或者由终端与其他电子设备一同显示。
另外,在一些实施例中,随着所获取的投诉标签的变化,可视化图表也可实时更新并显示,以便相关人员进行及时的监控。
本实施例提供的语义分析方法,通过在通话过程中,获取用户输入的投诉语音,然后对投诉语音进行识别得到投诉语音对应的投诉文本,获取投诉文本对应的投诉标签,接着基于指定时间段内获取的投诉标签,建立可视化图表,其中,可视化图表用于呈现指定时间段内获取的投诉标签的分布信息,最后显示可视化图表。由此,通过将语音通话识别成文本,并对文本进行语义识别,确定文本对应的语义标签,并基于指定时间段内获取的投诉标签的分布信息,建立可视化图表并呈现,从而形成准确的分析报表,让运营分析更加有效,成本更低,并可提高投诉语音的应答效率,提升客服体验。
在一些实施例中,对投诉语音的识别可以通过第一服务器实现,即终端获取用户输入的投诉语音后,可将其传输至第一服务器,由第一服务器识别投诉语音得到对应的投诉文本,并返回给终端。具体地,请参阅图3,图3示出了本申请另一个实施例提供的语义分析方法的流程示意图,于本实施例中,该方法可包括:
步骤S210:在通话过程中,获取用户输入的投诉语音并传输至第一服务器,指示第一服务器对投诉语音进行语音识别得到投诉文本。
在一些实施方式中,第一服务器可运行语音识别模型,则根据终端传输的投诉语音,可通过语音识别模型识别出对应的投诉文本。则在通话过程中,终端可获取用户输入的投诉语音,并传输至第一服务器,指示第一服务器对投诉语音进行语音识别得到投诉文本。
步骤S220:获取第一服务器返回的投诉文本。
第一服务器基于语音识别模型对投诉语音进行语音识别得到对应的投诉文本后,可将该投诉文本返回至终端,则终端可获取第一服务器返回的投诉文本。
步骤S230:获取投诉文本对应的投诉标签。
步骤S240:基于指定时间段内获取的投诉标签,建立可视化图表。
步骤S250:显示可视化图表。
需要说明的是,本实施例中未详细描述的部分可以参考前述实施例,在此不再赘述。
由此,通过本实施例提供的语义分析方法,可基于第一服务器对投诉语音进行识别得到对应的投诉文本,从而无需将语音识别模型部署于终端,降低对运算资源和存储空间的消耗。
在一些实施例中,语义识别模型可以运行于第二服务器,具体地,请参阅图4,图4示出了本申请又一个实施例提供的语义分析方法的流程示意图,于本实施例中,该方法可包括:
步骤S310:在通话过程中,获取用户输入的投诉语音。
步骤S320:获取投诉语音对应的投诉文本。
于本实施例中,步骤S310至步骤S320的具体描述可参考前述实施例对步骤S110至步骤S120的描述或对步骤S210至步骤S220的描述。
步骤S330:将投诉文本传输至第二服务器,指示第二服务器基于训练好的语义识别模型,对投诉文本进行语义识别得到投诉文本对应的投诉标签。
于本实施例中,语义识别模型运行于第二服务器,则终端获取投诉语音对应的投诉文本后,可将投诉文本传输至第二服务器,指示第二服务器基于训练好的语义识别模型,对投诉文本进行语义识别得到投诉文本对应的投诉标签。其中,语义识别模型可经过预先训练得到。
在一些实施方式中,可先获取训练样本集,训练样本集可包括各种语料,并每种语料对应标注有其语义标签。其中,语义标签是语料对应语义类别,可实现定义好,例如,语义标签可包括“无法上网”、“网速慢”、“服务态度差”等,在此不做限定。其中,语料可以是对话中的语句,可经由相关人员对各种语料标注对应的语义标签。例如,语料“我这网好卡啊”、“我的视频应用老是提示加载中”的语义表征网速慢,则可对语料“我这网好卡啊”、“我的视频应用老是提示加载中”标注语义标签“网速慢”;再如,语料“你态度怎么这样”、“你能不能客气点”的语义表征服务态度差,则可对语料“你态度怎么这样”、“你能不能客气点”标注语义标签“服务态度差”。
获取训练样本集后,则可基于训练样本集训练初始的语义识别模型,如将各种语料作为输入,并将各种语料对应的语义标签作为期望输出,训练初始的语义识别模型,并根据实际输出与期望输出的损失函数调整语义识别模型的参数,直至损失函数满足收敛条件,则可停止训练,得到训练好的语义识别模型。其中,损失函数可根据实际需要确定,也可由程序预设,还可以是自定义,本实施例对此不作限定。由此,训练好的语义识别模型可根据输入的语料输出对应的语义标签,即可根据投诉文本可得到对应的投诉标签。例如,对投诉文本“我的应用用不了”,通过训练好的语义识别模型可得到对应的投诉标签是“无法上网”,即可确定用户的投诉原因是无法上网或者说没有网络。
在一些实施方式中,语义识别模型输出的投诉标签,可以是众多语义标签中“置信度”最高的语义标签,置信度越高,可认为结果越可信,即此投诉文本的语义属于该投诉标签的“概率”越大。其中,置信度是一个0-0.999的数值,可根据实际需要确定,在此不作限定。
步骤S340:获取第二服务器返回的投诉文本对应的投诉标签。
第二服务器基于语义识别模型对投诉文本进行语义识别得到投诉文本对应的投诉标签后,可将该投诉标签返回至终端,则终端可获取第二服务器返回的投诉标签。
步骤S350:基于指定时间段内获取的投诉标签,建立可视化图表。
步骤S360:显示可视化图表。
需要说明的是,本实施例中未详细描述的部分可以参考前述实施例,在此不再赘述。
由此,通过本实施例提供的语义分析方法,可基于第二识别模型对投诉文本进行语义识别,得到对应的投诉标签,即可得到用户投诉的原因。则无需在终端部署语义识别模型,进一步降低对终端的运算资源和存储空间的耗费,提升终端运行效率。并且通过对投诉文本进行语义识别来得到对应的投诉标签,可无需通过穷举关键词的方式收集投诉标签,避免耗费大量人力,从而提升投诉原因识别的效率。
在一些实施例中,可以将获取的投诉标签存储至数据库,以从数据库可获取多个投诉标签来生成可视化图表。具体地,请参阅图5,图5示出了本申请再一个实施例提供的语义分析方法的流程示意图,于本实施例中,该方法可包括:
步骤S410:在通话过程中,获取用户输入的投诉语音。
步骤S420:获取投诉语音对应的投诉文本。
步骤S430:获取投诉文本对应的投诉标签。
步骤S440:存储投诉标签至数据库。
终端每次获取投诉文本对应的投诉标签后,可存储投诉标签至数据库,则数据库可存储有多个投诉标签。
步骤S450:获取在指定时间段内存储于数据库的目标投诉标签。
步骤S460:基于目标投诉标签的分布信息,建立可视化图表。
终端可获取在指定时间段内存储于数据库的投诉标签作为目标投诉标签,并基于目标投诉标签的分布信息,建立可视化图表。则终端可从数据库拉取指定时间段内存储的投诉标签,并基于目标投诉标签的分布信息建立可视化图表。
在一些实施例中,可以通过对指定时间段内获取的目标投诉标签进行统计分析,从而可根据目标投诉标签的分布信息,来生成可视化图表。具体地,请参阅图6,图6示出了本申请一个示例性实施例提供的图5中步骤S460的流程示意图,于本实施例中,步骤S460可包括:
步骤S461:确定每个目标投诉标签对应的累计数量。
步骤S462:根据每个目标投诉标签对应的累计数量以及所有目标投诉标签对应的总累计数量,确定每个目标投诉标签的统计参数。
步骤S463:生成统计参数对应的可视化图表。
终端获取在指定时间段内存储于数据库的目标投诉标签后,可以根据每个目标投诉标签对应的累计数量以及所有目标投诉标签对应的总累计数量,确定每个目标投诉标签的统计参数,并生成统计参数对应的可视化图表。其中,统计参数包括每个目标投诉标签对应的累计数量占总累计数量的占比、累计数量的变化率中的至少一个,由此可得到指定时间段内每个目标投诉标签的投诉率、增长或衰减变化率等统计参数。
在一些实施方式中,若统计参数可包括每个目标投诉标签对应的累计数量占总累计数量的占比,则可根据各目标投诉标签的占比来生成对应的饼图,从而直观呈现各目标投诉标签的占比。若统计参数可包括每个目标投诉标签对应的累计数量的变化率,则可生成对应的折线图,以直观呈现变化率,当然还可生成条形图等,在此不做限定,前述仅为示例性说明,并不对本实施例构成限定。
当然,同一统计参数还可通过不同的图表呈现方式来生成不同的可视化图表,本实施例对此不做限定。
步骤S470:显示可视化图表。
需要说明的是,本实施例中未详细描述的部分可以参考前述实施例,在此不再赘述。
在一些实施例中,可以结合用户的本次的投诉标签和历史投诉标签来生成可视化图表,对该用户本人的历史投诉进行分析,以便直观地呈现用户历史投诉原因以及哪些问题是用户关注、有解决还是未解决等,从而有利于提高对用户投诉的应答效率和质量,进而提高对用户的客户服务质量,并有利于提高对用户投诉原因的识别准确性和效率。具体地,请参阅图7,图7示出了本申请还一个实施例提供的语义分析方法的流程示意图,于本实施例中,该方法可包括:
步骤S510:在通话过程中,获取用户输入的投诉语音。
步骤S520:获取投诉语音对应的投诉文本。
步骤S530:获取投诉文本对应的投诉标签。
步骤S540:存储投诉标签至数据库。
步骤S550:确定投诉语音对应的用户。
步骤S560:从数据库中查找在指定时间段内存储的用户对应的投诉标签,作为历史投诉标签。
步骤S570:将历史投诉标签与投诉语音对应的投诉标签作为目标投诉标签。
在一些实施方式中,可对用户的历史投诉进行分析,则具体地,可确定投诉语音对应的用户,然后从数据库中查找在指定时间段内存储的用户对应的投诉标签,作为历史投诉标签,并将历史投诉标签与投诉语音对应的投诉标签作为目标投诉标签,以基于目标投诉标签对应的分布信息,建立可视化图表。其中,投诉标签用于确定用户的投诉原因,则可获取用户在指定时间段内的历史投诉原因,来建立可视化图表。从而可对该用户本人的历史投诉进行分析,以便直观地呈现用户历史投诉原因以及哪些问题是用户关注、有解决还是未解决等,从而有利于通过对历史投诉原因的分析来指导应答,提高对用户投诉的应答效率和质量,进而提高对用户的客户服务质量,并有利于提高对用户投诉原因的识别准确性和效率。
步骤S580:基于目标投诉标签的分布信息,建立可视化图表。
步骤S590:显示可视化图表。
需要说明的是,本实施例中未详细描述的部分可以参考前述实施例,在此不再赘述。
在一些实施例中,用户本次投诉可能出于多个原因,则可对用户本次投诉通话对应的投诉标签来生成可视化图表,以便直观地观察到哪些问题是急需解决的,有利于提高对用户投诉的应答效率和质量。具体地,请参阅图8,图8示出了本申请又另一个实施例提供的语义分析方法的流程示意图,于本实施例中,该方法可包括:
步骤S610:在通话过程中,获取用户输入的投诉语音。
步骤S620:获取投诉语音对应的投诉文本。
步骤S630:获取投诉文本对应的投诉标签。
步骤S640:存储投诉标签至数据库。
步骤S650:确定投诉语音对应的用户。
步骤S660:从数据库中查找用户本次投诉通话对应的至少一个投诉标签,作为目标投诉标签。
在一些实施方式中,用户本次投诉可能出于多个原因,则可对用户本次投诉通话的投诉原因进行分析,则具体地,可确定投诉语音对应的用户,然后从数据库中查找用户本次投诉通话对应的至少一个投诉标签,作为目标投诉标签,以基于目标投诉标签对应的分布信息,建立可视化图表,由此,则可通过可视化图表直观呈现用户在本次投诉通话的投诉原因,来建立可视化图表,以便分析和应答,如直观地观察到哪些问题是急需解决的,并据此进行应答,从而有利于提高对用户投诉的应答效率和质量。
步骤S670:基于目标投诉标签的分布信息,建立可视化图表。
步骤S680:显示可视化图表。
需要说明的是,本实施例中未详细描述的部分可以参考前述实施例,在此不再赘述。
在一些实施例中,获取投诉文本对应的投诉标签之后,还可根据投诉标签确定答复文本,并生成语音进行答复,从而可以针对性地对用户的投诉原因进行答复,以提高客诉问题的处理效率。具体地,请参阅图9,图9示出了本申请再另一个实施例提供的语义分析方法的流程示意图,于本实施例中,该方法可包括:
步骤S710:在通话过程中,获取用户输入的投诉语音。
步骤S720:获取投诉语音对应的投诉文本。
步骤S730:获取投诉文本对应的投诉标签。
步骤S740:确定投诉标签对应的目标答复文本。
步骤S750:基于目标答复文本生成答复语音。
步骤S760:输出答复语音,以对投诉语音进行答复。
在一些实施方式中,获取投诉文本对应的投诉标签之后,还可根据投诉标签确定投诉标签对应的目标答复文本,并基于目标答复文本生成答复语音,输出答复语音,以对投诉语音进行答复。由此,若客服人员由机器人担任,即若由机器人来对接听用户的投诉电话,则可在识别出用户输入的投诉语音对应的投诉标签后,可得到对应的目标答复文本,通过语音合成得到目标答复文本对应的答复语音,并输出答复语音,以自动对投诉语音进行答复,从而可自动针对性地对用户的投诉原因进行答复,提高客诉问题的处理效率,并且基于前述的语义识别模型,可在无需穷举关键词的情况下,无需耗费大量人力的情况下提高对用户投诉原因的识别准确性。
需要说明的是,本实施例中未详细描述的部分可以参考前述实施例,在此不再赘述。
在一些实施例中,数据库可存储有历史投诉记录,其中,历史投诉记录包括存储的至少一个用户对应的投诉标签以及投诉标签对应的答复文本,为了提高投诉解决效果和答复效果,可以将用户没有就相同原因再投诉或者反复投诉的答复来作为本次的答复,降低用户就相同原因反复多次投诉的概率,从而提高应答效率和质量。具体地,请参阅图10,图10示出了本申请再又一个实施例提供的语义分析方法的流程示意图,于本实施例中,该方法可包括:
步骤S810:在通话过程中,获取用户输入的投诉语音。
步骤S820:获取投诉语音对应的投诉文本。
步骤S830:获取投诉文本对应的投诉标签。
步骤S840:存储投诉标签至数据库。
其中,数据库可存储有历史投诉记录,其中,历史投诉记录包括存储的至少一个用户对应的投诉标签以及投诉标签对应的答复文本。
步骤S850:基于历史投诉记录,确定每个用户基于投诉标签的投诉次数。
步骤S860:将投诉次数由低到高的前指定数量个用户作为候选用户。
步骤S870:从答复候选用户的答复文本中确定投诉标签对应的目标答复文本。
在一些实施方式中,可从数据库中获取历史投诉记录,并确定每个用户针对同一投诉标签的投诉次数,则可以理解的是,投诉次数越高的用户,说明该投诉标签对应投诉原因越没有得到很好的解决,比如针对投诉标签“无法上网”,投诉次数由高到低的用户依次为用户A、用户B、用户C,则可认为用户C无法上网的问题相对来说得到了更好的解决,所以没有反复再来就相同的原因无法上网来投诉,而相对的,用户A无法上网的问题没有得到较好的解决,所以反复多次地就相同的原因来投诉,因此答复用户C无法上网的答复文本可能相对于答复用户A、用户B的答复文本能够更好的解决无法上网的问题。
因此,通过将投诉次数由低到高的前指定数量个用户作为候选用户,并从答复候选用户的答复文本中确定投诉标签对应的目标答复文本,可降低用户就相同原因投诉的次数,提高应答质量和效率,提升用户体验。其中,指定数量可根据实际需要确定,也可程序预设,还可以是用户自定义,在此不作限定。
在一些示例中,若存在投诉次数仅为1次的候选用户,则可以将用户没有就相同原因再投诉的答复文本来作为本次的目标答复文本进行答复,从而提高投诉解决效果和答复效果。
步骤S880:基于目标答复文本生成答复语音。
步骤S890:输出答复语音,以对投诉语音进行答复。
需要说明的是,本实施例中未详细描述的部分可以参考前述实施例,在此不再赘述。
在一些实施例中,本次投诉通话中可能对应有多个投诉标签,即有多个投诉原因,则还可确定多个投诉标签的答复优先级,再依次多个投诉标签对应的答复文本,并生成语音进行答复,从而可以根据答复优先级来依次解决用户的投诉,以提高客诉问题的处理效率和应答质量。具体地,请参阅图11,图11示出了本申请再还一个实施例提供的语义分析方法的流程示意图,于本实施例中,该方法可包括:
步骤S910:在通话过程中,获取用户输入的投诉语音。
步骤S920:获取投诉语音对应的投诉文本。
步骤S930:获取投诉文本对应的投诉标签。
步骤S940:若投诉标签的数量为多个,根据每个投诉标签对投诉语音进行分段,得到每个投诉标签对应的投诉语音片段。
若投诉标签的数量为多个,则可根据每个投诉标签对投诉语音进行分段,得到每个投诉标签对应的投诉语音片段。
步骤S950:确定每个投诉语音片段对应的答复优先级。
在一些实施例中,可通过对投诉语音的情绪识别,来确定每个投诉语音片段对应的答复优先级。具体地,请参阅图12,图12示出了本申请一个示例性实施例提供的图11中步骤S950的流程示意图,其中,步骤S950可包括:
步骤S951:对每个投诉语音片段进行情绪识别得到对应的情绪参数。
其中,情绪参数包括效价(Valence)与唤起度(Arousal)的至少一种,则可确定情绪是正性的还是负性的,以及当前情绪的程度有多深。
步骤S952:根据情绪参数由高至低的排序,确定每个投诉语音片段对应的答复优先级。
作为一种实施方式,情绪参数仅包括唤起度,则可根据唤起度由高至低的排序,确定每个投诉语音片段对应的答复优先级,从而可优先对用户情绪最激动的投诉语音片段所对应的投诉标签进行答复,提升应答质量。
作为另一种实施方式,情绪参数仅包括效价,则可将负性的效价设置的高于正性的效价,则可使得效价为负性的投诉语音片段的答复优先级高于效价为正性的投诉语音片段,从而可优先对情绪较负面的投诉语音片段对应的投诉标签进行答复,提升应答质量。
作为又一种实施方式,情绪参数可包括效价与唤起度,则可根据效价的正/负性、唤起度的高低来确定答复优先级,使得效价为负性的答复优先级高于效价为正性的,且同一效价下唤起度越高的答复优先级越高,从而可在使得短时间内更快安抚用户情绪,提升应答的效率和质量。
在一些实施方式中,还可使得效价为负性的投诉语音片段中唤起度越高的答复优先级越高,将效价为正性的投诉语音片段中唤起度越低的答复优先级越高。从而优先应答负面情绪,尤其是负面情绪越激动的答复优先级越高,而正面情绪越激动的答复优先级越低,从而可在使得短时间内更快安抚用户情绪,提升应答的效率和质量。
步骤S960:按答复优先级依次确定多个投诉标签对应的目标答复文本,以基于目标答复文本的确定顺序依次对投诉语音进行答复。
终端在确定答复优先级后,可按答复优先级依次确定多个投诉标签对应的目标答复文本,以基于目标答复文本的确定顺序依次对投诉语音进行答复,从而合理安排应答顺序,使得用户情绪最激动,越迫切解决的问题能够最快得到回复,则可尽快安抚用户情绪,提升应答质量和效率。
步骤S970:基于目标答复文本生成答复语音。
步骤S980:输出答复语音,以对投诉语音进行答复。
需要说明的是,本实施例中未详细描述的部分可以参考前述实施例,在此不再赘述。
本申请实施例还提供一种语义分析系统,该语义分析系统包括:终端和与该终端连接的服务器。
其中,终端可用于在通话过程中,获取用户输入的投诉语音并传输至该服务器。
其中,服务器可用于接收该投诉语音,对该投诉语音进行语音识别得到该投诉文本,基于训练好的语义识别模型,确定该投诉文本对应的投诉标签。
终端,还可用于基于指定时间段内获取的投诉标签,建立可视化图表,并显示该可视化图表,该可视化图表用于呈现该指定时间段内获取的投诉标签的分布信息。
在一些实施例中,服务器可包括第一服务器与第二服务器。
其中,第一服务器可用于接收该投诉语音,对该投诉语音进行语音识别得到该投诉文本,并将该投诉文本存储至该第一数据库。
其中,第二服务器可用于从该第一数据库中获取投诉文本,基于训练好的语义识别模型,确定该投诉文本对应的投诉标签,并将该投诉标签存储至该第二数据库。
本申请实施例提供的语义分析系统用于实现前述方法实施例中相应的语义分析方法,并具有相应的方法实施例的有益效果,在此不再赘述。
请参阅图13,图13示出了本申请实施例提供的语义分析装置1300的结构框图。下面将针对图13所示的框图进行阐述,该语义分析装置1300包括:语音获取模块1310、文本获取模块1320、标签获取模块1330、图表建立模块1340以及图表显示模块1350,其中:
语音获取模块1310,用于在通话过程中,获取用户输入的投诉语音;
文本获取模块1320,用于获取所述投诉语音对应的投诉文本;
标签获取模块1330,用于获取所述投诉文本对应的投诉标签;
图表建立模块1340,用于基于指定时间段内获取的投诉标签,建立可视化图表,所述可视化图表用于呈现所述指定时间段内获取的投诉标签的分布信息;
图表显示模块1350,用于显示所述可视化图表。
进一步地,所述语音获取模块1310以及文本获取模块1320可包括:语音传输子模块以及文本获取子模块,其中:
语音传输子模块,用于在通话过程中,获取用户输入的投诉语音并传输至第一服务器,指示所述第一服务器对所述投诉语音进行语音识别得到所述投诉文本;
文本获取子模块,用于获取所述第一服务器返回的所述投诉文本。
进一步地,所述语义识别模型运行于第二服务器,标签获取模块1330可包括:文本传输子模块以及标签获取子模块,其中:
文本传输子模块,用于将所述投诉文本传输至所述第二服务器,指示所述第二服务器基于训练好的语义识别模型,对所述投诉文本进行语义识别得到所述投诉文本对应的投诉标签;
标签获取子模块,用于获取所述第二服务器返回的所述投诉文本对应的投诉标签。
进一步地,图表建立模块1340可包括:标签存储子模块、标签拉取子模块以及图表建立子模块,其中:
标签存储子模块,用于存储所述投诉标签至数据库;
标签拉取子模块,用于获取在指定时间段内存储于所述数据库的目标投诉标签;
图表建立子模块,用于基于所述目标投诉标签的分布信息,建立可视化图表。
进一步地,图表建立子模块可包括:数量确定单元、参数确定单元以及图表生成单元,其中:
数量确定单元,用于确定每个所述目标投诉标签对应的累计数量;
参数确定单元,用于根据每个所述目标投诉标签对应的累计数量以及所有目标投诉标签对应的总累计数量,确定每个目标投诉标签的统计参数,所述统计参数包括每个所述目标投诉标签对应的累计数量占所述总累计数量的占比、所述累计数量的变化率中的至少一个;
图表生成单元,用于生成所述统计参数对应的可视化图表。
进一步地,标签拉取子模块可包括:第一用户确定单元、历史标签确定单元以及第一目标确定单元,其中:
第一用户确定单元,用于确定所述投诉语音对应的用户;
历史标签确定单元,用于从所述数据库中查找在所述指定时间段内存储的所述用户对应的投诉标签,作为历史投诉标签,所述投诉标签用于确定所述用户的投诉原因;
第一目标确定单元,用于将所述历史投诉标签与所述投诉语音对应的投诉标签作为目标投诉标签。
进一步地,标签拉取子模块可包括:第二用户确定单元以及第二目标确定单元,其中:
第二用户确定单元,用于确定所述投诉语音对应的用户;
第二目标确定单元,用于从所述数据库中查找所述用户本次投诉通话对应的至少一个投诉标签,作为目标投诉标签。
进一步地,所述获取所述投诉文本对应的投诉标签之后,语义分析装置1300还可包括:答复确定模块、答复生成模块以及答复输出模块,其中:
答复确定模块,用于确定所述投诉标签对应的目标答复文本;
答复生成模块,用于基于所述目标答复文本生成答复语音;
答复输出模块,用于输出所述答复语音,以对所述投诉语音进行答复。
进一步地,所述数据库存储有历史投诉记录,所述历史投诉记录包括存储的至少一个用户对应的投诉标签以及所述投诉标签对应的答复文本,答复确定模块可包括:次数确定子模块、候选确定子模块以及答复确定子模块,其中:
次数确定子模块,用于基于所述历史投诉记录,确定每个用户基于所述投诉标签的投诉次数;
候选确定子模块,用于将所述投诉次数由低到高的前指定数量个用户作为候选用户;
答复确定子模块,用于从答复所述候选用户的答复文本中确定所述投诉标签对应的目标答复文本。
进一步地,答复确定子模块可包括:语音分段单元、优先级确定单元以及顺序答复单元,其中:
语音分段单元,用于若所述投诉标签的数量为多个,根据每个所述投诉标签对所述投诉语音进行分段,得到每个所述投诉标签对应的投诉语音片段;
优先级确定单元,用于确定每个投诉语音片段对应的答复优先级;
顺序答复单元,用于按所述答复优先级依次确定多个所述投诉标签对应的目标答复文本,以基于所述目标答复文本的确定顺序依次对所述投诉语音进行答复。
进一步地,优先级确定单元可包括:情绪识别子单元以及情绪排序子单元,其中:
情绪识别子单元,用于对每个所述投诉语音片段进行情绪识别得到对应的情绪参数,所述情绪参数包括唤起度与效价的至少一种;
情绪排序子单元,用于根据所述情绪参数由高至低的排序,确定每个所述投诉语音片段对应的答复优先级。
本申请实施例提供的语义分析装置用于实现前述方法实施例中相应的语义分析方法,并具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的技术人员可以清楚地了解到,本申请实施例提供的语义分析装置能够实现前述方法实施例中的各个过程,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参阅前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,所显示或讨论的模块相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
请参考图14,其示出了本申请实施例提供的一种电子设备的结构框图。该电子设备1400可以是智能手机、平板电脑、电子书等能够运行应用程序的电子设备。本申请中的电子设备1400可以包括一个或多个如下部件:处理器1410、存储器1420以及一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器1420中并被配置为由一个或多个处理器1410执行,一个或多个程序配置用于执行如前述方法实施例所描述的方法。
处理器1410可以包括一个或者多个处理核。处理器1410利用各种接口和线路连接整个电子设备1400内的各个部分,通过运行或执行存储在存储器1420内的指令、程序、代码集或指令集,以及调用存储在存储器1420内的数据,执行电子设备1400的各种功能和处理数据。可选地,处理器1410可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1410可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1410中,单独通过一块通信芯片进行实现。
存储器1420可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器1420可用于存储指令、程序、代码、代码集或指令集。存储器1420可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备1400在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
请参阅图15,其示出了本申请实施例提供的一种计算机可读取存储介质的结构框图。该计算机可读取存储介质1500中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读取存储介质1500可以是诸如闪存、电可擦除可编程只读存储器(electrically-erasable programmable read-only memory,EEPROM)、可擦除可编程只读存储器(erasable programmable read only memory,EPROM)、硬盘或者ROM之类的电子存储器。可选地,计算机可读取存储介质1500包括非易失性计算机可读介质(non-transitorycomputer-readable storage medium)。计算机可读取存储介质1500具有执行上述方法中的任何方法步骤的程序代码1510的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码1510可以例如以适当形式进行压缩。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (16)
1.一种语义分析方法,其特征在于,应用于终端,包括:
在通话过程中,获取用户输入的投诉语音;
获取所述投诉语音对应的投诉文本;
获取所述投诉文本对应的投诉标签;
基于指定时间段内获取的投诉标签,建立可视化图表,所述可视化图表用于呈现所述指定时间段内获取的投诉标签的分布信息;
显示所述可视化图表。
2.根据权利要求1所述的方法,其特征在于,所述在通话过程中,获取用户输入的投诉语音,所述获取所述投诉语音对应的投诉文本,包括:
在通话过程中,获取用户输入的投诉语音并传输至第一服务器,指示所述第一服务器对所述投诉语音进行语音识别得到所述投诉文本;
获取所述第一服务器返回的所述投诉文本。
3.根据权利要求1所述的方法,其特征在于,所述语义识别模型运行于第二服务器,所述获取所述投诉文本对应的投诉标签,包括:
将所述投诉文本传输至所述第二服务器,指示所述第二服务器基于训练好的语义识别模型,对所述投诉文本进行语义识别得到所述投诉文本对应的投诉标签;
获取所述第二服务器返回的所述投诉文本对应的投诉标签。
4.根据权利要求1所述的方法,其特征在于,所述基于指定时间段内获取的投诉标签,建立可视化图表,包括:
存储所述投诉标签至数据库;
获取在指定时间段内存储于所述数据库的目标投诉标签;
基于所述目标投诉标签的分布信息,建立可视化图表。
5.根据权利要求4所述的方法,其特征在于,所述基于所述目标投诉标签的分布信息,建立可视化图表,包括:
确定每个所述目标投诉标签对应的累计数量;
根据每个所述目标投诉标签对应的累计数量以及所有目标投诉标签对应的总累计数量,确定每个目标投诉标签的统计参数,所述统计参数包括每个所述目标投诉标签对应的累计数量占所述总累计数量的占比、所述累计数量的变化率中的至少一个;
生成所述统计参数对应的可视化图表。
6.根据权利要求4所述的方法,其特征在于,所述获取在指定时间段内存储于所述数据库的目标投诉标签,包括:
确定所述投诉语音对应的用户;
从所述数据库中查找在所述指定时间段内存储的所述用户对应的投诉标签,作为历史投诉标签,所述投诉标签用于确定所述用户的投诉原因;
将所述历史投诉标签与所述投诉语音对应的投诉标签作为目标投诉标签。
7.根据权利要求4所述的方法,其特征在于,所述获取在指定时间段内存储于所述数据库的目标投诉标签,包括:
确定所述投诉语音对应的用户;
从所述数据库中查找所述用户本次投诉通话对应的至少一个投诉标签,作为目标投诉标签。
8.根据权利要求1-5任一项所述的方法,其特征在于,所述获取所述投诉文本对应的投诉标签之后,所述方法还包括:
确定所述投诉标签对应的目标答复文本;
基于所述目标答复文本生成答复语音;
输出所述答复语音,以对所述投诉语音进行答复。
9.根据权利要求8所述的方法,其特征在于,所述数据库存储有历史投诉记录,所述历史投诉记录包括存储的至少一个用户对应的投诉标签以及所述投诉标签对应的答复文本,所述确定所述投诉标签对应的目标答复文本,包括:
基于所述历史投诉记录,确定每个用户基于所述投诉标签的投诉次数;
将所述投诉次数由低到高的前指定数量个用户作为候选用户;
从答复所述候选用户的答复文本中确定所述投诉标签对应的目标答复文本。
10.根据权利要求8所述的方法,其特征在于,所述确定所述投诉标签对应的目标答复文本,包括:
若所述投诉标签的数量为多个,根据每个所述投诉标签对所述投诉语音进行分段,得到每个所述投诉标签对应的投诉语音片段;
确定每个投诉语音片段对应的答复优先级;
按所述答复优先级依次确定多个所述投诉标签对应的目标答复文本,以基于所述目标答复文本的确定顺序依次对所述投诉语音进行答复。
11.根据权利要求10所述的方法,其特征在于,所述确定每个投诉语音片段对应的答复优先级,包括:
对每个所述投诉语音片段进行情绪识别得到对应的情绪参数,所述情绪参数包括唤起度与效价的至少一种;
根据所述情绪参数由高至低的排序,确定每个所述投诉语音片段对应的答复优先级。
12.一种语义分析系统,其特征在于,所述系统包括:终端和与所述终端连接的服务器;
所述终端,用于在通话过程中,获取用户输入的投诉语音并传输至所述服务器;
所述服务器,用于接收所述投诉语音,对所述投诉语音进行语音识别得到所述投诉文本,基于训练好的语义识别模型,确定所述投诉文本对应的投诉标签;
所述终端,还用于基于指定时间段内获取的投诉标签,建立可视化图表,并显示所述可视化图表,所述可视化图表用于呈现所述指定时间段内获取的投诉标签的分布信息。
13.根据权利要求11所述的系统,其特征在于,所述服务器包括第一服务器与第二服务器;
所述第一服务器,用于接收所述投诉语音,对所述投诉语音进行语音识别得到所述投诉文本,并将所述投诉文本存储至所述第一数据库;
所述第二服务器,用于从所述第一数据库中获取投诉文本,基于训练好的语义识别模型,确定所述投诉文本对应的投诉标签,并将所述投诉标签存储至所述第二数据库。
14.一种语义分析装置,其特征在于,应用于终端,所述装置包括:
语音获取模块,用于在通话过程中,获取用户输入的投诉语音;
文本获取模块,用于获取所述投诉语音对应的投诉文本;
标签获取模块,用于获取所述投诉文本对应的投诉标签;
图表建立模块,用于基于指定时间段内获取的投诉标签,建立可视化图表,所述可视化图表用于呈现所述指定时间段内获取的投诉标签的分布信息;
图表显示模块,用于显示所述可视化图表。
15.一种电子设备,其特征在于,包括:
存储器;
一个或多个处理器,与所述存储器耦接;
一个或多个程序,其中,所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行如权利要求1至11中任一项所述的方法。
16.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行所述权利要求1-11任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010544163.1A CN111695360B (zh) | 2020-06-15 | 2020-06-15 | 语义分析方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010544163.1A CN111695360B (zh) | 2020-06-15 | 2020-06-15 | 语义分析方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111695360A true CN111695360A (zh) | 2020-09-22 |
CN111695360B CN111695360B (zh) | 2023-10-27 |
Family
ID=72481223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010544163.1A Active CN111695360B (zh) | 2020-06-15 | 2020-06-15 | 语义分析方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111695360B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112036119A (zh) * | 2020-10-16 | 2020-12-04 | 深圳市欢太科技有限公司 | 一种文本显示方法、装置及计算机可读存储介质 |
CN113450796A (zh) * | 2021-06-29 | 2021-09-28 | 平安养老保险股份有限公司 | 语音报表生成方法、装置、设备及存储介质 |
CN113657118A (zh) * | 2021-08-16 | 2021-11-16 | 北京好欣晴移动医疗科技有限公司 | 基于通话文本的语义分析方法、装置和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670843A (zh) * | 2018-11-12 | 2019-04-23 | 平安科技(深圳)有限公司 | 投诉业务的数据处理方法、装置、计算机设备及存储介质 |
CN109684475A (zh) * | 2018-11-21 | 2019-04-26 | 斑马网络技术有限公司 | 投诉的处理方法、装置、设备以及存储介质 |
CN109784938A (zh) * | 2018-12-12 | 2019-05-21 | 顺丰科技有限公司 | 线上化投诉方法和装置 |
CN109816399A (zh) * | 2019-01-07 | 2019-05-28 | 平安科技(深圳)有限公司 | 投诉件的管理方法、装置、计算机设备和存储介质 |
CN109961214A (zh) * | 2019-02-13 | 2019-07-02 | 平安科技(深圳)有限公司 | 投诉对接处理人分配方法、装置、计算机设备及存储介质 |
CN110163432A (zh) * | 2019-05-17 | 2019-08-23 | 北京三快在线科技有限公司 | 一种订单识别的方法及装置 |
CN111028827A (zh) * | 2019-12-10 | 2020-04-17 | 深圳追一科技有限公司 | 基于情绪识别的交互处理方法、装置、设备和存储介质 |
-
2020
- 2020-06-15 CN CN202010544163.1A patent/CN111695360B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670843A (zh) * | 2018-11-12 | 2019-04-23 | 平安科技(深圳)有限公司 | 投诉业务的数据处理方法、装置、计算机设备及存储介质 |
CN109684475A (zh) * | 2018-11-21 | 2019-04-26 | 斑马网络技术有限公司 | 投诉的处理方法、装置、设备以及存储介质 |
CN109784938A (zh) * | 2018-12-12 | 2019-05-21 | 顺丰科技有限公司 | 线上化投诉方法和装置 |
CN109816399A (zh) * | 2019-01-07 | 2019-05-28 | 平安科技(深圳)有限公司 | 投诉件的管理方法、装置、计算机设备和存储介质 |
CN109961214A (zh) * | 2019-02-13 | 2019-07-02 | 平安科技(深圳)有限公司 | 投诉对接处理人分配方法、装置、计算机设备及存储介质 |
CN110163432A (zh) * | 2019-05-17 | 2019-08-23 | 北京三快在线科技有限公司 | 一种订单识别的方法及装置 |
CN111028827A (zh) * | 2019-12-10 | 2020-04-17 | 深圳追一科技有限公司 | 基于情绪识别的交互处理方法、装置、设备和存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112036119A (zh) * | 2020-10-16 | 2020-12-04 | 深圳市欢太科技有限公司 | 一种文本显示方法、装置及计算机可读存储介质 |
CN113450796A (zh) * | 2021-06-29 | 2021-09-28 | 平安养老保险股份有限公司 | 语音报表生成方法、装置、设备及存储介质 |
CN113450796B (zh) * | 2021-06-29 | 2023-09-19 | 平安养老保险股份有限公司 | 语音报表生成方法、装置、设备及存储介质 |
CN113657118A (zh) * | 2021-08-16 | 2021-11-16 | 北京好欣晴移动医疗科技有限公司 | 基于通话文本的语义分析方法、装置和系统 |
CN113657118B (zh) * | 2021-08-16 | 2024-05-14 | 好心情健康产业集团有限公司 | 基于通话文本的语义分析方法、装置和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111695360B (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190124020A1 (en) | Chatbot Skills Systems And Methods | |
CN111695360B (zh) | 语义分析方法、装置、电子设备及存储介质 | |
CN110019742B (zh) | 用于处理信息的方法和装置 | |
US11798539B2 (en) | Systems and methods relating to bot authoring by mining intents from conversation data via intent seeding | |
CN111666380A (zh) | 一种智能呼叫方法、装置、设备和介质 | |
CN116521841B (zh) | 用于生成回复信息的方法、装置、设备及介质 | |
CN112818109B (zh) | 邮件的智能回复方法、介质、装置和计算设备 | |
CN116501960B (zh) | 内容检索方法、装置、设备及介质 | |
JP2022088304A (ja) | ビデオを処理するための方法、装置、電子機器、媒体及びコンピュータプログラム | |
CN113239204A (zh) | 文本分类方法及装置、电子设备、计算机可读存储介质 | |
CN115099239B (zh) | 一种资源识别方法、装置、设备以及存储介质 | |
CN114254158A (zh) | 视频生成方法及其装置、神经网络的训练方法及其装置 | |
CN114171063A (zh) | 一种实时话务客户情绪分析辅助方法及系统 | |
CN114547244A (zh) | 用于确定信息的方法和装置 | |
CN114138960A (zh) | 用户意图识别方法、装置、设备及介质 | |
CN110740212B (zh) | 基于智能语音技术的通话接听方法、装置及电子设备 | |
CN112434953A (zh) | 一种基于计算机数据处理的客服人员考核方法和装置 | |
CN115879469B (zh) | 文本数据处理方法、模型训练方法、装置及介质 | |
CN116257690A (zh) | 一种资源推荐方法、装置、电子设备和存储介质 | |
CN116303951A (zh) | 对话处理方法、装置、电子设备和存储介质 | |
CN114490967B (zh) | 对话模型的训练方法、对话机器人的对话方法、装置和电子设备 | |
CN116108176A (zh) | 基于多模态深度学习的文本分类方法、设备及存储介质 | |
CN111556096B (zh) | 信息推送方法、装置、介质及电子设备 | |
CN112632241A (zh) | 智能会话的方法、装置、设备和计算机可读介质 | |
CN114118937A (zh) | 基于任务的信息推荐方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |