CN116996619A - 语音业务导航方法、装置、设备及存储介质 - Google Patents
语音业务导航方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116996619A CN116996619A CN202310797217.9A CN202310797217A CN116996619A CN 116996619 A CN116996619 A CN 116996619A CN 202310797217 A CN202310797217 A CN 202310797217A CN 116996619 A CN116996619 A CN 116996619A
- Authority
- CN
- China
- Prior art keywords
- voice
- terminal
- service
- call
- session
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000013507 mapping Methods 0.000 claims abstract description 48
- 230000002452 interceptive effect Effects 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 70
- 230000003993 interaction Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 12
- 230000000875 corresponding effect Effects 0.000 description 78
- 238000012546 transfer Methods 0.000 description 9
- 238000005457 optimization Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 238000004804 winding Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000012089 stop solution Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5166—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请涉及一种语音业务导航方法、装置、设备及存储介质,应用于计算机技术领域,所述方法包括:获取第一语音会话中的第一语音通话数据;识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息;根据预设的功能映射表,确定目标业务场景信息对应的功能节点标识,功能映射表中包含业务场景信息和功能节点标识之间的映射关系;响应于交互办理指令,生成第一语音会话对应的随路数据包,随路数据包中包含有功能节点标识;根据随路数据包,生成第二语音会话,以在第二语音会话中根据功能节点标识为第一终端进行语音业务导航。采用本方法能够提高语音业务导航效率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种语音业务导航方法、装置、设备及存储介质。
背景技术
语音通话是通过语音并借助传输媒介的沟通方式,常见的有座机通话、手机通话、网络通话等。当前,用户可以通过语言通话与人工客服进行一对一的电话咨询,以办理相关业务。
相关技术中,用户在和人工客服通话的过程中,若用户存在业务办理的诉求,人工客服需要判断客户的真实意图,再根据真实意图手动点击页面,配置业务对应的功能节点,从而协助建立交互语音应答(Interactive Voice Response,IVR)会话,以使用户在IVR会话中通过自助按键式菜单进行业务办理。
然而,仅凭人工客服的经验判断客户的真实意图,可能存在误判的风险,从而导致用户需要再次与人工客户进行语音通话以重新建立IVR会话,这大大降低了语音业务的处理效率。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高语音业务导航效率的语音业务导航方法、装置、设备及存储介质。
第一方面,本申请提供了一种语音业务导航方法。所述方法包括:
获取第一语音会话中的第一语音通话数据;
识别所述第一语音通话数据的通话内容,并确定所述通话内容对应的目标业务场景信息;
根据预设的功能映射表,确定所述目标业务场景信息对应的功能节点标识,所述功能映射表中包含业务场景信息和功能节点标识之间的映射关系;
响应于交互办理指令,生成所述第一语音会话对应的随路数据包,所述随路数据包中包含有所述功能节点标识;
根据所述随路数据包,生成第二语音会话,以在所述第二语音会话中根据所述功能节点标识为第一终端进行语音业务导航。
在其中一个实施例中,所述确定所述通话内容对应的目标业务功能,包括:
将所述通话内容输入知识库模型中,并获取所述知识库模型输出的所述通话内容对应的标准业务问答数据,所述知识库模型用于根据所述通话内容中挖掘出的知识点为所述通话内容匹配所述标准业务问答数据;
根据所述通话内容对应的标准业务问答数据,确定所述语音通话内容对应的目标业务功能。
在其中一个实施例中,在所述响应于交互办理指令,生成所述第一语音会话对应的随路数据包之前,所述方法还包括:
向第二终端发送业务推荐请求,所述业务推荐请求用于在所述第二终端上显示所述目标业务场景信息并生成所述目标业务场景对应的控件,所述目标业务场景对应的控件用于在触发操作下生成所述交互办理指令;
接收所述第二终端发送的所述交互办理指令。
在其中一个实施例中,在所述获取第一语音会话中的第一语音通话数据之前,所述方法还包括:
接收所述第一终端发送的语音通话请求;
获取第二终端的业务处理状态;
根据所述语音通话请求的通话类型和第二终端的业务处理状态,在所述第一终端和所述第二终端之间建立所述第一语音会话。
在其中一个实施例中,所述根据所述语音通话请求的通话类型和第二终端的业务处理状态,在所述第一终端和所述第二终端之间建立所述第一语音会话,包括:
若所述语音通话请求的通话类型为人工类型且所述第二终端处于空闲状态,则在所述第一终端和所述第二终端之间建立所述第一语音会话。
在其中一个实施例中,在所述接收所述第一终端发送的语音通话请求之后,所述方法还包括:
将所述语音通话请求中的第二语音数据转换为文本数据;
通过识别所述文本数据中的语义标识,确定所述语音通话请求的通话类型。
第二方面,本申请还提供了一种语音业务导航装置。所述装置包括:
获取模块,用于获取第一语音会话中的第一语音通话数据;
确定模块,用于识别所述第一语音通话数据的通话内容,并确定所述通话内容对应的目标业务场景信息;根据预设的功能映射表,确定所述目标业务场景信息对应的功能节点标识,所述功能映射表中包含业务场景信息和功能节点标识之间的映射关系;
生成模块,用于响应于交互办理指令,生成所述第一语音会话对应的随路数据包,所述随路数据包中包含有所述功能节点标识;根据所述随路数据包,生成第二语音会话,以在所述第二语音会话中根据所述功能节点标识为第一终端进行语音业务导航。
在其中一个实施例中,所述确定模块,具体用于将所述通话内容输入知识库模型中,并获取所述知识库模型输出的所述通话内容对应的标准业务问答数据,所述知识库模型用于根据所述通话内容中挖掘出的知识点为所述通话内容匹配所述标准业务问答数据;根据所述通话内容对应的标准业务问答数据,确定所述语音通话内容对应的目标业务功能。
在其中一个实施例中,所述确定模块,还用于向第二终端发送业务推荐请求,所述业务推荐请求用于在所述第二终端上显示所述目标业务场景信息并生成所述目标业务场景对应的控件,所述目标业务场景对应的控件用于在触发操作下生成所述交互办理指令;接收所述第二终端发送的所述交互办理指令。
在其中一个实施例中,所述生成模块,还用于接收所述第一终端发送的语音通话请求;获取第二终端的业务处理状态;根据所述语音通话请求的通话类型和第二终端的业务处理状态,在所述第一终端和所述第二终端之间建立所述第一语音会话。
在其中一个实施例中,所述生成模块,具体用于若所述语音通话请求的通话类型为人工类型且所述第二终端处于空闲状态,则在所述第一终端和所述第二终端之间建立所述第一语音会话。
在其中一个实施例中,所述生成模块,具体用于将所述语音通话请求中的第二语音数据转换为文本数据;通过识别所述文本数据中的语义标识,确定所述语音通话请求的通话类型。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述语音业务导航方法。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述语音业务导航方法。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述语音业务导航方法。
上述语音业务导航方法、装置、设备及存储介质,首先获取第一语音会话中的第一语音通话数据。其次,识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息。再次,根据预设的功能映射表,确定目标业务场景信息对应的功能节点标识,功能映射表中包含业务场景信息和功能节点标识之间的映射关系。最后,响应于交互办理指令,生成第一语音会话对应的随路数据包,随路数据包中包含有功能节点标识,并根据随路数据包,生成第二语音会话,第二语音会话用于根据功能节点标识为第一终端进行语音业务导航。由于先识别通话内容对应的目标业务场景信息,再根据目标业务场景信息自动配置对应的功能节点标识,从而避免了因个主观判断通话内容导致的功能节点标识的误判,进而避免了因误判而进行的重复语言通话,提高了语音业务导航效率。
附图说明
图1为本申请实施例提供的一种语音业务导航方法的应用环境图;
图2为本申请实施例提供的一种语音业务导航系统的系统架构图;
图3为本申请实施例提供的一种语音业务导航方法的流程示意图;
图4为本申请实施例提供的另一种语音业务导航方法的流程示意图;
图5为本申请实施例提供的再一种语音业务导航方法的流程示意图;
图6为本申请实施例提供的一种语音业务导航装置的结构示意图;
图7为本申请实施例提供的一种计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的语音业务导航方法,可以应用于如图1所示的应用环境中。其中,第一终端101和第二终端102通过网络与服务器103进行通信。其中,第一终端101可以为用户终端,第二终端102可以为客服终端。数据存储系统可以存储服务器103需要处理的数据。数据存储系统可以集成在服务器103上,也可以放在云上或其他网络服务器上。
当用户需要进行语音业务导航时,可以通过第一终端101向服务器103发起语音通话请求,从而使得服务器103建立第一终端101和第二终端102之间的第一语音会话。服务器103可以获取第一语音会话中的第一语音通话数据,从而识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息。随后,服务器103可以根据预设的功能映射表,确定目标业务场景信息对应的功能节点标识。当服务器接收到第二终端102发送的交互办理指令后,服务器103可以生成第一语音会话对应的随路数据包,并根据随路数据包,生成第二语音会话,从而使得服务器103在第二语音会话中根据功能节点标识为第一终端101进行语音业务导航。
其中,终端101可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。终端102可以为呼叫中心坐席(Customer Service Representative,CSR)。服务器103可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一些实施例中,上述服务器103可以划分为多个模块,以实现上述语音业务导航方法。图2为本申请实施例提供的一种语音业务导航系统的系统架构图。如图2所示,服务器可以包括业务系统模块、语音辅助模块、网关模块、交互语音应答(Interactive VoiceResponse,IVR)模块、计算机集成电话(ComputerTelephony Integration,CTI)模块、呼叫中心坐席(Customer Service Representative,CSR)模块和基础组件模块。
其中,IVR模块,用于用户进线电话的接起,IVR自助菜单播报、用户端语音流采集转发,业务逻辑调用,客户信息判断。语言导航模块,用于语音导航和用户语音声纹的识别,并可以将声纹识别出的结果反馈给IVR模块。基础组件模块,用于提供语音识别、语义解析、文本到语音合成等服务。业务系统模块,用于业务功能和身份信息查询,并将查询到的数据返回IVR,语音辅助模块,用于实时转译用户与客服之间的对话内容,并根据智能助手建议的标准业务问答数据,将对应的业务场景推送到CTI模块。
在一些实施例中,网关模块通过网络与用户终端交互,接收用户终端发起的语音通话请求。随后,网络模块将语音通话请求发送给IVR模块中的负责均衡器,以使负载均衡器将语音通话请求分配给IVR集群中的任意IVR单元处理,任意IVR单元均可以调用IVR模块中的媒体服务器集群,从而使得媒体服务器集群通过语音辅助模块进行智能语音导航,并且,当确定用户需要的业务时,任意IVR单元还可以与业务系统模块,获取业务数据。此外,IVR模块还可以将语音通话中的随路数据发送给CTI模块,以使CTI模块将随路数据发送给CSR模块。CSR模块建立用户终端和客服终端之间的语音会话,以便用户进行工人业务咨询。同时,CSR模块基础组件模块连接,从而对用户终端和客服终端之间的语音会话中的语音通话数据,进行语音识别、语义解析、文本到语音合成等操作。
在一个实施例中,如图3所示,提供了一种语音业务导航方法,以该方法应用于图1中的服务器为例进行说明,包括S201-S205:
S201、获取第一语音会话中的第一语音通话数据。
在本申请中,当用户进行语音业务导航时,可以建立第一语音会话,从而使得服务器可以获取第一语音会话中的第一语音通话数据。
其中,上述第一语音会话可以为第一终端和第二终端之间的语音会话,第一终端可以为用户终端,第二终端可以为客服终端,第一语音会话可以为用户和客服之间的业务咨询会话。
应理解,本申请实施例对于如何建立第一语音会话不做限制,在一些实施例中,当用户需要进行语音业务导航时,第一终端可以向服务器发送语音通话请求。随后,服务器可以获取第二终端的业务处理状态。最后,服务器根据语音通话请求的通话类型和第二终端的业务处理状态,在第一终端和第二终端之间建立第一语音会话。
其中,上述业务处理状态可以包括空闲状态和忙碌状态,上述语音通话类型可以包括自动类型和人工类型。相应的,若语音通话请求的通话类型为人工类型且第二终端处于空闲状态,则在第一终端和第二终端之间建立第一语音会话。
应理解,本申请实施例对于如何确定语音通话请求的通话类型也不做限制,在一些实施例中,可以将语音通话请求中的第二语音数据转换为文本数据,随后,通过识别文本数据中的语义标识,确定语音通话请求的通话类型。
其中,上述第二语音数据可以为发起语音通话请求时用户所讲的语音数据,将第二语音数据转换为文本数据可以通过基础组件中的语音识别引擎实现,该语音识别引擎中可以包括语音识别模型,通过对语音识别模型进行训练,可以实现将第二语音数据转换为文本数据。
其中,上述语义标识可以包括“转人工”、“人工客户”等特点的语义关键词,服务器可以将第二语音数据转换为文本数据存入内存数据库,随后,识别文本数据中是否存在上述语义标识,来判断用户是否有转人工的意图。若有转人工的意图,则确定语音通话请求的通话类型为人工类型,则转接对应的第二终端并建立第一会话。若无转人工的意图,则继续自动进行智能答复,协议用户进行业务办理。
示例性的,第二终端可以包含为一个,也可以为多个,若存在多个第二终端,则可以通过CTI模型进行管理,并通过CRS模块进行接入。若语音通话请求的类型为人工类型,则在接入CRS模块时,可以将语言通话请求中的相关参数写入随路数据包中,通过会话初始协议(Session initialization Protocol,SIP)将随路数据包发送给CTI模块,进行转人工排队等待。当第二终端处于空闲状态时,CTI模块可以将随路数据传送给CRS模块,并通过CRS模块在第二终端上生成示闲按钮,当示闲按钮被点击后,CRS模块将随路数据发送给第二终端,以转接用户来电并建议第一语音会话。
S202、识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息。
在本步骤中,当服务器获取第一语音会话中的第一语音通话数据后,可以识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息。
其中,上述识别第一语音通话数据的通话内容,可以在第一语音会话后进行,也可以在捕获来电事件时进行,本申请实施例对此不做限制。
在一些实施例中,服务器可以将第一语音通话数据转译为文本数据,从而识别第一语音通话数据的通话内容。示例性的,将第一语音通话数据转译为文本数据也可以通过基础组件中的语音识别引擎实现,该语音识别引擎中可以包括语音识别模型,通过对语音识别模型进行训练,可以实现将第二语音数据转换为文本数据。
在一些实施例中,当服务器确定通话内容后,可以将通话内容输入知识库模型中,并获取知识库模型输出的通话内容对应的标准业务问答数据,随后,根据通话内容对应的标准业务问答数据,确定语音通话内容对应的目标业务功能。
其中,该知识库模型用于根据通话内容中挖掘出的知识点为通话内容匹配标准业务问答数据。
示例性的,上述知识库模型在生成过程中可以包括冷启动阶段、效果优化阶段和机制优化阶段。
在冷启动阶段,可以基于客服和用户的历史对话数据,挖掘高频知识点,从而生成知识库模型。在该阶段,可以根据用户的业务场景明确业务节点,快速丰富词集及句式,确定标准业务问答数据并写入库,从而提高内容匹配标准业务问答数据的响应成功率。
在效果优化阶段,可以依赖知识库模型上线使用一段时间的真实数据,快速迭代优化集,优化知识库模型。其中,优化方式可以包括新知识点发现、新词发现、句式挖掘、质检缠绕、模型训练、转写优化等,从而进一步提高内容匹配标准业务问答数据的响应成功率。
在极致优化阶段,可以依赖知识库模型长期上线的海量真实数据,对线上大数据进行按需筛选,通过拒识数据处理、质检缠绕,意图缠绕处理、模型训练、转写效果优化等手段减少库中缠绕情况,提升拒识节点的正确率,从而进一步提高内容匹配标准业务问答数据的响应成功率。
S203、根据预设的功能映射表,确定目标业务场景信息对应的功能节点标识。
在本步骤中,当服务器识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息后,可以据预设的功能映射表,确定目标业务场景信息对应的功能节点标识。
应理解,上述预设的功能映射表中可以包含业务场景信息和功能节点标识之间的映射关系,上述映射关系可以为一个,也可以为多个,可以根据指令进行配置修改,对映射关系进行删除、新增和替换等操作。
示例性的,如表1所示为预设的功能映射表,在表1中,不同的业务场景可以对应不同的功能节点标识,通过功能映射表,可以快速确定目标业务场景信息对应的功能节点标识。
表1
应理解,在本申请中,上述功能映射表可以定期通过非同质化通证(Non-FungibleToken,NFT)协议推送给第二终端,第二终端将其写入对应的数据库中,从而包括服务器和第二终端两方的功能映射表一致。
S204、响应于交互办理指令,生成第一语音会话对应的随路数据包,随路数据包中包含有功能节点标识。
在本申请中,当服务器确定目标业务场景信息对应的功能节点标识后,可以响应于交互办理指令,生成第一语音会话对应的随路数据包。
应理解,本申请实施例对于上述交互办理指令不做限制,在一些实施例中,服务器可以向第二终端发送业务推荐请求,业务推荐请求用于在第二终端上显示目标业务场景信息并生成目标业务场景对应的控件,目标业务场景对应的控件用于在触发操作下生成交互办理指令。随后,客服用过对目标业务场景对应的控件进行触发操作,从而使第二终端生成交互办理指令,并向服务器发送交互办理指令。
其中,上述触发操作可以包括点击、按压、滑动等操作。
应理解,本申请实施例对于如何在第二终端上显示目标业务场景信息不做限制,在一些实施例中,可以在第二终端上生成相关的坐席操作页面,并通过超文本传输协议(Hypertext Transfer Protocol,HTTP)将目标业务场景信息展示在坐席操作页面上。
在一些实施例中,业务推荐请求不但可以包括目标业务场景信息,还可以包括与通话内容匹配的标准业务问答数据,从而同步地在坐席操作页面上显示与通话内容匹配的标准业务问答数据,以辅助客服人员与用户进行沟通。
应理解,本申请实施例对于如何生成随路数据包不做限制,在一些实施例中,服务器可以将第一语音会话相关的参数进行数据包写入处理,从而生成随路数据包。该随路数据包随话路转移。
示例性的,如图2所示,IVR模块和CSR模块同时向CTI模块注册一路SIP呼叫通道A,通道A用于IVR模块和CSR模块的语音通话,IVR模块和CSR模块通过A通道建立的语音呼叫(即,第一语音会话),实现IVR模块和CSR模块对应的第二终端之间的点对点双向语音通话和随路数据传送。
S205、根据随路数据包,生成第二语音会话,以在第二语音会话中根据功能节点标识为第一终端进行语音业务导航。
在本申请中,当服务器生成第一语音会话对应的随路数据包后,可以根据随路数据包,生成第二语音会话。
其中,上述第二语音会话可以为用户自主进行业务办理的会话,该第二业务会话中由人工智能助手辅助用户进行业务办理,无需人工介入。
应理解,本申请实施例对于如何根据根据随路数据包,生成第二语音会话不做限制,在一些实施例中,服务器中的CTI模块可以通过SIP协议将随路数据包送回IVR模块,由IVR模块进行拆包解析。随后,针对解析后的随路数据包括,IVR模块可以重新发起会话请求,生成并初始化第二语音会话。
示例性的,在第二语音会话中,可以基于功能节点标识生成相关的自助语音菜单,从而进行业务导航,现实功能节点标识对应的业务场景的人机交互办理,例如智能一问一答、消息推送等。
在一些实施例中,若功能节点标识对应的业务场景为交易类场景,则在生成自助语音菜单后,可以由IVR模块通过向业务系统模块发送请求,获取交易数据进行自助办理。
在本申请中,基于随路数据包中的功能节点标识生成自助语音菜单,从而使自助语音菜单与用户通话内容对应的目标业务场景高度相关,使得自助语音菜单更加扁平化,通过全流程的自然语言交互,实时跟进用户需求,使交流更加快捷自然,实现用户问题一语直达、一站式解决。此外,还可以在为用户导航方面提供精准导航,减少因人工主观臆断带来的错误判断,提高工作效率和服务水平。
本申请实施例提供的语音业务导航方法,首先获取第一语音会话中的第一语音通话数据。其次,识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息。再次,根据预设的功能映射表,确定目标业务场景信息对应的功能节点标识,功能映射表中包含业务场景信息和功能节点标识之间的映射关系。最后,响应于交互办理指令,生成第一语音会话对应的随路数据包,随路数据包中包含有功能节点标识,并根据随路数据包,生成第二语音会话,以在第二语音会话中根据功能节点标识为第一终端进行语音业务导航。由于先识别通话内容对应的目标业务场景信息,再根据目标业务场景信息自动配置对应的功能节点标识,从而避免了因个主观判断通话内容导致的功能节点标识的误判,从而避免了因误判而进行的重复语言通话,进而提高了语音业务导航效率。
下面对于如何建立第一语音会话进行说明。图4为本申请实施例提供的另一种语音业务导航方法流程示意图。如图4所示,该语音业务导航方法包括S301-S308:
S301、接收第一终端发送的语音通话请求。
其中,第一终端可以为用户终端,第一语音会话可以为用户和客服之间的业务咨询会话。
S302、获取第二终端的业务处理状态。
其中,上述业务处理状态可以包括空闲状态和忙碌状态。
S303、根据语音通话请求的通话类型和第二终端的业务处理状态,在第一终端和第二终端之间建立第一语音会话。
在一些实施例中,若语音通话请求的通话类型为人工类型且第二终端处于空闲状态,则在第一终端和第二终端之间建立第一语音会话。
S304、获取第一语音会话中的第一语音通话数据。
S305、识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息。
S306、根据预设的功能映射表,确定目标业务场景信息对应的功能节点标识,功能映射表中包含业务场景信息和功能节点标识之间的映射关系。
S307、响应于交互办理指令,生成第一语音会话对应的随路数据包,随路数据包中包含有功能节点标识。
S308、根据随路数据包,生成第二语音会话,以在第二语音会话中根据功能节点标识为第一终端进行语音业务导航。
下面对于如何触发交互办理指令进行说明。图5为本申请实施例提供的再一种语音业务导航方法流程示意图。如图5所示,该语音业务导航方法包括S401-S407:
S401、获取第一语音会话中的第一语音通话数据。
S402、识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息。
S403、根据预设的功能映射表,确定目标业务场景信息对应的功能节点标识,功能映射表中包含业务场景信息和功能节点标识之间的映射关系。
应理解,上述预设的功能映射表中可以包含业务场景信息和功能节点标识之间的映射关系,上述映射关系可以为一个,也可以为多个,可以根据指令进行配置修改,对映射关系进行删除、新增和替换等操作。
应理解,在本申请中,上述功能映射表可以定期通过非同质化通证(Non-FungibleToken,NFT)协议推送给第二终端,第二终端将其写入对应的数据库中,从而包括服务器和第二终端两方的功能映射表一致。
S404、向第二终端发送业务推荐请求,业务推荐请求用于在第二终端上显示目标业务场景信息并生成目标业务场景对应的控件,目标业务场景对应的控件用于在触发操作下生成交互办理指令。
其中,上述触发操作可以包括点击、按压、滑动等操作。
应理解,本申请实施例对于如何在第二终端上显示目标业务场景信息不做限制,在一些实施例中,可以在第二终端上生成相关的坐席操作页面,并通过超文本传输协议(Hypertext Transfer Protocol,HTTP)将目标业务场景信息展示在坐席操作页面上。
在一些实施例中,业务推荐请求不但可以包括目标业务场景信息,还可以包括与通话内容匹配的标准业务问答数据,从而同步地在坐席操作页面上显示与通话内容匹配的标准业务问答数据,以辅助客服人员与用户进行沟通。
S405、接收第二终端发送的交互办理指令。
S406、响应于交互办理指令,生成第一语音会话对应的随路数据包,随路数据包中包含有功能节点标识。
S407、根据随路数据包,生成第二语音会话,以在第二语音会话中根据功能节点标识为第一终端进行语音业务导航。
本申请实施例提供的语音业务导航方法,首先获取第一语音会话中的第一语音通话数据。其次,识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息。再次,根据预设的功能映射表,确定目标业务场景信息对应的功能节点标识,功能映射表中包含业务场景信息和功能节点标识之间的映射关系。最后,响应于交互办理指令,生成第一语音会话对应的随路数据包,随路数据包中包含有功能节点标识,并根据随路数据包,生成第二语音会话,以在第二语音会话中根据功能节点标识为第一终端进行语音业务导航。由于先识别通话内容对应的目标业务场景信息,再根据目标业务场景信息自动配置对应的功能节点标识,从而避免了因个主观判断通话内容导致的功能节点标识的误判,从而避免了因误判而进行的重复语言通话,进而提高了语音业务导航效率。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的语音业务导航方法的语音业务导航装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个语音业务导航装置实施例中的具体限定可以参见上文中对于语音业务导航方法的限定,在此不再赘述。
在一个实施例中,如图6所示,提供了一种语音业务导航装置500,包括:获取模块501、确定模块502和生成模块503,其中:
获取模块501,用于获取第一语音会话中的第一语音通话数据;
确定模块502,用于识别第一语音通话数据的通话内容,并确定通话内容对应的目标业务场景信息;根据预设的功能映射表,确定目标业务场景信息对应的功能节点标识,功能映射表中包含业务场景信息和功能节点标识之间的映射关系;
生成模块503,用于响应于交互办理指令,生成第一语音会话对应的随路数据包,随路数据包中包含有功能节点标识;根据随路数据包,生成第二语音会话,以在第二语音会话中根据功能节点标识为第一终端进行语音业务导航。
在其中一个实施例中,确定模块502,具体用于将通话内容输入知识库模型中,并获取知识库模型输出的通话内容对应的标准业务问答数据,知识库模型用于根据通话内容中挖掘出的知识点为通话内容匹配标准业务问答数据;根据通话内容对应的标准业务问答数据,确定语音通话内容对应的目标业务功能。
在其中一个实施例中,确定模块502,还用于向第二终端发送业务推荐请求,业务推荐请求用于在第二终端上显示目标业务场景信息并生成目标业务场景对应的控件,目标业务场景对应的控件用于在触发操作下生成交互办理指令;接收第二终端发送的交互办理指令。
在其中一个实施例中,生成模块503,还用于接收第一终端发送的语音通话请求;获取第二终端的业务处理状态;根据语音通话请求的通话类型和第二终端的业务处理状态,在第一终端和第二终端之间建立第一语音会话。
在其中一个实施例中,生成模块503,具体用于若语音通话请求的通话类型为人工类型且第二终端处于空闲状态,则在第一终端和第二终端之间建立第一语音会话。
在其中一个实施例中,生成模块503,具体用于将语音通话请求中的第二语音数据转换为文本数据;通过识别文本数据中的语义标识,确定语音通话请求的通话类型。
上述语音业务导航装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音业务导航方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述语音业务导航方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述语音业务导航方法。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述语音业务导航方法。
需要说明的是,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase ChangeMemory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random AccessMemory,SRAM)或动态随机存取存储器(Dynamic Random AccessMemory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种语音业务导航方法,其特征在于,所述方法包括:
获取第一语音会话中的第一语音通话数据;
识别所述第一语音通话数据的通话内容,并确定所述通话内容对应的目标业务场景信息;
根据预设的功能映射表,确定所述目标业务场景信息对应的功能节点标识,所述功能映射表中包含业务场景信息和功能节点标识之间的映射关系;
响应于交互办理指令,生成所述第一语音会话对应的随路数据包,所述随路数据包中包含有所述功能节点标识;
根据所述随路数据包,生成第二语音会话,以在所述第二语音会话中根据所述功能节点标识为第一终端进行语音业务导航。
2.根据权利要求1所述的方法,其特征在于,所述确定所述通话内容对应的目标业务功能,包括:
将所述通话内容输入知识库模型中,并获取所述知识库模型输出的所述通话内容对应的标准业务问答数据,所述知识库模型用于根据所述通话内容中挖掘出的知识点为所述通话内容匹配所述标准业务问答数据;
根据所述通话内容对应的标准业务问答数据,确定所述语音通话内容对应的目标业务功能。
3.根据权利要求1或2所述的方法,其特征在于,在所述响应于交互办理指令,生成所述第一语音会话对应的随路数据包之前,所述方法还包括:
向第二终端发送业务推荐请求,所述业务推荐请求用于在所述第二终端上显示所述目标业务场景信息并生成所述目标业务场景对应的控件,所述目标业务场景对应的控件用于在触发操作下生成所述交互办理指令;
接收所述第二终端发送的所述交互办理指令。
4.根据权利要求1所述的方法,其特征在于,在所述获取第一语音会话中的第一语音通话数据之前,所述方法还包括:
接收所述第一终端发送的语音通话请求;
获取第二终端的业务处理状态;
根据所述语音通话请求的通话类型和第二终端的业务处理状态,在所述第一终端和所述第二终端之间建立所述第一语音会话。
5.根据权利要求4所述的方法,其特征在于,所述根据所述语音通话请求的通话类型和第二终端的业务处理状态,在所述第一终端和所述第二终端之间建立所述第一语音会话,包括:
若所述语音通话请求的通话类型为人工类型且所述第二终端处于空闲状态,则在所述第一终端和所述第二终端之间建立所述第一语音会话。
6.根据权利要求4所述的方法,其特征在于,在所述接收所述第一终端发送的语音通话请求之后,所述方法还包括:
将所述语音通话请求中的第二语音数据转换为文本数据;
通过识别所述文本数据中的语义标识,确定所述语音通话请求的通话类型。
7.一种语音业务导航装置,其特征在于,所述装置包括:
获取模块,用于获取第一语音会话中的第一语音通话数据;
确定模块,用于识别所述第一语音通话数据的通话内容,并确定所述通话内容对应的目标业务场景信息;根据预设的功能映射表,确定所述目标业务场景信息对应的功能节点标识,所述功能映射表中包含业务场景信息和功能节点标识之间的映射关系;
生成模块,用于响应于交互办理指令,生成所述第一语音会话对应的随路数据包,所述随路数据包中包含有所述功能节点标识;根据所述随路数据包,生成第二语音会话,以在所述第二语音会话中根据所述功能节点标识为第一终端进行语音业务导航。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310797217.9A CN116996619A (zh) | 2023-06-30 | 2023-06-30 | 语音业务导航方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310797217.9A CN116996619A (zh) | 2023-06-30 | 2023-06-30 | 语音业务导航方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116996619A true CN116996619A (zh) | 2023-11-03 |
Family
ID=88522219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310797217.9A Pending CN116996619A (zh) | 2023-06-30 | 2023-06-30 | 语音业务导航方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116996619A (zh) |
-
2023
- 2023-06-30 CN CN202310797217.9A patent/CN116996619A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210112161A1 (en) | System and Method for Omnichannel User Engagement and Response | |
US7647228B2 (en) | Method and apparatus for speech processing incorporating user intent | |
CN108764649B (zh) | 保险销售实时监控方法、装置、设备及存储介质 | |
JP6730994B2 (ja) | 問答情報の処理方法、装置、記憶媒体及び装置 | |
US20170032027A1 (en) | Contact Center Virtual Assistant | |
KR102043365B1 (ko) | 음성 인식 전자 디바이스에서 선택적으로 오프라인으로 실행가능한 음성 액션을 위한 데이터의 로컬 유지 | |
US9542074B2 (en) | Method and apparatus for enhancing an interactive voice response (IVR) system | |
US10402434B1 (en) | Interface between a virtual personal assistant and an interactive voice response system | |
CN112131358A (zh) | 场景流程结构及所应用的智能客服系统 | |
KR20170126667A (ko) | 회의 기록 자동 생성 방법 및 그 장치 | |
DE112022004082T5 (de) | Ermittlung und visuelle Anzeige von Sprachmenüs für Anrufe | |
US20240267463A1 (en) | Transcribing Interactive Voice Response Menu Options To Generate Visualizations During A Call | |
CN111507698A (zh) | 用于转账的处理方法和装置、计算设备及介质 | |
CN113724036B (zh) | 提供问题咨询服务的方法及电子设备 | |
CN113051389B (zh) | 知识推送方法及装置 | |
KR102284912B1 (ko) | 상담 서비스 제공 방법 및 장치 | |
CN116996619A (zh) | 语音业务导航方法、装置、设备及存储介质 | |
CN116016779A (zh) | 语音通话翻译辅助方法、系统、计算机设备和存储介质 | |
CN114339132A (zh) | 视频会议的智能会议纪要方法、装置和计算机设备 | |
CN112133306B (zh) | 一种基于快递用户的应答方法、装置和计算机设备 | |
CN114222028A (zh) | 语音识别方法、装置、计算机设备和存储介质 | |
CN114138943A (zh) | 对话消息生成方法、装置、电子设备及存储介质 | |
CN112632241A (zh) | 智能会话的方法、装置、设备和计算机可读介质 | |
US11722572B2 (en) | Communication platform shifting for voice-enabled device | |
CN115086283B (zh) | 语音流的处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |