CN116233316A - 语音信息处理方法、装置、系统、设备及介质 - Google Patents

语音信息处理方法、装置、系统、设备及介质 Download PDF

Info

Publication number
CN116233316A
CN116233316A CN202310070146.2A CN202310070146A CN116233316A CN 116233316 A CN116233316 A CN 116233316A CN 202310070146 A CN202310070146 A CN 202310070146A CN 116233316 A CN116233316 A CN 116233316A
Authority
CN
China
Prior art keywords
user
voice
voice information
guiding
target operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310070146.2A
Other languages
English (en)
Inventor
罗震震
沈鹏
余文虎
胡尧
周晓波
黄明星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shuidi Technology Group Co ltd
Original Assignee
Beijing Shuidi Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shuidi Technology Group Co ltd filed Critical Beijing Shuidi Technology Group Co ltd
Priority to CN202310070146.2A priority Critical patent/CN116233316A/zh
Publication of CN116233316A publication Critical patent/CN116233316A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/527Centralised call answering arrangements not requiring operator intervention
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B29WORKING OF PLASTICS; WORKING OF SUBSTANCES IN A PLASTIC STATE IN GENERAL
    • B29CSHAPING OR JOINING OF PLASTICS; SHAPING OF MATERIAL IN A PLASTIC STATE, NOT OTHERWISE PROVIDED FOR; AFTER-TREATMENT OF THE SHAPED PRODUCTS, e.g. REPAIRING
    • B29C64/00Additive manufacturing, i.e. manufacturing of three-dimensional [3D] objects by additive deposition, additive agglomeration or additive layering, e.g. by 3D printing, stereolithography or selective laser sintering
    • B29C64/10Processes of additive manufacturing
    • B29C64/106Processes of additive manufacturing using only liquids or viscous materials, e.g. depositing a continuous bead of viscous material
    • B29C64/124Processes of additive manufacturing using only liquids or viscous materials, e.g. depositing a continuous bead of viscous material using layers of liquid which are selectively solidified
    • B29C64/129Processes of additive manufacturing using only liquids or viscous materials, e.g. depositing a continuous bead of viscous material using layers of liquid which are selectively solidified characterised by the energy source therefor, e.g. by global irradiation combined with a mask
    • B29C64/135Processes of additive manufacturing using only liquids or viscous materials, e.g. depositing a continuous bead of viscous material using layers of liquid which are selectively solidified characterised by the energy source therefor, e.g. by global irradiation combined with a mask the energy source being concentrated, e.g. scanning lasers or focused light sources
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B29WORKING OF PLASTICS; WORKING OF SUBSTANCES IN A PLASTIC STATE IN GENERAL
    • B29CSHAPING OR JOINING OF PLASTICS; SHAPING OF MATERIAL IN A PLASTIC STATE, NOT OTHERWISE PROVIDED FOR; AFTER-TREATMENT OF THE SHAPED PRODUCTS, e.g. REPAIRING
    • B29C64/00Additive manufacturing, i.e. manufacturing of three-dimensional [3D] objects by additive deposition, additive agglomeration or additive layering, e.g. by 3D printing, stereolithography or selective laser sintering
    • B29C64/30Auxiliary operations or equipment
    • B29C64/307Handling of material to be used in additive manufacturing
    • B29C64/321Feeding
    • B29C64/336Feeding of two or more materials
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B33ADDITIVE MANUFACTURING TECHNOLOGY
    • B33YADDITIVE MANUFACTURING, i.e. MANUFACTURING OF THREE-DIMENSIONAL [3-D] OBJECTS BY ADDITIVE DEPOSITION, ADDITIVE AGGLOMERATION OR ADDITIVE LAYERING, e.g. BY 3-D PRINTING, STEREOLITHOGRAPHY OR SELECTIVE LASER SINTERING
    • B33Y40/00Auxiliary operations or equipment, e.g. for material handling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Materials Engineering (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Manufacturing & Machinery (AREA)
  • Optics & Photonics (AREA)
  • Mechanical Engineering (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请涉及语音处理技术领域,提出了一种语音信息处理方法、装置、系统、设备及介质,该方法包括:向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;接收用户返回的语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作;响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。通过本申请的技术方案,解决传统方式浪费人力以及无法完成整体流程闭环的问题,最终达到减少对于人工成本的输出以及提升效果转化的目的。

Description

语音信息处理方法、装置、系统、设备及介质
【技术领域】
本申请涉及语音处理技术领域,尤其涉及一种语音信息处理方法、装置、系统、设备及介质。
【背景技术】
目前,对于一些操作,如企业微信推广,下单催付、好评邀请和沉默激活等,需要人工外呼,筛选意向用户,人力的消耗是较大的。
以企业微信推广为例,现有的企业微信添加方式主要是人工外呼电话与用户进行沟通,判断用户是否有意向添加企业微信,如果用户有意向添加企业微信,会通过信息提醒用户信息添加。上述方案存在以下技术问题:
1)人工外呼进行筛选意向用户,在公域用户较广的情况下,人力的消耗是较大的。
2)人工判断用户有意向后开始发起加企业微信的操作,虽然可以实时提醒用户有该信息,但无法完成最终加好友的闭环,用户最终是否同意完全取决于用户是否看到。
3)对于有意向且没有完成加企业微信的用户,这部分优质潜在用户可能会因为未被标记而流失。
【发明内容】
本申请实施例提供了一种语音信息处理方法、装置、系统、设备及介质,旨在解决相关技术中人工外呼消耗较大人力,且无法帮助用户完成闭环操作,可能导致有意向用户流失的问题。
第一方面,本申请实施例提供了一种语音信息处理方法,包括:
向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;
接收用户返回的语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作;
响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。
在一个实施例中,优选地,所述目标操作包括添加企业微信。
在一个实施例中,优选地,响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作,包括:
响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术引导用户确定是否执行添加企业微信的操作;
响应于用户确定执行添加企业微信的操作,发送企业微信添加确认信息至所述用户终端;
接收用户输入的确认添加操作,并确定是否成功添加所述用户的企业微信;
响应于确定未成功添加所述用户的企业微信,通过添加好友引导话术引导用户通过企业微信添加确认信息;
响应于确定用户成功添加企业微信,结束本次通话。
在一个实施例中,优选地,所述方法还包括:
响应于用户确定当前不执行添加企业微信的操作,将所述用户标记为有意向用户。
在一个实施例中,优选地,所述方法还包括:
对所述语音信息进行语音识别,并确定用户意图,得到语音识别结果;
根据所述语音识别结果合成与其对应的引导话术。
在一个实施例中,优选地,所述方法还包括:
通过RPA向用户终端发送电话呼叫请求;
通过语音交互sdk进行语音信息和引导话术的接收和转发;
通过对话机器人确定与所述语音信息匹配的引导话术。
在一个实施例中,优选地,所述方法还包括:
响应于确定用户没有意向完成目标操作,结束本次通话。
第二方面,本申请实施例提供了一种语音信息处理装置,包括:
播放模块,用于向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;
确定模块,用于接收用户返回的语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作;
处理模块,用于响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。
第三方面,提供了一种语音信息处理系统,包括:RPA外呼单元、语音交互单元和机器人对话单元;
所述RPA外呼单元用于向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;
所述语音交互单元用于接收用户返回的语音信息,并将所述语音信息转发至所述机器人对话单元,以及接收所述机器人对话单元返回的与所述语音信息匹配的引导话术,并播放所述引导话术;
所述机器人对话单元用于接收所述语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作,响应于确定用户有意向完成目标操作,返回与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。
第四方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述传染病空间预测方法的步骤。
第五方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述传染病空间预测方法的步骤。
以上语音信息处理方法、装置、系统、设备及介质所实现的方案中,可以向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;接收用户返回的语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作;响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。在本发明中,通过RPA的方式来模拟人进行外呼,通过语音机器人完成人机对话,完全释放人力,通过对于用户意图的捕获,实现用户标签的定位,机器人会在用户表达出意向后添加用户企业微信,同时会验证是否收到用户的同意信息,如果用户在消息发出后没有同意,机器人会通过话术继续引导用户添加,从而解决传统方式浪费人力以及无法完成整体流程闭环的问题,最终达到减少对于人工成本的输出以及提升效果转化的目的。
【附图说明】
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了根据本申请的一个实施例的一种语音信息处理方法的示意流程图。
图2示出了根据本申请的一个实施例的一种语音信息处理方法的具体流程图。
图3示出了根据本申请的一个实施例的一种语音信息处理方法的示意流程图。
图4示出了根据本申请的一个实施例的一种语音信息处理系统的示意框图。
图5示出了根据本申请的一个实施例的计算机设备的框图。
【具体实施方式】
为了更好的理解本申请的技术方案,下面结合附图对本申请实施例进行详细描述。
应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
需要说明的是,本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
请参阅图1,图1示出了根据本申请的一个实施例的一种语音信息处理方法的示意流程图。
如图1所示,根据本申请的一个实施例的语音信息处理方法的流程包括:
步骤S101,向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;
可选的,可以事先获取海量用户的电话联系方式,根据这些用户的电话联系方式进行电话呼叫。
步骤S102,接收用户返回的语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作;
可选的,可以对用户的语音信息进行分析,识别用户说的话,并判断用户意图,根据用户意图合成对应的回答用户的话术。
步骤S103,响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。
在一个实施例中,优选地,所述目标操作包括添加企业微信。目标操作除了添加企业微信外,还可以是下单催付、好评邀请和沉默激活等。
在一个实施例中,优选地,所述方法还包括:
通过RPA向用户终端发送电话呼叫请求;
可以使用RPA代替坐席来操作外呼系统,签入坐席,外呼调用电脑的虚拟声卡来与用户对话.RPA为机器人流程自动化的技术,可以去替代人工做一些重复性的工作,按照程序设计的流程去模拟执行。
通过语音交互sdk进行语音信息和引导话术的接收和转发;
通过语音交互sdk打通了用户跟机器人沟通的通道,本来坐席可以直接跟用户沟通的,使用机器人来替代坐席对话,就需要将虚拟声卡收集的声音通过sdk传输给机器人,sdk一边调用虚拟声卡进行收音,通过sip协议传输给机器人,一边将机器人返回的语音流接收传给虚拟声卡,播放给用户听。
通过对话机器人确定与所述语音信息匹配的引导话术。
机器人由freeswitch网关、voip语音交互引擎、asr语音识别引擎、tts语音合成服务等等组成,主要是作为语音机器人跟用户进行沟通,做一些打标签、引导的操作。freeswitch网关负责接收sdk发送过来的sip协议,将其转化后给到voip交互引擎,voip接收语音流以后调用asr服务识别用户说的话,判断用户意图后调用tts合成对应回答用户的话术,播放给用户,由freeswitch转发语音流通过sip协议的方式给到语音交互sdk.
在本发明中,通过RPA的方式来模拟人进行外呼,通过语音机器人完成人机对话,完全释放人力,通过对于用户意图的捕获,实现用户标签的定位,机器人会在用户表达出意向后添加用户企业微信,同时会验证是否收到用户的同意信息,如果用户在消息发出后没有同意,机器人会通过话术继续引导用户添加,从而解决传统方式浪费人力以及无法完成整体流程闭环的问题,最终达到减少对于人工成本的输出以及提升效果转化的目的。
在一个实施例中,优选地,步骤S103包括:
响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术引导用户确定是否执行添加企业微信的操作;
响应于用户确定执行添加企业微信的操作,发送企业微信添加确认信息至所述用户终端;
接收用户输入的确认添加操作,并确定是否成功添加所述用户的企业微信;
响应于确定未成功添加所述用户的企业微信,通过添加好友引导话术引导用户通过企业微信添加确认信息;
响应于确定用户成功添加企业微信,结束本次通话。
在该实施例中,如果用户有意向进行添加企业微信,则可以不断为用户提供话术引导,从而引导用户一步步完成企业微信的好友添加,实现目标操作的闭环管理,避免造成优质潜在用户的流失。
具体举例来说,以保险推销业务为例,首先通过RPA呼通客户电话,第一轮,可以播放首播话术:“您好请问是XXX先生吗?”;客户回复:“我是,有什么事情吗?”通过意图识别得出客户为肯定意图——是,则机器人返回第二轮引导话术,继续播报机器人话术:“是这样的,添加我们企业微信号可以了解更多关于我们的保险业务,您想要了解一下吗”;用户回复:“好的”。通过意图识别得出用户为肯定意图——同意,则机器人返回引导话术:“接下来为您详细介绍一下……先生,您要现在进行企业微信的添加吗”;客户回复:“好的”,通过意图识别得出客户为肯定意图——是,则机器人可以对应的引导话术:“好的,我已向您发出企业微信好友添加请求,请您点击同意,进行好友添加确认”;客户回复:“好的”,通过意图识别得出客户为肯定意图——同意,则机器人查看是否成功添加用户的企业微信;如果未成功添加,机器人返回引导话术“添加未成功,请再次点击确认”,直到成功添加用户的企业微信之后,机器人可以返回引导话术“已成功添加企业微信,感谢您的接听,再见”,继而结束本次通话。
在一个实施例中,优选地,所述方法还包括:
响应于用户确定当前不执行添加企业微信的操作,将所述用户标记为有意向用户。
在该实施例中,如果用户有意向进行企业微信好友的添加,但是当前不执行添加企业微信的操作,可以将用户标记为有意向用户,从而便于后续继续对该用户进行跟踪提醒等。
具体举例来说,以保险推销业务为例,通过RPA呼通客户电话,首先,可以播放首播话术:“您好请问是XXX先生吗?”;客户回复:“我是,有什么事情吗?”通过意图识别得出客户为肯定意图——是,则机器人返回引导话术,继续播报机器人话术:“是这样的,添加我们企业微信号可以了解更多关于我们的保险业务,您想要了解一下吗”;用户回复:“好的”。通过意图识别得出用户为肯定意图——同意,则机器人返回引导话术:“接下来为您详细介绍一下……先生,您要现在进行企业微信的添加吗”;客户回复:“好的”,通过意图识别得出客户为肯定意图——是,则机器人可以返回对应的引导话术:“好的,我已向您发出企业微信好友添加请求,请您点击同意,进行好友添加确认”;客户回复:“好的”,通过意图识别得出客户为肯定意图——同意,则机器人查看是否成功添加用户的企业微信;如果未成功添加,机器人返回引导话术“添加未成功,请再次点击确认”,直到成功添加用户的企业微信之后,机器人可以返回引导话术“已成功添加企业微信,感谢您的接听,再见”,继而结束本次通话。
而如果用户有意向了解,但是当前不方便进行企业微信添加,则可以对该用户进行标记,将其标记为意向用户,从而方便下次继续跟踪该用户的好友添加进度。
具体举例来说,还是以保险推销业务为例,通过RPA呼通客户电话,第一轮,可以播放首播话术:“您好请问是XXX先生吗?”;客户回复:“我是,有什么事情吗?”通过意图识别得出客户为肯定意图——是,则机器人返回引导话术,继续播报机器人话术:“是这样的,添加我们企业微信号可以了解更多关于我们的保险业务,您想要了解一下吗”;用户回复:“好的”。通过意图识别得出用户为肯定意图——同意,则机器人返回引导话术:“接下来为您详细介绍一下……先生,您要现在进行企业微信的添加吗”;客户回复:“我现在不太方便,可以晚点进行添加”,通过意图识别得出客户为否定意图——否,则机器人可以返回对应的引导话术:“好的,感谢您的接听,晚点我们再进行企业微信好友添加”,挂断电话,并对该用户的联系方式进行标记,比如,添加标记“意向用户”,或者,可以将其联系方式移动至意向客户对应的通讯表中。
在一个实施例中,优选地,所述方法还包括:
对所述语音信息进行语音识别,并确定用户意图,得到语音识别结果;
根据所述语音识别结果合成与其对应的引导话术。
在一个实施例中,优选地,所述方法还包括:
响应于确定用户没有意向完成目标操作,结束本次通话。
在该实施例中,如果用户没有意向完成目标操作,则可以直接在返回对应的话术后,结束本次通话。
具体举例来说,还是以保险推销业务为例,通过RPA呼通客户电话,第一轮,可以播放首播话术:“您好请问是XXX先生吗?”;客户回复:“我是,有什么事情吗?”通过意图识别得出客户为肯定意图——是,则机器人返回引导话术,继续播报机器人话术:“是这样的,添加我们企业微信号可以了解更多关于我们的保险业务,您想要了解一下吗”;用户回复:“不需要”,通过意图识别得出用户为否定意图——不同意,则机器人返回“好的,感谢您的接听,再见”,继而结束本次通话。
如图2所示,在目标操作为添加企业微信时,根据本申请的一个实施例的语音信息处理方法的流程包括:
步骤S201,通过RPA向用户终端发送电话呼叫请求;
步骤S202,机器人判断用户是否有意向,当判断有意向时进入步骤S204,否则,挂断电话。
步骤S203,机器人判断是否添加企业微信,当判断结果为是时,进入步骤S205,否则,进入步骤S209。
步骤S204,话术引导,介绍产品后引导用户进行添加企业微信;
步骤S205,机器人判断添加用户企业微信,则向用户发送添加企业微信好友请求,用户通过RPA点击同意添加企业微信;
步骤S206,机器人判断是否成为好友;
步骤S207,当判断已成为好友,挂断电话;
步骤S208,机器人话术引导用户通过好友添加。
步骤S209,当机器人判断用户当前不同意添加企业微信,则标记用户为有意向用户。
图3示出了根据本申请的一个实施例的一种语音信息处理装置的示意框图。
如图3所示,第二方面,本申请实施例提供了一种语音信息处理装置,包括:
播放模块31,用于向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;
确定模块32,用于接收用户返回的语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作;
处理模块33,用于响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。
图4示出了根据本申请的一个实施例的一种语音信息处理系统的示意框图。
如图4所示,提供了一种语音信息处理系统,包括:RPA外呼单元41、语音交互单元42和机器人对话单元43;
所述RPA外呼单元41用于向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;RPA外呼单元41代替坐席来操作外呼系统,签入坐席,外呼调用电脑的虚拟声卡来与用户对话.RPA为机器人流程自动化的技术,可以去替代人工做一些重复性的工作,按照程序设计的流程去模拟执行。
所述语音交互单元42用于接收用户返回的语音信息,并将所述语音信息转发至所述机器人对话单元,以及接收所述机器人对话单元返回的与所述语音信息匹配的引导话术,并播放所述引导话术;语音交互单元42通过语音交互sdk打通了用户跟机器人沟通的通道,本来坐席可以直接跟用户沟通的,使用机器人来替代坐席对话,就需要将虚拟声卡收集的声音通过sdk传输给机器人,sdk一边调用虚拟声卡进行收音,通过sip协议传输给机器人,一边将机器人返回的语音流接收传给虚拟声卡,播放给用户听。
所述机器人对话单元43用于接收所述语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作,响应于确定用户有意向完成目标操作,返回与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。
机器人对话单元机器人由freeswitch网关、voip语音交互引擎、asr语音识别引擎、tts语音合成服务等等组成,主要是作为语音机器人跟用户进行沟通,做一些打标签、引导的操作。freeswitch网关负责接收sdk发送过来的sip协议,将其转化后给到voip交互引擎,voip接收语音流以后调用asr服务识别用户说的话,判断用户意图后调用tts合成对应回答用户的话术,播放给用户,由freeswitch转发语音流通过sip协议的方式给到语音交互sdk.
第四方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。
第五方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述装置和各模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
上述装置可以实现为一种计算机程序的形式,该计算机程序可以在如图5所示的计算机设备上运行。
图5示出了根据本申请的一个实施例的计算机设备的框图。
参阅图5,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括存储介质和内存储器。
存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行本申请实施例提供的任意一种方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种方法。所述存储介质可以是非易失性的,也可以是易失性的。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本申请实施例的计算机设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
另外,本申请实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行以下步骤:
向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;
接收用户返回的语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作;
响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。
在一个实施例中,优选地,所述目标操作包括添加企业微信。
在一个实施例中,优选地,响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作,包括:
响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术引导用户确定是否执行添加企业微信的操作;
响应于用户确定执行添加企业微信的操作,发送企业微信添加确认信息至所述用户终端;
接收用户输入的确认添加操作,并确定是否成功添加所述用户的企业微信;
响应于确定未成功添加所述用户的企业微信,通过添加好友引导话术引导用户通过企业微信添加确认信息;
响应于确定用户成功添加企业微信,结束本次通话。
在一个实施例中,优选地,所述方法还包括:
响应于用户确定当前不执行添加企业微信的操作,将所述用户标记为有意向用户。
在一个实施例中,优选地,所述方法还包括:
对所述语音信息进行语音识别,并确定用户意图,得到语音识别结果;
根据所述语音识别结果合成与其对应的引导话术。
在一个实施例中,优选地,所述方法还包括:
通过RPA向用户终端发送电话呼叫请求;
通过语音交互sdk进行语音信息和引导话术的接收和转发;
通过对话机器人确定与所述语音信息匹配的引导话术。
在一个实施例中,优选地,所述方法还包括:
响应于确定用户没有意向完成目标操作,结束本次通话。
需要说明的是,上述关于计算机可读存储介质或电子设备所能实现的功能或步骤,可对应参阅前述方法实施例中的相关描述,为避免重复,这里不再一一描述。
以上结合附图详细说明了本申请的技术方案,通过本申请的技术方案,可将灰度发布的相关操作集成于发布系统中,开发人员仅需要在发布系统中进行集成设置即可使发布系统调用部署系统为灰度发布进行相应部署,降低了灰度发布部署工作的复杂度,提升了灰度发布的效率和可靠性。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本申请实施例中可能采用术语第一、第二等来描述设置单元,但这些设置单元不应限于这些术语。这些术语仅用来将设置单元彼此区分开。例如,在不脱离本申请实施例范围的情况下,第一设置单元也可以被称为第二设置单元,类似地,第二设置单元也可以被称为第一设置单元。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种语音信息处理方法,其特征在于,包括:
向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;
接收用户返回的语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作;
响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。
2.根据权利要求1所述的语音信息处理方法,其特征在于,所述目标操作包括添加企业微信。
3.根据权利要求2所述的语音信息处理方法,其特征在于,响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作,包括:
响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术引导用户确定是否执行添加企业微信的操作;
响应于用户确定执行添加企业微信的操作,发送企业微信添加确认信息至所述用户终端;
接收用户输入的确认添加操作,并确定是否成功添加所述用户的企业微信;
响应于确定未成功添加所述用户的企业微信,通过添加好友引导话术引导用户通过企业微信添加确认信息;
响应于确定用户成功添加企业微信,结束本次通话。
4.根据权利要求3所述的语音信息处理方法,其特征在于,所述方法还包括:
响应于用户确定当前不执行添加企业微信的操作,将所述用户标记为有意向用户。
5.根据权利要求1所述的语音信息处理方法,其特征在于,所述方法还包括:
对所述语音信息进行语音识别,并确定用户意图,得到语音识别结果;
根据所述语音识别结果合成与其对应的引导话术。
6.根据权利要求1所述的语音信息处理方法,其特征在于,所述方法还包括:
通过RPA向用户终端发送电话呼叫请求;
通过语音交互sdk进行语音信息和引导话术的接收和转发;
通过对话机器人确定与所述语音信息匹配的引导话术。
7.一种语音信息处理装置,其特征在于,包括:
播放模块,用于向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;
确定模块,用于接收用户返回的语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作;
处理模块,用于响应于确定用户有意向完成目标操作,通过与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。
8.一种语音信息处理系统,其特征在于,包括:RPA外呼单元、语音交互单元和机器人对话单元;
所述RPA外呼单元用于向用户终端发送电话呼叫请求,并在电话接通后播放预设语音;
所述语音交互单元用于接收用户返回的语音信息,并将所述语音信息转发至所述机器人对话单元,以及接收所述机器人对话单元返回的与所述语音信息匹配的引导话术,并播放所述引导话术;
所述机器人对话单元用于接收所述语音信息,并根据所述语音信息确定所述用户是否有意向完成目标操作,响应于确定用户有意向完成目标操作,返回与所述语音信息匹配的引导话术对所述用户进行操作引导,直至确定所述用户完成目标操作。
9.一种计算机设备,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述权利要求1至6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1至6中任一项所述的方法流程。
CN202310070146.2A 2023-01-12 2023-01-12 语音信息处理方法、装置、系统、设备及介质 Pending CN116233316A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310070146.2A CN116233316A (zh) 2023-01-12 2023-01-12 语音信息处理方法、装置、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310070146.2A CN116233316A (zh) 2023-01-12 2023-01-12 语音信息处理方法、装置、系统、设备及介质

Publications (1)

Publication Number Publication Date
CN116233316A true CN116233316A (zh) 2023-06-06

Family

ID=86586674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310070146.2A Pending CN116233316A (zh) 2023-01-12 2023-01-12 语音信息处理方法、装置、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN116233316A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116545977A (zh) * 2023-06-06 2023-08-04 北京联客触点智能科技有限公司 一种基于企微定制化rpa操作交互方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116545977A (zh) * 2023-06-06 2023-08-04 北京联客触点智能科技有限公司 一种基于企微定制化rpa操作交互方法
CN116545977B (zh) * 2023-06-06 2024-03-12 北京联客触点智能科技有限公司 一种基于企微定制化rpa操作交互方法

Similar Documents

Publication Publication Date Title
KR102233343B1 (ko) 선택적으로 조종 가능한 상태 머신을 갖는 개인 보조 모듈 제공
US20120259633A1 (en) Audio-interactive message exchange
US8515025B1 (en) Conference call voice-to-name matching
CN110392913A (zh) 在共用的启用语音的装置上处理呼叫
US8942479B2 (en) Method and apparatus for pictorial identification of a communication event
US20120163677A1 (en) Automatic identifying
CN107995370B (zh) 通话控制方法、装置及存储介质和移动终端
US20220334795A1 (en) System and method for providing a response to a user query using a visual assistant
CN112185388B (zh) 语音识别方法、装置、设备及计算机可读存储介质
CN110708431A (zh) 一种通话管理方法、通信终端及存储介质
CN116233316A (zh) 语音信息处理方法、装置、系统、设备及介质
CN112445906A (zh) 一种生成回复消息的方法及装置
US20110082695A1 (en) Methods, electronic devices, and computer program products for generating an indicium that represents a prevailing mood associated with a phone call
CN112153223B (zh) 一种语音助手识别并执行被叫用户指令的方法及语音助手
CN110865789A (zh) 基于语音识别的智能开启麦克风的方法及系统
CN115840841A (zh) 多模态对话方法、装置、设备及存储介质
CN116016779A (zh) 语音通话翻译辅助方法、系统、计算机设备和存储介质
CN107277284A (zh) 基于VoLTE的语音通话方法和系统、存储装置
CN111768772A (zh) 虚拟物品转移方法、装置、设备和可读存储介质
CN112988998A (zh) 应答方法及设备
CN111935348A (zh) 提供通话处理服务的方法和装置
US20190333517A1 (en) Transcription of communications
KR102559488B1 (ko) 범죄 예방 서비스 방법 및 시스템
CN111726283B (zh) 用于车载智能音箱的微信接收方法和装置
US11830120B2 (en) Speech image providing method and computing device for performing the same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination