CN114598773B - 一种智能应答系统及方法 - Google Patents
一种智能应答系统及方法 Download PDFInfo
- Publication number
- CN114598773B CN114598773B CN202011395506.9A CN202011395506A CN114598773B CN 114598773 B CN114598773 B CN 114598773B CN 202011395506 A CN202011395506 A CN 202011395506A CN 114598773 B CN114598773 B CN 114598773B
- Authority
- CN
- China
- Prior art keywords
- response
- service
- intelligent
- target
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42025—Calling or Called party identification service
- H04M3/42034—Calling party identification service
- H04M3/42059—Making use of the calling party identifier
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42212—Call pickup
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/436—Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请提供一种智能应答系统及方法。系统包括:智能应答中台和接入智能应答中台的多个智能应答接入平台,智能应答中台包括:前置机、业务处理模块、服务分流模块;前置机在接收到主叫方的话务时,从业务处理模块获取业务信息并将主叫方的语音流和业务信息封装后发送给服务分流模块,业务信息包括主叫方的历史应答特征和/或被叫方预设的应答服务配置,应答服务配置用于表征被叫方所需的应答服务特征;服务分流模块选出与业务信息相匹配的目标智能应答接入平台,并将语音流分发给目标智能应答接入平台进行应答处理。由此可知,本申请通过增加接入多个智能应答接入平台的智能应答中台,可实现不同应答场景下定制化配置智能应答产品。
Description
技术领域
本文件涉及计算机技术领域,尤其涉及一种智能应答系统及方法。
背景技术
智能应答是指业务是针对消费者不便通话时的语音/短信增值业务。
随着社会经济的快速发展,广告、金融、营销等陌生电话或骚扰电话越来越多,人们越来越害怕接听电话,一方面担心接听到骚扰电话,比如一些播放广告的外呼电话,也害怕接到营销电话,如房产、保险电话等,碍于礼貌原因未直接挂断电话,听着营销人员的滔滔不绝的产品介绍,浪费宝贵时间。人们如果拒接陌生电话,又担心害怕错过重要信息,比如工作面试邀约、客户邀约、银行通知、快递通知等等。因此人们开始使用骚扰电话拦截、智能应答类软件来管理陌生电话,帮助代接电话,与来电者进行语音交互,并获取来电目的,不用担心接听骚扰电话也不会错过重要信息。
因此,需要提供一种有效的智能应答方案。
发明内容
本说明书实施例提供一种智能应答系统及方法,用以在满足用户个性化地应答需求的同时,提高智能应答平台的复用度。
本说明书实施例还提供一种智能应答系统,包括:智能应答中台和接入所述智能应答中台的多个智能应答接入平台,所述智能应答中台包括:前置机、业务处理模块、服务分流模块,其中:
所述前置机,用于接收到主叫方的话务时,从所述业务处理模块获取业务信息并将所述主叫方的语音流和所述业务信息进行封装之后发送给所述服务分流模块,所述业务信息包括所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,所述应答服务配置用于表征所述被叫方所需的应答服务特征;
所述服务分流模块,用于从所述多个智能应答接入平台中选出与所述业务信息相匹配的目标智能应答接入平台,并将所述语音流分发给目标智能应答接入平台;
所述目标智能应答接入平台,用于生成所述语音流的应答语音并通过所述前置机提供给所述主叫方。
本说明书实施例还提供一种智能应答方法,应用上述的系统,包括:
接收到主叫方的话务时,获取业务信息,所述业务信息包括所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,所述应答服务配置用于表征所述被叫方所需的应答服务特征;
从多个智能应答接入平台中选出与所述业务信息相匹配的目标智能应答接入平台,并将所述语音流分发给目标智能应答接入平台,由所述目标智能应答接入平台生成所述语音流的应答语音并通过前置机提供给所述主叫方。
本说明书的上述任一实施例,通过增加接入多个智能应答接入平台的智能应答中台,实现了根据不同应答场景下,可快速定制化配置智能应答产品;在通话场景下,面向不同的用户类型,如C端代接、B端代接等,需要开发应对不同场景的智能应答产品,在经过中台能力抽取后,只需要适当修改话术配置,即可在已有平台基础上实现产品的快速开发。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书一实施例提供的一种智能应答系统的应用场景示意图;
图2为本说明书一实施例提供的一种智能应答系统的结构示意图;
图3为本说明书一实施例提供的智能应答中台的结构示意图;
图4为本说明书一实施例提供的一种智能应答方法的流程示意图;
图5为本说明书另一实施例提供的一种智能应答方法的流程示意图;
图6为本说明书一实施例提供的智能应答技术中台的业务处理流程图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文件保护的范围。
图1为本说明书一实施例提供的一种智能应答系统的应用场景示意图,参见图1,在本场景中:
主叫方给被叫方拨打电话,若被叫方未接入或者无法接入,则转入智能应答代接;智能应答中台先获取被叫方预先通过使用智能应答终端设置的自己想要使用的配置文件,并同步到智能应答综合业务平台,智能应答综合业务平台将会根据用户选择,更新用户当前的服务设置状态;智能应答中台记录主叫方传输的主叫方语音,并根据用户设置,从多个智能应答接入平台中选择合适的产品服务为被叫方代接电话,生成应答语音,以与主叫方进行语音交互,并将获取的来电信息推送给用户。
其中,主叫方是指在电信网中发起呼叫的用户,被叫方是指在电信网中被呼叫的用户;智能应答终端是指可接入智能应答系统的客户端,如小程序、H5页面等。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图2为本说明书一实施例提供的一种智能应答系统的结构示意图,参见图2,所述系统包括智能应答中台和接入所述智能应答中台的多个智能应答接入平台,所述智能应答中台包括:前置机、业务处理模块、服务分流模块,其中:
所述前置机,用于接收到主叫方的话务时,从所述业务处理模块获取业务信息并将所述主叫方的语音流和所述业务信息进行封装之后发送给所述服务分流模块,所述业务信息包括所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,所述应答服务配置用于表征所述被叫方所需的应答服务特征;
所述服务分流模块,用于从所述多个智能应答接入平台中选出与所述业务信息相匹配的目标智能应答接入平台,并将所述语音流分发给目标智能应答接入平台;
所述目标智能应答接入平台,用于生成所述语音流的应答语音并通过所述前置机提供给所述主叫方。
可选的,所述业务处理模块,具体用于:
解析所述话务对应的主叫方和被叫方的用户信息;
基于所述主叫方和被叫方的用户信息,获取所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,所述历史应答特征为通过分析所述主叫方的历史应答数据预先获得的。
可选的,所述服务分流模块包括:MRCP模块和分发控制组件,其中:
所述MRCP模块,用于将所述主叫方的语音流和所述业务信息转发至所述分发控制组件;
所述分发控制组件,用于依据预设的业务信息与各智能应答接入平台的智能应答引擎之间的对应关系,确定处理所述语音流的最佳引擎处理路径,所述最佳引擎处理路径用于表征参与处理的目标智能应答引擎及其处理流程;若所述目标智能应答引擎为多个,则将所述语音流和其他目标智能应答引擎的路径分发至第一流程节点的目标智能应答引擎,由各目标智能应答引擎按照所述最佳引擎处理路径处理所述语音流。
可选的,智能应答引擎包括:ASR组件、NLP组件和TTS组件;
所述分发控制组件,具体用于依据预设的业务信息与智能应答引擎组件之间的对应关系,确定处理所述语音流的最佳组件处理路径,所述最佳组件处理路径用于表征参与处理所述语音流的目标ASR组件、目标NLP组件和目标TTS组件及其处理流程;依据所述最佳组件处理路径,将所述语音流以及目标NLP组件和目标TTS组件的路径分发至目标ASR组件;
所述目标ASR组件,用于将所述语音流转换为文本信息并依据所述最佳组件处理路径将文本信息发送至所述目标NLP组件;
所述目标NLP组件,用于构建上述文本信息的应答文本信息并依据所述最佳组件处理路径将应答文本信息发送至所述目标TTS组件;
所述目标TTS组件用于将所述应答文本信息转换为语音流并提供给前置机。
下面对ASR组件、NLP组件和TTS组件的工作原理分别进行详细说明:
语音识别组件(Automatic Speech Recognition,ASR):就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。
语音识别提供关键字语音识别和连续语音识别,具备前端语音处理和后端识别处理,支持端点检测、噪音消除、智能打断、后端语音识别等功能,即在电话交互的过程中,可以识别用户开始说话、话语间的停顿、说话结束等,以及在平台播音的过程中,用户可以打断平台播音等。并把用户说的任意语音转换成对应的文字信息,在电话交互过程中,将用户的语音进行实时转写成文本内容。
从文本到语音组件(Text to Speech,TTS)技术能够自动将任意文字实时转换为连续的自然语音,是一种能够在任何时间、任何地点,向任何人提供语音信息服务的高效便捷手段,非常符合信息时代海量数据、动态更新和个性化查询的需求。
在智能应答产品中,使用智能应答系统自有的TTS引擎进行音频合成,在合成的过程中,可对用户音频进行调优,比如
a)、用户声音风格调优。可以对用户声音风格进行调整,比如严肃的、幽默的、轻快的、低沉的等等,
b)、说话语调调优。根据文本语句特点调整说话的语调,如陈述语句、疑问句等;
c)、语速调优。根据话术文本的长度,调整语速。
智能NLP服务是智能应答会话的大脑,它是智能应答的核心基础。NLP(NaturalLanguage Processing)是人工智能(AI)的一个子领域。智能NLP服务提供轻量级、方便易用HTTP协议开发接口,基于该接口可以便捷调用相关资源,快速完成各种智能语音交互的开发工作以实现智能来电助手业务。
NLP应用的技术及算法:
a)、文本分类,语义相似度,实体识别,词槽提取;
b、实体消歧,词义消歧;
c)、句法分析,词性标注,角色标注;
智能NLP特点:
a)、引入语义理解平台进行语料前置解析,再到业务语料处理平台进行二次解析;
b)、拥有大量通用实体和辅助词资源,帮助机器进行分词、词法、语法分析,可快速扩展多种应用场景,同时支持运营自建技能和实体。
该智能应答系统中使用的智能NLP模块,能够预先配置场景、意图的相关语料,根据来电者的对话文本,进行语义理解,识别用户对话的意图,并将意图提交给平台业务软件进行处理。
可选的,所述分发控制组件,具体用于:
依据所述最佳组件处理路径,通过私有协议建立连接并将所述语音流以及目标NLP组件和目标TTS组件的路径分发至目标ASR组件。
可选的,所述历史应答特征包括:语言类型,所述语言类型为通过分析所述主叫方的历史应答数据获得的;
其中,所述目标ASR组件为所述多个智能应答接入平台中对所述语言类型的识别率最高的ASR组件。
可选的,所述被叫方所需的应答服务特征包括:应答语言类型;
其中,所述目标ASR组件为所述多个智能应答接入平台中对所述语言类型的识别率最高的ASR组件。
可选的,所述被叫方所需的应答服务特征包括:话术类型;
其中,所述目标NLP组件为所述多个智能应答接入平台中提供所述话术类型的智能语音交互服务的NLP组件。
可选的,所述被叫方所需的应答服务特征还包括:音频特征;
其中,所述目标TTS组件为所述多个智能应答接入平台中提供所述音频特征的语音流的TTS组件。
可选的,智能应答系统可以根据用户设置的智能应答服务类型,由智能应答技术中台与特定的智能应答引擎建立连接,播放被叫用户设置的开场白,询问来电目的,对主叫的回应进行录音、语音转文字处理、判断来电场景、识别来电意图等,实现与来电者进行交互,总体控制通话过程与挂断。
下面结合图2,对智能应答接入平台和智能应答技术中台的系统架构进行详细说明:
智能应答接入平台,包括:
业务后台:主要是智能应答接入平台中管理话术配置、存储用户信息等功能的后台服务;
业务交互接口:主要是与智能应答技术中台产生信息交互的接口,主要包括应答信息交互接口、用户信息接口以及其他业务接口;
用户前端:主要是用户使用智能应答服务与接收来电消息记录的前端应用界面,包括小程序、H5、短信、公众号等;
能力引擎:主要是智能应答接入平台提供的支持智能应答流程的核心能力模块,包括ASR、TTS、NLP等能力模块。
智能应答技术中台(智能应答中台),包括:
业务逻辑处理模块:主要是处理平台运行逻辑,将平台各个模块的使用串联起来,保证业务平台的正常运行,主要包括用户信息处理、业务数据处理、方言类型识别、触点推送等处理模块;
IVR对话流程:主要负责语音播报资源、流程管理与话务接入运营商网络;
服务分流模块:由分发控制组件、MRCP Server组成。
进一步地,参见图3示出的智能应答中台的结构示意图,下面对智能应答中台的技术架构进行说明:
智能应答技术中台的技术架构,包括:
资源层:主要是智能应答产品所使用到的底层资源与技术能力,主要包括数据库集群、短信资源、文件存储集群等;
服务层:主要是产品提供服务所包含的服务类型,主要有用户服务、短信服务、消息服务等;
逻辑层:主要是智能应答流程中的所涉及需处理的逻辑模块,包括IVR流程逻辑、分发控制逻辑、业务处理逻辑等。
接入层:主要是开发接入层面的模块,主要有RMI Server、SMSGW、MRCP Server等;
前端应用:主要是用户层面接触使用智能应答产品的方式,包括IVR、短信等。
综上所述,本实施例通过增加接入多个智能应答接入平台的智能应答中台,实现了根据不同应答场景下,可快速定制化配置智能应答产品;在通话场景下,面向不同的用户类型,如C端代接、B端代接等,需要开发应对不同场景的智能应答产品,在经过中台能力抽取后,只需要适当修改话术配置,即可在已有平台基础上实现产品的快速开发。
图4为本说明书一实施例提供的一种智能应答方法的流程示意图,参见图4,所述方法可由图1中的智能应答中台执行,具体可以包括如下步骤:
步骤402、接收到主叫方的话务时,获取业务信息,所述业务信息包括所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,所述应答服务配置用于表征所述被叫方所需的应答服务特征;
步骤404、从多个智能应答接入平台中选出与所述业务信息相匹配的目标智能应答接入平台,并将所述语音流分发给目标智能应答接入平台,由所述目标智能应答接入平台生成所述语音流的应答语音并通过前置机提供给所述主叫方。
可选的,方法还包括:
解析所述话务对应的主叫方和被叫方的用户信息;
基于所述主叫方和被叫方的用户信息,获取所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,所述历史应答特征为通过分析所述主叫方的历史应答数据预先获得的。
可选的,步骤404具体可以包括:
依据预设的业务信息与各智能应答接入平台的智能应答引擎之间的对应关系,确定处理所述语音流的最佳引擎处理路径,所述最佳引擎处理路径用于表征参与处理的目标智能应答引擎及其处理流程;若所述目标智能应答引擎为多个,则将所述语音流和其他目标智能应答引擎的路径分发至第一流程节点的目标智能应答引擎,由各目标智能应答引擎按照所述最佳引擎处理路径处理所述语音流。
可选的,智能应答引擎包括:ASR组件、NLP组件和TTS组件;
则步骤404具体可以包括:
依据预设的业务信息与智能应答引擎组件之间的对应关系,确定处理所述语音流的最佳组件处理路径,所述最佳组件处理路径用于表征参与处理所述语音流的目标ASR组件、目标NLP组件和目标TTS组件及其处理流程;依据所述最佳组件处理路径,将所述语音流以及目标NLP组件和目标TTS组件的路径分发至目标ASR组件;
其中,所述目标ASR组件,用于将所述语音流转换为文本信息并依据所述最佳组件处理路径将文本信息发送至所述目标NLP组件;所述目标NLP组件,用于构建上述文本信息的应答文本信息并依据所述最佳组件处理路径将应答文本信息发送至所述目标TTS组件;所述目标TTS组件用于将所述应答文本信息转换为语音流并提供给前置机。
可选的,步骤404具体可以包括:
依据所述最佳组件处理路径,通过私有协议建立连接并将所述语音流以及目标NLP组件和目标TTS组件的路径分发至目标ASR组件。
可选的,所述历史应答特征包括:语言类型,所述语言类型为通过分析所述主叫方的历史应答数据获得的;
其中,所述目标ASR组件为所述多个智能应答接入平台中对所述语言类型的识别率最高的ASR组件。
可选的,所述被叫方所需的应答服务特征包括:应答语言类型;
其中,所述目标ASR组件为所述多个智能应答接入平台中对所述语言类型的识别率最高的ASR组件。
可选的,所述被叫方所需的应答服务特征包括:话术类型;
其中,所述目标NLP组件为所述多个智能应答接入平台中提供所述话术类型的智能语音交互服务的NLP组件。
可选的,所述被叫方所需的应答服务特征还包括:音频特征;
其中,所述目标TTS组件为所述多个智能应答接入平台中提供所述音频特征的语音流的TTS组件。
综上所述,本实施例通过增加接入多个智能应答接入平台的智能应答中台,实现了根据不同应答场景下,可快速定制化配置智能应答产品;在通话场景下,面向不同的用户类型,如C端代接、B端代接等,需要开发应对不同场景的智能应答产品,在经过中台能力抽取后,只需要适当修改话术配置,即可在已有平台基础上实现产品的快速开发。
图5为本说明书另一实施例提供的一种智能应答方法的流程示意图,所述方法可由图2中的智能应答系统执行,参见图5,所述方法具体可以包括如下步骤:
步骤502、接收到主叫方的呼叫转移时,获取所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,所述应答服务配置用于表征所述被叫方所需的应答服务特征;
步骤504、基于所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,从多种智能应答产品服务中选出相匹配的目标智能应答产品服务;其中,各种智能应答产品服务的应答服务特征不同且各种智能应答产品服务分别由接入智能应答平台的一个或多个智能应答引擎支持;
步骤506、基于所述目标智能应答产品服务,与所述主叫方进行通信交互。
可选的,所述历史应答特征包括:语言类型,所述语言类型为通过分析所述主叫方的历史应答数据获得的;
其中,所述步骤504,包括:
确定第一智能应答引擎,在所述多个智能应答引擎中所述第一智能应答引擎对所述语言类型的识别率最高;
基于所述第一智能应答引擎,从多种智能应答产品服务中选出相匹配的目标智能应答产品服务。
可选的,所述被叫方所需的应答服务特征包括:应答语言类型;
其中,所述步骤504,包括:
确定第一智能应答引擎,在所述多个智能应答引擎中所述第一智能应答引擎对所述应答语言类型的识别率最高;
基于所述第一智能应答引擎,从多种智能应答产品服务中选出相匹配的目标智能应答产品服务。
可选的,所述被叫方所需的应答服务特征包括:应答语言类型和话术类型;
其中,所述步骤504,包括:
确定第一智能应答引擎,在所述多个智能应答引擎中所述第一智能应答引擎对所述应答语言类型的识别率最高;
确定第二智能应答引擎,所述第二智能应答引擎用于提供所述话术类型的智能语音交互服务;
基于所述第一智能应答引擎和所述第二智能应答引擎,从多种智能应答产品服务中选出相匹配的目标智能应答产品服务。
可选的,所述被叫方所需的应答服务特征包括:应答语言类型、话术类型和音频特征;
其中,所述步骤504,包括:
确定第一智能应答引擎,在所述多个智能应答引擎中所述第一智能应答引擎对所述应答语言类型的识别率最高;
确定第二智能应答引擎,所述第二智能应答引擎用于提供所述话术类型的人机交互服务;
确定第三智能应答引擎,所述第三智能应答引擎用于提供所述音频特征的用户音频;
基于所述第一智能应答引擎、所述第二智能应答引擎和所述第三智能应答引擎,从多种智能应答产品服务中选出相匹配的目标智能应答产品服务。
可选的,所述多个智能应答引擎均包括:第一组件、第二组件和第三组件,所述第一组件用于将所述主叫方的音频流转换为文本,所述第二组件用于生成应答文件,所述第三组件用于将应答文件转换为音频文件;
其中,所述步骤504,包括:
基于所述第一智能应答引擎的第一组件、所述第二智能应答引擎的第二组件和所述第三智能应答引擎的第三组件,从多种智能应答产品服务中选出相匹配的目标智能应答产品服务。
可选的,所述步骤506,包括:
基于所述目标智能应答产品服务,将所述主叫方的语音流、所述第二智能应答引擎的第二组件和所述第三智能应答引擎的第三组件的路径,分发给所述第一智能应答引擎的第一组件;
由所述第一智能应答引擎的第一组件将所述语音流转换为文本并提供给所述第二智能应答引擎的第二组件;
由第二智能应答引擎的第二组件生成所述文本的应答文件并提供给所述第三智能应答引擎的第三组件;
由所述第三智能应答引擎的第三组件将所述应答文件转换为音频文件,并提供给主叫方。
综上所述,本实施例通过增加接入多个智能应答接入平台的智能应答中台,实现了根据不同应答场景下,可快速定制化配置智能应答产品;在通话场景下,面向不同的用户类型,如C端代接、B端代接等,需要开发应对不同场景的智能应答产品,在经过中台能力抽取后,只需要适当修改话术配置,即可在已有平台基础上实现产品的快速开发。
下面结合图6对图4和图5对应的方法实施例的实现原理进行详细说明:
在进入电话智能应答业务前,需要完成用户智能应答服务选择设置。用户需通过智能应答系统提供的终端小程序、H5页面,切换选择所有可用的智能应答服务,或在智能应答接入平台提供的小程序、H5页面中单独设置开启。统一平台的设置信息,将由平台保存更改记录和状态;用户通过智能应答引擎接入方前端产品的业务设置信息,也将同步至平台。
步骤1:用户话务接入前置机,传输到业务逻辑处理模块,业务逻辑处理模块根据用户信息获取业务信息,发送至前置机。
在用户的电话未接通时,成功设置开通了智能应答服务的用户的话务将首先接入前置机。进入智能应答流程后,技术中台的业务逻辑处理模块将获取用户信息、用户权限、主叫方言类型等业务信息,并对用户信息、用户权限进行校验,得到该用户是否可正常使用智能应答服务的结果。若校验通过后,将通过技术中台的IVR流程控制技术,开始首句放音;
其中,前置机是用户IVR接入方式的智能IP-PBX设备,采用IP方式的话路接入。前置机话路与信令接入采用IP方式与移动核心网络CS域的CE设备链接。前置机的后端话路控制、录放音等网络汇聚接入系统平台的骨干核心网络。在智能应答系统代接电话过程中,语音播报资源将平台合成的音频文件进行播放,实现对话交互过程。
业务逻辑处理模块是智能应答系统的指挥中心,主要是处理平台运行逻辑,将平台各个模块的使用串联起来,保证业务平台的正常运行,其包含用户信息处理、业务数据收集、业务数据推送、方言类型识别等功能。
其中,用户信息处理的具体过程为:获取主叫用户号码、被叫用户号码、用户服务开关状态、用户个性化设置等信息,经过校验处理,判断用户放音权限并决定具体的放音流程,并对以上信息进行封装。方言类型识别可以为:通过识别用户每次通话所使用的方言类型,作为历史方言记录进行保存。通话接入时,通过分析用户历史方言数据,判断其使用的方言类别。
步骤2:前置机将语音流和业务信息进行封装,发送至MRCP Server,MRCP Server将语音流和业务信息传输给分发控制组件;
进入对话流程,主叫说话内容将被录制,形成语音流;前置机的IVR流程将语音流和业务信息进行封装,发送至MRCP Server。其中,业务信息中包含用户当前选中的智能应答服务类型、会话ID,以及根据主叫历史数据分析记录得出的主叫方言类型等必要信息;
MRCP(Media Resource Control Protocol),媒体资源控制协议,是一种计算机网络应用层的通讯协议,用于语音服务器向客户端提供各种语音服务。MRCP设计目的是支持客户端对服务器端发起一个请求,设定一个在网络中部署的媒体资源。MRCP的主要目的在于语音处理资源的处理,这些语音处理资源包括:语音识别,语音合成,语音录音和讲话人的认证和确认。
步骤3:分发控制组件基于业务信息,根据预存的业务信息与各引擎组件的对应关系,确定分发的引擎处理路径;
由于MRCP协议无法进行分发,因此,本提案在步骤3中加入分发控制组件的机制,采用私有协议进行数据传输,实现同一流程接入多个引擎的能力。
具体的,分发控制组件接收业务信息,根据业务信息确定各步骤最优组件,如ASR1-NLP3-TTS1,其中涉及引擎1和引擎3,分发控制组件将根据各引擎与路径之间的映射关系,与引擎1采用私有协议建立连接并进行数据传输,将用户语音流以及NLP、TTS引擎的路径信息分发至引擎1的ASR1,ASR1处理后,引擎管理模块根据分发控制组件提供的路径信息,将转写文本信息发送至引擎3的NLP3,NLP3处理后,再根据收到的路径信息,将应答文本发送至引擎1的TTS1。
在一个例子中,在提供接入的多个不同引擎中多个ASR组件时,其对各类型的方言识别效果不一。本智能应答系统将根据各ASR组件对不同方言的识别率为判断基准,利用分发控制组件预设主叫方言类型与ASR组件所属引擎的目标地址的映射关系,在本次智能应答流程中使用识别效果最佳的引擎中的ASR组件进行语音文字转写。
可以理解,分发控制模块,一方面可以接收语音流与业务信息,同时也可以通过与多方智能应答引擎实现连接,向其传输语音流与业务信息,用于控制它们的整体流向,从而提供支持不同智能应答服务类型接入的能力,是智能应答技术中台里的核心模块之一。
步骤4、多个引擎根据分发控制模块的路径安排对语音流进行处理,返回给MRCPServer;
在一个例子中,ASR组件收到语音流后,执行语音转写文字流程;根据分发控制模块的路径安排,将ASR的转写结果传输至特定的NLP组件,执行语义理解、话术管理流程,结合语音合成等能力,将回复话术TTS合成音频存至文件服务器中;文件服务器保存后,将用户说话文本、应答文本、应答语音路径、控制信息等内容返回给MRCP Server。
步骤5、MRCP Server将收到的用户说话文本、应答文本、应答语音路径、控制信息等内容返回给前置机,IVR流程控制根据收到的信息,利用文件服务器进行音频播放,主叫层面听到回复,完成一轮对话流程。重复步骤2至步骤8,直到通话流程完成,IVR流程控制或用户挂断通话。
步骤6:通话结束后,业务逻辑处理模块中的方言类型分析模块,将分析本次通话中主叫对话使用的方言类型并记录保存;业务逻辑处理模块中的触点推送模块,将根据该次的智能应答服务类型,分发至不同的服务渠道,将获取到的来电信息通过短信、微信公众号等推送给被叫用户。
本申请与现有的接入单个智能应答服务的技术方案相比,具备以下技术优点:
(1)、实现了根据不同应答场景下,可快速定制化配置智能应答产品。在通话场景下,面向不同的用户类型,如C端代接、B端代接等,需要开发应对不同场景的智能应答产品。在经过中台能力抽取后,只需要适当修改话术配置,即可在已有平台基础上实现产品的快速开发。
(2)、在同类应用场景下,支持快速聚合市场应用,构建统一开放平台,满足用户的需求多样性。支持快速接入多个智能应答应用服务,不同服务间可包含不同类型的语义理解方式、话术配置、场景配置等。帮助用户根据不同的服务特点,结合自身实际需求便捷切换应用选择。
(3)、将数据、技术对接工作抽离出来放到一个服务层中,可降低频繁更换核心系统的风险,后台系统可只关注某个业务场景的具体实现,消除和外部数据的过多接口。中台接入的不同能力与逻辑产品之间,既可在不同场景发挥各自的长处,又可协同工作,实现互通。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (9)
1.一种智能应答系统,其特征在于,包括:智能应答中台和接入所述智能应答中台的多个智能应答接入平台,所述智能应答中台包括:前置机、业务处理模块、服务分流模块,其中:
所述前置机,用于接收到主叫方的话务时,从所述业务处理模块获取业务信息并将所述主叫方的语音流和所述业务信息进行封装之后发送给所述服务分流模块,所述业务信息包括所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,所述应答服务配置用于表征所述被叫方所需的应答服务特征;
所述服务分流模块,用于从所述多个智能应答接入平台中选出与所述业务信息相匹配的目标智能应答接入平台,并将所述语音流分发给目标智能应答接入平台;
所述目标智能应答接入平台,用于生成所述语音流的应答语音并通过所述前置机提供给所述主叫方;
所述服务分流模块包括:MRCP模块和分发控制组件,其中:
所述MRCP模块,用于将所述主叫方的语音流和所述业务信息转发至所述分发控制组件;
所述分发控制组件,用于依据预设的业务信息与各智能应答接入平台的智能应答引擎之间的对应关系,确定处理所述语音流的最佳引擎处理路径,所述最佳引擎处理路径用于表征参与处理的目标智能应答引擎及其处理流程;若所述目标智能应答引擎为多个,则将所述语音流和其他目标智能应答引擎的路径分发至第一流程节点的目标智能应答引擎,由各目标智能应答引擎按照所述最佳引擎处理路径处理所述语音流。
2.根据权利要求1所述的系统,其特征在于,所述业务处理模块,具体用于:
解析所述话务对应的主叫方和被叫方的用户信息;
基于所述主叫方和被叫方的用户信息,获取所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,所述历史应答特征为通过分析所述主叫方的历史应答数据预先获得的。
3.根据权利要求1所述的系统,其特征在于,智能应答引擎包括:ASR组件、NLP组件和TTS组件;
所述分发控制组件,具体用于依据预设的业务信息与智能应答引擎组件之间的对应关系,确定处理所述语音流的最佳组件处理路径,所述最佳组件处理路径用于表征参与处理所述语音流的目标ASR组件、目标NLP组件和目标TTS组件及其处理流程;依据所述最佳组件处理路径,将所述语音流以及目标NLP组件和目标TTS组件的路径分发至目标ASR组件;
所述目标ASR组件,用于将所述语音流转换为文本信息并依据所述最佳组件处理路径将文本信息发送至所述目标NLP组件;
所述目标NLP组件,用于构建上述文本信息的应答文本信息并依据所述最佳组件处理路径将应答文本信息发送至所述目标TTS组件;
所述目标TTS组件用于将所述应答文本信息转换为语音流并提供给前置机。
4.根据权利要求3所述的系统,其特征在于,所述分发控制组件,具体用于:
依据所述最佳组件处理路径,通过私有协议建立连接并将所述语音流以及目标NLP组件和目标TTS组件的路径分发至目标ASR组件。
5.根据权利要求3所述的系统,其特征在于,所述历史应答特征包括:语言类型,所述语言类型为通过分析所述主叫方的历史应答数据获得的;
其中,所述目标ASR组件为所述多个智能应答接入平台中对所述语言类型的识别率最高的ASR组件。
6.根据权利要求3所述的系统,其特征在于,所述被叫方所需的应答服务特征包括:应答语言类型;
其中,所述目标ASR组件为所述多个智能应答接入平台中对所述语言类型的识别率最高的ASR组件。
7.根据权利要求5或6所述的系统,其特征在于,所述被叫方所需的应答服务特征包括:话术类型;
其中,所述目标NLP组件为所述多个智能应答接入平台中提供所述话术类型的智能语音交互服务的NLP组件。
8.根据权利要求7所述的系统,其特征在于,所述被叫方所需的应答服务特征还包括:音频特征;
其中,所述目标TTS组件为所述多个智能应答接入平台中提供所述音频特征的语音流的TTS组件。
9.一种智能应答方法,其特征在于,应用于权利要求1-8中任一项所述的系统,包括:
接收到主叫方的话务时,获取业务信息,所述业务信息包括所述主叫方的历史应答特征和/或被叫方预设的应答服务配置,所述应答服务配置用于表征所述被叫方所需的应答服务特征;
从多个智能应答接入平台中选出与所述业务信息相匹配的目标智能应答接入平台,并将所述语音流分发给目标智能应答接入平台,由所述目标智能应答接入平台生成所述语音流的应答语音并通过前置机提供给所述主叫方;
其中,从多个智能应答接入平台中选出与所述业务信息相匹配的目标智能应答接入平台,并将所述语音流分发给目标智能应答接入平台,包括:
依据预设的业务信息与各智能应答接入平台的智能应答引擎之间的对应关系,确定处理所述语音流的最佳引擎处理路径,所述最佳引擎处理路径用于表征参与处理的目标智能应答引擎及其处理流程;若所述目标智能应答引擎为多个,则将所述语音流和其他目标智能应答引擎的路径分发至第一流程节点的目标智能应答引擎,由各目标智能应答引擎按照所述最佳引擎处理路径处理所述语音流。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011395506.9A CN114598773B (zh) | 2020-12-03 | 2020-12-03 | 一种智能应答系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011395506.9A CN114598773B (zh) | 2020-12-03 | 2020-12-03 | 一种智能应答系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114598773A CN114598773A (zh) | 2022-06-07 |
CN114598773B true CN114598773B (zh) | 2023-09-05 |
Family
ID=81802957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011395506.9A Active CN114598773B (zh) | 2020-12-03 | 2020-12-03 | 一种智能应答系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114598773B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10322454A (ja) * | 1997-05-16 | 1998-12-04 | Nec Commun Syst Ltd | 通信ネットワーク |
US6665640B1 (en) * | 1999-11-12 | 2003-12-16 | Phoenix Solutions, Inc. | Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries |
CN102695144A (zh) * | 2011-03-22 | 2012-09-26 | 北京易信通联信息技术有限公司 | 一种通信处理方法及智能应答平台 |
CN105592196A (zh) * | 2016-01-23 | 2016-05-18 | 广州市讯飞樽鸿信息技术有限公司 | 一种基于智能终端的来电呼叫智能应答的方法及系统 |
CN109446304A (zh) * | 2018-10-10 | 2019-03-08 | 长沙师范学院 | 智能客服会话方法及系统 |
CN111294471A (zh) * | 2020-02-06 | 2020-06-16 | 广州市讯飞樽鸿信息技术有限公司 | 一种智能电话应答方法和系统 |
CN111294463A (zh) * | 2020-02-06 | 2020-06-16 | 广州市讯飞樽鸿信息技术有限公司 | 一种智能应答方法、系统及装置 |
-
2020
- 2020-12-03 CN CN202011395506.9A patent/CN114598773B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10322454A (ja) * | 1997-05-16 | 1998-12-04 | Nec Commun Syst Ltd | 通信ネットワーク |
US6665640B1 (en) * | 1999-11-12 | 2003-12-16 | Phoenix Solutions, Inc. | Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries |
CN102695144A (zh) * | 2011-03-22 | 2012-09-26 | 北京易信通联信息技术有限公司 | 一种通信处理方法及智能应答平台 |
CN105592196A (zh) * | 2016-01-23 | 2016-05-18 | 广州市讯飞樽鸿信息技术有限公司 | 一种基于智能终端的来电呼叫智能应答的方法及系统 |
CN109446304A (zh) * | 2018-10-10 | 2019-03-08 | 长沙师范学院 | 智能客服会话方法及系统 |
CN111294471A (zh) * | 2020-02-06 | 2020-06-16 | 广州市讯飞樽鸿信息技术有限公司 | 一种智能电话应答方法和系统 |
CN111294463A (zh) * | 2020-02-06 | 2020-06-16 | 广州市讯飞樽鸿信息技术有限公司 | 一种智能应答方法、系统及装置 |
Non-Patent Citations (1)
Title |
---|
基于SIP的交互式语音应答(IVR)系统的设计与实现;马欢;俞勇;;微型电脑应用(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114598773A (zh) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10498886B2 (en) | Dynamically switching communications to text interactions | |
US11979518B2 (en) | Handling calls on a shared speech-enabled device | |
US9214154B2 (en) | Personalized text-to-speech services | |
US7519359B2 (en) | Voice tagging of automated menu location | |
US8625749B2 (en) | Content sensitive do-not-disturb (DND) option for a communication system | |
EP1354311B1 (en) | Voice-enabled user interface for voicemail systems | |
US8990071B2 (en) | Telephony service interaction management | |
US7689425B2 (en) | Quality of service call routing system using counselor and speech recognition engine and method thereof | |
JPH0918574A (ja) | 電話応答装置 | |
JPH09186770A (ja) | 電話における自動音声認識のための方法 | |
CN111294471B (zh) | 一种智能电话应答方法和系统 | |
CN105578439A (zh) | 一种应用于呼转平台的来电转接智能应答的方法及系统 | |
JP2021530130A (ja) | 保留を管理するための方法および装置 | |
CN113194203A (zh) | 一种用于听障人士的沟通系统、接听拨打方法及通讯系统 | |
US20050278177A1 (en) | Techniques for interaction with sound-enabled system or service | |
EP3113175A1 (en) | Method for converting text to individual speech, and apparatus for converting text to individual speech | |
EP1643725A1 (en) | Method to manage media resources providing services to be used by an application requesting a particular set of services | |
CN114598773B (zh) | 一种智能应答系统及方法 | |
US6501751B1 (en) | Voice communication with simulated speech data | |
US10057418B1 (en) | Managing telephone interactions of a user and an agent | |
CN115002283A (zh) | 一种虚拟数字人电话应答系统及方法 | |
CN114390144A (zh) | 语音来电智能处理方法、装置和控制系统 | |
KR100370973B1 (ko) | 통화중 음성에 배경음악을 합성해서 전송하는 방법 및 그장치 | |
JP2013257428A (ja) | 音声認識装置 | |
KR20080061050A (ko) | 인터넷 전화를 이용한 자동 음성 응대서비스 제공방법 및시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |