CN113726960B - 多ai能力引擎对接和内容分发装置、方法和介质 - Google Patents
多ai能力引擎对接和内容分发装置、方法和介质 Download PDFInfo
- Publication number
- CN113726960B CN113726960B CN202010452758.4A CN202010452758A CN113726960B CN 113726960 B CN113726960 B CN 113726960B CN 202010452758 A CN202010452758 A CN 202010452758A CN 113726960 B CN113726960 B CN 113726960B
- Authority
- CN
- China
- Prior art keywords
- capability engine
- engine
- capability
- module
- intelligent application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5166—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5175—Call or contact centers supervision arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Psychiatry (AREA)
- Hospice & Palliative Care (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Child & Adolescent Psychology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了多AI能力引擎对接和内容分发装置、方法和介质。该装置包括:呼叫中心接口模块,被配置为通过MRCP/RTP协议接收从呼叫中心输出的语音流和包括业务发起方信息的业务管理信息;AI能力引擎接口模块,被配置为通过所包括的多个接口模块适配至少一个AI能力引擎;语音流解析模块,被配置为根据业务发起方查询智能化应用的订阅信息,根据订阅信息对语音流进行切分和分流,并将分流后的语音流发送到AI能力引擎接口模块;管理配置模块,被配置为根据订阅信息通过至少一个接口模块调用至少一个AI能力引擎;和能力引擎识别结果收发模块,被配置为接收来自所调用的AI能力引擎的识别结果并将其封装为HTTP标准接口,根据订阅信息将其分发到对应的智能化应用。
Description
技术领域
本发明属于人工智能领域,特别涉及多AI能力引擎对接和内容分发装置、方法和介质。
背景技术
现有主流呼叫中心一般是输出一个语音流,只能配置对接一家厂商的人工智能(AI:Artificial Intelligence)能力引擎,由这个AI引擎再和其它AI引擎对接,或通过分流设备分流分别对接,属于订阅方式。而智能导航、智能客服助手等智能化应用有不同方式,往往需要多个AI能力引擎对接,对灵活的厂商选择和业务的灵活性都受限。
目前主流的智能语音能力引擎都已支持HTTP或Web Socket方式,但现有呼叫中心一般是基于MRCP协议同智能语音能力引擎对接。MRCP协议由SIP承载,因此智能语音能力引擎必须与呼叫中心部署在一个局域网内,否则需部署进行NAT转换的BAC设备。
因此,需要能够实现呼叫中心与多AI能力引擎对接且不用局限在一个局域网内的方法和系统。
发明内容
鉴于以上技术问题,本发明提出了一种支持呼叫中心、智能语音AI能力引擎、智能化应用的松耦合的多AI能力引擎对接和内容分发装置以及基于订阅机制的AI能力开放接口调用和基于订阅的识别结果分发方法。
根据本发明的一个方面,提供了一种多人工智能(AI)能力引擎对接和内容分发装置。该装置包括:呼叫中心接口模块,被配置为通过MRCP/RTP协议接收从呼叫中心输出的语音流和业务管理信息,其中所述业务管理信息包括业务发起方信息;包括多个接口模块的AI能力引擎接口模块,被配置为通过所述多个接口模块适配至少一个AI能力引擎;语音流解析模块,被配置为从呼叫中心接口模块接收所述语音流和业务管理信息,根据业务发起方查询智能化应用的订阅信息,根据所查询到的智能化应用的订阅信息对语音流进行切分和分流,并将分流后的语音流发送到AI能力引擎接口模块;管理配置模块,被配置为根据所查询到的智能化应用的订阅信息通过AI能力引擎接口模块中的至少一个接口模块调用至少一个AI能力引擎;以及能力引擎识别结果收发模块,被配置为接收来自所调用的AI能力引擎的识别结果并将其封装为HTTP标准接口,然后根据智能化应用的订阅信息将其分发到对应的智能化应用。
根据一个示例,所述能力引擎识别结果收发模块包括:能力引擎识别结果接收模块,被配置为接收来自所调用的AI能力引擎的识别结果;以及能力引擎识别结果分发模块,被配置为将能力引擎识别结果接收模块接收到的识别结果封装为HTTP标准接口并根据智能化应用的订阅信息进行分发。
根据一个示例,所述管理配置模块还被配置为保存识别结果日志。
根据一个示例,所述语音流解析模块还被配置为根据所查询到的智能化应用的订阅信息按句、按时间片或者按流式输出对所接收的语音流进行切分。
根据一个示例,所述多个接口模块包括语音识别(ASR)接口模块、语义识别(NLP)接口模块、声纹识别(VPR)接口模块和文本转语音(TTS)接口模块。
根据一个示例,所述管理配置模块还被配置为管理智能化应用的订阅信息,包括接收智能化应用对所需识别内容的订阅。
根据本发明的另一方面,提供了一种多人工智能(AI)能力引擎对接和内容分发方法。该方法包括:通过MRCP/RTP协议接收从呼叫中心输出的语音流和业务管理信息,其中所述业务管理信息包括业务发起方信息;根据业务发起方查询智能化应用的订阅信息;根据所查询到的智能化应用的订阅信息对语音流进行切分和分流;根据所查询到的智能化应用的订阅信息调用至少一个AI能力引擎;以及接收来自所调用的至少一个AI能力引擎的识别结果并将其封装为HTTP标准接口,然后根据智能化应用的订阅信息将其分发到对应的智能化应用。
根据一个示例,所述AI能力引擎对接和内容分发方法还包括保存识别结果日志。
根据一个示例,所述AI能力引擎对接和内容分发方法还包括根据所查询到的智能化应用的订阅信息按句、按时间片或者按流式输出对所接收的语音流进行切分。
根据一个示例,所述AI能力引擎对接和内容分发方法还包括接收智能化应用的实时请求。
根据一个示例,所述AI能力引擎对接和内容分发方法还包括管理智能化应用的订阅信息,包括接收智能化应用对所需识别内容的订阅。
根据本发明的再一方面,提供了一种非暂态的计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令在由一个或多个处理器运行时使得所述一个或多个处理器实施根据本发明所述的多人工智能(AI)能力引擎对接和内容分发方法。
本发明适用于基于当前所有主流呼叫中心的智能客服解决方案,为呼叫中心提供了灵活的智能语音AI能力调用和为智能客服应用提供了灵活的识别内容分发的机制,实现了AI能力订阅和AI流程自定义配置机制,大大缩短了项目部署和应用上线时间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1示出了现有技术中呼叫中心与AI能力引擎及智能化应用之间的示例对接结构图100。
图2示出了根据本发明的一个实施例通过本装置提供呼叫中心、AI能力引擎、智能化应用对接以及相应管理的功能的示例结构图200。
图3示出了根据本发明的一个实施例的多AI能力引擎对接与内容分发装置300的结构图。
图4示出了根据本发明的一个实施例的本装置应用于上海电信公司智能客服助手的流程图400。
图5示出了根据本发明的一个实施例的本装置应用于上海电信公司预质检(智能质检)的流程图500。
具体实施方式
在本部分中提供了根据本文所述实施方案的装置和方法的代表性应用。提供这些示例仅是为了添加上下文并有助于理解所述实施方案。对于本领域的技术人员因此将显而易见的是,本发明所述的实施方案可在不具有这些具体细节中的一些或全部的情况下实施。在其它情况下,未详细描述熟知的工艺步骤,以便避免不必要地模糊本发明所述的实施方案。其它应用也是可能的,使得以下示例不应视为是限制性的。
图1示出了现有技术中呼叫中心与AI能力引擎及智能化应用之间的示例对接结构图100。如图1所示,呼叫中心通过MRCP(基于SIP的信令承载协议)/RTP(媒体流承载协议)同语音识别引擎对接,包括语音流及控制信息的对接。为完成从语音识别引擎到语义识别引擎和/或声纹识别引擎等其它能力引擎的整个业务流程,往往需要语音识别引擎或分流设备实现业务流控制。例如,语音识别引擎直接调用语义识别引擎或通过分流方式调用声纹识别引擎,从而完成智能化处理。在语音识别引擎及其它AI能力引擎完成智能化处理后,通过HTTP协议将各个能力引擎的识别结果分发到智能化应用。
由于需要语音识别引擎来调用其它能力引擎,因此不能调用具有不同接口或SDK的不同厂商提供的能力引擎。同时由于接口协议不兼容,语音识别引擎必须与呼叫中心部署在一个局域网内,否则需要部署进行NAT转换的BAC设备。
为了解决上述图1所示的现有技术中的问题,本发明提出了在呼叫中心和语音识别引擎之间建立一个对接呼叫中心、语音识别引擎和智能化应用的多AI能力引擎对接与内容分发装置(后文中简称本装置)。呼叫中心(例如,华为的UAP9600、UAP6600、UAP8100等或者中兴的MS10、MS100等)输出MRCP/RTP语音媒体流与本装置对接,本装置对语音媒体流进行切分、协议转换适配(不同AI能力引擎有不同接口协议要求),收到来自AI能力引擎的识别结果后,根据智能化应用的订阅信息将识别结果分发到对应的智能化应用(如客服助手、智能质智能导航、声纹识别应用等)。各个智能化应用需要识别什么内容需要提前向本装置订阅。
下面参考图2-图3对本装置与呼叫中心等的连接关系以及本装置的结构进行详细描述。
图2示出了根据本发明的一个实施例通过本装置提供呼叫中心、AI能力引擎、智能化应用对接以及相应管理的功能的示例结构图200。如图2所示,由本装置适配呼叫中心和包括来自不同厂商的多个AI能力引擎的AI能力池,即,通过MRCP/RTP协议实现呼叫中心与本装置的语音流对接;同时由本装置进行业务流控制,根据智能化应用在本装置的订阅信息(例如,某个智能应用根据其用户的不同等级向本装置订阅不同的信息)、当前语音流处于话前还是话中以及不同维度来调用AI能力池中的语音识别引擎和/或具有不同厂商的协议或SDK的其它能力引擎并接收返回本装置的识别结果。还根据智能化应用在本装置的订阅信息和/或不同维度来进行智能引擎识别结果到智能化应用的分发。
根据本发明的实施例,这里的不同维度包括能力引擎类别维度、话前/话中/话后维度、应用的业务类别维度(例如,情绪识别有的需要违规词检测+语音语调检测,有的只需要违规词检测)。
图2中示出了包括多个AI能力引擎的AI能力池,包括语音识别引擎、语义识别引擎、声纹识别引擎、情绪识别引擎、文本转语音引擎等。本装置通过与多厂商能力引擎的分别对接,根据智能化应用选择对应能力引擎(特别是语义识别引擎,有些厂商在某些行业有更深入积累),可支持不同类AI能力引擎及多家同类引擎厂商。
图3示出了根据本发明的一个实施例的多AI能力引擎对接与内容分发装置300的结构图。如图3所示,多AI能力引擎对接与内容分发装置300包括通过MRCP/RTP协议接收从呼叫中心输出的语音流和业务管理信息的呼叫中心接口模块。呼叫中心接口模块通过MRCP/RTP协议实现与呼叫中心的语音流对接。业务管理信息包括业务发起方信息。
多AI能力引擎对接与内容分发装置300还包括AI能力引擎接口模块。AI能力引擎接口模块包括能够适配具有不同厂商提供的接口或SDK的不同能力引擎的多个接口模块,包括语音识别(ASR)接口模块、语义识别(NLP)接口模块、声纹识别(VPR)接口模块和文本转语音(TTS)接口模块等,这些接口模块分配适配语音识别(ASR)引擎、语义识别(NLP)引擎、声纹识别(VPR)引擎和文本转语音(TTS)引擎等。
多AI能力引擎对接与内容分发装置300还包括语音流解析模块。语音流解析模块从呼叫中心接口模块接收语音流和和包括业务发起方的业务管理信息,根据业务发起方查询智能化应用的订购信息,根据所查询到的智能化应用的订购信息对语音流进行切分和分流,并将分流后的语音流发送到AI能力引擎接口模块。具体地,语音识别将语音流需要切分成句,声纹识别需要将语音流切分成时间片,如何切分语音流是根据AI引擎能力的接口来判断的。
多AI能力引擎对接与内容分发装置300还包括管理配置模块。管理配置模块根据所查询到的智能化应用的订购信息通过AI能力引擎接口模块中的至少一个接口模块调用相应的至少一个AI能力引擎。
根据一个示例实施例,管理配置模块还可以通过自服务门户、工单等方式接收智能化应用对需要识别的内容的订阅。例如,智能客服助手应用需要知道语音流中是否有热词(例如5G),对语音流的识别需要语音转文本,因此需要语音识别,对热词的识别需要语义识别,还要识别用户身份,需要调用声纹引擎,于是可以通过管理配置模块向本装置订阅语音识别、语义识别和声纹识别。在智能客服助手应用订阅了语音识别、语义识别、声纹识别后,只要接收到的语音流主、被叫号码在业务管理信息中查到订阅了智能客服助手应用,管理配置模块就会根据此智能化应用的订阅信息,即,将语音流按句切分和按时间片(这里声纹识别配置为3秒)切分,并将不同切分后的语音流分别发送到语音识别引擎和声纹识别引擎,将按时间片切分的语音流送到声纹识别引擎识别出用户身份ID将结果送到智能客服助手应用,同时将按句切分的语音流送到语音识别引擎中进行语音转文本,然后将文本发送到语义引擎中提取热词并标亮,将结果送到智能客服助手应用。
多AI能力引擎对接与内容分发装置300还包括能力引擎识别结果收发模块。能力引擎识别结果收发模块接收来自所调用的至少一个AI能力引擎的识别结果并将其封装为HTTP标准接口,然后根据智能化应用的订购信息将其分发到对应的智能化应用。
根据一个实施例,能力引擎识别结果收发模块包括能力引擎识别结果接收模块和能力引擎识别结果分发模块。能力引擎识别结果接收模块统一接收来自AI能力引擎的识别结果。能力引擎识别结果分发模块将接收到的识别结果封装为HTTP标准接口,根据智能化应用的订阅信息将封装后的识别结果分发到各个智能化应用。
根据本发明的实施例,管理配置模块还用作流程配置管理模块,例如语音流解析模块根据业务发起方向管理配置模块查询智能化应用的订购信息,在查询到订购信息后管理配置模块指示AI能力引擎接口模块根据订购信息通过相应的接口模块调用相应的能力引擎(即,将切分和分流后的语音流发送到相应的能力引擎),在接收到AI智能引擎返回的识别结果时保存识别结果日志。此外,管理配置模块还配置有统计功能,例如,统计一段时期内各能力引擎的调用次数或频率、调用各能力引擎的时延、一段时期内各智能化应用的使用次数或频率等。
本发明的多AI能力引擎对接与内容分发装置能够提供开放的AI能力引擎调用接口,对智能化应用提供标准的内容分发接口,并且提供了基于智能化应用订阅信息的灵活的语音流切分、分流和AI能力引擎调用策略。通过本发明的多AI能力引擎对接与内容分发装置,实现了呼叫中心、多个不同厂商的AI能力引擎以及智能化应用的松耦合,可以支持同时调用多类引擎或多厂商引擎的灵活部署方式。通过将传统呼叫中心MRCP协议转换为主流AI能力引擎接口,避免了AI能力引擎必须和呼叫中心部署在一个局域网内的限制。
图4示出了根据本发明的一个实施例的本装置应用于上海电信公司智能客服助手的流程图400。在用户与客服通话中,人工客服人员需要快速识别用户身份(通过声纹识别),将用户与客服通话内容转成文本呈现在客服助手界面,并且需要知道语音流中是否有热词。因此需要同时调用声纹识别引擎、语音识别引擎和语义识别引擎。声纹识别引擎在识别出用户后终止调用,而语音识别引擎和语义识别引擎需要调用直到用户与客服的通话结束。
如图4所示,在步骤401,通过MRCP协议或SIP协议从呼叫中心接收用户及话务员语音流以及业务管理信息。业务管理信息包括业务发起方,在本实施例中,业务发起方为智能客服助手。
在步骤402,查询智能客服助手的订阅信息。在本实施例中,订阅信息包括语音转文本、声纹识别用户身份以及提取热词。并且根据本发明的实施例,由本装置中的语音流解析模块向管理配置模块查询智能客服助手的订阅信息。
在步骤403,将语音流按句切分和按时间片切片,并将不同切分后的语音流分别发送到语音识别引擎和声纹识别引擎。具体地,将按句切分的语音流发送到语音识别引擎中进行语音转文本,同时将按时间片切分的语音流发送到声纹识别引擎以识别出用户身份ID。根据本发明的实施例,由语音流解析模块执行切片和分流,并由管理配置模块指示AI能力引擎接口模块执行对语音识别引擎和声纹识别引擎的调用。
在步骤404,分别从语音识别引擎和声纹识别引擎接收转文本结果和声纹识别结果。根据本发明的实施例,由AI能力引擎接收模块执行此步骤。在声纹识别成功后停止调用声纹识别引擎,根据本发明的实施例,声纹识别配置一般为3秒。
在步骤405,将声纹识别结果封装为HTTP标准接口发送给智能客服助手。根据本发明的实施例,由AI能力引擎分发模块执行此步骤。然后将文本发送到语义引擎中提取热词并标亮,将结果送到智能客服助手应用
在步骤406,将文本发送到语义识别引擎中提取热词。
在步骤407,从语义识别引擎接收提取了热词并标亮的语义识别结果。
在步骤408,将语义识别结果封装为HTTP标准接口发送给智能客服助手。
图5示出了根据本发明的一个实施例的本装置应用于上海电信公司预质检(智能质检)的流程图500。在用户与客服通话中与通话结束后,如需要对客服人员的服务规范、情绪进行监控,智能质检应用需要在通话过程中调用语义识别引擎和情绪识别引擎,对客服人员是否使用违规词及情绪音调是否异常进行监测。
如图5所示,在步骤501,通过MRCP协议或SIP协议从呼叫中心接收用户及话务员语音流以及业务管理信息。业务管理信息包括业务发起方,在本实施例中,业务发起方为智能质检应用。
在本发明的实施例中,用户通过呼叫中心与客服人员建立通话,并可通过互动式语音应答(IVR:Interactive Voice Response)流程触发智能质检。
在步骤502中,查询智能质检应用的订阅信息。
在本实施例中,智能质检应用的订阅信息可包括进行违规词的提取和情绪音调的检测,因此需要调用语义识别引擎和情绪识别引擎。而进行语义和情绪识别需要先识别语音,因此还需要调用语音识别引擎。
在步骤503,本装置将语音流按句切分并调用语音识别引擎。
在步骤504,本装置从语音识别引擎接收语音转文本结果。
在步骤505,本装置将接收到的语音转文本结果封装为HTTP标准接口发送给智能质检应用。语音转文本结果发送给智能质检应用后可用于离线的规范用词质检。
智能质检应用的质检包括实时预质检和话后离线质检。在智能质检应用确定需要实时预质检时,智能质检应用向本装置的管理配置模块发起实时质检请求。此时,在步骤506,智能质检应用向本装置发送实时质检请求。
在步骤507,本装置调用语义识别引擎进行违规词检测。
在步骤508,本装置从语义识别引擎接收返回的违规词检测结果。
在步骤509,本装置将所接收的违规词检测结果封装为HTTP标准接口发送给智能质检应用。
在步骤510,本装置调用情绪识别引擎进行语音语调检测。
在步骤511,本装置从情绪识别引擎接收返回的情绪识别结果。
在步骤512,本装置将所接收的情绪识别结果封装为HTTP标准接口发送给智能质检应用。
根据本发明的实施例,步骤507-509与步骤510-512可以同时进行或者先后进行。根据本发明的实施例,对语音识别引擎、语义识别引擎和情绪识别引擎的调用直到本次通话结束。在智能质检应用不需要进行实时预质检而只需要进行话后离线质检的情况下,省略步骤506,步骤505、509和512中将语音转文本结果、违规词检测结果和情绪识别结果发送到智能质检平台用于离线质检。
上述示例实施例示意性地记载了根据本发明的多人工智能(AI)能力引擎对接和内容分发装置和方法,其支持现网主流呼叫中心的对接,能够实现多厂商的AI能力引擎池化部署,并通过松耦合架构实现了呼叫中心、AI能力引擎和智能化应用的独立部署方式,支持与多厂商、多协议的对接和灵活分发机制,大大简化了组网架构,实现了智能语音AI能力的开放、灵活的多AI能力同时调用,可以更好的支持智能语音应用。
前面所描述的其中一些功能可以由存储在存储介质(例如计算机可读介质)上的指令构成。所述指令可以由处理器取回并执行。存储介质的一些实例有存储器设备、带、盘等等。所述指令在由处理器执行时适于引导处理器根据所述技术操作。本领域技术人员熟悉指令、(多种)处理器和存储介质。
用于实施对应于本发明的各个方面的操作的计算机程序代码可以用一种或更多种编程语言的任意组合来编写,其中包括面向对象的编程语言,比如Java、Smalltalk、C++等等,以及传统的过程编程语言,比如“C”编程语言或者类似的编程语言。所述程序代码可以完全在用户的计算机上执行、部分地在用户的计算机上执行(作为独立软件包),部分地在用户的计算机上执行并且部分地在远程计算机上执行,或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何类型的网络连接到用户的计算机,其中包括局域网(LAN)或广域网(WAN),或者所述连接可以是去到外部计算机(例如利用互联网服务提供商通过因特网连接)。
后面的权利要求书中的所有装置或步骤加功能元素的相应结构、材料、动作和等效方案意图包括用于将所述功能与明确要求保护的其他权利要求元素组合实施的任何结构、材料或动作。前面对于本发明的描述是出于说明和描述的目的而给出的,而不意图进行穷举或者将本发明限制到所公开的形式。在不背离本发明的范围和精神的情况下,本领域技术人员将会想到许多修改和变型。选择并描述前面的示例性实施例是为了最好地解释本发明的技术的原理及其实际应用,并且使得本领域技术人员能够对于具有适合于所设想的特定用途的各种修改的各个实施例理解本发明。
前面参照根据本发明的实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图描述了本发明的各个方面。应当理解的是,所述流程图和/或方框图的每一个方框以及流程图和/或方框图中的各种方框组合可以由计算机程序指令实施。这些计算机程序指令可以被提供到通用计算机、专用计算机或其他可编程数据处理设备的处理器以产生一台机器,从而使得经由所述计算机或其他可编程数据处理设备的处理器执行的指令创建用于实施在流程图以及/或者一个或多个方框图方框中规定的功能/动作的装置。
这些计算机程序指令还可以被存储在计算机可读介质中,其可以引导计算机、其他可编程数据处理设备或其他设备按照特定方式运作,从而使得存储在所述计算机可读介质中的指令产生包括实施在流程图以及/或者一个或多个方框图方框中规定的功能/动作的指令的制造品。
所述计算机程序指令还可以被加载到计算机、其他可编程数据处理设备或者其他设备上,以使得在所述计算机、其他可编程设备或者其他设备上实施一系列操作步骤从而产生计算机实施的处理,从而使得执行在所述计算机或其他可编程设备上的指令提供用于实施在流程图以及/或者一个或多个方框图方框中规定的功能/动作的处理。
附图中的流程图和方框图示出了根据本发明的各个实施例的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。在这方面,流程图或方框图中的每一个方框可以代表一个代码模块、片段或部分,其包括用于实施所指定的(多项)逻辑功能的一条或更多条可执行指令。还应当提到的是,在一些替换实现方式中,在所述方框中提到的各项功能可以按照不同于附图中提到的顺序发生。举例来说,被相继地示出的两个方框实际上可以被基本上同时地执行,或者所述方框有时可以按照相反顺序被执行,这取决于所涉及的功能。还应当提到的是,方框图和/或流程图中的每一个方框以及方框图和/或流程图中的各种方框组合可以由实施所指定的功能或动作的基于专用硬件的系统或者专用硬件与计算机指令的组合来实施。
虽然前面描述了各个实施例,但是应当理解的是,其仅仅是通过举例而非限制的方式给出的。前面的描述不意图把所述技术的范围限制到这里所阐述的具体形式。因此,优选实施例的广度和范围不应当受到前面描述的任何示例性实施例的限制。应当理解的是,前面的描述是说明性而非限制性的。相反,本发明的描述意图涵盖可以被包括在由所附权利要求书限定以及通过其他方式为本领域技术人员所认识到的所述技术的精神和范围内的此类替换方案、修改和等效方案。因此,所述技术的范围不应当参照前面的描述来确定,而是应当参照所附权利要求书连同其等效表述的完全范围来确定。
Claims (10)
1.一种多人工智能AI能力引擎对接和内容分发装置,包括:
呼叫中心接口模块,被配置为通过MRCP/RTP协议接收从呼叫中心输出的语音流和业务管理信息,其中所述业务管理信息包括业务发起方信息;
包括多个接口模块的AI能力引擎接口模块,被配置为通过所述多个接口模块适配至少一个AI能力引擎;
语音流解析模块,被配置为从呼叫中心接口模块接收所述语音流和业务管理信息,根据业务发起方查询智能化应用的订阅信息,根据所查询到的智能化应用的订阅信息对语音流进行切分和分流,并将分流后的语音流发送到AI能力引擎接口模块;
管理配置模块,被配置为根据所查询到的智能化应用的订阅信息通过AI能力引擎接口模块中的至少一个接口模块调用至少一个AI能力引擎;以及
能力引擎识别结果收发模块,被配置为接收来自所调用的AI能力引擎的识别结果并将其封装为HTTP标准接口,然后根据智能化应用的订阅信息将其分发到对应的智能化应用;
其中,所述语音流解析模块被配置为根据所查询到的智能化应用的订阅信息按句、按时间片或者按流式输出对所接收的语音流进行切分。
2.根据权利要求1所述的多AI能力引擎对接和内容分发装置,其中所述能力引擎识别结果收发模块包括:
能力引擎识别结果接收模块,被配置为接收来自所调用的AI能力引擎的识别结果;以及
能力引擎识别结果分发模块,被配置为将能力引擎识别结果接收模块接收到的识别结果封装为HTTP标准接口并根据智能化应用的订阅信息进行分发。
3.根据权利要求1所述的多AI能力引擎对接和内容分发装置,其中所述管理配置模块还被配置为保存识别结果日志。
4.根据权利要求1所述的多AI能力引擎对接和内容分发装置,其中所述多个接口模块包括语音识别接口模块、语义识别接口模块、声纹识别接口模块和文本转语音接口模块。
5.根据权利要求1所述的多AI能力引擎对接和内容分发装置,其中所述管理配置模块还被配置为管理智能化应用的订阅信息,包括接收智能化应用对所需识别内容的订阅。
6.一种多人工智能AI能力引擎对接和内容分发方法,包括:
通过MRCP/RTP协议接收从呼叫中心输出的语音流和业务管理信息,其中所述业务管理信息包括业务发起方信息;
根据业务发起方查询智能化应用的订阅信息;
根据所查询到的智能化应用的订阅信息对语音流进行切分和分流,其中,根据所查询到的智能化应用的订阅信息按句、按时间片或者按流式输出对所接收的语音流进行切分;
根据所查询到的智能化应用的订阅信息调用至少一个AI能力引擎;
接收来自所调用的至少一个AI能力引擎的识别结果并将其封装为HTTP标准接口,然后根据智能化应用的订阅信息将其分发到对应的智能化应用。
7.根据权利要求6所述的多AI能力引擎对接和内容分发方法,还包括保存识别结果日志。
8.根据权利要求6所述的多AI能力引擎对接和内容分发方法,还包括接收智能化应用的实时请求。
9.根据权利要求6所述的多AI能力引擎对接和内容分发方法,还包括管理智能化应用的订阅信息,包括接收智能化应用对所需识别内容的订阅。
10.一种非暂态的计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令在由一个或多个处理器运行时使得所述一个或多个处理器实施根据权利要求6-9中任一项所述的多人工智能AI能力引擎对接和内容分发方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010452758.4A CN113726960B (zh) | 2020-05-26 | 2020-05-26 | 多ai能力引擎对接和内容分发装置、方法和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010452758.4A CN113726960B (zh) | 2020-05-26 | 2020-05-26 | 多ai能力引擎对接和内容分发装置、方法和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113726960A CN113726960A (zh) | 2021-11-30 |
CN113726960B true CN113726960B (zh) | 2022-09-30 |
Family
ID=78671901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010452758.4A Active CN113726960B (zh) | 2020-05-26 | 2020-05-26 | 多ai能力引擎对接和内容分发装置、方法和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113726960B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101127898A (zh) * | 2007-09-20 | 2008-02-20 | Ut斯达康通讯有限公司 | 流媒体系统及其多媒体文件的切片存储和流服务方法 |
CN107274882A (zh) * | 2017-08-08 | 2017-10-20 | 腾讯科技(深圳)有限公司 | 数据传输方法及装置 |
CN109410926A (zh) * | 2018-11-27 | 2019-03-01 | 恒大法拉第未来智能汽车(广东)有限公司 | 语音语义识别方法及系统 |
CN110659741A (zh) * | 2019-09-03 | 2020-01-07 | 浩鲸云计算科技股份有限公司 | 一种基于分片式自动学习的ai模型训练系统和方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100544463C (zh) * | 2007-06-29 | 2009-09-23 | 中兴通讯股份有限公司 | 一种提供语音合成应用统一开发平台的系统和方法 |
CN107756395B (zh) * | 2016-08-19 | 2020-12-01 | 腾讯科技(深圳)有限公司 | 智能机器人的控制系统、方法和装置 |
CN107666411B (zh) * | 2017-09-21 | 2020-10-09 | 烽火通信科技股份有限公司 | 家庭网关中语音芯片识别及语音软件加载系统及方法 |
CN108257590B (zh) * | 2018-01-05 | 2020-10-02 | 携程旅游信息技术(上海)有限公司 | 语音交互方法、装置、电子设备、存储介质 |
CN109327629A (zh) * | 2018-11-01 | 2019-02-12 | 深圳市号互联科技有限公司 | 一种人工智能语音导航数据处理方法 |
-
2020
- 2020-05-26 CN CN202010452758.4A patent/CN113726960B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101127898A (zh) * | 2007-09-20 | 2008-02-20 | Ut斯达康通讯有限公司 | 流媒体系统及其多媒体文件的切片存储和流服务方法 |
CN107274882A (zh) * | 2017-08-08 | 2017-10-20 | 腾讯科技(深圳)有限公司 | 数据传输方法及装置 |
CN109410926A (zh) * | 2018-11-27 | 2019-03-01 | 恒大法拉第未来智能汽车(广东)有限公司 | 语音语义识别方法及系统 |
CN110659741A (zh) * | 2019-09-03 | 2020-01-07 | 浩鲸云计算科技股份有限公司 | 一种基于分片式自动学习的ai模型训练系统和方法 |
Non-Patent Citations (1)
Title |
---|
基于AI的智能呼叫运营系统设计的与实现;马昭征等;《电信科学》;20200430;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113726960A (zh) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8326624B2 (en) | Detecting and communicating biometrics of recorded voice during transcription process | |
US10027799B2 (en) | Automatic contextual media recording and processing utilizing speech analytics | |
US7921214B2 (en) | Switching between modalities in a speech application environment extended for interactive text exchanges | |
US9014364B1 (en) | Contact center speech analytics system having multiple speech analytics engines | |
US8204181B2 (en) | Telecommunications voice server leveraging application web-server capabilities | |
EP1311102A1 (en) | Streaming audio under voice control | |
US20040162724A1 (en) | Management of conversations | |
CN109417583B (zh) | 一种将音频信号实时转录为文本的系统和方法 | |
US20060072727A1 (en) | System and method of using speech recognition at call centers to improve their efficiency and customer satisfaction | |
WO2011063761A1 (zh) | 呼叫中心语音检测的方法、装置及系统 | |
JP2005504448A (ja) | 強化媒体ゲートウェイ制御プロトコル | |
KR20100059878A (ko) | 통합 메시징 상태 기계 | |
US20180012600A1 (en) | Call management system and its speech recognition control method | |
CN110176252A (zh) | 基于风险管控模式的智能语音质检方法及系统 | |
CN104580762A (zh) | 一种根据语种实现电话转接的方法和装置 | |
US11900942B2 (en) | Systems and methods of integrating legacy chatbots with telephone networks | |
US10255919B2 (en) | Identifying speaker roles in a streaming environment | |
CN113726960B (zh) | 多ai能力引擎对接和内容分发装置、方法和介质 | |
US8019607B2 (en) | Establishing call-based audio sockets within a componentized voice server | |
JP2019088009A (ja) | 通訳サービスシステム、通訳依頼者端末、通訳サービス方法及び通訳サービスプログラム | |
US7451086B2 (en) | Method and apparatus for voice recognition | |
CN111590610A (zh) | 一种新型智能对话机器人控制系统及其方法 | |
CN109410926A (zh) | 语音语义识别方法及系统 | |
CN114420130A (zh) | 电话语音交互方法、装置、设备及存储介质 | |
CN114387971A (zh) | 一种基于实时语音信令解析的多语音识别引擎调用的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |