CN114528386A - 机器人的外呼控制方法、装置、存储介质和终端 - Google Patents
机器人的外呼控制方法、装置、存储介质和终端 Download PDFInfo
- Publication number
- CN114528386A CN114528386A CN202210043093.0A CN202210043093A CN114528386A CN 114528386 A CN114528386 A CN 114528386A CN 202210043093 A CN202210043093 A CN 202210043093A CN 114528386 A CN114528386 A CN 114528386A
- Authority
- CN
- China
- Prior art keywords
- robot
- text
- session
- intention
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000013145 classification model Methods 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 11
- 230000000977 initiatory effect Effects 0.000 claims description 5
- 230000003993 interaction Effects 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 229930003268 Vitamin C Natural products 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Acoustics & Sound (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种机器人的外呼控制方法及装置、存储介质和终端,方法包括:获取基于机器人输出的当前会话文本反馈的用户会话内容;分析用户会话内容所属的意图类别;按照当前会话文本所处节点的会话逻辑,输出意图类别对应的目标会话文本。本申请的方法,实现了服务领域的机器人的外呼通话,在保证外呼交互灵活性和准确度的同时,降低人力成本,提高服务效率。
Description
技术领域
本申请涉及机器人外呼技术领域,尤其是涉及到一种机器人的外呼控制方法及装置、存储介质和终端。
背景技术
相关技术中,对话机器人系统普遍停留在日常对话、知识问答以及任务型等泛场景领域。比如,用户和机器人闲聊、寒暄;用户希望通过询问机器人得到特定的答案,例如:“苹果含有维生素C吗?”;用户希望机器人提供某项服务等。但上述对话机器人为依赖用户主动询问的被动型对话机器人,这样就无法满足服务行业存在的主动式场景,在主动式场景下,仍旧需要人工主动去联系客户,确定服务项目后再通过机器人辅助完成服务任务。然而人工服务效率较低,大大增加了企业的运营成本。
发明内容
有鉴于此,本申请提供了一种机器人的外呼控制方法及装置、存储介质和终端,实现了服务领域的机器人的外呼通话,在保证外呼交互灵活性和准确度的同时,降低人力成本,提高服务效率。
根据本申请的一个方面,提供了一种机器人的外呼控制方法,包括:
获取基于机器人输出的当前会话文本反馈的用户会话内容;
分析用户会话内容所属的意图类别;
按照当前会话文本所处节点的会话逻辑,输出意图类别对应的目标会话文本。
可选地,分析用户会话内容所属的意图类别,具体包括:
确定用户会话内容的第一文本序列;
将第一文本序列输入意图分类模型,以确定用户会话内容所属的意图类别。
可选地,将第一文本序列输入意图分类模型之前,还包括:
获取历史通话样本和预设意图词典,预设意图词典包括预设意图类别和预设意图类别对应的预设语义特征;
提取历史通话样本的第二文本序列的语义特征;
在语义特征和预设语义特征的相似度大于相似度阈值的情况下,将预设语义特征对应的预设意图类别确定为意图类别样本;
根据第二文本序列和意图类别样本,训练意图分类模型。
可选地,机器人的外呼控制方法还包括:
在意图类别属于预设会话文本的第一意图类别范围的情况下,输出结束会话文本,并挂断外呼通话。
可选地,机器人的外呼控制方法还包括:
在意图类别属于当前会话文本所处节点的第二意图类别范围的情况下,将外呼通话转接至人工会话对应的终端。
可选地,获取基于机器人输出的当前会话文本反馈的用户会话内容之前,还包括:
获取机器人的业务场景信息和用户信息,用户信息包括身份信息和号码信息;
加载业务场景信息对应的会话文本集,会话文本集包括至少两个会话文本,至少两个会话文本之间存在会话逻辑;
按照号码信息发起外呼通话;
在外呼通话处于接通状态的情况下,根据会话逻辑的顺序,确定会话文本集中的初始会话文本;
按照身份信息,输出初始会话文本。
可选地,机器人的外呼控制方法还包括:
将机器人输出的会话文本、用户会话内容和意图类别关联存储。
可选地,输出意图类别对应的目标会话文本,具体包括:
识别用户会话内容对应的方言类别;
按照方言类别,对目标会话文本进行语音转换处理;
输出语音转换处理后的目标会话文本。
根据本申请的另一方面,提供了一种机器人的外呼控制装置,装置包括:
第一获取模块,用于获取基于机器人输出的当前会话文本反馈的用户会话内容;
意图分析模块,用于分析用户会话内容所属的意图类别;
输出模块,用于按照当前会话文本所处节点的会话逻辑,输出意图类别对应的目标会话文本。
可选地,意图分析模块,具体包括:
第一确定模块,用于确定用户会话内容的第一文本序列;
模型分析模块,用于将第一文本序列输入意图分类模型,以确定用户会话内容所属的意图类别。
可选地,机器人的外呼控制装置还包括:
第二获取模块,用于获取历史通话样本和预设意图词典,预设意图词典包括预设意图类别和预设意图类别对应的预设语义特征;
特征提取模块,用于提取历史通话样本的第二文本序列的语义特征;
第二确定模块,用于在语义特征和预设语义特征的相似度大于相似度阈值的情况下,将预设语义特征对应的预设意图类别确定为意图类别样本;
训练模块,用于根据第二文本序列和意图类别样本,训练意图分类模型。
可选地,输出模块,还用于在意图类别属于预设会话文本的第一意图类别范围的情况下,输出结束会话文本,并挂断机器人的外呼通话。
可选地,机器人的外呼控制装置还包括:
转接模块,用于在意图类别属于当前会话文本所处节点的第二意图类别范围的情况下,将外呼通话转接至人工会话对应的终端。
可选地,机器人的外呼控制装置还包括:
第三获取模块,用于获取机器人的业务场景信息和用户信息,用户信息包括身份信息和号码信息;
加载模块,用于加载业务场景信息对应的会话文本集,会话文本集包括至少两个会话文本,至少两个会话文本之间存在会话逻辑;
外呼模块,用于按照号码信息发起外呼通话;
第三确定模块,用于在外呼通话处于接通状态的情况下,根据会话逻辑的顺序,确定会话文本集中的初始会话文本;
输出模块,还用于按照身份信息,输出初始会话文本。
可选地,机器人的外呼控制装置还包括:
存储模块,用于将机器人输出的会话文本、用户会话内容和意图类别关联存储。
可选地,机器人的外呼控制装置还包括:
识别模块,用于识别用户会话内容对应的方言类别;
转换模块,用于按照方言类别,对目标会话文本进行语音转换处理;
输出模块,具体用于输出语音转换处理后的目标会话文本。
根据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,程序被处理器执行时实现上述机器人的外呼控制方法。
根据本申请再一个方面,提供了一种终端,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述机器人的外呼控制方法。
借由上述技术方案,在机器人执行外呼任务的过程中,通过分析用户针对机器人输出的当前会话文本反馈的真实意图,以及机器人会话文本的逻辑性,进行会话文本的跳转。一方面,无需人工即可完成外呼任务,不仅降低了人工成本,而且提升的业务服务效率;另一方面,通过意图分析能够尽可能多的降低因用户反馈文本不符合预期反馈关键字匹配或模式匹配导致的重复提问的可能性提升了外呼交互灵活性和准确度,保证机器人继续进行外呼通话,有利于提升通话对端用户的服务感受。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种机器人的外呼控制方法的流程示意图之一;
图2示出了本申请实施例提供的一种机器人的外呼控制方法的流程示意图之二;
图3示出了本申请实施例提供的一种机器人的外呼控制方法的流程示意图之三;
图4示出了本申请实施例提供的一种机器人的外呼控制方法的流程示意图之四;
图5示出了本申请实施例提供的一种机器人的外呼控制装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种机器人的外呼控制方法,如图1所示,该方法包括:
步骤101,获取基于机器人输出的当前会话反馈的用户会话内容;
具体地,机器人具体可以是电话机器人、客服机器人或销售机器人等AI(Artificial Intelligence,人工智能)机器人。用户会话内容是指通话对端用户输出的内容,可以是语音或手动输入的文本数据,当前会话文本指外呼机器人需要通过语音合成处理后播放给用户的话术。
在该实施例中,机器人可通过外呼方式与客户之间建立语音会话,外呼通话过程中先由外呼机器人发起提问,用户再回答,并不断循环这一问答的过程,进而与客户间进行正常的通话。将机器人输出当前会话的时刻之后首次接收到的内容作为用户基于该当前会话反馈的用户会话内容。
步骤102,分析用户会话内容所属的意图类别;
在实际应用场景中,分析用户会话内容所属的意图类别的步骤,具体包括:确定用户会话内容的第一文本序列;将第一文本序列输入意图分类模型,以确定用户会话内容所属的意图类别。
可以理解的是,若用户会话内容为语音数据,则先通过语音-文本转换处理将语音数据转换为文本数据,以确定第一文本序列。若用户会话内容为用户通过终端输入给机器人的一段文字,则该段文字即第一文本序列。其中,第一文本序列包括文本信息和词序信息,以便于更好的分析用户会话内容的语义,从而提高意图分析的准确性。
在该实施例中,利用基于神经网络的意图分类模型对用户会话内容的第一文本序列进行语义解析,进而分析出用户针对机器人输出的当前会话文本反馈的真实意图,有益于机器人对自然语言语义的理解力,达到了提高语音机器人识别用户意图的准确度和应对多样的业务需求的适应性的目的。
例如,“听不懂吗”、“我不明白”、“不是的”等内容对应的意图类别为否。“我想办理xxx项目”、“麻烦转接xxx”对应的意图类别为执行xxx功能。
步骤103,按照当前会话文本所处节点的会话逻辑,输出意图类别对应的目标会话文本。
其中,基于会话逻辑,用于提问的当前会话文本的节点将对应多个逻辑选项,每个逻辑选项与一种意图类别一一对应。
在该实施例中,在机器人执行外呼任务的过程中,通过分析用户针对机器人输出的当前会话文本反馈的真实意图,以及机器人会话文本的逻辑性,进行会话文本的跳转。一方面,无需人工即可完成外呼任务,不仅降低了人工成本,而且提升的业务服务效率;另一方面,通过意图分析能够尽可能多的降低因用户反馈文本不符合预期反馈关键字匹配或模式匹配导致的重复提问的可能性,提升了外呼交互灵活性和准确度,保证机器人继续进行外呼通话,有利于提升通话对端用户的服务感受。
具体举例来说,以保险推销业务为例,根据不同保险产品以及购买方式配置机器人会话逻辑。会话节点node1:请问是张先生吗?跳转:是-node2,否-node5;会话节点node2:接下来请您打开微信公众号?跳转:是-node3,否-node5;会话节点node3:请您点击点我买保险?跳转:是-node4,否-node5;会话节点node4:恭喜您已成功购买保险A。其中,会话节点中的问句即机器人输出的会话文本,“是”和“否”即意图类别。
如图2所示,在本申请实施例中,进一步地,将第一文本序列输入意图分类模型的步骤之前,还包括:
步骤201,获取历史通话样本和预设意图词典;
其中,预设意图词典包括预设意图类别和预设意图类别对应的预设语义特征,不同的预设意图类别可以对应相同或不同预设语义特征。历史通话样本可以是人机通话的内容记录或者人人通话的内容记录。
步骤202,提取历史通话样本的第二文本序列的语义特征;
具体地,由于文本是一种非结构化的数据,计算机无法直接对其进行直接处理,而计算机能够处理的对象可以为向量,故而基于预训练的特征提取模型对第二文本序列进行token级别的向量提取,生成第二文本序列的语义特征。从而将文本进行向量化表示,以便于计算机对文本进行识别和处理。其中,特征提取模型可以为BERT模型,BERT模型是基于双向Transformer构建的语言模型。
在该实施例中,利用文本向量转换实现会话文本的语义特征提取,能够适用于多样化的口语语料,并且具备较好的泛化能力,在利用训练意图分类模型时,能够获得较好的识别准确度,有利于提高其识别会话文本的会话意图的效率和准确度。
步骤203,在语义特征和预设语义特征的相似度大于相似度阈值的情况下,将预设语义特征对应的预设意图类别确定为意图类别样本;
步骤204,根据第二文本序列和意图类别样本,训练意图分类模型。
在该实施例中,将第二文本序列的语义特征映射到意图词典中,通过相似度匹配确定历史通话样本所述的用户意图。在利用第二文本序列和意图类别样本对初始模型进行训练,得到意图分类模型。从而以大量历史通话样本作为数据支撑来训练意图分类模型,使得意图分类模型能够更好的理解自然语言语义,从而提高语音机器人识别用户意图的准确度和应对多样的业务需求的适应性,有利于提高用户体验。
在本申请实施例中,进一步地,机器人的外呼控制方法还包括:在意图类别属于预设会话文本的第一意图类别范围的情况下,输出结束会话文本,并挂断外呼通话。
在该实施例中,预设会话文本用于完成机器人服务任务的最终一个节点的会话文本。若检测到用户反馈的用户会话内容的意图类别在预设会话文本的意图类别范围内,说明机器人输出的当前会话文本与预设回话文本相同,换言之,本次人机会话已经达到服务任务的最后一个流程节点,且用户的意图达到本次服务任务的目的。此时,可输出结束会话文本,挂断外呼通话,来结束本次通话。
具体举例来说,以保险推销业务为例,首先有机器人呼通客户电话,第一轮,机器人播放首播节点话术:“您好请问是XXX先生吗?”;客户回复:“我是,有什么事情吗?”通过意图识别得出客户为肯定意图——是,则机器人跳转到相应节点。第二轮,继续播报机器人话术:“是这样的,您在我们微信公众号领取过一份赠险,现在带您查看一下”;客户回复:“好的”。通过意图识别得出客户为肯定意图——同意,则机器人跳转到相应节点。第三轮,播报机器人话术:“接下来请您打开免提,进入微信公众号,请问您进入公众号了吗”;客户回复:“已经进入了”,通过意图识别得出客户为肯定意图——是,则机器人跳转到相应节点。第四轮,播报机器人话术:“请您看右下角有个我的保单,然后点击查看就好了”;客户回复:“不知道你再说什么”,通过意图识别得出客户为肯定意图——不知道,则机器人跳转到相应节点。第五轮,播报机器人话术:“公众号右下角有个按钮是我的保单,字节直接点击就好了,请问您点了吗”;客户回复:“看到了,谢谢”通过意图识别得出客户为肯定意图——是。此时,机器人的服务任务已完成,也即满足结束条件。第六轮,播放机器人结束话术:“感谢您的接听,再见”。然后挂机。
在本申请实施例中,进一步地,机器人的外呼控制方法还包括:在意图类别属于当前会话文本所处节点的第二意图类别范围的情况下,将外呼通话转接至人工会话对应的终端。
在该实施例中,第二意图类别范围包括与人工接听相关的至少一个意图类别。若检测到用户反馈的用户会话内容的意图类别在第二意图类别范围内,说明用户需求已经超出机器人的服务能力,需要人工客服来完成。此时,将外呼通话转接至人工会话对应的终端,从而实现机器人和人工通话无差别切换,以保证客户的通话体验良好。
具体举例来说,以商品推销业务为例,首先有机器人呼通客户电话,第一轮,机器人播放首播节点话术:“您好请问是XXX女士吗?”;客户回复:“是的”通过意图识别得出客户为肯定意图——是,则机器人跳转到相应节点。第二轮,继续播报机器人话术:“是这样的,我们店铺赠送了您一张优惠券你看到了吗”;客户回复:“没看到呢”。通过意图识别得出客户为肯定意图——否,则机器人跳转到相应节点。第三轮,播报机器人话术:“您可以进入我的优惠券中查找,您看到了吗”;客户回复:“好的看到了,谢谢,可以帮我转接人工客服吗,正好我有一个订单想咨询”,通过意图识别得出客户的意图为是和人工转接功能,则机器人切换到人工客服。
如图3所示,在本申请实施例中,进一步地,获取基于机器人输出的当前会话文本反馈的用户会话内容的步骤之前,还包括:
步骤301,获取业务场景信息和用户信息;
其中,用户信息包括身份信息和号码信息。业务场景信息可以是银行贷款催收业务、物品销售业务或信息采集业务等需要主动问询的场景,可按照实际需求合理设置。
步骤302,加载业务场景信息对应的会话文本集;
其中,会话文本集包括至少两个会话文本,至少两个会话文本之间存在会话逻辑,会话逻辑用于指示会话节点处不同意图类别对应的会话文本。当前会话文本和目标会话文本均在至少两个会话文本中选取。
在该实施例中,机器人在执行外呼任务,按照管理者设定的服务业务场景加载相应的会话文本集,以采用与服务业务场景相关的话术与用户沟通,从而提高机器人外呼的多场景适应性。
步骤303,按照号码信息发起外呼通话;
步骤304,在外呼通话处于接通状态的情况下,根据会话逻辑的顺序,确定会话文本集中的初始会话文本;
步骤305,按照身份信息,输出初始会话文本。
其中,身份信息包括用户的姓名、年龄、身份证号、电话号等。
在该实施例中,从至少两个会话文本中选取处于会话逻辑的顺序中第一句的会话文本作为初始会话文本,以开始本次外呼通话。同时,考虑到通话对端用户的身份差异,通过身份信息对模板化的初始会话文本进行修正,在输出修正后的初始会话文本,有利于提升用户的亲切感。
例如,会话文本集中的初始会话文本为“您好,请问您是手机尾号aaaa的bb先生吗”,此时,按照用户的身份信息,将初始会话文本修改为“您好,请问您是手机尾号cccc的dd先生吗”。
在本申请实施例中,进一步地,机器人的外呼控制方法还包括:将机器人输出的会话文本、用户会话内容和意图类别关联存储。
在该实施例中,在无论用户或机器人主动挂断通话,均将此次通话的所有会话文本、用户会话内容和识别出的意图类别进行关联存储,以便于后续通过存储的通话数据作为历史通话样本来修正意图分类模型,进而使意图分类模型能够对多种不同的用户会话内容进行分析,得到更加准确的用户意图。
在本申请实施例中,进一步地,输出意图类别对应的目标会话文本的步骤,具体包括:识别用户会话内容对应的方言类别;按照方言类别,对目标会话文本进行语音转换处理;输出语音转换处理后的目标会话文本。
在该实施例中,考虑到地域语言文化的差异,为了更好的为提供服务,在首次获得用户反馈的语音的用户会话内容时,利用目标语音模型对用户会话内容的方言类别进行识别。按照方言类别以及方言与普通话之间的映射关系,将目标会话文本转换成方言的语音数据,以实现对目标会话文本进行语音转换处理。最后按照方言的语音数据输出目标会话文本。从而在外呼通话过程中,识别用户的方言类别,并将目标会话文本转化为该方言类别的语音,有利于提升用户的亲切感,促进通话顺利进行,特别是针对推销类的服务业务,使人机沟通更加流畅。
其中,目标语音模型可根据终端采集的不同地域的用户的语音数据样本的发音特征对语音数据样本进行分类,并确定出分类后的语音数据样本对应的地域信息样本,以及以地域信息样本和语音数据样本的发音特征对训练模型进行训练得到的,以提高方言语音识别的正确率。
值得一提到是,若通话对端的用户的身份信息包括地域信息,还可以通过身份信息中用户所处的地域信息,在机器人与用户进行通话时直接加载与该地域信息绑定的语音包。使得外呼通话时,输出的会话文本均满足地域语言的要求,而且能够省去方言识别的步骤,有利于沟通效率。
如图4所示,在本申请的一个具体实施例中,提供了一种基于意图识别的保险营销外呼机器人的控制方法,包括:
1.配置机器人需要播报的文本内容以及各个节点之间的跳转逻辑。
2.通过语音转文字功能,将用户输入的语音转化成机器能读懂的文字序列,从而将文本向量化,在将文本序列输入到意图分类模型中得到代表用户的真实意图的意图类别。
3.按照意图类别映射原始话术中当前对话节点配置的跳转逻辑选项,并将结果保存,然后通过逻辑跳转将当前解析的会话数据传送给机器人并跳到对应的节点上继续播报该节点上的话术,直至分类结果满足预设条件后结束外呼。
4.定义人机交互信息实体包括节点id,意图名称,用户通话内容,机器人话术文本,并将人机会话上下文状态记录下来,为外呼机器人根据用户请求作出精确响应提供了大量的数据支撑。
在该实施例中,采用大规模预训练模型进行意图识别,极大的提高了用户意图识别准确率,提高用户体验,而且实现了人机交互中信息的处理和机器人逻辑跳转功能,可以拓展到任意场景,有利于提升服务业务的转化率。
进一步地,作为上述机器人的外呼控制方法的具体实现,本申请实施例提供了一种机器人的外呼控制装置,如图5所示,该机器人的外呼控制装置500包括:第一获取模块501、意图分析模块502以及输出模块503。
其中,第一获取模块501,用于获取基于机器人输出的当前会话文本反馈的用户会话内容;意图分析模块502,用于分析用户会话内容所属的意图类别;输出模块503,用于按照当前会话文本所处节点的会话逻辑,输出意图类别对应的目标会话文本。
在该实施例中,在机器人执行外呼任务的过程中,通过分析用户针对机器人输出的当前会话文本反馈的真实意图,以及机器人会话文本的逻辑性,进行会话文本的跳转。一方面,无需人工即可完成外呼任务,不仅降低了人工成本,而且提升的业务服务效率;另一方面,通过意图分析能够尽可能多的降低因用户反馈文本不符合预期反馈关键字匹配或模式匹配导致的重复提问的可能性提升了外呼交互灵活性和准确度,保证机器人继续进行外呼通话,有利于提升通话对端用户的服务感受。
进一步地,意图分析模块502,具体包括:第一确定模块(图中未示出),用于确定用户会话内容的第一文本序列;模型分析模块(图中未示出),用于将第一文本序列输入意图分类模型,以确定用户会话内容所属的意图类别。
进一步地,机器人的外呼控制装置500还包括:第二获取模块(图中未示出),用于获取历史通话样本和预设意图词典,预设意图词典包括预设意图类别和预设意图类别对应的预设语义特征;特征提取模块(图中未示出),用于提取历史通话样本的第二文本序列的语义特征;第二确定模块(图中未示出),用于在语义特征和预设语义特征的相似度大于相似度阈值的情况下,将预设语义特征对应的预设意图类别确定为意图类别样本;训练模块(图中未示出),用于根据第二文本序列和意图类别样本,训练意图分类模型。
进一步地,输出模块503,还用于在意图类别属于预设会话文本的第一意图类别范围的情况下,输出结束会话文本,并挂断机器人的外呼通话。
进一步地,机器人的外呼控制装置500还包括:转接模块(图中未示出),用于在意图类别属于当前会话文本所处节点的第二意图类别范围的情况下,将外呼通话转接至人工会话对应的终端。
进一步地,机器人的外呼控制装置500还包括:第三获取模块(图中未示出),用于机器人的获取业务场景信息和用户信息,用户信息包括身份信息和号码信息;加载模块(图中未示出),用于加载业务场景信息对应的会话文本集,会话文本集包括至少两个会话文本,至少两个会话文本之间存在会话逻辑;
外呼模块(图中未示出),用于按照号码信息发起外呼通话;第三确定模块(图中未示出),用于在外呼通话处于接通状态的情况下,根据会话逻辑的顺序,确定会话文本集中的初始会话文本;输出模块503,还用于按照身份信息,输出初始会话文本。
进一步地,机器人的外呼控制装置500还包括:存储模块(图中未示出),用于将机器人输出的会话文本、用户会话内容和意图类别关联存储。
进一步地,机器人的外呼控制装置500还包括:识别模块(图中未示出),用于识别用户会话内容对应的方言类别;转换模块(图中未示出),用于按照方言类别,对目标会话文本进行语音转换处理;输出模块503,具体用于输出语音转换处理后的目标会话文本。
根据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,程序被处理器执行时实现上述机器人的外呼控制方法。
根据本申请再一个方面,提供了一种终端,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述机器人的外呼控制方法。
需要说明的是,本申请实施例提供的一种机器人的外呼控制装置所涉及各功能模块的其他相应描述,可以参考图1至图4的对应描述,在此不再赘述。
基于上述如图1至图4所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1至图4所示的机器人的外呼控制方法。
基于这样的理解,本申请的技术方案可以以软件产品或硬件产品或软硬件相结合的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台终端(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景的方法。
基于上述如图1至图4所示的方法,以及图5所示的机器人的外呼控制装置实施例,为了实现上述目的,本申请实施例还提供了一种终端,具体可以为个人计算机、服务器、网络设备等,该终端包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1至图4所示的机器人的外呼控制方法。
可选地,该终端还可以包括用户接口、网络接口、摄像头、射频(Radio Frequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种终端结构并不构成对该终端的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存终端硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各控件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的单元或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的单元可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的单元可以合并为一个单元,也可以进一步拆分成多个子单元。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。
Claims (10)
1.一种机器人的外呼控制方法,其特征在于,所述方法包括:
获取基于所述机器人输出的当前会话文本反馈的用户会话内容;
分析所述用户会话内容所属的意图类别;
按照所述当前会话文本所处节点的会话逻辑,输出所述意图类别对应的目标会话文本。
2.根据权利要求1所述的机器人的外呼控制方法,其特征在于,所述分析所述用户会话内容所属的意图类别,具体包括:
确定所述用户会话内容的第一文本序列;
将所述第一文本序列输入意图分类模型,以确定所述用户会话内容所属的意图类别。
3.根据权利要求2所述的机器人的外呼控制方法,其特征在于,所述将所述第一文本序列输入意图分类模型之前,还包括:
获取历史通话样本和预设意图词典,所述预设意图词典包括预设意图类别和所述预设意图类别对应的预设语义特征;
提取所述历史通话样本的第二文本序列的语义特征;
在所述语义特征和所述预设语义特征的相似度大于相似度阈值的情况下,将所述预设语义特征对应的预设意图类别确定为意图类别样本;
根据所述第二文本序列和所述意图类别样本,训练所述意图分类模型。
4.根据权利要求1所述的机器人的外呼控制方法,其特征在于,所述方法还包括:
在所述意图类别属于预设会话文本的第一意图类别范围的情况下,输出结束会话文本,并挂断所述机器人的外呼通话;和/或
在所述意图类别属于所述当前会话文本所处节点的第二意图类别范围的情况下,将所述机器人的外呼通话转接至人工会话对应的终端。
5.根据权利要求1至4中任一项所述的机器人的外呼控制方法,其特征在于,所述获取基于所述机器人输出的当前会话文本反馈的用户会话内容之前,还包括:
获取所述机器人的业务场景信息和用户信息,所述用户信息包括身份信息和号码信息;
加载所述业务场景信息对应的会话文本集,所述会话文本集包括至少两个会话文本,所述至少两个会话文本之间存在所述会话逻辑;
按照所述号码信息发起所述机器人的外呼通话;
在所述外呼通话处于接通状态的情况下,根据所述会话逻辑的顺序,确定所述会话文本集中的初始会话文本;
按照所述身份信息,输出所述初始会话文本。
6.根据权利要求1至4中任一项所述的机器人的外呼控制方法,其特征在于,所述方法还包括:
将所述机器人输出的会话文本、所述用户会话内容和所述意图类别关联存储。
7.根据权利要求1至4中任一项所述的机器人的外呼控制方法,其特征在于,所述输出所述意图类别对应的目标会话文本,具体包括:
识别所述用户会话内容对应的方言类别;
按照所述方言类别,对所述目标会话文本进行语音转换处理;
输出语音转换处理后的所述目标会话文本。
8.一种机器人的外呼控制装置,其特征在于,所述装置包括:
第一获取模块,用于获取基于所述机器人输出的当前会话文本反馈的用户会话内容;
意图分析模块,用于分析所述用户会话内容所属的意图类别;
输出模块,用于按照所述当前会话文本所处节点的会话逻辑,输出所述意图类别对应的目标会话文本。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的机器人的外呼控制方法。
10.一种终端,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的机器人的外呼控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210043093.0A CN114528386A (zh) | 2022-01-14 | 2022-01-14 | 机器人的外呼控制方法、装置、存储介质和终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210043093.0A CN114528386A (zh) | 2022-01-14 | 2022-01-14 | 机器人的外呼控制方法、装置、存储介质和终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114528386A true CN114528386A (zh) | 2022-05-24 |
Family
ID=81620690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210043093.0A Pending CN114528386A (zh) | 2022-01-14 | 2022-01-14 | 机器人的外呼控制方法、装置、存储介质和终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114528386A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846127A (zh) * | 2018-06-29 | 2018-11-20 | 北京百度网讯科技有限公司 | 一种语音交互方法、装置、电子设备和存储介质 |
CN110704594A (zh) * | 2019-09-27 | 2020-01-17 | 北京百度网讯科技有限公司 | 基于人工智能的任务型对话交互处理方法、装置 |
CN111177310A (zh) * | 2019-12-06 | 2020-05-19 | 广西电网有限责任公司 | 电力服务机器人智能场景会话方法及装置 |
CN111654582A (zh) * | 2020-06-05 | 2020-09-11 | 中国银行股份有限公司 | 一种智能外呼方法及装置 |
CN111881271A (zh) * | 2020-07-08 | 2020-11-03 | 泰康保险集团股份有限公司 | 一种实现自动对话的方法和装置 |
CN111949784A (zh) * | 2020-08-14 | 2020-11-17 | 中国工商银行股份有限公司 | 基于意图识别的外呼方法及装置 |
CN112131359A (zh) * | 2020-09-04 | 2020-12-25 | 交通银行股份有限公司太平洋信用卡中心 | 一种基于图形化编排智能策略的意图识别方法及电子设备 |
CN112256854A (zh) * | 2020-11-05 | 2021-01-22 | 云南电网有限责任公司 | 一种基于ai自然语言理解的智能ai会话方法及装置 |
CN112732911A (zh) * | 2020-12-30 | 2021-04-30 | 平安科技(深圳)有限公司 | 基于语义识别的话术推荐方法、装置、设备及存储介质 |
CN113591463A (zh) * | 2021-07-30 | 2021-11-02 | 中国平安人寿保险股份有限公司 | 意图识别方法、装置、电子设备及存储介质 |
CN113840040A (zh) * | 2021-09-22 | 2021-12-24 | 平安普惠企业管理有限公司 | 一种人机协作的外呼方法、装置、设备及存储介质 |
-
2022
- 2022-01-14 CN CN202210043093.0A patent/CN114528386A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846127A (zh) * | 2018-06-29 | 2018-11-20 | 北京百度网讯科技有限公司 | 一种语音交互方法、装置、电子设备和存储介质 |
CN110704594A (zh) * | 2019-09-27 | 2020-01-17 | 北京百度网讯科技有限公司 | 基于人工智能的任务型对话交互处理方法、装置 |
CN111177310A (zh) * | 2019-12-06 | 2020-05-19 | 广西电网有限责任公司 | 电力服务机器人智能场景会话方法及装置 |
CN111654582A (zh) * | 2020-06-05 | 2020-09-11 | 中国银行股份有限公司 | 一种智能外呼方法及装置 |
CN111881271A (zh) * | 2020-07-08 | 2020-11-03 | 泰康保险集团股份有限公司 | 一种实现自动对话的方法和装置 |
CN111949784A (zh) * | 2020-08-14 | 2020-11-17 | 中国工商银行股份有限公司 | 基于意图识别的外呼方法及装置 |
CN112131359A (zh) * | 2020-09-04 | 2020-12-25 | 交通银行股份有限公司太平洋信用卡中心 | 一种基于图形化编排智能策略的意图识别方法及电子设备 |
CN112256854A (zh) * | 2020-11-05 | 2021-01-22 | 云南电网有限责任公司 | 一种基于ai自然语言理解的智能ai会话方法及装置 |
CN112732911A (zh) * | 2020-12-30 | 2021-04-30 | 平安科技(深圳)有限公司 | 基于语义识别的话术推荐方法、装置、设备及存储介质 |
CN113591463A (zh) * | 2021-07-30 | 2021-11-02 | 中国平安人寿保险股份有限公司 | 意图识别方法、装置、电子设备及存储介质 |
CN113840040A (zh) * | 2021-09-22 | 2021-12-24 | 平安普惠企业管理有限公司 | 一种人机协作的外呼方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7406413B2 (en) | Method and system for the processing of voice data and for the recognition of a language | |
CN109065052B (zh) | 一种语音机器人 | |
CN106406806A (zh) | 一种用于智能设备的控制方法及装置 | |
CN111241260A (zh) | 基于人机交互的数据处理方法、装置、设备及存储介质 | |
US20040002868A1 (en) | Method and system for the processing of voice data and the classification of calls | |
US20040042591A1 (en) | Method and system for the processing of voice information | |
CN110489519B (zh) | 基于会话预测模型的会话方法及相关产品 | |
CN111462726A (zh) | 一种外呼应答方法、装置、设备及介质 | |
CN113901837A (zh) | 一种意图理解方法、装置、设备及存储介质 | |
CN110047473B (zh) | 一种人机协作交互方法及系统 | |
CN116052646B (zh) | 语音识别方法、装置、存储介质和计算机设备 | |
US20040006464A1 (en) | Method and system for the processing of voice data by means of voice recognition and frequency analysis | |
CN115658875B (zh) | 基于聊天服务的数据处理方法及相关产品 | |
CN115083412B (zh) | 语音交互方法及相关装置、电子设备、存储介质 | |
CN114528386A (zh) | 机器人的外呼控制方法、装置、存储介质和终端 | |
CN110740212A (zh) | 基于智能语音技术的通话接听方法、装置及电子设备 | |
US7343288B2 (en) | Method and system for the processing and storing of voice information and corresponding timeline information | |
CN110765242A (zh) | 一种客服信息的提供方法,装置及系统 | |
JP6929960B2 (ja) | 情報処理装置及び情報処理方法 | |
CN110888971B (zh) | 机器人客服与用户的多轮交互方法和装置 | |
CN117059082B (zh) | 基于大模型的外呼通话方法、装置、介质和计算机设备 | |
CN117648408B (zh) | 基于大模型的智能问答方法、装置、电子设备及存储介质 | |
CN115577092B (zh) | 用户话句处理方法、装置、电子设备及计算机存储介质 | |
CN116453522B (zh) | 语音识别方法、装置、电子设备及可读存储介质 | |
CN115414666B (zh) | 基于成语接龙游戏的语音数据处理方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100102 201 / F, block C, 2 lizezhong 2nd Road, Chaoyang District, Beijing Applicant after: Beijing Shuidi Technology Group Co.,Ltd. Address before: 100102 201, 2 / F, block C, No.2 lizezhong 2nd Road, Chaoyang District, Beijing Applicant before: Beijing Health Home Technology Co.,Ltd. |