CN115240676A - 智能外呼方法、装置、计算机设备及存储介质 - Google Patents

智能外呼方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN115240676A
CN115240676A CN202210920853.1A CN202210920853A CN115240676A CN 115240676 A CN115240676 A CN 115240676A CN 202210920853 A CN202210920853 A CN 202210920853A CN 115240676 A CN115240676 A CN 115240676A
Authority
CN
China
Prior art keywords
intention
target
data
key data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210920853.1A
Other languages
English (en)
Inventor
孙梓淇
张智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202210920853.1A priority Critical patent/CN115240676A/zh
Publication of CN115240676A publication Critical patent/CN115240676A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

本发明公开了一种智能外呼方法、装置、计算机设备及存储介质,该方法包括:获取目标领域的客户语音数据;对所述客户语音数据进行语音识别和语义解析,获取客户文本数据;对所述客户文本数据进行文本预处理,获取目标关键数据;采用所述目标领域对应的多意图识别模型,对所述目标关键数据进行识别,确定至少一个目标意图;获取至少一个所述目标意图对应的语音回复数据,基于所述语音回复数据进行外呼。该方法根据客服回复识别多个意图,准确地找到客户的诉求提高智能外呼的响应质量和响应效率。

Description

智能外呼方法、装置、计算机设备及存储介质
技术领域
本发明涉及人工智能领域,尤其涉及一种智能外呼方法、装置、计算机设备及存储介质。
背景技术
外呼是指电话通过电脑自动往外拨打用户电话,将录制好的语音通过电脑播放给用户,它是电脑电话集成一体代客户服务中心系统不可或缺的一个组成部分。智能外呼系统是业内较为通用的一种方式,一些重复性的通知可以使用机器进行播报,减少人力浪费。在智能外呼系统中,对客户回复的语音数据及时准确地进行意图识别是非常重要的,只有准确地识别出客户意图,才能针对性的给出应对方式,比如转人工电话、资讯类问题或者修改个人信息等。现在智能外呼系统在对语音数据进行效意图识别时,会由于意图识别准确率低,而导致无法及时进行有效效果,从而影响服务体验。
发明内容
本发明实施例提供一种智能外呼方法、装置、计算机设备及存储介质,以解决智能外呼系统中存在意图识别准确率低的问题。
一种智能外呼方法,包括:
获取目标领域的客户语音数据;
对所述客户语音数据进行语音识别和语义解析,获取客户文本数据;
对所述客户文本数据进行文本预处理,获取目标关键数据;
采用所述目标领域对应的多意图识别模型,对所述目标关键数据进行识别,确定至少一个目标意图;
一种智能外呼装置,包括:
客户语音数据获取模块,用于获取目标领域的客户语音数据;
客户文本数据获取模块,用于对所述客户语音数据进行语音识别和语义解析,获取客户文本数据;
目标关键数据获取模块,用于对所述客户文本数据进行文本预处理,获取目标关键数据;
目标意图确定模块,用于采用所述目标领域对应的多意图识别模型,对所述目标关键数据进行识别,确定至少一个目标意图;
外呼模块,用于获取至少一个所述目标意图对应的语音回复数据,基于所述语音回复数据进行外呼。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述智能外呼方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述智能外呼方法。
上述智能外呼方法、装置、计算机设备及存储介质,对目标领域的客户语音数据进行语音识别和语义解析,获得客户文本数据,保障了客户意图识别的可行性;对客户文本数据进行预处理,获得目标关键数据,有助于保障目标意图的识别准确率和识别效率;采用目标领域对应的多意图识别模型对目标关键数据进行识别,确定至少一个目标意图,提高多意图识别的准确率和识别效率;基于目标意图对应的语音回复数据进行外呼,根据目标意图做出相应的外呼操作,提高智能外呼的响应质量和响应效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中智能外呼方法的一应用环境示意图;
图2是本发明一实施例中智能外呼方法的一流程图;
图3是本发明一实施例中智能外呼方法的另一流程图;
图4是本发明一实施例中智能外呼方法的另一流程图;
图5是本发明一实施例中智能外呼方法的另一流程图;
图6是本发明一实施例中智能外呼方法的另一流程图;
图7是本发明一实施例中智能外呼方法的另一流程图;
图8是本发明一实施例中智能外呼方法的另一流程图;
图9是本发明一实施例中智能外呼装置的一示意图;
图10是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的智能外呼方法,该智能外呼方法可应用如图1所示的应用环境中。具体地,该智能外呼方法应用在智能外呼系统中,该智能外呼系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于实现对客户语音数据进行多意图识别,并基于识别到的至少一个目标意图进行智能外呼,有助于提高客户体验。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种智能外呼方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S201:获取目标领域的客户语音数据;
S202:对客户语音数据进行语音识别和语义解析,获取客户文本数据;
S203:对客户文本数据进行文本预处理,获取目标关键数据;
S204:采用目标领域对应的多意图识别模型,对目标关键数据进行识别,确定至少一个目标意图;
S205:获取至少一个目标意图对应的语音回复数据,基于语音回复数据进行外呼。
其中,目标领域是指智能外呼系统与客户进行语音沟通内容所属的领域,例如,在应用智能外呼系统进行保险业务推荐时,其所属的目标领域为保险领域。客户语音数据是指智能外呼系统与客户通话过程中采集到的语音数据。一般来说,在智能外呼系统与客户进行通话过程中,会预先提示客户存在通话录音,经客户允许后,即可获取通话过程中采集到的客户语音数据。
作为一示例,步骤S201中,在采用智能外呼系统与客户进行通话过程中,经客户允许,服务器会获取通话内容所属的目标领域对应的客户语音数据,以便基于客户语音数据进行意图识别和响应。
其中,客户文本数据是对客户语音数据进行语音识别和语义解析得到的文本数据。
作为一示例,步骤S202中,服务器对客户语音数据进行语音识别和语义解析,具体可采用语音识别工具对客户语音数据进行识别,以将语音内容转换成文本内容,再采用语义解析工具对客户语音数据识别到的文本内容进行解析,获得客户文本数据,为接下来客户意图识别做准备。
其中,目标关键数据是为客户文本数据进行文本预处理得到的数据。文本处理方式采用分词,然后对每个句子进行去除停用词和标点符号。停用词是指为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词。
作为一示例,步骤S203中,服务器对客户文本数据进行预处理,具体是指采用预先设置的筛选过滤逻辑,对客户文本数据进行筛选过滤处理,以达到自动过滤掉部分对意图识别无关的字或词,以获取目标关键数据,可节省后续意图识别过程所需的内存空间并提高搜索效率,避免无关信息的干扰,有助于提高意图识别的处理效率和识别准确率。筛选过滤逻辑是预先设置的用于筛选过滤与意图识别无关的字或词的处理逻辑。
其中,目标意图对目标关键数据识别得到的意图。目标领域对应的多意图识别模型是指采用目标领域对应的训练数据,训练出的可以同时识别多个意图的模型。
作为一示例,步骤S204中,服务器将目标领域的多意图识别模型对同一目标领域的目标关键数据进行识别,相比于单意图识别模型,可同时识别至少一个目标意图,有助于提高目标意图识别准确性;由于多意图识别模型与目标关键数据对应同一目标领域,可进一步保障目标意图识别的准确率。本示例中,多意图识别模型是采用多个单意图识别模型构建的多分类模型,在利用多意图识别模型对目标关键数据进行识别时,每个单意图识别模型均可输出一个概率较高的目标意图,以达到同时获取至少一个目标意图的目的,提高至少一个目标意图的识别准确性和识别效率。
其中,语音回复数据是根据获得目标意图对客户语音回复的数据
作为一示例,步骤S205中,服务器在获取到至少一个目标意图后,可根据至少一个目标意图,判断是否存在至少一个目标意图相对应的意图回复文本。该意图回复文本是指对至少一个目标意图进行回复的文本数据。若存在至少一个目标意图对应的意图回复文本,采用文本转语音工具,对意图回复文本进行语音转换,获取语音回复数据,再基于语音回复数据进行外呼,以实现根据识别出的至少一个目标意图进行智能语音回复,有助于提高语音回复效率,提高客户体验。若不存在至少一个目标意图对应的意图回复文本,则根据当前节点跳到不同外呼处理方式,例如,可以是转人工,也可以是请稍后再拨,或者是进行解释与安抚等处理,以便根据至少一个目标意图做出相应的外呼操作,提高智能外呼的响应效率。
本示例中,服务器可基于至少一个目标意图查询系统数据库,判断是否存在每一目标意图相对应的意图响应文本;若每一目标意图均存在意图响应文件,则至少一个目标意图对应的意图响应文本进行拼接,获取意图回复文本,以实现根据至少一个目标意图进行快速响应,有助于提高智能外呼的响应效率。
本实施例所提供的智能外呼方法中,对目标领域的客户语音数据进行语音识别和语义解析,获得客户文本数据,保障了客户意图识别的可行性;对客户文本数据进行预处理,获得目标关键数据,有助于保障目标意图的识别准确率和识别效率;采用目标领域对应的多意图识别模型对目标关键数据进行识别,确定至少一个目标意图,提高多意图识别的准确率和识别效率;基于目标意图对应的语音回复数据进行外呼,根据目标意图做出相应的外呼操作,提高智能外呼的响应质量和响应效率。
在一实施例中,如图3所示,步骤S203中,即对客户文本数据进行文本预处理,获取目标关键数据;
S301:对客户文本数据进行分词,获取原始关键数据;
S302:对原始关键数据进行去除停用词和标点除号处理,获取目标关键数据。
其中,原始关键数据是对客户文本数据进行分词得到的。对客户文本分词采用的分词器。
作为一示例,步骤S301中,服务器将客户文本数据输入到分词器进行分词,获取原始关键数据。本实例中,分词器可以采用但不限于jieba分词。jieba分词是一个Python(一种计算机编程语言)中文分词组件,可以对中文文本进行分词、词性标注和关键词抽取等功能,并且支持自定义词典。
其中,目标关键数据是对原始关键数据进行行去除停用词和标点除号处理得到的数据。
作为一示例,步骤S302中,服务器可对原始关键数据进行去除停用词和标点除号处理,以获取目标关键数据。具体地,停用词和标点除号的剔除,具体预先通过业务逻辑筛选出来的专用名单,这个专用名单上记录需要剔除的停用词和标点符号,服务器可以针对业务逻辑,对原始关键数据进行去除停用词和标点符号的处理,以获取目标关键数据,避免停用词和标号符号对后续意图识别的干扰,有助于保障意图识别的准确率。
本实施例所提供的智能外呼方法中,先采用但不限于jieba分词等分词器,对客户文本数据进行分词,获取原始关键数据;再将原始关键数据进行去停用词和去标点处理,获取目标关键数据;采用先分词,再去除停用词和标点除号处理,避免某些单词单独看是一个不需要的语气词,但这些单词和其他词进行结合,则变成有意义的词组,因此,可提高意图识别的准确率。
在一实施例中,如图4所示,步骤S204中,即目标领域对应的多意图识别模型包括目标领域对应的多个单意图识别模型;
采用目标领域对应的多意图识别模型对目标关键数据进行识别,确定至少一个目标意图,包括:
S401:采用目标领域对应的多个单意图识别模型,分别对目标关键数据进行分析,获取多个单意图识别模型输出的原始意图和原始意图对应的识别概率;
S402:将识别概率大于预设概率的至少一个原始意图,确定为至少一个目标意图。
其中,原始意图为单意图识别模型对目标关键数据分析预测得到的意图。原始意图对应的识别概率是单意图识别模型对目标关键数据分析评估得到某一原始意图对应的概率。每个原始意图对应一个识别概率,识别概率表示预测原始意图的置信度。
作为一示例,步骤S401中,服务器采用目标领域对应的多个单意图识别模型,分别对目标关键数据进行分析,获得每个单意图识别模型预测得到的原始意图和原始意图对应的识别概率。本示例中,采用多个目标领域对应的单意图识别模型对同一目标关键数据进行识别,可识别同一时间进行多意图识别,提高识别范围,有助于提高多意图识别效率。
其中,预设概率是预先设置的用于评估识别概率是否达到较大标准的概率。目标意图为识别概率大于预设概率的原始意图。
作为一示例,步骤S402中,服务器将原始意图对应的识别概率与预先设好的预设概率进行比较,当识别概率大于预设概率,则认定这一原始意图的识别概率达到较大标准,将可识别概率大于预设概率的原始意图为目标意图。本示例中,根据至少一个原始意图对应的识别概率和预设概率的比较结果,确定至少一个目标意图,提高多意图识别的准确率和识别效率。
本实施例所提供的智能外呼方法中,采用多个目标领域对应的单意图识别模型对同一目标关键数据进行识别,可识别同一时间进行多意图识别,提高识别范围,有助于提高多意图识别效率;将原始意图对应的识别概率与预先设好的预设概率进行比较,当识别概率大于预设概率,则认定这一原始意图的识别概率达到较大标准,将可识别概率大于预设概率的原始意图为目标意图,提高多意图识别的准确率和识别效率。
在一实施例中,如图5所示,在获取客户语音数据之前,智能外呼方法还包括:
S501:获取同一目标领域对应的模型训练数据,模型训练数据包括训练文本数据和多意图标签;
S502:获取多个单意图识别模型,基于多个单意图识别模型构建多分类模型,设置多分类模型的最后一层无激活函数,或者设置多分类模型的最后一层采用sigmoid函数或logits函数;
S503:采用模型训练数据对多分类模型进行训练,获取多意图识别模型。
其中,同一目标领域对应的模型训练数据为用于进行模型训练的数据。训练文本数据是用于对模型训练的文本数据。多意图标签是训练模型需要的多标签分类,为了保持训练时输入数据和输出数据的统一和完整性,需要将多意图标签封装成one-hot encoding形式再进行训练,one-hot encoding即独热编码即,又称一位有效编码。本示例中,可使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。
作为一示例,步骤S501中,服务器获取训练文本数据和多意图标签,并将多意图标签封装成one-hot encoding形式,将获取的训练文本数据和封装成one-hot encoding形式的多意图标签作为模型训练数据,为多意图识别模型训练做准备。例如,给训练文本数据标注00101000这一多意图标签,表明其具有第3个意图和第5个意图,没有其他意图,这样就可以将目标领域对应的训练文本数据进行意图区分,使得训练后的多意图识别模型可以同时识别出多个意图。
其中,单意图识别模型是指可识别单一意图的模型。单意图识别模型选择很多从SVM(support vector machines)二分类模型、logistic regression(逻辑回归)到深度神经网络等。多分类模型为多个单分类模型构建得到的模型。激活函数(ActivationFunction)是指在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端。sigmoid函数是使用范围最广的一类激活函数,具有指数函数形状,它在物理意义上最为接近生物神经元,是一个在生物学中常见的S型的函数,也称为S型生长曲线。logits函数线是一种常见的S形函数,logits函数和sigmoid函数互为反函数。
作为一示例,步骤S502中,服务器获取多个单意图识别模型,将多个单意图识别模型构建成多分类模型,服务器设置多分类模型的最后一层无激活函数,或者服务器设置多分类模型的最后一层采用sigmoid函数或logits函数。本示例中,服务器设置多分类模型的最后一层无激活函数,可避免最后一层对多分类模型的输出结果进行加权或者其他处理,以使每个单分类模型均输出一个标签,以使多意图识别模型可进行多意图识别。一般来说,单意图识别模型最后一层的激活函数往往采用softmax函数,Softmax是一种激活函数,它可以将一个数值向量归一化为一个概率分布向量,且各个概率之和为1,所以获取的最大概率对应的单标签,无法选择多标签。本示例中,采用sigmoid激活函数和logits激活函数作为多意图识别模型最后一层的激活函数,由于每个分类都是独立的,不会像softmax函数一样加和等于1,这样的话,如果多个分类的识别概率高于预设概率,则这条数据对应多个分类,以使多意图识别模型可进行多意图识别。
其中,多意图识别模型是采用模型训练数据对多分类模型进行训练得到的。
作为一示例,步骤S503中,服务器采用模型训练数据对多分类模型进行训练,模型训练数据包含训练文本数据和多意图标签,其中多意图标签是one-hot encoding形式,由于标签的形式不同,需要修改多分类模型的损失函数为binary cross entropy(二值交叉熵损失函数)、circle loss或focal loss等。本示例中,服务器需修改多分类模型的标签代码,其中,单分类模型的标签代码是计算概率最大的分类与真实分类的重和率,而多分类模型要修改成多标签分类,使其变为计算大于阈值的分类与真实分类的重合率。服务器将修改好的多分类模型输入模型训练数据进行训练获取多意图识别模型,以使多意图识别模型可进行多意图识别。
本实施例所提供的智能外呼方法中,采用同一目标领域对应的模型训练数据进行训练,为多意图识别模型训练做准备;基于多个单意图识别模型构建多分类模型,多分类模型的最后一层无激活函数或者采用sigmoid函数、logits函数,提高多意图识别模型训练的可行性;将修改好的多分类模型输入模型训练数据进行训练获取多意图识别模型,以使多意图识别模型可进行多意图识别。
在一实施例中,如图6所示,在采用多意图识别模型对目标关键数据进行识别,确定至少一个目标意图之前,智能外呼方法还包括:
S601:采用意图规则引擎,对目标关键数据进行匹配处理,判断意图规则引擎是否能够匹配到目标关键数据对应的第一意图;
S602:若能够匹配到第一意图,则将第一意图确定为目标意图;
S603:若不能匹配到第一意图,则采用目标领域对应的多意图识别模型,对目标关键数据进行识别,确定至少一个目标意图。
其中,规则引擎是指可降低复杂业务逻辑组件复杂性、降低应用程序的维护和可扩展性成本的组件。意图规则引擎是用于实现意图识别的规则引擎。第一意图是规则引擎匹配到与目标关键数据对应的意图。
作为一示例,步骤S601中,服务器采用意图规则引擎对目标关键数据进行匹配处理,判断意图规则引擎是否能匹配到目标关键数据对应的第一意图,以便根据匹配结果,可快速确定目标关键数据对应的目标意图,
作为一示例,步骤S602中,服务器采用意图规则引擎能够匹配到目标关键数据对应的第一意图,服务器将匹配到的第一意图作为目标意图。例如,意图规则引擎识别出目标关键数据中包括“我确认”等反映客户的明确意图用词,则将意图规则引擎中预先确定的第一意图确定为目标意图。本示例中,利用意图规则引擎进行对目标关键数据进行意图匹配,有助于提高目标意图的识别效率。
作为一示例,步骤S603中,服务器采用意图规则引擎不能匹配到目标关键数据对应的第一意图,服务器执行采用目标领域对应的多意图识别模型,对目标关键数据进行识别,确定至少一个目标意图。
本实施例所提供的智能外呼方法中,采用意图规则引擎对目标关键数据进行匹配处理,判断能否匹配到目标关键数据对应的第一意图,若能够匹配到第一意图,则将第一意图作为目标意图,若不能匹配到第一意图,则采用检索分析模型对目标关键数据进行匹配,确定至少一个目标意图。在采用多意图识别模型对目标关键数据进行意图识别之前,先采用意图规则引擎进行识别,降低了智能外呼系统逻辑组件复杂性,提高意图识别的准确性和效率,有提高了智能外呼方法的效率。
在一实施例中,如图7所示,在采用多意图识别模型对目标关键数据进行识别,确定至少一个目标意图之前,智能外呼方法还包括:
S701:采用检索分析模型,对目标关键数据进行匹配处理,判断检索分析模型是否能够匹配到目标关键数据对应的第二意图;
S702:若能够匹配到第二意图,则将第二意图确定为目标意图;
S703:若不能匹配到第二意图,则采用目标领域对应的多意图识别模型,对目标关键数据进行识别,确定至少一个目标意图。
其中,检索分析模型包括ES检索算法和语义匹配模型,ES(ElasticSearch)检索是基于ApacheLucene(TM)的一个开源搜索引擎,是一个分布式且具有高扩展性的全文检索的搜索引擎,而且还提供了近乎实时的索引、分析、搜索功能。第二意图为检索分析模型对目标关键数据进行匹配获得的意图。
作为一示例,步骤S701中,服务器采用检索分析模型对目标关键数据进行匹配,判断检索分析模型是否能匹配到目标关键数据对应的第二意图,以便根据匹配结果,可快速确定目标关键数据对应的目标意图。
作为一示例,步骤S702中,服务器采用检索分析模型对目标关键数据进行匹配,检索分析模型匹配到目标关键数据对应的第二意图时,将第二意图作为目标意图。例如,与服务器相连的ES数据库中预先存储有多个ES配置数据和每个ES配置数据对应的第二意图,服务器可对目标关键数据和其对应的ES配置数据进行匹配处理,可匹配成功,则将ES配置数据对应的第二意图确定为目标意图。
作为一示例,步骤S703中,服务器采用检索分析模型对目标关键数据进行匹配,没有匹配到目标关键数据对应的第二意图,执行采用目标领域对应的多意图识别模型,对目标关键数据进行识别,确定至少一个目标意图。
本实施例所提供的智能外呼方法中,若检索分析模型能够匹配到目标关键数据对应的第二意图,则将第二意图确定为目标意图;若检索分析模型不能匹配到第二意图,则执行采用多意图识别模型,对目标关键数据进行识别,确定至少一个目标意图。在采用多意图识别模型对目标关键数据进行意图识别之前,先采用检索分析模型对目标关键数据进行检索分析,可进一步提高了意图识别的准确率。
在一实施例中,如图8所示,步骤S701中,即采用检索分析模型,对目标关键数据进行匹配处理,判断检索分析模型是否能够匹配到目标关键数据对应的第二意图,包括:
S801:采用ES检索算法,对目标关键数据进行初步检索,获取多个ES配置数据,每一ES配置数据对应一配置意图;
S802:采用语义匹配模型,对多个ES配置数据和目标关键数据进行相似度分析,获取每一ES配置数据对应的目标相似度;
S803:若存在目标相似度大于预设相似度,则将目标相似度对应的ES配置数据对应的配置意图,确定为与目标关键数据对应的第二意图,确定检索分析模型能匹配到第二意图;
S804:若所有目标相似度均不大于预设相似度,则确定检索分析模型不能匹配到第二意图。
其中,ES配置数据是采用ES检索算法对目标关键数据初步检索得到的。配置意图是通过人工标注和日志清洗等方式得到的意图,这部分配置意图存储在ES检索库中。
作为一示例,步骤S801中,服务器采用ES检索算法对目标关键数据进行初步检索,获取多个ES配置数据,并且每一条ES配置数据都有对应的配置意图。此处的ES配置数据可以理解为ES数据库中预先存储的包含目标关键词中的全部或部分关键词的数据。配置意图是指ES数据库中预先存储的与ES配置数据相匹配的意图。
其中,语义匹配模型是判断两句话是否表达了相同或相似意思的模型。目标相似度为采用语义匹配模型将ES配置数据和目标关键数据进行相似度分析得到的相似度。本示例中,由于ES检索数据检索到多个ES配置数据,将每一条ES配置数据都会有一条对应的目标相似度。
作为一示例,步骤S802中,服务器采用语义匹配模型对多个ES配置数据和目标关键数据进行相似度打分,得到每个ES配置数据和目标关键数据之间的目标相似度。本实例中,语义匹配模型采用的是ESIM(Enhanced LSTM for Natural Language Inference)是一个文本相似度计算模型。
其中,预设相似度是预先设置好的相似度阈值。
作为一示例,步骤S803中,服务器将至少一个ES配置数据对应的目标相似度和预设相似度进行比较,若存在目标相似度大于预设相似度,则将目标相似度对应的ES配置数据对应的配置意图作为第二意图。
作为一示例,步骤S804中,服务器将至少一个ES配置数据对应的目标相似度和预设相似度进行比较,若所有目标相似度均不大于预设相似度,则ES配置数据对应的配置意图中不存在第二意图。
本实施例所提供的智能外呼方法中,采用ES检索算法对目标关键数据进行匹配处理,获取多个ES配置数据,每一个ES配置数据对应一个配置意图,为获取第二意图做准备;采用语义匹配模型对ES配置数据和目标关键数据进行相似度打分,得到目标相似度,当目标相似度大于预设相似度,ES配置数据对应的配置意图可作为第二意图;若目标相似度小于预设相似度,则不存在第二意图,以提升意图识别的准确率和识别效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种智能外呼装置,该智能外呼装置与上述实施例中智能外呼方法一一对应。如图9所示,该智能外呼装置包括客户语音数据获取模块901、客户文本数据获取模块902、目标关键数据获取模块903、目标意图确定模块904和外呼模块905。各功能模块详细说明如下:
客户语音数据获取模块901,用于获取目标领域的客户语音数据;
客户文本数据获取模块902,用于对客户语音数据进行语音识别和语义解析,获取客户文本数据;
目标关键数据获取模块903,用于对客户文本数据进行文本预处理,获取目标关键数据;
目标意图确定模块904,用于采用目标领域对应的多意图识别模型,对目标关键数据进行识别,确定至少一个目标意图;
外呼模块905,用于获取至少一个目标意图对应的语音回复数据,基于语音回复数据进行外呼。
在一实施例中,目标关键数据获取模块903,包括:
原始关键数据获取单元,用于对客户文本数据进行分词,获取原始关键数据;
目标关键数据获取单元,用于对原始关键数据进行去除停用词和标点除号处理,获取目标关键数据。
在一实施例中,目标意图确定模块904,包括:
原始意图识别单元,用于采用目标领域对应的多个单意图识别模型,分别对目标关键数据进行分析,获取多个单意图识别模型输出的原始意图和原始意图对应的识别概率;
目标意图确定单元,用于将识别概率大于预设概率的至少一个原始意图,确定为至少一个目标意图。
在一实施例中,该多智能外呼装置,还包括:
模型训练数据获取单元,用于获取同一目标领域对应的模型训练数据,模型训练数据包括训练文本数据和多意图标签;
多分类模型构建单元,用于获取多个单意图识别模型,基于多个单意图识别模型构建多分类模型,设置多分类模型的最后一层无激活函数,或者设置多分类模型的最后一层采用sigmoid函数或logits函数;
多意图识别模型获取单元,用于采用模型训练数据对多分类模型进行训练,获取多意图识别模型。
在一实施例中,该多智能外呼装置,还包括:
规则引擎匹配单元,用于采用意图规则引擎,对目标关键数据进行匹配处理,判断意图规则引擎是否能够匹配到目标关键数据对应的第一意图;
第一规则匹配处理单元,用于若能够匹配到第一意图,则将第一意图确定为目标意图;
第二规则匹配处理单元,用于若不能匹配到第一意图,则采用目标领域对应的多意图识别模型,对目标关键数据进行识别,确定至少一个目标意图。
在一实施例中,该多智能外呼装置,还包括:
检索分析匹配单元,用于采用检索分析模型,对目标关键数据进行匹配处理,判断检索分析模型是否能够匹配到目标关键数据对应的第二意图;
第一检索匹配处理单元,用于若能够匹配到第二意图,则将第二意图确定为目标意图;
第二检索匹配处理单元,用于若不能匹配到第二意图,则采用目标领域对应的多意图识别模型,对目标关键数据进行识别,确定至少一个目标意图。
在一实施例中,检索分析匹配单元,包括:
ES配置数据获取子单元,用于采用ES检索算法,对目标关键数据进行初步检索,获取多个ES配置数据,每一ES配置数据对应一配置意图;
目标相似度获取子单元,用于采用语义匹配模型,对多个ES配置数据和目标关键数据进行相似度分析,获取每一ES配置数据对应的目标相似度;
第一相似度处理子单元,用于若存在目标相似度大于预设相似度,则将目标相似度对应的ES配置数据对应的配置意图,确定为与目标关键数据对应的第二意图,确定检索分析模型能匹配到第二意图;
第二相似度处理子单元,若所有目标相似度均不大于预设相似度,则确定检索分析模型不能匹配到第二意图。
关于智能外呼装置的具体限定可以参见上文中对于智能外呼方法的限定,在此不再赘述。上述智能外呼装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储执行智能外呼过程中采用或生成的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种智能外呼方法。
在一实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中智能外呼方法,例如图2所示S201-S205,或者图3至图8中所示,为避免重复,这里不再赘述。或者,处理器执行计算机程序时实现智能外呼装置这一实施例中的各模块/单元的功能,例如图9所示的客户语音数据获取模块901、客户文本数据获取模块902、目标关键数据获取模块903、目标意图确定模块904和外呼模块905的功能,为避免重复,这里不再赘述。
在一实施例中,提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中智能外呼方法,例如图2所示S201-S205,或者图3至图8中所示,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现上述智能外呼装置这一实施例中的各模块/单元的功能,例如图9所示的客户语音数据获取模块901、客户文本数据获取模块902、目标关键数据获取模块903、目标意图确定模块904和外呼模块905的功能,为避免重复,这里不再赘述。所述计算机可读存储介质可以是非易失性,也可以是易失性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种智能外呼方法,其特征在于,包括:
获取目标领域的客户语音数据;
对所述客户语音数据进行语音识别和语义解析,获取客户文本数据;
对所述客户文本数据进行文本预处理,获取目标关键数据;
采用所述目标领域对应的多意图识别模型,对所述目标关键数据进行识别,确定至少一个目标意图;
获取至少一个所述目标意图对应的语音回复数据,基于所述语音回复数据进行外呼。
2.如权利要求1所述的智能外呼方法,其特征在于,所述对所述客户文本数据进行文本预处理,获取目标关键数据,包括:
对所述客户文本数据进行分词,获取原始关键数据;
对所述原始关键数据进行去除停用词和标点除号处理,获取目标关键数据。
3.如权利要求1所述的智能外呼方法,其特征在于,所述目标领域对应的多意图识别模型包括所述目标领域对应的多个单意图识别模型;
所述采用所述目标领域对应的多意图识别模型对所述目标关键数据进行识别,确定至少一个目标意图,包括:
采用目标领域对应的多个所述单意图识别模型,分别对所述目标关键数据进行分析,获取多个单意图识别模型输出的原始意图和所述原始意图对应的识别概率;
将所述识别概率大于预设概率的至少一个原始意图,确定为至少一个目标意图。
4.如权利要求1所述的智能外呼方法,在所述获取客户语音数据之前,所述智能外呼方法还包括:
获取同一目标领域对应的模型训练数据,所述模型训练数据包括训练文本数据和多意图标签;
获取多个单意图识别模型,基于多个所述单意图识别模型构建多分类模型,设置所述多分类模型的最后一层无激活函数,或者设置所述多分类模型的最后一层采用sigmoid函数或logits函数;
采用所述模型训练数据对所述多分类模型进行训练,获取多意图识别模型。
5.如权利要求1所述的智能外呼方法,在所述采用多意图识别模型对所述目标关键数据进行识别,确定至少一个目标意图之前,所述智能外呼方法还包括:
采用意图规则引擎,对所述目标关键数据进行匹配处理,判断所述意图规则引擎是否能够匹配到所述目标关键数据对应的第一意图;
若能够匹配到所述第一意图,则将所述第一意图确定为目标意图;
若不能匹配到所述第一意图,则采用所述目标领域对应的多意图识别模型,对所述目标关键数据进行识别,确定至少一个目标意图。
6.如权利要求1或5所述的智能外呼方法,在所述采用多意图识别模型对所述目标关键数据进行识别,确定至少一个目标意图之前,所述智能外呼方法还包括:
采用检索分析模型,对所述目标关键数据进行匹配处理,判断所述检索分析模型是否能够匹配到所述目标关键数据对应的第二意图;
若能够匹配到所述第二意图,则将所述第二意图确定为目标意图;
若不能匹配到所述第二意图,则采用所述目标领域对应的多意图识别模型,对所述目标关键数据进行识别,确定至少一个目标意图。
7.如权利要求6所述的智能外呼方法,其特征在于,所述采用检索分析模型,对所述目标关键数据进行匹配处理,判断所述检索分析模型是否能够匹配到所述目标关键数据对应的第二意图,包括:
采用ES检索算法,对所述目标关键数据进行初步检索,获取多个ES配置数据,每一所述ES配置数据对应一配置意图;
采用语义匹配模型,对多个ES配置数据和所述目标关键数据进行相似度分析,获取每一所述ES配置数据对应的目标相似度;
若存在所述目标相似度大于预设相似度,则将所述目标相似度对应的ES配置数据对应的配置意图,确定为与所述目标关键数据对应的第二意图,确定所述检索分析模型能匹配到所述第二意图;
若所有所述目标相似度均不大于所述预设相似度,则确定所述检索分析模型不能匹配到所述第二意图。
8.一种智能外呼装置,其特征在于,包括:
客户语音数据获取模块,用于获取目标领域的客户语音数据;
客户文本数据获取模块,用于对所述客户语音数据进行语音识别和语义解析,获取客户文本数据;
目标关键数据获取模块,用于对所述客户文本数据进行文本预处理,获取目标关键数据;
目标意图确定模块,用于采用所述目标领域对应的多意图识别模型,对所述目标关键数据进行识别,确定至少一个目标意图;
外呼模块,用于获取至少一个所述目标意图对应的语音回复数据,基于所述语音回复数据进行外呼。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述智能外呼方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述智能外呼方法。
CN202210920853.1A 2022-08-02 2022-08-02 智能外呼方法、装置、计算机设备及存储介质 Pending CN115240676A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210920853.1A CN115240676A (zh) 2022-08-02 2022-08-02 智能外呼方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210920853.1A CN115240676A (zh) 2022-08-02 2022-08-02 智能外呼方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN115240676A true CN115240676A (zh) 2022-10-25

Family

ID=83677200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210920853.1A Pending CN115240676A (zh) 2022-08-02 2022-08-02 智能外呼方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN115240676A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117435738A (zh) * 2023-12-19 2024-01-23 中国人民解放军国防科技大学 一种基于深度学习的文本多意图分析方法与系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117435738A (zh) * 2023-12-19 2024-01-23 中国人民解放军国防科技大学 一种基于深度学习的文本多意图分析方法与系统
CN117435738B (zh) * 2023-12-19 2024-04-16 中国人民解放军国防科技大学 一种基于深度学习的文本多意图分析方法与系统

Similar Documents

Publication Publication Date Title
CN110162633B (zh) 语音数据意图确定方法、装置、计算机设备和存储介质
CN109635838B (zh) 人脸样本图片标注方法、装置、计算机设备及存储介质
CN109583325B (zh) 人脸样本图片标注方法、装置、计算机设备及存储介质
CN111753531B (zh) 基于人工智能的文本纠错方法、装置、设备及存储介质
CN108536800B (zh) 文本分类方法、系统、计算机设备和存储介质
CN110472224B (zh) 服务质量的检测方法、装置、计算机设备和存储介质
CN110909137A (zh) 基于人机交互的信息推送方法、装置和计算机设备
CN111324713B (zh) 对话自动回复方法、装置、存储介质和计算机设备
CN110674319A (zh) 标签确定方法、装置、计算机设备及存储介质
CN111191032B (zh) 语料扩充方法、装置、计算机设备和存储介质
CN112380853B (zh) 业务场景交互方法、装置、终端设备及存储介质
CN105243055A (zh) 基于多语言的分词方法和装置
CN110309504B (zh) 基于分词的文本处理方法、装置、设备及存储介质
CN110633475A (zh) 基于计算机场景的自然语言理解方法、装置、系统和存储介质
CN111859916B (zh) 古诗关键词提取、诗句生成方法、装置、设备及介质
CN111309881A (zh) 智能问答中未知问题处理方法、装置、计算机设备和介质
CN114120978A (zh) 情绪识别模型训练、语音交互方法、装置、设备及介质
CN112766319A (zh) 对话意图识别模型训练方法、装置、计算机设备及介质
CN112632248A (zh) 问答方法、装置、计算机设备和存储介质
CN115240676A (zh) 智能外呼方法、装置、计算机设备及存储介质
CN115186080A (zh) 一种智能问答数据处理方法、系统、计算机设备及介质
CN115858776B (zh) 一种变体文本分类识别方法、系统、存储介质和电子设备
CN117093682A (zh) 意图识别方法、装置、计算机设备及存储介质
CN109657071B (zh) 词汇预测方法、装置、设备和计算机可读存储介质
CN115422936A (zh) 实体识别方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination