CN113905135B - 一种智能外呼机器人的用户意向识别方法和装置 - Google Patents

一种智能外呼机器人的用户意向识别方法和装置 Download PDF

Info

Publication number
CN113905135B
CN113905135B CN202111206048.4A CN202111206048A CN113905135B CN 113905135 B CN113905135 B CN 113905135B CN 202111206048 A CN202111206048 A CN 202111206048A CN 113905135 B CN113905135 B CN 113905135B
Authority
CN
China
Prior art keywords
user
intention
model
recognition
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111206048.4A
Other languages
English (en)
Other versions
CN113905135A (zh
Inventor
黄萧
李林
徐丞申
刘荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Chezhijia Software Co ltd
Original Assignee
Tianjin Chezhijia Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Chezhijia Software Co ltd filed Critical Tianjin Chezhijia Software Co ltd
Priority to CN202111206048.4A priority Critical patent/CN113905135B/zh
Publication of CN113905135A publication Critical patent/CN113905135A/zh
Application granted granted Critical
Publication of CN113905135B publication Critical patent/CN113905135B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/527Centralised call answering arrangements not requiring operator intervention

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种智能外呼机器人的用户意向识别方法和装置,所述方法包括:获取整通电话的用户录音,并通过语音识别转成通话文本;对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;构建外呼机器人问题与用户回答意图之间的对应关系;利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。所述装置包括:文本转换模块、意图识别模块、序列构建模块和意向识别模块。本发明考虑了外呼机器人的问题序列和用户回答的意图序列信息,可以提升用户意向识别的准确率,还能够结合外呼机器人问题和用户回答内容进行用户意向分类,能够针对特定类别的准确率和召回率有特定需求的场景提供灵活适配的模型。

Description

一种智能外呼机器人的用户意向识别方法和装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种智能外呼机器人的用户意向识别方法和装置。
背景技术
近年来,随着人工智能技术的飞速发展,智能外呼机器人已经越来越多地应用在企业电话营销领域,例如对用户的购车意向线索清洗、教育产品推销、理财产品营销等。外呼机器人与传统的人工呼叫相比,具有工作效率高、成本低等特点和优势。目前,采用外呼机器人替代人工坐席在企业电话营销领域是大势所趋。外呼机器人和用户的一通电话完成后,通常需要对整通电话的用户意向进行分析,后续,对具有购买意向的客户再通过人工坐席跟进,提升具有购买意向的客户的成交转化率。因此,用户意向的确定在基于外呼机器人的智能营销中起着至关重要的作用。
现有技术中,常用的一种方式是基于规则对用户意向进行分级,例如对整通电话中用户的回答录音通过语音识别技术(ASR,Automatic Speech Recognition)转录成用户回答的文本,再对转录的文本进行意图识别,并基于规则对各意图进行打分,最终得到整通电话用户意向的分值,作为用户意向分级的依据。然而,此类方法依赖对规则的经验性设置,在简单场景下比较有效,在复杂场景下规则设置复杂性大大提升,而且用户意向分类的准确率也得不到保证。例如某具有购买意向的客户在前半段意图识别为不买车,而后半段又表现出买车高意向时,这时通过得分加减很难得到较高的准确率。
此外,现有技术中也有通过训练分类模型来对用户意向进行分类的方法。此类方法对用户的回答直接通过训练分类模型来判断用户的意向。
然而,上述两种方法忽略了外呼机器人的提问问题,由于整通电话是外呼机器人发起提问,用户再回答,并不断循环这一问答过程,而用户的回答是针对问题进行,因此整通电话的问题—回答的序列信息也是至关重要的。
此外,上述两种现有方案都无法对特定级别的用户意向进行召回率或准确率上的修改,其中,准确率=提取出的正确信息条数/提取出的信息条数;召回率=提取出的正确信息条数/样本中的信息条数。例如对于某些厂商,他们的用户线索量非常多,因此,厂商关心的是智能外呼机器人帮忙筛选高意向类别的准确率,而不关心有没有漏检高意向的客户。如果高意向的分类准确率特别高,这样对该类用户进行人工电话介入就可以减少无效的人工电话量。而对另一些厂商,厂商的用户线索较少,因此他们关心高意向类别的召回率,如果外呼机器人筛选后丢掉了一些高意向客户,则对厂商损失较大。因此,针对不同的场景能否灵活配置高准确或者高召回在识别用户意向领域格外重要。
发明内容
为此,本发明提供一种智能外呼机器人的用户意向识别方法和装置,以力图解决或至少缓解上面存在的问题。
根据本发明的第一个方面,提供一种智能外呼机器人的用户意向识别方法,包括:获取整通电话的用户录音,并通过语音识别转成通话文本;对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;构建外呼机器人问题与用户回答意图之间的对应关系;利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。
优选地,所述的方法,还包括:根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
优选地,获取整通电话的用户录音,并通过语音识别转成通话文本包括:对所述用户录音的声道通过静音检测算法得到所述外呼机器人每个提问问题的回答录音,按照所述外呼机器人提问问题的顺序组成回答录音序列;通过语音识别将用户回答录音序列转录为用户回答文本序列。
优选地,对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图包括:利用文本分类模型对所述用户回答文本序列的每个回答分别进行意图识别,得到对应的用户回答的意图序列。
优选地,所述用户意向识别模型通过如下步骤进行训练:对智能外呼机器人收集到的整通电话的样本分别进行用户意向标注;利用携带标注的样本对神经网络模型进行分类训练得到用户意向识别模型;所述神经网络模型的损失函数表示为:
其中,C为分类的类别数目,yj和pj分别代表样本是否属于第j类的真实标签值以及该样本通过模型预测得到的属于第j类的概率值,λj是准确率加权系数,ηj是召回率加权系数。
优选地,根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型包括:对需要提高第x类的准确率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,a大于1;对需要提高第y类的召回率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,b大于1;a和b的值越大,所述神经网络模型对应类的准确度或者召回率越高。
优选地,利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向包括:
采用各个分类的类别中概率值最大的一个类别作为用户的意向。
根据本发明的第二个方面,提供一种智能外呼机器人的用户意向识别装置,包括:文本转换模块,适于获取整通电话的用户录音,并通过语音识别转成通话文本;意图识别模块,适于对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;序列构建模块,适于构建外呼机器人问题与用户回答意图之间的对应关系;意向识别模块,适于利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。
优选地,所述的装置,还包括:适配模块,适于根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
根据本发明的第三个方面,提供一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,当所述程序指令被所述处理器读取并执行时,使得所述计算设备执行上述智能外呼机器人的用户意向识别方法。
根据本发明的第四个方面,提供一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行上述智能外呼机器人的用户意向识别方法。
本发明和现有技术相比,具有如下有益效果:
本申请的智能外呼机器人的用户意向识别方法和装置不仅考虑了外呼机器人的问题序列和用户回答的意图序列信息,可以提升用户意向识别的准确率,还能够结合外呼机器人问题和用户回答内容进行用户意向分类,能够针对特定类别的准确率和召回率有特定需求的场景提供灵活适配的模型。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的智能外呼机器人的用户意向识别方法的流程图;
图2示出了根据本发明一个实施例的智能外呼机器人的用户意向识别方法的示意图;
图3示出了根据本发明一个实施例的智能外呼机器人的用户意向识别装置的结构示意图;
图4是根据本申请实施例的第一种计算机可读存储介质的示意性结构框图;
图5是根据本申请实施例的第二种计算机可读存储介质的示意性结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
针对灵活配置高准确或者高召回的问题,本发明提供了智能外呼机器人的用户意向识别方法,能够结合外呼机器人问题和用户回答内容进行用户意向分类,能够针对特定类别的准确率和召回率有特定需求的场景提供灵活适配的模型。
本发明的智能外呼机器人的用户意向识别方法在计算设备中执行。计算设备可以是任意具有存储和计算能力的设备,其例如可以实现为服务器、工作站等,也可以实现为桌面计算机、笔记本计算机等个人配置的计算机,或者实现为手机、平板电脑、智能可穿戴设备、物联网设备等终端设备,但不限于此。
图1示出了根据本发明一种智能外呼机器人的用户意向识别方法的流程图,可以包括如下将要描述的步骤S101至步骤S104:
在步骤S101中,获取整通电话的用户录音,并通过语音识别转成通话文本。
本发明实施例中,获取整通电话的用户录音,并通过语音识别转成通话文本包括:
对用户录音的声道通过静音检测算法得到外呼机器人每个提问问题的回答录音,按照外呼机器人提问问题的顺序组成回答录音序列;通过语音识别将用户回答录音序列转录为用户回答文本序列。
具体地,在外呼机器人和用户对答的电话录音里,外呼机器人播放的录音和用户回答的录音分别处于不同的声道,对用户录音的声道可以通过静音检测算法(VAD,VoiceActivity Detection)得到每个机器人提问问题对应的用户回答录音录音(AS1,AS2,…,ASn)。相应地,外呼机器人的录音可记为(QS1,QS2,…,QSn)。再通过语音识别(ASR,Automatic Speech Recognition)将用户回答录音序列(AS1,AS2,…,ASn)转录为用户回答文本序列(AT1,AT2,…,ATn)。
例如,在某通完整的电话录音内容为,外呼机器人录音序列的语音包含下述内容:(QS1:您好,请问您近期要买车吗?QS2:我们这有优惠活动,要不要给您介绍一下),用户回答录音序列包含下述内容:(AS1:不买;AS2:不用,再见)。对该通电话,序列长度n=2。对上述例子,用户回答文本序列为:(AT1:不买;AT2:不用,再见)。其中语音识别模型可通过调用讯飞、阿里等厂商提供的第三方接口实现或其他方案实现。
在步骤S102中,对所述通话文本进行意图识别,得到每个问题(即外呼机器人的录音中提问的每个问题)对应的用户回答的意图。
本发明实施例中,对通话文本进行意图识别,得到每个问题对应的用户回答的意图包括:
利用文本分类模型对用户回答文本序列的每个回答分别进行意图识别,得到对应的用户回答的意图序列。
具体地,针对步骤S101得到的用户回答文本序列,利用文本分类模型对用户回答文本序列的各个回答分别进行意图识别,得到对应的意图。本发明实施例中文本分类模型可采用业Textcnn或BERT等模型进行,用户回答的文本序列(AT1,AT2,…,ATn)转化为用户回答的意图序列(AP1,AP2,…,APn),其中
APi∈{A1,A2,...,Ak}
其中,k为用户回答的意图的个数,Ai为意图集合中第i个意图。其中,用户回答的意图序列长度n和意图集合的意图数k不相关。例如对上述例子,用户回答的意图序列为(AP1:不买车意图;AP2:否定意图)。这里意图种类数根据业务需要制定,例如某场景中k=50,这样就将用户回答文本的无限维空间压缩到用户回答的意图空间50维。
在步骤S103中,构建外呼机器人问题与用户回答意图之间的对应关系。
本发明实施例中,步骤S102得到用户回答的意图序列,在真实的外呼电话中,是通过外呼机器人提问问题和用户回答的循环完成的。一来用户回答即使是相同的意图,在不同的问题节点下的意义也不同。二来在外呼机器人流程管理里,会根据用户回答意图配置不同的跳转流程,问题的序列也会影响最终用户意向的判别。因此,结合外呼机器人的问题序列进行用户意向识别是有必要的。
在一通外呼电话中,外呼机器人的问题序列为预设的问题集合中元素的一种排列。外呼机器人的录音(QS1,QS2,…,QSn)可转为问题序列(QP1,QP2,…,QPn),其中
QPi∈{Q1,Q2,...,Qm}
m为外呼机器人问题集合的问题个数,Qi为问题集合中第i个问题。其中问题序列的长度n和问题结合的问题数m不相关。例如,对上述例子,问题的录音序列(QS1:您好,请问您近期要买车吗?QS2:我们这有优惠活动,要不要给您介绍一下)可转化为问题序列(QP1:是否买车问题;QP2:活动引导问题)。
对于一通完整的电话,特征可以抽取为问题—用户回答意图序列对(pairsequence),可记为((QP1,AP1),(QP2,AP2),…,(QPn,APn)),并且有QPi∈{Q1,Q2,...,Qm},APi∈{A1,A2,...,Ak}。每一条序列对可作为一条完整的特征,由于QPi和APi是离散的特征,因此,编码方式可采取one-hot编码,即将(QPi,APi)这样的对(pair)编码为(k+m)维的向量,因此,编码后的一条样本可转化为n*(k+m)维的二维矩阵。
在步骤S104中,利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。
本发明实施例中步骤S104中所述用户意向识别模型通过如下步骤进行训练:对智能外呼机器人收集到的整通电话的样本分别进行用户意向标注;利用携带标注的样本对神经网络模型进行分类训练得到用户意向识别模型;所述神经网络模型的损失函数表示为:
其中,C为分类的类别数目,yj和pj分别代表样本是否属于第j类的真实标签值以及该样本通过模型预测得到的属于第j类的概率值,λj是准确率加权系数,ηj是召回率加权系数。
本发明实施例步骤S103中得到了一通完整电话的问题—用户回答意图序列对,并将其编码为维度为n*(k+m)维的二维矩阵。本发明实施例采用基于深度学习的分类模型来对样本进行训练,以得到最终的用户意向识别模型,其中特征提取模块可选取为卷积神经网络(Convolutional Neural Networks,CNN),也可以选长短期记忆人工神经网络(Long-Short Term Memory,LSTM),以及Transfomer模型等,本发明实施例中对此不作限制。作为实施例,这里考虑问题—用户回答意图序列对具有长时序列特征,因此选择LSTM作为分类的神经网络。
本实施例采用的LSTM分类网络的训练方法如下:智能外呼机器人收集到的整通电话带用户意向标注的样本,类别分别标注为明确有意向(0类)、可能有意向(1类)、明确无意向(2类)。
带标注的样本进行训练,其中损失函数采用加权损失函数:
其中,C为分类的类别数目,yj和pj分别代表该样本是否属于第j类的真实标签值(属于则值为1,不属于则值为0),以及该样本通过模型预测得到的属于第j类的概率值。λj、ηj分别是准确率加权系数和召回率加权系数。
本发明实施例中所述意图为整通电话中每个机器人提问问题对应的用户回答的倾向性的分类。所述意向为整通电话完成后,对用户倾向性的分类。
如图2所示,本发明实施例的智能外呼机器人的用户意向识别方法,还可以包括步骤S105:
在步骤S105中,根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
其中,根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型包括:对需要提高第x类的准确率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,a大于1;对需要提高第y类的召回率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,b大于1;a和b的值越大,所述神经网络模型对应类的准确度或者召回率越高。
利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向包括:采用各个分类的类别中概率值最大的一个类别作为用户的意向。
例如,对特定场景下想提高第x类的准确率,则训练模型时可以将损失函数的权重设为:
若对特定场景下想提高第y类的召回率,则训练模型时可以将损失函数的权重设为
式中100为给定的一个例子,也可以根据需要改成不同的值,该值越大,表示模型预测为第x类的准确度或者第y类的召回率越高。
本发明实施例中的分类模型为多标签分类模型,根据上述分类模型的损失函数可以看成有C个标签,每个标签是二分类的问题(是和否);而对本实施例中对每通电话样本,需要得出一个意向,因此可以采用取各标签之间概率值最大的那个标签作为最终结果,因此对任意新来的整通电话样本,通过多标签分类模型预测得出用户意向类别为第z类,即
本发明实施例中分别给出了对高准确率场景和高召回率场景基于修改损失函数的模型训练方式。在实际场景中,对于用户意向的管理系统,针对不同厂商的不同需求场景,分为普通模型、高准确率模型和高召回率模型三种来进行管理,对于某些厂商需求对外呼机器人筛选出的买车高意向客户的准确率要求高时,模型管理选取高准确率模型,对于某些厂商需求对外呼机器人筛选出的买车高意向客户的召回率要求高时,模型管理选取高召回率模型,其余无特殊要求的采用普通模型。
如图3所示,本发明实施例还提供一种智能外呼机器人的用户意向识别装置,包括:文本转换模块,适于获取整通电话的用户录音,并通过语音识别转成通话文本;意图识别模块,适于对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;序列构建模块,适于构建外呼机器人问题与用户回答意图之间的对应关系;意向识别模块,适于利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向。
本发明实施例中所述的装置,还包括:适配模块,适于根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
本申请实施例还提供了一种计算设备,参照图4,该计算设备包括存储器1120、处理器1110和存储在所述存储器1120内并能由所述处理器1110运行的计算机程序,该计算机程序存储于存储器1120中的用于程序代码的空间1130,该计算机程序在由处理器1110执行时实现用于执行任一项根据本发明的方法步骤1131。
本申请实施例还提供了一种计算机可读存储介质。参照图5,该计算机可读存储介质包括用于程序代码的存储单元,该存储单元设置有用于执行根据本发明的方法步骤的程序1131′,该程序被处理器执行。
本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行根据本发明的方法步骤。
A9、如A8所述的装置,还包括:适配模块,适于根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetic tape),软盘(英文:floppy disk),光盘(英文:optical disc)及其任意组合。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (7)

1.一种智能外呼机器人的用户意向识别方法,包括:
获取整通电话的用户录音,并通过语音识别转成通话文本;
对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;
构建外呼机器人问题与用户回答意图之间的对应关系;
利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向;
根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;
利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向;
所述用户意向识别模型通过如下步骤进行训练:
对智能外呼机器人收集到的整通电话的样本分别进行用户意向标注;
利用携带标注的样本对神经网络模型进行分类训练得到用户意向识别模型;
所述神经网络模型的损失函数表示为:
其中,C为分类的类别数目,yj和pj分别代表样本是否属于第j类的真实标签值以及该样本通过模型预测得到的属于第j类的概率值,λj是准确率加权系数,ηj是召回率加权系数;
其中,根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型包括:
对需要提高第x类的准确率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,a大于1;
对需要提高第y类的召回率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,b大于1;
a和b的值越大,所述神经网络模型对应类的准确度或者召回率越高。
2.如权利要求1所述的方法,其特征在于,获取整通电话的用户录音,并通过语音识别转成通话文本包括:
对所述用户录音的声道通过静音检测算法得到所述外呼机器人每个提问问题的回答录音,按照所述外呼机器人提问问题的顺序组成回答录音序列;
通过语音识别将用户回答录音序列转录为用户回答文本序列。
3.如权利要求2所述的方法,其中,对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图包括:
利用文本分类模型对所述用户回答文本序列的每个回答分别进行意图识别,得到对应的用户回答的意图序列。
4.如权利要求1所述的方法,其特征在于,利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向包括:
采用各个分类的类别中概率值最大的一个类别作为用户的意向。
5.一种智能外呼机器人的用户意向识别装置,包括:
文本转换模块,适于获取整通电话的用户录音,并通过语音识别转成通话文本;
意图识别模块,适于对所述通话文本进行意图识别,得到每个问题对应的用户回答的意图;
序列构建模块,适于构建外呼机器人问题与用户回答意图之间的对应关系;
意向识别模块,适于利用预设的用户意向识别模型对所述对应关系进行识别获得用户的意向;
适配模块,适于根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型;利用适配的用户意向识别模型所述对应关系进行识别获得用户的意向;
所述意向识别模块的用户意向识别模型通过如下步骤进行训练:
对智能外呼机器人收集到的整通电话的样本分别进行用户意向标注;
利用携带标注的样本对神经网络模型进行分类训练得到用户意向识别模型;
所述神经网络模型的损失函数表示为:
其中,C为分类的类别数目,yj和pj分别代表样本是否属于第j类的真实标签值以及该样本通过模型预测得到的属于第j类的概率值,λj是准确率加权系数,ηj是召回率加权系数;
其中,所述适配模块根据场景需求对所述用户意向识别模型的准确率或召回率进行调整得到适配的用户意向识别模型包括:
对需要提高第x类的准确率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,a大于1;
对需要提高第y类的召回率的场景需求,将所述神经网络模型的损失函数的准确率加权系数和召回率加权系数设置为:
其中,b大于1;
a和b的值越大,所述神经网络模型对应类的准确度或者召回率越高。
6.一种计算设备,包括:
至少一个处理器和存储有程序指令的存储器;
当所述程序指令被所述处理器读取并执行时,使得所述计算设备执行如权利要求1-4中任一项所述的智能外呼机器人的用户意向识别方法。
7.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-4中任一项所述的智能外呼机器人的用户意向识别方法。
CN202111206048.4A 2021-10-14 2021-10-14 一种智能外呼机器人的用户意向识别方法和装置 Active CN113905135B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111206048.4A CN113905135B (zh) 2021-10-14 2021-10-14 一种智能外呼机器人的用户意向识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111206048.4A CN113905135B (zh) 2021-10-14 2021-10-14 一种智能外呼机器人的用户意向识别方法和装置

Publications (2)

Publication Number Publication Date
CN113905135A CN113905135A (zh) 2022-01-07
CN113905135B true CN113905135B (zh) 2023-10-20

Family

ID=79192551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111206048.4A Active CN113905135B (zh) 2021-10-14 2021-10-14 一种智能外呼机器人的用户意向识别方法和装置

Country Status (1)

Country Link
CN (1) CN113905135B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115134466A (zh) * 2022-06-07 2022-09-30 马上消费金融股份有限公司 意图识别方法、装置及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6650738B1 (en) * 2000-02-07 2003-11-18 Verizon Services Corp. Methods and apparatus for performing sequential voice dialing operations
CN109104534A (zh) * 2018-10-22 2018-12-28 北京智合大方科技有限公司 一种提高外呼机器人意图检测准确率、召回率的系统
CN109285030A (zh) * 2018-08-29 2019-01-29 深圳壹账通智能科技有限公司 产品推荐方法、装置、终端及计算机可读存储介质
CN110689878A (zh) * 2019-10-11 2020-01-14 浙江百应科技有限公司 一种基于XLNet的智能语音对话意图识别方法
CN111611375A (zh) * 2019-07-03 2020-09-01 北京航空航天大学 一种基于深度学习和转折关系的文本情感分类方法
CN112001186A (zh) * 2020-08-26 2020-11-27 重庆理工大学 一种利用图卷积神经网络和中文句法的情感分类方法
WO2020237869A1 (zh) * 2019-05-31 2020-12-03 平安科技(深圳)有限公司 一种问题意图识别方法、装置、计算机设备及存储介质
AU2019260038A1 (en) * 2018-04-23 2020-12-24 Mio Ahmed System and method of operating open ended interactive voice response in any spoken languages
CN112182252A (zh) * 2020-11-09 2021-01-05 浙江大学 基于药品知识图谱的智能用药问答方法及其设备
CN112989843A (zh) * 2021-03-17 2021-06-18 中国平安人寿保险股份有限公司 意图识别方法、装置、计算设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598445B (zh) * 2013-11-01 2019-05-10 腾讯科技(深圳)有限公司 自动问答系统和方法
CN108921221B (zh) * 2018-07-04 2022-11-18 腾讯科技(深圳)有限公司 用户特征的生成方法、装置、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6650738B1 (en) * 2000-02-07 2003-11-18 Verizon Services Corp. Methods and apparatus for performing sequential voice dialing operations
AU2019260038A1 (en) * 2018-04-23 2020-12-24 Mio Ahmed System and method of operating open ended interactive voice response in any spoken languages
CN109285030A (zh) * 2018-08-29 2019-01-29 深圳壹账通智能科技有限公司 产品推荐方法、装置、终端及计算机可读存储介质
CN109104534A (zh) * 2018-10-22 2018-12-28 北京智合大方科技有限公司 一种提高外呼机器人意图检测准确率、召回率的系统
WO2020237869A1 (zh) * 2019-05-31 2020-12-03 平安科技(深圳)有限公司 一种问题意图识别方法、装置、计算机设备及存储介质
CN111611375A (zh) * 2019-07-03 2020-09-01 北京航空航天大学 一种基于深度学习和转折关系的文本情感分类方法
CN110689878A (zh) * 2019-10-11 2020-01-14 浙江百应科技有限公司 一种基于XLNet的智能语音对话意图识别方法
CN112001186A (zh) * 2020-08-26 2020-11-27 重庆理工大学 一种利用图卷积神经网络和中文句法的情感分类方法
CN112182252A (zh) * 2020-11-09 2021-01-05 浙江大学 基于药品知识图谱的智能用药问答方法及其设备
CN112989843A (zh) * 2021-03-17 2021-06-18 中国平安人寿保险股份有限公司 意图识别方法、装置、计算设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向任务型多轮对话的粗粒度意图识别方法;叶铱雷;曹斌;范菁;王俊;陈江斌;;小型微型计算机系统(08);54-60 *

Also Published As

Publication number Publication date
CN113905135A (zh) 2022-01-07

Similar Documents

Publication Publication Date Title
WO2022095380A1 (zh) 基于ai的虚拟交互模型生成方法、装置、计算机设备及存储介质
US9437215B2 (en) Predictive video analytics system and methods
US20210224832A1 (en) Method and apparatus for predicting customer purchase intention, electronic device and medium
US11632463B2 (en) Automated systems and methods for natural language processing with speaker intention inference
CN109767765A (zh) 话术匹配方法及装置、存储介质、计算机设备
US10262268B2 (en) Predictive analytic systems and methods
CN107886949A (zh) 一种内容推荐方法及装置
CN110188361A (zh) 结合文本、语音与情绪特征的语音意图识别方法及装置
US20180374029A1 (en) Selection of customer service requests
CN113297365B (zh) 一种用户意向判定方法、装置、设备及存储介质
CN110147435A (zh) 对话生成方法、装置、设备及存储介质
CN114218488A (zh) 基于多模态特征融合的信息推荐方法、装置及处理器
CN113905135B (zh) 一种智能外呼机器人的用户意向识别方法和装置
CN116631412A (zh) 一种通过声纹匹配判断语音机器人的方法
CN115269836A (zh) 意图识别方法及装置
US10762423B2 (en) Using a neural network to optimize processing of user requests
CN116860953A (zh) 一种基于问答系统的问答匹配方法及系统
CN111818290B (zh) 一种在线访谈的方法及系统
CN115982657B (zh) 一种智能外呼客服系统的录音审核分类方法及装置
CN113676603B (zh) 呼叫控制方法、装置、设备及存储介质
CN113782022B (zh) 基于意图识别模型的通信方法、装置、设备及存储介质
CN115472152B (zh) 语音端点检测方法、装置、计算机设备及可读存储介质
CN116910101A (zh) 结合深度知识追踪的客服推荐方法、话务系统及计算设备
CN118098282A (zh) 事件上报方法和电子设备
CN116244635A (zh) 情绪类型智能识别方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant