CN113890949A - 面向意图识别的智能语音外呼方法及装置 - Google Patents

面向意图识别的智能语音外呼方法及装置 Download PDF

Info

Publication number
CN113890949A
CN113890949A CN202111144110.1A CN202111144110A CN113890949A CN 113890949 A CN113890949 A CN 113890949A CN 202111144110 A CN202111144110 A CN 202111144110A CN 113890949 A CN113890949 A CN 113890949A
Authority
CN
China
Prior art keywords
client
calling
intention
user
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111144110.1A
Other languages
English (en)
Inventor
钟方洁
吴凤鸽
赵军锁
王鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Software of CAS
Original Assignee
Institute of Software of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Software of CAS filed Critical Institute of Software of CAS
Priority to CN202111144110.1A priority Critical patent/CN113890949A/zh
Publication of CN113890949A publication Critical patent/CN113890949A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/527Centralised call answering arrangements not requiring operator intervention
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L15/222Barge in, i.e. overridable guidance for interrupting prompts

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种面向意图识别的智能语音外呼方法及装置,包括根据构建的外呼任务,与客户进行对话;基于一语料库并利用对话内容理解客户意图,引导客户完成外呼任务中的场景,其中在对话过程中出现话术打断、噪声打断或超时打断时,终止所述外呼任务。本发明引用业务流程模型和表示法为指定业务流程提供了一种通用且简单的可视化语言,客户可以打断机器的话,机器可根据客户打断的意图来进行后续操作。

Description

面向意图识别的智能语音外呼方法及装置
技术领域
本发明涉及数据通信技术领域,尤其涉及一种面向意图识别的智能语音外呼方法及装置。
背景技术
传统的呼叫中心语音服务系统是通过系统自动往外拨打用户电话,将录制好的语音通过电话或者其他语音渠道播放给用户,只能单方面输出,不能和用户进行互动,无法获取用户的真实想法从而达不到快速筛选用户意图的目的,无法根据客户打断的意图来进行后续操作。
即便是存在互动的呼叫中心语音服务系统在和用户的交互方面也存在不足,几乎所有的交互都需要用户使用电话按键来选择相应服务。对客户而言,输入麻烦,还经常因误解提示音选错;对企业而言,其服务项目也不能太多。
发明内容
为解决上述问题,本发明公开一种面向意图识别的智能语音外呼方法及装置,通过对语音流进行语音识别,挖掘客户意图,以语音合成播报的形式与客户进行沟通交流,从而高效准确地锁定目标用户,达到提高呼叫效率的目的。
为了实现本发明的目的,采用的技术方案概述如下:
一种面向意图识别的智能语音外呼方法,其步骤包括:
1)根据构建的外呼任务,与客户进行对话;
2)基于一语料库并利用对话内容理解客户意图,引导客户完成外呼任务中的场景,其中在对话过程中出现话术打断、噪声打断或超时打断时,终止所述外呼任务。
进一步地,外呼任务包括:名单管理、场景管理、策略管理、外显号码、拨打开始时间、拨打结束时间、线路配置、是否过滤黑名单和拨打优先级。
进一步地,通过以下步骤进行场景管理:
1)基于给用户播放答复内容的语音或者文字,设计答复节点;
2)基于从用户回复中提取的相关信息,设计词槽节点;
3)基于调用外部REST API操作信息,设计调用节点;
4)基于询问话术、客户意图、超时时间、超时话术和拒识话术,设计意图节点。
进一步地,外部REST API操作信息包括:调用地址、请求方式、入参设置和出参设置。
进一步地,所述策略管理包括:自动呼叫、设置呼叫时间段和跳过节假日功能中的至少一种。
进一步地,理解客户意图的方法包括:使用正则匹配或基于Bert文本分类的深度学习。
进一步地,依据客户意图,对客户进行画像,并将客户复制到相关的名单。
进一步地,对话结束后,基于异常对话进行自我学习,以完善所述语料库。
一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行以上所述方法。
一种电子装置,包括存储器和处理器,其中存储器存储执行以上所述方法的程序。
与现有技术相比,本发明具有以下优点:
1)改变传统的将录好的语音通过电话或者其他语音渠道播放给用户的情况,利用语音处理技术(包含TTS,STT,NLU,NER等),让机器与客户进行沟通,大大减少人力;
2)通过对一个任务进行多项配置,使得每个任务都更完善和人性化;
3)客户可以打断机器的话,机器会根据客户打断的意图来进行后续操作;
4)引用业务流程模型和表示法(BPMN)为指定业务流程提供了一种通用且简单的可视化语言;
5)根据客户的对话,对客户进行人物画像,将人物复制到新名单,以备后续需要;
6)根据客户对话,捕获对话异常,送入后端,进行自学习。
附图说明
图1是本发明方法的方法流程图。
图2是本发明的答复节点设计示例图。
图3是本发明的词槽节点设计示例图。
图4是本发明的调用节点设计示例图。
图5是本发明的意图节点设计示例图。
具体实施方式
以下结合附图和实施例对本发明进行详细说明,需要指出的是,所描述的实施例仅旨在便于对本发明的理解,而对其不起任何限定作用。
本发明可以构建符合企业业务需求,各种不同业务场景的智能外呼,如回访、信息采集、通知机器人等。按照平台设定的呼叫任务和策略完成外呼工作,在与用户沟通的过程中,将实时语音流进行语音识别,根据设定的外呼业务场景,挖掘客户意图,以语音合成播报的形式与客户进行沟通交流。具体包括:
(1)用户管理:进行拨打电话之前一定要有拨打对象。本发明可以通过批量导入的方式和单条新增的模式进行添加用户,自动去除重复号码,和不是电话号码的用户。
(2)名单管理:拨打号码不可能对用户一个个的拨打,这样效率太低;也不可能全部拨打,因为不同客户的需求不同。所以需要对客户进行不同的名单管理。这里我们分为白名单和黑名单,白名单下面可以细分为不同的名单,比如银行工作人员,武汉地区人员,借贷人员等。黑名单下,我们不再细分。
(3)场景管理:该外呼的应用场景,比如信息核实、调查、通告等。本发明引用业务流程模型和表示法(BPMN)为指定业务流程提供了一种通用且简单的可视化语言,使得非技术人员也可以设计场景流程,包括:
(a)答复节点,可以为该节点填写名称和答复内容。如图2所示,当电话流程到这个节点的时候,将给用户播放答复内容的语音或者文字;
(b)词槽节点:词槽收集。提示用户提供相关信息,节点从用户回复中提取相关信息并保存,如图3所示,包括,节点名称,词槽,询问话术,超时时间,超时话术,拒识话术;本发明会提供一些常用的词槽变量,用户也可自行定义。
(c)调用节点:资源调用。调用外部REST API操作,如图4所示,包括节点名称,调用地址,请求方式,入参设置,出参设置。当电话流程到这个节点的时候,调用外部REST API获取想要的信息;
(d)意图节点:意图识别节点。识别用户答复是什么意图,如图5所示,包括节点名称,询问话术,意图,超时时间,超时话术,拒识话术,其中,意图,超时话术,拒识话术可以多条,其中,意图可新增和编辑。新增编辑意图之后,将被送到引擎进行深度学习训练。
(4)策略管理:自动呼叫、设置呼叫时间段及跳过节假日的功能以供用户制定具体的外呼策略管理。
(5)任务管理:任务管理即将要拨打出去的任务,包含之前设置的名单,场景,策略,还有外显号码(显示在客户手机上的号码),开始时间(新建一个任务并不是立马拨打出去的,到达指定的开始时间才拨打),结束时间(到达指定的结束时间,即使任务没结束,也立马结束),线路配置(一次性可以对外拨打号码的数量),是否过滤黑名单以及优先级等。
(6)通话引导:开始拨打,与客户进行对话,理解客户意图,按照客户的意图,引导客户慢慢完成场景。
(7)意图分析:利用正则匹配或基于Bert文本分类的深度学习,系统自动分析客户的意图,对客户进行画像,并将客户复制到相关的名单中,以备后续需要。
(8)打断模式:本发明的打断模式分为三种模式:
(a)话术打断,即用户直接语音打断,比如“你别说了”,“我不想听了”等,针对这种模式,捕获到用户语音,进行意图识别,识别为打断模式,进入打断模式流程;
(b)噪声打断,即用户发出噪声,比如不断的咳嗽,一直狂说“嗯”,“啊”等声
音,捕获到用户这种声音,进行意图识别,识别为打断模式,进入打断模式流程;
(c)超时打断,即用户一直不说话,超过了限定的最大时长,认定为超时打断,进入打断模式流程。
(9)通过记录:保存通话时间,录音等信息。
(10)自学习过程,记录对话异常情况,比如通话中没有命中客户的话术,将该话术添加到语料库中,进行深度学习训练,自我学习。
上述仅以优选实施例对本发明进行说明,非因此即局限本发明的权利范围,因此,在不脱离本发明思想的情况下,凡运用本发明说明书及附图内容所为的等效变化,均理同包含于本发明的权利要求范围内。

Claims (10)

1.一种面向意图识别的智能语音外呼方法,其步骤包括:
1)根据构建的外呼任务,与客户进行对话;
2)基于一语料库并利用对话内容理解客户意图,引导客户完成外呼任务中的场景,其中在对话过程中出现话术打断、噪声打断或超时打断时,终止所述外呼任务。
2.如权利要求1所述的方法,其特征在于,外呼任务包括:名单管理、场景管理、策略管理、外显号码、拨打开始时间、拨打结束时间、线路配置、是否过滤黑名单和拨打优先级。
3.如权利要求2所述的方法,其特征在于,通过以下步骤进行场景管理:
1)基于给用户播放答复内容的语音或者文字,设计答复节点;
2)基于从用户回复中提取的相关信息,设计词槽节点;
3)基于调用外部REST API操作信息,设计调用节点;
4)基于询问话术、客户意图、超时时间、超时话术和拒识话术,设计意图节点。
4.如权利要求3所述的方法,其特征在于,外部REST API操作信息包括:调用地址、请求方式、入参设置和出参设置。
5.如权利要求2所述的方法,其特征在于,所述策略管理包括:自动呼叫、设置呼叫时间段和跳过节假日功能中的至少一种。
6.如权利要求1所述的方法,其特征在于,理解客户意图的方法包括:使用正则匹配或基于Bert文本分类的深度学习。
7.如权利要求1所述的方法,其特征在于,依据客户意图,对客户进行画像,并将客户复制到相关的名单。
8.如权利要求1所述的方法,其特征在于,对话结束后,基于异常对话进行自我学习,以完善所述语料库。
9.一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1-8中任一所述方法。
10.一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行如权利要求1-8中任一所述方法。
CN202111144110.1A 2021-09-28 2021-09-28 面向意图识别的智能语音外呼方法及装置 Pending CN113890949A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111144110.1A CN113890949A (zh) 2021-09-28 2021-09-28 面向意图识别的智能语音外呼方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111144110.1A CN113890949A (zh) 2021-09-28 2021-09-28 面向意图识别的智能语音外呼方法及装置

Publications (1)

Publication Number Publication Date
CN113890949A true CN113890949A (zh) 2022-01-04

Family

ID=79007618

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111144110.1A Pending CN113890949A (zh) 2021-09-28 2021-09-28 面向意图识别的智能语音外呼方法及装置

Country Status (1)

Country Link
CN (1) CN113890949A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115134466A (zh) * 2022-06-07 2022-09-30 马上消费金融股份有限公司 意图识别方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112188017A (zh) * 2020-08-24 2021-01-05 维知科技张家口有限责任公司 信息交互方法及信息交互系统、处理设备、存储介质
CN112202978A (zh) * 2020-08-24 2021-01-08 维知科技张家口有限责任公司 智能外呼系统、方法、计算机系统及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112188017A (zh) * 2020-08-24 2021-01-05 维知科技张家口有限责任公司 信息交互方法及信息交互系统、处理设备、存储介质
CN112202978A (zh) * 2020-08-24 2021-01-08 维知科技张家口有限责任公司 智能外呼系统、方法、计算机系统及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115134466A (zh) * 2022-06-07 2022-09-30 马上消费金融股份有限公司 意图识别方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN109949805B (zh) 基于意图识别及有限状态自动机的智能催收机器人及催收方法
CN109672786B (zh) 一种来电接听方法及装置
US7844454B2 (en) Apparatus and method for providing voice recognition for multiple speakers
CN111683175B (zh) 一种自动应答来电的方法、装置、设备及存储介质
US8731919B2 (en) Methods and system for capturing voice files and rendering them searchable by keyword or phrase
DE69839068T2 (de) System und Verfahren zur automatischen Verarbeitung von Anruf und Datenübertragung
US6724866B2 (en) Dialogue device for call screening and classification
US7130404B2 (en) Apparatus and method for providing advanced communication conferencing operations
KR102136706B1 (ko) 정보 처리 시스템, 접수 서버, 정보 처리 방법 및 프로그램
US8014500B2 (en) Methods and systems for screening incoming calls
US8391445B2 (en) Caller identification using voice recognition
CN112188017A (zh) 信息交互方法及信息交互系统、处理设备、存储介质
CN110895940A (zh) 智能语音交互方法及装置
CN111654582A (zh) 一种智能外呼方法及装置
CN109859032A (zh) 基于智能语音的账款催收方法、装置、设备和存储介质
CN108391020A (zh) 一种通话控制方法、装置、设备及存储介质
CN113890949A (zh) 面向意图识别的智能语音外呼方法及装置
CN110602334A (zh) 一种基于人机协同的智能外呼方法及系统
CN112291430B (zh) 一种基于身份确认的智能应答方法、装置
CN1700714A (zh) 自动实现电话语音服务的系统及方法
CN113779217A (zh) 一种基于人机交互的智能语音外呼业务方法及系统
KR20090076318A (ko) 실시간 대화 서비스 시스템 및 그 방법
CN112291428A (zh) 一种语音助手的智能呼叫方法、装置
CN104601832A (zh) 对话系统与语音对话处理方法
CN113542509B (zh) 一种应急处理方法、装置、存储介质和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination