CN114242052A - 一种智能电话外呼方法和装置 - Google Patents
一种智能电话外呼方法和装置 Download PDFInfo
- Publication number
- CN114242052A CN114242052A CN202111527098.2A CN202111527098A CN114242052A CN 114242052 A CN114242052 A CN 114242052A CN 202111527098 A CN202111527098 A CN 202111527098A CN 114242052 A CN114242052 A CN 114242052A
- Authority
- CN
- China
- Prior art keywords
- user
- matching
- preset flow
- dialogue
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000005516 engineering process Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5166—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/527—Centralised call answering arrangements not requiring operator intervention
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种智能电话外呼方法和装置,方法包括:将用户的输入语音转换为文本信息,对所述文本信息进行语义分析,获取用户意图,根据用户意图,匹配相应对话流程,若匹配成功,则进行所述对话流程的处理;装置包括语音识别模块、语义分析模块、对话匹配模块,所述语音识别模块用于将用户的输入语音转换为文本信息,所述语义分析模块用于对所述文本信息进行语义分析,获取用户意图,所述对话匹配模块根据用户意图,匹配相应对话流程。本发明所述方法和装置,提高了对话流程的匹配度,提高了外呼机器人对用户语音意图的理解准确度,进而提升用户体验感。
Description
技术领域
本发明涉及智能电话外呼技术领域,具体涉及一种智能电话外呼方法和装置。
背景技术
随着人工智能的技术发展,电话外呼业务出现了智能电话外呼,通过外呼机器人实现。
智能电话外呼技术使用人工智能算法与用户进行交互对话,经过一轮或多轮的语音交互后,跳转到自助流程供用户办理业务,这在一定程度上减轻了人工电话外呼的工作量,提升了工作效率。因此,智能电话外呼技术在金融、汽车、电商等行业得到了大量应用。
目前,智能电话外呼技术提前预设对话流程,通过人工交互的方式来引导用户使用自助流程服务。但由于用户的语音输入没有固定的话语,话语比较随意,经常导致外呼机器人不能准确理解用户意图,给用户带来不好体验。
发明内容
本发明为了解决上述技术问题,提出了如下技术方案:
第一方面,本发明实施例提供了一种智能电话外呼方法,所述方法包括:
将用户的输入语音转换为文本信息;
对所述文本信息进行语义分析,获取用户意图;
根据用户意图,匹配相应对话流程;
若匹配成功,则进行所述对话流程的处理。
进一步地,所述将用户的输入语音转换为文本信息,包括:
从用户的输入语音中分离出多个语音段落;
对多个语音段落分别进行语音识别,转换为文本信息。
进一步地,所述对多个语音段落分别进行语音识别,包括:
利用声音状态检测VAD算法,对对多个语音段落分别进行语音识别。
进一步地,所述根据用户意图,匹配相应对话流程,包括:
将用户意图和流程库中各级预设流程匹配,获取对应的匹配值;
选择匹配值最高的预设流程,反馈给用户。
进一步地,若选择匹配值最高的预设流程,反馈给用户后,匹配失败,
则选择匹配值次高的预设流程,反馈给用户。
进一步地,若选择匹配值次高的预设流程,反馈给用户后,匹配失败,
则反馈用户流程匹配失败,转接人工电话外呼。
进一步地,转接人工电话外呼后,将人工对话流程和用户意图关联,维护到流程库中。
第二方面,本发明实施例提供了一种智能电话外呼装置,包括语音识别模块、语义分析模块、对话匹配模块,
所述语音识别模块用于将用户的输入语音转换为文本信息;
所述语义分析模块用于对所述文本信息进行语义分析,获取用户意图;
所述对话匹配模块根据用户意图,匹配相应对话流程。
进一步地,所述语音识别模块,包括:
从用户的输入语音中分离出多个语音段落;
对多个语音段落分别进行语音识别,转换为文本信息。
进一步地,所述对话匹配模块包括对话匹配单元、对话反馈单元和判断单元,
所述对话匹配单元用于将用户意图和流程库中各级预设流程匹配,获取对应的匹配值;
所述对话反馈单元用于选择匹配值最高的预设流程,反馈给用户;
所述判断单元用于判断反馈的预设流程是否匹配成功。
进一步地,若选择匹配值最高的预设流程,反馈给用户后,匹配失败,所述对话反馈单元还用于选择匹配值次高的预设流程,反馈给用户。
进一步地,若选择匹配值次高的预设流程,反馈给用户后,匹配失败,所述对话反馈单元还用于反馈用户流程匹配失败,转接人工电话外呼。
有益效果:
(1)本发明实施例提供的智能电话外呼方法和装置,利用声音状态检测VAD算法,将用户的输入语音进行语音识别,转换为文本信息;对所述文本信息进行语义分析,获取用户意图;将用户意图和流程库中各级预设流程匹配,获取对应的匹配值;选择匹配值最高的预设流程,反馈给用户;若选择匹配值最高的预设流程,匹配失败,则选择匹配值次高的预设流程,反馈给用户;本发明所述方法和装置,提高了对话流程的匹配度,提高了外呼机器人对用户语音意图的理解准确度,进而提升用户体验感。
(2)本发明实施例提供的智能电话外呼方法和装置,在两次预设流程匹配失败后,转接人工电话外呼,并将人工对话流程和用户意图关联,维护到流程库中,提升了流程库维护的智能化程度。
附图说明
图1为本发明实施例所述方法流程图;
图2为本发明实施例所述根据用户意图,匹配相应对话流程图;
图3为本发明实施例所述系统结构示意图;
图4为本发明实施例所述系统示意图。
具体实施方式
下面结合附图与具体实施方式对本方案进行阐述。
如图1所示,为本发明实施例所述方法流程图,包括:
将用户的输入语音转换为文本信息;
对文本信息进行语义分析,获取用户意图;
根据用户意图,匹配相应对话流程;
若匹配成功,则进行对话流程的处理。
将用户的输入语音转换为文本信息,包括:从用户的输入语音中分离出多个语音段落;对多个语音段落分别进行语音识别(Auto Speech Recognition,ASR),转换为文本信息。
语音识别的主要任务是完成语音到文字的转变,当把语音文字转化为文字,得到文本信息,从而实现人机交互。
本方面利用声音状态检测VAD(voice activity detection,VAD)算法,对对多个语音段落分别进行语音识别。利用VAD技术,检测、分离出多个语音段落。
如图2所示,为本发明实施例所述根据用户意图,匹配相应对话流程图,包括:
将用户意图和流程库中各级预设流程匹配,获取对应的匹配值;
选择匹配值最高的预设流程,反馈给用户。
外呼机器人通过TTS(Text To Speech,语音合成)技术,和用户进行交互。TTS技术,涉及声学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术。
若选择匹配值最高的预设流程,反馈给用户后,匹配失败,则选择匹配值次高的预设流程,反馈给用户。
本发明实施例所述方法,利用声音状态检测VAD算法,将用户的输入语音进行语音识别,转换为文本信息;对文本信息进行语义分析,获取用户意图;将用户意图和流程库中各级预设流程匹配,获取对应的匹配值;选择匹配值最高的预设流程,反馈给用户;若选择匹配值最高的预设流程,匹配失败,则选择匹配值次高的预设流程,反馈给用户;本发明提高了对话流程的匹配度,提高了外呼机器人对用户语音意图的理解准确度,进而提升用户体验感。
若选择匹配值次高的预设流程,反馈给用户后,匹配失败,则反馈用户流程匹配失败,转接人工电话外呼。
转接人工电话外呼后,将人工对话流程和用户意图关联,维护到流程库中。
本发明实施例所述方法,在两次预设流程匹配失败后,转接人工电话外呼,并将人工对话流程和用户意图关联,维护到流程库中,提升了流程库维护的智能化程度。
本发明方法还将智能电话外呼的通话详情,存入数据库做进一步分析。通话详情通过图标方式呈现给工作人员,以便工作人员直观查看高频率自助服务,有助于自助流程的优化。
如图3所示,为本发明实施例所述系统结构示意图,包括语音识别模块、语义分析模块、对话匹配模块,语音识别模块用于将用户的输入语音转换为文本信息;语义分析模块用于对文本信息进行语义分析,获取用户意图;对话匹配模块根据用户意图,匹配相应对话流程。
语音识别模块,包括:
从用户的输入语音中分离出多个语音段落;
对多个语音段落分别进行语音识别,转换为文本信息。
如图4所示,为本发明实施例所述系统示意图,对话匹配模块包括对话匹配单元、对话反馈单元和判断单元。
对话匹配单元用于将用户意图和流程库中各级预设流程匹配,获取对应的匹配值;对话反馈单元用于选择匹配值最高的预设流程,反馈给用户;判断单元用于判断反馈的预设流程是否匹配成功。
若选择匹配值最高的预设流程,反馈给用户后,匹配失败,对话反馈单元还用于选择匹配值次高的预设流程,反馈给用户。
若选择匹配值次高的预设流程,反馈给用户后,匹配失败,对话反馈单元还用于反馈用户流程匹配失败,转接人工电话外呼。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (10)
1.一种智能电话外呼方法,其特征在于,所述方法包括:
将用户的输入语音转换为文本信息;
对所述文本信息进行语义分析,获取用户意图;
根据用户意图,匹配相应对话流程;
若匹配成功,则进行所述对话流程的处理。
2.根据权利要求1所述的一种智能电话外呼方法,其特征在于,所述将用户的输入语音转换为文本信息,包括:
从用户的输入语音中分离出多个语音段落;
对多个语音段落分别进行语音识别,转换为文本信息。
3.根据权利要求1所述的一种智能电话外呼方法,其特征在于,所述根据用户意图,匹配相应对话流程,包括:
将用户意图和流程库中各级预设流程匹配,获取对应的匹配值;
选择匹配值最高的预设流程,反馈给用户。
4.根据权利要求3所述的一种智能电话外呼方法,其特征在于,所述方法还包括:
若选择匹配值最高的预设流程,反馈给用户后,匹配失败,则选择匹配值次高的预设流程,反馈给用户。
5.根据权利要求4所述的一种智能电话外呼方法,其特征在于,所述方法还包括:
若选择匹配值次高的预设流程,反馈给用户后,匹配失败,则反馈用户流程匹配失败,转接人工电话外呼。
6.根据权利要求5所述的一种智能电话外呼方法,其特征在于,所述方法还包括:转接人工电话外呼后,将人工对话流程和用户意图关联,维护到流程库中。
7.一种智能电话外呼装置,其特征在于,根据权利要求1-6任一项所述方法实现,所述装置包括语音识别模块、语义分析模块、对话匹配模块;
所述语音识别模块用于将用户的输入语音转换为文本信息;
所述语义分析模块用于对所述文本信息进行语义分析,获取用户意图;
所述对话匹配模块根据用户意图,匹配相应对话流程。
8.根据权利要求7所述的一种智能电话外呼装置,其特征在于,所述对话匹配模块包括对话匹配单元、对话反馈单元和判断单元;
所述对话匹配单元用于将用户意图和流程库中各级预设流程匹配,获取对应的匹配值;
所述对话反馈单元用于选择匹配值最高的预设流程或匹配值次高的预设流程,反馈给用户;
所述判断单元用于判断反馈的预设流程是否匹配成功。
9.根据权利要求8所述的一种智能电话外呼装置,其特征在于,若选择匹配值最高的预设流程,反馈给用户后,匹配失败,所述对话反馈单元还用于选择匹配值次高的预设流程,反馈给用户。
10.根据权利要求9所述的一种智能电话外呼装置,其特征在于,若选择匹配值次高的预设流程,反馈给用户后,匹配失败,所述对话反馈单元还用于反馈用户流程匹配失败,转接人工电话外呼。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111527098.2A CN114242052A (zh) | 2021-12-14 | 2021-12-14 | 一种智能电话外呼方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111527098.2A CN114242052A (zh) | 2021-12-14 | 2021-12-14 | 一种智能电话外呼方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114242052A true CN114242052A (zh) | 2022-03-25 |
Family
ID=80755797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111527098.2A Pending CN114242052A (zh) | 2021-12-14 | 2021-12-14 | 一种智能电话外呼方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114242052A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114691852A (zh) * | 2022-06-01 | 2022-07-01 | 阿里巴巴达摩院(杭州)科技有限公司 | 人机对话系统及方法 |
CN115665325A (zh) * | 2022-09-14 | 2023-01-31 | 中信建投证券股份有限公司 | 一种智能外呼的方法、装置、电子设备及存储介质 |
-
2021
- 2021-12-14 CN CN202111527098.2A patent/CN114242052A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114691852A (zh) * | 2022-06-01 | 2022-07-01 | 阿里巴巴达摩院(杭州)科技有限公司 | 人机对话系统及方法 |
CN114691852B (zh) * | 2022-06-01 | 2022-08-12 | 阿里巴巴达摩院(杭州)科技有限公司 | 人机对话系统及方法 |
CN115665325A (zh) * | 2022-09-14 | 2023-01-31 | 中信建投证券股份有限公司 | 一种智能外呼的方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6996525B2 (en) | Selecting one of multiple speech recognizers in a system based on performance predections resulting from experience | |
CN114242052A (zh) | 一种智能电话外呼方法和装置 | |
US8000973B2 (en) | Management of conversations | |
EP1602102B1 (en) | Management of conversations | |
US8135579B2 (en) | Method of analyzing conversational transcripts | |
WO2011082340A1 (en) | Method and system for processing multiple speech recognition results from a single utterance | |
CN101558442A (zh) | 使用语音识别的内容选择 | |
CN111261162B (zh) | 语音识别方法、语音识别装置及存储介质 | |
WO2013010262A1 (en) | Method and system of classification in a natural language user interface | |
CN111477231B (zh) | 人机交互方法、装置和存储介质 | |
CN113821621B (zh) | 一种基于深度学习的开放式智能客服系统 | |
CN112148874A (zh) | 可自动新增用户潜在意图的意图识别方法及系统 | |
CN105323392A (zh) | 一种快速进入ivr菜单的方法及装置 | |
CN112087726B (zh) | 彩铃识别的方法及系统、电子设备及存储介质 | |
CN109901810A (zh) | 一种用于智能终端设备的人机交互方法及装置 | |
CN111062729A (zh) | 一种信息获取方法、装置和设备 | |
CN107645613A (zh) | 服务转接的方法和装置 | |
Zou et al. | Design of intelligent customer service report system based on automatic speech recognition and text classification | |
CN112133306B (zh) | 一种基于快递用户的应答方法、装置和计算机设备 | |
CN112652300B (zh) | 多方言语音识别方法、装置、设备和存储介质 | |
CN113301214B (zh) | 一种可进行智能工单系统 | |
CN115298639A (zh) | 用于用户发起的与人工智能机器的通用对话的系统 | |
CN112711654B (zh) | 语音机器人的汉字解释话术生成方法、系统、设备及介质 | |
CN117714600A (zh) | 一种用于智能ivr的自动转接人工方法及系统 | |
Englert et al. | An architecture for multimodal mobile applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |