CN111866289B - 外呼号码状态检测方法及装置、智能外呼方法及系统 - Google Patents
外呼号码状态检测方法及装置、智能外呼方法及系统 Download PDFInfo
- Publication number
- CN111866289B CN111866289B CN202010025582.4A CN202010025582A CN111866289B CN 111866289 B CN111866289 B CN 111866289B CN 202010025582 A CN202010025582 A CN 202010025582A CN 111866289 B CN111866289 B CN 111866289B
- Authority
- CN
- China
- Prior art keywords
- audio information
- outbound
- state
- outbound number
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5166—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5175—Call or contact centers supervision arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Marketing (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种外呼号码状态检测方法及装置、智能外呼方法及系统,外呼号码状态检测方法包括获取外呼号码的前置音音频信息;通过语音识别模型获取所述前置音音频信息的词图;基于预设关键词计算得到在前置音音频信息的词图中各个预设关键词对应的预测概率;将预测概率最高的一种预设关键词确定为当前外呼号码的状态。本申请提供的一种外呼号码状态检测方法,通过对获取的前置音音频信息进行语音识别,得出前置音音频信息的词图,根据预设关键词计算新词图中概率最高的预设关键词作为前置音音频信息对应的号码状态,提升了号码状态检测有效性判断的速度和精度,节约坐席资源,从而提高了工作效率。
Description
技术领域
本申请涉及通信技术领域,特别是涉及外呼号码状态检测方法及装置、智能外呼方法及系统。
背景技术
语音识别是一种利用机器模拟人类的识别和理解过程、把人类的语音信号转变为相应的文本或命令的技术。语音识别的根本目的是研究出一种具有听觉功能的机器,能直接接受人的语音,理解人的意图,并做出相应的反应。随着人工智能技术的发展,语音识别技术取得巨大的进步,并开始进入家电、通信、汽车、医疗等各个领域。但是目前的语音识别功能的精度并不是很高,且在不同领域也存在不同的技术障碍。
例如,近年来,国内的消费需求不断增长,消费金融行业也迎来了大爆发,线上金融业务蓬勃发展,催生了大量外呼业务需求。当前消费金融行业在办理线上业务时,为了提高工作效率,需要对外呼号码的有效性、应答情况等进行检测判断,以便使得外呼系统尽量呼叫到有效的号码上。因此,提供一种高效精度高的外呼号码检测方法尤为重要。
发明内容
本申请主要解决的技术问题是提供外呼号码状态检测方法及装置、智能外呼方法及系统,能够快速准确地对外呼号码的状态进行检测。
为解决上述技术问题,本申请采用的第一个技术方案是:提供一种外呼号码状态检测方法,所述检测方法包括:获取所述外呼号码的前置音音频信息;通过语音识别模型获取所述前置音音频信息的词图;基于预设关键词计算得到在所述前置音音频信息的词图中各个预设关键词对应的预测概率;将预测概率最高的一种预设关键词确定为当前外呼号码的状态。
为解决上述技术问题,本申请采用的第二个技术方案是:提供一种智能外呼方法,所述方法包括:根据如第一个技术方案所述的外呼号码状态检测方法获取当前外呼号码的状态;根据所述外呼号码的状态对本次外呼动作做出响应。
为解决上述技术问题,本申请采用的第三个技术方案是:提供一种外呼号码状态检测装置,包括音频获取模块、词图获取模块、概率获取模块以及识别结果获取模块,所述音频获取模块用于获取所述外呼号码的前置音音频信息;所述词图获取模块用于通过语音识别模型获取所述前置音音频信息的词图;所述概率获取模块用于根据预设关键词计算得到在所述前置音音频信息的词图中各个预设关键词对应的预测概率;所述识别结果获取模块用于将预测概率最高的一种预设关键词确定为当前外呼号码的状态。
为解决上述技术问题,本申请采用的第四个技术方案是:一种智能外呼系统,包括外呼号码的状态检测装置和处理装置,所述外呼号码的状态检测装置用于检测所述当前外呼号码的状态,所述处理装置用于根据所述外呼号码的状态对本次外呼动作做出响应。
为解决上述技术问题,本申请采用的第五个技术方案是:提供一种智能终端,所述智能终端包括存储器、处理器以及存储于所述存储器中并在所述处理器上运行的计算机程序,所述处理器用于实现上述所述的外呼号码状态检测方法的步骤或者实现上述所述智能外呼方法的步骤。
为解决上述技术问题,本申请采用的第六个技术方案是:提供一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述所述外呼号码的状态检测方法的步骤,或实现如权利要求7所述智能外呼方法的步骤。
本申请的有益效果是:区别于现有技术的情况,本申请提供的外呼号码状态检测方法及装置、智能外呼方法及系统,通过对获取的前置音音频信息进行语音识别,得出前置音音频信息的词图,根据预设关键词计算新词图中概率最高的预设关键词作为前置音音频信息对应的号码状态,提升了号码状态检测有效性判断的速度和精度,比如可以根据号码状态而采用不同的外呼策略,从而可以避免无限制地过多使用坐席资源,进而可以节约坐席资源,从而提高了工作效率。
附图说明
图1是本申请外呼号码状态检测方法一实施方式的流程示意图;
图2是本申请外呼号码状态检测方法另一实施方式的流程示意图;
图3是本申请智能外呼方法一实施方式的示意框图;
图4是本申请外呼号码状态检测装置一实施方式的示意框图;
图5是本申请智能外呼系统一实施方式的示意框图;
图6是本申请智能终端一实施方式的示意框图;
图7是本申请计算机可读存储介质一实施方式的示意框图。
具体实施方式
为使本领域的技术人员更好地理解本申请的技术方案,下面结合附图和具体实施方式对本申请所提供的一种外呼号码状态检测方法及装置、智能外呼方法及系统、终端、存储介质做进一步详细描述。
参阅图1,图1是本申请外呼号码状态检测方法一实施方式的流程示意图。该外呼号码状态检测方法具体包括如下步骤:
S11:获取所述外呼号码的前置音音频信息。
具体地,外呼时的前置音音频信息可以是终端设备上集成的录音模块或与终端设备相连的录音设备在业务办理过程中录音所采集的录音音频,也可以是直接从网上下载获取的语音。前置音音频信息可以选自金融领域、通用领域一般性的应用领域,例如日常生活领域,也可以是相对于专业的行业领域,例如化工行业、电子行业等。
S12:通过语音识别模型获取所述前置音音频信息的词图。
具体地,将前置音音频信息进行分割成多个子段;分别获取前置音音频信息首尾的设定数量的子段进行拼接,得到拼接后的音频信息;通过语音识别模型对拼接后的音频信息进行识别,得到待识别音频语料的词图。
其中,将前置音音频信息进行分割成多个子段。例如前置音音频信息是由铃音、静音和运营商提示音混合而成,通过计算前置音音频信息中每一帧音频的短时能量和短时过零率,筛选出静音音频帧并将其移除,将保留的铃音音频和运营商提示音音频分割成若干个子段。其中,可以对前置音音频信息的每一帧语音能量进行提取,设前置音音频信息信号为x(n)、加窗函数ω(n)分帧处理后的第i帧语音信号为yi(n),则yi(n)满足:
yi(n)=ω(n)*x((i-1)*inc+n),1≤n≤L,1≤i≤fn,
ω(n)=1,n=0~L;ω(n)=0,n=其他值。
式中,ω(n)为窗函数;yi(n)是一帧的数值;inc为帧移长度;fn为分帧后的总帧数,则第i帧的前置音音频信息信号的短时能量为:
可以计算一帧前置音音频信息中信号的波形穿过零电平的次数。对于离散信号来说,相邻数据改变一次符号就算做一次过零,短时平均过零率为:
上式中,sgn[]是符号函数,即:sgn[y]=1,y≥0;sgn[y]=-1,y<0。
通过计算前置音音频信息信号中每一帧的短时能量和短时过零率,将短时能量和短时过零率与对应的预设短时能量阈值和预设短时过零率阈值进行比较,根据短时能量和短时过零率可以将音频信息分为静音、清音和浊音。铃音和提示音包括清音和浊音。其中,三种音频中静音的短时能量和短时过零率均低,清音的短时能量相对比较低、短时过零率相对比较高,浊音的短时能量相对比较高、短时过零率相对比较低。当前置音音频信息音频帧的短时能量小于预设的短时能量阈值,短时过零率小于预设短时过零率阈值时,则前置音音频信息音频帧为静音音频帧;当前置音音频信息音频帧的短时能量大于预设的短时能量阈值或短时过零率小于预设的短时过零率阈值,则前置音音频信息音频帧为铃音、运营商提示音音频帧,进而将运营商提示音音频帧、铃音与静音音频帧区分开。之后将静音音频帧从前置音音频信息中移除,保留铃音、运营商提示音音频帧,在移除静音音频帧后,前置音音频信息中的铃音和运营商提示音被分割成n个子段。
其中,获取前置音音频信息首尾的设定数量的子段进行拼接,得到拼接后的音频信息。具体地,可以将n个子段中的每个音频片段中的部分音频片段截留。其中,可以将音频段中时长小于1s的子段去掉,时长大于4s的子段只取前4s的截断音频,即得到n个新的子段。按照预设顺序对n个新的子段进行排序,其中,预设顺序可以是时间顺序,提取排列靠前的n1个新的子段和排列靠后的n2个新的子段,其中n1和n2均为大于或等于1的正整数,例如,在系统中设定n1和n2均为4,当分割的新的子段总共为20个,则提取前4个新子段和后4个新的子段,总共提取8个新的子段;当分割的新的子段总数为6个时,则提取6个新的子段。将提取的n1个和n2个新的子段按照预设拼接顺序进行拼接合并,以得到特征音频片段。其中,预设拼接顺序可为预先设定的随机的将n1个新的子段和n2个新的子段进行拼接,也可为按照n1个新的子段和n2个新的子段携带的时间信息进行拼接,得到拼接后的音频信息。或者其他方式,在此不做限定。
通过语音识别模型对拼接后的音频信息进行识别,得到待识别音频语料的词图。具体地,语音识别模型对拼接后的音频信息通过预设方式进行分段,其中预设方式可以是通过拼接后的音频信息中自带的时间戳,将拼接后的音频信息根据时间戳分成多段音频信息。提取每一段音频信息中的特征参数,其中特征参数可以是线性预测参数及其派生参数、语音频谱直接导出的参数、混合参数及Mel频率倒谱系数等;通过语音识别模型识别每一段音频信息中可能对应的词组序列,并计算音频信息对应可能词组序列的概率;最后通过Viterbi算法对可能的词组序列进行解码,得到词图。
S13:基于预设关键词计算得到在所述前置音音频信息的词图中各个预设关键词对应的预测概率。
具体地,获取到至少一个所述预设关键词;将各个所述预设关键词依次与所述词图进行合并,得到至少一个新的词图;通过调用关键词搜索方法分别计算得到所述预设关键词在对应的新词图中的预测概率。
在一个具体的实施例中,通过在Kaldi识别模型中输入m个预设关键词,Kaldi识别模型中的Keyword Search模块对m个预设关键词进行编码,得到m个预设关键词的对应词图,即预设关键词词图。将上述步骤得到的待识别音频语料的词图和预设关键词词图输入到Kaldi识别模型,调用Kaldi识别模型中的Keyword Search模块使上述步骤得到的待识别音频语料的词图分别与m个预设关键词词图进行合并,构建生成m个新词图,并搜索各个预设关键词在新词图中对应的概率,即计算得到各个预设关键词在m个新词图中最优路径对应的概率为预设关键词的预测概率。其中,Kaldi是语音识别的一种工具。搜索结果为各个预设关键字及其对应的预测概率。
S14:将预测概率最高的一种预设关键词确定为当前外呼号码的状态。
所述外呼号码的状态包括:外呼号码处于关机状态、停机状态或者通话中等状态;
具体地,可以对搜索结果进行剪枝处理,将搜索结果中预测关键词对应的预测概率与预设的阈值进行比较;当搜索结果中预设关键词对应的预测概率不小于预设的阈值时,保留该预设关键词及其对应的预测概率;当搜索结果中预设关键词对应的预测概率小于预设的阈值时,删除该预设关键词及其对应的预测概率。还可以对剪枝后保留的搜索结果进行加权,对保留的预设关键词对应的预测概率乘以加权系数,得出预设关键词对应的最终加权预测概率。例如,预测关键词“控好”的概率为50%,加权系数为10%;预测关键词“空号”的概率为10%,加权系数为80%,那么最终的概率为:预测关键词“控好”的概率为5%,预测关键词“空号”的概率为8%。可以对加权之后的预测关键词对应的最终加权预测概率进行排序,获得最终加权预测概率最大的预设关键词作为预测结果,输出该预测关键词作为外呼号码检测的结果。其中,在一种实施方式中,所述外呼号码的状态检测方法应用于金融领域。
本实施方式提供的一种外呼号码状态检测方法,通过对获取的前置音音频信息进行语音识别,得出前置音音频信息的词图,利用Kaldi识别模型中的Keyword Search模块计算新词图中概率最高的预设关键词作为前置音音频信息对应的号码状态,提升了号码状态检测有效性判断的速度和精度,例如可以根据号码状态而采用不同的外呼策略,从而可以避免无限制地过多使用坐席资源,进而可以节约坐席资源,从而提高了工作效率。
参阅图2,图2是本申请外呼号码状态检测方法另一实施方式的流程示意图。该外呼号码状态检测方法具体包括如下步骤:
S201:获取所述外呼号码处于外呼状态时的前置音音频信息。
具体地,外呼时的前置音音频信息可以是终端设备上集成的录音模块或与终端设备相连的录音设备在业务办理过程中录音所采集的录音音频,也可以是直接从网上下载获取的语音。前置音音频信息可以选自金融领域、通用领域一般性的应用领域,例如日常生活领域,也可以是相对于专业的行业领域,例如化工行业、电子行业等。
S202:将所述前置音音频信息分割成多个子段。
具体地,将前置音音频信息进行分割成多个子段。例如前置音音频信息是由铃音、静音和运营商提示音混合而成,通过计算前置音音频信息中每一帧音频的短时能量和短时过零率,筛选出静音音频帧并将其移除,将保留的铃音音频和运营商提示音音频分割成若干个子段。其中,可以对前置音音频信息的每一帧语音能量进行提取,设前置音音频信息信号为x(n)、加窗函数ω(n)分帧处理后的第i帧语音信号为yi(n),则yi(n)满足:
yi(n)=ω(n)*x((i-1)*inc+n),1≤n≤L,1≤i≤fn,
ω(n)=1,n=0~L;ω(n)=0,n=其他值。
式中,ω(n)为窗函数;yi(n)是一帧的数值;inc为帧移长度;fn为分帧后的总帧数,则第i帧的前置音音频信息信号的短时能量为:
可以计算一帧前置音音频信息中信号的波形穿过零电平的次数。对于离散信号来说,相邻数据改变一次符号就算做一次过零,设前置音音频信息为x(n),分帧后第i帧前置音音频信息信号为yi(n),短时平均过零率为:
式中,sgn[]是符号函数,即:sgn[y]=1,y≥0;sgn[y]=-1,y<0。
通过计算前置音音频信息信号中每一帧的短时能量和短时过零率,将短时能量和短时过零率与对应的预设短时能量阈值和预设短时过零率阈值进行比较,根据短时能量和短时过零率可以将音频信息分为静音、清音和浊音。铃音和提示音包括清音和浊音。其中,三种音频中静音的短时能量和短时过零率均低,清音的短时能量相对比较低、短时过零率相对比较高,浊音的短时能量相对比较高、短时过零率相对比较低。当前置音音频信息音频帧的短时能量小于预设的短时能量阈值,短时过零率小于预设短时过零率阈值时,则前置音音频信息音频帧为静音音频帧;当前置音音频信息音频帧的短时能量大于预设的短时能量阈值或短时过零率小于预设的短时过零率阈值,则前置音音频信息音频帧为铃音、运营商提示音音频帧,进而将运营商提示音音频帧、铃音与静音音频帧区分开。之后将静音音频帧从前置音音频信息中移除,保留铃音、运营商提示音音频帧,在移除静音音频帧后,前置音音频信息中的铃音和运营商提示音被分割成n个子段。
S203:分别获取所述前置音音频信息中首尾预设数量的子段进行拼接,得到拼接后的音频信息。
具体地,获取前置音音频信息首尾的设定数量的子段进行拼接,得到拼接后的音频信息。具体地,可以将n个子段中的每个音频片段中的部分音频片段截留。其中,可以将音频段中时长小于1s的子段去掉,时长大于4s的子段只取前4s的截断音频,即得到n个新的子段。按照预设顺序对n个新的子段进行排序,其中,预设顺序可以是时间顺序,提取排列靠前的n1个新的子段和排列靠后的n2个新的子段,其中n1和n2均为大于或等于1的正整数,例如,在系统中设定n1和n2均为4,当分割的新的子段总共为20个,则提取前4个新子段和后4个新的子段,总共提取8个新的子段;当分割的新的子段总数为6个时,则提取6个新的子段。将提取的n1个和n2个新的子段按照预设拼接顺序进行拼接合并,以得到特征音频片段。其中,预设拼接顺序可为预先设定的随机的将n1个新的子段和n2个新的子段进行拼接,也可为按照n1个新的子段和n2个新的子段携带的时间信息进行拼接,得到拼接后的音频信息。或者其他方式,在此不做限定。
S204:并将所述拼接后的音频信息输入到语音识别模型中。
具体地,将拼接后的音频信息输入到语音识别模型中。
S205:通过所述语音识别模型对所述拼接后的音频信息进行分段,得到多段子语料。
具体地,通过语音识别模型对输入的拼接后的音频信息进行分段,得到多段子语料。例如,可以是通过拼接后的音频信息中自带的时间戳,将音频信息分成多段音频信息,即将某一时间段的音频信息分为一段音频信息,得到多段子语料。
S206:对每一段所述子语料进行词预测,得到所述每一段子语料对应的至少一个词。
具体地,通过语音识别模型对每一段子语料进行语音识别,进一步对每一段子语料进行词预测,识别得出每一段子语料对应的预测词。语音识别模型在对子语料进行识别时,根据子语料语音信号在语音识别模型的数据库中查找可能对应的词,并得出所有可能的词。
S207:根据每一段所述子语料对应的词得到所述拼接后的音频信息的词图。
具体地,根据每一段子语料识别得到的可能对应的词通过语音识别模型进行概率计算;之后通过Viterbi算法对每一段子语料识别得到的可能对应的词进行解码得到拼接后的音频信息的预测词图。其中包括提取每一段子语料中的特征参数,其中特征参数可以是线性预测参数及其派生参数、语音频谱直接导出的参数、混合参数及Mel频率倒谱系数等;通过语音识别模型识别每一段子语料中可能对应的词组序列,并计算子语料对应可能词组序列的概率;最后通过Viterbi算法对可能的词组序列进行解码,得到词图。其中,可以对词图中的路径进行优化,优化包括剪枝、加权和排序。筛选出词图中可能性比较大的路径,进一步缩小词图范围。
S208:获取至少一个所述预设关键词。
具体地,获取至少一个预设关键词,该预设关键词可以是获取的前置音音频信息的号码状态,如“空号”、“停机”、“不在服务区”和“无人接听”等。
S209:将各个所述预设关键词依次与所述词图进行合并,得到至少一个新的词图。
具体地,通过在Kaldi识别模型中输入m个预设关键词,Kaldi识别模型中的Keyword Search模块对m个预设关键词进行编码,得到m个预设关键词的对应词图,即预设关键词词图。将上述步骤得到的前置音音频信息的词图和预设关键词词图输入到Kaldi识别模型,调用Kaldi识别模型中的Keyword Search模块使上述步骤得到的前置音音频信息的词图分别与m个预设关键词词图进行合并,构建生成m个新词图其中,Kaldi是语音识别的一种工具。搜索结果为各个预设关键字及其对应的预测概率。
S210:根据关键词搜索方法分别计算得到所述预设关键词在对应的新词图中的预测概率。
具体地,根据关键词搜索方法分别计算得到每个所述预设关键词在对应的新词图中最优路径的预测概率,并将最高的预测概率确定为对应的预设关键词的预测概率。调用Kaldi识别模型中的Keyword Search模块搜索各个预设关键词在新词图中对应的概率,即计算得到各个预设关键词在m个新词图中最优路径对应的概率为预设关键词的预测概率。
S211:将所有所述预设关键词中所述预测概率最高的一种确定为当前外呼号码的状态。
具体地,对得到的关键词对应的每一种预测结果的概率进行剪枝、加权和排序,确定概率最高的预测结果为前置音音频信息的识别结果。
具体地,可以对搜索结果进行剪枝处理,将搜索结果中预测关键词对应的预测概率与预设的阈值进行比较;当搜索结果中预设关键词对应的预测概率不小于预设的阈值时,保留该预设关键词及其对应的预测概率;当搜索结果中预设关键词对应的预测概率小于预设的阈值时,删除该预设关键词及其对应的预测概率。还可以对剪枝后保留的搜索结果进行加权,对保留的预设关键词对应的预测概率乘以加权系数,得出预设关键词对应的最终加权预测概率。例如,预测关键词“控好”的概率为50%,加权系数为10%;预测关键词“空号”的概率为10%,加权系数为80%,那么最终的概率为:预测关键词“控好”的概率为5%,预测关键词“空号”的概率为8%。可以对加权之后的预测关键词对应的最终加权预测概率进行排序,获得最终加权预测概率最大的预设关键词作为预测结果,输出该预测关键词作为外呼号码检测的结果。
本实施方式提供的一种外呼号码的状态检测方法,通过对获取的前置音音频信息进行语音识别,得出前置音音频信息的词图,利用Kaldi识别模型中的Keyword Search模块计算新词图中概率最高的预设关键词作为前置音音频信息对应的号码状态,提升了号码状态检测有效性判断的速度和精度,从而提高了工作效率。
参阅图3,图3是本申请智能外呼方法一实施方式的示意框图。所述方法包括:
S31:获取所述外呼号码的前置音音频信息。
具体地,通过移动终端或外呼系统拨通待呼叫号码,获取呼叫电话中的前置音音频信息。
S32:将所述前置音音频信息输入语音识别模型,获取所述前置音音频信息的词图。
具体地,语音识别模型将所述前置音音频信息分割成多个子段;分别获取所述前置音音频信息中首尾预设数量的子段进行拼接,得到拼接后的音频信息;通过所述语音识别模型对所述前置音音频信息进行分段,得到多段子语料;对每一段所述子语料进行词预测,得到所述每一段标注语料对应的至少一个词;根据每一段所述子语料对应的词得到所述前置音音频信息的词图。
S33:基于预设关键词计算得到在所述前置音音频信息的词图中各个预设关键词对应的预测概率。
获取至少一个所述预设关键词;将各个所述预设关键词依次与所述词图进行合并,得到至少一个新的词图;根据关键词搜索方法分别计算得到所述预设关键词在对应的新词图中的预测概率。另一可选实施例中,可以根据关键词搜索方法分别计算得到每个所述预设关键词在对应的新词图中最优路径的预测概率,并将最高的预测概率确定为对应的预设关键词的预测概率。
S34:将预测概率最高的一种预设关键词确定为当前外呼号码的状态。
具体地,对上述步骤得到的所述预设关键词对应的预测概率进行剪枝、加权和排序,并将预测概率最高的预设关键词确定为当前呼叫电话的状态。
S35:根据所述外呼号码的状态对本次外呼动作做出响应。
具体地,根据确定的当前呼叫电话的状态对本次呼叫作出响应动作。比如,如果确定当前呼叫电话的状态是接通,则直接将当前呼叫电话接通到人工坐席进行处理;如果确定当前呼叫电话的状态是关机,则结束当前通话,重新呼叫下一个电话。
本实施方式提供的一种智能外呼方法,通过拨通用户号码获取前置音音频信息,语音识别模型对获取的前置音音频信息进行语音识别,得出前置音音频信息的词图,并计算新词图中概率最高的预设关键词作为前置音音频信息对应的号码状态,提升了号码状态检测有效性判断的速度和精度,节约坐席资源,从而提高了工作效率。
参阅图4,图4是本申请外呼号码状态检测装置一实施方式的示意框图。一种外呼号码状态检测装置40包括音频获取模块41、词图获取模块42、概率获取模块43以及识别结果获取模块44。
音频获取模块41用于获取所述外呼号码的前置音音频信息。
词图获取模块42用于通过语音识别模型获取所述前置音音频信息的词图。
具体地,将所述前置音音频信息分割成多个子段;分别获取所述前置音音频信息中首尾预设数量的子段进行拼接,得到拼接后的音频信息;并将所述音频信息输入到语音识别模型中;通过所述语音识别模型对所述前置音音频信息进行分段,得到多段子语料;对每一段所述子语料进行词预测,得到所述每一段标注语料对应的至少一个词;根据每一段所述子语料对应的词得到所述前置音音频信息的词图。
概率获取模块43用于基于预设关键词计算得到在所述前置音音频信息的词图中各个预设关键词对应的预测概率。
具体地,获取至少一个所述预设关键词;将各个所述预设关键词依次与所述词图进行合并,得到至少一个新的词图;根据关键词搜索方法分别计算得到所述预设关键词在对应的新词图中的预测概率。另一可选实施例中,可以根据关键词搜索方法分别计算得到每个所述预设关键词在对应的新词图中最优路径的预测概率,并将最高的预测概率确定为对应的预设关键词的预测概率。
识别结果获取模块44用于将预测概率最高的一种预设关键词确定为当前外呼号码的状态。
具体地,对各个所述预设关键词对应的预测概率进行剪枝、加权和排序,并将预测概率最高的预设关键词确定为当前外呼号码的状态。
本实施方式提供的一种外呼号码状态检测装置,通过对获取的前置音音频信息进行语音识别,得出前置音音频信息的词图,根据预设关键词计算新词图中概率最高的预设关键词作为前置音音频信息对应的号码状态,提升了号码状态检测有效性判断的速度和精度,节约坐席资源,从而提高了工作效率。
参阅图5,图5是本申请智能外呼系统一实施方式的示意框图。一种智能外呼系统50,包括外呼号码的状态检测装置51和处理装置52,所述外呼号码的状态检测装置51用于检测所述当前外呼号码的状态。具体检测方式参见上述实施例的内容。
所述处理装置52用于根据所述外呼号码的状态对本次外呼动作做出响应。具体地,根据确定的当前呼叫电话的状态对本次呼叫作出响应动作。比如,如果确定当前呼叫电话的状态是接通,则所述处理装置52直接将当前呼叫电话接通到人工坐席进行处理;如果确定当前呼叫电话的状态是关机,则结束当前通话,重新呼叫下一个电话。
本实施方式提供的一种智能外呼系统,通过外呼号码的状态检测装置51检测出当前呼叫号码的状态,然后通过所述处理装置52根据检测出的状态对本次外呼动作做出响应。这样,提升了号码状态检测有效性判断的速度和精度,节约坐席资源,从而提高了工作效率。
参阅图6,图6是本申请智能终端一实施方式的示意框图。
如图6所示,该实施方式的智能终端60包括:处理器61、存储器62以及存储在存储器62中并可在处理器61上运行的计算机程序该计算机程序被处理器61执行时实现上述词外呼号码状态检测方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器61执行时实现上述外呼号码状态检测装置中各模型/单元的功能,为避免重复,此处不一一赘述。
参阅图7,图7是本申请计算机可读存储介质一实施方式的示意框图。
本申请的实施方式中还提供一种计算机可读存储介质70,计算机可读存储介质70存储有计算机程序701,计算机程序701中包括程序指令,处理器执行程序指令,实现本申请实施方式提供的任一项外呼号码状态检测方法。
其中,计算机可读存储介质70可以是前述实施方式的计算机设备的内部存储单元,例如计算机设备的硬盘或内存。计算机可读存储介质70也可以是计算机设备的外部存储设备,例如计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利保护范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (11)
1.一种外呼号码状态检测方法,其特征在于,包括:
获取所述外呼号码的前置音音频信息;
通过语音识别模型获取所述前置音音频信息的词图;
基于预设关键词计算得到在所述前置音音频信息的词图中各个预设关键词对应的预测概率;
将预测概率最高的一种预设关键词确定为当前外呼号码的状态。
2.根据权利要求1所述外呼号码状态检测方法,其特征在于,所述基于预设关键词计算得到在所述前置音音频信息的词图中各个预设关键词对应的预测概率的步骤包括:
获取至少一个所述预设关键词;
将获取的所述预设关键词依次与所述词图进行合并,得到至少一个新的词图;
根据关键词搜索方法分别计算得到所述预设关键词在对应的新词图中的预测概率。
3.根据权利要求2所述外呼号码状态检测方法,其特征在于,
所述根据关键词搜索方法分别计算得到所述预设关键词在对应的新词图中的预测概率具体包括:
根据关键词搜索方法分别计算得到每个所述预设关键词在对应的新词图中最优路径的预测概率,并将最高的预测概率确定为对应的预设关键词的预测概率;
所述将预测概率最高的一种预设关键词确定为当前外呼号码的状态的步骤包括:
将所有所述预设关键词中所述预测概率最高的一种确定为当前外呼号码的状态。
4.根据权利要求1所述外呼号码状态检测方法,其特征在于,所述通过语音识别模型获取所述前置音音频信息的词图的步骤包括:
将所述前置音音频信息分割成多个子段;
分别获取所述前置音音频信息中首尾预设数量的子段进行拼接,得到拼接后的音频信息;
并将所述拼接后的音频信息输入到语音识别模型中。
5.根据权利要求1所述外呼号码状态检测方法,其特征在于,所述将预测概率最高的一种预设关键词确定为当前外呼号码的状态的步骤包括:
对各个所述预设关键词对应的预测概率进行剪枝、加权和/或排序处理,并将预测概率最高的预设关键词确定为当前外呼号码的状态。
6.根据权利要求1至5任一项所述外呼号码状态检测方法,其特征在于,所述通过语音识别模型获取所述前置音音频信息的词图的步骤包括:
通过所述语音识别模型对所述前置音音频信息进行分段,得到多段子语料;
对每一段所述子语料进行词预测,得到每一段子语料对应的至少一个词;
根据每一段所述子语料对应的词得到所述前置音音频信息的词图。
7.一种智能外呼方法,其特征在于,所述方法包括:
根据如权利要求1至6任一项所述的外呼号码状态检测方法获取当前外呼号码的状态;
根据所述外呼号码的状态对本次外呼动作做出响应。
8.一种外呼号码的状态检测装置,其特征在于,所述装置包括音频获取模块、词图获取模块、概率获取模块以及识别结果获取模块,
所述音频获取模块用于获取所述外呼号码的前置音音频信息;
所述词图获取模块用于通过语音识别模型获取所述前置音音频信息的词图;
所述概率获取模块用于基于预设关键词计算得到在所述前置音音频信息的词图中各个预设关键词对应的预测概率;
所述识别结果获取模块用于将预测概率最高的一种预设关键词确定为当前外呼号码的状态。
9.一种智能外呼系统,其特征在于,包括外呼号码的状态检测装置和处理装置,其中,所述外呼号码状态检测装置为权利要求8所述的外呼号码的状态检测装置,所述外呼号码的状态检测装置用于检测当前外呼号码的状态,所述处理装置用于根据所述外呼号码的状态对本次外呼动作做出响应。
10.一种智能终端,所述智能终端包括存储器、处理器以及存储于所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器用于实现包括如权利要求1~6任一项所述外呼号码的状态检测方法的步骤;或实现包括如权利要求7所述智能外呼方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现包括如权利要求1~6任一项所述外呼号码的状态检测方法的步骤,或实现包括如权利要求7所述智能外呼方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010025582.4A CN111866289B (zh) | 2020-01-10 | 2020-01-10 | 外呼号码状态检测方法及装置、智能外呼方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010025582.4A CN111866289B (zh) | 2020-01-10 | 2020-01-10 | 外呼号码状态检测方法及装置、智能外呼方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111866289A CN111866289A (zh) | 2020-10-30 |
CN111866289B true CN111866289B (zh) | 2021-05-11 |
Family
ID=72970916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010025582.4A Active CN111866289B (zh) | 2020-01-10 | 2020-01-10 | 外呼号码状态检测方法及装置、智能外呼方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111866289B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112908364B (zh) * | 2021-01-14 | 2023-11-17 | 深圳市云之音科技有限公司 | 一种电话号码状态判断方法及系统 |
CN112954118B (zh) * | 2021-02-22 | 2022-09-30 | 上海井星信息科技有限公司 | 一种基于频谱高点的空号检测方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107465797A (zh) * | 2016-06-03 | 2017-12-12 | 百度在线网络技术(北京)有限公司 | 终端设备来电信息显示方法和装置 |
CN109862198A (zh) * | 2019-03-16 | 2019-06-07 | 平安科技(深圳)有限公司 | 一种基于语音交互的客户呼入保存方法及相关设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7216077B1 (en) * | 2000-09-26 | 2007-05-08 | International Business Machines Corporation | Lattice-based unsupervised maximum likelihood linear regression for speaker adaptation |
CN102404462B (zh) * | 2010-09-08 | 2015-05-20 | 北京商路通信息技术有限公司 | 一种用于电话外拨系统的呼叫进程分析方法和设备 |
US8914288B2 (en) * | 2011-09-01 | 2014-12-16 | At&T Intellectual Property I, L.P. | System and method for advanced turn-taking for interactive spoken dialog systems |
CN103730115B (zh) * | 2013-12-27 | 2016-09-07 | 北京捷成世纪科技股份有限公司 | 一种语音中检测关键词的方法和装置 |
US10403268B2 (en) * | 2016-09-08 | 2019-09-03 | Intel IP Corporation | Method and system of automatic speech recognition using posterior confidence scores |
CN108694940B (zh) * | 2017-04-10 | 2020-07-03 | 北京猎户星空科技有限公司 | 一种语音识别方法、装置及电子设备 |
US10529322B2 (en) * | 2017-06-15 | 2020-01-07 | Google Llc | Semantic model for tagging of word lattices |
CN107580149B (zh) * | 2017-08-28 | 2020-01-21 | 携程旅游网络技术(上海)有限公司 | 外呼失败原因的识别方法、装置、电子设备、存储介质 |
CN110166637B (zh) * | 2018-02-12 | 2021-07-23 | 深圳市六度人和科技有限公司 | 一种空号识别方法及装置 |
-
2020
- 2020-01-10 CN CN202010025582.4A patent/CN111866289B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107465797A (zh) * | 2016-06-03 | 2017-12-12 | 百度在线网络技术(北京)有限公司 | 终端设备来电信息显示方法和装置 |
CN109862198A (zh) * | 2019-03-16 | 2019-06-07 | 平安科技(深圳)有限公司 | 一种基于语音交互的客户呼入保存方法及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111866289A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110428810B (zh) | 一种语音唤醒的识别方法、装置及电子设备 | |
CN108320733B (zh) | 语音数据处理方法及装置、存储介质、电子设备 | |
CN103971685B (zh) | 语音命令识别方法和系统 | |
CN110047481B (zh) | 用于语音识别的方法和装置 | |
CN105529028A (zh) | 语音解析方法和装置 | |
CN111797632B (zh) | 信息处理方法、装置及电子设备 | |
CN106875936B (zh) | 语音识别方法及装置 | |
CN105096941A (zh) | 语音识别方法以及装置 | |
CN111435592B (zh) | 一种语音识别方法、装置及终端设备 | |
CN111866289B (zh) | 外呼号码状态检测方法及装置、智能外呼方法及系统 | |
EP3989217B1 (en) | Method for detecting an audio adversarial attack with respect to a voice input processed by an automatic speech recognition system, corresponding device, computer program product and computer-readable carrier medium | |
CN103514882A (zh) | 一种语音识别方法及系统 | |
CN112509568A (zh) | 一种语音唤醒方法及装置 | |
CN112652306A (zh) | 语音唤醒方法、装置、计算机设备和存储介质 | |
CN112614514A (zh) | 有效语音片段检测方法、相关设备及可读存储介质 | |
CN106531195A (zh) | 一种对话冲突检测方法及装置 | |
CN111128174A (zh) | 一种语音信息的处理方法、装置、设备及介质 | |
CN110880317A (zh) | 一种语音识别系统中的智能标点方法及装置 | |
CN112951211B (zh) | 一种语音唤醒方法及装置 | |
CN112802498B (zh) | 语音检测方法、装置、计算机设备和存储介质 | |
CN111640423B (zh) | 一种词边界估计方法、装置及电子设备 | |
CN115762500A (zh) | 语音处理方法、装置、设备及存储介质 | |
CN111028830B (zh) | 一种本地热词库更新方法、装置及设备 | |
CN112185382A (zh) | 一种唤醒模型的生成和更新方法、装置、设备及介质 | |
CN112735392A (zh) | 语音处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |