CN102404462A - 一种用于电话外拨系统的呼叫进程分析方法和设备 - Google Patents

一种用于电话外拨系统的呼叫进程分析方法和设备 Download PDF

Info

Publication number
CN102404462A
CN102404462A CN2010102770065A CN201010277006A CN102404462A CN 102404462 A CN102404462 A CN 102404462A CN 2010102770065 A CN2010102770065 A CN 2010102770065A CN 201010277006 A CN201010277006 A CN 201010277006A CN 102404462 A CN102404462 A CN 102404462A
Authority
CN
China
Prior art keywords
frame
voice
keyword
target speech
characteristic sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102770065A
Other languages
English (en)
Other versions
CN102404462B (zh
Inventor
黄河
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yuanchuan Xinye Technology Co ltd
Original Assignee
BEIJING SHANGLUTONG INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING SHANGLUTONG INFORMATION TECHNOLOGY CO LTD filed Critical BEIJING SHANGLUTONG INFORMATION TECHNOLOGY CO LTD
Priority to CN201010277006.5A priority Critical patent/CN102404462B/zh
Publication of CN102404462A publication Critical patent/CN102404462A/zh
Application granted granted Critical
Publication of CN102404462B publication Critical patent/CN102404462B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种用于电话外拨系统的呼叫进程分析方法,包括如下步骤:A、电话外拨系统拨打状态已知的被叫方号码,从呼叫线路中提取来自被叫方的语音作为源语音样本,选取包含关键词的源语音样本进行特征提取形关键词语音帧特征序列模板;B、电话外拨系统拨打被叫方号码,从呼叫线路中提取来自被叫方的语音作为目标语音样本,对目标语音样本进行特征提取,形成目标语音帧特征序列;C、利用关键词语音帧特征序列模板,对目标语音帧特征序列进行识别。本发明还提供了一种用于电话外拨系统的呼叫进程分析装置。本发明方案可以提高被叫方状态的检测正确率,获取呼叫的准确状态,缩短检测延迟。

Description

一种用于电话外拨系统的呼叫进程分析方法和设备
技术领域
本发明涉及电话外拨技术领域以及语音识别领域,尤其涉及一种用于电话外拨系统的呼叫进程分析方法和设备。
背景技术
电话外拨是指拨打电话,并识别被叫方的呼叫状态,根据呼叫状态进行后续处理的操作。所述呼叫状态包括但不限于对方接通、空号、被叫用户关机、被叫不在服务区、被叫停机、有呼叫等待功能被叫忙、无呼叫等待功能被叫忙、中继忙/网络忙、被叫用户设置了呼入限制、其它运营商方向线路故障、被叫久叫不应等。电话外拨系统是指计算机自动拨打电话,并自动判断呼叫状态,根据呼叫状态进行后续处理的系统,根据后续处理的类型,分成自动外拨和预测式外拨两种类型。电话外拨系统被广泛应用于市场营销、商务办公、金融服务、售前售后服务、社会信息调查等方面。
电话外拨方案的核心,是准确识别出被叫方的呼叫状态,该过程被称为呼叫进程分析。在现有技术中,电话外拨系统最常用的电信线路为综合业务数字网(ISDN,Integrated Services Digital Network)线路。ISDN线路上的信息分成两类,一类是带外信息,即ISDN信令,一类是带内信息,即人可以听到的音频。
传统的基于ISDN线路的呼叫进程分析检测方法包括以下三种:信令检测方法、标准信息音检测方法和人声检测方法。信令检测方法就是根据ISDN所接收的ISDN信令判断被叫方的呼叫状态。标准信息音检测方法就是通过检测标准信息音来判断被叫方的呼叫状态。标准信息音是带内信息的一种,由单一频率的、有占空比的声音信号组成。常用的标准信息音包括回铃音和忙音。回铃音和忙音都是具有特定频谱特征的声音信号。图1所示为回铃音的波形示意图,采用频率为450±25Hz的交流电源,发送电平为-10±3dBm,它是5s断续的信号音,即1s送,4s断。图2所示为忙音的波形示意图,采用频率为450±25Hz的交流电源,发送电平为-10±3dBm,它是0.7断续的信号音,即0.35送,0.35断。标准信息音的检测原则一般为:检测到回铃音,回铃音消失,则认为对方接通;检测到忙音,则认为对方没有接通。人声检测方法就是检测ISDN线路接收的带内信息是否符合人声的频谱特征来判断其是否为人声。该方法可以区分出声音信号不是标准信息音,但对于区分此声音是用户说话声,还是彩铃或录音通知的准确率非常低。
在实际应用中,可以将三种方法综合使用,以提高检测准确率。以下针对多种呼叫进程的情况进行具体分析。
对于被叫方应答的情况,在呼叫端收到的信号序列依次为回铃信令、回铃音或彩铃、接通信令和人声。采用标准信息音检测方式,如果收到的是彩铃而不是回铃音,则无法检测到对方回铃,如果采用人声检测方式,在收到彩铃时就会判定为对方应答,以致出现误判。
对于空号、被叫用户关机、被叫停机、有呼叫等待功能被叫忙、无呼叫等待功能被叫忙、中继忙/网络忙、被叫用户设置了呼入限制、其它运营商方向线路故障的情况,在呼叫端收到的信号序列依次为:录音通知(持续约10秒,内容为例如“您好!您所拨打的号码是空号,请核对后再拨”、“您好!您所拨打的电话已关机”、“对不起!您拨打的用户暂时无法接通,请稍后再拨”、“对不起!您拨打的电话已停机”等)、忙音(持续约20秒)、用户请求拆线的信令。通过信令检测方法可以检测没有接通,但是有较大的延迟,将近30秒(录音通知10秒,忙音20秒),并且无法从用户请求拆线信息中获取具体的呼叫状态;通过标准信息音检测方法,可以检测没有接通,但是有较大的延迟,将近10秒,并且无法从用户请求拆线信息中获取具体的呼叫状态;通过真人声检测方法,会将录音通知误判为真人接通,也无法获取具体的呼叫状态。
对于寻呼被叫不成功的情况,在呼叫端收到的信号序列依次为:静音(持续约15秒)、录音通知(持续约10秒,内容为“对不起,您拨打的电话暂时无人接听,请稍后再拨”)、忙音(持续约20秒)、用户请求拆线的信令。通过信令检测方法,可以检测没有接通,但是有较大的延迟,约45秒(15+10+20),并且无法获取对方不在服务区的呼叫状态;通过标准信息音检测方法,可以检测没有接通,但是有较大的延迟,将近25秒,并且无法获取对方不在服务区;通过真人声检测方法,会将录音通知误判为真人接通,并且无法获取对方不在服务区。
如果是寻呼被叫成功,但被叫方久不应答的情况,在呼叫端收到的信号序列依次为:回铃音或彩铃、录音通知(持续约10秒,内容为“对不起,您拨打的电话暂时无人接听,请稍后再拨”)、忙音(持续约20秒)、用户请求拆线的信令。通过信令检测方法可以检测没有接通,但是有较大的延迟,将近30秒(录音通知10秒,忙音20秒),并且无法获取对方是久叫不应;通过标准信息音检测方法,可以检测没有接通,但是有较大的延迟,将近10秒,并且无法获取对方是久叫不应;通过真人声检测方法,会将录音通知误判为真人接通,并且无法获取对方是久叫不应。
从以上分析可以看出,即使将上述三种方法混合使用,仍然会产生检测错误、检测延迟太大和无法获知被叫方准确的状态等问题。
发明内容
本发明提供了用于电话外拨系统的呼叫进程分析方法和装置,可以提高被叫方状态的检测正确率,获取呼叫的准确状态,缩短检测延迟。
本发明实施例提出一种用于电话外拨系统的呼叫进程分析方法,包括如下步骤:
A、电话外拨系统拨打状态已知的被叫方号码,从呼叫线路中提取来自被叫方的语音作为源语音样本,选取包含关键词的源语音样本进行特征提取形关键词语音帧特征序列模板;
B、电话外拨系统拨打被叫方号码,从呼叫线路中提取来自被叫方的语音作为目标语音样本,对目标语音样本进行特征提取,形成目标语音帧特征序列;
C、利用关键词语音帧特征序列模板,对目标语音帧特征序列进行识别。
较佳地,步骤A和/或步骤B所述从呼叫线路中提取来自被叫方的语音包括:
语音板卡、ISDN到H.323或SIP语音的网关、或IP交换机从呼叫线路中提取音频数据,并对所提取的音频数据进行线性化处理。
较佳地,步骤A所述选取包含关键词的源语音样本进行特征提取形成帧特征序列,将所述帧特征序列存储为关键词语音帧特征序列模板包括:
A1、对每一份包含关键词的源语音样本进行分帧加窗处理,得到源语音帧;
A2、使用帧过零率或短时能量特征对所述源语音帧进行静音判定,对于每一个源语音帧,生成用于指示该源语音帧是否为静音帧的静音标识;
A3、对每一个源语音帧的静音标识进行识别,若静音标识指示源语音帧为非静音帧,根据该源语音帧的语音线性猜测模型计算语音特征的倒谱系数;
A4、依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列;将所述分帧语音倒谱系数序列作为关键词语音帧特征序列模板。
较佳地,步骤B所述对目标语音样本进行特征提取,形成目标语音帧特征序列包括:
B1、对每一份目标语音样本进行分帧加窗处理,得到目标语音帧;
B2、使用帧过零率或短时能量特征对所述目标语音帧进行静音判定,对于每一个目标语音帧,生成用于指示该目标语音帧是否为静音帧的静音标识;
B3、对每一个目标语音帧的静音标识进行识别,若静音标识指示目标语音帧为非静音帧,根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数;
B4、将目标语音帧的静音标识以及倒谱系数按照顺序排列,形成分帧语音倒谱系数序列;将所述分帧语音倒谱系数序列作为目标语音帧特征序列。
较佳地,所述步骤A1进一步包括:对源语音样本进行预加重处理。
较佳地,所述关键词包括:是空号、已关机、无法接通、正在通话中、无法接通、呼入限制、无需加零、网络暂时无法接通、暂时无人接听或以上关键词的任意组合。
较佳地,所述步骤C包括:
C1、将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配,计算出与每一个关键词语音帧特征序列模板对应的匹配误差;
C2、将所有关键词语音帧特征序列模板对应的匹配误差进行比较,找出其中最小的匹配误差;
C3、判断所述最小的匹配误差是否小于预先设定的误差门限,若是,认为目标语音包含该最小的匹配误差对应的关键词语音帧特征序列模板所对应的关键词,否则,认为语音不包含关键词。
较佳地,步骤C1中对一个关键词语音帧特征序列模板进行匹配,计算出与该关键词语音帧特征序列模板对应的匹配误差包括:
设目标语音帧特征序列中的一个帧F1与关键词语音帧特征序列模板的一个帧F2之间的欧拉距离的表达式为:
Figure BSA00000263340600051
其中,α1,α2...αK为所述帧F1的倒谱系数,β1,β2...βK为所述帧F2的倒谱系数;
设目标语音帧特征序列共包括M个语音帧,分别为FD0、FD1...FDM-1,而关键词语音帧特征序列模板包括N个语音帧分别为FT0、FT1...FTN-1,其中M>N,目标语音帧特征序列中进行匹配的起始帧号为s;
计算关键词语音帧特征序列模板与目标语音中从帧s到帧s+N-1的平均欧拉距离平均欧拉距离DTs
DTs=[Df(FDs+0,FT0)+Df(FDs+1,FT1)+…+Df(FDs+N-1,FTN-1)]/N;
将所述起始帧号s从0遍历到M-N+1,计算所有的平均欧拉距离DT0、DT1....DTM-N+1
在所述平均欧拉距离DT0、DT1....DTM-N+1中找到一个最小值,作为该关键词语音帧特征序列模板的匹配误差。
本发明实施例还提出一种用于电话外拨系统的呼叫进程分析装置,包括:
源语音帧特征序列提取模块,用于在电话外拨系统拨打状态已知的被叫方号码时,从呼叫线路中提取来自被叫方的语音作为源语音样本,选取包含关键词的源语音样本进行特征提取形成关键词语音帧特征序列模板;
目标语音特征提取模块,用于在电话外拨系统拨打被叫方号码时,从呼叫线路中提取来自被叫方的语音作为目标语音样本,对目标语音样本进行特征提取,形成目标语音帧特征序列;
特征识别模块,用于利用所述特征模块建立的关键词语音帧特征序列模板,对信号提取模块所提取的目标语音帧特征序列进行识别。
较佳地,所述源语音帧特征序列提取模块包括:
第一音频数据提取单元,用于从语音板卡、ISDN到H.323或SIP语音的网关、或IP交换机中提取音频数据并输出所述音频数据;
第一线性化处理单元,用于对第一音频数据提取单元所提取的音频数据进行线性化处理,并输出线性化处理后的音频数据;
关键词选择单元,用于从第一线性化处理单元输出的音频数据中截取包含关键词的音频片段作为源语音样本;
第一加窗处理单元,用于对每一份包含关键词的源语音样本进行分帧加窗处理,得到源语音帧并输出;
第一静音判定单元,用于使用帧过零率与短时能量特征对所述源语音帧进行静音判定,对于加窗处理单元输出的每一个源语音帧,生成用于指示该源语音帧是否为静音帧的静音标识;
第一计算单元,用于对每一个源语音帧的静音标识进行识别,若静音标识指示源语音帧为非静音帧,根据该源语音帧的语音线性猜测模型计算语音特征的倒谱系数;
存储单元,用于依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列;所述分帧语音倒谱系数序列即为关键词语音帧特征序列模板。
较佳地,所述目标语音特征提取模块包括:
第二音频数据提取单元,用于从语音板卡、ISDN到H.323或SIP语音的网关、或IP交换机中提取音频数据并输出所述音频数据;
第二线性化处理单元,用于对音频数据提取单元所提取的音频数据进行线性化处理,并输出线性化处理后的音频数据作为目标语音样本;
第二加窗处理单元,用于对每一份目标语音样本进行分帧加窗处理,得到并输出目标语音帧;
第二静音判定单元,用于使用帧过零率与短时能量特征对所述目标语音帧进行静音判定,对于每一个目标语音帧,生成用于指示该目标语音帧是否为静音帧的静音标识;
第二计算单元,用于对每一个目标语音帧的静音标识进行识别,若静音标识指示目标语音帧为非静音帧,根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数;
特征序列单元,用于将目标语音帧的静音标识以及倒谱系数按照顺序排列,形成分帧语音倒谱系数序列;所述分帧语音倒谱系数序列作为目标语音帧特征序列。
较佳地,所述特征识别模块包括:
匹配单元,用于将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配,计算出与该关键词语音帧特征序列模板对应的匹配误差;
比较单元,用于将所有匹配误差进行比较,找出其中最小的匹配误差并输出至判断单元;以及
判断单元,用于判断来自所述比较单元的匹配误差是否小于预先设定的误差门限,若是,判断结果为目标语音包含该关键词语音帧特征序列模板对应的关键词,否则,判断结果为语音不包含关键词,并输出该判断结果。
从以上技术方案可以看出,在电话外拨系统拨打被叫号码时,提取来自被叫方的信号,根据预先建立录音通知包含的关键词的特征模板对该信号进行识别。该技术方案具有如下有益效果:
1、检测时间短,在接收到关键词30毫秒内,即可检测完成;
2、检测信息全面,不但通过信令可以检测对方接通,还可以检测出空号、被叫用户关机、被叫不在服务区、被叫停机、有呼叫等待功能被叫忙、无呼叫等待功能被叫忙、中继忙/网络忙、被叫用户设置了呼入限制、GSM手机拨GSM手机加″0″、固定网拨本地GSM手机加″0″、拨号未加长途区号、其它运营商方向线路故障、被叫久叫不应等信息;
3、误判率低:不会将彩铃或录音通知误判为对方应答,不会因为彩铃误判为没有回铃。
附图说明
图1为回铃音的波形示意图;
图2为忙音的波形示意图;
图3为本发明实施例提出的呼叫进程分析的流程示意图;
图4为本发明实施例提出的用于电话外拨系统的呼叫进程分析装置的结构框图;
图5为图4中的源语音帧特征序列提取模块401的内部结构图;
图6为图4中的目标语音特征提取模块402的内部结构图;
图7为图4中的特征识别模块的内部结构图。
具体实施方式
本发明实施例提出的用于电话外拨系统的呼叫进程分析方法,其关键技术特征为对被叫方的信号进行关键词语音识别,以解决检测错误、检测延迟太大和无法获知被叫方准确的状态等问题。
图3所示为本发明实施例提出的呼叫进程分析的流程示意图,包括如下步骤:
步骤301:建立关键词语音帧特征序列模板。
建立关键词语音帧特征序列模板的流程包括如下步骤:
步骤301a:建立关键词字典,所述关键词包含但不限于“是空号”、“已关机”、“无法接通”、“正在通话中”、“无法接通”、“呼入限制”、“无需加零”、“网络暂时无法接通”、“暂时无人接听”等;
步骤301b:电话外拨系统拨打状态已知的被叫方号码,从呼叫线路中提取来自被叫方的语音作为源语音样本。
目前有大量的设备可以提取音频数据和信令,形成音频数据流,包括语音板卡、ISDN到H.323或SIP语音的网关、IP交换机等。通过这些设备可以直接从呼叫线路中提取音频数据,数据编码格式常用的是G.711 A Law,将其线性化处理后即可进行语音识别处理。
步骤301c:选取包含关键词的源语音样本进行特征提取形成关键词语音帧特征序列模板。步骤如下:
步骤301c-1:对源语音样本进行预加重处理,该步骤为可选步骤,其目的是提升高频部分,使信号的频谱变得平坦,保证语音特征明显,减少噪声对频谱分析的影响。
步骤301c-2:对每一份目标语音样本进行分帧加窗处理,得到目标语音帧,该步骤的目的是保证分帧语音的短时平稳性;
步骤301c-3:使用帧过零率或短时能量特征对所述源语音帧进行静音判定,对于每一个源语音帧,生成用于指示该源语音帧是否为静音帧的静音标识。
使用帧过零率的判定方法如下:
设置采样值门限G和过零率门限为R,
过零率=帧中采样值超过G的数量/N。
当过零率<R时,则判定这一帧为静音帧,否则判定这一帧为非静音帧。
步骤301c-4、对每一个目标语音帧的静音标识进行识别,若静音标识指示目标语音帧为非静音帧,根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数。步骤301c-5、依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列;将所述分帧语音倒谱系数序列作为关键词语音帧特征序列模板。
由于每一个关键词的倒谱系数序列都具有其独特的特征,并且易于识别,可以将其作为关键词的特征模板。
步骤302:电话外拨系统拨打被叫方号码。
步骤303:从呼叫线路中提取来自被叫方的带内语音。提取方式与提取源语音样本的方式相同。
步骤304:对目标语音样本进行特征提取,形成目标语音帧特征序列。
步骤304具体包括如下子步骤:
步骤304-1、对每一份目标语音样本进行分帧加窗处理,得到目标语音帧。
步骤304-2、使用帧过零率与短时能量特征对所述目标语音帧进行静音判定,对于每一个目标语音帧,生成用于指示该目标语音帧是否为静音帧的静音标识;
步骤304-3、对每一个目标语音帧的静音标识进行识别,若静音标识指示目标语音帧为非静音帧,根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数;
步骤304-4、将目标语音帧的静音标识以及倒谱系数按照顺序排列,形成分帧语音倒谱系数序列;将所述分帧语音倒谱系数序列作为目标语音帧特征序列。
较佳地,在步骤304-1之前,也可以对目标语音样本进行预加重处理。
步骤305:利用关键词语音帧特征序列模板,对目标语音帧特征序列进行识别。具体包括如下子步骤:
步骤305-1:将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配,计算出与该关键词语音帧特征序列模板对应的匹配误差;
具体方法分解为三个部分:
1、计算帧误差,定义为函数Df(F1,F2)
例如,设目标语音帧特征序列中一个帧F 1的倒谱系数为:α1,α2...αK
关键词语音帧特征序列模板中一个帧F2的倒谱系数为:β1,β2...βK
计算所述两个帧的欧拉距离为:
Df(F1,F2)=sqrt((α1-β1)^2+(α2-β2)^2...(αK-βK)^2)。
该欧拉距离是帧F1与帧F2之间的帧误差。
2、计算平均欧拉距离DT
设目标语音共包括M个语音帧,分别为FD0、FD1...FDM-1,而关键词语音帧特征序列模板包括N个语音帧分别为FT0、FT1...FTN-1,其中M>N,起始帧为s。
计算关键词语音帧特征序列模板与目标语音中从帧s到帧s+N-1的平均欧拉距离DTs
DTs=[Df(FDs+0,FT0)+Df(FDs+1,FT1)+…+Df(FDs+N-1,FTN-1)]/N3、将所述起始帧号s从0遍历到M-N+1,计算所有的平均欧拉距离DT0、DT1....DTM-N+14、在所述平均欧拉距离DT0、DT1....DTM-N+1中找到一个最小值,作为该关键词语音帧特征序列模板的匹配误差
步骤305-2:将所有匹配误差进行比较,找出其中最小的匹配误差,作为关键词语音帧特征序列模板的匹配误差;
步骤305-3:判断所述最小的匹配误差是否小于预先设定的误差门限,若是,认为目标语音包含该关键词语音帧特征序列模板对应的关键词,否则,认为语音不包含关键词。
本发明实施例还提出一种用于电话外拨系统的呼叫进程分析装置,其结构框图如图4所示,该呼叫进程分析装置400包括:
源语音帧特征序列提取模块401,用于在电话外拨系统拨打状态已知的被叫方号码时,从呼叫线路中提取来自被叫方的语音作为源语音样本,选取包含关键词的源语音样本进行特征提取形成关键词语音帧特征序列模板;
目标语音特征提取模块402,用于在电话外拨系统拨打被叫方号码时,从呼叫线路中提取来自被叫方的语音作为目标语音样本,对目标语音样本进行特征提取,形成目标语音帧特征序列;
特征识别模块403,用于利用所述特征模块建立的关键词语音帧特征序列模板,对信号提取模块所提取的目标语音帧特征序列进行识别。
较佳地,所述源语音帧特征序列提取模块401的内部结构如图5所示,包括:
第一音频数据提取单元501,用于从语音板卡、ISDN到H.323或SIP语音的网关、或IP交换机中提取音频数据并输出所述音频数据;
第一线性化处理单元502,用于对第一音频数据提取单元所提取的音频数据进行线性化处理,并输出线性化处理后的音频数据;
关键词选择单元503,用于从第一线性化处理单元502输出的音频数据中截取包含关键词的音频片段作为源语音样本;
第一加窗处理单元504,用于对每一份包含关键词的源语音样本进行分帧加窗处理,得到源语音帧并输出;
第一静音判定单元505,用于使用帧过零率与短时能量特征对所述源语音帧进行静音判定,对于加窗处理单元输出的每一个源语音帧,生成用于指示该源语音帧是否为静音帧的静音标识;
第一计算单元506,用于对每一个源语音帧的静音标识进行识别,若静音标识指示源语音帧为非静音帧,根据该源语音帧的语音线性猜测模型计算语音特征的倒谱系数;
存储单元507,用于依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列;所述分帧语音倒谱系数序列即为关键词语音帧特征序列模板。
较佳地,所述目标语音特征提取模块402的内部结构如图6所示,包括:
第二音频数据提取单元601,用于从语音板卡、ISDN到H.323或SIP语音的网关、或IP交换机中提取音频数据并输出所述音频数据;
第二线性化处理单元602,用于对音频数据提取单元601所提取的音频数据进行线性化处理,并输出线性化处理后的音频数据作为目标语音样本;
第二加窗处理单元603,用于对每一份目标语音样本进行分帧加窗处理,得到并输出目标语音帧;
第二静音判定单元604,用于使用帧过零率与短时能量特征对所述目标语音帧进行静音判定,对于每一个目标语音帧,生成用于指示该目标语音帧是否为静音帧的静音标识;
第二计算单元605,用于对每一个目标语音帧的静音标识进行识别,若静音标识指示目标语音帧为非静音帧,根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数;
特征序列单元606,用于将目标语音帧的静音标识以及倒谱系数按照顺序排列,形成分帧语音倒谱系数序列;所述分帧语音倒谱系数序列作为目标语音帧特征序列输出。
较佳地,所述特征识别模块的内部结构如图7所示,包括:
匹配单元701,用于将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配,计算出与该关键词语音帧特征序列模板对应的匹配误差;
比较单元702,用于将所有匹配误差进行比较,找出其中最小的匹配误差并输出至判断单元;以及
判断单元703,用于判断来自所述比较单元的匹配误差是否小于预先设定的误差门限,若是,判断结果为目标语音包含该关键词语音帧特征序列模板对应的关键词,否则,判断结果为语音不包含关键词,并输出该判断结果。
本发明实施例的技术方案具有以下有益效果:
1、检测时间短,在接收到关键词30毫秒内,即可检测完成,例如,在听到“是空号”的声音30毫秒后,即可判定对方是空号;
2、检测信息全面,不但通过信令可以检测对方接通,还可以检测出空号、被叫用户关机、被叫不在服务区、被叫停机、有呼叫等待功能被叫忙、无呼叫等待功能被叫忙、中继忙/网络忙、被叫用户设置了呼入限制、GSM手机拨GSM手机加″0″、固定网拨本地GSM手机加″0″、拨号未加长途区号、其它运营商方向线路故障、被叫久叫不应等信息;
3、误判率低:不会将彩铃或录音通知误判为对方应答,不会因为彩铃误判为没有回铃。
利用本发明实施例提出的呼叫进程分析方案,可以极大提高自动外拨的速度和效率。具体分析如下:
在实际使用中,电话外拨系统经常利用外拨资源同时发起上百个外拨任务,而且对于呼叫没有接通的电话需要重新呼叫。一方面,利用本发明实施例提出的呼叫进程分析方案快速检测呼叫状态,可以减少外拨资源占用,提高外拨效率;另一方面,通过制定策略,可以减少无效外拨对外拨资源的占用,并提高接通率,具体策略如下:
对于空号、被叫用户设置了呼入限制等状态的电话不再重复呼叫;
对于被叫停机的状态,选择24小时后重复呼叫,避免资源占用;
对于被叫用户关机的状态,选择延迟M1小时后重复呼叫,例如,延迟5小时后呼叫;
对于被叫不在服务区、被叫久叫不应的状态,选择延迟M2小时后重复呼叫;例如,所述M2=2。一般来说,M2应小于M1。
对于有呼叫等待功能被叫忙、无呼叫等待功能被叫忙、中继忙/网络忙、其它运营商方向线路故障的状态,选择M3小时后重复呼叫。例如,所述M3=1。一般来说,M3应小于M2。
本发明实施例提出的准确的呼叫进程分析还可以用于提高预测式外拨的人员利用率。
预测式外拨系统在自动外拨的基础上,增加接通后转接到人工的功能。
首先,快速检测呼叫状态,可以减少人工等待,降低人力成本。
其次,降低误判,降低人工接听没有接通的电话带来的人力浪费;
最后,准确的呼叫进程分析提供的数据,可以大幅优化预测外拨的算法,提高坐席工作效率,降低骚扰率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (12)

1.一种用于电话外拨系统的呼叫进程分析方法,其特征在于,包括如下步骤:
A、电话外拨系统拨打状态已知的被叫方号码,从呼叫线路中提取来自被叫方的语音作为源语音样本,选取包含关键词的源语音样本进行特征提取形关键词语音帧特征序列模板;
B、电话外拨系统拨打被叫方号码,从呼叫线路中提取来自被叫方的语音作为目标语音样本,对目标语音样本进行特征提取,形成目标语音帧特征序列;
C、利用关键词语音帧特征序列模板,对目标语音帧特征序列进行识别。
2.根据权利要求1所述的方法,其特征在于,步骤A和/或步骤B所述从呼叫线路中提取来自被叫方的语音包括:
语音板卡、ISDN到H.323或SIP语音的网关、或IP交换机从呼叫线路中提取音频数据,并对所提取的音频数据进行线性化处理。
3.根据权利要求1所述的方法,其特征在于,步骤A所述选取包含关键词的源语音样本进行特征提取形成帧特征序列,将所述帧特征序列存储为关键词语音帧特征序列模板包括:
A1、对每一份包含关键词的源语音样本进行分帧加窗处理,得到源语音帧;
A2、使用帧过零率或短时能量特征对所述源语音帧进行静音判定,对于每一个源语音帧,生成用于指示该源语音帧是否为静音帧的静音标识;
A3、对每一个源语音帧的静音标识进行识别,若静音标识指示源语音帧为非静音帧,根据该源语音帧的语音线性猜测模型计算语音特征的倒谱系数;
A4、依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列;将所述分帧语音倒谱系数序列作为关键词语音帧特征序列模板。
4.根据权利要求1所述的方法,其特征在于,步骤B所述对目标语音样本进行特征提取,形成目标语音帧特征序列包括:
B1、对每一份目标语音样本进行分帧加窗处理,得到目标语音帧;
B2、使用帧过零率或短时能量特征对所述目标语音帧进行静音判定,对于每一个目标语音帧,生成用于指示该目标语音帧是否为静音帧的静音标识;
B3、对每一个目标语音帧的静音标识进行识别,若静音标识指示目标语音帧为非静音帧,根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数;
B4、将目标语音帧的静音标识以及倒谱系数按照顺序排列,形成分帧语音倒谱系数序列;将所述分帧语音倒谱系数序列作为目标语音帧特征序列。
5.根据权利要求3所述的方法,其特征在于,所述步骤A1进一步包括:对源语音样本进行预加重处理。
6.根据权利要求1所述的方法,其特征在于,所述关键词包括:是空号、已关机、无法接通、正在通话中、无法接通、呼入限制、无需加零、网络暂时无法接通、暂时无人接听或以上关键词的任意组合。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述步骤C包括:
C1、将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配,计算出与每一个关键词语音帧特征序列模板对应的匹配误差;
C2、将所有关键词语音帧特征序列模板对应的匹配误差进行比较,找出其中最小的匹配误差;
C3、判断所述最小的匹配误差是否小于预先设定的误差门限,若是,认为目标语音包含该最小的匹配误差对应的关键词语音帧特征序列模板所对应的关键词,否则,认为语音不包含关键词。
8.根据权利要求7所述的方法,其特征在于,步骤C1中对一个关键词语音帧特征序列模板进行匹配,计算出与该关键词语音帧特征序列模板对应的匹配误差包括:
设目标语音帧特征序列中的一个帧F1与关键词语音帧特征序列模板的一个帧F2之间的欧拉距离的表达式为:
Figure FSA00000263340500031
其中,α1,α2...αK为所述帧F1的倒谱系数,β1,β2...βK为所述帧F2的倒谱系数;
设目标语音帧特征序列共包括M个语音帧,分别为FD0、FD1...FDM-1,而关键词语音帧特征序列模板包括N个语音帧分别为FT0、FT1...FTN-1,其中M>N,目标语音帧特征序列中进行匹配的起始帧号为s;
计算关键词语音帧特征序列模板与目标语音中从帧s到帧s+N-1的平均欧拉距离平均欧拉距离DTs
DTs=[Df(FDs+0,FT0)+Df(FDs+1,FT1)+…+Df(FDs+N-1,FTN-1)]/N;
将所述起始帧号s从0遍历到M-N+1,计算所有的平均欧拉距离DT0、DT1....DTM-N+1
在所述平均欧拉距离DT0、DT1....DTM-N+1中找到一个最小值,作为该关键词语音帧特征序列模板的匹配误差。
9.一种用于电话外拨系统的呼叫进程分析装置,其特征在于,包括:
源语音帧特征序列提取模块,用于在电话外拨系统拨打状态已知的被叫方号码时,从呼叫线路中提取来自被叫方的语音作为源语音样本,选取包含关键词的源语音样本进行特征提取形成关键词语音帧特征序列模板;
目标语音特征提取模块,用于在电话外拨系统拨打被叫方号码时,从呼叫线路中提取来自被叫方的语音作为目标语音样本,对目标语音样本进行特征提取,形成目标语音帧特征序列;
特征识别模块,用于利用所述特征模块建立的关键词语音帧特征序列模板,对信号提取模块所提取的目标语音帧特征序列进行识别。
10.根据权利要求9所述的装置,其特征在于,所述源语音帧特征序列提取模块包括:
第一音频数据提取单元,用于从语音板卡、ISDN到H.323或SIP语音的网关、或IP交换机中提取音频数据并输出所述音频数据;
第一线性化处理单元,用于对第一音频数据提取单元所提取的音频数据进行线性化处理,并输出线性化处理后的音频数据;
关键词选择单元,用于从第一线性化处理单元输出的音频数据中截取包含关键词的音频片段作为源语音样本;
第一加窗处理单元,用于对每一份包含关键词的源语音样本进行分帧加窗处理,得到源语音帧并输出;
第一静音判定单元,用于使用帧过零率与短时能量特征对所述源语音帧进行静音判定,对于加窗处理单元输出的每一个源语音帧,生成用于指示该源语音帧是否为静音帧的静音标识;
第一计算单元,用于对每一个源语音帧的静音标识进行识别,若静音标识指示源语音帧为非静音帧,根据该源语音帧的语音线性猜测模型计算语音特征的倒谱系数;
存储单元,用于依次存储每一个源语音帧的静音标识以及倒谱系数形成分帧语音倒谱系数序列;所述分帧语音倒谱系数序列即为关键词语音帧特征序列模板。
11.根据权利要求9所述的装置,其特征在于,所述目标语音特征提取模块包括:
第二音频数据提取单元,用于从语音板卡、ISDN到H.323或SIP语音的网关、或IP交换机中提取音频数据并输出所述音频数据;
第二线性化处理单元,用于对音频数据提取单元所提取的音频数据进行线性化处理,并输出线性化处理后的音频数据作为目标语音样本;
第二加窗处理单元,用于对每一份目标语音样本进行分帧加窗处理,得到并输出目标语音帧;
第二静音判定单元,用于使用帧过零率与短时能量特征对所述目标语音帧进行静音判定,对于每一个目标语音帧,生成用于指示该目标语音帧是否为静音帧的静音标识;
第二计算单元,用于对每一个目标语音帧的静音标识进行识别,若静音标识指示目标语音帧为非静音帧,根据该目标语音帧的语音线性猜测模型计算语音特征的倒谱系数;
特征序列单元,用于将目标语音帧的静音标识以及倒谱系数按照顺序排列,形成分帧语音倒谱系数序列;所述分帧语音倒谱系数序列作为目标语音帧特征序列。
12.根据权利要求9至11任一项所述的方法,其特征在于,所述特征识别模块包括:
匹配单元,用于将目标语音帧特征序列分别对每一个关键词语音帧特征序列模板进行匹配,计算出与该关键词语音帧特征序列模板对应的匹配误差;
比较单元,用于将所有匹配误差进行比较,找出其中最小的匹配误差并输出至判断单元;以及
判断单元,用于判断来自所述比较单元的匹配误差是否小于预先设定的误差门限,若是,判断结果为目标语音包含该关键词语音帧特征序列模板对应的关键词,否则,判断结果为语音不包含关键词,并输出该判断结果。
CN201010277006.5A 2010-09-08 2010-09-08 一种用于电话外拨系统的呼叫进程分析方法和设备 Active CN102404462B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010277006.5A CN102404462B (zh) 2010-09-08 2010-09-08 一种用于电话外拨系统的呼叫进程分析方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010277006.5A CN102404462B (zh) 2010-09-08 2010-09-08 一种用于电话外拨系统的呼叫进程分析方法和设备

Publications (2)

Publication Number Publication Date
CN102404462A true CN102404462A (zh) 2012-04-04
CN102404462B CN102404462B (zh) 2015-05-20

Family

ID=45886228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010277006.5A Active CN102404462B (zh) 2010-09-08 2010-09-08 一种用于电话外拨系统的呼叫进程分析方法和设备

Country Status (1)

Country Link
CN (1) CN102404462B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488025A (zh) * 2015-11-24 2016-04-13 小米科技有限责任公司 模板构建方法和装置、信息识别方法和装置
CN105592023A (zh) * 2014-11-13 2016-05-18 中国科学院沈阳计算技术研究所有限公司 SIPHelloSDK与语音板卡的通话系统和方法
CN108391020A (zh) * 2018-02-26 2018-08-10 出门问问信息科技有限公司 一种通话控制方法、装置、设备及存储介质
CN108399913A (zh) * 2018-02-12 2018-08-14 北京容联易通信息技术有限公司 高鲁棒性音频指纹识别方法及系统
CN108877768A (zh) * 2018-05-21 2018-11-23 广东省电信规划设计院有限公司 座机提示音识别方法、装置及计算机设备
CN108986789A (zh) * 2018-09-12 2018-12-11 携程旅游信息技术(上海)有限公司 语音识别方法、装置、存储介质及电子设备
CN110290280A (zh) * 2019-05-28 2019-09-27 同盾控股有限公司 一种终端状态的识别方法、装置及存储介质
CN110335627A (zh) * 2019-07-16 2019-10-15 柴桥子 一种基于深度学习的快速判断号码有效性的方法以及装置
CN111435960A (zh) * 2018-12-25 2020-07-21 马上消费金融股份有限公司 用户号码状态的识别方法、系统、装置和计算机存储介质
CN111508527A (zh) * 2020-04-17 2020-08-07 北京帝派智能科技有限公司 一种电话应答状态检测方法、装置及服务器
CN111866289A (zh) * 2020-01-10 2020-10-30 马上消费金融股份有限公司 外呼号码状态检测方法及装置、智能外呼方法及系统
CN112202974A (zh) * 2020-12-03 2021-01-08 零犀(北京)科技有限公司 自动判断电话接听状态的方法、装置以及系统
CN112837680A (zh) * 2019-11-25 2021-05-25 马上消费金融股份有限公司 音频关键词检索方法、智能外呼方法及相关装置
CN113611284A (zh) * 2021-08-06 2021-11-05 工银科技有限公司 语音库构建方法、识别方法、构建系统和识别系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1120211A (zh) * 1994-10-12 1996-04-10 谭政 一种数字语音处理方法和采用该方法的数字语音电话机
CN1268732A (zh) * 2000-03-31 2000-10-04 清华大学 基于语音识别专用芯片的特定人语音识别、语音回放方法
CN101136199A (zh) * 2006-08-30 2008-03-05 国际商业机器公司 语音数据处理方法和设备
CN101262524A (zh) * 2008-04-23 2008-09-10 沈阳东软软件股份有限公司 垃圾语音过滤的方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1120211A (zh) * 1994-10-12 1996-04-10 谭政 一种数字语音处理方法和采用该方法的数字语音电话机
CN1268732A (zh) * 2000-03-31 2000-10-04 清华大学 基于语音识别专用芯片的特定人语音识别、语音回放方法
CN101136199A (zh) * 2006-08-30 2008-03-05 国际商业机器公司 语音数据处理方法和设备
CN101262524A (zh) * 2008-04-23 2008-09-10 沈阳东软软件股份有限公司 垃圾语音过滤的方法及系统

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105592023A (zh) * 2014-11-13 2016-05-18 中国科学院沈阳计算技术研究所有限公司 SIPHelloSDK与语音板卡的通话系统和方法
CN105592023B (zh) * 2014-11-13 2018-12-07 中国科学院沈阳计算技术研究所有限公司 SIPHelloSDK与语音板卡的通话系统和方法
CN105488025B (zh) * 2015-11-24 2019-02-12 小米科技有限责任公司 模板构建方法和装置、信息识别方法和装置
WO2017088246A1 (zh) * 2015-11-24 2017-06-01 小米科技有限责任公司 模板构建方法和装置、信息识别方法和装置
US10061762B2 (en) 2015-11-24 2018-08-28 Xiaomi Inc. Method and device for identifying information, and computer-readable storage medium
CN105488025A (zh) * 2015-11-24 2016-04-13 小米科技有限责任公司 模板构建方法和装置、信息识别方法和装置
CN108399913A (zh) * 2018-02-12 2018-08-14 北京容联易通信息技术有限公司 高鲁棒性音频指纹识别方法及系统
CN108391020A (zh) * 2018-02-26 2018-08-10 出门问问信息科技有限公司 一种通话控制方法、装置、设备及存储介质
CN108877768B (zh) * 2018-05-21 2020-12-11 广东省电信规划设计院有限公司 座机提示音识别方法、装置及计算机设备
CN108877768A (zh) * 2018-05-21 2018-11-23 广东省电信规划设计院有限公司 座机提示音识别方法、装置及计算机设备
CN108986789A (zh) * 2018-09-12 2018-12-11 携程旅游信息技术(上海)有限公司 语音识别方法、装置、存储介质及电子设备
CN111435960A (zh) * 2018-12-25 2020-07-21 马上消费金融股份有限公司 用户号码状态的识别方法、系统、装置和计算机存储介质
CN111435960B (zh) * 2018-12-25 2021-08-17 马上消费金融股份有限公司 用户号码状态的识别方法、系统、装置和计算机存储介质
CN110290280A (zh) * 2019-05-28 2019-09-27 同盾控股有限公司 一种终端状态的识别方法、装置及存储介质
CN110335627A (zh) * 2019-07-16 2019-10-15 柴桥子 一种基于深度学习的快速判断号码有效性的方法以及装置
CN112837680A (zh) * 2019-11-25 2021-05-25 马上消费金融股份有限公司 音频关键词检索方法、智能外呼方法及相关装置
CN111866289A (zh) * 2020-01-10 2020-10-30 马上消费金融股份有限公司 外呼号码状态检测方法及装置、智能外呼方法及系统
CN111508527A (zh) * 2020-04-17 2020-08-07 北京帝派智能科技有限公司 一种电话应答状态检测方法、装置及服务器
CN111508527B (zh) * 2020-04-17 2021-03-12 北京帝派智能科技有限公司 一种电话应答状态检测方法、装置及服务器
CN112202974A (zh) * 2020-12-03 2021-01-08 零犀(北京)科技有限公司 自动判断电话接听状态的方法、装置以及系统
CN112202974B (zh) * 2020-12-03 2021-04-02 安徽信晨通信技术有限公司 自动判断电话接听状态的方法、装置以及系统
CN113611284A (zh) * 2021-08-06 2021-11-05 工银科技有限公司 语音库构建方法、识别方法、构建系统和识别系统
CN113611284B (zh) * 2021-08-06 2024-05-07 工银科技有限公司 语音库构建方法、识别方法、构建系统和识别系统

Also Published As

Publication number Publication date
CN102404462B (zh) 2015-05-20

Similar Documents

Publication Publication Date Title
CN102404462B (zh) 一种用于电话外拨系统的呼叫进程分析方法和设备
US6850602B1 (en) Method and apparatus for answering machine detection in automatic dialing
US8391445B2 (en) Caller identification using voice recognition
US20060246891A1 (en) Voice mail with phone number recognition system
CN102780819A (zh) 一种移动终端的语音识别联系人的方法
CN104883437B (zh) 基于环境的语音分析调整提示音量的方法及系统
CN103139404A (zh) 基于语音识别生成交互式语音响应显示菜单的系统和方法
CN104184872A (zh) 一种基于通话内容防骚扰电话的手机实现方法
CN101951432A (zh) 一种在通信录中增加联系人信息的方法、装置及移动终端
CN103295585A (zh) 识别电话自动外呼是否真人应答的处理系统及方法
EP2763386A1 (en) Method and system to provide priority indicating calls
CN106936997B (zh) 一种基于社交关系图谱的垃圾语音识别方法和系统
CN104427479A (zh) 一种提示呼叫状态的方法及移动终端
CN110062097B (zh) 骚扰电话处理方法、装置、移动终端以及存储介质
CN111508527B (zh) 一种电话应答状态检测方法、装置及服务器
CN111179936B (zh) 通话录音监控方法
US10063691B1 (en) Detecting dial tone on a telephone line
CN105007365B (zh) 一种分机号拨打方法及装置
CN111343328B (zh) 基于声纹识别的通话管理方法、系统及移动终端
CN107357859A (zh) 一种通过语音采集实现知识库自动显示的智能终端
CN107370865A (zh) 骚扰电话的识别方法、装置及终端
CN1809098A (zh) 防止电话语音来电干扰的装置及其方法
CN102651784A (zh) 联系人身份验证系统及方法
JP2004173124A (ja) 顧客データの管理方法
CN108040185A (zh) 一种识别骚扰电话的方法及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210128

Address after: Room 23011, Yuejiang commercial center, 857 Xincheng Road, Puyan street, Binjiang District, Hangzhou City, Zhejiang Province, 310051

Patentee after: Hangzhou Yuanchuan New Technology Co.,Ltd.

Address before: 100080 room 706, building 2, courtyard 72, Suzhou street, Haidian District, Beijing

Patentee before: BEIJING SHANGLUTONG INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: Room 23011, Yuejiang commercial center, 857 Xincheng Road, Puyan street, Binjiang District, Hangzhou City, Zhejiang Province, 310051

Patentee after: Hangzhou Yuanchuan Xinye Technology Co.,Ltd.

Address before: Room 23011, Yuejiang commercial center, 857 Xincheng Road, Puyan street, Binjiang District, Hangzhou City, Zhejiang Province, 310051

Patentee before: Hangzhou Yuanchuan New Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Call Process Analysis Method and Equipment for Telephone Outdialing Systems

Effective date of registration: 20230509

Granted publication date: 20150520

Pledgee: China Everbright Bank Limited by Share Ltd. Hangzhou branch

Pledgor: Hangzhou Yuanchuan Xinye Technology Co.,Ltd.

Registration number: Y2023980040155

PE01 Entry into force of the registration of the contract for pledge of patent right