CN116741151A

CN116741151A - 一种基于呼叫中心的用户呼叫实时监测系统

Info

Publication number: CN116741151A
Application number: CN202311015933.3A
Authority: CN
Inventors: 邓奇; 祝博; 王衡; 杨彪; 严雨
Original assignee: Chengdu Zhuhun Technology Co ltd
Current assignee: Chengdu Zhuhun Technology Co ltd
Priority date: 2023-08-14
Filing date: 2023-08-14
Publication date: 2023-09-12
Anticipated expiration: 2043-08-14
Also published as: CN116741151B

Abstract

本发明公开了一种基于呼叫中心的用户呼叫实时监测系统，属于语音识别技术领域，本发明通过信号采集子系统采集用户的原始语音信号，采用基于最优滤波系数的滤波函数对原始语音信号进行滤波，从而最大程度的滤除噪声，得到滤波语音信号，再采用语音识别子系统处理滤波语音信号，结合滤波语音信号中当前特征及其相邻时刻的历史特征，实现对语音的识别，提高语音识别精度，得到用户需求，在提前获知用户需求的情况下，呼叫中心则可为其分配合适的话务员，同时，在明确客户需求的情况下，大量骚扰电话可不被接听，减少骚扰电话对呼叫中心通信量造成的挤兑。

Description

一种基于呼叫中心的用户呼叫实时监测系统

技术领域

本发明属于语音识别技术领域，具体涉及一种基于呼叫中心的用户呼叫实时监测系统。

背景技术

呼叫中心通常也称为客户服务中心，呼叫中心用于接听用户的热线电话和咨询电话，用于接收用户的咨询、投诉和建议等，但是每个用户的需求是不同的，每个话务员服务的方向也是不同的，因此，呼叫中心需要将用户需求与话务员服务的方向相匹配。同时，呼叫中心还存在大量骚扰电话，对呼叫中心的业务量造成挤兑，严重干扰正常需求的用户。

现有呼叫中心用户可选择对应需求方向的业务员服务，但是该用户的需求是正常需求还是骚扰，无法进行区分，大量骚扰电话对呼叫中心的通信量造成严重挤兑，正常需求用户无法进行咨询、投诉和建议。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于呼叫中心的用户呼叫实时监测系统解决了现有呼叫中心无法提前获知用户需求，大量骚扰电话对呼叫中心的通信量造成严重挤兑的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种基于呼叫中心的用户呼叫实时监测系统，包括：信号采集子系统、滤波子系统和语音识别子系统；

所述信号采集子系统用于采集呼叫中心的用户原始语音信号；

所述滤波子系统根据最优滤波系数的滤波函数对原始语音信号进行滤波，得到滤波语音信号；

所述语音识别子系统用于处理滤波语音信号，结合当前特征及其相邻时刻的历史特征，得到用户需求。

进一步地，所述滤波子系统包括：噪声混入单元、滤波系数更新单元、第一滤波单元、系数选择单元和第二滤波单元；

所述噪声混入单元用于对仿真语音信号加入噪声，得到原始混合信号；

所述滤波系数更新单元用于对滤波函数中滤波系数采用系数更新函数进行每一次更新；

所述第一滤波单元用于采用每次更新后的滤波函数对原始混合信号进行滤波，得到滤波混合信号；

所述系数选择单元用于建立系数选择目标函数，系数选择目标函数用于根据每次滤波后的滤波混合信号和原始混合信号计算目标值，在目标值最大时，更新后的滤波函数为最优滤波系数的滤波函数；

所述第二滤波单元用于根据最优滤波系数的滤波函数，对原始语音信号进行滤波，得到滤波语音信号。

上述进一步地方案的有益效果为：本发明中设置无噪声的仿真语音信号，在仿真语音信号中加入噪声，从而得到混入噪声的信号，本发明中的滤波函数中滤波系数会进行多次更新，通过每次更新后的滤波函数对原始混合信号进行滤波，通过系数选择目标函数来评判滤波前和滤波后信号之间的差距，从而使得在滤波的同时也能保障语音信号的特征，在系数选择目标函数最大时，对应的滤波函数为最优滤波系数的滤波函数，采用最优滤波系数的滤波函数对原始语音信号进行滤波，最大程度保留语音特征。

进一步地，所述滤波函数为：

，

其中，为第/>个滤波数据，/>为待滤波信号中第/>个数据，/>为待滤波信号中第/>个数据，/>为待滤波信号中临近第/>个数据/>的数据数量，/>为临近数据的编号，/>为第/>个滤波数据，/>为第/>次更新的滤波系数，/>为滤波权重，| |为绝对值运算。

上述进一步地方案的有益效果为：本发明中先采用待滤波信号中临近个数据的均值和当前待滤波数据/>作为滤波的基础，同时/>个数据的均值也对当前待滤波数据/>存在影响，可增大或削弱当前待滤波数据/>，实现第一次滤波；再采用第/>个滤波数据/>实现对当前待滤波数据/>的第二次滤波，且滤波权重根据/>与/>之间差值变化而变化，在距离越大时，当前待滤波数据/>为噪点的可能性较大，因此，第/>个滤波数据/>占比较大，从而实现对当前待滤波数据/>的大幅度滤波；滤波系数实现对当前待滤波数据/>的第三次滤波，滤波系数决定整个滤波后信号的幅度，因此，滤波系数对于整体的滤波效果至关重要，滤波系数过大，噪声特征较明显，滤波系数过小，滤波后的语音信号被严重削减，特征丢失。

进一步地，所述系数更新函数的公式为：

，

其中，为第/>次更新的滤波系数，/>为第/>次更新的滤波系数，/>为第次更新后系数选择目标函数的目标值，/>为自然常数。

上述进一步地方案的有益效果为：本发明中滤波系数跟随系数选择目标函数的目标值的大小而变化，目标值越大时，说明语音特征保留程度越高，因此，滤波系数下降速度更缓慢，从而实现在该数值区域遍历更细致，在目标值越小时，语音特征保留程度越低，滤波系数下降速度更快，实现快速遍历。

进一步地，所述系数选择目标函数的通式为：

，

其中，为系数选择目标函数的目标值，/>为滤波混合信号的第一语音特征，为滤波混合信号的第二语音特征，/>为仿真语音信号的第一语音特征，/>为仿真语音信号的第二语音特征。

进一步地，所述滤波混合信号和仿真语音信号的第一语音特征的表达式均为：

，

其中，为第一语音特征，/>为信号中的第/>个数据，/>为信号长度，/>为信号中数据的最大值，/>为信号中数据的最小值。

进一步地，所述滤波混合信号和仿真语音信号的第二语音特征的表达式均为：

，

其中，为第二语音特征，/>为信号中数据的最大值，/>为信号中的第/>个数据，/>为信号长度。

上述进一步地方案的有益效果为：本发明中第一语音特征体现数据的波动分布特征，第二语音特征体现数据的整体分布情况，将滤波混合信号和仿真语音信号中两种语音特征进行比较，从而根据目标值的大小，确定出两者语音信号特征之间的相似程度，从而达到保留语音特征，滤除噪声的目的。

进一步地，所述语音识别子系统包括：第一特征提取单元、第二特征提取单元、第三特征提取单元、历史特征缓存单元、Concat单元和CTC单元；

所述第一特征提取单元的输入端作为语音识别子系统的输入端，其输出端分别与第二特征提取单元的输入端和历史特征缓存单元的输入端连接；所述Concat单元的第一输入端与第二特征提取单元的输出端连接，其第二输入端与历史特征缓存单元的输出端连接，其输出端与第三特征提取单元的输入端连接；所述CTC单元的输入端与第三特征提取单元的输出端连接，其输出端作为语音识别子系统的输出端。

上述进一步地方案的有益效果为：本发明中第一特征提取单元在提取语音特征后，输入到第二特征提取单元中进行进一步的特征提取，还输入到历史特征缓存单元进行保存，Concat单元将当前的第二特征提取单元输出特征与上一时刻的第一特征提取单元输出特征进行拼接，实现前后语义特征关联，提高文字识别精度。

进一步地，所述第一特征提取单元、第二特征提取单元和第三特征提取单元结构相同，均包括：第一卷积层、第二卷积层、第三卷积层、第四卷积层、乘法器M1和加法器A1；

所述第一卷积层的输入端分别与第二卷积层的输入端和加法器A1的第一输入端连接，并作为第一特征提取单元、第二特征提取单元或第三特征提取单元的输入端；所述乘法器M1的第一输入端与第三卷积层的输出端连接，其第二输入端与第一卷积层的输出端连接，其输出端与第四卷积层的输入端连接；所述第二卷积层的输出端与第三卷积层的输入端连接；所述加法器A1的第二输入端与第四卷积层的输出端连接，其输出端作为第一特征提取单元、第二特征提取单元或第三特征提取单元的输出端。

上述进一步地方案的有益效果为：本发明中将第一卷积层的输出和第三卷积层的输出，采用乘法器M1进行融合，实现深浅特征汇集，再通过第四卷积层再次提取特征，在加法器A1处连接第四卷积层输出和特征提取单元的输入，防止特征丢失，且解决梯度消失的问题。

进一步地，所述历史特征缓存单元用于缓存上一时刻第一特征提取单元输出的特征，所述Concat单元用于将上一时刻第一特征提取单元输出的特征和当前时刻第二特征提取单元输出的特征进行拼接。

本发明的有益效果为：本发明通过信号采集子系统采集用户的原始语音信号，采用基于最优滤波系数的滤波函数对原始语音信号进行滤波，从而最大程度的滤除噪声，得到滤波语音信号，再采用语音识别子系统处理滤波语音信号，结合滤波语音信号中当前特征及其相邻时刻的历史特征，实现对语音的识别，提高语音识别精度，得到用户需求，在提前获知用户需求的情况下，呼叫中心则可为其分配合适的话务员，同时，在明确客户需求的情况下，大量骚扰电话可不被接听，减少骚扰电话对呼叫中心通信量造成的挤兑。

附图说明

图1为一种基于呼叫中心的用户呼叫实时监测系统的系统框图；

图2为语音识别子系统的结构示意图；

图3为特征提取单元的结构示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，一种基于呼叫中心的用户呼叫实时监测系统，包括：信号采集子系统、滤波子系统和语音识别子系统；

所述滤波子系统包括：噪声混入单元、滤波系数更新单元、第一滤波单元、系数选择单元和第二滤波单元；

本发明中设置无噪声的仿真语音信号，在仿真语音信号中加入噪声，从而得到混入噪声的信号，本发明中的滤波函数中滤波系数会进行多次更新，通过每次更新后的滤波函数对原始混合信号进行滤波，通过系数选择目标函数来评判滤波前和滤波后信号之间的差距，从而使得在滤波的同时也能保障语音信号的特征，在系数选择目标函数最大时，对应的滤波函数为最优滤波系数的滤波函数，采用最优滤波系数的滤波函数对原始语音信号进行滤波，最大程度保留语音特征。

在本实施例中，可先将滤波系数的初值设为1，然后多次更新，直到滤波系数逼近0，在每次更新后，都采用滤波函数对原始混合信号进行滤波，得到滤波混合信号，再计算目标值，统计滤波系数1~0之间的所有更新次数对应的目标值，从而选出最大目标值，其对应的滤波系数为最优滤波系数。

在本发明中，滤波函数的表达式为通式，用户原始语音信号和原始混合信号的滤波函数均为下式。

所述滤波函数的表达式为：

，

本发明中先采用待滤波信号中临近个数据的均值和当前待滤波数据/>作为滤波的基础，同时/>个数据的均值也对当前待滤波数据/>存在影响，可增大或削弱当前待滤波数据/>，实现第一次滤波；再采用第/>个滤波数据/>实现对当前待滤波数据/>的第二次滤波，且滤波权重根据/>与/>之间差值变化而变化，在距离越大时，当前待滤波数据/>为噪点的可能性较大，因此，第/>个滤波数据/>占比较大，从而实现对当前待滤波数据/>的大幅度滤波；滤波系数实现对当前待滤波数据/>的第三次滤波，滤波系数决定整个滤波后信号的幅度，因此，滤波系数对于整体的滤波效果至关重要，滤波系数过大，噪声特征较明显，滤波系数过小，滤波后的语音信号被严重削减，特征丢失。

所述系数更新函数的公式为：

，

本发明中滤波系数跟随系数选择目标函数的目标值的大小而变化，目标值越大时，说明语音特征保留程度越高，因此，滤波系数下降速度更缓慢，从而实现在该数值区域遍历更细致，在目标值越小时，语音特征保留程度越低，滤波系数下降速度更快，实现快速遍历。

所述系数选择目标函数的通式为：

，

所述滤波混合信号和仿真语音信号的第一语音特征的表达式均为：

，

所述滤波混合信号和仿真语音信号的第二语音特征的表达式均为：

，

本发明中第一语音特征体现数据的波动分布特征，第二语音特征体现数据的整体分布情况，将滤波混合信号和仿真语音信号中两种语音特征进行比较，从而根据目标值的大小，确定出两者语音信号特征之间的相似程度，从而达到保留语音特征，滤除噪声的目的。

如图2所示，所述语音识别子系统包括：第一特征提取单元、第二特征提取单元、第三特征提取单元、历史特征缓存单元、Concat单元和CTC单元；

本发明中第一特征提取单元在提取语音特征后，输入到第二特征提取单元中进行进一步的特征提取，还输入到历史特征缓存单元进行保存，Concat单元将当前的第二特征提取单元输出特征与上一时刻的第一特征提取单元输出特征进行拼接，实现前后语义特征关联，提高文字识别精度。

如图3所示，所述第一特征提取单元、第二特征提取单元和第三特征提取单元结构相同，均包括：第一卷积层、第二卷积层、第三卷积层、第四卷积层、乘法器M1和加法器A1；

本发明中将第一卷积层的输出和第三卷积层的输出，采用乘法器M1进行融合，实现深浅特征汇集，再通过第四卷积层再次提取特征，在加法器A1处连接第四卷积层输出和特征提取单元的输入，防止特征丢失，且解决梯度消失的问题。

所述历史特征缓存单元用于缓存上一时刻第一特征提取单元输出的特征，所述Concat单元用于将上一时刻第一特征提取单元输出的特征和当前时刻第二特征提取单元输出的特征进行拼接。

本发明通过信号采集子系统采集用户的原始语音信号，采用基于最优滤波系数的滤波函数对原始语音信号进行滤波，从而最大程度的滤除噪声，得到滤波语音信号，再采用语音识别子系统处理滤波语音信号，结合滤波语音信号中当前特征及其相邻时刻的历史特征，实现对语音的识别，提高语音识别精度，得到用户需求，在提前获知用户需求的情况下，呼叫中心则可为其分配合适的话务员，同时，在明确客户需求的情况下，大量骚扰电话可不被接听，减少骚扰电话对呼叫中心通信量造成的挤兑。

Claims

1.一种基于呼叫中心的用户呼叫实时监测系统，其特征在于，包括：信号采集子系统、滤波子系统和语音识别子系统；

2.根据权利要求1所述的基于呼叫中心的用户呼叫实时监测系统，其特征在于，所述滤波子系统包括：噪声混入单元、滤波系数更新单元、第一滤波单元、系数选择单元和第二滤波单元；

3.根据权利要求2所述的基于呼叫中心的用户呼叫实时监测系统，其特征在于，所述滤波函数为：

，

其中，为第/>个滤波数据，/>为待滤波信号中第/>个数据，/>为待滤波信号中第个数据，/>为待滤波信号中临近第/>个数据/>的数据数量，/>为临近数据的编号，为第/>个滤波数据，/>为第/>次更新的滤波系数，/>为滤波权重，| |为绝对值运算。

4.根据权利要求3所述的基于呼叫中心的用户呼叫实时监测系统，其特征在于，所述系数更新函数的公式为：

，

5.根据权利要求2所述的基于呼叫中心的用户呼叫实时监测系统，其特征在于，所述系数选择目标函数的通式为：

，

其中，为系数选择目标函数的目标值，/>为滤波混合信号的第一语音特征，/>为滤波混合信号的第二语音特征，/>为仿真语音信号的第一语音特征，/>为仿真语音信号的第二语音特征。

6.根据权利要求5所述的基于呼叫中心的用户呼叫实时监测系统，其特征在于，所述滤波混合信号和仿真语音信号的第一语音特征的表达式均为：

，

7.根据权利要求5所述的基于呼叫中心的用户呼叫实时监测系统，其特征在于，所述滤波混合信号和仿真语音信号的第二语音特征的表达式均为：

，

其中，为第二语音特征，/>为信号中数据的最大值，/>为信号中的第/>个数据，为信号长度。

8.根据权利要求1所述的基于呼叫中心的用户呼叫实时监测系统，其特征在于，所述语音识别子系统包括：第一特征提取单元、第二特征提取单元、第三特征提取单元、历史特征缓存单元、Concat单元和CTC单元；

9.根据权利要求8所述的基于呼叫中心的用户呼叫实时监测系统，其特征在于，所述第一特征提取单元、第二特征提取单元和第三特征提取单元结构相同，均包括：第一卷积层、第二卷积层、第三卷积层、第四卷积层、乘法器M1和加法器A1；

10.根据权利要求8所述的基于呼叫中心的用户呼叫实时监测系统，其特征在于，所述历史特征缓存单元用于缓存上一时刻第一特征提取单元输出的特征，所述Concat单元用于将上一时刻第一特征提取单元输出的特征和当前时刻第二特征提取单元输出的特征进行拼接。