CN111312271B

CN111312271B - 一种提高收敛速度和处理性能的模型压缩方法和系统

Info

Publication number: CN111312271B
Application number: CN202010129841.8A
Authority: CN
Inventors: 李庆龙
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2020-02-28
Filing date: 2020-02-28
Publication date: 2023-03-21
Anticipated expiration: 2040-02-28
Also published as: CN111312271A

Abstract

本发明提出了一种提高收敛速度和处理性能的模型压缩方法和系统，属于语音降噪处理技术领域。所述模型压缩方法的Teacher模型训练阶段、模型参数迁移及Student模型训练阶段和测试阶段；所述模型压缩系统包括Teacher模型训练模块、Student模型训练模块和模型测试模块。

Description

一种提高收敛速度和处理性能的模型压缩方法和系统

技术领域

本发明提出了一种提高收敛速度和处理性能的模型压缩方法和系统，属于语音降噪处理技术领域。

背景技术

语音降噪是将混合语音中的噪声和人声分离出来，在尽可能完整保留人声部分的同时尽可能多的去除噪声部分。这可以有效提高语音通信或语音交互的质量，使人或机器在嘈杂的环境下也能听到清晰、干净的语音。随着基于深度学习的降噪方法在移动设备上的全面应用，降低模型的参数量的任务也越来越重要。

传统的降噪方法在非平稳噪声环境下很难取得很好的效果，尤其对于瞬态的噪声更是无能为力，当前基于深度学习技术的降噪方法可以有效的去除快变的噪声，取得更好的语音降噪效果，而目前主流的基于深度学习技术的降噪方法表现良好，但模型参数量比较大，且会有冗余，对计算资源的消耗比较严重。在移动设备上运行时，对功耗的要求就比较苛刻，所以在保证降噪性能几乎不变的前提下，模型压缩变的尤为重要。随着模型参数量的减小，如果重新训练模型，由于参数初始化的问题，模型的性能或许会有较大的性能损失，且训练时的收敛速度比较慢，模型压缩、调优的时间代价比较大。

发明内容

本发明提供了一种提高收敛速度和处理性能的模型压缩方法和系统，用以解决现有的主模型训练过程中，模型压缩直接训练后的训练效果不稳定且模型训练收敛速度慢的问题，所采取的技术方案如下：

一种提高收敛速度和处理性能的模型压缩方法，所述模型压缩方法的过程包括：

步骤1、利用带噪语音mix作为语音训练数据，结合带噪语音mix的实际掩膜mask_r对 Teacher模型进行训练，获得训练收敛后的Teacher模型；

步骤2、对Student模型中的模型参数进行参数量压缩，并利用训练收敛后的Teacher模型参数对压缩后的Student模型进行初始化，并结合带噪语音mix的实际掩膜mask_r对Student 模型进行指导训练，获得训练收敛后的Student模型；

步骤3、利用带噪的测试语音对训练收敛后的Student模型进行测试，并获得训练收敛后 Student模型的测试数据。

进一步地，步骤1所述获得训练收敛后的Teacher模型的过程包括：

步骤101、选取带噪语音mix作为Teacher模型训练阶段的语音训练数据，对所述带噪语音mix进行特征提取，获取所述带噪语音mix的语音特征；

步骤102、将所述带噪语音mix和带噪语音对应的纯净语音进行计算，获得带噪语音mix 的实际掩膜mask_r；

步骤103、将步骤101获得的带噪语音mix的语音特征和步骤102获得的实际掩膜mask_r 分别输入到Teacher模型中，Teacher模型通过所述带噪语音mix的特征和实际掩膜mask_r 对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第一次估计掩膜mask；

步骤104、将步骤103获得的第一次估计掩膜mask和步骤102获得的实际掩膜mask_r 进行比较，计算获取掩膜第一误差值e₁；

步骤105、将步骤104获得的掩膜误差值e₁输入到Teacher模型中，所述Teacher模型根据掩膜第一误差值e₁对所述带噪语音mix的特征和实际掩膜mask_r的数据处理过程进行参数调整，使第一次估计掩膜mask无限趋近于实际掩膜mask_r；

步骤106、通过掩膜第一误差值e₁和实际掩膜mask_r对Teacher模型进行不断训练使其收敛，待Teacher模型训练收敛后，保存收敛后的Teacher模型以备后用。

进一步地，步骤2所述获得训练收敛后的Student模型的过程包括：

步骤201、建立一个Student模型，所述Student模型的架构与Teacher模型相同，但是 Student模型中每个隐含层内的节点数量比Teacher模型中每个隐含层的节点数量少；然后将训练收敛后的Teacher模型中的部分参数迁移至Student模型中，利用所述Teacher模型参数对压缩后的Student模型进行初始化；

步骤202、将所述带噪语音mix进行特征提取后获得的语音特征输入至完成初始化的 Student模型中；Student模型通过所述带噪语音mix的语音特征和训练收敛后的Teacher模型参数对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第二次估计掩膜mask_s；

步骤203、将步骤202获得的第二次估计掩膜mask_s与所述带噪语音mix的实际掩膜 mask_r进行比较，计算获得掩膜第二误差值e₂；

步骤204、将步骤203获得的掩膜第二误差值e₂输入至Student模型中，所述Student模型根据掩膜第二误差值e₂对所述带噪语音mix的语音特征和训练收敛后的Teacher模型参数的数据处理过程进行参数调整，使第二次估计掩膜mask_s无限趋近于实际掩膜mask_r；

步骤205、通过掩膜第二误差值e₂和实际掩膜mask_r对Student模型进行不断训练使其收敛，待Student模型训练收敛后，保存训练收敛后的Student模型。

进一步地，步骤3所述对训练收敛后的Student模型进行测试的过程包括：

步骤301、对带噪的测试语音进行特征提取，获取所述测试语音的语音特征；将所述测试语音的语音特征输入至训练收敛后的Student模型；

步骤302、所述训练收敛后的Student模型根据测试语音的语音特征对测试语音的掩膜进行预测，获得与所述测试语音的语音特征对应的测试语音掩膜mask_c；

步骤303、对所述测试语音进行短时傅里叶变换(STFT)，获得所述测试语音的频谱；

步骤304、将步骤302获得的测试语音掩膜mask_c与步骤303获得的测试语音的频谱进行乘积运算，并将乘积结果进行逆短时傅立叶变换(ISTFT)获得测试语音降噪处理后的增强语音，完成训练收敛后的Student模型的测试；所述增强语音体现的语音质量数据即为所述练收敛后Student模型的测试数据。

一种提高收敛速度和处理性能的模型压缩方法对应的模型压缩系统，所述模型压缩系统包括：

Teacher模型训练模块，用于利用带噪语音mix作为语音训练数据，结合带噪语音mix的实际掩膜mask_r对Teacher模型进行训练，获得训练收敛后的Teacher模型；

Student模型训练模块，用于利用训练收敛后的Teacher模型参数对压缩后的Student模型进行初始化，并结合带噪语音mix的实际掩膜mask_r对Student模型进行指导训练，获得训练收敛后的Student模型；

模型测试模块，用于利用带噪的测试语音对训练收敛后的Student模型进行测试，并获得训练收敛后Student模型的测试数据。

进一步地，所述Teacher模型训练模块包括：

特征提取模块，用于对所述带噪语音mix进行特征提取获取所述带噪语音mix的语音特征；

实际掩膜获取模块，用于将所述带噪语音mix和带噪语音对应的纯净语音进行计算，获得带噪语音mix的实际掩膜mask_r；

数据输入模块一，用于将所述带噪语音mix的语音特征和所述实际掩膜mask_r分别输入到Teacher模型中；

掩膜第一误差值获取模块，用于在接收到Teacher模型发送的第一次估计掩膜mask后，将第一次估计掩膜mask和实际掩膜mask_r进行比较，计算获取掩膜第一误差值e₁，并将所述掩膜第一误差值e₁发送至Teacher模型；

Teacher模型，用于通过所述带噪语音mix的特征和实际掩膜mask_r对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第一次估计掩膜mask并发送至掩膜第一误差值获取模块；以及，用于在接收到掩膜第一误差值获取模块发送的掩膜第一误差值e₁后，根据掩膜第一误差值e₁对所述带噪语音mix的特征和实际掩膜mask_r的数据处理过程进行参数调整，使第一次估计掩膜mask无限趋近于实际掩膜mask_r，直至获得训练收敛后的Teacher 模型；

Teacher模型保存模块，用于保存训练收敛后的Teacher模型。

进一步地，所述Student模型训练模块包括：

Student模型压缩模块，用于对Student模型进行模型参数量的压缩，获得压缩后的Student 模型；

参数初始化模块，用于将所述Teacher模型的模型参数迁移至压缩后的Student模型中，并利用Teacher模型的模型参数对压缩后的Student模型进行初始化，获得完成初始化的 Student模型；

数据输入模块二、用于将所述带噪语音mix进行特征提取后获得的语音特征输入至完成初始化的Student模型中；

掩膜第二误差值获取模块，用于将所述第二次估计掩膜mask_s与所述带噪语音mix的实际掩膜mask_r进行比较，计算获得掩膜第二误差值e₂，并将所述掩膜第二误差值e₂发送至 Student模型中；

Student模型，用于通过所述带噪语音mix的语音特征和训练收敛后的Teacher模型参数对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第二次估计掩膜mask_s，并将所述第二次估计掩膜mask_s发送至掩膜第二误差值获取模块中；以及，用于在接收到掩膜第二误差值获取模块发送的掩膜第二误差值e₂后，根据掩膜第二误差值e₂对所述带噪语音 mix的语音特征和训练收敛后的Teacher模型参数的数据处理过程进行参数调整，使第二次估计掩膜mask_s无限趋近于实际掩膜mask_r，直至获得训练收敛后的Student模型；

Student模型保存模块，用于保存训练收敛后的Student模型。

进一步地，所述模型测试模块包括：

测试特征提取模块，用于对带噪的测试语音进行特征提取，获取所述测试语音的语音特征，并将所述测试语音的语音特征输入至训练收敛后的Student模型进行掩膜预测；

频谱获取模块，用于对所述测试语音进行短时傅里叶变换获得所述测试语音的频谱；

运算模块，用于将训练收敛后的Student模型预测的测试语音掩膜mask_c与测试语音的频谱进行乘积运算，并将乘积结果进行逆短时傅立叶变换获得测试语音降噪处理后的增强语音。

本发明有益效果：

本发明提出的提高收敛速度和处理性能的模型压缩方法和系统，通过训练Teacher模型，提高Teacher模型的降噪性能，在对Student模型进行参数量压缩的时候，将其已经训练好的部分参数用来初始化压缩后的模型，就相当于直接把Teacher模型学习到的部分知识直接迁移到Student模型，使Student模型有了较好的先验知识信息，再在原始数据上对压缩后的模型进行自适应迭代，极大程度上提高了Student模型的收敛速度，并且使Student模型较好的继承Teacher模型的性能。与随机初始化后，重新训练的模型相比，本发明提出的提高收敛速度和处理性能的模型压缩方法对应的模型压缩方法和系统训练获得的具有迁移知识的Student 模型的训练效果稳定性高，收敛速度快，在进行了模型参数量压缩后，模型的性能依然存在较大的提高。

附图说明

图1为发明所述模型压缩方法流程图；

图2为发明所述模型压缩系统的结构示意图；

图3为发明所述模型压缩系统的原理示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

本发明实施例提供了一种提高收敛速度和处理性能的模型压缩方法和系统，用以解决现有的主模型训练过程中，模型压缩直接训练后的训练效果不稳定且训练收敛速度慢的问题。

本发明实施例提供了一种提高收敛速度和处理性能的模型压缩方法，如图1所示，所述模型压缩方法的过程包括：

上述技术方案的工作原理为：利用带噪语音mix作为语音训练数据，结合带噪语音mix 的实际掩膜mask_r训练Teacher模型用以提高Teacher模型的降噪性能，在对Student模型进行参数量压缩的时候，将Teacher模型已经训练好的部分参数用来初始化压缩后的模型，就相当于直接把Teacher模型学习到的部分知识直接迁移到Student模型，使Student模型有了较好的先验知识信息，再在原始数据上对压缩后的模型进行基于掩膜的自适应迭代，最终获得训练好的Student模型。

上述技术方案的技术效果为：本实施例提出的提高收敛速度和处理性能的模型压缩方法训练获得的具有迁移知识的Student模型的训练效果稳定性高，收敛速度快，在进行了模型参数量压缩后，模型的性能依然存在较大的提高。

本发明的一个实施例，步骤1所述获得训练收敛后的Teacher模型的过程包括：

上述技术方案的工作原理为：将混有噪音的语音作为Teacher模型训练阶段的语音训练数据，特征提取带噪语音的feature，并通过带噪语音和其对应的纯净语音进行计算获取带噪语音的实际掩膜mask_r，Teacher模型通过带噪语音的feature和实际掩膜mask_r对带噪语音的掩膜进行估计并获得掩膜估计值，Teacher模型根据掩膜估计值与带噪语音的实际掩膜之间的误差进行自适应迭代直至迭代收敛，即Teacher模型训练收敛，则表示Teacher模型训练完成。最后保存训练好的Teacher模型为后续Student模型训练做准备。

上述技术方案的技术效果为：通过上述Teacher模型的训练方法能够有效提高训练过程中的模型收敛速度，同时，通过上述训练方法训练出的Teacher模型具有较高的降噪性能和稳定性。

本发明的一个实施例，步骤2所述获得训练收敛后的Student模型的过程包括：

步骤201、建立一个Student模型，所述Student模型的架构与Teacher模型相同，但是 Student模型中每个隐含层内的节点数量比Teacher模型中每个隐含层的节点数量少；对 Student模型进行模型压缩，然后将训练收敛后的Teacher模型中的部分参数迁移至Student 模型中，利用所述Teacher模型参数对压缩后的Student模型进行初始化；

上述技术方案的工作原理为：将训练收敛的Teacher模型的全部或部分模型参数迁移至 Student模型中，在Student模型进行参数压缩的过程中，使用迁移至Student模型中的Teacher 模型参数对压缩后的Student模型进行初始化，使Teacher模型学习到的全部或部分知识直接迁移到Student模型中。然后Student模型通过带噪语音的语音特征与Teacher模型参数预测估计带噪语音的掩膜，第二次估计掩膜mask_s，并根据第二次估计掩膜mask_s与所述带噪语音mix的实际掩膜mask_r之间的误差值进行进行自适应迭代直至迭代收敛，即Teacher模型训练收敛，则表示Student模型训练完成，然后对Student模型进行保存。

上述技术方案的技术效果为：在Student模型进行参数压缩的过程中将Teacher模型的全部或部分模型参数迁移至Student模型中，并对Student模型进行初始化，使Student模型具有了较好的先验知识信息，有效提高了Student模型的掩膜预测估计的性能和效率，提高了 Student模型掩膜估计的准确性，同时，通过上述训练方法结合Teacher模型的全部或部分模型参数对Student模型进行训练，能够极大程度上提高Student模型的收敛速度，提高Student 模型模型训练的效率。

本发明的一个实施例，步骤3所述对训练收敛后的Student模型进行测试的过程包括：

上述技术方案的工作原理为：另选择一个带噪语音作为测试语音，将其输入至训练好的 Student模型中，通过Student模型计算获得测试语音的掩膜mask_c；然后通过测试语音掩膜 mask_c和测试语音的频谱获取测试语音降噪处理后的增强语音。最后通过增强语音质量与其他模型压缩方法获得的模型降噪后的语音进行对比，确定本发明所述模型压缩方法获得的 Student模型的降噪性能更好。

上述技术方案的技术效果为：上述模型测试方法有效提高了Student模型测试速度和测试准确度。

本发明实施例提供了一种提高收敛速度和处理性能的模型压缩方法对应的模型压缩系统，如图2所示，所述模型压缩系统包括：

上述技术方案的工作原理为：如图3所示，所述模型压缩系统通过Teacher模型训练模块利用带噪语音mix作为语音训练数据，结合带噪语音mix的实际掩膜mask_r对Teacher模型进行训练，获得训练收敛后的Teacher模型；然后，通过Student模型训练模块对Student模型中的模型参数进行参数量压缩，并利用训练收敛后的Teacher模型参数对压缩后的Student 模型进行初始化，并结合带噪语音mix的实际掩膜mask_r对Student模型进行指导训练，获得训练收敛后的Student模型；最后，模型测试模块利用带噪的测试语音对训练收敛后的 Student模型进行测试，并获得训练收敛后Student模型的测试数据。

上述技术方案的技术效果为：本实施例提出的提高收敛速度和处理性能的模型压缩系统训练获得的具有迁移知识的Student模型的训练效果稳定性高，收敛速度快，在进行了模型参数量压缩后，模型的性能依然存在较大的提高。

本发明的一个实施例，所述Teacher模型训练模块包括：

Teacher模型保存模块，用于保存训练收敛后的Teacher模型。

上述技术方案的工作原理为：如图3所示，利用特征提取模块对所述带噪语音mix进行特征提取，获取所述带噪语音mix的语音特征；通过实际掩膜获取模块将所述带噪语音mix 和带噪语音对应的纯净语音进行计算，获得带噪语音mix的实际掩膜mask_r；然后，利用数据输入模块一将所述带噪语音mix的语音特征和所述实际掩膜mask_r分别输入到Teacher模型中；Teacher模型通过所述带噪语音mix的特征和实际掩膜mask_r对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第一次估计掩膜mask，并发送至掩膜第一误差值获取模块中，掩膜第一误差值获取模块在接收到第一次估计掩膜mask后，将第一次估计掩膜 mask和实际掩膜mask_r进行比较，计算获取掩膜第一误差值e₁，并将所述掩膜第一误差值 e₁发送至Teacher模型；Teacher模型在接收到掩膜第一误差值获取模块发送的掩膜第一误差值e₁后，根据掩膜第一误差值e₁对所述带噪语音mix的特征和实际掩膜mask_r的数据处理过程进行参数调整，使第一次估计掩膜mask无限趋近于实际掩膜mask_r，直至获得训练收敛后的Teacher模型；最后通过Teacher模型保存模块保存训练收敛后的Teacher模型。

本发明的一个实施例，所述Student模型训练模块包括：

Student模型保存模块，用于保存训练收敛后的Student模型。

上述技术方案的工作原理为：如图3所示，首先通过Student模型压缩模块对Student模型进行模型压缩，然后通过参数初始化模块将训练收敛后的Teacher模型参数迁移至Student 模型中，利用所述Teacher模型参数对压缩后的Student模型进行初始化；通过数据输入模块二将所述带噪语音mix进行特征提取后获得的语音特征输入至完成初始化的Student模型中；然后Student模型通过所述带噪语音mix的语音特征和训练收敛后的Teacher模型参数对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第二次估计掩膜mask_s，并将所述第二次估计掩膜mask_s发送至掩膜第二误差值获取模块中；掩膜第二误差值获取模块将所述第二次估计掩膜mask_s与所述带噪语音mix的实际掩膜mask_r进行比较，计算获得掩膜第二误差值e₂，并将所述掩膜第二误差值e₂发送至Student模型中；Student模型接收到掩膜第二误差值获取模块发送的掩膜第二误差值e₂后，根据掩膜第二误差值e₂对所述带噪语音mix 的语音特征和训练收敛后的Teacher模型参数的数据处理过程进行参数调整，使第二次估计掩膜mask_s无限趋近于实际掩膜mask_r，直至获得训练收敛后的Student模型；最后，通过 Student模型保存模块保存训练收敛后的Student模型。

本发明的一个实施例，所述模型测试模块包括：

上述技术方案的工作原理为：如图3所示，选择另一个带噪语音作为测试语音，通过测试特征提取模块对带噪的测试语音进行特征提取，获取所述测试语音的语音特征；将所述测试语音的语音特征输入至训练收敛后的Student模型；所述训练收敛后的Student模型根据测试语音的语音特征对测试语音的掩膜进行预测，获得与所述测试语音的语音特征对应的测试语音掩膜mask_c；通过频谱获取模块对所述测试语音进行短时傅里叶变换(STFT)，获得所述测试语音的频谱；然后通过运算模块将测试语音掩膜mask_c与测试语音的频谱进行乘积运算，并将乘积结果进行逆短时傅立叶变换(ISTFT)获得测试语音降噪处理后的增强语音，完成训练收敛后的Student模型的测试；所述增强语音体现的语音质量数据即为所述练收敛后Student模型的测试数据。最后通过增强语音质量与其他模型压缩方法获得的模型降噪后的语音进行对比，确定本发明所述模型压缩方法获得的Student模型的降噪性能更好。

上述技术方案的技术效果为：上述模型测试模块能够有效提高Student模型测试速度和测试准确度。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种提高收敛速度和处理性能的模型压缩方法，其特征在于，所述模型压缩方法的过程包括：

步骤1、利用带噪语音mix作为语音训练数据，结合带噪语音mix的实际掩膜mask_r对Teacher模型进行训练，获得训练收敛后的Teacher模型；

步骤2、对Student模型中的模型参数进行参数量压缩，并利用训练收敛后的Teacher模型参数对压缩后的Student模型进行初始化，并结合带噪语音mix的实际掩膜mask_r对Student模型进行指导训练，获得训练收敛后的Student模型；

步骤3、利用带噪的测试语音对训练收敛后的Student模型进行测试，并获得训练收敛后Student模型的测试数据。

2.根据权利要求1所述模型压缩方法，其特征在于，步骤1所述获得训练收敛后的Teacher模型的过程包括：

步骤102、将所述带噪语音mix和带噪语音对应的纯净语音进行计算，获得带噪语音mix的实际掩膜mask_r；

步骤103、将步骤101获得的带噪语音mix的语音特征和步骤102获得的实际掩膜mask_r分别输入到Teacher模型中，Teacher模型通过所述带噪语音mix的特征和实际掩膜mask_r对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第一次估计掩膜mask；

步骤104、将步骤103获得的第一次估计掩膜mask和步骤102获得的实际掩膜mask_r进行比较，计算获取掩膜第一误差值e ₁；

步骤105、将步骤104获得的掩膜误差值e ₁输入到Teacher模型中，所述Teacher模型根据掩膜第一误差值e ₁对所述带噪语音mix的特征和实际掩膜mask_r的数据处理过程进行参数调整，使第一次估计掩膜mask无限趋近于实际掩膜mask_r；

步骤106、通过掩膜第一误差值e ₁和实际掩膜mask_r对Teacher模型进行不断训练使其收敛，待Teacher模型训练收敛后，保存收敛后的Teacher模型以备后用。

3.根据权利要求1所述模型压缩方法，其特征在于，步骤2所述获得训练收敛后的Student模型的过程包括：

步骤201、建立一个Student模型，所述Student模型的架构与Teacher模型相同，但是Student模型中每个隐含层内的节点数量比Teacher模型中每个隐含层的节点数量少；然后将训练收敛后的Teacher模型中的部分参数迁移至Student模型中，利用所述Teacher模型参数对压缩后的Student模型进行初始化；

步骤202、将所述带噪语音mix进行特征提取后获得的语音特征输入至完成初始化的Student模型中；Student模型通过所述带噪语音mix的语音特征和训练收敛后的Teacher模型参数对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第二次估计掩膜mask_s；

步骤203、将步骤202获得的第二次估计掩膜mask_s与所述带噪语音mix的实际掩膜mask_r进行比较，计算获得掩膜第二误差值e ₂；

步骤204、将步骤203获得的掩膜第二误差值e ₂输入至Student模型中，所述Student模型根据掩膜第二误差值e ₂对所述带噪语音mix的语音特征和训练收敛后的Teacher模型参数的数据处理过程进行参数调整，使第二次估计掩膜mask_s无限趋近于实际掩膜mask_r；

步骤205、通过掩膜第二误差值e ₂和实际掩膜mask_r对Student模型进行不断训练使其收敛，待Student模型训练收敛后，保存训练收敛后的Student模型。

4.根据权利要求1所述模型压缩方法，其特征在于，步骤3所述对训练收敛后的Student模型进行测试的过程包括：

步骤303、对所述测试语音进行短时傅里叶变换，获得所述测试语音的频谱；

步骤304、将步骤302获得的测试语音掩膜mask_c与步骤303获得的测试语音的频谱进行乘积运算，并将乘积结果进行逆短时傅立叶变换获得测试语音降噪处理后的增强语音，完成训练收敛后的Student模型的测试；所述增强语音体现的语音质量数据即为所述练收敛后Student模型的测试数据。

5.一种如权利要求1-4任一所述方法对应的模型压缩系统，其特征在于，所述模型压缩系统包括：

6.根据权利要求5所述模型压缩系统，其特征在于，所述Teacher模型训练模块包括：

掩膜第一误差值获取模块，用于在接收到Teacher模型发送的第一次估计掩膜mask后，将第一次估计掩膜mask和实际掩膜mask_r进行比较，计算获取掩膜第一误差值e ₁，并将所述掩膜第一误差值e ₁发送至Teacher模型；

Teacher模型，用于通过所述带噪语音mix的特征和实际掩膜mask_r对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第一次估计掩膜mask并发送至掩膜第一误差值获取模块；以及，用于在接收到掩膜第一误差值获取模块发送的掩膜第一误差值e ₁后，根据掩膜第一误差值e ₁对所述带噪语音mix的特征和实际掩膜mask_r的数据处理过程进行参数调整，使第一次估计掩膜mask无限趋近于实际掩膜mask_r，直至获得训练收敛后的Teacher模型；

Teacher模型保存模块，用于保存训练收敛后的Teacher模型。

7.根据权利要求5所述模型压缩系统，其特征在于，所述Student模型训练模块包括：

Student模型压缩模块，用于对Student模型进行模型参数量的压缩，获得压缩后的Student模型；

参数初始化模块，用于将所述Teacher模型的模型参数迁移至压缩后的Student模型中，并利用Teacher模型的模型参数对压缩后的Student模型进行初始化，获得完成初始化的Student模型；

数据输入模块二，用于将所述带噪语音mix进行特征提取后获得的语音特征输入至完成初始化的Student模型中；

Student模型通过所述带噪语音mix的语音特征和训练收敛后的Teacher模型参数对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第二次估计掩膜mask_s；

掩膜第二误差值获取模块，用于将所述第二次估计掩膜mask_s与所述带噪语音mix的实际掩膜mask_r进行比较，计算获得掩膜第二误差值e ₂，并将所述掩膜第二误差值e ₂发送至Student模型中；

Student模型，用于通过所述带噪语音mix的语音特征和训练收敛后的Teacher模型参数对带噪语音mix的掩膜进行估计处理，获得所述带噪语音mix的第二次估计掩膜mask_s，并将所述第二次估计掩膜mask_s发送至掩膜第二误差值获取模块中；以及，用于在接收到掩膜第二误差值获取模块发送的掩膜第二误差值e ₂后，根据掩膜第二误差值e ₂对所述带噪语音mix的语音特征和训练收敛后的Teacher模型参数的数据处理过程进行参数调整，使第二次估计掩膜mask_s无限趋近于实际掩膜mask_r，直至获得训练收敛后的Student模型；

Student模型保存模块，用于保存训练收敛后的Student模型。

8.根据权利要求5所述模型压缩系统，其特征在于，所述模型测试模块包括：