CN116825121B

CN116825121B - 基于人工智能的智能语音识别与机器翻译系统

Info

Publication number: CN116825121B
Application number: CN202311105259.8A
Authority: CN
Inventors: 陈小波; 彭小芳
Original assignee: Beijing Shenma Digital Technology Co ltd
Current assignee: Beijing Shenma Digital Technology Co ltd
Priority date: 2023-08-30
Filing date: 2023-08-30
Publication date: 2023-11-10
Anticipated expiration: 2043-08-30
Also published as: CN116825121A

Abstract

本发明涉及人工智能技术领域，尤其为基于人工智能的智能语音识别与机器翻译系统，包括：语音拾取模块：用于采集语音信号；信号处理模块：用于对采集的语音信号进行去噪操作。智能识别模块：用于去噪处理后的语音信号进行语音信息的识别和特征提取；机器翻译模块：用于根据提取的语音信号特征进行语音信号的翻译。本发明基于改进的经验模态分解方法和改进的小波阈值算法进行双重去噪处理，能够大大提升获取的语音信号的质量，同时基于特征提取处理和改进萤火虫算法优化的翻译模型提升机器翻译速度与翻译质量。

Description

基于人工智能的智能语音识别与机器翻译系统

技术领域

本发明涉及人工智能技术领域，尤其是基于人工智能的智能语音识别与机器翻译系统。

背景技术

机器翻译给人们带来了极大的便利，机器翻译技术日趋成熟和完善，但在一些对翻译细节要求比较高的场合，机器翻译引擎还存在不少不尽如人意的地方。现有技术中对于机器翻译的方法比较成熟，且几乎不需要人工撰写翻译规则，所有的翻译信息都是自动地从语料中学习而获得，因此该方法最大程度地发挥了计算机高速运算的特点，极大地降低了人工成本。

随着科技的进步，国际交流的日益繁杂和信息量急剧增加，机器翻译极大程度地应用于人们的各项生产、生活中，由于语音信息采集环境中声源状况复杂，杂音多，极易使采集到的声音夹杂大量无关语音，导致语音识别和翻译出现错误，不利于实时翻译，且未经除杂降噪处理的声音信息直接处理更容易导致识别错误。

发明内容

本发明的目的是通过提出基于人工智能的智能语音识别与机器翻译系统，以解决上述背景技术中提出的缺陷。

本发明采用的技术方案如下：

提供基于人工智能的智能语音识别与机器翻译系统，包括：

语音拾取模块：用于采集语音信号；

信号处理模块：用于对采集的语音信号进行去噪操作；

智能识别模块：用于对去噪处理后的语音信号进行语音信息的识别和特征提取；

机器翻译模块：用于根据提取的语音信号特征进行语音信号的翻译。

作为本发明的一种优选技术方案：所述去噪操作包括对语音信号基于改进的经验模态分解方法进行去噪处理和基于改进的小波阈值算法进行去噪处理。

作为本发明的一种优选技术方案：所述改进的经验模态分解方法具体如下：

在采集的语音信号上添加高斯白噪声构造新的个语音信号：

其中，为独立正负成对且方差为1的高斯白噪声，为噪声系数；

对每个构造的新的语音信号通过EMD分解获得第个IMF分量并取平均值：

其中，为个IMF分量平均值，为第个IMF分量，为残余信号；

分解添加高斯白噪声的残余信号并取平均值，其中，为添加高斯白噪声经过EMD分解后的第个IMF分量：

其中，为添加高斯白噪声的残余信号分解的个IMF分量的平均值；

重复分解残余分量直至无法分解，得到最终的剩余残差，得到原始信号如下：

其中，为第个IMF分量平均值。

作为本发明的一种优选技术方案：所述改进的经验模态分解方法中，根据当前的 SNR水平自动调整，具体为：

计算语音信号的当前SNR：

其中，代表信号的功率，代表噪声的功率；

其中，为第个语音信号，为第个高斯白噪声，为样本数量；

根据高斯白噪声的目标订立目标SNR为；

计算调整系数，；

将噪声系数乘以调整系数来得到新的噪声系数，。

作为本发明的一种优选技术方案：所述改进的小波阈值算法具体如下：

其中，为估计小波系数，为原始小波系数，为小波分解尺度，为正整数，为选择的阈值，为调整量，为数学常量，为调节因子。

作为本发明的一种优选技术方案：所述智能识别模块对语音信息的识别和特征提取具体如下：

基于去噪后的语音信号构建翻译语义映射的联合参数分析模型，通过对语音的谱峰监测采用连续光滑的曲线滤波，得到模糊语义关键词特征指向性函数，得到翻译输出的词汇指向性分布集：

其中，为语音信号中的具体预警分布系数，为语音信号的谱长度，得到检测的语音信号的谱平均频率：

其中，为语音信号的时频特征。

作为本发明的一种优选技术方案：所述机器翻译模块根据目标语言类型基于特征聚类检测翻译模型进行语音信号的翻译。

作为本发明的一种优选技术方案：所述特征聚类检测翻译模型具体如下：

其中，为去噪后的语音信号幅度谱，为去噪后的语音信号相位谱，为模糊度匹配系数。

作为本发明的一种优选技术方案：所述机器翻译模块还根据目标语言种类进行翻译译文的整理。

作为本发明的一种优选技术方案：所述信号处理模块和所述机器翻译模块基于改进萤火虫算法分别进行IMF分量个数预模糊度匹配系数的寻优。

作为本发明的一种优选技术方案：所述改进萤火虫算法具体如下：

其中，为第只萤火虫的初始化位置，为间的随机数，、分别为萤火虫位置的上限和下限，为萤火虫种群数量；

萤火虫基于下式进行位置更新：

其中，为第只萤火虫第次迭代的位置，为第只萤火虫第次迭代的位置，第只萤火虫第次迭代的位置；

对于萤火虫种群中亮度最高的萤火虫基于如下扰动进行位置更新：

其中，为步长因子，为萤火虫种群中亮度最高的萤火虫第次迭代的位置，为萤火虫种群中亮度最高的萤火虫第次迭代的位置；

若算法运行到最大迭代次数或种群中相邻萤火虫的最大距离小于时，算法停止迭代；以亮度最高的萤火虫对应的位置为最优值，否则进行下一次迭代直至获取最优值。

本发明提供的基于人工智能的智能语音识别与机器翻译系统，与现有技术相比，其有益效果有：

本发明基于改进的经验模态分解方法和改进的小波阈值算法进行双重去噪处理，改进的经验模态分解方法能够在很大程度上消除模态混叠的问题，提高了分解效率，减小了噪声的残留和重构误差；改进的小波阈值算法利用指数函数的逼近性以及其在固定区间变换迅速的特点，能够合理控制函数的逼近速度，提高跟踪效率。通过双重去噪处理能够大大提升获取的语音信号的质量，同时基于特征提取处理和改进萤火虫算法优化的翻译模型提升机器翻译速度与翻译质量。

附图说明

图1为本发明优选实施例的系统框图。

图中各个标记的意义为：100、语音拾取模块；200、信号处理模块；300、智能识别模块；400、机器翻译模块。

具体实施方式

需要说明的是，在不冲突的情况下，本实施例中的实施例及实施例中的特征可以相互组合，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照图1所示，本发明优选实施例提供了基于人工智能的智能语音识别与机器翻译系统，包括：

语音拾取模块100：用于采集语音信号；

信号处理模块200：用于对采集的语音信号进行去噪操作。

智能识别模块300：用于去噪处理后的语音信号进行语音信息的识别和特征提取；

机器翻译模块400：用于根据提取的语音信号特征进行语音信号的翻译。

所述去噪操作包括对语音信号基于改进的经验模态分解方法进行去噪处理和基于改进的小波阈值算法进行去噪处理。

所述改进的经验模态分解方法具体如下：

在采集的语音信号上添加高斯白噪声构造新的个语音信号：

其中，为个IMF分量平均值，为第个IMF分量，为残余信号；

其中，为第个IMF分量平均值。

其中，改进的经验模态分解方法中，噪声系数如果是固定的噪声系数，一些信号的特性可能会随时间变化，导致其SNR随时间变化。固定的噪声系数无法适应这种动态变化，可能会导致在某些时间段内去噪效果不佳，所以，本实施例根据当前的SNR水平自动调整，具体为：

计算语音信号的当前SNR：

其中，代表信号的功率，代表噪声的功率

其中，为第个语音信号，为第个高斯白噪声，为样本数量；

根据高斯白噪声的目标订立目标SNR为；

计算调整系数，；

将噪声系数乘以调整系数来得到新的噪声系数，。

如此一来，可以通过分析信噪比来确定合适的噪声系数。SNR可以帮助确定噪声与信号之间的相对强度。在每次迭代中，根据当前的SNR水平来自动调整，以便更好地匹配信号和噪声的特性。

所述改进的小波阈值算法具体如下：

所述智能识别模块300对语音信息的识别和特征提取具体如下：

其中，为语音信号的时频特征。

所述机器翻译模块400根据目标语言类型基于特征聚类检测翻译模型进行语音信号的翻译。

所述特征聚类检测翻译模型具体如下：

所述机器翻译模块400还根据目标语言种类进行翻译译文的整理。

所述信号处理模块200和所述机器翻译模块400基于改进萤火虫算法分别进行IMF分量个数预模糊度匹配系数的寻优。

所述改进萤火虫算法具体如下：

萤火虫基于下式进行位置更新：

本实施例中，设定需要翻译的目标语言类型为英语，语音拾取模块100采集获取语音信号，并通过信号处理模块200对语音拾取模块100采集的语音信号基于改进的经验模态分解方法进行去噪处理：

在采集的语音信号上添加高斯白噪声构造新的个语音信号：

其中，为个IMF分量平均值，为第个IMF分量，为残余信号；

其中，为第个IMF分量平均值。

基于改进萤火虫算法寻优获取IMF分量的最佳个数：

以第12次迭代为例，萤火虫基于下式进行位置更新：

其中，为第只萤火虫第13次迭代的位置，为第只萤火虫第次迭代的位置，第只萤火虫第次迭代的位置；

其中，为步长因子，为萤火虫种群中亮度最高的萤火虫第13次迭代的位置，为萤火虫种群中亮度最高的萤火虫第12次迭代的位置；

若算法运行到最大迭代次数或种群中萤火虫的最大距离小于时，算法停止迭代；以亮度最高的萤火虫对应的位置为最优值，否则进行下一次迭代直至获取最优值。

改进萤火虫算法中，通过间的随机数替换了萤火虫之间的吸引度，能够增加算法的随机性，降低算法追踪到局部IMF分量最佳数量的概率。并且只在亮度最高的萤火虫上施加扰动，通过判断亮度最高的萤火虫在种群中的位置来确定扰动的方向，能够提高跟踪效率和跟踪精度。

设寻优获取的IMF分量的最佳个数为15个，则得到原始信号如下：

其中，为第个IMF分量平均值。

基于改进萤火虫算法优化的经验模态分解方法进行去噪处理，获取最优的IMF分量数量，获取最优去噪结果，能够在很大程度上消除模态混叠的问题，提高了分解效率，减小了噪声的残留和重构误差。

再基于改进的小波阈值算法进行去噪处理：

可选取阈值如下：

其中，为噪声的标准差，为语音信号的谱长度。

小波阈值算法利用指数函数的逼近性以及其在固定区间变换迅速的特点，可通过调节因子的大小来合理地控制函数的逼近速度，提高跟踪效率。若去噪后的重构信号不够光滑，可以增大值进行调节；若去噪后的重构信号丢失了很多原始信号的信息，则可以减小的值进行调节。

去噪处理完成后，基于智能识别模块300进行语音信号的识别和特征提取：

基于去噪后的语音信号构建英文翻译语义映射的联合参数分析模型，通过对语音的谱峰监测采用连续光滑的曲线滤波，得到模糊语义关键词特征指向性函数，得到英文翻译输出的词汇指向性分布集：

其中，为语音信号的时频特征。

机器翻译模块400基于需要翻译的目标语言类型，如英文，根据特征聚类检测翻译模型进行翻译：

同样基于改进萤火虫算法寻优获取最佳模糊度匹配系数的值，设寻优获取的最佳模糊度匹配系数的为，则根据优化的特征聚类检测翻译模型进行翻译：

其中，为去噪后的语音信号幅度谱，为去噪后的语音信号相位谱。

基于改进的萤火虫算法寻优获取的翻译模型进行翻译，能够基于提高跟踪效率和跟踪精度的改进的萤火虫算法提升翻译速度和翻译质量。

最终根据翻译结果进行英文译文的整理，如符号管理和每句话的首字母大写等。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.基于人工智能的智能语音识别与机器翻译系统，其特征在于，包括：

语音拾取模块（100）：用于采集语音信号；

信号处理模块（200）：用于对采集的语音信号进行去噪操作；

智能识别模块（300）：用于对去噪处理后的语音信号进行语音信息的识别和特征提取；

机器翻译模块（400）：用于根据提取的语音信号特征进行语音信号的翻译；

所述去噪操作包括对语音信号基于改进的经验模态分解方法进行去噪处理和基于改进的小波阈值算法进行去噪处理；

所述改进的经验模态分解方法具体如下：

在采集的语音信号上添加高斯白噪声/>构造新的/>个语音信号：

；

其中，为独立正负成对且方差为1的高斯白噪声，/>为噪声系数；

；

其中，为/>个IMF分量平均值，/>为第/>个IMF分量，/>为残余信号；

分解添加高斯白噪声的残余信号并取平均值，其中，/>为添加高斯白噪声经过EMD分解后的第/>个IMF分量：

；

其中，为添加高斯白噪声的残余信号分解的/>个IMF分量的平均值；

重复分解残余分量直至无法分解，得到最终的剩余残差，得到原始信号如下/>：

；

其中，为第/>个IMF分量平均值；

所述改进的经验模态分解方法中，根据当前的SNR水平自动调整，具体为：

计算语音信号的当前SNR：

；

其中，代表信号的功率，/>代表噪声的功率：

；

其中，为第/>个语音信号，/>为第/>个高斯白噪声，/>为样本数量；

根据高斯白噪声的目标订立目标SNR为；

计算调整系数，/>；

将噪声系数乘以调整系数/>来得到新的噪声系数，/>；

所述改进的小波阈值算法具体如下：

；

其中，为估计小波系数，/>为原始小波系数，/>为小波分解尺度，/>为正整数，/>为选择的阈值，/>为调整量，/>为数学常量，/>为调节因子。

2.根据权利要求1所述的基于人工智能的智能语音识别与机器翻译系统，其特征在于：所述智能识别模块（300）对语音信息的识别和特征提取具体如下：

；

其中，为语音信号中的具体预警分布系数，/>为语音信号的谱长度，得到检测的语音信号的谱平均频率/>：

；

其中，为语音信号的时频特征。

3.根据权利要求2所述的基于人工智能的智能语音识别与机器翻译系统，其特征在于：所述机器翻译模块（400）根据目标语言类型基于特征聚类检测翻译模型进行语音信号的翻译。

4.根据权利要求3所述的基于人工智能的智能语音识别与机器翻译系统，其特征在于：所述特征聚类检测翻译模型具体如下：

；

其中，为去噪后的语音信号幅度谱，/>为去噪后的语音信号相位谱，/>为模糊度匹配系数。

5.根据权利要求4所述的基于人工智能的智能语音识别与机器翻译系统，其特征在于：所述机器翻译模块（400）还根据目标语言种类进行翻译译文的整理。

6.根据权利要求5所述的基于人工智能的智能语音识别与机器翻译系统，其特征在于：所述信号处理模块（200）和所述机器翻译模块（400）基于改进萤火虫算法分别进行IMF分量个数预模糊度匹配系数的寻优。

7.根据权利要求6所述的基于人工智能的智能语音识别与机器翻译系统，其特征在于：所述改进萤火虫算法具体如下：

；

其中，为第/>只萤火虫的初始化位置，/>为/>间的随机数，/>、/>分别为萤火虫位置的上限和下限，/>为萤火虫种群数量；

萤火虫基于下式进行位置更新：

；

其中，为第/>只萤火虫第/>次迭代的位置，/>为第/>只萤火虫第/>次迭代的位置，第/>只萤火虫第/>次迭代的位置；

；

其中，为步长因子，/>为萤火虫种群中亮度最高的萤火虫/>第/>次迭代的位置，/>为萤火虫种群中亮度最高的萤火虫/>第/>次迭代的位置；