CN117219098A

CN117219098A - 一种用于智能体的数据处理系统

Info

Publication number: CN117219098A
Application number: CN202311182203.2A
Authority: CN
Inventors: 孙志明; 陈海涛; 雷铜; 王彬
Original assignee: Nanjing Huizhi Mutual Entertainment Network Technology Co ltd
Current assignee: Nanjing Huizhi Mutual Entertainment Network Technology Co ltd
Priority date: 2023-09-13
Filing date: 2023-09-13
Publication date: 2023-12-12
Anticipated expiration: 2043-09-13
Also published as: CN117219098B

Abstract

本发明属于数据处理领域，公开了一种用于智能体的数据处理系统，包括噪声水平计算模块、算法选择模块和滤波模块：噪声水平计算模块用于计算需要进行滤波的语音信号的噪声指数；算法选择模块用于基于噪声指数选择用于对需要进行滤波的语音信号进行滤波的滤波算法；滤波模块用于基于算法选择模块选择的滤波算法对需要进行滤波的语音信号进行滤波，得到滤波后的语音信号。本发明能够在滤波的效果和滤波的耗时之间取得平衡，从而降低滤波时间过长或滤波程度不足的情况的出现概率。当在噪声水平不同的场所多次通过语音的方式与智能体交互时，本发明总体上提高了智能体对语音信号的识别的准确程度以及缩短了响应时间。

Description

一种用于智能体的数据处理系统

技术领域

本发明涉及数据处理领域，尤其涉及一种用于智能体的数据处理系统。

背景技术

智能体指的是驻留于环境中的实体，它可以解释从环境中获得的反映环境中所发生事件的数据，并执行对环境产生影响的行动。”在这个定义中，智能体被看作是一种在环境中“生存”的实体，它既可以是硬件(如机器人)，也可以是软件。

随着人工智能技术的发展，智能体能够完成的任务也越来越多，例如，比较有名的智能体GPT-4，可以计算一些简单的数学题，自动对文本内容进行分析等。

智能体在使用过程中，每次完成计算后，都需要接收用户输入的命令才能进行进行下一步的计算，现有技术中，可以通过语音或文字的方式，向智能体下达指令。在通过语音方式向智能体下达指令时，智能体需要对接收到的语音信号进行滤波处理，然后对经过滤波的信号进一步进行分析以提取语音信号中所包含的具体指令。

而现有的用于语音信号的滤波方式，通常仅在时域或频域对语音信号进行滤波处理，并没有考虑到不同的语音信号中的噪声含量，容易导致滤波时间过长或滤波程度不足的情况的出现，从而容易影响智能体对用户的所发出的指令的响应速度或影响智能体对语音信号进行识别从准确程度。当语音信号中的噪声含量比较多时，若在时域对语音信号进行滤波，则很容易导致滤波程度不足，即滤波后的语音信号中依然包含了比较多的噪声；而当语音信号中的噪声含量比较少时，若在频域中对语音信号进行滤波，则很容易导致滤波时间过长，因为噪声含量比较少时，在时域进行滤波的也能够实现噪声的有效去除。

发明内容

本发明的目的在于公开一种用于智能体的数据处理系统，解决在用户通过语音的方式向智能体下达指令时，智能体如何选择合适的滤波算法对语音信息进行滤波处理，从而降低滤波时间过长或滤波程度不足的情况的出现概率的问题。

为了达到上述目的，本发明提供如下技术方案：

本发明提供了一种用于智能体的数据处理系统，包括噪声水平计算模块、算法选择模块和滤波模块：

噪声水平计算模块用于计算需要进行滤波的语音信号的噪声指数；

算法选择模块用于基于噪声指数选择用于对需要进行滤波的语音信号进行滤波的滤波算法；

滤波模块用于基于算法选择模块选择的滤波算法对需要进行滤波的语音信号进行滤波，得到滤波后的语音信号。

可选的，还包括语音信号获取模块，语音信号获取模块用于将用户发出的声音转换为需要进行滤波的语音信号。

可选的，还包括语音识别模块；

语音识别模块用于对滤波后的语音信号进行识别，获取滤波后的语音信号所对应的文字信息。

可选的，噪声指数的计算公式为：

noifig表示需要进行滤波的语音信号的噪声系数，nodeu表示需要进行滤波的语音信号的采样时刻的集合，msval_i表示i时刻的语音信号的第一噪声值，mxmsval表示nodeu中的元素所对应的语音信号的第一噪声值的最大值，mrcaval_i表示i时刻的语音信号的第二噪声值，mxmrcaval表示nodeu中的元素所对应的语音信号的第二噪声值的最大值，w₁和w₂分别表示预设的第一噪声权重和第二噪声权重，w₁+w₂＝1。

可选的，第一噪声值的获取算法包括最小值统计噪声估计算法；

第二噪声值的获取算法包括MCRA算法。

可选的，nodeu的获取过程包括：

以时间长度T为间隔，获取需要进行滤波的语音信号中的采样时刻，将所有得到的采样时刻保存到集合nodeu。

可选的，基于噪声指数选择用于对需要进行滤波的语音信号进行滤波的滤波算法，包括：

若噪声指数大于设定的噪声系数阈值，则选择在频域进行滤波的自适应滤波算法作为对需要进行滤波的语音信号进行滤波的滤波算法；

若噪声指数小于等于设定的噪声系数阈值，则在时域进行滤波的滤波算法作为对需要进行滤波的语音信号进行滤波的滤波算法。

可选的，在时域进行滤波的滤波算法包括中值滤波算法、一阶滞后滤波算法、算术平均滤波算法和滑动平均滤波算法中的任一种。

可选的，自适应滤波算法的滤波过程包括：

对需要进行滤波处理的语音信号进行分帧处理和加窗处理，获得待滤波的语音帧；

分别对每个待滤波的语音帧进行滤波处理，得到滤波后的语音帧；

对滤波后的语音帧进行融合，得到滤波后的语音信号。

有益效果：

与现有的语音信号的滤波过程相比，本发明通过计算噪声指数来为需要进行滤波的语音信号进行滤波处理，当语音信号中包含的噪声比较多时，本发明采用滤波能力更强但是更加耗时的算法来对语音信号进行滤波，而当语音信号中包含的噪声比较少时，本发明采用滤波能力稍弱但是滤波速度更加快的算法来对语音信号进行滤波，能够在滤波的效果和滤波的耗时之间取得平衡，从而降低滤波时间过长或滤波程度不足的情况的出现概率。当在噪声水平不同的场所多次通过语音的方式与智能体交互时，本发明总体上提高了智能体对语音信号的识别的准确程度以及缩短了响应时间。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的一种用于智能体的数据处理系统的第一种示意图。

图2为本发明的一种用于智能体的数据处理系统的第二种示意图。

图3为本发明的一种用于智能体的数据处理系统的第三种示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

如图1所示的一种实施例，本发明提供了一种用于智能体的数据处理系统，包括

包括噪声水平计算模块、算法选择模块和滤波模块：

上述计算过程通过计算噪声指数来为需要进行滤波的语音信号进行滤波处理，当语音信号中包含的噪声比较多时，本发明采用滤波能力更强但是更加耗时的算法来对语音信号进行滤波，而当语音信号中包含的噪声比较少时，本发明采用滤波能力稍弱但是滤波速度更加快的算法来对语音信号进行滤波，能够在滤波的效果和滤波的耗时之间取得平衡，从而降低滤波时间过长或滤波程度不足的情况的出现概率。当在噪声水平不同的场所多次通过语音的方式与智能体交互时，本发明总体上提高了智能体对语音信号的识别的准确程度以及缩短了响应时间。

可选的，如图2所示，还包括语音信号获取模块，语音信号获取模块用于将用户发出的声音转换为需要进行滤波的语音信号。

具体的，语音信号获取模块可以包括麦克风和模数转换装置，麦克风用于获取用户发出的声音的模拟信号，模数转换装置用于将模拟信号转换为数字信号，即需要进行滤波的语音信号。

可选的，如图3所示，还包括语音识别模块；

具体的，对滤波后的语音信号进行识别的算法包括隐马尔科夫模型(HMM)、最大熵模型(MLM)、支持向量机(SVM)、深度学习(DL)等。

可选的的，还包括传输模块；

传输模块用于将语音识别模块获得的文字信息发送至智能体的处理器。

智能体对文字信息所包含的指令进行处理，从而得到处理结果。

例如，当文字信息中包含的指令为写一篇演讲稿，然后文字信息里面包含了演讲稿的主题、字数要求等，则智能体能够根据文字信息生成对应的演讲稿。

可选的，噪声指数的计算公式为：

在上述计算过程中，噪声指数并不是仅根据一种算法计算得到的，因为用户在使用智能体时，背景的噪声情况会比较复杂，单一的算法无法得到准确的噪声指数，因此，本发明通过两种噪声估计算法来计算噪声指数，能够有效地提高计算得到的噪声指数的准确率。

另外，本发明是通过采样时刻来计算噪声指数的，避免了对需要进行滤波的语音信号中所有时刻的取值来进行噪声指数的计算，从而能够在准确地得到噪声指数的同时，提高了噪声指数的计算效率。

具体的，第一噪声权重和第二噪声权重的取值可以分别是0.4和0.6。

第二噪声值的获取算法包括MCRA算法。

具体的，第一噪声值为最小值统计噪声估计算法对i时刻的语音信号计算得到的数值，第二噪声值为MCRA算法对i时刻的语音信号计算得到的数值。

具体的，对于i时刻的取值val_i，在计算噪声值时，基于时间区间[i-v,i+v]内的数据进行计算得到，v表示预设的正整数，当i小于等于v时，则将对应的第一噪声值和第二噪声值设定为固定的数值。例如第一噪声值和第二噪声值均设置为正常说话时的声音的语音信号的幅度的最大值的平方。

可选的，nodeu的获取过程包括：

具体的，以时间长度T为间隔，获取需要进行滤波的语音信号中的采样时刻，包括：

以时间长度T为间隔，将需要进行滤波的语音信号所对应的时间段分为多个时间周期；

对于需要进行滤波的语音信号中的第t个时间周期，t∈[1,T]，其采样时刻的确定过程如下：

在取值范围[1，T]内随机抽取一个整数R_t；

则第t个时间周期对应的采样时刻为star_t+R_t，star_t表示第t个时间周期的起始时刻。

在上述计算过程中，并不是直接间隔T来确定采样时刻，以为这样可能会导致周期性出现噪声的时刻的取值没有被采样到，刚好被错开，因此，上述采样方式能够最大程度地覆盖所有类型的噪声，从而使得噪声指数能够更加综合地表示需要进行滤波的语音信号中的噪声的情况，有利于后续采用更加准确的滤波算法来对需要进行滤波的语音信号进行处理。

具体的，当噪声指数比较大时，表示语音信号中的噪声比较多，因此，本发明在频域在进行滤波，能够达到更好的滤波效果，因为语音信号中的噪声在频域能够更好地被发现，而当噪声指数比较小时，表示语音信号中的噪声比较少，此时，仅需要在时域中进行滤波处理，便能够在较小的滤波耗时的情况下，得到满足需要的滤波结果。

可选的，自适应滤波算法的滤波过程包括：

对滤波后的语音帧进行融合，得到滤波后的语音信号。

具体的，分帧处理的目的是为了得到帧内信号稳定的信号，从而能够在后续的滤波过程中更准确地选择对应的滤波算法。而对分帧后的语音帧进行加窗处理，则是能够避免出现频谱泄露的情况。

可选的，分别对每个待滤波的语音帧进行滤波处理，得到滤波后的语音帧，包括：

对于待进行滤波的语音帧voifra，其滤波处理过程如下：

对voifra进行EMD分解，得到Q个IMF信号；

分别对每个IMF信号进行滤波处理，得到滤波后的IMF信号；

对所有滤波后的IMF信号进行重构，得到滤波后的语音帧avoifra。

具体的，EMD分解能够得到多个IMF信号，IMF信号的序号越大，表示其对应的EMD分解的次数越大。

可选的，分别对每个IMF信号进行滤波处理，得到滤波后的IMF信号，包括：

计算滤波序号门槛值H；

对于第q个IMF信号IMF_q，q∈[1，Q]，若q小于等于H，则使用小波降噪算法对IMF_q进行滤波处理，得到滤波后的IMF信号；

若q大于H，则使用带通滤波器对IMF_q进行滤波处理，得到滤波后的IMF信号。

当获得多个IMF信号之后，信号的序号越小时，其包含噪声的概率越大。因此，本发明通过计算滤波序号门槛值H，来为序号不同的IMF信号自适应地选择不同的滤波算法来进行滤波处理，从而能够避免对所有的IMF信号采用同样的滤波算法来进行滤波处理，在能够保留更多的信号细节的同时，实现语音信号中的噪声的快速且有效的过滤。因为当IMF信号的序号大于H时，其中包含的噪声的含量已经比较低，此时，本发明采用滤波速度更快的带通滤波器来进行滤波处理，而当IMF的需要比较少时，本发明采用滤波性能更好的小波降噪算法来进行滤波处理，从而得到了更好的滤波效果。因此，本发明能够避免对所有的IMF信号采用相同的滤波算法进行滤波处理，提高滤波效率，且能够保证滤波结果的准确程度。

可选的，滤波序号门槛值H的获取过程包括：

获取使得如下不等式成立时IMF信号的序号的最小值h；

bgtml_r表示第r个IMF信号中，数值大于设定的判断阈值tempval的时刻的数量，S_r表示第r个IMF信号的长度，value_s,r表示第h个IMF信号在时刻s处的取值的绝对值，sigjude_r表示第r个IMF信号的判断值，sigjude_h表示第h个IMF信号的判断值，threjude表示设定的数值；h∈[2,Q]，

将h的值作为H的值。

具体的，滤波序号门槛值的获取过程为：不断地将新获得的判断值与前面的所有判断值的平均值来进行比较，当不等式成立时，表示第h个IMF信号中，有效信息的含量已经大于噪声的含量，此时，可以采用滤波速度更加快的带通滤波器来进行滤波处理。sigjude_h的计算方式与sigjude_r的计算方式相同。滤波序号门槛值的获取过程能够发现IMF信号中的噪声含量和有效信息含量的突变点，从而实现对尽可能少的IMF信号采用小波降噪算法来进行降噪处理，提高了降噪的效率。

判断阈值的取值可以是0.1。threjude的数值可以是2。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本发明的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种用于智能体的数据处理系统，其特征在于，包括噪声水平计算模块、算法选择模块和滤波模块：

2.根据权利要求1所述的一种用于智能体的数据处理系统，其特征在于，还包括语音信号获取模块，语音信号获取模块用于将用户发出的声音转换为需要进行滤波的语音信号。

3.根据权利要求1所述的一种用于智能体的数据处理系统，其特征在于，还包括语音识别模块；

4.根据权利要求1所述的一种用于智能体的数据处理系统，其特征在于，噪声指数的计算公式为：

5.根据权利要求4所述的一种用于智能体的数据处理系统，其特征在于，第一噪声值的获取算法包括最小值统计噪声估计算法；

第二噪声值的获取算法包括MCRA算法。

6.根据权利要求4所述的一种用于智能体的数据处理系统，其特征在于，nodeu的获取过程包括：

7.根据权利要求4所述的一种用于智能体的数据处理系统，其特征在于，基于噪声指数选择用于对需要进行滤波的语音信号进行滤波的滤波算法，包括：

8.根据权利要求7所述的一种用于智能体的数据处理系统，其特征在于，在时域进行滤波的滤波算法包括中值滤波算法、一阶滞后滤波算法、算术平均滤波算法和滑动平均滤波算法中的任一种。

9.根据权利要求7所述的一种用于智能体的数据处理系统，其特征在于，自适应滤波算法的滤波过程包括：

对滤波后的语音帧进行融合，得到滤波后的语音信号。