CN113542982B

CN113542982B - 一种混音方法及存储介质

Info

Publication number: CN113542982B
Application number: CN202110719583.3A
Authority: CN
Inventors: 陈时钦; 江正梁
Original assignee: Rockchip Electronics Co Ltd
Current assignee: Rockchip Electronics Co Ltd
Priority date: 2021-06-28
Filing date: 2021-06-28
Publication date: 2023-07-18
Anticipated expiration: 2041-06-28
Also published as: CN113542982A

Abstract

一种混音方法及存储介质。一种混音方法，包括如下步骤，麦克风通过相同的时钟与音频播放器工作在第一频率，麦克风录制收音数据流，所述收音数据流与回声采集用的音频数据流通过混音处理芯片混音后，得到第二频率的混音后的数据流，将混音后的音频数据流送入I2S总线，所述I2S总线兼容第二频率，混音后的音频数据流再通过I2S总线被发送至处理单元。通过上述技术方案，能够实现在保证播放器音质以及麦克风收音音质的情况下，进行回采信号与麦克风收音信号的混音处理。

Description

一种混音方法及存储介质

技术领域

本发明涉及音频数据处理领域，尤其涉及一种能够回采同时保证播放音质的方法及存储介质。

背景技术

智能语音识别产品中需要用到音频信号处理算法，算法中一个很重要的部分是回声消除。回声消除算法需要采集喇叭播放的声音作为算法的回声参考信号，所以，对设备播放的音频数据进行数据回采和实时同步，是非常重要的步骤，直接影响回声消除的效果。

目前世面上存在不少回声消除的装置，但是总体上价格偏贵，且在HDMI和喇叭切换的时候效果不是很好。一般的设备录放都共用一组MCLK，为了使用市面上通用的音频处理算法(16k的数据)，需要做重采样(48k->16k，或者16k->48k)，很难在满足录音需求的同时兼顾到播放音质不受影响。本文提供的设计思路，能在HDMI和喇叭输出声音时候均采用硬回采，做到声源同步，且可以自由切换回采数据，价格低的同时效果还比较好。

发明内容

为此，需要提供一种混音方法及存储介质，以满足在音频回采装置中的混音需求。

为实现上述目的，发明人提供了一种混音方法，包括如下步骤，麦克风通过相同的时钟与音频播放器工作在第一频率，麦克风录制收音数据流，所述收音数据流与回声采集用的音频数据流通过混音处理芯片混音后，得到第二频率的混音后的数据流，将混音后的音频数据流送入I2S总线，所述I2S总线兼容第二频率，混音后的音频数据流再通过I2S总线被发送至处理单元。

具体地，还包括步骤，所述第一频率高于第二频率。

具体地，所述第一频率为48kHz，所述第二频率为16kHz。

具体地，还包括步骤，处理单元对混音后的数据流进行回声消除。

一种混音存储介质，存储有计算机程序，所述计算机程序在被运行时执行包括如下步骤，麦克风通过相同的时钟与音频播放器工作在第一频率，麦克风录制收音数据流，所述收音数据流与回声采集用的音频数据流通过混音处理芯片混音后，得到第二频率的混音后的数据流，将混音后的音频数据流送入I2S总线，所述I2S总线兼容第二频率，混音后的音频数据流再通过I2S总线被发送至处理单元。

具体地，还包括步骤，所述第一频率高于第二频率。

具体地，所述第一频率为48kHz，所述第二频率为16kHz。

通过上述技术方案，能够实现在保证播放器音质以及麦克风收音音质的情况下，进行回采信号与麦克风收音信号的混音处理。

附图说明

图1为本发明一实施方式所述的回声消除的方法流程图；

图2为本发明另一实施方式所述的混音方法流程图；

图3为本发明一实施方式所述的回声消除的装置模块图。

具体实施方式

为详细说明技术方案的技术内容、构造特征、所实现目的及效果，以下结合具体实施例并配合附图详予说明。

请参阅图1，介绍了一种回声消除方法，包括如下步骤，S100判断是否连接有音频数据分离芯片，若未连接有音频数据分离芯片，则S102调用codec的音频数据流作为回声采集用的音频数据流，同时将codec的音频数据流发送到音频播放器；还进行S104将codec的音频数据流送入处理单元，用于进行回声消除，

若连接有音视频分离芯片，则S106调用音视频分离芯片生成的音频数据流作为回声采集用的音频数据流，S108将音视频分离芯片生成的音频数据流送入处理单元，用于进行回声消除。

上述方案解决了回声消除的方法中的回采数据的来源问题，如果采用软件回采会存在解算速度不足导致的时延误差问题，采用硬件直接调用能够解决上述问题，而采用硬件回采也能够避免上述问题。

作为进一步的一些具体实施方式，所述音视频分离芯片用于分离系统生成的HDMI、DPI、DP、DVI、LVDS等格式的音视频数据。本方案中音视频分离芯片优选为HDMI音视频分离芯片。

进一步的实施例中，所述用于进行回声消除具体包括步骤，回声采集用的音频数据流送入混音处理芯片，与麦克风收音数据流进行混音后，处理单元处理混音数据和回声采集用的音频数据流进行对比消除。

在其他一些实施例中，为了保证方法实施的音质我们还设计一种混音方法，这里请看图2，本方案的适用环境中，我们可以让麦克风通过相同的时钟与音频播放器工作在第一频率，再进行步骤，S200麦克风录制收音数据流，所述收音数据流与回声采集用的音频数据流通过混音处理芯片混音后，得到第二频率的混音后的数据流，S202将混音后的音频数据流送入I2S总线，所述I2S总线兼容第二频率，S204混音后的音频数据流再通过I2S总线被发送至处理单元。让麦克风通过相同的时钟与音频播放器工作在第一频率，能够节省时钟芯片的成本，这种情况下的麦克风采样需求与播放音质的需求如果不匹配，常会得不到理想的录音播放效果。因此在麦克风与音频播放器同样工作在第一频率的情况下，采用混音处理芯片在此处有两点作用，一是对多路的数据流进行整合，同时还对不同频率的数据流进行兼容。例如在我们的一些实施例中，所述第一频率高于第二频率。则可说明在本实施例中，麦克风采集的收音数据流与音频播放器的播放音质较好，经过混音处理芯片后的数据流较差。所述第一频率为48kHz，所述第二频率为16kHz。这样音频播放器工作在48kHz，能够获得较好的播放音质，混音处理芯片采用ES7210音频模数转换芯片,采用时分复用技术(TDM)输出形式，可以使用48k的频率录音，同时兼容16kHz的输出模式。这里的混音处理指的是将收音数据流和音频数据流整合、同步输出，是数据的时分复用，而非进行音波的叠加混合。例如ES7210音频模数转换芯片可以使用4路输出，我们可以使用其中的2路输出收音数据流，2路输出音频数据流；也可以使用其中的2路输出收音数据流，2路输出音频数据流，也可以使用其中的3路输出收音数据流，1路输出音频数据流，由于3路16kHz输出相当于48kHz的收音数据流，通过这种方法也没有损失收音数据流的音质。还可以并行2套ES7210音频模数转换芯片，使用其中的2路输出收音数据流，4路输出音频数据流。并行2套ES7210音频模数转换芯片，使用其中的3路输出收音数据流，3路输出音频数据流等等实施方式，均能够达到混音输出的技术效果。

在进一步的具体实施例中，还包括步骤，处理单元对混音后的数据流进行回声消除。这里的处理单元可以是专用的回声消除芯片，如ATH8806，也可以通过对应的算法，通过处理单元运算进行回声消除。处理单元可用于对I2S总线传过来的数据进行后续的回声消除处理。这里的回声消除算法运行的是，对比收音数据流和音频数据流，根据音频数据流消除收音数据流中的杂波及背景回声。

在图3所示的实施例中，展示了应用本方案的装置的样式，在判断是连接有音频数据分离芯片的前提下，装置收到音视频数据流，调用音视频分离芯片生成的音频数据流作为回声采集用的音频数据流，S108将音视频分离芯片生成的音频数据流送入混音处理芯片，再通过混音处理芯片混音后送回处理芯片，用于进行回声消除。若未连接有音频数据分离芯片，则直接调用系统codec的音频数据流作为回声采集用的音频数据流，同时将codec的音频数据流发送到SPEAKER音频播放器；还同时进行将codec的音频数据流送入处理单元，用于进行回声消除。在这之后，我们还用麦克风录制收音数据流，所述收音数据流与回声采集用的音频数据流通过混音处理芯片混音后，得到第二频率的混音后的数据流，将混音后的音频数据流送入I2S总线，所述I2S总线兼容第二频率，混音后的音频数据流再通过I2S总线被发送至处理单元。

本方案还介绍一种回声消除存储介质，存储有计算机程序，所述计算机程序在被运行时执行包括如下步骤，判断是否连接有音频数据分离芯片，若未连接有音频数据分离芯片，则配置codec内部的通路，获取音频数据流作为回声采集用的音频数据流，同时将codec的音频数据流发送到音频播放器；还将codec的音频数据流送入处理单元，进行回声消除，

若连接有音视频分离芯片，则调用音视频分离芯片生成的音频数据流作为回声采集用的音频数据流，送入处理单元，用于进行回声消除。

具体地，所述音视频分离芯片用于分离系统生成的HDMI、DPI、DP、DVI、LVDS等格式的音视频数据。

具体地，所述计算机程序在被运行时执行回声消除具体执行包括步骤，回声采集用的音频数据流送入混音处理芯片，与麦克风收音数据流进行混音后，处理单元处理混音数据和回声采集用的音频数据流进行对比消除。

本方案还介绍一种混音存储介质，存储有计算机程序，所述计算机程序在被运行时执行包括如下步骤，麦克风通过相同的时钟与音频播放器工作在第一频率，麦克风录制收音数据流，所述收音数据流与回声采集用的音频数据流通过混音处理芯片混音后，得到第二频率的混音后的数据流，将混音后的音频数据流送入I2S总线，所述I2S总线兼容第二频率，混音后的音频数据流再通过I2S总线被发送至处理单元。

具体地，还包括步骤，所述第一频率高于第二频率。

具体地，所述第一频率为48kHz，所述第二频率为16kHz。

需要说明的是，尽管在本文中已经对上述各实施例进行了描述，但并非因此限制本发明的专利保护范围。因此，基于本发明的创新理念，对本文所述实施例进行的变更和修改，或利用本发明说明书及附图内容所作的等效结构或等效流程变换，直接或间接地将以上技术方案运用在其他相关的技术领域，均包括在本发明的专利保护范围之内。

Claims

1.一种混音方法，其特征在于，包括如下步骤：

判断是否连接有音频数据分离芯片，

若未连接有音频数据分离芯片，则调用codec的音频数据流作为回声采集用的音频数据流，同时将codec的音频数据流发送到音频播放器；将codec的音频数据流送入处理单元，用于进行回声消除，

若连接有音视频分离芯片，则调用音视频分离芯片生成的音频数据流作为回声采集用的音频数据流，将音视频分离芯片生成的音频数据流送入处理单元，用于进行回声消除；

使麦克风通过相同的时钟与音频播放器工作在第一频率；

通过所述麦克风录制收音数据流，并将所述收音数据流与回声采集用的音频数据流通过混音处理芯片混音，得到第二频率的混音后的数据流；

将所述混音后的数据流送入I2S总线，所述I2S总线兼容第二频率，所述第一频率高于所述第二频率；以及

将所述混音后的数据流再通过所述I2S总线发送至处理单元。

2.根据权利要求1所述的混音方法，其特征在于，所述混音处理芯片使用4路输出，其中的3路输出收音数据流，1路输出音频数据流。

3.根据权利要求1所述的混音方法，其特征在于，所述第一频率为48kHz，所述第二频率为16kHz。

4.根据权利要求1所述的混音方法，其特征在于，还包括步骤：

由所述处理单元对所述混音后的数据流进行回声消除。

5.一种混音存储介质，其特征在于，存储有计算机程序，所述计算机程序在被运行时执行包括如下步骤：

判断是否连接有音频数据分离芯片，

使麦克风通过相同的时钟与音频播放器工作在第一频率；

将所述混音后的音频数据流再通过所述I2S总线发送至处理单元。

6.根据权利要求5所述的混音存储介质，其特征在于，所述混音处理芯片使用4路输出，其中的3路输出收音数据流，1路输出音频数据流。

7.根据权利要求5所述的混音存储介质，其特征在于，所述第一频率为48kHz，所述第二频率为16kHz。

8.根据权利要求5所述的混音存储介质，其特征在于，还包括步骤：

由所述处理单元对混音后的数据流进行回声消除。