CN105163239A

CN105163239A - 4d裸耳全息立体声实现方法

Info

Publication number: CN105163239A
Application number: CN201510468234.3A
Authority: CN
Inventors: 郝立; 朱倩
Original assignee: Hefei Aisen Acoustic Technology Co Ltd
Current assignee: Hefei Wan Lai dock film and Television Technology Co., Ltd.
Priority date: 2015-07-30
Filing date: 2015-07-30
Publication date: 2015-12-16
Anticipated expiration: 2035-07-30
Also published as: CN105163239B

Abstract

本发明公开了一种4D裸耳全息立体声实现方法，所述方法包括：将一个立体声2.0音频文件分析扫描后，取得原声学空间；将原声学空间处理后建立空间模型，空间模型即为4D动态声场；将立体声2.0音频去除原声学空间后再进行处理得到处理后音频；将处理后音频与空间模型合成，生成4D裸耳全息立体声音频文件；使用在具有至少两个扬声器的声音再现系统中播放4D裸耳全息立体声音频文件，本发明算法简单，音质效果好，该方法可以实现利用现有的2.0播放系统重放出杜比全景声64个音响系统的效果。大幅降低了经济成本。

Description

4D裸耳全息立体声实现方法

技术领域

本发明涉及音频处理技术领域，尤其是一种4D裸耳全息立体声实现方法。

背景技术

立体声，就是指具有立体感的声音。自然界发出的声音是立体声，但如果我们把这些立体声经记录、放大等处理后而重放时，所有的声音都从一个扬声器放出来，这种重放声（与原声源相比）就不是立体的了。这时由于各种声音都从同一个扬声器发出，原来的空间感（特别是声群的空间分布感）也消失了。这种重放声称为单声。如果从记录到重放整个系统能够在一定程度上恢复原发生的空间感（不可能完全恢复），那么，这种具有一定程度的方位层次感等空间分布特性的重放声，称为音响技术中的立体声。

立体声源于双声道的原理，立体声不算和双声道一个概念，但是是因果关系。

人们听声音时，可以分辨出声音是由哪个方向传来的，从而大致确定声源的位置。人们之所以能分辨声音的方向，是由于人们有两只耳朵的缘故。例如，在人们的右前方有一个声源，那么，由于右耳离声源较近，声音就首先传到右耳，然后才传到左耳，并且右耳听到的声音比左耳听到的声音稍强些。如果声源发出的声音频率很高，传向左耳的声音有一部分会被人头反射回去，因而左耳就不容易听到这个声音。两只耳朵对声音的感觉的这种微小差别，传到大脑神经中，就使人们能够判断声音是来自右前方。这就是通常所说的“双耳效应”。

如果录音时能够把不同声源的空间位置反映出来，使人们在听录音时，就好像身临其境直接听到各方面的声源发音一样。这种放声系统重放的具有立体感的声音，就是立体声。

“立体”的概念是采用多麦克风定位录音技术，将声音分成两个“相位”录制，还原时使用左右两个扬声器放音，这就是双声道。双声道营造了一个平面的声场（主要是左右），高保真的系统还能在一定程度上表现出“纵深”的效果，使我们在听的时候能得到“现场感”，因此也就称其为“立体声”。

所以，立体声最初出现的就是双声道。

随着技术的发展，2.1、5.1、16、32声道的音频系统都已出现，“立体”的概念已失去其原特定的意义，现在追求的是“全方位”、“亲临感”。现在对音频系统的简单表述就是“声道”的构成特点，如：2.1重低音系统、5.1杜比环绕立体声系统、7.1THX立体环绕家庭影院系统等。

DolbyProLogic（杜比定向逻辑技术）是一种矩阵解码技术，它能够将VHS录影带及TV节目中已编码在立体声音轨上的杜比环绕声的节目解码还原为四声道输出的环绕声节目。而DolbyProLogicII（第二代杜比定向逻辑技术）要更为先进一些，它能从任何立体声节目源分离出五个独立声道的环绕声（左、中置、右，左环绕及右环绕），即便原来的节目没有经过杜比环绕声的编码处理也能实现。对于经过杜比环绕声编码的节目的回放，如电影音轨，其声音效果可与DolbyDigital5.1媲美；对于未编码的立体声节目，如立体声CD唱片，节目回放的效果可营造出更宽广的、更有包围感的声场环境。与第一代技术相比，第二代杜比定向逻辑的另一项改善之处在于它提供了全频段的两个独立的环绕声道，而第一代技术只有单一的、频段有限的环绕声道。

杜比对第一代全景声的扬声器数量要求设定在64个音箱，其中包括了3个低音声道。这是影院级最高配置，拥有64个扬声器播放杜比全景声。

DolbyProLogicII（第二代杜比定向逻辑技术）在重放时，首先需要5.1的音源，并且需要配置5+1个音箱，缺一不可，因此对使用条件要比普通双声道立体声苛刻且成本较高。

发明内容

本发明要解决的技术问题是提供一种4D裸耳全息立体声实现方法，把2.0立体声音计算成4D裸耳全息立体声。即2.0音响系统中播放出杜比全景声64个音箱的效果。

为了解决上述技术问题，本发明采用的技术方案是：

4D裸耳全息立体声实现方法，所述方法包括：

将一个立体声2.0音频文件分析扫描后，取得原声学空间；

将原声学空间处理后建立空间模型，此处空间模型即为4D动态声场；

将立体声2.0音频去除原声学空间后再进行处理得到处理后音频；

将处理后音频与空间模型合成，生成4D裸耳全息立体声音频文件；

使用在具有至少两个扬声器的声音再现系统中播放4D裸耳全息立体声音频文件。

进一步的，处理后音频通过以下步骤生成：

将立体声2.0音频去除原声学空间，把音频声波通过数据变形，通过处理后建立的空间模型引导基频强制拉伸到的各个基频相对应的相位，各个基频是指空间模型的各个基频处于原声学空间的各个基频所对应的位置的拉伸映射位置，从空间函数逆进推演检测处理前与处理后的基频变形，校正各个基频在拉升过程中产生的直流偏移信息，生成处理后音频。

优选的,使用滤波器去除各个基频在拉伸过程中产生的相位干涉信息。

优选的，使用延迟器使中频部分产生延迟，直到与高频部分同步播出。

优选的，使用延迟器使低频部分产生延迟，直到与中高频部分同步播出。

进一步的，空间模型通过以下步骤生成：

从音频声波分析各基频的振幅、空间残响和相位信息，建立拟建空间模型；

从音频声波分析声波复合基频部分获取复合音色信息函数，此函数即为原基频函数，将原基频函数处理后得到处理后基频模型；

将处理后基频模型和拟建空间模型合成空间模型。

进一步的，处理后基频模型通过以下步骤生成：

S1、计算出单一基频信息函数；

S2、寻找出单一基频信息函数中最具有代表特征的函数数据，包含描述振幅、频率在绝对比例上的多次出现的数据部分，后生成最具有代表特征的音频；

S3、扫描最具有代表特征的音频的谐波部分和泛音部分；

S4、对单一基频信息函数使用三分损益法建立模拟自然谐波部分和模拟自然泛音部分，生成拟建基频模型；

S5、用学习的方法扫描记录步骤S3和步骤S4的差异，并把差异建立差异函数；

S6、用差异函数对拟建基频模型进行校队补偿，得到处理后的基频模型。

优选的，空间模型和处理后音频的头文件通过逆进算法，推演获取文件中原系统开发平台的开发语言和原文件波形生成时使用的软件算法。

本发明的有益效果是：

本发明算法简单，音质效果好，该方法可以实现利用现有的2.0播放系统重放出杜比全景声64个音响系统的效果。大幅降低了经济成本。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明4D裸耳全息立体声实现方法流程图。

图2为本发明处理后音频生成流程图。

图3为本发明空间模型生成流程图。

图4为本发明处理后基频合成流程图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

如图1所示，本发明公开一种4D裸耳全息立体声实现方法，所述方法包括：

如图3所示，将一个立体声2.0音频文件分析扫描后，取得原声学空间；

从音频声波分析空间函数，即各基频的振幅、空间残响和相位信息，建立拟建空间模型；

如图2所示，从音频声波分析声波复合基频部分获取复合音色信息函数，此函数即为原基频函数，将原基频函数处理后得到处理后基频模型，其中，如图4所示，处理后基频模型通过以下步骤生成：

S1、计算出单一基频信息函数；

S3、扫描最具有代表特征的音频的谐波部分和泛音部分；

S6、用差异函数对拟建基频模型进行校队补偿，得到处理后的基频模型；

将处理后基频模型和拟建空间模型合成空间模型；

将立体声2.0音频去除原声学空间，把音频声波通过数据变形，处理后建立的空间模型（4D动态声场）引导基频强制拉伸到的各个基频相对应的相位，，各个基频是指空间模型（4D动态声场）的各个基频处于原声学空间的各个基频所对应的位置的拉伸映射位置，从空间函数逆进推演检测处理前与处理后的基频变形，校正各个基频在拉升过程中产生的直流偏移信息，生成处理后音频，在此过程中，使用滤波器去除各个基频在拉伸过程中产生的相位干涉信息，使用延迟器使中频部分产生延迟，直到与高频部分同步播出，使用延迟器使低频部分产生延迟，直到与中高频部分同步播出；

空间模型和处理后音频的头文件通过逆进算法，推演获取文件中原系统开发平台的开发语言和原文件波形生成时使用的软件算法。

以上所述的本发明实施方式，并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明的权利要求保护范围之内。

Claims

1.4D裸耳全息立体声实现方法，其特征在于，所述方法包括：

将一个立体声2.0音频文件分析扫描后，取得原声学空间；

2.根据权利要求1所述4D裸耳全息立体声实现方法，其特征在于,处理后音频通过以下步骤生成：

3.根据权利要求2所述4D裸耳全息立体声实现方法，其特征在于,使用滤波器去除各个基频在拉伸过程中产生的相位干涉信息。

4.根据权利要求2所述4D裸耳全息立体声实现方法，其特征在于,使用延迟器使中频部分产生延迟，直到与高频部分同步播出。

5.根据权利要求2所述4D裸耳全息立体声实现方法，其特征在于,使用延迟器使低频部分产生延迟，直到与中高频部分同步播出。

6.根据权利要求1所述4D裸耳全息立体声实现方法，其特征在于,空间模型通过以下步骤生成：

将处理后基频模型和拟建空间模型合成空间模型。

7.根据权利要求6所述4D裸耳全息立体声实现方法，其特征在于,处理后基频模型通过以下步骤生成：

S1、计算出单一基频信息函数；

S3、扫描最具有代表特征的音频的谐波部分和泛音部分；

8.根据权利要求1所述4D裸耳全息立体声实现方法，其特征在于,空间模型和处理后音频的头文件通过逆进算法，推演获取文件中原系统开发平台的开发语言和原文件波形生成时使用的软件算法。