CN105163239A - 4d裸耳全息立体声实现方法 - Google Patents

4d裸耳全息立体声实现方法 Download PDF

Info

Publication number
CN105163239A
CN105163239A CN201510468234.3A CN201510468234A CN105163239A CN 105163239 A CN105163239 A CN 105163239A CN 201510468234 A CN201510468234 A CN 201510468234A CN 105163239 A CN105163239 A CN 105163239A
Authority
CN
China
Prior art keywords
fundamental frequency
sound
frequency
holographic
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510468234.3A
Other languages
English (en)
Other versions
CN105163239B (zh
Inventor
郝立
朱倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Wan Lai dock film and Television Technology Co., Ltd.
Original Assignee
Hefei Aisen Acoustic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Aisen Acoustic Technology Co Ltd filed Critical Hefei Aisen Acoustic Technology Co Ltd
Priority to CN201510468234.3A priority Critical patent/CN105163239B/zh
Publication of CN105163239A publication Critical patent/CN105163239A/zh
Application granted granted Critical
Publication of CN105163239B publication Critical patent/CN105163239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Stereophonic System (AREA)

Abstract

本发明公开了一种4D裸耳全息立体声实现方法,所述方法包括:将一个立体声2.0音频文件分析扫描后,取得原声学空间;将原声学空间处理后建立空间模型,空间模型即为4D动态声场;将立体声2.0音频去除原声学空间后再进行处理得到处理后音频;将处理后音频与空间模型合成,生成4D裸耳全息立体声音频文件;使用在具有至少两个扬声器的声音再现系统中播放4D裸耳全息立体声音频文件,本发明算法简单,音质效果好,该方法可以实现利用现有的2.0播放系统重放出杜比全景声64个音响系统的效果。大幅降低了经济成本。

Description

4D裸耳全息立体声实现方法
技术领域
本发明涉及音频处理技术领域,尤其是一种4D裸耳全息立体声实现方法。
背景技术
立体声,就是指具有立体感的声音。自然界发出的声音是立体声,但如果我们把这些立体声经记录、放大等处理后而重放时,所有的声音都从一个扬声器放出来,这种重放声(与原声源相比)就不是立体的了。这时由于各种声音都从同一个扬声器发出,原来的空间感(特别是声群的空间分布感)也消失了。这种重放声称为单声。如果从记录到重放整个系统能够在一定程度上恢复原发生的空间感(不可能完全恢复),那么,这种具有一定程度的方位层次感等空间分布特性的重放声,称为音响技术中的立体声。
立体声源于双声道的原理,立体声不算和双声道一个概念,但是是因果关系。
人们听声音时,可以分辨出声音是由哪个方向传来的,从而大致确定声源的位置。人们之所以能分辨声音的方向,是由于人们有两只耳朵的缘故。例如,在人们的右前方有一个声源,那么,由于右耳离声源较近,声音就首先传到右耳,然后才传到左耳,并且右耳听到的声音比左耳听到的声音稍强些。如果声源发出的声音频率很高,传向左耳的声音有一部分会被人头反射回去,因而左耳就不容易听到这个声音。两只耳朵对声音的感觉的这种微小差别,传到大脑神经中,就使人们能够判断声音是来自右前方。这就是通常所说的“双耳效应”。
如果录音时能够把不同声源的空间位置反映出来,使人们在听录音时,就好像身临其境直接听到各方面的声源发音一样。这种放声系统重放的具有立体感的声音,就是立体声。
“立体”的概念是采用多麦克风定位录音技术,将声音分成两个“相位”录制,还原时使用左右两个扬声器放音,这就是双声道。双声道营造了一个平面的声场(主要是左右),高保真的系统还能在一定程度上表现出“纵深”的效果,使我们在听的时候能得到“现场感”,因此也就称其为“立体声”。
所以,立体声最初出现的就是双声道。
随着技术的发展,2.1、5.1、16、32声道的音频系统都已出现,“立体”的概念已失去其原特定的意义,现在追求的是“全方位”、“亲临感”。现在对音频系统的简单表述就是“声道”的构成特点,如:2.1重低音系统、5.1杜比环绕立体声系统、7.1THX立体环绕家庭影院系统等。
DolbyProLogic(杜比定向逻辑技术)是一种矩阵解码技术,它能够将VHS录影带及TV节目中已编码在立体声音轨上的杜比环绕声的节目解码还原为四声道输出的环绕声节目。而DolbyProLogicII(第二代杜比定向逻辑技术)要更为先进一些,它能从任何立体声节目源分离出五个独立声道的环绕声(左、中置、右,左环绕及右环绕),即便原来的节目没有经过杜比环绕声的编码处理也能实现。对于经过杜比环绕声编码的节目的回放,如电影音轨,其声音效果可与DolbyDigital5.1媲美;对于未编码的立体声节目,如立体声CD唱片,节目回放的效果可营造出更宽广的、更有包围感的声场环境。与第一代技术相比,第二代杜比定向逻辑的另一项改善之处在于它提供了全频段的两个独立的环绕声道,而第一代技术只有单一的、频段有限的环绕声道。
杜比对第一代全景声的扬声器数量要求设定在64个音箱,其中包括了3个低音声道。这是影院级最高配置,拥有64个扬声器播放杜比全景声。
DolbyProLogicII(第二代杜比定向逻辑技术)在重放时,首先需要5.1的音源,并且需要配置5+1个音箱,缺一不可,因此对使用条件要比普通双声道立体声苛刻且成本较高。
发明内容
本发明要解决的技术问题是提供一种4D裸耳全息立体声实现方法,把2.0立体声音计算成4D裸耳全息立体声。即2.0音响系统中播放出杜比全景声64个音箱的效果。
为了解决上述技术问题,本发明采用的技术方案是:
4D裸耳全息立体声实现方法,所述方法包括:
将一个立体声2.0音频文件分析扫描后,取得原声学空间;
将原声学空间处理后建立空间模型,此处空间模型即为4D动态声场;
将立体声2.0音频去除原声学空间后再进行处理得到处理后音频;
将处理后音频与空间模型合成,生成4D裸耳全息立体声音频文件;
使用在具有至少两个扬声器的声音再现系统中播放4D裸耳全息立体声音频文件。
进一步的,处理后音频通过以下步骤生成:
将立体声2.0音频去除原声学空间,把音频声波通过数据变形,通过处理后建立的空间模型引导基频强制拉伸到的各个基频相对应的相位,各个基频是指空间模型的各个基频处于原声学空间的各个基频所对应的位置的拉伸映射位置,从空间函数逆进推演检测处理前与处理后的基频变形,校正各个基频在拉升过程中产生的直流偏移信息,生成处理后音频。
优选的,使用滤波器去除各个基频在拉伸过程中产生的相位干涉信息。
优选的,使用延迟器使中频部分产生延迟,直到与高频部分同步播出。
优选的,使用延迟器使低频部分产生延迟,直到与中高频部分同步播出。
进一步的,空间模型通过以下步骤生成:
从音频声波分析各基频的振幅、空间残响和相位信息,建立拟建空间模型;
从音频声波分析声波复合基频部分获取复合音色信息函数,此函数即为原基频函数,将原基频函数处理后得到处理后基频模型;
将处理后基频模型和拟建空间模型合成空间模型。
进一步的,处理后基频模型通过以下步骤生成:
S1、计算出单一基频信息函数;
S2、寻找出单一基频信息函数中最具有代表特征的函数数据,包含描述振幅、频率在绝对比例上的多次出现的数据部分,后生成最具有代表特征的音频;
S3、扫描最具有代表特征的音频的谐波部分和泛音部分;
S4、对单一基频信息函数使用三分损益法建立模拟自然谐波部分和模拟自然泛音部分,生成拟建基频模型;
S5、用学习的方法扫描记录步骤S3和步骤S4的差异,并把差异建立差异函数;
S6、用差异函数对拟建基频模型进行校队补偿,得到处理后的基频模型。
优选的,空间模型和处理后音频的头文件通过逆进算法,推演获取文件中原系统开发平台的开发语言和原文件波形生成时使用的软件算法。
本发明的有益效果是:
本发明算法简单,音质效果好,该方法可以实现利用现有的2.0播放系统重放出杜比全景声64个音响系统的效果。大幅降低了经济成本。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明4D裸耳全息立体声实现方法流程图。
图2为本发明处理后音频生成流程图。
图3为本发明空间模型生成流程图。
图4为本发明处理后基频合成流程图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
如图1所示,本发明公开一种4D裸耳全息立体声实现方法,所述方法包括:
如图3所示,将一个立体声2.0音频文件分析扫描后,取得原声学空间;
从音频声波分析空间函数,即各基频的振幅、空间残响和相位信息,建立拟建空间模型;
如图2所示,从音频声波分析声波复合基频部分获取复合音色信息函数,此函数即为原基频函数,将原基频函数处理后得到处理后基频模型,其中,如图4所示,处理后基频模型通过以下步骤生成:
S1、计算出单一基频信息函数;
S2、寻找出单一基频信息函数中最具有代表特征的函数数据,包含描述振幅、频率在绝对比例上的多次出现的数据部分,后生成最具有代表特征的音频;
S3、扫描最具有代表特征的音频的谐波部分和泛音部分;
S4、对单一基频信息函数使用三分损益法建立模拟自然谐波部分和模拟自然泛音部分,生成拟建基频模型;
S5、用学习的方法扫描记录步骤S3和步骤S4的差异,并把差异建立差异函数;
S6、用差异函数对拟建基频模型进行校队补偿,得到处理后的基频模型;
将处理后基频模型和拟建空间模型合成空间模型;
将立体声2.0音频去除原声学空间,把音频声波通过数据变形,处理后建立的空间模型(4D动态声场)引导基频强制拉伸到的各个基频相对应的相位,,各个基频是指空间模型(4D动态声场)的各个基频处于原声学空间的各个基频所对应的位置的拉伸映射位置,从空间函数逆进推演检测处理前与处理后的基频变形,校正各个基频在拉升过程中产生的直流偏移信息,生成处理后音频,在此过程中,使用滤波器去除各个基频在拉伸过程中产生的相位干涉信息,使用延迟器使中频部分产生延迟,直到与高频部分同步播出,使用延迟器使低频部分产生延迟,直到与中高频部分同步播出;
将处理后音频与空间模型合成,生成4D裸耳全息立体声音频文件;
使用在具有至少两个扬声器的声音再现系统中播放4D裸耳全息立体声音频文件。
空间模型和处理后音频的头文件通过逆进算法,推演获取文件中原系统开发平台的开发语言和原文件波形生成时使用的软件算法。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的权利要求保护范围之内。

Claims (8)

1.4D裸耳全息立体声实现方法,其特征在于,所述方法包括:
将一个立体声2.0音频文件分析扫描后,取得原声学空间;
将原声学空间处理后建立空间模型,此处空间模型即为4D动态声场;
将立体声2.0音频去除原声学空间后再进行处理得到处理后音频;
将处理后音频与空间模型合成,生成4D裸耳全息立体声音频文件;
使用在具有至少两个扬声器的声音再现系统中播放4D裸耳全息立体声音频文件。
2.根据权利要求1所述4D裸耳全息立体声实现方法,其特征在于,处理后音频通过以下步骤生成:
将立体声2.0音频去除原声学空间,把音频声波通过数据变形,通过处理后建立的空间模型引导基频强制拉伸到的各个基频相对应的相位,各个基频是指空间模型的各个基频处于原声学空间的各个基频所对应的位置的拉伸映射位置,从空间函数逆进推演检测处理前与处理后的基频变形,校正各个基频在拉升过程中产生的直流偏移信息,生成处理后音频。
3.根据权利要求2所述4D裸耳全息立体声实现方法,其特征在于,使用滤波器去除各个基频在拉伸过程中产生的相位干涉信息。
4.根据权利要求2所述4D裸耳全息立体声实现方法,其特征在于,使用延迟器使中频部分产生延迟,直到与高频部分同步播出。
5.根据权利要求2所述4D裸耳全息立体声实现方法,其特征在于,使用延迟器使低频部分产生延迟,直到与中高频部分同步播出。
6.根据权利要求1所述4D裸耳全息立体声实现方法,其特征在于,空间模型通过以下步骤生成:
从音频声波分析各基频的振幅、空间残响和相位信息,建立拟建空间模型;
从音频声波分析声波复合基频部分获取复合音色信息函数,此函数即为原基频函数,将原基频函数处理后得到处理后基频模型;
将处理后基频模型和拟建空间模型合成空间模型。
7.根据权利要求6所述4D裸耳全息立体声实现方法,其特征在于,处理后基频模型通过以下步骤生成:
S1、计算出单一基频信息函数;
S2、寻找出单一基频信息函数中最具有代表特征的函数数据,包含描述振幅、频率在绝对比例上的多次出现的数据部分,后生成最具有代表特征的音频;
S3、扫描最具有代表特征的音频的谐波部分和泛音部分;
S4、对单一基频信息函数使用三分损益法建立模拟自然谐波部分和模拟自然泛音部分,生成拟建基频模型;
S5、用学习的方法扫描记录步骤S3和步骤S4的差异,并把差异建立差异函数;
S6、用差异函数对拟建基频模型进行校队补偿,得到处理后的基频模型。
8.根据权利要求1所述4D裸耳全息立体声实现方法,其特征在于,空间模型和处理后音频的头文件通过逆进算法,推演获取文件中原系统开发平台的开发语言和原文件波形生成时使用的软件算法。
CN201510468234.3A 2015-07-30 2015-07-30 4d裸耳全息立体声实现方法 Active CN105163239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510468234.3A CN105163239B (zh) 2015-07-30 2015-07-30 4d裸耳全息立体声实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510468234.3A CN105163239B (zh) 2015-07-30 2015-07-30 4d裸耳全息立体声实现方法

Publications (2)

Publication Number Publication Date
CN105163239A true CN105163239A (zh) 2015-12-16
CN105163239B CN105163239B (zh) 2017-11-14

Family

ID=54803977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510468234.3A Active CN105163239B (zh) 2015-07-30 2015-07-30 4d裸耳全息立体声实现方法

Country Status (1)

Country Link
CN (1) CN105163239B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106358129A (zh) * 2016-08-29 2017-01-25 陈立康 一种全息立体扬声器
CN108366316A (zh) * 2018-01-16 2018-08-03 中山市悦辰电子实业有限公司 一种满足杜比全景声标准实现的技术方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070160216A1 (en) * 2003-12-15 2007-07-12 France Telecom Acoustic synthesis and spatialization method
CN202353812U (zh) * 2011-07-15 2012-07-25 郝立 3d幻音
CN102752691A (zh) * 2012-07-30 2012-10-24 郝立 一种音频处理技术、3d幻音及其应用
CN102883245A (zh) * 2011-10-21 2013-01-16 郝立 3d幻音
CN203206451U (zh) * 2012-07-30 2013-09-18 郝立 一种3d音频处理系统
CN104378728A (zh) * 2014-10-27 2015-02-25 常州听觉工坊智能科技有限公司 立体声音频处理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070160216A1 (en) * 2003-12-15 2007-07-12 France Telecom Acoustic synthesis and spatialization method
CN202353812U (zh) * 2011-07-15 2012-07-25 郝立 3d幻音
CN102883245A (zh) * 2011-10-21 2013-01-16 郝立 3d幻音
CN102752691A (zh) * 2012-07-30 2012-10-24 郝立 一种音频处理技术、3d幻音及其应用
CN203206451U (zh) * 2012-07-30 2013-09-18 郝立 一种3d音频处理系统
CN104378728A (zh) * 2014-10-27 2015-02-25 常州听觉工坊智能科技有限公司 立体声音频处理方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106358129A (zh) * 2016-08-29 2017-01-25 陈立康 一种全息立体扬声器
CN106358129B (zh) * 2016-08-29 2019-06-11 陈立康 一种全息立体扬声器
CN108366316A (zh) * 2018-01-16 2018-08-03 中山市悦辰电子实业有限公司 一种满足杜比全景声标准实现的技术方法

Also Published As

Publication number Publication date
CN105163239B (zh) 2017-11-14

Similar Documents

Publication Publication Date Title
US10021507B2 (en) Arrangement and method for reproducing audio data of an acoustic scene
CN100586227C (zh) 立体声扩展网络中的输出均衡
JP4508295B2 (ja) 収音及び再生システム
KR101533347B1 (ko) 다중 오디오 채널의 재생을 강화하는 방법
JP5611970B2 (ja) オーディオ信号を変換するためのコンバータ及び方法
US8666081B2 (en) Apparatus for processing a media signal and method thereof
JP5691130B2 (ja) 聴者を取り囲むように配置される複数のスピーカで音響再生を行う際にクロストークをキャンセルする装置、方法、プログラム、およびシステム
JP4478220B2 (ja) 音場補正回路
CN103609143A (zh) 用于捕获和回放源自多个声音源的声音的方法
JP2645731B2 (ja) 音像定位再生方式
JPH0823600A (ja) 音空間効果方法および装置
JP5338053B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
US20200059750A1 (en) Sound spatialization method
CN102752691A (zh) 一种音频处理技术、3d幻音及其应用
CN105163239B (zh) 4d裸耳全息立体声实现方法
CN203206451U (zh) 一种3d音频处理系统
JP5281695B2 (ja) 音響変換装置
Ranjan et al. Wave field synthesis: The future of spatial audio
KR100275779B1 (ko) 5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하는 장치 및 방법
JPH06217400A (ja) 音響装置
JP2008219562A (ja) 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム
CN1144224C (zh) 耳前声波记录生成空间声信号的方法
JP5743003B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
CN104160722B (zh) 用于声音空间化的听觉传输合成方法
JP5590169B2 (ja) 波面合成信号変換装置および波面合成信号変換方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160425

Address after: 302, room 5, building 205, Wangjiang West Road, Shushan District, Anhui, Hefei, 230000

Applicant after: Hao Li

Address before: 302, room 5, building 205, Wangjiang West Road, Shushan District, Anhui, Hefei, 230000

Applicant before: Hao Li

Applicant before: HEFEI AISEN ACOUSTIC TECHNOLOGY CO., LTD.

GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Hao Li

Inventor before: Hao Li

Inventor before: Zhu Qian

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180119

Address after: High tech Zone Hefei city Anhui province 230000 Tianzhi Road No. 19 North Building 2216, room 2256, 2226, 2236

Patentee after: Hefei Wan Lai dock film and Television Technology Co., Ltd.

Address before: 302, room 5, building 205, Wangjiang West Road, Shushan District, Anhui, Hefei, 230000

Patentee before: Hao Li