CN102768836B - 用于编码和解码具有各种声道的多对象音频信号的设备和方法 - Google Patents
用于编码和解码具有各种声道的多对象音频信号的设备和方法 Download PDFInfo
- Publication number
- CN102768836B CN102768836B CN201210227885.XA CN201210227885A CN102768836B CN 102768836 B CN102768836 B CN 102768836B CN 201210227885 A CN201210227885 A CN 201210227885A CN 102768836 B CN102768836 B CN 102768836B
- Authority
- CN
- China
- Prior art keywords
- signal
- information
- contracting
- audio
- mixed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 167
- 238000000034 method Methods 0.000 title abstract description 32
- 239000000284 extract Substances 0.000 description 30
- 238000000605 extraction Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000001502 supplementing effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010030 laminating Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000014366 other mixer Nutrition 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Abstract
提供了一种用于编码和解码多对象音频信号的设备和方法。该设备包括:缩混器,用于将音频信号缩混为一个缩混后的音频信号,并提取用于所述音频信号中的每一个的包括报头信息和空间线索信息的补充信息;编码器,用于对缩混后的音频信号进行编码;和补充信息编码器,用于生成该补充信息作为比特流。该报头信息包括用于所述音频信号中的每一个的标识信息和用于所述音频信号的声道信息。
Description
本专利申请是下列发明专利申请的分案申请:
申请号:200780043560.3
申请日:2007年10月1日
发明名称:用于编码和解码具有各种声道的多对象音频信号的设备和方法
技术领域
本发明涉及用于编码和解码多对象音频信号的设备和方法;并且,更具体地,涉及用于对具有各种声道的多对象音频信号进行编码和解码以及对形成有各种声道的多对象音频信号进行编码和解码的设备和方法。
具有各种声道的多对象音频信号是包括其每一个形成有不同声道(例如,单声道、立体声声道、和5.1声道)的多个音频对象的音频信号。
该工作得到韩国信息通信部(MIC)和/或韩国信息技术(IT)研究院(IITA)的信息技术研究和开发规划的部分支持[2005-S-403-02,“super-intelligentmultimedia anytime-anywhere realistic TV(SmaRTV)technology”]。
背景技术
根据现有技术的音频编码和解码技术使得用户能够被动收听音频内容。因此,已存在对于以下对由不同声道组成的多个音频对象进行编码和解码的设备和方法的需求,通过根据用户需求控制由不同声道组成的每一音频对象,使用各种方法合并一个音频上下文,而使得用户能够消费各种音频对象。
作为现有技术,介绍了空间音频编码(SAC)。SAC是用于将多声道音频信号表达为缩混后的(down mixed)单声道信号或缩混后的立体声信号和空间线索、传送并恢复多声道音频信号的技术。基于SAC,可以以低比特率传送高质量多声道音频信号。
然而,SAC不能编码和解码多声道多对象音频信号-例如包括其每一个由诸如单声道、立体声、和5.1声道的不同声道组成的各种对象的音频信号,因为尽管音频信号由多个声道组成,但是SAC是用于编码和解码单对象音频信号的技术。
作为另一现有技术,介绍了双耳线索编码(BCC)。BCC可编码和解码多对象信号。然而,BCC不能编码和解码由除了单声道的各种声道组成的多对象音频信号,因为在BCC中音频对象限于形成有单声道的音频对象。
如上所述,根据现有技术的音频信号编码和解码技术不能对由各种声道组成的多对象音频信号进行编码和解码,因为它们被设计为对由单声道组成的多对象信号或具有多声道的单对象音频信号进行编码和解码。所以,根据现有技术,用户必须根据音频信号编码和解码技术来被动收听音频上下文。
所以,已存在对于以下对由各种声道组成的多个音频对象进行编码和解码的设备和方法的需求,通过根据用户需求控制其每一个具有不同声道的每一音频对象,使用各种方法混合一个音频内容,以便消费各种音频对象。
发明内容
技术问题
本发明的实施例旨在提供一种用于对具有各种声道的多对象音频信号进行编码和解码以及对由各种声道组成的多对象音频信号进行编码和解码的设备和方法。
本发明的其他目的和优点可通过以下描述而理解,并通过参考本发明的实施例而变得清楚。而且,对于本发明的领域的技术人员来说显而易见的是,可通过要求保护的部件及其组合来实现本发明的目的和优点。
技术方案
根据本发明的一个方面,提供了一种用于编码具有不同声道的多对象音频信号的设备,包括:缩混单元,用于将音频信号缩混为一个缩混后的音频信号,并提取用于所述音频信号中的每一个的包括报头信息和空间线索信息的补充信息;编码单元,用于对缩混后的音频信号进行编码;和补充信息编码单元,用于生成该补充信息作为比特流,其中该报头信息包括:用于所述音频信号中的每一个的标识信息;和用于所述音频信号的声道信息。
根据本发明的另一方面,提供了一种用于编码具有不同声道的多对象音频信号的方法,包括步骤:将音频信号缩混为一个缩混后的音频信号,并提取用于所述音频信号中的每一个的包括报头信息和空间线索信息的补充信息;对缩混后的音频信号进行编码;和生成该补充信息作为比特流,其中该报头信息包括:用于所述音频信号中的每一个的标识信息;和用于所述音频信号的声道信息。
根据本发明的另一方面,提供了一种用于解码由不同声道组成的多对象音频信号的设备,包括:输入信号分析单元,用于从输入的信号中恢复缩混后的音频信号,并从该输入的信号中包括的补充信息比特流中提取具有报头信息和空间线索信息的补充信息;音频对象提取单元,用于使用来自该输入信号分析单元的所提取的补充信息,来从所恢复的缩混后的音频信号中恢复每一对象的音频信号;和输出单元,用于使用该输入的信号的控制信息,来输出所恢复的每一对象的音频信号作为多对象音频信号,其中该报头信息包括:用于所述音频信号中的每一个的标识信息;和用于所述音频信号的声道信息。
根据本发明的另一方面,提供了一种用于解码由不同声道组成的多对象音频信号的方法,包括步骤:从输入的信号中恢复缩混后的音频信号,并从该输入的信号中包括的补充信息比特流中提取具有报头信息和空间线索信息的补充信息;使用所提取的补充信息,来从所恢复的缩混后的音频信号中恢复每一对象的音频信号;和使用该输入的信号的控制信息,来输出所恢复的每一对象的音频信号作为多对象音频信号,其中该报头信息包括:用于所述音频信号中的每一个的标识信息;和用于所述音频信号的声道信息。
根据本发明的另一方面,提供了一种用于解码由不同声道组成的多对象音频信号的设备,包括:输入信号分析单元,用于从输入的信号中恢复缩混后的音频信号,并从该输入的信号中包括的补充比特流中提取包括报头信息和空间线索信息的补充信息;补充信息控制单元,用于使用该输入的信号的控制信息,来控制所提取的补充信息;和输出单元,用于使用所控制的补充信息,来输出所恢复的缩混后的音频信号作为多对象音频信号,其中该报头信息包括:用于所述音频信号中的每一个的标识信息;和用于所述音频信号的声道信息。
根据本发明的另一方面,提供了一种用于解码由不同声道组成的多对象音频信号的方法,包括步骤:从输入的信号中恢复缩混后的音频信号,并从该输入的信号中包括的补充比特流中提取包括报头信息和空间线索信息的补充信息;使用该输入的信号的控制信息,来控制所提取的补充信息;和使用所控制的补充信息,来输出所恢复的缩混后的音频信号作为多对象音频信号,其中该报头信息包括:用于所述音频信号中的每一个的标识信息;和用于所述音频信号的声道信息。
有利效果
根据本发明实施例的用于对具有各种声道的多对象音频信号进行编码和解码以及对由各种声道组成的多对象音频信号进行编码和解码的设备和方法通过有效编码和解码由不同声道组成的包括各种音频对象的音频内容,而使得用户能够根据其需求来主动消费音频内容。
附图说明
图1是图示了根据本发明示范实施例的用于编码多对象音频信号的设备的图。
图2是描绘了图1中示出的单声道缩混器的图。
图3是示出了图1的立体声声道缩混器的图。
图4是图1的多声道缩混器的图。
图5是图示了图1的第二缩混器的图。
图6是示出了从图1的补充信息编码器生成的补充信息比特流的结构的图。
图7是图示了图6中示出的补充信息比特流的结构的详细图。
图8是图示了根据本发明另一实施例的图6中示出的补充信息比特流的结构的详细图。
图9是图示了根据本发明实施例的用于解码多对象音频信号的设备的框图。
图10是图示了根据本发明另一实施例的用于解码多对象音频信号的设备的框图。
图11是根据本发明实施例的用于使用图1的设备来编码多对象音频信号的方法的流程图。
图12是根据本发明实施例的用于使用图9的设备来解码多对象音频信号的方法的流程图。
图13是根据本发明另一实施例的用于使用图10的设备来解码多对象音频信号的方法的流程图。
具体实施方式
通过下面阐明的参考附图对实施例进行的以下描述,本发明的优点、特征和方面将变得清楚。
图1是图示了根据本发明实施例的用于编码多对象音频信号的设备的图。例如,根据本实施例的设备接收多声道音频对象,例如单声道音频对象、立体声声道音频对象、以及5.1声道音频对象。
如图1中所示,根据本实施例的多对象音频编码设备包括第一缩混器101、第二缩混器103、音频编码器105、和补充信息编码器107、以及多路复用器109。
第一缩混器101包括单声道缩混器111、立体声声道缩混器113、和多声道缩混器115。
第一缩混器101使用输入的音频对象的报头信息而将输入的各种声道多对象音频信号标识为单声道音频对象、立体声声道音频对象、以及多声道音频信号。然后,第一缩混器101通过对应声道来对标识的音频信号进行分组。所以,通过声道对多对象音频信号的不同声道进行分组,而分组后的音频对象由对应缩混器111、113和115进行缩混。
第一缩混器101还从输入的音频对象中提取缩混后的音频信号和包括空间线索的补充信息。即,声源由同一声道分组并被输入到第一缩混器101。单声道缩混器111从单声道音频对象中提取缩混后的信号和包括空间线索的补充信息,而立体声声道缩混器113从输入的立体声声道音频对象中提取缩混后的信号和包括空间线索的补充信息。多声道缩混器115从输入的多声道音频对象(例如,5.1声道)中提取缩混后的信号和具有空间线索的补充信息。
音频编码器105对从第二缩混器103输出的第二缩混后的信号进行编码。
补充编码器107使用从第一缩混器101输出的补充信息和从第二缩混器103输出的补充信息来生成补充信息比特流。这里,将参考图6来描述补充比特流中包括的信息。
多路复用器109通过对来自音频编码器105的编码后的信号和从补充编码器107生成的补充比特流进行多路复用,而生成要传送到解码设备的比特流。
从第一缩混器101输出的第一缩混后的信号是立体声信号或单声道信号。即,从单声道缩混器111输出的缩混后的信号是单声道信号,而从其余混音器113和115输出的缩混后的信号是单声道信号或立体声信号。
第二缩混器103对从第一缩混器101输出的第一缩混后的信号进行缩混,并输出第二缩混后的信号。第二缩混器103提取在第二缩混过程中分析的包括空间线索的补充信息。第二缩混后的信号根据模式是单声道信号或立体声信号。
补充信息包括用于恢复和控制空间线索和音频信号的报头信息。将参考图6来描述补充信息。
图2是描绘了图1中示出的单声道缩混器的图。例如,单声道缩混器111接收N个单声道音频对象m1到mN。
如图2中所示,单声道缩混器111包括层叠(cascade)结构的第一基本缩混器201a到201d。
根据单声道音频对象的数目来判断单声道缩混器111中包括的第一基本缩混器201a到201b的数目。即,如果单声道音频对象为N,则第一基本缩混器201的数目为N-1。如果单声道音频对象为1,则旁路(bypassed)输入信号,而没有基本缩混器。
在本实施例中,可基于层叠方法使用一个第一基本缩混器N-1次。
基本上,第一基本缩混器对两个输入信号进行缩混,生成一个缩混后的单声道信号,并对于该输入信号提取包括空间线索的补充信息。第1个第一基本缩混器201a生成缩混后的单声道信号,并使用输入到单声道缩混器111的两个单声道音频对象来提取包括空间线索的补充信息。第2个第一基本缩混器201b生成缩混后的单声道信号,并使用从第1个第一基本缩混器201a输出的缩混后的单声道信号和输入到单声道缩混器111的单声道音频对象来提取包括空间线索的补充信息。第(N-1)个第一基本缩混器生成缩混后的单声道信号,并使用从第(N-2)个基本缩混器(未示出)输出的缩混后的单声道信号和输入到单声道缩混器111的单声道音频对象来提取包括空间线索的补充信息。
空间线索是用于编码和解码音频信号的信息。空间线索是从频域提取的,并包括有关输入到第一基本缩混器201的两个信号之间的幅度差、延迟差、和相关性的信息。例如,根据本实施例的空间线索包括声道声级差(CLD)、声道间声级差(ICLD)、声道间时间差(ICTD)、声道间相关性(ICC)、以及音频信号之间的虚拟源位置信息,表示音频信号的功率增益信息。然而,本发明不限于此。
补充信息包括用于恢复和控制空间线索和音频信号的报头信息。将参考图6来描述补充信息。
图3是示出了图1的立体声声道缩混器的图。例如,该立体声声道缩混器接收M个左信号SL1到SLM以及M个右信号SR1到SRM作为立体声音频对象。
输入到立体声声道缩混器113的立体声音频对象被划分为左立体声信号和右立体声信号,并且所划分的信号被再次分组。
如图3中所示,立体声声道缩混器113包括多个第一基本缩混器201。立体声声道缩混器113需要2*(M-1)个第一基本缩混器201,以对M个左信号和M个右信号进行缩混。这里,可在另一实施例中使用一个第一基本缩混器2*(M-1)次。
如图3中所示,用于分析M个左信号的(M-1)个第一基本缩混器201la到201le通过分析输入的信号而生成一个混音后的左信号,并提取包括空间线索的补充信息。
如图3中所示,用于分析M个右信号的(M-1)个第一基本缩混器201ra到201re通过分析输入的信号而生成一个混音后的右信号,并提取包括空间线索的补充信息。
如图3中所示,如果立体声音频对象为1,则可旁路输入的左信号和右信号。
立体声声道缩混器113输出立体声缩混信号,并通过生成缩混后的左信号和缩混后的右信号而提取包括空间线索的补充信息。
补充信息包括用于恢复和控制空间线索和音频信号的报头信息。将参考图6来描述补充信息。
图4是图1的多声道缩混器的图。例如,该多声道缩混器接收P个5.1声道音频对象。
如图4中所示,多声道缩混器115是采用MPEG环绕或空间音频编码(SAC)的缩混器。多声道缩混器115从多声道音频信号中提取包括空间线索的补充信息,并将音频信号缩混为单声道缩混后音频信号或立体声缩混后音频信号。
即,多声道缩混器115从P个多声道音频对象中提取空间线索,并传送所提取的空间线索。多声道缩混器115还将音频信号缩混为单声道信号或立体声信号。一般来说,多声道音频对象为一。
图5是图示了图1的第二缩混器的图。
第二缩混器103对从第一缩混器101输出的信号再次进行缩混,输出立体声缩混信号,并提取包括空间线索的补充信息。
如图5所示,第二缩混器103包括第一基本缩混器201f和201g以及第二基本缩混器501。
如果来自立体声声道缩混器113和多声道缩混器115的缩混后信号是立体声信号,则将对应的缩混后立体声信号分组为左信号和右信号,并且第一基本缩混器201f和201g对分组后的左信号和分组后的右信号进行缩混。从第一基本缩混器201f和201g输出的缩混后的单声道信号是左信号和右信号的代表性缩混信号。
即,第一基本缩混器201f对由立体声声道缩混器113缩混和输出的左信号和由多声道缩混器115缩混和输出的左信号再次进行缩混,并输出一个缩混后的左信号作为代表性左信号。然后,第一基本缩混器201f提取补充信息。
第一基本缩混器201g对由立体声声道缩混器113缩混和输出的右信号和由多声道缩混器115缩混和输出的右信号再次进行缩混,并输出一个代表性右信号。然后,第一基本缩混器201g提取补充信息。
如图2中所示,根据另一实施例,可使用一个第一基本缩混器两次。
第二基本缩混器501对从单声道缩混器111输出的缩混后的单声道信号和从第一基本缩混器201f和201g输出的左代表性缩混信号和右代表性缩混信号进行缩混,并输出整个缩混后的左信号和右信号。然后,第二基本缩混器501提取包括空间线索的补充信息。
补充信息包括用于恢复和控制空间线索和音频信号的报头信息。稍后将参考图6描述补充信息。
第一基本缩混器201和第二基本缩混器501基于以下方程1和方程2对输入音频信号进行缩混。
在方程1和方程2中,是用于控制输入音频信号的缩混声级的加权因子。是作为第一基本缩混器201和第二基本缩混器501的输入音频信号的单声道信号或立体声左和右信号。下标b是表示子带的索引,并且每一加权因子由子带定义。
可根据输入音频对象的表达目的而不同地定义加权因子。例如,的加权因子可被定义为相对大的值,以便将单声道信号编码为主信号。如果方程1中的 则缩混后的信号是即,被缩混为主信号。
可根据缩混后信号的表达目的的限制条件来判断加权因子。该限制条件是用于声音场景(sound scene)的限制条件。例如,小提琴和吉他的加权因子被设置为0.7和0.3,以便从缩混后的音频信号按照小提琴和吉他比率0.7和0.3来重放小提琴和吉他的音频信号。基于来自例如系统或用户的外部装置的输入来判断限制条件信息。
其间,加权因子必须被反映为空间线索声级信息。例如,如果将CLD用作空间线索,则可象用于方程1的方程3那样预测空间线索信息。
在方程3中,P()是功率运算符,而可使用来计算信号功率之和。Ab和Ab+1表示子带的边界。
第二基本缩混器501提取空间线索-MPEG环绕的三到二(TTT)盒。
图6是示出了从图1的补充信息编码器生成的补充信息比特流的结构的图。
如图6中所示,补充比特流包括报头信息和空间线索。
报头信息包括用于恢复和再现由各种声道组成的多对象音频信号的信息。报头信息还通过定义音频对象的声道信息和对应音频对象的ID来提供用于单声道、立体声、多声道音频对象的解码信息。例如,可定义分类ID和每一对象的信息,以标识编码后的预定音频对象是单声道音频信号还是立体声音频信号。在实施例中,报头信息包括空间音频编码(SAC)报头信息、音频对象信息、和预置信息。
在实施例中,SAC报头信息是在基于空间线索和时隙信息编码音频信号的过程中生成的信息。当第一和第二缩混器101和103提取补充信息时,第一和第二缩混器101和103提取SAC报头信息。
在实施例中,音频对象信息包括用于标识缩混后的音频对象是单声道、立体声还是多声道音频对象的信息和对象ID信息。例如,音频对象信息包括有关每一声道的音频对象的数目的信息(单声道音频对象数目、立体声音频对象数目、和多声道音频对象数目)和每一声道的音频对象的索引信息,该索引信息包括音频对象是单声道、立体声还是多声道的ID和信息。
在本实施例中,预置信息是报头信息的补充信息,并包括所定义的每一对象的控制信息。
例如,预置信息包括预置模式信息和预置模式支持信息。预置模式信息例如包括卡拉OK模式、诸如提取吉他演奏音频对象和提取钢琴演奏音频对象的独奏对象提取模式、偏好渲染信息、和重放模式设置信息。
例如,预置模式支持信息包括用于支持卡拉OK模式的嗓音索引信息、用于支持独奏对象提取模式的对应对象索引信息、用于支持偏好渲染的诸如旋转、提升、和速度的用于每一对象的渲染信息、以及用于支持基本立体声和多声道重放模式设置的用于每一音频对象的最佳渲染信息。
而且,补充信息中包括的空间线索包括输入的多对象音频信号的每一对象的空间线索信息。
可根据设计者的选择按照各种方式来形成该补充信息的格式。
图7是图示了图6中示出的补充信息比特流的结构的详细图。即,图7示出了用于由单声道和立体声声道组成的多对象音频信号的补充信息。
如图7中所示,报头信息包括有关每一声道的音频对象的数目的信息,例如单声道音频对象的数目和立体声音频对象的数目。报头信息还包括有关每一声道的音频对象的索引信息,包括有关ID的信息和有关音频对象是单声道、立体声、还是多声道的信息。而且,补充比特流包括空间线索。作为示例,CDL或ICC被用作图7中示出的实施例中的空间线索的示例。
如图7中所示,补充信息包括与单声道和立体声对象中的每一个对应的例如CLD或ICC的空间线索。即,与输入音频对象对应的空间线索信息包括所有补充信息。
图8是图示了根据本发明另一实施例的图6中示出的补充信息比特流的结构的详细图。即,图8示出了用于由单声道、立体声、和多声道组成的多对象音频信号的补充信息。
如图8中所示,报头信息包括有关每一声道的音频对象的数目的信息,例如单声道音频对象的数目、立体声音频对象的数目、和多声道音频对象的数目。报头信息还包括每一声道的音频对象的索引信息,诸如ID以及音频对象是单声道、立体声、还是多声道。而且,补充比特流包括空间线索。作为空间线索的示例,在图8的示例中使用CLD和ICC。
通过对多声道对象的空间线索与单声道和立体声对象的空间线索进行层叠多路复用,可将多声道对象的空间线索表达为一个补充比特流。由单声道缩混器111、立体声声道缩混器113、和第二缩混器103提取的空间线索是用于图8的单声道和立体声音频对象的空间线索。而且,图8的多声道音频对象的空间线索是由多声道缩混器115提取的空间线索。
图9是图示了根据本发明实施例的用于解码多对象音频信号的设备的框图。
根据本实施例的多对象音频信号解码设备通过从图1中示出的多对象音频信号编码设备生成的音频比特流中提取空间线索信息并使用提取的空间线索预测每一声道信息,来恢复由各种声道组成的多对象音频信号,该多对象音频信号是包括单声道音频对象、立体声音频对象、和多声道音频对象的音频信号。
如图9中所示,根据本实施例的多对象音频信号解码设备包括解多路复用器(DEMUX)901、音频解码器903、补充信息分析器905、音频对象提取器907、和渲染处理器909。
例如,解多路复用器901从图1的多对象音频信号编码设备生成的音频比特流中分离出音频信息比特流和补充信息比特流。
音频解码器903从来自解多路复用器901的分离的音频信息比特流中恢复缩混后的音频信号。
补充信息分析器905从来自解多路复用器901的补充比特流中提取包括每一音频对象的空间线索信息的补充信息。
音频对象提取器907使用来自补充信息分析器905的提取的补充信息的报头信息,来从缩混后的音频信号恢复每一对象的音频信号。由于报头信息包括诸如单声道音频对象的数目、立体声音频对象的数目、和多声道音频对象的数目的有关每一声道的音频对象的数目的信息以及诸如ID和音频对象是单声道音频对象、立体声音频对象、还是多声道音频对象的每一音频对象的索引信息,所以音频对象提取器907可基于从补充信息分析器905提取的补充信息的报头信息和空间线索信息,来从音频解码器903输出的缩混后的音频信号中恢复每一对象的音频信号。
渲染处理器909对于从音频对象提取器907输出的所恢复的音频对象中的每一个从外部装置接收诸如空间音频对象的位置和尺寸的渲染控制信息和诸如5.1或7.1声道或立体声的输出声道控制信息。基于该渲染控制信息和该输出声道控制信息,渲染处理器909安排所恢复的每一对象的音频信号并输出该音频信号。
图10是图示了根据本发明另一实施例的用于解码多对象音频信号的设备的框图。与用于渲染根据每一对象恢复的音频信号的图9的解码设备不同,图10中所示的根据另一实施例的多对象音频信号解码设备通过控制补充信息并根据控制的补充信息渲染音频对象,来恢复音频信号。
如图10中所示,根据另一实施例的多对象音频信号解码设备包括解多路复用器901、音频解码器903、补充信息分析器905、补充信息控制器1001、和SAC解码器1003。
图10的解多路复用器901、音频解码器903、和补充信息分析器905与图9的解多路复用器901、音频解码器、和补充信息分析器905相同。
补充信息控制器1001对于从音频解码器903恢复的缩混后的音频信号从外部装置接收诸如空间音频对象的位置和尺寸的渲染控制信息和诸如5.1或7.1声道和立体声的输出声道控制信息,并根据外部输入信号控制从补充信息分析器905提取的诸如每一音频对象的信号幅度和相关性信息的补充信息。
SAC解码器1003使用来自补充信息控制器1001的受控制的补充信息,来从音频解码器903恢复的缩混后的音频信号中恢复多声道多对象音频信号。SAC解码器1003使用来自补充信息控制器1001的受控制的补充信息的报头信息,来从缩混后的音频信号中恢复每一对象的音频信号。由于报头信息包括诸如单声道音频对象的数目、立体声音频对象的数目、和多声道音频对象的数目的有关每一声道的音频对象的数目的信息以及诸如ID和音频对象是单声道音频对象、立体声音频对象、还是多声道音频对象的每一音频对象的索引信息,所以SAC解码器103可基于从补充信息控制器1001控制的补充信息的报头信息和空间线索信息,来从音频解码器903输出的缩混后的音频信号中恢复每一对象的音频信号。
图11是根据本发明实施例的用于使用图1的设备来编码多对象音频信号的方法的流程图。
参考图11,在步骤S1101中,输入的各种声道的多对象音频信号基于输入音频对象的报头信息被分类为单声道音频信号、立体声音频信号、和多声道音频信号,并通过每一声道分组。
在步骤S 1103中,对同一声道所分组的声源进行缩混,并提取包括空间线索的补充信息。即,从输入的单声道音频对象中提取缩混后的信号和包括空间线索的补充信息,从输入的立体声音频对象中提取缩混后的信号和包括空间线索的补充信息,并从例如5.1声道的输入的多声道音频对象中提取缩混后的信号和包括空间线索的补充信息。
在步骤S 1103中输出的第一缩混后的信号是立体声信号或单声道信号。即,从输入的单声道音频对象输出的缩混后的信号是单声道信号,而从输入的立体声音频对象或输入的多声道音频对象输出的缩混后的信号是单声道信号或立体声信号。
然后,在步骤S1105中,第一缩混后的信号被再次缩混,并且提取包括空间线索的补充信息。这里,第二缩混后的信号根据模式可以是单声道信号或立体声信号。
然后,在步骤S1107中,对步骤S1105中输出的第二缩混后的信号进行编码。
在步骤S1109中,使用在步骤S1103中输出的补充信息和在步骤S1105中输出的补充信息,来生成补充信息比特流。
在步骤S1111中,通过对从步骤S1107生成的补充信息比特流进行多路复用,而生成要传送到解码设备的比特流。
图12是根据本发明实施例的用于使用图9的设备来解码多对象音频信号的方法的流程图。
参考图12,在步骤S1201中,从步骤S1111生成的音频比特流中分离出音频信息比特流和补充信息比特流。
在步骤S1203中,从分离的音频信息比特流中恢复缩混后的音频信号。
在步骤S1205中,从分离的比特流中提取包括每一音频对象的空间线索信息的补充信息。
在步骤S1207中,使用提取的补充信息的报头信息来从缩混后的音频信号中恢复每一对象的音频信号。由于报头信息包括诸如单声道音频对象的数目、立体声音频对象的数目、和多声道音频对象的数目的有关每一声道的音频对象的数目的信息以及诸如ID和音频对象是单声道音频对象、立体声音频对象、还是多声道音频对象的每一音频对象的索引信息,所以可基于在步骤S 1205中提取的所提取的补充信息的报头信息和空间线索信息,来从步骤S 1203中输出的缩混后的音频信号中恢复每一对象的音频信号。
在步骤S1207中,从外部装置接收例如空间音频对象的位置和尺寸的用于每一恢复的音频对象的渲染控制信息和例如5.1或7.1声道或立体声的输出声道控制信息,并安排每一恢复的对象的音频信号,并输出多对象音频信号。
图13是根据本发明另一实施例的用于使用图10的设备来解码多对象音频信号的方法的流程图。
在步骤S1301中,从步骤S1111中生成的音频比特流中分离音频信息比特流和补充信息比特流。
在步骤S1303中,从分离的音频信息比特流中恢复缩混后的音频信号。
在步骤S1305中,从分离的补充比特流中提取包括每一音频对象的空间线索信息的补充信息。
在步骤S1307中,从外部设备接收例如空间音频对象的位置和尺寸的用于每一恢复的音频对象的渲染控制信息和例如5.1或7.1声道和立体声的输出声道控制信息,并根据外部输入信号控制从步骤S1305提取的补充信息,其中所提取的补充信息例如包括有关每一音频对象的信号幅度的信息和相关性信息。
在步骤S1309中,使用受控制的补充信息来从来自步骤S1303的缩混后的音频信号中恢复各种声道的多对象音频信号。使用受控制的补充信息的报头信息来从缩混后的音频信号中恢复每一对象的音频信号。由于报头信息包括诸如单声道音频对象的数目、立体声音频对象的数目、和多声道音频对象的数目的有关每一声道的音频对象的数目的信息以及诸如ID和音频对象是单声道音频对象、立体声音频对象、还是多声道音频对象的每一音频对象的索引信息,所以可基于来自步骤S1307的受控制的补充信息的报头信息和空间线索信息,来从步骤S1303输出的缩混后的音频信号中恢复每一对象的音频信号。
根据本发明的上述方法可被实施为程序并存储在计算机可读记录介质上。计算机可读记录介质是可存储其后可由计算机系统读取的数据的任何数据储存装置。计算机可读记录介质包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、软盘、硬盘和磁光盘。
尽管已针对某些优选实施例而描述了本发明,但是本领域技术人员将理解,可进行各种改变和变型,而不脱离以下权利要求中限定的本发明的精神和范围。
工业实用性
根据本发明实施例的用于编码和解码多对象音频信号的设备和方法通过有效编码和解码由各种声道组成的各种对象的音频内容,使得用户能够根据需求来主动消费音频内容。
Claims (5)
1.一种用于解码具有不同声道的多对象音频信号的设备,包括:
补充信息控制部件,用于使用从输入信号恢复的缩混音频信号的控制信息,来控制从该输入信号提取的补充信息,其中该控制信息包括用于所恢复的缩混音频信号的渲染控制信息;和
输出部件,用于使用该补充信息控制部件所控制的补充信息,来输出所恢复的缩混音频信号作为多声道音频信号,其中
该补充信息包括用于所述具有不同声道的多对象音频信号的单声道、立体声声道、和多声道之一的音频对象的空间线索信息。
2.根据权利要求1的设备,其中该补充信息进一步包括用于所述具有不同声道的多对象音频信号的预置信息。
3.根据权利要求2的设备,其中该预置信息包括:
预置模式信息,用于定义用于所述具有不同声道的多对象音频信号的预置模式;和
预置模式支持信息,用于定义用于支持所述预置模式所需的信息。
4.根据权利要求1的设备,其中该补充信息进一步包括:
用于所述具有不同声道的多对象音频信号中的每一个的标识信息;和
用于所述具有不同声道的多对象音频信号的声道信息。
5.根据权利要求4的设备,其中该声道信息包括:
用于所述具有不同声道的多对象音频信号中的每一个的声道信息;和
用于所述具有不同声道的多对象音频信号的每一声道的多个音频对象的信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20060096172 | 2006-09-29 | ||
KR10-2006-0096172 | 2006-09-29 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800435603A Division CN101617360B (zh) | 2006-09-29 | 2007-10-01 | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102768836A CN102768836A (zh) | 2012-11-07 |
CN102768836B true CN102768836B (zh) | 2014-11-05 |
Family
ID=39230399
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210227885.XA Active CN102768836B (zh) | 2006-09-29 | 2007-10-01 | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 |
CN2007800435603A Active CN101617360B (zh) | 2006-09-29 | 2007-10-01 | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 |
CN201210227837.0A Active CN102768835B (zh) | 2006-09-29 | 2007-10-01 | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800435603A Active CN101617360B (zh) | 2006-09-29 | 2007-10-01 | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 |
CN201210227837.0A Active CN102768835B (zh) | 2006-09-29 | 2007-10-01 | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 |
Country Status (6)
Country | Link |
---|---|
US (4) | US8364497B2 (zh) |
EP (3) | EP2100297A4 (zh) |
JP (3) | JP5451394B2 (zh) |
KR (1) | KR100917843B1 (zh) |
CN (3) | CN102768836B (zh) |
WO (1) | WO2008039038A1 (zh) |
Families Citing this family (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007091870A1 (en) | 2006-02-09 | 2007-08-16 | Lg Electronics Inc. | Method for encoding and decoding object-based audio signal and apparatus thereof |
WO2008046530A2 (en) * | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
DE602007013415D1 (de) | 2006-10-16 | 2011-05-05 | Dolby Sweden Ab | Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung |
AU2007322488B2 (en) * | 2006-11-24 | 2010-04-29 | Lg Electronics Inc. | Method for encoding and decoding object-based audio signal and apparatus thereof |
EP2595152A3 (en) * | 2006-12-27 | 2013-11-13 | Electronics and Telecommunications Research Institute | Transkoding apparatus |
CA2645915C (en) * | 2007-02-14 | 2012-10-23 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
ATE526663T1 (de) | 2007-03-09 | 2011-10-15 | Lg Electronics Inc | Verfahren und vorrichtung zum verarbeiten eines audiosignals |
KR20080082916A (ko) * | 2007-03-09 | 2008-09-12 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
JP2010538571A (ja) * | 2007-09-06 | 2010-12-09 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
WO2009093866A2 (en) | 2008-01-23 | 2009-07-30 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2009093867A2 (en) | 2008-01-23 | 2009-07-30 | Lg Electronics Inc. | A method and an apparatus for processing audio signal |
CN102007533B (zh) * | 2008-04-16 | 2012-12-12 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
EP2111060B1 (en) | 2008-04-16 | 2014-12-03 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
KR101061128B1 (ko) | 2008-04-16 | 2011-08-31 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
US8326446B2 (en) | 2008-04-16 | 2012-12-04 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
KR20090110242A (ko) | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 신호를 처리하는 방법 및 장치 |
KR101724326B1 (ko) * | 2008-04-23 | 2017-04-07 | 한국전자통신연구원 | 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체 |
KR101596504B1 (ko) * | 2008-04-23 | 2016-02-23 | 한국전자통신연구원 | 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체 |
KR102149019B1 (ko) * | 2008-04-23 | 2020-08-28 | 한국전자통신연구원 | 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체 |
WO2010008200A2 (en) | 2008-07-15 | 2010-01-21 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
JP5258967B2 (ja) * | 2008-07-15 | 2013-08-07 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
EP2169664A3 (en) | 2008-09-25 | 2010-04-07 | LG Electronics Inc. | A method and an apparatus for processing a signal |
WO2010036059A2 (en) | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
KR101108060B1 (ko) * | 2008-09-25 | 2012-01-25 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
US9412126B2 (en) * | 2008-11-06 | 2016-08-09 | At&T Intellectual Property I, Lp | System and method for commercializing avatars |
KR101129974B1 (ko) * | 2008-12-22 | 2012-03-28 | (주)오디즌 | 객체 기반 오디오 컨텐츠 생성/재생 방법 및 그 장치 |
US8332229B2 (en) * | 2008-12-30 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte. Ltd. | Low complexity MPEG encoding for surround sound recordings |
WO2010085083A2 (en) | 2009-01-20 | 2010-07-29 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
WO2010087627A2 (en) * | 2009-01-28 | 2010-08-05 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
KR101283783B1 (ko) * | 2009-06-23 | 2013-07-08 | 한국전자통신연구원 | 고품질 다채널 오디오 부호화 및 복호화 장치 |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
WO2011013381A1 (ja) * | 2009-07-31 | 2011-02-03 | パナソニック株式会社 | 符号化装置および復号装置 |
US20110054917A1 (en) * | 2009-08-28 | 2011-03-03 | Electronics And Telecommunications Research Institute | Apparatus and method for structuring bitstream for object-based audio service, and apparatus for encoding the bitstream |
KR102020334B1 (ko) | 2010-01-19 | 2019-09-10 | 돌비 인터네셔널 에이비 | 고조파 전위에 기초하여 개선된 서브밴드 블록 |
WO2011104146A1 (en) * | 2010-02-24 | 2011-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program |
CN102222503B (zh) * | 2010-04-14 | 2013-08-28 | 华为终端有限公司 | 一种音频信号的混音处理方法、装置及系统 |
KR101615776B1 (ko) * | 2010-05-28 | 2016-04-28 | 한국전자통신연구원 | 상이한 분석 단계를 사용하는 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법 |
KR20120071072A (ko) * | 2010-12-22 | 2012-07-02 | 한국전자통신연구원 | 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 |
KR101227932B1 (ko) * | 2011-01-14 | 2013-01-30 | 전자부품연구원 | 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법 |
KR101742136B1 (ko) | 2011-03-18 | 2017-05-31 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
CN103050124B (zh) | 2011-10-13 | 2016-03-30 | 华为终端有限公司 | 混音方法、装置及系统 |
IN2014CN03413A (zh) | 2011-11-01 | 2015-07-03 | Koninkl Philips Nv | |
EP2875510A4 (en) * | 2012-07-19 | 2016-04-13 | Nokia Technologies Oy | STEREO AUDIO SIGNAL ENCODER |
MX351193B (es) * | 2012-08-10 | 2017-10-04 | Fraunhofer Ges Forschung | Codificador, decodificador, sistema y metodo que emplean un concepto residual para codificar objetos de audio parametricos. |
CN103812824A (zh) * | 2012-11-07 | 2014-05-21 | 中兴通讯股份有限公司 | 音频多编码传输方法及相应装置 |
EP2973551B1 (en) | 2013-05-24 | 2017-05-03 | Dolby International AB | Reconstruction of audio scenes from a downmix |
CA3211308A1 (en) | 2013-05-24 | 2014-11-27 | Dolby International Ab | Coding of audio scenes |
TWI615834B (zh) * | 2013-05-31 | 2018-02-21 | Sony Corp | 編碼裝置及方法、解碼裝置及方法、以及程式 |
CN104240711B (zh) * | 2013-06-18 | 2019-10-11 | 杜比实验室特许公司 | 用于生成自适应音频内容的方法、系统和装置 |
EP2830049A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
EP2830050A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhanced spatial audio object coding |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
KR102243395B1 (ko) * | 2013-09-05 | 2021-04-22 | 한국전자통신연구원 | 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치 |
WO2015056383A1 (ja) * | 2013-10-17 | 2015-04-23 | パナソニック株式会社 | オーディオエンコード装置及びオーディオデコード装置 |
EP3444815B1 (en) * | 2013-11-27 | 2020-01-08 | DTS, Inc. | Multiplet-based matrix mixing for high-channel count multichannel audio |
KR101536855B1 (ko) * | 2014-01-23 | 2015-07-14 | 재단법인 다차원 스마트 아이티 융합시스템 연구단 | 레지듀얼 코딩을 이용하는 인코딩 장치 및 방법 |
KR101511553B1 (ko) * | 2014-02-14 | 2015-04-13 | 전자부품연구원 | 다중 단계 오디오 분리 방법 및 이를 적용한 오디오 시스템 |
CN111192595B (zh) * | 2014-05-15 | 2023-09-22 | 瑞典爱立信有限公司 | 音频信号分类和编码 |
CN110895943B (zh) | 2014-07-01 | 2023-10-20 | 韩国电子通信研究院 | 处理多信道音频信号的方法和装置 |
US9774974B2 (en) * | 2014-09-24 | 2017-09-26 | Electronics And Telecommunications Research Institute | Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion |
CN106716525B (zh) * | 2014-09-25 | 2020-10-23 | 杜比实验室特许公司 | 下混音频信号中的声音对象插入 |
CN105898667A (zh) * | 2014-12-22 | 2016-08-24 | 杜比实验室特许公司 | 从音频内容基于投影提取音频对象 |
CN106303897A (zh) * | 2015-06-01 | 2017-01-04 | 杜比实验室特许公司 | 处理基于对象的音频信号 |
US10607622B2 (en) * | 2015-06-17 | 2020-03-31 | Samsung Electronics Co., Ltd. | Device and method for processing internal channel for low complexity format conversion |
WO2016204581A1 (ko) * | 2015-06-17 | 2016-12-22 | 삼성전자 주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
WO2016204579A1 (ko) * | 2015-06-17 | 2016-12-22 | 삼성전자 주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
CN105070304B (zh) | 2015-08-11 | 2018-09-04 | 小米科技有限责任公司 | 实现对象音频录音的方法及装置、电子设备 |
ES2779603T3 (es) * | 2015-11-17 | 2020-08-18 | Dolby Laboratories Licensing Corp | Sistema y método de salida binaural paramétrico |
CN108476366B (zh) | 2015-11-17 | 2021-03-26 | 杜比实验室特许公司 | 用于参数化双耳输出系统和方法的头部跟踪 |
KR102421292B1 (ko) * | 2016-04-21 | 2022-07-18 | 한국전자통신연구원 | 오디오 객체 신호 재생 시스템 및 그 방법 |
CA3045847C (en) * | 2016-11-08 | 2021-06-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder |
US20200236424A1 (en) * | 2017-04-28 | 2020-07-23 | Hewlett-Packard Development Company, L.P. | Audio tuning presets selection |
GB2578715A (en) | 2018-07-20 | 2020-05-27 | Nokia Technologies Oy | Controlling audio focus for spatial audio processing |
GB2582748A (en) | 2019-03-27 | 2020-10-07 | Nokia Technologies Oy | Sound field related rendering |
KR102471718B1 (ko) * | 2019-07-25 | 2022-11-28 | 한국전자통신연구원 | 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1442956A (zh) * | 2002-03-01 | 2003-09-17 | 汤姆森许可贸易公司 | 数字信息信号的编码和解码方法及设备 |
CN1457482A (zh) * | 2001-02-09 | 2003-11-19 | 索尼株式会社 | 信号再生设备和方法,信号记录设备和方法,信号接收设备以及信息处理方法 |
CN1463429A (zh) * | 2001-06-11 | 2003-12-24 | 索尼株式会社 | 数据处理装置以及数据处理方法 |
WO2005013491A2 (de) * | 2003-07-21 | 2005-02-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiodateiformatumwandlung |
EP1735777A1 (en) * | 2004-04-05 | 2006-12-27 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0717892B1 (en) | 1993-09-10 | 1998-07-22 | Rca Thomson Licensing Corporation | Real-time audio packet layer encoder |
JP2003032800A (ja) | 2001-07-17 | 2003-01-31 | Nippon Hoso Kyokai <Nhk> | スピーカ接続回路装置 |
JP2003066994A (ja) | 2001-08-27 | 2003-03-05 | Canon Inc | データ復号装置及びデータ復号方法、並びにプログラム、記憶媒体 |
WO2004036954A1 (en) | 2002-10-15 | 2004-04-29 | Electronics And Telecommunications Research Institute | Apparatus and method for adapting audio signal according to user's preference |
KR100923297B1 (ko) * | 2002-12-14 | 2009-10-23 | 삼성전자주식회사 | 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치 |
DE10344638A1 (de) | 2003-08-04 | 2005-03-10 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Erzeugen, Speichern oder Bearbeiten einer Audiodarstellung einer Audioszene |
US7805313B2 (en) | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
EP1768107B1 (en) * | 2004-07-02 | 2016-03-09 | Panasonic Intellectual Property Corporation of America | Audio signal decoding device |
US7508947B2 (en) * | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
JP3915804B2 (ja) * | 2004-08-26 | 2007-05-16 | ヤマハ株式会社 | オーディオ再生装置 |
DE102004043521A1 (de) * | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
EP1817767B1 (en) * | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
DE102005008366A1 (de) * | 2005-02-23 | 2006-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ansteuern einer Wellenfeldsynthese-Renderer-Einrichtung mit Audioobjekten |
WO2007004831A1 (en) * | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
JP5173811B2 (ja) * | 2005-08-30 | 2013-04-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
US8019611B2 (en) * | 2005-10-13 | 2011-09-13 | Lg Electronics Inc. | Method of processing a signal and apparatus for processing a signal |
CN100561576C (zh) * | 2005-10-25 | 2009-11-18 | 芯晟(北京)科技有限公司 | 一种基于量化信号域的立体声及多声道编解码方法与系统 |
WO2007080212A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Controlling the decoding of binaural audio signals |
WO2007091870A1 (en) | 2006-02-09 | 2007-08-16 | Lg Electronics Inc. | Method for encoding and decoding object-based audio signal and apparatus thereof |
DE602007013415D1 (de) * | 2006-10-16 | 2011-05-05 | Dolby Sweden Ab | Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung |
KR20080082916A (ko) | 2007-03-09 | 2008-09-12 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
-
2007
- 2007-10-01 WO PCT/KR2007/004795 patent/WO2008039038A1/en active Search and Examination
- 2007-10-01 US US12/443,644 patent/US8364497B2/en active Active
- 2007-10-01 EP EP07833110A patent/EP2100297A4/en not_active Ceased
- 2007-10-01 KR KR1020070098663A patent/KR100917843B1/ko active IP Right Grant
- 2007-10-01 EP EP12199506A patent/EP2575130A1/en not_active Ceased
- 2007-10-01 CN CN201210227885.XA patent/CN102768836B/zh active Active
- 2007-10-01 CN CN2007800435603A patent/CN101617360B/zh active Active
- 2007-10-01 EP EP12199505A patent/EP2575129A1/en not_active Ceased
- 2007-10-01 JP JP2009530277A patent/JP5451394B2/ja not_active Expired - Fee Related
- 2007-10-01 CN CN201210227837.0A patent/CN102768835B/zh active Active
-
2012
- 2012-12-20 JP JP2012278575A patent/JP5453515B2/ja not_active Expired - Fee Related
- 2012-12-20 US US13/722,176 patent/US8670989B2/en active Active
- 2012-12-20 JP JP2012278574A patent/JP5453514B2/ja not_active Expired - Fee Related
-
2013
- 2013-12-04 US US14/096,117 patent/US9311919B2/en active Active
- 2013-12-04 US US14/096,114 patent/US9257124B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1457482A (zh) * | 2001-02-09 | 2003-11-19 | 索尼株式会社 | 信号再生设备和方法,信号记录设备和方法,信号接收设备以及信息处理方法 |
CN1463429A (zh) * | 2001-06-11 | 2003-12-24 | 索尼株式会社 | 数据处理装置以及数据处理方法 |
CN1442956A (zh) * | 2002-03-01 | 2003-09-17 | 汤姆森许可贸易公司 | 数字信息信号的编码和解码方法及设备 |
WO2005013491A2 (de) * | 2003-07-21 | 2005-02-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiodateiformatumwandlung |
EP1735777A1 (en) * | 2004-04-05 | 2006-12-27 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
Non-Patent Citations (2)
Title |
---|
《The Reference Model Architecture for MPEG Spatial Audio Coding》;Herre J et al;《Audio Engineering Society Convention Paper》;20050528;1-13 * |
Herre J et al.《The Reference Model Architecture for MPEG Spatial Audio Coding》.《Audio Engineering Society Convention Paper》.2005,1-13. * |
Also Published As
Publication number | Publication date |
---|---|
CN102768835B (zh) | 2014-11-05 |
JP2010521002A (ja) | 2010-06-17 |
US20100174548A1 (en) | 2010-07-08 |
CN101617360A (zh) | 2009-12-30 |
US20140095178A1 (en) | 2014-04-03 |
WO2008039038A1 (en) | 2008-04-03 |
KR20080029940A (ko) | 2008-04-03 |
EP2100297A1 (en) | 2009-09-16 |
JP5451394B2 (ja) | 2014-03-26 |
US9311919B2 (en) | 2016-04-12 |
JP2013077023A (ja) | 2013-04-25 |
CN102768836A (zh) | 2012-11-07 |
US9257124B2 (en) | 2016-02-09 |
EP2575129A1 (en) | 2013-04-03 |
JP5453515B2 (ja) | 2014-03-26 |
JP2013054395A (ja) | 2013-03-21 |
CN102768835A (zh) | 2012-11-07 |
US8364497B2 (en) | 2013-01-29 |
KR100917843B1 (ko) | 2009-09-18 |
US20140095179A1 (en) | 2014-04-03 |
US20130110523A1 (en) | 2013-05-02 |
CN101617360B (zh) | 2012-08-22 |
EP2100297A4 (en) | 2011-07-27 |
EP2575130A1 (en) | 2013-04-03 |
JP5453514B2 (ja) | 2014-03-26 |
US8670989B2 (en) | 2014-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102768836B (zh) | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 | |
CN102171754B (zh) | 编码装置以及解码装置 | |
CN101632118B (zh) | 用于对多对象音频信号进行编码和解码的设备和方法 | |
CN101930742B (zh) | 对多声道音频信号进行编码/解码的系统和方法 | |
CN101479785B (zh) | 用于编码和解码基于对象的音频信号的方法和装置 | |
CN105580073A (zh) | 音频解码器、音频编码器、用于基于已编码表示提供至少四个音频声道信号的方法、用于基于至少四个音频声道信号提供已编码表示的方法、及使用带宽扩展的计算机程序 | |
JP4859925B2 (ja) | オーディオ信号デコーディング方法及びその装置 | |
KR20140028094A (ko) | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 | |
JP4568363B2 (ja) | オーディオ信号デコーディング方法及びその装置 | |
CN101490745B (zh) | 用于编码和解码基于对象的音频信号的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |