CN1886781B - 用于编码和解码音频信号的冲激响应的方法 - Google Patents

用于编码和解码音频信号的冲激响应的方法 Download PDF

Info

Publication number
CN1886781B
CN1886781B CN2004800348480A CN200480034848A CN1886781B CN 1886781 B CN1886781 B CN 1886781B CN 2004800348480 A CN2004800348480 A CN 2004800348480A CN 200480034848 A CN200480034848 A CN 200480034848A CN 1886781 B CN1886781 B CN 1886781B
Authority
CN
China
Prior art keywords
impulse response
mpeg
4proto
params
room
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800348480A
Other languages
English (en)
Other versions
CN1886781A (zh
Inventor
于尔根·施密特
克劳斯·艾尔茨-格林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN1886781A publication Critical patent/CN1886781A/zh
Application granted granted Critical
Publication of CN1886781B publication Critical patent/CN1886781B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0091Means for obtaining special acoustic effects
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/011Files or data streams containing coded musical information, e.g. for transmission
    • G10H2240/046File format, i.e. specific or non-standard musical file format used in or adapted for electrophonic musical instruments, e.g. in wavetables
    • G10H2240/066MPEG audio-visual compression file formats, e.g. MPEG-4 for coding of audio-visual objects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/171Transmission of musical instrument data, control or status information; Transmission, remote access or control of music data for electrophonic musical instruments
    • G10H2240/281Protocol or standard connector for transmission of analog or digital data to or from an electrophonic musical instrument
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/055Filters for musical processing or musical effects; Filter responses, filter architecture, filter coefficients or control parameters therefor
    • G10H2250/111Impulse response, i.e. filters defined or specifed by their temporal impulse response features, e.g. for echo or reverberation applications
    • G10H2250/115FIR impulse, e.g. for echoes or room acoustics, the shape of the impulse response is specified in particular according to delay times
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

通过以下步骤使传输和使用实际(即测量)房间冲激响应从而与MPEG-4标准相兼容地、以此房间特性再现声音信号成为可能:将冲激响应插入到多个连续的控制参数字段(15、16、17、18)中,尤其是params[128]阵列。第一控制参数字段(15)包含与随后字段的个数和内容有关的信息。为了呈现声音信号,分离连续的控制参数字段的内容,将其存储在节点(12)的附加存储器中,并在计算房间特性时使用。

Description

用于编码和解码音频信号的冲激响应的方法
技术领域
本发明涉及一种用于编码和解码音频信号的冲激响应的方法和设备,更具体地,一种用于描述根据MPEG-4音频标准编码为音频对象的声音源的呈现的方法和设备。
背景技术
自然回响(也缩写为回响)是由封闭房间内的反射表面导致的声音逐渐衰落的效果。由声源发出的声音撞击墙体表面并以多种角度反射。一些反射是可以立即被察觉的,而其他反射继续由其他表面反射,直到被察觉。坚硬且厚重的表面以中等衰减反射声音,而较软的表面吸收更多的声音,尤其是高频分量。房间尺寸、复杂性、墙体的角度、表面的属性和房间内容的组合定义了房间的声音特性并由此定义了回响。
由于回响是时不变效应,可以通过在记录或回放期间,将房间的冲激响应应用于音频信号来再创建。可以将房间的冲激响应理解为房间对瞬时、全频率声音脉冲的响应,为回响的形式,通常看上去像衰落的噪声。如果数字化房间冲激响应可用,数字信号处理允许在任何数字化的“枯燥(dry)”声音上添加额外的房间特性。同样,可以仅通过利用不同的房间冲激响应,将音频信号置于不同的空间中。
传输和使用实际(即测量)房间冲激响应从而以此房间特性再现声音信号已经成为近年来研究和发展的目标。使用MPEG-4音频和系统标准ISO/IEC 14496中所定义的MPEG-4,由于以下问题,传输长冲激响应是困难的:
1.可以将房间冲激响应加载到MPEG-4播放器中,作为MPEG-4“样本转储(sample dumps)”,这是一种需要全结构化音频(SA,MPEG-4音频编程语言)实现的技术,包括具有适当MIDI和SA轮廓(profile)的MIDI。这种解决方案对代码、复杂性和执行能力的要求非常高,因此目前对于MPEG-4播放器并不实际,甚至在未来的设备中也不可用。
2.通过使用“DirectiveSound”节点(尤其针对虚拟现实应用而定义)来使用合成房间冲激响应的缺点在于:这种参数合成房间冲激响应与实际测量到的房间冲激响应明显不同,并且具有非常不自然的声音。
3.由于上述现有的可能但非最优解决方案1和2,而且在任何可能的情况下,应当避免新节点的引入,添加专门设计用于传输和使用实际房间冲激响应的新节点是不必要的。
4.对房间冲激响应施加与音频信号本身相同的编码是不合理的。典型的MPEG音频编码方案利用了心理声学现象,尤其适合于通过抑制不易察觉的音频信号部分来缩减音频数据率。但是,由于房间冲激响应不与人耳相关而是与房间的特性相关,将心理声学应用于房间冲激将导致歪曲。
发明内容
本发明的目的在于提供一种用于编码音频信号的冲激响应的方法,与MPE6-4标准相兼容,但克服了上述问题。此目的通过权利要求1所述的方法来实现。
本发明基于对以下事实的认知。在MPEG-4系统标准中,所谓的AudioFX节点和AudioFXProto方案定义为描述音频效果。AudioFX节点(AudioFXProto方案)中的128个浮点值的阵列(称为params[128])用于提供控制音频效果的参数。这些参数可以在效果的持续时间内固定,或者例如,可以按照每个帧更新进行更新,以实现时间相关的效果,如淡入/淡出等。上述params[128]阵列的使用受限于每帧传输特定数量的控制参数。由于128个数值的限制,扩展信号的传输是不可能的,128个数值对于扩展冲激响应而言是极为有限的。
因此,根据本发明的、用于编码音频信号的冲激响应的方法在于以下事实:产生声源的冲激响应,并将表示所产生的冲激响应的参数插入到多个连续的控制参数字段中,尤其是连续的params[128]阵列中,其中第一控制参数字段包含与随后字段的个数和内容有关的信息。
此外,本发明的目的在于提供一种用于解码音频信号的冲激响应的对应方法。此目的通过权利要求6所述的方法来实现。
原理上,根据本发明的、用于解码音频信号的冲激响应的方法在于以下事实:从多个连续的控制参数字段(尤其是连续的params[128]阵列)中分离表示冲激响应的参数,其中第一控制参数字段包含与随后字段的个数和内容有关的信息。将分离出的参数存储在节点的附加存储器中,并在计算房间特性期间,使用所存储的参数。
本发明的其他有利实施例可以由从属权利要求、以下的描述和附图中得出。
附图说明
根据图1,对本发明的典型实施例进行了描述,图1示意性地示出了根据本发明、使用连续控制参数字段的AudioFXProto方案的、示例BIFS场景。
具体实施方式
图1所示的BIFS场景示出了MPEG-4二进制流1和MPEG-4解码器的三个处理层2、3、4。解复用/解码层2通过将三个音频信号流馈入各个音频解码器5、6、7(例如G723或AAC解码器),对其进行解码,以及使用BIFS解码器8,对BIFS流进行解码。解码后的BIFS流例示并配置音频BIFS层3,并提供在音频BIFS层3和上面的BIFS层4中、针对节点内的信号处理的信息。来自解码器5、6、7的解码音频信号流用作音频源节点9、10和11的音频输入。通过在将由AudioMix节点13下混频的信号通过Sound2D节点14馈入输出端之前,在AudioFXProto 12中施加房间冲激响应,来自音频源节点11的信号获得了额外的效果。多个连续的params[128]字段(在图中以连续的块15、16、17、18表示)用于传输完整的房间冲激响应,其中第一块15包括一般信息,如包含房间冲激响应的各个部分的后续params[128]字段的个数等。在AudioFXProto实施方式中,在开始信号处理之前,必须重新收集完整的房间冲激响应。
为了易于理解此MPEG-4特有实施例,在对本发明的实施例进行更为详细的讨论之前,给出相关MPEG-4细节的简要解释。
MPEG-4通过支持音频对象的表示,促进了多种应用。为了组合音频对象,附加信息(所谓的场景描述)确定了空间和时间上的布局,并与编码音频对象一起传输。在传输之后,对音频对象进行分离地解码,并利用场景描述进行组合,以便准备单一的表示,然后将其呈现给听众。
考虑到效率,MPEG-4系统标准ISO/IEC 14496定义了以二进制表示对场景描述进行编码的方式,所谓的场景二进制信息(BIFS)。相应地,其针对音频处理而确定的子集是所谓的AudioBIFS。场景描述是层级结构的,并且可以表示为图表,其中图表的叶节点形成了分离的对象,而其他节点描述处理,如定位、缩放、效果等。可以在场景描述节点中利用参数控制分离对象的外观和行为。
所谓的AudioFX定义为根据音频编程语言“结构化音频”(SA)来描述音频效果。应用结构化音频需要较高的处理能力,并且需要结构化音频编译器或解译器,限制了在处理能力和实现复杂度受到限制的产品中的应用。
但是,通过使用MPEG 4系统标准中所定义的Proto机制,可以实现简化,所述Proto机制是针对BIFS语言的专用宏机制。针对消费产品,定制AudioFXProto方案,并允许没有结构化音频能力的播放器使用基本的音频效果。PROTO应当封装AudioFX节点,从而使具有结构化音频能力的增强MPEG 4播放器能够直接解码SA令牌流。较为简单的消费播放器只识别效果,并在可用时,从内部效果表示开始。AudioFXProto方案的一个字段是params[128]字段。此字段通常包含用于效果的实时控制的参数。本发明现在使用针对此params[128]字段(受限于128个浮点值的数据块长度(32位浮点))的多个连续字段更新,以便将长度大于128个浮点值的复杂系统参数(如房间冲激响应)用在一个效果中。第一params[128]字段包含与随后字段的个数和内容有关的信息。这表示对字段更新的扩展,所述字段更新缺省地只以一个params[128]字段进行。传输任意长度的数据成为可能。然后,可以将这些数据存储在附加存储器中,并且可以在计算效果时使用。理论上,也可以在运算期间替代或修改字段的特定部分,以便保持所传输的数据的数量尽可能的小。
具体地,用于将自然房间冲激响应应用于MPEG-4场景的特有AudioFXProto(称为audioNaturalReverb)包含以下参数:
第一params[]字段:
数据类型 功能 缺省值 范围
浮点 NumParamsFields 1 1..60000
浮点 NumImpResp 0 0..32
浮点 SampleRate
浮点[] ReverbChannels 0 0,1,2,3,...,31
浮点 ImpulseResponseCoding 0 0..1
..... 保留
后续params[]字段:
数据类型 功能 缺省值 范围
浮点 impulseResponseLength 0 240000*
浮点[] impulseResportse *
.... *numImpResp次
audioNaturalReverb PROTO使用不同声音信道的冲激响应来创建回响效果。由于这些冲激响应可以非常长(对于大教堂或大厅达几秒),一个params[]阵列不足以传输完整的数据集合。因此,按照如下方式使用一批连续的params[]阵列:
第一块params[]包含与后续params[]字段有关的信息:
numParamsFields字段确定要使用的后续params[]字段的个数。NaturalReverb PROTO必须提供足够的存储器来存储这些字段。
numImpResp定义了冲激响应的个数。
reverbChannels字段定义了冲激响应到输入信道的映射。
impulseResponseCoding字段示出了如何对冲激响应进行编码(见下表)。
编码值 编码函数
0 连续样本
1 样本数/样本
情况1可以用于减小稀疏冲激响应的长度。
可以定义额外的数值以实现房间冲激响应的可扩缩传输。广播模式下的一个有利示例可以是频繁传输房间冲激响应的短版本而较不频繁地传输长序列。另一有利示例是交织模式,频繁传输房间冲激响应的第一部分,而较不频繁地传输房间冲激响应的后续部分。
字段应当如下映射到第一params[]阵列:
numParamsFields                   =params    [0]
numRevChan                        =params    [1]
sampleRate                        =params    [2]
reverbChannels[0...numRevChan-1]  =
                      params  [3...3+numRevChan-1]
impulseResponseCoding  =params  [3+numRevChan]
后续params[]字段包含numImpResp个连续冲激响应,如下:
impulseResponseLength给出了后续impulseResponse的长度。
将impulseResponseLength和impulseResponse重复numImpResp次。
字段应当如下映射到后续params[]阵列:
impulseResponseLength=params[0]
impulseResponse=params[1...1+impulseResponseLength]...
为了根据规定的参数计算回响,可以应用不同的方法,得到回响声音信号,作为输出。
本发明允许传输和使用扩展房间冲激响应来再现声音信号,克服了MPEG-4标准中的控制参数长度限制。但是,本发明也可以应用于具有类似限制的其他系统或MPEG-4标准中的其他功能。

Claims (10)

1.一种用于编码音频信号的冲激响应的方法,其中所述冲激响应允许与特定房间特性相对应地再现声音信号,所述方法包括:
按照以下步骤所定义的,利用MPEG-4编码器对MPEG-4BIFS流的多个连续MPEG-4PROTO params字段进行编码,以传输与经编码的音频信号相关的一个或多个冲激响应:
利用所述MPEG-4编码器,向所述多个连续MPEG-4PROTOparams字段中的第一MPEG-4PROTO params字段中,插入与后续MPEG-4PROTO params字段有关的信息,其中,所述信息包含所要使用的后续MPEG-4PROTO params字段的个数以及所要传输的冲激响应的个数;以及
向所述后续MPEG-4PROTO params字段中,针对所述冲激响应中每个冲激响应,插入冲激响应的长度信息和表示冲激响应的采样。
2.根据权利要求1所述的方法,其特征在于实现房间冲激响应的可扩缩传输。
3.根据权利要求2所述的方法,其特征在于:在广播模式下,频繁地传输房间冲激响应的短版本,而较不频繁地传输长序列。
4.根据权利要求2所述的方法,其特征在于:在交织模式下,频繁地传输房间冲激响应的第一部分,而较不频繁地传输房间冲激响应的后续部分。
5.一种由MPEG-4解码器解码音频信号的冲激响应的方法,其中所述冲激响应允许与特定房间特性相对应地再现声音信号,所述方法包括:
在MPEG-4解码器处,接收在MPEG-4BIFS流的多个连续MPEG-4PROTO params字段中的一个或多个冲激响应,其中,所述多个连续MPEG-4PROTO params字段中的第一MPEG-4PROTO params字段包含与后续MPEG-4PROTO params字段有关的信息,所述信息包含所使用的后续MPEG-4PROTO params字段的个数以及所传输的冲激响应的个数,并且所述后续MPEG-4PROTO params字段针对所述冲激响应中每个冲激响应,包括该冲激响应的长度信息和表示冲激响应的采样;
由所述MPEG-4解码器,基于所述第一MPEG-4PROTO params字段中的所述信息和所述后续MPEG-4PROTO params字段中的所述长度信息,分离表示所述一个或多个冲激响应的所述采样;以及
利用由所分离出的采样所表示的所述一个或多个冲激响应,用所述MPEG-4解码器计算与所述房间特性相对应的回响效果。
6.根据权利要求5所述的方法,其特征在于在所述房间冲激响应的可扩缩传输之后,接收房间冲激响应。
7.根据权利要求6所述的方法,其特征在于:在广播模式下,频繁地接收房间冲激响应的短版本,而较不频繁地房间长序列。
8.根据权利要求6所述的方法,其特征在于:在交织模式下,频繁地接收房间冲激响应的第一部分,而较不频繁地接收房间冲激响应的后续部分。
9.一种用于编码音频信号的冲激响应的设备,其中所述冲激响应允许与特定房间特性相对应地再现声音信号,其特征在于:
所述设备利用MPEG-4编码器对MPEG-4BIFS流的多个连续MPEG-4PROTO params字段进行编码,以传输与经编码的音频信号相关的一个或多个冲激响应,其中所述MPEG-4编码器包括:
用于向所述多个连续MPEG-4PROTO params字段中的第一MPEG-4PROTO params字段中,插入与后续MPEG-4PROTOparams字段有关的信息的装置,其中,所述信息包含所要使用的后续MPEG-4PROTO params字段的个数以及所要传输的冲激响应的个数;以及
用于向所述后续MPEG-4PROTO params字段中,针对所述冲激响应中每个冲激响应,插入冲激响应的长度信息和表示冲激响应的采样的装置。
10.一种用于由MPEG-4解码器解码音频信号的冲激响应的设备,其中所述冲激响应允许与特定房间特性相对应地再现声音信号,其特征在于,所述MPEG-4解码器包括:
用于接收在MPEG-4BIFS流的多个连续MPEG-4PROTO params字段中的一个或多个冲激响应的装置,其中,所述多个连续MPEG-4PROTO params字段中的第一MPEG-4PROTO params字段包含与后续MPEG-4PROTO params字段有关的信息,所述信息包含所使用的后续MPEG-4PROTO params字段的个数以及所传输的冲激响应的个数,并且所述后续MPEG-4PROTO params字段针对所述冲激响应中每个冲激响应,包括该冲激响应的长度信息和表示冲激响应的采样;
用于基于所述第一MPEG-4PROTO params字段中的所述信息和所述后续MPEG-4PROTO params字段中的所述长度信息,分离表示所述一个或多个冲激响应的所述采样的装置;以及
用于利用由所分离出的采样所表示的所述一个或多个冲激响应,用所述MPEG-4解码器计算与所述房间特性相对应的回响效果的装置。
CN2004800348480A 2003-12-02 2004-11-18 用于编码和解码音频信号的冲激响应的方法 Expired - Fee Related CN1886781B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP03027638.0 2003-12-02
EP03027638 2003-12-02
PCT/EP2004/013123 WO2005055193A1 (en) 2003-12-02 2004-11-18 Method for coding and decoding impulse responses of audio signals

Publications (2)

Publication Number Publication Date
CN1886781A CN1886781A (zh) 2006-12-27
CN1886781B true CN1886781B (zh) 2011-05-04

Family

ID=34639271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800348480A Expired - Fee Related CN1886781B (zh) 2003-12-02 2004-11-18 用于编码和解码音频信号的冲激响应的方法

Country Status (8)

Country Link
US (1) US7894610B2 (zh)
EP (1) EP1690251B1 (zh)
JP (1) JP4813365B2 (zh)
KR (1) KR101132485B1 (zh)
CN (1) CN1886781B (zh)
BR (1) BRPI0416577A (zh)
TW (1) TWI350476B (zh)
WO (1) WO2005055193A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1568251B1 (en) * 2002-12-02 2007-01-24 Thomson Licensing Method for describing the composition of audio signals
EP1946517B1 (en) 2005-10-31 2012-11-28 SK Telecom Co., Ltd. Audio data packet format and decoding method thereof and method for correcting mobile communication terminal codec setup error and mobile communication terminal performing same
WO2019078034A1 (ja) * 2017-10-20 2019-04-25 ソニー株式会社 信号処理装置および方法、並びにプログラム
US11109179B2 (en) * 2017-10-20 2021-08-31 Sony Corporation Signal processing device, method, and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1139988A (zh) * 1994-02-01 1997-01-08 夸尔柯姆股份有限公司 猝发脉冲激励的线性预测
CN1179226A (zh) * 1995-03-22 1998-04-15 艾利森电话股份有限公司 基于合成的分析的线性预测语音编码器
CN1229502A (zh) * 1996-07-31 1999-09-22 夸尔柯姆股份有限公司 码激励线性预测(celp)编码器中搜索激励代码簿的方法和装置、

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63289597A (ja) * 1988-03-11 1988-11-28 ソニー株式会社 残響付加装置
JP3033357B2 (ja) * 1992-09-08 2000-04-17 ヤマハ株式会社 効果付与装置
FI116990B (fi) * 1997-10-20 2006-04-28 Nokia Oyj Menetelmä ja järjestelmä akustisen virtuaaliympäristön käsittelemiseksi
US6833840B2 (en) * 2000-02-14 2004-12-21 Optibase Ltd PROTO implementation in MPEG-4
GB2366709A (en) * 2000-06-30 2002-03-13 Graeme Roy Smith Modular software definable pre-amplifier
EP1209949A1 (en) 2000-11-22 2002-05-29 Technische Universiteit Delft Wave Field Synthesys Sound reproduction system using a Distributed Mode Panel
US20030169887A1 (en) 2002-03-11 2003-09-11 Yamaha Corporation Reverberation generating apparatus with bi-stage convolution of impulse response waveform
JP4263869B2 (ja) * 2002-03-11 2009-05-13 ヤマハ株式会社 残響付与装置、残響付与方法、プログラムおよび記録媒体
JP4019753B2 (ja) * 2002-03-12 2007-12-12 ヤマハ株式会社 残響付与装置、残響付与方法、プログラムおよび記録媒体
JP4055054B2 (ja) * 2002-05-15 2008-03-05 ソニー株式会社 音響処理装置
JP2005157278A (ja) * 2003-08-26 2005-06-16 Victor Co Of Japan Ltd 全周囲音場創生装置、全周囲音場創生方法、及び全周囲音場創生プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1139988A (zh) * 1994-02-01 1997-01-08 夸尔柯姆股份有限公司 猝发脉冲激励的线性预测
CN1179226A (zh) * 1995-03-22 1998-04-15 艾利森电话股份有限公司 基于合成的分析的线性预测语音编码器
CN1229502A (zh) * 1996-07-31 1999-09-22 夸尔柯姆股份有限公司 码激励线性预测(celp)编码器中搜索激励代码簿的方法和装置、

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CN 1139988 A,全文.
SCHEIRER E D.THE MPEG-4 STRUCTURED AUDIO STANDARD.ACOUSTICS,SPEECH AND SIGNAL PROCESSING,19986.1998,63801-3804. *

Also Published As

Publication number Publication date
KR20070037431A (ko) 2007-04-04
US20070140501A1 (en) 2007-06-21
JP2007513370A (ja) 2007-05-24
KR101132485B1 (ko) 2012-03-30
EP1690251B1 (en) 2015-08-26
BRPI0416577A (pt) 2007-01-30
WO2005055193A1 (en) 2005-06-16
EP1690251A1 (en) 2006-08-16
CN1886781A (zh) 2006-12-27
TW200525416A (en) 2005-08-01
US7894610B2 (en) 2011-02-22
TWI350476B (en) 2011-10-11
JP4813365B2 (ja) 2011-11-09

Similar Documents

Publication Publication Date Title
CN100571450C (zh) 在多声道音频环境中提供互动式音频的系统和方法
KR101805212B1 (ko) 객체-지향 오디오 스트리밍 시스템
CN106233380B (zh) 多对象音频的编码后位速率减少
KR20140138087A (ko) 햅틱 데이터 인코딩 및 스트리밍을 위한 방법 및 시스템
CN105474310A (zh) 用于低延迟对象元数据编码的装置及方法
US20210377691A1 (en) Signal processing device, method, and program
US7698006B2 (en) Apparatus and method for adapting audio signal according to user's preference
US11743646B2 (en) Signal processing apparatus and method, and program to reduce calculation amount based on mute information
CN115346539A (zh) 用于音频渲染的预渲染信号的方法、设备和系统
US20070297624A1 (en) Digital audio encoding
CN102819851A (zh) 一种有声图片的计算机实现方法
KR20030040203A (ko) 부호화 장치, 복호화 장치 및 방송 시스템
CN1886781B (zh) 用于编码和解码音频信号的冲激响应的方法
KR20240001226A (ko) 3차원 오디오 신호 코딩 방법, 장치, 및 인코더
Gerzon et al. The MLP lossless compression system for PCM audio
KR101114431B1 (ko) 실시간 스트리밍을 위한 오디오 생성장치, 오디오 재생장치 및 그 방법
KR101040086B1 (ko) 오디오 생성방법, 오디오 생성장치, 오디오 재생방법 및 오디오 재생장치
CN111866542A (zh) 音频信号处理方法、多媒体信息处理方法、装置及电子设备
US6516299B1 (en) Method, system and product for modifying the dynamic range of encoded audio signals
Potard et al. Using XML schemas to create and encode interactive 3-D audio scenes for multimedia and virtual reality applications
WO2022242534A1 (zh) 编解码方法、装置、设备、存储介质及计算机程序
Terentiev et al. SAOC for gaming–The upcoming MPEG standard on parametric object based audio coding
Neubauer et al. New high data rate audio watermarking based on SCS (scalar costa scheme)
Koenen MPEG-4 and its Operational Environments
JP2005159878A (ja) データ処理装置及びデータ処理方法、並びにプログラム、記憶媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110504

Termination date: 20161118