CN103915098A - 音频信号编码器 - Google Patents

音频信号编码器 Download PDF

Info

Publication number
CN103915098A
CN103915098A CN201410008366.3A CN201410008366A CN103915098A CN 103915098 A CN103915098 A CN 103915098A CN 201410008366 A CN201410008366 A CN 201410008366A CN 103915098 A CN103915098 A CN 103915098A
Authority
CN
China
Prior art keywords
sound signal
channel parameter
coding
frame
frame sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410008366.3A
Other languages
English (en)
Other versions
CN103915098B (zh
Inventor
A·瓦西拉凯
L·J·拉克索宁
A·S·拉莫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN103915098A publication Critical patent/CN103915098A/zh
Application granted granted Critical
Publication of CN103915098B publication Critical patent/CN103915098B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

一种设备,包括:编码率确定器,其被配置为确定对于至少一个第一帧音频信号多通道参数的第一编码比特率以及对于至少一个第二帧音频信号多通道参数的第二编码比特率,其中,组合的第一与第二编码比特率小于比特率限值;通道分析器,其被配置为对于第一帧确定所述至少一个第一帧音频信号多通道参数,并被配置为对于第二帧确定所述至少一个第二帧音频信号多通道参数;多通道参数确定器,其被配置为由所述至少一个第一帧音频信号多通道参数,在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数,并被配置为由所述至少一个第二帧音频信号多通道参数在第二编码比特率范围内产生编码后的至少一个第二帧音频信号多通道参数;以及,多工器,其被配置为组合编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。

Description

音频信号编码器
技术领域
本发明涉及一种多通道或立体声音频信号编码器,特别、但不仅仅涉及一种用于便携式设备中使用的多通道或立体声音频信号编码器。
背景技术
例如,对像语音或音乐这样的音频信号进行编码,以便使得音频信号的高效传输或存储成为可能。
音频编码器和解码器(也称为编码译码器)用于表现基于音频的信号,例如音乐和环境声音(用语音编码特有的术语来说,其可称为背景噪音)。这些类型的编码器典型地不对编码过程使用语音模型,相反,它们使用表现包括语音在内所有类型的语音信号的过程。语音编码器和解码器(编码译码器)可看作对于语音信号最优化的音频编码译码器,并能以固定或可变比特率运行。
音频编码译码器也可被配置为以变化的比特率运行。在较低比特率下,这样的音频编码译码器可被优化为以相当于纯语音编码译码器的编码速率对于语音信号运行。在较高比特率下,音频编码译码器可以以较高的品质和性能对包括音乐、背景噪音和语音的任何信号进行编码。可变速率音频编码译码器也可实现嵌入式可伸缩编码结构和比特流,其中,附加的位(特定量的位常常称为层)在较低速率下改进编码,且其中,较高速率的比特流可被截断,以获得较低速率编码的比特流。这种音频编码译码器可将纯粹为语音信号设计的编码译码器用作内核层或最低比特率编码。
音频编码译码器被设计为保持高(感知)品质,同时,提升压缩比。因此,代替波形匹配编码,常常使用多种参数方案来降低比特率。对于例如立体声信号的多通道音频,常常在单声道表达上使用较大量的可用比特率,并用使用相对较少位的参数化方法对立体声或多通道信息进行编码。
发明内容
根据第一方面,提供了一种方法,其包括:确定对于至少一个第一帧音频信号多通道参数的第一编码比特率以及对于至少一个第二帧音频信号多通道参数的第二编码比特率,其中,组合的第一与第二编码比特率小于比特率限值;对于第一帧,确定所述至少一个第一帧音频信号多通道参数;从所述至少一个第一帧音频信号多通道参数,在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数;对于第二帧,确定所述至少一个第二帧音频信号多通道参数;从所述至少一个第二帧音频信号多通道参数,在第二编码比特率范围内产生编码后的至少一个第二帧音频信号多通道参数;以及,组合编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。
第一帧可以为下列中的至少一种:与第二帧相邻;以及,在第二帧之前。
对于第一帧确定所述至少一个第一帧音频信号多通道参数或对于第二帧确定所述至少一个第二帧音频信号多通道参数可包括确定下列中的至少一个:至少一个耳间时间差;以及,至少一个耳间电平差。
从所述至少一个第一帧音频信号多通道参数在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数或从所述至少一个第二帧音频信号多通道参数在第二编码比特率范围内产生编码后的第二帧音频信号多通道参数可包括:使用分立的矢量量化码本,产生分别用于所述至少一个第一帧音频信号多通道参数或所述至少一个第二帧音频信号多通道参数的组的码本索引;从分立的量化码本,产生组合矢量量化码本;从对于组的码本索引,对于组合的矢量量化码本,产生组合矢量量化索引,其中,用于识别组合矢量量化索引的位的个数少于用于分立组的码本索引所使用的组合位数。
从分立的量化码本产生组合矢量量化码本可包括:从分立的矢量量化码本选择至少一个编码矢量;并对来自分立的矢量量化码本的所述至少一个编码矢量进行组合。
从分立的矢量量化码本选择至少一个编码矢量可包括:确定将从分立的矢量量化码本选择的第一数量的编码矢量;以及,增大第一数量,一直到达到第一或第二相应的编码比特率。
从所述至少一个第一帧音频信号多通道参数在第一编码比特率的范围内产生编码后的第一帧音频信号多通道参数可包括:依赖于所述至少一个第一帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第一帧音频信号多通道参数,产生具有所关联的索引的第一编码映射;以及,依赖于所关联的索引,对第一编码映射进行编码。
依赖于所关联的索引对第一编码映射进行编码可包括,依赖于所关联的索引,将Golomb-Rice编码应用到第一编码映射。
从所述至少一个第二帧音频信号多通道参数在第二编码比特率的范围内产生编码后的第二帧音频信号多通道参数可包括:依赖于所述至少一个第二帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第二帧音频信号多通道参数,产生具有所关联的索引的第二编码映射;以及,依赖于所关联的索引,对第二编码映射进行编码。
依赖于所关联的索引对第二编码映射进行编码可包括,依赖于所关联的索引,将Golomb-Rice编码应用到第二编码映射。
该方法还可包括:接收两个或多于两个语音信号通道;从所述两个或多于两个音频信号通道以及所述至少一个第一帧音频信号多通道参数,确定较少数量通道音频信号;在包比特率限值范围内,产生包括所述较少数量通道的编码后的音频信号;组合编码后的音频信号、编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。
第二编码比特率可小于第一编码比特率。
根据第二方面,提供了一种方法,其包括:在第一时间段内接收包括至少一个第一帧音频信号、至少一个第一帧音频信号多通道参数以及至少一个另一帧音频信号多通道参数的已编码音频信号,并在另一时间段内接收包括至少一个另一帧音频信号的另一已编码音频信号;判断另一编码音频信号是否包括至少一个另一帧音频信号多通道参数和/或所述至少一个另一帧音频信号多通道参数是否损坏;以及,当所述另一编码音频信号不包括至少一个另一帧音频信号多通道参数或所述至少一个另一帧音频信号多通道参数损坏时,对于所述另一帧,从所述至少一个第一帧音频信号或所述至少一个另一帧音频信号两者中的任一个产生至少两通道音频信号,并为已编码音频信号产生至少一个另一帧音频信号多通道参数。
该方法还可包括,当所述另一编码音频信号包括所述至少一个另一帧音频信号多通道参数且所述至少一个另一帧音频信号多通道参数未损坏时,对于所述另一帧,从所述至少一个另一帧音频信号产生至少两个通道音频信号,以及对于另一已编码音频信号,产生至少一个另一帧音频信号多通道参数。
根据第三方面,提供了一种设备,该设备包括:至少一个处理器;以及,至少一个存储器,其包括用于一个以上程序的计算机程序代码,所述至少一个存储器以及计算机程序代码被配置为,用所述至少一个处理器,使得设备至少:确定对于至少一个第一帧音频信号多通道参数的第一编码比特率以及对于至少一个第二帧音频信号多通道参数的第二编码比特率,其中,组合的第一与第二编码比特率小于比特率限值;对于第一帧,确定所述至少一个第一帧音频信号多通道参数;从所述至少一个第一帧音频信号多通道参数,在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数;对于第二帧,确定所述至少一个第二帧音频信号多通道参数;从所述至少一个第二帧音频信号多通道参数,在第二编码比特率范围内产生编码后的至少一个第二帧音频信号多通道参数;以及,组合编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。
第一帧可以为下列中的至少一种:与第二帧相邻;以及,在第二帧之前。
对于第一帧确定所述至少一个第一帧音频信号多通道参数或对于第二帧确定所述至少一个第二帧音频信号多通道参数可使得设备确定下列中的至少一个:至少一个耳间时间差;以及,至少一个耳间电平差。
从所述至少一个第一帧音频信号多通道参数在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数或从所述至少一个第二帧音频信号多通道参数在第二编码比特率范围内产生编码后的第二帧音频信号多通道参数可使得设备:使用分立的矢量量化码本,产生分别用于所述至少一个第一帧音频信号多通道参数或所述至少一个第二帧音频信号多通道参数的组的码本索引;从分立的量化码本,产生组合矢量量化码本;从对于组的码本索引,对于组合的矢量量化码本,产生组合矢量量化索引,其中,用于识别组合矢量量化索引的位的个数少于用于分立组的码本索引所使用的组合位数。
从分立的量化码本产生组合矢量量化码本可使得设备:从分立的矢量量化码本选择至少一个编码矢量;并对来自分立的矢量量化码本的所述至少一个编码矢量进行组合。
从分立的矢量量化码本选择至少一个编码矢量可使得设备:确定将从分立的矢量量化码本选择的第一数量的编码矢量;以及,增大第一数量,一直到达到第一或第二相应的编码比特率。
从所述至少一个第一帧音频信号多通道参数在第一编码比特率的范围内产生编码后的第一帧音频信号多通道参数可使得设备:依赖于所述至少一个第一帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第一帧音频信号多通道参数,产生具有所关联的索引的第一编码映射;以及,依赖于所关联的索引,对第一编码映射进行编码。
依赖于所关联的索引对第一编码映射进行编码可使得设备:依赖于所关联的索引,将Golomb-Rice编码应用到第一编码映射。
从所述至少一个第二帧音频信号多通道参数在第二编码比特率的范围内产生编码后的第二帧音频信号多通道参数可使得设备:依赖于所述至少一个第二帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第二帧音频信号多通道参数,产生具有所关联的索引的第二编码映射;以及,依赖于所关联的索引,对第二编码映射进行编码。
依赖于所关联的索引对第二编码映射进行编码可使得设备:依赖于所关联的索引,将Golomb-Rice编码应用到第二编码映射。
还可使得设备:接收两个或多于两个语音信号通道;从所述两个或多于两个音频信号通道以及所述至少一个第一帧音频信号多通道参数,确定较少数量通道音频信号;在包比特率限值范围内,产生编码后的音频信号;组合编码后的音频信号、编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。
根据第四方面,提供了一种设备,该设备包括:至少一个处理器;以及,至少一个存储器,其包括用于一个以上程序的计算机程序代码,所述至少一个存储器以及计算机程序代码被配置为,用所述至少一个处理器,使得设备至少:在第一时间段内接收包括至少一个第一帧音频信号、至少一个第一帧音频信号多通道参数以及至少一个另一帧音频信号多通道参数的已编码音频信号,并在另一时间段内接收包括至少一个另一帧音频信号的另一已编码音频信号;判断另一编码音频信号是否包括至少一个另一帧音频信号多通道参数和/或所述至少一个另一帧音频信号多通道参数是否损坏;以及,当所述另一编码音频信号不包括至少一个另一帧音频信号多通道参数或所述至少一个另一帧音频信号多通道参数损坏时,对于所述另一帧,从所述至少一个第一帧音频信号或所述至少一个另一帧音频信号两者中的任一个产生至少两个通道音频信号,并且对于已编码音频信号产生至少一个另一帧音频信号多通道参数。
还可使得该设备:当所述另一编码音频信号包括所述至少一个另一帧音频信号多通道参数且所述至少一个另一帧音频信号多通道参数未损坏时,对于所述另一帧,从所述至少一个另一帧音频信号产生至少两个通道音频信号,并且对于所述另一已编码音频信号产生至少一个另一帧音频信号多通道参数。
根据第五方面,提供了一种设备,该设备包括:用于确定对于至少一个第一帧音频信号多通道参数的第一编码比特率以及对于至少一个第二帧音频信号多通道参数的第二编码比特率的装置,其中,组合的第一与第二编码比特率小于比特率限值;用于对于第一帧确定所述至少一个第一帧音频信号多通道参数的装置;用于从所述至少一个第一帧音频信号多通道参数,在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数的装置;用于对于第二帧确定所述至少一个第二帧音频信号多通道参数的装置;用于从所述至少一个第二帧音频信号多通道参数在第二编码比特率范围内产生编码后的至少一个第二帧音频信号多通道参数的装置;以及,用于组合编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数的装置。
第一帧可以为下列中的至少一种:与第二帧相邻;以及,在第二帧之前。
用于对于第一帧确定所述至少一个第一帧音频信号多通道参数的装置或用于对于第二帧确定所述至少一个第二帧音频信号多通道参数的装置可包括确定下列中的至少一个的装置:至少一个耳间时间差;以及,至少一个耳间电平差。
用于从所述至少一个第一帧音频信号多通道参数在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数的装置或用于从所述至少一个第二帧音频信号多通道参数在第二编码比特率范围内产生编码后的第二帧音频信号多通道参数的装置可包括:用于使用分立的矢量量化码本产生分别用于所述至少一个第一帧音频信号多通道参数或所述至少一个第二帧音频信号多通道参数的组的码本索引的装置;用于从分立的量化码本产生组合矢量量化码本的装置;以及,用于从对于组的码本索引对于组合的矢量量化码本产生组合矢量量化索引的装置,其中,用于识别组合矢量量化索引的位的个数少于用于分立组的码本索引所使用的组合位数。
用于从分立的量化码本产生组合矢量量化码本的装置可包括:用于由分立的矢量量化码本选择至少一个编码矢量的装置;以及,用于对来自分立的矢量量化码本的所述至少一个编码矢量进行组合的装置
用于从分立的矢量量化码本选择至少一个编码矢量的装置可包括:用于确定将从分立的矢量量化码本选择的第一数量的编码矢量的装置;以及,用于增大第一数量、一直到达到第一或第二相应的编码比特率的装置。
用于从所述至少一个第一帧音频信号多通道参数在第一编码比特率的范围内产生编码后的第一帧音频信号多通道参数的装置可包括:用于依赖于所述至少一个第一帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第一帧音频信号多通道参数,产生具有所关联的索引的第一编码映射的装置;以及,用于依赖于所关联的索引,对第一编码映射进行编码的装置。
用于依赖于所关联的索引对第一编码映射进行编码的装置可包括:用于依赖于所关联的索引,将Golomb-Rice编码应用到第一编码映射的装置。
用于从所述至少一个第二帧音频信号多通道参数在第二编码比特率的范围内产生编码后的第二帧音频信号多通道参数的装置可包括:用于依赖于所述至少一个第二帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第二帧音频信号多通道参数,产生具有所关联的索引的第二编码映射的装置;以及,用于依赖于所关联的索引,对第二编码映射进行编码的装置。
用于依赖于所关联的索引对第二编码映射进行编码的装置可包括:用于依赖于所关联的索引,将Golomb-Rice编码应用到第二编码映射的装置。
该设备还可包括:用于接收至少两个语音信号通道的装置;用于从所述至少两个音频信号通道以及所述至少一个第一帧音频信号多通道参数确定较少数量通道音频信号的装置;用于在包比特率限值范围内产生编码后的音频信号的装置;以及,用于组合编码后的音频信号、编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数的装置。
根据第六方面,提供了一种设备,其包括:用于在第一时间段内接收包括至少一个第一帧音频信号、至少一个第一帧音频信号多通道参数以及至少一个另一帧音频信号多通道参数的已编码音频信号并用于在另一时间段内接收包括至少一个另一帧音频信号的另一已编码音频信号的装置;用于判断另一编码音频信号是否包括至少一个另一帧音频信号多通道参数和/或所述至少一个另一帧音频信号多通道参数是否损坏的装置;以及,用于当所述另一编码音频信号不包括至少一个另一帧音频信号多通道参数或所述至少一个另一帧音频信号多通道参数损坏时,对于所述另一帧,从所述至少一个第一帧音频信号或所述至少一个另一帧音频信号两者中的任一个产生至少两个通道音频信号以及对于已编码音频信号产生至少一个另一帧音频信号多通道参数的装置。
该设备还可包括,用于当所述另一编码音频信号包括所述至少一个另一帧音频信号多通道参数且所述至少一个另一帧音频信号多通道参数未损坏时,对于所述另一帧从所述至少一个另一帧音频信号产生至少两个通道音频信号并且对于所述另一已编码音频信号产生至少一个另一帧音频信号多通道参数的装置。
根据第七方面,提供了一种设备,其包括:编码率确定器,其被配置为确定对于至少一个第一帧音频信号多通道参数的第一编码比特率以及对于至少一个第二帧音频信号多通道参数的第二编码比特率,其中,组合的第一与第二编码比特率小于比特率限值;通道分析器,其被配置为对于第一帧确定所述至少一个第一帧音频信号多通道参数,并被配置为对于第二帧确定所述至少一个第二帧音频信号多通道参数;多通道参数确定器,其被配置为从所述至少一个第一帧音频信号多通道参数,在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数,并被配置为从所述至少一个第二帧音频信号多通道参数在第二编码比特率范围内产生编码后的至少一个第二帧音频信号多通道参数;以及,多工器,其被配置为组合编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。
第一帧可以为下列中的至少一种:与第二帧相邻;以及,在第二帧之前。
通道分析器可被配置为确定下列中的至少一个:至少一个耳间时间差;以及,至少一个耳间电平差。
多通道参数确定器可包括:码本量化器编码器,其被配置为使用分立的矢量量化码本产生分别用于所述至少一个第一帧音频信号多通道参数或所述至少一个第二帧音频信号多通道参数的组的码本索引;码本组合器,其被配置为从分立的量化码本产生组合矢量量化码本;以及,索引映射器,其被配置为从对于组的码本索引对于组合的矢量量化码本产生组合矢量量化索引,其中,用于识别组合矢量量化索引的位的个数少于用于分立组的码本索引所使用的组合位数。
码本组合器可包括:编码矢量选择器,其被配置为从分立的矢量量化码本选择至少一个编码矢量;以及,编码矢量组合器,其被配置为对来自分立的矢量量化码本的所述至少一个编码矢量进行组合。
编码矢量组合器可包括:编码矢量数量确定器,其被配置为确定将从分立的矢量量化码本选择的第一数量的编码矢量;以及,编码矢量选择器优化器,其被配置为增大第一数量、一直到达到第一或第二相应的编码比特率。
多通道参数确定器可包括:映射器,其被配置为依赖于所述至少一个第一帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第一帧音频信号多通道参数,产生具有所关联的索引的第一编码映射;以及,编码器,其被配置为依赖于所关联的索引,对第一编码映射进行编码。
编码器可包括Golomb-Rice编码器。
该设备还可包括:输入,其被配置为接收至少两个语音信号通道;单声道音频信号产生器,其被配置为从所述至少两个音频信号通道以及所述至少一个第一帧音频信号多通道参数确定较少数量的通道音频信号;音频信号编码器,其被配置为在包比特率限值范围内产生编码后的音频信号;以及,音频信号组合器,其被配置为组合编码后的音频信号、编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。
根据第八方面,提供了一种设备,其包括:输入,其被配置为在第一时间段内接收包括至少一个第一帧音频信号、至少一个第一帧音频信号多通道参数以及至少一个另一帧音频信号多通道参数的已编码音频信号,并在另一时间段内接收包括至少一个另一帧音频信号的另一已编码音频信号;包分析器,其被配置为判断另一已编码音频信号是否包括至少一个另一帧音频信号多通道参数和/或所述至少一个另一帧音频信号多通道参数是否损坏;以及,立体声通道产生器,其被配置为当所述另一编码音频信号不包括至少一个另一帧音频信号多通道参数或所述至少一个另一帧音频信号多通道参数损坏时,对于所述另一帧,从所述至少一个第一帧音频信号或所述至少一个另一帧音频信号两者中的任一个产生至少两个通道音频信号,并对于已编码音频信号产生至少一个另一帧音频信号多通道参数。
立体声通道产生器还可被配置为,当所述另一编码音频信号包括所述至少一个另一帧音频信号多通道参数且所述至少一个另一帧音频信号多通道参数未损坏时,对于所述另一帧从所述至少一个另一帧音频信号产生至少两个通道音频信号并对于所述另一已编码音频信号产生至少一个另一帧音频信号多通道参数。
第二编码比特率可小于第一编码比特率。
一种计算机程序产品可使得设备执行这里介绍的方法。
一种电子装置可包括这里介绍的设备。
一种芯片组可包括这里介绍的设备。
附图说明
为了更好地理解本发明,现在将通过举例的方式参照附图,在附图中:
图1原理性地示出了使用某些实施例的电子装置;
图2原理性地示出了根据某些实施例的音频编码译码器系统;
图3原理性地示出了根据某些实施例的图2所示的编码器;
图4原理性地示出了根据某些实施例在图3中更为详细地示出的通道分析器;
图5原理性地示出了根据某些实施例在图3中更为详细地示出的立体声参数编码器;
图6示出了一流程图,其示出根据某些实施例在图3中示出的编码器的操作;
图7示出了一流程图,其示出根据某些实施例如图4所示的通道分析器的操作;
图8原理性地示出了根据某些实施例在图5中更为详细地示出的主立体声参数编码器;
图9原理性地示出了根据某些实施例在图5中更为详细地示出的误差隐藏立体声参数编码器;
图10示出了一流程图,其示出根据某些实施例如图8和9所示的主以及误差隐藏立体声参数编码器的操作;
图11原理性地示出了根据某些实施例如图2所示的解码器;
图12示出了一流程图,其示出根据某些实施例如图11所示的解码器的操作;
图13示出了根据某些实施例在来自不同次波段的电平值之间的示例性归一化互相关性的图解表示;
图14示出了在某些实施例的示例性实施中来自6kbps总比特率的未使用的位的柱状图。
具体实施方式
下面更为详细地介绍可能的立体声和多通道语音与音频编码译码器,包括分层或可伸缩的可变速率语音与音频编码译码器。当前的音频编码译码器方法可存在这样的问题:为了通过编码效率、带宽以及通道数来提高编码信号的品质,任何帧误差可导致问题。特别地,这些问题为在基于包的网络上传输编码音频信号的问题。
在多通道或立体声参数(或者,一般地,与通道扩展对应的参数)的情况下处理帧误差尚未得到显著研究,并且,目前,帧误差或损坏导致有效的立体声或双声道参数损失。减轻这种损失的方法是在实时协议(RTP)层面应用、且因此应用到所有内容的帧交错以及前向误差隐藏。否则,可导致解码器插入零值或重复前一帧立体声参数。
这里介绍的实施例的概念是试图产生这样的立体声或多通道音频编码:其产生高效的高品质且低比特率立体声(或多通道)信号编码,同时,仍保持参数误差隐藏或参数帧损坏隐藏。
因此,这里介绍的实施例的概念使用立体声(或双声道或多通道)参数的可变比特率编码,使得关于总可用固定比特率的任何剩余位可用于由相邻帧——例如下一帧——对立体声(或双声道或多通道)参数进行解码。
通过使用双声道扩展和内核编码译码器之间的帧延迟差,确保相邻帧(例如下一帧)的双声道参数的可用性。因此,在这里介绍的实施例中,由于双声道、立体声或多通道参数的编码是比特率可伸缩的,相同的过程或设备可用于对下一帧参数进行编码,但是用较低分辨率的表达。
在这一点上,首先参照图1,其中示出了示例性的电子装置或设备10的原理性框图,该装置或设备可包含根据本申请一实施例的编码译码器。
例如,设备10可为无线通信系统的移动终端或用户设备。在其他实施例中,设备10可为例如视频摄像机的音频-视频装置、电视(TV)接收器、例如mp3录音机/播放器的音频录音机或音频播放器、媒体录影机(也称为mp4录影机/播放器)或适合对音频信号进行处理的任何计算机。
在某些实施例中,电子装置或设备10包括麦克风11,其经由模数转换器(ADC)14连接到处理器21。处理器21进一步经由数模(DAC)转换器32连接到扬声器33。处理器21进一步连接到收发器(RX/TX)13、用户接口(UI)15和存储器22。
在某些实施例中,处理器21可被配置为执行多种程序代码。在某些实施例中,所实现的程序代码包括这里介绍的多通道或立体声编码或解码代码。在某些实施例中,所实现的程序代码23可被存储在例如存储器22中,以便在需要时由处理器21取回。存储器22可进一步提供用于存储数据的部分24,该数据例如为已经根据应用编码的数据。
实施例中的编码与解码代码可以在硬件和/或固件中实现。
用户接口15使得用户能够例如经由键盘向电子装置10输入命令,以及例如经由显示器从电子装置10获得信息。在某些实施例中,触摸屏可为用户接口提供输入与输出功能二者。在某些实施例中,设备10包括收发器13,其适合使得与其他设备的通信成为可能,例如经由无线通信网络。
还将明了,设备10的结构可以以多种方式补充和变化。
例如,设备10的用户可使用麦克风来输入将要传输到某些其他设备或将要存储在存储器22的数据部分24中的语音或其他音频信号。在某些实施例中,为此目的,对应的应用可经由用户接口15被用户致动。这些实施例中的这种应用可由处理器21执行,使得处理器21执行存储在存储器22中的编码代码。
在某些实施例中,模数转换器(ADC)14将输入的模拟音频信号转换为数字音频信号,并将数字音频信号提供给处理器21。在某些实施例中,麦克风11可包括一体化的麦克风与ADC功能,并将数字音频信号直接提供给处理器以便进行处理。
在这样的实施例中,于是,处理器21以与参照图2所示系统、图3到10所示编码器以及图11与12所示解码器介绍的相同的方式对数字音频信号进行处理。
在某些实施例中,结果得到的位流可被提供给收发器13,以便传输给另一设备。或者,在某些实施例中,编码后的音频数据可存储在存储器22的数据部分24中,例如,用于由同一设备10在后来进行传输或在后来进行呈现。
在某些实施例中,设备10还可经由收发器13从另一设备接收具有对应的编码数据的位流。在这种实例中,处理器21可执行存储在存储器22中的解码程序代码。这种实施例中的处理器21对接收到的数据进行解码,并将解码数据提供给数模转换器32。数模转换器32将数字解码数据转换为模拟音频数据,并在某些实施例中可经由扬声器33输出模拟音频。在某些实施例中,解码程序代码的执行也可由用户经由用户接口15调用的应用来触发。
在某些实施例中,所接收的编码数据也可在存储器22的数据部分22中被存储而不是经由扬声器33立即呈现,例如,用于后来的解码和呈现,或解码并转发给又一设备。
将会明了,图3到5、8、9和11所示的原理性结构以及图6到7、10和12所示的方法步骤仅仅代表图1所示设备中实现的示例性示出的立体声编码器/解码器设备或方法的特定部分和音频编码译码器操作的一部分。
实施例所使用的音频编码译码器的一般操作如图2所示。一般音频编码/解码系统包括编码器与解码器二者,如图2原理性地示出。然而,将会明了,某些实施例可实现编码器或解码器中的一种,或编码器与解码器二者。图2所示为具有编码器104且特别是立体声编码器151、存储器或媒体通道106以及解码器108的系统102。将会明了,如上面所介绍的,某些实施例可包括或实现编码器104或解码器108或者编码器104与解码器108二者。
编码器104对输入音频信号110进行压缩,产生位流112,其在某些实施例中可通过媒体通道106存储或传输。编码器104还可立体声编码器151,作为整体编码操作的一部分。还将明了,立体声编码器可以为整体编码器104的一部分,或为分立的编码模块。编码器104也可包括多通道编码器,其对多于两个音频信号进行编码。
位流112可在解码器108中接收。解码器108对位流112进行解压缩,并产生输出音频信号114。解码器108可包括立体声解码器,作为整体解码操作的一部分。将会明了,立体声解码器可以为整体解码器108的一部分,或为分立的解码模块。解码器108还可包括多通道解码器,其对多于两个音频信号进行解码。相对于输入信号110的输出音频信号114的品质和位流112的比特率为定义编码系统102的性能的主要特征。
图3原理性地示出了根据某些实施例的编码器104。
图6原理性地示出了根据某些实施例的编码器104的操作的流程图。
这里介绍的实施例的概念为,确定并应用立体声编码模式,以产生具有误差隐藏的高效、高品质且低比特率的真实立体声信号。对于关于图3的方面,示出了根据某些实施例的示例性编码器104。另外,关于图6,进一步详细示出了编码器104的操作。
在某些实施例中,编码器104包括帧分段器/变换器201。帧分段器/变换器201被配置为接收左以及右(或者,更一般地,任何多通道音频表达)输入音频信号,并产生将要分析和编码的这些音频信号的频域表达。这些频率表达可被传送到通道参数确定器203。
在某些实施例中,帧分段器/变换器可被配置为将音频信号数据分段或分割为适合频域变换的段或帧。帧分段器/变换器201在某些实施例中还可被配置为根据任何适合的窗口函数对音频信号数据的这些帧或段开窗口。例如,帧分段器/变换器201可被配置为产生以各自10ms重叠前一以及后一帧的20ms的帧。
在某些实施例中,帧分段器/变换器可被配置为在音频信号数据执行任何合适的时到频域变换。例如,时到频域变换可以为离散傅立叶变换(DFT)、快速傅立叶变换(FFT)、改进型离散余弦变换(MDCT)。在下面的实例中,使用快速傅立叶变换(FFT)。另外,时到频域变换器的输出可进一步得到处理,以产生各个输入通道音频信号数据的分立频段域表达(次频段表达)。这些频段可以以任何适当的方式布置。例如,这些频段可线性间隔开,或者在感知上或心理声学上分配。
产生音频帧波段频域表达的操作在图6中通过步骤501示出。
在某些实施例中品与表达被传送到通道分析器/单声道编码器204。
在某些实施例中,编码器104可包括通道分析器/单声道编码器203。通道分析器/单声道编码器203可被配置为接收多通道或立体声输入的次频带滤波表达。通道分析器/单声道编码器203在某些实施例中可被另外配置为对频域音频信号进行分析,并确定关于立体声或多通道音频信号差与各个次频段相关联的参数。另外,通道分析器/单声道编码器可使用这些参数并产生可根据任何合适的编码进行编码的单声道通道。
立体声参数和单声道编码信号(或者,更一般地,多通道参数和减少通道编码信号)可被输出到立体声参数编码器205。在这里介绍的实例中,多通道参数关于频域参数定义,然而,在某些实施例中可产生时域或其他域参数。
确定立体声参数和产生单声道通道并对单声道通道进行编码的操作在图6中通过步骤503示出。
关于图4,进一步详细介绍根据某些实施例的示例性通道分析器/单声道编码器203。另外,关于图7,如图4所示通道分析器/单声道编码器203的操作根据某些实施例示出。
在某些实施例中,通道分析器/单声道编码器203包括相关性/移调确定器(correlation/shift determiner)301。相关性/移调确定器301被配置为确定两个声道(或多通道音频信号的部分)之间的每一次频段的相关性或移调(shift)。移调(或最佳相关性索引COR_IND[j])可使用例如下面的代码来确定。
其中,值MAXSHIFT是最大允许移调(该值可基于所支持的麦克风布置模型,或者更简单地,基于麦克风之间的距离),PI为π,COR_INT为初始相关性值或对相关性计算进行初始化的大的负值,且COR_BAND_START[]定义次频段的起始点。这里使用的矢量svec_re[]和svec_im[]即真实与想象值如下定义:
确定相关性值的操作在图7中通过步骤553示出。
相关性/移调值可在某些实施例中传送到单声道通道产生器/编码器,并作为立体声通道参数传送到量化器优化器。
另外,在某些实施例中,相关性/移调值应用到音频通道中的一个,以便提供通道之间的时间对准。这些对准的通道音频信号可在某些实施例中传送到相对能量信号电平确定器301。
使用相关性/移调值对准通道的操作在图7中通过步骤552示出。
在某些实施例中,通道分析器/解码器203包括相对能量信号电平确定器301。相对能量信号电平确定器301被配置为接收输出对准频域表达,并确定对于各个次频段的通道对之间的相对信号电平。将会明了,在下面的实例中,一对通道由合适的立体声通道分析器进行分析,并且受到处理,然而,将会明了,在某些实施例中,这可扩展到任何数量的通道(换句话说,多通道分析器或用于对多个或两个以上通道进行分析以确定定义通道间差或通道的参数合适的装置)。例如,这可由合适的多通道配对实现,以产生可以如这里介绍的那样受到分析的通道对。
在某些实施例中,对于各个频段的相对电平可使用下面的代码计算。
其中,L_FFT为FFT的长度,且EPSILON为超过零的小值,以防止除以零的问题。相对能量信号电平确定器在这样的实施例中有效地产生各个次频段上对于各个通道(L和R)的量值确定,于是,用一个通道值除以另一个通道值,以产生相对值。在某些实施例中,相对能量信号电平确定器301被配置为将相对能量信号电平输出到编码模式确定器205。
确定相对能量信号电平的操作在图7中通过步骤553示出。
相对能量信号电平值在某些实施例中可被传送到单声道通道产生器/编码器,以及作为立体声通道参数传送到量化器优化器。
在某些实施例中,可进行任何合适的电平(能量)间或时间(相关性或延迟)间差推定。例如,对于各个帧,可存在两个窗口,对于该窗口,推定延迟和电平。因此,例如,在各个帧为10ms的情况下,可存在两个这样的窗口:其可重叠,并且彼此延迟5ms。换句话说,对于各个帧,可存在所确定的两个分立延迟和电平差值,其可被传送到编码器以便进行编码。
另外,在某些实施例中,对于各个窗口,可推定相关次频段中每一个的差。次频段的划分可在某些实施例中根据任何合适的方法确定。
例如,次频段划分在某些这样的实施例中可根据选择的带宽确定来进行:该实施例接着确定电平(能量)间和时间(相关性或延迟)间差推定的数量。例如,音频信号的产生可基于输出信号被看作宽带(WB)、超宽带(SWB)还是满带(FB)(其中,带宽要求以从宽带到满带的顺序增大)。对于可能的带宽选择,在某些实施例中,可存在次频段的特定的划分。因此,例如,对于时间或延迟差推定的FFT域的次频段划分可以为:
ITD sub-bands for Wideband(WB)
const short scale1024_WB[]=
{1,5,8,12,20,34,48,56,120,512};
ITD sub-bands for Superwideband(SWB)
const short scale1024_SWB[]=
{1,2,4,6,10,14,17,24,28,60,256,512};
ITD sub-bands for Fullband(FB)
const short scale1024_FB[]=
{1,2,3,4,7,11,16,19,40,171,341,448/*~21kHz*/};
ILD sub-bands for Wideband(WB)
const short scf_band_WB[]=
{1,8,20,32,44,60,90,110,170,216,290,394,512};
ILD sub-bands for Superwideband(SWB)
const short scf_band_SWB[]=
{1,4,10,16,22,30,45,65,85,108,145,197,256,322,412,512};
ILD sub-bands for Fullband(FB)
const short scf_band_FB[]=
{1,3,7,11,15,20,30,43,57,72,97,131,171,215,275,341,391,448/*~21kHz*/};
换句话说,在某些实施例中,对于延迟和电平差,可存在不同的次频段。
在某些实施例中,编码器104包括单声道通道产生器/编码器305。单声道通道产生器被配置为,接收来自相对能量信号电平确定器301的例如相对能量信号电平的通道分析器值以及来自相关性/移调确定器303的相关性/移调电平。另外,在某些实施例中,单声道通道产生器/解码器305可被配置为进一步接收输入的多通道音频信号。单声道通道产生器/编码器305可在某些实施例中被配置为将延迟与电平差应用到多通道音频信号,以便产生代表音频信号的“对准”的通道。换句话说,单声道通道产生器/编码器305可产生代表对准的多通道音频信号的单声道通道信号。例如,在确定为左通道音频信号和右通道音频信号的某些实施例中,左或者右通道音频信号中的一个根据确定的延迟差相对于另一个延迟,于是,对延迟后的通道和另一通道音频信号求平均,以产生单声道通道信号。然而,将会明了,在某些实施例中,可实现任何合适的单声道通道产生方法。将会明了,在某些实施例中,单声道通道产生器或用于产生音频信号的合适的装置可用这样的减少通道数量产生器代替或由其辅助:其被配置为产生与输入的音频通道相比较少数量的输出音频通道。因此,例如,在输入音频信号通道的数量大于两个的某些多通道音频信号实例中,“单声道通道产生器”被配置为产生多于一个通道音频信号,但少于输入通道的数量。
从多通道信号产生单声道通道(或减少数量通道)信号的操作在图7中通过步骤555示出。
于是,在某些实施例中,单声道通道产生器/编码器305可使用任何合适的编码格式对所产生的单声道通道音频信号(或减少数量的通道)进行编码。例如,在某些实施例中,单声道通道音频信号可使用增强语音服务(EVS)单声道通道编码形式来编码,该形式可包含自适应多速率宽带(AMR-WB)编码译码器的位流互操作性版本。
对单声道通道(或减少数量的通道)进行编码的操作在图7中通过步骤557示出。
于是,编码后的单声道通道信号可被输出。在某些实施例中,编码后的单声道通道信号被输出到多工器,以便与立体声参数编码器205的输出组合,以形成单个流或输出。在某些实施例中,编码后的单声道通道信号与立体声参数编码器205分立地输出。
在某些实施例中,编码器104包括多通道参数编码器。在某些实施例中,多通道参数编码器为立体声参数编码器205或用于对多通道参数进行编码的合适的装置。立体声参数编码器205可被配置为接收多通道参数,例如从通道分析器/单声道编码器203确定的立体声(差)参数。于是,在某些实施例中,立体声参数编码器205可被配置为在参数上进行量化,另外,对参数进行编码,使得它们能被输出(存储在设备上,或传送到另一设备)。
量化以及对量化立体声参数进行编码的操作在图6中通过步骤505示出。
关于图5,更为详细地示出了示例性的立体声参数编码器205。另外,关于图10,示出了根据某些实施例的立体声参数编码器205的操作。
在某些实施例中,立体声参数编码器205被配置为以通道电平差和通道延迟差的形式接收立体声参数。在某些实施例中,立体声参数可被传送到帧延迟451和误差隐藏帧移调/电平编码器454。
接收立体声参数的操作在图10中用步骤901示出。
在某些实施例中,立体声参数编码器205包括帧延迟器451。帧延迟器451被配置为以一帧时间段对立体声参数信息进行延迟。例如,在某些实施例中,帧延迟时间段为10毫秒(ms)。
以帧延迟对立体声参数进型延迟的操作在图10中用步骤902示出。
在某些实施例中,帧延迟立体声参数可被传送到主移调/电平编码器453。
在某些实施例中,立体声参数编码器205包括主移调/电平编码器453。主移调/电平编码器453可在某些实施例中被配置为,接收帧延迟厚的立体声参数,并被配置为产生适合用于输出的编码立体声参数。
在某些实施例中,立体声参数编码器205包括误差隐藏移调/电平编码器454。误差隐藏移调/电平编码器454可在某些实施例中被配置为接收(非延迟)立体声参数,并被配置为产生适合用于输出且在主参数不可用或损坏的情况下用作误差隐藏参数的编码后的立体声参数。
将会明了,在某些实施例中,主移调/电平编码器454和误差隐藏移调/电平编码器454可在同样的元件中实现。例如,在某些实施例中,主移调/电平编码器454可以在硬件和/或软件中实现,误差隐藏移调/电平编码器454至少部分也由其实现。
关于图8,进一步详细示出了示例性的主移调/电平编码器453。
在某些实施例中,主移调/电平编码器453被配置为以帧延迟通道电平差(ILD)和通道延迟差(ITD)的形式接收帧延迟立体声参数。
在某些实施例中,主移调/电平编码器454包括主比特率确定器701。主比特率确定器701可被配置为接收或确定固定比特率,并将该比特率分为用于对帧延迟立体声参数进行编码(换句话说,主立体声编码)的编码位以及对误差隐藏立体声参数进行编码的将要使用的编码位。另外,在某些实施例中主比特率确定器701连同误差隐藏帧移调/电平编码器454中的误差隐藏比特率确定器801可被配置为对主移调差编码器705、主电平差编码器703、误差隐藏移调差编码器805以及误差隐藏电平差编码器803的操作进行控制。
确定主编码率的操作在图10中用步骤904示出。
为了更为充分地阐释由用于主以及误差隐藏编码的主比特率确定器701对比特率的分配和对编码器的控制,这里讨论立体声参数的编码。
在某些实施例中主移调/电平编码器453包括移调(或相关性)差编码器705。移调(或相关性)差编码器705被配置为从立体声参数输入接收帧延迟时刻间或时间间差(ITD)值。另外,在某些实施例中,移调(或相关性)差编码器705被配置为从主比特率确定器701接收这样的输入:其指示多少位将用于对各个帧的延迟ITD值进行编码,或者,换句话说,主移调差编码率。在某些实施例中,来自主比特率确定器701的输入可进一步包括这样的指示:其使得移调差编码器705可以确定将要使用的编码或其变型。
于是,移调差编码器705可被配置为对帧的移调差(ITD)进行编码并输出编码值。
在某些实施例中,仅规定数量的延迟值被编码。例如,仅仅最初的7个延迟值被编码。因此,在这样的实例中,每个帧总共14个延迟值将被编码。
在某些实施例中延迟值为使用2维码本编码或量化的矢量,其中第一维代表帧的第一窗口,第二维代表帧的第二窗口。在这里介绍的最初的7个延迟值被编码的实例中,因此需要7个2维码本。
在某些实施例中,码本用最大编码矢量数量定义。将会明了,编码器可被配置为产生这样的指示符或信号:与之最紧密地关联的编码矢量代表延迟值对。由于存在规定的最大数量编码矢量,这决定了从具有规定数量编码向量的码本对编码向量发信号需要的位数的上限。例如,在每个码本具有最大32个编码矢量的情况下,需要至多5位来对编码矢量中最接近延迟值对的一个发信号。
然而,在某些实施例中,移调差编码器可被配置为以这样的方式对值进行编码:各个2维码本中的编码矢量被排序,使得包含从索引0到索引n-1的编码矢量的任何子码本为n个编码矢量的好码本。换句话说,移调差编码器差生并实现全局码本,其包括这7个2维编码矢量。组合可以为任何合适的编码矢量映射,例如在某些实施例中,对于各个差对的编码矢量被串联为使得对于第一差对的编码矢量具有全局码本索引值1到N1(其中,N1为第一差对的编码矢量的数量),对于第二差对的编码矢量具有全局码本索引值N1+1到N1+N2(其中,N2为第一差对的编码矢量的数量),以此类推。
将会明了,通过将7个2维编码矢量组合到全局码本之中,可以使用较少的位用同样的量化分辨率对编码矢量发信号。另外,通过有选择地组合来自各个码本的编码矢量,需要的位的数量可进一步减少。例如,在矢量量化显示存在极端界外值发生频率极低的情况下,于是,与质心矢量相关联的编码矢量被选择为用在全局码本中。
例如,尽管使用每个码本5位来发信号的7个码本使用35位,在开始的5个码本各自包含11个编码矢量且最后的2个码本包含10个编码矢量的情况下,通过将它们组合为单个全局码本,于是,各个个体编码矢量可使用24位来识别。
或者,换句话说,在主比特率确定器701被配置为指示不是每帧最大数量位数可用于代表差对(例如35位)而是可用更少的位(例如24位)的情况下,于是,移调差编码器705可在某些实施例中被配置为向各个差对(或差对码本)分配若干个编码矢量,其用来自其他码本的其他分配的编码矢量进行全局性索引。在某些实施例中,移调差编码器705可被配置为从初始码本中选择若干个编码矢量,于是,其在全局码本中用来自其他码本的其他选中的编码矢量被全局性索引。因此,例如,移调差编码器可分配每帧24位,其根据下面的分布在原始码本上分配:来自开始的5个码本的11个编码矢量和来自最后的2个码本的10个编码矢量,因为log2(11^5)×(10^2)=23.941。
在某些实施例中,移调差编码器705可被配置为使用下面的表达式确定位数量的分配,以确定使用来自各个码本的多少个编码矢量:
x(i)=ceil(log2(i^7))应当存储在存储器中。
其中,i为对于全局码本选择的每个码本的编码矢量个数,x为从全局码本中选择需要的位数。因此,例如,对于下面的值为i的矢量,存在相关联的x的矢量:
i=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32]
x=[0,7,12,14,17,19,20,21,23,24,25,26,26,27,28,28,29,30,30,31,31,32,32,33,33,33,34,34,35,35,35,35]
或者,作为替代地,如果存在i位,指明一个码本可使用多少编码矢量的变量y(i):
i=[0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35]
y=[1,1,1,1,1,1,1,2,2,2,2,2,3,3,3,4,4,5,5,6,7,8,8,9,10,11,13,14,16,17,18,21,23,26,28,32];
例如,如上面关于24位的分配所讨论的,编码矢量值的个数y(24)=10。
在某些实施例中,移调差编码器可进一步配置为执行编码矢量的二次分配,以试图进一步增大所选择的编码矢量的个数。在某些实施例中,这可通过依次加上来自各个码本的附加编码矢量来进行。例如,根据初始分配而分配的码本编码矢量配置为:
[10101010101010]->23.25位每帧
于是选择来自第一码本的附加编码矢量
[11101010101010]->23.40位每帧
于是选择来自第二码本的附加编码矢量
[11111010101010]->23.53位每帧
以此类推,一直到达到位分配限值
[11111110101010]->23.67位每帧
[11111111101010]->23.80位每帧
[11111111111010]->23.94位每帧
[11111111111110]->24.08位每帧
作为在每帧24位上使用的最后的变型,最高效的是倒数第二个变型,其中,最初的5个买书中的11个编码矢量以及其余两个中的10个编码矢量。
在某些实施例中,移调差编码器705可被配置为根据任何合适的方式且使用对于各个码本的编码矢量索引进行移调差值的编码,产生作为主编码移调差值的全局码本索引。
码本的组合可以为这里介绍的任何合适的编码。
例如,全局编码矢量可在某些实施例中通过下面的表达式来确定:
I=I1*N2*…*Nn-1*Nn+…+In-2*Nn-1*Nn+In-1*Nn+In
其中,I1到In定义来自各个码本的编码矢量索引,且N2到Nn定义各个码本中的编码矢量的数量。
例如,在某些实施例中在对于各个码本获得的索引分别为I1、I2、I3、I4、I5、I6、I7的情况下,全局的14维编码矢量的结果得到的索引可在某些实施例中通过下面的表达式来确定:
I=I1*11^4*10^2+I2*11^3*10^2+I3*11^2*10^2+I4*11*10^2+I5*10^2+I6*10+I7
对于帧的全局编码矢量值于是可输出为延迟帧(X-1)编码移调差值,并传送到多工器455。
对主移调差值进行编码的操作在图10中通过步骤906示出。
在某些实施例中,主移调/电平编码器453包括电平差编码器703。电平差编码器703被配置为接收来自立体声参数输入的帧延迟电平或功率差(ILD)值。另外,在某些实施例中,电平差编码器703被配置为接收来自主比特率确定器701的这样的输入:其指示对于每个帧有多少位将用于对延迟ILD值进行编码,或者,换句话说,主电平差编码率。在某些实施例中,来自主比特率确定器701的输入可进一步包括这样的指示:其使得电平差编码器703能够确定将要使用的编码或其变型。
电平差编码器703于是可被配置为对于帧对电平差(ILD)进行编码,并输出编码值。
在某些实施例中,电平差编码器被配置为作为矢量量化对两个窗口均进行编码。将要编码的电平差的数量依赖于信号带宽(2×12(WB),2×15(SWB),2×17(FB)),在某些实施例中主比特率确定器可被配置为指示每个帧分配给电平差编码器的位的数量,作为分配给移调差编码器的每个帧的位数因子。例如,1/3的位分配给移调差编码器,且2/3的位分配给电平差编码器。在这样的实例中分配给对电平差进行编码的位数为移调差编码的两倍。使用这里讨论的实例,例如这可以为,每帧70位,其中为移调差编码器分配每帧35位。然而,在某些实施例中,例如在分配给移调差的位数为每帧24位的情况下,于是,为电平差编码器分配每帧48位以便对电平差进行编码。
然而,这样也是可行的:为电平差编码分配的位数可从正常情况下减少。
例如,在某些实施例中,电平差编码器可被配置为,基于确定的发生频率以及索引值的Golomb-Rice编码(或者以及其他合适的无序编码),使用索引重新映射,对各个值进行编码需要的位数可平均得到减少。
因此,在理想的情况下,对于各个次频段,用于表示帧中的电平差的位数为每个符号1位。例如,在这样的情况下,电平差编码器可被配置为,对于最普遍电平差的编码,使用15个次频段在SWB运行模式下30位×每帧2个窗口×1位。
在某些实施例中,帧中的电平差之间的相关性可得到利用。如图13所示,电平系数之间的相关性使得,与较高频率对应的电平值高度相关,以及,与同一位置但来自不同窗口对应的值高度相关。例如,在某些实施例中,这可由电平差编码器利用,以便仅仅对来自两个窗口中的一个的值进行编码(当其在解码器上被接收时,复制为另一窗口的值,大致截断所需要的比特率的一半)。
另外,如图14所示,额外位的平均数量对于延迟和电平大约为25位。
在某些实施例中,电平差编码器可进一步配置为逐帧地对差动电平差值进行编码,而不是对绝对电平差值。在某些实施例中,可对这些差动值进一步进行索引映射和Golomb-Rice(或者以及其他合适的无序编码)。
在某些实施例中电平差编码器可被配置为减小量化分辨率,以及通过使用较少表达电平允许以较少位对值进行编码。
电平差编码器因此可被配置为使用较少位,且因此,当与由移调差编码器705使用的位数组合时,使用由主比特率确定器701分配的位(其少于为每帧的立体声参数分配的总位数)。
在某些实施例中,电平差编码器可被配置为,不仅接收用于对电平差编码器编码的位的分配,还进一步配置为将用于当前延迟帧的位数指示传送到主比特率确定器,以便对主电平差进行编码。
对于帧的编码电平差值于是可作为延迟帧(X-1)编码电平差值输出,并传送到多工器455。
对主电平差值进行编码的操作在图10中通过步骤908示出。
关于图9,进一步详细示出示例性的误差隐藏移调/电平编码器454。
在某些实施例中,误差隐藏移调/电平编码器454被配置为以通道电平差(ILD)和通道延迟差(ITD)的形式接收立体声参数。
在某些实施例中,误差隐藏移调/电平编码器454包括误差隐藏比特率确定器801。误差隐藏比特率确定器801可被配置为接收或确定用于对帧的立体声参数进行编码的固定或分配比特率与用于对帧延迟立体声参数进行编码(换句话说,主立体声编码)的比特率之间的差,以确定对误差隐藏立体声参数进行编码将要使用的编码位的数量。另外,如这里所讨论的,在某些实施例中,误差隐藏比特率确定器801可被配置为对误差隐藏移调差编码器805以及误差隐藏电平差编码器803的运行进行控制。
确定误差隐藏编码率的操作在图10中通过步骤905示出。
在某些实施例中,误差隐藏移调编码器454包括误差隐藏(e.c.)移调(或校正)差编码器805。e.c.移调(或校正)差编码器805被配置为从立体声参数输入接收时刻间或时间间的差(ITD)值。另外,在某些实施例中,e.c.移调(或校正)差编码器805被配置为从e.c.比特率确定器801接收这样的输入:其指示将使用多少位来对于各个帧对ITD值进行编码,或者,换句话说,e.c.移调差编码率。在某些实施例中,来自e.c.比特率确定器801的输入可进一步包括这样的指示:其使得e.c.移调差编码器805能够确定将要使用的编码或其变型。
e.c.移调差编码器805于是可被配置为,对于帧对移调差(ITD)进行编码,并输出编码值。
通过类似于这里关于某些实施例中的主编码器介绍的方式,仅规定数量的延迟值被编码。例如,仅仅开头的7个延迟值被编码。因此,在这样的实例中,每一帧总共14个延迟值可被编码。
在某些实施例中延迟值为使用2维码本量化或编码的矢量,其中第一维代表帧的第一窗口,且第二维代表帧的第二窗口。在这里介绍的实例中,在开头的7个延迟值被编码的情况下,因此需要7个2维码本。
在某些实施例中,码本用编码矢量的最大数量来定义。将会明了,编码器可被配置为,产生这样的指示符或信号:最接近地与该指示符或信号相关联的编码矢量代表延迟值对。由于存在规定的最大数量的编码矢量,这决定了对来自具有规定数量编码矢量的码本的编码矢量发信号所需要的位的数量。在某些实施例中,编码矢量的这一数量少于主移调差编码器,且因此,所需要的位的数量少于主移调差编码器。
另外,在某些实施例中,与应用到主编码器的相类似的方法可关于e.c.移调差编码器应用,其中,各个2维码本中的编码矢量被排序,使得包含从索引0到索引n-1的任何码本为n个编码矢量的好码本。换句话说,移调差编码器产生并实现全局码本,其包含多种2维编码矢量。组合可以为编码矢量的任何合适的映射,例如,在某些实施例中,对于各个差对的编码矢量成串连接,使得对于第一差对的编码矢量具有全局码本索引值1到N1(其中,N1为第一差对的编码矢量数量),对于第二差对的编码矢量具有全局码本索引值N1+1到N1+N2(其中,N2为第二差对的编码矢量数量),以此类推。
这样的实施例中,对于帧的全局编码矢量值于是可作为帧(X)编码移调差值输出,并传送到多工器455。
对误差隐藏移调差值进行编码的操作在图10中通过步骤907示出。
在某些实施例中,e.c.移调/电平编码器454包含误差隐藏(e.c.)电平差编码器803。e.c.电平差编码器803被配置为接收来自立体声参数输入的电平或功率差(ILD)值。另外,在某些实施例中,e.c.电平差编码器803被配置为从e.c.比特率确定器801接收这样的输入:其指示对于每一帧将使用多少位来对ILD值进行编码,或者,换句话说,e.c.电平差编码率。在某些实施例中,来自e.c.比特率确定器801的输入可进一步包括这样的指示:其使得e.c.电平差编码器803能够确定将要使用的编码或其变型。
e.c.电平差编码器803于是可被配置为对于帧对电平差(ILD)进行编码,并输出编码值。
在某些实施例中,e.c.电平差编码器803被配置为作为矢量量化对两个窗口均进行编码。将要编码的电平差的数量依赖于信号宽度(2×12(WB),2×15(SWB),2×17(FB))。
在某些实施例中,e.c.比特率确定器801可被配置为将分配给e.c.电平差编码器803的每一帧的位的数量指示为分配给e.c.移调差编码器805的每一帧的位数的因子。例如,1/3的位分配给e.c.移调差编码器,且2/3的位分配给e.c.电平差编码器。在这样的实例中,分配为对e.c.电平差进行编码的位的数量是e.c.移调差编码中的两倍。
然而,以这里关于主电平差编码介绍的类似的方式,e.c.电平差编码器可被配置为试图有对于电平差编码分配的位的数量来改进编码品质。
例如,在某些实施例中,e.c.电平差编码器可被配置为基于确定的发生频率以及Golomb-Rice编码(或者/以及其他合适的无序编码)使用对索引值的索引重新映射,对各个值进行编码所需要的位的数量可平均得到减少。
在某些实施例中,帧内的电平差之间的相关性可得到利用。
在某些实施例中,e.c.电平差编码器可进一步被配置为逐帧地对差动电平差值进行编码,而不是对绝对电平差值。这些差动值可在某些实施例中进一步进行索引映射和Golomb-Rice(或者/以及任何其他合适的无序编码)。
在某些实施例中,e.c.电平差编码器可被配置为减小量化分辨率,并且,通过使用较少表达电平允许用较少得位对值进行编码。
对于帧的编码电平差值于是可作为帧(X)编码电平差值输出,并被传送到多工器455。
对e.c.电平差值进行编码的操作在图10中通过步骤909示出。
在某些实施例中,立体声参数编码器205可包括这样的多工器:其被配置为组合主以及e.c.立体声参数的输出,并输出组合编码立体声参数。
输出主(帧延迟)以及e.c.参数的立体声参数或编码差的操作在图10中通过步骤910示出。
为了充分显示编码译码器的操作,图11和12示出了根据某些实施例的解码器以及解码器的操作。在下面的实例中解码器为立体声解码器,其被配置为接收单声道通道编码音频信号和立体声通道扩展或立体声参数,然而,将会明了,解码器被配置为接收任何数量的通道编码音频信号和通道扩展参数。
在某些实施例中,解码器108包含单声道通道解码器1001。在某些实施例中,单声道通道解码器1001被配置为接收编码单声道通道信号。
接收编码单声道通道音频信号的操作在图12中通过步骤1101示出。
另外,单声道通道解码器1001可被配置为使用对于编码器所示单声道通道编码器反向的过程对编码单声道通道音频信号进行解码。
对单声道通道进行解码的操作在图12中通过步骤1103示出。
在某些实施例中,单声道通道解调器1001可被配置为确定当前帧单声道通道音频信号是否损坏或丢失。例如,在各个帧作为包被接收且当前包丢失(且因此,不存在当前单声道通道音频信号)的情况下,或者,单声道通道音频信号存在数据损坏。在这样的实施例中,单声道通道解码器1001可被配置为由前面的一个(复数个)帧的单声道通道音频信号产生合适的单声道通道音频信号帧(或多于一个通道音频信号帧)。例如,在某些实施例中,可进行前面的帧的单声道通道音频信号的误差隐藏处理。在某些实施例中,这可以为对于当前帧使用前面的帧的单声道通道音频信号。
在某些实施例中,解码器还包括帧延迟/同步器(单声道)1002,其被配置为接收单声道解码器1001的输出,并将解码后的单声道信号输出到立体声通道产生器1009,使得解码后的单声道信号实质上与来自误差隐藏解多工器1007的解码立体声参数同时地接收或同步化。
在某些实施例中,解码器108可包括立体声通道解码器1003。立体声通道解码器1003被配置为接收编码立体声参数。
接收编码立体声参数的操作在图12中通过步骤1102示出。
另外,立体声通道解码器1003可被配置为通过应用与编码器中所应用的反向的过程来对立体声通道信号参数进行解码。例如,立体声通道解码器可被配置为,通过应用主移调差编码器和主电平差编码器的反转来输出解码主立体声参数,以及,通过应用e.c.移调差编码器和e.c.电平差编码器的反转来输出解码e.c.立体声参数。
对立体声参数进行解码的操作在图12中通过步骤1104示出。
立体声通道解码器1103进一步被配置为向误差隐藏解多工器1007输出解码主立体声参数,并向帧延迟/同步器(立体声)1005输出解码e.c.立体声参数。
在某些实施例中,解码器包括帧延迟/同步器(立体声)1005。帧延迟/同步器(立体声)1005可在某些实施例中被配置为接收立体声通道解码器1003的输出,e.c.参数,并将e.c.参数输出到误差隐藏解多工器1007,使得解码后的e.c.参数在帧计数索引方面与解码后的主立体声参数同步化。
对e.c.参数进行延迟的操作在图12中通过步骤1106示出。
在某些实施例中,解码器包括误差隐藏解多工器1007。误差隐藏解多工器1007被配置为接收对于主以及e.c.立体声参数关于共同帧的立体声参数,并被配置为确定对于该帧的主立体声参数是否已经接收到。换句话说,对于当前帧的主立体声参数是否丢失或损坏。
确定主立体声参数是否已经被接收到的操作在图12中通过步骤1107示出。
在某些实施例中,误差隐藏解多工器被配置为当误差隐藏解多工器1007确定为主立体声参数存在或已经被接收到时输出主立体声参数。
在确定主立体声参数已经被接收到之后输出或选择主立体声参数以便输出的操作在图12中通过步骤1109示出。
在某些实施例中,误差隐藏解多工器被配置为,当误差隐藏解多工器1007确定为主立体声参数不存在或尚未接收到或显著损坏时输出e.c.立体声参数。
在确定为主立体声参数丢失或尚未接收到时输出或选择e.c.立体声参数以便输出的操作在图12中通过步骤1111示出。
在某些实施例中,解码器包括立体声通道产生器1009,其被配置为接收解码立体声参数和解码单声道通道并产生立体声通道,换句话说,将电平差应用到单声道通道,以产生第二通道。
由单声道通道和立体声参数产生立体声通道的操作在图12中通过步骤1009示出。
尽管上面的实例介绍了在设备10中的编码器解码器中运行的应用的实施例,将会明了,下面介绍的本发明可实现为任何音频(或语音)编码译码器的一部分,包括任何可变速率/自适应速率音频(或语音)编码译码器。因此,例如,应用的实施例可在这样的音频编码译码器中实现:其可在固定或有线通信路径上实现音频编码。
因此,用户设备可包括例如上面的本申请实施例中所描述的那样的音频编码译码器。
应当明了,术语用户设备旨在涵盖任何合适类型的无线用户设备,例如移动电话、便携式数据处理装置或便携式web浏览器。
另外,公共陆地移动网络(PLMN)的元件也可包括上面所描述的音频编码译码器。
一般而言,本申请的多种实施例可在硬件或专用电路、软件、逻辑或其任何组合中实现。例如,某些方面可以在硬件中实现,而其他方面可在可由控制器、微处理器或其他计算装置执行的固件或软件中实现,但本发明不限于此。尽管本申请的多种方面可示为且描述为框图、流程图或使用某些其他图型表达描述,将会明了,作为非限制性实例,这里介绍的这些块、设备、系统、技术或方法可以在硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算装置或其某种组合中实现。
本申请的实施例可通过例如在处理器实体中可由移动装置的数据处理器执行的计算机软件实现,或通过硬件或软件与硬件的组合来实现。另外,在这一点上,应当注意,附图中的逻辑流程的任何块可代表程序步骤或互相连接的逻辑电路、块和功能,或程序步骤与逻辑电路、块以及功能的组合。
存储器可以为任何适合于本地技术环境的类型,并可使用任何合适的数据存储技术实现,例如基于半导体的存储器装置、磁存储器装置和系统、光存储器装置和系统、固定存储器和可移除存储器。数据处理器可以为任何适合本地技术环境的类型,并且,作为非限制性实例,可包括通用计算机、专用计算机、微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、门级电路(DSP)以及基于多核处理器架构的处理器中的一个以上。
本申请的实施例可以以多种部件实现,例如集成电路模块。集成电路的设计总体来说为高度自动化过程。复杂和强有力的软件工具可用于将逻辑层面的设计转化为准备好在半导体基材上蚀刻和形成的半导体电路设计。
使用良好建立的设计规则以及预存储设计模块库,程序(例如加州圣何塞市的Cadence Design和加州山景市的Synopsys Inc.所提供的)在半导体芯片上自动设置导体路由并放置部件。一旦对于半导体电路的设计已经完成,以标准电子格式(例如Opus、GDSII等)的结果得到的设计可被发送到半导体制造工厂或制造厂以便制造。
如本申请中所使用的,术语电路指的是以下全部:
(a)仅为硬件的电路实现(例如仅为模拟和/或数字电路的实现),以及
(b)电路和软件(和/或固件)的组合,例如:(i)处理器的组合或(ii)处理器/软件(包括数字信号处理器)、软件和存储器的部分,其一起工作,以使得例如移动电话或服务器的设备执行多种功能,以及
(c)电路,例如微处理器或微处理器的部分,其需要软件或固件来运行,即使软件或固件物理上不存在。
电路的这种定义适用于此术语在本申请中的所有应用,包括任何权利要求中。作为另一实例,如本申请中所使用的,术语“电路”还将涵盖单纯处理器(或多个处理器)或处理器的一部分及其伴有的软件和/或固件的实现。例如且如果对于特定权利要求元素适用的话,电路还可涵盖用于移动电话的宽带集成电路或应用处理器集成电路或服务器、蜂窝网络装置或其他网络装置中的类似的集成电路。
上面的介绍已经通过示例性且非限制性实例的方式提供了对本发明的示例性实施例的全面且信息型的介绍。然而,在结合附图和所附权利要求阅读的情况下,在前面的介绍的启示下,本领域技术人员可想到多种修改和适应。然而,本发明的教导下的所有这些以及类似修改还将属于如所附权利要求所规定的本发明的范围。

Claims (26)

1.一种方法,其包括:
确定对于至少一个第一帧音频信号多通道参数的第一编码比特率以及对于至少一个第二帧音频信号多通道参数的第二编码比特率,其中,组合的第一与第二编码比特率小于比特率限值;
对于第一帧,确定所述至少一个第一帧音频信号多通道参数;
从所述至少一个第一帧音频信号多通道参数,在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数;
对于第二帧,确定所述至少一个第二帧音频信号多通道参数;
从所述至少一个第二帧音频信号多通道参数,在第二编码比特率范围内产生编码后的至少一个第二帧音频信号多通道参数;以及
组合编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。
2.根据权利要求1的方法,其中,第一帧为下列中的至少一种:
与第二帧相邻;以及
在第二帧之前。
3.根据权利要求1或2的方法,其中,对于第一帧确定所述至少一个第一帧音频信号多通道参数或对于第二帧确定所述至少一个第二帧音频信号多通道参数包括确定下列中的至少一个:
至少一个耳间时间差;以及
至少一个耳间电平差。
4.根据权利要求1到3的方法,其中,从所述至少一个第一帧音频信号多通道参数在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数或从所述至少一个第二帧音频信号多通道参数在第二编码比特率范围内产生编码后的第二帧音频信号多通道参数包括:
使用分立的矢量量化码本,产生分别用于所述至少一个第一帧音频信号多通道参数或所述至少一个第二帧音频信号多通道参数的组的码本索引;
从分立的量化码本,产生组合矢量量化码本;以及
从对于组的码本索引,对于组合的矢量量化码本,产生组合矢量量化索引,其中,用于识别组合矢量量化索引的位的个数少于用于分立组的码本索引所使用的组合位数。
5.根据权利要求4的方法,其中,从分立的量化码本产生组合矢量量化码本包括:
从分立的矢量量化码本选择至少一个编码矢量;以及
对来自分立的矢量量化码本的所述至少一个编码矢量进行组合。
6.根据权利要求5的方法,其中,从分立的矢量量化码本选择至少一个编码矢量包括:
确定将从分立的矢量量化码本选择的第一数量的编码矢量;以及
增大第一数量,一直到达到第一或第二相应的编码比特率。
7.根据权利要求1到6的方法,其中,从所述至少一个第一帧音频信号多通道参数在第一编码比特率的范围内产生编码后的第一帧音频信号多通道参数包括:
依赖于所述至少一个第一帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第一帧音频信号多通道参数,产生具有所关联的索引的第一编码映射;以及
依赖于所关联的索引,对第一编码映射进行编码。
8.根据权利要求7的方法,其中,依赖于所关联的索引对第一编码映射进行编码包括,依赖于所关联的索引,将Golomb-Rice编码应用到第一编码映射。
9.根据权利要求1到8的方法,其中,从所述至少一个第二帧音频信号多通道参数在第二编码比特率的范围内产生编码后的第二帧音频信号多通道参数包括:
依赖于所述至少一个第二帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第二帧音频信号多通道参数,产生具有所关联的索引的第二编码映射;以及
依赖于所关联的索引,对第二编码映射进行编码。
10.根据权利要求9的方法,其中,依赖于所关联的索引对第二编码映射进行编码包括,依赖于所关联的索引,将Golomb-Rice编码应用到第二编码映射。
11.根据权利要求1到10的方法,其还包括:
接收两个或多于两个语音信号通道;
从所述至少两个音频信号通道以及所述至少一个第一帧音频信号多通道参数,确定较少数量通道音频信号;
在包单声道比特率限值范围内,产生包括所述较少数量通道的编码后的音频信号;
组合编码后的音频信号、编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。
12.一种方法,其包括:
在第一时间段内接收包括至少一个第一帧音频信号、至少一个第一帧音频信号多通道参数以及至少一个另一帧音频信号多通道参数的已编码音频信号,并在另一时间段内接收包括至少一个另一帧音频信号的另一已编码音频信号;
判断所述另一已编码音频信号是否包括至少一个另一帧音频信号多通道参数和/或所述至少一个另一帧音频信号多通道参数是否损坏;以及
当所述另一已编码音频信号不包括至少一个另一帧音频信号多通道参数或所述至少一个另一帧音频信号多通道参数损坏时,对于所述另一帧,从所述至少一个第一帧音频信号或所述至少一个另一帧音频信号两者中的任一个产生至少两个通道音频信号,并且对于已编码音频信号产生至少一个另一帧音频信号多通道参数。
13.根据权利要求12的方法,其还包括,当所述另一已编码音频信号包括所述至少一个另一帧音频信号多通道参数且所述至少一个另一帧音频信号多通道参数未损坏时,对于所述另一帧,从所述另一帧音频信号产生至少两个通道音频信号,并且对于所述另一已编码音频信号产生至少一个另一帧音频信号多通道参数。
14.一种设备,其被配置为:
确定对于至少一个第一帧音频信号多通道参数的第一编码比特率以及对于至少一个第二帧音频信号多通道参数的第二编码比特率,其中,组合的第一与第二编码比特率小于比特率限值;
对于第一帧,确定所述至少一个第一帧音频信号多通道参数;
从所述至少一个第一帧音频信号多通道参数,在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数;
对于第二帧,确定所述至少一个第二帧音频信号多通道参数;
从所述至少一个第二帧音频信号多通道参数,在第二编码比特率范围内产生编码后的至少一个第二帧音频信号多通道参数;以及
组合编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。
15.根据权利要求14的设备,其中,第一帧为下列中的至少一种:
与第二帧相邻;以及
在第二帧之前。
16.根据权利要求14和15的设备,其中,被配置为对于第一帧确定所述至少一个第一帧音频信号多通道参数或对于第二帧确定所述至少一个第二帧音频信号多通道参数的设备进一步被配置为确定下列中的至少一个:
至少一个耳间时间差;以及
至少一个耳间电平差。
17.根据权利要求14-16的设备,其中,被配置为从所述至少一个第一帧音频信号多通道参数在第一编码比特率范围内产生编码后的第一帧音频信号多通道参数或从所述至少一个第二帧音频信号多通道参数在第二编码比特率范围内产生编码后的第二帧音频信号多通道参数的设备进一步被配置为:
使用分立的矢量量化码本,产生分别用于所述至少一个第一帧音频信号多通道参数或所述至少一个第二帧音频信号多通道参数的组的码本索引;
从分立的量化码本,产生组合矢量量化码本;以及
从对于组的码本索引,对于组合的矢量量化码本,产生组合矢量量化索引,其中,用于识别组合矢量量化索引的位的个数少于用于分立组的码本索引所使用的组合位数。
18.根据权利要求17的设备,其中,被配置为从分立的量化码本产生组合矢量量化码本的设备进一步被配置为:
从分立的矢量量化码本选择至少一个编码矢量;以及
对来自分立的矢量量化码本的所述至少一个编码矢量进行组合。
19.根据权利要求18的设备,其中,被配置为从分立的矢量量化码本选择至少一个编码矢量的设备进一步被配置为:
确定将从分立的矢量量化码本选择的第一数量的编码矢量;以及
增大第一数量,一直到达到第一或第二相应的编码比特率。
20.根据权利要求14-19的设备,其中,被配置为从所述至少一个第一帧音频信号多通道参数在第一编码比特率的范围内产生编码后的第一帧音频信号多通道参数的设备进一步被配置为:
依赖于所述至少一个第一帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第一帧音频信号多通道参数,产生具有所关联的索引的第一编码映射;以及
依赖于所关联的索引,对第一编码映射进行编码。
21.根据权利要求20的设备,其中,被配置为依赖于所关联的索引对第一编码映射进行编码的设备进一步被配置为:依赖于所关联的索引,将Golomb-Rice编码应用到第一编码映射。
22.根据权利要求14-21的设备,其中,被配置为从所述至少一个第二帧音频信号多通道参数在第二编码比特率的范围内产生编码后的第二帧音频信号多通道参数的设备进一步被配置为:
依赖于所述至少一个第二帧音频信号多通道参数的映射实例的频率分布,对于所述至少一个第二帧音频信号多通道参数,产生具有所关联的索引的第二编码映射;以及
依赖于所关联的索引,对第二编码映射进行编码。
23.根据权利要求22的设备,其中,被配置为依赖于所关联的索引对第二编码映射进行编码的设备进一步被配置为:依赖于所关联的索引,将Golomb-Rice编码应用到第二编码映射。
24.根据权利要求14-23的设备,其中,该设备进一步被配置为:
接收两个或多于两个语音信号通道;
从所述两个或多于两个音频信号通道以及所述至少一个第一帧音频信号多通道参数,确定较少数量通道音频信号;
在包比特率限值范围内,产生编码后的音频信号;组合编码后的音频信号、编码后的至少一个第一帧音频信号多通道参数和编码后的至少一个第二帧音频信号多通道参数。
25.一种设备,其被配置为:
在第一时间段内接收包括至少一个第一帧音频信号、至少一个第一帧音频信号多通道参数以及至少一个另一帧音频信号多通道参数的已编码音频信号,并在另一时间段内接收包括至少一个另一帧音频信号的另一已编码音频信号;
判断另一已编码音频信号是否包括至少一个另一帧音频信号多通道参数和/或所述至少一个另一帧音频信号多通道参数是否损坏;以及
当所述另一编码音频信号不包括至少一个另一帧音频信号多通道参数或所述至少一个另一帧音频信号多通道参数损坏时,对于所述另一帧,从所述至少一个第一帧音频信号或所述至少一个另一帧音频信号两者中的任一个产生至少两个通道音频信号,并且对已编码音频信号产生至少一个另一帧音频信号多通道参数。
26.根据权利要求25的设备,其中,该设备进一步被配置为:当所述另一编码音频信号包括所述至少一个另一帧音频信号多通道参数且所述至少一个另一帧音频信号多通道参数未损坏时,对于所述另一帧从所述至少一个另一帧音频信号产生至少两通道音频信号,并且对于所述另一编码音频信号产生至少一个另一帧音频信号多通道参数。
CN201410008366.3A 2013-01-08 2014-01-08 音频信号编码器 Expired - Fee Related CN103915098B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
WOPCT/IB2013/050154 2013-01-08
PCT/IB2013/050154 WO2014108738A1 (en) 2013-01-08 2013-01-08 Audio signal multi-channel parameter encoder

Publications (2)

Publication Number Publication Date
CN103915098A true CN103915098A (zh) 2014-07-09
CN103915098B CN103915098B (zh) 2017-03-01

Family

ID=49766927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410008366.3A Expired - Fee Related CN103915098B (zh) 2013-01-08 2014-01-08 音频信号编码器

Country Status (4)

Country Link
US (1) US9280976B2 (zh)
EP (1) EP2752845B1 (zh)
CN (1) CN103915098B (zh)
WO (1) WO2014108738A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107182009A (zh) * 2016-03-10 2017-09-19 联发科技股份有限公司 音频同步方法及相关电子设备
CN107431569A (zh) * 2015-03-12 2017-12-01 瑞典爱立信有限公司 电路交换系统中的速率控制
CN107771346A (zh) * 2015-06-17 2018-03-06 三星电子株式会社 实现低复杂度格式转换的内部声道处理方法和装置
WO2019029737A1 (zh) * 2017-08-10 2019-02-14 华为技术有限公司 音频编解码模式确定方法和相关产品
CN110235197A (zh) * 2017-01-31 2019-09-13 诺基亚技术有限公司 立体声音频信号编码器
CN110366752A (zh) * 2019-05-21 2019-10-22 深圳市汇顶科技股份有限公司 一种语音分频传输方法、源端、播放端、源端电路和播放端电路
CN112970063A (zh) * 2018-10-29 2021-06-15 杜比国际公司 用于利用生成模型的码率质量可分级编码的方法及设备

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014147441A1 (en) 2013-03-20 2014-09-25 Nokia Corporation Audio signal encoder comprising a multi-channel parameter selector
US9659569B2 (en) 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
EP3095117B1 (en) 2014-01-13 2018-08-22 Nokia Technologies Oy Multi-channel audio signal classifier
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
US10347258B2 (en) * 2015-11-13 2019-07-09 Hitachi Kokusai Electric Inc. Voice communication system
US9978381B2 (en) 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10217468B2 (en) * 2017-01-19 2019-02-26 Qualcomm Incorporated Coding of multiple audio signals
JP7371133B2 (ja) * 2019-06-13 2023-10-30 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 時間反転されたオーディオサブフレームエラー隠蔽

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6298071B1 (en) * 1998-09-03 2001-10-02 Diva Systems Corporation Method and apparatus for processing variable bit rate information in an information distribution system
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
EP1746751B1 (en) * 2004-06-02 2009-09-30 Panasonic Corporation Audio data receiving apparatus and audio data receiving method
US20060088093A1 (en) * 2004-10-26 2006-04-27 Nokia Corporation Packet loss compensation
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US20090164223A1 (en) * 2007-12-19 2009-06-25 Dts, Inc. Lossless multi-channel audio codec
EP2301015B1 (en) * 2008-06-13 2019-09-04 Nokia Technologies Oy Method and apparatus for error concealment of encoded audio data
US8848925B2 (en) 2009-09-11 2014-09-30 Nokia Corporation Method, apparatus and computer program product for audio coding
PT2483887T (pt) * 2009-09-29 2017-10-23 Dolby Int Ab Descodificador de sinal de áudio mpeg-saoc, método para fornecer uma representação de sinal de mistura ascendente usando descodificação mpeg-saoc e programa de comutador usando um valor comum de parâmetros de correlação inter-objetos dependente de tempo/frequência
JP5752134B2 (ja) * 2009-10-15 2015-07-22 オランジュ 最適化された低スループットパラメトリック符号化/復号化
EP2668651A4 (en) 2011-01-28 2014-07-30 Nokia Corp CODING BY COMBINING CODE VECTORS
US9026434B2 (en) * 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
KR101647576B1 (ko) 2012-05-29 2016-08-10 노키아 테크놀로지스 오와이 스테레오 오디오 신호 인코더
WO2014013294A1 (en) 2012-07-19 2014-01-23 Nokia Corporation Stereo audio signal encoder
US9613660B2 (en) * 2013-04-05 2017-04-04 Dts, Inc. Layered audio reconstruction system
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107431569B (zh) * 2015-03-12 2020-10-09 瑞典爱立信有限公司 用于电路交换系统中的速率控制的方法和设备
CN107431569A (zh) * 2015-03-12 2017-12-01 瑞典爱立信有限公司 电路交换系统中的速率控制
CN107771346B (zh) * 2015-06-17 2021-09-21 三星电子株式会社 实现低复杂度格式转换的内部声道处理方法和装置
CN107771346A (zh) * 2015-06-17 2018-03-06 三星电子株式会社 实现低复杂度格式转换的内部声道处理方法和装置
US11404068B2 (en) 2015-06-17 2022-08-02 Samsung Electronics Co., Ltd. Method and device for processing internal channels for low complexity format conversion
US11810583B2 (en) 2015-06-17 2023-11-07 Samsung Electronics Co., Ltd. Method and device for processing internal channels for low complexity format conversion
CN107182009A (zh) * 2016-03-10 2017-09-19 联发科技股份有限公司 音频同步方法及相关电子设备
CN110235197A (zh) * 2017-01-31 2019-09-13 诺基亚技术有限公司 立体声音频信号编码器
CN110235197B (zh) * 2017-01-31 2024-01-26 诺基亚技术有限公司 立体声音频信号编码器
WO2019029737A1 (zh) * 2017-08-10 2019-02-14 华为技术有限公司 音频编解码模式确定方法和相关产品
US11120807B2 (en) 2017-08-10 2021-09-14 Huawei Technologies Co., Ltd. Method for determining audio coding/decoding mode and related product
US11935547B2 (en) 2017-08-10 2024-03-19 Huawei Technologies Co., Ltd. Method for determining audio coding/decoding mode and related product
CN112970063A (zh) * 2018-10-29 2021-06-15 杜比国际公司 用于利用生成模型的码率质量可分级编码的方法及设备
CN110366752A (zh) * 2019-05-21 2019-10-22 深圳市汇顶科技股份有限公司 一种语音分频传输方法、源端、播放端、源端电路和播放端电路
CN110366752B (zh) * 2019-05-21 2023-10-10 深圳市汇顶科技股份有限公司 一种语音分频传输方法、源端、播放端、源端电路和播放端电路

Also Published As

Publication number Publication date
CN103915098B (zh) 2017-03-01
EP2752845A3 (en) 2014-09-03
EP2752845A2 (en) 2014-07-09
US20140195253A1 (en) 2014-07-10
WO2014108738A1 (en) 2014-07-17
EP2752845B1 (en) 2015-09-09
US9280976B2 (en) 2016-03-08

Similar Documents

Publication Publication Date Title
CN103915098A (zh) 音频信号编码器
CN106463138A (zh) 用于形成音频信号有效载荷的方法、装置和音频信号有效载荷
CN104509130B (zh) 立体声音频信号编码器
US9865269B2 (en) Stereo audio signal encoder
US9659569B2 (en) Audio signal encoder
US20150371643A1 (en) Stereo audio signal encoder
CN101542596A (zh) 用于编码和解码基于对象的音频信号的方法和装置
US10199044B2 (en) Audio signal encoder comprising a multi-channel parameter selector
WO2019105575A1 (en) Determination of spatial audio parameter encoding and associated decoding
CN109215668B (zh) 一种声道间相位差参数的编码方法及装置
WO2018142017A1 (en) Stereo audio signal encoder
WO2019106221A1 (en) Processing of spatial audio parameters
WO2020008112A1 (en) Energy-ratio signalling and synthesis
WO2019243670A1 (en) Determination of spatial audio parameter encoding and associated decoding
RU2648632C2 (ru) Классификатор многоканального звукового сигнала
KR20230135665A (ko) 공간 오디오 파라미터 인코딩 및 관련 디코딩 결정
CN117136406A (zh) 组合空间音频流

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160107

Address after: Espoo, Finland

Applicant after: Technology Co., Ltd. of Nokia

Address before: Espoo, Finland

Applicant before: Nokia Oyj

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170301

Termination date: 20200108

CF01 Termination of patent right due to non-payment of annual fee