CN104364842A - 立体声音频信号编码器 - Google Patents
立体声音频信号编码器 Download PDFInfo
- Publication number
- CN104364842A CN104364842A CN201280073988.3A CN201280073988A CN104364842A CN 104364842 A CN104364842 A CN 104364842A CN 201280073988 A CN201280073988 A CN 201280073988A CN 104364842 A CN104364842 A CN 104364842A
- Authority
- CN
- China
- Prior art keywords
- signal
- channel
- coding
- audio signal
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Abstract
一种装置,包括:声道分析器,被配置成分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异关联的至少一个参数;编码模式确定器,被配置成取决于该至少一个参数来选择多声道音频信号编码;以及声道编码器,被配置成用多声道音频信号编码对音频信号进行编码。
Description
技术领域
本申请涉及立体声音频信号编码器,更具体但非排他地涉及用于在便携式装置中使用的立体声音频信号编码器。
背景技术
音频信号、如语音或音乐被编码例如以使得能够高效地传输或存储音频信号。
音频编码器和解码器(也被称为编解码器)用来代表基于音频的信号、诸如音乐和环境声音(其在语音编码方面可以被称为背景噪声)。这些类型的编码器通常未使用用于编码处理的语音模型,相反,它们使用用于代表所有类型的音频信号、包括语音的处理。语音编码器和解码器(编解码器)可以被认为是对于语音信号被最优化的音频编解码器,并且可以在固定或可变比特率操作。
音频编解码器还可以被配置成以变化的比特率操作。在较低的比特率,这样的音频编解码器可以被最优化以便在等效于纯语音编解码器的编码速率与语音信号一起工作。在较高的比特率,音频编解码器可以以较高的质量和性能对任何信号、包括音乐、背景噪声和语音进行编码。可变速率音频编解码器还可以实施嵌入式可扩展编码结构和比特流,其中附加比特(特定数量的比特通常被称为层)在较低速率时改进编码,并且其中可以截断较高速率的比特流以获得较低速率编码的比特流。这样的音频编解码器可以使用纯粹被设计用于语音信号的编解码器作为核心层或最低比特率编码。
音频编解码器被设计成维持高的(感知)质量同时改善压缩比。因此,取代波形匹配编码,通常采用各种参数方案以降低比特率。对于多声道音频、诸如立体声信号,通常在单声声道表示上使用较大数量的可用比特率并且对立体声或多声道信息进行编码以开发使用相对较少比特的参数方法。
现实生活中可用的多声道信号类型包括双声道立体声和近远立体声表示。双声道立体声是指通常通过用两个麦克风记录声音而获得的立体声信号,这两个麦克风被布置成意图是为听众创建自然地三维立体声或空间声音感觉。这样的麦克风布置通常包括仿真头,其中将在仿真头耳朵中的麦克风放置在真人的每个耳朵附近,或者甚至将两个麦克风放置成彼此相距人耳的一般距离(通常使得两个麦克风之间的直达声被阻塞)。另一方面,近远立体声是指与通常通过用两个麦克风记录声音获得的立体声信号兼容的立体声,这两个麦克风被布置成使得一个麦克风靠近主声源、例如人嘴,而另一麦克风稍微远离(例如,如果使用规则移动电话形式因子则靠近人耳)并且更专注于记录周围声音。在这样的情况下,近声道可以直接用作单声输入信号。
在使用头戴式耳机进行回放时,双声道立体声记录的感知通常使得正在倾听的人感觉好像他们自身在记录环境中。另一方面,近远立体声表示可以被回放,使得一个耳朵接收近声道而另一耳朵接收远声道音频信息。因此,该体验相似于在一个耳朵中收听说话者而通过另一耳朵收听记录环境的周围声音而非他们自己的环境声音的传统的单耳电话呼叫。因此这两个现实生活立体声信号类型都可以被认为是向听众提供的、具有记录环境的自然和享受的感觉的表示。
发明内容
根据第一方面,提供一种方法,包括:分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异关联的至少一个参数;取决于至少一个参数来选择多声道音频信号编码;以及用多声道音频信号编码对音频信号进行编码。
分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异关联的至少一个参数可以包括:生成用于音频信号的至少两个音频声道的频域表示;将用于音频信号的至少两个音频声道的频域表示划分到至少两个频带中;以及针对频带生成与两个音频声道之间的差异关联的至少一个参数。
参数可以包括以下各项中的至少一项:与至少两个音频声道关联的相对能量信号电平;与至少两个音频声道关联的相关值;以及与至少两个音频声道关联的时移值。
取决于至少一个参数来选择多声道音频信号编码可以包括:选择初始默认多声道音频信号编码;取决于至少一个参数的第一选择来选择第二音频信号多声道音频信号编码;以及取决于至少一个参数的第二选择来维持第二音频信号多声道音频信号编码。
至少一个参数的第一选择可以是与至少两个音频声道关联的相对能量信号电平与相关值的组合,并且其中取决于至少一个参数的第一选择来选择第二音频信号多声道音频信号编码可以包括:在组合大于确定阈值的情况下选择第二音频信号多声道音频信号编码。
至少一个参数的第二选择可以是与至少两个音频声道关联的相对能量信号电平,并且其中维持第二音频信号多声道音频信号编码可以包括:在相对能量信号电平小于第二确定阈值的情况下维持第二音频信号多声道音频信号编码。
多声道音频信号编码可以包括以下各项中的至少一项:双声道编码;以及近远立体声编码。
用多声道音频信号编码对音频信号进行编码可以包括:组合至少两个音频声道以形成单个组合声道音频信号;对单个组合声道音频信号进行编码;以及通过使用多声道音频信号编码来生成与至少两个音频声道关联的数据,使得数据使得能够根据单个组合声道音频信号来重现至少两个音频声道。
根据第二方面,提供一种方法,包括:接收编码音频信号;取决于编码音频信号的第一部分来选择多声道音频信号解码;以及对编码音频信号的第二部分进行解码以致对编码音频信号的第二部分进行解码生成包括至少两个音频声道的音频信号,该音频信号的第二部分是利用多声道音频信号编码来编码的。
对编码音频信号的第二部分进行解码可以包括:根据编码音频信号的第二部分的第一分段生成第一声道音频信号;以及取决于由编码音频信号的第一部分所指示的多声道音频信号解码来根据编码音频信号的第二部分的第二分段生成至少一个另外的声道音频信号。
第一声道可以是左声道音频信号,并且至少一个另外的声道音频信号可以是右声道音频信号。
第一声道可以是组合声道音频信号,并且至少一个另外的声道音频信号可以包括左声道信号和右声道音频信号。
根据第三方面,提供一种方法,包括:对于至少包括一对音频声道的音频信号确定至少一个声道对距离值;用多声道音频信号编码对音频信号进行编码以至少生成编码信号和差异信号;以及取决于差异信号、至少一个声道对距离值和编码声道距离值来生成等效差异信号。
该方法还可以包括接收所述编码声道距离值。
接收所述编码声道距离值可以包括以下各项中的至少一项:根据用户输入确定编码声道距离值;以及从解码器接收编码声道距离值。
该方法可以包括从一对麦克风接收音频信号,其中第一音频声道可以来自第一麦克风并且第二音频声道可以来自第二麦克风,其中确定至少一个声道对距离值可以包括确定第一麦克风与第二麦克风之间的距离。
根据第四方面,提供一种方法,包括:接收编码信号和等效差异信号;取决于编码信号和等效差异信号来重现具有确定声道距离的一对音频声道。
该方法还可以包括:确定编码声道距离值;以及取决于编码信号、等效差异信号、编码声道距离值和期望声道距离来生成具有期望声道距离的一对音频声道。
根据第五方面,提供一种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的至少一个存储器,至少一个存储器和计算机程序代码被配置成与至少一个处理器一起使该装置至少执行:分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异关联的至少一个参数;取决于至少一个参数来选择多声道音频信号编码;以及用多声道音频信号编码对音频信号进行编码。
分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异关联的至少一个参数可以使该装置执行:生成用于音频信号的至少两个音频声道的频域表示;将用于音频信号的至少两个音频声道的频域表示划分到至少两个频带中;以及针对频带生成与两个音频声道之间的差异关联的至少一个参数。
参数可以包括以下各项中的至少一项:与至少两个音频声道关联的相对能量信号电平;与至少两个音频声道关联的相关值;以及与至少两个音频声道关联的时移值。
取决于至少一个参数来选择多声道音频信号编码可以使该装置执行:选择初始默认多声道音频信号编码;取决于至少一个参数的第一选择来选择第二音频信号多声道音频信号编码;以及取决于至少一个参数的第二选择来维持第二音频信号多声道音频信号编码。
至少一个参数的第一选择可以是与至少两个音频声道关联的相对能量信号电平与相关值的组合,并且其中取决于至少一个参数的第一选择来选择第二音频信号多声道音频信号编码可以使该装置执行:在组合大于确定阈值的情况下选择第二音频信号多声道音频信号编码。
至少一个参数的第二选择可以是与至少两个音频声道关联的相对能量信号电平,并且其中维持第二音频信号多声道音频信号编码可以使该装置执行:在相对能量信号电平小于第二确定阈值的情况下维持第二音频信号多声道音频信号编码。
多声道音频信号编码可以包括以下各项中的至少一项:双声道编码;以及近远立体声编码。
用多声道音频信号编码对音频信号进行编码可以使该装置执行:组合至少两个音频声道以形成单个组合声道音频信号;对单个组合声道音频信号进行编码;以及通过使用多声道音频信号编码来生成与至少两个音频声道关联的数据,使得数据使得能够根据单个组合声道音频信号来重现至少两个音频声道。
根据第六方面,提供一种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的至少一个存储器,至少一个存储器和计算机程序代码被配置成与至少一个处理器一起使该装置至少执行:接收编码音频信号;取决于编码音频信号的第一部分来选择多声道音频信号解码;以及对编码音频信号的第二部分进行解码以致对编码音频信号的第二部分进行解码生成包括至少两个音频声道的音频信号,该音频信号的第二部分是利用多声道音频信号编码来编码的。
对所述编码音频信号的第二部分进行解码可以使该装置执行:根据编码音频信号的第二部分的第一分段生成第一声道音频信号;以及取决于由编码音频信号的第一部分所指示的多声道音频信号解码来根据编码音频信号的第二部分的第二分段生成至少一个另外的声道音频信号。
第一声道可以是左声道音频信号,并且至少一个另外的声道音频信号可以是右声道音频信号。
第一声道可以是组合声道音频信号,并且至少一个另外的声道音频信号可以包括左声道信号和右声道音频信号。
根据第七方面,提供一种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的至少一个存储器,至少一个存储器和计算机程序代码被配置成与至少一个处理器一起使该装置至少执行:对于至少包括一对音频声道的音频信号确定至少一个声道对距离值;用多声道音频信号编码对音频信号进行编码以至少生成编码信号和差异信号;以及取决于差异信号、至少一个声道对距离值和编码声道距离值来生成等效差异信号。
还可以使该装置执行:接收编码声道距离值。
接收所述编码声道距离值可以使该装置执行以下各项中的至少一项:根据用户输入确定编码声道距离值;以及从解码器接收编码声道距离值。
还可以使该装置执行:从一对麦克风接收音频信号,其中第一音频声道可以来自第一麦克风并且第二音频声道可以来自第二麦克风,其中确定至少一个声道对距离值可以包括:确定第一麦克风与第二麦克风之间的距离。
根据第八方面,提供一种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的至少一个存储器,至少一个存储器和计算机程序代码被配置成与至少一个处理器一起使该装置至少执行:接收编码信号和等效差异信号;以及取决于编码信号和等效差异信号来重现具有确定声道距离的一对音频声道。
还可以使该装置执行:确定编码声道距离值;以及取决于编码信号、等效差异信号、编码声道距离值和期望声道距离来生成具有期望声道距离的一对音频声道。
根据第九方面,提供一种装置,包括:用于分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异关联的至少一个参数的装置;用于取决于至少一个参数来选择多声道音频信号编码的装置;以及用于用多声道音频信号编码对音频信号进行编码的装置。
用于分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异关联的至少一个参数的装置可以包括:用于生成用于音频信号的至少两个音频声道的频域表示的装置;用于将用于音频信号的至少两个音频声道的频域表示划分到至少两个频带中的装置;以及用于针对频带生成与两个音频声道之间的差异关联的至少一个参数的装置。
参数可以包括以下各项中的至少一项:与至少两个音频声道关联的相对能量信号电平;与至少两个音频声道关联的相关值;以及与至少两个音频声道关联的时移值。
用于取决于至少一个参数来选择多声道音频信号编码的装置可以包括:用于选择初始默认多声道音频信号编码的装置;用于取决于至少一个参数的第一选择来选择第二音频信号多声道音频信号编码的装置;以及用于取决于至少一个参数的第二选择来维持第二音频信号多声道音频信号编码的装置。
至少一个参数的第一选择可以是与至少两个音频声道关联的相对能量信号电平与相关值的组合,并且其中取决于至少一个参数的第一选择来选择第二音频信号多声道音频信号编码可以包括用于在组合大于确定阈值的情况下选择第二音频信号多声道音频信号编码的装置。
至少一个参数的第二选择可以是与至少两个音频声道关联的相对能量信号电平,并且其中维持第二音频信号多声道音频信号编码可以包括用于在相对能量信号电平小于第二确定阈值的情况下维持第二音频信号多声道音频信号编码的装置。
多声道音频信号编码可以包括以下各项中的至少一项:双声道编码;以及近远立体声编码。
用于用多声道音频信号编码对音频信号进行编码的装置可以包括:用于组合至少两个音频声道以形成单个组合声道音频信号的装置;用于对单个组合声道音频信号进行编码的装置;以及用于通过使用多声道音频信号编码来生成与至少两个音频声道关联的数据使得数据使得能够根据单个组合声道音频信号来重现至少两个音频声道的装置。
根据第十方面,提供一种装置,包括:用于接收编码音频信号的装置;用于取决于编码音频信号的第一部分来选择多声道音频信号解码的装置;以及用于对编码音频信号的第二部分进行解码以致对编码音频信号的第二部分进行解码生成包括至少两个音频声道的音频信号的装置,该音频信号的第二部分是利用多声道音频信号编码来编码的。
用于对编码音频信号的第二部分进行解码的装置可以包括:用于根据编码音频信号的第二部分的第一分段生成第一声道音频信号的装置;以及用于取决于由编码音频信号的第一部分所指示的多声道音频信号解码来根据编码音频信号的第二部分的第二分段生成至少一个另外的声道音频信号的装置。
第一声道可以是左声道音频信号,并且至少一个另外的声道音频信号可以是右声道音频信号。
第一声道可以是组合声道音频信号,并且至少一个另外的声道音频信号可以包括左声道信号和右声道音频信号。
根据第十一方面,提供一种装置,包括:用于对于至少包括一对音频声道的音频信号确定至少一个声道对距离值的装置;用于用多声道音频信号编码对音频信号进行编码以至少生成编码信号和差异信号的装置;以及用于取决于差异信号、至少一个声道对距离值和编码声道距离值来生成等效差异信号的装置。
该装置还可以包括用于接收编码声道距离值的装置。
用于接收编码声道距离值的装置可以包括以下各项中的至少一项:用于根据用户输入确定编码声道距离值的装置;以及用于从解码器接收编码声道距离值的装置。
该装置还可以包括用于从一对麦克风接收音频信号的装置,其中第一音频声道可以来自第一麦克风并且第二音频声道可以来自第二麦克风,其中用于确定至少一个声道对距离值的装置可以包括:用于确定第一麦克风与第二麦克风之间的距离的装置。
根据第十二方面,提供一种装置,包括:用于接收编码信号和等效差异信号的装置;以及用于取决于编码信号和等效差异信号来重现具有确定声道距离的一对音频声道的装置。
该装置可以包括:用于确定编码声道距离值的装置;以及用于取决于编码信号、等效差异信号、编码声道距离值和期望声道距离来生成具有期望声道距离的一对音频声道的装置。
根据第十三方面,提供一种装置,包括:声道分析器,被配置成分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异关联的至少一个参数;编码模式确定器,被配置成取决于至少一个参数来选择多声道音频信号编码;以及声道编码器,被配置成用多声道音频信号编码对音频信号进行编码。
声道分析器可以包括:时频域转换器,被配置成生成用于音频信号的至少两个音频声道的频域表示;滤波器,被配置成将用于音频信号的至少两个音频声道的频域表示划分到至少两个频带中;以及参数确定器,被配置成针对频带生成与两个音频声道之间的差异关联的至少一个参数。
参数确定器可以包括以下各项中的至少一项:相对能量信号电平确定器,被配置成确定与至少两个音频声道关联的相对能量信号电平;相关性确定器,被配置成确定与至少两个音频声道关联的相关值;以及偏移确定器,被配置成确定与至少两个音频声道关联的时移值。
编码模式确定器可以被配置成:选择初始默认多声道音频信号编码;取决于至少一个参数的第一选择来选择第二音频信号多声道音频信号编码;以及取决于至少一个参数的第二选择来维持第二音频信号多声道音频信号编码。
至少一个参数的第一选择可以是与至少两个音频声道关联的相对能量信号电平与相关值的组合,并且其中编码模式确定器可以被配置成在组合大于确定阈值的情况下选择第二音频信号多声道音频信号编码。
至少一个参数的第二选择可以是与至少两个音频声道关联的相对能量信号电平,并且其中编码模式确定器可以被配置成在相对能量信号电平小于第二确定阈值的情况下维持第二音频信号多声道音频信号编码。
多声道音频信号编码可以包括以下各项中的至少一项:双声道编码;以及近远立体声编码。
声道编码器可以包括:单声声道生成器,被配置成组合至少两个音频声道以形成单个组合声道音频信号;单声声道编码器,被配置成对单个组合声道音频信号进行编码;以及另外的声道编码器,被配置成通过使用多声道音频信号编码来生成与至少两个音频声道关联的数据,使得数据使得能够根据单个组合声道音频信号来重现至少两个音频声道。
根据第十四方面,提供一种装置,包括:输入,被配置成接收编码音频信号;多声道解码确定器,被配置成取决于编码音频信号的第一部分来选择多声道音频信号解码模式;以及多声道解码器,被配置成对编码音频信号的第二部分进行解码以致解码所述编码音频信号的第二部分生成包括至少两个音频声道的音频信号,该音频信号的第二部分是利用多声道音频信号编码来编码的。
多声道解码器可以包括:单声声道生成器,被配置成根据编码音频信号的第二部分的第一分段生成第一声道音频信号;以及立体声声道生成器,被配置成取决于由编码音频信号的第一部分所指示的多声道音频信号解码来根据编码音频信号的第二部分的第二分段生成至少一个另外的声道音频信号。
第一声道可以是左声道音频信号,并且至少一个另外的声道音频信号可以是右声道音频信号。
第一声道可以是组合声道音频信号,并且至少一个另外的声道音频信号可以包括左声道信号和右声道音频信号。
根据第十五方面,提供一种装置,包括:声道距离确定器,被配置成对于至少包括一对音频声道的音频信号确定至少一个声道对距离值;多声道编码器,被配置成用多声道音频信号编码对音频信号进行编码以至少生成编码信号和差异信号;以及等效器,被配置成取决于差异信号、至少一个声道对距离值和编码声道距离值来生成等效差异信号。
该装置还可以包括被配置成接收编码声道距离值的输入。
该输入可以包括以下各项中的至少一项:用户输入,被配置成确定编码声道距离值;以及编解码器握手输入,被配置成从解码器接收编码声道距离值。
该装置可以包括被配置成从一对麦克风接收音频信号的输入,其中第一音频声道可以来自第一麦克风并且第二音频声道可以来自第二麦克风,其中声道距离确定器还可以包括被配置成确定第一麦克风与第二麦克风之间的距离。
根据第十六方面,提供一种装置,包括:输入,被配置成接收编码信号和等效差异信号;以及声道距离解码器,被配置成取决于编码信号和等效差异信号来重现具有确定声道距离的一对音频声道。
该装置可以包括:编码声道距离值确定器,被配置成确定编码声道距离值;以及音频声道生成器,被配置成取决于编码信号、等效差异信号、编码声道距离值和期望声道距离来生成具有期望声道距离的一对音频声道。
一种计算机程序产品,使得装置执行如本文中所描述的方法。
一种电子设备,可以包括如本文中所描述的装置。
一种芯片组,可以包括如本文中所描述的装置。
附图说明
为了更好地理解本发明,现在将通过示例对附图进行参考,其中:
图1示意性地示出采用一些实施例的电子设备;
图2示意性地示出根据一些实施例的音频编解码系统;
图3示意性地示出根据一些实施例的如图2中所示的编解码器;
图4示意性地示出根据一些实施例的如图3中更具体地示出的声道分析器;
图5示意性地示出根据一些实施例的如图3中更具体地示出的声道编码器;
图6示出根据一些实施例的图示在图2中所示的编码器的操作的流程图;
图7示出根据一些实施例的图示如图4中所示的声道分析器的操作的流程图;
图8示出根据一些实施例的图示如图5中所示的声道编码器的操作的流程图;
图9示意性地示出根据一些实施例的如图2中所示的解码器;
图10示出根据一些实施例的图示如图9中所示的解码器的操作的流程图;
图11和图12示出在使用如本文中所描述的实施例时的示例模式选择;
图13示出针对在其之间具有各种距离的两个麦克风的、根据不同角度的声音的时间差。
具体实施方式
以下更具体地描述可能的立体声语音和音频编解码器、包括分层或可扩展可变速率语音和音频编解码器。在这点上,首先对图1进行参考,其示出示例性电子设备或装置10的示意性框图,其可以包含根据本申请的实施例的编解码器。
装置10例如可以是无线通信系统的移动终端或用户设备。在其他实施例中,装置10可以是音频-视频设备,诸如摄像机、电视(TV)接收器、音频记录器、或者音频播放器诸如mp3记录器/播放器、媒体记录器(也称为mp4记录器/播放器)、或者适于处理音频信号的任何计算机。
电子设备或装置10在一些实施例中包括麦克风11,其经由模数转换器(ADC)14链接至处理器21。该处理器21还经由数模转换器(DAC)32链接至扬声器33。该处理器21还链接至收发器(RX/TX)13、至用户界面(UI)15以及至存储器22。
该处理器21在一些实施例中可以被配置成执行各种程序代码。所实施的程序代码在一些实施例中包括如本文中所描述的多声道或立体声编码或解码代码。所实施的程序代码23在一些实施例中可以存储在例如存储器22中用于由处理器22在任何需要的时候获取。存储器22还可以提供用于存储数据、例如已经根据应用被编码的数据的部分24。
实施例中的编码和解码代码可以被实施在硬件和/或固件中。
用户界面15使得用户能够例如经由键盘向电子设备10输入命令,和/或例如经由显示器从电子设备10获得信息。在一些实施例中,触摸屏可以提供用于用户界面的输入和输出功能二者。该装置10在一些实施例中包括适于例如经由无线通信网络实现与其他装置的通信的收发器13。
还应当理解,可以用很多方式对装置10的结构进行补充和变化。
装置10的用户例如可以使用麦克风11用于输入要向一些其他装置传输或者要在存储器22的数据部分24中存储的语音或其他音频信号。为此可以在一些实施例中由用户经由用户界面15来实现对应应用。这一应用在这些实施例中可以由处理器21来执行,使处理器21执行存储器22中所存储的编码代码。
模数转换器(ADC)14在一些实施例中将输入模拟音频信号转换成数字音频信号并且向处理器21提供数字音频信号。在一些实施例中,麦克风11可以包括集成麦克风和ADC功能并且直接向处理器提供数字音频信号用于处理。
处理器21在这样的实施例中因此以与参考图2至图10描述的相同的方式处理数字音频信号。
所得比特流在一些实施例中可以被提供至收发器13用于向另一装置传输。备选地,编码音频数据在一些实施例中可以存储在存储器22的数据部分22中,比如用于稍后传输或者用于同一装置10稍后呈现.
该装置10在一些实施例中还可以经由收发器13从另一装置接收具有对应编码数据的比特流。在这一示例中,处理器21可以执行存储器22中所存储的解码程序代码。处理器21在这样的实施例中对所接收的数据进行解码,并且向数模转换器32提供解码数据。数模转换器32将数字解码数据转换成模拟音频数据并且在一些实施例中可以经由扬声器33输出模拟音频。解码程序代码的执行在一些实施例中也可以由用户经由用户界面15调用的应用来触发。
所接收的编码数据在一些实施例中代替经由扬声器33的中间呈现,还可以被存储在存储器22的数据部分24中,比如用于稍后解码和呈现或者解码和向又一装置转发。
应当理解,在图3至图5和图9中所描述的示意性结构以及在图6至图8和图10中所示出的方法步骤仅代表音频编解码器的操作的部分并且具体是如在图1中所示的装置中示例性地示出实施的立体声编码器/解码器装置和方法的一部分。
图2中示出如实施例所采用的音频编解码器的总体操作。普通音频编码/解码系统包括编码器和解码器二者,如图2中示意性地图示的。然而,应当理解,一些实施例可以实施编码器或解码器中的任一个、或者编码器和解码器二者。图2图示的是具有编码器104并且具体是立体声编码器151、存储或介质声道106和解码器108的系统102。应当理解,如以上所描述的,一些实施例可以包括或者实施编码器104或解码器108中的一个、或者编码器104和解码器108二者。
编码器104压缩输入音频信号110从而产生比特流112,该比特流112在一些实施例中可以通过介质声道106来存储或传输。编码器104还可以包括立体声编码器151作为整个编码操作的部分。应当理解,立体声编码器可以是整个编码器104的部分或者单独的编码模块。编码器104还可以包括对多于两个音频信号进行编码的多声道编码器。
比特流112可以在解码器108内被接收。该解码器108对比特流112解压缩并且产生输出音频信号114。解码器108可以包括立体声解码器作为整个解码操作的部分。应当理解,立体声解码器可以是整个解码器108的部分或者单独的解码模块。解码器108还可以包括对多于两个音频信号进行解码的多声道解码器。与输入信号110有关的比特流112的比特率和输出音频信号114的质量是限定编码系统102的性能的主要特征。
图3示意性地示出根据一些实施例的编码器104。
图6在流程图中示意性地示出根据一些实施例的编码器104的操作。
如本文中所描述的实施例的概念是确定和应用立体声编码模式以产生高效高质量且低比特率的现实生活立体声信号编码。在这方面,关于图3,示出根据一些实施例的示例编码器104。另外,关于图6,更具体地示出编码器104的操作。
编码器104在一些实施例中包括帧分段器/变换器201。帧分段器/变换器201被配置成接收左右(或者更一般地为多声道音频表示)输入音频信号并且生成待分析和编码的这些音频信号的频域表示。这些频域表示可以被传递至声道参数确定器203。
在一些实施例中,帧分段器/变换器可以被配置成将音频信号数据分段或分割成适于频域变换的部分或者帧。帧分段器/变换器201在一些实施例中还可以被配置成根据任何合适的开窗函数对音频信号数据的这些帧或分段进行开窗。例如,帧分段器/变换器201可以被配置成生成与在前帧和在后帧各自重叠10ms的20ms的帧。
在一些实施例中,帧分段器/变换器可以被配置成对音频信号数据执行任何合适的时频域变换。例如,时频域变换可以是离散傅里叶变换(DFT)、快速傅里叶变换(FFT)、修改的离散余弦变换(MDCT)。在以下示例中,使用快速傅里叶变换(FFT)。另外,可以进一步处理时频域变换的输出,以生成每个输入声道音频信号数据的单独的频带域表示。这些带可以以任何合适的方式布置。例如,这些带可以被线性间隔,或者在感觉或心理声学上被分配。
图6中用步骤501示出生成音频帧带频域表示的操作。
在一些实施例中,该频域表示被传递至声道分析器。
在一些实施例中,编码器包括声道分析器203。声道分析器203可以被配置成分析频域音频信号并且确定与每个声道的每个带关联的参数并且向编码模式确定器205输出这些参数值。
关于图4,更具体地描述根据一些实施例的示例声道分析器203。另外,关于图7,示出如图4中所示的根据一些实施例的声道分析器203的操作。
在一些实施例中,声道分析器203包括相对能量信号电平确定器301。该相对能量信号电平确定器301被配置成接收输出频域表示并且对于每个带确定声道对之间的相对信号电平。应当理解,在以下示例中,分析和处理单个声道对,然而,这可以通过多声道系统的合适的配对而被扩展至任何数目的声道。
在一些实施例中,对于每个带的相对电平可以通过使用以下代码来计算。
其中L_FFT是FFT的长度,并且EPSILON是用以防止除零问题的在零以上的小值。相对能量信号电平确定器在这样的实施例中对于每个带上的每个声道(L和R)有效地生成幅度确定并且然后用一个声道值除以另一声道值以生成相对值。在一些实施例中,相对能量信号电平确定器301被配置成向编码模式确定器205输出相对能量信号电平。
图7中用步骤551示出确定相对能量信号电平的操作。
在一些实施例中,声道分析器203包括相关性/偏移确定器303。该相关性/偏移确定器303被配置成确定两个声道(或者多声道音频信号中的部分声道音频信号)之间的每个带的相关性或者偏移。该偏移(或者最佳相关性指数COR_IND[j])可以例如使用以下代码来确定。
其中值MAXSHIFT是最大允许偏移(该值可以基于所支持的麦克风布置的模型或者更简单地基于麦克风之间的距离),PI为π,COR_INIT为用以开始相关性计算的初始相关性值或者大的负值,并且COR_BAND_START[]定义子带的开始点。本文中所使用的矢量svec_re[]和svec_im[]、矢量的实值和虚值定义如下:
图7中用步骤553示出确定相关性/偏移值的操作。
在一些实施例中,编码器包括编码模式确定器205。该编码模式确定器205被配置成接收声道分析器值并且基于这些值来控制声道编码器207使用特定的编码模式。
在一些实施例中,编码模式确定器205可以被配置有用以编码的默认编码模式。例如,编码模式确定器可以被配置成默认将编码器立体声或多声道信号控制为双声道立体声编码。在一些实施例中,编码模式确定器可以根据两个规则来控制编码器。第一规则或确定步骤是确定编码应当在什么时候从(双声道编码的)备份或默认模式变成其他编码模式(近远立体声编码),并且第二规则或者确定步骤是确定在什么情况下维持其他编码模式(近远编码模式)。
在一些实施例中,这两个确定步骤的目标是确保向其他模式的切换(近远配置)仅在其有用时发生,例如,模式选择可以切换和维持近远模式用于语音突发。
在一些实施例中,编码模式确定可以使用长度为L_SIGNAL的信号根据以下代码来执行:
其中值MODE为输出模式选择矢量。换言之,向声道编码器传递指示以控制该声道用一种方式(双声道编码)还是另一种方式(近远编码)来编码。在这一示例中,选择矢量为0是双声道,为1是近远立体声。值mag_sum和ind_sum表示来自声道分析器的幅度和相关性指示的和,值MEMORY_LEN定义用于计算临时幅度值的过去平均的存储器的长度,值ENTER_COUNT定义当检测到潜在的近远帧(换言之第一规则值)时从双声道至近远立体声的切换可以多快地进行,值MODE_TH_CMB_ENTER1、MODE_TH_CMB_ENTER2(其中在前值输入1大于在后值输入2)、以及MODE_TH_MAG_STAY定义一旦进入近远立体声编码以将其维持在编码模式(换言之第二规则值)时用于模式选择参数的阈值。另外,值PROPER_COUNT定义自被认为合适的近远立体声帧编码候选的最后帧以来的帧的数目。
在本文中所讨论的示例中,实施例未使用前瞻(look-head),然而,在一些实施例中,前瞻信息在可用于确定编码模式的情况下也可以被使用。在一些实施例中,该第一规则(从默认或双声道编码模式向其他或近远模式的变化)可以基于相对幅度值和偏移值的组合来确定,而维持其他模式(近远立体声编码模式)的第二规则可以仅使用相对幅度参数来确定。在一些实施例中,任何合适的参数组合可以被用于判断是否维持其他模式(近远编码模式)还是切换回默认模式(双声道编码)。在一些实施例中,阈值可以是可变的并且进行长期适应以改善模式确定或选择的鲁棒性。例如,近远立体声模式中的声道很可能保持静止(换言之,左声道很可能通常是近声道,右声道很可能通常是远声道,反之亦然)
在本文中所描述的示例中,将带相等地求和,然而,应当理解,可以实施音质(psycho acoustic)加权功能以改善性能,其中在这样的实施例中,将一些带相对于其他带来加权。
在一些实施例中,编码模式确定器205可以被配置成接收另外的输入。例如,在一些实施例中,模式确定在输入已知的情况下可以被拒绝或强制。例如,在一些实施例中,待使用的编码模式可以使用命令行或者用户选择选项来确定。另外,在一些实施例中,该模式可以基于一些在外部接收的信令或指示来被拒绝。例如,在一些实施例中,编码模式可以在如下情况下确定:设备指示其正在近远模式下操作并且靠近耳机的设备的麦克风连接至右声道且主麦克风连接至左声道。
图6中用步骤505示出选择立体声编码模式的操作。
如图11和图12所示,具有近远数据的基本上双声道捕获的信号和音频信号根据一些实施例被示出为具有关联模式选择/确定输出。
在一些实施例中,编码器包括声道编码器207。该声道编码器被配置成接收音频信号数据并且编码模式确定器输出以用所确定的多声道模式对音频信号进行编码。
图6中用步骤507示出对单声声道和立体声参数进行编码的操作。
关于图5,更具体示出根据一些实施例的声道编码器。另外,关于图8,更具体描述声道编码器207的操作。
在一些实施例中,声道编码器207包括单声声道生成器451。该单声声道生成器451被配置成接收至少用于一对音频声道的音频信号频域表示并且根据这些多声道音频信号生成单声音频声道。在一些实施例中,例如在双声道(左声道和右声道)音频信号系统中,左声道和右声道使用来自声道分析器203的相对偏移信息来组合成单声声道。在一些实施例中,取决于编码模式确定而从多于一种方法中来选择单声声道的生成。例如,本文中所描述的组合模式可以用于双声道模式编码,并且单独模式(其中左声道和右声道音频信号的主要部分被选择作为两个音频信号的“近”声道)被选择用于在编码模式为近远模式时进行编码。
图8中用步骤701示出生成单声声道表示的操作。
单声声道生成器451在一些实施例中可以向单声声道编码器/量化器453输出所生成的单声声道。
在一些实施例中,编码器包括单声声道编码器/量化器453。单声声道编码器/量化器453可以被配置成接收单声声道生成器451生成的单声声道并且以任何合适的格式对单声声道进行编码。
例如,在一些实施例中,单声信号编码可以是EVS单声声道编码形式,其可以包含AMR-WB编解码器的比特流可互操作版本。然而,任何合适的编码方法可以被实施。
图8中用步骤703示出对单声声道进行编码的操作。
单声声道编码器/量化器453在一些实施例中还可以被配置成对单声声道表示进行均衡。
图8中用步骤705示出对单声声道进行均衡的操作。
单声声道编码器/量化器453输出在一些实施例中可以向多路复用器455输出。
在一些实施例中,编码器包括双声道/近远参数量化器452。双声道/近远参数量化器452可以被配置成接收偏移和相对电平值,其定义两个声道和编码之间的幅度和频率/时间偏移关系或者以适于传输的形式对这些关系进行均衡。
在一些实施例中,双声道/近远参数量化器452在接收到编码模式确定器输出时可以被配置成以如下方式来对这些参数进行编码:该方式使得用于偏移和相对电平值的量化器取决于编码模式确定器205的输出。在一些实施例中,也包括或附接立体声编码模式确定指示,因此其可以通过解码器来接收/取得。
在一些实施例中,根据单声声道以及量化后的偏移和相对值来生成立体声双声道信号可以取决于来自编解码器的另外的信息来进行。因此,例如,由于偏移值在编码器中被量化,所以在一些实施例中,量化后的偏移值可以被改变以反映“真实”的一对耳朵之间的距离(其通常为约170mm)而非麦克风之间的真实距离。因此,量化步骤可以被配置成使得量化值可以在麦克风之间的距离小于人耳之间的距离时在量化中朝着较大的值偏置。
因此,例如,如图13所示,输入麦克风之间的距离的影响,其中8个麦克风距离从7cm到21cm,其中17cm的距离表示人耳之间的典型实际距离。在图13的图中,零度的角表示直接来自右边或左边的声音,而90度的角度表示直接来自前面的声音。当在这样的实施例中解码器渲染音频信号用于头戴式耳机倾听时,解码器使用量化后的偏移值。例如,可以感觉到麦克风距离为7cm的直接来自侧面零度的声音好像来自约60度的角度(其比侧面更向前或向后)。这很清楚没有提供最优空间质量。类似地,在21cm的麦克风距离的情况下,可以感觉到来自40度的角度的声音好像来自几乎侧面(很可能约20度)。在一些实施例中,双声道/近远参数量化器452可以被配置成生成已经确定或估计捕获麦克风分离距离的预定距离等效值,诸如17cm距离等效值,并且然后对预定距离等效值进行量化。在一些实施例中,由于逐带执行偏移确定和量化,所以也可以逐带执行向距离“等效化”的转换。在一些实施例中,“等效化”通过值的查找表来执行,其中将当前偏移和麦克风距离值作为输入。
在一些实施例中,可以给出目标距离等效值作为算法的输入。在一些实施例中,这一值可以例如在通信回话开始时在两个通信设备之间协商。
图8中用步骤702示出对立体声参数进行量化的操作。
另外,在一些实施例中,编码器455包括多路复用器,该多路复用器被配置成对编码单声声道和立体声量化值进行多路复用并且生成单个输出数据流。
图8中用步骤707示出对单声声道和立体声参数进行多路复用的操作。
图6中用步骤507示出对单声声道和立体声参数进行编码的操作。
为了完全示出关于一些实施例的编解码器的操作,参考图9和图10,示出解码器和解码器的操作。
在一些实施例中,解码器包括解多路复用器801。解多路复用器801被配置成接收多路复用信号并且将信号解多路复用成编码单声信号和立体声参数。
图10中用步骤901示出接收多路复用信号的操作。
另外,图10中用步骤903示出将信号解多路复用成编码单声信号和立体声参数的操作。
该解多路复用器在一些实施例中可以被配置成向单声解码器输出单声信号并且向立体声解码器输出立体声参数。
在一些实施例中,解码器包括单声解码器803。单声解码器803可以被配置成执行与图5中所示的单声声道编码器453相反或互逆的布置。
图10中用步骤905示出对单声信号进行解码的操作。
单声解码器803可以被配置成向立体声解码器805输出解码单声声道。在一些实施例中,解码器包括立体声解码器205。
立体声解码器805在一些实施例中被配置成接收单声解码信号和立体声参数并且取决于该立体声参数来生成或者重构单独的左声道和右声道音频信号。因此,例如,在一些实施例中,每个立体声解码器805被配置成作为双声道解码器来操作,在双声道解码器中,立体声参数确定在编码模式被确定为近远编码时执行双声道编码和近远解码。因此,信号的双声道去相关性可以被形成以改善在双声道头戴式耳机倾听中听取来自头外部信号的感知效果。
图10中用步骤907示出将立体声参数应用于单声信号以生成立体声信号的操作。
虽然以上示例描述在装置10内的编解码器内操作的本申请的实施例,然而,应当理解,如以下所描述的本发明可以被实施为任何音频(或者语音)编解码器、包括任何可变速率/自适应速率音频(或者语音)编解码器的部分。因此,例如,本申请的实施例可以在固定或有线通信路径上实施音频编码的音频编解码器中实施。
因此,用户设备可以包括音频编解码器、诸如在以上本申请的实施例中所描述的哪些音频编解码器。
应当理解,术语“用户设备”意在覆盖任何合适类型的无线用户设备、诸如移动电话、便携式数据处理设备或便携式网络浏览器。
另外,公用陆地移动网(PLMN)的元件还可以包括如以上所描述的音频编解码器。
总之,本申请的各种实施例可以在硬件或专用电路、软件、逻辑器件或其任何组合中实施。例如,一些方面可以在硬件中实施,而其他方面可以在可以由控制器、微处理器或其他计算设备来执行的固件或软件中实施,虽然本发明不限于此。虽然本申请的各个方面可以被图示和描述为框图、流程图、或者通过使用一些其他图示表示来描述,然而应当很好地理解,本文中所描述的这些块、装置、系统、技术或方法作为非限制性的示例可以用硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备、或者一些其组合来实施。
本申请的实施例可以用移动设备的数据处理器可执行的计算机软件来实施,诸如在处理器实体中、或者通过硬件、或者通过软件和硬件的组合来实施。另外,在这点上,应当注意,如附图中的逻辑流的任何块可以表示程序步骤、或者互连逻辑电路、块和功能、或者程序步骤和逻辑电路、块和功能的组合。
存储器可以是适合本地技术环境的任何类型,并且可以使用任何合适的数据存储技术来实施,诸如基于半导体的存储器设备、磁性存储器设备和系统、光学存储器设备和系统、固定存储器和可移除存储器。数据处理器可以是适合本地技术环境的任何类型,并且作为非限制性示例,可以包括通用计算机、专用计算机、微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、基于多核处理器架构的门级电路和处理器中的一项或多项。
本申请的实施例可以在各种部件、诸如集成电路模块中实践。集成电路的设计通过高度自动化的处理来实现。复杂且强大的软件工具可用于将逻辑级设计转换成准备好在半导体基底上被刻蚀和形成的半导体电路设计。
程序、诸如那些由加利福尼亚的山景城的Synopsys公司和加利福尼亚的圣何塞的Cadence Design提供的程序通过使用很好地建立的设计规则以及预存设计模块的库在半导体芯片上自动布线导体和定位部件。一旦完成半导体电路的设计,可以向半导体制造工厂或“fab”传输标准化电子格式(例如Opus、GDSII等)的所得设计用于制造。
如本申请中所使用的,术语“电路”指代所有以下各项:
(a)仅硬件电路实施(诸如在仅模拟和/或数字电路中的实施)以及
(b)电路和软件(和/或固件)的组合,诸如:(i)处理器的组合或者(ii)一起工作以使装置、诸如移动电话或服务器执行各种功能的处理器/软件(包括数字信号处理器)、软件和存储器的部分以及
(c)即使软件或固件没有物理存在仍需要软件或固件以用于操作的电路、诸如微处理器或者微处理器的部分。
“电路”这一定义适用于本申请、包括任何权利要求中这一术语的所用使用。作为另一示例,如本申请中所使用的,术语“电路”还将覆盖仅处理器(或者多个处理器)或者处理器的部分以及它的(或者它们的)附带软件和/或固件的实施。例如并且如果适用于特定权利要求元素,则术语“电路”还将覆盖用于移动电话或服务器、蜂窝网络设备或其他网络设备中的类似集成电路的基带集成电路或应用处理器集成电路。
以上描述已经通过示例性而非限制性示例提供对本发明的示例性实施例的全面和丰富描述。然而,对于本领域技术人员而言,在结合附图和所附权利要求阅读时,鉴于以上描述,各种修改和改变可能变得清楚。然而,本发明的教导的所有这样的和相似的修改仍然落入如所附权利要求中所限定的本发明的范围内。
Claims (45)
1.一种方法,包括:
分析包括至少两个音频声道的音频信号以确定与所述至少两个音频声道之间的差异关联的至少一个参数;
取决于所述至少一个参数来选择多声道音频信号编码;以及
用所述多声道音频信号编码对所述音频信号进行编码。
2.根据权利要求1所述的方法,其中分析包括至少两个音频声道的音频信号以确定与所述至少两个音频声道之间的差异关联的至少一个参数包括:
生成用于所述音频信号的所述至少两个音频声道的频域表示;
将用于所述音频信号的所述至少两个音频声道的所述频域表示划分到至少两个频带中;以及
针对频带生成与两个音频声道之间的所述差异关联的至少一个参数。
3.根据权利要求1和2所述的方法,其中所述参数包括以下各项中的至少一项:
与所述至少两个音频声道关联的相对能量信号电平;
与所述至少两个音频声道关联的相关值;以及
与所述至少两个音频声道关联的时移值。
4.根据权利要求1至3所述的方法,其中取决于所述至少一个参数来选择多声道音频信号编码包括:
选择初始默认多声道音频信号编码;
取决于所述至少一个参数的第一选择来选择第二音频信号多声道音频信号编码;以及
取决于所述至少一个参数的第二选择来维持所述第二音频信号多声道音频信号编码。
5.根据权利要求4所述的方法,其中所述至少一个参数的所述第一选择是与所述至少两个音频声道关联的相对能量信号电平与相关值的组合,并且其中取决于所述至少一个参数的第一选择来选择所述第二音频信号多声道音频信号编码包括:在所述组合大于确定阈值的情况下选择所述第二音频信号多声道音频信号编码。
6.根据权利要求4和5所述的方法,其中所述至少一个参数的所述第二选择是与所述至少两个音频声道关联的相对能量信号电平,并且其中维持所述第二音频信号多声道音频信号编码包括:在所述相对能量信号电平小于第二确定阈值的情况下维持所述第二音频信号多声道音频信号编码。
7.根据权利要求1至6所述的方法,其中所述多声道音频信号编码包括以下各项中的至少一项:
双声道编码;以及
近远立体声编码。
8.根据权利要求1至7所述的方法,其中用所述多声道音频信号编码对所述音频信号进行编码包括:
组合所述至少两个音频声道以形成单个组合声道音频信号;
对所述单个组合声道音频信号进行编码;以及
使用所述多声道音频信号编码来生成与所述至少两个音频声道关联的数据,以致所述数据使得能够根据所述单个组合声道音频信号来重现所述至少两个音频声道。
9.一种方法,包括:
接收编码音频信号;
取决于所述编码音频信号的第一部分来选择多声道音频信号解码;以及
对所述编码音频信号的第二部分进行解码以致对所述编码音频信号的所述第二部分进行解码生成包括至少两个音频声道的音频信号,所述音频信号的所述第二部分是利用多声道音频信号编码来编码的。
10.根据权利要求9所述的方法,其中对所述编码音频信号的第二部分进行解码包括:
根据所述编码音频信号的所述第二部分的第一分段生成第一声道音频信号;以及
取决于由所述编码音频信号的所述第一部分所指示的所述多声道音频信号解码来根据所述编码音频信号的所述第二部分的第二分段生成至少一个另外的声道音频信号。
11.根据权利要求10所述的方法,其中所述第一声道是左声道音频信号,并且所述至少一个另外的声道音频信号是右声道音频信号。
12.根据权利要求10所述的方法,其中所述第一声道是组合声道音频信号,并且所述至少一个另外的声道音频信号包括左声道信号和右声道音频信号。
13.一种方法,包括:
对于至少包括一对音频声道的音频信号确定至少一个声道对距离值;
用多声道音频信号编码对所述音频信号进行编码以至少生成编码信号和差异信号;以及
取决于所述差异信号、所述至少一个声道对距离值和编码声道距离值来生成等效差异信号。
14.根据权利要求13所述的方法,还包括接收所述编码声道距离值。
15.根据权利要求14所述的方法,其中接收所述编码声道距离值包括以下各项中的至少一项:
根据用户输入确定编码声道距离值;以及
从解码器接收编码声道距离值。
16.根据权利要求13至15所述的方法,包括从一对麦克风接收所述音频信号,其中第一音频声道来自第一麦克风并且第二音频声道来自第二麦克风,其中确定所述至少一个声道对距离值包括确定所述第一麦克风与所述第二麦克风之间的距离。
17.一种方法,包括:
接收编码信号和等效差异信号;
取决于所述编码信号和所述等效差异信号来重现具有确定声道距离的一对音频声道。
18.根据权利要求17所述的方法,还包括:
确定编码声道距离值;以及
取决于所述编码信号、所述等效差异信号、所述编码声道距离值和期望声道距离来生成具有所述期望声道距离的一对音频声道。
19.一种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置成与所述至少一个处理器一起使所述装置至少执行:
分析包括至少两个音频声道的音频信号以确定与所述至少两个音频声道之间的差异关联的至少一个参数;
取决于所述至少一个参数来选择多声道音频信号编码;以及
用所述多声道音频信号编码对所述音频信号进行编码。
20.根据权利要求19所述的装置,其中分析包括至少两个音频声道的音频信号以确定与所述至少两个音频声道之间的差异关联的至少一个参数使所述装置执行:
生成用于所述音频信号的所述至少两个音频声道的频域表示;
将用于所述音频信号的所述至少两个音频声道的所述频域表示划分到至少两个频带中;以及
针对频带生成与两个音频声道之间的所述差异关联的至少一个参数。
21.根据权利要求19和20所述的装置,其中所述参数包括以下各项中的至少一项:
与所述至少两个音频声道关联的相对能量信号电平;
与所述至少两个音频声道关联的相关值;以及
与所述至少两个音频声道关联的时移值。
22.根据权利要求19至21所述的装置,其中取决于所述至少一个参数来选择多声道音频信号编码使所述装置执行:
选择初始默认多声道音频信号编码;
取决于所述至少一个参数的第一选择来选择第二音频信号多声道音频信号编码;以及
取决于所述至少一个参数的第二选择来维持所述第二音频信号多声道音频信号编码。
23.一种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置成与所述至少一个处理器一起使所述装置至少执行:
接收编码音频信号;
取决于所述编码音频信号的第一部分来选择多声道音频信号解码;以及
对所述编码音频信号的第二部分进行解码以致对所述编码音频信号的所述第二部分进行解码生成包括至少两个音频声道的音频信号,所述音频信号的所述第二部分是利用多声道音频信号编码来编码的。
24.根据权利要求23所述的装置,其中对所述编码音频信号的第二部分进行解码使所述装置执行:
根据所述编码音频信号的所述第二部分的第一分段生成第一声道音频信号;以及
取决于由所述编码音频信号的所述第一部分所指示的所述多声道音频信号解码来根据所述编码音频信号的所述第二部分的第二分段生成至少一个另外的声道音频信号。
25.一种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置成与所述至少一个处理器一起使所述装置至少执行:
对于至少包括一对音频声道的音频信号确定至少一个声道对距离值;
用多声道音频信号编码对所述音频信号进行编码以至少生成编码信号和差异信号;以及
取决于所述差异信号、所述至少一个声道对距离值和编码声道距离值来生成等效差异信号。
26.一种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置成与所述至少一个处理器一起使所述装置至少执行:
接收编码信号和等效差异信号;
取决于所述编码信号和所述等效差异信号来重现具有确定声道距离的一对音频声道。
27.一种装置,包括:
用于分析包括至少两个音频声道的音频信号以确定与所述至少两个音频声道之间的差异关联的至少一个参数的装置;
用于取决于所述至少一个参数来选择多声道音频信号编码的装置;以及
用于用所述多声道音频信号编码对所述音频信号进行编码的装置。
28.根据权利要求27所述的装置,其中用于分析包括至少两个音频声道的音频信号以确定与所述至少两个音频声道之间的差异关联的至少一个参数的所述装置包括:
用于生成用于所述音频信号的所述至少两个音频声道的频域表示的装置;
用于将用于所述音频信号的所述至少两个音频声道的所述频域表示划分到至少两个频带中的装置;以及
用于针对频带生成与两个音频声道之间的所述差异关联的至少一个参数的装置。
29.根据权利要求27和28所述的装置,其中所述参数包括以下各项中的至少一项:
与所述至少两个音频声道关联的相对能量信号电平;
与所述至少两个音频声道关联的相关值;以及
与所述至少两个音频声道关联的时移值。
30.根据权利要求27至29所述的装置,其中用于取决于所述至少一个参数来选择多声道音频信号编码的所述装置包括:
用于选择初始默认多声道音频信号编码的装置;
用于取决于所述至少一个参数的第一选择来选择第二音频信号多声道音频信号编码的装置;以及
用于取决于所述至少一个参数的第二选择来维持所述第二音频信号多声道音频信号编码的装置。
31.一种装置,包括:
用于接收编码音频信号的装置;
用于取决于所述编码音频信号的第一部分来选择多声道音频信号解码的装置;以及
用于对所述编码音频信号的第二部分进行解码以致对所述编码音频信号的所述第二部分进行解码生成包括至少两个音频声道的音频信号的装置,所述音频信号的所述第二部分是利用多声道音频信号编码来编码的。
32.根据权利要求31所述的装置,其中用于对所述编码音频信号的第二部分进行解码的所述装置包括:
用于根据所述编码音频信号的所述第二部分的第一分段生成第一声道音频信号的装置;以及
用于取决于由所述编码音频信号的所述第一部分所指示的所述多声道音频信号解码来根据所述编码音频信号的所述第二部分的第二分段生成至少一个另外的声道音频信号的装置。
33.一种装置,包括:
用于对于至少包括一对音频声道的音频信号确定至少一个声道对距离值的装置;
用于用多声道音频信号编码对所述音频信号进行编码以至少生成编码信号和差异信号的装置;以及
用于取决于所述差异信号、所述至少一个声道对距离值和编码声道距离值来生成等效差异信号的装置。
34.一种装置,包括:
用于接收编码信号和等效差异信号的装置;以及
用于取决于所述编码信号和所述等效差异信号来重现具有确定声道距离的一对音频声道的装置。
35.一种装置,包括:
声道分析器,被配置成分析包括至少两个音频声道的音频信号以确定与所述至少两个音频声道之间的差异关联的至少一个参数;
编码模式确定器,被配置成取决于所述至少一个参数来选择多声道音频信号编码;以及
声道编码器,被配置成用所述多声道音频信号编码对所述音频信号进行编码。
36.根据权利要求35所述的装置,其中所述声道分析器包括:
时频域转换器,被配置成生成用于所述音频信号的所述至少两个音频声道的频域表示;
滤波器,被配置成将用于所述音频信号的所述至少两个音频声道的所述频域表示划分到至少两个频带中;以及
参数确定器,被配置成针对频带生成与两个音频声道之间的所述差异关联的至少一个参数。
37.根据权利要求35和36所述的装置,其中所述参数确定器包括以下各项中的至少一项:
相对能量信号电平确定器,被配置成确定与所述至少两个音频声道关联的相对能量信号电平;
相关性确定器,被配置成确定与所述至少两个音频声道关联的相关值;以及
偏移确定器,被配置成确定与所述至少两个音频声道关联的时移值。
38.根据权利要求35至37所述的装置,其中所述编码模式确定器被配置成:
选择初始默认多声道音频信号编码;
取决于所述至少一个参数的第一选择来选择第二音频信号多声道音频信号编码;以及
取决于所述至少一个参数的第二选择来维持所述第二音频信号多声道音频信号编码。
39.一种装置,包括:
输入,被配置成接收编码音频信号;
多声道解码确定器,被配置成取决于所述编码音频信号的第一部分来选择多声道音频信号解码模式;以及
多声道解码器,被配置成对所述编码音频信号的第二部分进行解码以致对所述编码音频信号的所述第二部分进行解码生成包括至少两个音频声道的音频信号,所述音频信号的所述第二部分是利用多声道音频信号编码来编码的。
40.根据权利要求39所述的装置,其中所述多声道解码器包括:
单声声道生成器,被配置成根据所述编码音频信号的所述第二部分的第一分段生成第一声道音频信号;以及
立体声声道生成器,被配置成取决于由所述编码音频信号的所述第一部分所指示的所述多声道音频信号解码来根据所述编码音频信号的所述第二部分的第二分段生成至少一个另外的声道音频信号。
41.一种装置,包括:
声道距离确定器,被配置成对于至少包括一对音频声道的音频信号确定至少一个声道对距离值;
多声道编码器,被配置成用多声道音频信号编码对所述音频信号进行编码以至少生成编码信号和差异信号;以及
等效器,被配置成取决于所述差异信号、所述至少一个声道对距离值和编码声道距离值来生成等效差异信号。
42.一种装置,包括:
输入,被配置成接收编码信号和等效差异信号;以及
声道距离解码器,被配置成取决于所述编码信号和所述等效差异信号来重现具有确定声道距离的一对音频声道。
43.一种计算机程序产品,用于使装置执行根据权利要求1至19中的任一项所述的方法。
44.一种电子设备,包括根据权利要求14至42所述的装置。
45.一种芯片组,包括根据权利要求14至42所述的装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/IB2012/051943 WO2013156814A1 (en) | 2012-04-18 | 2012-04-18 | Stereo audio signal encoder |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104364842A true CN104364842A (zh) | 2015-02-18 |
Family
ID=49382993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280073988.3A Pending CN104364842A (zh) | 2012-04-18 | 2012-04-18 | 立体声音频信号编码器 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150371643A1 (zh) |
EP (1) | EP2839460A4 (zh) |
CN (1) | CN104364842A (zh) |
WO (1) | WO2013156814A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107636757A (zh) * | 2015-05-20 | 2018-01-26 | 瑞典爱立信有限公司 | 多声道音频信号的编码 |
CN108292505A (zh) * | 2015-11-20 | 2018-07-17 | 高通股份有限公司 | 多重音频信号的编码 |
WO2019029737A1 (zh) * | 2017-08-10 | 2019-02-14 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
CN111316353A (zh) * | 2017-11-10 | 2020-06-19 | 诺基亚技术有限公司 | 确定空间音频参数编码和相关联的解码 |
CN111508507A (zh) * | 2019-01-31 | 2020-08-07 | 华为技术有限公司 | 一种音频信号处理方法及装置 |
CN111542877A (zh) * | 2017-12-28 | 2020-08-14 | 诺基亚技术有限公司 | 空间音频参数编码和相关联的解码的确定 |
CN112233684A (zh) * | 2015-03-09 | 2021-01-15 | 弗劳恩霍夫应用研究促进协会 | 用于对多声道信号进行编码或解码的装置与方法 |
CN112562696A (zh) * | 2019-09-26 | 2021-03-26 | 苹果公司 | 具有离散对象的音频的分层编码 |
WO2022012553A1 (zh) * | 2020-07-17 | 2022-01-20 | 华为技术有限公司 | 多声道音频信号的编解码方法和装置 |
WO2023097686A1 (zh) * | 2021-12-03 | 2023-06-08 | 北京小米移动软件有限公司 | 一种立体声音频信号处理方法及设备/存储介质/装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6235725B2 (ja) * | 2014-01-13 | 2017-11-22 | ノキア テクノロジーズ オサケユイチア | マルチ・チャンネル・オーディオ信号分類器 |
EP3067887A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US9837100B2 (en) * | 2015-05-05 | 2017-12-05 | Getgo, Inc. | Ambient sound rendering for online meetings |
GB2559200A (en) * | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9805534D0 (en) * | 1998-03-17 | 1998-05-13 | Central Research Lab Ltd | A method of improving 3d sound reproduction |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
KR100462615B1 (ko) * | 2002-07-11 | 2004-12-20 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US8041042B2 (en) * | 2006-11-30 | 2011-10-18 | Nokia Corporation | Method, system, apparatus and computer program product for stereo coding |
WO2009135532A1 (en) * | 2008-05-09 | 2009-11-12 | Nokia Corporation | An apparatus |
CA2754671C (en) * | 2009-03-17 | 2017-01-10 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
US9210503B2 (en) * | 2009-12-02 | 2015-12-08 | Audience, Inc. | Audio zoom |
US8463414B2 (en) * | 2010-08-09 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus for estimating a parameter for low bit rate stereo transmission |
-
2012
- 2012-04-18 CN CN201280073988.3A patent/CN104364842A/zh active Pending
- 2012-04-18 WO PCT/IB2012/051943 patent/WO2013156814A1/en active Application Filing
- 2012-04-18 EP EP12874814.2A patent/EP2839460A4/en not_active Withdrawn
- 2012-04-18 US US14/394,211 patent/US20150371643A1/en not_active Abandoned
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112233684B (zh) * | 2015-03-09 | 2024-03-19 | 弗劳恩霍夫应用研究促进协会 | 用于对多声道信号进行编码或解码的装置与方法 |
CN112233684A (zh) * | 2015-03-09 | 2021-01-15 | 弗劳恩霍夫应用研究促进协会 | 用于对多声道信号进行编码或解码的装置与方法 |
CN107636757A (zh) * | 2015-05-20 | 2018-01-26 | 瑞典爱立信有限公司 | 多声道音频信号的编码 |
CN107636757B (zh) * | 2015-05-20 | 2021-04-09 | 瑞典爱立信有限公司 | 多声道音频信号的编码 |
CN108292505A (zh) * | 2015-11-20 | 2018-07-17 | 高通股份有限公司 | 多重音频信号的编码 |
US11120807B2 (en) | 2017-08-10 | 2021-09-14 | Huawei Technologies Co., Ltd. | Method for determining audio coding/decoding mode and related product |
WO2019029737A1 (zh) * | 2017-08-10 | 2019-02-14 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
CN109389987A (zh) * | 2017-08-10 | 2019-02-26 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
US11935547B2 (en) | 2017-08-10 | 2024-03-19 | Huawei Technologies Co., Ltd. | Method for determining audio coding/decoding mode and related product |
CN109389987B (zh) * | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
CN111316353A (zh) * | 2017-11-10 | 2020-06-19 | 诺基亚技术有限公司 | 确定空间音频参数编码和相关联的解码 |
CN111316353B (zh) * | 2017-11-10 | 2023-11-17 | 诺基亚技术有限公司 | 确定空间音频参数编码和相关联的解码 |
CN111542877B (zh) * | 2017-12-28 | 2023-11-24 | 诺基亚技术有限公司 | 空间音频参数编码和相关联的解码的确定 |
CN111542877A (zh) * | 2017-12-28 | 2020-08-14 | 诺基亚技术有限公司 | 空间音频参数编码和相关联的解码的确定 |
CN111508507B (zh) * | 2019-01-31 | 2023-03-03 | 华为技术有限公司 | 一种音频信号处理方法及装置 |
CN111508507A (zh) * | 2019-01-31 | 2020-08-07 | 华为技术有限公司 | 一种音频信号处理方法及装置 |
CN112562696A (zh) * | 2019-09-26 | 2021-03-26 | 苹果公司 | 具有离散对象的音频的分层编码 |
WO2022012553A1 (zh) * | 2020-07-17 | 2022-01-20 | 华为技术有限公司 | 多声道音频信号的编解码方法和装置 |
WO2023097686A1 (zh) * | 2021-12-03 | 2023-06-08 | 北京小米移动软件有限公司 | 一种立体声音频信号处理方法及设备/存储介质/装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2013156814A1 (en) | 2013-10-24 |
US20150371643A1 (en) | 2015-12-24 |
EP2839460A4 (en) | 2015-12-30 |
EP2839460A1 (en) | 2015-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104364842A (zh) | 立体声音频信号编码器 | |
JP5081838B2 (ja) | オーディオ符号化及び復号 | |
EP2476113B1 (en) | Method, apparatus and computer program product for audio coding | |
CN103915098A (zh) | 音频信号编码器 | |
JP2013137563A (ja) | ストリーム合成装置、復号装置、ストリーム合成方法、復号方法、およびコンピュータプログラム | |
WO2010125228A1 (en) | Encoding of multiview audio signals | |
US8930197B2 (en) | Apparatus and method for encoding and reproduction of speech and audio signals | |
CN115580822A (zh) | 空间音频捕获、传输和再现 | |
RU2769789C2 (ru) | Способ и устройство кодирования параметра межканальной разности фаз | |
US9311925B2 (en) | Method, apparatus and computer program for processing multi-channel signals | |
CN112823534B (zh) | 信号处理设备和方法以及程序 | |
CN114008705A (zh) | 基于操作条件执行心理声学音频编解码 | |
CN114341976A (zh) | 将基于场景的音频数据相关以用于心理声学音频编解码 | |
EP3818730A1 (en) | Energy-ratio signalling and synthesis | |
US11696075B2 (en) | Optimized audio forwarding | |
CN115497485A (zh) | 三维音频信号编码方法、装置、编码器和系统 | |
JP5483813B2 (ja) | マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法 | |
KR20240005152A (ko) | 다운믹스 신호 및 잔차 신호를 계산하는 방법 및 장치 | |
RU2648632C2 (ru) | Классификатор многоканального звукового сигнала | |
KR20240013351A (ko) | 음장적용기능 및 적응적 소음통제기능이 구비되는 블루투스 이어폰 | |
CN115376527A (zh) | 三维音频信号编码方法、装置和编码器 | |
CN115376529A (zh) | 三维音频信号编码方法、装置和编码器 | |
CN115376528A (zh) | 三维音频信号编码方法、装置和编码器 | |
KR20230135665A (ko) | 공간 오디오 파라미터 인코딩 및 관련 디코딩 결정 | |
KR20210146980A (ko) | 공간 오디오 파라미터의 유의성의 결정 및 관련 인코딩 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20160202 Address after: Espoo, Finland Applicant after: Technology Co., Ltd. of Nokia Address before: Espoo, Finland Applicant before: Nokia Oyj |
|
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150218 |