JP2009528579A - Audio decoding technology for mid / side stereo - Google Patents

Audio decoding technology for mid / side stereo Download PDF

Info

Publication number
JP2009528579A
JP2009528579A JP2008557524A JP2008557524A JP2009528579A JP 2009528579 A JP2009528579 A JP 2009528579A JP 2008557524 A JP2008557524 A JP 2008557524A JP 2008557524 A JP2008557524 A JP 2008557524A JP 2009528579 A JP2009528579 A JP 2009528579A
Authority
JP
Japan
Prior art keywords
channel
decoding
audio
information
imdct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008557524A
Other languages
Japanese (ja)
Inventor
カカラ、サトヤナラヤナ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2009528579A publication Critical patent/JP2009528579A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

本開示はミッド/サイド(MS)ステレオ エンコーディングにより符号化されたオーディオ情報のためのデコーディング技術を説明している。当該技術は従来型でない順序で実行される多数のオーディオ デコーディングのタスクを伴う。復号化のタスクの順序を再配列することにより、様々な効果が得られる。一つの実施形態において、MSステレオのオーディオ情報を復号する方法はオーディオ情報の第1チャネルを復号すること、MSステレオ情報の生成に優先して第1チャネルに対する逆変形離散コサイン変換(IMDCT)を計算すること、オーディオ情報の第2チャネルを復号すること、MSステレオ情報の生成に優先して第2チャネルに対するIMDCTを計算すること、および第1および第2チャネルに対する各IMDCTを使用してMSステレオ情報を生成することを包含する。This disclosure describes a decoding technique for audio information encoded with mid / side (MS) stereo encoding. The technique involves a number of audio decoding tasks that are performed in an unconventional order. By rearranging the order of the decoding tasks, various effects can be obtained. In one embodiment, a method for decoding MS stereo audio information includes decoding a first channel of audio information and calculating an inverse modified discrete cosine transform (IMDCT) for the first channel in preference to generating MS stereo information. Decoding the second channel of audio information, calculating IMDCT for the second channel in preference to generating MS stereo information, and MS stereo information using each IMDCT for the first and second channels Generating.

Description

本開示は、オーディオ コーディング技術と、そしてより特定的には、ミッド/サイド(MS;mid-side)ステレオ エンコーディング技術により符号化されたオーディオ情報のためのデコーディング技術に関する。   The present disclosure relates to audio coding techniques, and more particularly to decoding techniques for audio information encoded with mid-side (MS) stereo encoding techniques.

オーディオ コーディングは多くのアプリケーションおよびサテライト ラジオ、デジタル ラジオ、インターネット ストリーミング(ウェブラジオ)、デジタル ミュージックプレイヤー、そして様々な移動式マルチメディア アプリケーションといった環境で使用されている。多くのオーディオ コーディング規格が存在しており、例えばモーション ピクチャーズ エクスパート グループ(MPEG;motion pictures expert group)やウィンドウズ(登録商標)メディア オーディオ(WMA;windows (登録商標)media audio)による規格や、ドルビー ラボラトリーズ社による規格がある。MP3規格、および、例えばアップルコンピュータ社により販売される「iPod」装置において採用されているアドバンスト オーディオ コーディング(AAC;advanced audio coding)といったMP3規格を後継する規格を含めて、多くのオーディオ コーディング規格が次々と出現し続けている。一般にオーディオ コーディング規格は低ビットレートの達成および圧縮技術を使用しての質の高いオーディオ コーディングの達成を目指す。オーディオ コーディングには「ロスレス(損失のない)」、つまりコーディングがオーディオ信号を劣化させないものがあり、他方では想定以上の圧縮をする目的でオーディオコーディングがいくらかの損失を導くものもある。   Audio coding is used in many applications and environments such as satellite radio, digital radio, Internet streaming (web radio), digital music players, and various mobile multimedia applications. There are many audio coding standards, such as those from the Motion Pictures Expert Group (MPEG), Windows Media Audio (WMA), and Dolby Laboratories. There is a standard by the company. Many audio coding standards, including the MP3 standard and the successor to the MP3 standard, such as advanced audio coding (AAC) used in “iPod” devices sold by Apple Computer, Inc. And continues to appear. In general, audio coding standards aim to achieve low bit rates and high-quality audio coding using compression techniques. Some audio coding is “lossless”, that is, coding does not degrade the audio signal, while other audio coding leads to some loss for the purpose of more compression than expected.

多くのアプリケーションにおいて、オーディオ コーディングはビデオ テレフォニー(VT)あるいはストリーミング ビデオといったアプリケーションのためのマルチメディア コンテンツを提供するためにビデオ コーディングと共に使用される。MPEGによるビデオ コーディング規格は、例えば、オーディオ コーディングおよびビデオ コーディングを多くの場合において使用する。MPEG規格は目下MPEG−1、MPEG−2およびMPEG−4を含むが、おそらく他の規格が出現するであろう。他の典型的なビデオ規格は国際電気通信連合(ITU)のH.263規格、ITUのH.264規格、アップル コンピュータ社により開発されたクイックタイム(TM)の技術、マイクロソフト社により開発されたビデオ フォー ウィンドウズ(TM)、インテル社により開発されたインデオ(TM)、リアル ネットワーク社によるリアルビデオ(TM)、スーパーマック社により開発されたシネパック(TM)である。オーディオおよびビデオの規格がオープン ソースになっているものがある一方で、専売のままのものもある。他にも多くのオーディオおよびビデオ コーディング規格が次々と出現し発展するであろう。   In many applications, audio coding is used in conjunction with video coding to provide multimedia content for applications such as video telephony (VT) or streaming video. MPEG video coding standards, for example, often use audio coding and video coding. MPEG standards currently include MPEG-1, MPEG-2 and MPEG-4, but other standards will likely emerge. Another typical video standard is the International Telecommunications Union (ITU) H.264 standard. H.263 standard, ITU H.264 H.264 standard, Quick Time (TM) technology developed by Apple Computer, Video for Windows (TM) developed by Microsoft, Indeo (TM) developed by Intel, Real Video (TM by Real Network) ), Cinepack (TM) developed by Super Mac. Some audio and video standards are open source, while others remain proprietary. Many other audio and video coding standards will emerge and evolve one after another.

ステレオ コーディングとは2つの異なるコーディング チャネルを使用するオーディオコーディングのことをいう。人間が2つの耳を持ち、それらが方向性の面から音声を認識するという理由で、ステレオ コーディングは復号されたオーディオ信号から人間が認識する知覚音声の音質をより良くすることができる。ステレオ サウンド情報を符号化する比較的直観的方法の1つは、左右の信号をそれぞれ符号化するために左右のチャネルを使用するものである。しかしミュージカル録音のような複雑な音声向けには、左右のマイクロフォンが同一の音声を異なる遅延時間で検出し得るため、左右のエンコーディング チャネルは特に効果的に機能するとはいえない。この結果として、ステレオ サウンドの音質を向上させるためにミッド/サイド(MS;mid-side)ステレオが開発された。   Stereo coding refers to audio coding that uses two different coding channels. Stereo coding can improve the quality of perceived speech that humans perceive from decoded audio signals because humans have two ears and they recognize speech in terms of directionality. One relatively intuitive method of encoding stereo sound information is to use left and right channels to encode the left and right signals, respectively. However, for complex audio such as musical recordings, the left and right encoding channels are not particularly effective because the left and right microphones can detect the same sound with different delay times. As a result, mid-side (MS) stereo was developed to improve the quality of stereo sound.

MSステレオにおいては2つの異なる信号がそれぞれ音声源の位置およびステレオ イメージの反響環境を符号化するために使用される。基本的に、MSステレオは中央の信号と横の信号を介して符号化される。復号化に次いで、左チャネルは一般に符号化された2チャネルの和であり、右チャネルは一般に符号化された2チャネルの差である。中央のステレオ コンポーネントおよび横のステレオ コンポーネントを使用することにより、更に質の高いステレオ コーディングを実現するために、また、与えられた音質レベルに対する更に優れた圧縮レベルを実現するために、左右チャネルにおけるステレオ冗長が活用されることが可能である。   In MS stereo, two different signals are used to encode the location of the audio source and the echo environment of the stereo image, respectively. Basically, MS stereo is encoded via a center signal and a side signal. Following decoding, the left channel is generally the sum of the two encoded channels and the right channel is generally the difference between the two encoded channels. By using the center stereo component and the horizontal stereo component, stereo in the left and right channels can be achieved to achieve higher quality stereo coding and to achieve better compression levels for a given sound quality level. Redundancy can be exploited.

[概要]
本開示はミッド/ サイド(MS)ステレオ エンコーディングに従って符号化されたオーディオ情報のためのデコーディング技術について記述したものである。当該技術は従来型でない順序において実行されるいくつかのオーディオ デコーディング タスクを含む。デコーディング タスクの順序を再配列することにより、様々な効果が得られる。例えば、デコーディング プロセスにおける待ち時間は、第1チャネルに対する逆変形離散コサイン変換(IMDCT:inverse modified discrete cosign transform))のための計算上のタスクが第2チャネルについてのプレ/デコーディングタスクと並行して実行されることを承認することにより、除去もしくは縮小されることが可能である。特定的には、ダイレクト メモリ エクスチェンジ(DME;direct memory exchange)技術と共に使用される時に、当該技術は一方のチャネルに対するIMDCT計算と並行して実行される他方のチャネルの復号化(decoding)において使用されるデコーディング表(例、ハフマン表(Huffman table))をロード(load)するためのメモリの取り出しを可能にする。この方法で、当該技術は計算上の利点を供給し、オーディオ デコーディングプロセスを加速するであろう。
[Overview]
The present disclosure describes a decoding technique for audio information encoded according to mid / side (MS) stereo encoding. The technique involves several audio decoding tasks that are performed in a non-conventional order. By rearranging the order of the decoding tasks, various effects can be obtained. For example, the latency in the decoding process is such that the computational task for the inverse modified discrete cosine transform (IMDCT) for the first channel is parallel to the pre / decoding task for the second channel. Can be removed or reduced by approving it to be executed. Specifically, when used in conjunction with direct memory exchange (DME) technology, the technology is used in the decoding of the other channel that is performed in parallel with the IMDCT calculation for one channel. Allows the retrieval of memory for loading a decoding table (eg, a Huffman table). In this way, the technology will provide computational advantages and accelerate the audio decoding process.

一つの実施形態では、本開示は符号化されたオーディオ情報を格納するメモリおよびその情報を復号するデコーダ ユニットを含む装置を供給する。デコーダ ユニットはオーディオ情報の第1チャネルを復号し、MSステレオ情報の生成に先行して第1チャネルに対するIMDCTを計算し、オーディオ情報の第2チャネルを復号し、MSステレオ情報の生成に先行して第2チャネルに対するIMDCTを計算する。そして第1および第2チャネルに対するIMDCTを使用してMSステレオ情報を生成する。   In one embodiment, the present disclosure provides an apparatus that includes a memory that stores encoded audio information and a decoder unit that decodes the information. The decoder unit decodes the first channel of audio information, calculates IMDCT for the first channel prior to generation of MS stereo information, decodes the second channel of audio information, and prior to generation of MS stereo information. Calculate the IMDCT for the second channel. MS stereo information is then generated using IMDCT for the first and second channels.

他の実施形態では、本開示はMSステレオ オーディオ情報の復号方法を供給する。その方法は、オーディオ情報の第1チャネルを復号し、MSステレオ情報の生成に先行して第1チャネルに対するIMDCTを計算し、オーディオ情報の第2チャネルを復号し、MSステレオ情報の生成に先行して第2チャネルに対するIMDCTを計算し、そして第1および第2チャネルに対するIMDCTを使用してMSステレオ情報を生成することを含む。当該技術を活用するために、第2チャネル用のデコーディング表をロードするためのメモリの取り出しは第1チャネルに対するIMDCT計算の間に実行されることが可能である。   In another embodiment, this disclosure provides a method for decoding MS stereo audio information. The method decodes a first channel of audio information, calculates an IMDCT for the first channel prior to generation of MS stereo information, decodes a second channel of audio information, and precedes generation of MS stereo information. Calculating IMDCT for the second channel and generating MS stereo information using the IMDCT for the first and second channels. In order to take advantage of the technique, a memory fetch to load the decoding table for the second channel can be performed during the IMDCT calculation for the first channel.

ここに記載されている前記およびその他の技術はハードウェア、ソフトウェア、ファームウェア、あるいはそれらの如何なる組み合わせにおいても実行され得る。ソフトウェアにおいて実行される場合、ソフトウェアはデジタル信号プロセッサ(DSP:digital signal processor)あるいは他の型のプロセッサにおいて実行され得る。当該技術を実行するソフトウェアは最初の段階でコンピュータ読み出し可能な媒体内に格納されていて、MSステレオに従って符号化されたオーディオ情報の効果的なオーディオ デコーディングのために、DSP内にロードされ実行されるかも知れない。   The above and other techniques described herein may be implemented in hardware, software, firmware, or any combination thereof. If executed in software, the software may be executed in a digital signal processor (DSP) or other type of processor. Software that implements the technique is initially stored in a computer readable medium, loaded and executed in the DSP for effective audio decoding of audio information encoded according to MS stereo. It may be.

結果的に本開示は、MSステレオをサポートする装置における実行時に、オーディオ情報の第1チャネルを復号し、MSステレオ情報の生成に先行して第1チャネルに対するIMDCTを計算し、オーディオ情報の第2チャネルを復号し、MSステレオ情報の生成に先行して第2チャネルに対するIMDCTを計算し、そして第1および第2チャネルに対するIMDCTを使用してMSステレオ情報を生成する実行可能な命令を含む、コンピュータ読み出し可能な媒体をも考慮している。   As a result, the present disclosure decodes the first channel of audio information, calculates the IMDCT for the first channel prior to generation of the MS stereo information, and executes the second of the audio information when executed on an apparatus that supports MS stereo. A computer comprising executable instructions for decoding the channel, calculating the IMDCT for the second channel prior to generating the MS stereo information, and generating the MS stereo information using the IMDCT for the first and second channels A readable medium is also considered.

さらに他の実施形態では、本開示はデコーダ ユニットがオーディオ情報の第1チャネルを復号し、MSステレオ情報の生成に先行して第1チャネルに対する変換を計算し、オーディオ情報の第2チャネルを復号し、MSステレオ情報の生成に先行して第2チャネルに対する変換を計算し、そして第1および第2チャネルに対する変換を使用してMSステレオ情報を生成する、オーディオ デコーディング装置用のデコーダ ユニットを供給する。   In yet another embodiment, the present disclosure provides that a decoder unit decodes a first channel of audio information, calculates a transform for the first channel prior to generating MS stereo information, and decodes a second channel of audio information. A decoder unit for an audio decoding device is provided that calculates a transform for a second channel prior to generating MS stereo information and generates MS stereo information using the transform for the first and second channels .

様々な実施形態に関する追加の詳細は添付の図および以下の記述において示す。他の特徴、意図、利点は記述および図から、そして請求項から明らかになるであろう。   Additional details regarding various embodiments are set forth in the accompanying drawings and the description below. Other features, intentions, and advantages will be apparent from the description and drawings, and from the claims.

[詳細な説明]
本開示はミッド/サイド(MS)ステレオ エンコーディングにより符号化されたオーディオ情報に対するデコーディング技術を説明する。MSステレオにおいて2つの異なる信号はそれぞれ、音声源の位置およびステレオ イメージの反響環境を符号化するために使用される。基本的に、MSステレオは中央の信号および横の信号から符号化される。MSステレオの復号に次いで、左チャネルは一般に第1および第2の符号化されたチャネルについての和であり、右チャネルは一般に第1および第2の符号化されたチャネルの差である。左右のチャネルは入れ替えも可能である。
[Detailed description]
The present disclosure describes a decoding technique for audio information encoded by mid / side (MS) stereo encoding. Two different signals in MS stereo are used to encode the location of the audio source and the echo environment of the stereo image, respectively. Basically, MS stereo is encoded from the center signal and the side signal. Following MS stereo decoding, the left channel is generally the sum for the first and second encoded channels, and the right channel is generally the difference between the first and second encoded channels. The left and right channels can be interchanged.

従来のMSステレオ デコーディングは、チャネル1の復号に次ぐチャネル1のデ クオンタイゼーション(dequantization)を必要とする。次に、チャネル2が復号され、次いでチャネル2がデ クオンタイゼーションされる。その後、左右のチャネルに対するステレオ情報が復号されたチャネル1およびチャネル2から計算される。例えば、左チャネルのMSステレオ情報はチャネル1+チャネル2を含むことがあり、また、右チャネルのMSステレオ情報はチャネル1−チャネル2を含むことがある。次に、逆変形離散コサイン変換(IMDCT)が左チャネルのステレオ情報に関して実行され、ウィンドウ処理(windowing)が実行され、そしてオーディオ標本(audio sample)が左チャネルに提供(render)される。同様に、IMDCTが右チャネルのステレオ情報に関して実行され、ウィンドウ処理が実行され、そしてオーディオ標本が右チャネルに提供される。このように、従来のMSステレオ デコーディングは一般にMSステレオ情報の生成に次いでIMDCTが実行されるという順に連続したプロセスである。   Conventional MS stereo decoding requires channel 1 dequantization after channel 1 decoding. Channel 2 is then decoded and then channel 2 is dequantized. Thereafter, stereo information for the left and right channels is calculated from the decoded channel 1 and channel 2. For example, the left channel MS stereo information may include channel 1 + channel 2, and the right channel MS stereo information may include channel 1-channel 2. An inverse modified discrete cosine transform (IMDCT) is then performed on the left channel stereo information, windowing is performed, and an audio sample is rendered on the left channel. Similarly, IMDCT is performed on the right channel stereo information, windowing is performed, and audio samples are provided on the right channel. Thus, conventional MS stereo decoding is generally a sequential process in which IMDCT is performed following generation of MS stereo information.

本開示において説明される当該技術は従来のMSステレオ デコーディングに類似したステップを含むことがあるが、通常とは異なる順序でそのステップを実行する。特定すると、本開示に従う場合、IMDCTは左右のチャネルについてのMSステレオ情報の生成に先行してチャネル1およびチャネル2に関して実行される。デコーディング タスクの順序を再配列することにより、様々な効果が得られる。例えば、デコーディング プロセスにおける待ち時間は、第1チャネルに対するIMDCTのための計算上のタスクが第2チャネルに対するプレ/デコーディング タスクと並行して実行されるのを許可することにより除去あるいは減少されることが可能である。特に、デジタル信号プロセッサ(DSP)においてダイレクト メモリ エクスチェンジ(DME)技術が使用される場合、当該技術は一方のチャネルのためのデコーディング表のメモリ取り出しが他方のチャネルに対するIMDCT計算と並行して実行されるのを可能にする。このようにして、ここで説明されている当該技術は計算上の利点を提供しオーディオ デコーディング プロセスを加速するかもしれない。   The techniques described in this disclosure may include steps similar to conventional MS stereo decoding, but perform the steps in an unusual order. Specifically, according to the present disclosure, IMDCT is performed for channel 1 and channel 2 prior to the generation of MS stereo information for the left and right channels. By rearranging the order of the decoding tasks, various effects can be obtained. For example, latency in the decoding process is eliminated or reduced by allowing the computational task for IMDCT for the first channel to be performed in parallel with the pre / decoding task for the second channel. It is possible. In particular, when a direct memory exchange (DME) technique is used in a digital signal processor (DSP), the technique is such that the decoding table memory fetch for one channel is performed in parallel with the IMDCT calculation for the other channel. Make it possible. In this way, the techniques described herein may provide computational benefits and accelerate the audio decoding process.

DME技術は一般に、DSP内のクロック サイクルの期間中にDSPにより処理されることと並行して実行される、デジタル信号処理(DSP)されたメモリの取り出しに関する。他の種類のメモリあるいは処理技術が使用される可能性もあり、特に、プロセッサが計算タスクを実行する間にオンチップ プロセッサ記憶場所へのメモリのロードを並行して実行する機能をサポートする如何なる技術も使用される可能性がある。   DME technology generally relates to fetching digital signal processed (DSP) memory that is performed in parallel with being processed by the DSP during clock cycles within the DSP. Any other type of memory or processing technology may be used, especially any technology that supports the ability to load memory into an on-chip processor storage location in parallel while the processor performs a computational task May also be used.

図1はオーディオ デコーディング装置10のブロック線図であり、装置10は本開示の当該技術を実行することができる。示されるとおり、装置10はメモリ12およびMSステレオ デコーディング ユニット14を包含する。メモリ12はMSステレオに従って符号化されたオーディオ情報を格納するかもしれない。オーディオ情報は、リアルタイム オーディオのような通信チャネルを通じて受信されたか、もしくはメモリ12において延長された期間格納されていた可能性がある。オーディオ情報のデコーディング プロセスを改善する目的で、デコーディング ユニット14は1つあるいはそれ以上の本開示の当該技術を実行する。特に、デコーディング ユニット14はオーディオ情報の第1チャネルを復号し、MSステレオ情報の生成に先行して第1チャネルに対するIMDCTを計算し、オーディオ情報の第2チャネルを復号し、MSステレオ情報の生成に先行して第2チャネルに対するIMDCTを計算し、そして第1および第2チャネルに対する各IMDCTを使用してMSステレオ情報を生成する。その後、MSステレオ情報は左右のスピーカ16Aおよび16Bを駆動する信号を生成するために使用される可能性がある。特に、ドライブ回路15はMSステレオ情報をMSステレオ デコーディング ユニット14から受信し、MSステレオ情報に基づいてスピーカ16Aおよび16Bのための駆動電圧を生成するかもしれない。ドライブ回路15は1つあるいはそれ以上のデジタル/トゥー/アナログ変換回路(DAC;digital-to-analog converter)、パワーアンプおよび他のアナログ信号調節コンポーネントを包含する。   FIG. 1 is a block diagram of an audio decoding device 10 that can implement the techniques of this disclosure. As shown, the apparatus 10 includes a memory 12 and an MS stereo decoding unit 14. The memory 12 may store audio information encoded according to MS stereo. Audio information may have been received over a communication channel such as real-time audio or stored in memory 12 for an extended period of time. In order to improve the decoding process of audio information, decoding unit 14 performs one or more of the techniques of this disclosure. In particular, the decoding unit 14 decodes the first channel of audio information, calculates the IMDCT for the first channel prior to generating the MS stereo information, decodes the second channel of audio information, and generates the MS stereo information. Prior to, IMDCT for the second channel is calculated and MS stereo information is generated using each IMDCT for the first and second channels. Thereafter, the MS stereo information may be used to generate signals that drive the left and right speakers 16A and 16B. In particular, the drive circuit 15 may receive MS stereo information from the MS stereo decoding unit 14 and generate drive voltages for the speakers 16A and 16B based on the MS stereo information. The drive circuit 15 includes one or more digital-to-analog converter (DAC), power amplifiers and other analog signal conditioning components.

MSデコーディングにおける所謂「ボトルネック」つまり障害は、従来のMSデコーディングには符号化されたチャネルが復号されることおよびMSステレオ情報がIMDCTの実行に先行して生成されることの双方が必要となるという事実のせいで発生する可能性がある。しかし、本開示に従えば、符号化された各チャネル(チャネル1および2)に対するIMDCTは左右のチャネルに対するMSステレオ情報の生成に先行して実行される可能性がある。IMDCTについて観察される線形性はこの変化を可能にする。   The so-called “bottleneck” or failure in MS decoding requires both conventional MS decoding to decode the encoded channel and that MS stereo information is generated prior to performing IMDCT. This can happen because of the fact that However, according to the present disclosure, the IMDCT for each encoded channel (channels 1 and 2) may be performed prior to the generation of MS stereo information for the left and right channels. The linearity observed for IMDCT allows this change.

さらにいえば、デコーディング プロセスのステップを再配列することによって、並行処理を活用することにより効果が得られる。例えばデコーディング プロセスにおける待ち時間は、第2チャネルに対するプレ/デコーディング タスクと並行してデコーディング ユニット14が第1チャネルに対するIMDCTを実行するのを許可することにより除去あるいは減少され得る。特に、DME技術あるいは計算中のメモリの取り出しをサポートする類似の技術と共に使用される場合、当該技術はデコーディング ユニット14がIMDCT計算と並行してメモリ12からメモリの取り出しを行うのを許可することができる。メモリの取り出しは、1つのチャネルのデコーディングにおいて使用される目的で、デコーディング表(例えばハフマン表)をロードすることができる。同時に、他方のチャネルに対してIMDCT計算が実行されることが可能である。このようにして、デコーディング ユニット14は計算上の効果を得ることができ、オーディオ デコーディング プロセスは加速され得る。   Furthermore, the benefits can be gained by utilizing parallel processing by rearranging the steps of the decoding process. For example, latency in the decoding process may be eliminated or reduced by allowing decoding unit 14 to perform IMDCT for the first channel in parallel with the pre / decoding task for the second channel. In particular, when used in conjunction with DME technology or similar technology that supports memory retrieval during computation, the technology allows the decoding unit 14 to perform memory retrieval from the memory 12 in parallel with the IMDCT computation. Can do. Memory fetching can load a decoding table (eg, a Huffman table) for the purpose of being used in decoding one channel. At the same time, an IMDCT calculation can be performed for the other channel. In this way, the decoding unit 14 can have a computational effect and the audio decoding process can be accelerated.

装置10はオーディオ デコーディング機能を包含し得る多種多様な装置の何れをも含むかも知れない。例は、iPodのようなデジタル ミュージック プレイヤー、デジタル テレビジョン、デジタル ダイレクト ブロードキャスト システム、無線通信装置、パーソナル デジタル アシスタント(PDA:personal digital assistant)、ラップトップ型コンピュータ、デスクトップ型コンピュータ、デジタル カメラ、デジタル レコーディング装置、セルラーあるいはサテライト ラジオ テレフォン、直接双方向通信装置(時に「ウォーキートーキー」と呼ばれる)、およびその他同種類のものを包含する。   Device 10 may include any of a wide variety of devices that may include audio decoding capabilities. Examples include digital music players such as iPods, digital television, digital direct broadcast systems, wireless communication devices, personal digital assistants (PDAs), laptop computers, desktop computers, digital cameras, digital recording devices , Cellular or satellite radio telephones, direct two-way communication devices (sometimes called "walkie talkies"), and the like.

図2はデコーディング ユニット14により実行されるかも知れないデコーディング プロセスを説明する流れ線図である。示される通り、デコーディング ユニット14はオーディオ情報の第1チャネルを復号し(21)、その後MSステレオ情報の生成(25)に先行して第1チャネルに対するIMDCTを計算する(22)。次に、デコーディング ユニット14はオーディオ情報の第2チャネルを復号し(23)、MSステレオ情報の生成(25)に先行して第2チャネルに対するIMDCTを計算する(24)。   FIG. 2 is a flow diagram illustrating a decoding process that may be performed by decoding unit 14. As shown, decoding unit 14 decodes the first channel of audio information (21) and then calculates the IMDCT for the first channel prior to generating MS stereo information (25) (22). The decoding unit 14 then decodes the second channel of audio information (23) and calculates the IMDCT for the second channel (24) prior to the generation of MS stereo information (25).

第1および第2チャネルに対するIMDCTの計算は実質上以下の数式1および数式2に従うかも知れない。

Figure 2009528579
Figure 2009528579
The IMDCT calculation for the first and second channels may substantially follow Equation 1 and Equation 2 below.
Figure 2009528579
Figure 2009528579

ここで、L_チャネル_時間_出力’はチャネル1に対するIMDCTを意味し、
R_チャネル_時間_出力’はチャネル2に対するIMDCTを意味し、
LおよびRはそれぞれ左および右チャネルのスペクトラム係数を意味し、
Nはデコーダ ユニット14におけるオーディオ フレーム長を意味し、
Kはスペクトラム係数の周波数インデクスを意味し、
nは時間インデクスを意味し、そして
n0は定数である。
Where L_channel_time_output 'means IMDCT for channel 1
R_channel_time_output 'means IMDCT for channel 2
L and R mean the left and right channel spectral coefficients respectively,
N means the audio frame length in the decoder unit 14,
K means frequency index of spectrum coefficient,
n means the time index, and n0 is a constant.

しかし、他の実施例において、デコーダ ユニット14はIMDCTではなく他の種類の変換を使用する可能性がある。   However, in other embodiments, the decoder unit 14 may use other types of transforms rather than IMDCT.

図2において示されるとおり、デコーディング ユニットは第1および第2チャネルに対するIMDCTを使用してMSステレオ情報を生成する(25)。MSステレオ情報はオーディオ標本を生成するために使用され得る左右のチャネル情報を含み、オーディオ標本は左右のスピーカ16Aおよび16Bに対する駆動信号を定義するために順番に使用される可能性がある。さらにまた、左チャネル情報はチャネル1および2からのIMDCTについての加法の組み合わせであり、一方で、右チャネル情報はチャネル1および2に対するIMDCTについての減法の組み合わせであるかも知れない。しかし、右および左チャネルは入れ替え可能であり、左チャネルはIMDCTについての加法の組み合わせであり右チャネルはIMDCTの減法の組み合わせであると定義される可能性もある。特筆すべきは、MSステレオ情報の生成がIMDCT計算の後に起こるという点である。   As shown in FIG. 2, the decoding unit generates MS stereo information using IMDCT for the first and second channels (25). The MS stereo information includes left and right channel information that can be used to generate audio samples, which can be used in turn to define drive signals for the left and right speakers 16A and 16B. Furthermore, the left channel information may be an additive combination for IMDCT from channels 1 and 2, while the right channel information may be a subtractive combination for IMDCT for channels 1 and 2. However, the right and left channels are interchangeable, and the left channel may be defined as an additive combination for IMDCT and the right channel is defined as a subtractive combination of IMDCT. It should be noted that the generation of MS stereo information occurs after the IMDCT calculation.

多くの場合、デコーディング ユニット14は第1および第2チャネルについてデ クオンタイゼーションをも実行するかも知れない。特定的に言えば、デコーディング ユニット14は第1チャネルに対するIMDCTの計算に先行しオーディオ情報の第1チャネルについてデ クオンタイゼーションをするかも知れないし、第2チャネルに対するIMDCTの計算に先行してオーディオ情報の第2チャネルについてデ クオンタイゼーションを実行するかもしれない。   In many cases, decoding unit 14 may also perform dequantization for the first and second channels. Specifically, decoding unit 14 may dequantize the first channel of audio information prior to the calculation of IMDCT for the first channel, and audio information prior to the calculation of IMDCT for the second channel. Quantization may be performed for the second channel.

場合によっては、第1および第2チャネルの復号化はハフマン デコーディング(Huffman decoding)あるいはルックアップ表を使用した他の類似の復号化を含むかも知れない。そのような場合、ルックアップ表(例、ハフマン表)は符号化された各チャネルのためにメモリ12からデコーディング ユニット14へロードされる必要があるかも知れず、連続したオーディオ フレームのために再びロードされることもある。残念ながら、デコーディング ユニット14が容量の大きいオンチップメモリを包含しないDSPとして提供される場合は特に、ハフマン表は比較的大きくなる恐れがある。本開示に従い、第1チャネルの復号化に先行して第1チャネルのためのハフマン表がメモリ12からデコーディング ユニット14にロードされる可能性があり、また第2チャネルに対するIMDCT計算の間に第2チャネルのためのハフマン表がメモリ12からデコーディング ユニット14にロードされる可能性がある。デコーディング ユニット14はハフマン表を格納するのに充分な容量で、しかしながらそのような表を数個格納するには不充分な容量の、ローカル オンチップ メモリを内蔵するDSPを含むかも知れない。   In some cases, decoding of the first and second channels may include Huffman decoding or other similar decoding using a look-up table. In such cases, a look-up table (eg, a Huffman table) may need to be loaded from memory 12 to decoding unit 14 for each encoded channel, and again for successive audio frames. Sometimes loaded. Unfortunately, the Huffman table can be relatively large, especially when the decoding unit 14 is provided as a DSP that does not include large on-chip memory. In accordance with the present disclosure, the Huffman table for the first channel may be loaded from the memory 12 to the decoding unit 14 prior to decoding the first channel, and during the IMDCT calculation for the second channel. A Huffman table for two channels may be loaded from the memory 12 into the decoding unit 14. Decoding unit 14 may include a DSP with local on-chip memory that is large enough to store a Huffman table, but insufficient to store several such tables.

IMDCT計算を実行する間に並行して実行されるメモリのロードは、デコーディングユニット14がダイレクト メモリ エクスチェンジ(DMEs:direct memory exchanges)をサポートするDSPを含む場合に特に有効である。この場合、現行チャネルに対するIMDCT計算の実行と同時に、DSPは次チャネルの復号に対して必要とされる次のハフマン表をロードする目的でメモリ取り出しを実行することができる。さらに、連続する並行的な計算およびメモリ取り出しは連続するオーディオ フレームについて実行される可能性がある。特に、オーディオ情報がオーディオ シーケンスにおける多数のオーディオ フレームに分割された場合、デコーディング ユニット14は第1オーディオ フレームの第1チャネルの復号化に先行して第1オーディオ フレームの第1チャネルのためのハフマン表をロードし、第1オーディオフレームの第2チャネルに対するIMDCTの計算中に第1オーディオ フレームの第2チャネルのためのハフマン表をロードし、そして第1オーディオ フレームの第2チャネルに対するIMDCTの計算中に第2オーディオ フレームの第1チャネルのためのハフマン表をロードするかも知れない。このように、同時に実行される計算およびメモリ取り出しは連続するオーディオ フレーム内の各チャネルの復号と共に実行され得る。   Memory loading performed in parallel while performing the IMDCT calculation is particularly effective when the decoding unit 14 includes a DSP that supports direct memory exchanges (DMEs). In this case, simultaneously with performing the IMDCT calculation for the current channel, the DSP can perform a memory fetch in order to load the next Huffman table required for decoding the next channel. In addition, successive parallel computations and memory fetches can be performed on successive audio frames. In particular, if the audio information is divided into a number of audio frames in the audio sequence, the decoding unit 14 will perform a Huffman for the first channel of the first audio frame prior to decoding the first channel of the first audio frame. Loading table, loading IMFCT for second channel of first audio frame during calculation of IMDCT for second channel of first audio frame, and calculating IMDCT for second channel of first audio frame May load the Huffman table for the first channel of the second audio frame. In this way, simultaneous computation and memory fetching can be performed with the decoding of each channel in successive audio frames.

図3は本開示に従うオーディオ デコーディング プロセスについての様相を示すまた別の流れ線図である。図3に示されるように、デコーディング ユニット14はメモリ12からチャネル1のために、例えばダイレクト メモリ アクセス(DMA)を介して、ルックアップ表をロードする(31)。その後、例えばロードされたルックアップ表を使用して、チャネル1の復号に取り掛かる(32)。その後、例えばダイレクト メモリ エクスチェンジ(DME)を介して、チャネル2のためにメモリ12から別のルックアップ表をロードする(34)のと同時に、デコーディング ユニット14はチャネル1に対するIMDCTを計算する(33)。デコーディン グユニット14はその次にチャネル2を復号し(35)、チャネル2に対するIMDCTを計算することができる(36)。   FIG. 3 is yet another flow diagram illustrating aspects of an audio decoding process in accordance with the present disclosure. As shown in FIG. 3, decoding unit 14 loads a lookup table from memory 12 for channel 1, for example, via direct memory access (DMA) (31). Thereafter, the decoding of channel 1 is started (32) using, for example, a loaded lookup table. Thereafter, simultaneously with loading another look-up table from memory 12 for channel 2 (34), eg, via a direct memory exchange (DME), decoding unit 14 calculates an IMDCT for channel 1 (33). ). The decoding unit 14 can then decode channel 2 (35) and calculate the IMDCT for channel 2 (36).

デコーディング ユニットはその後、チャネル1および2についてのMSステレオ情報を各チャネルに対するIMDCTを使用して生成する(35)。MSステレオ情報はオーディオ標本を生成するために使用され得る左および右チャネル情報を含み、そのオーディオ標本は左および右スピーカ16Aおよび16Bのための駆動信号を定義するために順番に使用され得る。図2に関しては前記の通り、デコーディング ユニット14は、例えば、各チャネルに対するそれぞれのIMDCT計算に先行して、チャネル1および2についてデ クオンタイゼーションをも実行するかも知れない。何れの場合も、MSステレオ情報の生成(37)はIMDCT計算(33および36)の後に起こる。デコーディング ユニット14はその後左および右チャネルに対してウィンドウ処理を実行する可能性およびオーディオ標本を提供する(38)可能性がある。オーディオ標本はステレオ出力のためにスピーカ16Aおよび16Bを駆動するのに必要とされるボルト数を定義するためにドライブ回路15により使用されるかも知れない。   The decoding unit then generates MS stereo information for channels 1 and 2 using the IMDCT for each channel (35). The MS stereo information includes left and right channel information that can be used to generate audio samples, which can be used in turn to define drive signals for the left and right speakers 16A and 16B. As described above with respect to FIG. 2, decoding unit 14 may also perform dequantization for channels 1 and 2, for example, prior to respective IMDCT calculations for each channel. In either case, the generation of MS stereo information (37) occurs after the IMDCT calculation (33 and 36). Decoding unit 14 may then provide the possibility to perform windowing and audio samples for the left and right channels (38). Audio samples may be used by drive circuit 15 to define the number of volts required to drive speakers 16A and 16B for stereo output.

この場合もまた本開示に従い、復号化で使用されるための次のルックアップ表をDMEがロードすることを伴うIMDCTの同時計算は、オーディオ シーケンス内の連続するオーディオ フレームのチャネル1および2に対して繰り返し起こるかも知れない。図4は一連のオーディオ フレームに対してハフマン デコーディングが実行されるという状況において有利となる当該技術を示している。   Again, in accordance with this disclosure, the simultaneous calculation of the IMDCT involving the DME loading the next lookup table to be used in decoding is performed for channels 1 and 2 of successive audio frames in the audio sequence. May happen repeatedly. FIG. 4 illustrates the technique that is advantageous in situations where Huffman decoding is performed on a series of audio frames.

図4で示されるように、デコーディング ユニット14はオーディオ シーケンス内の第1フレームのチャネル1のために、例えばDMAを介して、メモリ12からハフマン表をロードする(41)。デコーディング ユニット14はその後、ロードされたハフマン表を使ってチャネル1を復号する(42)。その後デコーディング ユニット14は、例えばDMEを介して第1フレームのチャネル2のためにメモリ12から別のハフマン表をロードする(43)のと同時に、第1フレームのチャネル1に対するIMDCTを計算する(44)。デコーディング ユニット14はその後、第1フレームのチャネル1に対するIMDCT計算期間中にロードされたハフマン表を使用して第1フレームのチャネル2を復号することができる(45)。   As shown in FIG. 4, decoding unit 14 loads a Huffman table from memory 12 for channel 1 of the first frame in the audio sequence, eg, via DMA (41). Decoding unit 14 then decodes channel 1 using the loaded Huffman table (42). The decoding unit 14 then loads another Huffman table from the memory 12 for channel 2 of the first frame, for example via DME (43) and at the same time calculates the IMDCT for channel 1 of the first frame ( 44). Decoding unit 14 may then decode channel 2 of the first frame using the Huffman table loaded during the IMDCT calculation for channel 1 of the first frame (45).

次にデコーディング ユニットは、例えばDMEを介して、オーディオ シーケンス内の第2フレームのチャネル1のためにメモリ12から別のハフマン表をロードする(46)のと同時に、第1フレームのチャネル2に対するIMDCTを計算する(47)。デコーディング ユニット14はその後、第1フレームのチャネル2に対するIMDCT計算期間中にロードされたハフマン表を使用して第2フレームのチャネル1を復号することができる(48)。   The decoding unit then loads (46) another Huffman table from memory 12 for channel 1 of the second frame in the audio sequence, eg via DME, at the same time for channel 2 of the first frame. IMDCT is calculated (47). Decoding unit 14 may then decode channel 1 of the second frame using the Huffman table loaded during the IMDCT calculation for channel 2 of the first frame (48).

次にデコーディング ユニット14は、例えばDMEを介して、オーディオ シーケンス内の第2フレームのチャネル2のためにメモリ12から別のハフマン表をロードする(49)のと同時に、第2フレームのチャネル1に対するIMDCTを計算する(50)。デコーディング ユニット14はその後、第2フレームのチャネル1に対するIMDCT計算期間中にロードされたハフマン表を使用して第2フレームのチャネル2を復号することができる(51)。   The decoding unit 14 then loads (49) another Huffman table from the memory 12 for channel 2 of the second frame in the audio sequence, for example via DME, at the same time as channel 1 of the second frame. IMDCT for is calculated (50). Decoding unit 14 may then decode channel 2 of the second frame using the Huffman table loaded during the IMDCT calculation for channel 1 of the second frame (51).

次にデコーディング ユニット14は、例えばDMEを介して、オーディオ シーケンス内の第3フレームのチャネル1のためにメモリ12から別のハフマン表をロードする(49)のと同時に、第2フレームのチャネル2に対するIMDCTを計算する(53)。このプロセスはオーディオ シーケンスにおけるMS符号化されたオーディオ フレームの何番目までも続くことが可能である。後続して起こるそれぞれのIMDCT計算と共に、メモリ取り出しおよび次に必要とされるハフマン表のロードの同時進行は待ち時間を減少させるために実行されることが可能であり、デコーディング プロセスを加速することが可能である。   The decoding unit 14 then loads (49) another Huffman table from the memory 12 for channel 1 of the third frame in the audio sequence, for example via DME, at the same time as channel 2 of the second frame. Calculate IMDCT for (53). This process can continue for any number of MS encoded audio frames in the audio sequence. Along with each subsequent IMDCT calculation, a concurrent memory fetch and next required Huffman table load can be performed to reduce latency, accelerating the decoding process. Is possible.

ここまで多数の実施形態が記述されてきた。しかし、ここに述べられている当該技術には様々な変更が加えられ得る。例えば、MSステレオは2チャネルから構成される可能性がある、あるいはマルチ/チャネル サラウンド システムのようなマルチ/チャネル システムについての2チャネルについて参照する可能性がある。加えて、IMDCTではなく他の種類の変換がMSステレオ デコーディングに対して使用されるかも知れない。また、本開示はハフマン コーディングに対してハフマン表を参照してきたが、本開示によれば他の種類のコーディングが使用されることが可能である。ハフマン コーディングはオーディオ情報をロスレスに符号化および復号する結果になる理由からハフマン コーディングは有効な例である。他のコーディング技術もまた本開示の指導から利点を得るかも知れない。特に、連続したオーディオ フレームの各チャネルのためにメモリからのロードを要求するルックアップ コーディング技術は本開示の指導から利点を得るかも知れない。   A number of embodiments have been described so far. However, various modifications can be made to the techniques described herein. For example, MS stereo may consist of two channels, or may reference for two channels for a multi / channel system such as a multi / channel surround system. In addition, other types of transforms rather than IMDCT may be used for MS stereo decoding. Also, although the present disclosure has referenced Huffman tables for Huffman coding, other types of coding can be used according to the present disclosure. Huffman coding is an effective example because it results in lossless encoding and decoding of audio information. Other coding techniques may also benefit from the teachings of this disclosure. In particular, lookup coding techniques that require loading from memory for each channel of successive audio frames may benefit from the teachings of this disclosure.

ここで述べられている当該技術はハードウェア、ソフトウェア、ファームウェア、あるいはそれらの何れの組み合わせにおいても実行されるかも知れない。当該技術はソフトウェアにおいて実行される場合、ビデオ シーケンスを符号化する装置において実行される際にここで記述されているオーディオ デコーディング技術の1つあるいはそれ以上を実行するプログラムコードを含む、コンピュータ読み出し可能な媒体に向けられているかも知れない。その場合、コンピュータ読み出し可能な媒体は例えば同期ダイナミック ランダム アクセスメモリ(SDRAM)、読み出し専用メモリ(ROM)、非揮発性メモリ(NVRAM)、電気的に消去可能でプログラムも可能な読み出し専用メモリ(EEPROM)、フラッシュ メモリ等のようなランダム アクセス メモリ(RAM)を含むかも知れない。   The techniques described herein may be implemented in hardware, software, firmware, or any combination thereof. When implemented in software, the techniques include computer code that includes program code that performs one or more of the audio decoding techniques described herein when executed in an apparatus that encodes a video sequence. May be directed to various media. In this case, the computer-readable medium is, for example, a synchronous dynamic random access memory (SDRAM), a read-only memory (ROM), a non-volatile memory (NVRAM), or an electrically erasable and programmable read-only memory (EEPROM). May include random access memory (RAM), such as flash memory.

プログラム・コードはコンピュータ読み出し可能な指示の形式でメモリに格納されるかも知れない。その場合、DSPのようなプロセッサは1つあるいはそれ以上のオーディオデコーディング技術を遂行する目的でメモリに格納されている命令を実行するかも知れない。当該技術はコーディング プロセスを加速するために様々なハードウェア コンポーネントを援用するDSPによって実行されるかも知れない場合がある。また一方で、ここで記述されているユニットはマイクロプロセッサ、1つあるいはそれ以上のアプリケーション スペシフィック インテグレーテッド サーキット(ASICs)、1つあるいはそれ以上のフィールド プログラマブル ゲート アレー(FPGAs)、あるいは他の何らかのハードウェア/ソフトウェアの組み合わせとして提供されるかも知れない場合もある。   The program code may be stored in memory in the form of computer readable instructions. In that case, a processor such as a DSP may execute instructions stored in memory for the purpose of performing one or more audio decoding techniques. The technique may be performed by a DSP that employs various hardware components to accelerate the coding process. On the other hand, the units described here may be microprocessors, one or more application specific integrated circuits (ASICs), one or more field programmable gate arrays (FPGAs), or some other hardware. / May be provided as a software combination.

これらおよび他の実施形態は以下に続く請求項の範囲の内にある。   These and other embodiments are within the scope of the following claims.

本開示の当該技術を実行することができるオーディオ デコーディング装置例のブロック線図である。FIG. 6 is a block diagram of an example audio decoding device that can implement the techniques of this disclosure. 図1のオーディオ デコーディング装置もしくは他の類似の装置により実行される技術を説明する流れ線図である。FIG. 2 is a flow diagram illustrating a technique performed by the audio decoding device of FIG. 1 or other similar devices. 図1のオーディオ デコーディング装置もしくは他の類似の装置により実行される技術を説明する流れ線図である。FIG. 2 is a flow diagram illustrating a technique performed by the audio decoding device of FIG. 1 or other similar devices. 図1のオーディオ デコーディング装置もしくは他の類似の装置により実行される技術を説明する流れ線図である。FIG. 2 is a flow diagram illustrating a technique performed by the audio decoding device of FIG. 1 or other similar devices.

Claims (26)

符号化されたオーディオ情報を格納するためのメモリと、そして
符号化された情報を復号するためのデコーダ ユニットとを含む装置であって、
該デコーダユニットは
オーディオ情報の第1チャネルを復号し、
ミッド/サイド(MS)ステレオ情報の生成に先行して第1チャネルに対する逆変形離散コサイン変換(IMDCT)を計算し、
オーディオ情報の第2チャネルを復号し、
MSステレオ情報の生成に先行して第2チャネルに対するIMDCTを計算し、そして、
第1および第2チャネルに対する各IMDCTを使用してMSステレオ情報を生成するように動作可能である、装置。
An apparatus comprising a memory for storing encoded audio information, and a decoder unit for decoding the encoded information,
The decoder unit decodes the first channel of audio information;
Calculating an inverse modified discrete cosine transform (IMDCT) for the first channel prior to generation of mid / side (MS) stereo information;
Decoding the second channel of audio information;
Calculate the IMDCT for the second channel prior to generating the MS stereo information; and
An apparatus operable to generate MS stereo information using each IMDCT for the first and second channels.
該デコーダユニットは、
第1チャネルに対するIMDCTの計算に先行してオーディオ情報の第1チャネルについてのデ クオンタイゼーションを実行するように動作可能であり、そして
第2チャネルに対するIMDCTの計算に先行してオーディオ情報の第2チャネルについてデ クオンタイゼーションを実行するように動作可能である、請求項1記載の装置。
The decoder unit is
Operable to perform dequantization for the first channel of audio information prior to calculation of IMDCT for the first channel, and second channel of audio information prior to calculation of IMDCT for the second channel The apparatus of claim 1, wherein the apparatus is operable to perform dequantization on.
さらに、左および右のステレオ スピーカを含み、MSステレオ情報が左および右チャネル情報を備え、またデコーダ ユニットは左および右チャネル情報にウィンドウ処理を実行することが可能であり、左および右のステレオスピーカに対してオーディオ標本を提供する、請求項1記載の装置。   In addition, left and right stereo speakers are included, the MS stereo information comprises left and right channel information, and the decoder unit can perform windowing on the left and right channel information, and the left and right stereo speakers The apparatus of claim 1, wherein the apparatus provides an audio specimen. 第1チャネルの復号化が第1チャネルをハフマン デコーディングすることを含み、第2チャネルの復号化が第2チャネルをハフマン デコーディングすることを含む、請求項1記載の装置。   The apparatus of claim 1, wherein decoding the first channel includes Huffman decoding the first channel, and decoding the second channel includes Huffman decoding the second channel. デコーディング ユニットが第1チャネルの復号化に先行して第1チャネルのためのハフマン表をロードするように動作可能であり、そして第1チャネルに対するIMDCTの計算をする間に第2チャネルのためのハフマン表をロードするように動作可能である、請求項4記載の装置。   The decoding unit is operable to load a Huffman table for the first channel prior to decoding the first channel, and for the second channel while calculating the IMDCT for the first channel The apparatus of claim 4, wherein the apparatus is operable to load a Huffman table. デコーディング ユニットがオーディオ シーケンス内の複数のオーディオ フレームに関し第1および第2チャネルを復号するように動作可能である、請求項1記載の装置。   The apparatus of claim 1, wherein the decoding unit is operable to decode the first and second channels for a plurality of audio frames in the audio sequence. デコーディング ユニットがハフマン デコーディングを実行するように動作可能であり、
なお、デコーディング ユニットが第1オーディオ フレームの第1チャネルの復号化に先行して第1オーディオフレームの第1チャネルのためのハフマン表をロードし、
第1オーディオ フレームの第1チャネルに対するIMDCTを計算する間に第1オーディオ フレームの第2チャネルのためのハフマン表をロードし、および
第1オーディオ フレームの第2チャネルに対するIMDCTを計算する間に第2オーディオ フレームの第1チャネルのためのハフマン表をロードするように動作可能である、請求項6記載の装置。
The decoding unit is operable to perform Huffman decoding,
Note that the decoding unit loads the Huffman table for the first channel of the first audio frame prior to decoding the first channel of the first audio frame;
Loading the Huffman table for the second channel of the first audio frame while calculating the IMDCT for the first channel of the first audio frame and second while calculating the IMDCT for the second channel of the first audio frame The apparatus of claim 6, wherein the apparatus is operable to load a Huffman table for a first channel of an audio frame.
デコーディング ユニットがダイレクト メモリ エクスチェンジ(DMEs)をサポートするデジタル信号プロセッサ(DSP)を含む、請求項1記載の装置。   The apparatus of claim 1, wherein the decoding unit includes a digital signal processor (DSP) that supports direct memory exchanges (DMEs). 装置がデジタル ミュージック プレイヤー、無線通信装置、パーソナル デジタル アシスタント(PDA)、ラップトップ型コンピュータ、デスクトップ型コンピュータ、デジタルカメラ、デジタルビデオ・レコーディング装置、無線電話、および直接双方向通信装置のうち少なくとも1つを含む、請求項1記載の装置。   The device includes at least one of a digital music player, a wireless communication device, a personal digital assistant (PDA), a laptop computer, a desktop computer, a digital camera, a digital video recording device, a wireless telephone, and a direct two-way communication device. The apparatus of claim 1, comprising: ミッド/サイド(MS)ステレオのオーディオ情報を復号する方法であって、
オーディオ情報の第1チャネルを復号化し、
MSステレオ情報の生成に先行して第1チャネルに対する逆変形離散コサイン変換(IMDCT)を計算し、
オーディオ情報内の第2チャネルの復号化し、
MSステレオ情報の生成に先行して第2チャネルに対するIMDCTを計算し、そして、
第1および第2チャネルに対する各IMDCTを使用してMSステレオ情報を生成すること、
を含む方法。
A method for decoding mid / side (MS) stereo audio information, comprising:
Decoding the first channel of audio information;
Calculating an inverse modified discrete cosine transform (IMDCT) for the first channel prior to generating the MS stereo information;
Decoding the second channel in the audio information;
Calculate the IMDCT for the second channel prior to generating the MS stereo information; and
Generating MS stereo information using each IMDCT for the first and second channels;
Including methods.
さらに、第1チャネルに対するIMDCTの計算に先行してオーディオ情報の第1チャネルについてのデ クオンタイゼーションを実行し、および
第2チャネルに対するIMDCTの計算に先行してオーディオ情報の第2チャネルについてのデ クオンタイゼーションを実行することを含む、請求項10記載の方法。
In addition, dequantization for the first channel of audio information is performed prior to calculation of IMDCT for the first channel, and dequantization for the second channel of audio information is performed prior to calculation of IMDCT for the second channel. The method of claim 10, comprising performing an initialization.
MSステレオ情報が左および右のチャネル情報を含む請求項10記載の方法であって、さらに左および右のチャネル情報に対してウィンドウ処理を実行すること、また、左および右のステレオスピーカに対してオーディオ標本を提供することを含む、請求項10記載の方法。   11. The method of claim 10, wherein the MS stereo information includes left and right channel information, further performing windowing on the left and right channel information, and for left and right stereo speakers The method of claim 10, comprising providing an audio specimen. 第1チャネルの復号化が第1チャネルをハフマン デコーディングすること、および、第2チャネルの復号化が第2チャネルをハフマン デコーディングすることを含む、請求項10記載の方法。   The method of claim 10, wherein decoding the first channel includes Huffman decoding the first channel and decoding the second channel includes Huffman decoding the second channel. さらに、第1チャネルの復号化に先行して第1チャネルのためのハフマン表をロードすること、および、第1チャネルに対するIMDCTを計算する間に第2チャネルのためのハフマン表をロードすることを含む、請求項13記載の方法。   In addition, loading the Huffman table for the first channel prior to decoding the first channel, and loading the Huffman table for the second channel while calculating the IMDCT for the first channel. 14. The method of claim 13, comprising. さらに、オーディオ シーケンス内の複数のオーディオ フレームの第1および第2チャネルの復号化を含む、請求項10記載の方法。   The method of claim 10, further comprising decoding first and second channels of a plurality of audio frames in the audio sequence. 第1および第2チャネルの復号化が第1および第2チャネルをハフマン デコーディングすることを含む請求項15記載の方法であって、
デコーディングユニットが第1チャネルの復号化に先行して第1オーディオ フレームの第1チャネルのためにハフマン表をロードし、
第1オーディオフレームの第1チャネルに対するIMDCTを計算する間に第1オーディオフレームの第2チャネルのためのハフマン表をロードし、および
第1オーディオフレームの第2チャネルに対するIMDCTを計算する間に第2オーディオフレームの第1チャネルのためのハフマン表をロードすることを含む、請求項15記載の方法。
16. The method of claim 15, wherein decoding the first and second channels comprises Huffman decoding the first and second channels,
A decoding unit loads a Huffman table for the first channel of the first audio frame prior to decoding the first channel;
Loading the Huffman table for the second channel of the first audio frame while calculating the IMDCT for the first channel of the first audio frame and second while calculating the IMDCT for the second channel of the first audio frame 16. The method of claim 15, comprising loading a Huffman table for the first channel of an audio frame.
ミッド/サイド(MS)ステレオをサポートする装置において実行可能な命令を含むコンピュータ読み出し可能な媒体であって、
オーディオ情報の第1チャネルを復号し、
MSステレオ情報の生成に先行して第1チャネルに対する逆変形離散コサイン変換(IMDCT)を計算し、
オーディオ情報の第2チャネルを復号し、
MSステレオ情報の生成に先行して第2チャネルに対するIMDCTを計算し、そして、
第1および第2チャネルに対する各IMDCTを使用してMSステレオ情報を生成する、実行可能な命令を含むコンピュータ読み出し可能な媒体。
A computer readable medium containing instructions executable on a device that supports mid / side (MS) stereo,
Decoding the first channel of audio information;
Calculating an inverse modified discrete cosine transform (IMDCT) for the first channel prior to generating the MS stereo information;
Decoding the second channel of audio information;
Calculate the IMDCT for the second channel prior to generating the MS stereo information; and
A computer readable medium containing executable instructions for generating MS stereo information using each IMDCT for the first and second channels.
さらに、第1チャネルに対するIMDCTの計算に先行してオーディオ情報の第1チャネルについてデ クオンタイゼーションを実行し、そして、
第2チャネルに対するIMDCTの計算に先行してオーディオ情報の第2チャネルについてデ クオンタイゼーションを実行する命令を含む、請求項17記載のコンピュータ読み出し可能な媒体。
In addition, performing dequantization on the first channel of audio information prior to the calculation of IMDCT for the first channel; and
18. The computer readable medium of claim 17, comprising instructions for performing dequantization on a second channel of audio information prior to calculating an IMDCT for the second channel.
MSステレオ情報が左および右チャネル情報を含み、そして該命令が左および右のチャネル情報にウィンドウ処理を実行し、左および右のステレオ スピーカに対してオーディオ標本を提供する、請求項17記載のコンピュータ読み出し可能な媒体。   18. The computer of claim 17, wherein the MS stereo information includes left and right channel information and the instructions perform windowing on the left and right channel information and provide audio samples for the left and right stereo speakers. A readable medium. 該命令がハフマン デコーディングを使用して第1チャネルを復号し、そして該命令がハフマンデ コーディングを使用して第2チャネルを復号する、請求項17記載のコンピュータ読み出し可能な媒体。   The computer-readable medium of claim 17, wherein the instructions decode the first channel using Huffman decoding and the instructions decode the second channel using Huffman decoding. 該命令が第1チャネルの復号化に先行して第1チャネルのためのハフマン表をロードし、そして
第1チャネルに対するIMDCTの計算の間に第2チャネルに対するハフマン表をロードする、請求項21記載のコンピュータ読み出し可能な媒体。
23. The instructions load the Huffman table for the first channel prior to decoding the first channel and load the Huffman table for the second channel during the IMDCT calculation for the first channel. Computer readable media.
該命令がオーディオシーケンス内の複数のオーディオフレームの第1および第2チャネルを復号する、請求項17記載のコンピュータ読み出し可能な媒体。   The computer-readable medium of claim 17, wherein the instructions decode first and second channels of a plurality of audio frames in an audio sequence. 該命令がハフマン デコーディングを使用し、および、該命令が第1オーディオ フレームの第1チャネルの復号化に先行して第1オーディオフレームの第1チャネルのためのハフマン表をロードし、第1オーディオフレームの第1チャネルに対するIMDCTを計算する間に第1オーディオ フレームの第2チャネルのためのハフマン表をロードし、また、第1オーディオ フレームの第2チャネルに対するIMDCTを計算する間に第2オーディオ フレームの第1チャネルのためのハフマン表をロードする、請求項22記載のコンピュータ読み出し可能な媒体。   The instruction uses Huffman decoding, and the instruction loads a Huffman table for the first channel of the first audio frame prior to decoding the first channel of the first audio frame; Loading the Huffman table for the second channel of the first audio frame while calculating the IMDCT for the first channel of the frame, and the second audio frame while calculating the IMDCT for the second channel of the first audio frame 23. The computer readable medium of claim 22, loading a Huffman table for a first channel of the first. オーディオ デコーディング装置のためのデコーダユニットであって、
該デコーダユニットは、
オーディオ情報の第1チャネルを復号し、
ミッド/サイド(MS)ステレオ情報の生成に先行して第1チャネルに対する変換を計算し、
オーディオ情報の第2チャネルを復号し、
MSステレオ情報の生成に先行して第2チャネルに対する変換を計算し、および、
第1および第2チャネルに対する変換を使用してMSステレオ情報を生成するように動作可能である、
オーディオ デコーディング装置のためのデコーダ ユニット。
A decoder unit for an audio decoding device,
The decoder unit is
Decoding the first channel of audio information;
Calculate the transformation for the first channel prior to the generation of mid / side (MS) stereo information;
Decoding the second channel of audio information;
Calculating a transform for the second channel prior to generating the MS stereo information; and
Operable to generate MS stereo information using transforms for the first and second channels;
Decoder unit for audio decoding equipment.
第1および第2チャネルに対する変換が逆変形離散コサイン変換(IMDCT)を含む、請求項24記載のデコーダ ユニット。   The decoder unit of claim 24, wherein the transform for the first and second channels comprises an inverse modified discrete cosine transform (IMDCT). デコーダ ユニットが第1チャネルの復号化に先行して第1チャネルの復号のための表をロードするように動作可能であり、また、第1チャネルに対する変換を計算する間に第2チャネルのための表をロードするように動作可能である、請求項24記載のデコーダ ユニット。   The decoder unit is operable to load a table for decoding the first channel prior to decoding the first channel, and for the second channel while calculating the transform for the first channel 25. A decoder unit according to claim 24, operable to load a table.
JP2008557524A 2006-03-02 2007-03-02 Audio decoding technology for mid / side stereo Pending JP2009528579A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/367,534 US8064608B2 (en) 2006-03-02 2006-03-02 Audio decoding techniques for mid-side stereo
PCT/US2007/063228 WO2007101277A1 (en) 2006-03-02 2007-03-02 Audio decoding techniques for mid-side stereo

Publications (1)

Publication Number Publication Date
JP2009528579A true JP2009528579A (en) 2009-08-06

Family

ID=38157789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008557524A Pending JP2009528579A (en) 2006-03-02 2007-03-02 Audio decoding technology for mid / side stereo

Country Status (6)

Country Link
US (1) US8064608B2 (en)
EP (1) EP1989708A1 (en)
JP (1) JP2009528579A (en)
KR (1) KR20080103095A (en)
CN (1) CN101395660A (en)
WO (1) WO2007101277A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008066836A1 (en) * 2006-11-28 2008-06-05 Treyex Llc Method and apparatus for translating speech during a call
US20100106797A1 (en) * 2008-10-23 2010-04-29 Qualcomm Incorporated Methods and apparatus for hybrid broadcast and peer-to-peer network using cooperative mimo
US20100331048A1 (en) * 2009-06-25 2010-12-30 Qualcomm Incorporated M-s stereo reproduction at a device
KR101733205B1 (en) 2010-04-05 2017-05-08 삼성전자주식회사 Audio decoding system and audio decoding method thereof

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675590A (en) * 1992-03-02 1994-03-18 American Teleph & Telegr Co <Att> Method and apparatus for coding audio signal based on perception model
JP2001282290A (en) * 2000-03-29 2001-10-12 Sanyo Electric Co Ltd Audio data encoding device
JP2004246224A (en) * 2003-02-17 2004-09-02 Matsushita Electric Ind Co Ltd Audio high-efficiency encoder, audio high-efficiency encoding method, audio high-efficiency encoding program, and recording medium therefor
JP2005141121A (en) * 2003-11-10 2005-06-02 Matsushita Electric Ind Co Ltd Audio reproducing device

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1209744C (en) * 2001-11-02 2005-07-06 松下电器产业株式会社 Coding device and decoding device
KR20030065228A (en) * 2002-01-31 2003-08-06 김종수 System for outputs Ch'ongjin acoustic signal
US7020603B2 (en) * 2002-02-07 2006-03-28 Intel Corporation Audio coding and transcoding using perceptual distortion templates
WO2004098105A1 (en) * 2003-04-30 2004-11-11 Nokia Corporation Support of a multichannel audio extension
US7657336B2 (en) * 2003-10-31 2010-02-02 Broadcom Corporation Reduction of memory requirements by de-interleaving audio samples with two buffers
JP2005202248A (en) * 2004-01-16 2005-07-28 Fujitsu Ltd Audio encoding device and frame region allocating circuit of audio encoding device
US8515741B2 (en) * 2004-06-18 2013-08-20 Broadcom Corporation System (s), method (s) and apparatus for reducing on-chip memory requirements for audio decoding
TWI273562B (en) * 2004-09-01 2007-02-11 Via Tech Inc Decoding method and apparatus for MP3 decoder

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675590A (en) * 1992-03-02 1994-03-18 American Teleph & Telegr Co <Att> Method and apparatus for coding audio signal based on perception model
JP2001282290A (en) * 2000-03-29 2001-10-12 Sanyo Electric Co Ltd Audio data encoding device
JP2004246224A (en) * 2003-02-17 2004-09-02 Matsushita Electric Ind Co Ltd Audio high-efficiency encoder, audio high-efficiency encoding method, audio high-efficiency encoding program, and recording medium therefor
JP2005141121A (en) * 2003-11-10 2005-06-02 Matsushita Electric Ind Co Ltd Audio reproducing device

Also Published As

Publication number Publication date
US8064608B2 (en) 2011-11-22
EP1989708A1 (en) 2008-11-12
KR20080103095A (en) 2008-11-26
WO2007101277A1 (en) 2007-09-07
US20070217617A1 (en) 2007-09-20
CN101395660A (en) 2009-03-25

Similar Documents

Publication Publication Date Title
KR102381202B1 (en) Apparatus for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values
KR102410307B1 (en) Coded hoa data frame representation taht includes non-differential gain values associated with channel signals of specific ones of the data frames of an hoa data frame representation
JP2012524301A (en) Less complex spectral band replication (SBR) filter bank
US9646615B2 (en) Audio signal encoding employing interchannel and temporal redundancy reduction
CN106471580B (en) Method and apparatus for determining a minimum number of integer bits required to represent non-differential gain values for compression of a representation of a HOA data frame
JP2009528579A (en) Audio decoding technology for mid / side stereo
US20130034232A1 (en) Method and apparatus for down-mixing multi-channel audio signal
CN106663434B (en) Method for determining the minimum number of integer bits required to represent non-differential gain values for compression of a representation of a HOA data frame
WO2009142017A1 (en) Stereo signal conversion device, stereo signal inverse conversion device, and method thereof
Anwar et al. OpenMax Based MPEG4 SP Video Decoder for ARM926EJ-S Platform
Sajid et al. OpenMax Based MPEG4 SP Video Decoder for ARM926EJ-S Platform
KR20090030085A (en) Method of managing a memory and memory system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111129