JPWO2009057327A1 - 符号化装置および復号装置 - Google Patents

符号化装置および復号装置 Download PDF

Info

Publication number
JPWO2009057327A1
JPWO2009057327A1 JP2009538954A JP2009538954A JPWO2009057327A1 JP WO2009057327 A1 JPWO2009057327 A1 JP WO2009057327A1 JP 2009538954 A JP2009538954 A JP 2009538954A JP 2009538954 A JP2009538954 A JP 2009538954A JP WO2009057327 A1 JPWO2009057327 A1 JP WO2009057327A1
Authority
JP
Japan
Prior art keywords
signal
monaural
residual signal
band
reference signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009538954A
Other languages
English (en)
Other versions
JP5413839B2 (ja
Inventor
ハイシャン ツォン
ハイシャン ツォン
ゾンシアン リウ
ゾンシアン リウ
コック セン チョン
コック セン チョン
吉田 幸司
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2009538954A priority Critical patent/JP5413839B2/ja
Publication of JPWO2009057327A1 publication Critical patent/JPWO2009057327A1/ja
Application granted granted Critical
Publication of JP5413839B2 publication Critical patent/JP5413839B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Abstract

チャネル間予測(ICP)を用いたスケーラブルなステレオ音声符号化において、ICPの予測性能を改善する符号化装置。この符号化装置では、ICP分析部(113、114、115)は、それぞれ、サイド残差信号の低帯域部分の周波数係数sL'(f)、モノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)、モノラル残差信号の低帯域部分の周波数係数mL(f)を基準信号候補として、これとサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)とのICP分析を行い、第1、第2、第3ICP係数を生成する。選択部(116)は、各基準信号候補とサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)との関係をチェックすることによって、基準信号候補の中から最適な基準信号を選択し、選択した基準信号を示す基準信号ID及び基準信号に対応するICP係数をICPパラメータ量子化部(117)に出力する。

Description

本発明は、チャネル間予測(ICP)を用いてスケーラブルなステレオ音声符号化を実現する符号化装置および復号装置に関する。
従来、音声符号化(音声コーデック)は、電話帯域(200Hz〜3.4kHz)の狭帯域音声を使用する通信用途に用いられる。モノラル音声の狭帯域音声コーデックは、移動電話、遠隔会議機器、および、パケットネットワーク(たとえば、インターネット)上での音声通信などの通信用途に広く使用されている。
より臨場感のある音声通信システムに向けたステップの一つは、モノラル音声表現からステレオ音声表現への移行である。広帯域ステレオ音声通信は、より自然な音響環境を提供する。スケーラブルステレオ音声符号化は、高音質で有用性の高い音声通信を実現するためのコア技術である。
ステレオ音声信号を符号化する一般的な方法の一つは、モノラル音声に基づく信号予測手法を使用することによる。すなわち、基本チャネル信号を公知のモノラル音声コーデックを使用して送信し、この基本チャネル信号から、追加の情報およびパラメータを使用して左チャネルまたは右チャネルを予測する。多くのアプリケーションでは、基本チャネル信号として、左チャネル信号と右チャネル信号がミックスされたモノラル信号が選択される。
ステレオ信号を符号化する方法としてISC(Intensity Stereo Coding:強度ステレオ符号化)、BCC(Binaural Cue Coding:バイノーラル・キュー符号化)、およびICP(Inter-Channel Prediction:チャネル間予測)などが知られている。これらのパラメトリックなステレオ符号化方式は、それぞれ異なる長所および短所を持ち、それぞれ異なる音源(source materials)の符号化に適している。
非特許文献1には、これらの符号化方法を用いて、モノラル信号に基づきステレオ信号を予測する技術が開示されている。具体的には、ステレオ信号を構成するチャネル信号、例えば、左チャネル信号と右チャネル信号とを合成してモノラル信号を得、得られるモノラル信号を公知の音声コーデックを使用して符号化/復号し、さらに予測パラメータを用いてモノラル信号から左チャネルと右チャネルの差信号(サイド信号(side signal))を予測する。このような符号化方法において、符号化側は、モノラル信号とサイド信号との関係を時間依存性の適応フィルタを使用してモデル化し、フレーム毎に算出されたフィルタ係数を復号側に送信する。復号側では、モノラルコーデックによって送信された高品質なモノラル信号をフィルタリングすることによって、差信号を再生成し、再生成した差信号とモノラル信号から、左チャネル信号および右チャネル信号を算出する。
また、非特許文献2には、チャネル間相関キャンセラー(Cross-Channel Correlation Canceller)と呼ばれる符号化方法が開示されており、ICP方式の符号化方法においてチャネル間相関キャンセラーの技術を適用する場合、一方のチャネルから他方のチャネルを予測することができる。
また、近年、オーディオ圧縮技術が急速に発展し、その中で、変形離散コサイン変換(MDCT)方式が、高品質のオーディオ符号化における主要な手法となっている(非特許文献3、非特許文献4参照)。
適切な窓ウィンドウ(例:正弦窓)が使用される場合、MDCTは、聴覚上大きな問題が生じることなくオーディオ圧縮に適用されてきた。最近では、MDCTは、マルチモード変換予測符号化(multimode transform predictive coding)のパラダイムにおいて重要な役割を果たしている。
マルチモード変換予測符号化とは、音声符号化の原理とオーディオ符号化の原理とをひとつの符号化体系としてまとめるものである(非特許文献4)。ただし、非特許文献4における、MDCTに基づく符号化構造およびその適用は、1つのチャネルの信号のみを符号化するように設計され、異なる周波数領域におけるMDCT係数を、異なる量子化方式を使用して量子化している。
Extended AMR Wideband Speech Codec (AMR-WB+): Transcoding functions, 3GPP TS 26.290. S. Minami and O. Okada, "Stereophonic ADPCM voice coding method," in Proc. ICASSP’90, Apr. 1990. Ye Wang and Miikka Vilermo, "The modified discrete cosine transform: its implications for audio coding and error concealment," in AES 22nd International Conference on Virtual, Synthetic and Entertainment, 2002. Sean A. Ramprashad, "The multimode transform predictive coding paradigm," IEEE Tran. Speech and Audio Processing, vol. 11, pp. 117 - 129, Mar. 2003. Wai C. Chu, "Speech coding algorithms: foundation and evolution of standardized coders", ISBN 0-471-37312-5, 2003
非特許文献2において使用されている符号化方式の場合、2つのチャネル間の相関が高いときには、ICPのパフォーマンスは十分なものである。しかしながら、相関が低いときには、より高い次数の適応フィルタ係数が必要であり、場合によっては、予測利得を高めるためのコストがかかりすぎる。フィルタ次数を増やさないと、予測誤差のエネルギレベルが基準信号のエネルギレベルと変わらないことがあり、そのような状況ではICPは有用ではない。
音声信号の品質にとっては、周波数帯域の低帯域部分が本質的に重要である。復号した音声の低帯域部分におけるわずかな誤りによって、音声全体の品質が大きく損なわれる。音声符号化におけるICPの予測性能の限界のため、2つのチャネル間の相関が高くないときには、低帯域部分について満足なパフォーマンスを達成することが難しく、別の符号化方式を採用した方が望ましい。
非特許文献1では、時間領域において高帯域部分の信号に対してのみICPを適用している。これは、上記の問題に対する1つの解決策である。しかしながら、非特許文献1では、符号器におけるICPに、入力モノラル信号を使用している。好ましくは、復号されたモノラル信号を使用すべきである。なぜなら、復号部側において、再生成されたステレオ信号はICP合成フィルタによって得られ、このICP合成フィルタは、モノラル復号部によって復号されたモノラル信号を使用するためである。しかしながら、モノラル符号器が、特に広帯域(7kHz以上)オーディオ符号化に幅広く使用されているMDCT変換符号化などの変換符号化タイプの符号器である場合、符号器側において時間領域で復号されたモノラル信号を取得するためには、何らかの追加のアルゴリズム遅延が発生する。
本発明の目的は、チャネル間予測(ICP)を用いてスケーラブルなステレオ音声符号化を実現し、ステレオ音声符号化におけるICPの予測性能を改善することができる符号化装置および復号装置を提供することである。
本発明の符号化装置は、ステレオ信号の第1チャネル信号および第2チャネル信号を合成してモノラル信号を生成し、前記第1チャネル信号と前記第2チャネル信号との差分であるサイド信号を生成するモノラル信号生成手段と、前記サイド信号に対する線形予測残差信号であるサイド残差信号を取得するサイド残差信号取得手段と、前記モノラル信号に対する線形予測残差信号であるモノラル残差信号を取得するモノラル残差信号取得手段と、前記サイド残差信号を、所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第1スペクトル分割手段と、前記モノラル残差信号を、前記所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第2スペクトル分割手段と、前記サイド残差信号の低帯域部分の周波数係数、前記モノラル残差信号の中間帯域部分の周波数係数、及び前記モノラル残差信号の低帯域部分の周波数係数を基準信号候補とし、前記サイド残差信号の中間帯域部分の周波数係数をターゲット信号とし、前記各基準信号候補と前記ターゲット信号との関係をチェックすることによって、前記基準信号候補の中から最適なものを基準信号として選択する選択手段と、前記基準信号と前記ターゲット信号とのチャネル間予測分析を行ってチャネル間予測係数を得るチャネル間予測分析手段と、を具備する構成を採る。
本発明の復号装置は、ステレオ信号の第1チャネル信号と第2チャネル信号との差分であるサイド信号に対する線形予測残差信号であるサイド残差信号の所定周波数より低い帯域である低帯域部分の周波数係数、前記第1チャネル信号および前記第2チャネル信号を合成して生成されるモノラル信号に対する線形予測残差信号であるモノラル残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数、及び前記モノラル残差信号の前記所定周波数より低い帯域である低帯域部分の周波数係数、の中から選択された基準信号を示す基準信号IDを復号するとともに、前記サイド残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数と前記基準信号とのチャネル間予測分析が行われることによって得られたチャネル間予測係数を復号するICP(Inter-Channel Prediction)パラメータ復号手段と、前記チャネル間予測係数をフィルタ係数として前記基準信号に対してフィルタ処理を行うことにより、前記サイド残差信号の前記中間帯域部分の周波数係数を算出するICP合成手段と、前記サイド残差信号の前記低帯域部分の周波数係数と前前記サイド残差信号の前記中間帯域部分の周波数係数を加算して前記サイド残差信号の全帯域の周波数係数を得る加算手段と、前記サイド残差信号の全帯域の周波数係数から時間領域のサイド残差信号に変換する変換手段と、前記時間領域のサイド残差信号に対して線形予測合成フィルタリングを行い、前記サイド信号を得る線形予測合成手段と、前記モノラル信号と前記サイド信号とを用いて前記第1チャネル信号および前記第2チャネル信号を得るステレオ信号計算手段と、を具備する構成を採る。
本発明の符号化方法は、ステレオ信号の第1チャネル信号および第2チャネル信号を合成してモノラル信号を生成し、前記第1チャネル信号と前記第2チャネル信号との差分であるサイド信号を生成するモノラル信号生成工程と、前記サイド信号に対する線形予測残差信号であるサイド残差信号を取得するサイド残差信号取得工程と、前記モノラル信号に対する線形予測残差信号であるモノラル残差信号を取得するモノラル残差信号取得工程と、前記サイド残差信号を、所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第1スペクトル分割工程と、前記モノラル残差信号を、前記所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第2スペクトル分割工程と、前記サイド残差信号の低帯域部分の周波数係数、前記モノラル残差信号の中間帯域部分の周波数係数、及び前記モノラル残差信号の低帯域部分の周波数係数を基準信号候補とし、前記サイド残差信号の中間帯域部分の周波数係数をターゲット信号とし、前記各基準信号候補と前記ターゲット信号との関係をチェックすることによって、前記基準信号候補の中から最適なものを基準信号として選択する選択工程と、前記基準信号と前記ターゲット信号とのチャネル間予測分析を行ってチャネル間予測係数を得るチャネル間予測分析工程と、を具備する方法を採る。
本発明の復号方法は、ステレオ信号の第1チャネル信号と第2チャネル信号との差分であるサイド信号に対する線形予測残差信号であるサイド残差信号の所定周波数より低い帯域である低帯域部分の周波数係数、前記第1チャネル信号および前記第2チャネル信号を合成して生成されるモノラル信号に対する線形予測残差信号であるモノラル残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数、及び前記モノラル残差信号の前記所定周波数より低い帯域である低帯域部分の周波数係数、の中から選択された基準信号を示す基準信号IDを復号するとともに、前記サイド残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数と前記基準信号とのチャネル間予測分析が行われることによって得られたチャネル間予測係数を復号するICPパラメータ復号工程と、前記チャネル間予測係数をフィルタ係数として前記基準信号に対してフィルタ処理を行うことにより、前記サイド残差信号の前記中間帯域部分の周波数係数を算出するICP合成工程と、前記サイド残差信号の前記低帯域部分の周波数係数と前前記サイド残差信号の前記中間帯域部分の周波数係数を加算して前記サイド残差信号の全帯域の周波数係数を得る加算工程と、前記サイド残差信号の全帯域の周波数係数から時間領域のサイド残差信号に変換する変換工程と、前記時間領域のサイド残差信号に対して線形予測合成フィルタリングを行い、前記サイド信号を得る線形予測合成工程と、前記モノラル信号と前記サイド信号とを用いて前記第1チャネル信号および前記第2チャネル信号を得るステレオ信号計算工程と、を具備する方法を採る。
本発明によれば、複数の信号の中から最良の予測結果をもたらすものを基準信号として選択し、基準信号を用いてサイド信号の残差信号を予測することにより、ステレオ音声符号化におけるICPの予測性能を改善することができる。
本発明の実施の形態1に係る符号化装置の構成を示すブロック図 本発明の実施の形態1に係るICP分析部の内部の主要な構成を示すブロック図 ICP分析およびICP合成において使用する適応FIRフィルタの構造の一例を示す図 本発明の実施の形態1に係る符号化装置の選択部における基準信号の選択を説明するための図 本発明の実施の形態1に係る復号装置の構成を示すブロック図 本発明の実施の形態1に係る符号化装置の第一例における選択部の内部構成を示すブロック図 本発明の実施の形態1に係る符号化装置の第二例における選択部の内部構成を示すブロック図 本発明の実施の形態2に係る符号化装置の構成を示すブロック図 本発明の実施の形態2に係る符号化装置の選択部の内部構成を示すブロック図 本発明の実施の形態3の修正ICPにおける予測方法を説明する図 本発明の実施の形態4の修正ICPにおける予測方法を説明する図
(実施の形態1)
以下、本発明の実施の形態1について、図面を用いて説明する。なお、以下の説明において、左チャネル信号、右チャネル信号、モノラル信号、サイド信号をそれぞれ、L、R、M、S、およびそれらの再生成信号をそれぞれ、L’、R’、M’、S’として表す。また、以下の説明では、各フレームの長さをN、モノラル、サイドの各信号に対するMDCT領域信号(周波数係数、またはMDCT係数と称する)を、それぞれ、m(f)、s(f)として表す。
図1は、本実施の形態に係る符号化装置の構成を示すブロック図である。図1に示す符号化装置100には、例えばPCM(Pulse Code Modulation)形式における左チャネル信号と右チャネル信号とからなるステレオ信号がフレーム毎に入力される。
モノラル信号合成部101は、左チャネル信号L、右チャネル信号Rを以下の式(1)により合成し、モノラル信号Mを生成する。また、モノラル信号合成部101は、左チャネル信号Lおよび右チャネル信号Rを用いて以下の式(2)によりサイド信号Sを生成する。そして、モノラル信号合成部101は、サイド信号SをLP分析・量子化部102及びLP逆フィルタ103に出力し、モノラル信号Mをモノラル符号化部104に出力する。
Figure 2009057327
Figure 2009057327
この式(1)、(2)において、nは、フレームにおける時間インデックス(time index)である。なお、モノラル信号を生成するための合成方法は、式(1)に限定されない。例えば、適応的に重み付けしてミックスする方法等、他の方法を使用して、モノラル信号を生成することもできる。
LP分析・量子化部102は、サイド信号Sに対してLP分析(線形予測分析)によるLPパラメータの算出および算出LPパラメータの量子化を行い、得られたLPパラメータの符号化データを多重部118に出力すると共に、量子化されたLP係数AをLP逆フィルタ103に出力する。
LP逆フィルタ103は、LP係数Aを用いて、サイド信号Sに対してLP逆フィルタリングを行い、得られたサイド信号の残差信号(以下、「サイド残差信号」という)Sresを窓掛け部105に出力する。
モノラル符号化部104は、モノラル信号Mを符号化し、得られた符号化データを多重部118に出力する。また、モノラル符号化部104は、モノラル残差信号Mresを窓掛け部106に出力する。なお、残差信号は励振信号ともいう。この残差信号は、ほとんどのモノラル音声符号化装置(例:CELP(Code Excited Linear Prediction)ベースの符号化装置)において、あるいは、LP残差信号または局部復号される残差信号を生成するプロセスが含まれるタイプの符号化装置において取り出すことが可能である。
窓掛け部105は、サイド残差信号Sresに対して窓掛け処理(windowing)を行い、MDCT変換部107に出力する。窓掛け部106は、モノラル残差信号Mresに対して窓掛け処理を行い、MDCT変換部108に出力する。
MDCT変換部107は、窓掛け処理後のサイド残差信号Sresに対してMDCT変換を実行し、得られたサイド残差信号の周波数係数s(f)をスペクトル分割部109に出力する。MDCT変換部108は、窓掛け処理後のモノラル残差信号Mresに対してMDCT変換を実行し、得られたモノラル残差信号の周波数係数m(f)をスペクトル分割部110に出力する。
スペクトル分割部109は、所定の周波数を境としてサイド残差信号の周波数係数s(f)の帯域を低帯域部分、中間帯域部分及び高帯域部分に分割し、サイド残差信号の低帯域部分の周波数係数s(f)を低帯域符号化部111に出力する。また、スペクトル分割部109は、サイド残差信号の中間帯域部分を更に小さなサブ帯域iに分割し、サイド残差信号の各サブ帯域部分の周波数係数sM、i(f)をICP分析部113、114、115に出力する。なお、iはサブ帯域のインデックスであり、0以上の整数である。
スペクトル分割部110は、所定の周波数を境としてモノラル残差信号の周波数係数m(f)の帯域を低帯域部分、中間帯域部分及び高帯域部分に分割し、モノラル残差信号の低帯域部分の周波数係数m(f)をICP分析部115に出力する。また、スペクトル分割部110は、モノラル残差信号の中間帯域部分を更に小さなサブ帯域iに分割し、モノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)をICP分析部114に出力する。
低帯域符号化部111は、サイド残差信号の低帯域部分の周波数係数s(f)を符号化し、得られた符号化データを低帯域復号部112及び多重部118に出力する。
低帯域復号部112は、サイド残差信号の低帯域部分の周波数係数の符号化データを復号し、得られたサイド残差信号の低帯域部分の周波数係数s'(f)をICP分析部113及び選択部116に出力する。
ICP分析部113は、適応フィルタからなり、サイド残差信号の低帯域部分の周波数係数s'(f)を基準信号候補として、これとサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)とのICP分析を行い、第1ICP係数を生成し、これを選択部116に出力する。
ICP分析部114は、適応フィルタからなり、モノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)を基準信号候補として、これとサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)とのICP分析を行い、第2ICP係数を生成し、これを選択部116に出力する。
ICP分析部115は、適応フィルタからなり、モノラル残差信号の低帯域部分の周波数係数m(f)を基準信号候補として、これとサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)とのICP分析を行い、第3ICP係数を生成し、これを選択部116に出力する。
選択部116は、各基準信号候補とサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)との関係をチェックすることによって、基準信号候補の中から最適なものを基準信号として選択し、選択した基準信号を示す基準信号ID(Identification)及び基準信号に対応するICP係数をICPパラメータ量子化部117に出力する。なお、選択部116の内部構成の詳細な説明については後述する。
ICPパラメータ量子化部117は、選択部116から出力されたICP係数を量子化し、基準信号IDを符号化する。量子化されたICP係数に対する符号化データ及び基準信号IDに対する符号化データは多重部118に出力される。
多重部118は、LP分析・量子化部102から出力されたLPパラメータの符号化データ、モノラル符号化部104から出力されたモノラル信号の符号化データ、低帯域符号化部111から出力されたサイド残差信号の低帯域部分の周波数係数の符号化データ、およびICPパラメータ量子化部117から出力された量子化ICP係数符号化データと基準信号ID符号化データを多重し、得られたビットストリームを出力する。
図2は、ICP分析部113、114、115を構成する適応フィルタの構成および動作を説明するための図である。この図において、H(z)は、H(z)=b+b(z−1)+b(z−2)+…+b(z−k)であり、適応フィルタ、例えばFIR(Finite Impulse Response)フィルタのモデル(伝達関数)を示す。ここで、kは適応フィルタ係数の次数を示し、b=[b,b,…,b]は適応フィルタ係数を示す。x(n)は適応フィルタの入力信号(基準信号)、y’(n)は適応フィルタの出力信号(予測信号)、y(n)は適応フィルタのターゲット信号を示す。例えば、ICP分析部113においては、x(n)はs'(f)に相当し、y(n)はsM、i(f)に相当する。
適応フィルタは、下記の式(3)に従って、予測信号とターゲット信号との平均二乗誤差(MSE)が最小となるような、適応フィルタパラメータb=[b,b,…,b]を求めて出力する。なお、式(3)において、E{ }はアンサンブル平均演算(ensemble average operation)、kはフィルタ次数、e(n)は予測誤差を示す。
Figure 2009057327
なお、図2におけるH(z)には、多数の別の構造が存在する。図3は、そのうちの1つを示している。図3に示したフィルタ構造は、従来のFIRフィルタである。
図4は、選択部116における基準信号の選択を説明するための図である。図4では、サブ帯域の数が2(i=0,1)の場合を示す。なお、図4の横軸は周波数、縦軸は周波数係数(MDCT係数)の値であり、上側がサイド残差信号の周波数帯域、下側がモノラル残差信号の周波数帯域である。
この場合、選択部116は、サイド残差信号の第0サブ帯域部分の周波数係数sM、0(f)を予測する場合の基準信号を、第0サブ帯域部分の周波数係数mM、0(f)、モノラル残差信号の低帯域部分の周波数係数m(f)、サイド残差信号の低帯域部分の周波数係数s'(f)の中から選択する。同様に、選択部116は、サイド残差信号の第1サブ帯域部分の周波数係数sM、1(f)を予測する場合の基準信号を、第1サブ帯域部分の周波数係数mM、1(f)、モノラル残差信号の低帯域部分の周波数係数m(f)、サイド残差信号の低帯域部分の周波数係数s'(f)の中から選択する。
図5は、本実施の形態に係る復号装置の構成を示すブロック図である。図1に示した符号化装置100から送信されたビットストリームは、図5に示す復号装置500に受信される。
分離部501は、復号装置500に受信されたビットストリームを分離し、LPパラメータの符号化データをLPパラメータ復号部512に出力し、ICP係数符号化データと基準信号ID符号化データをICPパラメータ復号部503に出力し、モノラル信号の符号化データをモノラル復号部502に出力し、サイド残差信号の低帯域部分の周波数係数の符号化データを低帯域復号部507に出力する。
モノラル復号部502は、モノラル信号の符号化データを復号してモノラル信号M’およびモノラル残差信号M'resを得る。モノラル復号部502は、得られたモノラル残差信号M'resを窓掛け部504に出力し、モノラル信号M’をステレオ信号計算部514に出力する。
ICPパラメータ復号部503は、ICP係数符号化データと基準信号ID符号化データを復号し、得られたICP係数と基準信号IDをICP合成部508に出力する。
窓掛け部504は、モノラル残差信号M'resに対して窓掛け処理を行い、MDCT変換部505に出力する。MDCT変換部505は、窓掛け処理後のモノラル残差信号M'resに対してMDCT変換を実行し、得られたモノラル残差信号の周波数係数m'(f)をスペクトル分割部506に出力する。
スペクトル分割部506は、所定の周波数を境としてモノラル残差信号の周波数係数m’(f)の帯域を低帯域部分、中間帯域部分及び高帯域部分に分割し、モノラル残差信号の低帯域部分の周波数係数m’(f)及び中間帯域部分の周波数係数m’(f)をICP合成部508に出力する。
低帯域復号部507は、サイド残差信号の低帯域部分の周波数係数の符号化データを復号し、得られたサイド残差信号の低帯域部分の周波数係数s'(f)をICP合成部508及び加算部509に出力する。
ICP合成部508は、基準信号IDに基づいて、モノラル残差信号の低帯域部分の周波数係数m’(f)、中間帯域部分の周波数係数m’(f)あるいはサイド残差信号の低帯域部分の周波数係数s'(f)の中から一つを基準信号として選択する。そして、ICP合成部508は、以下の式(4)によって表される、量子化ICP係数をフィルタ係数とするフィルタ処理により、サイド残差信号の各サブ帯域部分の周波数係数s’M、i(f)を算出し、加算部509に出力する。なお、式(4)において、h(i)はICP係数、X(f)は基準信号、PはICPの次数である。
Figure 2009057327
加算部509は、サイド残差信号の低帯域部分の周波数係数s'(f)とサイド残差信号の各サブ帯域部分の周波数係数s'M、i(f)とを結合し、得られたサイド残差信号の周波数係数s'(f)をIMDCT変換部510に出力する。
IMDCT変換部510は、サイド残差信号の周波数係数s'(f)に対してIMDCT変換を実行し、窓掛け部511に出力する。窓掛け部511は、IMDCT変換部510の出力信号に対して窓掛け処理を行い、得られたサイド残差信号S'resをLP合成部513に出力する。
LPパラメータ復号部512は、LPパラメータの符号化データを復号し、得られたLP係数AをLP合成部513に出力する。
LP合成部513は、サイド残差信号S'resに対して、LP係数Aを用いてLP合成フィルタリングを行い、サイド信号S'を得る。
ステレオ信号計算部514は、モノラル信号M’とサイド信号S'を用いて、以下の式(5)、(6)により、左チャネル信号L’及び右チャネル信号R’を得る。
Figure 2009057327
Figure 2009057327
このように、図5の復号装置500は、受信した図1の符号化装置100の信号に対して復号処理を行うことにより、左チャネル信号L’及び右チャネル信号R’を得ることができる。なお、ビットストリームが、LPパラメータの符号化データ、ICP係数符号化データ、基準信号ID符号化データ、モノラル信号の符号化データ、および、サイド残差信号の低帯域部分の周波数係数の符号化データを用いて形成されていれば、復号装置500は復号処理が可能である。すなわち、復号装置500が受信する信号は、このようなビットストリームを形成可能な符号化装置からの信号であれば、必ずしも図1の構成の符号化装置100からの信号でなくても良い。
次に、選択部116の内部構成について詳細に説明する。本実施の形態では、相互相関に基づいて基準信号を選択する場合(第一例)と、予測利得に基づいて基準信号を選択する場合(第二例)とを示す。
図6は、第一例における選択部116の内部構成を示すブロック図である。選択部116には、サイド残差信号の低帯域部分の周波数係数s'(f)、モノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)、モノラル残差信号の低帯域部分の周波数係数m(f)、サイド残差信号の各サブ帯域部分の周波数係数sM、i(f)、第1ICP係数、第2ICP係数及び第3ICP係数が入力される。
相関検査部601、602、603は、それぞれ以下の式(7)により相互相関を計算し、計算結果である相関値を相互相関比較部604に出力する。ここで、式(7)において、X(j)は基準信号候補のいずれかを示し、相関検査部601ではモノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)であり、相関検査部602ではモノラル残差信号の低帯域部分の周波数係数m(f)であり、相関検査部603ではサイド残差信号の低帯域部分の周波数係数s'(f)である。
Figure 2009057327
相互相関比較部604は、相関値が最も高い基準信号候補を基準信号として選択し、選択した基準信号を示す基準信号IDをICP係数選択部605に出力する。
ICP係数選択部605は、基準信号IDに対応するICP係数を選択し、基準信号ID及びICP係数をICPパラメータ量子化部117に出力する。
図7は、第二例における選択部116の内部構成を示すブロック図である。選択部116には、サイド残差信号の低帯域部分の周波数係数s'(f)、モノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)、モノラル残差信号の低帯域部分の周波数係数m(f)、サイド残差信号の各サブ帯域部分の周波数係数sM、i(f)、第1ICP係数、第2ICP係数及び第3ICP係数が入力される。
ICP合成部701、702、703は、上記式(4)により各基準信号に対応するサイド残差信号の各サブ帯域部分の周波数係数s’M、i(f)を算出し、それぞれ利得確認部704、705、706に出力する。
利得確認部704、705、706は、以下の式(8)により予測利得を計算し、予測利得比較部707に出力する。ここで、式(8)において、e(n)=sM、i(f)−s’M、i(f)である。式(8)における予測利得Gainが高いほど予測性能は良いことになる。
Figure 2009057327
予測利得比較部707は、予測利得を比較し、最も高い予測利得の基準信号候補を基準信号として選択し、選択した基準信号を示す基準信号IDをICP係数選択部708に出力する。
ICP係数選択部708は、基準信号IDに対応するICP係数を選択し、基準信号ID及びICP係数をICPパラメータ量子化部117に出力する。
以上のように、本実施の形態によれば、複数の信号の中から最良の予測結果をもたらすものを基準信号として選択し、基準信号を用いてサイド信号の残差信号を予測することにより、ステレオ音声符号化におけるICPの予測性能を改善することができる。
なお、上記第二例において、量子化したICP係数をICP合成に使用しても良い。この場合、選択部116には、量子化前のICP係数の代わりに、ICP係数量子化器により量子化した量子化ICP係数が入力されるようにする。ICP合成部701、702、703は、量子化ICP係数を用いてサイド信号を復号する。予測利得は、量子化ICP係数による予測結果に基づいて比較される。このバリエーションでは、復号装置で用いられる量子化ICP係数を用いた予測により、最適な基準信号を選択できる。
(実施の形態2)
本発明の実施の形態2は、相互相関比較後にICP係数を計算する場合について説明する。図8は、本実施の形態に係る符号化装置の構成を示すブロック図である。なお、図8において、図1と共通する構成部分には、図1と同一符号を付してその説明を省略する。図8に示す符号化装置800は、図1に示した符号化装置100と比較して、ICP分析部113、114、115及び選択部116を削除し、選択部801及びICP分析部802を追加した構成を採る。
選択部801は、各基準信号候補とサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)との関係をチェックすることによって、基準信号候補の中から最適なものを基準信号として選択し、選択した基準信号を示す基準信号IDをICP分析部802に出力する。
ICP分析部802は、適応フィルタからなり、基準信号とサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)とを用いてICP分析を行い、ICP係数を生成し、これをICPパラメータ量子化部117に出力する。
図9は、選択部801の内部構成を示すブロック図である。図9に示す選択部801の内部構成は、図6に示した選択部116の内部構成と比較してICP係数選択部605を削除したものとなる。
相互相関比較部604は、相関値が最も高い基準信号候補を基準信号として選択し、選択した基準信号を示す基準信号IDをICP分析部802に出力する。
このように、本実施の形態によれば、ICP係数を相互相関比較後に計算することができるので、実施の形態1と同様の効果を得ることができるともに、実施の形態1よりも計算量を削減することができる。
(実施の形態3)
実施の形態3は、従来のICPに対する修正版である修正ICPについて説明する。修正ICPは、ターゲット信号と異なる長さの基準信号を用いて予測を行う方法についての課題を解決するものである。
図10は、本実施の形態の修正ICPにおける予測方法を説明する図である。なお、本実施の形態における修正ICPの方法を「コピー法」と呼ぶ。図10において、基準信号X(f)(ベクトル)の長さをNで示し、ターゲット信号の長さをNで示す。X(j)は基準信号候補のいずれかを示す。
修正ICPでは、以下の2つのケースを考慮する。
1.N=Nの場合
この場合は、符号化装置が、従来ICPを用いてICP係数を計算する。このケースはあらゆる種類の基準信号に起こりうる。
2.N<NまたはN>Nの場合、
この場合は、符号化装置が、元の基準信号X(f)に基づいてNの長さの新しい基準信号X ̄(f)を生成し、新しい基準信号X ̄(f)を用いてターゲット信号を予測し、ICP係数を計算する。そして、復号装置が、符号化装置と同じ方法を用いてX ̄(f)を生成する。このケースは低域サイド信号または低域モノラル信号を基準信号として選択した場合に生じる。これらの信号の長さはターゲット信号より短い場合もあれば長い場合もある。
本実施の形態のコピー法は、上記ケース2の課題を解決する。コピー法には次の2段階がある。
ステップ1:N<Nの場合には、図10に示すように、ベクトルX(f)の先頭部の(N−N)点をベクトルX(f)(長さN)の最後にコピーして新しいベクトルX ̄(f)を作成する。また、N>Nの場合には、ベクトルX(f)の最初のN点をコピーして新しいベクトルX ̄(f)を作成する。X(f)は長さがNの新しい基準ベクトルとなる。
ステップ2:ICPアルゴリズムを用いてベクトルX ̄(f)からターゲット信号sM、i(f)を予測する。
このように、本実施の形態による修正ICPによれば、ターゲット信号のサブ帯域長を基準信号の長さによらず可変とすることができ、ターゲット信号と異なる長さの基準信号を用いて予測を行うことができる。すなわち、すべてのサブ帯域を基準信号と同じ固定長に分割する必要はない。周波数帯域の低帯域部分が音声品質に与える影響は大きいため、低域のサブ帯域はより短い長さに分割し、逆に重要性が相対的に低くなる高い周波数のサブ帯域ほどより大きな長さに分割して、その分割帯域を単位に予測を行うことで、スケーラブルステレオ音声符号化における符号化効率の向上および音質の向上を図ることができる。
また、基準信号として低帯域サイド信号を選択する場合、従来のICPでは予測対象のサブ帯域と同じ長さの基準信号を符号化し復号器に送信する必要がある。一方、本実施の形態による修正ICPでは、対象のサブ帯域より短い帯域幅の基準信号を用いて予測を行うことができ、長い基準信号を符号化する代わりに、短い基準信号を符号化するだけで済む。このため、本実施の形態による修正ICPは、低ビットレートで基準信号を復号器に伝送することができる。
(実施の形態4)
実施の形態4では、実施の形態3のケース2の場合(N<NまたはN>N)における代替方法について説明する。本実施の形態の修正ICPにおける予測方法は、短い基準ベクトル内の点の値を用いて、新しい基準ベクトルに対して補間により拡張するか、基準ベクトルをより短いベクトルに短縮するものである。なお、本実施の形態における修正ICPにおける方法を「拡張・縮小法」と呼ぶ。
本実施の形態の拡張・縮小法には次の2つの段階がある。
ステップ1:N<Nの場合には、図11に示すように、以下の式(9)によりベクトルX(f)(長さN)を長さNのベクトルX ̄(f)に拡張する。
Figure 2009057327
このとき、最近補間法、線形補間法、立体スプライン補間法、ラグランジュ補間法などの様々な補間法のいずれかをX ̄(f)に適用してベクトルX ̄(f)の欠落した点の値を求める。また、N>Nの場合には、以下の式(10)によりベクトルX(f)(長さN)を長さNのベクトルX ̄(f)に縮小する。
Figure 2009057327
ステップ2:ICPアルゴリズムを用いてベクトルX ̄(f)からターゲット信号sM、i(f)を予測する。
(実施の形態5)
実施の形態5では、実施の形態3、4の代替方法(N<NまたはN>Nの場合に対するもの)について説明する。本実施の形態の修正ICPにおける予測方法は、長期予測を用いて基準信号とターゲット信号内の周期を求めるものである。新しい基準信号は、得られた周期に基づいて元の基準信号のいくつかの周期を複製することにより生成される。
本実施の形態の方法には次の2つの段階がある。
ステップ1:基準信号X(f)とターゲット信号sM、i(f)を連結して連続したベクトルX(f)を得る。ベクトルX(f)内には周期が存在するものとする。次の式(11)の誤差errを最小化することにより周期Tを求める。なお、周期Tは、自己相関法、振幅差関数(magnitude difference function、非特許文献5参照)などの他の周期算出アルゴリズムを使用することによっても求められる。
Figure 2009057327
T>min[N,N]の場合、T=min[N,N]とする。Tに基づいてX(f)から長さがTの信号を1回または数回コピーして長さNの新しい基準信号X ̄(f)を得る。
ステップ2:ICPアルゴリズムを用いてベクトルX ̄(f)からターゲット信号sM、i(f)を予測する。
なお、本実施の形態の方法を用いる場合には、周期Tの情報を復号装置に伝送する必要がある。
なお、実施の形態3、4、5の説明においては、基準信号としてモノラル残差信号の低帯域部分を選択した場合、上記実施の形態のいずれかの方法を用いてモノラル残差信号の長さを拡張した基準信号を生成した後に予測を行うこととしたが、本発明は、その代わりに、モノラル残差信号の中間帯域を含めることによって所望の長さの基準信号を生成するようにしてもよい。この場合は実施の形態3に記載のケース1(N=Nの場合)に相当する。
また、実施の形態3、4、5において、サイド残差信号の中間帯域をサブ帯域に分割して予測を行う際に、低域側のサブ帯域から高域側のサブ帯域へと順次予測を実行するようにすることで、基準信号としてサイド残差信号の低帯域部分を選択した場合、先行して予測済みの低域側のサブ帯域の信号も用いて所望の長さの基準信号を生成することもできる。
以上、本発明の実施の形態について説明した。
本発明の手法は、ICPにおいて、複数の信号の中から最良の予測結果をもたらすものを基準信号として選択し、基準信号を用いてサイド信号の残差信号を予測することから、「適応的チャネル予測(ACP:Adaptive Channel Prediction)」と称し得る。この本発明のACPを用いることにより、スケーラブルなステレオ音声符号化におけるICPの予測性能を向上することができる。
なお、モノラル信号符号器/復号器がMDCT変換などの変換符号器の場合、MDCT領域の復号されたモノラル信号(または復号されたモノラルLP残差信号)は、符号器側ではモノラル符号器から、また復号器側ではモノラル復号器から直接得ることができる。
また、上記の各実施の形態に示した符号化方式はモノラル信号を用いてサイド信号を予測するもの(M−Sタイプと呼ぶ)である。モノラル信号を用いて左あるいは右信号を予測することもできる。この場合の動作は、上記各実施の形態において、サイドチャネルを左または右チャネルで置き換えて(LまたはRをSとみなす)、左(または右)チャネル信号を符号化する以外は、M−S方式の処理とほぼ同じである。この場合、符号化側で符号化したチャネル(左または右チャネル)の他方のチャネル(右または左チャネル)の信号は、復号器において、復号したチャネル信号(左または右チャネル信号)とモノラル信号を用いて以下の次の式(12)、(13)のように計算することができる。なお、両チャネル(LおよびR)共に、上記各実施の形態におけるサイド信号と同様に符号化するようにしても良い。
Figure 2009057327
Figure 2009057327
また、本発明は、上記各実施の形態における基準信号候補として、それらの加重和した信号(3種類の信号を所定の重み係数で乗じた後に加算した信号)を用いてもよい。また、本発明は、3つの基準信号候補を全て用いる必要はなく、例えば、中間帯域のモノラル信号と低帯域のサイド信号の2種類のみを候補とする、などとしてもよい。これによって基準信号IDを送信するビット数を減らすことができる。
また、上記各実施の形態では、サイド信号の予測はフレーム単位で行っている。このことは中間帯域の信号は他の周波数帯域上の同じフレームでの信号から予測されることを意味する。その代わりに、またはそれに加えて、フレーム間の予測も使用できる。例えば、先行する過去のフレームを基準候補として用いて現在のフレーム信号を予測することができる。
また、上記各実施の形態で予測の対象としたターゲット信号は低域帯域と高域帯域を除いた中間帯域のサイド信号であるとして説明したが、これに限らず、ターゲット信号として、中間帯域および高域帯域を含む、低域帯域を除く全ての信号帯域を含むようにしても良い。更には、低域帯域も含む全ての信号帯域を対象としても良い。これらの場合でも、サイド信号の任意の帯域は、小さなサブ帯域に分割して予測を行うことができる。これによって符号器および復号器の構造が変化することはない。
また、本発明は、時間領域の信号にも適用することができる。例えば、時間領域の(例えばQMF(Quadrature Mirror Filter)で得られる)いくつかのサブ帯域信号から基準信号を選択して時間領域の中間(あるは高)帯域信号を予測するようにしても良い。
なお、以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。本発明は、符号化装置、復号装置を有するシステムであればどのような場合にも適用することができる。
また、本発明に係る符号化装置および復号装置は、例えば音声符号化装置および音声復号装置等として、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置/復号装置と同様の機能を実現することができる。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2007年10月31日出願の特願2007−284622の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る符号化装置および復号装置は、携帯電話、IP電話、テレビ会議等に用いるに好適である。
本発明は、チャネル間予測(ICP)を用いてスケーラブルなステレオ音声符号化を実現する符号化装置および復号装置に関する。
従来、音声符号化(音声コーデック)は、電話帯域(200Hz〜3.4kHz)の狭帯域音声を使用する通信用途に用いられる。モノラル音声の狭帯域音声コーデックは、移動電話、遠隔会議機器、および、パケットネットワーク(たとえば、インターネット)上での音声通信などの通信用途に広く使用されている。
より臨場感のある音声通信システムに向けたステップの一つは、モノラル音声表現からステレオ音声表現への移行である。広帯域ステレオ音声通信は、より自然な音響環境を提供する。スケーラブルステレオ音声符号化は、高音質で有用性の高い音声通信を実現するためのコア技術である。
ステレオ音声信号を符号化する一般的な方法の一つは、モノラル音声に基づく信号予測手法を使用することによる。すなわち、基本チャネル信号を公知のモノラル音声コーデックを使用して送信し、この基本チャネル信号から、追加の情報およびパラメータを使用して左チャネルまたは右チャネルを予測する。多くのアプリケーションでは、基本チャネル信号として、左チャネル信号と右チャネル信号がミックスされたモノラル信号が選択される。
ステレオ信号を符号化する方法としてISC(Intensity Stereo Coding:強度ステレオ符号化)、BCC(Binaural Cue Coding:バイノーラル・キュー符号化)、およびICP(Inter-Channel Prediction:チャネル間予測)などが知られている。これらのパラメトリックなステレオ符号化方式は、それぞれ異なる長所および短所を持ち、それぞれ異なる音源(source materials)の符号化に適している。
非特許文献1には、これらの符号化方法を用いて、モノラル信号に基づきステレオ信号を予測する技術が開示されている。具体的には、ステレオ信号を構成するチャネル信号、例えば、左チャネル信号と右チャネル信号とを合成してモノラル信号を得、得られるモノラル信号を公知の音声コーデックを使用して符号化/復号し、さらに予測パラメータを用いてモノラル信号から左チャネルと右チャネルの差信号(サイド信号(side signal))を予測する。このような符号化方法において、符号化側は、モノラル信号とサイド信号との関係を時間依存性の適応フィルタを使用してモデル化し、フレーム毎に算出されたフィルタ係数を復号側に送信する。復号側では、モノラルコーデックによって送信された高品質なモノラル信号をフィルタリングすることによって、差信号を再生成し、再生成した差信号とモノラル信号から、左チャネル信号および右チャネル信号を算出する。
また、非特許文献2には、チャネル間相関キャンセラー(Cross-Channel Correlation Canceller)と呼ばれる符号化方法が開示されており、ICP方式の符号化方法においてチャネル間相関キャンセラーの技術を適用する場合、一方のチャネルから他方のチャネルを予測することができる。
また、近年、オーディオ圧縮技術が急速に発展し、その中で、変形離散コサイン変換(MDCT)方式が、高品質のオーディオ符号化における主要な手法となっている(非特許文献3、非特許文献4参照)。
適切な窓ウィンドウ(例:正弦窓)が使用される場合、MDCTは、聴覚上大きな問題が生じることなくオーディオ圧縮に適用されてきた。最近では、MDCTは、マルチモード変換予測符号化(multimode transform predictive coding)のパラダイムにおいて重要な役割を果たしている。
マルチモード変換予測符号化とは、音声符号化の原理とオーディオ符号化の原理とをひとつの符号化体系としてまとめるものである(非特許文献4)。ただし、非特許文献4における、MDCTに基づく符号化構造およびその適用は、1つのチャネルの信号のみを符号化するように設計され、異なる周波数領域におけるMDCT係数を、異なる量子化方式を使用して量子化している。
Extended AMR Wideband Speech Codec (AMR-WB+): Transcoding functions, 3GPP TS 26.290. S. Minami and O. Okada, "Stereophonic ADPCM voice coding method," in Proc. ICASSP’90, Apr. 1990. Ye Wang and Miikka Vilermo, "The modified discrete cosine transform: its implications for audio coding and error concealment," in AES 22nd International Conference on Virtual, Synthetic and Entertainment, 2002. Sean A. Ramprashad, "The multimode transform predictive coding paradigm," IEEE Tran. Speech and Audio Processing, vol. 11, pp. 117 - 129, Mar. 2003. Wai C. Chu, "Speech coding algorithms: foundation and evolution of standardized coders", ISBN 0-471-37312-5, 2003
非特許文献2において使用されている符号化方式の場合、2つのチャネル間の相関が高いときには、ICPのパフォーマンスは十分なものである。しかしながら、相関が低いときには、より高い次数の適応フィルタ係数が必要であり、場合によっては、予測利得を高めるためのコストがかかりすぎる。フィルタ次数を増やさないと、予測誤差のエネルギレベルが基準信号のエネルギレベルと変わらないことがあり、そのような状況ではICPは有用ではない。
音声信号の品質にとっては、周波数帯域の低帯域部分が本質的に重要である。復号した音声の低帯域部分におけるわずかな誤りによって、音声全体の品質が大きく損なわれる。音声符号化におけるICPの予測性能の限界のため、2つのチャネル間の相関が高くないときには、低帯域部分について満足なパフォーマンスを達成することが難しく、別の符号化方式を採用した方が望ましい。
非特許文献1では、時間領域において高帯域部分の信号に対してのみICPを適用している。これは、上記の問題に対する1つの解決策である。しかしながら、非特許文献1では、符号器におけるICPに、入力モノラル信号を使用している。好ましくは、復号されたモノラル信号を使用すべきである。なぜなら、復号部側において、再生成されたステレオ信号はICP合成フィルタによって得られ、このICP合成フィルタは、モノラル復号部によって復号されたモノラル信号を使用するためである。しかしながら、モノラル符号器が、特に広帯域(7kHz以上)オーディオ符号化に幅広く使用されているMDCT変換符号化などの変換符号化タイプの符号器である場合、符号器側において時間領域で復号されたモノラル信号を取得するためには、何らかの追加のアルゴリズム遅延が発生する。
本発明の目的は、チャネル間予測(ICP)を用いてスケーラブルなステレオ音声符号化を実現し、ステレオ音声符号化におけるICPの予測性能を改善することができる符号化装置および復号装置を提供することである。
本発明の符号化装置は、ステレオ信号の第1チャネル信号および第2チャネル信号を合成してモノラル信号を生成し、前記第1チャネル信号と前記第2チャネル信号との差分であるサイド信号を生成するモノラル信号生成手段と、前記サイド信号に対する線形予測残差信号であるサイド残差信号を取得するサイド残差信号取得手段と、前記モノラル信号に対する線形予測残差信号であるモノラル残差信号を取得するモノラル残差信号取得手段と、前記サイド残差信号を、所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第1スペクトル分割手段と、前記モノラル残差信号を、前記所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第2スペクトル分割手段と、前記サイド残差信号の低帯域部分の周波数係数、前記モノラル残差信号の中間帯域部分の周波数係数、及び前記モノラル残差信号の低帯域部分の周波数係数を基準信号候補とし、前記サイド残差信号の中間帯域部分の周波数係数をターゲット信号とし、前記各基準信号候補と前記ターゲット信号との関係をチェックすることによって、前記基準信号候補の中から最適なものを基準信号として選択する選択手段と、前記基準信号と前記ターゲット信号とのチャネル間予測分析を行ってチャネル間予測係数を得るチャネル間予測分析手段と、を具備する構成を採る。
本発明の復号装置は、ステレオ信号の第1チャネル信号と第2チャネル信号との差分であるサイド信号に対する線形予測残差信号であるサイド残差信号の所定周波数より低い帯域である低帯域部分の周波数係数、前記第1チャネル信号および前記第2チャネル信号を合成して生成されるモノラル信号に対する線形予測残差信号であるモノラル残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数、及び前記モノラル残差信号の前記所定周波数より低い帯域である低帯域部分の周波数係数、の中から選択された基準信号を示す基準信号IDを復号するとともに、前記サイド残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数と前記基準信号とのチャネル間予測分析が行われることによって得られたチャネル間予測係数を復号するICP(Inter-Channel Prediction)パラメータ復号手段と、前記チャネル間予測係数をフィルタ係数として前記基準信号に対してフィルタ処理を行うことにより、前記サイド残差信号の前記中間帯域部分の周波数係数を算出するICP合成手段と、前記サイド残差信号の前記低帯域部分の周波数係数と前前記サイド残差信号の前記中間帯域部分の周波数係数を加算して前記サイド残差信号の全帯域の周波数係数を得る加算手段と、前記サイド残差信号の全帯域の周波数係数から時間領域のサイド残差信号に変換する変換手段と、前記時間領域のサイド残差信号に対して線形予測合成フィルタリングを行い、前記サイド信号を得る線形予測合成手段と、前記モノラル信号と前記サイド信号とを用いて前記第1チャネル信号および前記第2チャネル信号を得るステレオ信号計算手段と、を具備する構成を採る。
本発明の符号化方法は、ステレオ信号の第1チャネル信号および第2チャネル信号を合成してモノラル信号を生成し、前記第1チャネル信号と前記第2チャネル信号との差分であるサイド信号を生成するモノラル信号生成工程と、前記サイド信号に対する線形予測残差信号であるサイド残差信号を取得するサイド残差信号取得工程と、前記モノラル信号に対する線形予測残差信号であるモノラル残差信号を取得するモノラル残差信号取得工程と、前記サイド残差信号を、所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第1スペクトル分割工程と、前記モノラル残差信号を、前記所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第2スペクトル分割工程と、前記サイド残差信号の低帯域部分の周波数係数、前記モノラル残差信号の中間帯域部分の周波数係数、及び前記モノラル残差信号の低帯域部分の周波数係数を基準信号候補とし、前記サイド残差信号の中間帯域部分の周波数係数をターゲット信号とし、前記各基準信号候補と前記ターゲット信号との関係をチェックすることによって、前記基準信号候補の中から最適なものを基準信号として選択する選択工程と、前記基準信号と前記ターゲット信号とのチャネル間予測分析を行ってチャネル間予測係数を得るチャネル間予測分析工程と、を具備する方法を採る。
本発明の復号方法は、ステレオ信号の第1チャネル信号と第2チャネル信号との差分であるサイド信号に対する線形予測残差信号であるサイド残差信号の所定周波数より低い帯域である低帯域部分の周波数係数、前記第1チャネル信号および前記第2チャネル信号を合成して生成されるモノラル信号に対する線形予測残差信号であるモノラル残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数、及び前記モノラル残差信号の前記所定周波数より低い帯域である低帯域部分の周波数係数、の中から選択された基準信号を示す基準信号IDを復号するとともに、前記サイド残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数と前記基準信号とのチャネル間予測分析が行われることによって得られたチャネル間予測係数を復号するICPパラメータ復号工程と、前記チャネル間予測係数をフィルタ係数として前記基準信号に対してフィルタ処理を行うことにより、前記サイド残差信号の前記中間帯域部分の周波数係数を算出するICP合成工程と、前記サイド残差信号の前記低帯域部分の周波数係数と前前記サイド残差信号の前記中間帯域部分の周波数係数を加算して前記サイド残差信号の全帯域の周波数係数を得る加算工程と、前記サイド残差信号の全帯域の周波数係数から時間領域のサイド残差信号に変換する変換工程と、前記時間領域のサイド残差信号に対して線形予測合成フィルタリングを行い、前記サイド信号を得る線形予測合成工程と、前記モノラル信号と前記サイド信号とを用いて前記第1チャネル信号および前記第2チャネル信号を得るステレオ信号計算工程と、を具備する方法を採る。
本発明によれば、複数の信号の中から最良の予測結果をもたらすものを基準信号として選択し、基準信号を用いてサイド信号の残差信号を予測することにより、ステレオ音声符号化におけるICPの予測性能を改善することができる。
(実施の形態1)
以下、本発明の実施の形態1について、図面を用いて説明する。なお、以下の説明において、左チャネル信号、右チャネル信号、モノラル信号、サイド信号をそれぞれ、L、R、M、S、およびそれらの再生成信号をそれぞれ、L’、R’、M’、S’として表す。また、以下の説明では、各フレームの長さをN、モノラル、サイドの各信号に対するMDCT領域信号(周波数係数、またはMDCT係数と称する)を、それぞれ、m(f)、s(f)として表す。
図1は、本実施の形態に係る符号化装置の構成を示すブロック図である。図1に示す符号化装置100には、例えばPCM(Pulse Code Modulation)形式における左チャネル信号と右チャネル信号とからなるステレオ信号がフレーム毎に入力される。
モノラル信号合成部101は、左チャネル信号L、右チャネル信号Rを以下の式(1)により合成し、モノラル信号Mを生成する。また、モノラル信号合成部101は、左チャネル信号Lおよび右チャネル信号Rを用いて以下の式(2)によりサイド信号Sを生成する。そして、モノラル信号合成部101は、サイド信号SをLP分析・量子化部102及びLP逆フィルタ103に出力し、モノラル信号Mをモノラル符号化部104に出力する。
Figure 2009057327
Figure 2009057327
この式(1)、(2)において、nは、フレームにおける時間インデックス(time index)である。なお、モノラル信号を生成するための合成方法は、式(1)に限定されない。例えば、適応的に重み付けしてミックスする方法等、他の方法を使用して、モノラル信号を生成することもできる。
LP分析・量子化部102は、サイド信号Sに対してLP分析(線形予測分析)によるLPパラメータの算出および算出LPパラメータの量子化を行い、得られたLPパラメータの符号化データを多重部118に出力すると共に、量子化されたLP係数AをLP逆フィルタ103に出力する。
LP逆フィルタ103は、LP係数Aを用いて、サイド信号Sに対してLP逆フィルタリングを行い、得られたサイド信号の残差信号(以下、「サイド残差信号」という)Sresを窓掛け部105に出力する。
モノラル符号化部104は、モノラル信号Mを符号化し、得られた符号化データを多重部118に出力する。また、モノラル符号化部104は、モノラル残差信号Mresを窓掛け部106に出力する。なお、残差信号は励振信号ともいう。この残差信号は、ほとんどのモノラル音声符号化装置(例:CELP(Code Excited Linear Prediction)ベースの符号化装置)において、あるいは、LP残差信号または局部復号される残差信号を生成するプロセスが含まれるタイプの符号化装置において取り出すことが可能である。
窓掛け部105は、サイド残差信号Sresに対して窓掛け処理(windowing)を行い、MDCT変換部107に出力する。窓掛け部106は、モノラル残差信号Mresに対して窓掛け処理を行い、MDCT変換部108に出力する。
MDCT変換部107は、窓掛け処理後のサイド残差信号Sresに対してMDCT変換を実行し、得られたサイド残差信号の周波数係数s(f)をスペクトル分割部109に出力する。MDCT変換部108は、窓掛け処理後のモノラル残差信号Mresに対してMDCT変換を実行し、得られたモノラル残差信号の周波数係数m(f)をスペクトル分割部110に出力する。
スペクトル分割部109は、所定の周波数を境としてサイド残差信号の周波数係数s(f)の帯域を低帯域部分、中間帯域部分及び高帯域部分に分割し、サイド残差信号の低帯域部分の周波数係数s(f)を低帯域符号化部111に出力する。また、スペクトル分割部109は、サイド残差信号の中間帯域部分を更に小さなサブ帯域iに分割し、サイド残差信号の各サブ帯域部分の周波数係数sM、i(f)をICP分析部113、114、115に出力する。なお、iはサブ帯域のインデックスであり、0以上の整数である。
スペクトル分割部110は、所定の周波数を境としてモノラル残差信号の周波数係数m(f)の帯域を低帯域部分、中間帯域部分及び高帯域部分に分割し、モノラル残差信号の低帯域部分の周波数係数m(f)をICP分析部115に出力する。また、スペクトル分割部110は、モノラル残差信号の中間帯域部分を更に小さなサブ帯域iに分割し、モノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)をICP分析部114に出力する。
低帯域符号化部111は、サイド残差信号の低帯域部分の周波数係数s(f)を符号化し、得られた符号化データを低帯域復号部112及び多重部118に出力する。
低帯域復号部112は、サイド残差信号の低帯域部分の周波数係数の符号化データを復号し、得られたサイド残差信号の低帯域部分の周波数係数s'(f)をICP分析部113及び選択部116に出力する。
ICP分析部113は、適応フィルタからなり、サイド残差信号の低帯域部分の周波数係数s'(f)を基準信号候補として、これとサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)とのICP分析を行い、第1ICP係数を生成し、これを選択部116に出力する。
ICP分析部114は、適応フィルタからなり、モノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)を基準信号候補として、これとサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)とのICP分析を行い、第2ICP係数を生成し、これを選択部116に出力する。
ICP分析部115は、適応フィルタからなり、モノラル残差信号の低帯域部分の周波数係数m(f)を基準信号候補として、これとサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)とのICP分析を行い、第3ICP係数を生成し、これを選択部116に出力する。
選択部116は、各基準信号候補とサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)との関係をチェックすることによって、基準信号候補の中から最適なものを基準信号として選択し、選択した基準信号を示す基準信号ID(Identification)及び基準信号に対応するICP係数をICPパラメータ量子化部117に出力する。なお、選択部116の内部構成の詳細な説明については後述する。
ICPパラメータ量子化部117は、選択部116から出力されたICP係数を量子化し、基準信号IDを符号化する。量子化されたICP係数に対する符号化データ及び基準信号IDに対する符号化データは多重部118に出力される。
多重部118は、LP分析・量子化部102から出力されたLPパラメータの符号化データ、モノラル符号化部104から出力されたモノラル信号の符号化データ、低帯域符号化部111から出力されたサイド残差信号の低帯域部分の周波数係数の符号化データ、およびICPパラメータ量子化部117から出力された量子化ICP係数符号化データと基準信号ID符号化データを多重し、得られたビットストリームを出力する。
図2は、ICP分析部113、114、115を構成する適応フィルタの構成および動作を説明するための図である。この図において、H(z)は、H(z)=b+b(z−1)+b(z−2)+…+b(z−k)であり、適応フィルタ、例えばFIR(Finite Impulse Response)フィルタのモデル(伝達関数)を示す。ここで、kは適応フィルタ係数の次数を示し、b=[b,b,…,b]は適応フィルタ係数を示す。x(n)は適応フィルタの入力信号(基準信号)、y’(n)は適応フィルタの出力信号(予測信号)、y(n)は適応フィルタのターゲット信号を示す。例えば、ICP分析部113においては、x(n)はs'(f)に相当し、y(n)はsM、i(f)に相当する。
適応フィルタは、下記の式(3)に従って、予測信号とターゲット信号との平均二乗誤差(MSE)が最小となるような、適応フィルタパラメータb=[b,b,…,b]を求めて出力する。なお、式(3)において、E{ }はアンサンブル平均演算(ensemble average operation)、kはフィルタ次数、e(n)は予測誤差を示す。
Figure 2009057327
なお、図2におけるH(z)には、多数の別の構造が存在する。図3は、そのうちの1つを示している。図3に示したフィルタ構造は、従来のFIRフィルタである。
図4は、選択部116における基準信号の選択を説明するための図である。図4では、サブ帯域の数が2(i=0,1)の場合を示す。なお、図4の横軸は周波数、縦軸は周波数係数(MDCT係数)の値であり、上側がサイド残差信号の周波数帯域、下側がモノラル残差信号の周波数帯域である。
この場合、選択部116は、サイド残差信号の第0サブ帯域部分の周波数係数sM、0(f)を予測する場合の基準信号を、第0サブ帯域部分の周波数係数mM、0(f)、モノラル残差信号の低帯域部分の周波数係数m(f)、サイド残差信号の低帯域部分の周波数係数s'(f)の中から選択する。同様に、選択部116は、サイド残差信号の第1サブ帯域部分の周波数係数sM、1(f)を予測する場合の基準信号を、第1サブ帯域部分の周波数係数mM、1(f)、モノラル残差信号の低帯域部分の周波数係数m(f)、サイド残差信号の低帯域部分の周波数係数s'(f)の中から選択する。
図5は、本実施の形態に係る復号装置の構成を示すブロック図である。図1に示した符号化装置100から送信されたビットストリームは、図5に示す復号装置500に受信される。
分離部501は、復号装置500に受信されたビットストリームを分離し、LPパラメータの符号化データをLPパラメータ復号部512に出力し、ICP係数符号化データと基準信号ID符号化データをICPパラメータ復号部503に出力し、モノラル信号の符号化データをモノラル復号部502に出力し、サイド残差信号の低帯域部分の周波数係数の符号化データを低帯域復号部507に出力する。
モノラル復号部502は、モノラル信号の符号化データを復号してモノラル信号M’およびモノラル残差信号M'resを得る。モノラル復号部502は、得られたモノラル残差信号M'resを窓掛け部504に出力し、モノラル信号M’をステレオ信号計算部514に出力する。
ICPパラメータ復号部503は、ICP係数符号化データと基準信号ID符号化データを復号し、得られたICP係数と基準信号IDをICP合成部508に出力する。
窓掛け部504は、モノラル残差信号M'resに対して窓掛け処理を行い、MDCT変換部505に出力する。MDCT変換部505は、窓掛け処理後のモノラル残差信号M'resに対してMDCT変換を実行し、得られたモノラル残差信号の周波数係数m'(f)をスペクトル分割部506に出力する。
スペクトル分割部506は、所定の周波数を境としてモノラル残差信号の周波数係数m’(f)の帯域を低帯域部分、中間帯域部分及び高帯域部分に分割し、モノラル残差信号の低帯域部分の周波数係数m’(f)及び中間帯域部分の周波数係数m’(f)をICP合成部508に出力する。
低帯域復号部507は、サイド残差信号の低帯域部分の周波数係数の符号化データを復号し、得られたサイド残差信号の低帯域部分の周波数係数s'(f)をICP合成部508及び加算部509に出力する。
ICP合成部508は、基準信号IDに基づいて、モノラル残差信号の低帯域部分の周波数係数m’(f)、中間帯域部分の周波数係数m’(f)あるいはサイド残差信号の低帯域部分の周波数係数s'(f)の中から一つを基準信号として選択する。そして、ICP合成部508は、以下の式(4)によって表される、量子化ICP係数をフィルタ係数とするフィルタ処理により、サイド残差信号の各サブ帯域部分の周波数係数s’M、i(f)を算出し、加算部509に出力する。なお、式(4)において、h(i)はICP係数、X(f)は基準信号、PはICPの次数である。
Figure 2009057327
加算部509は、サイド残差信号の低帯域部分の周波数係数s'(f)とサイド残差信号の各サブ帯域部分の周波数係数s'M、i(f)とを結合し、得られたサイド残差信号の周波数係数s'(f)をIMDCT変換部510に出力する。
IMDCT変換部510は、サイド残差信号の周波数係数s'(f)に対してIMDCT変換を実行し、窓掛け部511に出力する。窓掛け部511は、IMDCT変換部510の出力信号に対して窓掛け処理を行い、得られたサイド残差信号S'resをLP合成部513に出力する。
LPパラメータ復号部512は、LPパラメータの符号化データを復号し、得られたLP係数AをLP合成部513に出力する。
LP合成部513は、サイド残差信号S'resに対して、LP係数Aを用いてLP合成フィルタリングを行い、サイド信号S'を得る。
ステレオ信号計算部514は、モノラル信号M’とサイド信号S'を用いて、以下の式(5)、(6)により、左チャネル信号L’及び右チャネル信号R’を得る。
Figure 2009057327
Figure 2009057327
このように、図5の復号装置500は、受信した図1の符号化装置100の信号に対して復号処理を行うことにより、左チャネル信号L’及び右チャネル信号R’を得ることができる。なお、ビットストリームが、LPパラメータの符号化データ、ICP係数符号化データ、基準信号ID符号化データ、モノラル信号の符号化データ、および、サイド残差信号の低帯域部分の周波数係数の符号化データを用いて形成されていれば、復号装置500は復号処理が可能である。すなわち、復号装置500が受信する信号は、このようなビットストリームを形成可能な符号化装置からの信号であれば、必ずしも図1の構成の符号化装置100からの信号でなくても良い。
次に、選択部116の内部構成について詳細に説明する。本実施の形態では、相互相関に基づいて基準信号を選択する場合(第一例)と、予測利得に基づいて基準信号を選択する場合(第二例)とを示す。
図6は、第一例における選択部116の内部構成を示すブロック図である。選択部116には、サイド残差信号の低帯域部分の周波数係数s'(f)、モノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)、モノラル残差信号の低帯域部分の周波数係数m(f)、サイド残差信号の各サブ帯域部分の周波数係数sM、i(f)、第1ICP係数、第2ICP係数及び第3ICP係数が入力される。
相関検査部601、602、603は、それぞれ以下の式(7)により相互相関を計算し、計算結果である相関値を相互相関比較部604に出力する。ここで、式(7)において、X(j)は基準信号候補のいずれかを示し、相関検査部601ではモノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)であり、相関検査部602ではモノラル残差信号の低帯域部分の周波数係数m(f)であり、相関検査部603ではサイド残差信号の低帯域部分の周波数係数s'(f)である。
Figure 2009057327
相互相関比較部604は、相関値が最も高い基準信号候補を基準信号として選択し、選択した基準信号を示す基準信号IDをICP係数選択部605に出力する。
ICP係数選択部605は、基準信号IDに対応するICP係数を選択し、基準信号ID及びICP係数をICPパラメータ量子化部117に出力する。
図7は、第二例における選択部116の内部構成を示すブロック図である。選択部116には、サイド残差信号の低帯域部分の周波数係数s'(f)、モノラル残差信号の各サブ帯域部分の周波数係数mM、i(f)、モノラル残差信号の低帯域部分の周波数係数m(f)、サイド残差信号の各サブ帯域部分の周波数係数sM、i(f)、第1ICP係数、第2ICP係数及び第3ICP係数が入力される。
ICP合成部701、702、703は、上記式(4)により各基準信号に対応するサイド残差信号の各サブ帯域部分の周波数係数s’M、i(f)を算出し、それぞれ利得確認部704、705、706に出力する。
利得確認部704、705、706は、以下の式(8)により予測利得を計算し、予測利得比較部707に出力する。ここで、式(8)において、e(n)=sM、i(f)−s’M、i(f)である。式(8)における予測利得Gainが高いほど予測性能は良いことになる。
Figure 2009057327
予測利得比較部707は、予測利得を比較し、最も高い予測利得の基準信号候補を基準信号として選択し、選択した基準信号を示す基準信号IDをICP係数選択部708に出力する。
ICP係数選択部708は、基準信号IDに対応するICP係数を選択し、基準信号ID及びICP係数をICPパラメータ量子化部117に出力する。
以上のように、本実施の形態によれば、複数の信号の中から最良の予測結果をもたらすものを基準信号として選択し、基準信号を用いてサイド信号の残差信号を予測することにより、ステレオ音声符号化におけるICPの予測性能を改善することができる。
なお、上記第二例において、量子化したICP係数をICP合成に使用しても良い。この場合、選択部116には、量子化前のICP係数の代わりに、ICP係数量子化器により量子化した量子化ICP係数が入力されるようにする。ICP合成部701、702、703は、量子化ICP係数を用いてサイド信号を復号する。予測利得は、量子化ICP係数による予測結果に基づいて比較される。このバリエーションでは、復号装置で用いられる量子化ICP係数を用いた予測により、最適な基準信号を選択できる。
(実施の形態2)
本発明の実施の形態2は、相互相関比較後にICP係数を計算する場合について説明する。図8は、本実施の形態に係る符号化装置の構成を示すブロック図である。なお、図8において、図1と共通する構成部分には、図1と同一符号を付してその説明を省略する。図8に示す符号化装置800は、図1に示した符号化装置100と比較して、ICP分析部113、114、115及び選択部116を削除し、選択部801及びICP分析部802を追加した構成を採る。
選択部801は、各基準信号候補とサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)との関係をチェックすることによって、基準信号候補の中から最適なものを基準信号として選択し、選択した基準信号を示す基準信号IDをICP分析部802に出力する。
ICP分析部802は、適応フィルタからなり、基準信号とサイド残差信号の各サブ帯域部分の周波数係数sM、i(f)とを用いてICP分析を行い、ICP係数を生成し、これをICPパラメータ量子化部117に出力する。
図9は、選択部801の内部構成を示すブロック図である。図9に示す選択部801の内部構成は、図6に示した選択部116の内部構成と比較してICP係数選択部605を削除したものとなる。
相互相関比較部604は、相関値が最も高い基準信号候補を基準信号として選択し、選択した基準信号を示す基準信号IDをICP分析部802に出力する。
このように、本実施の形態によれば、ICP係数を相互相関比較後に計算することができるので、実施の形態1と同様の効果を得ることができるともに、実施の形態1よりも計算量を削減することができる。
(実施の形態3)
実施の形態3は、従来のICPに対する修正版である修正ICPについて説明する。修正ICPは、ターゲット信号と異なる長さの基準信号を用いて予測を行う方法についての課題を解決するものである。
図10は、本実施の形態の修正ICPにおける予測方法を説明する図である。なお、本実施の形態における修正ICPの方法を「コピー法」と呼ぶ。図10において、基準信号X(f)(ベクトル)の長さをNで示し、ターゲット信号の長さをNで示す。X(j)は基準信号候補のいずれかを示す。
修正ICPでは、以下の2つのケースを考慮する。
1.N=Nの場合
この場合は、符号化装置が、従来ICPを用いてICP係数を計算する。このケースはあらゆる種類の基準信号に起こりうる。
2.N<NまたはN>Nの場合、
この場合は、符号化装置が、元の基準信号X(f)に基づいてNの長さの新しい基準信号X ̄(f)を生成し、新しい基準信号X ̄(f)を用いてターゲット信号を予測し、ICP係数を計算する。そして、復号装置が、符号化装置と同じ方法を用いてX ̄(f)を生成する。このケースは低域サイド信号または低域モノラル信号を基準信号として選択した場合に生じる。これらの信号の長さはターゲット信号より短い場合もあれば長い場合もある。
本実施の形態のコピー法は、上記ケース2の課題を解決する。コピー法には次の2段階がある。
ステップ1:N<Nの場合には、図10に示すように、ベクトルX(f)の先頭部の(N−N)点をベクトルX(f)(長さN)の最後にコピーして新しいベクトルX ̄(f)を作成する。また、N>Nの場合には、ベクトルX(f)の最初のN点をコピーして新しいベクトルX ̄(f)を作成する。X(f)は長さがNの新しい基準ベクトルとなる。
ステップ2:ICPアルゴリズムを用いてベクトルX ̄(f)からターゲット信号sM、i(f)を予測する。
このように、本実施の形態による修正ICPによれば、ターゲット信号のサブ帯域長を基準信号の長さによらず可変とすることができ、ターゲット信号と異なる長さの基準信号を用いて予測を行うことができる。すなわち、すべてのサブ帯域を基準信号と同じ固定長に分割する必要はない。周波数帯域の低帯域部分が音声品質に与える影響は大きいため、低域のサブ帯域はより短い長さに分割し、逆に重要性が相対的に低くなる高い周波数のサブ帯域ほどより大きな長さに分割して、その分割帯域を単位に予測を行うことで、スケーラブルステレオ音声符号化における符号化効率の向上および音質の向上を図ることができる。
また、基準信号として低帯域サイド信号を選択する場合、従来のICPでは予測対象のサブ帯域と同じ長さの基準信号を符号化し復号器に送信する必要がある。一方、本実施の形態による修正ICPでは、対象のサブ帯域より短い帯域幅の基準信号を用いて予測を行うことができ、長い基準信号を符号化する代わりに、短い基準信号を符号化するだけで済む。このため、本実施の形態による修正ICPは、低ビットレートで基準信号を復号器に伝送することができる。
(実施の形態4)
実施の形態4では、実施の形態3のケース2の場合(N<NまたはN>N)における代替方法について説明する。本実施の形態の修正ICPにおける予測方法は、短い基準ベクトル内の点の値を用いて、新しい基準ベクトルに対して補間により拡張するか、基準ベクトルをより短いベクトルに短縮するものである。なお、本実施の形態における修正ICPにおける方法を「拡張・縮小法」と呼ぶ。
本実施の形態の拡張・縮小法には次の2つの段階がある。
ステップ1:N<Nの場合には、図11に示すように、以下の式(9)によりベクトルX(f)(長さN)を長さNのベクトルX ̄(f)に拡張する。
Figure 2009057327
このとき、最近補間法、線形補間法、立体スプライン補間法、ラグランジュ補間法などの様々な補間法のいずれかをX ̄(f)に適用してベクトルX ̄(f)の欠落した点の値を求める。また、N>Nの場合には、以下の式(10)によりベクトルX(f)(長さN)を長さNのベクトルX ̄(f)に縮小する。
Figure 2009057327
ステップ2:ICPアルゴリズムを用いてベクトルX ̄(f)からターゲット信号sM、i(f)を予測する。
(実施の形態5)
実施の形態5では、実施の形態3、4の代替方法(N<NまたはN>Nの場合に対するもの)について説明する。本実施の形態の修正ICPにおける予測方法は、長期予測を用いて基準信号とターゲット信号内の周期を求めるものである。新しい基準信号は、得られた周期に基づいて元の基準信号のいくつかの周期を複製することにより生成される。
本実施の形態の方法には次の2つの段階がある。
ステップ1:基準信号X(f)とターゲット信号sM、i(f)を連結して連続したベクトルX(f)を得る。ベクトルX(f)内には周期が存在するものとする。次の式(11)の誤差errを最小化することにより周期Tを求める。なお、周期Tは、自己相関法、振幅差関数(magnitude difference function、非特許文献5参照)などの他の周期算出アルゴリズムを使用することによっても求められる。
Figure 2009057327
T>min[N,N]の場合、T=min[N,N]とする。Tに基づいてX(f)から長さがTの信号を1回または数回コピーして長さNの新しい基準信号X ̄(f)を得る。
ステップ2:ICPアルゴリズムを用いてベクトルX ̄(f)からターゲット信号sM、i(f)を予測する。
なお、本実施の形態の方法を用いる場合には、周期Tの情報を復号装置に伝送する必要がある。
なお、実施の形態3、4、5の説明においては、基準信号としてモノラル残差信号の低帯域部分を選択した場合、上記実施の形態のいずれかの方法を用いてモノラル残差信号の長さを拡張した基準信号を生成した後に予測を行うこととしたが、本発明は、その代わりに、モノラル残差信号の中間帯域を含めることによって所望の長さの基準信号を生成するようにしてもよい。この場合は実施の形態3に記載のケース1(N=Nの場合)に相当する。
また、実施の形態3、4、5において、サイド残差信号の中間帯域をサブ帯域に分割して予測を行う際に、低域側のサブ帯域から高域側のサブ帯域へと順次予測を実行するようにすることで、基準信号としてサイド残差信号の低帯域部分を選択した場合、先行して予測済みの低域側のサブ帯域の信号も用いて所望の長さの基準信号を生成することもできる。
以上、本発明の実施の形態について説明した。
本発明の手法は、ICPにおいて、複数の信号の中から最良の予測結果をもたらすものを基準信号として選択し、基準信号を用いてサイド信号の残差信号を予測することから、「適応的チャネル予測(ACP:Adaptive Channel Prediction)」と称し得る。この本発明のACPを用いることにより、スケーラブルなステレオ音声符号化におけるICPの予測性能を向上することができる。
なお、モノラル信号符号器/復号器がMDCT変換などの変換符号器の場合、MDCT領域の復号されたモノラル信号(または復号されたモノラルLP残差信号)は、符号器側ではモノラル符号器から、また復号器側ではモノラル復号器から直接得ることができる。
また、上記の各実施の形態に示した符号化方式はモノラル信号を用いてサイド信号を予測するもの(M−Sタイプと呼ぶ)である。モノラル信号を用いて左あるいは右信号を予測することもできる。この場合の動作は、上記各実施の形態において、サイドチャネルを左または右チャネルで置き換えて(LまたはRをSとみなす)、左(または右)チャネル信号を符号化する以外は、M−S方式の処理とほぼ同じである。この場合、符号化側で符号化したチャネル(左または右チャネル)の他方のチャネル(右または左チャネル)の信号は、復号器において、復号したチャネル信号(左または右チャネル信号)とモノラル信号を用いて以下の次の式(12)、(13)のように計算することができる。なお、両チャネル(LおよびR)共に、上記各実施の形態におけるサイド信号と同様に符号化するようにしても良い。
Figure 2009057327
Figure 2009057327
また、本発明は、上記各実施の形態における基準信号候補として、それらの加重和した信号(3種類の信号を所定の重み係数で乗じた後に加算した信号)を用いてもよい。また、本発明は、3つの基準信号候補を全て用いる必要はなく、例えば、中間帯域のモノラル信号と低帯域のサイド信号の2種類のみを候補とする、などとしてもよい。これによって基準信号IDを送信するビット数を減らすことができる。
また、上記各実施の形態では、サイド信号の予測はフレーム単位で行っている。このことは中間帯域の信号は他の周波数帯域上の同じフレームでの信号から予測されることを意味する。その代わりに、またはそれに加えて、フレーム間の予測も使用できる。例えば、先行する過去のフレームを基準候補として用いて現在のフレーム信号を予測することができる。
また、上記各実施の形態で予測の対象としたターゲット信号は低域帯域と高域帯域を除いた中間帯域のサイド信号であるとして説明したが、これに限らず、ターゲット信号として、中間帯域および高域帯域を含む、低域帯域を除く全ての信号帯域を含むようにしても良い。更には、低域帯域も含む全ての信号帯域を対象としても良い。これらの場合でも、サイド信号の任意の帯域は、小さなサブ帯域に分割して予測を行うことができる。これによって符号器および復号器の構造が変化することはない。
また、本発明は、時間領域の信号にも適用することができる。例えば、時間領域の(例えばQMF(Quadrature Mirror Filter)で得られる)いくつかのサブ帯域信号から基準信号を選択して時間領域の中間(あるは高)帯域信号を予測するようにしても良い。
なお、以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。本発明は、符号化装置、復号装置を有するシステムであればどのような場合にも適用することができる。
また、本発明に係る符号化装置および復号装置は、例えば音声符号化装置および音声復号装置等として、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置/復号装置と同様の機能を実現することができる。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2007年10月31日出願の特願2007−284622の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る符号化装置および復号装置は、携帯電話、IP電話、テレビ会議等に用いるに好適である。
本発明の実施の形態1に係る符号化装置の構成を示すブロック図 本発明の実施の形態1に係るICP分析部の内部の主要な構成を示すブロック図 ICP分析およびICP合成において使用する適応FIRフィルタの構造の一例を示す図 本発明の実施の形態1に係る符号化装置の選択部における基準信号の選択を説明するための図 本発明の実施の形態1に係る復号装置の構成を示すブロック図 本発明の実施の形態1に係る符号化装置の第一例における選択部の内部構成を示すブロック図 本発明の実施の形態1に係る符号化装置の第二例における選択部の内部構成を示すブロック図 本発明の実施の形態2に係る符号化装置の構成を示すブロック図 本発明の実施の形態2に係る符号化装置の選択部の内部構成を示すブロック図 本発明の実施の形態3の修正ICPにおける予測方法を説明する図 本発明の実施の形態4の修正ICPにおける予測方法を説明する図

Claims (10)

  1. ステレオ信号の第1チャネル信号および第2チャネル信号を合成してモノラル信号を生成し、前記第1チャネル信号と前記第2チャネル信号との差分であるサイド信号を生成するモノラル信号生成手段と、
    前記サイド信号に対する線形予測残差信号であるサイド残差信号を取得するサイド残差信号取得手段と、
    前記モノラル信号に対する線形予測残差信号であるモノラル残差信号を取得するモノラル残差信号取得手段と、
    前記サイド残差信号を、所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第1スペクトル分割手段と、
    前記モノラル残差信号を、前記所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第2スペクトル分割手段と、
    前記サイド残差信号の低帯域部分の周波数係数、前記モノラル残差信号の中間帯域部分の周波数係数、及び前記モノラル残差信号の低帯域部分の周波数係数を基準信号候補とし、前記サイド残差信号の中間帯域部分の周波数係数をターゲット信号とし、前記各基準信号候補と前記ターゲット信号との関係をチェックすることによって、前記基準信号候補の中から最適なものを基準信号として選択する選択手段と、
    前記基準信号と前記ターゲット信号とのチャネル間予測分析を行ってチャネル間予測係数を得るチャネル間予測分析手段と、
    を具備する符号化装置。
  2. 前記選択手段は、前記各基準信号候補と前記ターゲット信号との相互相関を比較し、相関値が最も高い基準信号候補を基準信号として選択する、請求項1記載の符号化装置。
  3. 前記選択手段は、前記各基準信号候補と前記ターゲット信号との予測利得を比較し、予測利得値が最も高い基準信号候補を基準信号として選択する、請求項1記載の符号化装置。
  4. 前記第1スペクトル分割手段は、前記サイド残差信号の中間帯域部分を更に小さなサブ帯域部分に分割し、
    前記第2スペクトル分割手段は、前記モノラル残差信号の中間帯域部分を更に小さなサブ帯域部分に分割し、
    前記選択手段は、サブ帯域部分毎に基準信号を選択する、請求項1記載の符号化装置。
  5. 前記チャネル間予測分析手段は、前記基準信号と前記ターゲット信号の長さが異なる場合、前記基準信号の一部分を複製または一部分のみを取り出して長さを合わせ、チャネル間予測分析を行う、請求項1記載の符号化装置。
  6. 前記チャネル間予測分析手段は、前記基準信号と前記ターゲット信号の長さが異なる場合、基準信号を拡張又は縮小して長さを合わせ、チャネル間予測分析を行う、請求項1記載の符号化装置。
  7. 前記チャネル間予測分析手段は、前記基準信号と前記ターゲット信号の長さが異なる場合、前記基準信号あるいは前記ターゲット信号の周期を求め、周期単位で複製することにより長さを合わせ、チャネル間予測分析を行う、請求項1記載の符号化装置。
  8. ステレオ信号の第1チャネル信号と第2チャネル信号との差分であるサイド信号に対する線形予測残差信号であるサイド残差信号の所定周波数より低い帯域である低帯域部分の周波数係数、前記第1チャネル信号および前記第2チャネル信号を合成して生成されるモノラル信号に対する線形予測残差信号であるモノラル残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数、及び前記モノラル残差信号の前記所定周波数より低い帯域である低帯域部分の周波数係数、の中から基準信号を選択し、前記サイド残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数と前記基準信号とのチャネル間予測分析が行われることによって得られたチャネル間予測係数をフィルタ係数として前記基準信号に対してフィルタ処理を行うことにより、前記サイド残差信号の前記中間帯域部分の周波数係数を算出するICP合成手段と、
    前記サイド残差信号の前記低帯域部分の周波数係数と前前記サイド残差信号の前記中間帯域部分の周波数係数を加算して前記サイド残差信号の全帯域の周波数係数を得る加算手段と、
    前記サイド残差信号に対して線形予測合成フィルタリングを行い、前記サイド信号を得る線形予測合成手段と、
    前記モノラル信号と前記サイド信号とを用いて前記第1チャネル信号および前記第2チャネル信号を得るステレオ信号計算手段と、
    を具備する復号装置。
  9. ステレオ信号の第1チャネル信号および第2チャネル信号を合成してモノラル信号を生成し、前記第1チャネル信号と前記第2チャネル信号との差分であるサイド信号を生成するモノラル信号生成工程と、
    前記サイド信号に対する線形予測残差信号であるサイド残差信号を取得するサイド残差信号取得工程と、
    前記モノラル信号に対する線形予測残差信号であるモノラル残差信号を取得するモノラル残差信号取得工程と、
    前記サイド残差信号を、所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第1スペクトル分割工程と、
    前記モノラル残差信号を、前記所定周波数より低い帯域である低帯域部分と前記所定周波数より高い帯域である中間帯域部分とに分割する第2スペクトル分割工程と、
    前記サイド残差信号の低帯域部分の周波数係数、前記モノラル残差信号の中間帯域部分の周波数係数、及び前記モノラル残差信号の低帯域部分の周波数係数を基準信号候補とし、前記サイド残差信号の中間帯域部分の周波数係数をターゲット信号とし、前記各基準信号候補と前記ターゲット信号との関係をチェックすることによって、前記基準信号候補の中から最適なものを基準信号として選択する選択工程と、
    前記基準信号と前記ターゲット信号とのチャネル間予測分析を行ってチャネル間予測係数を得るチャネル間予測分析工程と、
    を具備する符号化方法。
  10. ステレオ信号の第1チャネル信号と第2チャネル信号との差分であるサイド信号に対する線形予測残差信号であるサイド残差信号の所定周波数より低い帯域である低帯域部分の周波数係数、前記第1チャネル信号および前記第2チャネル信号を合成して生成されるモノラル信号に対する線形予測残差信号であるモノラル残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数、及び前記モノラル残差信号の前記所定周波数より低い帯域である低帯域部分の周波数係数、の中から基準信号を選択し、前記サイド残差信号の前記所定周波数より高い帯域である中間帯域部分の周波数係数と前記基準信号とのチャネル間予測分析が行われることによって得られたチャネル間予測係数をフィルタ係数として前記基準信号に対してフィルタ処理を行うことにより、前記サイド残差信号の前記中間帯域部分の周波数係数を算出するICP合成工程と、
    前記サイド残差信号の前記低帯域部分の周波数係数と前前記サイド残差信号の前記中間帯域部分の周波数係数を加算して前記サイド残差信号の全帯域の周波数係数を得る加算工程と、
    前記サイド残差信号に対して線形予測合成フィルタリングを行い、前記サイド信号を得る線形予測合成工程と、
    前記モノラル信号と前記サイド信号とを用いて前記第1チャネル信号および前記第2チャネル信号を得るステレオ信号計算工程と、
    を具備する復号方法。
JP2009538954A 2007-10-31 2008-10-31 符号化装置および復号装置 Expired - Fee Related JP5413839B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009538954A JP5413839B2 (ja) 2007-10-31 2008-10-31 符号化装置および復号装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007284622 2007-10-31
JP2007284622 2007-10-31
PCT/JP2008/003151 WO2009057327A1 (ja) 2007-10-31 2008-10-31 符号化装置および復号装置
JP2009538954A JP5413839B2 (ja) 2007-10-31 2008-10-31 符号化装置および復号装置

Publications (2)

Publication Number Publication Date
JPWO2009057327A1 true JPWO2009057327A1 (ja) 2011-03-10
JP5413839B2 JP5413839B2 (ja) 2014-02-12

Family

ID=40590731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009538954A Expired - Fee Related JP5413839B2 (ja) 2007-10-31 2008-10-31 符号化装置および復号装置

Country Status (5)

Country Link
US (1) US8374883B2 (ja)
EP (1) EP2209114B1 (ja)
JP (1) JP5413839B2 (ja)
CN (1) CN101842832B (ja)
WO (1) WO2009057327A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009084226A1 (ja) * 2007-12-28 2009-07-09 Panasonic Corporation ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
US8140723B2 (en) * 2008-11-04 2012-03-20 Renesas Electronics America Inc. Digital I/O signal scheduler
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN102598124B (zh) 2009-10-30 2013-08-28 松下电器产业株式会社 编码装置、解码装置及其方法
TW201209805A (en) 2010-07-06 2012-03-01 Panasonic Corp Device and method for efficiently encoding quantization parameters of spectral coefficient coding
ES2526320T3 (es) * 2010-08-24 2015-01-09 Dolby International Ab Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM
US9106384B2 (en) * 2011-07-01 2015-08-11 Panasonic Intellectual Property Corporation Of America Receiver apparatus, transmitter apparatus, setting method, and determining method
US9779731B1 (en) * 2012-08-20 2017-10-03 Amazon Technologies, Inc. Echo cancellation based on shared reference signals
TWI618051B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
KR101729930B1 (ko) 2013-02-14 2017-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 업믹스된 오디오 신호들의 채널간 코히어런스를 제어하기 위한 방법
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
CN110473560B (zh) 2013-09-12 2023-01-06 杜比国际公司 多声道音频内容的编码
US10147441B1 (en) 2013-12-19 2018-12-04 Amazon Technologies, Inc. Voice controlled system
US10475457B2 (en) * 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
US10734001B2 (en) * 2017-10-05 2020-08-04 Qualcomm Incorporated Encoding or decoding of audio signals
CN110556117B (zh) * 2018-05-31 2022-04-22 华为技术有限公司 立体声信号的编码方法和装置
CN110719564B (zh) * 2018-07-13 2021-06-08 海信视像科技股份有限公司 音效处理方法和装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
DE4320990B4 (de) 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
DE19526366A1 (de) 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
JP4367455B2 (ja) 1998-10-13 2009-11-18 日本ビクター株式会社 音声信号伝送方法及び音声信号復号方法
US6463410B1 (en) 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7191136B2 (en) 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
JP4195598B2 (ja) 2002-10-31 2008-12-10 日本電信電話株式会社 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム
WO2004098105A1 (en) * 2003-04-30 2004-11-11 Nokia Corporation Support of a multichannel audio extension
WO2006000842A1 (en) 2004-05-28 2006-01-05 Nokia Corporation Multichannel audio extension
WO2006022308A1 (ja) * 2004-08-26 2006-03-02 Matsushita Electric Industrial Co., Ltd. マルチチャネル信号符号化装置およびマルチチャネル信号復号装置
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
RU2387024C2 (ru) 2004-11-05 2010-04-20 Панасоник Корпорэйшн Кодер, декодер, способ кодирования и способ декодирования
WO2006070760A1 (ja) * 2004-12-28 2006-07-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
ATE521143T1 (de) 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US8433581B2 (en) * 2005-04-28 2013-04-30 Panasonic Corporation Audio encoding device and audio encoding method
US8271275B2 (en) * 2005-05-31 2012-09-18 Panasonic Corporation Scalable encoding device, and scalable encoding method
JP5171256B2 (ja) * 2005-08-31 2013-03-27 パナソニック株式会社 ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
US8112286B2 (en) * 2005-10-31 2012-02-07 Panasonic Corporation Stereo encoding device, and stereo signal predicting method
JPWO2007116809A1 (ja) * 2006-03-31 2009-08-20 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP4989095B2 (ja) 2006-04-06 2012-08-01 日本電信電話株式会社 マルチチャネル符号化方法、その装置、そのプログラム及び記録媒体
JP4399832B2 (ja) 2006-07-07 2010-01-20 日本ビクター株式会社 音声符号化方法、音声復号化方法及び音声信号伝送方法
DE102006055737A1 (de) * 2006-11-25 2008-05-29 Deutsche Telekom Ag Verfahren zur skalierbaren Codierung von Stereo-Signalen

Also Published As

Publication number Publication date
EP2209114A1 (en) 2010-07-21
EP2209114A4 (en) 2011-09-28
JP5413839B2 (ja) 2014-02-12
US8374883B2 (en) 2013-02-12
CN101842832B (zh) 2012-11-07
EP2209114B1 (en) 2014-05-14
US20100250244A1 (en) 2010-09-30
WO2009057327A1 (ja) 2009-05-07
CN101842832A (zh) 2010-09-22

Similar Documents

Publication Publication Date Title
JP5413839B2 (ja) 符号化装置および復号装置
JP5171256B2 (ja) ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
JP5046652B2 (ja) 音声符号化装置および音声符号化方法
JP4606418B2 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP4850827B2 (ja) 音声符号化装置および音声符号化方法
JP5753540B2 (ja) ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法
EP1801783B1 (en) Scalable encoding device, scalable decoding device, and method thereof
JP4555299B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP5404412B2 (ja) 符号化装置、復号装置およびこれらの方法
KR20090117883A (ko) 부호화 장치, 복호 장치 및 그 방법
JP5355387B2 (ja) 符号化装置および符号化方法
JP4887279B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JPWO2007116809A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JPWO2009084226A1 (ja) ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
JPWO2006059567A1 (ja) ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
JPWO2008132850A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP4842147B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP4937746B2 (ja) 音声符号化装置および音声符号化方法
JPWO2008132826A1 (ja) ステレオ音声符号化装置およびステレオ音声符号化方法
JPWO2008090970A1 (ja) ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
Bhatt Implementation and Overall Performance Evaluation of CELP based GSM AMR NB coder over ABE
JP2009134187A (ja) 符号化装置、復号装置、およびこれらの方法
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131015

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131105

R150 Certificate of patent or registration of utility model

Ref document number: 5413839

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees