JPWO2006118178A1 - 音声符号化装置および音声符号化方法 - Google Patents

音声符号化装置および音声符号化方法 Download PDF

Info

Publication number
JPWO2006118178A1
JPWO2006118178A1 JP2007514798A JP2007514798A JPWO2006118178A1 JP WO2006118178 A1 JPWO2006118178 A1 JP WO2006118178A1 JP 2007514798 A JP2007514798 A JP 2007514798A JP 2007514798 A JP2007514798 A JP 2007514798A JP WO2006118178 A1 JPWO2006118178 A1 JP WO2006118178A1
Authority
JP
Japan
Prior art keywords
channel
signal
prediction
intra
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007514798A
Other languages
English (en)
Other versions
JP4850827B2 (ja
Inventor
吉田 幸司
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2007514798A priority Critical patent/JP4850827B2/ja
Publication of JPWO2006118178A1 publication Critical patent/JPWO2006118178A1/ja
Application granted granted Critical
Publication of JP4850827B2 publication Critical patent/JP4850827B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

モノラル−ステレオ・スケーラブル構成を有する音声符号化において、効率的にステレオ音声を符号化することができる音声符号化装置。この装置では、相関度比較部(304)が、第1ch音声信号から第1chのチャネル内相関(第1ch内の過去の信号と現在の信号との相関度)を算出するとともに、第2ch音声信号から第2chのチャネル内相関(第2ch内の過去の信号と現在の信号との相関度)を算出し、第1chのチャネル内相関と第2chのチャネル内相関とを比較して、より大きい相関をもつチャネルを選択し、選択部(305)が、相関度比較部(304)での選択結果に従って、第1ch内予測部(307)から出力される第1ch予測信号、または、第1ch信号生成部(311)から出力される第1ch予測信号のいずれかを選択して、減算器(303)および第1ch予測残差信号符号化部(308)に出力する。

Description

本発明は、音声符号化装置および音声符号化方法に関し、特に、ステレオ音声のための音声符号化装置および音声符号化方法に関する。
移動体通信やIP通信での伝送帯域の広帯域化、サービスの多様化に伴い、音声通信において高音質化、高臨場感化のニーズが高まっている。例えば、今後、テレビ電話サービスにおけるハンズフリー形態での通話、テレビ会議における音声通信、多地点で複数話者が同時に会話を行うような多地点音声通信、臨場感を保持したまま周囲の音環境を伝送できるような音声通信などの需要が増加すると見込まれる。その場合、モノラル信号より臨場感があり、また複数話者の発話位置が認識できるような、ステレオ音声による音声通信を実現することが望まれる。このようなステレオ音声による音声通信を実現するためには、ステレオ音声の符号化が必須となる。
また、IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号化が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データの復号が可能な構成をいう。
よって、ステレオ音声を符号化し伝送する場合にも、ステレオ信号の復号と、符号化データの一部を用いたモノラル信号の復号とを受信側において選択可能な、モノラル−ステレオ間でのスケーラブル構成(モノラル−ステレオ・スケーラブル構成)を有する符号化が望まれる。
このような、モノラル−ステレオ・スケーラブル構成を有する音声符号化方法としては、例えば、チャネル(以下、適宜「ch」と略す)間の信号の予測(第1ch信号から第2ch信号の予測、または、第2ch信号から第1ch信号の予測)を、チャネル相互間のピッチ予測により行う、すなわち、2チャネル間の相関を利用して符号化を行うものがある(非特許文献1参照)。
Ramprashad,S.A.,"Stereophonic CELP coding using cross channel prediction",Proc.IEEE Workshop on Speech Coding,pp.136−138,Sep.2000.
しかしながら、上記非特許文献1記載の音声符号化方法では、双方のチャネル間の相関が小さい場合には、チャネル間の予測性能(予測ゲイン)が低下してしまい、符号化効率が劣化する。
また、モノラル−ステレオ・スケーラブル構成を有する音声符号化方法におけるステレオ拡張レイヤでの符号化にチャネル間の予測を用いた符号化を適用する場合、双方のチャネル間の相関が小さく、かつ、ステレオ拡張レイヤで符号化の対象となるチャネルのチャネル内相関(すなわち、チャネル内の過去の信号と現在の信号との相関度)が小さい場合には、チャネル間の予測のみでは十分な予測性能(予測ゲイン)が得られず符号化効率が劣化する。
本発明の目的は、モノラル−ステレオ・スケーラブル構成を有する音声符号化において、効率的にステレオ音声を符号化することができる音声符号化装置および音声符号化方法を提供することである。
本発明の音声符号化装置は、モノラル信号のためのコアレイヤの符号化を行う第1符号化手段と、ステレオ信号のための拡張レイヤの符号化を行う第2符号化手段と、を具備し、前記第1符号化手段は、ステレオ信号を構成する第1チャネルの信号および第2チャネルの信号からモノラル信号を生成し、前記第2符号化手段は、前記第1チャネルおよび前記第2チャネルのうち、チャネル内相関がより大きいチャネルのチャネル内予測により生成した予測信号を用いて前記第1チャネルに対する符号化を行う構成を採る。
本発明によれば、効率的にステレオ音声を符号化することができる。
本発明の実施の形態1に係る音声符号化装置の構成を示すブロック図 本発明の実施の形態1に係る拡張レイヤ符号化部の動作フロー図 本発明の実施の形態1に係る拡張レイヤ符号化部の動作概念図 本発明の実施の形態1に係る拡張レイヤ符号化部の動作概念図 本発明の実施の形態1に係る音声復号装置の構成を示すブロック図 本発明の実施の形態2に係る音声符号化装置の構成を示すブロック図 本発明の実施の形態2に係る第1chCELP符号化部の構成を示すブロック図 本発明の実施の形態2に係る第1chCELP符号化部の動作フロー図
以下、モノラル−ステレオ・スケーラブル構成を有する音声符号化に関する本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
本実施の形態に係る音声符号化装置の構成を図1に示す。図1に示す音声符号化装置100は、モノラル信号のためのコアレイヤ符号化部200とステレオ信号のための拡張レイヤ符号化部300とを備える。なお、以下の説明では、フレーム単位での動作を前提にして説明する。
コアレイヤ符号化部200において、モノラル信号生成部201は、入力される第1ch音声信号s_ch1(n)、第2ch音声信号s_ch2(n)(但し、n=0〜NF−1;NFはフレーム長)から、式(1)に従ってモノラル信号s_mono(n)を生成し、モノラル信号符号化部202に出力する。
Figure 2006118178
モノラル信号符号化部202は、モノラル信号s_mono(n)に対する符号化を行い、このモノラル信号の符号化データをモノラル信号復号部203に出力する。また、このモノラル信号の符号化データは、拡張レイヤ符号化部300から出力される量子化符号、符号化データおよび選択情報と多重されて、符号化データとして、後述する音声復号装置へ伝送される。
モノラル信号復号部203は、モノラル信号の符号化データからモノラルの復号信号を生成して拡張レイヤ符号化部300に出力する。
拡張レイヤ符号化部300において、チャネル間予測パラメータ分析部301は、第1ch音声信号とモノラル復号信号とから、モノラル信号に対する第1ch音声信号の予測パラメータ(チャネル間予測パラメータ)を求めて量子化し、チャネル間予測部302に出力する。ここでは、チャネル間予測パラメータ分析部301は、チャネル間予測パラメータとして、モノラル信号(モノラル復号信号)に対する第1ch音声信号の遅延差(Dサンプル)および振幅比(g)を求める。また、チャネル間予測パラメータ分析部301は、チャネル間予測パラメータを量子化および符号化したチャネル間予測パラメータ量子化符号を出力する。このチャネル間予測パラメータ量子化符号は、他の量子化符号、符号化データおよび選択情報と多重されて、符号化データとして、後述する音声復号装置へ伝送される。
チャネル間予測部302は、量子化されたチャネル間予測パラメータを用いて、モノラル復号信号から第1ch信号を予測し、この第1ch予測信号(チャネル間予測)を減算器303および第1ch予測残差信号符号化部308に出力する。例えば、チャネル間予測部302は、式(2)で表される予測により、モノラル復号信号sd_mono(n)から、第1ch予測信号sp_ch1(n)を合成する。
Figure 2006118178
相関度比較部304は、第1ch音声信号から第1chのチャネル内相関(第1ch内の過去の信号と現在の信号との相関度)を算出するとともに、第2ch音声信号から第2chのチャネル内相関(第2ch内の過去の信号と現在の信号との相関度)を算出する。各チャネルのチャネル内相関としては、例えば、対応する音声信号に対する正規化最大自己相関係数値、対応する音声信号に対するピッチ予測ゲイン値、対応する音声信号から求められるLPC予測残差信号に対する正規化最大自己相関係数値、対応する音声信号から求められるLPC予測残差信号に対するピッチ予測ゲイン値などを用いることができる。そして、相関度比較部304は、第1chのチャネル内相関と第2chのチャネル内相関とを比較して、より大きい相関をもつチャネルを選択する。この選択の結果を示す選択情報は選択部305、306に出力される。また、この選択情報は、量子化符号および符号化データと多重されて、符号化データとして、後述する音声復号装置へ伝送される。
第1ch内予測部307は、第1ch音声信号と、第1ch予測残差信号符号化部308から入力される第1ch復号信号とから、第1chでのチャネル内予測により、第1ch信号を予測して、この第1ch予測信号を選択部305に出力する。また、第1ch内予測部307は、第1chでのチャネル内予測に必要なチャネル内予測パラメータの量子化により得られる第1chのチャネル内予測パラメータ量子化符号を選択部306に出力する。なお、チャネル内予測の詳細については後述する。
第2ch信号生成部309は、モノラル信号復号部203から入力されるモノラル復号信号と、第1ch予測残差信号符号化部308から入力される第1ch復号信号とから、上式(1)の関係に基づいて、第2ch復号信号を生成する。つまり、第2ch信号生成部309は、モノラル復号信号sd_mono(n)と第1ch復号信号sd_ch1(n)とから、式(3)に従って第2ch復号信号sd_ch2(n)を生成して、第2ch内予測部310に出力する。
Figure 2006118178
第2ch内予測部310は、第2ch音声信号と第2ch復号信号とから、第2chでのチャネル内予測により、第2ch信号を予測して、この第2ch予測信号を第1ch信号生成部311に出力する。また、第2ch内予測部310は、第2chでのチャネル内予測に必要なチャネル内予測パラメータの量子化により得られる第2chのチャネル内予測パラメータ量子化符号を選択部306に出力する。なお、チャネル内予測の詳細については後述する。
第1ch信号生成部311は、第2ch予測信号と、モノラル信号復号部203から入力されるモノラル復号信号とから、上式(1)の関係に基づいて、第1ch予測信号を生成する。つまり、第1ch信号生成部311は、モノラル復号信号sd_mono(n)と第2ch予測信号s_ch2_p(n)とから、式(4)に従って第1ch予測信号s_ch1_p(n)を生成して、選択部305に出力する。
Figure 2006118178
選択部305は、相関度比較部304での選択結果に従って、第1ch内予測部307から出力される第1ch予測信号、または、第1ch信号生成部311から出力される第1ch予測信号のいずれかを選択して、減算器303および第1ch予測残差信号符号化部308に出力する。選択部305は、相関度比較部304により第1chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関より大きい場合)、第1ch内予測部307から出力される第1ch予測信号を選択し、相関度比較部304により第2chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関以下の場合)、第1ch信号生成部311から出力される第1ch予測信号を選択する。
選択部306は、相関度比較部304での選択結果に従って、第1ch内予測部307から出力される第1chのチャネル内予測パラメータ量子化符号、または、第2ch内予測部310から出力される第2chのチャネル内予測パラメータ量子化符号のいずれかを選択して、チャネル内予測パラメータ量子化符号として出力する。このチャネル内予測パラメータ量子化符号は、他の量子化符号、符号化データおよび選択情報と多重されて、符号化データとして、後述する音声復号装置へ伝送される。
具体的には、選択部306は、相関度比較部304により第1chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関より大きい場合)、第1ch内予測部307から出力される第1chのチャネル内予測パラメータ量子化符号を選択し、相関度比較部304により第2chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関以下の場合)、第2ch内予測部310から出力される第2chのチャネル内予測パラメータ量子化符号を選択する。
減算器303は、入力信号である第1ch音声信号と第1ch予測信号との残差信号(第1ch予測残差信号)、すなわち、チャネル間予測部302から出力された第1ch予測信号と、選択部305から出力された第1ch予測信号とを、第1ch音声信号から差し引いた残りの信号を求め、第1ch予測残差信号符号化部308に出力する。
第1ch予測残差信号符号化部308は、第1ch予測残差信号を符号化した第1ch予測残差符号化データを出力する。この第1ch予測残差符号化データは、他の符号化データ、量子化符号および選択情報と多重されて、符号化データとして、後述する音声復号装置へ伝送される。また、第1ch予測残差信号符号化部308は、第1ch予測残差符号化データを復号した信号と、チャネル間予測部302から出力された第1ch予測信号と、選択部305から出力された第1ch予測信号とを加算して、第1ch復号信号を求め、この第1ch復号信号を第1ch内予測部307および第2ch信号生成部309に出力する。
ここで、第1ch内予測部307および第2ch内予測部310は、各チャネル内の信号の相関性を利用して、過去の信号から符号化対象フレームの信号を予測するチャネル内予測を行う。例えば、1次のピッチ予測フィルタを用いる場合は、チャネル内予測により予測される各チャネルの信号は式(5)で表される。ここで、Sp(n)は各チャネルの予測信号、s(n)は各チャネルの復号信号(第1ch復号信号または第2ch復号信号)である。また、Tおよびgpは、各チャネルの復号信号と各チャネルの入力信号(第1ch音声信号または第2ch音声信号)とから求められる、1次のピッチ予測フィルタのラグおよび予測係数であり、これらはチャネル内予測パラメータを構成する。
Figure 2006118178
次いで、図2〜4を用いて、拡張レイヤ符号化部300の動作について説明する。
まず、第1chのチャネル内相関度cor1および第2chのチャネル内相関度cor2を算出する(ST11)。
次いで、cor1とcor2とを比較して(ST12)、チャネル内相関度がより大きいチャネルでのチャネル内予測を用いる。
すなわち、cor1>cor2の場合は(ST12:YES)、第1chでのチャネル内予測を行って求めた第1ch予測信号を符号化対象として選択する。具体的には、図3に示すように、第n−1フレームの第1ch復号信号21から上式(5)に従って第nフレームの第1ch信号22を予測し(ST13)、このようにして予測した第1ch予測信号22を符号化対象として選択部305から出力する(ST17)。つまり、cor1>cor2の場合は、第1ch復号信号から第1ch信号を直接的に予測する。
一方、cor1≦cor2の場合は(ST12:NO)、第2ch復号信号を生成し(ST14)、第2chでのチャネル内予測を行って第2チャネル予測信号を求め(ST15)、第2ch予測信号とモノラル復号信号とから第1ch予測信号を求め(ST16)、このようにして求めた第1ch予測信号を符号化対象として選択部305から出力する(ST17)。具体的には、図4に示すように、第n−1フレームの第1ch復号信号31および第n−1フレームのモノラル復号信号32から、上式(3)に従って、第n−1フレームの第2ch復号信号を生成する。次いで、第n−1フレームの第2ch復号信号33から上式(5)に従って第nフレームの第2ch信号34を予測する。次いで、第nフレームの第2ch予測信号34および第nフレームのモノラル復号信号35から、上式(4)に従って、第nフレームの第1ch予測信号36を生成する。そして、このようにして予測した第1ch予測信号36を符号化対象として選択する。つまり、cor1≦cor2の場合は、第2ch予測信号とモノラル復号信号とから、第1ch信号を間接的に予測する。
次いで、本実施の形態に係る音声復号装置について説明する。本実施の形態に係る音声復号装置の構成を図5に示す。図5に示す音声復号装置400は、モノラル信号のためのコアレイヤ復号部410と、ステレオ信号のための拡張レイヤ復号部420とを備える。
モノラル信号復号部411は、入力されるモノラル信号の符号化データを復号し、モノラル復号信号を拡張レイヤ復号部420に出力するとともに、最終出力として出力する。
チャネル間予測パラメータ復号部421は、入力されるチャネル間予測パラメータ量子化符号を復号してチャネル間予測部422に出力する。
チャネル間予測部422は、量子化されたチャネル間予測パラメータを用いて、モノラル復号信号から第1ch信号を予測し、この第1ch予測信号(チャネル間予測)を加算器423に出力する。例えば、チャネル間予測部422は、上式(2)で表される予測により、モノラル復号信号sd_mono(n)から、第1ch予測信号sp_ch1(n)を合成する。
第1ch予測残差信号復号部424は、入力される第1ch予測残差符号化データを復号して加算器423に出力する。
加算器423は、チャネル間予測部422から出力される第1ch予測信号と、第1ch予測残差信号復号部424から出力される第1ch予測残差信号と、選択部426から出力される第1ch予測信号とを加算して、第1ch復号信号を求め、この第1ch復号信号を、第1ch内予測部425および第2ch信号生成部427に出力するとともに、最終出力として出力する。
第1ch内予測部425は、第1ch復号信号と、第1chのチャネル内予測パラメータ量子化符号とから、上記同様のチャネル内予測により第1ch信号を予測して、この第1ch予測信号を選択部426に出力する。
第2ch信号生成部427は、モノラル復号信号と第1ch復号信号とから、上式(3)に従って第2ch復号信号を生成して、第2ch内予測部428に出力する。
第2ch内予測部428は、第2ch復号信号と、第2chのチャネル内予測パラメータ量子化符号とから、上記同様のチャネル内予測により第2ch信号を予測して、この第2ch予測信号を第1ch信号生成部429に出力する。
第1ch信号生成部429は、モノラル復号信号と第2ch予測信号とから、上式(4)に従って第1ch予測信号を生成して、選択部426に出力する。
選択部426は、選択情報が示す選択結果に従って、第1ch内予測部425から出力される第1ch予測信号、または、第1ch信号生成部429から出力される第1ch予測信号のいずれかを選択して、加算器423に出力する。選択部426は、図1の音声符号化装置100にて第1chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関より大きい場合)、第1ch内予測部425から出力される第1ch予測信号を選択し、音声符号化装置100にて第2chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関以下の場合)、第1ch信号生成部429から出力される第1ch予測信号を選択する。
このような構成を採る音声復号装置400では、モノラル−ステレオ・スケーラブル構成において、出力音声をモノラルとする場合は、モノラル信号の符号化データのみから得られる復号信号をモノラル復号信号として出力し、出力音声をステレオとする場合は、受信される符号化データおよび量子化符号のすべてを用いて第1ch復号信号および第2ch復号信号を復号して出力する。
このように、本実施の形態では、チャネル内相関がより大きいチャネルでのチャネル内予測により求めた予測信号を用いて拡張レイヤでの符号化を行うため、符号化対象チャネル(本実施形態では第1ch)の符号化対象フレームにおけるチャネル内相関(チャネル内予測性能)が小さく予測が有効に行えない場合でも、他方のチャネル(本実施形態では第2ch)のチャネル内相関が大きい場合には、その他方のチャネルでのチャネル内予測により求めた予測信号を用いて符号化対象チャネルの信号を予測することができるため、符号化対象チャネルのチャネル内相関が小さい場合でも、十分な予測性能(予測ゲイン)を得ることができ、その結果、符号化効率の劣化を防ぐことができる。
なお、上記説明では、拡張レイヤ符号化部300にチャネル間予測パラメータ分析部301およびチャネル間予測部302を設ける構成について説明したが、拡張レイヤ符号化部300はこれらの各部を有しない構成を採ることも可能である。この場合、拡張レイヤ符号化部300では、コアレイヤ符号化部200から出力されたモノラル復号信号が直接減算器303に入力され、減算器303は、第1ch音声信号からモノラル復号信号および第1ch予測信号を減算して予測残差信号を求める。
また、上記説明では、チャネル内相関の大きさに基づいて、第1chでのチャネル内予測により直接求めた第1ch予測信号(直接的予測)、または、第2chでのチャネル内予測により求めた第2ch予測信号から間接的に求めた第1ch予測信号(間接的予測)のいずれかを選択したが、符号化対象チャネルである第1chのチャネル内予測誤差(すなわち、入力信号である第1ch音声信号に対する第1ch予測信号の誤差)が小さい方の第1ch予測信号を選択してもよい。または、双方の第1ch予測信号を用いて拡張レイヤでの符号化を行い、その結果生じる符号化歪みがより小さい方の第1ch予測信号を選択してもよい。
(実施の形態2)
図6に本実施の形態に係る音声符号化装置500の構成を示す。
コアレイヤ符号化部510において、モノラル信号生成部511は、上式(1)に従ってモノラル信号を生成し、モノラル信号CELP符号化部512に出力する。
モノラル信号CELP符号化部512は、モノラル信号生成部511で生成されたモノラル信号に対してCELP符号化を行い、モノラル信号符号化データ、および、CELP符号化によって得られるモノラル駆動音源信号を出力する。モノラル信号符号化データは、モノラル信号復号部513に出力されるとともに、第1ch符号化データと多重されて音声復号装置へ伝送される。また、モノラル駆動音源信号は、モノラル駆動音源信号保持部521に保持される。
モノラル信号復号部513は、モノラル信号の符号化データからモノラルの復号信号を生成して、モノラル復号信号保持部522に出力する。このモノラル復号信号は、モノラル復号信号保持部522に保持される。
拡張レイヤ符号化部520において、第1chCELP符号化部523は、第1ch音声信号に対してCELP符号化を行って第1ch符号化データを出力する。第1chCELP符号化部523は、モノラル信号符号化データ、モノラル復号信号、モノラル駆動音源信号、第2ch音声信号、および、第2ch信号生成部525から入力される第2ch復号信号を用いて、第1ch音声信号に対応する駆動音源信号の予測、および、その予測残差成分に対するCELP符号化を行う。第1chCELP符号化部523は、その予測残差成分に対するCELP音源符号化において、ステレオ信号の各チャネルのチャネル内相関に基づき、適応符号帳探索を行う符号帳を切替える(すなわち、符号化に用いるチャネル内予測を行うチャネルを切替える)。第1chCELP符号化部523の詳細については後述する。
第1ch復号部524は、第1ch符号化データを復号して第1ch復号信号を求め、この第1ch復号信号を第2ch信号生成部525に出力する。
第2ch信号生成部525は、モノラル復号信号と第1ch復号信号とから、上式(3)に従って第2ch復号信号を生成して、第1chCELP符号化部523に出力する。
次いで、第1chCELP符号化部523の詳細について説明する。第1chCELP符号化部523の構成を図7に示す。
図7において、第1chLPC分析部601は、第1ch音声信号に対するLPC分析を行い、得られたLPCパラメータを量子化して第1chLPC予測残差信号生成部602および合成フィルタ615に出力するとともに、第1chLPC量子化符号を第1ch符号化データとして出力する。第1chLPC分析部601では、LPCパラメータの量子化に際し、モノラル信号に対するLPCパラメータと第1ch音声信号から得られるLPCパラメータ(第1chLPCパラメータ)との相関が大きいことを利用して、モノラル信号の符号化データからモノラル信号量子化LPCパラメータを復号し、そのモノラル信号量子化LPCパラメータに対する第1chLPCパラメータの差分成分を量子化することにより効率的な量子化を行う。
第1chLPC予測残差信号生成部602は、第1ch量子化LPCパラメータを用いて、第1ch音声信号に対するLPC予測残差信号を算出してチャネル間予測パラメータ分析部603に出力する。
チャネル間予測パラメータ分析部603は、LPC予測残差信号とモノラル駆動音源信号とから、モノラル信号に対する第1ch音声信号の予測パラメータ(チャネル間予測パラメータ)を求めて量子化し、第1ch駆動音源信号予測部604に出力する。また、チャネル間予測パラメータ分析部603は、チャネル間予測パラメータを量子化および符号化したチャネル間予測パラメータ量子化符号を第1ch符号化データとして出力する。
第1ch駆動音源信号予測部604は、モノラル駆動音源信号および量子化されたチャネル間予測パラメータを用いて、第1ch音声信号に対応する予測駆動音源信号を合成する。この予測駆動音源信号は、乗算器612−1でゲインを乗じられて加算器614に出力される。
ここで、チャネル間予測パラメータ分析部603は、実施の形態1(図1)におけるチャネル間予測パラメータ分析部301に対応し、それらの動作は同様になる。また、第1ch駆動音源信号予測部604は、実施の形態1(図1)におけるチャネル間予測部302に対応し、それらの動作は同様になる。但し、本実施の形態では、モノラル復号信号に対する予測を行って第1ch予測信号を合成するのではなく、モノラル駆動音源信号に対する予測を行って第1chの予測駆動音源信号を合成する点において実施の形態1と異なる。そして、本実施の形態では、その予測駆動音源信号に対する残差成分(予測しきれない誤差成分)の音源信号を、CELP符号化における音源探索により符号化する。
相関度比較部605は、第1ch音声信号から第1chのチャネル内相関を算出するとともに、第2ch音声信号から第2chのチャネル内相関を算出する。そして、相関度比較部605は、第1chのチャネル内相関と第2chのチャネル内相関とを比較して、より大きい相関をもつチャネルを選択する。この選択の結果を示す選択情報は選択部613に出力される。また、この選択情報は、第1ch符号化データとして出力される。
第2chLPC予測残差信号生成部606は、第1ch量子化LPCパラメータおよび第2ch復号信号から第2ch復号信号に対するLPC予測残差信号を生成し、前サブフレーム(第n−1サブフレーム)までの第2chLPC予測残差信号で構成される第2ch適応符号帳607を生成する。
モノラルLPC予測残差信号生成部609は、第1ch量子化LPCパラメータおよびモノラル復号信号からモノラル復号信号に対するLPC予測残差信号(モノラルLPC予測残差信号)を生成して、第1ch信号生成部608に出力する。
第1ch信号生成部608は、歪最小化部618から指示されたインデクスに対応する適応符号帳ラグに基づいて第2ch適応符号帳607から出力される第2chの符号ベクトルVacb_ch2(n)(但し、n=0〜NSUB−1;NSUBはサブフレーム長(CELP音源探索時の区間長単位))と、符号化対象の現サブフレーム(第nサブフレーム)のモノラルLPC予測残差信号Vres_mono(n)とを用いて、上式(1)の関係に基づき、式(6)に従って、第1chの適応音源に対応する符号ベクトルVacb_ch1(n)を算出して適応符号帳ベクトルとして出力する。この符号ベクトルVacb_ch1(n)は、乗算器612−2で適応符号帳ゲインを乗じられて選択部613に出力される。
Figure 2006118178
第1ch適応符号帳610は、歪最小化部618から指示されたインデクスに対応する適応符号帳ラグに基づいて、1サブフレーム分の第1chの符号ベクトルを適応符号帳ベクトルとして乗算器612−3へ出力する。この適応符号帳ベクトルは、乗算器612−3で適応符号帳ゲインを乗じられて選択部613に出力される。
選択部613は、相関度比較部605での選択結果に従って、乗算器612−2から出力される適応符号帳ベクトル、または、乗算器612−3から出力される適応符号帳ベクトルのいずれかを選択して、乗算器612−4に出力する。選択部613は、相関度比較部605により第1chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関より大きい場合)、乗算器612−3から出力される適応符号帳ベクトルを選択し、相関度比較部605により第2chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関以下の場合)、乗算器612−2から出力される適応符号帳ベクトルを選択する。
乗算器612−4は、選択部613から出力された適応符号帳ベクトルに別のゲインを乗じ、加算器614に出力する。
第1ch固定符号帳611は、歪最小化部618から指示されたインデクスに対応する符号ベクトルを固定符号帳ベクトルとして乗算器612−5に出力する。
乗算器612−5は、第1ch固定符号帳611から出力された固定符号帳ベクトルに固定符号帳ゲインを乗じ、乗算器612−6に出力する。
乗算器612−6は、固定符号帳ベクトルに別のゲインを乗じ、加算器614に出力する。
加算器614は、乗算器612−1から出力された予測駆動音源信号と、乗算器612−4から出力された適応符号帳ベクトルと、乗算器612−6から出力された固定符号帳ベクトルとを加算し、加算後の音源ベクトルを駆動音源として合成フィルタ615に出力する。
合成フィルタ615は、第1ch量子化LPCパラメータを用いて、加算器614から出力される音源ベクトルを駆動音源としてLPC合成フィルタによる合成を行い、この合成により得られる合成信号を減算器616に出力する。なお、合成信号のうち第1chの予測駆動音源信号に対応する成分は、実施の形態1(図1)においてチャネル間予測部302から出力される第1ch予測信号に相当する。
減算器616は、合成フィルタ615から出力された合成信号を第1ch音声信号から減算することにより誤差信号を算出し、この誤差信号を聴覚重み付け部617に出力する。この誤差信号が符号化歪みに相当する。
聴覚重み付け部617は、減算器616から出力された符号化歪みに対して聴覚的な重み付けを行い、歪最小化部618へ出力する。
歪最小化部618は、第2ch適応符号帳607、第1ch適応符号帳610および第1ch固定符号帳611に対して、聴覚重み付け部617から出力される符号化歪みを最小とするようなインデクスを決定し、第2ch適応符号帳607、第1ch適応符号帳610および第1ch固定符号帳611が使用するインデクスを指示する。また、歪最小化部618は、それらのインデクスに対応するゲイン(適応符号帳ゲインおよび固定符号帳ゲイン)を生成し、それぞれ乗算器612−2、612−3、612−5へ出力する。
また、歪最小化部618は、第1ch駆動音源信号予測部604から出力される予測駆動音源信号、選択部613から出力される適応符号帳ベクトル、および、乗算器612−5から出力される固定符号帳ベクトル、の3種類の信号間のゲインを調整する各ゲインを生成し、それぞれ乗算器612−1、612−4、612−6に出力する。それら3種類の信号間のゲインを調整する3種類のゲインは、好ましくはそれらのゲイン値間に相互に関係性をもたせて生成することが望ましい。例えば、第1ch音声信号と第2ch音声信号とのチャネル間相関が大きい場合は、予測駆動音源信号の寄与分がゲイン乗算後の適応符号帳ベクトルおよびゲイン乗算後の固定符号帳ベクトルの寄与分に対して相対的に大きくなるように、逆に、チャネル間相関が小さい場合は、予測駆動音源信号の寄与分がゲイン乗算後の適応符号帳ベクトルおよびゲイン乗算後の固定符号帳ベクトルの寄与分に対して相対的に小さくなるようにする。
また、歪最小化部618は、それらのインデクス、それらのインデクスに対応する各ゲインの符号、および、信号間調整用ゲインの符号を第1ch音源符号化データとして出力する。この第1ch音源符号化データは、第1ch符号化データとして出力される。
次いで、図8を用いて、第1chCELP符号化部523の動作について説明する。
まず、第1chのチャネル内相関度cor1および第2chのチャネル内相関度cor2を算出する(ST41)。
次いで、cor1とcor2とを比較して(ST42)、チャネル内相関度がより大きいチャネルの適応符号帳を用いた適応符号帳探索を行う。
すなわち、cor1>cor2の場合は(ST42:YES)、第1ch適応符号帳を用いた適応符号帳探索を行って(ST43)、探索結果を出力する(ST48)。
一方、cor1≦cor2の場合は(ST42:NO)、モノラルLPC予測残差信号を生成し(ST44)、第2chLPC予測残差信号を生成し(ST45)、第2chLPC予測残差信号から第2ch適応符号帳を生成し(ST46)、モノラルLPC予測残差信号と第2ch適応符号帳とを用いた適応符号帳探索を行って(ST47)、探索結果を出力する(ST48)。
このように、本実施の形態によれば、音声符号化に適したCELP符号化を用いるため、実施の形態1に比べ、さらに効率的な符号化を行うことができる。
なお、上記説明では、第1chCELP符号化部523に第1chLPC予測残差信号生成部602、チャネル間予測パラメータ分析部603および第1ch駆動音源信号予測部604を設ける構成について説明したが、第1chCELP符号化部523はこれらの各部を有しない構成を採ることも可能である。この場合、第1chCELP符号化部523では、モノラル駆動音源信号保持部521から出力されたモノラル駆動音源信号に直接ゲインが乗算されて加算器614に出力される。
また、上記説明では、チャネル内相関の大きさに基づいて、第1ch適応符号帳610を用いた適応符号帳探索または第2ch適応符号帳607を用いた適応符号帳探索のいずれかを選択したが、これら双方の適応符号帳探索を行い、符号化対象チャネル(本実施形態では第1ch)の符号化歪みがより小さい方の探索結果を選択してもよい。
上記各実施の形態に係る音声符号化装置、音声復号装置を、移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することも可能である。
また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
本明細書は、2005年4月28日出願の特願2005−132365に基づくものである。この内容はすべてここに含めておく。
本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置の用途に適用できる。
本発明は、音声符号化装置および音声符号化方法に関し、特に、ステレオ音声のための音声符号化装置および音声符号化方法に関する。
移動体通信やIP通信での伝送帯域の広帯域化、サービスの多様化に伴い、音声通信において高音質化、高臨場感化のニーズが高まっている。例えば、今後、テレビ電話サービスにおけるハンズフリー形態での通話、テレビ会議における音声通信、多地点で複数話者が同時に会話を行うような多地点音声通信、臨場感を保持したまま周囲の音環境を伝送できるような音声通信などの需要が増加すると見込まれる。その場合、モノラル信号より臨場感があり、また複数話者の発話位置が認識できるような、ステレオ音声による音声通信を実現することが望まれる。このようなステレオ音声による音声通信を実現するためには、ステレオ音声の符号化が必須となる。
また、IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号化が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データの復号が可能な構成をいう。
よって、ステレオ音声を符号化し伝送する場合にも、ステレオ信号の復号と、符号化データの一部を用いたモノラル信号の復号とを受信側において選択可能な、モノラル−ステレオ間でのスケーラブル構成(モノラル−ステレオ・スケーラブル構成)を有する符号化が望まれる。
このような、モノラル−ステレオ・スケーラブル構成を有する音声符号化方法としては、例えば、チャネル(以下、適宜「ch」と略す)間の信号の予測(第1ch信号から第2ch信号の予測、または、第2ch信号から第1ch信号の予測)を、チャネル相互間のピッチ予測により行う、すなわち、2チャネル間の相関を利用して符号化を行うものがある(非特許文献1参照)。
Ramprashad, S.A., "Stereophonic CELP coding using cross channel prediction", Proc. IEEE Workshop on Speech Coding, pp.136-138, Sep. 2000.
しかしながら、上記非特許文献1記載の音声符号化方法では、双方のチャネル間の相関が小さい場合には、チャネル間の予測性能(予測ゲイン)が低下してしまい、符号化効率が劣化する。
また、モノラル−ステレオ・スケーラブル構成を有する音声符号化方法におけるステレオ拡張レイヤでの符号化にチャネル間の予測を用いた符号化を適用する場合、双方のチャネル間の相関が小さく、かつ、ステレオ拡張レイヤで符号化の対象となるチャネルのチャネル内相関(すなわち、チャネル内の過去の信号と現在の信号との相関度)が小さい場合には、チャネル間の予測のみでは十分な予測性能(予測ゲイン)が得られず符号化効率が劣化する。
本発明の目的は、モノラル−ステレオ・スケーラブル構成を有する音声符号化において、効率的にステレオ音声を符号化することができる音声符号化装置および音声符号化方法
を提供することである。
本発明の音声符号化装置は、モノラル信号のためのコアレイヤの符号化を行う第1符号化手段と、ステレオ信号のための拡張レイヤの符号化を行う第2符号化手段と、を具備し、前記第1符号化手段は、ステレオ信号を構成する第1チャネルの信号および第2チャネルの信号からモノラル信号を生成し、前記第2符号化手段は、前記第1チャネルおよび前記第2チャネルのうち、チャネル内相関がより大きいチャネルのチャネル内予測により生成した予測信号を用いて前記第1チャネルに対する符号化を行う構成を採る。
本発明によれば、効率的にステレオ音声を符号化することができる。
以下、モノラル−ステレオ・スケーラブル構成を有する音声符号化に関する本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
本実施の形態に係る音声符号化装置の構成を図1に示す。図1に示す音声符号化装置100は、モノラル信号のためのコアレイヤ符号化部200とステレオ信号のための拡張レイヤ符号化部300とを備える。なお、以下の説明では、フレーム単位での動作を前提にして説明する。
コアレイヤ符号化部200において、モノラル信号生成部201は、入力される第1ch音声信号s_ch1(n)、第2ch音声信号s_ch2(n)(但し、n=0〜NF-1;NFはフレーム長)から、式(1)に従ってモノラル信号s_mono(n)を生成し、モノラル信号符号化部202に出力する。
Figure 2006118178
モノラル信号符号化部202は、モノラル信号s_mono(n)に対する符号化を行い、このモノラル信号の符号化データをモノラル信号復号部203に出力する。また、このモノラル信号の符号化データは、拡張レイヤ符号化部300から出力される量子化符号、符号化データおよび選択情報と多重されて、符号化データとして、後述する音声復号装置へ伝送される。
モノラル信号復号部203は、モノラル信号の符号化データからモノラルの復号信号を
生成して拡張レイヤ符号化部300に出力する。
拡張レイヤ符号化部300において、チャネル間予測パラメータ分析部301は、第1ch音声信号とモノラル復号信号とから、モノラル信号に対する第1ch音声信号の予測パラメータ(チャネル間予測パラメータ)を求めて量子化し、チャネル間予測部302に出力する。ここでは、チャネル間予測パラメータ分析部301は、チャネル間予測パラメータとして、モノラル信号(モノラル復号信号)に対する第1ch音声信号の遅延差(Dサンプル)および振幅比(g)を求める。また、チャネル間予測パラメータ分析部301は、チャネル間予測パラメータを量子化および符号化したチャネル間予測パラメータ量子化符号を出力する。このチャネル間予測パラメータ量子化符号は、他の量子化符号、符号化データおよび選択情報と多重されて、符号化データとして、後述する音声復号装置へ伝送される。
チャネル間予測部302は、量子化されたチャネル間予測パラメータを用いて、モノラル復号信号から第1ch信号を予測し、この第1ch予測信号(チャネル間予測)を減算器303および第1ch予測残差信号符号化部308に出力する。例えば、チャネル間予測部302は、式(2)で表される予測により、モノラル復号信号sd_mono(n)から、第1ch予測信号sp_ch1(n)を合成する。
Figure 2006118178
相関度比較部304は、第1ch音声信号から第1chのチャネル内相関(第1ch内の過去の信号と現在の信号との相関度)を算出するとともに、第2ch音声信号から第2chのチャネル内相関(第2ch内の過去の信号と現在の信号との相関度)を算出する。各チャネルのチャネル内相関としては、例えば、対応する音声信号に対する正規化最大自己相関係数値、対応する音声信号に対するピッチ予測ゲイン値、対応する音声信号から求められるLPC予測残差信号に対する正規化最大自己相関係数値、対応する音声信号から求められるLPC予測残差信号に対するピッチ予測ゲイン値などを用いることができる。そして、相関度比較部304は、第1chのチャネル内相関と第2chのチャネル内相関とを比較して、より大きい相関をもつチャネルを選択する。この選択の結果を示す選択情報は選択部305、306に出力される。また、この選択情報は、量子化符号および符号化データと多重されて、符号化データとして、後述する音声復号装置へ伝送される。
第1ch内予測部307は、第1ch音声信号と、第1ch予測残差信号符号化部308から入力される第1ch復号信号とから、第1chでのチャネル内予測により、第1ch信号を予測して、この第1ch予測信号を選択部305に出力する。また、第1ch内予測部307は、第1chでのチャネル内予測に必要なチャネル内予測パラメータの量子化により得られる第1chのチャネル内予測パラメータ量子化符号を選択部306に出力する。なお、チャネル内予測の詳細については後述する。
第2ch信号生成部309は、モノラル信号復号部203から入力されるモノラル復号信号と、第1ch予測残差信号符号化部308から入力される第1ch復号信号とから、上式(1)の関係に基づいて、第2ch復号信号を生成する。つまり、第2ch信号生成部309は、モノラル復号信号sd_mono(n)と第1ch復号信号sd_ch1(n)とから、式(3)に従って第2ch復号信号sd_ch2(n)を生成して、第2ch内予測部310に出力する。
Figure 2006118178
第2ch内予測部310は、第2ch音声信号と第2ch復号信号とから、第2chでのチャネル内予測により、第2ch信号を予測して、この第2ch予測信号を第1ch信号生成部311に出力する。また、第2ch内予測部310は、第2chでのチャネル内予測に必要なチャネル内予測パラメータの量子化により得られる第2chのチャネル内予測パラメータ量子化符号を選択部306に出力する。なお、チャネル内予測の詳細については後述する。
第1ch信号生成部311は、第2ch予測信号と、モノラル信号復号部203から入力されるモノラル復号信号とから、上式(1)の関係に基づいて、第1ch予測信号を生成する。つまり、第1ch信号生成部311は、モノラル復号信号sd_mono(n)と第2ch予測信号s_ch2_p(n)とから、式(4)に従って第1ch予測信号s_ch1_p(n)を生成して、選択部305に出力する。
Figure 2006118178
選択部305は、相関度比較部304での選択結果に従って、第1ch内予測部307から出力される第1ch予測信号、または、第1ch信号生成部311から出力される第1ch予測信号のいずれかを選択して、減算器303および第1ch予測残差信号符号化部308に出力する。選択部305は、相関度比較部304により第1chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関より大きい場合)、第1ch内予測部307から出力される第1ch予測信号を選択し、相関度比較部304により第2chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関以下の場合)、第1ch信号生成部311から出力される第1ch予測信号を選択する。
選択部306は、相関度比較部304での選択結果に従って、第1ch内予測部307から出力される第1chのチャネル内予測パラメータ量子化符号、または、第2ch内予測部310から出力される第2chのチャネル内予測パラメータ量子化符号のいずれかを選択して、チャネル内予測パラメータ量子化符号として出力する。このチャネル内予測パラメータ量子化符号は、他の量子化符号、符号化データおよび選択情報と多重されて、符号化データとして、後述する音声復号装置へ伝送される。
具体的には、選択部306は、相関度比較部304により第1chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関より大きい場合)、第1ch内予測部307から出力される第1chのチャネル内予測パラメータ量子化符号を選択し、相関度比較部304により第2chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関以下の場合)、第2ch内予測部310から出力される第2chのチャネル内予測パラメータ量子化符号を選択する。
減算器303は、入力信号である第1ch音声信号と第1ch予測信号との残差信号(第1ch予測残差信号)、すなわち、チャネル間予測部302から出力された第1ch予
測信号と、選択部305から出力された第1ch予測信号とを、第1ch音声信号から差し引いた残りの信号を求め、第1ch予測残差信号符号化部308に出力する。
第1ch予測残差信号符号化部308は、第1ch予測残差信号を符号化した第1ch予測残差符号化データを出力する。この第1ch予測残差符号化データは、他の符号化データ、量子化符号および選択情報と多重されて、符号化データとして、後述する音声復号装置へ伝送される。また、第1ch予測残差信号符号化部308は、第1ch予測残差符号化データを復号した信号と、チャネル間予測部302から出力された第1ch予測信号と、選択部305から出力された第1ch予測信号とを加算して、第1ch復号信号を求め、この第1ch復号信号を第1ch内予測部307および第2ch信号生成部309に出力する。
ここで、第1ch内予測部307および第2ch内予測部310は、各チャネル内の信号の相関性を利用して、過去の信号から符号化対象フレームの信号を予測するチャネル内予測を行う。例えば、1次のピッチ予測フィルタを用いる場合は、チャネル内予測により予測される各チャネルの信号は式(5)で表される。ここで、Sp(n)は各チャネルの予測信号、s(n)は各チャネルの復号信号(第1ch復号信号または第2ch復号信号)である。また、Tおよびgpは、各チャネルの復号信号と各チャネルの入力信号(第1ch音声信号または第2ch音声信号)とから求められる、1次のピッチ予測フィルタのラグおよび予測係数であり、これらはチャネル内予測パラメータを構成する。
Figure 2006118178
次いで、図2〜4を用いて、拡張レイヤ符号化部300の動作について説明する。
まず、第1chのチャネル内相関度cor1および第2chのチャネル内相関度cor2を算出する(ST11)。
次いで、cor1とcor2とを比較して(ST12)、チャネル内相関度がより大きいチャネルでのチャネル内予測を用いる。
すなわち、cor1>cor2の場合は(ST12:YES)、第1chでのチャネル内予測を行って求めた第1ch予測信号を符号化対象として選択する。具体的には、図3に示すように、第n−1フレームの第1ch復号信号21から上式(5)に従って第nフレームの第1ch信号22を予測し(ST13)、このようにして予測した第1ch予測信号22を符号化対象として選択部305から出力する(ST17)。つまり、cor1>cor2の場合は、第1ch復号信号から第1ch信号を直接的に予測する。
一方、cor1≦cor2の場合は(ST12:NO)、第2ch復号信号を生成し(ST14)、第2chでのチャネル内予測を行って第2チャネル予測信号を求め(ST15)、第2ch予測信号とモノラル復号信号とから第1ch予測信号を求め(ST16)、このようにして求めた第1ch予測信号を符号化対象として選択部305から出力する(ST17)。具体的には、図4に示すように、第n−1フレームの第1ch復号信号31および第n−1フレームのモノラル復号信号32から、上式(3)に従って、第n−1フレームの第2ch復号信号を生成する。次いで、第n−1フレームの第2ch復号信号33から上式(5)に従って第nフレームの第2ch信号34を予測する。次いで、第nフレームの第2ch予測信号34および第nフレームのモノラル復号信号35から、上式(4)に
従って、第nフレームの第1ch予測信号36を生成する。そして、このようにして予測した第1ch予測信号36を符号化対象として選択する。つまり、cor1≦cor2の場合は、第2ch予測信号とモノラル復号信号とから、第1ch信号を間接的に予測する。
次いで、本実施の形態に係る音声復号装置について説明する。本実施の形態に係る音声復号装置の構成を図5に示す。図5に示す音声復号装置400は、モノラル信号のためのコアレイヤ復号部410と、ステレオ信号のための拡張レイヤ復号部420とを備える。
モノラル信号復号部411は、入力されるモノラル信号の符号化データを復号し、モノラル復号信号を拡張レイヤ復号部420に出力するとともに、最終出力として出力する。
チャネル間予測パラメータ復号部421は、入力されるチャネル間予測パラメータ量子化符号を復号してチャネル間予測部422に出力する。
チャネル間予測部422は、量子化されたチャネル間予測パラメータを用いて、モノラル復号信号から第1ch信号を予測し、この第1ch予測信号(チャネル間予測)を加算器423に出力する。例えば、チャネル間予測部422は、上式(2)で表される予測により、モノラル復号信号sd_mono(n)から、第1ch予測信号sp_ch1(n)を合成する。
第1ch予測残差信号復号部424は、入力される第1ch予測残差符号化データを復号して加算器423に出力する。
加算器423は、チャネル間予測部422から出力される第1ch予測信号と、第1ch予測残差信号復号部424から出力される第1ch予測残差信号と、選択部426から出力される第1ch予測信号とを加算して、第1ch復号信号を求め、この第1ch復号信号を、第1ch内予測部425および第2ch信号生成部427に出力するとともに、最終出力として出力する。
第1ch内予測部425は、第1ch復号信号と、第1chのチャネル内予測パラメータ量子化符号とから、上記同様のチャネル内予測により第1ch信号を予測して、この第1ch予測信号を選択部426に出力する。
第2ch信号生成部427は、モノラル復号信号と第1ch復号信号とから、上式(3)に従って第2ch復号信号を生成して、第2ch内予測部428に出力する。
第2ch内予測部428は、第2ch復号信号と、第2chのチャネル内予測パラメータ量子化符号とから、上記同様のチャネル内予測により第2ch信号を予測して、この第2ch予測信号を第1ch信号生成部429に出力する。
第1ch信号生成部429は、モノラル復号信号と第2ch予測信号とから、上式(4)に従って第1ch予測信号を生成して、選択部426に出力する。
選択部426は、選択情報が示す選択結果に従って、第1ch内予測部425から出力される第1ch予測信号、または、第1ch信号生成部429から出力される第1ch予測信号のいずれかを選択して、加算器423に出力する。選択部426は、図1の音声符号化装置100にて第1chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関より大きい場合)、第1ch内予測部425から出力される第1ch予測信号を選択し、音声符号化装置100にて第2chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関以下の場合)、第1ch信号生成部429から出力される第1ch予測信号を選択する。
このような構成を採る音声復号装置400では、モノラル−ステレオ・スケーラブル構成において、出力音声をモノラルとする場合は、モノラル信号の符号化データのみから得られる復号信号をモノラル復号信号として出力し、出力音声をステレオとする場合は、受信される符号化データおよび量子化符号のすべてを用いて第1ch復号信号および第2ch復号信号を復号して出力する。
このように、本実施の形態では、チャネル内相関がより大きいチャネルでのチャネル内予測により求めた予測信号を用いて拡張レイヤでの符号化を行うため、符号化対象チャネル(本実施形態では第1ch)の符号化対象フレームにおけるチャネル内相関(チャネル内予測性能)が小さく予測が有効に行えない場合でも、他方のチャネル(本実施形態では第2ch)のチャネル内相関が大きい場合には、その他方のチャネルでのチャネル内予測により求めた予測信号を用いて符号化対象チャネルの信号を予測することができるため、符号化対象チャネルのチャネル内相関が小さい場合でも、十分な予測性能(予測ゲイン)を得ることができ、その結果、符号化効率の劣化を防ぐことができる。
なお、上記説明では、拡張レイヤ符号化部300にチャネル間予測パラメータ分析部301およびチャネル間予測部302を設ける構成について説明したが、拡張レイヤ符号化部300はこれらの各部を有しない構成を採ることも可能である。この場合、拡張レイヤ符号化部300では、コアレイヤ符号化部200から出力されたモノラル復号信号が直接減算器303に入力され、減算器303は、第1ch音声信号からモノラル復号信号および第1ch予測信号を減算して予測残差信号を求める。
また、上記説明では、チャネル内相関の大きさに基づいて、第1chでのチャネル内予測により直接求めた第1ch予測信号(直接的予測)、または、第2chでのチャネル内予測により求めた第2ch予測信号から間接的に求めた第1ch予測信号(間接的予測)のいずれかを選択したが、符号化対象チャネルである第1chのチャネル内予測誤差(すなわち、入力信号である第1ch音声信号に対する第1ch予測信号の誤差)が小さい方の第1ch予測信号を選択してもよい。または、双方の第1ch予測信号を用いて拡張レイヤでの符号化を行い、その結果生じる符号化歪みがより小さい方の第1ch予測信号を選択してもよい。
(実施の形態2)
図6に本実施の形態に係る音声符号化装置500の構成を示す。
コアレイヤ符号化部510において、モノラル信号生成部511は、上式(1)に従ってモノラル信号を生成し、モノラル信号CELP符号化部512に出力する。
モノラル信号CELP符号化部512は、モノラル信号生成部511で生成されたモノラル信号に対してCELP符号化を行い、モノラル信号符号化データ、および、CELP符号化によって得られるモノラル駆動音源信号を出力する。モノラル信号符号化データは、モノラル信号復号部513に出力されるとともに、第1ch符号化データと多重されて音声復号装置へ伝送される。また、モノラル駆動音源信号は、モノラル駆動音源信号保持部521に保持される。
モノラル信号復号部513は、モノラル信号の符号化データからモノラルの復号信号を生成して、モノラル復号信号保持部522に出力する。このモノラル復号信号は、モノラル復号信号保持部522に保持される。
拡張レイヤ符号化部520において、第1chCELP符号化部523は、第1ch音
声信号に対してCELP符号化を行って第1ch符号化データを出力する。第1chCELP符号化部523は、モノラル信号符号化データ、モノラル復号信号、モノラル駆動音源信号、第2ch音声信号、および、第2ch信号生成部525から入力される第2ch復号信号を用いて、第1ch音声信号に対応する駆動音源信号の予測、および、その予測残差成分に対するCELP符号化を行う。第1chCELP符号化部523は、その予測残差成分に対するCELP音源符号化において、ステレオ信号の各チャネルのチャネル内相関に基づき、適応符号帳探索を行う符号帳を切替える(すなわち、符号化に用いるチャネル内予測を行うチャネルを切替える)。第1chCELP符号化部523の詳細については後述する。
第1ch復号部524は、第1ch符号化データを復号して第1ch復号信号を求め、この第1ch復号信号を第2ch信号生成部525に出力する。
第2ch信号生成部525は、モノラル復号信号と第1ch復号信号とから、上式(3)に従って第2ch復号信号を生成して、第1chCELP符号化部523に出力する。
次いで、第1chCELP符号化部523の詳細について説明する。第1chCELP符号化部523の構成を図7に示す。
図7において、第1chLPC分析部601は、第1ch音声信号に対するLPC分析を行い、得られたLPCパラメータを量子化して第1chLPC予測残差信号生成部602および合成フィルタ615に出力するとともに、第1chLPC量子化符号を第1ch符号化データとして出力する。第1chLPC分析部601では、LPCパラメータの量子化に際し、モノラル信号に対するLPCパラメータと第1ch音声信号から得られるLPCパラメータ(第1chLPCパラメータ)との相関が大きいことを利用して、モノラル信号の符号化データからモノラル信号量子化LPCパラメータを復号し、そのモノラル信号量子化LPCパラメータに対する第1chLPCパラメータの差分成分を量子化することにより効率的な量子化を行う。
第1chLPC予測残差信号生成部602は、第1ch量子化LPCパラメータを用いて、第1ch音声信号に対するLPC予測残差信号を算出してチャネル間予測パラメータ分析部603に出力する。
チャネル間予測パラメータ分析部603は、LPC予測残差信号とモノラル駆動音源信号とから、モノラル信号に対する第1ch音声信号の予測パラメータ(チャネル間予測パラメータ)を求めて量子化し、第1ch駆動音源信号予測部604に出力する。また、チャネル間予測パラメータ分析部603は、チャネル間予測パラメータを量子化および符号化したチャネル間予測パラメータ量子化符号を第1ch符号化データとして出力する。
第1ch駆動音源信号予測部604は、モノラル駆動音源信号および量子化されたチャネル間予測パラメータを用いて、第1ch音声信号に対応する予測駆動音源信号を合成する。この予測駆動音源信号は、乗算器612−1でゲインを乗じられて加算器614に出力される。
ここで、チャネル間予測パラメータ分析部603は、実施の形態1(図1)におけるチャネル間予測パラメータ分析部301に対応し、それらの動作は同様になる。また、第1ch駆動音源信号予測部604は、実施の形態1(図1)におけるチャネル間予測部302に対応し、それらの動作は同様になる。但し、本実施の形態では、モノラル復号信号に対する予測を行って第1ch予測信号を合成するのではなく、モノラル駆動音源信号に対する予測を行って第1chの予測駆動音源信号を合成する点において実施の形態1と異な
る。そして、本実施の形態では、その予測駆動音源信号に対する残差成分(予測しきれない誤差成分)の音源信号を、CELP符号化における音源探索により符号化する。
相関度比較部605は、第1ch音声信号から第1chのチャネル内相関を算出するとともに、第2ch音声信号から第2chのチャネル内相関を算出する。そして、相関度比較部605は、第1chのチャネル内相関と第2chのチャネル内相関とを比較して、より大きい相関をもつチャネルを選択する。この選択の結果を示す選択情報は選択部613に出力される。また、この選択情報は、第1ch符号化データとして出力される。
第2chLPC予測残差信号生成部606は、第1ch量子化LPCパラメータおよび第2ch復号信号から第2ch復号信号に対するLPC予測残差信号を生成し、前サブフレーム(第n−1サブフレーム)までの第2chLPC予測残差信号で構成される第2ch適応符号帳607を生成する。
モノラルLPC予測残差信号生成部609は、第1ch量子化LPCパラメータおよびモノラル復号信号からモノラル復号信号に対するLPC予測残差信号(モノラルLPC予測残差信号)を生成して、第1ch信号生成部608に出力する。
第1ch信号生成部608は、歪最小化部618から指示されたインデクスに対応する適応符号帳ラグに基づいて第2ch適応符号帳607から出力される第2chの符号ベクトルVacb_ch2(n)(但し、n=0〜NSUB-1;NSUBはサブフレーム長(CELP音源探索時の区間長単位))と、符号化対象の現サブフレーム(第nサブフレーム)のモノラルLPC予測残差信号Vres_mono(n)とを用いて、上式(1)の関係に基づき、式(6)に従って、第1chの適応音源に対応する符号ベクトルVacb_ch1(n)を算出して適応符号帳ベクトルとして出力する。この符号ベクトルVacb_ch1(n)は、乗算器612−2で適応符号帳ゲインを乗じられて選択部613に出力される。
Figure 2006118178
第1ch適応符号帳610は、歪最小化部618から指示されたインデクスに対応する適応符号帳ラグに基づいて、1サブフレーム分の第1chの符号ベクトルを適応符号帳ベクトルとして乗算器612−3へ出力する。この適応符号帳ベクトルは、乗算器612−3で適応符号帳ゲインを乗じられて選択部613に出力される。
選択部613は、相関度比較部605での選択結果に従って、乗算器612−2から出力される適応符号帳ベクトル、または、乗算器612−3から出力される適応符号帳ベクトルのいずれかを選択して、乗算器612−4に出力する。選択部613は、相関度比較部605により第1chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関より大きい場合)、乗算器612−3から出力される適応符号帳ベクトルを選択し、相関度比較部605により第2chが選択された場合(つまり、第1chのチャネル内相関が第2chのチャネル内相関以下の場合)、乗算器612−2から出力される適応符号帳ベクトルを選択する。
乗算器612−4は、選択部613から出力された適応符号帳ベクトルに別のゲインを乗じ、加算器614に出力する。
第1ch固定符号帳611は、歪最小化部618から指示されたインデクスに対応する
符号ベクトルを固定符号帳ベクトルとして乗算器612−5に出力する。
乗算器612−5は、第1ch固定符号帳611から出力された固定符号帳ベクトルに固定符号帳ゲインを乗じ、乗算器612−6に出力する。
乗算器612−6は、固定符号帳ベクトルに別のゲインを乗じ、加算器614に出力する。
加算器614は、乗算器612−1から出力された予測駆動音源信号と、乗算器612−4から出力された適応符号帳ベクトルと、乗算器612−6から出力された固定符号帳ベクトルとを加算し、加算後の音源ベクトルを駆動音源として合成フィルタ615に出力する。
合成フィルタ615は、第1ch量子化LPCパラメータを用いて、加算器614から出力される音源ベクトルを駆動音源としてLPC合成フィルタによる合成を行い、この合成により得られる合成信号を減算器616に出力する。なお、合成信号のうち第1chの予測駆動音源信号に対応する成分は、実施の形態1(図1)においてチャネル間予測部302から出力される第1ch予測信号に相当する。
減算器616は、合成フィルタ615から出力された合成信号を第1ch音声信号から減算することにより誤差信号を算出し、この誤差信号を聴覚重み付け部617に出力する。この誤差信号が符号化歪みに相当する。
聴覚重み付け部617は、減算器616から出力された符号化歪みに対して聴覚的な重み付けを行い、歪最小化部618へ出力する。
歪最小化部618は、第2ch適応符号帳607、第1ch適応符号帳610および第1ch固定符号帳611に対して、聴覚重み付け部617から出力される符号化歪みを最小とするようなインデクスを決定し、第2ch適応符号帳607、第1ch適応符号帳610および第1ch固定符号帳611が使用するインデクスを指示する。また、歪最小化部618は、それらのインデクスに対応するゲイン(適応符号帳ゲインおよび固定符号帳ゲイン)を生成し、それぞれ乗算器612−2、612−3、612−5へ出力する。
また、歪最小化部618は、第1ch駆動音源信号予測部604から出力される予測駆動音源信号、選択部613から出力される適応符号帳ベクトル、および、乗算器612−5から出力される固定符号帳ベクトル、の3種類の信号間のゲインを調整する各ゲインを生成し、それぞれ乗算器612−1、612−4、612−6に出力する。それら3種類の信号間のゲインを調整する3種類のゲインは、好ましくはそれらのゲイン値間に相互に関係性をもたせて生成することが望ましい。例えば、第1ch音声信号と第2ch音声信号とのチャネル間相関が大きい場合は、予測駆動音源信号の寄与分がゲイン乗算後の適応符号帳ベクトルおよびゲイン乗算後の固定符号帳ベクトルの寄与分に対して相対的に大きくなるように、逆に、チャネル間相関が小さい場合は、予測駆動音源信号の寄与分がゲイン乗算後の適応符号帳ベクトルおよびゲイン乗算後の固定符号帳ベクトルの寄与分に対して相対的に小さくなるようにする。
また、歪最小化部618は、それらのインデクス、それらのインデクスに対応する各ゲインの符号、および、信号間調整用ゲインの符号を第1ch音源符号化データとして出力する。この第1ch音源符号化データは、第1ch符号化データとして出力される。
次いで、図8を用いて、第1chCELP符号化部523の動作について説明する。
まず、第1chのチャネル内相関度cor1および第2chのチャネル内相関度cor2を算出する(ST41)。
次いで、cor1とcor2とを比較して(ST42)、チャネル内相関度がより大きいチャネルの適応符号帳を用いた適応符号帳探索を行う。
すなわち、cor1>cor2の場合は(ST42:YES)、第1ch適応符号帳を用いた適応符号帳探索を行って(ST43)、探索結果を出力する(ST48)。
一方、cor1≦cor2の場合は(ST42:NO)、モノラルLPC予測残差信号を生成し(ST44)、第2chLPC予測残差信号を生成し(ST45)、第2chLPC予測残差信号から第2ch適応符号帳を生成し(ST46)、モノラルLPC予測残差信号と第2ch適応符号帳とを用いた適応符号帳探索を行って(ST47)、探索結果を出力する(ST48)。
このように、本実施の形態によれば、音声符号化に適したCELP符号化を用いるため、実施の形態1に比べ、さらに効率的な符号化を行うことができる。
なお、上記説明では、第1chCELP符号化部523に第1chLPC予測残差信号生成部602、チャネル間予測パラメータ分析部603および第1ch駆動音源信号予測部604を設ける構成について説明したが、第1chCELP符号化部523はこれらの各部を有しない構成を採ることも可能である。この場合、第1chCELP符号化部523では、モノラル駆動音源信号保持部521から出力されたモノラル駆動音源信号に直接ゲインが乗算されて加算器614に出力される。
また、上記説明では、チャネル内相関の大きさに基づいて、第1ch適応符号帳610を用いた適応符号帳探索または第2ch適応符号帳607を用いた適応符号帳探索のいずれかを選択したが、これら双方の適応符号帳探索を行い、符号化対象チャネル(本実施形態では第1ch)の符号化歪みがより小さい方の探索結果を選択してもよい。
上記各実施の形態に係る音声符号化装置、音声復号装置を、移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することも可能である。
また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
本明細書は、2005年4月28日出願の特願2005−132365に基づくものである。この内容はすべてここに含めておく。
本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置の用途に適用できる。
本発明の実施の形態1に係る音声符号化装置の構成を示すブロック図 本発明の実施の形態1に係る拡張レイヤ符号化部の動作フロー図 本発明の実施の形態1に係る拡張レイヤ符号化部の動作概念図 本発明の実施の形態1に係る拡張レイヤ符号化部の動作概念図 本発明の実施の形態1に係る音声復号装置の構成を示すブロック図 本発明の実施の形態2に係る音声符号化装置の構成を示すブロック図 本発明の実施の形態2に係る第1chCELP符号化部の構成を示すブロック図 本発明の実施の形態2に係る第1chCELP符号化部の動作フロー図

Claims (5)

  1. モノラル信号のためのコアレイヤの符号化を行う第1符号化手段と、
    ステレオ信号のための拡張レイヤの符号化を行う第2符号化手段と、を具備し、
    前記第1符号化手段は、ステレオ信号を構成する第1チャネルの信号および第2チャネルの信号からモノラル信号を生成し、
    前記第2符号化手段は、前記第1チャネルおよび前記第2チャネルのうち、チャネル内相関がより大きいチャネルのチャネル内予測により生成した予測信号を用いて前記第1チャネルに対する符号化を行う、
    音声符号化装置。
  2. 前記第2符号化手段は、
    前記第2チャネルのチャネル相関がより大きい場合は、前記第2チャネルのチャネル内予測により生成した予測信号と、前記モノラル信号とから前記第1チャネルの信号を予測する、
    請求項1記載の音声符号化装置。
  3. 請求項1記載の音声符号化装置を具備する無線通信移動局装置。
  4. 請求項1記載の音声符号化装置を具備する無線通信基地局装置。
  5. モノラル信号のためのコアレイヤの符号化とステレオ信号のための拡張レイヤの符号化とを行う音声符号化方法であって、
    前記コアレイヤにおいて、ステレオ信号を構成する第1チャネルの信号および第2チャネルの信号からモノラル信号を生成し、
    前記拡張レイヤにおいて、前記第1チャネルおよび前記第2チャネルのうち、チャネル内相関がより大きいチャネルのチャネル内予測により生成した予測信号を用いて前記第1チャネルに対する符号化を行う、
    音声符号化方法。
JP2007514798A 2005-04-28 2006-04-27 音声符号化装置および音声符号化方法 Expired - Fee Related JP4850827B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007514798A JP4850827B2 (ja) 2005-04-28 2006-04-27 音声符号化装置および音声符号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005132365 2005-04-28
JP2005132365 2005-04-28
PCT/JP2006/308811 WO2006118178A1 (ja) 2005-04-28 2006-04-27 音声符号化装置および音声符号化方法
JP2007514798A JP4850827B2 (ja) 2005-04-28 2006-04-27 音声符号化装置および音声符号化方法

Publications (2)

Publication Number Publication Date
JPWO2006118178A1 true JPWO2006118178A1 (ja) 2008-12-18
JP4850827B2 JP4850827B2 (ja) 2012-01-11

Family

ID=37307976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007514798A Expired - Fee Related JP4850827B2 (ja) 2005-04-28 2006-04-27 音声符号化装置および音声符号化方法

Country Status (7)

Country Link
US (1) US8433581B2 (ja)
EP (1) EP1876585B1 (ja)
JP (1) JP4850827B2 (ja)
KR (1) KR101259203B1 (ja)
CN (1) CN101167124B (ja)
DE (1) DE602006014957D1 (ja)
WO (1) WO2006118178A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200705386A (en) * 2005-01-11 2007-02-01 Agency Science Tech & Res Encoder, decoder, method for encoding/decoding, computer readable media and computer program elements
US8150702B2 (en) * 2006-08-04 2012-04-03 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
KR101412255B1 (ko) * 2006-12-13 2014-08-14 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치, 복호 장치 및 이들의 방법
US20100049508A1 (en) * 2006-12-14 2010-02-25 Panasonic Corporation Audio encoding device and audio encoding method
US20100100372A1 (en) * 2007-01-26 2010-04-22 Panasonic Corporation Stereo encoding device, stereo decoding device, and their method
BRPI0808202A8 (pt) * 2007-03-02 2016-11-22 Panasonic Corp Dispositivo de codificação e método de codificação.
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
WO2008108076A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 符号化装置および符号化方法
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP5355387B2 (ja) 2007-03-30 2013-11-27 パナソニック株式会社 符号化装置および符号化方法
CN101842832B (zh) * 2007-10-31 2012-11-07 松下电器产业株式会社 编码装置和解码装置
WO2009084226A1 (ja) * 2007-12-28 2009-07-09 Panasonic Corporation ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
EP2144228A1 (en) 2008-07-08 2010-01-13 Siemens Medical Instruments Pte. Ltd. Method and device for low-delay joint-stereo coding
JP5340378B2 (ja) 2009-02-26 2013-11-13 パナソニック株式会社 チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN102428512A (zh) * 2009-06-02 2012-04-25 松下电器产业株式会社 下混装置、编码装置以及其方法
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
WO2017109865A1 (ja) * 2015-12-22 2017-06-29 三菱電機株式会社 データ圧縮装置、データ伸長装置、データ圧縮プログラム、データ伸長プログラム、データ圧縮方法及びデータ伸長方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5274740A (en) * 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
DE19526366A1 (de) * 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
JP3622365B2 (ja) 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JP3887827B2 (ja) * 1997-04-10 2007-02-28 ソニー株式会社 符号化方法及び装置、復号化方法及び装置、並びに記録媒体
JPH1132399A (ja) * 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
US6356211B1 (en) * 1997-05-13 2002-03-12 Sony Corporation Encoding method and apparatus and recording medium
US5924062A (en) * 1997-07-01 1999-07-13 Nokia Mobile Phones ACLEP codec with modified autocorrelation matrix storage and search
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6961432B1 (en) * 1999-04-29 2005-11-01 Agere Systems Inc. Multidescriptive coding technique for multistream communication of signals
JP3335605B2 (ja) * 2000-03-13 2002-10-21 日本電信電話株式会社 ステレオ信号符号化方法
SE519985C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US6614365B2 (en) * 2000-12-14 2003-09-02 Sony Corporation Coding device and method, decoding device and method, and recording medium
JP3951690B2 (ja) * 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
US6934676B2 (en) * 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
KR100711989B1 (ko) * 2002-03-12 2007-05-02 노키아 코포레이션 효율적으로 개선된 스케일러블 오디오 부호화
US20030231799A1 (en) * 2002-06-14 2003-12-18 Craig Schmidt Lossless data compression using constraint propagation
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
DE602005022235D1 (de) * 2004-05-19 2010-08-19 Panasonic Corp Audiosignalkodierer und Audiosignaldekodierer
WO2006000952A1 (en) * 2004-06-21 2006-01-05 Koninklijke Philips Electronics N.V. Method and apparatus to encode and decode multi-channel audio signals
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
BRPI0516739A (pt) * 2004-09-30 2008-09-23 Matsushita Electric Ind Co Ltd dispositivo de codificação escalável, dispositivo de decodificação escalável, e método dos mesmos
TW200705386A (en) * 2005-01-11 2007-02-01 Agency Science Tech & Res Encoder, decoder, method for encoding/decoding, computer readable media and computer program elements
US20100023575A1 (en) * 2005-03-11 2010-01-28 Agency For Science, Technology And Research Predictor
WO2006103586A1 (en) * 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US8180631B2 (en) * 2005-07-11 2012-05-15 Lg Electronics Inc. Apparatus and method of processing an audio signal, utilizing a unique offset associated with each coded-coefficient

Also Published As

Publication number Publication date
EP1876585B1 (en) 2010-06-16
KR20080003839A (ko) 2008-01-08
CN101167124A (zh) 2008-04-23
EP1876585A4 (en) 2008-05-21
JP4850827B2 (ja) 2012-01-11
CN101167124B (zh) 2011-09-21
DE602006014957D1 (de) 2010-07-29
EP1876585A1 (en) 2008-01-09
US8433581B2 (en) 2013-04-30
US20090076809A1 (en) 2009-03-19
WO2006118178A1 (ja) 2006-11-09
KR101259203B1 (ko) 2013-04-29

Similar Documents

Publication Publication Date Title
JP4850827B2 (ja) 音声符号化装置および音声符号化方法
JP5046652B2 (ja) 音声符号化装置および音声符号化方法
JP5046653B2 (ja) 音声符号化装置および音声符号化方法
JP4907522B2 (ja) 音声符号化装置および音声符号化方法
JP5413839B2 (ja) 符号化装置および復号装置
JP4963965B2 (ja) スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法
JP5153791B2 (ja) ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
JP4555299B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP4887279B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP4948401B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JPWO2010016270A1 (ja) 量子化装置、符号化装置、量子化方法及び符号化方法
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110927

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111019

R150 Certificate of patent or registration of utility model

Ref document number: 4850827

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees