JP4871894B2 - 符号化装置、復号装置、符号化方法および復号方法 - Google Patents

符号化装置、復号装置、符号化方法および復号方法 Download PDF

Info

Publication number
JP4871894B2
JP4871894B2 JP2008045259A JP2008045259A JP4871894B2 JP 4871894 B2 JP4871894 B2 JP 4871894B2 JP 2008045259 A JP2008045259 A JP 2008045259A JP 2008045259 A JP2008045259 A JP 2008045259A JP 4871894 B2 JP4871894 B2 JP 4871894B2
Authority
JP
Japan
Prior art keywords
layer
encoding
gain
unit
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008045259A
Other languages
English (en)
Other versions
JP2009042734A (ja
Inventor
正浩 押切
利幸 森井
智史 山梨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2008045259A priority Critical patent/JP4871894B2/ja
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to MYPI20093440 priority patent/MY147075A/en
Priority to SG2012005948A priority patent/SG178727A1/en
Priority to BRPI0808428A priority patent/BRPI0808428A8/pt
Priority to EP08710511.0A priority patent/EP2128857B1/en
Priority to PCT/JP2008/000408 priority patent/WO2008120440A1/ja
Priority to AU2008233888A priority patent/AU2008233888B2/en
Priority to CN201410119876.8A priority patent/CN103903626B/zh
Priority to CN200880006787.5A priority patent/CN101622662B/zh
Priority to US12/528,659 priority patent/US8554549B2/en
Priority to KR1020097018303A priority patent/KR101414354B1/ko
Priority to SG2012005971A priority patent/SG178728A1/en
Priority to CN201210004224.0A priority patent/CN102411933B/zh
Priority to RU2009132934/08A priority patent/RU2471252C2/ru
Publication of JP2009042734A publication Critical patent/JP2009042734A/ja
Publication of JP4871894B2 publication Critical patent/JP4871894B2/ja
Application granted granted Critical
Priority to RU2012135697/08A priority patent/RU2579663C2/ru
Priority to RU2012135696/08A priority patent/RU2579662C2/ru
Priority to US13/965,644 priority patent/US8918315B2/en
Priority to US13/965,634 priority patent/US8918314B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Description

本発明は、音声信号等の入力信号を符号化して伝送する通信システムに用いられる符号化装置、復号装置、符号化方法および復号方法に関する。
移動体通信システムでは、電波資源等の有効利用のために、音声信号を低ビットレートに圧縮して伝送することが要求されている。その一方で、通話音声の品質向上や臨場感の高い通話サービスの実現も望まれており、その実現には、音声信号の高品質化のみならず、より帯域の広いオーディオ信号等、音声信号以外の信号をも高品質に符号化することが望ましい。
このように相反する2つの要求に対し、複数の符号化技術を階層的に統合する技術が有望視されている。この技術は、音声信号に適したモデルで入力信号を低ビットレートで符号化する基本レイヤと、入力信号と基本レイヤの復号信号との差分信号を音声以外の信号にも適したモデルで符号化する拡張レイヤとを階層的に組み合わせるものである。このように階層的に符号化を行う技術は、符号化装置から得られるビットストリームにスケーラビリティ性、すなわち、ビットストリームの一部の情報からでも復号信号を得ることができる性質を有するため、一般的にスケーラブル符号化(階層符号化)と呼ばれている。
スケーラブル符号化方式は、その性質から、ビットレートの異なるネットワーク間の通信に柔軟に対応することができるので、IP(Internet Protocol)で多様なネットワークが統合されていく今後のネットワーク環境に適したものと言える。
MPEG−4(Moving Picture Experts Group phase-4)で規格化された技術を用いてスケーラブル符号化を実現する例として、例えば、非特許文献1に開示されている技術がある。この技術は、基本レイヤにおいて、音声信号に適したCELP(Code Excited Linear Prediction;符号励振線形予測)符号化を用い、拡張レイヤにおいて、原信号から第1レイヤ復号信号を減じた残差信号に対して、AAC(Advanced Audio Coder)やTwinVQ(Transform Domain Weighted Interleave Vector Quantization;周波数領域重み付きインターリーブベクトル量子化)等の変換符号化を用いる。
また、異種網間ハンドオーバーや輻輳の発生などにより通信速度が動的に変動するようなネットワーク環境に柔軟に対応させるためには、ビットレート刻みの細かいスケーラブル符号化の実現が必要であり、従って、低ビットレート化されたレイヤを多数階層化してスケーラブル符号化を構成する必要がある。
一方、特許文献1および特許文献2には、符号化対象となる信号を周波数領域に変換し、得られた周波数領域信号において符号化を行う変換符号化の技術が開示されている。このような、変換符号化では、まず、サブバンド毎に周波数領域信号のエネルギ成分、すなわちゲイン(スケールファクタ)を算出および量子化し、次に、上記周波数領域信号の微細成分、すなわち形状ベクトルを算出および量子化する。
三木弼一編著、「MPEG−4のすべて」、初版、(株)工業調査会、1998年9月30日、p.126−127 特表2006−513457号公報 特開平7−261800号公報
しかしながら、2つのパラメータを前後順序に量子化する場合、後で量子化されるパラメータは、先に量子化されるパラメータの量子化歪の影響を受けるため、量子化歪が大きくなる傾向がある。よって、ゲイン、形状ベクトルの順序に量子化を行う特許文献1および特許文献2記載の変換符号化においては、形状ベクトルの量子化歪が大きくなり、スペクトルの形状が正確に表せなくなる傾向にある。この問題は、母音のようにトーナリティが強い信号、すなわち、ピーク形状が多数観察されるスペクトル特性の信号に対して大きな品質劣化を生じさせる。この問題は低ビットレート化を図ったときに顕著になる。
本発明はかかる点に鑑みてなされたものであり、母音のようにトーナリティが強い信号、すなわち、ピーク形状が多数観察されるスペクトル特性の信号のスペクトルの形状を正確に符号化することができ、復号音声の音質等、復号信号の品質を向上することができる符号化装置、復号装置、符号化方法および復号方法を提供することを目的とする。
本発明の第1の態様に係る符号化装置は、入力信号を符号化して基本レイヤ符号化データを得る基本レイヤ符号化部と、前記基本レイヤ符号化データを復号して基本レイヤ復号信号を得る基本レイヤ復号部と、前記入力信号と前記基本レイヤ復号信号との差である残差信号を符号化して拡張レイヤ符号化データを得る拡張レイヤ符号化部と、を備える符号化装置であって、前記拡張レイヤ符号化部は、前記残差信号を複数のサブバンドに分割する分割手段と、前記複数のサブバンドそれぞれに対し符号化を行って第1形状符号化情報を得るとともに、前記複数のサブバンドそれぞれのターゲットゲインを算出する第1形状ベクトル符号化手段と、前記複数のターゲットゲインを用いて1つのゲインベクトルを構成するゲインベクトル構成手段と、前記ゲインベクトルに対し符号化を行って第1ゲイン符号化情報を得るゲインベクトル符号化手段と、を具備する構成を採る。
本発明の第2の態様に係る符号化方法は、入力信号を周波数領域に変換して得られる変換係数を複数のサブバンドに分割するステップと、前記複数のサブバンドの変換係数それぞれに対し符号化を行って第1形状符号化情報を得るとともに、前記複数のサブバンドの変換係数それぞれのターゲットゲインを算出するステップと、前記複数のターゲットゲインを用いて1つのゲインベクトルを構成するステップと、前記ゲインベクトルに対し符号化を行って第1ゲイン符号化情報を得るステップと、を具備するようにした。
本発明によれば、母音のようにトーナリティが強い信号、すなわち、ピーク形状が多数観察されるスペクトル特性の信号のスペクトルの形状をより正確に符号化することができ、復号音声の音質等、復号信号の品質を向上することができる。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。以下においては、本発明の符号化装置/復号装置の例として、音声符号化装置/音声復号装置を用いて説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る音声符号化装置100の主要な構成を示すブロック図である。本実施の形態に係る音声符号化装置および音声復号装置の構成として、2レイヤのスケーラブル構成をとる例にとって説明する。なお、第1レイヤは基本レイヤを構成し、第2レイヤは拡張レイヤを構成する。
図1において、音声符号化装置100は、周波数領域変換部101、第1レイヤ符号化部102、第1レイヤ復号部103、減算器104、第2レイヤ符号化部105、および多重化部106を備える。
周波数領域変換部101は、時間領域の入力信号を周波数領域の信号に変換し、得られる入力変換係数を第1レイヤ符号化部102および減算器104に出力する。
第1レイヤ符号化部102は、周波数領域変換部101から入力される入力変換係数に対し符号化処理を行い、得られる第1レイヤ符号化データを第1レイヤ復号部103および多重化部106に出力する。
第1レイヤ復号部103は、第1レイヤ符号化部102から入力される第1レイヤ符号化データを用いて復号処理を行い、得られる第1レイヤ復号変換係数を減算器104に出力する。
減算器104は、周波数領域変換部101から入力される入力変換係数から、第1レイヤ復号部103から入力される第1レイヤ復号変換係数を減じ、得られる第1レイヤ誤差変換係数を第2レイヤ符号化部105に出力する。
第2レイヤ符号化部105は、減算器104から入力される第1レイヤ誤差変換係数に対し符号化処理を行い、得られる第2レイヤ符号化データを多重化部106に出力する。なお、第2レイヤ符号化部105の詳細については後述する。
多重化部106は、第1レイヤ符号化部102から入力される第1レイヤ符号化データと、第2レイヤ符号化部105から入力される第2レイヤ符号化データとを多重化して、得られるビットストリームを通信路に出力する。
図2は、第2レイヤ符号化部105の内部の構成を示すブロック図である。
図2において、第2レイヤ符号化部105は、サブバンド構成部151、形状ベクトル符号化部152、ゲインベクトル構成部153、ゲインベクトル符号化部154、および多重化部155を備える。
サブバンド構成部151は、減算器104から入力される第1レイヤ誤差変換係数をM個のサブバンドに分割し、得られるM個のサブバンド変換係数を形状ベクトル符号化部152に出力する。ここで、第1レイヤ誤差変換係数をe(k)と表す場合、第m(0≦m≦M−1)サブバンド変換係数e(m,k)は、下記の式(1)で表される。
Figure 0004871894
式(1)において、F(m)は、各サブバンド境界の周波数を表し、0≦F(0)<F(1)<…<F(M)≦FHの関係にある。ここで、FHは第1レイヤ誤差変換係数の最大周波数を表し、mは0≦m≦M−1の整数をとる。
形状ベクトル符号化部152は、サブバンド構成部151から順次入力されるM個のサブバンド変換係数それぞれに対し形状ベクトル量子化を行ってM個のサブバンドそれぞれの形状符号化情報を生成するとともに、M個のサブバンド変換係数それぞれのターゲットゲインを算出する。形状ベクトル符号化部152は、生成された形状符号化情報を多重化部155に出力し、ターゲットゲインをゲインベクトル構成部153に出力する。なお、形状ベクトル符号化部152の詳細については後述する。
ゲインベクトル構成部153は、形状ベクトル符号化部152から入力されるM個のターゲットゲインから1つのゲインベクトルを構成してゲインベクトル符号化部154に出力する。なお、ゲインベクトル構成部153の詳細については後述する。
ゲインベクトル符号化部154は、ゲインベクトル構成部153から入力されるゲインベクトルを目標値としてベクトル量子化を行い、得られるゲイン符号化情報を多重化部155に出力する。なお、ゲインベクトル符号化部154の詳細については後述する。
多重化部155は、形状ベクトル符号化部152から入力される形状符号化情報と、ゲインベクトル符号化部154から入力されるゲイン符号化情報とを多重化し、得られるビットストリームを第2レイヤ符号化データとして多重化部106に出力する。
図3は、第2レイヤ符号化部105における第2レイヤ符号化処理の手順を示すフロー図である。
まず、ステップ(以下、「ST」と略称する。)1010において、サブバンド構成部151は、第1レイヤ誤差変換係数をM個のサブバンドに分割し、M個のサブバンド変換係数を構成する。
次いで、ST1020において、第2レイヤ符号化部105は、サブバンドをカウントするサブバンドカウンタmを「0」に初期化する。
次いで、ST1030において、形状ベクトル符号化部152は、第mサブバンド変換係数に対し形状ベクトル符号化を行い、第mサブバンドの形状符号化情報を生成するとともに、第mサブバンド変換係数のターゲットゲインを生成する。
次いで、ST1040において、第2レイヤ符号化部105は、サブバンドカウンタmを1インクリメントする。
次いで、ST1050において、第2レイヤ符号化部105は、m<Mであるか否かを判定する。
ST1050において、m<Mであると判定した場合(ST1050:「YES」)には、第2レイヤ符号化部105は、処理手順をST1030に戻す。
一方、ST1050において、m<Mでないと判定した場合(ST1050:「NO」)には、ゲインベクトル構成部153は、ST1060において、M個のターゲットゲインを用いて1つのゲインベクトルを構成する。
次いで、ST1070において、ゲインベクトル符号化部154は、ゲインベクトル構成部153で構成されたゲインベクトルを目標値としてベクトル量子化を行い、ゲイン符号化情報を生成する。
次いで、ST1080において、多重化部155は、形状ベクトル符号化部152で生成された形状符号化情報と、ゲインベクトル符号化部154で生成されたゲイン符号化情報とを多重化する。
図4は、形状ベクトル符号化部152の内部の構成を示すブロック図である。
図4において、形状ベクトル符号化部152は、形状ベクトル符号帳521、相互相関算出部522、自己相関算出部523、探索部524、およびターゲットゲイン算出部525を備える。
形状ベクトル符号帳521は、第1レイヤ誤差変換係数の形状を表す形状ベクトル候補を多数格納しており、探索部524から入力される制御信号に基づき、形状ベクトル候補を相互相関算出部522および自己相関算出部523に順次出力する。なお、一般的に、形状ベクトル符号帳は、実際に記憶領域を確保して形状ベクトル候補を記憶する形態をとる場合もあるし、またはあらかじめ定められた処理手順に従い形状ベクトル候補を構成する場合もある。後者の場合、実際に記憶領域を確保する必要はない。本実施の形態で用いる形状ベクトル符号帳はどちらでも良いが、以下では図4に示されているような形状ベクトル候補が記憶されている形状ベクトル符号帳521を持つことを前提として説明を行う。以下、形状ベクトル符号帳521に格納されている多数の形状ベクトル候補のうちの第i番目をc(i,k)と表す。ここで、kは、形状ベクトル候補を構成する複数の要素のうちの第k個目を示す。
相互相関算出部522は、下記の式(2)に従い、サブバンド構成部151から入力される第mサブバンド変換係数と、形状ベクトル符号帳521から入力される第i形状ベクトル候補との相互相関ccor(i)を算出し、探索部524、およびターゲットゲイン算出部525に出力する。
Figure 0004871894
自己相関算出部523は、下記の式(3)に従い、形状ベクトル符号帳521から入力される形状ベクトル候補c(i,k)の自己相関acor(i)を算出し、探索部524、およびターゲットゲイン算出部525に出力する。
Figure 0004871894
探索部524は、相互相関算出部522から入力される相互相関ccor(i)と、自己相関算出部523から入力される自己相関acor(i)とを用いて下記の式(4)で表される寄与度Aを算出し、寄与度Aの最大値が探索されるまで、形状ベクトル符号帳521に制御信号を出力する。探索部524は、寄与度Aが最大となる際の形状ベクトル候補のインデックスioptを最適インデックスとしてターゲットゲイン算出部525に出力するととともに、形状符号化情報として多重化部155に出力する。
Figure 0004871894
ターゲットゲイン算出部525は、相互相関算出部522から入力される相互相関ccor(i)、自己相関算出部523から入力される自己相関acor(i)、および探索部524から入力される最適インデックスioptを用いて下記の式(5)に従いターゲットゲインを算出し、ゲインベクトル構成部153に出力する。
Figure 0004871894
図5は、ゲインベクトル構成部153の内部の構成を示すブロック図である。
図5において、ゲインベクトル構成部153は、配置位置決定部531およびターゲットゲイン配置部532を備える。
配置位置決定部531は、初期値が「0」であるカウンタを備え、形状ベクトル符号化部152からターゲットゲインが入力される度にカウンタの値を1インクリメントし、カウンタの値がサブバンドの総数Mとなる場合、再びカウンタの値をゼロに設定する。ここで、Mは、ゲインベクトル構成部153において構成されるゲインベクトルのベクトル長でもあり、配置位置決定部531が備えるカウンタの処理は、カウンタの値をゲインベクトルのベクトル長で剰余をとることに相当する。すなわち、カウンタの値は「0」〜M−1までの整数である。配置位置決定部531は、カウンタの値が更新される度に、更新されたカウンタの値を配置情報としてターゲットゲイン配置部532に出力する。
ターゲットゲイン配置部532は、初期値がそれぞれ「0」であるM個のバッファ、および形状ベクトル符号化部152から入力されるターゲットゲインを各バッファに配置するスイッチを備え、このスイッチは、配置位置決定部531から入力される配置情報が示す値を番号とするバッファに、形状ベクトル符号化部152から入力されるターゲットゲインを配置する。
図6は、ターゲットゲイン配置部532の動作を詳細に説明するための図である。
図6において、スイッチに入力される配置情報が「0」である場合には、ターゲットゲインが第0バッファに配置され、配置情報がM−1である場合には、ターゲットゲインが第M−1バッファに配置される。全てのバッファにターゲットゲインが配置された場合、ターゲットゲイン配置部532は、M個のバッファに配置されたターゲットゲインからなるゲインベクトルをゲインベクトル符号化部154に出力する。
図7は、ゲインベクトル符号化部154の内部の構成を示すブロック図である。
図7において、ゲインベクトル符号化部154は、ゲインベクトル符号帳541、誤差算出部542、および探索部543を備える。
ゲインベクトル符号帳541は、ゲインベクトルを表すゲインベクトル候補を多数格納しており、探索部543から入力される制御信号に基づき、ゲインベクトル候補を誤差算出部542に順次出力する。一般的に、ゲインベクトル符号帳は、実際に記憶領域を確保してゲインベクトル候補を記憶する形態をとる場合もあるし、またはあらかじめ定められた処理手順に従いゲインベクトル候補を構成する場合もある。後者の場合、実際に記憶領域を確保する必要はない。本実施の形態で用いるゲインベクトル符号帳はどちらでも良いが、以下では図7に示されているようなゲインベクトル候補が記憶されているゲインベクトル符号帳541を持つことを前提として説明を行う。以下、ゲインベクトル符号帳541に格納されている多数のゲインベクトル候補のうちの第j番目をg(j,m)と表す。ここで、mは、ゲインベクトル候補を構成するM個の要素のうちの第m個目を示す。
誤差算出部542は、ゲインベクトル構成部153から入力されるゲインベクトル、およびゲインベクトル符号帳541から入力されるゲインベクトル候補を用いて、下記の式(6)に従い、誤差E(j)を算出して探索部543に出力する。
Figure 0004871894
式(6)において、mは、サブバンドの番号を示し、gv(m)は、ゲインベクトル構成部153から入力されるゲインベクトルを示す。
探索部543は、誤差算出部542から入力される誤差E(j)の最小値が探索されるまで、ゲインベクトル符号帳541に制御信号を出力し、誤差E(j)が最小となる際のゲインベクトル候補のインデックスjoptを探索し、ゲイン符号化情報として多重化部155に出力する。
図8は、本実施の形態に係る音声復号装置200の主要な構成を示すブロック図である。
図8において、音声復号装置200は、分離部201、第1レイヤ復号部202、第2レイヤ復号部203、加算器204、切替部205、時間領域変換部206、およびポストフィルタ207を備える。
分離部201は、通信路を経由して音声符号化装置100から伝送されるビットストリームを第1レイヤ符号化データおよび第2レイヤ符号化データに分離し、第1レイヤ符号化データを第1レイヤ復号部202に出力し、第2レイヤ符号化データを第2レイヤ復号部203に出力する。ただし、通信路の状況(輻輳の発生等)によっては、符号化データの一部分、例えば第2レイヤ符号化データが消失するか、または第1レイヤ符号化データおよび第2レイヤ符号化データを含む符号化データ全てが消失してしまう場合がある。そこで、分離部201は、受信した符号化データに第1レイヤ符号化データのみが含まれているか、または第1レイヤおよび第2レイヤ符号化データの両方が含まれているかを判定し、前者の場合にはレイヤ情報として「1」を切替部205に出力し、後者の場合にはレイヤ情報として「2」を切替部205に出力する。また、分離部201は、第1レイヤ符号化データおよび第2レイヤ符号化データを含む符号化データ全てが消失したと判定した場合には、所定の補償処理を行って第1レイヤ符号化データおよび第2レイヤ符号化データを生成し、第1レイヤ復号部202および第2レイヤ復号部203それぞれに出力し、レイヤ情報として「2」を切替部205に出力する。
第1レイヤ復号部202は、分離部201から入力される第1レイヤ符号化データを用いて復号処理を行い、得られる第1レイヤ復号変換係数を加算器204および切替部205に出力する。
第2レイヤ復号部203は、分離部201から入力される第2レイヤ符号化データを用いて復号処理を行い、得られる第1レイヤ誤差変換係数を加算器204に出力する。
加算器204は、第1レイヤ復号部202から入力される第1レイヤ復号変換係数と、第2レイヤ復号部203から入力される第1レイヤ誤差変換係数とを加算し、得られる第2レイヤ復号変換係数を切替部205に出力する。
切替部205は、分離部201から入力されるレイヤ情報が「1」である場合には、第1レイヤ復号変換係数を復号変換係数として時間領域変換部206に出力し、レイヤ情報が「2」である場合には、第2レイヤ復号変換係数を復号変換係数として時間領域変換部206に出力する。
時間領域変換部206は、切替部205から入力される復号変換係数を時間領域の信号に変換し、得られる復号信号をポストフィルタ207に出力する。
ポストフィルタ207は、時間領域変換部206より入力される復号信号に対して、ホルマント強調、ピッチ強調、およびスペクトル傾斜調整等のポストフィルタ処理を行ってから復号音声として出力する。
図9は、第2レイヤ復号部203の内部の構成を示すブロック図である。
図9において、第2レイヤ復号部203は、分離部231、形状ベクトル符号帳232、ゲインベクトル符号帳233、および第1レイヤ誤差変換係数生成部234を備える。
分離部231は、分離部201から入力される第2レイヤ符号化データをさらに形状符号化情報およびゲイン符号化情報に分離し、形状符号化情報を形状ベクトル符号帳232に出力し、ゲイン符号化情報をゲインベクトル符号帳233に出力する。
形状ベクトル符号帳232は、図4の形状ベクトル符号帳521が備える多数の形状ベクトル候補と同様な形状ベクトル候補を備え、分離部231から入力される形状符号化情報が示す形状ベクトル候補を第1レイヤ誤差変換係数生成部234に出力する。
ゲインベクトル符号帳233は、図7のゲインベクトル符号帳541が備える多数のゲインベクトル候補と同様なゲインベクトル候補を備え、分離部231から入力されるゲイン符号化情報が示すゲインベクトル候補を第1レイヤ誤差変換係数生成部234に出力する。
第1レイヤ誤差変換係数生成部234は、形状ベクトル符号帳232から入力される形状ベクトル候補に、ゲインベクトル符号帳233から入力されるゲインベクトル候補を乗じて第1レイヤ誤差変換係数を生成し、加算器204に出力する。具体的には、ゲインベクトル符号帳233から入力されるゲインベクトル候補を構成するM個の要素のうちの第m番目の要素を、すなわち第mサブバンド変換係数のターゲットゲインを、形状ベクトル符号帳232から順次入力される第m番目の形状ベクトル候補に乗じる。ここで、Mは前述したようにサブバンドの総数を示す。
このように、本実施の形態によれば、サブバンド毎の目標信号(本実施の形態では第1レイヤ誤差変換係数)のスペクトルの形状を符号化し(形状ベクトルの符号化)、次に目標信号と符号化された形状ベクトルとの歪を最小とするターゲットゲイン(理想ゲイン)を算出し、これを符号化する(ターゲットゲインの符号化)構成を採る。これにより、従来技術のように、サブバンド毎の目標信号のエネルギ成分を符号化し(ゲインまたはスケールファクタの符号化)、これを用いて目標信号を正規化した後にスペクトルの形状を符号化(形状ベクトルの符号化)する方式に比べ、目標信号との歪を最小化するターゲットゲインを符号化する本実施の形態の方が原理的に符号化歪を小さくすることができる。なお、ターゲットゲインは、式(5)に示されるように、形状ベクトルを符号化してはじめて算出できるパラメータであるため、従来技術のように形状ベクトルの符号化がゲイン情報の符号化よりも時間的に後段に位置する符号化方式ではターゲットゲインをゲイン情報の符号化の対象にすることができないのに対し、本実施の形態ではそれが可能となり、より符号化歪を小さくすることができる。
また本実施の形態では、複数の隣接するサブバンドのターゲットゲインを用いて1つのゲインベクトルを構成し、これを符号化する構成を採る。目標信号の隣接するサブバンド間のエネルギ情報は類似していることから、隣接サブバンド間のターゲットゲインの類似度も同様に高い。このため、ベクトル空間上でのゲインベクトルの分布に偏りが生じることになる。ゲイン符号帳に含まれるゲインベクトル候補をこの偏りに適合するように配置することにより、ターゲットゲインの符号化歪を低減させることができる。
このように本実施の形態によれば、目標信号の符号化歪を低減させることができ、このため復号音声の音質を向上させることができる。さらに、本実施の形態によれば、音声の母音や音楽信号のようにトーナリティが強い信号のスペクトルに対しても、スペクトルの形状を正確に符号化できるため、音質を向上させることができる。
また、従来技術では、サブバンドゲインと形状ベクトルという2つのパラメータを用いてスペクトルの大きさを制御している。これは、スペクトルの大きさをサブバンドゲインと形状ベクトルの2つのパラメータに分けて表していると捉えることができる。それに対して本実施の形態では、ターゲットゲインという1つのパラメータのみでスペクトルの大きさを制御している。さらにこのターゲットゲインは、符号化された形状ベクトルに対して符号化歪を最小にする理想的なゲイン(理想ゲイン)である。このため、従来技術と比べて効率的な符号化を行うことができ、低ビットレート時においても高音質化を実現することができる。
なお、本実施の形態では、サブバンド構成部151により周波数領域を複数のサブバンドに分割しサブバンド毎に符号化を行う場合を例にとって説明したが、本発明はこれに限定されず、ゲインベクトル符号化よりも形状ベクトル符号化を時間的に先に行えば、複数のサブバンドを纏めて符号化しても良く、本実施の形態と同様に母音のようにトーナリティが強い信号スペクトルの形状をより正確に符号化できる効果が得られる。例えば、始めに形状ベクトル符号化を行い、その後に形状ベクトルをサブバンドに分割してサブバンド毎のターゲットゲインを算出してゲインベクトルを構成し、ゲインベクトルの符号化を行う構成であっても良い。
また、本実施の形態では、第2レイヤ符号化部105において多重化部155(図2参照)を備える場合を例にとって説明したが、本発明はこれに限定されず、形状ベクトル符号化部152およびゲインベクトル符号化部154それぞれは、形状符号化情報およびゲイン符号化情報それぞれを直接音声符号化装置100の多重化部106(図1参照)に出力しても良い。これに対応して、第2レイヤ復号部203も分離部231(図9参照)を備えず、音声復号装置200の分離部201(図8参照)がビットストリームを用いて、直接形状符号化情報およびゲイン符号化情報を分離し、直接形状ベクトル符号帳232およびゲインベクトル符号帳233それぞれに出力しても良い。
また、本実施の形態では、相互相関算出部522は、式(2)に従い相互相関ccor(i)を算出する場合を例にとって説明したが、本発明はこれに限定されず、聴感的に重要なスペクトルに大きな重みを与えて聴感的に重要なスペクトルの寄与を大きくすることを目的に、相互相関算出部522は、次の式(7)に従い相互相関ccor(i)を算出しても良い。
Figure 0004871894
式(7)において、w(k)は、人間の聴感特性に関連する重みを示し、聴感特性上、重要度が高い周波数ほどw(k)が大きくなる。
また、同様に、自己相関算出部523も、聴感的に重要なスペクトルに大きな重みを与えることにより聴感的に重要なスペクトルの寄与を大きくするために、次の式(8)に従い自己相関acor(i)を算出しても良い。
Figure 0004871894
また、同様に、誤差算出部542も、聴感的に重要なスペクトルに大きな重みを与えることにより聴感的に重要なスペクトルの寄与を大きくするために、次の式(9)に従い誤差E(j)を算出しても良い。
Figure 0004871894
式(7)、式(8)および式(9)における重みとしては、例えば、入力信号または下位レイヤの復号信号(第1レイヤ復号信号)を基に算出された聴覚マスキング閾値や、人間の聴覚のラウドネス特性を利用して求めたものを用いても良い。
また、本実施の形態では、形状ベクトル符号化部152が自己相関算出部523を備える場合を例にとって説明したが、本発明はこれに限定されず、式(3)に従い算出される自己相関係数acor(i)、または式(8)に従い算出される自己相関係数acor(i)が定数となる場合には、自己相関acor(i)をあらかじめ算出しておいて、自己相関算出部523を設けず、あらかじめ算出された自己相関acor(i)を用いても良い。
(実施の形態2)
本発明の実施の形態2に係る音声符号化装置および音声復号装置は、実施の形態1に示した音声符号化装置100および音声復号装置200と同様な構成を有して同様な動作を行い、用いる形状ベクトル符号帳のみにおいて相違する。
図10は、本実施の形態に係る形状ベクトル符号帳を説明するための図であり、母音の一例として日本語の母音「オ」のスペクトルを示す。
図10において、横軸は周波数を示し、縦軸はスペクトルの対数エネルギを示す。図10に示すように、母音のスペクトルにおいては、多数のピーク形状が観察され、強いトーナリティを示す。また、Fxは多数のピーク形状のうちの1つが位置する周波数を示す。
図11は、本実施の形態に係る形状ベクトル符号帳に含まれる多数の形状ベクトル候補を例示する図である。
図11において、(a)は、形状ベクトル候補において振幅値が「+1」または「−1」であるサンプル(すなわちパルス)を例示し、(b)は、振幅値が「0」であるサンプルを例示する。図11に示す複数の形状ベクトル候補は、任意の周波数に位置するパルスを複数含む。従って、図11に示すような形状ベクトル候補を探索することによって、図10に示すようなトーナリティの強いスペクトルをより正確に符号化することができる。具体的には、図10に示されているようなトーナリティの強い信号に対しては、ピーク形状が位置する周波数に対応する振幅値、例えば図10に示すFxの位置の振幅値が「+1」または「−1」のパルス(図11に示すサンプル(a))となり、ピーク形状以外の周波数の振幅値が「0」(図11に示すサンプル(b))となるように、形状ベクトル候補を探索により決定する。
形状ベクトル符号化よりもゲイン符号化を時間的に先に行う従来技術では、サブバンドゲインの量子化、およびサブバンドゲインを用いたスペクトルの正規化を行った後にスペクトルの微細成分(形状ベクトル)の符号化を行う。低ビットレート化によってサブバンドゲインの量子化歪が大きくなると正規化の効果が小さくなり、正規化後のスペクトルのダイナミックレンジを十分に小さくできない。これにより、次の形状ベクトル符号化部の量子化ステップを粗くしなければならなくなり、その結果、量子化歪が増大してしまう。この量子化歪の影響により、スペクトルのピーク形状が減衰してしまったり(真のピーク形状の喪失)、ピーク形状ではないスペクトルが増幅してピーク形状のように現れてしまう(偽のピーク形状の出現)。これによりピーク形状の周波数位置が変わってしまい、ピーク性の強い音声信号の母音部や音楽信号の音質劣化を引き起こす。
それに対して本実施の形態では、先に形状ベクトルを決定し、次にターゲットゲインを算出して、これを量子化する構成を採る。本実施の形態のようにベクトルの要素のいくつかが+1または−1のパルスで表される形状ベクトルを有するとき、先に形状ベクトルを決定するということは当該パルスを立てる周波数位置を先に決定することを意味する。ゲインの量子化の影響を受けずにパルスを立てる周波数位置を決定できるため、真のピーク形状の喪失や偽のピーク形状の出現といった現象を引き起こすことがなく、前述した従来技術の課題を回避することができる。
このように、本実施の形態によれば、先に形状ベクトルを決定する構成で、かつパルスを含む形状ベクトルからなる形状ベクトル符号帳を用いて形状ベクトル符号化を行うため、ピーク性の強いスペクトルの周波数を特定し、そこにパルスを立てることができる。これにより、音声信号の母音や音楽信号のようにトーナリティが強いスペクトルを持つ信号を高品質に符号化することができる。
(実施の形態3)
本発明の実施の形態3においては、音声信号のスペクトルの中でトーナリティの強い範囲(領域)を選択し、選択された範囲に限定して符号化を行う点において、実施の形態1と相違する。
本発明の実施の形態3に係る音声符号化装置は、実施の形態1に係る音声符号化装置100(図1参照)と同様な構成を有しており、第2レイヤ符号化部105の代わりに第2レイヤ符号化部305を有する点のみにおいて音声符号化装置100と相違する。このため、本実施の形態に係る音声符号化装置の全体構成は図示せず、詳細な説明を省略する。
図12は、本実施の形態に係る第2レイヤ符号化部305の内部の構成を示すブロック図である。なお、第2レイヤ符号化部305は、実施の形態1に示した第2レイヤ符号化部105(図1参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
第2レイヤ符号化部305は、範囲選択部351をさらに具備する点において、実施の形態1に係る第2レイヤ符号化部105と相違する。なお、第2レイヤ符号化部305の形状ベクトル符号化部352は、第2レイヤ符号化部105の形状ベクトル符号化部152とは処理の一部に相違点があり、それを示すために異なる符号を付す。
範囲選択部351は、サブバンド構成部151から入力されるM個のサブバンド変換係数のうち、任意数の隣接する複数のサブバンドを用いて複数の範囲を構成し、各範囲のトーナリティを算出する。範囲選択部351は、トーナリティが最も高い範囲を選択し、選択された範囲を示す範囲情報を多重化部155と形状ベクトル符号化部352に出力する。なお、範囲選択部351における範囲選択処理の詳細については後述する。
形状ベクトル符号化部352は、範囲選択部351より入力される範囲情報に基づき、範囲に含まれるサブバンド変換係数をサブバンド構成部151から入力されるサブバンド変換係数の中から選択し、選択されたサブバンド変換係数に対し形状ベクトル量子化を行う点のみにおいて、実施の形態1に係る形状ベクトル符号化部152と相違し、ここでは詳細な説明を省略する。
図13は、範囲選択部351における範囲選択処理を説明するための図である。
図13において、横軸は周波数を示し、縦軸はスペクトルの対数エネルギを示す。また、図13においては、サブバンドの総数Mが「8」であり、第0サブバンド〜第3サブバンドを用いて範囲0を構成し、第2サブバンド〜第5サブバンドを用いて範囲1を構成し、第4サブバンド〜第7サブバンドを用いて範囲2を構成する場合を例示する。範囲選択部351において、所定の範囲のトーナリティを評価する指標として、所定の範囲に含まれている複数のサブバンド変換係数の幾何平均と算術平均との比を用いて表されるスペクトラルフラットネスメジャー(SFM:Spectral Flatness Measure)を算出する。SFMは「0」〜「1」までの値をとり、「0」に近いほどより強いトーナリティを示す。従って、各範囲でSFMを算出し、SFMが「0」に最も近い範囲が選択されることになる。
本実施の形態に係る音声復号装置は、実施の形態1に係る音声復号装置200(図8参照)と同様な構成を有しており、第2レイヤ復号部203の代わりに第2レイヤ復号部403を有する点のみにおいて音声復号装置200と相違する。このため、本実施の形態に係る音声復号装置の全体構成は図示せず、詳細な説明を省略する。
図14は、本実施の形態に係る第2レイヤ復号部403の内部の構成を示すブロック図である。なお、第2レイヤ復号部403は、実施の形態1に示した第2レイヤ復号部203と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
第2レイヤ復号部403の分離部431および第1レイヤ誤差変換係数生成部434は、第2レイヤ復号部203の分離部231および第1レイヤ誤差変換係数生成部234と処理の一部に相違点があり、それを示すために異なる符号を付す。
分離部431は、形状符号化情報およびゲイン符号化情報のほかに、範囲情報をさらに分離して第1レイヤ誤差変換係数生成部434に出力する点のみにおいて、実施の形態1に示した分離部231と相違し、ここでは、詳細な説明を省略する。
第1レイヤ誤差変換係数生成部434は、形状ベクトル符号帳232から入力される形状ベクトル候補に、ゲインベクトル符号帳233から入力されるゲインベクトル候補を乗じて第1レイヤ誤差変換係数を生成し、これを範囲情報が示す範囲に含まれるサブバンドに配置して加算器204に出力する。
このように、本実施の形態によれば、音声符号化装置はトーナリティが最も高い範囲を選択し、選択された範囲において、各サブバンドのゲインよりも形状ベクトルを時間的に先に符号化する。これにより、音声の母音や音楽信号のようにトーナリティが強い信号のスペクトルの形状をさらに正確に符号化しつつ、選択された範囲でのみ符号化を行うため符号化ビットレートを低減することができる。
なお、本実施の形態では所定の各範囲のトーナリティを評価する指標としてSFMを算出する場合を例にとって説明したが、本発明はこれに限定されず、例えば、所定の範囲の平均エネルギとトーナリティの大きさとの関連が強いことから、所定の範囲に含まれる変換係数の平均エネルギをトーナリティ評価の指標として算出しても良い。これによって、SFMを求めるよりも演算量を低減することができる。
具体的には、範囲選択部351は、下記の式(10)に従い、範囲jに含まれる第1レイヤ誤差変換係数e(k)のエネルギE(j)を算出する。
Figure 0004871894
この式において、jは範囲を特定する識別子、FRL(j)は範囲jの最低周波数、FRH(j)は範囲jの最高周波数を表す。範囲選択部351は、このように範囲のエネルギE(j)を求め、次に、第1レイヤ誤差変換係数のエネルギが最も大きい範囲を特定し、この範囲に含まれる第1レイヤ誤差変換係数を符号化する。
また、下記の式(11)に従い、人間の聴感特性を反映した重み付けを行って第1レイヤ誤差変換係数のエネルギを求めても良い。
Figure 0004871894
かかる場合、聴感特性上の重要度が高い周波数ほど重みw(k)をより大きくして、その周波数を含む範囲が選択されやすいようにし、重要度の低い周波数ほど重みw(k)をより小さくして、その周波数を含む範囲が選択されにくいようにする。これにより、聴感的に重要な帯域ほど優先的に選択されるため、復号音声の音質を向上することができる。この重みw(k)としては、例えば、入力信号または下位レイヤの復号信号(第1レイヤ復号信号)を基に算出された聴覚マスキング閾値や、人間の聴覚のラウドネス特性を利用して求めたものを用いても良い。
また、範囲選択部351は、所定の周波数(基準周波数)より低い周波数に配置された範囲の中から選択を行う構成であっても良い。
図15は、範囲選択部351において、所定の周波数(基準周波数)より低い周波数に配置された範囲の中から選択を行う方法を説明するための図である。
図15においては、所定の基準周波数Fyよりも低い帯域に8つの選択範囲の候補が配置される場合を例にあげ説明する。これらの8つの範囲は、それぞれF1、F2、…、F8を起点として所定長さの帯域からなり、範囲選択部351は、これらの8つの候補の中から、上述した選択方法に基づいて1つの範囲を選択する。これにより、所定の基準周波数Fyよりも低い周波数に位置する範囲が選択される。このように、低域(または低中域)を重視して符号化を行う利点は以下の通りである。
音声信号の特徴の1つである調波構造(またはハーモニクス構造と称す)、すなわち、ある周波数間隔でスペクトルがピーク状に現れる構造は、高域部に比べて低域部にピークが大きく現れる。符号化処理によって生じる量子化誤差(誤差スペクトルまたは誤差変換係数)においても同様にピーク性が残り、高域部よりは低域部のピーク性が強い。そのため、低域部の誤差スペクトルのエネルギが高域部と比べて小さい場合でも、誤差スペクトルのピーク性が強いため、誤差スペクトルが聴覚マスキング閾値(人間が音を感じ取ることのできる閾値)を超えやすく、聴感的な音質劣化を引き起こす。つまり、誤差スペクトルのエネルギが小さくても、低域部は高域部よりも聴感的な感度が高くなる。よって、範囲選択部351は、所定の周波数より低い周波数に配置された候補の中から範囲を選択する構成をとることにより、誤差スペクトルのピーク性が強い低域部の中から符号化の対象となる範囲を特定し、復号音声の音質を向上することができる。
また、符号化対象となる範囲の選択方法として、過去のフレームで選択した範囲に関連付けて現フレームの範囲を選択しても良い。例えば、(1)前フレームで選択した範囲の近傍に位置する範囲の中から現フレームの範囲を決定する、(2)前フレームで選択した範囲の近傍に現フレームの範囲の候補を再配置し、その再配置された範囲の候補の中から現フレームの範囲を決定する、(3)範囲情報を数フレームに1度の割合で伝送し、範囲情報を伝送しないフレームでは過去に伝送された範囲情報が表す範囲を用いる(範囲情報の間欠伝送)などの方法が挙げられる。
また、範囲選択部351は、図16に示すように全帯域をあらかじめ複数の部分帯域に分割して、各部分帯域の中から各々1つの範囲を選択し、各部分帯域の選択された範囲を結合して、この結合範囲を符号化対象としても良い。図16では、部分帯域の数が2であって、低域部をカバーするように部分帯域1が設定され、高域部をカバーするように部分帯域2が設定される場合を例示する。なお、部分帯域1および部分帯域2は、それぞれ複数の範囲から構成される。範囲選択部351は、部分帯域1および部分帯域2の中から、それぞれ1つの範囲を選択する。例えば、図16に示すように、部分帯域1においては範囲2が選択され、部分帯域2においては範囲4が選択される。以下、部分帯域1の中から選択された範囲を示す情報を第1部分帯域範囲情報と呼び、部分帯域2の中から選択された範囲を示す情報を第2部分帯域範囲情報と呼ぶ。次いで、範囲選択部351は、部分帯域1の中から選択された範囲と、部分帯域2の中から選択された範囲とを結合して結合範囲を構成する。この結合範囲が範囲選択部351において選択された範囲となり、形状ベクトル符号化部352は、この結合範囲に対して形状ベクトル符号化を行う。
図17は、部分帯域の数がNである場合に対応する範囲選択部351の構成を示すブロック図である。図17において、サブバンド構成部151から入力されるサブバンド変換係数は、部分帯域1選択部511−1〜部分帯域N選択部511−Nそれぞれに与えられる。各々の部分帯域n選択部511−n(n=1〜N)は、各部分帯域nの中から1つの範囲を選択し、選択した範囲を示す情報、すなわち第n部分帯域範囲情報を範囲情報構成部512に出力する。範囲情報構成部512は、部分帯域1選択部511−1〜部分帯域N選択部511−Nから入力される各第n部分帯域範囲情報(n=1〜N)が示す各範囲を結合して結合範囲を得る。そして、範囲情報構成部512は、結合範囲を示す情報を範囲情報として形状ベクトル符号化部352および多重化部155に出力する。
図18は、範囲情報構成部512において範囲情報を構成する様子を例示する図である。図18に示すように、範囲情報構成部512は、第1部分帯域範囲情報(A1ビット)〜第N部分帯域範囲情報(ANビット)を順番に並べて範囲情報を構成する。ここで、各第n部分帯域範囲情報のビット長Anは、各部分帯域nに含まれる候補範囲の数により決まり、それぞれ異なる値を有しても良い。
図19は、図17に示した範囲選択部351に対応する第1レイヤ誤差変換係数生成部434(図14参照)の動作を説明するための図である。ここでは、部分帯域の数が2である場合を例にとる。第1レイヤ誤差変換係数生成部434は、形状ベクトル符号帳232から入力される形状ベクトル候補にゲインベクトル符号帳233から入力されるゲインベクトル候補を乗じる。そして、第1レイヤ誤差変換係数生成部434は、部分帯域1および部分帯域2各々の範囲情報が示す各範囲に上記のゲイン候補乗算後の形状ベクトル候補を配置する。このようにして求められた信号は、第1レイヤ誤差変換係数として出力される。
図16に示すような範囲選択方法によれば、各々の部分帯域の中から1つの範囲が決定されるため、部分帯域に少なくとも1つの復号スペクトルを配置することが可能となる。従って、音質を改善したい複数の帯域をあらかじめ設定しておくことにより、全帯域の中から1つの範囲のみを選択する範囲選択方法よりも復号音声の品質を向上することができる。例えば低域部と高域部との両者の品質改善を同時に図りたい場合などに、図16に示すような範囲選択方法は有効である。
なお、図16に示す範囲選択方法のバリエーションとして、図20に例示しているように特定の部分帯域において常に固定の範囲が選択されるようにしても良い。図20に示す例では、部分帯域2において常に範囲4が選択され、これが結合範囲の一部になっている。図20に示した範囲選択方法によれば、図16に示した範囲選択方法の効果と同様に、音質を改善したい帯域をあらかじめ設定しておくことが可能となり、かつ、例えば、部分帯域2の部分帯域範囲情報が不用となるため、範囲情報を表すためのビット数をより小さくすることができる。
また、図20は、高域部(部分帯域2)において常に固定の範囲が選択される場合を例にとって示しているが、これに限定されず、低域部(部分帯域1)において常に固定の範囲が選択されるようにしても良いし、また図20には図示されていない中域部の部分帯域において、常に固定の範囲が選択されるようにしても良い。
また、図16および図20に示す範囲選択方法のバリエーションとして、図21に示すように、各部分帯域に含まれる候補範囲の帯域幅は異なっていても良い。図21においては、部分帯域1に含まれる候補範囲よりも部分帯域2に含まれる候補範囲の帯域幅がより短い場合を例示している。
(実施の形態4)
本発明の実施の形態4においては、フレーム毎にトーナリティの程度を判断し、その結果に応じて形状ベクトル符号化およびゲイン符号化の順序を決定する。
本発明の実施の形態4に係る音声符号化装置は、実施の形態1に係る音声符号化装置100(図1参照)と同様な構成を有しており、第2レイヤ符号化部105の代わりに第2レイヤ符号化部505を有する点のみにおいて音声符号化装置100と相違する。このため、本実施の形態に係る音声符号化装置の全体構成は図示せず、詳細な説明を省略する。
図22は、第2レイヤ符号化部505の内部の構成を示すブロック図である。なお、第2レイヤ符号化部505は、図1に示した第2レイヤ符号化部105と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
第2レイヤ符号化部505は、トーナリティ判定部551、切替部552、ゲイン符号化部553、正規化部554、形状ベクトル符号化部555、および切替部556をさらに備える点において、実施の形態1に係る第2レイヤ符号化部105と相違する。なお、図22において、形状ベクトル符号化部152、ゲインベクトル構成部153、およびゲインベクトル符号化部154は符号化系統(a)を構成し、ゲイン符号化部553、正規化部554、および形状ベクトル符号化部555は符号化系統(b)を構成する。
トーナリティ判定部551は、減算器104から入力される第1レイヤ誤差変換係数のトーナリティを評価する指標としてSFMを求め、求められたSFMが所定の閾値より小さい場合には、トーナリティ判定情報として「高」を切替部552と切替部556に出力し、求められたSFMが所定の閾値以上である場合には、トーナリティ判定情報として「低」を切替部552と切替部556に出力する。
なお、ここではトーナリティを評価する指標にSFMを用いて説明しているが、これに限定されることなく、例えば第1レイヤ誤差変換係数の分散など別の指標を用いて判定しても良い。また、トーナリティの判定に入力信号などの別の信号を用いて判定しても良い。例えば、入力信号のピッチ分析結果や、入力信号を低位レイヤ(本実施の形態では第1レイヤ符号化部)で符号化した結果を用いても良い。
切替部552は、トーナリティ判定部551から入力されるトーナリティ判定情報が「高」である場合には、サブバンド構成部151から入力されるM個のサブバンド変換係数を形状ベクトル符号化部152に順次出力し、トーナリティ判定部551から入力されるトーナリティ判定情報が「低」である場合には、サブバンド構成部151から入力されるM個のサブバンド変換係数をゲイン符号化部553および正規化部554に順次出力する。
ゲイン符号化部553は、切替部552から入力されるM個のサブバンド変換係数の平均エネルギを算出し、算出された平均エネルギを量子化し、量子化インデックスをゲイン符号化情報として切替部556に出力する。また、ゲイン符号化部553は、ゲイン符号化情報を用いてゲイン復号処理を行い、得られる復号ゲインを正規化部554に出力する。
正規化部554は、ゲイン符号化部553から入力される復号ゲインを用いて、切替部552から入力されるM個のサブバンド変換係数を正規化し、得られる正規化形状ベクトルを形状ベクトル符号化部555に出力する。
形状ベクトル符号化部555は、正規化部554から入力される正規化形状ベクトルに対して符号化処理を行い、得られる形状符号化情報を切替部556に出力する。
切替部556は、トーナリティ判定部551から入力されるトーナリティ判定情報が「高」である場合には、形状ベクトル符号化部152およびゲインベクトル符号化部154それぞれから入力される形状符号化情報およびゲイン符号化情報を多重化部155に出力し、トーナリティ判定部551から入力されるトーナリティ判定情報が「低」である場合には、ゲイン符号化部553および形状ベクトル符号化部555それぞれから入力されるゲイン符号化情報および形状符号化情報を多重化部155に出力する。
上記のように、本実施の形態に係る音声符号化装置においては、第1レイヤ誤差変換係数のトーナリティが「高」である場合に応じて、系統(a)を用いて、ゲイン符号化よりも形状ベクトル符号化を先に行い、第1レイヤ誤差変換係数のトーナリティが「低」である場合に応じて、系統(b)を用いて、形状ベクトル符号化よりもゲイン符号化を先に行う。
このように、本実施の形態によれば、第1レイヤ誤差変換係数のトーナリティに応じて、ゲイン符号化および形状ベクトル符号化の順序を適応的に変化させるため、符号化対象となる入力信号に応じてゲイン符号化歪みおよび形状ベクトル符号化歪みの両方を抑えることができ、復号音声の音質をさらに向上することができる。
(実施の形態5)
図23は、本発明の実施の形態5に係る音声符号化装置600の主要な構成を示すブロック図である。
図23において、音声符号化装置600は、第1レイヤ符号化部601、第1レイヤ復号部602、遅延部603、減算器604、周波数領域変換部605、第2レイヤ符号化部606、および多重化部106を備える。そのうち、多重化部106は図1に示した多重化部106と同様であるため、詳細な説明を省略する。なお、第2レイヤ符号化部606と、図12に示した第2レイヤ符号化部305とは処理の一部に相違点があり、それを示すために異なる符号を付す。
第1レイヤ符号化部601は、入力信号を符号化し、生成される第1レイヤ符号化データを第1レイヤ復号部602および多重化部106に出力する。第1レイヤ符号化部601の詳細については後述する。
第1レイヤ復号部602は、第1レイヤ符号化部601から入力される第1レイヤ符号化データを用いて復号処理を行い、生成される第1レイヤ復号信号を減算器604に出力する。第1レイヤ復号部602の詳細については後述する。
遅延部603は、入力信号に対して所定の遅延を与えてから減算器604に出力する。遅延の長さは、第1レイヤ符号化部601および第1レイヤ復号部602の処理において生じる遅延の長さと同じである。
減算器604は、遅延部603から入力される遅延された入力信号と、第1レイヤ復号部602から入力される第1レイヤ復号信号との差を算出し、得られる誤差信号を周波数領域変換部605に出力する。
周波数領域変換部605は、減算器604から入力される誤差信号を周波数領域の信号に変換させ、得られる誤差変換係数を第2レイヤ符号化部606に出力する。
図24は、第1レイヤ符号化部601の内部の主要な構成を示すブロック図である。
図24において、第1レイヤ符号化部601は、ダウンサンプリング部611およびコア符号化部612を備える。
ダウンサンプリング部611は、時間領域の入力信号をダウンサンプリングして、所望のサンプリングレートに変換し、ダウンサンプリングされた時間領域信号をコア符号化部612に出力する。
コア符号化部612は、所望のサンプリングレートに変換された入力信号に対して符号化処理を行い、生成された第1レイヤ符号化データを第1レイヤ復号部602および多重化部106に出力する。
図25は、第1レイヤ復号部602の内部の主要な構成を示すブロック図である。
図25において、第1レイヤ復号部602は、コア復号部621、アップサンプリング部622、および高域成分付与部623を備え、高域部を雑音などによる近似信号で代用する。これは、聴感的に重要度の低い高域部を近似信号で表し、その代わりに聴感的に重要な低域部(または低中域部)のビット配分を増やしてこの帯域の原信号に対する忠実度を向上させることにより、全体的に復号音声の音質の向上を図るという技術に基づいている。
コア復号部621は、第1レイヤ符号化部601から入力される第1レイヤ符号化データを用いて復号処理を行い、得られるコア復号信号をアップサンプリング部622に出力する。また、コア復号部621は、復号処理によって求められた復号LPC係数を高域成分付与部623に出力する。
アップサンプリング部622は、コア復号部621から入力される復号信号をアップサンプリングして、入力信号と同じサンプリングレートに変換し、アップサンプリングされたコア復号信号を高域成分付与部623に出力する。
高域成分付与部623は、ダウンサンプリング部611におけるダウンサンプリング処理によって欠損した高域成分を近似信号にて補う。近似信号の生成方法として、コア復号部621の復号処理において求められた復号LPC係数によって合成フィルタを構成し、エネルギ調整された雑音信号を当該合成フィルタおよびバンドパスフィルタにより順次フィルタリングする方法が知られている。この手法で求められる高域成分は聴感的な帯域感の広がりには寄与するものの、原信号の高域成分とは全く異なる波形になるため、減算器で求められる誤差信号の高域部のエネルギが増大する。
第1レイヤ符号化処理がこのような特徴を有する場合、誤差信号の高域部のエネルギが増大するため、本来聴感的な感度の高い低域部が選択されにくくなる。従って、本実施の形態に係る第2レイヤ符号化部606は、所定の周波数(基準周波数)より低い周波数に配置された候補の中から範囲を選択することにより、前述の高域部の誤差信号のエネルギが増加することによる弊害を回避する。すなわち、第2レイヤ符号化部606は、図15に示したような選択処理を行う。
図26は、本発明の実施の形態5に係る音声復号装置700の主要な構成を示すブロック図である。なお、音声復号装置700は、図8に示した音声復号装置200と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
音声復号装置700の第1レイヤ復号部702と、音声復号装置200の第1レイヤ復号部202とは一部の処理が相違するため、異なる符号を付す。なお、第1レイヤ復号部702の構成および動作は音声符号化装置600の第1レイヤ復号部602と同様であるため、詳細な説明を省略する。
音声復号装置700の時間領域変換部706と、音声復号装置200の時間領域変換部206とは、配置位置のみ相違し、同様な処理を行うため、異なる符号を付し、詳細な説明を省略する。
このように、本実施の形態によれば、第1レイヤの符号化処理において高域部を雑音などによる近似信号で代用し、その代わりに聴感的に重要な低域部(または低中域部)のビット配分を増やしてこの帯域の原信号に対する忠実度を向上し、さらに第2レイヤの符号化処理において所定の周波数より低い範囲を符号化対象として高域部の誤差信号のエネルギが増大することによる弊害を回避し、ゲインの符号化よりも形状ベクトルの符号化を時間的に先に行うため、母音のようにトーナリティが強い信号のスペクトルの形状をより正確に符号化するとともに、ビットレートを増加せずゲインベクトル符号化歪みをさらに低減させることができ、復号音声の音質をさらに向上することができる。
なお、本実施の形態では、減算器604は、時間領域の信号の差をとる場合を例にとって説明したが、本発明はこれに限定されず、減算器604は、周波数領域の変換係数の差をとっても良い。かかる場合、周波数領域変換部605を遅延部603と減算器604の間に配置して入力変換係数を求め、また、第1レイヤ復号部602と減算器604の間にもう1つの周波数領域変換部を配置して第1レイヤ復号変換係数を求める。そして、減算器604は、入力変換係数と第1レイヤ復号変換係数との差をとり、その誤差変換係数を第2レイヤ符号化部606に直接与える。この構成により、ある帯域では差をとり、ほかの帯域では差をとらないという適応的な減算処理が可能となり、復号音声の音質をさらに向上することができる。
また、本実施の形態では、高域部に関する情報を音声復号装置に送信しない構成を例にとって説明したが、本発明はこれに限定されず、高域部の信号を低域部に比べて低ビットレートで符号化して音声復号装置に送信する構成にしても良い。
(実施の形態6)
図27は、本発明の実施の形態6に係る音声符号化装置800の主要な構成を示すブロック図である。なお、音声符号化装置800は、図23に示した音声符号化装置600と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
音声符号化装置800は、重みフィルタ801をさらに具備する点において、音声符号化装置600と相違する。
重みフィルタ801は、誤差信号をフィルタリングすることにより聴感的な重み付けを行い、重み付けされた誤差信号を周波数領域変換部605に出力する。重みフィルタ801は、入力信号のスペクトルを平坦化(白色化)もしくはそれに近いスペクトル特性に変化させる。例えば、重みフィルタの伝達関数w(z)は、第1レイヤ復号化部602で得られる復号LPC係数を用いて下記の式(12)を用いて表される。
Figure 0004871894
式(12)において、α(i)はLPC係数、NPはLPC係数の次数、そしてγはスペクトル平坦化(白色化)の程度を制御するパラメータであり、0≦γ≦1の範囲の値をとる。γが大きいほど平坦化の程度がおおきくなり、ここでは例えばγに0.92を用いる。
図28は、本発明の実施の形態6に係る音声復号装置900の主要な構成を示すブロック図である。なお、音声復号装置900は、図26に示した音声復号装置700と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
音声復号装置900は、合成フィルタ901をさらに具備する点において、音声復号装置700と相違する。
合成フィルタ901は、音声符号化装置800の重みフィルタ801と逆のスペクトル特性を持つフィルタからなり、時間領域変換部706から入力される信号に対しフィルタリング処理を行ってから加算部204に出力する。合成フィルタ901の伝達関数B(z)は、下記の式(13)を用いて表される。
Figure 0004871894
式(13)において、α(i)はLPC係数、NPはLPC係数の次数、そしてγはスペクトル平坦化(白色化)の程度を制御するパラメータであり、0≦γ≦1の範囲の値をとる。γが大きいほど平坦化の程度がおおきくなり、ここでは例えばγに0.92を用いる。
上記のように、音声符号化装置800の重みフィルタ801は、入力信号のスペクトル包絡と逆のスペクトル特性を持つフィルタからなり、音声復号装置900の合成フィルタ901は、重みフィルタと逆のスペクトル特性を持つフィルタからなる。よって、合成フィルタは、入力信号のスペクトル包絡と同様の特性を有する。一般に、音声信号のスペクトル包絡は低域部のエネルギが高域部のエネルギより大きく現れるため、合成フィルタを通す前の信号の符号化歪が低域部と高域部とで同等であっても、合成フィルタを通した後では低域部の符号化歪が大きくなる。本来、音声符号化装置800の重みフィルタ801、音声復号装置900の合成フィルタ901は、聴覚マスキング効果により符号化歪を聞こえにくくするために導入されるものであるが、低ビットレートにより符号化歪を小さくできない場合に聴覚マスキング効果が十分に機能せず、符号化歪が知覚されやすくなる。このような場合、音声復号装置900の合成フィルタ901により符号化歪の低域部のエネルギを増大させているため、低域部の品質劣化が現れやすくなる。本実施の形態においては、実施の形態5に示したように第2レイヤ符号化部606が所定の周波数(基準周波数)より低い周波数に配置された候補の中から符号化対象となる範囲を選択することにより、前述の低域部の符号化歪が強調されてしまう弊害を緩和し、復号音声の音質の向上を図る。
このように、本実施の形態によれば、音声符号化装置に重みフィルタを備え、音声復号装置に合成フィルタを備えて聴覚マスキング効果を利用して品質改善を図り、そして第2レイヤの符号化処理において、所定の周波数より低い範囲を符号化対象とすることにより、符号化歪の低域部のエネルギを増大させている弊害を緩和し、かつゲインの符号化よりも形状ベクトルの符号化を時間的に先に行うため、母音のようにトーナリティが強い信号のスペクトルの形状をより正確に符号化するとともに、ビットレートを増加せずゲインベクトル符号化歪みを低減させることができ、復号音声の音質をさらに向上することができる。
(実施の形態7)
本発明の実施の形態7においては、音声符号化装置および音声復号装置が1つの基本レイヤと複数の拡張レイヤとからなる3階層以上の構成をとる場合、各拡張レイヤにおいて符号化対象となる範囲の選択について説明する。
図29は、本発明の実施の形態7に係る音声符号化装置1000の主要な構成を示すブロック図である。
音声符号化装置1000は、周波数領域変換部101、第1レイヤ符号化部102、第1レイヤ復号部603、減算器604、第2レイヤ符号化部606、第2レイヤ復号部1001、加算器1002、減算器1003、第3レイヤ符号化部1004、第3レイヤ復号部1005、加算器1006、減算器1007、第4レイヤ符号化部1008、および多重化部1009を備え、4レイヤを備える。そのうち、周波数領域変換部101、第1レイヤ符号化部102の構成および動作は、図1に示した通りであり、第1レイヤ復号部603、減算器604、第2レイヤ符号化部606の構成および動作は、図23に示した通りであり、1001〜1009までの番号を有する各ブロックの構成および動作は、101、102、603、604、606の各ブロックの構成および動作と類似しており類推できるため、ここでは詳細な説明を省略する。
図30は、音声符号化装置1000の符号化処理において符号化対象となる範囲の選択処理を説明するための図である。そのうち、図30(a)〜図30(c)は、第2レイヤ符号化部606の第2レイヤ符号化、第3レイヤ符号化部1004の第3レイヤ符号化、および第4レイヤ符号化部1008の第4レイヤ符号化それぞれにおける範囲選択の処理を説明するための図である。
図30(a)に示すように、第2レイヤ符号化においては、第2レイヤ用基準周波数Fy(L2)よりも低い帯域に選択範囲の候補が配置されており、第3レイヤ符号化においては、第3レイヤ用基準周波数Fy(L3)よりも低い帯域に選択範囲の候補が配置され、第4レイヤ符号化においては、第4レイヤ用基準周波数Fy(L4)よりも低い帯域に選択範囲の候補が配置される。なお、各拡張レイヤの基準周波数の間には、Fy(L2)<Fy(L3)<Fy(L4)の関係がある。各拡張レイヤの選択範囲の候補の数は同じであり、ここでは4つの場合を例にあげる。すなわち、ビットレートの低い低位レイヤほど(例えば第2レイヤ)、聴感的な感度の高い低域の帯域の中から符号化の対象となる範囲を選択し、ビットレートの高い高位レイヤ(例えば第4レイヤ)では高域部まで含めたより広い帯域の中から符号化の対象となる範囲を選択する。このような構成を採ることにより、低位レイヤにおいて低域部を重視し、高位レイヤにおいてより広い帯域をカバーするようにするため、音声信号の高音質化を実現することができる。
図31は、本実施の形態に係る音声復号装置1100の主要な構成を示すブロック図である。
図31において、音声復号装置1100は分離部1101、第1レイヤ復号部1102、第2レイヤ復号部1103、加算部1104、第3レイヤ復号部1105、加算部1106、第4レイヤ復号部1107、加算部1108、切替部1109,時間領域変換部1110、およびポストフィルタ1111を備え、4レイヤからなるスケーラブル音声復号装置である。なお、これらの各ブロックの構成および動作は図8に示した音声復号装置200の各ブロックの構成および動作と類似しており類推できるため、ここでは詳細な説明を省略する。
このように、本実施の形態によれば、スケーラブル音声符号化装置において、ビットレートの低い低位レイヤほど聴感的な感度の高い低域の帯域の中から符号化の対象となる範囲を選択し、ビットレートの高い高位レイヤほど高域部まで含めたより広い帯域の中から符号化の対象となる範囲を選択することにより、低位レイヤにおいて低域部を重視し、高位レイヤにおいてより広い帯域をカバーするようにし、かつゲインの符号化よりも形状ベクトルの符号化を時間的に先に行うため、母音のようにトーナリティが強い信号のスペクトルの形状をより正確に符号化するとともに、ビットレートを増加せずゲインベクトル符号化歪みをさらに低減させることができ、復号音声の音質をさらに向上することができる。
なお、本実施の形態では、各拡張レイヤの符号化処理において図30に示すような範囲選択の候補の中から符号化対象を選択する場合を例にとって説明したが、本発明はこれに限定されず、図32および図33に示すように等間隔に配置されている範囲の候補から符号化対象を選択しても良い。
図32(a)、図32(b)、図33は、第2レイヤ符号化、第3レイヤ符号化、および第4レイヤ符号化それぞれにおける範囲選択の処理を説明するための図である。図32および図33に示すように、各拡張レイヤにおける選択範囲の候補の数は異なり、ここではそれぞれ4つ、6つ、8つである場合を例示する。このような構成では、低位レイヤでは低域の帯域の中から符号化の対象となる範囲を決定し、かつ選択範囲の候補の数が高位レイヤに比べより少ないため、演算量とビットレートの削減も可能になる。
また、各拡張レイヤにおいて符号化対象となる範囲の選択方法として低位レイヤで選択した範囲に関連付けて現在のレイヤの範囲を選択しても良い。例えば、(1)低位レイヤで選択した範囲の近傍に位置する範囲の中から現在のレイヤの範囲を決定する方法、(2)低位レイヤで選択した範囲の近傍に現在のレイヤの範囲の候補を再配置し、その再配置された範囲の候補の中から現在のレイヤの範囲を決定する方法、(3)範囲情報を数フレームに1度の割合で伝送し、範囲情報を伝送しないフレームでは過去に伝送された範囲情報が表す範囲を用いる(範囲情報の間欠伝送)方法などがあげられる。
以上、本発明の各実施の形態について説明した。
なお、上記各実施の形態では、音声符号化装置および音声復号装置の構成として2レイヤのスケーラブル構成を例にとって説明したが、本発明はこれに限定されず、3レイヤ以上のスケーラブル構成でも良い。さらに、本発明は、スケーラブル構成ではない音声符号化装置にも適用可能である。
また、上記各実施の形態では、第1レイヤの符号化方法としてCELPの方法を用いることが可能である。
また、上記各実施の形態における周波数領域変換部は、FFT、DFT(Discrete Fourier Transform)、DCT(Discrete Cosine Transform)、MDCT(Modified Discrete Cosine Transform)、サブバンドフィルタ等によって実現される。
また、上記各実施の形態では、復号信号として音声信号を想定しているが、本発明はこれに限らず、例えば、オーディオ信号等でもよい。
また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
本発明は、移動体通信システムにおける無線通信端末装置、基地局装置等に適用することができる。
本発明の実施の形態1に係る音声符号化装置の主要な構成を示すブロック図 本発明の実施の形態1に係る第2レイヤ符号化部の内部の構成を示すブロック図 本発明の実施の形態1に係る第2レイヤ符号化部における第2レイヤ符号化処理の手順を示すフロー図 本発明の実施の形態1に係る形状ベクトル符号化部の内部の構成を示すブロック図 本発明の実施の形態1に係るゲインベクトル構成部の内部の構成を示すブロック図 本発明の実施の形態1に係るターゲットゲイン配置部の動作を詳細に説明するための図 本発明の実施の形態1に係るゲインベクトル符号化部の内部の構成を示すブロック図 本発明の実施の形態1に係る音声復号装置の主要な構成を示すブロック図 本発明の実施の形態1に係る第2レイヤ復号部の内部の構成を示すブロック図 本発明の実施の形態2に係る形状ベクトル符号帳を説明するための図 本発明の実施の形態2に係る形状ベクトル符号帳に含まれる多数の形状ベクトル候補を例示する図 本発明の実施の形態3に係る第2レイヤ符号化部の内部の構成を示すブロック図 本発明の実施の形態3に係る範囲選択部における範囲選択処理を説明するための図 本発明の実施の形態3に係る第2レイヤ復号部の内部の構成を示すブロック図 本発明の実施の形態3に係る範囲選択部のバリエーションを示す図 本発明の実施の形態3に係る範囲選択部における範囲選択方法のバリエーションを示す図 本発明の実施の形態3に係る範囲選択部の構成のバリエーションを示すブロック図 本発明の実施の形態3に係る範囲情報構成部において範囲情報を構成する様子を例示する図 本発明の実施の形態3に係る第1レイヤ誤差変換係数生成部のバリエーションの動作を説明するための図 本発明の実施の形態3に係る範囲選択部における範囲選択方法のバリエーションを示す図 本発明の実施の形態3に係る範囲選択部における範囲選択方法のバリエーションを示す図 本発明の実施の形態4に係る第2レイヤ符号化部の内部の構成を示すブロック図 本発明の実施の形態5に係る音声符号化装置の主要な構成を示すブロック図 本発明の実施の形態5に係る第1レイヤ符号化部の内部の主要な構成を示すブロック図 本発明の実施の形態5に係る第1レイヤ復号部の内部の主要な構成を示すブロック図 本発明の実施の形態5に係る音声復号装置の主要な構成を示すブロック図 本発明の実施の形態6に係る音声符号化装置の主要な構成を示すブロック図 本発明の実施の形態6に係る音声復号装置の主要な構成を示すブロック図 本発明の実施の形態7に係る音声符号化装置の主要な構成を示すブロック図 本発明の実施の形態7に係る音声符号化装置の符号化処理において符号化対象となる範囲の選択処理を説明するための図 本発明の実施の形態7に係る音声復号装置の主要な構成を示すブロック図 本発明の実施の形態7に係る音声符号化装置の符号化処理において等間隔に配置されている範囲の候補から符号化対象を選択する場合を説明するための図 本発明の実施の形態7に係る音声符号化装置の符号化処理において等間隔に配置されている範囲の候補から符号化対象を選択する場合を説明するための図
符号の説明
101 周波数領域変換部
102、601 第1レイヤ符号化部
103、602 第1レイヤ復号部
104 減算器
105、305、505、606 第2レイヤ符号化部
151 サブバンド構成部
152、555、352 形状ベクトル符号化部
153 ゲインベクトル構成部
154 ゲインベクトル符号化部
155 多重化部
106 多重化部
201 分離部
202 第1レイヤ復号部
203 第2レイヤ復号部
204 加算器
205 切替部
206 時間領域変換部
207 ポストフィルタ
351 範囲選択部
551 トーナリティ判定部
552、556 切替部
553 ゲイン符号化部
554 正規化部
611 ダウンサンプリング部
612 コア符号化部
621 コア復号部
622 アップサンプリング部
623 高域成分付与部

Claims (5)

  1. 入力信号を符号化して第1レイヤ符号化データを得る第1レイヤ符号化手段と、
    前記第1レイヤ符号化データを復号して第1レイヤ復号信号を得る第1レイヤ復号手段と、
    前記入力信号と前記第1レイヤ復号信号との差である第1レイヤ誤差信号を周波数領域に変換し第1レイヤ誤差変換係数を算出する第1レイヤ誤差変換係数算出手段と、
    前記第1レイヤ誤差変換係数を符号化して第2レイヤ符号化データを得る第2レイヤ符号化手段と、
    具備する符号化装置であって、
    前記第2レイヤ符号化手段は、
    入力信号のトーナリティまたはエネルギに基づいて前記第2レイヤ符号化手段の符号化対象となる帯域を決定する帯域決定手段と
    前記帯域決定手段にて決定された所定の第1の帯域幅を持つ帯域に含まれる前記第1レイヤ誤差変換係数を参照して、前記帯域に所定の数のパルスを配置して第1形状ベクトルを生成するとともに、前記所定の数のパルスの位置から第1形状符号化情報を生成する第1形状ベクトル符号化手段と、
    前記帯域に含まれる前記第1レイヤ誤差変換係数と前記第1形状ベクトルとを用いて所定の第2の帯域幅を持つサブバンド毎にターゲットゲインを算出するターゲットゲイン算出手段と、
    前記サブバンド毎に算出された複数のターゲットゲインを用いて1つのゲインベクトルを構成するゲインベクトル構成手段と、
    前記ゲインベクトルに対し符号化を行って第1ゲイン符号化情報を得るゲインベクトル符号化手段と、を具備する
    符号化装置。
  2. 入力信号のトーナリティの強さを判定するトーナリティ判定手段と、
    前記第1レイヤ誤差変換係数の一部の帯域の複数のサブバンドそれぞれのゲインを符号化して第2ゲイン符号化情報を得るゲイン符号化手段と、
    前記ゲイン符号化情報を復号して得られる復号ゲインを用い、前記複数のサブバンドの第1レイヤ誤差変換係数それぞれを正規化して正規化形状ベクトルを得る正規化手段と、
    前記複数の正規化形状ベクトルを符号化して第2形状符号化情報を得る第2形状ベクトル符号化手段と、
    フレーム毎に前記入力信号のトーナリティを算出し、前記トーナリティが前記閾値以上であると判定した場合には前記第1レイヤ誤差変換係数を前記第1形状ベクトル符号化手段に出力し、前記トーナリティが前記閾値より小さいと判定した場合には前記第1レイヤ誤差変換係数を前記ゲイン符号化手段に出力する判定手段と、
    をさらに具備する請求項1記載の符号化装置。
  3. 符号化装置において入力信号を符号化して得られた第1レイヤ符号化データ、および、前記符号化装置において前記第1レイヤ符号化データを復号して得られた信号と前記入力信号との差である第1レイヤ誤差信号を周波数領域に変換し算出された第1レイヤ誤差変換係数を符号化して得られた第2レイヤ符号化データを受信する受信手段と、
    前記第1レイヤ符号化データを復号して第1レイヤ復号信号を生成する第1レイヤ復号手段と、
    前記第2レイヤ符号化データを復号して第1レイヤ復号誤差変換係数を生成する第2レイヤ復号手段と、
    前記第1レイヤ復号変換係数を時間領域に変換して第1復号誤差信号を生成する時間領域変換手段と、
    前記第1レイヤ復号信号と前記第1レイヤ復号誤差信号とを加算して復号信号を生成する加算手段と、
    を具備する復号装置であって、
    前記第2レイヤ符号化データは、
    前記第1レイヤ誤差変換係数の一部の帯域に対して、振幅値の大きい複数の変換係数の位置にパルスを配置して生成される第1形状ベクトルの複数のパルスの位置から求められる第1形状符号化情報、および、
    前記第1形状ベクトルを複数のサブバンドに分割し、前記第1レイヤ誤差変換係数の前記一部の帯域を複数のサブバンドに分割し、前記サブバンド毎に前記第1形状ベクトルと前記第1レイヤ誤差変換係数を用いてターゲットゲインを算出し、前記複数のターゲットゲインを用いて構成される1つのゲインベクトルを符号化して得られる第1ゲイン符号化情報、を含む、
    復号装置。
  4. 入力信号を符号化して第1レイヤ符号化データを得る第1レイヤ符号化ステップと、
    前記第1レイヤ符号化データを復号して第1レイヤ復号信号を得る第1レイヤ復号ステップと、
    前記入力信号と前記第1レイヤ復号信号との差である第1レイヤ誤差信号を周波数領域に変換し第1レイヤ誤差変換係数を算出する第1レイヤ誤差変換係数算出ステップと、
    前記第1レイヤ誤差変換係数を符号化して第2レイヤ符号化データを得る第2レイヤ符号化ステップと、
    を具備する符号化方法であって、
    前記第2レイヤ符号化ステップは、
    入力信号のトーナリティまたはエネルギに基づいて前記第2レイヤ符号化ステップの符号化対象となる帯域を決定する帯域決定ステップと、
    前記帯域決定ステップにて決定された所定の第1の帯域幅を持つ帯域に含まれる前記第1レイヤ誤差変換係数を参照して、前記帯域に所定の数のパルスを配置して第1形状ベクトルを生成するとともに、前記所定の数のパルスの位置から第1形状符号化情報を生成する第1形状ベクトル符号化ステップと、
    前記帯域に含まれる前記第1レイヤ誤差変換係数と前記第1形状ベクトルとを用いて所定の第2の帯域幅を持つサブバンド毎にターゲットゲインを算出するターゲットゲイン算出ステップと、
    前記サブバンド毎に算出された複数のターゲットゲインを用いて1つのゲインベクトルを構成するゲインベクトル構成ステップと、
    前記ゲインベクトルに対し符号化を行って第1ゲイン符号化情報を得るゲインベクトル符号化ステップと、を具備する、
    符号化方法。
  5. 符号化装置において入力信号を符号化して得られた第1レイヤ符号化データ、および、前記符号化装置において前記第1レイヤ符号化データを復号して得られた信号と前記入力信号との差である第1レイヤ誤差信号を周波数領域に変換し算出された第1レイヤ誤差変換係数を符号化して得られた第2レイヤ符号化データを受信する受信ステップと、
    前記第1レイヤ符号化データを復号して第1レイヤ復号信号を生成する第1レイヤ復号ステップと、
    前記第2レイヤ符号化データを復号して第1レイヤ復号誤差変換係数を生成する第2レイヤ復号ステップと、
    前記第1レイヤ復号変換係数を時間領域に変換して第1復号誤差信号を生成する時間領域変換ステップと、
    前記第1レイヤ復号信号と前記第1レイヤ復号誤差信号とを加算して復号信号を生成する加算ステップと、
    を具備する復号方法であって、
    前記第2レイヤ符号化データは、
    前記第1レイヤ誤差変換係数の一部の帯域に対して、振幅値の大きい複数の変換係数の位置にパルスを配置して生成される第1形状ベクトルの複数のパルスの位置から求められる第1形状符号化情報、および、
    前記第1形状ベクトルを複数のサブバンドに分割し、前記第1レイヤ誤差変換係数の前記一部の帯域を複数のサブバンドに分割し、前記サブバンド毎に前記第1形状ベクトルと前記第1レイヤ誤差変換係数を用いてターゲットゲインを算出し、前記複数のターゲットゲインを用いて構成される1つのゲインベクトルを符号化して得られる第1ゲイン符号化情報、を含む、
    復号方法。
JP2008045259A 2007-03-02 2008-02-26 符号化装置、復号装置、符号化方法および復号方法 Active JP4871894B2 (ja)

Priority Applications (18)

Application Number Priority Date Filing Date Title
JP2008045259A JP4871894B2 (ja) 2007-03-02 2008-02-26 符号化装置、復号装置、符号化方法および復号方法
CN201210004224.0A CN102411933B (zh) 2007-03-02 2008-02-29 解码装置和解码方法
SG2012005948A SG178727A1 (en) 2007-03-02 2008-02-29 Encoding device and encoding method
EP08710511.0A EP2128857B1 (en) 2007-03-02 2008-02-29 Encoding device and encoding method
PCT/JP2008/000408 WO2008120440A1 (ja) 2007-03-02 2008-02-29 符号化装置および符号化方法
AU2008233888A AU2008233888B2 (en) 2007-03-02 2008-02-29 Encoding device and encoding method
CN201410119876.8A CN103903626B (zh) 2007-03-02 2008-02-29 语音编码装置、语音解码装置、语音编码方法以及语音解码方法
CN200880006787.5A CN101622662B (zh) 2007-03-02 2008-02-29 编码装置和编码方法
RU2009132934/08A RU2471252C2 (ru) 2007-03-02 2008-02-29 Устройство кодирования и способ кодирования
KR1020097018303A KR101414354B1 (ko) 2007-03-02 2008-02-29 부호화 장치 및 부호화 방법
MYPI20093440 MY147075A (en) 2007-03-02 2008-02-29 Encoding device, decoding device, encoding method and decoding method
BRPI0808428A BRPI0808428A8 (pt) 2007-03-02 2008-02-29 Dispostivo de codificação e método de codificação
US12/528,659 US8554549B2 (en) 2007-03-02 2008-02-29 Encoding device and method including encoding of error transform coefficients
SG2012005971A SG178728A1 (en) 2007-03-02 2008-02-29 Encoding device and encoding method
RU2012135697/08A RU2579663C2 (ru) 2007-03-02 2012-08-20 Устройство кодирования и способ кодирования
RU2012135696/08A RU2579662C2 (ru) 2007-03-02 2012-08-20 Устройство кодирования и способ кодирования
US13/965,644 US8918315B2 (en) 2007-03-02 2013-08-13 Encoding apparatus, decoding apparatus, encoding method and decoding method
US13/965,634 US8918314B2 (en) 2007-03-02 2013-08-13 Encoding apparatus, decoding apparatus, encoding method and decoding method

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2007053502 2007-03-02
JP2007053502 2007-03-02
JP2007133545 2007-05-18
JP2007133545 2007-05-18
JP2007185077 2007-07-13
JP2007185077 2007-07-13
JP2008045259A JP4871894B2 (ja) 2007-03-02 2008-02-26 符号化装置、復号装置、符号化方法および復号方法

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2008148511A Division JP5403949B2 (ja) 2007-03-02 2008-06-05 符号化装置および符号化方法
JP2011089954A Division JP5236040B2 (ja) 2007-03-02 2011-04-14 符号化装置、復号装置、符号化方法および復号方法

Publications (2)

Publication Number Publication Date
JP2009042734A JP2009042734A (ja) 2009-02-26
JP4871894B2 true JP4871894B2 (ja) 2012-02-08

Family

ID=39808027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008045259A Active JP4871894B2 (ja) 2007-03-02 2008-02-26 符号化装置、復号装置、符号化方法および復号方法

Country Status (11)

Country Link
US (3) US8554549B2 (ja)
EP (1) EP2128857B1 (ja)
JP (1) JP4871894B2 (ja)
KR (1) KR101414354B1 (ja)
CN (3) CN101622662B (ja)
AU (1) AU2008233888B2 (ja)
BR (1) BRPI0808428A8 (ja)
MY (1) MY147075A (ja)
RU (3) RU2471252C2 (ja)
SG (2) SG178727A1 (ja)
WO (1) WO2008120440A1 (ja)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101548318B (zh) * 2006-12-15 2012-07-18 松下电器产业株式会社 编码装置、解码装置以及其方法
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
EP2237269B1 (en) * 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
JP5764488B2 (ja) 2009-05-26 2015-08-19 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 復号装置及び復号方法
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
EP2490216B1 (en) * 2009-10-14 2019-04-24 III Holdings 12, LLC Layered speech coding
JP5295380B2 (ja) * 2009-10-20 2013-09-18 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
WO2011058752A1 (ja) 2009-11-12 2011-05-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP5746974B2 (ja) 2009-11-13 2015-07-08 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置およびこれらの方法
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
CN104392726B (zh) * 2010-03-31 2018-01-02 韩国电子通信研究院 编码设备和解码设备
US9508356B2 (en) * 2010-04-19 2016-11-29 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
US8751225B2 (en) * 2010-05-12 2014-06-10 Electronics And Telecommunications Research Institute Apparatus and method for coding signal in a communication system
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
BR112013016438B1 (pt) 2010-12-29 2021-08-17 Samsung Electronics Co., Ltd Método de codificação, método de decodificação, e mídia de gravação legível por computador não transitória
RU2554554C2 (ru) * 2011-01-25 2015-06-27 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи
CN103443856B (zh) * 2011-03-04 2015-09-09 瑞典爱立信有限公司 音频编码中的后量化增益校正
EP2696343B1 (en) * 2011-04-05 2016-12-21 Nippon Telegraph And Telephone Corporation Encoding an acoustic signal
DK2697795T3 (en) 2011-04-15 2015-09-07 Ericsson Telefon Ab L M ADAPTIVE SHARING Gain / FORM OF INSTALLMENTS
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
WO2013002696A1 (en) * 2011-06-30 2013-01-03 Telefonaktiebolaget Lm Ericsson (Publ) Transform audio codec and methods for encoding and decoding a time segment of an audio signal
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
RU2601188C2 (ru) 2012-02-23 2016-10-27 Долби Интернэшнл Аб Способы и системы для эффективного восстановления высокочастотного аудиоконтента
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
IN2015DN04001A (ja) * 2012-11-07 2015-10-02 Dolby Int Ab
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
CN110619884B (zh) * 2014-03-14 2023-03-07 瑞典爱立信有限公司 音频编码方法和装置
WO2015146224A1 (ja) * 2014-03-24 2015-10-01 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
PL3594945T3 (pl) * 2014-05-01 2021-05-04 Nippon Telegraph And Telephone Corporation Kodowanie sygnału dźwiękowego
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
CN106096892A (zh) * 2016-06-22 2016-11-09 严东军 供应链随货单编码及其编码规则和使用方法
JP7009509B2 (ja) 2017-05-18 2022-01-25 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ネットワーク装置の管理
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483882A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
CN110874402A (zh) * 2018-08-29 2020-03-10 北京三星通信技术研究有限公司 基于个性化信息的回复生成方法、设备和计算机可读介质
US11361776B2 (en) * 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
WO2021046136A1 (en) * 2019-09-03 2021-03-11 Dolby Laboratories Licensing Corporation Audio filterbank with decorrelating components
CN115171709B (zh) * 2022-09-05 2022-11-18 腾讯科技(深圳)有限公司 语音编码、解码方法、装置、计算机设备和存储介质

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03263100A (ja) * 1990-03-14 1991-11-22 Mitsubishi Electric Corp 音声符号化・復号化装置
SG47025A1 (en) * 1993-03-26 1998-03-20 Motorola Inc Vector quantizer method and apparatus
KR100269213B1 (ko) * 1993-10-30 2000-10-16 윤종용 오디오신호의부호화방법
JP3186007B2 (ja) 1994-03-17 2001-07-11 日本電信電話株式会社 変換符号化方法、復号化方法
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
CA2213909C (en) * 1996-08-26 2002-01-22 Nec Corporation High quality speech coder at low bit rates
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
JP3063668B2 (ja) * 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
JP4281131B2 (ja) 1998-10-22 2009-06-17 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
BR9906090A (pt) * 1999-12-22 2001-07-24 Conselho Nacional Cnpq Sìntese de um potente agonista paramagnético (epm-3) do hormÈnio estimulador de melanócito contendo radical livre estável em forma de aminoácido
US7013268B1 (en) * 2000-07-25 2006-03-14 Mindspeed Technologies, Inc. Method and apparatus for improved weighting filters in a CELP encoder
EP1199812A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
JP3881946B2 (ja) * 2002-09-12 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
FR2849727B1 (fr) 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
JP2004302259A (ja) 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 音響信号の階層符号化方法および階層復号化方法
WO2004097796A1 (ja) * 2003-04-30 2004-11-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置及びこれらの方法
KR20060131793A (ko) * 2003-12-26 2006-12-20 마츠시타 덴끼 산교 가부시키가이샤 음성ㆍ악음 부호화 장치 및 음성ㆍ악음 부호화 방법
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
JP4464707B2 (ja) * 2004-02-24 2010-05-19 パナソニック株式会社 通信装置
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
JP4871501B2 (ja) 2004-11-04 2012-02-08 パナソニック株式会社 ベクトル変換装置及びベクトル変換方法
EP2752849B1 (en) * 2004-11-05 2020-06-03 Panasonic Intellectual Property Management Co., Ltd. Encoder and encoding method
US7983904B2 (en) * 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
US20080162148A1 (en) * 2004-12-28 2008-07-03 Matsushita Electric Industrial Co., Ltd. Scalable Encoding Apparatus And Scalable Encoding Method
EP1858006B1 (en) 2005-03-25 2017-01-25 Panasonic Intellectual Property Corporation of America Sound encoding device and sound encoding method
DE602006011600D1 (de) 2005-04-28 2010-02-25 Panasonic Corp Audiocodierungseinrichtung und audiocodierungsverfahren
US8433581B2 (en) 2005-04-28 2013-04-30 Panasonic Corporation Audio encoding device and audio encoding method
WO2006120931A1 (ja) * 2005-05-11 2006-11-16 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置及びこれらの方法
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
JP4170326B2 (ja) 2005-08-16 2008-10-22 富士通株式会社 メール送受信プログラムおよびメール送受信装置
WO2007052612A1 (ja) 2005-10-31 2007-05-10 Matsushita Electric Industrial Co., Ltd. ステレオ符号化装置およびステレオ信号予測方法
JP2007133545A (ja) 2005-11-09 2007-05-31 Fujitsu Ltd 運用管理プログラムおよび運用管理方法
JP2007185077A (ja) 2006-01-10 2007-07-19 Yazaki Corp ワイヤーハーネス固定具
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
WO2007119368A1 (ja) 2006-03-17 2007-10-25 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
EP2017830B9 (en) * 2006-05-10 2011-02-23 Panasonic Corporation Encoding device and encoding method
EP1887118B1 (de) 2006-08-11 2012-06-13 Groz-Beckert KG Bestückungsset zur Bestückung einer gegebenen Anzahl von Systemteilen einer Strickmaschine, insbesondere einer Rundstrickmaschine
US8352258B2 (en) * 2006-12-13 2013-01-08 Panasonic Corporation Encoding device, decoding device, and methods thereof based on subbands common to past and current frames
US20100017199A1 (en) * 2006-12-27 2010-01-21 Panasonic Corporation Encoding device, decoding device, and method thereof
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置

Also Published As

Publication number Publication date
US8554549B2 (en) 2013-10-08
CN101622662A (zh) 2010-01-06
CN101622662B (zh) 2014-05-14
RU2579663C2 (ru) 2016-04-10
US8918314B2 (en) 2014-12-23
EP2128857A4 (en) 2013-08-14
EP2128857A1 (en) 2009-12-02
JP2009042734A (ja) 2009-02-26
US8918315B2 (en) 2014-12-23
EP2128857B1 (en) 2018-09-12
AU2008233888B2 (en) 2013-01-31
CN102411933B (zh) 2014-05-14
RU2471252C2 (ru) 2012-12-27
US20130325457A1 (en) 2013-12-05
US20100017204A1 (en) 2010-01-21
CN102411933A (zh) 2012-04-11
BRPI0808428A8 (pt) 2016-12-20
RU2579662C2 (ru) 2016-04-10
RU2012135697A (ru) 2014-02-27
CN103903626B (zh) 2018-06-22
CN103903626A (zh) 2014-07-02
KR101414354B1 (ko) 2014-08-14
BRPI0808428A2 (pt) 2014-07-22
SG178728A1 (en) 2012-03-29
KR20090117890A (ko) 2009-11-13
US20130332154A1 (en) 2013-12-12
RU2012135696A (ru) 2014-02-27
RU2009132934A (ru) 2011-03-10
WO2008120440A1 (ja) 2008-10-09
MY147075A (en) 2012-10-31
AU2008233888A1 (en) 2008-10-09
SG178727A1 (en) 2012-03-29

Similar Documents

Publication Publication Date Title
JP4871894B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
JP4708446B2 (ja) 符号化装置、復号装置およびそれらの方法
JP5404418B2 (ja) 符号化装置、復号装置および符号化方法
JP5236040B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
US20100017197A1 (en) Voice coding device, voice decoding device and their methods
JP5236032B2 (ja) 音声符号化装置、音声復号装置およびそれらの方法
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ
WO2011058752A1 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111101

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111121

R150 Certificate of patent or registration of utility model

Ref document number: 4871894

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350