JP2009042739A - 符号化装置、復号装置およびそれらの方法 - Google Patents

符号化装置、復号装置およびそれらの方法 Download PDF

Info

Publication number
JP2009042739A
JP2009042739A JP2008148510A JP2008148510A JP2009042739A JP 2009042739 A JP2009042739 A JP 2009042739A JP 2008148510 A JP2008148510 A JP 2008148510A JP 2008148510 A JP2008148510 A JP 2008148510A JP 2009042739 A JP2009042739 A JP 2009042739A
Authority
JP
Japan
Prior art keywords
band
encoding
target frequency
unit
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008148510A
Other languages
English (en)
Other versions
JP5294713B2 (ja
Inventor
Masahiro Oshikiri
正浩 押切
Tomohito Yamanashi
智史 山梨
Toshiyuki Morii
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2008148510A priority Critical patent/JP5294713B2/ja
Publication of JP2009042739A publication Critical patent/JP2009042739A/ja
Application granted granted Critical
Publication of JP5294713B2 publication Critical patent/JP5294713B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】全帯域の中から誤差が大きい帯域を少ない演算量で正確に特定すること。
【解決手段】第1位置特定部201は、入力信号に対する復号信号の誤差を示す第1レイヤ誤差変換係数を用いて、入力信号の全帯域に渡って、相対的に広い帯域幅で誤差が大きい帯域を探索し、特定した帯域を示す第1位置情報を生成し、第2位置特定部202は、第1位置特定部201で特定された帯域において、相対的に狭い帯域幅で誤差が大きいターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す第2位置情報を生成し、符号化部203は、ターゲット周波数帯域に含まれる第1レイヤ復号誤差変換係数を符号化して符号化情報を生成する。第1位置情報、第2位置情報および符号化情報は、通信相手に送信される。
【選択図】図2

Description

本発明は、スケーラブル符号化方式の通信システムに使用される符号化装置、復号装置およびそれらの方法に関する。
移動体通信システムでは、電波資源等の有効利用のために、音声信号を低ビットレートに圧縮して伝送することが要求されている。その一方で、通話音声の品質向上や臨場感の高い通話サービスの実現も望まれており、その実現には、音声信号の高品質化のみならず、より帯域の広いオーディオ信号等、音声信号以外の信号をも高品質に符号化することが望ましい。
このように相反する2つの要求に対し、複数の符号化技術を階層的に統合する技術が有望視されている。この技術は、音声信号に適したモデルで入力信号を低ビットレートで符号化する第1レイヤと、入力信号と第1レイヤの復号信号との差分信号を音声以外の信号にも適したモデルで符号化する第2レイヤとを階層的に組み合わせるものである。このように階層的に符号化を行う技術は、符号化装置から得られるビットストリームにスケーラビリティ性、すなわち、ビットストリームの一部の情報からでも復号信号を得ることができる性質を有するため、一般的にスケーラブル符号化(階層符号化)と呼ばれている。
スケーラブル符号化方式は、その性質から、ビットレートの異なるネットワーク間の通信に柔軟に対応することができるので、IPプロトコルで多様なネットワークが統合されていく今後のネットワーク環境に適したものと言える。
MPEG−4(Moving Picture Experts Group phase-4)で規格化された技術を用いてスケーラブル符号化を実現する例として、例えば、非特許文献1に開示されている技術がある。この技術は、第1レイヤにおいて、音声信号に適したCELP(Code Excited Linear Prediction;符号励振線形予測)符号化を用い、第2レイヤにおいて、原信号から第1レイヤ復号信号を減じた残差信号に対して、AAC(Advanced Audio Coder)やTwinVQ(Transform Domain Weighted Interleave Vector Quantization;周波数領域重み付きインターリーブベクトル量子化)等の変換符号化を用いる。
一方、非特許文献2は、基本構成単位としてモジュール化されたTwinVQを用いて所望の周波数帯域のMDCT係数を階層的に符号化する手法を開示している。当該モジュールを共通化して複数回使用することにより、シンプルかつ自由度の高いスケーラブル符号化を実現できる。この手法では、各階層(レイヤ)の符号化対象となるサブバンドはあらかじめ決められている構成が基本となるが、入力信号の性質に応じて各階層レイヤの符号化対象となるサブバンドの位置をあらかじめ定められた帯域の中で変動させる構成も開示されている。
三木弼一編著、「MPEG−4のすべて」、初版、(株)工業調査会、1998年9月30日、p.126−127 神明夫他、「階層的変換符号化基本モジュールによって構成されるスケーラブル楽音符号化」、電子情報通信学会論文誌A, Vol. J83-A, No.3, pp.241-252, 2000年3月 "AMR Wideband Speech Codec; Transcoding functions", 3GPP TS 26.190, March 2001. "Source-Controlled-Variable-Rate Multimode Wideband Speech Codec (VMR-WB), Service options 62 and 63 for Spread Spectrum Systems", 3GPP2 C.S0052-A, April 2005. "ピッチフィルタリングによる帯域拡張技術を用いた7/10/15 kHz帯域スケーラブル音声符号化方式", 音講論集3-11-4, pp.327-328, March 2004.
しかしながら、出力信号の音声品質を改善する上で、第2レイヤ符号化部のサブバンド(ターゲット周波数帯域)をどのように設定するかが重要となる。非特許文献2に開示の手法に従えば、第2レイヤの符号化対象となるサブバンドはあらかじめ決められている(図21(A))。この場合、常に所定のサブバンドの品質を上げることになるため、そのサブバンド以外の帯域に誤差成分が集中している場合に十分な音声品質の改善効果は得られないという問題がある。
また、入力信号の性質に応じて、各階層(レイヤ)の符号化対象となるサブバンドの位置をあらかじめ定められた帯域の中で変動させる(図21(B))ことが記載されているが、サブバンドの採りえる位置が所定の帯域の中に限定されてしまうので、前述した課題を解決することにはならない。また、仮にサブバンドの採りえる帯域が入力信号の全帯域にわたる(図21(C))ようにした場合、サブバンドの位置を特定するための演算量が増加してしまうという問題がある。さらに、レイヤ数を増やしたときに、レイヤ毎にサブバンドの位置を特定する必要があるため、この問題は顕著になる。
本発明は、かかる点に鑑みてなされたものであり、スケーラブル符号化方式において、全帯域の中から誤差が大きい帯域を少ない演算量で正確に特定することができる符号化装置、復号装置およびそれらの方法を提供することを目的とする。
本発明の符号化装置は、入力信号を変換係数に変換する変換手段と、符号化の対象となるターゲット周波数帯域を特定する特定手段と、前記変換係数のうち、ターゲット周波数帯域に含まれる変換係数を符号化する符号化手段と、を具備し、前記特定手段は、前記ターゲット周波数帯域よりも広い帯域幅で前記変換係数が最も大きい第1帯域を、所定の第1刻み幅で探索し、特定した第1帯域を示す第1位置情報を生成する第1位置特定手段と、前記第1帯域に渡って、前記第1刻み幅より細かい第2刻み幅で前記ターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す第2位置情報を生成する第2位置特定手段と、前記第1位置情報、前記第2位置情報により特定されたターゲット周波数帯域に含まれる前記変換係数を符号化して符号化情報を生成する符号化手段と、を具備する構成を採る。
本発明の復号装置は、符号化の対象となるターゲット周波数帯域に含まれる変換係数に対して符号化処理を行って得られた符号化データ、前記ターゲット周波数よりも広い帯域幅で前記変換係数が最も大きい第1帯域を示す第1位置情報、および前記第1位置帯域の中の前記ターゲット周波数帯域を示す第2位置情報を受信する受信手段と、前記符号化データを復号して復号変換係数を生成する復号手段と、前記第1位置情報および前記第2位置情報に基づいて前記ターゲット周波数帯域を特定し、前記復号変換係数を前記ターゲット周波数帯域に配置する配置手段と、を具備する構成を採る。
本発明の符号化方法は、入力信号を変換係数に変換する変換ステップと、符号化の対象となるターゲット周波数帯域を特定する特定ステップと、前記変換係数のうち、ターゲット周波数帯域に含まれる変換係数を符号化する符号化ステップと、を具備し、前記特定ステップは、前記ターゲット周波数帯域よりも広い帯域幅で前記変換係数が最も大きい第1帯域を、所定の第1刻み幅で探索し、特定した第1帯域を示す第1位置情報を生成する第1位置特定ステップと、前記第1帯域に渡って、前記第1刻み幅より細かい第2刻み幅で前記ターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す第2位置情報を生成する第2位置特定ステップと、前記第1位置情報、前記第2位置情報により特定されたターゲット周波数帯域に含まれる前記変換係数を符号化して符号化情報を生成する符号化ステップと、を具備する方法を採る。
本発明の復号方法は、符号化の対象となるターゲット周波数帯域に含まれる変換係数に対して符号化処理を行って得られた符号化データ、前記ターゲット周波数よりも広い帯域幅で前記変換係数が最も大きい第1帯域を示す第1位置情報、および前記第1位置帯域の中の前記ターゲット周波数帯域を示す第2位置情報を受信する受信ステップと、前記符号化データを復号して復号変換係数を生成する復号ステップと、前記第1位置情報および前記第2位置情報に基づいて前記ターゲット周波数帯域を特定し、前記復号変換係数を前記ターゲット周波数帯域に配置する配置ステップと、を具備する方法を採る。
本発明によれば、第1位置特定手段より入力信号の全帯域に渡って、相対的に広い帯域幅、および相対的に粗い刻み幅で、誤差が大きい帯域を探索して特定し、第2位置特定手段は、第1位置特定手段により特定された帯域において、相対的に狭い帯域幅、および相対的に細かい刻み幅でターゲット周波数帯域(誤差が最も大きい周波数帯域)を探索して特定することにより、全帯域の中から誤差が大きい帯域を少ない演算量で正確に特定することができ、音質を改善することができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る符号化装置の主要な構成を示すブロック図である。図1に示す符号化装置100は、周波数領域変換部101と、第1レイヤ符号化部102と、第1レイヤ復号部103と、減算部104と、第2レイヤ符号化部105と、多重化部106とを備える。
周波数領域変換部101は、時間領域の入力信号を周波数領域の信号(入力変換係数)に変換し、入力変換係数を第1レイヤ符号化部102に出力する。
第1レイヤ符号化部102は、入力変換係数に対して符号化処理を行い、第1レイヤ符号化データを生成し、この第1レイヤ符号化データを第1レイヤ復号部103および多重化部106に出力する。
第1レイヤ復号部103は、第1レイヤ符号化データを用いて復号処理を行い、第1レイヤ復号変換係数を生成し、減算部104に出力する。
減算部104は、入力変換係数から第1レイヤ復号部103で生成された第1レイヤ復号変換係数を減じて第1レイヤ誤差変換係数を生成し、この第1レイヤ誤差変換係数を第2レイヤ符号化部105に出力する。
第2レイヤ符号化部105は、減算部104より出力された第1レイヤ誤差変換係数の符号化処理を行い、第2レイヤ符号化データを生成し、この第2レイヤ符号化データを多重化部106に出力する。
多重化部106は、第1レイヤ符号化部102で求められる第1レイヤ符号化データと第2レイヤ符号化部105で求められる第2レイヤ符号化データを多重化してビットストリームを形成し、これを最終的な符号化データとして通信路に出力する。
図2は、図1に示した第2レイヤ符号化部105の構成を示すブロック図である。図2に示す第2レイヤ符号化部105は、第1位置特定部201と、第2位置特定部202と、符号化部203と、多重化部204とを備える。
第1位置特定部201は、減算部104から入力される第1レイヤ誤差変換係数を用いて、符号化の対象となるターゲット周波数帯域が採り得る帯域を、所定の帯域幅および所定の刻み幅で探索し、特定した帯域を示す情報を第1位置情報として、第2位置特定部202、符号化部203および多重化部204へ出力する。なお、第1位置特定部201の詳細については後述する。なお、この特定した帯域を、「範囲」もしくは「領域」などと言うこともできる。
第2位置特定部202は、第1位置特定部201より特定された帯域の中から、第1位置特定部201での帯域幅より狭い帯域幅、および第1位置特定部201での刻み幅より細かい刻み幅でターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す情報を第2位置情報として、符号化部203および多重化部204へ出力する。なお、第2位置特定部202の詳細については後述する。
符号化部203は、第1位置情報および第2位置情報により特定されたターゲット周波数帯域に含まれる第1レイヤ誤差変換係数を符号化し、符号化情報を生成して多重化部204に出力する。なお、符号化部203の詳細については後述する。
多重化部204は、第1位置情報、第2位置情報、符号化情報を多重化し、第2レイヤ符号化データを生成して出力する。なお、この多重化部204は必須ではなく、これらの情報を直接図1に示す多重化部106に出力しても良い。
図3は、図2に示した第1位置特定部201が特定する帯域を示す図である。
図3では、第1位置特定部201は、予め所定の帯域幅で設定される3つの帯域の中から1つを特定し、この帯域の位置情報を第1位置情報として、第2位置特定部202、符号化部203および多重化部204に出力する。図3に示す各帯域はターゲット周波数帯域以上の帯域幅を持つように設定される(帯域1はF以上F未満、帯域2はF以上F未満、帯域3はF以上F未満としている)。なお、本実施の形態では各帯域は同一の帯域幅を持つように設定されているが、各帯域が異なる帯域幅を持つように設定しても良い。例えば、人間の聴覚の臨界帯域幅のように、低域に位置する帯域の帯域幅は狭く、高域に位置する帯域の帯域幅は広くなるように設定しても良い。
次いで、第1位置特定部201による帯域の特定方法について説明する。ここでは、第1位置特定部201は、第1レイヤ誤差変換係数のエネルギーの大きさを基準に帯域を特定する。第1レイヤ誤差変換係数をe(k)と示し、各帯域に含まれる第1レイヤ誤差変換係数のエネルギーE(i)を次式(1)により算出する。
Figure 2009042739
ここで、iは帯域を特定する識別子、FRL(i)は帯域iの最低域周波数、FRH(i)は帯域iの最高域周波数を表す。
このように、第1レイヤ誤差変換係数のエネルギーが大きい帯域を特定し、誤差が大きい帯域に含まれる第1レイヤ誤差変換係数を符号化することにより、入力信号に対する復号信号の誤差が小さくなり、音声品質を改善することができる。
なお、第1レイヤ誤差変換係数のエネルギーの代わりに、次式(2)のように帯域幅で正規化した正規化エネルギーNE(i)を算出しても良い。
Figure 2009042739
また、帯域を特定する基準として、第1レイヤ誤差変換係数のエネルギーの代わりに、人間の聴感特性を反映した重み付けが行われた第1レイヤ誤差変換係数のエネルギーWE(i)、WNE(i)(帯域幅で正規化した正規化エネルギー)を、式(3)、(4)により算出しても良い。ここで、w(k)は人間の聴感特性に関連する重みを表す。
Figure 2009042739
Figure 2009042739
この場合、第1位置特定部201は、聴感特性上、重要度の高い周波数には重みを大きくして、その周波数を含む帯域が選択されやすいようにし、一方、重要度の低い周波数には重みを小さくして、その周波数を含む帯域が選択されにくいようにする。これにより、聴感的に重要な帯域が優先的に選択されるため、上記同様の音質改善の効果を得ることができる。この重みとして、例えば、入力信号または第1レイヤの復号信号を基に算出された聴覚マスキング閾値や、人間の聴覚のラウドネス特性を利用して求めたものを用いても良い。
また、帯域の選択法において、周波数が予め設定された基準周波数(Fx)よりも低い低域部に配置された帯域の中から帯域を選択するようにしても良い。図4の例では、帯域1〜帯域8の中から帯域を選択する。帯域の選択に制限(基準周波数)を設定する理由は次の通りである。音声信号の特徴の1つである調波構造またはハーモニクス構造(ある周波数間隔でスペクトルがピーク状に現れる構造)は、高域部に比べて低域部のピークが大きく現れ、符号化処理によって生じる量子化誤差(誤差スペクトルまたは誤差変換係数)においても同様に、高域部よりは低域部のピーク性が強くなる。そのため、たとえ、低域部の誤差スペクトル(誤差変換係数)のエネルギーが高域部と比べて小さくても、低域部の誤差スペクトル(誤差変換係数)のピーク性が高域部に比べ強くなる傾向にあることから、低域部の誤差スペクトル(誤差変換係数)が聴覚マスキング閾値(人間が音を感じ取ることのできる閾値)を超えやすくなり、その結果、聴感的な音質劣化を引き起こす。
この方法によれば、基準周波数を予め設定することにより、周波数が基準周波数(Fx)よりも高い高域部と比べて、誤差変換係数(または誤差ベクトル)のピーク性が強い低域部からターゲット周波数が決定されるため、誤差変換係数のピークを抑えることができ、音質を改善することができる。
さらに、帯域の選択法において、低中域部に配置されている帯域の中から帯域を選択するようにしても良い。図3の例では、帯域3は選択候補から除外し、帯域1および帯域2の中から帯域を選択する。これにより、低中域部の中からターゲット周波数帯域が決定されることになる。
以下では、第1位置特定部201は、帯域1を特定した場合に「1」を、帯域2を特定した場合に「2」を、帯域3を特定した場合に「3」を第1位置情報として出力する。
図5は、図2に示した第2位置特定部202が特定するターゲット周波数帯域の位置を示す図である。
第2位置特定部202は、第1位置特定部201により特定された帯域において、さらに細かい刻み幅でターゲット周波数帯域を特定し、そのターゲット周波数帯域の位置情報を第2位置情報として符号化部203および多重化部204に出力する。
次いで、第2位置特定部202によるターゲット周波数帯域の特定方法を説明する。ここでは、図2に示す第1位置特定部201から出力される第1位置情報が「2」である場合を例にして、ターゲット周波数帯域の幅をBWとする。また、帯域2の最低周波数Fを起点にし、この最低周波数Fを便宜上Gとする。そして、第2位置特定部202が特定することができるターゲット周波数帯域の最低周波数をG〜Gとする。なお、第2位置特定部202が特定するターゲット周波数帯域の刻み幅はG−Gn−1であり、一方、第1位置特定部201が特定する帯域の刻み幅はF−Fn−1(G−Gn−1<F−Fn−1)である。
第2位置特定部202は、最低周波数がそれぞれG、…、Gのターゲット周波数帯域候補から、第1レイヤ誤差変換係数のエネルギー又はそれに類する基準で、ターゲット周波数帯域を特定する。例えば、全てのG個のターゲット周波数帯域候補について、式(5)により第1レイヤ誤差変換係数のエネルギーを算出し、算出されたエネルギーE(n)が最大であるターゲット周波数帯域を特定し、このターゲット周波数帯域の位置情報を第2位置情報として出力する。
Figure 2009042739
なお、上記説明したように、人間の聴感特性を反映した重み付けが行われた第1レイヤ誤差変換係数のエネルギーWE(n)が基準となる場合、次式(6)によりWE(n)の算出を行う。ここで、w(k)は人間の聴感特性に関連する重みを表す。この重みとして、例えば、入力信号または第1レイヤの復号信号を基に算出された聴覚マスキング閾値や、人間の聴覚のラウドネス特性を利用して求めたものを用いても良い。
Figure 2009042739
この場合、第2位置特定部202は、聴感特性上、重要度の高い周波数には重みを大きくして、その周波数を含むターゲット周波数帯域が選択されやすいようにし、一方、重要度の低い周波数には重みを小さくして、その周波数を含むターゲット周波数帯域が選択されにくいようにする。これにより、聴感的に重要なターゲット周波数帯域が優先的に選択されるため、音質をさらに改善することができる。
図6は、図2に示した符号化部203の構成を示すブロック図である。図6に示す符号化部203は、目標信号構成部301と、誤差算出部302と、探索部303と、形状符号帳304と、ゲイン符号帳305とを備える。
目標信号構成部301は、第1位置特定部201から入力される第1位置情報と第2位置特定部202から入力される第2位置情報とを使用してターゲット周波数帯域を特定し、減算部104から入力される第1レイヤ誤差変換係数からターゲット周波数帯域に含まれる部分を抽出し、抽出された第1レイヤ誤差変換係数を目標信号として誤差算出部302に出力する。この第1誤差変換係数をe(k)と表す。
誤差算出部302は、誤差変換係数の形状を表す候補(形状候補)を格納する形状符号帳304から入力される第i番目の形状候補、誤差変換係数のゲインを表す候補(ゲイン候補)を格納するゲイン符号帳305から入力される第m番目のゲイン候補、および目標信号構成部301から入力される目標信号に基づいて、次式(7)により誤差Eを算出し、算出された誤差Eを探索部303に出力する。
Figure 2009042739
ここで、sh(i,k)は第i番目の形状候補、ga(m)は第m番目のゲイン候補を表す。
探索部303は、誤差算出部302により算出された誤差Eを基に、誤差Eが最小である形状候補とゲイン候補との組み合わせを探索し、探索結果である形状情報とゲイン情報とを符号化情報として、図2に示す多重化部204に出力する。ここで、形状情報は誤差Eを最小にするときのパラメータm、ゲイン情報は誤差Eを最小にするときのパラメータiを指す。
なお、誤差算出部302は、聴感的に重要なスペクトルに大きな重み付けを行うことにより聴感的に重要なスペクトルの影響を大きくし、次式(8)により誤差Eを求めても良い。ここで、w(k)は人間の聴感特性に関連する重みを表す。
Figure 2009042739
このように、聴感特性上、重要度の高い周波数には重みを大きくして、聴感特性上、重要度の高い周波数の量子化歪の影響を大きくし、一方、重要度の低い周波数には重みを小さくして、重要度の低い周波数の量子化歪の影響を小さくすることにより、主観品質を改善することができる。
図7は、本実施の形態に係る復号装置の主要な構成を示すブロック図である。図7に示す復号装置600は、分離部601と、第1レイヤ復号部602と、第2レイヤ復号部603と、加算部604と、切替部605と、時間領域変換部606と、ポストフィルタ607とを備える。
分離部601は、通信路を介して入力されるビットストリームを、第1レイヤ符号化データと第2レイヤ符号化データとに分離して、それぞれ第1レイヤ符号化データを第1レイヤ復号部602へ、第2レイヤ符号化データを第2レイヤ復号部603へ出力する。また、分離部601は、入力されるビットストリームに第1レイヤ符号化データおよび第2レイヤ符号化データの両者が含まれる場合には、「2」をレイヤ情報として切替部605に出力する。一方、分離部601は、ビットストリームに第1レイヤ符号化データしか含まれていない場合には、「1」をレイヤ情報として切替部605に出力する。なお、全ての符号化データが廃棄されている場合もあるが、その場合は各レイヤの復号部は所定の誤り補償処理を行い、ポストフィルタはレイヤ情報が「1」として処理を行うものとする。本実施の形態では、復号装置において、全ての符号化データまたは第2レイヤ符号化データが廃棄された符号化データのいずれかが得られることを前提として説明を行う。
第1レイヤ復号部602は、第1レイヤ符号化データの復号処理を行い、第1レイヤ復号変換係数を生成し、加算部604および切替部605に出力する。
第2レイヤ復号部603は、第2レイヤ符号化データの復号処理を行い、第1レイヤ復号誤差変換係数を生成し、加算部604に出力する。
加算部604は、第1レイヤ復号変換係数と第1レイヤ復号誤差変換係数を加算して第2レイヤ復号変換係数を生成し、切替部605に出力する。
切替部605は、分離部601から入力されるレイヤ情報に基づき、レイヤ情報が「1」の場合には第1レイヤ復号変換係数を、レイヤ情報が「2」の場合には第2レイヤ復号変換係数を、復号変換係数として時間領域変換部606に出力する。
時間領域変換部606は、復号変換係数を時間領域の信号に変換し復号信号を生成し、ポストフィルタ607に出力する。
ポストフィルタ607は、時間領域変換部606から出力される復号信号に対して、ポストフィルタ処理を行って、出力信号を生成する。
図8は、図7に示した第2レイヤ復号部603の構成を示す図である。図8に示す第2レイヤ復号部603は、形状符号帳701と、ゲイン符号帳702と、乗算部703と、配置部704とを備える。
形状符号帳701は、分離部601から出力された第2レイヤ符号化データに含まれる形状情報を基に形状候補sh(i,k)を選択して、乗算部703に出力する。
ゲイン符号帳702は、分離部601から出力された第2レイヤ符号化データに含まれるゲイン情報を基にゲイン候補ga(m)を選択して、乗算部703に出力する。
乗算部703は、形状候補sh(i,k)にゲイン候補ga(m)を乗じ、配置部704に出力する。
配置部704は、分離部601から出力された第2レイヤ符号化データに含まれる第1位置情報と第2位置情報とにより特定されるターゲット周波数帯域に、乗算部703から入力されるゲイン候補乗算後の形状候補を配置し、第1レイヤ復号誤差変換係数として、加算部604に出力する。
図9は、図8に示した配置部704から出力される第1レイヤ復号誤差変換係数の様子を示す図である。ここで、Fは第1位置情報により特定される周波数、Gは第2位置情報により特定される周波数を表す。
このように、本実施の形態によれば、第1位置特定部201が、入力信号の全帯域に渡って、所定の帯域幅および所定の刻み幅で誤差が大きい帯域を探索して特定し、第2位置特定部202は、第1位置特定部201により特定された帯域において、上記所定の帯域幅より狭い帯域幅、および上記所定の刻み幅より細かい刻み幅でターゲット周波数帯域を探索して特定することにより、全帯域の中から誤差が大きい帯域を少ない演算量で正確に特定することができ、音質を改善することができる。
(実施の形態2)
実施の形態2では、第2位置特定部202によるターゲット周波数帯域の別の特定方法について説明する。図10は、図2に示した第2位置特定部202が特定するターゲット周波数の位置を示す図である。本実施の形態に係る符号化装置の第2位置特定部は、実施の形態1で説明した符号化装置の第2位置特定部と異なっており、単一のターゲット周波数を特定する。単一のターゲット周波数に対応する誤差変換係数の形状候補はパルス(または線スペクトル)で表される。なお、本実施の形態において、符号化装置の構成は、符号化部203の内部構成を除いて、図1に示した符号化装置と同一であり、復号装置の構成は第2レイヤ復号部603の内部構成を除いて、図7に示した復号装置と同一であるので、これらの説明を省略し、第2位置特定に関連する符号化部203及び復号装置の第2レイヤ復号部603のみについて説明する。
本実施の形態では、第2位置特定部202は、第1位置特定部201により特定された帯域において、単一のターゲット周波数を特定する。従って、本実施の形態では、単一の第1レイヤ誤差変換係数が符号化の対象として選択される。ここでは、第1位置特定部201が帯域2を特定した場合を例にして説明する。ターゲット周波数帯域の帯域幅をBWとした場合、本実施の形態ではBW=1である。
具体的に、第2位置特定部202は、図10に示すように、帯域2に含まれる複数のターゲット周波数候補Gに対して、上記の式(5)により、それぞれの第1レイヤ誤差変換係数のエネルギーを算出し、または上記の式(6)により、それぞれの人間の聴感特性を反映した重み付けが行われた第1レイヤ誤差変換係数のエネルギーを算出する。また、第2位置特定部202は、算出したエネルギーが最大となるターゲット周波数G(1≦n≦N)を特定し、特定されたターゲット周波数Gの位置情報を第2位置情報として符号化部203に出力する。
図11は、図6に示した符号化部203の別の態様の構成を示すブロック図である。図11に示す符号化部203は、図6に対して形状符号帳305を削除した構成を採る。なお、この構成は形状符号帳304から出力される信号が常に「1」の場合に相当する。
符号化部203は、第2位置特定部202で特定されたターゲット周波数Gに含まれる第1レイヤ誤差変換係数を符号化し、符号化情報を生成して多重化部204に出力する。ここでは、第2位置特定部202から入力されるターゲット周波数は単一であり、符号化の対象となる第1レイヤ誤差変換係数も単一となるので、符号化部203は形状符号帳304からの形状情報を必要とせず、ゲイン符号帳305のみで探索を行い、探索結果のゲイン情報を符号化情報として、多重化部204に出力する。
図12は、図8に示した第2レイヤ復号部603の別の態様の構成を示すブロック図である。図12に示す第2レイヤ復号部603は、図8に対して、形状符号帳701と乗算部703とを削除した構成を採る。なお、この構成は形状符号帳701から出力される信号が常に「1」である場合に相当する。
配置部704は、分離部601から出力された第2レイヤ符号化データに含まれる第1位置情報と第2位置情報とにより特定される単一のターゲット周波数に、ゲイン情報によりゲイン符号帳から選択したゲイン候補を配置し、第1レイヤ復号誤差変換係数として、加算部604に出力する。
このように、本実施の形態によれば、第2位置特定部202は、第1位置特定部201により特定された帯域の中から単一のターゲット周波数を特定することにより、線スペクトルを正確に表すことができるため、母音のようなトーナリティの強い信号(多数のピークが観察されるスペクトル特性を有する信号)の音質を改善することができる。
(実施の形態3)
実施の形態3では、第2位置特定部によるターゲット周波数帯域の別の特定方法について説明する。なお、本実施の形態において、符号化装置の構成は、第2レイヤ符号化部105の内部構成を除いて、図1に示した符号化装置と同一であるので、その説明を省略する。
図13は、本実施の形態に係る符号化装置の第2レイヤ符号化部105の構成を示すブロック図である。図13に示す第2レイヤ符号化部105は、図2に対して、第2位置特定部202に代えて、第2位置特定部301を備える構成を採る。図2に示した第2レイヤ符号化部105と同一の構成には同一の番号を付し、その説明を省略する。
図13に示す第2位置特定部301は、第1サブ位置特定部311−1と、第2サブ位置特定部311−2と、…、第Jサブ位置特定部311−Jと、多重化部312とを備える。
複数のサブ位置特定部(311−1、…、311−J)は、第1位置特定部201より特定された帯域において、それぞれ異なるターゲット周波数を特定する。具体的には、第n番目のサブ位置特定部311−nは、第1位置特定部201より特定された帯域から第1〜第n−1番目のサブ位置特定部(311−1、…、311−n−1)が特定したターゲット周波数を除いた帯域において、第n番目のターゲット周波数を特定する。
図14は本実施の形態に係る符号化装置の複数のサブ位置特定部(311−1、…、311−J)が特定するターゲット周波数の位置を示す図である。ここでは、第1位置特定部201が帯域2を特定し、第2位置特定部301によりJ個のターゲット周波数の位置を特定する場合を例にして説明する。
図14(A)に示すように、第1サブ位置特定部311−1は、帯域2におけるターゲット周波数候補の中から1つのターゲット周波数を特定し(ここではG)、そのターゲット周波数の位置情報を多重化部312に出力するとともに第2サブ位置特定部311−2に出力する。
図14(B)に示すように、第2サブ位置特定部311−2は、帯域2から第1サブ位置特定部311−1が特定したターゲット周波数Gを除いたターゲット周波数の候補の中から1つのターゲット周波数を特定し(ここではGN−1)、そのターゲット周波数の位置情報を多重化部312に出力するとともに第3サブ位置特定部311−3に出力する。
同様に、図14(C)に示すように、第Jサブ位置特定部311−Jは、帯域2から第1〜第J−1サブ位置特定部(311−1、…、311−J−1)が特定したJ−1個のターゲット周波数を除いたターゲット周波数の候補の中から1つのターゲット周波数を選択し(ここではG)、それを特定する位置情報を多重化部312に出力する。
多重化部312は、サブ位置特定部(311−1、…311−J)から入力されるJ個の位置情報を多重して第2位置情報を生成し、符号化部203と多重化部204に出力する。なお、この多重化部312は必須ではなく、J個の位置情報を直接符号化部203および多重化部204に出力しても良い。
このように、第2位置特定部301は、第1位置特定部201により特定された帯域において、J個のターゲット周波数を特定し、複数個のピークを表現することができるため、母音のようなトーナリティの強い信号の音質を更に改善することができる。また、第1位置特定部201により特定された帯域の中からJ個のターゲット周波数を決定すれば良いため、全帯域の中からJ個のターゲット周波数を決定する場合に比べて、複数個のターゲット周波数の組み合わせ数を大幅に削減することできる。これにより、低ビットレート化および低演算量化を実現することができる。
(実施の形態4)
実施の形態4では、第2レイヤ符号化部105における別の符号化方法について説明する。なお、本実施の形態において、符号化装置の構成は、第2レイヤ符号化部105の内部構成を除いて、図1に示した符号化装置と同一であるので、その説明を省略する。
図15は、本実施の形態に係る符号化装置の他の態様の第2レイヤ符号化部105の構成を示すブロック図である。図15に示す第2レイヤ符号化部105は、図2に示した第2位置特定部202を有さず、更に、図2に示した符号化部203に代えて符号化部221を備える構成を採る。
符号化部221は、ターゲット周波数に含まれる誤差変換係数の符号化の際に生じる量子化歪が最小となるように第2位置情報を決定する。この第2位置情報は第2位置情報符号帳321に記憶されている。
図16は、図15に示した符号化部221の構成を示すブロック図である。図16に示す符号化部221は、図6に示した符号化部203に対して第2位置情報符号帳321を追加し、探索部303に代えて探索部322を備える構成を採る。なお、図6に示した符号化部203と同一の構成には同一の番号を付し、その説明を省略する。
第2位置情報符号帳321は、後述する探索部322からの制御信号に従い、記憶している第2位置情報の候補から1つの第2位置情報を選択し、目標信号構成部301に出力する。図16の第2位置情報符号帳321では、黒点はそれぞれの第2位置情報候補のターゲット周波数の位置を表す。
目標信号構成部301は、第1位置特定部201から入力される第1位置情報と第2位置情報符号帳321において選択された第2位置情報を用いてターゲット周波数を特定し、減算部104から入力される第1レイヤ誤差変換係数から特定したターゲット周波数に含まれる部分を抽出し、抽出された第1レイヤ誤差変換係数を目標信号として誤差算出部302に出力する。
探索部322は、誤差算出部302から入力される誤差Eを基に、誤差Eが最小となる形状候補とゲイン候補、そして第2位置情報候補の組み合わせを探索し、探索結果の形状情報、ゲイン情報および第2位置情報を符号化情報として、図15に示す多重化部204に出力する。また、探索部322は、第2位置情報候補を選択して目標信号構成部301に出力するという制御信号を第2位置情報符号帳321に出力する。
このように、本実施の形態によれば、ターゲット周波数に含まれる誤差変換係数の符号化の際に生じる量子化歪が最小となるように第2位置情報を決定するので、最終的な量子化歪が小さくなるため、音声品質を改善することができる。
なお、本実施の形態では、図16に示した第2位置情報符号帳321が、単一のターゲット周波数を要素として持つ第2位置情報候補を記憶する例について説明したが、本発明はこれに限らず、図17に示すように第2位置情報符号帳321は、複数個のターゲット周波数を要素として持つ第2位置情報候補を記憶しても良い。図17は、第2位置情報符号帳321に記憶している第2位置情報候補がそれぞれ3つのターゲット周波数を持つ場合の符号化部221を示す図である。
また、本実施の形態では、図16に示した誤差算出部302が、形状符号帳304およびゲイン符号帳305に基づいて誤差Eを算出する例について説明したが、本発明はこれに限らず、図18に示すように形状符号帳304を削除し、ゲイン符号帳305のみに基づいて誤差Eを算出してもよい。図18は、図15に示した符号化部221の別の構成を示すブロック図である。この構成は、形状符号帳304から出力される信号が常に「1」である場合に相当する。この場合、形状が複数個のパルスで構成され、形状符号帳304は不要になるため、探索部322はゲイン符号帳305および第2位置情報符号帳321のみを探索し、探索結果のゲイン情報および第2位置情報を符号化情報として、図15に示した多重化部204に出力する。
なお、本実施の形態では、第2位置情報符号帳321が、実際に記憶領域を確保して第2位置情報候補を記憶する形態を採ることを前提に説明したが、本発明はこれに限らず、第2位置情報符号帳321が、あらかじめ定められた処理手順に従い第2位置情報候補を生成するようにしても良い。この場合、第2位置情報符号帳321には記憶領域が不用となる。
(実施の形態5)
実施の形態5では、第1位置特定部による帯域の別の特定方法について説明する。なお、本実施の形態において、符号化装置の構成は、第2レイヤ符号化部105の内部構成を除いて、図1に示した符号化装置と同一であるので、その説明を省略する。
図19は本実施の形態に係る符号化装置の第2レイヤ符号化部105の構成を示すブロック図である。図19示す第2レイヤ符号化部105は、図2に示した第1位置特定部201に代えて、第1位置特定部231を備える構成を採る。
図示せぬ算出部は、入力信号に対してピッチ分析し、ピッチ周期を求め、求められたピッチ周期の逆数からピッチ周波数を算出する。なお、算出部は、第1レイヤ符号化部102の符号化処理によって生成された第1レイヤ符号化データからピッチ周波数を算出してもよい。この場合、第1レイヤ符号化データが送信されるため、ピッチ周波数を特定する情報を別途送信する必要がなくなる。また、算出部は、ピッチ周期を特定するピッチ周期情報を多重化部106に出力する。
第1位置特定部231は、図示せぬ算出部から入力されるピッチ周波数に基づいて、所定の相対的に広い帯域幅で帯域を特定し、特定された帯域の位置情報を第1位置情報として第2位置特定部202、符号化部203および多重化部204に出力する。
図20は、図19に示した第1位置特定部231が特定する帯域の位置を示す図である。図20に示す3つの帯域は、入力されるピッチ周波数PFを基に定められる基準周波数F〜Fの整数倍の近傍の帯域である。基準周波数は、ピッチ周波数PFに所定の値を加えて求められる周波数である。具体的な例として、ここでは−1、0、1をPFに加えた値とし、基準周波数はF=PF−1、F=PF、F=PF+1となる。
ピッチ周波数の整数倍を基準とした帯域を設定する理由は、音声信号には、特にピッチ周期性の強い母音部において、ピッチ周期の逆数(ピッチ周波数)の整数倍近傍にスペクトルのピークが立つという特徴(調波構造またはハーモニクス)があり、また、第1レイヤ誤差変換係数においてもピッチ周波数の整数倍近傍に大きな誤差が生じやすいからである。
このように、本実施の形態によれば、第1位置特定部231は、ピッチ周波数の整数倍近傍の帯域を特定するため、最終的に第2位置特定部202により特定されるターゲット周波数はピッチ周波数の近傍になるので、少ない演算量で音声品質を改善することができる。
(実施の形態6)
実施の形態6では、符号化処理において、高域部を雑音などによる近似信号で代用する方法を用いる第1レイヤ符号化部を有する符号化装置に、本発明による符号化方法を適用する場合について説明する。図22は本実施の形態に係る符号化装置220の主要な構成を示すブロック図である。図22に示す符号化装置220は、第1レイヤ符号化部2201と、第1レイヤ復号部2202と、遅延部2203と、減算部104と、周波数領域変換部101と、第2レイヤ符号化部105と、多重化部106とを備える。なお、図22の符号化装置220において、図1に示した符号化装置100と同様の構成要素には同一の番号を付し、その説明を省略する。
本実施の形態の第1レイヤ符号化部2201は、高域部を雑音などによる近似信号で代用する方式を採用する。具体的には、聴感的に重要度の低い高域部を近似信号で表し、その代わりに聴感的に重要な低域部(または低中域部)のビット配分を増やしてこの帯域の原信号に対する忠実度を向上させる。これにより、全体的な音質の向上を図る。例えば、AMR−WB方式(非特許文献3)やVMR−WB方式(非特許文献4)が挙げられる。
第1レイヤ符号化部2201は、入力信号を符号化して第1レイヤ符号化データを生成し、多重化部106及び第1レイヤ復号部2202に出力する。なお、第1レイヤ符号化部2201の詳細については後述する。
第1レイヤ復号部2202は、第1レイヤ符号化部2201から入力される第1レイヤ符号化データを用いて復号処理を行い、第1レイヤ復号信号を生成し、減算部104に出力する。なお、第1レイヤ復号部2202の詳細については後述する。
次いで、図23を用いて、第1レイヤ符号化部2201の詳細について説明する。図23は符号化装置220の第1レイヤ符号化部2201の構成を示すブロック図である。図23に示すように、第1レイヤ符号化部2201は、ダウンサンプリング部2210と、コア符号化部2220とから構成される。
ダウンサンプリング部2210は、時間領域の入力信号をダウンサンプリングして、所望のサンプリングレートに変換し、ダウンサンプリングした時間領域信号をコア符号化部2220に出力する。
コア符号化部2220は、ダウンサンプリング部2210の出力信号に対して符号化処理を行い、第1レイヤ符号化データを生成し、第1レイヤ復号部2202及び多重化部106に出力する。
次いで、図24を用いて第1レイヤ復号部2202の詳細について説明する。図24は符号化装置220の第1レイヤ復号部2202の構成を示すブロック図である。図24に示すように、第1レイヤ復号部2202は、コア復号部2230と、アップサンプリング部2240と、高域成分付与部2250と、から構成される。
コア復号部2230は、コア符号化部2220から入力される第1レイヤ符号化データを用いて復号処理を行って復号信号を生成し、アップサンプリング部2240に出力するとともに、復号処理によって求められた復号LPC係数を高域成分付与部2250に出力する。
アップサンプリング部2240は、コア復号部2230から出力された復号信号をアップサンプリングして、入力信号と同じサンプリングレートに変換し、アップサンプリング後の信号を高域成分付与部2250に出力する。
高域成分付与部2250は、ダウンサンプリング部2240よりアップサンプリングされた信号に対して、例えば非特許文献3および非特許文献4に記載されている方法により高域成分の近似信号を生成し、欠損した高域部を補う。
図25は、本実施の形態に係る符号化装置に対応する復号装置の主要な構成を示すブロック図である。図25の復号装置250は、図7に示した復号装置600と同様の基本構成を有しており、第1レイヤ復号部602に代えて、第1レイヤ復号部2501を備える。第1レイヤ復号部2501は符号化装置の第1レイヤ復号部2202と同様に、図示せぬコア復号部、アップサンプリング部及び高域成分付与部から構成される。ここでは、それらについての詳細な説明を省略する。
コア復号部より与えられる復号LPC係数によって構成される合成フィルタに、雑音信号のような符号化部および復号部で付加情報なしに生成できる信号を通し、合成フィルタの出力信号を高域成分の近似信号に用いる。このとき、入力信号の高域成分と第1レイヤ復号信号の高域成分が全く異なる波形となるため、減算部で求められる誤差信号の高域成分のエネルギーは入力信号の高域成分のエネルギーよりもむしろ大きくなってしまう。これにより、第2レイヤ符号化部では、聴感的な重要度が低い高域部に配置された帯域が選択されやすくなるという問題が生じる。
本実施の形態によれば、上記のように第1レイヤ符号化部2201の符号化処理において、高域部を雑音などによる近似信号で代用する方法を用いる符号化装置220において、予め設定された基準周波数よりも周波数が低い低域部から帯域を選択することにより、誤差信号(又は誤差変換係数)の高域部のエネルギーが増大されても、聴覚的な感度の高い低域部を第2レイヤ符号化部の符号化対象として選択することできるため、音質を改善することができる。
なお、本実施の形態では、高域部に関する情報を復号部に送らない構成を例にして説明したが、本発明はこれに限らず、例えば、非特許文献5のように高域部の信号を低域部に比べて低ビットレートで符号化して復号部に送る構成であっても良い。
また、図22に示す符号化装置220において、減算部104は、時間領域の信号同士の差をとる構成であるが、減算部は周波数領域の変換係数同士の差をとる構成にしても良い。この場合、周波数領域変換部101を遅延部2203と減算部104の間に配置して入力変換係数を求め、第1レイヤ復号部2202と減算部104の間に周波数領域変換部101を新たに追加して第1レイヤ復号変換係数を求める。そして、減算部104は入力変換係数と第1レイヤ復号変換係数の差をとり、その誤差変換係数を第2レイヤ符号化部に直接与える構成となる。この構成によれば、ある帯域では差をとり別の帯域では差はとらないなど、各帯域に適した減算処理が可能になり、音質をさらに改善することができる。
(実施の形態7)
実施の形態7では、他の構成の符号化装置及び復号装置において、本発明による符号化方法を適用する場合について説明する。図26は、本実施の形態に係る符号化装置260の主要な構成を示すブロック図である。
図26に示す符号化装置260は、図22に示した符号化装置220に対して、重みフィルタ部2601を追加した構成を有する。なお、図26の符号化装置260において、図22と同様の構成要素については同一の番号を付し、その説明を省略する。
重みフィルタ部2601は、減算部104から入力される誤差信号に聴感的な重み付けをするフィルタ処理を行い、フィルタ処理後の信号を周波数領域変換部101に出力する。重みフィルタ部2601は、入力信号のスペクトル包絡と逆のスペクトル特性を有し、入力信号のスペクトルを平坦化(白色化)もしくはそれに近いスペクトル特性に変化させる。例えば、重みフィルタW(z)は、第1レイヤ復号部2202で得られる復号LPC係数を用いて、次式(9)のように構成される。
Figure 2009042739
ここで、α(i)は復号LPC係数、NPはLPC係数の次数、そしてγはスペクトル平坦化(白色化)の程度を制御するパラメータであり、0≦γ≦1の範囲の値をとる。γが大きいほど平坦化の程度が大きくなり、例えばγには0.92を用いる。
図27に示す復号装置270は、図25に示した復号装置250に対して、合成フィルタ部2701を追加した構成を有する。なお、図27の復号装置270において、図25と同様の構成要素については同一の番号を付し、その説明を省略する。
合成フィルタ部2701は、時間領域変換部606から入力される信号に対して、平坦化されたスペクトルの特性を元の特性に復元するフィルタ処理を行い、フィルタ処理後の信号を加算部604に出力する。合成フィルタ部2701は、式(9)で表される重みフィルタと逆のスペクトル特性、すなわち入力信号のスペクトル包絡と同様の特性を有する。合成フィルタB(z)は、式(9)を用いて次式(10)のように表される。
Figure 2009042739
ここで、α(i)は復号LPC係数、NPはLPC係数の次数、そしてγはスペクトル平坦化(白色化)の程度を制御するパラメータであり、0≦γ≦1の範囲の値をとる。γが大きいほど平坦化の程度が大きくなり、例えばγには0.92を用いる。
一般的には、上記のような符号化装置及び復号装置において、音声信号のスペクトル包絡は低域部のエネルギーが高域部のエネルギーより大きく現れるため、合成フィルタを通す前の信号の符号化歪が低域部と高域部で同等であっても、合成フィルタを通した後では低域部の符号化歪が大きくなる。音声信号を低ビットレートに圧縮して転送する場合には符号化歪を十分に小さくすることができないため、前述したような復号部の合成フィルタ部の影響によって符号化歪の低域部のエネルギーが増大されてしまい、低域部の品質劣化が現れやすくなるという問題がある。
本実施の形態の符号化方法によれば、周波数が基準周波数よりも低い低域部からターゲット周波数が決定されるため、低域部が第2レイヤ符号化部105の符号化対象として選択されやすく、それにより低域部の符号化歪を小さくすることができる。すなわち、本実施の形態によれば、合成フィルタによって低域部が強調されても、低域部の符号化歪が知覚されにくくなるため、音質を改善する効果が得られる。
なお、本実施の形態では符号化装置260の減算部104を時間領域の信号同士の差をとる構成としたが、本発明はこれに限らず、周波数領域の変換係数同士の差をとる構成としても良い。具体的には、重みフィルタ部2601と周波数領域変換部101を遅延部2203と減算部104の間に配置して入力変換係数を求め、そして第1レイヤ復号部2202と減算部104の間に重みフィルタ部2601と周波数領域変換部101を新たに追加して第1レイヤ復号変換係数を求める。そして、減算部104では入力変換係数と第1レイヤ復号変換係数の差をとり、その誤差変換係数を第2レイヤ符号化部105に直接与える構成とする。この構成によれば、ある帯域では差をとり別の帯域では差はとらないなど、各帯域に適した減算処理が可能になり、音質をさらに改善することができる。
また、本実施の形態では、符号化装置220のレイヤ数が2である場合を例にして説明したが、本発明はこれに限らず、例えば、図28に示す符号化装置280のように、符号化階層をレイヤ数が2以上の構成としてもよい。
図28は符号化装置280の主要な構成を示すブロック図である。図1に示した符号化装置100に対して、第2レイヤ復号部2801と、第3レイヤ符号化部2802と、第3レイヤ復号部2803と、第4レイヤ符号化部2804と、2つの加算器2805を追加し、3つの減算部104を有する構成を採る。
図28に示す第3レイヤ符号化部2802と第4レイヤ符号化部2804は、図1に示した第2レイヤ符号化部105と同様の構成を有し、同様の動作を行い、第2レイヤ復号部2801と第3レイヤ復号部2803は、図1に示した第1レイヤ復号部103と同様の構成を有し、同様の動作を行う。ここでは、各レイヤ符号化部における帯域の位置について、図29を用いて説明する。
各レイヤ符号化部における帯域の配置の一例として、図29Aは、第2レイヤ符号化部における帯域の位置を示し、図29Bは、第3レイヤ符号化部における帯域の位置を示し、図29Cは、第4レイヤ符号化部における帯域の位置を示し、帯域数はそれぞれ4である。
より詳しく言うと、第2レイヤ符号化部105では、レイヤ2の基準周波数Fx(L2)を超えないように4つの帯域が配置され、第3レイヤ符号化部2802では、レイヤ3の基準周波数Fx(L3)を超えないように4つの帯域が配置され、第4レイヤ符号化部2804では、レイヤ4の基準周波数Fx(L4)を超えないよう帯域が配置されている。そして、各レイヤの基準周波数の間には、Fx(L2)<Fx(L3)<Fx(L4)の関係がある。すなわち、ビットレートが低いレイヤ2では、聴感的な感度の高い低域部の中から符号化の対象となる帯域を決定し、ビットレートが高くなる高位レイヤになるほど高域部まで含めた帯域の中から符号化の対象となる帯域を決定する。
このような構成を採ることにより、低位レイヤにおいて低域部を重視し、高位レイヤにおいてより広い帯域をカバーするようにするため、音声信号の高音質化を実現することができる。
図30は、図28に示した符号化装置280に対応する復号装置300の主要な構成を示すブロック図である。図30の復号装置300は、図7に示した復号装置600に対して、第3レイヤ復号部3001と第4レイヤ復号部3002と2つの加算器604とを追加した構成を有する。なお、第3レイヤ復号部3001と第4レイヤ復号部3002は、図7に示した復号装置600の第2レイヤ復号部603と同様の構成を有し、同様の動作を行うため、ここでは、その詳細な説明を省略する。
また、各レイヤ符号化部における帯域の配置の別の一例として、図31Aは第2レイヤ符号化部105における4つの帯域の位置を示し、図31Bは、第3レイヤ符号化部2802における6つの帯域の位置を示し、図31Cは、第4レイヤ符号化部2804における8つの帯域の位置を示す。
図31では、各レイヤ符号化部において、各帯域は等間隔に配置され、図31Aに示すような低位レイヤでは低域部に配置された帯域のみが符号化の対象となり、図31Bまたは図31Cに示すような高位レイヤになるほど符号化の対象となる帯域が増える。
このような構成によれば、各レイヤでは帯域が等間隔に配置され、低位レイヤでは符号化の対象となる帯域を選択する場合、選択候補である低域部に配置される帯域の数が少ないため、演算量とビットレートを削減することができる。
(実施の形態8)
本発明の実施の形態8は、第1位置特定部の動作のみにおいて実施の形態1と相違し、それを示すために、本実施の形態に係る第1位置特定部には「801」という番号を付す。第1位置特定部801は、符号化対象となるターゲット周波数が採り得る帯域を特定する際、全帯域をあらかじめ複数の部分帯域に分割し、各部分帯域において所定の帯域幅および所定の刻み幅で探索を行う。そして、第1位置特定部801は、探索により求められた各部分帯域内の帯域を結合して、符号化対象となるターゲット周波数が採り得る帯域とする。
本実施の形態に係る第1位置特定部801の動作について図32を用いて説明する。図32は、部分帯域数N=2であって、低域部をカバーするように部分帯域1が設定され、高域部をカバーするように部分帯域2が設定される場合を例示する。部分帯域1では、予め所定の帯域幅に設定された複数の帯域の中から1つの帯域が選択される(この帯域の位置情報を第1部分帯域位置情報と呼ぶ)。同様に、部分帯域2では、予め所定の帯域幅に設定された複数の帯域の中から1つの帯域が選択される(この帯域の位置情報を第2部分帯域位置情報と呼ぶ)。
次に、第1位置特定部801は、部分帯域1において選択された帯域と、部分帯域2において選択された帯域とを結合して結合帯域を構成する。この結合帯域が第1位置特定部801により特定される帯域となり、次いで第2位置特定部202は当該結合帯域を基に第2位置情報を特定する。例えば、部分帯域1で選択された帯域が帯域2、部分帯域2で選択された帯域が帯域4である場合、第1位置特定部801は、図32の下段に示されるようにこの2つの帯域を結合し、符号化対象となる周波数帯域が採り得る帯域とする。
図33は、部分帯域の数がNである場合に対応する第1位置特定部801の構成を示すブロック図である。図33において、減算部104から入力される第1レイヤ誤差変換係数は部分帯域1特定部811−1〜部分帯域N特定部811−Nそれぞれに与えられる。各々の部分帯域n特定部811−n(n=1〜N)は、所定の部分帯域nの中から1つの帯域を選択し、選択された帯域の位置を示す情報(第n部分帯域位置情報)を第1位置情報構成部812に出力する。
第1位置情報構成部812は、各々の部分帯域n特定部811−nから入力される第n部分帯域位置情報(n=1〜N)を用いて第1位置情報を構成し、当該第1位置情報を第2位置特定部202、符号化部203、および多重化部204に出力する。
図34は、第1位置情報構成部812において第1位置情報を構成する様子を例示する図である。この図において、第1位置情報構成部812は、第1部分帯域位置情報(A1ビット)〜第N部分帯域位置情報(ANビット)を順番に並べて第1位置情報を構成する。ここで、各々の第n部分帯域位置情報のビット長Anは、各部分帯域nに含まれる候補帯域の数により決まり、それぞれ異なる値を有しても良い。
図35は、本実施の形態の復号処理において、第1位置情報と第2位置情報とを用いて第1レイヤ復号誤差変換係数を求める様子を示す図である。ここでは、部分帯域数が2である場合を例にとって説明する。なお、以下の説明においては、実施の形態1に係る第2レイヤ復号部603を構成する各構成要素の名称および番号を流用する。
配置部704は、乗算部703から入力されるゲイン候補乗算後の形状候補に対して、第2位置情報を用いて再配置を行う。次に、配置部704は、第2位置情報を用いた再配置後の形状候補に対して、第1位置情報を用いてさらに部分帯域1および部分帯域2への再配置を行う。配置部704は、このようにして求められた信号を第1レイヤ復号誤差変換係数として出力する。
本実施の形態によれば、第1位置特定部は各々の部分帯域の中から1つの帯域を選択するため、部分帯域に少なくとも1つの復号スペクトルを配置することが可能となる。これにより、全帯域の中から1つの帯域を決定する実施形態に比べて、音質を改善したい複数の帯域をあらかじめ設定しておくことができる。例えば、低域部と高域部の両者の品質改善を同時に図りたい場合などに本実施の形態は有効である。
また、本実施の形態によれば、低位レイヤ(本実施の形態では第1レイヤ)において低ビットレートの符号化を行う場合でも、復号信号の主観品質を改善することができる。低位レイヤにCELP方式を用いる構成はその一例である。CELP方式は、波形マッチングに基づく符号化方式であるため、高域部に比べてエネルギーの大きい低域部の量子化歪がより小さくなるように符号化が行われる。その結果、高域部のスペクトルが減衰してしまい、こもり感(帯域感の欠如)として知覚される。その一方でCELP方式の符号化は低ビットレートの符号化方式であるため、低域の量子化歪を十分に抑えることができず、その量子化歪は雑音感として知覚されてしまう。本実施形態では、低域部と高域部の各々から符号化の対象となる帯域を選択するため、低域部の雑音感、高域部のこもり感という異なる2つの劣化要因を同時に解消し、主観品質を改善することが可能となる。
また、本実施の形態によれば、低域から選択された帯域および高域から選択された帯域を結合して結合帯域を構成し、この結合帯域の中でスペクトルの形状を決定するため、高域よりも低域の品質改善が必要なフレームでは、低域を重視したスペクトルの形状を選択し、低域よりも高域の品質改善が必要なフレームでは、高域を重視したスペクトルの形状を選択するという適応処理を行うことができ、主観品質を改善することができる。例えば、スペクトルの形状をパルスで表す場合、高域よりも低域の品質改善が必要なフレームでは低域に多くのパルスを配置し、低域よりも高域の品質改善が必要なフレームでは高域に多くのパルスを配置することができ、このような適応処理により、主観品質を改善することができる。
なお、本実施の形態のバリエーションとして、図36に示すように、特定の部分帯域において常に固定の帯域が選択されるようにしても良い。図36に示す例では、部分帯域2において常に帯域4が選択され、これが結合帯域の一部となっている。これにより、本実施の形態の効果と同様に、音質を改善したい帯域をあらかじめ設定しておくことが可能となり、かつ、例えば、部分帯域2の部分帯域位置情報が不用となるため、図34に示されたような第1位置情報を表すためのビット数をより小さくすることができる。
また、図36は、高域部(部分帯域2)において常に固定の範囲が選択される場合を例にとって示しているが、これに限定されず、低域部(部分帯域1)において常に固定の範囲が選択されるようにしても良いし、また図36には図示されていない中域部の部分帯域において、常に固定の範囲が選択されるようにしても良い。
また、本実施の形態のバリエーションとして、図37に示すように、各部分帯域において設定される候補帯域の帯域幅が異なっていても良い。図37においては、部分帯域1において設定されている候補帯域よりも部分帯域2において設定されている部分帯域の帯域幅が短い場合を例示している。
以上、本発明の実施の形態について説明した。
なお、各レイヤ符号化部における帯域の配置として、本発明では上記説明した例に限らず、例えば、低位レイヤでは各帯域の帯域幅を狭く、高位レイヤでは各帯域の帯域幅を広くするように構成しても良い。
また、上記の各実施の形態では、過去のフレームで選択した帯域に関連付けて現フレームの帯域を選択しても良い。例えば、前フレームで選択した帯域の近傍に位置する帯域の中から現フレームの帯域を決定してもよい。また、前フレームで選択した帯域の近傍に現フレームの帯域の候補を再配置し、その再配置された帯域の候補の中から現フレームの帯域を決定してもよい。また、範囲情報を数フレームに1度の割合で伝送し、範囲情報を伝送しないフレームでは過去に伝送された範囲情報が表す範囲を用いてもよい(帯域情報の間欠伝送)。
また、上記の各実施の形態では、低位レイヤで選択した帯域に関連付けて現在のレイヤの帯域を選択しても良い。例えば、低位レイヤで選択した帯域の近傍に位置する帯域の中から現在のレイヤの帯域を決定してもよい。低位レイヤで選択した帯域の近傍に現在のレイヤの帯域の候補を再配置し、その再配置された帯域の候補の中から現在のレイヤの帯域を決定してもよい。また、範囲情報を数フレームに1度の割合で伝送し、範囲情報を伝送しないフレームでは過去に伝送された範囲情報が表す範囲を用いてもよい(帯域情報の間欠伝送)。
なお、本発明は、スケーラブル符号化の階層数に制限はない。
また、上記実施の形態では、復号信号として音声信号を想定しているが、本発明はこれに限らず、例えば、オーディオ信号などでもよい。
また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
本発明は、スケーラブル符号化方式の通信システムに使用される符号化装置、復号装置等に用いるのに好適である。
本発明の実施の形態1に係る符号化装置の主要な構成を示すブロック図 図1に示した第2レイヤ符号化部の構成を示すブロック図 図2に示した第1位置特定部が特定する帯域の位置を示す図 図2に示した第1位置特定部が特定する帯域の他の位置を示す図 図2に示した第2位置特定部が特定するターゲット周波数帯域の位置を示す図 図2に示した符号化部の構成を示すブロック図 本発明の実施の形態1に係る復号装置の主要な構成を示すブロック図 図7に示した第2レイヤ復号部の構成を示す図 図8に示した配置部から出力される第1レイヤ復号誤差変換係数の様子を示す図 図2に示した第2位置特定部が特定するターゲット周波数の位置を示す図 図6に示した符号化部の別の態様の構成を示すブロック図 図8に示した第2レイヤ復号部の別の態様の構成を示すブロック図 本発明の実施の形態3に係る符号化装置の第2レイヤ符号化部の構成を示すブロック図 実施の形態3に係る符号化装置の複数のサブ位置特定部が特定するターゲット周波数の位置を示す図 本発明の実施の形態4に係る符号化装置の第2レイヤ符号化部の構成を示すブロック図 図15に示した符号化部の構成を示すブロック図 図16の第2位置情報符号帳に記憶するそれぞれの第2位置情報候補が3つのターゲット周波数を持つ場合の符号化部を示す図 図15に示した符号化部の別の構成を示すブロック図 本発明の実施の形態5に係る第2レイヤ符号化部の構成を示すブロック図 図19に示した第1位置特定部が特定する帯域の位置を示す図 従来の音声符号化装置の第2レイヤ符号化部の符号化帯域を示す図 実施の形態6に係る符号化装置の主要な構成を示すブロック図 図22に示した符号化装置の第1レイヤ符号化部の構成を示すブロック図 図22に示した符号化装置の第1レイヤ復号部の構成を示すブロック図 図22に示した符号化装置に対応する復号装置の主要な構成を示すブロック図 実施の形態7に係る符号化装置の主要な構成を示すブロック図 図26に示した符号化装置に対応する復号装置の主要な構成を示すブロック図 実施の形態7に係る他の態様の符号化装置の主要な構成を示すブロック図 図28に示した第2レイヤ符号化部における帯域の位置を示す図 図28に示した第3レイヤ符号化部における帯域の位置を示す図 図28に示した第4レイヤ符号化部における帯域の位置を示す図 図28に示した符号化装置に対応する復号装置の主要な構成を示すブロック図 図28に示した第2レイヤ符号化部における帯域の他の位置を示す図 図28に示した第3レイヤ符号化部における帯域の他の位置を示す図 図28に示した第4レイヤ符号化部における帯域の他の位置を示す図 実施の形態8に係る第1位置特定部の動作を説明するための図 実施の形態8に係る第1位置特定部の構成を示すブロック図 実施の形態8に係る第1位置情報構成部において第1位置情報を構成する様子を例示する図 実施の形態8に係る復号処理を説明するための図 実施の形態8に係るバリエーションを説明するための図 実施の形態8に係るバリエーションを説明するための図
符号の説明
101 周波数領域変換部
102、2201 第1レイヤ符号化部
103、2202 第1レイヤ復号部
104 減算部
105 第2レイヤ符号化部
106、204 多重化部
201、801 第1位置特定部
202 第2位置特定部
203、221 符号化部
301 目標信号構成部
302 誤差算出部
303 探索部
304 形状符号帳
305 ゲイン符号帳
311−1、…、311−J サブ位置特定部
321 第2位置情報符号帳
601 分離部
602、2501 第1レイヤ復号部
603、2502 第2レイヤ復号部
604 加算部
605 切替部
606 時間領域変換部
607 ポストフィルタ
701 形状符号帳
702 ゲイン符号帳
703 乗算部
704 配置部
2203 遅延部
2210 ダウンサンプリング部
2220 コア符号化部
2230 コア復号部
2240 アップサンプリング部
2250 高域成分付与部
2601 重みフィルタ部
2701 合成フィルタ部
2801 第2レイヤ復号部
2802 第3レイヤ符号化部
2803 第3レイヤ復号部
2804 第4レイヤ符号化部
3001 第3レイヤ復号部
3002 第4レイヤ復号部

Claims (14)

  1. 入力信号を変換係数に変換する変換手段と、
    符号化の対象となるターゲット周波数帯域を特定する特定手段と、
    前記変換係数のうち、ターゲット周波数帯域に含まれる変換係数を符号化する符号化手段と、を具備し、
    前記特定手段は、
    前記ターゲット周波数帯域よりも広い帯域幅で前記変換係数が最も大きい第1帯域を、所定の第1刻み幅で探索し、特定した第1帯域を示す第1位置情報を生成する第1位置特定手段と、
    前記第1帯域に渡って、前記第1刻み幅より細かい第2刻み幅で前記ターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す第2位置情報を生成する第2位置特定手段と、
    前記第1位置情報、前記第2位置情報により特定されたターゲット周波数帯域に含まれる前記変換係数を符号化して符号化情報を生成する符号化手段と、
    を具備する符号化装置。
  2. 前記第2位置特定手段は、
    単一のターゲット周波数により前記ターゲット周波数帯域を特定する、
    請求項1に記載の符号化装置。
  3. 前記第2位置特定手段は、
    複数のターゲット周波数により前記ターゲット周波数帯域を特定する、
    請求項1に記載の符号化装置。
  4. 前記第2位置特定手段は、
    前記変換係数の符号化の際に生じる量子化歪みが最小となるように前記ターゲット周波数帯域を特定する、
    請求項1に記載の符号化装置。
  5. 前記第1位置特定手段は、
    前記変換係数のエネルギーの大きさを基準に前記第1帯域を特定する、
    請求項1に記載の符号化装置。
  6. 前記第1位置特定手段は、
    設定された基準周波数よりも低い低域部から前記第1帯域を特定する、
    請求項1に記載の符号化装置。
  7. 前記第1位置特定手段は、
    ピッチ周波数の整数倍を基準に前記第1帯域を特定する、
    請求項1に記載の符号化装置。
  8. 符号化処理のレイヤ数は、2以上であって、
    基準周波数は、高位レイヤほど高く設定され、
    前記第1位置特定手段は、
    レイヤ毎に前記各基準周波数よりも低い低域部から前記第1帯域を特定する、
    請求項1に記載の符号化装置。
  9. 前記第1位置特定手段は、
    全帯域を複数の部分帯域に分割し、前記複数の部分帯域各々において1つの帯域を選択し、選択された複数の帯域を結合した結合帯域を、前記第1帯域とする、
    請求項1記載の符号化装置。
  10. 前記第1位置特定手段は、
    前記複数の部分帯域の中の少なくとも1つにおいて、予め決められた固定の帯域を選択する、
    請求項9記載の符号化装置。
  11. 符号化の対象となるターゲット周波数帯域に含まれる変換係数に対して符号化処理を行って得られた符号化データ、前記ターゲット周波数よりも広い帯域幅で前記変換係数が最も大きい第1帯域を示す第1位置情報、および前記第1位置帯域の中の前記ターゲット周波数帯域を示す第2位置情報を受信する受信手段と、
    前記符号化データを復号して復号変換係数を生成する復号手段と、
    前記第1位置情報および前記第2位置情報に基づいて前記ターゲット周波数帯域を特定し、前記復号変換係数を前記ターゲット周波数帯域に配置する配置手段と、
    を具備する復号装置。
  12. 前記第2レイヤ復号手段は、
    前記第2レイヤ符号化データに含まれる形状情報およびゲイン情報を用いて復号を行う、
    請求項11記載の復号装置。
  13. 入力信号を変換係数に変換する変換ステップと、
    符号化の対象となるターゲット周波数帯域を特定する特定ステップと、
    前記変換係数のうち、ターゲット周波数帯域に含まれる変換係数を符号化する符号化ステップと、を具備し、
    前記特定ステップは、
    前記ターゲット周波数帯域よりも広い帯域幅で前記変換係数が最も大きい第1帯域を、所定の第1刻み幅で探索し、特定した第1帯域を示す第1位置情報を生成する第1位置特定ステップと、
    前記第1帯域に渡って、前記第1刻み幅より細かい第2刻み幅で前記ターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す第2位置情報を生成する第2位置特定ステップと、
    前記第1位置情報、前記第2位置情報により特定されたターゲット周波数帯域に含まれる前記変換係数を符号化して符号化情報を生成する符号化ステップと、
    を具備する符号化方法。
  14. 符号化の対象となるターゲット周波数帯域に含まれる変換係数に対して符号化処理を行って得られた符号化データ、前記ターゲット周波数よりも広い帯域幅で前記変換係数が最も大きい第1帯域を示す第1位置情報、および前記第1位置帯域の中の前記ターゲット周波数帯域を示す第2位置情報を受信する受信ステップと、
    前記符号化データを復号して復号変換係数を生成する復号ステップと、
    前記第1位置情報および前記第2位置情報に基づいて前記ターゲット周波数帯域を特定し、前記復号変換係数を前記ターゲット周波数帯域に配置する配置ステップと、
    を具備する復号方法。
JP2008148510A 2007-03-02 2008-06-05 符号化装置、復号装置およびそれらの方法 Active JP5294713B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008148510A JP5294713B2 (ja) 2007-03-02 2008-06-05 符号化装置、復号装置およびそれらの方法

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2007053498 2007-03-02
JP2007053498 2007-03-02
JP2007133525 2007-05-18
JP2007133525 2007-05-18
JP2007184546 2007-07-13
JP2007184546 2007-07-13
JP2008148510A JP5294713B2 (ja) 2007-03-02 2008-06-05 符号化装置、復号装置およびそれらの方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008044774A Division JP4708446B2 (ja) 2007-03-02 2008-02-26 符号化装置、復号装置およびそれらの方法

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2011054916A Division JP5236032B2 (ja) 2007-03-02 2011-03-14 音声符号化装置、音声復号装置およびそれらの方法
JP2011054917A Division JP5236033B2 (ja) 2007-03-02 2011-03-14 音声符号化装置、音声復号装置およびそれらの方法

Publications (2)

Publication Number Publication Date
JP2009042739A true JP2009042739A (ja) 2009-02-26
JP5294713B2 JP5294713B2 (ja) 2013-09-18

Family

ID=40443476

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2008148510A Active JP5294713B2 (ja) 2007-03-02 2008-06-05 符号化装置、復号装置およびそれらの方法
JP2011054916A Active JP5236032B2 (ja) 2007-03-02 2011-03-14 音声符号化装置、音声復号装置およびそれらの方法
JP2011054917A Active JP5236033B2 (ja) 2007-03-02 2011-03-14 音声符号化装置、音声復号装置およびそれらの方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2011054916A Active JP5236032B2 (ja) 2007-03-02 2011-03-14 音声符号化装置、音声復号装置およびそれらの方法
JP2011054917A Active JP5236033B2 (ja) 2007-03-02 2011-03-14 音声符号化装置、音声復号装置およびそれらの方法

Country Status (1)

Country Link
JP (3) JP5294713B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012032759A1 (ja) * 2010-09-10 2012-03-15 パナソニック株式会社 符号化装置及び符号化方法
WO2013051210A1 (ja) * 2011-10-07 2013-04-11 パナソニック株式会社 符号化装置及び符号化方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268693A (ja) * 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
JP2003216190A (ja) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP2004004710A (ja) * 2002-04-11 2004-01-08 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
WO2006046587A1 (ja) * 2004-10-28 2006-05-04 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
JP2007033833A (ja) * 2005-07-26 2007-02-08 Yamaha Corp オーサリング装置およびオーサリングプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI109393B (fi) * 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
CN100507485C (zh) * 2003-10-23 2009-07-01 松下电器产业株式会社 频谱编码装置和频谱解码装置
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
JP4977472B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 スケーラブル復号化装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268693A (ja) * 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
JP2003216190A (ja) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP2004004710A (ja) * 2002-04-11 2004-01-08 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
WO2005112001A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
WO2006046587A1 (ja) * 2004-10-28 2006-05-04 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
JP2007033833A (ja) * 2005-07-26 2007-02-08 Yamaha Corp オーサリング装置およびオーサリングプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012032759A1 (ja) * 2010-09-10 2012-03-15 パナソニック株式会社 符号化装置及び符号化方法
CN103069483A (zh) * 2010-09-10 2013-04-24 松下电器产业株式会社 编码装置以及编码方法
JP5679470B2 (ja) * 2010-09-10 2015-03-04 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置及び符号化方法
US9361892B2 (en) 2010-09-10 2016-06-07 Panasonic Intellectual Property Corporation Of America Encoder apparatus and method that perform preliminary signal selection for transform coding before main signal selection for transform coding
WO2013051210A1 (ja) * 2011-10-07 2013-04-11 パナソニック株式会社 符号化装置及び符号化方法
JPWO2013051210A1 (ja) * 2011-10-07 2015-03-30 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置及び符号化方法
US9558752B2 (en) 2011-10-07 2017-01-31 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method

Also Published As

Publication number Publication date
JP5236032B2 (ja) 2013-07-17
JP5236033B2 (ja) 2013-07-17
JP5294713B2 (ja) 2013-09-18
JP2011154383A (ja) 2011-08-11
JP2011154384A (ja) 2011-08-11

Similar Documents

Publication Publication Date Title
JP4708446B2 (ja) 符号化装置、復号装置およびそれらの方法
JP4871894B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
KR101366124B1 (ko) 오디오 인코딩/디코딩에서의 인지 가중 장치
JP5404418B2 (ja) 符号化装置、復号装置および符号化方法
JP5058152B2 (ja) 符号化装置および符号化方法
JP2012163981A (ja) オーディオコーデックポストフィルタ
JP5236040B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
JPWO2007129728A1 (ja) 符号化装置及び符号化方法
US20100017197A1 (en) Voice coding device, voice decoding device and their methods
JP5236033B2 (ja) 音声符号化装置、音声復号装置およびそれらの方法
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ
JPWO2011058752A1 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130611

R150 Certificate of patent or registration of utility model

Ref document number: 5294713

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250