JP5230782B2 - 符号化装置、階層符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法、および復号化方法 - Google Patents

符号化装置、階層符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法、および復号化方法 Download PDF

Info

Publication number
JP5230782B2
JP5230782B2 JP2011184357A JP2011184357A JP5230782B2 JP 5230782 B2 JP5230782 B2 JP 5230782B2 JP 2011184357 A JP2011184357 A JP 2011184357A JP 2011184357 A JP2011184357 A JP 2011184357A JP 5230782 B2 JP5230782 B2 JP 5230782B2
Authority
JP
Japan
Prior art keywords
encoding
gain
spectrum
decoding
subband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011184357A
Other languages
English (en)
Other versions
JP2011248378A (ja
Inventor
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2011184357A priority Critical patent/JP5230782B2/ja
Publication of JP2011248378A publication Critical patent/JP2011248378A/ja
Application granted granted Critical
Publication of JP5230782B2 publication Critical patent/JP5230782B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Description

本発明は、広帯域の音声信号、オーディオ信号等のスペクトルを符号化する符号化装置、復号化装置、およびこれらの方法に関する。
音声符号化の分野において、50Hz〜7kHzの広帯域信号を符号化する代表的な方法として、ITU−Tの規格G722、G722.1、または3GPP(The 3rd Generation Partnership Project)が提唱するAMR−WB等がある。これらの符号化方式によれば、ビットレートが6.6kbit/s〜64kbit/sと広帯域の音声信号の符号化を行うことができる。しかし、この広帯域信号の音質は、狭帯域信号に比べれば高いものの、オーディオ信号を対象とした場合や音声信号でもさらに高臨場感な品質が求められる場合には充分でない。
一般に、信号の最大周波数を10〜15kHz程度まで広帯域化できれば、FMラジオ相当の臨場感を得ることができ、20kHz程度まで広帯域化できればCD並みの品質を得ることができる。このような広帯域信号の符号化には、MPEG(Moving Picture Expert Group)で規格化されているレイヤ3方式やAAC(Advanced audio coding)方式等に代表されるオーディオ信号に対する符号化方式が適している。しかし、これらのオーディオ符号化方式は、符号化対象の周波数帯域が広いため、符号化パラメータのビットレートは大きくなる。
特許文献1には、広帯域信号のスペクトルを低ビットレートで高品質に符号化する技術として、広帯域スペクトルのうち高域部のスペクトルを、低域部のスペクトルの複製で置換した後に包絡線調整を行うことにより、品質劣化を抑えつつ全体のビットレートを低減させる技術が開示されている。
また、特許文献2には、スペクトルを複数のサブバンドに分割し、サブバンド毎にゲインを算出してゲインベクトルを生成し、このゲインベクトルをベクトル量子化することにより、ビットレートを低減する技術が開示されている。
特表2001−521648号公報(第15頁、第1図、第2図) 特開平5−265487号公報
図1A〜Dは、特許文献1に開示されている技術を周波数帯域0≦k<FHの原信号に適用したときの各スペクトルを示す図である。
図1Aは、原信号のスペクトル、図1Bは、原信号のスペクトルの高域部(FL≦k<FH)を削除した後の低域スペクトル、図1Cは、図1Bの低域スペクトルの複製を高域部に挿入することにより得られる全帯域のスペクトル、図1Dは、高域部の包絡線調整をした後のスペクトルを示している。
このように、高域スペクトルを低域スペクトルの複製で置換した後に包絡線調整を行うのは、新たに生成される高域スペクトル(複製スペクトル)の概形が原信号の高域スペクトルの概形と大きく異なっていると、大きな品質劣化が生じることがわかっているからである。そのため、新たに生成される高域スペクトルの概形を調整することにより、原信号の高域スペクトルと新たに生成されるスペクトルとの類似度を向上させることは非常に重要なことである。
高域スペクトルの概形を調整する方法としては、例えば、複製スペクトルのエネルギーが原信号の高域スペクトルのエネルギーと一致するように、複製スペクトルに調整係数(ゲイン)を乗じることが考えられる。図2A、Bは、この複製スペクトルにゲインを乗じる処理によって得られるスペクトルの概形の一例を示す図である。
図2Aは、原信号のスペクトルの概形を示す図、図2Bは、概形調整後のスペクトルの概形を示す図である。
この図からわかるように、上記のスペクトル概形調整を行うと、得られるスペクトルには次の不具合がある。すなわち、低域スペクトルと高域スペクトルとの接続部において不連続が発生し、異音の原因となる。これは、高域スペクトル全体に一律の同一ゲインを乗じるため、高域スペクトルのエネルギーは原信号のそれに一致するものの、低域スペクトルと高域スペクトルとの間の連続性が保たれるとは限らないからである。また、低域スペクトルの概形に何か特徴的な形状があった場合、一律の同一ゲインを乗じるだけではその特徴的な形状が高域部に不適切なまま残ってしまい、これも音質劣化の一因となる。
例えば、上記のスペクトルの概形調整に特許文献2の技術を応用すること、すなわち、サブバンド分割後に各サブバンドごとにゲインを調整することにより概形調整を行うことも考えられる。図3A、Bは、この処理によって得られるスペクトルの概形の一例を示す図である。
図3Aは、原信号のスペクトルの概形を示す図、図3Bは、サブバンド分割後に各サブバンドのゲインを調整した場合のスペクトルの概形を示す図である。
この図からわかるように、特許文献2の技術を応用した場合、高域スペクトルの形状が不正確であること(元の原信号の形状を精度良く再現できないこと)が起こり得る。これは、サブバンドごとにゲインを調整する方法は、精度良く符号化を行うためにはサブバンド数を増加させ本来多くのビット数を必要とするところ、充分なビット数が配分されないために生じる。そもそも、高域スペクトルを低域スペクトルの複製で置換するのは、低ビットレート化を目的とするものであるから、この状況は当然起こり得ることである。
以上説明したように、従来の方法では、広帯域信号のスペクトルを符号化する際に、低ビットレート化を実現しつつ、原信号の高域スペクトルと新たに生成されるスペクトルとの類似度を向上させることは困難である。
よって、本発明の目的は、広帯域信号のスペクトルを符号化する際に、低ビットレート化を実現しつつ、原信号の高域スペクトルと新たに生成されるスペクトルとの類似度を向上させることができる符号化装置および符号化方法を提供することである。
本発明の符号化装置は、少なくとも低域と高域とに分けられたスペクトルを取得する取得手段と、前記低域のスペクトルを符号化して第1符号化情報を生成する第1の符号化手段と、前記第1符号化情報を復号して復号低域スペクトルを生成する第1の復号手段と、前記復号された低域スペクトルを複製して高域のスペクトルの形状を生成する生成手段と、前記高域のスペクトルを複数のサブバンドに分割し、各サブバンドのゲインを算出するゲイン算出手段と、前記高域のスペクトルのサブバンドの内、少なくとも前記低域スペクトルに隣接する前記高域スペクトルのサブバンドを含む特定のサブバンドのゲインのみを符号化する第2の符号化手段と、前記特定のサブバンド以外のサブバンドのゲインを前記特定のサブバンドのゲインを補間して求める補間手段と、前記第1および第2の符号化手段で得られる符号化情報を出力する出力手段と、を具備する構成を採る。
本発明によれば、広帯域信号のスペクトルを符号化する際に、低ビットレート化を実現しつつ、原信号の高域スペクトルと新たに生成されるスペクトルとの類似度を向上させることができる。
原信号のスペクトルを示す図 原信号のスペクトルの高域部を削除した後の低域スペクトルを示す図 低域スペクトルの複製を高域部に挿入することにより得られる全帯域のスペクトルを示す図 高域部の包絡線調整をした後のスペクトルを示す図 原信号のスペクトルの概形を示す図 概形調整後のスペクトルの概形を示す図 原信号のスペクトルの概形を示す図 サブバンド分割後に各サブバンドのゲインを調整した場合のスペクトルの概形を示す図 実施の形態1に係る無線送信装置の主要な構成を示すブロック図 実施の形態1に係る符号化装置内部の主要な構成を示すブロック図 実施の形態1に係る高域符号化部内部の主要な構成を示すブロック図 実施の形態1に係るゲイン符号化部内部の主要な構成を示すブロック図 実施の形態1に係る補間演算関連の一連の処理を説明するための図 実施の形態1に係る補間演算関連の一連の処理を説明するための図 量子化点がg1(j)の1点のみである場合を示した図 量子化点が3点の場合を示した図 量子化点が3点の場合を示した図 実施の形態1に係る符号化装置の別のバリエーションを示すブロック図 実施の形態1に係る高域符号化部の主要な構成を示すブロック図 実施の形態1に係る無線受信装置の主要な構成を示すブロック図 実施の形態1に係る復号化装置内部の主要な構成を示すブロック図 実施の形態1に係る高域復号化部内部の主要な構成を示すブロック図 実施の形態1に係る復号化装置の構成を示す図 実施の形態1に係る高域復号化部の主要な構成を示すブロック図 実施の形態1に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示すブロック図 実施の形態1に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示すブロック図 実施の形態2に係る階層符号化装置の主要な構成を示すブロック図 実施の形態2に係るスペクトル符号化部内部の主要な構成を示すブロック図 実施の形態2に係る拡張帯域ゲイン符号化部内部の主要な構成を示すブロック図 実施の形態2に係る拡張帯域ゲイン符号化部の処理の概要を説明するための図 実施の形態2に係る拡張帯域ゲイン符号化部の処理の概要を説明するための図 実施の形態2に係る階層復号化装置の内部構成を示すブロック図 実施の形態2に係るスペクトル復号化部の内部構成を示すブロック図 実施の形態2に係る拡張帯域ゲイン復号化部内部の主要な構成を示すブロック図 実施の形態3に係る拡張帯域ゲイン符号化部の主要な構成を示すブロック図 基準振幅値の算出方法を説明するための図 実施の形態3に係る補間部の補間処理を説明するための図 実施の形態3に係る復号化装置の構成について説明する図 実施の形態4に係る拡張帯域ゲイン符号化部の主要な構成を示すブロック図 実施の形態4に係る補間部のゲイン候補の配置方法を説明するための図 実施の形態4に係る拡張帯域ゲイン復号化部について説明する図
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、ここでは符号化/復号化対象がオーディオ信号または音声信号である場合を例にとって説明する。また、本発明は大別して、通常の符号化(スケーラブルでない符号化)に適用される第1のケースと、スケーラブル符号化に適用される第2のケースと、が考えられる。そこで、実施の形態1では第1のケースについて、実施の形態2では第2のケースについて説明する。
(実施の形態1)
図4は、本発明の実施の形態1に係る符号化装置が無線通信システムの送信側に搭載された場合の無線送信装置130の主要な構成を示すブロック図である。
この無線送信装置130は、符号化装置100、入力装置131、A/D変換装置132、RF変調装置133、およびアンテナ134を有する。
入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換し、A/D変換装置132に出力する。A/D変換装置132は、このアナログ信号をディジタル信号に変換し、符号化装置100に出力する。符号化装置100は、入力されたディジタル信号を符号化して符号化信号を生成し、RF変調装置133に出力する。RF変調装置133は、符号化信号を変調して変調符号化信号を生成し、アンテナ134に出力する。アンテナ134は、変調符号化信号を電波W12として送信する。
図5は、上記の符号化装置100内部の主要な構成を示すブロック図である。ここでは、時間領域のディジタル信号が入力され、この信号を周波数領域の信号に変換してから符号化を行う場合を例にとって説明する。
符号化装置100は、入力端子101、周波数領域変換部102、分割部103、低域符号化部104、高域符号化部105、多重化部106、および出力端子107を有する。
周波数領域変換部102は、入力端子101から入力された時間領域のディジタル信号に対し、周波数領域への変換を施し、周波数領域の信号であるスペクトルを生成する。なお、このスペクトルの有効周波数帯域を0≦k<FHとする。周波数領域への変換方法は、離散フーリエ変換、離散コサイン変換、変形離散コサイン変換、ウェーブレット変換等を用いる。
分割部103は、周波数領域変換部102で得られたスペクトルを、低域スペクトルおよび高域スペクトルの2つの周波数帯域(バンド)のスペクトルに分割し、分割後のスペクトルを低域符号化部104および高域符号化部105に与える。具体的には、分割部103は、周波数領域変換部102から出力されたスペクトルを、有効周波数帯域0≦k<FLの低域スペクトルと、有効周波数帯域FL≦k<FHの高域スペクトルとに分割し、得られた低域スペクトルを低域符号化部104に、高域スペクトルを高域符号化部105にそれぞれ与える。
低域符号化部104は、分割部103から出力された低域スペクトルの符号化を行い、得られた符号化情報を多重化部106に出力する。なお、オーディオ・データまたは音声データの場合、低域のデータが高域のデータより重要であるため、低域符号化部104には高域符号化部105と比較してより多くのビットが配分され、高品質に符号化される。
具体的な符号化方法としては、MPEGレイヤ3方式、AAC方式、TwinVQ(Transform domain Weighted INterleaveVector Quantization)方式等を利用する。
高域符号化部105は、分割部103から出力された高域スペクトルに対し、後述の符号化処理を施し、得られた符号化情報(ゲイン情報)を多重化部106に出力する。高域符号化部105における符号化方法の詳細については、後述する。
多重化部106は、低域符号化部104から低域スペクトルに関する情報が入力され、一方、高域符号化部105からは高域スペクトルの概形を得るために必要なゲイン情報が入力される。多重化部106は、これらの情報を多重化した後に出力端子107から出力する。
図6は、上記の高域符号化部105内部の主要な構成を示すブロック図である。
スペクトル形状符号化部112は、入力端子111を介して、入力信号の有効周波数FL≦k<FHのスペクトルS(k)が与えられ、このスペクトルの形状の符号化を行う。具体的には、スペクトル形状符号化部112は、聴感的な歪が最も小さくなるようにスペクトル形状を符号化し、このスペクトル形状に関する符号化情報を多重化部114およびスペクトル形状復号化部116に与える。
なお、スペクトル形状の符号化方法としては、例えば、(式1)で表される2乗歪Eを最小とするときのコードベクトルC(i,k)を求め、このコードベクトルC(i,k)を出力する。
Figure 0005230782
ここで、C(i,k)は符号帳に含まれる第i番目のコードベクトルを表し、w(k)は周波数kの聴感的な重要度の対応する重み係数を表す。また、FLおよびFHはそれぞれ高域スペクトルの最小周波数および最大周波数に対応するインデックスを表す。また、スペクトル形状符号化部112は、(式2)を最小とするコードベクトルC(i,k)を出力しても良い。
Figure 0005230782
この式の右辺第1項は定数項なので、右辺第2項を最大とするコードベクトルを出力すると考えても良い。
スペクトル形状復号化部116は、スペクトル形状符号化部112から出力されたスペクトル形状に関する符号化情報を復号化し、得られるコードベクトルC(i,k)をゲイン符号化部113に与える。
ゲイン符号化部113は、目標信号である入力スペクトルS(k)のスペクトル概形に、コードベクトルC(i,k)のスペクトル概形が近くなるように、コードベクトルC(i,k)のゲインを符号化し、符号化情報を多重化部114に与える。ゲイン符号化部113の処理については、後ほど詳述する。
多重化部114は、スペクトル形状符号化部112およびゲイン符号化部113から出力される符号化情報を多重化し、出力端子115を介してこれを出力する。
図7は、上記のゲイン符号化部113内部の主要な構成を示すブロック図である。ゲイン符号化部113には、入力端子121を介し、スペクトル形状復号化部116から高域スペクトルの形状が入力され、また、入力端子127を介し、入力スペクトルが入力される。
サブバンド振幅算出部122は、スペクトル形状復号化部116から入力されたスペクトル形状に対し、各サブバンドの振幅値を算出する。乗算部123は、サブバンド振幅算出部122から出力されるスペクトル形状の各サブバンドの振幅値に、補間部126から出力される各サブバンドのゲイン(後述)を乗算して振幅の調整をした後、探索部124に出力する。一方、サブバンド振幅算出部128は、入力端子127から入力された目標信号の入力スペクトルに対し、各サブバンドの振幅値を算出し、探索部124に出力する。
探索部124は、乗算部123から出力されるサブバンド振幅値と、サブバンド振幅算出部128から与えられる高域スペクトルのサブバンド振幅値との間の歪を算出する。具体的には、ゲイン符号帳125には、複数のゲイン量子化値の候補g(j)が予め登録されており、探索部124は、この複数のゲイン量子化値の候補g(j)のうちの1つを指定して、これについて上記の歪み(2乗歪み)を算出する。ここで、jは各ゲイン量子化値の候補を識別するためのインデックスである。ゲイン符号帳125は、探索部124に指定されたゲイン候補g(j)を補間部126に与える。補間部126は、このゲイン候補g(j)を用いて、未だゲインが決定されていないサブバンドのゲイン値を補間演算により算出する。そして、補間部126は、ゲイン符号帳125から与えられたゲイン候補と、算出された補間ゲイン候補と、を乗算部123に与える。
上記の乗算部123、探索部124、ゲイン符号帳125、および補間部126の処理は帰還ループとなっており、探索部124は、ゲイン符号帳125に登録されている全てのゲイン量子化値の候補g(j)について上記の歪み(2乗歪み)を算出する。そして、探索部124は、最も2乗歪みが最小となるゲインのインデックスjを出力端子129を介して出力する。上記の処理を換言すると、探索部124は、まずゲイン符号帳125に登録されているゲイン量子化値の候補g(j)のうちのある特定の値を選択し、これを用いて残りのゲイン量子化値を補間することにより、擬似的な高域スペクトルを生成する。そして、この生成されたスペクトルと目標信号の高域スペクトルとを比較して2つのスペクトルの類似具合を判断し、探索部124は、最終的には、最初に用いたゲイン量子化値の候補ではなく、2つのスペクトルの類似具合が最も良くなるゲイン量子化値を選択し、このゲイン量子化値を示すインデックスjを出力する。
図8A、Bは、ゲイン符号化部113の上記の補間演算関連の一連の処理を説明するための図である。ここでは、高域スペクトルがサブバンド数N=8のサブバンドからなる場合を例にとって説明する。ゲイン符号帳125は、第0サブバンドのゲイン候補g0(j)と第7サブバンドのゲイン候補g1(j)を要素として持つゲイン候補G(j)={g0(j),g1(j)}を有する。ここでjは、ゲイン候補を識別するためのインデックスを表す。ゲイン符号帳125は、充分な長さの学習用データを用いてあらかじめ設計されている。そのため、適切なゲイン候補が既に格納されている状態にある。
ゲイン候補G(j)は、スカラー値であってもベクトル値であっても良いが、ここでは2次元ベクトルとして説明する。補間部126は、このゲイン候補G(j)を用いて、未だゲインが決定されていないサブバンドに対するゲインを補間により算出する。
具体的には、補間処理は、図8Bに示すように行われる。第0サブバンドのゲインはg0(j)、第7サブバンドのゲインはg1(j)で与えられ、それ以外のサブバンドのゲインがg0(j)およびg1(j)を線形補間することにより、内挿値として与えられる。
このように、本実施の形態に係る符号化装置によれば、入力された符号化対象の広帯域のスペクトルを少なくとも低域のスペクトルと高域のスペクトルとに分け、高域スペクトルに対しては、さらにこのスペクトルを複数のサブバンドに分割し、この複数のサブバンドの中から一部のサブバンドを選択し、選択されたサブバンドのゲインのみを符号化(量子化)対象とする。よって、全てのサブバンドについて符号化するわけではないので、少ない符号量で効率的にゲインを符号化することができる。なお、ここで、高域スペクトルに対して上記の処理を施すのは、入力信号がオーディオ信号、音声信号等である場合、高域のデータは、低域のデータに比べて重要度が低いためである。
また、以上の構成において、本実施の形態に係る符号化装置は、高域スペクトルにおいて、選択されなかったサブバンドのゲインに対しては、選択されたゲインを互いに補間することにより表す。よって、符号量をあるレベルで維持したまま、スペクトル概形の変化を滑らかに近似しながらゲインを決定することができる。すなわち、少ないビット数で異音の発生を抑えることができ、品質が向上する。よって、広帯域信号のスペクトルを符号化する際に、低ビットレート化を実現しつつ、原信号の高域スペクトルと新たに生成されるスペクトルとの類似度を向上させることができる。
本発明は、スペクトルの概形が周波数軸方向に滑らかに変化する点に着目し、この性質を利用して、符号化対象の点(量子化点)を一部に限定し、この量子化点のみを符号化し、残りのサブバンドについては、量子化点のゲインを相互に補間することにより求めることとしたものである。
また、以上の構成において、本実施の形態に係る符号化装置を搭載した送信装置は、選択されたサブバンドの量子化ゲインのみを送信し、補間によって得られるゲインは送信しない。一方、受信装置に搭載された復号化装置は、送信された量子化ゲインを受信して復号化すると共に、送信されていないサブバンドのゲインについては、送信されたゲインを互いに補間することにより得る。これらの構成を採ることにより、送受信装置間の伝送レートが低下するため、通信システムの負荷を軽減することができる。
なお、本実施の形態では、ゲインを線形補間する場合を例にとって説明したが、補間方法はこれに限定されず、例えば、スペクトルの特性上、1次関数以外の関数で補間を行った方が符号化性能が向上することがわかっている場合には、その関数を補間演算に用いても良い。
また、本実施の形態では、量子化点として上記の位置のサブバンドのゲインを選択する場合、すなわち、g0(j)が高域スペクトルの最小周波数のサブバンドのゲインであり、g1(j)が高域スペクトルの最高周波数のサブバンドのゲインである場合を例にとって説明した。量子化点の位置は、必ずしもこれらの設定に限定されるわけではないが、以下の条件を満たすことにより、補間による誤差が小さくなることが期待される。特に、g0(j)の位置は、低域スペクトルと高域スペクトルとの連続性を維持するために、低域スペクトルと高域スペクトルとの接続部である周波数FLの近傍の位置に設定することが望ましい。しかし、g0(j)の位置をこのように設定しても低域スペクトルと(新たに生成される)高域スペクトルとが滑らかに接続されるとは限らない。だが、連続性を少なくとも維持すれば、大きな音質劣化はないものと考えられる。また、g1(j)を高域スペクトルの最大周波数のサブバンド(要は高域スペクトルの右端)の位置に設定することにより、少なくともこの位置のゲインを特定できれば、一般的には、高域スペクトル全体の概形を粗い精度であるかもしれないが効率よく表現できると考えられる。しかし、g1(j)の位置は、例えば、FLとFHの中間位置であっても良い。
また、本実施の形態では、量子化点がg0(j)とg1(j)との2点である場合を例にとって説明したが、量子化点は1点であっても良い。以下、かかる場合について図面を用いて詳細に説明する。
図9は、量子化点がg1(j)の1点のみである場合を示した図である。この図で、SLは低域スペクトル、SHは高域スペクトルを表している。このように、低域スペクトルの最大周波数のサブバンドのゲイン値は、高域スペクトルの最小周波数のサブバンドのゲイン値と大きく変わらないことが期待できるので、g0(j)の代わりに低域スペクトルの最大周波数のサブバンドのゲイン値を用いる。これにより、g0(j)を求めなくても上記のゲイン補間が可能となる。
また、量子化点は3点以上であっても良い。図10A、Bは、量子化点が3点の場合を示した図である。
この図に示されるように、3つのサブバンドで決定されたサブバンドゲインを用い、それ以外のサブバンドのゲインを補間により決定する。このように、3以上の量子化点を利用することで、2点は高域スペクトルの端部(FLまたはFH)のゲインを表すために使用するとしても、少なくとも1点は高域スペクトルの中央部(端部以外の部分)に配置することができる。よって、高域スペクトルの概形に特徴的な部分、例えば、山(極大点)もしくは谷(極小点)が存在する場合でも、この山もしくは谷に量子化点1つを割り当てることにより、精度良く高域スペクトルの概形を表現した符号化パラメータを生成することが可能となる。ただし、量子化点を3以上に増やすと、スペクトル概形の細かい変化はより忠実に符号化することができるが、トレードオフで符号化効率は低下する。
また、本実施の形態では、符号化方法が、複数のサブバンドの中から量子化点を一部選択するステップと、残りのゲインについては補間演算によってそのゲインを得るステップとからなる場合を例にとって説明したが、量子化点を一部に限定することのみでも、低ビットレート化は実現できるため、高い符号化性能が要求されない場合には、補間演算のステップは省略し、量子化点を一部選択するステップのみでも良い。
また、本実施の形態では、帯域を等間隔に分割してサブバンドを生成する場合を例にとって説明したが、これに限定されず、例えばBarkスケールを用いた非線形な分割法を適用しても良い。
また、本実施の形態では、入力ディジタル信号を周波数領域に直接変換し帯域分割を行っている場合を例にとって説明したが、これに限定されない。
図11は、上記の符号化装置100の別のバリエーション(符号化装置100a)を示すブロック図である。なお、同一の構成要素には同一の符号を付している。
この図に示すように、入力ディジタル信号をフィルタ処理によって帯域分割する構成を採っても良い。この場合、多相(Polyphase)フィルタ、直交鏡像(Quadrature Mirror)フィルタ等を用いて帯域分割を行う。
図12は、符号化装置100a内の高域符号化部105aの主要な構成を示すブロック図である。なお、高域符号化部105と同一の構成要素には同一の符号を付している。高域符号化部105と高域符号化部105aの違いは、周波数領域変換部がどこに設置されているかである。
以上、符号化側の構成について詳細に説明した。次いで、復号化側の構成について以下詳細に説明する。
図13は、本実施の形態に係る無線送信装置130から送信された信号を受信する無線受信装置180の主要な構成を示すブロック図である。
この無線受信装置180は、アンテナ181、RF復調装置182、復号化装置150、D/A変換装置183、および出力装置184を有している。
アンテナ181は、電波W12としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してRF復調装置182に与える。RF復調装置182は、アンテナ181からの受信符号化音響信号を復調して復調符号化音響信号を生成して復号化装置150に与える。
復号化装置150は、RF復調装置182からのディジタルの復調符号化音響信号を受けて復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置150からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。
図14は、上記の復号化装置150内部の主要な構成を示すブロック図である。
分離部152は、入力端子151を介して入力された復調符号化音響信号から低域符号化パラメータと高域符号化パラメータとを分離し、各符号化パラメータを低域復号化部153と高域復号化部154とにそれぞれ与える。低域復号化部153は、低域符号化部104の符号化処理により得られる符号化パラメータを復号して低域復号スペクトルを生成し結合部155に与える。高域復号化部154は、高域符号化パラメータを用いて復号処理を行い、高域復号スペクトルを生成して結合部155に与える。なお、この高域復号化部154の詳細については後述する。結合部155は、低域復号スペクトルと高域復号スペクトルとを結合し、結合後のスペクトルを時間領域変換部156に与える。時間領域変換部156は、結合後のスペクトルを時間領域に変換し、かつ連続するフレーム間で不連続が生じにくくなるように窓掛けおよび重ね合わせ加算等の処理を行い、出力端子157から出力する。
図15は、高域復号化部154内部の主要な構成を示すブロック図である。
分離部162は、入力端子161を介して入力された高域符号化パラメータから、スペクトル形状コードとゲインコードとを分離し、各々をスペクトル形状復号化部163およびゲイン復号化部164に与える。スペクトル形状復号化部163は、スペクトル形状コードを参照して符号帳からコードベクトルC(i,k)を選択し、乗算部165に与える。ゲイン復号化部164は、ゲインコードに基づいてゲインを復号し乗算部165に与える。なお、このゲイン復号化部164の詳細については実施の形態2において詳述する。乗算部165は、スペクトル形状復号化部163で選択されたコードベクトルC(i,k)と、ゲイン復号化部164で復号されたゲインとを乗算し、出力端子166を介して出力する。
なお、符号化側の構成が図11に示した符号化装置100aのように、帯域分割フィルタによる低域信号と高域信号とへの帯域分割を行う構成である場合には、対応する復号化装置の構成は、図16に示される構成(復号化装置150a)となる。なお、同一の構成要素には同一の符号を付している。また、図17は、復号化装置150a内の高域復号化部154aの主要な構成を示すブロック図である。高域復号化部154と同一の構成要素には同一の符号を付している。高域復号化部154と高域復号化部154aの違いは、周波数領域変換部がどの位置に設置されるかである。
このように、上記の復号化装置によれば、本実施の形態に係る符号化装置によって符号化された情報を復号化することができる。
なお、本実施の形態では、入力信号の周波数帯域を2つの帯域に分割する場合を例にとって説明したが、これに限定されず、2以上の帯域に分割して、そのうちの1または複数の帯域に対して、既に説明した上記のスペクトルの符号化処理を行うことが可能である。
また、本実施の形態では、時間領域の信号が入力される場合を例にとって説明したが、周波数領域の信号が直接入力されても良い。
なお、ここでは、本実施の形態に係る符号化装置または復号化装置が無線通信システムに適用される場合を例にとって説明したが、本実施の形態に係る符号化装置または復号化装置は、以下に示すように、有線通信システムにも適用することができる。
図18Aは、本実施の形態に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図である。なお、図4に既に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。
有線送信装置140は、符号化装置100、入力装置131、およびA/D変換装置132を有し、出力がネットワークN1に接続されている。
A/D変換装置132の入力端子は、入力装置131の出力端子に接続されている。符号化装置100の入力端子は、A/D変換装置132の出力端子に接続されている。符号化装置100の出力端子はネットワークN1に接続されている。
入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換してA/D変換装置132に与える。A/D変換装置132は、アナログ信号をディジタル信号に変換して符号化装置100に与える。符号化装置100は、入力されてくるディジタル信号を符号化してコードを生成し、ネットワークN1に出力する。
図18Bは、本実施の形態に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図である。なお、図13に既に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。
有線受信装置190は、ネットークN1に接続されている受信装置191、復号化装置150、D/A変換装置183、および出力装置184を有している。
受信装置191の入力端子は、ネットワークN1に接続されている。復号化装置150の入力端子は、受信装置191の出力端子に接続されている。D/A変換装置183の入力端子は、復号化装置150の出力端子に接続されている。出力装置184の入力端子は、D/A変換装置183の出力端子に接続されている。
受信装置191は、ネットワークN1からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して復号化装置150に与える。復号化装置150は、受信装置191からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置150からのディジタルの復号音声信号を変換してアナログの復号音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号音響信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。
このように、上記の構成によれば、上記の無線送受信装置と同様の作用効果を有する有線送受信装置を提供することができる。
(実施の形態2)
本実施の形態の特徴は、本発明の符号化装置および復号化装置が、周波数軸方向にスケーラビリティを有する帯域スケーラブル符号化に適用されている点である。
図19は、本発明の実施の形態2に係る階層符号化装置200の主要な構成を示すブロック図である。
階層符号化装置200は、入力端子221、ダウンサンプリング部222、第1レイヤ符号化部223、第1レイヤ復号化部224、遅延部226、スペクトル符号化部210、多重化部227、および出力端子228を有する。
入力端子221には、A/D変換装置132から有効周波数帯域が0≦k<FHの信号が入力される。ダウンサンプリング部222は、入力端子221を介し入力された信号にダウンサンプリングを施してサンプリングレートの低い信号を生成し、出力する。第1レイヤ符号化部223は、このダウンサンプリング後の信号を符号化し、得られた符号化パラメータを多重化部(マルチプレクサ)227に出力すると共に、第1レイヤ復号化部224にも出力する。第1レイヤ復号化部224は、この符号化パラメータを基に第1レイヤの復号信号を生成する。
一方、遅延部226は、入力端子221を介し入力される信号に対し、所定の長さの遅延を与える。この遅延の大きさは、信号がダウンサンプリング部222、第1レイヤ符号化部223,第1レイヤ復号化部224を介した際に生じる時間遅れと同値とする。スペクトル符号化部210は、第1レイヤ復号化部224から出力される信号を第1信号として、また遅延部226から出力される信号を第2信号としてスペクトル符号化を行い、生成した符号化パラメータを多重化部227に出力する。多重化部227は、第1レイヤ符号化部223で求められる符号化パラメータとスペクトル符号化部210で求められる符号化パラメータとを多重化し、出力コードとして出力端子228を介し出力する。この出力コードは、RF変調装置133に与えられる。
図20は、上記のスペクトル符号化部210内部の主要な構成を示すブロック図である。
スペクトル符号化部210は、入力端子201、204、周波数領域変換部202、205、拡張帯域スペクトル推定部203、拡張帯域ゲイン符号化部206、多重化部207、および出力端子208を有する。
入力端子201には、第1レイヤ復号化部224にて復号された信号が入力される。この信号の有効周波数帯域は0≦k<FLである。また、入力端子204には、遅延部226から有効周波数帯域が0≦k<FH(ただし、FL<FH)の第2信号が入力される。
周波数領域変換部202は、入力端子201から入力される第1信号に周波数変換を行い、第1スペクトルS1(k)を算出する。一方、周波数領域変換部205は、入力端子204から入力される第2信号に周波数変換を行い、第2スペクトルS2(k)を算出する。ここで周波数変換の方法は、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、変形離散コサイン変換(MDCT)等を適用する。
拡張帯域スペクトル推定部203は、第2スペクトルS2(k)を参照信号として第1スペクトルS1(k)の帯域FL≦k<FHに含めるべきスペクトルを推定し、推定スペクトルE(k)(ただし、FL≦k<FH)を求める。ここで推定スペクトルE(k)は、第1スペクトルS1(k)の低域(0≦k<FL)に含まれるスペクトルに基づいて推定される。
拡張帯域ゲイン符号化部206は、推定スペクトルE(k)に乗ずべきゲインを推定スペクトルE(k)と第2スペクトルS2(k)とを用いて符号化する。ここでの処理は、いかに少ない符号量で効率よく拡張帯域における推定スペクトルE(k)のスペクトル概形を第2スペクトルS2(k)のスペクトル概形に近づけるかが重要である。この成否により、音質が大きく左右される。
多重化部207は、拡張帯域スペクトル推定部203から拡張帯域の推定スペクトルに関する情報が入力され、かつ拡張帯域ゲイン符号化部206から拡張帯域のスペクトル概形を得るために必要なゲイン情報が入力される。これらの情報を多重化した後に出力端子208から出力する。
図21は、上記の拡張帯域ゲイン符号化部206内部の主要な構成を示すブロック図である。
この拡張帯域ゲイン符号化部206は、入力端子211、217、サブバンド振幅算出部212、218、ゲイン符号帳215、補間部216、乗算部213、探索部214、および出力端子219を有する。
入力端子211から推定スペクトルE(k)が入力され、入力端子217から第2スペクトルS2(k)が入力される。サブバンド振幅算出部212では、拡張帯域をサブバンドに分割し、サブバンド毎の推定スペクトルE(k)の振幅値を算出する。拡張帯域をFL≦k<FHと表すと、拡張帯域の帯域幅BWは(式3)と表される。
BW = FH−FL+1 ・・・(式3)
この拡張帯域をN個のサブバンドに分割すると、各サブバンドのバンド幅BWSは(式4)と表される。
BWS = (FH−FL+1)/N ・・・(式4)
よって、第nサブバンドの最小周波数FL(n)は(式5)と表され、第nサブバンドの最大周波数FH(n)は(式6)と表される。
FL(n) = FL + n・BWS ・・・(式5)
FH(n) = FL + (n+1)・BWS − 1 ・・・(式6)
このように規定されるサブバンド毎に推定スペクトルE(k)の振幅値AE(n)を(式7)に従い算出する。
Figure 0005230782
同様に、サブバンド振幅算出部218は、第2スペクトルS2(k)のサブバンド毎の振幅値AS2(n)を(式8)に従って算出する。
Figure 0005230782
一方、ゲイン符号帳215は、J個のゲイン量子化値の候補G(j)(ただし、0≦j<J)を有し、全てのゲイン候補について次に示すような処理を施す。ゲイン候補G(j)はスカラー値であってもベクトル値であっても良いが、ここでは説明のために2次元のベクトルであるものとする(すなわち、g(j)={g0(j),g1(j)})。ゲイン符号帳215は、充分な長さの学習用データを用いてあらかじめ設計されている。そのため、適切なゲイン候補が既に格納されている状態にある。
図22A、Bは、拡張帯域ゲイン符号化部206の処理の概要を説明するための図である。ここでも、サブバンド数N=8の場合を例にとって説明する。
図22Aに示されるように、ゲイン候補G(j)の第1要素g0(j)を第0サブバンドゲイン、第2要素g1(j)を第7サブバンドゲインとして、それぞれを第1サブバンドおよび第7サブバンドに配置する。
補間部216は、このゲイン候補G(j)を用いて、未だゲインが決定されていないサブバンドに対するゲインを補間により算出する。
具体的には、その様子を図22Bに示す。第0サブバンドのゲインはg0(j)、第7サブバンドのゲインはg1(j)で与えられ、それ以外のサブバンドのゲインはg0(j)およびg1(j)の内挿値として与えられる。このような考えに基づくと、第nサブバンドのゲインp(j,n)は、(式9)のように表すことができる。
Figure 0005230782
このように算出されたサブバンドゲインの候補p(j,n)は乗算部213に与えられる。乗算部213では、サブバンド振幅算出部212より与えられるサブバンド振幅値AE(n)と、補間部216から与えられるサブバンドゲインの候補p(j,n)とを要素ごとに乗算する。乗算後のサブバンド振幅値をAE’(n)と表すと、AE’(n)は(式10)に従って算出され、探索部214に与えられる。
AE’(n) = AE(n)・p(j,n) ・・・(式10)
探索部214は、乗算後のサブバンド振幅値AE’(n)とサブバンド振幅算出部218より与えられる第2スペクトルのサブバンド振幅値AS2(k)との間の歪を算出する。なお、ここでは説明の簡単のため、2乗歪みを用いる場合を例にとって説明するが、歪みの定義としては、例えば要素ごとに聴覚感度に基づいた重み付けを行う距離尺度等を用いることもできる。
探索部214は、AE’(n)とAS2(n)の2乗歪Dを、(式11)に従い算出する。
Figure 0005230782
または、2乗歪Dを(式12)としても良い。
Figure 0005230782
この場合、w(n)は聴覚感度に基づいた重み関数を表す。
ゲイン符号帳215に含まれる全てのゲイン量子化値の候補G(j)について、上記処理に従い2乗歪Dを算出し、その中で最も2乗歪Dが最小となるときのゲインのインデックスjを出力端子219を介して出力する。
このような処理に基づくと、スペクトル概形の変化を滑らかに近似しながらゲインを決定することができるため、少ないビット数であっても異音の発生が抑えられ品質が改善する。
また、本実施の形態では、サブバンド振幅の大きさを基準に補間を行いゲインを決定しているが、サブバンド振幅の代わりにサブバンド対数エネルギーを基準に補間を行う構成であっても良い。この場合、人間の聴覚特性に適合する対数エネルギーの領域でスペクトル概形が滑らかに変化するようゲインを決定するので、より聴感的に品質が改善されるという効果が得られる。
図23は、上記の階層符号化装置200で符号化された情報を復号化する階層復号化装置250の内部構成を示すブロック図である。ここでは、階層符号化された符号化パラメータを復号する場合を例にとって説明する。
この階層復号化装置250は、入力端子171、分離部172、第1レイヤ復号化部173、スペクトル復号化部260、および出力端子176、177を有する。
入力端子171には、RF復調装置182からディジタルの復調符号化音響信号が入力される。分離部172は、入力端子171を介し入力された復調符号化音響信号を分離し、第1レイヤ復号化部173用の符号化パラメータとスペクトル復号化部260用の符号化パラメータとを生成する。第1レイヤ復号化部173は、分離部172で得られた符号化パラメータを用いて信号帯域0≦k<FLの復号信号を復号し、この復号信号をスペクトル復号化部に与える。また、他方の出力は、出力端子176に接続されている。これにより、第1レイヤ復号化部173で生成される第1レイヤ復号信号を出力する必要が生じた場合には、この出力端子176を介し出力させることができる。
スペクトル復号化部260には、分離部172で分離された符号化パラメータと第1レイヤ復号化部より得られる第1レイヤ復号信号とが与えられる。スペクトル復号化部260は、後述するスペクトル復号化を行い、信号帯域0≦k<FHの復号信号を生成し、出力端子177を介しこれを出力する。スペクトル復号化部260では、第1レイヤ復号化部より与えられる第1レイヤ復号信号を第1信号とみなして処理を行うことになる。
この構成によれば、第1レイヤ復号化部173で生成される第1レイヤ復号信号を出力する必要がある場合には、出力端子176より出力させることができる。また、より品質の高いスペクトル復号化部260の出力信号を出力する必要がある場合には、出力端子177より出力させることができる。階層復号化装置250からは、出力端子176もしくは出力端子177のいずれか一方の信号が出力され、D/A変換装置183に与えられる。どちらの信号が出力されるかは、アプリケーションやユーザの設定や判定結果に基づく。
図24は、上記のスペクトル復号化部260の内部構成を示すブロック図である。
このスペクトル復号化部260は、入力端子251、253、分離部252、周波数領域変換部254、拡張帯域推定スペクトル付与部255、拡張帯域ゲイン復号化部256、乗算部257、時間領域変換部258、および出力端子259を有する。
入力端子251から、スペクトル符号化部210にて符号化された符号化パラメータが入力され、分離部252を介して拡張帯域推定スペクトル付与部255および拡張帯域ゲイン復号化部256にそれぞれ符号化パラメータが入力される。さらに、入力端子253には、有効周波数帯域が0≦k<FLの第1信号が入力される。この第1信号は、第1レイヤ復号化部173で復号された第1レイヤ復号信号である。
周波数領域変換部254は、入力端子253から入力された時間領域信号に周波数変換を行い、第1スペクトルS1(k)を算出する。周波数変換法は、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、変形離散コサイン変換(MDCT)等を使用する。
拡張帯域推定スペクトル付与部255は、周波数領域変換部254より与えられる第1スペクトルS1(k)の拡張帯域FL≦k<FHに含まれるスペクトルを分離部252より得られる符号化パラメータを基に生成する。この生成の方法は、符号化側で用いた拡張帯域スペクトルの推定法に依存するが、ここでは第1スペクトルS1(k)を用いて拡張帯域に含まれる推定スペクトルE(k)を生成するものとする。よって、拡張帯域推定スペクトル付与部255より出力される結合スペクトルF(k)は、帯域0≦k<FLにおいては第1スペクトルS1(k)、帯域FL≦k<FHにおいては拡張帯域推定スペクトルE(k)により構成される。
拡張帯域ゲイン復号化部256は、分離部252より与えられる符号化パラメータを基に結合スペクトルF(k)の拡張帯域FL≦k<FHに含まれるスペクトルに乗算されるサブバンドゲインp(j,n)を生成する。サブバンドゲインp(j,n)を生成する方法については後述する。
乗算部257は、拡張帯域推定スペクトル付与部255より与えられる結合スペクトルF(k)の拡張帯域FL≦k<FHに含まれるスペクトルにサブバンド単位に拡張帯域ゲイン復号化部256より与えられるサブバンドゲインp(j,n)を乗算し、復号スペクトルF’(k)を生成する。復号スペクトルF’(k)は、(式13)のように表すことができる。
Figure 0005230782
時間領域変換部258は、乗算部257より得られた復号スペクトルF’(k)を時間領域の信号に変換し、出力端子259を介し出力する。ここでは、必要に応じて、適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を回避する。
図25は、上記の拡張帯域ゲイン復号化部256内部の主要な構成を示すブロック図である。
入力端子261から、符号化側の拡張帯域ゲイン符号化部206で決定されたインデックスjが入力され、このインデックス情報を基にゲイン符号帳262よりゲインG(j)が選択され出力される。このゲインG(j)は補間部263に与えられ、補間部263では、前述の方法に従って補間を行いサブバンドゲインp(j,n)を生成し、出力端子264より出力する。
この構成によれば、スペクトル概形の変化を滑らかに近似しながら決定されたゲインを復号することができるため、異音の発生等が抑えられ品質が改善するという効果が得られる。
このように、本実施の形態の復号化装置によれば、本実施の形態に係る符号化方法に対応した構成を有しているため、少ないビット数で効率よく符号化された音響信号を復号することができ、良好な音響信号を出力することができる。
(実施の形態3)
図26は、本発明の実施の形態3に係る符号化装置内の拡張帯域ゲイン符号化部301の主要な構成を示すブロック図である。なお、この拡張帯域ゲイン符号化部301は、実施の形態2で示した拡張帯域ゲイン符号化部206と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施形態の特徴は、ゲイン符号帳に含まれるゲイン量子化値の候補G(j)の次数が1、つまりスカラー値であり、ゲインの補間は入力端子より与えられる基準振幅値を基に求められる基準ゲインとゲイン量子化値の候補G(j)との間で行われる点にある。この構成によれば、量子化の対象となるゲインの数が1へと削減されるため、低ビットレート化が可能になるという効果が得られる。
基準ゲイン算出部303には、入力端子302から入力される基準振幅値とサブバンド振幅算出部212で算出されたサブバンド振幅値の内、最低域のサブバンド振幅値が与えられる。ここで基準振幅値には、図27に示されるように、拡張帯域に隣接する帯域に含まれるスペクトルから算出されるものとする。基準ゲイン算出部303は、基準振幅値と最低域サブバンド振幅値が一致するという仮定が成り立つよう基準ゲインを決定する。基準振幅値をAb、最低域サブバンド振幅値をAE(0)と表すと、基準ゲインgbは(式14)のように表される。
gb = Ab/AE(0) ・・・(式14)
補間部304は、基準ゲイン算出部303で求められる基準ゲインgbと、ゲイン符号帳215から得られるゲイン量子化値の候補g(j)とを用い、図28に示すように、補間によりゲインが未定義となっているサブバンドのゲインを生成する。なお、この図では、サブバンド数N=8となっており、また補間によりゲインが生成されるサブバンドは第1〜第6サブバンドとなる。
次いで、本実施の形態に係る符号化装置によって符号化された信号を復号する復号化装置の構成について図29を用いて説明する。この拡張帯域ゲイン復号化部350は、実施の形態2で示した拡張帯域ゲイン復号化部256(図25参照)と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
入力端子351より基準振幅値Abと、入力端子352から拡張帯域の推定スペクトルの内の最低域サブバンドのサブバンド振幅値AE(0)が与えられる。ここで基準振幅値には、図27を用いて既に説明したように、拡張帯域に隣接する帯域に含まれるスペクトルから算出されるものとする。基準ゲイン算出部353は、拡張帯域ゲイン符号化部で説明したように、基準振幅値と最低域サブバンド振幅値が一致するという仮定が成り立つよう基準ゲインを決定する。
このように、本実施の形態によれば、量子化の対象となるゲインの数を1へと削減され、さらなる低ビットレート化が可能となる。
(実施の形態4)
図30は、本発明の実施の形態4に係る符号化装置内の拡張帯域ゲイン符号化部401の主要な構成を示すブロック図である。なお、この拡張帯域ゲイン符号化部401は、実施の形態2で示した拡張帯域ゲイン符号化部206と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態の特徴は、拡張帯域に含まれるサブバンドの内のゲインに最も特徴のある(例えばゲインの最大値もしくは最小値)サブバンドをゲイン符号帳の探索の対象に必ず含めるようにする点にある。この構成によれば、最もゲインの影響を受けるサブバンドをゲイン符号帳の探索の対象に含めることができるため、品質改善が図れるという効果が得られる。ただしこの構成では、どのサブバンドを選択したかという付加情報を符号化する必要がある。
サブバンド決定部402は、サブバンド振幅算出部212で求められた推定スペクトルE(k)のサブバンド振幅値AE(n)と、サブバンド振幅算出部218で求められた第2スペクトルS2(k)のサブバンド振幅値AS2(n)とを用いて、(式15)に従い理想ゲイン値gopt(n)を算出する。
gopt(n) = AS2(n)/AE(n) ・・・(式15)
次に、理想ゲインgopt(n)が最大(もしくは最小)となるサブバンドを求め、そのサブバンド番号を出力端子より出力する。
補間部403は、ゲイン符号帳215から得られるゲイン候補G(j)={g0(j),g1(j),g2(j)}とサブバンド選択部402から得られるサブバンド情報を基に、図31に示すようにゲイン候補を配置し、ゲインが決定されていないサブバンドについては、補間によりゲインを決定する。この図では、第0サブバンド、第7サブバンドはデフォルトでゲイン候補を配置し、第1〜第6サブバンドの内、最も特徴的なゲインを有するサブバンド(この図では第2サブバンド)にゲイン候補を配置し、それ以外のサブバンドのゲインは補間により決定している。
次いで、本実施の形態に係る符号化装置によって符号化された信号を復号する復号化装置内の拡張帯域ゲイン復号化部450について図32を用いて説明する。なお、この拡張帯域ゲイン復号化部450は、実施の形態2で示した拡張帯域ゲイン復号化部256と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
補間部263は、ゲイン符号帳262から得られるゲインG(j)={g0(j),g1(j),g2(j)}と、入力端子451を介して入力されるサブバンド情報から、第0サブフレームにg0(j)、第7サブフレームにg2(j)、そしてサブバンド情報により示されるサブバンドにg1(j)を配置し、それ以外のサブバンドのゲインは補間により決定する。このようにして復号されたサブバンドゲインを出力端子264から出力する。
このように、本実施の形態によれば、最もゲインの影響を受けるサブバンドをゲイン符号帳の探索の対象に含めて符号化するため、符号化性能をさらに向上させることができる。
以上、本発明に係る実施の形態について説明した。
本発明に係るスペクトル符号化装置は、上記の実施の形態1〜4に限定されず、種々変更して実施することが可能である。
本発明に係る符号化装置および復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。例えば、本発明に係る符号化方法および復号化方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置および復号化装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてあり得る。
本明細書は、2004年5月19日出願の特願2004−148901に基づく。この内容はすべてここに含めておく。
本発明に係る符号化装置、復号化装置、およびこれらの方法は、移動体通信システムにおける通信端末装置等の用途に適用できる。
103 分割部
104 低域符号化部
105 高域符号化部
113 ゲイン符号化部
122、128、212、218 サブバンド振幅算出部
123、213 乗算部
124、214 探索部
125、215 ゲイン符号帳
126、216 補間部
203 拡張帯域スペクトル推定部
206 拡張帯域ゲイン符号化部

Claims (13)

  1. 少なくとも低域と高域とに分けられたスペクトルを取得する取得手段と、
    前記低域のスペクトルを符号化して第1符号化情報を生成する第1の符号化手段と、
    前記第1符号化情報を復号して復号低域スペクトルを生成する第1の復号手段と、
    前記復号された低域スペクトルを複製して高域のスペクトルの形状を生成する生成手段と、
    前記高域のスペクトルを複数のサブバンドに分割し、各サブバンドのゲインを算出するゲイン算出手段と、
    前記高域のスペクトルのサブバンドの内、少なくとも前記低域スペクトルに隣接する前記高域スペクトルのサブバンドを含む特定のサブバンドのゲインのみを符号化する第2の符号化手段と、
    前記特定のサブバンド以外のサブバンドのゲインを前記特定のサブバンドのゲインを補間して求める補間手段と、
    前記第1および第2の符号化手段で得られる符号化情報を出力する出力手段と、
    を具備する符号化装置。
  2. 前記第2の符号化手段は、
    前記高域のスペクトルの前記特定のサブバンドのゲインを決定する決定手段および前記補間手段の双方で求まったゲインで表されるスペクトルを、前記取得手段により取得された高域のスペクトルと比較し、これらのスペクトルの類似具合に応じて、前記決定手段によって決定されたゲインを変更する変更手段と、
    を具備し、前記変更手段によって変更された後のゲインを符号化する、
    請求項1記載の符号化装置。
  3. 前記第2の符号化手段は、
    前記高域のスペクトルの最高周波数のサブバンドのゲインを符号化する、
    請求項1記載の符号化装置。
  4. 前記第2の符号化手段は、
    前記高域のスペクトルの極小点を含むサブバンドまたは極大点を含むサブバンドのゲインを符号化する、
    請求項1記載の符号化装置。
  5. 前記第2の符号化手段で使用された前記特定のサブバンドのうちの少なくとも1つのサブバンドに関する情報を符号化する第3の符号化手段をさらに具備し、
    前記出力手段は、
    前記第3の符号化手段で得られる符号化情報も併せて出力する、
    請求項1記載の符号化装置。
  6. 周波数軸方向にスケーラビリティを有する符号化情報を生成する階層符号化装置であって、請求項1記載の符号化装置を拡張レイヤの符号化に使用する階層符号化装置。
  7. 少なくとも低域と高域とに分けられたスペクトルに関する符号化情報を復号化する復号化装置であって、
    前記低域のスペクトルに関する符号化情報を復号化して復号低域スペクトルを生成する第1の復号化手段と、
    前記高域のスペクトルに関する符号化情報を復号化して、複数のサブバンドに分割された前記高域スペクトルの内、少なくとも前記低域スペクトルに隣接する前記高域スペクトルのサブバンドを含む特定のサブバンドのゲインを生成する第2の復号化手段と、
    前記特定のサブバンド以外のサブバンドのゲインを前記特定のサブバンドのゲインを補間して求める補間手段と、
    前記第1の復号化手段によって得られた低域スペクトルと、前記第2の復号化手段および前記補間手段によって得られたゲインを用いて前記高域のスペクトルを復号化する第3の復号化手段と、
    を具備する復号化装置。
  8. 請求項1記載の符号化装置を具備する通信端末装置。
  9. 請求項7記載の復号化装置を具備する通信端末装置。
  10. 請求項1記載の符号化装置を具備する基地局装置。
  11. 請求項7記載の復号化装置を具備する基地局装置。
  12. 少なくとも低域と高域とに分けられたスペクトルを取得する取得ステップと、
    前記低域のスペクトルを符号化して第1符号化情報を生成する第1の符号化ステップと、
    前記第1符号化情報を復号して復号低域スペクトルを生成する第1の復号ステップと、
    前記復号された低域スペクトルを複製して高域のスペクトルの形状を生成する生成ステップと、
    前記高域のスペクトルを複数のサブバンドに分割し、各サブバンドのゲインを算出するゲイン算出ステップと、
    前記高域のスペクトルのサブバンドの内、少なくとも前記低域スペクトルに隣接する前記高域スペクトルのサブバンドを含む特定のサブバンドのゲインのみを符号化する第2の符号化ステップと、
    前記特定のサブバンド以外のサブバンドのゲインを前記特定のサブバンドのゲインを補間して求める補間ステップと、
    前記第1および第2の符号化ステップで得られる符号化情報を出力する出力ステップと、
    を具備する符号化方法。
  13. 少なくとも低域と高域とに分けられたスペクトルに関する符号化情報を復号化する復号化方法であって、
    前記低域のスペクトルに関する符号化情報を復号化して復号低域スペクトルを生成する第1の復号化ステップと、
    前記高域のスペクトルに関する符号化情報を復号化して、複数のサブバンドに分割された前記高域スペクトルの内、少なくとも前記低域スペクトルに隣接する前記高域スペクトルのサブバンドを含む特定のサブバンドのゲインを生成する第2の復号化ステップと、
    前記特定のサブバンド以外のサブバンドのゲインを前記特定のサブバンドのゲインを補間して求める補間ステップと、
    前記第1の復号化ステップで得られた低域スペクトルと、前記第2の復号化ステップおよび前記補間ステップで得られたゲインを用いて前記高域のスペクトルを復号化する第3の復号化ステップと、
    を具備する復号化方法。
JP2011184357A 2004-05-19 2011-08-26 符号化装置、階層符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法、および復号化方法 Active JP5230782B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011184357A JP5230782B2 (ja) 2004-05-19 2011-08-26 符号化装置、階層符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法、および復号化方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004148901 2004-05-19
JP2004148901 2004-05-19
JP2011184357A JP5230782B2 (ja) 2004-05-19 2011-08-26 符号化装置、階層符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法、および復号化方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006513605A Division JP5013863B2 (ja) 2004-05-19 2005-05-17 符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法及び復号化方法

Publications (2)

Publication Number Publication Date
JP2011248378A JP2011248378A (ja) 2011-12-08
JP5230782B2 true JP5230782B2 (ja) 2013-07-10

Family

ID=35394381

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006513605A Active JP5013863B2 (ja) 2004-05-19 2005-05-17 符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法及び復号化方法
JP2011184357A Active JP5230782B2 (ja) 2004-05-19 2011-08-26 符号化装置、階層符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法、および復号化方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2006513605A Active JP5013863B2 (ja) 2004-05-19 2005-05-17 符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法及び復号化方法

Country Status (9)

Country Link
US (2) US8463602B2 (ja)
EP (3) EP1742202B1 (ja)
JP (2) JP5013863B2 (ja)
KR (1) KR20070012832A (ja)
CN (2) CN102280109B (ja)
AT (1) ATE394774T1 (ja)
BR (1) BRPI0510400A (ja)
DE (1) DE602005006551D1 (ja)
WO (1) WO2005112001A1 (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
JP2007310298A (ja) * 2006-05-22 2007-11-29 Oki Electric Ind Co Ltd 帯域外信号生成装置及び周波数帯域拡張装置
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
CN101548318B (zh) * 2006-12-15 2012-07-18 松下电器产业株式会社 编码装置、解码装置以及其方法
JP5294713B2 (ja) * 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
GB2448201A (en) 2007-04-04 2008-10-08 Zarlink Semiconductor Inc Cancelling non-linear echo during full duplex communication in a hands free communication system.
US8149752B2 (en) * 2007-07-06 2012-04-03 Alcatel Lucent Media-access-control protocol for a network employing multi-user wireless channels
BRPI0722269A2 (pt) * 2007-11-06 2014-04-22 Nokia Corp Encodificador para encodificar um sinal de áudio, método para encodificar um sinal de áudio; decodificador para decodificar um sinal de áudio; método para decodificar um sinal de áudio; aparelho; dispositivo eletrônico; produto de programa de comoputador configurado para realizar um método para encodificar e para decodificar um sinal de áudio
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
US20100274555A1 (en) * 2007-11-06 2010-10-28 Lasse Laaksonen Audio Coding Apparatus and Method Thereof
JP2009116245A (ja) * 2007-11-09 2009-05-28 Yamaha Corp 音声強調装置
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JPWO2011048741A1 (ja) * 2009-10-20 2013-03-07 日本電気株式会社 マルチバンドコンプレッサ
JP5746974B2 (ja) * 2009-11-13 2015-07-08 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置およびこれらの方法
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
AU2015202393B2 (en) * 2010-12-29 2016-06-16 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high-frequency bandwidth extension
BR112013016438B1 (pt) * 2010-12-29 2021-08-17 Samsung Electronics Co., Ltd Método de codificação, método de decodificação, e mídia de gravação legível por computador não transitória
JP2012163919A (ja) * 2011-02-09 2012-08-30 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
JP6011758B2 (ja) * 2011-09-09 2016-10-19 国立研究開発法人情報通信研究機構 音声合成システム、音声合成方法、およびプログラム
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
US9100466B2 (en) * 2013-05-13 2015-08-04 Intel IP Corporation Method for processing an audio signal and audio receiving circuit
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
RU2665281C2 (ru) * 2013-09-12 2018-08-28 Долби Интернэшнл Аб Временное согласование данных обработки на основе квадратурного зеркального фильтра
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
US10410645B2 (en) 2014-03-03 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
KR102400016B1 (ko) 2014-03-24 2022-05-19 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
CN110444216B (zh) 2014-05-01 2022-10-21 日本电信电话株式会社 解码装置、解码方法、记录介质
JP6401521B2 (ja) * 2014-07-04 2018-10-10 クラリオン株式会社 信号処理装置及び信号処理方法
PL3163571T3 (pl) * 2014-07-28 2020-05-18 Nippon Telegraph And Telephone Corporation Kodowanie sygnału dźwiękowego
JP2016038435A (ja) 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP3274992B1 (en) 2015-03-27 2020-11-04 Dolby Laboratories Licensing Corporation Adaptive audio filtering
US10825465B2 (en) * 2016-01-08 2020-11-03 Nec Corporation Signal processing apparatus, gain adjustment method, and gain adjustment program
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
JP7016660B2 (ja) * 2017-10-05 2022-02-07 キヤノン株式会社 符号化装置、その制御方法、および制御プログラム、並びに撮像装置

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
US5765127A (en) 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3237178B2 (ja) 1992-03-18 2001-12-10 ソニー株式会社 符号化方法及び復号化方法
JPH0685607A (ja) * 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3106749B2 (ja) * 1992-12-10 2000-11-06 ソニー株式会社 適応型ダイナミックレンジ符号化装置
WO1997017692A1 (en) * 1995-11-07 1997-05-15 Euphonics, Incorporated Parametric signal modeling musical synthesizer
US5687191A (en) * 1995-12-06 1997-11-11 Solana Technology Development Corporation Post-compression hidden data transport
EP0880235A1 (en) * 1996-02-08 1998-11-25 Matsushita Electric Industrial Co., Ltd. Wide band audio signal encoder, wide band audio signal decoder, wide band audio signal encoder/decoder and wide band audio signal recording medium
TW326070B (en) * 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
US7139700B1 (en) * 1999-09-22 2006-11-21 Texas Instruments Incorporated Hybrid speech coding and system
US7039581B1 (en) * 1999-09-22 2006-05-02 Texas Instruments Incorporated Hybrid speed coding and system
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
CN1383614A (zh) * 2000-06-06 2002-12-04 酒井康江 压缩方法及装置、扩展方法及装置、压缩扩展系统、存储媒体、程序
JP3590342B2 (ja) 2000-10-18 2004-11-17 日本電信電話株式会社 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
EP1701340B1 (en) 2001-11-14 2012-08-29 Panasonic Corporation Decoding device, method and program
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
DE60202881T2 (de) * 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
JP4272897B2 (ja) * 2002-01-30 2009-06-03 パナソニック株式会社 符号化装置、復号化装置およびその方法
DE60323331D1 (de) * 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
JP2003255973A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
JP2003323199A (ja) 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
EP1489599B1 (en) 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP4227772B2 (ja) * 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
CN1328707C (zh) * 2002-07-19 2007-07-25 日本电气株式会社 音频解码设备以及解码方法
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
DE60303689T2 (de) * 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
JP2004198485A (ja) * 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
JP2005004119A (ja) * 2003-06-16 2005-01-06 Victor Co Of Japan Ltd 音響信号符号化装置及び音響信号復号化装置
EP3336843B1 (en) * 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP5265487B2 (ja) 2009-09-03 2013-08-14 光洋自動機株式会社 掘進装置

Also Published As

Publication number Publication date
EP1742202A1 (en) 2007-01-10
JP2011248378A (ja) 2011-12-08
WO2005112001A1 (ja) 2005-11-24
US8688440B2 (en) 2014-04-01
JPWO2005112001A1 (ja) 2008-03-27
EP1742202B1 (en) 2008-05-07
CN102280109A (zh) 2011-12-14
CN102280109B (zh) 2016-04-27
CN1954363B (zh) 2011-10-12
BRPI0510400A (pt) 2007-10-23
US20130246075A1 (en) 2013-09-19
EP1742202A4 (en) 2007-10-10
US8463602B2 (en) 2013-06-11
JP5013863B2 (ja) 2012-08-29
CN1954363A (zh) 2007-04-25
DE602005006551D1 (de) 2008-06-19
EP1939862A1 (en) 2008-07-02
ATE394774T1 (de) 2008-05-15
US20080262835A1 (en) 2008-10-23
EP3118849A1 (en) 2017-01-18
EP3118849B1 (en) 2020-01-01
EP1939862B1 (en) 2016-10-05
KR20070012832A (ko) 2007-01-29

Similar Documents

Publication Publication Date Title
JP5230782B2 (ja) 符号化装置、階層符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法、および復号化方法
JP5226092B2 (ja) スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP3579047B2 (ja) オーディオ復号装置と復号方法およびプログラム
US7769584B2 (en) Encoder, decoder, encoding method, and decoding method
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
JP4220461B2 (ja) 時間的に離散した音声信号のアップサンプリングした信号を発生する方法と装置
WO2008072737A1 (ja) 符号化装置、復号装置およびこれらの方法
US7844451B2 (en) Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
US11232803B2 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
WO2011058752A1 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110826

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130319

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160329

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5230782

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250