JP5226091B2 - スペクトル符号化装置、スペクトル復号化装置、およびこれらの方法 - Google Patents

スペクトル符号化装置、スペクトル復号化装置、およびこれらの方法 Download PDF

Info

Publication number
JP5226091B2
JP5226091B2 JP2011011995A JP2011011995A JP5226091B2 JP 5226091 B2 JP5226091 B2 JP 5226091B2 JP 2011011995 A JP2011011995 A JP 2011011995A JP 2011011995 A JP2011011995 A JP 2011011995A JP 5226091 B2 JP5226091 B2 JP 5226091B2
Authority
JP
Japan
Prior art keywords
spectrum
signal
frequency
unit
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011011995A
Other languages
English (en)
Other versions
JP2011100158A (ja
Inventor
正浩 押切
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2011011995A priority Critical patent/JP5226091B2/ja
Publication of JP2011100158A publication Critical patent/JP2011100158A/ja
Application granted granted Critical
Publication of JP5226091B2 publication Critical patent/JP5226091B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

本発明は、オーディオ信号または音声信号の周波数帯域を拡張して音質を向上させる方法であり、さらにこの方法を適用したオーディオ信号または音声信号などの符号化方法および復号化方法に関するものである。
音声信号またはオーディオ信号を低ビットレートで圧縮する音声符号化技術やオーディオ符号化技術は、移動体通信における電波等の伝送路容量及び記録媒体の有効利用のために重要である。
音声信号を符号化する音声符号化に、ITU−T(International Telecommunication Union Telecommunication Standardization Sector)で規格化されているG726、G729などの方式が存在する。これらの方式は、狭帯域信号(300Hz〜3.4kHz)を対象とし、8kbit/s〜32kbit/sで高品質に符号化が行える。しかしこのような狭帯域信号は周波数帯域が最大3.4kHzまでと狭いため、その品質はこもっており臨場感に欠ける。
また、音声符号化の分野では、広帯域信号(50Hz〜7kHz)を符号化の対象とする方式が存在する。その代表的な方法として、ITU−TのG722、G722.1や、3GPP(The 3rd Generation Partnership Project)のAMR−WBなどがある。これら方式は、ビットレートが6.6kbit/s〜64kbit/sで広帯域音声信号の符号化が行える。符号化の対象とする信号が音声の場合、広帯域信号は比較的高品質であるものの、オーディオ信号を対象とした場合や音声信号でもさらに高臨場感な品質が求められる場合には十分ではない。
一般に、信号の最大周波数が10〜15kHz程度まであるとFMラジオ相当の臨場感が得られ、20kHz程度までであればCD並みの品質が得られる。このような信号に対しては、MPEG(Moving Picture Expert Group)で規格化されているレイヤ3方式やAAC方式などに代表されるオーディオ符号化が適している。しかしながら、これらオーディオ符号化方式の場合には、符号化の対象となる周波数帯域が広くなるためビットレートが大きくなってしまう。
特許文献1には、周波数帯域の広い信号を低ビットレートで高品質に符号化する方法として、入力信号を低域部と高域部に分割し、高域部は低域部のスペクトルを置換して代用することにより全体のビットレートを低減させる技術が記載されている。この従来技術を原信号に適用したときの処理の様子について図1A〜Dを用いて説明する。ここでは説明を容易にするために原信号に従来技術を適用する場合について述べる。図1A〜Dにおいて横軸は周波数、縦軸は対数パワースペクトルを表す。また、図1Aは周波数帯域が0≦k<FHに帯域制限された原信号の対数パワースペクトル、図1Bは同信号を0≦k<FLに帯域制限されたときの対数パワースペクトル(FL<FH)、図1Cは従来技術により低域のスペクトルを用いて高域のスペクトルを置換したときの図、図1Dは置換後のスペクトルをスペクトル概形情報に従い置換スペクトルの形状を整えたときの図を表す。
従来技術に従えば、スペクトルが0≦k<FLまでの信号(図1B)をもとに原信号のスペクトル(図1A)を表すために、高域(この図ではFL≦K<FH)のスペクトルは低域(0≦k<FL)のスペクトルで置換される(図1C)。なお簡単のために、ここではFL=FH/2の関係にある場合を想定して説明している。次に、原信号のスペクトル包絡情報に従い、高域の置換されたスペクトルの振幅値が調整され、原信号のスペクトルを推定したスペクトルが求められる(図1D)。
特表2001−521648号公報
一般に、音声信号やオーディオ信号のスペクトルは、図2Aに示すように、ある周波数の整数倍にスペクトルのピークが現れる調波構造を持つことが知られている。調波構造は品質を保つ上で重要な情報であり、調波構造にずれが生じると品質劣化が知覚されてしまう。図2Aに、あるオーディオ信号をスペクトル分析したときのスペクトルを示す。この図にあるように、原信号には間隔Tの調波構造が見受けられる。ここで従来技術に従い原信号のスペクトルを推定した図を図2Bに示す。これら2つの図を見比べると、図2Bの方では置換元の低域スペクトル(領域A1)と置換先の高域スペクトル(領域A2)では調波構造が保持されているが、置換元の低域スペクトルと置換先の高域スペクトルの接続部(領域A3)では調波構造が崩れていることが分かる。これは、従来技術では、調波構造の形状を考慮せずに置換が行われたことに起因している。推定スペクトルを時間信号に変換して試聴すると、このような調波構造の乱れによって主観的な品質が低下してしまうことになる。
また、FLがFH/2より小さい場合、つまりFL≦k<FHの帯域に2回以上低域スペクトルを置換する必要がある場合には、スペクトル概形の調整の際に別の問題が生じる。その問題を図3Aおよび図3Bを用いて説明する。音声信号やオーディオ信号は一般にスペクトルが平坦ではなく低域もしくは高域のエネルギーのいずれかが大きい。このように音声信号やオーディオ信号ではスペクトルに傾きが生じている状態にあり、低域のエネルギーより高域のエネルギーの方が小さい場合が多い。このような状況でスペクトルの置換が行われると、スペクトルエネルギーの不連続が生じる(図3A)。図3Aに示されるように単に予め定められた一定周期(サブバンド)毎にスペクトル概形の調整を行うとすると、エネルギーの不連続が解消されず(図3Bの領域A4および領域A5)、この現象が原因で復号信号に異音が発生するなどして主観的な品質が低下してしまう。
本発明は、以上の問題を考慮して、周波数帯域の広い信号を低ビットレートで高品質に符号化する技術を提案するものである。
本発明では、低域のスペクトルを内部状態としてもつフィルタを用いて高域のスペクトルの形状を推定し、そのときのフィルタの特性を表す係数を符号化するスペクトル符号化法において、推定後の高域のスペクトルを適切なサブバンドにてスペクトル概形の調整を実施する。
これにより、復号信号の品質を改善することができる。
従来のビットレート圧縮技術を示す図 音声信号やオーディオ信号のスペクトルにおける調波構造を示す図 スペクトル概形の調整の際に生じるエネルギーの不連続を示す図 実施の形態1に係るスペクトル符号化装置の構成を示すブロック図 フィルタリングにより第2スペクトルの推定値を算出する過程を示す図 フィルタリング部と探索部とピッチ係数設定部の処理の流れを示す図 フィルタリングの様子を表す例を示す図 内部状態に格納されている第1スペクトルの調波構造の別の例を示す図 実施の形態2に係るスペクトル符号化装置の構成を示すブロック図 実施の形態2に係るフィルタリングの様子を示す図 実施の形態3に係るスペクトル符号化装置の構成を示すブロック図 実施の形態3の処理の様子を表す図 実施の形態4に係るスペクトル符号化装置の構成を示すブロック図 実施の形態5に係るスペクトル符号化装置の構成を示すブロック図 実施の形態6に係るスペクトル符号化装置の構成を示すブロック図 実施の形態7に係るスペクトル符号化装置の構成を示すブロック図 実施の形態8に係る階層符号化装置の構成を示すブロック図 実施の形態8に係る階層符号化装置の構成を示すブロック図 実施の形態9に係るスペクトル復号化装置の構成を示すブロック図 実施の形態9に係るフィルタリング部から生成される復号スペクトルの状態を示す図 実施の形態10に係るスペクトル復号化装置の構成を示すブロック図 実施の形態10のフローチャート 実施の形態11に係るスペクトル復号化装置の構成を示すブロック図 実施の形態12に係るスペクトル復号化装置の構成を示すブロック図 実施の形態13に係る階層復号化装置の構成を示すブロック図 実施の形態13に係る階層復号化装置の構成を示すブロック図 実施の形態14に係る音響信号符号化装置の構成を示すブロック図 実施の形態15に係る音響信号復号化装置の構成を示すブロック図 実施の形態16に係る音響信号送信符号化装置の構成を示すブロック図 本発明の実施の形態17に係る音響信号受信復号化装置の構成を示すブロック図
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
図4は、本発明の実施の形態1に係るスペクトル符号化装置100の構成を示すブロック図である。
入力端子102から有効な周波数帯域が0≦k<FLの第1信号が入力され、入力端子103からは有効な周波数帯域が0≦k<FHの第2信号が入力される。次に、周波数領域変換部104では入力端子102から入力される第1信号に周波数変換を行い第1スペクトルS1(k)を算出し、周波数領域変換部105では入力端子103から入力される第2信号に周波数変換を行い第2スペクトルS2(k)を算出する。ここで周波数変換法としては、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、変形離散コサイン変換(MDCT)などが適用できる。
次に内部状態設定部106では、第1スペクトルS1(k)を使ってフィルタリング部107で用いられるフィルタの内部状態を設定する。フィルタリング部107では、内部状態設定部106で設定されたフィルタの内部状態と、ピッチ係数設定部109から与えられるピッチ係数Tに基づきフィルタリングを行い、第2スペクトルの推定値D2(k)を算出する。フィルタリングにより第2スペクトルの推定値D2(k)を算出する過程を図5を用いて説明する。図5において、0≦k<FHのスペクトルを便宜的にS(k)と呼ぶことにする。図5に示すように、S(k)における0≦k<FLの領域はフィルタの内部状態として第1スペクトルS1(k)が格納されており、FL≦k<FHの領域には第2スペクトルの推定値D2(k)が生成されることになる。
本実施例ではフィルタを以下の式(1)で表すものを使用した場合について説明を行うものとし、ここでのTは係数設定部109より与えられた係数を表す。また、本説明ではM=1とする。
Figure 0005226091
フィルタリング処理は周波数の低い方から順に、周波数Tだけ低いスペクトルを中心に対応する係数βiを乗じて加算することで推定値を算出する。
Figure 0005226091
式(2)に従う処理を、FL≦k<FHの間に行う。この結果算出されるS(k) (FL≦k<FH)が第2スペクトルの推定値D2(k)として利用される。
探索部108では、周波数領域変換部105から与えられる第2スペクトルS2(k)とフィルタリング部107から与えられる第2スペクトルの推定値D2(k)の類似度を算出する。類似度には様々な定義が存在するが、本実施例ではまずフィルタ係数β-1およびβを0とみなして最小2乗誤差に基づき定義される以下の式(3)に従い算出される類似度を用いた場合について説明する。この方法では、最適なピッチ係数Tを算出した後にフィルタ係数βiを決定することになる。
Figure 0005226091
ここでEはS2(k)とD2(k)間の2乗誤差を表す。式(3)の右辺第1項はピッチ係数Tに関わらず固定値となるので、式(3)の右辺第2項を最大とするD2(k)を生成するピッチ係数Tが探索されることになる。本実施例では、式(3)の右辺第2項を類似度と呼ぶことにする。
ピッチ係数設定部109は、予め定められた探索範囲TMIN〜TMAXに含まれるピッチ係数Tを順次フィルタリング部107に出力する機能を有する。そのため、ピッチ係数設定部109よりピッチ係数Tが与えられる度にフィルタリング部107でFL≦k<FHの範囲のS(k)をゼロクリアした後にフィルタリングが行われ、探索部108にて類似度が算出される。探索部108では、算出される類似度の中で最大となるときのピッチ係数TmaxをTMIN〜TMAXの間から決定し、そのピッチ係数Tmaxをフィルタ係数算出部110、第2スペクトル推定値生成部115、スペクトル概形調整サブバンド決定部112、および多重化部111に与える。図6にフィルタリング部107と探索部108とピッチ係数設定部109の処理の流れを示す。
図7A〜Eに本実施の形態の理解を容易にするために、フィルタリングの様子を表す例を示す。図7Aは、内部状態に格納されている第1スペクトルの調波構造を、図7B〜Dは、3種類のピッチ係数T0,T1,T2を用いてフィルタリングを行い算出される第2スペクトルの推定値の調波構造の関係を示している。この例によれば、調波構造が保たれるピッチ係数Tとして第2スペクトルS2(k)に形状が近いT1が選択されることになる(図7Cおよび図7E参照)。
また、図8A〜Eに内部状態に格納されている第1スペクトルの調波構造の別の例を示す。この例においても、調波構造が保持される推定スペクトルを算出するのはピッチ係数T1のときであり、探索部108から出力されるのはT1となる(図8Cおよび図8E参照)。
次に、フィルタ係数算出部110では探索部108から与えられるピッチ係数Tmaxを用いてフィルタ係数βiを求める。フィルタ係数βiは以下の式(4)に従う2乗歪Eを最小にするように求められる。
Figure 0005226091
フィルタ係数算出部110では複数個のβi(i=−1,0,1)の組合せを予めテーブルとして持っており、式(4)の2乗歪Eを最小とするβi(i=−1,0,1)の組合せを決定し、そのコードを第2スペクトル推定値生成部115と多重化部111に与える。
第2スペクトル推定値生成部115では、ピッチ係数Tmaxとフィルタ係数βiを用いて、式(1)に従い第2スペクトルの推定値D2(k)を生成して、スペクトル概形調整係数符号化部113に与える。
ピッチ係数Tmaxはスペクトル概形調整サブバンド決定部112にも与えられる。スペクトル概形調整サブバンド決定部112では、ピッチ係数Tmaxを基にスペクトル概形調整のためのサブバンドを決定する。第j番目のサブバンドはピッチ係数Tmaxを用いて以下の式(5)のように表すことができる。
Figure 0005226091
ここで、BL(j)は第jサブバンドの最小周波数、BH(j)は第jサブバンドの最大周波数を表す。また、サブバンド数Jは第J−1サブバンドの最大周波数BH(J−1)がFHを超える最小の整数として表される。このようにして決定されたスペクトル概形調整サブバンドの情報をスペクトル概形調整係数符号化部113に与える。
スペクトル概形調整係数符号化部113では、スペクトル概形調整サブバンド決定部112から与えられるスペクトル概形調整サブバンド情報と、第2スペクトル推定値生成部115から与えられる第2スペクトルの推定値D2(k)と周波数領域変換部105より与えられる第2スペクトルS2(k)を用いてスペクトル概形調整係数を算出し、符号化を行う。本実施の形態では、当該スペクトル概形情報をサブバンド毎のスペクトルパワーで表す場合について説明する。このとき、第jサブバンドのスペクトルパワーは以下の式(6)で表される。
Figure 0005226091
ここで、BL(j)は第jサブバンドの最小周波数、BH(j)は第jサブバンドの最大周波数を表す。このようにして求めた第2スペクトルのサブバンド情報を第2スペクトルのスペクトル概形情報とみなす。同様に第2スペクトルの推定値D2(k)のサブバンド情報b(j)を以下の式(7)に従い算出し、サブバンド毎の変動量V(j)を以下の式(8)に従い算出する。
Figure 0005226091
Figure 0005226091
次に、変動量V(j)を符号化してそのコードを多重化部111に送る。
より詳細なスペクトル概形情報を算出するために、次のような方法を適用しても良い。スペクトル概形調整サブバンドをさらにバンド幅の小さいサブバンドに分割し、それぞれのサブバンド毎にスペクトル概形調整係数を算出する。例えば、第jサブバンドを分割数Nに分割したときには、式(9)を用いて各サブバンドでN次のスペクトル調整係数のベクトルを算出し、このベクトルをベクトル量子化して歪が最小となる代表ベクトルのインデックスを多重化部111に出力する。ここで、B(j,n)およびb(j,n)はそれぞれ、
Figure 0005226091
Figure 0005226091
Figure 0005226091
として算出される。また、BL(j,n)、BH(j,n)はそれぞれ、第jサブバンドの第n分割部の最小周波数と最大周波数を表す。
多重化部111では、探索部108から得られる最適なピッチ係数Tmaxの情報とフィルタ係数算出部110から得られるフィルタ係数の情報と、スペクトル概形調整係数符号化部113から得られるスペクトル概形調整係数の情報を多重化して出力端子114より出力する。
本実施の形態では、式(1)におけるM=1のときについて説明を行ったが、この値に限定されることが無く、0以上の整数を用いることが可能である。また、本実施の形態において、周波数領域変換部104,105を用いる場合を説明したが、これらは時間領域信号を入力とする場合に必要な構成要素であり、直接スペクトルが入力される構成において周波数領域変換部は必要ない。
(実施の形態2)
図9は、本発明の実施の形態2に係るスペクトル符号化装置200の構成を示すブロック図である。本実施の形態では、フィルタリング部で用いるフィルタの構成が簡易なため、フィルタ係数算出部が必要なく、少ない演算量で第2スペクトルの推定を行うことができるという効果が得られる。なお、図9において、図4と同じ名称を持つ構成要素は同一の機能を有するため、そのような構成要素についての詳細な説明は省略する。例えば、図4のスペクトル概形調整サブバンド決定部112は、図9のスペクトル概形調整サブバンド決定部209と「スペクトル概形調整サブバンド決定部」という同じ名称を持つので、同一の機能を有している。
フィルタリング部206で用いられるフィルタの構成は次式のように簡略化したものを用いる。
Figure 0005226091
式(12)は、式(1)を基にM=0、β=1として表されるフィルタとなっている。このときのフィルタリングの様子を図10に示す。このように第2スペクトルの推定値D2(k)は、Tだけ離れた低域のスペクトルを順次コピーすることにより求めることができる。
また探索部207では、最適なピッチ係数Tmaxを実施の形態1と同様に式(3)を最小とするときのピッチ係数Tを探索して決定する。このようにして求めたピッチ係数Tmaxを多重化部211に与える。
本構成において、スペクトル概形調整係数符号化部210に与えられる第2スペクトルの推定値D2(k)は探索部207で探索のために一時的に生成したものを利用することを想定している。よって、スペクトル概形調整係数符号化部210には探索部207より第2スペクトル推定値D2(k)が与えられている。
(実施の形態3)
図11は、本発明の実施の形態3に係るスペクトル符号化装置300の構成を示すブロック図である。本実施の形態の特徴は、FL≦k<FHの帯域を複数のサブバンドに予め分割しておき、それぞれのサブバンドについてピッチ係数Tの探索、フィルタ係数の算出およびスペクトル概形の調整を行い、これら情報を符号化する点にある。これにより、置換元である0≦k<FLの帯域のスペクトルに含まれるスペクトル傾きに起因するスペクトルエネルギーの不連続の問題が回避され、さらにサブバンド毎に独立に符号化を行うためにより高品質な帯域の拡張を実現できるという効果が得られる。図11において、図4と同じ名称を持つ構成要素は同一の機能を有するため、そのような構成要素についての詳細な説明は省略する。
サブバンド分割部309は、周波数領域変換部304より与えられる第2のスペクトルS2(k)の帯域FL≦k<FHを予め定めておいたJ個のサブバンドに分割する。本実施例では、J=4として説明する。サブバンド分割部309は、第0サブバンドに含まれるスペクトルS2(k)を端子310aに出力する。同様に、第1サブバンド、第2サブバンドおよび第3サブバンドに含まれるスペクトルS2(k)はそれぞれ、端子310b、310cおよび310dに出力される。
サブバンド選択部312は、切り替え部311が端子310a、端子310b、端子310cおよび端子310dを順次選択するように切り替え部311を制御する。つまりサブバンド選択部312によって、探索部307、フィルタ係数算出部313およびスペクトル概形調整係数符号化部314に、第0サブバンド、第1サブバンド、第2サブバンドおよび第3サブバンドと順次選択されてスペクトルS2(k)が与えられることになる。以降は、サブバンド単位で処理が実施され、サブバンド毎にピッチ係数Tmax、フィル
タ係数βiおよびスペクトル概形調整係数が求められ、多重化部315に与えられることになる。よって、多重化部315には、J個のピッチ係数Tmaxの情報、J個のフィルタ係数の情報およびJ個のスペクトル概形調整係数の情報が与えられる。
また、本実施の形態では予めサブバンドが決定されているために、スペクトル概形調整サブバンド決定部は必要なくなる。
図12は、本実施の形態の処理の様子を表す図である。この図に示されるように、帯域FL≦k<FHは予め定められたサブバンドに分割され、各々のサブバンド毎にTmax、βi、Vqを算出し、それぞれが多重化部に送られる。この構成により、低域スペクトルから置換されるスペクトルのバンド幅とスペクトル概形調整のためのサブバンドのバンド幅とが一致するために、スペクトルエネルギーの不連続が発生しなくなり、音質が改善される。
(実施の形態4)
図13は、本発明の実施の形態4に係るスペクトル符号化装置400の構成を示すブロック図である。本実施の形態の特徴は、前述の実施の形態3を基にしてフィルタリング部で用いるフィルタの構成が簡易な点にある。このため、フィルタ係数算出部が必要なく、少ない演算量で第2スペクトルの推定を行うことができるという効果が得られる。図13において、図11と同じ名称を持つ構成要素は同一の機能を有するため、そのような構成要素についての詳細な説明は省略する。
フィルタリング部406で用いられるフィルタの構成は次式のように簡略化したものを用いる。
Figure 0005226091
式(13)は、式(1)を基にM=0、β0=1として表されるフィルタとなっている。このときのフィルタリングの様子を図10に示す。このように第2スペクトルの推定値D2(k)は、Tだけ離れた低域のスペクトルを順次コピーすることにより求めることができる。
また探索部407では、最適なピッチ係数Tmaxを実施の形態1と同様に式(3)を最小とするときのピッチ係数Tを探索して決定する。このようにして求めたピッチ係数Tmaxを多重化部414に与える。
本構成において、スペクトル概形調整係数符号化部413に与えられる第2スペクトルの推定値D2(k)は探索部407で探索のために一時的に生成したものを利用することを想定している。よって、スペクトル概形調整係数符号化部413には探索部407より第2スペクトル推定値D2(k)が与えられている。
(実施の形態5)
図14は、本発明の実施の形態5に係るスペクトル符号化装置500の構成を示すブロック図である。本実施の形態の特徴は、第1スペクトルS1(k)と第2スペクトルS2(k)を、それぞれLPCスペクトルを用いてスペクトル傾きを補正し、補正後のスペクトルを用いて第2スペクトルの推定値D2(k)を求めている点にある。これにより、スペクトルエネルギーの不連続の問題が解消されるという効果が得られる。図14において、図13と同じ名称を持つ構成要素は同一の機能を有するため、そのような構成要素についての詳細な説明は省略する。また、本実施の形態では前述の実施の形態4に対してスペクトル傾き補正の技術を適用する場合について説明するが、これに限定されることは無く、前述した実施の形態1〜3のそれぞれについて本技術を適用することが可能である。
入力端子505より、ここでは図示されないLPC分析部もしくはLPC復号部により求められたLPC係数が入力され、LPCスペクトル算出部506に与えられる。これとは別に、LPC係数は、入力端子501から入力される信号をLPC分析して求める構成であってもよい。この場合、入力端子505は必要なくなり、その代わりLPC分析部が新たに追加されることになる。
LPCスペクトル算出部506では、LPC係数を基に、次に示す式(14)に従いスペクトル包絡を算出する。
Figure 0005226091
または、次の式(15)に従いスペクトル包絡を算出しても良い。
Figure 0005226091
ここでαはLPC係数、NPはLPC係数の次数、Kはスペクトル分解能を表す。また、γは0以上1未満の定数であり、このγの使用によりスペクトルの形状を平滑化させることができる。このようにして求めたスペクトル包絡e1(k)はスペクトル傾き補正507に与えられる。
スペクトル傾き補正507では、LPCスペクトル算出部506より得られるスペクトル包絡e1(k)を使い、周波数領域変換部503より与えられる第1スペクトルS1(k)に内在するスペクトル傾きを次の式(16)に従い補正する。
Figure 0005226091
このようにして求めた補正後の第1スペクトルを内部状態設定部511に与える。
その一方で第2スペクトルの算出の際にも同様の処理を行う。入力端子502から入力される第2信号をLPC分析部508に与え、LPC分析を行いLPC係数を求める。ここで求めたLPC係数はLSP係数などの符号化に適したパラメータに変換した後に符号化され、そのインデックスを多重化部521に与える。それと同時に、LPC係数を復号して復号LPC係数をLPCスペクトル算出部509に与える。LPCスペクトル算出部509は、前述したLPCスペクトル算出部506と同様の機能を有しており、第2信号用のスペクトル包絡e2(k)を式(14)または式(15)に従い算出する。スペクトル傾き補正部510は、前述したスペクトル傾き補正507と同様の機能を有し、第2スペクトルに内在するスペクトル傾きを次の式(17)に従い補正する。
Figure 0005226091
このようにして求めた補正後の第2スペクトルを探索部513に与えると同時にスペクトル傾き付与部519に与える。
スペクトル傾き付与部519では、探索部513から与えられる第2スペクトルの推定値D2(k)に次の式(18)に従いスペクトル傾きを付与する。
Figure 0005226091
このようにして算出した第2スペクトルの推定値s2new(k)をスペクトル概形調整係数符号化部520に与える。
多重化部521では、探索部513から与えられるピッチ係数Tmaxの情報、スペクトル概形調整係数符号化部520から与えられる調整係数の情報、LPC分析部から与えられるLPC係数の符号化情報を多重化して出力端子522より出力する。
(実施の形態6)
図15は、本発明の実施の形態6に係るスペクトル符号化装置600の構成を示すブロック図である。本実施の形態の特徴は、第1スペクトルS1(k)の中から比較的スペクトルの形状が平坦な帯域を検出し、この平坦な帯域からピッチ係数Tの探索を行う。これにより、置換後のスペクトルのエネルギーが不連続になりにくくなり、スペクトルエネルギーの不連続の問題が回避されるという効果が得られる。図15において、図13と同じ名称を持つ構成要素は同一の機能を有するため、そのような構成要素についての詳細な説明は省略する。また、本実施の形態では前述の実施の形態4に対してスペクトル傾き補正の技術を適用する場合について説明するが、これに限定されることは無く、これまで前述した実施の形態のそれぞれについて本技術を適用することが可能である。
スペクトル平坦部検出部605には、周波数領域変換部603より第1スペクトルS1(k)が与えられ、第1スペクトルS1(k)からスペクトルの形状が平坦な帯域を検出する。スペクトル平坦部検出部605では、帯域0≦k<FLの第1スペクトルS1(k)を複数のサブバンドに分割し、各々のサブバンドのスペクトル変動量を定量化し、そのスペクトル変動量が最も小さいサブバンドを検出する。そのサブバンドを示す情報をピッチ係数設定部609および多重化部615に与える。
本実施例ではスペクトルの変動量を定量化する手段として、サブバンドに含まれるスペクトルの分散値を用いる場合について説明する。帯域0≦k<FLをN個のサブバンドに分割し、各サブバンドに含まれるスペクトルS1(k)の分散値u(n)を次の式(19)に従い算出する。
Figure 0005226091
ここでBL(n)は第nサブバンドの最小周波数、BH(n)は第nサブバンドの最大周波数、S1meanは、第nサブバンドに含まれるスペクトルの絶対値の平均を表す。ここでスペクトルの絶対値をとるのは、スペクトルの振幅値の観点での平坦な帯域の検出を目的としているからである。
このようにして求めた各サブバンドの分散値u(n)を比較し、最も分散値の小さいサブバンドを決定し、そのサブバンドを示す変数nをピッチ係数設定部609および多重化部615に与えることになる。
ピッチ係数設定部609では、スペクトル平坦部検出部605にて決定されたサブバンドの帯域の中にピッチ係数Tの探索範囲を限定し、その限定された範囲の中でピッチ係数Tの候補を決定する。これにより、スペクトルエネルギーの変動が小さい帯域の中からピッチ係数Tが決定されることになるため、スペクトルエネルギーの不連続の問題が緩和される。
多重化部615では、探索部608から与えられるピッチ係数Tmaxの情報、スペクトル概形調整係数符号化部614から与えられる調整係数の情報、スペクトル平坦部検出部605から与えられるサブバンドの情報を多重化して出力端子616より出力する。
(実施の形態7)
図16は、本発明の実施の形態7に係るスペクトル符号化装置700の構成を示すブロック図である。本実施の形態の特徴は、入力信号の周期性の強さによってピッチ係数Tを探索する範囲を適応的に変化させる点にある。これにより、無声部のように周期性の低い信号に対しては調波構造が存在しないので探索範囲を非常に小さく設定しても問題は生じにくい。また有声部のように周期性の高い信号に対しては、そのときのピッチ周期の値によってピッチ係数Tを探索する範囲を変更する。これにより、ピッチ係数Tを表すための情報量を小さくすることができ、ビットレートを削減することが可能となる。図16において、図13と同じ名称を持つ構成要素は同一の機能を有するため、そのような構成要素についての詳細な説明は省略する。また、本実施の形態では前述の実施の形態4に対して本技術を適用する場合について説明するが、これに限定されることは無く、これまで前述した実施の形態のそれぞれについて本技術を適用することが可能である。
入力端子706からは、ピッチ周期性の強さを表すパラメータとピッチ周期の長さを表すパラメータの少なくとも一方が入力されてくる。本実施例では、ピッチ周期の強さを表すパラメータとピッチ周期の長さを表すパラメータが入力されるときの説明を行う。また、本実施例では、ここでは図示されないCELPの適応符号帳探索にて求められたピッチ周期PとピッチゲインPgが入力端子706より入力されるものとして説明を行う。
探索範囲決定部707では、入力端子706より与えられるピッチ周期PとピッチゲインPgを用いて探索範囲を決定する。まず、入力信号の周期性の強さをピッチゲインPgの大きさで判定する。ピッチゲインPgが閾値と比較して大きい場合には、入力端子701から入力される入力信号は有声部であるとみなし、ピッチ周期Pで表される調波構造の少なくとも1つの調波を含むようにピッチ係数Tの探索範囲を表すTMINとTMAXを決定する。従ってピッチ周期Pの周波数が大きい場合にピッチ係数Tの探索範囲は広く設定され、逆にピッチ周期Pの周波数が小さい場合にはピッチ係数Tの探索範囲を狭く設定される。
ピッチゲインPgが閾値と比較して小さい場合には、入力端子701から入力される入力信号は無声部であるとみなし、調波構造が無いとしてピッチ係数Tを探索する探索範囲を非常に狭く設定する。
(実施の形態8)
図17は、本発明の実施の形態8に係る階層符号化装置800の構成を示すブロック図である。本実施の形態では、前述した実施の形態1〜7のいずれか一つを階層符号化に適用することにより、音声信号もしくはオーディオ信号を低ビットレートで高品質に符号化することが可能となる。
入力端子801から音響データが入力され、ダウンサンプリング部802でサンプリングレートの低い信号が生成される。ダウンサンプリングされた信号が第1レイヤ符号化部803に与えられ、当該信号を符号化する。第1レイヤ符号化部803の符号化コードは多重化部807に与えられると共に、第1レイヤ復号化部804に与えられる。第1レイヤ復号化部804では、符号化コードをもとに第1レイヤの復号信号を生成する。
次に、アップサンプリング部805にて第1レイヤ符号化手段803の復号信号のサンプリングレートを上げる。遅延部806は、入力端子801から入力される入力信号に特定の長さの遅延を与える。この遅延の大きさをダウンサンプリング部802と第1レイヤ符号化部803と第1レイヤ復号化部804とアップサンプリング部805で生じる時間遅れと同値とする。
スペクトル符号化部101には、前述の実施の形態1〜7の内のいずれかひとつが適用され、アップサンプリング部805から得られる信号を第1信号、遅延部806から得られる信号を第2信号としてスペクトル符号化を行い、符号化コードを多重化部807に出力する。
第1レイヤ符号化部803で求められる符号化コードとスペクトル符号化部101で求められる符号化コードは多重化部807にて多重化され、出力コードとして出力端子808より出力される。
スペクトル符号化部101の構成が図14および図16に示されるものであるとき、本実施の形態に係る階層符号化装置800a(図17に示した階層符号化装置800と区別するため、末尾にアルファベットの小文字を付す)の構成は図18のようになる。図18と図17の違いは、スペクトル符号化部101に第1レイヤ復号化部804aより直接入力される信号線が追加されている点にある。これは、第1レイヤ復号化部804で復号されたLPC係数またはピッチ周期PやピッチゲインPgがスペクトル符号化部101に与えられることを表している。
(実施の形態9)
図19は、本発明の実施の形態9に係るスペクトル復号化装置1000の構成を示すブロック図である。
本実施の形態では、第1のスペクトルを基に第2のスペクトルの高域成分をフィルタによって推定して生成される符号化コードを復号することができ精度の良い推定スペクトルを復号することが可能になり、かつ推定後の高域のスペクトルを適切なサブバンドにてスペクトル概形を調整することにより、復号信号の品質を改善するという効果が得られる。入力端子1002からここでは図示されないスペクトル符号化部にて符号化された符号化コードが入力され、分離部1003に与えられる。分離部1003では、フィルタ係数の情報をフィルタリング部1007とスペクトル概形調整サブバンド決定部1008に与える。それとともに、スペクトル概形調整係数の情報をスペクトル概形調整係数復号部1009に与える。さらに、入力端子1004から有効な周波数帯域が0≦k<FLの第1信号が入力され、周波数領域変換部1005では入力端子1004から入力された時間領域信号に周波数変換を行い第1スペクトルS1(k)を算出する。ここで周波数変換法としては、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、変形離散コサイン変換(MDCT)などが適用できる。
次に内部状態設定部1006では、第1スペクトルS1(k)を使ってフィルタリング部1007で用いられるフィルタの内部状態を設定する。フィルタリング部1007では、内部状態設定部1006で設定されたフィルタの内部状態と、分離部1003から与えられるピッチ係数Tmaxおよびフィルタ係数βに基づきフィルタリングを行い、第2スペクトルの推定値D2(k)を算出する。この場合、フィルタリング部1007では式(1)に記載のフィルタが用いられる。また、式(12)に記載のフィルタを用いる場合には、分離部1003から与えられるのはピッチ係数Tmaxのみとなる。どちらのフィルタを利用するかは、ここでは図示されないスペクトル符号化部で用いたフィルタの種類に対応し、そのフィルタと同一のフィルタを用いる。
フィルタリング部1007から生成される復号スペクトルD(k)の状態を図20に示す。図20にあるように、復号スペクトルD(k)の周波数帯域0≦k<FLにおいて第1スペクトルS1(k)、周波数帯域FL≦k<FHにおいて第2スペクトルの推定値D2(k)により構成される。
スペクトル概形調整サブバンド決定部1008は、分離部1003より与えられるピッチ係数Tmaxを用いてスペクトル概形の調整を行うサブバンドを決定する。第j番目のサブバンドはピッチ係数Tmaxを用いて次の式(20)のように表すことができる。
Figure 0005226091
ここで、BL(j)は第jサブバンドの最小周波数、BH(j)は第jサブバンドの最大周波数を表す。また、サブバンド数Jは第J−1サブバンドの最大周波数BH(J−1)がFHを超える最小の整数として表される。このようにして決定されたスペクトル概形調整サブバンドの情報をスペクトル調整部1010に与える。
スペクトル概形調整係数復号部1009では分離部1003から与えられるスペクトル概形調整係数の情報を基にスペクトル概形調整係数を復号し、この復号されたスペクトル概形調整係数をスペクトル調整部1010に与える。ここで、スペクトル概形調整係数は、式(8)に示されるサブバンド毎の変動量を量子化し、その後に復号した値Vq(j)を表す。
スペクトル調整部1010では、フィルタリング部1007から得られる復号スペクトルD(k)に、スペクトル概形調整サブバンド決定部1008より与えられるサブバンドに対しスペクトル概形調整係数復号部1009で復号されたサブバンド毎の変動量の復号値Vq(j)を次の式(21)に従い乗じることにより、復号スペクトルD(k)の周波数帯域FL≦k<FHのスペクトル形状を調整し、調整後の復号スペクトルS3(k)を生成する。
Figure 0005226091
この復号スペクトルS3(k)は時間領域変換部1011に与えられ時間領域信号に変換し、出力端子1012より出力する。時間領域変換部1011にて時間領域信号に変換する際には、必要に応じて適切な窓掛けおよび重ね合わせ加算などの処理を行い、フレーム間に生じる不連続を回避する。
(実施の形態10)
図21は、本発明の実施の形態10に係るスペクトル復号化装置1100の構成を示すブロック図である。本実施の形態の特徴は、FL≦k<FHの帯域を複数のサブバンドに予め分割しておき、それぞれのサブバンドの情報を用いて復号することができる点にある。これにより、置換元である0≦k<FLの帯域のスペクトルに含まれるスペクトル傾きに起因するスペクトルエネルギーの不連続の問題が回避され、さらにサブバンド毎に独立に符号化された符号化コードを復号できるため、高品質な復号信号を生成することができる。図21において、図19と同じ名称を持つ構成要素は同一の機能を有するため、そのような構成要素についての詳細な説明は省略する。
本実施の形態では、図12に示されるように帯域FL≦k<FHを予め定めておいたJ個のサブバンドに分割し、それぞれのサブバンドについて符号化されたピッチ係数Tmax、フィルタ係数β、スペクトル概形調整係数Vqを復号して音声信号を生成する。もしくは、それぞれのサブバンドについて符号化されたピッチ係数Tmax、スペクトル概形調整係数Vqを復号して音声信号を生成するものである。どちらの手法に従うかは、ここでは図示されないスペクトル符号化部で用いられたフィルタの種類に依存する。前者の場合には式(1)、後者の場合には式(12)のフィルタを用いていることになる。
スペクトル調整部1108から、帯域0≦k<FLには第1スペクトルS1(k)が格納され、帯域FL≦k<FHについてはJ個のサブバンドに分割されたスペクトル概形調整後のスペクトルがサブバンド統合部1109に与えられる。サブバンド統合部1109では、これらスペクトルを結合して図20に示されるような復号スペクトルD(k)を生成する。このようにして生成された復号スペクトルD(k)を時間領域変換部1110に与える。本実施の形態のフローチャートを図22に示す。
(実施の形態11)
図23は、本発明の実施の形態11に係るスペクトル復号化装置1200の構成を示すブロック図である。本実施の形態の特徴は、第1スペクトルS1(k)と第2スペクトルS2(k)を、それぞれLPCスペクトルを用いてスペクトル傾きを補正し、補正後のスペクトルを用いて第2スペクトルの推定値D2(k)を求めて得られる符号を復号できる点にある。これにより、スペクトルエネルギーの不連続の問題が解消されたスペクトルを得ることができ、高品質な復号信号を生成できるという効果が得られる。図23において、図21と同じ名称を持つ構成要素は同一の機能を有するため、そのような構成要素についての詳細な説明は省略する。また、本実施の形態では前述の実施の形態10に対してスペクトル傾き補正の技術を適用する場合について説明するが、これに限定されることは無く、前述した実施の形態9に対して本技術を適用することが可能である。
LPC係数復号部1210は、分離部1202より与えられるLPC係数の情報を基にLPC係数を復号し、LPCスペクトル算出部1211にLPC係数を与える。LPC係数復号部1210の処理は、ここでは図示されない符号化部のLPC分析部内で行われるLPC係数の符号化処理に依存し、そこでの符号化処理で得られた符号を復号する処理が実施される。LPCスペクトル算出部1211は、式(14)または式(15)に従いLPCスペクトルを算出する。どのような方法を用いるかは、ここでは図示されない符号化部のLPCスペクトル算出部で用いた方法と同じ方法を適用すれば良い。LPCスペクトル算出部1211で求められたLPCスペクトルはスペクトル傾き付与部1209に与えられる。
その一方で、入力端子1215からは、ここでは図示されないLPC復号部もしくはLPC算出部で求められたLPC係数が入力され、LPCスペクトル算出部1216に与えられる。LPCスペクトル1216では、式(14)または式(15)に従いLPCスペクトルを算出する。どちらを使用するかは、ここでは図示されない符号化部でどのような方法を用いたかに依存する。
スペクトル傾き付与部1209では、以下の式(22)に従いフィルタリング部1206より与えられる復号スペクトルD(k)にスペクトル傾きを乗じ、その後にスペクトル傾きを付与された復号スペクトルD(k)をスペクトル調整部1207に与える。式(22)において、e1(k)はLPCスペクトル算出部1216の出力、e2(k)はLPCスペクトル算出部1211の出力を表す。
Figure 0005226091
(実施の形態12)
図24は、本発明の実施の形態12に係るスペクトル復号化装置1300の構成を示すブロック図である。本実施の形態の特徴は、第1スペクトルS1(k)の中から比較的スペクトルの形状が平坦な帯域を検出し、この平坦な帯域からピッチ係数Tの探索を行うことにより得られる符号を復号できる点にある。これにより、置換後のスペクトルのエネルギーが不連続になりにくくなり、スペクトルエネルギーの不連続の問題が回避される復号スペクトルを得ることができ、高品質な復号信号を生成することができるという効果が得られる。図24において、図21と同じ名称を持つ構成要素は同一の機能を有するため、そのような構成要素についての詳細な説明は省略する。また、本実施の形態では前述の実施の形態10に対して本技術を適用する場合について説明するが、これに限定されることは無く、前述した実施の形態9および実施の形態11に対して本技術を適用することが可能である。
分離部1302から帯域0≦k<FLをN個のサブバンドに分割した内のどのサブバンドが選択されたかを示すサブバンド選択情報nと、第nサブバンドに含まれる周波数の内、どの位置を置換元の始点として使用したかを示す情報がピッチ係数Tmax生成部1303に与えられる。ピッチ係数Tmax生成部1303では、これら2つの情報を基にフィルタリング部1307で用いられるピッチ係数Tmaxを生成し、フィルタリング部1307にピッチ係数Tmaxを与える。
(実施の形態13)
図25は、本発明の実施の形態13に係る階層復号化装置1400の構成を示すブロック図である。本実施の形態では、前述した実施の形態9〜12のいずれか一つを階層復号化法に適用することにより、前述した実施の形態8の階層符号化法により生成された符号化コードを復号することができるようになり、高品質な音声信号もしくはオーディオ信号を復号することが可能となる。
入力端子1401からここでは図示されない階層信号符号化法にて符号化されたコードが入力され、分離部1402にて前記コードを分離して第1レイヤ復号化部用の符号とスペクトル復号化部用の符号を生成する。第1レイヤ復号化部1403では、分離部1402で得られた符号を用いてサンプリングレート2・FLの復号信号を復号し、当該復号信号をアップサンプリング部1405に与える。アップサンプリング部1405では、第1レイヤ復号化部1403より与えられる第1レイヤ復号信号のサンプリング周波数を2・FHに上げる。本構成によれば、第1レイヤ復号化部1403で生成される第1レイヤ復号信号を出力する必要がある場合には、出力端子1404より出力させることができる。第1レイヤ復号信号が必要ない場合には、出力端子1404を構成より削除することができる。
スペクトル復号化部1001に、分離部1402で分離された符号とアップサンプリング部1405で生成されたアップサンプリング後の第1レイヤ復号信号が与えられる。スペクトル復号化部1001では、前述した実施の形態9〜12の内の1つの方法に基づきスペクトル復号化を行い、サンプリング周波数2・FHの復号信号を生成し、出力端子1406より出力する。スペクトル復号化部1001では、アップサンプリング部1405より与えられるアップサンプリング後の第1レイヤ復号信号を第1信号とみなして処理を行うことになる。
スペクトル復号化部1001の構成が図23に示されるものであるとき、本実施の形態に係る階層復号化装置1400aの構成は図26のようになる。図25と図26の違いは、スペクトル復号化部1001に分離部1402より直接入力される信号線が追加されている点にある。これは、分離部1402で復号されたLPC係数またはピッチ周期PやピッチゲインPgがスペクトル復号化部1001に与えられることを表している。
(実施の形態14)
次に、本発明の実施の形態14について、図面を参照して説明する。図27は、本発明の実施の形態14に係る音響信号符号化装置1500の構成を示すブロック図である。図27における音響符号化装置1504は、前述した実施の形態8に示した階層符号化装置800によって構成されている点に本実施の形態の特徴がある。
図27に示すように、本発明の実施の形態14に係る音響信号符号化装置1500は、入力装置1502、AD変換装置1503及びネットーク1505に接続されている音響符号化装置1504を具備している。
AD変換装置1503の入力端子は、入力装置1502の出力端子に接続されている。音響符号化装置1504の入力端子は、AD変換装置1503の出力端子に接続されている。音響符号化装置1504の出力端子はネットワーク1505に接続されている。
入力装置1502は、人間の耳に聞こえる音波1501を電気的信号であるアナログ信号に変換してAD変換装置1503に与える。AD変換装置1503はアナログ信号をディジタル信号に変換して音響符号化装置1504に与える。音響符号化装置1504は入力されてくるディジタル信号を符号化してコードを生成し、ネットワーク1505に出力する。
本発明の実施の形態14によれば、前述した実施の形態8に示したような効果を享受でき、効率よく音響信号を符号化する音響符号化装置を提供することができる。
(実施の形態15)
次に、本発明の実施の形態15について、図面を参照して説明する。図28は、本発明の実施の形態15に係る音響信号復号化装置1600の構成を示すブロック図である。図28における音響復号化装置1603は、前述した実施の形態13に示した階層復号化装置1400によって構成されている点に本実施の形態の特徴がある。
図28に示すように、本発明の実施の形態15に係る音響信号復号化装置1600は、ネットーク1601に接続されている受信装置1602、音響復号化装置1603、及びDA変換装置1604及び出力装置1605を具備している。
受信装置1602の入力端子は、ネットワーク1601に接続されている。音響復号化装置1603の入力端子は、受信装置1602の出力端子に接続されている。DA変換装置1604の入力端子は、音声復号化装置1603の出力端子に接続されている。出力装置1605の入力端子は、DA変換装置1604の出力端子に接続されている。
受信装置1602は、ネットワーク1601からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して音響復号化装置1603に与える。音声復号化装置1603は、受信装置1602からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してDA変換装置1604に与える。DA変換装置1604は、音響復号化装置1603からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置1605に与える。出力装置1605は、電気的信号であるアナログの復号化音響信号を空気の振動に変換して音波1606として人間の耳に聴こえるように出力する。
本発明の実施の形態15によれば、前述した実施の形態13に示したような効果を享受でき、少ないビット数で効率よく符号化された音響信号を復号することができるので、良好な音響信号を出力することができる。
(実施の形態16)
次に、本発明の実施の形態16について、図面を参照して説明する。図29は、本発明の実施の形態16に係る音響信号送信符号化装置1700の構成を示すブロック図である。本発明の実施の形態16において、図29における音響符号化装置1704は、前述した実施の形態8に示した階層符号化装置800によって構成されている点に本実施の形態の特徴がある。
図29に示すように、本発明の実施の形態16に係る音響信号送信符号化装置1700は、入力装置1702、AD変換装置1703、音響符号化装置1704、RF変調装置1705及びアンテナ1706を具備している。
入力装置1702は人間の耳に聞こえる音波1701を電気的信号であるアナログ信号に変換してAD変換装置1703に与える。AD変換装置1703はアナログ信号をディジタル信号に変換して音響符号化装置1704に与える。音響符号化装置1704は入力されてくるディジタル信号を符号化して符号化音響信号を生成し、RF変調装置1705に与える。RF変調装置1705は、符号化音響信号を変調して変調符号化音響信号を生成し、アンテナ1706に与える。アンテナ1706は、変調符号化音響信号を電波1707として送信する。
本発明の実施の形態16によれば、前述した実施の形態8に示したような効果を享受でき、少ないビット数で効率よく音響信号を符号化することができる。
なお、本発明は、オーディオ信号を用いる送信装置、送信符号化装置又は音響信号符号化装置に適用することができる。また、本発明は、移動局装置又は基地局装置にも適用することができる。
(実施の形態17)
次に、本発明の実施の形態17について、図面を参照して説明する。図30は、本発明の実施の形態17に係る音響信号受信復号化装置1800の構成を示すブロック図である。本発明の実施の形態17において、図30における音響復号化装置1804は、前述した実施の形態13に示した階層復号化装置1400によって構成されている点に本実施の形態の特徴がある。
図30に示すように、本発明の実施の形態17に係る音響信号受信復号化装置1800は、アンテナ1802、RF復調装置1803、音響復号化装置1804、DA変換装置1805及び出力装置1806を具備している。
アンテナ1802は、電波1801としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してRF復調装置1803に与える。RF復調装置1803は、アンテナ1802からの受信符号化音響信号を復調して復調符号化音響信号を生成して音響復号化装置1804に与える。
音響復号化装置1804は、RF復調装置1803からのディジタルの復調符号化音響信号を受けて復号化処理を行ってディジタルの復号化音響信号を生成してDA変換装置1805に与える。DA変換装置1805は、音響復号化装置1804からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置1806に与える。出力装置1806は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波1807として人間の耳に聴こえるように出力する。
本発明の実施の形態17によれば、前述した実施の形態13に示したような効果を享受でき、少ないビット数で効率よく符号化された音響信号を復号することができるので、良好な音響信号を出力することができる。
以上説明したように、本発明によれば、第1スペクトルを内部状態に持つフィルタを使って第2スペクトルの高域部の推定を行い、第2スペクトルの推定値との類似度が最も大きくなるときのフィルタ係数を符号化し、かつ第2スペクトルの推定値を適切なサブバンドにてスペクトル概形の調整を実施することにより、低ビットレートで高品質にスペクトルを符号化することができる。さらに本発明を階層符号化に適用することにより、音声信号やオーディオ信号を低ビットレートで高品質に符号化することができる。
なお、本発明は、オーディオ信号を用いる受信装置、受信復号化装置又は音声信号復号化装置に適用することができる。また、本発明は、移動局装置又は基地局装置にも適用することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されていても良いし、一部または全てを含むように1チップ化されていても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてあり得る。
本発明のスペクトル符号化法の第1の態様は、第1の信号を周波数変換し第1のスペクトルを算出する手段と、第2の信号を周波数変換し第2のスペクトルを算出する手段と、FL≦k<FHの帯域の第2のスペクトルの形状を、0≦k<FLの帯域の第1のスペクトルを内部状態として持つフィルタで推定し、このときのフィルタの特性を表す係数を符号化するスペクトル符号化方法において、フィルタの特性を表す係数に基づいて決定される第2のスペクトルの概形を併せて符号化する構成よりなる。
この構成によれば、第1のスペクトルS1(k)を基に第2のスペクトルS2(k)の高域成分をフィルタによって推定することにより、フィルタの特性を表す係数のみを符号化すれば良く、低ビットレートで精度良く第2のスペクトルS2(k)の高域成分を推定することが可能となる。さらに、フィルタの特性を表す係数に基づいてスペクトル概形を符号化するためにスペクトルのエネルギーの不連続が発生しなくなり品質を改善することが可能となる。
さらに本発明のスペクトル符号化法の第2の態様は、第2のスペクトルを複数のサブバンドに分割し、それぞれのサブバンド毎にフィルタの特性を表す係数とスペクトルの概形を符号化する構成よりなる。
この構成によれば、第1のスペクトルS1(k)を基に第2のスペクトルS2(k)の高域成分をフィルタによって推定することにより、フィルタの特性を表す係数のみを符号化すれば良く、低ビットレートで精度良く第2のスペクトルS2(k)の高域成分を推定することが可能となる。さらに、複数のサブバンドを予め決めておきそれぞれのサブバンド毎にフィルタの特性を表す係数とスペクトルの概形を符号化する構成になっているために、スペクトルのエネルギーの不連続が発生しなくなり品質を改善することが可能となる。
さらに本発明のスペクトル符号化法の第3の態様は、前記構成において、フィルタが
Figure 0005226091
と表され、当該フィルタのゼロ入力応答を用いて推定を行う構成よりなる。
この構成によれば、S2(k)の推定値で生じる調波構造の崩れを回避することができ、品質が改善されるという効果が得られる。
さらに本発明のスペクトル符号化法の第4の態様は、前記構成において、M=0、β0=1とした構成よりなる。
この構成によれば、フィルタの特性はピッチ係数Tのみで決定されることになるため、低ビットレートでスペクトルの推定を行うことができるという効果が得られる。
さらに本発明のスペクトル符号化法の第5の態様は、前記構成において、ピッチ係数Tによって定まるサブバンド毎にスペクトルの概形を決定する構成よりなる。
この構成によれば、サブバンドの帯域幅が適切に定まるためスペクトルのエネルギーの不連続が発生しなくなり品質を改善することが可能となる。
さらに本発明のスペクトル符号化法の第6の態様は、前記構成において、第1の信号は下位レイヤで符号化された後に復号化されて得られた信号またはこの信号をアップサンプリングした信号であり、第2の信号は入力信号である構成よりなる。
この構成によれば、複数レイヤの符号化部より構成される階層符号化に本発明を適用することができ、低ビットレートで高品質に入力信号を符号化できるという効果が得られる。
本発明のスペクトル復号化法の第1の態様は、フィルタの特性を表す係数を復号し、第1の信号を周波数変換して第1のスペクトルを求め、0≦k<FLの帯域の第1のスペクトルを内部状態として持つ当該フィルタを用いてFL≦k<FHの帯域の第2のスペクトルの推定値を生成するスペクトル復号化方法において、フィルタの特性を表す係数に基づいて決定される第2のスペクトルのスペクトル概形を併せて復号する構成よりなる。
この構成によれば、第1のスペクトルS1(k)を基に第2のスペクトルS2(k)の高域成分をフィルタによって推定して得られた符号化コードを復号することができるため、精度の良い第2のスペクトルS2(k)の高域成分の推定値を復号できるという効果が得られる。さらに、フィルタの特性を表す係数に基づいて符号化したスペクトル概形を復号することができるため、スペクトルのエネルギーの不連続が発生しなくなり高品質な復号信号を生成することが可能となる。
さらに本発明のスペクトル復号化法の第2の態様は、第2のスペクトルを複数のサブバンドに分割し、それぞれのサブバンド毎にフィルタの特性を表す係数とスペクトルの概形を復号する構成よりなる。
この構成によれば、第1のスペクトルS1(k)を基に第2のスペクトルS2(k)の高域成分をフィルタによって推定して得られた符号化コードを復号することができるため、精度の良い第2のスペクトルS2(k)の高域成分の推定値を復号できるという効果が得られる。さらに、複数のサブバンドを予め決めておきそれぞれのサブバンド毎に符号化されたフィルタの特性を表す係数とスペクトルの概形を復号することができるため、スペクトルのエネルギーの不連続が発生しなくなり高品質な復号信号を生成することが可能となる。
さらに本発明のスペクトル復号化法の第3の態様は、前記構成において、フィルタが
Figure 0005226091
と表され、当該フィルタのゼロ入力応答を用いて推定値を生成する構成よりなる。
この構成によれば、S2(k)の推定値で生じる調波構造の崩れを回避する方法にて得られた符号化コードを復号することができるため、品質が改善されたスペクトルの推定値を復号できるという効果が得られる。
さらに本発明のスペクトル復号化法の第4の態様は、前記構成において、M=0、β0=1とした構成よりなる。
この構成によれば、ピッチ係数Tのみで特性が規定されるフィルタに基づきスペクトルの推定を行い得られた符号化コードを復号することができるため、低ビットレートでスペクトルの推定値を復号できるという効果が得られる。
さらに本発明のスペクトル復号化法の第5の態様は、ピッチ係数Tによって定まるサブバンド毎にスペクトルの概形を復号する構成よりなる。
この構成によれば、適切な帯域幅のサブバンド毎に算出されたスペクトル概形を復号することができるため、スペクトルのエネルギーの不連続が発生しなくなり品質を改善することが可能となる。
さらに本発明のスペクトル復号化法の第6の態様は、前記構成において、第1の信号は下位レイヤで復号化された信号またはこの信号をアップサンプリングした信号から生成する構成よりなる。
この構成によれば、複数レイヤの符号化部より構成される階層符号化により得られた符号化コードを復号することができるようになるため、低ビットレートで高品質な復号信号を得ることができるという効果が得られる。
本発明の音響信号送信装置は、楽音や音声などの音響信号を電気的信号に変換する音響入力装置と、音響入力手段から出力される信号をディジタル信号に変換するA/D変換装置と、このA/D変換装置から出力されるディジタル信号の符号化を行う上記各実施の形態に記載の内の1つのスペクトル符号化方式を含む方法にて符号化を行う符号化装置と、この音響符号化装置から出力される符号化コードに対して変調処理等を行うRF変調装置と、このRF変調装置から出力された信号を電波に変換して送信する送信アンテナを具備する構成を採る。
この構成によれば、少ないビット数で効率よく符号化する符号化装置を提供することができる。
本発明の音響信号復号化装置は、受信電波を受信する受信アンテナと、前記受信アンテナで受信した信号の復調処理を行うRF復調装置と、前記RF復調装置によって得られた情報の復号化処理を上記各実施の形態に記載の内の1つのスペクトル復号化方法を含む方法にて復号化を行う復号化装置と、前記音響復号化装置によって復号化されたディジタル音響信号をD/A変換するD/A変換装置と、前記D/A変換装置から出力される電気的信号を音響信号に変換する音響出力装置を具備する構成を採る。
この構成によれば、少ないビット数で効率よく符号化された音響信号を復号することができるので、良好な階層信号を出力することができる。
本発明の通信端末装置は、上記の音響信号送信装置あるいは上記の音響信号受信装置の少なくとも一方を具備する構成を採る。本発明の基地局装置は、上記の音響信号送信装置あるいは上記の音響信号受信装置の少なくとも一方を具備する構成を採る。
この構成によれば、少ないビット数で効率よく音響信号を符号化する通信端末装置や基地局装置を提供することができる。また、この構成によれば、少ないビット数で効率よく符号化された音響信号を復号することができる通信端末装置や基地局装置を提供することができる。
本明細書は、2003年10月23日出願の特願2003−363080に基づく。この内容はすべてここに含めておく。
本発明は、低ビットレートで高品質にスペクトルを符号化することができ、送信装置又は受信装置等に有用である。さらに本発明を階層符号化に適用することにより、音声信号やオーディオ信号を低ビットレートで高品質に符号化することができ、移動体通信システムにおける移動局装置又は基地局装置等に有用である。

Claims (10)

  1. 周波数kが0≦k<FLの帯域の第1のスペクトルを取得する第1の取得手段と、
    周波数kが0≦k<FHの帯域の第2のスペクトルを取得する第2の取得手段と、
    式(1)を用いて、周波数kがFL≦k<FHの帯域の第2のスペクトルの形状を推定し、推定スペクトルを生成する推定手段と、
    前記推定スペクトルの形状と、周波数kがFL≦k<FHの帯域の前記第2のスペクトルの形状との誤差を最小にするピッチ係数を符号化する符号化手段と、
    を具備するスペクトル符号化装置。
    Figure 0005226091
  2. 周波数kがFL≦k<FHの帯域の前記第2のスペクトルを複数のサブバンドに分割する分割手段、を更に具備し、
    前記符号化手段は、前記サブバンド毎に前記ピッチ係数を符号化する、
    請求項1に記載のスペクトル符号化装置。
  3. スペクトル包絡を用いて平滑化を行った前記第1のスペクトルを用いて前記ピッチ係数を求める、
    請求項1記載のスペクトル符号化装置。
  4. 符号化情報からピッチ係数を復号する復号化手段と、
    周波数kが0≦k<FLの帯域のスペクトルを取得する取得手段と、
    式(2)を用いて、周波数kがFL≦k<FHの帯域の推定スペクトルを生成する生成手段と、
    を具備するスペクトル復号化装置。
    Figure 0005226091
  5. 前記推定スペクトルは、複数のサブバンドに分割され、
    前記復号化手段は、
    前記サブバンド毎に前記ピッチ係数を復号する、
    請求項4に記載のスペクトル復号化装置。
  6. 前記生成手段は、
    スペクトル包絡を用いて平滑化を行った前記第1のスペクトルと前記ピッチ係数とを用いて前記推定スペクトルを生成する、
    請求項4記載のスペクトル復号化装置。
  7. 周波数kが0≦k<FLの帯域の第1のスペクトルを取得し、
    周波数kが0≦k<FHの帯域の第2のスペクトルを取得し、
    式(3)を用いて、周波数kがFL≦k<FHの帯域の前記第2のスペクトルの形状を推定し、推定スペクトルを生成し、
    前記推定スペクトルの形状と、周波数kがFL≦k<FHの帯域の前記第2のスペクトルの形状との誤差を最小にするピッチ係数を符号化する、
    スペクトル符号化方法。
    Figure 0005226091
  8. 前記第2のスペクトルは、複数のサブバンドに分割され、
    前記ピッチ係数は、前記サブバンド毎に符号化される、
    請求項7に記載のスペクトル符号化方法。
  9. 符号化情報からピッチ係数を復号し、
    第1の信号を周波数変換し、周波数kが0≦k<FLの帯域の第1のスペクトルを取得し、
    式(4)を用いて、周波数kがFL≦k<FHの帯域の推定スペクトルを生成する、
    スペクトル復号化方法。
    Figure 0005226091
  10. さらに、周波数kがFL≦k<FHの帯域の前記推定スペクトルを複数のサブバンドに分割し、
    前記サブバンド毎に前記ピッチ係数を復号する、
    請求項9に記載のスペクトル復号化方法。
JP2011011995A 2003-10-23 2011-01-24 スペクトル符号化装置、スペクトル復号化装置、およびこれらの方法 Active JP5226091B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011011995A JP5226091B2 (ja) 2003-10-23 2011-01-24 スペクトル符号化装置、スペクトル復号化装置、およびこれらの方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2003363080 2003-10-23
JP2003363080 2003-10-23
JP2011011995A JP5226091B2 (ja) 2003-10-23 2011-01-24 スペクトル符号化装置、スペクトル復号化装置、およびこれらの方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2005515052A Division JP4822843B2 (ja) 2003-10-23 2004-10-25 スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法

Publications (2)

Publication Number Publication Date
JP2011100158A JP2011100158A (ja) 2011-05-19
JP5226091B2 true JP5226091B2 (ja) 2013-07-03

Family

ID=34510022

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2005515052A Active JP4822843B2 (ja) 2003-10-23 2004-10-25 スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP2011011999A Active JP5226092B2 (ja) 2003-10-23 2011-01-24 スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP2011011995A Active JP5226091B2 (ja) 2003-10-23 2011-01-24 スペクトル符号化装置、スペクトル復号化装置、およびこれらの方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2005515052A Active JP4822843B2 (ja) 2003-10-23 2004-10-25 スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
JP2011011999A Active JP5226092B2 (ja) 2003-10-23 2011-01-24 スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法

Country Status (9)

Country Link
US (4) US7949057B2 (ja)
EP (3) EP2221807B1 (ja)
JP (3) JP4822843B2 (ja)
KR (1) KR20060090995A (ja)
CN (3) CN101556800B (ja)
AT (1) ATE471557T1 (ja)
BR (1) BRPI0415464B1 (ja)
DE (1) DE602004027750D1 (ja)
WO (1) WO2005040749A1 (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP4407538B2 (ja) * 2005-03-03 2010-02-03 ヤマハ株式会社 マイクロフォンアレー用信号処理装置およびマイクロフォンアレーシステム
KR100933548B1 (ko) * 2005-04-15 2009-12-23 돌비 스웨덴 에이비 비상관 신호의 시간적 엔벨로프 정형화
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US20100153099A1 (en) * 2005-09-30 2010-06-17 Matsushita Electric Industrial Co., Ltd. Speech encoding apparatus and speech encoding method
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
CN101652807B (zh) * 2007-02-01 2012-09-26 缪斯亚米有限公司 音乐转录的方法、系统及装置
JP5294713B2 (ja) * 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
WO2008108083A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 音声符号化装置および音声符号化方法
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
RU2010125221A (ru) * 2007-11-21 2011-12-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR) Способ и устройство для обработки сигнала
US8423371B2 (en) 2007-12-21 2013-04-16 Panasonic Corporation Audio encoder, decoder, and encoding method thereof
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
US9159325B2 (en) * 2007-12-31 2015-10-13 Adobe Systems Incorporated Pitch shifting frequencies
RU2483367C2 (ru) 2008-03-14 2013-05-27 Панасоник Корпорэйшн Устройство кодирования, устройство декодирования и способ для их работы
JP5010743B2 (ja) 2008-07-11 2012-08-29 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
KR101589942B1 (ko) 2009-01-16 2016-01-29 돌비 인터네셔널 에이비 외적 향상 고조파 전치
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102131081A (zh) * 2010-01-13 2011-07-20 华为技术有限公司 混合维度编解码方法和装置
CA2792368C (en) 2010-03-09 2016-04-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch
MY154204A (en) 2010-03-09 2015-05-15 Fraunhofer Ges Forschung Apparatus and method for processing an imput audio signal using cascaded filterbanks
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
KR20240023667A (ko) * 2010-07-19 2024-02-22 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6010539B2 (ja) 2011-09-09 2016-10-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法および復号方法
CN103035248B (zh) * 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
USRE48258E1 (en) 2011-11-11 2020-10-13 Dolby International Ab Upsampling using oversampled SBR
BR112015029574B1 (pt) * 2013-06-11 2021-12-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método de decodificação de sinal de áudio.
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program
RU2667627C1 (ru) 2013-12-27 2018-09-21 Сони Корпорейшн Устройство и способ декодирования и программа
US10013975B2 (en) * 2014-02-27 2018-07-03 Qualcomm Incorporated Systems and methods for speaker dictionary based speech modeling
AU2015247503B2 (en) * 2014-04-17 2018-09-27 Audimax, Llc Systems, methods and devices for electronic communications having decreased information loss
JP6517924B2 (ja) * 2015-04-13 2019-05-22 日本電信電話株式会社 線形予測符号化装置、方法、プログラム及び記録媒体
TWI568306B (zh) * 2015-10-15 2017-01-21 國立交通大學 裝置配對連線之方法
KR102299193B1 (ko) 2016-04-12 2021-09-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 상부 주파수 대역에서 검출된 피크 스펙트럼 영역을 고려하여 오디오 신호를 부호화하는 오디오 인코더, 오디오 신호를 부호화하는 방법, 및 컴퓨터 프로그램

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685607A (ja) * 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JPH06350401A (ja) * 1993-06-03 1994-12-22 Nec Corp ディジタルフィルタ
US5893068A (en) * 1993-06-03 1999-04-06 Nec Corporation Method of expanding a frequency range of a digital audio signal without increasing a sampling rate
US5673364A (en) * 1993-12-01 1997-09-30 The Dsp Group Ltd. System and method for compression and decompression of audio signals
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP3301473B2 (ja) * 1995-09-27 2002-07-15 日本電信電話株式会社 広帯域音声信号復元方法
JP3243174B2 (ja) * 1996-03-21 2002-01-07 株式会社日立国際電気 狭帯域音声信号の周波数帯域拡張回路
US6345246B1 (en) * 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
CN1144179C (zh) * 1997-07-11 2004-03-31 索尼株式会社 声音信号解码方法和装置、声音信号编码方法和装置
CA2249792C (en) * 1997-10-03 2009-04-07 Matsushita Electric Industrial Co. Ltd. Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
JP3765171B2 (ja) * 1997-10-07 2006-04-12 ヤマハ株式会社 音声符号化復号方式
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
DE1298643T1 (de) * 2000-06-14 2003-11-27 Kenwood Corp Frequenzinterpolationseinrichtung und frequenzinterpolationsverfahren
JP3576936B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
JP3881836B2 (ja) * 2000-10-24 2007-02-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
KR100865860B1 (ko) * 2000-11-09 2008-10-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 보다 높은 지각의 품질을 위한 전화 음성의 광대역 확장
JP3887531B2 (ja) * 2000-12-07 2007-02-28 株式会社ケンウッド 信号補間装置、信号補間方法及び記録媒体
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
EP1364364B1 (en) * 2001-03-02 2009-07-22 Panasonic Corporation Audio coder and audio decoder
JP4008244B2 (ja) 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
JP4106624B2 (ja) 2001-06-29 2008-06-25 株式会社ケンウッド 信号の周波数成分を補間するための装置および方法
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
AU2002318813B2 (en) * 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
EP1292036B1 (en) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Digital signal decoding methods and apparatuses
WO2003019533A1 (fr) 2001-08-24 2003-03-06 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation adaptive de composantes de frequence d'un signal
KR100935961B1 (ko) 2001-11-14 2010-01-08 파나소닉 주식회사 부호화 장치 및 복호화 장치
JP3751001B2 (ja) * 2002-03-06 2006-03-01 株式会社東芝 オーディオ信号再生方法および再生装置
US7257154B2 (en) * 2002-07-22 2007-08-14 Broadcom Corporation Multiple high-speed bit stream interface circuit
US7515629B2 (en) * 2002-07-22 2009-04-07 Broadcom Corporation Conditioning circuit that spectrally shapes a serviced bit stream

Also Published As

Publication number Publication date
KR20060090995A (ko) 2006-08-17
BRPI0415464A (pt) 2006-12-19
CN101556800B (zh) 2012-05-23
US20110194635A1 (en) 2011-08-11
US20110196674A1 (en) 2011-08-11
US20110196686A1 (en) 2011-08-11
BRPI0415464A8 (pt) 2017-06-06
JPWO2005040749A1 (ja) 2007-04-19
CN101556800A (zh) 2009-10-14
JP4822843B2 (ja) 2011-11-24
CN101556801A (zh) 2009-10-14
JP2011100159A (ja) 2011-05-19
EP2221807B1 (en) 2013-03-20
EP2221808B1 (en) 2012-07-11
BRPI0415464B1 (pt) 2019-04-24
CN101556801B (zh) 2012-06-20
EP1677088B1 (en) 2010-06-16
CN1871501A (zh) 2006-11-29
US8275061B2 (en) 2012-09-25
EP1677088A1 (en) 2006-07-05
US8315322B2 (en) 2012-11-20
US8208570B2 (en) 2012-06-26
ATE471557T1 (de) 2010-07-15
EP2221807A1 (en) 2010-08-25
DE602004027750D1 (de) 2010-07-29
JP2011100158A (ja) 2011-05-19
JP5226092B2 (ja) 2013-07-03
EP2221808A1 (en) 2010-08-25
US20070071116A1 (en) 2007-03-29
CN100507485C (zh) 2009-07-01
US7949057B2 (en) 2011-05-24
WO2005040749A1 (ja) 2005-05-06
EP1677088A4 (en) 2008-08-13

Similar Documents

Publication Publication Date Title
JP5226091B2 (ja) スペクトル符号化装置、スペクトル復号化装置、およびこれらの方法
JP5013863B2 (ja) 符号化装置、復号化装置、通信端末装置、基地局装置、符号化方法及び復号化方法
US8417515B2 (en) Encoding device, decoding device, and method thereof
JP5171922B2 (ja) 符号化装置、復号化装置、およびこれらの方法
US8738372B2 (en) Spectrum coding apparatus and decoding apparatus that respectively encodes and decodes a spectrum including a first band and a second band
US7752052B2 (en) Scalable coder and decoder performing amplitude flattening for error spectrum estimation
WO2006049204A1 (ja) 符号化装置、復号化装置、符号化方法及び復号化方法
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
WO2011058752A1 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130313

R150 Certificate of patent or registration of utility model

Ref document number: 5226091

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160322

Year of fee payment: 3