JPWO2006028010A1 - スケーラブル符号化装置およびスケーラブル符号化方法 - Google Patents

スケーラブル符号化装置およびスケーラブル符号化方法 Download PDF

Info

Publication number
JPWO2006028010A1
JPWO2006028010A1 JP2006535719A JP2006535719A JPWO2006028010A1 JP WO2006028010 A1 JPWO2006028010 A1 JP WO2006028010A1 JP 2006535719 A JP2006535719 A JP 2006535719A JP 2006535719 A JP2006535719 A JP 2006535719A JP WO2006028010 A1 JPWO2006028010 A1 JP WO2006028010A1
Authority
JP
Japan
Prior art keywords
lsp
order
narrowband
autocorrelation coefficient
wideband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006535719A
Other languages
English (en)
Other versions
JP4937753B2 (ja
Inventor
江原 宏幸
宏幸 江原
利幸 森井
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006535719A priority Critical patent/JP4937753B2/ja
Publication of JPWO2006028010A1 publication Critical patent/JPWO2006028010A1/ja
Application granted granted Critical
Publication of JP4937753B2 publication Critical patent/JP4937753B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

狭帯域LSPから広帯域LSPへの変換性能を高め、高性能な帯域スケーラブルLSP符号化を実現することができるスケーラブル符号化装置。この装置では、自己相関係数変換部(301)が、Mn次の狭帯域LSPをMn次の自己相関係数に変換し、逆ラグ窓部(302)が、自己相関係数に掛けられているラグ窓と逆特性の窓(逆ラグ窓)を掛け、外挿部(303)が、逆ラグ窓を掛けられた自己相関係数に対して外挿処理を行って自己相関係数の次数を(Mn+Mi)次に拡張し、アップサンプル部(304)が、(Mn+Mi)次の自己相関係数に対して時間領域でのアップサンプル処理と等価な自己相関領域でのアップサンプル処理を行ってMw次の自己相関係数を求め、ラグ窓部(305)が、Mw次の自己相関係数に対してラグ窓を掛け、LSP変換部(306)が、ラグ窓を掛けられた自己相関係数をLSPに変換する。

Description

本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等において、音声通信を行う際に用いられるスケーラブル符号化装置およびスケーラブル符号化方法に関する。
VoIP(Voice over IP)等のようにパケットを用いた音声通信においては、音声データの符号化にフレーム消失耐性のある符号化方式が望まれている。インターネット通信に代表されるパケット通信においては、輻輳等により伝送路上でパケットが破棄されることがあるからである。
フレーム消失耐性を高める方法の一つとして、伝送情報の一部が消失しても他の一部から復号処理を行うようにすることでフレーム消失の影響をできるだけ少なくするアプローチがある(例えば、特許文献1参照)。特許文献1には、スケーラブル符号化を用いてコアレイヤの符号化情報と拡張レイヤの符号化情報とを別々のパケットに詰めて伝送する方法が開示されている。また、パケット通信のアプリケーションとして、太い回線(ブロードバンド回線)と細い回線(伝送レートの低い回線)とが混在するネットワークを用いたマルチキャスト通信(一対多の通信)が挙げられる。このような不均一なネットワーク上で多地点間通信を行う場合にも、それぞれのネットワークに対応して符号化情報が階層化されていればネットワークごとに異なる符号化情報を送る必要がないため、スケーラブル符号化が有効である。
例えば、音声信号の高能率な符号化を可能とするCELP方式をベースとした、信号帯域幅に(周波数軸方向に)スケーラビリティを有する帯域スケーラブル符号化技術として、特許文献2に開示されている技術がある。特許文献2では、音声信号のスペクトル包絡情報をLSP(線スペクトル対)パラメータで表現するCELP方式の例が示されている。ここでは、狭帯域音声用の符号化部(コアレイヤ)で得られた量子化LSPパラメータ(狭帯域符号化LSP)を以下の式(1)を用いて広帯域音声符号化用のLSPパラメータに変換し、変換したLSPパラメータを広帯域音声用の符号化部(拡張レイヤ)で用いることにより、帯域スケーラブルなLSP符号化方法を実現している。
fw(i)=0.5×fn(i)[ただし、i=0,…,P−1]
=0.0 [ただし、i=P,…,P−1]…(1)
なお、fw(i)は広帯域信号におけるi次のLSPパラメータ、fn(i)は狭帯域信号におけるi次のLSPパラメータ、Pは狭帯域信号のLSP分析次数、Pは広帯域信号のLSP分析次数をそれぞれ示している。
特許文献2においては、狭帯域信号としてサンプリング周波数が8kHz、広帯域信号としてサンプリング周波数が16kHz、広帯域LSPの分析次数が狭帯域LSPの分析次数の2倍である場合を例にとって説明しているため、狭帯域LSPから広帯域LSPへの変換が式(1)で表されるような単純な式で行われ得る。ところが、広帯域LSPの低次側のP次のLSPパラメータの存在する位置は、高次側の(P−P)次を含めた広帯域信号全体に対して決定されるため、その位置は必ずしも狭帯域LSPのP次のLSPパラメータに対応するわけではない。このため、式(1)で表される変換では高い変換効率(狭帯域LSPから広帯域LSPを予測すると見た場合、予測精度と言う事も可能)は得られない。よって、式(1)に基づいて設計された広帯域LSP符号化器には、符号化性能を改善する余地が残されている。
そこで、例えば、非特許文献1には、式(1)のi次の狭帯域LSPパラメータに乗じる変換係数を0.5とする代わりに、以下の式(2)に示すように、変換係数の最適化アルゴリズムを用いて次数毎に最適な変換係数β(i)を求める方法が開示されている。
fw_n(i)=α(i)×L(i)+β(i)×fn_n(i)…(2)
ただし、fw_n(i)は第nフレームにおけるi次の広帯域量子化LSPパラメータ、α(i)×L(i)は予測誤差信号を量子化したベクトルのi次の要素(α(i)はi次の重み係数)、L(i)はLSP予測残差ベクトル、β(i)は予測広帯域LSPへの重み係数、fn_n(i)は第nフレームにおける狭帯域LSPパラメータである。このような変換係数の最適化により、特許文献2と同じ構成のLSP符号化器でありながら、より高い符号化性能を実現している。
ここで、例えば、非特許文献2によれば、LSPパラメータの分析次数は、周波数範囲が3〜4kHzの狭帯域の音声信号に対しては8〜10次程度が適当であり、また、周波数範囲が5〜8kHzの広帯域の音声信号に対しては12〜16次程度が適当であるとされている。
特開2003−241799号公報 特許第3134817号公報 K.Koishida et al,"Enhancing MPEG−4 CELP by jointly optimized inter/intra−frame LSP predictors,"IEEE Speech Coding Workshop 2000,Proceeding,pp.90−92,2000 斎藤収三・中田和男共著、「音声情報処理の基礎」、オーム社、1981年11月30日、p、91
しかしながら、広帯域LSPの低次側のP次のLSPパラメータの位置は広帯域信号全体に対して決定されるため、例えば、非特許文献2のように、狭帯域LSPの分析次数を10次、広帯域LSPの分析次数を16次とした場合、広帯域LSP16次のうち低次側(狭帯域LSPパラメータの1〜10次が存在する帯域に相当)に存在するLSPパラメータの個数は8個以下であることが多くなる。よって、式(2)を用いた変換では、広帯域LSPパラメータ(16次)の低次側において狭帯域LSPパラメータ(10次)との対応関が1対1でなくなってしまう。つまり、広帯域LSPの10次の成分が4kHzを超える帯域に存在する場合においても、この広帯域LSPの10次の成分を、4kHz以下の帯域に存在する狭帯域LSPの10次の成分と対応付けることとなってしまい、その結果、広帯域LSPと狭帯域LSPとの対応付けが不適切となる。よって、式(2)に基づいて設計された広帯域LSP符号化器においても、依然として符号化性能を改善する余地が残されている。
本発明の目的は、狭帯域LSPから広帯域LSPへの変換性能(狭帯域LSPから広帯域LSPを予測する際の予測精度)を高め、高性能な帯域スケーラブルLSP符号化を実現することができるスケーラブル符号化装置およびスケーラブル符号化方法を提供することである。
本発明のスケーラブル符号化装置は、狭帯域LSPパラメータから広帯域LSPパラメータを得るスケーラブル符号化装置であって、狭帯域LSPパラメータを自己相関係数に変換する第1変換手段と、前記自己相関係数をアップサンプリングするアップサンプリング手段と、アップサンプリングされた前記自己相関係数をLSPパラメータに変換する第2変換手段と、前記LSPパラメータの周波数帯域を広帯域に変換して広帯域LSPパラメータを得る第3変換手段と、を具備する構成を採る。
本発明によれば、狭帯域LSPから広帯域LSPへの変換性能を高め、高性能な帯域スケーラブルLSP符号化を実現することができる。
本発明の一実施の形態に係るスケーラブル符号化装置の主要な構成を示すブロック図 上記実施の形態に係る広帯域LSP符号化部の主要な構成を示すブロック図 上記実施の形態に係る変換部の主要な構成を示すブロック図 上記実施の形態に係るスケーラブル符号化装置の動作フロー図 Mn次の自己相関係数を拡張して得られる(Mn+Mi)次の自己相関係数を示すグラフ 図5の各結果に対してアップサンプル処理を行なって得られる自己相関係数から求めたLPCを示すグラフ LSPのシミュレーション結果(Fs:8kHzの狭帯域音声信号を12次で分析したLSP) LSPのシミュレーション結果(狭帯域音声信号を12次で分析したLSPを図1に示すスケーラブル符号化装置によりFs:16kHzの18次のLSPに変換した場合) LSPのシミュレーション結果(広帯域音声信号を18次で分析したLSP)
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
図1は、本発明の一実施の形態に係るスケーラブル符号化装置の主要な構成を示すブロック図である。
本実施の形態に係るスケーラブル符号化装置は、ダウンサンプル部101、LSP分析部(狭帯域用)102、狭帯域LSP符号化部103、音源符号化部(狭帯域用)104、位相補正部105、LSP分析部(広帯域用)106、広帯域LSP符号化部107、音源符号化部(広帯域用)108、アップサンプル部109、加算器110、および多重化部111を備える。
ダウンサンプル部101は、入力音声信号に対しダウンサンプリング処理を行って狭帯域信号をLSP分析部(狭帯域用)102および音源符号化部(狭帯域用)104に出力する。なお、入力音声信号は、デジタル化された信号であり、必要に応じてHPFや背景雑音抑圧処理等の前処理が施されている。
LSP分析部(狭帯域用)102は、ダウンサンプル部101から入力された狭帯域信号に対してLSP(線スペクトル対)パラメータを算出し、狭帯域LSP符号化部103へ出力する。より具体的には、LSP分析部(狭帯域用)102は、狭帯域信号から自己相関係数を求め、この自己相関係数をLPC(線形予測係数)に変換した後、LPCをLSPに変換することによって狭帯域LSPパラメータを算出する(自己相関係数からLPC、LPCからLSPへの具体的な変換手順については、例えば、ITU−T勧告G.729(3.2.3節LP to LSP conversion)に開示されている)。この際、LSP分析部(狭帯域用)102は、自己相関係数の打ち切り誤差を軽減するために、自己相関係数にラグ窓と呼ばれる窓を掛ける(ラグ窓については、例えば、中溝高好、「現代制御シリーズ信号解析とシステム同定」、コロナ社、p.36、2.5.2章参照)。
狭帯域LSP符号化部103は、LSP分析部(狭帯域用)102から入力された狭帯域LSPパラメータを符号化して得られる狭帯域の量子化LSPパラメータを広帯域LSP符号化部107および音源符号化部(狭帯域用)104へ出力する。また、狭帯域LSP符号化部103は、符号化データを多重化部111へ出力する。
音源符号化部(狭帯域用)104は、狭帯域LSP符号化部103から入力された狭帯域の量子化LSPパラメータを線形予測係数に変換し、得られた線形予測係数を用いて線形予測合成フィルタを構築する。音源符号化部104は、この線形予測合成フィルタを用いて合成される合成信号と別途ダウンサンプル部101から入力された狭帯域入力信号との間の聴覚的重みづき誤差を求め、この聴覚的重みづき誤差を最小とする音源パラメータの符号化を行う。得られた符号化情報は多重化部111へ出力される。また、音源符号化部104は、狭帯域復号音声信号を生成してアップサンプル部109へ出力する。
なお、狭帯域LSP符号化部103または音源符号化部(狭帯域用)104については、LSPパラメータを利用するCELP型音声符号化装置で一般的に用いられている回路を適用でき、例えば、特許文献2またはITU−T勧告G.729等に記載されている技術を利用できる。
アップサンプル部109は、音源符号化部104で合成された狭帯域復号音声信号が入力され、その狭帯域復号音声信号にアップサンプル処理を施して加算器110へ出力する。
加算器110は、位相補正部105から位相補正後の入力信号、アップサンプル部109からアップサンプルされた狭帯域復号音声信号、がそれぞれ入力され、両信号の差分信号を求めて音源符号化部(広帯域用)108へ出力する。
位相補正部105は、ダウンサンプル部101およびアップサンプル部109で生じる位相のずれ(遅延)を補正するためのものである。位相補正部105は、ダウンサンプル処理およびアップサンプル処理が直線位相低域通過フィルタとサンプル間引き/零点挿入によって行なわれる場合は、直線位相低域通過フィルタによって生じる遅延の分だけ入力信号を遅延させる処理を行い、LSP分析部(広帯域用)106および加算器110に出力する。
LSP分析部(広帯域用)106は、位相補正部105から出力される広帯域信号に対してLSP分析を行い、得られた広帯域LSPパラメータを広帯域LSP符号化部107へ出力する。より具体的には、LSP分析部(広帯域用)106は、広帯域信号から自己相関係数を求め、この自己相関係数をLPCに変換した後、LPCをLSPに変換することによって広帯域LSPパラメータを算出する。この際、LSP分析部(広帯域用)106は、LSP分析部(狭帯域用)102同様、自己相関係数の打ち切り誤差を軽減するために、自己相関係数にラグ窓を掛ける。
広帯域LSP符号化部107は、図2に示すように、変換部201および量子化部202を備える。変換部201は、狭帯域LSP符号化部103から入力される狭帯域の量子化LSPを変換して予測広帯域LSPを求め、量子化部202へ出力する。変換部201の詳しい構成および動作については後述する。量子化部202は、LSP分析部(広帯域用)106から入力された広帯域LSPとLSP変換部から入力された予測広帯域LSPとの誤差信号を、ベクトル量子化などの手法を用いて符号化し、得られる広帯域の量子化LSPを音源符号化部(広帯域用)108へ出力するとともに、得られる符号情報を多重化部111へ出力する。
音源符号化部(広帯域用)108は、広帯域LSP符号化部107から入力された、量子化された広帯域LSPパラメータを線形予測係数に変換し、得られた線形予測係数を用いて線形予測合成フィルタを構築する。そして、この線形予測合成フィルタを用いて合成される合成信号と位相補正された入力信号との間の聴覚的重みづき誤差を求め、この聴覚的重みづき誤差を最小とする音源パラメータを決定する。より詳細には、音源符号化部108には、広帯域入力信号とアップサンプル後の狭帯域復号信号との誤差信号が別途加算器110より入力され、この誤差信号と音源符号化部108で生成される復号信号との間の誤差が求められ、この誤差に聴覚的重みづけが施されたものが最小となるように音源パラメータが決定される。求まった音源パラメータの符号情報は、多重化部111へ出力される。この音源符号化については、例えば、K.Koishida et al,“A 16−kbit/s bandwidth scalable audio coder based on the G.729 standard,”IEEE Proc.ICASSP 2000,pp.1149−1152,2000に開示されている。
多重化部111には、狭帯域LSP符号化部103からは狭帯域LSPの符号化情報が、音源符号化部(狭帯域用)104からは狭帯域信号の音源符号化情報が、広帯域LSP符号化部107からは広帯域LSPの符号化情報が、そして、音源符号化部(広帯域用)108からは広帯域信号の音源符号化情報が入力される。多重化部111は、これらの情報を多重化してビットストリームとして伝送路に送出する。なお、ビットストリームは、伝送路の仕様に応じて、伝送チャネルフレームにフレーム化されたり、パケット化されたりする。また、伝送路誤りに対する耐性を高めるために、誤り保護、誤り検出符号の付加、インタリーブ処理等を適用したりする。
図3は、上記の変換部201の主要な構成を示すブロック図である。変換部201は、は、自己相関係数変換部301、逆ラグ窓部302、外挿部303、アップサンプル部304、ラグ窓部305、LSP変換部306、乗算部307および変換係数テーブル308を備える。
自己相関係数変換部301は、Mn次の狭帯域LSPをMn次の自己相関係数に変換して逆ラグ窓部302へ出力する。より具体的には、自己相関係数変換部301は、狭帯域LSP符号化部103より入力される狭帯域の量子化LSPパラメータをLPC(線形予測係数)に変換した後、LPCを自己相関係数に変換する。
LSPからLPCへの変換については、例えば、P.Kabal and R.P.Ramachandran,“The Computation of Line Spectral Frequencies Using Chevyshev Polynomials,”IEEE Trans.on Acoustics,Speech,and Signal Processing,vol.ASSP−34,no.6,December 1986に開示されている(この文献におけるLSFは本実施の形態におけるLSPと同意である)。また、例えば、ITU−T勧告G.729(3.2.6節 LSP to LP conversion)にもLSPからLPCへの具体的な変換手順が開示されている。
また、LPCから自己相関係数への変換については、レビンソン・ダービン(Levinson−Durbin)のアルゴリズム(例えば、中溝高好、「現代制御シリーズ信号解析とシステム同定」、コロナ社、p.71、3.6.3章参照)を用いて行なう。具体的には式(3)に従って行う。
Figure 2006028010
逆ラグ窓部302は、入力された自己相関係数に対し、その自己相関係数に掛けられているラグ窓と逆特性の窓(逆ラグ窓)を掛ける。上記のように、LSP分析部(狭帯域用)102では、自己相関係数からLPCへの変換時に自己相関係数にラグ窓が掛けられるため、自己相関係数変換部301から逆ラグ窓部302へ入力される自己相関係数には未だラグ窓が掛かったままである。そこで、逆ラグ窓部302は、後述する外挿処理の精度を高めるために、入力された自己相関係数に対し逆ラグ窓を掛けて、LSP分析部(狭帯域用)102においてラグ窓を掛ける前の自己相関係数に戻して、外挿部303へ出力する。
狭帯域の符号化レイヤではMn次を超える次数の自己相関係数は符号化されないので、Mn次までの情報のみからMn次を超える次数の自己相関係数を求める必要がある。そこで、外挿部303は、逆ラグ窓部302から入力される自己相関係数に対して外挿処理を行って、自己相関係数の次数を拡張して、次数拡張後の自己相関係数をアップサンプル部304へ出力する。すなわち、外挿部303は、Mn次の自己相関係数を(Mn+Mi)次に拡張する。この外挿処理を行うのは、後述するアップサンプル処理において、Mn次より高次の自己相関係数が必要になるためである。また、後述するアップサンプル処理時の打ち切り誤差を低減するために、本実施の形態では、狭帯域LSPパラメータの分析次数を広帯域LSPパラメータの分析次数の1/2以上とする。すなわち、(Mn+Mi)次をMn次の2倍未満にする。外挿部303は、レビンソン・ダービンのアルゴリズム(式(3))においてMn次を超える部分での反射係数を0とすることで再帰的に(Mn+1)次〜(Mn+Mi)次の自己相関係数を求める。式(3)においてMn次を超える部分での反射係数を0とすると式(4)が得られる。
Figure 2006028010
式(4)は式(5)のように展開することができる。式(5)に示すように、反射係数を0として得られる自己相関係数Rm+1は、入力信号時間波形xt+m+1−i(i=1〜m)から線形予測によって得られる予測値
Figure 2006028010
と入力信号時間波形xとの相互相関であることが分かる。つまり、外挿部303では、線形予測を用いて自己相関係数の外挿処理を行なっていることになる。このような外挿処理を行なうことで、後述するアップサンプル処理により、安定したLPCに変換可能な自己相関係数を得ることができる。
Figure 2006028010
アップサンプル部304は、外挿部から入力される自己相関係数、すなわち、次数を(Mn+Mi)次に拡張された自己相関係数に対して、時間領域でのアップサンプル処理と等価な自己相関領域でのアップサンプル処理を行って、Mw次の自己相関係数を得る。このアップサンプル後の自己相関係数はラグ窓部305へ出力される。アップサンプル処理はsinc関数を畳み込む補間フィルタ(ポリフェーズフィルタ、FIRフィルタ等)を用いて行なう。以下、自己相関係数のアップサンプル処理の具体的手順について説明する。
離散化された信号x(nΔt)から連続信号u(t)をsinc関数を用いて補間する場合、式(6)のように表される。よって、u(t)のサンプリング周波数を2倍にアップサンプルする場合は、式(7)および式(8)に示すようになる。
Figure 2006028010
Figure 2006028010
Figure 2006028010
式(7)はアップサンプル後に偶数サンプルになる点を示しており、アップサンプル前のx(i)がそのままu(2i)となる。
また、式(8)はアップサンプル後に奇数サンプルになる点を示しており、x(i)にsinc関数を畳み込むことでu(2i+1)が求められる。この畳み込み処理は、x(i)の時間軸を反転したものとsinc関数との積和で表される。積和処理はx(i)の前後の点を用いて行なわれるので、積和に必要なデータ数を例えば2N+1とした場合、u(2i+1)の点を求めるにはx(i−N)〜x(i+N)が必要になる。よって、このアップサンプル処理においては、アップサンプル前のデータの時間長がアップサンプル後のデータの時間長より長いことが必要である。このため、本実施の形態では、広帯域信号に対する帯域幅あたりの分析次数を狭帯域信号に対する帯域幅あたりの分析次数より相対的に小さくしている。
また、アップサンプルされた自己相関関数R(j)は、x(i)をアップサンプルしたu(i)を用いて式(9)のように表される。
Figure 2006028010
式(9)に式(7)および式(8)を代入して整理すると、式(10)および式(11)が得られる。式(10)は偶数サンプルになる点を示し、式(11)は奇数サンプルになる点を示す。
Figure 2006028010
Figure 2006028010
ここで、式(10)および式(11)においてr(j)はアップサンプル前のx(i)の自己相関係数である。よって、式(10)および式(11)を用いてアップサンプル前の自己相関係数r(j)をR(j)にアップサンプルすれば、時間領域でのx(i)からu(i)へのアップサンプルを行なってから自己相関係数を求めたのと等価になることが分かる。このようにして、アップサンプル部304が、時間領域でのアップサンプル処理と等価な自己相関領域でのアップサンプル処理を行うことにより、アップサンプルによる誤差の発生を最小限に抑えることができる。
なお、アップサンプル処理は、式(6)〜式(11)で示した処理の他に、例えば、ITU−T勧告G.729(3.7節)に記載されている処理を用いて近似的に行うことも可能である。ITU−T勧告G.729では、ピッチ分析において分数精度ピッチ探索を行なう目的で相互相関係数のアップサンプルを行なっている。例えば、正規化相互相関係数を1/3精度で補間(3倍のアップサンプルに相当)している。
ラグ窓部305は、アップサンプル部304から入力されるアップサンプル後のMw次の自己相関係数に対して広帯域用(高サンプリングレート用)のラグ窓を掛けて、LSP変換部306へ出力する。
LSP変換部306は、ラグ窓を掛けられたMw次の自己相関係数(分析次数が狭帯域LSPパラメータの分析次数の2倍未満の自己相関係数)をLPCに変換した後、LPCをLSPに変換してMw次のLSPパラメータを求める。これにより、Mw次の狭帯域LSPが得られる。Mw次の狭帯域LSPは乗算部307へ出力される。
乗算部307は、LSP変換部306から入力されるMw次の狭帯域LSPに、変換係数テーブル308に格納されている変換係数を乗じて、Mw次の狭帯域LSPの周波数帯域を広帯域に変換する。この変換により、乗算部307は、Mw次の狭帯域LSPからMw次の予測広帯域LSPを求めて量子化部202へ出力する。なお、ここでは、変換係数は予め変換係数テーブル308に格納されているものとしたが、適応的に算出した変換係数を用いてもよい。例えば、直前のフレームにおける広帯域量子化LSPの狭帯域量子化LSPに対する比を変換係数として用いることができる。
以上のようにして、変換部201は、狭帯域LSP符号化部103より入力される狭帯域LSPを変換して予測広帯域LSPを求める。
次に、本実施の形態に係るスケーラブル符号化装置の動作フローについて図4を用いて説明する。図4においては、一例として、狭帯域音声信号(8kHzサンプリング、Fs:8kHz)に対しては12次のLSP分析を行い、広帯域音声信号(16kHzサンプリング、Fs:16kHz)に対しては18次のLSP分析を行う場合を示している。
まず、Fs:8kHz(狭帯域)において、狭帯域音声信号(401)を12次の自己相関係数(402)に変換し、12次の自己相関係数(402)を12次のLPC(403)に変換し、そして、12次のLPC(403)を12次のLSP(404)に変換する。
ここで、12次のLSP(404)は12次のLPC(403)に、12次のLPC(403)は12次の自己相関係数(402)に可逆的に変換する(戻す)ことが可能である。一方、12次の自己相関係数(402)を元の音声信号(401)に戻すことはできない。
そこで、本実施の形態に係るスケーラブル符号化装置では、時間領域でのアップサンプルと等価なアップサンプルを自己相関領域で行なうことで、Fs:16kHz(広帯域)の自己相関係数(405)を求める。つまり、Fs:8kHzの12次の自己相関係数(402)をアップサンプルして、Fs:16kHzの18次の自己相関係数(405)を求める。
そして、Fs:16kHz(広帯域)において、18次の自己相関係数(405)を18次のLPC(406)に変換し、18次のLPC(406)を18次のLSP(407)に変換する。この18次のLSP(407)が予測広帯域LSPとして使用される。
なお、Fs:16kHz(広帯域)においては、広帯域音声信号を元に自己相関係数を求めていることと擬似的に等価な処理を行なう必要があるため、自己相関領域でのアップサンプルを行うときには、上記のように、Fs:8kHzの自己相関係数の次数:12次を18次に拡張する自己相関係数の外挿処理を行う。
次に、逆ラグ窓部302による逆ラグ窓掛けおよび外挿部303による外挿処理の効果について図5および図6を用いて説明する。
図5は、Mn次の自己相関係数を拡張して得られる(Mn+Mi)次の自己相関係数を示すグラフである。図5において、501は、実際の狭帯域入力音声信号(低サンプリングレート)から求めた自己相関係数であり、これが理想的な自己相関係数である。これに対し、502は、本実施の形態のように、自己相関係数に逆ラグ窓を掛けてから外挿処理を行って求めた自己相関係数である。また、503は、自己相関係数に逆ラグ窓を掛けずにそのまま外挿処理を行って求めた自己相関係数である。なお、503では、スケールを合わせるために外挿処理を行った後に逆ラグ窓を掛けている。図5の結果より、外挿した部分(Mi=5の部分)において、503が502より歪んでいることが分かる。つまり、本実施の形態のように自己相関係数に逆ラグ窓を掛けてから外挿処理を行うことにより、自己相関係数の外挿処理の精度を高めることができる。なお、504は、本実施の形態のような外挿処理を行わずに、自己相関係数のMi次を零詰めで拡張して求めた自己相関係数である。
図6は、図5の各結果に対してアップサンプル処理を行なって得られる自己相関係数から求めたLPCスペクトル包絡を示すグラフである。601は、4kHz以上の帯域を含む広帯域信号から求めたLPCスペクトル包絡である。また、602は502に、603は503に、604は504にそれぞれ対応する。図6に示す結果より、Mi次を零詰めで拡張して求めた自己相関係数(504)に対してアップサンプル処理を行なって得られる自己相関係数からLPCを求めると、スペクトル特性が604に示すように発振状態に陥ってしまう。このように、Mi次(拡張部分)を零詰めで拡張すると、自己相関係数の適切な補間(アップサンプル)ができないために、自己相関係数をLPCに変換したときに発振してしまい、安定したフィルタが得られなくなってしまう。このようにLPCが発振状態に陥ると、LPCからLSPへの変換処理ができなくなってしまう。これに対して、本実施の形態のような外挿処理を行ってMi次を拡張した自己相関係数をアップサンプリングした自己相関係数からLPCを求めると、602および603のようになり、広帯域信号の4kHz未満の狭帯域成分が精度良く求められることが分かる。このように、本実施の形態によれば、自己相関係数のアップサンプルを精度良く行うことができる。つまり、本実施の形態によれば、式(4)および式(5)に示すような外挿処理を行うことにより、自己相関係数に対して適切なアップサンプル処理を行うことができ、安定したLPCを得ることができる。
次に、LSPのシミュレーション結果を図7〜図9に示す。図7はFs:8kHzの狭帯域音声信号を12次で分析したLSPを示し、図8は狭帯域音声信号を12次で分析したLSPを図1に示すスケーラブル符号化装置によりFs:16kHzの18次のLSPに変換した場合を示し、図9は広帯域音声信号を18次で分析したLSPを示す。図7〜図9において、実線は入力音声信号(広帯域)のスペクトル包絡を示し、波線はLSPを示す。このスペクトル包絡は、女声の「管理システム」の「かんり」の「ん」の部分である。なお、近年のCELP方式においては、狭帯域用では分析次数が10〜14次、広帯域用では16〜20次程度のCELP方式が使用されることが多いため、図7において狭帯域の分析次数を12次とし、図8および図9において広帯域の分析次数を18次としている。
まず、図7と図9とを比較する。図7と図9とにおいて同じ次数同士のLSPの対応関係に着目すると、例えば、図7におけるLSP(L1〜L12)のうち8次のLSP(L8)はスペクトルピーク701(左から2番目のスペクトルピーク)付近にあるが、図9における8次のLSP(L8)はスペクトルピーク702(左から3番目のスペクトルピーク)付近にある。つまり、図7と図9とでは、同じ次数のLSPが全く異なる位置にある。よって、狭帯域音声信号を12次で分析したLSPと広帯域音声信号を18次で分析したLSPとを直接対応付けることは適切でないと言える。
これに対し、図8と図9とを比較すると、同じ次数同士のLSPの対応が全体的に良くとれていることが分かる。特に、3.5kHz以下の低域において、対応関係が良くとれていることが分かる。このように、本実施の形態によれば、任意の次数の狭帯域(低サンプリング周波数)LSPパラメータを任意の次数の広帯域(高サンプリング周波数)LSPパラメータに精度良く変換することができる。
以上説明したようにして、本実施の形態に係るスケーラブル符号化装置は周波数軸方向にスケーラビリティを有する狭帯域および広帯域の量子化LSPパラメータを得る。
本発明に係るスケーラブル符号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。
なお、上記実施の形態では、アップサンプル部304がサンプリング周波数を2倍にするアップサンプル処理を行う場合を一例として説明した。しかし、本発明は、アップサンプル処理につき、サンプリング周波数を2倍にするものに限定されない。すなわち、サンプリング周波数をn倍(nは2以上の自然数)にするアップサンプル処理であればよい。また、サンプリング周波数をn倍にするアップサンプルの場合は、本発明では、狭帯域LSPパラメータの分析次数を広帯域LSPパラメータの分析次数の1/n以上、すなわち、(Mn+Mi)次をMn次のn倍未満にする。
また、上記実施の形態では、LSPパラメータを符号化する場合について説明したが、ISP(Immittance Spectrum Pairs)パラメータについても本発明は適用可能である。
また、上記実施の形態では、帯域スケーラブル符号化のレイヤが2つである場合、すなわち、狭帯域および広帯域の2つの周波数帯域からなる帯域スケーラブル符号化を例にとって説明したが、本発明は、3つ以上の周波数帯域(レイヤ)からなる帯域スケーラブル符号化または帯域スケーラブル復号化に対しても適用可能である。
また、一般にラグ窓掛けとは別にWhite−noise Correctionと呼ばれる処理(入力音声信号に微弱なノイズフロアを加算するのと等価な処理として、0次の自己相関係数に1よりわずかに大きい数(例えば1.0001)を乗じる処理または0次以外のすべての自己相関係数を1よりわずかに大きい数(例えば1.0001)で除する処理)が自己相関係数に対して行われる。本実施の形態では、White−noise Correctionについては記載していないが、ラグ窓掛けの処理にWhite−noise Correctionを含める(すなわち、ラグ窓の係数に対してWhite−noise Correctionを施したものを実際のラグ窓の係数として使用する)ことは一般的に行われていることである。よって、本発明においてもWhite−noise Correctionをラグ窓掛けの処理の中に含めてもよい。
また、上記実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてありえる。
本明細書は、2004年9月6日出願の特願2004−258924に基づくものである。この内容はすべてここに含めておく。
本発明に係るスケーラブル符号化装置およびスケーラブル符号化方法は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置の用途に適用できる。
本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等において、音声通信を行う際に用いられるスケーラブル符号化装置およびスケーラブル符号化方法に関する。
VoIP(Voice over IP)等のようにパケットを用いた音声通信においては、音声データの符号化にフレーム消失耐性のある符号化方式が望まれている。インターネット通信に代表されるパケット通信においては、輻輳等により伝送路上でパケットが破棄されることがあるからである。
フレーム消失耐性を高める方法の一つとして、伝送情報の一部が消失しても他の一部から復号処理を行うようにすることでフレーム消失の影響をできるだけ少なくするアプローチがある(例えば、特許文献1参照)。特許文献1には、スケーラブル符号化を用いてコアレイヤの符号化情報と拡張レイヤの符号化情報とを別々のパケットに詰めて伝送する方法が開示されている。また、パケット通信のアプリケーションとして、太い回線(ブロードバンド回線)と細い回線(伝送レートの低い回線)とが混在するネットワークを用いたマルチキャスト通信(一対多の通信)が挙げられる。このような不均一なネットワーク上で多地点間通信を行う場合にも、それぞれのネットワークに対応して符号化情報が階層化されていればネットワークごとに異なる符号化情報を送る必要がないため、スケーラブル符号化が有効である。
例えば、音声信号の高能率な符号化を可能とするCELP方式をベースとした、信号帯域幅に(周波数軸方向に)スケーラビリティを有する帯域スケーラブル符号化技術として、特許文献2に開示されている技術がある。特許文献2では、音声信号のスペクトル包絡情報をLSP(線スペクトル対)パラメータで表現するCELP方式の例が示されている。ここでは、狭帯域音声用の符号化部(コアレイヤ)で得られた量子化LSPパラメータ(狭帯域符号化LSP)を以下の式(1)を用いて広帯域音声符号化用のLSPパラメータに変換し、変換したLSPパラメータを広帯域音声用の符号化部(拡張レイヤ)で用いることにより、帯域スケーラブルなLSP符号化方法を実現している。
fw(i)=0.5×fn(i) [ただし、i=0,…,P−1]
=0.0 [ただし、i=P,…,P−1] …(1)
なお、fw(i)は広帯域信号におけるi次のLSPパラメータ、fn(i)は狭帯域信号におけるi次のLSPパラメータ、Pは狭帯域信号のLSP分析次数、Pは広帯域信号のLSP分析次数をそれぞれ示している。
特許文献2においては、狭帯域信号としてサンプリング周波数が8kHz、広帯域信号としてサンプリング周波数が16kHz、広帯域LSPの分析次数が狭帯域LSPの分析次数の2倍である場合を例にとって説明しているため、狭帯域LSPから広帯域LSPへの変換が式(1)で表されるような単純な式で行われ得る。ところが、広帯域LSPの低次側のP次のLSPパラメータの存在する位置は、高次側の(P−P)次を含めた広帯域信号全体に対して決定されるため、その位置は必ずしも狭帯域LSPのP次のLSPパラメータに対応するわけではない。このため、式(1)で表される変換では高い変換効率(狭帯域LSPから広帯域LSPを予測すると見た場合、予測精度と言う事も可能)は得られない。よって、式(1)に基づいて設計された広帯域LSP符号化器には、符号化性能を改善する余地が残されている。
そこで、例えば、非特許文献1には、式(1)のi次の狭帯域LSPパラメータに乗じる変換係数を0.5とする代わりに、以下の式(2)に示すように、変換係数の最適化アルゴリズムを用いて次数毎に最適な変換係数β(i)を求める方法が開示されている。
fw_n(i)=α(i)×L(i)+β(i)×fn_n(i) …(2)
ただし、fw_n(i)は第nフレームにおけるi次の広帯域量子化LSPパラメータ、α(i)×L(i)は予測誤差信号を量子化したベクトルのi次の要素(α(i)はi次の重み係数)、L(i)はLSP予測残差ベクトル、β(i)は予測広帯域LSPへの重み係数、fn_n(i)は第nフレームにおける狭帯域LSPパラメータである。このような変換係数の最適化により、特許文献2と同じ構成のLSP符号化器でありながら、より高い符号化性能を実現している。
ここで、例えば、非特許文献2によれば、LSPパラメータの分析次数は、周波数範囲が3〜4kHzの狭帯域の音声信号に対しては8〜10次程度が適当であり、また、周波数範囲が5〜8kHzの広帯域の音声信号に対しては12〜16次程度が適当であるとされている。
特開2003−241799号公報 特許第3134817号公報 K. Koishida et al, "Enhancing MPEG-4 CELP by jointly optimized inter/intra-frame LSP predictors," IEEE Speech Coding Workshop 2000, Proceeding, pp.90-92, 2000 斎藤収三・中田和男共著、「音声情報処理の基礎」、オーム社、1981年11月30日、p.91
しかしながら、広帯域LSPの低次側のP次のLSPパラメータの位置は広帯域信号全体に対して決定されるため、例えば、非特許文献2のように、狭帯域LSPの分析次数を10次、広帯域LSPの分析次数を16次とした場合、広帯域LSP16次のうち低次側(狭帯域LSPパラメータの1〜10次が存在する帯域に相当)に存在するLSPパラメータの個数は8個以下であることが多くなる。よって、式(2)を用いた変換では、広帯域LSPパラメータ(16次)の低次側において狭帯域LSPパラメータ(10次)との対応関が1対1でなくなってしまう。つまり、広帯域LSPの10次の成分が4kHzを超える帯域に存在する場合においても、この広帯域LSPの10次の成分を、4kHz以下の帯域に存在する狭帯域LSPの10次の成分と対応付けることとなってしまい、その結果、広帯域LSPと狭帯域LSPとの対応付けが不適切となる。よって、式(2)に基づいて設計された広帯域LSP符号化器においても、依然として符号化性能を改善する余地が残されている。
本発明の目的は、狭帯域LSPから広帯域LSPへの変換性能(狭帯域LSPから広帯域LSPを予測する際の予測精度)を高め、高性能な帯域スケーラブルLSP符号化を実現することができるスケーラブル符号化装置およびスケーラブル符号化方法を提供することである。
本発明のスケーラブル符号化装置は、狭帯域LSPパラメータから広帯域LSPパラメータを得るスケーラブル符号化装置であって、狭帯域LSPパラメータを自己相関係数に変換する第1変換手段と、前記自己相関係数をアップサンプリングするアップサンプリング手段と、アップサンプリングされた前記自己相関係数をLSPパラメータに変換する第
2変換手段と、前記LSPパラメータの周波数帯域を広帯域に変換して広帯域LSPパラメータを得る第3変換手段と、を具備する構成を採る。
本発明によれば、狭帯域LSPから広帯域LSPへの変換性能を高め、高性能な帯域スケーラブルLSP符号化を実現することができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
図1は、本発明の一実施の形態に係るスケーラブル符号化装置の主要な構成を示すブロック図である。
本実施の形態に係るスケーラブル符号化装置は、ダウンサンプル部101、LSP分析部(狭帯域用)102、狭帯域LSP符号化部103、音源符号化部(狭帯域用)104、位相補正部105、LSP分析部(広帯域用)106、広帯域LSP符号化部107、音源符号化部(広帯域用)108、アップサンプル部109、加算器110、および多重化部111を備える。
ダウンサンプル部101は、入力音声信号に対しダウンサンプリング処理を行って狭帯域信号をLSP分析部(狭帯域用)102および音源符号化部(狭帯域用)104に出力する。なお、入力音声信号は、デジタル化された信号であり、必要に応じてHPFや背景雑音抑圧処理等の前処理が施されている。
LSP分析部(狭帯域用)102は、ダウンサンプル部101から入力された狭帯域信号に対してLSP(線スペクトル対)パラメータを算出し、狭帯域LSP符号化部103へ出力する。より具体的には、LSP分析部(狭帯域用)102は、狭帯域信号から自己相関係数を求め、この自己相関係数をLPC(線形予測係数)に変換した後、LPCをLSPに変換することによって狭帯域LSPパラメータを算出する(自己相関係数からLPC、LPCからLSPへの具体的な変換手順については、例えば、ITU−T勧告G.729(3.2.3節LP to LSP conversion)に開示されている)。この際、LSP分析部(狭帯域用)102は、自己相関係数の打ち切り誤差を軽減するために、自己相関係数にラグ窓と呼ばれる窓を掛ける(ラグ窓については、例えば、中溝高好、「現代制御シリーズ
信号解析とシステム同定」、コロナ社、p.36、2.5.2章参照)。
狭帯域LSP符号化部103は、LSP分析部(狭帯域用)102から入力された狭帯域LSPパラメータを符号化して得られる狭帯域の量子化LSPパラメータを広帯域LSP符号化部107および音源符号化部(狭帯域用)104へ出力する。また、狭帯域LSP符号化部103は、符号化データを多重化部111へ出力する。
音源符号化部(狭帯域用)104は、狭帯域LSP符号化部103から入力された狭帯域の量子化LSPパラメータを線形予測係数に変換し、得られた線形予測係数を用いて線形予測合成フィルタを構築する。音源符号化部104は、この線形予測合成フィルタを用いて合成される合成信号と別途ダウンサンプル部101から入力された狭帯域入力信号との間の聴覚的重みづき誤差を求め、この聴覚的重みづき誤差を最小とする音源パラメータの符号化を行う。得られた符号化情報は多重化部111へ出力される。また、音源符号化部104は、狭帯域復号音声信号を生成してアップサンプル部109へ出力する。
なお、狭帯域LSP符号化部103または音源符号化部(狭帯域用)104については、LSPパラメータを利用するCELP型音声符号化装置で一般的に用いられている回路を適用でき、例えば、特許文献2またはITU−T勧告G.729等に記載されている技術を利用できる。
アップサンプル部109は、音源符号化部104で合成された狭帯域復号音声信号が入力され、その狭帯域復号音声信号にアップサンプル処理を施して加算器110へ出力する。
加算器110は、位相補正部105から位相補正後の入力信号、アップサンプル部109からアップサンプルされた狭帯域復号音声信号、がそれぞれ入力され、両信号の差分信号を求めて音源符号化部(広帯域用)108へ出力する。
位相補正部105は、ダウンサンプル部101およびアップサンプル部109で生じる位相のずれ(遅延)を補正するためのものである。位相補正部105は、ダウンサンプル処理およびアップサンプル処理が直線位相低域通過フィルタとサンプル間引き/零点挿入によって行なわれる場合は、直線位相低域通過フィルタによって生じる遅延の分だけ入力信号を遅延させる処理を行い、LSP分析部(広帯域用)106および加算器110に出力する。
LSP分析部(広帯域用)106は、位相補正部105から出力される広帯域信号に対してLSP分析を行い、得られた広帯域LSPパラメータを広帯域LSP符号化部107へ出力する。より具体的には、LSP分析部(広帯域用)106は、広帯域信号から自己相関係数を求め、この自己相関係数をLPCに変換した後、LPCをLSPに変換することによって広帯域LSPパラメータを算出する。この際、LSP分析部(広帯域用)106は、LSP分析部(狭帯域用)102同様、自己相関係数の打ち切り誤差を軽減するために、自己相関係数にラグ窓を掛ける。
広帯域LSP符号化部107は、図2に示すように、変換部201および量子化部202を備える。変換部201は、狭帯域LSP符号化部103から入力される狭帯域の量子化LSPを変換して予測広帯域LSPを求め、量子化部202へ出力する。変換部201の詳しい構成および動作については後述する。量子化部202は、LSP分析部(広帯域用)106から入力された広帯域LSPとLSP変換部から入力された予測広帯域LSPとの誤差信号を、ベクトル量子化などの手法を用いて符号化し、得られる広帯域の量子化LSPを音源符号化部(広帯域用)108へ出力するとともに、得られる符号情報を多重
化部111へ出力する。
音源符号化部(広帯域用)108は、広帯域LSP符号化部107から入力された、量子化された広帯域LSPパラメータを線形予測係数に変換し、得られた線形予測係数を用いて線形予測合成フィルタを構築する。そして、この線形予測合成フィルタを用いて合成される合成信号と位相補正された入力信号との間の聴覚的重みづき誤差を求め、この聴覚的重みづき誤差を最小とする音源パラメータを決定する。より詳細には、音源符号化部108には、広帯域入力信号とアップサンプル後の狭帯域復号信号との誤差信号が別途加算器110より入力され、この誤差信号と音源符号化部108で生成される復号信号との間の誤差が求められ、この誤差に聴覚的重みづけが施されたものが最小となるように音源パラメータが決定される。求まった音源パラメータの符号情報は、多重化部111へ出力される。この音源符号化については、例えば、K. Koishida et al, “A 16-kbit/s bandwidth scalable audio coder based on the G.729 standard,” IEEE Proc. ICASSP 2000, pp.1149-1152, 2000に開示されている。
多重化部111には、狭帯域LSP符号化部103からは狭帯域LSPの符号化情報が、音源符号化部(狭帯域用)104からは狭帯域信号の音源符号化情報が、広帯域LSP符号化部107からは広帯域LSPの符号化情報が、そして、音源符号化部(広帯域用)108からは広帯域信号の音源符号化情報が入力される。多重化部111は、これらの情報を多重化してビットストリームとして伝送路に送出する。なお、ビットストリームは、伝送路の仕様に応じて、伝送チャネルフレームにフレーム化されたり、パケット化されたりする。また、伝送路誤りに対する耐性を高めるために、誤り保護、誤り検出符号の付加、インタリーブ処理等を適用したりする。
図3は、上記の変換部201の主要な構成を示すブロック図である。変換部201は、は、自己相関係数変換部301、逆ラグ窓部302、外挿部303、アップサンプル部304、ラグ窓部305、LSP変換部306、乗算部307および変換係数テーブル308を備える。
自己相関係数変換部301は、Mn次の狭帯域LSPをMn次の自己相関係数に変換して逆ラグ窓部302へ出力する。より具体的には、自己相関係数変換部301は、狭帯域LSP符号化部103より入力される狭帯域の量子化LSPパラメータをLPC(線形予測係数)に変換した後、LPCを自己相関係数に変換する。
LSPからLPCへの変換については、例えば、P. Kabal and R. P. Ramachandran, “The Computation of Line Spectral Frequencies Using Chevyshev Polynomials,” IEEE Trans. on Acoustics, Speech, and Signal Processing, vol. ASSP-34, no. 6, December 1986に開示されている(この文献におけるLSFは本実施の形態におけるLSPと同意である)。また、例えば、ITU−T勧告G.729(3.2.6節 LSP to LP conversion)にもLSPからLPCへの具体的な変換手順が開示されている。
また、LPCから自己相関係数への変換については、レビンソン・ダービン(Levinson-Durbin)のアルゴリズム(例えば、中溝高好、「現代制御シリーズ 信号解析とシステム同定」、コロナ社、p.71、3.6.3章参照)を用いて行なう。具体的には式(3)に従って行う。
Figure 2006028010
逆ラグ窓部302は、入力された自己相関係数に対し、その自己相関係数に掛けられているラグ窓と逆特性の窓(逆ラグ窓)を掛ける。上記のように、LSP分析部(狭帯域用)102では、自己相関係数からLPCへの変換時に自己相関係数にラグ窓が掛けられるため、自己相関係数変換部301から逆ラグ窓部302へ入力される自己相関係数には未だラグ窓が掛かったままである。そこで、逆ラグ窓部302は、後述する外挿処理の精度を高めるために、入力された自己相関係数に対し逆ラグ窓を掛けて、LSP分析部(狭帯域用)102においてラグ窓を掛ける前の自己相関係数に戻して、外挿部303へ出力する。
狭帯域の符号化レイヤではMn次を超える次数の自己相関係数は符号化されないので、Mn次までの情報のみからMn次を超える次数の自己相関係数を求める必要がある。そこで、外挿部303は、逆ラグ窓部302から入力される自己相関係数に対して外挿処理を行って、自己相関係数の次数を拡張して、次数拡張後の自己相関係数をアップサンプル部304へ出力する。すなわち、外挿部303は、Mn次の自己相関係数を(Mn+Mi)次に拡張する。この外挿処理を行うのは、後述するアップサンプル処理において、Mn次より高次の自己相関係数が必要になるためである。また、後述するアップサンプル処理時の打ち切り誤差を低減するために、本実施の形態では、狭帯域LSPパラメータの分析次数を広帯域LSPパラメータの分析次数の1/2以上とする。すなわち、(Mn+Mi)次をMn次の2倍未満にする。外挿部303は、レビンソン・ダービンのアルゴリズム(式(3))においてMn次を超える部分での反射係数を0とすることで再帰的に(Mn+1)次〜(Mn+Mi)次の自己相関係数を求める。式(3)においてMn次を超える部分での反射係数を0とすると式(4)が得られる。
Figure 2006028010
式(4)は式(5)のように展開することができる。式(5)に示すように、反射係数を0として得られる自己相関係数Rm+1は、入力信号時間波形xt+m+1-i(i=1〜m)から線形予測によって得られる予測値
Figure 2006028010
と入力信号時間波形xtとの相互相関であることが分かる。つまり、外挿部303では、線形予測を用いて自己相関係数の外挿処理を行なっていることになる。このような外挿処理を行なうことで、後述するアップサンプル処理により、安定したLPCに変換可能な自己相関係数を得ることができる。
Figure 2006028010
アップサンプル部304は、外挿部から入力される自己相関係数、すなわち、次数を(Mn+Mi)次に拡張された自己相関係数に対して、時間領域でのアップサンプル処理と等価な自己相関領域でのアップサンプル処理を行って、Mw次の自己相関係数を得る。このアップサンプル後の自己相関係数はラグ窓部305へ出力される。アップサンプル処理はsinc関数を畳み込む補間フィルタ(ポリフェーズフィルタ、FIRフィルタ等)を用いて行なう。以下、自己相関係数のアップサンプル処理の具体的手順について説明する。
離散化された信号x(nΔt)から連続信号u(t)をsinc関数を用いて補間する場合、式(6)のように表される。よって、u(t)のサンプリング周波数を2倍にアップサンプルする場合は、式(7)および式(8)に示すようになる。
Figure 2006028010
Figure 2006028010
Figure 2006028010
式(7)はアップサンプル後に偶数サンプルになる点を示しており、アップサンプル前のx(i)がそのままu(2i)となる。
また、式(8)はアップサンプル後に奇数サンプルになる点を示しており、x(i)にsinc関数を畳み込むことでu(2i+1)が求められる。この畳み込み処理は、x(i)の時間軸を反転したものとsinc関数との積和で表される。積和処理はx(i)の前後の点を用いて行なわれるので、積和に必要なデータ数を例えば2N+1とした場合、u(2i+1)の点を求めるにはx(i−N)〜x(i+N)が必要になる。よって、このアップサンプル処理においては、アップサンプル前のデータの時間長がアップサンプル後のデータの時間長より長いことが必要である。このため、本実施の形態では、広帯域信号に対する帯域幅あたりの分析次数を狭帯域信号に対する帯域幅あたりの分析次数より相対的に小さくしている。
また、アップサンプルされた自己相関関数R(j)は、x(i)をアップサンプルしたu(i)を用いて式(9)のように表される。
Figure 2006028010
式(9)に式(7)および式(8)を代入して整理すると、式(10)および式(11)が得られる。式(10)は偶数サンプルになる点を示し、式(11)は奇数サンプルになる点を示す。
Figure 2006028010
Figure 2006028010
ここで、式(10)および式(11)においてr(j)はアップサンプル前のx(i)の自己相関係数である。よって、式(10)および式(11)を用いてアップサンプル前の自己相関係数r(j)をR(j)にアップサンプルすれば、時間領域でのx(i)からu(i)へのアップサンプルを行なってから自己相関係数を求めたのと等価になることが分かる。このようにして、アップサンプル部304が、時間領域でのアップサンプル処理と等価な自己相関領域でのアップサンプル処理を行うことにより、アップサンプルによる誤差の発生を最小限に抑えることができる。
なお、アップサンプル処理は、式(6)〜式(11)で示した処理の他に、例えば、ITU−T勧告G.729(3.7節)に記載されている処理を用いて近似的に行うことも可能である。ITU−T勧告G.729では、ピッチ分析において分数精度ピッチ探索を行なう目的で相互相関係数のアップサンプルを行なっている。例えば、正規化相互相関係数を1/3精度で補間(3倍のアップサンプルに相当)している。
ラグ窓部305は、アップサンプル部304から入力されるアップサンプル後のMw次の自己相関係数に対して広帯域用(高サンプリングレート用)のラグ窓を掛けて、LSP変換部306へ出力する。
LSP変換部306は、ラグ窓を掛けられたMw次の自己相関係数(分析次数が狭帯域LSPパラメータの分析次数の2倍未満の自己相関係数)をLPCに変換した後、LPCをLSPに変換してMw次のLSPパラメータを求める。これにより、Mw次の狭帯域LSPが得られる。Mw次の狭帯域LSPは乗算部307へ出力される。
乗算部307は、LSP変換部306から入力されるMw次の狭帯域LSPに、変換係数テーブル308に格納されている変換係数を乗じて、Mw次の狭帯域LSPの周波数帯域を広帯域に変換する。この変換により、乗算部307は、Mw次の狭帯域LSPからMw次の予測広帯域LSPを求めて量子化部202へ出力する。なお、ここでは、変換係数は予め変換係数テーブル308に格納されているものとしたが、適応的に算出した変換係数を用いてもよい。例えば、直前のフレームにおける広帯域量子化LSPの狭帯域量子化LSPに対する比を変換係数として用いることができる。
以上のようにして、変換部201は、狭帯域LSP符号化部103より入力される狭帯域LSPを変換して予測広帯域LSPを求める。
次に、本実施の形態に係るスケーラブル符号化装置の動作フローについて図4を用いて説明する。図4においては、一例として、狭帯域音声信号(8kHzサンプリング、Fs:8kHz)に対しては12次のLSP分析を行い、広帯域音声信号(16kHzサンプリング、Fs:16kHz)に対しては18次のLSP分析を行う場合を示している。
まず、Fs:8kHz(狭帯域)において、狭帯域音声信号(401)を12次の自己相関係数(402)に変換し、12次の自己相関係数(402)を12次のLPC(403)に変換し、そして、12次のLPC(403)を12次のLSP(404)に変換する。
ここで、12次のLSP(404)は12次のLPC(403)に、12次のLPC(403)は12次の自己相関係数(402)に可逆的に変換する(戻す)ことが可能である。一方、12次の自己相関係数(402)を元の音声信号(401)に戻すことはできない。
そこで、本実施の形態に係るスケーラブル符号化装置では、時間領域でのアップサンプルと等価なアップサンプルを自己相関領域で行なうことで、Fs:16kHz(広帯域)の自己相関係数(405)を求める。つまり、Fs:8kHzの12次の自己相関係数(402)をアップサンプルして、Fs:16kHzの18次の自己相関係数(405)を求める。
そして、Fs:16kHz(広帯域)において、18次の自己相関係数(405)を18次のLPC(406)に変換し、18次のLPC(406)を18次のLSP(407)に変換する。この18次のLSP(407)が予測広帯域LSPとして使用される。
なお、Fs:16kHz(広帯域)においては、広帯域音声信号を元に自己相関係数を求めていることと擬似的に等価な処理を行なう必要があるため、自己相関領域でのアップサンプルを行うときには、上記のように、Fs:8kHzの自己相関係数の次数:12次を18次に拡張する自己相関係数の外挿処理を行う。
次に、逆ラグ窓部302による逆ラグ窓掛けおよび外挿部303による外挿処理の効果について図5および図6を用いて説明する。
図5は、Mn次の自己相関係数を拡張して得られる(Mn+Mi)次の自己相関係数を示すグラフである。図5において、501は、実際の狭帯域入力音声信号(低サンプリングレート)から求めた自己相関係数であり、これが理想的な自己相関係数である。これに対し、502は、本実施の形態のように、自己相関係数に逆ラグ窓を掛けてから外挿処理を行って求めた自己相関係数である。また、503は、自己相関係数に逆ラグ窓を掛けずにそのまま外挿処理を行って求めた自己相関係数である。なお、503では、スケールを合わせるために外挿処理を行った後に逆ラグ窓を掛けている。図5の結果より、外挿した部分(Mi=5の部分)において、503が502より歪んでいることが分かる。つまり、本実施の形態のように自己相関係数に逆ラグ窓を掛けてから外挿処理を行うことにより、自己相関係数の外挿処理の精度を高めることができる。なお、504は、本実施の形態のような外挿処理を行わずに、自己相関係数のMi次を零詰めで拡張して求めた自己相関係数である。
図6は、図5の各結果に対してアップサンプル処理を行なって得られる自己相関係数から求めたLPCスペクトル包絡を示すグラフである。601は、4kHz以上の帯域を含む広帯域信号から求めたLPCスペクトル包絡である。また、602は502に、603は503に、604は504にそれぞれ対応する。図6に示す結果より、Mi次を零詰めで拡張して求めた自己相関係数(504)に対してアップサンプル処理を行なって得られる自己相関係数からLPCを求めると、スペクトル特性が604に示すように発振状態に陥ってしまう。このように、Mi次(拡張部分)を零詰めで拡張すると、自己相関係数の適切な補間(アップサンプル)ができないために、自己相関係数をLPCに変換したとき
に発振してしまい、安定したフィルタが得られなくなってしまう。このようにLPCが発振状態に陥ると、LPCからLSPへの変換処理ができなくなってしまう。これに対して、本実施の形態のような外挿処理を行ってMi次を拡張した自己相関係数をアップサンプリングした自己相関係数からLPCを求めると、602および603のようになり、広帯域信号の4kHz未満の狭帯域成分が精度良く求められることが分かる。このように、本実施の形態によれば、自己相関係数のアップサンプルを精度良く行うことができる。つまり、本実施の形態によれば、式(4)および式(5)に示すような外挿処理を行うことにより、自己相関係数に対して適切なアップサンプル処理を行うことができ、安定したLPCを得ることができる。
次に、LSPのシミュレーション結果を図7〜図9に示す。図7はFs:8kHzの狭帯域音声信号を12次で分析したLSPを示し、図8は狭帯域音声信号を12次で分析したLSPを図1に示すスケーラブル符号化装置によりFs:16kHzの18次のLSPに変換した場合を示し、図9は広帯域音声信号を18次で分析したLSPを示す。図7〜図9において、実線は入力音声信号(広帯域)のスペクトル包絡を示し、波線はLSPを示す。このスペクトル包絡は、女声の「管理システム」の「かんり」の「ん」の部分である。なお、近年のCELP方式においては、狭帯域用では分析次数が10〜14次、広帯域用では16〜20次程度のCELP方式が使用されることが多いため、図7において狭帯域の分析次数を12次とし、図8および図9において広帯域の分析次数を18次としている。
まず、図7と図9とを比較する。図7と図9とにおいて同じ次数同士のLSPの対応関係に着目すると、例えば、図7におけるLSP(L1〜L12)のうち8次のLSP(L8)はスペクトルピーク701(左から2番目のスペクトルピーク)付近にあるが、図9における8次のLSP(L8)はスペクトルピーク702(左から3番目のスペクトルピーク)付近にある。つまり、図7と図9とでは、同じ次数のLSPが全く異なる位置にある。よって、狭帯域音声信号を12次で分析したLSPと広帯域音声信号を18次で分析したLSPとを直接対応付けることは適切でないと言える。
これに対し、図8と図9とを比較すると、同じ次数同士のLSPの対応が全体的に良くとれていることが分かる。特に、3.5kHz以下の低域において、対応関係が良くとれていることが分かる。このように、本実施の形態によれば、任意の次数の狭帯域(低サンプリング周波数)LSPパラメータを任意の次数の広帯域(高サンプリング周波数)LSPパラメータに精度良く変換することができる。
以上説明したようにして、本実施の形態に係るスケーラブル符号化装置は周波数軸方向にスケーラビリティを有する狭帯域および広帯域の量子化LSPパラメータを得る。
本発明に係るスケーラブル符号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。
なお、上記実施の形態では、アップサンプル部304がサンプリング周波数を2倍にするアップサンプル処理を行う場合を一例として説明した。しかし、本発明は、アップサンプル処理につき、サンプリング周波数を2倍にするものに限定されない。すなわち、サンプリング周波数をn倍(nは2以上の自然数)にするアップサンプル処理であればよい。また、サンプリング周波数をn倍にするアップサンプルの場合は、本発明では、狭帯域LSPパラメータの分析次数を広帯域LSPパラメータの分析次数の1/n以上、すなわち、(Mn+Mi)次をMn次のn倍未満にする。
また、上記実施の形態では、LSPパラメータを符号化する場合について説明したが、ISP(Immittance Spectrum Pairs)パラメータについても本発明は適用可能である。
また、上記実施の形態では、帯域スケーラブル符号化のレイヤが2つである場合、すなわち、狭帯域および広帯域の2つの周波数帯域からなる帯域スケーラブル符号化を例にとって説明したが、本発明は、3つ以上の周波数帯域(レイヤ)からなる帯域スケーラブル符号化または帯域スケーラブル復号化に対しても適用可能である。
また、一般にラグ窓掛けとは別にWhite-noise Correctionと呼ばれる処理(入力音声信号に微弱なノイズフロアを加算するのと等価な処理として、0次の自己相関係数に1よりわずかに大きい数(例えば1.0001)を乗じる処理または0次以外のすべての自己相関係数を1よりわずかに大きい数(例えば1.0001)で除する処理)が自己相関係数に対して行われる。本実施の形態では、White-noise Correctionについては記載していないが、ラグ窓掛けの処理にWhite-noise Correctionを含める(すなわち、ラグ窓の係数に対してWhite-noise Correctionを施したものを実際のラグ窓の係数として使用する)ことは一般的に行われていることである。よって、本発明においてもWhite-noise Correctionをラグ窓掛けの処理の中に含めてもよい。
また、上記実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてありえる。
本明細書は、2004年9月6日出願の特願2004−258924に基づくものである。この内容はすべてここに含めておく。
本発明に係るスケーラブル符号化装置およびスケーラブル符号化方法は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置の用途に適用できる。
本発明の一実施の形態に係るスケーラブル符号化装置の主要な構成を示すブロック図 上記実施の形態に係る広帯域LSP符号化部の主要な構成を示すブロック図 上記実施の形態に係る変換部の主要な構成を示すブロック図 上記実施の形態に係るスケーラブル符号化装置の動作フロー図 Mn次の自己相関係数を拡張して得られる(Mn+Mi)次の自己相関係数を示すグラフ 図5の各結果に対してアップサンプル処理を行なって得られる自己相関係数から求めたLPCを示すグラフ LSPのシミュレーション結果(Fs:8kHzの狭帯域音声信号を12次で分析したLSP) LSPのシミュレーション結果(狭帯域音声信号を12次で分析したLSPを図1に示すスケーラブル符号化装置によりFs:16kHzの18次のLSPに変換した場合) LSPのシミュレーション結果(広帯域音声信号を18次で分析したLSP)

Claims (8)

  1. 狭帯域LSPパラメータから広帯域LSPパラメータを得るスケーラブル符号化装置であって、
    狭帯域LSPパラメータを自己相関係数に変換する第1変換手段と、
    前記自己相関係数をアップサンプリングするアップサンプリング手段と、
    アップサンプリングされた前記自己相関係数をLSPパラメータに変換する第2変換手段と、
    前記LSPパラメータの周波数帯域を広帯域に変換して広帯域LSPパラメータを得る第3変換手段と、
    を具備するスケーラブル符号化装置。
  2. 前記アップサンプリング手段は、前記自己相関係数のサンプリング周波数をn倍(nは2以上の自然数)にし、
    前記第2変換手段は、前記狭帯域LSPパラメータの分析次数のn倍未満の分析次数の前記自己相関係数を前記LSPパラメータに変換する、
    請求項1記載のスケーラブル符号化装置。
  3. 前記自己相関係数の次数を拡張する外挿処理を行う外挿手段、をさらに具備する請求項1記載のスケーラブル符号化装置。
  4. 前記自己相関係数に対し、前記狭帯域LSPパラメータに掛けられているラグ窓と逆特性の窓を掛ける窓掛け手段、をさらに具備する請求項1記載のスケーラブル符号化装置。
  5. 前記アップサンプリング手段は、時間領域でのアップサンプリングと等価な自己相関領域でのアップサンプリングを行う請求項1記載のスケーラブル符号化装置。
  6. 請求項1記載のスケーラブル符号化装置を具備する通信端末装置。
  7. 請求項1記載のスケーラブル符号化装置を具備する基地局装置。
  8. 狭帯域LSPパラメータから広帯域LSPパラメータを得るスケーラブル符号化方法であって、
    狭帯域LSPパラメータを自己相関係数に変換する第1変換工程と、
    前記自己相関係数をアップサンプリングするアップサンプリング工程と、
    アップサンプリングされた前記自己相関係数をLSPパラメータに変換する第2変換工程と、
    前記LSPパラメータの周波数帯域を広帯域に変換して広帯域LSPパラメータを得る第3変換工程と、
    を具備するスケーラブル符号化方法。
JP2006535719A 2004-09-06 2005-09-02 スケーラブル符号化装置およびスケーラブル符号化方法 Expired - Fee Related JP4937753B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006535719A JP4937753B2 (ja) 2004-09-06 2005-09-02 スケーラブル符号化装置およびスケーラブル符号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004258924 2004-09-06
JP2004258924 2004-09-06
JP2006535719A JP4937753B2 (ja) 2004-09-06 2005-09-02 スケーラブル符号化装置およびスケーラブル符号化方法
PCT/JP2005/016099 WO2006028010A1 (ja) 2004-09-06 2005-09-02 スケーラブル符号化装置およびスケーラブル符号化方法

Publications (2)

Publication Number Publication Date
JPWO2006028010A1 true JPWO2006028010A1 (ja) 2008-05-08
JP4937753B2 JP4937753B2 (ja) 2012-05-23

Family

ID=36036295

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006535719A Expired - Fee Related JP4937753B2 (ja) 2004-09-06 2005-09-02 スケーラブル符号化装置およびスケーラブル符号化方法

Country Status (10)

Country Link
US (1) US8024181B2 (ja)
EP (1) EP1785985B1 (ja)
JP (1) JP4937753B2 (ja)
KR (1) KR20070051878A (ja)
CN (1) CN101023472B (ja)
AT (1) ATE406652T1 (ja)
BR (1) BRPI0514940A (ja)
DE (1) DE602005009374D1 (ja)
RU (1) RU2007108288A (ja)
WO (1) WO2006028010A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103860B (zh) * 2004-09-17 2013-05-08 松下电器产业株式会社 频谱包络信息量化装置及方法、频谱包络信息解码装置及方法
BRPI0515814A (pt) * 2004-12-10 2008-08-05 Matsushita Electric Ind Co Ltd dispositivo de codificação de banda larga, dispositivo de predição de lsp de banda larga, dispositivo de codificação de banda escalonável, método de codificação de banda larga
DE602006015461D1 (de) * 2005-05-31 2010-08-26 Panasonic Corp Einrichtung und verfahren zur skalierbaren codierung
CN101213590B (zh) * 2005-06-29 2011-09-21 松下电器产业株式会社 可扩展解码装置及丢失数据插值方法
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US8069035B2 (en) * 2005-10-14 2011-11-29 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, and methods of them
EP1959431B1 (en) * 2005-11-30 2010-06-23 Panasonic Corporation Scalable coding apparatus and scalable coding method
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
US8370138B2 (en) * 2006-03-17 2013-02-05 Panasonic Corporation Scalable encoding device and scalable encoding method including quality improvement of a decoded signal
US20090240494A1 (en) * 2006-06-29 2009-09-24 Panasonic Corporation Voice encoding device and voice encoding method
JPWO2008108077A1 (ja) * 2007-03-02 2010-06-10 パナソニック株式会社 符号化装置および符号化方法
KR100921867B1 (ko) * 2007-10-17 2009-10-13 광주과학기술원 광대역 오디오 신호 부호화 복호화 장치 및 그 방법
CN101620854B (zh) * 2008-06-30 2012-04-04 华为技术有限公司 频带扩展的方法、系统和设备
EP4376307A2 (en) 2008-07-11 2024-05-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
CN101609678B (zh) * 2008-12-30 2011-07-27 华为技术有限公司 信号压缩方法及其压缩装置
WO2012053149A1 (ja) * 2010-10-22 2012-04-26 パナソニック株式会社 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法
CN102783034B (zh) * 2011-02-01 2014-12-17 华为技术有限公司 用于提供信号处理系数的方法和设备
DK3040988T3 (en) 2011-11-02 2018-01-08 ERICSSON TELEFON AB L M (publ) AUDIO DECODING BASED ON AN EFFECTIVE REPRESENTATION OF AUTOREGRESSIVE COEFFICIENTS
PL2777041T3 (pl) 2011-11-10 2016-09-30 Sposób i urządzenie do wykrywania częstotliwości próbkowania audio
EP2750130B1 (en) * 2012-12-31 2015-11-25 Nxp B.V. Signal processing for a frequency modulation receiver
WO2014138539A1 (en) * 2013-03-08 2014-09-12 Motorola Mobility Llc Conversion of linear predictive coefficients using auto-regressive extension of correlation coefficients in sub-band audio codecs
SI3511935T1 (sl) 2014-04-17 2021-04-30 Voiceage Evs Llc Metoda, naprava in računalniško bran neprehodni spomin za linearno predvidevano kodiranje in dekodiranje zvočnih signalov po prehodu med okvirji z različnimi frekvencami vzorčenja
KR101878292B1 (ko) * 2014-04-25 2018-07-13 가부시키가이샤 엔.티.티.도코모 선형 예측 계수 변환 장치 및 선형 예측 계수 변환 방법
KR20180026528A (ko) 2015-07-06 2018-03-12 노키아 테크놀로지스 오와이 오디오 신호 디코더를 위한 비트 에러 검출기
US10824917B2 (en) 2018-12-03 2020-11-03 Bank Of America Corporation Transformation of electronic documents by low-resolution intelligent up-sampling

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123495A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 広帯域音声復元装置
JPH09101798A (ja) * 1995-10-05 1997-04-15 Matsushita Electric Ind Co Ltd 音声帯域拡大方法および音声帯域拡大装置
JPH09127985A (ja) * 1995-10-26 1997-05-16 Sony Corp 信号符号化方法及び装置
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
JP2002528777A (ja) * 1998-10-27 2002-09-03 ボイスエイジ コーポレイション オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置
JP2004151423A (ja) * 2002-10-31 2004-05-27 Nec Corp 帯域拡張装置及び方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US539355A (en) * 1895-05-14 Cushion-stamp
US93279A (en) * 1869-08-03 Gustav cramer and julius gross
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
US5710863A (en) * 1995-09-19 1998-01-20 Chen; Juin-Hwey Speech signal quantization using human auditory models in predictive coding systems
TW321810B (ja) * 1995-10-26 1997-12-01 Sony Co Ltd
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
JP3134817B2 (ja) 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
JP2001500284A (ja) * 1997-07-11 2001-01-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 改良した調波音声符号器を備えた送信機
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
CN1326415C (zh) * 2001-06-26 2007-07-11 诺基亚公司 对音频信号进行代码变换的方法、码变换器、网元、无线通信网和通信系统
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
JP2003241799A (ja) 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
EP1755109B1 (en) * 2004-04-27 2012-08-15 Panasonic Corporation Scalable encoding and decoding apparatuses and methods
JPWO2005106848A1 (ja) * 2004-04-30 2007-12-13 松下電器産業株式会社 スケーラブル復号化装置および拡張レイヤ消失隠蔽方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123495A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 広帯域音声復元装置
JPH09101798A (ja) * 1995-10-05 1997-04-15 Matsushita Electric Ind Co Ltd 音声帯域拡大方法および音声帯域拡大装置
JPH09127985A (ja) * 1995-10-26 1997-05-16 Sony Corp 信号符号化方法及び装置
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
JP2002528777A (ja) * 1998-10-27 2002-09-03 ボイスエイジ コーポレイション オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置
JP2004151423A (ja) * 2002-10-31 2004-05-27 Nec Corp 帯域拡張装置及び方法

Also Published As

Publication number Publication date
EP1785985B1 (en) 2008-08-27
DE602005009374D1 (de) 2008-10-09
US20070271092A1 (en) 2007-11-22
BRPI0514940A (pt) 2008-07-01
CN101023472A (zh) 2007-08-22
US8024181B2 (en) 2011-09-20
EP1785985A4 (en) 2007-11-07
CN101023472B (zh) 2010-06-23
KR20070051878A (ko) 2007-05-18
EP1785985A1 (en) 2007-05-16
ATE406652T1 (de) 2008-09-15
WO2006028010A1 (ja) 2006-03-16
RU2007108288A (ru) 2008-09-10
JP4937753B2 (ja) 2012-05-23

Similar Documents

Publication Publication Date Title
JP4937753B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP5165559B2 (ja) オーディオコーデックポストフィルタ
JP5143193B2 (ja) スペクトル包絡情報量子化装置、スペクトル包絡情報復号装置、スペクトル包絡情報量子化方法及びスペクトル包絡情報復号方法
US8543392B2 (en) Encoding device, decoding device, and method thereof for specifying a band of a great error
JP4546464B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
RU2389085C2 (ru) Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx
JP6336086B2 (ja) 適合的帯域幅拡張およびそのための装置
TWI384807B (zh) 用於在一與一語音訊號相關之封包中包含一識別符之系統及方法
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
EP1806736B1 (en) Scalable encoding apparatus, scalable decoding apparatus, and methods thereof
RU2756042C2 (ru) Передискретизация звукового сигнала для кодирования/декодирования с малой задержкой
JPWO2008053970A1 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
EP2227682A1 (en) An encoder
JP5236033B2 (ja) 音声符号化装置、音声復号装置およびそれらの方法
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法
Seto Scalable Speech Coding for IP Networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120131

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120222

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150302

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4937753

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees