JPWO2005106848A1 - スケーラブル復号化装置および拡張レイヤ消失隠蔽方法 - Google Patents
スケーラブル復号化装置および拡張レイヤ消失隠蔽方法 Download PDFInfo
- Publication number
- JPWO2005106848A1 JPWO2005106848A1 JP2006512775A JP2006512775A JPWO2005106848A1 JP WO2005106848 A1 JPWO2005106848 A1 JP WO2005106848A1 JP 2006512775 A JP2006512775 A JP 2006512775A JP 2006512775 A JP2006512775 A JP 2006512775A JP WO2005106848 A1 JPWO2005106848 A1 JP WO2005106848A1
- Authority
- JP
- Japan
- Prior art keywords
- signal
- decoded
- decoder
- core layer
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 165
- 238000012545 processing Methods 0.000 claims abstract description 114
- 239000010410 layer Substances 0.000 claims description 152
- 230000005284 excitation Effects 0.000 claims description 140
- 239000012792 core layer Substances 0.000 claims description 134
- 238000003786 synthesis reaction Methods 0.000 claims description 70
- 230000015572 biosynthetic process Effects 0.000 claims description 68
- 238000006243 chemical reaction Methods 0.000 claims description 39
- 238000004891 communication Methods 0.000 claims description 19
- 238000005070 sampling Methods 0.000 abstract description 13
- 230000008569 process Effects 0.000 description 144
- 238000010586 diagram Methods 0.000 description 36
- 230000005540 biological transmission Effects 0.000 description 32
- 230000005236 sound signal Effects 0.000 description 32
- 230000003044 adaptive effect Effects 0.000 description 10
- 238000000354 decomposition reaction Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000010295 mobile communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000000630 rising effect Effects 0.000 description 4
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
帯域スケーラブル符号化において、拡張レイヤの信号を消失した場合でも、復号信号の帯域が頻繁に切り替わることがなく、主観品質に違和感や不快感を生じさせないスケーラブル復号化装置を開示する。フレーム消失がなかった場合、信号S101となる。しかし、高帯域パケットを消失すると、実際に受信される信号は低域パケットのみである。そこで、上記装置は、低域パケットの信号にアップサンプル処理等を施すことにより、サンプリングレートは広帯域であって低域成分のみが残った信号S102を生成する。一方、第n−1フレームの信号S103に基づいて、隠蔽処理によって補償信号S104を生成する。この信号S104をHPFに通し、高域成分のみを取り出すと信号S105となる。この低域成分のみが残った信号S101と高域成分のみが残った信号S105とを加算し、復号信号S106を得る。
Description
本発明は、拡張レイヤを消失した場合に隠蔽処理を行うスケーラブル復号化装置および当該装置で使用される拡張レイヤ消失隠蔽方法に関する。
インターネット通信に代表されるパケット通信においては、伝送路上でパケット損失が発生することがあるため、伝送情報の一部が消失しても、残る情報から復号処理を可能とするいわゆるスケーラブル符号化機能が望まれる。このスケーラブル符号化には、周波数帯域は変えずに、符号化対象の信号のビットレートのみにスケーラビリティを持たせるものと、符号化対象の信号の周波数帯域(周波数軸方向)にスケーラビリティを持たせて符号化するものとが存在する(例えば、非特許文献1参照)。特に、後者の周波数帯域にスケーラビリティを持たせて符号化する方式を帯域スケーラブル符号化と呼ぶことにする。
従来の音声通信では、電話帯域(300Hz〜3.4kHz)の狭帯域信号が用いられてきたが、近年、広帯域(50Hz〜7kHz)の信号を符号化する方式等も標準化され(例えば、非特許文献2参照)、将来の高品質音声通信への利用が期待されている。
一方、今後ネットワークのオールIP化が進むにつれ、電話帯域の音声信号用の端末と広帯域音声用の端末とが同一のネットワーク内に混在することが予想される。また、現在の電話会議サービスに見られるような多地点間通信も普及すると言われている。このような状況を考えると、一つの符号化方式で、電話帯域の音声信号と広帯域の音声信号との双方を符号化/復号化できるスケーラブル符号化方式の有効性が高いと考えられる。
これまでにも、音声信号に限らず、さらに広帯域な音響信号に対するスケーラブル符号化方式が開示されている(例えば、特許文献1、2参照)。このようなスケーラブル符号化は、符号化対象となる音響信号を階層的に符号化するため、DiffServ(Differentiated Services)のようなネットワーク上での優先制御を用いてコア(基本レイヤ)の情報を優先的に伝送する。そして、伝送路の状況によっては、より上位の拡張レイヤの情報から順に廃棄を行う。これにより、通信ネットワーク内でコア情報が破棄される確率を低く抑え、パケット損失によって一部の符号化情報が失われても通話品質の劣化を抑えることができる。
一方、伝送路上で符号化情報が失われ、復号器側で符号化情報を受信できない場合、このデータ消失の隠蔽(補償)処理を行うことが一般的である。例えば、特許文献3には、ITU−T勧告G.729のフレーム消失隠蔽処理が開示されている。特許文献3に開示されているように、過去に復号した情報を用いて外挿的に消失フレームの隠蔽処理を行うことが標準的である。
特開平08−263096号公報 特開2002−100994号公報 特開平09−120297号公報 T.Nomura et al,"A Bitrateand Bandwidth Scalable CELP Coder,"IEEE Proc.ICASSP98,pp.341−344,1998 3GPP規格、TS26.190
しかしながら、スケーラブル符号化された信号の伝送において、拡張レイヤの信号を消失した場合の復号処理については、標準的な技術が存在しない。
また、拡張レイヤの信号のみを消失した場合にコアレイヤの情報を用いて消失信号の復号化処理を行うことも考えられるが、以下のような問題がある。すなわち、上記のように、ビットレートだけでなく周波数帯域もスケーラブルな場合、コアレイヤの情報から生成された復号信号は狭帯域な信号であるのに対し、コアレイヤと拡張レイヤの双方の情報から生成された復号信号は広帯域な信号となる。よって、コアレイヤの情報のみを用いて復号処理を行った場合と、拡張レイヤまでを使用して復号処理を行った場合とでは、復号信号の周波数帯域が変化してしまうという問題がある。かかる場合、コアレイヤの符号化情報のみを用いて復号しても、局所的に信号帯域が狭小化するだけであるので、著しい品質劣化にはつながらないものの、拡張レイヤの消失率が高く、復号信号の帯域が狭帯域と広帯域とに頻繁に切り替わるような場合には、主観品質に違和感や不快感を生じる結果となる。
よって、本発明の目的は、帯域スケーラブル符号化において、拡張レイヤの信号を消失した場合でも、復号信号の帯域が頻繁に切り替わることがなく、主観品質に違和感や不快感を生じさせないスケーラブル復号化装置、および当該装置で使用される拡張レイヤ消失隠蔽方法を提供することである。
本発明のスケーラブル復号化装置は、周波数軸方向にスケーラビリティを有するコアレイヤと拡張レイヤとからなる符号化情報から、広帯域の復号信号を得るスケーラブル復号化装置であって、コアレイヤの符号化情報から狭帯域のコアレイヤ復号信号を得るコアレイヤ復号化手段と、前記狭帯域のコアレイヤ復号信号の周波数帯域を広帯域に変換し、第1信号を得る変換手段と、コアレイヤが存在し拡張レイヤが消失された符号化情報に対し、過去に得られた復号信号に基づいて広帯域の補償信号を生成する補償手段と、前記広帯域の補償信号からコアレイヤに相当する周波数成分を除去し、第2信号を得る除去手段と、前記変換手段で得られた第1信号と、前記除去手段で得られた第2信号と、を加算して広帯域の復号信号を得る加算手段と、を具備する構成を採る。
本発明によれば、帯域スケーラブル符号化において、拡張レイヤの信号を消失した場合でも、復号信号の帯域が頻繁に切り替わることがなく、主観品質に違和感や不快感を生じさせないようにすることができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、ここでは、周波数帯域にスケーラビリティを持たせて階層的に入力信号の符号化/復号化が行われている状況、すなわち符号化情報が周波数軸方向にスケーラビリティを有する場合を例にとって説明する。かかる場合、コアレイヤは、最も狭帯域の信号の符号化/復号化を行うレイヤである。
(実施の形態1)
図1は、本発明の実施の形態1に係るスケーラブル復号化装置の主要な構成を示すブロック図である。
図1は、本発明の実施の形態1に係るスケーラブル復号化装置の主要な構成を示すブロック図である。
本実施の形態に係るスケーラブル復号化装置は、コア符号パケット用のパケット分解部101、コア復号器(コア復号化処理部)102、アップサンプル処理部103、拡張符号パケット用のパケット分解部104、拡張復号器(拡張復号化処理部)105、高域通過フィルタ(HPF)106、切り替えスイッチ(SW)107、および加算器108を備える。
本実施の形態に係るスケーラブル復号化装置の各部は以下の動作を行う。
コア符号パケット用のパケット分解部101は、パケット網Nを介し入力されたコアレイヤの符号化情報が載っているコア符号パケットから、コアレイヤの符号化情報を取り出してコア復号器102へ出力(S1)すると共に、フレーム消失情報C1をコア復号器102、拡張復号器105、および切り替えスイッチ107へ出力する。ここで、符号化情報とは、送信側の符号化装置(図示せず)から出力される符号化ビットストリームのことであり、フレーム消失情報C1とは、復号対象となるフレームが消失フレームか否かを示す情報のことである。なお、復号対象となるパケットが消失パケットである場合は、このパケットが含む全フレームが消失フレームとなる。
コア復号器102は、パケット分解部101から出力されるフレーム消失情報C1と符号化情報S1とを用いて、コアレイヤの復号処理を行い、コアレイヤの復号信号(狭帯域信号)S3を出力する。コアレイヤの復号処理の具体的内容は、例えば、CELPモデルに基づく復号処理であっても良いし、波形符号化に基づく復号処理であっても良いし、MDCT等を用いた変換符号化モデルの復号処理であっても良い。また、コア復号器102は、コアレイヤの復号処理において得られる情報の一部または全て(S4)を拡張復号器105へ出力する。拡張復号器105へ出力された情報は、拡張レイヤの復号処理に用いられる。さらに、コア復号器102は、コアレイヤの復号処理において得られる信号S6をアップサンプル処理部103へ出力する。アップサンプル処理部103へ出力する信号S6は、コアレイヤの復号信号そのものであってもよいし、コアレイヤの符号化モデルによっては部分的な復号パラメータ(例えば、スペクトルパラメータや音源パラメータ)であっても良い。
アップサンプル処理部103は、コア復号器102から出力される、復号信号または復号処理過程で得られる一部の復号パラメータもしくは復号信号に対し、ナイキスト周波数を上げる処理を行う。このアップサンプリングされた信号S7は、拡張復号器105へ出力される。なお、このアップサンプリング処理は、時間軸上での処理に限定されず、スケーラブル符号化のアルゴリズムによっては、アップサンプル処理後の信号を拡張音源復号器122に出力して、拡張音源復号時に利用する構成としても良い。
一方、拡張符号パケット用のパケット分解部104は、パケット網を介し入力された拡張レイヤの符号化情報が乗っている拡張符号パケットから、拡張レイヤの符号化情報を取り出し、拡張復号器105へ出力(S2)すると共に、フレーム消失情報C2を拡張復号器105および切り替えスイッチ107へ出力する。
拡張復号器105は、パケット分解部104から出力されるフレーム消失情報C2および符号化情報S2と、コア復号器102から出力されるコアレイヤの復号信号S3およびコアレイヤの符号化処理過程で得られた情報S4と、アップサンプル処理部103から出力されるコアレイヤの復号信号をアップサンプルした信号S7と、を用いて拡張レイヤの復号処理を行い、拡張レイヤの復号信号(広帯域信号)を得て、HPF106および加算器108へ出力する(S8、S9)。なお、加算器108へ出力される信号S8とHPF106へ出力される信号S9は同一でなくても良い。例えば、拡張復号器105は、アップサンプル処理部103から出力された信号S7をそのまま加算器108に出力しても良いし、フレーム消失情報C2を参照して条件的に切り替えても良い。
HPF106は、拡張復号器105から入力された復号信号S9の高域成分(コアレイヤの狭帯域復号信号に含まれない帯域成分)のみを通過させ、切り替えスイッチ107へ出力する。
切り替えスイッチ(SW)107は、HPF106から出力される信号の加算器108への出力のオン/オフを切り換える。スイッチのオン/オフは、コア符号パケット用のパケット分解部101と拡張符号パケット用のパケット分解部104とからそれぞれ出力されるフレーム消失情報を参照することにより行われる。具体的には、コアレイヤも拡張レイヤもフレーム消失になっていない(正常フレームである)場合は、スイッチを開放してオフとする。また、コアレイヤのみ正常フレームで拡張レイヤは消失フレームである場合は、スイッチを閉じてオンとする。さらに、コアレイヤも拡張レイヤも消失フレームである場合は、スイッチを開放してオフとする。
加算器108は、拡張復号器105から直接入力されるフルバンドの音響信号と拡張復号器105からHPF106を介して入力される高帯域復号信号とを加算し、加算結果を広帯域信号として出力する。
図2は、上記のコア復号器102内部の主要な構成を示すブロック図である。
このコア復号器102は、パラメータ復号部111、コア線形予測係数(LPC)復号器112、コア音源復号器113、および合成フィルタ114を備える。
パラメータ復号部111は、パケット分解部101から出力されたコアレイヤの符号化情報(ビットストリーム)S1を、LPCパラメータ符号化データ(LSPのコード等を含む)および音源パラメータ符号化データ(ピッチラグのコード、固定音源符号帳のコード、ゲインコード等を含む)に分離し、各々のデータを各種コードにまで復号し、コア(レイヤ)LPC復号器112およびコア音源復号器113にそれぞれ出力する。
コアLPC復号器112は、パラメータ復号部111から出力されたLPCパラメータのコードを復号し、復号LPCを合成フィルタ114および拡張復号器105へ出力する。復号処理の具体的な内容は、例えば、ベクトル量子化を用いて符号化されたLSPパラメータを復号してからLPCパラメータに変換する。なお、コア符号パケット用のパケット分解部101から出力したフレーム消失情報C1が、現フレームは消失フレームであることを示していたら、コアLPC復号器112は、フレーム消失補償処理を用いてLPCパラメータの隠蔽処理を行い、隠蔽処理によって生成されたLPC(補償信号)を復号LPCとして出力する。
コア音源復号器113は、パラメータ復号部111から出力された音源パラメータの各種コード(ピッチラグ、固定符号帳、ゲイン符号帳等のコード)に対して復号処理を施し、復号音源信号を合成フィルタ114およびアップサンプル処理部103へ出力する(S6)。また、コア音源復号器113は、この復号処理によって復号された一部または全ての情報S3を拡張復号器105へ出力する。具体的には、ピッチラグ情報とパルス駆動信号(固定符号帳音源情報)等がコア音源復号器113から拡張復号器105へ出力される。なお、コア符号パケット用のパケット分解部101から入力されたフレーム消失情報C1が、現フレームは消失フレームであることを示していたら、コア音源復号器113は、フレーム消失補償処理を用いて音源パラメータの隠蔽処理を行い、隠蔽処理によって生成された補償音源信号を復号音源信号として出力する。
合成フィルタ114は、コアLPC復号器112から出力された復号LPCで構成された線形予測フィルタを、コア音源復号器113から出力された復号音源信号で駆動して、狭帯域信号S5を出力する。
図3は、拡張復号器105内部の主要な構成を示すブロック図である。
この拡張復号器105は、パラメータ復号部121、拡張音源復号器122、2つの切り替えスイッチ(123、126)、2つの合成フィルタ(124、128)、LPC変換部125、および拡張LPC復号器127を備える。
パラメータ復号部121は、パケット分解部104から拡張レイヤの符号化情報S2が入力され、LPCパラメータ符号化データ(LSPコード等を含む)と、音源パラメータ符号化データ(ピッチラグコード、固定符号帳インデックスコード、ゲインコード等を含む)とに分離し、各種パラメータのコードに復号し、拡張LPC復号器127および拡張音源復号器122にそれぞれ出力する。
拡張LPC復号器127は、コア復号器102内のコアLPC復号器112から入力された復号コアLPCパラメータS4と、パラメータ復号部111から入力された拡張レイヤLPCパラメータコードと、を用いて広帯域信号を再合成するためのLPCパラメータを復号し、2つの合成フィルタに出力する(合成フィルタ124へは切り替えスイッチ126を介して出力する)。具体的には、コアLPC復号器112から入力した復号LSP(狭帯域LSP)から拡張LSP(広帯域LSP)を予測するモデルを用いる。この場合、拡張LPC復号器127は、狭帯域LSPから予測された広帯域LSPの予測誤差の復号処理(例えばMA予測ベクトル量子化などを用いて符号化されている)を行い、それを狭帯域LSPから予測された広帯域LSPに加算して最終的な広帯域LSPを復号し、最後にLPCに変換する、といった一連の処理を行う。
なお、拡張符号パケット用パケット分解部から入力したフレーム消失情報が、現フレームは消失フレームであることを示していたら、拡張LPC復号器127は、フレーム消失補償処理を用いてLPCパラメータの隠蔽処理を行い、隠蔽処理によって生成された補償LPCを復号LPCとして出力する。また、復号処理は他の方法であっても良い。
LPC変換部125は、狭帯域LPCパラメータS4を広帯域LPCパラメータへ変換する。このアップサンプルの方法としては、狭帯域LSPから得られるLPC合成フィルタのインパルス応答をアップサンプルし、アップサンプルしたインパルス応答から自己相関を求め、求めた自己相関係数を所望の次数のLSPに変換する方法等が挙げられるが、これに限定されるものではない。自己相関係数RiとLPCパラメータaiの間の変換は両者に下記の(式1)の関係があることを用いれば実現できる。
変換されたLPCパラメータは切り替えスイッチ126を介して合成フィルタ124に出力される。なお、図示していないが、変換されたLPCパラメータを用いて拡張LPCの復号を行うような符号化モデルを用いている場合は、変換されたLPCを拡張LPC復号器127にも出力するようにする。
拡張音源復号器122には、パラメータ復号部121から拡張音源パラメータの各種コード情報が入力され、コア音源復号器113からコア音源パラメータの復号情報、復号コア音源信号等のコア音源復号処理で得られる情報が入力される。拡張音源復号器122は、拡張音源(広帯域音源)信号の復号処理を行い、復号信号を合成フィルタ124および合成フィルタ128へ出力する(ただし、合成フィルタ124への出力は、スイッチ123を経由して行われる)。
例えば、拡張音源復号器122がCELP方式の復号化処理を行う場合、この処理には、ピッチラグの復号処理、適応符号帳成分の復号処理、固定符号帳成分の復号処理、ゲインパラメータの復号処理等が含まれる。
ピッチラグの復号処理は、例えば、次のように行われる。拡張音源用のピッチラグは、コア音源復号器113から入力されたピッチラグ情報を基にして差分量子化されているので、拡張音源復号器122は、サンプリング周波数を2倍にする拡張であればコア音源用ピッチラグを2倍にすることによってコア音源用ピッチラグを拡張音源用ピッチラグに変換し、一方、差分量子化されたピッチラグ(デルタラグ)を復号する。そして、拡張音源復号器122は、拡張音源用に変換されたピッチラグと、復号によって得られたデルタラグとの和を拡張音源用復号ピッチラグとする。
適応符号帳成分の復号処理では、例えば、拡張音源復号器122用の適応符号帳、すなわち過去に拡張音源復号器122から生成された音源信号のバッファを用いて拡張音源復号器122は適応符号帳成分を生成し、これを復号する。
固定符号帳成分の復号処理では、例えば、コア音源復号器113から入力された固定符号帳のサンプリングレート変換後のものを拡張音源復号器122は拡張音源復号処理における固定符号帳の一成分として利用する。また、拡張音源復号器122は、拡張音源符号帳内に固定符号帳を別途備えていて、復号処理をすることによって追加の固定符号帳成分を復号する。復号された適応符号帳成分と固定符号帳成分とのそれぞれに、復号されたゲインパラメータを乗じて足し合わせることによって復号音源信号が得られる。
なお、拡張符号パケット用パケット分解部から入力されたフレーム消失情報が、現フレームは消失フレームであることを示していたら、拡張音源復号器122は、フレーム消失補償処理を用いて音源パラメータの隠蔽処理を行い、隠蔽処理によって生成された補償音源信号を復号音源信号として出力する。
切り替えスイッチ123は、アップサンプル処理部103または拡張音源復号器122のいずれか一方と合成フィルタ124とを接続する切り替えスイッチで、コア符号パケット用パケット分解部101から入力されるフレーム消失情報C1と、拡張符号パケット用パケット分解部104から入力されるフレーム消失情報C2と、に基づいて切り替えられる。具体的には、コアレイヤが正常フレームで拡張レイヤが消失フレームである場合、合成フィルタ124の入力端子はアップサンプル処理部103の出力端子に接続され、それ以外の場合には、合成フィルタ124の入力端子は拡張音源復号器122の出力端子に接続される。
切り替えスイッチ126は、LPC変換部125または拡張LPC復号器127のいずれか一方と合成フィルタ124の第2の入力端子とを接続する切り替えスイッチで、コア符号パケット用パケット分解部101から入力されるフレーム消失情報C1と、拡張符号パケット用パケット分解部104から入力されるフレーム消失情報C2と、に基づいて切り替えられる。具体的には、コアレイヤが正常フレームで拡張レイヤが消失フレームである場合、合成フィルタ124の第2の入力端子はLPC変換部125の出力端子に接続され、それ以外の場合には、合成フィルタ124の第2の入力端子は拡張LPC復号器127の出力端子に接続される。
合成フィルタ124は、拡張LPC復号器127またはLPC変換部125から、スイッチ126を介してフィルタ係数が入力され、これらのフィルタ係数を用いて合成フィルタが構成される。構成された合成フィルタは、拡張音源復号器122またはアップサンプル処理部103からスイッチ123を介して入力される音源信号で駆動され、出力信号S8は加算器へ出力される。なお、コアレイヤのフレームが消失しない限り、合成フィルタ124は、誤りのない信号を生成し続ける。
合成フィルタ128は、拡張LPC復号器127から入力されるフィルタ係数で合成フィルタを構成し、拡張音源復号器122から入力される復号音源信号で駆動され、出力信号S9を高域通過フィルタ106へ出力する。なお、合成フィルタ128は、フレーム消失の有無に関わらず常に広帯域の復号信号を生成する。
HPF106は、コア復号器102の復号信号の帯域を遮断するフィルタで、合成フィルタ128の出力信号を入力し、高域成分(拡張レイヤで拡張される帯域)のみを通過してスイッチ107へ出力する。高域通過フィルタは、直線位相特性を有することが望ましいが、それに限定するものではない。
切り替えスイッチ107は、加算器への信号の入力をON/OFFするスイッチで、コア符号パケット用パケット分解部から入力されるフレーム消失情報と、拡張符号パケット用パケット分解部から入力されるフレーム消失情報と、に基づいて切り替えられる。具体的には、コアレイヤは正常フレームで拡張レイヤは消失フレームである場合には、スイッチが閉じられて、HPF106の出力が加算器へ入力される。それ以外の場合には、切り替えスイッチ107は開放され、HPF106の出力は加算器へ入力されない。
加算器108は、合成フィルタ124から出力される復号信号と、切り替えスイッチ107から入力される高域成分のみを有する復号信号と、を加算して最終的な広帯域復号信号として出力する。
合成フィルタ128は、拡張レイヤでフレーム消失が発生したとき、すなわち、合成フィルタ124の出力信号の帯域幅が狭まったときは、HPF106で取り出された高域成分の信号と、合成フィルタ124で生成された狭帯域の復号信号とが加算され、出力される。その結果、常に広帯域の復号信号が得られる。すなわち、復号信号の帯域幅が変化することによる主観的違和感の発生を防止することができる。また、低域成分については拡張レイヤの情報が失われても影響を受けないので、高品質な広帯域信号を生成できる。人間の聴覚的に信号の低域成分は重要であると共に、CELP方式の符号化/復号化では低域成分(ピッチ周期)がずれることによる品質劣化が大きいので、低域成分がエラーフリーの状況になっていれば、高域成分に誤りが混入していても主観的品質の劣化を少なくすることが可能であるからである。
なお、コアレイヤがビットレートスケーラブル復号器となっている場合は、コア符号用パケットをビットレートスケーラブル構成の階層数に分割することができる。この場合、コア符号用パケット分解部も階層数に応じて用意する。ビットレートスケーラブル符号化情報のコアレイヤ(ビットレートスケーラブルコア)以外の情報がパケット網内で失われた場合、図1におけるコア復号器102から出力される各種情報は、コア復号器102のビットレートスケーラブルコアの復号処理のみによって得られるものとする。また、ビットレートスケーラブルコア以外のビットレートスケーラブル拡張レイヤの一部の拡張レイヤのみが失われている場合は、ビットレートスケーラブルコアと正常に受信したビットレートスケーラブル拡張レイヤの一部の情報を利用してコア復号化器の復号処理を行っても良い。
図4および図5は、以上説明した拡張復号器105内部における信号の流れを整理した図である。図4は、フレーム消失がない場合、すなわち、正常時の信号の流れを示した図、図5は、拡張レイヤのフレームが消失した場合の信号の流れを示した図である。なお、図中において、NB信号は狭帯域信号を、WB信号は広帯域信号を指している。
次いで、上記構成を有するスケーラブル復号化装置の復号処理の概要について、図6に示す信号図を用いて説明する。なお、この図は、第nフレームにおいてフレーム消失が起こった場合を示している。
破線で示した信号S101は、フレーム消失がなかった場合の信号を示している。しかし、伝送路上でこの信号の高帯域(拡張レイヤ)パケットを消失すると、実際に受信される信号は低域パケットのみとなる。そこで、本実施の形態では、この低域パケットの信号にアップサンプル処理等を施すことにより、サンプリングレートは広帯域であって低域成分のみが残った信号S102(実線の信号)を生成する。一方、第n−1フレームの信号S103に基づいて、隠蔽処理によって補償信号S104を生成する。この信号S104をHPFに通すことにより、高域成分のみを取り出すと信号S105となる。加算部108において、低域成分のみが残っている信号S101と高域成分のみが残っている信号S105とを加算することにより、復号信号S106が得られる。
このように、本実施の形態によれば、正常に受信したエラーフリーの(エラーのない)低域成分であるコアレイヤの符号化情報を用いて得られる信号をアップサンプリングして信号を生成し、この信号に、拡張レイヤで誤り隠蔽処理を用いて生成した全帯域の信号の高域成分のみを取り出した信号を加算して、全帯域復号信号を得る。
この構成を採ることにより、帯域スケーラブル音響符号化情報のコアレイヤ以外の符号化情報が失われた場合であっても、コアレイヤのサポートする音響信号帯域だけでなく、拡張レイヤのサポートする音響信号帯域を常に生成することができる。
また、コアレイヤの符号化情報のみから得られる復号信号は、サンプリングレートは広帯域復号信号のままで変化しないが、合成フィルタの出力信号の帯域幅が拡張レイヤの誤り状況によって狭まったり広がったりする。すなわち、拡張レイヤのフレームが消失した場合は、復号信号の帯域幅が狭まる。しかし、本実施の形態によれば、復号音響信号の帯域幅が短時間のうちに変化することを防ぎ、不快感や違和感が復号音響信号に生じないようにすることができる。しかも、低域成分の品質は低下しない。
帯域スケーラブル音響復号化において、パケット網でパケット転送の優先制御が行われている場合、拡張レイヤの符号化データのみが消失すると、復号器側で復号信号の帯域幅が変化し、聴感上不快と感じる場合がある。エラーフリーの状態で復号したコアレイヤの復号信号に、フレーム消失隠蔽処理を用いて復号した拡張レイヤの復号信号の高域成分を加算することにより、復号信号の帯域幅が時間的に変化することを回避し、聴感上安定した品質を復号器側で得ることが可能となる。
また、コアレイヤの復号情報を活用して拡張レイヤの符号化/復号化およびフレーム消失隠蔽処理を適応的に切り替える構成としたので、拡張レイヤの情報が失われても、コアレイヤの情報を正常に受信していれば、高品質な復号信号を得ることが可能となる。
さらに、パケット網での優先制御を有効に利用し、高品質な音響通信品質を実現できる。
なお、本実施の形態では、拡張レイヤが1層である場合を例にとって説明したが、拡張レイヤの数は2以上(出力する周波数帯域の種類が2種類以上)であっても良い。
また、コアレイヤがさらにビットレートスケーラビリティを有する階層構造(スケーラブル符号化器/スケーラブル復号器)を持っていても良い。
また、各周波数帯域を出力する符号化/復号化のアルゴリズムが、ビットレートスケーラビリティを有する階層構造を持っていても良い。
また、拡張復号器105は、MDCTベースのものであっても良い。図7は、拡張復号器105がMDCTベースである場合のアップサンプル処理部103aの構成を示したブロック図である。
このアップサンプル処理部103aは、MDCT部131および次数拡張部132を備える。
コア復号器102は、コア復号信号を狭帯域復号信号として出力すると共に、MDCT部131へも出力する。これは、図1に示したコア復号器102の2つの出力信号(S3、S4)が同一である場合に相当する。また、コアレイヤの復号過程において得られた情報の一部または全てを拡張復号器105に出力する。
MDCT部131は、コア復号器102から出力された狭帯域復号信号に対して変形離散余弦変換(MDCT)処理を行って、得られるMDCT係数を次数拡張部132へ出力する。
次数拡張部132は、MDCT部131から出力されたMDCT係数の次数を零詰めによって拡張する(ただし、2倍にアップサンプルする場合は、MDCT次数を2倍にし、増やした部分は0の係数で埋める)。拡張されたMDCT係数は拡張復号器105へ出力される。
拡張復号器105は、次数拡張部132から出力されたMDCT係数を逆変形離散コサイン変換することによって拡張レイヤの復号信号を生成する。また、拡張復号器105は、隠蔽処理を行う場合は、次数拡張部132の出力するMDCT係数に、隠蔽処理によって生成された拡張情報を加え、これにより生成されたMDCT係数を逆変形離散コサイン変換することによって、拡張レイヤの復号信号を生成する。
(実施の形態2)
図8は、本発明の実施の形態2に係るスケーラブル復号化装置の主要な構成を示すブロック図である。なお、このスケーラブル復号化装置は、実施の形態1に示したスケーラブル復号化装置と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
図8は、本発明の実施の形態2に係るスケーラブル復号化装置の主要な構成を示すブロック図である。なお、このスケーラブル復号化装置は、実施の形態1に示したスケーラブル復号化装置と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態に係るスケーラブル復号化装置は、モード判定部201を備え、モード判定部201への入出力インタフェースを有するコア復号器102および拡張復号器105の動作が実施の形態1と異なる。
次いで、上記構成を有するスケーラブル復号化装置の動作について説明する。
コア復号器102は、パケット分解部101から入力されるフレーム消失情報C1と符号化情報S1を用いてコアレイヤの復号処理を行い、コアレイヤの復号信号(狭帯域信号)S6として出力する。また、コアレイヤの復号処理において得られる情報の一部または全てを拡張復号器105へ出力する。拡張復号器105へ出力された情報は拡張レイヤの復号処理に用いられる。さらに、コアレイヤの復号処理において得られる信号をアップサンプル処理部103およびモード判定部へ出力する。アップサンプル処理部103へ出力する信号は、コアレイヤの復号信号そのものであっても良いし、コアレイヤの符号化モデルによっては部分的な復号パラメータであっても良い。モード判定部へ出力される情報は、線形予測係数、ピッチ予測利得、ピッチラグ、ピッチ周期、信号エネルギ、零交差率、反射係数、対数断面積比、LSPパラメータ、正規化線形予測残差パワ等の一般に音声信号の状態(無音、有声定常部、雑音性子音部、立ち上がり、過渡部等)を分類するのに使われるパラメータである。
モード判定部201は、コア復号器102から入力した各種情報を用いて、復号中の信号の分類(例えば、雑音性子音部、有声定常部、立ち上がり部、有声過渡部、無音部、音楽信号等)を行い、この分類結果を拡張復号器105へ出力する。ただし、分類は、この例に限定されない。
拡張復号器105は、パケット分解部104から出力されるフレーム消失情報と符号化情報と、コア復号器102から出力されるコアレイヤの符号化処理過程で得られた情報と、アップサンプル処理部103から入力されるコアレイヤの復号信号をアップサンプルしたものと、を用いて拡張レイヤの復号化処理を行う。なお、モード判定部から入力したモード情報を用いて、そのモードに適した符号化モデルを選択的に使用するような拡張符号化器(図示せず)によって拡張レイヤの符号化処理が行われている場合は、復号化処理も同様の処理を行う。
このようにコアレイヤで現在の音響信号の状況を判定し、拡張レイヤの符号化モデルを適応的に切り替える構成とすれば、より高品質な符号化/復号化を実現できる。
復号信号は、拡張レイヤの復号信号(広帯域信号)としてHPF106および加算器108へ出力される。なお、加算器108へ出力される信号とHPF106へ出力される信号は同じものでなくても良い。例えば、加算器108にはアップサンプル処理部103から入力された信号をそのまま出力しても良い。また、フレーム消失情報を参照して加算器108へ出力する信号を条件的に切り替える(例えば、アップサンプル処理部103から入力された信号と、拡張復号器105内で行われる復号処理によって生成される信号と、を切り替える)ようにしても良い。
また、フレーム消失情報が現フレームは消失フレームであることを示していた場合、拡張復号器105はフレーム消失隠蔽処理を行う。この場合、モード判定部から音響信号のモードを示す情報が入力されているので、そのモードに適した隠蔽処理を行う。隠蔽処理を用いて生成された広帯域信号は、HPF106とスイッチを経由して加算器へ出力される。HPF106は時間領域のディジタルフィルタで実現可能だが、MDCT等の直行変換を用いて周波数領域へ変換し、高域成分のみを残して逆変換によって時間領域に戻すような処理を利用しても良い。
コアLPC復号器112は、LPCの復号処理過程で得られる音響パラメータもしくは復号したLPCから得られる音響パラメータ(例えば、反射係数、対数断面積比、LSP、正規化線型予測残差パワ等)をモード判定部に出力する。
コア音源復号器113は、音源復号過程で得られる音響パラメータもしくは復号した音源信号から得られる音響パラメータ(例えば、ピッチラグ、ピッチ周期、ピッチゲイン、ピッチ予測ゲイン、音源信号エネルギ、音源信号零交差率、など)をモード判定部201に出力する。
なお、図示していないが、合成フィルタから出力される狭帯域復号信号の零交差率やエネルギ情報等を分析する分析部を設けて、これらのパラメータをモード判定部に入力するようにするとさらに良い。
モード判定部201は、コアLPC復号器112およびコア音源復号器113等から各種音響パラメータ(LSP、LPC、反射係数、対数断面積比、正規化線型予測残差パワ、ピッチラグ、ピッチ周期、ピッチゲイン、ピッチ予測ゲイン、音源信号エネルギ、音源信号零交差率、合成信号エネルギ、合成信号零交差率等)を入力し、音響信号のモード分類(無音部、雑音性子音部、有声定常部、立ち上がり部、有声過渡部、語尾、音楽信号等)を行い、分類結果を拡張LPC復号器127および拡張音源復号器122にそれぞれ出力する。なお、図示していないが、拡張復号器105がポストフィルタのような後処理部を備える場合は、この後処理部にも上記モード分類情報を出力しても良い。
拡張LPC復号器127は、モード判定部201から入力された音響信号の各種モードに応じて復号処理を切り替えても良い。この場合、拡張LPC符号器(図示せず)においても同様の符号化モデルの切り替え処理が行われていることを前提とする。また、拡張レイヤでフレーム消失が生じている場合は、上記モードに対応するフレーム消失隠蔽処理を行って、復号拡張LPCを生成する。
拡張音源復号器122は、モード判定部201から入力された音響信号の各種モードに応じて復号処理を切り替えても良い。この場合、拡張音源符号器(図示せず)においても同様の符号化モデルが切り替えられていることが前提である。また、拡張レイヤでフレーム消失が生じている場合は、上記モードに対応するフレーム消失隠蔽処理を行って、復号拡張音源信号を生成する。
(実施の形態3)
図9は、実施の形態1または2に示したスケーラブル復号化装置を移動体通信システムに適用した場合の移動局装置および基地局装置の主要な構成を示すブロック図である。
図9は、実施の形態1または2に示したスケーラブル復号化装置を移動体通信システムに適用した場合の移動局装置および基地局装置の主要な構成を示すブロック図である。
この移動体通信システムは、音声信号送信装置300および音声信号受信装置310を備える。なお、音声信号受信装置310に実施の形態1または2に示したスケーラブル復号化装置が搭載されている。
音声信号送信装置300は、入力装置301、A/D変換装置302、音声符号化装置303、信号処理装置304、RF変調装置305、送信装置306及びアンテナ307を有している。
A/D変換装置302の入力端子は、入力装置301の出力端子に接続されている。音声符号化装置303の入力端子は、A/D変換装置302の出力端子に接続されている。信号処理装置304の入力端子は、音声符号化装置303の出力端子に接続されている。RF変調装置305の入力端子は、信号処理装置304の出力端子に接続されている。送信装置306の入力端子は、RF変調装置305の出力端子に接続されている。アンテナ307は、送信装置306の出力端子に接続されている。
入力装置301は、音声信号を受けてこれを電気信号であるアナログ音声信号に変換し、A/D変換装置302に与える。A/D変換装置302は、入力装置301からのアナログの音声信号をディジタル音声信号に変換し、これを音声符号化装置303へ与える。音声符号化装置303は、A/D変換装置302からのディジタル音声信号を符号化して音声符号化ビット列を生成し信号処理装置304に与える。信号処理装置304は、音声符号化装置303からの音声符号化ビット列にチャネル符号化処理やパケット化処理及び送信バッファ処理等を行った後、その音声符号化ビット列をRF変調装置305に与える。RF変調装置305は、信号処理装置304からのチャネル符号化処理等が行われた音声符号化ビット列の信号を変調して送信装置306に与える。送信装置306は、RF変調装置305からの変調された音声符号化信号をアンテナ307を介して電波(RF信号)として送出する。
音声信号送信装置300においては、A/D変換装置302を介して得られるディジタル音声信号に対して数十msのフレーム単位で処理が行われる。システムを構成するネットワークがパケット網である場合には、1フレーム又は数フレームの符号化データを1つのパケットに入れこのパケットをパケット網に送出する。なお、上記ネットワークが回線交換網の場合には、パケット化処理や送信バッファ処理は不要である。
音声信号受信装置310は、アンテナ311、受信装置312、RF復調装置313、信号処理装置314、音声復号化装置315、D/A変換装置316及び出力装置317を有している。
受信装置312の入力端子は、アンテナ311に接続されている。RF復調装置313の入力端子は、受信装置312の出力端子に接続されている。信号処理装置314の入力端子は、RF復調装置313の出力端子に接続されている。音声復号化装置315の入力端子は、信号処理装置314の出力端子に接続されている。D/A変換装置316の入力端子は、音声復号化装置315の出力端子に接続されている。出力装置317の入力端子は、D/A変換装置316の出力端子に接続されている。
受信装置312は、アンテナ311を介して音声符号化情報を含んでいる電波(RF信号)を受けてアナログの電気信号である受信音声符号化信号を生成し、これをRF復調装置313に与える。アンテナ311を介して受けた電波(RF信号)は、伝送路において信号の減衰や雑音の重畳がなければ、音声信号送信装置300において送出された電波(RF信号)と全く同じものになる。
RF復調装置313は、受信装置312からの受信音声符号化信号を復調し信号処理装置314に与える。信号処理装置314は、RF復調装置313からの受信音声符号化信号のジッタ吸収バッファリング処理、パケット組みたて処理およびチャネル復号化処理等を行い、受信音声符号化ビット列を音声復号化装置315に与える。音声復号化装置315は、信号処理装置314からの受信音声符号化ビット列の復号化処理を行って復号音声信号を生成しD/A変換装置316へ与える。D/A変換装置316は、音声復号化装置315からのディジタル復号音声信号をアナログ復号音声信号に変換して出力装置317に与える。出力装置317は、D/A変換装置316からのアナログ復号音声信号を空気の振動に変換し音波として人間の耳に聞こえる様に出力する。
これにより、実施の形態1または2と同様の作用効果を有する移動局装置(通信端末装置)を提供することができる。
また、本発明に係るスケーラブル復号化装置は、上記各実施の形態に限定されず、種々変更して実施することが可能である。例えば、実施の形態1および2は、適宜組み合わせて実施することが可能である。
図10は、実施の形態1および2を組み合わせた場合のスケーラブル復号化装置の主要な構成を示すブロック図である。
コア復号器102は、復号処理過程で得られる音響パラメータもしくは復号信号を分析して得られる音響パラメータをモード判定部201に出力する。音響パラメータとしては、前述のような各種パラメータ全てが例としてあげられる。このような構成は、拡張復号器105がMDCTを用いた符号化アルゴリズムを利用している場合に有効である。
以上、本発明の様々な実施の形態について説明した。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。例えば、本発明に係る拡張レイヤ消失隠蔽方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るスケーラブル復号化装置と同様の機能を実現することができる。
また、LSPの余弦をとったもの、すなわち、LSPをL(i)とした場合のcos(L(i))を特にLSF(Line Spectral Frequency)と呼び、LSPと区別する場合もあるが、本明細書では、LSFはLSPの一形態であり、LSPにLSFは含まれるものとしてLSPという用語を用いている。すなわち、LSPをLSFと読み替えても良い。
また、上記各実施の形態では、コアレイヤは最も狭帯域の信号の符号化/復号化を行うレイヤであるとして説明したが、ある帯域の信号を符号化/復号化するレイヤXとそれよりも広い帯域の信号を符号化/復号化するレイヤYとがあった場合、Xをコアレイヤ、Yを拡張レイヤとして、本発明の内容を適用することも可能である。この場合、レイヤXは必ずしも最も狭帯域の信号の符号化/復号化を行うレイヤである必要はなく、レイヤX自体が複数のレイヤから成るスケーラブル構造となっていても良い。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されていても良いし、一部または全てを含むように1チップ化されていても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてあり得る。
本明細書は、2004年4月30日出願の特願2004−136280に基づく。この内容はすべてここに含めておく。
本発明に係るスケーラブル復号化装置および拡張レイヤ消失隠蔽方法は、移動体通信システムにおける通信端末装置等の用途に適用できる。
本発明は、拡張レイヤを消失した場合に隠蔽処理を行うスケーラブル復号化装置および当該装置で使用される拡張レイヤ消失隠蔽方法に関する。
インターネット通信に代表されるパケット通信においては、伝送路上でパケット損失が発生することがあるため、伝送情報の一部が消失しても、残る情報から復号処理を可能とするいわゆるスケーラブル符号化機能が望まれる。このスケーラブル符号化には、周波数帯域は変えずに、符号化対象の信号のビットレートのみにスケーラビリティを持たせるものと、符号化対象の信号の周波数帯域(周波数軸方向)にスケーラビリティを持たせて符号化するものとが存在する(例えば、非特許文献1参照)。特に、後者の周波数帯域にスケーラビリティを持たせて符号化する方式を帯域スケーラブル符号化と呼ぶことにする。
従来の音声通信では、電話帯域(300Hz〜3.4kHz)の狭帯域信号が用いられてきたが、近年、広帯域(50Hz〜7kHz)の信号を符号化する方式等も標準化され(例えば、非特許文献2参照)、将来の高品質音声通信への利用が期待されている。
一方、今後ネットワークのオールIP化が進むにつれ、電話帯域の音声信号用の端末と広帯域音声用の端末とが同一のネットワーク内に混在することが予想される。また、現在の電話会議サービスに見られるような多地点間通信も普及すると言われている。このような状況を考えると、一つの符号化方式で、電話帯域の音声信号と広帯域の音声信号との双方を符号化/復号化できるスケーラブル符号化方式の有効性が高いと考えられる。
これまでにも、音声信号に限らず、さらに広帯域な音響信号に対するスケーラブル符号化方式が開示されている(例えば、特許文献1、2参照)。このようなスケーラブル符号化は、符号化対象となる音響信号を階層的に符号化するため、DiffServ(Differentiated Services)のようなネットワーク上での優先制御を用いてコア(基本レイヤ)の情報を優先的に伝送する。そして、伝送路の状況によっては、より上位の拡張レイヤの情報から順に廃棄を行う。これにより、通信ネットワーク内でコア情報が破棄される確率を低く抑え、パケット損失によって一部の符号化情報が失われても通話品質の劣化を抑えることができる。
一方、伝送路上で符号化情報が失われ、復号器側で符号化情報を受信できない場合、このデータ消失の隠蔽(補償)処理を行うことが一般的である。例えば、特許文献3には、ITU−T勧告G.729のフレーム消失隠蔽処理が開示されている。特許文献3に開示されているように、過去に復号した情報を用いて外挿的に消失フレームの隠蔽処理を行うことが標準的である。
特開平08−263096号公報
特開2002−100994号公報
特開平09−120297号公報
T. Nomura et al,"A Bitrateand Bandwidth Scalable CELP Coder,"IEEE Proc. ICASSP98, pp.341-344, 1998
3GPP規格、TS26.190
しかしながら、スケーラブル符号化された信号の伝送において、拡張レイヤの信号を消失した場合の復号処理については、標準的な技術が存在しない。
また、拡張レイヤの信号のみを消失した場合にコアレイヤの情報を用いて消失信号の復号化処理を行うことも考えられるが、以下のような問題がある。すなわち、上記のように、ビットレートだけでなく周波数帯域もスケーラブルな場合、コアレイヤの情報から生成された復号信号は狭帯域な信号であるのに対し、コアレイヤと拡張レイヤの双方の情報から生成された復号信号は広帯域な信号となる。よって、コアレイヤの情報のみを用いて復号処理を行った場合と、拡張レイヤまでを使用して復号処理を行った場合とでは、復号信号の周波数帯域が変化してしまうという問題がある。かかる場合、コアレイヤの符号化情報のみを用いて復号しても、局所的に信号帯域が狭小化するだけであるので、著しい品質劣化にはつながらないものの、拡張レイヤの消失率が高く、復号信号の帯域が狭帯域と広帯域とに頻繁に切り替わるような場合には、主観品質に違和感や不快感を生じる結果となる。
よって、本発明の目的は、帯域スケーラブル符号化において、拡張レイヤの信号を消失した場合でも、復号信号の帯域が頻繁に切り替わることがなく、主観品質に違和感や不快感を生じさせないスケーラブル復号化装置、および当該装置で使用される拡張レイヤ消失隠蔽方法を提供することである。
本発明のスケーラブル復号化装置は、周波数軸方向にスケーラビリティを有するコアレイヤと拡張レイヤとからなる符号化情報から、広帯域の復号信号を得るスケーラブル復号化装置であって、コアレイヤの符号化情報から狭帯域のコアレイヤ復号信号を得るコアレイヤ復号化手段と、前記狭帯域のコアレイヤ復号信号の周波数帯域を広帯域に変換し、第1信号を得る変換手段と、コアレイヤが存在し拡張レイヤが消失された符号化情報に対し、過去に得られた復号信号に基づいて広帯域の補償信号を生成する補償手段と、前記広帯域の補償信号からコアレイヤに相当する周波数成分を除去し、第2信号を得る除去手段と、前記変換手段で得られた第1信号と、前記除去手段で得られた第2信号と、を加算して広帯域の復号信号を得る加算手段と、を具備する構成を採る。
本発明によれば、帯域スケーラブル符号化において、拡張レイヤの信号を消失した場合でも、復号信号の帯域が頻繁に切り替わることがなく、主観品質に違和感や不快感を生じさせないようにすることができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、ここでは、周波数帯域にスケーラビリティを持たせて階層的に入力信号の符号化/復号化が行われている状況、すなわち符号化情報が周波数軸方向にスケーラビリティを有する場合を例にとって説明する。かかる場合、コアレイヤは、最も狭帯域の信号の符号化/復号化を行うレイヤである。
(実施の形態1)
図1は、本発明の実施の形態1に係るスケーラブル復号化装置の主要な構成を示すブロック図である。
図1は、本発明の実施の形態1に係るスケーラブル復号化装置の主要な構成を示すブロック図である。
本実施の形態に係るスケーラブル復号化装置は、コア符号パケット用のパケット分解部101、コア復号器(コア復号化処理部)102、アップサンプル処理部103、拡張符号パケット用のパケット分解部104、拡張復号器(拡張復号化処理部)105、高域通過フィルタ(HPF)106、切り替えスイッチ(SW)107、および加算器108を備える。
本実施の形態に係るスケーラブル復号化装置の各部は以下の動作を行う。
コア符号パケット用のパケット分解部101は、パケット網Nを介し入力されたコアレイヤの符号化情報が載っているコア符号パケットから、コアレイヤの符号化情報を取り出してコア復号器102へ出力(S1)すると共に、フレーム消失情報C1をコア復号器102、拡張復号器105、および切り替えスイッチ107へ出力する。ここで、符号化情報とは、送信側の符号化装置(図示せず)から出力される符号化ビットストリームのことであり、フレーム消失情報C1とは、復号対象となるフレームが消失フレームか否かを示す情報のことである。なお、復号対象となるパケットが消失パケットである場合は、このパケットが含む全フレームが消失フレームとなる。
コア復号器102は、パケット分解部101から出力されるフレーム消失情報C1と符号化情報S1とを用いて、コアレイヤの復号処理を行い、コアレイヤの復号信号(狭帯域信号)S3を出力する。コアレイヤの復号処理の具体的内容は、例えば、CELPモデルに基づく復号処理であっても良いし、波形符号化に基づく復号処理であっても良いし、MDCT等を用いた変換符号化モデルの復号処理であっても良い。また、コア復号器102は、コアレイヤの復号処理において得られる情報の一部または全て(S4)を拡張復号器105へ出力する。拡張復号器105へ出力された情報は、拡張レイヤの復号処理に用いられる。さらに、コア復号器102は、コアレイヤの復号処理において得られる信号S6をアップサンプル処理部103へ出力する。アップサンプル処理部103へ出力する信号S6は、コアレイヤの復号信号そのものであってもよいし、コアレイヤの符号化モデルによっては部分的な復号パラメータ(例えば、スペクトルパラメータや音源パラメータ)であっても良い。
アップサンプル処理部103は、コア復号器102から出力される、復号信号または復号処理過程で得られる一部の復号パラメータもしくは復号信号に対し、ナイキスト周波数を上げる処理を行う。このアップサンプリングされた信号S7は、拡張復号器105へ出力される。なお、このアップサンプリング処理は、時間軸上での処理に限定されず、スケーラブル符号化のアルゴリズムによっては、アップサンプル処理後の信号を拡張音源復号器122に出力して、拡張音源復号時に利用する構成としても良い。
一方、拡張符号パケット用のパケット分解部104は、パケット網を介し入力された拡張レイヤの符号化情報が乗っている拡張符号パケットから、拡張レイヤの符号化情報を取り出し、拡張復号器105へ出力(S2)すると共に、フレーム消失情報C2を拡張復号器105および切り替えスイッチ107へ出力する。
拡張復号器105は、パケット分解部104から出力されるフレーム消失情報C2および符号化情報S2と、コア復号器102から出力されるコアレイヤの復号信号S3およびコアレイヤの符号化処理過程で得られた情報S4と、アップサンプル処理部103から出力されるコアレイヤの復号信号をアップサンプルした信号S7と、を用いて拡張レイヤの復号処理を行い、拡張レイヤの復号信号(広帯域信号)を得て、HPF106および加算器108へ出力する(S8、S9)。なお、加算器108へ出力される信号S8とHPF106へ出力される信号S9は同一でなくても良い。例えば、拡張復号器105は、アップサンプル処理部103から出力された信号S7をそのまま加算器108に出力しても良いし、フレーム消失情報C2を参照して条件的に切り替えても良い。
HPF106は、拡張復号器105から入力された復号信号S9の高域成分(コアレイヤの狭帯域復号信号に含まれない帯域成分)のみを通過させ、切り替えスイッチ107へ出力する。
切り替えスイッチ(SW)107は、HPF106から出力される信号の加算器108への出力のオン/オフを切り換える。スイッチのオン/オフは、コア符号パケット用のパケット分解部101と拡張符号パケット用のパケット分解部104とからそれぞれ出力されるフレーム消失情報を参照することにより行われる。具体的には、コアレイヤも拡張レイヤもフレーム消失になっていない(正常フレームである)場合は、スイッチを開放してオフとする。また、コアレイヤのみ正常フレームで拡張レイヤは消失フレームである場合は、スイッチを閉じてオンとする。さらに、コアレイヤも拡張レイヤも消失フレームである場合は、スイッチを開放してオフとする。
加算器108は、拡張復号器105から直接入力されるフルバンドの音響信号と拡張復号器105からHPF106を介して入力される高帯域復号信号とを加算し、加算結果を広帯域信号として出力する。
図2は、上記のコア復号器102内部の主要な構成を示すブロック図である。
このコア復号器102は、パラメータ復号部111、コア線形予測係数(LPC)復号器112、コア音源復号器113、および合成フィルタ114を備える。
パラメータ復号部111は、パケット分解部101から出力されたコアレイヤの符号化情報(ビットストリーム)S1を、LPCパラメータ符号化データ(LSPのコード等を含む)および音源パラメータ符号化データ(ピッチラグのコード、固定音源符号帳のコード、ゲインコード等を含む)に分離し、各々のデータを各種コードにまで復号し、コア(レイヤ)LPC復号器112およびコア音源復号器113にそれぞれ出力する。
コアLPC復号器112は、パラメータ復号部111から出力されたLPCパラメータのコードを復号し、復号LPCを合成フィルタ114および拡張復号器105へ出力する。復号処理の具体的な内容は、例えば、ベクトル量子化を用いて符号化されたLSPパラメータを復号してからLPCパラメータに変換する。なお、コア符号パケット用のパケット分解部101から出力したフレーム消失情報C1が、現フレームは消失フレームであることを示していたら、コアLPC復号器112は、フレーム消失補償処理を用いてLPCパラメータの隠蔽処理を行い、隠蔽処理によって生成されたLPC(補償信号)を復号LPCとして出力する。
コア音源復号器113は、パラメータ復号部111から出力された音源パラメータの各種コード(ピッチラグ、固定符号帳、ゲイン符号帳等のコード)に対して復号処理を施し、復号音源信号を合成フィルタ114およびアップサンプル処理部103へ出力する(S6)。また、コア音源復号器113は、この復号処理によって復号された一部または全ての情報S3を拡張復号器105へ出力する。具体的には、ピッチラグ情報とパルス駆動信号(固定符号帳音源情報)等がコア音源復号器113から拡張復号器105へ出力される。なお、コア符号パケット用のパケット分解部101から入力されたフレーム消失情報C1が、現フレームは消失フレームであることを示していたら、コア音源復号器113は、フレーム消失補償処理を用いて音源パラメータの隠蔽処理を行い、隠蔽処理によって生成された補償音源信号を復号音源信号として出力する。
合成フィルタ114は、コアLPC復号器112から出力された復号LPCで構成された線形予測フィルタを、コア音源復号器113から出力された復号音源信号で駆動して、狭帯域信号S5を出力する。
図3は、拡張復号器105内部の主要な構成を示すブロック図である。
この拡張復号器105は、パラメータ復号部121、拡張音源復号器122、2つの切り替えスイッチ(123、126)、2つの合成フィルタ(124、128)、LPC変換部125、および拡張LPC復号器127を備える。
パラメータ復号部121は、パケット分解部104から拡張レイヤの符号化情報S2が入力され、LPCパラメータ符号化データ(LSPコード等を含む)と、音源パラメータ符号化データ(ピッチラグコード、固定符号帳インデックスコード、ゲインコード等を含む)とに分離し、各種パラメータのコードに復号し、拡張LPC復号器127および拡張音源復号器122にそれぞれ出力する。
拡張LPC復号器127は、コア復号器102内のコアLPC復号器112から入力された復号コアLPCパラメータS4と、パラメータ復号部111から入力された拡張レイヤLPCパラメータコードと、を用いて広帯域信号を再合成するためのLPCパラメータを復号し、2つの合成フィルタに出力する(合成フィルタ124へは切り替えスイッチ126を介して出力する)。具体的には、コアLPC復号器112から入力した復号LSP(狭帯域LSP)から拡張LSP(広帯域LSP)を予測するモデルを用いる。この場合、拡張LPC復号器127は、狭帯域LSPから予測された広帯域LSPの予測誤差の復号処理(例えばMA予測ベクトル量子化などを用いて符号化されている)を行い、それを狭帯域LSPから予測された広帯域LSPに加算して最終的な広帯域LSPを復号し、最後にLPCに変換する、といった一連の処理を行う。
なお、拡張符号パケット用パケット分解部から入力したフレーム消失情報が、現フレームは消失フレームであることを示していたら、拡張LPC復号器127は、フレーム消失補償処理を用いてLPCパラメータの隠蔽処理を行い、隠蔽処理によって生成された補償LPCを復号LPCとして出力する。また、復号処理は他の方法であっても良い。
LPC変換部125は、狭帯域LPCパラメータS4を広帯域LPCパラメータへ変換する。このアップサンプルの方法としては、狭帯域LSPから得られるLPC合成フィルタのインパルス応答をアップサンプルし、アップサンプルしたインパルス応答から自己相関を求め、求めた自己相関係数を所望の次数のLSPに変換する方法等が挙げられるが、これに限定されるものではない。自己相関係数RiとLPCパラメータaiの間の変換は両者に下記の(式1)の関係があることを用いれば実現できる。
変換されたLPCパラメータは切り替えスイッチ126を介して合成フィルタ124に出力される。なお、図示していないが、変換されたLPCパラメータを用いて拡張LPCの復号を行うような符号化モデルを用いている場合は、変換されたLPCを拡張LPC復号器127にも出力するようにする。
拡張音源復号器122には、パラメータ復号部121から拡張音源パラメータの各種コード情報が入力され、コア音源復号器113からコア音源パラメータの復号情報、復号コア音源信号等のコア音源復号処理で得られる情報が入力される。拡張音源復号器122は、拡張音源(広帯域音源)信号の復号処理を行い、復号信号を合成フィルタ124および合成フィルタ128へ出力する(ただし、合成フィルタ124への出力は、スイッチ123を経由して行われる)。
例えば、拡張音源復号器122がCELP方式の復号化処理を行う場合、この処理には、ピッチラグの復号処理、適応符号帳成分の復号処理、固定符号帳成分の復号処理、ゲインパラメータの復号処理等が含まれる。
ピッチラグの復号処理は、例えば、次のように行われる。拡張音源用のピッチラグは、コア音源復号器113から入力されたピッチラグ情報を基にして差分量子化されているので、拡張音源復号器122は、サンプリング周波数を2倍にする拡張であればコア音源用ピッチラグを2倍にすることによってコア音源用ピッチラグを拡張音源用ピッチラグに変換し、一方、差分量子化されたピッチラグ(デルタラグ)を復号する。そして、拡張音源復号器122は、拡張音源用に変換されたピッチラグと、復号によって得られたデルタラグとの和を拡張音源用復号ピッチラグとする。
適応符号帳成分の復号処理では、例えば、拡張音源復号器122用の適応符号帳、すなわち過去に拡張音源復号器122から生成された音源信号のバッファを用いて拡張音源復号器122は適応符号帳成分を生成し、これを復号する。
固定符号帳成分の復号処理では、例えば、コア音源復号器113から入力された固定符号帳のサンプリングレート変換後のものを拡張音源復号器122は拡張音源復号処理における固定符号帳の一成分として利用する。また、拡張音源復号器122は、拡張音源符号帳内に固定符号帳を別途備えていて、復号処理をすることによって追加の固定符号帳成分を復号する。復号された適応符号帳成分と固定符号帳成分とのそれぞれに、復号されたゲインパラメータを乗じて足し合わせることによって復号音源信号が得られる。
なお、拡張符号パケット用パケット分解部から入力されたフレーム消失情報が、現フレームは消失フレームであることを示していたら、拡張音源復号器122は、フレーム消失補償処理を用いて音源パラメータの隠蔽処理を行い、隠蔽処理によって生成された補償音源信号を復号音源信号として出力する。
切り替えスイッチ123は、アップサンプル処理部103または拡張音源復号器122のいずれか一方と合成フィルタ124とを接続する切り替えスイッチで、コア符号パケット用パケット分解部101から入力されるフレーム消失情報C1と、拡張符号パケット用パケット分解部104から入力されるフレーム消失情報C2と、に基づいて切り替えられる。具体的には、コアレイヤが正常フレームで拡張レイヤが消失フレームである場合、合成フィルタ124の入力端子はアップサンプル処理部103の出力端子に接続され、それ以外の場合には、合成フィルタ124の入力端子は拡張音源復号器122の出力端子に接続される。
切り替えスイッチ126は、LPC変換部125または拡張LPC復号器127のいずれか一方と合成フィルタ124の第2の入力端子とを接続する切り替えスイッチで、コア符号パケット用パケット分解部101から入力されるフレーム消失情報C1と、拡張符号パケット用パケット分解部104から入力されるフレーム消失情報C2と、に基づいて切り替えられる。具体的には、コアレイヤが正常フレームで拡張レイヤが消失フレームである場合、合成フィルタ124の第2の入力端子はLPC変換部125の出力端子に接続され、それ以外の場合には、合成フィルタ124の第2の入力端子は拡張LPC復号器127の出力端子に接続される。
合成フィルタ124は、拡張LPC復号器127またはLPC変換部125から、スイッチ126を介してフィルタ係数が入力され、これらのフィルタ係数を用いて合成フィルタが構成される。構成された合成フィルタは、拡張音源復号器122またはアップサンプル処理部103からスイッチ123を介して入力される音源信号で駆動され、出力信号S8は加算器へ出力される。なお、コアレイヤのフレームが消失しない限り、合成フィルタ124は、誤りのない信号を生成し続ける。
合成フィルタ128は、拡張LPC復号器127から入力されるフィルタ係数で合成フィルタを構成し、拡張音源復号器122から入力される復号音源信号で駆動され、出力信号S9を高域通過フィルタ106へ出力する。なお、合成フィルタ128は、フレーム消失の有無に関わらず常に広帯域の復号信号を生成する。
HPF106は、コア復号器102の復号信号の帯域を遮断するフィルタで、合成フィルタ128の出力信号を入力し、高域成分(拡張レイヤで拡張される帯域)のみを通過してスイッチ107へ出力する。高域通過フィルタは、直線位相特性を有することが望ましいが、それに限定するものではない。
切り替えスイッチ107は、加算器への信号の入力をON/OFFするスイッチで、コア符号パケット用パケット分解部から入力されるフレーム消失情報と、拡張符号パケット用パケット分解部から入力されるフレーム消失情報と、に基づいて切り替えられる。具体的には、コアレイヤは正常フレームで拡張レイヤは消失フレームである場合には、スイッチが閉じられて、HPF106の出力が加算器へ入力される。それ以外の場合には、切り替えスイッチ107は開放され、HPF106の出力は加算器へ入力されない。
加算器108は、合成フィルタ124から出力される復号信号と、切り替えスイッチ107から入力される高域成分のみを有する復号信号と、を加算して最終的な広帯域復号信号として出力する。
合成フィルタ128は、拡張レイヤでフレーム消失が発生したとき、すなわち、合成フィルタ124の出力信号の帯域幅が狭まったときは、HPF106で取り出された高域成分の信号と、合成フィルタ124で生成された狭帯域の復号信号とが加算され、出力される。その結果、常に広帯域の復号信号が得られる。すなわち、復号信号の帯域幅が変化することによる主観的違和感の発生を防止することができる。また、低域成分については拡張レイヤの情報が失われても影響を受けないので、高品質な広帯域信号を生成できる。人間の聴覚的に信号の低域成分は重要であると共に、CELP方式の符号化/復号化では低域成分(ピッチ周期)がずれることによる品質劣化が大きいので、低域成分がエラーフリーの状況になっていれば、高域成分に誤りが混入していても主観的品質の劣化を少なくすることが可能であるからである。
なお、コアレイヤがビットレートスケーラブル復号器となっている場合は、コア符号用パケットをビットレートスケーラブル構成の階層数に分割することができる。この場合、コア符号用パケット分解部も階層数に応じて用意する。ビットレートスケーラブル符号化情報のコアレイヤ(ビットレートスケーラブルコア)以外の情報がパケット網内で失われた場合、図1におけるコア復号器102から出力される各種情報は、コア復号器102のビットレートスケーラブルコアの復号処理のみによって得られるものとする。また、ビットレートスケーラブルコア以外のビットレートスケーラブル拡張レイヤの一部の拡張レイヤのみが失われている場合は、ビットレートスケーラブルコアと正常に受信したビットレートスケーラブル拡張レイヤの一部の情報を利用してコア復号化器の復号処理を行っても良い。
図4および図5は、以上説明した拡張復号器105内部における信号の流れを整理した図である。図4は、フレーム消失がない場合、すなわち、正常時の信号の流れを示した図、図5は、拡張レイヤのフレームが消失した場合の信号の流れを示した図である。なお、図中において、NB信号は狭帯域信号を、WB信号は広帯域信号を指している。
次いで、上記構成を有するスケーラブル復号化装置の復号処理の概要について、図6に示す信号図を用いて説明する。なお、この図は、第nフレームにおいてフレーム消失が起こった場合を示している。
破線で示した信号S101は、フレーム消失がなかった場合の信号を示している。しかし、伝送路上でこの信号の高帯域(拡張レイヤ)パケットを消失すると、実際に受信される信号は低域パケットのみとなる。そこで、本実施の形態では、この低域パケットの信号にアップサンプル処理等を施すことにより、サンプリングレートは広帯域であって低域成分のみが残った信号S102(実線の信号)を生成する。一方、第n−1フレームの信号S103に基づいて、隠蔽処理によって補償信号S104を生成する。この信号S104をHPFに通すことにより、高域成分のみを取り出すと信号S105となる。加算部108において、低域成分のみが残っている信号S101と高域成分のみが残っている信号S105とを加算することにより、復号信号S106が得られる。
このように、本実施の形態によれば、正常に受信したエラーフリーの(エラーのない)低域成分であるコアレイヤの符号化情報を用いて得られる信号をアップサンプリングして信号を生成し、この信号に、拡張レイヤで誤り隠蔽処理を用いて生成した全帯域の信号の高域成分のみを取り出した信号を加算して、全帯域復号信号を得る。
この構成を採ることにより、帯域スケーラブル音響符号化情報のコアレイヤ以外の符号化情報が失われた場合であっても、コアレイヤのサポートする音響信号帯域だけでなく、拡張レイヤのサポートする音響信号帯域を常に生成することができる。
また、コアレイヤの符号化情報のみから得られる復号信号は、サンプリングレートは広帯域復号信号のままで変化しないが、合成フィルタの出力信号の帯域幅が拡張レイヤの誤り状況によって狭まったり広がったりする。すなわち、拡張レイヤのフレームが消失した場合は、復号信号の帯域幅が狭まる。しかし、本実施の形態によれば、復号音響信号の帯域幅が短時間のうちに変化することを防ぎ、不快感や違和感が復号音響信号に生じないようにすることができる。しかも、低域成分の品質は低下しない。
帯域スケーラブル音響復号化において、パケット網でパケット転送の優先制御が行われている場合、拡張レイヤの符号化データのみが消失すると、復号器側で復号信号の帯域幅が変化し、聴感上不快と感じる場合がある。エラーフリーの状態で復号したコアレイヤの復号信号に、フレーム消失隠蔽処理を用いて復号した拡張レイヤの復号信号の高域成分を加算することにより、復号信号の帯域幅が時間的に変化することを回避し、聴感上安定した品質を復号器側で得ることが可能となる。
また、コアレイヤの復号情報を活用して拡張レイヤの符号化/復号化およびフレーム消失隠蔽処理を適応的に切り替える構成としたので、拡張レイヤの情報が失われても、コアレイヤの情報を正常に受信していれば、高品質な復号信号を得ることが可能となる。
さらに、パケット網での優先制御を有効に利用し、高品質な音響通信品質を実現できる。
なお、本実施の形態では、拡張レイヤが1層である場合を例にとって説明したが、拡張レイヤの数は2以上(出力する周波数帯域の種類が2種類以上)であっても良い。
また、コアレイヤがさらにビットレートスケーラビリティを有する階層構造(スケーラブル符号化器/スケーラブル復号器)を持っていても良い。
また、各周波数帯域を出力する符号化/復号化のアルゴリズムが、ビットレートスケーラビリティを有する階層構造を持っていても良い。
また、拡張復号器105は、MDCTベースのものであっても良い。図7は、拡張復号器105がMDCTベースである場合のアップサンプル処理部103aの構成を示したブロック図である。
このアップサンプル処理部103aは、MDCT部131および次数拡張部132を備える。
コア復号器102は、コア復号信号を狭帯域復号信号として出力すると共に、MDCT部131へも出力する。これは、図1に示したコア復号器102の2つの出力信号(S3、S4)が同一である場合に相当する。また、コアレイヤの復号過程において得られた情報の一部または全てを拡張復号器105に出力する。
MDCT部131は、コア復号器102から出力された狭帯域復号信号に対して変形離散余弦変換(MDCT)処理を行って、得られるMDCT係数を次数拡張部132へ出力する。
次数拡張部132は、MDCT部131から出力されたMDCT係数の次数を零詰めによって拡張する(ただし、2倍にアップサンプルする場合は、MDCT次数を2倍にし、増やした部分は0の係数で埋める)。拡張されたMDCT係数は拡張復号器105へ出力される。
拡張復号器105は、次数拡張部132から出力されたMDCT係数を逆変形離散コサイン変換することによって拡張レイヤの復号信号を生成する。また、拡張復号器105は、隠蔽処理を行う場合は、次数拡張部132の出力するMDCT係数に、隠蔽処理によって生成された拡張情報を加え、これにより生成されたMDCT係数を逆変形離散コサイン変換することによって、拡張レイヤの復号信号を生成する。
(実施の形態2)
図8は、本発明の実施の形態2に係るスケーラブル復号化装置の主要な構成を示すブロック図である。なお、このスケーラブル復号化装置は、実施の形態1に示したスケーラブル復号化装置と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
図8は、本発明の実施の形態2に係るスケーラブル復号化装置の主要な構成を示すブロック図である。なお、このスケーラブル復号化装置は、実施の形態1に示したスケーラブル復号化装置と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態に係るスケーラブル復号化装置は、モード判定部201を備え、モード判定部201への入出力インタフェースを有するコア復号器102および拡張復号器105の動作が実施の形態1と異なる。
次いで、上記構成を有するスケーラブル復号化装置の動作について説明する。
コア復号器102は、パケット分解部101から入力されるフレーム消失情報C1と符号化情報S1を用いてコアレイヤの復号処理を行い、コアレイヤの復号信号(狭帯域信号)S6として出力する。また、コアレイヤの復号処理において得られる情報の一部または全てを拡張復号器105へ出力する。拡張復号器105へ出力された情報は拡張レイヤの復号処理に用いられる。さらに、コアレイヤの復号処理において得られる信号をアップサンプル処理部103およびモード判定部へ出力する。アップサンプル処理部103へ出力する信号は、コアレイヤの復号信号そのものであっても良いし、コアレイヤの符号化モデルによっては部分的な復号パラメータであっても良い。モード判定部へ出力される情報は、線形予測係数、ピッチ予測利得、ピッチラグ、ピッチ周期、信号エネルギ、零交差率、反射係数、対数断面積比、LSPパラメータ、正規化線形予測残差パワ等の一般に音声信号の状態(無音、有声定常部、雑音性子音部、立ち上がり、過渡部等)を分類するのに使われるパラメータである。
モード判定部201は、コア復号器102から入力した各種情報を用いて、復号中の信号の分類(例えば、雑音性子音部、有声定常部、立ち上がり部、有声過渡部、無音部、音楽信号等)を行い、この分類結果を拡張復号器105へ出力する。ただし、分類は、この例に限定されない。
拡張復号器105は、パケット分解部104から出力されるフレーム消失情報と符号化情報と、コア復号器102から出力されるコアレイヤの符号化処理過程で得られた情報と、アップサンプル処理部103から入力されるコアレイヤの復号信号をアップサンプルしたものと、を用いて拡張レイヤの復号化処理を行う。なお、モード判定部から入力したモード情報を用いて、そのモードに適した符号化モデルを選択的に使用するような拡張符号化器(図示せず)によって拡張レイヤの符号化処理が行われている場合は、復号化処理も同様の処理を行う。
このようにコアレイヤで現在の音響信号の状況を判定し、拡張レイヤの符号化モデルを適応的に切り替える構成とすれば、より高品質な符号化/復号化を実現できる。
復号信号は、拡張レイヤの復号信号(広帯域信号)としてHPF106および加算器108へ出力される。なお、加算器108へ出力される信号とHPF106へ出力される信号は同じものでなくても良い。例えば、加算器108にはアップサンプル処理部103から入力された信号をそのまま出力しても良い。また、フレーム消失情報を参照して加算器108へ出力する信号を条件的に切り替える(例えば、アップサンプル処理部103から入力された信号と、拡張復号器105内で行われる復号処理によって生成される信号と、を切り替える)ようにしても良い。
また、フレーム消失情報が現フレームは消失フレームであることを示していた場合、拡張復号器105はフレーム消失隠蔽処理を行う。この場合、モード判定部から音響信号のモードを示す情報が入力されているので、そのモードに適した隠蔽処理を行う。隠蔽処理を用いて生成された広帯域信号は、HPF106とスイッチを経由して加算器へ出力される。HPF106は時間領域のディジタルフィルタで実現可能だが、MDCT等の直行変換を用いて周波数領域へ変換し、高域成分のみを残して逆変換によって時間領域に戻すような処理を利用しても良い。
コアLPC復号器112は、LPCの復号処理過程で得られる音響パラメータもしくは復号したLPCから得られる音響パラメータ(例えば、反射係数、対数断面積比、LSP、正規化線型予測残差パワ等)をモード判定部に出力する。
コア音源復号器113は、音源復号過程で得られる音響パラメータもしくは復号した音源信号から得られる音響パラメータ(例えば、ピッチラグ、ピッチ周期、ピッチゲイン、ピッチ予測ゲイン、音源信号エネルギ、音源信号零交差率、など)をモード判定部201に出力する。
なお、図示していないが、合成フィルタから出力される狭帯域復号信号の零交差率やエネルギ情報等を分析する分析部を設けて、これらのパラメータをモード判定部に入力するようにするとさらに良い。
モード判定部201は、コアLPC復号器112およびコア音源復号器113等から各種音響パラメータ(LSP、LPC、反射係数、対数断面積比、正規化線型予測残差パワ、ピッチラグ、ピッチ周期、ピッチゲイン、ピッチ予測ゲイン、音源信号エネルギ、音源信号零交差率、合成信号エネルギ、合成信号零交差率等)を入力し、音響信号のモード分類(無音部、雑音性子音部、有声定常部、立ち上がり部、有声過渡部、語尾、音楽信号等)を行い、分類結果を拡張LPC復号器127および拡張音源復号器122にそれぞれ出力する。なお、図示していないが、拡張復号器105がポストフィルタのような後処理部を備える場合は、この後処理部にも上記モード分類情報を出力しても良い。
拡張LPC復号器127は、モード判定部201から入力された音響信号の各種モードに応じて復号処理を切り替えても良い。この場合、拡張LPC符号器(図示せず)においても同様の符号化モデルの切り替え処理が行われていることを前提とする。また、拡張レイヤでフレーム消失が生じている場合は、上記モードに対応するフレーム消失隠蔽処理を行って、復号拡張LPCを生成する。
拡張音源復号器122は、モード判定部201から入力された音響信号の各種モードに応じて復号処理を切り替えても良い。この場合、拡張音源符号器(図示せず)においても同様の符号化モデルが切り替えられていることが前提である。また、拡張レイヤでフレーム消失が生じている場合は、上記モードに対応するフレーム消失隠蔽処理を行って、復号拡張音源信号を生成する。
(実施の形態3)
図9は、実施の形態1または2に示したスケーラブル復号化装置を移動体通信システムに適用した場合の移動局装置および基地局装置の主要な構成を示すブロック図である。
図9は、実施の形態1または2に示したスケーラブル復号化装置を移動体通信システムに適用した場合の移動局装置および基地局装置の主要な構成を示すブロック図である。
この移動体通信システムは、音声信号送信装置300および音声信号受信装置310を備える。なお、音声信号受信装置310に実施の形態1または2に示したスケーラブル復号化装置が搭載されている。
音声信号送信装置300は、入力装置301、A/D変換装置302、音声符号化装置303、信号処理装置304、RF変調装置305、送信装置306及びアンテナ307を有している。
A/D変換装置302の入力端子は、入力装置301の出力端子に接続されている。音声符号化装置303の入力端子は、A/D変換装置302の出力端子に接続されている。信号処理装置304の入力端子は、音声符号化装置303の出力端子に接続されている。RF変調装置305の入力端子は、信号処理装置304の出力端子に接続されている。送信装置306の入力端子は、RF変調装置305の出力端子に接続されている。アンテナ307は、送信装置306の出力端子に接続されている。
入力装置301は、音声信号を受けてこれを電気信号であるアナログ音声信号に変換し、A/D変換装置302に与える。A/D変換装置302は、入力装置301からのアナログの音声信号をディジタル音声信号に変換し、これを音声符号化装置303へ与える。音声符号化装置303は、A/D変換装置302からのディジタル音声信号を符号化して音声符号化ビット列を生成し信号処理装置304に与える。信号処理装置304は、音声符号化装置303からの音声符号化ビット列にチャネル符号化処理やパケット化処理及び送信バッファ処理等を行った後、その音声符号化ビット列をRF変調装置305に与える。RF変調装置305は、信号処理装置304からのチャネル符号化処理等が行われた音声符号化ビット列の信号を変調して送信装置306に与える。送信装置306は、RF変調装置305からの変調された音声符号化信号をアンテナ307を介して電波(RF信号)として送出する。
音声信号送信装置300においては、A/D変換装置302を介して得られるディジタル音声信号に対して数十msのフレーム単位で処理が行われる。システムを構成するネットワークがパケット網である場合には、1フレーム又は数フレームの符号化データを1つのパケットに入れこのパケットをパケット網に送出する。なお、上記ネットワークが回線交換網の場合には、パケット化処理や送信バッファ処理は不要である。
音声信号受信装置310は、アンテナ311、受信装置312、RF復調装置313、信号処理装置314、音声復号化装置315、D/A変換装置316及び出力装置317を有している。
受信装置312の入力端子は、アンテナ311に接続されている。RF復調装置313の入力端子は、受信装置312の出力端子に接続されている。信号処理装置314の入力端子は、RF復調装置313の出力端子に接続されている。音声復号化装置315の入力端子は、信号処理装置314の出力端子に接続されている。D/A変換装置316の入力端子は、音声復号化装置315の出力端子に接続されている。出力装置317の入力端子は、D/A変換装置316の出力端子に接続されている。
受信装置312は、アンテナ311を介して音声符号化情報を含んでいる電波(RF信号)を受けてアナログの電気信号である受信音声符号化信号を生成し、これをRF復調装置313に与える。アンテナ311を介して受けた電波(RF信号)は、伝送路において信号の減衰や雑音の重畳がなければ、音声信号送信装置300において送出された電波(RF信号)と全く同じものになる。
RF復調装置313は、受信装置312からの受信音声符号化信号を復調し信号処理装置314に与える。信号処理装置314は、RF復調装置313からの受信音声符号化信号のジッタ吸収バッファリング処理、パケット組みたて処理およびチャネル復号化処理等を行い、受信音声符号化ビット列を音声復号化装置315に与える。音声復号化装置315は、信号処理装置314からの受信音声符号化ビット列の復号化処理を行って復号音声信号を生成しD/A変換装置316へ与える。D/A変換装置316は、音声復号化装置315からのディジタル復号音声信号をアナログ復号音声信号に変換して出力装置317に与える。出力装置317は、D/A変換装置316からのアナログ復号音声信号を空気の振動に変換し音波として人間の耳に聞こえる様に出力する。
これにより、実施の形態1または2と同様の作用効果を有する移動局装置(通信端末装置)を提供することができる。
また、本発明に係るスケーラブル復号化装置は、上記各実施の形態に限定されず、種々変更して実施することが可能である。例えば、実施の形態1および2は、適宜組み合わせて実施することが可能である。
図10は、実施の形態1および2を組み合わせた場合のスケーラブル復号化装置の主要な構成を示すブロック図である。
コア復号器102は、復号処理過程で得られる音響パラメータもしくは復号信号を分析して得られる音響パラメータをモード判定部201に出力する。音響パラメータとしては、前述のような各種パラメータ全てが例としてあげられる。このような構成は、拡張復号器105がMDCTを用いた符号化アルゴリズムを利用している場合に有効である。
以上、本発明の様々な実施の形態について説明した。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。例えば、本発明に係る拡張レイヤ消失隠蔽方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るスケーラブル復号化装置と同様の機能を実現することができる。
また、LSPの余弦をとったもの、すなわち、LSPをL(i)とした場合のcos(L(i))を特にLSF(Line Spectral Frequency)と呼び、LSPと区別する場合もあるが、本明細書では、LSFはLSPの一形態であり、LSPにLSFは含まれるものとしてLSPという用語を用いている。すなわち、LSPをLSFと読み替えても良い。
また、上記各実施の形態では、コアレイヤは最も狭帯域の信号の符号化/復号化を行うレイヤであるとして説明したが、ある帯域の信号を符号化/復号化するレイヤXとそれよりも広い帯域の信号を符号化/復号化するレイヤYとがあった場合、Xをコアレイヤ、Yを拡張レイヤとして、本発明の内容を適用することも可能である。この場合、レイヤXは必ずしも最も狭帯域の信号の符号化/復号化を行うレイヤである必要はなく、レイヤX自体が複数のレイヤから成るスケーラブル構造となっていても良い。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されていても良いし、一部または全てを含むように1チップ化されていても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてあり得る。
本明細書は、2004年4月30日出願の特願2004−136280に基づく。この内容はすべてここに含めておく。
本発明に係るスケーラブル復号化装置および拡張レイヤ消失隠蔽方法は、移動体通信システムにおける通信端末装置等の用途に適用できる。
Claims (7)
- 周波数軸方向にスケーラビリティを有するコアレイヤと拡張レイヤとからなる符号化情報から、広帯域の復号信号を得るスケーラブル復号化装置であって、
コアレイヤの符号化情報から狭帯域のコアレイヤ復号信号を得るコアレイヤ復号化手段と、
前記狭帯域のコアレイヤ復号信号の周波数帯域を広帯域に変換し、第1信号を得る変換手段と、
コアレイヤが存在し拡張レイヤが消失された符号化情報に対し、過去に得られた復号信号に基づいて広帯域の補償信号を生成する補償手段と、
前記広帯域の補償信号からコアレイヤに相当する周波数成分を除去し、第2信号を得る除去手段と、
前記第1信号および前記第2信号を加算して広帯域の復号信号を得る加算手段と、
を具備するスケーラブル復号化装置。 - 前記コアレイヤ復号化手段は、
コアレイヤの符号化情報からコアレイヤの復号LPCを得るコアレイヤLPC復号部と、コアレイヤの符号化情報からコアレイヤの復号音源信号を得るコアレイヤ音源信号復号部と、を具備し、
前記変換手段は、
前記コアレイヤの復号LPCを広帯域のLPCに次数変換するLPC変換部と、前記コアレイヤの復号音源信号を広帯域の音源信号にアップサンプリングするアップサンプル処理部と、前記LPC変換部で広帯域に次数変換されたLPCによって構成される合成フィルタであって、前記アップサンプル処理部でアップサンプリングされた広帯域の音源信号を駆動音源信号として前記第1信号を合成する第1の合成フィルタと、を具備し、
前記補償手段は、
拡張レイヤの符号化情報から過去に得られた拡張レイヤの復号LPCに基づいて広帯域の補償LPCを生成する拡張レイヤLPC復号部と、拡張レイヤの符号化情報から過去に得られた拡張レイヤの復号音源信号に基づいて広帯域の補償音源信号を生成する拡張レイヤ音源信号復号部と、前記拡張レイヤLPC復号部で生成された補償LPCによって構成される合成フィルタであって、前記拡張レイヤ音源信号復号部で生成された補償音源信号を駆動音源信号として前記補償信号を合成する第2の合成フィルタと、を具備する、
請求項1記載のスケーラブル復号化装置。 - 前記変換手段は、
前記狭帯域のコアレイヤ復号信号を変形離散コサイン変換するMDCT部と、
前記MDCT部で得られたMDCT係数の次数を拡張して前記第1信号を得る次数拡張部と、
を具備する請求項1記載のスケーラブル復号化装置。 - 前記補償手段は、
前記コアレイヤと拡張レイヤとからなる符号化情報のモードに従って前記補償信号の生成方法を切り替える、
請求項1記載のスケーラブル復号化装置。 - 請求項1記載のスケーラブル復号化装置を具備する通信端末装置。
- 請求項1記載のスケーラブル復号化装置を具備する基地局装置。
- 周波数軸方向にスケーラビリティを有するコアレイヤと拡張レイヤとからなる符号化情報に対し、
コアレイヤの符号化情報から狭帯域のコアレイヤ復号信号を得るステップと、
前記狭帯域のコアレイヤ復号信号の周波数帯域を広帯域に変換し、第1信号を得るステップと、
コアレイヤが存在し拡張レイヤが消失された符号化情報に対し、過去に得られた復号信号に基づいて広帯域の補償信号を生成するステップと、
前記広帯域の補償信号からコアレイヤに相当する周波数成分を除去し、第2信号を得るステップと、
前記第1信号および前記第2信号を加算して広帯域の復号信号を得るステップと、
を具備する拡張レイヤ消失隠蔽方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004136280 | 2004-04-30 | ||
JP2004136280 | 2004-04-30 | ||
PCT/JP2005/007822 WO2005106848A1 (ja) | 2004-04-30 | 2005-04-25 | スケーラブル復号化装置および拡張レイヤ消失隠蔽方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2005106848A1 true JPWO2005106848A1 (ja) | 2007-12-13 |
Family
ID=35241896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006512775A Withdrawn JPWO2005106848A1 (ja) | 2004-04-30 | 2005-04-25 | スケーラブル復号化装置および拡張レイヤ消失隠蔽方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20080249766A1 (ja) |
EP (1) | EP1758099A1 (ja) |
JP (1) | JPWO2005106848A1 (ja) |
CN (1) | CN1950883A (ja) |
WO (1) | WO2005106848A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2040253B1 (en) * | 2000-04-24 | 2012-04-11 | Qualcomm Incorporated | Predictive dequantization of voiced speech |
ATE406652T1 (de) * | 2004-09-06 | 2008-09-15 | Matsushita Electric Ind Co Ltd | Skalierbare codierungseinrichtung und skalierbares codierungsverfahren |
KR100612889B1 (ko) * | 2005-02-05 | 2006-08-14 | 삼성전자주식회사 | 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치 |
EP1892702A4 (en) * | 2005-06-17 | 2010-12-29 | Panasonic Corp | POST-FILTER, DECODER AND POST-FILTRATION METHOD |
EP1990800B1 (en) * | 2006-03-17 | 2016-11-16 | Panasonic Intellectual Property Management Co., Ltd. | Scalable encoding device and scalable encoding method |
EP1841072B1 (de) | 2006-03-30 | 2016-06-01 | Unify GmbH & Co. KG | Verfahren und Einrichtung zum Dekodieren von schichtkodierten Daten |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
WO2007138825A1 (ja) * | 2006-05-25 | 2007-12-06 | Pioneer Corporation | デジタル音声データ処理装置及び処理方法 |
WO2008053970A1 (fr) * | 2006-11-02 | 2008-05-08 | Panasonic Corporation | Dispositif de codage de la voix, dispositif de décodage de la voix et leurs procédés |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
WO2008066071A1 (en) * | 2006-11-29 | 2008-06-05 | Panasonic Corporation | Decoding apparatus and audio decoding method |
JP2008197247A (ja) * | 2007-02-09 | 2008-08-28 | Yamaha Corp | 音声処理装置 |
US8160872B2 (en) * | 2007-04-05 | 2012-04-17 | Texas Instruments Incorporated | Method and apparatus for layered code-excited linear prediction speech utilizing linear prediction excitation corresponding to optimal gains |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
CN101471073B (zh) * | 2007-12-27 | 2011-09-14 | 华为技术有限公司 | 一种基于频域的丢包补偿方法、装置和系统 |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8706479B2 (en) * | 2008-11-14 | 2014-04-22 | Broadcom Corporation | Packet loss concealment for sub-band codecs |
WO2010082471A1 (ja) * | 2009-01-13 | 2010-07-22 | パナソニック株式会社 | 音響信号復号装置及びバランス調整方法 |
US20120041761A1 (en) * | 2009-03-13 | 2012-02-16 | Panasonic Corporation | Voice decoding apparatus and voice decoding method |
CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
WO2012103686A1 (en) * | 2011-02-01 | 2012-08-09 | Huawei Technologies Co., Ltd. | Method and apparatus for providing signal processing coefficients |
US9208796B2 (en) * | 2011-08-22 | 2015-12-08 | Genband Us Llc | Estimation of speech energy based on code excited linear prediction (CELP) parameters extracted from a partially-decoded CELP-encoded bit stream and applications of same |
RU2608447C1 (ru) * | 2013-01-29 | 2017-01-18 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для генерирования расширенного по частоте сигнала, используя временное сглаживание поддиапазонов |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
CN111585702B (zh) * | 2015-07-01 | 2023-04-25 | 韩国电子通信研究院 | 生成广播信号帧的方法 |
US9837094B2 (en) * | 2015-08-18 | 2017-12-05 | Qualcomm Incorporated | Signal re-use during bandwidth transition period |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5450449A (en) * | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
US7031926B2 (en) * | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
ATE319162T1 (de) * | 2001-01-19 | 2006-03-15 | Koninkl Philips Electronics Nv | Breitband-signalübertragungssystem |
CN1326415C (zh) * | 2001-06-26 | 2007-07-11 | 诺基亚公司 | 对音频信号进行代码变换的方法、码变换器、网元、无线通信网和通信系统 |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
JP2003241799A (ja) * | 2002-02-15 | 2003-08-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム |
JP4169320B2 (ja) * | 2002-04-05 | 2008-10-22 | 日本電信電話株式会社 | 音声処理方法、音声処理プログラム |
JP3881946B2 (ja) * | 2002-09-12 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
KR100503415B1 (ko) * | 2002-12-09 | 2005-07-22 | 한국전자통신연구원 | 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법 |
-
2005
- 2005-04-25 EP EP05734140A patent/EP1758099A1/en not_active Withdrawn
- 2005-04-25 JP JP2006512775A patent/JPWO2005106848A1/ja not_active Withdrawn
- 2005-04-25 CN CNA2005800137573A patent/CN1950883A/zh active Pending
- 2005-04-25 US US11/587,964 patent/US20080249766A1/en not_active Abandoned
- 2005-04-25 WO PCT/JP2005/007822 patent/WO2005106848A1/ja not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
US20080249766A1 (en) | 2008-10-09 |
EP1758099A1 (en) | 2007-02-28 |
WO2005106848A1 (ja) | 2005-11-10 |
CN1950883A (zh) | 2007-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPWO2005106848A1 (ja) | スケーラブル復号化装置および拡張レイヤ消失隠蔽方法 | |
US7848921B2 (en) | Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof | |
US7277849B2 (en) | Efficiency improvements in scalable audio coding | |
US8195450B2 (en) | Decoder with embedded silence and background noise compression | |
JP5363488B2 (ja) | マルチチャネル・オーディオのジョイント強化 | |
US6694293B2 (en) | Speech coding system with a music classifier | |
KR100574031B1 (ko) | 음성합성방법및장치그리고음성대역확장방법및장치 | |
US20080208575A1 (en) | Split-band encoding and decoding of an audio signal | |
JP5706445B2 (ja) | 符号化装置、復号装置およびそれらの方法 | |
JPWO2006049205A1 (ja) | スケーラブル復号化装置およびスケーラブル符号化装置 | |
WO2006030865A1 (ja) | スケーラブル符号化装置、スケーラブル復号化装置、スケーラブル符号化方法、スケーラブル復号化方法、通信端末装置および基地局装置 | |
JP2009541797A (ja) | 種々の音声フレーム・レートの混合励振線形予測(melp)ボコーダ間でトランスコーディングするボコーダ及び関連した方法 | |
WO2008053970A1 (fr) | Dispositif de codage de la voix, dispositif de décodage de la voix et leurs procédés | |
EP2057626B1 (en) | Encoding an audio signal | |
JPH1097295A (ja) | 音響信号符号化方法及び復号化方法 | |
Hiwasaki et al. | A G. 711 embedded wideband speech coding for VoIP conferences | |
Choudhary et al. | Study and performance of amr codecs for gsm | |
KR100653783B1 (ko) | 음성 복호화 기능이 구비된 이동통신 단말기 및 그동작방법 | |
Gibson | Speech coding for wireless communications | |
Herre et al. | Perceptual audio coding of speech signals | |
Kroon | Speech and Audio Compression | |
Herre et al. | 18. Perceptual Perceptual Audio Coding of Speech Signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080317 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20091109 |