JP4781272B2 - 音声符号化装置、音声復号装置、通信装置及び音声符号化方法 - Google Patents

音声符号化装置、音声復号装置、通信装置及び音声符号化方法 Download PDF

Info

Publication number
JP4781272B2
JP4781272B2 JP2006535200A JP2006535200A JP4781272B2 JP 4781272 B2 JP4781272 B2 JP 4781272B2 JP 2006535200 A JP2006535200 A JP 2006535200A JP 2006535200 A JP2006535200 A JP 2006535200A JP 4781272 B2 JP4781272 B2 JP 4781272B2
Authority
JP
Japan
Prior art keywords
enhancement layer
core layer
speech
signal
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006535200A
Other languages
English (en)
Other versions
JPWO2006030864A1 (ja
Inventor
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006535200A priority Critical patent/JP4781272B2/ja
Publication of JPWO2006030864A1 publication Critical patent/JPWO2006030864A1/ja
Application granted granted Critical
Publication of JP4781272B2 publication Critical patent/JP4781272B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声信号をスケーラブルCELP(Code Excited Linear Prediction)方式で符号化する音声符号化装置等に関する。
IP(Internet Protocol)ネットワーク上における音声データ通信のトラフィック制御やマルチキャスト通信には、スケーラブル機能(受信側で部分的な符号化データからでも復号が可能な機能)を有する音声符号化方式が適している。CELP符号化方式は、低ビットレートで高音質を実現できる音声符号化方式であり、スケーラブル符号化方式に適用されることにより、ビットレートに応じた音質調節が可能になる。
音声信号のCELP符号化において、適応符号帳(ACB:Adaptive Code Book)探索(時間的に過去の駆動音源信号即ち適応符号帳を用いた音源探索)は、符号化音声信号の音質やその伝送に必要なビットレート等に大きな影響を与える。特に、スケーラブルCELP符号化では、その影響の度合いが一段と大きくなる。なお、スケーラブルCELP符号化において、拡張レイヤ(エンハンスメント層とも言う)に適応符号帳を用いない符号化方式が知られているが(例えば非特許文献1の図3を参照)、適応符号帳を用いる方が、最適化のために随時更新される過去の駆動音源信号を有効利用できることから、符号化音声信号の音質は概して良好である(例えば非特許文献1の図5を参照)。
図1に、拡張レイヤでサブフレーム毎にスケーラブルCELP符号化における音源探索を行う場合において、符号化対象サブフレームと、この符号化対象サブフレームの拡張レイヤ適応音源候補ベクトルを生成するために探索される適応符号帳の区間と、の時間関係を示す。図1に示すように、拡張レイヤ適応音源候補ベクトルは、拡張レイヤにおける符号化対象サブフレームよりも過去の駆動音源信号の集積である適応符号帳の所定区間を探索することによって取り出される。ちなみに、拡張レイヤにおける適応符号帳は、次の手順で生成、更新される。
(1)コアレイヤの符号化
(2)コアレイヤ駆動音源、コアレイヤの適応音源ラグ(ピッチ周期T0)及び拡張レイヤの適応符号帳(補助適応符号帳)を用いて拡張レイヤで適応符号帳探索(ピッチ予測)を行い、適応符号帳から適応音源を生成
(3)拡張レイヤで固定音源探索およびゲイン符号化を実行
(4)前記(1)〜(3)により得られた符号化後の拡張レイヤ駆動音源信号を用いて拡張レイヤの適応符号帳を更新
電子情報通信学会論文誌,D−II,2003年3月,Vol.J86−D−II(No.3),p.379−387
しかしながら、従来のスケーラブルCELP符号化方式では、過渡的な有声信号や有音の立ち上がり部分等の時間的に変化している区間の入力音声信号を拡張レイヤで適応符号帳探索を行って符号化すると、適応符号帳は過去の駆動音源信号の集積であるため入力音声信号の時間的変化に対応できていないことから、符号化音声信号の音質が却って劣化する問題がある。
本発明の目的は、時間的に変化している区間の音声信号をスケーラブルCELP符号化する場合でも、符号化音声信号の音質を改善できる音声符号化装置等を提供することであ
る。
本発明に係る音声符号化装置は、音声信号のスケーラブルCELP符号化において、サブフレーム毎に拡張レイヤの適応符号帳探索を行う音声符号化装置であって、コアレイヤについて、音声信号からコアレイヤ駆動音源信号及びCELP符号化の符号化結果を示すコアレイヤ符号化データを生成するコアレイヤ符号化手段と、拡張レイヤについて、符号化対象サブフレームよりも過去の拡張レイヤ駆動音源信号と前記過去の拡張レイヤ駆動音源信号よりも未来の前記コアレイヤ駆動音源信号とを含む拡張型適応符号帳を生成する拡張レイヤ拡張型適応符号帳生成手段と、生成した拡張型適応符号帳を探索することによって前記符号化対象サブフレームの適応音源ベクトルを示す拡張レイヤ適応音源符号を生成する拡張レイヤ拡張型適応符号帳と、を具備する構成を採る。
また、本発明に係る音声復号装置は、スケーラブルCELP符号化された音声符号化データを復号して復号音声を生成する音声復号装置であって、コアレイヤについて、前記音声符号化データに含まれるコアレイヤ符号化データを復号してコアレイヤ駆動音源信号及びコアレイヤ復号音声信号を生成するコアレイヤ復号手段と、拡張レイヤについて、復号対象サブフレームよりも過去の拡張レイヤ駆動音源信号と前記過去の拡張レイヤ駆動音源信号よりも未来の前記コアレイヤ駆動音源信号とを含む拡張型適応符号帳を生成する拡張レイヤ拡張型適応符号帳生成手段と、生成した拡張型適応符号帳から前記復号対象サブフレームの適応音源ベクトルを取り出す拡張レイヤ拡張型適応符号帳と、を具備する構成を採る。
本発明によれば、過渡的な有声信号や有音の立ち上がり部分等の時間的に変化している区間の音声信号をサブフレーム毎に拡張レイヤで適応符号帳探索を行って符号化する場合に、その適応符号帳が過去の拡張レイヤの駆動音源信号の集積である従来型の適応符号帳のみならず符号化対象サブフレームよりも未来の音声信号の変化を示すコアレイヤ駆動音源信号を含んで構成されるため、その符号化対象サブフレームの駆動音源を正確に推定することができ、その結果、符号化音声信号の音質を改善することができる。
以下、本発明の実施の形態について、適宜図を参照しながら詳細に説明する。
(実施の形態1)
本発明に係る実施の形態1では、音声信号がスケーラブルCELP符号化され、拡張レイヤで音源探索される適応符号帳が、過去の拡張レイヤの駆動音源信号の集積である従来型の適応符号帳のみならず符号化対象サブフレームよりも未来の音声信号の変化を示すコアレイヤ駆動音源信号を含んで構成される態様について説明する。なお、本実施の形態では、下記の条件下で音声信号のスケーラブルCELP符号化が行われるものとする。
(1)コアレイヤと拡張レイヤとの2階層スケーラブル符号化方式
(2)コアレイヤと拡張レイヤとにおけるサンプリング周波数は同一(2階層間での帯域拡張なし)
(3)拡張レイヤの音源探索において、適応符号帳探索時には、適応符号帳から生成された適応音源とコアレイヤ駆動音源信号との差分を符号化する
(4)LPCパラメータは、コアレイヤと拡張レイヤとで同一
(5)コアレイヤと拡張レイヤとのCELP符号化は共に、サブフレーム単位で実行される
(6)拡張レイヤのCELP符号化における音源探索は、1つのフレームにおける全サブフレームに対してコアレイヤのCELP符号化が完了した後に実行される
図2は、本実施の形態に係る音声符号化装置100の主要な構成を示すブロック図である。なお、音声符号化装置100は、移動体無線通信システムを構成する移動局装置又は基地局装置に搭載されて使用されるものとする。
音声符号化装置100は、コアレイヤCELP符号化部101、拡張レイヤ拡張型適応符号帳生成部102、拡張レイヤ拡張型適応符号帳103、加算器104、106、ゲイン乗算部105、LPC合成フィルタ部107、減算器108、聴感重み付け部109、歪最小化部111、拡張レイヤ固定符号帳112及び拡張レイヤゲイン符号帳113を具備する。
コアレイヤCELP符号化部101は、入力されてくる音声信号に対して線形予測分析を施すことにより、スペクトル包絡情報であるLPCパラメータ(LPC係数)を算出し、算出したLPCパラメータを量子化してLPC合成フィルタ部107へ出力する。また、コアレイヤCELP符号化部101は、入力されてくる音声信号のコアレイヤのCELP符号化を行い、1フレーム内の全サブフレームについてコアレイヤ駆動音源信号exc_core[n](n=0,...,Nfr-1)(Nfr:フレーム長)と適応音源ラグTcore[is](is=0,...,ns-1)(ns:サブフレーム数)とを生成し、このコアレイヤ駆動音源信号exc_core[n]を拡張レイヤ拡張型適応符号帳生成部102、加算器104及びゲイン乗算部105における乗算器G1に入力するとともに、適応音源ラグTcore[is]を拡張レイヤ拡張型適応符号帳103に入力する。また、コアレイヤCELP符号化部101は、コアレイヤにおけるCELP符号化により、コアレイヤ符号化データを生成して、生成したコアレイヤ符号化データを、図示しない多重部等に入力する。
拡張レイヤ拡張型適応符号帳生成部102は、コアレイヤCELP符号化部101から入力されてくる1フレーム分のコアレイヤ駆動音源信号exc_core[n]と、加算器106から入力されてくる過去の拡張レイヤ駆動音源信号exc_enh[n]と、から拡張型適応符号帳d_enh_ext[i]を生成し、生成した拡張型適応符号帳d_enh_ext[i]をサブフレーム毎に拡張レイヤ拡張型適応符号帳103に入力する。つまり、拡張レイヤ拡張型適応符号帳生成部102は、サブフレーム毎に拡張型適応符号帳d_enh_ext[i]を更新する。なお、このサブフレーム毎の更新では、拡張レイヤにおける従来型の適応符号帳に対応する過去の拡張レイヤ駆動音源信号のみが更新されることになる。拡張レイヤ拡張型適応符号帳生成部102における拡張型適応符号帳の生成態様については、後に詳述する。
拡張レイヤ拡張型適応符号帳103は、コアレイヤCELP符号化部101から入力されてくる適応音源ラグTcore[is]と、拡張レイヤ拡張型適応符号帳生成部102から入力されてくる拡張型適応符号帳d_enh_ext[i]と、を用いて、歪最小化部111からの指示に従い、サブフレーム単位で拡張レイヤのCELP符号化における音源探索を行う。具体的には、拡張レイヤ拡張型適応符号帳103は、拡張レイヤ拡張型適応符号帳生成部102
から入力されてくる拡張型適応符号帳d_enh_ext[i]における所定の区間即ちコアレイヤCELP符号化部101から入力されてくる適応音源ラグTcore[is]の値又はその累積値の時間間隔に基づいて決定した区間(適応音源ラグ候補)でのみ、歪最小化部111から指示されたインデックスに対応する適応音源を生成し、その生成した適応音源を加算器104に入力する。
加算器104は、拡張レイヤ拡張型適応符号帳103から入力されてくる適応音源とコアレイヤCELP符号化部101から入力されてくる対応するサブフレームのコアレイヤ駆動音源信号との差分信号を算出し、算出した差分信号をゲイン乗算部105における乗算器G2に入力する。
拡張レイヤ固定符号帳112は、所定形状の音源ベクトル(固定音源)を複数個予め記憶しており、歪最小化部111から指示されたインデックスに対応する固定音源をゲイン乗算部105における乗算器G3に入力する。
拡張レイヤゲイン符号帳113は、歪最小化部111からの指示に従って、コアレイヤ駆動音源信号exc_core[n]に対するゲイン、加算器104から入力されてくる差分信号に対するゲイン及び固定音源に対するゲインを生成し、生成したゲインをそれぞれゲイン乗算部105へ出力する。
ゲイン乗算部105は、乗算器G1、G2、G3を具備し、乗算器G1においてコアレイヤCELP符号化部101から入力されてくるコアレイヤ駆動音源信号exc_core[n]に対してゲイン値g1を乗じ、同様に乗算器G2において加算器104から入力されてくる差分信号に対してゲイン値g2を乗じ、乗算器G3において拡張レイヤ固定符号帳112から入力されてくる固定音源に対してゲイン値g3を乗じて、これら3つの乗算結果を全て加算器106に入力する。
加算器106は、ゲイン乗算部105から入力されてくる3つの量子化された乗算結果を加算して、その加算結果即ち拡張レイヤ駆動音源信号をLPC合成フィルタ部107に入力する。
LPC合成フィルタ部107は、コアレイヤCELP符号化部101から入力されてくる量子化されたLPCパラメータをフィルタ係数とする合成フィルタにより、加算器106から入力されてくる拡張レイヤ駆動音源信号から合成音声信号を生成し、生成された拡張レイヤ合成音声信号を減算器108に入力する。
減算器108は、LPC合成フィルタ部107から入力されてくる拡張レイヤ合成音声信号を入力音声信号から減算することによって誤差信号を生成し、この誤差信号を聴感重み付け部109に入力する。なお、この誤差信号が符号化歪みに相当する。
聴感重み付け部109は、減算器108から入力されてくる符号化歪みに対して聴感的な重み付けを施し、この重み付けした符号化歪みを歪最小化部111に入力する。
歪最小化部111は、聴感重み付け部109から入力されてくる符号化歪みが最小となるような、拡張レイヤ拡張型適応符号帳103、拡張レイヤ固定符号帳112及び拡張レイヤゲイン符号帳113の各インデックスをサブフレーム毎に求め、それらのインデックスを拡張レイヤ拡張型適応符号帳103、拡張レイヤ固定符号帳112及び拡張レイヤゲイン符号帳113にそれぞれ通知し、それらを経由して対応する拡張レイヤ適応音源符号、拡張レイヤ固定音源符号及び拡張レイヤゲイン符号を、音声符号化データとして図示しない多重化部に入力する。
そして、図示しない多重部及び送信部等は、コアレイヤCELP符号化部101から入力されてくるコアレイヤ符号化データをフレーム単位でパケット化し、また拡張レイヤ拡張型適応符号帳103から入力されてくる拡張レイヤ適応音源符号と、拡張レイヤゲイン符号帳113から入力されてくる拡張レイヤゲイン符号と、拡張レイヤ固定符号帳112から入力されてくる拡張レイヤ固定音源符号と、をフレーム単位でパケット化し、前記コアレイヤ符号化データを含むパケットと、前記拡張レイヤ適応音源符号を含むパケットと、を別々のタイミングで無線送信する。
なお、符号化歪みが最小となる際の拡張レイヤ駆動音源信号は、サブフレーム毎に拡張レイヤ拡張型符号帳生成部102へフィードバックされる。
なお、拡張レイヤ拡張型適応符号帳103は、有声音のように周期性の強い成分を表現するために使われ、一方で拡張レイヤ固定符号帳112は、白色雑音のように周期性の弱い成分を表現するために使われる。
図3は、本実施の形態に係る音声復号装置200における主要な構成を示すブロック図である。音声復号装置200は、音声符号化装置100によってスケーラブルCELP符号化された音声符号化データから音声信号を復号する装置であり、音声符号化装置100と同様に、移動体無線通信システムを構成する移動局又は基地局に搭載されて使用されるものとする。
音声復号装置200は、コアレイヤCELP復号部201、拡張レイヤ拡張型適応符号帳生成部202、拡張レイヤ拡張型適応符号帳203、加算器204、207、拡張レイヤ固定符号帳205、拡張レイヤゲイン符号帳209、ゲイン乗算部206及びLPC合成フィルタ部208を具備する。なお、音声復号装置200では、コアレイヤの復号音声信号を復号する場合と、拡張レイヤの復号音声信号を復号する場合と、がある。
まず、コアレイヤの復号音声信号を復号する場合には、コアレイヤCELP復号部201において、図示しない受信部から音声符号化装置100によってスケーラブルCELP符号化された音声符号化データのうちコアレイヤ符号化データを取り出し、取り出したコアレイヤ符号化データに基づいて、コアレイヤにおけるCELP復号を行い、コアレイヤの復号音声を生成し出力する。
一方、拡張レイヤの復号音声信号を復号する場合には、コアレイヤCELP復号部201におけるCELP復号の過程で、量子化されたLPCパラメータと、1フレーム分のコアレイヤ駆動音源信号exc_core[n]と、1フレーム分の適応音源ラグTcore[is]と、をそれぞれ生成する。そして、コアレイヤCELP復号部201は、この量子化されたLPCパラメータをLPC合成フィルタ部208に入力する。また、コアレイヤCELP復号部201は、このコアレイヤ駆動音源信号exc_core[n]を拡張レイヤ拡張型適応符号帳生成部202、加算器204及びゲイン乗算部206における乗算器G’1に入力するとともに、この適応音源ラグTcore[is]を拡張レイヤ拡張型適応符号帳203に入力する。
拡張レイヤ拡張型適応符号帳生成部202は、コアレイヤCELP復号部201から入力されてくる1フレーム分のコアレイヤ駆動音源信号exc_core[n]と、加算器207からサブフレーム毎に入力されてくる過去の拡張レイヤ駆動音源信号exc_enh[n]と、からサブフレーム毎に拡張型適応符号帳d_enh_ext[i]を生成し、生成した拡張型適応符号帳d_enh_ext[i]を拡張レイヤ拡張型適応符号帳203に入力する。つまり、拡張レイヤ拡張型適応符号帳生成部202は、サブフレーム毎に拡張型適応符号帳d_enh_ext[i]を更新する。
拡張レイヤ拡張型適応符号帳203は、図示しない受信部から音声符号化装置100によってスケーラブルCELP符号化された音声符号化データのうちの拡張レイヤ適応音源符号と、コアレイヤCELP復号部201から入力されてくる適応音源ラグTcore[is]と、拡張レイヤ拡張型適応符号帳生成部202から入力されてくる拡張型適応符号帳d_enh_ext[i]と、に基づいて、適応音源を生成し、生成した適応音源を加算器204に入力する。
加算器204は、拡張レイヤ拡張型適応符号帳203から入力されてくる適応音源とコアレイヤCELP復号部201から入力されてくるコアレイヤ駆動音源信号との差分信号をゲイン乗算部206における乗算器G’2に入力する。
拡張レイヤ固定符号帳205は、図示しない受信部から音声符号化装置100によってスケーラブルCELP符号化された音声符号化データのうちの拡張レイヤ固定音源符号を取り出す。また、拡張レイヤ固定符号帳205は、所定形状の音源ベクトル(固定音源)を複数個予め記憶しており、取得した固定音源符号に対応する固定音源を生成して、生成した固定音源をゲイン乗算部206における乗算器G’3に入力する。
拡張レイヤゲイン符号帳209は、図示しない受信部から音声符号化装置100によってスケーラブルCELP符号化された音声符号化データのうちの拡張レイヤゲイン符号からゲイン乗算部105で用いられたゲイン値g1、g2、g3を生成し、生成したゲイン値g1、g2、g3をゲイン乗算部206に通知する。
そして、ゲイン乗算部206は、具備する乗算器G’1において取得したゲイン値g1をコアレイヤCELP復号部201から入力されてくるコアレイヤ駆動音源信号exc_core[n]に乗じ、同様に乗算器G’2においてゲイン値g2を加算器204から入力されてくる差分信号に乗じ、ゲイン値g3を拡張レイヤ固定符号帳205から入力されてくる固定音源に乗じ、これら3つの乗算結果を加算器207に入力する。
加算器207は、ゲイン乗算部206から入力されてくる3つの乗算結果を加算して、その加算結果即ち拡張レイヤ駆動音源信号を拡張レイヤ拡張型適応符号帳生成部202とLPC合成フィルタ部208とにそれぞれ入力する。
LPC合成フィルタ部208は、加算器207から入力されてくる拡張レイヤ駆動音源信号から合成復号音声を生成し、生成された拡張レイヤ復号音声信号を出力する。
次いで、音声符号化装置100の動作について、図4〜図6を用いて説明する。
図4は、音声符号化装置100において、拡張レイヤ拡張型適応符号帳生成部102において拡張型適応符号帳が生成され、最終的に拡張レイヤ拡張型適応符号帳生成部102において拡張型適応符号帳が更新されるまでの拡張レイヤでの音源探索の1サイクル(1サブフレーム周期)の流れを示すフロー図である。また、図5に、コアレイヤ駆動音源信号と従来型の適応符号帳とから拡張型適応符号帳が生成され、さらに生成された拡張型適応符号帳の所定区間から拡張レイヤ適応音源候補ベクトル(適応音源に相当)が生成される態様を模式的に示す。
図4に示すステップST310では、拡張レイヤ拡張型適応符号帳生成部102が、過去の拡張レイヤ駆動音源信号と、コアレイヤCELP符号化部101から入力されてくる1フレーム分のコアレイヤ駆動音源信号とに基づいて、拡張型適応符号帳を生成する。ここで、音声信号のサブフレーム番号isの符号化対象サブフレームをスケーラブルCELP符号化における音源探索を行う際に探索される拡張型適応符号帳d_enh_ext[i]は、下記(
式1)で表される。
d_enh_ext[i] = d_enh[i] ( for -Nd ≦ i < 0 )
exc_core[is*+Nsub+i]( for 0 ≦ i < Nfr-is*Nsub )・・・(式1)
ここで、
d_enh[i]:拡張レイヤにおける従来型の適応符号帳
exc_core[i]:コアレイヤにおける駆動音源信号
Nsub:サブフレーム長
Nfr:フレーム長(Nfr=Nsub*ns、ns:フレーム当たりのサブフレーム数)
また、(式1)の意義は、図5における(a)コアレイヤ駆動音源信号、(b)拡張レイヤ適応符号帳及び(c)拡張レイヤ拡張型適応符号帳の欄によって模式的に示される。
そして、ステップST320からステップST340までで拡張型適応符号帳探索、固定符号帳探索及びゲイン量子化をその順序で順次行う。ここで、サブフレーム番号isの符号化対象サブフレームにおける拡張レイヤ駆動音源信号exc_enh[n](n=0,...,Nsub-1)は、下記(式2)で表される。
exc_enh[n] = g1 * exc_core[is*Nsub+n]
+ g2 * {d_enh_ext[n - Tenh] -exc_core[is*Nsub+n]}
+ g3*c_enh[n] ・・・(式2)
ここで、
g1, g2, g3:ゲイン値
c_enh[n]:固定音源
Tenh:拡張レイヤにおける適応音源ラグ値
なお、本実施の形態では、拡張型適応符号帳探索によりTenhを、固定符号帳探索によりc_enh[n]を、並びにゲイン量子化によりg1, g2, g3を順次求める。
ステップST320では、拡張型適応符号帳探索を行う。まず、拡張レイヤ拡張型適応符号帳103において、拡張レイヤ拡張型適応符号帳生成部102から入力されてくる拡張型適応符号帳の所定区間に対する拡張レイヤ適応音源候補ベクトルを出力する。そして、加算器104にてコアレイヤCELP符号化部101から入力されてくるコアレイヤ駆動音源信号との差分をとった差分信号と、前記コアレイヤ駆動音源信号と、を各々ゲイン乗算部105で乗算した後に加算器106で加算した信号((式2)における右辺の第1項及び第2項の和に該当)に対するLPC合成信号と、入力音声信号との間の符号化歪みを最小にするような拡張レイヤ適応音源候補ベクトルを適応音源として選択して、その時の対応する適応音源ラグ値Tenhを出力するとともに、選択した適応音源とコアレイヤ駆動音源信号との差分信号をゲイン乗算部105に入力する。
ここで、Tenhの算出においては、コアレイヤの適応音源ラグTcore[is]を利用して定められた拡張レイヤ適応音源ラグ候補ベース値Tcand[it]を中心とする±ΔTの範囲を複数範囲設定し、その範囲内に限定して探索することで、拡張レイヤ適応音源ラグを表す符号化ビット数の低減(符号化効率の向上)や演算量の削減を図ることができる。なお、Tenhの算出は、小数精度でも良い。
Tenh = Tcand[it] -ΔT 〜 Tcand[it]+ΔT it = 0, 1, 2, 3, ... ・・・(式3)
また、拡張レイヤ適応音源ラグ候補ベース値Tcand[it]は、コアレイヤのサブフレーム毎に算出された適応音源ラグTcore[j](j=is,...,ns-1)の値又はその累積値の時間的間隔で入力信号の相関性が高いことを利用して、拡張型適応符号帳d_enh_ext[i]の取り得る範囲全体の中から、例えば下記(式4)のようにして決定される。
Tcand[it] = Tcore[is] it= 0
0 it= 1
-(Tcand[it-1]+Tcore[is0]) it>=2 ・・・(式4)
ここで、is0は、is0*Nsub ≦ is*Nsub+Tcand[it-1] < (is0+1)*Nsub を満たすように定められる。
また、(式2)〜(式4)の意義は、図5における(c)拡張レイヤ拡張型適応符号帳及び(d)拡張レイヤ適応音源候補ベクトルの欄によって模式的に示される。
続いて、図4に示すステップST330では、固定符号帳探索により固定音源を生成する。具体的には、ステップST330では、拡張レイヤ固定符号帳112が歪最小化部111から指示されたインデックスに対応する固定音源候補ベクトルを生成する。そして、前記固定音源候補ベクトルと、コアレイヤCELP符号化部101から入力されてくるコアレイヤ駆動音源信号と、ステップST320で選択された拡張レイヤ適応音源と前記コアレイヤ駆動音源信号との差分信号とから、減算器108で生成される符号化歪みを最小にするような固定音源候補ベクトルを固定音源c_enh[n]として選択して、その固定音源をゲイン乗算部105に入力する。
続いて、ステップST340では、ゲイン量子化を行うため、ゲイン乗算部105において、コアレイヤCELP符号化部101から入力されてくるコアレイヤ駆動音源信号と、ステップST320で選択された拡張レイヤ適応音源と前記コアレイヤ駆動音源信号を用いて加算器104から入力されてくる差分信号と、拡張レイヤ固定符号帳112から入力されてくるステップST330で選択された固定音源と、に対して、歪最小化部111から指示され、かつ、拡張レイヤゲイン符号帳113から出力されたそれぞれに対するゲイン値を乗じた後に、加算器106で加算した信号に対するLPC合成信号と、入力音声信号と、の間の符号化歪みを最小にするようなゲイン値g1、g2、g3を求める。
続いて、ステップST350では、加算器106が、ステップST340で求められたゲイン値g1、g2、g3を用いて乗算された3つの乗算結果を加算して、その加算結果を拡張レイヤ拡張型適応符号帳生成部102にフィードバックすることにより、拡張型適応符号帳を更新する。ここで、拡張レイヤの音源探索後に決定された拡張レイヤの駆動音源信号exc_enh[n]を用いて、次サブフレームでの探索用に拡張レイヤの従来型の適応符号帳d_enh[i]を、下記(式5)に従って更新する。
d_enh[i] = d_enh[i+Nsub] ( for -Nd ≦ i < -Nsub )
exc_enh[i+Nsub] ( for -Nsub ≦ i < 0 ) ・・・(式5)
図6は、音声符号化装置100において、音声信号がスケーラブルCELP符号化されて無線送信されるまでの1サイクル(1フレーム周期)の流れを示すフロー図である。
ステップST510では、コアレイヤCELP符号化部101が音声信号のコアレイヤについて1フレーム分をCELP符号化するとともに、符号化により得られるコアレイヤ駆動音源信号を拡張レイヤ拡張型適応符号帳生成部102に入力する。
続いて、ステップST520では、符号化対象サブフレームのサブフレーム番号isを0に設定する。
続いて、ステップST530では、is<ns(ns:1フレーム中の全サブフレーム数)であるか判定する。ステップST530において、is<nsであると判定された場合は、次にステップST540が実行され、一方でis<nsでないと判定された場合は、次にステップST560が実行される。
続いて、ステップST540では、サブフレーム番号isの符号化対象サブフレームに対して、前記ステップST310からステップST350までの各ステップが順次実行される。
続いて、ステップST550では、次の符号化対象サブフレームのサブフレーム番号isとしてis+1を設定する。そして、ステップST550に続いて、ステップST530が実行される。
また、ステップST560では、図示しない音声符号化装置100における送信部等が、スケーラブルCELP符号化された1フレーム分の音声符号化データのパケットを音声復号装置200に無線送信する。
このように、本実施の形態によれば、過渡的な有声信号や有音の立ち上がり部分等の時間的に変化している区間の音声信号をサブフレーム毎に拡張レイヤで適応符号帳探索を行ってCELP符号化する場合に、拡張レイヤ拡張型適応符号帳103が過去の拡張レイヤの駆動音源信号の集積である従来型の適応符号帳のみならず符号化対象サブフレームよりも未来の音声信号の変化を示すコアレイヤ駆動音源信号を含んで構成されるため、その符号化対象サブフレームの駆動音源を正確に推定することができ、その結果、符号化音声信号の音質を改善することができる。
なお、本実施の形態に係る音声符号化装置100又は音声復号装置200について、以下のように応用したり変形したりしても良い。
本実施の形態では、コアレイヤと符号化レイヤとの2階層のスケーラブルCELP符号化方式を適用する場合について説明したが、本発明はこの場合に限定されるものではなく、例えば3階層以上のスケーラブルCELP符号化方式を適用しても良い。ちなみに、N階層のスケーラブルCELP符号化方式では、2〜N階層目においてそれぞれ、本実施の形態の拡張レイヤで行ったように、一つ下位の階層即ち1〜N−1階層目のコアレイヤ駆動音源信号又は拡張レイヤ駆動音源信号を用いて拡張型適応符号帳を生成すれば良い。
また、本実施の形態では、コアレイヤと拡張レイヤとにおいてサンプリング周波数が同一である場合について説明したが、本発明はこの場合に限定されるものではなく、例えばスケーラブル符号化の階層に応じてサンプリング周波数を適宜変更即ち帯域スケーラブルを適用しても良い。ちなみに、音声符号化装置100に帯域スケーラブルを適用するには、コアレイヤCELP符号化部101と拡張レイヤ拡張型適応符号帳生成部102との間に、コアレイヤ駆動音源信号exc_core[n]をアップサンプルするアップサンプル部と、アップサンプリングされたコアレイヤ駆動音源信号exc_core[n]に対して帯域制限を行うローパスフィルタ(Low Pass Filter:LPF)と、を新たに設置するか、或いはコアレイヤ駆動音源信号exc_core[n]から復号音声信号を生成するコアレイヤ局部復号器と、前記アップサンプル部及びLPFと、LPFを通過した信号からコアレイヤ駆動音源信号exc_core[n]を再生成する逆フィルタと、をこの順で設置すれば良い。
また、本実施の形態では、ゲイン乗算部105における乗算器G1のゲイン値g1即ちコアレイヤ駆動音源信号exc_core[n]に乗算されるゲイン値g1が歪最小化部111によって指定される場合について説明したが、本発明はこの場合に限定されるものではなく、例えばゲイン値g1=1.0と固定しても良い。
また、本実施の形態では、加算器104が、拡張レイヤ拡張型適応符号帳103から入力されてくる適応音源とコアレイヤ駆動音源信号との差分信号をゲイン乗算部105に入
力する場合について説明したが、本発明はこの場合に限定されるものではなく、ゲイン乗算部105に入力されるのは、拡張レイヤ拡張型適応符号帳103から出力された適応音源の特性を示す信号であれば良い。よって、上記差分信号の代わりに、例えば拡張レイヤ拡張型適応符号帳103から出力される適応音源をゲイン乗算部105に直接入力するようにしても良い。このようにすれば、音声符号化装置100から加算器104を除去することができ、音声符号化装置100の構成を簡素化できる。ちなみに、このようにする場合には、拡張レイヤ駆動音源信号exc_enh[n]は、次式で表されることとなる。
exc_enh[n] = g1*exc_core[is*Nsub+n]+g2*d_enh_ext[n-Tenh]+g3*c_enh[n]
また、このようにする場合には、ゲイン乗算部105におけるゲイン値g1、g2を、(g1,g2)=(1,0)又は(0,1)に制限する即ちコアレイヤ駆動音源信号exc_core[n]と 拡張レイヤ適応音源信号d_enh_ext[n-Tenh]とを切り替えて使用するようにしても良い。
また、本実施の形態では、LPCパラメータがコアレイヤと拡張レイヤとで同一である場合について説明したが、本発明はこの場合に限定されるものではなく、例えばコアレイヤの量子化に対して、付加的量子化分を拡張レイヤで量子化し、拡張レイヤではそれによって得られた量子化LPCパラメータを用いるようにしても良い。このようにする場合は、音声符号化装置100において、コアレイヤLPCパラメータ及び音声信号を入力され、かつ、拡張レイヤ量子化LPCパラメータ及び量子化符号を出力する拡張レイヤLPCパラメータ量子化部が新たに設置される。さらに、帯域スケーラブルを適用する場合には、音声符号化装置100にLPC分析部が追加して設置される。
また、本実施の形態における拡張型適応符号帳の探索時の適応音源ラグ決定方法を、下記(a)〜(c)の手法で行っても良い。
(a)サブフレーム番号isの符号化対象サブフレームに対応するコアレイヤ駆動音源信号exc_core[n](n=is*Nsub, ..., is*Nsub+Nsub-1)と拡張型適応符号帳d_enh_ext[i]との間で相関を取り、その相関値が最大となるものから順に複数の遅延値を選択し、それらを適応音源ラグ候補ベース値Tcand[it]とし、以降は本実施の形態と同様にして適応音源ラグ探索を行う。
(b)音声信号から予めLPC予測残差信号又はそれに類する信号を算出しておき、サブフレーム番号isの符号化対象サブフレームに対応するLPC予測信号res[n](n=is*Nsub, ..., is*Nsub+Nsub-1)と拡張型適応符号帳d_enh_ext[i]との間で相関を取り、その相関値が最大となるものから順に複数の遅延値を選択し、それらを適応音源ラグ候補ベース値Tcand[it]とし、以降は本実施の形態と同様にして適応音源ラグ探索を行う。
(c)適応音源ラグの候補値を事前に選択せずに、拡張型適応符号帳d_enh_ext[i]の全ての区間の中から、最適な適応音源ラグを全探索により算出する。
また、本実施の形態では、全ての符号化対象サブフレームについて拡張型適応符号帳d_enh_ext[i]の探索を行う場合について説明したが、本発明はこの場合に限定されるものではなく、例えば1フレーム内の一部の符号化対象サブフレームに対してのみ拡張型適応符号帳d_enh_ext[i]の探索を行うようにしても良い。具体的には、ns=4の場合に、is=0,2の符号化対象サブフレームに対してのみ、拡張型適応符号帳d_enh_ext[i]の探索を行うようにしても良い。このようにすれば、拡張レイヤ適応音源ラグの符号化伝送ビット数の増加をある程度抑えながら、スケーラブルCELP符号化された音声信号の音質を改善することができる。
(実施の形態2)
本発明に係る実施の形態2では、実施の形態1において、音声符号化装置100から無線送信されたコアレイヤ符号化データを含むパケットと、拡張レイヤ適応音源符号を含むパケットと、について、音声復号装置200におけるパケットロス率に差が生じた場合に、コアレイヤ駆動音源信号に乗じるゲイン値と拡張型適応符号帳からの出力である適応音源に乗じるゲイン値との比率を調節する態様について説明する。具体的には、音声復号装置200においてコアレイヤ符号化データを含むパケットのロス率が拡張レイヤ適応音源符号を含むパケットのロス率より十分小さい場合に、音声符号化装置100における拡張レイヤ駆動音源信号の生成に際して、過去の拡張レイヤ駆動音源信号よりもコアレイヤ駆動音源信号の影響度を大きくするために、コアレイヤ駆動音源信号に乗じるゲイン値を増大させる又は拡張レイヤにおける適応音源に乗じるゲイン値を縮小させる。
図7は、本実施の形態に係る音声符号化装置600の主要な構成を示すブロック図である。音声符号化装置600は、実施の形態1における音声符号化装置100において、ゲイン量子化制御部621をさらに具備するものである。従って、音声符号化装置600は、音声符号化装置100の全ての構成要素を具備するため、音声符号化装置100の構成要素と同一の構成要素には同一の参照符号を付して、その説明を省略する。また、音声符号化装置600は、移動体無線通信システムを構成する移動局や基地局に搭載されて使用され、音声復号装置200を搭載する無線通信装置とパケット通信を行うものとする。
ゲイン量子化制御部621は、先に音声符号化装置600からパケット送信されたコアレイヤ符号化データを含むパケットと、拡張レイヤ適応音源符号を含むパケットと、について音声復号装置200の生成したパケットロス情報を取得し、このパケットロス情報に応じて、ゲイン乗算部105におけるゲイン値g1、g2、g3を適応的に制御する。具体的には、ゲイン量子化制御部621は、拡張レイヤゲイン符号帳113に対して、コアレイヤ符号化データを含むパケットのロス率をPLRcoreとし、拡張レイヤ適応音源符号を含むパケットのロス率をPLRenhとすると、コアレイヤ駆動音源信号に対するゲイン値g1と、コアレイヤ駆動音源信号と拡張型適応符号帳からの出力である適応音源との差分信号に乗じるゲイン値g2と、について、下記のような制限を設定し、その制限の下でゲイン量子化を行なわせる。
if PLRcore < c * PLRenh
then
g1の取り得る下限値をTHR1に設定
g2の取り得る上限値をTHR2に設定
else
g1,g2への上限値及び下限値の設定はしない
ここで、cは、パケットロスに関する判定条件を調整するための定数(但し、c < 1.0)、THR1,THR2は、g1に対する下限値及びg2に対する上限値の設定値定数である。
このように、本実施の形態に係る音声符号化装置600によれば、音声復号装置200におけるコアレイヤ符号化データを含むパケットのロス率が拡張レイヤ適応音源符号を含むパケットのロス率より十分小さい場合には、音声符号化装置100における拡張レイヤ駆動音源信号の生成に際して、コアレイヤ駆動音源信号に乗じるゲイン値を増大させる又は拡張型適応符号帳103の出力である適応音源に乗じるゲイン値を縮小させることから、スケーラブルCELP符号化された音声信号について、パケットの消失耐性を高めることができる。
なお、本実施の形態に係る音声符号化装置600について、以下のように応用したり変形したりしても良い。
本実施の形態では、ゲイン量子化制御部621がゲイン乗算部105におけるゲイン値g1、g2に対する制限の設定を行う場合について説明したが、本発明はこの場合に限定されるものではなく、例えばゲイン量子化制御部621が拡張レイヤ拡張型適応符号帳103に対して、拡張型適応符号帳探索時に、従来型の適応符号帳に対応する区間よりもコアレイヤ駆動音源信号に対応する区間から優先的に適応音源を取り出すように制御しても良い。さらに、ゲイン量子化制御部621が、前記拡張レイヤゲイン符号帳113に対する制御と、前記拡張レイヤ拡張型適応符号帳103に対する制御と、を組み合わせて行うようにしても良い。
また、本実施の形態では、パケットロス情報が、音声復号装置200から音声符号化装置600に、音声符号化データとは別個に送信される場合を想定して説明したが、本発明はこの場合に限定されるものではなく、例えば音声復号装置200から無線送信された音声符号化データのパケットを受信した音声符号化装置600が、その受信パケットにおけるパケットロス率を算出して、自ら算出したパケットロス率を音声復号装置200におけるパケットロス率として代用しても良い。
なお、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてありえる。
本明細書は、2004年9月17日出願の特願2004−271886に基づくものである。この内容は全てここに含めておく。
本発明に係る音声符号化装置は、符号化対象サブフレームの駆動音源を正確に推定することができ、その結果符号化音声信号の音質を改善できるという効果を有し、移動体無線通信システムを構成する移動局や基地局等の通信装置等として有用である。
従来型の適応符号帳の生成及び更新の態様を模式的に示す図 実施の形態1に係る音声符号化装置の主要な構成を示すブロック図 実施の形態1に係る音声復号装置の主要な構成を示すブロック図 実施の形態1における拡張型適応符号帳が生成、更新される流れを示すフロー図 実施の形態1における拡張型適応符号帳の生成又は探索の態様を模式的に示す図 実施の形態1におけるスケーラブルCELP符号化された音声符号化データが音声符号化装置からフレーム単位でパケット送信されるまでの流れを示すフロー図 実施の形態2に係る音声符号化装置の主要な構成を示すブロック図

Claims (7)

  1. 音声信号のスケーラブルCELP符号化において、サブフレーム毎に拡張レイヤの適応符号帳探索を行う音声符号化装置であって、
    コアレイヤについて、音声信号からコアレイヤ駆動音源信号及びCELP符号化の符号化結果を示すコアレイヤ符号化データを生成するコアレイヤ符号化手段と、
    拡張レイヤについて、符号化対象サブフレームよりも過去の拡張レイヤ駆動音源信号と前記過去の拡張レイヤ駆動音源信号よりも未来の前記コアレイヤ駆動音源信号とを含む拡張型適応符号帳を生成する拡張レイヤ拡張型適応符号帳生成手段と、
    生成した拡張型適応符号帳を探索することによって前記符号化対象サブフレームの適応音源ベクトルを示す拡張レイヤ適応音源符号を生成する拡張レイヤ拡張型適応符号帳と、を具備する音声符号化装置。
  2. 前記コアレイヤ符号化データと前記拡張レイヤ適応音源符号とを別個のパケットで送信する送信手段と、
    前記コアレイヤ駆動音源信号と前記拡張レイヤ拡張型適応符号帳から出力された適応音源の特性を示す信号とに対してそれぞれゲインを乗じるゲイン手段と、
    前記送信手段によって送信された前記コアレイヤ符号化データを含むパケットと前記拡張レイヤ適応音源符号を含むパケットとのパケットロスの状況を監視し、前記コアレイヤ符号化データを含むパケットロス率が前記拡張レイヤ適応音源符号を含むパケットロス率よりも低い場合には、前記ゲイン手段に対して、前記コアレイヤ駆動音源信号に乗じるゲインを増大させる又は前記適応音源の特性を示す信号に乗じるゲインを縮小させるゲイン制御手段と、
    をさらに具備する請求項1記載の音声符号化装置。
  3. 前記適応音源の特性を示す信号は、
    前記拡張レイヤ拡張型適応符号帳から出力された適応音源と、前記コアレイヤ駆動音源信号と、の差分信号である、
    請求項2記載の音声符号化装置。
  4. スケーラブルCELP符号化された音声符号化データを復号して復号音声を生成する音声復号装置であって、
    コアレイヤについて、前記音声符号化データに含まれるコアレイヤ符号化データを復号してコアレイヤ駆動音源信号及びコアレイヤ復号音声信号を生成するコアレイヤ復号手段と、
    拡張レイヤについて、復号対象サブフレームよりも過去の拡張レイヤ駆動音源信号と前記過去の拡張レイヤ駆動音源信号よりも未来の前記コアレイヤ駆動音源信号とを含む拡張型適応符号帳を生成する拡張レイヤ拡張型適応符号帳生成手段と、
    生成した拡張型適応符号帳から前記復号対象サブフレームの適応音源ベクトルを取り出す拡張レイヤ拡張型適応符号帳と、
    を具備する音声復号装置。
  5. 請求項1記載の音声符号化装置を具備する通信装置。
  6. 請求項4記載の音声復号装置を具備する通信装置。
  7. 音声信号のスケーラブルCELP符号化において、サブフレーム毎に拡張レイヤの適応符号帳探索を行う音声符号化方法であって、
    コアレイヤについて、音声信号からコアレイヤ駆動音源信号及びCELP符号化の符号化結果を示すコアレイヤ符号化データを生成するコアレイヤ符号化ステップと、
    拡張レイヤについて、符号化対象サブフレームよりも過去の拡張レイヤ駆動音源信号と前記過去の拡張レイヤ駆動音源信号よりも未来の前記コアレイヤ駆動音源信号とを含む拡張型適応符号帳を生成する拡張レイヤ拡張型適応符号帳生成ステップと、
    拡張レイヤについて、生成した拡張型適応符号帳を探索することによって前記符号化対象サブフレームの適応音源ベクトルを示す拡張レイヤ適応音源符号を生成する拡張レイヤ拡張型適応符号帳探索ステップと、
    を具備する音声符号化方法。
JP2006535200A 2004-09-17 2005-09-15 音声符号化装置、音声復号装置、通信装置及び音声符号化方法 Expired - Fee Related JP4781272B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006535200A JP4781272B2 (ja) 2004-09-17 2005-09-15 音声符号化装置、音声復号装置、通信装置及び音声符号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004271886 2004-09-17
JP2004271886 2004-09-17
JP2006535200A JP4781272B2 (ja) 2004-09-17 2005-09-15 音声符号化装置、音声復号装置、通信装置及び音声符号化方法
PCT/JP2005/017053 WO2006030864A1 (ja) 2004-09-17 2005-09-15 音声符号化装置、音声復号装置、通信装置及び音声符号化方法

Publications (2)

Publication Number Publication Date
JPWO2006030864A1 JPWO2006030864A1 (ja) 2008-05-15
JP4781272B2 true JP4781272B2 (ja) 2011-09-28

Family

ID=36060114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006535200A Expired - Fee Related JP4781272B2 (ja) 2004-09-17 2005-09-15 音声符号化装置、音声復号装置、通信装置及び音声符号化方法

Country Status (8)

Country Link
US (1) US7783480B2 (ja)
EP (1) EP1793373A4 (ja)
JP (1) JP4781272B2 (ja)
KR (1) KR20070061818A (ja)
CN (1) CN101023470A (ja)
BR (1) BRPI0515551A (ja)
RU (1) RU2007109825A (ja)
WO (1) WO2006030864A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4445328B2 (ja) 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法
JPWO2007116809A1 (ja) * 2006-03-31 2009-08-20 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
EP2048658B1 (en) * 2006-08-04 2013-10-09 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
WO2008072671A1 (ja) * 2006-12-13 2008-06-19 Panasonic Corporation 音声復号化装置およびパワ調整方法
WO2008108080A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 音声符号化装置及び音声復号装置
JP5164970B2 (ja) * 2007-03-02 2013-03-21 パナソニック株式会社 音声復号装置および音声復号方法
US8160872B2 (en) * 2007-04-05 2012-04-17 Texas Instruments Incorporated Method and apparatus for layered code-excited linear prediction speech utilizing linear prediction excitation corresponding to optimal gains
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
CA2759914A1 (en) * 2009-05-29 2010-12-02 Nippon Telegraph And Telephone Corporation Encoding device, decoding device, encoding method, decoding method and program therefor
WO2011058758A1 (ja) * 2009-11-13 2011-05-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
RU2464651C2 (ru) * 2009-12-22 2012-10-20 Общество с ограниченной ответственностью "Спирит Корп" Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов
US8442837B2 (en) * 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
EP2737479B1 (en) * 2011-07-29 2017-01-18 Dts Llc Adaptive voice intelligibility enhancement
KR102138320B1 (ko) 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
WO2013108343A1 (ja) * 2012-01-20 2013-07-25 パナソニック株式会社 音声復号装置及び音声復号方法
US20130208809A1 (en) * 2012-02-14 2013-08-15 Microsoft Corporation Multi-layer rate control
CN104217727B (zh) 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP3139602B2 (ja) 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
KR100455970B1 (ko) * 1996-02-15 2004-12-31 코닌클리케 필립스 일렉트로닉스 엔.브이. 복잡성이감소된신호전송시스템,전송기및전송방법,인코더및코딩방법
US6704703B2 (en) * 2000-02-04 2004-03-09 Scansoft, Inc. Recursively excited linear prediction speech coder
EP1431962B1 (en) 2000-05-22 2006-04-05 Texas Instruments Incorporated Wideband speech coding system and method
DE60118627T2 (de) * 2000-05-22 2007-01-11 Texas Instruments Inc., Dallas Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen
JP3467469B2 (ja) * 2000-10-31 2003-11-17 Necエレクトロニクス株式会社 音声復号装置および音声復号プログラムを記録した記録媒体
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
JP2003323199A (ja) 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
JP4331928B2 (ja) * 2002-09-11 2009-09-16 パナソニック株式会社 音声符号化装置、音声復号化装置、及びそれらの方法
JP4287637B2 (ja) * 2002-10-17 2009-07-01 パナソニック株式会社 音声符号化装置、音声符号化方法及びプログラム
CA2524243C (en) * 2003-04-30 2013-02-19 Matsushita Electric Industrial Co. Ltd. Speech coding apparatus including enhancement layer performing long term prediction
DE602004004950T2 (de) * 2003-07-09 2007-10-31 Samsung Electronics Co., Ltd., Suwon Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren

Also Published As

Publication number Publication date
BRPI0515551A (pt) 2008-07-29
RU2007109825A (ru) 2008-09-27
US7783480B2 (en) 2010-08-24
KR20070061818A (ko) 2007-06-14
CN101023470A (zh) 2007-08-22
US20080281587A1 (en) 2008-11-13
EP1793373A4 (en) 2008-10-01
JPWO2006030864A1 (ja) 2008-05-15
WO2006030864A1 (ja) 2006-03-23
EP1793373A1 (en) 2007-06-06

Similar Documents

Publication Publication Date Title
JP4781272B2 (ja) 音声符号化装置、音声復号装置、通信装置及び音声符号化方法
JP5046652B2 (ja) 音声符号化装置および音声符号化方法
US8935162B2 (en) Encoding device, decoding device, and method thereof for specifying a band of a great error
US8428956B2 (en) Audio encoding device and audio encoding method
US8433581B2 (en) Audio encoding device and audio encoding method
US7895035B2 (en) Scalable decoding apparatus and method for concealing lost spectral parameters
US7978771B2 (en) Encoder, decoder, and their methods
JP4679513B2 (ja) 階層符号化装置および階層符号化方法
JP4555299B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JPWO2009057327A1 (ja) 符号化装置および復号装置
WO2008072701A1 (ja) ポストフィルタおよびフィルタリング方法
JP4948401B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP2006011091A (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
US8112271B2 (en) Audio encoding device and audio encoding method
JP6001451B2 (ja) 符号化装置及び符号化方法
WO2005045808A1 (en) Harmonic noise weighting in digital speech coders
WO2011058752A1 (ja) 符号化装置、復号装置およびこれらの方法
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110614

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110705

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140715

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees