JP2008519991A - 音声の符号化及び復号化 - Google Patents

音声の符号化及び復号化 Download PDF

Info

Publication number
JP2008519991A
JP2008519991A JP2007539688A JP2007539688A JP2008519991A JP 2008519991 A JP2008519991 A JP 2008519991A JP 2007539688 A JP2007539688 A JP 2007539688A JP 2007539688 A JP2007539688 A JP 2007539688A JP 2008519991 A JP2008519991 A JP 2008519991A
Authority
JP
Japan
Prior art keywords
decoding
encoding
unit
frequency band
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007539688A
Other languages
English (en)
Other versions
JP2008519991A5 (ja
Inventor
ブリンケル,アルベルテュス セー デン
パロウ,フェリペ リエラ
ウェー イェー オーメン,アルノルデュス
アシュ エム ロル,ジャン−ベルナール
エス テ ヴィレト,ダヴィド
ジ−エル エム フィリップ,ピエリク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Koninklijke Philips NV
Original Assignee
France Telecom SA
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA, Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical France Telecom SA
Publication of JP2008519991A publication Critical patent/JP2008519991A/ja
Publication of JP2008519991A5 publication Critical patent/JP2008519991A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

音声符号化装置(100)は、音声信号(x(n))の過渡信号成分及び/又は正弦波信号成分を符号化して、残留信号(z(n))を生成する第1の符号化手段(101,111)と、残留信号を符号化する第2の符号化手段とを有する。第2の符号化手段は、残留信号の少なくとも2つの周波数帯域を選択するためのフィルタ手段(122)を有する。残留信号(z(n))の選択された周波数帯域(LH,HF)は、第1の符号化ユニット(123)及び第2の符号化ユニット(124)によって夫々符号化される。第1の符号化ユニット(123)は、時間領域エンコーダなどの波形エンコーダを有し、一方、第2のエンコーダユニット(124)はノイズエンコーダを有しうる。

Description

本発明は、音声の符号化及び復号化に関する。更に具体的には、本発明は、音声信号の過渡信号成分及び/又は正弦波信号成分を符号化して、残留信号を生成する第1の符号化手段と、残留信号を符号化する第2の符号化手段とを有する音声符号化装置に関する。本発明は、また、音声復号化装置と、音声信号を符号化する方法と、音声信号を復号する方法とに関する。
信号の伝送又は記憶に必要とされる帯域幅を低減するために音声信号を符号化することが知られる。様々な符号化技術が使用されており、これらの技術のほとんどは、特定の分類の信号に適する。異なった符号化技術は、異なった信号成分を有効に符号化するために同じ信号へ連続して適用されうる。例えば、音声信号の過渡信号成分が符号化され、その後、符号化された信号成分は、元の音声信号から減じられる。その場合に、結果として得られた信号の正弦波信号成分は、符号化され、その後、残留信号を得るために減じられる。この残留信号は、一般に、ノイズ信号を構成すると考えられており、例えば、その確率論的性質(例えば、電力、確率密度関数、電力スペクトル密度関数、及び/又はスペクトル時間エンベロープ)に基づいて残留信号を決定することによって、符号化されうる。
上述されたような配置の一例は、米国特許出願番号US2001/0032087(オーメン等、フィリップス社)に開示されている。この文献の内容全体は、本明細書に援用されている。
米国特許出願番号US2001/0032087
しかし、上記残留信号は、しばしば、典型的なノイズ信号ではないことが知られている。符号化誤差に起因して、全ての過渡信号成分及び正弦波信号成分が元の音声信号から除去されるわけではないことが起こり得る。結果として、残留信号は、一般に、「純粋な」ノイズに加えて、これらの成分の幾らかを含む。従って、このような残留信号へノイズモデルを適用することは、更なる符号化誤差を引き起こして、デコーダでの音響信号歪みをもたらしうる。
本発明は、従来技術のこれら及び他の問題を解決して、改善された精度により信号を符号化する音声符号化装置及び方法を提供することを目的とする。
本発明は、また、改善された精度により符号化された音声信号を復号する能力を有する復号化装置及び方法を提供することを目的とする。
従って、本発明は、音声信号の過渡信号成分及び/又は正弦波信号成分を符号化して、残留信号を生成する第1の符号化手段と、前記残留信号を符号化する第2の符号化手段とを有し、前記第2の符号化手段は、前記残留信号の少なくとも1つの周波数帯域を選択するフィルタ手段を有し、前記第2の符号化手段は、更に、前記選択された周波数帯域と、前記残留信号の更なる周波数帯域とを夫々符号化する少なくとも第1の符号化ユニット及び第2の符号化ユニットを有する、音声符号化装置を提供する。
周波数帯域毎に残留信号を符号化することによって、符号化技術と夫々の周波数帯域との間の一層より良い整合が得られる。周波数帯域間の符号化パラメータを変化させること、又は、様々な周波数帯域へ異なった符号化技術を適用することが可能である。結果として、残留信号の符号化誤差及び対応する信号歪みは、実質的に低減される。
特に、選択された周波数帯域は、主に符号化アーティファクトを含み、第1の符号化技術(例えば、波形符号化)により符号化されうる。一方、他の(例えば、残りの)周波数帯域は、主にノイズを含み、第2の異なる符号化技術(例えば、ノイズ符号化)により符号化されうる。異なった第1及び第2の符号化ユニットを用いることによって、改善された符号化精度が達成される。
好ましい実施例では、前記選択された(即ち、第1の)周波数帯域は、前記信号の周波数スペクトラムの比較的低い部分を有し、一方、前記更なる(即ち、第2の)周波数帯域は、比較的高い部分を有する。前記周波数スペクトラムのこれらの部分(周波数帯域)は、幾らかの重複を有しても、あるいは有さなくても良い。当然のことながら、例えば3、4又は5といった2よりも多い周波数帯域が選択されても良い。前記周波数帯域は、ともに、残留信号全体を実質的に構成しうるが、前記残留信号の幾つかの周波数が効率性のために符号化されない実施例も可能である。前記更なる(即ち、第2の)周波数帯域は、実質的に前記残留信号の周波数領域全体を含むが、また、フィルタ手段によって選択されて、前記周波数領域全体よりも相当に狭くても良い。
本発明者は、前記残留信号の高周波部分が、通常は、「純粋な」ノイズの良好な近似であり、従って、ノイズ信号としてモデル化可能である一方、低周波部分がノイズモデルから逸脱することに気付いた。具体的には、前記残留信号の低周波部分は、一般に、符号化誤差に起因するアーティファクトを含む。このようなアーティファクトは、残りの過渡信号成分及び正弦波信号成分を含みうる。
従って、有利に、前記第1の符号化ユニットは波形エンコーダを有し、一方、前記第2の符号化ユニットはノイズエンコーダを有する。これは、音声符号化装置が、前記第1の符号化ユニットが前記周波数スペクトラムのより低い部分を含む周波数帯域を符号化し、前記第2の符号化ユニットがより高い部分を含む周波数帯域を符号化するように配置される場合に、特に有利である。
特に適切な波形符号化技術は、分析合成(Analysis−by−Synthesis(AS))符号化である。従って、前記第1の符号化ユニットは、分析合成エンコーダを有することが好ましい。更に具体的には、前記第1の符号化ユニットは、規則的パルス励振(Regular Pulse excitation(RPE))エンコーダ、多重パルス励振(Multiple Pulse Excitation(MPE))エンコーダ、符号励振線形予測(Code−Excited Linear Prediction(CELP))エンコーダ、又はそれらのいずれかの組合せを有することが好ましい。これらのエンコーダは、時間領域エンコーダであって、通常は、発話音声(スピーチ)のために使用され、発話音声モデルを使用する。この理由ために、それらは、一般に音声(オーディオ)信号には使用され得ない。しかし、本発明者は、発話音声エンコーダが前記残留信号の選択された周波数帯域を符号化するために使用されうることに気付いた。適切な発話音声エンコーダ技術は、更に、デルタ変調及び適応差分パルス符号変調(ADPCM)を有する。RPE又はMPEエンコーダは、線形予測段を有しても良い。
前記フィルタ手段は、帯域分配器又は直交ミラーフィルタ(QMF)バンクを有することが好ましい。このような配置は、周波数帯域の効率的選択を可能にする。
前記第1の符号化手段は、過渡合成ユニット及び第1の結合ユニットへ結合された過渡パラメータ抽出ユニットと、正弦波パラメータ合成ユニット及び第2の結合ユニットへ結合された正弦波パラメータ抽出ユニットとを有しても良い。
当該音声符号化装置は、前記第1の符号化手段及び前記第2の符号化手段によって生成された信号を結合してマルチプレクスする結合及びマルチプレクスユニットを更に有しても良い。
本発明は、また、上記装置によって符号化された音声信号を復号する音声復号化装置であって、前記音声信号の前記過渡信号成分及び/又は前記正弦波信号成分を復号する第1の復号化手段と、前記残留信号を復号する第2の復号化手段とを有し、前記第2の復号化手段は、前記残留信号の第1の周波数帯域及び第2の周波数帯域を夫々復号する少なくとも第1の復号化ユニット及び第2の復号化ユニットと、前記残留信号の前記復号された第1の周波数帯域及び第2の周波数帯域を混合する混合ユニットとを有する、音声復号化装置を提供する。
有利に、前記第1の復号化ユニットは波形デコーダを有しても良く、一方、前記第2の復号化ユニットはノイズデコーダを有する。更に具体的には、前記第1の復号化ユニットは分析合成(AS)デコーダ、更に具体的には、規則的パルス励振(RPE)デコーダ、多重パルス励振(MPE)デコーダ、及び/又は符号励振線形予測(CELP)デコーダを有しても良い。
特に有利な実施例において、当該音声復号化装置は、更に、前記第1の周波数帯域及び/又は前記第2の周波数帯域を更に復号する第3の復号化ユニットを更に有し、前記第3の復号化ユニットは、前記第1及び/又は第2の復号化ユニットとは異なる復号方式を用いる。これは、代替の復号化技術の実質的に同時の使用を可能にする。更に、切替え手段が、前記第1の復号化ユニット又は前記第3の復号化ユニットのいずれか一方を前記混合ユニットへ選択的に接続するために設けられても良い。これは、当該復号化装置が、例えば信号品質測定又は外部制御信号に基づいて、いずれか一方の復号化ユニットから復号された信号を選択することを可能にする。この実施例は、スケーリング可能なビットストリームの復号化を可能にする。
前記第3の復号化ユニットは、前記第3の復号化ユニットによって復号される信号の周波数帯域を選択する更なるフィルタユニットを設けられても良い。即ち、前記第3の復号化ユニットによって出力される復号された信号は、幾つかの周波数帯域に分割されても良く、一方、それらの周波数帯域の夫々は、例えば、上述された第1の復号化ユニットなどの他の復号化ユニットによって復号化された対応する周波数帯域の代わりに選択的に使用されても良い。
本発明は、更に、上述されたような音声符号化装置及び音声復号化装置を有する音声伝送システムを提供する。
本発明は、また、音声信号の過渡信号成分及び/又は正弦波信号成分を符号化して、残留信号を生成するステップと、前記残留信号を符号化するステップとを有し、前記残留信号を符号化するステップは、前記残留信号の周波数帯域を選択するサブステップと、前記選択された周波数帯域と、前記残留信号の更なる周波数帯域とを別々に符号化するサブステップとを有する、音声符号化の方法を提供する。
前記選択された(即ち、第1の)周波数帯域は比較的低い周波数を有しても良く、一方、前記更なる(即ち、第2の)周波数帯域は比較的高い周波数を有しても良い。前記更なる周波数帯域は、前記残留信号の周波数領域全体、又は、選択された有限な周波数帯域を有しても良い。
前記選択された周波数帯域を符号化するステップは波形符号化を含んでも良く、一方、前記更なる周波数帯域を符号化するステップはノイズ符号化を含んでも良い。更に具体的には、前記選択された周波数帯域を符号化するステップは分析合成(AS)符号化、更に具体的には、規則的パルス励振(RPE)符号化、多重パルス励振(MPE)符号化、及び/又は符号励振線形予測(CELP)符号化を含んでも良い。
本発明の音声符号化方法の他の実施例は、本発明の明細書から明らかとなるであろう。
更に、本発明は、音声信号を復号する方法であって、前記音声信号の過渡信号成分及び/又は正弦波信号成分を復号するステップと、残留信号を復号するステップとを有し、前記残留信号を復号するステップは、前記残留信号の第1の周波数帯域及び第2の周波数帯域を別々に復号するサブステップと、前記復号された第1の周波数帯域及び第2の周波数帯域を結合するサブステップとを有する、方法を提供する。
有利に、前記第1の周波数帯域を復号するサブステップは波形復号化を含んでも良く、一方、前記第2の周波数帯域を復号するサブステップはノイズ復号化を含む。更に具体的には、前記第1の周波数帯域を復号するサブステップは分析合成(AS)復号化、更に具体的には、規則的パルス励振(RPE)復号化、多重パルス励振(MPE)復号化、及び/又は符号励振線形予測(CELP)復号化を含んでも良い。
本発明の音声復号化方法は、更に、異なる復号方式により更に前記第1の周波数帯域及び/又は前記第2の周波数帯域を復号するサブステップを更に有しても良い。更に、当該方法は、前記最初に復号された周波数帯域又は前記更に復号された周波数帯域のいずれか一方を選択的に用いるサブステップを更に有しても良い。
本発明は、更に、上述された方法を実行するコンピュータプログラムプロダクトを提供する。コンピュータプログラムプロダクトは、例えば、CD(コンパクトディスク)、DVD(デジタル・バーサトル・ディスク)、フロッピー(登録商標)ディスク、又はいずれかの他の適切な媒体などの情報媒体に記憶された、コンピュータが実行可能な命令(コンピュータプログラム)の組を有することができる。代替的に、前記コンピュータが実行可能な命令の組は、例えばインターネットを介して、遠くのサーバからダウンロードされても良い。前記コンピュータが実行可能な命令の組は、コンピュータが本発明の方法を実行することを可能にするものであって、機械言語、アセンブリ言語、又は、例えばC++若しくはJava(登録商標)などの高度なプログラミング言語で提供されうる。本発明の絶対不可欠な方法ステップを実行する能力を有する如何なるコンピュータ実行可能なプログラムも、上述されたコンピュータプログラムプロダクトを構成すると考えられる。本発明のコンピュータプログラムを実行するために必要な特定の形式のコンピュータは関連しない。
以下、添付の図面に表される例となる実施形態を参照して本発明について更に説明する。
図1に単なる限定されない例として示される伝送システムは、音声符号化装置100´及び音声復号化装置200´を有する。従来技術の音声符号化装置100´は、「パラメトリック音声コーダ」としても知られ、3つの段階で音声信号x(n)を符号化する。このような形式の音声伝送システムは、上記米国特許出願番号US2001/0032087に開示される。
第1の段階では、音声信号x(n)の如何なる過渡信号成分も、過渡パラメータ抽出(TPE)ユニット101により符号化される。パラメータは、結合及びマルチプレクス(C&M)ユニット150並びに過渡合成(TS)ユニット102の両方へ供給される。結合及びマルチプレクスユニット150は、復号化装置200´への送信のためにパラメータを適切に結合してマルチプレクスし、過渡合成ユニット102は符号化された過渡信号を再構成する。これらの再構成された過渡信号は、その過渡信号が実質的に除去された中間信号y(n)を形成するよう、第1の結合ユニット103で元の音声信号x(n)から減じられる
第2の段階では、中間信号y(n)の如何なる正弦波信号成分(即ち、サイン波及びコサイン波)も、正弦波パラメータ抽出(SPE)ユニット111によって符号化される。結果として得られるパラメータは、結合及びマルチプレクスユニット150と、正弦波合成(SS)ユニット112とへ供給される。正弦波合成ユニット112によって再構成された正弦波信号は、残留信号z(n)を得るよう、第2の結合ユニット113で中間信号y(n)から減じられる。
第3の段階では、残留信号z(n)は、時間/周波数エンベロープ抽出(TFE)ユニット121により符号化される。明らかなように、残留信号z(n)は、過渡信号及び正弦波信号が第1及び第2の段階で除去される場合に、ノイズ信号であると考えられる。従来技術に従うノイズモデル化及び符号化の技術の概説は、1999年、アメリカ合衆国、スタンフォード大学、S.N.レビンによる論文「Audio Representations for Data Compression and Compressed Domain Processing(データ圧縮及び圧縮領域処理のための音声表示)」の第5章に提示されている。
3つの段階の全てから結果として得られるパラメータは、結合及びマルチプレクス(C&M)ユニット150によって適切に結合されてマルチプレクスされる。結合及びマルチプレクスユニット150は、また、パラメータの更なる符号化、例えば、ハフマン符号化又は時間差分符号化などを実行して、伝送のために必要とされる帯域幅を低減する。パラメータ抽出(即ち、符号化)ユニット101、111及び121は、抽出されたパラメータの量子化を行っても良い。代替的に又は付加的に、量子化は、結合及びマルチプレクスユニット(C&M)150で実行されても良い。
C&Mユニット150で結合されてマルチプレクスされた(更に、随意的に、符号化及び/又は量子化された)後に、パラメータは、ユニット150と250との間の矢印によって図1で示されるように、伝送媒体を介して送信される。伝送媒体は、衛星リンク、グラスファイバーケーブル、銅ケーブル、及び/又は如何なる他の適切な媒体を有しても良い。
明らかなように、x(n)、y(n)及びz(n)はデジタル信号であり、nはサンプル番号を表す。
図1の復号化装置200´は、符号化の段階に対応する3つの段階で、送信された信号パラメータを復号する。デマルチプレクス及び分割(D&D)ユニット250で信号パラメータを受信し、デマルチプレクスして分割した後、過渡パラメータは過渡合成(TS)ユニット202へ供給される。過渡合成ユニット202は、符号化装置100´の対応ユニット102と同様に、信号の過渡信号成分を再構成する。正弦波パラメータは、対応ユニット112と同様に、正弦波合成(SS)ユニット212で正弦波信号成分を再構成するために使用される。再構成された過渡信号成分及び正弦波信号成分は、第1の結合ユニット203で結合される。
ノイズパラメータ(時間及び/又は周波数エンベロープデータ)は、ノイズ発生器227へ結合された時間/周波数成形(TFS)ユニット221によって使用される。再構成された残留信号は、再構成された音声信号x´(n)を生成するよう、第2の結合ユニット213で、再構成された過渡信号及び正弦波信号と結合される。
この従来技術の伝送システムは、元の音声信号が正確にモデル化される場合には、具体的には、残留信号z(n)が「実際の」ノイズのみを有する場合には、うまく機能する。しかし、実際には、これは、しばしば事実とは異なる。最初の2つの段階における信号モデル化及びパラメータ抽出の誤差は、残留信号z(n)に依然として過渡信号及び正弦波信号のトレースを含ませうる。更に、元の音声信号x(n)は、構成する信号成分に容易に分割され得ない構成を有しうる。結果として、残留信号z(n)は、実際のノイズ信号ではなく、従って、ノイズ信号として適切にモデル化され得ない。従って、TFEユニット121によって抽出されたエンベロープデータは、不正確であり、復号化装置200´での残留信号の不正確な再構成、及び知覚的に不正確な(即ち、歪んだ)再構成音声信号x´(n)を生じさせる。
本発明は、残留信号z(n)の改善された符号化を提供して、再構成音声信号x´(n)の歪みの著しい低減を実現することによって上記問題を解決する。本発明に従う符号化装置の実施例は図2aに表され、一方、対応する復号化装置は図2bに表される。
図2aに単に限定されない例として示される本発明の符号化装置100は、同じく、過渡パラメータ抽出(TPE)ユニット101と、過渡合成(TS)ユニット102と、第1の結合ユニット103と、正弦波パラメータ抽出(SPE)ユニット111と、正弦波合成(SS)ユニット112と、第2の結合ユニット113と、結合及びマルチプレクス(C&M)ユニット150とを有する。しかし、単一の時間/周波数エンベロープデータ抽出(TFE)ユニット121が、帯域分配器(BS)122と、第1の符号化ユニット123と、第2の符号化ユニット124とに置き換えられている。帯域分配器122は、残留信号z(n)をフィルタ処理して、本例でLF(低周波)及びHF(高周波)で夫々示される多数の通過帯域に分割する。
残留信号を多数の周波数帯域に分割することによって、符号化ユニットをそれらの夫々の周波数帯域へ適合させることが可能である。当然、残留信号の夫々の周波数帯域は特有の特性を有し、符号化ユニットは残留信号を最適に符号化するようそれらの特性に適合させられうる。更に、当然のことながら、3、4、5、6又はそれ以上の周波数帯域及び関連する符号化ユニットが利用されても良い。
図2aに示される実施例では、第1の(LF)符号化ユニット123は、時間領域符号化ユニット、具体的には、発話音声符号化技術を用いる符号化ユニットである。当業者には明らかなように、発話音声符号化及びオーディオ符号化は、一般的に通常は、大変異なった符号化技術を必要とする。一般に、発話音声符号化は、発話信号を解析するために人間の声道モデルを使用し、一方、このようなモデルは、一般には音響に適用することができず、任意のオーディオ信号に適用される場合には信号歪みを生じさせうる。しかし、本発明者は、発話音声符号化技術が、問題となっている符号化装置の残留信号の低周波部分を符号化するために極めて適切であることに気付いた。
(第1の)符号化ユニット123は、本例では、例えば分析合成(Analysis−by−Synthesis(AS))エンコーダなどの波形エンコーダ(WE)によって構成され、更に具体的には、RPE(規則的パルス励振)エンコーダ、MPE(多重パルス励振)エンコーダ、及び/又はCELP(符号励振線形予測)エンコーダを有しても良い。それら及び他の符号化技術に関して、1994年10月、IEEE議事録Vol.82、No.10、A.S.スパニアスによる「Speech Coding:A Tutorial Review(発話音声符号化:指導書概説)」が参照される。この文献の全体の内容は、本願に援用される。
(第2の)符号化ユニット124は、「標準的」ノイズエンコーダである。このようなエンコーダは、例えば出力、出力スペクトル密度関数、及び/又はスペクトル時間的エンベロープなどの1又はそれ以上の確率論的事項(パラメータ)で信号を表す。当業者には明らかなように、これらのパラメータは、例えば、周波数エンベロープを決定するためのラゲール・フィルタリング、及び(ノイズ)信号の時間エンベロープを決定するための線形予測符号化などの周知技術により決定されうる。
第2の符号化ユニット124は、本例では、残留信号z(n)のHF(高周波)部分を符号化する。本発明者は、残留信号の高周波部分が、実質的に、ノイズエンコーダにより有効に符号化されうる「実際の」ノイズから成ることに気付いた。しかし、残留信号のLF(低周波)部分は、ノイズ符号化技術に適合しないが、例えば発話音声符号化技術により適切に符号化されうる過渡信号及び正弦波信号の残余部を含むことが分かっている。本発明の「複合型」符号化技術を用いることによって、残留信号の極めて正確な符号化が達成可能である。
第1の符号化ユニット123及び第2の符号化ユニット124によって生成されるパラメータは、過渡パラメータ抽出(TPE)ユニット101及び正弦波パラメータ抽出(SPE)ユニット111によって生成された信号パラメータとともに、結合及びマルチプレクスユニット150へ供給される。次に、結合されてマルチプレクスされたパラメータは、例えばパラメトリック・ビットストリームとして、適切な伝送経路を介して送信されうる。このようなビットストリームは、例えば、4つのセクション、即ち、ヘッダ、過渡パラメータ、正弦波パラメータ、及びノイズ(残留信号)パラメータから成る。
図2aの実施例では、過渡パラメータ抽出(TPE)ユニット101及び正弦波パラメータ抽出(SPE)ユニット111は、音声信号x(n)の周波数スペクトラム全体に関して動作し、一方、第1の符号化ユニット123及び第2の符号化ユニット124は、周波数スペクトラムの選択された部分に対して動作する。その選択は、帯域分配器(BS)122によって実行される。従って、過渡信号成分及び正弦波信号成分の周波数に依存しない符号化と、残留信号の周波数依存の符号化とが実現される。更に、この周波数依存の符号化は、異なった符号化技術を利用する別個の符号化ユニットによって実行される。
本発明に従う例となる復号化装置200が図2bに表される。図2bの装置200は、図2aの装置100によって符号化された音声信号を復号するよう設計される。
図2bの復号化装置200は、図1の従来技術の復号化装置200´と類似しており、同じく、デマルチプレクス及び分割(D&D)ユニット250と、過渡合成(TS)ユニット202と、正弦波合成(SS)ユニット212と、第1の結合ユニット203と、第2の結合ユニット213とを有する。しかし、従来技術の復号化装置200´とは対照的に、図2bに示される本発明の復号化装置200は、並列に配置され且つ混合(M)ユニット222へ結合された第1の復号化ユニット223及び第2の復号化ユニット224を有する。第1の復号化ユニット223は、残留信号を表すパラメータの第1の部分、本例では低周波(LF)部分を受信する。同様に、第2の復号化ユニット224は、残留信号を表すパラメータの第2の部分、本例では高周波(HF)部分を受信する。これらの別個の信号パラメータの組は、夫々の復号化ユニット223及び224で別々に復号され、結果として得られる残留信号の部分は、再構成残留信号を形成するよう混合ユニット222によって適切に混合される。第2の結合ユニット213は、この再構成残留信号を、再構成音声信号x´(n)を形成するよう、再構成された過渡信号成分及び正弦波信号成分と結合する。
当然のことながら、2つの結合ユニット203及び213は、多数の入力を有する単一の結合ユニットに結合されても良い。結合ユニットが混合ユニット222に一体化される実施例も考えられる。
示される実施例では、第1の復号化ユニット223は波形デコーダ(WD)であり、一方、第2の復号化ユニット224はノイズデコーダ(ND)によって構成される。一般に、復号化ユニット223及び224は、符号化装置100の対応する符号化ユニットに整合するように選択されうる。復号化ユニット223の波形デコーダは、対応するエンコーダに依存して、分析合成(Analysis−by−Synthesis(AS))デコーダ、更に具体的には、RPE(規則的パルス励振)デコーダ、MPE(多重パルス励振)デコーダ、及び/又はCELP(符号励振線形予測)デコーダであっても良い。
残留信号の2又はそれ以上の周波数帯域を別々に符号化及び復号化することによって、残留信号z(n)のより一層正確な再構成が得られる。
本発明の符号化装置100の代替の実施例が図3aに表される。図3aで、帯域分配器122は、QMF(直交ミラーフィルタ)分析フィルタ(QAF)バンク125に置換されている。このフィルタバンクは、残留信号z(n)を、図3aで0〜3の番号を付された4つの周波数帯域に分割する。示される実施例では、最低周波数帯域(帯域0)は、CELP(符号励振線形予測)エンコーダ(CE)ユニット126によって符号化され、他の周波数帯域は、時間/周波数エンベロープデータ抽出(TFE)ユニット121によって符号化される。明らかなように、これらのTFEユニット121は、夫々、図1で表される従来技術のTFEユニット121と同一である。しかし、従来技術の符号化装置では、単一のTFEユニット121しか使用されておらず、一方、本発明の符号化装置では、TFEユニット121は、少なくとも1つの他の符号化ユニットに並列に配置されており、夫々の符号化ユニットは、特定の周波数帯域に関連付けられている。示される例では、3つのTFEユニット121は、CE(CELPエンコーダ)ユニット126へ並列に配置されている。これら全ての符号化ユニットは、過渡パラメータ抽出(TPE)ユニット101及び正弦波パラメータ抽出(SPE)ユニット111とともに、結合及びマルチプレクス(C&M)ユニット150へ結合されている。
当業者には明らかなように、QMF分析フィルタ(QAF)バンク125はフィルタバンクの有効な実施を提供するが、代替のフィルタ配置が同様の結果を得るために使用され得る。同様に、単一のCELPエンコーダユニット126及び3つのTFEユニット121の選択は、QMF分析フィルタバンク125(又はその等価なもの)によって選択された特定の周波数帯域に依存しうる。本発明者は、残留信号のより低い周波数は、例えばCELP又はRPE符号化などの波形符号化により正確且つ効率的に符号化可能であり、一方、より高い周波数は(時間及び/又は周波数)エンベロープデータ抽出により適切に符号化されうることに気付いた。この理由は、より低い周波数は過渡信号成分及び正弦波信号成分の残余部と、場合により符号化アーティファクトとを含み、一方、より高い周波数は「純粋な」ノイズに類似しうるためである。
当然のことながら、CELPエンコーダユニット126は、例えばRPEエンコーダユニット、MPEエンコーダユニット、又は他の波形符号化ユニットなど、他のエンコーダユニットに置換されても良い。
図3aの符号化装置に対応する復号化装置は図3bに示される。図3bの例となる復号化装置200は、CELPデコーダ(CD)ユニット226と、3つの時間/周波数成形(TFS)ユニット221とを有する。夫々の時間/周波数成形(TFS)ユニット221は、ノイズ発生器227へ結合されている(当然のことながら、単一のノイズ発生器227が、全ての時間/周波数成形ユニット221に対してノイズ信号を発生させるために使用されても良い。)。
CELP復号化ユニット226及び3つの時間/周波数成形ユニット221は、残留信号の(図3bで0から3の番号を付された)夫々の周波数帯域を再構成するよう、デマルチプレクス及び分割(D&D)(及び随意的に、復号化)ユニット225から信号パラメータを受信する。再構成された部分的な信号は、QMF(直交ミラーフィルタ)合成フィルタ(QSF)バンク225へ供給され、QSFバンク225で残留信号は再構成される。次に、この再構成された残留信号は、再構成音声信号x´(n)を生成するよう(第2の)結合ユニット213へ供給される。
図4aの符号化装置100は、同様に、残留信号z(n)を(0〜3の番号を付された)4つの周波数帯域に分割するQMF(直交ミラーフィルタ)分析フィルタ(QAF)バンク125を有する。図3aとは対照的に、図4aの実施例は、また、第2の結合ユニット113と、結合及びマルチプレクス(C&M)ユニット150との間に、即ち、QMF分析フィルタバンク125及び符号化ユニット126に並列に結合された時間/周波数エンベロープデータ抽出(TFE)ユニット121を有する。この特に有利な実施例では、残留信号z(n)は、最初は従来技術の場合と同じく符号化されたノイズであるが、更に、符号化ユニット126によって周波数帯域ごとに符号化された波形である。結合及びマルチプレクスユニット150は、時間/周波数エンベロープデータ抽出ユニット121によって生成されたパラメータの幾つかが符号化ユニット126によって上書きされうるように配置されうる。その場合に、(CELP又は等価な)エンコーダユニット126は、改善された信号パラメータを供給するよう働き、一方、TFEユニット121は、基本信号パラメータを供給するよう働く。代替的に、TFEユニット121及びCELPエンコーダユニット126の両方からのパラメータが送信されても良い。
結合されてマルチプレクスされたパラメータは、拡張可能なビットストリームとして配置されうる。このようなビットストリームは、例えば、8つのセクション、即ち、ヘッダ、過渡パラメータ、正弦波パラメータ、ノイズパラメータ、及び、CELP(又は等価な)パラメータのための4つの更なるセクションから成っても良い。このような構成を有するビットストリームは、夫々のCELPパラメータセクションの前又は後で切り捨てられても良い。明らかなように、夫々のCELPパラメータセクションは、最初の4つのセクションによって構成される基本層で伝送される音声を拡張するためのエンハンスメント層として考えられる。
結合及びマルチプレクスユニット150は、どのエンコーダユニット(即ち、4つのCEユニット126又はTFEユニット121のどれ)が特定のパラメータを生成するために使用されたかを示す情報を送信することができる。このエンコーダ情報は、復号化装置が適切な復号化ユニットを選択することを可能にする。代替的に、復号化装置は、送信されたパラメータを基にこのような選択を行う。例えば、QMF分析フィルタバンク229でのある周波数帯域のエネルギーが、CELPデコーダ226での同じ帯域のエネルギーよりも著しく大きい場合に、QMF分析フィルタバンク229は、その特定の周波数帯域に関して選択されるべきである。
明らかなように、単一のCELPエンコーダ(CE)ユニット126のみが、従来技術に対する改良を予め提供するよう存在しうる。このような実施例では、単一のCELPエンコーダユニット126は、残留信号z(n)の周波数領域全体、又はその選択された周波数帯域のみを符号化することができる。代替的に、2又は3のCELPエンコーダユニット126は、夫々関連する周波数帯域を符号化するために設けられても良い。有利に、最も高い周波数帯域のCELPエンコーダユニット126は、この周波数帯域が「純粋な」ノイズに類似する信号を含む可能性が最も高いので、省略されても良い。
更に、符号化ユニット126は、また、夫々、CELPエンコーダの代わりに(又は、それに加えて)、RPE、MPE又は他のエンコーダ(一般に、波形エンコーダ)を有しても良いことが知られる。
図4aの符号化装置に対応する復号化装置は図4bに示される。図4bの例となる復号化装置200は、夫々(0〜3の番号を付された)選択された周波数帯域のための複数のCELPデコーダ(CD)ユニット226を有する。更に、(ノイズ発生器227へ結合された)時間/周波数成形(TFS)ユニット221は、デコーダユニット226へ並列に配置されている。時間/周波数成形(TFS)ユニット221によって再構成された(残留)信号は、QMF分析フィルタ(QAF)バンク229へ供給されて、(0〜3の番号を付された)複数の周波数帯域に分割される。ひと組のスイッチ230は、CELPデコーダユニット226又はQMF分析フィルタバンク229のいずれか一方をQMF合成フィルタ(QSF)バンク225へ接続する能力を有する。スイッチ230は、デマルチプレクス及び分割(D&D)ユニット250から選択情報を受信するスイッチ制御ユニット231によって個々に制御される。従って、夫々の周波数帯域は、時間/周波数成形(TFS)ユニット221又はCELPデコーダ(CD)ユニット226のいずれかにより復号されうる。代替的に、スイッチ制御ユニット231は、残留信号の品質を測定して、その測定された信号品質に従ってスイッチ230を制御する信号品質試験ユニットを設けられても良い。
当然のことながら、CELPデコーダユニット226は、例えばRPE又はMPEデコーダユニットなどの等価なデコーダユニットにより個々に又は集合的に置換されても良い。更なる変形が可能であり、例えば、時間/周波数成形(TFS)ユニット221はQAFユニット229に一体化されても良い。
本発明は、音声信号から過渡信号成分及び正弦波信号成分を減じた後に、残留信号が「純粋な」ノイズではなく、そのようなものとして正確に符号化され得ないという見識に基づく。本発明は、残留信号が周波数帯域毎に残留信号を符号化することによってより正確に符号化され得るという更なる見識から恩恵を受ける。このことは、更に、特定の符号化技術を周波数帯域に依存して使用させることを可能にする。
本願で使用される如何なる用語も、本発明の適用範囲を限定するように解釈されるべきではない。具体的には、語「有する」は、特に挙げられていない如何なる要素も排除することを意味しているわけではない。単一の(回路)素子は、複数の(回路)素子又はそれらの等価なものにより置換されても良い。
当業者にとっては明らかなように、本発明は上記実施例に限定されず、多数の変更及び付加が添付の特許請求の範囲で定められる本発明の適用範囲から逸脱することなくなされうる。
従来技術に従う符号化装置及び復号化装置を有する伝送システムを示す。 本発明に従う符号化装置の第1の実施例を示す。 本発明に従う復号化装置の第1の実施例を示す。 本発明に従う符号化装置の第2の実施例を示す。 本発明に従う復号化装置の第2の実施例を示す。 本発明に従う符号化装置の第3の実施例を示す。 本発明に従う復号化装置の第3の実施例を示す。

Claims (35)

  1. 音声信号の過渡信号成分及び/又は正弦波信号成分を符号化して、残留信号を生成する第1の符号化手段と、
    前記残留信号を符号化する第2の符号化手段とを有し、
    前記第2の符号化手段は、前記残留信号の少なくとも1つの周波数帯域を選択するフィルタ手段を有し、
    前記第2の符号化手段は、更に、前記選択された周波数帯域と、前記残留信号の更なる周波数帯域とを夫々符号化する少なくとも第1の符号化ユニット及び第2の符号化ユニットを有する、音声符号化装置。
  2. 前記フィルタ手段は、前記選択された周波数帯域が比較的低い周波数を有し、前記更なる周波数帯域が比較的高い周波数を有するように配置される、請求項1記載の音声符号化装置。
  3. 前記フィルタ手段は、前記更なる周波数帯域を更に選択するよう配置される、請求項1記載の音声符号化装置。
  4. 前記更なる周波数帯域は、実質的に前記残留信号の周波数領域全体を含む、請求項1記載の音声符号化装置。
  5. 前記第1の符号化ユニットは波形エンコーダを有し、前記第2の符号化ユニットはノイズエンコーダを有する、請求項1記載の音声符号化装置。
  6. 前記第1の符号化ユニットは分析合成(AS)エンコーダを有する、請求項5記載の音声符号化装置。
  7. 前記第1の符号化ユニットは、規則的パルス励振(RPE)エンコーダ、及び/又は多重パルス励振(MPE)エンコーダ、及び/又は符号励振線形予測(CELP)エンコーダを有する、請求項5記載の音声符号化装置。
  8. 前記フィルタ手段は、帯域分配器又は直交ミラーフィルタ(QMF)バンクを有する、請求項1記載の音声符号化装置。
  9. 前記第1の符号化手段は、過渡合成ユニット及び第1の結合ユニットへ結合された過渡パラメータ抽出ユニットと、正弦波パラメータ合成ユニット及び第2の結合ユニットへ結合された正弦波パラメータ抽出ユニットとを有する、請求項1記載の音声符号化装置。
  10. 前記第1の符号化手段及び前記第2の符号化手段によって生成された信号を結合してマルチプレクスする結合及びマルチプレクスユニットを更に有する、請求項1記載の音声符号化装置。
  11. 請求項1記載の音声符号化装置によって符号化された音声信号を復号する音声復号化装置であって、
    前記音声信号の前記過渡信号成分及び/又は前記正弦波信号成分を復号する第1の復号化手段と、
    前記残留信号を復号する第2の復号化手段とを有し、
    前記第2の復号化手段は、前記残留信号の第1の周波数帯域及び第2の周波数帯域を夫々復号する少なくとも第1の復号化ユニット及び第2の復号化ユニットと、前記残留信号の前記復号された第1の周波数帯域及び第2の周波数帯域を混合する混合ユニットとを有する、音声復号化装置。
  12. 前記第1の復号化ユニットは波形デコーダを有し、前記第2の復号化ユニットはノイズデコーダを有する、請求項11記載の音声復号化装置。
  13. 前記第1の復号化ユニットは分析合成(AS)デコーダを有する、請求項12記載の音声復号化装置。
  14. 前記第1の復号化ユニットは、規則的パルス励振(RPE)デコーダ、多重パルス励振(MPE)デコーダ、及び/又は符号励振線形予測(CELP)デコーダを有する、請求項12記載の音声復号化装置。
  15. 前記混合手段は、直交ミラーフィルタ(QMF)合成フィルタバンクを有する、請求項11記載の音声復号化装置。
  16. 更に前記第1の周波数帯域及び/又は前記第2の周波数帯域を復号する第3の復号化ユニットを更に有し、
    前記第3の復号化ユニットは、前記第1及び/又は第2の復号化ユニットとは異なる復号方式を用いる、請求項11記載の音声復号化装置。
  17. 前記第1の復号化ユニット又は前記第3の復号化ユニットのいずれか一方を前記混合ユニットへ選択的に接続する切替え手段を更に有する、請求項16記載の音声復号化装置。
  18. 前記第3の復号化ユニットは、前記第3の復号化ユニットによって復号される信号の周波数帯域を選択する更なるフィルタユニットを設けられる、請求項11記載の音声復号化装置。
  19. 前記第1の復号化手段は、過渡合成ユニット及び第1の結合ユニットと、正弦波パラメータ合成ユニット及び第2の結合ユニットとを有する、請求項11記載の音声復号化装置。
  20. 伝送チャネルから受信されたパラメータをデマルチプレスして分割するデマルチプレクス及び分割ユニットを更に有する、請求項11記載の音声復号化装置。
  21. 請求項1記載の音声符号化装置と、請求項11記載の音声復号化装置とを有する音声伝送システム。
  22. 音声信号の過渡信号成分及び/又は正弦波信号成分を符号化して、残留信号を生成するステップと、
    前記残留信号を符号化するステップとを有し、
    前記残留信号を符号化するステップは、前記残留信号の周波数帯域を選択するサブステップと、前記選択された周波数帯域と、前記残留信号の更なる周波数帯域とを別々に符号化するサブステップとを有する、音声符号化の方法。
  23. 前記選択された周波数帯域は比較的低い周波数を有し、前記更なる周波数帯域は比較的高い周波数を有する、請求項22記載の方法。
  24. 前記更なる周波数帯域は、また、選択された周波数帯域である、請求項22記載の方法。
  25. 前記更なる周波数帯域は、実質的に前記残留信号の周波数領域全体を含む、請求項22記載の方法。
  26. 前記選択された周波数帯域を符号化するステップは波形符号化を含み、
    前記更なる周波数帯域を符号化するステップはノイズ符号化を含む、請求項22記載の方法。
  27. 前記選択された周波数帯域を符号化するステップは分析合成(AS)符号化を含む、請求項26記載の方法。
  28. 前記選択された周波数帯域を符号化するステップは、規則的パルス励振(RPE)符号化、多重パルス励振(MPE)符号化、及び/又は符号励振線形予測(CELP)符号化を含む、請求項26記載の方法。
  29. 請求項22記載の方法によって符号化された音声信号を復号する方法であって、
    前記音声信号の前記過渡信号成分及び/又は前記正弦波信号成分を復号するステップと、
    前記残留信号を復号するステップとを有し、
    前記残留信号を復号するステップは、前記残留信号の第1の周波数帯域及び第2の周波数帯域を別々に復号するサブステップと、前記復号された第1の周波数帯域及び第2の周波数帯域を結合するサブステップとを有する、方法。
  30. 前記第1の周波数帯域を復号するサブステップは波形復号化を含み、
    前記第2の周波数帯域を復号するサブステップはノイズ復号化を含む、請求項29記載の方法。
  31. 前記第1の周波数帯域を復号するサブステップは分析合成(AS)復号化を含む、請求項30記載の方法。
  32. 前記第1の周波数帯域を復号するサブステップは、規則的パルス励振(RPE)復号化、多重パルス励振(MPE)復号化、及び/又は符号励振線形予測(CELP)復号化を含む、請求項30記載の方法。
  33. 異なる復号方式により更に前記第1の周波数帯域及び/又は前記第2の周波数帯域を復号するサブステップを更に有する、請求項29記載の方法。
  34. 前記最初に復号された周波数帯域又は前記更に復号された周波数帯域のいずれか一方を選択的に用いるサブステップを更に有する、請求項33記載の方法。
  35. 請求項22又は請求項29に記載された方法を実行するコンピュータプログラム。
JP2007539688A 2004-11-09 2005-11-03 音声の符号化及び復号化 Pending JP2008519991A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04105633 2004-11-09
PCT/IB2005/053591 WO2006051451A1 (en) 2004-11-09 2005-11-03 Audio coding and decoding

Publications (2)

Publication Number Publication Date
JP2008519991A true JP2008519991A (ja) 2008-06-12
JP2008519991A5 JP2008519991A5 (ja) 2008-11-27

Family

ID=35892382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007539688A Pending JP2008519991A (ja) 2004-11-09 2005-11-03 音声の符号化及び復号化

Country Status (6)

Country Link
US (1) US20090070118A1 (ja)
EP (1) EP1815462A1 (ja)
JP (1) JP2008519991A (ja)
KR (1) KR20070109982A (ja)
CN (1) CN101167128A (ja)
WO (1) WO2006051451A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010526346A (ja) * 2007-05-08 2010-07-29 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号の符号化及び復号化方法並びにその装置
WO2011045927A1 (ja) * 2009-10-14 2011-04-21 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2011045926A1 (ja) * 2009-10-14 2011-04-21 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP2013045084A (ja) * 2011-08-26 2013-03-04 Yamaha Corp 信号処理装置
JP2014109669A (ja) * 2012-11-30 2014-06-12 Kddi Corp 音声合成装置、音声合成方法および音声合成プログラム
JP2014531063A (ja) * 2011-10-24 2014-11-20 エルジー エレクトロニクスインコーポレイティド 音声信号の帯域選択的量子化方法及び装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008100503A2 (en) * 2007-02-12 2008-08-21 Dolby Laboratories Licensing Corporation Improved ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
ES2391228T3 (es) 2007-02-26 2012-11-22 Dolby Laboratories Licensing Corporation Realce de voz en audio de entretenimiento
KR101410230B1 (ko) 2007-08-17 2014-06-20 삼성전자주식회사 종지 정현파 신호와 일반적인 연속 정현파 신호를 다른방식으로 처리하는 오디오 신호 인코딩 방법 및 장치와오디오 신호 디코딩 방법 및 장치
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
WO2009066869A1 (en) * 2007-11-21 2009-05-28 Electronics And Telecommunications Research Institute Frequency band determining method for quantization noise shaping and transient noise shaping method using the same
KR100938282B1 (ko) * 2007-11-21 2010-01-22 한국전자통신연구원 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과,그를 이용한 양자화 잡음 처리 방법
KR101413967B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8831937B2 (en) * 2010-11-12 2014-09-09 Audience, Inc. Post-noise suppression processing to improve voice quality
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1020888A (ja) * 1996-07-02 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化・復号化装置
JPH11330977A (ja) * 1998-03-11 1999-11-30 Matsushita Electric Ind Co Ltd オ―ディオ信号符号化装置、オ―ディオ信号復号化装置、及び、オ―ディオ信号符号化・復号化装置
WO2000019414A1 (en) * 1998-09-26 2000-04-06 Liquid Audio, Inc. Audio encoding apparatus and methods
JP2002372996A (ja) * 2001-06-15 2002-12-26 Sony Corp 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体
JP2003527632A (ja) * 2000-03-15 2003-09-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化用のラゲール関数

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1020888A (ja) * 1996-07-02 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化・復号化装置
JPH11330977A (ja) * 1998-03-11 1999-11-30 Matsushita Electric Ind Co Ltd オ―ディオ信号符号化装置、オ―ディオ信号復号化装置、及び、オ―ディオ信号符号化・復号化装置
WO2000019414A1 (en) * 1998-09-26 2000-04-06 Liquid Audio, Inc. Audio encoding apparatus and methods
JP2003527632A (ja) * 2000-03-15 2003-09-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化用のラゲール関数
JP2002372996A (ja) * 2001-06-15 2002-12-26 Sony Corp 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010526346A (ja) * 2007-05-08 2010-07-29 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号の符号化及び復号化方法並びにその装置
WO2011045927A1 (ja) * 2009-10-14 2011-04-21 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2011045926A1 (ja) * 2009-10-14 2011-04-21 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP5544371B2 (ja) * 2009-10-14 2014-07-09 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP5544370B2 (ja) * 2009-10-14 2014-07-09 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
US8949117B2 (en) 2009-10-14 2015-02-03 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device and methods therefor
US9009037B2 (en) 2009-10-14 2015-04-14 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, and methods therefor
JP2013045084A (ja) * 2011-08-26 2013-03-04 Yamaha Corp 信号処理装置
JP2014531063A (ja) * 2011-10-24 2014-11-20 エルジー エレクトロニクスインコーポレイティド 音声信号の帯域選択的量子化方法及び装置
US9390722B2 (en) 2011-10-24 2016-07-12 Lg Electronics Inc. Method and device for quantizing voice signals in a band-selective manner
JP2014109669A (ja) * 2012-11-30 2014-06-12 Kddi Corp 音声合成装置、音声合成方法および音声合成プログラム

Also Published As

Publication number Publication date
US20090070118A1 (en) 2009-03-12
WO2006051451A1 (en) 2006-05-18
KR20070109982A (ko) 2007-11-15
CN101167128A (zh) 2008-04-23
EP1815462A1 (en) 2007-08-08

Similar Documents

Publication Publication Date Title
JP2008519991A (ja) 音声の符号化及び復号化
RU2646314C1 (ru) Гармоническое преобразование, усовершенствованное перекрестным произведением
TWI609364B (zh) 用於編碼多聲道信號的音訊編碼器及用於解碼經編碼音訊信號的音訊解碼器(一)
JP5400059B2 (ja) オーディオ信号処理方法及び装置
JP6173288B2 (ja) マルチモードオーディオコーデックおよびそれに適応されるcelp符号化
KR101363793B1 (ko) 부호화 장치, 복호 장치 및 그 방법
US7876966B2 (en) Switching between coding schemes
KR101411759B1 (ko) 오디오 신호 인코더, 오디오 신호 디코더, 앨리어싱-소거를 이용하여 오디오 신호를 인코딩 또는 디코딩하는 방법
KR101381513B1 (ko) 음성/음악 통합 신호의 부호화/복호화 장치
JP6126006B2 (ja) 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法
EP2104096A2 (en) Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
MX2011000373A (es) Aparato y metodo para la codificacion/decodificacion de una señal de audio utilizando un esquema de conmutacion de generacion de señal ajena.
WO2008047795A1 (fr) Dispositif de quantification vectorielle, dispositif de quantification vectorielle inverse et procédé associé
CN105957532A (zh) 对音频/语音信号进行编码和解码的方法和设备
KR20070012194A (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
CN105702258A (zh) 用于对音频信号进行编码和解码的方法及设备
TW201214415A (en) Low-delay unified speech and audio codec
JP5629319B2 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JP5294713B2 (ja) 符号化装置、復号装置およびそれらの方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
CN107924683A (zh) 正弦编码和解码的方法和装置
JP2796408B2 (ja) 音声情報圧縮装置
RU2806621C1 (ru) Гармоническое преобразование, усовершенствованное перекрестным произведением
JP2002073067A (ja) オーディオ信号の復号方法、及びオーディオ信号の復号装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20080514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081009

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081009

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111129