JP2006189836A - 広域音声符号化システム及び広域音声復号化システム、高域音声符号化及び高域音声復号化装置、並びにその方法 - Google Patents

広域音声符号化システム及び広域音声復号化システム、高域音声符号化及び高域音声復号化装置、並びにその方法 Download PDF

Info

Publication number
JP2006189836A
JP2006189836A JP2005370053A JP2005370053A JP2006189836A JP 2006189836 A JP2006189836 A JP 2006189836A JP 2005370053 A JP2005370053 A JP 2005370053A JP 2005370053 A JP2005370053 A JP 2005370053A JP 2006189836 A JP2006189836 A JP 2006189836A
Authority
JP
Japan
Prior art keywords
high frequency
signal
audio signal
frequency audio
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005370053A
Other languages
English (en)
Inventor
Kang-Eun Lee
康 殷 李
Chang-Yong Son
昌 用 孫
Insung Lee
寅 誠 李
Jaehyun Shin
載 賢 申
Shoken Kin
鍾 憲 金
Kyuhyuk Jung
奎 赫 鄭
Youngwook Ahn
映 ▲煌▼ 安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2006189836A publication Critical patent/JP2006189836A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】低いビット率でも高音質を再生できる高域音声符号化装置及び復号化装置を提供する。
【解決手段】高域音声符号化装置202は、高域音声信号にハーモニック成分があれば、ハーモニック構造とストキャスティック構造とを結合した構造で高域音声信号を符号化する第1符号化部308と、高域音声信号にハーモニック成分がなければ、ストキャスティック構造で高域音声信号を符号化する第2符号化部309とを備える。高域音声復号化装置は、受信した第1復元情報を利用して、ハーモニック構造とストキャスティック構造を結合した構造で高域音声信号を復元する第1復元ユニットと、受信した第2復元情報を利用して、ストキャスティック構造で高域音声信号を復元する第2復元ユニットと、受信したモード選択情報により、第1復元ユニットと第2復元ユニットのうちの一方から高域音声信号を出力するスイッチを備える。
【選択図】図3

Description

本発明は、音声符号化及び音声復号化に係り、特に、帯域幅の拡張機能を有する広域音声符号化及び復号化における高域音声符号化及び復号化装置並びにその方法に関する。
音声通信の応用分野が多様化され、ネットワークの伝送速度が向上することにより、高品質の音声通信に対する必要性が浮び上がっている。これにより、既存の音声通信帯域である0.3〜3.4kHzに比べて、自然性及び明瞭度などの多様な側面で優れた性能である0.3〜7kHzの帯域幅を有する広域音声信号の伝達が要求されている。
また、ネットワークの側面でデータをパケット単位で伝送するパケットスイッチングネットワークは、チャンネル渋滞をもたらし、これによるパケットの損失及び音質の低下が発生しうる。これを解決するために、損傷したパケットを隠す技術が使用されているが、これは、根本的な処方ではない。
したがって、前記広域音声信号を効果的に圧縮しつつチャンネル渋滞現象を解決できる広域音声符号化及び復号化技術が提案されている。
現在、提案されている広域音声符号化及び復号化は、0.3〜7kHの周波数帯域を有する音声信号を一度に圧縮し、これを復元する方式と、0.3〜7kHの周波数帯域を有する音声信号を0.3〜4kHz帯域と4〜7kHz帯域とに分けて階層的に圧縮し、これを復元する方式とに区分できる。後者の場合は、チャンネル渋滞現象の程度により階層別に伝達するデータ量を調節して、与えられたチャンネル環境で最適の通信を可能にする域幅拡張機能を利用した広域音声符号化及び復号化方式である。
前記帯域幅拡張機能を利用した広域音声符号化で、4〜7kHzの周波数範囲を有する高域音声信号は、MLT(Modulated Lapped Transform:以下、MLTという)方式により符号化される。MLT方式を利用する高域音声符号化装置は、図1に示す高域音声符号化装置100と同じである。
図1に示すように、前記高域音声符号化装置100は、高域音声信号を受信し、高域音声信号をMLTしてMLT係数を抽出するMLTユニット101を備える。抽出されたMLT係数のサイズは、2D−DCT(2Dimension-Discrete Cosine Transform)モジュール102に出力し、抽出されたMLT係数の符号は、符号量子化器103に出力する。
2D−DCTモジュール102は、入力されたMLT係数のサイズから2D−DCT係数を抽出し、抽出された2D−DCT係数をDCT係数量子化器104に出力する。DCT係数量子化器104は、2D−DCT係数をサイズの大きい順からサイズの小さい順に配列し、配列された2D−DCT係数を量子化した後、そのコードブックインデックスを出力する。符号量子化器103は、サイズの大きいMLT係数の符号を量子化する。
出力されたコードブックインデックス及び量子化された符号は、高域音声復号化装置110に提供され、高域音声復号化装置110は、高域音声符号化装置100と逆過程により高域音声信号を復元し、復元された高域音声信号を出力する。
しかし、前記MLT方式により高域音声信号を符号化することは、低いビット率で音声信号を伝送する時に高音質の復元が難しく、ビット率が低くなるほど、音質復元性能の低下が目立つ。
本発明は、帯域幅拡張機能を有する広域音声符号化及び復号化において、低いビット率でも高音質を再生できる高域音声符号化及び復号化装置と、その方法とを提供することを目的とする。
また、本発明は、帯域幅拡張機能を有する広域音声符号化及び復号化において、高域音声信号が、ハーモニック成分のある信号であるか否かにより動作される高域音声符号化及び復号化装置と、その方法とを提供することを他の目的とする。
さらに、本発明は、帯域幅拡張機能を有する広域音声符号化及び復号化において、周波数の解像度及び複雑度に依存せずに、正確なハーモニックサイズ及び位相が得られる高域音声符号化及び復号化装置と、その方法とを提供することを他の目的とする。
前記した目的を達成するために、本発明の高域音声符号化装置は、高域音声信号が、ハーモニック成分のある信号であれば、ハーモニック構造とストキャスティック構造とを結合した構造で前記高域音声信号を符号化する第1符号化部と、前記高域音声信号が、ハーモニック成分のない信号であれば、ストキャスティック構造で前記高域音声信号を符号化する第2符号化部とを備えることを特徴とする。
また、前記した目的を達成するために、本発明の広域音声符号化システムは、音声信号が入力されれば、前記音声信号を高域音声信号と低域音声信号とに分割する帯域分割部と、前記帯域分割部から伝送される低域音声信号を符号化し、前記符号化により検出された低域音声信号のピッチ値を出力する低域音声符号化装置と、前記帯域分割部から伝送される高域音声信号、低域音声信号及び前記低域音声信号のピッチ値を利用して、前記高域音声信号を符号化する高域音声符号化装置とを備えることを特徴とする。
また、前記した目的を達成するために、本発明の高域音声復号化装置は、受信された第1復元情報を利用して、ハーモニック構造とストキャスティック構造とを結合した構造で高域音声信号を復元する第1復元ユニットと、受信された第2復元情報を利用して、ストキャスティック構造で高域音声信号を復元する第2復元ユニットと、受信されたモード選択情報により、前記第1復元ユニットと前記第2復元ユニットのうち、何れか一つから出力される復元された高域音声信号を出力するスイッチとを備えることを特徴とする。
また、前記した目的を達成するために、本発明の広域音声復号化システムは、ハーモニック構造とストキャスティック構造とを結合した構造と、ストキャスティック構造のうち、何れか一つの構造を利用して、チャンネルを介して受信される復元情報から高域音声信号を復元する高域音声復号化装置と、前記チャンネルを介して受信される復元情報から低域音声信号を復元する低域音声復号化装置と、前記復元された高域音声信号と前記復元された低域音声信号とを結合して、復元された音声信号を出力する帯域結合部とを備えることを特徴とする。
また、前記した目的を達成するために、本発明の高域音声の符号化方法は、高域音声信号及び対応する低域音声信号にハーモニック成分があるか否かを判断するステップと、前記高域音声信号と前記対応する低域音声信号とに何れもハーモニック成分があれば、ハーモニック構造とストキャスティック構造とを結合した構造で前記高域音声信号を符号化する符号化ステップと、前記高域音声信号と前記対応する低域音声信号のうち、何れか一つの信号にハーモニック成分がなければ、ストキャスティック構造で前記高域音声信号を符号化する符号化ステップとを含むことを特徴とする。
また、前記した目的を達成するために、本発明の高域音声の復号化方法は、受信された復元情報に含まれているモード選択情報を分析するステップと、前記モード選択情報が、ハーモニック構造とストキャスティック構造とを結合したモードを表せば、ハーモニック構造とストキャスティック構造とを結合した構造で受信された復元情報から高域音声信号を復元するステップと、前記モード選択情報がストキャスティック構造を表せば、ストキャスティック構造で受信された復元情報から高域音声信号を復元するステップとを含むことを特徴とする。
本発明によれば、帯域幅拡張機能を有する広域音声符号化及び復号化システムで高域音声符号化及び復号化時に、高域音声信号及び低域音声信号にハーモニック成分があれば、ハーモニック構造とストキャスティック構造とを結合した構造で高域音声信号を符号化及び復号化し、ハーモニック構造は、MP(Matching Pursuit)アルゴリズムを使用して正弦波辞書(dictionary)のサイズ及び位相を探索することにより、少ないビット率及び低い複雑度で高音質を再生できる。これにより、低伝送率の狭域の符号化及び復号化装置を具現できる。
また、MP正弦波辞書を利用したハーモニック構造で符号化することにより、FFT(Fast Fourier Transform)を利用したハーモニック構造で符号化することに比べて、周波数解像度に敏感ではない広域音声符号化及び復号化システムを提供できる。
以下、本発明の実施形態に係る高域音声符号化及び復号化装置並びにその方法を説明する。
図2は、本発明の好ましい実施形態に係る高域音声符号化装置202及び高域音声復号化装置221を有する広域音声符号化及び復号化システムの全体構成図である。
図2に示すように、広域音声符号化及び復号化システムは、音声符号化装置(広域音声符号化システム)200、チャンネル210、及び音声復号化装置(広域音声復号化システム)220を備える。図2に示す広域音声符号化及び復号化システムは、帯域幅拡張機能を有する。したがって、図2に示す音声符号化装置200は、帯域分割部201、高域音声符号化装置202、及び低域音声符号化装置203を備える。
帯域分割部201は、入力される音声信号を高域音声信号と低域音声信号とに分割する。前記入力される音声信号は、16ビット線型パルスコード変調形式を有しうる。この帯域分割部201は、分割した音声信号のうち、高域音声信号を高域音声符号化装置202に出力すると共に、低域音声信号を高域音声符号化装置202と低域音声符号化装置203とにそれぞれ出力する。
高域音声符号化装置202は、入力される高域音声信号を符号化する。このために、高域音声符号化装置202は、図3に示すように構成されうる。
図3に示すように、高域音声符号化装置202は、ゼロ状態の高域音声信号生成部300、モード選択部306、スイッチ307、第1符号化部308、及び第2符号化部309を備える。
ゼロ状態の高域音声信号生成部300は、入力される高域音声信号をゼロ状態の高域音声信号に生成する。このために、ゼロ状態の高域音声信号生成部300は、6次LPC(Linear Prediction Coefficient:線型予測係数)分析部301、LPC量子化部302、認知加重された合成フィルタ303、認知加重フィルタ304、及び減算器305を備える。
6次LPC分析部301は、高域音声信号が入力された場合に、自己相関方式とレビンソン・ダービン・アルゴリズム(Levison-Durbin Algorithm)とを使用して、6個のLPCを求める。求められた6個のLPCは、LPC量子化部302に伝送される。
LPC量子化部302は、入力された6個のLPCをLSP(Line Spectral Pair)ベクトルに変換し、変換されたLSPベクトルを多段階のベクトル量子化器を利用して量子化する。量子化されたLSPベクトルは、再びLPCに変換されて、認知加重された合成フィルタ303に出力される。この時、量子化されたLSPベクトルは、LPCインデックスとしてチャンネル210に出力される。
認知加重された合成フィルタ303は、LPC量子化部302から入力されたLPCインデックスを利用して、 “0”入力(ゼロ状態を示す入力)に対する応答信号を出力する。出力された応答信号(0入力応答信号)は、減算器305に伝送される。
認知加重フィルタ304は、6次LPC分析部301から提供される6個のLPCを利用して、入力された高域音声信号に対する認知加重された音声信号(知覚可能に重み付けられた音声信号)を出力する。この認知加重フィルタ304は、心理的な聴覚を評価するためのマスキング効果を利用して、量子化ノイズをマスキングレベル以下にする役割を担う。この認知加重された音声信号は、減算器305に伝送される。
減算器305は、認知加重フィルタ304で認知加重された音声信号から、認知加重された合成フィルタ303の出力する0入力応答信号を除去した信号を出力する。したがって、減算器305から出力される認知加重された音声信号は、ゼロ状態の高域音声信号である。この減算器305から出力される認知加重されたゼロ状態の高域音声信号は、モード選択部306とスイッチ307とに伝送される。
モード選択部306は、減算器305から伝送される認知加重されたゼロ状態の高域音声信号と、帯域分割部201(図2参照)から伝送される低域音声信号とを利用して、入力される高域音声信号がハーモニック成分のある信号であるか否かを判断して、判断結果によるモード選択情報を出力する。
すなわち、モード選択部306は、減算器305から伝送される認知加重されたゼロ状態の高域音声信号と、帯域分割部201から伝送される低域音声信号とに対して、それぞれ所定の特性値を求める。前記所定の特性値は、後記するシャープネス(鮮明さ)の比率、信号の左右エネルギー比率、0交差率、及び1次予測係数を含みうる。
モード選択部306は、減算器305から受信した認知加重されたゼロ状態の高域音声信号をs(n)で表したときに、このs(n)に対するシャープネスの比率Srを式(1)により求める。
Figure 2006189836
式(1)において、Lsfは、サブフレームの長さである。サブフレームの長さは、サンプル数で表現されうる。サブフレームは、1つのフレームの一部であり、1つのフレームは、2個のサブフレームに分割される。
続いて、モード選択部306は、前記した減算器305から受信した信号s(n)に対する左右エネルギー比率Erを式(2)により求める。
Figure 2006189836
続いて、モード選択部306は、サブフレーム当りの信号s(n)の符号が変わる程度を表す0交差率Zrを式(3)に基づいて求める。
Figure 2006189836
式(3)から分かるように、1つのサブフレームに対し、Zrの初期値は0である。この0交差率は、サブフレーム単位で検出されるため、計算範囲iは、Lsf−1から1までである。減算器305から出力されるi番目の出力信号s(i)と、(i−1)番目の出力信号s(i−1)とを乗算した値が0より小さければ、0交差が発生したことであるため、Zr値を1増加させる。サブフレーム単位の計算範囲のすべての計算の実行の結果、最終検出されたZr値をこのサブフレームの長さLsfで割れば、該当するサブフレームでの高域音声信号の0交差率Zrを得る。
続いて、モード選択部306は、前記信号s(n)に対する1次予測係数Crを、式(4)に基づいて求める。
Figure 2006189836
前記1次予測係数Crは、隣接したサンプル間の相関関係が大きいほど、大きい値が得られ、隣接したサンプル間の相関関係が小さいほど、小さな値が得られる。
続いて、モード選択部306は、式(5)のように、サブフレーム単位で検出された各特性値と、事前に設定された各特性値に対する閾値TS、TE、TZ、TCとを比較する。
Figure 2006189836
式(5)に定義された条件を満足すれば、モード選択部306は、入力された高域音声信号がハーモニック成分を含むと判断する。
モード選択部306は、入力される低域音声信号に対しても、式(1)ないし式(4)に定義されたように、サブフレーム単位の4つの特性値を得る。
モード選択部306は、前記した式(5)に定義されたように、事前に設定された低域音声信号に対する各特性値に対する閾値と、前記した式(1)ないし式(4)により得た入力される低域音声信号に対する特性値とを比較して、前記した式(5)に定義された条件を満足するか否かを判断する。前記した式(5)に定義された条件を満足すれば、モード選択部306は、入力された低域音声信号がハーモニック成分を含むと判断する。
しかし、前記した式(5)に定義された条件を満足しなければ、モード選択部306は、入力される低域音声信号がハーモニック成分を含まないと判断する。
モード選択部306は、高域音声信号と低域音声信号とが何れもハーモニック成分を含むと判断した場合に、スイッチ307が、減算器305から出力される認知加重されたゼロ状態の高域音声信号を第1符号化部308に伝送するように制御するモード選択情報を出力する。それ以外の場合には、スイッチ307が、減算器305から出力される認知加重されたゼロ状態の高域音声信号を第2符号化部309に伝送するように制御するモード選択情報を出力する。各モード選択情報は、チャンネル210にも伝送される。
第1符号化部308は、サブフレーム単位でハーモニック構造とストキャスティック構造とを混合して、ゼロ状態の高域音声信号に励起信号を合成するものである。したがって、第1符号化部308は、励起信号合成部として定義されうる。
第1符号化部308は、図4に示すように、第1認知加重された逆合成フィルタ401、正弦波辞書のサイズ及び位相探索器402、正弦波振幅量子化器403、正弦波位相量子化器404、合成音声信号生成器405、乗算器406、認知加重された合成フィルタ407、減算器408、利得値量子化器409、第2認知加重された逆合成フィルタ410、開ループストキャスティックコードブック探索器411、及び閉ループストキャスティックコードブック探索器412を備える。
前記ハーモニック構造は、第1認知加重された逆合成フィルタ401、正弦波辞書のサイズ及び位相探索器402、正弦波振幅量子化器403、正弦波位相量子化器404、合成音声信号生成器405、乗算器406、認知加重された合成フィルタ407、及び減算器408を備え、前記ストキャスティック構造は、第2認知加重された逆合成フィルタ410、開ループストキャスティックコードブック探索器411及び閉ループストキャスティックコードブック探索器412を備えるように定義できる。
第1認知加重された逆合成フィルタ401は、認知加重されたゼロ状態の高域音声信号が入力された場合に、式(6)により理想的なLPC励起信号rhを得るものである。
Figure 2006189836
式(6)において、x(i)は、認知加重されたゼロ状態の高域音声信号であり、h’(n−i)は、第1認知加重された逆合成フィルタ401のインパルス応答である。第1認知加重された逆合成フィルタ401は、前記x(i)と、h’(n−i)とをコンボリューションして(comvolute:巻き込んで)、理想的なLPC励起信号rhを得る。
理想的なLPC励起信号rhは、正弦波辞書のサイズ及び位相を探すための目的信号であって、正弦波辞書のサイズ及び位相探索器402に伝送される。
正弦波辞書のサイズ及び位相探索器402は、MPアルゴリズムを使用して正弦波辞書のサイズ及び位相を探索する。正弦波辞書を利用したハーモニック励起信号eMPは、式(7)のように定義できる。
Figure 2006189836
式(7)において、Akは、k番目の正弦波のサイズ(振幅)、ωkは、k番目の正弦波の角周波数、φkは、k番目の正弦波の位相、Kは、正弦波辞書の個数を表す。
正弦波辞書のサイズ及び位相探索器402は、MPアルゴリズムによる正弦波辞書のサイズ及び位相探索の以前に、正弦波辞書の角周波数ωkを、低域音声符号化装置203から提供される低域音声信号のピッチ値tpを利用して求める。すなわち、式(8)のように角周波数ωkを求める。
Figure 2006189836
正弦波辞書のサイズ及び位相探索器402は、MPアルゴリズムにより、k番目の辞書から、k番目の目的信号を反映するサイズ成分(振幅成分)を抽出する過程と、抽出されたサイズ成分(振幅成分)をk番目の目的信号に適用することによって新たな(k+1)番目の目的信号を創出する過程とを反復的に行いつつ、正弦波辞書のサイズ及び位相を探索する。このようなMPアルゴリズムを利用した正弦波辞書のサイズ及び位相探索は、式(9)のように定義できる。
Figure 2006189836
式(9)において、rh,kは、k番目の目的信号であり、Ekは、rh,kとk番目の正弦波辞書との平均二乗エラーにハミングウィンドウ(Hamming Window)whamを取った値である。k=0であれば、k番目の目的信号rh,kは、理想的なLPC励起信号rhと同じである。Ekが最小となるAkとφkとは、式(10)のように定義できる。
Figure 2006189836
K個の正弦波辞書のサイズ及び位相が探索された後、正弦波辞書のサイズベクトルは、正弦波振幅量子化器403に出力され、正弦波辞書の位相ベクトルは、正弦波位相量子化器404に出力される。
正弦波振幅量子化器403は、図5に示すように構成される。図5に示すように、正弦波振幅量子化器403は、正弦波振幅正規化器501、MDCT(Modulated Discrete Cosine Transform)器502、係数ベクトル量子化器503、IMDCT(Inverse Modified Discrete Cosine Transform)器504、減算器505、残差サイズ量子化器506、加算器507、及び最適ベクトル選択部508を備える。
正弦波振幅正規化器501は、正弦波辞書のサイズ及び位相探索器402から提供される正弦波振幅を式(11)のように正規化する。
Figure 2006189836
式(11)において、Ak’は、正規化されたk番目の正弦波振幅を表し、正弦波振幅正規化要素は、式(11)の右辺の分母に該当する。この正弦波振幅正規化要素は、スカラー値であって、利得値量子化器409に提供される。前記正規化されたk番目の正弦波振幅Ak’は、ベクトル値であって、MDCT器502と減算器505とに出力される。
MDCT器502は、前記正規化された正弦波振幅Ak’に対し、式(12)のようにMDCTを行う。
Figure 2006189836
式(12)において、Ckは、正規化されたk番目の正弦波振幅Ak’に対するk番目のDCT係数ベクトルであり、An’は、前記正規化されたk番目の正弦波振幅Ak’である。Ckは、係数ベクトル量子化器503に出力される。
係数ベクトル量子化器503は、スプリットベクトル量子化方式により前記DCT係数を量子化し、最適のDCT係数ベクトル候補を選択する。4つのDCT係数ベクトルが、最適のDCT係数ベクトル候補として選択されうる。
選択されたDCT係数ベクトル候補は、IMDCT器504に出力される。IMDCT器504は、選択されたDCT係数ベクトル候補を式(13)に代入し、量子化された正弦波振幅ベクトルを得る。
Figure 2006189836
式(13)において、AEkは、量子化されたDCT係数ベクトル候補Cn をIMDCTしたベクトルであって、量子化された正弦波振幅ベクトルである。この量子化された正弦波振幅ベクトルは、減算器505に出力される。
減算器505は、正弦波振幅正規化器501から伝送された正規化された正弦波振幅ベクトルAk’と、量子化された正弦波振幅ベクトルAEkとの差をエラーベクトルとして求め、前記エラーベクトルを残差サイズ量子化器506に伝送する。
残差サイズ量子化器506は、入力されたエラーベクトルを量子化し、量子化されたエラーベクトルを加算器507に出力する。
加算器507は、残差サイズ量子化器506から伝送された量子化されたエラーベクトルと、それに該当するIMDCT過程を経た正弦波振幅ベクトルAEkとを加算して、量子化された正弦波辞書のサイズベクトルを最終的に求める。
最適ベクトル選択部508は、加算器507からMDCT器502で検出されたDCT係数ベクトル候補に対する量子化された正弦波辞書のサイズベクトルが受信された場合に、受信された量子化された正弦波辞書のサイズベクトルのうち、本来(original)の正弦波辞書のサイズベクトルに最も近接した量子化された正弦波辞書のサイズベクトルを選択して出力する。出力された量子化された正弦波辞書のサイズベクトルは、合成音声信号生成器405に伝送され、量子化された正弦波辞書のサイズのインデックス(サイズインデックス)としてチャンネル210に伝送される。
図4に示すように、正弦波位相量子化器404は、正弦波辞書のサイズ及び位相探索器402で探索された位相ベクトルが入力された場合に、多段階ベクトル量子化方式で前記入力された位相ベクトルを量子化する。この場合、正弦波位相量子化器404は、全ての伝送すべき位相情報のうち、比較的に低い周波数の位相が重要であるという点を鑑みて、全体の位相情報のうち、半分の位相情報のみを量子化して伝送する。残りの半分の位相情報については、ランダムに位相情報を作って使用できる。正弦波位相量子化器404から出力される量子化された位相ベクトルは、合成音声信号生成器405とチャンネル210とにそれぞれ出力される。前記量子化された位相ベクトルは、正弦波辞書の位相のインデックス(位相インデックス)である。
合成音声信号生成器405は、正弦波振幅量子化器403から提供される量子化された正弦波辞書のサイズベクトルと、正弦波位相量子化器404から提供される量子化された正弦波辞書の位相ベクトルとを利用して、合成した音声励起信号(または、合成した励起音声信号)を得る。すなわち、前記量子化された正弦波辞書のサイズベクトルがAであり、前記量子化された位相ベクトルがφであれば、合成音声信号生成器405は、合成した音声励起信号rh を式(14)のように求めうる。
Figure 2006189836
合成した音声励起信号rh は、乗算器406に出力される。乗算器406は、利得値量子化器409から出力される量子化された正弦波振幅正規化要素と、前記合成音声信号生成器405から出力される合成した音声励起信号rh とを乗算し、その乗算結果を、認知加重された合成フィルタ407に出力する。
認知加重された合成フィルタ407は、量子化された正弦波振幅正規化要素と前記合成した音声励起信号rh が乗算されたハーモニック構造の励起信号と、認知加重された合成フィルタ407のインパルス応答h(n)とを、式(15)のようにコンボリューションして、ハーモニック構造で合成された信号Sh を出力する。
Figure 2006189836
式(15)において、gh は、利得値量子化器409から出力される量子化された正弦波振幅正規化要素であって、利得値量子化器409から乗算器406に提供された値である。前記ハーモニック構造で合成された信号は、減算器408に出力される。
減算器408は、入力される認知加重されたゼロ状態の高域音声信号で、前記認知加重された合成フィルタ407から提供されるハーモニック構造で合成された信号を減算して残差信号を得る。
減算器408で得られた残差信号は、開ループ探索過程と閉ループ探索過程とによりコードブックを探すために利用される。すなわち、減算器408から出力された残差信号は、開ループ探索のために第2認知加重された逆合成フィルタ410に入力される。第2認知加重された逆合成フィルタ410は、第2認知加重された逆合成フィルタ410のインパルス応答と、前記減算器408から出力された残差信号とを、式(16)に定義されたようにコンボリューションして、2次の理想的な励起信号を生成する。
Figure 2006189836
式(16)において、x2は、減算器408から出力される残差信号であり、rsは、2次の励起信号である。
第2認知加重された逆合成フィルタ410から生成された2次の理想的な励起信号は、開ループストキャスティックコードブック探索器411に出力される。開ループストキャスティックコードブック探索器411は、2次の理想的な励起信号を目的信号として、ストキャスティックコードブックを複数備えたストキャスティックコードブック部(図示はしない)から複数のストキャスティックコードブック候補を選択する。開ループストキャスティックコードブック探索器411で探索されたストキャスティックコードブック候補は、閉ループストキャスティックコードブック探索器412に伝送される。
閉ループストキャスティックコードブック探索器412は、認知加重された合成フィルタのインパルス応答と、開ループストキャスティックコードブック探索器411により探索されたストキャスティックコードブック候補とをコンボリューションして、音声レベル信号を生成する。生成された音声レベル信号y2と減算器408から提供される残差信号x2との間の利得値gsを、式(17)により求める。
Figure 2006189836
続いて、閉ループストキャスティックコードブック探索器412は、音声レベル信号y2に前記利得値gsを乗算した信号と残差信号x2とを利用して、式(18)のように平均二乗エラーEmseを求める。
Figure 2006189836
そして、開ループストキャスティックコードブック探索器411で探索されたストキャスティックコードブック候補で、前記平均二乗エラーEmseが最小となる1つのストキャスティックコードブック候補が選択される。選択されたストキャスティックコードブック候補に該当する利得値は、利得値量子化器409に伝送されて量子化される。また、選択されたストキャスティックコードブック候補に対するインデックスを、ストキャスティックコードブックインデックスとして出力する。出力されたストキャスティックコードブックインデックスは、チャンネル210に伝送される。
利得値量子化器409は、正弦波振幅量子化器403から伝送される正弦波振幅正規化要素と、閉ループストキャスティックコードブック探索器412から伝送されるストキャスティックコードブック利得値とを2次元的にベクトル量子化し、量子化された正弦波振幅正規化要素を、乗算器406に出力する。量子化されたストキャスティックコードブック利得値は、チャンネル210に伝送される。この量子化されたストキャスティックコードブック利得値は、利得値インデックスとして使用される。
一方、図3の第2符号化部309は、ストキャスティック構造でスイッチ307を介して伝送される認知加重されたゼロ状態の高域音声信号に励起信号を合成するものである。したがって、第2符号化部309は、励起信号合成部として定義されうる。
第2符号化部309は、図6に示すように構成されうる。図6に示すように、第2符号化部309は、認知加重された逆合成フィルタ601、ストキャスティックコードブック候補探索器602、ストキャスティックコードブック部603、乗算器604、認知加重された合成フィルタ605、減算器606、最適のストキャスティックコードブック探索器607、及び利得値量子化器608を備える。
認知加重された逆合成フィルタ601は、入力される認知加重されたゼロ状態の高域音声信号x(i)と、認知加重された逆合成フィルタ601のインパルス応答h’(n)とを、式(19)のようにコンボリューションして、理想的な励起信号rsを生成するものである。
Figure 2006189836
ストキャスティックコードブック候補探索器602は、認知加重された逆合成フィルタ601で生成された理想的な励起信号rsが入力された場合に、理想的な励起信号rs(n)とストキャスティックコードブック部603に存在するあらゆるストキャスティックコードブックとを対象として、相互相関性c(i)を式(20)に基づいて求めて、相互相関性の大きなストキャスティックコードブック候補を選択する。
Figure 2006189836
式(20)において、ri’(n)は、ストキャスティックコードブック部603に含まれているi番目のストキャスティックコードブックである。
ストキャスティックコードブック部603は、複数のストキャスティックコードブックを備え得る。
乗算器604は、選択されたストキャスティックコードブック候補が、ストキャスティックコードブック部603から出力された場合に、選択されたストキャスティックコードブック候補に利得値を乗算して出力する。この利得値は、最適のストキャスティックコードブック探索器607から提供される。
認知加重された合成フィルタ605は、利得値が乗算されたストキャスティックコードブック候補と、インパルス応答hi(n−j)とを、式(21)のようにコンボリューションする。
Figure 2006189836
式(21)において、giは、利得値であって、最適のストキャスティックコードブック探索器607から乗算器604に提供されたものである。認知加重された合成フィルタ605は、前記ストキャスティックコードブック候補と、インパルス応答hi(n−j)とをコンボリューションして得た合成された信号を出力する。
減算器606は、認知加重された合成フィルタ605からの合成された信号と認知加重されたゼロ状態の高域音声信号との差を示す信号(差信号)を、最適のストキャスティックコードブック探索器607に出力する。
最適のストキャスティックコードブック探索器607は、減算器606から提供される差信号に基づいてストキャスティックコードブック候補探索器602により探索されたストキャスティックコードブック候補のうち、最適のストキャスティックコードブックを探索する。
すなわち、最適のストキャスティックコードブック探索器607は、減算器606から提供される差信号が最も小さなストキャスティックコードブック候補を最適のストキャスティックコードブックとして選択する。選択されたストキャスティックコードブックは、最適の励起信号となる。最適のストキャスティックコードブック探索器607で最適のストキャスティックコードブックとして選択されたストキャスティックコードブックに該当する利得値は、利得値量子化器608と乗算器604とに提供される。
また、最適のストキャスティックコードブック探索器607は、最適のストキャスティックコードブックが選択されれば、選択されたストキャスティックコードブックのインデックス(ストキャスティックコードブックインデックス)をチャンネル210に出力する。
利得値量子化器608は、入力された利得値を量子化し、この量子化された利得値を利得値インデックスとして出力する。出力された利得値インデックスは、チャンネル210に出力される。
高域音声符号化装置202は、符号化された音声信号を復元するために必要な復元情報である、LPCインデックス、第1符号化部308から出力される利得値インデックス、正弦波辞書のサイズインデックス、正弦波辞書の位相インデックス、及びストキャスティックコードブックインデックスと、第2符号化部309から出力されるストキャスティックコードブックインデックス及び利得値インデックスとをマルチプレクシングしてチャンネル210に送出する機能を含みうる。
低域音声符号化装置203は、標準狭帯域音声信号圧縮器を利用して入力される低域音声信号を符号化する。前記標準狭帯域音声信号圧縮器は、0.3〜4kHz帯域の低域の音声信号を圧縮しつつ、前記低域音声信号のピッチ値tpを求めるように構成される。低域音声符号化装置203から出力される信号は、チャンネル210に伝送される。
チャンネル210は、高域音声符号化装置202と低域音声符号化装置203とからそれぞれ出力される前記した復元情報を、対応する音声復号化装置220に伝送するものである。チャンネルは、前記高域音声符号化装置202と低域音声符号化装置203とから出力される復元情報をパケットの形態で伝送できる。
音声復号化装置220は、図2に示すように、高域音声復号化装置221、低域音声復号化装置222及び帯域結合部223を備える。
高域音声復号化装置221は、チャンネル210を介して伝送される復元情報に基づいて、復元された高域音声信号を出力する。このために、高域音声復号化装置221は、図7に示すように構成される。
図7に示すように、高域音声復号化装置221は、第1復元ユニット700、LPC逆量子化部710、第2復元ユニット720、及びスイッチ730を備える。
第1復元ユニット700は、ハーモニック構造とストキャスティック構造とを結合した構造で、チャンネル210を介して受信された復元情報から高域音声信号を復元する。したがって、第1復元ユニット700は、チャンネル210を介して受信されたモード選択情報が、ハーモニック構造とストキャスティック構造とを結合したモードを表す場合に、動作する。このハーモニック構造とストキャスティック構造とを結合したモード選択情報とは、高域音声信号と低域音声信号とが何れもハーモニック成分である場合の信号である。
第1復元ユニット700は、利得値逆量子化部701、正弦波振幅復号化部702、正弦波位相復号化部703、ストキャスティックコードブック部704、乗算器705、707、ハーモニック信号復元部706、加算器708、及び合成フィルタ709を備える。
利得値逆量子化部701は、利得値インデックスが入力された場合に、入力された利得値インデックスを逆量子化して、量子化された正弦波振幅正規化要素を出力する。
正弦波振幅復号化部702は、正弦波辞書のサイズインデックスが入力されれば、IMDCT過程により、この正弦波辞書のサイズインデックスに対する量子化された正弦波辞書のサイズを求め、この量子化された正弦波辞書のサイズを復元すると共に、この量子化された正弦波辞書のサイズと、この復元された正弦波辞書のサイズとを加算して、量子化された正弦波辞書のサイズを検出して出力するものである。
正弦波位相復号化部703は、正弦波辞書の位相インデックスが入力された場合に、前記入力された正弦波辞書の位相インデックスに対応する、量子化された正弦波辞書の位相を出力する。
ストキャスティックコードブック部704は、ストキャスティックコードブックインデックスが入力された場合に、このストキャスティックコードブックインデックスに対応するストキャスティックコードブックを出力する。このストキャスティックコードブック部704は、複数のストキャスティックコードブックを備えうる。
乗算器705は、利得値逆量子化部701から出力される量子化された正弦波振幅正規化要素と、正弦波振幅復号化部702から出力される量子化された正弦波辞書のサイズとを乗算して出力する。
ハーモニック信号復元部706は、乗算器705から出力される量子化された正弦波振幅正規化要素が乗算された、量子化された正弦波辞書のサイズベクトルと、量子化された正弦波辞書の位相ベクトルとを使用して、式(14)に基づいてハーモニック信号を復元する。復元されたハーモニック信号は、加算器708に出力される。
乗算器707は、利得値逆量子化部701から出力される量子化されたストキャスティックコードブック利得値と、ストキャスティックコードブック部704から出力されるストキャスティックコードブックとを乗算して、励起信号を生成する。
加算器708は、ハーモニック信号復元部706ら出力されるハーモニック信号と、乗算器707から出力される励起信号とを加算して出力する。
合成フィルタ709は、LPC逆量子化部710から提供される逆量子化されたLPCを利用して、加算器708から出力される信号を合成フィルタリングすることにより、復元された高域音声信号を出力する。復元された高域音声信号は、スイッチ730に伝送される。
LPC逆量子化部710は、LPCインデックスが入力された場合に、入力されたLPCインデックスに対応する、量子化されたLPCを出力する。出力された量子化されたLPCは、合成フィルタ709と後記する合成フィルタ724とに提供される。
第2復元ユニット720は、ストキャスティック構造でチャンネル210を介して受信された、復元情報から復元された高域音声信号を生成するものである。したがって、第2復元ユニット720は、チャンネル210を介して受信されたモード選択情報がストキャスティック構造モードを表す場合に動作する。このモード選択情報がストキャスティック構造モードを表す場合とは、高域音声信号と低域音声信号とのうち、少なくとも1つの音声信号にハーモニック成分がない場合である。
第2復元ユニット720は、ストキャスティックコードブック部721、利得値逆量子化部722、乗算器723及び合成フィルタ724を備える。
ストキャスティックコードブック部721は、ストキャスティックコードブックインデックスが入力された場合に、該当するストキャスティックコードブックを出力する。このストキャスティックコードブック部721は、複数のストキャスティックコードブックを備え得る。
利得値逆量子化部722は、利得値インデックスが入力された場合に、該当する量子化された利得値を出力する。
乗算器723は、ストキャスティックコードブックに、量子化された利得値を乗算して出力する。
合成フィルタ724は、LPC逆量子化部710から提供される量子化されたLPCを利用して、利得値が乗算されたストキャスティックコードブックを合成フィルタリングすることにより、復元された高域音声信号を出力する。復元された高域音声信号は、スイッチ730に出力される。
スイッチ730は、受信されるモード選択情報により、第1復元ユニット700と第2復元ユニット720とからそれぞれ出力される復元された高域音声信号を選択的に伝送する。すなわち、モード選択情報が、ハーモニック構造とストキャスティック構造とを結合した構造を表せば、第1復元ユニット700から出力される復元された高域音声信号を、復元された高域音声信号として出力する。一方、モード選択情報が、ストキャスティック構造を表せば、第2復元ユニット720から出力される復元された高域音声信号を、復元された高域音声信号として出力する。
高域音声復号化装置221は、チャンネル210から受信された復元情報をデマルチプレクシングして、該当するモジュールに伝送するためのデマルチプレクサを更に備え得る。
低域音声復号化装置222は、チャンネル210を介して受信された低域音声信号に対する復元情報を利用して低域音声信号を復元するものである。この低域音声復号化装置222は、低域音声符号化装置203と対応する構造を有する。
帯域結合部223は、高域音声復号化装置221から出力される復元された高域音声信号と、低域音声復号化装置222から出力される復元された低域音声信号とを結合して、復元された音声信号を出力する。
図8は、本発明に係る高域音声の符号化方法の動作フローチャートである。
高域音声符号化装置202は、入力される音声信号が、高域音声信号と低域音声信号とに分割された場合に、分割された高域音声信号に対する認知加重されたゼロ状態の高域音声信号を生成する(801)。すなわち、図3を参照して説明したように、入力される高域音声信号に対してLPC分析して検出されたLPCと、認知加重フィルタ304とを利用して、認知加重されたゼロ状態の高域音声信号を生成する。
そして、高域音声符号化装置202は、生成された認知加重されたゼロ状態の高域音声信号、及び、この高域音声信号に対応する低域音声信号にハーモニック成分があるか否かを判断する(802)。判断方法は、図3のモード選択部306の説明で説明したように、サブフレーム単位で4つの特性値を検出し、事前に設定された各特性値に対する閾値と検出された特性値とを比較するものである。その結果が、設定された条件を満足する場合に、各音声信号にハーモニック成分があると判断されることとなる。
そして、高域音声符号化装置202は、認知加重されたゼロ状態の高域音声信号、及び、対応する低域音声信号にハーモニック成分があると判断した場合に、前記ゼロ状態の高域音声信号を、図4を参照して説明したように、ハーモニック構造とストキャスティック構造とを結合した構造で、ゼロ状態の高域音声信号を符号化する(803、804)。
しかし、ゼロ状態の高域音声信号と対応する低域音声信号のうち、いずれか1つの信号でもハーモニック成分がない場合には、図6に示したように、ストキャスティック構造で前記ゼロ状態の高域音声信号を符号化する(805)。
前記のように符号化された高域音声信号に対する復元情報は、チャンネル210を介して音声復号化装置(または広域音声復号化システム)220に送出される。この時、符号化された低域音声信号に対する復元情報も共に、音声復号化装置(または広域音声復号化システム)220に伝送できる。
図9は、本発明に係る高域音声の復号化方法の動作フローチャートである。
高域音声復号化装置221は、チャンネル210を介して受信された高域音声信号に対する復元情報に、高域音声信号に対するモード選択情報が含まれている場合に、前記モード選択情報を分析する(901)。
そして、高域音声復号化装置221は、モード選択情報を分析した結果、モード選択情報が、ハーモニック構造とストキャスティック構造とを結合したモードを表す場合に、図7に示す第1復元ユニット700のように、ハーモニック構造とストキャスティック構造とを結合した構造に基づいて高域音声信号を復元する(902、903)。
しかし、モード選択情報を分析した結果、モード選択情報が、ストキャスティック構造モードを表す場合に、高域音声復号化装置221は、図7に示す第2復元ユニット720のように、ストキャスティック構造に基づいて高域音声信号を復元する(902、904)。
本発明に係る高域音声の符号化方法及び高域音声の復号化方法をコンピュータに実行させるためのプログラムは、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られ得るデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM(Read Only Memory)、RAM(Random Access Memory)、CD−ROM、磁気テープ、フレキシブルディスク、光データ記録装置などがあり、また、キャリアウェーブ(例えば、インターネットを介した伝送)の形態で具現されるものも含む。
また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取り可能なコードが保存されて実行されうる。そして、高域音声の符号化方法及び高域音声の復号化方法を具現するための機能的なプログラム、コード及びコードセグメントは、本発明が属する技術分野のプログラマにより容易に推論されうる。
以上、本発明についてその好ましい実施形態を中心に説明した。当業者は、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態で具現されうるということを理解できる。したがって、開示された実施形態は、限定的な観点ではなく、説明的な観点から考慮されねばならない。本発明の範囲は、前記の説明ではなく、特許請求の範囲に示されており、それと同等な範囲内にあるあらゆる差異点は、本発明に含まれたものと解釈されねばならない。
本発明は、音声符号化装置及び音声復号化装置に関連した技術分野に好適に適用されうる。
従来の高域音声符号化装置及び高域音声復号化装置の機能ブロック図である。 本発明の好ましい実施形態に係る高域音声符号化装置及び高域音声復号化装置を有する広域音声符号化及び復号化システムの全体構成図である。 図2に示す高域音声符号化装置の機能ブロック図である。 図3に示す第1符号化部の詳細ブロック図である。 図4に示す正弦波振幅量子化器の詳細ブロック図である。 図3に示す第2符号化部の詳細ブロック図である。 図2に示す高域音声復号化装置の機能ブロック図である。 本発明の好ましい実施形態に係る高域音声符号化装置による高域音声の符号化方法の動作を示すフローチャートである。 本発明の好ましい実施形態に係る高域音声復号化装置による高域音声の復号化方法の動作を示すフローチャートである。
符号の説明
100 高域音声符号化装置
101 MLTユニット
102 2D−DCTモジュール
103 符号量子化器
104 DCT係数量子化器
110 高域音声復号化装置
200 音声符号化装置(広域音声符号化システム)
201 帯域分割部
202 高域音声符号化装置
203 低域音声符号化装置
210 チャンネル
220 音声復号化装置(広域音声復号化システム)
221 高域音声復号化装置
222 低域音声復号化装置
223 帯域結合部
300 高域音声信号生成部(生成部)
301 6次LPC分析部(線形予測係数分析部)
302 LPC量子化部(量子化部)
303 認知加重された合成フィルタ(合成フィルタ)
304 認知加重フィルタ
305 減算器
306 モード選択部
307 スイッチ
308 第1符号化部
309 第2符号化部
401 第1認知加重された逆合成フィルタ(逆合成フィルタ)
402 正弦波辞書の振幅及び位相探索器(探索器)
403 正弦波振幅量子化器(第1量子化器)
404 正弦波位相量子化器(第2量子化器)
405 合成音声信号生成器(励起信号生成器)
406 乗算器
407 認知加重された合成フィルタ(合成フィルタ)
408 減算器
409 利得値量子化器(第3量子化器)
410 第2認知加重された逆合成フィルタ(逆合成フィルタ)
411 開ループスキャトスティックコードブック探索器
412 閉ループスキャトスティックコードブック探索器
501 正弦波振幅正規化器(正規化器)
502 MDCT器
503 係数ベクトル量子化器
504 IMDCT器
505 減算器
506 残差振幅量子化器(残差サイズ量子化器)
507 加算器
508 最適ベクトル選択部
601 認知加重された逆合成フィルタ(逆合成フィルタ)
602 スキャトスティックコードブック候補探索器(第1探索器)
603 スキャトスティックコードブック部
604 乗算器
605 認知加重された合成フィルタ(合成フィルタ)
606 減算器
607 最適スキャトスティックコードブック探索器(第2探索器)
608 利得値量子化器
700 第1復元ユニット
701 利得値逆量子化部
702 正弦波振幅復号化部
703 正弦波位相復号化部
704 スキャトスティックコードブック部
705 乗算器(第1乗算器)
706 ハーモニック信号復元部
707 乗算器(第2乗算器)
708 加算器
709 合成フィルタ
710 LPC逆量子化部(線形予測係数逆量子化部)
720 第2復元ユニット
721 スキャトスティックコードブック部
722 利得値逆量子化部
723 乗算器
724 合成フィルタ
730 スイッチ

Claims (37)

  1. 広域音声符号化システムの高域音声符号化装置において、
    高域音声信号が、ハーモニック成分のある信号であれば、ハーモニック構造とストキャスティック構造とを結合した構造で前記高域音声信号を符号化する第1符号化部と、
    前記高域音声信号が、ハーモニック成分のない信号であれば、ストキャスティック構造で前記高域音声信号を符号化する第2符号化部と、を備えることを特徴とする高域音声符号化装置。
  2. 前記第1符号化部は、
    MP(Matching Pursuit)アルゴリズムにより、前記高域音声信号に対する正弦波辞書のサイズ及び位相を探索して励起信号を生成するハーモニック構造と、
    前記ハーモニック構造により生成された励起信号を目的信号として、開ループストキャスティックコードブック探索と閉ループストキャスティックコードブック探索とを行うストキャスティック構造と、を備えることを特徴とする請求項1に記載の高域音声符号化装置。
  3. 前記高域音声信号は、認知加重されたゼロ状態の高域音声信号であることを特徴とする請求項2に記載の高域音声符号化装置。
  4. 前記ハーモニック構造は、
    前記認知加重されたゼロ状態の高域音声信号に対する理想的な線型予測係数励起信号を出力する第1認知加重された逆合成フィルタと、
    前記理想的な線型予測係数励起信号を目的信号として、前記MPアルゴリズムにより正弦波辞書のサイズ及び位相を探索する探索器と、
    前記探索器で探索された正弦波辞書のサイズベクトルを量子化する第1量子化器と、
    前記探索器で探索された正弦波辞書の位相ベクトルを量子化する第2量子化器と、
    前記第1量子化器から出力される量子化された正弦波辞書のサイズベクトルと、前記第2量子化器から出力される量子化された正弦波辞書の位相ベクトルとを利用して合成した、励起信号を生成する合成された励起信号生成器と、
    前記第1量子化器から出力される正弦波振幅正規化要素を量子化する第3量子化器と、
    前記合成された音声励起信号生成器から出力される合成した音声励起信号に、前記第3量子化器から出力される量子化された正弦波振幅正規化要素を乗算する乗算器と、
    前記乗算器から出力される信号と、インパルス応答とをコンボリューションして得られた合成された信号を出力する認知加重された合成フィルタと、
    前記認知加重されたゼロ状態の高域音声信号と、前記認知加重された合成フィルタにより出力される前記合成された信号との残差信号を出力する減算器と、を備えることを特徴とする請求項3に記載の高域音声符号化装置。
  5. 前記探索器は、前記認知加重されたゼロ状態の高域音声信号に対応する低域音声信号のピッチ値を利用して前記正弦波辞書の角周波数を求め、前記求められた角周波数を利用して前記正弦波辞書のサイズ及び位相を探索することを特徴とする請求項4に記載の高域音声符号化装置。
  6. 前記第1量子化器は、
    前記正弦波辞書のサイズベクトルを正規化し、前記正弦波振幅正規化要素を前記第3量子化器に提供する正規化器と、
    前記正規化器で正規化された正弦波辞書のサイズベクトルに対し、MDCTを行って得たDCT係数を出力するMDCT器と、
    前記MDCT器から出力されるDCT係数を量子化し、少なくとも1つのDCT係数候補を出力する係数ベクトル量子化器と、
    前記係数ベクトル量子化器から出力される少なくとも1つのDCT係数候補に対し、逆MDCTを行って量子化された正弦波振幅ベクトルを出力するIMDCT器と、
    前記正規化器から出力される前記正規化された正弦波辞書のサイズベクトルと、前記IMDCT器から出力される前記量子化された正弦波振幅ベクトルとの残差サイズベクトルを検出する減算器と、
    前記減算器から出力される残差サイズベクトルを量子化する残差サイズ量子化器と、
    前記残差サイズ量子化器から出力される量子化された残差サイズベクトルと、前記IMDCTから出力される量子化された正弦波振幅ベクトルとを加算する加算器と、
    本来の正弦波辞書のサイズベクトルを利用して、前記加算器から出力される量子化された正弦波辞書のサイズベクトルのうち、何れか一つを、前記本来の正弦波辞書のサイズベクトルと最も近接したサイズベクトルとして、最適の正弦波辞書のサイズベクトルを選択する最適ベクトル選択部と、を備えることを特徴とする請求項4に記載の高域音声符号化装置。
  7. 前記第1量子化器は、正弦波辞書のサイズのインデックスを、前記高域音声信号に対する復元情報として出力し、
    前記第2量子化器は、正弦波辞書の位相のインデックスを、前記高域音声信号に対する復元情報として出力することを特徴とする請求項4に記載の高域音声符号化装置。
  8. 前記ストキャスティック構造は、
    前記減算器から出力される残差信号と、インパルス応答とをコンボリューションして、理想的な励起信号を生成する第2認知加重された逆合成フィルタと、
    前記第2認知加重された逆合成フィルタから出力される前記理想的な励起信号を目的信号として、ストキャスティックコードブックで少なくとも1つのストキャスティックコードブック候補を選択する開ループストキャスティックコードブック探索器と、
    前記減算器から出力される残差信号を利用して、前記少なくとも1つのストキャスティックコードブック候補のうち、何れか1つのストキャスティックコードブック候補を、ストキャスティックコードブックとして選択し、選択されたストキャスティックコードブックの利得値を前記第3量子化器に提供する閉ループストキャスティックコードブック探索器と、を備え、
    前記第3量子化器は、前記正弦波振幅正規化要素と前記閉ループストキャスティックコードブック探索器から出力される利得値とを2次元的にベクトル量子化し、前記閉ループストキャスティックコードブック探索器から出力された利得値を量子化した値を、利得値インデックスとして出力し、
    前記利得値インデックスは、前記高域音声信号に対する復元情報であることを特徴とする請求項4に記載の高域音声符号化装置。
  9. 前記閉ループストキャスティックコードブック探索器は、
    前記認知加重された合成フィルタのインパルス応答と、前記少なくとも1つのストキャスティックコードブック候補とをコンボリューションして音声レベル信号を生成し、
    生成された音声レベル信号と前記減算器から出力される残差信号との間の利得値、前記音声レベル信号、及び前記残差信号を利用して前記少なくとも1つのストキャスティックコードブック候補に対する平均二乗エラーを求め、
    前記求められた平均二乗エラーが最小となるストキャスティックコードブック候補をストキャスティックコードブックとして選択することを特徴とする請求項8に記載の高域音声符号化装置。
  10. 前記第2符号化部は、
    前記高域音声信号に対する少なくとも1つのストキャスティックコードブック候補を選択する第1探索器と、
    前記第1探索器で選択された少なくとも1つのストキャスティックコードブック候補に基づいて、最適のストキャスティックコードブック候補をストキャスティックコードブックとして選択し、前記選択された最適のストキャスティックコードブックのインデックスを生成する第2探索器と、を備え、
    前記選択された最適のストキャスティックコードブックのインデックスは、前記高域音声信号を復元するための情報であることを特徴とする請求項1に記載の高域音声符号化装置。
  11. 前記高域音声信号は、認知加重されたゼロ状態の高域音声信号であることを特徴とする請求項10に記載の高域音声符号化装置。
  12. 前記第2符号化部は、
    前記認知加重されたゼロ状態の高域音声信号と、インパルス応答とをコンボリューションして、理想的な励起信号を生成し、前記生成された理想的な励起信号を前記第1探索器に提供する認知加重された逆合成フィルタと、
    複数のストキャスティックコードブックを備え、前記第1探索器により選択された前記少なくとも1つのストキャスティックコードブック候補と、前記第2探索器により選択された前記最適のストキャスティックコードブック候補とを、ストキャスティックコードブックとして出力するストキャスティックコードブック部と、
    前記ストキャスティックコードブック部から提供される少なくとも1つのストキャスティックコードブックに、前記第2探索器から提供される利得値を乗算する乗算器と、
    前記乗算器から出力される信号と、インパルス応答とをコンボリューションして、合成された信号を出力する認知加重された合成フィルタと、
    前記認知加重された合成フィルタから出力される合成信号と、前記認知加重されたゼロ状態の高域音声信号との差を出力する減算器と、
    前記第2探索器から出力される利得値を量子化し、量子化された利得値を利得値インデックスに出力する利得値量子化器と、を更に備え、
    前記利得値インデックスは、前記高域音声信号を復元する情報であることを特徴とする請求項11に記載の高域音声符号化装置。
  13. 前記高域音声信号がハーモニック成分のある信号であるか否かを、サブフレーム単位で前記高域音声信号のシャープネスの比率、左右エネルギー比率、0交差率、及び1次予測係数に基づいて判断することを特徴とする請求項1に記載の高域音声符号化装置。
  14. 前記高域音声信号を、前記第1符号化部と前記第2符号化部のうち、何れか1つに伝送するスイッチと、
    前記高域音声信号が、ハーモニック成分のある信号であるか否かを判断し、判断された結果に基づいて、前記スイッチの動作を制御するためのモード選択情報を出力するモード選択部と、を更に備えることを特徴とする請求項1に記載の高域音声符号化装置。
  15. 前記モード選択部は、サブフレーム単位で前記高域音声信号のシャープネスの比率、左右エネルギー比率、0交差率、及び1次予測係数をそれぞれ検出し、
    事前に設定された閾値と、前記検出されたシャープネスの比率、左右エネルギー比率、0交差率、及び1次予測係数とを比較し、
    前記比較結果が事前に設定された条件を満足すれば、前記高域音声信号が、ハーモニック成分のある信号と判断し、
    前記比較結果が前記事前に設定された条件を満足しなければ、前記高域音声信号がハーモニック成分のない信号と判断することを特徴とする請求項14に記載の高域音声符号化装置。
  16. 前記モード選択部は、前記高域音声信号に対応する低域音声信号が、ハーモニック成分のある信号であるか否かを更に判断し、前記高域音声信号と前記低域音声信号とが何れもハーモニック成分のある信号であれば、前記高域音声信号が前記第1符号化部に伝送されるように前記スイッチの動作を制御することを特徴とする請求項14に記載の高域音声符号化装置。
  17. 前記モード選択部は、前記高域音声信号と前記低域音声信号とのそれぞれに対し、サブフレーム単位でシャープネスの比率、左右エネルギー比率、0交差率、及び1次予測係数を検出し、
    事前に設定された閾値と前記検出されたシャープネスの比率、左右エネルギー比率、0交差率、及び1次予測係数とを比較し、
    前記高域音声信号と前記低域音声信号とに対する比較結果が、事前に設定された条件を満足すれば、前記高域音声信号と前記低域音声信号とが何れもハーモニック成分のある信号と判断し、
    前記高域音声信号と前記低域音声信号とに対する比較結果が、前記事前に設定された条件のうち、少なくとも一つの条件を満足しなければ、前記高域音声信号が前記第2符号化部に伝送されるように前記モード選択情報を出力することを特徴とする請求項16に記載の高域音声符号化装置。
  18. 前記高域音声信号は、認知加重されたゼロ状態の高域音声信号であることを特徴とする請求項17に記載の高域音声符号化装置。
  19. 前記認知加重されたゼロ状態の高域音声信号を生成する生成部を更に備えることを特徴とする請求項18に記載の高域音声符号化装置。
  20. 前記生成部は、
    高域音声信号から線型予測係数を求める線型予測係数分析部と、
    前記線型予測係数分析部から出力される線型予測係数を量子化する量子化部と、
    前記量子化部から出力される、量子化された線型予測係数を利用して0入力応答信号を出力する認知加重された合成フィルタと、
    前記線型予測係数分析部で求められた前記線型予測係数を利用して、前記高域音声信号に対する認知加重された音声信号を出力する認知加重フィルタと、
    前記認知加重フィルタから出力される認知加重された音声信号から前記0入力応答信号を除去して、前記認知加重されたゼロ状態の高域音声信号を出力する減算器と、を備えることを特徴とする請求項19に記載の高域音声符号化装置。
  21. 前記認知加重されたゼロ状態の高域音声信号を生成する生成部を更に備えることを特徴とする請求項2に記載の高域音声符号化装置。
  22. 入力される音声信号を高域音声信号と低域音声信号とに分割する帯域分割部と、
    前記帯域分割部から伝送される低域音声信号を符号化し、前記符号化により検出された低域音声信号のピッチ値を出力する低域音声符号化装置と、
    前記帯域分割部から伝送される高域音声信号及び低域音声信号と、前記低域音声信号符号化装置から出力されるピッチ値を利用して、前記帯域分割部から伝送される高域音声信号を符号化する高域音声符号化装置と、を備えることを特徴とする広域音声符号化システム。
  23. 前記高域音声符号化装置は、
    前記高域音声信号と前記低域音声信号とにハーモニック成分があれば、ハーモニック構造とストキャスティック構造とを結合した構造で前記高域音声信号を符号化し、
    前記高域音声信号と前記低域音声信号のうち、何れか1つの信号にハーモニック成分がなければ、ストキャスティック構造で前記高域音声信号を符号化することを特徴とする請求項22に記載の広域音声符号化システム。
  24. 受信された第1復元情報を利用して、ハーモニック構造とストキャスティック構造とを結合した構造で高域音声信号を復元する第1復元ユニットと、
    受信された第2復元情報を利用して、ストキャスティック構造で高域音声信号を復元する第2復元ユニットと、
    受信されたモード選択情報により、前記第1復元ユニットと前記第2復元ユニットのうち、何れか1つから出力される復元された高域音声信号を出力するスイッチと、を備えることを特徴とする高域音声復号化装置。
  25. 前記第1復元情報は、利得値インデックス、正弦波辞書のサイズのインデックス、正弦波辞書の位相のインデックス、及びストキャスティックコードブックのインデックスを備え、
    前記第2復元情報は、ストキャスティックコードブックのインデックス及び利得値インデックスを備えることを特徴とする請求項24に記載の高域音声復号化装置。
  26. 受信された線型予測係数インデックスを逆量子化して、量子化された線型予測係数を得て、前記量子化された線型予測係数を、前記第1復元ユニットと前記第2復元ユニットとにそれぞれ伝送する線型予測係数逆量子化部を更に備えることを特徴とする請求項25に記載の高域音声復号化装置。
  27. 受信された線型予測係数インデックスを逆量子化して、量子化された線型予測係数を得て、前記量子化された線型予測係数を、前記第1復元ユニットと前記第2復元ユニットとにそれぞれ伝送する線型予測係数逆量子化部を更に備えることを特徴とする請求項24に記載の高域音声復号化装置。
  28. 前記第1復元ユニットは、
    前記利得値インデックスを逆量子化して、量子化された利得値を出力する利得値逆量子化部と、
    前記正弦波辞書のサイズのインデックスを復号して、量子化された正弦波辞書のサイズベクトルを出力する正弦波振幅復号化部と、
    前記正弦波辞書の位相のインデックスを復号化して、量子化された正弦波辞書の位相ベクトルを出力する正弦波位相復号化部と、
    前記ストキャスティックコードブックのインデックスにより対応するストキャスティックコードブックを出力するストキャスティックコードブック部と、
    前記量子化された利得値と前記量子化された正弦波辞書のサイズベクトルとを乗算する第1乗算器と、
    前記量子化された利得値と前記ストキャスティックコードブックとを乗算して、励起信号を生成する第2乗算器と、
    前記第1乗算器から出力される信号と、前記量子化された正弦波辞書の位相ベクトルとを利用して、ハーモニック信号を復元するハーモニック信号復元部と、
    前記ハーモニック信号復元部から出力されるハーモニック信号と前記第2乗算器から出力される励起信号とを加算する加算器と、
    前記線型予測係数を利用して、前記加算器から出力される信号を合成フィルタリングして、前記復元された高域音声信号を出力する合成フィルタと、を備えることを特徴とする請求項25に記載の高域音声復号化装置。
  29. 前記第2復元ユニットは、
    前記ストキャスティックコードブックのインデックスが入力された場合に、対応するストキャスティックコードブックを出力するストキャスティックコードブック部と、
    前記利得値インデックスが入力された場合に、入力される前記利得値インデックスを逆量子化して、量子化された利得値を出力する利得値逆量子化部と、
    前記ストキャスティックコードブックと前記量子化された利得値とを乗算して、励起信号を生成する乗算器と、
    前記線型予測係数を利用して、前記乗算器から出力される信号を合成フィルタリングする合成フィルタと、を更に備えることを特徴とする請求項25に記載の高域音声復号化装置。
  30. ハーモニック構造とストキャスティック構造とを結合した構造と、ストキャスティック構造のうち、いずれか1つの構造を利用して、チャンネルを介して受信される復元情報から高域音声信号を復元する高域音声復号化装置と、
    前記チャンネルを介して受信される復元情報から低域音声信号を復元する低域音声復号化装置と、
    前記復元された高域音声信号と前記復元された低域音声信号とを結合して、復元された音声信号を出力する帯域結合部と、を備えることを特徴とする広域音声復号化システム。
  31. 広域音声符号化システムにおける高域音声の符号化方法において、
    高域音声信号及び対応する低域音声信号にハーモニック成分があるか否かを判断するステップと、
    前記高域音声信号と前記対応する低域音声信号とにいずれもハーモニック成分があれば、ハーモニック構造とストキャスティック構造とを結合した構造で前記高域音声信号を符号化する符号化ステップと、
    前記高域音声信号と前記対応する低域音声信号のうち、いずれか1つの信号にハーモニック成分がなければ、ストキャスティック構造で前記高域音声信号を符号化する符号化ステップと、を含むことを特徴とする高域音声の符号化方法。
  32. 前記ハーモニック成分があるか否かを判断するステップは、
    前記高域音声信号と前記低域音声信号とのそれぞれに対し、サブフレーム単位で特性値を検出するステップと、
    前記検出された特性値と事前に設定された閾値とを比較するステップと、
    前記比較結果が所定の条件を満足すれば、該当する音声信号にハーモニック成分があると判断するステップと、
    前記比較結果が所定の条件を満足しなければ、該当する音声信号にハーモニック成分がないと判断するステップと、を含むことを特徴とする請求項31に記載の高域音声の符号化方法。
  33. 前記特性値は、シャープネスの比率、左右エネルギー比率、0交差率、及び1次予測係数を含み、
    前記事前に設定された閾値は、各特性値に対する閾値を含むことを特徴とする請求項32に記載の高域音声の符号化方法。
  34. 前記高域音声信号は、認知加重されたゼロ状態の高域音声信号であることを特徴とする請求項33に記載の高域音声の符号化方法。
  35. 前記高域音声信号は、認知加重されたゼロ状態の高域音声信号であることを特徴とする請求項31に記載の高域音声の符号化方法。
  36. 前記ハーモニック構造は、MPアルゴリズムにより、前記高域音声信号に対する正弦波辞書のサイズ及び位相を探索して励起信号を生成することを特徴とする請求項31に記載の高域音声の符号化方法。
  37. 広域音声復号化システムにおける高域音声の復号化方法において、
    受信された復元情報に含まれているモード選択情報を分析するステップと、
    前記モード選択情報が、ハーモニック構造とストキャスティック構造とを結合したモードを表す場合に、ハーモニック構造とストキャスティック構造とを結合した構造を利用して、前記受信された復元情報に基づいて高域音声信号を復元するステップと、
    前記モード選択情報がストキャスティック構造を表す場合に、ストキャスティック構造を利用して、前記受信された復元情報に基づいて高域音声信号を復元するステップと、を含むことを特徴とする高域音声の復号化方法。
JP2005370053A 2004-12-31 2005-12-22 広域音声符号化システム及び広域音声復号化システム、高域音声符号化及び高域音声復号化装置、並びにその方法 Withdrawn JP2006189836A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040117965A KR100707174B1 (ko) 2004-12-31 2004-12-31 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법

Publications (1)

Publication Number Publication Date
JP2006189836A true JP2006189836A (ja) 2006-07-20

Family

ID=35917609

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005370053A Withdrawn JP2006189836A (ja) 2004-12-31 2005-12-22 広域音声符号化システム及び広域音声復号化システム、高域音声符号化及び高域音声復号化装置、並びにその方法

Country Status (4)

Country Link
US (1) US7801733B2 (ja)
EP (1) EP1677289A3 (ja)
JP (1) JP2006189836A (ja)
KR (1) KR100707174B1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009093466A1 (ja) 2008-01-25 2009-07-30 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
JP2011043795A (ja) * 2009-05-31 2011-03-03 Huawei Technologies Co Ltd 符号化方法、装置及び機器、及び復号化方法
JP2012511731A (ja) * 2008-12-10 2012-05-24 華為技術有限公司 信号符号化及び復号化方法及び装置、並びに符号化及び復号化システム
JP2013538374A (ja) * 2010-09-15 2013-10-10 サムスン エレクトロニクス カンパニー リミテッド 高周波数帯域幅拡張のための符号化/復号化装置及びその方法
JP2016539369A (ja) * 2013-11-22 2016-12-15 クゥアルコム・インコーポレイテッドQualcomm Incorporated ハイバンドコーディングにおける選択的位相補償
JP2017515154A (ja) * 2014-04-29 2017-06-08 華為技術有限公司Huawei Technologies Co.,Ltd. 音声符号化方法および関連装置
JP2017524980A (ja) * 2014-06-26 2017-08-31 クゥアルコム・インコーポレイテッドQualcomm Incorporated ハイバンド信号特性に基づいた時間利得調整
US10453466B2 (en) 2010-12-29 2019-10-22 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high frequency bandwidth extension

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
WO2007114290A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
KR100868763B1 (ko) * 2006-12-04 2008-11-13 삼성전자주식회사 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
US8326641B2 (en) * 2008-03-20 2012-12-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding using bandwidth extension in portable terminal
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8831958B2 (en) 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
US9843742B2 (en) 2009-03-02 2017-12-12 Flir Systems, Inc. Thermal image frame capture using de-aligned sensor array
US9473681B2 (en) 2011-06-10 2016-10-18 Flir Systems, Inc. Infrared camera system housing with metalized surface
US9517679B2 (en) 2009-03-02 2016-12-13 Flir Systems, Inc. Systems and methods for monitoring vehicle occupants
US9948872B2 (en) 2009-03-02 2018-04-17 Flir Systems, Inc. Monitor and control systems and methods for occupant safety and energy efficiency of structures
WO2012170946A2 (en) 2011-06-10 2012-12-13 Flir Systems, Inc. Low power and small form factor infrared imaging
US9635285B2 (en) 2009-03-02 2017-04-25 Flir Systems, Inc. Infrared imaging enhancement with fusion
US9998697B2 (en) 2009-03-02 2018-06-12 Flir Systems, Inc. Systems and methods for monitoring vehicle occupants
US9756264B2 (en) 2009-03-02 2017-09-05 Flir Systems, Inc. Anomalous pixel detection
US10757308B2 (en) 2009-03-02 2020-08-25 Flir Systems, Inc. Techniques for device attachment with dual band imaging sensor
US10244190B2 (en) 2009-03-02 2019-03-26 Flir Systems, Inc. Compact multi-spectrum imaging with fusion
USD765081S1 (en) 2012-05-25 2016-08-30 Flir Systems, Inc. Mobile communications device attachment with camera
US9451183B2 (en) 2009-03-02 2016-09-20 Flir Systems, Inc. Time spaced infrared image enhancement
US9986175B2 (en) 2009-03-02 2018-05-29 Flir Systems, Inc. Device attachment with infrared imaging sensor
US9208542B2 (en) 2009-03-02 2015-12-08 Flir Systems, Inc. Pixel-wise noise reduction in thermal images
US9235876B2 (en) 2009-03-02 2016-01-12 Flir Systems, Inc. Row and column noise reduction in thermal images
US9674458B2 (en) 2009-06-03 2017-06-06 Flir Systems, Inc. Smart surveillance camera systems and methods
EP2239958A3 (en) * 2009-03-06 2015-06-24 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
US10091439B2 (en) 2009-06-03 2018-10-02 Flir Systems, Inc. Imager with array of multiple infrared imaging modules
US9292909B2 (en) 2009-06-03 2016-03-22 Flir Systems, Inc. Selective image correction for infrared imaging devices
US9819880B2 (en) 2009-06-03 2017-11-14 Flir Systems, Inc. Systems and methods of suppressing sky regions in images
US9843743B2 (en) 2009-06-03 2017-12-12 Flir Systems, Inc. Infant monitoring systems and methods using thermal imaging
US9756262B2 (en) 2009-06-03 2017-09-05 Flir Systems, Inc. Systems and methods for monitoring power systems
US9716843B2 (en) 2009-06-03 2017-07-25 Flir Systems, Inc. Measurement device for electrical installations and related methods
US8781822B2 (en) * 2009-12-22 2014-07-15 Qualcomm Incorporated Audio and speech processing with optimal bit-allocation for constant bit rate applications
CN104252862B (zh) * 2010-01-15 2018-12-18 Lg电子株式会社 处理音频信号的方法和装置
CN102812512B (zh) * 2010-03-23 2014-06-25 Lg电子株式会社 处理音频信号的方法和装置
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
US9706138B2 (en) 2010-04-23 2017-07-11 Flir Systems, Inc. Hybrid infrared sensor array having heterogeneous infrared sensors
US9207708B2 (en) 2010-04-23 2015-12-08 Flir Systems, Inc. Abnormal clock rate detection in imaging sensor arrays
US9848134B2 (en) 2010-04-23 2017-12-19 Flir Systems, Inc. Infrared imager with integrated metal layers
US9918023B2 (en) 2010-04-23 2018-03-13 Flir Systems, Inc. Segmented focal plane array architecture
US8000968B1 (en) 2011-04-26 2011-08-16 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals
US9706137B2 (en) 2011-06-10 2017-07-11 Flir Systems, Inc. Electrical cabinet infrared monitor
US10051210B2 (en) 2011-06-10 2018-08-14 Flir Systems, Inc. Infrared detector array with selectable pixel binning systems and methods
US10841508B2 (en) 2011-06-10 2020-11-17 Flir Systems, Inc. Electrical cabinet infrared monitor systems and methods
US9235023B2 (en) 2011-06-10 2016-01-12 Flir Systems, Inc. Variable lens sleeve spacer
US9900526B2 (en) 2011-06-10 2018-02-20 Flir Systems, Inc. Techniques to compensate for calibration drifts in infrared imaging devices
US9058653B1 (en) 2011-06-10 2015-06-16 Flir Systems, Inc. Alignment of visible light sources based on thermal images
US9509924B2 (en) 2011-06-10 2016-11-29 Flir Systems, Inc. Wearable apparatus with integrated infrared imaging module
EP2719166B1 (en) 2011-06-10 2018-03-28 Flir Systems, Inc. Line based image processing and flexible memory system
US10169666B2 (en) 2011-06-10 2019-01-01 Flir Systems, Inc. Image-assisted remote control vehicle systems and methods
US9961277B2 (en) 2011-06-10 2018-05-01 Flir Systems, Inc. Infrared focal plane array heat spreaders
US9143703B2 (en) 2011-06-10 2015-09-22 Flir Systems, Inc. Infrared camera calibration techniques
KR101778353B1 (ko) 2011-06-10 2017-09-13 플리어 시스템즈, 인크. 적외선 이미징 장치용 불균일성 교정 기술
US10389953B2 (en) 2011-06-10 2019-08-20 Flir Systems, Inc. Infrared imaging device having a shutter
US10079982B2 (en) 2011-06-10 2018-09-18 Flir Systems, Inc. Determination of an absolute radiometric value using blocked infrared sensors
CN103035248B (zh) 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
EP2791937B1 (en) * 2011-11-02 2016-06-08 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
US8731911B2 (en) * 2011-12-09 2014-05-20 Microsoft Corporation Harmonicity-based single-channel speech quality estimation
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
KR101398189B1 (ko) * 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
US9811884B2 (en) 2012-07-16 2017-11-07 Flir Systems, Inc. Methods and systems for suppressing atmospheric turbulence in images
WO2014014957A1 (en) 2012-07-16 2014-01-23 Flir Systems, Inc. Methods and systems for suppressing noise in images
CN103928031B (zh) * 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
US9973692B2 (en) 2013-10-03 2018-05-15 Flir Systems, Inc. Situational awareness by compressed display of panoramic views
US11297264B2 (en) 2014-01-05 2022-04-05 Teledyne Fur, Llc Device attachment with dual band imaging sensor
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
KR101701623B1 (ko) * 2015-07-09 2017-02-13 라인 가부시키가이샤 VoIP 통화음성 대역폭 감소를 은닉하는 시스템 및 방법
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US11914862B2 (en) * 2022-03-22 2024-02-27 Western Digital Technologies, Inc. Data compression with entropy encoding

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07334194A (ja) * 1994-06-14 1995-12-22 Matsushita Electric Ind Co Ltd 音声符号化/復号化方法およびそれらの装置
DE69619284T3 (de) 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP3707153B2 (ja) 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
EP0994464A1 (fr) 1998-10-13 2000-04-19 Koninklijke Philips Electronics N.V. Procédé destiné à génére un signal large bande a partir d'un signal en bande étroite, appareil pour realiser un tel procédé et equipement téléphonique comportant un tel appareil
CA2259094A1 (en) 1999-01-15 2000-07-15 Universite De Sherbrooke A method and device for designing and searching large stochastic codebooks in low bit rate speech encoders
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
DE60118627T2 (de) 2000-05-22 2007-01-11 Texas Instruments Inc., Dallas Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
KR100348899B1 (ko) * 2000-09-19 2002-08-14 한국전자통신연구원 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법
US6691085B1 (en) 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
JP4622164B2 (ja) 2001-06-15 2011-02-02 ソニー株式会社 音響信号符号化方法及び装置
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
KR100707177B1 (ko) * 2005-01-19 2007-04-13 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8422569B2 (en) 2008-01-25 2013-04-16 Panasonic Corporation Encoding device, decoding device, and method thereof
WO2009093466A1 (ja) 2008-01-25 2009-07-30 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
JP2017151486A (ja) * 2008-12-10 2017-08-31 華為技術有限公司Huawei Technologies Co.,Ltd. 信号符号化及び復号化方法及び装置
JP2012511731A (ja) * 2008-12-10 2012-05-24 華為技術有限公司 信号符号化及び復号化方法及び装置、並びに符号化及び復号化システム
JP2013174899A (ja) * 2008-12-10 2013-09-05 Huawei Technologies Co Ltd 信号符号化及び復号化方法及び装置
JP2015180960A (ja) * 2008-12-10 2015-10-15 華為技術有限公司Huawei Technologies Co.,Ltd. 信号符号化及び復号化方法及び装置
JP2011043795A (ja) * 2009-05-31 2011-03-03 Huawei Technologies Co Ltd 符号化方法、装置及び機器、及び復号化方法
JP2013538374A (ja) * 2010-09-15 2013-10-10 サムスン エレクトロニクス カンパニー リミテッド 高周波数帯域幅拡張のための符号化/復号化装置及びその方法
JP2017076133A (ja) * 2010-09-15 2017-04-20 サムスン エレクトロニクス カンパニー リミテッド 高周波数帯域幅拡張のための符号化/復号化装置及びその方法
US9837090B2 (en) 2010-09-15 2017-12-05 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding signal for high frequency bandwidth extension
JP2018120236A (ja) * 2010-09-15 2018-08-02 サムスン エレクトロニクス カンパニー リミテッド 高周波数帯域幅拡張のための符号化/復号化装置及びその方法
US10152983B2 (en) 2010-09-15 2018-12-11 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high frequency bandwidth extension
US10418043B2 (en) 2010-09-15 2019-09-17 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding signal for high frequency bandwidth extension
US10453466B2 (en) 2010-12-29 2019-10-22 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high frequency bandwidth extension
US10811022B2 (en) 2010-12-29 2020-10-20 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high frequency bandwidth extension
JP2016539369A (ja) * 2013-11-22 2016-12-15 クゥアルコム・インコーポレイテッドQualcomm Incorporated ハイバンドコーディングにおける選択的位相補償
JP2017515154A (ja) * 2014-04-29 2017-06-08 華為技術有限公司Huawei Technologies Co.,Ltd. 音声符号化方法および関連装置
US10262671B2 (en) 2014-04-29 2019-04-16 Huawei Technologies Co., Ltd. Audio coding method and related apparatus
US10984811B2 (en) 2014-04-29 2021-04-20 Huawei Technologies Co., Ltd. Audio coding method and related apparatus
JP2017524980A (ja) * 2014-06-26 2017-08-31 クゥアルコム・インコーポレイテッドQualcomm Incorporated ハイバンド信号特性に基づいた時間利得調整

Also Published As

Publication number Publication date
KR100707174B1 (ko) 2007-04-13
KR20060078362A (ko) 2006-07-05
EP1677289A3 (en) 2008-12-03
US20060149538A1 (en) 2006-07-06
US7801733B2 (en) 2010-09-21
EP1677289A2 (en) 2006-07-05

Similar Documents

Publication Publication Date Title
JP2006189836A (ja) 広域音声符号化システム及び広域音声復号化システム、高域音声符号化及び高域音声復号化装置、並びにその方法
US10115407B2 (en) Method and apparatus for encoding and decoding high frequency signal
US9418666B2 (en) Method and apparatus for encoding and decoding audio/speech signal
JP6170520B2 (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
EP1619664B1 (en) Speech coding apparatus, speech decoding apparatus and methods thereof
US7805314B2 (en) Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data
US20070282599A1 (en) Method and apparatus to encode and/or decode signal using bandwidth extension technology
EP2017830B9 (en) Encoding device and encoding method
RU2677453C2 (ru) Способы, кодер и декодер для линейного прогнозирующего кодирования и декодирования звуковых сигналов после перехода между кадрами, имеющими различные частоты дискретизации
JP2009508146A (ja) オーディオコーデックポストフィルタ
JPH10124088A (ja) 音声帯域幅拡張装置及び方法
JP2005031683A (ja) ビット率拡張音声符号化及び復号化装置とその方法
JP3541680B2 (ja) 音声音楽信号の符号化装置および復号装置
JP5313967B2 (ja) ビット率拡張音声符号化及び復号化装置とその方法
JP4727413B2 (ja) 音声符号化・復号装置
WO2013057895A1 (ja) 符号化装置及び符号化方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
RU2409874C9 (ru) Сжатие звуковых сигналов
RU2414009C2 (ru) Устройство и способ для кодирования и декодирования сигнала
KR100682966B1 (ko) 주파수 크기데이터 양자화/역양자화 방법 및 장치와 이를이용한 오디오 부호화/복호화 방법 및 장치

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061114

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061129

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081126

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090521