JP4726445B2 - 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法 - Google Patents
広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法 Download PDFInfo
- Publication number
- JP4726445B2 JP4726445B2 JP2004208615A JP2004208615A JP4726445B2 JP 4726445 B2 JP4726445 B2 JP 4726445B2 JP 2004208615 A JP2004208615 A JP 2004208615A JP 2004208615 A JP2004208615 A JP 2004208615A JP 4726445 B2 JP4726445 B2 JP 4726445B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- dct coefficient
- signal
- audio signal
- dct
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000007906 compression Methods 0.000 title claims abstract description 71
- 230000006835 compression Effects 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000005236 sound signal Effects 0.000 title claims description 216
- 230000006837 decompression Effects 0.000 title abstract description 18
- 238000013139 quantization Methods 0.000 claims description 113
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 3
- 230000005237 high-frequency sound signal Effects 0.000 claims 3
- 230000009466 transformation Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000012546 transfer Methods 0.000 description 7
- 238000011084 recovery Methods 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000005238 low-frequency sound signal Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
図1は、本発明による広域音声信号の圧縮装置の機能ブロック図である。図1に示すとおり、前記広域音声信号の圧縮装置は、第1帯域変換ユニット102と、狭域音声圧縮器106と、高域音声圧縮器107とを含む。
とする時、最初の帯域のDC予測誤差Δ0は下記式(1)により求められる。
を検出する。逆量子化されたLog DC値
は式(3)を使用して検出される。検出された逆量子化されたLog DC値
は、ライン405を通じて帯域間予測器401に提供される。
を求める。
および
は、現在フレームmで第1DCT係数インデックスkに対する時間インデックスnでのサンプル値をそれぞれ示し、
は、インデックスkの第1量子化されたDCT係数の大きさを示す。前記サンプル値は、ライン902、903を通じて出力される。
は、ライン905を通じて出力されるDCT係数インデックスkに対する時間軸予測情報であり、
は、以前フレームm−1で求めた時間インデックスn+Lに該当するサンプル値を意味する。1フレームの時間インデックスが0からL−1までであるため、
値が以前フレームで求めた現フレームのサンプル値となる。
102 第1帯域変換ユニット
103 狭域低域信号
104 低域通過フィルター
105 ダウンサンプラー
106 狭域音声圧縮器
107 高域音声圧縮器
108 低域音声パケット
109 ライン
110 ライン
Claims (48)
- 広域音声信号の圧縮装置において、
前記広域音声信号の低域音声信号を圧縮し、前記圧縮された低域音声信号を低域音声パケットとして出力する狭域音声圧縮器と、
前記広域音声信号の高域音声信号の複数の帯域に対して、前記狭域音声圧縮器から提供される低域音声信号のエネルギー情報を利用して帯域間予測を行うことによって、前記広域音声信号の高域音声信号を圧縮し、圧縮された高域音声信号を高域音声パケットとして出力する高域音声圧縮器と、を含み、
前記帯域間予測は、前記広域音声信号の高域音声信号の帯域に離散余弦変換(DCT)を実行して求めた第1DCT係数の大きさに対してさらにDCTを実行して求めた第2DCT係数のDC成分を、前記狭域音声圧縮器から提供される低域音声信号のエネルギー情報を利用して予測するものである、
広域音声信号の圧縮装置。 - 前記狭域音声圧縮器がCELP型の圧縮器である場合、前記低域音声信号のエネルギー情報は、前記高域音声圧縮器のフレームに該当する前記狭域音声圧縮器の量子化された固定コードブック利得であることを特徴とする請求項1に記載の広域音声信号の圧縮装置。
- 前記狭域音声圧縮器がCELP系列の圧縮器である場合、前記低域音声信号のエネルギー情報は、前記高域音声圧縮器のフレームに該当する前記狭域音声圧縮器の量子化された固定コードブック利得の平均値であることを特徴とする請求項1に記載の広域音声信号の圧縮装置。
- 前記高域音声圧縮器は、
前記広域音声信号の高域音声信号を異なる周波数帯域の複数個の帯域信号に分解するフィルターバンクと、
前記フィルターバンクから出力される各帯域信号に対してRMS値を計算する帯域RMS値計算器と、
前記帯域RMS値計算器で計算されたRMS値に基づいて前記フィルターバンクで分解された帯域信号の順位を定める帯域順位決定器と、
前記帯域順位決定器で決定された帯域順位情報および前記低域音声信号のエネルギー情報を利用して、前記フィルターバンクで分解された前記複数の帯域信号を量子化して各帯域の量子化インデックスを出力する帯域信号量子化モジュールと、
前記帯域順位情報および前記帯域信号量子化モジュールから出力される帯域別量子化インデックスをパケット化し、前記パケット化された結果を前記高域音声パケットとして出力するパケット化器と、を含む請求項1に記載の広域音声信号の圧縮装置。 - 前記帯域順位決定器は、前記RMS値の大きさ順序によって前記帯域信号の順位を決定することを特徴とする請求項4に記載の広域音声信号の圧縮装置。
- 前記帯域順位決定器は、大きいRMS値を持つ帯域信号に高い優先順位を割り当てることを特徴とする請求項4に記載の広域音声信号の圧縮装置。
- 前記帯域信号量子化モジュールは、
前記フィルターバンクから提供される複数の信号に対して離散余弦変換(Discrete Cosine Transform:DCT)を実行して第1DCT係数を求める第1DCT演算器と、
前記第1DCT係数の大きさを求める大きさ抽出器と、
前記第1DCT係数の符号を求める符号抽出器と、
前記大きさ抽出器で抽出された第1DCT係数の大きさに対してDCTを実行して第2DCT係数を求める第2DCT演算器と、
前記第2DCT係数において、DC成分および前記DC成分を除外したDCT係数を分離し、前記DCT係数を第3DCT係数として出力するDC分離器と、
前記DC分離器から出力される前記DC成分を量子化するDC量子化モジュールと、
前記第3DCT係数のRMS値を求めるRMS値計算器と、
前記RMS値計算器で求めたRMS値を量子化するRMS値量子化モジュールと、
前記RMS値量子化モジュールから出力されるRMS値量子化インデックスを利用して検出された量子化されたRMS値に基づいて、前記第3DCT係数を正規化する正規化器と、
前記正規化された第3DCT係数を量子化するDCT係数量子化器と、
前記符号抽出器から抽出された符号を量子化する符号量子化モジュールと、を含む請求項4に記載の広域音声信号の圧縮装置。 - 前記DC量子化モジュールは、前記低域音声信号のエネルギー情報および前記帯域信号のDC成分を利用した帯域間予測によって前記DC成分を量子化することを特徴とする請求項7に記載の広域音声信号の圧縮装置。
- 前記DC量子化モジュールは、
前記低域音声信号のエネルギー情報および前記各帯域信号のDC成分を利用して帯域間予測を行う帯域間予測器と、
前記帯域間予測器から出力される各帯域信号のDC予測誤差を量子化してDC量子化インデックスを出力するDC量子化器と、
前記DC量子化器から出力される前記DC量子化インデックスから各帯域信号に対する量子化されたDC予測誤差を求め、前記DC予測誤差から各帯域信号に対する逆量子化されたDC値を求めるDC逆量子化器と、を含むことを特徴とする請求項7に記載の広域音声信号の圧縮装置。 - 前記DC量子化モジュールは、前記DC予測誤差を独立的にスカラー量子化することを特徴とする請求項9に記載の広域音声信号の圧縮装置。
- 前記RMS値量子化モジュールは、前記第2DCT係数の量子化されたDC値を利用した帯域内予測によって前記第3DCT係数のRMS値を量子化することを特徴とする請求項7に記載の広域音声信号の圧縮装置。
- 前記RMS値量子化モジュールは、
前記第3DCT係数のRMS値および前記第2DCT係数の量子化されたDC値を利用して帯域内で予測動作を行う帯域内予測器と、
前記帯域内予測器から出力されるRMS予測誤差を量子化するRMS量子化器と、を含む請求項7に記載の広域音声信号の圧縮装置。 - 前記DCT係数量子化器は、各帯域信号の第3DCT係数のうち所定数のDCT係数を量子化して残りの第3DCT係数は除去することを特徴とする請求項7に記載の広域音声信号の圧縮装置。
- 前記DCT係数量子化器は、前記帯域順位情報によって、高い優先順位を持つ帯域では前記第3DCT係数を少なく除去し、低い優先順位を持つ帯域では前記第3DCT係数を多く除去することを特徴とする請求項15に記載の広域音声信号の圧縮装置。
- 前記DCT係数量子化器は、前記帯域順位情報によって各帯域で量子化するDCT係数の範囲に該当するインデックスを決定し、決定されたインデックスを参照して各帯域別に第3DCT係数を量子化することを特徴とする請求項7に記載の広域音声信号の圧縮装置。
- 前記DCT係数量子化器は、前記帯域順位情報によって各帯域で量子化するDCT係数の範囲に該当するインデックスを決定し、前記決定されたDCT係数のインデックスより下位のインデックスに該当する第3DCT係数を除去し、前記決定されたDCT係数インデックスより下位インデックスに該当しない残りの第3DCT係数を量子化する請求項7に記載の広域音声信号の圧縮装置。
- 前記DCT係数量子化器は、各帯域で量子化する第3DCT係数を複数のサブベクトルに分割し、前記帯域順位情報によって複数のサブベクトルのうち量子化するサブベクトルと除去するサブベクトルとを選択する分割ベクトル量子化方式によって量子化することを特徴とする請求項7に記載の広域音声信号の圧縮装置。
- 前記符号量子化モジュールは、前記第3DCT係数の量子化インデックスおよび前記第2DCT係数のDC量子化インデックスを利用して前記第1量子化されたDCT係数の大きさ順序情報を検出し、前記量子化された第1DCT係数の大きさ順序情報によって前記第1DCT係数の符号を量子化する請求項7に記載の広域音声信号の圧縮装置。
- 前記符号量子化モジュールは、前記第1量子化されたDCT係数の大きさ順序情報を利用して、前記第1DCT係数の符号を量子化する第1DCT係数の符号と除去する第1DCT係数の符号とに区分して前記量子化する第1DCT係数の符号を量子化する請求項20に記載の広域音声信号の圧縮装置。
- 前記量子化する第1DCT係数の符号は、最大の大きさの第1DCT係数の符号から順次、下位の第1DCT係数の符号まで所定の数の第1DCT係数の符号を含むことを特徴とする請求項21に記載の広域音声信号の圧縮装置。
- 前記符号量子化モジュールは、
前記第3DCT係数の量子化インデックスから逆量子化された第3DCT係数を求めるDCT係数逆量子化器と、
前記第2DCT係数のDC量子化インデックスから第2DCT係数の逆量子化されたDC値を求めるDC逆量子化器と、
前記逆量子化された第3DCT係数と第2DCT係数の逆量子化されたDC値をDCT逆変換する逆DCT演算器と、
前記逆DCT演算器から出力される量子化された第1DCT係数の大きさを大きさ順に整列する整列器と、
前記整列器から出力される量子化された第1DCT係数の大きさ順序情報によって前記第1DCT係数の符号を量子化する符号量子化器と、を含む請求項7に記載の広域音声信号の圧縮装置。 - 前記符号量子化器は、前記整列器から出力される量子化された第1DCT係数の大きさ順序情報を利用して、最大の大きさの第1DCT係数から順次、下位の第1DCT係数の符号まで所定の数の第1DCT係数に該当する符号を量子化し、残りの第1DCT係数の符号は除去することを特徴とする請求項23に記載の広域音声信号の圧縮装置。
- 前記広域音声信号の圧縮装置は、
前記広域音声信号を狭域低域音声信号に変換して前記狭域音声圧縮器に提供する第1帯域変換ユニットをさらに含む請求項1に記載の広域音声信号の圧縮装置。 - 圧縮された低域音声パケットおよび圧縮された高域音声パケットから広域音声信号を復元する装置において、
前記圧縮された低域音声パケットを低域音声信号に復元する狭域音声復元器と、
前記広域音声信号の高域音声信号の複数の帯域に対して、前記狭域音声復元器から提供される復元された低域音声信号のエネルギー情報を利用して帯域間予測を行うことによって、前記圧縮された高域音声パケットを高域音声信号に復元する高域音声復元器と、
前記狭域音声復元器から出力される低域音声信号と前記高域音声復元器から出力される高域音声信号とを加算して広域復元信号を出力する加算器と、を含み、
前記帯域間予測は、復元された高域音声信号を求める元になる量子化された第1DCT係数の大きさを求める元になる第2DCT係数のうちDC成分を、前記狭域音声復元器から提供される低域音声信号のエネルギー情報を利用して予測するものである、
広域音声信号復元装置。 - 前記高域音声復元器は、
前記高域音声パケットを分解して、符号量子化インデックス、帯域順位情報、第3DCT量子化インデックス、第2DCT係数のDC量子化インデックス、および第3DCT係数のRMS量子化インデックスを出力する逆パケット化器と、
前記逆パケット化器から出力される符号量子化インデックスを逆量子化する符号逆量子化器と、
前記逆パケット化器から出力される帯域順位情報、第3DCT量子化インデックス、第2DCT係数のDC量子化インデックス、および第3DCT係数のRMS量子化インデックスをそれぞれ逆量子化して量子化された第2DCT係数を求め、前記量子化された第2DCT係数から量子化された第1DCT係数の大きさを求める逆DCT演算モジュールと、
前記逆DCT演算モジュールから出力される量子化された第1DCT係数の大きさを大きさ順に整列して前記量子化された第1DCT係数の大きさ順序情報を出力する整列器と、
前記第1DCT係数の大きさ順序情報に基づいて第1DCT係数の大きさに、前記高域音声パケットから求めた第1DCT係数の符号を挿入する符号挿入器と、
前記整列器から提供される第1DCT係数の大きさ順序情報に基づいて第1DCT係数の符号情報のうち伝達されていない符号を予測して、その予測された符号を該当する第1DCT係数の大きさに挿入する符号予測モジュールと、
前記符号挿入器および前記符号予測モジュールから出力される符号が挿入された第1DCT係数を、各帯域別に量子化された時間領域信号に変換する逆DCT演算器と、
前記逆DCT演算器から出力される各帯域別に量子化された時間領域の信号を利用して各帯域別の音声信号を得て、前記各帯域別の音声信号を利用して高域音声信号を復元する復元処理部と、を含む請求項26に記載の広域音声信号復元装置。 - 前記符号挿入器は、前記量子化された第1DCT係数の大きさ順序情報を利用して、最大の大きさを持つ量子化された第1DCT係数から順次、下位の第1DCT係数の符号まで所定の数の前記第1DCT係数の符号を量子化された第1DCT係数に挿入することを特徴とする請求項27に記載の広域音声信号復元装置。
- 前記符号予測モジュールは、前記符号挿入器の動作によって符号が割り当てられていない第1DCT係数に対して符号を予測し、予測された符号を該当する第1DCT係数に挿入することを特徴とする請求項27に記載の広域音声信号復元装置。
- 前記符号予測モジュールは、
前記符号が割り当てられていない第1DCT係数の各インデックスに正の符号および負の符号をそれぞれ挿入し、逆DCT演算を通じて各係数のインデックスの符号に対する時間軸情報を出力する複数個の時間軸変換器と、
前記符号が割り当てられていない第1DCT係数の各インデックスに対して、以前フレームの高域信号情報を利用して各DCT係数インデックス別に現在フレームの時間軸予測情報を出力する信号予測器と、
各DCT係数インデックスの前記正の符号および負の符号を使用して求められた時間軸情報と前記時間軸予測情報とを比較して各DCT係数インデックスに対する最終符号を決定する符号選択器と、を含むことを特徴とする請求項27に記載の広域音声信号復元装置。 - 前記符号選択器は、前記複数個の時間軸変換器の出力のうち前記信号予測器から出力される時間軸予測情報に最も近接した符号を最終符号として選択することを特徴とする請求項30に記載の広域音声信号復元装置。
- 広域音声信号の圧縮方法において、
広域音声信号を受信し、前記広域音声信号の高域音声信号の複数の帯域に対して、前記広域音声信号の低域音声信号のエネルギー情報を利用して帯域間予測を行うことによって、前記広域音声信号の高域音声信号を圧縮する段階と、
前記圧縮された高域音声信号を高域音声パケットとして出力する段階と、を含み、
前記帯域間予測は、前記広域音声信号の高域音声信号の帯域に離散余弦変換(DCT)を実行して求めた第1DCT係数の大きさに対してさらにDCTを実行して求めた第2DCT係数のDC成分を、前記狭域音声圧縮器から提供される低域音声信号のエネルギー情報を利用して予測するものである、
広域音声信号の圧縮方法。 - 前記方法は、前記広域音声信号の低域音声信号を狭域音声圧縮によって圧縮し、圧縮された低域音声信号を低域音声パケットとして出力する段階をさらに含み、
前記低域音声信号のエネルギー情報は、前記広域音声信号の低域音声信号の狭域音声圧縮により生成されることを特徴とする請求項36に記載の広域音声信号の圧縮方法。 - 前記高域音声信号の圧縮段階は、
前記広域音声信号の高域音声信号を異なる周波数帯域を持つ複数個の帯域信号に分解する段階と、
前記複数個の帯域信号の順位を決定する段階と、
前記決定された順位によって前記複数個の帯域信号を量子化する段階と、を含む請求項36に記載の広域音声信号の圧縮方法。 - 前記順位を決定する段階は、前記複数個の帯域信号に対するRMS値に基づいて行われることを特徴とする請求項38に記載の広域音声信号の圧縮方法。
- 前記順位を決定する段階は、前記RMS値が大きい値を持つ帯域に高い優先順位が割り当てられるように行われることを特徴とする請求項39に記載の広域音声信号の圧縮方法。
- 前記各帯域別に量子化する段階は、
前記複数の帯域信号にそれぞれDCTを適用して第1DCT係数を求める段階と、
前記第1DCT係数の大きさおよび符号を独立的に抽出する段階と、
前記第1DCT係数の大きさにDCTを適用して第2DCT係数を求める段階と、
前記第2DCT係数におけるDC成分と残りのDCT係数とを分離し、前記残りのDCT係数を第3DCT係数として生成する段階と、
前記第3DCT係数のRMS値を計算する段階と、
前記DC成分、前記第3DCT係数のRMS値、前記第3DCT係数および前記第1DCT係数の符号を独立的に量子化する段階と、を含む請求項38に記載の広域音声信号の圧縮方法。 - 前記DC成分、前記第3DCT係数のRMS値、前記第3DCT係数および前記第1DCT係数の符号を独立的に量子化する段階は、
前記DC成分を帯域間予測量子化過程で量子化する段階と、
前記第3DCT係数のRMS値を帯域内予測量子化過程で量子化する段階と、
前記第3DCT係数を、各帯域の第3DCT係数のうち所定数の第3DCT係数は量子化され、残りの第3DCT係数は除去されるように量子化する段階と、
最も大きい値を持つ第1DCT係数の符号が量子化されるように前記第1DCT係数の符号を量子化する段階と、を含む請求項41に記載の広域音声信号の圧縮方法。 - 前記帯域内予測量子化を使用する第3DCT係数のRMS値の量子化は、前記第3DCT係数のRMS値および前記第2DCT係数の量子化されたDC値を利用して行われることを特徴とする請求項42に記載の広域音声信号の圧縮方法。
- 前記第3DCT係数の量子化段階は、前記各帯域の順位情報によって、高い優先順位を持つ帯域で前記第3DCT係数を少なく除去し、低い優先順位を持つ帯域で前記第3DCT係数を多く除去することを特徴とする請求項42に記載の広域音声信号の圧縮方法。
- 前記第1DCT係数の符号量子化段階は、最大の大きさを持つ量子化された第1DCT係数から順次、下位の第1DCT係数の符号まで所定の数の前記第1DCT係数の符号を量子化し、残りの第1DCT係数の符号は除去することを特徴とする請求項42に記載の広域音声信号の圧縮方法。
- 階層的な帯域幅構造に圧縮された低域音声パケットおよび高域音声パケットから広域音声信号を復元する方法において、
前記低域音声パケットを低域音声信号に復元する段階と、
前記広域音声信号の高域音声信号の複数の帯域に対して、前記低域音声信号の復元時に得られる復元された低域音声信号のエネルギー情報を利用して帯域間予測を行うことによって、前記高域音声パケットを高域音声信号に復元する段階と、
前記低域音声信号および前記高域音声信号を加算して広域復元信号を生成する段階と、を含み、
前記帯域間予測は、復元された高域音声信号を求める元になる量子化された第1DCT係数の大きさを求める元になる第2DCT係数のうちDC成分を、前記狭域音声復元器から提供される低域音声信号のエネルギー情報を利用して予測するものである、
広域音声信号の復元方法。 - 前記高域音声信号を復元する段階は、
前記高域音声パケットを各広域音声信号復元のためのモジュール別に逆量子化する段階と、
前記逆量子化段階により逆量子化された第1DCT係数の大きさを抽出する段階と、
前記逆量子化段階により逆量子化された第1DCT係数の符号を抽出する段階と、
前記第1DCT係数の大きさ順序情報によって第1DCT係数に前記第1DCT係数の符号を挿入する段階と、
前記第1DCT係数の大きさ順序情報および以前フレームの第1DCT係数を利用して受信されていない第1DCT係数符号を予測する段階と、
前記予測された第1DCT係数の符号を該当する逆量子化された第1DCT係数に挿入する段階と、
逆量子化された第1DCT係数に対する逆DCT演算によって帯域別の時間領域信号を求めて前記高域音声信号を出力する段階と、を含む請求項47に記載の広域音声信号復元方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030048665A KR100940531B1 (ko) | 2003-07-16 | 2003-07-16 | 광대역 음성 신호 압축 및 복원 장치와 그 방법 |
KR2003-048665 | 2003-07-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005037949A JP2005037949A (ja) | 2005-02-10 |
JP4726445B2 true JP4726445B2 (ja) | 2011-07-20 |
Family
ID=36643387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004208615A Expired - Fee Related JP4726445B2 (ja) | 2003-07-16 | 2004-07-15 | 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8433565B2 (ja) |
EP (1) | EP1498874B1 (ja) |
JP (1) | JP4726445B2 (ja) |
KR (1) | KR100940531B1 (ja) |
DE (1) | DE602004001101T2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006243041A (ja) * | 2005-02-28 | 2006-09-14 | Yutaka Yamamoto | 高域補間装置及び再生装置 |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
KR101261524B1 (ko) * | 2007-03-14 | 2013-05-06 | 삼성전자주식회사 | 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치 |
CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
US8000968B1 (en) | 2011-04-26 | 2011-08-16 | Huawei Technologies Co., Ltd. | Method and apparatus for switching speech or audio signals |
CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
US8560330B2 (en) * | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
CN102741831B (zh) * | 2010-11-12 | 2015-10-07 | 宝利通公司 | 多点环境中的可伸缩音频 |
US9905236B2 (en) | 2012-03-23 | 2018-02-27 | Dolby Laboratories Licensing Corporation | Enabling sampling rate diversity in a voice communication system |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
US10264116B2 (en) * | 2016-11-02 | 2019-04-16 | Nokia Technologies Oy | Virtual duplex operation |
CN112770269B (zh) * | 2019-11-05 | 2022-05-17 | 海能达通信股份有限公司 | 宽窄带互通环境下语音通讯方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08163056A (ja) * | 1994-12-09 | 1996-06-21 | Hitachi Denshi Ltd | 音声信号帯域圧縮伝送方式 |
JPH1130997A (ja) * | 1997-07-11 | 1999-02-02 | Nec Corp | 音声符号化復号装置 |
JP2001519552A (ja) * | 1997-10-02 | 2001-10-23 | シーメンス アクチエンゲゼルシヤフト | ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置 |
WO2002033696A1 (en) * | 2000-10-18 | 2002-04-25 | Nokia Corporation | Method and system for estimating artificial high band signal in speech codec |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8421498D0 (en) * | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
JPH07334194A (ja) * | 1994-06-14 | 1995-12-22 | Matsushita Electric Ind Co Ltd | 音声符号化/復号化方法およびそれらの装置 |
JPH08160996A (ja) * | 1994-12-05 | 1996-06-21 | Hitachi Ltd | 音声符号化装置 |
US6353808B1 (en) * | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
JP2001217999A (ja) * | 2000-02-03 | 2001-08-10 | Nikon Corp | 画像入力装置 |
-
2003
- 2003-07-16 KR KR1020030048665A patent/KR100940531B1/ko active IP Right Grant
-
2004
- 2004-07-15 JP JP2004208615A patent/JP4726445B2/ja not_active Expired - Fee Related
- 2004-07-15 US US10/891,423 patent/US8433565B2/en active Active
- 2004-07-16 DE DE602004001101T patent/DE602004001101T2/de not_active Expired - Lifetime
- 2004-07-16 EP EP04254266A patent/EP1498874B1/en not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08163056A (ja) * | 1994-12-09 | 1996-06-21 | Hitachi Denshi Ltd | 音声信号帯域圧縮伝送方式 |
JPH1130997A (ja) * | 1997-07-11 | 1999-02-02 | Nec Corp | 音声符号化復号装置 |
JP2001519552A (ja) * | 1997-10-02 | 2001-10-23 | シーメンス アクチエンゲゼルシヤフト | ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置 |
WO2002033696A1 (en) * | 2000-10-18 | 2002-04-25 | Nokia Corporation | Method and system for estimating artificial high band signal in speech codec |
Also Published As
Publication number | Publication date |
---|---|
KR100940531B1 (ko) | 2010-02-10 |
US8433565B2 (en) | 2013-04-30 |
JP2005037949A (ja) | 2005-02-10 |
DE602004001101D1 (de) | 2006-07-20 |
DE602004001101T2 (de) | 2007-06-14 |
EP1498874A1 (en) | 2005-01-19 |
US20050027516A1 (en) | 2005-02-03 |
EP1498874B1 (en) | 2006-06-07 |
KR20050009384A (ko) | 2005-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5314720B2 (ja) | 階層的な帯域幅構造を有する音声圧縮および復元装置、ならびにその方法 | |
US7596492B2 (en) | Apparatus and method for concealing highband error in split-band wideband voice codec and decoding | |
KR100813259B1 (ko) | 입력신호의 계층적 부호화/복호화 장치 및 방법 | |
KR100848324B1 (ko) | 음성 부호화 장치 및 그 방법 | |
JP4726445B2 (ja) | 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法 | |
KR100921867B1 (ko) | 광대역 오디오 신호 부호화 복호화 장치 및 그 방법 | |
JP5280607B2 (ja) | 音声信号圧縮装置及び方法、音声信号復元装置及び方法、ならびにコンピュータ読取可能な記録媒体 | |
KR100352351B1 (ko) | 정보부호화방법및장치와정보복호화방법및장치 | |
US7155384B2 (en) | Speech coding and decoding apparatus and method with number of bits determination | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
US5231669A (en) | Low bit rate voice coding method and device | |
KR20090029088A (ko) | 계층적 부호화 및 복호화 방법 및 장치 | |
JP4274614B2 (ja) | オーディオ信号復号方法 | |
JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
JP3468184B2 (ja) | 音声通信装置及びその通信方法 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
Mohdar et al. | Audio compression testing tool for multimedia applications | |
JP2003195898A (ja) | 音声データ処理装置、方法及びプログラム | |
JPH11145846A (ja) | 信号圧縮伸張装置及び方法 | |
JP2000091920A (ja) | 画像音声圧縮装置 | |
KR20160098597A (ko) | 통신 시스템에서 신호 코덱 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20061101 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061107 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070412 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4726445 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140422 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |