JP5222452B2 - 音響信号の符号化の知覚的改善 - Google Patents
音響信号の符号化の知覚的改善 Download PDFInfo
- Publication number
- JP5222452B2 JP5222452B2 JP2002536999A JP2002536999A JP5222452B2 JP 5222452 B2 JP5222452 B2 JP 5222452B2 JP 2002536999 A JP2002536999 A JP 2002536999A JP 2002536999 A JP2002536999 A JP 2002536999A JP 5222452 B2 JP5222452 B2 JP 5222452B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- hat
- frequency
- primary
- iii
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000006872 improvement Effects 0.000 title description 2
- 238000001228 spectrum Methods 0.000 claims abstract description 120
- 238000009499 grossing Methods 0.000 claims abstract description 38
- 230000003595 spectral effect Effects 0.000 claims abstract description 38
- 230000005540 biological transmission Effects 0.000 claims abstract description 28
- 230000004044 response Effects 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims description 46
- 230000006870 function Effects 0.000 claims description 17
- 230000007704 transition Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 5
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 230000005284 excitation Effects 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 2
- 230000004048 modification Effects 0.000 claims 2
- 238000012986 modification Methods 0.000 claims 2
- 241000287462 Phalacrocorax carbo Species 0.000 claims 1
- 230000008569 process Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 14
- 230000007246 mechanism Effects 0.000 description 5
- 238000007429 general method Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Description
本発明は、一般に音響信号の符号化情報に基づいて再構成された信号が知覚できる音質を有する、すなわち、既知の符号化ソリューションよりも上質の音質を有するような、音響源信号の符号化に関するものである。本発明は、より詳しくは、請求項1及び31のプリアンブルにそれぞれ従って送信媒体で送信用の符号化情報を発生するための音響信号を符号化することと、符号化の各々について、請求項15及び37のプリアンブルにそれぞれ従って送信媒体で送信済みの符号化情報を復号することに関するものである。また、本発明は、請求項44による通信システム、請求項13及び29のそれぞれのコンピュータ・プログラム、請求項13及び30のそれぞれのコンピュータ読み出し可能媒体に関するものである。
音声コーデック(codec=coderとdecoder)については、各種の多様な用途がある。符号化及び復号化機構は、固定式及び移動式の通信システムとテレビ会議システムとでの音響信号のビットレート効率のよい送信に用いられる。また、安全なテレフォニと、音声記憶装置のために、音声コーデックを利用することができる。
このため、本発明の目的は、上記の問題を軽減するような、音響信号の拡張版符号化機構を提供することである。
本発明の1つの態様によれば、最初の説明のように、音響源信号を符号化して送信媒体上で送信するための符号化情報を生成する方法により、この目的は達成される。そうした符号化情報は、周波数成分を表す各係数をそれぞれが有する一次符号信号とターゲット信号によって特徴付けられる。一次符号信号のそれぞれのターゲット信号に対応する少なくとも1つの平滑化信号が生成され、それは選択的に修正されたバージョンの一次符号信号のそれぞれのターゲット信号であるが、そこにおいて、閾値を上回る周波数情報を表す係数値のバラツキが縮小される。
図1Aは、周波数図表で、一次復号スペクトルY(ハット)の係数KYをx軸に沿って示している。各係数KYは、任意の符号化機構により符号化され、送信媒体で送信され、適正な復号化機構により復号された音響源信号の周波数成分の大きさを表している。したがって、一次復号スペクトルY(ハット)は、音響信号xの重要な特性を知覚的に表す。
本発明は、各図において説明した実施形態に限定されるものではなく、請求の範囲内で自由に変更してよい。
Claims (44)
- 音響源信号(x)を符号化して、送信媒体(306)を介して送信用の符号化情報(P1、PC)を生成する方法において、該方法が、
音響源信号(x)に応答して、当該音響源信号(x)の知覚的に重要な特性を表す基本符号信号(P1)と、フィルタリング処理された前記音響源信号(x)を表すターゲット信号(r)と、前記基本符号信号(P1)に基づいて再構成された信号を表す一次符号信号(y)を生成するステップと、
一次符号信号(y)とターゲット信号(r)との少なくとも1つに応答して、一次符号信号(y)の各々のターゲット信号(r)の知覚的に改善された表現を構成する対応の平滑化信号(yE;rE)を生成するステップと、
前記平滑化一次符号信号(yE)及び前記ターゲット信号(r)と、前記一次符号信号(y)及び前記平滑化ターゲット信号(rE)と、前記平滑化一次符号信号(yE)及び前記平滑化ターゲット信号(rE)と、のいずれかの組み合わせに基づいて、二次符号信号(PC)を生成するステップと、
を含み、
更に、周波数成分を表す各係数(KY)を含む前記一次符号信号(y)と、
周波数成分を表す各係数を含む前記ターゲット信号(r)と、
前記一次符号信号(y)の各々の前記ターゲット信号(r)の選択的に修正されたバージョンであり、閾値(fT)を上回る周波数情報を表す係数値(KYE)のバラツキが縮小される、前記対応する平滑化信号(yE;rE)と、
を含むことを特徴とする方法。
- 閾値(fT)を上回る周波数成分を表す前記一次符号信号(y)の前記係数(KY)を1つ以上の周波数帯域(i、ii、iii)に分割するステップと、
前記各々の周波数帯域(i、ii、iii)内の前記係数(KY)の平均係数値(Ki、Kii、Kiii)を計算するステップと、
各周波数帯域(i、ii、iii)内の前記係数(KY)を前記各々の平均係数値(Ki、Kii、Kiii)で置き換えるステップと、
により、一次符号信号(y)から得られる平滑化一次符号信号(yE)によって特徴付けられる請求項1に記載の方法。
- 周波数帯域(i、ii、iii)のそれぞれの帯域幅が等しいことを特徴とする請求項2に記載の方法。
- 周波数帯域(i、ii、iii)のそれぞれの領域が部分的に重複していることを特徴とする請求項2又は3に記載の方法。
- 各周波数帯域(i、ii、iii)とウィンドウ関数(W1;W2)とを乗算し、対応のウィンドウをかけた周波数帯域を取得するステップと、
重複する各領域で隣り合う前記ウィンドウをかけた周波数帯域の係数値を加算するステップと、
によって得られる前記周波数帯域(i、ii、iii)の重複領域の結果の係数値により特徴付けられる請求項4に記載の方法。
- 重複しない周波数領域では一定の大きさで、隣り合う周波数帯域が重なり合う高周波側遷移領域と低周波側遷移領域とでは大きさが次第に減少する前記ウィンドウ関数(W1;W2)を特徴とする請求項5に記載の方法。
- ケプストラム領域の成分を各々が表す一連のケプストラム係数を有するケプストラム符号信号を生成するステップと、
前記ケプストラム符号信号中の特定の次数(n次、nは2以上の任意の整数)以上のケプストラム係数を破棄するステップと、
を伴う前記一次符号信号(y)の選択的な修正を特徴とする、請求項1に記載の方法。
- 前記閾値(fT)を上回る周波数情報を表す前記平滑化一次符号信号(yE)の係数値(KYE)のバラツキが縮小するような前記特定の次数(n次)を選ぶことを特徴とする、請求項7に記載の方法。
- 前記第1の符号信号(P1)が前記音響信号(x)をいかに適正に記述するかを示す前記第2の符号信号(PC)によって特徴付けられる、請求項1から8のいずれかひとつに記載の方法。
- 前記ターゲット信号(r)と前記一次符号信号(y)との間のスペクトル比を表す前記二次符号信号(PC)によって特徴付けられる請求項9に記載の方法。
- 前記ターゲット信号(r)と前記一次符号信号(y)との間の対数スケールのスペクトル差を表す前記二次符号信号(PC)によって特徴付けられる請求項9に記載の方法。
- 前記音響信号(x)に応答して周波数変換されたターゲット信号(R)を生成するステップと、
前記音響信号(x)に応答して前記周波数変換された一次符号信号(Y)を生成するステップと、
前記周波数変換されたターゲット信号(R)と前記周波数変換された一次符号信号(Y)との間のスペクトル比(C)を生成するステップと、
前記スペクトル比(C)に基づいて前記二次符号信号(PC)を形成するステップと、
から得られる前記二次符号信号(PC)によって特徴付けられる請求項10又は11のいずれかに記載の方法。
- コンピュータの内部記憶装置に直接ロード可能で、コンピュータ上で稼動中に請求項1から12のいずれかひとつのステップを制御するソフトウェアを含むコンピュータ・プログラム。
- 請求項1から12のいずれかひとつのステップをコンピュータに制御させるためのプログラムを記録した、コンピュータ読み取り可能媒体。
- 少なくとも1つの符号信号(P(E))の推定値を表す少なくとも1つの送信された符号信号(P(ハット)(E))を受信するステップと、
前記少なくとも1つの送信された符号信号(P(ハット)(E))から少なくとも1つの一次復号スペクトル(Y(ハット))を復号するステップと、
前記少なくとも1つの一次復号スペクトル(Y(ハット))から前記平滑化一次復号スペクトル(Y(ハット)(E))を生成するステップと、
周波数成分を表す各係数(KY)を含む平滑化復号一次スペクトル(Y(ハット)(E))であって、閾値(fT)を上回る周波数情報を表す係数値(KYE)のバラツキが縮小される、前記少なくとも1つの一次復号スペクトル(Y(ハット))の選択的に修正されたバージョンの1つである前記平滑化一次復号スペクトル(Y(ハット)(E))によって特徴付けられる、少なくとも前記平滑化一次復号スペクトル(Y(ハット)(E))に基づいて、音響源信号(x)の推定値(z(ハット))を生成するステップと、
を含む、送信媒体(306)で送信された符号化情報から前記音響源信号(x)の表現の前記推定値(z(ハット))を復号する方法。
- 前記音響源信号(x)自体を構成する前記音響源信号(x)の表現によって特徴付けられる請求項15に記載の方法。
- 前記音響源信号(x)を得ることが可能な励起信号を構成する前記音響源信号(x)の表現によって特徴付けられる請求項15に記載の方法。
- 閾値(fT)を上回る周波数成分を表す少なくとも1つの一次復号スペクトル(Y(ハット))の1つの係数(KY)を、1つ以上の周波数帯域(i、ii、iii)に分割するステップと、
前記各周波数帯域(i、ii、iii)内の前記係数(KY)の平均係数値(Ki、Kii、Kiii)を計算するステップと、
前記各周波数帯域内(i、ii、iii)内の前記係数(KY)を、前記各々の平均係数値(Ki、Kii、Kiii)で置き換えるステップと、
により、少なくとも1つの一次復号スペクトルY(ハット)から得られる平滑化一次復号信号(Y(ハット)E)によって特徴付けられる、請求項15から17のいずれかひとつに記載の方法。
- 前記周波数帯域(i、ii、iii)が等距離であることを特徴とする請求項18に記載の方法。
- 少なくとも一部が重複している前記周波数帯域(i、ii、iii)によって特徴付けられる請求項18又は19のいずれかに記載の方法。
- 前記各周波数帯域(i、ii、iii)とウィンドウ関数(W1;W2)とを乗算し、対応するウィンドウをかけた周波数帯域を取得するステップと、
重複する各領域で隣り合うウィンドウをかけた周波数帯域の係数値を加算するステップと、
によって得られる前記周波数帯域(i、ii、iii)の重複領域の結果の係数値によって特徴付けられる請求項20に記載の方法。
- 重複しない周波数領域では一定の大きさで、隣り合う周波数帯域が重なり合う高周波側遷移領域と下位低周波側遷移領域とでは大きさが次第に減少するウィンドウ関数(W1;W2)を特徴とする請求項21に記載の方法。
- ケプストラム領域の成分を表す一連の各ケプストラム係数を有するケプストラム符号信号を生成するステップと、
ケプストラム符号信号中の特定の次数(n次)以上のケプストラム係数を破棄するステップと、
を伴う少なくとも1つの一次復号スペクトル(Y(ハット))の選択的な修正を特徴とする、請求項15から17のいずれかひとつに記載の方法。
- 前記閾値(fT)を上回る周波数情報を表す前記平滑化一次復号スペクトル(Y(ハット)E)の係数値(KYE)のバラツキが縮小するような前記特定の次数(n次)を選ぶことを特徴とする、請求項23に記載の方法。
- 前記音響信号(x)の符号表現を構成する第1の符号信号(P1)の第1の推定値(P(ハット)1)と、
前記第1の符号信号(P1)が前記音響信号(x)をいかに適正に記述しているかを示す第2の符号信号(PC)の第2の推定値と、
を含む少なくとも1つの送信された拡張符号信号(P(ハット)(E))によって特徴付けられる、請求項15から24のいずれかひとつに記載の方法。
- ターゲット信号(r)のスペクトルと一次符号信号(y)のスペクトルとの間の比を表す前記二次符号信号(PC)を特徴とする、請求項25に記載の方法。
- ターゲット信号(r)の対数スケールのスペクトルと一次符号信号(y)の対数スケールのスペクトルとの差を表す前記二次符号信号(PC)を特徴とする、請求項25に記載の方法。
- 前記第1の推定値(P(ハット)1)に応答して、前記少なくとも1つの一次復号スペクトル(Y(ハット))を生成するステップと、
前記少なくとも1つの一次復号スペクトル(Y(ハット))に応答して、前記平滑化一次復号スペクトル(Y(ハット)E)を生成するステップと、
前記第2の推定値(P(ハット)C)に応答して、等化スペクトル(C(ハット))を生成するステップと、
前記等化スペクトル(C(ハット))と前記平滑化一次復号スペクトル(Y(ハット)E)とに応答して、音響源信号(x)の推定値(z(ハット))を生成するステップと、
により得られる前記音響源信号(x)の前記推定値(z(ハット))によって特徴付けられる、請求項25から27のいずれかひとつに記載の方法。
- コンピュータの内部記憶装置に直接ロード可能で、コンピュータ上で稼動中に請求項15から28のいずれかひとつのステップを制御するソフトウェアを含むコンピュータ・プログラム。
- 請求項15から28のいずれかひとつのステップをコンピュータに制御させるプログラムを記録した、コンピュータ読み取り可能媒体。
- 音響源信号(x)を受信する入力を有し、音響源信号(x)の推定値(z(ハット))を再構成できる前記音響信号(x)の知覚的に重要な特性を表す基本符号信号(P1)を提供する第1の出力と、フィルタリングしたバージョンの音響源信号(x)を表すターゲット信号(r)を提供する第2の出力と、前記基本符号信号(P1)に基づいて再構成された信号を表す一次符号信号(y)を提供する第3の出力と、を有する一次符号器(702)と、
前記一次符号信号(y)に応答して、一次符号信号(y)の知覚的に改善された表現を構成する平滑化一次符号信号(yE)を生成するための、少なくとも1つのスペクトル平滑化装置(305a)と、
前記平滑化一次符号信号(yE)と前記ターゲット信号(r)とに基づいて二次符号信号(PC)を発生するための量子化器(704)と、
を備え、
前記少なくとも1つのスペクトル平滑化装置(305a)が、閾値(fT)を上回る周波数情報を表す係数値(KYE)のバラツキを縮小するように前記一次符号信号(y)を選択的に修正することによって、前記一次符号信号(y)から平滑化出力信号(yE)を生成するよう構成されている、
ことを特徴とする、送信媒体(306)で送信する符号化情報を生成するために音響源信号(x)を符号化する送信器。
- 周波数成分を表す入力信号(P)の各係数(KP)を記憶するための第1のバッファ記憶装置(401)と、
閾値(fT)を上回る周波数成分に対応する係数(kY n+1〜kY m)用に、少なくとも1つの周波数帯域(i、ii、iii)の各々のために第1のバッファ記憶装置(401)に記憶された係数(kP n+1〜kP m)の平均係数値(Ki、Kii、Kiii)を計算するための処理装置(402)と、
特定の周波数帯域(i、ii、iii)で少なくとも1つの基本符号信号(P)に対応する係数(KP)がある分だけ、各周波数帯域(i、ii、iii)のそれぞれの平均係数値(Ki、Kii、Kiii)を反復記憶するための第2のバッファ記憶装置(403)と、
閾値(fT)までの係数(kY 1〜kY n)を第1のバッファ記憶装置(401)から読み出し、閾値(fT)を上回る係数(kY n+1〜kY m)を第2のバッファ記憶装置(403)から読み出して、出力信号(yE)の係数(KYE)を形成するための読み出し装置(404)と、
を、少なくとも1つのスペクトル平滑化装置(305a、305b)が備えることを特徴とする、請求項31に記載の送信器。
- 前記周波数帯域(i、ii、iii)が等距離であることを特徴とする請求項32に記載の送信器。
- 少なくとも一部が重複している前記周波数帯域(i、ii、iii)によって特徴付けられる請求項32又は33に記載の送信器。
- 前記各周波数帯域(i、ii、iii)とウィンドウ関数(W1;W2)とを乗算し、対応のウィンドウをかけた周波数帯域を取得するステップと、
重複する各領域で隣り合うウィンドウをかけた周波数帯域の係数値を加算するステップと、
によって、前記周波数帯域(i、ii、iii)の重複領域の結果の係数値を得るための係数コンバイナを備えることを特徴とする、請求項34に記載の送信器。
- 重複しない周波数領域では一定の大きさで、隣り合う周波数帯域が重なり合う高周波側遷移領域と下位低周波側遷移領域とでは大きさが次第に減少する前記ウィンドウ関数(W1;W2)を特徴とする請求項35に記載の送信器。
- 送信媒体(306)から受信した符号化情報から音響源信号(x)の表現の推定値(z(ハット))を復号する受信器であって、受信した符号化信号(P(ハット)(E))から得られる一次復号スペクトル(Y(ハット))を受信する入力と、平滑化一次復号スペクトル(Y(ハット)E)を提供する出力と、を有するスペクトル平滑化装置(305b)を備える前記受信器において、前記平滑化一次復号スペクトル(Y(ハット)E)が周波数成分を表す各係数(KY)を含むことと、スペクトル平滑化装置(305b)が閾値(fT)を上回る周波数情報を表す係数値(KYE)のバラツキを縮小するように前記一次復号スペクトル(Y(ハット))を選択的に修正することで前記平滑化一次復号スペクトル(Y(ハット)E)を発生するよう工夫されていることを特徴とする前記受信器。
- 前記符号化情報(P(ハット)(E))で第1の送信された信号(P(ハット)1)を受信する入力と、一次復号スペクトル(Y(ハット))を提供する出力と、を有する再構成装置(708)と、
前記符号化情報(P(ハット)(E))で第2の送信された信号(P(ハット)C)を受信する入力と、推定の等化スペクトル(C(ハット))を提供する出力と、を有する等化復号器(707)と、
前記平滑化一次復号スペクトル(Y(ハット)E)を受信する第1の入力と、前記推定の等化スペクトル(C(ハット))を受信する第2の入力と、前記音響源信号(x)の前記推定値(z(ハット))を提供する出力と、を有するイコライザ(709)と、
を備えることを特徴とする請求項37に記載の受信器。
- 周波数成分を表す前記一次復号スペクトル(Y(ハット))の各係数(KY)を記憶するための第1のバッファ記憶装置(401)と、
前記閾値(fT)を上回る周波数成分に対応する係数(kY n+1〜kY m)用に、少なくとも1つの周波数帯域(i、ii、iii)の各々のために前記第1のバッファ記憶装置(401)に記憶された前記係数(kY n+1〜kY m)の平均係数値(Ki、Kii、Kiii)を計算するための処理装置(402)と、
前記特定の周波数帯域(i、ii、iii)で前記少なくとも1つの基本符号信号(P)に対応する係数(KY)がある分だけ、前記各周波数帯域(i、ii、iii)の前記それぞれの平均係数値(Ki、Kii、Kiii)を反復記憶するための第2のバッファ記憶装置(403)と、
前記閾値(fT)までの係数(kY 1〜kY n)を前記第1のバッファ記憶装置(401)から読み出し、前記閾値(fT)を上回る係数(kY n+1〜kY m)を前記第2のバッファ記憶装置(403)から読み出して、前記平滑化一次復号スペクトル(Y(ハット)E)の係数(KYE)を形成するための読み出し装置(404)と、
を備えた、前記スペクトル平滑化装置(305b)を特徴とする請求項38に記載の受信器。
- 前記周波数帯域(i、ii、iii)が等距離であることを特徴とする請求項39に記載の受信器。
- 少なくとも一部が重複している前記周波数帯域(i、ii、iii)によって特徴付けられる請求項39又は40に記載の受信器。
- 前記各周波数帯域(i、ii、iii)とウィンドウ関数(W1;W2)とを乗算し、対応のウィンドウをかけた周波数帯域を取得するステップと、
重複する各領域で隣り合うウィンドウをかけた周波数帯域の係数値を加算するステップと、
によって、前記周波数帯域(i、ii、iii)の重複領域の結果の係数値を得るための係数コンバイナを備えることを特徴とする、請求項41に記載の受信器。
- 重複しない周波数領域では一定の大きさで、隣り合う周波数帯域が重なり合う高周波側遷移領域と下位低周波側遷移領域とでは大きさが次第に減少するウィンドウ関数(W1;W2)を特徴とする請求項42に記載の受信器。
- 請求項31から36のいずれかひとつにより前記音響源信号(x)を符号化して符号化情報を生成するための送信器(300)と、
請求項37から43のいずれかひとつにより送信器300から生成された符号化情報を受信する入力を有し、符号化情報を前記音響源信号(x)の推定値(z(ハット))に復号する受信器(301)と、
送信器(300)から受信器(310)に前記少なくとも1つの拡張符号信号(P(E))を送信するための送信媒体(306)と、
を備えた、前記送信器(300)から前記受信器(301)に前記音響源信号(x)を送信するための通信システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00850172.8 | 2000-10-20 | ||
EP00850172A EP1199812A1 (en) | 2000-10-20 | 2000-10-20 | Perceptually improved encoding of acoustic signals |
PCT/SE2001/001919 WO2002033692A1 (en) | 2000-10-20 | 2001-09-07 | Perceptually improved encoding of acoustic signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004515801A JP2004515801A (ja) | 2004-05-27 |
JP5222452B2 true JP5222452B2 (ja) | 2013-06-26 |
Family
ID=8175680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002536999A Expired - Lifetime JP5222452B2 (ja) | 2000-10-20 | 2001-09-07 | 音響信号の符号化の知覚的改善 |
Country Status (12)
Country | Link |
---|---|
US (1) | US6611798B2 (ja) |
EP (2) | EP1199812A1 (ja) |
JP (1) | JP5222452B2 (ja) |
KR (1) | KR100832144B1 (ja) |
CN (1) | CN1312658C (ja) |
AT (1) | ATE380378T1 (ja) |
AU (2) | AU2001284606B2 (ja) |
CA (1) | CA2424373C (ja) |
DE (1) | DE60131766T2 (ja) |
ES (1) | ES2296791T3 (ja) |
PT (1) | PT1328923E (ja) |
WO (1) | WO2002033692A1 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60029147T2 (de) * | 2000-12-29 | 2007-05-31 | Nokia Corp. | Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk |
IL144158A (en) | 2001-07-05 | 2011-06-30 | Mosaid Technologies Inc | Socket for connecting an analog telephone to a digital communications network that carries digital voice signals |
US7308406B2 (en) * | 2001-08-17 | 2007-12-11 | Broadcom Corporation | Method and system for a waveform attenuation technique for predictive speech coding based on extrapolation of speech waveform |
AU2003234763A1 (en) * | 2002-04-26 | 2003-11-10 | Matsushita Electric Industrial Co., Ltd. | Coding device, decoding device, coding method, and decoding method |
DE10254612A1 (de) * | 2002-11-22 | 2004-06-17 | Humboldt-Universität Zu Berlin | Verfahren zur Ermittlung spezifisch relevanter akustischer Merkmale von Schallsignalen für die Analyse unbekannter Schallsignale einer Schallerzeugung |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US7075434B2 (en) * | 2003-09-22 | 2006-07-11 | Michael Shafir | Encoding and decoding method and system |
US7536302B2 (en) * | 2004-07-13 | 2009-05-19 | Industrial Technology Research Institute | Method, process and device for coding audio signals |
KR100619893B1 (ko) * | 2004-07-23 | 2006-09-19 | 엘지전자 주식회사 | 휴대단말기의 개선된 저전송률 선형예측코딩 장치 및 방법 |
KR20060067016A (ko) | 2004-12-14 | 2006-06-19 | 엘지전자 주식회사 | 음성 부호화 장치 및 방법 |
US7930176B2 (en) | 2005-05-20 | 2011-04-19 | Broadcom Corporation | Packet loss concealment for block-independent speech codecs |
US8599925B2 (en) * | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
US7490036B2 (en) * | 2005-10-20 | 2009-02-10 | Motorola, Inc. | Adaptive equalizer for a coded speech signal |
EP1870880B1 (en) | 2006-06-19 | 2010-04-07 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
US7774205B2 (en) * | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
WO2010016271A1 (ja) * | 2008-08-08 | 2010-02-11 | パナソニック株式会社 | スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法 |
WO2013022426A1 (en) * | 2011-08-08 | 2013-02-14 | Hewlett-Packard Development Company, L.P. | Method and system for compression of a real-time surveillance signal |
CN105321521B (zh) * | 2014-06-30 | 2019-06-04 | 美的集团股份有限公司 | 基于终端运行环境的音频信号编码方法和系统 |
WO2018084305A1 (ja) * | 2016-11-07 | 2018-05-11 | ヤマハ株式会社 | 音声合成方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US920832A (en) | 1906-11-26 | 1909-05-04 | Vickers Sons & Maxim Ltd | Automatic gun. |
US5307441A (en) | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
US5206884A (en) * | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
IT1241358B (it) * | 1990-12-20 | 1994-01-10 | Sip | Sistema di codifica del segnale vocale con sottocodice annidato |
ES2087522T3 (es) | 1991-01-08 | 1996-07-16 | Dolby Lab Licensing Corp | Descodificacion/codificacion para campos sonoros multidimensionales. |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
US5526464A (en) | 1993-04-29 | 1996-06-11 | Northern Telecom Limited | Reducing search complexity for code-excited linear prediction (CELP) coding |
US5574825A (en) | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
JPH07261797A (ja) * | 1994-03-18 | 1995-10-13 | Mitsubishi Electric Corp | 信号符号化装置及び信号復号化装置 |
JP3237089B2 (ja) | 1994-07-28 | 2001-12-10 | 株式会社日立製作所 | 音響信号符号化復号方法 |
JP3970327B2 (ja) * | 1996-02-15 | 2007-09-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ | 複雑さが軽減された信号送信システム |
TW416044B (en) * | 1996-06-19 | 2000-12-21 | Texas Instruments Inc | Adaptive filter and filtering method for low bit rate coding |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
KR20000068538A (ko) * | 1997-07-11 | 2000-11-25 | 이데이 노부유끼 | 정보 복호 방법 및 장치, 정보 부호화 방법 및 장치, 및 제공매체 |
TW408298B (en) * | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
JPH11296196A (ja) * | 1998-04-13 | 1999-10-29 | Hitachi Ltd | 音声符号化方法および音声符号化処理装置 |
JP2000047695A (ja) * | 1998-07-29 | 2000-02-18 | Oki Electric Ind Co Ltd | 符号化装置及び復号化装置 |
US6182030B1 (en) * | 1998-12-18 | 2001-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Enhanced coding to improve coded communication signals |
-
2000
- 2000-10-20 EP EP00850172A patent/EP1199812A1/en not_active Withdrawn
-
2001
- 2001-09-07 CA CA2424373A patent/CA2424373C/en not_active Expired - Lifetime
- 2001-09-07 KR KR1020037005479A patent/KR100832144B1/ko active IP Right Grant
- 2001-09-07 AU AU2001284606A patent/AU2001284606B2/en not_active Expired
- 2001-09-07 PT PT01963677T patent/PT1328923E/pt unknown
- 2001-09-07 AU AU8460601A patent/AU8460601A/xx active Pending
- 2001-09-07 AT AT01963677T patent/ATE380378T1/de not_active IP Right Cessation
- 2001-09-07 WO PCT/SE2001/001919 patent/WO2002033692A1/en active IP Right Grant
- 2001-09-07 CN CNB018173799A patent/CN1312658C/zh not_active Expired - Lifetime
- 2001-09-07 ES ES01963677T patent/ES2296791T3/es not_active Expired - Lifetime
- 2001-09-07 JP JP2002536999A patent/JP5222452B2/ja not_active Expired - Lifetime
- 2001-09-07 EP EP01963677A patent/EP1328923B1/en not_active Expired - Lifetime
- 2001-09-07 DE DE60131766T patent/DE60131766T2/de not_active Expired - Lifetime
- 2001-10-19 US US09/982,027 patent/US6611798B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP1199812A1 (en) | 2002-04-24 |
CN1312658C (zh) | 2007-04-25 |
KR20030048061A (ko) | 2003-06-18 |
DE60131766T2 (de) | 2008-11-13 |
CA2424373C (en) | 2011-08-30 |
ATE380378T1 (de) | 2007-12-15 |
AU8460601A (en) | 2002-04-29 |
EP1328923B1 (en) | 2007-12-05 |
JP2004515801A (ja) | 2004-05-27 |
ES2296791T3 (es) | 2008-05-01 |
DE60131766D1 (de) | 2008-01-17 |
KR100832144B1 (ko) | 2008-05-27 |
PT1328923E (pt) | 2008-02-28 |
CA2424373A1 (en) | 2002-04-25 |
WO2002033692A1 (en) | 2002-04-25 |
US20020049584A1 (en) | 2002-04-25 |
CN1470048A (zh) | 2004-01-21 |
US6611798B2 (en) | 2003-08-26 |
EP1328923A1 (en) | 2003-07-23 |
AU2001284606B2 (en) | 2007-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5222452B2 (ja) | 音響信号の符号化の知覚的改善 | |
JP5193413B2 (ja) | 符号化音響信号の復号に関するエラー隠匿 | |
JP5047268B2 (ja) | Mdct係数を使用する音声後処理 | |
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
JP3653826B2 (ja) | 音声復号化方法及び装置 | |
RU2419891C2 (ru) | Способ и устройство эффективной маскировки стирания кадров в речевых кодеках | |
JP4550289B2 (ja) | Celp符号変換 | |
JP3881943B2 (ja) | 音響符号化装置及び音響符号化方法 | |
US8391212B2 (en) | System and method for frequency domain audio post-processing based on perceptual masking | |
US6654716B2 (en) | Perceptually improved enhancement of encoded acoustic signals | |
US8200496B2 (en) | Audio signal decoder and method for producing a scaled reconstructed audio signal | |
JP5413839B2 (ja) | 符号化装置および復号装置 | |
JP5285162B2 (ja) | ピーク検出に基づいた選択型スケーリングマスク演算 | |
AU2001284608A1 (en) | Error concealment in relation to decoding of encoded acoustic signals | |
AU2001284606A1 (en) | Perceptually improved encoding of acoustic signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110617 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110920 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110928 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111017 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111024 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111117 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120703 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120906 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120913 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121105 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121112 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121203 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130311 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160315 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5222452 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |