JP5161212B2 - Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法 - Google Patents
Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法 Download PDFInfo
- Publication number
- JP5161212B2 JP5161212B2 JP2009518697A JP2009518697A JP5161212B2 JP 5161212 B2 JP5161212 B2 JP 5161212B2 JP 2009518697 A JP2009518697 A JP 2009518697A JP 2009518697 A JP2009518697 A JP 2009518697A JP 5161212 B2 JP5161212 B2 JP 5161212B2
- Authority
- JP
- Japan
- Prior art keywords
- noise shaping
- noise
- signal
- layer
- codec
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000007493 shaping process Methods 0.000 title claims description 203
- 238000000034 method Methods 0.000 title claims description 127
- 230000005236 sound signal Effects 0.000 claims description 65
- 238000012546 transfer Methods 0.000 claims description 59
- 238000013139 quantization Methods 0.000 claims description 44
- 238000001914 filtration Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 17
- 230000003044 adaptive effect Effects 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 14
- 230000002708 enhancing effect Effects 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims 1
- 239000010410 layer Substances 0.000 description 162
- 230000006870 function Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 22
- 238000001228 spectrum Methods 0.000 description 10
- 239000002131 composite material Substances 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 8
- 239000012792 core layer Substances 0.000 description 8
- 230000005284 excitation Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000000465 moulding Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Storage Device Security (AREA)
Description
Pulse code modulation (PCM) of voice frequencies, ITU-T Recommendation G.711, November 1988, (http://www.itu.int). AMR Wideband Speech Codec: Transcoding Functions, 3GPP Technical Specification TS 26.190 (http://www.3gpp.org). Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB), ITU-T Recommendation G.722.2, Geneva, January 2002 (http://www.itu.int). B.S. Atal and M.R. Schroeder, "Predictive coding of speech and subjective error criteria", IEEE Trans. of Audio, Speech and Signal Processing, vol. 27, no. 3, pp. 247-254, June 1979.
エンコーダにおいて:レイヤ1における雑音を成形するステップを含むレイヤ1における符号化音声信号を生成するステップと;レイヤ2におけるエンハンスメント信号を生成するステップと;
デコーダにおいて:エンコーダのレイヤ1からの符号化音声信号を復号し、合成音声信号を生成するステップと;レイヤ2からのエンハンスメント信号を復号するステップと;合成音声信号に関するフィルタ伝達関数を計算するステップと;計算されたフィルタ伝達関数を介してレイヤ2の復号エンハンスメント信号をフィルタリングし、レイヤ2のフィルタリングされたエンハンスメント信号を生成するステップと;レイヤ2のフィルタリングされたエンハンスメント信号を合成音声信号に加え、レイヤ1およびレイヤ2双方からの寄与を含む出力信号を生成するステップとを含む。
エンコーダにおいて:レイヤ1における雑音を成形する手段を含む音声信号を符号化する手段と;レイヤ2からのエンハンスメント信号を生成する手段と;
デコーダにおいて:レイヤ1からの符号化音声信号を復号し、レイヤ1からの合成音声信号を生成する手段と;レイヤ2からのエンハンスメント信号を復号する手段と;合成音声信号に関するフィルタ伝達関数を計算する手段と;エンハンスメント信号をフィルタリングし、レイヤ2のフィルタリングされたエンハンスメント信号を生成する手段と;レイヤ2のフィルタリングされたエンハンスメント信号を合成音声信号に加え、レイヤ1およびレイヤ2双方の寄与を含む出力信号を生成する手段とを含む。
符号化デバイスにおいて:レイヤ1における雑音成形フィルタを含むレイヤ1における音声信号の第1のエンコーダと;レイヤ2におけるエンハンスメント信号の第2のエンコーダと;
復号デバイスにおいて:合成音声信号を生成する符号化音声信号のデコーダと;レイヤ2におけるエンハンスメント信号のデコーダと;レイヤ1からの合成音声信号に関して判断する伝達関数を有し、復号エンハンスメント信号を処理し、レイヤ2のフィルタリングされたエンハンスメント信号を生成するフィルタと;合成音声信号とフィルタリングされたエンハンスメント信号を加え、レイヤ1およびレイヤ2双方の寄与を含む出力信号を生成する加算器とを含む。
AMR−WBは分析、合成符号化パラダイムを使用し、入力信号、例えば通話と知覚加重領域における合成音声信号(フィルタリング励振)との間の平均二乗誤差を最小にすることにより、励振信号の最適ピッチおよび更新パラメータを探索する(図5)。
Ew(z)=W’(z)E(z) (2)
ここで、E(z)は入力音声信号と合成音声信号s〜(n)との間の誤差信号e(n)のスペクトラムであり、Ew(z)は加重誤差信号ew(n)の「平坦な」スペクトラムである。式(2)から、加重フィルタの逆数、即ちE(z)=W’(z)−1Ew(z)により、入力音声信号と合成音声信号との間の誤差E(z)を成形することが分かりうる。この結果は非特許文献4に記載されている。伝達関数W’(z)−1は入力音声信号の幾つかのフォルマント構成を示す。従って、量子化誤差の成形により人の耳のマスキング特性を使用し、量子化誤差がフォルマント領域においてより多くのエネルギーを持つようにし、量子化誤差をこの領域に存在する強い信号エネルギーによりマスクすることとする。加重量は式(1)のファクタγ1およびγ2により制御する。
2.1 第1のレイヤ(コアレイヤ)における雑音の知覚加重
図6はITU−T勧告G.711(例えば、G.711WBEコーデックのレイヤ1)に基づく単一レイヤエンコーダの例を示し、この例では量子化誤差はフィルタ1/A(z/γ)により成形し、A(z)はフィルタ1−μz−1を使用してプレエンハンスメント入力音声信号を基本に計算する。図7は図6の単純化であり、プレエンハンスメントフィルタと加重フィルタを組み合わせるが、LPフィルタを依然図6におけるように例えばフィルタ1−μz−1によるプレエンハンスメント音声信号を基本に計算する。図6および図7双方から、通常平坦なスペクトラムを有するG.711量子化誤差をフィルタ1/A(z/γ)により成形し、A(z)はプレエンハンスメント入力音声信号を基本に計算することは明らかである。図6および図7双方における構成は所望の雑音成形を達成するが、その構成は従来のG.711デコーダとの相互動作が可能なエンコーダにならない。これは逆加重フィルタをデコーダ出力において適用しなければならないことによる。
X(z)=S(z)W(z)−Y(z)F(z) (6a)
Y(z)=X(z)+Q(Z) (6b)
ここで、X(z)はG.711量子化器802の入力音声信号、S(z)は原音声信号、Y(z)はG.711量子化器802の出力信号、Q(Z)は平坦なスペクトラムを持つG.711の量子化誤差であり、W(z)は加重フィルタ804の伝達関数である。上の式6aおよび式6bは次式を生じる:
Y(z)=S(z)W(z)−Y(z)F(z)+Q(Z) (7)
上式は次式になる:
Y(z)[1+F(z)]=S(z)W(z)+Q(Z) (8)
上式は次式と同等である:
X(z)=S(z)+F(z)[S(z)−Y(z)] (11a)
Y(z)=X(z)+Q(z) (11b)
従って、
Y(z)=S(z)+F(z)[S(z)−Y(z)]+Q(z) (12)
上式は次式になる:
Y(z)[1+F(z)]=S(z)[1+F(z)]+Q(z) (13)
それ故、
プレエンハンスメントファクタμは次の関係により与える:
以上の説明は、単一レイヤのG.711と互換性のあるエンコーダにおける符号化雑音の成形法を記述する。複数レイヤを使用する場合の適切な雑音成形を保証するために、図13および図14におけるエンコーダ(第1の、即ちコアレイヤ用)と図15におけるデコーダ(G.711WBEにおけるレイヤ2などの上位レイヤ用)との間で、雑音成形アルゴリズムを分散させる。
X(z)=S(z)+F(z)D(z) (17)
以前のように、フィルタF(z)1402をF(z)=W(z)−1と定義し、ここで例えばW(z)=A(z/γ)は加重LPフィルタであり、A(z)はプレエンハンスメント音声信号(通話またはオーディオ)に関して計算する。図14における演算2からの差分信号d[n]を加算器1403により生成し、z変換領域において以下のように表す:
D(z)=S(z)−Y^8(z) (18)
ここで、Y^8(z)(または時間領域のy^8[n])は第1のレイヤからの量子化出力である(G.711WBEコーデックにおける8ビットPCM)。従って、図14の雑音フィードバックはレイヤ1の出力のみを考慮する。なお図14を参照して、信号x[n]、即ち雑音フィードバックにより修正する入力を量子化器Qにおいて量子化する。この量子化器Qはレイヤ1の8ビット(これをy^8[n]に復号できる)に加えてレイヤ2の2エンハンスメントビット(これを復号し、e^[n]を形成できる)を生成する。演算3では、y10[n]をy^8[n]とe^[n]の和として定義し、次の関係を生じる:
Y10(z)=X(z)+Q(z) (19)
ここで、Q(z)(または時間領域のq[n])はブロックQからの量子化雑音である。これが10ビットPCM量子化器からの量子化雑音であるのは、レイヤ1およびレイヤ2ビット双方をQから得るからである。G.711WBEエンコーダなどのマルチレイヤエンコーダでは、これらの10ビットはレイヤ1からの8ビット(PCMと互換性のある)に加えてレイヤ2(エンハンスメントレイヤ)からの2ビットに実際に相当する。
Y^8(z)=Y10(z)−E^(z) (20)
実際には、演算4を明確には実行しない。図14の箱Qのレイヤ1部からのビットを使用して、y^8[n]を復号し、レイヤ2からの追加の2ビットをただ納め、チャネルに送信する。レイヤ1のビットのみを復号する場合、以下の入力/合成の関係をもたらす:
この節では、レイヤ1およびレイヤ2双方を復号する、即ち図14の信号y10[n]を復号する場合の雑音の成形方法を記述する。式(17)のD(z)を式(18)に与える式により置換すれば、以下の関係を生じる:
X(z)=S(z)+F(z){S(z)−Y^8(z)} (22)
式(19)に、X(z)とY10(z)との間の関係を提示する。式(22)のX(z)を置換することにより、以下の関係を得る:
Y10(z)−Q(z)=S(z)+F(z){S(z)−Y^8(z)}(23)
次に以上の関係のY^8(z)を置換するために式(20)を使用すると、次の関係を生じる:
Y10(z)−Q(z)=S(z)+F(z){S(z)−Y10(z)
+E^(z)} (24)
上式(24)の左側のY10(z)における全項を分離すると、次の関係を生じる:
{F(z)+1}Y10(z)={F(z)+1}S(z)
+Q(z)+F(z)E^(z) (25)
両側を{F(z)+1}で除算すると、以下の関係を得る:
Y10(z)=Y^8(z)+E^(z) (30)
Y10(z)にこの関係を使用し、以上のYD(z)の定義においてY10(z)を置換すると、以下の関係を生じる:
・モジュール1501においてレイヤ1の合成(y^8[n])を計算する;
・モジュール1502においてレイヤ2のエンハンスメント信号(e^[n])を計算(復号)する;
・循環(全ポール)フィルタ
・加算器1504において信号y^8[n]とe^2[n]を合計し、所望の信号yD[n](レイヤ1およびレイヤ2の寄与の和)を形成する。
側面情報の伝達を回避するためにレイヤ1合成信号y^8[n]を使用してデコーダにおいて、フィルタW(z)=F(z)+1を計算する(フィルタ計算器1505参照)。G.711WBEコーデックでは、レイヤ1は高レート(64kビット/sのPCM)で動作し、従ってレイヤ1を使用してデコーダでこのフィルタを計算するのは、エンコーダで原(入力)音声信号に関して計算する同じフィルタとそれほどの不整合を持ち込まない。とはいえ不整合を完全に回避するためにはエンコーダおよびデコーダ双方において利用可能なローカルな復号信号y^8[n]を使用して、フィルタW(z)をエンコーダにおいて計算する。レイヤ2における適切な雑音成形を達成するこの復号処理を図15に示す。エンコーダ側に類似してW(z)=A(z/γ)であり、式(15)および式(16)に従い適応するプレエンハンスメントファクタにより適応プレエンハンスメントを適用後、レイヤ1信号に基づき、LPフィルタA(z)を計算する。事実第2の非限定的で、説明上の実施形態では、同じプレエンハンスメントおよび過去の復号信号に関して実行する4次のLP分析を上記のようにエンコーダ側で行う。
幾つかの限定的な場合、例えばある音楽の分野では、信号エネルギーは4000Hz(低帯域におけるサンプリング周波数の半値)近くの単一の周波数ピークに集中することがある。この特別な場合、フィルタが強く共鳴するので、雑音成形フィードバックは不安定になる。その結果成形雑音は正確でなく、合成信号は音が切れる。これは人工的可聴音を生成し、その継続時間は雑音成形ループがその安定状態に戻るまでの数フレームでありうる。この問題を防止するために、高周波数にエネルギーが集中する信号をエンコーダにおいて検出するといつでも、雑音成形フィードバックを減衰させる。
入力信号が非常に低いエネルギーを持つ場合、雑音成形デバイスおよび方法は符号化雑音の適切なマスキングを妨げることがある。その理由は、G.711デコーダの分析がレベルに依存するからである。信号レベルが低すぎる場合、量子化雑音は入力信号と凡そ同じエネルギーを持ち、歪みは100%に近い。それ故フィルタリング化雑音がそれに加わる場合、入力信号のエネルギーは増加することさえ起こりうる。これは、次に復号信号などのエネルギーを増加させる。雑音フィードバックは数フレームの間に早くも飽和状態になり、これは望ましくない。この飽和状態を防止するために非常に低レベルの信号に対し、雑音成形フィルタを減衰させる。
r0<θ、 (40)
を満たせば、非常に低レベルの信号に対する減衰を実行し、ここでθは所与の閾値である。あるいは正規化ファクタηLを式(35)の相関r0について計算することができる。正規化ファクタは左へのシフトの最大数を表し、これを16ビット値のr0について実行し、結果が32767を下回るように維持することができる。ηLが条件:
ηL≧16、 (41)
を満たす場合、非常に低レベルの信号に対する減衰を実行する。
ηL≧16であれば、
式(42)を生じる知覚フィルタの減衰を行う。
そうでなく、
式(38)を生じる知覚フィルタの減衰を行う。
それ以外であれば、
減衰はせず、
終了。
本発明の第1のおよび第2の非限定的で、説明上の実施形態において開示する雑音成形は固定(適応しない)量子化レベルを持つPCMエンコーダにおける雑音の問題を提示するので、幾つかの非常に小さな信号の状態は入力より大きなエネルギーを持つ合成信号を実際に生成しうる。これは、量子化器への入力信号が2つの量子化レベルの中点の周りで振動する場合に生じる。
A法則の場合:
u(n)=0
u(n)=0
準無声期間の間の合成信号に関する雑音一掃の程度をさらに増すために雑音ゲート法をデコーダに加える。フレームエネルギーが非常に低い場合、雑音ゲートは出力信号を減衰させる。この減衰はレベルおよび時間双方において漸進的である。減衰レベルは信号に依存し、サンプル毎を基本に徐々に修正する。非限定的例では下記のように、雑音ゲートはG.711WBEデコーダにおいて動作する。
yf(n)=y(n)−0.768y(n−1)、n=0、..、N−1 (44)
ここで、y(n)、n=0、..、N−1は現行フレームの合成信号に対応し、N=40はフレーム長である。フィルタリングされた信号エネルギーは次式により計算する。
Et=E0+E−1 (46)
各フレームの復号終了時にE−1をE0により更新することに注意されたい。
g(n)=0.99g(n−1)+0.01gt、n=0、..、N−1 (50)
上式を、サンプル毎を基本に更新する。利得がゆっくりと目標利得gtに向かって収束することが分かりうる。
502 誤差最小化
503 固定コードブック
506 適応型コードブック
508 過去の励振
510 合成フィルタ
Claims (66)
- 音声信号コーデックによる入力音声信号の符号化過程における雑音成形方法であって、前記方法が:
前記入力音声信号をプレエンハンスメントし、プレエンハンスメント音声信号を生成するステップと;
前記プレエンハンスメント音声信号を使用して、雑音フィードバックフィルタ伝達関数を計算するステップと;
前記音声信号コーデックを介する前記入力音声信号の処理により生成する雑音を表す雑音フィードバックを生成するステップと;
を含み、
前記雑音フィードバックを生成するステップは、
前記音声信号コーデックの出力信号と前記入力音声信号との間の誤差を計算するステップと;
前記雑音を成形するため、前記計算されたフィルタ伝達関数を介して前記誤差をフィルタリングするステップと;
前記音声信号コーデックに入力として供給するため、前記入力音声信号に前記フィルタリングされた誤差を加えるステップと;
を含む雑音成形方法。 - 請求項1に記載の雑音成形方法において、前記音声信号コーデックがITU−TG.711コーデックを含む雑音成形方法。
- 請求項1に記載の雑音成形方法において、前記雑音フィードバックフィルタ伝達関数を計算するステップが、A(z)が線形予測フィルタを表し、γが加重ファクタである関係A(z/γ)−1を計算するステップを含む雑音成形方法。
- 請求項2に記載の雑音成形方法において、前記音声信号コーデックがマルチレイヤコーデックを含む雑音成形方法。
- 請求項4に記載の雑音成形方法において、前記マルチレイヤコーデックが前記ITU−T G.711コーデックを含む雑音成形方法。
- 請求項1に記載の雑音成形方法において、前記入力音声信号をプレエンハンスメントするステップが、μがプレエンハンスメントファクタであり、zがz変換領域を表す伝達関数1−μz−1を有するフィルタを介して前記入力音声信号を処理するステップを含む雑音成形方法。
- 請求項6に記載の雑音成形方法において、前記プレエンハンスメントファクタμが、0.38と1との間の範囲にある雑音成形方法。
- 請求項6に記載の雑音成形方法において、前記プレエンハンスメントファクタμが固定値を含む雑音成形方法。
- 請求項1に記載の雑音成形方法において、前記雑音フィードバックフィルタ伝達関数を計算するステップがフレームごとを基本に前記雑音フィードバックフィルタ伝達関数を更新するステップを含む雑音成形方法。
- 音声信号コーデックによる入力音声信号の符号化過程における雑音成形方法であって、前記方法が:
前記入力音声信号の供給を受ける前記音声信号コーデックの出力から復号信号を受信するステップと;
前記復号された出力信号をプレエンハンスメントし、プレエンハンスメント信号を生成するステップと;
前記プレエンハンスメント信号を使用して、雑音フィードバックフィルタ伝達関数を計算するステップと;
前記音声信号コーデックを介する前記入力音声信号の処理により生成する雑音を表す雑音フィードバックを生成するステップと;
を含み、
前記雑音フィードバックを生成するステップは、
前記音声信号コーデックの前記復号された出力信号と前記入力音声信号との間の誤差を計算するステップと;
前記雑音を成形するため、前記計算されたフィルタ伝達関数を介して前記誤差をフィルタリングするステップと;
前記音声信号コーデックに入力として供給するため、前記入力音声信号に前記フィルタリングされた誤差を加えるステップと;
を含む雑音成形方法。 - 請求項11に記載の雑音成形方法において、前記音声信号コーデックがITU−T G.711コーデックである雑音成形方法。
- 請求項11に記載の雑音成形方法において、前記音声信号コーデックが少なくともレイヤ1およびレイヤ2を含むITU−T G.711マルチレイヤコーデックを含む雑音成形方法。
- 請求項11に記載の雑音成形方法において、前記復号された出力信号を受信するステップが、G.711マルチレイヤコーデックのレイヤ1から出力信号を受信するステップを含む雑音成形方法。
- 請求項11に記載の雑音成形方法において、前記雑音フィードバックフィルタ伝達関数を計算するステップが、A(z)が線形予測フィルタであり、γが加重ファクタである関係A(z/γ)−1を計算するステップを含む雑音成形方法。
- 請求項11に記載の雑音成形方法において、前記復号された出力信号をプレエンハンスメントするステップが、μがプレエンハンスメントファクタであり、zがz変換領域を表す伝達関数1−μz−1を有するフィルタを介して前記復号された出力信号を処理するステップを含む雑音成形方法。
- 請求項13に記載の雑音成形方法において、不安定性に対して前記雑音フィードバックフィルタ伝達関数を保護するステップをさらに含む雑音成形方法。
- 請求項18に記載の雑音成形方法において、不安定性に対して前記雑音フィードバックフィルタ伝達関数を保護するステップが前記入力音声信号に関するサンプリング周波数の半値に近い周波数に集中するエネルギーを持つ信号を検出するステップを含む雑音成形方法。
- 請求項19に記載の雑音成形方法において、前記サンプリング周波数の半値に近い前記周波数に集中する前記エネルギーを持つ前記信号を検出するステップが前記信号エネルギーの周波数分布を反映するパラメータrを計算するステップを含む雑音成形方法。
- 請求項21に記載の雑音成形方法において、前記パラメータrが一定の閾値を下回れば、前記雑音フィードバックを削減するステップをさらに含む雑音成形方法。
- 請求項23に記載の雑音成形方法において、ファクタαにより前記雑音フィードバックフィルタ伝達関数を削減するステップが、A(z)が前記プレエンハンスメント信号を基本に計算する線形予測フィルタであり、γが加重ファクタである減衰伝達関数A(z/αγ)−1を計算するステップを含む雑音成形方法。
- 請求項21に記載の雑音成形方法において、所与の閾値より低いエネルギーを持つ低エネルギー信号を検出するステップをさらに含む雑音成形方法。
- 請求項25に記載の雑音成形方法において、所与の閾値より低いエネルギーを持つ低エネルギー信号を検出するステップが不安定性に対して前記雑音フィードバックフィルタ伝達関数を保護するステップを含む雑音成形方法。
- 請求項26に記載の雑音成形方法において、低エネルギー信号を検出するステップが前記第1の自動相関r0に関係して計算する正規化ファクタηLを計算するステップを含む雑音成形方法。
- 請求項27に記載の雑音成形方法において、ηLが一定の値より大きい場合、前記雑音フィードバックフィルタ伝達関数を減衰させるステップをさらに含む雑音成形方法。
- 請求項28に記載の雑音成形方法において、前記雑音フィードバックフィルタ伝達関数を減衰させるステップが加重ファクタをγ=0.5に設定し、前記加重ファクタを前記雑音フィードバックフィルタ伝達関数に適用するステップを含む雑音成形方法。
- 請求項25に記載の雑音成形方法において、デッドゾーン量子化をさらに含む雑音成形方法。
- 請求項30に記載の雑音成形方法において、前記デッドゾーン量子化が低レベル信号に対して量子化レベルをゼロに設定するステップを含む雑音成形方法。
- 請求項13に記載の雑音成形方法において、前記コーデックのエンコーダにおけるレイヤ1の雑音成形および前記コーデックのデコーダにおけるレイヤ2の雑音成形をさらに含む雑音成形方法。
- 請求項32に記載の雑音成形方法において、前記エンコーダにおけるレイヤ1の雑音成形が量子化器の出力信号からレイヤ2を減算し、レイヤ1のみに基づいて雑音フィードバックを生成するステップを含む雑音成形方法。
- 請求項32に記載の雑音成形方法において、前記デコーダにおけるレイヤ2の雑音成形が:
レイヤ1からの出力信号を計算するステップと;
レイヤ1からの前記計算された出力信号に基づきフィルタ伝達関数を計算するステップと;
レイヤ2からのエンハンスメント信号を計算するステップと;
前記計算されたフィルタ伝達関数を介してレイヤ2からの前記エンハンスメント信号をフィルタリングするステップと
を含む雑音成形方法。 - 請求項32に記載の雑音成形方法において、レイヤ1コーデックとしてG.711コーデックをさらに含み、レイヤ1における雑音成形が従来のG.711デコーダとの相互動作性を維持するステップを含む雑音成形方法。
- 少なくともレイヤ1およびレイヤ2を含むマルチレイヤエンコーダおよびデコーダにおける雑音成形方法であって、前記方法が:
前記エンコーダにおいて:
請求項1又は11に記載の雑音成形方法を使用して、レイヤ1における雑音を成形するステップを含むレイヤ1における符号化音声信号を生成するステップと;
レイヤ2におけるエンハンスメント信号を生成するステップと;
前記デコーダにおいて:
前記エンコーダのレイヤ1からの前記符号化音声信号を復号し、合成音声信号を生成するステップと;
レイヤ2からの前記エンハンスメント信号を復号するステップと;
前記合成音声信号を使用して、フィルタ伝達関数を計算するステップと;
前記計算されたフィルタ伝達関数を介してレイヤ2の前記復号エンハンスメント信号をフィルタリングし、レイヤ2のフィルタリングされたエンハンスメント信号を生成するステップと;
レイヤ2の前記フィルタリングされたエンハンスメント信号を前記合成音声信号に加え、レイヤ1およびレイヤ2双方からの寄与を含む出力信号を生成するステップと
を含む雑音成形方法。 - 請求項36に記載の雑音成形方法において、レイヤ1コーデックとしてG.711コーデックをさらに含み、レイヤ1における雑音成形が従来のG.711デコーダとの相互動作性を維持するステップを含む雑音成形方法。
- 請求項36に記載の雑音成形方法において、前記エンコーダのレイヤ1における雑音を成形するステップが、レイヤ1からの過去の復号信号をプレエンハンスメントし、前記プレエンハンスメント信号を生成するステップを含む雑音成形方法。
- 請求項38に記載の雑音成形方法において、レイヤ1およびレイヤ2量子化器を介して処理することにより生成する雑音を表す雑音フィードバックを生成するステップをさらに含む雑音成形方法。
- 請求項39に記載の雑音成形方法において、雑音フィードバックを生成するステップが前記レイヤ1およびレイヤ2量子化器の出力信号からレイヤ2の前記エンハンスメント信号を除去するステップを含む雑音成形方法。
- 請求項36に記載の雑音成形方法において、所与の閾値を下回り低減する合成音声信号を抑制する雑音ゲートを前記デコーダにおいて使用するステップをさらに含む雑音成形方法。
- 請求項42に記載の雑音成形方法において、前記合成音声信号を抑制するステップが前記合成音声信号のエネルギーを徐々に減衰させるステップをさらに含む雑音成形方法。
- 請求項43に記載の雑音成形方法において、前記合成音声信号の目標利得を計算するステップをさらに含む雑音成形方法。
- 音声信号コーデックによる入力音声信号の符号化過程における雑音成形デバイスであって、前記デバイスが:
前記入力音声信号をプレエンハンスメントし、プレエンハンスメント音声信号を生成する手段と;
前記プレエンハンスメント音声信号を使用して、雑音フィードバックフィルタ伝達関数を計算する手段と;
前記音声信号コーデックを介する前記入力音声信号の処理により生成する雑音を表す雑音フィードバックを生成する手段と;
を含み、
前記雑音フィードバックを生成する手段は、
前記音声信号コーデックの出力信号と前記入力音声信号との間の誤差を計算する手段と;
前記雑音を成形するため、前記計算されたフィルタ伝達関数を介して前記誤差をフィルタリングする手段と;
前記音声信号コーデックに入力として供給するため、前記入力音声信号に前記フィルタリングされた誤差を加える手段と;
を含む雑音成形デバイス。 - 請求項46に記載の雑音成形デバイスにおいて、前記音声信号コーデックがITU−T G.711コーデックを含む雑音成形デバイス。
- 請求項46に記載の雑音成形デバイスにおいて、前記入力音声信号をプレエンハンスメントする手段が、μが適応型プレエンハンスメントファクタであり、zがz変換領域を表す伝達関数1−μz−1を有するプレエンハンスメントフィルタを含む雑音成形デバイス。
- 請求項48に記載の雑音成形デバイスにおいて、前記適応型プレエンハンスメントファクタμの計算器をさらに含む雑音成形デバイス。
- 請求項46に記載の雑音成形デバイスにおいて、前記誤差を計算する手段が前記音声信号コーデックからの前記出力信号と前記入力音声信号との差分を計算する加算器を含む雑音成形デバイス。
- 請求項46に記載の雑音成形デバイスにおいて、前記誤差をフィルタリングする手段が、A(z)が線形予測フィルタであり、γが加重ファクタである伝達関数A(z/γ)−1を持つフィルタをさらに含む雑音成形デバイス。
- 音声信号コーデックによる入力音声信号の符号化過程における雑音成形デバイスであって、前記デバイスが:
前記入力音声信号の供給を受ける前記音声信号コーデックの出力から復号信号を受信する手段と;
前記復号された出力信号をプレエンハンスメントし、プレエンハンスメント信号を生成する手段と;
前記プレエンハンスメント信号に関する雑音フィードバックフィルタ伝達関数を計算する手段と;
前記音声信号コーデックを介する前記入力音声信号の処理により生成する雑音を表す雑音フィードバックを生成する手段と;
を含み、
前記雑音フィードバックを生成する手段は、
前記音声信号コーデックの前記復号された出力信号と前記入力音声信号との間の誤差を計算する手段と;
前記雑音を成形するため、前記計算されたフィルタ伝達関数を介して前記誤差をフィルタリングする手段と;
前記音声信号コーデックに入力として供給するため、前記入力音声信号に前記フィルタリングされた誤差を加える手段と;
を含む雑音成形デバイス。 - 請求項52に記載の雑音成形デバイスにおいて、前記音声信号コーデックがG.711コーデックである雑音成形デバイス。
- 請求項52に記載の雑音成形デバイスにおいて、前記誤差をフィルタリングする手段が、A(z)が線形予測フィルタであり、γが加重ファクタである伝達関数A(z/γ)−1を持つフィルタを含む雑音成形デバイス。
- 請求項52に記載の雑音成形デバイスにおいて、前記復号された出力信号をプレエンハンスメントする手段が、μが適応型プレエンハンスメントファクタであり、zがz変換領域を表す伝達関数1−μz−1を有するプレエンハンスメントフィルタを含む雑音成形デバイス。
- 請求項55に記載の雑音成形デバイスにおいて、前記適応型プレエンハンスメントファクタμの計算器をさらに含む雑音成形デバイス。
- 請求項52に記載の雑音成形デバイスにおいて、前記誤差をフィルタリングする手段の不安定性に対し前記雑音フィードバックを生成する手段を保護する保護要素をさらに含む雑音成形デバイス。
- 請求項57に記載の雑音成形デバイスにおいて、前記保護要素がサンプリング周波数の半値に近い周波数に集中するエネルギーを持つ信号の検出器を含む雑音成形デバイス。
- 請求項58に記載の雑音成形デバイスにおいて、前記復号された出力信号の第1と第2の自動相関との間の割合であって、前記信号エネルギーの周波数分布を表す前記割合の計算器をさらに含む雑音成形デバイス。
- 請求項52に記載の雑音成形デバイスにおいて、前記雑音フィードバックを低減する利得コントローラをさらに含む雑音成形デバイス。
- 請求項52に記載の雑音成形デバイスにおいて、低エネルギー信号に対して量子化レベルをゼロに設定するデッドゾーン量子化器をさらに含む雑音成形デバイス。
- 少なくともレイヤ1およびレイヤ2を含むマルチレイヤエンコーダおよびデコーダにおける雑音成形デバイスであって、前記デバイスが:
前記エンコーダにおいて:
レイヤ1における雑音を成形する請求項46又は52に記載の雑音成形デバイスを含む音声信号を符号化する手段と;
レイヤ2におけるエンハンスメント信号を生成する手段と;
前記デコーダにおいて:
前記エンコーダのレイヤ1からの前記符号化音声信号を復号し、合成音声信号を生成する手段と;
レイヤ2からの前記エンハンスメント信号を復号する手段と;
前記合成音声信号を使用して、フィルタ伝達関数を計算する手段と;
前記計算されたフィルタ伝達関数を介してレイヤ2からの前記復号されたエンハンスメント信号をフィルタリングし、レイヤ2のフィルタリングされたエンハンスメント信号を生成する手段と;
レイヤ2の前記フィルタリングされたエンハンスメント信号を前記合成音声信号に加え、レイヤ1およびレイヤ2双方からの寄与を含む出力信号を生成する手段と
を含む雑音成形デバイス。 - 請求項62に記載の雑音成形デバイスにおいて、前記符号化デバイスにおけるプレエンハンスメントフィルタをさらに含む雑音成形デバイス。
- 請求項62に記載の雑音成形デバイスにおいて、前記誤差をフィルタリングする手段が、A(z)が線形予測フィルタであり、γが加重ファクタであるA(z/γ)−1の伝達関数を持つフィルタを含む雑音成形デバイス。
- 請求項62に記載の雑音成形デバイスにおいて、前記音声信号コーデックがITU−T G.711コーデックを含む雑音成形デバイス。
- 請求項62に記載の雑音成形デバイスにおいて、所与の閾値に劣るエネルギーレベルを持つ前記合成音声信号を抑制する雑音ゲートをさらに含む雑音成形デバイス。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US92912407P | 2007-06-14 | 2007-06-14 | |
US60/929,124 | 2007-06-14 | ||
US96005707P | 2007-09-13 | 2007-09-13 | |
US60/960,057 | 2007-09-13 | ||
PCT/CA2007/002373 WO2008151410A1 (en) | 2007-06-14 | 2007-12-28 | Device and method for noise shaping in a multilayer embedded codec interoperable with the itu-t g.711 standard |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009541815A JP2009541815A (ja) | 2009-11-26 |
JP5161212B2 true JP5161212B2 (ja) | 2013-03-13 |
Family
ID=40129163
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010511454A Expired - Fee Related JP5618826B2 (ja) | 2007-06-14 | 2007-12-24 | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
JP2009518697A Expired - Fee Related JP5161212B2 (ja) | 2007-06-14 | 2007-12-28 | Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010511454A Expired - Fee Related JP5618826B2 (ja) | 2007-06-14 | 2007-12-24 | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US20110022924A1 (ja) |
EP (1) | EP2160733A4 (ja) |
JP (2) | JP5618826B2 (ja) |
CN (1) | CN101765879B (ja) |
WO (2) | WO2008151408A1 (ja) |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE602006018618D1 (de) * | 2005-07-22 | 2011-01-13 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
KR100900438B1 (ko) * | 2006-04-25 | 2009-06-01 | 삼성전자주식회사 | 음성 패킷 복구 장치 및 방법 |
US8335684B2 (en) * | 2006-07-12 | 2012-12-18 | Broadcom Corporation | Interchangeable noise feedback coding and code excited linear prediction encoders |
US8589720B2 (en) * | 2008-04-15 | 2013-11-19 | Qualcomm Incorporated | Synchronizing timing mismatch by data insertion |
CA2730200C (en) * | 2008-07-11 | 2016-09-27 | Max Neuendorf | An apparatus and a method for generating bandwidth extension output data |
PL2352147T3 (pl) * | 2008-07-11 | 2014-02-28 | Fraunhofer Ges Forschung | Urządzenie i sposób kodowania sygnału audio |
US20100017196A1 (en) * | 2008-07-18 | 2010-01-21 | Qualcomm Incorporated | Method, system, and apparatus for compression or decompression of digital signals |
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466673B (en) * | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466675B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
WO2010137300A1 (ja) * | 2009-05-26 | 2010-12-02 | パナソニック株式会社 | 復号装置及び復号方法 |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
FR2961980A1 (fr) * | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
FR2969360A1 (fr) * | 2010-12-16 | 2012-06-22 | France Telecom | Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique |
US9026434B2 (en) | 2011-04-11 | 2015-05-05 | Samsung Electronic Co., Ltd. | Frame erasure concealment for a multi rate speech and audio codec |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
KR101594480B1 (ko) * | 2011-12-15 | 2016-02-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 클립핑 아티팩트를 피하기 위한 장치, 방법 및 컴퓨터 프로그램 |
US9325544B2 (en) | 2012-10-31 | 2016-04-26 | Csr Technology Inc. | Packet-loss concealment for a degraded frame using replacement data from a non-degraded frame |
BR112015017868B1 (pt) | 2013-01-29 | 2022-02-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Aparelho e método para gerar um sinal de melhoria de frequência utilizando uma operação de limitação de energia |
CN105122357B (zh) | 2013-01-29 | 2019-04-23 | 弗劳恩霍夫应用研究促进协会 | 频域中基于lpc进行编码的低频增强 |
FR3001593A1 (fr) * | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
FR3004876A1 (fr) * | 2013-04-18 | 2014-10-24 | France Telecom | Correction de perte de trame par injection de bruit pondere. |
CN104217727B (zh) * | 2013-05-31 | 2017-07-21 | 华为技术有限公司 | 信号解码方法及设备 |
AU2014283389B2 (en) * | 2013-06-21 | 2017-10-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization |
AU2014283393A1 (en) | 2013-06-21 | 2016-02-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation |
CN107818789B (zh) * | 2013-07-16 | 2020-11-17 | 华为技术有限公司 | 解码方法和解码装置 |
ES2699582T3 (es) * | 2013-07-18 | 2019-02-11 | Nippon Telegraph & Telephone | Dispositivo, método, programa y medio de almacenamiento de análisis de predicción lineal |
US9570093B2 (en) * | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
KR101805630B1 (ko) * | 2013-09-27 | 2017-12-07 | 삼성전자주식회사 | 멀티 디코딩 처리 방법 및 이를 수행하기 위한 멀티 디코더 |
EP2980793A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, system and methods for encoding and decoding |
US9953660B2 (en) * | 2014-08-19 | 2018-04-24 | Nuance Communications, Inc. | System and method for reducing tandeming effects in a communication system |
US9706317B2 (en) * | 2014-10-24 | 2017-07-11 | Starkey Laboratories, Inc. | Packet loss concealment techniques for phone-to-hearing-aid streaming |
JP6754764B2 (ja) * | 2014-12-09 | 2020-09-16 | ドルビー・インターナショナル・アーベー | Mdct領域の誤り隠蔽 |
US9712348B1 (en) * | 2016-01-15 | 2017-07-18 | Avago Technologies General Ip (Singapore) Pte. Ltd. | System, device, and method for shaping transmit noise |
WO2017129270A1 (en) | 2016-01-29 | 2017-08-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal |
WO2017129665A1 (en) * | 2016-01-29 | 2017-08-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal |
JP6826126B2 (ja) * | 2016-03-07 | 2021-02-03 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 異なる周波数帯域の異なる減衰係数に従って隠蔽されたオーディオフレームをフェードアウトする誤り隠蔽ユニット、オーディオデコーダ、および関連する方法およびコンピュータプログラム |
BR112018067944B1 (pt) | 2016-03-07 | 2024-03-05 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema |
KR102192999B1 (ko) * | 2016-03-07 | 2020-12-18 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 적절히 디코딩된 오디오 프레임의 디코딩된 표현의 특성을 사용하는 에러 은닉 유닛, 오디오 디코더, 및 관련 방법과 컴퓨터 프로그램 |
CN107356521B (zh) * | 2017-07-12 | 2020-01-07 | 湖北工业大学 | 一种针对多电极阵列腐蚀传感器微小电流的检测装置及方法 |
US10971166B2 (en) * | 2017-11-02 | 2021-04-06 | Bose Corporation | Low latency audio distribution |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3553777B1 (en) | 2018-04-09 | 2022-07-20 | Dolby Laboratories Licensing Corporation | Low-complexity packet loss concealment for transcoded audio signals |
CN113454714B (zh) * | 2019-02-21 | 2024-05-14 | 瑞典爱立信有限公司 | 根据mdct系数的频谱形状估计 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4704730A (en) * | 1984-03-12 | 1987-11-03 | Allophonix, Inc. | Multi-state speech encoder and decoder |
US5550544C1 (en) * | 1994-02-23 | 2002-02-12 | Matsushita Electric Ind Co Ltd | Signal converter noise shaper ad converter and da converter |
EP0763818B1 (en) * | 1995-09-14 | 2003-05-14 | Kabushiki Kaisha Toshiba | Formant emphasis method and formant emphasis filter device |
JP3017715B2 (ja) * | 1997-10-31 | 2000-03-13 | 松下電器産業株式会社 | 音声再生装置 |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US7171355B1 (en) * | 2000-10-25 | 2007-01-30 | Broadcom Corporation | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals |
US20070055498A1 (en) * | 2000-11-15 | 2007-03-08 | Kapilow David A | Method and apparatus for performing packet loss or frame erasure concealment |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
KR100477699B1 (ko) * | 2003-01-15 | 2005-03-18 | 삼성전자주식회사 | 양자화 잡음 분포 조절 방법 및 장치 |
US8473286B2 (en) * | 2004-02-26 | 2013-06-25 | Broadcom Corporation | Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure |
JP4574320B2 (ja) * | 2004-10-20 | 2010-11-04 | 日本電信電話株式会社 | 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 |
CN1783701A (zh) * | 2004-12-02 | 2006-06-07 | 中国科学院半导体研究所 | 一种高阶σδ噪声整形直接数字频率合成器 |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
JP4758687B2 (ja) * | 2005-06-17 | 2011-08-31 | 日本電信電話株式会社 | 音声パケット送信方法、音声パケット受信方法、それらの方法を用いた装置、プログラム、および記録媒体 |
US20070174047A1 (en) * | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
JP2007114417A (ja) * | 2005-10-19 | 2007-05-10 | Fujitsu Ltd | 音声データ処理方法及び装置 |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
JP4693185B2 (ja) * | 2007-06-12 | 2011-06-01 | 日本電信電話株式会社 | 符号化装置、プログラム、および記録媒体 |
JP5014493B2 (ja) * | 2011-01-18 | 2012-08-29 | 日本電信電話株式会社 | 符号化方法、符号化装置、およびプログラム |
-
2007
- 2007-12-24 JP JP2010511454A patent/JP5618826B2/ja not_active Expired - Fee Related
- 2007-12-24 WO PCT/CA2007/002357 patent/WO2008151408A1/en active Application Filing
- 2007-12-24 US US12/664,024 patent/US20110022924A1/en not_active Abandoned
- 2007-12-28 US US12/664,010 patent/US20110173004A1/en not_active Abandoned
- 2007-12-28 JP JP2009518697A patent/JP5161212B2/ja not_active Expired - Fee Related
- 2007-12-28 CN CN2007801000736A patent/CN101765879B/zh not_active Expired - Fee Related
- 2007-12-28 WO PCT/CA2007/002373 patent/WO2008151410A1/en active Application Filing
- 2007-12-28 EP EP07855653A patent/EP2160733A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JP2009541815A (ja) | 2009-11-26 |
WO2008151408A8 (en) | 2009-03-05 |
EP2160733A4 (en) | 2011-12-21 |
JP5618826B2 (ja) | 2014-11-05 |
EP2160733A1 (en) | 2010-03-10 |
CN101765879B (zh) | 2013-10-30 |
CN101765879A (zh) | 2010-06-30 |
JP2010530078A (ja) | 2010-09-02 |
WO2008151410A1 (en) | 2008-12-18 |
WO2008151408A1 (en) | 2008-12-18 |
US20110022924A1 (en) | 2011-01-27 |
US20110173004A1 (en) | 2011-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5161212B2 (ja) | Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法 | |
US8630864B2 (en) | Method for switching rate and bandwidth scalable audio decoding rate | |
JP5608660B2 (ja) | エネルギ保存型マルチチャネルオーディオ符号化 | |
JP5203929B2 (ja) | スペクトルエンベロープ表示のベクトル量子化方法及び装置 | |
US9715883B2 (en) | Multi-mode audio codec and CELP coding adapted therefore | |
US7020605B2 (en) | Speech coding system with time-domain noise attenuation | |
US7693710B2 (en) | Method and device for efficient frame erasure concealment in linear predictive based speech codecs | |
US20080208575A1 (en) | Split-band encoding and decoding of an audio signal | |
JP5285162B2 (ja) | ピーク検出に基づいた選択型スケーリングマスク演算 | |
KR20090104846A (ko) | 디지털 오디오 신호에 대한 향상된 코딩/디코딩 | |
JPH04233600A (ja) | 32Kb/sワイドバンド音声の低遅延コード励起線型予測符号化 | |
JP2002533963A (ja) | 符号化通信信号の性能改良のための符号化された改良特性 | |
US5913187A (en) | Nonlinear filter for noise suppression in linear prediction speech processing devices | |
US20110125507A1 (en) | Method and System for Frequency Domain Postfiltering of Encoded Audio Data in a Decoder | |
JP2008519990A (ja) | 信号符号化の方法 | |
JP2004515801A (ja) | 音響信号の符号化の知覚的改善 | |
JP5255575B2 (ja) | レイヤード・コーデックのためのポストフィルタ | |
US10672411B2 (en) | Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy | |
JP5451603B2 (ja) | デジタルオーディオ信号の符号化 | |
Lapierre et al. | Noise shaping in an ITU-T G. 711-Interoperable embedded codec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110816 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111110 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5161212 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |