JP5357055B2 - 改良形デジタルオーディオ信号符号化/復号化方法 - Google Patents
改良形デジタルオーディオ信号符号化/復号化方法 Download PDFInfo
- Publication number
- JP5357055B2 JP5357055B2 JP2009547737A JP2009547737A JP5357055B2 JP 5357055 B2 JP5357055 B2 JP 5357055B2 JP 2009547737 A JP2009547737 A JP 2009547737A JP 2009547737 A JP2009547737 A JP 2009547737A JP 5357055 B2 JP5357055 B2 JP 5357055B2
- Authority
- JP
- Japan
- Prior art keywords
- subband
- frequency
- masking threshold
- signal
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000005236 sound signal Effects 0.000 title description 5
- 230000000873 masking effect Effects 0.000 claims abstract description 109
- 230000003595 spectral effect Effects 0.000 claims abstract description 59
- 230000006870 function Effects 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 16
- 238000004891 communication Methods 0.000 claims description 6
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 12
- 238000004590 computer program Methods 0.000 abstract 2
- 238000001228 spectrum Methods 0.000 description 24
- 238000013139 quantization Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
パルス符号変調(PCM:pulse code modulation)及び適応差分パルス符号変調(ADPCM:adaptive differential pulse code modulation)のような波形符号化法。
符号駆動線形予測(CELP:code excited linear prediction)符号化のような「合成による分析(analysis-by-synthesis)」パラメトリック符号化法。
サブバンドの知覚的符号化法または変換符号化。
Feはサンプリングレート(サンプリング速度)であり、
F0は基本周波数である。
ソース制御及び/またはチャンネル制御のマルチモード符号化、これは、特に3GPP AMR−NB、3GPP AMR−WB、または3GPP2 VMR−WBコーダにおいて用いられる。
階層または「スケーラブル」符号化、これは、コアビットレート層及び1つ以上のいわゆる拡張層から成るので、「階層」ビットストリームを発生する(G.722による48、56及び64kbit/sでの標準符号化は一般にビットレートがスケーラブル(拡大縮小可能)であるのに対し、UIT−T G.729.1及びMPEG−4 CELP符号化は、ビットレート及び帯域幅が共にスケーラブルである)。
多重記述符号化、これは特に非特許文献1に記載されている。
G.729.1コーダはUIT−T G.729コーダの拡張である。これは、修正されたG.729階層コアコーダであり、狭帯域(50〜4000Hz)から広帯域(50〜7000Hz)までにわたる帯域の信号を音声サービス用の8〜32kbit/sのビットレートで生成する。このコーデックは既存のIP電話機器(大部分は規格G.729に従って装置化されている)と互換性がある。最後に、規格G.729は2006年5月に承認されていることを指摘しておくことが適切である。
CELPカスケード符号化;
時間領域帯域幅拡張(TDBWE:time domain bandwidth extension)型モジュール108による帯域パラメータの拡張;及び、
TDAC予測変換符号化、これは変形離散(ディスクリート)コサイン変換(MDCT:modified discrete cosine transform)型変換後に適用する。
図2に、規格G.729.1による対応するデコーダを示す。20msの各フレームを記述するビットを、ブロック200において多重分離する。
図3に、G.729.1コーダにおけるTDAC型変換符号化を示す。
知覚的にフィルタ処理された差信号のMDCTスペクトル
元の高帯域信号のMDCTスペクトルSHB。
sb_bound(j)≦k≦sb_bound(j+1)
なる係数Y(k)を含む。
rms_index(j)=round(2・log_rms(j))
ここに、記号「round」は最も近い整数に丸めることを表し、次式の制約を有する:
−11≦rms_index(j)≦+20
この量子化値rms_index(j)はビット割り当て(ビットアロケーション)ブロック306に伝送される。
「差分ハフマン符号化」と称される符号化によって符号化することができ;あるいは、
普通のバイナリ(2進)符号化によって符号化することができる。
選定した符号化モードを示すためのビット(0または1)がデコーダに伝送される。
エンコーダ(図3)と同様の方法で、復号化されたスペクトル包絡線(ブロック401)は、ビット割り当てを復元することを可能にする。包絡線(エンベロープ)復号化(ブロック401)は、ブロック305によって生成された(多重化)ビットストリームに基づいて、スペクトル包絡線の量子化値(rms_index(j), j=0,...,17)を再構成して、これより復号化した包絡線を次式のように推定する:
rms_q(j)=21/2rms_index(j)
知覚的にフィルタ処理された低帯域の復号化差信号のスペクトル
に対応する最初160個の係数;及び、
元の高帯域の復号化信号のスペクトル
に対応する次の160個の係数。
に逆の知覚的重み付け(WLB(z)-1で表されるフィルタ)が適用される。
nbits_VQ=351−nbits_rmsであり、nbits_rmsは、スペクトル包絡線の符号化によって使用されるビット数である。
の形式を有し、ここに0<γ2<γ1<1であり、
は線形予測スペクトル(LPC)を表す。従って、CELP符号化の「合成による分析」の効果は、この種のフィルタにより知覚的重み付けした信号領域における標準偏差を最小化することにある。
とSHBとが隣接する際(図3のブロック303)のスペクトルの連続性を保証するために、フィルタWLB(z)は次式の形に定義される:
規格G.729.1では、エンコーダTDACは次のものを同時に処理する:
元の低帯域と、
型のフィルタによって知覚的にフィルタ処理して(スペクトル連続性を保証すべく)ゲイン補償したCELP合成信号との信号差、及び、
元の高帯域信号を含む高帯域。
低帯域信号は50Hz〜4kHzの周波数に相当し、高帯域信号は4〜7kHzの周波数に相当する。
第2サブバンドに適用する少なくとも1つの周波数マスキングしきい値を決定するステップ;及び、
上記第1サブバンドと第2サブバンドとの間のスペクトル連続性を保証するために、このマスキングしきい値を正規化(規格化)するステップ。
次のことが有利である:
従って、第1サブバンドは、階層コーダのコア符号化から生じる信号を含み、
第2サブバンドは原信号を含む。
第2サブバンドに適用する少なくとも1つの周波数マスキングしきい値を、復号化したスペクトル包絡線に基づいて決定するステップ;及び、
このマスキングしきい値を正規化して、第1サブバンドと第2サブバンドとの間のスペクトル連続性を保証するステップ。
型フィルタによって既に重み付けした低帯域信号を再び重み付けすることになり、従って、追加的なしきい値の重み付けがこの低帯域信号にとって余分である。
スペクトル包絡線の表現式;及び、
サブバンドjの中心周波数を含む広がり関数。
第1周波数帯域(0〜4000Hz)内では、原信号とG.711合成信号との差信号;
第2周波数帯域(4000〜8000Hz)では、本発明により周波数領域内で知覚的に重み付けした原信号。
他の変形例では、原信号を32kHzでサンプリングして、適切なQMF型のフィルタバンクによって(0から8000Hzまで、及び8000から16000Hzまでの)2つの周波数帯域に分割する。ここでは、コーダは規格G.722(2つのサブバンド内のADPCM圧縮)によるコーダとすることができ、変換符号化は次の信号に対して実行する:
第1周波数帯域(0〜8000Hz)内では、原信号とG.122合成信号との差信号;
第2周波数帯域(4000〜8000Hz)に限定された周波数領域内では、これも本発明により周波数領域内で知覚的に重み付けした原信号。
Claims (19)
- 可聴周波数信号を複数のサブバンド内で符号化する方法であって、前記サブバンドのうち互いに隣接する第1サブバンド及び第2サブバンドを変換符号化する方法において、
前記変換符号化における変換領域内で、少なくとも前記第2サブバンドに知覚的重み付けを適用するために、前記方法が、
前記第2サブバンドに適用する少なくとも1つの周波数マスキングしきい値を、前記第2サブバンドのスペクトル包絡線に基づいて決定するステップと;
前記周波数マスキングしきい値を正規化して、前記第1サブバンドと前記第2サブバンドとの間のスペクトル連続性を保証するステップであって、前記正規化は、前記第1サブバンド用の周波数マスキングしきい値及び前記第2サブバンド用の周波数マスキングしきい値のうち少なくとも一方に関して実行するステップと
を具えていることを特徴とする可聴周波数信号の符号化方法。 - 前記サブバンドの各々に割り当てるビット数を、前記サブバンドの各々のスペクトル包絡線に基づいて決定し、少なくとも前記第2サブバンドに対するビット割り当てをさらに、少なくとも前記第2サブバンドに適用される正規化したマスキング曲線の計算値の関数として決定することを特徴とする請求項1に記載の方法。
- 前記符号化を3つ以上のサブバンドに対して実行し、前記第1サブバンドが第1スペクトル帯域内に含まれ、前記第2サブバンドが第2スペクトル帯域内に含まれ、指標jの前記サブバンド毎に、サブバンド当たりのビット数nbit(j)を、次の関係式:
jが前記第1スペクトル帯域内の指標である場合は、ip(j)=(1/2)rms_index(j)、
jが前記第2スペクトル帯域内の指標である場合は、ip(j)=(1/2)[rms_index(j)−log_mask(j)], log_mask(j)=log2(M(j))−normfac、
に基づいて計算した知覚的重要度ip(j)に応じて与え、ここに、
rms_index(j)は、サブバンドjについて、前記スペクトル包絡線の符号化から生じた量子化値であり、
M(j)は、指標jの前記サブバンド用の周波数マスキングしきい値であり、
normfacは、前記第1サブバンドと前記第2サブバンドとの間のスペクトル連続性を保証するための正規化係数である
ことを特徴とする請求項2に記載の方法。 - 変換符号化した前記第2サブバンド内の信号を、前記第2サブバンド用の前記正規化した周波数マスキングしきい値の平方根に比例する係数によって重み付けすることを特徴とする請求項1に記載の方法。
- 前記符号化を3つ以上の前記サブバンドに対して実行し、前記第1サブバンドが第1スペクトル帯域内に含まれ、前記第2サブバンドが第2スペクトル帯域内に含まれ、重み付け値
(外12)
を符号化し、ここに、M(j)は、前記第2スペクトル帯域内に含まれる指標jのサブバンド用の前記正規化した周波数マスキングしきい値である
ことを特徴とする請求項4に記載の方法。 - 前記変換符号化を、階層コーダ内の上層において実行し、
前記第1サブバンドが、前記階層コーダのコア符号化から生じた信号を含み、
前記第2サブバンドが、原信号を含む
ことを特徴とする請求項1に記載の方法。 - 前記コア符号化から生じた信号を知覚的に重み付けすることを特徴とする請求項6に記載の方法。
- 前記コア符号化から生じた信号が、原信号とこの原信号の合成信号との差を表す信号であることを特徴とする請求項6に記載の方法。
- 前記変換符号化が、規格G.729.1による総合コーダにおけるTDAC型の変換符号化であり、前記第1サブバンドが低周波帯域内に含まれ、前記第2サブバンドが高周波帯域内に含まれることを特徴とする請求項6に記載の方法。
- 前記高周波帯域が、少なくとも7000Hzまでに及ぶことを特徴とする請求項9に記載の方法。
- 前記スペクトル包絡線を計算し、1つの前記サブバンド用の前記周波数マスキングしきい値が、
前記スペクトル包絡線の表現式と、
当該サブバンドの中心周波数を含む広がり関数と
の畳み込みによって定義されることを特徴とする請求項1に記載の方法。 - 符号化する前記可聴周波数信号が音声的であるか音声的でないかを表す情報を得て、前記周波数マスキングしきい値を決定して正規化した前記第2サブバンドの前記知覚的重み付けを、前記可聴周波数信号が音声的でない場合のみに実行することを特徴とする請求項1に記載の方法。
- 複数のサブバンドの可聴周波数信号を復号化する方法であって、互いに隣接する少なくとも第1サブバンド及び第2サブバンドを変換復号化する方法において、
前記第2サブバンドに適用する少なくとも1つの周波数マスキングしきい値を、復号化した前記第2サブバンドのスペクトル包絡線に基づいて決定するステップと;
前記周波数マスキングしきい値を正規化して、前記第1サブバンドと前記第2サブバンドとの間のスペクトル連続性を保証するステップであって、前記正規化は、前記第1サブバンド用の周波数マスキングしきい値及び前記第2サブバンド用の周波数マスキングしきい値のうち少なくとも一方に関して実行するステップと
を具えていることを特徴とする可聴周波数信号の復号化方法。 - 前記サブバンドの各々に割り当てるビット数を、前記サブバンドの各々のスペクトル包絡線の復号化によって決定し、少なくとも前記第2サブバンドに対するビット割り当てをさらに、少なくとも前記第2サブバンドに適用される正規化したマスキング曲線の計算により決定することを特徴とする請求項13に記載の方法。
- 変換符号化された前記第2サブバンド内の信号を、前記第2サブバンド用の前記正規化した周波数マスキングしきい値の平方根に比例する係数によって重み付けすることを特徴とする請求項13に記載の方法。
- 通信端末のコーダのメモリに記憶され、及び/または、前記コーダのリーダと協働することを意図した記憶媒体上に記憶されたソフトウェアプログラムであって、
前記コーダのプロセッサによって実行された際に請求項1〜12のいずれかに記載の符号化方法を実現するための命令を具えていることを特徴とするソフトウェアプログラム。 - 可聴周波数信号を複数のサブバンド内で符号化するコーダであって、前記サブバンドのうち互いに隣接する第1サブバンド及び第2サブバンドを変換符号化するコーダにおいて、
前記変換符号化における変換領域内で、少なくとも前記第2サブバンドに知覚的重み付けを適用するために、前記コーダが、
前記第2サブバンドに適用する少なくとも1つの周波数マスキングしきい値を、前記第2サブバンドのスペクトル包絡線に基づいて決定する手段と;
前記周波数マスキングしきい値を正規化して、前記第1サブバンドと前記第2サブバンドとの間のスペクトル連続性を保証する手段であって、前記正規化を、前記第1サブバンド用の周波数マスキングしきい値及び前記第2サブバンド用の周波数マスキングしきい値のうち少なくとも一方に関して実行する手段と
を具えていることを特徴とするコーダ。 - 通信端末のデコーダのメモリに記憶され、及び/または、前記デコーダのリーダと協働することを意図した記憶媒体上に記憶されたソフトウェアプログラムであって、
前記デコーダのプロセッサによって実行された際に請求項13〜15のいずれかに記載の復号化方法を実現するための命令を具えていることを特徴とするソフトウェアプログラム。 - 複数のサブバンドの可聴周波数信号を復号化するデコーダであって、互いに隣接する少なくとも第1サブバンド及び第2サブバンドを変換復号化するデコーダにおいて、
前記第2サブバンドに適用する少なくとも1つの周波数マスキングしきい値を、復号化した前記第2サブバンドのスペクトル包絡線に基づいて決定する手段と;
前記周波数マスキングしきい値を正規化して、前記第1サブバンドと前記第2サブバンドとの間のスペクトル連続性を保証する手段であって、前記正規化を、前記第1サブバンド用の周波数マスキングしきい値及び前記第2サブバンド用の周波数マスキングしきい値のうち少なくとも一方に関して実行する手段と
を具えていることを特徴とするデコーダ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0700747A FR2912249A1 (fr) | 2007-02-02 | 2007-02-02 | Codage/decodage perfectionnes de signaux audionumeriques. |
FR0700747 | 2007-02-02 | ||
PCT/FR2008/050150 WO2008104663A1 (fr) | 2007-02-02 | 2008-01-30 | Codage/decodage perfectionnes de signaux audionumeriques |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010518422A JP2010518422A (ja) | 2010-05-27 |
JP5357055B2 true JP5357055B2 (ja) | 2013-12-04 |
Family
ID=38477199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009547737A Active JP5357055B2 (ja) | 2007-02-02 | 2008-01-30 | 改良形デジタルオーディオ信号符号化/復号化方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8543389B2 (ja) |
EP (1) | EP2115741B1 (ja) |
JP (1) | JP5357055B2 (ja) |
KR (1) | KR101425944B1 (ja) |
CN (1) | CN101622661B (ja) |
AT (1) | ATE473504T1 (ja) |
DE (1) | DE602008001718D1 (ja) |
ES (1) | ES2347850T3 (ja) |
FR (1) | FR2912249A1 (ja) |
WO (1) | WO2008104663A1 (ja) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008022181A2 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Updating of decoder states after packet loss concealment |
MX2011000370A (es) * | 2008-07-11 | 2011-03-15 | Fraunhofer Ges Forschung | Un aparato y un metodo para decodificar una señal de audio codificada. |
CA2730200C (en) * | 2008-07-11 | 2016-09-27 | Max Neuendorf | An apparatus and a method for generating bandwidth extension output data |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
WO2010028301A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Spectrum harmonic/noise sharpness control |
US8532998B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
EP2645367B1 (en) * | 2009-02-16 | 2019-11-20 | Electronics and Telecommunications Research Institute | Encoding/decoding method for audio signals using adaptive sinusoidal coding and apparatus thereof |
FR2947944A1 (fr) * | 2009-07-07 | 2011-01-14 | France Telecom | Codage/decodage perfectionne de signaux audionumeriques |
ES2441069T3 (es) * | 2009-10-08 | 2014-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación |
WO2011048820A1 (ja) * | 2009-10-23 | 2011-04-28 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
JP5598536B2 (ja) * | 2010-03-31 | 2014-10-01 | 富士通株式会社 | 帯域拡張装置および帯域拡張方法 |
US9443534B2 (en) | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
WO2011132368A1 (ja) * | 2010-04-19 | 2011-10-27 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法及び復号方法 |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
EP3422346B1 (en) | 2010-07-02 | 2020-04-22 | Dolby International AB | Audio encoding with decision about the application of postfiltering when decoding |
US20120029926A1 (en) | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
ES2564504T3 (es) * | 2010-12-29 | 2016-03-23 | Samsung Electronics Co., Ltd | Aparato de codificación y aparato de descodificación con una ampliación de ancho de banda |
US9536534B2 (en) * | 2011-04-20 | 2017-01-03 | Panasonic Intellectual Property Corporation Of America | Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
CN103548080B (zh) * | 2012-05-11 | 2017-03-08 | 松下电器产业株式会社 | 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法 |
ES2613747T3 (es) | 2013-01-08 | 2017-05-25 | Dolby International Ab | Predicción basada en modelo en un banco de filtros críticamente muestreado |
KR102150496B1 (ko) * | 2013-04-05 | 2020-09-01 | 돌비 인터네셔널 에이비 | 오디오 인코더 및 디코더 |
CN104217727B (zh) | 2013-05-31 | 2017-07-21 | 华为技术有限公司 | 信号解码方法及设备 |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
US10204630B2 (en) * | 2013-10-22 | 2019-02-12 | Electronics And Telecommunications Research Instit Ute | Method for generating filter for audio signal and parameterizing device therefor |
KR101498113B1 (ko) * | 2013-10-23 | 2015-03-04 | 광주과학기술원 | 사운드 신호의 대역폭 확장 장치 및 방법 |
EP3913628A1 (en) * | 2014-03-24 | 2021-11-24 | Samsung Electronics Co., Ltd. | High-band encoding method |
EP3594946B1 (en) * | 2014-05-01 | 2020-10-28 | Nippon Telegraph And Telephone Corporation | Decoding of a sound signal |
CN107077855B (zh) | 2014-07-28 | 2020-09-22 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
WO2017033113A1 (en) | 2015-08-21 | 2017-03-02 | Acerta Pharma B.V. | Therapeutic combinations of a mek inhibitor and a btk inhibitor |
US10628165B2 (en) * | 2017-08-17 | 2020-04-21 | Agora Lab, Inc. | Gain control for multiple description coding |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
KR102189733B1 (ko) * | 2019-06-12 | 2020-12-11 | 주식회사 에이치알지 | 대동물의 섭취량을 측정하는 전자 장치 및 그 동작 방법 |
WO2024034389A1 (ja) * | 2022-08-09 | 2024-02-15 | ソニーグループ株式会社 | 信号処理装置、信号処理方法、およびプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0695700A (ja) * | 1992-09-09 | 1994-04-08 | Toshiba Corp | 音声符号化方法及びその装置 |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
US5632003A (en) * | 1993-07-16 | 1997-05-20 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for coding method and apparatus |
US5625743A (en) * | 1994-10-07 | 1997-04-29 | Motorola, Inc. | Determining a masking level for a subband in a subband audio encoder |
DE69620967T2 (de) * | 1995-09-19 | 2002-11-07 | At & T Corp | Synthese von Sprachsignalen in Abwesenheit kodierter Parameter |
US5790759A (en) * | 1995-09-19 | 1998-08-04 | Lucent Technologies Inc. | Perceptual noise masking measure based on synthesis filter frequency response |
JP4570250B2 (ja) * | 1998-05-27 | 2010-10-27 | マイクロソフト コーポレーション | 信号の量子化変換係数をエントロピーエンコードするシステムと方法 |
JP3515903B2 (ja) * | 1998-06-16 | 2004-04-05 | 松下電器産業株式会社 | オーディオ符号化のための動的ビット割り当て方法及び装置 |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
JP2003280697A (ja) * | 2002-03-22 | 2003-10-02 | Sanyo Electric Co Ltd | 音声圧縮方法および音声圧縮装置 |
EP1489599B1 (en) * | 2002-04-26 | 2016-05-11 | Panasonic Intellectual Property Corporation of America | Coding device and decoding device |
FR2850781B1 (fr) * | 2003-01-30 | 2005-05-06 | Jean Luc Crebouw | Procede pour le traitement numerique differencie de la voix et de la musique, le filtrage du bruit, la creation d'effets speciaux et dispositif pour la mise en oeuvre dudit procede |
US7333930B2 (en) * | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
WO2006049205A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号化装置およびスケーラブル符号化装置 |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
-
2007
- 2007-02-02 FR FR0700747A patent/FR2912249A1/fr not_active Withdrawn
-
2008
- 2008-01-30 US US12/524,774 patent/US8543389B2/en active Active
- 2008-01-30 KR KR1020097016113A patent/KR101425944B1/ko active IP Right Grant
- 2008-01-30 EP EP08762010A patent/EP2115741B1/fr active Active
- 2008-01-30 ES ES08762010T patent/ES2347850T3/es active Active
- 2008-01-30 AT AT08762010T patent/ATE473504T1/de not_active IP Right Cessation
- 2008-01-30 WO PCT/FR2008/050150 patent/WO2008104663A1/fr active Application Filing
- 2008-01-30 DE DE602008001718T patent/DE602008001718D1/de active Active
- 2008-01-30 CN CN2008800066533A patent/CN101622661B/zh active Active
- 2008-01-30 JP JP2009547737A patent/JP5357055B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN101622661A (zh) | 2010-01-06 |
FR2912249A1 (fr) | 2008-08-08 |
JP2010518422A (ja) | 2010-05-27 |
EP2115741A1 (fr) | 2009-11-11 |
WO2008104663A1 (fr) | 2008-09-04 |
US8543389B2 (en) | 2013-09-24 |
ATE473504T1 (de) | 2010-07-15 |
KR20090104846A (ko) | 2009-10-06 |
ES2347850T3 (es) | 2010-11-04 |
EP2115741B1 (fr) | 2010-07-07 |
US20100121646A1 (en) | 2010-05-13 |
KR101425944B1 (ko) | 2014-08-06 |
CN101622661B (zh) | 2012-05-23 |
DE602008001718D1 (de) | 2010-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5357055B2 (ja) | 改良形デジタルオーディオ信号符号化/復号化方法 | |
US10885926B2 (en) | Classification between time-domain coding and frequency domain coding for high bit rates | |
US10249313B2 (en) | Adaptive bandwidth extension and apparatus for the same | |
US8532983B2 (en) | Adaptive frequency prediction for encoding or decoding an audio signal | |
RU2520402C2 (ru) | Переключаемая аудио кодирующая/декодирующая схема с мультиразрешением | |
US8812327B2 (en) | Coding/decoding of digital audio signals | |
JP2020204784A (ja) | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 | |
JP2012518194A (ja) | 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130626 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130813 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130829 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5357055 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |