JP6041815B2 - 音声信号復号器、音声信号符号器、復号化されたマルチチャンネル音声信号表現の生成方法、符号化されたマルチチャンネル音声信号表現の生成方法およびコンピュータプログラム - Google Patents
音声信号復号器、音声信号符号器、復号化されたマルチチャンネル音声信号表現の生成方法、符号化されたマルチチャンネル音声信号表現の生成方法およびコンピュータプログラム Download PDFInfo
- Publication number
- JP6041815B2 JP6041815B2 JP2014012379A JP2014012379A JP6041815B2 JP 6041815 B2 JP6041815 B2 JP 6041815B2 JP 2014012379 A JP2014012379 A JP 2014012379A JP 2014012379 A JP2014012379 A JP 2014012379A JP 6041815 B2 JP6041815 B2 JP 6041815B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- channel
- audio
- axis compression
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 179
- 238000000034 method Methods 0.000 title claims description 62
- 238000004590 computer program Methods 0.000 title claims description 14
- 238000007906 compression Methods 0.000 claims description 733
- 230000006835 compression Effects 0.000 claims description 733
- 230000003595 spectral effect Effects 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 4
- 230000036962 time dependent Effects 0.000 claims 1
- 239000011295 pitch Substances 0.000 description 146
- 238000004422 calculation algorithm Methods 0.000 description 39
- 238000004364 calculation method Methods 0.000 description 39
- 238000010586 diagram Methods 0.000 description 28
- 230000008859 change Effects 0.000 description 20
- 230000007704 transition Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 238000005070 sampling Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 5
- 230000000737 periodic effect Effects 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000005684 electric field Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Stereophonic System (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Synchronisation In Digital Transmission Systems (AREA)
Description
本発明は、時間軸圧縮音声信号の符号化および時間軸圧縮音声信号の復号化に関するので、本発明が適用される原型の時間軸圧縮音声信号符号器および時間軸圧縮音声信号復号器の短い概観が与えられる。
図2は時間軸圧縮音声信号復号器200のブロック概略図を示す。時間軸圧縮音声信号復号器200は、第2のフレームが第1のフレームに続くフレームの系列を有する音声信号の第1および第2のフレームの、第1の時間軸圧縮されてサンプル抽出された表現、または、第1の単に時間軸圧縮された表現を処理する。時間軸圧縮音声信号復号器200は、さらに、音声信号の第2のフレームおよびフレーム系列の中の第2のフレームに続く第3のフレームの、第2の時間軸圧縮された表現を処理する。音声信号復号器200は変換窓計算機210を含む。変換窓計算機210は、第1および第2のフレームのピッチ曲線212の情報を使用して、第1の時間軸圧縮された表現211aのための第1のスケーリング窓を引き出すように適合される。さらに、変換窓計算機210は、第2および第3のフレームのピッチ曲線の情報を使用して、第2の時間軸圧縮された表現211bのための第2のスケーリング窓を引き出すように適合される。ここで、スケーリング窓は同じ数のサンプルを有し、第1のスケーリング窓をフェードアウトするために使用される1番目のサンプルは、第2のスケーリング窓をフェードインするために使用される2番目のサンプルと異なる。音声信号復号器200は更に窓化器216を含む。窓化器216は、第1のスケーリング窓を第1の時間軸圧縮された表現に適用するように、そして、第2のスケーリング窓を第2の時間軸圧縮された表現に適用するように適合させられる。さらに、音声信号復号器200は再サンプル抽出器218を含む。再サンプル抽出器218は、第1および第2のフレームのピッチ曲線の情報を使用して、第1のサンプル抽出された表現を引き出すために、第1のスケーリングされた時間軸圧縮表現を、逆に時間軸圧縮するように適合させられる。さらに、再サンプル抽出器218は、第1および第2のフレームのピッチ曲線の情報を使用して、第2のサンプル抽出された表現を引き出すために、第2のスケーリングされた表現を、逆に時間軸圧縮するように適合させられる。その結果、第2のフレームに対応する第1のサンプル抽出された表現の部分は、予め決められた許容範囲内で、第2のフレームに対応する第2のサンプル抽出された表現の部分のピッチ曲線と等しいピッチ曲線を含む。スケーリング窓を引き出すために、変換窓計算機210は、直接にピッチ曲線212を受信するか、または、任意のサンプル抽出速度調整器220から時間軸圧縮の情報を受信する。サンプル抽出速度調整器220は、ピッチ曲線212を受信して、重複領域のサンプルのための線形時間スケール上のサンプルの位置を、特定または略特定し、かつ、周期的に分離されるような、逆時間軸圧縮方法を引き出す。その結果、ピッチが重複領域の中で同じになり、そして、任意に、逆時間軸圧縮の前には、重複窓の一部分の異なるフェード長が、逆時間軸圧縮の後には、同じ長さになる。
以下では、簡易型の音声信号復号器が説明される。図3はこの簡易型の音声信号復号器300のブロック概略図を示す。音声信号復号器300は、符号化された音声信号表現310を受信して、それに基づいて、復号化された音声信号表現312を提供するように構成されている。符号化された音声信号表現310は、時間軸圧縮曲線進展情報316を含む。音声信号復号器300は、時間軸圧縮曲線進展情報316に基づいて、時間軸圧縮曲線データ322を発生するように構成された、時間軸圧縮曲線計算機320を含む。時間軸圧縮曲線進展情報316は、時間軸圧縮曲線の時間的進展を説明し、符号化された音声信号表現310に含まれている。時間軸圧縮曲線データ322を時間軸圧縮曲線進展情報316から引き出すとき、時間軸圧縮曲線計算機320は、以下で詳細に説明されるように、予め決められた時間軸圧縮曲線開始値から繰り返して再開始する。再開始は、時間軸圧縮曲線が不連続(時間軸圧縮曲線進展情報316によって符号化されたステップより大きい階段状変化)を含むという結果を有する。音声信号復号器300は、さらに、少なくとも時間軸圧縮曲線データ322の一部分を再スケールするように構成されている、時間軸圧縮曲線データ再スケーラ330を含む。その結果、時間軸圧縮曲線計算の再開始時点における不連続が、時間軸圧縮曲線の再スケールバージョン332において、避けられる、または、減少する、または、排除される。
図4は、符号化された音声信号表現に基づいて復号化された音声信号表現を提供する方法のフローチャート図を示す。符号化された音声信号表現は、図3の音声信号復号器300によって実行される時間軸圧縮曲線進展情報を含む。方法400は時間軸圧縮曲線データを発生させる第1のステップ410を含む。第1のステップ410は、時間軸圧縮曲線の時間的進展を説明する時間軸圧縮曲線進展情報に基づいて、予め決められた時間軸圧縮曲線開始値から繰り返して再開始する。
以下において、本発明に係る実施形態が、図5a〜図9cを参照して詳細に説明される。
以下では、手段520の構造と機能が説明される。手段520は時間軸圧縮曲線計算機540を含む。時間軸圧縮曲線計算機540は、時間軸圧縮曲線進展情報510を受信して、それに基づいて、新しい時間軸圧縮曲線部分情報542を提供するように構成されている。例えば、時間軸圧縮曲線進展情報510の1セットが、再構成されるべき音声信号の各フレームごとに装置500に伝送される。それにも関わらず、再構成されるべき一つの音声信号のフレームに関係した時間軸圧縮曲線進展情報510の1セットは、音声信号の複数のフレームの再構成のために使用される。同様に、時間軸圧縮曲線進展情報510の複数のセットが、以下で詳細に議論するように、音声信号の単一のフレームの音声内容の再構成のために使用される。結論として、いくつかの実施形態において、時間軸圧縮曲線進展情報510は、再構成または更新されるべき音声信号の変換領域係数のセットと同じ速度(音声信号の1フレーム当たり1つの時間軸圧縮曲線部分)で更新されると主張される。
以下では、時間軸圧縮曲線部分の計算に関する詳細が、図7a、図7b、図8、図9a、図9b及び図9cを参照して説明される。
図8は、本発明に係る実施形態によって解決される問題を例証するグラフ表示を示す。第1のグラフ表示810は、いくつかの従来例で得られる、再構成された相対的ピッチの時間的進展を示す。横軸812は時間を表し、縦軸814は相対的ピッチを表す。曲線816は、時間が経過するにつれての相対的ピッチの時間的進展を示す。相対的ピッチの時間的進展は、相対的ピッチ情報から再構成される。相対的ピッチ曲線の再構成に関して、時間軸圧縮された変形離散余弦変換(MDCT)の応用には、実際のフレーム内のピッチの相対的変化に関する知識のみが必要であることに注目すべきである。これを理解するために、相対的ピッチ曲線から時間軸曲線を得るための計算ステップを参照する。計算ステップは、同じ相対的ピッチ曲線のスケーリングされたバージョンに対して一致した時間軸曲線に導く。従って、絶対的ピッチの値の代わりに相対的ピッチの値を符号化するだけで十分である。それは、符号化効率を増加させる。符号化効率をさらに増加させるために、実際の量子化された値は、相対的ピッチではなく、ピッチの相対的変化、すなわち、前の相対的ピッチに対する現在の相対的ピッチの比率(以下で詳細に議論する)である。例えば、信号が倍音構造を全く示さない、いくつかのフレームの中で、時間軸圧縮は望まれない。そのような場合、追加フラグは、任意に、前述した方法で平坦なピッチ曲線の符号化の代わりに、平坦なピッチ曲線を示す。実際の世界の信号の中で、そのようなフレームの量が、通常、十分高いので、いつも加えられる追加ビットと非圧縮フレーム毎に保存されたビットとの間の交換取引は、ビット保存に有利である。
以下では、本発明の実施形態に係る音声復号器によって実行されるアルゴリズムのいくつかが詳細に説明される。このために、図5a、図5b、図6a、図6b、図9a、図9b、図9c及び図10a〜図10gを参照する。さらに、図11a、図11b−1及び図11b−2のデータ要素、補助要素および定数に関する説明を参照する。
以下では、時間軸圧縮制御情報が、時間軸圧縮曲線(例えば、3つの時間軸圧縮曲線部分を含む)および圧縮曲線合計値に基づいて、どのように計算されるかを簡潔に説明される。
以下では、時間軸圧縮制御情報512に基づいて実行される時間軸圧縮信号再構成が、簡潔に議論され、時間軸圧縮曲線の計算が、適切な文脈の中に入れられる。
以下では、時間軸圧縮制御情報に依存した、窓付けされた圧縮時間領域サンプルの逆時間軸圧縮ステップ650Cが説明される。そこでは、周期的にサンプル抽出された時間領域サンプル、または、単なる時間領域サンプルが、時間変化している再サンプル抽出によって得られる。時間変化している再サンプル抽出において、窓付けされたブロック「z[]」は、例えば、図10fの符号1070で示されたインパルス応答を使用して、抽出位置に従って再サンプル抽出される。再サンプル抽出の前に、窓付けされたブロックは、図10fの符号1072で示されるように、両端にゼロを入れる。再サンプル抽出自体は、図10fの符号1074で示された仮コード区域によって説明される。
以下では、時間領域サンプルの任意の後ステップ650Dが説明される。いくつかの実施形態では、後再サンプル抽出フレーム処理が、窓系列の型に依存して実行される。パラメータ「window_sequence」によって、所定の更なる処理ステップが適用される。
さらに、現在の時間領域サンプルと1つ以上の前の時間領域サンプルとの重複および加算ステップ650Eが、実行される。重複および加算ステップ650Eは、すべての系列に対して同じであり、図10gの符号1086で示されているように、数学的に説明される。
また、与えられた表記に関して、その索引が図11a、図11b−1及び図11b−2に示された説明図に成されている。通常、逆変換の合成窓長Nは、特に、構文要素「窓系列(window_sequence)」とアルゴリズムの文脈との関数である。例えば、それは、図11b−2の符号1190で示されるように定義される。
図13は、再構成された時間軸圧縮曲線情報を提供するための手段1300のブロック概略図を示す。手段1300は、図5aを参照して説明された手段520の機能を引き継ぐ。しかしながら、データ経路とバッファが、さらに詳細に示される。手段1300は、圧縮ノード値計算機544の機能を取る圧縮ノード値計算機1344を含む。圧縮ノード値計算機1344は、符号化された圧縮比率情報として、圧縮比率のコード表インデックス「tw_ratio[]」を受信する。圧縮ノード値計算機1344は、例えば、図9cに表された時間軸圧縮比率値上への時間軸圧縮比率インデックスの写像を表す、圧縮値表を含む。圧縮ノード値計算機1344は、さらに、図9a−1の符号910で表されたアルゴリズムを実行するための乗算器を含む。従って、圧縮ノード値計算機1344は、圧縮ノード値「warp_node_values[i]」を提供する。さらに、手段1300は、圧縮曲線補間器1348を含む。圧縮曲線補間器1348は、補間器540aの機能を取り、図9a−1の符号920で示されたアルゴリズムを実行するように構成されている。その結果、新しい圧縮曲線(「new_warp_contour」)の値を得る。手段1300は、さらに、新しい圧縮曲線バッファ1350を含む。新しい圧縮曲線バッファ1350は、新しい圧縮曲線(すなわち、「warp_contour[i]」、2・n_long≦i<3・n_long)の値を格納する。手段1300は、さらに、過去の圧縮曲線バッファ/更新器1360を含む。過去の圧縮曲線バッファ/更新器1360は、「最後の時間軸圧縮曲線部分」と「現在の時間軸圧縮曲線部分」を格納して、再スケールおよび現在のフレームの処理の完成に対応して、記憶内容を更新する。従って、過去の圧縮曲線バッファ/更新器1360は、過去の圧縮曲線再スケーラ1370と協働する。その結果、過去の圧縮曲線バッファ/更新器1360と過去の圧縮曲線再スケーラ1370とは、共にアルゴリズム930,932,934,936,950,960の機能を十分に満たす。また、任意に、過去の圧縮曲線バッファ/更新器1360は、アルゴリズム932,936,952,954,962,964の機能を引き継ぐ。
以下では、本発明に係る音声信号符号器が説明される。図14の音声信号符号器は、符号1400でその全体が指定される。音声信号符号器1400は、音声信号1410と、音声信号1410に関係した、任意に外部的に提供された圧縮曲線情報1412と、を受信するように構成されている。さらに、音声信号符号器1400は、音声信号1410の符号化された表現1414を提供するように構成されている。
図15は、本発明の別の実施形態に係る時間軸圧縮曲線計算機1500のブロック概略図を示す。時間軸圧縮曲線計算機1500は、符号化された圧縮比率情報1510を受信して、それに基づいて、複数の圧縮曲線ノード値1512を提供するように構成されている。時間軸圧縮曲線計算機1500は、例えば、圧縮比率復号器1520を含む。圧縮比率復号器1520は、圧縮比率値1522の系列を、符号化された圧縮比率情報1510から引き出すように構成されている。また、時間軸圧縮曲線計算機1500は、圧縮曲線ノード値計算機1530を含む。圧縮曲線ノード値計算機1530は、圧縮曲線ノード値1512の系列を、圧縮比率値1522の系列から引き出すように構成されている。例えば、圧縮曲線ノード値計算機1530は、圧縮曲線開始値から開始する圧縮曲線開始ノード値を得るように構成されている。圧縮曲線ノード値計算機1530の中で、圧縮曲線開始ノードに関係した圧縮曲線開始値と圧縮曲線ノード値との間の比率が、圧縮比率値1522によって決定される。また、圧縮曲線ノード値計算機1530は、乗算形式に基づいて、特定の圧縮曲線ノードの圧縮曲線ノード値1512を計算するように構成されている。特定の圧縮曲線ノードは、中間圧縮曲線ノードによって、圧縮曲線開始ノードから区切られている。前記乗算形式は、係数として、圧縮曲線開始値(例えば、1)と中間圧縮曲線ノードの圧縮曲線ノード値との間の比率、ならびに、中間圧縮曲線ノードの圧縮曲線ノード値と特定の圧縮曲線ノードの圧縮曲線ノード値との間の比率を含む。
以下では、本発明の別の実施形態に係る音声信号符号器が、図17を参照して簡潔に説明される。音声信号符号器1700は、マルチチャンネル音声信号1710を受信して、マルチチャンネル音声信号1710の符号化された音声表現1712を提供するように構成されている。音声信号符号器1700は、符号化音声表現提供装置1720を含む。符号化音声表現提供装置1720は、共通してマルチチャンネル音声信号の複数の音声チャンネルに関係した共通圧縮曲線情報を含む音声表現、または、複数の音声チャンネルの異なる音声チャンネルに個別に関係した個別の圧縮曲線情報を含む符号化音声表現を、選択的に提供するように構成されている。それらの表現は、複数の音声チャンネルの音声チャンネルに関係した圧縮曲線の間の類似または相違を説明する情報に依存している。
図18は、本発明の実施形態に係る音声信号復号器のブロック概略図を示す。音声信号復号器1800は、符号化された音声信号表現1810(例えば、符号化された表現1712)を受信して、それに基づいて、マルチチャンネル音声信号の復号化された表現1812を提供するように構成されている。音声信号復号器1800は、サイド情報抽出器1820と時間軸圧縮復号器1830とを含む。サイド情報抽出器1820は、時間軸圧縮曲線応用情報1822および圧縮曲線情報1824を、符号化された音声信号表現1810から引き出すように構成されている。例えば、サイド情報抽出器1820は、単一の共通の時間軸圧縮情報が、符号化された音声信号の複数のチャンネルに利用可能であるか否か、または、別々の時間軸圧縮曲線情報が、複数のチャンネルに利用可能であるか否か、を識別するように構成されている。従って、サイド情報抽出器1820は、時間軸圧縮曲線応用情報1822(共通のまたは個別の時間軸圧縮曲線情報が利用可能であるか否かを示す)と、時間軸圧縮曲線情報1824(共通(共同)時間軸圧縮曲線または個別の時間軸圧縮曲線の時間的進展を説明する)と、を共に提供する。時間軸圧縮復号器1830は、情報1822,1824によって説明された時間軸圧縮を考慮に入れて、符号化された音声信号表現1810に基づいて、マルチチャンネル音声信号の復号化された表現1812を再構成するように構成されている。例えば、時間軸圧縮復号器1830は、個別の符号化された周波数領域情報が利用可能である異なる音声チャンネルを復号化するために、共通の時間軸圧縮曲線を適用するように構成されている。従って、時間軸圧縮復号器1830は、例えば、類似の、または、同じ時間軸圧縮を含むが、異なるピッチを含むマルチチャンネル音声信号の、異なるチャンネルを再構成する。
以下では、1つ以上の音声信号チャンネルと1つ以上の時間軸圧縮曲線との符号化された表現を含む音声ストリームが説明される。
以上をまとめると、本発明に係る実施形態は、時間軸圧縮の分野の中で異なる改良をもたらす。
1.(「numPitches」+1)個のノードが存在する。
2.「node [0]」は常に1.0である。
3.関係式node [i]=node[i−1]・relChange[i] (i=1..「numPitches」+1)
ここで、「relChange[i]」は、「pitchIdx[i]」の逆量子化によって得られる。
所定の実施例の要求に依存して、本発明の実施形態が、ハードウェアまたはソフトウェアの中で実行される。実施例は、電子的に読み込み可能な制御信号を格納するデジタル格納媒体、例えば、フロッピー(登録商標)ディスク、DVD、CD、ROM、PROM、EPROM、EEPROM、または、フラッシュメモリを使用して実行される。デジタル格納媒体は、プログラマブルコンピュータシステムと協働する(または、共に操作できる)。その結果、それぞれの方法が実行される。
Claims (14)
- 符号化されたマルチチャンネル音声信号表現(211,212;310;1810)に基づいて、復号化されたマルチチャンネル音声信号表現(232;312;1812)を生成するように構成された音声信号復号器(200;300;1500;1800)であって、
前記符号化されたマルチチャンネル音声信号表現(211,212;310;1810)によって表された、複数の音声チャンネルの再構成のために、個別の音声チャンネルの特定の時間軸圧縮曲線(332;1824)、もしくは、共通マルチチャンネル時間軸圧縮曲線(332;1824)を、選択的に使用するように構成された時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)を備えたこと、
を特徴とする、音声信号復号器。 - 前記時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)が、前記符号化されたマルチチャンネル音声信号表現(211,212;310;1810)によって表された、複数の音声チャンネルの時間軸圧縮している再構成のために、共通マルチチャンネル時間軸圧縮曲線(332;1824)を、選択的に使用するように構成され、前記再構成のために、個別の符号化されたスペクトル領域情報(211)が利用可能であること、を特徴とする、請求項1に記載の音声信号復号器。
- 前記時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)は、第1の音声チャンネルに関係した第1の符号化されたスペクトル領域情報を受信して、それに基づいて、周波数領域から圧縮時間領域への変換を使用して、前記第1の音声チャンネルの圧縮時間領域表現(X[][])を生成するように構成され、
前記時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)は、第2の音声チャンネルに関係した第2の符号化されたスペクトル領域情報を受信して、それに基づいて、周波数領域から圧縮時間領域への変換を使用して、前記第2の音声チャンネルの圧縮時間領域表現(X[][])を生成するように構成され、
前記第2の符号化されたスペクトル領域情報が前記第1の符号化されたスペクトル領域情報と異なり、
前記時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)は、前記共通マルチチャンネル時間軸圧縮曲線(332;1824)に基づいて、前記第1の音声チャンネルの圧縮時間領域表現、または、前記第1の音声チャンネルの圧縮時間領域表現の処理バージョンを、時間変化的に再サンプル抽出して、前記第1の音声チャンネルの周期的に抽出された表現を得るように構成され、
前記時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)は、前記共通マルチチャンネル時間軸圧縮曲線(332;1824)に基づいて、前記第2の音声チャンネルの圧縮時間領域表現、または、前記第2の音声チャンネルの圧縮時間領域表現の処理バージョンを、時間変化的に再サンプル抽出して、前記第2の音声チャンネルの周期的に抽出された表現を得るように構成されていること、
を特徴とする、請求項2に記載の音声信号復号器。 - 前記時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)は、共通マルチチャンネル時間軸圧縮曲線情報から共通マルチチャンネル時間軸曲線を引き出し、
第1の符号化された窓形状情報に基づいて、第1の音声チャンネルに関係した第1の個別のチャンネル特有の窓形状を引き出し、
第2の符号化された窓形状情報に基づいて、第2の音声チャンネルに関係した第2の個別のチャンネル特有の窓形状を引き出し、
前記第1の個別のチャンネル特有の窓形状を前記第1の音声チャンネルの圧縮時間領域表現に適用して、前記第1の音声チャンネルの圧縮時間領域表現の処理バージョンを得て、
前記第2の個別のチャンネル特有の窓形状を前記第2の音声チャンネルの圧縮時間領域表現に適用して、前記第2の音声チャンネルの圧縮時間領域表現の処理バージョンを得るように構成され、
前記時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)は、個別のチャンネル特有の窓形状情報に依存して、異なる窓形状を、特定のフレームの第1および第2の音声チャンネルの圧縮時間領域表現に適用可能であること、
を特徴とする、請求項1または請求項2に記載の音声信号復号器。 - 前記時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)は、共通マルチチャンネル時間軸圧縮曲線情報から共通マルチチャンネル時間軸曲線を引き出し、
第1の符号化された窓形状情報に基づいて、前記第1の音声チャンネルに関係した第1の個別のチャンネル特有の窓形状を引き出し、
第2の符号化された窓形状情報に基づいて、前記第2の音声チャンネルに関係した第2の個別のチャンネル特有の窓形状を引き出し、
前記第1の個別のチャンネル特有の窓形状を前記第1の音声チャンネルの圧縮時間領域表現に適用して、前記第1の音声チャンネルの圧縮時間領域表現の処理バージョンを得て、
前記第2の個別のチャンネル特有の窓形状を前記第2の音声チャンネルの圧縮時間領域表現に適用して、前記第2の音声チャンネルの圧縮時間領域表現の処理バージョンを得るように構成され、
前記時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)は、個別のチャンネル特有の窓形状情報に依存して、異なる窓形状を、特定のフレームの第1および第2の音声チャンネルの圧縮時間領域表現に適用可能であること、
を特徴とする、請求項3に記載の音声信号復号器。 - 前記時間軸圧縮復号器(210,216,218、219,220,230,240;340;1830)は、前記第1および第2の音声チャンネルの圧縮時間領域表現を窓付けするとき、共通マルチチャンネル時間軸曲線によって決定される共通時間軸スケーリングを、異なる窓形状に適用するように構成されていること、を特徴とする、請求項4または請求項5に記載の音声信号復号器。
- マルチチャンネル音声信号の符号化された表現(150,152;1712)を生成するための音声信号符号器(100;1700)であって、
複数の音声チャンネルに関係した時間軸圧縮曲線の間の類似もしくは相違を説明する情報に依存して、前記マルチチャンネル音声信号の複数の音声チャンネルに共通に関係した共通マルチチャンネル時間軸圧縮曲線情報を含む符号化された音声表現(150,152;1712)、もしくは、前記複数の音声チャンネルの異なる音声チャンネルに個別に関係した個別の時間軸圧縮曲線情報を含む符号化された音声表現(150,152;1712)を、選択的に生成するように構成された、符号化された音声表現生成装置(104,106,108,108a,114;1720)を含むこと、
を特徴とする、音声信号符号器。 - 前記符号化された音声表現生成装置(104,106,108,108a,114;1720)は、共通マルチチャンネル時間軸圧縮曲線情報を適用して、前記複数の音声チャンネルの第1および第2の音声チャンネルの時間軸圧縮バージョンを得て、前記第1の音声チャンネルの時間圧縮バージョンに基づいて、前記第1の音声チャンネルに関係した第1の個別の符号化されたスペクトル領域情報を生成し、かつ、前記第2の音声チャンネルの時間圧縮バージョンに基づいて、前記第2の音声チャンネルに関係した第2の個別の符号化されたスペクトル領域情報を生成するように構成されていること、を特徴とする、請求項7に記載の音声信号符号器。
- 前記符号化された音声表現生成装置(104,106,108,108a,114;1720)は、マルチチャンネル音声信号の符号化された表現(150,152;1712)を生成するように構成され、その結果、前記マルチチャンネル音声信号の符号化された表現(150,152;1712)が、前記共通マルチチャンネル時間軸圧縮曲線情報、前記共通マルチチャンネル時間軸圧縮曲線情報に従って時間軸圧縮された第1の音声チャンネルの時間軸圧縮バージョンの符号化されたスペクトル表現、および、前記共通マルチチャンネル時間軸圧縮曲線情報に従って時間軸圧縮された第2の音声チャンネルの時間軸圧縮バージョンの符号化されたスペクトル表現を含むこと、を特徴とする、請求項7または請求項8に記載の音声信号符号器。
- 前記共通マルチチャンネル時間軸圧縮曲線情報を得るように構成され、その結果、前記共通マルチチャンネル時間軸圧縮曲線情報が、前記第1の音声チャンネルおよび前記第2の音声チャンネルに関係した個別の圧縮曲線の平均を表すこと、を特徴とする、請求項8または請求項9に記載の音声信号符号器。
- 前記符号化された音声表現生成装置(104,106,108,108a,114;1720)は、マルチチャンネル音声信号の符号化された表現(150,152;1712)内のサイド情報(tw_data_present; common_tw)を生成するように構成され、前記サイド情報(tw_data_present; common_tw)は、音声フレーム単位を基本にして、時間軸圧縮データが特定の音声フレームに対して存在しているか否か、および、共通時間軸圧縮曲線情報が特定の音声フレームに対して存在しているか否かを示すこと、を特徴とする、請求項7〜請求項10のいずれかに記載の音声信号符号器。
- 符号化されたマルチチャンネル音声信号表現(211,212;310;1810)に基づいて、復号化されたマルチチャンネル音声信号表現(232;300;1500;1800)を生成するための方法であって、
前記符号化されたマルチチャンネル音声信号表現によって表された複数の音声チャンネルの再構成のために、個別の音声チャンネルの特定の時間軸圧縮曲線もしくは共通マルチチャンネル時間軸圧縮曲線を選択的に使用するステップを含むこと、
を特徴とする、復号化されたマルチチャンネル音声信号表現の生成方法。 - 符号化されたマルチチャンネル音声信号表現(150,152;1712)を生成するための方法であって、
複数の音声チャンネルに関係した時間軸圧縮曲線の間の類似もしくは相違を説明する情報に依存して、マルチチャンネル音声信号の複数の音声チャンネルに共通して関係した共通マルチチャンネル時間軸圧縮曲線情報を含む符号化された音声信号表現、もしくは、複数の音声チャンネルの異なる音声チャンネルに個々に関係した個別の時間軸圧縮曲線情報を含む符号化された音声信号表現を、選択的に生成するステップを含むこと、
を特徴とする、符号化されたマルチチャンネル音声信号表現の生成方法。 - プログラムコードがコンピュータ上で実行されると、前記コンピュータが請求項12または請求項13の方法を実行する、前記プログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7987308P | 2008-07-11 | 2008-07-11 | |
US61/079,873 | 2008-07-11 | ||
US10382008P | 2008-10-08 | 2008-10-08 | |
US61/103,820 | 2008-10-08 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011510909A Division JP5551686B2 (ja) | 2008-07-11 | 2009-07-01 | 音声信号復号器、復号化されたマルチチャンネル音声信号表現の生成方法およびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014130359A JP2014130359A (ja) | 2014-07-10 |
JP6041815B2 true JP6041815B2 (ja) | 2016-12-14 |
Family
ID=41131685
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011510908A Active JP5323180B2 (ja) | 2008-07-11 | 2009-07-01 | 音声信号復号器、時間軸圧縮曲線データ生成装置、復号化された音声信号の生成方法、およびコンピュータプログラム |
JP2011510909A Active JP5551686B2 (ja) | 2008-07-11 | 2009-07-01 | 音声信号復号器、復号化されたマルチチャンネル音声信号表現の生成方法およびコンピュータプログラム |
JP2011510907A Active JP5323179B2 (ja) | 2008-07-11 | 2009-07-01 | 時間軸圧縮曲線計算機、音声信号符号器、復号化された音声信号表現の生成方法、符号化された音声信号表現の生成方法、およびコンピュータプログラム |
JP2014012379A Active JP6041815B2 (ja) | 2008-07-11 | 2014-01-27 | 音声信号復号器、音声信号符号器、復号化されたマルチチャンネル音声信号表現の生成方法、符号化されたマルチチャンネル音声信号表現の生成方法およびコンピュータプログラム |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011510908A Active JP5323180B2 (ja) | 2008-07-11 | 2009-07-01 | 音声信号復号器、時間軸圧縮曲線データ生成装置、復号化された音声信号の生成方法、およびコンピュータプログラム |
JP2011510909A Active JP5551686B2 (ja) | 2008-07-11 | 2009-07-01 | 音声信号復号器、復号化されたマルチチャンネル音声信号表現の生成方法およびコンピュータプログラム |
JP2011510907A Active JP5323179B2 (ja) | 2008-07-11 | 2009-07-01 | 時間軸圧縮曲線計算機、音声信号符号器、復号化された音声信号表現の生成方法、符号化された音声信号表現の生成方法、およびコンピュータプログラム |
Country Status (18)
Country | Link |
---|---|
US (3) | US9043216B2 (ja) |
EP (3) | EP2257945B1 (ja) |
JP (4) | JP5323180B2 (ja) |
KR (3) | KR101205593B1 (ja) |
CN (3) | CN102007537B (ja) |
AR (3) | AR072498A1 (ja) |
AT (2) | ATE532176T1 (ja) |
AU (3) | AU2009267486B2 (ja) |
BR (2) | BRPI0906300B1 (ja) |
CA (3) | CA2718740C (ja) |
ES (3) | ES2376849T3 (ja) |
HK (3) | HK1151619A1 (ja) |
MX (3) | MX2010010747A (ja) |
MY (1) | MY154452A (ja) |
PL (3) | PL2257945T3 (ja) |
RU (3) | RU2509381C2 (ja) |
TW (3) | TWI459374B (ja) |
WO (3) | WO2010003583A1 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
PT2410522T (pt) | 2008-07-11 | 2018-01-09 | Fraunhofer Ges Forschung | Codificador de sinal de áudio, método para codificar um sinal de áudio e programa de computador |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2471061B1 (en) * | 2009-10-08 | 2013-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
ES2458354T3 (es) * | 2010-03-10 | 2014-05-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador de señales de audio, codificador de señales de audio, métodos y programa de ordenador que utiliza tasa de muestreo dependiente de la codificación del contorno de distorsión en el tiempo |
EP2372703A1 (en) * | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window |
SG184230A1 (en) * | 2010-03-26 | 2012-11-29 | Agency Science Tech & Res | Methods and devices for providing an encoded digital signal |
KR101740359B1 (ko) * | 2011-01-25 | 2017-05-26 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 방법, 부호화 장치, 주기성 특징량 결정 방법, 주기성 특징량 결정 장치, 프로그램, 기록 매체 |
JP5666021B2 (ja) | 2011-02-14 | 2015-02-04 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 復号後オーディオ信号をスペクトル領域で処理する装置及び方法 |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
BR112013020699B1 (pt) | 2011-02-14 | 2021-08-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Aparelho e método para codificar e decodificar um sinal de áudio utilizando uma parte antecipada alinhada |
AR085361A1 (es) | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio |
AU2012217156B2 (en) | 2011-02-14 | 2015-03-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Linear prediction based coding scheme using spectral domain noise shaping |
MX2012013025A (es) * | 2011-02-14 | 2013-01-22 | Fraunhofer Ges Forschung | Representacion de señal de informacion utilizando transformada superpuesta. |
EP2661745B1 (en) | 2011-02-14 | 2015-04-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
MY166006A (en) | 2011-02-14 | 2018-05-21 | Fraunhofer Ges Forschung | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
JP5969513B2 (ja) | 2011-02-14 | 2016-08-17 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 不活性相の間のノイズ合成を用いるオーディオコーデック |
WO2012126893A1 (en) | 2011-03-18 | 2012-09-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frame element length transmission in audio coding |
TWI450266B (zh) * | 2011-04-19 | 2014-08-21 | Hon Hai Prec Ind Co Ltd | 電子裝置及音頻資料的解碼方法 |
US9967600B2 (en) * | 2011-05-26 | 2018-05-08 | Nbcuniversal Media, Llc | Multi-channel digital content watermark system and method |
ES2549953T3 (es) * | 2012-08-27 | 2015-11-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada |
CN102855884B (zh) * | 2012-09-11 | 2014-08-13 | 中国人民解放军理工大学 | 基于短时连续非负矩阵分解的语音时长调整方法 |
CN105976824B (zh) | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
US9548056B2 (en) * | 2012-12-19 | 2017-01-17 | Dolby International Ab | Signal adaptive FIR/IIR predictors for minimizing entropy |
CA2925734C (en) * | 2013-10-18 | 2018-07-10 | Guillaume Fuchs | Coding of spectral coefficients of a spectrum of an audio signal |
FR3015754A1 (fr) * | 2013-12-20 | 2015-06-26 | Orange | Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame |
EP2980791A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
JP6807033B2 (ja) * | 2015-11-09 | 2021-01-06 | ソニー株式会社 | デコード装置、デコード方法、およびプログラム |
US10074373B2 (en) * | 2015-12-21 | 2018-09-11 | Qualcomm Incorporated | Channel adjustment for inter-frame temporal shift variations |
JP6730438B2 (ja) | 2016-01-22 | 2020-07-29 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
CN107749304B (zh) * | 2017-09-07 | 2021-04-06 | 电信科学技术研究院 | 有限冲激响应滤波器系数矢量的可持续更新方法及装置 |
KR20220054645A (ko) * | 2019-09-03 | 2022-05-03 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 저지연, 저주파 효과 코덱 |
TWI752551B (zh) * | 2020-07-13 | 2022-01-11 | 國立屏東大學 | 迅吃偵測方法、迅吃偵測裝置與電腦程式產品 |
Family Cites Families (81)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5054075A (en) | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
JP3076859B2 (ja) | 1992-04-20 | 2000-08-14 | 三菱電機株式会社 | ディジタルオーディオ信号の信号処理装置 |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
JPH0784597A (ja) * | 1993-09-20 | 1995-03-31 | Fujitsu Ltd | 音声符号化装置および音声復号化装置 |
US5717823A (en) * | 1994-04-14 | 1998-02-10 | Lucent Technologies Inc. | Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders |
FI105001B (fi) * | 1995-06-30 | 2000-05-15 | Nokia Mobile Phones Ltd | Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin |
US5704003A (en) | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
JP3707116B2 (ja) | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
US6115689A (en) | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
US6453285B1 (en) * | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
US6330533B2 (en) | 1998-08-24 | 2001-12-11 | Conexant Systems, Inc. | Speech encoder adaptively applying pitch preprocessing with warping of target signal |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US7047185B1 (en) | 1998-09-15 | 2006-05-16 | Skyworks Solutions, Inc. | Method and apparatus for dynamically switching between speech coders of a mobile unit as a function of received signal quality |
US6424938B1 (en) * | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6223151B1 (en) | 1999-02-10 | 2001-04-24 | Telefon Aktie Bolaget Lm Ericsson | Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders |
DE19910833C1 (de) | 1999-03-11 | 2000-05-31 | Mayer Textilmaschf | Kurzketten-Schärmaschine |
EP1099215B1 (en) | 1999-05-26 | 2005-02-23 | Koninklijke Philips Electronics N.V. | Audio signal transmission system |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US6366880B1 (en) | 1999-11-30 | 2002-04-02 | Motorola, Inc. | Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies |
JP2001255882A (ja) * | 2000-03-09 | 2001-09-21 | Sony Corp | 音声信号処理装置及びその信号処理方法 |
JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
US6850884B2 (en) * | 2000-09-15 | 2005-02-01 | Mindspeed Technologies, Inc. | Selection of coding parameters based on spectral content of a speech signal |
BR0107420A (pt) | 2000-11-03 | 2002-10-08 | Koninkl Philips Electronics Nv | Processos de codificação de um sinal de entrada e de decodificação, sinal modificado modelado, meio de armazenagem, decodificador, reprodutor de áudio, e ,aparelho para codificação de sinais |
US6925435B1 (en) | 2000-11-27 | 2005-08-02 | Mindspeed Technologies, Inc. | Method and apparatus for improved noise reduction in a speech encoder |
SE0004818D0 (sv) | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
CN100338650C (zh) * | 2001-04-05 | 2007-09-19 | 皇家菲利浦电子有限公司 | 时标扩展方法、时标修改装置和接收音频信号的接收器 |
FI110729B (fi) | 2001-04-11 | 2003-03-14 | Nokia Corp | Menetelmä pakatun audiosignaalin purkamiseksi |
AU2002307533B2 (en) | 2001-05-10 | 2008-01-31 | Dolby Laboratories Licensing Corporation | Improving transient performance of low bit rate audio coding systems by reducing pre-noise |
DE20108778U1 (de) * | 2001-05-25 | 2001-08-02 | Mannesmann VDO AG, 60388 Frankfurt | Gehäuse für ein in einem Fahrzeug verwendbares Gerät zur automatischen Ermittlung von Straßenbenutzungsgebühren |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
EP1278185A3 (en) | 2001-07-13 | 2005-02-09 | Alcatel | Method for improving noise reduction in speech transmission |
US6963842B2 (en) | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
KR20040060946A (ko) * | 2001-10-26 | 2004-07-06 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코더에서의 사인곡선의 파라미터의 추적 |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
JP2003316392A (ja) | 2002-04-22 | 2003-11-07 | Mitsubishi Electric Corp | オーディオ信号の復号化及び符号化装置、復号化装置並びに符号化装置 |
US7457757B1 (en) | 2002-05-30 | 2008-11-25 | Plantronics, Inc. | Intelligibility control for speech communications systems |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
TWI288915B (en) | 2002-06-17 | 2007-10-21 | Dolby Lab Licensing Corp | Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components |
US7043423B2 (en) | 2002-07-16 | 2006-05-09 | Dolby Laboratories Licensing Corporation | Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding |
EP1550108A2 (en) * | 2002-10-11 | 2005-07-06 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US20040181411A1 (en) * | 2003-03-15 | 2004-09-16 | Mindspeed Technologies, Inc. | Voicing index controls for CELP speech coding |
JP4629353B2 (ja) * | 2003-04-17 | 2011-02-09 | インベンテイオ・アクテイエンゲゼルシヤフト | エスカレータまたは動く歩道のための移動手摺り駆動装置 |
KR100732659B1 (ko) * | 2003-05-01 | 2007-06-27 | 노키아 코포레이션 | 가변 비트 레이트 광대역 스피치 음성 코딩시의 이득양자화를 위한 방법 및 장치 |
US7363221B2 (en) | 2003-08-19 | 2008-04-22 | Microsoft Corporation | Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation |
KR100604897B1 (ko) | 2004-09-07 | 2006-07-28 | 삼성전자주식회사 | 하드 디스크 드라이브 조립체, 하드 디스크 드라이브의장착 구조 및 이를 채용한 휴대폰 |
KR100640893B1 (ko) | 2004-09-07 | 2006-11-02 | 엘지전자 주식회사 | 음성 인식용 베이스밴드 모뎀 및 이동통신용 단말기 |
WO2006079813A1 (en) | 2005-01-27 | 2006-08-03 | Synchro Arts Limited | Methods and apparatus for use in sound modification |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
CN101167125B (zh) * | 2005-03-11 | 2012-02-29 | 高通股份有限公司 | 用于对声码器内的帧进行相位匹配的方法及设备 |
RU2381572C2 (ru) * | 2005-04-01 | 2010-02-10 | Квэлкомм Инкорпорейтед | Системы, способы и устройство широкополосного речевого кодирования |
JP4550652B2 (ja) | 2005-04-14 | 2010-09-22 | 株式会社東芝 | 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法 |
US7885809B2 (en) | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
EP1875464B9 (en) | 2005-04-22 | 2020-10-28 | Qualcomm Incorporated | Method, storage medium and apparatus for gain factor attenuation |
JP4450324B2 (ja) | 2005-08-15 | 2010-04-14 | 日立オートモティブシステムズ株式会社 | 内燃機関の始動制御装置 |
JP2007084597A (ja) | 2005-09-20 | 2007-04-05 | Fuji Shikiso Kk | 表面処理カーボンブラック組成物およびその製造方法 |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7366658B2 (en) * | 2005-12-09 | 2008-04-29 | Texas Instruments Incorporated | Noise pre-processor for enhanced variable rate speech codec |
ES2391116T3 (es) | 2006-02-23 | 2012-11-21 | Lg Electronics Inc. | Método y aparato para procesar una señal de audio |
TWI294107B (en) | 2006-04-28 | 2008-03-01 | Univ Nat Kaohsiung 1St Univ Sc | A pronunciation-scored method for the application of voice and image in the e-learning |
RU2418322C2 (ru) | 2006-06-30 | 2011-05-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодер, аудиодекодер и аудиопроцессор, имеющий динамически изменяющуюся характеристику перекоса |
US8682652B2 (en) * | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
CN101136901B (zh) * | 2006-08-18 | 2012-11-21 | 广州广晟数码技术有限公司 | 用于处理基于帧的数据的方法和系统 |
US8239190B2 (en) | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
CN101025918B (zh) | 2007-01-19 | 2011-06-29 | 清华大学 | 一种语音/音乐双模编解码无缝切换方法 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
PT2410522T (pt) | 2008-07-11 | 2018-01-09 | Fraunhofer Ges Forschung | Codificador de sinal de áudio, método para codificar um sinal de áudio e programa de computador |
JP5297891B2 (ja) | 2009-05-25 | 2013-09-25 | 京楽産業.株式会社 | 遊技機 |
US9269366B2 (en) | 2009-08-03 | 2016-02-23 | Broadcom Corporation | Hybrid instantaneous/differential pitch period coding |
EP2492911B1 (en) | 2009-10-21 | 2017-08-16 | Panasonic Intellectual Property Management Co., Ltd. | Audio encoding apparatus, decoding apparatus, method, circuit and program |
-
2009
- 2009-06-23 MY MYPI2011000095A patent/MY154452A/en unknown
- 2009-07-01 WO PCT/EP2009/004758 patent/WO2010003583A1/en active Application Filing
- 2009-07-01 KR KR1020107021806A patent/KR101205593B1/ko active IP Right Grant
- 2009-07-01 CA CA2718740A patent/CA2718740C/en active Active
- 2009-07-01 MX MX2010010747A patent/MX2010010747A/es active IP Right Grant
- 2009-07-01 AU AU2009267486A patent/AU2009267486B2/en active Active
- 2009-07-01 JP JP2011510908A patent/JP5323180B2/ja active Active
- 2009-07-01 KR KR1020107021830A patent/KR101205615B1/ko active IP Right Grant
- 2009-07-01 BR BRPI0906300-5A patent/BRPI0906300B1/pt active IP Right Grant
- 2009-07-01 KR KR1020107021817A patent/KR101205644B1/ko active IP Right Grant
- 2009-07-01 CA CA2718859A patent/CA2718859C/en active Active
- 2009-07-01 ES ES09776908T patent/ES2376849T3/es active Active
- 2009-07-01 ES ES09776909T patent/ES2376974T3/es active Active
- 2009-07-01 EP EP09776909A patent/EP2257945B1/en active Active
- 2009-07-01 CN CN2009801116869A patent/CN102007537B/zh active Active
- 2009-07-01 JP JP2011510909A patent/JP5551686B2/ja active Active
- 2009-07-01 AU AU2009267484A patent/AU2009267484B2/en active Active
- 2009-07-01 WO PCT/EP2009/004757 patent/WO2010003582A1/en active Application Filing
- 2009-07-01 EP EP09776910A patent/EP2260485B1/en active Active
- 2009-07-01 CN CN2009801116873A patent/CN102007531B/zh active Active
- 2009-07-01 AT AT09776908T patent/ATE532176T1/de active
- 2009-07-01 CN CN2009801116801A patent/CN102007536B/zh active Active
- 2009-07-01 US US12/935,718 patent/US9043216B2/en active Active
- 2009-07-01 BR BRPI0906320-0A patent/BRPI0906320B1/pt active IP Right Grant
- 2009-07-01 ES ES09776910T patent/ES2404132T3/es active Active
- 2009-07-01 PL PL09776909T patent/PL2257945T3/pl unknown
- 2009-07-01 MX MX2010010749A patent/MX2010010749A/es active IP Right Grant
- 2009-07-01 CA CA2718857A patent/CA2718857C/en active Active
- 2009-07-01 RU RU2010139021/08A patent/RU2509381C2/ru active
- 2009-07-01 MX MX2010010748A patent/MX2010010748A/es active IP Right Grant
- 2009-07-01 US US12/935,731 patent/US9299363B2/en active Active
- 2009-07-01 EP EP09776908A patent/EP2257944B1/en active Active
- 2009-07-01 AU AU2009267485A patent/AU2009267485B2/en active Active
- 2009-07-01 US US12/935,740 patent/US9025777B2/en active Active
- 2009-07-01 RU RU2010139022/28A patent/RU2486484C2/ru active
- 2009-07-01 RU RU2010139023/08A patent/RU2527760C2/ru active
- 2009-07-01 WO PCT/EP2009/004756 patent/WO2010003581A1/en active Application Filing
- 2009-07-01 AT AT09776909T patent/ATE532177T1/de active
- 2009-07-01 JP JP2011510907A patent/JP5323179B2/ja active Active
- 2009-07-01 PL PL09776910T patent/PL2260485T3/pl unknown
- 2009-07-01 PL PL09776908T patent/PL2257944T3/pl unknown
- 2009-07-09 TW TW098123191A patent/TWI459374B/zh active
- 2009-07-09 TW TW098123192A patent/TWI453732B/zh active
- 2009-07-09 TW TW098123194A patent/TWI451402B/zh active
- 2009-07-13 AR ARP090102627A patent/AR072498A1/es unknown
- 2009-07-13 AR ARP090102630A patent/AR072739A1/es active IP Right Grant
- 2009-07-13 AR ARP090102629A patent/AR072500A1/es active IP Right Grant
-
2011
- 2011-06-07 HK HK11105650.7A patent/HK1151619A1/xx unknown
- 2011-06-07 HK HK11105652.5A patent/HK1151620A1/xx unknown
- 2011-06-08 HK HK11105751.5A patent/HK1151883A1/xx unknown
-
2014
- 2014-01-27 JP JP2014012379A patent/JP6041815B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6041815B2 (ja) | 音声信号復号器、音声信号符号器、復号化されたマルチチャンネル音声信号表現の生成方法、符号化されたマルチチャンネル音声信号表現の生成方法およびコンピュータプログラム | |
BRPI0906319B1 (pt) | Decodificador de sinal de áudio, codificador de sinal de áudio, representação de sinal de áudio multi-canal codificado e métodos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150303 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150903 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160324 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20160610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161011 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6041815 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |