JP5302980B2 - 複数の入力データストリームのミキシングのための装置 - Google Patents
複数の入力データストリームのミキシングのための装置 Download PDFInfo
- Publication number
- JP5302980B2 JP5302980B2 JP2010549055A JP2010549055A JP5302980B2 JP 5302980 B2 JP5302980 B2 JP 5302980B2 JP 2010549055 A JP2010549055 A JP 2010549055A JP 2010549055 A JP2010549055 A JP 2010549055A JP 5302980 B2 JP5302980 B2 JP 5302980B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- output
- sbr
- spectral
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003595 spectral effect Effects 0.000 claims abstract description 234
- 238000012545 processing Methods 0.000 claims abstract description 72
- 238000001228 spectrum Methods 0.000 claims description 88
- 230000005236 sound signal Effects 0.000 claims description 86
- 238000000034 method Methods 0.000 claims description 54
- 230000001052 transient effect Effects 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 30
- 238000009499 grossing Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 description 30
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000009826 distribution Methods 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000005070 sampling Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000010606 normalization Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 239000010755 BS 2869 Class G Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Telephonic Communication Services (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Time-Division Multiplex Systems (AREA)
- Television Systems (AREA)
- Paper (AREA)
- Telephone Function (AREA)
- Communication Control (AREA)
- Amplifiers (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Image Processing (AREA)
Description
であり、数学的な同次性という性質を有しており、すなわち
であり、ここでf(x)は変換関数であり、x及びyはその適切な引数であり、aは実数値又は虚数値の定数である。
及び
に従って達成でき、比r(n)が、
に従って計算され、ここでnは、入力データストリームの添え字であり、Nは、全入力データストリーム又は関連の入力データストリームの数である。比r(n)が充分に大きい場合、入力データストリーム510のあまり支配的でないチャネル又はあまり支配的でないフレームが支配的なチャネル又はフレームによってマスクされていると考えることができる。したがって、無関係の削減を処理することができ、すなわち、ストリームのうちのとにかく顕著なスペクトル成分だけが含められる一方で、他のストリームは破棄される。
に従って達成でき、ここでakは、重み係数であり、Ek(n)は、nによって示される時間/周波数格子における位置に対応する入力データストリームkのエネルギー値である。E(n)は、同じ添え字nに対応する該当のSBRエネルギー値である。Nは、入力データストリームの数であり、図9A及び9Eに示した例では、2に等しい。
によって定義することができ、ここでrikは、入力フレーム540及び出力フレーム550のそれぞれの2つの時間/周波数領域630i及びkの重なり合いの領域を示す値である。Mは、入力フレーム540のすべての時間/周波数領域630の数であり、gは、例えばミキシングプロセスが値の許容範囲をオーバーシュート又はアンダーシュートするという結果を防止するために、1/Nに等しくてよい全体的な正規化係数である。係数rikは、0から1の間の範囲であってよく、0は、2つの時間/周波数領域630がまったく重なり合わないことを示し、1という値は、入力フレーム540の時間/周波数領域630が、出力フレーム550の該当の時間/周波数領域630に完全に含まれることを意味する。
110 入力
120 デコーダ
130 加算器
140 エンコーダ
150 出力
160 会議端末
170 エンコーダ
180 デコーダ
190 時間/周波数変換器
200 量子化器/コーダー
210 デコーダ/逆量子化器
220 周波数/時間変換器
250 データストリーム
260 フレーム
270 さらなる情報のブロック
300 周波数
310 周波数帯域
500 装置
510 入力データストリーム
520 処理ユニット
530 出力データストリーム
540 フレーム
550 出力フレーム
560 スペクトル情報表現
570 クロスオーバー周波数
580 スペクトルの下方部分
590 スペクトルの上方部分
600 線
610 スペクトルデータ
620 エンベロープ
630 時間/周波数領域
640 分析部
650 スペクトルミキサー
660 SBRミキサー
670 推定部
680 ミキサー
700 ビットストリームデコーダ
710 ビットストリーム読み取り部
720 ハフマンコーダー
730 デクオンタイザー
740 スケーラー
750 第1のユニット
760 第2のユニット
770 ステレオデコーダ
780 PNSデコーダ
790 TNSデコーダ
800 ミキシングユニット
810 スペクトルミキサー
820 最適化モジュール
830 SBRミキサー
850 ビットストリームエンコーダ
860 第3のユニット
870 TNSエンコーダ
880 PNSエンコーダ
890 ステレオエンコーダ
900 第4のユニット
910 スケーラー
920 量子化器
930 ハフマンコーダー
940 ビットストリームライタ
950 心理音響モジュール
1000 中間周波数範囲
Claims (16)
- 第1の入力データストリーム(510−1)の第1のフレーム(540−1)と第2の入力データストリーム(510−2)の第2のフレーム(540−2)とをミキシングして、出力データストリーム(530)の出力フレーム(550)を得るための装置(500)であって、
前記出力フレーム(550)を生成するように構成された処理ユニット(520)を備えており、
前記第1のフレーム(540−1)が、第1のオーディオ信号の第1のスペクトルについて第1のクロスオーバー周波数までの下方部分を記述する第1のスペクトルデータと、前記第1のスペクトルについて前記第1のクロスオーバー周波数から始まる上方部分を記述する第1のスペクトル帯域複製(SBR)データとを含んでおり、前記第2のフレーム(540−2)が、第2のオーディオ信号の第2のスペクトルについて第2のクロスオーバー周波数までの下方部分を記述する第2のスペクトルデータと、前記第2のスペクトルについて前記第2のクロスオーバー周波数から始まる上方部分を記述する第2のSBRデータとを含んでおり、前記第1及び第2のSBRデータが、前記第1及び第2のスペクトルのそれぞれの上方部分を、時間/周波数格子分解能におけるエネルギー関連の値によって記述しており、前記第1のクロスオーバー周波数が、前記第2のクロスオーバー周波数とは異なっており、
前記出力フレーム(550)が、出力スペクトルについて出力クロスオーバー周波数までの下方部分を記述する出力スペクトルデータを含むとともに、前記出力スペクトルについて前記出力クロスオーバー周波数よりも上の上方部分を、出力時間/周波数格子分解能におけるエネルギー関連の値によって記述する出力SBRデータをさらに含んでおり、
前記処理ユニット(520)は、前記第1のクロスオーバー周波数、前記第2のクロスオーバー周波数及び前記出力クロスオーバー周波数の最小値を下回る周波数に対応する前記出力スペクトルデータを、前記第1及び第2のスペクトルデータに基づいてスペクトル領域において生成するように構成されており、
前記処理ユニット(520)は、前記第1のクロスオーバー周波数、前記第2のクロスオーバー周波数及び前記出力クロスオーバー周波数の最大値を上回る周波数に対応する前記出力SBRデータを、前記第1及び第2のSBRデータに基づいてSBR領域において処理するようにさらに構成されており、
前記処理ユニット(520)は、前記最小値及び前記最大値の間の周波数領域について、第1及び第2のスペクトルデータの少なくとも一方から少なくとも1つのSBR値を推定し、前記出力SBRデータの該当のSBR値を少なくとも前記推定したSBR値に基づいて生成するようにさらに構成されている装置(500)。 - 前記処理ユニット(520)が、前記少なくとも1つのSBR値の推定を、該推定すべきSBR値に対応する周波数成分に対応するスペクトル値に基づいて行うように構成されている請求項1に記載の装置(500)。
- 第1の入力データストリーム(510−1)の第1のフレーム(540−1)と第2の入力データストリーム(510−2)の第2のフレーム(540−2)とをミキシングして、出力データストリーム(530)の出力フレーム(550)を得るための装置(500)であって、
前記出力フレーム(550)を生成するように構成された処理ユニット(520)を備えており、
前記第1のフレーム(540−1)が、第1のオーディオ信号の第1のスペクトルについて第1のクロスオーバー周波数までの下方部分を記述する第1のスペクトルデータと、前記第1のスペクトルについて前記第1のクロスオーバー周波数から始まる上方部分を記述する第1のスペクトル帯域複製(SBR)データとを含んでおり、前記第2のフレーム(540−2)が、第2のオーディオ信号の第2のスペクトルについて第2のクロスオーバー周波数までの下方部分を記述する第2のスペクトルデータと、前記第2のスペクトルについて前記第2のクロスオーバー周波数から始まる上方部分を記述する第2のSBRデータとを含んでおり、前記第1及び第2のSBRデータが、前記第1及び第2のスペクトルのそれぞれの上方部分を、時間/周波数格子分解能におけるエネルギー関連の値によって記述しており、前記第1のクロスオーバー周波数が、前記第2のクロスオーバー周波数とは異なっており、
前記出力フレーム(550)が、出力スペクトルについて出力クロスオーバー周波数までの下方部分を記述する出力スペクトルデータを含むとともに、前記出力スペクトルについて前記出力クロスオーバー周波数よりも上の上方部分を、出力時間/周波数格子分解能におけるエネルギー関連の値によって記述する出力SBRデータをさらに含んでおり、
前記処理ユニット(520)は、前記第1のクロスオーバー周波数、前記第2のクロスオーバー周波数及び前記出力クロスオーバー周波数の最小値を下回る周波数に対応する前記出力スペクトルデータを、前記第1及び第2のスペクトルデータに基づいてスペクトル領域において生成するように構成されており、
前記処理ユニット(520)は、前記第1のクロスオーバー周波数、前記第2のクロスオーバー周波数及び前記出力クロスオーバー周波数の最大値を上回る周波数に対応する前記出力SBRデータを、前記第1及び第2のSBRデータに基づいてSBR領域において処理するようにさらに構成されており、
さらに当該装置(500)は、前記最小値及び前記最大値の間の周波数領域について、前記第1及び第2のフレームの少なくとも一方からの少なくとも1つのスペクトル値を、該当のフレームの前記SBRデータに基づいて推定し、前記出力スペクトルデータの該当のスペクトル値を、少なくとも前記推定したスペクトル値に基づいて、該推定したスペクトル値をスペクトル領域において処理することによって生成するように構成されている装置(500)。 - 前記処理ユニットは、前記少なくとも1つのスペクトル値を、前記SBRデータ及び前記それぞれのフレームの前記それぞれのスペクトルの前記下方部分の前記スペクトルデータに基づいてスペクトル成分について少なくとも1つのスペクトル値を再現することに基づいて、推定するように構成されている請求項3に記載の装置。
- 前記処理ユニット(520)は、前記出力クロスオーバー周波数を前記第1のクロスオーバー周波数又は前記第2のクロスオーバー周波数になるように決定するように構成されている請求項1から4のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記出力クロスオーバー周波数を第1及び第2のクロスオーバー周波数のうちの低い方のクロスオーバー周波数へと設定し、又は前記出力クロスオーバー周波数を前記第1及び第2のクロスオーバー周波数のうちの高い方へと設定するように構成されている請求項1から5のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記出力時間/周波数格子分解能を、前記第1又は第2のフレームの前記時間/周波数格子分解能によって示される過渡の過渡位置に適合するように決定するように構成されている請求項1から6のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記第1及び第2のフレームの前記時間/周波数格子分解能が2つ以上の過渡の存在を示している場合に、前記時間/周波数格子分解能を、前記第1及び第2のフレームの前記時間/周波数格子分解能によって示される早い方の過渡に適合するように設定するように構成されている請求項7に記載の装置(500)。
- 前記処理ユニット(520)は、SBR周波数領域又はSBR領域における線形結合に基づいて、スペクトルデータ又はSBRデータを出力するように構成されている請求項1から8のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記第1及び第2のフレームの正弦曲線関連のSBRデータの線形結合に基づいて、正弦曲線関連のSBRデータを含む前記出力SBRデータを生成するように構成されている請求項1から9のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記第1及び第2のフレームのノイズ関連のSBRデータの線形結合に基づいて、ノイズ関連のSBRデータを含む前記出力SBRデータを生成するように構成されている請求項1から10のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記第1及び第2のフレームのそれぞれのSBRデータの関連性の心理音響的推定に基づく正弦曲線関連又はノイズ関連のSBRデータを含むように構成されている請求項10又は11に記載の装置(500)。
- 前記処理ユニット(520)は、平滑化フィルター処理に基づいて前記出力SBRデータを生成するように構成されている請求項1から12のいずれか一項に記載の装置(500)。
- 複数の入力データストリーム(510)を処理するように構成されており、該複数の入力データストリームが、3つ以上の入力データストリームを含んでおり、該複数の入力データストリームが、前記第1及び第2の入力データストリーム(510−1、510−2)を含んでいる請求項1から13のいずれか一項に記載の装置(500)。
- 第1の入力データストリーム(510−1)の第1のフレーム(540−1)と第2の入力データストリーム(510−2)の第2のフレーム(540−2)とをミキシングして出力データストリーム(530)の出力フレーム(550)を得るための方法であって、前記第1のフレームが、第1のオーディオ信号のスペクトルについて第1のクロスオーバー周波数までの下方部分を記述する第1のスペクトルデータと、前記スペクトルについて前記第1のクロスオーバー周波数から始まる上方部分を記述する第1のスペクトル帯域複製(SBR)データとを含んでおり、前記第2のフレームが、第2のオーディオ信号の第2のスペクトルについて第2のクロスオーバー周波数までの下方部分を記述する第2のスペクトルデータと、第2のスペクトルについて前記第2のクロスオーバー周波数から始まる上方部分を記述する第2のSBRデータとを含んでおり、前記第1及び第2のSBRデータが、前記それぞれのスペクトルの前記それぞれの上方部分を、時間/周波数格子分解能におけるエネルギー関連の値によって記述しており、前記第1のクロスオーバー周波数が、前記第2のクロスオーバー周波数とは異なっており、
当該方法は、
出力スペクトルの出力クロスオーバー周波数までの下方部分を記述する出力スペクトルデータを含むとともに、該出力スペクトルについて前記出力クロスオーバー周波数よりも上の上方部分を、出力時間/周波数格子分解能におけるエネルギー関連の値によって記述する出力SBRデータをさらに含む前記出力フレームを生成するステップ、
前記第1のクロスオーバー周波数、前記第2のクロスオーバー周波数及び出力クロスオーバー周波数の最小値を下回る周波数に対応するスペクトルデータを、前記第1及び第2のスペクトルデータに基づいてスペクトル領域において生成するステップ、
前記第1のクロスオーバー周波数、前記第2のクロスオーバー周波数及び前記出力クロスオーバー周波数の最大値を上回る周波数に対応する出力SBRデータを、前記第1及び第2のSBRデータに基づいてSBR領域において生成するステップ、並びに
前記最小値及び前記最大値の間の周波数領域の周波数について、第1及び第2のスペクトルデータの少なくとも一方から少なくとも1つのSBR値を推定し、前記出力SBRデータの該当のSBR値を少なくとも前記推定したSBR値に基づいて生成するステップ、又は
前記最小値及び前記最大値の間の周波数領域の周波数について、該当のフレームの前記SBRデータに基づいて前記第1及び第2のフレームの少なくとも一方からの少なくとも1つのスペクトル値を推定し、前記出力スペクトルデータのスペクトル値を、少なくとも前記推定したスペクトル値に基づいて、該推定したスペクトル値をスペクトル領域において処理することによって生成するステップを含んでいる方法。 - 第1の入力データストリームの第1のフレームと第2の入力データストリームの第2のフレームとのミキシングのための請求項15に記載の方法をプロセッサーに実行させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US3359008P | 2008-03-04 | 2008-03-04 | |
US61/033,590 | 2008-03-04 | ||
PCT/EP2009/001533 WO2009109373A2 (en) | 2008-03-04 | 2009-03-04 | Apparatus for mixing a plurality of input data streams |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011513780A JP2011513780A (ja) | 2011-04-28 |
JP5302980B2 true JP5302980B2 (ja) | 2013-10-02 |
Family
ID=41053617
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010549055A Active JP5302980B2 (ja) | 2008-03-04 | 2009-03-04 | 複数の入力データストリームのミキシングのための装置 |
JP2010549056A Active JP5536674B2 (ja) | 2008-03-04 | 2009-03-04 | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
JP2013095511A Active JP5654632B2 (ja) | 2008-03-04 | 2013-04-30 | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010549056A Active JP5536674B2 (ja) | 2008-03-04 | 2009-03-04 | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
JP2013095511A Active JP5654632B2 (ja) | 2008-03-04 | 2013-04-30 | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
Country Status (15)
Country | Link |
---|---|
US (2) | US8290783B2 (ja) |
EP (3) | EP2260487B1 (ja) |
JP (3) | JP5302980B2 (ja) |
KR (3) | KR101192241B1 (ja) |
CN (3) | CN102789782B (ja) |
AT (1) | ATE528747T1 (ja) |
AU (2) | AU2009221444B2 (ja) |
BR (2) | BRPI0906078B1 (ja) |
CA (2) | CA2717196C (ja) |
ES (3) | ES2374496T3 (ja) |
HK (1) | HK1149838A1 (ja) |
MX (1) | MX2010009666A (ja) |
PL (1) | PL2250641T3 (ja) |
RU (3) | RU2473140C2 (ja) |
WO (2) | WO2009109373A2 (ja) |
Families Citing this family (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101479011B1 (ko) * | 2008-12-17 | 2015-01-13 | 삼성전자주식회사 | 다중 대역 스케쥴링 방법 및 이를 이용한 방송 서비스 시스템 |
JP5423684B2 (ja) * | 2008-12-19 | 2014-02-19 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
JPWO2010125802A1 (ja) * | 2009-04-30 | 2012-10-25 | パナソニック株式会社 | デジタル音声通信制御装置及び方法 |
MY154641A (en) * | 2009-11-20 | 2015-07-15 | Fraunhofer Ges Forschung | Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear cimbination parameter |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
KR101370870B1 (ko) * | 2009-12-16 | 2014-03-07 | 돌비 인터네셔널 에이비 | Sbr 비트스트림 파라미터 다운믹스 |
US20110197740A1 (en) * | 2010-02-16 | 2011-08-18 | Chang Donald C D | Novel Karaoke and Multi-Channel Data Recording / Transmission Techniques via Wavefront Multiplexing and Demultiplexing |
RU2559899C2 (ru) * | 2010-04-09 | 2015-08-20 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
BR112012026324B1 (pt) * | 2010-04-13 | 2021-08-17 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V | Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
JP5957446B2 (ja) * | 2010-06-02 | 2016-07-27 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 音響処理システム及び方法 |
CN102568481B (zh) * | 2010-12-21 | 2014-11-26 | 富士通株式会社 | 用于实现aqmf处理的方法、和用于实现sqmf处理的方法 |
MY165853A (en) | 2011-02-14 | 2018-05-18 | Fraunhofer Ges Forschung | Linear prediction based coding scheme using spectral domain noise shaping |
TR201903388T4 (tr) | 2011-02-14 | 2019-04-22 | Fraunhofer Ges Forschung | Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi. |
EP2676268B1 (en) | 2011-02-14 | 2014-12-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
TWI483245B (zh) * | 2011-02-14 | 2015-05-01 | Fraunhofer Ges Forschung | 利用重疊變換之資訊信號表示技術 |
EP2676270B1 (en) | 2011-02-14 | 2017-02-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Coding a portion of an audio signal using a transient detection and a quality result |
JP5633431B2 (ja) * | 2011-03-02 | 2014-12-03 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US8891775B2 (en) | 2011-05-09 | 2014-11-18 | Dolby International Ab | Method and encoder for processing a digital stereo audio signal |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
EP3544006A1 (en) * | 2011-11-11 | 2019-09-25 | Dolby International AB | Upsampling using oversampled sbr |
US8615394B1 (en) * | 2012-01-27 | 2013-12-24 | Audience, Inc. | Restoration of noise-reduced speech |
EP2828855B1 (en) | 2012-03-23 | 2016-04-27 | Dolby Laboratories Licensing Corporation | Determining a harmonicity measure for voice processing |
WO2013142650A1 (en) | 2012-03-23 | 2013-09-26 | Dolby International Ab | Enabling sampling rate diversity in a voice communication system |
CN103325384A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 谐度估计、音频分类、音调确定及噪声估计 |
EP2709106A1 (en) * | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
WO2014068817A1 (ja) * | 2012-10-31 | 2014-05-08 | パナソニック株式会社 | オーディオ信号符号化装置及びオーディオ信号復号装置 |
KR101998712B1 (ko) | 2013-03-25 | 2019-10-02 | 삼성디스플레이 주식회사 | 표시장치, 표시장치를 위한 데이터 처리 장치 및 그 방법 |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
EP2838086A1 (en) | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
US9553601B2 (en) * | 2013-08-21 | 2017-01-24 | Keysight Technologies, Inc. | Conversion of analog signal into multiple time-domain data streams corresponding to different portions of frequency spectrum and recombination of those streams into single-time domain stream |
BR112016004299B1 (pt) | 2013-08-28 | 2022-05-17 | Dolby Laboratories Licensing Corporation | Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida |
US9866986B2 (en) | 2014-01-24 | 2018-01-09 | Sony Corporation | Audio speaker system with virtual music performance |
JP6224850B2 (ja) * | 2014-02-28 | 2017-11-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 会議における変化盲を使った知覚的連続性 |
JP6243770B2 (ja) * | 2014-03-25 | 2017-12-06 | 日本放送協会 | チャンネル数変換装置 |
DE112015004185T5 (de) | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
US10015006B2 (en) | 2014-11-05 | 2018-07-03 | Georgia Tech Research Corporation | Systems and methods for measuring side-channel signals for instruction-level events |
CN107210824A (zh) | 2015-01-30 | 2017-09-26 | 美商楼氏电子有限公司 | 麦克风的环境切换 |
TW202242853A (zh) * | 2015-03-13 | 2022-11-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
CN104735512A (zh) * | 2015-03-24 | 2015-06-24 | 无锡天脉聚源传媒科技有限公司 | 一种同步音频数据的方法、设备及系统 |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
CN105261373B (zh) * | 2015-09-16 | 2019-01-08 | 深圳广晟信源技术有限公司 | 用于带宽扩展编码的自适应栅格构造方法和装置 |
WO2017064264A1 (en) * | 2015-10-15 | 2017-04-20 | Huawei Technologies Co., Ltd. | Method and appratus for sinusoidal encoding and decoding |
EP3405950B1 (en) | 2016-01-22 | 2022-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Stereo audio coding with ild-based normalisation prior to mid/side decision |
US9826332B2 (en) * | 2016-02-09 | 2017-11-21 | Sony Corporation | Centralized wireless speaker system |
US9924291B2 (en) | 2016-02-16 | 2018-03-20 | Sony Corporation | Distributed wireless speaker system |
US9826330B2 (en) | 2016-03-14 | 2017-11-21 | Sony Corporation | Gimbal-mounted linear ultrasonic speaker assembly |
US10824629B2 (en) | 2016-04-01 | 2020-11-03 | Wavefront, Inc. | Query implementation using synthetic time series |
US10896179B2 (en) * | 2016-04-01 | 2021-01-19 | Wavefront, Inc. | High fidelity combination of data |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
EP3246923A1 (en) * | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a multichannel audio signal |
US9794724B1 (en) | 2016-07-20 | 2017-10-17 | Sony Corporation | Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating |
US9924286B1 (en) | 2016-10-20 | 2018-03-20 | Sony Corporation | Networked speaker system with LED-based wireless communication and personal identifier |
US10075791B2 (en) | 2016-10-20 | 2018-09-11 | Sony Corporation | Networked speaker system with LED-based wireless communication and room mapping |
US9854362B1 (en) | 2016-10-20 | 2017-12-26 | Sony Corporation | Networked speaker system with LED-based wireless communication and object detection |
US20180302454A1 (en) * | 2017-04-05 | 2018-10-18 | Interlock Concepts Inc. | Audio visual integration device |
IT201700040732A1 (it) * | 2017-04-12 | 2018-10-12 | Inst Rundfunktechnik Gmbh | Verfahren und vorrichtung zum mischen von n informationssignalen |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
CN109559736B (zh) * | 2018-12-05 | 2022-03-08 | 中国计量大学 | 一种基于对抗网络的电影演员自动配音方法 |
US11283853B2 (en) * | 2019-04-19 | 2022-03-22 | EMC IP Holding Company LLC | Generating a data stream with configurable commonality |
US11443737B2 (en) | 2020-01-14 | 2022-09-13 | Sony Corporation | Audio video translation into multiple languages for respective listeners |
CN111402907B (zh) * | 2020-03-13 | 2023-04-18 | 大连理工大学 | 一种基于g.722.1的多描述语音编码方法 |
US11662975B2 (en) * | 2020-10-06 | 2023-05-30 | Tencent America LLC | Method and apparatus for teleconference |
CN113468656B (zh) * | 2021-05-25 | 2023-04-14 | 北京临近空间飞行器系统工程研究所 | 基于pns计算流场的高速边界层转捩快速预示方法和系统 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69026278T3 (de) * | 1989-01-27 | 2002-08-08 | Dolby Lab Licensing Corp | Adaptiv Bitzuordnung für Audio-Koder und Dekoder |
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
US5488665A (en) * | 1993-11-23 | 1996-01-30 | At&T Corp. | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels |
JP3344575B2 (ja) * | 1998-11-16 | 2002-11-11 | 日本ビクター株式会社 | 記録媒体、音声復号装置 |
JP3173482B2 (ja) * | 1998-11-16 | 2001-06-04 | 日本ビクター株式会社 | 記録媒体、及びそれに記録された音声データの音声復号化装置 |
JP3344572B2 (ja) * | 1998-11-16 | 2002-11-11 | 日本ビクター株式会社 | 記録媒体、音声復号装置 |
JP3344574B2 (ja) * | 1998-11-16 | 2002-11-11 | 日本ビクター株式会社 | 記録媒体、音声復号装置 |
JP3387084B2 (ja) * | 1998-11-16 | 2003-03-17 | 日本ビクター株式会社 | 記録媒体、音声復号装置 |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US20030028386A1 (en) | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
US7469206B2 (en) * | 2001-11-29 | 2008-12-23 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
KR101016251B1 (ko) * | 2002-04-10 | 2011-02-25 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스테레오 신호의 코딩 |
US7039204B2 (en) | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
JP2005533271A (ja) * | 2002-07-16 | 2005-11-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化 |
KR101169596B1 (ko) * | 2003-04-17 | 2012-07-30 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 신호 합성 |
US7349436B2 (en) | 2003-09-30 | 2008-03-25 | Intel Corporation | Systems and methods for high-throughput wideband wireless local area network communications |
KR101106026B1 (ko) * | 2003-10-30 | 2012-01-17 | 돌비 인터네셔널 에이비 | 오디오 신호 인코딩 또는 디코딩 |
US20080260048A1 (en) * | 2004-02-16 | 2008-10-23 | Koninklijke Philips Electronics, N.V. | Transcoder and Method of Transcoding Therefore |
US8423372B2 (en) * | 2004-08-26 | 2013-04-16 | Sisvel International S.A. | Processing of encoded signals |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
JP2006197391A (ja) * | 2005-01-14 | 2006-07-27 | Toshiba Corp | 音声ミクシング処理装置及び音声ミクシング処理方法 |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
KR100791846B1 (ko) * | 2006-06-21 | 2008-01-07 | 주식회사 대우일렉트로닉스 | 오디오 복호기 |
CA2656867C (en) * | 2006-07-07 | 2013-01-08 | Johannes Hilpert | Apparatus and method for combining multiple parametrically coded audio sources |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
JP2008219549A (ja) * | 2007-03-06 | 2008-09-18 | Nec Corp | 信号処理の方法、装置、及びプログラム |
US7983916B2 (en) * | 2007-07-03 | 2011-07-19 | General Motors Llc | Sampling rate independent speech recognition |
RU2454736C2 (ru) * | 2007-10-15 | 2012-06-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство обработки сигнала |
JP5086366B2 (ja) * | 2007-10-26 | 2012-11-28 | パナソニック株式会社 | 会議端末装置、中継装置、および会議システム |
-
2009
- 2009-03-04 JP JP2010549055A patent/JP5302980B2/ja active Active
- 2009-03-04 CN CN201210232608.8A patent/CN102789782B/zh active Active
- 2009-03-04 JP JP2010549056A patent/JP5536674B2/ja active Active
- 2009-03-04 AU AU2009221444A patent/AU2009221444B2/en active Active
- 2009-03-04 PL PL09716202T patent/PL2250641T3/pl unknown
- 2009-03-04 CA CA2717196A patent/CA2717196C/en active Active
- 2009-03-04 BR BRPI0906078-2A patent/BRPI0906078B1/pt active IP Right Grant
- 2009-03-04 ES ES09716202T patent/ES2374496T3/es active Active
- 2009-03-04 ES ES09716835T patent/ES2753899T3/es active Active
- 2009-03-04 EP EP09716835.5A patent/EP2260487B1/en active Active
- 2009-03-04 AU AU2009221443A patent/AU2009221443B2/en active Active
- 2009-03-04 EP EP11162197.5A patent/EP2378518B1/en active Active
- 2009-03-04 RU RU2010136360/08A patent/RU2473140C2/ru active
- 2009-03-04 CN CN200980116080.4A patent/CN102016985B/zh active Active
- 2009-03-04 US US12/398,026 patent/US8290783B2/en active Active
- 2009-03-04 WO PCT/EP2009/001533 patent/WO2009109373A2/en active Application Filing
- 2009-03-04 RU RU2010136357/08A patent/RU2488896C2/ru active
- 2009-03-04 KR KR1020107021918A patent/KR101192241B1/ko active IP Right Grant
- 2009-03-04 MX MX2010009666A patent/MX2010009666A/es active IP Right Grant
- 2009-03-04 US US12/398,013 patent/US8116486B2/en active Active
- 2009-03-04 AT AT09716202T patent/ATE528747T1/de not_active IP Right Cessation
- 2009-03-04 ES ES11162197.5T patent/ES2665766T3/es active Active
- 2009-03-04 KR KR1020127005298A patent/KR101253278B1/ko active IP Right Grant
- 2009-03-04 EP EP09716202A patent/EP2250641B1/en active Active
- 2009-03-04 BR BRPI0906079-0A patent/BRPI0906079B1/pt active IP Right Grant
- 2009-03-04 CN CN200980114170XA patent/CN102016983B/zh active Active
- 2009-03-04 CA CA2716926A patent/CA2716926C/en active Active
- 2009-03-04 KR KR1020107022038A patent/KR101178114B1/ko active IP Right Grant
- 2009-03-04 RU RU2012128313/08A patent/RU2562395C2/ru active
- 2009-03-04 WO PCT/EP2009/001534 patent/WO2009109374A2/en active Application Filing
-
2011
- 2011-04-13 HK HK11103749.5A patent/HK1149838A1/xx unknown
-
2013
- 2013-04-30 JP JP2013095511A patent/JP5654632B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5302980B2 (ja) | 複数の入力データストリームのミキシングのための装置 | |
KR102230727B1 (ko) | 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법 | |
JP4521032B2 (ja) | 空間音声パラメータの効率的符号化のためのエネルギー対応量子化 | |
WO2010090019A1 (ja) | 結合装置、遠隔通信システム及び結合方法 | |
WO2014053537A1 (en) | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding | |
CA2821325C (en) | Mixing of input data streams and generation of an output data stream therefrom | |
AU2012202581B2 (en) | Mixing of input data streams and generation of an output data stream therefrom | |
Gbur et al. | Realtime implementation of an ISO/MPEG layer 3 encoder on Pentium PCs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121030 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130118 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130430 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130528 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5302980 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |