JP2011513780A - 複数の入力データストリームのミキシングのための装置 - Google Patents
複数の入力データストリームのミキシングのための装置 Download PDFInfo
- Publication number
- JP2011513780A JP2011513780A JP2010549055A JP2010549055A JP2011513780A JP 2011513780 A JP2011513780 A JP 2011513780A JP 2010549055 A JP2010549055 A JP 2010549055A JP 2010549055 A JP2010549055 A JP 2010549055A JP 2011513780 A JP2011513780 A JP 2011513780A
- Authority
- JP
- Japan
- Prior art keywords
- output
- frequency
- sbr
- data
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
Abstract
【選択図】図6A
Description
であり、数学的な同次性という性質を有しており、すなわち
であり、ここでf(x)は変換関数であり、x及びyはその適切な引数であり、aは実数値又は虚数値の定数である。
及び
に従って達成でき、比r(n)が、
に従って計算され、ここでnは、入力データストリームの添え字であり、Nは、全入力データストリーム又は関連の入力データストリームの数である。比r(n)が充分に大きい場合、入力データストリーム510のあまり支配的でないチャネル又はあまり支配的でないフレームが支配的なチャネル又はフレームによってマスクされていると考えることができる。したがって、無関係の削減を処理することができ、すなわち、ストリームのうちのとにかく顕著なスペクトル成分だけが含められる一方で、他のストリームは破棄される。
に従って達成でき、ここでakは、重み係数であり、Ek(n)は、nによって示される時間/周波数格子における位置に対応する入力データストリームkのエネルギー値である。E(n)は、同じ添え字nに対応する該当のSBRエネルギー値である。Nは、入力データストリームの数であり、図9A及び9Eに示した例では、2に等しい。
によって定義することができ、ここでrikは、入力フレーム540及び出力フレーム550のそれぞれの2つの時間/周波数領域630i及びkの重なり合いの領域を示す値である。Mは、入力フレーム540のすべての時間/周波数領域630の数であり、gは、例えばミキシングプロセスが値の許容範囲をオーバーシュート又はアンダーシュートするという結果を防止するために、1/Nに等しくてよい全体的な正規化係数である。係数rikは、0から1の間の範囲であってよく、0は、2つの時間/周波数領域630がまったく重なり合わないことを示し、1という値は、入力フレーム540の時間/周波数領域630が、出力フレーム550の該当の時間/周波数領域630に完全に含まれることを意味する。
110 入力
120 デコーダ
130 加算器
140 エンコーダ
150 出力
160 会議端末
170 エンコーダ
180 デコーダ
190 時間/周波数変換器
200 量子化器/コーダー
210 デコーダ/逆量子化器
220 周波数/時間変換器
250 データストリーム
260 フレーム
270 さらなる情報のブロック
300 周波数
310 周波数帯域
500 装置
510 入力データストリーム
520 処理ユニット
530 出力データストリーム
540 フレーム
550 出力フレーム
560 スペクトル情報表現
570 クロスオーバー周波数
580 スペクトルの下方部分
590 スペクトルの上方部分
600 線
610 スペクトルデータ
620 エンベロープ
630 時間/周波数領域
640 分析部
650 スペクトルミキサー
660 SBRミキサー
670 推定部
680 ミキサー
700 ビットストリームデコーダ
710 ビットストリーム読み取り部
720 ハフマンコーダー
730 デクオンタイザー
740 スケーラー
750 第1のユニット
760 第2のユニット
770 ステレオデコーダ
780 PNSデコーダ
790 TNSデコーダ
800 ミキシングユニット
810 スペクトルミキサー
820 最適化モジュール
830 SBRミキサー
850 ビットストリームエンコーダ
860 第3のユニット
870 TNSエンコーダ
880 PNSエンコーダ
890 ステレオエンコーダ
900 第4のユニット
910 スケーラー
920 量子化器
930 ハフマンコーダー
940 ビットストリームライタ
950 心理音響モジュール
1000 中間周波数範囲
Claims (16)
- 第1の入力データストリーム(510−1)の第1のフレーム(540−1)と第2の入力データストリーム(510−2)の第2のフレーム(540−2)とをミキシングして、出力データストリーム(530)の出力フレーム(550)を得るための装置(500)であって、
前記出力フレーム(550)を生成するように構成された処理ユニット(520)を備えており、
前記第1のフレーム(540−1)が、第1のオーディオ信号の第1のスペクトルについて第1のクロスオーバー周波数(570)までの下方部分(580)を記述する第1のスペクトルデータと、前記第1のスペクトルについて前記第1のクロスオーバー周波数(570)から始まる上方部分(590)を記述する第1のスペクトル帯域複製(SBR)データとを含んでおり、前記第2のフレーム(540−2)が、第2のオーディオ信号の第2のスペクトルについて第2のクロスオーバー周波数(570)までの下方部分(580)を記述する第2のスペクトルデータと、前記第2のスペクトルについて前記第2のクロスオーバー周波数(570)から始まる上方部分(590)を記述する第2のSBRデータとを含んでおり、前記第1及び第2のSBRデータが、前記第1及び第2のスペクトルのそれぞれの上方部分(590)を、時間/周波数格子分解能におけるエネルギー関連の値によって記述しており、前記第1のクロスオーバー周波数(570)が、前記第2のクロスオーバー周波数(570)とは異なっており、
前記出力フレーム(550)が、出力スペクトルについて出力クロスオーバー周波数(570)までの下方部分(580)を記述する出力スペクトルデータを含むとともに、前記出力スペクトルについて前記出力クロスオーバー周波数(570)よりも上の上方部分(590)を、出力時間/周波数格子分解能におけるエネルギー関連の値によって記述する出力SBRデータをさらに含んでおり、
前記処理ユニット(520)は、前記第1のクロスオーバー周波数(570)、前記第2のクロスオーバー周波数(570)及び前記出力クロスオーバー周波数(570)の最小値を下回る周波数に対応する前記出力スペクトルデータを、前記第1及び第2のスペクトルデータに基づいてスペクトル領域において生成するように構成されており、
前記処理ユニット(520)は、前記第1のクロスオーバー周波数(570)、前記第2のクロスオーバー周波数(570)及び前記出力クロスオーバー周波数(570)の最大値を上回る周波数に対応する前記出力SBRデータを、前記第1及び第2のSBRデータに基づいてSBR領域において処理するようにさらに構成されており、
前記処理ユニット(520)は、前記最小値及び前記最大値の間の周波数領域について、第1及び第2のスペクトルデータの少なくとも一方から少なくとも1つのSBR値を推定し、前記出力SBRデータの該当のSBR値を少なくとも前記推定したSBR値に基づいて生成するようにさらに構成されている装置(500)。 - 前記処理ユニット(520)が、前記少なくとも1つのSBR値の推定を、該推定すべきSBR値に対応する周波数成分に対応するスペクトル値に基づいて行うように構成されている請求項1に記載の装置(500)。
- 第1の入力データストリーム(510−1)の第1のフレーム(540−1)と第2の入力データストリーム(510−2)の第2のフレーム(540−2)とをミキシングして、出力データストリーム(530)の出力フレーム(550)を得るための装置(500)であって、
前記出力フレーム(550)を生成するように構成された処理ユニット(520)を備えており、
前記第1のフレーム(540−1)が、第1のオーディオ信号の第1のスペクトルについて第1のクロスオーバー周波数(570)までの下方部分(580)を記述する第1のスペクトルデータと、前記第1のスペクトルについて前記第1のクロスオーバー周波数(570)から始まる上方部分(590)を記述する第1のスペクトル帯域複製(SBR)データとを含んでおり、前記第2のフレーム(540−2)が、第2のオーディオ信号の第2のスペクトルについて第2のクロスオーバー周波数(570)までの下方部分(580)を記述する第2のスペクトルデータと、前記第2のスペクトルについて前記第2のクロスオーバー周波数(570)から始まる上方部分(590)を記述する第2のSBRデータとを含んでおり、前記第1及び第2のSBRデータが、前記第1及び第2のスペクトルのそれぞれの上方部分(590)を、時間/周波数格子分解能におけるエネルギー関連の値によって記述しており、前記第1のクロスオーバー周波数(570)が、前記第2のクロスオーバー周波数(570)とは異なっており、
前記出力フレーム(550)が、出力スペクトルについて出力クロスオーバー周波数(570)までの下方部分(580)を記述する出力スペクトルデータを含むとともに、前記出力スペクトルについて前記出力クロスオーバー周波数(570)よりも上の上方部分(590)を、出力時間/周波数格子分解能におけるエネルギー関連の値によって記述する出力SBRデータをさらに含んでおり、
前記処理ユニット(520)は、前記第1のクロスオーバー周波数(570)、前記第2のクロスオーバー周波数(570)及び前記出力クロスオーバー周波数(570)の最小値を下回る周波数に対応する前記出力スペクトルデータを、前記第1及び第2のスペクトルデータに基づいてスペクトル領域において生成するように構成されており、
前記処理ユニット(520)は、前記第1のクロスオーバー周波数(570)、前記第2のクロスオーバー周波数(570)及び前記出力クロスオーバー周波数(570)の最大値を上回る周波数に対応する前記出力SBRデータを、前記第1及び第2のSBRデータに基づいてSBR領域において処理するようにさらに構成されており、
さらに当該装置(500)は、前記最小値及び前記最大値の間の周波数領域について、前記第1及び第2のフレームの少なくとも一方からの少なくとも1つのスペクトル値を、該当のフレームの前記SBRデータに基づいて推定し、前記出力スペクトルデータの該当のスペクトル値を、少なくとも前記推定したスペクトル値に基づいて、該推定したスペクトル値をスペクトル領域において処理することによって生成するように構成されている装置(500)。 - 前記処理ユニットは、前記少なくとも1つのスペクトル値を、前記SBRデータ及び前記それぞれのフレームの前記それぞれのスペクトルの前記下方部分の前記スペクトルデータに基づいてスペクトル成分について少なくとも1つのスペクトル値を再現することに基づいて、推定するように構成されている請求項3に記載の装置。
- 前記処理ユニット(520)は、前記出力クロスオーバー周波数(570)を前記第1のクロスオーバー周波数又は前記第2のクロスオーバー周波数になるように決定するように構成されている請求項1から4のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記出力クロスオーバー周波数を第1及び第2のクロスオーバー周波数のうちの低い方のクロスオーバー周波数へと設定し、又は前記出力クロスオーバー周波数を前記第1及び第2のクロスオーバー周波数のうちの高い方へと設定するように構成されている請求項1から5のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記出力時間/周波数格子分解能を、前記第1又は第2のフレームの前記時間/周波数格子分解能によって示される過渡の過渡位置に適合するように決定するように構成されている請求項1から6のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記第1及び第2のフレームの前記時間/周波数格子分解能が2つ以上の過渡の存在を示している場合に、前記時間/周波数格子分解能を、前記第1及び第2のフレームの前記時間/周波数格子分解能によって示される早い方の過渡に適合するように設定するように構成されている請求項7に記載の装置(500)。
- 前記処理ユニット(520)は、SBR周波数領域又はSBR領域における線形結合に基づいて、スペクトルデータ又はSBRデータを出力するように構成されている請求項1から8のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記第1及び第2のフレームの正弦曲線関連のSBRデータの線形結合に基づいて、正弦曲線関連のSBRデータを含む前記出力SBRデータを生成するように構成されている請求項1から9のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記第1及び第2のフレームのノイズ関連のSBRデータの線形結合に基づいて、ノイズ関連のSBRデータを含む前記出力SBRデータを生成するように構成されている請求項1から10のいずれか一項に記載の装置(500)。
- 前記処理ユニット(520)は、前記第1及び第2のフレームのそれぞれのSBRデータの関連性の心理音響的推定に基づく正弦曲線関連又はノイズ関連のSBRデータを含むように構成されている請求項10又は11に記載の装置(500)。
- 前記処理ユニット(520)は、平滑化フィルター処理に基づいて前記出力SBRデータを生成するように構成されている請求項1から12のいずれか一項に記載の装置(500)。
- 複数の入力データストリーム(510)を処理するように構成されており、該複数の入力データストリームが、3つ以上の入力データストリームを含んでおり、該複数の入力データストリームが、前記第1及び第2の入力データストリーム(510−1、510−2)を含んでいる請求項1から13のいずれか一項に記載の装置(500)。
- 第1の入力データストリーム(510−1)の第1のフレーム(540−1)と第2の入力データストリーム(510−1)の第2のフレーム(540−2)とをミキシングして出力データストリーム(530)の出力フレーム(550)を得るための方法であって、前記第1のフレームが、第1のオーディオ信号のスペクトルについて第1のクロスオーバー周波数(570)までの下方部分(580)を記述する第1のスペクトルデータと、前記スペクトルについて前記第1のクロスオーバー周波数から始まる上方部分(590)を記述する第1のスペクトル帯域複製(SBR)データとを含んでおり、前記第2のフレームが、第2のオーディオ信号の第2のスペクトルについて第2のクロスオーバー周波数までの下方部分を記述する第2のスペクトルデータと、第2のスペクトルについて前記第2のクロスオーバー周波数から始まる上方部分を記述する第2のSBRデータとを含んでおり、前記第1及び第2のSBRデータが、前記それぞれのスペクトルの前記それぞれの上方部分を、時間/周波数格子分解能におけるエネルギー関連の値によって記述しており、前記第1のクロスオーバー周波数が、前記第2のクロスオーバー周波数とは異なっており、
当該方法は、
出力スペクトルの出力クロスオーバー周波数までの下方部分を記述する出力スペクトルデータを含むとともに、該出力スペクトルについて前記出力クロスオーバー周波数よりも上の上方部分を、出力時間/周波数格子分解能におけるエネルギー関連の値によって記述する出力SBRデータをさらに含む前記出力フレームを生成するステップ、
前記第1のクロスオーバー周波数、前記第2のクロスオーバー周波数及び出力クロスオーバー周波数の最小値を下回る周波数に対応するスペクトルデータを、前記第1及び第2のスペクトルデータに基づいてスペクトル領域において生成するステップ、
前記第1のクロスオーバー周波数、前記第2のクロスオーバー周波数及び前記出力クロスオーバー周波数の最大値を上回る周波数に対応する出力SBRデータを、前記第1及び第2のSBRデータに基づいてSBR領域において生成するステップ、並びに
前記最小値及び前記最大値の間の周波数領域の周波数について、第1及び第2のスペクトルデータの少なくとも一方から少なくとも1つのSBR値を推定し、前記出力SBRデータの該当のSBR値を少なくとも前記推定したSBR値に基づいて生成するステップ、又は
前記最小値及び前記最大値の間の周波数領域の周波数について、該当のフレームの前記SBRデータに基づいて前記第1及び第2のフレームの少なくとも一方からの少なくとも1つのスペクトル値を推定し、前記出力スペクトルデータのスペクトル値を、少なくとも前記推定したスペクトル値に基づいて、該推定したスペクトル値をスペクトル領域において処理することによって生成するステップを含んでいる方法。 - プロセッサー上で動作するときに、第1の入力データストリームの第1のフレームと第2の入力データストリームの第2のフレームとのミキシングのための請求項15に記載の方法を実行するプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US3359008P | 2008-03-04 | 2008-03-04 | |
US61/033,590 | 2008-03-04 | ||
PCT/EP2009/001533 WO2009109373A2 (en) | 2008-03-04 | 2009-03-04 | Apparatus for mixing a plurality of input data streams |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011513780A true JP2011513780A (ja) | 2011-04-28 |
JP5302980B2 JP5302980B2 (ja) | 2013-10-02 |
Family
ID=41053617
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010549056A Active JP5536674B2 (ja) | 2008-03-04 | 2009-03-04 | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
JP2010549055A Active JP5302980B2 (ja) | 2008-03-04 | 2009-03-04 | 複数の入力データストリームのミキシングのための装置 |
JP2013095511A Active JP5654632B2 (ja) | 2008-03-04 | 2013-04-30 | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010549056A Active JP5536674B2 (ja) | 2008-03-04 | 2009-03-04 | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013095511A Active JP5654632B2 (ja) | 2008-03-04 | 2013-04-30 | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
Country Status (15)
Country | Link |
---|---|
US (2) | US8290783B2 (ja) |
EP (3) | EP2250641B1 (ja) |
JP (3) | JP5536674B2 (ja) |
KR (3) | KR101178114B1 (ja) |
CN (3) | CN102016985B (ja) |
AT (1) | ATE528747T1 (ja) |
AU (2) | AU2009221443B2 (ja) |
BR (2) | BRPI0906079B1 (ja) |
CA (2) | CA2716926C (ja) |
ES (3) | ES2753899T3 (ja) |
HK (1) | HK1149838A1 (ja) |
MX (1) | MX2010009666A (ja) |
PL (1) | PL2250641T3 (ja) |
RU (3) | RU2488896C2 (ja) |
WO (2) | WO2009109374A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013527727A (ja) * | 2010-06-02 | 2013-06-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音響処理システム及び方法 |
WO2014068817A1 (ja) * | 2012-10-31 | 2014-05-08 | パナソニック株式会社 | オーディオ信号符号化装置及びオーディオ信号復号装置 |
Families Citing this family (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101479011B1 (ko) * | 2008-12-17 | 2015-01-13 | 삼성전자주식회사 | 다중 대역 스케쥴링 방법 및 이를 이용한 방송 서비스 시스템 |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
WO2010125802A1 (ja) * | 2009-04-30 | 2010-11-04 | パナソニック株式会社 | デジタル音声通信制御装置及び方法 |
JP5645951B2 (ja) * | 2009-11-20 | 2014-12-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
BR112012014856B1 (pt) | 2009-12-16 | 2022-10-18 | Dolby International Ab | Método para fundir conjuntos de fonte de parâmetros de sbr a conjuntos-alvo de parâmetros de sbr, meio de armazenamento não transitório e unidade de fusão de parâmetros de sbr |
US20110197740A1 (en) * | 2010-02-16 | 2011-08-18 | Chang Donald C D | Novel Karaoke and Multi-Channel Data Recording / Transmission Techniques via Wavefront Multiplexing and Demultiplexing |
TR201901336T4 (tr) | 2010-04-09 | 2019-02-21 | Dolby Int Ab | Mdct-tabanlı karmaşık tahmin stereo kodlama. |
ES2953084T3 (es) * | 2010-04-13 | 2023-11-08 | Fraunhofer Ges Forschung | Decodificador de audio para procesar audio estéreo usando una dirección de predicción variable |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
CN102568481B (zh) * | 2010-12-21 | 2014-11-26 | 富士通株式会社 | 用于实现aqmf处理的方法、和用于实现sqmf处理的方法 |
AR085794A1 (es) | 2011-02-14 | 2013-10-30 | Fraunhofer Ges Forschung | Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral |
AU2012217158B2 (en) * | 2011-02-14 | 2014-02-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Information signal representation using lapped transform |
TR201903388T4 (tr) | 2011-02-14 | 2019-04-22 | Fraunhofer Ges Forschung | Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi. |
WO2012110448A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
SG192746A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for processing a decoded audio signal in a spectral domain |
JP5633431B2 (ja) * | 2011-03-02 | 2014-12-03 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US8891775B2 (en) | 2011-05-09 | 2014-11-18 | Dolby International Ab | Method and encoder for processing a digital stereo audio signal |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
CN103918029B (zh) * | 2011-11-11 | 2016-01-20 | 杜比国际公司 | 使用过采样谱带复制的上采样 |
US8615394B1 (en) * | 2012-01-27 | 2013-12-24 | Audience, Inc. | Restoration of noise-reduced speech |
EP2828855B1 (en) | 2012-03-23 | 2016-04-27 | Dolby Laboratories Licensing Corporation | Determining a harmonicity measure for voice processing |
CN103325384A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 谐度估计、音频分类、音调确定及噪声估计 |
WO2013142650A1 (en) | 2012-03-23 | 2013-09-26 | Dolby International Ab | Enabling sampling rate diversity in a voice communication system |
EP2709106A1 (en) * | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
KR101998712B1 (ko) | 2013-03-25 | 2019-10-02 | 삼성디스플레이 주식회사 | 표시장치, 표시장치를 위한 데이터 처리 장치 및 그 방법 |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
EP2838086A1 (en) * | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
US9553601B2 (en) * | 2013-08-21 | 2017-01-24 | Keysight Technologies, Inc. | Conversion of analog signal into multiple time-domain data streams corresponding to different portions of frequency spectrum and recombination of those streams into single-time domain stream |
BR112016004299B1 (pt) * | 2013-08-28 | 2022-05-17 | Dolby Laboratories Licensing Corporation | Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida |
US9866986B2 (en) | 2014-01-24 | 2018-01-09 | Sony Corporation | Audio speaker system with virtual music performance |
JP6224850B2 (ja) | 2014-02-28 | 2017-11-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 会議における変化盲を使った知覚的連続性 |
JP6243770B2 (ja) * | 2014-03-25 | 2017-12-06 | 日本放送協会 | チャンネル数変換装置 |
WO2016040885A1 (en) | 2014-09-12 | 2016-03-17 | Audience, Inc. | Systems and methods for restoration of speech components |
US10015006B2 (en) | 2014-11-05 | 2018-07-03 | Georgia Tech Research Corporation | Systems and methods for measuring side-channel signals for instruction-level events |
US9668048B2 (en) | 2015-01-30 | 2017-05-30 | Knowles Electronics, Llc | Contextual switching of microphones |
TWI758146B (zh) | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
CN104735512A (zh) * | 2015-03-24 | 2015-06-24 | 无锡天脉聚源传媒科技有限公司 | 一种同步音频数据的方法、设备及系统 |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
CN105261373B (zh) * | 2015-09-16 | 2019-01-08 | 深圳广晟信源技术有限公司 | 用于带宽扩展编码的自适应栅格构造方法和装置 |
WO2017064264A1 (en) * | 2015-10-15 | 2017-04-20 | Huawei Technologies Co., Ltd. | Method and appratus for sinusoidal encoding and decoding |
MX2018008886A (es) * | 2016-01-22 | 2018-11-09 | Fraunhofer Ges Zur Foerderung Der Angewandten Forscng E V | Aparato y metodo para estereo mdct m/s con ild global con decision medio/lado mejorada. |
US9826332B2 (en) * | 2016-02-09 | 2017-11-21 | Sony Corporation | Centralized wireless speaker system |
US9924291B2 (en) | 2016-02-16 | 2018-03-20 | Sony Corporation | Distributed wireless speaker system |
US9826330B2 (en) | 2016-03-14 | 2017-11-21 | Sony Corporation | Gimbal-mounted linear ultrasonic speaker assembly |
US10824629B2 (en) | 2016-04-01 | 2020-11-03 | Wavefront, Inc. | Query implementation using synthetic time series |
US10896179B2 (en) * | 2016-04-01 | 2021-01-19 | Wavefront, Inc. | High fidelity combination of data |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
EP3246923A1 (en) * | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a multichannel audio signal |
US9794724B1 (en) | 2016-07-20 | 2017-10-17 | Sony Corporation | Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating |
US9924286B1 (en) | 2016-10-20 | 2018-03-20 | Sony Corporation | Networked speaker system with LED-based wireless communication and personal identifier |
US9854362B1 (en) | 2016-10-20 | 2017-12-26 | Sony Corporation | Networked speaker system with LED-based wireless communication and object detection |
US10075791B2 (en) | 2016-10-20 | 2018-09-11 | Sony Corporation | Networked speaker system with LED-based wireless communication and room mapping |
US20180302454A1 (en) * | 2017-04-05 | 2018-10-18 | Interlock Concepts Inc. | Audio visual integration device |
IT201700040732A1 (it) * | 2017-04-12 | 2018-10-12 | Inst Rundfunktechnik Gmbh | Verfahren und vorrichtung zum mischen von n informationssignalen |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
CN109559736B (zh) * | 2018-12-05 | 2022-03-08 | 中国计量大学 | 一种基于对抗网络的电影演员自动配音方法 |
US11283853B2 (en) * | 2019-04-19 | 2022-03-22 | EMC IP Holding Company LLC | Generating a data stream with configurable commonality |
US11443737B2 (en) | 2020-01-14 | 2022-09-13 | Sony Corporation | Audio video translation into multiple languages for respective listeners |
CN111402907B (zh) * | 2020-03-13 | 2023-04-18 | 大连理工大学 | 一种基于g.722.1的多描述语音编码方法 |
US11662975B2 (en) * | 2020-10-06 | 2023-05-30 | Tencent America LLC | Method and apparatus for teleconference |
CN113468656B (zh) * | 2021-05-25 | 2023-04-14 | 北京临近空间飞行器系统工程研究所 | 基于pns计算流场的高速边界层转捩快速预示方法和系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007514962A (ja) * | 2003-10-30 | 2007-06-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号のエンコードまたはデコード |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK0513860T3 (da) * | 1989-01-27 | 1997-08-18 | Dolby Lab Licensing Corp | Adaptiv biallokering for audiokoder og -dekoder |
US5463424A (en) | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
US5488665A (en) * | 1993-11-23 | 1996-01-30 | At&T Corp. | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels |
JP3173482B2 (ja) * | 1998-11-16 | 2001-06-04 | 日本ビクター株式会社 | 記録媒体、及びそれに記録された音声データの音声復号化装置 |
JP3344574B2 (ja) * | 1998-11-16 | 2002-11-11 | 日本ビクター株式会社 | 記録媒体、音声復号装置 |
JP3344575B2 (ja) * | 1998-11-16 | 2002-11-11 | 日本ビクター株式会社 | 記録媒体、音声復号装置 |
JP3344572B2 (ja) * | 1998-11-16 | 2002-11-11 | 日本ビクター株式会社 | 記録媒体、音声復号装置 |
JP3387084B2 (ja) * | 1998-11-16 | 2003-03-17 | 日本ビクター株式会社 | 記録媒体、音声復号装置 |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US20030028386A1 (en) | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
BR0304231A (pt) * | 2002-04-10 | 2004-07-27 | Koninkl Philips Electronics Nv | Métodos para codificação de um sinal de canais múltiplos, método e disposição para decodificação de informação de sinal de canais múltiplos, sinal de dados incluindo informação de sinal de canais múltiplos, meio legìvel por computador, e, dispositivo para comunicação de um sinal de canais múltiplos |
US7039204B2 (en) * | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
RU2325046C2 (ru) * | 2002-07-16 | 2008-05-20 | Конинклейке Филипс Электроникс Н.В. | Аудиокодирование |
US8311809B2 (en) * | 2003-04-17 | 2012-11-13 | Koninklijke Philips Electronics N.V. | Converting decoded sub-band signal into a stereo signal |
US7349436B2 (en) | 2003-09-30 | 2008-03-25 | Intel Corporation | Systems and methods for high-throughput wideband wireless local area network communications |
JP2007524124A (ja) * | 2004-02-16 | 2007-08-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | トランスコーダ及びそのための符号変換方法 |
US8423372B2 (en) | 2004-08-26 | 2013-04-16 | Sisvel International S.A. | Processing of encoded signals |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
JP2006197391A (ja) * | 2005-01-14 | 2006-07-27 | Toshiba Corp | 音声ミクシング処理装置及び音声ミクシング処理方法 |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
KR100791846B1 (ko) * | 2006-06-21 | 2008-01-07 | 주식회사 대우일렉트로닉스 | 오디오 복호기 |
JP5134623B2 (ja) * | 2006-07-07 | 2013-01-30 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 複数のパラメータ的に符号化された音源を合成するための概念 |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
JP2008219549A (ja) * | 2007-03-06 | 2008-09-18 | Nec Corp | 信号処理の方法、装置、及びプログラム |
US7983916B2 (en) * | 2007-07-03 | 2011-07-19 | General Motors Llc | Sampling rate independent speech recognition |
WO2009051401A2 (en) * | 2007-10-15 | 2009-04-23 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
JP5086366B2 (ja) * | 2007-10-26 | 2012-11-28 | パナソニック株式会社 | 会議端末装置、中継装置、および会議システム |
-
2009
- 2009-03-04 RU RU2010136357/08A patent/RU2488896C2/ru active
- 2009-03-04 EP EP09716202A patent/EP2250641B1/en active Active
- 2009-03-04 JP JP2010549056A patent/JP5536674B2/ja active Active
- 2009-03-04 US US12/398,026 patent/US8290783B2/en active Active
- 2009-03-04 RU RU2012128313/08A patent/RU2562395C2/ru active
- 2009-03-04 US US12/398,013 patent/US8116486B2/en active Active
- 2009-03-04 AU AU2009221443A patent/AU2009221443B2/en active Active
- 2009-03-04 AU AU2009221444A patent/AU2009221444B2/en active Active
- 2009-03-04 CN CN200980116080.4A patent/CN102016985B/zh active Active
- 2009-03-04 EP EP11162197.5A patent/EP2378518B1/en active Active
- 2009-03-04 KR KR1020107022038A patent/KR101178114B1/ko active IP Right Grant
- 2009-03-04 ES ES09716835T patent/ES2753899T3/es active Active
- 2009-03-04 PL PL09716202T patent/PL2250641T3/pl unknown
- 2009-03-04 EP EP09716835.5A patent/EP2260487B1/en active Active
- 2009-03-04 MX MX2010009666A patent/MX2010009666A/es active IP Right Grant
- 2009-03-04 JP JP2010549055A patent/JP5302980B2/ja active Active
- 2009-03-04 AT AT09716202T patent/ATE528747T1/de not_active IP Right Cessation
- 2009-03-04 ES ES09716202T patent/ES2374496T3/es active Active
- 2009-03-04 ES ES11162197.5T patent/ES2665766T3/es active Active
- 2009-03-04 CA CA2716926A patent/CA2716926C/en active Active
- 2009-03-04 BR BRPI0906079-0A patent/BRPI0906079B1/pt active IP Right Grant
- 2009-03-04 CN CN200980114170XA patent/CN102016983B/zh active Active
- 2009-03-04 KR KR1020107021918A patent/KR101192241B1/ko active IP Right Grant
- 2009-03-04 KR KR1020127005298A patent/KR101253278B1/ko active IP Right Grant
- 2009-03-04 BR BRPI0906078-2A patent/BRPI0906078B1/pt active IP Right Grant
- 2009-03-04 CN CN201210232608.8A patent/CN102789782B/zh active Active
- 2009-03-04 WO PCT/EP2009/001534 patent/WO2009109374A2/en active Application Filing
- 2009-03-04 WO PCT/EP2009/001533 patent/WO2009109373A2/en active Application Filing
- 2009-03-04 CA CA2717196A patent/CA2717196C/en active Active
- 2009-03-04 RU RU2010136360/08A patent/RU2473140C2/ru active
-
2011
- 2011-04-13 HK HK11103749.5A patent/HK1149838A1/xx unknown
-
2013
- 2013-04-30 JP JP2013095511A patent/JP5654632B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007514962A (ja) * | 2003-10-30 | 2007-06-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号のエンコードまたはデコード |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013527727A (ja) * | 2010-06-02 | 2013-06-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音響処理システム及び方法 |
WO2014068817A1 (ja) * | 2012-10-31 | 2014-05-08 | パナソニック株式会社 | オーディオ信号符号化装置及びオーディオ信号復号装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5302980B2 (ja) | 複数の入力データストリームのミキシングのための装置 | |
KR102230727B1 (ko) | 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법 | |
US7573912B2 (en) | Near-transparent or transparent multi-channel encoder/decoder scheme | |
JP2008517339A (ja) | 空間音声パラメータの効率的符号化のためのエネルギー対応量子化 | |
WO2014053537A1 (en) | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding | |
CA2821325C (en) | Mixing of input data streams and generation of an output data stream therefrom | |
AU2012202581B2 (en) | Mixing of input data streams and generation of an output data stream therefrom | |
Gbur et al. | Realtime implementation of an ISO/MPEG layer 3 encoder on Pentium PCs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121030 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130118 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130430 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130528 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5302980 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |