JP5818913B2 - 音声信号フレームにおけるイベントのスロット位置の符号化および復号化 - Google Patents
音声信号フレームにおけるイベントのスロット位置の符号化および復号化 Download PDFInfo
- Publication number
- JP5818913B2 JP5818913B2 JP2013549787A JP2013549787A JP5818913B2 JP 5818913 B2 JP5818913 B2 JP 5818913B2 JP 2013549787 A JP2013549787 A JP 2013549787A JP 2013549787 A JP2013549787 A JP 2013549787A JP 5818913 B2 JP5818913 B2 JP 5818913B2
- Authority
- JP
- Japan
- Prior art keywords
- event
- slot
- frame
- slots
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 80
- 238000000034 method Methods 0.000 claims description 75
- 230000001052 transient effect Effects 0.000 claims description 69
- 238000012360 testing method Methods 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000005192 partition Methods 0.000 description 38
- 230000008569 process Effects 0.000 description 27
- 238000012545 processing Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 7
- 238000007792 addition Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Description
− ラティスオールパス非相関器の前のQMF領域のトランジェントを分離する:すなわち、トランジェントストリームs2および非トランジェントストリームs1に非相関化された入力信号を分割する。
− トランジェントミクスチャに対して適切である異なるパラメータ制御された非相関器にトランジェントストリームを送り込む。
− MPSオールパス非相関器に非トランジェントストリームを送り込む。
− 非相関化された信号Dを得るために、両方の非相関D1およびD2の出力を加える。
− エンコーダにおいて実行されるトランジェント検出器のバイナリのトランジェント/非トランジェントの決定は、デコーダにおけるQMF時間スロット精度を有するトランジェントの分離を制御するために用いられる。効率的なロス符号化スキームは、トランジェントQMFのスロット位置データを送信するために利用される。
− 実際のトランジェント非相関パラメータは、トランジェントの空間的分布を導くためのトランジェント非相関器のために必要である。トランジェント非相関パラメータは、ダウンミックスとその間のその残余との間の角度を意味する。これらのパラメータは、トランジェントを含むために、エンコーダで検知されている時間スロットの間に送信されるだけである。
− RM8:USAC RM8システム
− CE:トランジェント・ステアリング非相関器(TSD)によって強化されるUSAC RM8システム
− トランジェントスロット位置の復号化
− トランジェント非相関器の計算量
Nを音声信号フレームのスロットの合計数であるとし、そして、
Pを音声信号フレームのイベントを含むスロットの数であるとする。
イベント状態値/f(区分Bのイベントを含むスロットの数,Nb)
Function x = decodestate(state, pulses, N)
1. Split vector into two partitions of length Na and Nb.
2. For pulses_a from 0 to pulses
− a. pulses_b = pulses − pulses_a
b. if state < f(pulses_a,Na)*f(pulses_b,Nb) then break for−loop.
c. state := state − f(pulses_a,Na)*f(pulses_b,Nb)
3. Number of possible states for partition B is no_states_b = f(pulses_b,Nb)
4. The states, state_a and state_b, of partitions A and B, respectively, are the integer part and the reminder of the division state/no_states_b.
5. If Na > 1 then the decoded vector of partition A is obtained recursively by
xa = decodestate(state_a,pulses_a,Na)
Otherwise (Na==1), and the vector xa is a scalar and we can set xa=state_a.
6. If Nb > 1 then the decoded vector of partition B is obtained recursively by
xb = decodestate(state_b,pulses_b,Nb)
Otherwise (Nb==1), and the vector xb is a scalar and we can set xb=state_b.
7. The final output x is obtained by merging xa and xb by x = [xa xb].
Function state = encodestate(x,N)
1. Split vector into two partitions xa and xb of length Na and Nb.
2. Count pulses in partitions A and B in pulses_a and pulses_b, and set pulses=pulses_a+pulses_b.
3. Set state to 0
4. For k from 0 to pulses_a−1
a. state := state + f(k,Na)*f(pulse−k,Nb)
5. If Na > 1, encode partition A by state_a = encodestate(xa, Na);
Otherwise (Na==1), set state_a = xa.
6. If Nb > 1, encode partition B by state_b = encodestate(xb,Nb);
Otherwise (Nb==1), set state_b = xb.
7. Encode states jointly
state := state + state_a*f(pulses_b,Nb) + state_b.
である。
乗算 (3・pules+1)・log2(N)−1
除算 (pules+1)・log2(N)−1
そのうちの倍長整数の除算 log2(N)−1
加算および引算 pules・log2(N)
乗算 (3・pules+1)・log2(N)−1
除算 (pules+1)・log2(N)−1
そのうちの倍長整数の除算 0
加算および引算 (pules+2)・log2(N)
− 拍手のような信号を検出するセマンティック信号分類器を実行させる。分類結果は、フレーム毎に1度送信される。bsTsdEnableフラグは、拍手のような信号のための1に設定される、そうでなければ、それは0に設定される。
−bsTsdEnableが、カレント・フレームに対して0に設定される場合、さらなるTSDデータは、このフレームのために、生成されず/送信されない。
−bsTsdEnableが、カレント・フレームに対して1に設定される場合、以下を実行する:
・OTT空間パラメータのブロードバンド算出のスイッチを入れる。
・カレント・フレーム(MPSタイムスロット毎のバイナリの決定)のトランジェントを検出する。
・以下の擬似コードに従って、ベクトルtsdPosにおけるtsdPosLenを符号化する。tsdPosにおけるスロット位置は、昇順において要求される。図13は、tsdPosLenにおいて、トランジェントスロット位置を符号化するための擬似コードを例示する。
・トランジェントスロットの数(bsTsdNumTrSlots=(検出されたトランジェントスロットの数)−1)を送信する。
・符号化されたトランジェント位置(bsTsdCodedPos)を送信する。
・トランジェントスロット毎に、ダウンミックス信号と残留信号との間にブロードバンド位相差を表す位相計測を算出する。
・トランジェントスロット毎に、ブロードバンド位相差計測(bsTsdTrPhaseData)を符号化して、送信する。
Claims (17)
- スロットと前記スロットに関連したイベントを含む音声信号フレームを有する符号化された音声信号を復号化するための装置(10;40;60;410)であって、前記装置は、
前記音声信号フレームのスロットの合計数を示しているフレーム・スロット数、前記音声信号フレームの前記イベントを含む前記スロット数を示しているイベント・スロット数、およびイベント状態数を解析するための解析ユニット(20;42;70;420)と、
前記フレーム・スロット数、前記イベント・スロット数および前記イベント状態数を使用して前記音声信号フレームにおける前記イベントを含む複数のスロット位置の表示を生成するための生成ユニット(30;45;80;430)と、
を含む、復号化するための装置。 - 復号化するための装置(10;40;60;410)は、音声信号フレームにおけるトランジェントの前記スロットの位置を復号化するように適応される、請求項1に記載の復号化するための装置。
- 前記解析ユニット(20;42;70;420)は、前記イベント状態数、またはアップデートされたイベント状態数と閾値とを比較するテストを実施するように適応される、請求項1または請求項2に記載の復号化するための装置。
- 前記解析ユニット(20;42;70;420)は、前記イベント状態数またはアップデートされたイベント状態数が、閾値より大きいか、閾値以上か、閾値より小さいか、または閾値以下かどうかの比較により前記テストを実施するように適応され、
ここで、前記生成ユニット(30;45;80;430)は、前記イベント状態数、または前記テストの結果に依存するアップデートされたイベント状態数をアップデートするように、さらに適応される、請求項3に記載の復号化するための装置。 - 前記復号化するための装置(10;40;60)は、スロット・セレクタ(90)をさらに含み、
ここで、前記スロット・セレクタ(90)は、考慮されたスロットとして、スロットを選択するように適応され、
前記解析ユニット(20;42;70)は、考慮されたスロットに関して前記テストを実施するように適応され、
前記閾値は、前記フレーム・スロット数、前記イベント・スロット数、および前記フレームの範囲内における前記考慮されたスロットの位置に依存する、請求項3または請求項4に記載の復号化するための装置。 - 前記復号化するための装置(10;40;410)は、フレーム区分器(440)をさらに含み、
ここで、前記フレーム区分器(440)は、前記フレームのスロットの第1のセットを含む第1のフレーム区分、および前記フレームのスロットの第2のセットを含む第2のフレーム区分を前記フレームに分割するように適応され、前記復号化するための装置(10;40;410)は、前記スロット位置を決定するように、さらに適応される、請求項1ないし請求項4のいずれかに記載の復号化するための装置。 - 前記復号化するための装置(10;40;60;410)は、
フレーム・スロット数、前記イベント・スロット数および前記イベント状態数を使用して前記音声信号フレームにおける前記イベントを含む複数のスロット位置の表示を使用して、音声出力信号を生成するための音声信号プロセッサ(50)をさらに含む、請求項1ないし請求項7のいずれかに記載の復号化するための装置。 - 前記イベントを含む複数のスロット位置の前記表示が、第1の表示状態である場合、前記音声信号プロセッサ(50)は、第1の方法に従って前記音声出力信号を生成するように適応され、そして、前記イベントを含む複数のスロット位置の前記表示が、前記第1の表示状態とは異なる第2の表示状態である場合、前記音声信号プロセッサ(50)は、異なる第2の方法に従って、前記音声出力信号を生成するように適応される、請求項8に記載の復号化するための装置。
- 前記スロットがトランジェントを含むことを前記第1の表示状態が表示する場合、前記第1の方法が、スロットを復号化するためのトランジェント非相関器(56)を使用することを含み、前記スロットがトランジェントを含まないことを前記第2の表示状態が表示する場合、前記第2の方法が、スロットを復号化するための第2の非相関器(54)を使用することを含む、請求項9に記載の復号化するための装置。
- 音声信号フレームにおけるイベントを含むスロットの位置を符号化する装置(510)であって、前記装置は、
イベント状態数を符号化することによってスロットの前記位置を符号化するためのイベント状態数生成器(530)と、
前記音声信号フレームのスロットの前記合計数を示すフレーム・スロット数と、前記音声信号フレームの前記イベントを含む前記スロット数を前記イベント状態数生成器(530)に示すイベント・スロット数と、を提供するように適応されるスロット情報ユニット(520)と、を含み、
ここで、前記イベント状態数、前記フレーム・スロット数および前記イベント・スロット数は、一緒に、前記音声信号フレームにおける前記イベントを含む複数のスロット位置を示す、符号化するための装置。 - 前記イベント状態数生成器(530)は、イベントを含む各スロットのための正の整数値を加えることによってイベント状態数を生成するように適応される、請求項11に記載の符号化するための装置。
- 前記イベント状態数生成器(530)は、前記イベント状態数を生成するために、第1のフレーム区分のための第1のイベントサブ状態数を決定し、第2のフレーム区分のための第2のイベントサブ状態数を決定し、そして、前記第1および第2のイベント状態数を結合することによって、前記イベント状態数を生成するように適応される、請求項11に記載の符号化するための装置。
- 音声信号フレームにおけるイベントを含むスロットの位置を復号化するための方法であって、前記方法は、
前記音声信号フレームのスロットの合計数を示しているフレーム・スロット数を解析するステップであって、イベント・スロット数は、前記音声信号フレームの前記イベント、およびイベント状態数を含むスロットの数を示す、解析するステップと、
フレーム・スロット数、前記イベント・スロット数および前記イベント状態数を使用して、前記音声信号フレームにおける前記イベントを含む複数のスロット位置の表示を生成するステップと、
を含む、復号化するための方法。 - 音声信号フレームにおけるイベントを含むスロットの位置を符号化する方法であって、前記方法は、
前記音声信号フレームのスロットの合計数を示すフレーム・スロット数を受信するか、または決定するステップと、
前記音声信号フレームの前記イベントを含むスロットの数を示すイベント・スロット数を受信するか、または決定するステップと、
前記音声信号フレームにおける前記イベントを含む複数のスロット位置の表示は、フレーム・スロット数、前記イベント・スロット数および前記イベント状態数によって復号化されうるように、前記イベント状態数、前記フレーム・スロット数および前記イベント・スロット数に基づくイベント状態数を符号化するステップと、
を含む、符号化するための方法。 - 請求項14に記載の音声信号フレームにおけるイベントのスロット位置を復号化するための方法を実施する音声信号フレームにおける前記イベントを含むスロット位置を復号化するためのコンピュータ・プログラム。
- 請求項15に記載の音声信号フレームにおけるイベントのスロット位置を符号化するための方法を実施する音声信号フレームにおける前記イベントを含むスロットの位置を符号化するためのコンピュータ・プログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161433803P | 2011-01-18 | 2011-01-18 | |
US61/433,803 | 2011-01-18 | ||
EP11172791.3 | 2011-07-06 | ||
EP11172791A EP2477188A1 (en) | 2011-01-18 | 2011-07-06 | Encoding and decoding of slot positions of events in an audio signal frame |
PCT/EP2012/050613 WO2012098098A1 (en) | 2011-01-18 | 2012-01-17 | Encoding and decoding of slot positions of events in an audio signal frame |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014508316A JP2014508316A (ja) | 2014-04-03 |
JP5818913B2 true JP5818913B2 (ja) | 2015-11-18 |
Family
ID=44508771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013549787A Active JP5818913B2 (ja) | 2011-01-18 | 2012-01-17 | 音声信号フレームにおけるイベントのスロット位置の符号化および復号化 |
Country Status (15)
Country | Link |
---|---|
US (1) | US9502040B2 (ja) |
EP (2) | EP2477188A1 (ja) |
JP (1) | JP5818913B2 (ja) |
KR (1) | KR101657251B1 (ja) |
CN (1) | CN103620677B (ja) |
AR (1) | AR084873A1 (ja) |
AU (1) | AU2012208673B2 (ja) |
BR (1) | BR112013018362B1 (ja) |
CA (1) | CA2824935C (ja) |
MX (1) | MX2013008364A (ja) |
MY (1) | MY155887A (ja) |
SG (1) | SG191988A1 (ja) |
TW (1) | TWI485699B (ja) |
WO (1) | WO2012098098A1 (ja) |
ZA (1) | ZA201306173B (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112015002367B1 (pt) | 2012-08-03 | 2021-12-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev | Decodificador e método para codificação de objeto de áudio espacial multi-instância empregando um conceito paramétrico para caixas multicanal de downmix/upmix |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
EP2956935B1 (en) | 2013-02-14 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Controlling the inter-channel coherence of upmixed audio signals |
WO2014126688A1 (en) * | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
US20150371646A1 (en) * | 2013-02-14 | 2015-12-24 | Dolby Laboratories Licensing Corporation | Time-Varying Filters for Generating Decorrelation Signals |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
CN110619882B (zh) * | 2013-07-29 | 2023-04-04 | 杜比实验室特许公司 | 用于降低去相关器电路中瞬态信号的时间伪差的系统和方法 |
JP6201047B2 (ja) | 2013-10-21 | 2017-09-20 | ドルビー・インターナショナル・アーベー | オーディオ信号のパラメトリック再構成のための脱相関器構造 |
EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
KR102517867B1 (ko) | 2015-08-25 | 2023-04-05 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 오디오 디코더 및 디코딩 방법 |
TWI720086B (zh) * | 2015-12-10 | 2021-03-01 | 美商艾斯卡瓦公司 | 儲存在區塊處理儲存系統上的音頻資料和資料的縮減 |
CN105654959B (zh) * | 2016-01-22 | 2020-03-06 | 韶关学院 | 一种自适应滤波的系数更新方法及装置 |
FR3048808A1 (fr) * | 2016-03-10 | 2017-09-15 | Orange | Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal |
JP7257975B2 (ja) | 2017-07-03 | 2023-04-14 | ドルビー・インターナショナル・アーベー | 密集性の過渡事象の検出及び符号化の複雑さの低減 |
SG11202000510VA (en) * | 2017-07-28 | 2020-02-27 | Fraunhofer Ges Forschung | Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter |
US10200540B1 (en) * | 2017-08-03 | 2019-02-05 | Bose Corporation | Efficient reutilization of acoustic echo canceler channels |
US10542153B2 (en) | 2017-08-03 | 2020-01-21 | Bose Corporation | Multi-channel residual echo suppression |
US10594869B2 (en) | 2017-08-03 | 2020-03-17 | Bose Corporation | Mitigating impact of double talk for residual echo suppressors |
US10863269B2 (en) | 2017-10-03 | 2020-12-08 | Bose Corporation | Spatial double-talk detector |
TWI812658B (zh) * | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
EP3729427A1 (en) * | 2017-12-19 | 2020-10-28 | Dolby International AB | Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements |
US10964305B2 (en) | 2019-05-20 | 2021-03-30 | Bose Corporation | Mitigating impact of double talk for residual echo suppressors |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3307138B2 (ja) * | 1995-02-27 | 2002-07-24 | ソニー株式会社 | 信号符号化方法及び装置、並びに信号復号化方法及び装置 |
US6424938B1 (en) | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
DE60006953T2 (de) * | 1999-04-07 | 2004-10-28 | Dolby Laboratories Licensing Corp., San Francisco | Matrizierung für die verlustfreie kodierung und dekodierung von mehrkanaligen audiosignalen |
AU2003281128A1 (en) | 2002-07-16 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
SG108862A1 (en) * | 2002-07-24 | 2005-02-28 | St Microelectronics Asia | Method and system for parametric characterization of transient audio signals |
US7536305B2 (en) | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
TW594674B (en) * | 2003-03-14 | 2004-06-21 | Mediatek Inc | Encoder and a encoding method capable of detecting audio signal transient |
US7353169B1 (en) * | 2003-06-24 | 2008-04-01 | Creative Technology Ltd. | Transient detection and modification in audio signals |
JP4966013B2 (ja) | 2003-10-30 | 2012-07-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号のエンコードまたはデコード |
US8983834B2 (en) * | 2004-03-01 | 2015-03-17 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
KR100571574B1 (ko) * | 2004-07-26 | 2006-04-17 | 한양대학교 산학협력단 | 비선형 분석을 이용한 유사화자 인식방법 및 그 시스템 |
KR20070003593A (ko) * | 2005-06-30 | 2007-01-05 | 엘지전자 주식회사 | 멀티채널 오디오 신호의 인코딩 및 디코딩 방법 |
EP1938311B1 (en) * | 2005-08-30 | 2018-05-02 | LG Electronics Inc. | Apparatus for decoding audio signals and method thereof |
CN101253555B (zh) * | 2005-09-01 | 2011-08-24 | 松下电器产业株式会社 | 多声道音频信号处理装置及多声道音频信号处理方法 |
US7974713B2 (en) * | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
JP5222279B2 (ja) * | 2006-03-28 | 2013-06-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチチャネルオーディオ再構成における信号整形のための改善された方法 |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
DE102007018032B4 (de) * | 2007-04-17 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Erzeugung dekorrelierter Signale |
CN101308655B (zh) * | 2007-05-16 | 2011-07-06 | 展讯通信(上海)有限公司 | 一种音频编解码方法与装置 |
US8725520B2 (en) | 2007-09-07 | 2014-05-13 | Qualcomm Incorporated | Power efficient batch-frame audio decoding apparatus, system and method |
TWI433137B (zh) * | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
-
2011
- 2011-07-06 EP EP11172791A patent/EP2477188A1/en not_active Withdrawn
-
2012
- 2012-01-17 EP EP12701848.9A patent/EP2666161A1/en active Pending
- 2012-01-17 KR KR1020137021329A patent/KR101657251B1/ko active IP Right Grant
- 2012-01-17 MX MX2013008364A patent/MX2013008364A/es active IP Right Grant
- 2012-01-17 JP JP2013549787A patent/JP5818913B2/ja active Active
- 2012-01-17 AR ARP120100152A patent/AR084873A1/es active IP Right Grant
- 2012-01-17 CA CA2824935A patent/CA2824935C/en active Active
- 2012-01-17 BR BR112013018362-4A patent/BR112013018362B1/pt active IP Right Grant
- 2012-01-17 MY MYPI2013002693A patent/MY155887A/en unknown
- 2012-01-17 SG SG2013054283A patent/SG191988A1/en unknown
- 2012-01-17 CN CN201280013909.XA patent/CN103620677B/zh active Active
- 2012-01-17 WO PCT/EP2012/050613 patent/WO2012098098A1/en active Application Filing
- 2012-01-17 AU AU2012208673A patent/AU2012208673B2/en active Active
- 2012-01-17 TW TW101101714A patent/TWI485699B/zh active
-
2013
- 2013-07-17 US US13/944,766 patent/US9502040B2/en active Active
- 2013-08-16 ZA ZA2013/06173A patent/ZA201306173B/en unknown
Also Published As
Publication number | Publication date |
---|---|
CA2824935C (en) | 2016-08-30 |
EP2666161A1 (en) | 2013-11-27 |
WO2012098098A1 (en) | 2012-07-26 |
EP2477188A1 (en) | 2012-07-18 |
KR20130133833A (ko) | 2013-12-09 |
US20130304480A1 (en) | 2013-11-14 |
MX2013008364A (es) | 2013-08-12 |
CN103620677A (zh) | 2014-03-05 |
TW201248619A (en) | 2012-12-01 |
MY155887A (en) | 2015-12-15 |
AR084873A1 (es) | 2013-07-10 |
CN103620677B (zh) | 2015-10-14 |
BR112013018362B1 (pt) | 2021-01-19 |
ZA201306173B (en) | 2014-04-30 |
AU2012208673B2 (en) | 2015-05-14 |
US9502040B2 (en) | 2016-11-22 |
KR101657251B1 (ko) | 2016-09-13 |
JP2014508316A (ja) | 2014-04-03 |
AU2012208673A1 (en) | 2013-08-29 |
CA2824935A1 (en) | 2012-07-26 |
TWI485699B (zh) | 2015-05-21 |
SG191988A1 (en) | 2013-08-30 |
RU2013138354A (ru) | 2015-02-27 |
BR112013018362A2 (pt) | 2016-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5818913B2 (ja) | 音声信号フレームにおけるイベントのスロット位置の符号化および復号化 | |
CA2576739C (en) | Multichannel decorrelation in spatial audio coding | |
AU2011295368B2 (en) | Apparatus for generating a decorrelated signal using transmitted phase information | |
EP2870603B1 (en) | Encoding and decoding of audio signals | |
JP6134867B2 (ja) | レンダラ制御式空間アップミックス | |
JP6133422B2 (ja) | マルチチャネルをダウンミックス/アップミックスする場合のため一般化された空間オーディオオブジェクト符号化パラメトリック概念のデコーダおよび方法 | |
KR102482162B1 (ko) | 오디오 인코더 및 디코더 | |
AU2015201672B2 (en) | Apparatus for generating a decorrelated signal using transmitted phase information | |
RU2575393C2 (ru) | Кодирование и декодирование позиций слотов с событиями в кадре аудиосигнала |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141202 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150602 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150908 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150929 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5818913 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |