JP2010507943A - 音声信号からアンビエント信号を生成するための装置および方法、音声信号からマルチチャンネル音声信号を導出するための装置および方法並びにコンピュータプログラム - Google Patents
音声信号からアンビエント信号を生成するための装置および方法、音声信号からマルチチャンネル音声信号を導出するための装置および方法並びにコンピュータプログラム Download PDFInfo
- Publication number
- JP2010507943A JP2010507943A JP2009533720A JP2009533720A JP2010507943A JP 2010507943 A JP2010507943 A JP 2010507943A JP 2009533720 A JP2009533720 A JP 2009533720A JP 2009533720 A JP2009533720 A JP 2009533720A JP 2010507943 A JP2010507943 A JP 2010507943A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- matrix
- audio signal
- representation
- ambient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 182
- 238000000034 method Methods 0.000 title claims description 125
- 238000004590 computer program Methods 0.000 title claims description 9
- 238000007906 compression Methods 0.000 claims abstract description 60
- 230000006835 compression Effects 0.000 claims abstract description 60
- 239000011159 matrix material Substances 0.000 claims description 112
- 238000009826 distribution Methods 0.000 claims description 100
- 230000003595 spectral effect Effects 0.000 claims description 6
- 230000001934 delay Effects 0.000 claims description 2
- 230000002427 irreversible effect Effects 0.000 abstract description 16
- 230000006870 function Effects 0.000 description 26
- 238000004364 calculation method Methods 0.000 description 15
- 238000012805 post-processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 230000008901 benefit Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 238000005457 optimization Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 6
- 230000006978 adaptation Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000001788 irregular Effects 0.000 description 5
- 230000002238 attenuated effect Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000007480 spreading Effects 0.000 description 4
- 238000003892 spreading Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 235000009508 confectionery Nutrition 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 241001342895 Chorus Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- RDYMFSUJUZBWLH-UHFFFAOYSA-N endosulfan Chemical compound C12COS(=O)OCC2C2(Cl)C(Cl)=C(Cl)C1(Cl)C2(Cl)Cl RDYMFSUJUZBWLH-UHFFFAOYSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 108010066082 tartrate-sensitive acid phosphatase Proteins 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/005—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo five- or more-channel type, e.g. virtual surround
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
Abstract
音声信号からマルチチャンネル音声信号を導出するための装置は、音声信号からアンビエント信号を生成するための装置、フロントラウドスピーカ信号として音声信号を提供するための装置およびバックラウドスピーカ信号としてアンビエント信号を提供するための装置を含む。
【選択図】図1
Description
利点1:最適な(中央の)リスニングポジションと同等のポジションまたはその外で、改善されたフロントイメージの安定性。「スイートスポット」は、センターチャンネルによって広げられる。ターム「スイートスポット」は、最適なサウンド印象が(リスナーによって)知覚されるリスニングポジションのエリアを意味する。
利点2:コンサートホールの印象または体験のより良好な近似を確立すること。「包囲」および広大さのさらなる体験は、リアチャンネルラウドスピーカまたはバックチャンネルラウドスピーカによって得られる。
オプション1:真のモノラルソースを得るために、センターを通してまたはセンターラウドスピーカを通してモノラルチャンネルの再現または再生。
オプション2:LおよびRラウドスピーカに優る(すなわちフロントレフトラウドスピーカおよびフロントライトラウドスピーカに優る)モノラル信号の再現または再生。
この方法は、リスナーがスイートスポットにおいてまたはそこに座る場合に、真のモノラルソースに比べてより広い知覚されたソース幅を有するがリスナーに最も近いラウドスピーカへの傾向を有するファントムモノラルソースを発生する。
この方法は、2チャンネル再生システムが利用できる場合に用いることができ、それは、拡張されたラウドスピーカセットアップ(例えば5つまたは6つのラウドスピーカを有するラウドスピーカセットアップ)を用いない。Cラウドスピーカまたはセンターラウドスピーカ、LSラウドスピーカまたはリアレフトラウドスピーカ、RSラウドスピーカまたはリアライトラウドスピーカおよびLFEラウドスピーカまたは低周波効果チャンネルラウドスピーカは、用いられないままである。
オプション3:ある方法は、モノラル信号のチャンネルを、5.1ラウドスピーカの全て(すなわち、5.1マルチチャンネルシステムに用いられる全部で6つのラウドスピーカ)を用いるマルチチャンネル信号に変換するために用いることができる。このように、マルチチャンネル信号は、マルチチャンネルセットアップの先に述べられた利点から利益を得る。この方法は、リアルタイムに若しくは「オンザフライ」でまたは前処理によって用いることができ、アップミックスプロセスまたは「アップミキシング」と呼ばれる。
Xi,j=X(ω=ωi,k=k1+j-1)
1≦j≦n
および
1≦i≦m
d(A,B)=d(B,A)
Wi,k≧0、および
Hi,k≧0
を適用することによって費用関数f(x)の極小(または大域的最小点)に反復して接近する。
V=X(ω,k)
V=X(ω,k)
|X(ω,k)|ij=|X(ω,k)ij|
|A|=|X|−WH
において負の値のエレメントの量または値に影響するために、境界拘束または境界条件を費用関数に加算することにある。
によって表されるように、相関係数Rxyによってしばしば表される。
Claims (31)
- 非可逆圧縮のための前記手段(110;220;320)は、前記音声信号(108;208;308;x(t);x[n])の前記スペクトル表現(108;212;316;|X|)として、前記音声信号のスペクトログラムを表す時間周波数分布マトリクス(|X|)を用いるように、さらに
第1の近似マトリクス(W)および第2の近似マトリクス(H)の積(WH)によって前記時間周波数分布マトリクス(|X|)を近似するように構成される、請求項2に記載の装置(100;200;300;510)。 - 非可逆圧縮のための前記手段(110;220;320)は、前記音声信号(108;208;308;x(t);x[n])の前記スペクトル表現(108;212;316;|X|)として、前記音声信号のスペクトログラムを表す実数値の時間周波数分布マトリクス(|X|)を用いるように構成される、請求項3に記載の装置(100;200;300;510)。
- 非可逆圧縮のための前記手段(110;220;320)は、前記音声信号(108;208;308;x(t);x[n])の前記スペクトル表現(108;212;316;|X|)として、時間周波数分布マトリクス(|X|)を用いるように構成され、それのエントリー(X)は、複数の時間間隔に対して前記音声信号の複数の周波数ドメイン(ω)において振幅またはエネルギーを表す、請求項4に記載の装置(100;200;300;510)。
- 非可逆圧縮のための前記手段(110;220;320)は、前記音声信号(108;208;308;x(t);x[n])の前記スペクトル表現(108;212;316)として、排他的に負でないまたは排他的に正でないエントリーを含む時間周波数分布マトリクス(|X|)を用いるように構成される、請求項3ないし請求項5のいずれかに記載の装置(100;200;300;510)。
- 非可逆圧縮のための前記手段(110;220;320)は、
前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)が排他的に負でないエントリーまたは排他的に正でないエントリーを有するように、または
前記第1の近似マトリクス(W)が排他的に負でないエントリーを有し、さらに前記第2の近似マトリクス(H)が排他的に正でないエントリーを有するように、または
前記第1の近似マトリクス(W)が排他的に正でないエントリーを有し、さらに前記第2の近似マトリクス(H)が排他的に負でないエントリーを有するように、
前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)の積(WH)によって前記時間周波数分布マトリクスを近似するように構成される、請求項3ないし請求項6のいずれかに記載の装置(100;200;300;510)。 - 非可逆圧縮のための前記手段(110;220;320)は、一方では前記時間周波数分布マトリクス(|X|)と他方では前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)の前記積(WH)との間の差の定量的記述を含む費用関数(c)を評価することによって前記第1の近似マトリクス(W)のエントリーおよび前記第2の近似マトリクス(H)のエントリーを決定するように構成される、請求項3ないし請求項7のいずれかに記載の装置(100;200;300;510)。
- 非可逆圧縮のための前記手段(110;220;320)は、前記費用関数(c)の極値を決定するための方法を用いてまたは前記費用関数(c)の前記極値に近似のための方法を用いて前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)の前記エントリーを決定するように構成される、請求項8に記載の装置(100;200;300;510)。
- 前記費用関数(c)は、前記費用関数(c)が一方では前記時間周波数分布マトリクスのエントリー(|X|ij)と他方では前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)の前記積(WH)のエントリー((WH)ij)との間の差の符号に依存する部分を含むように選択される、請求項8または請求項9に記載の装置(100;200;300;510)。
- 前記費用関数(c)または非可逆圧縮のための前記手段の境界条件は、一方では前記時間周波数分布マトリクスのエントリー(|X|ij)と他方では前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)の前記積(WH)のエントリー((WH)ij)との間の差において、第1の符号の値がそれに対して逆の符号の値と比較して発生することが好ましいように選択される、請求項8、請求項9または請求項10に記載の装置(100;200;300;510)。
- 前記費用関数(c)は、一方では前記時間周波数分布マトリクス(|X|)と他方では前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)の前記積(WH)との間のエレメント的な差のフロベニウスノルムを決定するように構成される、請求項8ないし請求項11のいずれかに記載の装置(100;200;300,510)。
- 前記費用関数(c)は、一方では前記時間周波数分布マトリクス(|X|)と他方では前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)の前記積(WH)との間のエレメント的な差の一般化カルバックライブラーダイバージェンスを決定するように構成される、請求項8ないし請求項11のいずれかに記載の装置(100;200;300,510)。
- 前記時間周波数分布マトリクス(|X|)は、関連した第1のマトリクス次元nおよび関連した第2のマトリクス次元mを含み、
前記第1の近似マトリクス(W)は、関連した第1のマトリクス次元nおよび関連した第2のマトリクス次元rを含み、
前記第2の近似マトリクス(H)は、関連した第1のマトリクス次元rおよび関連した第2のマトリクス次元mを含み、さらに
以下
(n+m)r<nm
が真である、請求項3ないし請求項13のいずれかに記載の装置(100;200;300,510)。 - 差を算出するための前記手段(120;230;330)は、近似エラーマトリクス(|A|)のエレメント(A)が一方では前記時間周波数分布マトリクス(|X|)のエレメントと他方では前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)の前記積(WH)のエレメント((WH)ij)との間の差の関数であるように近似エラーマトリクス(|A|)を導出するように構成され、
前記近似エラーマトリクス(|A|)は、前記識別表現(122;232;332)を形成する、請求項3ないし請求項14のいずれかに記載の装置(100;200;300,510)。 - 差を算出するための前記手段(120;230;330)は、前記近似エラーマトリクス(|A|)の所定のエントリー(|A|ij)の算出において、一方では前記所定のエントリー(|A|ij)に関連する前記時間周波数マトリクス(|X|)のエントリー(|X|ij)と他方では前記所定のエントリー(|X|ij)に関連する前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)の前記積(WH)のエントリー((WH)ij)との間の差を決定するように、さらに前記差の前記符号に依存して前記差を重み付けることによって前記差の関数として前記近似エラーマトリクス(|A|)の前記所定のエントリー(|A|ij)を算出するように構成される、請求項15に記載の装置(100;200;300;510)。
- 算出するための前記手段(120;230;330)は、前記近似エラーマトリクス(|A|)の所定のエントリー(|A|ij)の算出において、一方では前記所定のエントリー(|A|ij)に関連する前記時間周波数マトリクス(|X|)のエントリー(|X|ij)と他方では前記所定のエントリー(|A|ij)に関連するものに等しくない重み係数(ξ)によって重み付けられる前記第1の近似マトリクス(W)および前記第2の近似マトリクス(H)の前記積(WH)のエントリー((WH)ij)との間の差を決定するように、さらに
前記差の強度となる前記近似エラーマトリクス(|A|)の前記所定のエントリー(|A|ij)を決定するように構成される、請求項15に記載の装置(100;200;300;510)。 - 提供するための前記手段(130;240;334)は、前記時間周波数分布マトリクス(X)において得られる位相値(φ)を、前記実数値の品質測度(|A|)によって表される前記差に割り当てるように構成される、請求項18に記載の装置(100;200;300;510)。
- 音声信号(508)からフロントラウドスピーカ信号(562,564,566)およびバックラウドスピーカ信号(542,544)を含むマルチチャンネル音声信号を導出するための装置(500)であって、
請求項1ないし請求項19のいずれかに記載の音声信号(508)からアンビエント信号(512)を生成するための装置(100;200;300;510)であって、前記アンビエント信号(512)を生成するための前記装置(510)は、前記音声信号(508)を受信するように構成される、装置、
前記フロントラウドスピーカ信号(563,564,566)として前記音声信号(508)またはそれから導出される信号を提供するための装置(550,560)、および
前記バックラウドスピーカ信号(542,544)として前記アンビエント信号(512)を生成するための前記装置(510)によって提供される前記アンビエント信号(512)またはそれから導出される信号を提供するためのバックラウドスピーカ信号提供装置(520,530,540)を含む、装置。 - 前記バックラウドスピーカ信号提供装置(520,530,540)は、前記バックラウドスピーカ信号が前記フロントラウドスピーカ信号(562,564,566)と比較して1ミリ秒および50ミリ秒間の範囲において遅延するように、前記バックラウドスピーカ信号(542,544)を生成するように構成される、請求項20に記載の装置(500)。
- 前記バックラウドスピーカ信号提供装置(520,530,540)は、前記バックラウドスピーカ信号(542,544)においてパルスのような信号部分を減衰するようにまたは前記バックラウドスピーカ信号(542,544)から前記パルスのような信号部分を除去するように構成される、請求項20または請求項21に記載の装置(500)。
- 前記バックラウドスピーカ信号提供装置(520,530,540)は、前記アンビエント信号(512)を生成するための前記装置(510)によって提供される前記アンビエント信号に基づいて、第1のバックラウドスピーカのための第1のバックラウドスピーカ信号(542)および第2のバックラウドスピーカのための第2のバックラウドスピーカ信号(544)を提供するように構成される、請求項20ないし請求項22のいずれかに記載の装置(500)。
- 前記バックラウドスピーカ信号提供装置(520,530,540)は、前記第1のバックラウドスピーカ信号および前記第2のバックラウドスピーカ信号が少なくとも部分的に互いに非相関するように、前記アンビエント信号(512)に基づいて前記第1のバックラウドスピーカ信号(542)および前記第2のバックラウドスピーカ信号(544)を提供するように構成される、請求項23に記載の装置(500)。
- 音声信号(108;208;308)からアンビエント信号(132;242;252;254;336;342)を生成するための方法(600)であって、
前記音声信号の圧縮表現(112;222;322)を得るために、前記音声信号の表現(108;212;316)の非可逆圧縮ステップ(610)、
識別表現(122;232;332)を得るために、前記音声信号の前記圧縮表現および前記音声信号の前記表現間の差(122;232;332)を算出するステップ(620)、および
前記識別表現を用いて前記アンビエント信号を提供するステップ(630)を含む、方法。 - 音声信号からフロントラウドスピーカ信号およびバックラウドスピーカ信号を含むマルチチャンネル音声信号を導出するための方法であって、
請求項25に記載の前記音声信号から前記アンビエント信号を生成するステップ、
前記フロントラウドスピーカ信号として前記音声信号またはそれから導出される信号を提供するステップ、および
前記バックラウドスピーカ信号として前記アンビエント信号またはそれから導出される信号を提供するステップを含む、方法。 - 音声信号からフロントラウドスピーカ信号およびバックラウドスピーカ信号を含むマルチチャンネル音声信号を導出するための方法であって、
前記音声信号から前記アンビエント信号を生成するステップを含み、前記音声信号から前記アンビエント信号を前記生成するステップは、
前記音声信号の圧縮表現(112;222;322)を得るために、前記音声信号の圧縮表現(108;212;316)の非可逆圧縮ステップ(610)、および
前記アンビエント信号を形成する識別表現(122;232;332)を得るために、前記音声信号の前記圧縮表現および前記音声信号の前記表現間の差(122;232;332)を算出するステップ(620)を含み、
前記識別表現は、前記音声信号の前記表現および前記音声信号の前記圧縮表現間の前記差を表し、さらに
前記識別表現は、非可逆圧縮の方法における前記表現において再生されない前記音声信号のそれらの部分を表し、さらに
前記非可逆圧縮ステップは、エネルギーの規則的な分布を示すまたは大きい信号エネルギーを伝える信号部分が前記圧縮表現に含まれることが好ましいように実行され、前記マルチチャンネル音声信号を導出するための方法は、
前記フロントラウドスピーカ信号として前記音声信号またはそれから導出される信号を提供するステップ、および
前記バックラウドスピーカ信号として前記アンビエント信号またはそれから導出される信号を提供するステップを含む、方法。 - 音声信号からフロントラウドスピーカ信号およびバックラウドスピーカ信号を含むマルチチャンネル音声信号を導出するための方法であって、
前記音声信号から前記アンビエント信号を生成するステップを含み、前記音声信号から前記アンビエント信号を前記生成するステップは、
前記音声信号の圧縮表現(112;222;322)を得るために、前記音声信号の表現(108;212;316)の非可逆圧縮ステップ(610)、
識別表現(122;232;332)を得るために、前記音声信号の前記圧縮表現および前記音声信号の前記表現間の差(122;232;332)算出するステップ(620)、および
前記識別表現を用いて前記アンビエント信号を提供するステップ(630)を含み、
前記識別表現は、前記音声信号の前記表現および前記音声信号の前記圧縮表現間の前記差を表し、さらに
前記識別表現は、非可逆圧縮の方法における前記表現において再生されない前記音声信号のそれらの部分を表し、さらに
前記非可逆圧縮ステップは、エネルギーの規則的な分布を示すまたは大きい信号エネルギーを伝える信号部分が前記圧縮表現に含まれることが好ましいように実行され、前記マルチチャンネル音声信号を導出するための方法は、
前記フロントラウドスピーカ信号として前記音声信号またはそれから導出される信号を提供するステップ、および
前記バックラウドスピーカ信号として前記アンビエント信号またはそれから導出される信号を提供するステップを含む、方法。 - コンピュータ上で実行されるときに、請求項25または請求項26または請求項29または請求項30に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102006050068A DE102006050068B4 (de) | 2006-10-24 | 2006-10-24 | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm |
DE102006050068.7 | 2006-10-24 | ||
PCT/EP2007/009197 WO2008049587A1 (en) | 2006-10-24 | 2007-10-23 | Apparatus and method for generating an ambient signal from an audio signal, apparatus and method for deriving a multi-channel audio signal from an audio signal and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010507943A true JP2010507943A (ja) | 2010-03-11 |
JP5048777B2 JP5048777B2 (ja) | 2012-10-17 |
Family
ID=38988087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009533720A Active JP5048777B2 (ja) | 2006-10-24 | 2007-10-23 | 音声信号からアンビエント信号を生成するための装置および方法、音声信号からマルチチャンネル音声信号を導出するための装置および方法並びにコンピュータプログラム |
Country Status (13)
Country | Link |
---|---|
US (1) | US8346565B2 (ja) |
EP (2) | EP1997102B1 (ja) |
JP (1) | JP5048777B2 (ja) |
KR (1) | KR101090565B1 (ja) |
CN (1) | CN101536085B (ja) |
AU (1) | AU2007308413B2 (ja) |
CA (1) | CA2664163C (ja) |
DE (1) | DE102006050068B4 (ja) |
ES (2) | ES2391308T3 (ja) |
HK (2) | HK1122391A1 (ja) |
PL (2) | PL1997102T3 (ja) |
TW (1) | TWI352971B (ja) |
WO (1) | WO2008049587A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011530913A (ja) * | 2008-08-13 | 2011-12-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 空間出力マルチチャネルオーディオ信号を決定する装置 |
JP2013517687A (ja) * | 2010-01-22 | 2013-05-16 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャネル脱相関を使った改善されたマルチチャネル上方混合 |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2097895A4 (en) | 2006-12-27 | 2013-11-13 | Korea Electronics Telecomm | DEVICE AND METHOD FOR ENCODING AND DECODING MULTI-OBJECT AUDIO SIGNAL WITH DIFFERENT CHANNELS WITH INFORMATION BIT RATE CONVERSION |
US20080228470A1 (en) * | 2007-02-21 | 2008-09-18 | Atsuo Hiroe | Signal separating device, signal separating method, and computer program |
EP2220646A1 (en) * | 2007-11-06 | 2010-08-25 | Nokia Corporation | Audio coding apparatus and method thereof |
US20100250260A1 (en) * | 2007-11-06 | 2010-09-30 | Lasse Laaksonen | Encoder |
WO2009059633A1 (en) * | 2007-11-06 | 2009-05-14 | Nokia Corporation | An encoder |
KR101271972B1 (ko) * | 2008-12-11 | 2013-06-10 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 다채널 오디오 신호를 생성하기 위한 장치 |
EP2382799A1 (en) * | 2008-12-23 | 2011-11-02 | Koninklijke Philips Electronics N.V. | Speech capturing and speech rendering |
BR112012008257A2 (pt) * | 2009-10-09 | 2017-06-06 | Dts Inc | método para condicionamento de um sinal de áudio, e, aparelho de processamento de sinal de áudio |
WO2011060816A1 (en) * | 2009-11-18 | 2011-05-26 | Nokia Corporation | Data processing |
WO2011090437A1 (en) * | 2010-01-19 | 2011-07-28 | Nanyang Technological University | A system and method for processing an input signal to produce 3d audio effects |
EP2543199B1 (en) * | 2010-03-02 | 2015-09-09 | Nokia Technologies Oy | Method and apparatus for upmixing a two-channel audio signal |
US9219972B2 (en) * | 2010-11-19 | 2015-12-22 | Nokia Technologies Oy | Efficient audio coding having reduced bit rate for ambient signals and decoding using same |
US20120316886A1 (en) * | 2011-06-08 | 2012-12-13 | Ramin Pishehvar | Sparse coding using object exttraction |
EP2544466A1 (en) | 2011-07-05 | 2013-01-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor |
WO2013093569A1 (en) | 2011-12-23 | 2013-06-27 | Nokia Corporation | Audio processing for mono signals |
MX343564B (es) * | 2012-09-12 | 2016-11-09 | Fraunhofer Ges Forschung | Aparato y metodo para proveer funciones mejoradas de mezcla guiada para audio 3d. |
EP2965540B1 (en) | 2013-03-05 | 2019-05-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multichannel direct-ambient decomposition for audio signal processing |
US9788119B2 (en) * | 2013-03-20 | 2017-10-10 | Nokia Technologies Oy | Spatial audio apparatus |
CN104240711B (zh) * | 2013-06-18 | 2019-10-11 | 杜比实验室特许公司 | 用于生成自适应音频内容的方法、系统和装置 |
EP2830336A3 (en) * | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Renderer controlled spatial upmix |
JP6242489B2 (ja) * | 2013-07-29 | 2017-12-06 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 |
EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
DE102013223201B3 (de) * | 2013-11-14 | 2015-05-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes |
US10002622B2 (en) * | 2013-11-20 | 2018-06-19 | Adobe Systems Incorporated | Irregular pattern identification using landmark based convolution |
US9351060B2 (en) | 2014-02-14 | 2016-05-24 | Sonic Blocks, Inc. | Modular quick-connect A/V system and methods thereof |
MX363415B (es) | 2014-07-22 | 2019-03-22 | Huawei Tech Co Ltd | Un metodo y aparato para manipular una señal de audio de entrada. |
EP2980789A1 (en) | 2014-07-30 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhancing an audio signal, sound enhancing system |
US9576583B1 (en) * | 2014-12-01 | 2017-02-21 | Cedar Audio Ltd | Restoring audio signals with mask and latent variables |
WO2016087583A1 (en) * | 2014-12-03 | 2016-06-09 | Meridian Audio Limited | Non linear filter with group delay at pre-response frequency for high res audio |
JP6519959B2 (ja) * | 2017-03-22 | 2019-05-29 | カシオ計算機株式会社 | 操作処理装置、再生装置、操作処理方法およびプログラム |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
BR112021010956A2 (pt) * | 2018-12-07 | 2021-08-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparelho e método para gerar uma descrição de campo de som |
CN109597342B (zh) * | 2019-01-16 | 2020-10-20 | 郑州轻工业学院 | 一种动态组网智能辨识的采砂船监测装置及方法 |
US11579838B2 (en) | 2020-11-26 | 2023-02-14 | Verses, Inc. | Method for playing audio source using user interaction and a music application using the same |
KR102401549B1 (ko) * | 2020-11-26 | 2022-05-24 | 주식회사 버시스 | 사용자의 인터랙션을 이용한 오디오 소스 재생 방법 및 이를 이용한 음악 어플리케이션 |
US11575998B2 (en) | 2021-03-09 | 2023-02-07 | Listen and Be Heard LLC | Method and system for customized amplification of auditory signals based on switching of tuning profiles |
US11432078B1 (en) | 2021-03-09 | 2022-08-30 | Listen and Be Heard LLC | Method and system for customized amplification of auditory signals providing enhanced karaoke experience for hearing-deficient users |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004289196A (ja) * | 2002-03-08 | 2004-10-14 | Nippon Telegr & Teleph Corp <Ntt> | ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム |
JP2005004119A (ja) * | 2003-06-16 | 2005-01-06 | Victor Co Of Japan Ltd | 音響信号符号化装置及び音響信号復号化装置 |
JP2005049869A (ja) * | 2003-07-23 | 2005-02-24 | Mitsubishi Electric Research Laboratories Inc | 非定常信号の成分を検出する方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE467332B (sv) * | 1990-06-21 | 1992-06-29 | Ericsson Telefon Ab L M | Foerfarande foer effektreglering i ett digitalt mobiltelefonisystem |
UA51671C2 (uk) | 1995-09-02 | 2002-12-16 | Нью Транзд'Юсез Лімітед | Акустичний пристрій |
TW411723B (en) * | 1996-11-15 | 2000-11-11 | Koninkl Philips Electronics Nv | A mono-stereo conversion device, an audio reproduction system using such a device and a mono-stereo conversion method |
US6229453B1 (en) * | 1998-01-26 | 2001-05-08 | Halliburton Energy Services, Inc. | Method to transmit downhole video up standard wireline cable using digital data compression techniques |
US7076071B2 (en) * | 2000-06-12 | 2006-07-11 | Robert A. Katz | Process for enhancing the existing ambience, imaging, depth, clarity and spaciousness of sound recordings |
US7257231B1 (en) * | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
US7738881B2 (en) * | 2003-07-22 | 2010-06-15 | Microsoft Corporation | Systems for determining the approximate location of a device from ambient signals |
US7412380B1 (en) * | 2003-12-17 | 2008-08-12 | Creative Technology Ltd. | Ambience extraction and modification for enhancement and upmix of audio signals |
CN1677491A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
JP3916087B2 (ja) * | 2004-06-29 | 2007-05-16 | ソニー株式会社 | 疑似ステレオ化装置 |
US7876909B2 (en) * | 2004-07-13 | 2011-01-25 | Waves Audio Ltd. | Efficient filter for artificial ambience |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
WO2006079086A2 (en) * | 2005-01-24 | 2006-07-27 | Thx, Ltd. | Ambient and direct surround sound system |
EP1927102A2 (en) * | 2005-06-03 | 2008-06-04 | Dolby Laboratories Licensing Corporation | Apparatus and method for encoding audio signals with decoding instructions |
US7965848B2 (en) * | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
US9088855B2 (en) * | 2006-05-17 | 2015-07-21 | Creative Technology Ltd | Vector-space methods for primary-ambient decomposition of stereo audio signals |
-
2006
- 2006-10-24 DE DE102006050068A patent/DE102006050068B4/de active Active
-
2007
- 2007-10-23 PL PL07819257T patent/PL1997102T3/pl unknown
- 2007-10-23 PL PL12168768T patent/PL2500900T3/pl unknown
- 2007-10-23 JP JP2009533720A patent/JP5048777B2/ja active Active
- 2007-10-23 CN CN2007800348291A patent/CN101536085B/zh active Active
- 2007-10-23 WO PCT/EP2007/009197 patent/WO2008049587A1/en active Application Filing
- 2007-10-23 CA CA2664163A patent/CA2664163C/en active Active
- 2007-10-23 ES ES07819257T patent/ES2391308T3/es active Active
- 2007-10-23 US US12/440,058 patent/US8346565B2/en active Active
- 2007-10-23 AU AU2007308413A patent/AU2007308413B2/en active Active
- 2007-10-23 EP EP07819257A patent/EP1997102B1/en active Active
- 2007-10-23 ES ES12168768.5T patent/ES2461191T3/es active Active
- 2007-10-23 EP EP12168768.5A patent/EP2500900B1/en active Active
- 2007-10-23 KR KR1020097005712A patent/KR101090565B1/ko active IP Right Grant
- 2007-10-24 TW TW096139824A patent/TWI352971B/zh active
-
2009
- 2009-02-18 HK HK09101539.7A patent/HK1122391A1/xx unknown
- 2009-02-18 HK HK13103385.2A patent/HK1176156A1/xx unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004289196A (ja) * | 2002-03-08 | 2004-10-14 | Nippon Telegr & Teleph Corp <Ntt> | ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム |
JP2005004119A (ja) * | 2003-06-16 | 2005-01-06 | Victor Co Of Japan Ltd | 音響信号符号化装置及び音響信号復号化装置 |
JP2005049869A (ja) * | 2003-07-23 | 2005-02-24 | Mitsubishi Electric Research Laboratories Inc | 非定常信号の成分を検出する方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011530913A (ja) * | 2008-08-13 | 2011-12-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 空間出力マルチチャネルオーディオ信号を決定する装置 |
JP2012070414A (ja) * | 2008-08-13 | 2012-04-05 | Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev | 空間出力マルチチャネルオーディオ信号を決定する装置 |
US8824689B2 (en) | 2008-08-13 | 2014-09-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for determining a spatial output multi-channel audio signal |
US8855320B2 (en) | 2008-08-13 | 2014-10-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for determining a spatial output multi-channel audio signal |
US8879742B2 (en) | 2008-08-13 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus for determining a spatial output multi-channel audio signal |
JP2013517687A (ja) * | 2010-01-22 | 2013-05-16 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャネル脱相関を使った改善されたマルチチャネル上方混合 |
US9269360B2 (en) | 2010-01-22 | 2016-02-23 | Dolby Laboratories Licensing Corporation | Using multichannel decorrelation for improved multichannel upmixing |
Also Published As
Publication number | Publication date |
---|---|
PL2500900T3 (pl) | 2014-08-29 |
ES2461191T3 (es) | 2014-05-19 |
HK1122391A1 (en) | 2009-05-15 |
US8346565B2 (en) | 2013-01-01 |
PL1997102T3 (pl) | 2012-11-30 |
WO2008049587A1 (en) | 2008-05-02 |
AU2007308413B2 (en) | 2010-08-26 |
AU2007308413A1 (en) | 2008-05-02 |
ES2391308T3 (es) | 2012-11-23 |
EP2500900B1 (en) | 2014-04-02 |
TWI352971B (en) | 2011-11-21 |
CN101536085A (zh) | 2009-09-16 |
WO2008049587A8 (en) | 2009-04-09 |
DE102006050068A1 (de) | 2008-06-19 |
CA2664163A1 (en) | 2008-05-02 |
JP5048777B2 (ja) | 2012-10-17 |
HK1176156A1 (en) | 2013-07-19 |
KR101090565B1 (ko) | 2011-12-08 |
TW200837718A (en) | 2008-09-16 |
US20100030563A1 (en) | 2010-02-04 |
EP1997102B1 (en) | 2012-07-25 |
DE102006050068B4 (de) | 2010-11-11 |
EP1997102A1 (en) | 2008-12-03 |
KR20090042856A (ko) | 2009-04-30 |
CN101536085B (zh) | 2012-01-25 |
CA2664163C (en) | 2013-07-16 |
EP2500900A1 (en) | 2012-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5048777B2 (ja) | 音声信号からアンビエント信号を生成するための装置および方法、音声信号からマルチチャンネル音声信号を導出するための装置および方法並びにコンピュータプログラム | |
JP6637014B2 (ja) | 音声信号処理のためのマルチチャネル直接・環境分解のための装置及び方法 | |
CA2599969C (en) | Device and method for generating an encoded stereo signal of an audio piece or audio data stream | |
TWI396188B (zh) | 依聆聽事件之函數控制空間音訊編碼參數的技術 | |
AU2015295518B2 (en) | Apparatus and method for enhancing an audio signal, sound enhancing system | |
JP4664431B2 (ja) | アンビエンス信号を生成するための装置および方法 | |
CA2835463C (en) | Apparatus and method for generating an output signal employing a decomposer | |
KR20070107698A (ko) | 오디오 소스의 파라메트릭 조인트 코딩 | |
AU2015255287B2 (en) | Apparatus and method for generating an output signal employing a decomposer | |
Negru et al. | Automatic Audio Upmixing Based on Source Separation and Ambient Extraction Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110614 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110914 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110922 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120703 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120719 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150727 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5048777 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |