JP5455657B2 - 音声の再現を高めるための方法および装置 - Google Patents
音声の再現を高めるための方法および装置 Download PDFInfo
- Publication number
- JP5455657B2 JP5455657B2 JP2009553930A JP2009553930A JP5455657B2 JP 5455657 B2 JP5455657 B2 JP 5455657B2 JP 2009553930 A JP2009553930 A JP 2009553930A JP 2009553930 A JP2009553930 A JP 2009553930A JP 5455657 B2 JP5455657 B2 JP 5455657B2
- Authority
- JP
- Japan
- Prior art keywords
- origin
- channel
- audio
- speech
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 56
- 230000002708 enhancing effect Effects 0.000 title claims description 7
- 230000005236 sound signal Effects 0.000 claims abstract description 48
- 230000001965 increasing effect Effects 0.000 claims abstract description 16
- 230000008447 perception Effects 0.000 claims description 16
- 230000007480 spreading Effects 0.000 claims description 16
- 238000003892 spreading Methods 0.000 claims description 16
- 230000036961 partial effect Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 13
- 238000009792 diffusion process Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000004091 panning Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Description
この発明は、再現された音声信号の起源の方向の認知をどのように向上させるかについての技術に関する。特に、この発明は、音声源の選択可能な方向が他の方向から来る音声信号に対して強調されるか重み付けされるように、記録された音声信号を再生するための装置および方法を提示する。
一般に、多チャンネル再生および聴取では、聴取者は多数のラウドスピーカによって包囲される。特定の設定用に音声信号を取り込むために、さまざまな方法が存在する。再生における1つの一般的な目標は、もともと記録された信号の空間的配置、すなわちオーケストラの中でのトランペットの位置といった個々の音声源の起源を再現することである。いくつかのラウドスピーカ設定はかなり一般的であり、異なる空間的印象を作り出すことができる。特殊な生成後技術(post-production techniques)を用いなければ、一般に知られた2チャンネルステレオ設定は、2つのラウドスピーカ間の配線上に聴覚事象を再度作り出すことしかできない。これは主として、1つの音声源に関連した信号の振幅が2つのラウドスピーカ間で、ラウドスピーカに対する音声源の位置に依存して分配される、いわゆる「振幅パンニング」によって達成される。これは通常、録音中またはその後のミキシング中に行なわれる。つまり、聴取位置に対して左端から到来する音声源は主として左のラウドスピーカによって再生され、一方、聴取位置の前にある音声源は両方のラウドスピーカによって同じ振幅(レベル)で再生されることになる。しかしながら、他の方向から生じる音は再生できない。
いくつかのマイクの使用は、異なるラウドスピーカに関連するマイクで記録されることから、単一方向から発せられる音声が常に必要以上のラウドスピーカで再生されるという事実により、色のついた(colored)不明瞭な音声知覚となる。一般的に、現在利用可能なマイクは、2チャンネルの記録および再生に対して最も適する。すなわち、これらは、囲まれた空間的な印象の再生という目標なしに設計される。
米国特許出願第5,812,674号明細書は、仮想の音声源によって生成される音響品質の模擬実験のため、および1以上の聴取者に対するこの源の局所化のための方法に関する。所望の自然な再生を達成するために、空間、所望の音響品質および仮想の音声源の局所化を定義する知覚パラメータが用いられる。これらの値は、そのエネルギー分布によって時間および周波数の関数として記載されるパルス応答を計算するのに用いられる。室内効果を考慮するために背景補償が行なわれ、室内の記載に基づいて基本信号の人工的な音響が計算される。前に記載した方法で室内音響が一度決定されれば、記録された音声サンプルは、それらが人工的に創造された室内で記録されたかのように聞こえるようにするために後処理され得る。
この発明の一実施例によれば、少なくとも1つの音声チャネルを有する音声信号と、記録位置に関して音声チャネルの部分の起源の方向を示す関連した方向パラメータとは、1つの明確な方向または多くの明確な方向から来る信号の知覚性を高められるように再構築することができる。
図1は、少なくとも1つの音声チャネルを有する音声信号と、記録位置に関して音声チャネルの部分の起源の方向を示す関連した方向パラメータとを再構築するための方法の実施例を示す。選択ステップ10において、記録位置に対する起源の所望の方向は、再構築された音声信号の再構築部分のために選択され、当該再構築された部分は、音声チャネルの部分と対応している。つまり、処理される信号部分に対して、信号部分が再構築後にそこから明確に聴取可能な起源の所望の方向が選択される。当該選択は、以下に詳述するように、ユーザ入力によって直接されるか自動的にされ得る。
価であると解釈され得る。それゆえ、多数のチャネルの各々は、音声チャネル46のチャネル部分を有する。個々の音声部分の起源の方向は、再生のために用いられるラウドスピーカに対応するチャネル部分の強度または振幅を付加的に増加または減少させる方向変更(redirect)ブロック60によって再構築される。この目的のために、方向変更ブロック60は、再生に用いられるラウドスピーカ設定についての知識を一般に必要とする。実際の再分配(方向変更)および関連する重み付け因子の導出は、たとえばベクトルに基づく振幅パンニングのような技術を用いて行なうことができる。幾何学的に異なるラウドスピーカ設定を再分配ブロック60に供給することにより、再生ラウドスピーカの任意の構成は、再生品質の損失なく、独創的な構想を実現するのに用いることが出来る。処理の後、個々のラウドスピーカによって再生され得る時間領域信号を導出するための逆フーリエ変換ブロック62によって、多数の逆フーリエ変換が周波数領域信号に対して行なわれる。再生の前に、ラウドスピーカによって再生されつつある連続的な時間領域信号を導出するための個々の音声フレームを連結させるための総和部64によって、重ね合わせ(overlap)および加算の技術が行なわれなければならない。
付加的な重み付け因子の適用は、代替的な実施例においても、再分配ブロック60内で行なわれ、その場合、再分配ブロック60は、付加的な重み付け因子によって増加または減少される再分配の利得因子を適用する。
パラメータ化され得る。
せることになる。
的な方法を実施することができる。当該実施は、デジタル記憶媒体、特に、独創的な方法が行なわれるように、プログラム可能なコンピュータシステムと共同してそこに記憶される電子的に読み取り可能な制御信号を有するディスク、DVDまたはCD等を用いて行なうことができる。それゆえ、この発明は一般に、コンピュータプログラム製品がコンピュータ上で動作するとき、機械読取可能なキャリアに記憶され、独創的な方法を行なうのに作動的なプログラムコードによるコンピュータプログラム製品である。それゆえに、言い換えると、独創的な方法は、コンピュータプログラムがコンピュータ上で動作するとき、少なくとも1つの独創的な方法を行なうためのプログラムコードを有するコンピュータプログラムである。
Claims (17)
- 少なくとも1つの音声チャネルと記録位置に関して前記音声チャネルの部分の起源の方向を示す関連した方向パラメータとを有する音声信号を再構築するための方法であって、前記音声チャネルの前記部分は、時間部分、周波数部分または前記音声チャネルの周波数間隔の時間部分であり、前記方法は、
記録位置に関して起源の特定の方向を選択するステップと、
再構築された音声信号の再構築された部分を得るために前記音声チャネルの前記部分を調整するステップとを備え、前記音声信号の再構築された部分は、時間部分、周波数部分または前記音声チャネルの周波数間隔の時間部分であり、当該調整は、前記起源の特定の方向からさらに離れた起源の方向を示す方向パラメータを有する前記音声チャネルの他の部分に対して、前記起源の特定の方向に近接した起源の方向を示す方向パラメータを有する音声チャネルの部分の強度を増大させるステップを含み,前記音声チャネルの当該部分は、時間部分、周波数部分または前記音声チャネルの周波数間隔の時間部分である、方法。 - 前記起源の特定の方向を選択するステップは、メモリ装置から前記特定の方向を読み取ることを含む、請求項1に記載の方法。
- 前記調整するステップは、前記音声チャネルの部分の周波数領域の表現を調整することを含む、請求項1に記載の方法。
- 前記調整するステップは、前記音声チャネルの部分の時間領域の表現を調整することを含む、請求項1に記載の方法。
- 前記調整するステップは、前記音声チャネルの各部分に対するスケーリング因子を得るステップを含み、該スケーリング因子を得るステップにおいて、第1のスケーリング因子により乗算されるとともに前記記録位置に対して前記起源の第1の方向を示す関連の方向パラメータを有する音声チャネルの第1の部分が第1の強度を有し、第2のスケーリング因子により乗算されるとともに前記記録位置について前記起源の第2の方向を示す音声チャネルの第2の部分が第2の強度を有するように前記第1および第2のスケーリング因子が算出され、前記記録位置についての前記起源の第1の方向は前記記録位置についての前記起源の第2の方向よりも前記特定の方向により近く、かつ前記第1の強度は前記第2の強度よりも大きい、請求項1に記載の方法。
- 前記少なくとも1つの音声チャネルの周波数表現を導出するステップをさらに含む、請求項1に記載の方法。
- 前記導出するステップは、前記少なくとも1つの音声チャネルの第1および第2の有限幅の周波数間隔の表現を導き出すことを含み、前記第1の周波数間隔の有限幅は、前記第2の周波数間隔の有限幅と異なる、請求項6に記載の方法。
- 前記起源の特定の方向を選択するステップは、前記特定の方向を示す入力パラメータをユーザ入力として受けることを含む、請求項1に記載の方法。
- 前記起源の特定の方向を選択するステップは、前記音声信号に関連する前記特定の方向を示す方向パラメータを受けることを含む、請求項1に記載の方法。
- 前記起源の特定の方向を選択するステップは、前記少なくとも1つの音声チャネルの有限幅の周波数間隔の起源の方向を決定することを含む、請求項1に記載の方法。
- 前記音声チャネルに関連した前記音声チャネルの部分の拡散性を示す拡散パラメータを受けることをさらに含み、
前記音声チャネルの部分を調整するステップは、より低い拡散性を示す拡散パラメータを有する音声チャネルの他の部分に対してより高い拡散性を示す拡散パラメータを有する音声チャネルの部分の強度を減少させることを含む、請求項1に記載の方法。 - 多数のラウドスピーカを有するラウドスピーカシステムを介した再生のために、前記少なくとも1つの音声チャネルを多数のチャネルに混合するステップをさらに含み、前記多数のチャネルの各々は、前記少なくとも1つの音声チャネルの部分に対応するチャネル部分を有する、請求項1に記載の方法。
- 音声信号の指向性知覚を高めるための方法であって、
少なくとも1つの音声チャネルと、記録位置に関して前記音声チャネルの部分の起源の方向を示す関連する方向パラメータとを導出するステップを備え、前記音声チャネルの部分は、時間部分、周波数部分または前記音声チャネルの周波数間隔の時間部分であり、
前記記録位置に関して起源の特定の方向を選択するステップと、
高められた音声信号の部分を導き出すように前記音声チャネルの部分を調整するステップとを含み、当該調整するステップは、起源の前記特定の方向に近接した起源の方向を示す方向パラメータを有する音声チャネルの第1の部分の強度を、前記起源の特定の方向からさらに離れた起源の方向を示す方向パラメータを有する音声チャネルの第2の部分に対して、より増大させるステップを含む、方法。 - 少なくとも1つの音声チャネルと記録位置に関して前記音声チャネルの部分の起源の方向を示す関連した方向パラメータとを有する音声信号を再構築するための音声復号器であって、前記音声チャネルの部分は、時間部分、周波数部分または前記音声チャネルの周波数間隔の時間部分であり、
前記記録位置に関して起源の特定の方向を選択するようにされた方向選択器と、
再構築された音声信号の再構築された部分を得るために前記音声チャネルの部分を調整するための音声部分調整器とを備え、前記音声チャネルの再構築された部分は、時間部分、周波数部分または前記再構築された音声信号の周波数間隔の時間部分であり、
当該調整は、起源の特定の方向に近接した起源の方向を示す方向パラメータを有する音声チャネルの第1の部分の強度を、前記起源の特定の方向からさらに離れた起源の方向を示す方向パラメータを有する音声チャネルの第2の部分に対して、より増大させることを含む、音声復号器。 - 音声信号の指向性知覚を高めるための音声符号器であって、
少なくとも1つの音声チャネルと、記録位置に関して前記音声チャネルの部分の起源の方向を示す関連した方向パラメータとを導出するための信号生成器を備え、前記音声チャネルの部分は、時間部分、周波数部分または前記音声チャネルの周波数間隔の時間部分であり、
前記記録位置に関して起源の特定の方向を選択するようにされた方向選択器と、
高められた音声信号の部分を得るために前記音声チャネルの部分を調整するための信号調整器とを備え、前記音声チャネルの当該部分は、時間部分、周波数部分、または前記音声チャネルの周波数間隔の時間部分であり、当該調整は、起源の特定の方向に近接した起源の方向を示す方向パラメータを有する音声チャネルの部分の強度を、前記起源の特定の方向からさらに離れた起源の方向を示す方向パラメータを有する音声チャネルの第2の部分に対して、より増大させることを含む、音声符号器。 - 再構築された音声信号を高めるためのシステムであって、
少なくとも1つの音声チャネルと、記録位置に関して音声チャネルの部分の起源の方向を示す関連した方向パラメータとを有する音声信号を導出するための音声符号器を備え、前記音声チャネルの部分は、時間部分、周波数部分または前記音声チャネルの周波数間隔の時間部分であり、
前記記録位置に関して起源の設定方向を選択するようにされた方向選択器と、
再構築された音声信号の再構築された部分を得るために前記音声チャネルの部分を調整するための音声部分調整器を有する音声復号器とを備え、前記音声信号の再構築された部分は、時間部分、周波数部分、または前記音声信号の周波数間隔の時間部分であり、当該調整は、起源の特定の方向に近接した起源の方向を示す方向パラメータを有する音声チャネルの第1の部分の強度を、前記起源の特定の設定方向からさらに離れた起源の方向を示す方向パラメータを有する音声チャネルの他の部分に対して、より増大させることを含む、システム。 - コンピュータ上で動作するとき請求項1または13の方法を実行するためのコンピュータプログラムを格納するコンピュータ読み取り可能媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US89618407P | 2007-03-21 | 2007-03-21 | |
US60/896,184 | 2007-03-21 | ||
US11/742,488 | 2007-04-30 | ||
US11/742,488 US20080232601A1 (en) | 2007-03-21 | 2007-04-30 | Method and apparatus for enhancement of audio reconstruction |
PCT/EP2008/000829 WO2008113427A1 (en) | 2007-03-21 | 2008-02-01 | Method and apparatus for enhancement of audio reconstruction |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010521909A JP2010521909A (ja) | 2010-06-24 |
JP5455657B2 true JP5455657B2 (ja) | 2014-03-26 |
Family
ID=39322757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009553930A Active JP5455657B2 (ja) | 2007-03-21 | 2008-02-01 | 音声の再現を高めるための方法および装置 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20080232601A1 (ja) |
EP (1) | EP2130403B1 (ja) |
JP (1) | JP5455657B2 (ja) |
KR (1) | KR101096072B1 (ja) |
CN (1) | CN101658052B (ja) |
AT (1) | ATE476835T1 (ja) |
BR (1) | BRPI0808225B1 (ja) |
DE (1) | DE602008002066D1 (ja) |
HK (1) | HK1138977A1 (ja) |
RU (1) | RU2416172C1 (ja) |
TW (1) | TWI456569B (ja) |
WO (1) | WO2008113427A1 (ja) |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
US8908873B2 (en) * | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US8180062B2 (en) * | 2007-05-30 | 2012-05-15 | Nokia Corporation | Spatial sound zooming |
PL2154677T3 (pl) * | 2008-08-13 | 2013-12-31 | Fraunhofer Ges Forschung | Urządzenie do wyznaczania konwertowanego przestrzennego sygnału audio |
EP2446642B1 (en) * | 2009-06-23 | 2017-04-12 | Nokia Technologies Oy | Method and apparatus for processing audio signals |
WO2011101708A1 (en) * | 2010-02-17 | 2011-08-25 | Nokia Corporation | Processing of multi-device audio capture |
EP2553947B1 (en) | 2010-03-26 | 2014-05-07 | Thomson Licensing | Method and device for decoding an audio soundfield representation for audio playback |
EP2375410B1 (en) * | 2010-03-29 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal |
CN101867853B (zh) * | 2010-06-08 | 2014-11-05 | 中兴通讯股份有限公司 | 基于传声器阵列的语音信号处理方法及装置 |
WO2012004057A1 (en) * | 2010-07-06 | 2012-01-12 | Bang & Olufsen A/S | A method and an apparatus for a user to select one of a multiple of audio tracks |
ES2922639T3 (es) * | 2010-08-27 | 2022-09-19 | Sennheiser Electronic Gmbh & Co Kg | Método y dispositivo para la reproducción mejorada de campo sonoro de señales de entrada de audio codificadas espacialmente |
US9055371B2 (en) * | 2010-11-19 | 2015-06-09 | Nokia Technologies Oy | Controllable playback system offering hierarchical playback options |
US9313599B2 (en) | 2010-11-19 | 2016-04-12 | Nokia Technologies Oy | Apparatus and method for multi-channel signal playback |
US9456289B2 (en) | 2010-11-19 | 2016-09-27 | Nokia Technologies Oy | Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof |
EP2600343A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for merging geometry - based spatial audio coding streams |
BR112014017457A8 (pt) * | 2012-01-19 | 2017-07-04 | Koninklijke Philips Nv | aparelho de transmissão de áudio espacial; aparelho de codificação de áudio espacial; método de geração de sinais de saída de áudio espacial; e método de codificação de áudio espacial |
EP2832115B1 (en) | 2012-03-30 | 2017-07-05 | Barco N.V. | Apparatus and method for creating proximity sound effects in audio systems |
EP2645749B1 (en) * | 2012-03-30 | 2020-02-19 | Samsung Electronics Co., Ltd. | Audio apparatus and method of converting audio signal thereof |
WO2013150341A1 (en) | 2012-04-05 | 2013-10-10 | Nokia Corporation | Flexible spatial audio capture apparatus |
US9161149B2 (en) | 2012-05-24 | 2015-10-13 | Qualcomm Incorporated | Three-dimensional sound compression and over-the-air transmission during a call |
WO2013186593A1 (en) * | 2012-06-14 | 2013-12-19 | Nokia Corporation | Audio capture apparatus |
US9268522B2 (en) | 2012-06-27 | 2016-02-23 | Volkswagen Ag | Devices and methods for conveying audio information in vehicles |
EP2688066A1 (en) | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
BR122021021506B1 (pt) | 2012-09-12 | 2023-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d |
US9729993B2 (en) | 2012-10-01 | 2017-08-08 | Nokia Technologies Oy | Apparatus and method for reproducing recorded audio with correct spatial directionality |
US9396732B2 (en) * | 2012-10-18 | 2016-07-19 | Google Inc. | Hierarchical deccorelation of multichannel audio |
EP2733965A1 (en) * | 2012-11-15 | 2014-05-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals |
CN103124386A (zh) * | 2012-12-26 | 2013-05-29 | 山东共达电声股份有限公司 | 一种远讲用降噪、消回波、锐指向传声器 |
US9357306B2 (en) | 2013-03-12 | 2016-05-31 | Nokia Technologies Oy | Multichannel audio calibration method and apparatus |
CN105210389B (zh) * | 2013-03-19 | 2017-07-25 | 皇家飞利浦有限公司 | 用于确定麦克风的位置的方法和装置 |
WO2014162171A1 (en) | 2013-04-04 | 2014-10-09 | Nokia Corporation | Visual audio processing apparatus |
EP4300488A3 (en) | 2013-04-05 | 2024-02-28 | Dolby International AB | Stereo audio encoder and decoder |
EP2991383B1 (en) * | 2013-04-26 | 2021-01-27 | Sony Corporation | Audio processing device and audio processing system |
WO2014184618A1 (en) | 2013-05-17 | 2014-11-20 | Nokia Corporation | Spatial object oriented audio apparatus |
TWI634798B (zh) * | 2013-05-31 | 2018-09-01 | 新力股份有限公司 | Audio signal output device and method, encoding device and method, decoding device and method, and program |
CN104575515A (zh) * | 2013-10-23 | 2015-04-29 | 中兴通讯股份有限公司 | 一种提高语音质量的方法及装置 |
RU2558642C2 (ru) * | 2013-12-18 | 2015-08-10 | Владимир Георгиевич Потёмкин | Способ формирования сигнала для управления электроакустическим излучателем |
EP2942981A1 (en) * | 2014-05-05 | 2015-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | System, apparatus and method for consistent acoustic scene reproduction based on adaptive functions |
US9959876B2 (en) * | 2014-05-16 | 2018-05-01 | Qualcomm Incorporated | Closed loop quantization of higher order ambisonic coefficients |
KR102454747B1 (ko) * | 2014-06-27 | 2022-10-17 | 돌비 인터네셔널 에이비 | Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 장치 |
CN105992120B (zh) * | 2015-02-09 | 2019-12-31 | 杜比实验室特许公司 | 音频信号的上混音 |
WO2016168408A1 (en) | 2015-04-17 | 2016-10-20 | Dolby Laboratories Licensing Corporation | Audio encoding and rendering with discontinuity compensation |
EP3378241B1 (en) * | 2015-11-20 | 2020-05-13 | Dolby International AB | Improved rendering of immersive audio content |
US20170264942A1 (en) * | 2016-03-11 | 2017-09-14 | Mediatek Inc. | Method and Apparatus for Aligning Multiple Audio and Video Tracks for 360-Degree Reconstruction |
JP6634976B2 (ja) * | 2016-06-30 | 2020-01-22 | 株式会社リコー | 情報処理装置、及びプログラム |
WO2018064296A1 (en) | 2016-09-29 | 2018-04-05 | Dolby Laboratories Licensing Corporation | Method, systems and apparatus for determining audio representation(s) of one or more audio sources |
US10257633B1 (en) | 2017-09-15 | 2019-04-09 | Htc Corporation | Sound-reproducing method and sound-reproducing apparatus |
CN109683846B (zh) * | 2017-10-18 | 2022-04-19 | 宏达国际电子股份有限公司 | 声音播放装置、方法及非暂态存储媒体 |
CN109688497B (zh) * | 2017-10-18 | 2021-10-01 | 宏达国际电子股份有限公司 | 声音播放装置、方法及非暂态存储介质 |
WO2019097017A1 (en) | 2017-11-17 | 2019-05-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions |
GB2572419A (en) * | 2018-03-29 | 2019-10-02 | Nokia Technologies Oy | Spatial sound rendering |
GB2572420A (en) * | 2018-03-29 | 2019-10-02 | Nokia Technologies Oy | Spatial sound rendering |
GB2573537A (en) * | 2018-05-09 | 2019-11-13 | Nokia Technologies Oy | An apparatus, method and computer program for audio signal processing |
US11432069B2 (en) | 2019-10-10 | 2022-08-30 | Boomcloud 360, Inc. | Spectrally orthogonal audio component processing |
WO2022020365A1 (en) * | 2020-07-20 | 2022-01-27 | Orbital Audio Laboratories, Inc. | Multi-stage processing of audio signals to facilitate rendering of 3d audio via a plurality of playback devices |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5208860A (en) * | 1988-09-02 | 1993-05-04 | Qsound Ltd. | Sound imaging method and apparatus |
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
JPH07222299A (ja) * | 1994-01-31 | 1995-08-18 | Matsushita Electric Ind Co Ltd | 音像移動処理編集装置 |
US5850453A (en) * | 1995-07-28 | 1998-12-15 | Srs Labs, Inc. | Acoustic correction apparatus |
FR2738099B1 (fr) * | 1995-08-25 | 1997-10-24 | France Telecom | Procede de simulation de la qualite acoustique d'une salle et processeur audio-numerique associe |
US5870484A (en) * | 1995-09-05 | 1999-02-09 | Greenberger; Hal | Loudspeaker array with signal dependent radiation pattern |
US6697491B1 (en) * | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
JP3594281B2 (ja) * | 1997-04-30 | 2004-11-24 | 株式会社河合楽器製作所 | ステレオ拡大装置及び音場拡大装置 |
EP0990370B1 (en) * | 1997-06-17 | 2008-03-05 | BRITISH TELECOMMUNICATIONS public limited company | Reproduction of spatialised audio |
FI116990B (fi) * | 1997-10-20 | 2006-04-28 | Nokia Oyj | Menetelmä ja järjestelmä akustisen virtuaaliympäristön käsittelemiseksi |
DE60010457T2 (de) * | 2000-09-02 | 2006-03-02 | Nokia Corp. | Vorrichtung und Verfahren zur Verarbeitung eines Signales emittiert von einer Zielsignalquelle in einer geräuschvollen Umgebung |
KR100922910B1 (ko) * | 2001-03-27 | 2009-10-22 | 캠브리지 메카트로닉스 리미티드 | 사운드 필드를 생성하는 방법 및 장치 |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
JP3810004B2 (ja) * | 2002-03-15 | 2006-08-16 | 日本電信電話株式会社 | ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
WO2006003813A1 (ja) * | 2004-07-02 | 2006-01-12 | Matsushita Electric Industrial Co., Ltd. | オーディオ符号化及び復号化装置 |
US7720232B2 (en) * | 2004-10-15 | 2010-05-18 | Lifesize Communications, Inc. | Speakerphone |
US8873768B2 (en) * | 2004-12-23 | 2014-10-28 | Motorola Mobility Llc | Method and apparatus for audio signal enhancement |
JP4804014B2 (ja) * | 2005-02-23 | 2011-10-26 | 沖電気工業株式会社 | 音声会議装置 |
WO2006137400A1 (ja) * | 2005-06-21 | 2006-12-28 | Japan Science And Technology Agency | ミキシング装置及び方法並びにプログラム |
-
2007
- 2007-04-30 US US11/742,488 patent/US20080232601A1/en not_active Abandoned
-
2008
- 2008-02-01 AT AT08707512T patent/ATE476835T1/de not_active IP Right Cessation
- 2008-02-01 BR BRPI0808225A patent/BRPI0808225B1/pt active IP Right Grant
- 2008-02-01 KR KR1020097019538A patent/KR101096072B1/ko active IP Right Grant
- 2008-02-01 RU RU2009134471/09A patent/RU2416172C1/ru active
- 2008-02-01 CN CN2008800088335A patent/CN101658052B/zh active Active
- 2008-02-01 DE DE602008002066T patent/DE602008002066D1/de active Active
- 2008-02-01 EP EP08707512A patent/EP2130403B1/en active Active
- 2008-02-01 WO PCT/EP2008/000829 patent/WO2008113427A1/en active Application Filing
- 2008-02-01 JP JP2009553930A patent/JP5455657B2/ja active Active
- 2008-03-19 TW TW097109730A patent/TWI456569B/zh active
-
2010
- 2010-06-04 HK HK10105552.7A patent/HK1138977A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
TWI456569B (zh) | 2014-10-11 |
CN101658052B (zh) | 2013-01-30 |
TW200841326A (en) | 2008-10-16 |
WO2008113427A1 (en) | 2008-09-25 |
CN101658052A (zh) | 2010-02-24 |
DE602008002066D1 (de) | 2010-09-16 |
EP2130403A1 (en) | 2009-12-09 |
ATE476835T1 (de) | 2010-08-15 |
BRPI0808225B1 (pt) | 2019-12-24 |
RU2416172C1 (ru) | 2011-04-10 |
KR20090121348A (ko) | 2009-11-25 |
BRPI0808225A2 (pt) | 2014-07-08 |
JP2010521909A (ja) | 2010-06-24 |
KR101096072B1 (ko) | 2011-12-20 |
EP2130403B1 (en) | 2010-08-04 |
HK1138977A1 (en) | 2010-09-03 |
US20080232601A1 (en) | 2008-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5455657B2 (ja) | 音声の再現を高めるための方法および装置 | |
US9015051B2 (en) | Reconstruction of audio channels with direction parameters indicating direction of origin | |
US7489788B2 (en) | Recording a three dimensional auditory scene and reproducing it for the individual listener | |
Spors et al. | Spatial sound with loudspeakers and its perception: A review of the current state | |
KR101547035B1 (ko) | 다중 마이크에 의한 3차원 사운드 포착 및 재생 | |
Kyriakakis et al. | Surrounded by sound | |
Pulkki et al. | First‐Order Directional Audio Coding (DirAC) | |
Alexandridis et al. | Capturing and reproducing spatial audio based on a circular microphone array | |
Laitinen et al. | Binaural reproduction for directional audio coding | |
KR20150021052A (ko) | 3 차원 사운드 압축 및 호출 동안의 오버-디-에어 송신 | |
CN109155895B (zh) | 有源监听耳机及用于正则化其反演的方法 | |
CA2744429C (en) | Converter and method for converting an audio signal | |
CN113170271A (zh) | 用于处理立体声信号的方法和装置 | |
Ahrens | Auralization of omnidirectional room impulse responses based on the spatial decomposition method and synthetic spatial data | |
Pulkki et al. | Directional audio coding-perception-based reproduction of spatial sound | |
Pfanzagl-Cardone | The Art and Science of Surround-and Stereo-Recording | |
Pulkki et al. | Spatial effects | |
Laitinen | Binaural reproduction for directional audio coding | |
Lokki | Recording and reproducing concert hall acoustics for subjective evaluation | |
Pulkki et al. | Spatial impulse response rendering: A tool for reproducing room acoustics for multi-channel listening | |
AU2002325063B2 (en) | Recording a three dimensional auditory scene and reproducing it for the individual listener | |
Pfanzagl-Cardone | Introductory Critical Analysis and Case Studies | |
Alexandridis et al. | Research Article Capturing and Reproducing Spatial Audio Based on a Circular Microphone Array | |
Kan et al. | Psychoacoustic evaluation of different methods for creating individualized, headphone-presented virtual auditory space from B-format room impulse responses | |
Pulkki et al. | Perception-based Reproduction of Spatial Sound with Directional Audio Coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111213 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120312 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120313 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120319 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120321 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130122 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130417 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130717 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5455657 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |