JP2018510374A - 目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法 - Google Patents
目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法 Download PDFInfo
- Publication number
- JP2018510374A JP2018510374A JP2017545563A JP2017545563A JP2018510374A JP 2018510374 A JP2018510374 A JP 2018510374A JP 2017545563 A JP2017545563 A JP 2017545563A JP 2017545563 A JP2017545563 A JP 2017545563A JP 2018510374 A JP2018510374 A JP 2018510374A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- frequency domain
- time domain
- envelope
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 193
- 238000012545 processing Methods 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims description 117
- 230000003595 spectral effect Effects 0.000 claims abstract description 49
- 238000000926 separation method Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000001228 spectrum Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 238000005457 optimization Methods 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 230000001419 dependent effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000000873 masking effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 abstract description 42
- 230000001052 transient effect Effects 0.000 description 26
- 238000007792 addition Methods 0.000 description 14
- 238000000354 decomposition reaction Methods 0.000 description 12
- 238000011049 filling Methods 0.000 description 10
- 239000000203 mixture Substances 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012804 iterative process Methods 0.000 description 4
- 238000009527 percussion Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000002592 echocardiography Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000665848 Isca Species 0.000 description 1
- 241001028048 Nicola Species 0.000 description 1
- XRKZVXDFKCVICZ-IJLUTSLNSA-N SCB1 Chemical compound CC(C)CCCC[C@@H](O)[C@H]1[C@H](CO)COC1=O XRKZVXDFKCVICZ-IJLUTSLNSA-N 0.000 description 1
- 101100439280 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CLB1 gene Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
Description
1)時間周波数領域表現から時間領域信号を繰返し再構成すること、
2)マグニチュード、位相情報および時間周波数領域表現に対する初期推定を生成すること、
3)繰返しの間、ある信号特性に中間的信号操作を適用すること、
4)時間周波数領域表現を時間領域へ変換すること、
5)任意の振幅エンベロープを有する中間的な時間領域信号を変調すること、
6)変調された時間領域信号を時間周波数領域へ変換すること、
7)時間周波数領域表現を更新するために結果として生じる位相情報を使用すること、
8)隣接するフレームから中央フレームに特に畳み込まれ、かつシフトされた寄与を追加する時間周波数領域処理によって逆変換および順変換のシーケンスをエミュレートすること、
9)短縮された畳み込みカーネルを使用し、対称性を利用して上記の処理を近似すること、
10)目標フレームの時間周波数表現との所望のフレームの畳み込みによって時間領域変調をエミュレートすること、
11)時間周波数領域操作を時間周波数依存方式で適用するには、例えば、時間周波数ビンを選択するためにのみ操作を適用すること、または、
12)知覚的オーディオ符号化のための上述の処理を使用するために、オーディオソース分離、および/または帯域幅エンハンスメントを含むこと、
のための、方法、装置またはプログラムでありうる。
[1] Daniel W. Griffin and Jae S. Lim, "Signal estimation from modified short-time Fourier transform", IEEE Transactions on Acoustics, Speech and Signal Processing, vol. 32, no. 2, pp. 236-243, April 1984.
[2] Jonathan Le Roux, Nobutaka Ono, and Shigeki Sagayama, "Explicit consistency constraints for STFT spectrograms and their application to phase reconstruction" in Proceedings of the ISCA Tutorial and Research Workshop on Statistical And Perceptual Audition, Brisbane, Australia, September 2008, pp. 23-28.
[3] Xinglei Zhu, Gerald T. Beauregard, and Lonce L. Wyse, "Real-time signal estimation from modified short-time Fourier transform magnitude spectra", IEEE Transactions on Audio, Speech, and Language Processing, vol. 15, no. 5, pp. 1645-1653, July 2007.
[4] Jonathan Le Roux, Hirokazu Kameoka, Nobutaka Ono, and Shigeki Sagayama, "Phase initialization schemes for faster spectrogram-consistency-based signal reconstruction" in Proceedings of the Acoustical Society of Japan Autumn Meeting, September 2010, number 3-10-3.
[5] Nicolas Sturmel and Laurent Daudet, "Signal reconstruction from STFT magnitude: a state of the art" in Proceedings of the International Conference on Digital Audio Effects (DAFx), Paris, France, September 2011, pp. 375-386.
[6] Nathanaoel Perraudin, Peter Balazs, and Peter L. Soendergaard, "A fast Griffin-Lim algorithm" in Proceedings IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), New Paltz, NY, USA, October 2013, pp. 1-4.
[7] Dennis L. Sun and Julius O. Smith III, "Estimating a signal from a magnitude spectrogram via convex optimization" in Proceedings of the Audio Engineering Society (AES) Convention, San Francisco, USA, October 2012, Preprint 8785.
[8] Tomohiko Nakamura and Hiokazu Kameoka, "Fast signal reconstruction from magnitude spectrogram of continuous wavelet transform based on spectrogram consistency" in Proceedings of the International Conference on Digital Audio Effects (DAFx), Erlangen, Germany, September 2014, pp. 129-135.
[9] Volker Gnann and Martin Spiertz, "Inversion of shorttime fourier transform magnitude spectrograms with adaptive window lengths" in Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, (ICASSP), Taipei, Taiwan, April 2009, pp. 325-328.
[10] Jonathan Le Roux, Hirokazu Kameoka, Nobutaka Ono, and Shigeki Sagayama, "Fast signal reconstruction from magnitude STFT spectrogram based on spectrogram consistency" in Proceedings International Conference on Digital Audio Effects (DAFx), Graz, Austria, September 2010, pp. 397-403.
Claims (24)
- 処理されたオーディオ信号(6)を得るために、オーディオ信号(49)を処理するための装置(2)であって、
オーディオ信号(4)のオーバーラップしているフレームを表現している一連の周波数領域フレーム(12)のスペクトル値のための位相値(10)を計算するための位相計算機(8)を含み、
前記位相計算機(8)は、前記処理されたオーディオ信号(6)に関連した目標時間領域エンベロープ(14)についての情報に基づいて、位相値(10)を計算するように構成され、その結果、前記処理されたオーディオ信号が、少なくとも近似に、前記目標時間領域エンベロープ(14)および前記一連の周波数領域フレーム(12)によって決定されたスペクトル・エンベロープを持つ、装置。 - 前記位相計算機(8)は、
初期の位相値(18)から開始して、オーバーラップしている範囲の中のオーバーラップしているブロックの整合性を必要とする最適化目標を使って、スペクトル値のための位相値を計算するために、繰返しのアルゴリズムを実行するための繰返しプロセッサ(16)を含み、
前記繰返しプロセッサ(16)は、別の繰返しステップの中で、前記目標時間領域エンベロープ(14)に依存している更新された位相推定(20)を使うように構成されている、請求項1に記載の装置(2)。 - 前記位相計算機(8)は、少なくとも1つの目標時間領域エンベロープ(14)および少なくとも1つの中間的な周波数領域再構成(28’)のスペクトル表現の回旋、または、オーディオ信号の少なくとも1つの目標時間領域エンベロープまたは少なくとも1つの中間的な周波数領域再構成の、選択された部分または帯域またはハイパス部分のみまたはほんのいくつかの帯域通過部分のみを適用するように構成されている、請求項1または請求項2に記載の装置(2)。
- 前記位相計算機は、
前記一連の周波数領域フレーム(12)および先行繰返しステップの初期位相値推定(18)または位相値推定(20)から前記オーディオ信号(4)の前記中間的な時間領域再構成(28)を計算するための周波数から時間へのコンバータ(22)と、
振幅変調したオーディオ信号(30)を得るために、目標時間領域エンベロープ(14)を使用して、中間的な時間領域再構成(28)を変調するための振幅変調器(24)と、
前記振幅変調した信号(30)を、位相値(10)を持つ別の一連の周波数領域フレーム(32)に変換するための時間から周波数へのコンバータ(26)と、を含み、
前記位相計算機は、次の繰返しステップのために、前記一連の周波数領域フレーム(12)の前記位相値および前記スペクトル値を使うように構成されている、請求項3に記載の装置(2)。 - 前記位相計算機(8)は、繰返し決定条件が満たされたとき、前記処理されたオーディオ信号(6)として、前記中間的な時間領域再構成(28)を出力するように構成されている、請求項5に記載の装置(2)。
- 前記位相計算機は、前記オーディオ信号(4)の前記中間的な周波数領域再構成(28’)を得るために、回旋カーネルを適用し、シフト・カーネルを適用し、中心的フレームに隣接したフレームのオーバーラップしている部分を前記中心的フレームに追加するための回旋プロセッサ(40)を含んでいる、請求項4に記載の装置(2)。
- 前記位相計算機(8)は、次の繰返しステップについて、更新された位相値推定(20)として、前記回旋(34)によって得られた位相値(10)を使用するように構成されている、請求項4または請求項6に記載の装置(2)。
- 前記目標時間領域エンベロープを前記スペクトル領域に変換するための目標エンベロープコンバータ(36)をさらに含む、請求項4または請求項6または請求項7のいずれか1つに記載の装置(2)。
- 最新の繰返しステップおよび前記一連の周波数領域フレーム(12)から得られた前記位相値推定(10,20)を使って、前記中間的な周波数領域再構成(28’,28’’’)から前記時間領域再構成(28’’)を計算するための周波数から時間へのコンバータ(38)をさらに含む、請求項4または請求項6または請求項7または請求項8のいずれか1つに記載の装置(2)。
- 前記位相計算機(8)は、前記一連の周波数領域フレーム(12)を処理するために回旋プロセッサ(40)を含み、前記回旋プロセッサは、前記中間的な周波数領域再構成を決定するために、時間領域の重畳加算処理を、前記周波数領域の中の前記一連の周波数領域フレーム(12)に適用するように構成されている、請求項4または請求項6または請求項7または請求項8または請求項9のいずれか1つに記載の装置(2)。
- 前記回旋プロセッサ(40)は、現在の周波数領域フレームに基づいて、時間領域の重畳加算が前記周波数領域の中で実行された後に、現在の周波数領域フレームに寄与する、隣接した周波数領域フレームの部分を決定するように構成され、
前記回旋プロセッサは、前記現在の周波数領域フレーム内の前記隣接した周波数領域フレームの部分のオーバーラップしている位置を決定し、前記オーバーラップしている位置で、隣接する周波数領域フレームの前記部分と前記現在の周波数領域フレームの加算を実行するようにさらに構成されている、請求項10の装置(2)。 - 前記回旋プロセッサは、時間領域の重畳加算が前記周波数領域の中で実行された後に、現在の周波数領域フレームに寄与する、隣接した周波数領域フレームの部分を決定するために、時間領域合成と時間領域分析ウィンドウとを、周波数から時間に変換するように構成され、
前記回旋プロセッサは、前記現在の周波数領域フレーム内で、前記隣接した周波数領域フレームの位置を、オーバーラップしている位置に移動して、前記オーバーラップしている位置で、前記隣接した周波数領域フレームの部分を前記現在のフレームに適用するようにさらに構成されている、請求項10または請求項11に記載の装置(2)。 - 前記位相計算機(8)は、グリフィンとリムによる繰返しの信号再構成処理に従って、繰返しのアルゴリズムを実行するように構成されている、請求項1ないし請求項12のいずれか1つに記載の装置(2)。
- オーディオ信号を符号化するためのオーディオエンコーダ(100)であって、
符号化されたオーディオ信号(108)が、オーディオ信号の一連の周波数領域フレームの表現と目標時間領域エンベロープの表現とを含むように、オーディオ信号を符号化するために構成されたオーディオ信号プロセッサ(102)と、
前記オーディオ信号から時間領域エンベロープを決定するために構成されたエンベロープ決定器(104)と、を含み、
前記エンベロープ決定器(104)は、前記エンベロープを、所定のエンベロープのセットと比較して、前記比較に基づいて、前記目標時間領域エンベロープ(14)の表現を決定するようにさらに構成されている、オーディオエンコーダ(100)。 - 請求項1ないし請求項13のいずれか1つに記載の装置(2)と、
符号化された信号(108)を受信するための入力インタフェース(112)と、を含み、
前記符号化された信号は、前記一連の周波数領域フレームの表現および前記目標時間領域エンベロープ(18)の表現を含む、オーディオデコーダ(110)。 - 前記時間領域オーディオ信号(4)の一連の周波数領域フレーム(12)の表現および目標時間領域エンベロープ(14)の表現を含む、オーディオ信号(114)。
- 請求項1ないし請求項13のいずれか1つに記載の処理するための装置(2)と、
処理するための装置に入力する変調されたオーディオ信号を得るために、もとのオーディオ信号のスペクトルをマスキングするためのスペクトルマスク器(118)と、を含み、
前記処理されたオーディオ信号(6)は、前記目標時間領域エンベロープ(14)と関連した、分離されたソース信号である、オーディオソース分離プロセッサ(116)。 - 符号化されたオーディオ信号を処理するための帯域幅エンハンスメントプロセッサ(122)であって、
前記符号化された信号に含まれるオーディオ信号帯域からエンハンスメント信号(127)を生成するためのエンハンスメントプロセッサ(126)と、
請求項1ないし請求項13のいずれか1つに記載の処理するための装置(2)と、を含み、
前記エンハンスメントプロセッサ(126)は、前記符号化された信号に含まれる符号化された表現、または、前記符号化された信号に含まれる前記オーディオ信号帯域から、前記目標時間領域エンベロープ(14)を抽出するように構成されている、帯域幅エンハンスメントプロセッサ(122)。 - 処理されたオーディオ信号を得るためにオーディオ信号を処理するための方法(2200)であって、
前記オーディオ信号のオーバーラップしているフレームを表現する一連の周波数領域フレームのスペクトル値のための位相値を計算するステップを含み、
前記位相値は、前記処理されたオーディオ信号に関連した目標時間領域エンベロープについての情報に基づいて計算され、その結果、前記処理されたオーディオ信号が、少なくとも近似に、前記一連の周波数領域フレームによって決定された前記目標時間領域エンベロープおよびスペクトル・エンベロープを持つ、方法(2200)。 - オーディオ復号化の方法(2300)であって、
請求項19の方法、
符号化された信号を受信するステップを含み、前記符号化された信号は、前記一連の周波数領域フレームの表現および前記目標時間領域エンベロープの表現を含む、方法(2300)。 - オーディオソース分離の方法(2400)であって、
請求項19の方法、
処理のための装置の中に入力される変調されたオーディオ信号を得るために、もとのオーディオ信号のスペクトルをマスキングするステップを含み、
前記処理されたオーディオ信号は、前記目標時間領域エンベロープに関連した分離されたソース信号である、方法(2400)。 - 符号化されたオーディオ信号の帯域幅エンハンスメントの方法(2500)であって、
エンハンスメント信号を、前記符号化された信号に含まれたオーディオ信号帯域から生成するステップと、
請求項19の方法を含み、
前記生成するステップは、前記符号化された信号に含まれた符号化された表現、または、前記符号化された信号に含まれた前記オーディオ信号帯域から、前記目標時間領域エンベロープを抽出するステップを含む、方法(2500)。 - オーディオ符号化の方法(2600)であって、
前記符号化されたオーディオ信号が、オーディオ信号の一連の周波数領域フレームの表現および目標時間領域エンベロープの表現を含むように、前記オーディオ信号を符号化し、
前記オーディオ信号から時間領域エンベロープを決定し、
前記エンベロープを、所定のエンベロープのセットと比較して、前記比較に基づいて、前記目標時間領域エンベロープの表現を決定するステップを含む、方法(2600)。 - コンピュータまたはプロセッサで動作させると、請求項19、請求項20、請求項21、請求項22、または請求項23のうちのいずれか1つの方法を実行するためのコンピュータ・プログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15156704 | 2015-02-26 | ||
EP15156704.7 | 2015-02-26 | ||
EP15181118 | 2015-08-14 | ||
EP15181118.9 | 2015-08-14 | ||
PCT/EP2016/053752 WO2016135132A1 (en) | 2015-02-26 | 2016-02-23 | Apparatus and method for processing an audio signal to obtain a processed audio signal using a target time-domain envelope |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018510374A true JP2018510374A (ja) | 2018-04-12 |
JP2018510374A5 JP2018510374A5 (ja) | 2019-04-18 |
JP6668372B2 JP6668372B2 (ja) | 2020-03-18 |
Family
ID=55409840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017545563A Active JP6668372B2 (ja) | 2015-02-26 | 2016-02-23 | 目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US10373623B2 (ja) |
EP (1) | EP3262639B1 (ja) |
JP (1) | JP6668372B2 (ja) |
KR (1) | KR102125410B1 (ja) |
CN (1) | CN107517593B (ja) |
BR (1) | BR112017018145B1 (ja) |
CA (1) | CA2976864C (ja) |
ES (1) | ES2837107T3 (ja) |
MX (1) | MX2017010593A (ja) |
RU (1) | RU2679254C1 (ja) |
WO (1) | WO2016135132A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017083736A (ja) * | 2015-10-30 | 2017-05-18 | 日本電信電話株式会社 | 信号波形推定装置、信号波形推定方法、プログラム |
CN111954904A (zh) * | 2018-04-16 | 2020-11-17 | 三菱电机株式会社 | 用于转换输入音频信号的音频信号处理系统及方法 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9842609B2 (en) * | 2016-02-16 | 2017-12-12 | Red Pill VR, Inc. | Real-time adaptive audio source separation |
US10224042B2 (en) * | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
EP3382703A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
EP3457401A1 (en) * | 2017-09-18 | 2019-03-20 | Thomson Licensing | Method for modifying a style of an audio object, and corresponding electronic device, computer readable program products and computer readable storage medium |
WO2019083130A1 (ko) * | 2017-10-25 | 2019-05-02 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
EP3576088A1 (en) | 2018-05-30 | 2019-12-04 | Fraunhofer Gesellschaft zur Förderung der Angewand | Audio similarity evaluator, audio encoder, methods and computer program |
EP3841821B1 (en) * | 2018-08-20 | 2023-06-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Physical random access channel signal generation optimization for 5g new radio |
WO2020094263A1 (en) * | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
US10659099B1 (en) * | 2018-12-12 | 2020-05-19 | Samsung Electronics Co., Ltd. | Page scanning devices, computer-readable media, and methods for bluetooth page scanning using a wideband receiver |
EP3671741A1 (en) * | 2018-12-21 | 2020-06-24 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Audio processor and method for generating a frequency-enhanced audio signal using pulse processing |
US11456007B2 (en) * | 2019-01-11 | 2022-09-27 | Samsung Electronics Co., Ltd | End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization |
CN109753943B (zh) * | 2019-01-14 | 2023-09-19 | 沈阳化工大学 | 一种自适应分配变模态分解方法 |
CN110411439B (zh) * | 2019-07-15 | 2021-07-09 | 北京控制工程研究所 | 一种根据星能量等级生成仿真星点的方法、装置及介质 |
KR102294639B1 (ko) | 2019-07-16 | 2021-08-27 | 한양대학교 산학협력단 | 다중 디코더를 이용한 심화 신경망 기반의 비-자동회귀 음성 합성 방법 및 시스템 |
CN110838299B (zh) * | 2019-11-13 | 2022-03-25 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种瞬态噪声的检测方法、装置及设备 |
CN111402858B (zh) * | 2020-02-27 | 2024-05-03 | 平安科技(深圳)有限公司 | 一种歌声合成方法、装置、计算机设备及存储介质 |
CN112133319B (zh) * | 2020-08-31 | 2024-09-06 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频生成的方法、装置、设备及存储介质 |
WO2022076404A1 (en) * | 2020-10-05 | 2022-04-14 | The Trustees Of Columbia University In The City Of New York | Systems and methods for brain-informed speech separation |
CN112257577A (zh) * | 2020-10-21 | 2021-01-22 | 华北电力大学 | 一种利用线性流形投影的微震信号重构方法和系统 |
CN113191317B (zh) * | 2021-05-21 | 2022-09-27 | 江西理工大学 | 一种基于极点构造低通滤波器的信号包络提取方法和装置 |
US11682411B2 (en) | 2021-08-31 | 2023-06-20 | Spotify Ab | Wind noise suppresor |
CN113835065B (zh) * | 2021-09-01 | 2024-05-17 | 深圳壹秘科技有限公司 | 基于深度学习的声源方向确定方法、装置、设备及介质 |
CN113903355B (zh) * | 2021-12-09 | 2022-03-01 | 北京世纪好未来教育科技有限公司 | 语音获取方法、装置、电子设备及存储介质 |
CN115116460B (zh) * | 2022-06-17 | 2024-03-12 | 腾讯科技(深圳)有限公司 | 音频信号增强方法、装置、设备、存储介质及程序产品 |
CN115691541B (zh) * | 2022-12-27 | 2023-03-21 | 深圳元象信息科技有限公司 | 语音分离方法、装置及存储介质 |
CN116229999A (zh) * | 2022-12-28 | 2023-06-06 | 阿里巴巴达摩院(杭州)科技有限公司 | 音频信号处理方法、装置、设备及存储介质 |
CN117745551B (zh) * | 2024-02-19 | 2024-04-26 | 电子科技大学 | 一种图像信号相位恢复的方法 |
CN118230745B (zh) * | 2024-05-23 | 2024-07-26 | 玖益(深圳)医疗科技有限公司 | 连续调制声音信号生成方法、耳鸣匹配方法及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10513282A (ja) * | 1995-11-22 | 1998-12-15 | フィリップス エレクトロニクス ネムローゼ フェンノートシャップ | 言語信号再合成方法および装置 |
JP2005258440A (ja) * | 2004-03-12 | 2005-09-22 | Mitsubishi Electric Research Laboratories Inc | 別個の信号の成分を分離する方法およびシステム |
JP2012511184A (ja) * | 2008-12-29 | 2012-05-17 | 華為技術有限公司 | 過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システム |
EP2631906A1 (en) * | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
EP1527441B1 (en) * | 2002-07-16 | 2017-09-06 | Koninklijke Philips N.V. | Audio coding |
DE10313875B3 (de) * | 2003-03-21 | 2004-10-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Analysieren eines Informationssignals |
DE102004021403A1 (de) * | 2004-04-30 | 2005-11-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung |
NZ562182A (en) * | 2005-04-01 | 2010-03-26 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
TWI324336B (en) * | 2005-04-22 | 2010-05-01 | Qualcomm Inc | Method of signal processing and apparatus for gain factor smoothing |
CN101140759B (zh) * | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
CN101197577A (zh) * | 2006-12-07 | 2008-06-11 | 展讯通信(上海)有限公司 | 一种用于音频处理框架中的编码和解码方法 |
US7715342B2 (en) * | 2007-06-22 | 2010-05-11 | Research In Motion Limited | Location of packet data convergence protocol in a long-term evolution multimedia broadcast multicast service |
CN101521010B (zh) * | 2008-02-29 | 2011-10-05 | 华为技术有限公司 | 一种音频信号的编解码方法和装置 |
CN101662288B (zh) * | 2008-08-28 | 2012-07-04 | 华为技术有限公司 | 音频编码、解码方法及装置、系统 |
WO2010028297A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
PL2234103T3 (pl) * | 2009-03-26 | 2012-02-29 | Fraunhofer Ges Forschung | Urządzenie i sposób manipulacji sygnałem audio |
WO2011039668A1 (en) * | 2009-09-29 | 2011-04-07 | Koninklijke Philips Electronics N.V. | Apparatus for mixing a digital audio |
JP5651980B2 (ja) * | 2010-03-31 | 2015-01-14 | ソニー株式会社 | 復号装置、復号方法、およびプログラム |
US9546924B2 (en) * | 2011-06-30 | 2017-01-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Transform audio codec and methods for encoding and decoding a time segment of an audio signal |
CN103258539B (zh) * | 2012-02-15 | 2015-09-23 | 展讯通信(上海)有限公司 | 一种语音信号特性的变换方法和装置 |
EP2819783B1 (en) * | 2012-02-27 | 2018-10-10 | Ecole Polytechnique Fédérale de Lausanne (EPFL) | Sample processing device with detachable slide |
JP5997592B2 (ja) * | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
US9368103B2 (en) * | 2012-08-01 | 2016-06-14 | National Institute Of Advanced Industrial Science And Technology | Estimation system of spectral envelopes and group delays for sound analysis and synthesis, and audio signal synthesis system |
CN104103276B (zh) * | 2013-04-12 | 2017-04-12 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
KR101732059B1 (ko) * | 2013-05-15 | 2017-05-04 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
WO2015087107A1 (en) * | 2013-12-11 | 2015-06-18 | European Aeronautic Defence And Space Company Eads France | Phase retrieval algorithm for generation of constant time envelope with prescribed fourier transform magnitude signal |
-
2016
- 2016-02-23 RU RU2017133228A patent/RU2679254C1/ru active
- 2016-02-23 BR BR112017018145-2A patent/BR112017018145B1/pt active IP Right Grant
- 2016-02-23 MX MX2017010593A patent/MX2017010593A/es active IP Right Grant
- 2016-02-23 CA CA2976864A patent/CA2976864C/en active Active
- 2016-02-23 ES ES16705948T patent/ES2837107T3/es active Active
- 2016-02-23 CN CN201680013372.5A patent/CN107517593B/zh active Active
- 2016-02-23 JP JP2017545563A patent/JP6668372B2/ja active Active
- 2016-02-23 WO PCT/EP2016/053752 patent/WO2016135132A1/en active Application Filing
- 2016-02-23 EP EP16705948.4A patent/EP3262639B1/en active Active
- 2016-02-23 KR KR1020177027052A patent/KR102125410B1/ko active IP Right Grant
-
2017
- 2017-08-21 US US15/682,123 patent/US10373623B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10513282A (ja) * | 1995-11-22 | 1998-12-15 | フィリップス エレクトロニクス ネムローゼ フェンノートシャップ | 言語信号再合成方法および装置 |
JP2005258440A (ja) * | 2004-03-12 | 2005-09-22 | Mitsubishi Electric Research Laboratories Inc | 別個の信号の成分を分離する方法およびシステム |
JP2012511184A (ja) * | 2008-12-29 | 2012-05-17 | 華為技術有限公司 | 過渡信号符号化方法及び装置、復号化方法及び装置、並びに処理システム |
EP2631906A1 (en) * | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
JP2015508911A (ja) * | 2012-02-27 | 2015-03-23 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 知覚的オーディオコーデックにおけるハーモニック信号のための位相コヒーレンス制御 |
Non-Patent Citations (1)
Title |
---|
DANIEL W.GRIFFIN, ET AL.: "Signal Estimation from Modified Short-Time Fourier Transform", IEEE TRANSACTION ON ACOUSTICS, SPEECH AND SIFNAL PROCESSING, vol. VOL.ASSP-32, NO.2, JPN6018043198, 30 April 1984 (1984-04-30), pages 236 - 243 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017083736A (ja) * | 2015-10-30 | 2017-05-18 | 日本電信電話株式会社 | 信号波形推定装置、信号波形推定方法、プログラム |
CN111954904A (zh) * | 2018-04-16 | 2020-11-17 | 三菱电机株式会社 | 用于转换输入音频信号的音频信号处理系统及方法 |
JP2021515277A (ja) * | 2018-04-16 | 2021-06-17 | 三菱電機株式会社 | オーディオ信号処理システム、及び入力オーディオ信号を変換する方法 |
JP7034339B2 (ja) | 2018-04-16 | 2022-03-11 | 三菱電機株式会社 | オーディオ信号処理システム、及び入力オーディオ信号を変換する方法 |
CN111954904B (zh) * | 2018-04-16 | 2024-07-09 | 三菱电机株式会社 | 用于转换输入音频信号的音频信号处理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107517593A (zh) | 2017-12-26 |
ES2837107T3 (es) | 2021-06-29 |
US10373623B2 (en) | 2019-08-06 |
KR102125410B1 (ko) | 2020-06-22 |
KR20170125058A (ko) | 2017-11-13 |
US20170345433A1 (en) | 2017-11-30 |
EP3262639A1 (en) | 2018-01-03 |
EP3262639B1 (en) | 2020-10-07 |
BR112017018145B1 (pt) | 2023-11-28 |
CA2976864A1 (en) | 2016-09-01 |
WO2016135132A1 (en) | 2016-09-01 |
BR112017018145A2 (pt) | 2018-04-10 |
MX2017010593A (es) | 2018-05-07 |
CN107517593B (zh) | 2021-03-12 |
JP6668372B2 (ja) | 2020-03-18 |
RU2679254C1 (ru) | 2019-02-06 |
CA2976864C (en) | 2020-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6668372B2 (ja) | 目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法 | |
JP5467098B2 (ja) | オーディオ信号をパラメータ化された表現に変換するための装置および方法、パラメータ化された表現を修正するための装置および方法、オーディオ信号のパラメータ化された表現を合成するための装置および方法 | |
JP4740260B2 (ja) | 音声信号の帯域幅を疑似的に拡張するための方法および装置 | |
RU2641224C2 (ru) | Адаптивное расширение полосы пропускания и устройство для этого | |
RU2591733C2 (ru) | Устройство и способ изменения звукового сигнала посредством формирования огибающей | |
JP6262668B2 (ja) | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 | |
JP5425250B2 (ja) | 瞬間的事象を有する音声信号の操作装置および操作方法 | |
RU2667382C2 (ru) | Улучшение классификации между кодированием во временной области и кодированием в частотной области | |
JP5722437B2 (ja) | 広帯域音声コーディングのための方法、装置、およびコンピュータ可読記憶媒体 | |
RU2563164C2 (ru) | Кодер расширения полосы пропускания, декодер расширения полосы пропускания и фазовый вокодер | |
JP5237465B2 (ja) | クロス生成物により向上された高調波転換 | |
CA2556797C (en) | Methods and devices for low-frequency emphasis during audio compression based on acelp/tcx | |
Dittmar et al. | Towards transient restoration in score-informed audio decomposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171031 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171031 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181025 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181106 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190205 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20190308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190709 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20191008 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6668372 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |