JP6790114B2 - 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング - Google Patents
音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング Download PDFInfo
- Publication number
- JP6790114B2 JP6790114B2 JP2018549178A JP2018549178A JP6790114B2 JP 6790114 B2 JP6790114 B2 JP 6790114B2 JP 2018549178 A JP2018549178 A JP 2018549178A JP 2018549178 A JP2018549178 A JP 2018549178A JP 6790114 B2 JP6790114 B2 JP 6790114B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- frequency
- phase
- bins
- frequency bins
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 54
- 230000008859 change Effects 0.000 claims description 53
- 238000000034 method Methods 0.000 claims description 50
- 238000004458 analytical method Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims description 2
- 238000011084 recovery Methods 0.000 claims 6
- 238000009527 percussion Methods 0.000 description 30
- 238000001228 spectrum Methods 0.000 description 29
- 238000000926 separation method Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000033764 rhythmic process Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/307—Frequency adjustment, e.g. tone control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/041—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal based on mfcc [mel -frequency spectral coefficients]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/056—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction or identification of individual instrumental parts, e.g. melody, chords, bass; Identification or separation of instrumental parts by their characteristic voices or timbres
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/076—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/011—Files or data streams containing coded musical information, e.g. for transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/011—Files or data streams containing coded musical information, e.g. for transmission
- G10H2240/046—File format, i.e. specific or non-standard musical file format used in or adapted for electrophonic musical instruments, e.g. in wavetables
- G10H2240/066—MPEG audio-visual compression file formats, e.g. MPEG-4 for coding of audio-visual objects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/011—Files or data streams containing coded musical information, e.g. for transmission
- G10H2240/046—File format, i.e. specific or non-standard musical file format used in or adapted for electrophonic musical instruments, e.g. in wavetables
- G10H2240/071—Wave, i.e. Waveform Audio File Format, coding, e.g. uncompressed PCM audio according to the RIFF bitstream format method
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/131—Mathematical functions for musical analysis, processing, synthesis or composition
- G10H2250/215—Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
- G10H2250/235—Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
Description
− 音声信号の振幅スペクトログラムに依存して、音声信号の振幅スペクトログラムの複数の時間−周波数ビンのうちの各々の時間−周波数ビンについて周波数の変化を決定するステップと、
− 複数の時間−周波数ビンについて決定された周波数の変化に依存して、複数の時間−周波数ビンについての位相値を生成するステップと、
を含む。
256サンプル≦N≦2048サンプル
0.25N≦H≦0.75N
である。
512サンプル≦H≦1536サンプル
64サンプル≦H≦192サンプル
140 位相復元部
150 信号生成部
210 エンコーダ
220 デコーダ
Claims (21)
- 音声信号の振幅スペクトログラムから位相復元するための装置であって、
前記音声信号の前記振幅スペクトログラムに依存して、前記音声信号の前記振幅スペクトログラムの複数の時間−周波数ビンのうちの各々の時間−周波数ビンについて周波数の変化を決定するように構成された周波数変化決定部(110)と、
前記複数の時間−周波数ビンについて決定された周波数の変化に依存して、前記複数の時間−周波数ビンについての位相値を生成するように構成された位相復元部(140)と、
を含む、装置。 - 前記位相復元部(140)は、前記周波数の変化を2回積分することにより前記複数の時間−周波数ビンの各々の時間−周波数ビンについての前記位相値を生成するように構成される、
請求項1に記載の装置。 -
- 前記周波数変化決定部(110)は、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについて前記周波数の変化を、当該時間−周波数ビンについての角度(α(b,k))に依存して決定するように構成され、
当該時間−周波数ビンについての前記角度(α(b,k))は、前記音声信号の前記振幅スペクトログラムに依存する、
請求項1〜3の1項に記載の装置。 - 前記周波数変化決定部(110)は、さらに前記音声信号のサンプリング周波数(fs)に依存して、および分析ウィンドウの長さ(N)に依存して、および前記分析ウィンドウのホップサイズ(H)に依存して、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについての前記周波数の変化を決定するように構成される、
請求項4に記載の装置。 -
-
-
- 前記位相復元部(140)は、前記複数の時間−周波数ビンについて決定された前記周波数の変化に依存して、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについての位相値を生成するように構成される、請求項1〜8の1項に記載の装置。
- 前記位相復元部(140)は、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについて決定された前記周波数の変化に依存して、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビン(b,k)について異方性の大きさを決定するように構成される、請求項7または8に記載の装置。
-
-
- 前記位相復元部(140)は、位相の復元が行なわれるか否かに関わらず、前記異方性の大きさに依存して、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについて、位相復元モードを決定するように構成され、
前記位相復元部(140)は、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについての位相値を、前記位相復元部(140)が当該時間−周波数ビンについて決定した前記位相復元モードが第1のモードを表わしている場合には、前記周波数の変化を2回積分することによって生成するように構成され、
前記位相復元部(140)は、前記位相復元部(140)が当該時間−周波数ビンについて決定した位相復元モードが前記第1のモードと異なる第2のモードを表わしている場合には、前記周波数の変化を2回積分することによって前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについての位相を決定するように構成される、
請求項9〜12の1項に記載の装置。 - 前記位相復元部(140)は、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについての前記位相復元モードを、当該時間−周波数ビン((b,k))についての前記異方性の大きさが下側閾値(c)よりも大きい場合には前記位相復元モードが前記第1のモードを表わし、当該時間−周波数ビン((b,k))についての前記異方性の大きさが前記下側閾値(c)以下である場合には前記位相復元モードが前記第2のモードを表わすように決定するように構成される、または、
前記位相復元部(140)は、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについての位相復元モードを、当該時間−周波数ビン((b,k))についての前記異方性の大きさが前記下側閾値(c)以上である場合には前記位相復元モードが前記第1のモードを表わし、当該時間−周波数ビン((b,k))についての前記異方性の大きさが前記下側閾値(c)より小さい場合には前記位相復元モードが前記第2のモードを表わすように決定するように構成される、
請求項13に記載の装置。 - 前記位相復元部(140)は、周波数にわたって2回積分することにより、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについての位相値を生成するように構成される、
請求項1〜14の1項に記載の装置。 - 前記位相復元部(140)は、経時的に2回積分することにより、前記複数の時間−周波数ビンのうちの各々の時間−周波数ビンについての位相値を生成するように構成される、
請求項1〜15の1項に記載の装置。 - 前記装置は、前記音声信号の前記振幅スペクトログラムに依存して、かつ前記複数の時間−周波数ビンについての前記位相値に依存して、音声出力信号を生成するように構成された信号生成部(150)を含む、請求項1〜16の1項に記載の装置。
- 音声信号の振幅スペクトログラムを符号化するためのエンコーダ(210)と、
請求項1〜17の1項に記載の装置である、前記音声信号を復号化するためのデコーダ(220)と、
を含むシステムであって、
前記デコーダ(220)は、前記音声信号の前記振幅スペクトログラムに依存して、前記音声信号の前記振幅スペクトログラムの複数の時間−周波数ビンのうちの各々の時間−周波数ビンについての周波数の変化を決定するように構成され、
前記デコーダ(220)は、前記複数の時間−周波数ビンについて決定された前記周波数の変化に依存して、前記複数の時間−周波数ビンについての位相値を生成するように構成され、
前記デコーダ(220)は、前記音声信号の前記振幅スペクトログラムを使用して、且つ、前記複数の時間−周波数ビンについての位相値を使用して、前記音声信号を復号化するように構成される、
システム。 - 請求項1〜17の1項に記載の位相復元装置のための、音声信号の振幅スペクトログラムを生成するように構成されるエンコーダ(210)。
- 音声信号の振幅スペクトログラムから位相を復元するための方法であって、
前記音声信号の前記振幅スペクトログラムに依存して、前記音声信号の前記振幅スペクトログラムの複数の時間−周波数ビンのうちの各々の時間−周波数ビンについて周波数の変化を決定するステップと、
前記複数の時間−周波数ビンについて決定された前記周波数の変化に依存して、前記複数の時間−周波数ビンについての位相値を生成するステップと、
を含む、方法。 - コンピュータまたは信号プロセッサ上で実行されているときに、請求項20に記載の方法を実装するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16161230.4 | 2016-03-18 | ||
EP16161230 | 2016-03-18 | ||
PCT/EP2017/056263 WO2017158105A1 (en) | 2016-03-18 | 2017-03-16 | Encoding by reconstructing phase information using a structure tensor on audio spectrograms |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019512740A JP2019512740A (ja) | 2019-05-16 |
JP6790114B2 true JP6790114B2 (ja) | 2020-11-25 |
Family
ID=55646317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018549178A Active JP6790114B2 (ja) | 2016-03-18 | 2017-03-16 | 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング |
Country Status (7)
Country | Link |
---|---|
US (1) | US10607630B2 (ja) |
EP (1) | EP3430620B1 (ja) |
JP (1) | JP6790114B2 (ja) |
CN (1) | CN109247069B (ja) |
BR (1) | BR112018068892A2 (ja) |
RU (1) | RU2714579C1 (ja) |
WO (1) | WO2017158105A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10664715B2 (en) * | 2018-03-16 | 2020-05-26 | University Of Wolverhampton | Computer-implemented print analysis |
DE102019205543A1 (de) * | 2019-04-17 | 2020-10-22 | Robert Bosch Gmbh | Verfahren zum Klassifizieren zeitlich aufeinanderfolgender digitaler Audiodaten |
CN110246510B (zh) * | 2019-06-24 | 2021-04-06 | 电子科技大学 | 一种基于RefineNet的端到端语音增强方法 |
JP7218688B2 (ja) * | 2019-07-24 | 2023-02-07 | 日本電信電話株式会社 | 位相推定装置、位相推定方法、およびプログラム |
CN111312258A (zh) * | 2019-12-16 | 2020-06-19 | 随手(北京)信息技术有限公司 | 用户的身份认证方法、装置、服务器及存储介质 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2759646B2 (ja) * | 1985-03-18 | 1998-05-28 | マサチユ−セツツ インステイテユ−ト オブ テクノロジ− | 音響波形の処理 |
ATE527654T1 (de) | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
JP5294300B2 (ja) * | 2008-03-05 | 2013-09-18 | 国立大学法人 東京大学 | 音信号の分離方法 |
ES2898865T3 (es) | 2008-03-20 | 2022-03-09 | Fraunhofer Ges Forschung | Aparato y método para sintetizar una representación parametrizada de una señal de audio |
EP4231291B1 (en) * | 2008-12-15 | 2023-11-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio bandwidth extension decoder, corresponding method and computer program |
AU2013203159B2 (en) * | 2008-12-15 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and bandwidth extension decoder |
EP2214165A3 (en) * | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
JP2013057895A (ja) * | 2011-09-09 | 2013-03-28 | Research Organization Of Information & Systems | 音声再生装置、音声再生方法及びコンピュータプログラム |
JP2013114009A (ja) * | 2011-11-29 | 2013-06-10 | Honda Motor Co Ltd | 能動型振動騒音制御装置 |
JP5898534B2 (ja) * | 2012-03-12 | 2016-04-06 | クラリオン株式会社 | 音響信号処理装置および音響信号処理方法 |
JP2013197815A (ja) * | 2012-03-19 | 2013-09-30 | Nippon Telegr & Teleph Corp <Ntt> | 変調光源および変調信号の生成方法 |
US10497381B2 (en) * | 2012-05-04 | 2019-12-03 | Xmos Inc. | Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation |
EP2747451A1 (en) | 2012-12-21 | 2014-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrivial estimates |
US20170178664A1 (en) * | 2014-04-11 | 2017-06-22 | Analog Devices, Inc. | Apparatus, systems and methods for providing cloud based blind source separation services |
CN104240695A (zh) * | 2014-08-29 | 2014-12-24 | 华南理工大学 | 一种优化的基于耳机重放的虚拟声合成方法 |
CN104616659B (zh) * | 2015-02-09 | 2017-10-27 | 山东大学 | 相位对重构语音声调感知影响方法及在人工耳蜗中应用 |
-
2017
- 2017-03-16 JP JP2018549178A patent/JP6790114B2/ja active Active
- 2017-03-16 EP EP17710751.3A patent/EP3430620B1/en active Active
- 2017-03-16 WO PCT/EP2017/056263 patent/WO2017158105A1/en active Application Filing
- 2017-03-16 RU RU2018136578A patent/RU2714579C1/ru active
- 2017-03-16 CN CN201780030962.3A patent/CN109247069B/zh active Active
- 2017-03-16 BR BR112018068892A patent/BR112018068892A2/pt active Search and Examination
-
2018
- 2018-09-18 US US16/133,840 patent/US10607630B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20190019529A1 (en) | 2019-01-17 |
CN109247069B (zh) | 2021-12-21 |
RU2714579C1 (ru) | 2020-02-18 |
US10607630B2 (en) | 2020-03-31 |
WO2017158105A1 (en) | 2017-09-21 |
EP3430620B1 (en) | 2020-03-25 |
EP3430620A1 (en) | 2019-01-23 |
JP2019512740A (ja) | 2019-05-16 |
CN109247069A (zh) | 2019-01-18 |
BR112018068892A2 (pt) | 2019-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6790114B2 (ja) | 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング | |
US11817110B2 (en) | Cross product enhanced subband block based harmonic transposition | |
TWI587289B (zh) | 用以決定用於音訊信號之相位校正資料的計算器及方法 | |
KR101572034B1 (ko) | 파라메트릭 오디오 코딩 방식들의 포렌식 검출 | |
KR102095385B1 (ko) | 고주파 복원 동안 오디오 신호들의 프로세싱 | |
CA2867069C (en) | Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal | |
JP6800995B2 (ja) | スペクトログラムに対する構造テンソルを用いた調波打楽器残差音声分離装置および方法 | |
DK2843659T3 (en) | PROCEDURE AND APPARATUS TO DETECT THE RIGHT OF PITCH PERIOD | |
CN105556602A (zh) | 用于高频重构算法的频带表设计 | |
AU2015202647B2 (en) | Cross product enhanced subband block based harmonic transposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200114 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200713 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201006 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6790114 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |