JP2021018398A - 位相推定装置、位相推定方法、およびプログラム - Google Patents
位相推定装置、位相推定方法、およびプログラム Download PDFInfo
- Publication number
- JP2021018398A JP2021018398A JP2019135981A JP2019135981A JP2021018398A JP 2021018398 A JP2021018398 A JP 2021018398A JP 2019135981 A JP2019135981 A JP 2019135981A JP 2019135981 A JP2019135981 A JP 2019135981A JP 2021018398 A JP2021018398 A JP 2021018398A
- Authority
- JP
- Japan
- Prior art keywords
- phase
- group delay
- spectrogram
- estimation unit
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
Description
位相スペクトログラムの時間方向の微分(瞬時周波数)と周波数方向の微分(群遅延)は、対数振幅スペクトログラムと関係があることが知られている(参考文献1−3参照)。
〔参考文献2〕Z. Prusa, P. Balazs, and P. L. Sndergaard, "A noniterative method for reconstruction of phase from STFT magnitude," IEEE/ACM Transactions on Audio, Speech, Language Processing, Vol. 25, No. 5, pp. 1154-1164, May 2017.
〔参考文献3〕K. Yatabe, Y. Masuyama, T. Kusano, and Y. Oikawa, "Representation of complex spectrogram via phase conversion," Acoustic Science & Technology, Vol. 40, No. 3, pp. 170-177, May 2019.
式(9)では、瞬時周波数と群遅延の推定精度が、全ての時間周波数ビンで等しいと仮定した。しかし、振幅が小さい時間周波数ビンでは推定精度が悪い可能性がある。そこで、式(9)をσω,τ∈(0, 1)で重みづけした式(10)で求める方法をとることもできる。
本発明で利用するディープニューラルネットワークは、FIFとFGDの2つである。また変形例としてFweightを利用することもできる。この学習は何を利用してもよいが、一例として以下の方法を挙げる。
〔参考文献6〕J. Le Roux, N. Ono, and S. Sagayama, "Explicit consistency constraints for STFT spectrograms and their application to phase reconstruction," In ISCA Workshop on Statistical and Perceptual Audition (SAPA), pp. 23-28, September 2008.
実施形態の位相推定装置は、音声信号の振幅スペクトログラムから位相スペクトログラムを推定して出力する信号処理装置である。実施形態の位相推定装置1は、図2に示すように、瞬時周波数推定部11、群遅延推定部12、および位相推定部13を備える。この位相推定装置1が図3に例示する各ステップの処理を行うことにより実施形態の位相推定方法が実現される。
図4に実施形態の位相推定装置による実行結果の例を示す。図4の一段目はスペクトログラム、二段目は位相スペクトログラム、三段目は瞬時周波数、四段目は群遅延である。図4の二〜四段目の左側は真値であり、右側は推定値である。図4の結果から、瞬時周波数と群遅延は、推定値が真値とほぼ一致しており、位相スペクトログラムも精度よく推定できていることがわかる。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムを図5に示すコンピュータの記憶部1020に読み込ませ、制御部1010、入力部1030、出力部1040などに動作させることにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
11 瞬時周波数推定部
12 群遅延推定部
13 位相推定部
Claims (5)
- 音声信号の音響特徴量から瞬時周波数を推定する瞬時周波数推定部と、
上記音声信号の音響特徴量から群遅延を推定する群遅延推定部と、
直前の時刻の位相スペクトルおよび上記瞬時周波数と現在時刻の上記群遅延とを用いて上記音声信号の位相スペクトログラムを推定する位相推定部と、
を含む位相推定装置。 - 請求項1に記載の位相推定装置であって、
上記位相推定部は、~φτ-1を時刻τ-1の位相スペクトルとし、vτ-1を時刻τ-1の瞬時周波数とし、uτを時刻τの群遅延とし、Dωを周波数方向の差分作用素とし、||・||2をL2ノルムとし、次式を解くことで上記音声信号の位相スペクトル^φτを求める、
位相推定装置。 - 請求項1に記載の位相推定装置であって、
上記位相推定部は、~φτ-1を時刻τ-1の位相スペクトルとし、vτ-1を時刻τ-1の瞬時周波数とし、uτを時刻τの群遅延とし、Dωを周波数方向の差分作用素とし、ΣIFを対角要素が予め学習した重みστ=[σ0,τ, σ1,τ, …, σK-1,τ]Tで与えられる対角行列とし、Iを単位行列とし、ΣGD=I-ΣIFとし、||・||2 Σ=・TΣ・とし、次式を解くことで上記音声信号の位相スペクトル^φτを求める、
位相推定装置。 - 瞬時周波数推定部が、音声信号の音響特徴量から瞬時周波数を推定し、
群遅延推定部が、上記音声信号の音響特徴量から群遅延を推定し、
位相推定部が、直前の時刻の位相スペクトルおよび上記瞬時周波数と現在時刻の上記群遅延とを用いて上記音声信号の位相スペクトログラムを推定する、
位相推定方法。 - 請求項1から3のいずれかに記載の位相推定装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019135981A JP7218688B2 (ja) | 2019-07-24 | 2019-07-24 | 位相推定装置、位相推定方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019135981A JP7218688B2 (ja) | 2019-07-24 | 2019-07-24 | 位相推定装置、位相推定方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021018398A true JP2021018398A (ja) | 2021-02-15 |
JP7218688B2 JP7218688B2 (ja) | 2023-02-07 |
Family
ID=74565994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019135981A Active JP7218688B2 (ja) | 2019-07-24 | 2019-07-24 | 位相推定装置、位相推定方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7218688B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018097430A (ja) * | 2016-12-08 | 2018-06-21 | 日本電信電話株式会社 | 時系列信号特徴推定装置、プログラム |
JP2019512740A (ja) * | 2016-03-18 | 2019-05-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング |
-
2019
- 2019-07-24 JP JP2019135981A patent/JP7218688B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019512740A (ja) * | 2016-03-18 | 2019-05-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング |
JP2018097430A (ja) * | 2016-12-08 | 2018-06-21 | 日本電信電話株式会社 | 時系列信号特徴推定装置、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7218688B2 (ja) | 2023-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10891944B2 (en) | Adaptive and compensatory speech recognition methods and devices | |
US9355649B2 (en) | Sound alignment using timing information | |
US20140136976A1 (en) | Sound Alignment User Interface | |
US10638221B2 (en) | Time interval sound alignment | |
CN113284507B (zh) | 语音增强模型的训练方法和装置及语音增强方法和装置 | |
US9318106B2 (en) | Joint sound model generation techniques | |
KR20040014976A (ko) | 코히어런트하지 않게 샘플링된 데이타의 파워 스펙트럼을측정하기 위한 저누설 방법 | |
Rendon et al. | Improved error scaling for trotter simulations through extrapolation | |
CN112951263B (zh) | 语音增强方法、装置、设备和存储介质 | |
JP6640702B2 (ja) | 時系列信号特徴推定装置、プログラム | |
Cai et al. | Online radio interferometric imaging: assimilating and discarding visibilities on arrival | |
JP2021018398A (ja) | 位相推定装置、位相推定方法、およびプログラム | |
Krémé et al. | Phase reconstruction for time-frequency inpainting | |
JP4630203B2 (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 | |
JP6815956B2 (ja) | フィルタ係数算出装置、その方法、及びプログラム | |
CN112578458B (zh) | 叠前弹性阻抗随机反演方法、装置、存储介质及处理器 | |
CN113823312B (zh) | 语音增强模型生成方法和装置、语音增强方法和装置 | |
JP6912780B2 (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
Feng et al. | Unified and coupled self-stabilizing algorithms for minor and principal eigen-pairs extraction | |
Sircar et al. | Signal parameter estimation of complex exponentials using fourth order statistics: additive Gaussian noise environment | |
US20190385590A1 (en) | Generating device, generating method, and non-transitory computer readable storage medium | |
Zarekar et al. | A new method for reducing end effects in empirical mode decomposition | |
JP6915579B2 (ja) | 信号分析装置、信号分析方法および信号分析プログラム | |
Schillinger et al. | The method of separation: A novel approach for accurate estimation of evolutionary power spectra | |
US20230154480A1 (en) | Adl-ufe: all deep learning unified front-end system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190724 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210924 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220831 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20220909 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20220909 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7218688 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |