JP6925995B2 - 信号処理装置、音声強調装置、信号処理方法およびプログラム - Google Patents
信号処理装置、音声強調装置、信号処理方法およびプログラム Download PDFInfo
- Publication number
- JP6925995B2 JP6925995B2 JP2018008649A JP2018008649A JP6925995B2 JP 6925995 B2 JP6925995 B2 JP 6925995B2 JP 2018008649 A JP2018008649 A JP 2018008649A JP 2018008649 A JP2018008649 A JP 2018008649A JP 6925995 B2 JP6925995 B2 JP 6925995B2
- Authority
- JP
- Japan
- Prior art keywords
- feature amount
- signal processing
- signal
- weight
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
第1の実施形態にかかる信号処理装置は、話者の空間情報を表す特徴量を複数の記憶領域それぞれに記憶する。信号処理装置は、音声信号に対する特徴量が入力されるごとに、記憶部に記憶された特徴量と入力された特徴量との類似度、および、入力された特徴量をニューラルネットに入力する。ニューラルネットは、記憶領域の個数と等しい次元数を持つ重みを出力する。出力される重みは、例えば、記憶された特徴量に対する重み(消去重み)、入力された特徴量に対する重み(書き込み重み)、および、記憶領域から読み出した特徴量に対する重み(読み出し重み)を含む。記憶領域から読み出した特徴量は、ビームフォーミングなどの信号処理に用いられる。
・音源が存在する領域(部屋など)のインパルス応答を生成して元の信号に畳み込む。
・雑音を加える。
・ランダムにサンプルを欠損させる。
・チャンネル間にランダムな遅延を加える。
・フェーズボコーダーにより持続時間、および、音高を変化させる。
ξX(t,ω)=mX(t,ω)x(t,ω)xH(t,ω) ・・・(1)
R←RDiag(WD)+vXWH W ・・・(2)
φX=WH RR ・・・(3)
R←αR+vX ・・・(4)
ECN=|(fHs)/(fHn)| ・・・(5)
・更新の回数が一定値(例えば100万回)に達したときに収束したとみなす。
・更新の回数が一定値(例えば100万回)に達するごとに、評価データの平均SN比に対してSN比が改善されたかを評価する。所定回数(例えば5回)に渡って改善が見られないときに収束したとみなす。学習部122は、例えば、学習データの一部を学習には利用せずに分離して、評価データとして利用する。
第2の実施形態にかかる信号処理装置は、第1の実施形態の信号処理装置などによりパラメータが学習されたモデルを用いて信号処理(例えば音声強調処理)を実行する装置である。第1の実施形態の信号処理装置(学習処理を実行する装置)の機能と、本実施形態の信号処理装置の機能とを両方備えるように構成してもよい。
101 生成部
111 解析部
112 特徴量算出部
113 類似度算出部
114 重み算出部
115 更新部
121 信号処理部
122 学習部
131−2 受付部
141 記憶部
Claims (11)
- 第1入力信号の特徴を表す第1特徴量を記憶する記憶部と、
前記第1特徴量と、第2入力信号の特徴を表す第2特徴量と、の類似度を算出する類似度算出部と、
前記類似度および前記第2特徴量に基づいて、前記第1特徴量に対する第1重みを算出する重み算出部と、
前記第1重みを乗算した前記第1特徴量と、前記第2特徴量とに基づいて、第3特徴量を算出し、前記第3特徴量により前記記憶部に記憶された前記第1特徴量を更新する更新部と、
更新された前記第1特徴量を用いた信号処理を実行する信号処理部と、を備え、
前記第1入力信号および前記第2入力信号は、音声信号、時間周波数領域で特徴的なパターンを持つ信号、または、反射されたレーザー光を含む電磁波による信号である対象信号をそれぞれ含む、
信号処理装置。 - 前記重み算出部は、前記類似度および前記第2特徴量を入力して前記第1重みを出力するモデルを用いて、前記第1重みを算出する、
請求項1に記載の信号処理装置。 - 前記モデルはニューラルネットワークである、
請求項2に記載の信号処理装置。 - 学習データを用いて前記信号処理の処理結果を評価し、前記モデルのパラメータを更新する学習部をさらに備える、
請求項2に記載の信号処理装置。 - 第3入力信号と、前記信号処理の処理結果を表す参照データと、を含む学習データを生成する生成部をさらに備え、
前記学習部は、生成された前記学習データを用いて学習処理を実行する、
請求項4に記載の信号処理装置。 - 前記対象信号は、空間内の異なる位置からそれぞれ得られる複数チャンネルの信号を含み、
前記第1特徴量、前記第2特徴量、および、前記第3特徴量は、前記複数チャンネルの信号に基づく空間相関である、
請求項1に記載の信号処理装置。 - 前記重み算出部は、さらに、前記類似度および前記第2特徴量に基づいて、前記第2特徴量に対する第2重みを算出し、
前記更新部は、前記第1重みを乗算した前記第1特徴量と、前記第2重みを乗算した前記第2特徴量とに基づいて、前記第3特徴量を算出する、
請求項1に記載の信号処理装置。 - 前記重み算出部は、さらに、前記類似度および前記第2特徴量に基づいて、前記記憶部から読み出した前記第1特徴量に対する第3重みを算出し、
前記信号処理部は、前記第3重みを乗算した前記第1特徴量を用いた信号処理を実行する、
請求項1に記載の信号処理装置。 - 複数チャンネルの音声信号を含む第1入力信号の特徴を表す第1特徴量を記憶する記憶部と、
前記第1特徴量と、複数チャンネルの音声信号を含む第2入力信号の特徴を表す第2特徴量と、の類似度を算出する類似度算出部と、
前記類似度および前記第2特徴量に基づいて、前記第1特徴量に対する第1重みを算出する重み算出部と、
前記第1重みを乗算した前記第1特徴量と、前記第2特徴量とに基づいて、第3特徴量を算出し、前記第3特徴量により前記記憶部に記憶された前記第1特徴量を更新する更新部と、
更新された前記第1特徴量を用いて複数チャンネルの音声信号のうち一部の音声信号を強調する信号処理を実行する信号処理部と、
を備える音声強調装置。 - 第1入力信号の特徴を表す第1特徴量を記憶部に記憶する記憶ステップと、
前記第1特徴量と、第2入力信号の特徴を表す第2特徴量と、の類似度を算出する類似度算出ステップと、
前記類似度および前記第2特徴量に基づいて、前記第1特徴量に対する第1重みを算出する重み算出ステップと、
前記第1重みを乗算した前記第1特徴量と、前記第2特徴量とに基づいて、第3特徴量を算出し、前記第3特徴量により前記記憶部に記憶された前記第1特徴量を更新する更新ステップと、
更新された前記第1特徴量を用いた信号処理を実行する信号処理ステップと、を含み、
前記第1入力信号および前記第2入力信号は、音声信号、時間周波数領域で特徴的なパターンを持つ信号、または、反射されたレーザー光を含む電磁波による信号である対象信号をそれぞれ含む、
信号処理方法。 - コンピュータに、
第1入力信号の特徴を表す第1特徴量を記憶部に記憶する記憶ステップと、
前記第1特徴量と、第2入力信号の特徴を表す第2特徴量と、の類似度を算出する類似度算出ステップと、
前記類似度および前記第2特徴量に基づいて、前記第1特徴量に対する第1重みを算出する重み算出ステップと、
前記第1重みを乗算した前記第1特徴量と、前記第2特徴量とに基づいて、第3特徴量を算出し、前記第3特徴量により前記記憶部に記憶された前記第1特徴量を更新する更新ステップと、
更新された前記第1特徴量を用いた信号処理を実行する信号処理ステップと、を実行させ、
前記第1入力信号および前記第2入力信号は、音声信号、時間周波数領域で特徴的なパターンを持つ信号、または、反射されたレーザー光を含む電磁波による信号である対象信号をそれぞれ含む、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018008649A JP6925995B2 (ja) | 2018-01-23 | 2018-01-23 | 信号処理装置、音声強調装置、信号処理方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018008649A JP6925995B2 (ja) | 2018-01-23 | 2018-01-23 | 信号処理装置、音声強調装置、信号処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019128402A JP2019128402A (ja) | 2019-08-01 |
JP6925995B2 true JP6925995B2 (ja) | 2021-08-25 |
Family
ID=67472141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018008649A Active JP6925995B2 (ja) | 2018-01-23 | 2018-01-23 | 信号処理装置、音声強調装置、信号処理方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6925995B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6967099B2 (ja) * | 2020-03-04 | 2021-11-17 | 株式会社日立製作所 | 学習モデル作成システム及び学習モデル作成方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0566795A (ja) * | 1991-09-06 | 1993-03-19 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | 雑音抑圧装置とその調整装置 |
JPH1155132A (ja) * | 1997-07-30 | 1999-02-26 | Nec Corp | 無線機及び無線通信方法 |
US10347271B2 (en) * | 2015-12-04 | 2019-07-09 | Synaptics Incorporated | Semi-supervised system for multichannel source enhancement through configurable unsupervised adaptive transformations and supervised deep neural network |
KR102151682B1 (ko) * | 2016-03-23 | 2020-09-04 | 구글 엘엘씨 | 다중채널 음성 인식을 위한 적응성 오디오 강화 |
-
2018
- 2018-01-23 JP JP2018008649A patent/JP6925995B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019128402A (ja) | 2019-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6903611B2 (ja) | 信号生成装置、信号生成システム、信号生成方法およびプログラム | |
Delcroix et al. | Strategies for distant speech recognitionin reverberant environments | |
KR101224755B1 (ko) | 음성-상태 모델을 사용하는 다중-감각 음성 향상 | |
JP6623376B2 (ja) | 音源強調装置、その方法、及びプログラム | |
JP2010224321A (ja) | 信号処理装置 | |
WO2005117517A2 (en) | Neuroevolution-based artificial bandwidth expansion of telephone band speech | |
JP5634959B2 (ja) | 雑音/残響除去装置とその方法とプログラム | |
Eskimez et al. | Adversarial training for speech super-resolution | |
CN111465982A (zh) | 信号处理设备和方法、训练设备和方法以及程序 | |
JP6821970B2 (ja) | 音声合成装置および音声合成方法 | |
JP4457221B2 (ja) | 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム | |
JP2018040848A (ja) | 音響処理装置および音響処理方法 | |
CN101460996A (zh) | 增益控制系统、增益控制方法和增益控制程序 | |
KR20220022286A (ko) | 잔향 제거 오토 인코더를 이용한 잔향 환경 임베딩 추출 방법 및 장치 | |
Gaubitch et al. | Blind channel magnitude response estimation in speech using spectrum classification | |
JP5443547B2 (ja) | 信号処理装置 | |
JP6925995B2 (ja) | 信号処理装置、音声強調装置、信号処理方法およびプログラム | |
Jannu et al. | Weibull and Nakagami speech priors based regularized NMF with adaptive wiener filter for speech enhancement | |
JP7443823B2 (ja) | 音響処理方法 | |
Das et al. | Improved real-time monophonic pitch tracking with the extended complex Kalman filter | |
US20210089926A1 (en) | Machine learning method and machine learning apparatus | |
Dwivedi et al. | Spherical harmonics domain-based approach for source localization in presence of directional interference | |
CN110675890A (zh) | 声音信号处理装置以及声音信号处理方法 | |
Moliner et al. | Zero-shot blind audio bandwidth extension | |
JP6930089B2 (ja) | 音響処理方法および音響処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190814 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201020 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210706 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210804 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6925995 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |