JP6519801B2 - 信号解析装置、方法、及びプログラム - Google Patents
信号解析装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6519801B2 JP6519801B2 JP2016032414A JP2016032414A JP6519801B2 JP 6519801 B2 JP6519801 B2 JP 6519801B2 JP 2016032414 A JP2016032414 A JP 2016032414A JP 2016032414 A JP2016032414 A JP 2016032414A JP 6519801 B2 JP6519801 B2 JP 6519801B2
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- observation
- sound
- absolute value
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 39
- 238000000034 method Methods 0.000 title description 18
- 238000001228 spectrum Methods 0.000 claims description 56
- 230000006870 function Effects 0.000 claims description 29
- 230000004913 activation Effects 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000012546 transfer Methods 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 4
- 238000001727 in vivo Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 9
- 238000000926 separation method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012880 independent component analysis Methods 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 210000000038 chest Anatomy 0.000 description 1
- 238000005354 coacervation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 210000001595 mastoid Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
ただし、
は虚数単位を表す。
次に、本実施形態の原理について説明する。
、及び
次に、本発明の実施形態に係る信号解析装置の構成について説明する。図1に示すように、本発明の実施形態に係る信号解析装置100は、CPUと、RAMと、後述するパラメータ推定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この信号解析装置100は、機能的には図1に示すようにNAMマイク10と、空気伝導マイク12と、演算部20と、出力部90と、を含んで構成されている。なお、第1のマイクの音声を体表から取得する非可聴つぶやきマイクであるNAMマイク10と、第2のマイクである空気伝導マイク12の位置関係を図2に示す。図2の場合、NAMマイク10は、耳介後方部(乳様突起直下の胸鎖乳突筋上)に設置され、空気伝導マイク12は、NAMマイク10の周辺に設置され、両マイクの間の距離は5センチ程度に設定されている。また、本実施形態においてj=1はNAMマイク10を表し、j=2は空気伝導マイク12を表すものとする。また、i=1は体内伝導微弱音声の音源を表し、i=2は雑音源を表す。
次に、本発明の実施形態に係る信号解析装置100の作用について説明する。まず、NAMマイク10から出力された、クリーン音源信号の時系列データを受け付け、データベース22に記憶する。次に、NAMマイク10から出力された、混合音音源信号の時系列データを受け付け、かつ空気伝導マイク12から出力された、空気伝導外部雑音の時系列データを受け付けると、信号解析装置100は、図3に示すパラメータ推定処理ルーチンを実行する。
本実施形態に係る信号解析装置100を用いて、実環境下で収録した雑音に対する雑音抑圧性能を検証した。雑音は駅構内の雑音と、飲食店内の雑音の2種類とし、それぞれSN比0dBでクリーンな体内伝導微弱音声および空気伝導(漏れ込み)微弱音声に重畳する。
12 空気伝導マイク
20 演算部
22 データベース
24 時間周波数展開部
26 パラメータ推定部
28 混合音時間周波数展開部
32 パラメータ更新部
34 収束判定部
40 音声信号生成部
90 出力部
100 信号解析装置
Claims (10)
- 第1のマイクで取得した体内伝導微弱音声及び外部雑音を含む複数の移動しうる音源からの音源信号が混合された観測信号の時系列データを入力として、各時刻における各周波数の観測時間周波数成分を表す観測スペクトログラムを出力し、第2のマイクで取得した前記外部雑音の音源信号が混合された観測信号の時系列データを入力として、各時刻における各周波数の観測時間周波数成分を表す観測スペクトログラムを出力する混合音時間周波数展開部と、
前記混合音時間周波数展開部により取得した前記第1のマイクで取得した音源信号の観測スペクトログラムの絶対値成分、及び前記第2のマイクで取得した音源信号の観測スペクトログラムの絶対値成分と、予め学習された、体内伝導微弱音声の、各周波数及び各基底におけるパワースペクトルを表す基底パワースペクトルと、に基づいて、
前記第1のマイクで取得した音源信号の観測スペクトログラムの絶対値成分、及び前記第2のマイクで取得した音源信号の観測スペクトログラムの絶対値成分を要素に持つテンソルと、
前記複数の音源の各々から各マイクまでの伝達特性を表すステアリングベクトルの絶対値成分、前記複数の音源の各々についての前記基底パワースペクトル、及び前記複数の音源の各々についての、各時刻及び各基底におけるパワーを表すアクティベーションパラメータから求められるテンソルとの距離を表す目的関数を最小化するように、
前記複数の音源の各々の前記ステアリングベクトルの絶対値成分と、前記複数の音源の各々の前記アクティベーションパラメータとの更新の各々を行うパラメータ更新部と、
予め定められた収束条件を満たしたか否かを判定し、前記収束条件を満たすまで、前記パラメータ更新部による更新を繰り返し行う収束判定部と、
を含む信号解析装置。 - 前記ステアリングベクトルは、前記絶対値成分と偏角成分に式(10)の通り分解され、
前記式(10)に基づき、前記観測時間周波数成分の瞬時混合モデルは、式(11)と式(12)の積で表現される
請求項1記載の信号解析装置。
ただし、iは音源インデックスを表し、ωは周波数インデックスを表し、
は虚数単位を表し、
は、各音源の複素スペクトログラムを表し、τは時刻フレームインデックスを表す。
- 前記偏角成分を式(13)の通りとすることで、
前記瞬時混合モデルを式(14)と変形し、
上記式(14)に基づき前記観測信号を解析する
請求項2記載の信号解析装置。
ただし、p i,ω,τ は、各音源のパワースペクトログラムの期待値を表すパラメータであり、
は、(2×2)の単位行列である。 - 前記パラメータ更新部は、前記混合音時間周波数展開部により取得した前記第1のマイクで取得した音源信号の観測スペクトログラムの絶対値成分、及び前記第2のマイクで取得した音源信号の観測スペクトログラムの絶対値成分と、予め学習された、体内伝導微弱音声の、各周波数及び各基底におけるパワースペクトルを表す基底パワースペクトルと、に基づいて、前記目的関数を最小化するように、前記複数の音源の各々の前記ステアリングベクトルの絶対値成分と、前記複数の音源の各々の前記アクティベーションパラメータと、前記基底パワースペクトルとの更新の各々を行う請求項1〜3の何れか1項記載の信号解析装置。
- 前記第1のマイクを、音声を体表から取得する非可聴つぶやきマイクとした請求項1〜4の何れか1項記載の信号解析装置。
- 前記距離の距離尺度を板倉齋藤擬距離基準とする請求項1〜5の何れか1項記載の信号解析装置。
- 混合音時間周波数展開部と、パラメータ更新部と、収束判定部とを含む信号解析装置における、信号解析方法であって、
前記混合音時間周波数展開部は、第1のマイクで取得した体内伝導微弱音声及び外部雑音を含む複数の移動しうる音源からの音源信号が混合された観測信号の時系列データを入力として、各時刻における各周波数の観測時間周波数成分を表す観測スペクトログラムを出力し、第2のマイクで取得した前記外部雑音の音源信号が混合された観測信号の時系列データを入力として、各時刻における各周波数の観測時間周波数成分を表す観測スペクトログラムを出力し、
前記パラメータ更新部は、前記混合音時間周波数展開部により取得した前記第1のマイクで取得した音源信号の観測スペクトログラムの絶対値成分、及び前記第2のマイクで取得した音源信号の観測スペクトログラムの絶対値成分と、予め学習された、体内伝導微弱音声の、各周波数及び各基底におけるパワースペクトルを表す基底パワースペクトルと、に基づいて、
前記第1のマイクで取得した音源信号の観測スペクトログラムの絶対値成分、及び前記第2のマイクで取得した音源信号の観測スペクトログラムの絶対値成分を要素に持つテンソルと、
前記複数の音源の各々から各マイクまでの伝達特性を表すステアリングベクトルの絶対値成分、前記複数の音源の各々についての前記基底パワースペクトル、及び前記複数の音源の各々についての、各時刻及び各基底におけるパワーを表すアクティベーションパラメータから求められるテンソルとの距離を表す目的関数を最小化するように、
前記複数の音源の各々の前記ステアリングベクトルの絶対値成分と、前記複数の音源の各々の前記アクティベーションパラメータとの更新の各々を行い、
前記収束判定部は、予め定められた収束条件を満たしたか否かを判定し、前記収束条件を満たすまで、前記パラメータ更新部による更新を繰り返し行う
信号解析方法。 - 前記パラメータ更新部により更新の各々を行うことは、前記混合音時間周波数展開部により取得した前記第1のマイクで取得した音源信号の観測スペクトログラムの絶対値成分、及び前記第2のマイクで取得した音源信号の観測スペクトログラムの絶対値成分と、予め学習された、体内伝導微弱音声の、各周波数及び各基底におけるパワースペクトルを表す基底パワースペクトルと、に基づいて、前記目的関数を最小化するように、前記複数の音源の各々の前記ステアリングベクトルの絶対値成分と、前記複数の音源の各々の前記アクティベーションパラメータと、前記基底パワースペクトルとの更新の各々を行う請求項7記載の信号解析方法。
- 前記第1のマイクを、音声を体表から取得する非可聴つぶやきマイクとした請求項7又は8記載の信号解析方法。
- コンピュータを、請求項1〜6の何れか1項記載の信号解析装置を構成する各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016032414A JP6519801B2 (ja) | 2016-02-23 | 2016-02-23 | 信号解析装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016032414A JP6519801B2 (ja) | 2016-02-23 | 2016-02-23 | 信号解析装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017151226A JP2017151226A (ja) | 2017-08-31 |
JP6519801B2 true JP6519801B2 (ja) | 2019-05-29 |
Family
ID=59738923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016032414A Active JP6519801B2 (ja) | 2016-02-23 | 2016-02-23 | 信号解析装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6519801B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7450911B2 (ja) | 2019-12-05 | 2024-03-18 | 国立大学法人 東京大学 | 音響解析装置、音響解析方法及び音響解析プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5520883B2 (ja) * | 2011-05-17 | 2014-06-11 | 日本電信電話株式会社 | 信号分解装置、方法、及びプログラム |
-
2016
- 2016-02-23 JP JP2016032414A patent/JP6519801B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017151226A (ja) | 2017-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3189521B1 (en) | Method and apparatus for enhancing sound sources | |
JP5675848B2 (ja) | レベルキューによる適応ノイズ抑制 | |
JP5091948B2 (ja) | ブラインド信号抽出 | |
US20180374497A1 (en) | Sound signal enhancement device | |
EP3113508B1 (en) | Signal-processing device, method, and program | |
Schwartz et al. | Joint maximum likelihood estimation of late reverberant and speech power spectral density in noisy environments | |
WO2022256577A1 (en) | A method of speech enhancement and a mobile computing device implementing the method | |
Hosseini et al. | Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function | |
Shankar et al. | Influence of MVDR beamformer on a Speech Enhancement based Smartphone application for Hearing Aids | |
Dmour et al. | A new framework for underdetermined speech extraction using mixture of beamformers | |
JP6142402B2 (ja) | 音響信号解析装置、方法、及びプログラム | |
JP6519801B2 (ja) | 信号解析装置、方法、及びプログラム | |
Miyazaki et al. | Theoretical analysis of parametric blind spatial subtraction array and its application to speech recognition performance prediction | |
JP5113096B2 (ja) | 音源分離方法、装置およびプログラム | |
JP2011139409A (ja) | 音響信号処理装置、音響信号処理方法、及びコンピュータプログラム | |
JP2016126136A (ja) | 自動ミキシング装置およびプログラム | |
KR20150026634A (ko) | 클러스터 기반 손실 특징 복원 알고리즘을 위한 마스크 추정 방법 및 장치 | |
Zhang et al. | Ica-based noise reduction for mobile phone speech communication | |
Hidri et al. | A multichannel beamforming-based framework for speech extraction | |
US10204638B2 (en) | Integrated sensor-array processor | |
Unoki et al. | Unified denoising and dereverberation method used in restoration of MTF-based power envelope | |
Niwa et al. | Microphone Array Wiener Post Filtering Using Monotone Operator Splitting | |
Aoulass et al. | Noise Reduction using DUET algorithm for dual-microphone mobile station | |
CN117121104A (zh) | 估计用于处理所获取的声音数据的优化掩模 | |
Kavalekalam | Invitation to the PhD defense of the dissertation: Model-based Speech Enhancement for Hearing aids. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20171208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6519801 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |