JP2016163135A - 収音装置、プログラム及び方法 - Google Patents

収音装置、プログラム及び方法 Download PDF

Info

Publication number
JP2016163135A
JP2016163135A JP2015038628A JP2015038628A JP2016163135A JP 2016163135 A JP2016163135 A JP 2016163135A JP 2015038628 A JP2015038628 A JP 2015038628A JP 2015038628 A JP2015038628 A JP 2015038628A JP 2016163135 A JP2016163135 A JP 2016163135A
Authority
JP
Japan
Prior art keywords
target sound
signal
sound
filter
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015038628A
Other languages
English (en)
Inventor
一浩 片桐
Kazuhiro Katagiri
一浩 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2015038628A priority Critical patent/JP2016163135A/ja
Publication of JP2016163135A publication Critical patent/JP2016163135A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】安定的に特定の方向の音源からの音を強調して収音する収音装置を提供する。【解決手段】収音装置(音声強調装置100)は、1又は複数のマイクロホンM1、M2で収音した信号を取得する信号入力部1−1、1−2と、信号入力部が取得した信号に基づく第1の信号から目的音以外の非目的音を抽出する非目的音抽出部3と、第1の信号から、非目的音抽出部が抽出した非目的音をスペクトル減算した第2の信号を生成するスペクトル減算部4と、第2の信号から目的音成分を判定し、目的音成分以外の成分を抑圧するフィルタを形成するフィルタ形成部5と、フィルタ形成部が形成したフィルタを用いて、第1の信号から非目的音を抑圧し、目的音を強調した第3の信号を生成する目的音強調部6とを有する。【選択図】図1

Description

本発明は、収音装置及びプログラムに関し、例えば、例えば複数の音源が存在する環境下において、特定の方向の音源のみ強調し収音する場合に適用し得るものである。
従来、複数の音源が存在する環境下において、ある特定の方向(以下、「目的方向」とも呼ぶ)の音のみ分離し収音する技術として、マイクロホンアレイを用いたビームフォーマ(Beam Former;以下BF)がある(非特許文献1参照)。BFとは、各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である。
従来のBFは、加算型と減算型の大きく2つの種類に分けられる。特に減算型BFは、加算型BFに比べ、少ないマイクロホン数で指向性を形成できるという利点がある。従来の減算型BFを適用した装置としては特許文献1に記載されたものがある。
以下では、従来の減算型BFの構成例について説明する。
図4は、従来の減算型BFを適用した収音装置PSの構成例について示した説明図である。
図4に示す収音装置PSは、2個のマイクロホンM1、M2を用いて構成されたマイクロホンアレイMAの出力から目的音(目的方向の音)を抽出するものである。
図4では、マイクロホンM1、M2で捕捉した音の信号を、それぞれx(t)、x(t)と示している。また、図4に示す収音装置PSは、遅延器DEL及び減算器SUBを有している。
遅延器DELは、各マイクロホンM1、M2に到来する信号x(t)とx(t)の時間差τを算出し、遅延を加えることで目的音の位相差を合せる。以下では、x(t)に時間差τ分の遅延を加えた信号をx(t−τ)と表す。
遅延器DELは、以下の(1)式により時間差τを算出する。以下の(1)式において、dはマイクロホンM1、M2の間の距離、cは音速、τは遅延量を示している。また、以下の(1)式において、θは、各マイクロホンM1、M2を結んだ直線に対する垂直方向から目的方向への角度を示している。
τ=(dsinθ)/c …(1)
ここで、死角が、マイクロホンM1、M2の中心(中点)に対し、マイクロホンM1の方向に存在する場合、マイクロホンM1の入力信号x(t)に対し遅延処理を行う。減算器SUBは、例えば、以下の(2)式により、x(t)からx(t−τ)を減算する処理を行う。
α(t)=x(t)−x(t−τ) …(2)
減算器SUBは、周波数領域で減算処理を行うこともできる。その場合、上記の(2)式は、以下の(3)式のように示すことができる。
A(ω)=X(ω)−e−jωτL(ω) …(3)
ここで、θ=±π/2の場合、マイクロホンアレイMAにより形成される指向性は図5(A)に示すように、カージオイド型の単一指向性となる。一方、θ=0,πの場合、マイクロホンアレイMAにより形成される指向性は、図5(B)のような8の字型の双指向性となる。以下では、入力信号から単一指向性を形成するフィルタを単一指向性フィルタ、双指向性を形成するフィルタを双指向性フィルタと呼称する。また、減算器SUBでは、スペクトル減算法(Spectral Subtraction)の処理(以下、単に「SS」とも呼ぶ)を用いることで、双指向性の死角に強い指向性を形成することもできる。
減算器SUBは、SSによる指向性の形成を行う場合、以下の(4)式を用いて減算処理を行うことができる。以下の(4)式では、マイクロホンM1の入力信号Xを用いているが、マイクロホンM2の入力信号Xでも同様の効果を得ることができる。以下の(4)式において、βはSSの強度を調節するための係数である。減算器SUBは、以下の(4)式を用いて減算処理を行った結果値がマイナスなった場合、0または元の値を小さくした値に置き換える処理(フロアリング処理)を行うようにしてもよい。減算器SUBでは、SS法で減算処理を行うことにより、目的エリアの方向以外に存在する音を抽出し、抽出した音(目的方向以外に存在する音)の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。
|Y(ω)|=|X(ω)|−β|A(ω)| …(4)
特許文献2には、単一指向性を双指向性の2種類の指向性を利用することで、目的方向に強い指向性を形成する装置(音源分離装置)が提案されている。特許文献2に記載の装置では、まず目的方向に対して左右に死角を向ける単一指向性と、目的方向に対して死角を向ける双指向性を形成する。そしてその後、特許文献2に記載の装置では、2つの単一指向性フィルタ出力の内パワーの大きい方を選択し、選択した単一指向性フィルタ出力から双指向性フィルタ出力をSSすることにより非目的音を抑圧し、目的音を強調する。
特開2008−131183号公報
浅野太著,"音響テクノロジーシリーズ16 音のアレイ信号処理−音源の定位・追跡と分離−",日本音響学会編,コロナ社,2011年2月25日発行 矢頭 隆,森戸 誠,山田 圭,小川 哲司著,「情報処理Vol.51 No.11 Nov.2010」(正方形マイクロホンアレイによる音源分離技術),情報処理学会、2010年12月発行,pp.1410−1416
しかしながら、従来の収音装置では、非目的音源の数が多く、かつ収音する際の周波数分解能が十分でない場合や、非目的音成分の一部が目的音成分と重なる場合等には、抽出した非目的音を入力信号からSSすると、非目的音成分と重なった目的音成分も減算されてしまい、目的音が歪んでしまうおそれがある。
また、従来の収音装置では、残響が強い環境下では、壁などに反射した目的音が目的方向以外から回り込み、目的方向以外から非目的音としてマイクロホンに収音される場合がある。この場合は、目的音成分が非目的音成分として抽出されてしまうため、入力信号から非目的音をSSする際に、目的音成分自体が減算され、同様に目的音が歪んでしまう。
さらにまた、従来の収音装置において、SSを用いる場合、通常フロアリング処理を行うが、このとき周囲の周波数成分に比べてパワーの大きい孤立周波数ができてしまうと、耳障りなミュージカルノイズが発生する原因となってしまう場合がある。
そのため、安定的に特定の方向の音源からの音を強調して収音することができる収音装置、プログラム及び方法が望まれている。
第1の本発明の収音装置は、(1)1又は複数のマイクロホンで収音した信号を取得する入力信号取得手段と、(2)上記入力信号取得手段が取得した信号に基づく第1の信号から目的音以外の非目的音を抽出する非目的音抽出手段と、(3)上記第1の信号から、上記非目的音抽出手段が抽出した非目的音をスペクトル減算した第2の信号を生成するスペクトル減算手段と、(4)上記第2の信号から目的音成分を判定し、目的音成分以外の成分を抑圧するフィルタを形成するフィルタ形成手段と、(5)上記フィルタ形成手段が形成したフィルタを用いて、上記第1の信号から非目的音を抑圧し、目的音を強調した第3の信号を生成する目的音強調手段とを有することを特徴とする。
第2の本発明の収音プログラムは、コンピュータを、(1)1又は複数のマイクロホンで収音した信号を取得する入力信号取得手段と、(2)上記入力信号取得手段が取得した信号に基づく第1の信号から目的音以外の非目的音を抽出する非目的音抽出手段と、(3)上記第1の信号から、上記非目的音抽出手段が抽出した非目的音をスペクトル減算した第2の信号を生成するスペクトル減算手段と、(4)上記第2の信号から目的音成分を判定し、目的音成分以外の成分を抑圧するフィルタを形成するフィルタ形成手段と、(5)上記フィルタ形成手段が形成したフィルタを用いて、上記第1の信号から非目的音を抑圧し、目的音を強調した第3の信号を生成する目的音強調手段として機能させることを特徴とする。
第3の本発明は、収音装置が行う収音方法において、(1)入力信号取得手段、入力信号取得手段、スペクトル減算手段、フィルタ形成手段、及び目的音強調手段を有し、(2)上記入力信号取得手段は、1又は複数のマイクロホンで収音した信号を取得し、
上記入力信号取得手段は、上記入力信号取得手段が取得した信号に基づく第1の信号から目的音以外の非目的音を抽出し、(3)上記スペクトル減算手段は、上記第1の信号から、上記非目的音抽出手段が抽出した非目的音をスペクトル減算した第2の信号を生成し、(4)上記フィルタ形成手段は、上記第2の信号から目的音成分を判定し、目的音成分以外の成分を抑圧するフィルタを形成し、(5)上記目的音強調手段は、上記フィルタ形成手段が形成したフィルタを用いて、上記第1の信号から非目的音を抑圧し、目的音を強調した第3の信号を生成することを特徴とする。
本発明によれば、安定的に特定の方向の音源からの音を強調して収音する収音装置を提供することができる。
第1の実施形態に係る音声強調装置(収音装置)の機能的構成について示したブロック図である。 第1の実施形態に係るマイクロホンの位置関係の例について示した説明図である。 第2の実施形態に係る音声強調装置(収音装置)の機能的構成について示したブロック図である。 従来の指向性フィルタにより形成される指向特性の一例を説明する説明図である。 従来の収音装置において、2つのマイクロホンアレイのビームフォーマ(BF)による指向性を別々の方向から目的エリアへ向けた場合の構成例について示した説明図である。
(A)第1の実施形態
以下、本発明による収音装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳述する。なお、以下では、本発明の収音装置を、音声強調装置に適用した例について説明する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態の音声強調装置100の機能的構成について示したブロック図である。
音声強調装置100は、2つのマイクロホンM1、M2(マイクロホンアレイ)を用いて、目的方向(目的エリアの位置する方向)の音源からの目的音を収音する処理を行う。以下では、マイクロホンM1、M2をそれぞれ、「第1のマイクロホン」、「第2のマイクロホンとも呼ぶものとする。
図2は、2つのマイクロホンM1、M2の配置の例について示した説明図である。
この実施形態では、図2に示すように、2つのマイクロホンM1、M2は、それぞれ目的方向に対して水平に配置されているものとする。言い換えると、図2に示すように、第1のマイクロホンM1の位置と第2のマイクロホンM2の位置とを結ぶ線に直交する線上に、目的方向の目的エリアが位置しているものとする。
音声強調装置100は、2つの信号入力部1(1−1、1−2)、信号入力部1、信号加算部2、非目的音抽出部3、スペクトル減算部4、フィルタ形成部5、及び目的音強調部6を有している。
音声強調装置100は、全てハードウェア(例えば、専用チップ等)により構成するようにしてもよいし一部又は全部についてソフトウェア(プログラム)として構成するようにしてもよい。音声強調装置100は、例えば、プロセッサ及びメモリを有するコンピュータに実施形態の収音プログラムをインストールすることにより構成するようにしてもよい。
信号入力部1−1、1−2は、それぞれ第1、第2のマイクロホンM1、M2で収音した音響信号をアナログ信号からデジタル信号に変換するものである。また、ここでは、信号入力部1−1、1−2は、取得した信号(ディジタル信号)を時間領域から周波数領域に変換する。信号入力部1−1、1−2は、例えば、高速フーリエ変換等を用いて、取得した信号(ディジタル信号)を時間領域から周波数領域へ変換する。
信号加算部2は、信号入力部1−1と信号入力部1−2からの信号(周波数領域の信号)を加算した後、平均を取り目的音成分を強調した信号を取得して出力する。以下では、信号加算部2が出力する信号(周波数領域の信号)を「入力信号x」とも呼ぶものとする。なお、音声強調装置100では、マイクロホンの数が少ない場合、加算処理をせず、いずれかのマイクロホンからの入力(いずれかの信号入力部1からの入力)を選択し、入力信号xとして出力するようにしてもよい。
非目的音抽出部3は、信号入力部1−1と信号入力部1−2からの信号に基づいて、BFにより指向性を形成し、非目的音(目的方向以外の方向の音)を抽出する。
非目的音抽出部3は、例えば、信号入力部1−1と信号入力部1−2からの信号を用い、目的方向に死角を向ける双指向性フィルタ(上述の図5(B)参照)を形成することで、非目的音を抽出するようにしてもよい。この場合、非目的音抽出部3は、例えば、θ=0として、上記の(1)式と(3)式を用いて、双指向性の形成を行うことができる。
また、非目的音抽出部3は、例えば、信号入力部1−1と信号入力部1−2からの信号を用い、単一指向性フィルタ(上述の図5(A)参照)を形成することで、非目的音を抽出するようにしてもよい。この場合、非目的音抽出部3は、例えば、θ=π/2として、上記の(1)式と(3)式を用いて、単一指向性の形成を行うことができる。単一指向性フィルタを用いた場合でも、非目的音抽出部3は、少なくとも目的音方向を含む方向に死角を向けた指向性を形成することが可能である。
スペクトル減算部4は、信号加算部2の出力(入力信号x)から、非目的音抽出部3の出力(非目的音)をSSした音を、目的音について推定した音(以下、「推定目的音」と呼ぶ)として抽出する。推定目的音の抽出は、例えば、上述の(4)式を用いて求めることができる。なお、スペクトル減算部4は、スペクトル減算の結果、値がマイナスになった場合は、0または元の値を小さくした値に置き換えるフロアリング処理を行うものとする。
フィルタ形成部5は、スペクトル減算部4の出力である推定目的音をもとに、入力信号xから非目的音を抑圧し、目的音を強調する処理に対応可能なフィルタHを形成する処理を行う。
フィルタ形成部5は、まず、推定目的音の成分の内、一定のパワー以上の成分(閾値T1以上のパワーの成分)を目的音であると判定し、目的音成分(目的音成分の周波数)のフィルタ値(当該成分(周波数)に対する係数の値)を1、それ以外の成分のフィルタ値を0に設定したフィルタHを形成(例えば、以下の(7)式に従って形成)する。フィルタHでは、推定目的音を構成する各成分(周波数)に対して、フィルタ値が設定されているものとする。ここでは、推定目的音は、1番目〜k番目(kは2以上の整数)の周波数(成分)で構成されているものとする。したがってフィルタHには1番目〜k番目の各周波数(成分)に対するフィルタ値が設定されるものとして説明する。
Figure 2016163135
また、フィルタ形成部5は、推定目的音と入力信号x(信号加算部2の出力信号)とのパワー比を利用して上述のフィルタ値を補正するようにしてもよい。この実施形態では、フィルタ形成部5は、周波数毎(1番目〜k番目の成分毎)に以下の(5)式に従って、パワー比(推定目的音と入力信号xとのパワー比)を求めるものとする。そして、フィルタ形成部5は、周波数ごとに求めたパワー比に基づいて、フィルタHの各周波数に対応するフィルタ値を補正するものとする。
以下の(5)式において、Rは、推定目的音と信号加算部2の出力とのk番目の周波数のパワー比である。また、以下の(5)式において、Yは推定目的音のk番目の周波数のパワーである。さらに、以下の(5)式において、Xは入力信号x(信号加算部2の出力信号)のk番目の周波数のパワーである。
ここでは、フィルタ形成部5は、一定のパワー以上の成分(閾値T1以上のパワーの成分)であっても、パワー比が閾値T2以下の成分については、非目的音抽出部3において抽出が不十分であった非目的音成分と判定し、フィルタ値の値を1から0に変更する補正(例えば、以下の(5−1)式に従って補正)を行うものとする。閾値T2としては、例えば0.5程度の値を適用することができる。言い換えると、フィルタ形成部5は、一定のパワー以上の成分(閾値T1以上のパワーの成分)であって、かつ、パワー比が閾値T2より大きい成分についてのみ、フィルタ値の値を「1」とし、それ以外の成分のフィルタ値を「0」とする処理を行う。
=Y/X …(5)
Figure 2016163135
目的音強調部6は、信号加算部2の出力(入力信号x)にフィルタ形成部5で形成したフィルタHをかけて(フィルタHを用いて)、非目的音成分を抑圧し、目的音を強調した信号を出力する。この実施形態の例では、目的音強調部6は、以下の(6)式を用いて、信号加算部2の出力(入力信号x)にフィルタHを適用して目的音を強調した目的音の信号を生成するものとする。以下の(6)式において、Zは、目的音の各周波数成分(各周波数のパワー)を要素に持つベクトルである。また、以下の(6)式において、Xは、信号加算部2の出力(入力信号x)の各周波数成分(各周波数のパワー)を要素に持つベクトル(例えば、以下の(6−1)式で示されるベクトル)である。さらに、以下の(6)式において、Hは、各周波数のフィルタ値を要素に持つ対角行列(例えば、以下の(6−2)式で示される対角行列)である。なお、目的音強調部6が出力する信号の形式については限定されないものであり、例えば、周波数領域を時間領域に変換して出力するようにしてもよいし、所定の形式で符号化した音声データを出力するようにしてもよい。
Z=HX …(6)
Figure 2016163135
SSにより抽出された推定目的音は、減算処理により変形している可能性があるが、周波数領域に分布する成分自体は、もとの目的音源と同じであると考えられる。また、推定目的音には、目的音以外にも引き残しの非目的音成分が含まれている可能性がある。
そこで、フィルタ形成部5は、まず、推定目的音の各成分のうち、一定以上のパワーの成分(閾値より大きいパワーの成分)に対するフィルタ値を「1」、それ以外の成分(閾値以下のパワーの成分)については非目的音の成分と判定しフィルタ値を「0」とするフィルタHを生成している。
さらに、フィルタ形成部5は、SS出力と入力信号とのパワー比Rを利用してフィルタHの各フィルタ値を補正している。SS出力のパワーを入力信号のパワーで割ると、共通に含まれる目的音成分のパワー比Rは、通常1に近い値になる傾向がある。逆に非目的音成分は、入力信号にしか含まれないため、パワー比Rは目的音成分よりも比較的小さい値となる傾向にある。例えば、推定目的音において、上述の閾値以上のパワーの成分でも、例えば「パワー比R」が閾値T2(例えば、0.5以下)であるような場合、当該成分は、目的音成分でない可能性(非目的成分である可能性)が高い。このような成分に対して、0又は0に近いフィルタ値をフィルタHに設定することで、SSでは抑圧が不十分であった非目的音成分も抑圧することができる。
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の音声強調装置100の動作(実施形態の収音方法)の例を説明する。
信号入力部1−1、1−2は、それぞれ第1、第2のマイクロホンM1、M2で収音した音響信号をアナログ信号からデジタル信号に変換し、さらに時間領域から周波数領域に変換する。
信号加算部2は、信号入力部1−1と信号入力部1−2からの信号を加算した後、平均を取り目的音成分を強調した信号を入力信号xとして取得する。
非目的音抽出部3は、信号入力部1−1と信号入力部1−2からの信号に基づいて、BFにより指向性を形成(例えば、上記の(1)式と(3)式を用いて形成)し、非目的音を抽出する。
スペクトル減算部4は、信号加算部2の出力から非目的音抽出部3の出力をSSして推定目的音を抽出(例えば、上記の(4)式を用いて抽出)する。
フィルタ形成部5は、一定のパワー以上の成分(閾値T1以上のパワーの成分)であって、かつ、パワー比が閾値T2より大きい成分についてのみ、フィルタ値の値を「1」とし、それ以外の成分のフィルタ値を「0」とするフィルタHを形成する。
目的音強調部6は、信号加算部2の出力にフィルタ形成部5で形成したフィルタをかけ、非目的音成分を抑圧し、目的音を強調した信号を生成(例えば、上記の(6)式を用いて生成)して出力する。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
音声強調装置100では、SSの出力音(スペクトル減算部4の出力信号)をそのまま目的音として出力するのではなく、フィルタ形成部5がSSの出力をもとに、目的音成分には影響を与えずに目的音成分以外を抑圧するフィルタHを形成している。そして、音声強調装置100では、目的音強調部6により、入力信号(信号加算部2の出力信号)に対してフィルタHを掛けたものを目的音として抽出している。これにより、音声強調装置100では、周囲に非目的音源が多く存在する環境や、残響が強い環境においても、歪を抑えて、安定的に目的音を強調した収音を行うことができる。また、音声強調装置100では、最終的に出力される音について、SSを直接行っていないため、SSにより発生する副作用(例えば、ミュージカルノイズの発生等)も抑えることができる。
(B)第2の実施形態
以下、本発明による収音装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態の構成
図3は、第2の実施形態の音声強調装置100Aの機能的構成について示したブロック図であり、上述の図1と同一又は対応する部分には、同一又は対応する符号を付している。
以下では、第2の実施形態の音声強調装置100Aについて、第1の実施形態との差異を中心に説明する。
第2の実施形態の音声強調装置100Aは、1つのマイクロホンMを用いて、目的方向(目的エリアの位置する方向)の音源からの目的音を収音する収音処理を行う点で第1の実施形態と異なっている。
次に、第2の実施形態の音声強調装置100Aの内部構成について説明する。
第2の実施形態の音声強調装置100Aでは、信号加算部2が音声区間検出部7に置き換わっている。また、第2の実施形態では、非目的音抽出部3が非目的音抽出部3Aに置き換わっている。
信号入力部1は、マイクロホンMで収音した音響信号をアナログ信号からデジタル信号に変換するものである。また、信号入力部1は、取得した信号(ディジタル信号)を時間領域から周波数領域に変換して出力する。第2の実施形態では、信号入力部1の出力信号を入力信号xとして以下の説明を行う。
音声区間検出部7は、信号入力部1の出力(入力信号x)をもとに、音声区間と非音声区間を判定する処理を行う。このとき、音声区間検出部7が行う音声区間の判定方法は限定されないものであり、例えば、振幅スペクトルの変動や零交差など、種々の手法を用いることが可能である。
非目的音抽出部3Aは、音声区間検出部7において非音声区間と判定された信号の成分を、非目的音として出力するものとする。この実施形態の例では、非目的音抽出部3Aは、音声区間検出部7において非音声区間と判定された信号のパワーの平均値(各周波数成分のパワーの平均値)を算出し、非目的音として出力するものとする。この実施形態では、音声強調装置100Aは、主として目的方向(目的エリア)に存在する話者の発する音声を収音することを目的としているものとする。したがって、非目的音抽出部3Aでは、音声区間検出部7を用いて、人間の音声が存在しない非音声区間の音を、目的方向以外の方向から到来した非目的音と認識することができるものとする。
スペクトル減算部4は、信号入力部1の出力(入力信号x)から非目的音抽出部3Aの出力(非目的音)をSSし、推定目的音を抽出する。スペクトル減算部4で行われるSSの処理自体は、第1の実施形態と同様の処理であるため、詳しい説明を省略する。
フィルタ形成部5は、スペクトル減算部4が出力する推定目的音を用いて、第1の実施形態と同様の処理によりフィルタHを形成する。このとき、フィルタ形成部5は、入力信号xとして信号入力部1の出力信号を用いて、フィルタHを形成することになる。
目的音強調部6は、入力信号x(信号入力部1の出力)にフィルタ形成部5で形成したフィルタHをかけ、非目的音成分を抑圧し、目的音を強調した信号を生成して出力する処理を行う。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の音声強調装置100Aの動作(実施形態の収音方法)の例を説明する。
信号入力部1は、マイクロホンMで収音した音響信号をアナログ信号からデジタル信号に変換し、さらに、取得した信号(ディジタル信号)を時間領域から周波数領域に変換して入力信号xとして出力する。
音声区間検出部7は、信号入力部1の出力(入力信号x)をもとに、音声区間と非音声区間を判定する処理を行う。
非目的音抽出部3Aは、音声区間検出部7において非音声区間と判定された信号のパワーの平均値を算出して、非目的音として出力する。
スペクトル減算部4は、信号入力部1の出力(入力信号x)から非目的音抽出部3Aの出力をSSし推定目的音を抽出(第1の実施形態と同様の処理により抽出)する。
フィルタ形成部5は、スペクトル減算部4が出力する推定目的音を用いて、フィルタHを形成(第1の実施形態と同様の処理により形成)する。
目的音強調部6は、信号入力部1の出力(入力信号x)にフィルタ形成部5で形成したフィルタHをかけ、非目的音成分を抑圧し、目的音を強調した信号を生成(第1の実施形態と同様の処理により生成)して出力する。
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて以下のような効果を奏することができる。
第2の実施形態の音声強調装置100Aでは、非目的音抽出部3Aが非音声区間の音を、目的方向以外の方向から到来した非目的音として抽出するため、1つのマイクロホンMを用いた場合でも目的方向以外の方向から到来した非目的音と認識することができる。したがって、第2の実施形態の音声強調装置100Aでは、マイクロホンMを複数用いない場合でも目的音を強調する処理を行うことができる。
(C)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(C−1)上記の各実施形態において、フィルタHの各フィルタ値は、「0」又は「1」の2値のいずれかであるものとして説明したが、フィルタHに設定するフィルタ値は0から1の間で任意の値を設定するようにしてもよい。これにより、目的音強調部6ではSN比を操作することもできる。例えば、フィルタHとして、目的音成分以外の成分を20dB抑圧するフィルタ値を設定すれば、非目的音を完全に抑圧せずに環境音の一部として残すこともできる。これにより、目的音強調部6で出力する音を聴いた聴者の違和感を低減することができる。
(C−2)第1の実施形態では、音声強調装置100は、2つのマイクロホンM1、M2が収音した信号を処理しているが、3つ以上のマイクロホンで収音した信号を処理するようにしてもよい。
(C−3)上記各実施形態では、マイクロホンが捕捉して得た音響信号をリアルタイムに処理するものを示したが、マイクロホンが捕捉して得た音響信号を記憶媒体に記憶し、その後、記憶媒体から読み出して処理して目的音、目的エリア音の強調信号を得るようにしても良い。このように記憶媒体を利用する場合には、マイクロホンが設定されている場所と、目的音や目的エリア音の抽出処理する場所とが離れていても良い。同様に、リアルタイム処理をする場合でも、マイクロホンが設定されている場所と、目的音や目的エリア音の抽出処理する場所とが離れていても良く、通信により信号を遠隔地に供給するようにしても良い。
(C−4)第1の実施形態において、フィルタ形成部5が形成するフィルタHは、入力信号xから非目的音を抑圧し、目的音を強調する処理に対応可能なフィルタ値が設定されていれば良い。したがって、フィルタ形成部5は、上述のパワー比を用いたフィルタHの補正処理を省略するようにしてもよい。
100…音声強調装置、M、M1、M2…マイクロホン、1…信号入力部、2…信号加算部、3…非目的音抽出部、4…スペクトル減算部、5…フィルタ形成部、6…目的音強調部。

Claims (6)

  1. 1又は複数のマイクロホンで収音した信号を取得する入力信号取得手段と、
    上記入力信号取得手段が取得した信号に基づく第1の信号から目的音以外の非目的音を抽出する非目的音抽出手段と、
    上記第1の信号から、上記非目的音抽出手段が抽出した非目的音をスペクトル減算した第2の信号を生成するスペクトル減算手段と、
    上記第2の信号から目的音成分を判定し、目的音成分以外の成分を抑圧するフィルタを形成するフィルタ形成手段と、
    上記フィルタ形成手段が形成したフィルタを用いて、上記第1の信号から非目的音を抑圧し、目的音を強調した第3の信号を生成する目的音強調手段と
    を有することを特徴とする収音装置。
  2. 上記入力信号取得手段は、複数の上記マイクロホンで収音した信号を取得し、
    上記非目的音抽出手段は、上記入力信号取得手段が取得した信号に基づく上記第1の信号を用いて、上記目的方向以外の方向に指向性を形成して、上記第1の信号から非目的音を抽出する
    ことを特徴とする請求項1に記載の収音装置。
  3. 上記第1の信号は、複数の上記マイクロホンにより収音した信号のいずれか1つ、又は複数の上記マイクロホンにより収音した信号を平均した信号であることを特徴とする請求項2に記載の収音装置。
  4. 上記第1の信号の音声区間と非音声区間とを判定する音声区間検出手段をさらに備え、
    上記非目的音抽出手段は、上記第1の信号の非音声区間の信号に基づいて非目的音を抽出する
    ことを特徴とする請求項1に記載の収音装置。
  5. コンピュータを、
    1又は複数のマイクロホンで収音した信号を取得する入力信号取得手段と、
    上記入力信号取得手段が取得した信号に基づく第1の信号から目的音以外の非目的音を抽出する非目的音抽出手段と、
    上記第1の信号から、上記非目的音抽出手段が抽出した非目的音をスペクトル減算した第2の信号を生成するスペクトル減算手段と、
    上記第2の信号から目的音成分を判定し、目的音成分以外の成分を抑圧するフィルタを形成するフィルタ形成手段と、
    上記フィルタ形成手段が形成したフィルタを用いて、上記第1の信号から非目的音を抑圧し、目的音を強調した第3の信号を生成する目的音強調手段と
    して機能させることを特徴とする収音プログラム。
  6. 収音装置が行う収音方法において、
    入力信号取得手段、入力信号取得手段、スペクトル減算手段、フィルタ形成手段、及び目的音強調手段を有し、
    上記入力信号取得手段は、1又は複数のマイクロホンで収音した信号を取得し、
    上記非目的音抽出手段は、上記入力信号取得手段が取得した信号に基づく第1の信号から目的音以外の非目的音を抽出し、
    上記スペクトル減算手段は、上記第1の信号から、上記非目的音抽出手段が抽出した非目的音をスペクトル減算した第2の信号を生成し、
    上記フィルタ形成手段は、上記第2の信号から目的音成分を判定し、目的音成分以外の成分を抑圧するフィルタを形成し、
    上記目的音強調手段は、上記フィルタ形成手段が形成したフィルタを用いて、上記第1の信号から非目的音を抑圧し、目的音を強調した第3の信号を生成する
    ことを特徴とする収音方法。
JP2015038628A 2015-02-27 2015-02-27 収音装置、プログラム及び方法 Pending JP2016163135A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015038628A JP2016163135A (ja) 2015-02-27 2015-02-27 収音装置、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015038628A JP2016163135A (ja) 2015-02-27 2015-02-27 収音装置、プログラム及び方法

Publications (1)

Publication Number Publication Date
JP2016163135A true JP2016163135A (ja) 2016-09-05

Family

ID=56845705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015038628A Pending JP2016163135A (ja) 2015-02-27 2015-02-27 収音装置、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP2016163135A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018164156A (ja) * 2017-03-24 2018-10-18 沖電気工業株式会社 収音装置、プログラム及び方法
CN109951762A (zh) * 2017-12-21 2019-06-28 音科有限公司 一种用于听力设备的源信号提取方法、系统和装置
CN112397080A (zh) * 2020-10-30 2021-02-23 浙江大华技术股份有限公司 回声消除方法及装置、语音设备及计算机可读存储介质
JP7486891B2 (ja) 2020-03-12 2024-05-20 三菱電機株式会社 電子機器筐体、電子機器及び電子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01149695A (ja) * 1987-12-07 1989-06-12 Sumitomo Metal Ind Ltd 音声認識用マイク装置
JP2011099967A (ja) * 2009-11-05 2011-05-19 Fujitsu Ltd 音信号処理方法および音信号処理装置
JP2013182044A (ja) * 2012-02-29 2013-09-12 Oki Electric Ind Co Ltd 音声信号処理装置、方法及びプログラム
WO2014097637A1 (ja) * 2012-12-21 2014-06-26 パナソニック株式会社 指向性マイクロホン装置、音響信号処理方法およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01149695A (ja) * 1987-12-07 1989-06-12 Sumitomo Metal Ind Ltd 音声認識用マイク装置
JP2011099967A (ja) * 2009-11-05 2011-05-19 Fujitsu Ltd 音信号処理方法および音信号処理装置
JP2013182044A (ja) * 2012-02-29 2013-09-12 Oki Electric Ind Co Ltd 音声信号処理装置、方法及びプログラム
WO2014097637A1 (ja) * 2012-12-21 2014-06-26 パナソニック株式会社 指向性マイクロホン装置、音響信号処理方法およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018164156A (ja) * 2017-03-24 2018-10-18 沖電気工業株式会社 収音装置、プログラム及び方法
CN109951762A (zh) * 2017-12-21 2019-06-28 音科有限公司 一种用于听力设备的源信号提取方法、系统和装置
CN109951762B (zh) * 2017-12-21 2021-09-03 音科有限公司 一种用于听力设备的源信号提取方法、系统和装置
JP7486891B2 (ja) 2020-03-12 2024-05-20 三菱電機株式会社 電子機器筐体、電子機器及び電子装置
CN112397080A (zh) * 2020-10-30 2021-02-23 浙江大华技术股份有限公司 回声消除方法及装置、语音设备及计算机可读存储介质
CN112397080B (zh) * 2020-10-30 2023-02-28 浙江大华技术股份有限公司 回声消除方法及装置、语音设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
JP5482854B2 (ja) 収音装置及びプログラム
JP6065028B2 (ja) 収音装置、プログラム及び方法
JP6065030B2 (ja) 収音装置、プログラム及び方法
JP6187626B1 (ja) 収音装置及びプログラム
JP6131989B2 (ja) 収音装置、プログラム及び方法
JP4986248B2 (ja) 音源分離装置、方法及びプログラム
JP5772151B2 (ja) 音源分離装置、プログラム及び方法
KR20090037692A (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
JP6540730B2 (ja) 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法
JP2016163135A (ja) 収音装置、プログラム及び方法
KR20090037845A (ko) 혼합 신호로부터 목표 음원 신호를 추출하는 방법 및 장치
JP6436180B2 (ja) 収音装置、プログラム及び方法
JP2007047427A (ja) 音声処理装置
JP2019068133A (ja) 収音装置、プログラム及び方法
JP6241520B1 (ja) 収音装置、プログラム及び方法
JP6065029B2 (ja) 収音装置、プログラム及び方法
JP6260666B1 (ja) 収音装置、プログラム及び方法
JP6624256B1 (ja) 収音装置、プログラム及び方法
JP6879340B2 (ja) 収音装置、収音プログラム、及び収音方法
JP6908142B1 (ja) 収音装置、収音プログラム、及び収音方法
JP6863004B2 (ja) 収音装置、プログラム及び方法
JP2017181761A (ja) 信号処理装置及びプログラム、並びに、ゲイン処理装置及びプログラム
JP6624255B1 (ja) 収音装置、プログラム及び方法
JP6772890B2 (ja) 信号処理装置、プログラム及び方法
JP6923025B1 (ja) 収音装置、プログラム及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190702

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190902

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200310