JP7207170B2 - 収音装置、収音プログラム、収音方法、及び収音システム - Google Patents
収音装置、収音プログラム、収音方法、及び収音システム Download PDFInfo
- Publication number
- JP7207170B2 JP7207170B2 JP2019099683A JP2019099683A JP7207170B2 JP 7207170 B2 JP7207170 B2 JP 7207170B2 JP 2019099683 A JP2019099683 A JP 2019099683A JP 2019099683 A JP2019099683 A JP 2019099683A JP 7207170 B2 JP7207170 B2 JP 7207170B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- sound
- speaker
- mixing
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
以下、本発明による収音装置、収音プログラム、収音方法、及び収音システムの第1の実施形態を、図面を参照しながら詳述する。この実施形態では、本発明の収音システムを対面録音システムに適用した例について説明する。
図1は、第1の実施形態の対面録音システム1の全体構成を示すブロック図である。
次に、以上のような構成を有する第1の実施形態の対面録音システム1の動作を説明する。
参考文献1:特開2016-127457
第1の実施形態によれば、以下のような効果を奏することができる。
以下、本発明による収音装置、収音プログラム、収音方法、及び収音システムの第2の実施形態を、図面を参照しながら詳述する。この実施形態では、本発明の収音システムを対面録音システムに適用した例について説明する。
図6は、第2の実施形態の対面録音システム1Aの全体構成を示すブロック図である。
次に、以上のような構成を有する第2の実施形態の対面録音システム1Aの動作を説明する。
「S1、S2」又は「S1、S3」が共にtrueとなったステータスパターン(以下、「第1のステータスパターン」と呼ぶ)が発生した場合は、対応者と相談者が同時に発話している場合であると推定される。そこで、混合レベル算出部209は、第1のステータスパターンが発生した場合、各話者が単独に発話した場合の混合レベル(標準混合レベルGとする)に対し、たとえば半減したゲインを与える。
S2とS3が共にtrueとなったステータスパターン(以下、「第2のステータスパターン」と呼ぶ)が発生した場合は、2人の相談者が同時に発話している状態であると推定される。相談者右側席エリアA2-1と相談者左側席エリアA2-2は、非常に近接しているため、分離・抽出された目的音(エリア音出力Z2、Z3)に入力信号を混合した場合、混合によって隣接話者の発話が混ざり合う危険性がさらに高くなる。例えば、相談者右側席エリア音Z2に、相談者左側席エリアA2-2の話者の音声が混ざり合う危険性がさらに高かうなる。
S1、S2、S3がすべてtrueとなったステータスパターン(以下、「第3のステータスパターン」と呼ぶ)が発生した場合は、3人が同時に発話したと推定することができる。そのため、第3のステータスパターンが発生した場合、混合レベル算出部209が混合処理を行えば、一層、各目的音(エリア音出力Z1、Z2、Z3)へ妨害音が混入する恐れが増大する。したがって、第3のステータスパターンが発生した場合、混合レベル算出部209は、混合処理は見合わせる。
S1、S2、S3の何れか1つがtrueとなったステータスパターン(以下、「第4のステータスパターン」と呼ぶ)が発生した場合、各収音エリアの話者が単独で発話している場合であり、信号混合による妨害音の影響は少ないと考えられる。そこで、第4のステータスパターンが発生した場合、混合レベル算出部209は、ため、ステータスがtrueとなったエリア音出力に対してのみ標準の混合レベルGsを与える。
第2の実施形態によれば、以下のような効果を奏することができる。
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
Claims (14)
- 1又は複数の話者が位置する第1の話者エリアと、前記第1の話者エリアの話者と対話する1又は複数の話者が位置する第2の話者エリア内の複数のサブエリアに指向性を向けることが可能な複数のマイクロホンを備える複数のマイクアレイを備える複数のマイクアレイユニットからの入力信号に基づいて、それぞれの前記マイクアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力を用いて、前記第1の話者エリア及び前記第2の話者エリアに対してエリア収音処理を行うエリア音抽出手段と、
前記第1の話者エリアと前記第2の話者エリアについて、エリア音が発生しているか否かを検出するエリア音検出処理を行うエリア音検出手段と、
前記第1の話者エリアと前記第2の話者エリアのエリア音検出処理の判定結果のパターンに応じて、前記第1の話者エリア及び前記第2の話者エリアのエリア収音結果に対する混合用信号の混合内容を決定する混合内容決定手段と、
前記第1の話者エリア及び前記第2の話者エリアのエリア収音結果に対して、前記混合内容決定手段が決定した内容に従った混合用信号の混合処理を行って出力する信号混合手段と
を有することを特徴とする収音装置。 - 前記混合内容決定手段は、前記第1の話者エリアと前記第2の話者エリアのエリア音検出処理の判定結果のパターンに応じて、前記第1の話者エリア及び前記第2の話者エリアのエリア収音結果に対して混合用信号を混合するか否かを決定し、
前記信号混合手段は、前記混合内容決定手段で混合用信号を混合すると決定されたエリア収音結果について混合用信号を混合して出力する
ことを特徴とする請求項1に記載の収音装置。 - 前記混合内容決定手段は、前記第1の話者エリアと前記第2の話者エリアの両方についてエリア音検出処理によりエリア音が検出された場合、記第1の話者エリア及び前記第2の話者エリアのエリア収音結果に対して混合用信号を混合しないと決定し、それ以外の場合には記第1の話者エリア及び前記第2の話者エリアのエリア収音結果に対して混合用信号を混合すると決定することを特徴とする請求項2に記載の収音装置。
- それぞれの前記マイクアレイユニットは、前記第2の話者エリア内の複数のサブエリアに指向性を向けることが可能であり、
前記エリア音抽出手段は、前記第2の話者エリア内の複数のサブエリアのそれぞれについてエリア収音処理を行うことが可能であり、
前記エリア音検出手段は、それぞれのサブエリアについてもエリア音検出処理を行い、
前記混合内容決定手段は、前記第1の話者エリアと前記第2の話者エリア内の各サブエリアのエリア音検出処理の判定結果のパターンに応じて、前記第1の話者エリア及び前記第2の話者エリア内の各サブエリアのエリア収音結果に対する混合用信号の混合内容を決定し、
前記信号混合手段は、前記第1の話者エリア及び前記第2の話者エリアの各サブエリアのエリア収音結果に対して、前記混合内容決定手段が決定した内容に従った混合用信号の混合処理を行って出力する
ことを特徴とする請求項1に記載の収音装置。 - 前記混合内容決定手段は、前記第1の話者エリアと前記第2の話者エリアの各サブエリアのエリア音検出処理の判定結果のパターンに応じて、前記第1の話者エリア及び前記第2の話者エリアの各サブエリアのエリア収音結果に対する混合用信号の混合レベルを算出し、
前記信号混合手段は、前記第1の話者エリア及び前記第2の話者エリアの各サブエリアのエリア収音結果に対して、前記混合内容決定手段が算出した混合レベルに応じた混合レベルに調整された混合用信号を混合して出力する
ことを特徴とする請求項4に記載の収音装置。 - 前記エリア音抽出手段は、前記第2の話者エリア内の第1のサブエリアと、前記第1のサブエリアから前記第1の話者エリアを見た場合に前記第1のサブエリアの左側又は右側に隣接する第2のサブエリアについてエリア収音処理を行うことを特徴とする請求項5に記載の収音装置。
- 前記混合内容決定手段は、エリア音検出処理の結果、前記第1の話者エリアと前記第1のサブエリアについてだけエリア音が発生しているという判定結果だった場合、又は、前記第1の話者エリアと前記第2のサブエリアについてだけエリア音が発生しているという判定結果だった場合、エリア音が発生していた収音エリアに対する混合レベルを下げるように調整することを特徴とする請求項6に記載の収音装置。
- 前記混合内容決定手段は、前記第1のサブエリアと前記第2のサブエリアについてだけエリア音が発生しているという判定結果だった場合、前記第1のサブエリア、及び前記第2のサブエリアのエリア収音結果に対する混合用信号の混合レベルを下げるように調整することを特徴とする請求項6又は7に記載の収音装置。
- 前記混合内容決定手段は、エリア音検出処理の結果、前記第1の話者エリア、前記第1のサブエリア、及び前記第2のサブエリアの全てについてエリア音が発生しているという判定結果だった場合、前記第1の話者エリア、前記第1のサブエリア、及び前記第2のサブエリアに対して0の混合レベルを設定することを特徴とする請求項6~8のいずれかに記載の収音装置。
- 前記混合内容決定手段は、エリア音検出処理の結果、前記第1の話者エリア、前記第1のサブエリア、及び前記第2のサブエリアの3つの収音エリアのうち、1つについてのみエリア音が発生しているという判定結果だった場合、エリア音が発生していた収音エリアに対する混合レベルを調整しないことを特徴とする請求項6~9のいずれかに記載の収音装置。
- コンピュータを、
1又は複数の話者が位置する第1の話者エリアと、前記第1の話者エリアの話者と対話する1又は複数の話者が位置する第2の話者エリア内の複数のサブエリアに指向性を向けることが可能な複数のマイクロホンを備える複数のマイクアレイを備える複数のマイクアレイユニットからの入力信号に基づいて、それぞれの前記マイクアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力を用いて、前記第1の話者エリア及び前記第2の話者エリアに対してエリア収音処理を行うエリア音抽出手段と、
前記第1の話者エリアと前記第2の話者エリアについて、エリア音が発生しているか否かを検出するエリア音検出処理を行うエリア音検出手段と、
前記第1の話者エリアと前記第2の話者エリアのエリア音検出処理の判定結果のパターンに応じて、前記第1の話者エリア及び前記第2の話者エリアのエリア収音結果に対する混合用信号の混合内容を決定する混合内容決定手段と、
前記第1の話者エリア及び前記第2の話者エリアのエリア収音結果に対して、前記混合内容決定手段が決定した内容に従った混合用信号の混合処理を行って出力する信号混合手段と
して機能させることを特徴とする収音プログラム。 - 収音装置が行う収音方法において、
エリア音抽出手段、エリア音検出手段、混合内容決定手段及び信号混合手段を有し、
前記エリア音抽出手段は、1又は複数の話者が位置する第1の話者エリアと、前記第1の話者エリアの話者と対話する1又は複数の話者が位置する第2の話者エリア内の複数のサブエリアに指向性を向けることが可能な複数のマイクロホンを備える複数のマイクアレイを備える複数のマイクアレイユニットからの入力信号に基づいて、それぞれの前記マイクアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力を用いて、前記第1の話者エリア及び前記第2の話者エリアに対してエリア収音処理を行い、
前記エリア音検出手段は、前記第1の話者エリアと前記第2の話者エリアについて、エリア音が発生しているか否かを検出するエリア音検出処理を行い、
前記混合内容決定手段は、前記第1の話者エリアと前記第2の話者エリアのエリア音検出処理の判定結果のパターンに応じて、前記第1の話者エリア及び前記第2の話者エリアのエリア収音結果に対する混合用信号の混合内容を決定し、
前記信号混合手段は、前記第1の話者エリア及び前記第2の話者エリアのエリア収音結果に対して、前記混合内容決定手段が決定した内容に従った混合用信号の混合処理を行って出力する
ことを特徴とする収音方法。 - 1又は複数の話者が位置する第1の話者エリアと、前記第1の話者エリアの話者と対話する1又は複数の話者が位置する第2の話者エリアに指向性を向けることが可能な複数のマイクアレイユニットと、前記第1の話者エリア及び前記第2の話者エリアのエリア収音処理を行う収音装置を備える収音システムにおいて、前記収音装置として請求項1~10のいずれかに記載の収音装置を適用したことを特徴とする収音システム。
- 前記収音装置によるエリア収音処理の結果を記録する記録装置をさらに備えることを特徴とする請求項13に記載の収音システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019099683A JP7207170B2 (ja) | 2019-05-28 | 2019-05-28 | 収音装置、収音プログラム、収音方法、及び収音システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019099683A JP7207170B2 (ja) | 2019-05-28 | 2019-05-28 | 収音装置、収音プログラム、収音方法、及び収音システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020195069A JP2020195069A (ja) | 2020-12-03 |
JP7207170B2 true JP7207170B2 (ja) | 2023-01-18 |
Family
ID=73546579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019099683A Active JP7207170B2 (ja) | 2019-05-28 | 2019-05-28 | 収音装置、収音プログラム、収音方法、及び収音システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7207170B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003319095A (ja) | 2002-04-26 | 2003-11-07 | Matsushita Electric Ind Co Ltd | 音声制御装置 |
JP2007295104A (ja) | 2006-04-21 | 2007-11-08 | Yamaha Corp | 収音装置および音声会議装置 |
JP2010232862A (ja) | 2009-03-26 | 2010-10-14 | Toshiba Corp | 音声処理装置、音声処理方法、及び、プログラム |
JP2014183902A (ja) | 2013-03-22 | 2014-10-02 | Kyoraku Sangyo Co Ltd | 遊技機 |
JP2016127457A (ja) | 2015-01-05 | 2016-07-11 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
-
2019
- 2019-05-28 JP JP2019099683A patent/JP7207170B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003319095A (ja) | 2002-04-26 | 2003-11-07 | Matsushita Electric Ind Co Ltd | 音声制御装置 |
JP2007295104A (ja) | 2006-04-21 | 2007-11-08 | Yamaha Corp | 収音装置および音声会議装置 |
JP2010232862A (ja) | 2009-03-26 | 2010-10-14 | Toshiba Corp | 音声処理装置、音声処理方法、及び、プログラム |
JP2014183902A (ja) | 2013-03-22 | 2014-10-02 | Kyoraku Sangyo Co Ltd | 遊技機 |
JP2016127457A (ja) | 2015-01-05 | 2016-07-11 | 沖電気工業株式会社 | 収音装置、プログラム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2020195069A (ja) | 2020-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5675848B2 (ja) | レベルキューによる適応ノイズ抑制 | |
US9232309B2 (en) | Microphone array processing system | |
US9986332B2 (en) | Sound pick-up apparatus and method | |
JP5772151B2 (ja) | 音源分離装置、プログラム及び方法 | |
Shabtai et al. | Generalized spherical array beamforming for binaural speech reproduction | |
JP5295115B2 (ja) | 補聴器の駆動方法および補聴器 | |
JP6943120B2 (ja) | 収音装置、プログラム及び方法 | |
JP2020155971A (ja) | 収音装置、収音プログラム、収音方法、及び収音システム | |
JP6436180B2 (ja) | 収音装置、プログラム及び方法 | |
JP2016163135A (ja) | 収音装置、プログラム及び方法 | |
JP7207170B2 (ja) | 収音装置、収音プログラム、収音方法、及び収音システム | |
JP7207159B2 (ja) | 収音装置、収音プログラム、収音方法、及び収音システム | |
US11095979B2 (en) | Sound pick-up apparatus, recording medium, and sound pick-up method | |
WO2021019844A1 (ja) | 収音装置、記憶媒体、及び収音方法 | |
JP6624256B1 (ja) | 収音装置、プログラム及び方法 | |
JP6725014B1 (ja) | 収音装置、収音プログラム及び収音方法 | |
Reindl et al. | An acoustic front-end for interactive TV incorporating multichannel acoustic echo cancellation and blind signal extraction | |
JP7158976B2 (ja) | 収音装置、収音プログラム及び収音方法 | |
As' ad et al. | Perceptually motivated binaural beamforming with cues preservation for hearing aids | |
JP6624255B1 (ja) | 収音装置、プログラム及び方法 | |
JP6669219B2 (ja) | 収音装置、プログラム及び方法 | |
JP6923025B1 (ja) | 収音装置、プログラム及び方法 | |
JP2024027617A (ja) | 音声認識装置、音声認識プログラム、音声認識方法、収音装置、収音プログラム及び収音方法 | |
JP6885483B1 (ja) | 収音装置、収音プログラム及び収音方法 | |
Kellermann | Echoes and noise with seamless acoustic man-machine interfaces–the challenge persists |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220208 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221129 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7207170 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |