JP5246120B2 - 収音装置、利得制御方法、およびプログラム - Google Patents
収音装置、利得制御方法、およびプログラム Download PDFInfo
- Publication number
- JP5246120B2 JP5246120B2 JP2009224668A JP2009224668A JP5246120B2 JP 5246120 B2 JP5246120 B2 JP 5246120B2 JP 2009224668 A JP2009224668 A JP 2009224668A JP 2009224668 A JP2009224668 A JP 2009224668A JP 5246120 B2 JP5246120 B2 JP 5246120B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- level
- unit
- audio
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
まず、図1を参照し、本発明の実施形態による遠隔通信システム1について説明する。図1は、本発明の実施形態による遠隔通信システム1の構成を示した説明図である。図1に示したように、本発明の実施形態による遠隔通信システム1は、遠隔通信装置10Aおよび10Bと、通信網12と、を備える。
近日、ユーザが発した音声を収音して、収音した音声を自動的に一定レベルに増幅して伝送するテレビ会議用装置の研究が行われている。ここで、ユーザが発する音声には、他ユーザに明確に伝えようとする発言としての音声と、つぶやき、独り言または近隣ユーザとの雑談および相談などの小音量の音声とが含まれる。発言としての音声の信号レベルが小さい場合には遠隔地のユーザが聞きやすい音量に増幅することが望まれるが、その他の独り言や雑談などの音声も自動利得制御によって増幅することは適切でない。
図2は、第1の実施形態による遠隔通信装置10の構成を示した機能ブロック図である。図2に示したように、遠隔通信装置10は、マイクロホン100−1〜100−mからなるマイクロホンアレイ100と、指向性形成部101と、音声検出部102と、発言レベル学習部103と、話者特性記録部104と、発言判定部105と、利得制御部106と、通信部107と、を備える。なお、図2に示した各機能ブロックは、一つの収容体に設けられている必要はなく、異なる収容体に分離して設けられていてもよい。
以上説明したように、第1の実施形態による遠隔通信装置10は、複数の指向方向からの収音信号から音声信号を検出する音声検出部102、ユーザによる事前発声に基づき指向方向ごとの発言レベルを学習する発言レベル学習部103、音声検出部102により検出された音声信号が発言レベルを上回るか否かを判定する発言判定部105、および、発言レベルを上回る音声信号を発言伝送レベルに増幅し、他の音声信号を発言伝送レベルより低い他音声伝送レベルに利得調整する利得制御部106を備える。
次に、本発明の第2の実施形態について説明する。第1の実施形態においては、発言レベルを学習するために、会議開始に先立って遠隔通信装置10が発言レベル登録モードに設定される例を説明した。一方、第2の実施形態による遠隔通信装置10’は、発言レベルの学習に際し、特別な動作モードを設けず、会議運用中に逐次学習する。
以上説明したように、第2の実施形態によれば、発言レベル学習モードなどの動作モードを遠隔通信装置10’に設けずに、会議運用中に発言レベルを学習、設定することができる。より詳細には、各ユーザと遠隔通信装置10’との距離を検出し、検出した距離に応じた値を発言レベルの初期値として設定することが可能である。
12 通信網
100、601、602 マイクロホンアレイ
101、603、604 指向性形成部
102、605、606 音声検出部
103、608 発言レベル学習部
104、609 話者特性記録部
105 発言判定部
106、610 利得制御部
107、611 通信部
301−1、301−m FFT
302 遅延制御部
303−1、303−m 乗算部
304 加算部
305 逆FFT
607 音源位置検出部
Claims (7)
- 指向性を形成して指向方向ごとに信号を取得する信号取得部と;
指向方向と信号閾値が対応付けて記録される記録部と;
前記信号取得部により取得された信号から音声信号を検出する音声検出部と;
前記音声検出部により検出された音声信号の信号レベルが、前記音声信号が取得された指向方向に対応する信号閾値を上回るか否かを判断する判断部と;
前記判断部による判断結果に基づき、前記信号閾値を上回る音声信号を第1の信号レベルに利得調整を行う利得制御部と;
を備え、
前記利得制御部は、前記信号閾値を下回る音声信号の利得調整を行わない、または、前記第1の信号レベルより低い第2の信号レベルに利得調整する、収音装置。 - 前記収音装置は、
前記記録部に指向方向と対応付けて記録される信号閾値を話者の事前発声に基づいて学習する学習部をさらに備え、
前記学習部は、前記事前発声に基づいて音声信号が取得された指向方向に対応する信号閾値を、前記事前発声により取得された前記音声信号の信号レベルに基づいて学習する、請求項1に記載の収音装置。 - 前記収音装置は、
話者による発声に基づいて前記話者と前記収音装置との距離を検出する位置検出部と;
前記発声に基づいて音声信号が取得された指向方向に対応する信号閾値を、前記位置検出部により検出された前記話者と前記収音装置との距離に応じて設定する学習部と;
をさらに備える、請求項1に記載の収音装置。 - 前記学習部は、前記位置検出部により検出された前記話者と前記収音装置との距離が長いほど、信号閾値を小さなレベルに設定する、請求項3に記載の収音装置。
- 前記収音装置は、
離隔して配置された複数組のマイクロホンアレイをさらに備え、
前記信号取得部は、前記複数組のマイクロホンアレイによる収音信号の各々から指向方向ごとの信号を取得し、
前記位置検出部は、前記複数組のマイクロホンアレイによる収音信号の各々から前記発声に基づく音声信号が取得された指向方向、および前記複数組のマイクロホンアレイの配置間隔に基づいて前記話者と前記収音装置との距離を検出する、請求項3に記載の収音装置。 - 指向方向と信号閾値を対応付けて記録するステップと;
指向性を形成して指向方向ごとに信号を取得するステップと;
取得された信号から音声信号を検出するステップと;
検出された音声信号の信号レベルが、前記音声信号が取得された指向方向に対応する信号閾値を上回っているか否かを判断するステップと;
前記信号閾値を上回る音声信号を第1の信号レベルに利得調整するステップと;
を含み、
前記信号閾値を下回る音声信号に対しては、利得調整が行われない、または、前記第1の信号レベルより低い第2の信号レベルに利得調整される、利得調整方法。 - コンピュータを、
指向性を形成して指向方向ごとに信号を取得する信号取得部と;
指向方向と信号閾値が対応付けて記録される記録部と;
前記信号取得部により取得された信号から音声信号を検出する音声検出部と;
前記音声検出部により検出された音声信号の信号レベルが、前記音声信号が取得された指向方向に対応する信号閾値を上回っているか否かを判断する判断部と;
前記判断部による判断結果に基づき、前記信号閾値を上回る音声信号を第1の信号レベルに利得調整し、前記信号閾値を下回る音声信号の利得調整を行わない、または、前記第1の信号レベルより低い第2の信号レベルに利得調整する利得制御部と;
として機能させるための、プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009224668A JP5246120B2 (ja) | 2009-09-29 | 2009-09-29 | 収音装置、利得制御方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009224668A JP5246120B2 (ja) | 2009-09-29 | 2009-09-29 | 収音装置、利得制御方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011077649A JP2011077649A (ja) | 2011-04-14 |
JP5246120B2 true JP5246120B2 (ja) | 2013-07-24 |
Family
ID=44021203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009224668A Expired - Fee Related JP5246120B2 (ja) | 2009-09-29 | 2009-09-29 | 収音装置、利得制御方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5246120B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6056544B2 (ja) * | 2013-02-26 | 2017-01-11 | 富士ゼロックス株式会社 | 音声解析装置、信号解析装置、音声解析システムおよびプログラム |
JP5929810B2 (ja) * | 2013-03-27 | 2016-06-08 | 富士ゼロックス株式会社 | 音声解析システム、音声端末装置およびプログラム |
JP5737342B2 (ja) * | 2013-07-22 | 2015-06-17 | 沖電気工業株式会社 | 収音装置及びプログラム |
JP5988461B2 (ja) * | 2014-07-30 | 2016-09-07 | 株式会社タムラ製作所 | 自動音声調整装置 |
CN106205628B (zh) | 2015-05-06 | 2018-11-02 | 小米科技有限责任公司 | 声音信号优化方法及装置 |
JP2017108240A (ja) * | 2015-12-08 | 2017-06-15 | シャープ株式会社 | 情報処理装置、及び情報処理方法 |
JP6701573B2 (ja) | 2016-08-03 | 2020-05-27 | 株式会社リコー | 音声処理装置、音声映像出力装置、及び遠隔会議システム |
CN112151058B (zh) * | 2019-06-28 | 2023-09-15 | 大众问问(北京)信息科技有限公司 | 一种声音信号的处理方法、装置及设备 |
CN112669878B (zh) * | 2020-12-23 | 2024-04-19 | 北京声智科技有限公司 | 声音增益值的计算方法、装置和电子设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05241588A (ja) * | 1992-03-02 | 1993-09-21 | Fujitsu Ltd | 閾値決定方法 |
JP5070960B2 (ja) * | 2007-07-06 | 2012-11-14 | ヤマハ株式会社 | 収音装置 |
-
2009
- 2009-09-29 JP JP2009224668A patent/JP5246120B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011077649A (ja) | 2011-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5246120B2 (ja) | 収音装置、利得制御方法、およびプログラム | |
US10553235B2 (en) | Transparent near-end user control over far-end speech enhancement processing | |
US10149049B2 (en) | Processing speech from distributed microphones | |
AU2016201028B2 (en) | Signal enhancement using wireless streaming | |
DK2916321T3 (en) | Processing a noisy audio signal to estimate target and noise spectral variations | |
US20120163624A1 (en) | Directional sound source filtering apparatus using microphone array and control method thereof | |
CN108235181B (zh) | 在音频处理装置中降噪的方法 | |
EP2835986B1 (en) | Hearing device with input transducer and wireless receiver | |
US20120303363A1 (en) | Processing Audio Signals | |
EP2732638B1 (en) | Speech enhancement system and method | |
EP2715725A2 (en) | Processing audio signals | |
WO2016034454A1 (en) | Method and apparatus for enhancing sound sources | |
CN110875056B (zh) | 语音转录设备、系统、方法、及电子设备 | |
JP2001309483A (ja) | 収音方法および収音装置 | |
US10529358B2 (en) | Method and system for reducing background sounds in a noisy environment | |
US10602276B1 (en) | Intelligent personal assistant | |
JPH1118192A (ja) | 収音方法およびその装置 | |
JPH1118193A (ja) | 受話状態検出方法およびその装置 | |
JP2007329753A (ja) | 音声通信装置および音声通信システム | |
JP2008294599A (ja) | 放収音装置、および放収音システム | |
US10419851B2 (en) | Retaining binaural cues when mixing microphone signals | |
JP2019537071A (ja) | 分散したマイクロホンからの音声の処理 | |
JP2009302983A (ja) | 音声処理装置および音声処理方法 | |
JP2008294600A (ja) | 放収音装置、および放収音システム | |
JP5022459B2 (ja) | 収音装置、収音方法及び収音プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5246120 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |