JP4867798B2 - 音声検出装置、音声会議システムおよび遠隔会議システム - Google Patents
音声検出装置、音声会議システムおよび遠隔会議システム Download PDFInfo
- Publication number
- JP4867798B2 JP4867798B2 JP2007148764A JP2007148764A JP4867798B2 JP 4867798 B2 JP4867798 B2 JP 4867798B2 JP 2007148764 A JP2007148764 A JP 2007148764A JP 2007148764 A JP2007148764 A JP 2007148764A JP 4867798 B2 JP4867798 B2 JP 4867798B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- signal
- voice
- input
- detection device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
複数のマイクをアレイ状に配置したマイクアレイと、前記マイクアレイの各マイクによって収音された音声信号を遅延させて合成することにより、前記複数の指向性マイクの設置方向に指向性を有する複数の収音ビームを形成する収音ビーム形成部と、を備え、前記各収音ビームを前記各収音信号として用いることを特徴とする。
図面を参照してこの発明の実施形態である収音装置について説明する。
図2〜図4を参照して、発話検出部103が行う発話検出のアルゴリズムについて説明する。
図2は、ノイズが小さい環境における収音信号、ノイズ、レベル差D、パワー比Pの関係を説明する図である。また、図3は、ノイズが大きい環境における収音信号、レベル差D、パワー比Pの関係を説明する図である。
すなわち、図2(A)は、左側のマイク101Lによって収音されるノイズ(ノイズL)、右側のマイク101Rによって収音されるノイズ(ノイズR)、および、左側のマイク101Lによって収音される目的音声信号のレベルを示す図である。同図の目的音声信号は、話者が小声で話した場合の信号レベルを示している。同図(B)は、左側のマイク101Lの収音信号と右側のマイク101Rの収音信号のレベル差(V)を示す図である。この図において、d0は、目的音声信号が収音されない場合のレベル差の推移を示す曲線である。また、d1は、マイク101Lによって目的音声信号が収音された場合のレベル差の推移を示す曲線である。同図(C)は、左側のマイク101Lの収音信号と右側のマイク101Rの収音信号のパワー比(dB)を示す図である。この図において、p0は、目的音声信号が収音されない場合のパワー比の推移を示す曲線である。また、p1は、マイク101Lによって目的音声信号が収音された場合のパワー比の推移を示す曲線である。
また、図3(A)に示すように、ノイズが大きい環境下では、左右のマイク101L,Rに収音されるノイズ(ノイズL,ノイズR)のレベルは、(小さい)目的音声信号のレベルに近いレベルであり、また、レベルが大きいため、両ノイズ間のレベル差も大きい。
(上記DT1よりも)大きい値のレベル差しきい値DT2を設定し、左右の収音信号のレベル差Dの、このしきい値DT2に対する大小を判定することで目的音声信号が収音されているか否かを推定することができる。
すなわち、レベル差Dに、2つのしきい値DT1、DT2(DT1<DT2)を設定するとともに、パワー比Pに、2つのしきい値PT1、PT2(PT1>PT2)を設定し、レベル差D>DT1且つパワー比P>PT1を満たすときは、ノイズの小さい環境下で目的音声信号が入力されたと推定することができ、レベル差D>DT2且つパワー比P>PT2を満たすときは、ノイズの大きい環境下で目的音声信号が入力されたと推定することができる。
同図において、レベル差計算部201が、左側のマイク101Lが収音した音声信号(収音信号L)と右側のマイク101Rが収音した音声信号(収音信号R)とのレベル差を計算する。また、パワー比計算部202が、収音信号Lと収音信号Rとのパワー比を計算する。
図5(A)、(B)は、図1に示した収音装置の変形例を示す図である。
同図(A)は、左右のマイク101L,Rに加えて、目的音声収音用のセンタマイク101Cを設けた例である。この構成では、センタマイク101Cが、音声出力部104に接続されている。発話検出部103が発話を検出すると、音声出力部104は、センタマイク101Cが収音した音声信号を後段に出力する。センタマイク101Cは、装置の真正面ではなく、左30度等の若干斜めの方向に設置される。これは、発話音声等の目的音声信号が、左右のマイク101L,Rに対して異なるレベルで収音されるようにするため、話者が装置の真正面から外れた位置に着席するためである。
図5(B)にマイクアレイを用いた収音装置の概略構成を示したが、図6以下の図面を参照して、このマイクアレイおよびスピーカアレイを用いた放収音装置についてさらに詳細に説明する。
また、通信制御部19は、ネットワーク接続端子61を介して他の放収音装置等とデータ通信を行うための制御部である。
図9、図10は、前記メイン制御部10による発話検出動作を示すフローチャートである。
図9は、レベル差D、パワー比PにN段階のしきい値を設定した場合の動作を示すフローチャートである。すなわち、図2〜4の説明では、2段階のしきい値を設定しているが、このフローチャートでは、このしきい値をN段階に拡張した動作を示している。この処理動作は、話者の発言の頭切れが生じない程度に短い周期で繰り返し実行される。
2 ネットワーク
100 収音装置
101L,101R,101C 指向性マイク
101A マイクアレイ
102L,102R,102C A/Dコンバータ
103 発話検出部
104 音声出力部
110 話者
201 レベル差計算部
202 パワー比計算部
211,213 レベル差判定部
212,214 パワー比判定部
215,216 AND回路
217 OR回路
Claims (6)
- それぞれ異なる方向に向けて設置された複数の指向性マイクと、
前記複数の指向性マイクのうち少なくとも2つのマイクによって収音された音声信号である収音信号の大きさの差Dを検出する差検出部と、
前記収音信号の大きさの比Pを検出する比検出部と、
検出された前記差Dおよび前記比Pに基づいて、前記指向性マイクに目的となる音声信号である目的音声信号が入力されたか否かを判定する目的音声判定部と、
を備えた音声検出装置。 - 前記目的音声判定部は、
差Dに、複数のしきい値DT1、DT2、・・・、DTn(DT1<DT2<・・・<DTn)を設定するとともに、比Pに、複数のしきい値PT1、PT2、・・・、PTn(PT1>PT2>・・・>PTn)を設定し、
前記差Dおよび比Pが、i=1〜nの少なくとも1つのiにおいて、D>DTiまたはD≧DTi、且つ、P>PTiまたはP≧PTiを満たすとき、目的音声信号が入力されたと判定する請求項1に記載の音声検出装置。 - 前記目的音声判定部は、ノイズレベルxに対する単調増加関数fd(x)および単調減少関数fp(x)を設定し、前記差Dおよび比Pに対して、D≧fd(x)且つP≧fp(x)を満たすxが存在するとき、目的音声信号が入力されたと判定する請求項1に記載の音声検出装置。
- 前記複数の指向性マイクに代えて、
複数のマイクをアレイ状に配置したマイクアレイと、
前記マイクアレイの各マイクによって収音された音声信号を遅延させて合成することにより、前記複数の指向性マイクの設置方向に指向性を有する複数の収音ビームを形成する収音ビーム形成部と、
を備え、前記各収音ビームを前記各収音信号として用いる請求項1乃至3のいずれかに記載の音声検出装置。 - 請求項1乃至4のいずれかに記載の音声検出装置と、
前記音声検出装置によって目的音声信号が入力されたことが判定されたとき、前記収音された音声信号を外部に出力する音声出力部と、
外部から入力された音声信号を放音する放音部と、
を備えた放収音装置を、複数接続した音声会議システム。 - 請求項1乃至4のいずれかに記載の音声検出装置と、
前記音声検出装置によって目的音声信号が入力されたことが判定されたとき、前記収音された音声信号を外部に出力する音声出力部と、
外部から入力された音声信号を放音する放音部と、
を備えた放収音装置を、ネットワークまたは通信回線を介して複数接続した遠隔会議システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007148764A JP4867798B2 (ja) | 2007-06-05 | 2007-06-05 | 音声検出装置、音声会議システムおよび遠隔会議システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007148764A JP4867798B2 (ja) | 2007-06-05 | 2007-06-05 | 音声検出装置、音声会議システムおよび遠隔会議システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008304498A JP2008304498A (ja) | 2008-12-18 |
JP4867798B2 true JP4867798B2 (ja) | 2012-02-01 |
Family
ID=40233315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007148764A Expired - Fee Related JP4867798B2 (ja) | 2007-06-05 | 2007-06-05 | 音声検出装置、音声会議システムおよび遠隔会議システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4867798B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101103794B1 (ko) * | 2010-10-29 | 2012-01-06 | 주식회사 마이티웍스 | 멀티 빔 음향시스템 |
JP2013142843A (ja) * | 2012-01-12 | 2013-07-22 | Fuji Xerox Co Ltd | 動作解析装置、音声取得装置、および、動作解析システム |
CN105321528B (zh) * | 2014-06-27 | 2019-11-05 | 中兴通讯股份有限公司 | 一种麦克风阵列语音检测方法及装置 |
WO2019186403A1 (en) * | 2018-03-29 | 2019-10-03 | 3M Innovative Properties Company | Voice-activated sound encoding for headsets using frequency domain representations of microphone signals |
CN110491376B (zh) * | 2018-05-11 | 2022-05-10 | 北京国双科技有限公司 | 一种语音处理方法及装置 |
CN113763957A (zh) * | 2019-03-12 | 2021-12-07 | 百度在线网络技术(北京)有限公司 | 应用于车辆的交互方法和装置 |
CN111540365B (zh) * | 2020-07-10 | 2020-10-23 | 北京声智科技有限公司 | 语音信号确定方法、装置、服务器及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07109559B2 (ja) * | 1985-08-20 | 1995-11-22 | 松下電器産業株式会社 | 音声区間検出方法 |
JPH071958B2 (ja) * | 1986-06-20 | 1995-01-11 | 松下電器産業株式会社 | 収音装置 |
JP2913105B2 (ja) * | 1989-03-10 | 1999-06-28 | 日本電信電話株式会社 | 音響信号検出方法 |
JPH03147000A (ja) * | 1989-11-02 | 1991-06-21 | Ricoh Co Ltd | 音声入力装置 |
JP4951232B2 (ja) * | 2005-11-02 | 2012-06-13 | ヤマハ株式会社 | 音声信号送受信装置 |
-
2007
- 2007-06-05 JP JP2007148764A patent/JP4867798B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008304498A (ja) | 2008-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2640967C (en) | Audio conferencing apparatus | |
JP4867798B2 (ja) | 音声検出装置、音声会議システムおよび遠隔会議システム | |
KR101761312B1 (ko) | 마이크 어레이를 이용한 방향성 음원 필터링 장치 및 그 제어방법 | |
JP5050616B2 (ja) | 放収音装置 | |
JP3891153B2 (ja) | 通話装置 | |
KR101125897B1 (ko) | 음성 집음 장치와 에코 캔슬 처리 방법 | |
JP5028944B2 (ja) | 音声会議装置及び音声会議システム | |
EP2026598A1 (en) | Voice conference device | |
EP1564980A1 (en) | Acoustic echo canceller | |
JP2008011196A (ja) | 放収音装置 | |
JP4802708B2 (ja) | 放収音装置 | |
JP4894353B2 (ja) | 放収音装置 | |
JP2008294690A (ja) | 音声会議装置および音声会議システム | |
JP2009021658A (ja) | 放収音装置 | |
JP4967575B2 (ja) | 音声会議装置 | |
JP2009212927A (ja) | 収音装置 | |
JP2007329753A (ja) | 音声通信装置および音声通信システム | |
JP2008017126A (ja) | 音声会議システム | |
JP4269854B2 (ja) | 通話装置 | |
JP5055987B2 (ja) | 音声会議装置および音声会議システム | |
JP2007251782A (ja) | 放収音装置 | |
JP5141442B2 (ja) | 収音装置、及び放収音装置 | |
JP4470413B2 (ja) | マイクロフォン・スピーカ一体構成型・通話装置 | |
JP2007258951A (ja) | 通信会議装置 | |
JP2008294600A (ja) | 放収音装置、および放収音システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100421 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111018 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111031 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141125 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |