WO2008018362A1

WO2008018362A1 - dispositif de collecte sonore

Info

Publication number: WO2008018362A1
Application number: PCT/JP2007/065173
Authority: WO
Inventors: Shigeru Homma
Original assignee: Yamaha Corporation
Priority date: 2006-08-07
Filing date: 2007-08-02
Publication date: 2008-02-14
Also published as: US20100046763A1; CN101502129B; EP2059065A1; US8103018B2; JP4893146B2; CN101502129A; JP2008042549A

Description

明細書

収音装置

技術分野

[0001] この発明は、会議などに用いられ、会議参加者の発話音声を収音する収音装置に関するものである。

背景技術

[0002] 近年、 IP電話等では音声の有無を検出する機能として VAD (Voice Activity Detec tion)が搭載されており、無音時には音声情報を送信しない機能として DTX (Disconti nuous transmission)が搭載されているものが多い（例えば非特許文献 1、非特許文献 2参照）。無音時に音声情報を送信しない構成 (以下、無音圧縮と言う）とすることで、送信する情報量（平均ビットレート）を下げることができる。しかし、無音圧縮を行うと、無音から有音に変化する場合に音声部分の頭が途切れる不都合が生じる。

[0003] そこで、収音した音声を一旦メモリへ格納し、無音から有音に変化する時にメモリから過去の音声を読み出して送信することで、立上がり時の音声が途切れないようにした音声圧縮方法が提案されている (例えば特許文献 1参照）。

非特許文献 1 : ITU-T G.711 Appendix II to Recommendation G.711 (02/2000) 非特許文献 2： RFC3389 Real-time Transport Protocol (RTP) Payload for Comfort N oise (CN)

特許文献 1 :特開 2005— 266411号公報

発明の開示

発明が解決しょうとする課題

[0004] しかし、特許文献 1の方法では、マイクの感度が足りずに適正な音声信号を取得できないときは、立上がりの音を検出できないという問題が有った。一方で、立上がりの音を検出するためにマイクの感度を上げた場合、無音区間を有音区間として誤った認識をする可能性が有った。また、マイクの感度を上げた場合、立上がり時に大きな音が入力された場合に、許容入力限界を超えてしまう（クリップしてしまう）という問題が有った。 [0005] 本発明は、無音圧縮を行う場合に、立上がりの音を正確に検出し、かつ、立上がり時に大きな音が入力された場合であってもクリップすることのない収音装置を提供することを目白勺とする。

課題を解決するための手段

[0006] この発明の収音装置は：

複数のマイクを配列してなるマイクアレイと、

前記複数のマイクが収音した音声信号を入力し、分配出力する信号分配手段と、前記信号分配手段が分配出力した音声信号に基づいて、同じ領域に指向性を有する第一と第二の収音ビームをそれぞれ生成する第一と第二の収音信号処理手段と、

前記第一の収音信号処理手段が生成する第一の収音ビームの感度を高感度に設定し、前記第二の収音信号処理手段が生成する第二の収音ビームの感度を低感度に設定するレベル設定手段と、

前記第一と第二の収音信号処理手段が生成した第一と第二の収音ビームをそれぞれ格納する第一と第二のメモリと、

前記第一と第二の収音信号処理手段が生成した第一と第二の収音ビームの信号レベルを検出し、検出された信号レベルの有音、無音を判定するとともに、第一の収音ビームが許容入力限界を超えている力、を検出する音声判定部と、

前記第一と第二のメモリに格納されている収音ビームを読み出し、いずれかを選択して出力するセレクタと、

前記音声判定部が第一の収音ビームが許容入力限界を超えていることを検出しないとき、無音から有音に判定を変更したタイミングで、前記セレクタに、前記第一のメモリに格納されている高感度の収音ビームを出力するように設定し、前記音声判定部が第一の収音ビームが許容入力限界を超えていることを検出したとき、無音から有音に判定を変更したタイミングで、前記セレクタに、前記第二のメモリに格納されている第二の収音ビームを出力するように設定する制御部と、

を備えることを特徴とする。

[0007] この構成では、複数のマイクで収音した音声信号を、信号分配手段が第一と第二の収音信号処理手段に分配出力する。第一と第二の収音信号処理手段は第一と第二の収音ビームを生成し、これらの収音ビームは、それぞれ高感度、低感度に設定される。高感度の収音ビーム、低感度の収音ビームは、それぞれメモリに格納される。セレクタは、制御部から指定されるタイミングでメモリに格納されている収音ビームのいずれかを過去のものから順次読み出し、出力する。音声判定部は、収音ビームの有音、無音を検出し、さらに許容入力限界を超える（クリップする）収音ビームを検出する。制御部は、音声判定部の判定結果を入力する。制御部は、収音ビームがクリツプしてない場合において、無音→有音の判定結果が入力されたとき、セレクタに、高感度の収音ビームを選択して読み出すように設定する。また、制御部は、収音ビーム力 Sクリップしている場合において、無音→有音の判定結果が入力されたとき、セレクタに、低感度の収音ビームを選択して読み出すように設定する。

[0008] また、この発明の収音装置は、前記制御部は、前記音声判定部が所定時間以上有音判定を行っている場合、前記信号分配手段に、全てのマイクが収音した音声信号を単一の収音信号処理手段に出力するよう指示し、前記レベル設定手段に、前記収音信号処理手段が生成する収音ビームを高感度に設定するよう指示し、前記セレクタに、高感度の収音ビームを出力するように指示する通常出力処理を行うことを特徴とする。

[0009] この構成では、所定時間以上安定して有音の判定結果が入力されている場合に、全てのマイクが収音した音声から単一の高感度の収音ビームを生成し、この収音ビームを出力する処理である通常出力処理を行う。これにより安定して有音と判定されている場合には、発話音声を確実に出力する。

[0010] また、この発明の収音装置は、前記制御部は、前記音声判定部が有音から無音に判定を変更したときに、前記通常出力処理から、前記信号分配手段に、音声信号を第一と第二の信号処理手段に分配出力するよう指示し、前記レベル設定手段に、第一と第二の収音信号処理手段が生成する収音ビームの感度をそれぞれ高感度、または低感度に設定するよう指示し、前記セレクタに、前記音声判定部が許容入力限界を超える収音ビームを検出していないとき、無音から有音に判定を変更したタイミングで、高感度の収音ビームを出力するように設定し、前記音声判定部が許容入力限界を超える収音ビームを検出しているとき、無音から有音に判定を変更したタイミングで、低感度の収音ビームを出力するように設定する検出モードへ処理を変更することを特徴とする。

[0011] この構成では、所定時間以上安定して有音の判定結果が入力されている状態から

、無音の判定結果が入力された場合に、上記通常出力処理から、高感度、低感度の収音ビームを用いて無音→有音検出を行う検出モードに移行する。

[0012] また、この発明の収音装置は、前記レベル設定手段は、前記複数のマイクが収音した音声信号のレベルを変更して前記収音信号処理手段に入力させることにより収音ビームをそれぞれ高感度、または低感度に設定することを特徴とする。

[0013] また、この発明の収音装置は、前記レベル設定手段は、前記収音信号処理手段の入力、出力レベル比を変更することにより収音ビームをそれぞれ高感度、または低感度に設定することを特徴とする。

発明の効果

[0014] この発明によれば、低感度の収音ビーム、高感度の収音ビームを設定し、高感度の収音ビームで無音→有音のタイミングを確実に検出するとともに、高感度の収音ビームがクリップしたときに、出力を低感度の収音ビームに切り換えることで、立上がりの音を正確に検出し、かつ、立上がり時に大きな音が入力された場合であってもタリップすること力 S無くなる。

図面の簡単な説明

[0015] [図 1]本実施形態に係る収音装置のマイク配置を示す図

[図 2]本実施形態の収音装置の構成を示すブロック図

[図 3]マイク個数、マイク配置を示す概念図

[図 4]マイクアレイが音声を収音する収音領域を示した図

[0016] 101—筐体、 11〜； 18—マイク、 21—入出力 I/F、 22—収音用アンプ、 23— A/D コンバータ、 24—デジタルオーディオパッチ、 25A, 25B—収音ビーム生成部、 26

A, 26B— FIFOメモリ、 27—音声検出器、 28—制御部、 29—エンコーダ

発明を実施するための最良の形態

[0017] この発明の実施形態に係る収音装置は、複数のマイクで収音した音声信号を所定時間遅延して合成することにより、特定の領域の音声を高感度で収音した収音ビーム（信号)を生成する。この収音ビームの信号レベルを監視することにより、有音、無音 (発話音声の有無）を検出する。所定時間以上安定して有音を検出して!/、る時には全マイクで収音した音声信号を所定時間遅延して合成することにより収音ビームを生成する（これを通常モードとする）。一方で、発話音声が収音されなくなった場合、（機能的に） 2つに分割した信号処理部に各マイクで収音した音声信号を分配入力し、各信号処理部にて同一収音領域に対応する感度の異なる収音ビームを生成する。この場合、高感度の収音ビームで無音→有音を検出し、高感度の収音ビームの信号レベルがクリップした時には低感度の収音ビームを後段に出力する（これを VADモードとする)。

[0018] 以下、本発明の実施形態の収音装置について図面を参照して説明する。

図 1は、本実施形態に係る収音装置のマイク配置を示す図である。

本実施形態の収音装置は、筐体 101に、複数のマイク 11〜； 18を備えている。

筐体 101は一方向に長尺な略直方体形状からなる。以下の説明では、筐体 101の四側面のうち、長尺な面を長尺面、短尺な面を短尺面と称する。

[0019] 筐体 101のいずれか一の長尺面には、同スペックのマイク 11〜； 18が設置されている。これらマイク 11〜； 18は長尺方向に沿って一定の間隔で直線状に設置されており

、これによりマイクアレイが構成される。

[0020] なお、本実施形態では、マイクアレイのマイク数を 8本とした力 S、これに限ることなく、仕様に応じてマイク数は適宜設定すればよい。また、マイクアレイの各マイク間隔は一定でなくてもよぐ例えば、長尺方向に沿って中央部で密に配置され、両端部に向力、うに従って疎に配置されるような態様でもよい。

[0021] マイク 11〜； 18よりなるマイクアレイは、特定の領域 20；!〜 204に強い指向性を有する収音ビームを生成する。本実施形態の収音装置は、マイクアレイの各マイクが収音する音声をそれぞれ所定時間遅延し、遅延後の音声信号を合成することで、特定の領域 20；!〜 204に対応する収音ビームを複数生成する。詳細は後述する。

[0022] 次に、図 2は、本実施形態に係る収音装置の構成を示すブロック図である。図 2に示すブロック図は、上記複数の収音ビームのうち 1つの収音ビームの処理系統について示すものである。図 2に示すように、本実施形態の収音装置は、マイク 11〜； 18、入出力 I/F21、フロントエンドの複数（同図において 8つ）のアンプ 22、 8チャンネルの A/Dコンバータ 23、デジタルオーディオパッチ 24、収音ビーム生成部 25 (25A, 25B)、 FIFOメモリ 26 (26A, 26B)、音声検出器 27、制御部 28、およびエンコーダ 29、を備えている。収音ビーム生成部 25、および FIFOメモリ 26はそれぞれ、通常モード時には 1つの構成部として動作する力 VADモード時には機能的に 2つに分割されて、それぞれ異なる収音ビームを処理するように動作する。通常モード、 VADモードの切り換えは、制御部 28により指示される。

[0023] 入出力 I/F21は、収音装置が収音した音声信号を外部に出力する。なお、入出力 I/F21は、音声信号を、ネットワークに対応するデータ形式 (プロトコル）に変換して外部に出力することもでき、無論、デジタル音声信号をそのまま外部に出力することも可能である。なお、入出力 I/F21は、必要に応じて D/Aコンバータを内蔵しており、アナログ音声信号を外部に出力することも可能である。

[0024] マイクアレイの各マイク;！;!〜 18は、無指向性であっても有指向性であってもよいが、有指向性であることが望ましぐ収音装置の外部からの音声を収音して収音信号 S ；!〜 S8を各アンプ 22に出力する。

[0025] 各アンプ 22は、収音信号 S 1〜S8をそれぞれ AMP22で増幅して A/Dコンバータ

23に与える。 A/Dコンバータ 23は、収音信号 S1〜S8をそれぞれデジタル変換してデジタルオーディオパッチ 24に出力する。なお、 A/Dコンバータ 23は、各収音信号毎に個別のゲイン (入力アナログ信号と出力デジタル信号のレベル比）を設定することができ、各収音信号毎のゲインは制御部 28により設定される。

[0026] デジタルオーディオパッチ 24は、通常モード時には図 3 (B)に示すように、収音ビーム生成部 25に収音信号 S1〜S8を出力する。デジタルオーディオパッチ 24は、 V ADモード時には図 3 (A)に示すように、 A/Dコンバータ 23から入力される収音信号 S 1〜S8を収音ビーム生成部 25A、 25Bのそれぞれに分配して出力する。デジタノレオーディオパッチ 24は、収音ビーム生成部 25A, 25Bに分配出力する収音信号の数を 0〜8まで変更することができる。出力する収音信号の数、および収音信号の組み合わせは制御部 28により設定される。すなわち、デジタルオーディオパッチ 24 は、マイクアレイのマイク配置、マイク数を自由に変更することができるものである。

[0027] 収音ビーム生成部 25は、デジタルオーディオパッチ 24から出力された収音信号に対して所定の遅延処理を行!/ \筐体 101の周囲所定方位（領域 20；!〜 204の!/、ずれ力、）に強い指向性を有する収音ビーム信号 MBを生成する。

[0028] 例えば全てのマイクに前方から同タイミングで音波が到来したとすると、各マイクから出力された収音信号は、合成によって強められる。一方で、これ以外の方向から音波が到来すると、各マイクから出力される収音信号はそれぞれ位相が異なるために合成されることによって弱められる。したがって、マイクアレイの感度はビーム状に絞り込まれて前方にのみ収音ビームを生成する。

[0029] 収音ビーム生成部 25は、各収音信号にそれぞれ所定の遅延時間を付与することで収音ビームを斜めに向けることができる。収音ビームを斜めにする場合、一方の端部マイクから所定時間が経過する毎に順次隣のマイクから音声信号を出力するように設定する。例えば音源がマイクアレイの一方の端部前方に存在する場合、音源に最も近い一方の端部から音波が到来し、反対の端部に最後に音波が到来するが、収音ビーム生成部 25は、この伝搬時間差を補正するように各マイクの収音信号に遅延時間を付与した後合成する。制御部 28は、各収音信号に対応するマイク位置の情報を所持しているため、各収音信号の遅延時間を個別に制御する。したがって、特定の方向の音声信号を合成によって強められる。このように、一列に並んでいるマイクから出力する音声信号を一端力他端に向けて順次遅延することにより、収音ビームは、その遅延時間に応じて傾斜する。

[0030] VADモード時には、収音ビーム生成部 25が機能的に収音ビーム生成部 25A, 25 Bに分割される。収音ビーム生成部 25A, 25Bは、それぞれデジタルオーディオパッチ 24から出力された収音信号に対して所定の遅延処理を行い、筐体 101の周囲所定方位（領域 201 ~204( V、ずれか）に強!/、指向性を有する収音ビーム信号 MB 1 , MB2を生成する。収音ビーム信号 MB 1 , MB2は、同じ領域の音声を異なる感度で収音したものである。なお、通常モード時、 VADモード時ともに同じ領域 (領域 201 〜204のいずれ力、)を収音するため、各収音信号に付与する遅延量は、通常モード時、 VADモード時にかかわらず同じ値である。 [0031] 収音ビーム生成部 25は、通常モード時には、収音ビーム信号 MBを FIFOメモリ 26 、および音声検出器 27に出力する。また、 VADモード時の収音ビーム生成部 25A, 25Bは、収音ビーム信号 MB1、 MB2をそれぞれ機能的に分割された FIFOメモリ 2 6A, 26Bに出力する。また、収音ビーム生成部 25A, 25Bは、収音ビーム信号 MB1 、および MB2を音声検出器 27に出力する。

[0032] FIFOメモリ 26は、入力された収音ビーム信号 MBを順次格納する。 FIFOメモリ 26 は、格納した収音ビーム信号 MBを過去のものから順次エンコーダ 29に出力する。出力タイミング (周期）は制御部 28により指定される。これにより収音ビーム信号 MB は、 FIFOメモリ 26に所定時間分バッファされる。 VADモード時の FIFOメモリ 26A, 26Bは、入力された収音ビーム信号 MB1、 MB2をそれぞれ順次格納し、収音ビーム信号 MB1、 MB2をそれぞれ過去のものから順次エンコーダ 29に出力する。この場合も出力タイミング (周期）は制御部 28により指定される。これにより収音ビーム信号 MB1、 MB2は、 FIFOメモリ 26A, 26Bに所定時間分バッファされる。

[0033] 音声検出器 27は、入力された収音ビーム信号 MBの信号レベルを検出する。音声検出器 27は、検出した信号レベルから有音、無音の判定を行う。すなわち、音声検出器 27は、収音ビーム信号の信号レベルが所定の閾値未満から閾値以上に変化した場合 (信号レベルが閾値以上となった時)、無音→有音と判定する。一方で、音声検出器 27は、収音ビーム信号の信号レベルが所定の閾値以上から閾値未満となつた場合、閾値未満となる時間が所定時間以上続く場合にのみ有音→無音と判定する。閾値未満となった時間が所定時間よりも少ない場合は、有音が継続していると判断する。判定結果は制御部 28に出力される。

[0034] また、音声検出器 27は、 VADモード時に入力された収音ビーム信号 MB1、 MB2 の信号レベルをそれぞれ検出する。音声検出器 27は、高感度の収音ビーム信号 M B1の信号レベルから有音、無音の判定を行う。判定結果は制御部 28に出力される。

[0035] エンコーダ 29は、通常モード時には、 FIFOメモリ 26から入力された収音ビーム信号 MBを音声圧縮し、入出力 I/F21に出力する。音声圧縮方式はどのような方式に基づいてもよいが、例えば ITU—T G. 711に基づく。

[0036] また、エンコーダ 29は、 VADモード時には、 FIFOメモリ 26A, 26Bから入力された収音ビーム信号 MB1 , MB2のいずれかを音声圧縮し、入出力 I/F21に出力する。収音ビーム信号 MB1 , MB2のどちらを圧縮して出力するかは制御部 28により設定される。また、エンコーダ 29は、制御部 28により、音声圧縮の有無が設定される。すなわち、制御部 28は、音声検出器 27から有音、無音の判定を受信し、無音と判定された場合に、エンコーダ 29で音声圧縮をせずに、入出力 I/F21に圧縮音声を出力しないように設定する。

[0037] 収音ビーム信号 MB1 , MB2は、 FIFOメモリ 26A, 26Bに所定時間分バッファされるため、制御部 28が音声検出器 27から無音→有音の判定結果を受信してェンコ一ダ 29に有音圧縮に切り換え指示を行ったとき、立上がり時の音声が途切れることはない。

し力、し、全てのマイク感度が低ぐ収音ビーム信号 MB 1、 MB2の信号レベルが低すぎる場合は音声検出器 27が無音→有音の判定を行うことができず、有音、無音判定閾値を下げた場合には本来無音である場合も有音と判定してしまう。一方でマイク感度が高ぐ収音ビーム信号 MB1、 MB2の信号レベルが高すぎる場合は、許容入力限界を超えてしまう（クリップする）。

[0038] そこで、本実施形態の収音装置は、 VADモード時には、デジタルオーディオパッチ 24により、マイクアレイのマイク個数、配置を変更し、高感度用の収音ビーム生成部、低感度用の収音ビーム生成部を設定することで、無音→有音を確実に検出しつつ、無音→有音時に大きな音が入力された場合にクリップを防止する。

[0039] この収音装置の具体的な動作について説明する。図 3は、マイク個数、マイク配置を示す概念図であり、図 4は、マイクアレイが音声を収音する収音領域を示した図である。図 3 (A)は、 VADモード時の処理系統を示した図であり、収音信号 S1 , S3, S 5,および S7を収音ビーム生成部 25Bに、収音信号 S2, S4, S6,および S8を収音ビーム生成部 25Aに入力する。図 3 (B)は、通常モード時の処理系統を示した図であり、収音信号 S1〜S8を全て収音ビーム生成部 25に入力する例を示した図である。制御部 28は、音声検出器 27から安定して (所定の時間以上）クリップが無ぐ有音の判定結果が入力されている場合、この図 3 (B)の通常モード時の設定を行う。

[0040] 通常モード時には、デジタルオーディオパッチ 24は、マイク 11〜； 18の入力系統を全て収音ビーム生成部 25に接続するように設定する。 A/Dコンバータ 23は、マイク 1；!〜 18からの入力系統を全て高ゲインに設定し、収音信号 S；!〜 S8を高レベルで出力する。これらの設定は、制御部 28により指示される。

[0041] 収音ビーム生成部 25は、高レベルの収音信号 S1〜S8を合成し、高レベルの収音ビーム信号 MBを生成する。この例において収音ビーム信号 MBは、例えば図 4 (B) に示すように、領域 202の音声を収音する。収音ビーム信号 MBは、 FIFOメモリ 26 に入力される。制御部 28は、 FIFOメモリ 26の出力タイミングを設定し、 FIFOメモリ 2 6はバッファした収音ビーム信号 MBをエンコーダ 29に出力する。

[0042] また、収音ビーム信号 MBは、音声検出器 27に入力される。音声検出器 27は、入力された収音ビーム信号 MBの信号レベルを検出し、有音、無音の判定を行う。有音、無音の判定結果は制御部 28に出力される。

[0043] 制御部 28は、音声検出器 27から有音の判定結果が入力された場合、エンコーダ 2 9に対し、収音ビーム信号 MBを音声圧縮して出力するように設定する。この通常モード時において、制御部 28は、音声検出器 27から有音→無音の判定結果が入力された場合、 VADモードに移行し、収音ビーム生成部 25、および FIFOメモリ 26を 2分割し、 A/Dコンバータ 23、およびデジタルオーディオパッチ 24に以下のような設定を行うよう指示する。

[0044] デジタルオーディオパッチ 24は、マイク 11、マイク 13、マイク 15、およびマイク 17からの入力系統を収音ビーム生成部 25Bに接続し、マイク 12、マイク 14、マイク 16、およびマイク 18からの入力系統を収音ビーム生成部 25Aに接続するように設定する。

[0045] A/Dコンバータ 23は、マイク 11、マイク 13、マイク 15、およびマイク 17からの入力系統を低ゲインに設定し、収音信号 S 1 , S3, S5, S7を低レベルで出力する。また、 A/Dコンバータ 23は、マイク 12、マイク 14、マイク 16、およびマイク 18からの入力系統を高ゲインに設定し、収音信号 S2, S4, S6, S8を高レベルで出力する。

[0046] 収音ビーム生成部 25Aは、高レベルの収音信号 S2, S4, S6, S8を合成し、高レベルの収音ビーム信号 MB1を生成する。また、収音ビーム生成部 25Bは、低レベルの収音信号 S1 , S3, S5, S7を合成し、低レベルの収音ビーム信号 MB2を生成する。ここで、収音ビーム信号 MB1と収音ビーム信号 MB2は、図 4 (A)に示すように、それぞれ同じ領域（同図においては領域 202)の音声を収音する。

[0047] 収音ビーム信号 MB1は、 FIFOメモリ 26Aに入力され、収音ビーム信号 MB2は、 F IFOメモリ 26Bに入力される。制御部 28は、 FIFOメモリ 26A、および FIFOメモリ 26 Bの出力タイミングを設定し、 FIFOメモリ 26A、および FIFOメモリ 26Bはバッファした収音ビーム信号 MB1、および収音ビーム信号 MB2をエンコーダ 29に出力する。

[0048] また、収音ビーム信号 MB1、および収音ビーム信号 MB2は、音声検出器 27に入力される。音声検出器 27は、上述したように、入力された収音ビーム信号 MB1、収音ビーム信号 MB2の信号レベルをそれぞれ検出し、有音、無音の判定を行う。ここで、音声検出器 27は、通常時には高レベルの収音ビーム信号 MB1の信号レベルから有音、無音の判定を行い、判定結果を制御部 28に出力する。この高レベルの収音ビーム信号 MB1の信号レベルがクリップした場合 (許容入力限界を超えた場合）、クリップした旨の結果を制御部 28に出力する。

[0049] 制御部 28は、音声検出器 27から無音の判定結果が入力されている場合には、ェンコーダ 29に対し、音声圧縮をせずに、圧縮音声を出力しないように設定する。一方、制御部 28は、音声検出器 27からクリップが無ぐ有音の判定結果が入力された場合、エンコーダ 29に対し、高レベルの収音ビーム信号 MB1を音声圧縮して出力するように設定する。また、制御部 28は、音声検出器 27からクリップが有り、有音の判定結果が入力された場合、エンコーダ 29に対し、低レベルの収音ビーム信号 MB2を音声圧縮して出力するように設定する。さらに、制御部 28は、音声検出器 27から安定して (所定の時間以上）クリップが無ぐ有音の判定結果が入力されている場合、 V ADモードから通常モードに移行する。

[0050] 以上のようにして、音声検出器 27は、高レベルの収音ビーム信号 MB1の信号レべルより、無音→有音を確実に検出することができる。また、無音→有音時に大きな音が入力された場合には、制御部 28がエンコーダ 29に低レベルの収音ビーム信号 M B2を音声圧縮して出力するように設定するので、外部には音割れ等のない音声が出力されることとなる。無論、 FIFOメモリ 26A,および FIFOメモリ 26Bにより収音ビーム信号 MB1、および収音ビーム信号 MB2がバッファされているため、制御部 28 が無音→有音の判定結果を受信してエンコーダ 29に有音圧縮への切り換え指示を行ったとき、立上がり時の音声が途切れることはない。

[0051] また、音声検出器 27が安定して (所定の時間以上）クリップが無ぐ有音の判定結果を出力している場合、通常モードに移行して、全てのマイク 11〜； 18を用いて収音ビームを生成するため、音質が向上し、発話者の音声を確実に収音する。音声検出器 27が有音→無音の判定結果を出力した場合、制御部 28は、 VADモードに移行するため、無音圧縮を行う場合には、高レベルの収音ビーム信号と低レベルの収音ビーム信号により無音→有音を確実に判定しながらクリップを防止することができ、有音圧縮を行う場合には全マイクの高音質の収音ビーム信号により発話者の音声を確実に収音、出力することができる。

[0052] なお、上記例では、制御部 28が A/Dコンバータ 23の各入出力系統のゲインを個別に設定することで、高レベルの収音ビーム信号と低レベルの収音ビーム信号を生成する例について示した力 A/Dコンバータ 23の全系統について同じゲインを設定するようにしてもよい。この場合、収音ビーム生成部 25Aと収音ビーム生成部 25B とでゲイン (各収音信号に対する出力信号のレベル）が異なるように設定すればよい。同じレベルの収音信号が入力されても、収音ビーム生成部 25Aは高レベルの収音ビーム信号を出力し、収音ビーム生成部 25Bは低レベルの収音ビーム信号を出力すればよい。

Claims

請求の範囲

[1] 複数のマイクを配列してなるマイクアレイと、

を備えた収音装置。

[2] 前記制御部は、前記音声判定部が所定時間以上有音判定を行って!/、る場合、前記信号分配手段に、全てのマイクが収音した音声信号を単一の収音信号処理手段に出力するよう指示し、

前記レベル設定手段に、前記収音信号処理手段が生成する収音ビームを高感度に設定するよう指示し、前記セレクタに、高感度の収音ビームを出力するように指示する通常出力処理を行う請求項 1に記載の収音装置。

[3] 前記制御部は、前記音声判定部が有音から無音に判定を変更したときに、前記通常出力処理から、

前記信号分配手段に、音声信号を前記第一と第二の信号処理手段に分配出力するよう旨示し、

前記レベル設定手段に、前記第一の収音信号処理手段が生成する第一の収音ビームの感度を高感度に、前記第二の収音信号処理手段が生成する第二の収音ビームの感度を低感度に設定するよう指示し、

前記セレクタに、前記音声判定部が第一の収音ビームが許容入力限界を超えていることを検出していないとき、無音から有音に判定を変更したタイミングで、第一の収音ビームを出力するように設定し、

前記音声判定部が第一の収音ビームが許容入力限界を超えていることを検出しているとき、無音から有音に判定を変更したタイミングで、第二の収音ビームを出力するように設定する検出モードへ処理を変更する請求項 2に記載の収音装置。

[4] 前記レベル設定手段は、前記複数のマイクが収音した音声信号のレベルを変更して前記収音信号処理手段に入力させることにより第一と第二の収音ビームをそれぞれ高感度、または低感度に設定する請求項 1、請求項 2、または請求項 3に記載の収

[5] 前記レベル設定手段は、前記第一と第二の収音信号処理手段の入力、出カレべル比を変更することにより第一と第二の収音ビームをそれぞれ高感度、または低感度に設定する請求項 1、請求項 2、または請求項 3に記載の収音装置。