JP2008017126A - Voice conference system - Google Patents
Voice conference system Download PDFInfo
- Publication number
- JP2008017126A JP2008017126A JP2006185674A JP2006185674A JP2008017126A JP 2008017126 A JP2008017126 A JP 2008017126A JP 2006185674 A JP2006185674 A JP 2006185674A JP 2006185674 A JP2006185674 A JP 2006185674A JP 2008017126 A JP2008017126 A JP 2008017126A
- Authority
- JP
- Japan
- Prior art keywords
- conference
- sound
- audio
- voice
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
この発明は、それぞれにマイクとスピーカとを備えた複数の音声会議装置を同一室内等の所定空間内に配置して、これら複数の音声会議装置同士で相互に音声通信を行うことで音声会議を実現する音声会議システムに関するものである。 This invention arranges a plurality of voice conference apparatuses each having a microphone and a speaker in a predetermined space such as the same room, and performs voice communication between the plurality of voice conference apparatuses with each other. The present invention relates to an audio conference system to be realized.
大きな会議室や会議場のような広い空間で会議を行う際に用いる音声会議システムが各種開示されている。 Various audio conference systems used when a conference is held in a large space such as a large conference room or conference hall are disclosed.
特許文献1は、講演者席にはマイクが設置され、他の会議者席にはそれぞれマイクとスピーカとが設置されたプレゼンテーションシステムが開示されている。このシステムでは、それぞれのマイクとスピーカとの距離に応じて放音量レベルが設定されており、この設定レベルに応じて、スピーカ毎に与える放音信号をアッテネーションして放音する。
特許文献2は、講演者席にマイクとスピーカとが設置され、各聴衆者席にそれぞれスピーカが設置された音響設備が開示されている。この音響設備では、講演者席のマイクと各聴衆者席のスピーカとの距離に基づく生音声の伝搬遅延時間を予め設定しておき、この伝搬遅延時間に準じて各聴衆者席のスピーカからの放音を遅延させる。 Patent Document 2 discloses an audio facility in which a microphone and a speaker are installed at a speaker seat, and a speaker is installed at each audience seat. In this audio equipment, a propagation delay time of the live sound based on the distance between the speaker's microphone and each speaker's speaker is set in advance, and the sound from each speaker's speaker is set according to this propagation delay time. Delay sound emission.
このような構成により、これらの特許文献に記載の音声会議システムでは、発言者と聴取者との距離に応じて、音量や遅延量が制御されるため、全ての聴取者に対して発言者の音声を略同等のレベルで提供することができる。
しかしながら、前述の各従来技術では、前述の発言者(講演者)および聴取者毎にそれぞれスピーカやマイクが個別に設置されているので、会議者が多い場合等には、システムが大幅に大きなものとなってしまう。また、会議途中で、参加者が増加するような場合には、当該参加者に対して容易にマイクやスピーカを設置することができず、当該参加者が発言者から遠い場所に着席した場合には、発言者の発声音を聴き取ることができなくなってしまう。 However, in each of the above-described prior arts, since the speaker and the microphone are individually installed for each of the above-described speakers (speakers) and listeners, the system is significantly large when there are many conference persons. End up. Also, if the number of participants increases during the meeting, microphones and speakers cannot be easily installed for the participants, and the participants are seated at a place far away from the speaker. Will not be able to hear the voice of the speaker.
したがって、本発明の目的は、広い空間からなる会議室で会議を行う場合に、会議者数にあまり影響されることなく音声会議を行え、各会議者が確実に発言者の声を聴き取ることができる音声会議システムを簡素な構成で実現することにある。 Therefore, an object of the present invention is to perform an audio conference without being affected by the number of conference participants when a conference is performed in a large conference room, and to ensure that each conference participant listens to the voice of the speaker. This is to realize a voice conferencing system that can be used with a simple configuration.
さらに、会議者がどの位置に、どのタイミングで着席しても、発言者の発声音を確実に聴取させて会議に参加させることができる音声会議システムを簡素な構成で実現することにある。 It is another object of the present invention to realize an audio conference system with a simple configuration that can surely listen to a speaker's voice and participate in the conference regardless of the position and timing of the conference.
この発明の音声会議システムは、それぞれに異なる複数の収音指向性を実現する収音手段およびそれぞれに異なる複数の放音指向性を実現する放音手段を備え、所定パターンで配置された複数の音声会議装置と、該複数の音声会議装置からの収音信号を受け付けて、収音信号を発生した音声会議装置からの距離に応じた調整音量の放音信号を生成する会議音制御手段と、を備えたことを特徴としている。 The audio conference system according to the present invention includes a plurality of sound collecting means for realizing a plurality of sound collecting directivities different from each other and a sound emitting means for realizing a plurality of sound emitting directivities different from each other, and a plurality of sound emitting means arranged in a predetermined pattern. A conference sound control unit that receives sound pickup signals from the plurality of sound conference devices and generates a sound emission signal having an adjustment volume according to a distance from the sound conference device that has generated the sound pickup signals; It is characterized by having.
この構成では、各音声会議装置は、それぞれ自装置付近に在席する各会議者の発声音を個別に収音するとともに、各会議者に対して個別に放音する。会議音制御手段は、各音声会議装置から入力された収音信号をミキシングして音声会議装置毎に個別の放音信号を出力する。この際、各音声会議装置に対する放音信号は、会議音制御手段により、収音信号の入力元である音声会議装置(以下、収音元音声会議装置)からそれぞれの音声会議装置までの距離に応じて信号レベルが高くなるように設定される。これにより、大きな会議室等で発言者からの距離が遠い位置に聴取者がいても、確実に発言者の発声音を聴き取ることができるとともに、発言者に対して本人の発声音を大きく放音しないため発言者に対する違和感をなくすとともにハウリング防止が可能となる。
さらに、それぞれの音声会議装置に放音機能と収音機能とが備えられていることで、同時に二台の音声会議装置で収音が行われた場合、各収音元音声会議装置からの距離に応じて他の音声会議装置の放音信号の信号レベルが設定されてミキシングされるので、全ての会議者が確実に聴き取れて且つより臨場感溢れる会議音声を実現できる。
また、この発明の音声会議システムの音声会議装置は、複数のマイクからなるマイクアレイと複数のスピーカからなるスピーカアレイと複数のマイクの収音音声に基づいて会議者方位を検出する会議者方位検出手段とを備え、該会議者方位検出手段で異なる複数の会議者方位を検出した場合に、複数のスピーカに与える放音音声を制御することで各会議者方位に対して同時に個別の放音指向性で放音を行うことを特徴としている。
In this configuration, each audio conference device individually collects the utterance sound of each conference person present in the vicinity of its own device and emits it individually to each conference participant. The conference sound control means mixes the collected sound signals input from the respective audio conference devices and outputs individual sound emission signals for each audio conference device. At this time, the sound emission signal for each audio conference device is sent by the conference sound control means to the distance from the audio conference device that is the input source of the sound collection signal (hereinafter, the sound collection source audio conference device) to each audio conference device. Accordingly, the signal level is set to be higher. As a result, even if the listener is far away from the speaker in a large conference room, the speaker's voice can be heard reliably, and the speaker's voice can be greatly released to the speaker. Since no sound is generated, it is possible to eliminate a sense of incongruity for the speaker and prevent howling.
Furthermore, since each voice conference device is equipped with a sound emission function and a sound collection function, when sound is collected by two voice conference devices at the same time, the distance from each sound source voice conference device Accordingly, since the signal level of the sound emission signal of the other audio conference apparatus is set and mixed, it is possible to realize conference audio that can be listened to by all the conference parties reliably and more realistic.
In addition, the audio conference apparatus of the audio conference system according to the present invention includes a microphone array composed of a plurality of microphones, a speaker array composed of a plurality of speakers, and a conference party orientation detection that detects a conference party orientation based on sound collected by the plurality of microphones. And a plurality of different meeting party orientations detected by the meeting party orientation detection means, by controlling the sound emission to be given to a plurality of speakers, the individual sound emitting direction for each meeting party direction simultaneously. It is characterized by emitting sound by sex.
この構成では、会議者方位検出手段が会議者位置を検出すると、会議者方位に強い収音指向性と放音指向性とを設定する。これにより、会議者方位からの音声、すなわち会議者が発言者である場合の発声音、会議者方位への音声、すなわち会議者が聴取者である場合の放音音声のS/N比が高くなる。また、一台の音声会議装置に複数の会議者が在席しても、各会議者に個別の放収音を行うことができる。なお、会議者方位は操作スイッチ等により検出しても、会議者の発声音をマイクアレイの各マイクで収音した収音信号に対して遅延処理を行って各方位に収音ビーム信号を形成し、その信号レベルで検出してもよい。また、この会議者方位検出を会議実行中に、連続的または所定タイミング間隔で機能させ続ければ、会議中に新たな会議者が加わったり会議者が移動したりしても、確実に発言者の発声音を聴取させたり、この新たな会議者の発言を収音することができる。 In this configuration, when the conference direction detection unit detects the location of the conference, the sound collection directivity and sound emission directivity that are strong in the conference direction are set. Thereby, the S / N ratio of the voice from the conference direction, that is, the utterance sound when the conference person is the speaker, the sound toward the conference direction, that is, the sound output sound when the conference person is the listener is high. Become. Further, even when a plurality of conference persons are present in one audio conference apparatus, it is possible to emit and collect individual sounds for each conference party. Note that even if the conference direction is detected by an operation switch, etc., a sound collection beam signal is formed in each direction by performing a delay process on the collected signal obtained by collecting the voice of the conference by each microphone of the microphone array. However, it may be detected at the signal level. In addition, if this conference direction detection continues to function continuously or at predetermined timing intervals during a conference, it will be possible to ensure that the speaker's direction is maintained even if a new conference participant is added or the conference party moves during the conference. It is possible to listen to the uttered sound or pick up the speech of this new conference person.
この発明によれば、広い空間からなる会議室で会議を行う場合に、各会議者が確実に発言者の声を聴き取ることができる音声会議システムを簡素な構成で実現することができる。この際、各音声会議装置が複数の放収音指向性を有することで、各音声会議装置に対して複数人が在席しても、各会議者が個別に発声者の音声を聴き取ることができる。 According to the present invention, it is possible to realize an audio conference system with a simple configuration in which each conference person can surely hear the voice of a speaker when a conference is performed in a conference room consisting of a large space. At this time, since each voice conference device has a plurality of sound emission and collection directivities, each conference person can listen to the voice of the speaker individually even if a plurality of people are present at each voice conference device. Can do.
また、この発明によれば、各音声会議装置が会議者方位を検出することで、会議者がどの位置にどのタイミングで着席しても、発言者の発声音を確実に聴取することができる。 Further, according to the present invention, each voice conference device detects the conference direction, so that the voice of the speaker can be surely heard regardless of the position and timing of the conference.
本発明の実施形態に係る音声会議システムについて図を参照して説明する。
図1は本実施形態の音声会議システムの構成図であり、本図では各音声会議装置にそれぞれ二人ずつ会議者が在席している場合を示す。
図2は本実施形態の音声会議システムの通信配線を示す構成図であり、本図では、四台の音声会議装置を接続する場合を示す。
なお、本実施形態では、音声会議装置が四台の場合を示すが、この台数に限ることなく、会議室の大きさおよび参加者等の仕様に基づいて設置台数は適宜設定すればよい。
図1に示すように、本実施形態の音声会議システムは、大会議室等の広い空間の会議室100内に、複数の音声会議装置1A〜1Dを配置してなる。複数の音声会議装置1A〜1Dは同じ仕様で形成されており、長尺状の形状からなる。音声会議装置1A〜1Dは、長机101上に長机101の延びる方向に対して平行な直線状に配列され、音声会議装置1A〜1Dの長尺方向と長机101の延びる方向とが平行になるように配置されている。
An audio conference system according to an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a configuration diagram of the audio conference system according to the present embodiment. In this figure, two audio conference apparatuses are present in each audio conference apparatus.
FIG. 2 is a configuration diagram showing communication wiring of the audio conference system according to the present embodiment. In this figure, a case where four audio conference apparatuses are connected is shown.
Although the present embodiment shows a case where there are four audio conference apparatuses, the number is not limited to this number, and the number of installed devices may be set as appropriate based on the size of the conference room and the specifications of the participants.
As shown in FIG. 1, the audio conference system according to the present embodiment includes a plurality of
各音声会議装置1A〜1Dには、それぞれ二人ずつの会議者200A〜200Hが在席しており、対応する音声会議装置1A〜1Dを用いて音声会議を行う。具体的に、音声会議装置1Aに会議者200A,200Eが在席し、音声会議装置1Bに会議者200B,200Fが在席し、音声会議装置1Cに会議者200C,200Gが在席し、音声会議装置1Dに会議者200D,200Hが在席している。なお、この実施形態の説明では、一台の音声会議装置1に対して二人の会議者200が在席する例を示したが、一台の音声会議装置に三人以上の会議者が同時に在席してもよい。
In each of the
図2に示すように、各音声会議装置1A〜1Dと会議音声制御装置2とはLAN等により接続されている。各音声会議装置1A〜1Dは、自装置に在席する会議者200A〜200Hの発言を収音して、収音音声信号SsA〜SsDを生成し、会議音声制御装置2に送信する。会議音声制御装置2は、収音音声信号SsA〜SsDを、音声会議装置1A〜1D毎に異なるミキシング比でミキシングして、音声会議装置1A〜1D毎の放音音声信号SdA〜SdDを生成し、各音声会議装置1A〜1Dに送信する。各音声会議装置1A〜1Dは、受信した放音音声信号SdA〜SdDをそれぞれの在席者200A〜200Hに向けて放音する。この際、詳細なミキシング比の設定例は後述するが、概念的には、(1)自装置の収音音声信号を大きく含まない、(2)放音させる音声会議装置と収音した音声会議装置との距離に応じたゲインにより収音音声信号を増幅する、という点に基づいて各放音音声信号SdA〜SdDを生成する。
As shown in FIG. 2, each of the
また、会議音声制御装置2は、会議室100外の音声会議システムの会議音声制御装置2にネットワーク等を介して接続されていれば、当該別の音声会議システムに対して、収音音声信号SsA〜SsDを同レベルでミキシングした外部出力音声信号SdOを生成して送信し、別の音声会議システムからの外部入力音声信号SsOを前記収音音声信号SsA〜SsD群にミキシングして各音声会議装置1A〜1Dに送信する。
If the conference audio control device 2 is connected to the conference audio control device 2 of the audio conference system outside the
次に、より具体的に、本実施形態の音声会議システムを構成する音声会議装置1(1A〜1D)および会議音声制御装置2の構成および処理を説明する。 Next, the configuration and processing of the audio conference device 1 (1A to 1D) and the conference audio control device 2 configuring the audio conference system of the present embodiment will be described more specifically.
図3は本実施形態の音声会議装置1A〜1Dの三面図であり、(A),(C)が側面図、(B)が底面図である。
図4は本実施形態の音声会議装置1A〜1Dの主要構成を示すブロック図である。
図3に示すように、本実施形態の音声会議装置1(1A〜1D)は、機構的に、筐体112、脚部113、操作部114を備える。
筐体112は一方向に長尺な略直方体形状からなり、筐体112の長尺な辺(面)の両端部には、筐体112の下面を設置面から所定間隔離間する所定高さの脚部113が設置されている。なお、以下の説明では、筐体112の四側面のうち、長尺な面を長尺面、短尺な面を短尺面と称する。この長尺面に沿って、図1に示すように、音声会議装置1A〜1Dが配列される。
FIG. 3 is a three-side view of the
FIG. 4 is a block diagram showing the main configuration of the
As shown in FIG. 3, the audio conference device 1 (1 </ b> A to 1 </ b> D) of the present embodiment mechanically includes a
The
筐体112の上面における長尺な方向の一方端には、複数のボタンや表示画面からなる操作部114が設置されている。これら操作部114は筐体112内に設置されたメイン制御部10に接続し、会議者からの操作入力を受け付けて、メイン制御部10に出力するとともに、操作内容や実行モード等を表示画面に表示する。
An
筐体112における操作部114が設置された側の短尺面には、図示しないが、ネットワーク接続端子等の各種入出力インターフェース端子が設置されており、このネットワーク接続端子を介することで、音声会議装置1(1A〜1D)は会議音声制御装置2にLAN等で接続する。
Although not shown, various input / output interface terminals such as a network connection terminal are installed on the short surface of the
筐体112の下面には、同形状からなるスピーカSP1〜SP16が設置されている。これらスピーカSP1〜SP16は長尺方向に沿って一定の間隔で直線状に設置されており、これによりスピーカアレイが構成される。筐体112の一方の長尺面には、同形状からなるマイクMIC101〜MIC116が設置されている。これらマイクMIC101〜MIC116は長尺方向に沿って一定の間隔で直線状に設置されており、これによりマイクアレイが構成される。また、筐体112の他方の長尺面にも、同形状からなるマイクMIC201〜MIC216が設置されている。これらマイクMIC201〜MIC216も長尺方向に沿って一定の間隔で直線状に設置されており、これによりマイクアレイが構成される。そして、筐体112の下面側には、これらスピーカアレイおよびマイクアレイを覆う形状で形成され、パンチメッシュされた下面グリル(図示せず)が設置されている。なお、本実施形態では、スピーカアレイのスピーカ数を16本とし、各マイクアレイのマイク数をそれぞれ16本としたが、これに限ることなく、仕様に応じてスピーカ数およびマイク数は適宜設定すればよい。
Speakers SP <b> 1 to SP <b> 16 having the same shape are installed on the lower surface of the
音声会議装置1A〜1Dは、機能的には図4に示すように、メイン制御部10、通信制御部11、放音制御部12、D/Aコンバータ13、放音アンプ(AMP)14、収音アンプ(AMP)15、A/Dコンバータ16、収音制御部17、エコーキャンセル部18、リモコン送受信部19、操作部114、スピーカSP1〜SP16、マイクMIC101〜MIC116、MIC201〜MIC216、を備える。
As shown in FIG. 4, the
メイン制御部10は、音声会議装置の全体制御を行うとともに、操作部114から入力される電源オン/オフ等の制御や、その他信号処理系の各種制御を行う。
The
メイン制御部10は、在席する会議者200がリモコン120を操作し、リモコン送受信部19を介して会議参加情報を受け付けると、受け付けたリモコン120の方向から会議者200の方位を検出する。メイン制御部10は検出した方位に基づいて会議者200方向に強い指向性を有する放音指向性を設定して、放音制御部12に与える。
When the attendee 200 operating the
通信制御部11は、LANを介して接続された会議音声制御装置2からの放音音声信号Sdを受信して、通信形式のデータから一般的な音声信号に変換して、エコーキャンセル部18を介して放音制御部12に出力する。
The communication control unit 11 receives the sound output audio signal Sd from the conference audio control device 2 connected via the LAN, converts the communication format data into a general audio signal, and sets the
また、通信制御部11は、エコーキャンセル部18から出力された収音音声信号Ssを通信形式に変換し、会議音声制御装置2に送信する。
In addition, the communication control unit 11 converts the collected sound signal Ss output from the
放音制御部12は、メイン制御部10からの与えられた放音指向性に基づいて、入力された放音音声信号Sdに対して遅延処理や振幅処理等を行って、在席する会議者200の方向に強い指向性を有する放音ビームを形成するように、各スピーカSP1〜SP16に対応する放音信号を生成する。
The sound
各D/Aコンバータ13は、入力された放音信号をディジタル−アナログ変換して、各放音アンプ14に与え、各放音アンプ14はアナログ化された放音信号を増幅して、各スピーカSP1〜SP16に与える。各スピーカSP1〜SP16は、入力された電気的な放音信号を音声に変換して放音する。
Each D /
マイクMIC101〜MIC116、MIC201〜MIC216は、自装置に在席する会議者200からの発声音を含む周囲の音を収音して電気的な収音信号に変換し、収音アンプ15に与える。収音アンプ15は収音信号を増幅してA/Dコンバータ16に与え、A/Dコンバータ16は、アナログ形式の収音信号をディジタル変換して、収音制御部17に出力する。
The microphones MIC101 to MIC116 and MIC201 to MIC216 collect ambient sounds including utterances from the conference person 200 present in the apparatus, convert them into electrical sound collection signals, and supply them to the
収音制御部17は、各マイクMIC101〜MIC116,MIC201〜MIC216の収音信号に対して遅延処理等を行い、それぞれに異なる方位に強い指向性を有する複数の収音ビーム信号を生成する。収音制御部17は、生成した各方位の収音ビーム信号の振幅を比較し、最も振幅の大きい収音ビーム信号MBを選択して、エコーキャンセル部18に出力する。この際、会議者200が発言していれば、会議者200の方向に強い指向性を有する収音ビーム信号が選択される。このため、この方位情報をメイン制御部10に与え、メイン制御部10はこの方位情報に基づいて放音指向性を設定してもよい。逆に、前述のように会議者200からリモコン操作により方位情報が入力されていることを利用し、当該方位に指向性を有する収音ビーム信号のみを形成したり、当該方位を含む所定方位角範囲内のみで収音ビーム信号を形成し、振幅による選択を行ってもよい。
The sound
エコーキャンセル部18は、適応型フィルタとポストプロセッサとを備える。適応型フィルタは放音音声信号Sdに基づく擬似回帰音信号を生成する。ポストプロセッサは収音制御部17から出力された収音ビーム信号MBから、放音音声信号Sdの擬似回帰音信号を減算して、通信制御部11に収音音声信号Ssとして出力する。これにより、スピーカSPからマイクMICへの回り込み音を抑圧する。
The
図5は本実施形態の会議音声制御装置2の主要構成を示すブロック図である。
会議音声制御装置2はCPU21、メモリ22、ミキサ23を備える。
CPU21は会議音声制御装置2の全体制御を行うとともに、収音音声信号SsA〜SsDに基づいて、放音音声信号SdA〜SdD毎のミキシング比および遅延時間をメモリ22から読み出してミキサ23に与える。
メモリ22は、各放音音声信号SdA〜SdDに対する収音音声信号SsA〜SsDのミキシング比および遅延時間比を記憶している。
図6(A)は、各放音音声信号SdA〜SdDを構成する際の各収音音声信号SsA〜SsDのゲインGの関係を示す図であり、(B)は各放音音声信号SdA〜SdDを構成する際の各収音音声信号SsA〜SsDの遅延時間Tの関係を示す図である。
図6(A)に示すように、それぞれの放音音声信号SdA〜SdDに対して、ミキシング要素となる各収音音声信号SsA〜SsDのゲインGは予め設定されている。このゲインGは、放音先である音声会議装置からの距離に応じて大きくなるように設定されている。音声会議装置1Aからの距離は、置換順に、(1)音声会議装置1B、(2)音声会議装置1C、(4)音声会議装置1Dとなる。したがって、音声会議装置1Aの放音音声信号SdAに対して、音声会議装置1Bの収音音声信号SsBのゲインをG1、音声会議装置1Cの収音音声信号SsCのゲインをG3、音声会議装置1Dの収音音声信号SsDのゲインをG5として、G1<G3<G5となるように設定されている。そして、これらゲインG1,G3,G5は、ゲイン調整後の各収音音声信号SsB〜SsDの音量レベルが略同じになるように設定されている。さらに、放音先の音声会議装置からの収音音声信号は、ミキシング要素に含まない(ゲインG=「0」に相当)ように設定されている。
なお、放音先の音声会議装置からの収音音声信号をミキシング要素に含めるようにしても良い。この場合、該収音音声信号は他の音声会議装置で得られた収音音声信号よりも小さな音量レベルでミキシングされる。すなわち、この時のゲインをG0とすると、0<G0<<G1とする。これにより、放音先の音声会議装置からは、当該装置の収音音声信号が極小さいレベルで再生(放音)される。これは拡声の目的ではなく、発言者による音声のモニタを目的とするもので、このように小さな音量レベルで再生することで、ハウリングを防止しながら、発言者の自然な会話をサポートすることができる。
FIG. 5 is a block diagram showing the main configuration of the conference voice control apparatus 2 of the present embodiment.
The conference voice control device 2 includes a
The
The
FIG. 6A is a diagram illustrating the relationship of gain G of each collected sound signal SsA to SsD when each sound output sound signal SdA to SdD is configured, and FIG. 6B is a diagram illustrating each sound output sound signal SdA to SdA to SdA. It is a figure which shows the relationship of the delay time T of each sound-collected audio | voice signal SsA-SsD at the time of comprising SdD.
As shown in FIG. 6A, the gain G of each of the collected sound signals SsA to SsD, which is a mixing element, is set in advance for each of the emitted sound signals SdA to SdD. This gain G is set so as to increase in accordance with the distance from the audio conference device that is the sound output destination. The distance from the
Note that the collected sound signal from the voice conference device that is the sound output destination may be included in the mixing element. In this case, the collected voice signal is mixed at a volume level smaller than that of the collected voice signal obtained by another voice conference apparatus. That is, assuming that the gain at this time is G0, 0 <G0 << G1. As a result, the collected voice signal of the device is reproduced (sounded) at a very small level from the voice conference device of the sound emitting destination. This is not for the purpose of loud sound but for the purpose of monitoring the voice of the speaker. By playing at such a low volume level, it is possible to support the natural conversation of the speaker while preventing howling. it can.
また、図6(B)に示すように、それぞれの放音音声信号SdA〜SdDに対して、ミキシング要素となる各収音音声信号SsA〜SsDの遅延時間Tは予め設定されている。この遅延時間Tは、放音先である音声会議装置からの距離に応じて長くなるように設定されている。より具体的に、音声会議装置1Aの放音音声信号SdAに対して、音声会議装置1Bの収音音声信号SsBの遅延時間をT1、音声会議装置1Cの収音音声信号SsCの遅延時間をT3、音声会議装置1Dの収音音声信号SsDの遅延時間をT5として、T1<T3<T5となるように設定されている。そして、これら遅延時間T1,T3,T5は、遅延処理をして放音される放音音声信号SdAに含まれる各収音音声信号SsB〜SsDと、これら収音音声信号SsB〜SsDに対応する音声会議装置1B〜1Dの会議者200B〜200D,200F〜200Hの生の発声音とが同時に音声会議装置1Aに在席する会議者200Aに届くように設定されている。
ところで、これらゲインGおよび遅延時間Tは、装置設置時に装置間距離を計測して入力することで設定すればよい。
As shown in FIG. 6B, the delay time T of each of the collected sound signals SsA to SsD serving as a mixing element is set in advance for each of the emitted sound signals SdA to SdD. This delay time T is set so as to increase in accordance with the distance from the voice conference device that is the sound output destination. More specifically, the delay time of the collected audio signal SsB of the
By the way, the gain G and the delay time T may be set by measuring and inputting the distance between apparatuses when the apparatus is installed.
ミキサ23は、CPU21から与えられたゲインGおよび遅延時間Tに基づいて、各音声会議装置1A〜1Dから受信した収音音声信号SsA〜SsDをミキシングして放音音声信号SdA〜SdDを生成する。より具体的に、ミキサ23は、放音音声信号SdA〜SdD毎に設定されたゲインGおよび遅延時間Tを用いて、各収音音声信号SsA〜SsDに、対応するゲインGと遅延時間Tとを乗算し、これら乗算後の各収音音声信号SsA〜SsDを加算する。ミキサ23は、これら放音音声信号SdA〜SdDを各音声会議装置1A〜1Dに送信する。
The
このようにゲインが設定されミキシングされることで、会議者間(音声会議装置間)の距離に影響されることなく、いずれの会議者が発言しても、聴取者である全ての会議者に同等の音量で発声音を放音することができる。 By setting the gain and mixing in this way, regardless of the distance between the conferences (between the audio conference devices), no matter which conferencer speaks, all the conference participants who are listeners The utterance sound can be emitted with the same volume.
さらに、このように遅延時間が設定されてミキシングされることで、会議者間(音声会議装置間)の距離に影響されることなく、いずれの会議者が発言しても、聴取者である各会議者に発言者の生音声と音声会議装置からの放音音声とを同時に与えることができる。 Furthermore, since the delay time is set and mixed in this way, each conference person speaks without being affected by the distance between the conference parties (between the audio conference apparatuses). The voice of the speaker and the sound emitted from the audio conference device can be simultaneously given to the conference person.
なお、この際、各音声会議装置1A〜1Dが外部の音声会議装置とネットワークを介して接続している場合、外部の音声会議装置には、各収音音声信号SsA〜SsDを同レベルのゲインで調整して加算した外部出力音声信号SdOを送信する。一方、外部の音声会議装置から外部入力音声信号SsOを受信すれば、適当なゲインを設定して、収音音声信号SsA〜SsDをそれぞれ所定ミキシング比でミキシングした放音音声信号SdA〜SdDに加える。これにより、前述の放収音環境を維持しながら、外部の音声会議装置との音声会議も実現することができる。
At this time, if each of the
次に、具体的な状況を設定し、図を参照することで前記機能を説明する。
図7は会議者200Aのみが発言している状況を示す図である。図7において、破線は収音音声を示し、実線は放音音声を示す。また、SsX(Gm,Tn)は、収音音声信号SsXをゲインGm、遅延時間Tnで調整した信号を示す。
図7に示すように音声会議装置1Aが会議者200Aの発言を収音すると、収音音声信号SsAを生成する。音声会議装置1Aは収音音声信号SsAを会議音声制御装置2に送信し、会議音声制御装置2は収音音声信号SsAに基づいて、放音音声信号SdA〜SdDを生成し、それぞれ音声会議装置1A〜1Dに送信する。この際、会議音声制御装置2は、前述の基準に従って設定されたゲインGおよび遅延時間Tを用いて放音音声信号SdA〜SdDを生成する。各音声会議装置1A〜1Dは、放音音声信号SdA〜SdDを受信して放音する。
具体的には、音声会議装置1Aは0レベルの放音音声信号SdAを放音するか、信号レベル(0レベル)を検出して放音を行わない。音声会議装置1Bはゲイン・遅延調整された放音音声信号SdB=SsA(G1,T1)を放音する。音声会議装置1Cはゲイン・遅延調整された放音音声信号SdC=SsA(G3,T3)を放音する。音声会議装置1Dはゲイン・遅延調整された放音音声信号SdD=SsA(G5,T5)を放音する。
Next, the function will be described by setting a specific situation and referring to the drawing.
FIG. 7 is a diagram showing a situation where only the
As shown in FIG. 7, when the
Specifically, the
このような処理を行うことにより、会議者200B〜200D,200F〜200Hは会議者200Aの発言を十分な音量で、且つ生音声と放音音声とのズレによる違和感が無い状態で聴き取ることができる。なお、会議者200Eは、会議者200Aの正面近傍に在席しているので、会議者200Aの生音声を直接聴き取ることができる。そして、会議者200Aは、自身の発声音を放音音声として聞くことが無いので、違和感なく発言することができる。
By performing such processing, the
以上のように、本実施形態の構成および処理を用いることにより、広い空間で会議を行う場合にも、全ての会議者が各発言者の発言を十分な音量で、且つ違和感なく聴き取ることができる。 As described above, by using the configuration and processing of the present embodiment, even when a conference is performed in a wide space, all the conference members can listen to the speech of each speaker at a sufficient volume and without a sense of incongruity. it can.
なお、このような放収音処理の状況で、各音声会議装置1A〜1Dは、前述のように会議者方向に強い指向性を有する放音音声を形成することができるので、それぞれの会議者方向にのみ放音音声が放音されるように設定することで、隣り合う会議者間でそれぞれの放音音声が混じり合うことがない。これにより、各会議者はより一層違和感なく発言者の音声を聴き取ることができる。
また、各音声会議装置1A〜1Dは、前述のように操作入力や収音ビーム信号を検出することができるので、会議者が移動しても、確実に会議者方向へ音声を放音することができる。これにより、会議者は移動しても発言者の音声を確実に聴き取ることができる。
In addition, in such a state of sound emission and collection processing, each of the
In addition, since each of the
また、前述の説明では、ゲイン調整と遅延時間調整とをともに行う場合を説明したが、いずれか一方のみを行うようにしてもよい。この場合、ミキシング処理の負荷が軽減することで、よりレスポンスよく放音音声信号を生成することができる。 In the above description, the case where both gain adjustment and delay time adjustment are performed has been described. However, only one of them may be performed. In this case, the sound output sound signal can be generated with better response by reducing the load of the mixing process.
また、前述の説明では、一台の音声会議装置に二人の会議者が在席する場合を示したが、さらに多くの人が一台の音声会議装置に在席する場合でも、前述の構成を適用することができる。この場合、多くの人が在席する音声会議装置は、在席する全員に同等に放音するように広い指向性の放音音声を放音しても、各人に対して絞った放音音声を放音するようにしてもよい。 Further, in the above description, the case where two conference persons are present in one audio conference apparatus has been described. However, the above-described configuration is possible even when more people are present in one audio conference apparatus. Can be applied. In this case, an audio conference device in which many people are present, even if a sound with a wide directivity is emitted so as to be emitted equally to all people present, Sound may be emitted.
また、各音声会議装置1A〜1Dは前述のように会議者を検出することができる。さらに、複数人が在席しても各人に放音音声を提供することができる。これらを利用することで、いずれかの音声会議装置に会議者が途中参加して、会議者数が増加しても、全ての会議者が発言者の発声音を十分な音量で且つ違和感無く聴き取ることができる。
Moreover, each audio |
この際、各音声会議装置1A〜1Dは各会議者の方位情報を会議音声制御装置2に与えることで、会議音声制御装置2は、各音声会議装置の距離情報と各会議者の方位情報とから、各々の会議者間の距離をより詳細に設定することもできる。この会議者間の距離を用いることで、より詳細にゲインおよび遅延時間を設定することができる。
At this time, each of the
1(1A〜1D)−音声会議装置、2−会議音声制御装置、10メイン制御部、11通信制御部、12−放音制御部、13−D/Aコンバータ、14−放音アンプ(AMP)、15−収音アンプ(AMP)、16−A/Dコンバータ、17−収音制御部、18−エコーキャンセル部、19−リモコン送受信部、112−筐体、113−脚部、114−操作部、200A〜200H−会議者、SP1〜SP16−スピーカ、MIC101〜MIC116,MIC201〜MIC216−マイク 1 (1A to 1D) -voice conference device, 2-conference voice control device, 10 main control unit, 11 communication control unit, 12-sound emission control unit, 13-D / A converter, 14-sound emission amplifier (AMP) , 15-sound collecting amplifier (AMP), 16-A / D converter, 17-sound collecting control unit, 18-echo canceling unit, 19-remote control transmission / reception unit, 112-housing, 113-leg unit, 114-operation unit , 200A-200H-conference, SP1-SP16-speaker, MIC101-MIC116, MIC201-MIC216-microphone
Claims (2)
該複数の音声会議装置からの収音信号を受け付けて、収音信号を発生した音声会議装置からの距離に応じた調整音量の放音信号を生成する会議音制御手段と、
を備えた音声会議システム。 A plurality of audio conferencing apparatuses arranged in a predetermined pattern, each having a sound collection means for realizing a plurality of sound collection directivities different from each other and a sound emission means for realizing a plurality of sound emission directivities different from each other;
A conference sound control means for receiving sound pickup signals from the plurality of voice conference devices and generating a sound emission signal having an adjustment volume according to the distance from the voice conference device that has generated the sound pickup signals;
Voice conference system with
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006185674A JP2008017126A (en) | 2006-07-05 | 2006-07-05 | Voice conference system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006185674A JP2008017126A (en) | 2006-07-05 | 2006-07-05 | Voice conference system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008017126A true JP2008017126A (en) | 2008-01-24 |
Family
ID=39073748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006185674A Pending JP2008017126A (en) | 2006-07-05 | 2006-07-05 | Voice conference system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008017126A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011524135A (en) * | 2008-06-11 | 2011-08-25 | ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | Conference audio system, audio signal distribution method and computer program |
WO2017073324A1 (en) * | 2015-10-26 | 2017-05-04 | ソニー株式会社 | Signal processing device, signal processing method, and program |
CN114531425A (en) * | 2021-12-31 | 2022-05-24 | 联想(北京)有限公司 | Processing method and processing device |
-
2006
- 2006-07-05 JP JP2006185674A patent/JP2008017126A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011524135A (en) * | 2008-06-11 | 2011-08-25 | ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング | Conference audio system, audio signal distribution method and computer program |
WO2017073324A1 (en) * | 2015-10-26 | 2017-05-04 | ソニー株式会社 | Signal processing device, signal processing method, and program |
JPWO2017073324A1 (en) * | 2015-10-26 | 2018-08-16 | ソニー株式会社 | Signal processing apparatus, signal processing method, and program |
US10425726B2 (en) | 2015-10-26 | 2019-09-24 | Sony Corporation | Signal processing device, signal processing method, and program |
CN114531425A (en) * | 2021-12-31 | 2022-05-24 | 联想(北京)有限公司 | Processing method and processing device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4929740B2 (en) | Audio conferencing equipment | |
JP3972921B2 (en) | Voice collecting device and echo cancellation processing method | |
US8462976B2 (en) | Voice conference system | |
JP5012387B2 (en) | Speech processing system | |
US7660428B2 (en) | Ceiling microphone assembly | |
US20070154001A1 (en) | High Quality Audio Conferencing With Adaptive Beamforming | |
JP2008005347A (en) | Voice communication apparatus and composite plug | |
WO2007138985A1 (en) | Discharging/collecting voice device and control method for discharging/collecting voice device | |
JP4882757B2 (en) | Audio conference system | |
JP2008294690A (en) | Voice conference device and voice conference system | |
JP2008017126A (en) | Voice conference system | |
JP2008304498A (en) | Voice detection device, voice conferencing system, and tele-conference system | |
JP2006211156A (en) | Acoustic device | |
JP2007329753A (en) | Voice communication device and voice communication device | |
WO2009110576A1 (en) | Sound collecting device | |
JP4967575B2 (en) | Audio conferencing equipment | |
JP4929673B2 (en) | Audio conferencing equipment | |
JPH03141799A (en) | Loudspeaker system | |
JP2007258951A (en) | Teleconference equipment | |
JP4867248B2 (en) | Speaker device and audio conference device | |
JP5055987B2 (en) | Audio conference device and audio conference system | |
JP2008022360A (en) | Voice communication device and voice communication system | |
JP2009010808A (en) | Loudspeaker device | |
JP2007300552A (en) | Voice signal transmitting/receiving apparatus | |
JP2006148228A (en) | Interactive conversation system |