JP4867579B2 - Remote conference equipment - Google Patents
Remote conference equipment Download PDFInfo
- Publication number
- JP4867579B2 JP4867579B2 JP2006294683A JP2006294683A JP4867579B2 JP 4867579 B2 JP4867579 B2 JP 4867579B2 JP 2006294683 A JP2006294683 A JP 2006294683A JP 2006294683 A JP2006294683 A JP 2006294683A JP 4867579 B2 JP4867579 B2 JP 4867579B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound collection
- unit
- position information
- acquisition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005540 biological transmission Effects 0.000 claims abstract description 50
- 230000005236 sound signal Effects 0.000 claims abstract description 38
- 238000001514 detection method Methods 0.000 claims description 35
- 238000000034 method Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 abstract description 43
- 230000006854 communication Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000003491 array Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
音声を位置情報と共に送信して、受信した音声とその音場を再現する遠隔会議装置に関する。 The present invention relates to a remote conference apparatus that transmits voice together with position information and reproduces the received voice and its sound field.
従来、送信側の音声を受信して、送信側の音声の音場を再現する遠隔会議装置が提案されている(特許文献1〜2参照。)。
Conventionally, there has been proposed a remote conference apparatus that receives a voice on the transmission side and reproduces a sound field of the voice on the transmission side (see
特許文献1には、以下の装置が記載されている。マイクによって話者の音声をとらえ、マイクから得られる話者情報によって話者位置情報を形成し、この話者位置情報を音声情報と共に多重化して伝送させる。また、受信側では送られて来る話者位置情報により鳴動させるスピーカの位置を切り替え、話者の声と位置を受信側で再現する。
また、特許文献2では、複数のマイクアレイで受け取った音声情報を送信して、これと同数のスピーカアレイに出力することにより、送信元の音場を再現する立体音声情報の創出方法等が開示されている。
しかしながら、特許文献1では、再生する音声を音像定位させる方法が複数のスピーカの音量バランスのみで調整することによるため、正確な音像定位を行うことが困難であった。
However, in
また、特許文献2では、複数のマイクアレイで受け取った音場情報をそのまま出力するので、自然な音声を出力することができる反面、アレイスピーカの数と同数のチャンネル数の信号を遠隔地に伝送しなければならないため、多くの伝送回線リソースを消費してしまう欠点があった。 In Patent Document 2, since sound field information received by a plurality of microphone arrays is output as it is, natural sound can be output, but a signal having the same number of channels as the number of array speakers is transmitted to a remote place. Therefore, there is a drawback that a lot of transmission line resources are consumed.
そこで、本発明は、送信先の音場を再現する装置において、受信した音源位置情報に基づいて音声信号をスピーカアレイに出力することにより、伝送回線リソースの消費を抑えつつ、送信先の音場を正確に再現することを目的とする。 Accordingly, the present invention provides an apparatus for reproducing a sound field of a transmission destination by outputting a sound signal to the speaker array based on the received sound source position information, thereby suppressing the consumption of transmission line resources and the sound field of the transmission destination. The purpose is to reproduce accurately.
本発明は、上述の課題を解決するための手段を以下のように構成している。 In the present invention, means for solving the above-described problems are configured as follows.
(1)本発明は、
音声を収音し、収音信号として出力する複数のマイクをアレイ状に配置したマイクアレイと、
前記複数のマイクから出力した収音信号を遅延加算することにより複数の収音エリアへ指向させた収音ビームをそれぞれ形成する収音ビーム形成部と、
前記複数の収音ビームのうち最大音量を示す収音ビームに対応する収音エリアを位置情報として検出する位置情報検出手段と、
前記マイクの収音信号の出力と前記位置情報とを送信する送信手段と、
複数のスピーカをアレイ状に配置したアレイスピーカと、
外部より音声信号および位置情報を受信する受信部と、
前記受信した位置情報に基づき決定される位置を仮想音源位置とする放音ビームが形成されるよう前記受信した音声信号を処理して前記複数のスピーカに供給する信号処理部と、
を備え、
前記位置情報検出手段は、前記最大音量となる収音ビームの収音エリアを検出した後、該収音エリアをさらに細分した複数の細分化収音エリアへ指向させた取得用収音ビームを各々形成し、前記取得用収音ビームの音量の大きい順に複数選択した取得用収音ビームに対応する細分化収音エリアに基づいて前記位置情報を検出することを特徴とする。
(1) The present invention
A microphone array in which a plurality of microphones that collect sound and output as sound collection signals are arranged in an array;
A sound collection beam forming unit that respectively forms a sound collection beam directed to a plurality of sound collection areas by delay-adding the sound collection signals output from the plurality of microphones;
Position information detection means for detecting, as position information, a sound collection area corresponding to a sound collection beam indicating the maximum volume among the plurality of sound collection beams;
Transmitting means for transmitting the output of the sound pickup signal of the microphone and the position information;
An array speaker in which a plurality of speakers are arranged in an array; and
A receiving unit for receiving an audio signal and position information from the outside;
A signal processing unit that processes the received audio signal so as to form a sound emission beam having a position determined based on the received position information as a virtual sound source position and supplies the sound output beam to the plurality of speakers;
Equipped with a,
The position information detecting means detects a sound collecting area of the sound collecting beam having the maximum sound volume, and then obtains an acquisition sound collecting beam directed to a plurality of subdivided sound collecting areas obtained by further subdividing the sound collecting area. The position information is detected based on subdivided sound collection areas corresponding to the plurality of acquisition sound collection beams that are formed and are selected in descending order of the volume of the acquisition sound collection beam .
本発明の装置は、2台以上の遠隔会議装置を通信回線やネットワークを介して相互に接続するための、1台分の機能を備えている。即ち、受信側ユニットと送信側ユニットとを備えている。
送信側ユニットでは、音源位置情報検出手段は音源の位置を検出すると共に、マイクはその音源の音声信号を収音し、この音声を電気信号に変換する。
The device of the present invention has a function for one device for connecting two or more remote conference devices to each other via a communication line or a network. That is, a receiving unit and a transmitting unit are provided.
In the transmission side unit, the sound source position information detection means detects the position of the sound source, and the microphone picks up the sound signal of the sound source and converts this sound into an electric signal.
音源位置情報検出手段は、複数の位置へ指向させた収音ビームを前記複数のマイクの収音信号から形成し、その複数ある収音ビームの最大音量から収音ビームの収音エリアの位置を話者の位置情報として検出する。送信部は、前記アレイマイクで得られた音声信号と前記位置情報とを送信する。 The sound source position information detection means forms a sound collection beam directed to a plurality of positions from the sound collection signals of the plurality of microphones, and determines the position of the sound collection area of the sound collection beam from the maximum volume of the plurality of sound collection beams. Detect as speaker location information. The transmission unit transmits the audio signal obtained by the array microphone and the position information.
受信側ユニットは、受信部が相手装置から音源の音声信号と前記音源の位置情報とを受信する。信号処理部は、前記スピーカユニットの後方に、この受信した音源の位置情報によって決定される位置を仮想音源位置とする放音ビームが形成されるよう、前記受信した音声信号を処理して前記スピーカユニットに供給する。例えば、この仮想音源の座標は、装置中央を原点とし、背面方向をY軸とする座標軸平面上とすることができる。
以上、2台の遠隔会議装置のうちの一台について説明したが、逆方向への音声信号・位置関係の収音・放音も同様である。
In the receiving unit, the receiving unit receives the sound signal of the sound source and the position information of the sound source from the counterpart device. The signal processing unit processes the received audio signal so as to form a sound emission beam having a virtual sound source position at a position determined by the received sound source position information behind the speaker unit. Supply to the unit. For example, the coordinates of the virtual sound source can be on a coordinate axis plane with the center of the apparatus as the origin and the back direction as the Y axis.
Although one of the two remote conference apparatuses has been described above, the same applies to sound signal collection / sound emission in the opposite direction.
本発明のこれらの構成により、会議参加者に対して、遠隔会議装置をはさんだ反対側に設けた相手装置側の会議室の仮想的な音源と対話しているかのような、リアルな位置関係で対話をすることができる。また、前記音源の位置情報を、前記音源の音声信号と共に受信するから、特許文献2のように、多くの伝送回線リソースを消費してしまう欠点を解消できる。また、特許文献2のように、スピーカが送信側と受信側で同じ数に限定する必要がない。 With these configurations of the present invention, a realistic positional relationship as if the conference participants are interacting with a virtual sound source in the conference room on the opposite device side provided on the opposite side across the remote conference device You can have a conversation. Further, since the position information of the sound source is received together with the sound signal of the sound source, it is possible to eliminate the disadvantage of consuming a lot of transmission line resources as in Patent Document 2. Further, unlike Patent Document 2, it is not necessary to limit the number of speakers to the same number on the transmission side and the reception side.
なお、送信手段が送信する前記マイクの収音信号の出力は、マイクの収音信号であればよく、音源が複数のマイク音声信号のうちのいずれか1つ、または複数を合成するもの(例えば単純加算したもの)でも良いし、また複数のマイクからの収音信号を遅延加算した収音ビームを出力するものでも良いし、収音ビームを複数合成するものでも良い。 Note that the output of the collected sound signal of the microphone transmitted by the transmitting means may be any sound collected signal of the microphone, and the sound source synthesizes any one or a plurality of microphone sound signals (for example, It may be a simple addition), may output a sound collection beam obtained by delay-adding sound collection signals from a plurality of microphones, or may synthesize a plurality of sound collection beams.
この構成では、位置情報検出手段は、細分化収音エリアへ指向させた取得用収音ビームを形成し、その収音ビームの音量が大きいものを選択するから、位置情報としてより細かいエリアを探索できる。また、この構成では、初めから細かいエリアそれぞれに対する収音ビームを形成して選択するのではなくて、2段階に絞り込んで選択している。したがって、形成すべき収音ビームの数を少なくすることができるから、位置情報検出手段に用いるハードウェアを簡素化できる。 In this configuration, the position information detection means forms the acquisition sound collection beam directed to the subdivided sound collection area, and selects a sound volume of the sound collection beam having a large volume. it can. Further, in this configuration, instead of forming and selecting a sound collecting beam for each fine area from the beginning, selection is made by narrowing down to two stages. Therefore, since the number of sound collecting beams to be formed can be reduced, the hardware used for the position information detecting means can be simplified.
(3)本発明は、
前記位置情報検出手段は、前記取得用収音ビームの音量の大きい順に複数選択した取得用収音ビームに対応する細分化収音エリアの間を、前記選択した取得用収音ビームの強弱に応じた比例配分により、前記位置情報を検出すると共に、
前記選択した複数の取得用収音ビームの出力を前記比例配分により合成し、前記マイクの収音信号の出力として前記送信手段に送信させる信号加算手段を備えたことを特徴とする。
(3) The present invention
The position information detecting means is arranged between subdivided sound collection areas corresponding to a plurality of acquisition sound collection beams selected in descending order of the volume of the acquisition sound collection beam according to the strength of the selected acquisition sound collection beam. And detecting the position information by proportional distribution,
A signal adding unit is provided that combines the outputs of the selected plurality of acquisition sound collection beams by the proportional distribution and transmits the output to the transmission unit as the sound collection signal output of the microphone .
この構成では、位置情報検出手段は、選択した細分化収音エリアの間を、前記選択した取得用収音ビームの強弱に対応した比例配分により位置情報を検出するので、細分化収音エリアの中間部分を補間でき、より精度の高い位置情報を得ることができる。また、信号処理部は前記選択した複数の取得用収音ビームの出力を前記比例配分に基づいて合成するので、各収音ビームの収音エリアの中間部分を補間できる。また、このように常にバランスをとって補間することで、音源が移動した場合にも、滑らかに収音ビームの切り替えをすることができる。 In this configuration, the position information detecting means detects the position information between the selected subdivided sound collection areas by proportional distribution corresponding to the strength of the selected acquisition sound collection beam. The intermediate portion can be interpolated, and more accurate position information can be obtained. Further, since the signal processing unit synthesizes the outputs of the selected plurality of acquisition sound collecting beams based on the proportional distribution, it is possible to interpolate an intermediate portion of the sound collection areas of the respective sound collection beams. Further, by always interpolating in a balanced manner in this way, the sound collecting beams can be switched smoothly even when the sound source moves.
本発明によれば、会議参加者に対して、遠隔会議装置をはさんだ反対側に設けた相手装置側の会議室の仮想的な音源と対話しているかのような、リアルな位置関係で対話をすることができる。 According to the present invention, it is possible to interact with a conference participant in a realistic positional relationship as if interacting with a virtual sound source in a conference room on the other device side provided on the opposite side across the remote conference device. Can do.
図1を用いて、本実施形態の音声通信に用いる遠隔会議装置について説明する。図1は、本実施形態の音声通信に用いる遠隔会議装置の外観図(A)と、概略機能図(B)である。 A remote conference apparatus used for voice communication according to the present embodiment will be described with reference to FIG. 1A and 1B are an external view (A) and a schematic functional diagram (B) of a remote conference device used for voice communication according to the present embodiment.
まず、図1(A)を用いて、遠隔会議装置1の構成を説明する。図1(A)に示すように、遠隔会議装置1は、外観上、複数のスピーカSPi(i=1〜N、Nは整数)からなるスピーカアレイと、複数のマイクMi(i=1〜N)からなるマイクアレイとを備えており、例えば、机101の上に設置されるものである。遠隔地に設置された2台の遠隔会議装置と通信回線で接続して、相互に音声通信を行う。
First, the configuration of the
なお、スピーカアレイを構成する複数のスピーカSPi(i=1〜N)は、それぞれ独立して音声信号を扱うことができる音声処理系統に接続され、独立に音声出力が可能となっており、マイクアレイを構成する複数のマイクMi(i=1〜N)は、それぞれ独立に音声出力をデジタルデータに変換可能である。なお、座標系X、Y、Zについての説明は後述する。 The plurality of speakers SPi (i = 1 to N) constituting the speaker array are connected to an audio processing system that can handle an audio signal independently, and can output audio independently, and a microphone The plurality of microphones Mi (i = 1 to N) constituting the array can independently convert the audio output into digital data. The description of the coordinate systems X, Y, and Z will be described later.
次に、図1(B)を用いて、遠隔会議装置1の機能の概略を説明する。図1(B)の左側の図に示すように、音声を送信する場合には、送信側の話者102Aは、遠隔会議装置1に向かって語りかける。そうすると、送信側ユニット1Aでは、マイクアレイを構成する複数のマイクMi(i=1〜N)がそれぞれ音声を収音するとともに、これら収音された音声に基づいて送信側の話者102Aの位置を検出し、収音した音声信号とその位置を示す位置情報とを送信する。この位置情報は、収音した電気信号それぞれにディレイを設定して合成した(即ち遅延加算した)収音ビームを複数パターン形成し、そのパターンの強弱から計算する。この位置情報の座標系は、例えば、図1(A)、図1(B)に示すように、XYZ軸座標系で与えることができる。具体的には、XYZ軸座標系は、遠隔会議装置1の受音面に対して、上下方向がZ軸、左右方向がX軸、この受音面に垂直な奥行き方向をY軸方向とする。また、X軸、Z軸方向の代わりに、この受音面の中心からの距離Rと角度θの極座標で与えることも可能である。
Next, an outline of functions of the
また、図1(B)の右側の図に示すように、遠隔会議装置1の受信側では、この送信された音声信号と位置情報とを基に、受信側ユニット1Bは、仮想音源VSの位置を計算し、これに基づいて、各スピーカSPiに出力する信号へのディレイ量をそれぞれ算出し、送信側ユニット1A側で話された音声にディレイを付与してスピーカSPiに出力する。これにより、送信側ユニット1A側で話された音声の音場を正確に再現して、受信側の聴取者102Bに、送信側の音場を伝える。ここで、仮想音源VSは、受信側ユニット1Bに話しかける受信側の聴取者102Bと対向する位置に設定するのが自然であるから、受信側の聴取者102Bから見て左右方向のX軸座標及び奥行き方向のY軸座標は、実際に送信側ユニット1Aで得られた値と、受信側ユニット1Bで仮想的な位置を設定する座標の値が正負逆になるようにする。前述の極座標を用いる場合も同様である。
As shown in the diagram on the right side of FIG. 1B, on the reception side of the
なお、以上の図1の説明では、送信側ユニット1Aと受信側ユニット1Bを概念的に区別するため別の符号を用いて記述したが、実際には、本実施形態の遠隔会議装置1は、双方向通信が可能であり、受信側の聴取者102Bも、送信側の話者102Aに音声を受信側ユニット1Bのマイクアレイを通じて送信することができる。すなわち、各遠隔会議装置は、図1(B)の送信側ユニット1Aと受信側ユニット1Bを一体に備えたものである。
また、本実施形態では、遠隔会議装置1が伝達する音声として、人声を例に挙げているが、本実施形態の装置1の対象は、人声に限らない。例えば、音楽等であっても良い。以下、同じである。
In the above description of FIG. 1, the
In the present embodiment, human voice is given as an example of the voice transmitted by the
ここで、図5(A)を参照して送信側ユニット1Aで行なう話者の位置の探索方法について簡単に説明する(図5の詳細は後述する。)。遠隔会議装置1内部の検出用ビーム形成部(後述図2の検出用ビーム形成部21に相当)は、図5(A)に示すように、このディレイパターンそれぞれに従い、送信側の話者102Aの位置として想定する、複数の収音エリア111〜114へ指向させた収音ビームを各々形成する。
Here, referring to FIG. 5A, a method for searching for the position of the speaker performed by the transmitting
この収音ビームは、マイクMi(i=1〜N)それぞれからの距離差によるディレイ量差をその特定の位置に合うように調整してデジタル音声信号を重ね合わせることにより形成する。これにより、その特定の位置の音声が互いに強められて入力されると共に、この特定の位置以外から来る音声は互いに打ち消されることになり、この特定の位置の音声への指向性を有することになる。 This sound collecting beam is formed by superimposing digital audio signals by adjusting a delay amount difference due to a distance difference from each of the microphones Mi (i = 1 to N) so as to match the specific position. As a result, the voices at the specific position are input while being strengthened with each other, and the voices coming from other than the specific position are canceled out, and have directivity to the voice at the specific position. .
この収音エリア111〜114と送信側の話者102Aの位置とが合致していれば、これらの収音ビームの中から、音量が最も大きな収音ビームが得られることになる。そこで、遠隔会議装置1内部の検出用ビーム形成部は、収音エリア111〜114に指向させた4個の収音ビームを同時に形成し、音量の大きい方向を探索する。また、遠隔会議装置1内部の取得用ビーム形成部(後述図2の取得用ビーム形成部22に相当し、検出用ビーム形成部と同様の回路構成を持つ)は、このようにして得られた音量の大きい方向(図5ではエリア114)を更に分割する細分化エリア131〜134を設定する。また、この取得用ビーム形成部は、これらの細分化エリア131〜134に指向させた収音ビームを各々形成する。遠隔会議装置1は、この細分化エリア131〜134に向けた収音ビームから音量の大きい収音ビームを選択する。このように2段階で探索することにより、話者102Aの位置を正確且つ迅速に探索できる。
If these
このビーム形成部は、常時稼動するか、または、遠隔会議装置1が所定の間隔ごと、例えば0.5秒おきにビーム位置算出部24が位置検出を行い、そのときにビーム位置算出部24から指示を受けて、稼動するようにする。
The beam forming unit is always operated, or the
次に、図2を用いて、遠隔会議装置1の内部構成について説明する。図2は、この内部構成を表すブロック図である。
まず、図2(A)を用いて、送信側ユニット1Aの構成について説明する。送信側ユニット1Aは、収音した音声をデジタルで加工するために、マイクMiと、A/D変換器29とを備える。また、話者が話している位置を推定し、位置情報を制御信号241として出力することができるよう、話者がいると想定されるマイク前方の複数の位置へ指向させた収音ビームを形成する検出用ビーム形成部21と、BPF23(バンドパスフィルタ)とビーム位置算出部24を備える。また、ビーム位置算出部24で検出した位置の近傍をさらに詳しく探索し、その位置へ指向させた収音ビームを形成することができるよう、取得用ビーム形成部22と信号選択部25と信号加算部26を備える。また、位置情報27Aと収音ビームを多重化するために多重化部28を備える。以下それぞれの構成を説明する。
Next, the internal configuration of the
First, the configuration of the
図2(A)のマイクMi(i=1〜N)は、図1に示すようにN個のマイクであり、これらのマイクMiにより送信側の話者102Aの音声を音声信号に変換する。
A/D変換器29は、A/D変換用のICで構成でき、マイクMiにより取得した音声信号をデジタル音声信号に変換して、検出用ビーム形成部21、取得用ビーム形成部22に送る。
The microphones Mi (i = 1 to N) in FIG. 2A are N microphones as shown in FIG. 1, and these microphones Mi convert the voice of the
The A /
検出用ビーム形成部21は、話者がいると想定されるエリアへ指向させた収音ビームを複数同時に形成する。そのため、例えば、ディレイ処理を行うためのリングバッファ用RAMまたはそれに相当するものを備えて、マイクMi各々で収音した音声信号のディレイ量を調整する。また、このディレイ処理を行うため、リングバッファ用RAMの書き込み、読み出しを制御するプログラムおよびディレイ制御用データを格納したROMを備える。またビーム形成部21はこのプログラムを実行させるための計算部を備えている。遠隔会議装置1は、遠隔会議装置1の信号処理を動作させるDSPを設けており、検出用ビーム形成部21の計算部はその一機能として構成する。
The detection
そこで、図2(A)の検出用ビーム形成部21は、前述したように送信側ユニット1Aの前にある話者の位置を複数想定して収音ビームの収音エリアを設定し、その位置へ指向させた収音ビームを形成する。
Therefore, as described above, the detection
なお、以下の説明では、検出用ビーム形成部21で形成する収音ビームと取得用ビーム形成部22で形成する収音ビームを区別するため、後者の収音ビームを取得用ビームと称する。
In the following description, the latter sound collection beam is referred to as an acquisition beam in order to distinguish between the sound collection beam formed by the detection
図2(A)の検出用ビーム形成部21は、粗い範囲の探索をするために収音エリア(図5(A)の111〜114に相当)へ指向させた収音ビームを形成する。
取得用ビーム形成部22は、検出用ビーム形成部21と同様の構成を備えている。ただし、取得用ビーム形成部22は、検出用ビーム形成部21の収音ビームを解析するビーム位置算出部24の計算結果に基づき、さらに細かい範囲に収音エリア(図5(A)の収音エリア114の中の細分化収音エリア131〜134)を設定する。取得用ビーム形成部22は、細分化収音エリア131〜134に指向させた取得用ビームを各々形成し、信号選択部25に出力する。このように、検出用ビーム形成部21、取得用ビーム形成部22で段階的に細かく収音ビーム、取得用ビームを形成し、送信側の話者102Aの位置を探索しているので、初めから細かく探索するよりも、ハードウェアの構成を簡略化できると共に、計算速度が速くなり、送信側の話者102Aの位置の変動に対する応答を速くすることができる。
図2(A)のBPF23は、検出用ビーム形成部21の収音ビームMB1〜MB4に対し、送信側の話者102Aの検出に必要な音声帯域以外の帯域をカットするフィルタを畳み込み演算し、収音ビームMB’1〜MB’4を出力する。これにより計算量を削減することができ、ビーム位置算出部24が行なう探索を高速化できる。なお、BPF23では、このような帯域をカットしても、前述の検出用ビーム形成部21では、粗い収音エリア111〜114を設定しているので問題ない。
The detection
The acquisition
The
ビーム位置算出部24は、BPF23で出力した収音ビームMB’1〜MB’4のうちから最も音量が大きいパターンを選択する。これにより、送信側の話者102Aの位置を特定できる。ビーム位置算出部24は、当該特定された位置情報を制御信号241として取得用ビーム形成部22に出力する。具体的には、送信側の話者102Aがいると想定される複数の位置のパターンについて予めIDコードを設けておき、ビーム位置算出部24は、収音ビームの音量が大きい位置のIDコードを取得用ビーム形成部22に出力する。
The beam position calculation unit 24 selects the pattern with the highest volume from the collected sound beams MB′1 to MB′4 output from the
なお、このビーム位置算出部24における音量の計算は、デジタル時系列音声データをFFT変換して、複数の特定周波数ごとのゲインの2乗を足し合わせることで代用することができる。また、ビーム位置算出部24は、所定間隔ごと、例えば0.5秒ごとに動作する。これにより、ビーム位置算出部24は、話者102Aの移動を制御信号241として検出できる。
The calculation of the sound volume in the beam position calculation unit 24 can be substituted by performing FFT conversion on digital time-series audio data and adding the squares of gains for each of a plurality of specific frequencies. Further, the beam position calculation unit 24 operates every predetermined interval, for example, every 0.5 seconds. Thereby, the beam position calculation unit 24 can detect the movement of the speaker 102 </ b> A as the
図2(A)の取得用ビーム形成部22は、ビーム位置算出部24からの制御信号241を受けて、検出用ビーム形成部21で合成した収音ビームのうちから最も音量が大きい収音ビームに対応する収音エリアをさらに細分する複数(本実施例では4つ)の収音エリアへ指向させた取得用ビームを形成する。
また、信号選択部25は、取得用ビーム形成部22が出力した取得用ビームのうち音量が大きい2つの取得用ビーム(図5の細分化収音エリア133、134に相当)を選択し、これらの取得用ビームの音量に応じて比例配分した位置を音源の位置102Aとして決定し、これを位置情報27Aとして多重化部28に出力する。
2A receives the control signal 241 from the beam position calculation unit 24, and the sound collection beam having the loudest volume among the sound collection beams synthesized by the detection
In addition, the
図2(A)の信号加算部26は、信号選択部25が出力した2つの取得用ビームを音量に応じて比例配分して合成し、この合成したデジタルの音声信号27Bを多重化部28に送る。このように常に2つ以上の取得用ビームを合成することにより、話者が移動したり、入れ替わったりしたときも音声がスムーズに移動するようにすることができる。
The
図2(A)の多重化部28は、信号選択部25で生成した位置情報27Aと、信号加算部26で生成した音声信号27Bを多重化して、受信側ユニット1Bに送信20を行う。
The multiplexing
次に図2(B)を用いて、受信側ユニット1Bの内部構成について説明する。受信側ユニット1Bは、受信部31と、パラメータ算出部32と、仮想音源生成信号処理部33と、DAC34i(i=1〜N)と、AMP35i(i=1〜N)とを備え、外部のスピーカSPi(i=1〜N)を接続している。以下、それぞれの構成を説明する。
Next, the internal configuration of the receiving
図2(B)の受信部31は、送信側ユニット1Aから、位置情報27Aと、音声信号27Bについて受信信号30の受信を行う。この音声信号27Bは、仮想音源生成信号処理部33に送られると共に、位置情報27Aは、パラメータ算出部32に送られる。
パラメータ算出部32は、位置情報27Aを基に仮想音源VS(図1(B)参照。)を設定して、仮想音源VSの位置から各スピーカSPiの位置までの距離36i(i=1〜N)を計算する。そして、この距離36iを音速で除算することにより、ディレイ量のパラメータを設定する。
The
The
図2(B)の仮想音源生成信号処理部33、DAC34i(i=1〜N)、AMP35i(i=1〜N)について説明する。
仮想音源生成信号処理部33は、パラメータ算出部32で設定するパラメータに基づいて、受信部31で受信した音声、即ち、送信側ユニット1Aの多重化部28で生成した音声信号27Bを、スピーカSPi(i=1〜N)の出力系統ごとに信号処理し、DAC34i(i=1〜N)にそれぞれ出力する。受信部31に入力する音声信号27Bは1系統であるが、音声信号27Bに対しパラメータ算出部32のパラメータ(ディレイ量設定)に基づいて、スピーカSPiの出力系統ごとに、遅延処理を行う。これにより、仮想音源VSを焦点とする放音ビームをスピーカSPiから出力することができ、あたかも、受信側ユニット1Bの前方に仮想音源があるような音像定位を実現できる。
The virtual sound source generation
Based on the parameters set by the
DAC34iは、仮想音源生成信号処理部33で得られた音声デジタルデータをアナログ信号に変換して出力する。
AMP35i(i=1〜N)は、DAC34i(i=1〜N)の出力をそれぞれ増幅して、スピーカSPi(i=1〜N)に出力する。
The DAC 34i converts the audio digital data obtained by the virtual sound source generation
The AMP 35i (i = 1 to N) amplifies the output of the DAC 34i (i = 1 to N), respectively, and outputs the amplified output to the speaker SPi (i = 1 to N).
ここで、送信側ユニット1Aの信号選択部25による絞り込み探索について、補足説明をする。信号選択部25は、例えば取得用ビーム形成部22が、特定時間、話者が静止していると判断した場合にのみ行なっても良い。処理能力の問題上、この絞込み探索をする時間的余裕がない場合があるからである。この場合には、音声信号27Bの生成を以下(A)〜(B)のように処理する。
(A)音源の位置が、粗く設定した収音エリア111〜114の1つに特定時間留まる場合には、取得用ビーム形成部22は、制御信号241が所定期間一定であることを検知し、ビーム位置算出部24で選択した収音エリアのさらに内側の細分化収音エリア(図5(A)の131〜134に相当)へ指向させた複数の取得用ビームを形成する。
(B)音源の位置が、粗く設定した収音エリア111〜114間で移動した場合には、取得用ビーム形成部22は、制御信号241の変動を検知して、取得用ビーム形成部22に検出用ビーム形成部21と同様の複数の粗い範囲を設定した収音エリア111〜114へ指向させた取得用ビームを形成する。この場合の取得用ビームは、上記収音ビームと同様に粗い範囲の収音エリアへ指向する。
Here, a supplementary explanation will be given for the search refinement by the
(A) When the position of the sound source stays in one of the roughly set
(B) When the position of the sound source moves between the
これら(A)、(B)いずれの場合においても、信号選択部25は、取得用ビーム形成部22から出力された複数の取得用ビームの中で、音量が大きい2つを選択して信号加算部26に出力し、信号加算部26はこれらの取得用ビームを音量に応じて比例配分して合成する。
また、図2(A)の信号加算部26は、音源が大きく移動する場合に音量の大きい2つを選択して単純に合成するのではなく、切り替え前の音声をフェードアウトすると共に切り替え後の音声をフェードインして、音声をクロスフェードするようにしてもよい。このように音源が大きく移動する場合、音声を自然に接続できる。このクロスフェードを行う時間中は、送信側ユニット1A、受信側ユニット1B間で、収音エリア111〜114の補間位置と、クロスフェード開始時、終了時を送受信する。パラメータ算出部32は、仮想音源の位置VSについても、このクロスフェード時間内で次第に移動するようにし、この移動に基づいてパラメータを設定する。これにより音像の移動が自然になる。
In either of these cases (A) and (B), the
In addition, the
なお、音源の位置が粗く設定した収音エリア111〜114間で移動した場合は、取得用ビーム形成部22に検出用ビーム形成部21と同様の複数の粗い範囲を設定するが、この場合、信号選択部25の出力する位置情報27Aは、ビーム位置算出部24の出力する位置情報である制御情報241と同等になる。したがって、信号選択部25が出力する位置情報27Aの代わりに、ビーム位置算出部24にて得られる制御情報241を、多重化部28に27C(図2(A)参照)として出力しても良い。
In addition, when the position of the sound source moves between the
図3を用いて、図2のパラメータ算出部32におけるパラメータの設定方法について、具体的に説明する。図3は、この設定方法についての概念図である。
まず、図3(A)で示すように、仮想音源VSと受信側ユニット1Bの各スピーカSPiとの距離36iを計算する。次に、図3(B)で示すように、パラメータ算出部32のパラメータを設定する。例えば、SP1について、距離361を音速Vで除算した値とする。
The parameter setting method in the
First, as shown in FIG. 3A, the distance 36i between the virtual sound source VS and each speaker SPi of the receiving
以上、図2、図3の説明で説明したように、伝送元のマイクMiの個数N個分の音声系統を伝送しなくとも、受信側ユニット1Bは、送信側ユニット1Aの音声信号27Bと、位置情報27Aのみに基づいて、スピーカSPi(i=1〜N)上に、音場を正確に再現できる。
As described above with reference to FIGS. 2 and 3, the reception-
<送信側装置の音声の収音の実施例>
以下、図4、図5を参照して、図2(A)で説明した検出用ビーム形成部21についての収音の実施例についてさらに具体的に説明を行う。
<Example of sound collection by the transmitting device>
Hereinafter, with reference to FIG. 4 and FIG. 5, the sound collection example for the detection
図4を用いて、検出用ビーム形成部21が、収音エリア111〜114へ指向させた収音ビームを形成する方法について説明する。図4では、X1〜XNの入力にディレイを付与して加算する方法を説明するため、仮想の計算テーブル2111〜2114を示している。形成すべき収音ビームMB1〜MB4は、X1〜XNの入力に所定のディレイを付与して合成したものである。検出用ビーム形成部21の図示しないROM内には、この収音エリアに収音ビームを指向させるよう、ディレイパターンのデータ2121〜2124が、収音エリア111〜114に対応して記録されている。検出用ビーム形成部21は、ディレイパターンのデータ2121〜2124に基づいてディレイDji(j=1〜4、i=1〜N)にディレイ量を設定する。マイク入力合成部2141〜2144は、ディレイX1〜XNの入力をDj1〜DjNに通した信号を、計算テーブル2111〜2114ごとに加算して、収音ビームMB1〜MB4として出力する。
With reference to FIG. 4, a description will be given of a method in which the detection
なお、以上では説明上、収音ビームMB1〜MB4毎に計算テーブル2111〜2114を示したが、実装上は、D11〜D41をまとめて1つのリングバッファ用のメモリ等で構成するのが簡便である。このリングバッファには、X1を入力し、D11〜D41の出力タップを設ける。D1i〜D4i(i=2〜N)も同様に、それぞれ1つのXiを入力するリングバッファを構成し、D1i〜D4iの出力タップを設ける。また、実装上、ディレイパターンのデータ2121〜2124を、収音ビームMB1〜MB4毎でなく、入力Xi(i=1〜N)毎に用意するのが好ましい。
In the above description, the calculation tables 2111 to 2114 are shown for each of the sound collecting beams MB1 to MB4 for the sake of explanation. However, in terms of mounting, it is easy to configure D11 to D41 together with a single ring buffer memory or the like. is there. X1 is input to this ring buffer, and output taps D11 to D41 are provided. Similarly, D1i to D4i (i = 2 to N) each constitute a ring buffer for inputting one Xi, and output taps D1i to D4i are provided. Further, in terms of mounting, it is preferable to prepare
次に、図5(A)を参照して音源位置の検出方法について説明する。検出用ビーム形成部21が、複数の収音エリア111〜114へ指向させた収音ビームを同時に形成する。ビーム位置算出部24は、各収音ビームの音量の大小を比較して、この収音エリアのいずれかの領域に話者がいるかを監視する。
Next, a method for detecting a sound source position will be described with reference to FIG. The detection
図5(A)において、各マイクMi(i=1〜N)が収音した音声信号を適当なディレイ時間だけを遅延させて合成することにより、収音エリア111〜114へ指向させた収音ビームを形成するが、以下、各マイクに設定するディレイ時間(すなわち、各マイクが収音した音声を遅延させるディレイ時間)の設定方法について説明する。ここでは、収音エリア111に収束する収音ビームを例に挙げて説明する。図5(A)に示すように、収音エリア111の中心からマイクMi(i=1〜N)までの距離121i(i=1〜N)を計算する。この距離を音速(340m/秒)で除算して収音エリア111から各マイクまでの音波の伝播時間を計算する。計算した伝搬時間のうち、最長のものを基準時間として、この基準時間と各マイクまでの伝播時間との差を、そのマイクに設定するディレイ時間とする。このディレイ時間が検出用ビーム形成部21に設定される。
In FIG. 5 (A), the sound signals picked up by the microphones Mi (i = 1 to N) are synthesized by delaying only an appropriate delay time so as to be directed to the
このように設定されたディレイ時間で各マイクが収音した音声信号を遅延させて合成することにより、収音エリア111から各マイクへ伝搬した音声を、位相をそろえて合成することができ、収音エリア111の音声を高いゲインで出力することができる。一方、他のエリアから伝搬した音声は、位相がずれた状態で合成されるため、振幅が相殺されて低ゲインとなる。
By delaying and synthesizing the sound signal collected by each microphone with the delay time set in this way, the sound propagated from the
以上では収音エリア111に収束する収音ビームについて説明したが、収音エリア112、113、114に収束する収音ビームについても同様である。
The sound collection beam that converges in the
次に、図5(B)を用いて、図2(A)で示したビーム位置算出部24の算出方法について、より具体的に説明する。以下の説明では、送信側の話者が図5(A)に示す102A(収音エリア114の中の細分化収音エリア133内)の位置に存在すると仮定する。また、音源発生信号の波形が符号240で示した形状と仮定する。
まず、検出用ビーム形成部21は、収音エリア111〜114を設定して、送信側の話者102Aの位置を探索している。図5(A)の102Aに話者がいるとすれば、この収音エリア114へ指向させた収音ビームMB’4の音量は最も大きくなる。他方、この収音エリア114から遠ざかる収音エリア113、112、111へ指向させた収音ビームは、波形243→波形242→波形241に示すように、音量は小さくなる。そこで、ビーム位置算出部24は、図2に示す収音ビームMB’1〜MB’4のうちで音量が最大のものに対応する収音エリア(図5では114)を選択する。
また、信号選択部25は、ビーム位置算出部24と同様にして、音量の最も大きな取得用ビーム出力を選択して出力する。ただし、信号選択部25は、取得用ビーム形成部22が設定した細分化収音エリア131〜134の内で音量が最大のものから順に2つの取得用ビームを選択する。この取得用ビームは、図5(A)では、細分化収音エリア133、134に対応するビームとなる。
Next, the calculation method of the beam position calculation unit 24 illustrated in FIG. 2A will be described more specifically with reference to FIG. In the following description, it is assumed that the speaker on the transmission side is present at the
First, the detection
Similarly to the beam position calculation unit 24, the
以上で説明した構成により、それぞれ、図5(A)に示すような、収音エリア11jの方向へ指向させた収音ビームMBjを形成することができる。図2(A)の取得用ビーム形成部22も、これと同様の構成をとることができる。
With the configuration described above, it is possible to form a sound collection beam MBj directed in the direction of the sound collection area 11j as shown in FIG. The acquisition
<具体的使用形態と音場再現例>
図6を用いて、本実施形態の装置の具体的使用形態と音場再現例について説明する。図6は、この具体的使用形態を表す図である。前述の図1の説明のとおり遠隔会議装置1は、通信回線やネットワークを介して相互に接続するための、1台分の機能を備えており、これと同等の2台またはそれ以上の遠隔会議装置を、ネットワークを介して相互に接続するようにする。
<Specific usage and sound field reproduction>
A specific usage pattern of the apparatus of the present embodiment and an example of sound field reproduction will be described with reference to FIG. FIG. 6 is a diagram showing this specific usage pattern. As described above with reference to FIG. 1, the
図6(A)、(B)に示す2台の送信側ユニット1A、受信側ユニット1Bは、音声信号と共に位置情報を送受信するので、互いに同じスピーカの数SPi、あるいはマイクMiを用意しなくとも送信側の話者102Aの音場を伝送できるが、以下では、同一の構成の遠隔会議装置1を用いるものとして説明する。また、簡単のため、以下の説明ではXY平面の2次元座標を用いることとし、送信側ユニット1A、受信側ユニット1Bの中心の位置を図6に示すようにそれぞれ原点の座標とする。
Since the two
図6(A)に示すように、送信側の話者102AのX、Y座標が(X1,−Y1)であったとする。なお、この実施形態では、話者から見て、送信側ユニット1A、受信側ユニット1Bの右側がXプラス方向(すなわち、図6(A)では紙面の左方向、図6(B)では紙面の右方向がXプラス方向)としている。遠隔会議装置1の送信側ユニット1Aは、送信側の話者102Aから発せられ、マイクMiで得られた音声信号を解析して、送信側の話者102Aの位置情報を得る。この位置情報を得る方法は、前述した図4、図5の説明のようにマイクMi(i=1〜N)の音声信号の解析により行うことができる。図6の以下の説明では、この位置情報を得た結果、送信側の話者102Aは、図6(A)に示すように、送信側の話者102AのX軸のプラスの位置にいると仮定して説明する。
As shown in FIG. 6A, it is assumed that the X and Y coordinates of the transmitting
図6(B)に示すように、受信側の聴取者102Bから見れば、送信側の話者102Aは向かい合って会話しているようにするのが自然であるから、送信側の話者102Aの代わりとなる仮想音源VSを設定すべき位置のX座標の値は、原点より左の−X1であり、また、Y座標の値は、奥行き側後方であるからY1となる。結果的に仮想音源VSを設定すべき位置の座標は、(−X1,Y1)となる。そして、前述の図3(B)で説明したようにして、図2(B)のパラメータ算出部32は、この仮想音源VSの位置に基づいて、スピーカSPi(i=1〜N)ごとにそのディレイ量、音量の各パラメータを計算する。そして、図2に示すように、仮想音源生成信号処理部33においてこれを設定して、DAC34i(i=1〜N)、AMP35i(i=1〜N)を経てスピーカSPi(i=1〜N)から音声として出力する。
As shown in FIG. 6B, from the viewpoint of the
以上の実施形態の説明について、補足する。
以上の説明では、説明の容易のため、送信側ユニット1Aは送信を行うものとして説明したが、送信側ユニット1A、1Bは送信のみ、または受信のみ行うものではない。遠隔会議装置1は、双方向通信を行う機能を備えており、受信側の聴取者102Bが話しかけた音声と受信側の聴取者102Bの位置情報は、受信側ユニット1Bを用いて取得され、ネットワークを通じて送信側ユニット1Aに送信される。その機能は、以上の説明と同様である。
It supplements about description of the above embodiment.
In the above description, for ease of explanation, the
また、以上の説明では、送信側の話者102Aは1人であり、1つの音源として説明したが、複数人いても良い。この場合には、位置情報を複数用意して、それぞれの位置での音量を検出して伝送する。受信側ユニットは、上述の図3で示したようなパラメータ設定を話者それぞれについて行い、これに基づいて算出したスピーカSPi(i=1〜N)の出力をユニットごとに加算する。
Further, in the above description, the transmitting
また、図2、図5では、同時に出力する収音ビーム、取得ビーム、収音エリアの数をそれぞれ4つとしたが、いずれもそれ以上であっても良く、それ以下であっても良い。同時に形成する収音ビーム、取得ビームの数は4つに限定されない。また、同時でなく、時分割で収音ビームを出力して、音量を比較するのであれば、収音ビーム、取得用ビームは2つ以上でなく、1つでも足りる。 In FIGS. 2 and 5, the number of sound collecting beams, acquisition beams, and sound collecting areas that are output simultaneously is four, but any of these may be more or less. The number of sound collecting beams and acquisition beams formed simultaneously is not limited to four. Further, if the sound collecting beams are output not in the same time but in a time division manner and the sound volumes are compared, not only two sound collecting beams and acquisition beams but one is sufficient.
また、話者が複数ある場合を想定する場合は、このような段階的な位置の絞込みをするときに、少なくとも最初の段階では、話者の位置を1つに絞り込むのではなく、複数の候補を用意してそれぞれの近傍をさらに探索しても良い。 In addition, when assuming a case where there are a plurality of speakers, when narrowing down such a staged position, at least in the first stage, instead of narrowing down the speaker position to one, a plurality of candidates May be further searched for each neighborhood.
また、以上の説明では、スピーカSPi、マイクMi(i=1〜N)の数はそれぞれ同じNとしたが、必ずしも同じにする必要はない。伝送経路では、特許文献2のようなものと異なり、音源の位置情報を用いて伝送しているからこれらの数が異なっていても、送信元の音場を再現できる。 In the above description, the number of speakers SPi and microphones Mi (i = 1 to N) is the same N, but it is not necessarily the same. In the transmission path, unlike the case of Patent Document 2, transmission is performed using the position information of the sound source, so even if these numbers are different, the sound field of the transmission source can be reproduced.
また、本実施形態では、検出用ビーム形成部21、取得用ビーム形成部22により2段階に収音ビーム、取得用ビームを設定し、送信側の話者102Aを探索したが、3段階以上にエリアを絞り込む設定をして、探索しても良い。
In this embodiment, the detection
また、取得用ビーム形成部22を設けなくても、ビーム位置算出部24だけで位置情報27Cを検出し出力することも可能である。ビーム位置算出部24単独でも収音ビームを比較すれば収音エリア111〜114のいずれに音源102Aが含まれるかを検出できる。また、ビーム位置算出部24は、必ずしも比例配分により求めなくても、単に最大の音量となる取得用ビームを検出して、これに対応する位置情報27Cを検出することができる。
Even without providing the acquisition
さらに、以上の説明では、図2の送信側ユニット1Aでは、音声信号27Bとして、収音ビームまたは取得用ビームを送信するとしたが、単にマイクM1〜MNのいずれかの出力を送信しても良い。また、マイクM1〜MNのいずれかまたは全部を足し合わせたものを送信しても良い。その他、マイクM1〜MNが出力する収音信号を加算等して用いたものであればどのような音声信号でも良い。このようにしても、受信側ユニット1Bは、位置情報27Aまたは27Cに基づいて伝送回線リソースの消費を抑えつつ、送信先の音場を正確に再現することができる。ただし、話者102Aに向けた収音ビームまたは取得用ビームを送信する方が、遠隔会議装置1の耐ノイズ性能が向上する。
Furthermore, in the above description, the
1−遠隔会議装置、 1A−送信側ユニット、 1B−受信側ユニット、
101−机、 102A−送信側の話者、 102B−受信側の聴取者、
111〜114―収音エリア、 12ji(j=1〜4,i=1〜N)−距離、
131〜134−細分化収音エリア、 SPi(i=1〜N)−スピーカ、
Mi(i=1〜N)−マイク、 MBj(j=1〜4)−収音ビーム、
VS−仮想音源、 20−送信、 21−検出用ビーム形成部、
211j(j=1〜4)−計算テーブル、
212j(j=1〜4)−ディレイパターンのデータ、
Dji(j=1〜4、i=1〜N)−ディレイ、
214j(j=1〜4)−マイク入力合成部、
22−取得用ビーム形成部、 23−BPF、 24−ビーム位置算出部、
241−制御信号、 25−信号選択部、 26−信号加算部、
27A−位置情報、 27B−音声信号、 28−多重化部、 29−A/D変換器、
30−受信信号、 31−受信部、 32−パラメータ算出部、
33−仮想音源生成信号処理部、 34i(i=1〜N)−DAC、
35i(i=1〜N)−AMP、 36i(i=1〜N)−距離
1-teleconference device, 1A-transmission side unit, 1B-reception side unit,
101-desk, 102A-speaker on transmitting side, 102B-listener on receiving side,
111-114-sound collection area, 12ji (j = 1-4, i = 1-N)-distance,
131-134-subdivided sound collection area, SPi (i = 1-N)-speaker,
Mi (i = 1 to N) -microphone, MBj (j = 1 to 4) -sound collecting beam,
VS-virtual sound source, 20-transmission, 21-beam forming unit for detection,
211j (j = 1 to 4) —calculation table,
212j (j = 1 to 4) -delay pattern data,
Dji (j = 1 to 4, i = 1 to N) -delay,
214j (j = 1 to 4)-microphone input synthesis unit,
22-Beam acquisition unit for acquisition, 23-BPF, 24-Beam position calculation unit,
241-control signal, 25-signal selection unit, 26-signal addition unit,
27A-position information, 27B-speech signal, 28-multiplexer, 29-A / D converter,
30-received signal, 31-receiver, 32-parameter calculator,
33-virtual sound source generation signal processing unit, 34i (i = 1 to N) -DAC,
35i (i = 1 to N) -AMP, 36i (i = 1 to N) -distance
Claims (2)
前記複数のマイクから出力した収音信号を遅延加算することにより複数の収音エリアへ指向させた収音ビームをそれぞれ形成する収音ビーム形成部と、
前記複数の収音ビームのうち最大音量を示す収音ビームに対応する収音エリアを位置情報として検出する位置情報検出手段と、
前記マイクの収音信号の出力と前記位置情報とを送信する送信手段と、
複数のスピーカをアレイ状に配置したアレイスピーカと、
外部より音声信号および位置情報を受信する受信部と、
前記受信した位置情報に基づき決定される位置を仮想音源位置とする放音ビームが形成されるよう前記受信した音声信号を処理して前記複数のスピーカに供給する信号処理部と、
を備え、
前記位置情報検出手段は、前記最大音量となる収音ビームの収音エリアを検出した後、該収音エリアをさらに細分した複数の細分化収音エリアへ指向させた取得用収音ビームを各々形成し、前記取得用収音ビームの音量の大きい順に複数選択した取得用収音ビームに対応する細分化収音エリアに基づいて前記位置情報を検出する遠隔会議装置。 A microphone array in which a plurality of microphones that collect sound and output as sound collection signals are arranged in an array;
A sound collection beam forming unit that respectively forms a sound collection beam directed to a plurality of sound collection areas by delay-adding the sound collection signals output from the plurality of microphones;
Position information detection means for detecting, as position information, a sound collection area corresponding to a sound collection beam indicating the maximum volume among the plurality of sound collection beams;
Transmitting means for transmitting the output of the sound pickup signal of the microphone and the position information;
An array speaker in which a plurality of speakers are arranged in an array; and
A receiving unit for receiving an audio signal and position information from the outside;
A signal processing unit that processes the received audio signal so as to form a sound emission beam having a position determined based on the received position information as a virtual sound source position and supplies the sound output beam to the plurality of speakers;
Equipped with a,
The position information detecting means detects a sound collecting area of the sound collecting beam having the maximum sound volume, and then obtains an acquisition sound collecting beam directed to a plurality of subdivided sound collecting areas obtained by further subdividing the sound collecting area. A teleconferencing device that detects the position information based on subdivided sound collection areas corresponding to a plurality of sound collection beams for acquisition that are formed and selected in descending order of volume of the sound collection beam for acquisition .
前記選択した複数の取得用収音ビームの出力を前記比例配分により合成し、前記マイクの収音信号の出力として前記送信手段に送信させる信号加算手段を備えた請求項1に記載の遠隔会議装置。 The position information detecting means is arranged between subdivided sound collection areas corresponding to a plurality of acquisition sound collection beams selected in descending order of the volume of the acquisition sound collection beam according to the strength of the selected acquisition sound collection beam. And detecting the position information by proportional distribution,
The output of the previous SL multiple selected acquisition sound beam synthesized by the proportional distribution, teleconference according to claim 1, further comprising a signal adding means for transmitting to said transmission means as an output of the sound collection signal of the microphone apparatus.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006294683A JP4867579B2 (en) | 2005-11-02 | 2006-10-30 | Remote conference equipment |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005320042 | 2005-11-02 | ||
JP2005320042 | 2005-11-02 | ||
JP2006294683A JP4867579B2 (en) | 2005-11-02 | 2006-10-30 | Remote conference equipment |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007151103A JP2007151103A (en) | 2007-06-14 |
JP4867579B2 true JP4867579B2 (en) | 2012-02-01 |
Family
ID=38211887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006294683A Active JP4867579B2 (en) | 2005-11-02 | 2006-10-30 | Remote conference equipment |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4867579B2 (en) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10367948B2 (en) | 2017-01-13 | 2019-07-30 | Shure Acquisition Holdings, Inc. | Post-mixing acoustic echo cancellation systems and methods |
USD865723S1 (en) | 2015-04-30 | 2019-11-05 | Shure Acquisition Holdings, Inc | Array microphone assembly |
USD944776S1 (en) | 2020-05-05 | 2022-03-01 | Shure Acquisition Holdings, Inc. | Audio device |
US11297426B2 (en) | 2019-08-23 | 2022-04-05 | Shure Acquisition Holdings, Inc. | One-dimensional array microphone with improved directivity |
US11303981B2 (en) | 2019-03-21 | 2022-04-12 | Shure Acquisition Holdings, Inc. | Housings and associated design features for ceiling array microphones |
US11302347B2 (en) | 2019-05-31 | 2022-04-12 | Shure Acquisition Holdings, Inc. | Low latency automixer integrated with voice and noise activity detection |
US11310596B2 (en) | 2018-09-20 | 2022-04-19 | Shure Acquisition Holdings, Inc. | Adjustable lobe shape for array microphones |
US11438691B2 (en) | 2019-03-21 | 2022-09-06 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality |
US11445294B2 (en) | 2019-05-23 | 2022-09-13 | Shure Acquisition Holdings, Inc. | Steerable speaker array, system, and method for the same |
US11552611B2 (en) | 2020-02-07 | 2023-01-10 | Shure Acquisition Holdings, Inc. | System and method for automatic adjustment of reference gain |
US11558693B2 (en) | 2019-03-21 | 2023-01-17 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality |
US11678109B2 (en) | 2015-04-30 | 2023-06-13 | Shure Acquisition Holdings, Inc. | Offset cartridge microphones |
US11706562B2 (en) | 2020-05-29 | 2023-07-18 | Shure Acquisition Holdings, Inc. | Transducer steering and configuration systems and methods using a local positioning system |
US11770650B2 (en) | 2018-06-15 | 2023-09-26 | Shure Acquisition Holdings, Inc. | Endfire linear array microphone |
US11785380B2 (en) | 2021-01-28 | 2023-10-10 | Shure Acquisition Holdings, Inc. | Hybrid audio beamforming system |
US11800281B2 (en) | 2018-06-01 | 2023-10-24 | Shure Acquisition Holdings, Inc. | Pattern-forming microphone array |
US12028678B2 (en) | 2019-11-01 | 2024-07-02 | Shure Acquisition Holdings, Inc. | Proximity microphone |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101118746B (en) * | 2007-09-17 | 2012-03-21 | 腾讯科技(深圳)有限公司 | Double track based audio data calibration method and multi-people voice talking system thererof |
JP2010232862A (en) * | 2009-03-26 | 2010-10-14 | Toshiba Corp | Audio processing device, audio processing method and program |
JP5513316B2 (en) * | 2010-08-30 | 2014-06-04 | 日本電信電話株式会社 | Sound field recording / reproducing apparatus, method, and program |
JP2012093705A (en) * | 2010-09-28 | 2012-05-17 | Yamaha Corp | Speech output device |
JP5060631B1 (en) * | 2011-03-31 | 2012-10-31 | 株式会社東芝 | Signal processing apparatus and signal processing method |
WO2018101459A1 (en) | 2016-12-02 | 2018-06-07 | ヤマハ株式会社 | Content playback device, sound collection device, and content playback system |
JP2017103801A (en) * | 2017-01-19 | 2017-06-08 | 株式会社Jvcケンウッド | Communication terminal, communication terminal control method, and communication terminal control program |
JP7182168B2 (en) * | 2019-02-26 | 2022-12-02 | 国立大学法人 筑波大学 | Sound information processing device and program |
CN112860065A (en) * | 2021-02-05 | 2021-05-28 | Oppo广东移动通信有限公司 | Sound pickup control method, sound pickup control device, storage medium, and electronic apparatus |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05316239A (en) * | 1992-05-08 | 1993-11-26 | Toshiba Corp | Conference system |
JP3830997B2 (en) * | 1995-10-24 | 2006-10-11 | 日本放送協会 | Depth direction sound reproducing apparatus and three-dimensional sound reproducing apparatus |
JP3154468B2 (en) * | 1996-03-19 | 2001-04-09 | 日本電信電話株式会社 | Sound receiving method and device |
JP3483086B2 (en) * | 1996-03-22 | 2004-01-06 | 日本電信電話株式会社 | Audio teleconferencing equipment |
JP3332143B2 (en) * | 1997-06-23 | 2002-10-07 | 日本電信電話株式会社 | Sound pickup method and device |
JP2003270034A (en) * | 2002-03-15 | 2003-09-25 | Nippon Telegr & Teleph Corp <Ntt> | Sound information analyzing method, apparatus, program, and recording medium |
JP2005197896A (en) * | 2004-01-05 | 2005-07-21 | Yamaha Corp | Audio signal supply apparatus for speaker array |
-
2006
- 2006-10-30 JP JP2006294683A patent/JP4867579B2/en active Active
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USD865723S1 (en) | 2015-04-30 | 2019-11-05 | Shure Acquisition Holdings, Inc | Array microphone assembly |
USD940116S1 (en) | 2015-04-30 | 2022-01-04 | Shure Acquisition Holdings, Inc. | Array microphone assembly |
US11832053B2 (en) | 2015-04-30 | 2023-11-28 | Shure Acquisition Holdings, Inc. | Array microphone system and method of assembling the same |
US11678109B2 (en) | 2015-04-30 | 2023-06-13 | Shure Acquisition Holdings, Inc. | Offset cartridge microphones |
US11310592B2 (en) | 2015-04-30 | 2022-04-19 | Shure Acquisition Holdings, Inc. | Array microphone system and method of assembling the same |
US11477327B2 (en) | 2017-01-13 | 2022-10-18 | Shure Acquisition Holdings, Inc. | Post-mixing acoustic echo cancellation systems and methods |
US10367948B2 (en) | 2017-01-13 | 2019-07-30 | Shure Acquisition Holdings, Inc. | Post-mixing acoustic echo cancellation systems and methods |
US11800281B2 (en) | 2018-06-01 | 2023-10-24 | Shure Acquisition Holdings, Inc. | Pattern-forming microphone array |
US11770650B2 (en) | 2018-06-15 | 2023-09-26 | Shure Acquisition Holdings, Inc. | Endfire linear array microphone |
US11310596B2 (en) | 2018-09-20 | 2022-04-19 | Shure Acquisition Holdings, Inc. | Adjustable lobe shape for array microphones |
US11438691B2 (en) | 2019-03-21 | 2022-09-06 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality |
US11558693B2 (en) | 2019-03-21 | 2023-01-17 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality |
US11303981B2 (en) | 2019-03-21 | 2022-04-12 | Shure Acquisition Holdings, Inc. | Housings and associated design features for ceiling array microphones |
US11778368B2 (en) | 2019-03-21 | 2023-10-03 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality |
US11445294B2 (en) | 2019-05-23 | 2022-09-13 | Shure Acquisition Holdings, Inc. | Steerable speaker array, system, and method for the same |
US11800280B2 (en) | 2019-05-23 | 2023-10-24 | Shure Acquisition Holdings, Inc. | Steerable speaker array, system and method for the same |
US11302347B2 (en) | 2019-05-31 | 2022-04-12 | Shure Acquisition Holdings, Inc. | Low latency automixer integrated with voice and noise activity detection |
US11688418B2 (en) | 2019-05-31 | 2023-06-27 | Shure Acquisition Holdings, Inc. | Low latency automixer integrated with voice and noise activity detection |
US11750972B2 (en) | 2019-08-23 | 2023-09-05 | Shure Acquisition Holdings, Inc. | One-dimensional array microphone with improved directivity |
US11297426B2 (en) | 2019-08-23 | 2022-04-05 | Shure Acquisition Holdings, Inc. | One-dimensional array microphone with improved directivity |
US12028678B2 (en) | 2019-11-01 | 2024-07-02 | Shure Acquisition Holdings, Inc. | Proximity microphone |
US11552611B2 (en) | 2020-02-07 | 2023-01-10 | Shure Acquisition Holdings, Inc. | System and method for automatic adjustment of reference gain |
USD944776S1 (en) | 2020-05-05 | 2022-03-01 | Shure Acquisition Holdings, Inc. | Audio device |
US11706562B2 (en) | 2020-05-29 | 2023-07-18 | Shure Acquisition Holdings, Inc. | Transducer steering and configuration systems and methods using a local positioning system |
US11785380B2 (en) | 2021-01-28 | 2023-10-10 | Shure Acquisition Holdings, Inc. | Hybrid audio beamforming system |
Also Published As
Publication number | Publication date |
---|---|
JP2007151103A (en) | 2007-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4867579B2 (en) | Remote conference equipment | |
WO2007052726A1 (en) | Teleconference device | |
JP4929685B2 (en) | Remote conference equipment | |
EP3627860A1 (en) | Audio conferencing using a distributed array of smartphones | |
JP5003531B2 (en) | Audio conference system | |
JP4816221B2 (en) | Sound pickup device and audio conference device | |
JP5012387B2 (en) | Speech processing system | |
JP5878549B2 (en) | Apparatus and method for geometry-based spatial audio coding | |
JP5169986B2 (en) | Telephone device, echo canceller and echo cancellation program | |
US7190775B2 (en) | High quality audio conferencing with adaptive beamforming | |
JP4984683B2 (en) | Sound emission and collection device | |
WO2007058130A1 (en) | Teleconference device and sound emission/collection device | |
JP2003510924A (en) | Sound directing method and apparatus | |
KR20140097555A (en) | Apparatus and method for merging geometry-based spatial audio coding streams | |
JP5259622B2 (en) | Sound collection device, sound collection method, sound collection program, and integrated circuit | |
WO2006125870A1 (en) | Apparatus, system and method for acoustic signals | |
JP2008543143A (en) | Acoustic transducer assembly, system and method | |
JP2009141560A (en) | Sound signal processor, and sound signal processing method | |
US11749254B2 (en) | Sound signal processing method, sound signal processing device, and storage medium that stores sound signal processing program | |
JP2000295698A (en) | Virtual surround system | |
CN104735582A (en) | Sound signal processing method, equipment and device | |
JP2018006892A (en) | Audio signal processing device and audio signal processing method | |
JP2009152949A (en) | Multi-channel sound collection device | |
JP7447533B2 (en) | Sound signal processing method and sound signal processing device | |
CN113766394B (en) | Sound signal processing method, sound signal processing device, and sound signal processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090820 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110921 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111018 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4867579 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141125 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |