JP2004072354A - Audio teleconference system - Google Patents

Audio teleconference system Download PDF

Info

Publication number
JP2004072354A
JP2004072354A JP2002228059A JP2002228059A JP2004072354A JP 2004072354 A JP2004072354 A JP 2004072354A JP 2002228059 A JP2002228059 A JP 2002228059A JP 2002228059 A JP2002228059 A JP 2002228059A JP 2004072354 A JP2004072354 A JP 2004072354A
Authority
JP
Japan
Prior art keywords
audio
identifier
conference system
data
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002228059A
Other languages
Japanese (ja)
Inventor
Masaaki Yonezawa
米澤 正明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokogawa Electric Corp
Original Assignee
Yokogawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Electric Corp filed Critical Yokogawa Electric Corp
Priority to JP2002228059A priority Critical patent/JP2004072354A/en
Publication of JP2004072354A publication Critical patent/JP2004072354A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To realize an audio teleconference system enabling the receiving side to easily identify a speaker. <P>SOLUTION: The audio teleconference system for performing a conference with persons in a remote place by transmitting/receiving voice data through a network is provided with the network, a 1st remote conference device for adding an identifier to voice data to be transmitted through the network and transmitting the voice data and a 2nd remote conference device for receiving the voice data to which the identifier is added through the network and changing the position of a sound image of the voice data to be reproduced on the basis of the identifier. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、ネットワークを利用して音声データを送受信することにより遠隔地の者と会議を行う音声会議システムに関し、特に受信側において発言者を容易に識別することが可能な音声会議システムに関する。
【0002】
【従来の技術】
従来の音声会議システムは複数台の遠隔会議装置をネットワークで接続し、一の遠隔会議装置で収集した発言者の音声データをネットワーク経由で他の遠隔会議装置に送信し音声を再生させることにより遠隔地の者と会議を可能にするものである。
【0003】
図4はこのような従来の音声会議システムの一例を示す構成ブロック図である。図4において1,2,3及び4は音声を収集するマイクロフォンや音声を再生するスピーカ等を有しネットワークを介して音声データの送受信が可能な遠隔会議装置、100はインターネット、イントラネット、電話回線、若しくは、専用回線等の汎用のネットワークである。
【0004】
遠隔会議装置1,2,3及び遠隔会議装置4はそれぞれネットワーク100に接続される。
【0005】
また、図5は遠隔会議装置1〜4の具体例を示す構成ブロック図である。図5において5はネットワーク100を介して他の遠隔会議装置との間で通信(音声データの送受信等)を行う通信手段、6は受信した音声データをアナログ信号に変換する音声再生手段、7は音声再生手段6のアナログ出力信号を適宜増幅して音声として出力するスピーカ等の拡声手段、8はマイクロフォン等により音声を収集し通信手段5を制御して他の遠隔会議装置に音声データを送信させる音声収集手段である。
【0006】
通信手段5はネットワーク100(図示せず。)に接続されると共に出力が音声再生手段6に接続され、音声再生手段6の出力は拡声手段7に接続される。また、音声収集手段8の出力が通信手段5に接続される。
【0007】
ここで、図4及び図5に示す従来例の動作を図6を用いて説明する。図6は音声会議システムの動作を説明する説明図である。但し、音声の再生に関してのみ説明し、音声の収集及び送信に関しては説明は省略する。
【0008】
先ず第1に、遠隔会議装置単体では、図5中”SS01”に示すような音声データをネットワーク100を介して受信した通信手段5は受信した音声データを音声再生手段6に出力する。音声再生手段6は音声データをアナログ信号に変換して出力する。
【0009】
そして、拡声手段7は音声再生手段6の出力であるアナログ信号を適宜増幅し図5中”PS01”に示すように音声として会議を行っている者に対して出力する。
【0010】
一方、図4に示す4台の遠隔会議装置から構成される音声会議システムでは、遠隔会議装置1において収集された図6中”TK11”に示す発言者の音声は図6中”SS11”に示すような音声データとして遠隔会議装置4に送信される。
【0011】
同様に、遠隔会議装置2及び3において収集された図6中”TK12”及び”TK13”に示す発言者の音声は図6中”SS12”及び”SS13”に示すような音声データとして遠隔会議装置4に送信される。
【0012】
この時、遠隔会議装置4では受信した図6中”SS11”、”SS12”及び”SS13”に示すような音声データを再生して図6中”SP11”に示す拡声手段7から図6中”PS11”に示すような音声として出力し、図6中”LN11”に示す聴取者によって発言者の音声が知覚される。
【0013】
この結果、複数台の遠隔会議装置をネットワークにより相互に接続して、各遠隔会議装置で収集した音声を音声データとして送信し音声を再生させることにより遠隔地の者との会議が可能になる。
【0014】
【発明が解決しようとする課題】
しかし、図4に示す従来例では複数の発言者がいる場合には、発言者を識別するために発言者がその都度氏名を名乗ったり、聴取者が再生される音声の特徴を聞き分けて発言者を識別しなければならないと言った問題点があった。
【0015】
このため、発言者が氏名を名乗らない場合には、初見の相手や音声の特徴が類似する発言者を聴取者が識別することは極めて困難であると言った問題点があった。
従って本発明が解決しようとする課題は、受信側において発言者を容易に識別することが可能な音声会議システムを実現することにある。
【0016】
【課題を解決するための手段】
このような課題を達成するために、本発明のうち請求項1記載の発明は、
ネットワークを利用して音声データを送受信することにより遠隔地の者と会議を行う音声会議システムにおいて、
ネットワークと、前記ネットワーク経由で送信する音声データに識別子を付加して送信する第1の遠隔会議装置と、前記ネットワーク経由で前記識別子を付加された音声データを受信し再生される前記音声データの音像の位置を前記識別子に基づき変える第2の遠隔会議装置とを備えたことにより、発言者を容易に識別することが可能になる。
【0017】
請求項2記載の発明は、
請求項1記載の発明である音声会議システムにおいて、
前記第1の遠隔会議装置が、
前記ネットワークを介して他の遠隔会議装置との間で通信を行う通信手段と、マイクロフォンにより音声を収集し前記識別子を付加した後に前記通信手段を制御して他の遠隔会議装置にデータを送信させる音声収集手段とから構成されることにより、発言者を容易に識別することが可能になる。
【0018】
請求項3記載の発明は、
請求項1記載の発明である音声会議システムにおいて、
前記第2の遠隔会議装置が、
前記ネットワークを介して他の遠隔会議装置との間で通信を行う通信手段と、受信したデータから前記音声データを抽出してアナログ信号に変換する音声信号抽出手段と、受信したデータから前記識別子を抽出する音声識別子抽出手段と、前記アナログ信号の再生音量のバランスを制御する再生均衡制御手段と、前記識別子に基づき前記バランスを決定して前記再生均衡制御手段に設定する均衡比率設定手段と、前記再生均衡制御手段の制御により音声データの音像の位置を変えて再生する2つの拡声手段とから構成されることにより、発言者を容易に識別することが可能になる。
【0019】
請求項4記載の発明は、
請求項3記載の発明である音声会議システムにおいて、
前記拡声手段が、
複数であることにより、発言者を容易に識別することが可能になる。
【0020】
請求項5記載の発明は、
請求項3記載の発明である音声会議システムにおいて、
前記拡声手段が、
奥行き方向にずらして配置されたことにより、発言者を容易に識別することが可能になる。
【0021】
請求項6記載の発明は、
請求項3記載の発明である音声会議システムにおいて、
前記拡声手段が、
高さ方向にずらして配置されたことにより、発言者を容易に識別することが可能になる。
【0022】
請求項7記載の発明は、
請求項1乃至請求項3のいずれかの発明である音声会議システムにおいて、
前記識別子が、
予め定義された識別子であることにより、発言者を容易に識別することが可能になる。
【0023】
請求項8記載の発明は、
請求項1乃至請求項3のいずれかの発明である音声会議システムにおいて、
前記識別子が、
遠隔会議装置のIPアドレスであることにより、発言者を容易に識別することが可能になる。
【0024】
請求項9記載の発明は、
請求項1乃至請求項3のいずれかの発明である音声会議システムにおいて、
前記識別子が、
遠隔会議装置のMACアドレスであることにより、発言者を容易に識別することが可能になる。
【0025】
請求項10記載の発明は、
請求項1若しくは請求項2の発明である音声会議システムにおいて、
前記第2の遠隔会議装置が、
複数の前記マイクロフォンを具備し、複数の前記マイクロフォンが収集した音声データ毎に異なる識別子を付加して送信することにより、発言者を容易に識別することが可能になる。
【0026】
【発明の実施の形態】
以下本発明を図面を用いて詳細に説明する。図1は本発明に係る音声会議システムの一実施例を示す構成ブロック図である。
【0027】
図1において100は図4と同一符号を付してあり、9,10,11及び12は改良された遠隔会議装置である。遠隔会議装置9,10,11及び遠隔会議装置12はそれぞれネットワーク100に接続される。
【0028】
また、図2は遠隔会議装置9〜11の具体例を示す構成ブロック図である。図2において5は図5と同一符号を付してあり、13は受信したデータから音声データを抽出してアナログ信号に変換する音声信号抽出手段、14は音声信号抽出手段13のアナログ出力信号の再生音量のバランス(均衡)を制御する再生均衡制御手段、15は受信したデータから識別子を抽出する音声識別子抽出手段、16は当該識別子に基づき再生音量のバランス(均衡)を設定する均衡比率設定手段、17及び18は再生均衡制御手段14のアナログ出力信号を適宜増幅し音声として出力するスピーカ等の拡声手段、19はマイクロフォン等により音声を収集し識別子を付加した後に通信手段5を制御して他の遠隔会議装置にデータを送信させる音声収集手段である。
【0029】
通信手段5はネットワーク100(図示せず。)に接続されると共に出力が音声信号抽出手段13及び音声識別子抽出手段15に接続され、音声信号抽出手段13の出力は再生均衡制御手段14に接続される。
【0030】
音声識別子抽出手段15の出力は均衡比率設定手段16に接続され、均衡比率設定手段16の出力は再生均衡制御手段14の制御入力端子に接続される。
【0031】
また、再生均衡制御手段14の2つの出力はそれぞれ左右に配置された拡声手段17及び18に接続され、音声収集手段19の出力が通信手段5に接続される。
【0032】
ここで、図1及び図2に示す実施例の動作を図3を用いて説明する。図3は音声会議システムの動作を説明する説明図である。
【0033】
音声収集手段19はマイクロフォン等により発言者の音声を収集し識別子を付加した後に通信手段5を制御して他の遠隔会議装置にデータを送信させる音声収集手段である。
【0034】
例えば、遠隔会議装置9において収集された図3中”TK31”に示す発言者の音声には識別子”A”が付加され図3中”SS31”に示すようなデータとして遠隔会議装置13に送信される。
【0035】
例えば、同様に、遠隔会議装置10及び11において収集された図3中”TK32”及び”TK33”に示す発言者の音声にはそれぞれ識別子”B”及び”C”が付加され図3中”SS32”及び”SS33”に示すようなデータとして遠隔会議装置13に送信される。
【0036】
また、図2中”SS21”に示すようなデータ(音声データ+識別子)をネットワーク100を介して受信した通信手段5は受信したデータ(音声データ+識別子)を音声信号抽出手段13及び音声識別子抽出手段15に出力する。音声信号抽出手段13はデータ(音声データ+識別子)から音声データを抽出してアナログ信号に変換する。
【0037】
一方、音声識別子抽出手段15はデータ(音声データ+識別子)から識別子を抽出して出力し、均衡比率設定手段16は抽出された識別子に基づき再生される音声の音量を決定して再生均衡制御手段14を制御する。
【0038】
そして、右側に設置された拡声手段17及び左側に設置された拡声手段18は再生均衡制御手段14の出力である2つ(左右)のアナログ信号を図2中”PS21”及び”PS22”に示すように音声として会議を行っている者に対して出力する。
【0039】
例えば、識別子”A”、”B”及び”C”に対する再生音声の音量のバランスがそれぞれ”100:0”、”50:50”及び”0:100”と定義されていた場合を想定する。
【0040】
ここで、音量のバランスは”100:0”の場合には左側の拡声手段18から再生する音声の音量の”100%”が出力され、右側の拡声手段17から再生する音声の音量の”0%”が出力されることを示す。
【0041】
このため、識別子”A”が付加された図3中”TK31”に示す発言者の音声データは左側の拡声手段18から再生する音声の音量の”100%”が出力され、右側の拡声手段17から再生する音声の音量の”0%”が出力されるので、図3中”PS31”に示すように左側から聞こえるように、言い換えれば、左端に音像が定位するように再生される。
【0042】
同様に、識別子”B”が付加された図3中”TK32”に示す発言者の音声データは左側の拡声手段18から再生する音声の音量の”50%”が出力され、右側の拡声手段17から再生する音声の音量の”50%”が出力されるので、図3中”PS32”に示すように中央から聞こえるように、言い換えれば、中央に音像が定位するように再生される。
【0043】
さらに、識別子”C”が付加された図3中”TK33”に示す発言者の音声データは左側の拡声手段18から再生する音声の音量の”0%”が出力され、右側の拡声手段17から再生する音声の音量の”100%”が出力されるので、図3中”PS33”に示すように右端から聞こえるように、言い換えれば、右端に音像が定位するように再生される。
【0044】
すなわち、図3中”LN31”に示す聴取者は図3中”TK31”,”TK32”及び”TK33”に示す発言者の再生された音声が図3中”PS31”、”PS32”及び”PS33”に示すようにそれぞれ異なる方向から聞こえてくるので発言者を容易に識別することが可能になる。
【0045】
この結果、送信側が送信する音声データに識別子を付加して送信し、受信側が当該識別子に基づき再生される音声の聞こえてくる方向、言い換えれば、再生される音声データの音像の位置を識別子に基づき変えることにより、発言者を容易に識別することが可能になる。
【0046】
なお、図1及び図3に示す実施例では発言者が3人である場合を例示しているが、発言者の数が増えた場合には、発言者と同数の識別子を設け再生音声の音量バランスの比率を適宜変更して再生音声の音像の位置が互いに重ならないようにすれば良い。
【0047】
また、図1及び図3に示す実施例では2つの拡声手段17及び18を例示しているが、勿論2つに限定されるものではなく、必要に応じて複数の拡声手段を備えることにより、聴取者を中心に360度に再生音声の音像の位置を配置することも可能になる。
【0048】
また、図1及び図3に示す実施例では拡声手段を左右にずらして設置しているが、拡声手段の設置位置として奥行き方向や高さ方向にずらしても良く、さらに、複数の拡声手段を3次元方向にずらして配置して再生音声の音像の位置を増加させることにより、さらに、多数の発言者の識別をすることも可能になる。
【0049】
また、図1及び図3に示す実施例では遠隔会議装置が予め定義された識別子を付加しているが、遠隔会議装置のMAC(Media Access Control adress)アドレスやIP(Internet Protocol)アドレス等の一意の情報を識別子として用いても構わない。
【0050】
また、図1及び図3に示す実施例では発言者と遠隔会議装置が同数であったが、1つの遠隔会議装置に複数人の発言者があっても構わない。この場合には、各発言者毎に音声収集用のマイクロフォンを割り当て、マイクロフォン毎に識別子を付加すれば良い。
【0051】
【発明の効果】
以上説明したことから明らかなように、本発明によれば次のような効果がある。
請求項1,2,3,4,5,6,7,8,9及び請求項10の発明によれば、送信側が送信する音声データに識別子を付加して送信し、受信側が当該識別子に基づき再生される音声の聞こえてくる方向、言い換えれば、再生される音声データの音像の位置を識別子に基づき変えることにより、発言者を容易に識別することが可能になる。
【図面の簡単な説明】
【図1】本発明に係る音声会議システムの一実施例を示す構成ブロック図である。
【図2】遠隔会議装置の具体例を示す構成ブロック図である。
【図3】音声会議システムの動作を説明する説明図である。
【図4】従来の音声会議システムの一例を示す構成ブロック図である。
【図5】遠隔会議装置の具体例を示す構成ブロック図である。
【図6】音声会議システムの動作を説明する説明図である。
【符号の説明】
1,2,3,4,9,10,11,12 遠隔会議装置
5 通信手段
6 音声再生手段
7,17,18 拡声手段
8,19 音声収集手段
13 音声信号抽出手段
14 再生均衡制御手段
15 音声識別子抽出手段
16 均衡比率設定手段
100 ネットワーク
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a voice conference system for holding a conference with a remote person by transmitting and receiving voice data using a network, and more particularly to a voice conference system capable of easily identifying a speaker on a receiving side.
[0002]
[Prior art]
In a conventional audio conference system, a plurality of teleconference devices are connected via a network, and voice data of a speaker collected by one teleconference device is transmitted to another teleconference device via a network to reproduce a voice. It enables meetings with local people.
[0003]
FIG. 4 is a configuration block diagram showing an example of such a conventional audio conference system. In FIG. 4, reference numerals 1, 2, 3, and 4 denote teleconferencing devices having a microphone for collecting voice, a speaker for reproducing voice, and the like, and capable of transmitting and receiving voice data via a network. 100 denotes the Internet, an intranet, a telephone line, Alternatively, it is a general-purpose network such as a dedicated line.
[0004]
The remote conference devices 1, 2, 3, and the remote conference device 4 are connected to the network 100, respectively.
[0005]
FIG. 5 is a configuration block diagram showing a specific example of the remote conference devices 1 to 4. In FIG. 5, reference numeral 5 denotes communication means for performing communication (transmission / reception of voice data, etc.) with another teleconference device via the network 100; 6, voice reproduction means for converting received voice data into analog signals; A loudspeaker, such as a speaker, which amplifies the analog output signal of the audio reproducer 6 as appropriate and outputs it as audio. The loudspeaker 8 collects audio by a microphone or the like and controls the communication means 5 to transmit the audio data to another remote conference device. Sound collection means.
[0006]
The communication unit 5 is connected to a network 100 (not shown), and the output is connected to the audio reproducing unit 6. The output of the audio reproducing unit 6 is connected to the loudspeaker 7. The output of the voice collecting means 8 is connected to the communication means 5.
[0007]
Here, the operation of the conventional example shown in FIGS. 4 and 5 will be described with reference to FIG. FIG. 6 is an explanatory diagram illustrating the operation of the audio conference system. However, only the reproduction of the audio will be described, and the description of the collection and transmission of the audio will be omitted.
[0008]
First, in the teleconferencing device alone, the communication unit 5 that has received the voice data as indicated by “SS01” in FIG. 5 via the network 100 outputs the received voice data to the voice reproduction unit 6. The audio reproducing means 6 converts the audio data into an analog signal and outputs it.
[0009]
Then, the loudspeaker 7 amplifies the analog signal output from the audio reproducer 6 as appropriate, and outputs the analog signal to the person having the conference as audio as indicated by "PS01" in FIG.
[0010]
On the other hand, in the audio conference system including the four remote conference devices shown in FIG. 4, the voice of the speaker indicated by “TK11” in FIG. 6 collected by the remote conference device 1 is indicated by “SS11” in FIG. Such audio data is transmitted to the remote conference device 4.
[0011]
Similarly, the voices of the speakers indicated by “TK12” and “TK13” in FIG. 6 collected by the remote conference devices 2 and 3 are converted into voice data such as “SS12” and “SS13” in FIG. 4 is sent.
[0012]
At this time, the remote conference device 4 reproduces the received audio data such as “SS11”, “SS12” and “SS13” in FIG. 6 and transmits the voice data from the loudspeaker 7 shown in “SP11” in FIG. PS11 "is output as a voice as shown in FIG.
[0013]
As a result, a plurality of teleconferencing devices can be connected to each other via a network, and the voice collected by each teleconferencing device can be transmitted as voice data to reproduce the voice, thereby enabling a conference with a remote person.
[0014]
[Problems to be solved by the invention]
However, in the conventional example shown in FIG. 4, when there are a plurality of speakers, the speakers give their names each time to identify the speakers, or the listener distinguishes the characteristics of the sound to be reproduced, and Had to be identified.
[0015]
For this reason, when the speaker does not give his name, there is a problem that it is extremely difficult for the listener to identify the first-time partner or the speaker whose voice characteristics are similar.
Therefore, an object of the present invention is to realize a voice conference system that can easily identify a speaker on a receiving side.
[0016]
[Means for Solving the Problems]
In order to achieve such an object, the invention according to claim 1 of the present invention is:
In a voice conference system that performs a conference with a remote person by transmitting and receiving voice data using a network,
A network, a first teleconference device for adding an identifier to audio data transmitted via the network and transmitting the audio data, and a sound image of the audio data to be received and reproduced via the network And the second teleconferencing device that changes the position of the speaker based on the identifier, the speaker can be easily identified.
[0017]
The invention according to claim 2 is
In the audio conference system according to the first aspect,
The first teleconferencing device comprises:
Communication means for communicating with another teleconference device via the network, and after collecting voice by a microphone and adding the identifier, controlling the communication means to transmit data to the other teleconference device With the configuration including the voice collecting means, the speaker can be easily identified.
[0018]
The invention according to claim 3 is
In the audio conference system according to the first aspect,
The second teleconferencing device comprises:
Communication means for communicating with another teleconference device via the network, audio signal extraction means for extracting the audio data from received data and converting it to an analog signal, and identifying the identifier from the received data Audio identifier extraction means to be extracted, reproduction balance control means for controlling the balance of the reproduction volume of the analog signal, balance ratio setting means for determining the balance based on the identifier and setting the reproduction balance control means, By comprising two loudspeakers for changing the position of the sound image of the audio data and reproducing it under the control of the reproduction balance controller, the speaker can be easily identified.
[0019]
The invention according to claim 4 is
The audio conference system according to claim 3,
The loudspeaker means,
With a plurality of speakers, the speaker can be easily identified.
[0020]
The invention according to claim 5 is
The audio conference system according to claim 3,
The loudspeaker means,
By being displaced in the depth direction, the speaker can be easily identified.
[0021]
The invention according to claim 6 is
The audio conference system according to claim 3,
The loudspeaker means,
By being shifted in the height direction, the speaker can be easily identified.
[0022]
The invention according to claim 7 is
In the audio conference system according to any one of claims 1 to 3,
The identifier is
By using a predefined identifier, the speaker can be easily identified.
[0023]
The invention according to claim 8 is
In the audio conference system according to any one of claims 1 to 3,
The identifier is
With the IP address of the remote conference device, the speaker can be easily identified.
[0024]
The invention according to claim 9 is
In the audio conference system according to any one of claims 1 to 3,
The identifier is
By using the MAC address of the remote conference device, the speaker can be easily identified.
[0025]
The invention according to claim 10 is
In the audio conference system according to claim 1 or 2,
The second teleconferencing device comprises:
By providing a plurality of the microphones and adding a different identifier to each of the voice data collected by the plurality of the microphones and transmitting the same, the speaker can be easily identified.
[0026]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, the present invention will be described in detail with reference to the drawings. FIG. 1 is a configuration block diagram showing one embodiment of a voice conference system according to the present invention.
[0027]
In FIG. 1, reference numeral 100 denotes the same reference numeral as in FIG. 4, and 9, 10, 11, and 12 denote improved teleconference devices. The remote conference devices 9, 10, 11 and the remote conference device 12 are connected to the network 100, respectively.
[0028]
FIG. 2 is a configuration block diagram showing a specific example of the remote conference devices 9 to 11. 2, reference numeral 5 denotes the same reference numeral as in FIG. 5, reference numeral 13 denotes an audio signal extracting means for extracting audio data from the received data and converting it into an analog signal, and reference numeral 14 denotes an analog output signal of the audio signal extracting means 13. Reproduction balance control means for controlling the reproduction volume balance (balance), 15 is a voice identifier extraction means for extracting an identifier from received data, and 16 is a balance ratio setting means for setting the reproduction volume balance (balance) based on the identifier. , 17 and 18 are loudspeaker means such as speakers for appropriately amplifying the analog output signal of the reproduction balance control means 14 and outputting it as sound, and 19 controls the communication means 5 after collecting the sound by a microphone or the like and adding an identifier thereto. Is a voice collecting means for transmitting data to the remote conference device.
[0029]
The communication unit 5 is connected to a network 100 (not shown), and the output is connected to the audio signal extraction unit 13 and the audio identifier extraction unit 15. The output of the audio signal extraction unit 13 is connected to the reproduction balance control unit 14. You.
[0030]
The output of the voice identifier extracting means 15 is connected to the balance ratio setting means 16, and the output of the balance ratio setting means 16 is connected to the control input terminal of the reproduction balance control means 14.
[0031]
Further, two outputs of the reproduction balance control means 14 are connected to loudspeakers 17 and 18 arranged on the left and right, respectively, and an output of the sound collection means 19 is connected to the communication means 5.
[0032]
Here, the operation of the embodiment shown in FIGS. 1 and 2 will be described with reference to FIG. FIG. 3 is an explanatory diagram illustrating the operation of the audio conference system.
[0033]
The voice collecting means 19 is a voice collecting means for collecting the voice of the speaker using a microphone or the like, adding an identifier, and then controlling the communication means 5 to transmit data to another remote conference device.
[0034]
For example, an identifier “A” is added to the voice of the speaker indicated by “TK31” in FIG. 3 collected by the remote conference device 9 and transmitted to the remote conference device 13 as data such as “SS31” in FIG. You.
[0035]
For example, similarly, identifiers “B” and “C” are added to the voices of the speakers indicated by “TK32” and “TK33” in FIG. 3 collected by the remote conference devices 10 and 11, respectively, and “SS32” in FIG. "And" SS33 "are transmitted to the remote conference apparatus 13.
[0036]
In addition, the communication unit 5 that has received the data (audio data + identifier) as indicated by “SS21” in FIG. 2 via the network 100 transmits the received data (audio data + identifier) to the audio signal extraction unit 13 and the audio identifier extraction. Output to the means 15. The audio signal extracting means 13 extracts audio data from the data (audio data + identifier) and converts it into an analog signal.
[0037]
On the other hand, the voice identifier extracting means 15 extracts and outputs an identifier from the data (voice data + identifier), and the equilibrium ratio setting means 16 determines the volume of the voice to be reproduced based on the extracted identifier and reproduces the balance control means. 14 is controlled.
[0038]
The loudspeaker 17 installed on the right side and the loudspeaker 18 installed on the left side show two (left and right) analog signals output from the reproduction balance control means 14 as "PS21" and "PS22" in FIG. As described above, it is output to the person who is conducting the meeting.
[0039]
For example, it is assumed that the balance of the volume of the reproduced sound with respect to the identifiers “A”, “B”, and “C” is defined as “100: 0”, “50:50”, and “0: 100”, respectively.
[0040]
Here, when the volume balance is “100: 0”, “100%” of the volume of the sound reproduced from the left loudspeaker 18 is output, and “0” of the volume of the sound reproduced from the right loudspeaker 17 is output. % "Is output.
[0041]
Therefore, the voice data of the speaker indicated by “TK31” in FIG. 3 to which the identifier “A” is added is output as “100%” of the volume of the reproduced voice from the left loudspeaker 18, and is output to the right loudspeaker 17. Since "0%" of the volume of the sound to be reproduced is output, the sound is reproduced so that it can be heard from the left side as shown by "PS31" in FIG. 3, in other words, the sound image is localized at the left end.
[0042]
Similarly, the voice data of the speaker indicated by “TK32” in FIG. 3 to which the identifier “B” is added is output as “50%” of the volume of the reproduced voice from the left loudspeaker 18 and is output to the right loudspeaker 17. Since "50%" of the volume of the sound to be reproduced is output, the sound is reproduced so as to be heard from the center as indicated by "PS32" in FIG. 3, in other words, so that the sound image is localized at the center.
[0043]
Further, as for the voice data of the speaker indicated by “TK33” in FIG. 3 to which the identifier “C” is added, “0%” of the volume of the voice to be reproduced is output from the left loudspeaker 18 and from the right loudspeaker 17 is output. Since "100%" of the volume of the sound to be reproduced is output, the sound is reproduced so as to be heard from the right end as shown by "PS33" in FIG. 3, in other words, so that the sound image is localized at the right end.
[0044]
That is, the listeners indicated by "LN31" in FIG. 3 can reproduce the voices of the speakers indicated by "TK31", "TK32" and "TK33" in FIG. 3 as "PS31", "PS32" and "PS33" in FIG. "", The speakers are heard from different directions, so that the speaker can be easily identified.
[0045]
As a result, the transmitting side transmits the sound data with the identifier added thereto, and the receiving side determines the direction in which the sound reproduced based on the identifier is heard, in other words, the position of the sound image of the reproduced sound data based on the identifier. By changing, the speaker can be easily identified.
[0046]
In the embodiment shown in FIGS. 1 and 3, the case where the number of speakers is three is exemplified. However, when the number of speakers increases, the same number of identifiers as the speakers are provided and The balance ratio may be appropriately changed so that the positions of the sound images of the reproduced sound do not overlap each other.
[0047]
Further, in the embodiment shown in FIGS. 1 and 3, two loudspeakers 17 and 18 are illustrated, but the present invention is not limited to the two loudspeakers, and by providing a plurality of loudspeakers as necessary, It is also possible to arrange the position of the sound image of the reproduced sound at 360 degrees around the listener.
[0048]
In the embodiment shown in FIGS. 1 and 3, the loudspeakers are shifted left and right. However, the loudspeakers may be shifted in the depth direction or the height direction as the installation positions of the loudspeakers. By increasing the position of the sound image of the reproduced sound by displacing it in the three-dimensional direction, it is possible to further identify a large number of speakers.
[0049]
Also, in the embodiment shown in FIGS. 1 and 3, the teleconferencing device adds a predefined identifier, but a unique identifier such as a MAC (Media Access Control address) address or an IP (Internet Protocol) address of the teleconferencing device. May be used as the identifier.
[0050]
Also, in the embodiment shown in FIGS. 1 and 3, the number of speakers and the number of remote conference devices are the same, but a single remote conference device may have a plurality of speakers. In this case, a microphone for voice collection may be assigned to each speaker, and an identifier may be added to each microphone.
[0051]
【The invention's effect】
As is apparent from the above description, the present invention has the following effects.
According to the first, second, third, fourth, fifth, sixth, seventh, eighth and ninth aspects of the present invention, an identifier is added to audio data transmitted by a transmitting side and transmitted, and a receiving side is configured based on the identifier. By changing the direction in which the reproduced sound is heard, in other words, the position of the sound image of the reproduced sound data based on the identifier, the speaker can be easily identified.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an embodiment of a voice conference system according to the present invention.
FIG. 2 is a configuration block diagram illustrating a specific example of a remote conference device.
FIG. 3 is an explanatory diagram illustrating an operation of the audio conference system.
FIG. 4 is a configuration block diagram illustrating an example of a conventional audio conference system.
FIG. 5 is a configuration block diagram showing a specific example of a remote conference device.
FIG. 6 is an explanatory diagram illustrating the operation of the audio conference system.
[Explanation of symbols]
1,2,3,4,9,10,11,12 Teleconference device 5 Communication means 6 Sound reproduction means 7,17,18 Loudspeaking means 8,19 Sound collection means 13 Sound signal extraction means 14 Reproduction balance control means 15 Sound Identifier extracting means 16 balance ratio setting means 100 network

Claims (10)

ネットワークを利用して音声データを送受信することにより遠隔地の者と会議を行う音声会議システムにおいて、
ネットワークと、
前記ネットワーク経由で送信する音声データに識別子を付加して送信する第1の遠隔会議装置と、
前記ネットワーク経由で前記識別子を付加された音声データを受信し再生される前記音声データの音像の位置を前記識別子に基づき変える第2の遠隔会議装置とを備えたことを特徴とする音声会議システム。
In a voice conference system that performs a conference with a remote person by transmitting and receiving voice data using a network,
Network and
A first teleconferencing device that adds an identifier to audio data transmitted via the network and transmits the data;
A voice conference system comprising: a second teleconferencing device that receives voice data to which the identifier is added via the network and changes a position of a sound image of the voice data to be reproduced based on the identifier.
前記第1の遠隔会議装置が、
前記ネットワークを介して他の遠隔会議装置との間で通信を行う通信手段と、
マイクロフォンにより音声を収集し前記識別子を付加した後に前記通信手段を制御して他の遠隔会議装置にデータを送信させる音声収集手段とから構成されることを特徴とする
請求項1記載の音声会議システム。
The first teleconferencing device comprises:
Communication means for communicating with another teleconference device via the network,
2. The audio conference system according to claim 1, further comprising: audio collection means for collecting audio by a microphone, adding said identifier, and controlling said communication means to transmit data to another remote conference apparatus. .
前記第2の遠隔会議装置が、
前記ネットワークを介して他の遠隔会議装置との間で通信を行う通信手段と、
受信したデータから前記音声データを抽出してアナログ信号に変換する音声信号抽出手段と、
受信したデータから前記識別子を抽出する音声識別子抽出手段と、
前記アナログ信号の再生音量のバランスを制御する再生均衡制御手段と、
前記識別子に基づき前記バランスを決定して前記再生均衡制御手段に設定する均衡比率設定手段と、
前記再生均衡制御手段の制御により音声データの音像の位置を変えて再生する2つの拡声手段とから構成されることを特徴とする
請求項1記載の音声会議システム。
The second teleconferencing device comprises:
Communication means for communicating with another teleconference device via the network,
Audio signal extraction means for extracting the audio data from the received data and converting it to an analog signal,
Voice identifier extracting means for extracting the identifier from the received data,
Playback balance control means for controlling the balance of the playback volume of the analog signal,
A balance ratio setting means for determining the balance based on the identifier and setting the reproduction balance control means;
2. The audio conference system according to claim 1, further comprising two loudspeakers for changing the position of the sound image of the audio data for reproduction under the control of the reproduction balance controller.
前記拡声手段が、
複数であることを特徴とする
請求項3記載の音声会議システム。
The loudspeaker means,
4. The audio conference system according to claim 3, wherein there are a plurality of audio conference systems.
前記拡声手段が、
奥行き方向にずらして配置されたことを特徴とする
請求項3記載の音声会議システム。
The loudspeaker means,
4. The audio conference system according to claim 3, wherein the audio conference system is arranged so as to be shifted in a depth direction.
前記拡声手段が、
高さ方向にずらして配置されたことを特徴とする
請求項3記載の音声会議システム。
The loudspeaker means,
4. The audio conference system according to claim 3, wherein the audio conference system is arranged so as to be shifted in a height direction.
前記識別子が、
予め定義された識別子であることを特徴とする
請求項1乃至請求項3のいずれかに記載の音声会議システム。
The identifier is
4. The audio conference system according to claim 1, wherein the identifier is a predefined identifier.
前記識別子が、
遠隔会議装置のIPアドレスであることを特徴とする
請求項1乃至請求項3のいずれかに記載の音声会議システム。
The identifier is
The audio conference system according to claim 1, wherein the audio conference system is an IP address of a remote conference device.
前記識別子が、
遠隔会議装置のMACアドレスであることを特徴とする
請求項1乃至請求項3のいずれかに記載の音声会議システム。
The identifier is
4. The audio conference system according to claim 1, wherein the audio conference system is a MAC address of the remote conference device.
前記第2の遠隔会議装置が、
複数の前記マイクロフォンを具備し、複数の前記マイクロフォンが収集した音声データ毎に異なる識別子を付加して送信することを特徴とする
請求項1若しくは請求項2記載の音声会議システム。
The second teleconferencing device comprises:
The audio conference system according to claim 1, further comprising a plurality of microphones, wherein a different identifier is added to each audio data collected by the plurality of microphones and transmitted.
JP2002228059A 2002-08-06 2002-08-06 Audio teleconference system Pending JP2004072354A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002228059A JP2004072354A (en) 2002-08-06 2002-08-06 Audio teleconference system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002228059A JP2004072354A (en) 2002-08-06 2002-08-06 Audio teleconference system

Publications (1)

Publication Number Publication Date
JP2004072354A true JP2004072354A (en) 2004-03-04

Family

ID=32014843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002228059A Pending JP2004072354A (en) 2002-08-06 2002-08-06 Audio teleconference system

Country Status (1)

Country Link
JP (1) JP2004072354A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006080133A1 (en) * 2005-01-25 2006-08-03 Matsushita Electric Industrial Co., Ltd. Audio dialogue device
JP2007267134A (en) * 2006-03-29 2007-10-11 Audio Technica Corp Voice conference apparatus
JP2009023486A (en) * 2007-07-19 2009-02-05 Xanavi Informatics Corp On-vehicle voice processing device, voice processing system, and voice processing method
JP2009261010A (en) * 2009-08-04 2009-11-05 Panasonic Corp Speech dialogue device
KR20180133195A (en) * 2017-06-05 2018-12-13 이상호 Apparatus and method for share voice transmitting using smart phone
US11914922B2 (en) 2020-10-06 2024-02-27 Tencent America LLC Audio mixing for teleconferencing

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006080133A1 (en) * 2005-01-25 2006-08-03 Matsushita Electric Industrial Co., Ltd. Audio dialogue device
US8014884B2 (en) 2005-01-25 2011-09-06 Panasonic Corporation Audio conversation apparatus
US8712564B2 (en) 2005-01-25 2014-04-29 Panasonic Corporation Audio conversation apparatus
JP2007267134A (en) * 2006-03-29 2007-10-11 Audio Technica Corp Voice conference apparatus
JP4522964B2 (en) * 2006-03-29 2010-08-11 株式会社オーディオテクニカ Audio conferencing equipment
JP2009023486A (en) * 2007-07-19 2009-02-05 Xanavi Informatics Corp On-vehicle voice processing device, voice processing system, and voice processing method
JP2009261010A (en) * 2009-08-04 2009-11-05 Panasonic Corp Speech dialogue device
JP4700126B2 (en) * 2009-08-04 2011-06-15 パナソニック株式会社 Spoken dialogue device
KR20180133195A (en) * 2017-06-05 2018-12-13 이상호 Apparatus and method for share voice transmitting using smart phone
KR101973158B1 (en) * 2017-06-05 2019-04-26 이상호 Apparatus and method for share voice transmitting using smart phone
US11914922B2 (en) 2020-10-06 2024-02-27 Tencent America LLC Audio mixing for teleconferencing

Similar Documents

Publication Publication Date Title
US9049339B2 (en) Method for operating a conference system and device for a conference system
US20050281421A1 (en) First person acoustic environment system and method
EP1902597B1 (en) A spatial audio processing method, a program product, an electronic device and a system
US11782674B2 (en) Centrally controlling communication at a venue
JP2004072354A (en) Audio teleconference system
JP2006279492A (en) Interactive teleconference system
JP4804014B2 (en) Audio conferencing equipment
EP2207311A1 (en) Voice communication device
CN110891216A (en) Earphone device
US10206031B2 (en) Switching to a second audio interface between a computer apparatus and an audio apparatus
JP3898673B2 (en) Audio communication system, method and program, and audio reproduction apparatus
JPH10215331A (en) Voice conference system and its information terminal equipment
CN110856068B (en) Communication method of earphone device
JP6392161B2 (en) Audio conference system, audio conference apparatus, method and program thereof
JP4052147B2 (en) Internet telephone device, internet telephone system, and program for internet telephone device
JPH06175942A (en) Multimedia electronic conference device
JP3516897B2 (en) Communication device
JP2023107364A (en) Communication device and communication method
JP2007306597A (en) Voice communication equipment, voice communication system and program for voice communication equipment
TWI255638B (en) Audio source system under networking environment
KR20020078679A (en) Multi-Communication Apparatus Using A Network
JP2005094569A (en) Ip call center system, instrument, and program
JPH11215240A (en) Telephone conference system
JPS6038065B2 (en) conference phone equipment
JP2019066601A (en) Acoustic processing device, program and method