JPH0888692A - 送信装置、受信装置及び送受信装置 - Google Patents

送信装置、受信装置及び送受信装置

Info

Publication number
JPH0888692A
JPH0888692A JP6223174A JP22317494A JPH0888692A JP H0888692 A JPH0888692 A JP H0888692A JP 6223174 A JP6223174 A JP 6223174A JP 22317494 A JP22317494 A JP 22317494A JP H0888692 A JPH0888692 A JP H0888692A
Authority
JP
Japan
Prior art keywords
speaker
data
signal
voice
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6223174A
Other languages
English (en)
Inventor
Akihiro Fujii
明宏 藤井
Shigeru Fukunaga
茂 福永
Toshihisa Nakai
敏久 中井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP6223174A priority Critical patent/JPH0888692A/ja
Publication of JPH0888692A publication Critical patent/JPH0888692A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

(57)【要約】 【目的】 多人数による音声通信会議、TV会議におい
て、対象とする発言者の音声を明確に聴取し得る。 【構成】 発言者データ作成部3は入力音声信号S1か
ら有音、無音の判別を行い、発言者の識別を行い発言者
データS3を出力し、マルチメディア多重化して多重化
データS6を伝送路5に出力する。マルチメディア分離
部6は伝送路5から受信すると多重分離し、発言者デー
タS9を発言者表示部8と音量調節部7とに与える。音
量調節部7はユーザ入力端子T3からの個別音量制御信
号S13によって必要な発言者の音声を制御する。発言
者表示部8は発言者の表示を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は送信装置、受信装置及
び送受信装置に関し、例えば、音声通信会議システム
や、テレビ会議システムなどに適用し得るものである。
【0002】
【従来の技術】近年、地域的に隔てられた者どうしでの
コミュニケーション手段として、テレビ電話(TV電
話)や、テレビ会議(TV会議)が使われるよになって
きた。例えば、近年の日本電信電話株式会社によるIS
DNの開始、CCITT(国際電信電話諮問委員会)に
よるTV電話、TV会議の国際標準の勧告化やTTC
(電信電話技術委員会)での国内標準化を背景に199
0年代に入ってからTV会議の用途が急速に拡大してき
た。
【0003】一般にTV会議は複数の人が参加できるこ
とに特徴がある。この場合画像は例えばその場所にいる
参加者全員の姿が収まった画像を圧縮符号化し、音声は
複数の音声を混合合成して一つにまとめ、それぞれを多
重化してISDN回線などを通じて送信する方法があ
る。
【0004】このような方法を使用すると複数(特に3
人以上)が参加するTV会議であっても、1対1のTV
電話と同じ程度の通信量で済む。
【0005】図2はTV会議システムの音声部分の処理
過程を示す構成図である。これは図3の会議室内のTV
会議端末どうしで行う場合の説明図のように場所前に1
箇所の会議室に参加者が集まり、TV会議端末を用いて
通信を行うようなTV会議の場合である。
【0006】図2の送信部101において、音声入力端
子T1(1)〜(n)から入力された参加者別の複数の
音声信号S1(1)〜S1(n)は、混合合成部2で混
合され、一つにまとめられて混合音声データS2として
出力される。この混合音声データS2は符号化画像デー
タS4やファクシミリデータやテキストデータなどその
他のデータS5と共に、マルチメディア多重化部4へ与
えられ、多重化される。
【0007】マルチメディア多重化部4は多重化データ
をISDNなどの伝送路5へ出力し、相手のTV会議端
末に伝送させる。
【0008】一方、図2において受信部102は、相手
のTV会議端末から伝送路5を通じて多重化データS7
を与えられる。マルチメディア分離部6は多重化データ
S7から混合音声データS8、符号化画像データS1
0、その他のデータS11に分離する。上記混合音声デ
ータS8は音声出力端子T2からスピーカなどに出力さ
れるものであった。
【0009】
【発明が解決しようとする課題】しかしながら、上述の
ような従来の技術では混合合成された音声が誰の音声で
あるかが分からないため、受信側では聞く相手の音量を
個別に小さくしたり、大きくしたりすることができない
という問題があった。
【0010】例えば、相手のTV会議端末側にいる人の
中で一番重要な人(例えば、Aさんとする。)だけの音
声は聞く必要があるが、他の人の音声は必要がないの
で、Aさん以外の音声は極力にスピーカ出力しないよう
にしたい場合があった。
【0011】このような場合には、従来相手の音量を個
別に変えることができないために、これを実現すること
ができなかった。また、スピーカから出力されるAさん
の音声が他の人に比べて小さいため、Aさんの音量を大
きくしたいと思っても、簡単にできなかった。
【0012】また、同じく混合合成された音声が誰の音
声であるかが分からないため、受信側で現在の発言者を
表示することができないという問題もあった。つまり、
通常の会議室で行う会議の場合は音の方向や相手の口な
どの動きなどを見ることなどで発言者が分かるが、TV
会議ではそれらが把握しにくいため、似た声の場合や初
めて聞く人の声の場合などで、誰が発言しているのか分
からない場合があった。
【0013】以上のようなことから、多人数による音声
通信会議、TV会議において、対象とする発言者の音響
を明確に聴取し得るように制御する送信装置、受信装置
及び送受信装置の提供が要請されている。
【0014】
【課題を解決するための手段】そこで、この発明の送信
装置は、以下のような構成で上述の課題を解決するもの
である。
【0015】つまり、複数の音響信号を混合して混合音
響信号を出力する混合手段と、上記混合手段に与えられ
ている音響信号から発言者を識別し、発言者識別信号を
出力する発言者識別手段と、上記混合音響信号と上記発
言者識別信号とを送信する送信手段とを備えるものであ
る。
【0016】また、この発明の受信装置は、以下のよう
な構成で上述の課題を解決するものである。
【0017】つまり、混合音響信号と発言者識別信号と
を受信する受信手段と、上記混合音響信号の音量又は音
質を制御するめの音響制御信号と、上記発言者識別信号
とから受信混合音響信号の音量又は音質を制御する音響
制御手段とを備えるものである。
【0018】
【作用】この発明の送信装置によれば、混合音響信号が
いずれの発言者のものであるかを識別し、発言者識別信
号として混合音響信号と共に送信するものである。一
方、受信装置は発言者の音響を強調したり、音質をクリ
アにしたりするための音響制御信号によって、受信した
混合音響信号の内、発言者の音響の強調や音質の制御を
行うものである。
【0019】このような構成によって、多人数で音声通
信を行う場合に発言者の音響を明確に聴取することがで
きる。
【0020】
【実施例】次にこの発明の好適な実施例を図面を用いて
説明する。尚、以下の実施例においては、場所前に1箇
所の会議室に参加者が集まり、TV会議端末を用いて通
信を行う場合の例を説明する。
【0021】『第1実施例』: 図1は第1実施例の
TV会議端末の機能構成図である。この図1においてT
V会議端末は送信部1と受信部9とから構成されてい
る。送信部1は混合合成部2と、発言者データ作成部3
と、マルチメディア多重化部4とから構成されている。
更に、送信部1には音声入力端子T1(1)〜T1
(n)が備えられている。受信部9は音声調節部7と、
発言者表示部8と、マルチメディア分離部6とから構成
されている。更に、受信部9には音声出力端子T2とユ
ーザ入力端子T3が備えられている。
【0022】(送信部1): 音声入力端子T1
(1)〜T1(n)には、参加者別の複数の音声信号S
1(1)〜S2(n)が印加され、これらの音声信号は
混合合成部2と発言者データ作成部3とに供給される。
混合合成部2は入力音声信号S1(1)〜S1(n)の
振幅を足し合わせて一つの混合音声データS2を生成
し、マルチメディア多重化部4に与える。
【0023】ここで例えば、時刻tに混合合成部2に与
えられた複数の音声信号S1(1)〜S1(n)の振幅
値をS1(1)(t)〜S1(n)(t)とし、混合合
成部2から出力される音声信号の振幅値をS2(t)と
すると、この混合合成部2の処理は次の式(1)で表す
ことができる。
【0024】
【数1】 更に、混合合成部2はオーバフロー防止など必要によっ
てはS2(t)にリミッタをかけて値の上下を制限して
出力するものである。
【0025】一方、発言者データ作成部3は複数の入力
音声信号S1(1)〜S1(n)から有音か、無音かを
判別し、いずれの音声入力端子からの音声信号が有音で
あるかを示した『発言者データS3』を生成し、マルチ
メディア多重化部4に与える。『この有音、無音の判別
は常時行う必要はなく、発言者データのデータ量を減ら
すためなどの理由で、ある一定時間間隔で周期的に行っ
ても良い』。
【0026】このようにして得た『発言者データS3』
と、上述の混合音声データS2とは符号化画像データS
4や、ファクシミリデータ、テキストデータなどのその
他のデータS5と共に、マルチメディア多重化部4に与
えられる。マルチメディア多重化部4はこれらの入力デ
ータを多重化し多重化データS6を伝送路5へ出力し、
相手のTV会議端末に伝送させる。
【0027】(発言者データ作成部3): 図4は発
言者データ作成部3の機能構成図である。この図4にお
いて発言者データ作成部3は、発言者判別部301
(1)〜301(n)と、発言者テーブル作成部302
とから構成されている。発言者判別部301(1)〜3
01(n)は入力音声信号S1(1)〜S1(n)から
有音、無音の判別を行い、この判別から発言者を識別を
行うものである。
【0028】この発言者の識別の具体的な構成例を次に
示す。 (1)時刻tの音声信号S1(i)(i=1〜n)の振
幅値をS1(i)(t)とする。このS1(i)(t)
がある閾値A0より小さい場合、発言者判別部301は
無音シグナルを出力し、それ以外は有音シグナルを出力
する。『この(1)の構成は、発言者の判別を常に行う
ものである』。
【0029】(2)ある一定時間中(この時間をTとす
る。)に音声信号S1(i)の振幅値がA1よりも小さ
い場合が、ある閾値N1回以上であった場合、発言者判
別部301は無音シグナルを出力し、それ以外は有音シ
グナルを出力する。『この(2)の構成は、発言者の判
別を周期的(T)に行うものである』。
【0030】(3)ある一定時間中(T)の音声信号S
1(i)の振幅値の平均値が、ある閾値A2よりも小さ
い場合、発言者判別部301は無音シグナルを出力し、
それ以外は有音シグナルを出力する。『この(3)の構
成も、上述の(2)の構成と同様に、発言者の判別を周
期的(T)に行うものである』。
【0031】発言者判別部301(1)〜301(n)
から出力された発言者シグナルS20(1)〜S20
(n)は発言者テーブル作成部302に与えられる。こ
の発言者テーブル作成部302は、図5に示す入力音声
に対する発言者テーブルを作成する。この図5の例では
音声入力の数nが6の場合を示すものである。発言者テ
ーブルは2進数5ビットとし、LSD(最下位の桁)が
S1(1)の発言者を示し、MSD(最上位の桁)がS
1(5)の発言者を示すものである。また、それぞれの
桁が1の場合は有音であり、0の場合は無音である。
【0032】図5(a)は000010(LSD)でS
1(2)が有音の場合を示す。図5(b)は01001
0(LSD)でS1(2)とS1(5)とが有音の場合
を示す。図5(c)は000000(LSD)で全て無
音の場合を示す。
【0033】(受信部9): 図1において受信部9
のマルチメディア分離部6は伝送路5を通じて多重化デ
ータS7を受信すると多重分離し、混合音声データS8
と、発言者データS9と、符号化画像データS10及び
その他のデータS11に分離し、混合音声データS8と
発言者データS9は音量調節部7に与える。
【0034】この音量調節部8にはユーザ入力端子T3
からの、ユーザより相手の音量を個別に制御するための
個別音量制御信号S13も与えられる。この音量調節部
8はこの個別音量制御信号S13に基づき混合音声デー
タS8の音量を調節し、音声信号S12を音声出力端子
T2に出力する。この音声信号S12はスピーカなどへ
出力される。
【0035】また、発言者データS9は発言者表示部8
に与えられ、ここで現在誰が発言しているか(有音か)
を受信者に認識し得るように表示するものである。
【0036】(音量調節部7): 図6は実施例の音
量調節部7の機能構成図である。この図6において、音
量調節部7は乗算部502と、音量算出部501とから
構成されている。音量算出部501は音量を個別に制御
する個別音量制御信号S13と発言者データS9に基づ
き混合音声データS8に掛け合わせる重み係数S30を
算出し出力する。
【0037】乗算部502は次の式(2)に示すような
混合音声データS8の振幅値S8(t)と重み係数S3
0の値wとの乗算を行い、音声信号S12の振幅値S1
2(t)を出力する。
【0038】
【数2】 S12(t)=w×S8(t) …(2) 続いて、音量算出部501の機能について上述の図5を
用いて詳細に説明する。例えば、相手の音声入力数が6
の場合、それぞれの音声に対する個別音量制御信号S1
3内部の値をC(1)、C(2)、…、C(6)とす
る。
【0039】このときに、発言者データS9が図5
(a)のように有音が一つなら、それに対応した個別音
量制御信号S13内部の値が重み係数S30の値とな
る。例えば、発言者データS9が図5(a)ならC
(2)が重み係数S30の値となる。発言者データS9
が図5(b)のように有音が複数の場合、それぞれに対
応した値の平均値を重み係数S30の値とする。発言者
データS9が図5(b)であれば、重み係数S30の値
は(C(2)+C(5))/2である。
【0040】また、他にこのように有音が複数の場合
は、重み係数S30の値を1として音量調節を行わない
ようにしてもよい。また、有音が複数の場合は、対象と
なる個別音量制御信号S13の中で最大値のものを重み
係数S30の値にしても良い。例えば、C(2)>C
(5)なら重み係数をC(2)にする。また、発言者デ
ータS9が図5(c)の場合は重み係数S30の値は0
又は1にするものである。この音量調節は先の発言者デ
ータ作成部3での発言者データ作成を周期的に行う場合
であれば、重み係数S30の算出も同じ周期で行うもの
である。
【0041】(動作): TV会議端末の送信にあた
る送信部1では、複数の音声入力端子T1(1)〜T1
(n)より入力した音声信号S1(1)〜S1(n)は
それぞれ混合合成部2で混合合成されて一つの混合音声
データS2に求められる。また、発言者データ作成部3
は入力音声信号S1(1)〜S1(n)から誰が発言し
ているかを識別し、その結果である発言者データS3を
出力する。
【0042】この混合音声データS2と、発言者データ
S3とは他の符号化画像データS4、S5と共に、マル
チメディア多重化部4で多重化され多重化データS6と
して伝送路5に出力される。そして、多重化データS6
は相手TV会議端末に伝送される。
【0043】一方、受信部9は多重化データS7を受信
すると、マルチメディア分離部6で多重分離し、混合音
声データS8と、発言者データS9と、符号化画像デー
タS10、S11などに分離して出力する。混合音声デ
ータS8と、発言者データS9とは音量調節部7に与え
られ、ユーザ入力端子T3から与えられた個別音量制御
信号S13に基づいて混合音声データS8は音量調節さ
れて音声出力端子T2に出力される。
【0044】更に、発言者表示部8に与えられた発言者
データS9によって、現在誰が発言しているかが表示さ
れる。
【0045】(第1実施例の効果): 以上の第1実
施例のTV会議システムによれば、従来の混合音声デー
タの他に各参加者別の発言者データも送信することで、
受信側では好みに応じて相手の音量を個別に変えること
ができる。
【0046】例えば、相手のTV会議端末側に居る人の
中で一番重要な人(Aさんとする。)だけの音声は聞く
必要があるが、他の人の音声は聞く必要がないので、A
さん以外の音声は極力スピーカ出力しないようにするこ
とができる。また、スピーカから出力されるAさんの音
声が他の人に比べて小さいため、Aさんの音量を大きく
することもできる。
【0047】また、従来のTV会議システムでは現在誰
が発言しているかが不明である場合があり得たが、この
実施例では発言者の音声の他に、発言者データも受信側
に送信され、受信部では誰が発言者であるかも表示する
ので、明確に発言者を理解することができる。
【0048】『第2実施例』: 図7は第2実施例の
TV会議システムの概念を表す説明図である。この図7
は拠点間が回線容量の小さい伝送路の場合のシステムの
概念を表すものである。会議参加者はそれぞれ分散配置
されており、拠点内ではLAN(ローカルエリアネット
ワーク)や専用線などの通信容量の大きい回線に接続さ
れた卓上のTV会議端末などを用いて通信を行う。
【0049】例えば、図7は拠点間で、例えば、東京−
大阪間は回線容量の小さい伝送路のため音声や画像を参
加者別に個別に伝送することができず、図7のように拠
点ゲート装置で拠点内のTV会議端から送られてくる複
数の音声を混合合成して一つにまとめて相手の拠点ゲー
ト装置705に送信するなどの場合である。
【0050】音声はこのように一つにまとめてしまうの
で、その音声が誰の音声かを理解することができない。
そこで、混合合成した音声データの他に誰の音声が入っ
ているかを表す情報(発言者データ)も送信し、第1実
施例と同様に個別音量制御を自分の卓上TV会議端末8
05a、bで行うものである。
【0051】(拠点ゲート装置705): 図8は拠
点ゲート装置705の機能構成図である。この図8にお
いて拠点ゲート装置705は、主に送信部701と受信
部703とから構成される。この送信部701はパケッ
ト受付部702と、発言者データ作成部3と、混合合成
部2と、マルチメディア多重化部4と、パケット入力端
子T31とから構成されている。また、受信部703は
パケット送信部704とマルチメディア分離部6と、パ
ケット出力端子T32とから構成されている。
【0052】(送信部701): 図8において、パ
ケット入力端子T31には、拠点内の卓上TV端末から
の音声、画像、その他のデータなどのパケットS41が
LANなどを通じて与えられる。このパケットS41は
パケット受付部702に与えられる。パケット受付部7
02はパケットS41から音声データS1と、符号化画
像データS4と、その他のデータS5とに振り分け、音
声データS1は混合合成部2と、発言者データ作成部3
とに与える。尚、混合合成部2と、発言者データ作成部
3との機能は上述の第1実施例と同様である。
【0053】マルチメディア多重化部4は、混合音声デ
ータS2と、発言者データS3と、符号化画像データS
4と、その他のデータS5とを多重化し多重化データS
6を伝送路5に出力するものである。
【0054】(受信部703): 図8において、受
信部703のマルチメディア分離部6は、伝送路5から
の多重化データS7を多重分離し、混合音声データS8
と、発言者データS9と、符号化画像データS10と、
その他のデータS11とに分離しパケット送信部704
に与える。パケット送信部704は与えられた各データ
S8〜S11からパケット化してパケットデータS42
をパケット出力端子T32に出力する。
【0055】このパケット出力端子T32から出力され
たパケットデータS42は拠点内の各卓上TV会議端末
に送信される。
【0056】(卓上TV会議端末805): 図9は
卓上TV会議端末805の機能構成図である。この図9
において卓上TV会議端末805は主に送信部801
と、受信部803とから構成されている。この送信部8
01は、パケット送信部802と、音声入力端子T1と
から構成されている。受信部803はパケット受信部8
04と、音量調節部7と、発言者表示部8とから構成さ
れている。
【0057】音声入力端子T1に与えられた入力音声信
号S1はパケット送信部802に与えられる。このパケ
ット送信部802は入力音声信号S1と符号化画像デー
タS4とその他のデータS5とをパケット化しパケット
データS51をパケット出力端子T41に出力する。出
力されたパケットデータS51はLANなどを通じて拠
点ゲート装置705に与えられる。
【0058】図9の受信部803のパケット入力端子T
42には、拠点ゲート装置705からパケットデータS
52が与えられる。パケット受信部804はパケットデ
ータS52から振り分け、混合音声データS8と発言者
データS9と符号化画像データS10とその他のデータ
S11とに振り分けられる。混合音声データS8は音量
調節部7に与えられる。発言者データS9は音量調節部
7と発言者表示部8とに与えられる。尚、音量調節部7
と発言者表示部8との機能は上述の第1実施例と同様で
ある。
【0059】(動作): 図8、図9において会議参
加者の各音声は拠点内の各卓上TV会議端末805から
拠点ゲート装置705に送られる。拠点ゲート装置70
5に与えられた各音声データS1は混合合成部2で混合
合成され、一つの混合音声データS2にまとめられる。
また、各音声データS1は発言者データ作成部3で有
音、無音判定され誰が発言しているかを調べられ、発言
者データS3をマルチメディア多重化部4に与えられ
る。
【0060】混合音声データS2と発言者データS3と
は他の符号化画像データS4、S4などと共に、マルチ
メディア多重化部4で多重化され相手の拠点ゲート装置
705に送信される。
【0061】一方、拠点ゲート装置705の受信部70
3は相手の拠点ゲート装置から受信した多重化データS
7をマルチメディア分離部6で分離する。ここで分離さ
れた混合音声データS8と、発言者データS9と符号化
画像データS10、S11などは卓上TV会議端末80
5に送信される。卓上TV会議端末805の音量調節部
7は、混合音声データS8と発言者データS9と、ユー
ザ入力端子T3からの個別音量制御信号S13とに基づ
いて、混合音声データS8の音量が調節されて音声出力
端子T2へ出力される。同時に発言者が誰であるかが表
示されるものである。
【0062】(第2実施例の効果): 上述の第1実
施例は、『複数のユーザが同一のTV会議端末で会議に
参加する例』であったが、この第2実施例では『参加者
一人1台の卓上会議端末を用いた例』である。この第2
実施例ではTV会議端末は個々の参加者にあるので、個
別音量調節を各卓上TV会議端末で行うことができる。
従って、『個別音量調節を個々の参加者が別々に行うこ
とができる』。
【0063】『第3実施例』: 図10は第3実施例
の機能構成図である。この第3実施例では例えば、図7
のように『場所毎に1箇所の会議室に参加者が集まりT
V会議端末を用いて通信を行う場合の例である』。上述
の『第1実施例と異なる点は、個別音量制御情報を相手
のTV会議端末に送り、音量調節を相手送信部の混合合
成部で行わせる』ものである。
【0064】図10において、TV会議端末904は主
に送信部901と、受信部903とから構成されてい
る。送信部901は荷重混合合成部902と、発言者デ
ータ作成部3と、マルチメディア多重化部4と、音声入
力端子T1(1)〜T1(n)と、ユーザ入力端子T3
とから構成されている。受信部903は発言者表示部8
とマルチメディア分離部6と、音声出力端子T2とから
構成されている。
【0065】(送信部901): 図10において、
送信部901の音声入力端子T1(1)〜T1(n)か
ら入力された入力音声信号S1(1)〜S1(n)は荷
重混合合成部902と発言者データ作成部3とに与えら
れる。加重混合合成部902は複数の入力音声信号S1
(1)〜S1(n)の振幅を受信部903から得られる
相手のTV会議端末からの各音声に対する個別音量制御
信号S62に基づいて荷重加算を行い、混合音声データ
S61を出力するものである。
【0066】例えば、時刻tに荷重混合合成部902に
与えられる複数の音声信号の振幅値をS1(1)(t)
〜S1(n)(t)、荷重混合合成部3より出力する音
声信号の振幅値をS61(t)、個別音量制御信号S6
2の値をC(1)〜C(n)とすると、荷重混合合成部
902は次の式(3)のように表される。
【0067】
【数3】 更に、オーバフロー防止など必要によってはS61
(t)にリミッタをかけて値の上下を制限して出力す
る。
【0068】一方、入力音声信号S1(1)〜S1
(n)は発言者データ作成部3に入力され、上述の第1
実施例、第2実施例と同じような働きをする。
【0069】また、ユーザ入力端子T3には相手のTV
会議端末から送信される音声の音量を個別に制御するた
めの個別音量制御信号S13が入力される。混合音声デ
ータS61と、発言者データS3と、個別音量制御信号
S13と、符号化画像データS4とその他のデータS5
とはマルチメディア多重化部4で多重化される。この多
重化データS6は伝送路5に出力され、相手TV会議端
末に伝送される。
【0070】(受信部903): 図10の受信部9
03のマルチメディア分離部6は多重化データS7を受
信すると、混合音声データS8と、発言者データS9
と、個別音量制御信号S62と、符号化画像データS1
0と、その他のデータS11とに分離し出力する。混合
音声データS8は音声出力端子T2へ出力され、ここか
らスピーカなどへ出力される。発言者データS9は発言
者表示部8へ与えられ、個別音量制御信号S62は送信
部901の荷重混合合成部902に与えられる。発言者
表示部8は上述の第1実施例、第2実施例と同様な機能
である。
【0071】(動作): 上述の第1実施例では個別
音量制御信号S13をTV会議会議端末の受信部9の音
量調節部7に入力することで、受信後の混合合成音声に
対して音量を調節した。そこで、この第3実施例では個
別音量制御信号S13を相手のTV会議端末の送信部9
01の荷重混合合成部902に与える。そして、送信部
901の内部で複数の混合合成する際に、個別音量制御
信号S13に基づいて各音声の音量を変えた上で混合合
成を行う。この音量調節された混合合成音声データが相
手のTV会議端末に送信される。
【0072】(第3実施例の効果): 以上の第3実
施例のTV会議システムによれば、音量調節を送信側で
の混合合成の際に行うので、有音入力が複数の場合にも
全ての音声に対して個別音量制御信号S13の値に基づ
いた混合合成が可能となる。また、以上のような構成を
採る送信側で必要な発言者の音量を強調させるように制
御することができる。
【0073】(他の実施例): (1)尚、上述の実
施例においては、発言者検出を送信部の内部の発言者判
別部で行ったが、この他に、例えば、マイクロフォンな
ど外部で有音/無音検出できる場合は送信部の内部で行
う必要はなく、外部での発言者検出結果を送信部に取り
込むことでもよい。
【0074】(2)また、上述の実施例においては、発
言者データは有音か無音かの2段階の値を持っていた
が、この他に、例えば、入力したそれぞれの音声の振幅
レベルの段階データでも良い。この振幅レベル段階デー
タとは、例えば、振幅を5段階などに量子化し0(無
音)から4(大きい)までの整数値にする。この振幅レ
ベルを発言者表示部10に入力し、振幅レベルを表示す
ることで有音か無音かだけでなく相手の声の大きさの程
度まで知ることができるので、きめ細かい制御を行うこ
とができる。
【0075】(3)更に、上述の実施例では画像も多重
化して伝送するTV会議システムの例を示したが、画像
は必ずしも送らない音声会議システムにも適用すること
ができる。
【0076】(4)更にまた、上述の実施例では混合音
声データと発言者データとを同じ伝送路で伝送する例を
示したが、この他に、別々の伝送路で伝送することもで
きる。このようにすることで、多重、分離をすることな
くそれぞれのデータを独立に伝送することができるの
で、構成が簡単になることも期待できる。
【0077】(5)また、上述の実施例では音量を個別
に制御したが、この他に例えば、音質に関しても個別に
制御してもよい。
【0078】(6)更に、上述の実施例では入力音声の
数が複数の場合の例を説明したが、音声入力が一つ若し
くは参加者数よりも少ない場合でも、外部から現在の発
言者が誰であるかなどを発言者データ作成部に入力する
ことで実現することができる。
【0079】(7)更にまた、上述の第3実施例では発
言者データ作成部3で作成した発言者データを表示しな
いならば、発言者データ作成部3及び発言者表示部8を
備えなくてもよい。
【0080】(8)また、発言者の判断には、音声認識
方式、話者認識方式などを使用することも判断精度を上
げるうえで好ましいと考えられる。また、上述の実施例
では『発言者』の判断として説明したが、これは他に
『話者』の判断と言っても同じことである。
【0081】(9)更に、上述の実施例では発言者表示
部8を備える、この他に発言者が誰であるかを音響的に
出力したり、印字出力することでもよい。このように構
成することで、視聴覚障害者の参加も容易になる。
【0082】(10)更にまた、上述のようなシステム
は、有線伝送システムでも、無線伝送システムでも同じ
ように適用し得る。
【0083】
【発明の効果】以上述べた様にこの発明の送信装置は、
複数の音響信号を混合して混合音響信号を出力する混合
手段と、混合手段に与えられている音響信号から発言者
を識別し、発言者識別信号を出力する発言者識別手段
と、混合音響信号と発言者識別信号とを送信する送信手
段とを備える。更に、この発明の受信装置は、混合音響
信号と発言者識別信号とを受信する受信手段と、混合音
響信号の音量又は音質を制御するめの音響制御信号と、
発言者識別信号とから受信混合音響信号の音量又は音質
を制御する音響制御手段とを備えるものである。
【0084】このような構成を採ることで、多人数によ
る音声通信会議やTV会議において、対象とする発言者
の音響を明確に聴取し得るように制御することができ
る。
【図面の簡単な説明】
【図1】この発明の第1実施例のTV会議端末の機能構
成図である。
【図2】従来例のTV会議端末の機能構成図である。
【図3】従来例の会議室内のTV会議端末どうしで行う
場合の説明図である。
【図4】第1実施例の発言者データ作成部の機能構成図
である。
【図5】第1実施例の発言者テーブルの説明図である。
【図6】第1実施例の音量調節部の機能構成図である。
【図7】第2実施例の拠点間が回線容量の小さい伝送路
の場合の構成図である。
【図8】第2実施例の拠点ゲート装置の機能構成図であ
る。
【図9】第2実施例の卓上TV会議端末の機能構成図で
ある。
【図10】第3実施例のTV会議端末の機能構成図であ
る。
【符号の説明】
1…送信部、2…混合合成部、3…発言者データ作成
部、4…マルチメディア多重化部、5…伝送路、6…マ
ルチメヂア分離部、7…音量調節部、8…発言者表示
部、9…受信部、10…TV会議端末。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 複数の音響信号を混合して混合音響信号
    を出力する混合手段と、 上記混合手段に与えられている音響信号から発言者を識
    別し、発言者識別信号を出力する発言者識別手段と、 上記混合音響信号と上記発言者識別信号とを送信する送
    信手段とを備えることを特徴とする送信装置。
  2. 【請求項2】 混合音響信号と発言者識別信号とを受信
    する受信手段と、 上記混合音響信号の音量又は音質を制御するめの音響制
    御信号と、上記発言者識別信号とから受信混合音響信号
    の音量又は音質を制御する音響制御手段とを備えること
    を特徴とする受信装置。
  3. 【請求項3】 上記発言者識別信号から発言者が誰であ
    るかを可視的又は音響的に出力する出力手段を備えるこ
    とを特徴とする請求項2記載の受信装置。
  4. 【請求項4】 上記音響制御手段は、 上記音響制御信号と、上記発言者識別信号とから重み係
    数を求め、この重み係数と受信混合音響信号とから演算
    して音響制御を行うことを特徴とする請求項2又は3記
    載の受信装置。
  5. 【請求項5】 混合音響信号の音量又は音質を制御する
    めの音響制御信号を受信部から受け、複数の音響信号の
    混合を制御して混合音響信号を出力する混合手段と、 上記混合手段に与えられている音響信号から発言者を識
    別し、発言者識別信号を出力する発言者識別手段と、 音響信号の音量又は音質を制御するめの音響制御信号
    と、上記混合音響信号と、上記発言者識別信号とを送信
    する送信手段とを有する送信部と、 上記音響制御信号と、上記混合音響信号と、上記発言者
    識別信号とを受信する受信手段と、 受信音響制御信号を上記混合手段に与え、混合音響信号
    を音響出力し、上記発言者識別信号を可視的又は音響的
    に出力する出力手段とを有する受信部とを備えることを
    特徴とする送受信装置。
JP6223174A 1994-09-19 1994-09-19 送信装置、受信装置及び送受信装置 Pending JPH0888692A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6223174A JPH0888692A (ja) 1994-09-19 1994-09-19 送信装置、受信装置及び送受信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6223174A JPH0888692A (ja) 1994-09-19 1994-09-19 送信装置、受信装置及び送受信装置

Publications (1)

Publication Number Publication Date
JPH0888692A true JPH0888692A (ja) 1996-04-02

Family

ID=16793970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6223174A Pending JPH0888692A (ja) 1994-09-19 1994-09-19 送信装置、受信装置及び送受信装置

Country Status (1)

Country Link
JP (1) JPH0888692A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008172790A (ja) * 2007-01-08 2008-07-24 Avaya Technology Llc マルチメディア会議方法および信号
JP2010507353A (ja) * 2006-10-18 2010-03-04 ソニー オンライン エンタテインメント エルエルシー オーバラップするメディアメッセージを調整するシステム及び方法
JP2014523707A (ja) * 2011-07-01 2014-09-11 クアルコム,インコーポレイテッド ソーシャル・グラフ、会話モデル、およびユーザ・コンテキストを介した、モバイル装置のユーザ付近の人の特定
JP2015069136A (ja) * 2013-09-30 2015-04-13 株式会社ナカヨ 話者別音量調整機能を有する通信会議装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010507353A (ja) * 2006-10-18 2010-03-04 ソニー オンライン エンタテインメント エルエルシー オーバラップするメディアメッセージを調整するシステム及び方法
US8855275B2 (en) 2006-10-18 2014-10-07 Sony Online Entertainment Llc System and method for regulating overlapping media messages
JP2008172790A (ja) * 2007-01-08 2008-07-24 Avaya Technology Llc マルチメディア会議方法および信号
JP2014523707A (ja) * 2011-07-01 2014-09-11 クアルコム,インコーポレイテッド ソーシャル・グラフ、会話モデル、およびユーザ・コンテキストを介した、モバイル装置のユーザ付近の人の特定
US9159324B2 (en) 2011-07-01 2015-10-13 Qualcomm Incorporated Identifying people that are proximate to a mobile device user via social graphs, speech models, and user context
JP2015069136A (ja) * 2013-09-30 2015-04-13 株式会社ナカヨ 話者別音量調整機能を有する通信会議装置

Similar Documents

Publication Publication Date Title
US8687820B2 (en) Stereo microphone processing for teleconferencing
US5818514A (en) Video conferencing system and method for providing enhanced interactive communication
US7612793B2 (en) Spatially correlated audio in multipoint videoconferencing
US6804340B2 (en) Teleconferencing system
EP0619679B1 (en) Multi-location television conference system and control apparatus
EP1622349B1 (en) Teleconference volume level monitoring and feedback on the volume level
EP0724362B1 (en) Priority controlled transmission of multimedia streams via a telecommunication line
EP1616433B1 (en) Automatic speak-up indication for conference call attendees
US20030112947A1 (en) Telecommunications and conference calling device, system and method
JP3483086B2 (ja) 音声電話会議装置
CA2500999A1 (en) A videophone interpretation system and a videophone interpretation method
JP2000270304A (ja) 多地点テレビ会議システム
US20030198328A1 (en) Voice activity identification for speaker tracking in a packed based conferencing system with distributed processing
US8515039B2 (en) Method for carrying out a voice conference and voice conference system
JPH08125738A (ja) Isdnによる話者特定機能付音声会議システム
JPH0888692A (ja) 送信装置、受信装置及び送受信装置
JPH09149133A (ja) テレビ会議システムのための音声入力端末および音声合成端末
JP2009246528A (ja) 画像付音声通信システム、画像付音声通信方法およびプログラム
JP2003283672A (ja) 電話会議装置
JP2000004304A (ja) 異なる手段での会話が可能な通話装置
US11764984B2 (en) Teleconference method and teleconference system
JPS6315559A (ja) 電子会議システム
JPH02228158A (ja) テレビ会議装置
JPH0746565A (ja) 通信システム
JPH07226930A (ja) 通信会議システム