JPH09163334A - 話者検出回路及びテレビ会議装置 - Google Patents

話者検出回路及びテレビ会議装置

Info

Publication number
JPH09163334A
JPH09163334A JP7325612A JP32561295A JPH09163334A JP H09163334 A JPH09163334 A JP H09163334A JP 7325612 A JP7325612 A JP 7325612A JP 32561295 A JP32561295 A JP 32561295A JP H09163334 A JPH09163334 A JP H09163334A
Authority
JP
Japan
Prior art keywords
band
microphone
filter
voice
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7325612A
Other languages
English (en)
Inventor
Iwao Hashizume
巌 橋爪
Hisayoshi Naito
久義 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP7325612A priority Critical patent/JPH09163334A/ja
Publication of JPH09163334A publication Critical patent/JPH09163334A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 【課題】 マイクロフォンに有意な音が入ったことを検
出する話者検出回路及び、その話者検出回路を適用した
遠隔会議装置に関し、話者音声を正確に検出する話者検
出回路及びその話者音声を正確に検出する話者検出回路
を適用したテレビ会議装置を提供する。 【解決手段】 話者検出回路は、マイクロフォンに入力
された音声帯域信号から特定の帯域の成分を取り出すろ
波器と、該ろ波器が出力する特定帯域の音声帯域信号の
レベルを検出して、該音声帯域信号のレベルと所定の閾
値とを比較するマイク検出部とを備えて構成し、テレビ
会議装置は、該話者検出回路の出力信号によってカメラ
を制御する構成を備えて構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、マイクロフォンに
有意な音が入ったことを検出する話者検出回路及び、そ
の話者検出方式を適用した遠隔会議装置に係り、特に、
話者音声を正確に検出する話者検出回路及びその話者音
声を正確に検出する話者検出回路を適用したテレビ会議
装置に関する。
【0002】電話は音声を媒介とする通信の代表的なも
ので、通信の基本的な形態として発達を続けてきてお
り、社会活動のグローバル化、個人生活の高度化と多様
化に伴ってその重要性は益々大きくなってゆくものと考
えられるが、電話は基本的には特定の二者間の会話形態
の通信を提供する手段であって、多数の者が同時に参加
することは元来考慮していない。
【0003】しかし、特に国内においては、二次の石油
ショックを経験してからの経済的な効果の追求と、企業
活動の同時進行化とそれに伴う決定の迅速化への対応と
から、出張打合せの代替手段として多数の者が同時に参
加できる通信手段の需要が急速に高り始め、今もその需
要は衰えを見せていない。このような目的に合致する通
信手段を提供するのが音声会議装置やテレビ会議装置に
よる遠隔会議装置である。
【0004】当初は通信事業者がリーズナブルな対価で
提供できるのは音声回線に限られていたために、遠隔会
議装置といえば音声会議装置のことを指すと言っても差
し支えなかったが、通信網のデジタル化の浸透と画像信
号の帯域圧縮技術の進歩に伴って、テレビ会議装置が主
流になりつつある。
【0005】遠隔会議装置においては、音声の回り込み
によるハウリングの防止、発言者に即座に且つ安定的に
追従するカメラ制御等が、会議の円滑な進行のために重
要な技術となっている。この双方を同時に改善又は解決
することができる技術が、話者検出技術、即ち、有意な
発言音声を入力されたマイクロフォンを特定する技術
で、その安定化は遠隔会議装置が初めて世に提供された
頃からの課題である。
【0006】
【従来の技術】図14は、従来の話者検出回路である。
図14において、10−1は第一のマイクロフォン、1
0−2は第二のマイクロフォン、10−3は第三のマイ
クロフォン、12はマイク検出部である。
【0007】図14の構成においては、マイク検出部で
各々のマイクロフォンに入力された音声帯域信号を尖頭
値検出し、該尖頭値が所定のレベル以上のマイクロフォ
ンに有意な発言音声が入力されたものとして、そのマイ
クロフォンを特定する、即ち話者を特定する信号を出力
する。
【0008】又は、上記尖頭値検出出力を所定時間内、
例えば1秒程度の時間内で平均し、該平均値が章程のレ
ベル以上のマイクロフォンに有意な発言音声が入力され
たものとして話者を特定する信号を出力する。
【0009】図15は、従来の話者検出回路を適用した
テレビ会議装置である。図15において、10−1は第
一のマイクロフォン、10−2は第二のマイクロフォ
ン、10−3は第三のマイクロフォン、12はマイク検
出部、13はマイク座標記憶部、14はカメラ制御部、
15は旋回台を含むカメラ、16は音声信号送信部、1
7は映像信号送信部、18は多重化部である。
【0010】図15の構成においては、マイク検出部の
出力である、有意な発言音声が入力されたとして特定し
たマイクロフォンを示す信号がマイク座標記憶部に渡さ
れる。マイク座標記憶部は、該マイク検出部から受けた
信号をキーに、該マイク検出部が特定したマイクロフォ
ンの座標をカメラ制御部に渡す。該カメラ制御部はマイ
ク座標記憶部から受けたマイク座標をパン信号(カメラ
のレンズ軸を水平方向に回転させるための信号)とチル
ト信号(カメラのレンズ軸を垂直方向に回転させるため
の信号)に変換してカメラに向けて出力する。該カメラ
は、水平方向の回転角と垂直方向の回転角を示すセンサ
ーの出力が、各々、該パン信号と該チルト信号に等しく
なるまでカメラのレンズ軸を回転させて該レンズ軸を特
定されたマイクロフォンの方向に向け、発言者を撮影す
る。そして、マイクロフォンが受けた音声帯域信号とカ
メラが撮影した映像帯域信号は、各々、音声信号送信
部、映像信号送信部に送られてデジタル符号化され、多
重化部において多重化された後に伝送路に送出される。
【0011】
【発明が解決しようとする課題】図14の話者検出回路
において、マイクロフォンの出力を尖頭値検出して有意
な発言音声が入力されたとしてマイクロフォンを特定す
る場合、発言者のマイクロフォンとは別のマイクロフォ
ンに入力された発言音声以外の物音、例えば資料をめく
る音やボールペンを落とした時の音のレベルによって、
発言者のマイクロフォンとは別のマイクロフォンに有意
な発言音声が入力されたと誤判定することがしばしばあ
る。
【0012】このような誤判定をしたマイク検出出力に
よってカメラの制御を行なった場合、カメラは発言音声
以外の物音を捉えたマイクロフォンの座標を目指して回
転を開始する。しかし、上記のような物音の継続時間は
短時間であるためにすぐに消失するので、発言音声を捉
えているマイクロフォンが新たに特定される。従って、
カメラは一旦物音を検出したマイクロフォンに向けて回
転を開始するものの、改めて発言音声を検出したマイク
ロフォンに向けて回転を開始する。これによって、図1
5では図示を省略している相手側の表示部には無意味な
移動する映像が映し出されることになって、表示部を注
視している会議参加者に不快感を与える原因になる。
【0013】又、上記尖頭値出力を所定時間内で平均す
る場合には、資料をめくる音やボールペンを落とした時
の音などの発言音声以外の物音の影響を抑圧することが
可能であるが、発言者が映し出されるまでの遅延時間が
大きくなって、相手側の会議参加者に違和感を与える原
因になる。
【0014】本発明は、かかる問題点を解決すべく、話
者音声を正確に検出する話者検出回路及びその話者音声
を正確に検出する話者検出回路を適用したテレビ会議装
置を提供することを目的とする。
【0015】
【課題を解決するための手段】図1は、本発明の話者検
出回路である。図1において、10−1は第一のマイク
ロフォン、10−2は第二のマイクロフォン、10−3
は第三のマイクロフォン、11−1は第一のろ波器、1
1−2は第二のろ波器、11−3は第三のろ波器、12
はマイク検出部である。
【0016】図1の構成の特徴は、マイクロフォンとマ
イク検出部の間に個々のマイクロフォン毎にろ波器を挿
入した点にある。人間の音声エネルギーの周波数分布特
性は、平均的には約1KHz程度まで平坦で、それ以上
では約6dB/オクターブで減少する。従って、約1K
Hzで帯域制限しても音声エネルギーを正しく検出する
ことができる。
【0017】一方、資料の紙がこすれる音や、ポールペ
ンを落とした時の音はそれより高周波帯域に大きなエネ
ルギーを持っている。従って、約1KHzで帯域制限を
すれば、マイクロフォンに入力された音声帯域信号は発
言音声であるか、発言音声以外の物音であるかを正確に
判別することができる。
【0018】図2は、本発明のテレビ会議装置の第一の
実施の形態である。図2において、10−1は第一のマ
イクロフォン、10−2は第二のマイクロフォン、10
−3は第三のマイクロフォン、11−1は第一のろ波
器、11−2は第二のろ波器、11−3は第三のろ波
器、12はマイク検出部、13はマイク座標記憶部、1
4はカメラ制御部、15は旋回台を含むカメラ、16は
音声信号送信部、17は映像信号送信部、18は多重化
部である。
【0019】図2の構成の特徴は、図15のテレビ会議
装置に対して、マイクロフォンとマイク検出部の間に各
々のマイクロフォンに対応してろ波器を挿入した点にあ
る。このような構成にすることにより、マイク検出部は
発言音声以外の物音を発言音声であると誤判定すること
が少なくなり、これに伴ってカメラが無意味な動きをす
ることも少なくなるので、相手側の会議参加者に違和感
を与えることも縮減される。
【0020】尚、上記ろ波器は話者検出のためにだけ使
用される構成になっていて、相手側に伝える必要がある
音声信号に対しては音声信号送信部で必要な帯域が確保
されるので、話者検出を行なったために相手側の会議参
加者が聞く音声品質が劣化することはない。
【0021】
【発明の実施の形態】図3は、ろ波器の構成例の要部
で、111は抵抗、112はコンデンサである。
【0022】図3の構成は、抵抗とコンデンサによる一
次のロール・オフを実現する回路で、その遮断周波数は
抵抗の抵抗値をR、コンデンサの容量値をCとすれば、
1/(2πCR)である。そして伝達関数の絶対値は、
遮断周波数以下ではほぼ平坦であり、遮断周波数以上で
はおおむね6dB/オクターブで減衰する。従って、遮
断周波数が約1KHzになるように抵抗値と容量値を選
択すれば、人間の音声のエネルギーの主要な部分を通過
させることができ、発言音声と其以外の物音を正確に判
別することができる。
【0023】ところで、図3はろ波器の要部のみを示す
もので、実用的に必要なバッファ増幅器は図示を省略し
ている。尚、図3においては最も構成が簡易な一次のロ
ール・オフを与える回路を例示したが、高次のロール・
オフを与える回路も実現することができることは回路網
理論が教えるところである。
【0024】又、所謂能動ろ波器の構成技術を適用すれ
ば帯域消去ろ波器を構成することも可能である。この消
去帯域を、発言音声以外の物音に特有な周波数帯域に一
致させれば、発言音声以外の物音をエネルギーを一層減
衰させた上でマイク検出を行なうことができるようにな
るので、発言音声と物音との判別をより正確に行なうこ
とが可能になる。
【0025】図4は、マイク検出部の要部の構成例で、
単一のマイクロフォンに対応して設けられる構成を示し
ている。図4において、121は整流部、122は比較
器である。
【0026】ろ波器より供給される、帯域を制限された
音声信号は整流部で整流されて直流に変換される。該直
流は比較器において検出閾値と比較され、検出閾値より
大きい時に比較器より“1”が検出信号として出力さ
れ、検出閾値より小さい時には比較器より“0”が検出
信号として出力される。
【0027】マイク検出部は、図4の構成をマイクロフ
ォンの数だけ備えているので、検出出力全体は各々のマ
イクロフォンに対応する“0”と“1”とで形成され
る。最も簡単な構成では、上記検出信号の組をそのまま
マイク座標記憶部に供給すればよく、図4にはこれを前
提にした構成を示している。
【0028】しかし、マイクロフォンの数が多くなる場
合にはマイクロフォン毎に検出信号を割り当てる方式で
は、マイク検出部からマイク座標記憶部への信号線の数
が多くなり、しかもその中の一本しか有意な発言音声を
検出したことを示す情報を載せていないので効率が悪く
なる。このような場合には、各々のマイクロフォンに対
応する数を決めておいて、それを2進数に変換して検出
信号として出力すればよい。図1又は図2のようにマイ
クロフォンが3本ある場合には、第一のマイクロフォン
に1、第二のマイクロフォンに2、第三のマイクロフォ
ンに3という数を決めておき、第一のマイクロフォンで
発言音声を検出した時には10進数の1を2進化して
“0“と“1”を出力し、第二のマイクロフォンで発言
音声を検出した時には2を2進化して“1“と“0”を
出力し、第三のマイクロフォンで発言音声を検出した時
には3を2進化して“1“と“1”を出力するようにす
れば、各々のマイクロフォンで発言音声を検出した信号
をそのまま出力すると3本の信号線が必要になるところ
2本の信号線に縮減できる。これは、マイクロフォンの
数が多くなるほど信号線数の縮減効果が大きくなる。
【0029】図5は、マイク座標記憶部の格納データの
例で、上記検出信号は発言音声を検出したマイクロフォ
ンに対して“1”が出力され、他は“0”が出力され
る、即ち2進数変換しない場合に対応している。
【0030】マイク座標記憶部にマイクロフォンの座標
を格納する場合、マイク検出信号をアドレスにして、そ
のアドレスのデータ領域にパン信号とチルト信号をデジ
タル量で書き込んでおく。そして、第一のマイクロフォ
ンで発言音声を検出した時の検出信号のパターンが“1
00”であれば、アドレス“100”にアクセスして、
該アドレスに書き込まれているパン信号とチルト信号と
を読み出せばよい。
【0031】今、図5ではパン信号もチルト信号も4ビ
ットを想定して図示しているが、データに割り当てるビ
ット数はカメラの制御精度、制御範囲によって決めれば
よい。4ビットであるとすれば、0±7段階即ち15段
階で水平方向と垂直方向にカメラを制御できる。1段階
を回転角にして2度とすれば、28度の範囲でカメラの
向きを制御できる。会議室における参加者とカメラの位
置関係にもよるが、カメラの視野角を考慮すれば通常は
この程度をカバーできれば十分であろう。
【0032】図6は、本発明のテレビ会議装置の第二の
実施の形態である。図6において、10−1は第一のマ
イクロフォン、10−2は第二のマイクロフォン、10
−3は第三のマイクロフォン、11−1は第一のろ波
器、11−2は第二のろ波器、11−3は第三のろ波
器、12はマイク検出部、13はマイク座標記憶部、1
4はカメラ制御部、15は旋回台を含むカメラ、16は
音声信号送信部、17は映像信号送信部、18は多重化
部、19はろ波器帯域設定部である。
【0033】図6の構成の特徴は、図2に示したテレビ
会議装置の基本的構成に対してろ波器帯域設定部を設け
た点と、これに伴って後述するようにろ波器の構成を遮
断周波数を選択可能な構成にした点にある。
【0034】図7は、ろ波器の帯域設定の例である。図
7において、111は抵抗、112−1は第一のコンデ
ンサ、112−2は第二のコンデンサ、112−3は第
三のコンデンサ、112−4は第四のコンデンサ、11
2−5は第五のコンデンサ、113−1は第一のスイッ
チ、113−2は第二のスイッチ、113−3は第三の
スイッチ、113−4は第四のスイッチ、113−5は
第五のスイッチで、これらによってろ波器を構成する。
図7のろ波器が図3のろ波器と異なる点は、複数のコン
デンサと複数のスイッチを準備しておいてろ波器帯域設
定部からの設定信号によって五のスイッチのオン・オフ
を切り替えて、帯域を選択して設定できることである。
尚、高域遮断特性を持たせることが前提なので、いずれ
かのコンデンサは必ず接地する、言い換えると、いずれ
かのスイッチは必ずオンにする必要がある。
【0035】最も簡単な構成をとる場合、ろ波器帯域設
定部は基本的にはスイッチ群でよく、該ろ波器帯域設定
部が出力する“0”、“1”信号で、ろ波器が備えるス
イッチを個別にオン、オフして、ろ波器の遮断周波数を
変化させる。ここで、抵抗の抵抗値をR、第n(nは1
から5までの整数)のコンデンサの容量値をCn とし、
1 =C、Cm (mは2から5までの整数)=0.1C
とすれば、最大の遮断周波数は1/(2πCR)とな
り、最小の遮断周波数は1/〔2πCR(1+0.
4)〕となるので、遮断周波数を約±20%可変にする
ことができる。
【0036】又、ろ波器帯域設定部での設定を2進数に
変換して出力できるようにし、C2=0.05C、C3
=0.1C、C3 =0.2C、C4 =0.4Cとしてお
けば、最大の遮断周波数1/(2πCR)から最小の遮
断周波数1/〔2πCR(1+0.75)〕まで15段
階にわたって遮断周波数を約±42%可変にすることが
できる。
【0037】遮断周波数を可変にする具体的な方法は別
にして、図7の構成によってろ波器の遮断周波数を可変
にしておけば、参加者毎の声の質に対応してろ波器の帯
域を変えることができ、話者検出をより正確に行なうこ
とが可能になる。
【0038】図8は、本発明のテレビ会議装置の第三の
実施の形態である。図8において、10−1は第一のマ
イクロフォン、10−2は第二のマイクロフォン、10
−3は第三のマイクロフォン、11−1は第一のろ波
器、11−2は第二のろ波器、11−3は第三のろ波
器、12はマイク検出部、13はマイク座標記憶部、1
4はカメラ制御部、15は旋回台を含むカメラ、16は
音声信号送信部、17は映像信号送信部、18は多重化
部、19−aはろ波器帯域設定部、20は周波数分析部
である。
【0039】図8の構成の特徴は、周波数分析部におい
てマイクロフォンに入力された音声帯域信号を周波数分
析し、その分析結果に基づいてろ波器帯域設定部におい
て各々のろ波器の帯域を設定する点にある。
【0040】図9は、周波数分析部の構成例で、一のマ
イクロフォンに対応する構成を示すものである。図9に
おいて、201−1は第一のバッファ増幅器、201−
2は第二のバッファ増幅器、201−3は第三のバッフ
ァ増幅器、201−4は第四のバッファ増幅器、201
−5は第五のバッファ増幅器、202−1は第一の帯域
通過ろ波器、202−2は第二の帯域通過ろ波器、20
2−3は第三の帯域通過ろ波器、202−4は第四の帯
域通過ろ波器、202−5は第五の帯域通過ろ波器、2
03−1は第一の整流器、203−2は第二の整流器、
203−3は第三の整流器、203−4は第四の整流
器、203−5は第五の整流器である。尚、第nの帯域
通過ろ波器の通過周波数をfn とし、nが小さいほど遮
断周波数が低周波であるものとする。
【0041】図9に示す如く、バッファ増幅器と帯域通
過ろ波器と整流器の組は各々のマイクロフォンに対応し
て設けられているので、第nの組について説明する。マ
イクロフォンに入力された音声帯域信号は第nのバッフ
ァ増幅器を経由して通過周波数がfn で所定の通過帯域
を有する第nの帯域通過ろ波器に入力される。この帯域
通過ろ波器を通過するのは、音声帯域信号のうち周波数
n 近傍の所定帯域の成分だけである。もし、第nの帯
域ろ波器が理想的に構成されていて、周波数f n だけを
通過させるものであれば、その出力信号は周波数fn
正弦波となる。第nの整流器では第nの帯域ろ波器を通
過した成分を整流して、通過成分のエネルギーと1:1
に対応する直流を得る。従って、各々の整流器から出力
される直流は、マイクロフォンに入力された音声帯域信
号の周波数分布を表わす。
【0042】図10は、ろ波器帯域判定部の構成例で、
一のマイクロフォンに対応する構成を示したものであ
る。そして、図10(イ)はろ波器帯域判定部を構成
を、図10(ロ)は該ろ波器帯域判定部における読出し
専用メモリの格納データを示す。
【0043】図10(イ)において、191−1は第一
の比較器、191−2は第二の比較器、191−3は第
三の比較器、191−4は第四の比較器、192は読出
し専用メモリである。
【0044】図10のろ波器帯域判定部は図9の周波数
分析部の構成に合わせて、五の整流出力が供給される。
該五の整流出力は、第一の整流器の出力と第二の整流器
の出力が第一の比較器に供給され、第二の整流器の出力
と第三の整流器の出力が第二の比較器に供給され、第三
の整流器の出力と第四の整流器の出力が第三の比較器に
供給され、第四の整流器の出力と第五の整流器の出力が
第四の比較器に供給される。
【0045】マイクロフォンに入力された音声帯域信号
が発言音声である場合には、ほぼ1KHzまではほぽ平
坦な周波数特性を持っており、ほぼ1KHz以上ではほ
ぽ6dB/オクターブの傾斜でスペクトラム分布が低減
してゆく。従って、番号が小さい比較器からは“1”が
出力される可能性が高く、番号が大きい比較器からは
“0”が出力される可能性が高い。比較器の出力をc1
からc4 とすると、c1からc4 の“0”と“1”の組
合せには図10(ロ)のように“1111”、“011
1”、“0011”、“0001”、“0000”の五
のケースがある。c1 からc4 が全て“1”の時には入
力音声帯域信号の遮断周波数は最も低い周波数である。
従って、この場合には図7のスイッチは全てオンにする
必要がある。従って、読出し専用メモリのアドレス“1
111”には“11111”を格納しておく必要があ
る。逆に、c1 からc4 が全て“0”の時には入力音声
帯域信号の遮断周波数は最も高い周波数である。従っ
て、読出し専用メモリのアドレス“0000”には“1
0000”を格納しておく必要がある。そして、c1
らc4 の組をアドレスとして該読出し専用メモリから格
納データを読み出して、図7に構成を示したろ波器に供
給すればよい。
【0046】このようにすれば、図6の構成では会議前
にろ波器帯域設定部に特定のマイクロフォンの位置に座
る参加者の音声の遮断周波数を設定する必要があるのに
対して、図8の構成によれば会議を行ないながら自動的
にろ波器の遮断周波数を設定できる利点がある。
【0047】ここで説明した読出し専用メモリの出力
は、1本の信号線で図7の各々のスイッチを制御するこ
とを前提にしているが、該格納データを2進数に変換し
てろ波器に供給するようにすれば、図10の場合には3
ビットの信号線をろ波器帯域判定部とろ波器の間に張れ
ばよい。
【0048】図11は、本発明のテレビ会議装置の第四
の実施の形態である。図11において、10−1は第一
のマイクロフォン、10−2は第二のマイクロフォン、
10−3は第三のマイクロフォン、11−1は第一のろ
波器、11−2は第二のろ波器、11−3は第三のろ波
器、12はマイク検出部、13はマイク座標記憶部、1
4はカメラ制御部、15は旋回台を含むカメラ、16は
音声信号送信部、17は映像信号送信部、18は多重化
部、19−aはろ波器帯域設定部、20は周波数分析
部、21はろ波器帯域記憶部である。
【0049】図11の構成の特徴は、ろ波器帯域記憶部
を設け、予め該ろ波器帯域記憶部に予め登録した音声の
有効帯域情報を読み出してろ波器の帯域を設定すること
にある。そして、予め音声の有効帯域情報を登録するに
は、図11に破線で示した如く、登録時に周波数分析部
とろ波器帯域設定部をアクティブにして、ろ波器帯域設
定部から特定の話者の有効帯域情報をろ波器帯域記憶部
に格納し、会議中は周波数分析部とろ波器帯域設定部は
ディアクティブにして、ろ波器帯域記憶部に格納してあ
る遮断周波数に従ってろ波器の帯域を設定すればよい。
【0050】図12は、ろ波器帯域記憶部の格納データ
の例で、図12(イ)はマイク−話者対応メモリの格納
内容、図12(ロ)は話者−帯域対応メモリの格納内容
である。
【0051】マイク−話者対応メモリは、マイク検出部
がマイクロフォンに対応して出力する検出信号のパター
ンをアドレスとして話者のID番号を格納するメモリで
ある。後述の話者−帯域対応メモリに帯域情報を登録し
ている者は、会議開始前に自分が使用するマイクロフォ
ンのアドレスと自分のID番号をマイク−話者対応メモ
リに登録する。又、話者−帯域対応メモリには、登録者
のID番号をアドレスとして、登録者の音声の帯域情報
が格納されている。
【0052】従って、ろ波器の帯域設定は次の手順で行
なわれる。即ち、まずマイク検出部が検出信号を出力す
る。今、この検出信号はマイクロフォン毎に定義され、
そのマイクロフォンがオンなら“1”、オフなら“0”
であるものとし、第一のマイクロフォンがオンの時には
検出信号は“100”、第二のマイクロフォンの場合に
は“010”、第三のマイクロフォンの場合には“00
1”とする。もし、第一のマイクロフォンに有意な発言
音声が検出された場合には検出信号は“100”である
ので、この検出信号のパターンをアドレスとしてマイク
−話者対応メモリから第一のマイクロフォンを使用する
として登録されている者のID番号を読み出す。更に、
該読み出された話者ID番号をアドレスとして話者−帯
域対応メモリから該話者ID番号の主の帯域情報を読み
出す。該読み出された帯域情報によってろ波器の帯域を
設定する方法は、図10において説明した通りである。
【0053】尚、話者−帯域対応メモリへ帯域情報を登
録する場合には、周波数分析部とろ波器帯域設定部をア
クティブにして、マイクロフォンから自分の音声を入力
すると共に、ろ波器帯域記憶部に備えられているID指
定部から自分のID番号を入力すればよい。
【0054】図13は、本発明のテレビ会議装置の第五
の実施の形態である。図13において、10−1は第一
のマイクロフォン、10−2は第二のマイクロフォン、
10−3は第三のマイクロフォン、11−1は第一のろ
波器、11−2は第二のろ波器、11−3は第三のろ波
器、12はマイク検出部、13はマイク座標記憶部、1
4はカメラ制御部、15は旋回台を含むカメラ、16は
音声信号送信部、17は映像信号送信部、18は多重化
部、19−aはろ波器帯域設定部、20は周波数分析
部、21はろ波器帯域記憶部、22は多重分離部であ
る。
【0055】図13の構成の特徴は、ろ波器帯域記憶部
から読み出される発言中の参加者の使用するマイク番号
と話者ID番号を多重化部に導いて映像信号に多重化し
て音声信号と共に相手側に送出する構成にすると共に、
図には明瞭に示してはいないが、多重分離部において相
手側から映像信号に多重化して送られてくる発言中の参
加者の使用しているマイク番号と話者ID番号を映像信
号受信部を介して映像モニタに供給して、モニタ上に発
言中の参加者が使用しているマイク番号と話者ID番号
を表示する点にある。これにより、予め使用マイク番号
付で参加者名簿が相手側に配付されていれば、発言者が
誰であるかを相手側で認識することができるので、初対
面の者が参加していてる場合にも会議を円滑に進行でき
る利点が生ずる。
【0056】尚、三箇所以上で会議をすることがあるな
らば、マイク番号、話者ID番号に加えて会議室番号も
送受信すれば、どこの誰が発言中かを明瞭に知ることが
可能になる。
【0057】図14は、本発明の本発明のテレビ会議装
置の第五の実施の形態である。図14において、10−
1は第一のマイクロフォン、10−2は第二のマイクロ
フォン、10−3は第三のマイクロフォン、11−1は
第一のろ波器、11−2は第二のろ波器、11−3は第
三のろ波器、12はマイク検出部、13はマイク座標記
憶部、14はカメラ制御部、15は旋回台を含むカメ
ラ、16は音声信号送信部、17は映像信号送信部、1
8は多重化部、19−aはろ波器帯域設定部、20は周
波数分析部、21はろ波器帯域記憶部、22は多重分離
部である。
【0058】図面上での構成要素は図14と図13は同
じであるが、図14の構成が図13の構成と異なるの
は、更に相手側のカメラを制御する信号を多重化部で多
重して送出すると共に、相手側から送られてくるカメラ
の制御信号を多重分離部で分離してカメラ制御部に与え
て、相手側からの制御信号によって自分側のカメラを制
御できる構成にした点である。該送信又は受信するカメ
ラ制御信号は、カメラ制御部がカメラに対して出力する
パン信号とチルト信号と同じ信号形態であり、図14の
カメラ制御部は、図13以前のカメラ制御部に該受信し
たカメラ制御信号と自分が生成したカメラ制御信号とを
加減算する構成を備えたものである。
【0059】これによって、発言者がいる会議室でのカ
メラとマイクの配置がマイク座標記憶部での記憶内容と
食い違っていて、表示部に発言者が映らない場合に相手
側からカメラを制御して発言者が映るようにすることが
できる。このための構成がないと、発言者の発言を遮っ
て、発言者が映っていない旨を伝えるという無駄を行な
わなければならないのに対して、図14の構成は上記の
無駄をしないで済むという利点を有する。尚、三箇所以
上で会議をする場合に、複数箇所で同時にカメラ制御を
行なうこともありうる。これは、例えば、カメラをマニ
ュアル制御しているという信号を同時に送出し、その信
号を受けた側の表示部に表示するようにすれば容易に避
けることが可能になる。
【0060】最後に、上記においては、ろ波器、マイク
検出部、周波数分析部などは一貫してアナログ技術で実
現する例を示したが、デジタル技術によって実現するこ
とも可能で、本発明にはそれらにデジタル技術を適用す
る場合も当然包含される。
【0061】
【発明の効果】以上詳述した如く、本発明により、マイ
クロフォンに入力される様々な音声帯域信号の中から発
言音声を正確に判別して話者検出することが可能にな
る。又、話者検出をするためのろ波器の帯域を設定する
ことによって、会議の参加者の声の質の如何にかかわら
ず正確に話者検出することが可能になる。更に、この帯
域設定を自動的に行なうことも可能である。
【0062】上記の如き話者検出回路を適用したテレビ
会議装置においては、話者の方にカメラを向けるための
制御が安定化される。又、発言者が誰であるかを他の会
議室の参加者に知らせることも可能になる上、設定が悪
くて発言者がカメラに映っていない場合には他の会議室
からカメラを制御することも可能になり、テレビ会議の
進行を円滑にすることができる。
【図面の簡単な説明】
【図1】 本発明の話者検出回路。
【図2】 本発明のテレビ会議装置の第一の実施の形
態。
【図3】 ろ波器の構成例。
【図4】 マイク検出部の構成例。
【図5】 マイク座標記憶部の格納データの例。
【図6】 本発明のテレビ会議装置の第二の実施の形
態。
【図7】 ろ波器の帯域設定の例。
【図8】 本発明のテレビ会議装置の第三の実施の形
態。
【図9】 周波数分析部の構成例。
【図10】 ろ波器帯域判定部の構成例。
【図11】 本発明のテレビ会議装置の第四の実施の形
態。
【図12】 ろ波器帯域記憶部の格納データの例。
【図13】 本発明のテレビ会議装置の第五の実施の形
態。
【図14】 本発明のテレビ会議装置の第六の実施の形
態。
【図15】 従来の話者検出回路。
【図16】 従来の話者検出回路を適用したテレビ会議
装置。
【符号の説明】
10−1 第一のマイクロフォン(マイク1) 10−2 第二のマイクロフォン(マイク2) 10−3 第三のマイクロフォン(マイク3) 11−1 第一のろ波器(ろ波器1) 11−2 第二のろ波器(ろ波器2) 11−3 第三のろ波器(ろ波器3) 12 マイク検出部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 マイクロフォンに入力された音声帯域信
    号から特定の帯域の成分を取り出すろ波器と、 該ろ波器が出力する特定帯域の音声帯域信号のレベルを
    検出して、該音声帯域信号のレベルと所定の閾値とを比
    較するマイク検出部とを備え、 発言者の音声が入力されたマイクロフォンを特定するこ
    とを特徴とする話者検出回路。
  2. 【請求項2】 マイクロフォンに入力された音声帯域信
    号から特定の帯域の成分を取り出すろ波器と、該特定帯
    域の音声帯域信号のレベルと所定の閾値とを比較して発
    言者の音声が入力されたマイクロフォンを特定するマイ
    ク検出部よりなる話者検出回路を備え、 該話者検出回路が特定したマイクロフォンの方向にカメ
    ラを制御することを特徴とするテレビ会議装置。
  3. 【請求項3】 請求項2記載のテレビ会議装置であっ
    て、 音声帯域信号から特定の帯域の成分を取り出すろ波器の
    通過帯域を設定するろ波器帯域設定部を備えることを特
    徴とするテレビ会議装置。
  4. 【請求項4】 請求項2記載のテレビ会議装置であっ
    て、 マイクロフォンに入力された音声帯域信号の周波数成分
    を分析する周波数分析部と、 該周波数分析部の出力によってマイクロフォンに入力さ
    れた音声帯域信号の有効帯域を判定し、該判定結果によ
    って前記ろ波器の通過帯域を判定するろ波器帯域判定部
    とを備えることを特徴とするテレビ会議装置。
  5. 【請求項5】 請求項4記載のテレビ会議装置であっ
    て、 前記ろ波器帯域判定部が出力する帯域情報を格納し、話
    者検出回路が出力する検出信号を参照して格納されてい
    る帯域情報を読み出してろ波器の通過帯域を設定するろ
    波器帯域記憶部を備えることを特徴とするテレビ会議装
    置。
  6. 【請求項6】 請求項5記載のテレビ会議装置であっ
    て、 前記ろ波器帯域記憶部の格納データを相手側に送信する
    と共に、 相手側から受信した、相手側のろ波器帯域記憶部の格納
    データを表示部に表示することを特徴とするテレビ会議
    装置。
  7. 【請求項7】 請求項6記載のテレビ会議装置であっ
    て、 相手側のカメラを制御するカメラ制御信号を送信すると
    共に、 相手側から受信したカメラ制御信号によって自分側のカ
    メラを制御することを特徴とするテレビ会議装置。
JP7325612A 1995-12-14 1995-12-14 話者検出回路及びテレビ会議装置 Withdrawn JPH09163334A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7325612A JPH09163334A (ja) 1995-12-14 1995-12-14 話者検出回路及びテレビ会議装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7325612A JPH09163334A (ja) 1995-12-14 1995-12-14 話者検出回路及びテレビ会議装置

Publications (1)

Publication Number Publication Date
JPH09163334A true JPH09163334A (ja) 1997-06-20

Family

ID=18178816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7325612A Withdrawn JPH09163334A (ja) 1995-12-14 1995-12-14 話者検出回路及びテレビ会議装置

Country Status (1)

Country Link
JP (1) JPH09163334A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007116683A (ja) * 2002-03-27 2007-05-10 Marconi Intellectual Property (Ringfence) Inc 電気通信システム
WO2008047804A1 (fr) * 2006-10-17 2008-04-24 Yamaha Corporation Dispositif de conférence audio et système de conférence audio
WO2009044749A1 (ja) * 2007-10-01 2009-04-09 Yamaha Corporation 放収音装置
CN108920127A (zh) * 2018-06-26 2018-11-30 广州视源电子科技股份有限公司 目标音量阈值确定方法、装置、设备和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007116683A (ja) * 2002-03-27 2007-05-10 Marconi Intellectual Property (Ringfence) Inc 電気通信システム
JP4566177B2 (ja) * 2002-03-27 2010-10-20 エリクソン アーベー 電気通信システム
WO2008047804A1 (fr) * 2006-10-17 2008-04-24 Yamaha Corporation Dispositif de conférence audio et système de conférence audio
JP2008103824A (ja) * 2006-10-17 2008-05-01 Yamaha Corp 音声会議装置及び音声会議システム
WO2009044749A1 (ja) * 2007-10-01 2009-04-09 Yamaha Corporation 放収音装置
CN108920127A (zh) * 2018-06-26 2018-11-30 广州视源电子科技股份有限公司 目标音量阈值确定方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
US10499136B2 (en) Providing isolation from distractions
US9154730B2 (en) System and method for determining the active talkers in a video conference
CA1230666A (en) Acoustic direction identification system
US8477174B2 (en) Automatic video switching for multimedia conferencing
JP4255461B2 (ja) 電話会議用のステレオ・マイクロフォン処理
CA2874715C (en) Dynamic video and sound adjustment in a video conference
ES2327288T3 (es) Sistema, metodo y nodo para limitar el numero de flujos de audio en u teleconferencia.
US8614735B2 (en) Video conferencing
US20040254982A1 (en) Receiving system for video conferencing system
US20100085415A1 (en) Displaying dynamic caller identity during point-to-point and multipoint audio/videoconference
EP2005705B1 (en) System and method for enhanced teleconferencing security
JP4411959B2 (ja) 音声集音・映像撮像装置
US7081915B1 (en) Control of video conferencing using activity detection
US6959095B2 (en) Method and apparatus for providing multiple output channels in a microphone
JP2006254064A (ja) 遠隔会議システム、音像位置割当方法および音質設定方法
CN115209083A (zh) 一种多视频会议协同开会方法、终端及存储介质
JPH09163334A (ja) 話者検出回路及びテレビ会議装置
JP2017103641A (ja) 情報処理装置、会議システム、情報処理方法およびプログラム
KR20150042628A (ko) 분산 텔레프레즌스 서비스 제공 방법 및 장치
CN112735455A (zh) 声音信息的处理方法和装置
JPS6386686A (ja) テレビ会議システム
JP5783157B2 (ja) 情報処理装置、情報処理装置の制御方法、およびプログラム
WO2017211447A1 (en) Method for reproducing sound signals at a first location for a first participant within a conference with at least two further participants at at least one further location
JPH07226930A (ja) 通信会議システム
GB2623548A (en) Hybrid Teleconference platform

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030304