JPH0683391A

JPH0683391A - テレビ会議用発言音声検出装置

Info

Publication number: JPH0683391A
Application number: JP4236782A
Authority: JP
Inventors: Katsumi Kitajima; 克美北島
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1992-09-04
Filing date: 1992-09-04
Publication date: 1994-03-25
Anticipated expiration: 2016-09-25
Also published as: JP3211398B2

Abstract

(57)【要約】【目的】発言音声以外の雑音に反応することなく会議
参加者の発言にのみ反応して発言者を確実に特定し、多
地点テレビ会議を円滑に運営する。【構成】音声入力部２２でマイクロホンで集音された
音声信号をサンプリング入力し、予めデータ記憶部２３
に記憶したデータから自己相関係数を所定の一定区間毎
に演算部２４で算出する。この場合、算出区間が音声、
無音又は雑音であるかを判定し、この判定結果を画面切
り替え制御のための信号として、データ記憶部２５、デ
ータ出力部２６を通じて出力する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は多地点参加によるテレビ
会議を行う際の発言者を自動的にクローズアップして撮
影し、かつ、発言地点を切り替えて画面表示するテレビ
会議用発言音声検出装置に関する。

【０００２】

【従来の技術】従来、テレビ会議システムでは、発言者
の画面への切り替えを自動的に行っている。この切り替
えは、各会議用マイクロホンの出力信号や会議参加地点
からの受信音声信号から音声検出器で発言中の会議参加
者又は会議参加地点を判定し、その発言者をクローズア
ップして撮影するためにテレビカメラの電動旋回制御を
行う。さらに、切り替え器によって発言地点映像を切り
替えている。

【０００３】図１１は、このような映像自動切り替え装
置の構成を示している。図１２は、多地点テレビ会議シ
ステムの全体構成を示すブロック図である。

【０００４】図１１において、この例は、会議参加者
Ａ、Ｂ、Ｃに対して配置されるマイクロホン１ａ、１
ｂ、１ｃと、このマイクロホン１ａ、１ｂ、１ｃと接続
される音声検出器２ａ、２ｂ、２ｃと、発言者判定回路
３と、旋回台制御器４と、電動旋回式テレビカメラ５と
からなる。

【０００５】図１２において、この多地点テレビ会議シ
ステムは会議参加地点となる会議室Ｄ、Ｅ、Ｆに配置さ
れるマイクロホン６ａ、６ｂ、６ｃと、スピーカー７
ａ、７ｂ、７ｃと、テレビカメラ８ａ、８ｂ、８ｃとを
有している。

【０００６】さらに、モニタ９ａ、９ｂ、９ｃと、音声
コーディック（ＣＯＤＥＣ）回路１０ａ、１０ｂ、１０
ｃと、画像コーディック回路１１ａ、１１ｂ、１１ｃと
を備えている。

【０００７】多地点会議制御装置１８は、音声コーディ
ック回路１２ａ、１２ｂ、１２ｃと、画像コーディック
回路１３ａ、１３ｂ、１３ｃと、音声検出部１４ａ、１
４ｂ、１４ｃと、音声合成部１５と、発言地点判定部１
６と、画像切り替え制御部１７とからなる。

【０００８】次に、この構成の動作について説明する。
図１１において、会議参加者Ａから発言があると、音声
検出器２ａが音声を検出して、検出信号を発言者判定回
路３へ出力する。発言者判定回路３は、会議参加者Ｂ、
Ｃからの音声検出信号がなければ会議参加者Ａを発言者
と特定する。そして旋回台制御器４へ会議参加者Ａの発
言者位置情報を出力する。

【０００９】旋回台制御器４は、その位置情報に基づい
て電動旋回式テレビカメラ５を旋回させ、会議発言者Ａ
をクローズアップして撮影する。

【００１０】図１２において、会議室Ｄでの発言がある
と音声検出器１４ａが音声を検出して、検出信号を発言
地点判定部１６へ出力する。発言地点判定部１６は以前
の対話情報に基づいて画像切り替え制御部１７へ制御信
号を出力し、会議室Ｄの映像を会議室Ｅ又は会議室Ｆへ
送信する。また、会議室Ｄへは会議室Ｅ又は会議室Ｆの
映像を送信する。

【００１１】図１１中の音声検出器２ａ、２ｂ、２ｃや
図１２中の音声検出部１４ａ、１４ｂ、１４ｃでは、会
議中の様々な音源からの入力信号から音声区間を検出し
て、所定の一定時間が音声であると検出された場合に、
対応する会議参加者や会議室を発言中と判定する。この
場合、音声の検出には各マイクロホン又は各地点からの
入力音声から、その信号レベルや短時間エネルギーなど
を求め、所定のしきい値との比較を行い、しきい値以上
の区間を音声区間とし、その継続時間を累積して所定の
しきい値と比較する。ここでしきい値以上の場合に発言
であると判定している。

【００１２】次に、この音声検出動作を詳細に説明す
る。図１３は、従来の音声レベル検出を行うための検出
器の構成を示すブロック図である。図１４は、従来の継
続時間による判定動作を説明するための図である。

【００１３】図１３（ａ）において、この例は、ヒステ
リシス付き整流器を用いた検出器１９と、比較器２２と
からなり、検出器１９は入力信号の電圧ピークレベル
を、所定の時定数だけ保持して出力する。比較器２２で
は検出器１９の出力信号、判定しきい値を越える場合、
音声検出信号をオン（ＯＮ）として出力する。

【００１４】なお、検出器１９に代えて、図１３（ｂ）
に示す積分器２１、又は図１３（ｃ）に示す乗算器２０
ａ、加算器２０ｂ、遅延回路２０ｃの構成に置き換えて
音声の短時間パワーを出力するようにした検出器を用い
る場合もある。

【００１５】図１４において、図１４（ａ）は入力音声
信号波形であり、図１４（ｂ）は図１４（ａ）の信号を
レベル検出又はパワー検出した結果であり、図１４
（ｃ）は図１４（ｂ）のオン（ＯＮ）信号を時間的に累
積したものである。図１４（ｄ）は図１４（ｃ）の累積
時間をしきい値と比較し、その判定した結果である。

【００１６】図１４（ａ）においてＮａ−Ｎｂ区間は雑
音又は短い音声であり、Ｖａ−Ｖｂ区間は発言音声であ
る場合、図１４（ｄ）のように、Ｎａ−Ｎｂ区間は音声
としては検出されず、Ｖａ−Ｖｂ区間は音声として検出
される。

【００１７】

【発明が解決しようとする課題】しかしながら上記の従
来の音声レベル又はパワーのみによる音声検出では、継
続時間の短い雑音は無視できる。しかしながら継続時間
の長い雑音、例えば、会議資料の書類をめくる音や、机
をコツコツと叩く音、息吹き音等で誤って検出されるこ
とがある。その場合、発言していない会議参加者の映像
に切り替わったり、発言の最中にもかかわらず不要な雑
音のために他の会議参加者の映像に切り替わってしま
う。このような状況は会議の進行妨害と受け取られてい
る。

【００１８】本発明は、このような従来の課題を解決す
るものであり、発言音声以外の雑音に反応することなく
会議参加者の発言にのみ反応して発言者を確実に特定で
き、多地点テレビ会議の円滑な運営が可能になる優れた
テレビ会議用発言音声検出装置の提供を目的とする。

【００１９】

【課題を解決するための手段】上記目的を達成するため
に、本発明は、音声入力部と、データ記憶部と、有声音
判定パラメータの算出と判定を行う演算部と、データ出
力部とを備えるテレビ会議用発言音声検出装置であっ
て、演算部に、マイクロホンで集音された音声信号をサ
ンプリング入力する入力手段と、予め記憶したデータか
ら自己相関係数を所定の一定区間毎に算出する算出手段
と、算出区間が音声、無音又は雑音であるかを判定する
判定手段と、判定手段での判定結果を画面切り替え制御
のための信号として出力する出力手段とを備える構成で
ある。

【００２０】また、音声入力部と、データ記憶部と、有
声音判定パラメータの算出と判定を行う演算部と、デー
タ出力部とを備えるテレビ会議用発言音声検出装置であ
って、演算部に、マイクロホンで集音された音声信号を
サンプリング入力する入力手段と、予め記憶したデータ
から自己相関係数又は線形予測係数による有声音判定パ
ラメータを所定の一定区間毎に算出する算出手段と、パ
ラメータ算出区間が音声、無音又は雑音であるかを判定
する判定手段と、判定手段での判定結果を画面切り替え
制御のための信号として出力する出力手段とを備える構
成としている。

【００２１】さらに、音声入力部と、データ記憶部と、
有声音判定パラメータの算出と判定を行う演算部と、デ
ータ出力部とを備えるテレビ会議用発言音声検出装置で
あって、演算部に、マイクロホンで集音された音声信号
をサンプリング入力する入力手段と、予め記憶したデー
タから自己相関係数、線形予測係数又はＬＰＣケプスト
ラム係数による有声音判定パラメータを所定の一定区間
毎に算出する算出手段と、パラメータ算出区間が音声、
無音又は雑音かを判定する判定手段と、判定手段での判
定結果を画面切り替え制御のための信号として出力する
出力手段とを備える構成である。

【００２２】

【作用】このような構成によって、本発明のテレビ会議
用発言音声検出装置は、演算部での有声音判定パラメー
タによる総合判定によって、発言音声以外の雑音に反応
することなく会議参加者の発言にのみ反応して発言者を
確実に特定する。

【００２３】以下に、演算部において算出するそれぞれ
の有声音判定パラメータの、音声検出について説明す
る。

【００２４】先ず、自己相関係数について説明する。サ
ンプリングした音声データを、（Ｓ１、Ｓ２、…、Ｓ
ｎ）とすると、ｍ次の自己相関係数は、数式（１）のよ
うに表される。

【００２５】

【数１】

【００２６】ここで、ｍ＝｛０、１、２、…、１０｝、
ｎは１００〜２００程度とする。０次の自己相関係数
は、算出区間における音声の短時間パワーである。１か
ら３次の低次自己相関係数は、算出区間における音声の
高周波数帯域成分を除去したものとなり、６次から８次
の高次自己相関係数は、算出区間における音声の低周波
数帯域成分を除去したものとする。

【００２７】０次の自己相関係数を所定の適切なしきい
値と比較することによって、会議中の無音又は暗騒音状
態にある区間と、雑音又は音声が入力された区間を分類
することができる。

【００２８】次に、１から３次の低次自己相関係数があ
る適切なしきい値と比較することによって、その区間が
高周波数帯域成分を多く含む雑音区間であり音声区間で
はないと判断できる。また、６から８次の高次自己相関
係数をある適切なしきい値と比較することによって、そ
の区間が低周波数帯域成分を多く含む雑音区間であり音
声区間ではないと判断できる。

【００２９】このような０次や低次及び高次の自己相関
係数のしきい値判定結果がいずれも音声区間であると判
定された場合に限り、算出区間が音声区間であると決定
することによって、雑音を音声であると誤検出してしま
うのを防止することができる。次に、線形予測係数につ
いて説明する。

【００３０】線形予備係数を算出する方式は各種の方式
が知られているが、特にＰＡＲＣＯＲ方式がその演算高
速性から優れている。これは、先に説明した自己相関係
数をもとに算出される。この方式で求められるＰＡＲＣ
ＯＲ係数は、発声する際の声道の特徴をよく表現してお
り、有声、無声の分類・判定に適している。ここで求め
られる低次の線形予測係数は、音声をスペクトル分析し
たときの大まかな変化成分を示しており、演算量の多い
ＦＦＴなどの周波数分析を行わなくても、スペクトルの
形を知ることができ、有声音に対しては自己相関係数に
より判定よりも優れた判別ができる。

【００３１】すなわち、低次の線形予測係数をある適切
なしきい値と比較することによって、発言音声中の有声
音と無声音とを分類することができ、日本語のような音
韻では母音と子音とを判別することができる。日本語の
場合、音声単語中の大部分は母音が占めているので、母
音を多く含む音声区間の検出によって、発言音声である
かどうかの判定が可能である。

【００３２】次に、ＬＰＣケプストラム係数について説
明する。このパラメータの算出方式およびその詳細な説
明は他の文献に譲り省略することにするが、上記自己相
関係数や線形予測係数による音声係数において判別が困
難な音韻を補助的に検出するのに本パラメータが効果が
あることから、自己相関係数や線形予測係数などの有声
音判定パラメータと併せて用いることによって、音声検
出に有効な判定パラメータの一要素となる。

【００３３】

【実施例】以下、本発明のテレビ会議用発言音声検出装
置の実施例を図面を参照して詳細に説明する。

【００３４】図１は本発明のテレビ会議用発言音声検出
装置の構成を示している。なお、本テレビ会議用発言音
声検出装置が適用される多地点テレビ会議システムの全
体構成は従前の図１２に示す構成と同様である。

【００３５】図１において、このテレビ会議用発言音声
検出装置は、音声入力部２２と、データ記憶部２３と、
演算部２４と、データ記憶部２５と、データ出力部２６
とからなる。

【００３６】次に、この構成における動作について説明
する。音声入力部２２ではマイクロホンからの入力音声
信号を帯域制限し、サンプリングする。このサンプリン
グデータはデータ記憶部２３で格納される。データ記憶
部２５では、演算部で算出されたデータ又はしきい値、
係数などのデータを格納する。さらに、演算部２４でサ
ンプリング音声データから自己相関係数や線形予測係数
などの有声音判定パラメータを算出し、その算出パラメ
ータとしきい値との比較を行う。

【００３７】データ出力部２６では、判定結果を画面切
り替え制御するための検出信号として出力するともに、
算出パラメータを出力する。

【００３８】なお、マイクロホンからの音声入力ではな
く、従前の図１２に示した多地点会議システムにおける
音声コーディック回路からの音声信号出力を用いる場合
は、音声入力部２２は省略できる。

【００３９】次に、音声入力部２２、演算部２４、デー
タ出力部２６を詳細に説明する。図２は音声入力部２２
の詳細な構成を示すブロック図である。図２において、
この音声入力部２２は、マイクロホン２７と、増幅器２
８と、低域通過フィルタ（ＬＰＦ）２９と、Ａ／Ｄコン
バータ３０とを有している。

【００４０】次に、この構成の動作について説明する。
音声入力部２２では、マイクロホン２７からの入力音声
を増幅器２８に入力して増幅する。この増幅した音声信
号が低域通過フィルタ２９へ入力される。この低域通過
フィルタ２９は、サンプリングによるエイリアシングを
防止するためのものである。低域通過フィルタ２９の出
力信号は、Ａ／Ｄコンバータ３０によってサンプリング
され、次段のデータ記憶部２３（図３）へ供給される。

【００４１】ここではサンプリング周波数を１０ＫＨｚ
とし、パラメータ算出の一区間を２０ｍｓｅｃとする。
すなわち、サンプリングデータが２００ポイント格納さ
れるごとに自己相関係数などの有声音判定パラメータを
算出する。

【００４２】なお、従前の図１２に示した多地点会議シ
ステムにおける音声コーディック回路からの音声信号入
力の場合、サンプリング周波数が８ＫＨｚとなる。この
場合もパラメータ算出の一区間は２０ｍｓｅｃ程度で良
い。パラメータ算出区間については、有声音のピッチ周
期の存在範囲やパラメータ算出にかかる演算回数から考
慮して、１０〜３０ｍｓｅｃが適切である。

【００４３】サンプリングされた音声信号データ列は、
データ記憶部２３に格納される。データ記憶部２３で
は、自己相関係数算出時の乗算器への入力とするため、
サンプリングデータ列Ｘと、Ｘを複写したデータ列Ｙも
格納している。

【００４４】次に、図３は図１中の演算部２４の構成を
示すブロック図である。図３において、演算部２４は、
乗算器３３と、シフタ３４と、ＡＬＵ３５と、演算命令
部３６とから構成されている。

【００４５】ここでは、演算命令部３６より与えられる
積和演算や、比較、論理演算、データ転送などが行える
ようになっている。

【００４６】この演算部２４で算出されたパラメータ
は、データ記憶部２５に格納される。このデータ記憶部
２５には、有声音判定パラメータの算出に必要な係数デ
ータや、比較判定のためのしきい値データも格納されて
いる。

【００４７】図４、図５、図６に、演算部２４における
有声音判定パラメータの算出と判定処理を説明するため
の動作フローチャートを示し、図７は図４〜図６に示す
処理信号と、そのタイミングを示すタイミングチャート
である。

【００４８】図４は、請求項１に対応する音声判定処理
を示しており、自己相関の０次と１次及び７次の係数に
よるしきい値判定を行っている。また、図５では、請求
項２に対応する音声判定処理を示しており、自己相関の
０次と１次及び７次の係数と１次の線形予測係数による
しきい値判定を行っている。さらに、図６は請求項３に
対応する有声音判定処理を示しており、自己相関の０次
と１次及び７次の係数と１次の線形予測係数と３次のＬ
ＰＣケプストラム係数によるしきい値判定を行ってい
る。

【００４９】すなわち、０次の自己相関係数Ｒ０は、短
時間パワーＥｎであり、暗騒音レベルより少し高いレベ
ルに相当するしきい値Ｔｈ０と比較される。Ｒ０がしき
い値以上の区間は音声と判定される候補区間となり、以
降の判定処理に進む。Ｒ０がしきい値以下なら、その区
間は無音と判定される。

【００５０】１次と７次の自己相関係数Ｒ１、Ｒ７は、
それぞれ０次の自己相関係数により正規化し（Ｒ０＝
１．０とする）、しきい値判定に用いる。Ｒ７／Ｒ０が
しきい値Ｔｈ７（＝０．５〜０．７）以下である区間は
音声と判定される候補区間となる。また、Ｒ１／Ｒ０が
しきい値Ｔｈ１（＝０．６〜０．８）以上である区間は
音声と判定される候補区間となる。それ以外は、雑音区
間であり音声区間ではないと判定される。

【００５１】１次の線形予測係数は、しきい値Ｔｈα
（＝−１．０〜−０．６）と比較され、しきい値以下の
区間は有声音と判定される候補区間となる。３次のケプ
ストラム係数は、しきい値Ｔｈｃ（＝約０．５）と比較
され、しきい値以上の区間は、有声音と判定される候補
区間となる。

【００５２】図４、図５に示す音声判定処理では、各パ
ラメータの判定条件において、すべて満たされなければ
有声音と判定されないが、図６に示す音声判定処理で
は、有声音がより判定通過され易いように改善された判
定条件の組み合わせになっており、１次自己相関係数と
１次線形予測係数の各しきい値比較で検出されなかった
区間を、３次のＬＰＣケプストラム係数のしきい値比較
によって有声音と判定されるようにしている。

【００５３】図７において、図４〜図６での処理信号
と、そのタイミングでは、それぞれのパラメータの判定
結果によって、有声音又は雑音が音声としては検出され
ない様子と、音声に対する判定結果の違いを表わしてい
る。

【００５４】このように判定された結果は、図１に示す
のデータ記憶部２５格納された後に、データ出力部２６
から読み出される。

【００５５】図８は図１中のデータ出力部２６の構成を
示すブロック図であり、このデータ出力部２６、ヒステ
リシス回路３９と、ラッチ回路４０とからなる。

【００５６】図９は図１中のデータ出力部２６のヒステ
リシス回路３９の動作を示すフローチャートであり、図
１０は、このデータ出力部２６での処理手順を示すタイ
ミングチャートである。

【００５７】図８、図９、図１０において、ヒステリシ
ス回路３９では、データ記憶部２５から２０ｍｓｅｃご
とに読み出される有声音判定データを、過去２００ｍｓ
ｅｃを１０フレームとする検出区間で通算し、有声音と
判定されたフレーム数Ｃｏｕｎｔ１を得る。

【００５８】ここで、今回の検出区間において、音声区
間から非音声区間への検出を行うか否かと、非音声区間
から音声区間への検出を行うか否かを、前回の判定結果
により決定する。前回音声と判定されなかった場合は、
Ｃｏｕｎｔ１と音声区間の開始点を検出するためのしき
い値Ｔｈｏｎ（図１０中、Ｔｈｏｎ＝５）を比較し、し
きい値以上なら音声区間の開始であり、音声区間検出信
号をオン（ＯＮ）とする。しきい値以下なら、非音声区
間の継続とする。また、前回音声と判定された場合は、
Ｃｏｕｎｔ１と音声区間の終了点を検出するためのしき
い値Ｔｈｏｆｆ（図１０中、Ｔｈｏｆｆ＝２）を比較
し、しきい値以上なら、音声区間の継続とする。しきい
値以下なら、しきい値を下回った回数Ｃｏｕｎｔ２に１
を加算し、そのＣｏｕｎｔが所定のしきい値ＴｈＨＯＬ
Ｄになるまでは音声区間を延長する。Ｃｏｕｎｔ２がＴ
ｈＨＯＬＤ（図１０中、ＴｈＨＯＬＤ＝１０）に一致し
たら、音声区間の終了とし、音声区間検出信号をオフ
（ＯＦＦ）とする。

【００５９】このように、発言音声区間の開始と終了に
対して、それぞれ異なるしきい値との比較動作を行うこ
とによって、音声区間検出信号にヒステリシス特性を持
たせ、画面切り替え制御のための検出信号として出力し
ている。

【００６０】図８に示すラッチ回路４０は、各検出区間
において算出された有声音判定パラメータを一時的に保
持しており、外部からそのデータを読み出すことができ
る。

【００６１】このデータは、従前に示した図１１中の発
言者判定器３や、同様に従前に示した図１２中の発言地
点判定部１６で読み出され、複数の発言者あるいは発言
地点が検出された場合に、その各々のデータを参照し、
比較することによって、競合した状態から唯一の発言者
又は発言地点を決定するために利用することができる。
例えば、隣接した２〜３本のマイクロホンに、同じ音声
が飛び込んで入力され、同時に音声検出されたときに
は、有声音判定パラメータ中の１つであったＲ０の０次
の自己相関係数、すなわち、短時間パワーをそれぞれ比
較すれば、その値が続けて最も大きいものを真の発言者
と判定することができる。

【００６２】また、その値の大小関係が切り替わるとき
は、別々の発言が行われていると判断し、その他の条件
で発言者を決定するような処理をとることが出来る。又
は別のパラメータを出力し、同一発言による競合か、別
々の発言による競合かを判定させることもできる。

【００６３】

【発明の効果】以上の説明から明らかなように、本発明
のテレビ会議用発言音声検出装置は、サンプリングした
音声データを、一定区間毎に蓄積格納し、自己相関係数
や線形予測係数などを算出し、それぞれしきい値判定し
て有声音か無音又は無声音かを検出してヒステリシス特
性を持つ音声検出区間信号を出力しているため、発言音
声以外の雑音に反応することなく会議参加者の発言にの
み反応して発言者を確実に特定でき、多地点テレビ会議
の円滑な運営が可能になるという効果を有する。

【図面の簡単な説明】

【図１】本発明のテレビ会議用発言音声検出装置の実施
例における構成を示すブロック図

【図２】実施例の説明に供され、図１中の音声入力部の
詳細な構成を示すブロック図

【図３】実施例の説明に供され、図１中の演算部の構成
を示すブロック図

【図４】実施例の動作説明に供され、図１中の演算部に
おける有声音判定パラメータの算出と判定処理を示すフ
ローチャート

【図５】実施例の動作説明に供され、図１中の演算部に
おける他の有声音判定パラメータの算出と判定処理を示
すフローチャート

【図６】実施例の動作説明に供され、図１中の演算部に
おける、さらに他の有声音判定パラメータの算出と判定
処理を示すフローチャート

【図７】実施例の動作説明に供され、演算部における処
理信号と、そのタイミングを示すタイミングチャート

【図８】実施例の説明に供され、データ出力部の構成を
示すブロック図

【図９】実施例の動作説明に供され、データ出力部にお
けるヒステリシス回路の動作を示すフローチャート

【図１０】実施例の動作説明に供され、データ出力部で
の処理手順を示すタイミングチャート

【図１１】従来例における映像自動切り替え装置の構成
を示すブロック図

【図１２】従来例の多地点テレビ会議システムの全体構
成を示すブロック図

【図１３】従来例の説明に供され、音声レベル検出を行
うための検出器の構成を示すブロック図

【図１４】従来例の動作説明に供され、継続時間による
判定動作を説明するための説明図

【符号の説明】

２２音声入力部２３データ記憶部２４演算部２５データ記憶部２６データ出力部２７マイクロホン２８増幅器２９低域通過フィルタ（ＬＰＦ）３０Ａ／Ｄコンバータ３３乗算器３４シフタ３５ＡＬＵ３６演算命令部３９ヒステリシス回路４０ラッチ回路

Claims

【特許請求の範囲】

【請求項１】音声入力部と、データ記憶部と、有声音
判定パラメータの算出と判定を行う演算部と、データ出
力部とを備えるテレビ会議用発言音声検出装置であっ
て、上記演算部に、マイクロホンで集音された音声信号
をサンプリング入力する入力手段と、予め記憶したデー
タから自己相関係数を所定の一定区間毎に算出する算出
手段と、上記算出区間が音声、無音又は雑音であるかを
判定する判定手段と、上記判定手段での判定結果を画面
切り替え制御のための信号として出力する出力手段とを
備えることを特徴とするテレビ会議用発言音声検出装
置。
【請求項２】音声入力部と、データ記憶部と、有声音
判定パラメータの算出と判定を行う演算部と、データ出
力部とを備えるテレビ会議用発言音声検出装置であっ
て、上記演算部に、マイクロホンで集音された音声信号
をサンプリング入力する入力手段と、予め記憶したデー
タから自己相関係数又は線形予測係数による有声音判定
パラメータを所定の一定区間毎に算出する算出手段と、
上記パラメータ算出区間が音声、無音又は雑音であるか
を判定する判定手段と、上記判定手段での判定結果を画
面切り替え制御のための信号として出力する出力手段と
を備えることを特徴とするテレビ会議用発言音声検出装
置。
【請求項３】音声入力部と、データ記憶部と、有声音
判定パラメータの算出と判定を行う演算部と、データ出
力部とを備えるテレビ会議用発言音声検出装置であっ
て、上記演算部に、マイクロホンで集音された音声信号
をサンプリング入力する入力手段と、予め記憶したデー
タから自己相関係数、線形予測係数又はＬＰＣケプスト
ラム係数による有声音判定パラメータを所定の一定区間
毎に算出する算出手段と、上記パラメータ算出区間が音
声、無音又は雑音かを判定する判定手段と、判定手段で
の判定結果を画面切り替え制御のための信号として出力
する出力手段とを備えることを特徴とするテレビ会議用
発言音声検出装置。