JPH09163333A - 音声遅延制御装置 - Google Patents

音声遅延制御装置

Info

Publication number
JPH09163333A
JPH09163333A JP7316997A JP31699795A JPH09163333A JP H09163333 A JPH09163333 A JP H09163333A JP 7316997 A JP7316997 A JP 7316997A JP 31699795 A JP31699795 A JP 31699795A JP H09163333 A JPH09163333 A JP H09163333A
Authority
JP
Japan
Prior art keywords
signal
delay
image
audio
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7316997A
Other languages
English (en)
Inventor
Shigeki Orito
隆樹 折戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7316997A priority Critical patent/JPH09163333A/ja
Publication of JPH09163333A publication Critical patent/JPH09163333A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Details Of Television Systems (AREA)

Abstract

(57)【要約】 【課題】 音声信号が途中で途切れることなく送信側及
び受信側の双方の対話状態における違和感を解消し、映
し出される画像に合わせて適切な音声遅延制御を可能と
する。 【解決手段】 音声遅延制御装置1の無音状態検出部4
は送信音声信号の無音状態もしくは小音量状態を検出
し、無音状態検出部5は受信音声信号の無音状態もしく
は小音量状態を検出する。対話状態検出部7は無音状態
検出部4,5各々からの無音状態検出信号を基に送信側
及び受信側双方の対話状態を検出する。画像動き検出部
6は送信画像信号の画像が静止状態にあるか否かを検出
する。遅延制御タイミング制御部3は無音状態検出部4
と画像動き検出部6と対話状態検出部7とからの出力信
号を基に音声信号に対する遅延のオン/オフ制御信号を
生成し、音声遅延回路2の動作を制御する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声遅延制御装置に
関し、特に音声信号と画像信号とを同時に送受信して遠
隔地間の通信を行うテレビ会議システムにおいて符号化
/復号化遅延量の異なる音声信号と画像信号との同期を
とるための音声信号遅延(リップシンク)の付加方法に
関する。
【0002】
【従来の技術】従来、この種のテレビ会議システムにお
いては、符号化した音声信号及び画像信号をISDN
(Integrated Services Digi
talNetwork)回線やLAN(Local A
rea Network)を経由して送受信している。
【0003】これら音声信号及び画像信号においては、
一般的に符号化/復号化遅延量が互いに異なることが多
い。この符号化/復号化遅延量の違いをそのままにして
音声信号及び画像信号を送信すると、受信側で再生され
た音声信号と画像信号との間に時間差が生じる。
【0004】特に、画像として相手の顔が映し出されて
いる場合等には、映し出された画像における唇の動きと
再生された音声との間に時間的なずれが現れ、その映し
出された画像及び再生された音声を受ける側に不自然な
感覚を生じさせてしまう。
【0005】通常、画像信号の符号化/復号化遅延量の
方が音声信号の符号化/復号化遅延量よりも大きいの
で、音声信号の符号化時あるいは復号化時に適切な信号
遅延を音声信号に加えることで、受信側での再生音声信
号と再生画像信号との同期をとることができ、自然な再
生画像を得ることができる。上記の音声信号に信号遅延
を加えて画像信号との同期をとる手法はリップシンクと
呼ばれている。
【0006】上記のリップシンク技術を用いたものとし
ては、特開昭62−266959号公報に開示された技
術がある。この技術では、画像コーデックの処理時間と
音声コーデックの処理時間との差を検出し、処理時間の
短い方のコーデックの符号化部のデータ出力または復号
化部のデータ出力を処理時間の差だけ遅らせることで、
音声信号と画像信号との整合を図るものである。
【0007】その場合、画像コーデックと音声コーデッ
クとに夫々テストデータを与え、これが符号化/復号化
されて出力された信号のタイミング差を検出して音声信
号の出力遅延時間を自動設定する構成をとっている。
【0008】また、特開昭63−187786号公報に
開示された技術では、復号化された画像信号のデータ発
生量に基づいて、画像信号及び音声信号の整合に必要な
音声信号の遅延時間を求め、その遅延時間だけ音声信号
を遅延させることで画像信号と音声信号とのずれを取り
除くようにしている。
【0009】上記の音声信号と画像信号との整合を図る
方法では、いずれも画像信号と音声信号との時間的ずれ
を取り除き、自然な再生画像を得ることを目的としてい
るが、音声信号に常時時間遅延をかけているため、双方
向の音声画像通信を行うテレビ会議システム等では対話
を行う場合に相手側の声が常に遅れて聞こえることとな
り、間延びしたような違和感を与えることがある。
【0010】この問題を解決する方法としては、送信側
及び受信側の双方が対話に入ったことを検出し、その検
出期間だけ音声信号に対して時間遅延を加えないように
する方法が考えられる。
【0011】特開昭63−018788号公報に開示さ
れた技術では上記の問題を解決するために、通常、音声
信号が一方向的に流れている時には音声信号に対して時
間遅延を加えるが、音声信号が反対方向に流れ始めたこ
とを検出した時には送信側及び受信側の双方の対話が始
まったと考え、音声信号に対して加える時間遅延を小さ
くするよう制御している。これによって、送信側及び受
信側の双方の対話時に相手の声が遅れて聞こえるという
間延び感を和らげることができる。
【0012】
【発明が解決しようとする課題】上述した従来の音声遅
延制御方法では、音声信号に常時時間遅延をかけて画像
信号と音声信号との時間的ずれを取り除き、自然な再生
画像を得ているが、例えば双方向の音声画像通信を行う
テレビ会議システム等において送信側及び受信側の双方
が対話を行う場合、相手側の声が常に遅れて聞こえるこ
ととなり、間延びしたような違和感を与えることがあ
る。
【0013】また、上記の問題を解決するために、音声
信号が反対方向に流れ始めたことを検出した時に音声信
号に対する時間遅延を小さくするよう制御することで、
送信側及び受信側の双方の対話時に相手の声が遅れて聞
こえるという間延び感を和らげているが、音声信号に対
して加える時間遅延を小さくする場合の切替えタイミン
グが考慮されていない。
【0014】そのため、相手側端末が話中に音声信号に
対する時間遅延を突然小さくすると、音声信号が一瞬途
切れたようになり、相手の声を聞いている者に違和感を
与えることがある。また、音声信号に対する時間遅延を
小さくしてから一定時間が経過すると、再度音声信号に
対する時間遅延を大きくするが、この切替えタイミング
についても考慮されていないため、音声信号に対する時
間遅延が突然切替わることがあり、その時にも音声信号
が一瞬途切れたようになる。
【0015】いずれの場合も、音声信号がどちらの方向
から流れているかに応じて音声信号に対する時間遅延の
遅延量を切替えているので、ある一定の時間(数秒程
度)を経た後でないと、送信側及び受信側の双方の対話
状態の変化が掴みにくく、状態変化への追従性が悪くな
ることによる違和感を解消することができない。
【0016】そこで、本発明の目的は上記の問題点を解
消し、音声信号が途中で途切れることなく送信側及び受
信側の双方の対話状態における違和感を解消することが
でき、映し出される画像に合わせて適切な音声遅延制御
を行うことができる音声遅延制御装置を提供することに
ある。
【0017】
【課題を解決するための手段】本発明による第1の音声
遅延制御装置は、送信音声信号及び送信画像信号を符号
化して送信するテレビ会議システムの音声遅延制御装置
であって、前記送信音声信号を予め設定された所定時間
遅延する遅延手段と、前記送信音声信号を監視して前記
送信音声信号において予め設定された所定レベル以下の
状態が一定時間以上連続することを検出する送信音声無
音検出手段と、前記送信画像信号における画像の静止状
態を検出する画像動き検出手段と、受信した音声信号を
監視して受信音声信号が前記所定レベル以下の状態が前
記一定時間以上連続することを検出する受信音声無音検
出手段と、前記送信音声無音検出手段の検出結果及び前
記受信音声無音検出手段の検出結果に基づいて送信側と
受信側との対話状態を検出する対話状態検出手段と、前
記送信音声無音検出手段の検出結果と前記画像動き検出
手段の検出結果と前記対話状態検出手段の検出結果とを
基に前記遅延手段による前記送信音声信号の遅延を制御
する遅延制御手段とを備えている。
【0018】本発明による第2の音声遅延制御装置は、
上記の構成において、前記遅延制御手段が、前記送信音
声信号の遅延を行う時の遅延時間量を保持する第1の保
持手段と、前記送信音声信号の遅延を解除した時の遅延
時間量を保持する第2の保持手段と、前記送信音声信号
の遅延及びその解除の切替えに応じて前記第1の保持手
段に保持された遅延時間量と前記第2の保持手段に保持
された遅延時間量とのうち一方によって前記送信音声信
号の遅延を制御する手段とを具備している。
【0019】本発明による第3の音声遅延制御装置は、
上記の構成において、前記画像動き検出手段が、前記送
信画像信号の符号化時に検出される前記画像の動き量を
基に前記画像の動き及び静止状態を検出する手段を具備
している。
【0020】本発明による第4の音声遅延制御装置は、
上記の構成において、前記画像動き検出手段が、前記テ
レビ会議システムで用いられるテレビカメラの向きが予
め設定された一定角度となった時に前記画像が静止状態
であることを示す信号を出力する手段を具備している。
【0021】本発明による第5の音声遅延制御装置は、
上記の構成において、前記遅延制御手段が、前記画像動
き検出手段で前記画像の静止状態が検出された時及び前
記対話状態検出手段で前記対話状態が検出された時のう
ちのいずれかの場合に前記遅延手段による前記送信音声
信号の遅延を解除するよう構成されている。
【0022】本発明による第6の音声遅延制御装置は、
上記の構成において、前記遅延制御手段は、前記送信音
声無音検出手段で前記送信音声信号における前記所定レ
ベル以下の状態が一定時間以上連続することを検出した
時に前記遅延手段による前記送信音声信号の遅延及びそ
の解除の切替えを行うよう構成されている。
【0023】
【発明の実施の形態】まず、本発明の作用について以下
に述べる。
【0024】画像動き検出部は送信する画像の中の動き
成分の有無を検出し、画像の動きが小さいことを検出す
ると、音声信号に対する時間遅延を解除するための状態
信号を出力する。
【0025】無音状態検出部では話者音声の切れ目を検
出し、その検出タイミングで音声信号に対する時間遅延
の付加及びその解除を切替えるようなタイミング制御信
号を生成する。そのために、入力音声信号レベルを監視
し、一定時間の無音もしくは小音量状態が続いた場合に
制御信号を出力する。
【0026】対話検出部では送信側及び受信側に夫々対
応して設けられた無音状態検出部からの制御信号に基づ
いて送信側及び受信側双方の対話状態を検出し、対話状
態検出信号を出力する。
【0027】音声遅延制御部では画像動き検出部からの
状態信号または対話検出部からの対話状態検出信号によ
って音声信号に対する時間遅延を付加(オン)するか、
あるいは解除(オフ)するかを決定し、無音状態検出部
からのタイミング制御信号と併せて送出する音声信号に
所定時間の遅延を加える。
【0028】上記の各部を配設することによって、映し
出された画面の内容に応じて適切に音声信号に対する時
間遅延を制御し、より自然に相手の音声の間延び感を和
らげることが可能となる。
【0029】よって、音声信号が途中で途切れることな
く送信側及び受信側の双方の対話状態における違和感を
解消することが可能となり、映し出される画像に合わせ
て適切な音声遅延制御を行うことが可能となる。
【0030】次に、本発明の一実施例について図面を参
照して説明する。図1は本発明の一実施例の構成を示す
ブロック図である。図においては、音声信号と画像信号
とを相互通信するテレビ会議システムの送信系及び受信
系の回路の一構成例を示している。
【0031】マイクロホン等(図示せず)によって入力
される音声信号(Audio in)は音声信号増幅回
路9で増幅された後に、A/D(アナログ/ディジタ
ル)変換回路11でディジタル信号に変換されて音声遅
延制御装置1に入力される。
【0032】ディジタル信号に変換された音声信号は音
声遅延制御装置1の音声遅延回路2で適当な時間遅延が
付加され、音声符号化部(Audio Encode
r)13で符号化処理が施される。
【0033】一方、テレビカメラ(図示せず)によって
入力された画像信号(Videoin)は画像信号増幅
回路10で増幅された後に、A/D変換回路12でディ
ジタル信号に変換され、画像符号化部(Video E
ncoder)8で符号化処理が施される。
【0034】ここで、画像符号化部8は動き検出回路
(ME)81と、量子化プロセッサ(QP)82と、デ
ィジタル信号処理プロセッサ(DSP)83と、可変ラ
ンレングス符号化回路(V.L.Enc.)84とから
構成されている。
【0035】音声符号化部13で符号化処理が施された
音声信号及び画像符号化部8で符号化処理が施された画
像信号は音声・画像多重化回路(MPX)14で多重化
され、通信回線インタフェース回路(ISDN I/
F)15を通して通信回線(ISDN Line)(図
示せず)に送出され、受信側のテレビ会議システム(図
示せず)に送信される。
【0036】受信側のテレビ会議システムから送信され
てきた音声信号及び画像信号は通信回線インタフェース
回路15を通して音声・画像多重化回路14に入力さ
れ、音声・画像多重化回路14で音声信号と画像信号と
に分離される。
【0037】音声・画像多重化回路14で分離された音
声信号は音声復号化部(AudioDecoder)1
6で復号化処理が施された後に、D/A(ディジタル/
アナログ)変換回路18でアナログ信号に変換され、音
声信号増幅回路20で増幅されて再生音声信号(Aud
io Out)としてスピーカ等(図示せず)に出力さ
れる。
【0038】音声・画像多重化回路14で分離された画
像信号は画像復号化部(VideoDecoder)1
7で復号化処理が施された後に、D/A変換回路19で
アナログ信号に変換され、画像信号増幅回路21で増幅
されて再生画像信号(Video Out)としてモニ
タ等(図示せず)に出力される。
【0039】音声遅延制御装置1は受信側のテレビ会議
システムに送信する符号化音声信号に対する時間遅延の
オン/オフ制御を行う。音声信号に対する時間遅延の制
御は送信側及び受信側双方の対話状態と送信する画像信
号の画面の動きの状態とに応じて行われる。
【0040】すなわち、音声遅延制御装置1は送信側及
び受信側双方の対話状態と送信する画像信号の画面の動
きの状態とに応じて音声信号に対して時間遅延を付加す
るかあるいは解除するかを決定する。その場合、音声遅
延制御装置1における時間遅延の付加及び解除の制御は
入力された音声信号の中に無音状態が発生したタイミン
グに同期させて行われる。
【0041】ここで、音声遅延制御装置1は音声遅延回
路2と、音声遅延タイミング制御部3と、送信側の無音
状態検出部4と、受信側の無音状態検出部5と、画像動
き検出部6と、対話状態検出部7とから構成されてい
る。
【0042】音声遅延制御装置1は相手方に送信する符
号化音声信号への遅延のオン/オフ制御を行っており、
送信側及び受信側双方の対話状態と送信する画像信号の
画面の動きの状態とから音声信号を遅延するか否かを決
定している。これに加えて、音声遅延制御装置1では入
力された音声信号の中に無音状態が発生したタイミング
に同期させて音声信号に対する遅延のオン/オフを行う
よう動作する。
【0043】すなわち、無音状態検出部4はディジタル
信号に変換された送信音声信号から音声の無音状態もし
くはある一定レベル以下の小音量状態を検出し、無音状
態もしくは小音量状態を検出した時のタイミングでトリ
ガ信号を発生する。
【0044】また、無音状態検出部5は無音状態検出部
4と同一の回路構成であり、受信音声信号の無音状態も
しくは小音量状態を検出し、無音状態もしくは小音量状
態を検出した時のタイミングでトリガ信号を発生する。
【0045】対話状態検出部7は無音状態検出部4,5
各々からの無音状態検出信号(トリガ信号)を基に送信
側及び受信側双方の対話状態の検出を行い、送信側及び
受信側双方の対話状態を検出した時にトリガ信号を発生
する。
【0046】画像動き検出部6は画像符号化部8の動き
検出回路81からの情報を基に入力されている画像が動
いているかあるいは静止しているかを判定し、静止して
いると判定すると遅延オン信号を出力する。
【0047】遅延制御タイミング制御部3では無音状態
検出部4と画像動き検出部6と対話状態検出部7とから
の出力信号から音声信号に対する遅延のオン/オフ制御
信号を生成し、音声遅延回路2の動作を制御する。
【0048】図2は図1の音声遅延回路2の構成を示す
ブロック図である。図において、音声遅延回路2はA/
D変換回路11でディジタル信号に変換された音声信号
に時間遅延を付加するためにラインメモリ(Line
Memory)2aを使用している。
【0049】音声信号データ(Audio Data
In)の書込み/読出しは書込みクロック端子(WC
K)/読出しクロック端子(RCK)に入力されるデー
タサンプリングクロック(Data Sampline
Clock)に同期して行われる。
【0050】ライトリセット(Write Rese
t)/リードリセット(Read Reset)信号は
夫々音声信号データの書込み/読出し開始のタイミング
をラインメモリ2aに通知するために使用される。
【0051】ここで、リードリセット信号を与えるタイ
ミングを、ライトリセット信号が与えられるタイミング
より遅らせることで、遅らせた分だけ時間遅延が与えら
れた音声信号データ(Audio Data Out)
が出力される。
【0052】図3は図1の音声制御タイミング制御部3
の構成を示すブロック図である。図において、音声制御
タイミング制御部3はレジスタ(Reg)31,32
と、オア(OR)回路33と、セレクタ(Select
or)回路34と、フリップフロップ(D・F/F)
(以下、F/Fとする)回路35と、カウンタ(Dow
nCounter)回路36とから構成され、音声遅延
回路2のラインメモリ2aに対する書込み/読出し開始
タイミング信号を生成している。
【0053】オア回路33とF/F回路35は音声信号
遅延オン/オフ切替え信号を生成している。画像の中の
動き成分が含まれていることを示す動き検出信号(Mo
tion Estimation)と対話状態検出信号
(ConversationDetect)とのうちの
いずれかが入力したことをオア回路33によって知り、
これを無音状態検出部4からの無音状態検出信号(Au
dio Mute)が現れるタイミングでF/F回路3
5に保持し、音声信号遅延オン/オフ切替え信号として
セレクタ回路34に送る。
【0054】レジスタ31,32は夫々音声信号に対す
る遅延をオン/オフする際の遅延時間量を、データサン
プリングクロック(Data Sampline Cl
ock)のカウント数として保持している。これらの値
はF/F回路35からの音声信号遅延オン/オフ切替え
信号によってセレクタ回路34で選択され、カウンタ回
路36に格納される。
【0055】カウンタ回路36ではまず無音状態検出信
号が現れるタイミングでセレクタ回路34からの遅延時
間量を初期値として格納し、データサンプリングクロッ
クによって減算カウントを行う。
【0056】カウンタ回路36はカウント値が“0”に
なると、リードリセット(ReadReset)信号を
音声遅延回路2に出力する。また、音声遅延回路2への
ライトリセット(Write Reset)信号は無音
状態検出部4からの無音状態検出信号がそのまま出力さ
れる。
【0057】尚、音声遅延タイミング制御部3において
は送信する画像の中の動き成分の有無に応じて音声遅延
のオン/オフを制御しているが、映し出された画面の内
容に応じて適切に音声遅延を制御するために、予め動き
成分がないことが判明している机上の書類等を映す方向
へのカメラの向きの変化を検出するカメラ位置検出手段
(図示せず)からの検知信号に基づいて音声遅延のオン
/オフを制御することも可能である。
【0058】ここで、カメラ位置検出手段はカメラの上
下方向への移動を示す信号と現在位置からの相対移動量
を示す信号とから生成したカメラ絶対座標位置が予め設
定された設定位置よりも下向きを示す時に、つまり予め
動き成分がないことが判明している机上の書類等を映す
方向に変化した時にカメラ位置検出信号を出力するもの
である。
【0059】図4は図1の無音状態検出部4の構成を示
すブロック図である。図において、無音状態検出部4は
レジスタ(Reg)41,44と、比較回路(Comp
arator)42,45と、カウンタ(Counte
r)回路43とから構成されている。
【0060】無音状態検出部4では入力した音声信号デ
ータ(Audio Data In)(A)がレジスタ
41に予め設定されたレベル値(B)以下になったこと
(A<B)が比較回路42で検出されると、その検出信
号の出力タイミングを契機としてカウンタ回路43がカ
ウント動作を開始する。
【0061】比較回路45ではカウンタ回路43の出力
データ(A)がレジスタ44に予め設定されたカウント
数(B)以上(A>B)になると、その旨を示す検出信
号が無音状態検出信号(Audio Mute)として
音声遅延タイミング制御部3と対話状態検出部7とに出
力される。
【0062】カウンタ回路43は音声信号データがレジ
スタ41に予め設定されたレベル値以上になると、つま
り無音状態が解消されたことが比較回路42で検出され
るといつでもリセットされ、カウント動作を停止する。
【0063】これによって、無音状態にある期間がレジ
スタ44に設定されたカウント数に満たない場合には無
音状態検出信号を出力しないようにしている。尚、図示
していないが、無音状態検出部5は図4に示す無音状態
検出部4の構成と同一の回路構成となっており、受信音
声信号の無音状態の検出を行っている。
【0064】図5は図1の画像動き検出部6の構成を示
すブロック図である。図において、画像動き検出部6は
加算(ACC)回路61と、レジスタ(Reg)62,
63と、比較回路(Comparator)64とから
構成されている。
【0065】画像動き検出部6は画像符号化部8の動き
検出回路81からの画像符号化残差信号(Pictur
e Motion)を受け、その画像符号化残差信号を
加算回路61でピクセルクロック(Pixel Clo
ck)によって1フレーム分加算し、加算結果を垂直同
期信号(VSYNC)に同期してレジスタ62に保持す
る。尚、加算回路61は垂直同期信号によってリセット
される。
【0066】比較回路64はレジスタ62に保持されて
いる加算結果とレジスタ63に予め設定されている画像
動き量とを比較し、加算結果が画像動き量よりも小さけ
れば、その画像フレームに動きがないと判断し、画像静
止信号(Motion Estimation)を出力
する。
【0067】図6は図1の対話状態検出部7の構成を示
すブロック図である。図において、対話状態検出部7は
送信側音声処理部71と、受信側音声処理部72と、オ
ア(OR)回路73とから構成されている。
【0068】送信側音声処理部71はダウンカウンタ
(Down Counter)回路71aと、レジスタ
(Reg)71bと、アンド(AND)回路71cとか
ら構成されている。尚、図示していないが、受信側音声
処理部72は送信側音声処理部71の構成と同一の回路
構成となっている。
【0069】送信側音声処理部71ではカウンタ回路7
1aが無音状態検出部4からの無音状態検出信号[Au
dio Mute(Snd)]を契機にレジスタ71b
に設定された所定値がセットされ、データサンプリング
クロック(Data Sampline Clock)
によって所定値に対するダウンカウント動作を開始す
る。
【0070】アンド回路71cでは無音状態検出部4か
らの無音状態検出信号とカウンタ回路71aの出力デー
タとの論理積をとり、その演算結果を送信側が音声信号
を出力している期間として出力する。
【0071】上記の送信側音声処理部71の処理と同様
に、受信側音声処理部72では無音状態検出部5からの
無音状態検出信号[Audio Mute(Rcv)]
を契機に所定値がセットされ、データサンプリングクロ
ック(Data Sampline Clock)によ
って所定値に対するダウンカウント動作が行われ、無音
状態検出部5からの無音状態検出信号とカウンタ値との
論理積の演算結果を受信側が音声信号を出力している期
間として出力する。
【0072】オア回路73は送信側音声処理部71及び
受信側音声処理部72各々からの出力信号の論理和をと
り、その演算結果を対話状態検出信号(Convers
ation Detect)として出力する。
【0073】つまり、無音状態検出部4からの無音状態
検出信号が音声信号の出力を示しかつ無音状態検出部5
からの無音状態検出信号が音声信号の出力を示すことを
検出した時に、対話状態検出部7から対話状態検出信号
が出力される。
【0074】このように、送信音声信号において予め設
定された所定レベル以下の状態が一定時間以上連続した
かどうかを示す無音状態検出部4の検出結果と、受信音
声信号が所定レベル以下の状態が一定時間以上連続した
かどうかを示す無音状態検出部5の検出結果とに基づい
て送信側と受信側との対話状態を対話状態検出部7で検
出した時に音声遅延回路2による送信音声信号の遅延の
解除を音声遅延タイミング制御回路3で制御することに
よって、送信側及び受信側の双方の対話状態における違
和感を解消することができる。
【0075】また、送信画像信号における画像の静止状
態を検出する画像動き検出部6の検出結果に基づいて音
声信号に対する遅延のオン/オフを行うことによって、
音声信号に対する遅延を利用シーンに合わせて適切に行
うことができる。
【0076】一般に、画面に講演者の顔が映っている場
合には、画像と音声との同期をとった方が自然であるの
で、音声信号に対して時間遅延を付加することで画像と
音声との同期をとっている。これに対し、例えば机上の
書類等を映し出している場合には、できるだけ音声信号
に対する遅延を少なくし、実時間内での対話が行えるよ
うにする方が自然である。
【0077】よって、画像動き検出部6の検出結果に基
づいて音声信号に対する遅延のオン/オフを行うこと
で、映し出される画像に合わせて適切な音声遅延制御を
行うことができる。
【0078】さらに、上記の処理において、無音状態検
出部4の検出結果に基づいて音声遅延回路2による送信
音声信号の遅延の付加及びその解除の切替えタイミング
を制御することによって、相手側の端末において受信音
声が途中で途切れることはなくなる。
【0079】したがって、音声信号が途中で途切れるこ
となく、送信側及び受信側の双方の対話状態における違
和感を解消することができ、映し出される画像に合わせ
て適切な音声遅延制御を行うことができる。
【0080】
【発明の効果】以上説明したように本発明によれば、送
信音声信号において予め設定された所定レベル以下の状
態が一定時間以上連続したか否かを示す送信音声信号の
無音状態の検出結果と、受信音声信号が所定レベル以下
の状態が一定時間以上連続したか否かを示す受信音声信
号の無音状態の検出結果とに基づいて送信側と受信側と
の対話状態を検出し、その検出結果と送信画像信号にお
いて画像が静止状態か否かの検出結果と送信音声信号の
無音状態の検出結果とを基に、送信音声信号を予め設定
された所定時間遅延する遅延手段による送信音声信号の
遅延を制御することによって、音声信号が途中で途切れ
ることなく送信側及び受信側の双方の対話状態における
違和感を解消することができ、映し出される画像に合わ
せて適切な音声遅延制御を行うことができるという効果
がある。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】図1の音声遅延回路の構成を示すブロック図で
ある。
【図3】図1の音声制御タイミング制御部の構成を示す
ブロック図である。
【図4】図1の無音状態検出部の構成を示すブロック図
である。
【図5】図1の画像動き検出部の構成を示すブロック図
である。
【図6】図1の対話状態検出部の構成を示すブロック図
である。
【符号の説明】
1 音声遅延制御装置 2 音声遅延回路 3 遅延制御タイミング制御部 4,5 無音状態検出部 6 画像動き検出部 7 対話状態検出部 8 画像符号化部 9,20 音声信号増幅回路 10,21 画像信号増幅回路 11,12 A/D変換回路 13 音声符号化部 14 音声・画像多重化回路 15 通信回線インタフェース回路 16 音声復号化部 17 画像復号化部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 送信音声信号及び送信画像信号を符号化
    して送信するテレビ会議システムの音声遅延制御装置で
    あって、前記送信音声信号を予め設定された所定時間遅
    延する遅延手段と、前記送信音声信号を監視して前記送
    信音声信号において予め設定された所定レベル以下の状
    態が一定時間以上連続することを検出する送信音声無音
    検出手段と、前記送信画像信号における画像の静止状態
    を検出する画像動き検出手段と、受信した音声信号を監
    視して受信音声信号が前記所定レベル以下の状態が前記
    一定時間以上連続することを検出する受信音声無音検出
    手段と、前記送信音声無音検出手段の検出結果及び前記
    受信音声無音検出手段の検出結果に基づいて送信側と受
    信側との対話状態を検出する対話状態検出手段と、前記
    送信音声無音検出手段の検出結果と前記画像動き検出手
    段の検出結果と前記対話状態検出手段の検出結果とを基
    に前記遅延手段による前記送信音声信号の遅延を制御す
    る遅延制御手段とを有することを特徴とする音声遅延制
    御装置。
  2. 【請求項2】 前記遅延制御手段は、前記送信音声信号
    の遅延を行う時の遅延時間量を保持する第1の保持手段
    と、前記送信音声信号の遅延を解除した時の遅延時間量
    を保持する第2の保持手段と、前記送信音声信号の遅延
    及びその解除の切替えに応じて前記第1の保持手段に保
    持された遅延時間量と前記第2の保持手段に保持された
    遅延時間量とのうち一方によって前記送信音声信号の遅
    延を制御する手段とを含むことを特徴とする請求項1記
    載の音声遅延制御装置。
  3. 【請求項3】 前記画像動き検出手段は、前記送信画像
    信号の符号化時に検出される前記画像の動き量を基に前
    記画像の動き及び静止状態を検出する手段を含むことを
    特徴とする請求項1または請求項2記載の音声遅延制御
    装置。
  4. 【請求項4】 前記画像動き検出手段は、前記テレビ会
    議システムで用いられるテレビカメラの向きが予め設定
    された一定角度となった時に前記画像が静止状態である
    ことを示す信号を出力する手段を含むことを特徴とする
    請求項1または請求項2記載の音声遅延制御装置。
  5. 【請求項5】 前記遅延制御手段は、前記画像動き検出
    手段で前記画像の静止状態が検出された時及び前記対話
    状態検出手段で前記対話状態が検出された時のうちのい
    ずれかの場合に前記遅延手段による前記送信音声信号の
    遅延を解除するよう構成したことを特徴とする請求項1
    から請求項4のいずれか記載の音声遅延制御装置。
  6. 【請求項6】 前記遅延制御手段は、前記送信音声無音
    検出手段で前記送信音声信号における前記所定レベル以
    下の状態が一定時間以上連続することを検出した時に前
    記遅延手段による前記送信音声信号の遅延及びその解除
    の切替えを行うよう構成したことを特徴とする請求項5
    記載の音声遅延制御装置。
JP7316997A 1995-12-06 1995-12-06 音声遅延制御装置 Pending JPH09163333A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7316997A JPH09163333A (ja) 1995-12-06 1995-12-06 音声遅延制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7316997A JPH09163333A (ja) 1995-12-06 1995-12-06 音声遅延制御装置

Publications (1)

Publication Number Publication Date
JPH09163333A true JPH09163333A (ja) 1997-06-20

Family

ID=18083270

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7316997A Pending JPH09163333A (ja) 1995-12-06 1995-12-06 音声遅延制御装置

Country Status (1)

Country Link
JP (1) JPH09163333A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165153A (ja) * 2000-11-27 2002-06-07 Asaka Co Ltd 映像/音声ずれ補正方法及び装置
WO2007080788A1 (ja) * 2006-01-12 2007-07-19 Matsushita Electric Industrial Co., Ltd. Tv会議制御装置およびtv会議制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165153A (ja) * 2000-11-27 2002-06-07 Asaka Co Ltd 映像/音声ずれ補正方法及び装置
WO2007080788A1 (ja) * 2006-01-12 2007-07-19 Matsushita Electric Industrial Co., Ltd. Tv会議制御装置およびtv会議制御方法

Similar Documents

Publication Publication Date Title
US5818514A (en) Video conferencing system and method for providing enhanced interactive communication
US5907351A (en) Method and apparatus for cross-modal predictive coding for talking head sequences
US6008838A (en) Multi-point video conference system
JPH04151953A (ja) 音声信号処理装置
JP2007214976A (ja) エコーキャンセル装置、テレビ電話端末、及びエコーキャンセル方法
JP3500667B2 (ja) テレビ会議システムおよび同期方法
JPS61159883A (ja) 狭帯域音声動画像送受信装置
JPH09163333A (ja) 音声遅延制御装置
JPH09163332A (ja) 音声遅延制御装置
JP5340880B2 (ja) 遠隔会話システムの出力制御装置、その方法、およびコンピュータが実行可能なプログラム
KR100195724B1 (ko) 화상회의 시스템에서의 영상카메라 조정방법 및 그 장치
KR20090010385A (ko) 화상 통신 단말의 화상 통화 녹화 방법 및 장치
JPS62266959A (ja) テレビ会議装置
JPH01206765A (ja) テレビ会議システム
JP4059597B2 (ja) 映像音声送受信装置
JPH04207287A (ja) テレビ電話会議システム
JPH11355450A (ja) 音声検出装置及び通話装置
JPH0287789A (ja) Tv電話会議方式並びにフレーム間符号器及び複合器
JPH06276427A (ja) 動画像音声制御装置
JPH099224A (ja) リップシンク制御装置を用いた動画像および音声コーデック装置
JP2002300579A (ja) 音声画像伝送装置
JPH08317362A (ja) テレビ会議システムの端末装置
JP2005020639A (ja) 衛星を利用した多地点テレビ会議システム
JPS6284689A (ja) 画像伝送表示方式
JPH01293058A (ja) 会議用テレビ電話端末装置