JPH08181962A - 音像定位方法および音像定位制御装置およびテレビ会議システム - Google Patents
音像定位方法および音像定位制御装置およびテレビ会議システムInfo
- Publication number
- JPH08181962A JPH08181962A JP6320169A JP32016994A JPH08181962A JP H08181962 A JPH08181962 A JP H08181962A JP 6320169 A JP6320169 A JP 6320169A JP 32016994 A JP32016994 A JP 32016994A JP H08181962 A JPH08181962 A JP H08181962A
- Authority
- JP
- Japan
- Prior art keywords
- sound image
- image localization
- motion vector
- sounding body
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Stereophonic System (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
(57)【要約】
【目的】 発音体の表示位置と発音体に付随した音響信
号の定位位置とを良好に一致させる。 【構成】 動きベクトル検出部31は、映像信号11に
含まれる発音体の動きベクトルを検出し、動きベクトル
情報信号14を出力する。予測音像定位制御部33は、
発音体の動きベクトル検出から音像定位処理の終了まで
の処理時間を経過した時の発音体の位置を前記動きベク
トルから予測し、制御信号15を音響信号処理部32に
入力する。音響信号制御部32は、前記制御信号15に
基づいて、音響信号12に対して音像定位処理(各スピ
ーカから再生する音量バランスおよび再生タイミング等
を制御する)を行い、処理後の音響信号13を出力す
る。 【効果】 音像定位処理に要する時間を考慮した位置に
音像定位するため、発音体の表示位置と音像定位位置と
を良好に一致させることが出来る。これにより、臨場感
ある音響再生が可能となる。
号の定位位置とを良好に一致させる。 【構成】 動きベクトル検出部31は、映像信号11に
含まれる発音体の動きベクトルを検出し、動きベクトル
情報信号14を出力する。予測音像定位制御部33は、
発音体の動きベクトル検出から音像定位処理の終了まで
の処理時間を経過した時の発音体の位置を前記動きベク
トルから予測し、制御信号15を音響信号処理部32に
入力する。音響信号制御部32は、前記制御信号15に
基づいて、音響信号12に対して音像定位処理(各スピ
ーカから再生する音量バランスおよび再生タイミング等
を制御する)を行い、処理後の音響信号13を出力す
る。 【効果】 音像定位処理に要する時間を考慮した位置に
音像定位するため、発音体の表示位置と音像定位位置と
を良好に一致させることが出来る。これにより、臨場感
ある音響再生が可能となる。
Description
【0001】
【産業上の利用分野】本発明は、音像定位方法および音
像定位制御装置およびテレビ会議システムに関する。さ
らに詳しくは、発音体の画面上の位置と音像定位位置と
を良好に一致させうる音像定位方法および音像定位制御
装置およびテレビ会議システムに関する。
像定位制御装置およびテレビ会議システムに関する。さ
らに詳しくは、発音体の画面上の位置と音像定位位置と
を良好に一致させうる音像定位方法および音像定位制御
装置およびテレビ会議システムに関する。
【0002】
【従来の技術】従来の技術として、特開平1−2969
00号公報に開示の音像定位制御方式が知られている。
この音像定位制御方式は、映像信号および音響信号を受
信し、映像信号に含まれる顔,口,楽器等の発音体の画
像パターンを識別抽出し、その画像パターンの画面上の
位置に追従して前記音響信号を再生する際の音像定位を
行う方式である。
00号公報に開示の音像定位制御方式が知られている。
この音像定位制御方式は、映像信号および音響信号を受
信し、映像信号に含まれる顔,口,楽器等の発音体の画
像パターンを識別抽出し、その画像パターンの画面上の
位置に追従して前記音響信号を再生する際の音像定位を
行う方式である。
【0003】
【発明が解決しようとする課題】上記従来の音像定位制
御方式には、次の問題点がある。 (1)発音体の動きを検出し追従させて音像定位すると
き、処理(例えば画像フレーム間の差分演算など)によ
る遅延が生じる。しかし、この遅延があると、発音体の
画像パターンの画面上の位置と音像定位位置とが一致し
なくなる。 (2)発音体の画像パターンの画面上での移動速度が速
い場合、ある音像定位位置から次の音像定位位置までの
移動が不自然に飛ぶようになる。 (3)複数の発音体の画像パターンがある場合、発音体
とそれに付随する音響信号の対応関係が不明確になる。
御方式には、次の問題点がある。 (1)発音体の動きを検出し追従させて音像定位すると
き、処理(例えば画像フレーム間の差分演算など)によ
る遅延が生じる。しかし、この遅延があると、発音体の
画像パターンの画面上の位置と音像定位位置とが一致し
なくなる。 (2)発音体の画像パターンの画面上での移動速度が速
い場合、ある音像定位位置から次の音像定位位置までの
移動が不自然に飛ぶようになる。 (3)複数の発音体の画像パターンがある場合、発音体
とそれに付随する音響信号の対応関係が不明確になる。
【0004】そこで、本発明の第1の目的は、発音体の
画像パターンの画面上の位置と音像定位位置とを良好に
一致させうる音像定位方法および音像定位制御装置およ
びテレビ会議システムを提供することにある。また、本
発明の第2の目的は、音像定位位置を連続的に移動させ
うる音像定位方法及び音像定位制御装置及びテレビ会議
システムを提供することにある。さらに、本発明の第3
の目的は、複数の発音体がある場合、発音体とそれに付
随した音響信号とを良好に対応させうる音像定位方法お
よび音像定位制御装置およびテレビ会議システムを提供
することにある。
画像パターンの画面上の位置と音像定位位置とを良好に
一致させうる音像定位方法および音像定位制御装置およ
びテレビ会議システムを提供することにある。また、本
発明の第2の目的は、音像定位位置を連続的に移動させ
うる音像定位方法及び音像定位制御装置及びテレビ会議
システムを提供することにある。さらに、本発明の第3
の目的は、複数の発音体がある場合、発音体とそれに付
随した音響信号とを良好に対応させうる音像定位方法お
よび音像定位制御装置およびテレビ会議システムを提供
することにある。
【0005】
【課題を解決するための手段】第1の観点では、この発
明は、映像信号から画面上の発音体の動きベクトル(単
位時間での発音体の画面上での移動方向および移動距離
を表すベクトル)を検出し、音像定位処理の終了までの
処理時間を経過した時の発音体の位置を前記動きベクト
ルから予測し、音響信号に対して前記予測した位置への
音像定位を行うことを特徴とする音像定位方法を提供す
る。
明は、映像信号から画面上の発音体の動きベクトル(単
位時間での発音体の画面上での移動方向および移動距離
を表すベクトル)を検出し、音像定位処理の終了までの
処理時間を経過した時の発音体の位置を前記動きベクト
ルから予測し、音響信号に対して前記予測した位置への
音像定位を行うことを特徴とする音像定位方法を提供す
る。
【0006】第2の観点では、この発明は、映像信号か
ら画面上の発音体の動きベクトル(単位時間での発音体
の画面上での移動方向および移動距離を表すベクトル)
を検出し、音響信号に対して前記動きベクトルに基づく
音像定位を行い、前記動きベクトルの検出から音像定位
処理の終了までの処理時間だけ前記映像信号の表示を遅
延させることを特徴とする音像定位方法を提供する。
ら画面上の発音体の動きベクトル(単位時間での発音体
の画面上での移動方向および移動距離を表すベクトル)
を検出し、音響信号に対して前記動きベクトルに基づく
音像定位を行い、前記動きベクトルの検出から音像定位
処理の終了までの処理時間だけ前記映像信号の表示を遅
延させることを特徴とする音像定位方法を提供する。
【0007】第3の観点では、この発明は、映像信号か
ら画面上の発音体の動きベクトル(単位時間での発音体
の画面上での移動方向および移動距離を表すベクトル)
を検出する動きベクトル検出手段と、音像定位処理の終
了までの処理時間を経過した時の発音体の位置を前記動
きベクトルから予測する予測音像定位制御手段と、音響
信号に対して前記予測した位置への音像定位を行う音像
定位処理手段とを具備したことを特徴とする音像定位制
御装置を提供する。
ら画面上の発音体の動きベクトル(単位時間での発音体
の画面上での移動方向および移動距離を表すベクトル)
を検出する動きベクトル検出手段と、音像定位処理の終
了までの処理時間を経過した時の発音体の位置を前記動
きベクトルから予測する予測音像定位制御手段と、音響
信号に対して前記予測した位置への音像定位を行う音像
定位処理手段とを具備したことを特徴とする音像定位制
御装置を提供する。
【0008】第4の観点では、この発明は、映像信号か
ら画面上の発音体の動きベクトル(単位時間での発音体
の画面上での移動方向および移動距離を表すベクトル)
を検出する動きベクトル検出手段と、音像定位処理の終
了までの処理時間を経過した時の発音体の位置を前記動
きベクトルから予測する予測音像定位制御手段と、ある
予測位置と次の予測位置の間に補間により複数の補間位
置を設定する補間音像定位制御手段と、音響信号に対し
て前記補間位置および予測位置への音像定位を行う音像
定位処理手段とを具備したことを特徴とする音像定位制
御装置を提供する。
ら画面上の発音体の動きベクトル(単位時間での発音体
の画面上での移動方向および移動距離を表すベクトル)
を検出する動きベクトル検出手段と、音像定位処理の終
了までの処理時間を経過した時の発音体の位置を前記動
きベクトルから予測する予測音像定位制御手段と、ある
予測位置と次の予測位置の間に補間により複数の補間位
置を設定する補間音像定位制御手段と、音響信号に対し
て前記補間位置および予測位置への音像定位を行う音像
定位処理手段とを具備したことを特徴とする音像定位制
御装置を提供する。
【0009】第5の観点では、この発明は、上記構成の
音像定位制御装置において、前記予測音像定位制御手段
は、前記音像定位処理の終了までの処理時間を予測ベク
トル算出時間cとし、フレーム間時間をtとし、動きベ
クトルにおける単位時間をTとするとき、c<n・tと
なる最小の正の整数nを求め、動きベクトル{r→}に
n・t/Tを乗算して予測ベクトル{x→}を算出する
ことを特徴とする音像定位制御装置を提供する。
音像定位制御装置において、前記予測音像定位制御手段
は、前記音像定位処理の終了までの処理時間を予測ベク
トル算出時間cとし、フレーム間時間をtとし、動きベ
クトルにおける単位時間をTとするとき、c<n・tと
なる最小の正の整数nを求め、動きベクトル{r→}に
n・t/Tを乗算して予測ベクトル{x→}を算出する
ことを特徴とする音像定位制御装置を提供する。
【0010】第6の観点では、この発明は、映像信号か
ら画面上の発音体の動きベクトル(単位時間での発音体
の画面上での移動方向および移動距離を表すベクトル)
を検出する動きベクトル検出手段と、音響信号に対して
前記動きベクトルに基づく音像定位を行う音像定位処理
手段と、映像信号を一時的に蓄積し前記動きベクトルの
検出から音像定位処理の終了までの処理時間だけ遅延さ
せて前記映像信号を出力する映像蓄積処理手段とを具備
したことを特徴とする音像定位制御装置を提供する。
ら画面上の発音体の動きベクトル(単位時間での発音体
の画面上での移動方向および移動距離を表すベクトル)
を検出する動きベクトル検出手段と、音響信号に対して
前記動きベクトルに基づく音像定位を行う音像定位処理
手段と、映像信号を一時的に蓄積し前記動きベクトルの
検出から音像定位処理の終了までの処理時間だけ遅延さ
せて前記映像信号を出力する映像蓄積処理手段とを具備
したことを特徴とする音像定位制御装置を提供する。
【0011】第7の観点では、この発明は、上記構成の
音像定位制御装置において、前記動きベクトル検出手段
は、ある発音体の動きベクトルとして複数の候補がある
ときそれらを出力するものであり、その動きベクトル検
出手段の後に、個々の発音体とそれに付随する音響信号
の対応関係を維持するように前記動きベクトルの複数の
候補中から1つを選定する追従音像定位制御手段を設け
たことを特徴とする音像定位制御装置を提供する。
音像定位制御装置において、前記動きベクトル検出手段
は、ある発音体の動きベクトルとして複数の候補がある
ときそれらを出力するものであり、その動きベクトル検
出手段の後に、個々の発音体とそれに付随する音響信号
の対応関係を維持するように前記動きベクトルの複数の
候補中から1つを選定する追従音像定位制御手段を設け
たことを特徴とする音像定位制御装置を提供する。
【0012】第8の観点では、この発明は、映像信号お
よび音響信号を受信する受信装置と、前記受信した映像
信号に基づいて画面に画像を表示する映像信号表示手段
と、前記受信した音響信号に対して音像定位処理を行う
上記構成の音像定位制御装置と、その音像定位制御装置
から出力される音響信号に基づいて音響を再生する音響
信号再生装置とを備えたことを特徴とするテレビ会議シ
ステムを提供する。
よび音響信号を受信する受信装置と、前記受信した映像
信号に基づいて画面に画像を表示する映像信号表示手段
と、前記受信した音響信号に対して音像定位処理を行う
上記構成の音像定位制御装置と、その音像定位制御装置
から出力される音響信号に基づいて音響を再生する音響
信号再生装置とを備えたことを特徴とするテレビ会議シ
ステムを提供する。
【0013】
【作用】上記第1の観点による音像定位方法および上記
第3の観点による音像定位制御装置では、映像信号から
画面上の発音体の動きベクトルを検出する。次に、音像
定位処理の終了までの処理時間を経過した時の発音体の
位置を前記動きベクトルから予測する。そして、音響信
号に対して前記予測した位置への音像定位を行う。この
ように処理の遅延を考慮した位置に音像定位するので、
発音体の画面上の位置と音像定位位置とを良好に一致さ
せることが出来る。
第3の観点による音像定位制御装置では、映像信号から
画面上の発音体の動きベクトルを検出する。次に、音像
定位処理の終了までの処理時間を経過した時の発音体の
位置を前記動きベクトルから予測する。そして、音響信
号に対して前記予測した位置への音像定位を行う。この
ように処理の遅延を考慮した位置に音像定位するので、
発音体の画面上の位置と音像定位位置とを良好に一致さ
せることが出来る。
【0014】上記第2の観点による音像定位方法および
上記第6の観点による音像定位制御装置では、映像信号
から画面上の発音体の動きベクトルを検出する。次に、
音響信号に対して前記動きベクトルに基づく音像定位を
行う。さらに、前記動きベクトルの検出から音像定位処
理の終了までの処理時間だけ前記映像信号の表示を遅延
させる。このように処理の遅延を考慮して映像信号の表
示を遅延させるので、発音体の画面上の位置と音像定位
位置とを良好に一致させることが出来る。
上記第6の観点による音像定位制御装置では、映像信号
から画面上の発音体の動きベクトルを検出する。次に、
音響信号に対して前記動きベクトルに基づく音像定位を
行う。さらに、前記動きベクトルの検出から音像定位処
理の終了までの処理時間だけ前記映像信号の表示を遅延
させる。このように処理の遅延を考慮して映像信号の表
示を遅延させるので、発音体の画面上の位置と音像定位
位置とを良好に一致させることが出来る。
【0015】上記第4の観点による音像定位制御装置で
は、映像信号から画面上の発音体の動きベクトルを検出
する。次に、音像定位処理の終了までの処理時間を経過
した時の発音体の位置を前記動きベクトルから予測す
る。次に、ある予測位置と次の予測位置の間に補間によ
り複数の補間位置を設定する。そして、音響信号に対し
て前記補間位置および予測位置への音像定位を行う。こ
のように処理の遅延を考慮した位置に音像定位するの
で、発音体の画面上の位置と音像定位位置とを良好に一
致させることが出来る。さらに、予測位置と次の予測位
置との間を補間して音像定位移動を行うため、滑らかな
音像移動が可能となる。
は、映像信号から画面上の発音体の動きベクトルを検出
する。次に、音像定位処理の終了までの処理時間を経過
した時の発音体の位置を前記動きベクトルから予測す
る。次に、ある予測位置と次の予測位置の間に補間によ
り複数の補間位置を設定する。そして、音響信号に対し
て前記補間位置および予測位置への音像定位を行う。こ
のように処理の遅延を考慮した位置に音像定位するの
で、発音体の画面上の位置と音像定位位置とを良好に一
致させることが出来る。さらに、予測位置と次の予測位
置との間を補間して音像定位移動を行うため、滑らかな
音像移動が可能となる。
【0016】上記第5の観点による音像定位制御装置で
は、予測音像定位制御手段は、前記音像定位処理の終了
までの処理時間を予測ベクトル算出時間cとし、フレー
ム間時間をtとし、動きベクトル{r→}が単位時間T
での発音体の画面上での移動方向および移動距離を表す
とき、c<n・tとなる最小の正の整数nを求める。次
に、動きベクトル{r→}にn・t/Tを乗算し、予測
ベクトル{x→}を求める。これにより、フレームにお
ける発音体の位置を予測することが出来る。
は、予測音像定位制御手段は、前記音像定位処理の終了
までの処理時間を予測ベクトル算出時間cとし、フレー
ム間時間をtとし、動きベクトル{r→}が単位時間T
での発音体の画面上での移動方向および移動距離を表す
とき、c<n・tとなる最小の正の整数nを求める。次
に、動きベクトル{r→}にn・t/Tを乗算し、予測
ベクトル{x→}を求める。これにより、フレームにお
ける発音体の位置を予測することが出来る。
【0017】上記第7の観点による音像定位制御装置で
は、動きベクトル検出手段は、ある発音体の動きベクト
ルとして複数の候補があるとき、それらを全て出力す
る。また、その動きベクトル検出手段の後に追従音像定
位制御手段を設け、その追従音像定位制御手段は、個々
の発音体とそれに付随する音響信号の対応関係を維持す
るように前記動きベクトルの複数の候補中から1つを選
定する。これにより、複数の発音体がある場合でも、発
音体とそれに付随した音響信号とを良好に対応させるこ
とが出来る。
は、動きベクトル検出手段は、ある発音体の動きベクト
ルとして複数の候補があるとき、それらを全て出力す
る。また、その動きベクトル検出手段の後に追従音像定
位制御手段を設け、その追従音像定位制御手段は、個々
の発音体とそれに付随する音響信号の対応関係を維持す
るように前記動きベクトルの複数の候補中から1つを選
定する。これにより、複数の発音体がある場合でも、発
音体とそれに付随した音響信号とを良好に対応させるこ
とが出来る。
【0018】上記第8の観点によるテレビ会議システム
では、上記構成の音像定位制御装置を備えているため、
発音体の表示位置と音像定位位置の一致性を高めること
が出来る。また、滑らかな音像移動が可能となる。さら
に、複数の発音体がある場合でも、発音体とそれに付随
する音響信号との対応関係を一致させることが出来る。
では、上記構成の音像定位制御装置を備えているため、
発音体の表示位置と音像定位位置の一致性を高めること
が出来る。また、滑らかな音像移動が可能となる。さら
に、複数の発音体がある場合でも、発音体とそれに付随
する音響信号との対応関係を一致させることが出来る。
【0019】
【実施例】以下、本発明の実施例を図面を用いて説明す
る。なお、これにより本発明が限定されるものではな
い。
る。なお、これにより本発明が限定されるものではな
い。
【0020】−第1実施例− 第1実施例は、フレームにおける発音体の位置を予測
し、その予測位置に音像定位する実施例である。図9
は、本発明の一実施例のテレビ会議システムのブロック
図である。このテレビ会議システム100において、1
は映像信号表示装置を表し、2は音響信号再生装置を表
す。3は、本発明にかかる音像定位制御装置を表す。4
はカメラを表し、5はマイクを表す。6は映像信号およ
び音響信号の送受信装置を表す。また、11は映像信号
を表し、12は音響信号を表す。また、13は通信回線
を表わす。人物(乙)は会議参加者である。
し、その予測位置に音像定位する実施例である。図9
は、本発明の一実施例のテレビ会議システムのブロック
図である。このテレビ会議システム100において、1
は映像信号表示装置を表し、2は音響信号再生装置を表
す。3は、本発明にかかる音像定位制御装置を表す。4
はカメラを表し、5はマイクを表す。6は映像信号およ
び音響信号の送受信装置を表す。また、11は映像信号
を表し、12は音響信号を表す。また、13は通信回線
を表わす。人物(乙)は会議参加者である。
【0021】次に、各部の動作を、通信回線13によっ
て接続された遠隔の図示せぬテレビ会議システムとのテ
レビ会議を想定して説明する。なお、図示せぬテレビ会
議システムは、テレビ会議システム100と同じ構成で
あり、その会議参加者は人物(甲)である。前記カメラ
4は、人物(乙)を撮影し、映像信号を送受信装置6に
渡す。前記マイク5は、人物(乙)の音声を収音し、音
響信号を送受信装置6に渡す。前記送受信装置6は、前
記カメラ4から渡された映像信号および前記マイク5か
ら渡された音響信号を、通信回線13を介して、図示せ
ぬテレビ会議システムへ送信する。また、前記送受信装
置6は、図示せぬテレビ会議システムから通信回線13
を介して送信されてきた映像信号および音響信号を受信
し、映像信号11は映像信号表示装置1および音像定位
制御装置3に入力し、音響信号12は音像定位制御装置
3に入力する。前記映像信号表示装置1は、入力された
映像信号11により画面に画像を実時間で表示する。前
記音像定位制御装置3は、入力された映像信号11を解
析し、その解析結果に応じて映像信号表示装置1の画面
上での音像定位位置を定め、前記音響信号12に対して
定位処理を行い、定位処理後の音響信号13を音響信号
再生装置2に渡す。前記音響信号再生装置2は、音響信
号13に基づき、音響を実時間で再生する。
て接続された遠隔の図示せぬテレビ会議システムとのテ
レビ会議を想定して説明する。なお、図示せぬテレビ会
議システムは、テレビ会議システム100と同じ構成で
あり、その会議参加者は人物(甲)である。前記カメラ
4は、人物(乙)を撮影し、映像信号を送受信装置6に
渡す。前記マイク5は、人物(乙)の音声を収音し、音
響信号を送受信装置6に渡す。前記送受信装置6は、前
記カメラ4から渡された映像信号および前記マイク5か
ら渡された音響信号を、通信回線13を介して、図示せ
ぬテレビ会議システムへ送信する。また、前記送受信装
置6は、図示せぬテレビ会議システムから通信回線13
を介して送信されてきた映像信号および音響信号を受信
し、映像信号11は映像信号表示装置1および音像定位
制御装置3に入力し、音響信号12は音像定位制御装置
3に入力する。前記映像信号表示装置1は、入力された
映像信号11により画面に画像を実時間で表示する。前
記音像定位制御装置3は、入力された映像信号11を解
析し、その解析結果に応じて映像信号表示装置1の画面
上での音像定位位置を定め、前記音響信号12に対して
定位処理を行い、定位処理後の音響信号13を音響信号
再生装置2に渡す。前記音響信号再生装置2は、音響信
号13に基づき、音響を実時間で再生する。
【0022】図1は、前記音像定位制御装置3の構成を
示すブロック図である。この音像定位制御装置3は、動
きベクトル検出部31と、予測音像定位制御部33と、
音像定位処理部32とから構成される。前記動きベクト
ル検出部31は、映像信号11から発音体の動きベクト
ル(単位時間Tでの発音体の画面上での移動方向および
移動距離を表すベクトル)を検出し、動きベクトル情報
信号14を予測音像定位制御部33に入力する。なお、
動きベクトルの検出は、例えば「認識技術を応用した対
話型映像編集の提案(上田 他)電子情報通信学会論文
誌 D-II Vol.J75-D-II No.2 pp.216-225 1992年2月」や
「ダイナミックシーンの理解(浅田稔)電子情報通信学
会編」に記載されている技術を用いることが出来る。前
記予測音像定位制御部33は、入力された動きベクトル
情報信号14から音響再生時の発音体の画面上の位置を
予測し、その予測位置に音像定位するように指示する制
御信号15を音像定位処理部32に入力する。前記制御
信号15は、例えば表示位置座標を含んでいる。前記音
像定位処理部32は、入力された制御信号15に基づ
き、音響信号再生装置2で再生する音響の音量バランス
および再生タイミング等を制御する音像定位処理を行
い、定位処理後の音響信号13を音響信号再生装置2に
渡す。
示すブロック図である。この音像定位制御装置3は、動
きベクトル検出部31と、予測音像定位制御部33と、
音像定位処理部32とから構成される。前記動きベクト
ル検出部31は、映像信号11から発音体の動きベクト
ル(単位時間Tでの発音体の画面上での移動方向および
移動距離を表すベクトル)を検出し、動きベクトル情報
信号14を予測音像定位制御部33に入力する。なお、
動きベクトルの検出は、例えば「認識技術を応用した対
話型映像編集の提案(上田 他)電子情報通信学会論文
誌 D-II Vol.J75-D-II No.2 pp.216-225 1992年2月」や
「ダイナミックシーンの理解(浅田稔)電子情報通信学
会編」に記載されている技術を用いることが出来る。前
記予測音像定位制御部33は、入力された動きベクトル
情報信号14から音響再生時の発音体の画面上の位置を
予測し、その予測位置に音像定位するように指示する制
御信号15を音像定位処理部32に入力する。前記制御
信号15は、例えば表示位置座標を含んでいる。前記音
像定位処理部32は、入力された制御信号15に基づ
き、音響信号再生装置2で再生する音響の音量バランス
および再生タイミング等を制御する音像定位処理を行
い、定位処理後の音響信号13を音響信号再生装置2に
渡す。
【0023】図2は、第1実施例にかかる音像定位方法
の説明図である。予測音像定位制御部33は、予測処理
に要する時間を予測ベクトル算出時間cとし、フレーム
間時間をt(例えば1/30秒)とするとき、c<n・
tとなる最小の正の整数nを求め、動きベクトル{r
→}にn・t/Tを乗算したものを予測ベクトル{x
→}とする。この予測ベクトル{x→}は、現フレーム
から数えてn番後のフレームまでの発音体の画面上での
移動方向および移動距離を表しており、これを音像定位
処理部32に通知する。ここで、n個の予測音像定位制
御部33が並列に処理する構成とすれば、フレーム毎に
予測ベクトル{x→}を算出することが出来る。音像定
位処理部32は、現在の音像定位位置の次に、現在の音
像定位位置に予測ベクトル{x→}を加えた予測位置に
音像定位する。なお、図2で、21〜24は、時刻(k
−1)のフレーム〜時刻(n)のフレームの画像であ
る。91は、フレーム間時間tである。92は、予測ベ
クトル算出時間cである。合成図25は、時刻(k−
1)から時刻(n)までの発音体(甲)の表示映像を合
成した図である。41は、時刻(k−1)のフレームで
の表示映像である。42は、時刻(k)のフレームでの
表示映像である。43は、時刻(n)のフレームでの表
示映像である。
の説明図である。予測音像定位制御部33は、予測処理
に要する時間を予測ベクトル算出時間cとし、フレーム
間時間をt(例えば1/30秒)とするとき、c<n・
tとなる最小の正の整数nを求め、動きベクトル{r
→}にn・t/Tを乗算したものを予測ベクトル{x
→}とする。この予測ベクトル{x→}は、現フレーム
から数えてn番後のフレームまでの発音体の画面上での
移動方向および移動距離を表しており、これを音像定位
処理部32に通知する。ここで、n個の予測音像定位制
御部33が並列に処理する構成とすれば、フレーム毎に
予測ベクトル{x→}を算出することが出来る。音像定
位処理部32は、現在の音像定位位置の次に、現在の音
像定位位置に予測ベクトル{x→}を加えた予測位置に
音像定位する。なお、図2で、21〜24は、時刻(k
−1)のフレーム〜時刻(n)のフレームの画像であ
る。91は、フレーム間時間tである。92は、予測ベ
クトル算出時間cである。合成図25は、時刻(k−
1)から時刻(n)までの発音体(甲)の表示映像を合
成した図である。41は、時刻(k−1)のフレームで
の表示映像である。42は、時刻(k)のフレームでの
表示映像である。43は、時刻(n)のフレームでの表
示映像である。
【0024】以上の第1実施例によれば、処理の遅延を
考慮して音像定位するので、発音体の画面上の位置と音
像定位位置とを良好に一致させることが出来る。また、
遅延の累積もないので、発音体の画面上の位置と音像定
位位置が大きくずれてしまうこともない。
考慮して音像定位するので、発音体の画面上の位置と音
像定位位置とを良好に一致させることが出来る。また、
遅延の累積もないので、発音体の画面上の位置と音像定
位位置が大きくずれてしまうこともない。
【0025】なお、上記第1実施例では、動きベクトル
{r→}として速度ベクトルを想定し、予測ベクトル
{x→}を線形的に予測した。しかし、これに限定され
ず、例えば動きベクトル{r→}として加速度ベクトル
を想定し、予測ベクトル{x→}を非線形的に予測して
もよい。
{r→}として速度ベクトルを想定し、予測ベクトル
{x→}を線形的に予測した。しかし、これに限定され
ず、例えば動きベクトル{r→}として加速度ベクトル
を想定し、予測ベクトル{x→}を非線形的に予測して
もよい。
【0026】−第2実施例− 第2実施例は、フレームにおける発音体の位置を予測
し、現在の発音体の位置から予測位置の間の発音体の位
置を補間し、その補間位置をたどって予測位置まで順に
音像定位する実施例である。図3は、第2実施例におけ
る音像定位制御装置3Aのブロック図である。この音像
定位制御装置3Aは、図1の音像定位制御装置3におけ
る予測音像定位制御部33と音像定位処理部32の間
に、補間音像定位制御部34を介設した構成である。前
記補間音像定位制御部34では、予測音像定位制御部3
3から制御信号15により入力された予測位置(n−
1)と予測位置(n)の間に、補間により複数の補間位
置を設定し、それら補間位置および前記予測位置を制御
信号16として音響信号処理部32に入力する。
し、現在の発音体の位置から予測位置の間の発音体の位
置を補間し、その補間位置をたどって予測位置まで順に
音像定位する実施例である。図3は、第2実施例におけ
る音像定位制御装置3Aのブロック図である。この音像
定位制御装置3Aは、図1の音像定位制御装置3におけ
る予測音像定位制御部33と音像定位処理部32の間
に、補間音像定位制御部34を介設した構成である。前
記補間音像定位制御部34では、予測音像定位制御部3
3から制御信号15により入力された予測位置(n−
1)と予測位置(n)の間に、補間により複数の補間位
置を設定し、それら補間位置および前記予測位置を制御
信号16として音響信号処理部32に入力する。
【0027】図4は、第2実施例にかかる補間音像定位
方法の説明図である。合成図26は、予測音像定位制御
部33において予測した発音体の予測位置(n−1)
と、次の予測位置(n)を合成した図である。補間音像
定位制御部34は、予測位置(n−1)と予測位置
(n)の間をm分割し、補間位置61〜63を設定す
る。音響信号処理部32は、予測位置(n−1)の次に
補間位置61に定位(1)し、順に補間位置62に定位
(2)し、順に補間位置63まで定位(m−1)し、最
後に予測位置(n)に定位(64)する。
方法の説明図である。合成図26は、予測音像定位制御
部33において予測した発音体の予測位置(n−1)
と、次の予測位置(n)を合成した図である。補間音像
定位制御部34は、予測位置(n−1)と予測位置
(n)の間をm分割し、補間位置61〜63を設定す
る。音響信号処理部32は、予測位置(n−1)の次に
補間位置61に定位(1)し、順に補間位置62に定位
(2)し、順に補間位置63まで定位(m−1)し、最
後に予測位置(n)に定位(64)する。
【0028】以上の第2実施例によれば、音像定位位置
を連続的に移動させることが出来る。この結果、発音体
の画面上での移動速度が速い場合でも、音像定位位置が
不自然に飛ばず、滑らかに移動するようになる。
を連続的に移動させることが出来る。この結果、発音体
の画面上での移動速度が速い場合でも、音像定位位置が
不自然に飛ばず、滑らかに移動するようになる。
【0029】−第3実施例− 第3実施例は、複数の発音体とそれらに付随した音響信
号の対応を維持する実施例である。図5は、第3実施例
における音像定位制御装置3Bのブロック図である。こ
の音像定位制御装置3Bは、図3の音像定位制御装置3
Aにおける動きベクトル検出部31と予測音像定位制御
部33の間に、追従音像定位制御部35を介設した構成
である。前記動きベクトル検出部31は、ある発音体の
動きベクトルとして複数の候補があるとき、それらを全
て出力する。前記追従音像定位制御部35は、前フレー
ムにおいて検出した動きベクトルと現フレームにおいて
検出した動きベクトルとを比較することにより、前記複
数の候補中から1つの動くベクトルを選定し、これによ
り個々の発音体とそれに付随する音響信号の対応関係を
維持し、個々の発音体ごとに区別した動きベクトル情報
信号17を予測音像定位制御部33に入力する。
号の対応を維持する実施例である。図5は、第3実施例
における音像定位制御装置3Bのブロック図である。こ
の音像定位制御装置3Bは、図3の音像定位制御装置3
Aにおける動きベクトル検出部31と予測音像定位制御
部33の間に、追従音像定位制御部35を介設した構成
である。前記動きベクトル検出部31は、ある発音体の
動きベクトルとして複数の候補があるとき、それらを全
て出力する。前記追従音像定位制御部35は、前フレー
ムにおいて検出した動きベクトルと現フレームにおいて
検出した動きベクトルとを比較することにより、前記複
数の候補中から1つの動くベクトルを選定し、これによ
り個々の発音体とそれに付随する音響信号の対応関係を
維持し、個々の発音体ごとに区別した動きベクトル情報
信号17を予測音像定位制御部33に入力する。
【0030】図6は、第3実施例にかかる追従音像定位
方法の説明図である。合成図27は、フレーム(k−
2)からフレーム(k)までの発音体(甲)および発音
体(乙)の動きを合成した図である。説明の都合上、フ
レーム(k−2),フレーム(k−1)における発音体
(甲)の位置40,41およびその音響信号の対応が判
っているとする。また、フレーム(k−2),フレーム
(k−1)における発音体(乙)の位置45,46およ
びその音響信号の対応が判っているとする。次のフレー
ム(k)では、2つの発音体の位置42,47は判る
が、発音体(甲)(乙)の位置がどちらかは判らない。
そこで、動きベクトル検出部31は、フレーム(k−
1)における発音体(甲)の位置41からフレーム
(k)における2つの発音体の位置42,47への2つ
の動きベクトル{v→}(k)56および動きベクトル
{v’→}(k)57を候補として追従音像定位制御部
35に入力する。追従音像定位制御部35は、フレーム
(k−2)からフレーム(k−1)までの発音体(甲)
の動きベクトル{v→}(k−1)55となす角度θお
よびθ’を算出し、角度の小さい方を発音体(甲)の動
きベクトルとして選定する(角度が同じときは動きベク
トルの小さい方を選定する)。これにより、位置42が
フレーム(k)における発音体(甲)の位置と判る。ま
た、位置47がフレーム(k)における発音体(乙)の
位置と判る。従って、フレーム(k)における発音体
(甲)の位置42およびその音響信号の対応が判る。ま
た、フレーム(k)における発音体(乙)の位置47お
よびその音響信号の対応が判る。以下、同様にして、フ
レーム(k+1)以降でも発音体とその音響信号の対応
を維持することが出来る。
方法の説明図である。合成図27は、フレーム(k−
2)からフレーム(k)までの発音体(甲)および発音
体(乙)の動きを合成した図である。説明の都合上、フ
レーム(k−2),フレーム(k−1)における発音体
(甲)の位置40,41およびその音響信号の対応が判
っているとする。また、フレーム(k−2),フレーム
(k−1)における発音体(乙)の位置45,46およ
びその音響信号の対応が判っているとする。次のフレー
ム(k)では、2つの発音体の位置42,47は判る
が、発音体(甲)(乙)の位置がどちらかは判らない。
そこで、動きベクトル検出部31は、フレーム(k−
1)における発音体(甲)の位置41からフレーム
(k)における2つの発音体の位置42,47への2つ
の動きベクトル{v→}(k)56および動きベクトル
{v’→}(k)57を候補として追従音像定位制御部
35に入力する。追従音像定位制御部35は、フレーム
(k−2)からフレーム(k−1)までの発音体(甲)
の動きベクトル{v→}(k−1)55となす角度θお
よびθ’を算出し、角度の小さい方を発音体(甲)の動
きベクトルとして選定する(角度が同じときは動きベク
トルの小さい方を選定する)。これにより、位置42が
フレーム(k)における発音体(甲)の位置と判る。ま
た、位置47がフレーム(k)における発音体(乙)の
位置と判る。従って、フレーム(k)における発音体
(甲)の位置42およびその音響信号の対応が判る。ま
た、フレーム(k)における発音体(乙)の位置47お
よびその音響信号の対応が判る。以下、同様にして、フ
レーム(k+1)以降でも発音体とその音響信号の対応
を維持することが出来る。
【0031】図7は、第3実施例にかかる別の追従音像
定位方法の説明図である。206は、フレーム(f)で
の発音体(A)211および発音体(B)214の画面
上の位置を表している。また、207は、フレーム(f
+1)での発音体(A)212および発音体(B)21
5の画面上の位置を表している。次に、208および2
09は、フレーム(f)およびフレーム(f+1)での
発音体(A),(B)の位置を合成表示した図である。
定位方法の説明図である。206は、フレーム(f)で
の発音体(A)211および発音体(B)214の画面
上の位置を表している。また、207は、フレーム(f
+1)での発音体(A)212および発音体(B)21
5の画面上の位置を表している。次に、208および2
09は、フレーム(f)およびフレーム(f+1)での
発音体(A),(B)の位置を合成表示した図である。
【0032】説明の都合上、フレーム(f)における発
音体(A)の位置211およびその音響信号の対応が判
っているものとする。また、フレーム(f)における発
音体(B)の位置214およびその音響信号の対応が判
っているものとする。次のフレーム(f+1)では、2
つの発音体の位置212,215は判るが、発音体
(A),(B)の位置がどちらかは判らない。つまり、
208に示したように、フレーム(f)における発音体
(A)211がフレーム(f+1)において位置212
に移動し、且つ、フレーム(f)の発音体(B)214
がフレーム(f+1)において位置215に移動する第
1の移動パターンと、209に示したように、フレーム
(f)における発音体(A)211がフレーム(f+
1)において位置215に移動し、且つ、フレーム
(f)の発音体(B)214がフレーム(f+1)にお
いて位置212に移動する第2の移動パターンとがあ
り、いずれであるかが判らない。
音体(A)の位置211およびその音響信号の対応が判
っているものとする。また、フレーム(f)における発
音体(B)の位置214およびその音響信号の対応が判
っているものとする。次のフレーム(f+1)では、2
つの発音体の位置212,215は判るが、発音体
(A),(B)の位置がどちらかは判らない。つまり、
208に示したように、フレーム(f)における発音体
(A)211がフレーム(f+1)において位置212
に移動し、且つ、フレーム(f)の発音体(B)214
がフレーム(f+1)において位置215に移動する第
1の移動パターンと、209に示したように、フレーム
(f)における発音体(A)211がフレーム(f+
1)において位置215に移動し、且つ、フレーム
(f)の発音体(B)214がフレーム(f+1)にお
いて位置212に移動する第2の移動パターンとがあ
り、いずれであるかが判らない。
【0033】そこで、動きベクトル検出部31は、第1
の移動パターンと仮定して、208における発音体
(A)および(B)の動きベクトル221{a→}およ
び動きベクトル223{b→}を算出し、発音体
(A),(B)の第1の移動候補として追従音像定位制
御部35に入力する。また、第2の移動パターンと仮定
して、209における発音体(A)および(B)の動き
ベクトル222{a’→}および動きベクトル224
{b’→}を算出し、発音体A,Bの第2の移動候補と
して追従音像定位制御部35に入力する。追従音像定位
制御部35は、フレーム(f)における発音体211を
動きベクトル221{a→}だけ移動させ、フレーム
(f+1)における発音体212と差分をとる。また、
フレーム(f)における発音体214を動きベクトル2
23{b→}だけ移動させ、フレーム(f+1)におけ
る発音体215と差分をとる。そして、両差分を合計す
る。次に、フレーム(f)における発音体211を動き
ベクトル222{a’→}だけ移動させ、フレーム(f
+1)における発音体215と差分をとる。また、フレ
ーム(f)における発音体214を動きベクトル224
{b’→}だけ移動させ、フレーム(f+1)における
発音体212と差分をとる。そして、両差分を合計す
る。さらに、前記差分の合計同士を比較し、合計の小さ
いの移動パターンが正しいと判定する。これにより、フ
レーム(f+1)における発音体(A),(B)の位置
が判る。また、フレーム(f+1)における発音体
(A),(B)と音響信号の対応が判る。以下、同様に
して、フレーム(f+2)以降でも発音体とその音響信
号の対応を維持することが出来る。
の移動パターンと仮定して、208における発音体
(A)および(B)の動きベクトル221{a→}およ
び動きベクトル223{b→}を算出し、発音体
(A),(B)の第1の移動候補として追従音像定位制
御部35に入力する。また、第2の移動パターンと仮定
して、209における発音体(A)および(B)の動き
ベクトル222{a’→}および動きベクトル224
{b’→}を算出し、発音体A,Bの第2の移動候補と
して追従音像定位制御部35に入力する。追従音像定位
制御部35は、フレーム(f)における発音体211を
動きベクトル221{a→}だけ移動させ、フレーム
(f+1)における発音体212と差分をとる。また、
フレーム(f)における発音体214を動きベクトル2
23{b→}だけ移動させ、フレーム(f+1)におけ
る発音体215と差分をとる。そして、両差分を合計す
る。次に、フレーム(f)における発音体211を動き
ベクトル222{a’→}だけ移動させ、フレーム(f
+1)における発音体215と差分をとる。また、フレ
ーム(f)における発音体214を動きベクトル224
{b’→}だけ移動させ、フレーム(f+1)における
発音体212と差分をとる。そして、両差分を合計す
る。さらに、前記差分の合計同士を比較し、合計の小さ
いの移動パターンが正しいと判定する。これにより、フ
レーム(f+1)における発音体(A),(B)の位置
が判る。また、フレーム(f+1)における発音体
(A),(B)と音響信号の対応が判る。以下、同様に
して、フレーム(f+2)以降でも発音体とその音響信
号の対応を維持することが出来る。
【0034】なお、上記の2通りの追従音像定位方法の
外に、例えば発音体の色や輝度(R,G,B,Y,C)
などの画像的特徴を比較することにより、発音体の移動
先を判定する方法を用いてもよい。
外に、例えば発音体の色や輝度(R,G,B,Y,C)
などの画像的特徴を比較することにより、発音体の移動
先を判定する方法を用いてもよい。
【0035】以上の第3実施例によれば、複数の発音体
がある場合でも、発音体とそれに付随した音響信号とを
良好に対応させることが出来る。
がある場合でも、発音体とそれに付随した音響信号とを
良好に対応させることが出来る。
【0036】−第4実施例− 第4実施例は、発音体の動きベクトル検出から音像定位
に要する時間だけ映像信号を遅らせることにより、発音
体の画面上の位置と音像定位位置とを一致させる実施例
である。図8は、第4実施例における音像定位制御装置
3Cのブロック図である。この音像定位制御装置3C
は、動きベクトル検出部31と、音像定位処理部37
と、映像蓄積処理部36とから構成される。前記動きベ
クトル検出部31は、映像信号11から発音体の動きベ
クトルを検出し、動きベクトル情報信号18を音像定位
処理部37に入力する。前記音像定位処理部37は、入
力された音響信号12を前記動きベクトルにより音像定
位処理し、処理後の音響信号13を音響信号再生装置2
へ出力する。また、音響信号13の再生と同期して映像
を表示するためのタイミングを制御する制御信号19を
映像蓄積処理部36へ送る。前記映像蓄積処理部36
は、映像信号11を一時的に蓄積し、前記制御信号19
に基づくタイミングで取り出した映像信号11’を映像
信号表示装置1へ出力する。なお、図8の動きベクトル
検出部31と音像定位処理部37の間に、図5の追従音
像定位制御部35および/または補間音像定位制御部3
4を介設してもよい。
に要する時間だけ映像信号を遅らせることにより、発音
体の画面上の位置と音像定位位置とを一致させる実施例
である。図8は、第4実施例における音像定位制御装置
3Cのブロック図である。この音像定位制御装置3C
は、動きベクトル検出部31と、音像定位処理部37
と、映像蓄積処理部36とから構成される。前記動きベ
クトル検出部31は、映像信号11から発音体の動きベ
クトルを検出し、動きベクトル情報信号18を音像定位
処理部37に入力する。前記音像定位処理部37は、入
力された音響信号12を前記動きベクトルにより音像定
位処理し、処理後の音響信号13を音響信号再生装置2
へ出力する。また、音響信号13の再生と同期して映像
を表示するためのタイミングを制御する制御信号19を
映像蓄積処理部36へ送る。前記映像蓄積処理部36
は、映像信号11を一時的に蓄積し、前記制御信号19
に基づくタイミングで取り出した映像信号11’を映像
信号表示装置1へ出力する。なお、図8の動きベクトル
検出部31と音像定位処理部37の間に、図5の追従音
像定位制御部35および/または補間音像定位制御部3
4を介設してもよい。
【0037】以上の第4実施例によれば、処理の遅延を
考慮して映像信号の表示を遅延させるので、発音体の画
面上の位置と音像定位位置とを良好に一致させることが
出来る。この第4実施例は、図9のテレビ会議システム
100に適用することも可能であるが、リアルタイム性
があまり重要でないビデオプレヤー等に適用する方が有
用である。
考慮して映像信号の表示を遅延させるので、発音体の画
面上の位置と音像定位位置とを良好に一致させることが
出来る。この第4実施例は、図9のテレビ会議システム
100に適用することも可能であるが、リアルタイム性
があまり重要でないビデオプレヤー等に適用する方が有
用である。
【0038】
【発明の効果】本発明の音像定位方法および音像定位制
御装置およびテレビ会議システムによれば、次の効果が
得られる。 (1)映像信号に含まれる発音体の動きを検出し、その
動き検出処理および音像定位処理に要する時間後の発音
体の表示位置を予測し、音響信号の定位処理を行うた
め、発音体の表示位置と音像定位位置との一致性を高め
た音響再生が可能となる。 (2)予測位置と次の予測位置との間を補間して音像定
位移動を行うため、滑らかな音像移動が可能となる。 (3)発音体が複数ある場合、発音体とそれに付属した
音響信号の対応関係を常に維持するよう制御するため、
発音体とそれに付属した音響信号の対応関係が明確にな
る。 (4)発音体の動きを検出し、発音体の移動後の位置に
音像定位するよう信号処理を行い、音響信号処理に要し
た時間量だけ映像信号の再生を遅延させ、映像表示およ
び音響信号の再生を行うため、発音体の表示位置と音像
定位位置との一致性を高めた音響再生が可能となる。
御装置およびテレビ会議システムによれば、次の効果が
得られる。 (1)映像信号に含まれる発音体の動きを検出し、その
動き検出処理および音像定位処理に要する時間後の発音
体の表示位置を予測し、音響信号の定位処理を行うた
め、発音体の表示位置と音像定位位置との一致性を高め
た音響再生が可能となる。 (2)予測位置と次の予測位置との間を補間して音像定
位移動を行うため、滑らかな音像移動が可能となる。 (3)発音体が複数ある場合、発音体とそれに付属した
音響信号の対応関係を常に維持するよう制御するため、
発音体とそれに付属した音響信号の対応関係が明確にな
る。 (4)発音体の動きを検出し、発音体の移動後の位置に
音像定位するよう信号処理を行い、音響信号処理に要し
た時間量だけ映像信号の再生を遅延させ、映像表示およ
び音響信号の再生を行うため、発音体の表示位置と音像
定位位置との一致性を高めた音響再生が可能となる。
【図1】本発明の第1実施例にかかる音像定位制御装置
を示すブロック図である。
を示すブロック図である。
【図2】第1実施例にかかる音像定位方法の説明図であ
る。
る。
【図3】本発明の第2実施例にかかる音像定位制御装置
を示すブロック図である。
を示すブロック図である。
【図4】第2実施例にかかる補間音像定位方法の説明図
である。
である。
【図5】本発明の第3実施例にかかる音像定位制御装置
を示すブロック図である。
を示すブロック図である。
【図6】第3実施例にかかる追従音像定位方法の説明図
である。
である。
【図7】第3実施例にかかる追従音像定位方法の別の説
明図である。
明図である。
【図8】本発明の第4実施例にかかる音像定位制御装置
を示すブロック図である。
を示すブロック図である。
【図9】本発明の一実施例にかかるテレビ会議システム
を示すブロック図である。
を示すブロック図である。
1…映像信号表示装置、2…音響信号再生装置、3,3
A,3B,3C…音像定位制御装置、11,11’…映
像信号、12,13…音響信号、14,18…動きベク
トル情報信号、15,16,17…制御信号、31…動
きベクトル検出部、32…音響信号処理部、33…予測
音像定位制御部、34…補間音像定位制御部、35…追
従音像定位制御部、36…映像蓄積処理部、51…動き
ベクトル、52…予測ベクトル
A,3B,3C…音像定位制御装置、11,11’…映
像信号、12,13…音響信号、14,18…動きベク
トル情報信号、15,16,17…制御信号、31…動
きベクトル検出部、32…音響信号処理部、33…予測
音像定位制御部、34…補間音像定位制御部、35…追
従音像定位制御部、36…映像蓄積処理部、51…動き
ベクトル、52…予測ベクトル
Claims (8)
- 【請求項1】 映像信号から画面上の発音体の動きベク
トル(単位時間での発音体の画面上での移動方向および
移動距離を表すベクトル)を検出し、発音体の動きベク
トル検出から音像定位処理の終了までの処理時間を経過
した時の発音体の位置を前記動きベクトルから予測し、
音響信号に対して前記予測した位置への音像定位を行う
ことを特徴とする音像定位方法。 - 【請求項2】 映像信号から画面上の発音体の動きベク
トル(単位時間での発音体の画面上での移動方向および
移動距離を表すベクトル)を検出し、音響信号に対して
前記動きベクトルに基づく音像定位を行い、前記動きベ
クトルの検出から音像定位処理の終了までの処理時間だ
け前記映像信号の表示を遅延させることを特徴とする音
像定位方法。 - 【請求項3】 映像信号から画面上の発音体の動きベク
トル(単位時間での発音体の画面上での移動方向および
移動距離を表すベクトル)を検出する動きベクトル検出
手段と、音像定位処理の終了までの処理時間を経過した
時の発音体の位置を前記動きベクトルから予測する予測
音像定位制御手段と、音響信号に対して前記予測した位
置への音像定位を行う音像定位処理手段とを具備したこ
とを特徴とする音像定位制御装置。 - 【請求項4】 映像信号から画面上の発音体の動きベク
トル(単位時間での発音体の画面上での移動方向および
移動距離を表すベクトル)を検出する動きベクトル検出
手段と、音像定位処理の終了までの処理時間を経過した
時の発音体の位置を前記動きベクトルから予測する予測
音像定位制御手段と、ある予測位置と次の予測位置の間
に補間により複数の補間位置を設定する補間音像定位制
御手段と、音響信号に対して前記補間位置および予測位
置への音像定位を行う音像定位処理手段とを具備したこ
とを特徴とする音像定位制御装置。 - 【請求項5】 請求項3または請求項4に記載の音像定
位制御装置において、前記予測音像定位制御手段は、前
記音像定位処理の終了までの処理時間を予測ベクトル算
出時間cとし、フレーム間時間をtとし、動きベクトル
における単位時間をTとするとき、c<n・tとなる最
小の正の整数nを求め、動きベクトル{r→}にn・t
/Tを乗算して予測ベクトル{x→}を算出することを
特徴とする音像定位制御装置。 - 【請求項6】 映像信号から画面上の発音体の動きベク
トル(単位時間での発音体の画面上での移動方向および
移動距離を表すベクトル)を検出する動きベクトル検出
手段と、音響信号に対して前記動きベクトルに基づく音
像定位を行う音像定位処理手段と、映像信号を一時的に
蓄積し前記動きベクトルの検出から音像定位処理の終了
までの処理時間だけ遅延させて前記映像信号を出力する
映像蓄積処理手段とを具備したことを特徴とする音像定
位制御装置。 - 【請求項7】 請求項3から請求項6のいずれかに記載
の音像定位制御装置において、前記動きベクトル検出手
段は、ある発音体の動きベクトルとして複数の候補があ
るときそれらを出力するものであり、その動きベクトル
検出手段の後に、個々の発音体とそれに付随する音響信
号の対応関係を維持するように前記動きベクトルの複数
の候補中から1つを選定する追従音像定位制御手段を設
けたことを特徴とする音像定位制御装置。 - 【請求項8】 映像信号および音響信号を受信する受信
装置と、前記受信した映像信号に基づいて画面に画像を
表示する映像信号表示手段と、前記受信した音響信号に
対して音像定位処理を行う請求項3から請求項7のいず
れかに記載の音像定位制御装置と、その音像定位制御装
置から出力される音響信号に基づいて音響を再生する音
響信号再生装置とを備えたことを特徴とするテレビ会議
システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6320169A JPH08181962A (ja) | 1994-12-22 | 1994-12-22 | 音像定位方法および音像定位制御装置およびテレビ会議システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6320169A JPH08181962A (ja) | 1994-12-22 | 1994-12-22 | 音像定位方法および音像定位制御装置およびテレビ会議システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08181962A true JPH08181962A (ja) | 1996-07-12 |
Family
ID=18118472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6320169A Pending JPH08181962A (ja) | 1994-12-22 | 1994-12-22 | 音像定位方法および音像定位制御装置およびテレビ会議システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08181962A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003264900A (ja) * | 2002-03-07 | 2003-09-19 | Sony Corp | 音響提示システムと音響取得装置と音響再生装置及びその方法並びにコンピュータ読み取り可能な記録媒体と音響提示プログラム |
JP2006066939A (ja) * | 2004-08-24 | 2006-03-09 | National Institute Of Information & Communication Technology | 音響再現方法及び装置 |
WO2006093184A1 (ja) * | 2005-03-01 | 2006-09-08 | Pioneer Corporation | 映像編集装置、映像編集方法および映像編集を行うためのコンピュータプログラム |
WO2010061791A1 (ja) * | 2008-11-28 | 2010-06-03 | シャープ株式会社 | 映像制御装置およびそれを備えた撮像装置、表示装置 |
JP2015032844A (ja) * | 2013-07-31 | 2015-02-16 | Kddi株式会社 | 音声伝達装置、音声伝達方法 |
KR101674187B1 (ko) * | 2015-06-11 | 2016-11-09 | 서울과학기술대학교 산학협력단 | 광대역 보간법을 위한 입체음향 획득 장치 및 그 방법 |
WO2019098022A1 (ja) * | 2017-11-14 | 2019-05-23 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CN110602316A (zh) * | 2019-09-05 | 2019-12-20 | Oppo广东移动通信有限公司 | 电子设备及其控制方法 |
-
1994
- 1994-12-22 JP JP6320169A patent/JPH08181962A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003264900A (ja) * | 2002-03-07 | 2003-09-19 | Sony Corp | 音響提示システムと音響取得装置と音響再生装置及びその方法並びにコンピュータ読み取り可能な記録媒体と音響提示プログラム |
JP2006066939A (ja) * | 2004-08-24 | 2006-03-09 | National Institute Of Information & Communication Technology | 音響再現方法及び装置 |
WO2006093184A1 (ja) * | 2005-03-01 | 2006-09-08 | Pioneer Corporation | 映像編集装置、映像編集方法および映像編集を行うためのコンピュータプログラム |
WO2010061791A1 (ja) * | 2008-11-28 | 2010-06-03 | シャープ株式会社 | 映像制御装置およびそれを備えた撮像装置、表示装置 |
JP2015032844A (ja) * | 2013-07-31 | 2015-02-16 | Kddi株式会社 | 音声伝達装置、音声伝達方法 |
KR101674187B1 (ko) * | 2015-06-11 | 2016-11-09 | 서울과학기술대학교 산학협력단 | 광대역 보간법을 위한 입체음향 획득 장치 및 그 방법 |
WO2019098022A1 (ja) * | 2017-11-14 | 2019-05-23 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JPWO2019098022A1 (ja) * | 2017-11-14 | 2020-11-19 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US11722832B2 (en) | 2017-11-14 | 2023-08-08 | Sony Corporation | Signal processing apparatus and method, and program |
CN110602316A (zh) * | 2019-09-05 | 2019-12-20 | Oppo广东移动通信有限公司 | 电子设备及其控制方法 |
CN110602316B (zh) * | 2019-09-05 | 2021-04-13 | Oppo广东移动通信有限公司 | 电子设备及其控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5548346A (en) | Apparatus for integrally controlling audio and video signals in real time and multi-site communication control method | |
JP4310916B2 (ja) | 映像表示装置 | |
KR101901908B1 (ko) | 오디오 신호 처리 방법 및 그에 따른 오디오 신호 처리 장치 | |
JP2000512108A (ja) | 音源位置づけ方法と装置 | |
JP2007533189A (ja) | ビデオ・オーディオ同期 | |
US5907351A (en) | Method and apparatus for cross-modal predictive coding for talking head sequences | |
JP2001236093A (ja) | 電子機器制御装置および電子機器 | |
JP2016051081A (ja) | 音源分離装置、及び音源分離方法 | |
JP2006041887A (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
JPH07336660A (ja) | テレビ会議システム | |
JP2000175170A (ja) | 多地点テレビ会議システム及びその通信方法 | |
JPH1051889A (ja) | 音声収集装置及び音声収集方法 | |
TW201926316A (zh) | 語音信號識別方法和裝置 | |
JPH08181962A (ja) | 音像定位方法および音像定位制御装置およびテレビ会議システム | |
JP2012134923A (ja) | 音声処理装置および方法、並びにプログラム | |
JP4725918B2 (ja) | 番組画像配信システム、番組画像配信方法及びプログラム | |
Li et al. | Audiovisual source association for string ensembles through multi-modal vibrato analysis | |
JP2003037826A (ja) | 代理画像表示装置およびテレビ電話装置 | |
Novoa et al. | Weighted delay-and-sum beamforming guided by visual tracking for human-robot interaction | |
Li et al. | Online audio-visual source association for chamber music performances | |
US20220224970A1 (en) | Signal processing device and signal processing system | |
TWI751866B (zh) | 影音通訊系統及其控制方法 | |
CN114205400A (zh) | 通信控制方法 | |
JPH10143151A (ja) | 指揮装置 | |
JPH06217276A (ja) | 動画像符号化装置 |