JP2691185B2 - 音像定位制御方式 - Google Patents

音像定位制御方式

Info

Publication number
JP2691185B2
JP2691185B2 JP63128710A JP12871088A JP2691185B2 JP 2691185 B2 JP2691185 B2 JP 2691185B2 JP 63128710 A JP63128710 A JP 63128710A JP 12871088 A JP12871088 A JP 12871088A JP 2691185 B2 JP2691185 B2 JP 2691185B2
Authority
JP
Japan
Prior art keywords
sound image
sounding body
image
sound
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63128710A
Other languages
English (en)
Other versions
JPH01296900A (ja
Inventor
直文 印牧
文郎 岸野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63128710A priority Critical patent/JP2691185B2/ja
Publication of JPH01296900A publication Critical patent/JPH01296900A/ja
Application granted granted Critical
Publication of JP2691185B2 publication Critical patent/JP2691185B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Stereophonic System (AREA)

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明はビデオ信号に含まれる顔、口、楽器等の発
音体の画像パターンを識別抽出し、その発音体画像パタ
ーンの表示画面上の位置座標の計数結果に基づいて、そ
の発音体の音像定位を動的に移動させる音像定位制御方
式に関するものである。
「従来の技術」 多地点間のテレビ会議に関して、各地点から送られて
くるオーディオ信号とビデオ信号を受信し、これらのビ
デオ信号を分割画面で同一の表示画面で会議の臨場感を
再現するように音像・映像の再生・表示を行う通信会議
システムが知られている。
第5図は従来のシステム例で、受信側の表示画面1に
3地点から送られてくるビデオ信号を分割画面2で同時
に合成表示している。表示画面1には発音体3である人
物、顔等が映し出され、各々の発音体3のオーディオ信
号はマイクロホン4を通じて会議の臨場感を再現させる
ために音像定位処理をほどこされて複数の再生スピーカ
5に出力される。会議に際しては会議を効果的に進行さ
せるため、会議内容に関連する物品類を実際に持ち込ん
で説明したり、黒板等の表示補助装置を用いて説明する
ことが多い。この場合人物とこれらの装置を映し出すた
めに視野が拡大し、その説明を行っている分割画面2は
臨場感の観点から他の地点から送られてくる人物・顔の
大きさに合わせるために相対的に前記他地点からの分割
画面2よりも表示領域が大きくなる。これに伴なって音
像定位の範囲6がアンバランスになり(a>b=c)音
の臨場感が低下するという欠点がある。即ち表示領域が
大きい分割画面2に含まれる発音体3が左右に移動した
際の音像定位精度が他に比べて相対的に低下し、画面全
体の音像定位精度が不均一になり自然さが損われる欠点
がある。
これに対処するため表示領域が大きい分割画面2に対
しては、送信側にマイクロホン4の個数を増加して設置
する方法が考えられるが、分割画面2の相対的比率を考
慮して送信側で逐次マイクロホン4の個数を調整する必
要があり、これが通信会議設営の簡便性・容易性を低下
させるとともに、各マイクロホンから入力された信号を
通す通信回線数が増加し、通信コストを増加させるとい
う欠点がある。
更にマイクロホン4を増加させても上下方向の微小な
音像定位を再現し難いという欠点もある。
この発明の目的は通信会議の臨場感を効率的に再現す
ることをねらいとし、上記従来の欠点を除去するため、
ビデオ信号に含まれる顔、口、楽器等の発音体と画像パ
ターンを識別抽出し、その発音体画像パターンの表示画
面上の位置座標の計数結果に基づいて前記発音体の音像
定位を前記発音体画像パターンの動きに追従して動的に
移動させる音像定位制御方式を提供することにある。
「課題を解決するための手段」 この発明によればオーディオ信号、ビデオ信号を含む
信号を受信し、これを信号分配手段でオーディオ信号と
ビデオ信号とに分配し、その分配されたビデオ信号に含
まれる、その再生画面上の画像パターンのうち顔、口、
楽器などの音を発する発音体の画像パターンを識別抽出
し、画面上のその発音体の画像パターンの位置座標が発
音体位置座標抽出手段で抽出され、その抽出された位置
座標に追従して音像定位が音像定位処理手段により形成
される。
つまりこの発明は発音体の画像パターンの動きに追従
してその発音体の音像定位を動的に変化させ、その発音
体の画像パターン位置と発音体の音像定位位置とを一致
させるように音像定位を制御する。
第6図はこの発明の特徴例を示している。従来の技術
との相違点は、発音体の動きを精度高く音像定位させる
ため、送信側のマイクロホン個数を増加させることな
く、発音体3の画像パターン7を追従し画面2における
発音体3の位置座標(x,y)を計数し、これに基づき音
像定位させる点である(第6図A)。
第6図Bは画像パターン7に連動してタイピン形マイ
クロホン等の単一のマイクロホン4より入力されたオー
ディオ信号から音像定位するための複数の再生スピーカ
5に出力するイメージを示している。
第7図は精度の高い音像定位を実現するための再生ス
ピーカ5の配置と映像を出力する表示画面1との関係
(正面図)を示している。第7図Aは表示画面1の周囲
に再生スピーカ5を複数個設置する形態、同図Bは表示
画面の裏側に再生スピーカ5を複数個設置し、表示画面
の中から音が発生するように感じさせる形態である。同
図Cは同図Bの形態を更にきめ細かく設置した形態であ
る。
「実施例」 第1図はこの発明の実施例の構成を示すブロック図で
あって、10は入力端子、20はビデオ信号、21はオーディ
オ信号、22は画面合成したビデオ信号、30はビデオ出力
端子、40はオーディオ再生出力端子、100は信号分配合
成部、200は発音体位置座法抽出部、300は音像定位処理
部、310は定位データメモリ、400は制御部である。
これを動作するには制御部400の指令により、信号分
配合成部100は入力端子10から転送された入力信号を受
信し、ビデオ信号20とオーディオ信号21とに分配し、オ
ーディオ信号21を音像定位処理部300に、又ビデオ信号2
0を発音体位置座標抽出部200に転送するとともに、定位
データメモリ310の内容に基づいて分配されたビデオ信
号を同一画面に分割表示するための画面合成を行い、画
面合成したビデオ信号22をビデオ出力端子30に出力す
る。
ビデオ信号20を受信すると、それぞれのビデオ信号を
対象にして発音体位置座標抽出部200は定位データメモ
リ310に格納されている識別用画像形状情報に基づいて
顔、口、楽器等の発音体3の画像パターン7の画像形状
を抽出しつつその発音体画像パターン7の動きに追従す
る画像処理を行うとともに発音体画像パターン7の画面
2における位置座標を計数し、その計数結果を音像定位
処理部300に転送する。転送が完了すると音像定位処理
部300はその計数結果に基づいて発音体画像パターン7
の動きの変化量、動きの方向等を算出し、その算出結果
に基づいて新たに動いた発音体画像パターンの位置に、
対応する音像定位を一致させるように信号分配合成部10
0から送られてくるオーディオ信号21に対して逐次音圧
差、位相差(時間おくれ)を制御して音像定位の移動処
理を行い、移動処理したオーディオ信号を逐次オーディ
オ再生出力端子40に出力する。発音体画像パターン7が
動いていない場合は、音像定位処理部300は現時点での
音像定位を保持してその保持オーディオ信号をオーディ
オ再生出力端子40に出力する。
第2図はこの発明中の発音体位置座標抽出部200の構
成例を示す。210は発音体画像追跡処理部、220は発音体
位置計数部である。
信号分配合成部100から転送されてくるビデオ信号に
対して発音体画像追跡処理部210は定位データメモリ310
に格納されている顔、口、楽器等の発音体の識別用画像
形状情報に基づいてその発音体の画像パターン7を追跡
処理を行う。その追跡処理結果に基づいて発音体位置計
数部220は画面2における発音体画像パターン7の位置
座標を計数し、その計数結果に基づいて音像定位の移動
を図る音像定位処理部300にその計数結果を転送する。
第3図はこの発明中の信号分配合成部の構成例を示す
ブロック図であって、110は信号分配部120は信号合成部
である。制御部400の指令により、信号分配部110は多地
点から送られてくる複数の信号を入力端子10を介して受
信し、その信号からオーディオ信号21とビデオ信号20と
を分配し、そのオーディオ信号21を音像定位処理部300
に、又ビデオ信号20を信号合成部120と発音体位置座標
抽出部200に転送する。転送受信後、信号合成部120は定
位データメモリ310に格納されている各ビデオ信号に関
する表示画面1での分割画面2の割当てデータに基づい
て分配されたビデオ信号20を同一画面に分割表示するた
めの画面合成を行い、画面合成したビデオ信号22をビデ
オ出力端子30に出力する。
第4図はこの発明中の音像定位処理部300の構成例を
示すブロック図であって、310は分割画面領域の割当て
データ、顔、口、楽器等の発音体の識別用画像形状情
報、現時点での音像定位状態等を格納する定位データメ
モリであり、320は音像移動制御部で、330は音像定位形
成部である。
音像移動制御部320は発音体位置座標抽出部200から転
送されてくる発音体画像パターンの表示画像上の位置座
標計数結果に基づいてその発音体画像パターンの動きの
変化量、動きの方向等を算出し、その算出結果を音像定
位形成部330に転送する。転送完了後、音像定位形成部3
30は定位データメモリ310に格納されている現時点での
音像定位状態と、前記算出結果に基づいて音像定位の移
動処理を逐次行い処理されたオーディオ信号をオーディ
オ再生出力端子40に出力する。音像定位の移動完了後、
音像定位形成部330は移動後の音像定位状態のデータを
定位データメモリ310に転送し、定位データメモリ310は
その定位状態のデータを用いて現時点での音像定位状態
のデータを書き換える。
なお複数の発音体の画像パターンを同時に抽出し、ビ
デオ信号が表示する画面上において同時に複数の発音体
画像パターンを追跡し、各々の発音体画像パターンの画
面上の位置座標を計数して複数の発音体画像パターンの
位置座標を並列処理して複数の画像とその音像について
定位させることもできる。
「発明の効果」 以上説明したように、この発明による音像定位制御方
式によれば、発音体の画像パターンを識別抽出しその画
像パターンの動きに追従して発音体の音像定位を動的に
変化させ、その発音体の画像パターン位置とその発音体
の音像定位位置とを一致させるように音像定位を制御す
ることから、通信会議の臨場感をきめ細く再現できる利
点がある。即ち分割された画面の表示領域の大きさに大
小が生じた場合にも、各発音体のオーディオ信号のみを
例えばタイピン形のマイクロホン等を介して受信し、そ
の発音体の各画像パターンの位置を識別抽出してその抽
出位置情報を用いることによって音像定位の精度を向上
させることができる利点がある。
また発音体の移動に伴う音像定位方法に関して送信側
のマイクロホンの個数を増加させる必要がなく、各々の
マイクロホンに付随する通信回線を確保する必要がない
ことから通信コスト面で優れているという利点がある。
またマイクロホンの個数を最小限にとどめられることか
ら設営の簡便性・容易性の点でも優れている。
【図面の簡単な説明】
第1図はこの発明の実施例の構成を示すブロック図、第
2図は第1図中の発音体位置座標抽出部200の構成を示
すブロック図、第3図は第1図中の信号分配合成部100
の構成を示すブロック図、第4図は第1図中の音像定位
処理部300の構成を示すブロック図、第5図は従来のシ
ステム例を示す図、第6図はこの発明の特徴例を示す
図、第7図は精度の高い音像定位を実現するための再生
スピーカ配置と映像を出力する表示画面との関係を示す
図である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】オーディオ信号、ビデオ信号を含む信号を
    受信し、その信号から音像定位を形成し映像を合成して
    視聴者に再生・表示する制御システムであって、 前記オーディオ信号と前記ビデオ信号とを分配する信号
    分配手段と、 前記分配されたビデオ信号に含まれ、その再生画面上の
    画像パターンのうち顔、口、楽器等の音を発する発音体
    の画像パターンを識別抽出し、画面上のその発音体の画
    像パターンの位置座標を抽出する発音体位置座標抽出手
    段と、 前記抽出された位置座標に追従して音像定位を形成する
    音像定位処理手段とを具備することを特徴とする音像定
    位制御方式。
JP63128710A 1988-05-25 1988-05-25 音像定位制御方式 Expired - Lifetime JP2691185B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63128710A JP2691185B2 (ja) 1988-05-25 1988-05-25 音像定位制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63128710A JP2691185B2 (ja) 1988-05-25 1988-05-25 音像定位制御方式

Publications (2)

Publication Number Publication Date
JPH01296900A JPH01296900A (ja) 1989-11-30
JP2691185B2 true JP2691185B2 (ja) 1997-12-17

Family

ID=14991517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63128710A Expired - Lifetime JP2691185B2 (ja) 1988-05-25 1988-05-25 音像定位制御方式

Country Status (1)

Country Link
JP (1) JP2691185B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8755543B2 (en) 2010-03-23 2014-06-17 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
US10158958B2 (en) 2010-03-23 2018-12-18 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
US10200804B2 (en) 2015-02-25 2019-02-05 Dolby Laboratories Licensing Corporation Video content assisted audio object extraction

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02209100A (ja) * 1989-02-09 1990-08-20 Nec Home Electron Ltd ステレオ音声付き情報処理システム
JP4010161B2 (ja) * 2002-03-07 2007-11-21 ソニー株式会社 音響提示システムと音響再生装置及びその方法並びにコンピュータ読み取り可能な記録媒体と音響提示プログラム。
JP2006074386A (ja) * 2004-09-01 2006-03-16 Fujitsu Ltd 立体音響再生方法、通信装置及びプログラム
JP4713398B2 (ja) * 2006-05-15 2011-06-29 シャープ株式会社 映像音声再生装置、及びその音像移動方法
JP2010041485A (ja) * 2008-08-06 2010-02-18 Pioneer Electronic Corp 映像音声出力装置
JP2010041483A (ja) * 2008-08-06 2010-02-18 Pioneer Electronic Corp 映像音声出力装置
JP2010041484A (ja) * 2008-08-06 2010-02-18 Pioneer Electronic Corp 映像音声出力装置
JP2010130403A (ja) * 2008-11-28 2010-06-10 Sharp Corp 映像制御装置およびそれを備えた撮像装置、表示装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8755543B2 (en) 2010-03-23 2014-06-17 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
US9172901B2 (en) 2010-03-23 2015-10-27 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
US9544527B2 (en) 2010-03-23 2017-01-10 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
US10158958B2 (en) 2010-03-23 2018-12-18 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
US10499175B2 (en) 2010-03-23 2019-12-03 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for audio reproduction
US10939219B2 (en) 2010-03-23 2021-03-02 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for audio reproduction
US11350231B2 (en) 2010-03-23 2022-05-31 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for audio reproduction
US10200804B2 (en) 2015-02-25 2019-02-05 Dolby Laboratories Licensing Corporation Video content assisted audio object extraction

Also Published As

Publication number Publication date
JPH01296900A (ja) 1989-11-30

Similar Documents

Publication Publication Date Title
JP3528284B2 (ja) 3次元サウンドシステム
JP2691185B2 (ja) 音像定位制御方式
EP0563929B1 (en) Sound-image position control apparatus
CN101370108B (zh) 图像显示装置和方法
US8571192B2 (en) Method and apparatus for improved matching of auditory space to visual space in video teleconferencing applications using window-based displays
US6430535B1 (en) Method and device for projecting sound sources onto loudspeakers
CN100481921C (zh) 声音产生方法和设备、声音再现方法和设备
US20050275914A1 (en) Binaural horizontal perspective hands-on simulator
US9967693B1 (en) Advanced binaural sound imaging
EP1182643A1 (en) Apparatus for and method of processing audio signal
WO1999033325A3 (en) Surround signal processing apparatus and method
JP2001503165A (ja) 音声会議システム中に空間音声環境を作る装置と方法
Wenzel Three-dimensional virtual acoustic displays
JP2017153083A (ja) 自動車でオーディオ信号を再生する装置及び方法
Casey et al. Vision steered beam-forming and transaural rendering for the artificial life interactive video environment (alive)
JP2671329B2 (ja) オーディオ再生装置
CN114520950B (zh) 音频输出方法、装置、电子设备及可读存储介质
JPH06301390A (ja) 立体音像制御装置
JP3363921B2 (ja) 音像定位装置
JP2714647B2 (ja) 画像連動形音声再生方式
JPH11313272A (ja) 映像音声出力装置
JPH06121311A (ja) 仮想現実空間供用システム
KR100238072B1 (ko) 화상회의시스템을 위한 가상공간 구현장치
JPH04191885A (ja) 音像制御処理方法
WO2002097372A1 (fr) Appareil de soutien aux operations

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070905

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 11