JPH01296900A - 音像定位制御方式 - Google Patents

音像定位制御方式

Info

Publication number
JPH01296900A
JPH01296900A JP63128710A JP12871088A JPH01296900A JP H01296900 A JPH01296900 A JP H01296900A JP 63128710 A JP63128710 A JP 63128710A JP 12871088 A JP12871088 A JP 12871088A JP H01296900 A JPH01296900 A JP H01296900A
Authority
JP
Japan
Prior art keywords
sounding body
sound image
signal
localization
image localization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63128710A
Other languages
English (en)
Other versions
JP2691185B2 (ja
Inventor
Naofumi Inmaki
印牧 直文
Fumio Kishino
岸野 文郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63128710A priority Critical patent/JP2691185B2/ja
Publication of JPH01296900A publication Critical patent/JPH01296900A/ja
Application granted granted Critical
Publication of JP2691185B2 publication Critical patent/JP2691185B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Stereophonic System (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明はビデオ信号に含まれる顔、口、楽器等の発音
体の画像パターンを識別抽出し、その発音体画像パター
ンの表示画面上の位置座標の計数結果に基づいて、その
発音体の音像定位を動的に移動させる音像定位制御方式
に関するものである。
「従来の技術」 多地点間のテレビ会°議に関して、各地点から送られて
くるオーディオ信号とビデオ信号を受信し、これらのビ
デオ信号を分割画面で同一の表示画面で会議の臨場感を
再現するように音像・映1象の再生・表示を行う通信会
議システムが知られている。
第5図は従来のシステム例で、受信側の表示画面1に3
地点から送られてくるビデオ信号を分割画面2で同時に
合成表示している。表示画面1には発音体3である人物
、顔等が映し出され、各々の発音体3のオーディオ信号
はマイクロホン4を通じて会議の臨場感を再現させるた
めに音数定位処理をほどこされて複数の再生スピーカ5
に出力される。会議に際しては会議を効果的に進行させ
るため、会議内容(二関連する物品類を実際に持ち込ん
で説明したり、黒板等の表示補助装置を用いて説明する
ことが多い。この場合人物とこれらの装置を映し出すた
めに視野が拡大し、その説明を行っている分割画面2は
臨場感の観点から他の地点から送られてくる人物・顔の
大きさに合わせるために相対的に前記他地点からの分割
画面2よりも表示領域が大きくなる。これ(二伴なって
音像定位の範囲6がアンバランスになり(a)b=c)
音の臨場感が低下するという欠点がある。即ち表示領域
が大きい分割画面2に含まれる発音体3が左右に移動し
た際の音像定位精度が他に比べて相対的に低下し、画面
全体の音像定位精度が不均一になり自然さが損われる欠
点がある。
これに対処するため表示領域が大きい分割画面2に対し
ては、送信側にマイクロホン4の個数を増加して設置す
る方法が考えられるが、分割画面2の相対的比率を考慮
して送信側で逐次マイクロホン4の個数を調整する必要
があり、これが通信会議設営の簡便性・容易性を低下さ
せるとともに、各マイクロホンから入力された信号を通
す通信回線数が増加し、通信コストを増加させるという
欠点がある。
更にマイクロホン4を増加させても上下方向の微小な音
像定位を再現し難いという欠点もある。
この発明の目的は通信会議の臨場感を効率的に再現する
ことをねらいとし、上記従来の欠点を除去するため、ビ
デオ信号(ユ含まれる顔、口、楽器等の発音体の画像パ
ターンを識別抽出し、その発音体画像パターンの表示画
面上の位置座標の計数結果に基づいて前記発音体の音像
定位を前記発音体画像パターンの動きに追従して動的に
移動させる音像定位制御方式を提供することにある。
「課題を解決するための手段」 この発明によればオーディオ信号、ビデオ信号を含む信
号を受信し、これを信号分配合成手段でオーディオ信号
とビデオ信号とに分配し、そのビデオ信号に含まれる顔
、口、楽器などの発音体の画像パターンを識別抽出し、
画面上のその発音体の位置座標が発音体位置座標抽出手
段で抽出され、その抽出された位置座標に追従して音像
定位が音数定位処理手段C:より形成される。
つまりこの発明は発音体の画像パターンの動きC:追従
してその発音体の音像定位を動的(=変化させ、その発
音体の画像パターン位置と発音体の音1象定位位置とを
一致させるように音像定位を制御する。
第6図はこの発明の特徴例を示している。従来の技術と
の相違点は、発音体の動きを精度高く音像定位させるた
め、送信側のマイクロホフ個数を増加させることなく、
発音体3の画像パターン7を追従し画面2における発音
体3の位置座標(x。
y)を計数し、これに基づき音像定位させる点である(
第6因A)。
第6図Bは画像パターン7(=連動してタイビン形マイ
クロホン等の単一のマイクロホン4より入力されたオー
ディオ信号から音像定位するための複数の再生スピーカ
5に出力するイメージを示している。
第7因は精度の高い音像定位を実現するための再生スピ
ーカ5の配置と映像を出力する表示画面1との関係(正
面図)を示している。第7因Aは表示画面1の周囲に再
生スピーカ5を複数個設置する形態、同1kBは表示画
面の裏側に再生スピーカ5を複数個設置し、表示画面の
中から音が発生するように感じさせる形態である。同図
Cは同(2)Bの形態を更にきめ細かく設置した形態で
ある。
「実施例」 第1図はこの発明の実施例の構成を示すブロック・図で
あって、10は入力端子、20はビデオ信号、21はオ
ーディオ信号、22は画面合成したビデオ信号、30は
ビデオ出力端子、40はオーディオ再生出力端子、10
0は信号分配合成部、200は発音体位置座標抽出部、
300は音像定位処理部、310は定位データメモリ、
400は制御部である。
これを動作する(−は制御部400の指令により、信号
分配合成部100は入力端子10から転送された入力信
号を受信し、ビデオ信号20とオーディオ信号21とに
分配し、オーディオ信号21を音像定位処理部300に
、又ビデオ信号2oを発音体位置座標抽出部200に転
送するとともに、定位データメモリ310の内容に基づ
いて分配されたビデオ信号を同一画面に分割表示するた
めの画面合成を行い、画面合成したビデオ信号22をビ
デオ出力端子30に出力する。
ビデオ信号20を受信すると、それぞれのビデオ信号を
対象にして発音体位置座標抽出部200は定位データメ
モリ310に格納されている識別用画像形状情報(二基
づいて顔、口、楽器等の発音体3の画像パターン7の画
像形状を抽出しつつその発音体画像パターン7の動きに
追従する画像処理を行うとともに発音体画像パターン7
の画面2における位置座標を計数し、その計数結果を音
像定位処理部300に転送する。転送が完了すると音像
定位処理部300はその計数結果に基づいて発音体画像
パターン7の動きの変化量、動きの方向等を算出し、そ
の算出結果に基づいて新たに動いた発音体側[象パター
ンの位置に、対応する音像定位を一致させるように信号
分配合成部100から送られてくるオーディオ信号21
に対して逐次音圧差、位相差(時間おくれ)を制御して
音(象定位の移動処理を行い、移動処理したオーディオ
信号を逐次オーディオ再生出力端子4,0に出力する。
発音体画像パターン7が動いていない場合は、音像定位
処理部300は現時点での音像定位を保持してその保持
オーディオ信号をオーディオ再生出力端子40に出力す
る。
第2図はこの発明中の発音体位置座標抽出部2・00の
構成例を示す。210は発音体画像追跡処理部、220
は発音体位置計数部である。
信号分配合成部100から転送されてくるビデオ信号に
対して発音体画像追跡処理部210は定位データメモ!
13101m格納されている顔、口、楽器等の発音体の
識別用画像形状情報(二基づいてその発音体の画像パタ
ーン7を追跡処理を行う。
その追跡処理結果に基づいて発音体位置計数部220は
画面2における発音体画像パターン7の位置座標を計数
し、その計数結果(−基づいて音像定位の移動を図る音
像定位処理部300にその計数結果を転送する。
第3図はこの発明中の信号分配合成部の構成例を示すブ
ロック図であって、110は信号分配部、120は信号
合成部である。制御部400の指令により、信号分配部
110は多地点から送られてくる複数の信号を入力端子
10を介して受信し、その信号からオーディオ信号21
とビデオ信号20とを分配し、そのオーディオ信号21
を音像定位処理部300に、又ビデオ信号20を信号合
成部120と発音体位置座標抽出部200に転送する。
転送受信後、信号合成部120は定位データメモリ31
0に格納きれている各ビデオ信号C二関する表示画面1
での分割画面2の割当てデータ(二基づいて分配された
ビデオ信号20を同一画面に分割表示するための画面合
成を行い、画面合成したビデオ信号22をビデオ出力端
子30に出力する。
第4図はこの発明中の音像定位処理部300の構成例を
示すブロック図であって、310は分割画面領域の割当
てデータ、顔、口、楽器等の発音体の識別用画像形状情
報、現時点での音像定位状態等を格納する定位データメ
モリであり、320は音像移動制御部で、330は音像
定位形成部である。
音像移動制御部320は発音体位置座標抽出部200か
ら転送されてくる発音体画数パターンの表示画面上の位
置座標計数結果に基づいてその発音体画像パターンの動
きの変化量、動きの方向等を算出し、その算出結果を音
1象定位形成部330に転送する。転送完了後、音像定
位形成部330は・定位データメモリ310に格納され
ている現時点での音1象定位状聾と、前記算出結果に基
づいて音像定位の移動処理を逐次行い処理されたオーデ
ィオ信号をオーディオ再生出力端モ40に出力する。音
像定位の移動完了後、音像定位形成部330は移動後の
音像定位状態のデータを定位データメモリ310(二転
送し、定位データメモリ310はその定位状態のデータ
を用いて現時点での音像定位状態のデータを書き換える
なお複数の発音体の画1象パターンを同時に抽出し、ビ
デオ信号が表示する画面上において同時に複数の発音体
側1象パターンを追跡し、各々の発音体画像パターンの
画面上の位置座標を計数して複数の発音体側1象パター
ンの位置座標を並列処理して複数の画像とその音像につ
いて定位させることもできる。
「発明の効果」 以上説明したように、この発明による音像定位制御方式
によれば、発音体の画像パターンを識別抽出しその画像
パターンの動きに追従して発音体の音像定位を動的に変
化させ、その発音体の画像パターン位置とその発音体の
音数定位位置とを一致させるように音1象定位を制御す
ることから、通信会議の臨場感をきめ細く再現できる利
点がある。
即ち分割された画面の表示領域の大きさに大小が生じた
場合にも、各発音体のオーディオ信号のみを例えばタイ
ピン形のマイクロホン等を介して受信し、その発音体の
各画)象パターンの位置を識別抽出してその抽出位置情
報を用いることによって音]象定位の精度を向上させる
ことができる利点がある。
また発音体の移動に伴う音像定位方法(二関して送信側
のマイクロホンの個数を増加させる必要がなく、各々の
マイクロホンに付随する通信回線を確医する必要がない
ことから通信コスト面で浸れているという利点がある。
またマイクロホンの個数を最小限にとどめられることか
ら設営の簡便性・容易性の点でも摩れている。
【図面の簡単な説明】
第1図はこの発明の実施例の構成を示すブロック、因、
第2図は第1因中の発音体位置座標抽出部200の構成
を示すブロック図、第3図は第1図中の信号分配合成部
100の構成を示すブロック図、第4図は第1囚中の音
像定位処理部300の構成を示すブロック図、第5図は
従来のシステム例を示す図、第6図はこの発明の特徴例
を示す図、第7図は精度の高い音1象定位を実現するた
めの再生スピーカ配置と映像を出力する表示画面との関
係を示す図である。 特許出願人  日本電信電話株式会社 代  理  人   草   野     卓オ 1 
図 +72 図 オ 3 図 、”174  同 1oO 木 5図 中 6 図 A                     8士 
7 図

Claims (1)

    【特許請求の範囲】
  1. (1)オーディオ信号、ビデオ信号を含む信号を受信し
    、その信号から音像定位を形成し映像を合成して視聴者
    に再生・表示する制御システムであって、 前記オーディオ信号と前記ビデオ信号とを分配し、信号
    を合成する信号分配合成手段と、前記ビデオ信号に含ま
    れる顔、口、楽器等の発音体の画像パターンを識別抽出
    し、画面上のその発音体の位置座標を抽出する発音体位
    置座標抽出手段と、 前記位置座標に追従して音像定位を形成する音像定位処
    理手段とを具備することを特徴とする音像定位制御方式
JP63128710A 1988-05-25 1988-05-25 音像定位制御方式 Expired - Lifetime JP2691185B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63128710A JP2691185B2 (ja) 1988-05-25 1988-05-25 音像定位制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63128710A JP2691185B2 (ja) 1988-05-25 1988-05-25 音像定位制御方式

Publications (2)

Publication Number Publication Date
JPH01296900A true JPH01296900A (ja) 1989-11-30
JP2691185B2 JP2691185B2 (ja) 1997-12-17

Family

ID=14991517

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63128710A Expired - Lifetime JP2691185B2 (ja) 1988-05-25 1988-05-25 音像定位制御方式

Country Status (1)

Country Link
JP (1) JP2691185B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02209100A (ja) * 1989-02-09 1990-08-20 Nec Home Electron Ltd ステレオ音声付き情報処理システム
JP2003264900A (ja) * 2002-03-07 2003-09-19 Sony Corp 音響提示システムと音響取得装置と音響再生装置及びその方法並びにコンピュータ読み取り可能な記録媒体と音響提示プログラム
JP2006074386A (ja) * 2004-09-01 2006-03-16 Fujitsu Ltd 立体音響再生方法、通信装置及びプログラム
JP2007306470A (ja) * 2006-05-15 2007-11-22 Sharp Corp 映像音声再生装置、及びその音像移動方法
JP2010041484A (ja) * 2008-08-06 2010-02-18 Pioneer Electronic Corp 映像音声出力装置
JP2010041483A (ja) * 2008-08-06 2010-02-18 Pioneer Electronic Corp 映像音声出力装置
JP2010041485A (ja) * 2008-08-06 2010-02-18 Pioneer Electronic Corp 映像音声出力装置
WO2010061791A1 (ja) * 2008-11-28 2010-06-03 シャープ株式会社 映像制御装置およびそれを備えた撮像装置、表示装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10158958B2 (en) 2010-03-23 2018-12-18 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
CN104822036B (zh) 2010-03-23 2018-03-30 杜比实验室特许公司 用于局域化感知音频的技术
CN105989845B (zh) 2015-02-25 2020-12-08 杜比实验室特许公司 视频内容协助的音频对象提取

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02209100A (ja) * 1989-02-09 1990-08-20 Nec Home Electron Ltd ステレオ音声付き情報処理システム
JP2003264900A (ja) * 2002-03-07 2003-09-19 Sony Corp 音響提示システムと音響取得装置と音響再生装置及びその方法並びにコンピュータ読み取り可能な記録媒体と音響提示プログラム
JP2006074386A (ja) * 2004-09-01 2006-03-16 Fujitsu Ltd 立体音響再生方法、通信装置及びプログラム
JP2007306470A (ja) * 2006-05-15 2007-11-22 Sharp Corp 映像音声再生装置、及びその音像移動方法
JP2010041484A (ja) * 2008-08-06 2010-02-18 Pioneer Electronic Corp 映像音声出力装置
JP2010041483A (ja) * 2008-08-06 2010-02-18 Pioneer Electronic Corp 映像音声出力装置
JP2010041485A (ja) * 2008-08-06 2010-02-18 Pioneer Electronic Corp 映像音声出力装置
WO2010061791A1 (ja) * 2008-11-28 2010-06-03 シャープ株式会社 映像制御装置およびそれを備えた撮像装置、表示装置

Also Published As

Publication number Publication date
JP2691185B2 (ja) 1997-12-17

Similar Documents

Publication Publication Date Title
US20050281411A1 (en) Binaural horizontal perspective display
US4418243A (en) Acoustic projection stereophonic system
EP3363212A1 (en) Distributed audio capture and mixing
JP2001503165A (ja) 音声会議システム中に空間音声環境を作る装置と方法
US20150189455A1 (en) Transformation of multiple sound fields to generate a transformed reproduced sound field including modified reproductions of the multiple sound fields
Wenzel Three-dimensional virtual acoustic displays
EP3422744B1 (en) An apparatus and associated methods
JPH01296900A (ja) 音像定位制御方式
CN101006492A (zh) 水平透视显示
US20220225052A1 (en) Moving an Emoji to Move a Location of Binaural Sound
US12010490B1 (en) Audio renderer based on audiovisual information
Casey et al. Vision steered beam-forming and transaural rendering for the artificial life interactive video environment (alive)
JP3452348B2 (ja) 仮想空間における発話者特定方法及びそのプログラムを記録した記録媒体
Malham Toward reality equivalence in spatial sound diffusion
CN114520950B (zh) 音频输出方法、装置、电子设备及可读存储介质
JPH01121000A (ja) オーディオ再生装置
JP2523367B2 (ja) 音声再生方式
Hollier et al. Spatial audio technology for telepresence
JPH06301390A (ja) 立体音像制御装置
JP3363921B2 (ja) 音像定位装置
KR100238072B1 (ko) 화상회의시스템을 위한 가상공간 구현장치
JPH04191885A (ja) 音像制御処理方法
US20240022855A1 (en) Stereo enhancement system and stereo enhancement method
Geronazzo et al. Customized 3D sound for innovative interaction design
KR100284457B1 (ko) 삼차원으로 녹음시킬 수 있는 음원의 처리방법

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070905

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080905

Year of fee payment: 11