JPH09219858A - 映像音声符号化装置及び映像音声復号化装置 - Google Patents

映像音声符号化装置及び映像音声復号化装置

Info

Publication number
JPH09219858A
JPH09219858A JP5090796A JP5090796A JPH09219858A JP H09219858 A JPH09219858 A JP H09219858A JP 5090796 A JP5090796 A JP 5090796A JP 5090796 A JP5090796 A JP 5090796A JP H09219858 A JPH09219858 A JP H09219858A
Authority
JP
Japan
Prior art keywords
signal
audio
video
encoding
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5090796A
Other languages
English (en)
Inventor
Toshiaki Mori
敏昭 森
Minoru Nishioka
稔 西岡
Toshihiko Kurosaki
敏彦 黒崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5090796A priority Critical patent/JPH09219858A/ja
Publication of JPH09219858A publication Critical patent/JPH09219858A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Receiver Circuits (AREA)

Abstract

(57)【要約】 【課題】 映像編集時において音量の調整等の音声編集
を映像に対応させて自動的にできるようにすること。 【解決手段】 有効画素面積生成手段105は、入力さ
れた有効画素位置信号から1フレーム内の有効画素数を
求める。有効画素面積音量変換手段106は、この有効
画素数と前フレームの有効画素数の比に定数を乗じた値
を求め、この値と現在の音量調整値を乗じた値を新たな
音量調整値として、音量変換手段108を制御する。こ
れにより画面の動きに基づいて自動的に音量調整が行わ
れ、臨場感のある音響効果が得られる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画面内の有効領域
及び視線軸上の階層関係が定義された映像信号とそれに
付随する音声信号とを符号化する映像音声符号化装置、
及びこれを復号化する映像音声復号化装置に関するもの
である。
【0002】
【従来の技術】従来、映像信号に付随した音声信号を符
号化、あるいは復号化する場合、多チャンネル音声の各
チャンネルの入力音声信号の音量や音響効果の設定は、
通常音声の記録時そのままであるか、又は変更する場合
はミキシング装置により操作する必要がある。
【0003】
【発明が解決しようとする課題】しかしながら編集時に
おける音量調整などの音声編集は、映像編集とは別に行
わなければならず、編集者にとっては作業量が増すこと
になる。又実時間で映像音声を送信するときには、音声
のミキシング操作を行うことは困難であった。
【0004】そこで本発明は上記の点に鑑み、画像の内
容から自動的に音声の音量値や音響効果などの調整を行
うことができる映像音声符号化装置、及びこれを復号化
する復号化装置を提供することを目的とする。
【0005】
【課題を解決するための手段】この目的を達成するため
に本発明の映像音声符号化装置は、入力された有効画素
位置信号から画面内における有効画素の占める面積を特
徴付ける値を生成する有効画素面積生成手段、又は、入
力有効画素位置信号から画面内における有効画素の位置
を特徴付ける値を生成する有効画素位置生成手段を備
え、有効画素面積生成手段が生成した値、又は有効画素
位置生成手段が生成した値、又は階層画像信号の視線軸
上の階層の上下関係を示す値に従って音声符号化手段の
符号化パラメータを設定するものである。
【0006】本願の請求項1の発明は、画素値信号と有
効画素位置信号で構成される映像信号を入力として、前
記映像信号を符号化して映像符号化信号を出力する映像
符号化手段と、音声信号を入力として、前記音声信号を
符号化して音声符号化信号を出力する音声符号化手段
と、入力された有効画素位置信号から、画面内における
有効画素の占める面積を特徴付ける値を生成する有効画
素面積生成手段と、を具備し、前記音声符号化手段は、
前記有効画素面積生成手段が生成した値に従って符号化
パラメータを設定することを特徴とするものである。
【0007】本願の請求項2の発明は、画素値信号と有
効画素位置信号で構成される映像信号を入力として、前
記映像信号を符号化して映像符号化信号を出力する映像
符号化手段と、複数チャンネルで構成される音声信号を
入力として、前記音声信号を符号化して音声符号化信号
を出力する音声符号化手段と、入力された有効画素位置
信号から、画面内における有効画素の位置を特徴付ける
値を生成する有効画素位置生成手段と、を具備し、前記
音声符号化手段は、前記有効画素位置生成手段が生成し
た値に従って符号化パラメータを設定することを特徴と
するものである。
【0008】本願の請求項3の発明は、視線軸上の前後
関係を有する複数の階層画像信号を入力として、前記階
層画像信号を符号化して映像符号化信号を出力する複数
の映像符号化手段と、前記各階層画像信号に対し1対1
に付随する複数の音声信号を入力として、前記各階層画
像信号の視線軸上の階層の上下関係を示す値に従ってそ
の符号化パラメータを設定して前記音声信号を符号化し
て音声符号化信号を出力する複数の音声符号化手段と、
を具備することを特徴とするものである。
【0009】本願の請求項4の発明は、前記有効画素面
積生成手段の生成値を前記音声符号化手段の音量設定値
に変換する有効画素面積音量変換手段を更に具備し、前
記音声符号化手段は、入力された音声信号を前記有効画
素面積音量変換手段によって変換された音量に変換する
音量変換手段と、前記音量変換手段によって変換された
音声手段を符号化する符号化手段と、を有することを特
徴とするものである。
【0010】本願の請求項5の発明は、前記有効画素位
置生成手段の生成値を前記音声符号化手段の音量設定値
に変換する有効画素位置音量変換手段を更に具備し、前
記音声符号化手段は、入力された音声信号を前記有効画
素位置音量変換手段によって変換された音量に変換する
音量変換手段と、前記音量変換手段によって変換された
音声手段を符号化する符号化手段と、を有することを特
徴とするものである。
【0011】本願の請求項6の発明は、各階層画像の視
線上の上下関係を示す値を前記音声符号化手段の音量設
定値に変換する階層位置音量変換手段を更に具備し、前
記音声符号化手段は、入力された音声信号を前記階層位
置音量変換手段によって変換された音量に変換する音量
変換手段と、前記音量変換手段によって変換された音声
手段を符号化する符号化手段と、を有することを特徴と
するものである。
【0012】本願の請求項7の発明では、前記音声符号
化手段は、入力音声信号に対して音響効果を設定する音
響効果付与手段と、前記音響効果付与手段の出力を符号
化する符号化手段と、を有するものであり、前記有効画
素面積生成手段の出力を前記音響効果付与手段に与える
音響効果設定値に変換する有効画素面積効果設定値変換
手段を更に有することを特徴とするものである。
【0013】本願の請求項8の発明では、前記音声符号
化手段は、入力音声信号に対して音響効果を設定する音
響効果付与手段と、前記音響効果付与手段の出力を符号
化する符号化手段と、を有するものであり、前記有効画
素位置生成手段の出力を前記音響効果設定値に変換する
有効画素位置音響効果設定値変換手段を更に有すること
を特徴とするものである。
【0014】本願の請求項9の発明では、前記音声符号
化手段は、入力音声信号に対して音響効果を設定する音
響効果付与手段と、前記音響効果付与手段の出力を符号
化する符号化手段と、を有するものであり、階層位置信
号を音響効果設定値に変換する階層位置音響効果設定値
変換手段を更に有することを特徴とするものである。
【0015】本願の請求項10の発明は、前記映像符号
化手段が出力する映像符号化信号と前記音声符号化手段
が出力する音声符号化信号とデータ信号とを多重化する
多重化手段を備え、前記音声符号化手段に設定する符号
化パラメータを、前記映像符号化信号と、前記音声符号
化信号に多重化して出力することを特徴とするものであ
る。
【0016】又、本発明の映像音声復号化装置は、入力
された映像符号化信号に重畳された有効画素の占める面
積の変化を特徴付ける値、又は動きベクトル値、又は視
線軸上の階層の上下関係を示す値を、復号化された音声
信号の再生時の音量あるいは音響効果設定値に変換する
ものである。
【0017】本願の請求項11の発明は、請求項10記
載の映像音声符号化装置が出力する映像音声符号化信号
を復号化して映像信号,音声信号を出力する映像音声復
号化装置であって、前記映像音声符号化信号を映像符号
化信号と音声符号化信号と符号化パラメータとに分離す
る分離手段と、映像符号化信号を映像信号に復号化する
映像信号復号化手段と、音声符号化信号を音声信号に復
号化する音声信号復号化手段と、前記分離手段によって
分離された符号化パラメータを復号化される音声信号の
再生時の音量設定値に変換する音量変換手段と、を具備
することを特徴とするものである。
【0018】本願の請求項12の発明は、有効画素の占
める面積の変化を特徴付ける値が重畳されて符号化され
た映像符号化信号、及び音声符号化信号を入力とし、前
記映像符号化信号と音声符号化信号を復号化して映像信
号、音声信号を出力する映像音声復号化装置であって、
入力された映像符号化信号に重畳された有効画素の占め
る面積の変化を特徴付ける値を、復号化された音声信号
の再生時の音量設定値に変換する有効画素面積音量変換
手段を備えたことを特徴とするものである。
【0019】本願の請求項13の発明は、動きベクトル
値が重畳された映像符号化信号、及び複数チャンネルで
構成される音声符号化信号を入力とし、前記映像符号化
信号と音声符号化信号を復号化して映像信号、音声信号
を出力する映像音声復号化装置であって、入力された映
像符号化信号に重畳された動きベクトル値を、復号化さ
れた各チャンネルの音声信号の再生時の音量設定値に変
換する動きベクトル音量変換手段を備えたことを特徴と
するものである。
【0020】本願の請求項14の発明は、視線軸上の前
後関係を有する複数の階層画像信号と各階層画像の視線
軸上の階層の上下関係を示す値とを重畳して符号化され
た映像符号化信号、及び前記各階層画像信号に対し1対
1に付随する複数の音声符号化信号を入力とし、前記映
像符号化信号と音声符号化信号を復号化して映像信号、
音声信号を出力する映像音声復号化装置であって、入力
された映像符号化信号に重畳された視線軸上の階層の上
下関係を示す値を、復号化された音声信号の再生時の音
量設定値に変換する階層位置音量変換手段を備えたこと
を特徴とするものである。
【0021】本願の請求項15の発明は、複号化された
音声信号に対して音響効果が設定可能な音響効果付与手
段と、有効画素の占める面積の変化を特徴付ける値を前
記音響効果付与手段の音響効果設定値に変換する有効画
素面積音響効果変換手段と、を備え、前記音響効果付与
手段は、前記有効画素面積音響効果変換手段が生成した
音響効果設定値に従って音声信号に対して音響効果を付
与することを特徴とするものである。
【0022】本願の請求項16の発明は、複号化された
音声信号に対して音響効果が設定可能な音響効果付与手
段と、動きベクトル値を前記音響効果付与手段の音響効
果設定値に変換する動きベクトル音響効果変換手段と、
を備え、前記音響効果付与手段は、前記動きベクトル音
響効果変換手段が生成した音響効果設定値に従って音声
信号に対して音響効果を付与することを特徴とするもの
である。
【0023】本願の請求項17の発明は、複号化された
音声信号に対して音響効果が設定可能な音響効果付与手
段と、各階層画像の視線上の階層の上下関係を示す値を
前記音響効果付与手段の音響効果設定値に変換する階層
位置音響効果設定値変換手段と、を備え、前記音響効果
付与手段は、前記階層位置音響効果設定値変換手段が生
成した音響効果設定値に従って音声信号に対して音響効
果を付与することを特徴とするものである。
【0024】上記の本発明の映像音声符号化装置、及び
映像音声復号化装置によれば、音量や左右のバランスな
どを画面上の物体の動きに合わせることができるため、
臨場感のある音響効果が得られる。
【0025】
【発明の実施の形態】本発明の以下の各実施形態で説明
する映像音声符号化装置には、画素値信号と有効画素位
置信号で構成される映像信号が入力される。又図13に
示すように、画素値信号と有効画素位置信号を組み合わ
せて1つの階層画像が構成される。ここで画素値信号と
は、画像の輝度や色差といった信号値を表し、有効画素
位置信号とは階層画像において有効とされる画素の位置
を表す。階層画像は多層化されており、各階層画像間で
は視線軸の上下関係が順序付けられており、この順序で
階層画像を重ね合わせて1フレームの画像が構成され
る。有効でない画素位置では、下の階層の階層画像が再
生画像に表示される。
【0026】本発明の実施の形態を図面を用いて説明す
る。図1は請求項1,4記載の発明による映像音声符号
化装置の第1実施形態のブロック図である。図1におい
て、映像符号化手段101は画素値信号符号化手段10
2,画素位置信号符号化手段103と多重化手段104
とにより構成される。105は有効画素面積生成手段、
106は有効画素面積音量変換手段である。又音声符号
化手段107は外部からの制御により入力された音声信
号の音量レベルを調整する音量変換手段108と、その
信号を符号化する符号化手段109とにより構成され
る。
【0027】以上のように構成された映像音声符号化装
置の動作を説明する。入力された画素値信号は画素値信
号符号化手段102により符号化され、有効画素位置信
号は、画素位置信号符号化手段103により符号化され
る。符号化された画素値信号と有効画素位置信号は多重
化手段(MUX)104により多重化され、映像符号化
信号として出力される。
【0028】又有効画素面積生成手段105は、入力さ
れた有効画素位置信号より1フレーム内の有効画素数を
求める。有効画素面積音量変換手段106は、この有効
画素数と前フレームの有効画素数の比に定数を乗じた値
を求め、この値と現在の音量調整値を乗じた値を新たな
音量調整値として、音量変換手段108を制御する。
【0029】入力された音声信号は、音量変換手段10
8により音量レベルが調整された後、符号化手段109
により符号化され、音声符号化信号として出力される。
【0030】又本発明の異なる実施形態として、映像信
号符号化手段101がアフィン変換を使用して映像信号
を符号化する場合の構成を説明する。アフィン変換で
は、アフィン変換パラメータにより、画面上の任意の位
置の動きが表現される。この動きベクトルは、次式
(1)で示されるように、その位置を変数とする多項式
関数で表され、a0 〜a5 をアフィン変換パラメータと
いう。
【数1】 ここで、(x,y)は画像中の水平垂直位置、(u,
v)は動きベクトルの水平垂直成分である。
【0031】本実施形態では、図1の画素値信号符号化
手段102と画素位置信号符号化手段103がアフィン
変換パラメータを生成し、それが有効画素面積生成手段
105に入力されるように構成する。有効画素面積生成
手段105は、式(2)で示す演算を行い、Dを有効画
素数の変化を特徴づける値として有効画素面積音量変換
手段106に出力する。
【数2】 有効画素面積音量変換手段106は、この値Dに定数と
現在の音量調整値を乗じた値を新たな音量調整値とし
て、音量変換手段108を制御する。
【0032】以上の構成によれば、画面内の物体の大小
の変化に合わせて音量の大小が調整されるため、画面内
の物体が遠ざかったときに音量が小さくなるといったよ
うな、遠近感のある音響効果が得られる。
【0033】次に第2実施形態を図面を用いて説明す
る。図2は請求項2,5記載の発明による映像音声符号
化装置の第2実施形態のブロック図である。本図におい
て第1実施形態と同一部分は同一符号を付して詳細な説
明を省略する。図2において、205は有効画素位置生
成手段、206は有効画素位置音量変換手段である。又
音声符号化手段207は外部からの制御により右及び左
の音声信号の音量レベルを調整する音量変換手段20
8,209と、符号化手段210,211と、これらの
信号を多重化する音声多重化手段(MUX)212で構
成される。
【0034】以上のように構成された映像音声符号化装
置の動作を説明する。第1実施形態と同様に、入力され
た画素値信号と有効画素位置信号は映像符号化手段10
1により符号化され、映像符号化信号として出力され
る。又有効画素位置生成手段205は、入力された有効
画素位置信号より1フレーム内の有効画素の重心位置を
求める。有効画素位置音量変換手段206は、画面の中
央を原点、右方向を正として、この重心位置の水平座標
に定数を乗じて1を加えた値を求める。そしてこの値
と、音量変換手段208の現在の音量調整値を乗じた値
を新たな音量変換手段208の音量調整値として、音量
変換手段208を制御する。又有効画素位置音量変換手
段206が求めた値の逆数と、音量変換手段209の現
在の音量調整値を乗じた値を新たな音量変換手段209
の音量調整値として、音量変換手段209を制御する。
入力された音声信号は、音量変換手段208,209に
より音量レベルが調整された後、符号化手段210,2
11により符号化される。そして音声多重化手段212
で左右の音声符号化信号が多重化され、音声符号化信号
として出力される。
【0035】又本発明の異なる実施形態として、映像信
号符号化手段101がアフィン変換を使用して映像信号
を符号化する場合、アフィン変換パラメータが有効画素
位置生成手段205に入力されるように構成する。有効
画素位置生成手段205は、式(1)で動きベクトルの
水平成分を表す値a0 を有効画素位置音量変換手段20
6に出力する。有効画素位置音量変換手段206は、こ
の値に定数と現在の音量調整値を乗じた値を、現在の音
量と新たな音量の差分値として、音量変換手段208,
209を制御する。
【0036】以上の構成によれば、画面内の物体の左右
の位置に合わせて音量の左右のバランスが調整されるた
め、画面内の物体の動きに合った音声出力が得られる。
【0037】次に第3実施形態を図面を用いて説明す
る。図3は請求項3,6記載の発明の映像音声符号化装
置の第3実施形態のブロック図であり、映像信号が2つ
の階層からなる場合の例である。但し階層数が3以上で
あっても、同様の構成で実現可能である。図3におい
て、映像符号化手段101aと101bは図1の映像符
号化手段101と同じであり、音声符号化手段107a
と107bは図1の音声符号化手段107と同じであ
る。306a,306bは階層位置を音量に変換する階
層位置音量変換手段、307は映像信号多重化手段、3
08は音声信号多重化手段である。
【0038】以上のように構成された映像音声符号化装
置の動作を説明する。本実施形態の映像音声符号化装置
には視線軸上の前後関係を有する2つの階層画像信号が
夫々入力される。各階層の画像信号はその階層に固有の
音声信号を含んでおり、又画像信号として画素値信号と
有効画素位置信号を含んでいる。映像符号化手段101
a,101bに夫々入力された各階層の画素値信号と有
効画素位置信号は、図1の実施形態と同様に符号化され
る。符号化された各階層の映像符号化信号は映像信号多
重化手段307により多重化され、映像符号化信号とし
て出力される。又階層位置音量変換手段306a,30
6bには階層の視線軸上の位置を示す数値、例えば前景
であれば1、背景であれば2が入力される。階層位置音
量変換手段306aはこの数値を予め設定されている音
量調整比、例えば入力された値が1であれば1,0、2
であれば0,8に変換し、この音量調整比と現在の音量
調整値を乗じた値を新たな音量調整値として、音声符号
化手段107aを制御する。又階層位置音量変換手段3
06bも、同様の手段で音声符号化手段107bを制御
する。符号化された各音声符号化信号は、音声信号多重
化手段308により多重化され、音声符号化信号として
出力される。
【0039】以上の構成によれば、画面内の物体の前後
関係に合わせて音量の大小が調整されるため、画面内で
後方にある物体の音声の音量は、前方にある物体の音声
よりも小さくなるといったような、遠近感のある音響効
果が得られる。
【0040】又図1,図2,図3の各実施形態では音量
を調整するようにしているが、その代わりに音響効果を
付与するようにしてもよい。次にその一例を第4実施形
態として図4に示す。本実施形態では、図1で示した第
1実施形態の有効画素面積音量変換手段106を有効画
素面積音響効果設定値変換手段110に置き換える。又
音量変換手段108を音響効果付与手段111に置き換
えて音声符号化手段120とする。本実施形態では、例
えば有効画素面積音響効果設定値変換手段110が連続
する2フレームの有効画素数を比較し、減少した場合に
は、例えば音声にエコーをかけるように音響効果付与手
段111を制御する。これにより、より臨場感が高まる
など様々な効果が得られる。
【0041】又第2実施形態における有効画素位置音量
変換手段206を、図5に示す第5実施形態のように、
有効画素位置音響効果設定値変換手段220に変更して
もよい。この場合にも、音量変換手段208,209を
音響効果付与手段112,113とする。こうすれば有
効画素の位置の生成値によって音響効果を付与すること
ができる。
【0042】又図6に示す第6実施形態では、第3の実
施形態における階層位置音量変換手段306a,306
bを階層位置音響効果設定値変換手段310a,310
bに変換し、音声符号化手段120a,120bを用い
たものである。こうすれば階層位置に応じた音響効果を
付与することができる。
【0043】次に本願の第7実施形態を図面を用いて説
明する。図7は請求項10記載の発明の映像音声符号化
装置の第7実施形態を示すブロック図である。図7にお
いて、映像符号化手段101,有効画素面積生成手段1
05は有効画素面積音量変換手段106,音声符号化手
段107と映像音声データ信号多重化手段320を含ん
で構成される。
【0044】本実施形態は、図1で示した第1実施形態
の有効画素面積音量変換手段106が出力する制御信号
を映像音声データ信号多重化手段320に出力し、映像
符号化信号,音声符号化信号と共に多重化して出力する
ようにしたものである。第2〜第6実施形態の有効画素
位置や階層位置に対応する音量,音響効果設定値をデー
タ信号として多重化するようにしてもよいことはいうま
でもない。
【0045】本実施形態の映像音声符号化装置が出力し
た信号を復号化する第8実施形態による復号化装置を図
8に示す。本図において映像音声符号化信号は分離手段
(DEMUX)501を介して分離手段502,505
に入力される。分離手段502は夫々の階層画像を分離
するものである。503a,503bは階層画像復号化
手段、504は階層画像合成手段である。又分離手段5
05は夫々各階層の音声信号を分離するものである。音
声復号化手段506a,506bはこれらを復号化する
ものである。又508a,508bは音声増幅手段、5
09bは音声合成手段である。
【0046】本実施形態において、図7による映像音声
符号化装置から出力された映像音声符号化信号は、分離
手段501で映像符号化信号と音声符号化信号と制御符
号化信号に分離される。映像符号化信号は更に分離手段
502で階層画像に分離される。各階層画像は階層画像
復号化手段503a,503bで復号化された後、階層
画像合成手段504で合成されて映像信号として出力さ
れる。音声符号化信号は分離手段505で分離され、音
声復号化手段506a,506bで復号化され、音声増
幅手段508a,508bで増幅された後、音声合成手
段509で合成されて音声信号として出力される。又符
号化パラメータ音量変換手段510は各階層の音声の制
御符号化信号を新たな音量調整値に変換し、各階層に対
応する音量となるように音声増幅手段508a,508
bを制御する。
【0047】図7の実施形態によれば、図8で示した復
号化装置を用いることにより、図1の例で示した符号化
時に音量を調整した場合と同じ効果が得られる。
【0048】又第2,第3の実施形態に示されるよう
に、有効画素位置や階層位置信号を多重化してデータ伝
送した場合に、復号化装置によってこれを復号して復号
時に音声を制御するようにしてもよい。
【0049】次に図9は請求項12記載の発明の映像音
声復号化装置の第9実施形態のブロック図であり、映像
符号化信号が2つの階層からなる場合の例である。
【0050】図9において、401は映像音声符号化信
号を映像符号化信号と音声符号化信号に分離する分離手
段(DEMUX)、402は映像符号化信号を階層画像
符号化信号に分離する分離手段、403aと403bは
階層画像復号化手段、404は階層画像合成手段、40
5は音声符号化信号を各階層の音声符号化信号に分離す
る分離手段、406aと406bは音声復号化手段、4
07は有効画素面積音量変換手段、408は音声合成増
幅手段である。
【0051】以上のように構成された映像音声復号化装
置の動作を説明する。入力された映像音声符号化信号
は、分離手段401で映像符号化信号と音声符号化信号
に分離される。映像符号化信号はさらに分離手段402
で階層画像に分離される。各階層画像は階層画像復号化
手段403a,403bで復号化された後、階層画像合
成手段404で合成されて映像信号として出力される。
音声符号化信号は分離手段405で分離され、音声復号
化手段406a,406bで復号化され、音声合成増幅
手段408で合成、及び増幅されて音声信号として出力
される。有効画素面積音.変換手段407は、例えば、
映像符号化信号がアフィン変換を用いて符号化されてい
る場合は、アフィン変換パラメータを階層画像復号化手
段403a,403bから受け取り、式(2)で示す演
算で求めたDと現在の音量調整値を乗じた値を、新たな
音量調整値として、音声合成増幅手段408を制御す
る。又、図1の実施形態と同様、有効画素数と前フレー
ムの有効画素数の比に定数を乗じた値を求め、この値と
現在の音量調整値を乗じた値を新たな音量調整値とし
て、音声合成増幅手段408を制御するようにしてもよ
い。
【0052】この実施形態によれば、音量調整なしに符
号化された音声信号に対しても、図1の例で示した符号
化時に音量を調整した場合と同じ効果が得られる。
【0053】次に本願の第10実施形態を図面を用いて
説明する。図10は請求項13記載の発明の映像音声復
号化装置の一実施形態のブロック図であり、映像符号化
信号が2つの階層からなる場合の例である。
【0054】図10において、401は映像音声符号化
信号を映像符号化信号と音声符号化信号に分離する分離
手段(DEMUX)、402は映像符号化信号を階層画
像符号化信号に分離する分離手段、403aと403b
は階層画像復号化手段、404は階層画像合成手段、4
05は音声符号化信号を各階層の音声符号化信号に分離
する分離手段、406aと406bは音声復号化手段、
408は音声合成増幅手段、410は動きベクトル音量
変換手段である。
【0055】以上のように構成された映像音声復号化装
置において、動きベクトル音量変換手段410は第2実
施形態のうちアフィン変換パラメータを用いた実施形態
における有効画素位置音量変換手段206と同様に、動
きベクトルの水平成分から音量調整値を求め、音声合成
増幅手段408の音量を調整する。
【0056】第10実施形態によれば、音量調整なしに
符号化された音声信号に対しても、図2の例で示した符
号化時に音量を調整した場合と同じ効果が得られる。
【0057】次に第11実施形態を図面を用いて説明す
る。図11は請求項14記載の発明の映像音声復号化装
置の第10実施形態のブロック図であり、映像符号化信
号が2つの階層からなる場合の例である。
【0058】図11において、401は映像音声符号化
信号を映像符号化信号と音声符号化信号に分離する分離
手段(DEMUX)、402は映像符号化信号を階層画
像符号化信号に分離する分離手段、403aと403b
は階層画像復号化手段、404は階層画像合成手段、4
05は音声符号化信号を各階層の音声符号化信号に分離
する分離手段、406aと406bは音声復号化手段、
408は音声合成増幅手段、411は階層位置音量変換
手段である。
【0059】以上のように構成された映像音声復号化装
置において、階層位置音量変換手段411は図3の階層
位置音量変換手段306と同様に、階層の視線軸上の位
置を示す数値から音量調整値を求め、音声合成増幅手段
408の音量を調整する。
【0060】第11実施形態によれば、音量調整なしに
符号化された音声信号に対しても、図3の例で示した符
号化時に音量を調整した場合と同じ効果が得られる。
【0061】次に本願の第12実施形態を図面を用いて
説明する。図12は請求項15記載の発明の映像音声復
号化装置の一実施形態のブロック図であり、図7の有効
画素面積音量変換手段407を図4の有効画素面積音響
効果設定値変換手段110に置き換え、又音声合成増幅
手段408を復号化された音声信号に音響効果を付与す
る音声合成音響効果付与手段412に置き換えたもので
ある。
【0062】第12実施形態によれば、音響効果なしに
符号化された音声信号に対しても、図4の例で示した符
号化時に音響効果を付与した場合と同じ効果が得られ
る。
【0063】又請求項16記載の発明の実施形態とし
て、図10の動きベクトル音量変換手段410を、各階
層画像の有効画素位置を音響効果付与のためのパラメー
タに変換する有効画素位置音響効果設定値変換手段に、
音声合成増幅手段408を音声合成音響効果付与手段4
12に置き換え、復号化した音声信号に音響効果を付与
するようにしてもよい。更に請求項17記載の実施形態
として、図11の階層位置音量変換手段411を各階層
画像の視線軸上の位置を示す数値を音響効果付与のため
のパラメータに変換する階層位置音響効果設定値変換手
段に、音声合成増幅手段408を音声合成音響効果付与
手段412に置き換え、復号化した音声信号に音響効果
を付与するようにしてもよい。
【0064】
【発明の効果】以上詳細に説明したように本願の請求項
1,4の発明によれば、画面内の有効画素の占める面積
から音量を自動的に設定することができる。又請求項
2,5の発明では有効画素の位置から音量を設定するこ
とができ、請求項3,6の発明では階層画像の階層位置
によって音量を設定することができる。更に請求項7〜
9の発明では、有効画素の面積や位置,階層位置から音
響効果を自動的に設定することができる。更に請求項1
0は音声の符号化時にデータ信号を同時に符号化パラメ
ータとして同時に多重化することができる。更に請求項
11では、この符号化パラメータを分離して音量に変換
することができ、請求項12〜14の発明では、有効画
素の面積変化や動きベクトル及び階層位置に応じて音量
に変換して復号化することができる。更に請求項15〜
17の発明では、有効画素の面積変化や動きベクトル,
階層位置に応じた音響効果を復号時に付与することがで
きるという効果が得られる。
【0065】以上のように本発明の映像音声符号化装
置、及び映像音声復号化装置によれば、音量や左右のバ
ランスなどを画面の動きに合わせることにより、臨場感
のある音響効果が得られる。
【図面の簡単な説明】
【図1】本発明の映像音声符号化装置の第1の実施形態
のブロック図である。
【図2】本発明の映像音声符号化装置の第2の実施形態
のブロック図である。
【図3】本発明の映像音声符号化装置の第3の実施形態
のブロック図である。
【図4】本発明の映像音声符号化装置の第4の実施形態
のブロック図である。
【図5】本発明の映像音声符号化装置の第5の実施形態
のブロック図である。
【図6】本発明の映像音声符号化装置の第6の実施形態
のブロック図である。
【図7】本発明の映像音声符号化装置の第7の実施形態
のブロック図である。
【図8】本発明の映像音声復号化装置の第8の実施形態
のブロック図である。
【図9】本発明の映像音声復号化装置の第9の実施形態
のブロック図である。
【図10】本発明の映像音声復号化装置の第10の実施
形態のブロック図である。
【図11】本発明の映像音声復号化装置の第11の実施
形態のブロック図である。
【図12】本発明の映像音声復号化装置の第12の実施
形態のブロック図である。
【図13】階層画像の概念図である。
【符号の説明】
101 映像符号化手段 102 画素値信号符号化手段 103 画素位置信号符号化手段 104 多重化手段 105 有効画素面積生成手段 106 有効画素面積音量変換手段 107 音声符号化手段 108 音量変換手段 109 符号化手段 110 有効画素面積音響効果設定値変換手段 111,112,113 音響効果付与手段 205 有効画素位置生成手段 206 有効画素位置音量変換手段 207 音声符号化手段 208,209 音量変換手段 210,211 符号化手段 212 音声多重化手段 220 有効画素位置音響効果設定値変換手段 306 階層位置音量変換手段 307 映像信号多重化手段 308 音声信号多重化手段 310a,310b 階層位置音響効果設定値変換手段 320 映像音声データ信号多重化手段 401,402,405,501,502,505 分
離手段 403,503a,503b 階層画像復号化手段 404,504 階層画像合成手段 406,506a,506b 音声復号化手段 407 有効画素面積音量変換手段 408 音声合成増幅手段 410 動きベクトル音量変換手段 411 階層位置音量効果変換手段 412 音声合成音響効果付与手段 508a,508b 音声増幅手段 509 音声合成手段 510 符号化パラメータ音量変換手段

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 画素値信号と有効画素位置信号で構成さ
    れる映像信号を入力として、前記映像信号を符号化して
    映像符号化信号を出力する映像符号化手段と、 音声信号を入力として、前記音声信号を符号化して音声
    符号化信号を出力する音声符号化手段と、 入力された有効画素位置信号から、画面内における有効
    画素の占める面積を特徴付ける値を生成する有効画素面
    積生成手段と、を具備し、 前記音声符号化手段は、前記有効画素面積生成手段が生
    成した値に従って符号化パラメータを設定することを特
    徴とする映像音声符号化装置。
  2. 【請求項2】 画素値信号と有効画素位置信号で構成さ
    れる映像信号を入力として、前記映像信号を符号化して
    映像符号化信号を出力する映像符号化手段と、 複数チャンネルで構成される音声信号を入力として、前
    記音声信号を符号化して音声符号化信号を出力する音声
    符号化手段と、 入力された有効画素位置信号から、画面内における有効
    画素の位置を特徴付ける値を生成する有効画素位置生成
    手段と、を具備し、 前記音声符号化手段は、前記有効画素位置生成手段が生
    成した値に従って符号化パラメータを設定することを特
    徴とする映像音声符号化装置。
  3. 【請求項3】 視線軸上の前後関係を有する複数の階層
    画像信号を入力として、前記階層画像信号を符号化して
    映像符号化信号を出力する複数の映像符号化手段と、 前記各階層画像信号に対し1対1に付随する複数の音声
    信号を入力として、前記各階層画像信号の視線軸上の階
    層の上下関係を示す値に従ってその符号化パラメータを
    設定して前記音声信号を符号化して音声符号化信号を出
    力する複数の音声符号化手段と、を具備することを特徴
    とする映像音声符号化装置。
  4. 【請求項4】 前記有効画素面積生成手段の生成値を前
    記音声符号化手段の音量設定値に変換する有効画素面積
    音量変換手段を更に具備し、 前記音声符号化手段は、入力された音声信号を前記有効
    画素面積音量変換手段によって変換された音量に変換す
    る音量変換手段と、 前記音量変換手段によって変換された音声手段を符号化
    する符号化手段と、を有するものであることを特徴とす
    る請求項1記載の映像音声符号化装置。
  5. 【請求項5】 前記有効画素位置生成手段の生成値を前
    記音声符号化手段の音量設定値に変換する有効画素位置
    音量変換手段を更に具備し、 前記音声符号化手段は、入力された音声信号を前記有効
    画素位置音量変換手段によって変換された音量に変換す
    る音量変換手段と、 前記音量変換手段によって変換された音声手段を符号化
    する符号化手段と、を有するものであることを特徴とす
    る請求項2記載の映像音声符号化装置。
  6. 【請求項6】 各階層画像の視線上の上下関係を示す値
    を前記音声符号化手段の音量設定値に変換する階層位置
    音量変換手段を更に具備し、 前記音声符号化手段は、入力された音声信号を前記階層
    位置音量変換手段によって変換された音量に変換する音
    量変換手段と、 前記音量変換手段によって変換された音声手段を符号化
    する符号化手段と、を有するものであることを特徴とす
    る請求項3記載の映像音声符号化装置。
  7. 【請求項7】 前記音声符号化手段は、 入力音声信号に対して音響効果を設定する音響効果付与
    手段と、 前記音響効果付与手段の出力を符号化する符号化手段
    と、を有するものであり、 前記有効画素面積生成手段の出力を前記音響効果付与手
    段に与える音響効果設定値に変換する有効画素面積効果
    設定値変換手段を更に有するものであることを特徴とす
    る請求項1記載の映像音声符号化装置。
  8. 【請求項8】 前記音声符号化手段は、 入力音声信号に対して音響効果を設定する音響効果付与
    手段と、 前記音響効果付与手段の出力を符号化する符号化手段
    と、を有するものであり、 前記有効画素位置生成手段の出力を前記音響効果設定値
    に変換する有効画素位置音響効果設定値変換手段を更に
    有するものであることを特徴とする請求項2記載の映像
    音声符号化装置。
  9. 【請求項9】 前記音声符号化手段は、 入力音声信号に対して音響効果を設定する音響効果付与
    手段と、 前記音響効果付与手段の出力を符号化する符号化手段
    と、を有するものであり、 階層位置信号を音響効果設定値に変換する階層位置音響
    効果設定値変換手段を更に有するものであることを特徴
    とする請求項3記載の映像音声符号化装置。
  10. 【請求項10】 前記映像符号化手段が出力する映像符
    号化信号と前記音声符号化手段が出力する音声符号化信
    号とデータ信号とを多重化する多重化手段を備え、前記
    音声符号化手段に設定する符号化パラメータを、前記映
    像符号化信号と、前記音声符号化信号に多重化して出力
    することを特徴とする請求項1,2,又は3記載の映像
    音声符号化装置。
  11. 【請求項11】 請求項10記載の映像音声符号化装置
    が出力する映像音声符号化信号を復号化して映像信号,
    音声信号を出力する映像音声復号化装置であって、 前記映像音声符号化信号を映像符号化信号と音声符号化
    信号と符号化パラメータとに分離する分離手段と、 映像符号化信号を映像信号に復号化する映像信号復号化
    手段と、 音声符号化信号を音声信号に復号化する音声信号復号化
    手段と、 前記分離手段によって分離された符号化パラメータを復
    号化される音声信号の再生時の音量設定値に変換する音
    量変換手段と、を具備することを特徴とする映像音声復
    号化装置。
  12. 【請求項12】 有効画素の占める面積の変化を特徴付
    ける値が重畳されて符号化された映像符号化信号、及び
    音声符号化信号を入力とし、前記映像符号化信号と音声
    符号化信号を復号化して映像信号、音声信号を出力する
    映像音声復号化装置であって、 入力された映像符号化信号に重畳された有効画素の占め
    る面積の変化を特徴付ける値を、復号化された音声信号
    の再生時の音量設定値に変換する有効画素面積音量変換
    手段を備えたことを特徴とする映像音声復号化装置。
  13. 【請求項13】 動きベクトル値が重畳された映像符号
    化信号、及び複数チャンネルで構成される音声符号化信
    号を入力とし、前記映像符号化信号と音声符号化信号を
    復号化して映像信号、音声信号を出力する映像音声復号
    化装置であって、 入力された映像符号化信号に重畳された動きベクトル値
    を、復号化された各チャンネルの音声信号の再生時の音
    量設定値に変換する動きベクトル音量変換手段を備えた
    ことを特徴とする映像音声復号化装置。
  14. 【請求項14】 視線軸上の前後関係を有する複数の階
    層画像信号と各階層画像の視線軸上の階層の上下関係を
    示す値とを重畳して符号化された映像符号化信号、及び
    前記各階層画像信号に対し1対1に付随する複数の音声
    符号化信号を入力とし、前記映像符号化信号と音声符号
    化信号を復号化して映像信号、音声信号を出力する映像
    音声復号化装置であって、 入力された映像符号化信号に重畳された視線軸上の階層
    の上下関係を示す値を、復号化された音声信号の再生時
    の音量設定値に変換する階層位置音量変換手段を備えた
    ことを特徴とする映像音声復号化装置。
  15. 【請求項15】 複号化された音声信号に対して音響効
    果が設定可能な音響効果付与手段と、 有効画素の占める面積の変化を特徴付ける値を前記音響
    効果付与手段の音響効果設定値に変換する有効画素面積
    音響効果変換手段と、を備え、 前記音響効果付与手段は、前記有効画素面積音響効果変
    換手段が生成した音響効果設定値に従って音声信号に対
    して音響効果を付与することを特徴とする映像音声復号
    化装置。
  16. 【請求項16】 複号化された音声信号に対して音響効
    果が設定可能な音響効果付与手段と、 動きベクトル値を前記音響効果付与手段の音響効果設定
    値に変換する動きベクトル音響効果変換手段と、を備
    え、 前記音響効果付与手段は、前記動きベクトル音響効果変
    換手段が生成した音響効果設定値に従って音声信号に対
    して音響効果を付与することを特徴とする映像音声復号
    化装置。
  17. 【請求項17】 複号化された音声信号に対して音響効
    果が設定可能な音響効果付与手段と、 各階層画像の視線上の階層の上下関係を示す値を前記音
    響効果付与手段の音響効果設定値に変換する階層位置音
    響効果設定値変換手段と、を備え、 前記音響効果付与手段は、前記階層位置音響効果設定値
    変換手段が生成した音響効果設定値に従って音声信号に
    対して音響効果を付与することを特徴とする映像音声復
    号化装置。
JP5090796A 1996-02-13 1996-02-13 映像音声符号化装置及び映像音声復号化装置 Pending JPH09219858A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5090796A JPH09219858A (ja) 1996-02-13 1996-02-13 映像音声符号化装置及び映像音声復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5090796A JPH09219858A (ja) 1996-02-13 1996-02-13 映像音声符号化装置及び映像音声復号化装置

Publications (1)

Publication Number Publication Date
JPH09219858A true JPH09219858A (ja) 1997-08-19

Family

ID=12871852

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5090796A Pending JPH09219858A (ja) 1996-02-13 1996-02-13 映像音声符号化装置及び映像音声復号化装置

Country Status (1)

Country Link
JP (1) JPH09219858A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010061791A1 (ja) * 2008-11-28 2010-06-03 シャープ株式会社 映像制御装置およびそれを備えた撮像装置、表示装置
WO2013008869A1 (ja) * 2011-07-14 2013-01-17 株式会社ニコン 電子機器及びデータ生成方法
US8675140B2 (en) 2010-06-16 2014-03-18 Canon Kabushiki Kaisha Playback apparatus for playing back hierarchically-encoded video image data, method for controlling the playback apparatus, and storage medium
WO2015151131A1 (ja) * 2014-03-31 2015-10-08 パナソニックIpマネジメント株式会社 指向性制御装置、指向性制御方法、記憶媒体及び指向性制御システム
US9516412B2 (en) 2014-03-28 2016-12-06 Panasonic Intellectual Property Management Co., Ltd. Directivity control apparatus, directivity control method, storage medium and directivity control system

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010061791A1 (ja) * 2008-11-28 2010-06-03 シャープ株式会社 映像制御装置およびそれを備えた撮像装置、表示装置
US8675140B2 (en) 2010-06-16 2014-03-18 Canon Kabushiki Kaisha Playback apparatus for playing back hierarchically-encoded video image data, method for controlling the playback apparatus, and storage medium
WO2013008869A1 (ja) * 2011-07-14 2013-01-17 株式会社ニコン 電子機器及びデータ生成方法
US9516412B2 (en) 2014-03-28 2016-12-06 Panasonic Intellectual Property Management Co., Ltd. Directivity control apparatus, directivity control method, storage medium and directivity control system
WO2015151131A1 (ja) * 2014-03-31 2015-10-08 パナソニックIpマネジメント株式会社 指向性制御装置、指向性制御方法、記憶媒体及び指向性制御システム
CN105706462A (zh) * 2014-03-31 2016-06-22 松下知识产权经营株式会社 指向性控制装置、指向性控制方法、存储介质及指向性控制系统
JPWO2015151131A1 (ja) * 2014-03-31 2017-04-13 パナソニックIpマネジメント株式会社 指向性制御方法、記憶媒体及び指向性制御システム
CN105706462B (zh) * 2014-03-31 2018-11-30 松下知识产权经营株式会社 指向性控制装置、指向性控制方法、存储介质及指向性控制系统

Similar Documents

Publication Publication Date Title
JP6914994B2 (ja) 高次アンビソニックス・オーディオ信号の再生のための方法および装置
JP6734343B2 (ja) スクリーン関連オーディオオブジェクトリマッピングのための装置および方法
EP1416769B1 (en) Object-based three-dimensional audio system and method of controlling the same
US7788690B2 (en) Receiving apparatus and method
US6377309B1 (en) Image processing apparatus and method for reproducing at least an image from a digital data sequence
US7054539B2 (en) Image processing method and apparatus
MXPA96002842A (en) Method and multip data current search system
KR20010072936A (ko) 정보 스트림의 포스트-동기화
CN112673649B (zh) 空间音频增强
JP2011061852A (ja) 画像復号化装置および画像復号化方法
JPH09219858A (ja) 映像音声符号化装置及び映像音声復号化装置
JP3927713B2 (ja) 放送受信装置およびその方法
JP4306850B2 (ja) 放送受信装置およびその方法
JP4343411B2 (ja) 画像処理方法及び装置と再生方法とプログラム及び記憶媒体
JP4289753B2 (ja) 再生方法及び装置と表示装置
JP4401463B2 (ja) 放送受信装置及びその方法
US7154906B2 (en) Image processing apparatus, image processing method, image processing program, and computer-readable storage medium storing image processing program code
JP2001119302A (ja) 符号化装置、復号装置、情報処理システム、情報処理方法、及び記憶媒体
JPH1056644A (ja) 画像信号復号化装置及び画像信号復号化方法
JP2000078574A (ja) 映像音声再生装置
Funk Hologlyphics: Volumetric image synthesis performance system
JP2001036913A (ja) 動画像復号装置
JPH06284393A (ja) 圧縮画像データフォーマットと圧縮画像データと圧縮画像データ生成装置