JP2002207488A - 音響と画像の臨場感を表現し伝達する方式 - Google Patents

音響と画像の臨場感を表現し伝達する方式

Info

Publication number
JP2002207488A
JP2002207488A JP2001031607A JP2001031607A JP2002207488A JP 2002207488 A JP2002207488 A JP 2002207488A JP 2001031607 A JP2001031607 A JP 2001031607A JP 2001031607 A JP2001031607 A JP 2001031607A JP 2002207488 A JP2002207488 A JP 2002207488A
Authority
JP
Japan
Prior art keywords
information
image data
data
sound data
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001031607A
Other languages
English (en)
Inventor
Junichi Kakumoto
純一 角元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2001031607A priority Critical patent/JP2002207488A/ja
Publication of JP2002207488A publication Critical patent/JP2002207488A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 1)人の{聴覚、視覚}に照らして、臨場感豊かな情報
伝達の環境を提供する。2)画面の{動き、操作}と連
動して、音の臨場感を変化させ、感性に馴染んだ{情報
作り}の環境を提供する。3)情報の受け手側において
{{リアルタイム性と連続性}が必要な音響信号処理}
の負担を軽減し、情報の表現範囲を広げる。 【課題】1)画像情報の表現には多くの手法があるが、
音響の場合は重要視されていない。2)音の臨場感の表
現には専門知識が必要で、その手法は一般化されていな
い。3)受信側の信号処理能力不足が、不連続再生を生
み、逆効果となることがある。 【解決手段】1){画像の制御パラメータ}または{情
報の受け手側の操作制御パラメータ}と{音響の臨場感
の成分のパラメータ}を連動させる。2)あらかじめ
{元の音響データ}から{臨場感の成分の音響データ}
を抽出し、{二種類の音響データファイルの強度の組み
合わせによる数値合成}という単純な手法により{情報
の受け手側の信号処理負担を軽減し}、臨場感を再生す
る。

Description

【発明の詳細な説明】
【0002】
【用語の定義】上記、請求項を含む全文に使う{}内の
文は{}外の文に優先して、ひとまとまりの意味を構成
する。上記、請求項を含む全文に使う[]内の用語と解
釈が曖昧な用語について意味するところを以下に定義す
る。 1)[任意の情報]とは;[画像データ][音響デー
タ][文字データ][信号処理制御プログラム][コン
ピュータ制御プログラム]のうち少なくともいずれかを
含む符号群である。 2)[画像データ]とは;コンピュータの画像モニタに
出力する画像の符号群。 3)[音響データ]とは;コンピュータの音響モニタに
出力する音響の符号群。 4)[文字データ]とは;コンピュータの画像モニタに
出力する文字の符号群。 5)[信号処理制御プログラム]とは;画像信号または
音響信号に、何らかの計算を加え、別の性質の{画像信
号または音響信号}に変換するための制御コマンドから
なる符号群。 6)[コンピュータ制御プログラム]とは;コンピュー
タに{意図する機能}を持たせるための制御コマンドか
らなる符号群。 7)[広告、紹介、販売、サービス、製作、のいずれか
の目的]とは;{工業製品、農産物、手工芸品、食料
品、料理、出版物、文章、カタログ、観光案内、地理案
内、音楽作品、絵画作品、映画作品、アニメーション、
放送番組、装飾品、コレクション、通話}を対象とし
て、{その内容を表現する}かまたは{{その内容その
もの}を{特定または不特定}の人に、{伝達する}}
行為。 8)[情報の送り手]とは;[任意の情報]を発信する
側の、コンピュータを含む装置。 9)[情報の受け手]とは;[任意の情報]を受信する
側の、コンピュータを含む装置。
【0003】10)[伝達メディア]とは;データ通信
回線、電話回線、コンピュータのデータバス、光ディス
ク、磁気ディスク、集積回路カード記憶装置、電波通
信、光通信、写真フィルム、を含む情報伝達の媒体。 11)[手段または手法]とは;{伝達しようとする内
容を作るためのソフトウェアツール}または{そのソフ
トウェアツールを機能させるに必要なハードウェアを含
むシステム}または{そのソフトウェアツールを使って
表現した情報}。 12)[元の音響データ]とは;[情報の送り手]側が
[情報の受け手]側に伝えようとする特定の[音響デー
タ]。 13)[元の画像データ]とは;[情報の送り手]側が
[情報の受け手]側に伝えようとする特定の[画像デー
タ]。 14)臨場感とは;音源に近づくほど聴覚が感じる音の
質感。一般的には、音源から離れるほど、音量だけでは
なく、音色を構成する音響成分の内、{周波数が中音域
から離れて低ければ低いほど}{周波数が中音域から離
れて高ければ高いほど}聴覚へ達するまでの強度が小さ
くなる。{マイクロホンやスピーカなどの音響─電気変
換系の特性}と{音波の伝播系の物理的な性質}に大き
く左右される。逆に、これらの聴覚に感じ難い音質成分
を音量と共に強調することにより、さらに強力な[臨場
感]が得られる。 15)臨場感成分とは;音源に近づくほど聴覚が感じる
音の成分。 16)[臨場感成分の音響データ]とは;音源に近づく
ほど聴覚が感じる音の成分の[音響データ]。 17)[臨場感成分の抽出フィルタ]とは;[元の音響
データ]から[元の音響データ]に含まれている[臨場
感]の成分を抽出する音響信号フイルタである。 18)[可変定数の臨場感強調フィルタ]とは[元の音
響データ]から[元の音響データ]が含む[臨場感]を
強調する機能を持ち、強調度合いを制御できる音響信号
フィルタ。 19)[臨場感を強調した音響データ]とは;{[元の
音響データ]を[臨場感成分の抽出フィルタ]}を通過
させて抽出した[臨場感成分]を[元の音響データ]と
合成して得た[音響データ]}または{[元の音響デー
タ]を[可変定数の臨場感強調フィルタ]を通過させて
臨場感が強調された[音響データ]}。臨場感の成分を
抽出する手法は限りなく存在するが、一般的には{低音
側の[臨場感の成分]}は{[元の音響データ]の{積
分、積分に類する手法、高次の積分}の組み合わせ}に
より、{高音側の[臨場感の成分]}は{[元の音響デ
ータ]の{微分、微分に類する手法、高次の微分}の組
み合わせ}により、得ることができる。 20)[[情報の送り手]側によってあらかじめ決めら
れた手順]とは;[情報の送り手]側によって作られた
ところの[情報の受け手]側の意思で制御できない表現
の内容と手順。 21)[[情報の受け手]側の操作]とは;[情報の受
け手]側の意思により、[情報の送り手]側があらかじ
め決めた自由度の範囲で[情報の受け手]側の受信情報
のモニタへの表現を制御する操作。 22)[[元の画像データ]を座標変換した画像デー
タ]とは;{平行移動、回転、拡大、縮小}などの座標
変換を組み合わせて得た[元の画像データ]の変形画
像。 23)[画面座標]とは;ある画面の、ある特定の場所
を示す座標情報。
【0004】
【発明の所属する技術分野】{ホームページ製作、映画
番組などの音響効果製作、TVゲームなどの音響効果製
作ツール、TVゲームソフトウェア、音楽の製作編集配
信}などの情報伝達の分野において[広告、紹介、販
売、サービス、製作のいずれかの目的]で、音響の臨場
感を伝えることにより、人の感性に対し、より説得力の
ある情報伝達の環境を提供しようとする、[手段と手
法]。
【0005】
【従来の技術】音響の臨場感を単にコンピュータ上で作
るソフトウェアツールは数多くあるが、 1)[広告、紹介、販売、サービス、製作のいずれかの
目的]で、{画像の操作}または{画像の動き}または
{情報の受け手側の操作}と連動した音響の臨場感を伝
達するシステムはない。 2)[臨場感成分の音響データ]を抽出し[元の音響デ
ータ]とは別の[音響データ]として伝達し、[元の音
響データ]と合成することによって臨場感を演出するシ
ステムはない。
【0006】
【発明が解決しようとしている課題】1)マン_マシン
_インタフェースにおける、人の主な感覚器官は視覚と
聴覚である。画像の場合は、多種多様な撮影装置があ
り、表現方法の手法も多く、臨場感表現の工夫にも高度
な専門知識を必要としない。一方、音響の場合は、臨場
感の表現には、{{音質に関する知識、臨場感そのもの
に関する知識、マイクロホンやスピーカの性能に関する
知識、音波の伝播に関する物理的知識、音響信号処理に
関する専門知識}などのひとまとまりの専門知識}や
{音質に関する官能訓練}も必要とされることから、一
般には普及していないのが現状である。 2)音響の臨場感の認識は主観に頼る傾向があり、聴覚
が強力な適応機能を備えていることから、表現に工夫を
凝らさなくても画像との関係で臨場感を感じる傾向があ
る。 3)実際に{臨場感成分の強い音響信号}を再生する
と、聞き手は{言葉で表現できない驚きや感動}を受け
る。このことは{聴覚がこれまでに経験した臨場感のあ
る生の音質を覚えていて}かつ{情報機器や音響機器を
通じて伝わる音響情報に臨場感を感じていない}とい
う、このギャップが大きいことを示唆している。 4)画像の場合は{不連続、細切れ、歪、低分解能}な
どが大きな問題にならない。音響の場合は{連続性、低
雑音、低歪、高分解能、正確なサンプリングクロックに
よる再生}が必要条件である。複雑な音響信号計算処理
は、受信側の音響信号処理能力の不足(画像処理や通信
処理に忙しい)により、音響再生に不連続が発生し、音
の途切れなどにより、逆効果を生むことがある。特に通
信回線を通じて[音響データ]を伝達するケースで、同
期の問題も含めて課題がある。
【0007】
【課題を解決するための手段】{専門知識を必要とする
複雑な信号処理のアルゴリズム}をあらかじめ用意して
おいて、{画像の動き}や{画面の操作}に伴うパラメ
ータと[臨場感]を生成するパラメータを連動させる。
音響の、臨場感成分のパラメータを次に挙げる手法で制
御する 1){{画像の制御パラメータ}または{[情報の受け
手]側の操作制御パラメータ}または{[情報の受け
手]側のモニタ画面上の位置を指し示すマークの画面座
標}のいずれか}と{音響の[臨場感成分]のパラメー
タ}を連動させる。 2)[可変定数の臨場感強調フィルタ]の臨場感パラメ
ータを制御する。 3)あらかじめ[元の音響データ]が持つ[臨場感成分
の音響データ]を抽出し、準備しておき、{二種類の音
響データファイルの数値合成という単純な信号処理}に
より自在な音響の臨場感を再生する。
【0008】
【発明の実施の形態】本発明の応用先には下記の項目が
挙げられる。 1){インターネットのホームページ}と{その作成用
ソフトウェア}。 2){映画番組、TV放送番組}と{それらの作成用ソ
フトウェア}。 3){TVゲーム}と{その作成用ソフトウェア}。 4){音楽信号}と{その作成ソフトウェア}。 5){効果音信号}と{その作成ソフトウェア} 6)電話通信信号。 7){録音、録画}の記録媒体。 以下、図面により詳細を説明する。図面中の記号につい
ては全図面を通じ、同記号は同機能であり、記号の定義
は{記号の説明}に記載の通りである。記述を簡素化す
るために、一度説明した記号と同記号の説明を省略する
ことがあるが、本説明の正確さを欠くものではない。
【0009】図1は請求項1の{[臨場感を強調した音
響データ]を得る手法が[可変定数の臨場感強調フィル
タ]によるもの}であって{[臨場感]の制御が[情報
の受け手]側にある場合}の一実施例のブロック図であ
る。
【0010】[情報の送り手]側SERVERの情報
は、情報の伝達媒体LINEを通じ[情報の受け手]側
RECEIVERに送られる。RECEIVERは{音
声モニタS_MNTと画像モニタV_MNTと操作入力
部U_OPT}を持つ。SERVERはRECEIVE
Rを動作させるに必要な{[信号処理制御プログラム]
CTRsと[元の音響データ]OSDspと[元の画像
データ]VDsq}を持つ。RECEIVERは、{S
ERVERから送られたSERVERと同じ内容}の
{[信号処理制御プログラム]CTRrと[元の音響デ
ータ]OSDrpと[元の画像データ]VDrq}を持
つ。[元の音響データ]OSDrpは[可変定数の臨場
感強調フィルタ]FLTEp(x,y,z)によって変
換され、[臨場感を強調した音響データ]の再生信号R
p(t)を生成する。FLTEp(x,y,z)は操作
制御パラメータO(x,y,z)に依存して臨場感の度
合を変える。例えば、座標(x,y)が変化した場合、
音源を表す画像の位置との関係に依存して、FLTEp
(x,y,z)の臨場感のパラメータを変化させる。拡
大率(z)が変化した場合、{座標(x、y)を中心と
する画面}の拡大率に依存して、FLTEp(x,y,
z)の臨場感のパラメータを変化させる。RECEIV
ER側の画像変換機能AFINq(x,y,z)は[画
像データ]VDrqを{{画像の制御パラメータO
(x,y,z)}と{[信号処理制御プログラム]CT
Rrの制御}}を受けて、[[元の画像データ]を座標
変換した信号]Hq(t)を生成する。
【0011】この実施例は{[情報の受け手]側の操作
により}{画像と音響の臨場感を表現する方法}の一つ
の基本形である。例えば{一本の木に多数の小鳥が囀っ
ている}ような画像の場合、[情報の受け手]側の操作
により、画像を拡大すると、音響も含めて{あたかも小
鳥の群れの中にいるように感じる}このような臨場感の
表現ができる。
【0012】図2は請求項1の{[臨場感を強調した音
響データ]を得る手法が[可変定数の臨場感強調フィル
タ]によるもの}であって{[臨場感]の制御が一方的
に[情報の送り手]側にある}場合の一実施例のブロッ
ク図である。
【0013】図2の図1との違いは、図1が{音響の臨
場感の制御が[情報の受け手]側にある}ことに対し、
図2は、音響も画像も臨場感の表現は、製作者の設計ど
うりに作られる。SERVERは[可変定数の臨場感強
調フィルタ]FLTEp(x,y,z)}によって[臨
場感を強調した音響データ]PSDspを生成する。
{[臨場感を強調した音響データ]PSDspと[元の
画像データ]VDsqと[信号処理制御プログラム]C
TRPpはRECEIVER側に伝達される。RECE
IVER側の{CTRrとPSDrpとVDrq}はS
ERVER側の{CTspとPSDspとVDsq}と
同じである。PSDrpは音響再生信号Rp(t)に変
換される。RECEIVER側には{図1の臨場感の操
作入力部U_OPT}はなく、臨場感の表現は全てSE
RVERによって決められたものである。RECEIV
ER側の画像変換機能AFINq(x,y,z)は[画
像データ]VDrqから、{[信号処理制御プログラ
ム]CTRrの制御}を受けて、[[元の画像データ]
を座標変換した信号]Hq(t)を生成する。
【0014】この実施例は、例えば{{楽器演奏}の場
面で、弾き手に照準を合わせた状態でのズーム_インの
場面と連動して、{楽器の音色の臨場感が増す}}この
ような臨場感の表現に応用できる。この実施例は{映画
番組のような[情報の受け手]側で操作する必要がな
い}場合の情報伝達に使われる。
【0015】図3は請求項3の{[臨場感を強調した音
響データ]を得る手法が{[情報の受け手]側での
{[元の音響データ]と[臨場感成分の音響データ]の
合成}}によるもの}であって、{[臨場感]の制御が
[情報の受け手]側にある場合}の一実施例のブロック
図である。[臨場感成分]の抽出は[情報の送り手]側
にある。
【0016】SERVERの情報はLINEを通じRE
CEIVERに送られる。RECEIVERは[情報の
受け手]の{音声モニタS_MNTと画像モニタV_M
NTと操作入力部U_OPT}を持つ。SERVERは
{{RECEIVER側を動作させるに必要な[信号処
理制御プログラム]CTRs}と{[元の音響データ]
OSDsp}と{[元の画像データ]VDsq}}を持
つ。RECEIVERは、SERVERから送られた、
SERVER側と同じ内容の{OSDrpとVDrqと
CTRr}を持つ。[元の音響データ]OSDrpは
[臨場感成分の抽出フィルタ]FLTrpによって変換
され、[臨場感成分の音響データ]PSDrpとなる。
ブロックCONVERSIONは操作入力U_OPTか
らの信号O(x,y,z)に依存して、{画像と音響}
の臨場感を生成する。Kfp(x,y,z)は[元の音
響信号]OSDrpを{操作信号O(x,y,z)に依
存して}変化させる係数器であり、その出力はFp
(m)である。Kgp(x,y,z)は[臨場感成分の
音響データ]を{操作信号O(x,y,z)に依存し
て}変化させる係数器であり、その出力はGp(m)で
ある。MIXは{[元の音響信号]に対応する符号列F
p(m)}と{[臨場感成分]に対応する符号列Gp
(m)}を加算し、[臨場感を強調した音響データ]F
p(m)+Gp(m)を音響再生信号Fp(t)+Gp
(t)に変換して出力する。AFINq(x,y,z)
は[元の画像データ]を{操作信号O(x,y,z)に
依存して}{移動、拡大、縮小、回転}などの座標変換
を作用させる機能であり、画像信号Hq(t)を出力す
る。{操作信号O(x,y,z)の座標(x,y)や拡
大率(z)}が変化した場合、音源を表す画像の位置と
の関係に依存して、{音響の臨場感パラメータ{Kfp
(x,y,z)とKgp(x,y,z)}}と{画像の
座標変換パラメータAFINq(x,y,z)}とを連
動して変化させる。
【0017】{図3と図1の相違点}は、図1の実施例
では{[情報の受け手]側で{音響の臨場感を生成する
信号処理}がリアルタイムに行われている}ことに対
し、図3の実施例では{[臨場感成分の音響データ]が
[情報の受け手]側であらかじめ作られている}ところ
にある。{図3と図1の共通点}は、臨場感を生成する
音響信号処理を[情報の受け手]側に委ねることから、
[情報の送り手]側は[情報の受け手]側に{音響信号
処理のアルゴリズム}を送る必要がある。
【0018】図4は請求項4の{[臨場感を強調した音
響データ]を得る手法が{[情報の送り手]側での
{[元の音響データ]と[臨場感成分の音響データ]の
合成}}によるもの}であって、{[臨場感]の制御が
[情報の受け手]側にある場合}の一実施例のブロック
図である。
【0019】図4の図3との相違点は、図3が{臨場感
成分の抽出が[情報の受け手]側にある}ことに対し、
図4は{臨場感成分の抽出が[情報の送り手]側にあ
る}点である。[臨場感成分の音響データ]は[元の音
響データ]とは別に[情報の受け手]側に伝達されるこ
とから、通信データ量は増えるものの、[情報の受け
手]側では{微分積分処理を伴う音響信号処理のアルゴ
リズム}を実行する必要がなく、不確定多数の装置間の
音響データの通信が容易となり、臨場感を確実に伝える
ことができる。図4のは{通信プロトコルを含むSER
VER、RECEIVER}のいずれの{ハードウェ
ア、ソフトウェア}の{特性の影響が少ない}手法であ
る。
【0020】SERVERの情報はLINEを通じRE
CEIVERに送られる。RECEIVERは[情報の
受け手]の{音声モニタS_MNTと画像モニタV_M
NTと操作入力部U_OPT}を持つ。SERVERは
{{RECEIVER側を動作させるに必要な[信号処
理制御プログラム]CTRs}と{[元の音響データ]
OSDsp}と{[臨場感成分の音響データ]PSDs
p}と{[元の画像データ]VDsq}}を持つ。[元
の音響データ]OSDspは[臨場感成分の抽出フィル
タ]FLTspによって変換され、[臨場感成分]の
[音響データ]PSDspを生成する。RECEIVE
R側は、SERVERから送られた、SERVER側と
同じ内容の{CTRrとOSDrpとPSDrpとVD
rq}を持つ。ブロックCONVERSIONは操作入
力U_OPTからの信号O(x,y,z)に依存して、
{画像と音響}の臨場感を生成する。Kfp(x,y,
z)は[元の音響信号]を{操作信号O(x,y,z)
に依存して}変化させる係数器であり、その出力はFp
(m)である。Kgp(x,y,z)は[臨場感成分の
音響データ]を{操作信号O(x,y,z)に依存し
て}変化させる係数器であり、その出力はGp(m)で
ある。MIXは{[元の音響信号]に対応する符号列F
p(m)}と{[臨場感成分]に対応する符号列Gp
(m)}を加算し、[臨場感を強調した音響データ]F
p(m)+Gp(m)を音響再生信号Fp(t)+Gp
(t)に変換して出力する。AFINq(x,y,z)
は[元の画像データ]を{操作信号O(x,y,z)に
依存して}{移動、拡大、縮小、回転}などの座標変換
機能であり、画像信号Hq(t)を出力する。{操作信
号O(x,y,z)の座標(x,y)や拡大率(z)}
が変化した場合、音源を表す画像の位置との関係に依存
して、{音響の臨場感パラメータ{Kfp(x,y,
z)とKgp(x,y,z)}}と{画像の座標変換パ
ラメータAFINq(x,y,z)}とを連動して変化
させる。
【0021】図5は{請求項1または請求項2または請
求項3または請求項4または請求項6}において、1個
の{[画像データ]と1個の[音響データ]で臨場感が
どのように表現されるか}その例の説明図である。画像
に関しては、図面での説明が簡単であるが、音響に関し
ては、臨場感を直接に説明することができないことか
ら、{用語の定義}に臨場感の補足説明を加えている。
【0022】図は{D5_a1、D5_a2、D5_a
3、D5_a4}の4個の{表と絵}からなる。表の中
の文字zは画面の拡大率を意味し、zの右の欄には、拡
大率を、説明の便宜上、数値で表現している。数値が大
きいものは拡大率が大きいと解釈する。OSDaは[元
の音響データ]の再生の強度を意味し、右の数値はその
再生強度を表している。数値が大きいものは再生音量が
大きいとする。PSDaは[臨場感成分の音響データ]
の再生の強度を意味し、右の数値はその再生強度を表し
ている。数値が大きいものは再生音量が大きいとする。
絵は[情報の受け手]側のモニタ画面である。説明を簡
単にするために、文字Aが表示されていて、Aに係る音
響信号が再生されているものとする。NOBの記号の上
の三角印は画面の拡大率を制御する{画面上のつまみ}
である。記号ZOOMは拡大率を表し、スケール0から
10はその度合を表している。つまみKNOBを{左O
UT側に動かせば縮小}{右IN側に動かせば拡大}と
なる。
【0023】図5の文字Aを{ギターの演奏画像}であ
るとする。{D5a1からD5a4}]へと画面を操作
すると、ギターの画像は{拡大されて、ギターに近づい
た}ように変化する。この時のギターの音は、音量だけ
でなく音質そのものも変化する。{ギターから5mは離
れた場所での音色}と{ギターの響鳴板に耳を当てて聴
いた音色}とでは大きく異なる。一般的に耳が音源に近
づくほどに、単に音量が大きくなるだけではなく、臨場
感の成分である{低周波数音と高周波数音}がよく聴こ
え、音域が広がり、音色は極めて豊かになる。音源との
距離が近づくほどに、この効果は顕著になる。このと
は、音の伝播の物理的な性質に大きく依存することか
ら、その性質を逆方向に利用し[元の音響データ]に臨
場感成分を補完することによって、音源に近づいたと同
じ臨場感を得ることができる。人の聴覚は{聴覚が音源
に近づいた時の感触}を本能的に知っているが、{その
感触を言葉で表現することが難しい}。その反面、言葉
で表現しなくとも、その感触を音そのもので、{言葉の
障壁を越えて全世界に伝えることの容易さ}も持ち合わ
せている。{臨場感成分の抽出}または{臨場感の強
調}の手法そのものについては本発明の本質とするとこ
ろではない。
【0024】図6は請求項5の{2個の[画像データ]
と1個の[音響データ]で臨場感がどのように表現され
るか}その例の説明図である。図6の図5と異なる点は
{拡大率をさらに大きくした}場合の{画像の臨場感の
表現手法}にある。音響の臨場感を表現する場合は、
{音響信号の分解能が{例えば16ビット}と一般的に
極めて高い}ことから、臨場感成分を40dB(100
倍)程度強調することによる再生信号のきめ細かさの表
現の問題は小さいが、画像の場合は、{明度は通常8ビ
ット程度で表現されている}ことから、拡大率が大きく
なるとモザイク模様となり、ある意味では臨場感は増す
ものの{精細さに欠けた画像}となり、説得力が弱ま
る。そこで、画像の臨場感と音響の臨場感のバランスを
とるために画像の臨場感の表現に工夫が必要である。図
7は画像の精細さが欠けるほどに拡大率が大きくなった
場合、その部分の拡大画像に切り替える手法についての
説明図である。
【0025】図は{D7_a1、D7_a2、D7_a
3、D7_a4}の4個の{表と絵}からなる。表の中
の記号zは情報表現の拡大率を意味し、zの右の欄に
は、表現の拡大率を便宜上、数値で表現している。数値
が大きいものは拡大率が大きいと解釈する。記号Zaは
[元の画像データ]Aの拡大率を意味しZaの右の欄に
は、拡大率を便宜状、数値で表現している。記号Zaa
は[元の画像データ]AAの拡大率を意味しZaaの右
の欄には、拡大率を便宜状、数値で表現している。記号
OSDaは[元の音響データ]Aの再生の強度を意味
し、PSDaはAの[臨場感成分の音響データ]の再生
の強度を意味する。{OSDaとPSDa}の右の数値
はその再生強度を表している。数値が大きいものは再生
音量が大きいとする。
【0026】絵は[情報の受け手]側のモニタ画面の図
である。説明を簡単にするために、文字Aが表示されて
いて、Aに係る音響信号が再生されているものとする。
NOBの記号の上の三角印は画面の拡大率を制御する、
画面上のつまみである。記号ZOOMは情報表現の拡大
率を表し、スケール0から100はその度合を表してい
る。つまみKNOBを{左OUT側に動かせば縮小}
{右IN側に動かせば拡大}となる。文字Aが拡大さ
れ、分解能の限界を超えてモザイク模様になる前に、画
像をAからAAに切り替えることにより精細さを維持し
て、あたかもAがさらに拡大されたように表現しようと
するものである。音響信号はダイナミックレンジが広い
ことから、別の音響データに切り替える必要がない。
【0027】図7は請求項5の{1個の[画像データ]
と3個の[音響データ]で臨場感がどのように表現され
るか}その例の説明図である。{D6_a1、D6_a
2、D6_a3、D7_a4}{D6_b1、D6_b
2、D6_b3、D7_b4}{D6_c1、D6_c
2、D6_c3、D7_c4}の12個の{表と絵}か
らなる。{an,bn,cn}n=1,2,3,4はそ
れぞれの図のモニタ画面を表す絵の中の文字{A,B,
C}に臨場感の照準を合わせていることを意味する。
{n=1,2,3,4}は照準位置での画像の拡大率の
大きさに対応している。表の中の文字zは画面の拡大率
を意味し、zの右の欄には、拡大率を便宜上、数値で表
現している。数値が大きいものは拡大率が大きいと解釈
する。{OSDa,OSDb,OSDc}はそれぞれ画
面上の{A,B,C}の位置にある画像に関連する音源
の[元の音響データ]の再生の強度を意味し、右の数値
はその再生強度を表している。{PSDa,PSDb,
PSDc}はそれぞれ{OSDa,OSDb,OSD
c}の[臨場感成分の音響データ]の再生の強度を意味
し、右の数値はその再生強度を表している。
【0028】図7中{D6_an}{D6_bn}{D
6_cn}n=1,2,3,4は[情報の受け手]側の
モニタ画面の絵であり、それぞれ照準が{A,B,C}
にあることを示す。nの値が大きくなると、拡大率が大
きくなるとする。説明を簡単にするために、文字{A,
B,C}が表示されていて、それぞれ{A,B,C}に
係る音響信号が再生されているものとする。NOBの記
号の上の三角印は画面の拡大率を制御する、画面上のつ
まみである。記号ZOOMは拡大率を表し、スケール0
から10はその度合を表している。つまみKNOBを
{左OUT側に動かせば縮小}{右IN側に動かせば拡
大}となる。
【0029】例えば、図6が海岸の写真であって{Aが
海岸で遊ぶ人、Bが波打ち際、Cが島}であるとする。
Aに照準が合わされ{D6_a1からD_a4}へとZ
OOMを操作すると{海岸で遊ぶ人の画像}は拡大され
て{画面は人に近づいた}ように変化する。この時の人
の声は、音量だけでなく音質そのものが変化する。Bに
照準が合わされ{D6_b1からD6_b4}へとZO
OMを操作すると{波打ち際の画像}は拡大されて{画
面は波打ち際に近づいた}ように変化する。この時の
{波が打ち寄せるの音}は、音量だけでなく音質そのも
のが変化する。Cに照準が合わされ{D6_c1からD
6_c4}へとZOOMを操作すると{島の画像}は拡
大されて{島に近づいた}ように変化する。この時の島
に住む鳥の声は、音量だけでなく音質そのものが変化す
る。
【0030】このように、画面の位置情報と臨場感の制
御を連動させることによって、立体感のある情報伝達が
可能となる。
【0031】
【発明の効果】1)画像と音響の両面から、臨場感を演
出する内容の情報伝達を簡単な手法で可能とする。 2)本発明は、商品や情報やサービスや音楽など直接の
商取引には係わらないものの、これらの商取引に必要な
情報伝達に大きな影響を与える。 3){吟味された臨場感のアルゴリズムを使うことがで
きる}ことや{臨場感の伝達を極め簡素化できる}こと
は芸術性の高い情報伝達の環境を一般のユーザに提供
し、{伝達する情報の内容の創作の競い}と{見て、聴
いて、楽しみ、学習し、感動する}ことができる{情報
の内容}に対する受け手側の評価の場を作る。
【0032】
【図面の簡単な説明】
【図1】臨場感強調フィルタが[情報の受け手]側にあ
る場合の{手法の実施例}。
【図2】臨場感強調フィルタが[情報の送り手]側にあ
る場合の{手法の実施例}。
【図3】臨場感抽出フィルタが[情報の受け手]側にあ
る場合の{手法の実施例}。
【図4】臨場感抽出フィルタが[情報の送り手]側にあ
る場合の{手法の実施例}。
【図5】1組の[画像データ]と[音響データ]の場合
の{表現の実施例}。
【図6】2個の[画像データ]と1個の[音響データ]
の場合の{表現の実施例}。
【図7】1個の[画像データ]と3個の[音響データ]
の場合の{表現の実施例}。
【0033】
【記号の説明】
図面の説明の中で、図面番号の如何にかかわらず、記入
されている記号は下記の意味を持つ。 SERVER:ブロック内が[情報の送り手]側にある
ことを示す。 RECEIVER:ブロック内が[情報の受け手]側に
あることを示す。 LINE:通信媒体または記録媒体 CONVERSION:信号処理部
【0034】CTRs:情報が[情報の送り手]側にあ
る[信号処理制御プログラム]または[コンピュータ制
御文]。 CTRr:情報が[情報の受け手]側にある[信号処理
制御プログラム]または[コンピュータ制御文]。 OSDsp:p=1,2,3,,,,,。情報が[情報
の送り手]側にある任意の数の[元の音響データ]。 FLTsp:p=1,2,3,,,,,。[情報の送り
手]側にある任意の数の[臨場感成分]の抽出フィル
タ。 PSDsp:p=1,2,3,,,,,。[臨場感成
分]の[音響データ]。 OSDrp:p=1,2,3,,,,,。情報が[情報
の受け手]側にある任意の数の[元の音響データ]。 PDSrp:p=1,2,3,,,,,。情報が[情報
の受け手]側にある任意の数の[臨場感成分]の[音響
データ]。 VDsq:q=1,2,3,,,,,。情報が[情報の
送り手]側にある任意の数の[元の画像データ]。 VDrq:q=1,2,3,,,,,。情報が[情報の
受け手]側にある任意の数の[元の画像データ]。
【0035】U_OPT:[情報の受け手]側の操作 O(x,y,z):[情報の受け手]側の操作が指し示
す[画像の制御パラメータ]で、x,yは{画面上の座
標}、zは{画像の拡大縮小率}。 S_MNT:音響信号のモニタ出力。 Rp(t):p=1,2,3,,,,,。任意の数の
[臨場感の成分を強調した音響データ]の符号列の合成
データを再生した時系列音響信号。 V_MNT:画像信号のモニタ出力。 Hq(t):q=1,2,3,,,,,。任意の数の
[元の画像データ]の符号列を再生した時系列画像信
号。 CNV:ブロック内が信号処理機能であることを示す。 (x、y、z)のz:画面の拡大縮小パラメータ。 (x,y,z)のx,y:画面の特定の位置を示すパラ
メータ。
【0036】FLTep(x,y,z):p=1,2,
3,,,,,。[情報の受け手]側にあって[情報の受
け手]側の操作O(x,y,z)に依存して[臨場感の
成分を強調した音響データ]群を生成する音響フィル
タ。 Kfp(x,y,z):p=1,2,3,,,,,。
[情報の受け手]側にあって[情報の受け手]側の操作
O(x,y,z)に依存して[元の音響データ]群の再
生強度を制御する係数機能。 Fp(m):Kfp(x,y,z)の出力符号列。 FLTrp:p=1,2,3,,,,,。[情報の受け
手]側にある任意の数の[臨場感成分]の抽出フィル
タ。 Kgp(x,y,z):p=1,2,3,,,,,。
[情報の受け手]側にあって[情報の受け手]側の操作
O(x,y,z)により[臨場感成分の音響データ]群
の再生強度を制御する係数機能。 MIX:[元の音響データ]Fp(m)と[臨場感成分
の音響データ]Gp(m)を合成する機能。 Gp(m):Kgp(x,y,z)の出力符号列。 Fp(t)+Gp(t):p=1,2,3,,,,,。
[臨場感の成分を強調した音響データ]の再生信号。 AFINq(x,y,z):q=1,2,
3,,,,,。O(x、y、z)の制御を受けて、
[[元の画像データ]を座標変換した画像データ]を生
成する機能。
【0037】z:画面の拡大縮小の制御パラメータ x,y:画面の特定の画像を示す位置制御パラメータ OSDa:画面中の{位置AにあるAの画像}に対応す
る[元の音響データ]の強度を表す記号。 PSDa:画面中の{位置AにあるAの画像}に対応す
る[臨場感成分の音響データ]の強度を表す記号。 OSDb:画面中の{位置BにあるBの画像}に対応す
る[元の音響データ]の強度を表す記号。 PSDb:画面中の{位置BにあるBの画像}に対応す
る[臨場感成分の音響データ]の強度を表す記号。 OSDc:画面中の{位置CにあるCの画像}に対応す
る[元の音響データ]の強度を表す記号。 PSDc:画面中の{位置CにあるCの画像}に対応す
る[臨場感成分の音響データ]の強度を表す記号。 ZOOM のマーク:AまたはBまたはCを中心位置と
する画面の拡大縮小率の度合を、制御するモニタ画面上
の目盛を示すマーク。 OUT のマーク:ZOOMの縮小方向。 IN のマーク:ZOOMの拡大方向。 KNOB のマーク:ZOOMの度合を変化させるモニ
タ画面上の操作ツマミ。 A のマーク:位置AにあるAの画像。 B のマーク:位置BにあるBの画像。 C のマーク:位置CにあるCの画像。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】[任意の情報]を[広告、紹介、販売、サ
    ービス、製作、のいずれかの目的]で[情報の送り手]
    側から[情報の受け手]側に[伝達メディア]を介して
    伝達するところの[手段または手法]であることを第1
    の特徴とし、[情報の送り手]側が発信する[任意の情
    報]が、少なくとも[元の音響データ]と[元の画像デ
    ータ]を含むことを第2の特徴とし、[情報の送り手]
    側が発信する[任意の情報]が、{[情報の受け手]側
    で[元の音響データ]から[臨場感を強調した音響デー
    タ]を生成する}に必要な[信号処理制御プログラム]
    を含むことを第3の特徴とし、[情報の受け手]側が、
    [信号処理制御プログラム]の制御により{[可変定数
    の臨場感強調フィルタ]を介して[元の音響データ]か
    ら[臨場感成分を強調した音響データ]を生成する機
    能}と{[[元の画像データ]を座標変換した画像デー
    タ]を生成する機能}を有することを第4の特徴とし、
    {{[[情報の送り手]側によってあらかじめ決められ
    た手順]}かまたは{[[情報の受け手]側の操作]}
    かまたは{[情報の受け手]側のモニタ画面上の位置を
    指し示すマークの[画面座標]}のいずれか}により、
    [臨場感を強調した音響データ]と[[元の画像デー
    タ]を座標変換した画像データ]を再生する機能を有す
    ることを第5の特徴とし、上記、第1と第2と第3と第
    4と第5の特徴を有するところの、[臨場感]を表現す
    る[手段または手法]。
  2. 【請求項2】[情報の送り手]側が発信する[任意の情
    報]が、少なくとも[元の画像データ]を含むことを第
    6の特徴とし、[情報の送り手]側が発信する[任意の
    情報]が、{[情報の受け手]側で{[[元の画像デー
    タ]を座標変換した画像データ]を生成するに必要な
    [信号処理制御プログラム]を含む}ことを第7の特徴
    とし、[情報の送り手]側が{[可変定数の臨場感強調
    フィルタ]介して[元の音響データ]から生成した[臨
    場感成分を強調した音響データ]を生成する}機能を有
    することを第8の特徴とし、{{[[情報の送り手]側
    によってあらかじめ決められた手順]}により、[臨場
    感成分を強調した音響データ]と[[元の画像データ]
    を座標変換した画像データ]を再生する機能を有するこ
    とを第9の特徴とし、上記、第1と第6と第7と第8と
    第9の特徴を有するところの、[臨場感]を表現する
    [手段または手法]。
  3. 【請求項3】[情報の送り手]側から発信する[任意の
    情報]が少なくとも[元の音響データ]と[元の画像デ
    ータ]を含むことを第10の特徴とし、[情報の受け
    手]側は、{[任意の情報]が含む[信号処理制御プロ
    グラム]}の制御により{[情報の受け手]側に構成し
    た[臨場感成分の抽出フィルタ]}を介して{[元の音
    響データ]から[臨場感成分の音響データ]を抽出す
    る}機能を有することを第11の特徴とし、[情報の受
    け手]側は、{[任意の情報]が含む[信号処理制御プ
    ログラム]}の制御により{{[[情報の送り手]側に
    よってあらかじめ決められた手順]}かまたは{[[情
    報の受け手]側の操作]}かまたは{[情報の受け手]
    側のモニタ画面上の位置を指し示すマークの座標}}の
    いずれかに依存して{[元の音響データ]と[臨場感成
    分の音響データ]のそれぞれの強度の比率を変えて合成
    したところの[臨場感成分を強調した音響データ]}と
    {[[元の画像データ]を座標変換した画像データ]}
    を生成し、再生する機能を有することを第12の特徴と
    し、上記、第1と第10と第11と第12の特徴を有す
    るところの、[臨場感]を表現する[手段または手
    法]。
  4. 【請求項4】[情報の送り手]側は、{[任意の情報]
    が含む[信号処理制御プログラム]}の制御により
    {[情報の送り手]側に構成した[臨場感成分の抽出フ
    ィルタ]}を介して{[元の音響データ]から[臨場感
    成分の音響データ]を抽出する}機能を有することを第
    13の特徴とし、[情報の送り手]側から発信する[任
    意の情報]が少なくとも[臨場感成分の音響データ]と
    [元の画像データ]を含むことを第14の特徴とし、
    [情報の受け手]側は、{[任意の情報]が含む[信号
    処理制御プログラム]}の制御により{{[[情報の送
    り手]側によってあらかじめ決められた手順]}かまた
    は{[[情報の受け手]側の操作]}かまたは{[情報
    の受け手]側のモニタ画面上の位置を指し示すマークの
    座標}}のいずれかに依存して{[元の音響データ]と
    [臨場感成分の音響データ]のそれぞれの強度の比率を
    変えて合成したところの[臨場感成分を強調した音響デ
    ータ]}と{[[元の画像データ]を座標変換した画像
    データ]}を生成し、再生する機能を有することを第1
    5の特徴とし、上記、第1と第13と第14と第15の
    特徴を有するところの、[臨場感]を表現する[手段ま
    たは手法]。
  5. 【請求項5】{請求項1と請求項3}において複数個の
    [画像データ]と1個の[音響データ]とを対応し臨場
    感を表現することを第16の特徴とし、{請求項1と請
    求項3}において1個の[画像データ]と複数個の[音
    響データ]とを対応し臨場感を表現することを第17の
    特徴とし、{請求項1と請求項3}において複数個の
    [画像データ]と複数個の[音響データ]し臨場感を表
    現することを第18の特徴とし、上記{第16の特徴ま
    たは第17の特徴または第18の特徴}のいずれかの特
    徴を有するところの[臨場感]を表現する[手段または
    手法]。
  6. 【請求項6】[情報の送り手]側が発信する[任意の情
    報]が、少なくとも{[元の画像データ]かまたは
    [[元の画像データ]を座標変換した画像データ]}と
    {[可変定数の臨場感強調フィルタ]介して[元の音響
    データ]から生成した[臨場感成分を強調した音響デー
    タ]}または{[元の音響データ]と[臨場感成分の音
    響データ]のそれぞれの強度の比率を変えて合成したと
    ころの[臨場感成分を強調した音響データ]}を含むこ
    とを第19の特徴とし、上記、第1と第19の特徴を有
    するところの、[臨場感]を表現する[手段または手
    法]。 【0001】
JP2001031607A 2001-01-01 2001-01-01 音響と画像の臨場感を表現し伝達する方式 Pending JP2002207488A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001031607A JP2002207488A (ja) 2001-01-01 2001-01-01 音響と画像の臨場感を表現し伝達する方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001031607A JP2002207488A (ja) 2001-01-01 2001-01-01 音響と画像の臨場感を表現し伝達する方式

Publications (1)

Publication Number Publication Date
JP2002207488A true JP2002207488A (ja) 2002-07-26

Family

ID=18895670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001031607A Pending JP2002207488A (ja) 2001-01-01 2001-01-01 音響と画像の臨場感を表現し伝達する方式

Country Status (1)

Country Link
JP (1) JP2002207488A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006515490A (ja) * 2003-02-12 2006-05-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 再生位置を決定するための装置及び方法
US8078037B2 (en) 2006-03-27 2011-12-13 Pioneer Corporation Information reproducing apparatus and method, and computer program
JP2013514696A (ja) * 2009-12-17 2013-04-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006515490A (ja) * 2003-02-12 2006-05-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 再生位置を決定するための装置及び方法
US8078037B2 (en) 2006-03-27 2011-12-13 Pioneer Corporation Information reproducing apparatus and method, and computer program
JP2013514696A (ja) * 2009-12-17 2013-04-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法
US9196257B2 (en) 2009-12-17 2015-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal

Similar Documents

Publication Publication Date Title
EP1416769B1 (en) Object-based three-dimensional audio system and method of controlling the same
Begault et al. 3-D sound for virtual reality and multimedia
Waters Performance Ecosystems: Ecological approaches to musical interaction
Barrett Spatio-musical composition strategies
US20070233494A1 (en) Method and system for generating sound effects interactively
CN105684467A (zh) 使用元数据处理的耳机的双耳呈现
CN112037738A (zh) 一种音乐数据的处理方法、装置及计算机存储介质
JP2022083443A (ja) オーディオと関連してユーザカスタム型臨場感を実現するためのコンピュータシステムおよびその方法
Crawford-Emery et al. The subjective effect of BRIR length on perceived headphone sound externalization and tonal coloration
Menzies W-panning and O-format, tools for object spatialization
De Poli et al. Physically based sound modelling
CN108269460B (zh) 一种电子屏幕的阅读方法、系统及终端设备
Worrall Space in sound: sound of space
JP2002207488A (ja) 音響と画像の臨場感を表現し伝達する方式
Serafin et al. Reflections from five years of Sonic Interactions in Virtual Environments workshops
Jang et al. A personalized preset-based audio system for interactive service
WO2023109278A1 (zh) 一种伴奏的生成方法、设备及存储介质
JP2003079000A (ja) 映像音響装置の臨場感制御方式
JPH1175151A (ja) 音声処理機能付き画像表示システム
CA3044260A1 (en) Augmented reality platform for navigable, immersive audio experience
Lee et al. Real-Time Sound Synthesis of Audience Applause
Jenny et al. Can I trust my ears in VR? Literature review of head-related transfer functions and valuation methods with descriptive attributes in virtual reality
Nazemi et al. Sound design: a procedural communication model for VE
Rumsey Virtual reality: mixing rendering, believabiity
JP2002006900A (ja) 音声還元再生システム及び音声還元再生方法