JP2022061771A - 音像描画装置及び音像描画方法 - Google Patents

音像描画装置及び音像描画方法 Download PDF

Info

Publication number
JP2022061771A
JP2022061771A JP2020169910A JP2020169910A JP2022061771A JP 2022061771 A JP2022061771 A JP 2022061771A JP 2020169910 A JP2020169910 A JP 2020169910A JP 2020169910 A JP2020169910 A JP 2020169910A JP 2022061771 A JP2022061771 A JP 2022061771A
Authority
JP
Japan
Prior art keywords
image
sound image
sound
control unit
image drawing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020169910A
Other languages
English (en)
Inventor
正 宇治野
Tadashi Ujino
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP2020169910A priority Critical patent/JP2022061771A/ja
Publication of JP2022061771A publication Critical patent/JP2022061771A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】評価者が知覚した音像を効率良く可視化する音像描画装置及び音像描画方法を提供する。【解決手段】音像描画システムにおいて、音像描画装置50は、音声出力制御部521と、追跡部522と、画像表示制御部523と、格納部524とを有する。音声出力制御部521は、音響パラメータに従って音声出力装置20に音声を出力させる。追跡部522は、ユーザの身体の動きを追跡する。画像表示制御部523は、追跡部522によって得られたユーザの身体の動きの軌跡を基に生成されたオブジェクトを、撮影された画像に合成して表示装置30に表示させる。格納部524は、音響パラメータとオブジェクトを生成するための情報とを対応付けて記憶部53に格納する。【選択図】図2

Description

本発明は、音像描画装置及び音像描画方法に関する。
従来、車両内において集音した音声データを基に音像を生成し、生成した音像を画像に重畳表示する方法が知られている(例えば、特許文献1又は2を参照)。また、音像の定位評価を行う際に、評価者が知覚した音像を俯瞰図及び正面図に手描きで描画する方法が知られている。
特開2020-12704号公報 特開2004-77277号公報
しかしながら、従来の技術方法では、評価者が知覚した音像を効率良く可視化することができない場合がある。例えば、特許文献1及び2に記載の自動的に音像を描画する方法では、評価者が知覚する主観的な音像を可視化することはできない。また、俯瞰図及び正面図に手描きで描画する方法は評価者の作業負荷を増大させる。
本発明は、上記に鑑みてなされたものであって、評価者が知覚した音像を効率良く可視化することができる音像描画装置及び音像描画方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明に係る音像描画装置は、音声出力制御部と、追跡部と、画像表示制御部と、格納部とを有する。音声出力制御部は、音響パラメータに従って音声出力装置に音声を出力させる。追跡部は、ユーザの身体の動きを追跡する。画像表示制御部は、追跡部によって得られたユーザの身体の動きの軌跡を基に生成されたオブジェクトを、撮影された画像に合成して表示装置に表示させる。格納部は、音響パラメータとオブジェクトを生成するための情報とを対応付けて記憶部に格納する。
本発明によれば、評価者が知覚した音像を効率良く可視化することができる。
図1は、実施形態に係る音像描画システムの構成を示す図である。 図2は、実施形態に係る音像描画装置の構成を示す機能ブロック図である。 図3は、オブジェクトの一例を示す図である。 図4は、オブジェクトの選択について説明する図である。 図5は、オブジェクトの変形について説明する図である。 図6は、オブジェクトの一例を示す図である。 図7は、オブジェクトの再現について説明する図である。 図8は、実施形態に係る音像描画装置が実行する処理の手順を示すフローチャートである。
以下、添付図面を参照して、本願の開示する音像描画装置及び音像描画方法の実施形態を詳細に説明する。なお、以下に示す実施形態により本発明が限定されるものではない。
まず、図1を用いて、実施形態に係る音像描画装置を含む音像描画システムについて説明する。図1は、実施形態に係る音像描画システムの構成を示す図である。
音質評価において、集計者は、評価者が描画した音像を集計し解析する。図1のユーザUは評価者である。音像描画システム1は、評価者による音像の描画を支援することができる。なお、集計者及び評価者は、それぞれ解析者及び入力者と言い換えられてもよい。
図1に示すように、音像描画システム1は、車両10、音声出力装置20、表示装置30、カメラ40及び音像描画装置50を有する。例えば、車両10は自動車である。
音声出力装置20は、例えば車両10に備えられたスピーカである。また、表示装置30は、例えばユーザUによって装着されたVR(Virtual Reality)ゴーグルである。
音像描画装置50は、音像に関する画像を表示装置30に表示させる。なお、表示装置30、カメラ40及び音像描画装置50は1つの装置として一体化されていてもよい。
音像描画装置50は、表示装置30と分離された別の装置であってもよい。その場合、音像描画装置50は、車両10に搭載されたECU(Electronic Control Unit)、又は車両10との間でデータ通信が可能なサーバによって実現されてもよい。
実施形態に係る音像描画方法では、音像描画装置50は、音響パラメータに従って音声出力装置20に音声を出力させる。
実施形態に係る音像描画方法では、音像描画装置50は、ユーザUの身体の動きを追跡する。
実施形態に係る音像描画方法では、音像描画装置50は、追跡して得られたユーザUの身体の動きの軌跡を基に生成されたオブジェクトを、撮影された画像に合成して表示装置30に表示させる。
実施形態に係る音像描画方法では、音像描画装置50は、音響パラメータとオブジェクトを生成するための情報とを対応付けて記憶部に格納する。
このため、本実施形態によれば、評価者が知覚した音像を効率良く可視化することができる。
図2は、実施形態に係る音像描画装置の構成を示す機能ブロック図である。図2に示すように、音像描画装置50は、IF部51、制御部52及び記憶部53を有する。
IF部51は、音像描画装置50を他の装置と接続するためのインタフェースである。音像描画装置50は、IF部51を介して音声出力装置20、表示装置30及びカメラ40と接続される。
音像描画装置50の制御部52及び記憶部53は、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ、入出力ポート等を有するコンピュータや各種の回路により実現される。
コンピュータのCPUは、例えばROMに記憶されたプログラムを読み出して実行することによって、制御部52の音声出力制御部521、追跡部522、画像表示制御部523及び格納部524として機能する。
また、記憶部53は、RAMやフラッシュメモリに対応する。RAMやフラッシュメモリは、音響情報531、オブジェクト情報532及び各種プログラムの情報等を記憶することができる。
なお、音像描画装置50は、有線や無線のネットワークで接続された他のコンピュータや可搬型記録媒体を介して上記したプログラムや各種情報を取得することとしてもよい。
音声出力制御部521は、音響パラメータに従って音声出力装置20に音声を出力させる。例えば、音声出力制御部521は、車両10内に備えられた音声出力装置20から、音響パラメータに従って音声を出力させる。
音響情報531は、音響パラメータを含む。音声出力制御部521は、音響情報531から取得した音響パラメータを基に音声を出力させる。
音響パラメータは、音声の波形を再現するためのパラメータであってもよいし、あらかじめ作成された音声ファイルであってもよい。
追跡部522は、ユーザUの身体の動きを追跡する。例えば、追跡部522は、カメラ40から入力された画像を基にユーザUの手のひら等の部位を認識し、認識した部位の位置を随時計算することで当該部位を追跡する。
表示装置30、カメラ40及び追跡部522は、モーショントラッキング及び水平面の検出等が可能なAR(Augmented Reality)機器を実現することができる。
画像表示制御部523は、追跡部522によって得られたユーザUの身体の動きの軌跡を基に生成されたオブジェクトを、撮影された画像に合成して表示装置30に表示させる。
ここで、ユーザUは、音声を聴くことによって知覚した音場を、身体の動きによって表現するものとする。このとき、ユーザUによって表現された音場を、音像描画装置50がオブジェクトとして描画したものを音像と呼ぶ。
例えば、画像表示制御部523は、追跡部522によって得られたユーザUの身体の動きの軌跡を基に生成された3次元オブジェクトを、撮影された画像を背景とする仮想的な空間に描画する。これにより、ユーザUは音像を直感的に確認することができる。
図3は、オブジェクトの一例を示す図である。図3の画面は、画像表示制御部523が表示装置30に表示させている画面の一例である。
図3の画面の背景は、カメラ40によって撮影された画像である。このように、画像表示制御部523は、オブジェクトを、ユーザUの視界を模した画像に重畳させて、ユーザUが装着しているゴーグル型の表示装置30に表示させる。
画像表示制御部523は、画面にオブジェクト301を表示させる。オブジェクト301は、3次元オブジェクトである。そのため、光源及びカメラ40の撮影位置等に応じた光沢及び影を表現することができる。
例えば、画像表示制御部523は、追跡部522によって得られたユーザUの手のひらの軌跡で囲まれる空間と一致するオブジェクトを生成する。また、画像表示制御部523は、軌跡を基に球、楕円体、直方体等のオブジェクトを生成してもよい。
格納部524は、音響パラメータとオブジェクトを生成するための情報とを対応付けて記憶部53に格納する。例えば、格納部524は、オブジェクト301の重心、奥行き、高さ等の特徴量をオブジェクト情報532として記憶部53に格納する。
また、格納部524は、第1の画像に示されるマーカ11とオブジェクトとの位置関係を記憶部53に格納する。図3の例では、マーカ11は車両10のピラー部分に印字されているが、他の位置に印字されていてもよい。
図4は、オブジェクトの選択について説明する図である。ユーザUが生成済みのオブジェクトに対して所定の操作を行った場合、画像表示制御部523は、当該オブジェクトを選択状態にする。
例えば、図4のオブジェクト301に対し、追跡部522によって得られた軌跡から、一定時間手のひらをかざす、素早くなでる、一定回数タップする等のジェスチャが検知された場合、画像表示制御部523はオブジェクト301を選択状態にする。
画像表示制御部523は、追跡部522によって得られたユーザUの身体の動きに従って、3次元オブジェクトを移動、拡縮又は変形させる。例えば、画像表示制御部523は、選択状態になったオブジェクトを、ユーザUの身体の動きに応じて変形させることができる。
このように、ユーザUは直感的な操作によって音像の変形等を行うことができる。
図5は、オブジェクトの変形について説明する図である。例えば、オブジェクト301が楕円体である場合、ユーザUが楕円体の長軸を圧縮するような動きをした場合、画像表示制御部523は、オブジェクト301を長軸方向に縮小する。
その他にも、画像表示制御部523は、ユーザUのつまむ、押す、引く、切る、つぶす、のばす、握る等の動作を検知してオブジェクト301を変形させることができる。
画像表示制御部523は、図6のように、複数のオブジェクトを表示させることができる。図6は、オブジェクトの一例を示す図である。
また、画像表示制御部523は、音響パラメータに基づく音場を構成する要素のそれぞれに対応付けられたオブジェクトを描画する。
例えば、画像表示制御部523は、ユーザUによって表現された音場であって、帯域ごと(高域、中域、低域)に表現された音場のそれぞれを、個別のオブジェクトとして描画する。これにより、多様な音像の表現が可能になる。
また、音声が楽曲を再生するものである場合、画像表示制御部523は、パートごと又は楽器ごとにオブジェクトを描画してもよい。
例えば、図6のオブジェクト302、オブジェクト303及びオブジェクト304は、それぞれ種類が異なる音源の音声を基にユーザUが生成したものであってもよい。
また、画像表示制御部523は、図6に示す複数のオブジェクトのうち、ユーザUによって選択されたオブジェクトを表示し、選択されていないオブジェクトを非表示にしてもよい。
音像描画装置50は、記憶部53に格納されたオブジェクトを異なる日時及び場所で再現することができる。これにより、評価者以外のユーザUが、評価者が知覚した音場を追体験することができる。
例えば、画像表示制御部523は、記憶部53に格納されたオブジェクトを生成するための情報を基に生成したオブジェクトを、撮影された画像である第1の画像と異なる第2の画像に合成して表示させる。図7は、オブジェクトの再現について説明する図である。
図7は、車両10内で生成されたオブジェクトを、オフィス内で再現した場合の例である。図7に示すように、オフィス内の所定の場所に、マーカ11と同等の視覚的特徴を持つマーカ11aが印字されている。
図6の背景の画像は第1の画像の一例である。また、図7の背景の画像は第2の画像の一例である。
図7のオブジェクト302a、オブジェクト303a及びオブジェクト304aとマーカ11aとの位置関係は、図6のオブジェクト302、オブジェクト303及びオブジェクト304とマーカ11との位置関係と同等である。
このように、音像描画装置50によれば、保存されたオブジェクトを、別の場所で再現することができるため、集計者は任意の場所で集計及び解析を行うことができる。
また、画像表示制御部523は、第2の画像に示されるマーカと第2の画像に表示されるオブジェクトの位置関係が、記憶部53に記憶された位置関係と同じになるように、オブジェクトを第2の画像に合成して表示させる。
これにより、位置関係を正確に再現することができる。
なお、保存されたオブジェクトの再現は、VRゴーグルに限らず、パーソナルコンピュータ、スマートフォン、タブレット端末等の3次元オブジェクトを描画する機能を備えた任意の装置上で行われてもよい。
図8を用いて、実施形態に係る音像描画装置50において実行される処理の手順について説明する。図8は、実施形態に係る音像描画装置が実行する処理の手順を示すフローチャートである。
図8に示すように、まず、音像描画装置50は、音響パラメータに従って音声出力装置20から音声を出力させる(ステップS101)。また、音像描画装置50は、カメラ40によって撮影された画像からユーザUの身体の動きを追跡する(ステップS102)。
ここで、音像描画装置50は、ユーザUの身体の動きがオブジェクトを生成するための生成動作であるか否かを確認する(ステップS103)。
ユーザUの身体の動きが生成動作でない場合(ステップS103:No)、音像描画装置50はステップS105へ進む。
一方、ユーザUの身体の動きが生成動作である場合(ステップS103:Yes)、音像描画装置50は、身体の動きの軌跡を基にオブジェクトを生成し(ステップS104)、ステップS105へ進む。
次に、音像描画装置50は、ユーザUの身体の動きがオブジェクトを選択するための選択動作であるか否かを確認する(ステップS105)。
ユーザUの身体の動きが選択動作でない場合(ステップS105:No)、音像描画装置50はステップS107へ進む。
一方、ユーザUの身体の動きが選択動作である場合(ステップS105:Yes)、音像描画装置50は、オブジェクトを選択し(ステップS106)、ステップS107へ進む。
さらに、音像描画装置50は、ユーザの身体の動きがオブジェクトを変形させるための変形動作であるか否かを確認する(ステップS107)。
ユーザUの身体の動きが変形動作でない場合(ステップS107:No)、音像描画装置50はステップS109へ進む。
一方、ユーザUの身体の動きが変形動作である場合(ステップS107:Yes)、音像描画装置50は、選択済みのオブジェクトを変形させ(ステップS108)、ステップS109へ進む。
例えば、オブジェクトの生成動作、選択動作及び変形動作は、それぞれ図3、図4及び図5で説明した動作に対応するものである。
そして、音像描画装置50は、オブジェクトを描画する(ステップS109)。このとき、音像描画装置50は、オブジェクトの生成、選択又は変形の結果を描画するオブジェクトに反映させる。
ここで、ユーザUの作業が終了される場合(ステップS110:Yes)、音像描画装置50は、音響パラメータとオブジェクトの情報を対応付けて保存する(ステップS111)。
一方、ユーザUの作業が終了されない場合(ステップS110:No)、音像描画装置50は、ステップS101に戻り処理を繰り返す。
このように、音像描画装置50は、オブジェクトの生成、選択及び変形と、オブジェクトの描画とを繰り返すことにより、リアルタイムにオブジェクトを変化させて表示させることができる。このため、ユーザUは直感的な評価及び入力を行うことができる。
音像描画装置50によれば、特に2次元の紙面上に音像を描画する場合と比べて、評価者の思考を遮られることなく音像を生成することができる。
なお、音像描画装置50は、作業が終了されるか否かを、ユーザUによる明示的な終了操作、及び時間経過等の条件により判定することができる。
上述してきたように、実施形態に係る音像描画装置50は、音声出力制御部521と、追跡部522と、画像表示制御部523と、格納部524とを有する。音声出力制御部521は、音響パラメータに従って音声出力装置20に音声を出力させる。追跡部522は、ユーザUの身体の動きを追跡する。画像表示制御部523は、追跡部522によって得られたユーザUの身体の動きの軌跡を基に生成されたオブジェクトを、撮影された画像に合成して表示装置30に表示させる。格納部524は、音響パラメータとオブジェクトを生成するための情報とを対応付けて記憶部53に格納する。
このように、音像描画装置50によれば、評価者は、自分が感じる音像の位置及び形状を、空間中で身体の動きで示すという直感的かつ簡単な動作により可視化することができる。さらに、音像描画装置50によれば、音響パラメータと音像を表すオブジェクトの3次元の情報が対応付けられて記憶される。このため、本実施形態によれば、評価者が知覚した音像を効率良く可視化することができる。さらに、その結果、評価者及び集計者による音質評価の作業効率が向上する。
また、ゴーグル型の表示装置を利用することにより、ユーザUは、実空間を見ながらより正確に音場を表現することが可能になる。
さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細及び代表的な実施形態に限定されるものではない。したがって、添付の特許請求の範囲及びその均等物によって定義される総括的な発明の概念の精神又は範囲から逸脱することなく、様々な変更が可能である。
U ユーザ
1 音像描画システム
10 車両
11、11a マーカ
20 音声出力装置
30 表示装置
40 カメラ
50 音像描画装置
51 IF部
52 制御部
53 記憶部
301、302、303、304、302a、303a、304a オブジェクト
521 音声出力制御部
522 追跡部
523 画像表示制御部
524 格納部
531 音響情報
532 オブジェクト情報

Claims (8)

  1. 音響パラメータに従って音声出力装置に音声を出力させる音声出力制御部と、
    ユーザの身体の動きを追跡する追跡部と、
    前記追跡部によって得られた前記ユーザの身体の動きの軌跡を基に生成されたオブジェクトを、撮影された画像に合成して表示装置に表示させる画像表示制御部と、
    前記音響パラメータと前記オブジェクトを生成するための情報とを対応付けて記憶部に格納する格納部と、
    を有することを特徴とする音像描画装置。
  2. 前記画像表示制御部は、前記追跡部によって得られた前記ユーザの身体の動きの軌跡を基に生成された3次元オブジェクトを、撮影された画像を背景とする仮想的な空間に描画することを特徴とする請求項1に記載の音像描画装置。
  3. 前記画像表示制御部は、前記追跡部によって得られた前記ユーザの身体の動きに従って、前記3次元オブジェクトを移動、拡縮又は変形させることを特徴とする請求項2に記載の音像描画装置。
  4. 前記画像表示制御部は、前記音響パラメータに基づく音場を構成する要素のそれぞれに対応付けられたオブジェクトを描画することを特徴とする請求項2に記載の音像描画装置。
  5. 前記画像表示制御部は、前記記憶部に格納された前記オブジェクトを生成するための情報を基に生成したオブジェクトを、前記撮影された画像である第1の画像と異なる第2の画像に合成して表示させることを特徴とする請求項1に記載の音像描画装置。
  6. 前記格納部は、前記第1の画像に示されるマーカと前記オブジェクトとの位置関係を前記記憶部に格納し、
    前記画像表示制御部は、前記第2の画像に示されるマーカと前記第2の画像に表示される前記オブジェクトの位置関係が、前記記憶部に記憶された位置関係と同じになるように、前記オブジェクトを前記第2の画像に合成して表示させることを特徴とする請求項5に記載の音像描画装置。
  7. 前記音声出力制御部は、車両内に備えられた音声出力装置から、前記音響パラメータに従って音声を出力させ、
    前記画像表示制御部は、前記オブジェクトを、前記ユーザの視界を模した画像に重畳させて、前記ユーザが装着しているゴーグル型の表示装置に表示させることを特徴とする請求項1に記載の音像描画装置。
  8. 音像描画装置によって実行される音像描画方法であって、
    音響パラメータに従って音声出力装置に音声を出力させる音声出力制御工程と、
    ユーザの身体の動きを追跡する追跡工程と、
    前記追跡工程によって得られた前記ユーザの身体の動きの軌跡を基に生成されたオブジェクトを、撮影された画像に合成して表示装置に表示させる画像表示制御工程と、
    前記音響パラメータと前記オブジェクトを生成するための情報とを対応付けて記憶部に格納する格納工程と、
    を含むことを特徴とする音像描画方法。
JP2020169910A 2020-10-07 2020-10-07 音像描画装置及び音像描画方法 Pending JP2022061771A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020169910A JP2022061771A (ja) 2020-10-07 2020-10-07 音像描画装置及び音像描画方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020169910A JP2022061771A (ja) 2020-10-07 2020-10-07 音像描画装置及び音像描画方法

Publications (1)

Publication Number Publication Date
JP2022061771A true JP2022061771A (ja) 2022-04-19

Family

ID=81210595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020169910A Pending JP2022061771A (ja) 2020-10-07 2020-10-07 音像描画装置及び音像描画方法

Country Status (1)

Country Link
JP (1) JP2022061771A (ja)

Similar Documents

Publication Publication Date Title
US11354825B2 (en) Method, apparatus for generating special effect based on face, and electronic device
US20230386174A1 (en) Method for generating customized/personalized head related transfer function
US10089785B2 (en) Real-time immersive mediated reality experiences
US10713471B2 (en) System and method for simulating facial expression of virtual facial model
KR101250619B1 (ko) 가상 사용자 인터페이스를 이용한 증강현실 시스템 및 그 방법
CN104765444A (zh) 车载手势交互空间音频系统
US20230274471A1 (en) Virtual object display method, storage medium and electronic device
JP2010026818A (ja) 画像処理プログラム、画像処理装置及び画像処理方法
KR102614048B1 (ko) 증강 현실을 위한 객체를 표시하기 위한 전자 장치 및 그의 동작 방법
US11276202B2 (en) Moving image generation apparatus, moving image generation method, and non-transitory recording medium
CN113542624A (zh) 生成商品对象讲解视频的方法及装置
JP2000322588A (ja) 画像処理装置及びその方法
JP7439131B2 (ja) 空間オーディオをキャプチャする装置および関連する方法
US11200739B2 (en) Virtual scene
WO2019085519A1 (zh) 面部跟踪方法及装置
CN111539795A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
KR101804679B1 (ko) 스토리에 기초하는 멀티미디어 콘텐츠 개발 장치 및 방법
KR102388773B1 (ko) 3차원 모델링 서비스 제공 방법 및 이를 위한 장치
JP2022061771A (ja) 音像描画装置及び音像描画方法
JP2011215709A (ja) 漫画作成支援装置、漫画作成支援方法及びプログラム
CN108028998B (zh) 耳形状分析装置和耳形状分析方法
US10200606B2 (en) Image processing apparatus and control method of the same
CN111652986B (zh) 舞台效果呈现方法、装置、电子设备及存储介质
CN114520950A (zh) 音频输出方法、装置、电子设备及可读存储介质
JP2016144044A (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230731

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240216

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240319