JP2010041483A - 映像音声出力装置 - Google Patents

映像音声出力装置 Download PDF

Info

Publication number
JP2010041483A
JP2010041483A JP2008203136A JP2008203136A JP2010041483A JP 2010041483 A JP2010041483 A JP 2010041483A JP 2008203136 A JP2008203136 A JP 2008203136A JP 2008203136 A JP2008203136 A JP 2008203136A JP 2010041483 A JP2010041483 A JP 2010041483A
Authority
JP
Japan
Prior art keywords
speaker
localization
voice
video
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2008203136A
Other languages
English (en)
Inventor
Hiroto Kawachi
洋人 河内
Kazusane Sugaya
和実 菅谷
Teiji Suzuki
禎司 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Electronic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Electronic Corp filed Critical Pioneer Electronic Corp
Priority to JP2008203136A priority Critical patent/JP2010041483A/ja
Publication of JP2010041483A publication Critical patent/JP2010041483A/ja
Ceased legal-status Critical Current

Links

Images

Landscapes

  • Television Receiver Circuits (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】話者位置が頻繁に切り替わったとしても違和感が生じない音声定位技術を提供する。
【解決手段】映像を解析して話者の位置を特定する映像解析部11と、特定した話者の位置に音声を定位させるように話者音声定位パラメータの値を設定する話者音声定位パラメータ設定部12と、特定した話者位置の履歴情報を保持する映像履歴保持部13と、履歴情報を解析して、特定した話者の位置が、予め定めた時間間隔以内に、予め定めた変更量以上変更されたと判定した場合には、話者音声定位パラメータ設定部12で設定された話者音声定位パラメータの値に対して、定位位置の変更を小さくするように話者音声定位パラメータの値を調整する話者音声定位パラメータ調整部14と、調整された話者音声定位パラメータの値に従って音声の定位変更を行う定位処理部15と、定位変更された音声を出力する音声出力部17と、を備える。
【選択図】図1

Description

本発明は、映像及び音声を含むコンテンツデータを出力する映像音声出力装置に関し、特に、映像の話者位置に応じて音声の定位を決定し、音声出力制御を行う映像音声出力装置に関する。
テレビ放送などの番組コンテンツを受信して、ディスプレイに映像を表示するとともにスピーカから音声を出力する場合、モノラル音声においてはスピーカの位置から人の声が聞こえるようになっている。また、ステレオ/サラウンド音声においては、多くの場合、画面中央に人の声を定位させて、画面中央から人の声が聞こえるようになっている。
しかしながら、一般に、ディスプレイ上の話者位置に人の声が定位していると臨場感が増すことが知られているため、従来においては、映像解析により話者位置を特定し、話者位置に音声を定位させる音声定位技術が開示されている。
例えば、特許文献1では、話者の位置を検出し、検出した位置に応じて、複数のスピーカから出力する音声の音量を制御している。また、特許文献2では、発話者の位置を特定し、特定した位置に応じて、エフェクトや音量調整を行い、最適なスピーカから音声データを出力している。
特開平11−313272号公報 特開2007−110582号公報
しかしながら、上述した従来技術においては、シーンの内容を考慮せずに、話者位置に音声を定位させているため、シーンによっては、臨場感を高めるどころか、却ってストレスを感じてしまう場合がある。例えば、2人の人物が登場し、2人の間で話者位置が頻繁に切り替わるようなシーンにおいては、切り替わる話者位置に応じて、音声の定位も頻繁に変更されるので、当該シーンを視聴している視聴者は、却ってストレスを感じてしまうという問題がある。
このように従来技術においては、シーンの内容を考慮せずに、一律に話者位置に音声を定位させているため、話者位置が頻繁に切り替わるようなシーンにおいては、臨場感を高めるどころか、却って違和感が生じるという問題がある。
本発明は上記の事情を鑑みてなされたものであり、その課題の一例としては、話者位置を特定して、特定した話者位置に音声を定位させる音声定位技術において、話者位置が頻繁に切り替わったとしても、違和感を生じない映像音声出力装置を提供することにある。
上記の課題を達成するため、請求項1に係る映像音声出力装置は、音声定位パラメータに基づいて音声定位を制御する映像音声出力装置であって、映像を解析して、話者の位置を特定する話者位置特定手段と、前記話者位置特定手段により特定した話者の位置に音声を定位させるように前記音声定位パラメータの値を設定する音声定位パラメータ設定手段と、前記話者位置特定手段で特定した話者の位置の履歴情報を保持する履歴情報保持手段と、前記履歴情報保持手段に保持された履歴情報を解析して、前記特定した話者の位置が、予め定めた時間間隔以内に、予め定めた変更量以上変更されたと判定した場合には、前記音声定位パラメータ設定手段で設定された音声定位パラメータの値に対して、定位位置の変更を小さくするように前記音声定位パラメータの値を調整する音声定位パラメータ調整手段と、前記音声定位パラメータ調整手段により、調整された音声定位パラメータの値に従って音声の定位変更処理を行い、映像及び音声を出力する定位変更出力手段と、を備えることを特徴とする。
以下、本発明の実施の形態を図面を用いて説明する。
図1は、本発明の実施の形態に係る映像音声出力装置1の概略構成図である。映像音声出力装置1は、映像データにおける話者位置の切り替わり間隔を考慮しつつ、話者位置に合わせた音声定位で音声を出力する装置であり、詳しくは、映像解析部11、話者音声定位パラメータ設定部12、映像解析履歴保持部13、話者音声定位パラメータ調整部14、定位処理部15、映像表示部16、及び音声出力部17を備えている。
ここで、映像音声出力装置1は、外部から入力された映像及び音声を含むコンテンツデータを再生して外部に出力する機能を有する装置であれば何であってもよく、例えば、具体的には、テレビジョン(TV)、DVDプレーヤ及びレコーダ、BDプレーヤ及びレコーダ、パーソナルコンピュータ(PC)などが想定される。また、「話者」とは、映像データ(画面上)において発話している者をいい、「話者位置」とは、話者の画面上の位置をいうが、より正確には話者の顔(特に口)付近の位置をいう。また、「話者位置に合わせた音声定位で音声を出力する」とは、例えば、話者が画面上左側に存在する場合には、画面左側に設けたスピーカから出力される音声の音量を大きくするなどして、話者の位置から音声が聞こえてくるように音声を出力することをいう。
映像解析部11は、入力した映像データを映像表示部16に出力する(音声データと同期させるため、必要に応じて映像データを遅延させて映像表示部16に出力する)とともに、入力した映像データから話者位置を特定するようになっている。話者位置の特定方法については、公知の技術を用いて行われる。例えば、映像データから人の顔面の領域を検出し、顔面の中の口の動きを検出することで、話者を特定するようにしてもよい。この際、口の動きの検出においては、前後数フレームの映像データを用いて、口領域の輝度などの差分を特徴量として算出し、算出した特徴量の値が最も大きい口領域を持った人を話者と判定とすれば、複数の顔面が検出された場合であっても、話者を特定することができる。
また、映像解析部11は、特定した話者の位置を話者音声定位パラメータ設定部12と映像解析履歴保持部13に出力するようになっている。
話者音声定位パラメータ設定部12は、映像解析部11から入力された話者位置に音声データを定位させるためのパラメータ(以下、話者音声定位パラメータという)の値を設定するようになっている。ここで、「話者位置に音声データを定位させるためのパラメータの値」とは、話者位置から音が聞こえるように音声が出力されるためのパラメータの値をいい、例えば、複数備えたスピーカのうち、話者位置の近くに設置されたスピーカの音量を大きくし、他のスピーカの音量を小さくするような音量調整に関するパラメータ値(複数のスピーカのそれぞれに対する音量設定値)を意味する。
また、話者音声定位パラメータ設定部12は、設定された話者音声定位パラメータ値を話者音声定位パラメータ調整部14に出力するようになっている。
映像解析履歴保持部13は、映像解析部11から入力された話者位置に関する情報を予め定めた時間の間(例えば、直近の数分間など)、時系列的に履歴情報として保持している。この履歴情報を保持することは、映像音声出力装置1の特徴であるので、詳しくは後述する。
また、映像解析履歴保持部13は、履歴情報を話者音声定位パラメータ調整部14に出力するようになっている。
話者音声定位パラメータ調整部14は、話者音声定位パラメータ設定部12で設定された話者音声定位パラメータの値を入力するとともに、映像解析履歴保持部13が保持する履歴情報を入力して、設定された話者音声定位パラメータの値を調整するようになっている。詳しくは、履歴情報から現在の話者位置と過去の話者位置を比較し、短時間の間に話者位置が大きく変わる場合には、現在の話者位置に音声を定位させる音声定位変更量を小さくするように話者音声定位パラメータの値を調整(修正)するようになっている。
ここで、話者音声定位パラメータの値を調整するための条件が成立する閾値、すなわち、話者位置が切り替わる時間間隔、及び話者位置の変更量は予め定められているものとする。また、「現在の話者位置に音声を定位させる音声定位変更量を小さくするように話者音声定位パラメータの値を調整する」とは、例えば、二人の人物が登場しているシーンにおいて、直前の話者位置が画面左側にいる人Aの位置であり、現在の話者位置が画面上右側にいる人Bの位置である場合を例に挙げて説明すると、話者位置の切り替わり間隔を全く考慮しないときには、右側のスピーカの音量をA1の大きさで出力するように設定した話者音声定位パラメータの値P1を、右側のスピーカの音量をA2(<A1)の大きさで出力するように設定した話者音声定位パラメータの値P2に調整することをいう。すなわち、この場合には、話者位置が左側に存在する人Aから右側に存在する人Bに移動したとしても、話者音声定位パラメータの値を話者位置に追随させて極端には変化させず、例えば、画面中央位置等に音声を定位させるなど、緩やかに変化させるように話者音声定位パラメータの値を調整する。この結果、視聴者は、短時間に話者位置が大きく変わったとしても、違和感を覚えることがない。なお、「音声定位変更量を小さくする」には、入力された音声データ(通常は画面中央位置に定位していることが多い音声データ)に対して音声定位変更量を小さくするようにしてもよいし、また、直前に設定した話者音声定位パラメータの値に対して音声定位変更量を小さくするようにしてもよい。
また、話者音声定位パラメータ調整部14は、調整された話者音声定位パラメータの値を定位処理部15に出力するようになっている。
定位処理部15は、音声データを入力するとともに、話者音声定位パラメータ調整部14から出力された話者音声定位パラメータの値を入力し、入力された話者音声定位パラメータの値に基づいて、音声データの定位変更処理を行うようになっている。また、定位処理部15は、定位変更処理した音声データを音声出力部17に出力するようになっている。
映像表示部16は、映像解析部11から出力された映像データをディスプレイ等に表示すべく出力するようになっている。
音声出力部17は、定位変更処理された音声データをスピーカに出力するようになっている。
い。
次に、図2を参照して、映像解析履歴保持部13が保持する履歴情報について具体的に説明する。図2は、本実施の形態における履歴情報の一例であるが、図2に示す履歴情報は、図3に示すような座標系を用いて表記されている。すなわち、1440×1080の画像サイズにおいて、画面左上を原点、横方向をX軸、縦方向をY軸としてピクセル単位に座標系を構成している。ここで、画面上で特定される話者SPの位置は、顔面の位置であり、本実施の形態では、矩形な顔領域Fの四隅の座標を話者SPの位置としている。具体的には、顔領域Fの左上の頂点S0(X0,Y0)、右上の頂点S1(X1,Y1)、左下の頂点S2(X2,Y2)、及び右下の頂点S3(X3,Y3)により、話者SPの位置を特定している。
図2に示すように、履歴情報は、少なくとも、履歴情報を一意に識別可能なシーケンス番号No、発話開始時刻st、発話終了時刻et、顔領域Fの4頂点の位置(座標)、及び話者音声定位位置P(座標)を備えている。
ここで、履歴情報のシーケンス番号No、発話開始時刻st、発話終了時刻et、及び顔領域Fの位置は、映像解析履歴保持部13で設定される情報であり、話者音声定位位置Pは、話者音声定位パラメータ調整部14で設定される情報である。すなわち、話者音声定位位置P(Px、Py)は上述した話者音声定位パラメータを具体化したものである。なお、以下の具体例では、通常時は、話者音声定位位置Pは、特定された話者の顔領域Fの中心位置に設定され、短い時間間隔で話者位置が大きく変わるときは、話者音声定位位置Pは、画面の中心位置に設定される場合について説明する。
また、以下の具体例では、話者SPの位置が、1秒未満の時間間隔で画面サイズの半分以上の距離の位置変更があった場合(X座標で720以上、またはY座標で540以上の変更があった場合)には、話者音声定位位置Pを画面の中心位置に設定するようにしている。
次に、図4及び図5を用いて、図2に示した履歴情報の内容を説明する。図4及び図5は、図2に示した履歴情報に従って、話者SPの位置が切り替わる様子を示している。
図4(a)は、図2のNo1の履歴情報に基づく映像データを示している。すなわち、話者A及び話者Bのうち、10秒から15秒までの間においては、話者SPは話者Aであることを示している。同様にして、図4(b)は、図2のNo2の履歴情報に基づく映像データを示しており、20秒から30秒の間は、話者SPは話者Bであることを示している。また、図4(c)は、図2のNo3の履歴情報に基づく映像データであり、35秒から45秒の間は、話者SPは話者Aであることを示している。また、図4(d)は、図2のNo4の履歴情報に基づく映像データを示しており、50秒から60秒の間は、話者SPは話者Bであることを示している。すなわち、図4は、時間経過に応じて、話者A→話者B→話者A→話者Bと話者が交互に切り替わる場合を示している。
ここで、図4において話者SPが切り替わる場合には、図4(a)から図4(b)、図4(b)から図4(c)、図4(c)から図4(d)のいずれもが、それぞれ5秒間の時間間隔を有している。すなわち、話者SPの発話が終了してから、次の話者SPの発話が開始されるまでに5秒間発話のない時間帯が存在している。このように話者SPの切り替わりに十分な時間間隔がある場合には、話者音声を話者位置に定位させて臨場感を高めるようにしている。
具体的には、図2の履歴情報の話者音声定位位置Pが示すように、図4(a)では、話者音声定位位置Pは話者Aの顔領域Fの中心(270,280)であり、図4(b)では、話者音声定位位置Pは話者Bの顔領域Fの中心(1080,355)であり
り、図4(c)では、話者音声定位位置Pは話者Aの顔領域Fの中心(270,280)であり、図4(d)では、話者音声定位位置Pは話者Bの顔領域Fの中心(1080,355)である。
これに対して、図5(a)は、図2のNo5の履歴情報に基づく映像データを示しており、60秒から61秒の間は、話者SPは話者Aであることを示している。また、図5(b)は、図2のNo6の履歴情報に基づく映像データを示しており、61秒から62秒の間は、話者SPは話者Bであることを示している。また、図5(c)は、図2の番号7の履歴情報に基づく映像データを示しており、62秒から63秒の間は、話者SPは話者Aであることを示している。すなわち、図4(d)及び図5は、時間経過に応じて、話者B→話者A→話者B→話者Aと話者が交互に切り替わる場合を示している。
ここで、図5において話者SPが切り替わる場合には、図4(d)から図5(a)、図5(a)から図5(b)、及び図5(b)から図5(c)に示すように、時間間隔が存在しない。すなわち、話者の発話が終了してから、次の話者の発話が開始されるまでに発話のない時間帯が存在していない。また、話者Aと話者Bの位置は、X座標で810離れているので、上述した画面サイズの半分以上の距離の位置変更があった場合に該当する。このように短い時間間隔で話者位置が大きく変わる場合には、話者音声を画面中央位置に定位させ、視聴者に違和感を生じさせないようにしている。
具体的には、図2の履歴情報の話者音声定位位置Pが示すように、図5(a)では、話者SPは話者Aであるが、話者音声定位位置Pは画面の中心(720,540)であり、図5(b)では、話者SPは話者Bであるが、話者音声定位位置Pは画面の中心(720,540)であり、図5(c)では、話者SPは話者Aであるが、話者音声定位位置Pは画面の中心(720,540)である。
詳しくは、図5(a)では、話者SPは話者Aであるため、話者の切り替わりに十分な時間間隔があれば、話者音声定位位置Pは(270,280)に設定されるところであるが、話者の切り替わりに十分な時間間隔がないので、話者音声定位位置Pは(720,540)に設定される。すなわち、話者の切り替わりに十分な時間間隔があれば、話者音声定位位置Pを図4(c)に示す(1080、355)から(270,280)に変更するところを、話者の切り替わりに十分な時間間隔がないので、話者音声定位位置Pを図4(c)に示す(1080、355)から(720,540)に変更している。ここで、(1080、355)→(720,540)の位置変更は、(1080、355)→(270,280)の位置変更に比べて変更量が小さくなっており、このことは、上述した「音声定位変更量を小さくするように話者音声定位パラメータの値を調整する」を具体的に示すものである。
次に、図6を参照して、本実施の形態の映像音声出力装置1の映像音声出力処理について説明する。図6は、映像音声出力装置1の話者位置の切り替わり間隔を考慮して、音声定位制御を行う映像音声出力処理の流れを示すフローチャートである。
まず、映像音声出力装置1の映像解析部11が入力された映像データを解析して、映像データの話者位置を特定する(ステップS10)。
次に、映像音声出力装置1の話者音声定位パラメータ設定部12は、特定された話者位置に基づいて、話者音声定位パラメータの値を設定する(ステップS20)。
次に、映像音声出力装置1の話者音声定位パラメータ調整部14は、映像解析履歴保持部13に保持されている、特定された話者位置に関する履歴情報を参照する(ステップS30)。
次に、映像音声出力装置1の話者音声定位パラメータ調整部14は、参照した履歴情報に基づいて、短い時間間隔で話者位置が大きく変わったか否かを判定する(ステップS40)。すなわち、予め定めた話者位置が切り替わる時間間隔、及び予め定めた話者位置の変更量を基準に、短い時間間隔で話者位置が大きく変わったか否かを判定する。
短い時間間隔で話者位置が大きく変わった場合には(ステップS40:YES)、映像音声出力装置1は、話者位置への音声定位変更量が小さくなるように、話者音声定位パラメータの値を調整する(ステップS50)。
次に、映像音声出力装置1の定位処理部15は、設定された話者音声定位パラメータの値に従って、音声データの音声定位変更を行う(ステップS60)。すなわち、短い時間間隔で話者位置が大きく変わった場合には(ステップS40:YES)、話者位置への音声定位変更量が小さくなるように調整された話者音声定位パラメータの値で音声データの音声定位変更を行い、そうでない場合には(ステップS40:NO)、ステップS20で設定された話者音声定位パラメータの値で音声データの音声定位変更を行う。
次に、映像音声出力装置1の映像表示部16は、映像データを出力し、また、音声出力部17は、音声定位変更を行われた音声データを出力する(ステップS70)。
以上説明したように、本実施の形態に係る映像音声出力装置1によれば、映像を解析して、話者の位置を特定する映像解析部11と、映像解析部11により特定した話者の位置に音声を定位させるように話者音声定位パラメータの値を設定する話者音声定位パラメータ設定部12と、映像解析部11で特定した話者位置の履歴情報を保持する映像履歴保持部13と、映像履歴保持部13に保持された履歴情報を解析して、特定した話者の位置が、予め定めた時間間隔以内に、予め定めた変更量以上変更されたと判定した場合には、話者音声定位パラメータ設定部12で設定された話者音声定位パラメータの値に対して、定位位置の変更を小さくするように話者音声定位パラメータの値を調整する話者音声定位パラメータ調整部14と、話者音声定位パラメータ調整部14により、調整された話者音声定位パラメータの値に従って音声の定位変更を行う定位処理部15と、定位処理部15により定位変更された音声を出力する音声出力部17と、を備えるので、特定した話者位置に音声を定位させる音声定位技術を備えた装置において、短い時間間隔で話者位置が頻繁に切り替わっても、視聴者は違和感を生じることがない。例えば、二人の人物が登場し、短い時間間隔で交互に話者が切り替わる漫才のような番組プログラムを視聴しても、視聴者は違和感を覚えることがない。
この場合、話者音声定位パラメータ調整部14は、表示画面の中心方向の位置に音声が定位するように話者音声定位パラメータの値を調整するようにしてもよい。短い時間間隔で話者位置が頻繁に切り替わったとしても、音声を画面中心に定位させているので、視聴者は違和感を覚えることなく、快適にコンテンツを視聴することができる。
以上、本発明の実施の形態について説明してきたが、本発明は、上述した実施の形態に限られるものではなく、本発明の要旨を逸脱しない範囲において、本発明の実施の形態に対して種々の変形や変更を施すことができ、そのような変形や変更を伴うものもまた、本発明の技術的範囲に含まれるものである。
本発明の実施の形態に係る映像音声出力装置の概略構成図である。 本発明の実施の形態に係る映像音声出力装置の履歴情報の一例である。 本発明の実施の形態に係る映像音声出力装置に入力される映像データの例である。 本発明の実施の形態に係る映像音声出力装置に入力される映像データにおいて話者が切り替わる様子を示す図である。 本発明の実施の形態に係る映像音声出力装置に入力される映像データにおいて話者が切り替わる様子を示す図である。 本発明の実施の形態に係る映像音声出力装置の話者位置の切り替わり間隔を考慮して、音声定位制御を行う映像音声出力処理の流れを示すフローチャートである。
符号の説明
1 映像音声出力装置
11 映像解析部
12 話者音声定位パラメータ設定部
13 映像解析履歴保持部
14 話者音声定位パラメータ調整部
15 定位処理部
16 映像表示部
17 音声出力部

Claims (3)

  1. 音声定位パラメータに基づいて音声定位を制御する映像音声出力装置であって、
    映像を解析して、話者の位置を特定する話者位置特定手段と、
    前記話者位置特定手段により特定した話者の位置に音声を定位させるように前記音声定位パラメータの値を設定する音声定位パラメータ設定手段と、
    前記話者位置特定手段で特定した話者の位置の履歴情報を保持する履歴情報保持手段と、
    前記履歴情報保持手段に保持された履歴情報を解析して、前記特定した話者の位置が、予め定めた時間間隔以内に、予め定めた変更量以上変更されたと判定した場合には、前記音声定位パラメータ設定手段で設定された音声定位パラメータの値に対して、定位位置の変更を小さくするように前記音声定位パラメータの値を調整する音声定位パラメータ調整手段と、
    前記音声定位パラメータ調整手段により、調整された音声定位パラメータの値に従って音声の定位変更処理を行い、映像及び音声を出力する定位変更出力手段と、
    を備えることを特徴とする映像音声出力装置。
  2. 前記音声定位パラメータ調整手段は、表示画面の中心方向の位置に音声を定位させるように前記音声定位パラメータの値を調整することを特徴とする請求項1記載の映像音声出力装置。
  3. 前記話者位置特定手段は、映像における人の顔の位置を検出して、検出した顔の口の動きから、話者を特定し、特定した話者の口近傍を話者の位置とすることを特徴とする請求項1又は2記載の映像音声出力装置。
JP2008203136A 2008-08-06 2008-08-06 映像音声出力装置 Ceased JP2010041483A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008203136A JP2010041483A (ja) 2008-08-06 2008-08-06 映像音声出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008203136A JP2010041483A (ja) 2008-08-06 2008-08-06 映像音声出力装置

Publications (1)

Publication Number Publication Date
JP2010041483A true JP2010041483A (ja) 2010-02-18

Family

ID=42013535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008203136A Ceased JP2010041483A (ja) 2008-08-06 2008-08-06 映像音声出力装置

Country Status (1)

Country Link
JP (1) JP2010041483A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01296900A (ja) * 1988-05-25 1989-11-30 Nippon Telegr & Teleph Corp <Ntt> 音像定位制御方式
JPH03272280A (ja) * 1990-03-20 1991-12-03 Victor Co Of Japan Ltd 音声信号処理装置
JPH08191498A (ja) * 1995-01-09 1996-07-23 Sony Corp 音場拡大装置
JP2008177734A (ja) * 2007-01-17 2008-07-31 Matsushita Electric Ind Co Ltd デジタル放送コンテンツ再生装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01296900A (ja) * 1988-05-25 1989-11-30 Nippon Telegr & Teleph Corp <Ntt> 音像定位制御方式
JPH03272280A (ja) * 1990-03-20 1991-12-03 Victor Co Of Japan Ltd 音声信号処理装置
JPH08191498A (ja) * 1995-01-09 1996-07-23 Sony Corp 音場拡大装置
JP2008177734A (ja) * 2007-01-17 2008-07-31 Matsushita Electric Ind Co Ltd デジタル放送コンテンツ再生装置

Similar Documents

Publication Publication Date Title
JP5957760B2 (ja) 映像音声処理装置
JP5067595B2 (ja) 画像表示装置および方法、並びにプログラム
US10848894B2 (en) Controlling audio in multi-viewpoint omnidirectional content
KR102072146B1 (ko) 입체 음향 서비스를 제공하는 디스플레이 장치 및 방법
US20120120207A1 (en) Image playback device and display device
CN102055941A (zh) 视频播放器及视频播放方法
JP5499469B2 (ja) 音声出力装置、映像音声再生装置及び音声出力方法
JP2007221269A (ja) 表示信号制御装置、表示信号制御方法、プログラム及び記憶媒体
US20120128184A1 (en) Display apparatus and sound control method of the display apparatus
KR20190013758A (ko) 음향 처리 장치 및 방법, 그리고 프로그램
JP2010206265A (ja) 音像制御装置、音像制御方法、ストリームのデータ構造、及びストリーム生成装置
JP4713398B2 (ja) 映像音声再生装置、及びその音像移動方法
CN108347688A (zh) 根据单声道音频数据提供立体声效果的影音处理方法及影音处理装置
JP2010041483A (ja) 映像音声出力装置
WO2010140254A1 (ja) 映像音声出力装置及び音声定位方法
KR20160093404A (ko) 캐릭터 선택적 오디오 줌인을 제공하는 멀티미디어 콘텐츠 서비스 방법 및 장치
KR20100028326A (ko) 미디어 처리 방법 및 그를 위한 장치
JP2010041484A (ja) 映像音声出力装置
JP2010041485A (ja) 映像音声出力装置
JP2010258776A (ja) 音声信号処理装置
US10516961B2 (en) Preferential rendering of multi-user free-viewpoint audio for improved coverage of interest
KR20150058809A (ko) 다중 영상 재생장치 및 재생방법
JP5067240B2 (ja) 遅延制御装置
JP2009159073A (ja) 音響再生装置および音響再生方法
JP5894055B2 (ja) 映像データ制御装置、映像データ制御方法及び映像データ制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110802

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120919

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121002

A045 Written measure of dismissal of application

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20130226