JP4385289B2 - 音声処理装置および方法、並びにプログラム - Google Patents

音声処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP4385289B2
JP4385289B2 JP2004080033A JP2004080033A JP4385289B2 JP 4385289 B2 JP4385289 B2 JP 4385289B2 JP 2004080033 A JP2004080033 A JP 2004080033A JP 2004080033 A JP2004080033 A JP 2004080033A JP 4385289 B2 JP4385289 B2 JP 4385289B2
Authority
JP
Japan
Prior art keywords
parameter
speakers
data
processing
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004080033A
Other languages
English (en)
Other versions
JP2005267766A5 (ja
JP2005267766A (ja
Inventor
暁子 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2004080033A priority Critical patent/JP4385289B2/ja
Publication of JP2005267766A publication Critical patent/JP2005267766A/ja
Publication of JP2005267766A5 publication Critical patent/JP2005267766A5/ja
Application granted granted Critical
Publication of JP4385289B2 publication Critical patent/JP4385289B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)

Description

本発明は、音声処理装置および方法、並びにプログラムに関し、特に、映像と、その映像に関わる音声を処理するとき、映像が提供される方向と音声が提供される方向を一致させるように制御する際に適用して好適な音声処理装置および方法、並びにプログラムに関する。
近年、ホームシアターシステムや、5.1チャンネルシステムなどと称されるシステムが普及しつつある。このようなシステムにおいては、複数のスピーカが設置され、臨場感のある音がユーザに提供されるように構成されている。
また、そのようなシステムにおいて扱われるマルチチャンネルコンテンツなどと称されるコンテンツも普及しつつある。マルチチャンネルコンテンツには、映像と複数の音声(オーディオ)チャネルで構成されるものと、複数のオーディオチャンネルのみで構成されるものがある。
映像がある場合、センターチャンネル(システムに含まれる複数のスピーカのうち、センタースピーカと称され、通常、映像を映し出すモニターの近傍に配置されるスピーカ用のチャンネル)に台詞が割り振られる。一方、映像がない場合、サラウンド空間の中央正面の音が割り当てられる。
このように、マルチチャンネルコンテンツを扱う装置では、センタースピーカとモニターのような映像再生装置を視聴者の正面に配置することでサラウンド空間を再現している。そのようなサラウンド空間を車でも再現できるように、車内に複数のスピーカを配置している車もある。
このようにして、ユーザに最適な音響を提供するような制御が行われている。また、マルチチャンネルコンテンツを扱う装置において、映像があるコンテンツを扱うときと、映像がないコンテンツを扱うときとで、モニターの電源のオン、オフを制御することも提案されている。(例えば、特許文献1参照)
特開2001−250333号公報
しかしながら、車内空間のように余剰スペースが限られる環境においては必ずしも視聴者の正面にセンタースピーカやモニターを配置できない場合が多い。そのような場合、例えば、モニターに表示されている映像が映画であるようなとき、その映画の台詞が、映像画面とは異なる方向から聞こえてきて、ユーザ(搭乗者)に違和感を与えてしまうといった問題があった。
このような問題は、必ずしも車載のシステムに限定される問題ではなく、家などで、同様なシステムを構築したとしても、余剰スペースなどの関係で、センタースピーカとモニターを適切な位置に配置することができず、結果として、上述したような問題が発生する可能性があった。
ホームシアターシステムなどと称されるシステムを構築したときに、このような問題、すなわち、ユーザに違和感を感じさせるようなことを防ぐ必要があるといた課題があった。
本発明はこのような状況に鑑みてなされたものであり、映像に関わりある音声が、その映像とは結びつかない方向から聞こえてくることにより、ユーザが違和感を感じるといったような不都合が発生しないように、また、ユーザに最適な音響を提供できるように、出力される音声を制御することを目的とする。また、そのような制御を行うためにユーザ側で行う設定を、できる限り簡便に行えるようにすることを目的とする。
本発明の音声処理装置は、車内に設置された複数のスピーカから出力される音声を制御する音声処理装置において、リスニングポジション、スピーカの数、スピーカの配置、センタースピーカの有無に関するデータをそれぞれ設定する設定手段と、前記設定手段により設定されたデータから一意に算出されるパラメータ、または一意にテーブルから読み出されるパラメータであり、前記車内に設置されたモニタの映像と音声が提供される方向が一致するようにするために前記複数のスピーカから出力される音を制御するための第1のパラメータと、前記リスニングポジションの位置に音像を定位させるようにするために前記複数のスピーカから出力される音を制御するための第2のパラメータを、それぞれ設定し、記憶する記憶手段と、所定の記録媒体から読み出されるコンテンツデータが映像データを含むか否かを判断する判断手段と、前記判断手段により当該コンテンツデータに映像データが含まれると判断された場合、前記記憶手段に記憶された前記第1のパラメータを読み出し、前記判断手段により当該コンテンツデータに映像データは含まれないと判断された場合、前記記憶手段に記憶された前記第2のパラメータを読み出す読み出し手段と、前記読み出し手段により読み出された前記第1のパラメータまたは前記第2のパラメータに基づき、前記コンテンツデータに含まれる音声データを処理する処理手段とを含む。
本発明の音声処理方法は、パラメータを記憶する記憶手段と、所定の記録媒体からコンテンツデータを再生する再生手段を少なくとも備え、車内に設置された複数のスピーカから出力される音声を制御する音声処理装置の音声処理方法において、リスニングポジション、スピーカの数、スピーカの配置、センタースピーカの有無に関するデータをそれぞれ設定する設定ステップと、前記設定ステップの処理で設定されたデータから一意に算出されるパラメータ、または一意にテーブルから読み出されるパラメータであり、前記車内に設置されたモニタの映像と音声が提供される方向が一致するようにするために前記複数のスピーカから出力される音を制御するための第1のパラメータと、前記リスニングポジションの位置に音像を定位させるようにするために前記複数のスピーカから出力される音を制御するための第2のパラメータを、それぞれ設定し、前記記憶手段への記憶を制御する記憶制御ステップと、前記再生手段により前記記録媒体から再生されたコンテンツデータに映像データが含まれるか否かを判断する判断ステップと、前記判断ステップの処理で当該コンテンツデータに映像データが含まれると判断された場合、前記記憶手段に記憶されている前記第1のパラメータを読み出し、前記判断手段により当該コンテンツデータに映像データは含まれないと判断された場合、前記記憶手段に記憶されている前記第2のパラメータを読み出す読み出しステップと、前記読み出しステップの処理により読み出された前記第1のパラメータまたは前記第2のパラメータに基づき、前記コンテンツデータに含まれる音声データを処理する処理ステップとを含む。
本発明のプログラムは、パラメータを記憶する記憶手段と、所定の記録媒体からコンテンツデータを再生する再生手段を少なくとも備え、車内に設置された複数のスピーカから出力される音声を制御する音声処理装置に、リスニングポジション、スピーカの数、スピーカの配置、センタースピーカの有無に関するデータをそれぞれ設定する設定ステップと、前記設定ステップの処理で設定されたデータから一意に算出されるパラメータ、または一意にテーブルから読み出されるパラメータであり、前記車内に設置されたモニタの映像と音声が提供される方向が一致するようにするために前記複数のスピーカから出力される音を制御するための第1のパラメータと、前記リスニングポジションの位置に音像を定位させるようにするために前記複数のスピーカから出力される音を制御するための第2のパラメータを、それぞれ設定し、前記記憶手段への記憶を制御する記憶制御ステップと、前記再生手段により前記記録媒体から再生されたコンテンツデータに映像データが含まれるか否かを判断する判断ステップと、前記判断ステップの処理で当該コンテンツデータに映像データが含まれると判断された場合、前記記憶手段に記憶されている前記第1のパラメータを読み出し、前記判断手段により当該コンテンツデータに映像データは含まれないと判断された場合、前記記憶手段に記憶されている前記第2のパラメータを読み出す読み出しステップと、前記読み出しステップの処理により読み出された前記第1のパラメータまたは前記第2のパラメータに基づき、前記コンテンツデータに含まれる音声データを処理する処理ステップとを含む処理を実行させるコンピュータが読み取り可能なプログラム。
このプログラムを処理するコンピュータは、音声処理装置を含むカーナビゲーションシステムなどと称される装置を制御するために、そのカーナビゲーションシステムに内蔵されているものとすることができる。
また、このプログラムは、所定の記録媒体に記録して配布することが可能である。また、このプログラムは、ネットワークを介して、音声処理装置を制御するコンピュータに提供することが可能である。
本発明の音声処理装置および方法、並びにプログラムにおいては、再生されるコンテンツデータに映像データが含まれている場合と、含まれていない場合とで、異なるパラメータに基づいて音声データが処理される。音声データが処理されることにより複数のスピーカから音が出力される場合、パラメータにより各スピーカから出力される音の強度などは調整され、その調整は、映像がある場合とない場合とで異なるものとされる。
本発明によれば、映像と音声をユーザ側に提供するときと、音声のみをユーザ側に提供するときとで、異なる音声出力の制御を行うことが可能となる。その制御により、映像が提供されるときには、その映像が提供される方向と、音声が提供される方向とが、一致しているとユーザが感じるようにすることが可能となる。
以下に、本発明の実施の形態について図面を参照して説明する。
図1は、本発明を適用したシステムの一実施の形態の構成を示す図である。
図1に示したシステムは、車内に設置される、カーナビゲーションシステムなどと称される装置に、本発明を適用した場合の構成例を示している。カーナビゲーションシステムは、GPS(Global Positioning System)を用い、車の走行位置をユーザに認識させ、ユーザが設定した目的地までの道順を、ユーザに案内する機能を有するものである。
また、近年のカーナビゲーションシステムには、カーオーディオなどと称される装置と一体化されたものもある。そのような一体化された装置には、CD(Compact Disk)やラジオ放送を再生することにより、ユーザに音声を提供する機能が備えられている。また、そのような一体化された装置には、DVD(Digital Versatile Disc)やテレビジョン放送を再生し、ユーザに、映像と音声を提供する機能も備えられている。
本明細書においては、カーナビゲーションシステムと称される機能と、カーオーディオと称される機能が一体化された装置を例に挙げて説明する。また、説明の都合上、以下の説明においては、そのような一体化された装置をカーナビゲーションシステムと記述する。
カーナビゲーションシステムは、本体10とモニター11とから構成されている。モニター11は、ユーザ(運転者)が運転している状態でも視認できる位置、例えば、車のダッシュボードの上に取り付けられる。モニター11には、本体10から供給されるデータに基づく画像や映像、例えば、地図や映画などの映像が表示される。
画像や映像(以下、特に区別する必要がない場合、画像と記述する)を表示するモニター11と、タッチパネル12は一体的に構成されている。タッチパネル12は、ユーザがその上をタッチしたとき、その位置(座標)を検出する。タッチパネル12は、透明な部材で形成されており、その下に配置されているモニター11に表示された画像をユーザが視認することができるように構成されている。
カーナビゲーションシステムは、通常、音声をユーザに提供するためのスピーカも含む構成とされている。図2は、カーナビゲーションシステムを構成し、車内に設置されるスピーカの配置について説明するための図である。図2に示した例では、運転席21、助手席22、および、後部座席23が車内の座席として設置されている。このような座席の配置の場合、例えば、図2に示すように、運転席21側にスピーカ31−1、助手席22側にスピーカ31−2、後部座席23の両側に、それぞれスピーカ32−1,32−2が設けられている。
このように、図2に示した車内には、4個のスピーカが設置されている。スピーカの数は、車やユーザの好みなどにより異なり、4個とは限らない。また、5.1チャンネルシステムなどと称され、5個のスピーカと、1個の重低音用のスピーカ(ウーファー)から構成されるスピーカシステムを備える車両もある。
このように、車により設置されているスピーカの数や、その配置などは異なる。
また、モニター11で映像が表示されているときと、映像が表示されていないときとでは、各スピーカからの音の出し方が異なる方が好ましい。このことについて説明を加える。例えば、モニター11に映像が表示されている状況は、本体10で映画などが収録されたDVDを再生している状況である。
映画などの場合、モニター11の近傍(好ましくは背後)からセリフなどの音が出力される方が好ましい。これは、モニター11上の映像、特に、その映像に含まれている俳優から発せられる音声は、その俳優から発せられているように聞こえる方が好ましいからである。
例えば、図2に示したように、モニター11とスピーカが配置されているような場合、モニター11上に映し出されている俳優が発したセリフが、スピーカ31−1から聞こえてくるような場合、運転席21に座っている運転者(ユーザ)は、モニター11上の映像と、聞こえてくる音声の方向との不一致による違和感(場合によっては不快感)を感じることがある。このことは、他の席に座っているユーザにとっても同じことが言える。
次に、モニター11上に映像が表示されていないような状況を考える。モニター11上に映像が表示されていないような状況とは、例えば、モニター11上に何も表示されていない、地図などの画像が表示されている場合などが考えられる。このような状況で、本体12により音楽が収録されたCDが再生されているような場合、その音楽が、モニター11の近傍から聞こえてこなくても、ユーザが違和感を感じるようなことはないと考えられる。むしろ、音楽のような場合、換言すれば、映像とのかかわりがない音の場合、モニター11の配置位置にかかわらず、例えば、運転席21に座っている運転者には、スピーカ31−1から音が聞こえれば問題はないと考えられる。
このように、モニター11上に表示されている画像とスピーカから出力される音にかかわりがある場合、その音が聞こえてくる方向が制御された方が好ましいと考えられる。
そこで、音の方向に関する制御を、本体10側で行えるようにするために、車内に設置されているスピーカの数およびその配置の設定が行なわれ、その設定に基づいて音の方向に関する制御が行われるようにする。まず、そのような設定や制御を行う本体10の構成について説明を加える。
図3は、本体10の内部構成例を示す図である。
本体10のCPU(Central Processing Unit)51は、ROM(Read Only Memory)52に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)53には、CPU51が各種の処理を実行する上において必要なデータやプログラムなどが適宜記憶される。入出力インタフェース55は、タッチパネル12や図示されていない本体10に設けられた操作部から構成される入力部56が接続され、入力部56に入力された信号をCPU51に出力する。また、入出力インタフェース55には、モニター11やスピーカなどから構成される(または、それらの機器と接続され、制御するためのインタフェースなどを含む構成とされる)出力部57も接続されている。
さらに、入出力インタフェース55には、ハードディスクなどから構成される記憶部58、および、リモートコントローラ(不図示)と赤外線などを用いてデータの授受を行う通信部59も接続されている。ドライブ60は、磁気ディスク71、光ディスク72、光磁気ディスク73、半導体メモリ74などの記録媒体からデータを読み出したり、データを書き込んだりするときに用いられる。
ドライブ60に装着される記録媒体は、上述したように、映画などが収録されたDVD、音楽などが収録されたCD、地図データが収録された所定のディスクなどである。ドライブ60は、このように、複数の記録媒体を取り扱うことができる、マルチディスクドライブなどと称されるドライブである。
図4は、本体12の機能を示すブロック図である。
図4においては、以下の説明において必要となる機能を図示し、説明を加えるが、本体10の機能は、図4に示した機能に限定されるわけではない。例えば、図4に示した機能には、カーナビゲーションシステムにおけるナビゲーションを実行する部分の詳細は図示していないが、そのような機能が、実際のカーナビゲーションシステムに備えられているのはいうまでもなく、そのような機能がないカーナビゲーションシステムに本発明が適用されることを意味しているわけではない。
制御部101は、本体10内の各部を制御するために設けられている。制御部101は、CPU51(図3)が有する機能である。制御部101は入力処理部102から入力されるユーザからの指示に基づき各部を制御する。ユーザからの指示は、タッチパネル12から入力される。ここでは、タッチパネル12から指示が入力されるとするが、リモートコントローラなどからも入力され、制御部101は、それらの指示も処理するように構成されている。
入力処理部102は、ドライブ60が所定の記録媒体から読み出したデータを、制御部101に供給するための制御も行う。表示制御部103は、モニター101の表示の制御を行う。その制御に用いるためのデータ(例えば、地図データ)は、制御部101から供給される。データ保持部104は、後述するような、スピーカの設定に関わる処理に関するデータなどを保持し、制御部101にその保持しているデータを供給する。データ保持部104は、例えば、ROM52、RAM53、記憶部58(いずれも図3)から構成される。
映像処理部105は、ドライブ60から読み出されたデータのうち、映像に関する映像データを処理するために設けられている。通常、映像データは、MPEG(Moving Picture Experts Group)方式などの所定の方式で圧縮されている。そこで、映像処理部105は、供給された映像データを所定の方式に基づき伸張し、表示制御部103に供給する。
同様に、音声処理部106は、制御部101から供給される音声データを所定の方式に基づいて伸張し、スピーカ31−1(図2)などに対して出力する。音声処理部106は、デジタルフィルタ107を有し、必要に応じて、スピーカ31−1に出力するデータに対してフィルタリング処理を施す。
このような機能を有する本体10の動作について説明を加える。まず、図5のフローチャートを参照して、スピーカの数および配置の設定に関わる動作について説明する。
前提として、スピーカの数および配置に関わる設定が行われる場合、ユーザにより、その設定を行うためのプログラムの起動が指示される。その指示に基づき、制御部101は、データ保持部104からプログラムを読み出し、その読み出したプログラムに基づく制御を制御を行うことにより以下に説明する処理が実行される。
ステップS11において、車種の設定が行われる。制御部101は、データ保持部104に保持(記憶)されているデータの内、車種の設定に関わるデータ(プログラム)を読み出す。読み出されたデータに基づく処理が実行されることにより、モニター11上には、図6に示したような画面が表示される。
図6に示した画面には、“乗車定員は?”というメッセージの下側に、“5人以下”という項目121と、“5人以上”という項目122が表示されている。ここで、乗車定員として5人を閾値としたのは、車内に設置される座席の列が、2列かまたは3列かを決定する一要因であると考えられるからである。
また、車内に設置されるスピーカの数を決定する要因として、車内に設置される座席数(列数)が一要因であると考えられる。そこで、ここでは、スピーカの数を設定するための画面として、まず、図6に示すように、乗車定員をユーザ側に質問する画面を設ける。
なお、図6に示した画面の他の画面の例として、例えば、“1ボックス”、“セダン”、“ワゴン”といった車種をユーザ側に質問する画面や、直接的にスピーカの数を入力(選択)させるような画面も考えられ、そのような画面でも良い。
図6のような画面が、モニター11上に表示され、項目121、または、項目122のうちのどちらか一方がユーザにより選択されると、ステップS12に処理が進められる。モニター11上には、タッチパネル12が設置されているため、ユーザは、そのタッチパネル12をタッチすることにより、項目121または項目122を選択することができる。
タッチパネル12は、タッチされた位置を検出すると、その位置を示すデータを入力処理部102(図4)の制御のもと、制御部101に出力する。制御部101は、タッチパネル12からの位置データを参照し、項目121が選択されたのか、項目122が選択されたのかを判断する。“5人以下”という項目121が選択された場合、図7に示したような画面が、モニター11上に表示され、“5人以上”という項目122が選択された場合、図8に示したような画面が、モニター11上に表示される。
図7に示した画面は、乗車定員が“5人以下”という項目121が選択された際に、モニター11上に表示される画面例である。その表示される画面は、車内の座席の列が2列の場合を模式的に示している。図7に示した画面には、俗にフロントスピーカなどと称されるスピーカ131−1,131−2、リアスピーカなどと称されるスピーカ132−1,132−2、および、サブウーファーなどと称されるスピーカ133を示すマークが、それぞれ表示されている。なお、センタースピーカは、後述する処理で選択されるため、図7に示した画面には表示されない。
図8に示した画面は、乗車定員が“5人以上”という項目122が選択された際に、モニター11上に表示される画面例である。その表示される画面は、車内の座席の列が3列の場合を模式的に示している。図8に示した画面には、図7に示した画面で表示されるスピーカのマークに加え3列目の座席の左右に、スピーカ151−1とスピーカ151−2を示すマークが表示されている。
なお、図7や図8に示した画面は、一例であり限定を示すものではない。例えば、車によっては、座席が2列の車であっても、図7に示したようなスピーカの配置(数)になっていない車もある。そのような車にも対応できるように、適宜、ユーザによりスピーカの配置位置や数を変更できるような仕組み、例えば、図7や図8に示したような画面だけでなく、他の画面も用意し、それらの画面をユーザが選択できるようにしても良い。
図7または図8に示したような画面が、モニター11上に表示されると、ステップS12の処理としてユーザは、リスニングポジションの選択を行う。最も良い音の環境が提供されるポジションを、どこにするかが選択される。リスニングポジションが選択され、“OK”ボタン141が操作されると、ステップS13に処理が進められ、モニター11の設置されている列が選択(設定)される。
図7に示した画面において“OK”ボタン141が操作された場合、図9に示したような画面に切り換えられ、図8に示した画面において“OK”ボタン141が操作された場合、図10に示したような画面に切り換えられる。図9や図10に示した画面には、列を選択するための枠171が表示されている。例えば、ユーザが、所定の列を選択すると、その選択された列に枠171が表示され、ユーザにその列が選択されていることを認識させるようになっている。
図9または図10に示した画面において、ユーザが、モニター11が設置されている座席の列を選択し、“OK”ボタン141を操作すると、図11に示したような画面にモニター11上の画面が切り換えられる。ユーザは、図11に示したような画面において、モニター11上のスクロールバー191を操作することにより、モニター11が設置されている位置を設定する。
このように、モニター11が設置されている列と、その列における位置(左右方向)が設定されることにより、モニター11の設置されている位置が登録される。
図11における画面から、“OK”ボタン141が操作されると、図12または図13に示したような画面にモニター11上の画面が切り換えられる。図12または図13に示した画面が参照され、ステップS14において、スピーカの構成が設定される。
図12または図13に示した、各スピーカを示す複数のマークのなかから、選択されたマーク(ユーザによりタッチされたマーク)は実線で、選択されていないマークは、点線で表示される。図12に示した画面例においては、スピーカ131−1,131−2が、選択されたため、実線で表示されている。また、選択されたマークで、実線で表示されているマークであっても、再度タッチされることにより、選択されていない状態(点線で表示される状態)に戻すことが可能とされている。
また、例えば、フロントスピーカと称されるスピーカ131−1とスピーカ131−2は、通常、車には少なくとも設置されているスピーカであるため、デフォルトとして実線で表示される(既に選択された状態にされる)ようにしても良い。
さらに、フロントスピーカ(スピーカ131−1とスピーカ131−2)やリアスピーカ(スピーカ132−1とスピーカ132−2)は、通常、対になって装着されるため、例えば、スピーカ132−1が選択された場合、ユーザの指示によらず、対に構成されるスピーカ132−2も選択されるようにしても良い。
ユーザは、このような図12または図13に示した画面を参照し、自己の車に設置されているスピーカに対応する位置に表示されているマークをタッチし、選択する。ユーザは、設置されているスピーカに対応するマークを選択し終えた場合、“O.K.”ボタンをタッチする。このような選択、および、決定の処理が、ユーザ側で行われることにより、センタースピーカ以外のスピーカの数およびその位置の設定が行われる。
そして、図14または図15に示したような画面においてセンタースピーカの有無が設定される。センタースピーカが設置されている場合には、“あり”というボタン201が操作され、センタースピーカが設置されていない場合には、“なし”というボタン202が操作される。操作されたボタンは、操作されていないボタンと区別が付くように表示される。ユーザは、操作されたボタンが正しければ、“OK”ボタン141を操作する。
ステップS15において、センタースピーカが設置されていると選択されたか否かが判断される。図14または図15に示した画面において、“あり”というボタン201が操作され、その後“OK”ボタン141が操作された場合、“YES”と判断され、ステップS16に処理が進められ、それ以外のときには“NO”と判断され、ステップS16の処理がスキップされてステップS17に処理が進められる。
ステップS16において、図16に示したような画面がモニター11上に表示される。ユーザは、図16に示した画面を参照し、センタースピーカの位置を設定する。図16に示した画面は、センタースピーカの位置(左右方向)を、スクロールバー191により設定する場合を示している。
図16の画面の代わりに、図17に示したような画面が表示され、より詳細にセンタースピーカの位置が設定されるようにしても良い。図17に示した画面において、センタースピーカが、車内の天井に設置されている場合、スピーカ134−1が選択される。同様に、ダッシュボード上で、運転席から見て左側に設置されている場合、スピーカ134―2が選択され、中央に設置されている場合、スピーカ134―3が選択され、右側(運転者から見て前)に設置されている場合、スピーカ134―4が選択される。
ここまでの処理において、リスニングポジション、スピーカの数、その配置がそれぞれ設定される。本体10側では、このような設定に関する処理を、以下のように行う。すなわち、選択されたスピーカのマーク(座席の列などのマーク)を点線の表示から実線の表示に切り換えるといった処理は、表示制御部103により行われる。ユーザがタッチパネル12をタッチすると、ユーザがタッチした位置のデータは、入力処理部102を介して制御部101に供給される。
制御部101は、供給されたデータから、どのスピーカのマークが選択されたのかを判断する。制御部101は、選択されたと判断したマークの情報を、表示制御部103に供給する。表示制御部103は、その供給されたデータを基に、マークを実線で表示する、または、点線で表示するといった制御を行う。
また、制御部101は、“OK”ボタン141が操作されたと判断した場合、その時点で設定されているスピーカに関するデータを、データ保持部104に保持させる。この保持に関する処理は、ステップS17およびステップS18の処理として行われる。
ステップS17とステップS18におけるそれぞれの処理で設定され、保持されるデータは、共に、設定されたリスニングポジション、スピーカの数、その配置、センタースピーカの有無に関するデータである。そして、そのようなデータの他に、それらのデータから一意に算出されるパラメータ、または、一意にテーブルから読み出されるパラメータである。
ステップS17において設定されるパラメータは、モニター11の位置にセンタースピーカ134の音像を定位させるためのパラメータ(以下、パラメータ1とする)である。このようなパラメータ1は、モニター11上に音声と関わりのある映像が表示され(例えば、DVDが再生されているような状態)、あたかもその映像から音が出ているような感覚をユーザに提供するためのパラメータである。
ステップS18において設定されるパラメータは、リスニングポジションの位置にセンタースピーカ134の音像を定位させるためのパラメータ(以下、パラメータ2とする)である。このようなパラメータ2は、モニター11上に音声と関わりのある映像は表示されていなく(例えば、CDが再生されているような状態)、あたかもユーザの目の前で演奏されている(音が出ているような)感覚をユーザに提供するためのパラメータである。
このようにして、車内に設置されているスピーカの数や、センタースピーカの有無、それらのスピーカの配置位置が設定され、その設定された情報(以下、適宜、スピーカデータと記述する)から、パラメータが設定され、データ保持部104に保持される。
このようにしてデータ保持部104に保持されたパラメータは、ドライブ60によりデータが再生される際、ユーザにとって最適であると判断される音を提供するための制御に用いられる。具体的には映像がある場合には、その映像が存在しているところから、音が発せられているかのように制御され、映像がない場合には、通常の制御が行われるようにするために、データ保持部104に保持されたスピーカデータが用いられる。
このような制御について、図18のフローチャートを参照して説明する。
ユーザによりドライブ60に所定の記録媒体(例えば、DVDやCD)が挿入され、その挿入された記録媒体からのデータ(以下、適宜、コンテンツデータと記述する)の再生が指示されると、ステップS31以下の処理が本体12において開始される。
ステップS31において、ドライブ60により記録媒体に記録されているコンテンツデータの再生が行われる。ドライブ60により記録媒体から読み出されたコンテンツデータは、入力処理部102の制御のもと、制御部101に供給される。ステップS32において、制御部101は、読み出されたコンテンツデータに映像データは含まれているか否かを判断する。
例えば、コンテンツデータのヘッダ部分には、そのデータの種類(音声データであるか、映像データであるかなど)の情報が記載されている。その情報が参照されることにより、ステップS32における処理が行われる。
ステップS32において、読み出されたコンテンツデータには映像データが含まれると判断された場合、ステップS33に処理が進められる。ステップS33において、データ保持部104に保持されているパラメータ1が読み出される。そして、データ保持部104から読み出されたパラメータ1は、音声処理部106のデジタルフィルタ107に設定される。このパラメータ1がどのようなことを実現するためのパラメータなのかについて、ここで説明を加えておく。
上述したように、モニター11に映像が表示されているとき、その映像に関わりのある音声は、あたかもその映像から発せられているように制御される方が好ましい。換言すれば、映像と、その映像に関わる音声は、その映像と一致する方向から発せられる方が好ましい。
例えば、センタースピーカが設置されている場合を例に挙げて説明すると、モニター11の背面に、センタースピーカが設置されていれば、センタースピーカからの音がモニター11が位置する方向から発せられることになる。よって、このような場合、ユーザに提供される映像の方向と、提供される音声の方向が一致することになる。このような一致している状態が、好ましい状態であると考えられる。
しかしながら、車内という限られた空間内では、必ずしもセンタースピーカをモニター11の背面に設置できるとは限らず、図17に示したように、センタースピーカの配置位置は、ダッシュボードの左右、中央、または天井といったように種々の場所が考えられる。また、センタースピーカ自体が設置されていない場合もある。
そのような場合であっても、映像と音声が提供される方向が一致するようにするために、車内に設置されている各スピーカから出力される音を制御する。その制御のために用いられるのが、上記したパラメータである。
図18に示したフローチャートの説明に戻り、ステップS34において、音声処理部106は、制御部101から供給される音声データを、設定されたパラメータ1を用いて処理する。処理された音声データは、それぞれ、対応するスピーカに対して出力される。
また、映像処理部105は、制御部101から供給される映像データを処理する。処理された映像データは、表示制御部103を介してモニター11に供給される。
ステップS35において、コンテンツの切り換えがあったか否かが判断される。例えば、ドライブ60に挿入されていた記録媒体が、他の記録媒体に交換され、その記録媒体に記録されているコンテンツデータの再生が指示された場合、ステップS35において、コンテンツの切り換えがあったと判断される。
ステップS35において、コンテンツの切り換えはないと判断された場合、ステップS34に処理が戻され、それ以降の処理が繰り返される。すなわち、その時点で再生されているコンテンツデータの再生が維持される。
一方、ステップS35において、コンテンツの切り換えがあったと判断された場合、その新たなコンテンツに対して、ステップS32以降の処理が繰り返される。
ステップS32において、再生されているコンテンツに映像はないと判断された場合、ステップS36に処理が進められる。ステップS36において、データ保持部104に保持されている、パラメータ2が読み出される。そして、データ保持部104から読み出されたパラメータ2は、音声処理部106のデジタルフィルタ107に設定される。このパラメータ2は、上述したように、音像を、リスニングポジションにいるユーザの前にくるようにするためのものである。
ステップS37において、音声処理部106は、制御部101から供給される音声データを、設定されたパラメータ2を用いて処理する。処理された音声データは、それぞれ、対応するスピーカに対して出力される。
ステップS38において、コンテンツの切り換えがあったか否かが判断される。例えば、ドライブ60に挿入されていた記録媒体が、他の記録媒体に交換され、その記録媒体に記録されているコンテンツデータの再生が指示された場合、ステップS38において、コンテンツの切り換えがあったと判断される。
ステップS38において、コンテンツの切り換えはないと判断された場合、ステップS37に処理が戻され、それ以降の処理が繰り返される。すなわち、その時点で再生されているコンテンツデータの再生が維持される。
このように、再生されるコンテンツデータに映像データが含まれているか否かにより、音を制御するためのパラメータが設定され、その設定されたパラメータにより、スピーカから出力される音が制御される。すなわち、モニター11に映像が映し出される場合、その映像に適合する方向から音が出力されるように制御される。
このような制御が行われることにより、ユーザは、映像のあり、なしに依存する最適な音響設定を容易に設定することができると共に、設置した音響設定に基づく音の提供を受けることができる。また、一度スピーカデータを設定すれば、すなわち、図5に示したようなフローチャートの処理が実行されれば、コンテンツの種類が切り替わったような場合でも、本体10側で最適な音響設定に切り換えられるようにすることができる。もって、ユーザに、常に、最適な音響を提供することが可能となる。
なお、スピーカデータ(パラメータ)は、データ保持部104に複数保持させておく(パラメータ1、2以外にさらに他のパラメータも保持させておく)ようにしても良い。複数のパラメータをデータ保持部104に保持させるようにした場合、複数のパラメータを作成するために、図5に示したようなフローチャートの処理が複数回行われる(または、ステップS17やステップS18と同様の処理が繰り返される)。
また、複数のパラメータは、それぞれ、例えばコンテンツの特徴(例えば、コンテンツが映画の映像なのか、コンサートなどの映像なのか)により用意されるようにし、コンテンツの特徴などに依存して、音響設定が切り換えられるようにしても良い。
なお、上述した実施の形態においては、車内における音の制御を例に挙げて説明したが、本発明を家内のホームシアターシステムなどと称されるシステムに適用することも可能である。
上述した一連の処理は、それぞれの機能を有するハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ(本実施の形態においては、本体10に相当する装置)などに、記録媒体からインストールされる。
記録媒体は、図3に示すように、パーソナルコンピュータ(本体10)とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク71(フレキシブルディスクを含む)、光ディスク72(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク73(MD(Mini-Disc)(登録商標)を含む)、若しくは半導体メモリ74などよりなるパッケージメディアにより構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記憶されているROM52や記憶部58が含まれるハードディスクなどで構成される。
なお、本明細書において、媒体により提供されるプログラムを記述するステップは、記載された順序に従って、時系列的に行われる処理は勿論、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
本発明を適用したシステムの一実施の形態の構成を示す図である。 スピーカの配置について説明するための図である。 本体の内部構成例を示す図である。 本体の機能を示すブロック図である。 本体の動作を説明するためのフローチャートである。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 モニターに表示される画面例を示す図である。 本体の動作を説明するためのフローチャートである。
符号の説明
10 本体, 11 モニター, 12 タッチパネル, 51 CPU, 52 ROM, 53 RAM, 56 入力部, 57 出力部, 58 記憶部, 59 通信部, 60 ドライブ, 101 制御部, 102 入力処理部, 103 表示制御部, 104 データ保持部, 105 映像処理部, 106 音声処理部, 107 デジタルフィルタ

Claims (4)

  1. 車内に設置された複数のスピーカから出力される音声を制御する音声処理装置において、
    リスニングポジション、スピーカの数、スピーカの配置、センタースピーカの有無に関するデータをそれぞれ設定する設定手段と、
    前記設定手段により設定されたデータから一意に算出されるパラメータ、または一意にテーブルから読み出されるパラメータであり、前記車内に設置されたモニタの映像と音声が提供される方向が一致するようにするために前記複数のスピーカから出力される音を制御するための第1のパラメータと、前記リスニングポジションの位置に音像を定位させるようにするために前記複数のスピーカから出力される音を制御するための第2のパラメータを、それぞれ設定し、記憶する記憶手段と、
    所定の記録媒体から読み出されるコンテンツデータが映像データを含むか否かを判断する判断手段と、
    前記判断手段により当該コンテンツデータに映像データが含まれると判断された場合、前記記憶手段に記憶された前記第1のパラメータを読み出し、前記判断手段により当該コンテンツデータに映像データは含まれないと判断された場合、前記記憶手段に記憶された前記第2のパラメータを読み出す読み出し手段と、
    前記読み出し手段により読み出された前記第1のパラメータまたは前記第2のパラメータに基づき、前記コンテンツデータに含まれる音声データを処理する処理手段と
    を含む音声処理装置。
  2. それぞれ所定の位置に配置されて音声を出力するための前記複数のスピーカに対して、
    前記処理手段は、
    前記第1のパラメータまたは前記第2のパラメータに基づき前記複数のスピーカからの音声の出力を異ならせるように前記音声データを処理する
    請求項1記載の音声処理装置。
  3. パラメータを記憶する記憶手段と、所定の記録媒体からコンテンツデータを再生する再生手段を少なくとも備え、車内に設置された複数のスピーカから出力される音声を制御する音声処理装置の音声処理方法において、
    リスニングポジション、スピーカの数、スピーカの配置、センタースピーカの有無に関するデータをそれぞれ設定する設定ステップと、
    前記設定ステップの処理で設定されたデータから一意に算出されるパラメータ、または一意にテーブルから読み出されるパラメータであり、前記車内に設置されたモニタの映像と音声が提供される方向が一致するようにするために前記複数のスピーカから出力される音を制御するための第1のパラメータと、前記リスニングポジションの位置に音像を定位させるようにするために前記複数のスピーカから出力される音を制御するための第2のパラメータを、それぞれ設定し、前記記憶手段への記憶を制御する記憶制御ステップと、
    前記再生手段により前記記録媒体から再生されたコンテンツデータに映像データが含まれるか否かを判断する判断ステップと、
    前記判断ステップの処理で当該コンテンツデータに映像データが含まれると判断された場合、前記記憶手段に記憶されている前記第1のパラメータを読み出し、前記判断手段により当該コンテンツデータに映像データは含まれないと判断された場合、前記記憶手段に記憶されている前記第2のパラメータを読み出す読み出しステップと、
    前記読み出しステップの処理により読み出された前記第1のパラメータまたは前記第2のパラメータに基づき、前記コンテンツデータに含まれる音声データを処理する処理ステップと
    を含む音声処理方法。
  4. パラメータを記憶する記憶手段と、所定の記録媒体からコンテンツデータを再生する再生手段を少なくとも備え、車内に設置された複数のスピーカから出力される音声を制御する音声処理装置に、
    リスニングポジション、スピーカの数、スピーカの配置、センタースピーカの有無に関するデータをそれぞれ設定する設定ステップと、
    前記設定ステップの処理で設定されたデータから一意に算出されるパラメータ、または一意にテーブルから読み出されるパラメータであり、前記車内に設置されたモニタの映像と音声が提供される方向が一致するようにするために前記複数のスピーカから出力される音を制御するための第1のパラメータと、前記リスニングポジションの位置に音像を定位させるようにするために前記複数のスピーカから出力される音を制御するための第2のパラメータを、それぞれ設定し、前記記憶手段への記憶を制御する記憶制御ステップと、
    前記再生手段により前記記録媒体から再生されたコンテンツデータに映像データが含まれるか否かを判断する判断ステップと、
    前記判断ステップの処理で当該コンテンツデータに映像データが含まれると判断された場合、前記記憶手段に記憶されている前記第1のパラメータを読み出し、前記判断手段により当該コンテンツデータに映像データは含まれないと判断された場合、前記記憶手段に記憶されている前記第2のパラメータを読み出す読み出しステップと、
    前記読み出しステップの処理により読み出された前記第1のパラメータまたは前記第2のパラメータに基づき、前記コンテンツデータに含まれる音声データを処理する処理ステップと
    を含む処理を実行させるコンピュータが読み取り可能なプログラム。
JP2004080033A 2004-03-19 2004-03-19 音声処理装置および方法、並びにプログラム Expired - Fee Related JP4385289B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004080033A JP4385289B2 (ja) 2004-03-19 2004-03-19 音声処理装置および方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004080033A JP4385289B2 (ja) 2004-03-19 2004-03-19 音声処理装置および方法、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2005267766A JP2005267766A (ja) 2005-09-29
JP2005267766A5 JP2005267766A5 (ja) 2007-05-10
JP4385289B2 true JP4385289B2 (ja) 2009-12-16

Family

ID=35092140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004080033A Expired - Fee Related JP4385289B2 (ja) 2004-03-19 2004-03-19 音声処理装置および方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP4385289B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007116363A (ja) * 2005-10-19 2007-05-10 Fujitsu Ten Ltd 音響空間制御装置

Also Published As

Publication number Publication date
JP2005267766A (ja) 2005-09-29

Similar Documents

Publication Publication Date Title
US10219096B2 (en) Seat-optimized reproduction of entertainment for autonomous driving
US20070268415A1 (en) Vehicle mounted display apparatus and sound controlling method
JP2009143495A (ja) 音響制御装置
JP4535883B2 (ja) 車載用マルチメディア装置
JP3554648B2 (ja) マルチメディア再生システム
JP2002354600A (ja) 音響装置
JP4215967B2 (ja) 音響装置
US9013640B2 (en) DVD menu representation via optical character recognition
JP4385289B2 (ja) 音声処理装置および方法、並びにプログラム
JP4289175B2 (ja) 可搬機器
JP2007116363A (ja) 音響空間制御装置
JP2006197432A (ja) ビデオシステム
JP2010074258A (ja) 表示装置及び表示方法
JP4316468B2 (ja) デジタルネットワークを用いたデータ再生システムおよびデータ再生方法、レジューム再生制御装置
JP2008227942A (ja) コンテンツ再生装置及びコンテンツ再生方法
JP4496981B2 (ja) 音響再生装置
JP5317465B2 (ja) 車載音響システム
JP4090682B2 (ja) 車載用音響システム
JP4214546B2 (ja) Avシステム
JP2008056063A (ja) 車載オーディオビジュアル装置
JP2005223491A (ja) オーディオシステム
JP7162987B2 (ja) 車載装置
JP2007331615A (ja) 番組共視聴システム
KR20080005036U (ko) 네비게이션과 미디어의 사운드가 동시에 출력 가능한차량용 사운드 시스템
JP4657872B2 (ja) 再生装置、再生方法、および、プログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070316

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070316

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090903

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090916

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121009

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121009

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131009

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees