以下、図を参照しながら、この発明による装置、方法、プログラムの一実施の形態について説明する。
[第1の実施の形態]
[再生装置100の構成と動作について]
以下に説明する第1の実施の形態においては、この発明による装置、方法、プログラムを音声信号の再生装置(以下、単に再生装置という。)に適用した場合を例にして説明する。
図1は、この第1の実施の形態の再生装置100を説明するためのブロック図である。図1に示すように、この第1の実施の形態の再生装置100は、メディア再生部1、音声信号処理部2、D/Aコンバータ(Digital/Analog Converter)3、システムコントローラ4、操作部5、コマンド受信部6を備えると共に、リモートコマンダ10を通じて遠隔制御することができるものである。
メディア再生部1は、例えばCD(Compact Disc)やDVD(Digital Versatile Disc)、或いはブルーレイディスク(Blu-Ray Disc)などの光ディスク記録媒体や、MD(Mini Disc(登録商標))などの光磁気ディスク、ハードディスクなどの磁気ディスク、半導体メモリを内蔵した記録媒体など、所要の記録媒体に記録されている音声信号を読み出して再生することができるものである。
この場合、メディア再生部1が対応する記録媒体には、Lch(左チャンネル)とRch(右チャンネル)とによる2系統の音声信号によるコンテンツが記録されているものとする。メディア再生部1で再生されたこれらLch、Rchの音声信号は、音声信号処理部2に供給される。
音声信号処理部2は、メディア再生部1からのLch、Rchとの音声信号と、後述するシステムコントローラ4からの分離角度指示信号S1および音量バランス指示信号S2とに応じ、指示された角度内に定位している音源の音声信号と指示された角度外に定位している音源の音声信号各々について所要の音声信号処理を施すように構成される。なお、音声信号処理部2の内部構成および具体的な処理については後述する。そして、音声信号処理部2において、所要の音声信号処理が施されたLchの音声信号Lexと、Rchの音声信号RexとはD/A(Digital/Analog)コンバータ3に供給される。
D/Aコンバータ3は、音声信号処理部2からのデジタル信号である音声信号Lex、Rexのそれぞれをアナログ信号に変換し、アナログ信号とされたLchの音声信号LとRchの音声信号Rとを出力する。これにより、音声信号処理部2において、上述したように、所要の信号処理が施されたLchとRchとの音声信号が例えばスピーカに供給されて再生音声をスピーカから放音することができるようにされる。
システムコントローラ4は、図1に示すように、CPU(Central Processing Unit)41、ROM(Read Only Memory)42、RAM(Random Access Memory)43、EEPROM(Electrically Erasable and Programmable ROM)44などの不揮発性メモリがCPUバス45を通じて接続されて形成されたマイクロコンピュータであり、この第1の実施の形態の再生装置100の各部を制御するものである。
システムコントローラ4に対しては、図1に示したように、操作部5とコマンド受信部6とが接続されている。操作部5は、当該再生装置100の筐体外部に表出するようにして設けられた各種の操作子を備え、それたに対するユーザからの操作入力を受け付けて、受け付けた操作入力に応じたコマンド信号を形成し、これをシステムコントローラ4に供給することができるものである。
また、コマンド受信部6は、リモートコマンダ10から発せられた例えば赤外線信号等に依るコマンド信号を受信し、これを電気信号に変換して、システムコントローラ4に供給する。リモートコマンダ10上にも各種の操作子が設けられており、上述したように、コマンド受信部6は、これらリモートコマンダ10上の操作子の操作に応じた赤外線などのコマンド信号を電気信号に変換してシステムコントローラ4に供給する。
システムコントローラ4は、操作部5またはコマンド受信部6からのコマンド信号に応じて、この第1の実施の形態の再生装置100の各部を制御する。これによって再生装置100ではユーザの操作入力に応じた動作が実行するようにされる。例えば、操作部5やリモートコマンダ10にはメディア再生部1に装填された記録媒体に記録されているコンテンツについての再生指示を行うための操作子が備えられており、当該操作子に対する操作に応じたコマンド信号が入力されることに応じて、システムコントローラ4はメディア再生部1を制御してコンテンツの再生処理を開始させることができる。
図2は、この第1の実施の形態の再生装置100のリモートコマンダ10の外観の一例について説明するための図である。この第1の実施の形態において、リモートコマンダ10上には、図2に示すように、右方向キー10a、左方向キー10b、上方向キー10c、下方向キー10dからなる方向指示のための操作子と、実行キー10eとが設けられている。
この第1の実施の形態において、ユーザは、右方向キー10aまたは左方向キー10bを操作することにより、再生装置100に対して、分離する定位角度を指示(指示入力)することができる。また、ユーザは、上方向キー10cまたは下方向キー10dを操作することにより、再生装置100に対して、上述のように指示された角度内に定位している音源の音声信号と指示された角度外に定位している音源の音声信号各々の音量バランスを指示(指示入力)することができる。
システムコントローラ4は、図2に示したリモートコマンダ10の右方向キー10a、左方向キー10bに対するユーザの操作に応じたコマンド信号の入力に応じて、音声信号処理部2に供給すべき分離角度指示信号S1を生成する。すなわち、分離角度指示信号S1は、右方向キー10a、左方向キー10bを通じて受け付けたユーザからの指示入力(分離角度指示情報)に応じて生成される分離定位角度を表すための情報である。
また、システムコントローラ4は、図2に示したリモートコマンダ10の上方向キー10c、下方向キー10dに対するユーザの操作に応じたコマンド信号の入力に応じて、音声信号処理部2に供給すべき音量バランス指示信号S2を生成する。すなわち、音量バランス指示信号S2は、上方向キー10c、下方向キー10dを通じて受け付けたユーザからの指示入力(音量バランス指示情報)に応じて生成される音量バランスを表すための情報である。
このように、この第1の実施の形態の再生装置100においては、メディア再生部1に装填された記録媒体(メディア)に記録されている音声信号を再生するに先立って、システムコントローラ4が、上述したように、例えば、リモートコマンダ10を通じて入力されるユーザからの分離角度指示情報、音量バランス指示情報の入力を受け付け、これに応じて分離角度指示信号S1、音量バランス指示信号S2を生成して、音声信号処理部2に供給する。
これにより、ユーザからの分離角度と音量バランスの指示を受けて、指示された角度内(分離角度内(分離角度範囲内))に定位している音源の音声信号と指示された角度外(分離角度外(分離角度範囲外))に定位している音源の音声信号各々の音量バランスを判別し、自動的に音量バランスを調節する事で毎回ユーザによる調整を必要とせずに常に好適な音量バランスで音声信号を再生することができるようにされる。
なお、分離角度指示情報と音量バランス指示情報との入力は、目的とする音声信号を再生するごとに入力することも可能であるが、予め再生装置100に入力しておき、例えば、システムコントローラ4のEEPROM44に記憶保持しておくようにする。
このようにしておくことにより、分離角度指示情報と音量バランス指示情報とを最初に1回だけ入力しておけば、その後においては繰り返し入力する必要はなく、EEPROM44に記憶保持するようにした分離角度指示情報と音量バランス指示情報とを用いて、分離角度指示信号S1と音量バランス指示信号S2とを生成し、これを用いるようにすることができる。すなわち、毎回ユーザによる調整を必要とせずに常に好適な音量バランスで音声信号の再生を行うようにすることができる。
また、楽曲などの再生対象となる一まとまりの音声データの識別情報と、予め入力するようにした分離角度指示情報と音量バランス指示情報とを対応付けてEEPROM44に記憶保持しておくことにより、再生対象の音声信号ごとに適切な分離角度指示情報と音量バランス指示情報とを用いて、音量バランスを適切に調整し、再生される音声を聴取できるようにすることができる。
この他、分離角度指示情報と音量バランス指示情報とを複数記憶保持するようにし、音声信号を再生するに先立って、再生対象の音声信号に合わせて、どの分離角度指示情報とどの音量バランス指示情報とを用いるかの指示入力を受け付けて、指示された分離角度指示情報と音量バランス指示情報とを用いて、分離角度指示信号S1と音量バランス指示信号S2とを生成するようにしてもよい。
[音声信号処理部2の第1の構成例と動作について]
図3は、この第1の実施の形態の再生装置100の音声信号処理部2の第1の構成例を説明するためのブロック図である。この例の音声信号処理部2は、処理対象の音声信号について、まず、指示された角度内に定位している音源の音声信号と指示された角度外に定位している音源の音声信号とに分離し、その後音量バランスを調査し、指示された音量バランスに基づき音量バランスを調整するものである。
図3に示すように、この例の音声信号処理部2は、分離処理回路21と、音量バランス調査回路22と、音量バランス調節回路23とを備えたものである。図3に示すように、分離処理回路21には、LchとRchとの左右2チャンネルの音声信号と、図1を用いて説明したように、システムコントローラ4から分離角度指示信号S1が供給される。
分離処理回路21は、システムコントローラ4からの分離角度指示信号S1に従い、これに供給されたLchとRchとの音声信号のそれぞれについて、指示された角度内(分離角度範囲内)の音源の音声信号Li、Ri(文字iは、inner(内側)の略)、および、指示された角度外(分離角度範囲外)の音源の音声信号Lo、Ro(文字oは、outer(外側)の略)に分離し、これら4つの信号のそれぞれを、音量バランス調査回路22および音量バランス調節回路23へと出力する。
なお、分離処理回路21は、分離角度指示信号S1に応じて、指示された角度内に定位している音源の音声信号と指示された角度外に定位している音源の音声信号とに分離する機能を持つ回路であれば種々のものを用いることができ、例えば、特願2005−327237(整理番号0590529003)に記載されている回路等を用いることができる。
音量バランス調査回路22は、図3に示すように、分離処理回路21において分離処理されたLchの定位角度内(分離角度内)の音声信号Liと、Rchの定位角度内(分離角度内)の音声信号Riと、Lchの定位角度外(分離角度外)の音声信号Loと、Rchの定位角度外(分離角度外)の音声信号Roとの供給を受けて、指定された角度内と角度外との音量バランスを調査し、システムコントローラ4からの音量バランス指示信号S2に従い、分離角度内の音声信号と分離角度外の音声信号とが好適な音量バランスとなるように、分離角度内の音声信号に対するゲイン値Giと、分離位角度外の音声信号に対するゲイン値Goとを決定し、これらを音量バランス調節回路23に供給する。
音量バランス調節回路23は、図3に示したように、分離処理回路21において分離処理されたLchの分離角度内の音声信号Liと、Rchの分離角度内の音声信号Riと、Lchの分離角度外の音声信号Loと、Rchの分離角度外の音声信号Roと、音量バランス調査回路22からの分離角度内の音声信号に対するゲイン値Giと、分離角度外の音声信号に対するゲイン値Goとの供給を受けて、下記[数1]に従った演算を行って、Lchの出力音声信号LexとRchの出力音声信号Rexとを生成し、これらを出力する。
音量バランス調査回路22で用いることが可能な音量バランスを調査する手法は幾つか考えられる。ここでその一例について説明する。例えば、
Lchの分離角度内の音声信号LiとRchの分離角度内の音声信号Riと和信号(Li+Ri=sum_inner)と、Lchの分離角度外の音声信号LoとRchの分離角度外の音声信号Roとの和信号(Lo+Ro=sum_outer)とを例えば各々5秒間監視し、その間における、分離角度内の和信号(sum_inner)の音量ピーク値(peak_inner)と分離角度外の和信号(sum_outer)の音量ピーク値(peak_outer)を算出する。
このようにして算出した分離角度内の和信号(sum_inner)の音量ピーク値(peak_inner)と分離角度外の和信号(sum_outer)の音量ピーク値(peak_outer)との比に応じて、処理対象の音声信号についての分離角度内と分離角度外との音量バランスを把握する。そして、この把握した分離角度内と分離角度外との音量バランスと、システムコントローラ4からの音量バランス指示信号S2とにより、分離角度内の音声信号に対するゲイン値Giと、分離角度外の音声信号に対するゲイン値Goとを決定する。
例えば、システムコントローラ4からの音量バランス指示信号S2が、分離角度内の音声信号と分離角度外の音声信号との音量比を1:1(1対1)とすることを指示しており、かつ、分離角度内の和信号(sum_inner)の音量ピーク値(peak_inner)と分離角度外の和信号(sum_outer)の音量ピーク値(peak_outer)との比が1:2(1対2)である場合には、分離角度内の音声信号に対するゲイン値Giを「1.5」とし、分離角度外の音声信号に対するゲイン値Goを「0.75」とすることにより、分離角度内の和信号(sum_inner)の音量ピーク値(peak_inner)と分離角度外の和信号(sum_outer)の音量ピーク値(peak_outer)との比が1:1(1対1)となる。
この際、音量バランス調節回路23において、「ゲイン値Gi=1.5」、「ゲイン値Go=0.75」という値を用いて、即時に音量バランスを目的とするバランスに調整してもよいが、音量バランスを変化させる時間として例えば5秒などのように遷移時間を設け、その間に徐々に音量バランスを遷移させることにより音量バランスの急激な変化を避け、ユーザに違和感を抱かせないようにすることができる。
また、分離角度内の音声信号に対するゲイン値Giと、分離角度外の音声信号に対するゲイン値Goとを決定する際には、入力信号全体の音量と出力信号全体の音量が聴感上変化しないよう留意する必要がある。
次に、この発明による第1の実施の形態のソフトウェアでの実装例について説明する。図4は、図3に示した構成の音声信号処理部2が用いられて形成された、この発明による第1の実施の形態の再生装置100で行われる処理を説明するためのフローチャートであり、この発明をソフトウェアで実現するようにした場合の例にも対応するものである。
図4に示す処理は、操作部5やリモートコマンダ10及びコマンド受信部6を通じて音声信号の再生指示を受け付け、メディア再生部1に装填された記録媒体に記録されている音声信号を再生するようにした場合に、図3を用いて説明したように構成される音声信号処理部2とシステムコントローラ4とが協働して実行する処理である。
まず、再生装置100のシステムコントローラ4は、音声信号処理部2を制御して、再生対象の音声信号が、自機において処理可能な信号形式であるか否かを判定する(ステップS101)。例えば、再生対象の音声信号がMP3(MPEG-1 Audio Layer 3)等の圧縮方式によって圧縮された信号である場合や、想定している信号フォーマットのサンプリング周波数と異なるような場合には、そのままの信号形式では処理を実行することが出来ないので、処理可能な信号フォーマットに変換するようにしている。
すなわち、ステップS101の判断処理において、肯定結果が得られると次のステップS103へ移るのに対し、ステップS101の判断処理において、否定結果が得られると、このことは音声信号処理部2が再生対象の音声信号に対して処理を実行することができないことを示しているので、ステップS102の処理に移ることになる。
したがって、ステップS101の判断処理において、再生対象の音声信号が自機においてそのまま処理可能な信号形式のものではないと判断したときには、システムコントローラ4は、音声信号処理部2を制御して、再生対象の音声信号を処理可能な信号形式の音声信号に変換する(ステップS102)。
ステップS102の処理の後には、または、ステップS101の判断処理において、再生対象の音声信号が自機においてそのまま処理可能な信号形式のものであると判断した場合には、システムコントローラ4は、音声信号処理部2に対して、分離角度指示信号S1と、音量バランス指示信号S2とを供給し、音声信号処理部2において、分離角度指示信号S1により指示された所定の分離角度内の音源の音声信号Li、Riと、指示された所定の分離角度外の音源の音声信号Lo、Roとに分離する処理を行うようにする(ステップS103)。このステップS103においての処理は、図3に示したように構成される音声信号処理部2の分離処理回路21において行われる処理である。
次に、音声信号処理部2は、LchとRchの所定の分離角度内の音源の音声信号Li、Riの和信号のピーク値(peak_inner)と、LchとRchの所定の分離角度外の音源の音声信号Lo、Roの和信号のピーク値(peak_outer)とを測定し、これらの値とシステムコントローラ5からの音量バランス指示信号S2に従い、LchとRchの所定の分離角度内の音源の音声信号Li、Riに対するゲイン値GiおよびLchとRchの所定の分離角度外の音源の音声信号Lo、Roに対するゲイン値Goを決定する(ステップS104)。このステップS104においての処理は、図3に示したように構成される音声信号処理部2の音量バランス調査回路22において行われる処理である。
そして、音声信号処理回路2は、上述の[数1]に示した計算式を用いて、Lchの所定の分離角度内の音源の音声信号Li、Lchの所定の分離角度外の音源の音声信号Lo、所定の分離角度内の音源の音声信号に対するゲイン値Gi、所定の分離角度外の音源の音声信号に対するゲイン値GoからLchの出力音声信号Lexを求め、Rchの所定の分離角度内の音源の音声信号Ri、Rchの所定の分離角度外の音源の音声信号Ro、所定の分離角度内の音源の音声信号に対するゲイン値Gi、所定の分離角度外の音源の音声信号に対するゲイン値GoからRchの出力音声信号Rexを求めて出力する(ステップS105)。このステップS105においての処理は、図3に示したように構成される音声信号処理部2の音量バランス調節回路23において行われる処理である。
このようにして生成される出力音声信号Lex、Rexは、指示された分離角度内に定位している音源の音声信号と指示された分離角度外に定位している音源の音声信号の音量バランスが、予め指示するようにされる情報に応じて調整され、聴取者の嗜好を反映した状態となっている。
そして、システムコントローラ4は、続いてオーディオ信号処理部2に入力される次の音声信号が存在するか否かを判定し(ステップS106)、否定結果が得られた場合、処理を行うべき対象が存在しないため、この図4に示す処理を終了する。また、ステップS106の判定処理において、肯定結果が得られた場合には、このことは次に処理を行うべき次の音声信号が存在することを表しており、再度ステップS101へ戻って当該ステップS101以降の処理を繰り返す。
このようにして、図3を用いて説明した構成を有する音声信号処理部2とシステムコントローラ4とが協働することにより、例えば、ユーザから予め指示される分離角度(分離角度範囲)と音量バランスとを示す情報に基づいて、指示された分離角度内に定位している音源の音声信号と指示された分離角度外に定位している音源の音声信号各々の音量バランスを判別し、自動的に音量バランスを調節することで毎回ユーザによる調整を必要とせずに常に好適な音量バランスを提供することができるようにしている。
[音声信号処理部2の第2の構成例と動作について]
図5は、この第1の実施の形態の再生装置100の音声信号処理部2の第2の構成例を説明するためのブロック図である。この例の音声信号処理部2は、本願発明者の先の特許出願である特願2005−327237(整理番号0590529003)で提案した手法を利用して、音量バランスを変更する方法である。すなわち、特願2005−327237では、或る角度に定位している音源の音声信号の音量を調整する手法を提案したが、この手法に音量バランスを調整する方法を組み込む事で実現可能となる。以下、具体的に説明する。
図5に示すように、この例の音声信号処理部2には、Lchの音声信号が入力されるLch用の分析フィルタバンク21Lと、Rchの音声信号が入力されるRch用の分析フィルタバンク21Rとが備えられる。これらLch用の分析フィルタバンク21Lと、Rch用の分析フィルタバンク21Rとは、入力音声信号を予め決められる帯域幅を有する複数の周波数帯域に分割するために備えられる。
周知のように、入力信号成分を複数の周波数帯域に分割する手法としては、DFT(Discrete Fourier Transform)フィルタバンク、ウェーブレットフィルタバンク、QMF(Quadrature Mirror Filter)フィルタバンクなどのフィルタバンクと呼ばれる手法がある。フィルタバンクは、分析フィルタバンクと合成フィルタバンクの1セットで構成される。このフィルタバンクの手法は、入力信号を各帯域ごとに目的に応じて処理する場合などに利用されているもので、例えば非可逆圧縮などで広く用いられている。
この例の分析フィルタバンク21Lは、入力されるLchの音声信号をn個の等帯域の周波数帯域に分割し、n個のサブバンド信号(sub1−L、sub2−L、…、subn−L)を生成する。これらn個のサブバンド信号sub1−L〜subn−Lの個々は、図示するようにしてn個のゲイン器23(23(1)〜23(n))のうち対応する添え字((1)〜(n))の付されるゲイン器23を介した後、それぞれ合成フィルタバンク24Lに供給されるようになっている。
合成フィルタバンク24Lでは、上述したように、各ゲイン器23(1)〜23(n)のそれぞれから供給されるn個のサブバンド信号(sub1−L〜subn−L)を合成して元の音声信号の形態(状態)に再構成する。
同様に、この例の分析フィルタバンク21Rは、入力されるRchの音声信号をn個の等帯域の周波数帯域に分割し、n個のサブバンド信号(sub1−R、sub2−R、…、subn−R)を生成する。この場合も、これらn個のサブバンド信号sub1−R〜subn−Rの個々は、上述したゲイン器23(23(1)〜23(n))のうち対応する添え字((1)〜(n))の付されるゲイン器23を介した後、それぞれ合成フィルタバンク24Rに供給される。
合成フィルタバンク24Rでは、上述したように、各ゲイン器23(1)〜23(n)のそれぞれから供給されるn個のサブバンド信号(sub1−R〜subn−R)を合成して元の音声信号の形態(状態)に再構成する。
なお、ここでは分析フィルタバンク21L、分析フィルタバンク21Rによって入力音声信号を等帯域のn個の周波数帯域に分割するものとして説明したが、これに限るものではない。入力音声信号を非等帯域の複数の周波数帯域に分割するようにしてももちろんよい。
そして、分析フィルタバンク21Lにより生成されたサブバンド信号sub1−L〜subn−Lの個々は、図5に示すように、n個の定位角度・レベル算出回路22(1)〜22(n)のうち対応する添え字の付される定位角度・レベル算出回路22に対してもそれぞれ分岐して供給される。
同様に、分析フィルタバンク21Rにより生成されたサブバンド信号sub1−R〜subn−Rの個々は、図5に示すように、定位角度・レベル算出回路22(1)〜22(n)のうち対応する添え字の付される定位角度・レベル算出回路22に対してもそれぞれ分岐して供給される。
つまり、これによって定位角度・レベル算出回路22(1)〜22(n)の個々には、それぞれ対応する帯域のLchのサブバンド信号sub−LとRchのサブバンド信号sub−Rとが入力されるようになっている。
これら定位角度・レベル算出回路22(1)〜22(n)は、後述するようにしてそれぞれ入力されるLchのサブバンド信号sub−LとRchのサブバンド信号sub−Rから定位角度およびレベルを算出し、ゲイン調査・調節回路25へと供給する。
つまり、定位角度・レベル算出回路22(1)では、サブバンド信号sub1−L、サブバンド信号sub1−Rから定位角度およびレベルを算出し、定位角度・レベル算出回路22(2)ではサブバンド信号sub2−L、サブバンド信号sub2−Rから定位角度およびレベルを算出するといったように、定位角度・レベル算出回路22(1)〜22(n)によっては、それぞれの帯域のサブバンド信号sub1−L〜subn−L、サブバンド信号sub1−R〜subn−Rから各定位角度およびレベルが算出され、各々ゲイン調査・調節回路25へと供給される。なお、定位角度・レベル算出回路22の内部構成については後述する。
ゲイン調査・調節回路25では、定位角度・レベル算出回路22(1)〜22(n)からの各サブバンドの定位角度情報およびレベル情報と、図1に示したシステムコントローラ5からの分離角度指示信号S1および音量バランス指示信号S2に従い好適な音量バランスとなるよう、各ゲイン器23(1)〜23(n)へ供給するゲインを決定する。なお、ゲイン調査・調節回路25の処理方式については後述する。
ゲイン器23(1)〜23(n)の個々は、供給されたゲイン値に基づき、それぞれ分析フィルタバンク21Lからのサブバンド信号sub−L、分析フィルタバンク21Rからのサブバンド信号sub−Rのゲインを調整し、サブバンド信号sub−Lについては合成フィルタバンク24Lへ、サブバンド信号sub−Rについては合成フィルタバンク24Rへそれぞれ供給する。
合成フィルタバンク24L、24Rでは、上述もしたようにゲイン器23(1)〜23(n)から供給されるサブバンド信号sub1−L〜subn−L、サブバンド信号sub1−R〜subn−Rを合成して元の音声信号の形態(状態)に再構成して出力する。
[定位角度・レベル算出回路22の構成例と動作について]
次に、図5に示したように構成されるこの第2の例の音声信号処理部2の定位角度・レベル算出回路22の構成例と動作について説明する。図6は、定位角度・レベル算出回路22の構成例を説明するためのブロック図である。
この例の定位角度・レベル算出回路22は、図6に示すように、Lch用のフーリエ変換器221Lと、Rch用のフーリエ変換器221Rと、定位角度算出器222と、レベル算出器223とを備えたものである。
図6に示すように、図5に示した分析フィルタバンク21Lからのサブバンド信号sub−Lは、フーリエ変換器221Lに入力され、ここにおいて例えばFFT(高速フーリエ変換)などのフーリエ変換処理が施される。フーリエ変換処理により得られた複素サブバンド信号csub−Lは、定位角度算出器222とレベル算出器223とに供給される。
なお、分析フィルタバンク21Lにおいて、サブバンド信号sub−Lがすでに複素サブバンド形式に変換されている場合はフーリエ変換器221Lは必要とせず、サブバンド信号sub−Lが直接に定位角度算出器222とレベル算出器223とに供給される。
また、分析フィルタバンク21Rからのサブバンド信号sub−Rは、フーリエ変換器221Rに供給されフーリエ変換処理が施され、同様に複素サブバンド信号csub−Rとして定位角度算出器222とレベル算出器223とに供給される。なお、分析フィルタバンク21Rにおいても同様に、サブバンド信号sub−Rがすでに複素サブバンド形式に変換されている場合はフーリエ変換器221Rは必要とせず、サブバンド信号sub−Rが直接に定位角度算出器222とレベル算出器223とに供給される。
定位角度算出器222では、複素サブバンド信号csub−Lおよび複素サブバンド信号csub−Rから位相差およびレベル比を計算し、これらを元に定位角度を求め、図5に示したゲイン調査・調節回路25へと供給する。
レベル算出器223では、複素サブバンド信号csub−Lおよび複素サブバンド信号csub−Rからその信号の音の大きさを求め、図5に示したゲイン調査・調節回路25へと供給する。
ここで、音の大きさを求める手法は幾つか考えられるが、ここでは一例を示す。ここで、時間ωにおける複素サブバンド信号csub−Lとcsub−RとをそれぞれL(ω)、R(ω)とした場合、時間ωにおける複素サブバンド信号csub−Lと複素サブバンド信号csub−Rとのレベルmag(ω)は、次の[数2]により与えられる。但し、Re(x)は複素数xの実部を、Im(x)はxの虚部を表す。
このようにして、定位角度・レベル算出回路22(1)〜22(n)のそれぞれにおいては、供給されるサブバンド信号sub−L、sub−Rとに基づいて、定位角度(分離角度)と信号レベルとが求められる。
[ゲイン調査・調節回路25の処理方式について]
次に、図5に示したように構成される音声信号処理部2のゲイン調査・調節回路25における処理方式について説明する。
ゲイン調査・調節回路25では、システムコントローラ4からの分離角度指示信号S1と音量バランス指示信号S2とに基づいて、指示された角度内の音源の音声信号のレベルの和(sum_inner)と指示された角度外の音源の音声信号のレベルの和(sum_outer)を求める処理と、指示された角度内の音源の音声信号と指示された角度外の音源の音声信号との音量バランスを調査し、指示された角度内の音源の音声信号に対するゲイン値Giおよび指示された角度外の音源の音声信号に対するゲイン値Goを決定する処理と、各サブバンド毎のゲイン値を決定する処理の3つの処理を行う。
まず、各々定位角度・レベル算出回路22(1)〜22(n)からの各サブバンドの定位角度情報と図1に示したシステムコントローラ5からの分離角度指示信号S1により、各サブバンド信号が指示された角度内の音源の音声信号か否かを判別し、指示された角度内の音源の音声信号であれば角度内の音声信号のレベルの和(sum_inner)に、また、指示された角度外の音源の音声信号であれば角度外の音声信号のレベル和(sum_outer)に、該当する各々定位角度・レベル算出回路22(1)〜22(n)からのレベル値を加算する。この処理を全てのサブバンドの定位角度情報およびレベル情報に対して行う事で指示された角度内の音源の音声信号のレベルの和(sum_inner)と指示された角度外の音源の音声信号のレベルの和(sum_outer)を求めることが可能となる。
次に、音量バランスを調査する手法は幾つか考えられるが、ここでは一つ目の内部構成例と同様の手法を用いる。すなわち、所定の角度内の音声信号のレベルの和(sum_inner)、所定の角度外の音声信号のレベルの和(sum_outer)を例えば各々5秒間監視し、その間における、所定の角度内の音声信号のレベルの和(sum_inner)の音量ピーク値(peak_inner)と、所定の角度外の音声信号のレベルの和(sum_outer)の音量ピーク値(peak_outer)を算出する。
そして、ゲイン調査・調節回路25は、所定の角度内の音声信号のレベルの和(sum_inner)の音量ピーク値(peak_inner)と所定の角度外の音声信号のレベルの和(sum_outer)の音量ピーク値(peak_outer)との比と、図1に示したシステムコントローラ4からの音量バランス指示信号S2により所定の角度内の音声信号に対するゲイン値Giおよび所定の角度外の音声信号に対するゲイン値Goを決定する。
この際、即時に音量バランスを目的とするバランスに調整してもよいが、音量バランスを変化させる時間として例えば5秒などのように遷移時間を設け、その間に徐々に音量バランスを遷移させることにより音量バランスの急激な変化を避け、ユーザに違和感を抱かせないようにすることができることが第1の例の音声信号処理部2と同様である。
また、定位角度内の音声信号に対するゲイン値Giと、定位角度外の音声信号に対するゲイン値Goとを決定する際には、入力信号全体の音量と出力信号全体の音量が聴感上変化しないよう留意する必要があることも第1の例の音声信号処理部2と同様である。
最後に、サブバンド信号が指示された角度内の音源の音声信号であればゲイン値Giを、指示された角度外の音源の音声信号であればゲイン値Goを各ゲイン器23(1)〜23(n)へ供給する。これにより、上述したように、ゲイン器(1)〜ゲイン器(n)のそれぞれにおいて、供給されるサブバンド信号に対して、指定するようにされるゲイン値が乗算されて、ゲイン調整が行われ、最終的に合成フィルタバンク24L、24Rにおいてまとめられて、所定の角度内と角度外とで音量バランスが調整された出力音声信号が生成される。
次に、この発明による第1の実施の形態のソフトウェアでの他の実装例について説明する。図7、図8は、図5、図6を用いて説明した音声信号処理部2が用いられて形成された、この発明による第1の実施の形態の再生装置100で行われる処理を説明するためのフローチャートであり、この発明をソフトウェアで実現するようにした場合の例にも対応するものである。
図7、図8に示す処理もまた、操作部5やリモートコマンダ10及びコマンド受信部6を通じて音声信号の再生指示を受け付け、メディア再生部1に装填された記録媒体に記録されている音声信号を再生するようにした場合に、図5、図6を用いて説明したように構成される音声信号処理部2とシステムコントローラ4とが協働して実行する処理である。
まず、再生装置100のシステムコントローラ4は、音声信号処理部2を制御して、再生対象の音声信号が、自機において処理可能な信号形式であるか否かを判定する(ステップS201)。上述もしたように、例えば、再生対象の音声信号がMP3(MPEG-1 Audio Layer 3)等の圧縮方式によって圧縮された信号である場合や、想定している信号フォーマットのサンプリング周波数と異なるような場合には、そのままの信号形式では処理を実行することが出来ないので、処理可能な信号フォーマットに変換するようにしている。
すなわち、ステップS201の判断処理において、肯定結果が得られると次のステップS203へ移るのに対し、ステップS201の判断処理において、否定結果が得られると、このことは音声信号処理部2が再生対象の音声信号に対して処理を実行することができないことを示しているので、ステップS202の処理に移ることになる。
したがって、ステップS201の判断処理において、再生対象の音声信号が自機においてそのまま処理可能な信号形式のものではないと判断したときには、システムコントローラ4は、音声信号処理部2を制御して、再生対象の音声信号を処理可能な信号形式の音声信号に変換する(ステップS202)。
ステップS202の処理の後には、または、ステップS201の判断処理において、再生対象の音声信号が自機においてそのまま処理可能な信号形式のものであると判断した場合には、システムコントローラ4は、音声信号処理部2に対して、分離角度指示信号S1と、音量バランス指示信号S2とを供給すると共に、音声信号処理部2において、Lchの音声信号とRchの音声信号とについて、複数バンド(複数の周波数帯域)に分割する(ステップS203)。
すなわち、ステップS203の処理は、図5に示したように構成される音声信号処理部2の分析フィルタバンク21L、分析フィルタバンク21Rが、それぞれ入力されるLchの音声信号、Rchの音声信号をn個の周波数帯域に分割し、それぞれサブバンド信号sub1−L〜subn−L、サブバンド信号sub1−R〜subn−Rを生成する動作に相当する。
次に、音声信号処理部2においては、分割したLchの音声信号と、Rchの音声信号をフーリエ変換する(ステップS204)。すなわち、このステップS204の処理は、図6に示した、定位角度・レベル算出回路22(1)〜22(n)内のフーリエ変換器221L、各フーリエ変換器221Rが、それぞれ入力されるサブバンド信号sub−L、sub−Rについてフーリエ変換処理を施すものである。
なお、上述もしたように、ステップS203において、サブバンド信号sub−L、sub−Rのそれぞれがすでに複素サブバンド形式に変換されている場合は、ステップS204の処理は必要とせず、ステップS204の処理をバイパスしてそのままステップS205の処理へと進む。
そして、音声信号処理2において、分割されたバンド(周波数帯域)ごとにLchの音声信号とRchの音声信号の定位角度およびレベルを算出する(ステップS205)。すなわち、このステップS205の処理は、図6に示したように構成される定位角度・レベル算出回路22(1)〜22(n)のそれぞれの定位角度算出器222と、レベル算出器223とにおいて、各サブバンド信号sub−L、sub−Rの定位角度と信号レベルとを算出する処理である。
次に、音声信号処理部2は、バンドごとに求めた定位角度とシステムコントローラ4からの分離角度指示信号S1を比較する事で、指示された角度内の音源の音声信号のレベルの和(sum_inner)と指示された角度外の音源の音声信号のレベルの和(sum_outer)を求める(ステップS206)。このステップS206の処理は、図5に示したように構成される音声信号処理部2のゲイン調査・調節回路25において行われる処理の1つである。
そして、図8に示すステップS207の処理に進み、音声信号処理部2は、ステップS206で求めた、指示された角度内の音源の音声信号のレベルの和(sum_inner)と指示された角度外の音源の音声信号のレベルの和(sum_outer)とシステムコントローラ4からの音量バランス指示信号S2に従い、指示された角度内の音源の音声信号に対するゲイン値Giおよび指示された角度外の音源の音声信号に対するゲイン値Goを求める(ステップS207)。
この後、音声信号処理部2は、バンドごとにサブバンド信号sub−L、sub−Rが、指示された角度内の音源の音声信号であればゲイン値Giを、指示された角度外の音源の音声信号であればゲイン値Goを与える(ステップS208)。このステップS208の処理は、図6に示したように構成される音声信号処理部2のゲイン調査・調節回路25が算出したゲイン値Gi、または、ゲイン値Goをゲイン器23(1)〜23(n)に対して供給し、サブバンド信号のそれぞれのゲイン調整を行うようにするものである。
そして、音声信号処理部2は、各バンドのLch信号、各バンドのRch信号をそれぞれ合成して出力する(ステップS209)。すなわち、図5に示した合成フィルタバンク24Lがゲイン器23(1)〜23(n)から供給される各バンドのLch信号を入力してこれらを合成して出力し、また合成フィルタバンク24Rがゲイン器23(1)〜23(n)から供給される各バンドのRch信号を入力してこれらを合成して出力する。
これによって合成フィルタバンク24L、合成フィルタバンク24Rからは、先にも説明したように分離角度指示信号S1により指示された角度内に定位している音源の音声信号と指示された角度外に定位している音源の音声信号の音量バランスが聴取者の嗜好を反映されたものとして再現できる音声信号Lex、音声信号Rexが出力される。
この後、システムコントローラ4は、続いてオーディオ信号処理部3に入力される次のオーディオ信号が存在するか否かを判定し(ステップS210)、否定結果が得られた場合、処理を行うべき対象が存在しないため、この図7、図8に示す処理を終了する。これに対して、ステップS210で肯定結果が得られると、このことは次に処理を行うべき次のオーディオ信号が存在することを表しており、システムコントローラ4は、再度ステップS201へ戻って当該ステップS201以降の処理を繰り返す。
このように、音声信号処理部2を図5に示したように構成した場合であっても、図5を用いて説明した構成を有する音声信号処理部2とシステムコントローラ4とが協働することにより、例えば、ユーザから予め指示される分離角度と音量バランスとを示す情報に基づいて、指示された角度内に定位している音源の音声信号と指示された角度外に定位している音源の音声信号各々の音量バランスを判別し、自動的に音量バランスを調節することで毎回ユーザによる調整を必要とせずに常に好適な音量バランスを提供することができるようにしている。
なお、図3を用いて説明した音声信号処理部2の第1の構成例の場合には、音量バランス調節回路23において、[数1]を用いて音量バランスの調節を行うことによって、Lchの出力音声信号と、Rchの出力音声信号とを形成して出力するようにしたが、これ以外の音量バランスの調節方法を用いるようにしてもよい。例えば、上述の[数1]とは異なる計算式を用いるようにしてもよい。
また、図3を用いて説明した音声信号処理部2の第1の構成例の場合には、分離処理回路21において、指示された角度内の音源の音声信号をLi、Riと2チャンネルにて出力したが、これに限るものではない。1チャンネル以上であればいくつであってもよい。したがって、1チャンネルであってもよい。
また、図3を用いて説明した音声信号処理部2の第1の構成例の場合には、例えば5.1ch入力であって、元々指示された分離角度に基づいて入力チャンネルが分かれているような場合、分離処理回路は必要ないためこれを省略してもよい。
また、図5を用いて説明した音声信号処理部2の第2の構成例の場合には、レベル算出器223において、[数2]を用いて音の大きさを求めたが、これ以外の方式であってもよい。またレベル算出器223の入力を複素サブバンド信号としたが、サブバンド信号を用いて音の大きさを求めてもよい。
また、上述した第1の実施の形態の再生装置100においては、音量バランス調整動作の実現にあたり、音声信号処理部2を図4に示した動作、または、図7、図8に示した動作を主にハードウェアにより行う場合について説明した。しかし、これに限るものではない。上述もしたように、図4に示した動作、または、図7、図8に示した動作の一部又は全部をソフトウェア処理により実現することももちろん可能である。
その場合、上述もしたように、主にシステムコントローラ4において実行するプログラムを作成し、システムコントローラ4が音声信号処理部2が制御して処理を実行するようにしてもよい。
また、音声信号処理部2をCPU、ROM、RAMを備えたマイクロコンピュータの構成とし、図4に示した対応する処理、または、図7、図8に示した対応する処理を実行するためのプログラムをROMに格納しておき、これを音声信号処理部2において実行するようにすることも可能である。
また、これまでの説明では、音量バランスを調査するためにある時間(例えば5秒)監視し、その音量ピーク値や[数2]に示したレベルの和を用いてきたが、音量ピーク値ではなく、音の大きさを示すデシベルの平均値や、PCM信号の場合サンプル値の絶対値を平均した値など、音量ピーク値以外であってもよい。
また、上述した第1の実施の形態においては、音量バランスを変化させる遷移時間を設けたが(例えば5秒)、上述もしたとおり、遷移時間は必ずしも設ける必要はなく、即座に目的とするバランスに調整するようにしてもよい。また、遷移時間を設ける場合であっても、例えば2分などのように、比較的に長い遷移時間を設定し、時間を掛けて音量バランスを遷移させるようにしてもよい。
また、上述した実施の形態においては、入力音声信号、出力音声信号とも2chの場合を例にして説明したが、これに限るものではない。2ch以上であれば何チャンネルであってもよく、例えば入力2ch、出力4chというように、入力と出力とてチャンネル数が異なる場合であっても、この発明を適用できる。
また、音量バランスを調整する代わりに、所定の定位角度範囲内の信号をユーザに近い位置に定位するよう信号処理を施すようにしたり、所定の定位角度範囲外の信号をユーザから遠い位置に定位するよう信号処理を施すようにしたりするなど、何らかの信号処理を施す事により聴感上においての音量バランスの調整を施してもよい。さらには、これらを組み合わせてもよい。
また、所定の定位角度範囲内の信号と所定の定位角度範囲外の信号の音量バランス情報を、音声データに重畳するようにしたり、あるいは、時間情報と共に外部データとして再生対象の音声信号が記録された記録媒体や、あるいは、再生装置100のEEOROMなどに書き込むようにしたりするなどして保持しておき、再生時にこれらの情報を元に音量バランスの調整を行うようにすることももちろん可能である。
このように、この第1の再生装置100は、ユーザからの分離角度と音量バランスの指示を受けて、指示された角度内に定位している音源の音声信号と指示された角度外に定位している音源の音声信号各々の音量バランスを判別し、自動的に音量バランスを調節する事で毎回ユーザによる調整を必要とせずに常に好適な音量バランスを提供する手法およびこの機能を有するものである。
[第2の実施の形態]
次に、この発明による第2の実施の形態について説明する。以下に説明する第2の実施の形態においても、上述した第1の実施の形態の場合と同様に、この発明による装置、方法、プログラムを音声信号の再生装置(以下、単に再生装置という。)に適用した場合を例にして説明する。
[再生装置200の構成と動作について]
この第2の実施の形態の再生装置200は、ユーザからの音源の種類と音量バランスの指示を受けて、指示された音源の音声信号とそれ以外の音源の音声信号との各々の音量バランスを判別し、自動的に音量バランスを調節することで毎回ユーザによる調整を必要とせずに常に好適な音量バランスを提供するようにするものである。
図9は、この第2の実施の形態の再生装置200を説明するためのブロック図である。なお、図9に示した第2の実施の形態の再生装置200おいて、図1を用いて説明した第1の実施の形態の再生装置100と同様に構成される部分には同じ参照符号を付し、その部分の詳細な説明については省略する。
すなわち、図9に示すように、この第2の実施の形態の再生装置200は、図1に示した第1の実施の形態の再生装置100の場合と同様に、メディア再生部1、D/Aコンバータ(Digital/Analog Converter)3、操作部5、コマンド受信部6、画面表示部7を備えると共に、リモートコマンダ10を通じて遠隔制御することができるものである。
しかし、音声信号処理部7の構成と動作、および、システムコントローラ8の動作が、第1の実施の形態の再生装置100の音声信号処理部2、システムコントローラ4とは異なるものである。なお、システムコントローラ8自体の構成は、図1に示した第1の実施の形態の再生装置100のシステムコントローラ4の場合と同様に、CPU41、ROM42、RAM43、EEPROM44がCPUバス45を通じて接続されて形成されたマイクロコンピュータである。
そして、この第2の実施の形態の再生装置200においても、メディア再生部1を通じて再生されたLchの音声信号とRchの音声信号とは、音声信号処理部7に供給される。音声信号処理部7は、メディア再生部1からのLchの音声信号とRchの音声信号と、後述するシステムコントローラ8からの音源種類指示信号S3および音量バランス指示信号S2とに応じ、指示された音源の音声信号とそれ以外の音源の音声信号各々について所要の音声信号処理を施すように構成される。そして、音声信号処理を施したLchの音声信号LexとRchの音声信号RexをD/Aコンバータ3に供給する。なお、この第2の実施の形態の再生装置200の音声信号処理部7の詳細については後述する。
音声信号処理部7からの音声信号Lex、Rexは、D/Aコンバータ3にてD/A変換が施され、アナログ音声信号とされたLchの出力音声信号とRchの出力音声信号とが出力するようにされている。
この第2の実施の形態の再生装置200のリモートコマンダ10上には、図2を用いて説明した第1の実施の形態の再生装置100のリモートコマンダ10の場合と同様に、方向指示のための操作子10a、10b、10c、10dが備えられている。この第2の実施の形態の再生装置200においても、ユーザは、右方向キー10a、または、左方向キー10bを操作することにより、再生装置1に対し分離する音源の種類を指示入力することができる。また、ユーザは、上記上方向キー10c、または、下方向キー10dを操作することにより、再生装置200に対し分離した音源の音声信号とそれ以外の音源の音声信号の音量バランスを指示入力することができる。
システムコントローラ8は、リモートコマンダ10の右方向キー10a、左方向キー10bの操作に応じて、当該リモートコマンダ10から送出され、コマンド受信部6を通じて受け付けたコマンド信号に応じて、音声信号処理部7に供給すべき音源種類指示信号S3を生成する。すなわち、音源種類指示信号S3は、右方向キー10a、左方向キー10bの操作により指示入力される音源種類を表すための情報である。
また、システムコントローラ8は、リモートコマンダ10の上方向キー10c、下方向キー10dの操作に応じて、当該リモートコマンダ10から送出去れ、コマンド受信部6を通じて受け付けたコマンド信号に応じて、音声信号処理部7に供給すべき音量バランス指示信号S2を生成する。すなわち、音量バランス指示信号S2は、第1の実施の形態の再生100の場合と同様に、上方向キー10c、下方向キー10dの操作により指示入力される音量バランスを表すための情報である。
このように、この第2の実施の形態の再生装置は、ユーザからのリモートコマンダ10を介して入力される音源種類の指示と音量バランスの指示とに基づいて、指示された音源の音声信号とそれ以外の音源の音声信号との各々の音量バランスを判別し、自動的に音量バランスを調節することで毎回ユーザによる調整を必要とせずに常に好適な音量バランスを提供する処理である。なお、音源種類の指示と音量バランスの指示とは、システムコントローラ8のEEPROMなどの記憶保持し、音声信号の再生時において繰り返し利用することができるようにされる。
[音声信号処理部7の構成例と動作について]
次に、この第2の実施の形態の再生装置200の音声信号処理部7の構成例と動作について説明する。図10は、この第2の実施の形態の音声信号処理部7を説明するためのブロック図である。なお、説明を簡単にするため、図10に示した音声信号処理部7において、図3を用いて説明した第1の実施の形態で用いた音声信号処理部2と同様に構成される部分には同じ参照符号を付し、その部分の詳細な説明については省略する。
そして、この第2の実施の形態の再生装置200で用いられる音声信号処理部7は、図10に示すように、音源分離処理回路71と、音量バランス調査回路22と、音量バランス調節回路23とを備えたものである。図10に示すように、音源分離処理回路71には、Lchの音声信号とRchの音声信号とが供給される。
音源分離処理回路71は、図9に示したシステムコントローラ8からの音源種類指示信号S3の供給を受けて、これに従い、指定の音源の音声信号Li、Riとそれ以外の音源の音声信号Lo、Roとに分離し、これらを音量バランス調査回路22および音量バランス調節回路23へと出力する。
音源分離処理回路71は、指定の音源の音声信号とそれ以外の音源の音声信号に分離する機能を持つ回路であれば何でもよい。例えば、音源種類として声(人の声)が指定された場合、入力信号から音声(人の声)部分の信号と非音声(人の声でない)部分の信号とを識別する音声-非音声判別技術を用いるようにすることができる。
より具体的には、複数の音声モデルデータを音声信号処理部7内、あるいは、システムコントローラ8内のメモリに記憶保持しておくようにし、入力音声信号(入力音響信号)と音声モデルデータとの照合により、音声か否かを判断するためのスコアを算出し、このスコアを、入力音声信号についての推定したS/N比(Signal to Noise Ratio)で補正し、この補正したスコアを用いて、人の声部分かそうでないかを判別し、入力音声信号について、人の声の部分とそれ以外の部分とに分離することができる。したがって、男性の話音声の音声モデルデータと女性の話音声の音声モデルデータとを用意しておくことにより、人の声の部分であっても、男性の声の部分と、女性の声の部分とを分離するなどのこともできる。
また、人の声だけでなく、種々の楽器などについても、種々の音源モデルデータを記憶保持しておき、再生対象の楽曲データ(入力音声信号)と、音源モデルデータとを照合し、目的とする楽器部分の音声信号と、それ以外の楽器の音声信号とを分離することもできる。このように、種々の音源モデルデータを記憶保持するメモリ手段と、入力音声信号(入力音響信号)と、音源モデルデータとを照合し類似度を算出する照合手段と、算出した類似度に応じて音声信号の分離処理を行う分離手段とを備えることにより、音源分離処理回路を構成することができる。
そして、Lchの音声信号においての目的する音源の音声信号Liとそれ以外の音源の音声信号Loと、Rchの音声信号においての目的する音源の音声信号Riとそれ以外の音源の音声信号Roとが、音量バランス調査回路22と、音量バランス調節回路23とに供給される。
音量バランス調査回路22は、図3を用いて説明したように、目的とする音声信号とそれ以外の音声信号との音量バランスを調査し、システムコントローラ8からの音量バランス指示信号S2に応じて、目的とする音声信号に対するゲイン値Giと、目的とする音声信号以外の音声信号に対するゲイン値Goとを決定し、これらを音量バランス調節回路23に供給する。
具体的には、図10に示したように、音量バランス調査回路22は、音源分離処理回路71において分離処理されたLchの目的とする音源の音声信号Liと、Rchの目的とする音源の音声信号Riと、Lchの目的とする音源以外の音声信号Loと、Rchの目的とする音源以外の音声信号Roとの供給を受けて、目的とする音源の音声信号と、それ以外の音源の音声信号との音量バランスを調査し、システムコントローラ4からの音量バランス指示信号S2に従い、目的とする音源の音声信号とそれ以外の音源の音声信号とが好適な音量バランスとなるように、目的とする音源の音声信号に対するゲイン値Giと、それ以外の音源の音声信号に対するゲイン値Goとを決定し、これらを音量バランス調節回路23に供給する。
音量バランス調節回路23は、図3を用いて説明したように、目的とする音声信号とそれ以外の音声信号とのそれぞれに音量バランス調査回路22からのゲイン値Gi、Goを乗算して、ゲイン調整し、ゲイン調整後の出力音声信号Lex、Rexを出力する。
具体的には、図10に示したように、音量バランス調節回路22は、音源分離処理回路71において分離処理されたLchの目的とする音源の音声信号Liと、Rchの目的とする音源の音声信号Riと、Lchの目的とする音源以外の音声信号Loと、Rchの目的とする音源以外の音声信号Roと、音量バランス調査回路22からの目的とする音源の音声信号に対するゲイン値Giと、目的とする音源以外の音声信号に対するゲイン値Goとの供給を受けて、上述した[数1]に従った演算を行って、Lchの出力音声信号LexとRchの出力音声信号Rexとを生成し、これらを出力する。
このようにして、ユーザからのリモートコマンダ10を介して入力される音源種類の指示と音量バランスの指示とに基づいて、指示された音源の音声信号とそれ以外の音源の音声信号との各々の音量バランスを判別し、自動的に音量バランスを調節することで毎回ユーザによる調整を必要とせずに常に好適な音量バランスを提供することができるようにしている。
次に、この発明による第2の実施の形態のソフトウェアでの実装例について説明する。図11は、図10に示した構成の音声信号処理部7が用いられて形成された、この発明による第2の実施の形態の再生装置200で行われる処理を説明するためのフローチャートであり、この発明をソフトウェアで実現するようにした場合の例にも対応するものである。
図11に示す処理は、操作部5やリモートコマンダ10及びコマンド受信部6を通じて音声信号の再生指示を受け付け、メディア再生部1に装填された記録媒体に記録されている音声信号を再生するようにした場合に、図10を用いて説明したように構成される音声信号処理部7とシステムコントローラ8とが協働して実行する処理である。そして、図11に示すステップS301、ステップS302の処理は、第1の実施の形態の図4に示したステップS101、ステップS102の処理と同様に行われる処理である。
まず、再生装置200のシステムコントローラ8は、音声信号処理部7を制御して、再生対象の音声信号が、自機において処理可能な信号形式であるか否かを判定する(ステップS301)。例えば、再生対象の音声信号がMP3(MPEG-1 Audio Layer 3)等の圧縮方式によって圧縮された信号である場合や、想定している信号フォーマットのサンプリング周波数と異なるような場合には、そのままの信号形式では処理を実行することが出来ないので、処理可能な信号フォーマットに変換するようにしている。
ステップS301の判断処理において、再生対象の音声信号が自機においてそのまま処理可能な信号形式のものではないと判断したときには、システムコントローラ8は、音声信号処理部7を制御して、再生対象の音声信号を処理可能な信号形式の音声信号に変換する(ステップS302)。
ステップS302の処理の後には、または、ステップS301の判断処理において、再生対象の音声信号が自機においてそのまま処理可能な信号形式のものであると判断した場合には、システムコントローラ8は、音声信号処理部7に対して、音源種類指示信号S3と、音量バランス指示信号S2とを供給し、音声信号処理部7において、音源種類指示信号S3により指示された音源の音声信号Li、Riと、指示された音源以外の音源の音声信号Lo、Roとに分離する処理を行うようにする(ステップS303)。このステップS303においての処理は、図10に示したように構成される音声信号処理部7の音源分離処理回路21において行われる処理である。
次に、音声信号処理部7は、LchとRchの所定の角度内の音源の音声信号Li、Riの和信号のピーク値(peak_inner)と、LchとRchの所定の角度外の音源の音声信号Lo、Roの和信号のピーク値(peak_outer)とを測定し、これらの値とシステムコントローラ5からの音量バランス指示信号S2に従い、LchとRchの所定の角度内の音源の音声信号Li、Riに対するゲイン値GiおよびLchとRchの所定の角度外の音源の音声信号Lo、Roに対するゲイン値Goを決定する(ステップS304)。このステップS304においての処理は、図10に示したように構成される音声信号処理部7の音量バランス調査回路22において行われる処理である。
そして、音声信号処理回路7は、上述の[数1]に示した計算式を用いて、Lchの目的とする音源の音声信号Li、Lchの目的とする音源以外の音源の音声信号Lo、目的とする音源の音声信号に対するゲイン値Gi、目的とする音源以外の音源の音声信号に対するゲイン値GoからLchの出力音声信号Lexを求め、Rchの目的とする音源の音声信号Ri、Rchの目的とする音源以外の音源の音声信号Ro、目的とする音源の音源の音声信号に対するゲイン値Gi、目的とする音源以外の音源の音声信号に対するゲイン値GoからRchの出力音声信号Rexを求めて出力する(ステップS305)。このステップS305においての処理は、図10に示したように構成される音声信号処理部7の音量バランス調節回路23において行われる処理である。
このようにして生成される出力音声信号Lex、Rexは、目的とする音源の音声信号と、それ以外の音源の音声信号との音量バランスが、予め指示するようにされる情報に応じて調整され、聴取者の嗜好を反映した状態となっている。
そして、システムコントローラ8は、続いて音声信号処理部7に入力される次の音声信号が存在するか否かを判定し(ステップS306)、否定結果が得られた場合、処理を行うべき対象が存在しないため、この図11に示す処理を終了する。また、ステップS306の判定処理において、肯定結果が得られた場合には、このことは次に処理を行うべき次の音声信号が存在することを表しており、再度ステップS301へ戻って当該ステップS301以降の処理を繰り返す。
このようにして、図10を用いて説明した構成を有する音声信号処理部7とシステムコントローラ8とが協働することにより、例えば、ユーザから予め指示される音源の種類と音量バランスとを示す情報とに基づいて、指示された目的とする音源の音声信号とそれ以外の音源の音声信号各々の音量バランスを判別し、自動的に音量バランスを調節することで毎回ユーザによる調整を必要とせずに常に好適な音量バランスを提供することができるようにしている。
このように、この第2の実施の形態の再生装置200は、ユーザからの音源の種類と音量バランスの指示を受けて、指示された音源の音声信号とそれ以外の音源の音声信号各々の音量バランスを判別し、自動的に音量バランスを調節する事で毎回ユーザによる調整を必要とせずに常に好適な音量バランスを提供する手法およびこの機能を有するものである。
[第3の実施の形態]
上述した第1、第2の実施の形態は、この発明を音声信号の再生装置に適用し場合を例にしたものである。しかし、この発明は、再生装置だけでなく音声信号の記録装置にも適用することができるものである。ここでは、この発明の音声信号の記録再生装置(以下、単に記録再生装置という。)に適用した場合を例にして説明する。
そして、以下に説明するこの第3の実施の形態の記録再生装置は、その記録系に、図1〜図8を用いて説明した第1の実施の形態の再生装置100に適用した発明と同様の発明を適用することによって、集音して記録媒体に記録する音声信号について、ユーザからの分離角度と音量バランスの指示を受けて、指示された角度内に定位している音源の音声信号と指示された角度外に定位している音源の音声信号各々の音量バランスを判別し、自動的に音量バランスを調節する事で毎回ユーザによる調整を必要とせずに常に好適な音量バランスで音声信号を記録媒体に記録できるようにするものである。
図12は、この第3の実施の形態の記録再生装置300を説明するためのブロック図である。図12において、図1に示した第1の実施の形態の再生装置100と同様に構成される部分には同じ参照符号を付し、その部分の詳細な説明については省略する。
図12に示すように、この第3の実施の形態の記録再生装置300は、左右2チャンネルのマイクロホン301L、301Rと、アンプ部302と、書き込み処理部303と、記録媒体ドライブ304と、読み出し処理部305と、再生処理部306と、操作部307と、コマンド受信部310と、リモートコマンダ310と、音声信号処理部2と、システムコントローラ4とを備えたものである。
上述もしたように、音声信号処理部2と、システムコントローラ4は、図1に示した第1の実施の形態の再生装置100の対応する部分と同様に構成され同様の機能を実現するものである。また、操作部307、コマンド受信部308、リモートコマンダ310もまた、図1に示した第1の実施の形態の再生装置100においての、操作部5、コマンド受信部6、リモートコマンダ10と同様に構成され、同様の機能を実現するものであるが、音声信号の記録指示や、記録する音声信号に対する種々の調整処理等をも受け付けることができるものである。
したがって、この第3の実施の形態の記録再生装置300の場合にも、システムコントローラ4は、リモートコマンダ310およびコマンド受信部308を通じて、ユーザからの分離角度と音量バランスとの指示入力を受け付けることができるものである。そして、音声信号の記録処理時において、システムコントローラ4は、ユーザからの先の指示入力
に応じて、分離角度指示信号S1と、音量バランス指示信号S2とを形成して、これらを音声信号処理部2に供給することができるものである。
そして、左右2チャンネルのマイクロホン301L、301Rを通じて集音され、電気信号に変換されたLchとRchの音声信号のそれぞれは、アンプ部302に供給され、ここで増幅処理された後に、音声信号処理部2に供給される。
音声信号処理部2は、第1の実施の形態の再生装置100において説明したように、これに供給されるLchとRchとの音声信号について、分離角度指示信号S1に応じて、所定の角度内の音声信号と所定の角度外の音声信号とに分離すると共に、所定の角度内の音声信号の音量レベルと所定の角度外の音声信号の音量レベルとを調査する。
そして、音声信号処理部2は、調査した所定の角度内の音声信号の音量レベルと所定の角度外の音声信号の音量レベルと、システムコントローラ4からの音量バランス指示信号S2に基づいて、所定の角度内の音声信号に対するゲイン値Giと所定の角度外の音声信号に対するゲイン値Goを決定する。
この後、音声信号処理部2は、所定の角度内の音声信号に対してはゲイン値Giを用いてゲイン調整し、所定の角度外の音声信号に対してはゲイン値Goを用いてゲイン調整することにより、Lchの出力音声信号LexとRchの出力音声信号Rexとを形成し、これを出力する。
音声信号処理部2から出力されるLchの出力音声信号LexとRchの出力音声信号Rexとは、書き込み処理部303に供給され、ここで記録媒体に記録する形式の信号WSに変換された後に、記録媒体ドライブ304に供給され、記録媒体ドライブ304に装填されている所定の記録媒体に記録される。
ここで記録媒体ドライブ304は、種々の記録媒体のものを用いることができる。例えば、CD(Compact Disc)やDVD(Digital Versatile Disc)、或いはブルーレイディスク(Blu-Ray Disc)などの光ディスク記録媒体を用いる光ディスクドライブや、MD(Mini Disc(登録商標))などの光磁気ディスクを用いる光磁気ディスクドライブや、ハードディスクなどの磁気ディスクを用いる磁気ディスクドライブや、半導体メモリを内蔵した半導体メモリドライブなどである。
このようにして、この第3の実施の形態の記録再生装置300は、マイクロホン301L、301Rを通じて集音した音声信号について、指示された定位角度内の音源の音声信号と、指示された定位角度外の音声信号に対して、指示された音量バランスとなるように調整して、調整後の音声信号を記録媒体ドライブ304の記録媒体に記録することができるようにしている。
そして、記録媒体ドライブ304の記録媒体に記録された音声信号は、システムコントローラ4に制御される読み出し処理部305の機能により、当該記録媒体が読み出すことができるようにされる。読み出し処理部305によって記録媒体から読み出される音声信号RSは、再生処理部306に供給され、ここで、Lchの音声信号とRchの音声信号とに分離されると共に、増幅処理されるなどして出力音声信号L、Rが形成され、これらか出力され、例えばスピーカに供給されて、出力音声信号L、Rに応じた音声が放音するようにされる。
この場合、記録媒体ドライブ34の記録媒体に記録されている音声信号は、上述したように、音声信号処理部2において、システムコントローラ9からの分離角度指示信号S1、音量バランス指示信号S2とに応じて、所定の角度内の音声信号と所定の角度外の音声信号とで、ユーザの嗜好に合うように音声バランスが調整されて記録されたものであるので、再生時にはそのまま再生するだけで、ユーザの嗜好に合うように音声バランスが調整された音声信号を再生して聴取することができる。すなわち、再生時において、音声バランスの調整を行うこともないようにすることができる。
なお、この第3の実施の形態の記録再生装置300においても、音声信号処理部2は、図3を用いて説明したように構成することもできるし、図5を用いて説明したように構成することもできる。音声信号処理部2を図3に示したように構成した場合には、音声信号処理部2とシステムコントローラ4とが協働して行うべき処理は、図4を用いて説明した処理が行われることになる。また、音声信号処理部2を図5に示したように構成した場合には、音声信号処理部2とシステムコントローラ4とが協働して行うべき処理は、図7、図8を用いて説明した処理が行われることになる。
[第4の実施の形態]
以下に説明する第4の実施の形態は、上述した第3の実施の形態の場合と同様に、この発明を記録再生装置に適用するようにしたものである。
そして、以下に説明するこの第4の実施の形態の記録再生装置は、その記録系に、図9〜図11を用いて説明した第2の実施の形態の再生装置200に適用した発明と同様の発明を適用することによって、集音して記録媒体に記録する音声信号について、ユーザからの音源の種類と音量バランスの指示を受けて、指示された音源の音声信号と、それ以外の音源の音声信号各々の音量バランスを判別し、自動的に音量バランスを調節する事で毎回ユーザによる調整を必要とせずに常に好適な音量バランスで音声信号を記録媒体に記録できるようにするものである。
図13は、この第4の実施の形態の記録再生装置400を説明するためのブロック図である。図13において、図9に示した第2の実施の形態の再生装置200と同様に構成される部分には同じ参照符号を付し、その部分の詳細な説明については省略する。また、図13において、図12に示した第3の実施の形態の記録再生装置300と同様に構成される部分にも同じ参照符号を付し、その部分の詳細な説明については省略する。
すなわち、図13に示す第4の実施の形態の記録再生装置400は、図12に示した記録再生装置300の音声信号処理部2とシステムコントローラ4とを、第2の実施の形態の再生装置200で用いた音声信号処理部7、システムコントローラ8を用いるようにしたものである。
したがっいて、左右2チャンネルのマイクロホン301L、301Rで集音した音声信号を記録媒体ドライブ304の記録媒体に記録する場合において、システムコントローラ8は、リモートコマンダ310、コマンド受信部308を通じて受け付けたユーザからの音源種類指示、音量バランス指示に基づいて、音源種類指示信号S3と音量バランス指示信号S2とを生成し、音声信号処理部7に供給する。
音声信号処理部7は、システムコントローラ8からの音源種類指示信号S3に基づいて、左右のマイクロホン301L、301Rによって集音され、アンプ部302を通じて供給されるLchの音声信号とRchの音声信号とのそれぞれについて、指示された音源の音声信号と、それ以外の音声信号とに分離し、それらの音量バランスを調査する。
その上で、音声信号処理部8は、指示された音源の音声信号と、それ以外の音声信号との音量バランスの調査結果と、システムコントローラ8からの音量バランス指示信号S2とに応じて、指示された音源の音声信号についてのゲイン値Giと、指示された音源以外の音源の音声信号についてのゲイン値Goとを特定し、これらを用いて、指示された音源の音声信号と、指示された音源以外の音源の音声信号とのそれぞれについてゲイン調整を行うことによって、指示された音源の音声信号と、指示された音源以外の音源の音声信号との音量バランスをユーザの嗜好に合うように調整する。
このようにして、音量バランスが調整された、指示された音源の音声信号と指示された音源以外の音源の音声信号とは、書き込み処理部303を通じて記録媒体ドライブ304の記録媒体に記録することができるようにされる。
なお、記録媒体ドライブ304の記録媒体に記録された音声信号を再生する場合には、図12を用いて説明した第3の実施の形態の記録再生装置300の場合と同様にして読み出されて再生される。この場合、記録媒体ドライブ34の記録媒体に記録されている音声信号は、上述したように、音声信号処理部2において、システムコントローラ9からの音源種類指示信号S3、音量バランス指示信号S2とに応じて、所定の音源の音声信号とそれ以外の音源の音声信号とで、ユーザの嗜好に合うように音声バランスが調整されて記録されたものであるので、再生時にはそのまま再生するだけで、ユーザの嗜好に合うように音声バランスが調整された音声信号を再生して聴取することができる。すなわち、再生時において、音声バランスの調整を行うこともないようにすることができる。
なお、上述した第3、第4の実施の形態の記録再生装置は、MD(Mini Disc(登録商標))の記録再生装置やICレコーダやカセットテープレコーダなどの音声信号の記録再生装置や、ビデオカメラなどの映像・音声記録再生装置の音声係などに適用することができる。もちろん、音声信号処理機能を備えたパーソナルコンピュータなどの情報処理装置に適用することも可能である。
[ユーザからの指示入力を受け付ける場合の具体例1について]
上述した第1〜第4の実施の形態の装置においては、いずれの場合においても、ユーザからの分離角度と音量バランスの指示入力を、あるいは、音源種類と音量バランスの指示入力を受け付ける必要が生じる。ここでは、分離角度と音量バランスの指示入力を受け付ける場合を例にして、ユーザに対して提供するユーザインターフェイスの一例(具体例1)について説明する。
以下に説明する具体例1は、複数の音源が混合するようにされた2チャンネル以上の音声信号の各周波数帯域における定位角度毎の音量値を、色の明るさにより各々周波数と定位角度を2つの軸とした2次元平面上に表現すると共に、これを参照しながら、目的とする分離角度(定位角度)と音量バランスの指示入力を行うことができるようにするものである。また、以下に説明する例においては、図1に示した第1の実施の形態の再生装置100に、ここで説明するユーザインターフェイスを適用した場合を例にして説明する。
図14は、ここで説明するユーザインターフェイスが適用された再生装置100を説明するためのブロック図である。図14に示した再生装置100は、図1に示した再生装置100のシステムコントローラ4に対して、画像表示部9を接続するようにしたものである。
そして、この例の音声信号処理部2は、メディア再生部1からのLchとRchとの音声信号について、予め決められる各周波数帯域における定位角度毎の音量値を調査し、その調査結果を後述するシステムコントローラ4へと供給することができるものである。また、音声信号処理部2は、LchとRchの音声信号を、再生用の音声信号Lexと音声信号Rexとして、D/Aコンバータ3に供給する。
なお、音声信号処理部2において用いることが可能な、2chの音声信号から各周波数帯域における定位角度毎の音量値を調査する方法としては種々のものが知られているが、例えば、先に提出した特願2005−327237(整理番号0590529003)の手法を用いることが可能である。
上記の特願2005−327237では、音声信号を周波数帯域分割処理により所定の周波数帯域毎に分割し(例えば、サンプリング周波数が44.1kHzの信号の場合、10.77Hz幅で、4096周波数帯域に分割し)、各々周波数帯域分割された音声信号の定位角度を調査することにより、或る角度に定位している音源の音声信号のみを抽出する、或いは消す、或いは音量を調整するなど、定位角度ごとに音源の調整を行う手法を提案した。この手法を用いる事で各周波数帯域における定位角度毎の音量値を調査する事が可能となる。
そして、システムコントローラ4は、上述したように、音声信号処理部2からの予め決められる各周波数帯域における定位角度毎の音量値の調査結果に基づいて、再生対象の音声信号に含まれる各音源についての情報を画面表示部9の表示画面に表示させるためのデータを生成し、これを画面表示部9に供給する。
画面表示部9は、例えば、LCD(Liquid Crystal Display)、有機EL(Electro Luminescence)パネル、PDP(Plasma Display Panel)、CRT(Cathode Ray Tube)などの表示素子とそのコントロール回路とを備え、システムコントローラ4からの表示データの供給を受けて、これに応じて画像を表示素子の表示画面に表示させることができるものである。
したがって、再生装置100は、操作部5やリモートコマンダ10とコマンド受信部6を通じてメディア再生部1に装填された記録媒体に記録されている音声信号の再生が指示された場合には、システムコントローラ4は、メディア再生部1を制御して、目的とする音声信号を記録媒体から読み出し、音声信号処理部2、D/Aコンバータ3を通じて再生するようにする。
そして、同時に、システムコントローラ4は、音声信号処理部2からの予め決められる各周波数帯域における定位角度毎の音量値の調査結果に基づいて、再生対象の音声信号に含まれる各音源についての情報を表示させるためのデータを形成し、これを画面表示部9に供給することにより、再生対象の音声信号に含まれる各音源についての情報を画面表示部9の表示画面に表示させることができるようにしている。
図15は、画面表示部9の表示画面に表示される再生対象の音声信号に含まれる各音源についての情報の表示例を説明するための図であり、具体的には、予め決められた各周波数帯域における定位角度毎に存在する音源についての音量値を色の明るさで表した場合の例である。そして、図15において、外枠は、画面表示部9の表示画面9Gを示している。そして、表示画面9Gには、再生対象の音声信号に含まれる各音源についての情報の表示領域である音量表示部91が設けられる。
画面表示部9の表示画面9Gに表示される音量表示部91は、図15に示すように、横軸が各音源の音像の定位角度を、縦軸は周波数をそれぞれ示している。この例においては、横軸の定位角度は、中央を0°(0度)として、左右に60°(60度)づつの120°(120度)の範囲を持っている。また、縦軸の周波数は、0Hz〜8000Hzの範囲を持っている。
そして、図15に示した例の場合、音量表示部91において黒色の領域は音量が小さい成分の部分であり、白色の領域は音量が大きい成分の部分である。また、音量表示部91において、上述もしたように、横軸は定位角度を表しており、左側に定位している音源の音声信号の音量値を左側に、右側に定位している音源の音声信号の音量値を右側に、中央に定位している音源の音声信号の音量値を中央に表すようにしている。また、音量表示部91において、上述もしたように、縦軸は周波数を表しており、高周波帯域の音量値を上側に、低周波帯域の音量値を下側に、中周波帯域の音量値を中央に表すようにしている。
したがって、音量表示部91において、右下の領域は右側に定位している低周波帯域の音量値を表す。すなわち、音量表示部91において、横軸および縦軸および色の明るさという3つの要素を用いて定位角度および周波数および音量値の3つの成分を表している。また図15において、表示92、93、94は、対応する周波数の値を示し、表示95、96、97は、対応する定位角度の値を表している。
そして、図15の例の場合には、「0°」を中心にして、左右に60°(±60°)の範囲であって、周波数が4000Hz以下の部分に、より特徴的には、左右に30°(±30°)の範囲であって、周波数が2000Hz以下の部分に、音量値の大きな音源が存在していることが分かる。
そして、この例の再生装置100のシステムコントローラ4は、ユーザからの操作入力に応じて、分離角度指示信号(定位角度範囲指示信号)S1と、音量バランス指示信号S2とを形成し、これらの指示信号S1、S2を音声信号処理部2に供給することができるものである。
システムコントローラ4は、ユーザからの操作入力を、操作部5を通じて、あるいは、リモートコマンダ10とコマンド受信部6とを通じて受け付けることが可能であるが、ここでは、ユーザからの操作入力をリモートコマンダ10とコマンド受信部6とを通じて受け付ける場合を例にして説明する。ここで、リモートコマンダ10は、図2を用いて説明したように、ユーザからの指示入力を受け付ける操作子が設けられたものである。
そして、上述もしたように、再生装置100においては、ユーザは、画面表示部9の表示画面9Gに表示される音源についての情報の表示を確認しながら、リモートコマンダ10に設けられている方向指示のための操作子や決定のための操作子を用いて、分離角度(分離角度範囲)を指示すると共に、音量バランスを指示する。
システムコントローラ4は、これらの指示を受け付けて、受け付けた指示に応じて分離角度指示信号S1と、音量バランス指示信号S2とを生成し、これらを音声信号処理部2に供給する。これにより、音声信号処理部2においては、指示された分離角度内の音源の音声信号に対して、音量バランス指示信号S2をも考慮して決定されたゲインを乗じ、また、指示された分離角度外の音源の音声信号について音量バランス指示信号S2をも考慮して決定されたゲインを乗じ、ユーザの指示に応じてゲイン調整した音声信号を再生することができるようにしている。
以下、音量バランスを変化させる分離角度を設定する手順と、指定の範囲内および指定の範囲外の音量バランスを変更する手順とを、リモートコマンダ10に対する操作と、これに応じて変化する画面表示部9の表示画面9Gの表示画像とを対応付けながら詳細に説明する。以下においては、図16、図17の分離角度を指定する場合においての表示画像の表示例を説明するための図をも参照しながら詳細に説明する。
まず、第一段階として、音声信号の再生処理の実行を開始し、画面表示部9の表示画面9Gの表示画像が図15に示した状態にあるときに、所定の操作を行うことにより、図16に示すように、開始点、終了点を指示するためのポインタ(指示子)Pを表示させ、右方向キー10a、左方向キー10bを操作して、選択する分離角度の範囲(以下、分離角度範囲という。)の開始点Sとなるべき位置にポインタPを位置付け、実行キー10eを押下することにより、開始点Sを決定する。この例において、分離角度範囲は、図15の音量表示部91において、その横方向に示すようにされている音像の定位角度範囲によって規定される範囲である。
すなわち、右方向キー10aを操作することにより定位角度範囲の開始点Sを右方向に移動し、左方向キー10bを操作することにより定位角度範囲の開始点Sを左方向に移動し、実行キー10eを操作することにより定位角度範囲の開始点Sを設定する。このように、現在位置を示すポインタPを、音量表示部91の表示領域上に重ねて表示することで開始点Sの指示をしやすくすることができるのである。
そして、開始点Sを決定した後、第二段階として、さらに右方向キー10a、左方向キー10bを操作することにより、図17に示すように、ポインタPを移動させることにより、選択する分離角度範囲(定位角度範囲)の終了点Eを指示し、実行キー10eを操作しその終了点Eを決定する。
すなわち、右方向キー10aを操作することにより定位角度範囲の終了点Eを右方向に移動し、左方向キー10bを操作することにより定位角度範囲の終了点Eを左方向に移動し、実行キー10eを操作することにより定位角度範囲の終了点Eを設定する。
この際、システムコントローラ4がユーザからの指示入力に応じて表示データを形成し、これを画面表示部9に供給することにより、図17に示すように、選択した開始点Sを含む縦線および指示している終了点Eを含む縦線を音量表示部91上に重ねて表示することにより、指示するようにしている分離角度範囲(定位角度範囲)を視覚を通じて認識できるようにしている。さらに、システムコントローラ4が、音声信号処理部2を制御して、指示された範囲内の音源の音声信号のみを出力するようにすることにより、指示するようにしている定位角度範囲を聴覚を通じて認識できるようにしている。これらにより、ユーザが行う終了点Eの指示をしやすくすることができる。
上述のようにして、分離角度範囲(定位角度範囲)の開始点および終了点を設定した後、第三段階として、これら開始点S、終了点Eで指示された定位角度範囲内とその範囲外の音量バランスを、リモートコマンダ10の上方向キー10c、下方向キー10dを操作することにより変化させる。
具体的には、例えば、現在の開始点S、終了点Eで指定された範囲内とその範囲外の音量バランス設定値が1:1である場合に、上方向キー10cを操作する事により、その音量バランス値が1.1:0.9となり、また、例えば、現在の開始点S、終了点Eで指定された範囲内とその範囲外の音量バランス値が1:1である場合に、下方向キー10dを操作する事により、その音量バランス値が0.9:1.1となるといった具合である。
以上説明したように、第一段階から第三段階までの一連の操作を行う事により、再生装置100のユーザは、特定の分離角度(定位角度範囲)を選択し、その選択範囲内と選択範囲外との音量バランスを調整する機能を操作することが可能となる。すなわち、特定の定位角度範囲を選択し、その選択範囲内と選択範囲外と一方あるいは両方の音量調整を行うことにより、両範囲の音量バランスを調整することができる。
次に、この例のソフトウェアでの実装例について説明する。図18、図19は、この例の再生装置100で行われる分離角度と音量バランスの指示入力の受付処理を説明するためのフローチャートであり、この発明をソフトウェアで実現するようにした場合の例にも対応するものである。
図18、図19に示す処理は、例えば、リモートコマンダ10及びコマンド信号受信部6を通じて音声信号の再生指示を受け付け、メディア再生部1に装填された記録媒体に記録されている音声信号を再生するようにした場合に、音声信号処理部2とシステムコントローラ4と画面表示部9とが協働して実行する処理である。
まず、再生装置100のシステムコントローラ4は、上述した第1の実施の形態の再生装置100の場合と同様に、音声信号処理部2を制御して、再生対象の音声信号が、自機において処理可能な信号形式であるか否かを判定する(ステップS501)。
ステップS501の判断処理において、再生対象の音声信号が自機においてそのまま処理可能な信号形式のものではないと判断したときには、システムコントローラ4は、音声信号処理部2を制御して、再生対象の音声信号を処理可能な信号形式の音声信号に変換する(ステップS502)。
ステップS502の処理の後には、または、ステップS501の判断処理において、再生対象の音声信号が自機においてそのまま処理可能な信号形式のものであると判断した場合には、システムコントローラ4は、リモートコマンダ10及びコマンド受信部6を通じて、ユーザによる音量バランスを調整する範囲の開始点Sの設定操作を受け付けている最中か否か、すなわち、開始点設定中か否かを判断する(ステップS503)。
ステップS503の判断処理において、開始点設定中であると判断したときには、システムコントローラ4は、コマンド受信部6を通じて受け付けるリモートコマンダ10からのコマンド信号に応じて、内部に保持するようにしている開始点Sの位置(位置情報)を更新し、これに応じてポインタPの表示位置を変更するようにするデータを形成し、これを画面表示部9に供給することによりポインタPの表示位置を変更する(ステップS504)。この後、システムコントローラ4は、後述する図19のステップS509の処理に進む。
なお、ステップS504の処理において、リモートコマンダ10から実行キー10eが押下操作されたことを示すコマンド信号が送信されてきたときには、そのときのポインタPの位置が、開始点Sとして設定するようにされ、終了点Eの設定操作を受け付けることができるようにされる。また、リモートコマンダ10から実行キー10eが押下操作されたことを示すコマンド信号が送信されてくるまでは、開始点Sの設定操作が繰り返し行うようにされる。
また、ステップS503の判断処理において、開始点設定中ではないと判断したときには、システムコントローラ4は、リモートコマンダ10及びコマンド受信部6を通じて、ユーザから音量バランスを調整する範囲の終了点Eの設定操作を受け付けている最中か否か、すなわち、終了点設定中か否かを判断する(ステップS505)。
ステップS505の判断処理において、終了点設定中であると判断したときには、システムコントローラ4は、コマンド受信部6を通じて受け付けるリモートコマンダ10からのコマンド信号に応じて、終了点Eの位置を更新し、これに応じてポインタPの表示位置を変更するようにするデータを形成し、これを画面表示部9に供給することによりポインタPの表示位置を変更する(ステップS506)。この後、システムコントローラ4は、後述する図19のステップS509の処理に進む。
なお、ステップS506の処理において、リモートコマンダ10から実行キー10eが押下操作されたことを示すコマンド信号が送信されてきたときには、そのときのポインタPの位置が、終了点Eとして設定するようにされ、音量バランス値の変更操作を受け付けることができるようにされる。また、開始点Sの設定後においては、リモートコマンダ10から実行キー10eが押下操作されたことを示すコマンド信号が送信されてくるまでは、終了点Eの設定操作が繰り返し行うようにされる。
また、ステップS505の判断処理において、終了点設定中ではないと判断したときには、システムコントローラ4は、リモートコマンダ10及びコマンド受信部6を通じて、ユーザからの音声バランスの調整操作を受け付けたか否か、すなわち、音声バランスが変化したか否かを判断する(ステップS507)。
ステップS507の判断処理において、音声バランスが変化したと判断したときには、システムコントローラ4は、コマンド受信部6を通じて受け付けるリモートコマンダ10からのコマンド信号に応じて、指定された範囲内、範囲外の音声信号に対する内部に保持している音声バランス値を更新する(ステップS508)。この後、システムコントローラ4は、後述する図19のステップS509の処理に進む。
なお、ステップS508の処理において、リモートコマンダ10から実行キー10eが押下操作されたことを示すコマンド信号が送信されてきたときには、変更するようにされた音声バランス値が決定値として設定するようにされる。また、終了点Sの設定後においては、リモートコマンダ10から実行キー10eが押下操作されたことを示すコマンド信号が送信されてくるまでは、音声バランス値の設定操作が繰り返し行うようにされる。
また、ステップS507の判断処理において、音声バランスが変化していないと判断した場合、また、上述もしたように、ステップS504、ステップS506、ステップS508の各処理の後においては、システムコントローラ4は、図19に示すステップS509の処理に進む。
そして、システムコントローラ4は、音声信号処理部2を制御して、各々音声信号から、ユーザ操作に拠り指定された分離角度範囲(定位角度範囲)内の音源の音声信号については、ユーザ操作に拠り設定された音量バランス設定値をも考慮して決定したゲイン値を乗じ、ユーザ操作に拠り設定された定位角度範囲外の音源の音声信号については、ユーザ操作に拠り設定された音量バランス設定値をも考慮して決定したゲイン値を乗じて、各周波数帯域における定位角度毎の音量値を調査するようにし、ゲイン調整後の再生対象の音声信号をD/Aコンバータ3に供給して再生するようにする(ステップS509)。
この後、システムコントローラ4は、音声信号処理部2から、再生対象の音声信号についての各周波数帯域における定位角度毎の音量値の調査結果に基づいて、再生対象の音声信号に含まれる各音源についての情報を表示させるためのデータを形成し、これを画面表示部9に供給し、画面表示部9の表示画面に表示される再生対象の音声信号に含まれる各音源についての情報を更新する(ステップS510)。
そして、システムコントローラ4は、続いて音声信号処理部2に入力される次の音声信号信号が存在するか否かを判定する(ステップS511)。ステップS511の判断処理において肯定結果が得られた場合、このことは次に処理を行うべき音声信号が存在することを表しており、システムコントローラ4は、再度、ステップS501からの処理を繰り返すようにする。また、ステップS511の判断処理において否定結果が得られた場合、処理を行うべき対象が存在しないため、システムコントローラ4は、この図18、図19に示した処理を終了する。
このように、この例の再生装置100は、2チャンネル以上の音声信号の各周波数帯域における定位角度毎の音量値を、色の明るさにより各々周波数と定位角度を2つの軸とした2次元平面上に表現する機能を実現することができる。そして、2次元平面において、ユーザ操作により特定の範囲を選択し、選択範囲内および選択範囲外の音量バランスを調整する機能を実現している。
このように、ユーザ操作により特定の分離角度範囲(特定の定位角度範囲)を選択し、選択範囲内および選択範囲外の音量バランスを調整できる。したがって、再生対象の音声信号が音楽の音声信号である場合には、目的とする楽器の音を目立たせるようにしたり、歌声を目立たせ、演奏を控えめにしたりするというように、コンテンツの楽しみ方の幅を広げることができる。
[変形例]
図14に示した再生装置100においては、リモートコマンダ10を通じて分離角度範囲(定位角度範囲)の設定を行うものとした。しかしこれに限るものではない。例えば、画面表示部9の表示画面9Gにタッチパネル機能を持たせる事により、より容易に設定を行うようにすることができる。
図20は、表示画面9Gにタッチパネル9TPが貼付された画面表示部9の当該表示画面9Gに表示される画面例を説明するための図である。図20に示すように、画面表示部9の表示画面9Gの前面には、タッチパネル9TPが貼付され、表示画面9Gに表示される画像とタッチパネル9TPとによって、ユーザからの操作入力を受け付ける受付手段としての機能を実現している。
すなわち、システムコントローラ4は、表示画面9Gのどの位置にどのような表示画像を表示するようにしているかを把握している。また、タッチパネル9TPへのタッチペンや指などによる接触が行われると、タッチパネル9TPは、接触位置を示す座標データを電気信号としてシステムコントローラ4に供給する。また、いわゆるドラッグ操作(引きずり操作)が行われた場合には、刻々と変化する接触位置を示す座標データをタッチパネル9TPは電気信号としてシステムコントローラ4に供給する。
システムコントローラ4は、タッチパネル9TPからの座標データと、その座標データによって示される表示画面9G上の位置に表示されている画像情報とに基づいて、実行するべき処理を決定し、その決定した処理を実行することができるようにしている。このようなタッチパネル9TPに対する操作によって、定位角度範囲を指定し、さらに音量バランスを変化させるようにする場合について具体的に説明する。
この変形例の場合においても、画面表示部9の表示画面9Gには、再生対象の音声信号に含まれる各音源についての情報の表示領域である音量表示部91が設けられる。図20において、表示92、93、94は、対応する周波数の値を示し、表示95、96、97は、対応する定位角度の値を表している。
すなわち、この音量表示領域91には、図15〜図17に示した音量表示領域91の場合と同様に、横軸が各音源の音像の定位角度を、縦軸は周波数を示し、各音源の音量の大きさを色の明るさで示すようにしている。したがって、横軸および縦軸および色の明るさという3つの要素を用いて、定位角度および周波数および音量値の3つの成分を表している。
また、音量表示部91上に貼付されたタッチパネル9TPに対して、タッチペンや指などを接触させて移動させる操作を行うことによって、分離角度範囲(定位角度範囲)を指定することができるようにしている。すなわち、ユーザが音量表示部91上に貼付されたタッチパネル9TP上の一点にタッチペンや指などを接触させ、接触させたままの状態で接触位置を別の一点に移動し、接触を解放する。
このようないわゆるドラッグ・アンド・ドロップ(Drag and Drop)操作を行うことにより、システムコントローラ4は、タッチパネル9TPからの座標データと、対応する表示情報とに基づいて、最初にタッチペンなどを接触させた点を開始点S、最後にタッチペンなどの接触を解放した点を終了点Eとし、その開始点Sおよび終了点Eを音量バランスを変更する定位角度範囲と設定することができる。
また、図20において、スライダー901、ボタン902およびボタン903の各表示は音量表示部91に表示する周波数の範囲を変更するためのものである。すなわち、ユーザがスライダー901の部位のうち、現在のスライダーの位置よりも上側の部位に触れるとスライダー901の位置が上側に変化し、その位置の変化に合わせて音量表示部91に表示される周波数の範囲が上側にずれる。
例えば、図20に示したように、スライダー901の位置が中心にあった場合に表示する周波数の範囲が0Hzから8000Hzまでの範囲であった場合に、スライダー901の位置を全体の1/4(4分の1)ほど上側にずらせば、システムコントローラ4は、音量表示部91の周波数範囲を、2000Hzから10000Hzまでの範囲にずらすといった具合である。
また、ユーザが、タッチペンや指などでボタン902の表示上のタッチパネル9TPに触れた場合には、音量表示部91に表示する周波数の範囲が狭くなる。例えば、図20に示したように、表示する周波数の範囲が0Hzから8000Hzまでの範囲であった場合に、ユーザが、タッチペンや指などでボタン902の表示上のタッチパネル9TPに触れた場合には、システムコントローラ4は、音量表示部91の周波数範囲を、0Hzから4000Hzまでの範囲に狭くするといった具合である。
また、ユーザが、タッチペンや指などでボタン903の表示上のタッチパネル9TPに触れた場合には、音量表示部91に表示する周波数の範囲が拡がる。例えば、図20に示したように、表示する周波数の範囲が0Hzから8000Hzまでの範囲であった場合に、ユーザが、タッチペンや指などでボタン903の表示上のタッチパネル9TPに触れた場合には、システムコントローラ4は、音量表示部91の周波数範囲を、0Hzから16000Hzまでの範囲に拡げるといった具合である。
このようにしてスライダー901、ボタン902およびボタン903を用いて音量表示部91に表示する周波数の範囲を変更できる。なお、ユーザ操作により周波数の範囲が変更された際、表示92、93、94の周波数の値も変更するようにされる。
また、図20において、スライダー904、ボタン905およびボタン906の各表示は音量表示部91に表示する定位角度の範囲を変更するためのものである。すなわち、ユーザがスライダー904の部位のうち、現在のスライダーの位置よりも左側の部位に触れるとスライダーの位置が左側に変化し、その位置の変化に合わせて音量表示部91に表示する定位角度の範囲が左側にずれる。
例えば、図20に示したように、スライダー904の位置が中心にあった場合に表示する定位角度の範囲が−60°から+60°までの範囲であった場合に、スライダー904の位置を全体の1/4(4分の1)ほど左側にずらせば、システムコントローラ4は、音量表示部91の定位角度の範囲を、−90°から+30°までの範囲にずらすといった具合である。
また、ユーザが、タッチペンや指などでボタン905の表示上のタッチパネル9TPに触れた場合には、音量表示部91に表示する定位角度の範囲が狭くなる。例えば、図20に示したように、表示する定位角度の範囲が−60°から+60°までの範囲であった場合に、ユーザが、タッチペンや指などでボタン906の表示上のタッチパネル9TPに触れた場合には、システムコントローラ4は、音量表示部91の定位角度の範囲を、−30°から+30°までの範囲に狭くするといった具合である。
また、ユーザが、タッチペンや指などでボタン906の表示上のタッチパネル9TPに触れた場合には、音量表示部91に表示する定位角度の範囲が拡がる。例えば、図20に示したように、表示する定位角度の範囲が−60°から+60°までの範囲であった場合に、ユーザが、タッチペンや指などでボタン906の表示上のタッチパネル9TPに触れた場合には、システムコントローラ4は、音量表示部91の定位角度の範囲を、−120°から+120°までの範囲に拡げるといった具合である。
このようにしてスライダー904、ボタン905およびボタン906を用いて音量表示部91に表示する定位角度の範囲を変更できる。なお、ユーザ操作により定位角度が変更された際、表示95、96、97の定位角度の値も変更するようにされる。
また、図20において、スライダー908は、ユーザ操作により指定された定位角度範囲内の音量バランス値を設定するためのものである。すなわち、ユーザがスライダー908の部位のうち、現在のスライダーの位置よりも上側の部位に触れるとスライダー908の位置が上側に変化し、その位置の変化に合わせて指定範囲内の音量バランス値が増加する。
また、図20において、スライダー909は、ユーザ操作により指定された定位角度範囲外の音量バランス値を設定するためのものである。すなわち、ユーザがスライダー909の部位のうち、現在のスライダーの位置よりも上側の部位に触れるとスライダー909の位置が上側に変化し、その位置の変化に合わせて指定範囲外の音量バランス値が増加する。
例えば、図20に示したように、スライダー908およびスライダー909の位置が、変更可能な範囲の中心にあった場合、この場合の指定された定位角度範囲内とその範囲外の音量バランス値が1:1であるとすると、スライダー908の位置を全体の1/4(4分の1)ほど上側に変化させると、システムコントローラ4は、指定された定位角度範囲内とその範囲外の音量バランス値を1.5:1と変化させることになる。この状態でさらにスライダー909の位置を全体の1/4(4分の1)ほど下側に変化させると、システムコントローラ4は、指定された定位角度範囲内とその範囲外の音量バランス値を1.5:0.5と変化させることになる。
そして、システムコントローラ4は、音声信号処理部2を制御して、各々音声信号から、ユーザ操作に拠り指定された分離角度(定位角度範囲)内の音源の音声信号については、ユーザ操作に拠り設定された音量バランス設定値をも考慮して決定したゲイン値を乗じ、ユーザ操作に拠り設定された定位角度範囲外の音源の音声信号については、ユーザ操作に拠り設定された音量バランス設定値をも考慮して決定したゲイン値を乗じ、ゲイン調整後の再生対象の音声信号をD/Aコンバータ3に供給して再生するようにする。
このように、表示画面にタッチパネルを設けることにより、リモートコマンダ10の操作子を頻繁に操作するなどのことなく、分離角度の指定や音量バランスの指定を簡単かつ迅速に行うようにすることができる。
[ユーザからの指示入力を受け付ける場合の具体例2について]
図14〜図20を用いて上述したユーザからの指示入力を受け付ける場合の具体例1の場合には、ユーザからの分離角度(定位角度)と音量バランスの指示入力を受け付けて、指示された分離角度範囲内と分離角度範囲外との音量バランスを調整するようにした。しかし、これに限るものではない。
分離角度範囲に加えて、周波数範囲をも指示できるようにし、指示された分離角度範囲と周波数範囲との重複する目的とする指定範囲内と指定範囲外とで、音量バランスを調整するようにすることもできる。そこで、分離角度範囲と周波数範囲と音量バランスの指示入力を受け付けて、分離角度範囲と周波数範囲とが重複する指定範囲の内と外の音量レベルを調整できるようにする場合を例にして、ユーザに対して提供するユーザインターフェイスについての他の一例(具体例2)について説明する。
そして、以下に説明する具体例2の場合においても、基本的には具体例1の場合と同様に、図14に示した構成の再生装置100に適用される。また、以下に説明する具体例2の場合にも、上述した具体例1の場合と同様に、複数の音源が混合するようにされた2チャンネル以上の音声信号の各周波数帯域における定位角度毎の音量値を、色の明るさにより各々周波数と定位角度を2つの軸とした2次元平面上に表現してユーザに提供し、これを参照しながら、目的とする分離角度範囲および周波数範囲の指示入力と、音量バランスの指示入力とを行うことができるようにするものである。
このため、以下に説明する具体例2の説明においても、必要に応じて、具体例1において用いた図14、図15をも参照しながら説明する。そして、上述もしたように、分離角度範囲の指定に加えて、周波数範囲の指定をも可能にするこの具体例2のユーザインターフェイスもまた、図14を示した再生装置100に適用される。
この具体例2の場合にも、音声信号処理部2は、メディア再生部1からのLchとRchとの音声信号について、予め決められる各周波数帯域における定位角度毎の音量値を調査し、その調査結果を後述するシステムコントローラ4へと供給することができるものである。また、音声信号処理部2は、LchとRchの音声信号を、再生用の音声信号Lexと音声信号Rexとして、D/Aコンバータ3に供給する。
そして、システムコントローラ4は、上述したように、音声信号処理部2からの予め決められる各周波数帯域における定位角度毎の音量値の調査結果に基づいて、再生対象の音声信号に含まれる各音源についての情報を画面表示部9の表示画面に表示させるためのデータを生成し、これを画面表示部9に供給する。
したがって、上述もしたように、再生装置100は、操作部5やリモートコマンダ10とコマンド受信部6を通じてメディア再生部1に装填された記録媒体に記録されている音声信号の再生が指示された場合には、システムコントローラ4は、メディア再生部1を制御して、目的とする音声信号を記録媒体から読み出し、音声信号処理部2、D/Aコンバータ3を通じて再生するようにする。
同時に、システムコントローラ4は、音声信号処理部2からの予め決められる各周波数帯域における定位角度毎の音量値の調査結果に基づいて、再生対象の音声信号に含まれる各音源についての情報を表示させるためのデータを形成し、これを画面表示部9に供給することにより、再生対象の音声信号に含まれる各音源についての情報を画面表示部9の表示画面に表示させることができるようにしている。
この場合、画面表示部9の表示画面9Gに表示される再生対象の音声信号に含まれる各音源についての情報は、図15を用いて説明したように、予め決められた各周波数帯域における定位角度毎に存在する音源についての音量値が色の明るさで表される。そして、この具体例2の場合、操作部5あるいはリモートコマンダ10を通じて、分離角度範囲と周波数範囲と音量バランス値との入力を受け付けて、システムコントローラ4に供給する。
この具体例2において、システムコントローラ4は、受け付けた分離角度範囲と周波数範囲とを含む分離角度指示信号S1と、受け付けた音量バランス値を含む音量バランス指示信号S2とを音声信号処理部2に供給する。このように、この具体例2において、システムコントローラ4は、分離角度範囲および周波数範囲を含む分離角度指示信号S1と、音量バランス値を含む音量バランス指示信号S2とを形成し、これらを音声信号処理部2に供給するようにしている。
そして、分離角度範囲および周波数範囲を含む分離角度指示信号S1と、音量バランス値を含む音量バランス指示信号S2との供給を受けて、分離角度範囲の指定のみならず、分離角度範囲と周波数範囲とによる目的とする指定範囲の指定(設定)をも可能にし、目的とする指定範囲の内部と外部とで音量バランスを調整できるようにするために、この具体例2における再生装置100の音声信号処理部2の構成は、図3に示した第1の実施の形態の再生装置100の音声信号処理部2とは異なるものである。
図21は、この具体例2の場合の再生装置100の音声信号処理部2の構成例を説明するためのブロック図である。図21と図3とを比較すると分かるように、図21に示したこの具体例2が適用された再生装置100の音声信号処理部2は、分離処理回路21、音量バランス調査回路22、音量バランス調節回路23に加えて、フィルタ係数生成回路24と、フィルタ部25と、加算回路26、27とが設けられたものである。なお、フィルタ部25は、2つのバンド・エリミネーション・フィルタ(以下、BEFと略称する。)と2つのバンド・パス・フィルタ(以下、BPFと略称する。)とからなる部分である。
そして、図21に示すように、システムコントローラ4からの分離角度範囲と周波数範囲とを含む分離角度指示信号S1は、分離処理回路21とフィルタ係数生成回路24に供給される。分離処理回路21は、分離角度指示信号S1に含まれる分離角度範囲に基づいて、上述もしたように、左右2チャンネルLch、Rchのそれぞれの音声信号について、指示された分離角度内の音源の音声信号Li、Ri、および、指示された分離角度外の音源の音声信号Lo、Roに分離し、指示された分離角度内の音源の音声信号Li、Riは、図21に示すように、左右のチャンネルで異なるBEFとBPFに供給される。また、指示された分離角度外の音源の音声信号Lo、Roは、左右のチャンネルで異なる加算回路26、27に供給される。
一方、フィルタ係数生成回路24は、システムコントローラ4から供給される分離角度指示信号S1に含まれる周波数範囲に基づいて、フィルタ部25の2つのBEFと2つのBPFのそれぞれに設定するフィルタ係数を求め、求めたフィルタ係数を目的とするフィルタに供給して設定する。
すなわち、フィルタ部25の2つのBPFは、指示された分離角度内の音源の音声信号Li、Riから、さらに指示された周波数範囲の信号のみを通過させるためのものである。このため、フィルタ部25の2つのBPFに対しては、指示された周波数範囲の信号のみを通過させるようにするためのフィルタ係数が設定される。
また、フィルタ部25の2つのBEFは、指示された分離角度内の音源の音声信号Li、Riから、指示された周波数範囲の信号のみを削除し、指示された分離角度内の音源信号Li、Riの内から指示された周波数範囲外の信号のみを通過させるためのものである。このため、フィルタ部25の2つのBEFに対しては、指示された周波数範囲外の信号のみを通過させるようにするためのフィルタ係数が設定される。
これにより、フィルタ部25の2つのBPFからは、指示された分離角度内(分離角度範囲内)の信号であって、かつ、指示された周波数範囲ないの信号Lii、Riiが出力される。換言すれば、フィルタ部25の2つのBPFからは、指示された分離角度範囲と指示された周波数範囲との重複する部分の音声信号(分離角度範囲と周波数範囲とで規定される目的とする指定範囲内の音声信号)Lii、Riiが出力される。
一方、フィルタ部25の2つのBEFからは、指示された分離角度内の音声信号であるが、指示された周波数範囲外の音声信号が出力される。2つのBEFからの出力された音声信号のそれぞれは対応する加算回路26、27に供給される。これら加算回路26、27には、図21に示したように、左右のチャンネルの指示された分離角度外の音声信号Lo、Roが供給されており、加算回路26、27からは、指示された分離角度範囲外の音声信号であって、かつ、指示された周波数範囲外の音声信号Loo、Rooが出力される。
これにより、フィルタ部25の2つのBPFからは、左右2チャンネルのそれぞれの信号のうち、指示された分離角度範囲内であって、かつ、指示された周波数範囲内である目的とする範囲内の音声信号Lii、Riiが出力され、加算回路26、27からは、左右2チャンネルのそれぞれの音声信号のうち、当該目的とする指定範囲外の音声信号Loo、Rooが出力される。これら、左右2チャンネルのそれぞれの音声信号についての、目的とする指定範囲内の音声信号Lii、Riiと、目的とする指定範囲外の音声信号Loo、Rooとが、図21に示すように、音量バランス調査回路22と、音量バランス調節回路23とに供給される。
そして、音量バランス調査回路22においては、これに供給された左右2チャンネルの目的とする指定範囲内の音声信号Lii、Riiと目的とする指定範囲外の音声信号Loo、Rooとの音量レベルと、システムコントローラ4からの音量バランス指示信号S2に含まれる音量バランス値とに基づいて、目的とする指定範囲内の音声信号Lii、Riiと目的とする指定範囲外の音声信号Loo、Rooとの音量バランスを調査し、システムコントローラ4からの音量バランス値に従い、目的とする指定範囲内の音声信号Lii、Riiと目的とする指定範囲外の音声信号Loo、Rooとが好適な音量バランスとなるように、目的とする指定範囲内の音声信号Lii、Riiに対するゲイン値Giと、目的とする指定範囲外の音声信号Loo、Rooに対するゲイン値Goとを決定し、これらを音量バランス調節回路23に供給する。
音量バランス調節回路23は、図21に示したように、これに供給された左右2チャンネルの目的とする指定範囲内の音声信号Lii、Riiと目的とする指定範囲外の音声信号Loo、Rooと、目的とする指定範囲内の音声信号Lii、Riiに対するゲイン値Giと、目的とする指定範囲外の音声信号Loo、Rooに対するゲイン値Goとに基づいて、例えば、上述した[数1]に従った演算を行って、Lchの出力音声信号LexとRchの出力音声信号Rexとを生成し、これらを出力する。なお、[数1]においては、Li=Lii、Ri=Rii、Lo=Loo、Ro=Rooとして演算することになる。もちろん、上述した[数1]以外の演算式を用いて目的とする音声信号を形成するようにしてもよい。
このように、図21に示した具体例2の場合の再生装置100の音声信号処理部2の構成例の場合には、分離処理の後に、設定された周波数範囲に応じたバンド・パス・フィルタ(BPF)を指示された分離角度範囲内の音声信号成分Li、Riに掛ける事により、分離角度範囲内であって、かつ、周波数範囲内である目的とする範囲内の音声信号成分Lii、Riiを生成している。
また、設定された周波数範囲に応じたバンド・エリミネーション・フィルタ(BEF)を指示された分離角度範囲内の音声信号成分Li、Riに掛ける事で分離角度範囲内の音声信号成分Li、Riから周波数範囲外の音声信号成分を生成し、これを分離角度範囲外の音声信号成分Lo、Roに足す事により設定された分離角度範囲外であって、かつ、設定された周波数範囲外の音声信号成分Loo、Rooを生成することができるようにしている。
なお、フィルタ部25を構成する各BPF、各BEFのフィルタ係数は、指定された周波数範囲に応じてフィルタ係数生成回路24にて静的(全ての周波数範囲パターンの係数を保持)または動的(計算により求める)に生成することができる。また、フィルタ部25を構成するBPFおよびBEFはFIRフィルタ(Finite Impulse Response Filter)でも、IIRフィルタ(Infinite Impulse Response Filter)でも構成可能である。
次に、この具体例2の場合において、音量バランスを変化させる分離角度範囲および周波数範囲を設定する手順と、分離角度範囲と周波数範囲とにより指定される目的とする範囲内および目的とする範囲外の音量バランスを変更する手順とを、リモートコマンダ10に対する操作と、これに応じて変化する画面表示部9の表示画面9Gの表示画像とを対応付けながら詳細に説明する。以下においては、図22、図23の分離角度範囲および周波数範囲を指定する場合においての表示画像の表示例を説明するための図をも参照しながら詳細に説明する。
まず、第一段階として、音声信号の再生処理の実行を開始する様にすると、この具体例2の場合においても上述した具体例1の場合と同様に、画面表示部9の表示画面9Gに、図15を用いて説明した表示画像が表示するようにされる。この図15に示した状態にあるときに、所定の操作を行うことにより、図22に示すように、開始点、終了点を指示するためのポインタ(指示子)Pを表示させ、右方向キー10a、左方向キー10b、上方向キー10c、下方向キー10dを操作して、目的とする範囲の開始点Sとなるべき位置にポインタPを位置付け、実行キー10eを押下することにより、開始点Sを決定する。この例において、目的とする範囲は、上述もしたように分離角度範囲(音像の定位角度範囲)と周波数範囲とによって規定される範囲である。
すなわち、右方向キー10aを操作することにより分離角度範囲の開始点Sを右方向に移動し、左方向キー10bを操作することにより分離角度範囲の開始点Sを左方向に移動し、上方向キー10cを操作することにより周波数範囲の開始点Sを高周波帯域方向に移動し、下方向キー10dを操作することにより周波数範囲の開始点Sを低周波帯域方向に移動し、実行キー10eを操作することにより分離角度範囲と周波数範囲とによって決まる目的とする範囲の開始点Sを設定する。
このように、現在位置を示すポインタPを、音量表示部91の表示領域上に重ねて表示することで開始点Sの指示をしやすくすることができるのである。
そして、開始点Sを決定した後、第二段階として、さらに右方向キー10a、左方向キー10b、上方向キー10c、下方向キー10dを操作することにより、図23に示すように、ポインタPを移動させることにより、目的とする範囲の終了点Eを指示し、実行キー10eを操作しその終了点Eを決定する。
すなわち、右方向キー10aを操作することにより分離角度範囲の終了点Eを右方向に移動し、左方向キー10bを操作することにより分離角度範囲の終了点Eを左方向に移動し、上方向キー10cを操作することにより周波数範囲の終了点Eを高周波帯域方向に移動し、下方向キー10dを操作することにより周波数範囲の終了点Eを低周波帯域方向に移動し、実行キー10eを操作することにより分離角度範囲と周波数範囲とによって決まる目的とする範囲の終了点Eを設定する。
この際、システムコントローラ4がユーザからの指示入力に応じて表示データを形成し、これを画面表示部9に供給することにより、図23に示すように、選択した開始点Sおよび指示している終了点Eを対角線上の頂点とした長方形を音量表示部91上に重ねて表示することにより、指示するようにしている目的とする範囲(分離角度範囲および周波数範囲とが重複する範囲)を視覚を通じて認識できるようにしている。
そして、システムコントローラ4が、入力された開始点S、終了点Eの座標位置から分離角度範囲(図23において、開始点Sと終了点Eとで示される横軸方向の範囲)と、周波数範囲(図23において、開始点Sと終了点Eとで示される縦軸方向の範囲)とが特定され、これら分離角度範囲と周波数範囲とを含む分離角度指示信号S1が形成され、音声信号処理部2に供給されることになる。
上述のようにして、分離角度範囲と周波数範囲とによって指示される目的とする範囲の開始点および終了点を設定した後、第三段階として、これら開始点S、終了点Eを対角線上の頂点とした長方形で囲まれた範囲内とその範囲外の音量バランスを、リモートコマンダ10の上方向キー10c、下方向キー10dを操作することにより変化させる。
すなわち、システムコントローラ4は、リモートコマンダ10の上方向キー10c、下方向キー10dを通じて音量バランスについての指示入力を受け付けて、この受け付けた指示入力に応じた音量バランス値を含む音量バランス指示信号S2を形成して、音声信号処理部2に供給することによって、図21を用いて説明したように、指示された目的とする範囲内と範囲外との音量バランスを調整することができる。
具体的には、例えば、現在の開始点S、終了点Eで指定された範囲内とその範囲外の音量バランス設定値が1:1である場合に、上方向キー10cを操作する事により、その音量バランス値が1.1:0.9となり、また、例えば、現在の開始点S、終了点Eで指定された範囲内とその範囲外の音量バランス値が1:1である場合に、下方向キー10dを操作する事により、その音量バランス値が0.9:1.1となるといった具合である。
以上説明したように、第一段階から第三段階までの一連の操作を行う事により、再生装置100のユーザは、分離角度範囲と周波数範囲とが重複する範囲である目的とする範囲を指定し、その指定した範囲内と範囲外との音量バランスを調整することが可能となる。すなわち、特定の分離角度範囲と周波数範囲を選択し、その選択範囲内と選択範囲外との一方あるいは両方の音量調整を行うことにより、両範囲の音量バランスを調整することができる。
なお、この具体例2の場合にも、主にシステムコントローラ4によって実行される処理は、図18、図19を用いて説明した具体例1の場合と同様に行われることになる。すなわち、基本的には、開始点S、終了点Eを指定することにより、目的とする範囲を指定し、この目的とする範囲内と範囲外の音量バランスの調整指示を与えることにより、目的とする範囲内と範囲外の音量バランスを指示に応じて調整することができる。
また、この具体例2の場合においても、図20を用いて説明したように、表示部9の表示画面9Gにタッチパネル9TPが設けられた構成を有している場合には、具体例1の場合と同様にして、開始点S、終了点Eを指示することにより、この具体例2の場合には、分離角度範囲と周波数範囲とが重複する部分である目的とする範囲を指定し、音量バランスを指定して、目的とする範囲内と範囲外との音量バランスをも調整することが可能である。
なお、上述した具体例2の場合には、音声信号処理部2の構成を図21に示した構成にすることによって、分離角度範囲と周波数範囲とによって決まる指定範囲内と範囲外とで、音量バランスを調整することができるようにした。しかし、音声信号処理部2の構成を図5、図6を用いて説明したように構成した場合には、構成を変更することなく、分離角度範囲と周波数範囲とによって決まる指定範囲内と範囲外とで、音量バランスを調整することができる。
また、上述した具体例1は分離角度範囲を指定する場合の例であり、具体例2は分離角度範囲と周波数範囲とで決まる指定範囲を指定する場合の例である。そして、上述した第2、第4の実施の形態のように、目的とする音声信号の種類を指定する場合には、指定可能な音声信号の種類を予め再生装置や記録再生装置に登録しておき、その中から目的とする音声信号の種類を選択するなど、種々の態様の選択方式を用いることが可能である。
また、上述のように、具体例1は分離角度範囲を指定する場合の例であり、具体例2は分離角度範囲と周波数範囲とで決まる指定範囲を指定する場合の例である。これ以外に、例えば、周波数範囲のみを指定し、この周波数範囲内と範囲外とで音量バランスを調整するようにすることも可能である。
[他の変形例]
また、上述した第1、第2の実施の形態においては、メディア再生部1としては、記録媒体から音声信号(および映像信号)を再生するものとして説明したが、これに限るものではない。メディア再生部1に変えて、AM(Amplitude Modulation)放送信号、FM(Frequency Modulation)放送信号、テレビジョン放送信号、衛星放送信号等の種々の放送信号などを受信・復調して音声信号(および映像信号)を出力するチューナ装置を用いた構成の再生装置にもこの発明を適用することができる。
或いは、メディア再生部1やチューナ装置を備えた再生装置ではなく、例えばアンプ装置などとして、外部で再生(受信)された音声信号の供給を受けて、この入力音声信号に対して音声信号処理を行うようにする音声信号処理装置に対して、この発明を適用することももちろん可能である。
また、AM(Amplitude Modulation)放送信号、FM(Frequency Modulation)放送信号、テレビジョン放送信号、衛星放送信号等の種々の放送信号などを受信・復調して音声信号(および映像信号)を出力するチューナ装置部を備え、ここで受信選局した放送信号を記録媒体に記録する記録装置や記録再生装置にもこの発明を適用することができる。
また、図14〜図20、図22、図23を用いて説明した部分では、画面表示部9の表示画面9Gに表示する音量表示部91には、音量の大きさが大きいほど白色になり、音量の大きさが小さいほど黒色になるよう表示させたが、逆の場合であってもよい。すなわち、音量が大きい場合に黒色になり音量が小さい場合に白色になるといった形態である。
また、画面表示部9の表示画面9Gに表示する音量表示部91への表示は、カラー表示であってもよい。例えば、予め決められた分離角度(定位角度)の範囲毎に表示色を変えるようにし、色が濃いほど音量レベルは大きく、色が薄いほど音量レベルは低いといったように表したり、逆に、色が薄いほど音量レベルは大きく、色が濃いほど音量レベルは低いといったように表したりすることもできる。もちろん、予め決められた分離角度(定位角度)であって、かつ、予め決められた周波数帯域毎にも、表示色を変え、上述のように変化させることも可能である。
また、画面表示部9の表示画面9Gに表示する音量表示部91への表示は、音量の大きさを色で表すだけではなく3次元形式により表示してもよい。また、平面画面に表示するのではなく立体画面に3次元により表現してもよい。また、縦軸と横軸の表現が逆であってもよい。すなわち、縦軸を定位角度、横軸を周波数としてもよい。
また、図14〜図20を用い上述したユーザインターフェイスについての具体例1においては、リモートコマンダ10の右方向キー10a、左方向キー10b、上方向キー10c、下方向キー10d、実行キー10eを操作することにより、ある分離角度範囲(定位角度範囲)を選択し、選択範囲内および選択範囲外の音量バランスを調整できるようにしたが、これ以外の手順、およびこれ以外の方式で範囲の指定をしても良い。また、マウス、タッチパネルなどリモートコマンダ以外の操作機器やポインティングデバイスを用いて範囲の指定を行ってもよい。
例えば、マウスであればマウスボタンを押下することにより開始点を設定し、そのまま押下しながらドラッグ(マウスの操作を行いマウスカーソルの位置を移動する)して終了点まで移動し、マウスボタンを解放することにより終了点を設定するとしてもよい。
また、図14〜図20を用い上述した変形例においては、分離角度範囲(選択可能な定位角度範囲)を1つのみとしたが、この選択範囲を複数とし、それぞれの音量バランスを変更する形態であってもよい。
また、図21〜図23を用いて説明したユーザインターフェイスについての具体例2においては、ある分離角度範囲(定位角度範囲)および周波数範囲を設定する際に開始点および終了点を対角線上の頂点とする長方形としたが、円や楕円などの形状とし、その内側の範囲を目的とする指定範囲とするようにすることもできる。
また、分離角度範囲と周波数範囲とにより指定するようにする目的とする範囲を指定する際に、開始点を中心とし終了点を半径とする円の形状の内側を指定範囲としても良い。また、ある周波数範囲および定位角度範囲を設定する際に、ユーザがマウスやタッチパネルなどで描いた閉曲線の内側を目的とする指定範囲としても良い。すなわち、範囲を指定する事が可能な手順、方式、機器であればどのような形態であってもよい。
また、図21〜図23を用い上述したユーザインターフェイスについての具体例2においては、分離角度範囲と周波数範囲とによって指定する目的とする範囲の指定を1つのみとしたが、この選択範囲(指定範囲)を複数とし、それぞれの音量バランスを変更する形態であってもよい。
図24、図25は、目的とする指定範囲(分離角度範囲および周波数範囲により規定される範囲)を設定する他の例について説明するための図である。図24Aの場合には、例えば、ポインティングデバイスにより、1つの点xを指定すると、その点xを中心として、分離角度範囲、周波数範囲を予め決められた分だけ確保して、分離角度範囲および周波数範囲を設定するようにする。
図24Aの場合には、最初に指定された点xを中心にして、分離角度範囲を左右に10°ずつ取り、周波数範囲を上下に2000Hzづつとって、図24Aに示したように、長方形の範囲Xを自動的に設定するようにする。この範囲Xは、例えば、図24Aにおいて、矢印a、b、c、dが示すように、4辺のそれぞれを移動させ、四方に縮小したり、拡大したりすることができるようにされる。
また、図24Bの場合には、1つの点を指定することにより設定される最初の範囲(初期範囲)を楕円によって形成するようにした場合の例である。この図24Bの例の場合にも、図24Aに示した例の場合と同様に、一点xを指定することにより、その点xを中心として例えば縦長の楕円の範囲を設定し、この範囲を図24Bにおいて矢印eが示すように、拡大したり、逆に縮小したりすることができるようにされる。
ここでは、楕円により周波数範囲および定位角度範囲を設定するようにしたが、これに限るものではない。上述もしたように、円を用いたり、あるいは、半円を用いたり、その他の種々の形状の範囲を指定して、その範囲を変形することにより、ユーザが目的とする範囲を指定するようにすることが可能である。
また、図21Bにおいて、範囲91a、91b、91c、91dが示すように、複数の分離角度範囲(周波数範囲および定位角度範囲)を設定するようにすることも可能である。この場合には、指定された範囲91a、91b、91c、91dのそれぞれと、それ以外の部分との音量バランスを指定するようにすることにより、各指定された範囲91a、91b、91c、91dのそれぞれと、それ以外の部分との音量バランスを調整することができる。
具体的には、範囲91a、91b、91c、91dに対応する楽器の音声信号の音量バランス値を大きくし、それ以外の楽器やノイズ音の音量バランス値を小さくするなどのことができるようにされる。もちろん、これとは逆に、指定された範囲91a、91b、91c、91dのそれぞれの音源の音量バランスを小さくし、それ以外の部分の音源の音量バランスを大きくするというように調整することも可能である。
すなわち、音声コンテンツに含まれる各音源に散らばりに対応して、目的とする音源が属する範囲を設定し、音量バランスを調整することができる。さらに換言すれば、どのような範囲(周波数範囲や音像の定位角度範囲、あるいは、その両方によって特定される分離角度範囲)に存在する音源の音声信号について、どのようにバランス調整するかを決めて、これに応じて調整することができる。
また、図25に示すように、音量表示部91自体の形状を扇型とするようにしてもよい。この場合、図25Aに示すように、扇型の開き角を定位角度範囲に一致させ、また、円弧の両端の半径部分における当該半径方向を周波数範囲とすることで、音声信号に含まれる目的とする音源の位置を、扇型の中心αを聴取者の位置に見立て、より直感的に分かりやすい態様で示すようにすることができる。
そして、例えば、聴取者の左側に音像が定位している音源が属する範囲を指定する場合には、例えば、図25Bに示すように、中心から左側の目的とする部分に範囲91eを設定し、この範囲を縮小したり、拡大したり、また、その位置を変更したりすることにより、目的とする音源の属する周波数範囲および定位角度範囲を設定するようにすることができる。もちろん、音量表示部91の形状は、四角形や扇形に限るものではなく、円、楕円、ひし形、台形など種々の形状とすることが可能である。
また、各実施の形態において、各々の楽器の周波数特性や倍音成分などから楽器を判別し、楽器の画像や名称を画面表示部9の音量表示部91などに表示し、目的とする音源の種類を指示するようにすることも可能である。
また、この発明は、上述もしたように、音声信号の再生装置、記録装置、記録再生装置の他、放送信号の受信復調機能を備えた受信装置、音楽や映像などの再生機能を備えたパーソナルコンピュータ、音声信号の供給を受けて増幅処理等の音声信号処理を行うパワーアンプ装置などの音声信号処理装置等、音声信号や、同期を取って再生すべき音声信号と映像信号とからなるいわゆるAV(Audio/Visual)信号等からなるコンテンツ信号を処理する種々の電子機器に適用することができる。
また、上述したように指定される分離角度と音量バランス、あるいは、音源種類と音量バランスについて、処理対象のコンテンツの識別IDとを関連付けて、例えば、システムコントローラ4内のメモリに記憶保持させておくことにより、そのコンテンツが再生される場合には、必ず、指定された指定範囲内と指定範囲外との一方または両方について、指定されたように音声信号のゲイン調整を行って、ユーザの好みの態様で再生できるようにすることができる。
また、音声信号などのコンテンツデータに対して、上述したように指定される分離角度と音量バランス、あるいは、音源種類と音量バランスを付加しておくことにより、例えば、他の機器などに提供した場合には、当該他の機器においても、その指定された周波数範囲および定位角度範囲と、その範囲内と範囲外の一方または両方についてのゲイン値とに基づいて、コンテンツを再生することもができるようにされる。
また、音声信号などのコンテンツデータに対して、上述したように指定される分離角度と音量バランスに応じた調整を、あるいは、音源種類と音量バランスに応じた調整をコンテンツデータの全体に適用したり、あるいは、コンテンツデータの所定の一部分のみに適用したりすることも可能である。
この場合には、例えば、全体に適用することを指示したり、先頭から何十秒経過した位置から何十秒間分の期間、あるいは、先頭から何フレーム目から何フレーム目までの期間というように、時間やフレーム数、その他のコンテンツ上の位置を指定することが可能な情報を用いて、適用期間を指定したりするようにすればよい。
このように、この発明は、ユーザからの分離角度と音量バランスの指示を受けて、指示された角度内に定位している音源の音声信号と指示された角度外に定位している音源の音声信号各々の音量バランスを判別し、自動的に音量バランスを調節する事で毎回ユーザによる調整を必要とせずに常に好適な音量バランスでコンテンツを処理することができるものである。
また、本発明は、ユーザからの音源の種類と音量バランスの指示を受けて、指示された音源の音声信号とそれ以外の音源の音声信号各々の音量バランスを判別し、自動的に音量バランスを調節する事で毎回ユーザによる調整を必要とせずに常に好適な音量バランスでコンテンツを処理することができるものである。
具体的には、上述もしたように、ユーザから入力され機器のメモリに記憶保持されていたり、あるいは、メタ情報として音声信号(音声コンテンツ)に付加されていたりする分離角度指示情報、音源種類指示情報、音量バランス情報に基づいて、目的とする人の声や目的とする楽器の音などを目立たせ、それ以外の音を目立つことがないようにしたり、あるいは、音声信号に含まれているメカノイズや風の音など、目的とする音源の音声信号を聞きとり難くしている音源の音声信号を目立つことがないようにしたりするなどのことができる。
そして、ユーザからの分離角度と音量バランスの指示や、音源の種類と音量バランスの指示を受ける事により、毎回ユーザによる調整を必要とせずに常に好適な音量バランスを提供することができる。
1…メディア再生部、2…音声信号処理部、3…D/Aコンバータ、4…システムコントローラ、5…操作部、6…コマンド受信部、7…音声信号処理部、8…システムコントローラ、9…画面表示部、9G…表示画面、91…音量表示部、10…リモートコマンダ、100…再生装置、200…再生装置、301L、301R…マイクロホン、302…アンプ部、303…書き込み処理部、304…記録媒体ドライブ、305…読み出し処理部、306…再生処理部、307…操作部、308…コマンド受信部、310…リモートコマンダ、300…記録再生装置、400…記録再生装置