JP2010118977A - 音像定位制御装置および音像定位制御方法 - Google Patents

音像定位制御装置および音像定位制御方法 Download PDF

Info

Publication number
JP2010118977A
JP2010118977A JP2008291799A JP2008291799A JP2010118977A JP 2010118977 A JP2010118977 A JP 2010118977A JP 2008291799 A JP2008291799 A JP 2008291799A JP 2008291799 A JP2008291799 A JP 2008291799A JP 2010118977 A JP2010118977 A JP 2010118977A
Authority
JP
Japan
Prior art keywords
sound
correlation coefficient
sound image
image localization
head
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008291799A
Other languages
English (en)
Inventor
Miki Haneishi
実希 羽石
Takao Yamabe
孝朗 山邊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2008291799A priority Critical patent/JP2010118977A/ja
Publication of JP2010118977A publication Critical patent/JP2010118977A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Receiver Circuits (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】 コンテンツの種類に拘わらず、また、台詞やアナウンス等の単音声がL/Rチャンネルに含まれている場合においても、明瞭な音声による聴感の向上を図ることを目的とする。
【解決手段】 本発明の音像定位制御装置150は、放送受信部210と、テレビジョン放送の音声信号がサラウンドに対応しているか否かを判定するサラウンド判定部218と、サラウンドに対応していると判定された場合に、センターチャンネルとL/Rチャンネルとの相関係数を導出する相関係数導出部222と、相関係数と頭部伝達関数の係数群とを関連付けたテーブルを記憶する記憶部224と、相関係数導出部が導出した相関係数に応じてテーブルから頭部伝達関数の係数群を抽出するテーブル抽出部226と、抽出された係数群を反映した頭部伝達関数によって音像定位処理を実行する音像定位処理部228と、を備えることを特徴とする。
【選択図】 図3

Description

本発明は、サラウンドに対応したテレビジョン放送に対して音像定位処理を施す音像定位制御装置および音像定位制御方法に関する。
従来から音の臨場感を向上する技術としてサラウンド方式があり、映画等において広がりのある空間が再現されていた。例えば、5.1サラウンド方式では、左/右スピーカ、左/右リアスピーカに加えて、センタースピーカの5つのスピーカから発せられる5チャンネルの音声信号と、1チャンネルの低域信号とで音声を再現している。
このようなサラウンド方式に対し、受聴者の後方にスピーカを配置することなく、受聴者の前方に設置した例えば2本のスピーカによって仮想的なサラウンド空間を再現するバーチャルサラウンド方式等の音像定位技術が開発されている。バーチャルサラウンド方式は、音像を定位するための頭部伝達関数等の計算が複雑であったが、近年の計算機の進歩によりその計算も容易となり、また、受聴者の後方にスピーカを設置する必要がないため、住宅事情や配線の手軽さの面から一般に広く知られるようになってきた。
また、近年、テレビジョン放送もデジタル化が進み、従来のアナログ放送ではモノラルやステレオ方式が主流だったのに対し、デジタル放送ではサラウンドに対応したコンテンツが増加している。そのため、映画だけでなく通常のテレビジョン放送、例えば、ニュース番組やスポーツ中継などでも手軽にサラウンドを楽しむことができ、今後はさらにサラウンドに対応したテレビジョン放送が一般的になっていくものと考えられる。
このようなテレビジョン放送には様々なコンテンツが含まれる。しかし、そのすべてのコンテンツに同一の音像定位処理を一様に施すと所望する音像定位効果を得られない場合がある。そこで、コンテンツ情報に基づき、コンテンツの内容に応じた音像定位効果を制御する技術が開示されている(例えば、特許文献1)。
2006−148664号公報
様々なコンテンツのうち、例えば、映画では、上述したバーチャルサラウンド方式によって、複数の音像をイメージでき、臨場感のある音声を楽しむことができる。一方、ニュース番組やスポーツ中継等コメンテータが発する台詞やアナウンス等の音声(以下、「単音声」という。)は、臨場感より明瞭さが求められる。従って、このようなコンテンツがサラウンドに対応している場合、コメンテータによる単音声は複数チャンネルのうちのセンターチャンネルにのみ割り当てられていることが多い。
上述した特許文献1の技術においても、ニュース番組の場合には、その音声がセンターチャンネルにのみ割当てられていることを前提に、センターチャンネルのフィルタ処理のタップ数を減らして残響を抑え、音声の明瞭度を上げている。
しかし、デジタル放送のニュース番組やスポーツ中継等では、チャンネルの役割が制作者の意図に沿って規定されているDVD等と異なり、従来のステレオ収録方式のなごりでセンターチャンネル以外のL/Rチャンネルにもサラウンド処理された単音声が含まれることが多い。そのため、バーチャルサラウンドシステムにおいて、L/Rチャンネルに広がり感を持たせた音像定位処理を施した場合、特許文献1の技術を用いてセンターチャンネルの残響を抑えることができたとしても、L/Rチャンネルに含まれる単音声が残り、明瞭度の悪化を招いてしまう。
本発明は、このような課題に鑑み、コンテンツの種類に拘わらず、また、台詞やアナウンス等の単音声がL/Rチャンネルに含まれている場合においても、明瞭な音声による聴感の向上を図ることが可能な、音像定位制御装置および音像定位制御方法を提供することを目的としている。
上記課題を解決するために、本発明の音像定位制御装置の代表的な構成は、テレビジョン放送を受信可能な放送受信部と、放送受信部が受信したテレビジョン放送の音声信号がサラウンドに対応しているか否かを判定するサラウンド判定部と、サラウンドに対応していると判定された場合に、音声信号のセンターチャンネルおよびL/Rチャンネルを抽出し、センターチャンネルとL/Rチャンネルとの相関係数を導出する相関係数導出部と、相関係数と頭部伝達関数の係数群とを関連付けたテーブルを記憶する記憶部と、相関係数導出部が導出した相関係数に応じてテーブルから頭部伝達関数の係数群を抽出するテーブル抽出部と、抽出された係数群を反映した頭部伝達関数によって音像定位処理を実行する音像定位処理部と、を備えることを特徴とする。
映画等においては、あらゆる数、あらゆる位置に音像を想定することができ、また、そのような複数の音像が受聴者の臨場感を向上させる。一方、ニュース番組やスポーツ中継等における単音声は単一かつ中央一カ所の音像を想定すればよく、またそのようにすべきである。本発明では、センターチャンネルとL/Rチャンネルとの相関係数を導出し、その相関係数が高い音声は、単一かつ中央一カ所の音像から発せられた単音声と見なし、その音声が明瞭になる係数群に基づく頭部伝達関数を用いて音声を出力する。かかる構成により、コンテンツの種類に拘わらず、また、台詞やアナウンス等の単音声がL/Rチャンネルに含まれている場合においても、明瞭な音声による聴感の向上を図ることが可能となる。
ここで、頭部伝達関数は、係数群によって、音声信号の直接音と反射音とをそれぞれ独立して調整できる。
頭部伝達関数を通じたインパルス応答を時間領域で見ると、その応答波形を直接音と反射音とに区別することができる。本発明では、頭部伝達関数における直接音と反射音との係数を調整し、直接音に対する反射音の比を下げることで、反射による残響を抑制し、明瞭な音声を生成する。
記憶部は、スピーカの配置に対応した複数の頭部伝達関数に対応したテーブルを含み、テーブル抽出部は、複数の頭部伝達関数のうち、スピーカの配置に応じて選択決定された頭部伝達関数の係数群を抽出してもよい。
頭部伝達関数は、受聴者の頭(両耳)とスピーカとの位置関係によって変化する。従って、スピーカの位置に応じた最適な頭部伝達関数を選択することで、ユーザは、より適切に明瞭な音声を得ることが可能となる。
相関係数導出部は、センターチャンネルおよびL/Rチャンネルに所定周波数帯域の帯域通過フィルタを施した後、相関係数を導出してもよい。このとき、所定周波数帯域は、200〜4000Hzであってもよい。
本発明の目的は、対象となる音声が単音声である場合にその音声を明瞭化することである。そこで、相関係数を導出する対象を人の音声の周波数帯域である200〜4000Hzに制限することで、相関係数導出負荷の軽減による迅速な処理と、その対象を制限することによる相関係数導出精度の向上を図ることができる。
本発明の音像定位制御方法の代表的な構成は、テレビジョン放送を受信し、受信したテレビジョン放送の音声信号がサラウンドに対応しているか否かを判定し、サラウンドに対応していると判定された場合に、音声信号のセンターチャンネルおよびL/Rチャンネルを抽出し、センターチャンネルとL/Rチャンネルとの相関係数を導出し、相関係数導出部が導出した相関係数に応じて、相関係数と頭部伝達関数の係数群とを関連付けたテーブルから頭部伝達関数の係数群を抽出し、抽出された係数群を反映した頭部伝達関数によって音像定位処理を実行することを特徴とする。
上述した音像定位制御装置における技術的思想に対応する構成要素やその説明は、当該音像定位制御方法にも適用可能である。
本発明では、コンテンツの種類に拘わらず、また、台詞やアナウンス等の単音声がL/Rチャンネルに含まれている場合においても、明瞭な音声による聴感の向上を図ることが可能となる。
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値などは、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
近年、デジタル放送の開始にも相俟って、サラウンド方式を採用したテレビジョン放送が放映されるようになった。従って、映画以外の例えばニュース番組やスポーツ中継等にも一様にサラウンド方式への拡張が為され、センターチャンネル以外のL/Rチャンネルにおいても、台詞やアナウンス等の単音声が割り当てられることがある。しかし、複数の音像をイメージでき、臨場感のある音声を楽しむことがその目的の1つである映画と異なり、これら番組におけるコメンテータが発する単音声は、臨場感より明瞭さが求められる。
本実施形態では、音声信号に単音声が含まれるか否かを判断し、その単音声が含まれる度合に応じた頭部伝達関数を適用することで、コンテンツの種類に拘わらず、また、台詞やアナウンス等の単音声がL/Rチャンネルに含まれている場合においても、明瞭な音声による聴感の向上を図ることが可能となる。ここで、頭部伝達関数とは、任意に配置されたスピーカから発せられたインパルス信号を、受聴者の外耳道入り口で測定したインパルス応答である。ここでは、理解を容易にするため、バーチャルサラウンドを採用したバーチャルサラウンドシステムを説明し、その後、そのバーチャルサラウンドシステムを構成する音像定位制御装置を詳細に説明する。
(サラウンドシステム100、バーチャルサラウンドシステム110)
図1は、5.1サラウンド方式によるサラウンドシステム100の構成を示した模式図である。かかるサラウンドシステム100は、テレビジョン放送を受信して映像および音声を抽出するサラウンド制御装置148と、抽出された映像を表示するモニタ152と、抽出された音声を出力するスピーカ154とを含んで構成される。
5.1サラウンド方式では、受聴者160を囲むようにスピーカ154が複数配置され、例えば、受聴者160の前方センターにセンタースピーカ154aが、その左右にLスピーカ154b、Rスピーカ154cが、受聴者の後方左右にSLスピーカ154d、SRスピーカ154eが配される。また、任意の位置に低域の音声を出力するサブウーファー(LFE:Low Frequency Effect)154fも配されている。かかるサラウンドシステム100により、音の臨場感を向上し、広がりある空間を再現することが可能となる。
図2は、バーチャルサラウンドシステム110の構成を示した模式図である。かかるバーチャルサラウンドシステム110は、音像定位制御装置150と、モニタ152と、音声を出力する2つのスピーカ154とを含んで構成される。
バーチャルサラウンドシステム110では、受聴者160の後方にスピーカを配置することなく、受聴者160の前方に設置した2本のスピーカ(Lスピーカ154b、Rスピーカ154c)によって仮想的なサラウンドを再現する。このバーチャルサラウンドシステム110は、音像を定位するための頭部伝達関数を用いた音像定位技術が採用されている。
バーチャルサラウンドシステム110において、音像定位制御装置150は、モニタ152やスピーカ154と一体的にまたは別体に形成することができる。以下、音像定位制御装置150の具体的な構成と動作を説明する。
(音像定位制御装置150)
図3は、音像定位制御装置150のハードウェア構成を示した機能ブロック図である。音像定位制御装置150は、放送受信部210と、アンテナ212と、映像処理部214と、オーディオ符号化信号抽出部216と、サラウンド判定部218と、復号部220と、相関係数導出部222と、記憶部224と、テーブル抽出部226と、音像定位処理部228と、増幅部230とを含んで構成される。
放送受信部210は、アンテナ212を通じてテレビジョン放送の電波を受信し、その受信した信号を圧縮映像信号と圧縮音声信号とに分離する。
映像処理部214は、放送受信部210が受信した圧縮映像信号を映像信号に変換し、モニタ152に出力する。
オーディオ符号化信号抽出部216は、放送受信部210が受信したテレビジョン信号から音声データ部であるオーディオ符号化信号を抽出する。
サラウンド判定部218は、オーディオ符号化信号抽出部216からのオーディオ符号化信号がサラウンド(3チャンネル以上のマルチチャンネル信号)に対応しているか否かを判定する。
復号部220は、オーディオ符号化信号を復号し、リニアPCM信号を生成する。
相関係数導出部222は、サラウンド判定部218が当該音声がサラウンド放送に対応していると判定した場合に、リニアPCM信号のセンターチャンネルおよびL/Rチャンネルを抽出し、センターチャンネルとL/Rチャンネルとの相関係数を導出する。以下、理解を容易にするため、リニアPCM信号を単に音声信号という。
通常、映画等においては、任意の数、任意の位置に音像を想定することができ、また、そのような複数の音像が受聴者の臨場感を向上させる。一方、ニュース番組やスポーツ中継等における単音声は単一かつ中央一カ所の音像を想定すればよく、またそのようにすべきである。
ここでは、相関係数導出部222によって、センターチャンネルとL/Rチャンネルとの相関係数を導出し、その相関係数が高い音声は、単一かつ中央一カ所の音像から発せられた単音声と見なし、その後、その音声が明瞭になる係数群に基づく頭部伝達関数を用いて音声を出力している。逆に、相関係数が低い音声は、単音声ではないと見なし、臨場感のある通常の頭部伝達関数を用いて音声を出力する。かかる構成により、コンテンツの種類に拘わらず、また、台詞やアナウンス等の単音声がL/Rチャンネルに含まれている場合においても、明瞭な音声による聴感の向上を図ることが可能となる。
図4は、相関係数導出部222の動作を説明するための音声信号時間波形図である。相関係数導出部222は、図4の(a)上段に示したセンターチャンネルの音声信号と、図4(a)の下段に示したL/Rチャンネルの音声信号とを時間軸上の変量として相関を求める。かかるL/Rチャンネルの音声信号は、Lチャンネルの音声信号とRチャンネルの音声信号の平均値((L+R)/2)である。
ここで、Lチャンネルの音声信号とRチャンネルの音声信号の平均値((L+R)/2)としたのは、平均値((L+R)/2)とセンターチャンネルとが相関があれば、LチャンネルとRチャンネルとは当然相関がとれており、改めて相関をとる必要がなく、また、センターチャンネルとの相関計算対象をLチャンネルおよびRチャンネルそれぞれとせず、平均値((L+R)/2)とすることで、計算処理を1回に抑えることができるからである。
一般に、2つの変量x、yが与えられたとき相関係数Rxyは、数式1から求められる。
Figure 2010118977
…(数式1)
このようにして導出される相関係数Rxyは、−1≦Rxy≦1の値をとり、その絶対値が1に近いほど相関が強く、0に近ければ相関が弱いということになる。例えば、図4(a)における(b)の領域を拡大した図4(b)では、センターチャンネルの音声信号とL/Rチャンネルの音声信号とが相異するので相関係数は低くなり、逆に、図4(a)における(c)の領域を拡大した図4(c)では、センターチャンネルの音声信号とL/Rチャンネルの音声信号とが近似しているので相関係数も高くなる。かかる相関係数Rxyは、音像定位処理に利用する頭部伝達関数の係数、即ち、直接音および反射音のゲイン調整の指標として用いられる。
また、相関係数導出部222は、センターチャンネルおよびL/Rチャンネルに所定周波数帯域の帯域通過フィルタを施した後、相関係数を導出してもよい。
図5は、周波数領域における音声の音圧レベルの分布を模式的に表した説明図である。本実施形態の目的は、対象となる音声が単音声である場合にその音声を明瞭化することである。そこで、相関係数を導出する対象を人の音声に絞ることを考える。人の音声(音圧レベル)の周波数帯域は、図5に示すように、200〜4000Hzがほとんどを占める。従って、相関係数の計算対象を、帯域通過フィルタを通じて200〜4000Hzに制限することで、背景音等音声以外の成分を排除または低減でき、音声に限った相関係数導出精度の向上を図ることもできる。また、相関をとる範囲が限定されるので、相関係数導出負荷を軽減でき、計算処理自体を短時間で遂行することが可能となる。
記憶部224は、ROM、RAM、EPROM、不揮発性RAM、フラッシュメモリ、HDD等で構成され、制御部で処理されるプログラムや音声データ等を記憶する。また、記憶部224は、相関係数と頭部伝達関数の係数群とを関連付けたテーブルを記憶する。
本実施形態は、相関係数に応じて、その音声を単音声か否か判断するだけでなく、単音声である確からしさ、即ち相関係数の値に比例して明瞭度を上げ、臨場感を落とす。従って、相関係数の値に応じて頭部伝達関数の係数群を変更することとなる。この目的を達成するためには、本来、係数群の各係数を相関係数の関数にするのが望ましいが、その関数の導出に過大な労力を要し、また、複数段階の対応付けのみであっても十分に本願の目的を達成できることから、ここでは、テーブルによる複数段階の対応付けによって、相関係数と頭部伝達関数の係数群とを関連付ける。
図6は、記憶部224に記憶されたテーブル250の一例を示した説明図である。ここでは、左欄の相関係数252に頭部伝達関数の係数群254が関連付けられる。また、かかるテーブル250に示された頭部伝達関数(1)、(2)、(3)は、図9を用いて後述する直接音ゲイン、初期反射音ゲイン、残響音ゲインに対応している。かかる頭部伝達関数の係数群254は後ほど詳述する。
テーブル抽出部226は、相関係数導出部222が導出した相関係数252に応じてテーブル250から頭部伝達関数の係数群254を抽出する。こうして、相関係数252に基づいて、頭部伝達関数を一意に形成することができる。
また、スピーカ154が音像定位制御装置150やモニタ152と別体に形成され、かつ、その位置を変更可能な場合、受聴者160は、図2のように、任意のスピーカ配置でその音声を聞くことになる。上述した頭部伝達関数は、受聴者の頭(両耳)とスピーカとの位置関係によって変化する。そのため、複数のスピーカの任意の配置に対して複数の頭部伝達関数を準備する。そして、記憶部224は、スピーカの配置に対応したかかる複数の頭部伝達関数およびそれに対応したテーブル250を記憶する。
テーブル抽出部226は、かかる記憶部224に記憶された複数の頭部伝達関数のうち、受聴者160からの選択入力に応じて選択決定された頭部伝達関数の係数群254を抽出する。受聴者160は、スピーカ154の位置に応じた最適な頭部伝達関数を選択することで、より適切に明瞭な音声を得ることが可能となる。
音像定位処理部228は、テーブル抽出部226が抽出した係数群254を反映した頭部伝達関数によって音像定位処理を実行する。ここでは、5.1サラウンド方式の各チャンネルを、複数のスピーカ、例えば、2つのスピーカに出力するため、バーチャルサウンド方式の音声信号に変換する。
図7は、音像定位処理部228の構成例を示した制御ブロック図である。図7の制御ブロック図においては、入力された5.1chのサラウンド音源を表す音声信号が頭部伝達関数ブロック270に伝達され、頭部伝達関数ブロック270における畳み込み処理を受け、加算器272で音声合成されて最終的に2chバーチャルサラウンドの音声信号として出力される。ここで、頭部伝達関数(1)、(2)、(3)は、図9を用いて後述する直接音ゲイン、初期反射音ゲイン、残響音ゲインに対応している。また、本実施形態では、直接音、初期反射音、残響音の3つの対象に対してそれぞれ頭部伝達関数ブロック270を設けているが、これらを混合した1つのブロックで処理を行うことも可能である。
図8は、図7の頭部伝達関数ブロック270の内部構成を示した制御ブロック図である。図8の制御ブロック図においては、まず、入力された5chのサラウンド音源を表す音声信号がディレイ280を通じて遅延処理され、LチャンネルとRチャンネルそれぞれに関してFIRフィルタ282によるフィルタ処理が施される。そして、加算器272で音声合成されて2chのバーチャルサラウンドの音声信号として出力される。
かかる頭部伝達関数ブロック270におけるディレイ280は、図9を用いて後述する初期反射音遅延量、残響音遅延量に対応している。直接音は遅延量が生じないので、直接音に関する頭部伝達関数ブロック270のディレイ280は省略することができる。また、本実施形態では頭部伝達関数としてFIR(Finite Impulse Response)フィルタを用いているが、IIR(Infinite Impulse Response)を用いることもできる。
5.1サラウンド方式の音声信号を2chのバーチャルサラウンドで再現するには、図2に示すように、受聴者160の前方に準備された2つのスピーカ154から発する音声を生成するため、頭部伝達関数(ターゲット用頭部伝達関数)5ch×2、およびスピーカの配置に対応した頭部伝達関数(再生用頭部伝達関数)4(両耳×2)が必要である。ここで、再生用頭部伝達関数は、受聴者160がスピーカの位置(音源)を認識させないようにするためのキャンセル信号である。
ここで、頭部伝達関数は、係数群254によって、音声信号の直接音と反射音とをそれぞれ独立して調整できる。従って、音像定位処理部228は、テーブル抽出部226が抽出した係数群254によって、直接音と反射音とをそれぞれ独立に制御できることとなる。
図9は、頭部伝達関数のインパルス応答を示した音声信号時間波形図である。かかるインパルス応答は、コンサートホールにおいて測定されており、前半のピークは直接音部分であり、次に壁、天井、床などから跳ね返った初期反射音(反射音)が続き、その後は残響音と呼ばれる副次的反射音が分布している。臨場感は、主として初期反射音や残響音の効果によって感じ取られている。
このように、頭部伝達関数を通じたインパルス応答を時間領域で見ると、その応答波形を直接音と反射音とに区別することができる。本実施形態では、頭部伝達関数における直接音と反射音との係数を調整し、直接音に対する反射音の比を下げることで、反射による残響を抑制する。具体的には、直接音と初期反射音(反射音)とが区別され、直接音ゲイン、初期反射音のゲインや直接音に対する遅延量、初期反射音以降の残響音のゲインや初期反射音に対する遅延量がそれぞれ独立して調整される。
上述した初期反射音や残響音のゲインの調整では、頭部伝達関数の測定条件や再現したい空間の広さ等にも影響されるが、一般に、測定時の直接音と反射音の比率に対して、反射音の比率を低くすると音声がより明瞭になり、高くすると、音声の臨場感が高くなる。具体的な処理方法の例として、直接音成分はその値を維持し、前述の相関係数252の絶対値(0〜1)を1から減算した値を、反射成分である初期反射音および残響音にゲイン係数として掛け合わせる。こうして、相関係数252が1に近い単音声では反射成分が抑えられ、直接音主体の明瞭性を持った音声信号を得る事ができる。
ここでは、初期反射音と残響音を区別して処理しているが、一連の波形として処理することもでき、また処理量軽減のため残響音部分を省略することもできる。また音像定位処理は時間軸信号をそのまま畳み込む方法と周波数軸上で畳み込む方法があり、一般的に周波数軸上の畳み込み演算の方が時間軸に比べて処理量を抑えられるが、いずれの方法であっても本実施形態の目標を達成することができ、どちらを利用するかは任意に決めることができる。
増幅部230は、音像定位処理部228によって変換された、バーチャルサウンド方式の音声信号をスピーカ154に出力可能な信号レベルに増幅する。
以上説明した音像定位制御装置150によって、コンテンツの種類に拘わらず、また、台詞やアナウンス等の単音声がL/Rチャンネルに含まれている場合においても、明瞭な音声による聴感の向上を図ることが可能となる。
(音像定位制御方法)
次に、上述した音像定位制御装置150を用いて、サラウンドに対応したテレビジョン放送に対して音像定位処理を施す音像定位制御方法を具体的に説明する。
図10は、音像定位制御方法の処理の流れを説明したフローチャートである。音像定位制御装置150の放送受信部210がテレビジョン放送を受信すると(S300のYES)、サラウンド判定部218は、放送受信部210が受信したテレビジョン放送の音声信号がサラウンドに対応しているか否かを判定し(S302)、サラウンドに対応していると判定されると(S302のYES)、相関係数導出部222は、当該音声信号のセンターチャンネルおよびL/Rチャンネルを抽出し、センターチャンネルとL/Rチャンネルとの相関係数252を導出する(S304)。
そして、テーブル抽出部226は、相関係数導出部222が導出した相関係数252に応じて、記憶部224に記憶されたテーブルから頭部伝達関数の係数群254を抽出し(S306)、音像定位処理部228は、抽出された係数群254を反映した頭部伝達関数によって音像定位処理を実行する(S308)。そして、その音像定位処理が行われた音声信号は、スピーカ154を通じて受聴者160に提供される(S310)。
かかる音像定位制御方法によっても、コンテンツの種類に拘わらず、また、台詞やアナウンス等の単音声がL/Rチャンネルに含まれている場合においても、明瞭な音声による聴感の向上を図ることが可能となる。
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
また、上述した実施形態において、明瞭さが求められる番組か否かの判定は、相関係数導出部222のみが行っているが、かかる場合に限られず、例えば、直接、コンテンツの種類を示す情報を受信し、受信したコンテンツの種類がニュース番組等明瞭さを求められる番組の場合、相関係数導出部222の導出した相関係数に拘わらず、音像定位処理の係数群を固定するとしてもよい。
なお、本明細書の音像定位制御方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。
本発明は、サラウンドに対応したテレビジョン放送に対して音像定位処理を施す音像定位制御装置および音像定位制御方法に利用することができる。
5.1サラウンド方式によるサラウンドシステムの構成を示した模式図である。 バーチャルサラウンドシステムの構成を示した模式図である。 音像定位制御装置のハードウェア構成を示した機能ブロック図である。 相関係数導出部の動作を説明するための音声信号時間波形図である。 周波数領域における音声の音圧レベルの分布を模式的に表した説明図である。 記憶部に記憶されたテーブルの一例を示した説明図である。 音像定位処理部の構成例を示した制御ブロック図である。 図7の頭部伝達関数ブロックの内部構成を示した制御ブロック図である。 頭部伝達関数のインパルス応答を示した音声信号時間波形図である。 音像定位制御方法の処理の流れを説明したフローチャートである。
符号の説明
150 …音像定位制御装置
152 …モニタ
154 …スピーカ
210 …放送受信部
216 …オーディオ符号化信号抽出部
218 …サラウンド判定部
222 …相関係数導出部
224 …記憶部
226 …テーブル抽出部
228 …音像定位処理部
250 …テーブル
252 …相関係数
254 …係数群

Claims (6)

  1. テレビジョン放送を受信可能な放送受信部と、
    前記放送受信部が受信したテレビジョン放送の音声信号がサラウンドに対応しているか否かを判定するサラウンド判定部と、
    サラウンドに対応していると判定された場合に、前記音声信号のセンターチャンネルおよびL/Rチャンネルを抽出し、前記センターチャンネルとL/Rチャンネルとの相関係数を導出する相関係数導出部と、
    相関係数と頭部伝達関数の係数群とを関連付けたテーブルを記憶する記憶部と、
    前記相関係数導出部が導出した相関係数に応じて前記テーブルから頭部伝達関数の係数群を抽出するテーブル抽出部と、
    前記抽出された係数群を反映した頭部伝達関数によって音像定位処理を実行する音像定位処理部と、
    を備えることを特徴とする音像定位制御装置。
  2. 前記頭部伝達関数は、前記係数群によって、前記音声信号の直接音と反射音とをそれぞれ独立して調整できることを特徴とする請求項1に記載の音像定位制御装置。
  3. 前記記憶部は、スピーカの配置に対応した複数の頭部伝達関数に対応したテーブルを含み、
    前記テーブル抽出部は、前記複数の頭部伝達関数のうち、スピーカの配置に応じて選択決定された頭部伝達関数の係数群を抽出することを特徴とする請求項1または2に記載の音像定位制御装置。
  4. 前記相関係数導出部は、前記センターチャンネルおよびL/Rチャンネルに所定周波数帯域の帯域通過フィルタを施した後、前記相関係数を導出することを特徴とする請求項1から3のいずれか1項に記載の音像定位制御装置。
  5. 前記所定周波数帯域は、200〜4000Hzであることを特徴とする請求項4に記載の音像定位制御装置。
  6. テレビジョン放送を受信し、
    前記受信したテレビジョン放送の音声信号がサラウンドに対応しているか否かを判定し、
    サラウンドに対応していると判定された場合に、前記音声信号のセンターチャンネルおよびL/Rチャンネルを抽出し、前記センターチャンネルとL/Rチャンネルとの相関係数を導出し、
    前記相関係数導出部が導出した相関係数に応じて、相関係数と頭部伝達関数の係数群とを関連付けたテーブルから頭部伝達関数の係数群を抽出し、
    前記抽出された係数群を反映した頭部伝達関数によって音像定位処理を実行することを特徴とする音像定位制御方法。
JP2008291799A 2008-11-14 2008-11-14 音像定位制御装置および音像定位制御方法 Pending JP2010118977A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008291799A JP2010118977A (ja) 2008-11-14 2008-11-14 音像定位制御装置および音像定位制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008291799A JP2010118977A (ja) 2008-11-14 2008-11-14 音像定位制御装置および音像定位制御方法

Publications (1)

Publication Number Publication Date
JP2010118977A true JP2010118977A (ja) 2010-05-27

Family

ID=42306325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008291799A Pending JP2010118977A (ja) 2008-11-14 2008-11-14 音像定位制御装置および音像定位制御方法

Country Status (1)

Country Link
JP (1) JP2010118977A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2445234A3 (en) * 2010-10-19 2014-04-09 Samsung Electronics Co., Ltd. Image processing apparatus, sound processing method used for image processing apparatus, and sound processing apparatus
JP2021013128A (ja) * 2019-07-09 2021-02-04 オンキヨーホームエンターテイメント株式会社 信号処理装置、及び、信号処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2445234A3 (en) * 2010-10-19 2014-04-09 Samsung Electronics Co., Ltd. Image processing apparatus, sound processing method used for image processing apparatus, and sound processing apparatus
JP2021013128A (ja) * 2019-07-09 2021-02-04 オンキヨーホームエンターテイメント株式会社 信号処理装置、及び、信号処理方法
JP7394549B2 (ja) 2019-07-09 2023-12-08 オンキヨーテクノロジー株式会社 信号処理装置、及び、信号処理方法

Similar Documents

Publication Publication Date Title
US10440496B2 (en) Spatial audio processing emphasizing sound sources close to a focal distance
US8254583B2 (en) Method and apparatus to reproduce stereo sound of two channels based on individual auditory properties
KR101569032B1 (ko) 오디오 신호의 디코딩 방법 및 장치
KR102160254B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
US20150358756A1 (en) An audio apparatus and method therefor
JP4327886B1 (ja) 音質補正装置、音質補正方法及び音質補正用プログラム
US7599498B2 (en) Apparatus and method for producing 3D sound
US9930469B2 (en) System and method for enhancing virtual audio height perception
KR20160001712A (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
JPWO2010076850A1 (ja) 音場制御装置及び音場制御方法
KR20160141793A (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
US10999678B2 (en) Audio signal processing device and audio signal processing system
JP5787128B2 (ja) 音響システム、音響信号処理装置および方法、並びに、プログラム
JP5038145B2 (ja) 定位制御装置、定位制御方法、定位制御プログラムおよびコンピュータに読み取り可能な記録媒体
KR20050064442A (ko) 이동통신 시스템에서 입체음향 신호 생성 장치 및 방법
CN103718573A (zh) 具有改善的通道分离的矩阵编码器
JP6569571B2 (ja) 信号処理装置及び信号処理方法
JP2001296894A (ja) 音声処理装置および音声処理方法
JP2010118978A (ja) 音像定位制御装置および音像定位制御方法
JP2010118977A (ja) 音像定位制御装置および音像定位制御方法
JP3740780B2 (ja) マルチチャンネル再生装置
JP5194614B2 (ja) 音場形成装置
KR102217832B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
JP4430105B2 (ja) 音響再生装置
JP2008147840A (ja) 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム