JPWO2019064719A1 - 音響信号処理装置および音響信号処理方法 - Google Patents

音響信号処理装置および音響信号処理方法 Download PDF

Info

Publication number
JPWO2019064719A1
JPWO2019064719A1 JP2019544249A JP2019544249A JPWO2019064719A1 JP WO2019064719 A1 JPWO2019064719 A1 JP WO2019064719A1 JP 2019544249 A JP2019544249 A JP 2019544249A JP 2019544249 A JP2019544249 A JP 2019544249A JP WO2019064719 A1 JPWO2019064719 A1 JP WO2019064719A1
Authority
JP
Japan
Prior art keywords
signal
dialog
unit
signal processing
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019544249A
Other languages
English (en)
Other versions
JP6988904B2 (ja
Inventor
宮阪 修二
修二 宮阪
一任 阿部
一任 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Socionext Inc
Original Assignee
Socionext Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Socionext Inc filed Critical Socionext Inc
Publication of JPWO2019064719A1 publication Critical patent/JPWO2019064719A1/ja
Application granted granted Critical
Publication of JP6988904B2 publication Critical patent/JP6988904B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/10Means associated with receiver for limiting or suppressing noise or interference
    • H04B1/1018Means associated with receiver for limiting or suppressing noise or interference noise filters connected between the power supply and the receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Stereophonic System (AREA)

Abstract

本開示の音響信号処理装置は、正面チャンネル信号である第1信号を信号処理することで第1L信号と第1R信号とを生成する正面信号処理部(101A)と、左側チャンネル信号である第2信号と、第1L信号とを加算した信号を、左側チャンネル信号である第4信号とする第1加算部(102)と、右側チャンネル信号である第3信号と、第1R信号とを加算した信号を、側チャンネル信号である第5信号とする第2加算部(103)とを備える。正面信号処理部(101A)は、第1信号がダイアログ信号である場合、第1信号を分配し、所定の位置に定位させるように信号処理し、第1信号がダイアログ信号でない場合、第1信号を分配して所定の位置と異なる位置に定位させるように信号処理することで第1L信号および第1R信号を生成する。

Description

本開示は、音響信号処理装置および音響信号処理方法に関し、特にマルチチャンネルの音響信号の信号処理を行う音響信号処理装置および音響信号処理方法に関する。
ドラマ、映画等の映像および音響コンテンツを家庭用のテレビ受信機などで視聴する際に、会話およびセリフ等のダイアログが背景音に埋もれてしまい聞き取りにくいという問題があり、ダイアログの聴こえ方の改善が求められている。
それに対して、22.2chのマルチチャンネル放送において、所定のチャンネルをダイアログ専用に設定し、再生側で、当該チャンネルの音響信号を選択的に増減できる技術がある(例えば非特許文献1参照)。非特許文献1に記載の技術によれば、ダイアログのみの音量を大きくすることでダイアログの聞き取り易さを向上できる。
杉本岳大、外2名、「MPEG−4 AACを用いた22.2ch音声符号化・復号装置の開発」、NHK技研 R&D/No.155/2016.1、p.40―46
しかしながら、非特許文献1に提案される技術によりダイアログの音量を大きくしたとしてもダイアログが背景音の中に埋もれていることには変わりがない。そのため、ダイアログの音量を大きくすることが必ずしもダイアログの聴こえ方の改善につながらない場合もある。特に高齢者に多くみられるオーバーリクルートメントの症状を持つリスナーに対しては、音量が大きくなることで音声が過剰に煩わしく感じられると言われている。
また、22.2chの音響システムは、24個のスピーカを前提とした音響システムであるが、現実の視聴者の居住環境を鑑みれば、22.2chより少ない、例えば2個のスピーカでダイアログの聴こえ方の改善を行う必要がある。
本開示は、上述の事情を鑑みてなされたもので、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる音響信号処理装置および音響信号処理方法を提供することを目的とする。
本開示の一形態に係る音響信号処理装置は、マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理装置であって、前記入力信号群を構成する正面チャンネル信号である第1信号がダイアログ信号であるか否かを示す第1ダイアログフラグが格納されているフラグ格納部と、前記第1信号を信号処理して第1L信号および第1R信号を生成する正面信号処理部と、前記入力信号群を構成する左側チャンネル信号である第2信号と、前記第1L信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第4信号とする第1加算部と、前記入力信号群を構成する右側チャンネル信号である第3信号と、前記第1R信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第5信号とする第2加算部とを備え、前記正面信号処理部は、前記第1信号がダイアログ信号であることを前記第1ダイアログフラグが示す場合、前記第1信号を分配し、所定の位置に定位させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成する第1音像定位部と、前記第1信号がダイアログ信号でないことを前記第1ダイアログフラグが示す場合、前記第1信号を分配し、前記所定の位置と異なる位置に定位させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成する第2音像定位部とを有する。
これにより、ダイアログ信号である第1信号の音像は、入力信号のチャンネル数より少ないスピーカ数でダイアログ信号でない第2信号および第3信号の音像と異なるところに定位されるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
また、例えば、前記第1音像定位部は、前記第1信号を分配し、位相差が90度から270度の範囲となるように位相を回転させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成し、前記第2音像定位部は、前記第1信号を分配し、位相差が‐90度から90度の範囲となるように位相を回転させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成するとしてもよい。
これにより、ダイアログ信号である第1信号の音像は、入力信号のチャンネル数より少ないスピーカ数でリスナーの頭内に(リスナーの近くに)定位したかのように聞こえるので、リスナーはダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
また、例えば、前記正面信号処理部は、さらに、ダイナミックレンジを圧縮する信号処理を行うダイナミックレンジ圧縮部を有し、前記正面信号処理部は、前記第1信号がダイアログ信号であることを前記第1ダイアログフラグが示す場合、前記ダイナミックレンジ圧縮部に前記第1信号のダイナミックレンジを圧縮させて前記第1音像定位部に出力させ、前記第1音像定位部に、ダイナミックレンジが圧縮された前記第1信号を分配し、所定の位置に定位させるように信号処理することにより、前記第1L信号および前記第1R信号を生成するとしてもよい。
これにより、ダイアログの聴こえ方を音像定位の面および音量面で改善でき、ダイアログ以外の背景音を原音のまま維持できる。さらに、正面チャンネル信号を削減できるので、正面用のスピーカが不要となる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
また、例えば、前記フラグ格納部は、さらに、前記第2信号がダイアログ信号であるか否かを示す第2ダイアログフラグと、前記第3信号がダイアログ信号であるか否かを示す第3ダイアログフラグとが格納されており、前記音響信号処理装置は、さらに、前記第2信号を信号処理して第2L信号および第2R信号を生成する左側信号処理部と、前記第3信号を信号処理して第3L信号および第3R信号を生成する右側信号処理部とを備え、前記左側信号処理部は、前記第2信号がダイアログ信号であることを前記第2ダイアログフラグが示す場合、前記第2信号を分配し、リスナーの左側に定位させる信号処理を行うことにより、前記第2L信号および前記第2R信号を生成する第1左定位部と、前記第2信号がダイアログ信号でないことを前記第2ダイアログフラグが示す場合、前記第2信号を前記第1左定位部が定位させる位置と異なる位置に定位させる信号処理を行うことにより、前記第2L信号および前記第2R信号を生成する第2左定位部とを有し、前記右側信号処理部は、前記第3信号がダイアログ信号であることを前記第3ダイアログフラグが示す場合、前記第3信号を分配し、前記リスナーの右側に定位させる信号処理を行うことにより、前記第3L信号および前記第3R信号を生成する第1右定位部と、前記第3信号がダイアログ信号でないことを前記第3ダイアログフラグが示す場合、前記第3信号を前記第1右定位部が定位させる位置と異なる位置に定位させる信号処理を行うことにより、前記第3L信号および前記第3R信号を生成する第2右定位部と、を有し、前記第1加算部は、前記第1L信号、前記第2L信号および前記第3L信号を加算した信号を前記第4信号とし、前記第2加算部は、前記第1R信号、前記第2R信号および前記第3R信号を加算した信号を前記第5信号とするとしてもよい。
これにより、ダイアログ信号である第2信号の音像は、ダイアログ信号でない第2信号の音像と比較して、リスナーの近いところに定位したかのように聞こえるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。同様に、ダイアログ信号である第3信号の音像は、ダイアログ信号でない第3信号の音像と比較して、リスナーの近いところに定位したかのように聞こえるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
また、例えば、前記第1左定位部は、分配した前記第2信号にクロストークキャンセル処理を施して、前記リスナーの左側に第2信号の音像を定位させる信号処理を行うことにより、前記第2L信号および前記第2R信号を生成し、前記第2左定位部は、前記第2信号にクロストークキャンセル処理を施さずに、前記リスナーの左側に前記第2信号の音像を定位させる信号処理を行うことにより、前記第2L信号および前記第2R信号を生成し、前記第1右定位部は、前記第3信号にクロストークキャンセル処理を施して、前記リスナーの右側に前記第3信号の音像を定位させる信号処理を行うことにより、前記第3L信号および前記第3R信号を生成し、前記第2右定位部は、前記第3信号にクロストークキャンセル処理を施さずに、前記リスナーの右側に前記第3信号の音像を定位させる信号処理を行うことにより、前記第3L信号および前記第3R信号を生成するとしてもよい。
これにより、ダイアログ信号である第2信号の音像は、リスナーの左耳元に定位したかのように聞こえるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。同様に、ダイアログ信号である第3信号の音像は、リスナーの右耳元に定位したかのように聞こえるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
また、例えば、前記音響信号処理装置は、さらに、複数のスピーカ位置それぞれから前記リスナーの両耳に至る音の伝達関数が、スピーカ位置ごとに格納されている伝達関数群格納テーブルと、前記第2信号および前記第3信号に割り当てられているスピーカ位置を特定するスピーカ位置情報が格納されている位置情報格納部と、を備え、前記第1左定位部は、前記位置情報格納部から前記第2信号に割り当てられている第1スピーカ位置を特定し、特定した第1スピーカ位置と前記伝達関数群格納テーブルとから前記第1スピーカ位置と前記リスナーの両耳の間の第1伝達関数を取得し、前記第2信号に前記第1伝達関数の処理を施した上でクロストークキャンセル処理を施すことにより、前記リスナーの左側に音像を定位させる信号処理を行い、前記第1右定位部は、前記位置情報格納部から前記第3信号に割り当てられている第2スピーカ位置を特定し、特定した第2スピーカ位置と前記伝達関数群格納テーブルとから前記第2スピーカ位置と前記リスナーの両耳の間の第2伝達関数を取得し、前記第3信号に前記第2伝達関数の処理を施した上でクロストークキャンセル処理を施すことにより、前記リスナーの右側に音像を定位させる信号処理を行うとしてもよい。
これにより、例えば2チャンネルスピーカしかない再生環境であっても、第2信号および/または第3信号がダイアログである場合、これらの信号に対してもともと意図されたスピーカ位置から当該信号が聴こえるようにできるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
また、本開示の一態様に係る音響信号処理装置は、マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理装置であって、前記入力信号群を構成する正面チャンネル信号である第1信号がダイアログ信号であるか否かを示す第1ダイアログフラグが格納されている第1フラグ格納部と、前記第1信号を信号処理して第1L信号と第1R信号とを生成する正面信号処理部と、前記入力信号群を構成する左側チャンネル信号である第2信号と、前記第1L信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第4信号とする第1加算部と、前記入力信号群を構成する右側チャンネル信号である第3信号と、前記第1R信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第5信号とする第2加算部と、を備え、前記正面信号処理部は、ダイナミックレンジを圧縮する信号処理を行うダイナミックレンジ圧縮部を有し、前記正面信号処理部は、前記第1信号がダイアログ信号であることを前記第1ダイアログフラグが示す場合、前記ダイナミックレンジ圧縮部により前記第1信号のダイナミックレンジが圧縮された信号を分配することで前記第1L信号および前記第1R信号を生成し、前記正面信号処理部は、前記第1信号がダイアログ信号でないことを前記第1ダイアログフラグが示す場合、前記第1信号を分配することで前記第1L信号および前記第1R信号を生成する。
これにより、ダイアログ信号である第1信号に対して補聴器の処理と同様のダイナミックレンジ圧縮処理が行われるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
また、本開示の一態様に係る音響信号処理方法は、マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理方法であって、前記入力信号群を構成する正面チャンネル信号である第1信号を信号処理して第1L信号および第1R信号を生成する正面信号処理ステップと、前記入力信号群を構成する左側チャンネル信号である第2信号と、前記第1L信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第4信号とする第1加算ステップと、前記入力信号群を構成する右側チャンネル信号である第3信号と、前記第1R信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第5信号とする第2加算ステップとを含み、前記正面信号処理ステップでは、前記第1信号がダイアログ信号であるか否かを示す第1ダイアログフラグにより前記第1信号がダイアログ信号であると示される場合、前記第1信号を分配し、所定の位置に定位させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成する第1音像定位ステップと、前記第1ダイアログフラグにより前記第1信号がダイアログ信号でないと示される場合、前記第1信号を分配し、前記所定の位置と異なる位置に定位させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成する第2音像定位ステップとを含む。
これにより、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
なお、これらの包括的又は具体的な態様は、システム、方法、集積回路、コンピュータプログラム又はコンピュータで読み取り可能なCD−ROMなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。
本開示の音響信号処理装置等によれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
図1は、実施の形態1に係るシステムの構成の一例を示すブロック図である。 図2は、実施の形態1に係る入力処理部の構成の一例を示すブロック図である。 図3は、放送番組のストリームの構造の一例を示す図である。 図4は、実施の形態1に係る音響信号処理装置の機能をソフトウェアにより実現するコンピュータのハードウェア構成の一例を示す図である。 図5は、実施の形態1に係る音響信号処理装置の構成の一例を示す図である。 図6は、実施の形態1に係る正面信号処理部の詳細構成の一例を示す図である。 図7は、実施の形態1に係る音響信号処理装置の動作を示すフローチャートである。 図8は、実施の形態2に係る正面信号処理部の詳細構成の一例を示す図である。 図9は、実施の形態2に係る音響信号処理装置の動作を示すフローチャートである。 図10Aは、実施の形態2に係る効果を説明するための図である。 図10Bは、実施の形態2に係る効果を説明するための図である。 図11は、実施の形態2の変形例に係る正面信号処理部の詳細構成の一例を示す図である。 図12は、クロストークキャンセル処理を説明するための図である。 図13は、実施の形態3に係る音響信号処理装置の構成の一例を示す図である。 図14は、実施の形態3に係る左側信号処理部の詳細構成の一例を示す図である。 図15は、実施の形態3に係る右側信号処理部の詳細構成の一例を示す図である。 図16Aは、実施の形態3に係る効果を説明するための図である。 図16Bは、実施の形態3に係る効果を説明するための図である。 図17は、仮想音像定位の処理を説明するための図である。 図18は、22.2ch規格における伝達関数群格納テーブルの一例を示す図である。 図19は、実施の形態4に係る音響信号処理装置の構成の一例を示す図である。 図20は、実施の形態4に係る左側信号処理部の詳細構成の一例を示す図である。 図21は、実施の形態4に係る右側信号処理部の詳細構成の一例を示す図である。 図22Aは、実施の形態4に係る効果を説明するための図である。 図22Bは、実施の形態4に係る効果を説明するための図である。 図23Aは、22.2ch規格におけるスピーカ位置を示す図である。 図23Bは、22.2ch規格におけるスピーカ位置と各スピーカ位置のチャンネルラベルを示す図である。 図23Cは、22.2ch規格におけるスピーカ位置と各スピーカ位置のチャンネルラベルを示す図である。 図23Dは、22.2ch規格におけるスピーカ位置と各スピーカ位置のチャンネルラベルを示す図である。 図24は、非特許文献1におけるダイアログチャンネルの一例を示す図である。 図25は、非特許文献1におけるダイアログ音量用のユーザーインターフェースの一例を示す図である。
(本開示の基礎となった知見)
ARIB標準規格STD−B32において22.2ch(22.2チャンネルch)の音声圧縮方式が規格化されている。この22.2chの音声圧縮方式は、8Kスーパーハイビジョン放送における音声方式として実用化されることになっている。
22.2ch規格では、スピーカの配置(スピーカ位置)と各スピーカの位置の名称(チャンネルラベル)とが規定されている。図23Aは、22.2ch規格におけるスピーカ位置を示す図である。図23B〜図23Dは、22.2ch規格におけるスピーカ位置と各スピーカ位置のチャンネルラベルを示す図である。図23Bには天井レベルである上層の、図23Cには視聴者の視点のレベルである中層の、図23Dには床レベルである下層のスピーカの配置とチャンネルラベルがそれぞれ示されている。つまり、22.2ch規格では、上層に9個、中層に10個、下層に3個で構成される計22個の通常スピーカと、下層に2個で構成されるサブウーファー(低音用スピーカ)とが配置されることになる。
また、22.2ch規格では、放送事業者は、放送番組ごとに22.2chのチャンネル構成の中で「ダイアログチャンネル」を指定することができる。つまり、放送事業者は、ダイアログチャンネルの個数および位置を、放送番組ごとに設定できる。
図24は、非特許文献1におけるダイアログチャンネルの一例を示す図である。図24には、非特許文献1においてダイアログ専用に設定されたチャンネルであるダイアログチャンネルの一例が示されており、中層の正面チャンネル(FC)と下層の正面チャンネル(BtFC)とが、ダイアログチャンネルとして設定された例が示されている。
また、ダイアログチャンネルではダイアログ成分だけが伝送される。22.2chのチャンネル構成の中でどのチャンネルがダイアログチャンネルとして指定されているかは、放送番組ごとにそれを示すフラグが伝送されるので、受信端末側でダイアログチャンネルを特定できる。
受信端末側では、伝送されたフラグによって指定されたダイアログチャンネルの音量を、他のチャンネルから独立に制御できる。
図25は、非特許文献1におけるダイアログ音量用のユーザーインターフェースの一例を示す図である。図25に示すユーザーインターフェースにより、伝送されたフラグによって指定されたダイアログチャンネルのダイアログのみの音量を増減することができる。
これにより、ダイアログの音量を背景音と独立に増減できるので、視聴者は自身の好みまたは聴力に応じて快適なダイアログの音量を設定できる。さらに、視聴者は、例えばダイアログが聞き取りにくい場合、全体のボリュームを下げた上で、ダイアログのボリュームを上げることで、ダイアログを聞き取り易くすることができる。
このように、非特許文献1に提案される技術によれば、ダイアログのみの音量を大きくすることでダイアログの聞き取り易さを向上できる。
しかしながら、非特許文献1に提案される技術によりダイアログの音量を大きくした場合でもダイアログが背景音の中に埋もれていることには変わりがない。そのため、ダイアログの音量を大きくすることが必ずしもダイアログの聴こえ方の改善につながらない場合もある。特に、リクルートメント現象の症状をもつ視聴者にとっては、ボリュームを上げることが必ずしもダイアログの聴こえ方の改善につながらない。ここで、リクルートメント現象の症状とは、小さい音が聞き取りにくい反面、大きな音は過剰に聴覚を刺激して不快なほど煩く聞こえる、という症状である。
また、22.2chの音響システムは、24個のスピーカを前提とした音響システムである。一方、現実の視聴者の居住環境は、2個のスピーカの音響システムなどである。これらを鑑みると、22.2chとして入力される信号のチャンネル数より少ないチャンネルのスピーカでダイアログの聴こえ方の改善を行うのがよい。
以下、本開示の実施の形態について、図面を用いて詳細に説明する。なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、使用手順、通信手順等は、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、本開示の最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、各図は、必ずしも厳密に図示したものではない。各図において、実質的に同一の構成については同一の符号を付し、重複する説明は省略又は簡略化する。
(実施の形態1)
以下では、図面を参照しながら、実施の形態1に係る音響信号処理装置等の説明を行う。
[システムの構成]
図1は、実施の形態1に係るシステムの構成の一例を示すブロック図である。
図1に示すシステムは、音響信号処理装置10と、入力処理部11と、左側スピーカ12と、右側スピーカ13とを備える。図1に示すシステムは、例えば、TV装置などに搭載される。
音響信号処理装置10は、入力されたマルチチャンネルの音響信号を信号処理して、出力する。マルチチャンネルは、例えば22.2chであるが、5.1chでもよく、3ch以上であればよい。
入力処理部11は、例えばマルチチャンネルの放送番組のストリームが入力され、マルチチャンネルの音響信号である入力信号群とダイアログフラグ情報とを取得して、音響信号処理装置10に伝達する。
左側スピーカ12は、2つのスピーカのうち視聴者またはリスナーからみて左側に位置するスピーカである。図1に示すシステムがTV装置に搭載された場合には、TV装置からリスナーをみてTV装置の右側に配置されることになる。
右側スピーカ13は、2つのスピーカのうち視聴者またはリスナーからみて右側に位置するスピーカである。図1に示すシステムがTV装置に搭載された場合には、TV装置からリスナーをみてTV装置の左側に配置されることになる。
[入力処理部11の構成]
図2は、実施の形態1に係る入力処理部11の構成の一例を示すブロック図である。
図2に示す入力処理部11は、ストリーム解析部111と、音響デコーダ112と、コントローラ113とを備える。
<ストリーム解析部111>
ストリーム解析部111は、入力処理部11に入力されたマルチチャンネルの放送番組のストリームを解析して、ストリームに含まれる音響データを音響デコーダ112に伝達し、ストリームに含まれるダイアログch情報をコントローラ113に伝達する。
図3は、放送番組のストリームの構造の一例を示す図である。
例えば図3に示されるように、マルチチャンネルの放送番組のストリーム50は、ヘッダ51と、映像データが含まれるVideo52と、音響データが含まれるAudio53とで少なくとも構成されている。例えば、Audio53には、マルチチャンネルそれぞれの音響データが含まれている。例えばマルチチャンネルが22.2chであれば、Audio53には、24個のスピーカそれぞれの音響データが含まれる。また、ヘッダ51には、マルチチャンネルのチャンネル数およびマルチチャンネルのどのチャンネルがダイアログであるかを示すダイアログch情報が含まれる。
ストリーム解析部111は、図3に示されるようなマルチチャンネルの放送番組のストリーム50を解析して、Audio53などの音響データを音響デコーダ112に伝達し、ダイアログch情報をコントローラ113に伝達する。
<音響デコーダ112>
音響デコーダ112は、ストリーム解析部111から伝達された音響データを復号したマルチチャンネルの音響信号を音響信号処理装置10に伝達する。図3に示す例では、音響デコーダ112は、ストリーム解析部111から伝達されたAudio53を復号したマルチチャンネルの音響信号を音響信号処理装置10に伝達する。
<コントローラ113>
コントローラ113は、ストリーム解析部111から伝達されたダイアログch情報からダイアログフラグを生成するし音響信号処理装置10に伝達する。例えば、第1のチャネルの信号がダイアログである場合、第1のダイアログフラグを1にし、そうでない場合は、第1のダイアログフラグを0にする、ということである。この処理をそれぞれのチャネルについて行う。
[音響信号処理装置10の構成]
以下、音響信号処理装置10について詳細に説明する。
[コンピュータ1000]
まず、図4を用いて音響信号処理装置10のハードウェア構成について説明する。
図4は、実施の形態1に係る音響信号処理装置10の機能をソフトウェアにより実現するコンピュータ1000のハードウェア構成の一例を示す図である。
コンピュータ1000は、図4に示すように、入力装置1001、出力装置1002、CPU1003、内蔵ストレージ1004、RAM1005、読取装置1007、送受信装置1008およびバス1009を備えるコンピュータである。入力装置1001、出力装置1002、CPU1003、内蔵ストレージ1004、RAM1005、読取装置1007および送受信装置1008は、バス1009により接続される。
入力装置1001は入力ボタン、タッチパッド、タッチパネルディスプレイなどといったユーザインタフェースとなる装置であり、ユーザの操作を受け付ける。なお、入力装置1001は、ユーザの接触操作を受け付ける他、音声での操作、リモコン等での遠隔操作を受け付ける構成であってもよい。
内蔵ストレージ1004は、フラッシュメモリなどである。また、内蔵ストレージ1004は、音響信号処理装置10の機能を実現するためのプログラムおよび/または音響信号処理装置10の機能構成を利用したアプリケーションが、予め記憶されているとしてもよい。
RAM1005は、Random Access Memoryであり、プログラムやアプリケーションの実行に際してデータ等の記憶に利用される。
読取装置1007は、USB(Universal Serial Bus)メモリなどの記録媒体から情報を読み取る。読取装置1007は、上記のようなプログラムやアプリケーションが記録された記録媒体からそのプログラムやアプリケーションを読み取り、内蔵ストレージ1004に記憶させる。
送受信装置1008は、無線又は有線で通信を行うための通信回路である。送受信装置1008は、例えばネットワークに接続されたサーバ装置と通信を行い、サーバ装置から上記のようなプログラムやアプリケーションをダウンロードして内蔵ストレージ1004に記憶させる。
CPU1003は、Central Processing Unitであり、内蔵ストレージ1004に記憶されたプログラムやアプリケーションをRAM1005にコピーし、そのプログラムやアプリケーションに含まれる命令をRAM1005から順次読み出して実行する。
[音響信号処理装置10]
次に、図5および図6を用いて音響信号処理装置10の各機能構成要素について説明する。
図5は、実施の形態1に係る音響信号処理装置10の構成の一例を示す図である。
音響信号処理装置10は、マルチチャンネルの音響信号である入力信号群を信号処理することで、入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する。本実施の形態では、音響信号処理装置10は、図5に示すように、第1フラグ格納部100と、正面信号処理部101と、第1加算部102と、第2加算部103とを備える。
以下では、説明を簡便にするために、入力信号群は、第1信号、第2信号および第3信号で構成され、出力信号群は、第4信号および第5信号で構成されるとして説明する。
<入力信号群>
第1信号は、入力信号群を構成する信号であって正面チャンネルに割り当てられている信号(正面チャンネル信号)であるとする。第1信号は、例えば22.2ch規格におけるFCに割り当てられる信号であるが、これに限らない。第1信号は、左右どちらにも偏っていないスピーカ位置に割り当てられる信号であればよく、22.2ch規格におけるBtFC、TcFC、BC、TpCまたはTpBCに割り当てられる信号であってもよい。
第2信号は、入力信号群を構成する信号であって左側チャンネルに割り当てられている信号(左側チャンネル信号)であるとする。第2信号は、例えば22.2ch規格におけるFLcに割り当てられる信号であるが、これに限らない。第2信号は、左側に偏っているスピーカ位置に割り当てられる信号であればよく、22.2ch規格におけるBtFL、FL、SiL、BL、TpFL、TpSiLまたはTpBLに割り当てられる信号であってもよい。
第3信号は、入力信号群を構成する信号であって右側チャンネルに割り当てられている信号(右側チャンネル信号)であるとする。第3信号は、例えば、22.2ch規格におけるFRcに割り当てられる信号であるが、これに限らない。第3信号は、右側に偏っているスピーカ位置に割り当てられる信号であればよく、22.2ch規格におけるBtFR、FR、SiR、BR、TpFR、TpSiRまたはTpBRに割り当てられる信号であってもよい。
<出力信号群>
第4信号は、出力信号群を構成する左側チャンネル信号であって左側に配置されたスピーカから出音される信号である。第5信号は、出力信号群を構成する右側チャンネル信号であって右側に配置されたスピーカから出音される信号である。
<第1フラグ格納部100>
第1フラグ格納部100は、入力信号群を構成する正面チャンネル信号である第1信号がダイアログ信号であるか否かを示す第1ダイアログフラグが格納されている。第1フラグ格納部100は、例えばフラッシュメモリまたはHDD等のメモリである。第1フラグ格納部100は、例えば入力処理部11から伝達されたダイアログフラグ情報が格納されることで、第1ダイアログフラグが格納される。
<正面信号処理部101>
図6は、実施の形態1に係る正面信号処理部101の詳細構成の一例を示す図である。
正面信号処理部101は、第1フラグ格納部100から、第1ダイアログフラグを取得するとともに、第1信号を信号処理して第1L信号と第1R信号とを生成する。正面信号処理部101は、生成した第1L信号を第1加算部102に伝達し、生成した第1R信号を第2加算部103に出力する。
本実施の形態では、正面信号処理部101は、図6に示すように、ダイナミックレンジ圧縮部1011と、セレクタ1012と、セレクタ1013とを備える。
≪ダイナミックレンジ圧縮部1011≫
ダイナミックレンジ圧縮部1011は、ダイナミックレンジを圧縮する信号処理を行う。より具体的には、ダイナミックレンジ圧縮部1011は、第1信号の振幅が小さい場合に第1信号を増幅し、第1信号の振幅が大きい場合に第1信号を減衰する信号処理を行うことで、第1信号のダイナミックレンジを圧縮する。
≪セレクタ1012≫
セレクタ1012は、第1ダイアログフラグが示す第1信号がダイアログ信号であるか否かに応じて信号を切り替え、第1L信号として第1加算部102に出力する。
例えば、セレクタ1012は、第1信号がダイアログ信号であることを第1ダイアログフラグが示す場合、ダイナミックレンジが圧縮され、かつ、分配された第1信号の一方を、第1L信号として第1加算部102に出力する。一方、セレクタ1012は、第1信号がダイアログ信号でないことを第1ダイアログフラグが示す場合、分配された第1信号の一方を第1L信号として、第1加算部102に出力する。
≪セレクタ1013≫
セレクタ1013は、第1ダイアログフラグが示す第1信号がダイアログ信号であるか否かに応じて信号を切り替え、第1R信号として第2加算部103に出力する。
例えば、セレクタ1013は、第1信号がダイアログ信号であることを第1ダイアログフラグが示す場合、ダイナミックレンジが圧縮され、かつ、分配された第1信号の他方を、第1R信号として第2加算部103に出力する。一方、セレクタ1013は、第1信号がダイアログ信号でないことを第1ダイアログフラグが示す場合、分配された第1信号の他方を第1R信号として、第2加算部103に出力する。
このようにして、正面信号処理部101は、第1信号がダイアログ信号であることを第1ダイアログフラグが示す場合、ダイナミックレンジ圧縮部1011により第1信号のダイナミックレンジが圧縮された信号を分配することで第1L信号および第1R信号を生成する。また、正面信号処理部101は、第1信号がダイアログ信号でないことを第1ダイアログフラグが示す場合、第1信号を分配することで第1L信号および第1R信号を生成する。
<第1加算部102>
第1加算部102は、第2信号と、第1L信号とを加算した信号を、出力信号群を構成する左側チャンネル信号である第4信号とする。より具体的には、第1加算部102は、入力処理部11により入力された第2信号と、正面信号処理部101により入力された第1L信号とを加算し、第4信号として、左側スピーカ12に出力する。
<第2加算部103>
第2加算部103は、第3信号と、第1R信号とを加算した信号を、出力信号群を構成する右側チャンネル信号である第5信号とする。より具体的には、第2加算部103は、入力処理部11により入力された第3信号と、正面信号処理部101により入力された第1R信号とを加算し、第5信号として、右側スピーカ13に出力する。
[音響信号処理装置10の動作]
以上のように構成された音響信号処理装置10の動作について説明する。
図7は、実施の形態1に係る音響信号処理装置10の動作を示すフローチャートである。
まず、音響信号処理装置10は、第1ダイアログフラグを取得するとともに、入力処理部11により入力された第1信号を信号処理して第1L信号と第1R信号とを生成する正面信号処理を行う(S10)。
より具体的には、音響信号処理装置10は、第1ダイアログフラグを確認し、第1信号がダイアログ信号であるか否かを判定する(S101)。S101において、第1信号がダイアログ信号である場合(S101でYes)、音響信号処理装置10は、第1信号のダイナミックレンジを圧縮して2つの信号に分配する(S102)。そして、分配した2つの信号を第1L信号および第1R信号として出力する(S103)。一方、S101において、第1信号がダイアログ信号でない場合(S101でNo)、音響信号処理装置10は、第1信号を2つの信号に分配する(S104)。そして、分配した2つの信号を第1L信号および第1R信号として出力する(S105)。
次に、音響信号処理装置10は、第2信号と、S10において出力された第1L信号とを加算して、第4信号として、左側スピーカ12に出力する第1加算処理を行う(S11)。
次に、音響信号処理装置10は、第3信号と、S10において出力された第1R信号とを加算して、第5信号として、右側スピーカ13に出力する第2加算処理を行う(S11)。
[効果等]
本実施の形態の音響信号処理装置10によれば、第1信号がダイアログ信号である場合に、ダイナミックレンジが圧縮処理された第1信号が左側スピーカ12および右側スピーカ13で出音される。つまり、第1信号がダイアログ信号である場合、当該第1信号により左側スピーカ12および右側スピーカ13で出音されるのは、意味の理解が必要なダイアログであるので、第1信号のダイナミックレンジを圧縮して出音される。ところで、ダイナミックレンジ圧縮により、小音量でもセリフ等のダイアログを聞き取りやすくことが知られている。特にリクルートメント現象の症状をもつリスナーは、聴こえ方が大きく改善することが知られている。小さな音は聞えない反面、大きな音が過剰に煩く感じるといったリクルートメント現象の症状の改善に、ダイナミックレンジ圧縮の処理がマッチするからである。これにより、ダイナミックレンジを圧縮して出音されたダイアログの聴こえ方を向上できる。
一方、本実施の形態の音響信号処理装置10によれば、第1信号がダイアログ信号でない場合に、ダイナミックレンジが圧縮処理されない第1信号が左側スピーカ12および右側スピーカ13で出音される。第1信号がダイアログ信号でない場合は、当該第1信号により左側スピーカ12および右側スピーカ13で出音されるのは、背景音または音楽等である。そのため、ダイナミックレンジを圧縮して出音する必要がないからである。
このようにして、ダイアログの聴こえ方を音量面で良好に改善でき、ダイアログ以外の背景音を原音のまま維持できる。さらに、正面チャンネル信号を削減できるので、正面用のスピーカが不要となる。
以上のように本実施の形態の音響信号処理装置10によれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
(実施の形態2)
実施の形態1では、ダイアログの聴こえ方を音量面で改善することについて説明したが、これに限らない。実施の形態2では、ダイアログの聴こえ方を音像定位の面で改善することについて説明する。
実施の形態2に係るシステムおよび入力処理部11の構成は、実施の形態1で説明したのと同様である。また、実施の形態2に係る音響信号処理装置10の構成も、図5に示す音響信号処理装置10と同様であるが、正面信号処理部101Aの詳細構成が異なる。以下、実施の形態1と異なるところを中心に説明する。
[正面信号処理部101Aの構成]
図8は、実施の形態2に係る正面信号処理部101Aの詳細構成の一例を示す図である。なお、図5と同様の要素には同一の符号を付しており、詳細な説明は省略する。
正面信号処理部101Aは、実施の形態1と同様に、第1フラグ格納部100から、第1ダイアログフラグを取得するとともに、第1信号を信号処理して第1L信号と第1R信号とを生成する。正面信号処理部101は、生成した第1L信号を第1加算部102に伝達し、生成した第1R信号を第2加算部に出力する。
本実施の形態では、正面信号処理部101Aは、図8に示すように、第1音像定位部1014と、第2音像定位部1015と、セレクタ1012と、セレクタ1013とを備える。
<第1音像定位部1014>
第1音像定位部1014は、第1信号を分配し、所定の位置に定位させるように信号処理することにより、第1L信号および第1R信号を生成する。より具体的には、第1音像定位部1014は、第1信号を分配し、位相差が90度から270度の範囲となるように位相を回転させる信号処理を行うことにより、第1L信号および第1R信号を生成する。
第1音像定位部1014は、図8に示すように、第1位相回転部1016と第2位相回転部1017とを備え、第1信号を2つに分配し、2つに分配した第1信号の位相を回転させ相互の位相差が180度となる2つの信号であるX信号およびY信号を生成する。例えば、第1位相回転部1016は、2つに分配された第1信号の一方を+90度回転させる信号処理を行うことで、X信号を生成する。第2位相回転部1017は、2つに分配された第1信号の他方を‐90度回転させる信号処理を行うことで、Y信号を生成する。これにより、X信号とY信号との位相差は180度となる。
第1位相回転部1016が生成するX信号は、第1信号がダイアログ信号である場合、セレクタ1012により第1L信号として第1加算部102に出力される。第2位相回転部1017が生成するY信号は、第1信号がダイアログ信号である場合、セレクタ1013により第1R信号として第2加算部103に出力される。
ここで、相互の位相差が180度となる2つの信号であるX信号およびY信号を生成する理由は、次の通りである。すなわち、位相差が180度の2つの信号をリスナーからみて左右に位置するスピーカから出音すると、その2つの信号の音像はリスナーの頭内に定位(リスナーの近くに定位)したかのように聞こえることが古くから知られており、その現象を利用するためである。
なお、第1位相回転部1016は、2つに分配された第1信号の一方が位相反転(180度回転)させる信号処理を行うことでX信号を生成し、第2位相回転部1017は、2つに分配された第1信号の他方そのもの(0度回転)をY信号として生成してもよい。もちろん、X信号とY信号とは逆の位相回転の関係であってもよい。
また、X信号とY信号との位相差は180度でなくてもよい。本開示の発明者らの実験によれば、X信号とY信号との位相差が概ね90度以上270度以下であれば、その音像がリスナーの方に近づいて聴こえることになる。したがって、第1音像定位部1014は、第1信号を分配し、位相差が90度から270度の範囲となるように位相を回転させる信号処理を行うことにより、第1L信号および第1R信号を生成すればよい。
<第2音像定位部1015>
第2音像定位部1015は、第1信号を分配し、当該所定の位置と異なる位置に定位させるように信号処理することにより、第1L信号および第1R信号を生成する。より具体的には、第2音像定位部1015は、第1信号を分配し、位相差が‐90度から90度の範囲となるように位相を回転させる信号処理を行うことにより、第1L信号および第1R信号を生成する。
第2音像定位部1015は、図8に示すように、第1信号を2つに分配することで、2つに分配した第1信号の一方をV信号、他方をW信号として生成する。このように、第2音像定位部1015は、図8に示すように、第1信号を位相差0度の2つの信号に分配して、V信号およびW信号としている。
第2音像定位部1015が生成するV信号は、第1信号がダイアログ信号でない場合、セレクタ1012により第1L信号として第1加算部102に出力される。第2音像定位部1015が生成するW信号は、第1信号がダイアログ信号でない場合、セレクタ1013により第R信号として第2加算部103に出力される。
ここで、位相差が0度となる2つの信号であるV信号およびW信号を生成する理由は次のとおりである。すなわち、相互の位相差が0度の2つの信号をリスナーからみて左右に位置するスピーカから出音すると、その2つの信号の音像は当該スピーカの真中に定位したかのように聞こえることが古くから知られており、その現象を利用するためである。
なお、第2音像定位部1015は、第1信号から位相差0度の2つの信号を生成するとしたが、必ずしも0度に限定されるものではなく、0度近傍(−90度より大きく、+90度より小さい値)であればよい。
[音響信号処理装置10の動作]
以上のように構成された実施の形態2に係る音響信号処理装置10の動作について説明する。
図9は、実施の形態2に係る音響信号処理装置10の動作を示すフローチャートである。なお、図7と同様の要素には同一の符号を付しており、詳細な説明は省略する。
まず、実施の形態2に係る音響信号処理装置10は、第1ダイアログフラグを取得するとともに、入力処理部11により入力された第1信号を信号処理して第1L信号と第1R信号とを生成する正面信号処理を行う(S10A)。
より具体的には、実施の形態2に係る音響信号処理装置10は、第1ダイアログフラグを確認し、第1信号がダイアログ信号であるか否かを判定する(S101)。S101において、第1信号がダイアログ信号である場合(S101でYes)、実施の形態2に係る音響信号処理装置10は、第1信号を2つの信号に分配して、所定の位置に定位させる信号処理を行う(S102A)。そして、S102Aにおいて信号処理を行った2つの信号であるX信号およびY信号を第1L信号および第1R信号として出力する(S103A)。一方、S101において、第1信号がダイアログ信号でない場合(S101でNo)、実施の形態2に係る音響信号処理装置10は、第1信号を2つの信号に分配して、当該所定の位置と異なる位置に定位させる信号処理を行う(S104A)。そして、S104Aにおいて信号処理を行った2つの信号であるV信号およびW信号を第1L信号および第1R信号として出力する(S105A)。
以降のS11およびS12は、実施の形態1で説明した通りであるので説明を省略する。
[効果等]
本実施の形態の音響信号処理装置10によれば、第1信号がダイアログ信号である場合に、第1信号は2つの信号に分配され、所定の位置に定位させる信号処理が行われ、第1L信号および第1R信号として出力される。第1L信号は第2信号に加算され左側スピーカ12から、第1R信号は第3信号に加算されて右側スピーカ13から出音される。これにより、ダイアログ信号である第1信号の音像は、ダイアログ信号でない第2信号および第3信号の音像と異なることろに定位されるので、リスナーにとってセリフ等のダイアログを聞き取りやすくすることができる。ここで、第1信号がダイアログ信号である場合に、第1信号を分配し、位相差が180度となるように位相を回転させる信号処理を行うときには、第1信号の音像は、リスナーの頭内に定位(リスナーの近くに定位)したかのように聞こえるので、リスナーにとってよりダイアログを聞き取りやすくすることができる。
一方、本実施の形態の音響信号処理装置10によれば、第1信号がダイアログ信号でない場合に、第1信号は2つの信号に分配され、当該所定の位置と異なる位置に定位させる信号処理が行われ、第1L信号および第1R信号として出力される。当該所定の位置と異なる位置に定位させる信号処理は、2つの信号に分配された第1信号の位相差が−90度より大きく、+90度より小さい値といった0度近傍となるように位相を回転させることに該当する。ダイアログ信号でない第1信号の音像は、ダイアログ信号でない第2信号および第3信号の音像と異なる位置に定位させる必要がないので、第2信号および第3信号の音像の近傍に定位され、スピーカの真中に定位したかのように聞こえることになる。
図10Aおよび図10Bは、実施の形態2に係る効果を説明するための図である。図10Aは、第1信号がダイアログ信号でない場合の第1信号の音像定位を概念的に示す図である。図10Bは、第1信号がダイアログ信号である場合の第1信号の音像定位を概念的に示す図である。図10Aおよび図10Bにおいて、実施の形態2に係る音響信号処理装置10等は、家庭用のテレビ受信機60に搭載されおり、テレビ受信機60のリスナー70からみた左端部には左側スピーカ12が設置され、右端部には右側スピーカ13が設置されているとする。図10Aおよび図10Bでは、リスナー70がタブレット80を見ながらテレビを視聴している様子が示されている。
図10Aに示すように、第1信号がダイアログ信号でない場合には、第1信号の音像90は、左側スピーカ12および右側スピーカ13の真中に定位するようにリスナー70に感じられる。これは、テレビ視聴で従来から体験している音像定位に該当する。一方、図10Bに示すように、第1信号がダイアログ信号である場合には、第1信号の音像92は、リスナー70の頭内に定位(リスナー70の近くに定位)するように感じられる。これにより、第1信号の音像92は、リスナー70の方に迫ったように感じられ、ダイアログが強調されて聴こえる。
このようにして、ダイアログの聴こえ方を音像定位の面で良好に改善でき、ダイアログ以外の背景音を原音のまま維持できる。さらに、正面チャンネル信号を削減できるので、正面用のスピーカが不要となる。
以上のように本実施の形態の音響信号処理装置10によれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
(変形例)
上述した実施の形態2では、ダイアログの聴こえ方を音像定位の面で改善するとして説明したが、これに限らない。ダイアログの聴こえ方を音量面および音像定位の面により改善するとしてもよい。以下、変形例として説明する。なお、以下では実施の形態1および実施の形態2と異なるところを中心に説明する。
[正面信号処理部101Bの構成]
図11は、実施の形態2の変形例に係る正面信号処理部101Bの詳細構成の一例を示す図である。なお、図5および図8と同様の要素には同一の符号を付しており、詳細な説明は省略する。
正面信号処理部101Bは、実施の形態1および2と同様に、第1フラグ格納部100から、第1ダイアログフラグを取得するとともに、第1信号を信号処理して第1L信号と第1R信号とを生成する。正面信号処理部101Bは、生成した第1L信号を第1加算部102に伝達し、生成した第1R信号を第2加算部に出力する。
本実施の形態では、正面信号処理部101Bは、図11に示すように、ダイナミックレンジ圧縮部1011Bと、第1音像定位部1014Bと、第2音像定位部1015と、セレクタ1012と、セレクタ1013とを備える。
ダイナミックレンジ圧縮部1011Bは、ダイナミックレンジを圧縮する信号処理を行い、第1音像定位部1014Bに出力する。より具体的には、ダイナミックレンジ圧縮部1011Bは、第1信号の振幅が小さい場合に第1信号を増幅し、第1信号の振幅が大きい場合に第1信号を減衰する信号処理を行うことで、第1信号のダイナミックレンジを圧縮し、第1音像定位部1014Bに出力する。
第1音像定位部1014Bは、ダイナミックレンジが圧縮された第1信号を分配し、所定の位置に定位させるように信号処理することにより、第1L信号および第1R信号を生成する。本変形例では、第1音像定位部1014Bは、図11に示すように、第1位相回転部1016と第2位相回転部1017とを備え、ダイナミックレンジが圧縮された第1信号を2つに分配し、2つに分配した当該第1信号の位相を回転させ相互の位相差が180度となる2つの信号であるX信号およびY信号を生成する。
その他の構成等については実施の形態1および2で説明した通りであるので説明を省略する。
この構成により、ダイアログの聴こえ方を音像定位の面および音量面で良好に改善でき、ダイアログ以外の背景音を原音のまま維持できる。さらに、正面チャンネル信号を削減できるので、正面用のスピーカが不要となる。
以上のように本変形例の音響信号処理装置によれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
(実施の形態3)
実施の形態2では、ダイアログ専用に設定される所定チャンネルが第1信号である場合について説明したが、これに限らない。第2信号および第3信号がダイアログ専用に設定されてもよい。実施の形態3では、第1信号〜第3信号がダイアログ信号に設定される場合について説明する。以下、実施の形態2と異なるところを中心に説明する。
上述したように、第2信号は左側チャンネル信号であり、第3信号は右側チャンネル信号であることから、本実施の形態では、クロストークキャンセル処理を用いる。クロストークキャンセル処理は、従来から知られているどのような方法で行ってもよいが、簡単な方法を一例として以下説明する。
[クロストークキャンセル処理]
図12は、クロストークキャンセル処理を説明するための図である。図12に示すように、左側スピーカ12からリスナー70の左耳元ZLまでの音の伝達関数をhFL、左側スピーカ12からリスナー70の右耳元ZRまでの音の伝達関数をhCLする。同様に、右側スピーカ13からリスナー70の左耳元ZLまでの音の伝達関数をhCR、右側スピーカ13からリスナーの右耳元ZRまでの音の伝達関数をhFRとする。
この場合、伝達関数行列Mは、下記の(式1)ように定義できる。
Figure 2019064719
ここで、Mの逆行列M−1を、(式2)のように示す場合、クロストークキャンセル処理は、入力信号XL、XRに対し、(式3)で示される行列演算を行うことに該当する。
Figure 2019064719
Figure 2019064719
そして、(式3)に示される行列演算で得られる信号を、左側スピーカ12および右側スピーカ13から出音する。これにより、左側スピーカ12および右側スピーカ13それぞれから出音された信号のクロストークの成分(左側スピーカ12からZR、右側スピーカ13からZLの成分)が空間の伝達関数行列でキャンセルされ、信号XLが左耳元ZLに到達し、信号XRが右耳元ZRに到達する。
[音響信号処理装置10C]
次に、図13〜図15を用いて音響信号処理装置10Cの各機能構成要素について説明する。音響信号処理装置10Cのハードウェア構成は、図4で説明した通りである。
図13は、実施の形態3に係る音響信号処理装置10Cの構成の一例を示す図である。なお、図5、図8等と同様の要素には同一の符号を付しており、詳細な説明は省略する。
音響信号処理装置10Cも、マルチチャンネルの音響信号である入力信号群を信号処理することで、入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する。本実施の形態では、音響信号処理装置10Cは、図13に示すように、第1フラグ格納部100と、正面信号処理部101Aと、第1加算部102Cと、第2加算部103Cと、第2フラグ格納部104と、左側信号処理部105と、第3フラグ格納部106と、右側信号処理部107とを備える。なお、第1フラグ格納部100、第2フラグ格納部104および第3フラグ格納部106は、別個の構成でなく、一つのフラグ格納部であるとしてもよい。
また、以下でも、説明を簡便にするために実施の形態1および2と同様に、入力信号群は、第1信号、第2信号および第3信号で構成され、出力信号群は、第4信号および第5信号で構成されるとして説明する。
<第2フラグ格納部104>
第2フラグ格納部104は、第2信号がダイアログ信号であるか否かを示す第2ダイアログフラグが格納されている。第2フラグ格納部104は、例えばフラッシュメモリまたはHDD等のメモリである。第2フラグ格納部104は、例えば入力処理部11から伝達されたダイアログフラグ情報が格納されることで、第2ダイアログフラグが格納される。
<左側信号処理部105>
図14は、実施の形態3に係る左側信号処理部105の詳細構成の一例を示す図である。
左側信号処理部105は、第2フラグ格納部104から、第2ダイアログフラグを取得するとともに、第2信号を信号処理して第2L信号および第2R信号を生成する。左側信号処理部105は、生成した第2L信号を第1加算部102Cに伝達し、生成した第2R信号を第2加算部103Cに出力する。
本実施の形態では、左側信号処理部105は、図14に示すように、第1左定位部1051と、第2左定位部1052と、セレクタ1053と、セレクタ1054とを備える。
≪第1左定位部1051≫
第1左定位部1051は、第2信号を分配し、リスナーの左側に定位させる信号処理を行うことにより、第2L信号および第2R信号を生成する。より具体的には、第1左定位部1051は、図14に示すように、第1クロストークキャンセルフィルタ1055と第2クロストークキャンセルフィルタ1056とを備える。第1左定位部1051は、分配した第2信号にクロストークキャンセル処理を施して、リスナーの左側に第2信号の音像を定位させる信号処理を行うことで、第2L信号および第2R信号を生成する。図14に示す例では、第1左定位部1051は、第1クロストークキャンセルフィルタ1055および第2クロストークキャンセルフィルタ1056を用いて、分配した第2信号それぞれにクロストークキャンセル処理を施し、リスナーの左側に音像を定位させる信号処理を行うことで2つの信号であるX信号およびY信号を生成する。
第1クロストークキャンセルフィルタ1055は、クロストークキャンセル処理が施される、左側スピーカ12から出音する信号を生成するためのフィルタであり、例えば、上記の(式2)で示される空間の伝達関数行列における伝達関数Aを処理するフィルタである。なお、ここでのクロストークキャンセル処理は、第2の信号を左側スピーカ12および右側スピーカ13から出音した際に、リスナーの右側の耳元に音が到達しないように制御する信号処理である。第1クロストークキャンセルフィルタ1055は、出力信号としてX信号を生成して出力する。第2クロストークキャンセルフィルタ1056は、クロストークキャンセル処理が施される、右側スピーカ13から出音する信号を生成するためのフィルタであり、例えば、上記の(式2)で示される空間の伝達関数行列における伝達関数Bを処理するフィルタである。なお、ここでのクロストークキャンセル処理は、第2信号を左側スピーカ12および右側スピーカ13から出音した際に、リスナーの右側の耳元に音が到達しないように制御する信号処理である。第2クロストークキャンセルフィルタ1056は、出力信号として、Y信号を生成して出力する。
第1クロストークキャンセルフィルタ1055が生成するX信号は、第2信号がダイアログ信号である場合、セレクタ1053により第2L信号として第1加算部102Cに出力される。第2クロストークキャンセルフィルタ1056が生成するY信号は、第2信号がダイアログ信号である場合、セレクタ1054により第2R信号として第2加算部103Cに出力される。
このようにして、第1左定位部1051は、第1クロストークキャンセルフィルタ1055および第2クロストークキャンセルフィルタ1056を用いることにより、第2信号が左側スピーカ12および右側スピーカ13から出音されたときに、第2信号がリスナーの左耳元に定位したかのような信号を生成することができる。なぜなら、リスナーの右耳に音が到達せず左耳にのみ音が到達するので、あたかも音像がリスナーの左耳元に定位したかのように聞こえるからである。
≪第2左定位部1052≫
第2左定位部1052は、第2信号がダイアログ信号でないことを第2ダイアログフラグが示す場合、第2信号を第1左定位部1051が定位させる位置と異なる位置に定位させる信号処理を行うことにより、第2L信号および第2R信号を生成する。より具体的には、第2左定位部1052は、第2信号にクロストークキャンセル処理を施さずに、リスナーの左側に第2信号の音像を定位させる信号処理を行うことにより、第2L信号および第2R信号を生成する。図14に示す例では、第2左定位部1052は、信号処理を施さずにそのまま通過させる第2信号をV信号として生成し、別途無音信号をW信号として生成する。
第2左定位部1052が生成するV信号は、第2信号がダイアログ信号でない場合、セレクタ1053により第2L信号として第1加算部102Cに出力される。第2左定位部1052が生成するW信号は、第2信号がダイアログ信号でない場合、セレクタ1054により第2R信号として第2加算部103Cに出力される。
このようにして、第2左定位部1052は、第2信号が左側スピーカ12および右側スピーカ13から出音されたときに、第2信号が左側スピーカ12の位置に定位するような信号を生成することができる。なぜなら、第2信号が左側スピーカ12からのみ出音され、右側スピーカは無音となるからである。
≪セレクタ1053≫
セレクタ1053は、第2ダイアログフラグが示す第2信号がダイアログ信号であるか否かに応じて信号を切り替え、第2L信号として第1加算部102Cに出力する。
例えば、セレクタ1053は、第2信号がダイアログ信号であることを第2ダイアログフラグが示す場合、クロストークキャンセル処理を用いてリスナーの左側に音像を定位させる信号処理が行われ、かつ、分配された第2信号の一方であるX信号を、第2L信号として第1加算部102Cに出力する。一方、セレクタ1053は、第2信号がダイアログ信号でないことを第2ダイアログフラグが示す場合、第2信号であるV信号を第2L信号として、第1加算部102Cに出力する。
≪セレクタ1054≫
セレクタ1054は、第2ダイアログフラグが示す第2信号がダイアログ信号であるか否かに応じて信号を切り替え、第2R信号として第2加算部103Cに出力する。
例えば、セレクタ1054は、第2信号がダイアログ信号であることを第2ダイアログフラグが示す場合、クロストークキャンセル処理を用いてリスナーの左側に音像を定位させる信号処理が行われ、かつ、分配された第2信号の他方であるY信号を、第2R信号として第2加算部103Cに出力する。一方、セレクタ1053は、第2信号がダイアログ信号でないことを第2ダイアログフラグが示す場合、無音信号であるW信号を第2R信号として、第2加算部103Cに出力する。
<第3フラグ格納部106>
第3フラグ格納部106は、第3信号がダイアログ信号であるか否かを示す第3ダイアログフラグとが格納されている。第3フラグ格納部106は、例えばフラッシュメモリまたはHDD等のメモリである。第3フラグ格納部106は、例えば入力処理部11から伝達されたダイアログフラグ情報が格納されることで、第3ダイアログフラグが格納される。
<右側信号処理部107>
図15は、実施の形態3に係る右側信号処理部107の詳細構成の一例を示す図である。
右側信号処理部107は、第3フラグ格納部106から、第3ダイアログフラグを取得するとともに、第3信号を信号処理して第3L信号および第3R信号を生成する。右側信号処理部107は、生成した第3L信号を第1加算部102Cに伝達し、生成した第3R信号を第2加算部103Cに出力する。
本実施の形態では、右側信号処理部107は、図15に示すように、第1右定位部1071と、第2右定位部1072と、セレクタ1073と、セレクタ1074とを備える。
≪第1右定位部1071≫
第1右定位部1071は、第3信号を分配し、リスナーの右側に定位させる信号処理を行うことにより、第3L信号および第3R信号を生成する。より具体的には、第1右定位部1071は、図15に示すように、第3クロストークキャンセルフィルタ1075と第4クロストークキャンセルフィルタ1076とを備える。第1右定位部1071は、分配した第3信号にクロストークキャンセル処理を施して、リスナーの右側に第3信号の音像を定位させる信号処理を行うことにより、第3L信号および第3R信号を生成する。図15に示す例では、第1右定位部1071は、第3クロストークキャンセルフィルタ1075および第4クロストークキャンセルフィルタ1076を用いて、分配した第3信号それぞれにクロストークキャンセル処理を施して、リスナーの右側に音像を定位させる信号処理を行うことで2つの信号であるX信号およびY信号を生成する。
第3クロストークキャンセルフィルタ1075は、クロストークキャンセル処理が施される、左側スピーカ12から出音する信号を生成するためのフィルタであり、例えば、上記の(式2)で示される空間の伝達関数行列における伝達関数Cを処理するフィルタである。なお、ここでのクロストークキャンセル処理は、第3の信号を左側スピーカ12および右側スピーカ13から出音した際に、リスナーの左側の耳元に音が到達しないように制御する信号処理である。第3クロストークキャンセルフィルタ1075は、出力信号としてX信号を生成して出力する。第4クロストークキャンセルフィルタ1076は、クロストークキャンセル処理が施される、右側スピーカ13から出音する信号を生成するためのフィルタであり、例えば、上記の(式2)で示される空間の伝達関数行列における伝達関数Dを処理するフィルタである。なお、ここでのクロストークキャンセル処理は、第3信号を左側スピーカ12および右側スピーカ13から出音した際に、リスナーの左側の耳元に音が到達しないように制御する信号処理である。第4クロストークキャンセルフィルタ1076は、出力信号として、Y信号を生成して出力する。
第3クロストークキャンセルフィルタ1075が生成するX信号は、第3信号がダイアログ信号である場合、セレクタ1073により第3L信号として第1加算部102Cに出力される。第4クロストークキャンセルフィルタ1076が生成するY信号は、第3信号がダイアログ信号である場合、セレクタ1074により第3R信号として第2加算部103Cに出力される。
このようにして、第1右定位部1071は、第3クロストークキャンセルフィルタ1075および第4クロストークキャンセルフィルタ1076を用いることにより、第3信号が左側スピーカ12および右側スピーカ13から出音されたときに、第3信号がリスナーの右耳元に定位したかのような信号を生成することができる。なぜなら、リスナーの左耳に音が到達せず右耳にのみ音が到達するので、あたかも音像がリスナーの右耳元に定位したかのように聞こえるからである。
≪第2右定位部1072≫
第2右定位部1072は、第3信号がダイアログ信号でないことを第3ダイアログフラグが示す場合、第3信号を第1右定位部1071が定位させる位置と異なる位置に定位させる信号処理を行うことにより、第3L信号および第3R信号を生成する。より具体的には、第2右定位部1072は、第3信号にクロストークキャンセル処理を施さずに、リスナーの右側に第3信号の音像を定位させる信号処理を行うことにより、第3L信号および第3R信号を生成する。図15に示す例では、第2右定位部1072は、別途無音信号をV信号として生成し、信号処理を施さずにそのまま通過させる第3信号をW信号として生成する。
第2右定位部1072が生成するV信号は、第3信号がダイアログ信号でない場合、セレクタ1073により第3L信号として第1加算部102Cに出力される。第2右定位部1072が生成するW信号は、第3信号がダイアログ信号でない場合、セレクタ1074により第3R信号として第2加算部103Cに出力される。
このようにして、第2右定位部1072は、第3信号が左側スピーカ12および右側スピーカ13から出音されたときに、第3信号が右側スピーカ13の位置に定位するような信号を生成することができる。なぜなら、第3信号が右側スピーカ13からのみ出音され、左側スピーカは無音となるからである。
≪セレクタ1073≫
セレクタ1073は、第3ダイアログフラグが示す第3信号がダイアログ信号であるか否かに応じて信号を切り替え、第3L信号として第1加算部102Cに出力する。
例えば、セレクタ1073は、第3信号がダイアログ信号であることを第3ダイアログフラグが示す場合、クロストークキャンセル処理を用いてリスナーの右側に音像を定位させる信号処理が行われ、かつ、分配された第3信号の一方であるX信号を、第3L信号として第1加算部102Cに出力する。一方、セレクタ1073は、第3信号がダイアログ信号でないことを第3ダイアログフラグが示す場合、無音信号であるV信号を第2L信号として、第1加算部102Cに出力する。
≪セレクタ1074≫
セレクタ1074は、第3ダイアログフラグが示す第3信号がダイアログ信号であるか否かに応じて信号を切り替え、第3R信号として第2加算部103Cに出力する。
例えば、セレクタ1074は、第3信号がダイアログ信号であることを第3ダイアログフラグが示す場合、クロストークキャンセル処理を用いてリスナーの右側に音像を定位させる信号処理が行われ、かつ、分配された第3信号の他方であるY信号を、第3R信号として第2加算部103Cに出力する。一方、セレクタ1073は、第3信号がダイアログ信号でないことを第3ダイアログフラグが示す場合、第3信号であるW信号を第2R信号として、第2加算部103Cに出力する。
<第1加算部102C>
第1加算部102Cは、第1L信号、第2L信号および第3L信号を加算した信号を、出力信号群を構成する左側チャンネル信号である第4信号とする。より具体的には、第1加算部102Cは、正面信号処理部101Aにより入力された第1L信号と、左側信号処理部105により入力された第2L信号と、右側信号処理部107により入力された第3L信号とを加算して、第4信号として、左側スピーカ12に出力する。
<第2加算部103C>
第2加算部103Cは、第1R信号、第2R信号および第3R信号を加算した信号を、出力信号群を構成する右側チャンネル信号である第5信号とする。より具体的には、第2加算部103Cは、正面信号処理部101Aにより入力された第1R信号と、左側信号処理部105により入力された第2R信号と、右側信号処理部107により入力された第3R信号とを加算して、第5信号として、右側スピーカ13に出力する。
[効果等]
本実施の形態の音響信号処理装置10Cによれば、第1信号がダイアログ信号である場合に、第1信号は2つの信号に分配され、リスナーの頭内に定位(リスナーの近くに定位)したかのような所定位置に定位させる信号処理が行われ、第1L信号および第1R信号として出力される。また、第2信号がダイアログ信号である場合に、第2信号は2つの信号に分配され、リスナーの左耳元に定位させる信号処理が行われ、第2L信号および第2R信号として出力される。また、第3信号がダイアログ信号である場合に、第3信号は2つの信号に分配され、リスナーの右耳元に定位させる信号処理が行われ、第3L信号および第3R信号として出力される。
これにより、ダイアログ信号である第2信号の音像は、ダイアログ信号でない第2信号の音像と比較して、リスナーの近いところに定位したかのように聞こえるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。同様に、ダイアログ信号である第3信号の音像は、ダイアログ信号でない第3信号の音像と比較して、リスナーの近いところに定位したかのように聞こえるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
さらに、ダイアログ信号である第2信号の音像は、クロストークキャンセル処理が施されることにより、リスナーの左耳元に定位したかのように聞こえるので、リスナーにとってセリフ等のダイアログを聞き取りやすくすることができる。同様に、ダイアログ信号である第3信号の音像は、クロストークキャンセル処理が施されることにより、リスナーの右耳元に定位したかのように聞こえるので、リスナーはセリフ等のダイアログをより聞き取りやすくなる。
図16Aおよび図16Bは、実施の形態3に係る効果を説明するための図である。なお、図10Aおよび図10Bと同様の要素には同一の符号を付しており、詳細な説明は省略する。図16Aは、第2信号および第3信号がダイアログ信号でない場合の第2信号および第3信号の音像定位を概念的に示す図である。図16Bは、第2信号および第3信号がダイアログ信号である場合の第2信号および第3信号の音像定位を概念的に示す図である。
図16Aに示すように、第2信号および第3信号がダイアログ信号でない場合には、第2信号の音像93は左側スピーカ12の位置に、第3信号の音像94は右側スピーカ13の位置に定位するように、リスナー70に感じられる。これは、テレビ視聴で従来から体験している音像定位に該当する。一方、図16Bに示すように、第2信号および第3信号がダイアログ信号である場合には、第2信号の音像95はリスナーの左耳元に、第3信号の音像96はリスナー70の右耳元に定位するように感じられる。これにより、第2信号の音像95および第3信号の音像96は、リスナー70のダイアログの聞き取り易さを向上させることができるだけでなく、臨場感を向上させることができる。
このようにして、ダイアログの聴こえ方を音像定位の面で良好に改善でき、ダイアログ以外の背景音は原音のまま維持できる。さらに、正面チャンネルの信号を削減できるので、正面用のスピーカが不要となる。
以上のように本実施の形態の音響信号処理装置10Cによれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
なお、実施の形態3では、第2信号は、例えば22.2ch規格におけるFLcに割り当てられる信号であるが、上述したように、リスナーの左側のチャンネルに割り当てられている信号であれば例えばFLまたはBtFLなどであってもよい。そして、実施の形態3の音響信号処理装置10Cによれば、2chスピーカしかない視聴環境において、リスナーの左側のチャンネルに割り当てられている信号がダイアログである場合、当該信号がリスナーの耳元に定位することとなる。22.2chの中のダイアログでない信号については、通常のダウンミックス処理によって、2ch信号にダウンミックスすればよい。ダウンミックス処理はどのようなものであってもよいが、例えば、非特許文献1で挙げられているダウンミックス式によって求めてもよい。ここで、非特許文献1で挙げられている(1)〜(8)のダウンミックス式は各チャンネルの信号がダイアログかどうかに関係なく処理される式である。これらのダウンミックス式を本実施の形態に適用する場合はダイアログであるチャンネルを除外してダウンミックス処理すればよい。
(実施の形態4)
実施の形態3では、第2信号および第3信号がダイアログ信号である場合に、これらの音像をリスナーの左耳元および右耳元に定位させることにより、ダイアログの聴こえ方を向上することについて説明したが、これに限らない。第2信号および第3信号に割り当てられる信号が予め予定されていたスピーカ位置に音像を定位させてもよい。なお、実施の形態4に係るシステムおよび入力処理部11の構成は、実施の形態1等で説明したのと同様であるので、実施の形態4に係る音響信号処理装置10Dの構成について、実施の形態3と異なるところを中心に説明する。
本実施の形態では、クロストークキャンセル処理を用いて、第2信号および第3信号の音像を、意図されていたスピーカ位置に仮想的に定位(仮想音像定位)させる。以下、仮想音像定位の処理の簡単な方法を一例として説明する。
[仮想音像定位の処理]
図17は、仮想音像定位の処理を説明するための図である。図17には、入力信号Sを出音した音像の位置(仮想音像位置)がスピーカ位置Xであるとする場合の例が示されている。ここで、図17に示す伝達関数HXは、スピーカ位置Xからリスナーの両耳に至る音の伝達関数であり、伝達関数HXは、スピーカ位置Xからリスナーの左耳に至る伝達関数LVxと、スピーカ位置Xからリスナーの右耳に至る伝達関数RVxとの組によって構成される。
入力信号Sを出音した音像の位置(仮想音像位置)がスピーカ位置Xの位置になるためには、伝達関数TL、TRと、伝達関数HXと、左右の実スピーカからリスナー70までの空間の伝達関数行列との関係が、下記の(式4)に示すような関係であればよい。伝達関数HXと、左右の実スピーカからリスナー70までの空間の伝達関数行列は、予め計測、あるいは計算できるものであるので、入力信号Sに伝達関数TL、TRを適用して左右の実スピーカから出音した信号が、あたかもスピーカ位置Xに置かれたスピーカから出音されたかのように聞こえるようになる。
Figure 2019064719
ここで、(式4)は、入力信号Sに伝達関数HXを掛けた上で、クロストークキャンセル処理する(空間の伝達関数行列の逆行列を掛ける)ことで、スピーカ位置Xから音が聞こえてくるかのような現象を実現できることを示している。
図18は、22.2ch規格における伝達関数群格納テーブルの一例を示す図である。図18に示す伝達関数群格納テーブルには、仮想音像位置としての種々のスピーカ位置Xからリスナー70の左右に耳に至る伝達関数が、スピーカ位置Xをインデックスとして格納されている。図18に示した伝達関数群格納テーブルの右の列は2つの要素からなっている。その左側の要素は、スピーカ位置Xからリスナー70の左耳に至る伝達関数、右側の要素は、スピーカ位置Xからリスナー70の右に耳に至る伝達関数である。ここで、インデックスは、一例としてARIB規格の22.2chのチャンネルラベルを用いている。
チャンネルラベルに対応したそれぞれのスピーカ位置は、ARIB規格によって定められている。そのため、当該伝達関数群格納テーブルには、ARIB規格によって定められているスピーカ位置からリスナーの左右に耳に至る伝達関数(LVx、RVx)を予め計測して格納することができる。なお、当該伝達関数群格納テーブルには、伝達関数(LVx、RVx)に代えて、伝達関数(LVx、RVx)に予めクロストークキャンセル処理の逆行列演算を施したあとの伝達関数を格納しておいてもよい。
[音響信号処理装置10D]
次に、図19〜図21を用いて音響信号処理装置10Dの各機能構成要素について説明する。音響信号処理装置10Dのハードウェア構成は、図4で説明した通りである。
図19は、実施の形態4に係る音響信号処理装置10Dの構成の一例を示す図である。なお、図13と同様の要素には同一の符号を付しており、詳細な説明は省略する。
図19に示す音響信号処理装置10Dは、実施の形態3に係る図13に示す音響信号処理装置10Cに対して、第1位置情報格納部108、第2位置情報格納部109および伝達関数群格納テーブル110が追加され、左側信号処理部105Dおよび右側信号処理部107Dの構成が異なる。その他については実施の形態3で説明した通りであるので、説明を省略する。なお、第1位置情報格納部108および第2位置情報格納部109は、別個の構成でなく、一つの位置情報格納部であるとしてもよい。
<伝達関数群格納テーブル110>
伝達関数群格納テーブル110は、複数のスピーカ位置それぞれからリスナーの両耳に至る音の伝達関数が、スピーカ位置ごとに格納されている。伝達関数群格納テーブル110は、マルチチャンネルが22.2chであれば、図18に示すものであってもよい。本実施の形態では、マルチチャンネルが22.2chであるとして説明する。
<第1位置情報格納部108>
第1位置情報格納部108は、第2信号に割り当てられているスピーカ位置を特定するスピーカ位置情報が格納されている。本実施の形態では、第1位置情報格納部108は、第2信号に対応するチャンネルラベルを格納する。
<第2位置情報格納部109>
第2位置情報格納部109は、第3信号に割り当てられているスピーカ位置を特定するスピーカ位置情報が格納されている。本実施の形態では、第2位置情報格納部109は、第3信号に対応するチャンネルラベルを格納する。
<左側信号処理部105D>
図20は、実施の形態4に係る左側信号処理部105Dの詳細構成の一例を示す図である。なお、図14と同様の要素には同一の符号を付しており、詳細な説明は省略する。
左側信号処理部105Dは、第2フラグ格納部104から、第2ダイアログフラグを取得するとともに、第1位置情報格納部108および伝達関数群格納テーブル110を参照し、第2信号を信号処理して第2L信号および第2R信号を生成する。左側信号処理部105Dは、生成した第2L信号を第1加算部102Cに伝達し、生成した第2R信号を第2加算部103Cに出力する。
本実施の形態では、左側信号処理部105Dは、図20に示すように、第1左定位部1051Dと、第2左定位部1052と、セレクタ1053と、セレクタ1054とを備える。
≪第1左定位部1051D≫
第1左定位部1051Dは、第1位置情報格納部108から第2信号に割り当てられている第1スピーカ位置を特定し、特定した第1スピーカ位置と伝達関数群格納テーブル110とから第1スピーカ位置とリスナーの両耳の間の第1伝達関数を取得する。そして、第1左定位部1051Dは、第2信号に第1伝達関数の処理を施した上でクロストークキャンセル処理を施すことにより、第1スピーカ位置に音像を定位させる信号処理を行う。
本実施の形態では、第1左定位部1051Dは、図20に示すように、左側仮想位置フィルタ1057と右側仮想位置フィルタ1058とを備える。第1左定位部1051Dは、第1位置情報格納部108からチャンネルラベルを取り出し、取り出したチャンネルラベルをインデックスとして伝達関数群格納テーブル110を参照する。そして、第1左定位部1051Dは、当該インデックスから特定された伝達関数を第2信号に掛けた上でクロストークキャンセル処理を行う。
図20に示す例では、第1左定位部1051Dは、左側仮想位置フィルタ1057および右側仮想位置フィルタ1058を用いて、分配した第2信号それぞれに仮想音像定位の処理を施す。さらに、第1左定位部1051Dは、第1クロストークキャンセルフィルタ1055および第2クロストークキャンセルフィルタ1056を用いて、2つの信号であるX信号およびY信号を生成する。ここでの仮想音像定位の処理は、第2信号を左側スピーカ12および右側スピーカ13から出音した際に、第2信号の音像が第2信号に割り当てられているスピーカ位置に定位したように感じられるように制御する信号処理である。
左側仮想位置フィルタ1057は、仮想音像定位の処理が施される信号であって左側スピーカ12から出音する信号を生成するためのフィルタである。より具体的には、左側仮想位置フィルタ1057は、第1位置情報格納部108から第2信号に割り当てられているスピーカ位置を特定する。左側仮想位置フィルタ1057は、特定したスピーカ位置に基づいて、伝達関数群格納テーブル110から、特定したスピーカ位置とリスナーの左耳の間の第1L伝達関数を取得(または算出)する。ここでは第1L伝達関数は伝達関数群格納テーブル110から取り出されたHXの左側の要素である。左側仮想位置フィルタ1057は、取得した第1L伝達関数を、分配された第2信号の一方に掛けて、第1クロストークキャンセルフィルタ1055に出力する。そして第1クロストークキャンセルフィルタ1055によりX信号が生成され、生成されたX信号は、第2信号がダイアログ信号である場合、セレクタ1053により第2L信号として第1加算部102Cに出力される。
右側仮想位置フィルタ1058は、仮想音像定位の処理が施される信号であって右側スピーカ13から出音する信号を生成するためのフィルタである。より具体的には、右側仮想位置フィルタ1058は、第1位置情報格納部108から第2信号に割り当てられているスピーカ位置を特定する。右側仮想位置フィルタ1058は、特定したスピーカ位置に基づいて、伝達関数群格納テーブル110から、特定したスピーカ位置とリスナーの右耳の間の第1R伝達関数を取得(または算出)する。ここでは第1R伝達関数は伝達関数群格納テーブル110から取り出されたHXの右側の要素である。右側仮想位置フィルタ1058は、取得した第1R伝達関数を、分配された第2信号の他方に掛けて、第2クロストークキャンセルフィルタ1056に出力する。そして第2クロストークキャンセルフィルタ1056によりY信号が生成され、生成されたY信号は、第2信号がダイアログ信号である場合、セレクタ1054により第2R信号として第2加算部103Cに出力される。
<右側信号処理部107D>
図21は、実施の形態4に係る右側信号処理部107Dの詳細構成の一例を示す図である。なお、図15と同様の要素には同一の符号を付しており、詳細な説明は省略する。
右側信号処理部107Dは、第3フラグ格納部106から、第3ダイアログフラグを取得するとともに、第2位置情報格納部109および伝達関数群格納テーブル110を参照し、第3信号を信号処理して第3L信号および第3R信号を生成する。右側信号処理部107Dは、生成した第3L信号を第1加算部102Cに伝達し、生成した第3R信号を第2加算部103Cに出力する。
本実施の形態では、右側信号処理部107Dは、図21に示すように、第1右定位部1071Dと、第2右定位部1072と、セレクタ1073と、セレクタ1074とを備える。
≪第1右定位部1071D≫
第1右定位部1071Dは、第2位置情報格納部109から第3信号に割り当てられている第2スピーカ位置を特定し、特定した第2スピーカ位置と伝達関数群格納テーブル110とから第2スピーカ位置とリスナーの両耳の間の第2伝達関数を取得する。そして、第1右定位部1071Dは、第3信号に第2伝達関数の処理施した上でクロストークキャンセル処理を施すことにより、第2スピーカ位置に音像を定位させる信号処理を行う。
本実施の形態では、第1右定位部1071Dは、図21に示すように、左側仮想位置フィルタ1077と右側仮想位置フィルタ1078とを備える。第1右定位部1071Dは、第2位置情報格納部109からチャンネルラベルを取り出し、取り出したチャンネルラベルをインデックスとして伝達関数群格納テーブル110を参照する。そして、第1右定位部1071Dは、当該インデックスから特定された伝達関数を第3信号に掛けた上でクロストークキャンセル処理を行う。
図21に示す例では、第1右定位部1071Dは、左側仮想位置フィルタ1077および右側仮想位置フィルタ1078を用いて、分配した第3信号それぞれに仮想音像定位の処理を施す。さらに、第1右定位部1071Dは、第3クロストークキャンセルフィルタ1075および第4クロストークキャンセルフィルタ1076を用いて、2つの信号であるX信号およびY信号を生成する。ここでの仮想音像定位の処理は、第3信号を左側スピーカ12および右側スピーカ13から出音した際に、第3信号の音像が第3信号に割り当てられているスピーカ位置に定位したように感じられるように制御する信号処理である。
左側仮想位置フィルタ1077は、仮想音像定位の処理が施される信号であって左側スピーカ12から出音する信号を生成するためのフィルタである。より具体的には、左側仮想位置フィルタ1077は、第2位置情報格納部109から第3信号に割り当てられているスピーカ位置を特定する。左側仮想位置フィルタ1077は、特定したスピーカ位置に基づいて、伝達関数群格納テーブル110から、特定したスピーカ位置とリスナーの左耳の間の第2L伝達関数を取得(または算出)する。ここでは第2L伝達関数は伝達関数群格納テーブル110から取り出されたHXの左側の要素である。左側仮想位置フィルタ1077は、取得した第2L伝達関数を、分配された第3信号の一方に掛けて、第3クロストークキャンセルフィルタ1075に出力する。そして第3クロストークキャンセルフィルタ1075によりX信号が生成され、生成されたX信号は、第3信号がダイアログ信号である場合、セレクタ1073により第3L信号として第1加算部102Cに出力される。
右側仮想位置フィルタ1078は、仮想音像定位の処理が施される信号であって右側スピーカ13から出音する信号を生成するためのフィルタである。右側仮想位置フィルタ1078は、出力信号としてY信号を生成して出力する。より具体的には、右側仮想位置フィルタ1078は、第2位置情報格納部109から第3信号に割り当てられているスピーカ位置を特定する。右側仮想位置フィルタ1078は、特定したスピーカ位置に基づいて、伝達関数群格納テーブル110から、特定したスピーカ位置とリスナーの右耳の間の第2R伝達関数を取得(または算出)する。ここでは第2R伝達関数は伝達関数群格納テーブル110から取り出されたHXの右側の要素である。右側仮想位置フィルタ1078は、取得した第2R伝達関数を、分配された第3信号の他方に掛けて、第4クロストークキャンセルフィルタ1076に出力する。そして第4クロストークキャンセルフィルタ1076によりY信号が生成され、生成されたY信号は、第3信号がダイアログ信号である場合、セレクタ1074により第3R信号として第2加算部103Cに出力される。
[効果等]
本実施の形態の音響信号処理装置10Dは、実施の形態3の音響信号処理装置10Cと比較して、スピーカ位置Xからリスナーの両耳に至る音の伝達関数HXがスピーカ位置ごとに格納されている伝達関数群格納テーブルと、第2信号および/または第3信号が割り当てられているスピーカ位置を特定するスピーカ位置情報が格納されている位置情報格納部とを更に備え、それらをクロストークキャンセル処理に加味する。
このようにすることによって、2チャンネルスピーカしかない再生環境であっても、当該信号がダイアログである場合、当該信号に対してもともと意図されたスピーカ位置から当該信号が聴こえるようにできる。
図22Aおよび図22Bは、実施の形態4に係る効果を説明するための図である。なお、図16Aおよび図16Bと同様の要素には同一の符号を付しており、詳細な説明は省略する。図22Aは図16Aと同じ図である。図22Bは、第2信号および第3信号がダイアログ信号である場合の第2信号および第3信号の定位を概念的に示す図である。
図22Bに示すように、第2信号および第3信号がダイアログ信号である場合には、第2信号および第3信号の音像97および音像98は、第2信号および第3信号に割り当てられる信号の予め予定していたスピーカ位置に定位するように、リスナー70は感じられる。これにより、第2信号の音像97および第3信号の音像98は、リスナー70のダイアログの聞き取り易さのみならず臨場感も向上させることができる。
このようにして、ダイアログの聴こえ方を音像定位の面で良好に改善でき、ダイアログ以外の背景音は原音のまま維持できる。さらに、正面チャンネルの信号を削減できるので、正面用のスピーカが不要となる。
以上のように本実施の形態の音響信号処理装置10Dによれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。
[その他の実施の形態等]
以上、本開示の態様に係る音響信号処理装置および音響信号処理方法について、実施の形態に基づいて説明したが、本開示は、この実施の形態に限定されるものではない。例えば、本明細書において記載した構成要素を任意に組み合わせて、また、構成要素のいくつかを除外して実現される別の実施の形態を本開示の実施の形態としてもよい。また、上記実施の形態に対して本開示の主旨、すなわち、請求の範囲に記載される文言が示す意味を逸脱しない範囲で当業者が思いつく各種変形を施して得られる変形例も本開示に含まれる。
また、以下に示す形態も、本開示の一つまたは複数の態様の範囲内に含まれてもよい。
(1)上記の音響信号処理装置を構成する構成要素の一部は、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムであってもよい。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記の音響信号処理装置および音響信号処理方法を構成する構成要素の一部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
(3)上記の音響信号処理装置を構成する構成要素の一部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
(4)また、上記の音響信号処理装置を構成する構成要素の一部は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータで読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray(登録商標) Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
また、上記の音響信号処理装置を構成する構成要素の一部は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
(5)本開示は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
(6)また、本開示は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。
(7)また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を、前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
(8)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
本開示は、音響信号処理装置および音響信号処理方法に利用でき、特に、ドラマ、映画等の映像・音響コンテンツを家庭用のテレビ受信機などで視聴する際のダイアログ(会話、セリフ等)の聴こえ方を改善することができるテレビ受信機またはDVD/BDRなどの再生機器などに搭載される音響信号処理装置および音響信号処理方法に利用できる。
10、10C、10D 音響信号処理装置
11 入力処理部
12 左側スピーカ
13 右側スピーカ
50 ストリーム
51 ヘッダ
52 Video
53 Audio
60 テレビ受信機
70 リスナー
80 タブレット
90、92、93、94、95、96、97、98 音像
100 第1フラグ格納部
101、101A、101B 正面信号処理部
102、102C 第1加算部
103、103C 第2加算部
104 第2フラグ格納部
105、105D 左側信号処理部
106 第3フラグ格納部
107、107D 右側信号処理部
108 第1位置情報格納部
109 第2位置情報格納部
110 伝達関数群格納テーブル
111 ストリーム解析部
112 音響デコーダ
113 コントローラ
1000 コンピュータ
1001 入力装置
1002 出力装置
1004 内蔵ストレージ
1007 読取装置
1008 送受信装置
1009 バス
1011、1011B ダイナミックレンジ圧縮部
1012、1013、1053、1054、1073、1074 セレクタ
1014、1014B 第1音像定位部
1015 第2音像定位部
1016 第1位相回転部
1017 第2位相回転部
1051、1051D 第1左定位部
1052 第2左定位部
1055 第1クロストークキャンセルフィルタ
1056 第2クロストークキャンセルフィルタ
1057、1077 左側仮想位置フィルタ
1058、1078 右側仮想位置フィルタ
1071、1071D 第1右定位部
1072 第2右定位部
1075 第3クロストークキャンセルフィルタ
1076 第4クロストークキャンセルフィルタ

Claims (8)

  1. マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理装置であって、
    前記入力信号群を構成する正面チャンネル信号である第1信号がダイアログ信号であるか否かを示す第1ダイアログフラグが格納されているフラグ格納部と、
    前記第1信号を信号処理して第1L信号および第1R信号を生成する正面信号処理部と、
    前記入力信号群を構成する左側チャンネル信号である第2信号と、前記第1L信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第4信号とする第1加算部と、
    前記入力信号群を構成する右側チャンネル信号である第3信号と、前記第1R信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第5信号とする第2加算部とを備え、
    前記正面信号処理部は、
    前記第1信号がダイアログ信号であることを前記第1ダイアログフラグが示す場合、前記第1信号を分配し、所定の位置に定位させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成する第1音像定位部と、
    前記第1信号がダイアログ信号でないことを前記第1ダイアログフラグが示す場合、前記第1信号を分配し、前記所定の位置と異なる位置に定位させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成する第2音像定位部とを有する、
    音響信号処理装置。
  2. 前記第1音像定位部は、
    前記第1信号を分配し、位相差が90度から270度の範囲となるように位相を回転させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成し、
    前記第2音像定位部は、
    前記第1信号を分配し、位相差が‐90度から90度の範囲となるように位相を回転させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成する、
    請求項1に記載の音響信号処理装置。
  3. 前記正面信号処理部は、さらに、
    ダイナミックレンジを圧縮する信号処理を行うダイナミックレンジ圧縮部を有し、
    前記正面信号処理部は、
    前記第1信号がダイアログ信号であることを前記第1ダイアログフラグが示す場合、前記ダイナミックレンジ圧縮部に前記第1信号のダイナミックレンジを圧縮させて前記第1音像定位部に出力させ、
    前記第1音像定位部に、ダイナミックレンジが圧縮された前記第1信号を分配し、所定の位置に定位させるように信号処理することにより、前記第1L信号および前記第1R信号を生成する、
    請求項1または2に記載の音響信号処理装置。
  4. 前記フラグ格納部は、さらに、前記第2信号がダイアログ信号であるか否かを示す第2ダイアログフラグと、前記第3信号がダイアログ信号であるか否かを示す第3ダイアログフラグとが格納されており、
    前記音響信号処理装置は、さらに、
    前記第2信号を信号処理して第2L信号および第2R信号を生成する左側信号処理部と、
    前記第3信号を信号処理して第3L信号および第3R信号を生成する右側信号処理部とを備え、
    前記左側信号処理部は、
    前記第2信号がダイアログ信号であることを前記第2ダイアログフラグが示す場合、前記第2信号を分配し、リスナーの左側に定位させる信号処理を行うことにより、前記第2L信号および前記第2R信号を生成する第1左定位部と、
    前記第2信号がダイアログ信号でないことを前記第2ダイアログフラグが示す場合、前記第2信号を前記第1左定位部が定位させる位置と異なる位置に定位させる信号処理を行うことにより、前記第2L信号および前記第2R信号を生成する第2左定位部とを有し、
    前記右側信号処理部は、
    前記第3信号がダイアログ信号であることを前記第3ダイアログフラグが示す場合、前記第3信号を分配し、前記リスナーの右側に定位させる信号処理を行うことにより、前記第3L信号および前記第3R信号を生成する第1右定位部と、
    前記第3信号がダイアログ信号でないことを前記第3ダイアログフラグが示す場合、前記第3信号を前記第1右定位部が定位させる位置と異なる位置に定位させる信号処理を行うことにより、前記第3L信号および前記第3R信号を生成する第2右定位部と、を有し、
    前記第1加算部は、前記第1L信号、前記第2L信号および前記第3L信号を加算した信号を前記第4信号とし、
    前記第2加算部は、前記第1R信号、前記第2R信号および前記第3R信号を加算した信号を前記第5信号とする、
    請求項1から3のいずれか1項に記載の音響信号処理装置。
  5. 前記第1左定位部は、分配した前記第2信号にクロストークキャンセル処理を施して、前記リスナーの左側に第2信号の音像を定位させる信号処理を行うことにより、前記第2L信号および前記第2R信号を生成し、
    前記第2左定位部は、前記第2信号にクロストークキャンセル処理を施さずに、前記リスナーの左側に前記第2信号の音像を定位させる信号処理を行うことにより、前記第2L信号および前記第2R信号を生成し、
    前記第1右定位部は、前記第3信号にクロストークキャンセル処理を施して、前記リスナーの右側に前記第3信号の音像を定位させる信号処理を行うことにより、前記第3L信号および前記第3R信号を生成し、
    前記第2右定位部は、前記第3信号にクロストークキャンセル処理を施さずに、前記リスナーの右側に前記第3信号の音像を定位させる信号処理を行うことにより、前記第3L信号および前記第3R信号を生成する、
    請求項4に記載の音響信号処理装置。
  6. 前記音響信号処理装置は、さらに、
    複数のスピーカ位置それぞれから前記リスナーの両耳に至る音の伝達関数が、スピーカ位置ごとに格納されている伝達関数群格納テーブルと、
    前記第2信号および前記第3信号に割り当てられているスピーカ位置を特定するスピーカ位置情報が格納されている位置情報格納部と、を備え、
    前記第1左定位部は、
    前記位置情報格納部から前記第2信号に割り当てられている第1スピーカ位置を特定し、特定した第1スピーカ位置と前記伝達関数群格納テーブルとから前記第1スピーカ位置と前記リスナーの両耳の間の第1伝達関数を取得し、前記第2信号に前記第1伝達関数の処理を施した上でクロストークキャンセル処理を施すことにより、前記リスナーの左側に音像を定位させる信号処理を行い、
    前記第1右定位部は、
    前記位置情報格納部から前記第3信号に割り当てられている第2スピーカ位置を特定し、特定した第2スピーカ位置と前記伝達関数群格納テーブルとから前記第2スピーカ位置と前記リスナーの両耳の間の第2伝達関数を取得し、前記第3信号に前記第2伝達関数の処理を施した上でクロストークキャンセル処理を施すことにより、前記リスナーの右側に音像を定位させる信号処理を行う、
    請求項5に記載の音響信号処理装置。
  7. マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理装置であって、
    前記入力信号群を構成する正面チャンネル信号である第1信号がダイアログ信号であるか否かを示す第1ダイアログフラグが格納されている第1フラグ格納部と、
    前記第1信号を信号処理して第1L信号と第1R信号とを生成する正面信号処理部と、
    前記入力信号群を構成する左側チャンネル信号である第2信号と、前記第1L信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第4信号とする第1加算部と、
    前記入力信号群を構成する右側チャンネル信号である第3信号と、前記第1R信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第5信号とする第2加算部と、を備え、
    前記正面信号処理部は、
    ダイナミックレンジを圧縮する信号処理を行うダイナミックレンジ圧縮部を有し、
    前記正面信号処理部は、
    前記第1信号がダイアログ信号であることを前記第1ダイアログフラグが示す場合、前記ダイナミックレンジ圧縮部により前記第1信号のダイナミックレンジが圧縮された信号を分配することで前記第1L信号および前記第1R信号を生成し、
    前記正面信号処理部は、前記第1信号がダイアログ信号でないことを前記第1ダイアログフラグが示す場合、前記第1信号を分配することで前記第1L信号および前記第1R信号を生成する、
    音響信号処理装置。
  8. マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理方法であって、
    前記入力信号群を構成する正面チャンネル信号である第1信号を信号処理して第1L信号および第1R信号を生成する正面信号処理ステップと、
    前記入力信号群を構成する左側チャンネル信号である第2信号と、前記第1L信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第4信号とする第1加算ステップと、
    前記入力信号群を構成する右側チャンネル信号である第3信号と、前記第1R信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第5信号とする第2加算ステップとを含み、
    前記正面信号処理ステップでは、
    前記第1信号がダイアログ信号であるか否かを示す第1ダイアログフラグにより前記第1信号がダイアログ信号であると示される場合、前記第1信号を分配し、所定の位置に定位させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成する第1音像定位ステップと、
    前記第1ダイアログフラグにより前記第1信号がダイアログ信号でないと示される場合、前記第1信号を分配し、前記所定の位置と異なる位置に定位させる信号処理を行うことにより、前記第1L信号および前記第1R信号を生成する第2音像定位ステップとを含む、
    音響信号処理方法。
JP2019544249A 2017-09-28 2018-06-12 音響信号処理装置および音響信号処理方法 Active JP6988904B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017187911 2017-09-28
JP2017187911 2017-09-28
PCT/JP2018/022385 WO2019064719A1 (ja) 2017-09-28 2018-06-12 音響信号処理装置および音響信号処理方法

Publications (2)

Publication Number Publication Date
JPWO2019064719A1 true JPWO2019064719A1 (ja) 2020-09-10
JP6988904B2 JP6988904B2 (ja) 2022-01-05

Family

ID=65900946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019544249A Active JP6988904B2 (ja) 2017-09-28 2018-06-12 音響信号処理装置および音響信号処理方法

Country Status (4)

Country Link
US (1) US10993060B2 (ja)
JP (1) JP6988904B2 (ja)
CN (1) CN111133775B (ja)
WO (1) WO2019064719A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI784735B (zh) * 2021-09-30 2022-11-21 陳俊銘 用於電動車音響系統之調節系統及其音頻調節方法
TW202333491A (zh) * 2021-12-28 2023-08-16 日商索尼集團公司 資訊處理裝置、資訊處理方法、以及程式

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010230972A (ja) * 2009-03-27 2010-10-14 Pioneer Electronic Corp 音信号処理装置、その方法、そのプログラム、および、再生装置
JP2012199786A (ja) * 2011-03-22 2012-10-18 Mitsubishi Electric Corp 音響再生装置
JP2015136100A (ja) * 2013-12-19 2015-07-27 ジーエヌ リザウンド エー/エスGn Resound A/S 選択可能な知覚空間的な音源の位置決めを備える聴覚装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4509686B2 (ja) * 2004-07-29 2010-07-21 新日本無線株式会社 音響信号処理方法および装置
WO2008047833A1 (fr) * 2006-10-19 2008-04-24 Panasonic Corporation Dispositif de positionnement d'image sonore, système de positionnement d'image sonore, procédé de positionnement d'image sonore, programme et circuit intégré
JP5370401B2 (ja) * 2011-03-18 2013-12-18 パナソニック株式会社 補聴装置
SG10201709574WA (en) * 2012-12-04 2018-01-30 Samsung Electronics Co Ltd Audio providing apparatus and audio providing method
EP2830332A3 (en) * 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP3041272A4 (en) * 2013-08-30 2017-04-05 Kyoei Engineering Co., Ltd. Sound processing apparatus, sound processing method, and sound processing program
WO2015087490A1 (ja) * 2013-12-12 2015-06-18 株式会社ソシオネクスト オーディオ再生装置及び遊技装置
US9307331B2 (en) 2013-12-19 2016-04-05 Gn Resound A/S Hearing device with selectable perceived spatial positioning of sound sources
EP2928216A1 (en) * 2014-03-26 2015-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for screen related audio object remapping
CA2956136C (en) * 2015-06-17 2022-04-05 Sony Corporation Transmitting device, transmitting method, receiving device, and receiving method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010230972A (ja) * 2009-03-27 2010-10-14 Pioneer Electronic Corp 音信号処理装置、その方法、そのプログラム、および、再生装置
JP2012199786A (ja) * 2011-03-22 2012-10-18 Mitsubishi Electric Corp 音響再生装置
JP2015136100A (ja) * 2013-12-19 2015-07-27 ジーエヌ リザウンド エー/エスGn Resound A/S 選択可能な知覚空間的な音源の位置決めを備える聴覚装置

Also Published As

Publication number Publication date
US20200228909A1 (en) 2020-07-16
CN111133775B (zh) 2021-06-08
CN111133775A (zh) 2020-05-08
US10993060B2 (en) 2021-04-27
WO2019064719A1 (ja) 2019-04-04
JP6988904B2 (ja) 2022-01-05

Similar Documents

Publication Publication Date Title
CN102100088B (zh) 用于使用基于对象的元数据产生音频输出信号的装置和方法
JP2011515942A (ja) 対象指向性の3d音声ディスプレイ装置
JP2010515290A (ja) ダイアログエンハンスメント技術のコントローラ及びユーザインタフェース
JP2002511683A (ja) 低ビットレート空間符号化方法及び装置
WO2012029790A1 (ja) 映像提示装置、映像提示方法、映像提示プログラム、記憶媒体
US11221820B2 (en) System and method for processing audio between multiple audio spaces
JP6988904B2 (ja) 音響信号処理装置および音響信号処理方法
Olivieri et al. Scene-based audio and higher order ambisonics: A technology overview and application to next-generation audio, vr and 360 video
CN112313971A (zh) 信息处理装置、信息处理方法和信息处理系统
JP2008312096A (ja) 音響再生装置及びテレビ受像機
JP4810621B1 (ja) 音声信号変換装置、方法、プログラム、及び記録媒体
WO2018198790A1 (ja) コミュニケーション装置、コミュニケーション方法、プログラム、およびテレプレゼンスシステム
KR101949756B1 (ko) 오디오 신호 처리 방법 및 장치
WO2018150774A1 (ja) 音声信号処理装置及び音声信号処理システム
JP6204683B2 (ja) 音響信号再生装置、音響信号作成装置
KR20140017344A (ko) 오디오 신호 처리 방법 및 장치
TWI699122B (zh) 多聲道音訊控制系統
KR20070081735A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
WO2021124906A1 (ja) 制御装置、信号処理方法およびスピーカ装置
JP7222434B2 (ja) 振動呈示システム
JP7290167B2 (ja) 振動呈示システム
RU2798414C2 (ru) Аудиоустройство и способ обработки аудио
JP7167995B2 (ja) オーディオ装置およびオーディオ信号出力方法
JP2008147840A (ja) 音声信号生成装置、音場再生装置、音声信号生成方法およびコンピュータプログラム
JP2004343376A (ja) Avシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211115

R150 Certificate of patent or registration of utility model

Ref document number: 6988904

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150