JP2011049862A - 音声信号処理装置および音声信号処理方法 - Google Patents

音声信号処理装置および音声信号処理方法 Download PDF

Info

Publication number
JP2011049862A
JP2011049862A JP2009197000A JP2009197000A JP2011049862A JP 2011049862 A JP2011049862 A JP 2011049862A JP 2009197000 A JP2009197000 A JP 2009197000A JP 2009197000 A JP2009197000 A JP 2009197000A JP 2011049862 A JP2011049862 A JP 2011049862A
Authority
JP
Japan
Prior art keywords
audio signal
component
audio
feature component
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009197000A
Other languages
English (en)
Other versions
JP2011049862A5 (ja
JP5682103B2 (ja
Inventor
Kenji Nakano
健司 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009197000A priority Critical patent/JP5682103B2/ja
Priority to EP10172613A priority patent/EP2293602A2/en
Priority to US12/858,532 priority patent/US8929556B2/en
Priority to CN201010261387.8A priority patent/CN102006545B/zh
Publication of JP2011049862A publication Critical patent/JP2011049862A/ja
Publication of JP2011049862A5 publication Critical patent/JP2011049862A5/ja
Application granted granted Critical
Publication of JP5682103B2 publication Critical patent/JP5682103B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/05Application of the precedence or Haas effect, i.e. the effect of first wavefront, in order to improve sound-source localisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】音響的な奥行き感に富む音声を提供可能な、音声信号処理装置および音声信号処理方法を提供する。
【解決手段】音声信号に含まれる少なくとも高域成分を特徴成分Scとして抽出する特徴成分抽出部32l、32rを備え、抽出された特徴成分の音像が音声信号の音像よりも聴取者に近接して定位するように、音声信号および抽出された特徴成分を音声出力部SPls、SPlrに供給する。音声信号処理装置は、音声信号を出力するとともに、オンマイク収録された音声に特徴的な高域・低域の音声に相当する音声信号の特徴成分を抽出し、特徴成分の音像が音声信号の音像よりも聴取者Lに近接して定位するように音声出力部に供給する。
【選択図】図3

Description

本発明は、音声信号処理装置および音声信号処理方法に関する。
視者の両眼に異なる画像を提示して立体視させる3次元ディスプレイ装置の実用化に伴い、立体映像コンテンツが家庭用コンテンツとして普及する可能性が高まっている。3次元ディスプレイ装置は、視者に対する映像の近接、離隔等、奥行き感に富む映像を視者に提供する。
しかし、立体映像コンテンツに付随する音声は、2ch、5.1ch等の従来フォーマットで提供されており、映像の奥行き感に対応する音響効果を十分にもたらすものではない。また、立体映像コンテンツに限らず、従来の音声でも音響的な奥行き感に乏しいものが多く、より奥行き感に富む音声の提供が望まれる場合がある。
そこで、本発明は、音響的な奥行き感に富む音声を提供可能な、音声信号処理装置および音声信号処理方法を提供しようとするものである。
本発明のある実施形態によれば、音声信号を処理して音声出力部に供給する音声信号処理装置であって、音声信号に含まれる少なくとも高域成分を特徴成分として抽出する特徴成分抽出部を備え、抽出された特徴成分の音像が音声信号の音像よりも聴取者に近接して定位するように、音声信号および抽出された特徴成分を音声出力部に供給する音声信号処理装置が提供される。
かかる構成によれば、音声信号を出力するとともに、オンマイク収録された音声に特徴的な高域・低域の音声に相当する音声信号の特徴成分を抽出し、特徴成分の音像が音声信号の音像よりも聴取者に近接して定位するように出力することで、音響的な奥行き感に富む音声を提供することができる。
また、上記音声信号処理装置は、抽出された特徴成分を処理し、抽出された特徴成分の音像を音声信号の音像よりも聴取者に近接して定位させる近接定位処理部をさらに備え、抽出された特徴成分の代わりに近接定位処理された特徴成分を音声出力部に供給してもよい。
また、上記音声信号処理装置は、音声信号に含まれる特徴成分を減衰させる特徴成分減衰部をさらに備え、抽出された特徴成分の音像が音声信号の音像よりも聴取者に近接して定位し、減衰された音声信号の音像が音声信号の音像よりも聴取者から離隔して定位するように、減衰された音声信号および抽出された特徴成分を音声出力部に供給してもよい。
また、上記音声信号処理装置は、減衰された音声信号を処理し、減衰された音声信号の音像を音声信号の音像よりも聴取者から離隔して定位させる離隔定位処理部をさらに備え、減衰された音声信号の代わりに離隔定位処理された音声信号を音声出力部に供給してもよい。ここで、上記離隔定位処理部は、減衰された音声信号を音声信号に対して所定の遅延量で遅延させてもよい。
また、上記特徴成分抽出部では、聴取者の操作指示に応じて、特徴成分の抽出条件が可変制御されてもよい。上記近接定位処理部では、聴取者の操作指示に応じて、特徴成分の近接定位処理の条件が可変制御されてもよい。上記特徴成分減衰部では、聴取者の操作指示に応じて、音声信号の減衰条件が可変制御されてもよい。上記離隔定位処理部では、聴取者の操作指示に応じて、音声信号の離隔定位処理の条件が可変制御されてもよい。
また、音声信号が多チャンネルの信号として入力され、聴取者により指定されたチャンネルの信号を特徴成分抽出部に入力するように、音声信号の入力が制御されてもよい。
また、本発明の別の実施形態によれば、音声信号に含まれる少なくとも高域成分を特徴成分として抽出し、抽出された特徴成分の音像が音声信号の音像よりも聴取者に近接して定位するように、音声信号および抽出された特徴成分を音声出力部に供給する音声信号処理方法が提供される。
以上説明したように本発明によれば、音響的な奥行き感に富む音声を提供可能な、音声信号処理装置および音声信号処理方法を提供することができる。
映像コンテンツに付随する音声の収録状況を示す図である。 映像コンテンツに付随する音声の再生状況を示す図である。 本発明の一実施形態に係る再生装置の主要な構成を示すブロック図である。 本発明の第1の実施形態に係る音声信号処理装置を示すブロック図である。 本発明の第2の実施形態に係る音声信号処理装置を示すブロック図である。 本発明の第3の実施形態に係る音声信号処理装置を示すブロック図である。 本発明の第4の実施形態に係る音声信号処理装置を示すブロック図である。 本発明の第5の実施形態に係る音声信号処理装置を示すブロック図である。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
図1Aおよび1Bは、映像コンテンツに付随する音声の収録状況および再生状況を示す図である。図1Aに示すように、通常、映像コンテンツの製作では、映像Vの手前側にある発音体SSfからの音声Sf(人物のセリフ等)がマイクMICに近接してオンマイクで収録され、映像Vの奥行き側にある発音体SSrからの音声Sr(環境音等)ほどオフマイクで収録される。
手前側の音声Sfは、全帯域でレベルが高くなる傾向にあり、特に近接マイクの場合は低域レベルが高く収録される
(近接効果)傾向にある。奥行き側の音声Srは、全帯域でレベルが低く、特に高域レベルの音声が落ちる傾向にある。ここで、手前側の音声Sfに多く含まれる高域・低域の音声に相当する信号成分は、音声信号の特徴成分Scとみなすことができる。
収録された音声Sf、Srは、合成された音声Smとして記録されて再生される。なお、音声Smが2ch、5.1ch等の信号である場合、各chに対応する音声Sm1、Sm2、…として記録される。そして、立体映像コンテンツを再生すると、図1Bに示すように、手前側および奥行き側の音声Sf、Srが合成された音声Smの音像がスピーカSPの前面に定位するのみで、音響的な奥行き感に乏しい音声が再生されてしまう。
このため、本発明は、音声信号を出力するとともに、オンマイク収録された音声に特徴的な高域・低域の音声に相当する音声信号の特徴成分Scを抽出し、特徴成分Scの音像が音声信号の音像よりも聴取者Lに近接して定位するように出力することで、近接音をより近接定位化して強調し、音響的な奥行き感に富む音声を提供することを主たる目的とする。
以下、図面を参照しながら本発明の一実施形態について説明する。一実施形態では、立体映像に付随する音声を再生可能な光ディスク再生装置1に本発明を適用した例を用いて説明する。しかし、本発明は、光ディスク再生装置1に限らず、立体映像に付随する音声を再生可能なテレビジョン受信装置、パーソナルコンピュータ等のマルチメディア機器にも適用することができる。また、本発明は、立体映像に付随する音声の再生に限らず、通常映像に付随する音声の再生、または映像に付随しない音声の再生にも適用することができる。
[1.再生装置1の構成]
図1は、本発明の一実施形態に係る再生装置1の主要な構成を示すブロック図である。
再生装置1は、光ディスク読出部11、逆多重化部12、映像データ復号部13、映像信号処理部14、映像信号インターフェイス15、音声データ復号部16、音声信号処理部17(音声信号処理装置)、音声信号インターフェイス18、システムコントローラ19、操作信号処理部20を含む。再生装置1は、映像信号インターフェイス15および音声信号インターフェイス18を介して、3次元ディスプレイ21およびスピーカ22に接続される。また、再生装置1は、リモートコントローラ23を介して遠隔操作される。
光ディスク読出部11は、光ディスクDの装填部、回転駆動部、光ピックアップ部、スレッドモータ、サーボ回路等を含む。ディスク読出部11は、装填された光ディスクDにレーザービームを照射して反射光を受光することで、光ディスクDに記録されている多重化データ(映像データ、音声データ等)を読出し、所定の処理を施して逆多重化部12に供給する。
ここで、映像データは、立体映像を再生するためのデータであり、所定の符号化方式で圧縮されている。音声データは、2ch、5.1ch等のデータであるが、以下では、音声データが所定の符号化方式で圧縮されている2chのデータである場合を想定する。
逆多重化部12は、供給された多重化データを、映像データ、音声データ(例えば2chの音声データ)に分離する。逆多重化部12は、映像データを映像データ復号部13に供給し、音声データを音声データ復号部16に供給する。
映像データ復号部13は、供給された映像データを解凍して元の映像データを復号し、映像信号処理部14に供給する。映像信号処理部14は、供給された映像データをアナログ変換して所定の信号処理を施し、立体映像を表示するための映像信号を生成し、映像信号インターフェイス15を介して3次元ディスプレイ21に出力する。
3次元ディスプレイ21は、出力された映像信号に応じた映像を表示画面に出力する。3次元ディスプレイ21は、視者に対する映像の近接、離隔等、奥行き感に富む映像を提供する。なお、3次元ディスプレイ21は、視者の両眼に異なる画像を提示して立体視させる表示装置であり、特殊な光学特性の眼鏡を併用するタイプ、または眼鏡を併用しないタイプのいずれでもよい。
音声データ復号部16は、供給された音声データを解凍して元の音声データを復号し、音声信号処理部17に供給する。音声信号処理部17は、供給された音声データをアナログ変換して所定の信号処理を施し、音声信号インターフェイス18を介してスピーカ22に出力する。スピーカ22は、供給された音声信号に応じた音声を出力する。
システムコントローラ19は、例えばマイクロプロセッサにより構成され、再生装置1の各部を制御する。システムコントローラ19は、特に、音声信号処理部17に所定の制御信号を送出することで、音声信号処理部17を制御する。なお、図1中では、表記上、システムコントローラ19と音声信号処理部17の接続のみが示されているが、システムコントローラ19は、他の各部にも接続されている。
操作信号処理部20は、リモートコントローラ23から送出された操作信号を受信し、操作信号を復調してシステムコントローラ19に供給する。リモートコントローラ23には、ボタン、キー、タッチパネル等の入力手段が配設される。
ここで、詳細は後述するが、音声信号処理部17は、音声信号に含まれる少なくとも高域成分を特徴成分Scとして抽出し、抽出された特徴成分Scの音像が音声信号の音像よりも聴取者Lに近接して定位するように、音声信号および抽出された特徴成分Scをスピーカ22に供給する。これにより、再生装置1は、立体映像の奥行き感に対応して、音響的な奥行き感を伴う音声を提供することができる。
[2.音声信号処理装置の構成]
以下では、図3〜図7を参照しながら、本発明の第1〜第5の実施形態に係る音声信号処理装置について説明する。なお、異なる実施形態の間で重複する事項については、説明を省略する。
[2−1.第1の実施形態]
図3は、本発明の第1の実施形態に係る音声信号処理装置30を示すブロック図である。図3には、音声信号処理装置30(図2に示した音声信号処理部17に相当する。)の周辺構成が示されている。
音声信号処理装置30は、音声データ復号部16とスピーカ22の間に配置される。スピーカ22は、左右のメインスピーカSPl、SPr、および左右のメインスピーカSPl、SPrよりも聴取者Lに近接して配置された左右のサブスピーカSPls、SPrsからなる。
音声信号処理装置30は、前処理部31、左スピーカSPl用の音声信号を処理する左信号処理系、および右スピーカSPr用の音声信号を処理する右信号処理系を含む。左信号処理系および右信号処理系は、特徴成分抽出部32l、32rを各々に含む。
前処理部17は、音声データ復号部16から供給された音声データから、左チャンネルおよび右チャンネルの音声信号を生成し、左信号処理系および右信号処理系に供給する。左信号処理系および右信号処理系では、同様の処理が行われるので、以下では、特に左信号処理系について説明する。
前処理部31は、左チャンネルの音声信号を左信号処理系の特徴成分抽出部32lおよび左メインスピーカSPlに供給する。特徴成分抽出部32lは、特定の帯域の音声信号を通過させるフィルタ等により構成され、供給された音声信号に含まれる特徴成分Scを抽出し、左サブスピーカSPlに供給する。
ここで、音声信号に含まれる特徴成分Scとは、オンマイクで収録された映像Vの手前側の音声Sfに多く含まれる高域・低域の音声、特に高域の音声に相当する信号成分である。音声信号は、4kHzを基準としてQ=1.5〜2.0の範囲を中域成分として、中域成分よりも低域の低域成分、および中域成分よりも高域の高域成分に区分される。
これにより、音声信号がメインスピーカSPl、SPrから出力され、特徴成分ScがメインスピーカSPl、SPrよりも聴取者Lに近接して配置されたサブスピーカSPls、SPrsから出力されることで、特徴成分Scの音像が音声信号の音像よりも聴取者Lに近接して定位する。
本実施形態によれば、音声信号をメインスピーカSPl、SPrから出力するとともに、オンマイク収録された音声Sfに特徴的な高域・低域の音声に相当する音声信号の特徴成分Scを抽出し、特徴成分Scの音像が音声信号の音像よりも聴取者Lに近接して定位するようにサブスピーカSPls、SPrsから出力することで、音響的な奥行き感に富む音声を提供することができる。
[2−2.第2の実施形態]
図4は、本発明の第2の実施形態に係る音声信号処理装置40を示すブロック図である。
本実施形態では、スピーカ22は、仮想スピーカSPlv、SPrvとしても機能する左右のスピーカSPl、SPrからなる。また、音声信号処理装置40は、前処理部41、特徴成分抽出部42l、42rの他に、近接定位処理部43l、43rおよび合成処理部4l、44rをさらに含む。以下では、特に左信号処理系について説明する。
前処理部41は、左チャンネルの音声信号を左信号処理系の特徴成分抽出部42lおよび合成処理部44lに供給する。特徴成分抽出部42lは、供給された音声信号に含まれる特徴成分Scを抽出し、近接定位処理部43lに供給する。
近接定位処理部43lは、例えばイコライザ等により構成され、供給された特徴成分Scの周波数特性および/または音量を変化させて、特徴成分Scに近接定位処理を施す。そして、近接定位処理部43lは、処理後の特徴成分Scを両信号処理系の合成処理部44l、44rに供給する。
近接定位処理では、頭部音響伝達関数等に基づく音像定位制御処理により、特徴成分Scの音像を音声信号の音像よりも聴取者Lに近接して定位させることができる。
合成処理部44lは、例えばミキサ等により構成され、前処理部41および両信号処理系の近接定位処理部43l、43rから供給された音声信号を合成処理し、左スピーカSPlに供給する。
近接定位処理された特徴成分Scの重み付けを調整することで、特徴成分Scの音像を音声信号の音像よりも聴取者Lに近接して所定の位置に定位させることができる。
これにより、音声信号がスピーカSPl、SPrから出力され、特徴成分Scが近接定位処理を施されて仮想スピーカSPlv、SPrvから出力されることで、特徴成分Scの音像が音声信号の音像よりも聴取者Lに近接して定位する。
本実施形態によれば、音声信号をスピーカSPl、SPrから出力するとともに、オンマイク収録された音声Sfに特徴的な高域・低域の音声に相当する音声信号の特徴成分Scを抽出し、近接定位処理を施して仮想スピーカSPlv、SPrvから出力することで、サブスピーカを配置せずに、音響的な奥行き感に富む音声を提供することができる。
[2−3.第3の実施形態]
図5は、本発明の第3の実施形態に係る音声信号処理装置50を示すブロック図である。
本実施形態では、音声信号処理装置50は、前処理部51、特徴成分抽出部52l、52r、近接定位処理部53l、53r、合成処理部54l、54rの他に、特徴成分減衰部55l、55rをさらに含む。以下では、特に左信号処理系について説明する。
前処理部51は、左チャンネルの音声信号を左信号処理系の特徴成分抽出部52lおよび特徴成分減衰部55lに供給する。なお、特徴成分抽出部52lおよび近接定位処理部53lの構成および動作については、第2の実施形態に係る特徴成分抽出部42lおよび近接定位処理部43lと同様であるので、説明を省略する。
特徴成分減衰部55lは、特定の帯域の音声信号を減衰させるフィルタ等により構成され、供給された音声信号に含まれる特徴成分Scを減衰させ、減衰された音声信号を合成処理部54lに供給する。ここで、音声信号に含まれる特徴成分Scとは、オンマイクで収録された映像Vの手前側の音声Sfに多く含まれる高域・低域の音声、特に高域の音声に相当する信号成分である。
合成処理部54lは、特徴成分減衰部55lおよび両信号処理系の近接定位処理部52l、52rから供給された音声信号を合成処理し、左スピーカSPlに供給する。左スピーカSPlは、減衰された音声信号に応じた音声を出力するとともに、近接定位処理後の特徴成分Scに応じた音声を出力する。
これにより、特徴成分Scを減衰された音声信号がスピーカSPl、SPrから出力され、特徴成分Scが近接定位処理を施されて仮想スピーカSPlv、SPrvから出力されることで、特徴成分Scの音像が音声信号の音像よりも聴取者Lに近接して定位し、かつ特徴成分Scを減衰された音声信号の音像が音声信号の音像よりも聴取者Lから離隔して定位する(なお、音声信号の音像は、減衰された音声信号の音像として定位する。)。つまり、特徴成分Scを減衰させることで、近接定位処理された特徴成分Scの音像と特徴成分Scを減衰された音声信号の音像の間の奥行き感をさらに拡げることができる。
本実施形態によれば、特徴成分Scを減衰された音声信号をスピーカSPl、SPrから出力するとともに、オンマイク収録された音声Sfに特徴的な高域・低域の音声に相当する音声信号の特徴成分Scを抽出し、近接定位処理を施して仮想スピーカSPlv、SPrvから出力することで、サブスピーカを配置せずに、音響的な奥行き感にさらに富む音声を提供することができる。
[2−4.第4の実施形態]
図6は、本発明の第4の実施形態に係る音声信号処理装置60を示すブロック図である。
本実施形態では、音声信号処理装置60は、前処理部61、特徴成分抽出部62l、62r、近接定位処理部63l、63r、合成処理部64l、64r、特徴成分減衰部65l、65rの他に、離隔定位処理部66l、66rをさらに含む。以下では、特に左信号処理系について説明する。
前処理部61は、左チャンネルの音声信号を左信号処理系の特徴成分抽出部62lおよび特徴成分減衰部65lに供給する。なお、特徴成分抽出部62lおよび近接定位処理部63lの構成および動作については、第2の実施形態に係る特徴成分抽出部42lおよび近接定位処理部43lと同様であるので、説明を省略する。特徴成分減衰部65lは、供給された音声信号に含まれる特徴成分Scを減衰させ、離隔定位処理部66lに供給する。
離隔定位処理部66lは、減衰されて供給された音声信号の周波数特性、音量、および/または供給タイミングを変化させて、減衰された音声信号に離隔定位処理を施す。そして、離隔定位処理部66lは、処理後の音声信号を両信号処理系の合成処理部64l、64rに供給する。
離隔定位処理では、頭部音響伝達関数等に基づく音像定位制御処理を減衰された音声信号に施し、特徴成分Scの音量を小さくし、および/または減衰された音声信号を合成処理部64l、64rに供給するタイミングを遅延させることで、減衰された音声信号の音像を音声信号の音像よりも聴取者Lから離隔して定位させることができる。特に、減衰された音声信号の出力を特徴成分Scの出力に対して遅延させることで、聴取者Lは、ハース効果により減衰された音声信号の音像よりも特徴成分Scの音像が聴取者Lに近接して定位しているように、音声信号に応じた音声を聴取する。
合成処理部64lは、両信号処理系の特徴成分減衰部65l、65rおよび近接定位処理部63l、63rから供給された音声信号を合成処理し、左スピーカSPlに供給する。左スピーカSPlは、離隔定位処理後の音声信号に応じた音声を出力するとともに、近接定位処理後の特徴成分Scに応じた音声を出力する。
これにより、特徴成分Scを減衰された音声信号が離隔定位処理を施されて第1仮想スピーカSPlv1から出力され、特徴成分Scが近接定位処理を施されて第2仮想スピーカSPlv2から出力されることで、特徴成分Scの音像が音声信号の音像よりも聴取者Lに近接して定位し、かつ減衰された音声信号の音像が音声信号の音像よりも聴取者Lから離隔して定位する(なお、音声信号の音像は、減衰された音声信号の音像として定位する。)。つまり、特徴成分Scを減衰された音声信号を離隔定位処理することで、近接定位処理された特徴成分Scの音像と離隔定位処理された音声信号の音像の間の奥行き感をさらに拡げることができる。
本実施形態によれば、特徴成分Scを減衰された音声信号を離隔定位処理を施して仮想の第1スピーカSPlv1、SPrv1から出力するとともに、オンマイク収録された音声Sfに特徴的な高域・低域の音声に相当する音声信号の特徴成分Scを抽出し、近接定位処理を施して仮想の第2スピーカSPlv2、SPrv2から出力することで、サブスピーカを配置せずに、音響的な奥行き感にさらに富む音声を提供することができる。
[2−5.第5の実施形態]
図7は、本発明の第5の実施形態に係る音声信号処理装置70を示すブロック図である。本実施形態では、音声データが5.1chのデータであり、スピーカ22が左前、中央前、右前、左後、右後およびウーハのスピーカSPfl、SPfc、SPfr、SPrl、SPrr、SPwからなる。
本実施形態では、聴取者Lがリモートコントローラ23を操作して各種の設定を指示すると、システムコントローラ19から供給される制御信号によって、音声信号処理部17の各部の処理が制御される。なお、操作信号の入力は、例えば、リモートコントローラ23、3次元ディスプレイ21等に表示されるオンスクリーンメニューを介して行われる。
前処理部71は、音声データ復号部16から供給された音声データから、左前、中央前、右前、左後、右後およびウーハの各チャンネルの音声信号を生成し、各信号処理系に供給する。前処理部71は、制御信号に応じて、スイッチ素子等を調整し、左信号処理系および右信号処理系に供給するデータを変更する。
前処理部71は、抽出処理、減衰処理、および定位処理の実行が設定されていなければ、左前、中央前、右前、左後、右後、およびウーハの各チャンネルのデータを対応するスピーカSPfl、SPfc、SPfr、SPrl、SPrr、SPwに供給する。
一方、前処理部71は、抽出処理、減衰処理、または定位処理の実行が設定されていると、中央前、左後、右後、およびウーハの各チャンネルのデータを対応するスピーカSPfc、SPrl、SPrr、SPwに供給し、左前および右前チャンネルのデータを左信号処理系および右信号処理系の特徴成分抽出部72l、72rおよび離隔定位処理部76l、76rに各々に供給する。
なお、前処理部71は、中央前のチャンネルのデータを中央前のスピーカSPfcに供給する代わりに、左前および右前のチャンネルに分割して、左前および右前のチャンネルと合わせて左信号処理系および右信号処理系の特徴成分抽出部72l、72rに供給してもよい。
これは、左後、右後、ウーハのチャンネルの音声データが主に音響的な空間の拡がり感に寄与するが、左前、中央前、右前のチャンネルの音声データは、音響的に平坦となり易く、音響的な奥行き感を拡げるために定位処理等を施すことが好ましいためである。
特徴成分抽出部72l、72rは、抽出処理の設定を指示する制御信号を供給されると、制御信号に応じて、フィルタのパラメータを調整し、特徴成分Scとして抽出する音声信号の特定の帯域を設定する。制御信号には、例えば、高域および/または低域成分の抽出処理の要否、または特定の帯域自体を指定する情報が含まれる。
近接定位処理部73l、73rは、近接定位処理の設定を指示する制御信号を供給されると、制御信号に応じて、イコライザのパラメータを調整し、特徴成分Scの周波数特性および/または音量を設定する。制御信号には、例えば、周波数特性および/または音量の変更の要否、または周波数特性および/または音量の変更条件を指定する情報が含まれる。
特徴成分減衰部75l、75rは、減衰処理の設定を変更する制御信号を供給されると、制御信号に応じて、フィルタのパラメータを調整し、特徴成分Scとして減衰させる音声信号の特定の帯域を設定する。制御信号には、例えば、高域および/または低域成分の減衰処理の要否、または特定の帯域自体を指定する情報が含まれる。
離隔定位処理部76l、76rは、離隔定位処理の設定を指示する制御信号を供給されると、制御信号に応じて、イコライザのパラメータを調整し、特徴成分Scの周波数特性、音量および/または遅延量を変更する。制御信号には、例えば、周波数特性、音量および/または遅延量の変更の要否、または周波数特性、音量および/または遅延量の変更条件を指定する情報が含まれる。
合成処理部74l、74rは、合成処理の設定を指示する制御信号を供給されると、制御信号に応じて、ミキサのパラメータを調整し、各信号処理系で近接定位および/または離隔定位された信号成分の合成条件、抽出処理および/または減衰処理された信号成分の合成条件を変更する。制御信号には、例えば、各成分の合成の要否、または各成分の重み付け等の合成条件を指定する情報が含まれる。
本実施形態によれば、聴取者Lにより指定される特徴成分抽出処理、近接定位処理、特徴成分減衰処理、離隔定位処理、および合成処理の設定状況に応じて、音響的な奥行き感が所望に調整された音声を提供することができる。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
例えば、上記実施形態では、2chの音声データを2chのスピーカSPl、SPrに出力する場合について説明した。しかし、例えば、5.1ch、7.1ch、モノラルの音声データを2ch、5.1ch、7.1ch等のスピーカに出力してもよい。
例えば、5.1ch、7.1chの音声データを2chのスピーカに出力する場合、5.1ch、7.1chのデータのうち前側の3チャンネルを左右のチャンネルに分割して、左右の信号処理系で特徴成分Scの抽出処理、近接定位処理、音声信号の減衰処理、離隔定位処理等を施し、2chのスピーカから出力してもよい。また、モノラルの音声データを2chのスピーカに出力する場合、モノラルのデータを左右のチャンネルに分割して、同様に出力してもよい。
また、上記第2〜第5の実施形態では、特徴成分抽出部42、52、62、72と近接定位処理部43、53、63、73が別々の構成からなる場合について説明した。しかし、特徴成分抽出部42、52、62、72と近接定位処理部43、53、63、73は、例えばフィルタ機能を有するイコライザ等の同一の構成からなるようにしてもよい。また、第4および第5の実施形態で説明した特徴成分減衰部65、75と離隔定位処理部66、76についても同様である。
また、第2〜第5の実施形態では、合成処理部44、54、64、74が左右の信号処理系で独立した構成からなる場合について説明したが、合成処理部44、54、64、74は、左右の信号処理系で共通する構成からなるようにしてもよい。
また、上記第5の実施形態では、第4の実施形態において音声信号処理装置60の各部の処理が制御される場合について説明したが、第1〜第3の実施形態において音声信号処理装置30、40、50の各部の処理が制御されるようにしてもよい。
1 光ディスク再生装置
30、40、50、60、70 音声信号処理装置
31、41、51、61、71 前処理部
32、42、52、62、72 特徴成分抽出部
43、53、63、73 近接定位処理部
44、54、64、74 合成処理部
55、65、75 特徴成分減衰部
66、76 離隔定位処理部
SPl、SPr、SPls、SPlr、SPfl、SPfc、SPfr、SPrl、SPrr、SPw スピーカ
SPlv、SPlr 仮想スピーカ
Sc 特徴成分
L 聴取者

Claims (13)

  1. 音声信号を処理して音声出力部に供給する音声信号処理装置であって、
    前記音声信号に含まれる少なくとも高域成分を特徴成分として抽出する特徴成分抽出部を備え、
    前記抽出された特徴成分の音像が前記音声信号の音像よりも聴取者に近接して定位するように、前記音声信号および前記抽出された特徴成分を前記音声出力部に供給する音声信号処理装置。
  2. 前記抽出された特徴成分を処理し、前記抽出された特徴成分の音像を前記音声信号の音像よりも前記聴取者に近接して定位させる近接定位処理部をさらに備え、
    前記抽出された特徴成分の代わりに前記近接定位処理された特徴成分を前記音声出力部に供給する、請求項1に記載の音声信号処理装置。
  3. 前記音声信号に含まれる特徴成分を減衰させる特徴成分減衰部をさらに備え、
    前記抽出された特徴成分の音像が前記音声信号の音像よりも前記聴取者に近接して定位し、前記減衰された音声信号の音像が前記音声信号の音像よりも前記聴取者から離隔して定位するように、前記減衰された音声信号および前記抽出された特徴成分を前記音声出力部に供給する、請求項1に記載の音声信号処理装置。
  4. 前記減衰された音声信号を処理し、前記減衰された音声信号の音像を前記音声信号の音像よりも前記聴取者から離隔して定位させる離隔定位処理部をさらに備え、
    前記減衰された音声信号の代わりに前記離隔定位処理された音声信号を前記音声出力部に供給する、請求項3に記載の音声信号処理装置。
  5. 前記離隔定位処理部は、前記減衰された音声信号を前記音声信号に対して所定の遅延量で遅延させる、請求項4に記載の音声信号処理装置。
  6. 前記特徴成分抽出部では、前記聴取者の操作指示に応じて、前記特徴成分の抽出条件が可変制御される、請求項1に記載の音声信号処理装置。
  7. 前記近接定位処理部では、前記聴取者の操作指示に応じて、前記特徴成分の近接定位処理の条件が可変制御される、請求項2に記載の音声信号処理装置。
  8. 前記特徴成分減衰部では、前記聴取者の操作指示に応じて、前記音声信号の減衰条件が可変制御される、請求項3に記載の音声信号処理装置。
  9. 前記離隔定位処理部では、前記聴取者の操作指示に応じて、前記音声信号の離隔定位処理の条件が可変制御される、請求項4に記載の音声信号処理装置。
  10. 前記音声信号が多チャンネルの信号として入力され、
    前記聴取者により指定されたチャンネルの信号を前記特徴成分抽出部に入力するように、前記音声信号の入力が可変制御される、請求項1に記載の音声信号処理装置。
  11. 前記特徴成分は、前記音声信号に含まれる高域成分および低域成分である、請求項1に記載の音声信号処理装置。
  12. 前記音声信号は、4kHzを基準としてQ=1.5〜2.0の範囲を中域成分とし、中域成分よりも低域の低域成分、および中域成分よりも高域の高域成分に区分される、請求項1に記載の音声信号処理装置。
  13. 音声信号に含まれる少なくとも高域成分を特徴成分として抽出するステップと、
    前記抽出された特徴成分の音像が前記音声信号の音像よりも聴取者に近接して定位するように、前記音声信号および前記抽出された特徴成分を音声出力部に供給するステップと、
    を含む音声信号処理方法。
JP2009197000A 2009-08-27 2009-08-27 音声信号処理装置および音声信号処理方法 Expired - Fee Related JP5682103B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2009197000A JP5682103B2 (ja) 2009-08-27 2009-08-27 音声信号処理装置および音声信号処理方法
EP10172613A EP2293602A2 (en) 2009-08-27 2010-08-12 Audio-signal processing
US12/858,532 US8929556B2 (en) 2009-08-27 2010-08-18 Audio-signal processing device and method for processing audio signal
CN201010261387.8A CN102006545B (zh) 2009-08-27 2010-08-20 音频信号处理装置和处理音频信号的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009197000A JP5682103B2 (ja) 2009-08-27 2009-08-27 音声信号処理装置および音声信号処理方法

Publications (3)

Publication Number Publication Date
JP2011049862A true JP2011049862A (ja) 2011-03-10
JP2011049862A5 JP2011049862A5 (ja) 2012-08-16
JP5682103B2 JP5682103B2 (ja) 2015-03-11

Family

ID=43244723

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009197000A Expired - Fee Related JP5682103B2 (ja) 2009-08-27 2009-08-27 音声信号処理装置および音声信号処理方法

Country Status (4)

Country Link
US (1) US8929556B2 (ja)
EP (1) EP2293602A2 (ja)
JP (1) JP5682103B2 (ja)
CN (1) CN102006545B (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2886503B1 (fr) * 2005-05-27 2007-08-24 Arkamys Sa Procede pour produire plus de deux signaux electriques temporels distincts a partir d'un premier et d'un deuxieme signal electrique temporel
US9681230B2 (en) * 2014-10-17 2017-06-13 Yamaha Corporation Acoustic system, output device, and acoustic system control method
JP6459379B2 (ja) * 2014-10-17 2019-01-30 ヤマハ株式会社 音響システム
US20160112799A1 (en) * 2014-10-17 2016-04-21 Yamaha Corporation Acoustic system, acoustic system control device, and acoustic system control method
US10271157B2 (en) * 2016-05-31 2019-04-23 Gaudio Lab, Inc. Method and apparatus for processing audio signal
US11477595B2 (en) * 2018-04-10 2022-10-18 Sony Corporation Audio processing device and audio processing method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6221400A (ja) * 1985-07-19 1987-01-29 Matsushita Electric Ind Co Ltd 音響効果装置
JPS62145935A (ja) * 1985-12-20 1987-06-30 Clarion Co Ltd マルチパス妨害時における再生音場補正回路
JP2001144656A (ja) * 1999-11-16 2001-05-25 Nippon Telegr & Teleph Corp <Ntt> 多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体
JP2005221792A (ja) * 2004-02-05 2005-08-18 Nippon Hoso Kyokai <Nhk> 音声調整回路および音声調整卓
WO2008047833A1 (fr) * 2006-10-19 2008-04-24 Panasonic Corporation Dispositif de positionnement d'image sonore, système de positionnement d'image sonore, procédé de positionnement d'image sonore, programme et circuit intégré

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2871387B2 (ja) * 1992-07-27 1999-03-17 ヤマハ株式会社 音像定位装置
US5708719A (en) * 1995-09-07 1998-01-13 Rep Investment Limited Liability Company In-home theater surround sound speaker system
US6405163B1 (en) * 1999-09-27 2002-06-11 Creative Technology Ltd. Process for removing voice from stereo recordings
US7110588B2 (en) * 2001-05-10 2006-09-19 Agfa-Gevaert N.V. Retrospective correction of inhomogeneities in radiographs
US7853341B2 (en) * 2002-01-25 2010-12-14 Ksc Industries, Inc. Wired, wireless, infrared, and powerline audio entertainment systems
JP2004328214A (ja) * 2003-04-23 2004-11-18 Yamaha Corp 車内楽音再生システム
JP2005184140A (ja) * 2003-12-16 2005-07-07 Nippon Hoso Kyokai <Nhk> 立体音響記録方法ならびに立体音響再生方法、立体音響再生装置
JP4580210B2 (ja) * 2004-10-19 2010-11-10 ソニー株式会社 音声信号処理装置および音声信号処理方法
CN101175343B (zh) * 2004-12-24 2010-04-21 松下电器产业株式会社 声像定位装置
US7441630B1 (en) * 2005-02-22 2008-10-28 Pbp Acoustics, Llc Multi-driver speaker system
JP2006324898A (ja) * 2005-05-18 2006-11-30 Sony Corp オーディオ再生装置
JP4301270B2 (ja) * 2006-09-07 2009-07-22 ヤマハ株式会社 オーディオ再生装置およびオーディオ再生方法
JP4946305B2 (ja) * 2006-09-22 2012-06-06 ソニー株式会社 音響再生システム、音響再生装置および音響再生方法
KR100788702B1 (ko) * 2006-11-01 2007-12-26 삼성전자주식회사 빔 형성 스피커 배열을 이용한 프론트 서라운드 시스템 및서라운드 재생 방법
JP5050721B2 (ja) * 2007-08-06 2012-10-17 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
JP5259622B2 (ja) * 2007-12-10 2013-08-07 パナソニック株式会社 収音装置、収音方法、収音プログラム、および集積回路

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6221400A (ja) * 1985-07-19 1987-01-29 Matsushita Electric Ind Co Ltd 音響効果装置
JPS62145935A (ja) * 1985-12-20 1987-06-30 Clarion Co Ltd マルチパス妨害時における再生音場補正回路
JP2001144656A (ja) * 1999-11-16 2001-05-25 Nippon Telegr & Teleph Corp <Ntt> 多チャンネル反響消去方法及び装置並びにそのプログラムを記録した記録媒体
JP2005221792A (ja) * 2004-02-05 2005-08-18 Nippon Hoso Kyokai <Nhk> 音声調整回路および音声調整卓
WO2008047833A1 (fr) * 2006-10-19 2008-04-24 Panasonic Corporation Dispositif de positionnement d'image sonore, système de positionnement d'image sonore, procédé de positionnement d'image sonore, programme et circuit intégré

Also Published As

Publication number Publication date
EP2293602A2 (en) 2011-03-09
CN102006545B (zh) 2014-01-08
US8929556B2 (en) 2015-01-06
US20110051936A1 (en) 2011-03-03
CN102006545A (zh) 2011-04-06
JP5682103B2 (ja) 2015-03-11

Similar Documents

Publication Publication Date Title
CN101009954B (zh) 音频再现设备及其方法
US7912566B2 (en) System and method for transmitting/receiving object-based audio
JP5682103B2 (ja) 音声信号処理装置および音声信号処理方法
US7668317B2 (en) Audio post processing in DVD, DTV and other audio visual products
CN101990075B (zh) 显示装置和音频输出装置
CN104380763B (zh) 用于驱动车辆内的音响系统的扬声器的装置和方法
JP2006303658A (ja) 再生装置および再生方法
JP5499469B2 (ja) 音声出力装置、映像音声再生装置及び音声出力方法
JP2005080079A (ja) 音声再生装置及び音声再生方法
KR20060041735A (ko) 음향 수음 장치, 음향 수음 방법, 기록 매체
US9226091B2 (en) Acoustic surround immersion control system and method
JP2009260458A (ja) 音響再生装置、および、これを含む映像音声視聴システム
JP2011049862A5 (ja)
JP2006245680A (ja) 映像音響再生方法及び映像音響再生装置
JP2007028065A (ja) サラウンド再生装置
WO2011068192A1 (ja) 音響変換装置
TWI699122B (zh) 多聲道音訊控制系統
JPH1118199A (ja) 音響処理装置
JP2010278819A (ja) 音響再生システム
WO2021124906A1 (ja) 制御装置、信号処理方法およびスピーカ装置
KR20030003743A (ko) 여러개의 실제 스피커 및 적어도 하나의 가상 스피커를통해 다중 채널 오디오 사운드를 재생하는 방법
KR200314345Y1 (ko) 5.1채널 헤드폰 시스템
JP2004017914A (ja) Avシステム
JP2004328519A (ja) 音声再生装置及び映像受信装置
KR200401419Y1 (ko) 스테레오 헤드폰 시스템

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120703

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120703

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131029

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140430

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141229

LAPS Cancellation because of no payment of annual fees