JP5649934B2 - サウンドエンハンスメント装置及び方法 - Google Patents

サウンドエンハンスメント装置及び方法 Download PDF

Info

Publication number
JP5649934B2
JP5649934B2 JP2010268165A JP2010268165A JP5649934B2 JP 5649934 B2 JP5649934 B2 JP 5649934B2 JP 2010268165 A JP2010268165 A JP 2010268165A JP 2010268165 A JP2010268165 A JP 2010268165A JP 5649934 B2 JP5649934 B2 JP 5649934B2
Authority
JP
Japan
Prior art keywords
signal
low
frequency signal
bse
harmonic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010268165A
Other languages
English (en)
Other versions
JP2011125004A (ja
Inventor
▲じょん▼ 宇 崔
▲じょん▼ 宇 崔
晶 ▲ほ▼ 金
晶 ▲ホ▼ 金
榮 泰 金
榮 泰 金
▲祥▼ 鐵 高
▲祥▼ 鐵 高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2011125004A publication Critical patent/JP2011125004A/ja
Application granted granted Critical
Publication of JP5649934B2 publication Critical patent/JP5649934B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/46Volume control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/155Musical effects
    • G10H2210/265Acoustic effect simulation, i.e. volume, spatial, resonance or reverberation effects added to a musical sound, usually by appropriate filtering or delays
    • G10H2210/295Spatial effects, musical uses of multiple audio channels, e.g. stereo
    • G10H2210/301Soundscape or sound field simulation, reproduction or control for musical purposes, e.g. surround or 3D sound; Granular synthesis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/025Envelope processing of music signals in, e.g. time domain, transform domain or cepstrum domain
    • G10H2250/031Spectrum envelope processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/09Electronic reduction of distortion of stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)

Description

本発明は、音声信号処理に係り、より詳細には、心理音響効果を用いて自然な聴覚環境を提供する装置及び方法に関する。
最近、TV、ホームシアターなどの装備やモバイルフォンなどで、より小型化、薄型化される機器の特性上、小型ラウドスピーカーに対する要求が高まりつつある。ラウドスピーカの特性上、その容積が小型化されるにつれて、音を発生可能な周波数範囲が制限され、特に、中低周波帯域の音響が低下する問題を有している。
また、最近、周辺他人に騷音公害を誘発せず、イヤホンやヘッドセットなしに特定聴取者にのみ音を伝達することができるパーソナルサウンドゾーン技術に対する関心が高まりつつある。パーソナルサウンドゾーンを形成するために、多数のスピーカーを駆動した時、発生する音の指向性を利用する方法が利用される。音の指向性を生成するために、多数個のスピーカーの入力信号に時間遅延や特定フィルターを付与して出力されるサウンドビームを生成することによって、特定方向及び特定位置に音を集中させる。多数のラウドスピーカーで構成された機器の特性上、個別スピーカーが小型化されて、発生可能な周波数帯域が制限されうる。
本発明が解決しようとする課題は、広帯域信号に対しても、低い混変調歪み成分を有し、聴感上で自然な心理音響的なベースエンハンスメント(BSE)技法を利用した音声処理装置及び方法を提供することである。
一態様によるサウンドエンハンスメント(Sound Enhancement)装置は、処理部と、BSE信号生成部と、利得制御部とを含む。処理部は、原信号を高周波信号及び低周波信号に分離し、前記低周波信号を分析して、低周波信号により発生される歪みの程度に関する予測情報を取得する。心理音響的なベースエンハンスメント(BSE)信号生成部は、低周波信号の高調波信号を、低周波信号に代わるBSE信号として生成する。高調波信号の次数は、歪みの程度に関する予測情報に基づいて調整される。利得制御部は、歪みの程度に関する予測情報に基づいて、低周波信号とBSE信号との合成比率を適応的に調節する。
記処理部は、低周波信号を複数のサブバンドに従って分類し、各サブバンドに対応する信号により生成される歪みの程度に関する予測情報を生成する。歪みの程度に関する予測情報は、調性(トーナリティー)情報及び包絡線(エンベロープ)情報を含む。
BSE信号生成部は、包絡線情報を用いて複数のサブバンドに対応する信号の振幅が一様になるように調整して正規化された信号を生成し、調性情報に基づいて前記正規化された信号の前記BSE信号として高調波信号を適応的に生成する。
BSE信号生成部は、包絡線情報を用いて複数のサブバンドに対応する信号の振幅が一様になるように調節して正規化された信号を生成する第1調整部と、正規化された信号を調性情報と乗算する第2調整部と、調性情報により乗算された信号のBSE信号として高調波信号を生成する非線形デバイスとを含む。
サウンドエンハンスメント装置は、第2調整部から出力される信号のうち、高い調性をもつ信号に対してスペクトルの先鋭化(シャープニング)を行うスペクトル先鋭化部を更に含み、非線形デバイスは、スペクトルの先鋭化が行われた信号について高調波信号を生成する。
低周波信号が、調性情報に基づいて低い調性を有すると判定された場合、利得制御部は、低周波信号の一部がBSE信号の一部よりも大きいように、低周波信号のBSE信号に対する合成比率を調節して、利得が調節された信号を生成する。
利得制御部は、BSE信号の音の強さが高周波信号によってマスクされないように、高周波信号のマスキングレベルを超えるようにBSE信号の音圧を増幅する。
サウンドエンハンスメント装置は、高周波信号及び前記利得が調節された信号を合成する後処理部を更に含む。後処理部は、合成された信号が出力される時、放射パターンを形成するために合成された信号を処理するビーム成形部と、処理された合成された信号を出力するアレイスピーカーとを含む。
他の態様によるサウンドエンハンスメント方法は、原信号を高周波信号及び低周波信号に分離し、低周波信号を分析して、低周波信号により発生される歪みの程度に関する予測情報を生成する段階と、低周波信号の高調波信号を、低周波信号に代わる心理音響的なベースエンハンスメント(BSE)信号として生成する段階と、高調波信号の次数は、歪みの程度に関する予測情報に基づいて調整され、歪みの程度に関する予測情報に基づいて、低周波信号とBSE信号との合成比率を適応的に調節する段階とを含む。
他の態様によるサウンドエンハンスメント方法で、歪みの程度に関する予測情報を生成する段階は、低周波信号を複数のサブバンドに従って分類する段階と、各サブバンドに対応する信号により生成される歪みの程度に関する予測情報を生成する段階とを含む。歪みの程度に関する予測情報は、調性情報及び包絡線情報を含む。
高調波信号を生成する段階は、包絡線情報を用いて複数のサブバンドに対応する信号の振幅が一様になるように調整して正規化された信号を生成し、調性情報に基づいて正規化された信号のBSE信号として高調波信号を適応的に生成する段階とを含む。
調性情報に基づいて適応的に正規化された信号の高調波信号を生成する段階は、正規化された信号を調性情報と乗算する段階と、調性情報で乗算された信号のうち、高い調性をもつ信号に対してスペクトルの先鋭化を行う段階と、スペクトルの先鋭化が行われた信号について高調波信号をBSE信号として生成する段階とを含む。
低周波信号のBSE信号に対する合成比率を適応的に調節する段階は、低周波信号が、調性情報に基づいて低い調性を有すると判定された場合、低周波信号の一部がBSE信号の一部よりも大きいように、低周波信号のBSE信号に対する合成比率を調節して、利得が調節された信号を生成する段階を含む。
低周波信号のBSE信号に対する合成比率を適応的に調節する段階は、BSE信号の音の強さが高周波信号によってマスクされないように、高周波信号のマスキングレベルを超えるようにBSE信号の音圧を増幅する段階を更に含む。
他の態様によるサウンドエンハンスメント方法は、高周波信号及び利得が調節された信号を合成する段階を更に含む。合成する段階は、合成された信号が出力される時、予め決定された放射パターンを形成するために合成された信号を処理する段階を更に含む。
また、他の態様による音声処理装置は、原信号を高周波信号及び低周波信号に分離し、低周波信号により発生される歪みの予測される程度を含む予測情報を取得する処理部と、低周波信号の前記予測される程度に基づいて、低周波信号の一部を代替する高調波信号を生成する適応的高調波信号生成部と、低周波信号の一部の高調波信号への変換比率を適応的に調整して、不均一な高調波量を減少させ、利得が調整された低周波信号を生成する利得制御部とを含む。
また他の態様による音声処理装置の処理部は、低域フィルタ、マルチバンドスプリッタ、及び歪み予測情報抽出部を含む。
マルチバンドスプリッタは、低周波信号を複数のサブバンドに分離し、歪み予測情報の抽出部は、各サブバンドの信号について歪み予測情報を生成する。マルチバンドスプリッタは、低周波帯域の信号を複数個のサブバンド別に分離し、各サブバンドの信号に対して歪曲発生量の予測情報を生成することができる。歪み予測情報抽出部は、各サブバンドについて調性情報及び包絡線情報を取得する。
適応的高調波信号生成部は、低周波信号の歪みの予測される程度に基づいて、高調波信号の次数を調整することで高調波信号を生成する。
利得制御部は、低周波信号の歪みの予測される程度に基づいて、低周波信号及び生成された高調波信号の合成比率を適応的に調節する。
利得制御部は、低周波信号及び生成された高調波信号の合成比率を適応的に調節する利得処理部を更に含む。
利得処理部は、調性情報に基づいて、低周波信号及び生成された高調波信号の合成比率を適応的に調節する。
利得制御部は、高周波信号の特性に基づいて高調波信号の利得を調整する。
また、他の態様による音声処理装置は、 低周波信号と生成された高調波信号とが合成された信号と共に、高周波信号を出力する更なる処理部を更に含む。更なる処理部は、合成された信号が出力される時、放射パターンを形成するために合成された信号を処理するビーム成形部と、処理された信号を出力するアレイスピーカーとを含む。
また、他の態様による音声処理装置は、原信号を高周波信号及び低周波信号に分類し、低周波信号を複数の低周波のサブバンドに分割し、各低周波のサブバンドに対して行われた非線形処理に基づいて、各低周波のサブバンドによって発生される歪みの予測される程度を含む予測情報を取得する処理部と、低周波信号の歪みの予測される程度に基づいて、各低周波のサブバンドを代替する高調波信号を生成する適応的高調波信号生成部と、低周波信号及び高調波信号の合成比率を適応的に調整して不均一な高調波量を減少させ、利得が調整された低周波信号を生成する利得制御部とを含む。
サウンドエンハンスメントの全体構成の一例を示す図である。 図1の処理部の構成の一例を示す図である。 図2の歪み予測情報抽出部の構成の一例を示す図である。 図1のBSE信号生成部の構成の一例を示す図である。 エンベロープの大きさの変化による高調波発生比率の変化を示す図である。 エンベロープの大きさの変化による高調波発生比率の変化を示す図である。 調性(トナル)成分とフラットなスペクトルとが混在された信号に対するBSE処理結果を示す図である。 スペクトルの先鋭化が行われた信号に対するBSE処理結果を示す図である。 図1の利得制御部の構成の一例を示す図である。 図1の後処理部の構成の一例を示す図である。 図1の後処理部の構成の一例を示す図である。 図1の後処理部の構成の一例を示す図である。 サウンドエンハンスメント方法の動作順序の一例を示すフローチャートである。
以下、添付した図面を参照して、本発明の一実施形態を詳しく説明する。本発明を説明するに当たって、関連した公知機能または構成についての具体的な説明が、本発明の要旨を不明にする恐れがあると判断される場合には、その詳細な説明を省略する。また、後述する用語は、本発明での機能を考慮して定義された用語であって、これは、ユーザ、運用者の意図または慣例などによって変わりうる。したがって、その定義は、本明細書全般に亘った内容に基づいて下さなければならない。
高調波を用いて、低音を認知させる現象を心理音響では、仮想ピッチ(virtual pitch)又は失われた基底音(missing fundamental)と称する。さらに詳しくは、基本周波数ωを有する音と、その高調波(2ω、3ω、4ω、...)のみで構成された音が類似したピッチを有する現象を言う。このような現象を用いて実際に低音を発生させずとも、低音の聴感を提供する技法をBSE(Psychoacoustic Bass Enhancement)(以下、BSEと略称する)と言う。
通常、高調波信号の生成に非線形デバイス(non−linear device)が利用される。このような非線形デバイスは、高調波信号を発生させる時、高調波成分の以外の他の周波数成分が発生する。このような高調波ではない(non−harmonic)成分による音声信号の歪みを混変調歪み(inter−modulation distortion;以下、IMDと略称する)と言う。このようなIMDは、その大きさが原音より小さくなくて、低音補強技法を使用時に音質劣化の主要原因となる。
BSEによって処理しようとする帯域の周波数が広い場合には、多様なスペクトルの音成分が存在するので、IMDが問題となる。また、このような、IMDは、原音成分に対してさらに高次の高調波信号を発生させるほど大きく発生する傾向があるので、仮想ピッチをより増加させるために、より高次の高調波信号を使うほど音質が低下する。
図1は、サウンドエンハンスメント装置の全体構成の一例を示す図である。
音声指向パターン生成装置100は、処理部110、BSE信号生成部120、利得制御部130、後処理部140及びアレイスピーカ150を含みうる。
処理部110は、高周波帯域の信号及び低周波帯域の信号に分離し、低周波帯域の信号を分析して、歪み発生量の予測情報を生成する。ここで、低周波帯域は、一実施形態によって、BSEが適用されない高周波帯域を除いた周波数帯域であって、実際に入力される音源の中間周波数帯域を含みうる。すなわち、低周波帯域は、一般的にサブウーファーが処理する低周波帯域より広い範囲の帯域を意味する。
例えば、周波数範囲は、仮想ピッチ(ピッチ強度)に基づくことができる。予測されたピッチ強度がさらに強いほど原音のピッチは、その高調波として強く認識される。例えば、250Hz以下の周波数成分は強いピッチ強度を有するものであって、すなわち、低周波帯域の信号として決定されうる。しかし、このようなピッチ強度は、単に例示的なものであり、サウンドエンハンスメント装置は、これに限定されるものではない。説明したように、強いピッチ強度を有する周波数成分は、高調波に代替されうる。
処理部110は、低周波帯域の信号を予め決定されたサブバンドに分離し、各サブバンドの信号から、フレーム単位で歪み発生量の予測情報としてトーナリティー情報及び/又はエンベロープ情報を抽出することができる。トーナリティー情報及び/又はエンベロープ情報は、各サブバンドに対して非線形処理が行われた後に、各サブバンドの信号から生成される歪み発生量の予測に利用されうる。エンベロープ情報は、例えば、信号のエネルギー、信号の音の強さ(ラウドネス)などを含みうる。
BSE信号生成部120は、歪み発生量の予測情報によって低周波帯域の信号に対して高調波信号の次数を調整して、高調波信号を生成する。例えば、BSE信号生成部120は、各サブバンドのトーナリティー情報及びエンベロープ情報に基づいて、適応的な高調波信号を生成することができる。サブバンドによって発生する予測された歪み発生量に基づいて、BSE信号生成部120は、サブバンドを代替する高調波信号の次数を調整することができる。
BSE信号生成部120は、分割された音声信号を入力され、音声信号が非線形処理を経れば、低周波帯域の信号の歪み発生量を分析し、予測することができる。該予測された歪み発生量に基づいて、BSE信号生成部120は、各サブバンドの利得を適応的に制御することができて、歪みが発生する機会が少ないサブバンドがさらに高い次数の高調波を生成することができる。各サブバンドの相異なる利得制御は、周波数帯域に亙って高調波の発生量を均等ではないようにできる。これを補償するために、生成された高調波と元のサブバンド信号との合成比率が変更されうる。
仮想ピッチをさらに増加させるのに利用される高調波信号の次数がさらに高いほど、音質の劣化はさらに大きくなる。したがって、さらに高い歪み発生量を起こすと予測されるサブバンドは、さらに低いエンベロープ及びさらに低い次数を有する高調波信号に調整され、さらに低い歪み発生量を起こすと予測されるサブバンドはさらに高いエンベロープ及びさらに高い次数を有する高調波信号に調整されうる。これにより、BSE信号生成部120は、歪みを起こすサブバンドを回避することができる。
生成された高調波信号は、元の低周波帯域の信号を代替する信号であって、以下では、BSE信号と称する。BSE信号生成部120は、歪み発生量の予測情報のうち、音源のスペクトルによるトーナリティー情報によって適応的に高調波の発生量を調節することができる。また、BSE信号生成部120は、低周波帯域の信号に対してスペクトルの先鋭化技法を行ってIMDをさらに低減させることができる。
利得制御部130は、歪み発生量の予測情報によって低周波帯域の信号とBSE信号との合成比率を利得調節によって適応的に調節して、出力される低周波帯域の信号を生成する。例えば、利得制御部130は、所望の生成される高調波信号の量に基づいて、低周波帯域信号のBSE信号への変換比率を適応的に調整することができる。各サブバンドの相異なる利得制御は、周波数帯域に亙って高調波の量を均一ではないようにできる。これを補償するために、生成された高調波及び元のサブバンド信号の合成の比率が適応的に調整されて不均一な高調波量を防止するか、減少させることができる。
後処理部140は、高周波帯域の信号及び利得制御部130によって利得が調節された低周波帯域の信号を合成する。後処理部140は、合成された信号が出力される時、既定の放射パターンを形成するように合成された信号を処理し、該処理された信号を出力することができる。例えば、処理された信号は、スピーカーに出力される。
IMD成分の発生量を予測して適応的に高調波信号の次数及びその増幅比を調節することによって、音質劣化を最小化させながら、可能な限り多くの低周波成分を高周波帯域に置き換えうる。このように処理された信号が、小型ラウドスピーカーシステムに適用される場合、広帯域の低周波帯域の信号に対して低いIMD成分を有し、聴感上で自然なBSE信号を発生させることができる。
図2は、図1の処理部110の構成の一例を示す図である。
前処理部110は、低域フィルタ210、マルチバンドスプリッタ220、歪み予測情報抽出部230及び高域フィルタ240を含みうる。
低域フィルタ210は、入力信号のうち、BSE信号を発生させる低周波帯域(又は中低周波帯域)の信号を分離する。
マルチバンドスプリッタ220は、低域フィルタ210によって分離された低周波帯域の信号に対するIMDを低減させるために、低周波帯域の信号を複数のサブバンドに分離する。これは、式(1)で表わすことができる。ここで、サブバンド信号は、1オクターブ又は1/3オクターブフィルタなど聴感特性によって多様な形態で提供されることがある。
Figure 0005649934
ここで、ORG(t)は、低域フィルタ210によって分離された低周波帯域の原音信号を表わし、ORG (m)(t)は、各サブバンドに対する原音信号を表わす。
このように、低周波帯域を複数のサブバンドに分割し、該分割されたサブバンド成分に対して歪み予測情報を抽出し、今後複数のサブバンドに対する信号にそれぞれ低音補強処理BSEを行うことによって、IMDを低減させることができる。詳細には、複数のサブバンドに対する信号にそれぞれ低音補強処理BSEを行えば、相異なる周波数帯域間の混変調は発生せず、帯域内の周波数成分の間でのみ混変調が発生するので、全体信号にBSEを適用する場合に比べて混変調を低減させることができる。
歪み予測情報抽出部230は、マルチバンド信号のそれぞれに対してエンベロープ情報及びトーナリティーパラメータを歪み発生量の予測情報として抽出する。
エンベロープ情報は、BSE信号生成部120のBSE処理で高調波発生量の調節に使われる。トーナリティー情報は、各スペクトルが平坦な程度を表わすパラメータであり、IMDの発生量の調節に使われる。
BSEは、原音成分にピッチが強い成分に対して適用が必要であり、原音にピッチが存在しない場合や、IMDが過度に発生する場合には、BSEを適用する必要がない。例えば、ノイズのような音声信号や、インパルシブサウンド(implusive sound)の場合には、平坦なスペクトルを有するので、ピッチを表わさず、またあらゆる周波数成分が同等の大きさを有するので、歪みが過度に発生する。
したがって、原音成分によってBSE信号の発生量を調節し、ピッチ強度が低いか、歪みが過度に発生する場合、BSE信号に比べて原音の比重を高めて自然な処理結果が得られる。平坦なスペクトルとピッチ成分を有するスペクトルとを区別するために、複数のサブバンドの各周波数バンド毎にスペクトルのトーナリティーを計算することができる。
高域フィルタ240は、入力信号のうち、高周波帯域の信号を分離する。高周波帯域の信号に対しては、BSE信号処理が行われない。
歪み予測情報抽出部230は、図3に示されたように構成することができる。
図3は、図2の歪み予測情報抽出部230の概略的構成の一例を示す図である。
歪み予測情報抽出部230は、トーナリティー検出部232及びエンベロープ検出部234を含みうる。
トーナリティー検出部232は、m個のマルチバンド信号ORG(1)(t)、...、ORG(m)(t)のそれぞれに対してトーナリティーSFM(1)(t)、...、SFM(m)(t)を検出する。先立って各分離された、各周波数帯域の信号のうち、m番目のバンドの信号のn番目のタイムフレーム区間をORG(m,n)(t)と言う。ここで、タイムフレームは、信号の特定視覚で一定の長さの区間を抽出したものであって、各タイムフレームは、時間に対して互いに部分重畳されるものであり得る。
前述したように、平坦なスペクトルとピッチ成分を有するスペクトルとを区別するために、各周波数バンドのタイムフレーム別に、スペクトルのトーナリティーを計算することができる。トーナリティーは、信号がどれほど純音に近いかを表わすものであって、多様な方法で定義されることができるが、一般的に、次のような定義(spectral flatness measure;SFM)が多く使われる。
Figure 0005649934
ここで、AM(m,n)(f)は、ORG(m,n)(t)の周波数スペクトルを表わす。AM(m,n)(f)は、離散フーリエ変換を通じて離散化された周波数f=lΔfに対するスペクトルが得られる。ここで、lは0より大きい整数である。GMは、スペクトルA(m,n)(f)の幾何平均(geometricmean)を表わし、AMは、算術平均(arithmetic mean)を表わす。このように定義されたトーナリティーは、純音成分である場合、1の値を表わし、完壁に平坦なスペクトルの場合、0の値を表わす。
トーナリティー検出部232は、各タイムフレームで得られたトーナリティー測定値SFM(m、n)に補間処理を行い、該補間の結果生成された値を時間軸で連続した値に変換する。このような方法で、トーナリティー検出部232は、最終的に各周波数帯域別に連続した信号SFM(m)(t)を獲得することができる。該取得されたトーナリティー測定値は、原音のピッチ強度及びIMD発生量を代表する。トーナリティー値が高いほどピッチ強度が高く、歪み発生量が少ない信号として扱われる。
エンベロープ検出部234は、m個の各マルチバンド信号ORG(1)(t)、...、ORG(m)(t)のそれぞれに対してエンベロープ情報ENV(1)(t)、...、ENV(m)(t)を検出する。
図3には、m番目のバンド信号ORG(m)(t)に対するエンベロープ情報及びトーナリティー情報を抽出する構成に対して示している。歪み予測情報抽出部230のトーナリティー検出部232及びエンベロープ検出部234は、各サブバンド信号を処理するために、サブバンドの個数に対応する個数のトーナリティー検出部及びエンベロープ検出部を含んで構成することができる。
図4は、図1のBSE信号生成部120の概略的構成の一例を示す図である。
BSE信号生成部120は、歪み予測情報抽出部230から抽出されたトーナリティー情報及びエンベロープ情報を用いて適応的に高調波信号を生成する。適応的に生成された高調波信号をBSE信号と言う。BSE信号生成部120は、エンベロープ情報適用部410、第1乗算部420、第2乗算部430、スペクトル先鋭化部440及び非線形デバイス450を含みうる。
図4は、m番目の帯域の信号ORG(m)(t)に対するBSEを行うためのブロック図であって、BSE信号生成部120は、他のそれぞれの帯域の信号に対しても、並列的にBSEを行うための機能ブロックをさらに含む。
入力の大きさ変動によるBSE効果の変化、すなわち、動的範囲の変化による高調波発生量の変化を防止するために、BSE演算を行う前に入力信号のピークエンベロープを一様にする処理が行われる。
エンベロープ情報適用部410は、入力信号のピークエンベロープ(x)を入力信号を均一化するための値(1/x)に変換する。第1乗算部420は、値(1/x)と信号ORG(m)(t)とを乗算することによって、信号ORG(m)(t)のエンベロープを均一化する。
m番目のサブバンドの音源信号をORG(m)(t)とし、抽出されたエンベロープ情報をENV(m)(t)とすれば、エンベロープ情報適用部410及び第1乗算部420は、ORG(m)(t)をENV(m)(t)で割て単位エンベロープを有する信号に変換させて均一化された信号nORG(m)(t)を生成することができる。これは、式(3)のように表わすことができる。
Figure 0005649934
一実施形態では、抽出された信号エンベロープに測定されたトーナリティーを乗算して、トナル成分の場合、より高い次数の高調波信号を生成し、平坦なスペクトルに対しては、その高調波の大きさを幾何級数的に減少させる。これは、式(4)で表わすことができる。
Figure 0005649934
この方法を使えば、IMD発生量が少なく、ピッチが強い信号の場合には、高次の高調波が発生し、IMDが容易に発生する信号の場合には、高次の高調波の発生量が多くないように、低次の高調波のみ発生する効果が得られる。
そのために、第2乗算部430は、均一化された信号nORG(m)(t)に抽出されたトーナリティーSFM(m)(t)を乗算するように構成することができる。エンベロープ情報適用部410、第1乗算部420及び第2乗算部430は、機能的にエンベロープ情報を用いて、各サブバンドの信号の大きさを均一化する第1調整部及び正規化された信号にトーナリティー情報を乗算する第2調整部で構成することができる。
非線形デバイス450は、入力される信号に対して高調波を生成する。非線形デバイス450としては、乗算器、クリッパなどが使われる。
非線形デバイス450は、均一化された信号nORG(m)(t)にトーナリティー情報SFM(m)(t)を乗算した信号に対する高調波を生成することによって、IMD発生量が高いと予測される信号に対しては、低いエンベロープを有するようにできる。したがって、IMD発生量が高いと予測される信号に対しては、低次の高調波のみを生成することによって、高次の高調波の生成時に発生する高い歪みを防止することができる。
このように、トーナリティーによって他のBSEを行う理由について、図5A及び図5Bを参照して説明する。図5A及び図5Bは、エンベロープの大きさの変化による高調波の発生比率の変化を示す図である。
多くの非線形デバイスであるBSEプロセッサは、非線形特性と同時に不均一な特性を有する。ここで、不均一とは、入力信号が増幅された時、BSEプロセッサの出力の大きさが線形的に比例して増加しない特性を言う。
図5Aで、非線形デバイス510が、乗算器であると仮定する。乗算器510として使って高調波を発生させる時、その入力の大きさをc倍ほど増幅させるならば、j番の乗算演算を経た信号の大きさは、式(5)のように表わすことができる。
Figure 0005649934
図5Aに示されたように、増幅比cが1であれば、非線形デバイス510に入力された信号に対して、次数に無関係に一定の大きさの高調波信号が出力される。
しかし、図5Bに示されたように、c<1である増幅比を使えば、乗算器510を経た高調波の次数が高くなるほどその大きさが幾何級数的に減少する。すなわち、高次の高調波が低次の高調波に比べて非常に小さな信号を得るようになる。
このような効果を利用すれば、非線形デバイス510で発生する高調波の大きさを容易に変化させることができ、結果的に、高調波の次数が調節される。
IMD発生量によって高調波の次数を調節する方法の以外にも、よりIMDを減衰するために、BSE信号生成部120にスペクトル先鋭化部440がさらに含まれうる。スペクトル先鋭化部440は、第2乗算部430から出力される信号にトーナリティー情報を用いてスペクトル先鋭化を行うことができる。
図6Aは、トナル成分と平坦なスペクトルとが混在された信号に対するBSE処理の結果を表わし、図6Bは、スペクトルの先鋭化が行われた信号に対するBSE処理の結果を示す図である。
図6Aに示されたように、グラフ610のように一つの帯域内に平坦なスペクトルとトナル成分とが混在されている信号に対して高調波を生成すれば、グラフ620のように平坦なスペクトルとトナル成分との間のIMDは、広い帯域に亙って発生する。このような、現象を低減するために、スペクトルの領域でピーク成分のみが維持され、ノイズのようなスペクトルは低減するように、スペクトルを拡張するスペクトルの先鋭化を行う。平坦なスペクトルとトナル成分とが混在されている信号をスペクトルの先鋭化によって処理すれば、スペクトルでピーク成分のみが維持されうる。図6Bを参照すると、スペクトルの先鋭化が行われた信号630に対してBSEを適用すれば、グラフ640に示されたように、広い帯域に亙って発生するIMDを低減することができる。
再び図4を参照すると、スペクトルの先鋭化部440の動作は、式(6)で表わすことができる。
Figure 0005649934
ここで、αは、スペクトルの先鋭化の量を調節するチューニングパラメータであり、トーナリティー測定と連動されて変更されうる。例えば、スペクトルの先鋭化のための情報として式(7)に表われたように、トーナリティー情報を利用することができる。
Figure 0005649934
ここで、ηは、トーナリティーを反映する程度を表わし、ユーザによって調節される。
スペクトルの先鋭化部440は、トーナリティーが高い信号に対してのみ、部分的にスペクトルの先鋭化を使って音質の変化を最小化することができる。言い換えれば、スペクトルの先鋭化部440は、周波数領域でピーク成分を除いた残りのスペクトル成分を除去して、広帯域信号とトーナリティー成分との間の歪みを抑制する。
非線形デバイス450は、スペクトルが先鋭化された信号に対する高調波信号を生成する。点線矢印で表わしたように、非線形デバイス450は、BSE信号発生後に、原音信号のエンベロープ情報によってBSE信号が対応する元の低周波信号のエンベロープを有するように、BSE信号のエンベロープを復元することができる。
図7は、図1の利得制御部130の構成の一例を示す図である。
利得制御部130は、IMD発生量によってBSE信号と原音との合成比率を調節する部分702、704、706、708、710と、高周波帯域の信号の特性によって再びBSE信号の利得を調節する部分712、714、716、718、720、722とで構成することができる。図7は、m番目の帯域の原音信号ORG(m)(t)、m番目の帯域のBSE信号BSE(m)(t)に対する合成のために、それぞれの利得を調整するためのブロック図を中心に表わしたものであって、利得制御部130は、他のサブバンドの原音信号及びBSE信号に対して、それぞれ並列的に利得を調節するための機能ブロックをさらに含む。
まず、IMD発生量によってBSE信号と原音との比率を調節する部分702、704、706、708、710の動作について説明する。
原音の低周波帯域の音を最大限維持するためには、生成されたBSE信号と原音とのラウドネスを一致させることが重要である。BSE利得処理部706は、測定されたトーナリティー情報によって処理されていない低周波帯域信号とBSE信号との比率を適応的に調整する。これを通じて、BSEを適用しない信号フレームに対しては、原音の比率を高めて、歪みが少なくより自然な音を具現することができる。
第1エネルギー検出部702は、原音低周波成分ORG(m)(t)のラウドネス
Figure 0005649934
を検出する。第2エネルギー検出部704は、BSE信号BSE(m)(t)のラウドネス
Figure 0005649934
を検出する。ラウドネスは、信号のRMS(Root−Mean−Square)の大きさを基準に算出され、またはラウドネスメーターを用いて正確に算出される。
BSE利得処理部706は、原音低周波成分ORG(m)(t)のラウドネス
Figure 0005649934
及びBSE信号BSE(m)(t)のラウドネス
Figure 0005649934
を用いて、それぞれの利得調節値g (m)(t)及びg (m)(t)を生成する。BSE利得処理部706は、歪み予測情報抽出部230で抽出されたトーナリティーSFMを用いて利得調節値g (m)(t)及びg (m)(t)を生成する。
BSE利得処理部706は、BSE信号BSE(m)(t)の利得調節値g (m)(t)はトーナリティーに比例する値で設定し、原音低周波成分ORG(m)(t)の利得調節値g (m)(t)は、トーナリティーに反比例するように設定することができる。これによれば、原音は、信号のトーナリティーに反比例して、その量が縮小され、該縮小された量ほどのエネルギーがBSE信号に置き換えられる。したがって、トーナリティーが高い場合、BSE信号をより多く添加して性能を高め、トーナリティーが低い場合、原音の比率を高めてIMDを最小化することができる。
第1乗算部708は、BSE信号BSE(m)(t)に利得調節値g (m)(t)を乗算する。このように、BSE信号に利得調節値g (m)(t)が乗算されて生成されたwBSE(weighted BSE)信号wBSE(m)(t)は、各サブバンドに対して計算される。
第2乗算部710は、原音低周波成分ORG(m)(t)の利得調節値g (m)(t)を乗算する。第2乗算部710によって生成された信号wORG(m)(t)は、後処理部140の低周波ビーム処理部610に伝達される。
前述したように、原音低周波成分ORG(m)(t)及びBSE信号BSE(m)(t)に対する処理過程は、式(8)のように表わすことができる。
Figure 0005649934
次いで、高周波帯域の信号の特性によって、再びBSE信号の利得を調節する部分712、714、716、718、720、722について説明する。
合算部712は、各サブバンドのwBSE信号を合算して、合算信号tBSE(t)を生成する。合算された信号tBSE(t)と高周波成分は、同じ周波数帯域に位置するので、相互マスキング効果によって合算信号tBSE(t)が聞こえないこともある。マスキング効果とは、人間の音の知覚特性のうち一つであって、一つの音に対して周辺の周波数成分の音が影響を受けることを意味する。すなわち、マスキングサウンドの妨害によって最小可聴値が増加する現象を意味し、ある音がまた他の音を聞くことができる能力を減少させる現象を意味する。
合算信号tBSE(t)の増幅比g(t)を算出するために、合算信号tBSE(t)及び高周波信号HP(m)(t)信号のそれぞれのラウドネスが分析されなければならない。
このために、ラウドネス検出部714は、合算された信号tBSE(t)に対するラウドネスgtbse(t)を検出する。また、マスキングレベル検出部716は、高周波信号HP(m)(t)の音量を分析して、そのマスキングレベルgmsk(t)を算出する。
制御利得処理部718は、マスキング効果によってBSE信号が聞こえない現象を防止するために、合算信号tBSE(t)のレベルが、高周波信号HP(m)(t)のマスキングレベルより高いように増幅比gを算出する。増幅比gは、式(9)で表わすことができる。
Figure 0005649934
合算部722は、増幅されたBSE信号と原音の高周波成分とを合算して、最終的な高周波帯域信号を生成する。
図8A乃至図8Cは、図1の後処理部140の構成の一例を示す図である。
後処理部140は、生成されたマルチバンド低周波数信号と高周波数信号とをラウドスピーカーに出力して音波を発生させる。後処理部140は、図8A乃至図8Cの後処理部810、820、830で示されたように、多様な形態で構成され、これに限定されるものではない。
図8Aを参照すると、後処理部810は、合算部812及び単一スピーカー814を含みうる。合算部812は、低周波帯域のマルチバンド信号及び高周波帯域の信号を結合し、該結合された信号は、スピーカー814を通じて出力される。
図8Bを参照すると、後処理部820は、合算部822、ビーム処理部824及びアレイスピーカー816を含みうる。合算部822は、低周波帯域のマルチバンド信号及び高周波帯域の信号を結合する。ビーム処理部824は、結合された信号が出力される時、予め決定された放射パターンを形成するように合成された信号を処理する。アレイスピーカー816は、合成された信号を出力して、サウンドビームを発生させる。
図8Cを参照すると、後処理部830は、低周波数帯域ビーム処理部831、高周波数帯域ビーム処理部832、複数個の合算器833、834、835及びアレイスピーカー836を含みうる。低周波数帯域ビーム処理部831は、各サブバンド別信号が、各サブバンド毎に設けられたビーム処理部を経るようにする。各サブバンド毎のビーム処理部を通過して生成されたマルチチャンネル信号を低周波数帯域の全周波数帯域に対して合算して出力する。低周波数帯域ビーム処理部831に含まれ、低周波数帯域の全周波数帯域に対する信号を合算するための複数の合算器の個数は、アレイスピーカー836の出力チャンネルの個数に対応する。
高周波数帯域ビーム処理部832は、高周波帯域の信号に対してビーム成形技法を適用して処理する。複数の合算器833、834、835は、低周波数帯域ビーム処理部831から出力されたマルチチャンネル信号と高周波帯域の信号とをそれぞれ合算する。複数の合算器833、834、835の個数は、アレイスピーカー836の出力チャンネルの個数に対応する。
図9は、サウンドエンハンスメント方法の動作順序の一例を示すフローチャートである。
サウンドエンハンスメント装置100は、原音信号を高周波帯域の信号及び低周波帯域の信号に分離する(910)。サウンドエンハンスメント装置100は、低周波帯域の信号を複数のサブバンドに分離し、各サブバンドの信号に対してフレーム単位で歪み発生量の予測情報を生成することができる。
サウンドエンハンスメント装置100は、低周波帯域の信号を分析して、歪み発生量の予測情報を生成する(920)。歪み発生量の予測情報は、トーナリティー情報及びエンベロープ情報を含みうる。
サウンドエンハンスメント装置100は、歪み発生量の予測情報によって低周波帯域の信号に対して高調波信号の次数を調整して高調波信号を生成することによって、低周波帯域の信号を代替するBSE信号を生成する(930)。このために、サウンドエンハンスメント装置100は、まずエンベロープ情報を用いて、各サブバンドの信号の大きさを均一化し、該均一化された信号に対してトーナリティー情報によって適応的に高調波信号を生成することができる。また、IMDをさらに低減させるために、サウンドエンハンスメント装置100は、高調波生成以前に、トーナリティー成分が高い信号に対してスペクトルの先鋭化を行い、該スペクトルの先鋭化が行われた信号に対して高調波信号を生成することができる。
サウンドエンハンスメント装置100は、歪み発生量の予測情報によって低周波帯域の信号とBSE信号との合成比率を適応的に調節する(940)。このために、サウンドエンハンスメント装置100は、トーナリティー情報によってトーナリティー情報が低い信号に対しては、低周波帯域の信号の比率がBSE信号に比べて相対的に高いように低周波帯域の信号及びBSEの合成比率を調節して、利得が調節された信号を生成することができる。また、サウンドエンハンスメント装置100は、BSE信号のラウドネスが高周波帯域の信号によってマスクされないように、高周波数帯域の信号のマスキングレベルを超えてBSE信号の音圧を増幅することができる。
高周波帯域の信号及び利得が調節された信号は、合成されて出力され、合成された信号が出力される時、予め決定された放射パターンを形成するように出力される。
一実施形態によれば、IMDを低減しながら広い低周波帯域に対する低音補強処理BSEを行うことができるので、通常的なサブウーファーより広帯域の低音成分を高周波信号に代替することができる。より広い帯域の信号をBSE信号に代替して、狭い周波数帯域のみが使用可能な多様なラウドスピーカーシステムで低音知覚を提供することができる。また、より広い帯域の信号をBSE信号で代替することができるので、より小型化、薄型化されたラウドスピーカーでも十分な低音知覚特性を提供することができる。
BSE信号処理で発生する混変調歪みの発生量によって原音の低音成分とBSE処理された信号との比率を適応的に調節することによって、音質の劣化を最小化しながら信号フレーム毎にBSE効果を極大化することができる。混変調歪み発生量の予測によってBSE信号処理で発生させる高調波の次数を適応的に調整して、音源特性によってより自然な低周波帯域の信号に対する知覚特性を提供することができる。また、マルチバンド処理とスペクトルの先鋭化技法とを通じて、より混変調歪みが低減したBSE信号が得られる。このように処理された信号に対するビーム成形処理時には、ビーム幅が低い低周波帯域の音をビーム幅が狭い高周波帯域の音に変換されることによって、アレイのサイズの増加なしに全周波数帯域で室内に適用するのに十分な音圧差を確保することができる。
これに説明された端末装置は、携帯電話、パーソナル・デジタル・アシスタント(PDA)、デジタルカメラ、ポータブルゲームコンソール、MP3プレーヤー、携帯/個人用マルチメディアプレーヤー(PMP)、ハンドヘルド電子ブック、携帯用ラップトップ及び/またはタブレットパーソナルコンピュータ(PC)、グローバル・ポジショニング・システム(GPS)ナビゲーション、デスクトップPC、高画質テレビ(HDTV)、光ディスクプレーヤー、セットトップボックスなどのように、無線通信又はネットワーク通信ができるデバイスであり得る。
コンピュータシステム又はコンピュータは、バス、ユーザインターフェース及びメモリコントローラと電気的に連結されるマイクロプロセッサとを含みうる。コンピュータシステム又はコンピュータは、またフラッシュメモリ装置を更に含みうる。フラッシュメモリは、メモリコントローラを通じてNビットデータを保存することができる。Nビットデータは、マイクロプロセッサによって処理されるか、処理され、ここで、Nは、1又は1以上の整数であり得る。コンピュータシステム又はコンピュータが移動装置である時、コンピュータシステム又はコンピュータに電源を供給するために、バッテリーが付加的に提供されることがある。
コンピュータシステム又はコンピュータが、アプリケーションチップセット、CIS(camera image processor)、DRAM(dynamic random access memory)などを更に含みうるということは当業者には明白である。メモリコントローラ及びフラッシュメモリ装置は、データを保存するのに不揮発性メモリを利用するSSD(solid state driver/disk)を構成することができる。
本発明の一態様は、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現しうる。前記のプログラムを具現するコード及びコードセグメントは、当該分野のコンピュータプログラマによって容易に推論されうる。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取れるデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光ディスクなどを含む。また、コンピュータで読み取り可能な記録媒体は、ネットワークで連結されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取り可能なコードとして保存されて実行可能である。
以上の説明は、本発明の一実施形態に過ぎず、当業者は、本発明の本質的特性から外れない範囲で変形された形態で具現することができる。したがって、本発明の範囲は、前述した実施形態に限定されず、特許請求の範囲に記載の内容と同等な範囲内にある多様な実施形態が含まれるように解析されなければならない。
本発明は、サウンドエンハンスメント装置及び方法関連の技術分野に適用可能である。
110:処理部
120:BSE信号生成部
130:利得制御部
140:後処理部

Claims (31)

  1. 原信号を高周波信号及び低周波信号に分離し、前記低周波信号を分析して、前記低周波信号により発生される歪みの程度に関する予測情報を取得する処理部と、
    前記低周波信号の高調波信号を、前記低周波信号に代わる心理音響的なベースエンハンスメント(BSE)信号として生成するBSE信号生成部と、前記高調波信号の次数は、前記歪みの程度に関する予測情報に基づいて調整され、
    前記歪みの程度に関する予測情報に基づいて、前記低周波信号と前記BSE信号との合成比率を適応的に調節する利得制御部と、
    を含むことを特徴とするサウンドエンハンスメント装置。
  2. 前記処理部は、
    前記低周波信号を複数のサブバンドに従って分類し、各サブバンドに対応する信号により生成される歪みの程度に関する予測情報を生成する、
    ことを特徴とする請求項1記載のサウンドエンハンスメント装置。
  3. 前記歪みの程度に関する予測情報は、調性情報及び包絡線情報を含む、
    ことを特徴とする請求項2記載のサウンドエンハンスメント装置。
  4. 前記BSE信号生成部は、
    前記包絡線情報を用いて前記複数のサブバンドに対応する信号の振幅が一様になるように調整して正規化された信号を生成し、前記調性情報に基づいて前記正規化された信号の前記BSE信号として高調波信号を適応的に生成する、
    ことを特徴とする請求項3記載のサウンドエンハンスメント装置。
  5. 前記BSE信号生成部は、
    前記包絡線情報を用いて前記複数のサブバンドに対応する信号の振幅が一様になるように調節して前記正規化された信号を生成する第1調整部と、
    前記正規化された信号を前記調性情報と乗算する第2調整部と、
    前記調性情報により乗算された信号の前記BSE信号として高調波信号を生成する非線形デバイスと、
    を含むことを特徴とする請求項4記載のサウンドエレメント装置。
  6. 前記第2調整部から出力される信号のうち、高い調性をもつ信号に対してスペクトルの先鋭化を行うスペクトル先鋭化部を更に含み、
    前記非線形デバイスは、スペクトルの先鋭化が行われた信号について高調波信号を生成する、
    ことを特徴とする請求項5記載のサウンドエンハンスメント装置。
  7. 前記低周波信号が、前記調性情報に基づいて低い調性を有すると判定された場合、前記利得制御部は、前記低周波信号の一部が前記BSE信号の一部よりも大きいように、前記低周波信号の前記BSE信号に対する合成比率を調節して、利得が調節された信号を生成する、
    ことを特徴とする請求項3記載のサウンドエンハンスメント装置。
  8. 前記利得制御部は、前記BSE信号の音の強さが前記高周波信号によってマスクされないように、前記高周波信号のマスキングレベルを超えるように前記BSE信号の音圧を増幅する、
    ことを特徴とする請求項7記載のサウンドエンハンスメント装置。
  9. 前記高周波信号及び前記利得が調節された信号を合成する後処理部を更に含む、
    ことを特徴とする請求項1記載のサウンドエンハンスメント装置。
  10. 前記後処理部は、
    前記合成された信号が出力される時、放射パターンを形成するために前記合成された信号を処理するビーム成形部と、
    前記処理された合成された信号を出力するアレイスピーカーと、
    を含むことを特徴とする請求項9記載のサウンドエンハンスメント装置。
  11. 原信号を高周波信号及び低周波信号に分離し、前記低周波信号を分析して、前記低周波信号により発生される歪みの程度に関する予測情報を生成する段階と、
    前記低周波信号の高調波信号を、前記低周波信号に代わる心理音響的なベースエンハンスメント(BSE)信号として生成する段階と、前記高調波信号の次数は、前記歪みの程度に関する予測情報に基づいて調整され、
    前記歪みの程度に関する予測情報に基づいて、前記低周波信号と前記BSE信号との合成比率を適応的に調節する段階と、
    を含むことを特徴とするサウンドエンハンスメント方法。
  12. 前記歪みの程度に関する予測情報を生成する段階は、
    前記低周波信号を複数のサブバンドに従って分類する段階と、
    各サブバンドに対応する信号により生成される歪みの程度に関する予測情報を生成する段階と、
    を含むことを特徴とする請求項11記載のサウンドエンハンスメント方法。
  13. 前記歪みの程度に関する予測情報は、調性情報及び包絡線情報を含む、
    ことを特徴とする請求項12記載のサウンドエンハンスメント方法。
  14. 前記高調波信号を生成する段階は、
    前記包絡線情報を用いて前記複数のサブバンドに対応する信号の振幅が一様になるように調整して正規化された信号を生成し、前記調性情報に基づいて前記正規化された信号の前記BSE信号として高調波信号を適応的に生成する段階と、
    を含むことを特徴とする請求項13記載のサウンドエンハンスメント方法。
  15. 前記調性情報に基づいて適応的に前記正規化された信号の高調波信号を生成する段階は、
    前記正規化された信号を前記調性情報と乗算する段階と、
    前記調性情報で乗算された信号のうち、高い調性をもつ信号に対してスペクトルの先鋭化を行う段階と、
    スペクトルの先鋭化が行われた信号について高調波信号を前記BSE信号として生成する段階と、
    を含むことを特徴とする請求項14記載のサウンドエンハンスメント方法。
  16. 前記低周波信号の前記BSE信号に対する合成比率を適応的に調節する段階は、
    前記低周波信号が、前記調性情報に基づいて低い調性を有すると判定された場合、前記低周波信号の一部が前記BSE信号の一部よりも大きいように、前記低周波信号の前記BSE信号に対する合成比率を調節して、利得が調節された信号を生成する段階を含む、
    ことを特徴とする請求項13記載のサウンドエンハンスメント方法。
  17. 前記低周波信号の前記BSE信号に対する合成比率を適応的に調節する段階は、
    前記BSE信号の音の強さが前記高周波信号によってマスクされないように、前記高周波信号のマスキングレベルを超えるように前記BSE信号の音圧を増幅する段階を更に含む、
    ことを特徴とする請求項16記載のサウンドエンハンスメント方法。
  18. 前記高周波信号及び前記利得が調節された信号を合成する段階を更に含む、
    ことを特徴とする請求項11記載のサウンドエンハンスメント方法。
  19. 前記合成する段階は、
    前記合成された信号が出力される時、予め決定された放射パターンを形成するために前記合成された信号を処理する段階を更に含む、
    ことを特徴とする請求項18記載のサウンドエンハンスメント方法。
  20. 原信号を高周波信号及び低周波信号に分離し、前記低周波信号により発生される歪みの予測される程度を含む予測情報を取得する処理部と、
    前記低周波信号の前記予測される程度に基づいて、前記低周波信号の一部を代替する高調波信号を生成する適応的高調波信号生成部と、
    前記低周波信号の一部の前記高調波信号への変換比率を適応的に調整して、不均一な高調波量を減少させ、利得が調整された低周波信号を生成する利得制御部と、
    を含むことを特徴とする音声処理装置。
  21. 前記処理部は、低域フィルター、マルチバンドスプリッタ、及び歪み予測情報の抽出部を含む、
    ことを特徴とする請求項20記載の音声処理装置。
  22. 前記マルチバンドスプリッタは、前記低周波信号を複数のサブバンドに分離し、
    前記歪み予測情報の抽出部は、各サブバンドの信号について歪み予測情報を生成する、
    ことを特徴とする請求項21記載の音声処理装置。
  23. 前記歪み予測情報の抽出部は、各サブバンドについて調性情報及び包絡線情報を取得する、
    ことを特徴とする請求項21記載の音声処理装置。
  24. 前記適応的高調波信号生成部は、前記低周波信号の歪みの予測される程度に基づいて、前記高調波信号の次数を調整することで前記高調波信号を生成する、
    ことを特徴とする請求項20記載の音声処理装置。
  25. 前記利得制御部は、前記低周波信号の歪みの予測される程度に基づいて、前記低周波信号及び前記生成された高調波信号の合成比率を適応的に調節する、
    ことを特徴とする請求項20記載の音声処理装置。
  26. 前記利得制御部は、前記低周波信号及び前記生成された高調波信号の合成比率を適応的に調節する利得処理部を更に含む、
    ことを特徴とする請求項20記載の音声処理装置。
  27. 前記利得処理部は、前記調性情報に基づいて、前記低周波信号及び前記生成された高調波信号の合成比率を適応的に調節する、
    ことを特徴とする請求項26記載の音声処理装置。
  28. 前記利得制御部は、前記高周波信号の特性に基づいて前記高調波信号の利得を調整する、
    ことを特徴とする請求項26記載の音声処理装置。
  29. 前記低周波信号と前記生成された高調波信号とが合成された信号と共に、前記高周波信号を出力する更なる処理部を更に含む、
    ことを特徴とする請求項20記載の音声処理装置。
  30. 前記更なる処理部は、
    前記合成された信号が出力される時、放射パターンを形成するために前記合成された信号を処理するビーム成形部と、
    前記処理された信号を出力するアレイスピーカーと、
    を含むことを特徴とする請求項29記載の音声処理装置。
  31. 原信号を高周波信号及び低周波信号に分類し、前記低周波信号を複数の低周波のサブバンドに分割し、各低周波のサブバンドに対して行われた非線形処理に基づいて、各低周波のサブバンドによって発生される歪みの予測される程度を含む予測情報を取得する処理部と、
    前記低周波信号の歪みの予測される程度に基づいて、各低周波のサブバンドを代替する高調波信号を生成する適応的高調波信号生成部と、
    前記低周波信号及び前記高調波信号の合成比率を適応的に調整して不均一な高調波量を減少させ、利得が調整された低周波信号を生成する利得制御部と、
    を含むことを特徴とする音声処理装置。
JP2010268165A 2009-12-09 2010-12-01 サウンドエンハンスメント装置及び方法 Expired - Fee Related JP5649934B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2009-0121895 2009-12-09
KR1020090121895A KR101613684B1 (ko) 2009-12-09 2009-12-09 음향 신호 보강 처리 장치 및 방법

Publications (2)

Publication Number Publication Date
JP2011125004A JP2011125004A (ja) 2011-06-23
JP5649934B2 true JP5649934B2 (ja) 2015-01-07

Family

ID=43726529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010268165A Expired - Fee Related JP5649934B2 (ja) 2009-12-09 2010-12-01 サウンドエンハンスメント装置及び方法

Country Status (5)

Country Link
US (1) US8855332B2 (ja)
EP (1) EP2334103B1 (ja)
JP (1) JP5649934B2 (ja)
KR (1) KR101613684B1 (ja)
CN (1) CN102149034B (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
SG11201407708YA (en) 2012-05-29 2014-12-30 Creative Tech Ltd Adaptive bass processing system
KR20130139074A (ko) * 2012-06-12 2013-12-20 삼성전자주식회사 오디오 신호 처리 방법 및 이를 적용한 오디오 신호 처리 장치
CN104704855B (zh) * 2012-10-15 2016-08-24 杜比国际公司 用于减小基于换位器的虚拟低音系统中的延迟的系统及方法
US9247342B2 (en) 2013-05-14 2016-01-26 James J. Croft, III Loudspeaker enclosure system with signal processor for enhanced perception of low frequency output
DE102013223201B3 (de) * 2013-11-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
US9590581B2 (en) * 2014-02-06 2017-03-07 Vladimir BENKHAN System and method for reduction of signal distortion
KR102423753B1 (ko) 2015-08-20 2022-07-21 삼성전자주식회사 스피커 위치 정보에 기초하여, 오디오 신호를 처리하는 방법 및 장치
CN106817324B (zh) * 2015-11-30 2020-09-11 腾讯科技(深圳)有限公司 频响校正方法及装置
CN105491478A (zh) * 2015-12-30 2016-04-13 东莞爱乐电子科技有限公司 由电视声音的包络线控制音量的低音炮
US10483931B2 (en) * 2017-03-23 2019-11-19 Yamaha Corporation Audio device, speaker device, and audio signal processing method
US10225654B1 (en) 2017-09-07 2019-03-05 Cirrus Logic, Inc. Speaker distortion reduction
CN109717894A (zh) * 2017-10-27 2019-05-07 贵州骏江实业有限公司 一种侦听心跳声音的心跳检测装置及检测方法
US10382857B1 (en) * 2018-03-28 2019-08-13 Apple Inc. Automatic level control for psychoacoustic bass enhancement
WO2019246449A1 (en) 2018-06-22 2019-12-26 Dolby Laboratories Licensing Corporation Audio enhancement in response to compression feedback
CN110718233B (zh) * 2019-09-29 2022-03-01 东莞市中光通信科技有限公司 一种基于心理声学的声学辅助降噪方法及装置
CN111796791A (zh) * 2020-06-12 2020-10-20 瑞声科技(新加坡)有限公司 一种低音增强方法、系统、电子设备和存储介质
CN112040373B (zh) * 2020-11-02 2021-04-23 统信软件技术有限公司 一种音频数据处理方法、计算设备及可读存储介质

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5737432A (en) * 1996-11-18 1998-04-07 Aphex Systems, Ltd. Split-band clipper
US5930373A (en) * 1997-04-04 1999-07-27 K.S. Waves Ltd. Method and system for enhancing quality of sound signal
US6285767B1 (en) 1998-09-04 2001-09-04 Srs Labs, Inc. Low-frequency audio enhancement system
CN1158898C (zh) 1998-09-08 2004-07-21 皇家菲利浦电子有限公司 音频系统低音增强装置
DE19955696A1 (de) * 1999-11-18 2001-06-13 Micronas Gmbh Vorrichtung zur Erzeugung von Oberwellen in einem Audiosignal
JP2001343998A (ja) * 2000-05-31 2001-12-14 Yamaha Corp ディジタルオーディオデコーダ
CA2354755A1 (en) * 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
EP1532734A4 (en) 2002-06-05 2008-10-01 Sonic Focus Inc ACOUSTIC VIRTUAL REALITY ENGINE AND ADVANCED TECHNIQUES FOR IMPROVING THE DELIVERED SOUND
US7333930B2 (en) 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
KR100619066B1 (ko) 2005-01-14 2006-08-31 삼성전자주식회사 오디오 신호의 저음역 강화 방법 및 장치
JP4400474B2 (ja) 2005-02-09 2010-01-20 ヤマハ株式会社 スピーカアレイ装置
JP2006324786A (ja) * 2005-05-17 2006-11-30 Matsushita Electric Ind Co Ltd 音響信号処理装置およびその方法
DE102005032724B4 (de) 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE102006047986B4 (de) * 2006-10-10 2012-06-14 Siemens Audiologische Technik Gmbh Verarbeitung eines Eingangssignals in einem Hörgerät
KR100829567B1 (ko) * 2006-10-17 2008-05-14 삼성전자주식회사 청각특성을 이용한 저음 음향 신호 보강 처리 방법 및 장치
JP4923939B2 (ja) 2006-10-18 2012-04-25 ソニー株式会社 オーディオ再生装置
JP5018339B2 (ja) * 2007-08-23 2012-09-05 ソニー株式会社 信号処理装置、信号処理方法、プログラム
US9031267B2 (en) * 2007-08-29 2015-05-12 Microsoft Technology Licensing, Llc Loudspeaker array providing direct and indirect radiation from same set of drivers
WO2009030235A1 (en) 2007-09-03 2009-03-12 Am3D A/S Method and device for extension of low frequency output from a loudspeaker
KR101449433B1 (ko) 2007-11-30 2014-10-13 삼성전자주식회사 마이크로폰을 통해 입력된 사운드 신호로부터 잡음을제거하는 방법 및 장치
KR101520618B1 (ko) 2007-12-04 2015-05-15 삼성전자주식회사 어레이 스피커를 통해 음향을 포커싱하는 방법 및 장치
EP2109328B1 (en) * 2008-04-09 2014-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for processing an audio signal
TWI462601B (zh) * 2008-10-03 2014-11-21 Realtek Semiconductor Corp 音頻信號裝置及方法

Also Published As

Publication number Publication date
CN102149034B (zh) 2015-07-08
EP2334103A2 (en) 2011-06-15
EP2334103B1 (en) 2020-10-21
CN102149034A (zh) 2011-08-10
EP2334103A3 (en) 2017-06-28
US20110135115A1 (en) 2011-06-09
JP2011125004A (ja) 2011-06-23
KR20110065063A (ko) 2011-06-15
US8855332B2 (en) 2014-10-07
KR101613684B1 (ko) 2016-04-19

Similar Documents

Publication Publication Date Title
JP5649934B2 (ja) サウンドエンハンスメント装置及び方法
JP6436934B2 (ja) 動的閾値を用いた周波数帯域圧縮
US8971551B2 (en) Virtual bass synthesis using harmonic transposition
JP5341128B2 (ja) 補聴器における安定性の改善
RU2520420C2 (ru) Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала
JP6968376B2 (ja) ステレオ仮想バス拡張
US20030216907A1 (en) Enhancing the aural perception of speech
US8625813B2 (en) Asymmetric polynomial psychoacoustic bass enhancement
US11109155B2 (en) Bass enhancement
JP4738213B2 (ja) 利得調整方法及び利得調整装置
KR101520618B1 (ko) 어레이 스피커를 통해 음향을 포커싱하는 방법 및 장치
KR102511377B1 (ko) 라우드스피커들을 위한 저음 향상
Mu et al. A timbre matching approach to enhance audio quality of psychoacoustic bass enhancement system
Mu Perceptual quality improvement and assessment for virtual bass system
RU2819779C1 (ru) Усиление низких частот для громкоговорителей
CN112511941B (zh) 一种音频输出方法及系统及耳机
KR101636801B1 (ko) 어레이 스피커를 이용하여 음원을 포커싱하는 음원 포커싱장치 및 방법
JP6531418B2 (ja) 信号処理装置
TW202307828A (zh) 用於心理聲學頻率範圍擴展之使用尺度依存非線性之自適性濾波器組
JP5641187B2 (ja) 音響処理装置
JP6286925B2 (ja) オーディオ信号処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141009

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141014

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141112

R150 Certificate of patent or registration of utility model

Ref document number: 5649934

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees