JP2011007823A - 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム - Google Patents

音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム Download PDF

Info

Publication number
JP2011007823A
JP2011007823A JP2009148220A JP2009148220A JP2011007823A JP 2011007823 A JP2011007823 A JP 2011007823A JP 2009148220 A JP2009148220 A JP 2009148220A JP 2009148220 A JP2009148220 A JP 2009148220A JP 2011007823 A JP2011007823 A JP 2011007823A
Authority
JP
Japan
Prior art keywords
frequency domain
output
signal
window
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009148220A
Other languages
English (en)
Other versions
JP5365363B2 (ja
Inventor
Minoru Tsuji
実 辻
Toru Chinen
徹 知念
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009148220A priority Critical patent/JP5365363B2/ja
Priority to TW099117632A priority patent/TWI447708B/zh
Priority to EP10791953.2A priority patent/EP2426662B1/en
Priority to PCT/JP2010/059440 priority patent/WO2010150635A1/ja
Priority to US13/057,219 priority patent/US8825495B2/en
Priority to KR1020117002948A priority patent/KR20120031930A/ko
Priority to CN2010800022072A priority patent/CN102119413B/zh
Priority to RU2011104718/08A priority patent/RU2011104718A/ru
Priority to BRPI1004287A priority patent/BRPI1004287A2/pt
Publication of JP2011007823A publication Critical patent/JP2011007823A/ja
Application granted granted Critical
Publication of JP5365363B2 publication Critical patent/JP5365363B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】適切な出力音響信号の生成を実現しつつ、周波数領域から時間領域への信号変換処理に伴う音響信号復号装置の演算量を削減する。
【解決手段】出力制御部340は、入力チャンネルの窓掛け処理に関する窓関数の種類を示す窓形状を含む窓情報を符号列分離部310から受け付けて、その窓情報が全て同一であれば、出力切替部351乃至355の接続を周波数領域混合部510に切り替える。周波数領域混合部510は、出力チャンネル数を入力チャンネル数未満にするためのダウンミックス情報に基づいて、復号・逆量子化部320からの5チャンネルの周波数領域信号同士を混合する。IMDC・窓掛け処理部521および522は、周波数領域混合部510から出力された2チャンネルの周波数領域信号を時間領域信号に変換して、2チャンネルの音響信号として出力する。
【選択図】図4

Description

本発明は、音響信号処理システムに関し、特に符号化された音響信号をダウンミックスする音響信号処理システム、音響信号復号装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラムに関する。
従来、音響信号符号化装置としては、複数の入力チャンネルの音響信号を周波数領域に変換して、その変換された周波数領域信号を符号化することによって、音響符号化データを生成するものが一般に用いられている。このため、その符号化された音響符号化データを復号することにより、周波数領域信号を時間領域信号に変換して出力音響信号として出力する音響信号復号装置が広く普及している。
このような音響信号復号装置には、出力音響信号の出力チャンネル数を入力チャンネル数よりも減らすための重み付け係数に基づいて、出力音響信号を入力チャンネル数未満の出力チャンネル数により出力させる機能を備えるものが数多く存在する。例えば、各入力チャンネルの周波数領域信号を時間領域信号に変換する前に、その重み付け係数を用いて重み付け加算することによって、出力チャンネル数の復号音声を出力する符号化音声復号装置が提案されている(例えば、特許文献1参照。)。
この符号化音声復号装置では、各周波数領域信号に関する変換長を示す変換関数選択情報に基づいて、その変換長ごとに入力チャンネルの周波数領域信号を関連付けて重み付け加算を行っている。これは、各入力チャンネルの周波数領域信号に施された窓掛け処理が同一でなければ入力チャンネルの周波数領域信号を重み付け加算(混合)することができないためである。
特許第3279228号公報(図1)
上述の従来技術では、周波数領域信号を重み付け加算することにより、周波数領域信号のチャンネル数を入力チャンネル数未満にすることができるため、周波数領域信号を時間領域信号に変換するための演算処理を削減することができる。しかしながら、各チャンネルの周波数領域信号に関する変換長の種類のみを判断基準として、周波数領域における重み付け加算の可否を判断しているため、周波数領域信号に施された窓形状が異なっていても、変換長が同一であれば混合してしまう場合がある。
例えば、AAC(Advanced Audio Coding)方式では、入力音響信号の特性に基づいて変換長だけでなく窓形状の種類も変更することができる。このため、周波数領域信号の変換長だけにより周波数領域における混合の可否を判断すると、窓形状の異なる周波数領域信号同士を混合してしまい、適切な出力音響信号を生成することができない場合がある。
本発明はこのような状況に鑑みてなされたものであり、適切な出力音響信号の生成を実現しつつ、周波数領域から時間領域への信号変換処理に伴う音響信号復号装置の演算量を削減することを目的とする。
本発明は、上記課題を解決するためになされたものであり、その第1の側面は、複数の入力チャンネルの音響信号に窓掛け処理が施された周波数領域信号に関する窓関数の種類が示された窓形状を含む窓情報に基づいて当該窓情報が互いに同一である上記周波数領域信号同士を同時に出力させるように制御する出力制御部と、上記窓情報が同一である上記入力チャンネルの周波数領域信号同士をダウンミックス情報に基づいて混合して上記入力チャンネル数未満の出力チャンネル数の周波数領域信号として出力する周波数領域混合部と、上記周波数領域混合部から出力された上記出力チャンネルの周波数領域信号を時間領域信号に変換して上記変換された時間領域信号に上記窓掛け処理を施すことによって上記出力チャンネルの音響信号を生成する出力音生成部とを具備する音響信号復号装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、窓関数の種類が示された窓形状を含む窓情報が、互いに同一である周波数領域信号同士をダウンミックス情報に基づいて混合することによって、入力チャンネル数未満の出力チャンネル数の周波数領域信号が時間領域信号に変換されて、出力チャンネル数の音響信号を生成させるという作用をもたらす。
また、この第1の側面において、上記周波数領域混合部は、上記複数の窓情報における組合せごとに上記ダウンミックス情報に基づいて上記入力チャンネルの周波数領域信号を混合し、上記出力音生成部は、上記窓掛け処理が施された上記組合せごとの上記時間領域信号を加算することによって上記出力チャンネルの上記音響信号を生成するようにしてもよい。これにより、周波数領域混合部により、複数の窓情報における組合せごとに、ダウンミックス情報に基づいて周波数領域信号を加算することによって、出力チャンネルの音響信号を生成させるという作用をもたらす。この場合において、上記出力制御部は、上記複数の窓情報における上記組合せの数と上記出力チャンネル数との乗算値が上記入力チャンネル数未満である場合には上記周波数領域混合部に上記入力チャンネルの上記周波数領域信号同士を同時に出力するようにしてもよい。これにより、窓情報における組合せの数と出力チャンネル数との積算値が入力チャンネル数未満である場合に限り、ダウンミックス情報に基づいて、入力チャンネルの周波数領域信号を混合することによって、出力チャンネルの周波数領域信号を生成するようにしてもよい。
また、この第1の側面において、上記出力制御部は、上記入力チャンネルの音響信号に基づいて設定された窓の種類が示された窓掛け形式を含む上記窓情報に基づいて上記周波数領域信号の出力を制御し、上記出力音生成部は、上記窓情報に示される上記窓掛け形式および窓関数の種類に基づいて上記出力チャンネルの上記周波数領域信号に上記窓掛け処理を施すことによって上記出力チャンネルの上記音響信号を生成するようにしてもよい。これにより、窓情報における窓掛け形式および窓形状の組合せに基づいて各チャンネルの周波数領域信号同士を混合して、出力チャンネルの周波数領域信号を生成させて、その生成された周波数領域信号を時間領域信号に変換するとともに、窓情報に基づいて窓掛け処理を施すことによって、音響信号を生成させるという作用をもたらす。この場合において、上記出力制御部は、上記窓掛け形式における前半部分および後半部分に対する上記窓形状が示された上記窓情報に基づいて上記周波数領域信号の出力を制御するようにしてもよい。これにより、出力制御部により、窓掛け形式における変換長の前半部分および後半部分に対する窓形状が示された窓情報に基づいて周波数領域信号の出力を切り替えさせるという作用をもたらす。
また、本発明の第2の側面は、複数の入力チャンネルの音響信号に窓掛け処理を施して上記窓掛け処理における窓関数の種類が示された窓形状を含む窓情報を生成する窓掛け処理部と、上記窓掛け処理部から出力された上記音響信号を周波数領域に変換することによって周波数領域信号を生成する周波数変換部とを備える音響信号符号化装置と、上記音響信号符号化装置から出力された上記入力チャンネルの上記周波数領域信号に関する上記窓情報が互いに同一である上記周波数領域信号同士を同時に出力させるように制御する出力制御部と、上記窓情報が同一である上記入力チャンネルの周波数領域信号同士をダウンミックス情報に基づいて混合して上記入力チャンネル数未満の出力チャンネル数の周波数領域信号として出力する周波数領域混合部と、上記周波数領域混合部から出力された上記出力チャンネルの周波数領域信号を時間領域信号に変換して上記変換された時間領域信号に上記窓掛け処理を施すことによって上記出力チャンネルの音響信号を生成する出力音生成部とを備える音響信号復号装置とを具備する音響信号処理システムである。これにより、音響信号符号化装置により生成された入力チャンネルの周波数領域信号のうち、窓情報が互いに一致する周波数領域信号同士をダウンミックス情報に基づいて混合することによって生成された出力チャンネル数の周波数領域信号を時間領域信号に変換して、その変換された時間領域信号を窓掛け処理して出力チャンネルの音響信号を生成させるという作用をもたらす。
本発明によれば、適切な出力音響信号の生成を実現しつつ、周波数領域から時間領域への信号変換処理に伴う音響信号復号装置の演算量を削減することができるという優れた効果を奏し得る。
本発明の第1の実施の形態における音響信号処理システムの一構成例を示すブロックである。 本発明の第1の実施の形態における音響信号符号化装置200の一構成例を示すブロック図である。 本発明の第1の実施の形態における窓掛け処理部211乃至215により生成される窓情報の組合せの一例を示す図である。 本発明の第1の実施の形態における音響信号復号装置300の一構成例を示すブロック図である。 本発明の第1の実施の形態における音響信号復号装置300による符号列の復号方法の処理手順例を示すフローチャートである。 本発明の第2の実施の形態における音響信号復号装置の一構成例を示すブロック図である。 本発明の第2の実施の形態における第1乃至第5出力選択部711乃至715による出力先の選択例を示す図である。 本発明の第2の実施の形態における第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至743による窓掛け処理に関する例を示す図である。 本発明の第2の実施の形態における音響信号復号装置600による符号列の復号方法の処理手順例を示すフローチャートである。 本発明の第3の実施の形態における音響信号復号装置の一構成例を示すブロック図である。 本発明の第3の実施の形態における音響信号復号装置800による符号列の復号方法の処理手順例を示すフローチャートである。
以下、本発明を実施するための形態(以下、実施の形態と称する)について説明する。説明は以下の順序により行う。
1.第1の実施の形態(ダウンミックス制御:窓情報に基づいて時間領域におけるダウンミックス処理と、周波数領域におけるダウンミックス処理とを切り替える例)
2.第2の実施の形態(ダウンミックス制御:窓情報に基づいて周波数領域信号のみによりダウンミックス処理を行う例)
3.第3の実施の形態(ダウンミックス制御:窓情報の組合せの数に基づいて時間領域におけるダウンミックス処理と、周波数領域におけるダウンミックス処理とを切り替える例)
<1.第1の実施の形態>
[音響信号符号化装置の構成例]
図1は、本発明の第1の実施の形態における音響信号処理システムの一構成例を示すブロックである。音響信号処理システム100は、複数の入力チャンネル数の音響信号を符号化する音響信号符号化装置200と、その符号化された音響信号を復号して入力チャンネル数未満の出力チャンネル数により出力する音響信号復号装置300とを備えている。また、音響信号処理システム100は、音響信号復号装置300から出力された2チャンネルの音響信号を音波として出力する2つの右チャンネルスピーカ110および左チャンネルスピーカ120を備えている。
音響信号符号化装置200は、入力端子101乃至105から入力される5チャンネルの音響信号をデジタル信号に変換して、その変換されたデジタル信号を符号化するものである。この音響信号符号化装置200は、右サラウンドチャンネル(Rs)の音響信号が入力端子101から供給され、右チャンネル(R)の音響信号が入力端子102から供給され、センターチャンネル(C)の音響信号が入力端子103から供給される。さらに、この音響信号符号化装置200は、左チャンネル(L)の音響信号が入力端子104から供給され、左サラウンドチャンネル(Ls)の音響信号が入力端子105から供給される。
この音響信号符号化装置200は、入力端子101乃至105からの入力チャンネル数が5チャンネルである音響信号の各々に対して符号化を行う。また、音響信号符号化装置200は、その符号化された各々の音響信号、その符号化に関する情報などを多重化して、音響符号化データとして符号列伝送線301を介して音響信号復号装置300に供給する。
音響信号復号装置300は、符号列伝送線301から供給された音響符号化データを復号することによって、入力チャンネル数未満の出力チャンネル数である2チャンネルの音響信号を生成するものである。この音響信号復号装置300は、符号化された音響信号を音響符号化データから抽出して、その抽出された5チャンネルの音響符号化データを復号することによって、2チャンネルの音響信号を生成する。
また、音響信号復号装置300は、その生成された2チャンネルの音響信号のうち、一方の右チャンネルの音響信号を、信号線111を介して右チャンネルスピーカ110に出力する。また、音響信号復号装置300は、他方の左チャンネルの音響信号を、信号線121を介して左チャンネルスピーカ120に出力する。
このように、音響信号処理システム100は、音響信号符号化装置200において符号化された5チャンネルの音響信号を、音響信号復号装置300により復号することによって、2チャンネルの音響信号をスピーカ110および120に出力する。なお、音響信号処理システム100は、特許請求の範囲に記載の音響信号処理システムの一例である。
なお、ここでは一例として、入力チャンネル数および出力チャンネル数をそれぞれ5チャンネルおよび2チャンネルと想定して説明したが、これに限られるものではない。本発明の実施の形態では、出力チャンネル数が入力チャンネル未満であれば良く、例えば、入力チャンネル数が3チャンネルであり、出力チャンネル数が1チャンネルのものでも良い。次に、音響信号符号化装置200の具体的な構成例について以下に図面を参照して説明する。
[音響信号符号化装置200の構成例]
図2は、本発明の第1の実施の形態における音響信号符号化装置200の一構成例を示すブロック図である。ここでは一例として、AACの規格により実現される音響信号符号化装置200を想定する。
音響信号符号化装置200は、窓掛け処理部211乃至215と、MDCT部231乃至235と、量子化部241乃至245と、符号列生成部250と、ダウンミックス情報受付部260とを備える。
窓掛け処理部211乃至215は、入力端子101乃至105から入力される各入力チャンネルの音響信号の特性に応じて、各入力チャンネルの音響信号に対して窓掛け処理を施すものである。すなわち、窓掛け処理部211は、右サラウンドチャンネルの音響信号に窓掛け処理を施し、窓掛け処理部212は、右チャンネルの音響信号に窓掛け処理を施し、窓掛け処理部213は、センターチャンネルの音響信号に窓掛け処理を施す。また、窓掛け処理部214は、左チャンネルの音響信号に窓掛け処理を施し、窓掛け処理部215は、左サラウンドチャンネルの音響信号に窓掛け処理を施す。
具体的には、窓掛け処理部211乃至215は、音響信号を一定期間によりサンプリングして、そのサンプリングされた2048サンプルの離散信号である時間領域信号をフレームとして生成する。この窓掛け処理部211乃至215は、1つ前のフレームに対し、1/2フレーム(1024サンプル)だけシフトさせて次のフレームを生成する。
すなわち、この窓掛け処理部211乃至215は、1つ前のフレームの後半部分(1/2フレーム)と次のフレームの前半部分が重複するように、次のフレームを生成する。これにより、MDCT部231乃至235における修正離散余弦変換(MDCT:Modified Discrete Cosine Transform)により生成される周波数領域信号のデータ量を抑制することができる。
また、窓掛け処理部211乃至215は、音響信号をフレームに分割することによって生じる歪みを抑えるために、フレームに対して窓掛け処理を施す。具体的には、この窓掛け処理部211乃至215は、AACの規定により、各チャンネルの時間領域信号の特性に基づいて、4つの窓の種類を示す窓掛け形式のうち、1つのフレームに対する窓掛け形式を選択する。
この窓掛け処理部211乃至215は、その選択された窓掛け形式における前半部分および後半部分に対して、2つの窓関数の種類を示す窓形状のうちいずれか一方の窓形状をそれぞれ選択する。このとき、窓掛け処理部211乃至215は、前後のフレーム間の接続歪を打ち消すために、現在のフレームの前半部分の窓形状として、1つ前のフレームの後半部分の窓形状と同一のものを選択する。すなわち、窓掛け処理部211乃至215は、前後のフレーム間で重複する部分に対し同一の窓形状を選択する。
この窓掛け処理部211乃至215は、その選択された窓掛け形式およびその形式に対する前半部分および後半部分の窓形状に基づいて、時間領域信号に対して窓掛け処理を施すとともに、その窓掛け形式および窓形状の組合せを示す窓情報を生成する。
また、窓掛け処理部211乃至215は、その窓掛け処理が施された時間領域信号の各々をMDCT部231乃至235に供給する。これとともに、窓掛け処理部211乃至215は、音響信号復号装置300において音響信号を生成するために、入力チャンネルの各々の窓情報を、窓情報線221乃至225を介して符号列生成部250に供給する。なお、窓掛け処理部211乃至215は、特許請求の範囲に記載の音響信号符号化装置における窓掛け処理部の一例である。
MDCT部231乃至235は、窓掛け処理部211乃至215の各々から供給された時間領域信号を周波数領域の信号に変換するものである。すなわち、MDCT部231乃至235は、窓掛け処理部211乃至215から出力された音響信号を周波数領域に変換することによって、周波数領域信号を生成する。具体的には、このMDCT部231乃至235は、MDCT処理により、時間領域信号を変換することによって、MDCT係数である周波数領域信号(周波数スペクトル)を生成する。
また、MDCT部231乃至235は、その生成された周波数領域信号である窓掛け処理が施された周波数領域信号の各々を、量子化部241乃至245に供給する。なお、MDCT部231乃至235は、特許請求の範囲に記載の音響信号符号化装置における周波数変換部の一例である。
量子化部241乃至245は、各入力チャンネルに対応するMDCT部231乃至235から供給された周波数領域信の各々を量子化するものである。この量子化部241乃至245は、例えば、人間の聴覚特性に基づいて量子化を行うとともに、聴覚特性によるマスキング効果を考慮して量子化雑音の制御を行う。また、量子化部241乃至245は、その量子化された周波数領域信号の各々を符号列生成部250に供給する。
ダウンミックス情報受付部260は、出力チャンネル数を入力チャンネル数未満にするためのダウンミックス情報を受け付けるものである。このダウンミックス情報受付部260は、例えば、各入力チャンネルに対する重み付け係数を設定するためのダウミックス係数の数値を受け付ける。このダウンミックス情報受付部260は、その受け付けたダウンミックス情報を符号列生成部250に出力する。なお、ここでは、音響信号符号化装置200においてダウンミックス情報を設定する例について示したが、音響信号復号装置300において設定するようにしてもよい。
符号列生成部250は、量子化部241乃至245からの量子化された周波数領域信号と、窓掛け処理部211乃至215からの窓情報と、ダウンミックス情報受付部260からのダウンミックス情報とを符号化して、1つの符号列を生成するものである。この符号列生成部250は、各入力チャンネルの量子化された周波数領域信号をそれぞれ符号化することによって音響符号化データを生成する。
また、符号列生成部250は、その符号化した各入力チャンネルの窓情報およびダウンミックス情報を音響符号化データに多重化することによって、1つの符号列(ビットストリーム)として符号列伝送線301に供給する。
このように、音響信号符号化装置200は、各入力チャンネルの音響信号に基づいて、MDCT変換における複数の組合せの窓掛け処理のうち1つの窓掛け処理を選択して、その選択された窓掛け処理を時間領域信号に施す。また、音響信号符号化装置200は、その窓掛け処理が施された周波数領域信号と、その周波数領域信号に関する窓情報とが多重化された音響符号化データを、符号列伝送線301を介して音響信号復号装置300に伝送する。ここで、窓掛け処理部211乃至215によりそれぞれ生成される窓情報の組合せについて、以下に図面を参照して簡単に説明する。
[窓掛け処理部211乃至215により生成される窓情報の例]
図3は、本発明の第1の実施の形態における窓掛け処理部211乃至215により生成される窓情報における窓掛け形式および窓形状の組合せの一例を示す図である。ここでは、窓情報270における組合せとして、窓掛け形式271と、その窓掛け形式271に対する前半部分および後半部分の窓形状272との組合せが示されている。
窓掛け形式271には、窓の種類として、4つの窓掛け形式(LONG_WINDOW、START_WINDOW、SHORT_WINDOW、STOP_WINDOW)が示されている。また、窓掛け形式271には、1つのフレームに対する窓掛け形式が概念的にそれぞれ示されている。ここでは、窓掛け形式271の実線部分が窓形状272における前半部分に対応し、窓掛け形式271における点線部分が窓形状272における後半部分に対応する。
この窓掛け形式271においては、基本的には、入力チャンネルの音響信号の特性に基づいて、LONG_WINDOWおよびSHORT_WINDOWのうちいずれか一方が選択される。この窓掛け形式271におけるLONG_WINDOWは、そのMDCTの変換区間である変換長が2048サンプルであり、音響信号のレベル変動が小さい場合に選択される窓掛け形式である。
一方、窓掛け形式271におけるSHORT_WINDOWは、そのMDCTの変換長が256サンプルであり、アタック音のように音響信号のレベルが急激に変化する場合に選択される。ここでは、8個のSHORT_WINDOWが示されているが、これは、SHORT_WINDOWが選択された場合には、1つのフレームに対して8つのSHORT_WINDOWを用いて周波数領域信号を生成するからである。これにより、入力チャンネルの音響信号の周波数成分をLONG_WINDOWに比べて正確に生成することができるため、音響信号の信号レベルが急峻に変化するフレームでも、聴覚的なノイズを抑制することができる。
また、この窓掛け形式271においては、LONG_WINDOWと、SHORT_WINDOWとの切替えに伴い、隣接するフレーム間の接続歪を抑制するために、START_WINDOWまたはSTOP_WINDOWが選択される。この窓掛け形式271におけるSTART_WINDOWは、そのMDCTの変換長が2048サンプルであり、LONG_WINDOWからSHORT_WINDOWに切替えるときに選択される窓掛け形式である。例えば、アタック音が検出された場合には、SHORT_WINDOWが選択される直前にSTART_WINDOWが選択される。
また、窓掛け形式271おけるSTOP_WINDOWは、そのMDCTの変換長が2048サンプルであり、SHORT_WINDOWからLONG_WINDOWに切替えるときに選択される窓掛け形式である。すなわち、アタック音部分の終了により、LONG_WINDOWが選択される直前にSTOP_WINDOWが選択される。
窓形状272における前半部分および後半部分には、窓掛け形式に適用する窓関数の種類として、2つの窓形状(サインおよびKBD)が示されている。ここにいう窓形状272における前半部分および後半部分とは、時間軸上において、窓掛け形式271における現在の変換区間に対し、1つ前の変換区間と重複する区間が前半部分であり、1つ後の変換区間と重複する区間が後半部分である。
この窓形状272におけるサインとは、窓関数として、サイン窓が選択されたことを示す。窓形状272におけるKBDとは、窓関数として、カイザーベッセル派生(KBD:Kaiser-Bessel derived)窓が選択されたことを示す。なお、MDCT処理においては、接続歪を抑制するために、現在のフレームにおける1つ前の変換区間と重複する部分(前半部分または後半部分)に対し、1つ前の変換区間に適用した窓形状と同一のものを選択しなければならない。
このように、窓情報270においては、4つの窓掛け形式と、その窓掛け形式における前半部分および後半部分に適用する2つの窓形状とに基づいて窓掛け処理が選択されるため、最大16通りの組合せ281乃至296が存在する。ここでは、入力チャンネルが5チャンネルであるため、窓情報270における組合せの数は最大5通りとなる。次に、音響信号復号装置300の構成例について図面を参照して以下に説明する。
[音響信号復号装置300の一構成例]
図4は、本発明の第1の実施の形態における音響信号復号装置300の一構成例を示すブロック図である。
音響信号復号装置300は、符号列分離部310と、復号・逆量子化部320と、出力制御部340と、出力切替部351乃至355と、加算部361および362と、時間領域合成部400と、周波数領域合成部500とを備える。また、時間領域合成部400は、IMDCT・窓掛け処理部411乃至415および時間領域混合部420を備える。
さらに、周波数領域合成部500は、周波数領域混合部510および出力音生成部520を備える。この出力音生成部520は、IMDCT・窓掛け処理部521および522を備える。
符号列分離部310は、符号列伝送線301から供給された符号列を分離するものである。この符号列分離部310は、符号列伝送線301から供給された符号列に基づいて、入力チャンネルの音響符号化データと、各入力チャンネルの窓情報と、ダウンミックス情報とに符号列を分離する。
また、符号列分離部310は、各入力チャンネルの音響符号化データおよび窓情報を、復号・逆量子化部320に供給する。すなわち、この符号列分離部310は、右サラウンドチャンネルの音響符号化データを信号線321に、右チャンネルの音響符号化データを信号線322に、センターチャンネルの音響符号化データを信号線323に供給する。さらに、この符号列分離部310は、左チャンネルの音響符号化データを信号線324に、左サラウンドチャンネルの音響符号化データを信号線325に供給する。
また、符号列分離部310は、窓情報線311を介して各入力チャンネルの窓情報を出力制御部340に供給する。また、符号列分離部310は、ダウンミックス情報線312を介して、ダウンミックス情報を、時間領域混合部420および周波数領域混合部510に供給する。
復号・逆量子化部320は、各入力チャンネルの音響符号化データを復号するとともに逆量子化を行うことによって、MDCT係数である周波数領域信号を生成するものである。この復号・逆量子化部320は、出力制御部340の制御に従って、その生成された各入力チャンネルの周波数領域信号および窓情報を、時間領域合成部400または周波数領域合成部500のいずれか一方に供給する。
この復号・逆量子化部320は、具体的には、その生成された各入力チャンネルの周波数領域信号を出力切替部351乃至355にそれぞれ供給する。すなわち、この復号・逆量子化部320は、右サラウンドチャンネルの周波数領域信号を信号線331に、右チャンネルの周波数領域信号を信号線332に、センターチャンネルの周波数領域信号を信号線333に供給する。さらに、この復号・逆量子化部320は、左チャンネルの周波数領域信号を信号線334に、左サラウンドチャンネルの周波数領域信号を信号線335に供給する。
出力切替部351乃至355は、出力制御部340からの制御に従って、信号線331乃至335からの周波数領域信号を、時間領域合成部400または周波数領域合成部500のうちいずれか一方に出力するためのスイッチである。この出力切替部351乃至355は、出力制御部340からの制御に従って、入力チャンネルの全ての周波数領域信号を、IMDCT・窓掛け処理部411乃至415または周波数領域混合部510のうちいずれか一方に同時に出力する。
出力制御部340は、窓情報線311から供給される各入力チャンネルの窓情報に含まれる窓掛け形式および窓形状に基づいて、出力切替部351乃至355の接続を切り替えるものである。すなわち、出力制御部340は、図3に示した窓情報における窓掛け形式およびその窓掛け形式における前半部分および後半部分に対する窓形状の組合せに基づいて、入力チャンネルの周波数領域信号の出力先を制御する。
この出力制御部340は、各入力チャンネルの窓情報が互いに一致するか否かを判断する。そして、全ての窓情報が一致した場合には、出力制御部340は、信号線331乃至335と周波数領域混合部510との間を接続するように出力切替部351乃至355を制御する。
一方、出力制御部340は、全ての窓情報が一致しない場合には、信号線331乃至335とIMDCT・窓掛け処理部411乃至415との間を接続するように出力切替部351乃至355を制御する。すなわち、出力制御部340は、窓関数の種類を示す窓形状を含む窓情報に基づいて、窓情報が互いに同一である周波数領域信号同士を同時に周波数領域混合部510に出力させるように出力切替部351乃至355を制御する。なお、出力制御部340は、特許請求の範囲に記載の出力制御部の一例である。
時間領域合成部400は、入力チャンネルの周波数領域信号の各々を時間領域信号に変換した後に、符号列分離部310からのダウンミックス情報に基づいて、入力チャンネルの時間領域信号を出力チャンネルの時間領域信号に合成するものである。すなわち、この時間領域合成部400は、5チャンネルの周波数領域信号を周波数領域信号に変換した後に、ダウンミックス情報に基づいて5チャンネルの時間領域信号を2チャンネルの時間領域信号に合成する。
IMDCT・窓掛け処理部411乃至415は、信号線331乃至335から供給された周波数領域信号および窓情報に基づいて、入力チャンネルの時間領域信号を生成するものである。このIMDCT・窓掛け処理部411乃至415は、窓情報に含まれる窓掛け形式に基づいて逆修正離散余弦変換(IMDCT:Inverse MDCT)により、各周波数領域信号を時間領域信号に変換する。
また、IMDCT・窓掛け処理部411乃至415は、符号列分離部310からの窓情報に基づいて、その変換された時間領域信号に窓掛け処理を施す。また、IMDCT・窓掛け処理部411乃至415は、その窓掛け処理が施された時間領域信号の各々を時間領域混合部420に供給する。
時間領域混合部420は、符号列分離部310からのダウンミックス情報に基づいて、IMDCT・窓掛け処理部411乃至415から供給された5チャンネルの時間領域信号を混合することによって、2チャンネルの時間領域信号を生成するものである。すなわち、時間領域混合部420は、符号列分離部310からのダウンミックス情報と、入力チャンネルの時間領域信号とに基づいて、入力チャンネル未満の出力チャンネルの時間領域信号を生成する。
この時間領域混合部420は、AACの規定により、例えば、次式に基づいて5チャンネルの時間領域信号を混合して2チャンネルの時間領域信号を生成する。
Figure 2011007823
ここでは、Rs、R、C、L、Lsは、右サラウンドチャンネル、右チャンネル、センターチャンネル、左チャンネル、左サラウンドチャンネルの入力チャンネルの時間領域信号を示す。また、R'およびL'は、右チャンネルおよび左チャンネルの出力チャンネルの時間領域信号を示す。
また、Aはダウンミックス係数であり、1/√2、1/2、1/2・√2、0の4つのうちから選択される。ここでは、このダウンミックス係数Aは、音響符号化データに含まれる情報に基づいて設定されることを想定している。
このように、時間領域混合部420は、符号列分離部310からの式1に関するダウンミックス情報に基づいて、5チャンネルの時間領域信号を重み付け加算(混合)することによって、入力チャンネル数未満の2チャンネルの時間領域信号を生成する。このように、ダウンミックス情報に基づいて入力チャンネル数未満の出力チャンネル数の信号を生成することを、ここではダウンミックスという。
また、時間領域混合部420は、その生成された2チャンネルの時間領域信号を、2チャンネルの音響信号として加算部361および362に出力する。すなわち、時間領域混合部420は、右チャンネルの音響信号を加算部361に出力し、左チャンネルの音響信号を加算部362に出力する。
周波数領域合成部500は、符号列分離部310からのダウンミックス情報に基づいて、窓情報が全て同一である入力チャンネルの周波数領域信号を出力チャンネルの周波数領域信号に合成して、その合成された周波数領域信号を時間領域信号に変換するものである。すなわち、この周波数領域合成部500は、ダウンミックス情報に基づいて5チャンネルの周波数領域信号を2チャンネルの周波数領域信号に合成して、その2チャンネルの周波数領域信号を時間領域信号に変換する。
周波数領域混合部510は、符号列分離部310からのダウンミックス情報に基づいて、信号線331乃至335からの窓情報が全て同一である5チャンネルの周波数領域信号を混合することによって、2チャンネルの周波数領域信号を生成するものである。この周波数領域混合部510は、ダウンミックス情報線312からの式1に関するダウンミックス情報に基づいて、5チャンネルの周波数領域信号を重み付け加算(混合)することによって、入力チャンネル数未満の2チャンネルの周波数領域信号を生成する。これにより、出力音生成部520に出力する周波数領域信号を5チャンネルから2チャンネルに削減することができる。
また、この周波数領域混合部510は、符号列分離部310からのダウンミックス情報に基づいて生成された2チャンネルの出力チャンネルの周波数領域信号を出力音生成部520に出力する。すなわち、この周波数領域混合部510は、ダウンミックス情報に基づいて、窓形状を含む窓情報が同一である入力チャンネルの周波数領域信号同士を混合して、入力チャンネル数未満の出力チャンネル数の周波数領域信号として出力する。この周波数領域混合部510は、右チャンネルの周波数領域信号をIMDCT・窓掛け処理部521に出力し、左チャンネルの周波数領域信号をIMDCT・窓掛け処理部522に出力する。なお、周波数領域混合部510は、特許請求の範囲に記載の周波数領域混合部の一例である。
出力音生成部520は、周波数領域混合部510から出力された出力チャンネルの周波数領域信号を時間領域信号に変換して、その変換された時間領域信号に窓掛け処理を施すことによって、出力チャンネルの音響信号を生成するものである。すなわち、出力音生成部520は、窓情報に示される窓掛け形式および窓関数の種類に基づいて出力チャンネルの周波数領域信号に窓掛け処理を施すことによって、出力チャンネルの音響信号を生成する。なお、出力音生成部520は、特許請求の範囲に記載の出力音生成部の一例である。
IMDCT・窓掛け処理部521および522は、周波数領域混合部510から出力された窓情報に基づいて、出力チャンネルの周波数領域信号を時間領域信号に変換するものである。このIMDCT・窓掛け処理部521および522は、周波数領域混合部510からの窓情報に基づいて、その変換された時間領域信号に窓掛け処理を施す。なお、窓情報に含まれる窓形状が一致しない場合には、窓形状を一意に特定することができないため、周波数領域信号を時間領域信号に適切に変換することができない。また、窓情報に含まれる窓掛け形式が一致しない場合にも、窓掛け形式の変換長が異なるため、周波数領域信号を時間領域信号に変換することができない。
また、IMDCT・窓掛け処理部521および522は、その窓掛け処理が施された時間領域信号の各々を、出力チャンネルの音響信号として加算部361および362に出力する。すなわち、IMDCT・窓掛け処理部521は、右チャンネルの窓掛け処理が施された時間領域信号を、右チャンネルの音響信号として加算部361に出力する。また、IMDCT・窓掛け処理部522は、左チャンネルの窓掛け処理が施された時間領域信号を、左チャンネルの音響信号として加算部362に出力する。
加算部361および362は、時間領域合成部400または周波数領域合成部500からの出力のいずれか一方を出力するものである。この加算部361および362は、出力制御部340により、信号線331乃至335との接続が時間領域合成部400の方に切り替えられた場合には、時間領域混合部420からの出力チャンネルの音響信号を信号線111および121に出力する。
また、出力制御部340によって信号線331乃至335との接続が周波数領域合成部500の方に切り替えられた場合には、出力音生成部520からの出力チャンネルの音響信号を信号線111および121に出力する。
このように、出力制御部340を設けることによって、入力チャンネルにおける窓関数の種類を示す窓形状を含む窓情報が互いに一致するか否かを判断することができる。このため、入力チャンネルの窓情報が全て一致する場合に限り、その窓情報が一致する周波数信号同士を関連付けて周波数領域合成部500に出力することができる。すなわち、窓形状の異なる窓掛け処理が施された周波数領域信号同士を関連付けて周波数領域合成部500に出力することを防止することができる。
これにより、窓情報が全て一致する場合には、周波数領域混合部510によって周波数領域信号を入力チャンネル未満の出力チャンネル数に減らすことができるため、時間領域合成部400に比べてIMDCTによる演算量を削減することができる。
[音響信号復号装置300の動作例]
次に本発明の第1の実施の形態における音響信号復号装置300の動作について図面を参照して説明する。
図5は、本発明の第1の実施の形態における音響信号復号装置300による符号列の復号方法の処理手順例を示すフローチャートである。
まず、符号列分離部310により、符号列伝送線301から供給される符号例が、入力チャンネルの音響符号化データ、入力チャンネルの窓情報、ダウンミックス情報などに分離される(ステップS911)。そして、復号・逆量子化部320により、入力チャンネルの音響符号化データが復号される(ステップS912)。続いて、復号・逆量子化部320により、復号された音響符号化データが逆量子化されることによって、周波数領域信号が生成される(ステップS913)。
次に、出力制御部340により、符号列分離部310からの各入力チャンネルの窓情報に含まれる窓形式および窓形状に基づいて、入力チャンネルの窓情報が全て一致するか否かが判断される(ステップS914)。そして、全ての窓情報が一致した場合には、出力制御部340により、入力チャンネル全ての周波数領域信号を周波数領域合成部500に出力するように出力切替部351乃至355の接続が切り替えられる(ステップS919)。
すなわち、出力制御部340により、窓関数の種類が示された窓形状を含む窓情報に基づいて、その窓情報が互いに同一である周波数領域信号同士を関連付けて出力させるように出力切替部351乃至355が制御される。なお、ステップS914およびS919は、特許請求の範囲に記載の出力制御手順の一例である。
この後、周波数領域混合部510により、符号列分離部310からのダウンミックス情報に基づいて入力チャンネル数の周波数領域信号が混合されて、出力チャンネル数の周波数領域信号が生成される(ステップS921)。すなわち、周波数領域混合部510により、入力チャンネルの周波数領域信号同士をダウンミックス情報に基づいて混合して、入力チャンネル数未満の出力チャンネル数の周波数領域信号として出力する。なお、ステップS921は、特許請求の範囲に記載の周波数領域混合手順の一例である。
そして、IMDCT・窓掛け処理部521および522により、2つの出力チャンネルの周波数領域信号がIMDCT処理により変換されて、時間領域信号として生成される(ステップS922)。続いて、IMDCT・窓掛け処理部521および522により、その生成された時間領域信号に窓掛け処理が施されて、出力チャンネルの音響信号として出力される(ステップS923)。
すなわち、出力音生成部520により、周波数領域混合部510からの出力チャンネルの周波数領域信号を時間領域信号に変換して、その変換された時間領域信号に窓掛け処理を施すことによって出力チャンネルの音響信号が生成される。なお、ステップS922およびS923は、特許請求の範囲に記載の出力音生成手順の一例である。
一方、ステップS914において、全ての窓情報が一致しない場合には、出力制御部340により、入力チャンネル全ての周波数領域信号を時間領域合成部400に出力するように出力切替部351乃至355の接続が切り替えられる(ステップS915)。この後、IMDCT・窓掛け処理部411乃至415により、5つの入力チャンネルの周波数領域信号がIMDCT処理により変換されて時間領域信号として生成される(ステップS916)。
続いて、IMDCT・窓掛け処理部411乃至415により、その生成された時間領域信号に窓掛け処理が施されて、入力チャンネル数の時間領域信号として出力される(ステップS917)。そして、時間領域混合部420により、符号列分離部310からのダウンミックス情報に基づいて入力チャンネル数の時間領域信号が混合されて、出力チャンネルの音響信号として出力されて(ステップS918)、符号列の復号方法における処理が終了する。
このように、本発明の第1の実施の形態では、窓情報に含まれる窓形状および窓掛け形式が全て一致する場合に、入力チャンネルの周波数領域信号全てを混合することによって、入力チャンネル数未満の出力チャンネル数の周波数領域信号を生成することができる。これにより、周波数領域信号のチャンネル数が少なくなるため、周波数領域信号から時間領域信号に変換するための時間領域変換(IMDCT)による演算処理を削減することができる。
なお、ここでは一例として、入力チャンネルの窓情報が全て一致する場合に周波数領域信号を混合する例について説明したが、窓情報が全て一致しない場合であっても、周波数領域信号を混合することによって音響信号を適切に生成することができる。次に、全ての窓情報が一致しない場合においても、時間領域合成部400を設けることなく、出力チャンネルの音響信号を生成する音響信号復号装置の例を、第2の実施の形態として以下に図面を参照して説明する。
<2.第2の実施の形態>
[音響信号復号装置の構成例]
図6は、本発明の第2の実施の形態における音響信号復号装置の一構成例を示すブロック図である。音響信号復号装置600は、図4に示した音響信号復号装置300における出力制御部340、出力切替部351乃至355、時間領域合成部400、周波数領域合成部500、加算部361および加算部362に代えて周波数領域合成部700を備えている。ここでは、周波数領域合成部700以外の構成は、図4に示したものと同様であるため、図4と同一符号を付してここでの詳細な説明を省略する。
周波数領域合成部700は、出力制御部710と、第1乃至第16周波数領域混合部721乃至723と、出力音生成部730とを備える。また、出力音生成部730は、右チャンネルに対応する第1乃至第16のIMDCT・窓掛け処理部731乃至733と、左チャンネルに対応する第1乃至第16のIMDCT・窓掛け処理部741乃至743と、加算部751および752とを備える。
出力制御部710は、複数の窓情報における窓掛け形式と窓形状の組合せごとに、入力チャンネルの周波数領域信号同士を、その組合せに対応する第1乃至第16周波数領域混合部721乃至723のいずれかに関連付けて出力するように制御するものである。なお、出力制御部710は、特許請求の範囲に記載の出力制御部の一例である。
この出力制御部710は、各入力チャンネルに対応する第1乃至第5出力選択部711乃至715を備える。第1乃至第5出力選択部711乃至715は、符号列分離部310からの窓情報に含まれる窓形状および窓掛け形式の組合せに基づいて、復号・逆量子化部320から供給された入力チャンネルの周波数領域信号の出力先を選択するものである。この第1出力選択部711は、例えば、右サラウンドチャンネルの窓情報における窓掛け形式および窓形状の組合せに基づいて、復号・逆量子化部320から供給された右サラウンドチャンネルの周波数領域信号に対する出力先を選択する。
また、第1乃至第5出力選択部711乃至715は、窓情報における組合せに基づいてその選択された出力先として、その組合せに対応する第1乃至第16周波数領域混合部721乃至723のいずれかに、復号・逆量子化部320からの周波数領域信号を供給する。例えば、第1出力選択部711は、右サラウンドチャンネルの窓情報における組合せに基づいて、その組合せに対応するいずれかの第1乃至第16周波数領域混合部721乃至723に、右サラウンドチャンネルの周波数領域信号を出力する。また、第1乃至第5出力選択部711乃至715は、その組合せに対応する第1乃至第16周波数領域混合部721乃至723のいずれかに、窓情報を供給する。
第1乃至第16周波数領域混合部721乃至723は、図4に示した周波数領域混合部510と同様のものである。この第1乃至第16周波数領域混合部721乃至723は、複数の窓情報における組合せごとに、符号列分離部310からダウンミックス情報線312を介して供給されたダウンミックス情報に基づいて、入力チャンネルの周波数領域信号を混合するものである。この第1乃至第16周波数領域混合部721乃至723は、その混合された入力チャンネルの周波数領域信号を、入力チャンネル数未満の出力チャンネル数により第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至743に出力する。
第1周波数領域混合部721は、例えば、第1乃至第4出力選択部711乃至714からの周波数領域信号と、ダウンミックス情報とに基づいて、右および左チャンネルの周波数領域信号を、第1のIMDCT・窓掛け処理部731および741にそれぞれ出力する。また、第16周波数領域混合部723は、例えば、第5出力選択部715からの左サラウンドチャンネルの周波数領域信号とダウンミックス情報とに基づいて、左チャンネルの周波数領域信号を第16のIMDCT・窓掛け処理部743に出力する。
また、第1乃至第16周波数領域混合部721乃至723は、出力制御部710からの窓情報を、第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至743に出力する。なお、第1乃至第16周波数領域混合部721乃至723は、特許請求の範囲に記載の周波数領域混合部の一例である。
出力音生成部730は、第1乃至第16周波数領域混合部721乃至723から出力された出力チャンネルの周波数領域信号を時間領域信号に変換して、その変換された時間領域信号に窓掛け処理を施すものである。この出力音生成部730は、その窓掛け処理が施された時間領域信号を出力チャンネルごとに加算することによって、出力チャンネルの音響信号を生成する。なお、出力音生成部730は、特許請求の範囲に記載の出力音生成部の一例である。
第1乃至第16のIMDCT・窓掛け処理部731乃至733は、第1乃至第16周波数領域混合部721乃至723からの右チャンネルの周波数領域信号および窓情報に基づいて、出力チャンネルの周波数領域信号を時間領域信号に変換するものである。この第1乃至第16のIMDCT・窓掛け処理部731乃至733は、第1乃至第16周波数領域混合部721乃至723からの窓情報に基づいて、その変換された時間領域信号に窓掛け処理を施す。
また、第1乃至第16のIMDCT・窓掛け処理部731乃至733は、その窓掛け処理が施された時間領域信号の各々を加算部751に出力する。すなわち、第1乃至第16のIMDCT・窓掛け処理部731乃至733は、右チャンネルの窓掛け処理が施された時間領域信号を加算部751に出力する。
第1乃至第16のIMDCT・窓掛け処理部741乃至743は、第1乃至第16周波数領域混合部721乃至723からの左チャンネルの周波数領域信号および窓情報に基づいて、その左チャンネルの周波数領域信号を時間領域信号に変換するものである。この第1乃至第16のIMDCT・窓掛け処理部741乃至743は、第1乃至第16周波数領域混合部721乃至723からの窓情報に基づいて、その変換された時間領域信号に窓掛け処理を施す。また、第1乃至第16のIMDCT・窓掛け処理部741乃至743は、その窓掛け処理が施された時間領域信号の各々を加算部752に出力する。
加算部751および752は、第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至743から出力された時間領域信号を加算することによって、出力チャンネルの音響信号を生成するものである。この加算部751は、第1乃至第16のIMDCT・窓掛け処理部731乃至733からの時間領域信号を加算することによって、右チャンネルの音響信号を、信号線111を介して出力する。この加算部752は、第1乃至第16のIMDCT・窓掛け処理部741乃至743からの時間領域信号を加算することによって、左チャンネルの音響信号を、信号線121を介して出力する。
このように、窓情報における組合せごとに対応する第1乃至第16周波数領域混合部721乃至723を設けて、入力チャンネルの周波数領域信号を混合することによって、出力チャンネルの音響信号を生成することができる。ここで、第1乃至第5出力選択部711乃至715により選択される出力先の例について以下に図面を参照して簡単に説明する。
[出力制御部710による出力先の選択例]
図7は、本発明の第2の実施の形態における第1乃至第5出力選択部711乃至715による出力先の選択例を示す図である。ここでは、窓情報761における組合せごとの周波数領域信号出力先762が示されている。
窓情報761には、音響信号符号化装置200における窓掛け処理部211乃至215により施される窓掛け処理に関する窓掛け形式および窓形状の組合せが示されている。この窓情報761における組合せの数は、図3で述べたとおり、16通りある。周波数領域信号出力先762には、窓情報761における組合せごとの入力チャンネルの周波数領域信号の出力先が示されている。
この例において、窓情報に示される窓掛け形式がLONG_WINDOWであり、窓形状における前半部分および後半部分が共にサイン窓であるときは、第1乃至第5出力選択部711乃至715は、第1周波数領域混合部721に周波数領域信号を出力する。
このように、第1乃至第5出力選択部711乃至715により、窓情報761における組合せごとに出力先が選択されるため、窓情報が同一の周波数領域信号同士を、第1乃至第16周波数領域混合部721乃至723に関連付けて出力することができる。次に、この例における第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至743における窓掛け処理の例について図面を参照して説明する。
[各IMDCT・窓掛け処理部における窓掛け処理例]
図8は、本発明の第2の実施の形態における第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至743による窓掛け処理に関する例を示す図である。ここでは、図7に示した窓情報761および周波数領域信号出力先762の対応関係に基づいて、第1乃至第5出力選択部711乃至715が、周波数領域信号の出力先を選択することを想定している。
ここでは、第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至743によって施される窓掛け処理に関する窓掛け形式771および窓形状772が示されている。この例では、第1のIMDCT・窓掛け処理部731および741は、窓掛け形式がLONG_WINDOWであり、その窓掛け形式における前半部分および後半部分にサイン窓の窓形状を適用する窓掛け処理を時間領域信号に施す。
このように、第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至743は、出力制御部710からの入力チャンネルの周波数領域信号および窓情報に基づいて出力チャンネルの周波数領域信号を生成する。
[音響信号復号装置600の動作例]
次に本発明の第2の実施の形態における音響信号復号装置600の動作について図面を参照して説明する。
図9は、本発明の第2の実施の形態における音響信号復号装置600による符号列の復号方法の処理手順例を示すフローチャートである。
まず、符号列分離部310により、符号列伝送線301から供給される符号例が、入力チャンネルの音響符号化データ、入力チャンネルの窓情報、ダウンミックス情報などに分離される(ステップS931)。そして、復号・逆量子化部320により、入力チャンネルの音響符号化データが復号される(ステップS932)。続いて、復号・逆量子化部320により、復号された音響符号化データが逆量子化されることによって、周波数領域信号が生成される(ステップS933)。
次に、出力制御部710により、窓形状を含む複数の窓情報に基づいて、その窓情報における組合せが互いに同一である周波数領域信号同士が、それぞれの組合せに対応する第1乃至第16周波数領域混合部721乃至723に同時に出力される(ステップS934)。なお、ステップS934は、特許請求の範囲に記載の出力制御手順の一例である。
この後、第1乃至第16周波数領域混合部721乃至723により、窓情報における組合せごとに、ダウンミックス情報と入力チャンネルの周波数領域信号とに基づいて、出力チャンネルの周波数領域信号が生成される(ステップS935)。すなわち、第1乃至第16周波数領域混合部721乃至723により、符号列分離部310からのダウンミックス情報に基づいて、同一の組合せの周波数領域信号同士を混合して、入力チャンネル数未満の出力チャンネル数の周波数領域信号として出力する。なお、ステップS935は、特許請求の範囲に記載の周波数領域混合手順の一例である。
そして、第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至744により、第1乃至第16周波数領域混合部721乃至723からの出力チャンネルの周波数領域信号にIMDCT処理が施される(ステップS936)。すなわち、第1乃至第16のIMDCT・窓掛け処理部731乃至733により、第1乃至第16周波数領域混合部721乃至723からの右チャンネルの周波数領域信号の各々がIMDCT処理により変換されて時間領域信号として生成される。これとともに、第1乃至第16のIMDCT・窓掛け処理部741乃至743により、第1乃至第16周波数領域混合部721乃至723からの左チャンネルの周波数領域信号の各々がIMDCT処理により変換されて時間領域信号として生成される。
続いて、IMDCT・窓掛け処理部731乃至733および741乃至743の各々により、その生成した時間領域信号に窓掛け処理が施される(ステップS937)。そして、加算部751および752により、第1乃至第16のIMDCT・窓掛け処理部731乃至733からの窓掛け処理が施された時間領域信号が出力チャンネルごとに加算されることによって、音響信号として出力される(ステップS938)。
すなわち、出力音生成部730により、第1乃至第16周波数領域混合部721乃至723からの出力チャンネルの周波数領域信号を時間領域信号に変換して、その変換された時間領域信号に窓掛け処理を施すことによって出力チャンネルの音響信号が生成される。これにより、音響信号符号化装置により生成された符号列の復号方法における処理手順が終了する。なお、ステップS936乃至S938は、特許請求の範囲に記載の出力音生成手順の一例である。
このように、本発明の第2の実施の形態では、出力制御部710により窓情報の組合せごとに関連付けられた周波数領域信号同士をダウンミックス情報に基づいてそれぞれ混合する。そして、その混合された周波数領域信号を時間領域信号に変換して、その変換された時間領域信号の各々を出力チャンネルごとに加算することによって、出力チャンネルの音響信号が生成される。これにより、第1の実施の形態とは異なり、全ての窓情報が一致しなくても、入力チャンネルの周波数領域信号とダウンミックス情報とに基づいて、出力チャンネルの音響信号を生成することができる。
なお、この例では、入力チャンネルの窓情報における組合せの数が多いときは、入力チャンネルの時間領域信号をダウンミックスする場合に比べてIMDCT処理による演算量が増加してしまう場合がある。例えば、5チャンネルの窓情報のうち2チャンネルのみ窓情報が一致したときは、窓情報における組合せの数は4であり、第1乃至第16周波数領域混合部721乃至723から出力される周波数領域信号は8つ(組合せの数×出力チャンネル数)となる。このため、第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至743は、8チャンネルの周波数領域信号に対してIMDCT処理を施すことになる。
一方、時間領域信号をダウンミックスする場合は、入力チャンネル数である5チャンネルの周波数領域信号に対してIMDCT処理を施すことになる。このため、周波数領域信号をダウンミックスする方がIMDCT処理による演算量が増大してしまう。これに対し、入力チャンネルの時間領域信号をダウンミックスする場合に比べてIMDCT処理による演算量が増大しないように改良したものが、第3の実施の形態である。
<3.第3の実施の形態>
[音響信号復号装置の一構成例]
図10は、本発明の第3の実施の形態における音響信号復号装置の一構成例を示すブロック図である。音響信号復号装置800は、図4に示した出力制御部340および周波数領域合成部500に代えて、図7に示した周波数領域合成部700および出力制御部840を備えている。ここでは、周波数領域合成部700および出力制御部840以外の構成は、図4に示したものと同様であるため、図4と同一符号を付してここでの説明を省略する。さらに、周波数領域合成部700の機能は、図7に示したものと同様であるため、ここでの説明を省略する。また、出力制御部840は、図4に示した出力制御部340と対応する。
出力制御部840は、入力チャンネルの窓情報における組合せの数に基づいて、復号・逆量子化部320からの全ての入力チャンネルの周波数領域信号を、時間領域合成部400または周波数領域合成部700の一方に出力するように制御するものである。この出力制御部840は、窓情報線311からの各入力チャンネルの窓情報に基づいて窓情報における組合せの数を算出する。この出力制御部840は、例えば、5個の窓情報のうち、2個の窓情報だけが一致する場合には、窓情報における組合せの数を4と算出する。
また、出力制御部840は、その算出された組合せの数と、出力チャンネル数との乗算値が入力チャンネル数未満である否かを判断する。すなわち、出力制御部840は、窓情報線311からの各入力チャンネルの窓情報における組合せの数と、出力チャンネル数との乗算値が入力チャンネル数未満である否かを判断する。
そして、出力制御部840は、その乗算値が入力チャンネル数未満である場合には、周波数領域合成部700における出力制御部710に各入力チャンネルの周波数領域信号を同時に出力するように出力切替部351乃至355を制御する。すなわち、出力制御部840は、入力チャンネルの窓情報における組合せの数に基づいて、窓情報の組合せが同一の入力チャンネルの周波数領域信号同士を関連付けて第1乃至第16周波数領域混合部721乃至723に出力する。
一方、出力制御部840は、その乗算値が入力チャンネル数以上である場合には、時間領域合成部400におけるIMDCT・窓掛け処理部411乃至415に、各入力チャンネルの周波数領域信号を出力するように出力切替部351乃至355を制御する。なお、出力制御部840は、特許請求の範囲に記載の出力制御部の一例である。
このように、出力制御部840を設けることによって、窓情報における組合せの数と出力チャンネル数との乗算値が入力チャンネル数以上の場合には、時間領域合成部400におけるダウンミックス処理に切り替えることができる。
[音響信号復号装置800の動作例]
次に本発明の第3の実施の形態における音響信号復号装置800の動作について図面を参照して説明する。
図11は、本発明の第3の実施の形態における音響信号復号装置800による符号列の復号方法の処理手順例を示すフローチャートである。
まず、符号列分離部310により、符号列伝送線301から供給される符号例が、入力チャンネルの音響符号化データ、入力チャンネルの窓情報、ダウンミックス情報などに分離される(ステップS941)。そして、復号・逆量子化部320により、入力チャンネルの音響符号化データが復号される(ステップS942)。続いて、復号・逆量子化部320により、復号された音響符号化データが逆量子化されることによって、周波数領域信号が生成される(ステップS943)。
次に、出力制御部840により、符号列分離部310からの各入力チャンネルの窓情報に含まれる窓形式および窓形状の組合せの数Nが算出される(ステップS944)。続いて、窓情報における組合せの数Nと出力チャンネル数との乗算値が入力チャンネル数未満であるか否かが判断される(ステップS945)。そして、入力チャンネル数未満と判断された場合には、出力制御部840により、入力チャンネル全ての周波数領域信号を周波数領域合成部700に出力するように出力切替部351乃至355の接続が切り替えられる(ステップS951)。
すなわち、出力制御部840により、窓関数の種類が示された窓形状を含む窓情報に基づいて、その窓情報が互いに同一である周波数領域信号同士を同時に出力させるように出力切替部351乃至355が制御される。これにより、復号・逆量子化部320から出力される入力チャンネルの周波数領域信号の全てが周波数領域合成部700に供給される。なお、ステップS945およびS951は、特許請求の範囲に記載の出力制御手順の一例である。
この後、出力制御部710により、窓情報線311からの窓情報に基づいて、その窓情報における組合せが互いに同一である周波数領域信号同士が、それぞれの組合せに対応する第1乃至第16周波数領域混合部721乃至723に同時に出力される。そして、第1乃至第16周波数領域混合部721乃至723により、窓情報における組合せごとに、ダウンミックス情報と、入力チャンネルの周波数領域信号とに基づいて、出力チャンネルの周波数領域信号が生成される(ステップS952)。
すなわち、第1乃至第16周波数領域混合部721乃至723により、符号列分離部310からのダウンミックス情報に基づいて、同一の組合せの周波数領域信号同士を混合して、入力チャンネル数未満の出力チャンネル数の周波数領域信号として出力する。なお、ステップS952は、特許請求の範囲に記載の周波数領域混合手順の一例である。
そして、第1乃至第16のIMDCT・窓掛け処理部731乃至733および741乃至744により、第1乃至第16周波数領域混合部721乃至723からの出力チャンネルの周波数領域信号にIMDCT処理が施される(ステップS953)。すなわち、第1乃至第16のIMDCT・窓掛け処理部731乃至733により、第1乃至第16周波数領域混合部721乃至723からの右チャンネルの周波数領域信号の各々がIMDCT処理により変換されて時間領域信号として生成される。これとともに、第1乃至第16のIMDCT・窓掛け処理部741乃至743により、第1乃至第16周波数領域混合部721乃至723からの左チャンネルの周波数領域信号の各々がIMDCT処理により変換されて時間領域信号として生成される。
続いて、IMDCT・窓掛け処理部731乃至733および741乃至743の各々により、その生成した時間領域信号に窓掛け処理が施される(ステップS954)。そして、加算部751および752により、第1乃至第16のIMDCT・窓掛け処理部731乃至733からの窓掛け処理が施された時間領域信号が出力チャンネルごとに加算されることによって、音響信号として出力される(ステップS955)。
すなわち、出力音生成部730により、第1乃至第16周波数領域混合部721乃至723からの出力チャンネルの周波数領域信号を時間領域信号に変換して、その変換された時間領域信号に窓掛け処理を施すことによって出力チャンネルの音響信号が生成される。なお、ステップS953乃至S955は、特許請求の範囲に記載の出力音生成手順の一例である。
一方、ステップS945において、乗算値が入力チャンネル数未満である場合には、出力制御部840により、入力チャンネル全ての周波数領域信号を時間領域合成部400に出力するように出力切替部351乃至355が制御される(ステップS946)。この後、IMDCT・窓掛け処理部411乃至415により、5つの入力チャンネルの周波数領域信号がIMDCT処理により変換されて時間領域信号として生成される(ステップS947)。
続いて、IMDCT・窓掛け処理部411乃至415により、その生成された時間領域信号に窓掛け処理が施されて、入力チャンネル数の時間領域信号として出力される(ステップS948)。そして、時間領域混合部420により、符号列分離部310からのダウンミックス情報に基づいて入力チャンネル数の時間領域信号が混合されて、出力チャンネルの音響信号として出力されて(ステップS949)、符号列の復号方法における処理が終了する。
このように、本発明の第3の実施の形態では、周波数領域合成部700におけるIMDCT処理による演算量が時間領域合成部400と比べて大きくなる場合には、時間領域合成部400による処理に切り替えることができる。これにより、本発明の第2の実施の形態に比べて、IMDC処理による演算量を必要以上に増加させることを防止することができる。
このように、本発明の実施の形態によれば、時間領域信号への変換による演算処理を低減するとともに、窓形状を含む窓情報に基づいて適切に出力チャンネルの音響信号を生成することができる。
なお、本発明の実施の形態は本発明を具現化するための一例を示したものであり、本発明の実施の形態において明示したように、本発明の実施の形態における事項と、特許請求の範囲における発明特定事項とはそれぞれ対応関係を有する。同様に、特許請求の範囲における発明特定事項と、これと同一名称を付した本発明の実施の形態における事項とはそれぞれ対応関係を有する。ただし、本発明は実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において実施の形態に種々の変形を施すことにより具現化することができる。
また、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。この記録媒体として、例えば、CD(Compact Disc)、MD(MiniDisc)、DVD(Digital Versatile Disk)、メモリカード、ブルーレイディスク(Blu-ray Disc(登録商標))等を用いることができる。
100 音響信号処理システム
110 右チャンネルスピーカ
120 左チャンネルスピーカ
200、600、800 音響信号符号化装置
211〜215 窓掛け処理部
231〜235 MDCT部
241〜245 量子化部
250 符号列生成部
260 ダウンミックス情報受付部
300 音響信号復号装置
310 符号列分離部
320 復号・逆量子化部
340、710、840 出力制御部
361、362、751、752 加算部
400 時間領域合成部
411〜415、521、522、731〜733、741〜743 IMDCT・窓掛け処理部
420 時間領域混合部
500、721〜723 周波数領域合成部
510 周波数領域混合部
520、730 出力音生成部
700 周波数領域合成部
711〜715 出力選択部

Claims (8)

  1. 複数の入力チャンネルの音響信号に窓掛け処理が施された周波数領域信号に関する窓関数の種類が示された窓形状を含む窓情報に基づいて当該窓情報が互いに同一である前記周波数領域信号同士を同時に出力させるように制御する出力制御部と、
    前記窓情報が同一である前記入力チャンネルの周波数領域信号同士をダウンミックス情報に基づいて混合して前記入力チャンネル数未満の出力チャンネル数の周波数領域信号として出力する周波数領域混合部と、
    前記周波数領域混合部から出力された前記出力チャンネルの周波数領域信号を時間領域信号に変換して前記変換された時間領域信号に前記窓掛け処理を施すことによって前記出力チャンネルの音響信号を生成する出力音生成部と
    を具備する音響信号復号装置。
  2. 前記周波数領域混合部は、前記複数の窓情報における組合せごとに前記ダウンミックス情報に基づいて前記入力チャンネルの周波数領域信号を混合し、
    前記出力音生成部は、前記窓掛け処理が施された前記組合せごとの前記時間領域信号を加算することによって前記出力チャンネルの前記音響信号を生成する
    請求項1記載の音響信号復号装置。
  3. 前記出力制御部は、前記複数の窓情報における前記組合せの数と前記出力チャンネル数との乗算値が前記入力チャンネル数未満である場合には前記周波数領域混合部に前記入力チャンネルの前記周波数領域信号同士を同時に出力する請求項2記載の音響信号復号装置。
  4. 前記出力制御部は、前記入力チャンネルの音響信号に基づいて設定された窓の種類が示された窓掛け形式を含む前記窓情報に基づいて前記周波数領域信号の出力を制御し、
    前記出力音生成部は、前記窓情報に示される前記窓掛け形式および窓関数の種類に基づいて前記出力チャンネルの前記周波数領域信号に前記窓掛け処理を施すことによって前記出力チャンネルの前記音響信号を生成する
    請求項1記載の音響信号復号装置。
  5. 前記出力制御部は、前記窓掛け形式における前半部分および後半部分に対する前記窓形状が示された前記窓情報に基づいて前記周波数領域信号の出力を制御する請求項4記載の音響信号復号装置。
  6. 複数の入力チャンネルの音響信号に窓掛け処理を施して前記窓掛け処理における窓関数の種類が示された窓形状を含む窓情報を生成する窓掛け処理部と、前記窓掛け処理部から出力された前記音響信号を周波数領域に変換することによって周波数領域信号を生成する周波数変換部とを備える音響信号符号化装置と、
    前記音響信号符号化装置から出力された前記入力チャンネルの前記周波数領域信号に関する前記窓情報が互いに同一である前記周波数領域信号同士を同時に出力させるように制御する出力制御部と、前記窓情報が同一である前記入力チャンネルの周波数領域信号同士をダウンミックス情報に基づいて混合して前記入力チャンネル数未満の出力チャンネル数の周波数領域信号として出力する周波数領域混合部と、前記周波数領域混合部から出力された前記出力チャンネルの周波数領域信号を時間領域信号に変換して前記変換された時間領域信号に前記窓掛け処理を施すことによって前記出力チャンネルの音響信号を生成する出力音生成部とを備える音響信号復号装置と
    を具備する音響信号処理システム。
  7. 複数の入力チャンネルの音響信号に窓掛け処理が施された周波数領域信号に関する窓関数の種類が示された窓形状を含む窓情報に基づいて当該窓情報が互いに同一である前記周波数領域信号同士を同時に出力させるように制御する出力制御手順と、
    前記窓情報が同一である前記入力チャンネルの周波数領域信号同士をダウンミックス情報に基づいて混合して前記入力チャンネル数未満の出力チャンネル数の周波数領域信号として出力する周波数領域混合手順と、
    前記周波数領域混合手順により出力された前記出力チャンネルの周波数領域信号を時間領域信号に変換して前記変換された時間領域信号に前記窓掛け処理を施すことによって前記出力チャンネルの音響信号を生成する出力音生成手順と
    を具備する音響信号復号方法。
  8. 複数の入力チャンネルの音響信号に窓掛け処理が施された周波数領域信号に関する窓関数の種類が示された窓形状を含む窓情報に基づいて当該窓情報が互いに同一である前記周波数領域信号同士を同時に出力させるように制御する出力制御手順と、
    前記窓情報が同一である前記入力チャンネルの周波数領域信号同士をダウンミックス情報に基づいて混合して前記入力チャンネル数未満の出力チャンネル数の周波数領域信号として出力する周波数領域混合手順と、
    前記周波数領域混合手順により出力された前記出力チャンネルの周波数領域信号を時間領域信号に変換して前記変換された時間領域信号に前記窓掛け処理を施すことによって前記出力チャンネルの音響信号を生成する出力音生成手順と
    をコンピュータに実行させるプログラム。
JP2009148220A 2009-06-23 2009-06-23 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム Expired - Fee Related JP5365363B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP2009148220A JP5365363B2 (ja) 2009-06-23 2009-06-23 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム
TW099117632A TWI447708B (zh) 2009-06-23 2010-06-01 An audio signal processing system, an audio signal decoding device, and a processing method and program thereof
PCT/JP2010/059440 WO2010150635A1 (ja) 2009-06-23 2010-06-03 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム
US13/057,219 US8825495B2 (en) 2009-06-23 2010-06-03 Acoustic signal processing system, acoustic signal decoding apparatus, processing method in the system and apparatus, and program
EP10791953.2A EP2426662B1 (en) 2009-06-23 2010-06-03 Acoustic signal decoding device, method and corresponding program
KR1020117002948A KR20120031930A (ko) 2009-06-23 2010-06-03 음향 신호 처리 시스템, 음향 신호 복호 장치, 이들에서의 처리 방법 및 프로그램
CN2010800022072A CN102119413B (zh) 2009-06-23 2010-06-03 声信号处理系统、声信号解码设备、该系统和设备中的处理方法
RU2011104718/08A RU2011104718A (ru) 2009-06-23 2010-06-03 Система обработки акустического сигнала, устройство декодирования акустического сигнала, способ обработки в системе и устройстве и программа
BRPI1004287A BRPI1004287A2 (pt) 2009-06-23 2010-06-03 aparelho e método de decodificação de sinal acústico, sistema de processamento de sinal acústico, e, programa

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009148220A JP5365363B2 (ja) 2009-06-23 2009-06-23 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2011007823A true JP2011007823A (ja) 2011-01-13
JP5365363B2 JP5365363B2 (ja) 2013-12-11

Family

ID=43386407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009148220A Expired - Fee Related JP5365363B2 (ja) 2009-06-23 2009-06-23 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム

Country Status (9)

Country Link
US (1) US8825495B2 (ja)
EP (1) EP2426662B1 (ja)
JP (1) JP5365363B2 (ja)
KR (1) KR20120031930A (ja)
CN (1) CN102119413B (ja)
BR (1) BRPI1004287A2 (ja)
RU (1) RU2011104718A (ja)
TW (1) TWI447708B (ja)
WO (1) WO2010150635A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5903758B2 (ja) * 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
WO2013142650A1 (en) 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
EP2743921A4 (en) 2012-07-02 2015-06-03 Sony Corp DEVICE AND METHOD FOR DECODING, DEVICE AND METHOD FOR CODING AND PROGRAM
US20150100324A1 (en) * 2013-10-04 2015-04-09 Nvidia Corporation Audio encoder performance for miracast
WO2015173422A1 (de) * 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
CN113035210A (zh) * 2021-03-01 2021-06-25 北京百瑞互联技术有限公司 一种lc3音频混合方法、装置及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09252254A (ja) * 1995-09-29 1997-09-22 Nippon Steel Corp オーディオ復号装置
JP2002536681A (ja) * 1999-01-28 2002-10-29 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 適応性のあるブロック長符号化システムのためのデータ構成

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2710852B2 (ja) 1990-03-28 1998-02-10 ホーヤ株式会社 ガラス成形体の製造装置及び製造方法
JP4213708B2 (ja) * 1995-09-29 2009-01-21 ユナイテッド・モジュール・コーポレーション オーディオ復号装置
US5867819A (en) * 1995-09-29 1999-02-02 Nippon Steel Corporation Audio decoder
JP3279228B2 (ja) 1997-08-09 2002-04-30 日本電気株式会社 符号化音声復号装置
JP3806770B2 (ja) * 2000-03-17 2006-08-09 松下電器産業株式会社 窓処理装置および窓処理方法
JP3966814B2 (ja) * 2002-12-24 2007-08-29 三洋電機株式会社 簡易再生方法とこの方法に利用可能な簡易再生装置、復号方法、復号装置
US7519538B2 (en) * 2003-10-30 2009-04-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
DE602008005250D1 (de) * 2008-01-04 2011-04-14 Dolby Sweden Ab Audiokodierer und -dekodierer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09252254A (ja) * 1995-09-29 1997-09-22 Nippon Steel Corp オーディオ復号装置
JP2002536681A (ja) * 1999-01-28 2002-10-29 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 適応性のあるブロック長符号化システムのためのデータ構成

Also Published As

Publication number Publication date
US20120116780A1 (en) 2012-05-10
US8825495B2 (en) 2014-09-02
TWI447708B (zh) 2014-08-01
CN102119413B (zh) 2013-03-27
BRPI1004287A2 (pt) 2016-02-23
EP2426662A4 (en) 2012-12-19
KR20120031930A (ko) 2012-04-04
EP2426662B1 (en) 2017-03-08
CN102119413A (zh) 2011-07-06
RU2011104718A (ru) 2012-08-20
WO2010150635A1 (ja) 2010-12-29
JP5365363B2 (ja) 2013-12-11
EP2426662A1 (en) 2012-03-07
TW201123172A (en) 2011-07-01

Similar Documents

Publication Publication Date Title
AU2007322488B2 (en) Method for encoding and decoding object-based audio signal and apparatus thereof
JP5442995B2 (ja) マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法
US9966080B2 (en) Audio object encoding and decoding
JP5365363B2 (ja) 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム
RU2010152580A (ru) Устройство параметрического стереофонического повышающего микширования, параметрический стереофонический декодер, устройство параметрического стереофонического понижающего микширования, параметрический стереофонический кодер
RU2011141881A (ru) Усовершенствованное стереофоническое кодирование на основе комбинации адаптивно выбираемого левого/правого или среднего/побочного стереофонического кодирования и параметрического стереофонического кодирования
KR20160033777A (ko) 결합하여 인코딩된 잔류 신호들을 이용하는 오디오 인코더, 오디오 디코더, 방법들 및 컴퓨터 프로그램
RU2008137596A (ru) Кодирование и декодирование аудио
KR20130029254A (ko) 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
KR20070031212A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20080035448A (ko) 다채널 오디오 신호의 부호화/복호화 방법 및 장치
JP6299202B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置
CN115917644A (zh) 声音信号编码方法、声音信号编码装置、程序以及记录介质
CN115917643A (zh) 声音信号解码方法、声音信号解码装置、程序以及记录介质
KR20070031213A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070031214A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20140122990A (ko) 다채널 오디오 신호 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130826

R151 Written notification of patent or utility model registration

Ref document number: 5365363

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees