JP2010156822A - 多チャンネル音響信号の音響圧縮符号化装置及び復号装置 - Google Patents

多チャンネル音響信号の音響圧縮符号化装置及び復号装置 Download PDF

Info

Publication number
JP2010156822A
JP2010156822A JP2008334825A JP2008334825A JP2010156822A JP 2010156822 A JP2010156822 A JP 2010156822A JP 2008334825 A JP2008334825 A JP 2008334825A JP 2008334825 A JP2008334825 A JP 2008334825A JP 2010156822 A JP2010156822 A JP 2010156822A
Authority
JP
Japan
Prior art keywords
acoustic
category
channel
unit
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008334825A
Other languages
English (en)
Other versions
JP5135205B2 (ja
Inventor
Kaoru Watanabe
馨 渡辺
Yasushige Nakayama
靖茂 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2008334825A priority Critical patent/JP5135205B2/ja
Publication of JP2010156822A publication Critical patent/JP2010156822A/ja
Application granted granted Critical
Publication of JP5135205B2 publication Critical patent/JP5135205B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】多チャンネル音響方式において、低伝送ビットレート及び符号化処理の負荷を低減可能な、低ビットレート音響圧縮符号化に関する技法(符号化装置、復号装置)を提供する。
【解決手段】互いに離間して配置された複数の音響チャンネルによる多チャンネル音響信号の音響圧縮符号化装置(100)は、複数の音響チャンネルを、予め定められた音響チャンネルの配置情報に基づいてグループ化するグループ化部(112)、グループ化されたグループ毎に、当該グループに属する音響チャンネルを、当該音響チャンネルの音響信号の相関性に基づいてカテゴリーに分割するカテゴリー分割部(114)、分割されたカテゴリー毎に、当該カテゴリーに属する各音響信号を符号化し、当該符号化された各音響信号を多重化したカテゴリー別の音響圧縮符号化信号を生成するカテゴリー別音響圧縮符号化部(120)、生成されたカテゴリー別の音響圧縮符号化信号を多重化して伝送する多重化部(130)を備える。
【選択図】図2

Description

本発明は、多チャンネル音響信号の音響圧縮符号化装置及び復号装置に関し、特に、3次元(立体)音響方式のように多数のチャンネルから構成される音響システムにおいて、チャンネル間の位置関係と音響信号間の類似性(相関性)とを利用して符号化することで、従来よりも伝送ビットレート及び符号化負荷を低減可能な多チャンネル音響信号の音響圧縮符号化装置及び復号装置に関する。
現在、原音(リニアPCM:Pulse Code Modulation)に比べて大幅に少ない伝送ビットレートで、原音と遜色のない高音質の音響信号を伝送できる「低ビットレートの音響圧縮符号化技術」が多数知られている。例えば、マスキング等の聴覚の性質を利用して原音(リニアPCM)の約1/10以下のビットレートで符号化するものがある(例えば、非特許文献1を参照)。このような符号化を行っても、聴感上で符号化音と原音との差が知覚されることはほとんどない。また、5.1チャンネルサラウンド音響等の符号化として、左右2チャンネルの音響信号の類似性を用いて、“単一チャンネル信号の所要ビットレート×チャンネル数”よりも少ないビットレートで符号化するステレオ圧縮符号化方式がある(例えば、特許文献1を参照)。また、送信側においてあるチャンネルの音響信号を別チャンネルの音響信号から予測し予測誤差信号を送ることによって、受信側における原音の復元を可能にし、かつ伝送ビットレートを削減させたロスレス符号化方式がある(例えば、非特許文献2、非特許文献3を参照)。
一方、5.1チャンネルサラウンド音響方式よりもさらに臨場感の高い音響を再生可能な、大画面・高精細の映像システムに適した「3次元音響方式」が開発されている(例えば、非特許文献4を参照)。これは、平面上に加え高さ方向にもチャンネルを階層的に拡張し、高さ方向の音像定位を可能としたものである。この3次元音響方式について、図を用いて説明する。図8は、3次元音響方式における番組制作時のスピーカ(チャンネル)配置例である。図8に示すように、3次元音響方式の番組制作においては、大画面映像ディスプレイ(例えば、7680×4320画素)と多数のスピーカとを配置した標準制作条件下で番組制作を行う。即ち、この標準制作条件下では、大画面のディスプレイDISを前方に、低域効果音用スピーカLFE1,LFE2を除き、立体式の上位レイヤU1〜U9、中間レイヤM1〜M10、下位レイヤL1〜L3の22チャンネルで音響信号が制作される。
特開2002−268694号公報 ISO/IEC13818−7,2003 ISO/IEC14496−3,2005/AMD2 鎌本、守谷、西本、嵯峨山、"チャンネル間相関を用いた多チャンネル信号の可逆圧縮符号化"、情報処理学会論文誌、vol. 46, No. 5, pp. 1118-1128, May 2005 安藤彰男、"高臨場感音響"、NHK放送技術研究所、[検索日:平成20年12月15日]、インターネット<http://www.nhk.or.jp/strl/group/ningen_joho/ningen_joho06.html>
この3次元音響方式は、多数の音響信号(図8の場合、メインチャンネルが22チャンネル、低域強調チャンネル2チャンネル)から構成される。従って、これら音響信号を原音のまま伝送するためには、大きなビットレートを必要とする。なお、この3次元音響方式の多数の音響信号は、2チャンネルステレオ音響や5.1チャンネルサラウンド音響方式と比べ、音響信号間、特に、近接する音響チャンネルによる音響信号間により強い類似性をもつ。しかしながら、この3次元音響方式の多数の音響チャンネル信号がもつ強い類似性を利用した、すなわち、3次元音響方式等、複数のチャンネルが隣接して配置されるチャンネル配置の特性を生かした低ビットレート音響信号圧縮符号化技術は開発されていない。
従って、本発明の目的は、5.1チャンネルサラウンド音響方式よりもさらに臨場感の高い音響を再生できる3次元音響方式等、多数の音響チャンネルが用いられる多チャンネル音響方式において、多チャンネル音響方式の有する高い音響品質を保持しつつ、“単一チャンネル信号の所要ビットレート×チャンネル数”よりも少ない伝送ビットレートで伝送が可能な、低ビットレート音響圧縮符号化に関する技法(符号化装置、復号装置)を提供することにある。
上述した諸課題を解決すべく、本発明による、互いに離間して(三次元または二次元に)配置された複数の音響チャンネルによる多チャンネル音響信号の音響圧縮符号化装置は、
前記複数の音響チャンネルを、予め定められた音響チャンネルの配置情報(チャンネルの位置関係を示す情報)に基づいてグループ化するグループ化部と、
前記グループ化部によってグループ化されたグループ毎に、当該グループに属する音響チャンネルを、当該音響チャンネルの音響信号の相関性に基づいてカテゴリーに分割するカテゴリー分割部と、
前記カテゴリー分割部によって分割されたカテゴリー毎に、当該カテゴリーに属する各音響信号を符号化し、当該符号化された各音響信号を多重化したカテゴリー別の音響圧縮符号化信号を出力するカテゴリー別音響圧縮符号化部と、
前記カテゴリー別音響圧縮符号化部によって出力されたカテゴリー別の音響圧縮符号化信号を多重化して伝送する多重化部とを備えることを特徴とする。
また、本発明の一実施態様による多チャンネル音響信号の音響圧縮符号化装置は、
前記受信データは単一のフレームに含まれ、
前記カテゴリー分割部は、前記グループに属する音響チャンネルの音響信号を、当該音響信号を符号化する単位フレーム毎にカテゴリーに分割することを特徴とする。
本発明の別の実施態様による多チャンネル音響信号の音響圧縮符号化装置は、
既定のビットレートを、前記カテゴリー分割部によって分割された各カテゴリーに対して配分するビットレート配分部をさらに備えることを特徴とする。
本発明のさらに別の実施態様による多チャンネル音響信号の音響圧縮符号化装置は、
前記ビットレート配分部は、前記各カテゴリーに属するチャンネルの数に従って既定のビットレートを配分することを特徴とする。
上述したように本発明を送信側の符号化装置として説明してきたが、本発明はこれらの符号化装置によって送信された音響信号を復号する復号装置としても実現し得るものであり、本発明の範囲にはこれらも包含されるものと理解されたい。
例えば、本発明を復号装置として実現した、互いに離間して(三次元または二次元に)配置された複数の音響チャンネルによる多チャンネル音響信号を受信して復号する音響復号装置は、
前記多チャンネル音響信号は、当該音響信号の相関性に基づくカテゴリー毎に符号化されたカテゴリー別の音響圧縮符号化信号が多重化された多重化信号であり、
前記多重化信号を、前記カテゴリー別の音響圧縮符号化信号に分離し、当該分離されたカテゴリーに関するカテゴリー分割情報を抽出する分離部と、
前記分離部によって分離された前記カテゴリー別の音響圧縮符号化信号をカテゴリー毎に復号し、当該カテゴリーに属する各音響信号を出力するカテゴリー別音響復号部と、
前記分離部によって分離された前記カテゴリー分割情報に基づいて前記カテゴリー別音響復号部によって出力された音響信号を統合化し、前記多チャンネル音響信号を出力するカテゴリー統合部とを備えることを特徴とする。
なお、本発明による装置を、中央演算装置(CPU等)、メモリ等を備えたコンピュータとして構成することもでき、上述した各部は、当該各部の機能を記述したプログラムをCPUにより実行させることによって実現することができる。
このように、本発明によれば、3次元音響方式等複数の音響チャンネルが用いられる多チャンネル音響方式において、従来よりも符号化負荷を低減させ、かつ“単一チャンネル信号の所要ビットレート×チャンネル数”よりも少ない伝送ビットレートでの伝送が可能となる。
以下に、諸図面を参照しながら、本発明の一実施態様による多チャンネル音響信号の音響圧縮符号化装置及び復号装置について説明する。なお、これ以降では、図8に示す音響チャンネル配置を想定して説明する。しかしながら、本発明はこれに限られるものではなく、配置されるチャンネル数がより少ない場合(例えば、2チャンネル等)や、多数のチャンネルが平面上に配置される場合にも、本発明を適用可能であることに留意されたい。またこれ以降、「音響チャンネル信号」とは、各音響チャンネルから生成される音響信号のことを指すものとし、「音響信号」と同義で用いることもある。さらに、「多チャンネル音響信号」とは、複数の「音響チャンネル信号」の総称として用いる。
まず、図1に、本発明による多チャンネル音響信号の音響圧縮符号化装置及び復号装置を含む音響信号伝送システムの概略図を示す。図1に示すように、音響信号伝送システムは、送信側(放送局)として3次元音響等多チャンネル音響制作・運行装置300及び多チャンネル音響圧縮符号化装置100、受信側として多チャンネル音響復号装置200及び3次元音響等多チャンネル音響再生装置400を備える。3次元音響等多チャンネル音響制作・運行装置300は、例えば図8に示すような、3次元空間にチャンネルが立体的に配置された形式で制作された番組コンテンツに含まれる多チャンネル音響信号を、放送局の番組運行に基づいて多チャンネル音響圧縮符号化装置100へ送出する。多チャンネル音響圧縮符号化装置100は、3次元音響等多チャンネル音響制作・運行装置300から送出された多チャンネル音響信号を符号化し、低ビットレートの音響符号化ストリーム信号を生成する(詳細は後述する)。多チャンネル音響圧縮符号化装置100によって生成されたストリーム信号は、図示しない多重化装置等によって番組コンテンツの画像データストリーム信号と多重化され、無線または有線によって受信側へ送信される。
受信側(一般家庭、企業等)において、多チャンネル音響復号装置200は、図示しない分離装置等によって画像データストリーム信号から分離された音響符号化ストリーム信号を、多チャンネル音響信号の形式に復号する。多チャンネル音響復号装置200によって復号された多チャンネル音響信号は、3次元音響等多チャンネル音響再生装置400に送出され、再生される。
次に、本発明による多チャンネル音響圧縮符号化装置を説明する。図2は、本発明の一実施例による多チャンネル音響圧縮符号化装置100の概略ブロック図である。図2に示すように、多チャンネル音響圧縮符号化装置100は、多チャンネル音響カテゴリー分割部110、音響圧縮符号化部120、多チャンネル音響複数カテゴリー符号化ストリーム多重化部130及び各カテゴリー割当ビットレート配分部140を備える。さらに、音響圧縮符号化部120は、カテゴリー1内音響チャンネル圧縮符号化部121、カテゴリー2内音響チャンネル圧縮符号化部122等、多チャンネル音響カテゴリー分割部110によって分割されたカテゴリー数n(nは0を除く自然数)に対応するカテゴリーn内音響チャンネル圧縮符号化部12nを備える。
多チャンネル音響カテゴリー分割部110は、多チャンネル音響制作・運行装置300から送出された多チャンネル音響信号を受信し、チャンネル配置に基づいて音響チャンネルを複数のグループにグループ化する。さらに、多チャンネル音響カテゴリー分割部110は、グループ毎に、グループに含まれる音響チャンネル信号を、音響チャンネル信号の類似性を基に複数のカテゴリーに分割(クラスタリング)する。また、カテゴリー分割に関する情報(多チャンネル音響カテゴリー分割情報)を、多チャンネル音響複数カテゴリー符号化ストリーム多重化部130及び各カテゴリー割当ビットレート配分部140に出力する。
音響圧縮符号化部120は、多チャンネル音響カテゴリー分割部110によって分割されたカテゴリー毎に、カテゴリーに属する音響チャンネル信号を符号化し、符号化された各音響チャンネル信号を多重化したカテゴリー別の音響圧縮符号化信号を生成する。すなわち、音響圧縮符号化部120は、多チャンネル音響カテゴリー分割部110によって分割されたカテゴリーの数と同数の、カテゴリー別の音響圧縮符号化信号を生成する。
多チャンネル音響複数カテゴリー符号化ストリーム多重化部130は、音響圧縮符号化部120によって生成された複数のカテゴリー別の音響圧縮符号化信号と、多チャンネル音響カテゴリー分割部110からの多チャンネル音響カテゴリー分割情報とを多重化して、一つの伝送ストリームとする。なお、詳細は後述するが、多チャンネル音響カテゴリー分割情報としては、多チャンネル音響信号のカテゴリー分割に関する情報、カテゴリー内の音響チャンネルの符号化情報、カテゴリー内の音響チャンネル符号化情報の多重化に関する情報等が含まれる。
各カテゴリー割当ビットレート配分部140は、既定の所要のビットレートを、多チャンネル音響カテゴリー分割部110からの多チャンネル音響カテゴリー分割情報に基づき、各カテゴリーに対して割当てる。
なお、多チャンネル音響圧縮符号化装置100による音響信号の符号化は、予め定められた単位フレームに対して、または連続した数フレームに対して行われる。このフレームは、映像信号と同期をとることが可能なように構成し、例えば、音響信号48kHzサンプリング、映像信号30Hzの間で同期を取る場合、1600音声サンプルで構成される。
各部の詳細な機能を以下に説明する。図3は、多チャンネル音響カテゴリー分割部110の概略ブロック図である。図に示すように、多チャンネル音響カテゴリー分割部110は、多チャンネルグループ化部112及びカテゴリー分割部114を備える。なお、多チャンネル音響カテゴリー分割部110によるカテゴリー分割は、次のような概念に基づく。
まず、従来のマスキング等の聴覚の性質を利用した符号化を3次元音響方式に適用する場合に、3次元音響方式ではチャンネルが前方・後方及び上下方向に設置されているため、ある方向の音が同一方向の音を聞きづらくする(マスキングする)度合いと、別方向の音を聞きづらくする度合いとは異なる。すなわち、チャンネルの位置関係に応じてマスキング量を算出することが必要となる。これは言い換えれば、あるチャンネルに対して同程度の位置にある複数のチャンネルは、そのあるチャンネルからマスキングされる度合いが同程度になると考えられる。従って、チャンネルの位置関係に基づいて事前にチャンネルをグループ化し、グループ化したチャンネルに対して同じマスキング量を適用すれば、複数のチャンネルに対してマスキング量を算出する処理を軽減できる。
また、従来技術による、音響信号間の類似性に基づいた符号化によって伝送ビットレートを低減する場合、音響信号の類似性は音響チャンネルの位置関係による割合が大きいため、上述のように予め位置関係に基づいたグループ内の音響チャンネル信号間が類似性はより大きいと考えられる。すなわち、グループ内の音響チャンネル信号間の類似性に基づく符号化を行うのみで、十分に全ての音響チャンネル信号間の類似性に基づく符号化の利点を享受できると考えられる。従って、グループ化によって、全ての音響チャンネル信号に対する類似性を検査するよりも、類似性の検査処理を軽減できる。
図3に戻り、各部の機能を説明する。多チャンネルグループ化部112は、多チャンネル音響信号を、多数の音響チャンネルの配置情報に基づきグループ化する。グループ化の方法としては、最も理想的な視聴者の位置(例えば、スクリーンから数メートル等)に対するチャンネルの相対位置(視聴者の前方、後方、側方等)に応じて行うことができる。さらに、視聴者からの絶対距離を含めてもよい。なお、多チャンネルの配置情報は、あらかじめ番組の制作者によって入力される。または、音響チャンネル間で所定のテスト信号を送受信し、テスト信号の受信時間等に基づいてチャンネル間の位置を算出してもよい。
図4に、グループ化の一例を示す。なお簡単のため、二次元上のチャンネルのグループ化について説明する。図4に示すように、視聴者AUに対して、M1〜M10の10チャンネルが配置されている。図4の例では、視聴者AUの前方に位置するチャンネルM1〜M5の5チャンネルが1つのグループG1、後方に位置するM6〜M8の3チャンネルが1つのグループG2、左右に位置するM9,M10が、それぞれ、グループG3,G4にグループ化される。なお、図は一例であり、本発明はこれに限られるものではないことに留意されたい。例えば、グループ化としては、制約付き最適化に関するペナルティ関数法を用いることもできる。
カテゴリー分割部114は、多チャンネルグループ化部112によってグループ化されたグループ毎に、グループ内に含まれるチャンネルを、それらの音響チャンネル信号の類似性に基づいて少なくとも1つのカテゴリーに分割する。このカテゴリーの分割手法としては、既存の手法を用いることができ、例えば、階層的クラスタリング、予測差分最小化クラスタリング等を用いることができる(例えば、鳥脇,“認識工学”,コロナ社,pp. 84-95、長尾,“パターン情報処理”,コロナ社,pp. 98-124、非特許文献3を参照)。また、その他既知のMax-Min法等を用いることもできる。図3の例では、n個のカテゴリーに分割されるが、このとき、異なるグループの信号が同一のカテゴリーに属することはない。カテゴリー分割部114は、分割された各カテゴリーに属する音響チャンネル信号を、後続する音響圧縮符号化部120へ送出する。これは例えば、カテゴリーの数に応じたフラグ等を用意し、そのフラグを用いてカテゴリーnに属する音響チャンネル信号(カテゴリーn音響チャンネル信号)であることを示すようにする。また、カテゴリー分割部114は、カテゴリー分割に関する情報(カテゴリー数、各カテゴリーに含まれる音響チャンネル数等)も生成し、後続する音響圧縮符号化部120へ送出する。
音響圧縮符号化部120は、各カテゴリーn音響チャンネル信号を、カテゴリー毎に符号化するが、音響圧縮符号化部120に先立ち、各カテゴリー割当ビットレート配分部140について説明する。
各カテゴリー割当ビットレート配分部140は、多チャンネル音響カテゴリー分割部110によって分割されたカテゴリーに対して既定の(所要の)ビットレートを配分する。音響信号及びそのマスキング閾値は時々刻々と変動するため、その変動に応じて適応的にビットレートを配分すれば、音響信号をさらに高音質にすることも可能である。しかしながらその場合、圧縮符号化に要する計算処理量や時間が多大になる。従って本願では、必要な計算処理量と音質とを考慮し、カテゴリー内に含まれる音響チャンネル数に応じて、ビットレートを配分する手法を採用する。
一例として、カテゴリー内に含まれる音響チャンネル数に応じてビットレートを配分することが考えられる。すなわち、カテゴリー毎に一番目の音響信号には同一のビット配分を行い、二番目以降の音響信号には一番目の配分ビット数を指数的に減算したビット数を割当てる。このとき、j番目のカテゴリーに割当てられる配分ビット数の比は、このカテゴリー内に含まれる音響チャンネル数をchとすると、次式で与えられる。
Figure 2010156822
さらに、全体ビットレートをbr_total、カテゴリー分割数をNとすると、j番目のカテゴリーに割当てられる配分ビット数は、次式で与えられる。
Figure 2010156822
なお、αの値としては、例えばα=1/2としてもよい。
このようにすれば、各カテゴリー内の音響信号間は類似性が高く、一方、カテゴリーの異なる音響信号間は類似性が弱い(無い)、という性質に基づいて、カテゴリー内の音響チャンネル数に従って所要のビットレートを配分することができる。各カテゴリー割当ビットレート配分部140は、上述のようにして求めたビットレート配分を、音響圧縮符号化部120へ出力する。
音響圧縮符号化部120の機能を説明する。音響圧縮符号化部120は、多チャンネル音響カテゴリー分割部110によって分割されたカテゴリー別の音響チャンネル信号をそれぞれ符号化する、カテゴリーn内音響チャンネル圧縮符号化部12nを備える。なお、概念的に分かり易くするため、図4においてn個のカテゴリー内音響チャンネル圧縮符号化部を示しているが、分割されたカテゴリー毎に符号化することを示すためのものであり、必ずしも複数個備えられているものではないことに留意されたい。従って、カテゴリー1内音響チャンネル圧縮符号化部121〜カテゴリーn内音響チャンネル12nの構成は同じものである。
図5に、カテゴリー1内音響チャンネル圧縮符号化部121の概略ブロック図を示す。図に示すように、カテゴリー1内音響チャンネル圧縮符号化部121は、時間-周波数変換部121A、再量子化・符号化部121B、マスキング閾値算出部121C、カテゴリー1閾値算出部121D、音響チャンネル符号化情報多重化部121E及びカテゴリー割当ビットレート格納部BIT1を備える。時間-周波数変換部121Aは、カテゴリー1内に含まれる時間領域の音響チャンネル信号を周波数変換する。再量子化・符号化部121Bは、時間-周波数変換部121Aによって周波数領域に変換された音響チャンネル信号の再量子化・符号化を行う。また、マスキング閾値算出部121Cは、カテゴリー1内に含まれる各音響チャンネル信号のマスキング閾値を算出し、カテゴリー1閾値算出部121Dは、マスキング閾値算出部121Cによって求められた各音響チャンネルのマスキング閾値に基づき、カテゴリー1全体に対するマスキング閾値を算出する。
マスキング閾値算出部121Cは、カテゴリー内に含まれる音響チャンネル信号毎に、聴覚の臨界帯域幅又は周波数サブバンドに沿って、各音響チャンネル信号のマスキング閾値(個別チャンネル・マスキング閾値)を算出する。カテゴリー1閾値算出部121Dは、マスキング閾値算出部121Cによって求められた個別チャンネル・マスキング閾値を用いて、カテゴリーに対するマスキング閾値(カテゴリー・マスキング閾値)を算出する。例えば、カテゴリー1閾値算出部121Dは、マスキング閾値算出部121Cによって求められた個別チャンネル・マスキング閾値のうち最大のものを、カテゴリー・マスキング閾値として求めてもよい。または、各個別チャンネル・マスキング閾値のパワーの合計から、カテゴリー・マスキング閾値を求めることもできる。なお、個別チャンネル・マスキング閾値の計算方法は、例えばISO/IEC 11172−3等から既知であるため、説明を省略する。
時間-周波数変換部121Aによる時間領域の音響信号を周波数領域の信号(周波数サンプル信号)に変換する方法として、サブバンドにより複数の帯域に分割する方式と、DCT(Discrete Cosine Transform)を用いて直接周波数に変換する方式がある。サブバンド方式はMPEG−1 Layer2の符号化、DCT変換方式はMPEG−2 AAC(ISO/IEC 13818−7を参照)で用いられており、これら時間-周波数変換については、例えばISO/IEC11172−3等から既知であるため説明を省略する。
再量子化・符号化部121Bは、カテゴリー内の音響チャンネル信号に、各カテゴリー割当ビットレート配分部140によって予め割当てられたビット数を、臨界帯域(または周波数サブバンド)毎に適応的に配分する。例えば、ビットは、カテゴリー1閾値算出部121Dによって求められたカテゴリー・マスキング閾値と音響チャンネル信号の振幅レベルの差(デシベル差)とが大きい臨界帯域の順に割当ててもよい。この場合、各カテゴリー割当ビットレート配分部140によって割当てられたビット数を超えた時点で、ビットの割当が終了する。さらに、再量子化・符号化部121Bは、臨界帯域に配分されたビット数に基づいて、周波数サブバンドに含まれる周波数サンプル値を再量子化・符号化する。ここで、符号化された周波数サンプル値の伝送ビット数をさらに削減するために、ハフマン符号等の可逆符号化を用いることもできる。なお、再量子化・符号化については、例えばISO/IEC 11172−3等から既知であるため、詳細な説明は省略する。
音響チャンネル符号化情報多重化部121Eは、再量子化・符号化部121Bによって符号化されたカテゴリー内の音響チャンネル信号と、それら音響チャンネル信号に関する符号化情報を、1つの信号ストリームに多重化する。符号化情報としては、音響チャンネル信号の臨界帯域のビット配分情報、臨界帯域のビット配分情報に基づいて符号化された周波数サブバンドに含まれる周波数サンプル符号化データ等が含まれる。
また、カテゴリー内の音響圧縮符号化を行う際に、予測符号化を用いることもできる(例えば、非特許文献3を参照)。カテゴリー分割は、音響チャンネル信号の類似性を基に行われている。従って、カテゴリー内の音響チャンネル信号の予測残差を再量子化・符号化することで、音響チャンネル信号をそのまま再量子化・符号化する場合(従来の符号化)に比べ、より少ない伝送ビット数で、音響チャンネル信号をそのまま再量子化・符号化した場合と同等の音質を達成することができる。言い換えれば、同じ伝送ビット数であれば、予測符号化を用いたほうが、従来の符号化よりも高音質化することができる。ただし、予測残差の計算には復号・差分・再量子化の処理を要するため、演算処理量の増加を招く。従って、予測用補助信号(追加情報)の必要ビット数や処理量の増加量を勘案し、予測符号化の使用の有無を決定すればよい。
この場合、音響チャンネル符号化情報多重化部121Eによって多重化される符号化情報として、上述のものの他に、予測符号化の有無の情報及び予測符号化に関する情報や、予測符号化の周波数サンプル符号化データ等を含めることもできる。
上述のように、本発明による音響圧縮符号化装置によれば、3次元音響方式のような多数の音響チャンネルによる多チャンネル音響信号が、チャンネル間の位置関係と音響信号間の類似性とに基づいて符号化されるため、従来よりも伝送ビットレート及び符号化処理の負荷を低減することが可能となる。また、カテゴリーに含まれるチャンネル数に応じてビットが配分されるため、音響信号の品質を劣化させずに伝送することが可能となる。
次に、上述の音響圧縮符号化装置によって生成された音響圧縮符号化ストリーム信号を復号する音響復号装置について説明する。すなわち、本発明による音響復号装置は、複数の音響チャンネル信号がそれらの相関性に基づくカテゴリー毎に符号化されたカテゴリー別の音響圧縮符号化信号が多重化された信号を、復号する装置である。
図6は、本発明の一実施例による多チャンネル音響復号装置の概略ブロック図である。図に示すように、多チャンネル音響復号装置200は、多チャンネル音響複数カテゴリー符号化ストリーム分離部210、音響復号部220及び多チャンネル音響カテゴリー統合化部230を備える。多チャンネル音響複数カテゴリー符号化ストリーム分離部210は、多チャンネル音響圧縮符号化装置100によって送信された符号化ストリーム信号を、音響チャンネル符号化情報とカテゴリー毎に符号化された音響チャンネル信号とに分離する。さらに、分離部210は、カテゴリー分割に関する情報(多チャンネル音響カテゴリー分割情報)も分離する。音響復号部220は、カテゴリーn内音響チャンネル音響復号部22nを備え、分離部210によって分離されたカテゴリー別の音響圧縮符号化信号を、符号化情報に基づいてカテゴリー毎に復号し、カテゴリーに含まれる各音響チャンネル信号を復号する。多チャンネル音響カテゴリー統合化部230は、音響復号部220によって復号された各カテゴリーに含まれる音響チャンネル信号を、多チャンネル音響カテゴリー分割情報に基づいて統合し、多チャンネル音響信号を復元する。
図7に、カテゴリー1内音響チャンネル音響復号部221の概略ブロック図を示す。図のように、カテゴリー1内音響チャンネル音響復号部221は、カテゴリー1内音響チャンネル符号化ストリーム分離部221A、復号部221B及び周波数-時間変換部221Cを備える。カテゴリー1内音響チャンネル符号化ストリーム分離部221Aは、分離部210によって分離されたカテゴリー1に関する音響圧縮符号化信号を、カテゴリー1に含まれる個々の音響チャンネル信号の符号化信号(音響チャンネル符号化信号)に分離する。そして、個々の音響チャンネル符号化信号は、復号部221B及び周波数-時間変換部221Cによって、時間領域の音響チャンネル信号として出力される。なお、音響復号装置200及びその各構成部の処理は、音響圧縮符号化装置100の逆の構成をとるものであり、詳細な説明は省略する。
本発明によれば、3次元音響方式等複数の音響チャンネルが用いられる多チャンネル音響方式において、チャンネル間の位置関係と音響信号間の類似性とを利用した符号化によって、従来よりも符号化処理の負荷や時間を低減し、かつ“単一チャンネル信号の所要ビットレート×チャンネル数”よりも少ない伝送ビットレートでの伝送が可能となるので、多チャンネル音響方式の用途に有用である。
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各構成部に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の構成部を1つに組み合わせたり、或いは分割したりすることが可能である。
本発明による多チャンネル音響信号の音響圧縮符号化装置及び復号装置を含む音響信号伝送システムの概略図である。 本発明の一実施例による多チャンネル音響圧縮符号化装置の概略ブロック図である。 多チャンネル音響カテゴリー分割部の概略ブロック図である。 グループ化の一例を示す図である。 カテゴリー1内音響チャンネル圧縮符号化部の概略ブロック図である。 本発明の一実施例による多チャンネル音響復号装置の概略ブロック図である。 カテゴリー1内音響チャンネル音響復号部の概略ブロック図である。 3次元音響方式における番組制作時のスピーカ(チャンネル)配置例である。
符号の説明
100 多チャンネル音響圧縮符号化装置
110 多チャンネル音響カテゴリー分割部
112 多チャンネルグループ化部
114 カテゴリー分割部
120 音響圧縮符号化部
121 カテゴリー1内音響チャンネル圧縮符号化部
121A 時間-周波数変換部
121B 再量子化・符号化部
121C マスキング閾値算出部
121D 閾値算出部
121E 音響チャンネル符号化情報多重化部
122 カテゴリー2内音響チャンネル圧縮符号化部
12n カテゴリーn内音響チャンネル圧縮符号化部
130 多チャンネル音響複数カテゴリー符号化ストリーム多重化部
140 各カテゴリー割当ビットレート配分部
200 多チャンネル音響復号装置
210 多チャンネル音響複数カテゴリー符号化ストリーム分離部
220 音響復号部
221 カテゴリー1内音響チャンネル音響復号部
221A カテゴリー1内音響チャンネル符号化ストリーム分離部
221B 復号部
221C 周波数-時間変換部
230 多チャンネル音響カテゴリー統合化部
300 3次元音響等多チャンネル音響制作・運行装置
400 3次元音響等多チャンネル音響再生装置
M1〜M10 中間レイヤチャンネル
U1〜U9 上位レイヤチャンネル
L1〜L3 下位レイヤチャンネル
LFE1,LFE2 低域効果音用スピーカ

Claims (7)

  1. 互いに離間して配置された複数の音響チャンネルによる多チャンネル音響信号の音響圧縮符号化装置であって、
    前記複数の音響チャンネルを、予め定められた音響チャンネルの配置情報に基づいてグループ化するグループ化部と、
    前記グループ化部によってグループ化されたグループ毎に、当該グループに属する音響チャンネルを、当該音響チャンネルの音響信号の相関性に基づいてカテゴリーに分割するカテゴリー分割部と、
    前記カテゴリー分割部によって分割されたカテゴリー毎に、当該カテゴリーに属する各音響信号を符号化し、当該符号化された各音響信号を多重化したカテゴリー別の音響圧縮符号化信号を生成するカテゴリー別音響圧縮符号化部と、
    前記カテゴリー別音響圧縮符号化部によって生成されたカテゴリー別の音響圧縮符号化信号を多重化して伝送する多重化部と、
    を備えることを特徴とする多チャンネル音響信号の音響圧縮符号化装置。
  2. 前記カテゴリー分割部は、前記グループに属する音響チャンネルの音響信号を、当該音響信号を符号化する単位フレーム毎にカテゴリーに分割する、
    ことを特徴とする、請求項1に記載の多チャンネル音響信号の音響圧縮符号化装置。
  3. 既定のビットレートを、前記カテゴリー分割部によって分割された各カテゴリーに対して配分するビットレート配分部をさらに備える、
    ことを特徴とする、請求項1又は2に記載の多チャンネル音響信号の音響圧縮符号化装置。
  4. 前記ビットレート配分部は、前記各カテゴリーに属する音響チャンネルの数に従って既定のビットレートを配分する、
    ことを特徴とする、請求項3に記載の多チャンネル音響信号の音響圧縮符号化装置。
  5. 互いに離間して配置された複数の音響チャンネルによる多チャンネル音響信号を受信して復号する音響復号装置であって、
    前記多チャンネル音響信号は、当該音響信号の相関性に基づくカテゴリー毎に符号化されたカテゴリー別の音響圧縮符号化信号が多重化された多重化信号であり、
    前記多重化信号を、前記カテゴリー別の音響圧縮符号化信号に分離し、当該分離されたカテゴリーに関するカテゴリー分割情報を抽出する分離部と、
    前記分離部によって分離された前記カテゴリー別の音響圧縮符号化信号をカテゴリー毎に復号し、当該カテゴリーに属する各音響信号を出力するカテゴリー別音響復号部と、
    前記分離部によって分離された前記カテゴリー分割情報に基づいて前記カテゴリー別音響復号部によって出力された音響信号を統合化し、前記多チャンネル音響信号を出力するカテゴリー統合部と、
    を備えることを特徴とする多チャンネル音響信号の音響復号装置。
  6. 前記音響信号は、当該音響信号を符号化する単位フレーム毎にカテゴリーに分割されている、
    ことを特徴とする、請求項5に記載の多チャンネル音響信号の音響復号装置。
  7. 既定のビットレートが、前記カテゴリー毎に配分されている、
    ことを特徴とする、請求項5又は6に記載の多チャンネル音響信号の音響復号装置。
JP2008334825A 2008-12-26 2008-12-26 多チャンネル音響信号の音響圧縮符号化装置及び復号装置 Expired - Fee Related JP5135205B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008334825A JP5135205B2 (ja) 2008-12-26 2008-12-26 多チャンネル音響信号の音響圧縮符号化装置及び復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008334825A JP5135205B2 (ja) 2008-12-26 2008-12-26 多チャンネル音響信号の音響圧縮符号化装置及び復号装置

Publications (2)

Publication Number Publication Date
JP2010156822A true JP2010156822A (ja) 2010-07-15
JP5135205B2 JP5135205B2 (ja) 2013-02-06

Family

ID=42574792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008334825A Expired - Fee Related JP5135205B2 (ja) 2008-12-26 2008-12-26 多チャンネル音響信号の音響圧縮符号化装置及び復号装置

Country Status (1)

Country Link
JP (1) JP5135205B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013537773A (ja) * 2010-08-17 2013-10-03 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルオーディオ互換システム及び方法
CN104269174A (zh) * 2014-10-24 2015-01-07 百度在线网络技术(北京)有限公司 一种音频信号的处理方法及装置
JP2015186143A (ja) * 2014-03-25 2015-10-22 日本放送協会 チャンネル数変換装置
JP2016509697A (ja) * 2013-01-24 2016-03-31 グーグル インコーポレイテッド 多重チャンネルオーディオを圧縮するための再編成とレート割り当て

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07161140A (ja) * 1993-12-07 1995-06-23 Sony Corp ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法
JPH0865169A (ja) * 1994-06-13 1996-03-08 Sony Corp 符号化方法及び装置、復号化装置、並びに記録媒体
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07161140A (ja) * 1993-12-07 1995-06-23 Sony Corp ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法
JPH0865169A (ja) * 1994-06-13 1996-03-08 Sony Corp 符号化方法及び装置、復号化装置、並びに記録媒体
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013537773A (ja) * 2010-08-17 2013-10-03 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルオーディオ互換システム及び方法
JP2016509697A (ja) * 2013-01-24 2016-03-31 グーグル インコーポレイテッド 多重チャンネルオーディオを圧縮するための再編成とレート割り当て
JP2015186143A (ja) * 2014-03-25 2015-10-22 日本放送協会 チャンネル数変換装置
CN104269174A (zh) * 2014-10-24 2015-01-07 百度在线网络技术(北京)有限公司 一种音频信号的处理方法及装置

Also Published As

Publication number Publication date
JP5135205B2 (ja) 2013-02-06

Similar Documents

Publication Publication Date Title
JP7174810B6 (ja) 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置
KR102429841B1 (ko) 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치
CA2645912C (en) Methods and apparatuses for encoding and decoding object-based audio signals
JP6526153B2 (ja) 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置
JP2012238034A (ja) マルチチャンネルオーディオ信号復号化方法
KR20080086552A (ko) 오디오 신호의 디코딩 방법 및 장치
KR960039979A (ko) 음성다중 시스템을 적용한 디지탈 오디오 부호화기
JP5135205B2 (ja) 多チャンネル音響信号の音響圧縮符号化装置及び復号装置
TWI501220B (zh) 嵌入與擷取輔助資料
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110315

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121112

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5135205

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees