JP5843856B2 - ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法及びビットストリーム受信方法 - Google Patents

ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法及びビットストリーム受信方法 Download PDF

Info

Publication number
JP5843856B2
JP5843856B2 JP2013516194A JP2013516194A JP5843856B2 JP 5843856 B2 JP5843856 B2 JP 5843856B2 JP 2013516194 A JP2013516194 A JP 2013516194A JP 2013516194 A JP2013516194 A JP 2013516194A JP 5843856 B2 JP5843856 B2 JP 5843856B2
Authority
JP
Japan
Prior art keywords
bitstream
elementary
audio stream
encoding format
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013516194A
Other languages
English (en)
Other versions
JPWO2012160782A1 (ja
Inventor
孝祐 西尾
孝祐 西尾
宮阪 修二
修二 宮阪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Socionext Inc
Original Assignee
Socionext Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Socionext Inc filed Critical Socionext Inc
Priority to JP2013516194A priority Critical patent/JP5843856B2/ja
Publication of JPWO2012160782A1 publication Critical patent/JPWO2012160782A1/ja
Application granted granted Critical
Publication of JP5843856B2 publication Critical patent/JP5843856B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、圧縮符号化されたオーディオ信号を別の装置に向けて送信するビットストリーム送信装置、及び、当該ビットストリーム送信装置から送信されたオーディオ信号を受信してオーディオを出力する受信装置を備えたビットストリーム送受信システムに関するものである。
従来、圧縮符号化されて記録されたビデオ信号及びオーディオ信号をCD−ROM、DVD−ROM、半導体メモリ、及びハードディスク等の記録媒体から読み出し、読み出したビデオ信号及びオーディオ信号をデコード(伸張)して出力するデータ再生装置が知られている。そして、データ再生装置は、伸張されたデータを当該データ再生装置に接続された映像モニタ、及び音響スピーカ等に送る。これにより、ビデオ及びオーディオの再生が実現される。また、デジタル放送を再生する場合、データ再生装置は、圧縮符号化されたビデオ信号及びオーディオ信号を受信し、記録媒体からの再生と同様に、圧縮符号化されたビデオ信号及びオーディオ信号をデコードして出力する。これにより、ビデオ及びオーディオの再生が実現される。
ビデオ信号及びオーディオ信号の圧縮符号化に関しては、多くの規格が規定されている。
例えば、画像データ符号化規格の主な例としてはMPEG−2やMPEG−4などが挙げられる。
また、オーディオデータ符号化規格の主な例としてはDolby Digital、DTS(Digital Theater System)、MPEG Audio、及びMPEG−4 AAC(Adavanced Audio Coding)などが挙げられる。また、オーディオデータ符号化規格として、情報量を削減しないPCM(Pulse Code Modulation)方式なども挙げられる。
Dolby Digitalは米Dolby社の登録商標である。
DTSは米Digltal Theater System社の登録商標である。
これらのオーディオデータ符号化方式で符号化された信号を以降「エレメンタリオーディオストリーム」と呼ぶ。
また、エレメンタリオーディオストリームをデータ再生装置でデコードすると同時に、外部機器へ当該エレメンタリオーディオストリームを出力することも可能である。
例えば、デジタルテレビとAVレシーバとを、S/PDIF(Sony Philips Digital InterFace)又はHDMI(High−Definition Multimedia Interface)を用いて接続する。これにより、IEC60958/IEC61937に従って、デジタルテレビからAVレシーバへエレメンタリオーディオストリームを伝送することができる。
AVレシーバは、受信したエレメンタリオーディオストリームを、デコードして出力することでオーディオ信号の再生を実現する。
図7は、IEC60958/IEC61937における出力ビットストリームのデータ構成の一例を示す図である。図7(a)は、IEC60958/IEC61937で定められたエレメンタリオーディオストリームのデータ構成の一例を示している。図7(b)は、エレメンタリオーディオストリームを伝送するためのオーディオビットストリームのデータ構成の一例を示している。
図7(a)に示すように、エレメンタリオーディオストリーム300は、所定数のサンプル(例えば、1024サンプル)を含む単位であるフレームを複数含む。各フレームは、ヘッダ部(Header)と、エンコードデータ部(EncodedData)とを含む。エンコードデータ部には実際の音の符号化信号が記録され、ヘッダ部には、エンコードデータ部に記録された符号化信号の属性、例えば、サンプリングレート及びチャネル数などが記録される。
ヘッダ部に符号化信号の属性を記録する形式には、ADTS(Audio Data Transport Stream)形式と呼ばれるもの、及びLOAS(Low Overhead Audio Stream)形式と呼ばれるものがある。図8A及び図8Bは、IEC60958/IEC61937におけるビットストリームのヘッダ部のデータ形式の一例を示す図である。図8Aは、ADTS形式の固定ヘッダにおける記述の一例を示す。図8Aのテーブルの上から8行目には、符号化信号のサンプリング周波数をADTSで記述するためのフォーマットが示されている。ここでは、符号化信号のサンプリング周波数を0x3〜0x8から選択することが規定されている。図8Bは、LOAS形式のヘッダにおける記述の一例を示す。図8Bに示すように、LOAS形式においても、ヘッダに符号化信号のサンプリング周波数を記述する形式が規定されている。
図7(a)のエレメンタリオーディオストリーム300のエンコードデータ部に記録される符号化信号の符号化方式としては、国際標準規格のMPEGオーディオAAC方式、及びHEAAC(High−Efficiency Advanced Audio Coding)方式がよく知られている。HEAAC方式は、AAC方式に対してSBR(Spectral Band Replication)と呼ばれる周波数帯域拡大技術を適用した方式である。また、HEAAC方式は、SBR情報をあえて処理しないようにすれば、又はそもそもSBR情報を処理できないデコーダであれば、AACと互換性のある再生処理が行える。
上記エンコードデータ部に記述される符号化信号がSBR技術を適用して符号化されたものであるか否かは、エンコードデータ部内の情報を解析することで判断できる。すなわち、図7(a)のエレメンタリオーディオストリーム300内の破線枠のビット構造を調べることで上記を解析できる。破線枠はAAC規格におけるExtension_payloadと呼ばれる情報格納構造である。当該Extension_payload内にSBR情報が格納されているかどうかに応じて、符号化信号にSBR技術が適用されているかどうかを判断することができる。エレメンタリオーディオストリーム300では、Extension_payloadは各フレームの最後に配置されているが、必ずしも各フレームにExtension_payloadが存在する必要はない。
図7(b)に示すように、オーディオビットストリーム301は、IEC61937形式オーディオビットストリームである。IEC61937形式オーディオビットストリームは、エレメンタリオーディオストリームの前にPa、Pb、Pc及びPdと名付けられたプリアンブル信号が付加されたものである。さらに、エレメンタリオーディオストリームの後には、Stuffingと呼ばれる、信号長を調節するための無効信号が挿入される場合もある。
図9は、図7(b)に示したプリアンブル信号Pcのデータ形式を示す図である。図9に破線で囲んで示す部分は、プリアンブル信号Pc内に、LOAS形式で、SBR情報の有無(AACかHEAACかを示す信号)を記載するためのデータの一例を示す部分である。例えば、プリアンブル信号Pcの0ビット目から4ビット目までの5ビットが示す値が23の場合、当該エレメンタリオーディオストリーム300はLOAS形式である。さらに、プリアンブル信号Pcの5ビット目から6ビット目までの2ビットが示す値が1の場合、当該エレメンタリオーディオストリームにはSBR情報が含まれていないことが示される。すなわち、エンコードデータ部に記録されている符号化信号が、AACLC方式又はAAC方式で符号化されていることが示される。また、プリアンブル信号Pcの0ビット目から4ビット目までの5ビットが示す値が23で、かつ、プリアンブル信号Pcの5ビット目から6ビット目までの2ビットが示す値が2の場合、エレメンタリオーディオストリーム300にはSBR情報が含まれていることが示される。すなわち、エンコードデータ部に記録されている符号化信号が、HEAAC方式で符号化されていることが示される。
さて、上記技術を用いるビットストリーム送信装置は、エレメンタリオーディオストリーム300のようなエレメンタリオーディオストリームを受信した場合、当該エレメンタリオーディオストリームのExtension_payloadからSBR情報の有無を検出する。そして、ビットストリーム送信装置は、SBR情報がない場合は、上記プリアンブル信号Pcに図9に示したビット構造に従って、AACを指定する。一方、Extension_payloadにSBR情報がある場合は、ビットストリーム送信装置はHEAACを指定する。他のプリアンブル信号Pa、Pb及びPdもそれぞれ、そのビット構造と信号の意味の規定とにそって設定される。そして、必要に応じてStuffingが挿入されることで、IEC61937形式のオーディオビットストリームが生成される。
IEC 61937−11 Digital audio − Interface for non−linear PCM encoded audio bitstreams applying IEC 60958 − Part 11: MPEG−4 AAC and its extensions in LATM/LOAS ISO/IEC 14496−3 Information technology − Coding of audio−visual objects −Part 3:Audio ETSI TS 101 154 Technical Specification Digital Video Broadcasting (DVB);Specification for the use of Video and Audio Coding in Broadcasting Applications based on the MPEG−2 Transport Stream
しかしながら、上記従来技術には2点の課題がある。
課題の1点目として、MEPG−4 AACで定義されているパラメータの中で、ビットストリーム規格が定義されていないものがある、という点である。図10は、エレメンタリオーディオストリームのサンプリングレートと当該サンプリングレートに対して選択可能なオーディオデータのオーディオ符号化データ形式との関係を示す図である。
図10に示すように、AACサンプリングレートが、16kHz、22.05kHz、24kHzで、かつオーディオ符号化データ形式がAACの場合、ビットストリーム規格が定義されていない(図10の上から1〜3行目)。また、AACサンプリングレートが、32kHz、44.1kHzで、かつオーディオ符号化データ形式がHEAAC(AAC符号化信号にSBR情報が付加されている)場合、ビットストリーム規格が定義されていない(図10の4〜5行目)。特に後者、すなわち、AACサンプリングレートが、32kHz、44.1kHzで、オーディオ符号化データ形式がHEAACである場合は、デジタル放送等で運用が規定されているにもかかわらずビットストリーム規格が定義されていない。この結果、HEAACを用いて符号化された高音質のエレメンタリオーディオストリームを受信したとしても、このエレメンタリオーディオストリームを外部のマルチチャネルスピーカシステムなどで再生して楽しむことができないという課題がある。
課題の2点目として、例えば、オーディオ符号化データ形式が異なる符号化データが同一コンテンツに含まれるような場合には、出力ビットストリームにおける出力サンプリング周波数の切り替えが増加することである。
例えば、デジタル放送において、番組コンテンツ部分はオーディオ符号化データ形式がHEAACで、かつ、AACサンプリングレートが48KHzで放送されており、その一方で、コマーシャル部分はオーディオ符号化データ形式がAACLCかつAACサンプリングレートが48KHzで放送されている場合、番組コンテンツ部分とコマーシャル部分との切変わり目で出力サンプリング周波数の切り替えが発生する。
図11A及び図11Bは、HEAACデコーダが復号し再生する周波数帯域と、AACデコーダが復号し再生する周波数帯域との違いを示す図である。図11Aは、HEAACでかつAACサンプリングレートが48KHzの符号化データにおける再生可能な周波数帯域を示している。HEAACは、AACが再生する周波数帯域の信号に対し、SBR技術(Spectral Band Replication)を用いることでAACの2倍の周波数帯域の信号を再生する。すなわち図11Aの実線部分は48kHzのAACによって再生される0〜24kHzの信号を示しており、破線部分の24〜48kHzの帯域がSBR技術によって拡大される帯域を示している。それによって、96kHzの信号が再生される。一方図11BはAACでかつAACサンプリングレートが48KHzの符号化データが再生する周波数帯域を示している。図11Bに示すように、HEAACにおいてAAC部が再生する周波数帯域と同じ周波数帯域の信号が生成される。
図11A及び図11Bから分かるように、番組コンテンツ部分ではIEC60958のフレームレートが96KHzの信号が出力され、コマーシャル部分ではIEC60958のフレームレートが48KHzの信号が出力されることになる。このようなビットストリームを受信した場合、AVレシーバにおいて受信したビットストリームのIEC60958のフレームレートの変化に応答して再度同期をとるための処理が必要となる。そして、この処理に時間がかかるため、番組部分とコマーシャル部分との切り替わりで音切れを生じるという問題がある。
そこで、本発明は、サンプリング周波数に対応する実際の符号化形式が所定の形式に適合しない場合であっても、適合するオーディオビットストリームとして送信することができるビットストリーム送信装置を提供することを目的とする。
上記の課題を解決するために、本発明の一形態に係るビットストリーム送信装置は、所定の形式のオーディオビットストリームを送信するビットストリーム送信装置であって、オーディオ信号を符号化して得られたエレメンタリオーディオストリームを取得する入力部と、前記エレメンタリオーディオストリームのサンプリング周波数と符号化形式とを解析する解析部と、前記エレメンタリオーディオストリームの符号化形式を示す情報を含むプリアンブル信号を、前記解析部の解析結果に応じて生成するプリアンブル生成部と、前記プリアンブル生成部が生成した前記プリアンブル信号を前記エレメンタリオーディオストリームに付加することで、前記所定の形式のオーディオビットストリームを成形する成形部と、前記成形部で成形された前記オーディオビットストリームを出力する出力部とを備え、前記プリアンブル生成部は、前記解析部の解析結果から得られる前記サンプリング周波数と前記符号化形式とに応じて、前記オーディオビットストリームの前記所定の形式に適合する符号化形式で、かつ、前記エレメンタリオーディオストリームの解析結果から得られた符号化形式とは異なる符号化形式を、前記プリアンブル信号内の前記符号化形式を示す情報として記載する。
このように、プリアンブル生成部は、前記解析部の解析結果から得られる前記サンプリング周波数と前記符号化形式とに応じて、前記オーディオビットストリームの前記所定の形式に適合する符号化形式で、かつ、前記エレメンタリオーディオストリームの解析結果から得られた符号化形式とは異なる符号化形式を、前記プリアンブル信号内の前記符号化形式を示す情報として記載する。これにより、本発明の一形態に係るビットストリーム送信装置は、サンプリング周波数に対応する実際の符号化形式が所定の形式に適合しない場合であっても、適合するオーディオビットストリームとして送信することができる。
また、前記プリアンブル生成部は、前記出力部から出力するデータの出力伝送速度が予め定められた範囲となるように、前記プリアンブル信号内の前記符号化形式を示す情報を記載するとしてもよい。
ここで、「予め定められた範囲」とは、例えば、1536kbpsと1411.2kbpsと1024kbpsとであり、規格上伝送可能なビットレートである。これにより、本発明の一形態に係るビットストリーム送信装置は、エレメンタリオーディオストリームのサンプリング周波数と符号化形式とに応じて定まるオーディオビットストリームの出力伝送速度を、伝送可能な伝送速度にすることができる。
また、前記所定の形式のオーディオビットストリームはIEC61937規格で規定されたオーディオビットストリームであり、前記解析部の解析結果から得られた前記サンプリング周波数が、予め定められた第1の周波数である場合に、前記第1の周波数に対応する前記符号化形式が前記IEC61937規格の対応範囲外であれば、前記プリアンブル生成部は、前記符号化形式を示す情報として、前記エレメンタリオーディオストリームにおけるSBR(Spectral Band Replication)情報の有無の点で前記解析された符号化形式と異なる符号化形式を記載することで、前記オーディオビットストリームがIEC61937規格の対応範囲内となるようなプリアンブル信号を生成するとしてもよい。
これにより、本発明の一形態に係るビットストリーム送信装置は、前記解析部の解析結果から得られる前記サンプリング周波数と前記符号化形式とが前記オーディオビットストリームの前記所定の形式に適合しない場合、プリアンブル信号のSBR情報の有無だけを変更することにより、所定の形式に適合するオーディオビットストリームを成形することができる。よって、当該ビットストリーム送信装置は、少ない処理負荷で所定の形式に適合したオーディオビットストリームを生成して送信することができる。
また、前記プリアンブル生成部は、さらに、前記解析部の解析結果から得られた前記サンプリング周波数が、予め定められた第2の周波数である場合に、前記エレメンタリオーディオストリームが前記SBR情報の含まれない符号化形式で符号化されていることを、前記プリアンブル信号内の前記符号化形式を示す情報として記載するとしてもよい。
これにより、本発明の一形態に係るビットストリーム送信装置は、エレメンタリオーディオストリームのサンプリング周波数が第2の周波数である場合に、前記エレメンタリオーディオストリームが前記SBR情報の含まれない符号化形式で符号化されていることを、前記プリアンブル信号内の前記符号化形式を示す情報として記載することができる。よって、エレメンタリオーディオストリームのサンプリング周波数が第2の周波数のときには、当該エレメンタリオーディオストリームを常にSBR情報なしの符号化形式で復号することができるので、サンプリング周波数の変動を防止することができる。
また、前記プリアンブル生成部は、前記解析部の解析結果から得られた前記サンプリング周波数が、予め定められた第3の周波数である場合に、前記エレメンタリオーディオストリームが前記SBR情報の含まれる前記符号化形式で符号化されていなくても、前記SBR情報の含まれる符号化形式で符号化されていることを示すプリアンブル信号を生成するとしてもよい。
これにより、本発明の一形態に係るビットストリーム送信装置は、エレメンタリオーディオストリームのサンプリング周波数が第3の周波数であるときには強制的にSBR処理を行うように制御することができる。これにより、当該ビットストリーム送信装置は、第3の周波数が低域の場合には、オーディオビットストリームを所定の形式に適合させることができる。
また、前記プリアンブル生成部は、前記解析部の解析結果から得られた前記サンプリング周波数が、予め定められた第4の周波数である場合に、前記エレメンタリオーディオストリームが前記SBR情報の含まれる符号化形式で符号化されていても、前記SBR情報の含まれない符号化形式で符号化されていることを示すプリアンブル信号を生成するとしてもよい。
これにより、本発明の一形態に係るビットストリーム送信装置は、エレメンタリオーディオストリームのサンプリング周波数が第4の周波数であるときにはSBRなしのAACで復号を行うように制御することができる。よって、当該ビットストリーム送信装置は、第4の周波数が高域の場合には、オーディオビットストリームを所定の形式に適合させることができる。
また、本発明の一形態に係るビットストリーム送受信システムは、前記ビットストリーム送信装置と、当該ビットストリーム送信装置から送信されたオーディオビットストリームを受信し、受信した前記オーディオビットストリームを復号するビットストリーム受信装置とを備えたビットストリーム送受信システムであって、前記ビットストリーム受信装置は、受信した前記オーディオビットストリームに含まれる前記プリアンブル信号を除去することによって前記エレメンタリオーディオストリームを抽出するプリアンブル除去部と、前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と、前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている符号化形式を示す情報によって示される符号化形式で前記エレメンタリオーディオストリームを復号するエレメンタリデコード部とを備えてもよい。
また、本発明の一形態に係るビットストリーム送受信システムは、前記ビットストリーム送信装置と、当該ビットストリーム送信装置から送信されたオーディオビットストリームを受信し、受信した前記オーディオビットストリームを復号するビットストリーム受信装置とを備えたビットストリーム送受信システムであって、前記ビットストリーム受信装置は、受信した前記オーディオビットストリームに含まれる前記プリアンブル信号を除去することによって前記エレメンタリオーディオストリームを抽出するプリアンブル除去部と、前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている前記符号化形式を示す情報に従って、高域に拡大される信号を0として前記SBR情報を用いた復号処理を行うエレメンタリデコード部とを備えてもよい。
また、本発明の一形態に係るビットストリーム送受信システムは、前記ビットストリーム送信装置と、当該ビットストリーム送信装置から送信されたオーディオビットストリームを受信し、受信した前記オーディオビットストリームを復号するビットストリーム受信装置とを備えたビットストリーム送受信システムであって、前記ビットストリーム受信装置は、受信した前記オーディオビットストリームから前記プリアンブル信号を除去することによって前記エレメンタリオーディオストリームを抽出するプリアンブル除去部と、前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合の場合、前記プリアンブル信号に記載されている前記符号化形式を示す情報に従って、前記SBR情報を用いた復号処理を行った場合の1/2のサンプリング周波数の信号を生成するエレメンタリデコード部とを備えてもよい。
また、前記ビットストリーム受信装置は、当該ビットストリーム受信装置の能力を示す情報を前記ビットストリーム送信装置に通知する能力通知部を有し、前記解析部は、前記エレメンタリオーディオストリームのサンプリングレートを示すFS情報を解析し、前記プリアンブル生成部は、当該FS情報が予め定められた値の場合、前記通知手段からの情報に応じ、SBR情報が含まれていることを示すプリアンブル信号を生成するか否かを切り替えてもよい。
また、本発明の一形態に係るビットストリーム受信装置は、オーディオ信号を符号化して得られたエレメンタリオーディオストリームに、前記エレメンタリオーディオストリームの符号化形式を示す情報を含むプリアンブル信号を付加することで成形された、前記所定の形式のオーディオビットストリームであって、前記エレメンタリオーディオストリームのサンプリング周波数と前記符号化形式とが前記オーディオビットストリームの前記所定の形式に適合しない場合、前記オーディオビットストリームの前記所定の形式に適合する符号化形式が、前記プリアンブル信号内の前記符号化形式を示す情報として記載されたオーディオビットストリームをビットストリーム送信装置から受信する受信部と、受信した前記オーディオビットストリームに含まれる前記プリアンブル信号を除去することによって前記エレメンタリオーディオストリームを抽出するプリアンブル除去部と、前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている符号化形式を示す情報によって示される符号化形式で前記エレメンタリオーディオストリームを復号するエレメンタリデコード部とを備えるとしてもよい。
これにより、本ビットストリーム送受信システムのビットストリーム受信装置は、前記プリアンブル信号に記載されている符号化形式を示す情報と前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている符号化形式を示す情報によって示される符号化形式で前記エレメンタリオーディオストリームを復号することができる。よって、当該ビットストリーム受信装置は、エレメンタリオーディオストリーム内で符号化形式を示す情報とプリアンブル信号内で符号化形式を示す情報とが不整合である場合であっても、オーディオビットストリームを矛盾無く復号することができる。
また、前記ビットストリーム受信装置は、前記エレメンタリオーディオストリームの前記サンプリング周波数が、予め定められた第3の周波数である場合に、前記エレメンタリオーディオストリームが前記SBR情報の含まれる前記符号化形式で符号化されていなくても、前記SBR情報の含まれる符号化形式で符号化されていることを示すプリアンブル信号を含んだオーディオビットストリームを受信し、前記エレメンタリデコード部は、前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と、前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている前記符号化形式を示す情報に従って、高域に拡大される信号を0として前記SBR情報を用いた復号処理を行ってもよい。
また、前記ビットストリーム受信装置は、前記エレメンタリオーディオストリームの前記サンプリング周波数が、予め定められた第4の周波数である場合に、前記エレメンタリオーディオストリームが前記SBR情報の含まれる符号化形式で符号化されていても、前記SBR情報の含まれない符号化形式で符号化されていることを示すプリアンブル信号を含んだオーディオビットストリームを受信し、前記エレメンタリデコード部は、前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と、前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合の場合、前記プリアンブル信号に記載されている前記符号化形式を示す情報に従って、前記SBR情報を用いた復号処理を行った場合の1/2のサンプリング周波数の信号を生成してもよい。
なお、これらの全般的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたは記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。また、本発明は、上記ビットストリーム送信装置により生成されるオーディオビットストリームとして実現されてもよい。
以上のように、本発明は、サンプリング周波数に対応する実際の符号化形式が所定の形式に適合しない場合であっても、適合するオーディオビットストリームとして送信することができるビットストリーム送信装置を提供できる。
また、本発明の一形態によれば、入力されたエレメンタリオーディオストリームのサンプリングレートとそのサンプリングレートに対応する符号化形式とをIEC61937規格で送信する場合の不都合を解消することができる。
また、本発明の他の形態によれば、入力されたエレメンタリオーディオストリームがIEC61937規格範囲外のものであってもIEC61937規格範囲内になるようにしてビットストリーム送信できる。
さらに、本発明のさらに他の形態によれば、連続して入力されるエレメンタリオーディオストリームをデコードした場合、デコード信号のサンプリングレートの変化が生じないようにすることができる。
また、さらに本発明の他の形態によれば、受信したビットストリームに付加されたプリアンブル信号に記載されているパラメータPと該ビットストリームを構成しているエレメンタリオーディオストリームに含まれる前記パラメータPに対応するパラメータEとが不整合の場合でも正常にデコード信号を生成することができる。
また、本発明のさらに他の形態によれば、低FSのAACの場合、IEC61937規格範囲内になるようにしてビットストリーム送信できる。
本発明のさらに他の形態によれば、低FSのAACの場合、予め定められた中FSのサンプリングレートの再生音を生成できる。
本発明のさらに他の形態によれば、高FSのHEAACの場合、IEC61937規格範囲内になるようにしてビットストリーム送信できる。
本発明のさらに他の形態によれば、高FSのAACの場合、予め定められた中FSのサンプリングレートの再生音を生成できる。
図1は、本発明の実施の形態1におけるビットストリーム送信装置の構成の一例を示す図である。 図2は、本発明の実施の形態1におけるビットストリーム受信装置の構成の一例を示す図である。 図3は、本発明の実施の形態1におけるビットストリーム送受信システムのオーディオシステムへの適用例を示す図である。 図4Aは、本発明の実施の形態1に係る、AAC方式とHEAAC方式の再生帯域の違いを説明するための図である。 図4Bは、本発明の実施の形態1に係る、AAC方式とHEAAC方式の再生帯域の違いを説明するための図である。 図5Aは、本発明の実施の形態1に係る、図10に示したストリーム出力規定の意味を説明するための図である。 図5Bは、本発明の実施の形態1に係る、図10に示したストリーム出力規定の意味を説明するための図である。 図5Cは、本発明の実施の形態1に係る、図10に示したストリーム出力規定の意味を説明するための図である。 図6は、本発明の実施の形態2におけるビットストリーム送信受信システムの構成の一例を示す図である。 図7は、IEC60958/IEC61937における出力ビットストリームのデータ構成の一例を説明する図である。 図8Aは、ADTS形式の固定ヘッダの記述の一例を示す図である。 図8Bは、LOAS形式のヘッダの記述の一例を示す図である。 図9は、図7(b)に示したプリアンブル信号Pcのデータ形式を示す図である。 図10は、エレメンタリオーディオストリームのサンプリングレートとオーディオ符号化データ形式との組み合わせに対するIEC61937規格におけるストリーム出力規定の有無を示す図である。 図11Aは、HEAACで、かつ、AACサンプリングレートが48KHzの符号化データが再生可能な周波数帯域を示す図である。 図11Bは、AACで、かつ、AACサンプリングレートが48KHzの符号化データが再生可能な周波数帯域を示す図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。なお、以下で説明する実施の形態は、いずれも本発明の一具体例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。本発明は、請求の範囲によって特定される。よって、以下の実施の形態における構成要素のうち、本発明の最上位概念を示す独立請求項に記載されていない構成要素については、本発明の課題を達成するのに必ずしも必要ではないが、より好ましい形態を構成するものとして説明される。
(実施の形態1)
以下本発明の実施の形態1におけるビットストリーム送信装置について図面を参照しながら説明する。
図1は本実施の形態1におけるビットストリーム送信装置200の構成を示す図である。図1に示すように、ビットストリーム送信装置200は、入力部100、解析部101、プリアンブル生成部102、成形部103及び出力部104を備える。
入力部100は、オーディオ信号を符号化して得られたエレメンタリオーディオストリーム300を取得する。
解析部101は、取得されたエレメンタリオーディオストリーム300のサンプリングレートとオーディオ符号化データ形式とを解析する。
プリアンブル生成部102は、解析部101の解析結果に応じて、IEC61937で規定された形式のオーディオビットストリームを構成するプリアンブル信号を生成する。これにおいて、プリアンブル生成部102は、解析部101の解析結果から得られるサンプリング周波数が予め定められた値である場合、エレメンタリオーディオストリーム300のオーディオ符号化データ形式を示すパラメータを、IEC61937の規定に従う値に変更することでプリアンブル信号を生成する。
成形部103は、プリアンブル生成部102が生成したプリアンブル信号をエレメンタリオーディオストリーム300に付加することで、IEC61937形式のオーディオビットストリームを成形する。
出力部104は、成形部103で成形されたオーディオビットストリーム301を出力する。
図2は、実施の形態1におけるビットストリーム受信装置の構成の一例を示す図である。図2に示すように、ビットストリーム受信装置201は、図1に示したビットストリーム送信装置200から送信されたオーディオビットストリーム301を受信し、受信したオーディオビットストリーム301をデコードする。このビットストリーム受信装置201は、プリアンブル除去部202及びエレメンタリデコード部203を備える。
プリアンブル除去部202は、ビットストリーム受信装置201に内蔵され、ビットストリーム送信装置200から送信されるIEC61937形式オーディオビットストリーム301からプリアンブル信号Pa、Pb、Pc及びPdを除去することでエレメンタリオーディオストリーム300を抜き出す。
エレメンタリデコード部203は、ビットストリーム受信装置201に内蔵され、プリアンブル除去部202で抜き出されたエレメンタリオーディオストリーム300をデコードすることでオーディオ信号(マルチチャネルデコード信号)を生成し、生成したオーディオ信号を出力する。エレメンタリデコード部203は、エレメンタリオーディオストリーム300をデコードする際において、プリアンブル信号Pcで示されるオーディオ符号化データ形式と、Extension_payloadで示されるオーディオ符号化データ形式とが矛盾する場合には、プリアンブル信号Pcで示されるオーディオ符号化データ形式でエレメンタリオーディオストリーム300をデコードする。
図3は、図1に示したビットストリーム送信装置200と図2に示したビットストリーム受信装置201とを備えた送受信システムを、オーディオ機器へ実装した例を示す図である。
図3に示すように、ビットストリーム送信装置200とビットストリーム受信装置201とを備えるビットストリーム送受信システム210は、IEC61937形式のオーディオビットストリーム301を伝送する接続線を介して接続される。この接続線は、例えば、HDMIなどである。ビットストリーム送信装置200は、例えば、テレビ220に内蔵され、テレビ220内部のデコーダ及び2チャネルダウンミックス部を介して、例えば、2チャネルのステレオスピーカに接続される。テレビ220は、図示しないアンテナ、チューナ、又はCDドライバなどを介して放送波又はCDなどからエレメンタリオーディオストリーム300を取得し、取得したエレメンタリオーディオストリーム300をビットストリーム送信装置200の入力部100に入力する。デコーダ221は、入力部100から成形部103に入力されるエレメンタリオーディオストリーム300を取り込んで、一旦、マルチチャネルオーディオ信号に復号する。2チャネルダウンミックス部222(2chダウンミックス部)は、エレメンタリオーディオストリーム300をデコーダで復号して得られたマルチチャネルオーディオ信号を、2チャネルのステレオオーディオ信号にダウンミックスし、当該ステレオオーディオ信号をステレオスピーカ223に出力する。
ビットストリーム受信装置201は、例えば、5.1チャネルなどのマルチチャネルスピーカ231を備えたシアターシステム230に内蔵される。このビットストリーム受信装置201は、HDMIなどを介してビットストリーム送信装置200から入力された、IEC61937の規定に従うオーディオビットストリーム301を復号し、復号によって得られたマルチチャネルオーディオ信号を、マルチチャネルスピーカ231に出力する。
以下では、以上のように構成されたビットストリーム送信装置200のより詳細な動作について説明する。
まず、入力部100は、エレメンタリオーディオストリーム300を取得する。エレメンタリオーディオストリーム300は、図7で示したようなデータ形式のストリームであり、本実施の形態1では、ヘッダ形式はLOAS形式であり、エンコードデータは、SBR情報を含まないAAC方式のエンコードデータであるとする。エレメンタリオーディオストリーム300内のエンコードデータ部にはExtension_payload310は含まれておらず、ヘッダ内に記載されているサンプリングレート(サンプリング周波数)は24kHzとする。
次に解析部101で、エレメンタリオーディオストリーム300を解析する。本実施の形態1では、入力されたエレメンタリオーディオストリーム300は、上で述べたように、サンプリングレートが24kHzで、SBR情報を含んでいないものであるので、そのことが解析部101によって解析される。サンプリングレートは図8Bに示したLOASヘッダ形式の規定に沿ってビットストリームを解析することで得られる。また、SBR情報の有無は、図7に示したExtension_payloadの規定に沿ってビットストリームを解析することで得られる。
次にプリアンブル生成部102で、解析部101の解析結果に応じてIEC61937形式のプリアンブル信号を生成する。エレメンタリオーディオストリーム300が、サンプリングレートが24kHzで、SBR情報を含んでいない場合、図10に示したように、IEC61937形式のオーディオビットストリームが定義されていない。よって、プリアンブル生成部102は、エレメンタリオーディオストリーム300がSBR情報を含んでいることを示すプリアンブル信号を生成する。具体的には、プリアンブル生成部102は、プリアンブル信号Pcの0から4ビット目の5ビットが示す値を23に設定する。これにより、プリアンブル信号Pcは、ヘッダ形式がLOAS形式であることを示す。さらに、プリアンブル生成部102は、プリアンブル信号Pcの5から6ビット目の2ビットを2に設定する。これにより、プリアンブル信号Pcは、エレメンタリオーディオストリーム300にSBR情報が含まれていることを示す。ここでSBR情報が含まれているとは、すなわち、プリアンブル信号Pcは、エレメンタリオーディオストリーム300がHEAAC方式で符号化されていることを示す。本実施の形態1では、サンプリングレートは24kHzとしたが、22.05kHzや16kHzであっても同様であることはいうまでもない。
次に、成形部103は、プリアンブル生成部102から出力されたプリアンブル信号をエレメンタリオーディオストリーム300に付加する。すなわち、成形部103は、図7のオーディオビットストリーム301に示したようなIEC61937形式のオーディオビットストリームを成形する。
最後に、出力部104は、成形部103からの信号であるオーディオビットストリーム301を外部機器に出力する。
また、図2のように構成されたビットストリーム受信装置201の動作について、以下説明する。
まず、ビットストリーム送信装置200は、入力されたエレメンタリオーディオストリーム300をIEC61937形式のオーディオビットストリーム301に成形し、当該オーディオビットストリーム301を出力する。
例えば、入力されたエレメンタリオーディオストリーム300のサンプリングレート(サンプリング周波数)が24kHzで、SBR情報がない(AAC方式)符号化が行われている場合、プリアンブル信号の中のPcには、SBR情報がある(HEAAC方式)を示すコードが記載されている。また、例えば、入力されたエレメンタリオーディオストリーム300のサンプリングレート(サンプリング周波数)が48kHzで、SBR情報がある(HEAAC方式)の場合、プリアンブル信号の中のPcには、SBR情報がない(AAC方式)を示すコードが記載されている。
プリアンブル除去部202は、ビットストリーム送信装置1000から送信されるIEC61937形式のオーディオビットストリーム301からプリアンブル信号Pa、Pb、Pc及びPdを除去することでエレメンタリオーディオストリーム300を抜き出す。もし、IEC61937形式のオーディオビットストリーム301にStuffing信号が入っている場合は、プリアンブル除去部202は、当該Stuffing信号も取り除き、エレメンタリオーディオストリーム300を生成する。このようにして生成されたエレメンタリオーディオストリーム300は、AAC方式、又はHEAAC方式のエレメンタリオーディオストリームであり、MPEG規格で規定されたデコード手順にそってデコードできるものである。また、当該プリアンブル除去部202では、SBR情報の有無を示すSBR有無情報をプリアンブル信号Pcから検出し、当該SBR有無情報を後続のエレメンタリデコード部203に送出する。
エレメンタリデコード部203は、抜き出されたエレメンタリオーディオストリーム300をデコードすることでオーディオ信号を生成する。また、エレメンタリデコード部203は、プリアンブル除去部202から送出されるSBR有無情報を参照し、エレメンタリオーディオストリーム300に含まれているSBR情報の有無を示す情報と、プリアンブル除去部202からのSBR有無情報とが矛盾するかを判定し、矛盾する場合には、プリアンブル除去部202からのSBR有無情報の示す内容に従う。
例えば、エレメンタリオーディオストリーム300が、サンプリングレートが24kHzで、「SBRなし」であっても、SBR有無情報が「SBR情報あり」を示している場合は、エレメンタリデコード部203は、帯域拡大処理を実施する。もちろん、実際にはエレメンタリオーディオストリーム300のExtension_payload内にSBR情報がないので、エレメンタリデコード部203は、完全な帯域拡大処理は実施できないが、例えば、デコード信号のサンプリングレートを2倍にアップサンプリングする処理を実行するなどの処理を行う。すなわち、エレメンタリデコード部203は、SBRによって高域に複製される成分が0であるような帯域拡大処理を実施することと等価な処理を行う。
また、例えば、エレメンタリオーディオストリーム300が、サンプリングレートが48kHzで、「SBR情報あり」であっても、SBR有無情報が「SBRなし」を示している場合は、エレメンタリデコード部203は、帯域拡大処理を実施しない。例えば、エレメンタリデコード部203は、実際には存在しているSBR情報を読み飛ばして無視する。または、エレメンタリデコード部203は、実際に存在しているSBR情報を適用はするが、出力のサンプリングレートを1/2にダウンサンプリングして結果として48kHzの信号を生成する、などの処理を行う。
なお、エレメンタリデコード部203は、エレメンタリオーディオストリーム300に含まれているSBR情報の有無を示す情報と、プリアンブル除去部202からのSBR有無情報とが矛盾する場合に、エレメンタリオーディオストリーム300に含まれているSBR情報の有無を示す情報に従ってもよい。
このようにして生成されたデコード信号は、エレメンタリデコード部203から外部に送信され、スピーカ又はヘッドホンなで可聴信号に変換される。
上記のように本実施の形態1に係るビットストリーム送信装置200は、オーディオ信号を符号化して得られたエレメンタリオーディオストリームを取得する入力部100と、エレメンタリオーディオストリームのサンプリング周波数とオーディオ符号化データ形式とを解析する解析部101と、解析部101の解析結果に応じてIEC61937形式のオーディオビットストリームを構成するプリアンブル信号を生成するプリアンブル生成部102と、プリアンブル生成部102が生成したプリアンブル信号をエレメンタリオーディオストリームに付加することで、IEC61937形式のオーディオビットストリームを成形する成形部103と、成形部103で成形されたオーディオビットストリームを出力する出力部104とを備え、プリアンブル生成部102は、解析部101の解析結果から得られるサンプリング周波数が予め定められた値である場合、エレメンタリオーディオストリームのオーディオ符号化データ形式を示すパラメータを、オーディオビットストリームのIEC61937に適合する形式に変更してプリアンブル信号を生成する。
これにより、当該ビットストリーム送信装置200は、IEC61937に適合しないためにビットストリーム受信装置201に送信できなかったオーディオビットストリーム301を問題なく送信することができる。この結果、当該ビットストリーム送信装置200は、エレメンタリオーディオストリーム300のサンプリングレートとオーディオ符号化データ形式との組み合わせが、IEC61937規格の範囲外であってもIEC61937規格の範囲内のオーディオビットストリーム301として出力できる。特に、本実施の形態1によれば、プリアンブル信号に記述されるSBR情報の有無のみを変更することでそれが実施できるので、処理が非常に簡単である。
なお、本実施の形態1では、ヘッダに記載されたサンプリングレートが24kHz(又は22.05kHz、16kHz)で「SBR情報なし」という例で説明したが、ヘッダに記載されたサンプリングレートが44.1kHz(又は32kHz)で「SBR情報あり」という場合も、同様に処理できる。その場合の動作は以下のようになる。
解析部101は、エレメンタリオーディオストリーム300のサンプリングレートとオーディオ符号化データ形式とを解析する。入力されたエレメンタリオーディオストリーム300が、上で述べたように、サンプリングレートが44.1kHzで、SBR情報を含んでいることが、解析部101によって解析される。
次にプリアンブル生成部102は、解析部101の解析結果に応じてIEC61937形式のオーディオビットストリーム301に含まれるプリアンブル信号を生成する。このとき、エレメンタリオーディオストリーム300のサンプリングレートが44.1kHzで、SBR情報を含んでいる場合、図10に示したように、IEC61937形式のオーディオビットストリームが定義されていないので、プリアンブル生成部102は、SBR情報を含んでいないことを示すプリアンブル信号を生成する。具体的には、プリアンブル生成部102は、プリアンブル信号Pcの0から4ビット目の5ビットが示す値を23に設定する。これにより、プリアンブル信号Pcは、ヘッダ形式がLOAS形式であることを示す。さらに、プリアンブル生成部102は、プリアンブル信号Pcの5から6ビット目の2ビットを1に設定する。これにより、プリアンブル信号PcはSBR情報が含まれていないことを示す。すなわち、プリアンブル信号Pcは、エレメンタリオーディオストリーム300のオーディオ符号化データ形式がAAC方式であることを示す。
次に、成形部103で、プリアンブル生成部102の出力のプリアンブル信号をエレメンタリオーディオストリーム300に付加する。すなわち、成形部103は、図7に示したようなIEC61937形式のオーディオビットストリーム301を成形する。
最後に、出力部104が、成形部103で成形されたオーディオビットストリーム301を外部機器に出力する。
このようにすることで、ビットストリーム送信装置200は、入力されたエレメンタリオーディオストリーム300が、IEC61937規格の範囲外であってもIEC61937規格の範囲内のオーディオビットストリーム301として出力できる。
なお、SBR情報を上記のように強制的に変更すれば、プリアンブル信号に含まれているSBRの有無を示す情報と、エンコードデータに含まれるSBRの有無を示す情報とが不整合となるが、不整合となった場合にはプリアンブル信号に含まれているSBRの有無を示す情報に従って処理が行われるように予め定めておいてもよい。前述したように、AACのエレメンタリオーディオストリームとHEAACのエレメンタリオーディオストリームとは再生互換があるので、当該不整合なIEC61937形式のオーディオビットストリームであっても外部受信機では当該ストリームを再生可能である。
その考え方を図4A及び図4Bに示す。図4A(a)〜(b2)及び図4B(a)〜(b2)において、横軸は周波数を表している。
図4A(a)は、HEAACで符号化されたエレメンタリオーディオストリーム300に含まれる周波数成分を、周波数スペクトルで模式的に示している。図4Aの中においてサンプリング周波数の1/4よりも低域の実線で示す信号は、AAC方式で符号化されており、サンプリング周波数の1/4よりも高域の破線で示す信号は、SBR方式で符号化されている。
図4A(b1)は、図4A(a)に示したHEAACの信号をHEAACデコーダで処理した場合の周波数成分を示している。この場合、低域及び高域の両方を含む全帯域の信号が再生される。
図4A(b2)は、図4A(a)に示したHEAACの信号をAACデコーダで処理した場合の周波数成分を示している。この場合、SBR方式で符号化されている高域は復号されず、AAC方式で符号化されている低域の信号のみがAACデコーダで復号されて再生される。
図4B(a)は、AACで符号化されたエレメンタリオーディオストリーム300に含まれる周波数成分を、周波数スペクトルで模式的に示している。この場合、全帯域がAAC方式で符号化されている。
図4B(b1)は、図4B(a)に示したAACの信号をHEAACデコーダで処理した場合の周波数成分を示している。この場合、全帯域の信号がHEAACデコーダで復号されて再生される。
図4B(b2)は、図4B(a)に示したAACの信号をAACデコーダで処理した場合の周波数成分を示している。この場合も図4B(b1)に示した場合と同様に、全帯域の信号がAACデコーダで復号されて再生される。
つまり、実態として信号がHEAACである場合、すなわち、エレメンタリオーディオストリーム300がHEAACオーディオ符号化データ形式で符号化されたエレメンタリオーディオストリームである場合において、プリアンブル信号により、エレメンタリオーディオストリーム300がAACで符号化されたことを示す場合には、エレメンタリオーディオストリーム300はAACデコーダで処理される。このような場合であっても、本来のHEAACでデコードされた場合と同様の音質は得られないまでもAACでデコードされた可聴オーディオが再生される(図4A(b2))。また、仮に、プリアンブル信号がAACを示し、実態としても信号がAACであったとしても、このAACの信号をHEAACデコードで処理して差し障りはない。つまり、このAACの信号をHEAACデコードで処理しておけば、本来のAACでデコードされた場合と同様の音質が得られる(図4B(b2))。
(実施の形態1の応用例)
なお、本実施の形態1では、「ヘッダに記載されたサンプリングレートが24kHz(又は22.05kHz、16kHz)でSBR情報なし」及び「ヘッダに記載されたサンプリングレートが44.1kHz(又は32kHz)でSBR情報あり」という例を用いて第1の課題を解決する構成について説明したが、「ヘッダに記載されたサンプリングレートが48kHzでSBR情報あり」という場合についても上記と同様の処理を行うことにより、第2の課題を解決することができる。以下では、「ヘッダに記載されたサンプリングレートが48kHzでSBR情報あり」という場合の処理について詳細に説明する。
まず、解析部101は、エレメンタリオーディオストリーム300のサンプリングレートとオーディオ符号化データ形式とを解析する。ここで、入力されたエレメンタリオーディオストリーム300は、上で述べたように、サンプリングレートが48kHzで、SBR情報を含んでいることが、解析部101によって解析される。
次に、プリアンブル生成部102は、解析部101の解析結果に応じてIEC61937形式のプリアンブル信号を生成する。サンプリングレートが48kHzの場合、図10に示したように、SBR情報を含んでいる場合も含んでいない場合も、いずれの場合であっても、IEC61937形式のオーディオビットストリームが定義されている。しかし、本実施の形態のプリアンブル生成部102は、SBR情報を含んでいる場合であっても常に、SBR情報を含んでいないことを示すプリアンブル信号を生成する。具体的にはプリアンブル生成部102は、プリアンブル信号Pcの0から4ビット目の5ビットが示す値を23に設定する。これにより、プリアンブル信号Pcは、ヘッダ形式がLOAS形式であることを示す。さらに、プリアンブル生成部102は、プリアンブル信号Pcの5から6ビット目の2ビットを1に設定する。これにより、プリアンブル信号Pcは、エレメンタリオーディオストリーム300にSBR情報が含まれていないことを示す。すなわち、プリアンブル信号Pcは、サンプリングレートが48kHzのときは常に、エレメンタリオーディオストリーム300がAAC方式で符号化されていることを示すプリアンブル信号を生成する。
次に、成形部103は、プリアンブル生成部102で生成されたプリアンブル信号をエレメンタリオーディオストリーム300に付加する。すなわち、成形部103は、図7に示したようなIEC61937形式のオーディオビットストリーム301を成形する。
最後に、出力部104では、成形部103で生成されたオーディオビットストリーム301を外部機器に出力する。
このようにすることで、実際のDTV放送などで、出力サンプリング周波数の切り替えが増加することを抑制することができる。例えば、デジタル放送において、番組コンテンツ部分はオーディオ符号化データ形式がHEAACで、かつ、AACサンプリングレートが48KHzで放送されていて、一方で、コマーシャル部分はオーディオ符号化データ形式がAACLCで、かつ、AACサンプリングレートが48KHzで放送されている場合、ビットストリーム送信装置は、番組コンテンツ部分ではIEC60958フレームレート96KHzで信号を出力し、コマーシャル部分ではIEC60958のフレームレート48KHzで信号を出力することになる。しかしながら上記のようにプリアンブル生成部102でSBR情報の有無を変更することにより、番組コンテンツ部分とコマーシャル部分との切り替わりで再生フレームレートが変化することを防止することができる。この結果、帯域拡張による番組コンテンツ部分での高音質なオーディオ再生は望めないが、ビットストリーム受信装置201においてIEC60958フレームレートの変化に追従するために時間がかかることに起因する音飛びなどの不具合を回避することができる。
図5A〜図5Cは、図10に示したストリーム出力規定に基づくストリームの伝送例を説明する図である。図5A〜図5Cにおいて、a、b、c及びdの文字が記された○はプリアンブル信号Pa、Pb、Pc及びPdを示し、ハッチングされた○はエレメンタリオーディオストリームを示し、○はデータ長を調節するための無効なデータであるパディングデータを示している。また、ここで伝送されるストリームのヘッダ形式はLOAS形式であるとする。
図5Aは、例えば、サンプリングレートが48kHzでAAC符号化(SBR情報なし)されたストリームを伝送できる理由を示す図である。ここでは、1サンプルを32ビットで表す。ビットストリーム送信装置は、サンプリング周波数が48kHzのエレメンタリオーディオストリームなので48kHz×32bits=1536kbpsの伝送速度でデータを伝送する。具体的には、21.333msec(48kHzで1024サンプル分の時間)ごとにプリアンブル信号Pa、Pb、Pc及びPdをつけて、32768ビットの1フレームの信号を順次伝送することが定められている。
これに対し、デコーダは、48kHzのAACの場合、21.333msecごとにPCMデータを生成する。よって、信号の供給レートとデコーダの処理レートとが一致することで、デコーダは信号を矛盾なく処理をできる。
図5Bは、例えば、サンプリングレートが24kHzでAAC符号化(SBR情報なし)されたストリームを伝送できない理由を示す図である。サンプリングレートが24kHzの信号の場合、ビットストリーム送信装置は、24kHz×32bits=768kbpsの伝送速度でデータを伝送することが好ましいしが、768kbpsというモードがない。仮にビットストリーム送信装置が1536kbpsの伝送速度を用いるとすると、図5Bに示すようにデータが伝送される。その場合、デコーダは、21.333msecごとに供給される信号に対して、42.6667msec分のPCMデータを生成するので(24kHzで1024サンプルは42.6667msecだから)、デコーダの処理速度に対してビットストリーム送信装置からの信号の供給が過剰となる。これにより、ストリームがオーバーフローする。
図5Cは、例えば、サンプリングレートが24kHzでHEAAC符号化(SBR有り)されたストリームを伝送できる理由を示す図である。HEAACで符号化されている場合、図11Aに示したように、AAC部のサンプリングレートが24kHzであっても、ビットストリーム送信装置は、ストリーム全体をサンプリングレートが48kHzの信号と見なすので、48kHz×32bits=1536kbpsの伝送速度でデータを伝送する。具体的には、42.6667msec(48kHzで2048サンプル分の時間)ごとにプリアンブル信号Pa、Pb、Pc及びPdをつけて1フレームごとに信号を伝送することが定められている。
これに対し、デコーダは、24kHzのHEAACの場合、42.6667msecごとに、PCMデータを生成するので、信号の供給レートとデコーダの処理レートとが一致する。よって、デコーダは信号を矛盾なく処理できる。
上記と同様にして、サンプリングレートが44.1kHzでAAC符号化されたストリームと、サンプリングレートが22.05kHzでHEAAC符号化されたストリームとは伝送可能であるのに対し、サンプリングレートが22.05kHzでAAC符号化されたストリームを伝送できない理由を説明することができる。また、サンプリングレートが32kHzでAAC符号化されたストリームと、サンプリングレートが16kHzでHEAAC符号化されたストリームとは伝送可能であるのに対し、サンプリングレートが16kHzでAAC符号化されたストリームを伝送できない理由を説明することができる。
なぜならば、出力の伝送レート1411.2kbps(=44.1kHz×32bits)と、1024kbps(=32kHz×32 bits)とは、それぞれ、IEC60958で規格化されているので、ビットストリーム送信装置は、それを用いることができるが、705.6kbps(=22.05kHz×32bits)と、512kbps(=16kHz×32bits)は、規格化されていないからである。
上記例とは異なり、サンプリングレート48kHzではAAC符号化されたストリームも、HEAAC符号化されたストリームも、いずれも問題なく伝送することができる。
その理由は、サンプリングレートが48kHzでAAC符号化されたストリームでは、サンプリングレートが48kHzなので、ビットストリーム送信装置は、48kHz×32bits=1536kbpsの伝送速度でデータを伝送する。また、21.333msec(48kHzで1024サンプル分の時間)ごとにプリアンブル信号Pa、Pb、Pc及びPdをつけて1フレーム(32768ビット)ごとに信号を伝送することが定められている。
これに対し、デコーダは、48kHzのAACの場合、21.333msecごとにPCMデータを生成するので、信号の供給レートとデコーダの処理レートとが一致する。よって、デコーダは信号を矛盾なく処理できる。
また、サンプリングレートが48kHzでHEAAC符号化されたストリームでは、ビットストリーム送信装置は、サンプリングレートを96kHzとみなすので、96kHz×32bits=3072kbpsの伝送速度でデータを伝送する。また、21.333msec(96kHzで2048サンプル分の時間)ごとにプリアンブル信号Pa、Pb、Pc及びPdをつけて1フレーム(32768ビット)ごとに信号を伝送することが定められている。
これに対し、デコーダでは、48kHzのHEAACの場合、21.333msecごとにPCMデータを生成するので、信号の供給レートとデコーダの処理レートとが一致する。よって、デコーダは信号を矛盾なく処理できる。
以上のように、エレメンタリオーディオストリームがサンプリングレート48kHzで符号化されている場合には、AACでもHEAACでも問題なく伝送することが可能である。一方で、サンプリングレート48kHzでAAC符号化されたストリームと、サンプリングレート48kHzでHEAAC符号化されたストリームとが切り替わる場合には、伝送レートが1536kbpsのストリームと、伝送レートが3072kbpsのストリームとが切り替わることになる。このとき、ビットストリーム送受信システム全体において、例えば、A/D変換器の動作周波数を切り替えるというような同期を取り直す処理が必要となる。このようなビットストリーム送受信システム全体の同期を取り直す処理には、時間を要するため、サンプリングレートの切り替わり時にタイムラグが生じる。例えば、番組本編とCMとのつなぎ目で音声が途切れるというような不具合を生じることがある。
これに対し、サンプリングレートが48kHzでHEAAC符号化(SBR有り)されたストリームを、SBR無しとして伝送することで、伝送レートを一定のサンプリングレートにすることが可能となる。これにより、音飛びなどの不具合を防止することが可能となる。
なお、上記実施の形態では、ビットストリーム送受信システムは、サンプリングレートの切り替わり時にタイムラグが生じるために、エレメンタリオーディオストリームのサンプリングレートが48kHzである場合には、エレメンタリオーディオストリームがHEAACで符号化されている場合であっても、AACで符号化されている場合であっても、常にAACで符号化されているとして処理することとしたが、本発明はこれに限定されない。例えば、サンプリングレートの切り替わり時に生じるタイムラグを気にしないのであれば、ビットストリーム送受信システムは、エレメンタリオーディオストリームが常にHEAACの信号であるとして処理を行うとしてもよい。
(実施の形態2)
以下、本発明の実施の形態2におけるビットストリーム送受信システム210について図面を参照しながら説明する。
図6は本実施の形態2におけるビットストリーム送受信システムの構成を示す図である。図6において、実施の形態2のビットストリーム送受信システム210は、ビットストリーム送信装置1000とビットストリーム受信装置1001とを備える。
ビットストリーム送信装置1000は、入力部100、解析部101、成形部103、出力部104及びプリアンブル生成部1010を備える。ビットストリーム送信装置1000において、ビットストリーム送信装置200の各処理部と同じ参照符号を付した処理部は実施の形態1における図1に記載されたものと同じであるので説明を省略する。以下では主に、プリアンブル生成部1010について説明する。
プリアンブル生成部1010は、ビットストリーム受信装置1001から、当該ビットストリーム受信装置1001の能力情報を受信し、受信した能力情報に従って、プリアンブル信号Pcに含まれる、エレメンタリオーディオストリームのオーディオ符号化データ形式を示す情報を変更する。具体的には、プリアンブル生成部1010は、ビットストリーム受信装置1001から受信した能力情報により、ビットストリーム受信装置1001が、サンプリングレートが48kHzでHEAACにより符号化されたエレメンタリオーディオストリーム300を復号する能力があるか否かを判断する。ビットストリーム受信装置1001が、サンプリングレートが48kHzでHEAACにより符号化されたエレメンタリオーディオストリーム300を復号する能力があると判断された場合、プリアンブル生成部1010は、上記実施の形態1とは異なり、実際のエレメンタリオーディオストリーム300がサンプリングレート48kHzでHEAACにより符号化されている場合には、HEAACにより符号化されていることを示すプリアンブル信号Pcを生成する。具体的には、プリアンブル生成部1010は、プリアンブル信号Pcの0から4ビット目の5ビットが示す値を23に設定する。これにより、プリアンブル信号Pcは、ヘッダ形式がLOAS形式であることを示す。さらに、プリアンブル生成部1010は、プリアンブル信号Pcの5から6ビット目の2ビットを2に設定する。これにより、プリアンブル信号Pcは、エレメンタリオーディオストリーム300にSBR情報が含まれていることを示す。すなわち、プリアンブル信号Pcは、エレメンタリオーディオストリーム300がHEAAC方式で符号化されていることを示す。
上記のビットストリーム送信装置1000に対し、実施の形態2のビットストリーム受信装置1001は、ビットストリーム送信装置1000から送信されたオーディオビットストリーム301を受信し、受信したオーディオビットストリーム301をデコードする。ビットストリーム受信装置1001は、プリアンブル除去部202、エレメンタリデコード部203及び能力情報通知部1011を備える。図6において、ビットストリーム受信装置201の各処理部と同じ参照符号を付した処理部は実施の形態1における図2に記載されたものと同じであり、すでに説明しているので説明を省略する。以下では主に、能力情報通知部1011について説明する。
能力情報通知部1011は、ビットストリーム受信装置1001内のエレメンタリデコード部203が、サンプリングレートが48kHzでHEAAC符号化されたエレメンタリオーディオストリーム300を復号できるか否かを示す能力情報を内部のメモリに記憶している。能力情報通知部1011は、ビットストリーム送信装置1000から能力情報の送信要求があったとき、メモリに記憶している能力情報をビットストリーム送信装置1000のプリアンブル生成部1010に通知する。
このように構成することによって、ビットストリーム送信装置1000は、ビットストリーム受信装置1001のエレメンタリデコード部203が、サンプリングレートが48kHzでHEAAC符号化されたエレメンタリオーディオストリームを復号する能力を備えるときには、エレメンタリオーディオストリーム300のサンプリングレートが48kHzの場合であってもHEAACで符号化されているときには、プリアンブル信号PcにSBR情報ありを示すパラメータを記述することができる。従って、AACで符号化されたコンテンツと、HEAACで符号化されたコンテンツとのつなぎ目で音が途切れる不具合が問題にならないような場合には、ビットストリーム受信装置1001は、ビットストリーム送信装置1000から伝送されたオーディオビットストリーム301に含まれるプリアンブル信号に従ってエレメンタリオーディオストリーム300を復号することができる。これにより、ユーザが、HEAACで符号化されたコンテンツを、高域まで帯域拡張された高音質で楽しむことができるという効果がある。
また、ビットストリーム受信装置1001のエレメンタリデコード部203が、サンプリングレートが48kHzのHEAACで符号化されたストリームを復号する能力を備える場合でも、ビットストリーム受信装置1001は、あえてビットストリーム送信装置1000に対して能力情報を通知しなくてもよい。この場合、ビットストリーム受信装置1001は、例えば、実施の形態1のビットストリーム送信装置200から受信したオーディオビットストリーム301から抽出されたエレメンタリオーディオストリーム300のヘッダ及びExtension_payloadを解釈し、エレメンタリオーディオストリーム300にSBR情報が含まれている場合にはそのSBR情報に従ってエレメンタリオーディオストリーム300を復号するとしてもよい。さらにまた、オーディオビットストリーム301から抽出されたエレメンタリオーディオストリーム300にSBR情報が含まれない場合であっても、ビットストリーム受信装置1001は、高域まで帯域拡張を行うHEAACデコードを行うとしてもよい。
プリアンブル生成部1010は、解析部101の解析結果から得られたサンプリング周波数が予め定められた第2の周波数である場合に、プリアンブル信号内にあって前記符号化形式を示す情報として、前記エレメンタリオーディオストリームにSBR情報が含まれない符号化形式を記載する。これにより、例えば、実際のDTV放送などで、番組コンテンツ部分はオーディオ符号化データ形式がHEAACかつAACサンプリングレートが48KHzで放送されていて、一方で、コマーシャル部分はオーディオ符号化データ形式がAACLCかつAACサンプリングレートが48KHzで放送されている場合でも、最終的なデコード信号のサンプリングレートが変動しないですむ。よって、番組コンテンツとCM部分の切り替え部分が滑らかに遷移することとなる。このようにすることによって、エレメンタリオーディオストリーム300がサンプリング周波数48kHzでHEAACにより符号化されており、ビットストリーム受信装置1001がこれを復号する能力を備える場合には、当該ビットストリーム受信装置1001は、HEAACでデコードされた高音質のオーディオ信号を再生することができる。
また、実際のDTV放送として、サンプリングレートが24kHz、「SBR情報あり」で放送されているような場合において、放送波の受信状態の不良などで信号に不具合が生じSBR情報が欠落したような場合であっても、最終的な出力信号のサンプリングレートが一定に保たれる。このように、当該ビットストリーム送受信システムは、受信状態の不良の影響を少なくとどめることができる。
なお、本実施の形態では、プリアンブル除去部202がSBR有無情報を抽出し、当該情報をエレメンタリデコード部203に送出していたが、そのようにせず、エレメンタリオーディオストリーム300が示すサンプリングレートが16kHzから24kHzの場合は、ビットストリーム受信装置は、常に「SBR情報あり」の前提でエレメンタリオーディオストリーム300をデコードしてもよい。また、逆に、エレメンタリオーディオストリーム300が示すサンプリングレートが32kHzから48kHzの場合は、ビットストリーム受信装置は、常に「SBR情報なし」の前提でエレメンタリオーディオストリーム300をデコードしてもよい。
以上、本発明の実施の形態に係るビットストリーム送信装置及びビットストリーム送受信システムについて説明したが、本発明は、この実施の形態に限定されるものではない。
また、上記実施の形態に係るビットストリーム送信装置又はビットストリーム送受信システムに含まれる各処理部は典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。
また、本発明の実施の形態に係る、ビットストリーム送信装置又はビットストリーム送受信システムの機能の一部又は全てを、CPU等のプロセッサがプログラムを実行することにより実現してもよい。
さらに、本発明は上記プログラムであってもよいし、上記プログラムが記録された非一時的なコンピュータ読み取り可能な記録媒体であってもよい。また、上記プログラムは、インターネット等の伝送媒体を介して流通させることができるのは言うまでもない。
また、上記実施の形態1及び2に係る、ビットストリーム送信装置及びビットストリーム送受信システム、並びにそれらの変形例の機能のうち少なくとも一部を組み合わせてもよい。
また、ブロック図における機能ブロックの分割は一例であり、複数の機能ブロックを一つの機能ブロックとして実現したり、一つの機能ブロックを複数に分割したり、一部の機能を他の機能ブロックに移してもよい。また、類似する機能を有する複数の機能ブロックの機能を単一のハードウェア又はソフトウェアが並列又は時分割に処理してもよい。
更に、本発明の主旨を逸脱しない限り、本実施の形態に対して当業者が思いつく範囲内の変更を施した各種変形例も本発明に含まれる。
本発明にかかるビットストリーム送信装置は、SBR情報の有無に関する情報を変更する手段を備えているので、IEC61937規格で定義されていないビットストリームが入力された場合であってもIEC61937規格を用いてビットストリームを送信することができる。よって、本発明は、幅広くDTV放送の受信機、及び、オーディオ符号化信号が格納された記録媒体から信号を読み出して再生する再生機器に適用できる。また、本発明は、オーディオ符号化データ形式が異なるコンテンツの切り替え時におけるサンプリングレートの変化を抑制できるので、途切れのない良好な再生音を享受することができる。
100 入力部
101 解析部
102、1010 プリアンブル生成部
103 成形部
104 出力部
200、1000 ビットストリーム送信装置
201、1001 ビットストリーム受信装置
202 プリアンブル除去部
203 エレメンタリデコード部
210 ビットストリーム送受信システム
220 テレビ
221 デコーダ
222 2チャネルダウンミックス部
223 スピーカ
230 シアターシステム
231 マルチチャネルスピーカ
300 エレメンタリオーディオストリーム
301 オーディオビットストリーム
1011 能力情報通知部

Claims (17)

  1. 所定の形式のオーディオビットストリームを送信するビットストリーム送信装置であって、
    オーディオ信号を符号化して得られたエレメンタリオーディオストリームを取得する入力部と、
    前記エレメンタリオーディオストリームのサンプリング周波数と符号化形式とを解析する解析部と、
    前記エレメンタリオーディオストリームの符号化形式を示す情報を含むプリアンブル信号を、前記解析部の解析結果に応じて生成するプリアンブル生成部と、
    前記プリアンブル生成部が生成した前記プリアンブル信号を前記エレメンタリオーディオストリームに付加することで、前記所定の形式のオーディオビットストリームを成形する成形部と、
    前記成形部で成形された前記オーディオビットストリームを出力する出力部とを備え、
    前記プリアンブル生成部は、前記解析部の解析結果から得られる前記サンプリング周波数と前記符号化形式とに応じて、前記オーディオビットストリームの前記所定の形式に適合する符号化形式で、かつ、前記エレメンタリオーディオストリームの解析結果から得られた符号化形式とは異なる符号化形式を、前記プリアンブル信号内の前記符号化形式を示す情報として記載する
    ビットストリーム送信装置。
  2. 前記プリアンブル生成部は、前記出力部から出力するデータの出力伝送速度が予め定められた範囲となるように、前記プリアンブル信号内の前記符号化形式を示す情報を記載する
    請求項1記載のビットストリーム送信装置。
  3. 前記所定の形式のオーディオビットストリームはIEC61937規格で規定されたオーディオビットストリームであり、
    前記解析部の解析結果から得られた前記サンプリング周波数が、予め定められた第1の周波数である場合に、前記第1の周波数に対応する前記符号化形式が前記IEC61937規格の対応範囲外であれば、前記プリアンブル生成部は、前記符号化形式を示す情報として、前記エレメンタリオーディオストリームにおけるSBR(Spectral Band Replication)情報の有無の点で前記解析された符号化形式と異なる符号化形式を記載することで、前記オーディオビットストリームがIEC61937規格の対応範囲内となるようなプリアンブル信号を生成する
    請求項1記載のビットストリーム送信装置。
  4. 前記プリアンブル生成部は、さらに、前記解析部の解析結果から得られた前記サンプリング周波数が、予め定められた第2の周波数である場合に、前記エレメンタリオーディオストリームが前記SBR情報の含まれない符号化形式で符号化されていることを、前記プリアンブル信号内の前記符号化形式を示す情報として記載する
    請求項3記載のビットストリーム送信装置。
  5. 前記プリアンブル生成部は、前記解析部の解析結果から得られた前記サンプリング周波数が、予め定められた第3の周波数である場合に、前記エレメンタリオーディオストリームが前記SBR情報の含まれる前記符号化形式で符号化されていなくても、前記SBR情報の含まれる符号化形式で符号化されていることを示すプリアンブル信号を生成する
    請求項3記載のビットストリーム送信装置。
  6. 前記プリアンブル生成部は、前記解析部の解析結果から得られた前記サンプリング周波数が、予め定められた第4の周波数である場合に、前記エレメンタリオーディオストリームが前記SBR情報の含まれる符号化形式で符号化されていても、前記SBR情報の含まれない符号化形式で符号化されていることを示すプリアンブル信号を生成する
    請求項3記載のビットストリーム送信装置。
  7. 請求項1〜6のいずれか1項に記載のビットストリーム送信装置と、当該ビットストリーム送信装置から送信されたオーディオビットストリームを受信し、受信した前記オーディオビットストリームを復号するビットストリーム受信装置とを備えたビットストリーム送受信システムであって、
    前記ビットストリーム受信装置は、
    受信した前記オーディオビットストリームに含まれる前記プリアンブル信号を除去することによって前記エレメンタリオーディオストリームを抽出するプリアンブル除去部と、
    前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と、前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている符号化形式を示す情報によって示される符号化形式で前記エレメンタリオーディオストリームを復号するエレメンタリデコード部とを備える
    ビットストリーム送受信システム。
  8. 請求項5に記載のビットストリーム送信装置と、当該ビットストリーム送信装置から送信されたオーディオビットストリームを受信し、受信した前記オーディオビットストリームを復号するビットストリーム受信装置とを備えたビットストリーム送受信システムであって、
    前記ビットストリーム受信装置は、
    受信した前記オーディオビットストリームに含まれる前記プリアンブル信号を除去することによって前記エレメンタリオーディオストリームを抽出するプリアンブル除去部と、
    前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている前記符号化形式を示す情報に従って、高域に拡大される信号を0として前記SBR情報を用いた復号処理を行うエレメンタリデコード部とを備える
    ビットストリーム送受信システム。
  9. 請求項6に記載のビットストリーム送信装置と、当該ビットストリーム送信装置から送信されたオーディオビットストリームを受信し、受信した前記オーディオビットストリームを復号するビットストリーム受信装置とを備えたビットストリーム送受信システムであって、
    前記ビットストリーム受信装置は、
    受信した前記オーディオビットストリームから前記プリアンブル信号を除去することによって前記エレメンタリオーディオストリームを抽出するプリアンブル除去部と、
    前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合の場合、前記プリアンブル信号に記載されている前記符号化形式を示す情報に従って、前記SBR情報を用いた復号処理を行った場合の1/2のサンプリング周波数の信号を生成するエレメンタリデコード部とを備える
    ビットストリーム送受信システム。
  10. 前記ビットストリーム受信装置は、当該ビットストリーム受信装置の能力を示す情報を前記ビットストリーム送信装置に通知する能力通知部を有し、
    前記解析部は、前記エレメンタリオーディオストリームのサンプリングレートを示すFS情報を解析し、
    前記プリアンブル生成部は、当該FS情報が予め定められた値の場合、前記能力通知部からの情報に応じ、SBR情報が含まれていることを示すプリアンブル信号を生成するか否かを切り替える
    請求項7〜9のいずれか1項に記載のビットストリーム送受信システム。
  11. オーディオ信号を符号化して得られたエレメンタリオーディオストリームに、前記エレメンタリオーディオストリームの符号化形式を示す情報を含むプリアンブル信号を付加することで成形された、所定の形式のオーディオビットストリームであって、前記エレメンタリオーディオストリームのサンプリング周波数と前記符号化形式とが前記オーディオビットストリームの前記所定の形式に適合しない場合、前記オーディオビットストリームの前記所定の形式に適合する符号化形式が、前記プリアンブル信号内の前記符号化形式を示す情報として記載されたオーディオビットストリームをビットストリーム送信装置から受信する受信部と、
    受信した前記オーディオビットストリームに含まれる前記プリアンブル信号を除去することによって前記エレメンタリオーディオストリームを抽出するプリアンブル除去部と、
    前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と、前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている符号化形式を示す情報によって示される符号化形式で前記エレメンタリオーディオストリームを復号するエレメンタリデコード部とを備える
    ビットストリーム受信装置。
  12. 前記ビットストリーム受信装置は、前記エレメンタリオーディオストリームの前記サンプリング周波数が、予め定められた第3の周波数である場合に、前記エレメンタリオーディオストリームがSBR情報の含まれる前記符号化形式で符号化されていなくても、前記SBR情報の含まれる符号化形式で符号化されていることを示すプリアンブル信号を含んだオーディオビットストリームを受信し、
    前記エレメンタリデコード部は、前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と、前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている前記符号化形式を示す情報に従って、高域に拡大される信号を0として前記SBR情報を用いた復号処理を行う
    請求項11記載のビットストリーム受信装置。
  13. 前記ビットストリーム受信装置は、前記エレメンタリオーディオストリームの前記サンプリング周波数が、予め定められた第4の周波数である場合に、前記エレメンタリオーディオストリームがSBR情報の含まれる符号化形式で符号化されていても、前記SBR情報の含まれない符号化形式で符号化されていることを示すプリアンブル信号を含んだオーディオビットストリームを受信し、
    前記エレメンタリデコード部は、前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と、前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合の場合、前記プリアンブル信号に記載されている前記符号化形式を示す情報に従って、前記SBR情報を用いた復号処理を行った場合の1/2のサンプリング周波数の信号を生成する
    請求項11記載のビットストリーム受信装置。
  14. 所定の形式のオーディオビットストリームを送信するビットストリーム送信方法であって、
    オーディオ信号を符号化して得られたエレメンタリオーディオストリームを取得し、
    前記エレメンタリオーディオストリームのサンプリング周波数と符号化形式とを解析し、
    前記エレメンタリオーディオストリームの符号化形式を示す情報を含むプリアンブル信号を、前記解析結果に応じて生成し、
    生成した前記プリアンブル信号を前記エレメンタリオーディオストリームに付加することで、前記所定の形式のオーディオビットストリームを成形し、
    成形された前記オーディオビットストリームを出力し、
    前記プリアンブル信号の生成において、前記解析結果から得られる前記サンプリング周波数と前記符号化形式とに応じて、前記オーディオビットストリームの前記所定の形式に適合する符号化形式で、かつ、前記エレメンタリオーディオストリームの解析結果から得られた符号化形式とは異なる符号化形式を、前記プリアンブル信号内の前記符号化形式を示す情報として記載する
    ビットストリーム送信方法。
  15. オーディオ信号を符号化して得られたエレメンタリオーディオストリームに、前記エレメンタリオーディオストリームの符号化形式を示す情報を含むプリアンブル信号を付加することで成形された、所定の形式のオーディオビットストリームであって、前記エレメンタリオーディオストリームのサンプリング周波数と前記符号化形式とに応じて、前記オーディオビットストリームの前記所定の形式に適合する符号化形式で、かつ、前記エレメンタリオーディオストリームの解析結果から得られた符号化形式とは異なる符号化形式が、前記プリアンブル信号内の前記符号化形式を示す情報として記載されたオーディオビットストリームをビットストリーム送信装置から受信し、
    受信した前記オーディオビットストリームに含まれる前記プリアンブル信号を除去することによって前記エレメンタリオーディオストリームを抽出し、
    前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と、前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている符号化形式を示す情報によって示される符号化形式で前記エレメンタリオーディオストリームを復号する
    ビットストリーム受信方法。
  16. オーディオ信号を符号化して得られたエレメンタリオーディオストリームを取得する入力部と、
    前記エレメンタリオーディオストリームのサンプリング周波数と符号化形式とを解析する解析部と、
    前記エレメンタリオーディオストリームの符号化形式を示す情報を含むプリアンブル信号を、前記解析部の解析結果に応じて生成するプリアンブル生成部と、
    前記プリアンブル生成部が生成した前記プリアンブル信号を前記エレメンタリオーディオストリームに付加することで、所定の形式のオーディオビットストリームを成形する成形部と、
    前記成形部で成形された前記オーディオビットストリームを出力する出力部とを備え、
    前記プリアンブル生成部は、前記解析部の解析結果から得られる前記サンプリング周波数と前記符号化形式とに応じて、前記オーディオビットストリームの前記所定の形式に適合する符号化形式で、かつ、前記エレメンタリオーディオストリームの解析結果から得られた符号化形式とは異なる符号化形式を、前記プリアンブル信号内の前記符号化形式を示す情報として記載する
    集積回路。
  17. オーディオ信号を符号化して得られたエレメンタリオーディオストリームに、前記エレメンタリオーディオストリームの符号化形式を示す情報を含むプリアンブル信号を付加することで成形された、所定の形式のオーディオビットストリームであって、前記エレメンタリオーディオストリームのサンプリング周波数と前記符号化形式とに応じて、前記オーディオビットストリームの前記所定の形式に適合する符号化形式で、かつ、前記エレメンタリオーディオストリームの解析結果から得られた符号化形式とは異なる符号化形式が、前記プリアンブル信号内の前記符号化形式を示す情報として記載されたオーディオビットストリームをビットストリーム送信装置から受信する受信部と、
    受信した前記オーディオビットストリームに含まれる前記プリアンブル信号を除去することによって前記エレメンタリオーディオストリームを抽出するプリアンブル除去部と、
    前記プリアンブル信号に記載されている前記エレメンタリオーディオストリームの符号化形式を示す情報と、前記エレメンタリオーディオストリームに含まれる前記エレメンタリオーディオストリームの符号化形式を示す情報とが不整合である場合、前記プリアンブル信号に記載されている符号化形式を示す情報によって示される符号化形式で前記エレメンタリオーディオストリームを復号するエレメンタリデコード部とを備える
    集積回路。
JP2013516194A 2011-05-20 2012-05-16 ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法及びビットストリーム受信方法 Active JP5843856B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013516194A JP5843856B2 (ja) 2011-05-20 2012-05-16 ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法及びビットストリーム受信方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011114178 2011-05-20
JP2011114178 2011-05-20
JP2013516194A JP5843856B2 (ja) 2011-05-20 2012-05-16 ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法及びビットストリーム受信方法
PCT/JP2012/003205 WO2012160782A1 (ja) 2011-05-20 2012-05-16 ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法、ビットストリーム受信方法及びビットストリーム

Publications (2)

Publication Number Publication Date
JPWO2012160782A1 JPWO2012160782A1 (ja) 2014-07-31
JP5843856B2 true JP5843856B2 (ja) 2016-01-13

Family

ID=47216875

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013516194A Active JP5843856B2 (ja) 2011-05-20 2012-05-16 ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法及びビットストリーム受信方法

Country Status (4)

Country Link
EP (1) EP2711924B1 (ja)
JP (1) JP5843856B2 (ja)
CN (1) CN103620678B (ja)
WO (1) WO2012160782A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101427756B1 (ko) * 2013-04-26 2014-08-08 주식회사 코아로직 멀티 채널의 오디오 신호 전송 방법 및 장치
WO2016039287A1 (ja) * 2014-09-12 2016-03-17 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
CN104392724A (zh) * 2014-12-11 2015-03-04 福建联迪商用设备有限公司 一种音频通讯的方法及装置
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2019051427A1 (en) * 2017-09-11 2019-03-14 Cohere Technologies, Inc. WIRELESS LOCAL NETWORKS USING ORTHOGONAL TIME-FREQUENCY SPACE MODULATION

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10275420A (ja) * 1997-03-31 1998-10-13 Samsung Electron Co Ltd Dvdディスクとdvdディスクを再生する装置及びその方法
JP2004007359A (ja) * 2002-04-08 2004-01-08 Matsushita Electric Ind Co Ltd マルチメディアデータ復号装置
JP2006050387A (ja) * 2004-08-06 2006-02-16 Matsushita Electric Ind Co Ltd データ再生方法、およびデータ再生装置
JP2006202353A (ja) * 2005-01-18 2006-08-03 Matsushita Electric Ind Co Ltd Mpeg2トランスポート・ストリームの管理情報の補正機能を有する再生装置
WO2006090852A1 (ja) * 2005-02-24 2006-08-31 Matsushita Electric Industrial Co., Ltd. データ再生装置
JP2006294120A (ja) * 2005-04-11 2006-10-26 Matsushita Electric Ind Co Ltd 音声再生装置
JP2007017628A (ja) * 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置
JP2008516360A (ja) * 2004-10-07 2008-05-15 松下電器産業株式会社 情報記録媒体、tsパケット判定装置、及びデータ再生装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004112021A2 (en) * 2003-06-17 2004-12-23 Matsushita Electric Industrial Co., Ltd. Receiving apparatus, sending apparatus and transmission system
JP2006317575A (ja) * 2005-05-11 2006-11-24 Matsushita Electric Ind Co Ltd オーディオ復号装置
CN101740032A (zh) * 2008-11-19 2010-06-16 北京中星微电子有限公司 音频编、解码方法和音频编、解码装置
CN101409093B (zh) * 2008-11-28 2011-06-15 炬力集成电路设计有限公司 一种确定音频数据采样点位置的方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10275420A (ja) * 1997-03-31 1998-10-13 Samsung Electron Co Ltd Dvdディスクとdvdディスクを再生する装置及びその方法
JP2004007359A (ja) * 2002-04-08 2004-01-08 Matsushita Electric Ind Co Ltd マルチメディアデータ復号装置
JP2006050387A (ja) * 2004-08-06 2006-02-16 Matsushita Electric Ind Co Ltd データ再生方法、およびデータ再生装置
JP2008516360A (ja) * 2004-10-07 2008-05-15 松下電器産業株式会社 情報記録媒体、tsパケット判定装置、及びデータ再生装置
JP2006202353A (ja) * 2005-01-18 2006-08-03 Matsushita Electric Ind Co Ltd Mpeg2トランスポート・ストリームの管理情報の補正機能を有する再生装置
WO2006090852A1 (ja) * 2005-02-24 2006-08-31 Matsushita Electric Industrial Co., Ltd. データ再生装置
JP2006294120A (ja) * 2005-04-11 2006-10-26 Matsushita Electric Ind Co Ltd 音声再生装置
JP2007017628A (ja) * 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置

Also Published As

Publication number Publication date
JPWO2012160782A1 (ja) 2014-07-31
EP2711924B1 (en) 2018-11-14
EP2711924A4 (en) 2015-04-01
CN103620678A (zh) 2014-03-05
EP2711924A1 (en) 2014-03-26
CN103620678B (zh) 2015-08-19
WO2012160782A1 (ja) 2012-11-29

Similar Documents

Publication Publication Date Title
JP4613674B2 (ja) 音声再生装置
US20100324915A1 (en) Encoding and decoding apparatuses for high quality multi-channel audio codec
JP5843856B2 (ja) ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法及びビットストリーム受信方法
TW200830874A (en) Image information transmission system, image information transmitting apparatus, image information receiving apparatus, image information transmission method, image information transmitting method, and image information receiving method
US20140310010A1 (en) Apparatus for encoding and apparatus for decoding supporting scalable multichannel audio signal, and method for apparatuses performing same
US11025406B2 (en) Audio return channel clock switching
US11514921B2 (en) Audio return channel data loopback
EP1162845B1 (en) Apparatus and method for information processing, and recording medium
JP2008252834A (ja) 音声再生装置
JP4013800B2 (ja) データ作成方法及びデータ記録装置
JP5957161B1 (ja) 放送信号送受信システムおよび放送信号送受信方法
JP4538445B2 (ja) トランスコードシステム,トランスコード方法及びその方法を実装したトランスコードプログラム,そのプログラムを記憶した記憶媒体
JP5957050B2 (ja) 放送信号受信装置、テレビジョン受像機、制御プログラム、および記録媒体
JP4997720B2 (ja) 多重化装置、多重化方法、プログラム、および記録媒体
US8719040B2 (en) Signal processing apparatus, signal processing method, and computer program
JP6181897B1 (ja) 放送信号受信装置、放送信号受信方法、テレビジョン受像機、制御プログラム、および記録媒体
JP6181898B1 (ja) 放送信号送受信システムおよび放送信号送受信方法
JP5957156B2 (ja) 放送信号送受信システムおよび放送信号送受信方法
JP6374053B2 (ja) 放送信号受信装置、放送信号受信方法、テレビジョン受像機、制御プログラム、および記録媒体
JP6341809B2 (ja) 放送信号送受信システムおよび放送信号送受信方法
KR980013417A (ko) 오디오 데이터 전송 방법 및 그 장치
JP4357578B1 (ja) 音声データ処理装置および音声データ処理方法
JP2018196130A (ja) 放送信号送信装置、放送信号送信方法、制御プログラム、および記録媒体
JP2007311847A (ja) 再生システム
WO2013098898A1 (ja) 放送受信装置および音声信号再生方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141126

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20150603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151117

R150 Certificate of patent or registration of utility model

Ref document number: 5843856

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150