JP4354455B2 - 再生装置および再生方法 - Google Patents

再生装置および再生方法 Download PDF

Info

Publication number
JP4354455B2
JP4354455B2 JP2005502921A JP2005502921A JP4354455B2 JP 4354455 B2 JP4354455 B2 JP 4354455B2 JP 2005502921 A JP2005502921 A JP 2005502921A JP 2005502921 A JP2005502921 A JP 2005502921A JP 4354455 B2 JP4354455 B2 JP 4354455B2
Authority
JP
Japan
Prior art keywords
header
data
stream
frame
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005502921A
Other languages
English (en)
Other versions
JPWO2004077406A1 (ja
Inventor
大朗 片山
俊哉 則竹
和生 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2004077406A1 publication Critical patent/JPWO2004077406A1/ja
Application granted granted Critical
Publication of JP4354455B2 publication Critical patent/JP4354455B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Description

本発明は、フレーム化されたオーディオ信号を復号し、再生するオーディオ再生装置であって、特に、編集や通信エラーによってオーディオ信号の途中に不連続点が存在する場合や、属性が変化する場合に異音を発生しないことを特徴とする再生装置および再生方法に関する。
近年、デジタル符号列として符号化されたオーディオ符号化信号を復号する再生装置やコンピュータプログラムとして具現化される再生方法が普及している。その多くの場合、MPEG規格(ISO11172−3、あるいは、ISO13818−3)に代表されるように、音声信号はオーディオ符号化信号としてフレーム化される。各フレームには信号の属性情報を含むプライベートヘッダが付加される。また、オーディオ符号化信号にはエラーチェックのためのCRCのビットが付加され、伝送路におけるデータの欠落や誤りが復号時に検出できる。
伝送路におけるデータの欠落が大きく、データストリームが不連続になった場合、エラー訂正で回復することができない。かかる不連続箇所をそのまま音声出力すれば雑音が混じる。この雑音を消すため、ミュートを掛けることが望まれる。
従来の再生装置の一例が、例えば、特許文献1(特開2000−259195号公報)に記載されている。この従来の再生装置は、不連続箇所を見つけるのではなく、送信側からの設定変更、例えばサンプリング周波数変更がストリームの途中にあった場合、かかる変更を検出し、変更後一定期間、音声出力にミュートをかけるものである。これは、変更があれば受信装置は、変更後の設定に自動調整する必要があり、自動調整する期間は雑音が出ない様、音声出力にミュートをかけるものである。この従来の装置は、正規のヘッダを検出し、ヘッダ解析手段によって解析された1つ前の正規のヘッダに書かれたサンプリング周波数と、現在復号処理をしようとしている現在の正規のヘッダに書かれたサンプリング周波数とを比較し、現在のヘッダに書かれたサンプリング周波数が変化した場合には、変化した後のフレームについて一定時間のミュートを施し異音の発生を防ぐものである。例えば、現在のヘッダに書かれたサンプリング周波数が変化した場合には、復号手段の後段に配置されるDAコンバータの設定の変更が必要となる。DAコンバータの設定の変更がなされている間は、正しい音声信号が生成されないので、雑音を含む音声信号となる。そこでDAコンバータの設定の変更がなされる一定期間、出力音声をミュートする。従って、変更が書かれた現在のヘッダ以降のフレームについてミュートがなされる。
また、ヘッダの検出は、ヘッダと同期して設けられた同期語を検出することにより、行われる。
また、同期語については特許文献2(特開2000−31942号公報)に記載されている。
また、特許文献3(特開平10−209876号公報)は、データ量の比較により、欠落データがある箇所を検出し、ミュート処理を行うものが開示されている。この特許文献3に記載されている従来のビットストリーム再生装置は、MPEG1あるいはMPEG2オーディオ規格で符号化されたオーディオストリームを復号するものであって、ストリームの一部が何らかの原因で欠損した場合に、復号器のフレームバッファのアンダーフローを検出し、ミュートを行うものである。すなわち、同期語を検出して、正規のヘッダを見つけ、正規のヘッダと正規のヘッダの間のデータ量をカウンタで計測する。計測したデータ量Fが、あらかじめ決められたデータ量よりも小さい場合は、データの欠落があったものと判断してミュート処理を行うものである。
特開2000−259195号公報 特開2000−31942号公報 特開平10−209876号公報
本願発明で扱うエレメンタリストリームには、同期語が存在せず、かつ、CRCのようなエラーチェックのためのビットが存在しない。このようなエレメンタリストリームを扱う場合、どの様にして不連続個所をデコード前に見つけ、また、どのタイミングでミュートをかけるのかが、解決すべき課題となる。
上で説明した特許文献では、以下の問題がある。
特許文献1、2は、まず、正規のヘッダを検出し、正規のヘッダの情報を解析しているので、ヘッダとヘッダとの間に生じる不連続箇所を見つけることができない。
特許文献3も、まず、正規のヘッダを検出し、正規のヘッダと次の正規のヘッダとの間のデータ量を検出している。正規のヘッダは、同期語で見つけることができるが、同期語を有しないストリームを扱う本願発明では、連続した2つの正規のヘッダを見つけることができない。
また、特許文献1では、ミュートをかけるタイミングは、変更が検出されてから後のフレームである。従って、変更前に生じた不連続箇所のミュートを行うことはできない。
また、特許文献3では、ミュートをかけるタイミングが示されていない。
本発明に係る再生装置は、1つのフレームにオーディオ符号化信号と前記オーディオ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、同期語を含まない下位レイヤーの第2ストリームが、検出可能なヘッダ信号を含む上位レイヤーの第1ストリームに包含されるデータを受け、前記オーディオ符号化信号を復号して音声を出力する再生装置であって、前記第1ストリームを解析し、前記ヘッダ信号を検出すると共に、検出したヘッダ信号を基準に、前記第2ストリームを解析して前記オーディオ符号化信号と前記プライベートヘッダの位置情報を出力するストリーム解析手段と、前記ストリーム解析手段から出力される前記オーディオ符号化信号と前記プライベートヘッダとを一時保存するデコード前バッファメモリと、前記デコード前バッファメモリから入力される前記オーディオ符号化信号を復号し音声を出力する復号手段と、第1フレームのプライベートヘッダに含まれる属性情報を解析し、プライベートヘッダの後に続く前記オーディオ符号化信号のデータ長を表すデータ長情報を検出する第1ヘッダ解析手段と、第1フレームのプライベートヘッダの位置情報に、検出されたデータ長を加えて得た位置から後にある所定量の標的データを解析し、解析した標的データが、第2フレームのプライベートヘッダに含まれる属性情報であるか否かを判断する第2ヘッダ解析手段と、解析した標的データが、第2フレームのプライベートヘッダに含まれる属性情報でないと判断した場合は、少なくとも第1フレームのオーディオ符号化信号について前記復号手段からの音声出力を停止する制御手段を具備することを特徴とする再生装置で構成される。
また、本発明に係る再生装置において、前記第2ヘッダ解析手段は、前記標的データの少なくとも1部が、前記第1ヘッダ解析手段で解析された属性情報の少なくとも1部と一致するか否かを判断することを特徴とする構成でもよい。
また、本発明に係る再生装置において、前記第2ヘッダ解析手段は、前記標的データの少なくとも1部が、あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致するか否かを判断することを特徴とする構成でもよい。
また、本発明に係る再生装置において、前記属性情報は、前記オーディオ符号化信号のサンプリング周波数、チャンネル情報、サンプルビット長、オーディオ符号化信号のデータ長の少なくとも一つであることを特徴とする構成でもよい。
また、本発明に係る再生装置において、前記ストリーム解析手段は、前記ヘッダ信号に含まれる前記フレームの長さを表すフレーム長データを検出し、前記ヘッダ信号に続く1フレームのデータが、検出したフレーム長データと等しくない場合は、前記フレームを破棄し、次のフレームの解析を行うことを特徴とする構成でもよい。
また、本発明に係る再生装置は、前記第1ストリームは複数のパケットで構成され、前記ストリーム解析手段は、前記ヘッダ信号に含まれる前記パケットの長さを表すパケット長データを検出し、検出した1パケットの長さが、検出したパケット長データと等しくない場合は、前記パケットを破棄し、次のパケットの解析を行うことを特徴とする構成でもよい。
また、本発明に係る再生装置において、前記第1ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析手段は、不連続点明示パケットを検出し、前記デコード前バッファに出力した、不連続点明示パケット前のデータ量があらかじめ定義された所定のデータ量あるいはその整数倍に満たない場合には、前記デコード前バッファに対して不足分の補完データを出力することを特徴とする構成でもよい。
また、本発明に係る再生装置において、前記第1ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析手段は、検出したヘッダ信号から不連続明示パケットまでをカウントするカウンタを備え、更にカウントした点におけるアドレスを計算して保持するアドレス記憶手段を設け、前記制御手段は、計算したアドレスに、次のプライベートヘッダが位置するように読み出しポインタを移動することを特徴とする構成でもよい。
また、本発明に係る再生装置において、前記デコード前バッファメモリと復号手段の間に、遅延手段を設けたことを特徴とする構成でもよい。
また、本発明に係る再生方法は、1つのフレームにオーディオ符号化信号と前記オーディオ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、同期語を含まない下位レイヤーの第2ストリームが、検出可能なヘッダ信号を含む上位レイヤーの第1ストリームに包含されるデータを受け、前記オーディオ符号化信号を復号して音声を出力する再生方法であって、前記第1ストリームを解析し、前記ヘッダ信号を検出すると共に、検出したヘッダ信号を基準に、前記第2ストリームを解析して前記オーディオ符号化信号と前記プライベートヘッダの位置情報を出力するストリーム解析ステップと、前記ストリーム解析ステップから出力される前記オーディオ符号化信号と前記プライベートヘッダとを一時保存するステップと、前記保持されたオーディオ符号化信号を復号し音声を出力する復号ステップと、第1フレームのプライベートヘッダに含まれる属性情報を解析し、プライベートヘッダの後に続く前記オーディオ符号化信号のデータ長を表すデータ長情報を検出する第1ヘッダ解析ステップと、第1フレームのプライベートヘッダの位置情報に、検出されたデータ長を加えて得た位置から後にある所定量の標的データを解析し、解析した標的データが、第2フレームのプライベートヘッダに含まれる属性情報であるか否かを判断する第2ヘッダ解析ステップと、解析した標的データが、第2フレームのプライベートヘッダに含まれる属性情報でないと判断した場合は、少なくとも第1フレームのオーディオ符号化信号について前記復号ステップからの音声出力を停止する制御ステップを具備することを特徴とする。
また、本発明に係る再生方法において、前記第2ヘッダ解析ステップは、前記標的データの少なくとも1部が、前記第1ヘッダ解析ステップで解析された属性情報の少なくとも1部と一致するか否かを判断することを特徴とする。
また、本発明に係る再生方法において、前記第2ヘッダ解析ステップは、前記標的データの少なくとも1部が、あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致するか否かを判断することを特徴とする。
また、本発明に係る再生方法において、前記属性情報は、前記オーディオ符号化信号のサンプリング周波数、チャンネル情報、サンプルビット長、オーディオ符号化信号のデータ長の少なくとも一つであることを特徴とする。
また、本発明に係る再生方法において、前記ストリーム解析ステップは、前記ヘッダ信号に含まれる前記フレームの長さを表すフレーム長データを検出し、前記ヘッダ信号に続く1フレームのデータが、検出したフレーム長データと等しくない場合は、前記フレームを破棄し、次のフレームの解析を行うことを特徴とする。
また、本発明に係る再生方法において、前記第1ストリームは、複数のパケットで構成され、前記ストリーム解析ステップは、前記ヘッダ信号に含まれる前記パケットの長さを表すパケット長データを検出し、検出した1パケットの長さが、検出したパケット長データと等しくない場合は、前記パケットを破棄し、次のパケットの解析を行うことを特徴とする。
また、本発明に係る再生方法において、前記第1ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析ステップは、不連続点明示パケットを検出し、前記保持した不連続点明示パケット前のデータ量が、あらかじめ定義された所定のデータ量あるいはその整数倍に満たない場合には、前記デコード前バッファに対して不足分の補完データを出力することを特徴とする。
また、本発明に係る再生方法において、前記第1ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析ステップは、検出したヘッダ信号から不連続明示パケットまでをカウントし、更にカウントした点におけるアドレスを計算して保持するアドレス記憶ステップを設け、前記制御ステップは、計算したアドレスに、次のプライベートヘッダが位置するように読み出しポインタを移動することを特徴とする。
また、本発明に係る再生方法において、前記保持するステップと復号ステップとの間に、オーディオ符号化信号を遅延する遅延ステップを設けたことを特徴とする。
また、本発明は、上記再生方法を、コンピュータで実行させるためのプログラムである。
また、本発明は、上記再生方法を、コンピュータで実行させるためのプログラムを記録した、コンピュータ読み取り可能な記録媒体である。
本発明にかかる再生装置は、エレメンタリストリームに同期語やCRCのビットが存在しないオーディオストリームの復号時に、編集による不連続点や伝送路のエラーによるデータの欠落があったとしても、異音を発生することなく音声の出力をすることが可能となる。
本発明の第1の実施の形態について、図1、図2A、図2B、図3、図4、図5A、図5Bを用いて説明する。
図1は、本実施の形態の再生装置101を表わすブロック図である。また、図2A、図2Bは、本実施の形態の再生方法の各ステップを表わすフローチャートである。また、図3は入力されるストリームの構造を示す図であり、MPEG規格におけるトランスポートストリームとPESパケットと、本発明によって異音発生防止の効果が期待されるエレメンタリストリームの構成を示す。図4は、図3で説明しているトランスポートストリームがトランスポートパケット単位で編集され、不完全なPESパケットを含む場合を示す図である。
まず、送信側において、トランスポートストリーム301が生成される過程を簡単に説明する。オーディオ信号は、所定の符号化技術により、オーディオ符号化信号308に変換され、所定のバイト数毎(960バイト毎、または1440バイト毎)に切断され、切断片の先頭に4バイトのプライベートヘッダ307が付与される。そのオーディオ符号化信号は、圧縮処理されていないPCMデータであるものとする。切断されたオーディオ符号化信号308のそれぞれは、およそ5msecの長さのオーディオ信号が含まれる。プライベートヘッダ307は、オーディオ符号化信号308の属性情報を含み、かつ、同期語を持たない。プライベートヘッダ307とそれに続くオーディオ符号化信号308を合わせてオーディオの1フレームとし、このようなフレームが連続して送られてくるストリームをエレメンタリストリーム306と言う。属性情報には、例えば、サンプリング周波数、チャンネルアサイン、サンプルのビット長、オーディオ符号化信号308のデータ長の情報が含まれる。これらの属性情報は、属性(サンプリング周波数、チャンネルアサイン情報、サンプルのビット長、オーディオ符号化信号308のデータ長)が変わらない限り、変わらない。従って、属性情報が変わらない限り、n番目(nは、正の整数)のフレームのプライベートヘッダ307と、(n+1)番目のフレームのプライベートヘッダ307は、同じである。通常は、属性情報はほとんど変わることがない。放送システムが変わる場合、または、光ディスクに記録された音声トラックが変わる場合、変わることがある。また、属性情報の中には、変わる頻度が少ない(ゼロを含む)ものと、多いものがある。たとえ変わる場合であっても、予め決められた複数の選択肢のひとつに変わる。例えば、オーディオ符号化信号308のデータ長は、予め決められた選択肢である、960バイトや1440バイトのひとつに変わる。
この様にして作られたエレメンタリストリーム306は、1フレーム毎に分けられ、964バイトまたは1444バイト長のPESペイロード305として扱われる。各PESペイロード305にはPESヘッダ304が加えられ、一つのPESパケット303が作られる。PESパケット303は、所定長毎(例えば188バイト長毎または184バイト長毎)に切断され、切断片は、一つのオーディオトランスポートパケット302として扱われる。オーディオトランスポートパケット302は、ビデオトランスポートパケットなどのその他のトランスポートパケットと混在して連結され、トランスポートストリーム301が生成される。トランスポートストリーム301は、送信局から放送される。受信器は、トランスポートストリーム301を受信し、オーディオ再生装置101で音声の再生を行う。受信したトランスポートストリーム301は、直接オーディオ再生装置101に送られても良いし、一時的にどこかに記録し、記録されたトランスポートストリーム301をオーディオ再生装置101に送る様にしても良い。後者の場合として、トランスポートストリームの形式で記録再生装置により記録された音声が、再生のために再生装置101に送られてくる場合や、トランスポートストリームの形式でディスク(例えばDVD)に記録された商用コンテンツが、再生のために再生装置101に送られてくる場合がある。
以上より明らかなように、本発明においては、1つのフレームにオーディオ符号化信号とオーディオ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、同期語を含まない下位レイヤーの第2ストリーム(エレメンタリストリーム)が、検出可能なヘッダ信号(PESヘッダ)を含む上位レイヤーの第1ストリーム(PESパケットで構成されるストリーム)に包含される構造のデータを処理する。
受信したストリームは、不連続検出部100において、ストリームの中のパケットまたはパケットの一部に不連続がないかどうか、すなわちデータの一部が欠落していないかどうかの検出がなされ、不連続が検出されれば、不連続明示パケット401が挿入される。
オーディオ再生装置101は、オーディオのトランスポートパケット302を含むトランスポートストリーム301が入力され、復号され、音声信号を出力するものである。再生装置101に入ったトランスポートストリーム301は、ストリーム解析手段102に入力される(S201)。ストリーム解析手段102はトランスポートストリーム301を解析し、オーディオのトランスポートパケット302を抜き出してオーディオPESパケット303を構成し、さらにオーディオPESパケット303を解析する(S202)。
図3に示すように、ストリーム解析手段102は、トランスポートパケットの内、オーディオトランスポートパケット302のみを抽出し、PESパケット303のストリームを作る。PESヘッダ304にはPESペイロード305のデータ長が含まれている。ストリーム解析手段102は、PESヘッダ304が検出されれば、PESヘッダ直後から、すなわち、PESペイロードの先頭からカウントを開始し、次のパケット(PESパケットまたは後で説明する不連続点明示パケット)が見つかればカウントを終了する。データに不連続がなければ、カウント値は、PESペイロード305のデータ長に等しい。カウント値を、PESヘッダに含まれていたデータ長と比較し、カウント値があらかじめ定義された正規の値と一致するかを判断する(S203)。一致しない場合、すなわち前記値が不正である場合(S203の不正)には現在解析しているPESパケットを破棄し、次のPESパケットの解析に移る。前記PESペイロードのデータ長とは、あらかじめ規格で定義された数種類の長さのいずれかであり、例えば、964バイト、1444バイトのいずれかである。
一方、前記値が正規である場合(S203の正規)には、PESペイロード305からプライベートヘッダ307およびオーディオ符号化信号308を抽出し、デコード前バッファメモリ103に格納する(S204)。ここでPESペイロード305はオーディオのエレメンタリストリーム306とも呼ぶ。また、プライベートヘッダ307はオーディオ符号化信号308の属性情報を含み、かつ、同期語を持たないものである。プライベートヘッダ307の検出は、たとえばPESヘッダ304の検出から、所定時間の遅延により検出する。図3に示す例にあっては、プライベートヘッダ307は、PESヘッダ304の直後に位置している場合を示しているが、プライベートヘッダ307は、PESヘッダ304の終端から所定量後に位置するように配置することも可能である。この場合は、PESヘッダに、所定量の情報を持たすようにすればよい。
以上より明らかなように、ストリーム解析手段102は、第1ストリームであるPESパケットを含むストリームを解析し、ヘッダ信号すなわちPESヘッダを検出すると共に、検出したヘッダ信号を基準に、第2ストリームであるエレメンタリストリームを解析して前記オーディオ符号化信号と前記プライベートヘッダの位置情報を出力することを目的とするものである。
ここで、オーディオ再生装置101に入力されるのはトランスポートストリーム301であるとしたが、これに限るものではなく、オーディオPESパケット303が入力されてもよい。その場合も、ストリーム解析手段102はエレメンタリストリーム306であるところのプライベートヘッダ307とオーディオ符号化信号308をデコード前バッファメモリ103に格納する。なお、図2Aにおいては、フローを見やすくするために、トランスポートストリーム301の解析とPESパケット303の解析を1つのステップS202で表わしている。
デコード前バッファメモリ103から出力されるオーディオ符号化信号308は、第1ヘッダ解析手段105、第2ヘッダ解析手段、フレーム遅延手段111に入力される。フレーム遅延手段111は、送られてきたオーディオ符号化信号308を少なくとも1フレーム遅延させ、復号手段104に送る。
第1のヘッダ解析手段105はデコード前バッファメモリ103に格納された第1のフレームのプライベートヘッダ307を検出し、読込み、プライベートヘッダ307に含まれる情報を解析して制御手段107に出力する(S205)。プライベートヘッダ307の検出は、たとえばストリーム解析手段102で検出したPESヘッダ304のタイミングから、所定時間後のタイミングで行う。プライベートヘッダ307に含まれる情報とは、オーディオ符号化信号の属性情報であり、例えば、サンプリング周波数とチャンネルアサイン情報とサンプルのビット長とオーディオ符号化信号308のデータ長である。属性情報の一部あるいは全部が、制御手段107に出力される。
第1ヘッダ解析手段105は、n番目のプライベートヘッダ307(4バイト)を検出し、検出したn番目のプライベートヘッダ307を制御手段107に送る。制御手段107は、n番目のプライベートヘッダ307の情報(サンプリング周波数、チャンネルアサイン情報、サンプルのビット長、オーディオ符号化信号308のデータ長)の全てまたは一部をプライベートヘッダメモリ110に保持する。更に、第1ヘッダ解析手段105は、検出したn番目のプライベートヘッダ307の先頭から1フレームに相当する時間Tfをカウントし、トリガ信号を第2ヘッダ解析手段106に送る。なお、1個のフレームの代わりに、m個(mは1より大きい正の整数)のフレームをカウントしてトリガ信号を出力するようにしてもよい。時間Tfは、属性情報のひとつであるオーディオ符号化信号308のデータ長にプライベートヘッダ長(4バイト)を加算すれば求まる。ここでのカウントは、プライベートヘッダ307の終端からオーディオ符号化信号308のデータ長をカウントしてもよい。
以上より明らかなように、第1ヘッダ解析手段105は、第1フレームのプライベートヘッダに含まれる属性情報を解析し、プライベートヘッダの後に続くオーディオ符号化信号のデータ長を表すデータ長情報を検出することを目的とするものである。
第2ヘッダ解析手段106は、トリガ信号に応答して、デコード前バッファメモリ103から出力されるエレメンタリストリームの一部のデータ(4バイト)、すなわち標的データを読み取る。オーディオ符号化信号に不連続がなければ、読み取った標的データは、(n+1)番目のプライベートヘッダに相当する。n番目のフレームデータに不連続があれば、読み取った標的データは、(n+1)番目のプライベートヘッダではないので、(n+1)番目のプライベートヘッダを正しく読み取れない。
第2ヘッダ解析手段106は、読み取った4バイトの標的データと、プライベートヘッダメモリ110に保持したプライベートヘッダを比較し、同じであれば、(n+1)番目のプライベートヘッダが正しい位置に存在していると判断し、すなわちn番目のフレームが過不足なく存在すると判断する。この判断に基づき、制御手段107は、音声のデコードを行う。
ところが、第2ヘッダ解析手段106は、標的データが、プライベートヘッダメモリ110に保持したプライベートヘッダと一致しなければ、(n+1)番目のプライベートヘッダが正しい位置に存在していないと判断し、この場合はオーディオ符号化信号に不連続があり、音声データが欠落していると判断される。この場合、制御手段107は、n番目のプライベートヘッダに続くオーディオ符号化信号をミュートするため、復号手段104に対し、ミュート信号を出力する。フレーム遅延手段111を設けたので、ミュート信号が出力される時点は、復号手段104により、n番目のプライベートヘッダに続くオーディオ符号化信号について、音声出力がなされる直前となる。したがって、復号手段104は、n番目のプライベートヘッダに続くオーディオ符号化信号をミュートし、音声出力を停止するように指示する。ミュート信号は、1フレーム期間をミュートする信号となっている。従って、(n+1)番目のプライベートヘッダに続くオーディオ符号化信号から音声の再生出力を行う。
以上より明らかなように、第2ヘッダ解析手段106は、第1フレームのプライベートヘッダの位置情報に、検出されたデータ長を加えて得た位置から後にある所定量の標的データを解析し、解析した標的データが、第2フレームのプライベートヘッダに含まれる属性情報であるか否かを判断することを目的とする。
なお、標的データが、第2フレームのプライベートヘッダに含まれる属性情報であるか否かの判断は、標的データの少なくとも1部が、第1ヘッダ解析手段105で解析された属性情報の少なくとも1部と一致するか否かを判断するようにしてもよい。
ここで、ミュート信号は、複数フレーム期間、例えば2フレーム期間をミュートする信号であっても良い。2フレーム期間をミュートする信号であれば、(n+1)番目のプライベートヘッダに続くオーディオ符号化信号もミュートし、音声出力を停止するように指示し、(n+2)番目のプライベートヘッダに続くオーディオ符号化信号から音声の再生出力を行うこととなる。また、プライベートヘッダメモリ110は、第1ヘッダ解析手段105に設けるようにしてもよい。
言うまでもなく、第1ヘッダ解析手段105の代わりに、制御手段107がアドレスの算出を行ってもよい。
第2のヘッダ解析手段106は第1のヘッダ解析手段105と同様にプライベートヘッダ307を解析してそこに含まれる情報を制御手段107に出力するものである(S207)。第2のヘッダ解析手段106が第1のヘッダ解析手段105と異なるのは、第1ヘッダ解析手段105からのトリガ信号によって、データの読み取りがなされる点と、第1のヘッダ解析手段105が解析したプライベートヘッダよりも後の時刻のフレーム、例えば、次のフレームのプライベートヘッダを解析する点である。つまり、後述する復号手段104で復号する現フレームの次のフレームのプライベートヘッダを解析する。
復号手段104は、デコード前バッファメモリ103から出力され、一定時間遅延されたオーディオ符号化信号308を読み出し、音声を出力するものである(S209)。復号手段104は制御手段107によって、復号の開始や停止、あるいは、ミュート処理など音声の出力に関わる制御を受ける。
制御手段107は、第1のヘッダ解析手段105および第2のヘッダ解析手段106より、現フレームおよび次フレームのプライベートヘッダに含まれる情報をそれぞれ受け取り、それらの情報を互いに比較し(S208)、異なるものがあれば復号手段104にミュートを指示する(S210)。
なお、本実施の形態における再生装置および再生方法は、第1のフレームのオーディオ信号を出力した後、次のフレームの復号を行うために、デコード前バッファメモリにオーディオ符号化信号の1フレームよりも充分に多い所定量のデータがたまっているかを判定し(S211)、たまっていれば第1のヘッダ解析手段105による第1のフレームの属性情報の解析(S205)の処理へ戻り、復号を続ける。デコード前バッファメモリに所定量のデータがたまっていない場合には、外部からストリームを入力し(S201)、上述したストリーム解析手段102によるストリームの解析(S202)以後の処理を行う。
さて、トランスポートストリーム301がトランスポートパケット単位で編集された場合について、図4を参照しながら説明する。オーディオ再生装置101に入力されるトランスポートストリームの編集などによって不連続が生じた場合には、不連続検出部100において、不連続点が検出された箇所に不連続点明示パケット401が挿入される。ストリーム解析手段102は前述したように入力されたストリームを解析し(S202)、オーディオのエレメンタリストリームをデコード前バッファメモリ103に格納する(S204)。ここで、不連続点明示パケット401があれば、ストリームから抽出されたオーディオ符号化信号は、データの後半部分が欠落した不完全なオーディオ符号化信号403となる。第1ヘッダ解析手段105は、現プライベートヘッダの終端位置のアドレスに、第1ヘッダ解析手段105に含まれる本来のオーディオ符号化信号のデータ長を加算してアドレスB(407)を算出する(S206)。不完全なオーディオ符号化信号403が存在するため、このアドレスBは、実際の次プライベートヘッダのアドレスであるアドレスA(406)よりも先に進んだ点になる。第1ヘッダ解析手段105は、アドレスBのタイミングでトリガ信号を生成する。第2ヘッダ解析手段106は、トリガ信号に応答してアドレスBの時点から所定量(4バイト)のデータを読み取り、次プライベートヘッダであると予測して、プライベートヘッダ解析の処理を行う(S207)。アドレスBから所定量に格納されているのはオーディオ符号化信号の一部あるいはプライベートヘッダの一部とオーディオ符号化信号の一部のデータであるので、正しい解析を行うことができない。したがって、第2ヘッダ解析手段106の解析結果の情報は、第1ヘッダ解析手段105で取得し、プライベートヘッダメモリ110で保持された属性情報と一致せず、不一致情報が生成される。オーディオ符号化信号がPCMデータであれば、偶然に第1のフレームのプライベートヘッダに一致する可能性があるが、その可能性は極めて低い。
生成された不一致情報に基づき、現プライベートヘッダ404に関連する現フレームを復号手段104から出音する前にミュートする(S210)。これにより、不完全なオーディオ符号化信号403と、必要であればそれに続く次のフレームのオーディオ符号化信号を復号および出力せず、異音の発生を防ぐことが可能となる。
なお、制御手段107による別の判定方法について、図5A、図5Bを用いて説明する。プライベートヘッダメモリ110は、検出したプライベートヘッダに含まれる属性情報(サンプリング周波数、チャンネルアサイン情報、サンプルのビット長、オーディオ符号化信号308のデータ長)を保持するのではなく、変形も含めた選択可能な属性情報群のすべてをあらかじめ保持する。すなわち、プライベートヘッダメモリ110は、たとえば次の表1の情報を記録する。
表1
Figure 0004354455
実際に、プライベートヘッダに含まれている情報は、aの列からひとつ、bの列からひとつ、cの列からひとつ、dの列からひとつの情報であり、たとえば、(a2,b1,c1,d2)の情報を含んでいる。
制御手段107は、現プライベートヘッダで検出した属性情報と、プライベートヘッダメモリ110にあらかじめ保持された属性情報群(表1のデータ)とを比較し、メモリ110に、検出した属性情報と一致する情報が含まれているかどうかを判定する(S507)。すなわち、検出した属性情報(a2,b1,c1,d2)の全てがメモリ110に保持された属性情報群の中に含まれていれば、全て正規の情報であると判断する一方、検出した属性情報(xx,b1,c1,d2)(ここでxxは分析不能な情報を示す)のいずれかひとつに、メモリ110に保持された属性情報群に含まれていないものがあれば、プライベートヘッダは不正な情報であると判断する。
次に、現プライベートヘッダの終端からオーディオ符号化信号308のデータ長後にある4バイトの標的データ、すなわち次プライベートヘッダがあるべき箇所から検出した属性情報と、あらかじめ保持された属性情報とを比較し、上述と同様の判定をする(S508)。2つの検出した属性情報のいずれも、あらかじめ保持された属性情報と一致する情報が含まれている場合はオーディオを再生する(S509)一方、2つの検出された属性情報のいずれかに、あらかじめ保持された属性情報と一致しない情報が含まれている場合には復号手段104にミュートを指示する(S510)。なお、図5Aではフローを見やすくするために、図2Aを用いて説明したPESペイロード長が正規であるか否かの判定ステップ(S203)を省略しているが、ストリーム解析(S502)の後で同様の判定を行っても良いのは言うまでも無い。また、ミュートを行うべきかどうかは、次プライベートヘッダが正しい位置にあるかどうかを判断すればよいので、判定ステップS507を省略し、次プライベートヘッダについてのみ、属性情報を検出し、あらかじめ保持された属性情報と一致する情報が含まれているかどうかを判定する(S508)ようにしてもよい。現プライベートヘッダを検出し、解析するのは、次プライベートヘッダまでカウントするための起算点と、次プライベートヘッダまでの間隔とを得るためである。また、次プライベートヘッダを解析するのは、次プライベートヘッダであるとして検出したデータが、正規のプライベートヘッダであるかどうかの判断をするためである。
以上より明らかなように、第2ヘッダ解析手段は、標的データが、第2フレームのプライベートヘッダに含まれる属性情報であるか否かの判断を行うが、この判断は、前記標的データの少なくとも1部が、あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致するか否かの判断を行うようにしてもよい。
表1に示す属性情報群をあらかじめ保持しておけば、属性情報が許容された範囲内で変更された場合、誤った属性情報であるとの判断を避けることができる。
なお、一般にフレーム化されたオーディオストリームのプライベートヘッダ307はその後に続くオーディオ符号化信号308の属性情報を含むものであるので、ストリームの最終フレームにおいては、第2のヘッダ解析手段で解析すべきデータが存在しない場合がある。
このような場合には、ストリーム解析手段102がストリームの終端にあらかじめ定義された特定のダミーデータ、たとえば表1の代表的な属性情報の組み合わせ(a1,b1,c1,d1)を付加する。制御手段107は、第2のヘッダ解析手段106によって取得した次フレームの属性情報が全て前記あらかじめ定義されたビット列に一致すれば復号手段104に対してミュートの指示をしないということにすればよい。これは、入力されるストリームの終端において、第2のヘッダ解析手段106が解析すべきアドレスにデータが存在せず、復号手段がデコード前バッファメモリ103からデータを読み出す際にアンダーフローが発生した場合、第2のヘッダ解析手段106が何ら情報を取得できなくなるのを回避するために有効な制御である。つまり、ストリーム解析手段102が、あらかじめ定義された正規の属性情報で構成されるプライベートヘッダを付加することにより、アンダーフローを回避し、最終フレームを復号処理して出力することが可能となる。あらかじめ定義された属性情報とは、例えば、サンプリング周波数は48kHzのみ、また、サンプルのビット長は16ビット、20ビットあるいは24ビットのいずれか、また、チャンネルアサイン情報とはモノラル、デュアルモノラルあるいはステレオのいずれか、また、オーディオ符号化信号のデータ長は960バイトあるいは1440バイトのいずれかであるというようなものであり、また、終端に付加される特定のビット列とは、以上の属性情報を表わすビット列と異なるものを定義すればよい。また、終端に付加する特定のビット列は、前記あらかじめ定義された正規の属性情報で構成されていても良い。
以上により、本実施の形態では、第1のフレームのプライベートヘッダと第2のフレームのプライベートヘッダの間のデータである第1のフレームのオーディオ符号化信号の一部がストリームの転送エラーなどにより欠損している場合においても、第1のフレームのオーディオ符号化信号をミュートすることにより、異音の発生を防止することが可能となる。
次に、本発明の第2の実施の形態について、図6および図7A、図7Bを用いて説明する。
第2の実施の形態が第1の実施の形態と異なるのは、パケット長カウント手段608を備えている点である。パケット長カウント手段608は、デコード前バッファメモリ103に格納するデータ量を逐次カウントし(S705)、カウントしたPESペイロードのデータ量が第1の所定の長さに満たない場合(S706のN)にはストリーム入力(S701)のステップへ戻る。第2の実施の形態では、トランスポートストリームTSおよびPESヘッダの解析(S702)後に不連続点明示パケットがあるかどうかを判定する(S703)。不連続点明示パケットがあった場合(S703のY)、デコード前バッファ103へのエレメンタリストリームの格納量が第2の所定の長さの整数倍であるかを判定する(S707)。整数倍でない場合には整数倍になるように特定の長さの補完データをデコード前バッファに格納し(S708)、パケット長カウント手段をリセットし(S716)、ストリーム入力ステップ(701)へ戻る。不連続点明示パケットがなかった場合(S703のN)、デコード前バッファ103へのエレメンタリストリームの格納が行われ(S704)、パケット長カウント手段608は、格納したデータ量をカウントする(S705)。
パケット長カウント手段608は、ストリーム解析手段102がオーディオのPESパケットのヘッダ(以下、PESヘッダ)を検出し(S702)、次のPESヘッダを検出するまでデコード前バッファメモリ103に格納するデータ量、すなわちPESペイロード長をカウントする(S705)。
ストリーム解析手段102は、トランスポートストリームTSまたはPESヘッダの解析中に不連続点明示パケットを検出し(S703のY)、その時点でデコード前バッファ103へのデータ格納量が第2の所定の長さの整数倍になっているかどうかを判定する(S707)。前記判定(S707)が偽の場合、デコード前バッファ103へのデータ格納量が第2の所定の長さの整数倍となるように補完データをデコード前バッファに格納する(S708)。次に、パケット長カウント手段608のカウンタはリセットされ(S716)、ストリーム入力(S701)へと処理が戻る。また、ストリーム入力(S701)へ処理が戻る際に、デコード前バッファメモリ103における、第1のヘッダ解析手段105の読出しアドレスを、前記補完データを格納したアドレスの次のアドレス、すなわち、不連続点明示パケット後のデータの先頭が格納されるアドレスへ移動する。
ここで、あらかじめ定義された第1の所定の長さとは、たとえば、4バイトの第1のプライベートヘッダと、960バイトまたは1440バイトのオーディオ符号化信号と、4バイトの第2のプライベートヘッダによって構成されるデータ量であり、すなわち、968バイトまたは1448バイトである。
また、第2の所定の長さとは、第1のヘッダ解析手段105、第2のヘッダ解析手段106および複合手段104がデコード前バッファメモリ103に格納されているデータを読み出す際にアクセスできるデータの最小単位(通称:ワード)のことであり、たとえば4バイトである。
デコード前バッファメモリ103から出力されるエレメンタリストリームは、上述と同様にして第1ヘッダ解析手段105で解析され(S709)、第2ヘッダの位置が算出される(S710)、第2ヘッダの位置にある標的データ(第2ヘッダであると予測されるデータ)が解析される(S711)。解析された標的データの内容が、第1ヘッダの内容と比較され、一致するかどうかの判断がなされる(S712)。同一であれば、標的データの内容が、正規の第2ヘッダであると判断され、オーディオ再生がなされる(S713)。第2ヘッダの内容が1箇所でも、第1ヘッダの内容と異なっていれば、標的データの内容は、正規の第2ヘッダではない、すなわち、第2ヘッダの位置が算出した位置とズレた位置にあると判断され、第1の実施の形態と同様にして、第1ヘッダの後の続くオーディオ符号化信号についてミュート処理を行う(S714)。その後、デコード前バッファメモリ103に所定量(第1の所定の長さ以上)のデータが格納されているかどうかが判断され(S715)、格納されていればステップS709に戻り、格納されていなければステップS701に戻る。
ステップS712での判断は、解析した標的データの内容と、解析された第1ヘッダの内容とが比較され、一致するかどうかの判断がなされたが、解析した標的データの内容と、あらかじめ保持された表1の内容と比較する様にしても良い。
これにより、トランスポートパケット単位でストリームが編集された場合においても、後半のデータが欠落したPESペイロードすなわち不完全なオーディオのプライベートヘッダおよびオーディオ符号化信号がデコードされることが無いので、編集点前の不完全なオーディオ符号化信号およびそれに続くデータが復号手段104に入力されて異音を発生することを防ぐことが可能となる。
なお、不完全なオーディオ符号化信号が復号手段104によって復号されないのであれば、第2のヘッダ解析手段106による次フレームのヘッダ解析(S711)および制御手段107における次フレームの属性情報の確認(S712)は本来必要無いが、現実においては、ストリーム解析手段102とデコード前バッファメモリ103の間のデータ転送におけるデータの欠落を検出したり、その他の要因で元々不正なオーディオ符号化信号が正しいパケット長でPES化されて入力されるような場合にも異音発生を防止するために、第2のヘッダ解析手段106を実装する。
また、第2の実施の形態におけるストリーム解析手段102の別の制御として、ストリーム解析手段102は、パケット長カウント手段608によってカウントされたパケット長が、特定のデータ長の整数倍にならない場合(S707のN)には、特定のデータ長の整数倍になるよう不足分のデータを付加する(S708)ことによってワードアライメントを行い、それをデコード前バッファメモリ103に格納する。一般に、復号手段104および第1のヘッダ解析手段105および第2のヘッダ解析手段106がデコード前バッファメモリ103からデータを読み出す際には、あらかじめ決められたワード単位で読み出すこととなる。例えば、4バイトを1ワードとしてデータを読み出す。
トランスポートパケット単位の編集が行われた場合、一般に、編集点のアドレスは4バイト単位ではなく、編集点後のフレームはその後ワードアラインされないままデコード前バッファメモリに格納される。この場合、第1のヘッダ解析手段105および第2のヘッダ解析手段106が読み出す編集点後のプライベートヘッダ近傍のデータは1乃至3バイトずれ、制御手段107は正しい属性情報を取得できなくなってしまう。なぜなら、本実施の形態において対象としているエレメンタリデータには同期語が存在しないため、この1乃至3バイトのデータのずれを第1のヘッダ解析手段105あるいは第2のヘッダ解析手段106が検出して読み出し位置を修正することは不可能だからである。よって、ストリーム解析手段102がデコード前バッファメモリ103にデータを格納する際に補完データを格納する(S708)ことにより、編集点後の復号および出音が可能となる。
以上の処理をまとめたのが図7A、図7Bであり、まず、PESパケット解析中に不連続点明示パケット401を検出した場合には、処理はPESパケット解析ステップ(S702)に戻る。また、デコード前バッファメモリへ格納したPESパケットのデータ量が第1の所定の長さ、すなわち、エレメンタリストリーム306の1フレーム長の整数倍に一致しない場合(S706のN)は、ストリーム入力ステップ(S701)に戻る。また、デコード前バッファに格納したデータ量が第2の所定の長さの整数倍に一致しない場合(S707のN)には、補完データをデコード前バッファに格納して(S708)、デコード前バッファに格納されたデータへアクセスするためのポインタをワードアラインする。
以上にように、本発明によって、ストリームの不連続点をストリーム解析手段で検出し、異音の発生を防止することが可能となる。また、不連続点においてワードアラインを行うことにより、不連続点後の復号およびオーディオの再生が可能となる。
なお、図7Aではフローを見やすくするために、図2Aを用いて説明したPESペイロード長が正規であるか否かの判定(S203)を省略しているが、ストリーム解析(S702)の後で同様の判定を行っても良いのは言うまでも無い。
次に、本発明の第3の実施の形態について、図8、図9A、図9Bおよび図4を用いて説明する。第3の実施の形態においては、編集点後の出音の再開を実現する例について説明する。
第3の実施の形態が第1の実施の形態あるいは第2の実施の形態と異なるのは、ストリーム解析手段102がデコード前バッファメモリ103に格納するプライベートヘッダのアドレスを記憶する(S904)アドレス記憶手段808(図8)を備えた点である。
ストリームが入力され(S901)、トランスポートストリームTSおよびPESヘッダの解析がなされる(S902)。PESヘッダの解析し、次のPESヘッダの検出中に、不連続点明示パケット401であるかどうかの判断がなされる(S903)。不連続点明示パケット401が見つかった場合はステップS904に進む一方、不連続点明示パケット401を見つけることなく次のPESヘッダが見つかった場合(または前のPESヘッダから所定量のカウントが終わった場合)は、ステップS905に進む。ステップS905ではエレメンタリストリームをデコード前バッファメモリ103に格納する。
ここでステップS903、S904について、図4を用いて説明する。ステップS903で、ストリーム解析手段102は、PESヘッダを検出し、解析する。ストリーム解析手段102に設けたカウンタは、PESヘッダの終端からカウントを開始し、次のパケット(データに不連続が生じている場合は、不連続点明示パケット、データに不連続が生じていない場合は次のPESパケット)が見つかるまでカウントする。PESヘッダを解析したときに、PESヘッダに続くPESペイロードのデータ長を検出し、そのデータ長をカウントする様にしても良い。そして、カウントが終了した点でのアドレスAを算出する。このアドレスAをアドレス記憶手段808に記憶する(S904)。即ち、アドレス記憶手段808には編集点後の先頭のプライベートヘッダの先頭アドレスが格納される。
デコード前バッファメモリ103から出力されるエレメンタリストリームは、上述と同様にして第1ヘッダ解析手段105で解析され(S906)、第2ヘッダの位置が算出される(S907)、第2ヘッダの位置にある標的データ(第2ヘッダであると予測されるデータ)が解析される(S908)。解析された標的データの内容が、第1ヘッダの内容と比較され、一致するかどうかの判断がなされる(S909)。同一であれば、標的データの内容が、正規の第2ヘッダであると判断され、オーディオ再生がなされる(S910)。第2ヘッダの内容が1箇所でも、第1ヘッダの内容と異なっていれば、標的データの内容は、正規の第2ヘッダではない、すなわち、第2ヘッダの位置が算出した位置とズレた位置にあると判断され、第1の実施の形態と同様にして、第1ヘッダの後の続くオーディオ符号化信号についてミュート処理を行う(S911)。更に、前記アドレス記憶手段808に格納されているアドレスAに、次のプライベートヘッダ405の先頭が位置するように、データ読出しポインタを移動し(S912)、デコード処理を続ける。すなわち、アドレスAをアドレス記憶手段808から読みだし、次のヘッダおよびフレーム先頭アドレスへ第1のヘッダ解析手段105および復号手段104の読出しポインタをそれぞれ移動する(S912)。このデータ読出しポインタの移動により、次のプライベートヘッダ405を、上述した現プライベートヘッダ404とし、その次のプライベートヘッダを次プライベートヘッダとして処理する。
その後、デコード前バッファメモリ103に所定量(第1の所定の長さ以上)のデータが格納されているかどうかが判断され(S913)、格納されていればステップS906に戻り、格納されていなければステップS901に戻る。
ステップS909での判断は、解析した標的データの内容と、解析された第1ヘッダの内容とが比較され、一致するかどうかの判断がなされたが、解析した標的データの内容と、あらかじめ保持された表1の内容と比較する様にしても良い。
以上より明らかなように、ストリーム解析手段102は、検出したヘッダ信号から不連続明示パケットまでをカウントするカウンタを備え、更にカウントした点におけるアドレスAを計算して保持するアドレス記憶手段808を設け、前記制御手段107は、計算したアドレスAに、次のプライベートヘッダが位置するように読み出しポインタを移動する。
なお、図9Aではフローを見やすくするために、図2Aを用いて説明したPESペイロード長が正規であるか否かの判定(S203)を省略しているが、ストリーム解析(S902)の後で同様の判定を行っても良いのは言うまでも無い。
以上により、本実施の形態では、編集などによって生じた不連続点後の音声の復号および出力が可能となる。
なお、以上の実施の形態は、オーディオの再生装置およびその処理を説明するステップとして説明したが、これらはコンピュータのプログラムの一部あるいは他の装置の一部の機能であっても良いことは説明するまでもない。
また、コンピュータのプログラムによって実現された本発明を磁気ディスクやCD−ROM等の記録媒体に格納することで、コンピュータシステムで容易に実施することが可能となる。
本発明は、再生装置、再生方法に利用可能である。
本発明の第1の実施の形態におけるオーディオの再生装置の構成を示すブロック図である。 本発明の第1の実施の形態におけるオーディオの再生方法を示すフローチャートである。 本発明の第1の実施の形態におけるオーディオの再生方法を示すフローチャートである。 MPEG規格に基づいたストリームの構造を表わす図である。 トランスポートストリームパケット単位で編集されたストリームの構造を表わす図である。 本発明の第1の実施の形態におけるオーディオの再生装置の構成を示すブロック図である。 本発明の第1の実施の形態におけるオーディオの再生装置の構成を示すブロック図である。 本発明の第2の実施の形態におけるオーディオの再生装置の構成を示すブロック図である。 本発明の第2の実施の形態におけるオーディオの再生方法を示すフローチャートである。 本発明の第2の実施の形態におけるオーディオの再生方法を示すフローチャートである。 本発明の第3の実施の形態におけるオーディオの再生装置の構成を示すブロック図である。 本発明の第3の実施の形態におけるオーディオの再生方法を示すフローチャートである。 本発明の第3の実施の形態におけるオーディオの再生方法を示すフローチャートである。

Claims (18)

  1. 1つのフレームにオーディオ符号化信号と前記オーディオ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、同期語を含まない下位レイヤーの第2ストリームが、検出可能なヘッダ信号を含む上位レイヤーの第1ストリームに包含されるデータを受け、前記オーディオ符号化信号を復号して音声を出力する再生装置であって、
    前記第1ストリームを解析し、前記ヘッダ信号を検出すると共に、検出したヘッダ信号を基準に、前記第2ストリームを解析して前記オーディオ符号化信号と前記プライベートヘッダの位置情報を出力するストリーム解析手段と、
    前記ストリーム解析手段から出力される前記オーディオ符号化信号と前記プライベートヘッダとを一時保存するデコード前バッファメモリと、
    前記デコード前バッファメモリから入力される前記オーディオ符号化信号を復号し音声を出力する復号手段と、
    第1フレームのプライベートヘッダに含まれる属性情報を解析し、プライベートヘッダの後に続く前記オーディオ符号化信号のデータ長を表すデータ長情報を検出する第1ヘッダ解析手段と、
    第1フレームのプライベートヘッダの位置情報に、検出されたデータ長を加えて得た位置から後にある所定量の標的データを解析し、解析した標的データが、第2フレームのプライベートヘッダに含まれる属性情報であるか否かを判断する第2ヘッダ解析手段と、
    解析した標的データが、第2フレームのプライベートヘッダに含まれる属性情報でないと判断した場合は、少なくとも第1フレームのオーディオ符号化信号について前記復号手段からの音声出力を停止する制御手段を具備することを特徴とする再生装置。
  2. 前記第2ヘッダ解析手段は、前記標的データの少なくとも1部が、前記第1ヘッダ解析手段で解析された属性情報の少なくとも1部と一致するか否かを判断することを特徴とする請求項1記載の再生装置。
  3. 前記第2ヘッダ解析手段は、前記標的データの少なくとも1部が、あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致するか否かを判断することを特徴とする請求項1記載の再生装置。
  4. 前記属性情報は、前記オーディオ符号化信号のサンプリング周波数、チャンネル情報、サンプルビット長、オーディオ符号化信号のデータ長の少なくとも一つであることを特徴とする請求項1記載の再生装置。
  5. 前記ストリーム解析手段は、前記ヘッダ信号に含まれる前記フレームの長さを表すフレーム長データを検出し、前記ヘッダ信号に続く1フレームのデータが、検出したフレーム長データと等しくない場合は、前記フレームを破棄し、次のフレームの解析を行うことを特徴とする請求項1記載の再生装置。
  6. 前記第1ストリームは複数のパケットで構成され、前記ストリーム解析手段は、前記ヘッダ信号に含まれる前記パケットの長さを表すパケット長データを検出し、検出した1パケットの長さが、検出したパケット長データと等しくない場合は、前記パケットを破棄し、次のパケットの解析を行うことを特徴とする請求項1記載の再生装置。
  7. 前記第1ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析手段は、不連続点明示パケットを検出し、前記デコード前バッファに出力した不連続点明示パケット前のデータ量が、あらかじめ定義された所定のデータ量あるいはその整数倍に満たない場合には、前記デコード前バッファに対して不足分の補完データを出力することを特徴とする請求項6記載のオーディオ再生装置。
  8. 前記第1ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析手段は、検出したヘッダ信号から不連続明示パケットまでをカウントするカウンタを備え、更にカウントした点におけるアドレスを計算して保持するアドレス記憶手段を設け、前記制御手段は、計算したアドレスに、次のプライベートヘッダが位置するように読み出しポインタを移動することを特徴とする請求項1記載の再生装置。
  9. 前記デコード前バッファメモリと復号手段の間に、遅延手段を設けたことを特徴とする請求項1記載の再生装置。
  10. 1つのフレームにオーディオ符号化信号と前記オーディオ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、同期語を含まない下位レイヤーの第2ストリームが、検出可能なヘッダ信号を含む上位レイヤーの第1ストリームに包含されるデータを受け、前記オーディオ符号化信号を復号して音声を出力する再生方法であって、
    前記第1ストリームを解析し、前記ヘッダ信号を検出すると共に、検出したヘッダ信号を基準に、前記第2ストリームを解析して前記オーディオ符号化信号と前記プライベートヘッダの位置情報を出力するストリーム解析ステップと、
    前記ストリーム解析ステップから出力される前記オーディオ符号化信号と前記プライベートヘッダとを一時保存するステップと、
    前記保持されたオーディオ符号化信号を復号し音声を出力する復号ステップと、
    第1フレームのプライベートヘッダに含まれる属性情報を解析し、プライベートヘッダの後に続く前記オーディオ符号化信号のデータ長を表すデータ長情報を検出する第1ヘッダ解析ステップと、
    第1フレームのプライベートヘッダの位置情報に、検出されたデータ長を加えて得た位置から後にある所定量の標的データを解析し、解析した標的データが、第2フレームのプライベートヘッダに含まれる属性情報であるか否かを判断する第2ヘッダ解析ステップと、
    解析した標的データが、第2フレームのプライベートヘッダに含まれる属性情報でないと判断した場合は、少なくとも第1フレームのオーディオ符号化信号について前記復号ステップからの音声出力を停止する制御ステップを具備することを特徴とする再生方法。
  11. 前記第2ヘッダ解析ステップは、前記標的データの少なくとも1部が、前記第1ヘッダ解析ステップで解析された属性情報の少なくとも1部と一致するか否かを判断することを特徴とする請求項10記載の再生方法。
  12. 前記第2ヘッダ解析ステップは、前記標的データの少なくとも1部が、あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致するか否かを判断することを特徴とする請求項10記載の再生方法。
  13. 前記属性情報は、前記オーディオ符号化信号のサンプリング周波数、チャンネル情報、サンプルビット長、オーディオ符号化信号のデータ長の少なくとも一つであることを特徴とする請求項10記載の再生方法。
  14. 前記ストリーム解析ステップは、前記ヘッダ信号に含まれる前記フレームの長さを表すフレーム長データを検出し、前記ヘッダ信号に続く1フレームのデータが、検出したフレーム長データと等しくない場合は、前記フレームを破棄し、次のフレームの解析を行うことを特徴とする請求項10記載の再生方法。
  15. 前記第1ストリームは、複数のパケットで構成され、前記ストリーム解析ステップは、前記ヘッダ信号に含まれる前記パケットの長さを表すパケット長データを検出し、検出した1パケットの長さが、検出したパケット長データと等しくない場合は、前記パケットを破棄し、次のパケットの解析を行うことを特徴とする請求項10記載の再生方法。
  16. 前記第1ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析ステップは、不連続点明示パケットを検出し、前記保持した不連続点明示パケット前のデータ量が、あらかじめ定義された所定のデータ量あるいはその整数倍に満たない場合には、前記デコード前バッファに対して不足分の補完データを出力することを特徴とする請求項15記載のオーディオ再生方法。
  17. 前記第1ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析ステップは、検出したヘッダ信号から不連続明示パケットまでをカウントし、更にカウントした点におけるアドレスを計算して保持するアドレス記憶ステップを設け、前記制御ステップは、計算したアドレスに、次のプライベートヘッダが位置するように読み出しポインタを移動することを特徴とする請求項10記載の再生方法。
  18. 前記保持するステップと復号ステップとの間に、オーディオ符号化信号を遅延する遅延ステップを設けたことを特徴とする請求項10記載の再生方法。
JP2005502921A 2003-02-28 2004-02-26 再生装置および再生方法 Expired - Fee Related JP4354455B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2003052837 2003-02-28
JP2003052837 2003-02-28
PCT/JP2004/002261 WO2004077406A1 (ja) 2003-02-28 2004-02-26 再生装置および再生方法

Publications (2)

Publication Number Publication Date
JPWO2004077406A1 JPWO2004077406A1 (ja) 2006-06-08
JP4354455B2 true JP4354455B2 (ja) 2009-10-28

Family

ID=32923416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005502921A Expired - Fee Related JP4354455B2 (ja) 2003-02-28 2004-02-26 再生装置および再生方法

Country Status (5)

Country Link
US (2) US7653538B2 (ja)
JP (1) JP4354455B2 (ja)
KR (1) KR20060022637A (ja)
CN (1) CN100583239C (ja)
WO (1) WO2004077406A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084459A (ja) * 2003-09-10 2005-03-31 Alpine Electronics Inc オーディオ装置およびオーディオ装置における再生方法
TWI275273B (en) * 2004-03-03 2007-03-01 Mediatek Inc Method and apparatus for extracting payload from a packetized elementary stream packet
JP3987541B2 (ja) 2005-03-24 2007-10-10 株式会社東芝 パケットストリーム受信装置
US7818442B2 (en) * 2005-09-06 2010-10-19 Viewcast.Com, Inc. Streaming media encoder with front panel control interface
JP4635801B2 (ja) * 2005-09-26 2011-02-23 日本電気株式会社 情報処理装置及び情報処理方法
US7747798B2 (en) * 2006-01-31 2010-06-29 Viewcast.Com, Inc. Portable media encoder
US20070189411A1 (en) * 2006-02-14 2007-08-16 Viewcast.Com, Inc. Audio encoding and transmission method
US8085718B2 (en) * 2006-06-29 2011-12-27 St-Ericsson Sa Partial radio block detection
TW200820780A (en) * 2006-10-18 2008-05-01 Realtek Semiconductor Corp Method of embedding voice data into the transmission data
WO2008117524A1 (ja) * 2007-03-26 2008-10-02 Panasonic Corporation デジタル放送送信装置、デジタル放送受信装置およびデジタル放送送受信システム
US7778839B2 (en) * 2007-04-27 2010-08-17 Sony Ericsson Mobile Communications Ab Method and apparatus for processing encoded audio data
JP2009005150A (ja) * 2007-06-22 2009-01-08 Panasonic Corp Avビットストリーム再生装置
JP2009047914A (ja) * 2007-08-20 2009-03-05 Nec Corp 音声復号化装置、音声復号化方法、音声復号化プログラムおよびプログラム記録媒体
WO2009038070A1 (ja) * 2007-09-18 2009-03-26 Kowa Company, Ltd. シリアルデータ通信システム、及びシリアルデータ通信方法
JP2009157272A (ja) * 2007-12-27 2009-07-16 Roland Corp 音声再生装置
JP2009277277A (ja) * 2008-05-13 2009-11-26 Funai Electric Co Ltd 音声処理装置
CN101964188B (zh) * 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
CN102244825A (zh) * 2011-06-10 2011-11-16 中兴通讯股份有限公司 一种多媒体流的播放方法及装置
MX2018006149A (es) 2013-01-21 2021-09-17 Dolby Laboratories Licensing Corp Codificador y decodificador de audio con metadatos de limite y sonoridad de programa.
US9351157B2 (en) * 2013-10-17 2016-05-24 Motorola Solutions, Inc. Methods, systems, and devices to reduce audio truncation during transcoding
JP2015119275A (ja) * 2013-12-17 2015-06-25 ソニー株式会社 通信装置、パケット監視方法及びコンピュータプログラム
CN113921020A (zh) * 2014-09-30 2022-01-11 索尼公司 发送装置、发送方法、接收装置和接收方法
US10332388B1 (en) * 2014-11-14 2019-06-25 Amazon Technologies, Inc. System for providing acoustic signals
US10176815B1 (en) * 2014-11-14 2019-01-08 Amazon Technologies, Inc. System for acoustic communication
AU2016269886B2 (en) 2015-06-02 2020-11-12 Sony Corporation Transmission device, transmission method, media processing device, media processing method, and reception device

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5726989A (en) * 1995-11-06 1998-03-10 Stellar One Corporation Method for ensuring synchronization of MPEG-1 data carried in an MPEG-2 transport stream
US5627936A (en) * 1995-12-21 1997-05-06 Intel Corporation Apparatus and method for temporal indexing of multiple audio, video and data streams
SG71709A1 (en) * 1996-05-08 2000-04-18 Matsushita Electric Ind Co Ltd Multiplex transmission method and system and audio jitter absorbing method used therein
JP3484908B2 (ja) 1997-01-27 2004-01-06 三菱電機株式会社 ビットストリーム再生装置
US6026506A (en) * 1997-09-26 2000-02-15 International Business Machines Corporation Concealing errors in transport stream data
US6788710B1 (en) * 1998-03-19 2004-09-07 Thomson Licensing S.A. Auxiliary data insertion in a transport datastream
JP2000031942A (ja) 1998-07-14 2000-01-28 Mitsubishi Electric Corp 音響再生装置及び音響再生方法
US6816491B1 (en) 1998-11-04 2004-11-09 Hitachi, Ltd. Multiplexed audio data decoding apparatus and receiver apparatus
JP3848805B2 (ja) * 1998-11-04 2006-11-22 株式会社日立製作所 受信装置
JP3318535B2 (ja) * 1998-11-26 2002-08-26 パイオニア株式会社 情報記録媒体、情報記録装置及び情報再生装置
JP2000259195A (ja) * 1999-01-08 2000-09-22 Matsushita Electric Ind Co Ltd デコード回路及びそれを用いた再生装置
US6631352B1 (en) 1999-01-08 2003-10-07 Matushita Electric Industrial Co. Ltd. Decoding circuit and reproduction apparatus which mutes audio after header parameter changes
JP4136151B2 (ja) * 1999-01-22 2008-08-20 キヤノン株式会社 符号化装置、方法及びコンピュータ読み取り可能な記憶媒体
JP4269409B2 (ja) * 1999-05-19 2009-05-27 ソニー株式会社 受信装置および方法
EP1087557A3 (en) * 1999-09-22 2005-01-19 Matsushita Electric Industrial Co., Ltd. Apparatus for transmitting digital audio data and receiving apparatus for receiving the digital audio data
US7236836B1 (en) * 1999-09-29 2007-06-26 Victor Company Of Japan, Ltd. System for signal processing and signal transmission
US6804257B1 (en) * 1999-11-25 2004-10-12 International Business Machines Corporation System and method for framing and protecting variable-lenght packet streams
GB9930787D0 (en) * 1999-12-30 2000-02-16 Koninkl Philips Electronics Nv Method and apparatus for convrerting data streams
US6804266B1 (en) * 2000-01-24 2004-10-12 Ati Technologies, Inc. Method and apparatus for handling private data from transport stream packets
JP3957251B2 (ja) * 2000-03-02 2007-08-15 パイオニア株式会社 オーディオ情報再生システム、オーディオ情報再生装置及びオーディオ情報再生方法
JP2001344905A (ja) * 2000-05-26 2001-12-14 Fujitsu Ltd データ再生装置、その方法及び記録媒体
US6931371B2 (en) * 2000-08-25 2005-08-16 Matsushita Electric Industrial Co., Ltd. Digital interface device
US6804655B2 (en) * 2001-02-06 2004-10-12 Cirrus Logic, Inc. Systems and methods for transmitting bursty-asnychronous data over a synchronous link
US7161939B2 (en) * 2001-06-29 2007-01-09 Ip Unity Method and system for switching among independent packetized audio streams
DE60131551T2 (de) * 2001-12-12 2008-10-23 Alcatel Lucent Telekommunikationsnetzwerk und entsprechenden Paketkopf
US7191375B2 (en) * 2001-12-28 2007-03-13 Intel Corporation Method and apparatus for signaling an error condition to an agent not expecting a completion
US7596488B2 (en) * 2003-09-15 2009-09-29 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal

Also Published As

Publication number Publication date
JPWO2004077406A1 (ja) 2006-06-08
CN1757059A (zh) 2006-04-05
WO2004077406A1 (ja) 2004-09-10
CN100583239C (zh) 2010-01-20
US20060080094A1 (en) 2006-04-13
KR20060022637A (ko) 2006-03-10
US7653538B2 (en) 2010-01-26
US20100088103A1 (en) 2010-04-08

Similar Documents

Publication Publication Date Title
JP4354455B2 (ja) 再生装置および再生方法
JP5273858B2 (ja) データストリームおよびマルチチャネル表現を生成するための装置および方法
KR100695657B1 (ko) 기록 장치, 기록 방법, 재생 장치, 재생 방법 및 기록 매체
JP3052824B2 (ja) オーディオ再生時刻調整回路
JP2003244589A (ja) 時系列データ記録装置及び時系列データ記録方法
JP3763153B2 (ja) データ処理装置及びデータ処理方法
US6438172B1 (en) Transmitting and recording method, reproducing method, and reproducing apparatus of information and its recording medium
JP3558983B2 (ja) デジタル放送の記録再生装置
US8369456B2 (en) Data processing apparatus and method and encoding device
US20100286989A1 (en) Recording/reproduction device
US7149159B2 (en) Method and apparatus for editing data streams
US20070192089A1 (en) Apparatus and method for reproducing audio data
EP1594131A2 (en) Reproduction apparatus and reproduction method
JPWO2005093750A1 (ja) ディジタルダビング装置
US20020141596A1 (en) Method of and apparatus for decoding audio data
JP3939136B2 (ja) 音声再生回路、デコード回路、音声再生装置及び音声再生方法
JP2006236475A (ja) 符号化データ再生装置
JP2006157822A (ja) 再生装置および再生方法
KR100752874B1 (ko) 오디오 프레임의 복호 제어 방법
KR0177314B1 (ko) 엠펙시스템에서의 전송패킷 보호장치
JP2008226365A (ja) 音声再生装置及び音声再生方法
JPH09294077A (ja) 圧縮音声データ処理方法及びデータストリーム再生方法とそれらの装置
JP2023179125A (ja) デジタル音声信号同期装置及びプログラム
KR100220848B1 (ko) 디지탈 비디오 카메라의 오디오 채널 삽입 장치
JP2009134115A (ja) デコーダ

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061206

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090630

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090729

R150 Certificate of patent or registration of utility model

Ref document number: 4354455

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120807

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130807

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees