JP4354455B2

JP4354455B2 - 再生装置および再生方法

Info

Publication number: JP4354455B2
Application number: JP2005502921A
Authority: JP
Inventors: 大朗片山; 俊哉則竹; 和生藤本
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2003-02-28
Filing date: 2004-02-26
Publication date: 2009-10-28
Anticipated expiration: 2024-02-26
Also published as: JPWO2004077406A1; CN1757059A; WO2004077406A1; CN100583239C; US20060080094A1; KR20060022637A; US7653538B2; US20100088103A1

Description

本発明は、フレーム化されたオーディオ信号を復号し、再生するオーディオ再生装置であって、特に、編集や通信エラーによってオーディオ信号の途中に不連続点が存在する場合や、属性が変化する場合に異音を発生しないことを特徴とする再生装置および再生方法に関する。

近年、デジタル符号列として符号化されたオーディオ符号化信号を復号する再生装置やコンピュータプログラムとして具現化される再生方法が普及している。その多くの場合、ＭＰＥＧ規格（ＩＳＯ１１１７２−３、あるいは、ＩＳＯ１３８１８−３）に代表されるように、音声信号はオーディオ符号化信号としてフレーム化される。各フレームには信号の属性情報を含むプライベートヘッダが付加される。また、オーディオ符号化信号にはエラーチェックのためのＣＲＣのビットが付加され、伝送路におけるデータの欠落や誤りが復号時に検出できる。

伝送路におけるデータの欠落が大きく、データストリームが不連続になった場合、エラー訂正で回復することができない。かかる不連続箇所をそのまま音声出力すれば雑音が混じる。この雑音を消すため、ミュートを掛けることが望まれる。

従来の再生装置の一例が、例えば、特許文献１（特開２０００−２５９１９５号公報）に記載されている。この従来の再生装置は、不連続箇所を見つけるのではなく、送信側からの設定変更、例えばサンプリング周波数変更がストリームの途中にあった場合、かかる変更を検出し、変更後一定期間、音声出力にミュートをかけるものである。これは、変更があれば受信装置は、変更後の設定に自動調整する必要があり、自動調整する期間は雑音が出ない様、音声出力にミュートをかけるものである。この従来の装置は、正規のヘッダを検出し、ヘッダ解析手段によって解析された１つ前の正規のヘッダに書かれたサンプリング周波数と、現在復号処理をしようとしている現在の正規のヘッダに書かれたサンプリング周波数とを比較し、現在のヘッダに書かれたサンプリング周波数が変化した場合には、変化した後のフレームについて一定時間のミュートを施し異音の発生を防ぐものである。例えば、現在のヘッダに書かれたサンプリング周波数が変化した場合には、復号手段の後段に配置されるＤＡコンバータの設定の変更が必要となる。ＤＡコンバータの設定の変更がなされている間は、正しい音声信号が生成されないので、雑音を含む音声信号となる。そこでＤＡコンバータの設定の変更がなされる一定期間、出力音声をミュートする。従って、変更が書かれた現在のヘッダ以降のフレームについてミュートがなされる。

また、ヘッダの検出は、ヘッダと同期して設けられた同期語を検出することにより、行われる。

また、同期語については特許文献２（特開２０００−３１９４２号公報）に記載されている。

また、特許文献３（特開平１０−２０９８７６号公報）は、データ量の比較により、欠落データがある箇所を検出し、ミュート処理を行うものが開示されている。この特許文献３に記載されている従来のビットストリーム再生装置は、ＭＰＥＧ１あるいはＭＰＥＧ２オーディオ規格で符号化されたオーディオストリームを復号するものであって、ストリームの一部が何らかの原因で欠損した場合に、復号器のフレームバッファのアンダーフローを検出し、ミュートを行うものである。すなわち、同期語を検出して、正規のヘッダを見つけ、正規のヘッダと正規のヘッダの間のデータ量をカウンタで計測する。計測したデータ量Ｆが、あらかじめ決められたデータ量よりも小さい場合は、データの欠落があったものと判断してミュート処理を行うものである。

特開２０００−２５９１９５号公報特開２０００−３１９４２号公報特開平１０−２０９８７６号公報

本願発明で扱うエレメンタリストリームには、同期語が存在せず、かつ、ＣＲＣのようなエラーチェックのためのビットが存在しない。このようなエレメンタリストリームを扱う場合、どの様にして不連続個所をデコード前に見つけ、また、どのタイミングでミュートをかけるのかが、解決すべき課題となる。

上で説明した特許文献では、以下の問題がある。

特許文献１、２は、まず、正規のヘッダを検出し、正規のヘッダの情報を解析しているので、ヘッダとヘッダとの間に生じる不連続箇所を見つけることができない。

特許文献３も、まず、正規のヘッダを検出し、正規のヘッダと次の正規のヘッダとの間のデータ量を検出している。正規のヘッダは、同期語で見つけることができるが、同期語を有しないストリームを扱う本願発明では、連続した２つの正規のヘッダを見つけることができない。

また、特許文献１では、ミュートをかけるタイミングは、変更が検出されてから後のフレームである。従って、変更前に生じた不連続箇所のミュートを行うことはできない。

また、特許文献３では、ミュートをかけるタイミングが示されていない。

本発明に係る再生装置は、１つのフレームにオーディオ符号化信号と前記オーディオ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、同期語を含まない下位レイヤーの第２ストリームが、検出可能なヘッダ信号を含む上位レイヤーの第１ストリームに包含されるデータを受け、前記オーディオ符号化信号を復号して音声を出力する再生装置であって、前記第１ストリームを解析し、前記ヘッダ信号を検出すると共に、検出したヘッダ信号を基準に、前記第２ストリームを解析して前記オーディオ符号化信号と前記プライベートヘッダの位置情報を出力するストリーム解析手段と、前記ストリーム解析手段から出力される前記オーディオ符号化信号と前記プライベートヘッダとを一時保存するデコード前バッファメモリと、前記デコード前バッファメモリから入力される前記オーディオ符号化信号を復号し音声を出力する復号手段と、第１フレームのプライベートヘッダに含まれる属性情報を解析し、プライベートヘッダの後に続く前記オーディオ符号化信号のデータ長を表すデータ長情報を検出する第１ヘッダ解析手段と、第１フレームのプライベートヘッダの位置情報に、検出されたデータ長を加えて得た位置から後にある所定量の標的データを解析し、解析した標的データが、第２フレームのプライベートヘッダに含まれる属性情報であるか否かを判断する第２ヘッダ解析手段と、解析した標的データが、第２フレームのプライベートヘッダに含まれる属性情報でないと判断した場合は、少なくとも第１フレームのオーディオ符号化信号について前記復号手段からの音声出力を停止する制御手段を具備することを特徴とする再生装置で構成される。

また、本発明に係る再生装置において、前記第２ヘッダ解析手段は、前記標的データの少なくとも１部が、前記第１ヘッダ解析手段で解析された属性情報の少なくとも１部と一致するか否かを判断することを特徴とする構成でもよい。

また、本発明に係る再生装置において、前記第２ヘッダ解析手段は、前記標的データの少なくとも１部が、あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致するか否かを判断することを特徴とする構成でもよい。

また、本発明に係る再生装置において、前記属性情報は、前記オーディオ符号化信号のサンプリング周波数、チャンネル情報、サンプルビット長、オーディオ符号化信号のデータ長の少なくとも一つであることを特徴とする構成でもよい。

また、本発明に係る再生装置において、前記ストリーム解析手段は、前記ヘッダ信号に含まれる前記フレームの長さを表すフレーム長データを検出し、前記ヘッダ信号に続く１フレームのデータが、検出したフレーム長データと等しくない場合は、前記フレームを破棄し、次のフレームの解析を行うことを特徴とする構成でもよい。

また、本発明に係る再生装置は、前記第１ストリームは複数のパケットで構成され、前記ストリーム解析手段は、前記ヘッダ信号に含まれる前記パケットの長さを表すパケット長データを検出し、検出した１パケットの長さが、検出したパケット長データと等しくない場合は、前記パケットを破棄し、次のパケットの解析を行うことを特徴とする構成でもよい。

また、本発明に係る再生装置において、前記第１ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析手段は、不連続点明示パケットを検出し、前記デコード前バッファに出力した、不連続点明示パケット前のデータ量があらかじめ定義された所定のデータ量あるいはその整数倍に満たない場合には、前記デコード前バッファに対して不足分の補完データを出力することを特徴とする構成でもよい。

また、本発明に係る再生装置において、前記第１ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析手段は、検出したヘッダ信号から不連続明示パケットまでをカウントするカウンタを備え、更にカウントした点におけるアドレスを計算して保持するアドレス記憶手段を設け、前記制御手段は、計算したアドレスに、次のプライベートヘッダが位置するように読み出しポインタを移動することを特徴とする構成でもよい。

また、本発明に係る再生装置において、前記デコード前バッファメモリと復号手段の間に、遅延手段を設けたことを特徴とする構成でもよい。

また、本発明に係る再生方法は、１つのフレームにオーディオ符号化信号と前記オーディオ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、同期語を含まない下位レイヤーの第２ストリームが、検出可能なヘッダ信号を含む上位レイヤーの第１ストリームに包含されるデータを受け、前記オーディオ符号化信号を復号して音声を出力する再生方法であって、前記第１ストリームを解析し、前記ヘッダ信号を検出すると共に、検出したヘッダ信号を基準に、前記第２ストリームを解析して前記オーディオ符号化信号と前記プライベートヘッダの位置情報を出力するストリーム解析ステップと、前記ストリーム解析ステップから出力される前記オーディオ符号化信号と前記プライベートヘッダとを一時保存するステップと、前記保持されたオーディオ符号化信号を復号し音声を出力する復号ステップと、第１フレームのプライベートヘッダに含まれる属性情報を解析し、プライベートヘッダの後に続く前記オーディオ符号化信号のデータ長を表すデータ長情報を検出する第１ヘッダ解析ステップと、第１フレームのプライベートヘッダの位置情報に、検出されたデータ長を加えて得た位置から後にある所定量の標的データを解析し、解析した標的データが、第２フレームのプライベートヘッダに含まれる属性情報であるか否かを判断する第２ヘッダ解析ステップと、解析した標的データが、第２フレームのプライベートヘッダに含まれる属性情報でないと判断した場合は、少なくとも第１フレームのオーディオ符号化信号について前記復号ステップからの音声出力を停止する制御ステップを具備することを特徴とする。

また、本発明に係る再生方法において、前記第２ヘッダ解析ステップは、前記標的データの少なくとも１部が、前記第１ヘッダ解析ステップで解析された属性情報の少なくとも１部と一致するか否かを判断することを特徴とする。

また、本発明に係る再生方法において、前記第２ヘッダ解析ステップは、前記標的データの少なくとも１部が、あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致するか否かを判断することを特徴とする。

また、本発明に係る再生方法において、前記属性情報は、前記オーディオ符号化信号のサンプリング周波数、チャンネル情報、サンプルビット長、オーディオ符号化信号のデータ長の少なくとも一つであることを特徴とする。

また、本発明に係る再生方法において、前記ストリーム解析ステップは、前記ヘッダ信号に含まれる前記フレームの長さを表すフレーム長データを検出し、前記ヘッダ信号に続く１フレームのデータが、検出したフレーム長データと等しくない場合は、前記フレームを破棄し、次のフレームの解析を行うことを特徴とする。

また、本発明に係る再生方法において、前記第１ストリームは、複数のパケットで構成され、前記ストリーム解析ステップは、前記ヘッダ信号に含まれる前記パケットの長さを表すパケット長データを検出し、検出した１パケットの長さが、検出したパケット長データと等しくない場合は、前記パケットを破棄し、次のパケットの解析を行うことを特徴とする。

また、本発明に係る再生方法において、前記第１ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析ステップは、不連続点明示パケットを検出し、前記保持した不連続点明示パケット前のデータ量が、あらかじめ定義された所定のデータ量あるいはその整数倍に満たない場合には、前記デコード前バッファに対して不足分の補完データを出力することを特徴とする。

また、本発明に係る再生方法において、前記第１ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析ステップは、検出したヘッダ信号から不連続明示パケットまでをカウントし、更にカウントした点におけるアドレスを計算して保持するアドレス記憶ステップを設け、前記制御ステップは、計算したアドレスに、次のプライベートヘッダが位置するように読み出しポインタを移動することを特徴とする。

また、本発明に係る再生方法において、前記保持するステップと復号ステップとの間に、オーディオ符号化信号を遅延する遅延ステップを設けたことを特徴とする。

また、本発明は、上記再生方法を、コンピュータで実行させるためのプログラムである。

また、本発明は、上記再生方法を、コンピュータで実行させるためのプログラムを記録した、コンピュータ読み取り可能な記録媒体である。

本発明にかかる再生装置は、エレメンタリストリームに同期語やＣＲＣのビットが存在しないオーディオストリームの復号時に、編集による不連続点や伝送路のエラーによるデータの欠落があったとしても、異音を発生することなく音声の出力をすることが可能となる。

本発明の第１の実施の形態について、図１、図２Ａ、図２Ｂ、図３、図４、図５Ａ、図５Ｂを用いて説明する。

図１は、本実施の形態の再生装置１０１を表わすブロック図である。また、図２Ａ、図２Ｂは、本実施の形態の再生方法の各ステップを表わすフローチャートである。また、図３は入力されるストリームの構造を示す図であり、ＭＰＥＧ規格におけるトランスポートストリームとＰＥＳパケットと、本発明によって異音発生防止の効果が期待されるエレメンタリストリームの構成を示す。図４は、図３で説明しているトランスポートストリームがトランスポートパケット単位で編集され、不完全なＰＥＳパケットを含む場合を示す図である。

まず、送信側において、トランスポートストリーム３０１が生成される過程を簡単に説明する。オーディオ信号は、所定の符号化技術により、オーディオ符号化信号３０８に変換され、所定のバイト数毎（９６０バイト毎、または１４４０バイト毎）に切断され、切断片の先頭に４バイトのプライベートヘッダ３０７が付与される。そのオーディオ符号化信号は、圧縮処理されていないＰＣＭデータであるものとする。切断されたオーディオ符号化信号３０８のそれぞれは、およそ５ｍｓｅｃの長さのオーディオ信号が含まれる。プライベートヘッダ３０７は、オーディオ符号化信号３０８の属性情報を含み、かつ、同期語を持たない。プライベートヘッダ３０７とそれに続くオーディオ符号化信号３０８を合わせてオーディオの１フレームとし、このようなフレームが連続して送られてくるストリームをエレメンタリストリーム３０６と言う。属性情報には、例えば、サンプリング周波数、チャンネルアサイン、サンプルのビット長、オーディオ符号化信号３０８のデータ長の情報が含まれる。これらの属性情報は、属性（サンプリング周波数、チャンネルアサイン情報、サンプルのビット長、オーディオ符号化信号３０８のデータ長）が変わらない限り、変わらない。従って、属性情報が変わらない限り、ｎ番目（ｎは、正の整数）のフレームのプライベートヘッダ３０７と、（ｎ＋１）番目のフレームのプライベートヘッダ３０７は、同じである。通常は、属性情報はほとんど変わることがない。放送システムが変わる場合、または、光ディスクに記録された音声トラックが変わる場合、変わることがある。また、属性情報の中には、変わる頻度が少ない（ゼロを含む）ものと、多いものがある。たとえ変わる場合であっても、予め決められた複数の選択肢のひとつに変わる。例えば、オーディオ符号化信号３０８のデータ長は、予め決められた選択肢である、９６０バイトや１４４０バイトのひとつに変わる。

この様にして作られたエレメンタリストリーム３０６は、１フレーム毎に分けられ、９６４バイトまたは１４４４バイト長のＰＥＳペイロード３０５として扱われる。各ＰＥＳペイロード３０５にはＰＥＳヘッダ３０４が加えられ、一つのＰＥＳパケット３０３が作られる。ＰＥＳパケット３０３は、所定長毎（例えば１８８バイト長毎または１８４バイト長毎）に切断され、切断片は、一つのオーディオトランスポートパケット３０２として扱われる。オーディオトランスポートパケット３０２は、ビデオトランスポートパケットなどのその他のトランスポートパケットと混在して連結され、トランスポートストリーム３０１が生成される。トランスポートストリーム３０１は、送信局から放送される。受信器は、トランスポートストリーム３０１を受信し、オーディオ再生装置１０１で音声の再生を行う。受信したトランスポートストリーム３０１は、直接オーディオ再生装置１０１に送られても良いし、一時的にどこかに記録し、記録されたトランスポートストリーム３０１をオーディオ再生装置１０１に送る様にしても良い。後者の場合として、トランスポートストリームの形式で記録再生装置により記録された音声が、再生のために再生装置１０１に送られてくる場合や、トランスポートストリームの形式でディスク（例えばＤＶＤ）に記録された商用コンテンツが、再生のために再生装置１０１に送られてくる場合がある。

以上より明らかなように、本発明においては、１つのフレームにオーディオ符号化信号とオーディオ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、同期語を含まない下位レイヤーの第２ストリーム（エレメンタリストリーム）が、検出可能なヘッダ信号（ＰＥＳヘッダ）を含む上位レイヤーの第１ストリーム（ＰＥＳパケットで構成されるストリーム）に包含される構造のデータを処理する。

受信したストリームは、不連続検出部１００において、ストリームの中のパケットまたはパケットの一部に不連続がないかどうか、すなわちデータの一部が欠落していないかどうかの検出がなされ、不連続が検出されれば、不連続明示パケット４０１が挿入される。

オーディオ再生装置１０１は、オーディオのトランスポートパケット３０２を含むトランスポートストリーム３０１が入力され、復号され、音声信号を出力するものである。再生装置１０１に入ったトランスポートストリーム３０１は、ストリーム解析手段１０２に入力される（Ｓ２０１）。ストリーム解析手段１０２はトランスポートストリーム３０１を解析し、オーディオのトランスポートパケット３０２を抜き出してオーディオＰＥＳパケット３０３を構成し、さらにオーディオＰＥＳパケット３０３を解析する（Ｓ２０２）。

図３に示すように、ストリーム解析手段１０２は、トランスポートパケットの内、オーディオトランスポートパケット３０２のみを抽出し、ＰＥＳパケット３０３のストリームを作る。ＰＥＳヘッダ３０４にはＰＥＳペイロード３０５のデータ長が含まれている。ストリーム解析手段１０２は、ＰＥＳヘッダ３０４が検出されれば、ＰＥＳヘッダ直後から、すなわち、ＰＥＳペイロードの先頭からカウントを開始し、次のパケット（ＰＥＳパケットまたは後で説明する不連続点明示パケット）が見つかればカウントを終了する。データに不連続がなければ、カウント値は、ＰＥＳペイロード３０５のデータ長に等しい。カウント値を、ＰＥＳヘッダに含まれていたデータ長と比較し、カウント値があらかじめ定義された正規の値と一致するかを判断する（Ｓ２０３）。一致しない場合、すなわち前記値が不正である場合（Ｓ２０３の不正）には現在解析しているＰＥＳパケットを破棄し、次のＰＥＳパケットの解析に移る。前記ＰＥＳペイロードのデータ長とは、あらかじめ規格で定義された数種類の長さのいずれかであり、例えば、９６４バイト、１４４４バイトのいずれかである。

一方、前記値が正規である場合（Ｓ２０３の正規）には、ＰＥＳペイロード３０５からプライベートヘッダ３０７およびオーディオ符号化信号３０８を抽出し、デコード前バッファメモリ１０３に格納する（Ｓ２０４）。ここでＰＥＳペイロード３０５はオーディオのエレメンタリストリーム３０６とも呼ぶ。また、プライベートヘッダ３０７はオーディオ符号化信号３０８の属性情報を含み、かつ、同期語を持たないものである。プライベートヘッダ３０７の検出は、たとえばＰＥＳヘッダ３０４の検出から、所定時間の遅延により検出する。図３に示す例にあっては、プライベートヘッダ３０７は、ＰＥＳヘッダ３０４の直後に位置している場合を示しているが、プライベートヘッダ３０７は、ＰＥＳヘッダ３０４の終端から所定量後に位置するように配置することも可能である。この場合は、ＰＥＳヘッダに、所定量の情報を持たすようにすればよい。

以上より明らかなように、ストリーム解析手段１０２は、第１ストリームであるＰＥＳパケットを含むストリームを解析し、ヘッダ信号すなわちＰＥＳヘッダを検出すると共に、検出したヘッダ信号を基準に、第２ストリームであるエレメンタリストリームを解析して前記オーディオ符号化信号と前記プライベートヘッダの位置情報を出力することを目的とするものである。

ここで、オーディオ再生装置１０１に入力されるのはトランスポートストリーム３０１であるとしたが、これに限るものではなく、オーディオＰＥＳパケット３０３が入力されてもよい。その場合も、ストリーム解析手段１０２はエレメンタリストリーム３０６であるところのプライベートヘッダ３０７とオーディオ符号化信号３０８をデコード前バッファメモリ１０３に格納する。なお、図２Ａにおいては、フローを見やすくするために、トランスポートストリーム３０１の解析とＰＥＳパケット３０３の解析を１つのステップＳ２０２で表わしている。

デコード前バッファメモリ１０３から出力されるオーディオ符号化信号３０８は、第１ヘッダ解析手段１０５、第２ヘッダ解析手段、フレーム遅延手段１１１に入力される。フレーム遅延手段１１１は、送られてきたオーディオ符号化信号３０８を少なくとも１フレーム遅延させ、復号手段１０４に送る。

第１のヘッダ解析手段１０５はデコード前バッファメモリ１０３に格納された第１のフレームのプライベートヘッダ３０７を検出し、読込み、プライベートヘッダ３０７に含まれる情報を解析して制御手段１０７に出力する（Ｓ２０５）。プライベートヘッダ３０７の検出は、たとえばストリーム解析手段１０２で検出したＰＥＳヘッダ３０４のタイミングから、所定時間後のタイミングで行う。プライベートヘッダ３０７に含まれる情報とは、オーディオ符号化信号の属性情報であり、例えば、サンプリング周波数とチャンネルアサイン情報とサンプルのビット長とオーディオ符号化信号３０８のデータ長である。属性情報の一部あるいは全部が、制御手段１０７に出力される。

第１ヘッダ解析手段１０５は、ｎ番目のプライベートヘッダ３０７（４バイト）を検出し、検出したｎ番目のプライベートヘッダ３０７を制御手段１０７に送る。制御手段１０７は、ｎ番目のプライベートヘッダ３０７の情報（サンプリング周波数、チャンネルアサイン情報、サンプルのビット長、オーディオ符号化信号３０８のデータ長）の全てまたは一部をプライベートヘッダメモリ１１０に保持する。更に、第１ヘッダ解析手段１０５は、検出したｎ番目のプライベートヘッダ３０７の先頭から１フレームに相当する時間Ｔｆをカウントし、トリガ信号を第２ヘッダ解析手段１０６に送る。なお、１個のフレームの代わりに、ｍ個（ｍは１より大きい正の整数）のフレームをカウントしてトリガ信号を出力するようにしてもよい。時間Ｔｆは、属性情報のひとつであるオーディオ符号化信号３０８のデータ長にプライベートヘッダ長（４バイト）を加算すれば求まる。ここでのカウントは、プライベートヘッダ３０７の終端からオーディオ符号化信号３０８のデータ長をカウントしてもよい。

以上より明らかなように、第１ヘッダ解析手段１０５は、第１フレームのプライベートヘッダに含まれる属性情報を解析し、プライベートヘッダの後に続くオーディオ符号化信号のデータ長を表すデータ長情報を検出することを目的とするものである。

第２ヘッダ解析手段１０６は、トリガ信号に応答して、デコード前バッファメモリ１０３から出力されるエレメンタリストリームの一部のデータ（４バイト）、すなわち標的データを読み取る。オーディオ符号化信号に不連続がなければ、読み取った標的データは、（ｎ＋１）番目のプライベートヘッダに相当する。ｎ番目のフレームデータに不連続があれば、読み取った標的データは、（ｎ＋１）番目のプライベートヘッダではないので、（ｎ＋１）番目のプライベートヘッダを正しく読み取れない。

第２ヘッダ解析手段１０６は、読み取った４バイトの標的データと、プライベートヘッダメモリ１１０に保持したプライベートヘッダを比較し、同じであれば、（ｎ＋１）番目のプライベートヘッダが正しい位置に存在していると判断し、すなわちｎ番目のフレームが過不足なく存在すると判断する。この判断に基づき、制御手段１０７は、音声のデコードを行う。

ところが、第２ヘッダ解析手段１０６は、標的データが、プライベートヘッダメモリ１１０に保持したプライベートヘッダと一致しなければ、（ｎ＋１）番目のプライベートヘッダが正しい位置に存在していないと判断し、この場合はオーディオ符号化信号に不連続があり、音声データが欠落していると判断される。この場合、制御手段１０７は、ｎ番目のプライベートヘッダに続くオーディオ符号化信号をミュートするため、復号手段１０４に対し、ミュート信号を出力する。フレーム遅延手段１１１を設けたので、ミュート信号が出力される時点は、復号手段１０４により、ｎ番目のプライベートヘッダに続くオーディオ符号化信号について、音声出力がなされる直前となる。したがって、復号手段１０４は、ｎ番目のプライベートヘッダに続くオーディオ符号化信号をミュートし、音声出力を停止するように指示する。ミュート信号は、１フレーム期間をミュートする信号となっている。従って、（ｎ＋１）番目のプライベートヘッダに続くオーディオ符号化信号から音声の再生出力を行う。

以上より明らかなように、第２ヘッダ解析手段１０６は、第１フレームのプライベートヘッダの位置情報に、検出されたデータ長を加えて得た位置から後にある所定量の標的データを解析し、解析した標的データが、第２フレームのプライベートヘッダに含まれる属性情報であるか否かを判断することを目的とする。

なお、標的データが、第２フレームのプライベートヘッダに含まれる属性情報であるか否かの判断は、標的データの少なくとも１部が、第１ヘッダ解析手段１０５で解析された属性情報の少なくとも１部と一致するか否かを判断するようにしてもよい。

ここで、ミュート信号は、複数フレーム期間、例えば２フレーム期間をミュートする信号であっても良い。２フレーム期間をミュートする信号であれば、（ｎ＋１）番目のプライベートヘッダに続くオーディオ符号化信号もミュートし、音声出力を停止するように指示し、（ｎ＋２）番目のプライベートヘッダに続くオーディオ符号化信号から音声の再生出力を行うこととなる。また、プライベートヘッダメモリ１１０は、第１ヘッダ解析手段１０５に設けるようにしてもよい。

言うまでもなく、第１ヘッダ解析手段１０５の代わりに、制御手段１０７がアドレスの算出を行ってもよい。

第２のヘッダ解析手段１０６は第１のヘッダ解析手段１０５と同様にプライベートヘッダ３０７を解析してそこに含まれる情報を制御手段１０７に出力するものである（Ｓ２０７）。第２のヘッダ解析手段１０６が第１のヘッダ解析手段１０５と異なるのは、第１ヘッダ解析手段１０５からのトリガ信号によって、データの読み取りがなされる点と、第１のヘッダ解析手段１０５が解析したプライベートヘッダよりも後の時刻のフレーム、例えば、次のフレームのプライベートヘッダを解析する点である。つまり、後述する復号手段１０４で復号する現フレームの次のフレームのプライベートヘッダを解析する。

復号手段１０４は、デコード前バッファメモリ１０３から出力され、一定時間遅延されたオーディオ符号化信号３０８を読み出し、音声を出力するものである（Ｓ２０９）。復号手段１０４は制御手段１０７によって、復号の開始や停止、あるいは、ミュート処理など音声の出力に関わる制御を受ける。

制御手段１０７は、第１のヘッダ解析手段１０５および第２のヘッダ解析手段１０６より、現フレームおよび次フレームのプライベートヘッダに含まれる情報をそれぞれ受け取り、それらの情報を互いに比較し（Ｓ２０８）、異なるものがあれば復号手段１０４にミュートを指示する（Ｓ２１０）。

なお、本実施の形態における再生装置および再生方法は、第１のフレームのオーディオ信号を出力した後、次のフレームの復号を行うために、デコード前バッファメモリにオーディオ符号化信号の１フレームよりも充分に多い所定量のデータがたまっているかを判定し（Ｓ２１１）、たまっていれば第１のヘッダ解析手段１０５による第１のフレームの属性情報の解析（Ｓ２０５）の処理へ戻り、復号を続ける。デコード前バッファメモリに所定量のデータがたまっていない場合には、外部からストリームを入力し（Ｓ２０１）、上述したストリーム解析手段１０２によるストリームの解析（Ｓ２０２）以後の処理を行う。

さて、トランスポートストリーム３０１がトランスポートパケット単位で編集された場合について、図４を参照しながら説明する。オーディオ再生装置１０１に入力されるトランスポートストリームの編集などによって不連続が生じた場合には、不連続検出部１００において、不連続点が検出された箇所に不連続点明示パケット４０１が挿入される。ストリーム解析手段１０２は前述したように入力されたストリームを解析し（Ｓ２０２）、オーディオのエレメンタリストリームをデコード前バッファメモリ１０３に格納する（Ｓ２０４）。ここで、不連続点明示パケット４０１があれば、ストリームから抽出されたオーディオ符号化信号は、データの後半部分が欠落した不完全なオーディオ符号化信号４０３となる。第１ヘッダ解析手段１０５は、現プライベートヘッダの終端位置のアドレスに、第１ヘッダ解析手段１０５に含まれる本来のオーディオ符号化信号のデータ長を加算してアドレスＢ（４０７）を算出する（Ｓ２０６）。不完全なオーディオ符号化信号４０３が存在するため、このアドレスＢは、実際の次プライベートヘッダのアドレスであるアドレスＡ（４０６）よりも先に進んだ点になる。第１ヘッダ解析手段１０５は、アドレスＢのタイミングでトリガ信号を生成する。第２ヘッダ解析手段１０６は、トリガ信号に応答してアドレスＢの時点から所定量（４バイト）のデータを読み取り、次プライベートヘッダであると予測して、プライベートヘッダ解析の処理を行う（Ｓ２０７）。アドレスＢから所定量に格納されているのはオーディオ符号化信号の一部あるいはプライベートヘッダの一部とオーディオ符号化信号の一部のデータであるので、正しい解析を行うことができない。したがって、第２ヘッダ解析手段１０６の解析結果の情報は、第１ヘッダ解析手段１０５で取得し、プライベートヘッダメモリ１１０で保持された属性情報と一致せず、不一致情報が生成される。オーディオ符号化信号がＰＣＭデータであれば、偶然に第１のフレームのプライベートヘッダに一致する可能性があるが、その可能性は極めて低い。

生成された不一致情報に基づき、現プライベートヘッダ４０４に関連する現フレームを復号手段１０４から出音する前にミュートする（Ｓ２１０）。これにより、不完全なオーディオ符号化信号４０３と、必要であればそれに続く次のフレームのオーディオ符号化信号を復号および出力せず、異音の発生を防ぐことが可能となる。

なお、制御手段１０７による別の判定方法について、図５Ａ、図５Ｂを用いて説明する。プライベートヘッダメモリ１１０は、検出したプライベートヘッダに含まれる属性情報（サンプリング周波数、チャンネルアサイン情報、サンプルのビット長、オーディオ符号化信号３０８のデータ長）を保持するのではなく、変形も含めた選択可能な属性情報群のすべてをあらかじめ保持する。すなわち、プライベートヘッダメモリ１１０は、たとえば次の表１の情報を記録する。
表１

実際に、プライベートヘッダに含まれている情報は、ａの列からひとつ、ｂの列からひとつ、ｃの列からひとつ、ｄの列からひとつの情報であり、たとえば、（ａ２，ｂ１，ｃ１，ｄ２）の情報を含んでいる。

制御手段１０７は、現プライベートヘッダで検出した属性情報と、プライベートヘッダメモリ１１０にあらかじめ保持された属性情報群（表１のデータ）とを比較し、メモリ１１０に、検出した属性情報と一致する情報が含まれているかどうかを判定する（Ｓ５０７）。すなわち、検出した属性情報（ａ２，ｂ１，ｃ１，ｄ２）の全てがメモリ１１０に保持された属性情報群の中に含まれていれば、全て正規の情報であると判断する一方、検出した属性情報（ｘｘ，ｂ１，ｃ１，ｄ２）（ここでｘｘは分析不能な情報を示す）のいずれかひとつに、メモリ１１０に保持された属性情報群に含まれていないものがあれば、プライベートヘッダは不正な情報であると判断する。

次に、現プライベートヘッダの終端からオーディオ符号化信号３０８のデータ長後にある４バイトの標的データ、すなわち次プライベートヘッダがあるべき箇所から検出した属性情報と、あらかじめ保持された属性情報とを比較し、上述と同様の判定をする（Ｓ５０８）。２つの検出した属性情報のいずれも、あらかじめ保持された属性情報と一致する情報が含まれている場合はオーディオを再生する（Ｓ５０９）一方、２つの検出された属性情報のいずれかに、あらかじめ保持された属性情報と一致しない情報が含まれている場合には復号手段１０４にミュートを指示する（Ｓ５１０）。なお、図５Ａではフローを見やすくするために、図２Ａを用いて説明したＰＥＳペイロード長が正規であるか否かの判定ステップ（Ｓ２０３）を省略しているが、ストリーム解析（Ｓ５０２）の後で同様の判定を行っても良いのは言うまでも無い。また、ミュートを行うべきかどうかは、次プライベートヘッダが正しい位置にあるかどうかを判断すればよいので、判定ステップＳ５０７を省略し、次プライベートヘッダについてのみ、属性情報を検出し、あらかじめ保持された属性情報と一致する情報が含まれているかどうかを判定する（Ｓ５０８）ようにしてもよい。現プライベートヘッダを検出し、解析するのは、次プライベートヘッダまでカウントするための起算点と、次プライベートヘッダまでの間隔とを得るためである。また、次プライベートヘッダを解析するのは、次プライベートヘッダであるとして検出したデータが、正規のプライベートヘッダであるかどうかの判断をするためである。

以上より明らかなように、第２ヘッダ解析手段は、標的データが、第２フレームのプライベートヘッダに含まれる属性情報であるか否かの判断を行うが、この判断は、前記標的データの少なくとも１部が、あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致するか否かの判断を行うようにしてもよい。

表１に示す属性情報群をあらかじめ保持しておけば、属性情報が許容された範囲内で変更された場合、誤った属性情報であるとの判断を避けることができる。

なお、一般にフレーム化されたオーディオストリームのプライベートヘッダ３０７はその後に続くオーディオ符号化信号３０８の属性情報を含むものであるので、ストリームの最終フレームにおいては、第２のヘッダ解析手段で解析すべきデータが存在しない場合がある。

このような場合には、ストリーム解析手段１０２がストリームの終端にあらかじめ定義された特定のダミーデータ、たとえば表１の代表的な属性情報の組み合わせ（ａ１，ｂ１，ｃ１，ｄ１）を付加する。制御手段１０７は、第２のヘッダ解析手段１０６によって取得した次フレームの属性情報が全て前記あらかじめ定義されたビット列に一致すれば復号手段１０４に対してミュートの指示をしないということにすればよい。これは、入力されるストリームの終端において、第２のヘッダ解析手段１０６が解析すべきアドレスにデータが存在せず、復号手段がデコード前バッファメモリ１０３からデータを読み出す際にアンダーフローが発生した場合、第２のヘッダ解析手段１０６が何ら情報を取得できなくなるのを回避するために有効な制御である。つまり、ストリーム解析手段１０２が、あらかじめ定義された正規の属性情報で構成されるプライベートヘッダを付加することにより、アンダーフローを回避し、最終フレームを復号処理して出力することが可能となる。あらかじめ定義された属性情報とは、例えば、サンプリング周波数は４８ｋＨｚのみ、また、サンプルのビット長は１６ビット、２０ビットあるいは２４ビットのいずれか、また、チャンネルアサイン情報とはモノラル、デュアルモノラルあるいはステレオのいずれか、また、オーディオ符号化信号のデータ長は９６０バイトあるいは１４４０バイトのいずれかであるというようなものであり、また、終端に付加される特定のビット列とは、以上の属性情報を表わすビット列と異なるものを定義すればよい。また、終端に付加する特定のビット列は、前記あらかじめ定義された正規の属性情報で構成されていても良い。

以上により、本実施の形態では、第１のフレームのプライベートヘッダと第２のフレームのプライベートヘッダの間のデータである第１のフレームのオーディオ符号化信号の一部がストリームの転送エラーなどにより欠損している場合においても、第１のフレームのオーディオ符号化信号をミュートすることにより、異音の発生を防止することが可能となる。

次に、本発明の第２の実施の形態について、図６および図７Ａ、図７Ｂを用いて説明する。

第２の実施の形態が第１の実施の形態と異なるのは、パケット長カウント手段６０８を備えている点である。パケット長カウント手段６０８は、デコード前バッファメモリ１０３に格納するデータ量を逐次カウントし（Ｓ７０５）、カウントしたＰＥＳペイロードのデータ量が第１の所定の長さに満たない場合（Ｓ７０６のＮ）にはストリーム入力（Ｓ７０１）のステップへ戻る。第２の実施の形態では、トランスポートストリームＴＳおよびＰＥＳヘッダの解析（Ｓ７０２）後に不連続点明示パケットがあるかどうかを判定する（Ｓ７０３）。不連続点明示パケットがあった場合（Ｓ７０３のＹ）、デコード前バッファ１０３へのエレメンタリストリームの格納量が第２の所定の長さの整数倍であるかを判定する（Ｓ７０７）。整数倍でない場合には整数倍になるように特定の長さの補完データをデコード前バッファに格納し（Ｓ７０８）、パケット長カウント手段をリセットし（Ｓ７１６）、ストリーム入力ステップ（７０１）へ戻る。不連続点明示パケットがなかった場合（Ｓ７０３のＮ）、デコード前バッファ１０３へのエレメンタリストリームの格納が行われ（Ｓ７０４）、パケット長カウント手段６０８は、格納したデータ量をカウントする（Ｓ７０５）。

パケット長カウント手段６０８は、ストリーム解析手段１０２がオーディオのＰＥＳパケットのヘッダ（以下、ＰＥＳヘッダ）を検出し（Ｓ７０２）、次のＰＥＳヘッダを検出するまでデコード前バッファメモリ１０３に格納するデータ量、すなわちＰＥＳペイロード長をカウントする（Ｓ７０５）。

ストリーム解析手段１０２は、トランスポートストリームＴＳまたはＰＥＳヘッダの解析中に不連続点明示パケットを検出し（Ｓ７０３のＹ）、その時点でデコード前バッファ１０３へのデータ格納量が第２の所定の長さの整数倍になっているかどうかを判定する（Ｓ７０７）。前記判定（Ｓ７０７）が偽の場合、デコード前バッファ１０３へのデータ格納量が第２の所定の長さの整数倍となるように補完データをデコード前バッファに格納する（Ｓ７０８）。次に、パケット長カウント手段６０８のカウンタはリセットされ（Ｓ７１６）、ストリーム入力（Ｓ７０１）へと処理が戻る。また、ストリーム入力（Ｓ７０１）へ処理が戻る際に、デコード前バッファメモリ１０３における、第１のヘッダ解析手段１０５の読出しアドレスを、前記補完データを格納したアドレスの次のアドレス、すなわち、不連続点明示パケット後のデータの先頭が格納されるアドレスへ移動する。

ここで、あらかじめ定義された第１の所定の長さとは、たとえば、４バイトの第１のプライベートヘッダと、９６０バイトまたは１４４０バイトのオーディオ符号化信号と、４バイトの第２のプライベートヘッダによって構成されるデータ量であり、すなわち、９６８バイトまたは１４４８バイトである。

また、第２の所定の長さとは、第１のヘッダ解析手段１０５、第２のヘッダ解析手段１０６および複合手段１０４がデコード前バッファメモリ１０３に格納されているデータを読み出す際にアクセスできるデータの最小単位（通称：ワード）のことであり、たとえば４バイトである。

デコード前バッファメモリ１０３から出力されるエレメンタリストリームは、上述と同様にして第１ヘッダ解析手段１０５で解析され（Ｓ７０９）、第２ヘッダの位置が算出される（Ｓ７１０）、第２ヘッダの位置にある標的データ（第２ヘッダであると予測されるデータ）が解析される（Ｓ７１１）。解析された標的データの内容が、第１ヘッダの内容と比較され、一致するかどうかの判断がなされる（Ｓ７１２）。同一であれば、標的データの内容が、正規の第２ヘッダであると判断され、オーディオ再生がなされる（Ｓ７１３）。第２ヘッダの内容が１箇所でも、第１ヘッダの内容と異なっていれば、標的データの内容は、正規の第２ヘッダではない、すなわち、第２ヘッダの位置が算出した位置とズレた位置にあると判断され、第１の実施の形態と同様にして、第１ヘッダの後の続くオーディオ符号化信号についてミュート処理を行う（Ｓ７１４）。その後、デコード前バッファメモリ１０３に所定量（第１の所定の長さ以上）のデータが格納されているかどうかが判断され（Ｓ７１５）、格納されていればステップＳ７０９に戻り、格納されていなければステップＳ７０１に戻る。

ステップＳ７１２での判断は、解析した標的データの内容と、解析された第１ヘッダの内容とが比較され、一致するかどうかの判断がなされたが、解析した標的データの内容と、あらかじめ保持された表１の内容と比較する様にしても良い。

これにより、トランスポートパケット単位でストリームが編集された場合においても、後半のデータが欠落したＰＥＳペイロードすなわち不完全なオーディオのプライベートヘッダおよびオーディオ符号化信号がデコードされることが無いので、編集点前の不完全なオーディオ符号化信号およびそれに続くデータが復号手段１０４に入力されて異音を発生することを防ぐことが可能となる。

なお、不完全なオーディオ符号化信号が復号手段１０４によって復号されないのであれば、第２のヘッダ解析手段１０６による次フレームのヘッダ解析（Ｓ７１１）および制御手段１０７における次フレームの属性情報の確認（Ｓ７１２）は本来必要無いが、現実においては、ストリーム解析手段１０２とデコード前バッファメモリ１０３の間のデータ転送におけるデータの欠落を検出したり、その他の要因で元々不正なオーディオ符号化信号が正しいパケット長でＰＥＳ化されて入力されるような場合にも異音発生を防止するために、第２のヘッダ解析手段１０６を実装する。

また、第２の実施の形態におけるストリーム解析手段１０２の別の制御として、ストリーム解析手段１０２は、パケット長カウント手段６０８によってカウントされたパケット長が、特定のデータ長の整数倍にならない場合（Ｓ７０７のＮ）には、特定のデータ長の整数倍になるよう不足分のデータを付加する（Ｓ７０８）ことによってワードアライメントを行い、それをデコード前バッファメモリ１０３に格納する。一般に、復号手段１０４および第１のヘッダ解析手段１０５および第２のヘッダ解析手段１０６がデコード前バッファメモリ１０３からデータを読み出す際には、あらかじめ決められたワード単位で読み出すこととなる。例えば、４バイトを１ワードとしてデータを読み出す。

トランスポートパケット単位の編集が行われた場合、一般に、編集点のアドレスは４バイト単位ではなく、編集点後のフレームはその後ワードアラインされないままデコード前バッファメモリに格納される。この場合、第１のヘッダ解析手段１０５および第２のヘッダ解析手段１０６が読み出す編集点後のプライベートヘッダ近傍のデータは１乃至３バイトずれ、制御手段１０７は正しい属性情報を取得できなくなってしまう。なぜなら、本実施の形態において対象としているエレメンタリデータには同期語が存在しないため、この１乃至３バイトのデータのずれを第１のヘッダ解析手段１０５あるいは第２のヘッダ解析手段１０６が検出して読み出し位置を修正することは不可能だからである。よって、ストリーム解析手段１０２がデコード前バッファメモリ１０３にデータを格納する際に補完データを格納する（Ｓ７０８）ことにより、編集点後の復号および出音が可能となる。

以上の処理をまとめたのが図７Ａ、図７Ｂであり、まず、ＰＥＳパケット解析中に不連続点明示パケット４０１を検出した場合には、処理はＰＥＳパケット解析ステップ（Ｓ７０２）に戻る。また、デコード前バッファメモリへ格納したＰＥＳパケットのデータ量が第１の所定の長さ、すなわち、エレメンタリストリーム３０６の１フレーム長の整数倍に一致しない場合（Ｓ７０６のＮ）は、ストリーム入力ステップ（Ｓ７０１）に戻る。また、デコード前バッファに格納したデータ量が第２の所定の長さの整数倍に一致しない場合（Ｓ７０７のＮ）には、補完データをデコード前バッファに格納して（Ｓ７０８）、デコード前バッファに格納されたデータへアクセスするためのポインタをワードアラインする。

以上にように、本発明によって、ストリームの不連続点をストリーム解析手段で検出し、異音の発生を防止することが可能となる。また、不連続点においてワードアラインを行うことにより、不連続点後の復号およびオーディオの再生が可能となる。

なお、図７Ａではフローを見やすくするために、図２Ａを用いて説明したＰＥＳペイロード長が正規であるか否かの判定（Ｓ２０３）を省略しているが、ストリーム解析（Ｓ７０２）の後で同様の判定を行っても良いのは言うまでも無い。

次に、本発明の第３の実施の形態について、図８、図９Ａ、図９Ｂおよび図４を用いて説明する。第３の実施の形態においては、編集点後の出音の再開を実現する例について説明する。

第３の実施の形態が第１の実施の形態あるいは第２の実施の形態と異なるのは、ストリーム解析手段１０２がデコード前バッファメモリ１０３に格納するプライベートヘッダのアドレスを記憶する（Ｓ９０４）アドレス記憶手段８０８（図８）を備えた点である。

ストリームが入力され（Ｓ９０１）、トランスポートストリームＴＳおよびＰＥＳヘッダの解析がなされる（Ｓ９０２）。ＰＥＳヘッダの解析し、次のＰＥＳヘッダの検出中に、不連続点明示パケット４０１であるかどうかの判断がなされる（Ｓ９０３）。不連続点明示パケット４０１が見つかった場合はステップＳ９０４に進む一方、不連続点明示パケット４０１を見つけることなく次のＰＥＳヘッダが見つかった場合（または前のＰＥＳヘッダから所定量のカウントが終わった場合）は、ステップＳ９０５に進む。ステップＳ９０５ではエレメンタリストリームをデコード前バッファメモリ１０３に格納する。

ここでステップＳ９０３、Ｓ９０４について、図４を用いて説明する。ステップＳ９０３で、ストリーム解析手段１０２は、ＰＥＳヘッダを検出し、解析する。ストリーム解析手段１０２に設けたカウンタは、ＰＥＳヘッダの終端からカウントを開始し、次のパケット（データに不連続が生じている場合は、不連続点明示パケット、データに不連続が生じていない場合は次のＰＥＳパケット）が見つかるまでカウントする。ＰＥＳヘッダを解析したときに、ＰＥＳヘッダに続くＰＥＳペイロードのデータ長を検出し、そのデータ長をカウントする様にしても良い。そして、カウントが終了した点でのアドレスＡを算出する。このアドレスＡをアドレス記憶手段８０８に記憶する（Ｓ９０４）。即ち、アドレス記憶手段８０８には編集点後の先頭のプライベートヘッダの先頭アドレスが格納される。

デコード前バッファメモリ１０３から出力されるエレメンタリストリームは、上述と同様にして第１ヘッダ解析手段１０５で解析され（Ｓ９０６）、第２ヘッダの位置が算出される（Ｓ９０７）、第２ヘッダの位置にある標的データ（第２ヘッダであると予測されるデータ）が解析される（Ｓ９０８）。解析された標的データの内容が、第１ヘッダの内容と比較され、一致するかどうかの判断がなされる（Ｓ９０９）。同一であれば、標的データの内容が、正規の第２ヘッダであると判断され、オーディオ再生がなされる（Ｓ９１０）。第２ヘッダの内容が１箇所でも、第１ヘッダの内容と異なっていれば、標的データの内容は、正規の第２ヘッダではない、すなわち、第２ヘッダの位置が算出した位置とズレた位置にあると判断され、第１の実施の形態と同様にして、第１ヘッダの後の続くオーディオ符号化信号についてミュート処理を行う（Ｓ９１１）。更に、前記アドレス記憶手段８０８に格納されているアドレスＡに、次のプライベートヘッダ４０５の先頭が位置するように、データ読出しポインタを移動し（Ｓ９１２）、デコード処理を続ける。すなわち、アドレスＡをアドレス記憶手段８０８から読みだし、次のヘッダおよびフレーム先頭アドレスへ第１のヘッダ解析手段１０５および復号手段１０４の読出しポインタをそれぞれ移動する（Ｓ９１２）。このデータ読出しポインタの移動により、次のプライベートヘッダ４０５を、上述した現プライベートヘッダ４０４とし、その次のプライベートヘッダを次プライベートヘッダとして処理する。

その後、デコード前バッファメモリ１０３に所定量（第１の所定の長さ以上）のデータが格納されているかどうかが判断され（Ｓ９１３）、格納されていればステップＳ９０６に戻り、格納されていなければステップＳ９０１に戻る。

ステップＳ９０９での判断は、解析した標的データの内容と、解析された第１ヘッダの内容とが比較され、一致するかどうかの判断がなされたが、解析した標的データの内容と、あらかじめ保持された表１の内容と比較する様にしても良い。

以上より明らかなように、ストリーム解析手段１０２は、検出したヘッダ信号から不連続明示パケットまでをカウントするカウンタを備え、更にカウントした点におけるアドレスＡを計算して保持するアドレス記憶手段８０８を設け、前記制御手段１０７は、計算したアドレスＡに、次のプライベートヘッダが位置するように読み出しポインタを移動する。

なお、図９Ａではフローを見やすくするために、図２Ａを用いて説明したＰＥＳペイロード長が正規であるか否かの判定（Ｓ２０３）を省略しているが、ストリーム解析（Ｓ９０２）の後で同様の判定を行っても良いのは言うまでも無い。

以上により、本実施の形態では、編集などによって生じた不連続点後の音声の復号および出力が可能となる。

なお、以上の実施の形態は、オーディオの再生装置およびその処理を説明するステップとして説明したが、これらはコンピュータのプログラムの一部あるいは他の装置の一部の機能であっても良いことは説明するまでもない。

また、コンピュータのプログラムによって実現された本発明を磁気ディスクやＣＤ−ＲＯＭ等の記録媒体に格納することで、コンピュータシステムで容易に実施することが可能となる。

本発明は、再生装置、再生方法に利用可能である。

本発明の第１の実施の形態におけるオーディオの再生装置の構成を示すブロック図である。本発明の第１の実施の形態におけるオーディオの再生方法を示すフローチャートである。本発明の第１の実施の形態におけるオーディオの再生方法を示すフローチャートである。ＭＰＥＧ規格に基づいたストリームの構造を表わす図である。トランスポートストリームパケット単位で編集されたストリームの構造を表わす図である。本発明の第１の実施の形態におけるオーディオの再生装置の構成を示すブロック図である。本発明の第１の実施の形態におけるオーディオの再生装置の構成を示すブロック図である。本発明の第２の実施の形態におけるオーディオの再生装置の構成を示すブロック図である。本発明の第２の実施の形態におけるオーディオの再生方法を示すフローチャートである。本発明の第２の実施の形態におけるオーディオの再生方法を示すフローチャートである。本発明の第３の実施の形態におけるオーディオの再生装置の構成を示すブロック図である。本発明の第３の実施の形態におけるオーディオの再生方法を示すフローチャートである。本発明の第３の実施の形態におけるオーディオの再生方法を示すフローチャートである。

Claims

１つのフレームにオーディオ符号化信号と前記オーディオ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、同期語を含まない下位レイヤーの第２ストリームが、検出可能なヘッダ信号を含む上位レイヤーの第１ストリームに包含されるデータを受け、前記オーディオ符号化信号を復号して音声を出力する再生装置であって、
前記第１ストリームを解析し、前記ヘッダ信号を検出すると共に、検出したヘッダ信号を基準に、前記第２ストリームを解析して前記オーディオ符号化信号と前記プライベートヘッダの位置情報を出力するストリーム解析手段と、
前記ストリーム解析手段から出力される前記オーディオ符号化信号と前記プライベートヘッダとを一時保存するデコード前バッファメモリと、
前記デコード前バッファメモリから入力される前記オーディオ符号化信号を復号し音声を出力する復号手段と、
第１フレームのプライベートヘッダに含まれる属性情報を解析し、プライベートヘッダの後に続く前記オーディオ符号化信号のデータ長を表すデータ長情報を検出する第１ヘッダ解析手段と、
第１フレームのプライベートヘッダの位置情報に、検出されたデータ長を加えて得た位置から後にある所定量の標的データを解析し、解析した標的データが、第２フレームのプライベートヘッダに含まれる属性情報であるか否かを判断する第２ヘッダ解析手段と、
解析した標的データが、第２フレームのプライベートヘッダに含まれる属性情報でないと判断した場合は、少なくとも第１フレームのオーディオ符号化信号について前記復号手段からの音声出力を停止する制御手段を具備することを特徴とする再生装置。
前記第２ヘッダ解析手段は、前記標的データの少なくとも１部が、前記第１ヘッダ解析手段で解析された属性情報の少なくとも１部と一致するか否かを判断することを特徴とする請求項１記載の再生装置。
前記第２ヘッダ解析手段は、前記標的データの少なくとも１部が、あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致するか否かを判断することを特徴とする請求項１記載の再生装置。
前記属性情報は、前記オーディオ符号化信号のサンプリング周波数、チャンネル情報、サンプルビット長、オーディオ符号化信号のデータ長の少なくとも一つであることを特徴とする請求項１記載の再生装置。
前記ストリーム解析手段は、前記ヘッダ信号に含まれる前記フレームの長さを表すフレーム長データを検出し、前記ヘッダ信号に続く１フレームのデータが、検出したフレーム長データと等しくない場合は、前記フレームを破棄し、次のフレームの解析を行うことを特徴とする請求項１記載の再生装置。
前記第１ストリームは複数のパケットで構成され、前記ストリーム解析手段は、前記ヘッダ信号に含まれる前記パケットの長さを表すパケット長データを検出し、検出した１パケットの長さが、検出したパケット長データと等しくない場合は、前記パケットを破棄し、次のパケットの解析を行うことを特徴とする請求項１記載の再生装置。
前記第１ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析手段は、不連続点明示パケットを検出し、前記デコード前バッファに出力した不連続点明示パケット前のデータ量が、あらかじめ定義された所定のデータ量あるいはその整数倍に満たない場合には、前記デコード前バッファに対して不足分の補完データを出力することを特徴とする請求項６記載のオーディオ再生装置。
前記第１ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析手段は、検出したヘッダ信号から不連続明示パケットまでをカウントするカウンタを備え、更にカウントした点におけるアドレスを計算して保持するアドレス記憶手段を設け、前記制御手段は、計算したアドレスに、次のプライベートヘッダが位置するように読み出しポインタを移動することを特徴とする請求項１記載の再生装置。
前記デコード前バッファメモリと復号手段の間に、遅延手段を設けたことを特徴とする請求項１記載の再生装置。
１つのフレームにオーディオ符号化信号と前記オーディオ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、同期語を含まない下位レイヤーの第２ストリームが、検出可能なヘッダ信号を含む上位レイヤーの第１ストリームに包含されるデータを受け、前記オーディオ符号化信号を復号して音声を出力する再生方法であって、
前記第１ストリームを解析し、前記ヘッダ信号を検出すると共に、検出したヘッダ信号を基準に、前記第２ストリームを解析して前記オーディオ符号化信号と前記プライベートヘッダの位置情報を出力するストリーム解析ステップと、
前記ストリーム解析ステップから出力される前記オーディオ符号化信号と前記プライベートヘッダとを一時保存するステップと、
前記保持されたオーディオ符号化信号を復号し音声を出力する復号ステップと、
第１フレームのプライベートヘッダに含まれる属性情報を解析し、プライベートヘッダの後に続く前記オーディオ符号化信号のデータ長を表すデータ長情報を検出する第１ヘッダ解析ステップと、
第１フレームのプライベートヘッダの位置情報に、検出されたデータ長を加えて得た位置から後にある所定量の標的データを解析し、解析した標的データが、第２フレームのプライベートヘッダに含まれる属性情報であるか否かを判断する第２ヘッダ解析ステップと、
解析した標的データが、第２フレームのプライベートヘッダに含まれる属性情報でないと判断した場合は、少なくとも第１フレームのオーディオ符号化信号について前記復号ステップからの音声出力を停止する制御ステップを具備することを特徴とする再生方法。
前記第２ヘッダ解析ステップは、前記標的データの少なくとも１部が、前記第１ヘッダ解析ステップで解析された属性情報の少なくとも１部と一致するか否かを判断することを特徴とする請求項１０記載の再生方法。
前記第２ヘッダ解析ステップは、前記標的データの少なくとも１部が、あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致するか否かを判断することを特徴とする請求項１０記載の再生方法。
前記属性情報は、前記オーディオ符号化信号のサンプリング周波数、チャンネル情報、サンプルビット長、オーディオ符号化信号のデータ長の少なくとも一つであることを特徴とする請求項１０記載の再生方法。
前記ストリーム解析ステップは、前記ヘッダ信号に含まれる前記フレームの長さを表すフレーム長データを検出し、前記ヘッダ信号に続く１フレームのデータが、検出したフレーム長データと等しくない場合は、前記フレームを破棄し、次のフレームの解析を行うことを特徴とする請求項１０記載の再生方法。
前記第１ストリームは、複数のパケットで構成され、前記ストリーム解析ステップは、前記ヘッダ信号に含まれる前記パケットの長さを表すパケット長データを検出し、検出した１パケットの長さが、検出したパケット長データと等しくない場合は、前記パケットを破棄し、次のパケットの解析を行うことを特徴とする請求項１０記載の再生方法。
前記第１ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析ステップは、不連続点明示パケットを検出し、前記保持した不連続点明示パケット前のデータ量が、あらかじめ定義された所定のデータ量あるいはその整数倍に満たない場合には、前記デコード前バッファに対して不足分の補完データを出力することを特徴とする請求項１５記載のオーディオ再生方法。
前記第１ストリームに不連続が生じた箇所で、不連続点明示パケットが挿入されると共に、前記ストリーム解析ステップは、検出したヘッダ信号から不連続明示パケットまでをカウントし、更にカウントした点におけるアドレスを計算して保持するアドレス記憶ステップを設け、前記制御ステップは、計算したアドレスに、次のプライベートヘッダが位置するように読み出しポインタを移動することを特徴とする請求項１０記載の再生方法。
前記保持するステップと復号ステップとの間に、オーディオ符号化信号を遅延する遅延ステップを設けたことを特徴とする請求項１０記載の再生方法。