JP2009259333A - 再生装置及び再生方法 - Google Patents

再生装置及び再生方法 Download PDF

Info

Publication number
JP2009259333A
JP2009259333A JP2008107107A JP2008107107A JP2009259333A JP 2009259333 A JP2009259333 A JP 2009259333A JP 2008107107 A JP2008107107 A JP 2008107107A JP 2008107107 A JP2008107107 A JP 2008107107A JP 2009259333 A JP2009259333 A JP 2009259333A
Authority
JP
Japan
Prior art keywords
audio
video
data
playback
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008107107A
Other languages
English (en)
Inventor
Hirofumi Yamamoto
宏文 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Electronics Corp
Original Assignee
NEC Electronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Electronics Corp filed Critical NEC Electronics Corp
Priority to JP2008107107A priority Critical patent/JP2009259333A/ja
Publication of JP2009259333A publication Critical patent/JP2009259333A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

【課題】ビデオとオーディオデータとを正確に同期させることができる再生装置及び再生方法を提供すること。
【解決手段】再生装置は、ビデオ及びオーディオの再生タイミングを通知するそれぞれビデオ時間114及びオーディオ時間124と、ビデオとオーディオの同期のための情報である情報ビットを前記オーディオデータに付加する情報ビット付加器126と、ビデオ時間114及びオーディオ時間124からの再生タイミングの通知に基づきオーディオデータの再生長さを調整するオーディオデータ数補正器125と、ビデオデコーダからのビデオデータを再生するビデオ提示部113と、オーディオ再生時間調整部から再生長さを調整済みのオーディオデータを受け取り再生するオーディオ選択器131とを有し、オーディオ時間124は、情報ビットに基づきオーディオの再生タイミングを通知する。
【選択図】図1

Description

本発明は、オーディオとビデオを同期をとって再生する再生装置及び再生方法に関する。
携帯電話のマルチメディアプレーヤー、携帯型デジタル動画像音声音楽プレイヤー(以下、AVプレイヤーという。)、又は据え置き型のデジタルAVプレイヤーを構成する動画像再生装置及び音声音楽再生装置において、ユーザーに対し動画像(以下、ビデオという。)と音声音楽(以下、オーディオという。)の同期をとってビデオ及びオーディオの提示を行うことは必須の機能である。一般的には、ビデオ再生装置とオーディオ再生装置を動作させるためのクロック発生器は異なり、それぞれのクロックに偏差(誤差)がある場合にビデオとオーディオの再生が徐々にずれていく問題があり、さまざまな方法によってビデオとオーディオの同期をとる工夫がなされている。
図9は、特許文献1に記載のビデオとオーディオの同期をとって提示するビデオオーディオ再生装置である。この例では、マルチメディアデータを記憶するデータ入力部201、マルチメディアデータから動画像データと音声データを分離するデータ分離部202と、音声データをPCMデータへ復号化する音声デコード部205と、動画像データを画像データへ復号化する動画像デコード部204と、PCMデータのカウント部116を備えたPCMデータを蓄える音声バッファ部208と、動画像の表示タイミングを決めるタイマ114を備えた再生制御部203を備える。PCMデータのカウント数を用いて画像データの表示のタイミングを決めるタイマ214の値を補正することによってビデオデータとオーディオデータの同期再生を行う。
図10は、特許文献2に記載のビデオとオーディオの同期をとって再生するAV再生装置である。再生装置300は、制御部301、ビデオデコーダ302、オーディオデコーダ303、表示処理部304、音声処理部305、同期処理部306、ディスプレイ307、スピーカ308を有する。この例では、ビデオデコーダでの画像処理の時間が負担となって画像の提示が遅れそうな場合を想定しており、ビデオデコーダ302の出力から画像の提示時間を推定部306aで推定し、比較部306bにおいてオーディオデコーダ303からのオーディオの提示時間と比較し、オーディオを遅らせるためのオーディオの引き伸ばしを音声処理時間調整部306cと音声処理部305で行う。
なお、この例では、オーディオデコーダ303から出力されたPCMサンプルデータによるオーディオ時計が図中に明確に示されていないが、オーディオデコーダ303もしくは比較部306bに存在する。
このように、ビデオとオーディオの同期をとって提示するAV再生装置において、同期を行う機能の構成要素として必須となるのは、ビデオを提示する時間をカウントするビデオ時計(ビデオタイミング通知部)と、オーディオを提示する時間をカウントするオーディオ時計(オーディオタイミング通知部)と、ビデオ時計とオーディオ時計を比較してずれを検出するずれ検出器と、ずれが検出された場合にそのずれを補正するための補正器である。
図11は、従来の技術によるビデオにオーディオを合わせて提示する一般的なAV再生装置を示す図である。また、図12は、従来の技術によるオーディオにビデオを合わせて提示する一般的なAV再生装置を示す図である。
図11及び図12を用いて、図9(特許文献1)又は図10(特許文献2)の例に倣って、ビデオとオーディオの同期をとって提示するAV再生装置において同期を行う機能の必須となる構成要素及びその動作を具体的に説明する。なお、以下の説明において、同一の構成要素には同一の符号を付し、その詳細な説明は省略する。
図11の構成におけるビデオとオーディオの同期をとって提示する動作について説明する。図11は、ビデオにオーディオを合わせるAV再生装置である。図11において、ビデオデコーダ412は圧縮されたビデオストリームを入力し伸張処理を行ってビデオデータを出力する。また、ビデオデコーダ412は、先頭のビデオデータのデコードの開始時に、ビデオ時計414のリセット信号を出力する。ビデオクロック発生器411はビデオ提示器413にビデオの提示動作のためのクロックを発生する。また、ビデオクロック発生器411はビデオ時計414へも時計のカウントのためのカウントクロックを供給する。ビデオ提示器413はビデオクロック発生器411から入力されるクロックをもとに、提示のための信号を生成し、入力されるビデオを混合する。提示の信号は、デジタルデータと仮定する。ビデオ時計414は、ビデオデコーダ412からのリセット信号の受信後からビデオクロック発生器411のカウントクロックをもとにカウントを開始し、ビデオの提示のタイミングを示す時間通知をずれ検出器430に通知する。
一方、オーディオデコーダ422は圧縮されたオーディオストリームを入力し伸張処理を行ってオーディオデータを出力する。また、オーディオデコーダ422は、先頭のオーディオデータのデコードの開始時に、オーディオ時計424へリセット信号を出力する。オーディオクロック発生器421はオーディオ提示器423にオーディオの提示動作のためのクロックを発生する。また、オーディオクロック発生器421はオーディオ時計424へも時計のカウントのためのカウントクロックを供給する。オーディオ提示器423はオーディオクロック発生器421から入力されるクロックをもとに、提示のための信号を生成し、入力されるオーディオを混合する。提示の信号は、デジタルデータと仮定する。オーディオ選択器431は、複数のオーディオデータの入力ソースから、提示するオーディオデータを選択する機能である。
オーディオ時計424は、オーディオデコーダ422からのリセット信号を受信後から、オーディオクロック発生器421のカウントクロックをもとにカウントを開始し、オーディオの提示のタイミングを示す時間通知をずれ検出器430に出力する。
ずれ検出器430は、ビデオ時計414から入力される時間通知とオーディオ時計424から入力される時間通知を比較し、ずれが生じている場合に、オーディオデータ数補正器425にオーディオデータの補正命令を出力する。オーディオデータ数補正器425は入力されるオーディオデータの補正命令に従って、オーディオデータのデータ数を、サンプリングレート変換を用いたり、又はオーディオデータの一部のデータの削除や一部のデータを挿入するなどして、データ数を多くしたり少なくしたりする。
このような、構成においてビデオとオーディオの同期をとって提示する方法について説明する。図13は、オーディオ時計が出力する時間通知の出力タイミングを示すタイミング図である。オーディオ時計424は、オーディオデコーダ422によって、先頭のオーディオデータのデコードの開始時にリセット信号によりリセットされる。
図13(a)の通常の場合で示すように、オーディオデータ(すなわちPCMサンプルデータ)は、例えば1秒間に44100個からなる。オーディオ時計のカウントは、例えば1サンプルごとにカウントアップを行い、44099までカウントした後に1に戻る。オーディオ時計のカウント値が1に戻るときに時間通知を行うとすると、図13(a)の通常の場合のように1秒ごとに時間通知が行われることになる。
図13(b)はPCMを増加させた場合の図で、44100個のデータに対し2個ほどオーディオデータを追加している。44100個に対し2個追加しているので、44101の後1に戻るタイミングで時間通知を行っている。図13(c)はPCMを減少させた場合の図で44100個のデータに対し2個ほどオーディオデータを削除している。44100個に対し2個削除しているので、44097の後1に戻るタイミングで時間通知を行っている。
このように、通常の場合に対してサンプルデータを追加したり削除した場合には、オーディオ時計から出力される時間通知が遅くなったり早くなったりする。このことにより、オーディオの提示とビデオとの提示の時間とをあわせる動作を行える。
図14は、ビデオにオーディオを合わせて提示する場合の提示が合う様を表したタイミング図である。A1は、各画像の提示終了タイミング、A2はビデオ時計の時間通知、A3は、オーディオ時計の時間通知、A4は各音の提示終了タイミング、A5は、音声データの補正命令、を示す。ビデオ時計414は、ビデオデコーダ412によって、先頭のビデオデータのデコードの開始時にリセット信号によりリセットされる。図14(a)は、オーディオデータの提示が早い場合の例を示している。1枚のビデオデータが1秒ごとに提示され、その動作画像データ提示の終了ごとにビデオ時計から時間通知が出力される。一方、オーディオデータの1秒分の提示終了においてオーディオ時計から時間通知が出力される。
オーディオデータ1秒分の提示の時間は、オーディオ提示器423へのオーディオクロック発生器421の供給クロックが絶対的な時間に対して早いことに起因して、1秒よりも短くなっている。ずれ検出器は、ビデオと時計とオーディオ時計のずれを検出し、ずれがある閾値を超えると、オーディオデータの補正命令を出力して、オーディオデータの補正を行う。図14(a)の例では、2秒目付近でオーディオデータの提示が進んでいると判断し、オーディオデータを増加させる補正命令を出力し、3秒目までの音に対して音を追加している。その結果、3秒目付近ではビデオ提示の時間とオーディオ提示の時間が一致している。
図14(b)は、オーディオデータの提示が遅い場合の例を示している。図14の例では、オーディオデータの1秒分の提示の時間は、オーディオ提示器423へのオーディオクロック発生器421の供給クロックが絶対的な時間に対して遅いことに起因して、1秒よりも長くなっている。2秒目付近でオーディオデータの提示が遅れていると判断し、オーディオデータを減少させる補正命令を出力し、3秒目までの音に対して音を削除している。その結果、3秒目付近ではビデオ提示の時間とオーディオ提示の時間が一致している。
図12の構成におけるビデオとオーディオの同期をとって提示する動作について説明する。図12は、オーディオにビデオを合わせるAV再生装置である。図12において、ビデオデコーダ412、ビデオクロック発生器411、ビデオ提示器413、オーディオデコーダ422、オーディオクロック発生器421、オーディオ提示器423、オーディオ時計424、オーディオ選択器431は、図11に示す例と同様である。
オーディオ時計424はオーディオクロック発生器421のカウントクロックをもとにオーディオの提示のタイミングを示す時間通知をビデオ提示時間調整器415に通知する。ビデオ提示時間調整器415は、入力されるオーディオの提示のタイミングを示す時間通知をもとにビデオ提示の時間を調整し、ビデオ提示器413にビデオを出力する。
このような、構成においてビデオとオーディオの同期をとって提示する方法について説明する。オーディオ時計が出力する時間通知の出力タイミングは、図13で説明したとおりである。図15は、オーディオにビデオを合わせて提示する場合の提示が合う様を表したタイミング図である。B1は、各画像の提示のタイミング、B2はオーディオ時計の時間通知、B3は、各音の提示終了のタイミングを示す。
図15(a)は、オーディオデータの提示が早い場合の例を示している。オーディオデータの1秒分の提示終了においてオーディオ時計から時間通知が出力され、ビデオ提示時間調整器415に入力される。オーディオデータ1秒分の提示の時間は、オーディオ提示器423へのオーディオクロック発生器421の供給クロックが絶対的な時間に対して早いことに起因して、1秒よりも短くなっているが、ビデオ提示時間調整器415がその時間通知に合わせてビデオの提示時間を調整するので、ビデオ提示の時間とオーディオ提示の時間が一致している。
図15(b)は、オーディオデータの提示が遅い場合の例を示している。図15(b)の例についても、オーディオデータ1秒分の提示の時間は、オーディオ提示器423へのオーディオクロック発生器421の供給クロックが絶対的な時間に対して遅いことに起因して、1秒よりも長くなっているが、図15(a)と同じように、ビデオ提示時間調整器415がその時間通知に合わせてビデオの提示時間を調整するので、ビデオ提示の時間とオーディオ提示の時間が一致している。
ところで、図9に示す特許文献1に記載の技術、図10に示す特許文献2に記載の技術、図11又は図12に示す従来の技術におけるビデオとオーディオの同期をとって提示するAV再生装置は、実際の製品に適用する場合に、複数のチップで構成することがある。
次に、図9に示す特許文献1に記載の技術、図10に示す特許文献2に記載の技術、図11又は図12に示す従来の技術にかかるAV再生装置において、これらAV再生装置を複数のチップで実現した場合の動作について述べる。
図16は、特許文献1におけるAV再生装置を複数のチップから構成した場合の例を示す図である。図16では、ビデオ処理チップとオーディオ処理チップに分かれている。ビデオの処理に長けたチップとオーディオの処理に長けたチップが存在する場合、このような構成となる場合がある。なお、図16では、ビデオ処理チップに、DA変換部109など、一部のオーディオ処理部が搭載される例を示している。
図17は、特許文献1におけるAV再生装置を複数のチップから構成した場合の他の例を示す図である。図17では、デコード用チップと提示用チップに分かれている。ある標準化された提示用チップが存在して複数の製品で使いまわすような場合、このような構成となることがある。
図18は、特許文献2におけるAV再生装置を複数のチップから構成した場合の例を示す図である。図18では、ビデオ処理チップとオーディオ処理チップに分かれている。ビデオの処理に長けたチップとオーディオの処理に長けたチップが存在する場合、このような構成となる場合がある。なお、図18では、ビデオ処理チップに、音声処理部305など、一部のオーディオ処理部が搭載される例を示している。
図19は、特許文献2におけるAV再生装置を複数のチップから構成した場合の他の例を示す図である。図19では、デコード用チップと提示用チップに分かれている。ある標準化された提示用チップが存在して複数の製品で使いまわすような場合、このような構成となることがある。
図20は、複数のチップ構成からなる一般的なAV再生装置である。図21は、複数のチップ構成からなる一般的なAV再生装置を示す図である。図22は、複数のチップ構成からなる一般的なAV再生装置の別の例である。図23は、複数のチップ構成からなる一般的なAV再生装置の別の例である。
図20乃至図23を用いて、図16及び図17に示す特許文献1の技術を複数チップで実現する場合や、図18及び図19に示す特許文献2の技術を複数チップで実現する場合の例に倣って、図11や図12に示すAV再生装置を複数のチップから構成した場合において、同期を行う機能の必須となる構成要素及びその動作の例を、具体的に説明する。
図20の構成におけるビデオとオーディオの同期をとって提示する動作について説明する。図20において、ビデオデコーダ412、ビデオクロック発生器411、ビデオ提示器413、ビデオ時計414、オーディオデコーダ422、オーディオクロック発生器421、オーディオ提示器423、オーディオ時計424、オーディオ選択器431、ずれ検出器430、オーディオデータ数補正器425の動作は、図11に示す例と同様である。
図20において、コマンド送信器433は、オーディオ時計から出力される時間通知をずれ検出器430に転送するためのもので、ビデオ処理チップ400とオーディオ処理チップ401の間の制御コマンドを転送するためのコマンド転送用シリアルインターフェースを制御する。また、オーディオ提示器423の出力はビデオ処理チップ400にあるオーディオ選択器431に、音声転送用シリアルインターフェースを通して転送される。
図20の構成においてビデオとオーディオの同期をとって提示する方法は、オーディオ時計から出力される時間通知がコマンド送信器433からコマンド転送用シリアルインターフェースを通してビデオ処理チップ400に転送される点を除き、図11に示す例と同様である。
ここで、コマンド転送用シリアルインターフェース及び音声転送用シリアルインターフェースの動作について説明する。図24は、従来のAV再生装置で用いられるコマンドデータ転送用シリアルインターフェースの詳細な構成図及びタイミング図である。
図24(a)はコマンド転送用シリアルインターフェースのチップ間の接続構成の例を示している。また図24(b)は、コマンド転送用シリアルインターフェースの転送フォーマットを示している。この構成は、一般的な3線式のシリアルインターフェースである。ビデオ処理チップ又はデコード処理チップから転送用のクロックが供給され、そのクロックに同期してコマンドや応答データや通知データを転送する。一般的に、データの送受信は、コマンドや応答データや通知データの転送の必要が生じたときに、ソフトウェア処理にてコマンドデータや応答データや通知データを作成し、ソフトウェア処理にてコマンド転送用シリアルインターフェースのハードウェアに通信の開始を指示し、コマンド転送用シリアルインターフェースのハードウェアがデータの実際の転送動作を行う。
図25は、従来のAV再生装置で用いられるオーディオデータ転送専用シリアルインターフェースの詳細な構成図及びタイミング図である。図25(a)はオーディオデータ転送専用シリアルインターフェースのチップ間の接続構成の例を示している。また図25(b)は、PCMサンプルデータの1サンプル分のオーディオデータ転送専用シリアルインターフェースの転送フォーマットを示している。
この構成は、一般的なPCMサンプルデータの転送シリアルインターフェースである。LRCKは、1サンプルごとに1周期するクロックである。BCLKはPCMサンプルデータの各ビットデータを転送するためのクロックである。SDOから出力されるデータがオーディオデータで、例えば右チャンネルのデータ16ビットと左チャンネルのデータ16ビットからなっている。なお、図25の例では、BCLKは1PCMサンプルデータあたり40ビット分あり、従って8ビットは空きビットとなっている。
オーディオデータの転送は、図25(b)に示す1サンプル分のオーディオデータ転送専用シリアルインターフェースのフォーマットによる動作が連続的に行われることによってなされる。従って、オーディオデータはオーディオデコーダ422で随時生成される必要がある。通常は、オーディオデコーダ422は1回のデコード動作で複数のサンプル(例えばAACの場合1024サンプルなど)を生成し、ソフトウェア処理にてオーディオデータ転送専用シリアルインターフェースに通信の開始を指示し、その後、生成した複数サンプル(1024サンプル分)を自動的にかつ連続的に出力する動作を行う。
最初に生成したサンプル分のオーディオデータを出力し終わる前にオーディオデコーダ422はデコード動作を行って次の複数サンプルデータ(1024サンプル)を生成し、出力待ちとなる。オーディオデータ転送専用シリアルインターフェースにおいて、最初に生成したサンプル分(1024サンプル分)のオーディオデータを出力し終わると、次に生成したサンプル(1024サンプル)の出力を自動的に開始する。この動作を繰り返すことにより、オーディオデータが連続的に転送される。
図21の構成におけるビデオとオーディオの同期をとって提示する動作について説明する。図21において、ビデオデコーダ412、ビデオクロック発生器411、ビデオ提示器413、ビデオ提示時間調整器415、オーディオデコーダ422、オーディオクロック発生器421、オーディオ提示器423、オーディオ時計424、オーディオ選択器431の動作は、図12と同様である。図21の、コマンド送信器は図20と同様であり、オーディオ時計から出力される時間通知をビデオ処理チップ400に転送するためのものである。
オーディオ提示器423の出力は、ビデオ処理チップ400にあるオーディオ選択器431に音声転送用シリアルインターフェースを通して転送される点も、図20と同様である。図21の構成においてビデオとオーディオの同期をとって提示する方法は、オーディオ時計から出力される時間通知がコマンド送信器433からコマンド転送用シリアルインターフェースを通してビデオ処理チップ400に転送される点を除き、図12と同様である。
図22の構成におけるビデオとオーディオの同期をとって提示する動作について説明する。図22において、ビデオデコーダ412、ビデオクロック発生器411、ビデオ提示器413、ビデオ時計414、オーディオデコーダ422、オーディオクロック発生器421、オーディオ提示器423、オーディオ時計424、オーディオ選択器431、ずれ検出器430、オーディオデータ数補正器425の動作は、図11と同様である。
図22において、コマンド送信器433は、オーディオデコーダ422から出力される時計リセット信号をオーディオ時計に転送するためのもので、デコード処理用チップ402とAV提示用チップ403の間の制御コマンドを転送するためのコマンド転送用シリアルインターフェースを制御する。また、オーディオデコーダ422の出力はAV提示用チップ403にあるオーディオデータ数補正器425に、音声転送用シリアルインターフェースを通して転送される。
図22の構成においてビデオとオーディオの同期をとって提示する方法は、オーディオデコーダ422から時計リセット信号がコマンド送信器433からコマンド転送用シリアルインターフェースを通してAV提示用チップ403に転送される点を除き、図11と同様である。また、コマンド転送用シリアルインターフェース及び音声転送用シリアルインターフェースの動作についても、図20と同様である。
図23の構成におけるビデオとオーディオの同期をとって提示する動作について説明する。図23において、ビデオデコーダ412、ビデオクロック発生器411、ビデオ提示器413、ビデオ提示時間調整器415、オーディオデコーダ422、オーディオクロック発生器421、オーディオ提示器423、オーディオ時計424、オーディオ選択器431の動作は、図12と同様である。図23のコマンド送信器は、図22と同様であり、オーディオデコーダ422から出力される時計リセット信号をAV提示用チップ403に転送するためのものである。また、オーディオデコーダ422の出力はAV提示用チップ403にあるオーディオ提示器423に、音声転送用シリアルインターフェースを通して転送される。
図23の構成においてビデオとオーディオの同期をとって提示する方法は、オーディオデコーダ422から時計リセット信号がコマンド送信器433からコマンド転送用シリアルインターフェースを通してAV提示用チップ403に転送される点を除き、図12と同様である。
また、コマンド転送用シリアルインターフェース及び音声転送用シリアルインターフェースの動作についても図20と同様である。なお、図16乃至23は、概ね2つのチップに分かれている例を示しており、さらにチップが分かれる場合もあるが、基本的な構成は変わらない。
特開2003−339023号公報 特開2008−11337号公報
前記のように、図9に示す特許文献1や図10に示す特許文献2に倣って示した図7及び図8のAV再生装置に対し、複数のチップで実現した図20乃至図23に示すAV再生装置において生じる問題の発生メカニズムについて述べる。
図20乃至図23に示すAV再生装置の場合、同期再生を実現するための情報をチップ間で通信して送信する必要がある。図20及び図21において、オーディオ時計424から出力される時刻通知は、コマンド送信器433を介してずれ検出器430に転送する。このため、コマンド送信器433での転送処理で時刻通知が遅延する。
例えば、コマンド送信器433は、コマンド転送用シリアルインターフェースのハードウェアとコマンド転送用シリアルインターフェースを制御するソフトウェアのモジュールとして実装される。コマンド送信器433のソフトウェアモジュールの実行タイミングは、オーディオ処理チップ401内の他のすべてのソフトウェアモジュールとの関係で決まり、コマンド送信器433のソフトウェアモジュールの実行の優先度が低い場合には、なかなか実行がされずに、オーディオ時計からの時刻通知のビデオ処理チップ400への出力が遅延する。
また、当然ながら、コマンド転送用シリアルインターフェース自体の遅延も存在する。さらに、コマンド送信器433のソフトウェアモジュールの実行タイミングが一定間隔とならない場合には、オーディオ時計からの時刻通知の出力の遅延量も一定にならない。
図26は、AV再生装置をビデオ処理チップとオーディオ処理チップに分けてビデオにオーディオを合わせる場合の動作を示すタイミング図である。図26(a)に示すオーディオデータの提示が早い場合において、2秒目までの音を提示し終わった時点のオーディオ時計からの時間通知が、ずれ検出器に遅延して到着している。
ずれ検出器は、2枚目の画像の提示終了に対応するビデオ時計からの時間通知と2秒目までの音の提示終了に対応する遅延して到着したオーディオ時計からの時間通知とを比較し、オーディオデータの提示が遅れていると判断し、3秒目までの音に対してオーディオデータを減少させるようにオーディオデータの補正命令を出力する。
その後、3秒目までの音が減少し、減少した3秒目までの音を提示し終わった時点でオーディオ時計からの時間通知が出力される。3秒目までの音を提示し終わった時点でオーディオ時計からの時間通知は、遅延無くずれ検出器に到着した場合には、オーディオデータの提示が進んでいると判断し、4秒目までの音に対してオーディオデータを増加させるようにオーディオデータの補正命令を出力する。その後、4秒目までの音が減少しているが、増加した4秒目までの音を提示し終わった時点で再びオーディオデータの提示が進んでいると判断し、5秒目までの音に対してオーディオデータを増加させるようにオーディオデータの補正命令を出力している。
このように、オーディオ時計からの時間通知が遅延する又は遅延量が一定にならないことによって、オーディオデータの提示が早い場合においては通常オーディオ時計からの時間通知が遅延しなければ行われることがないオーディオデータを、減少させる補正が行われてしまう問題点がある。さらに、オーディオデータの補正が増加や減少の両方を伴って頻繁に行われ、音質が非常に悪くなるという問題がある。
図26(b)に示すオーディオデータの提示が遅い場合においても、図26(a)に示すオーディオデータの提示が早い場合と同じ問題が生じている。
図27は、AV再生装置をビデオ処理チップとオーディオ処理チップに分けてオーディオにビデオを合わせる場合の動作を示すタイミング図である。
図27(a)に示すオーディオデータの提示が早い場合において、1秒目までの音を提示し終わった時点のオーディオ時計からの時間通知が、ビデオ提示時間調整器に、遅延をして到着している。従って、1枚目の画像の提示時間が長くなり、2枚目の画像の提示開始が遅れている。2秒目までの音を提示し終わった時点でのオーディオ時計からの時間通知が遅延無くビデオ提示時間調整器に到着した場合には、2枚目の画像の提示時間が短くなり、3枚目の画像の提示開始が早くなっている。
このように、オーディオ時計からの時間通知が遅延する又は遅延量が一定にならないことによって、オーディオとの同期がとれないばかりではなく、各画像の提示時間が長くなったり短くなったりする問題がある。
図27(b)に示すオーディオデータの提示が遅い場合においても、図27(a)に示すオーディオデータの提示が早い場合と同じ問題が生じている。
図26及び図27の例で示す問題は、オーディオ時計がオーディオ処理用チップに存在し、オーディオ時計から出力される時間通知をビデオ処理チップに連絡しなければならないことに起因している。
図28は、AV再生装置をデコード処理チップとAV提示用チップに分けてビデオにオーディオを合わせる場合の動作を示すタイミング図である。
図28(a)に示すオーディオデータの提示が早い場合において、オーディオデコーダから出力されるオーディオ時計のリセット信号が遅延して到着している。オーディオ時計は、このオーディオデコーダから出力されるオーディオ時計のリセット信号を受信後からカウントを行うので、1秒目までの音を提示し終わった時点のオーディオ時計からの時間通知が、ずれ検出器に、遅延をして到着している。ずれ検出器は、オーディオデータの提示が遅れていると判断し、2秒目までの音に対してオーディオデータを減少させるようにオーディオデータの補正命令を出力する。
このように、オーディオ時計のリセット信号が遅延して到着することによって、オーディオデータの提示が早い場合においては通常オーディオ時計からの時間通知が遅延しなければ行われることがないオーディオデータを減少させる補正が行われてしまう問題点がある。
図28(b)に示すオーディオデータの提示が遅い場合においても、オーディオ時計のリセット信号が遅延して到着することによって、提示を開始してから早いタイミングで、すなわち、図28(b)の例では、2秒目までの音に対してオーディオデータを増加させてしまう問題点がある。
図29は、AV再生装置をデコード処理チップとAV提示用チップに分けてオーディオにビデオを合わせる場合の動作を示すタイミング図である。
図29(a)に示すオーディオデータの提示が早い場合において、オーディオデコーダから出力されるオーディオ時計のリセット信号が遅延して到着している。オーディオ時計は、このオーディオデコーダから出力されるオーディオ時計のリセット信号を受信後からカウントを行うので、実際のオーディオ提示のタイミングとずれてオーディオ時計からの時間通知が出力されている。ビデオの提示のタイミングの決定は、ビデオ提示時間調整器においてこのオーディオ時計からの時間通知に基づいて行われるので、ビデオとオーディオがずれた状態、すなわちビデオの提示が、実際のオーディオの提示に対し遅れた状態で提示され続ける問題がある。
図29(b)に示すオーディオデータの提示が遅い場合においても、図29(a)に示すオーディオデータの提示が早い場合と同じ問題が生じている。また、オーディオデコーダから出力されるオーディオ時計のリセット信号がオーディオデータに対して早く到着する場合も考えられ、同様にビデオとオーディオがずれた状態、すなわちビデオの提示が、実際のオーディオの提示に対し進んだ状態で提示され続ける。
図28及び図29の例で示す問題は、AV提示用チップのオーディオ時計のカウントを開始させる有効なオーディオデータすなわち有効なPCMサンプルデータがどこからなのかが、従来の音声転送用シリアルインターフェースでは正確にはわからないことに起因している。
上述した課題を解決するために、本発明に係る再生装置は、ビデオデータとオーディオデータとを同期して再生する再生装置であって、ビデオストリームを復号してビデオデータを生成するビデオデコーダと、オーディオストリームを復号してオーディオデータを生成するオーディオデコーダと、前記ビデオ及びオーディオの再生タイミングを通知するそれぞれビデオタイミング通知部及びオーディオタイミング通知部と、前記ビデオと前記オーディオの同期のための情報である情報ビットを前記オーディオデータに付加する情報ビット付加部と、前記ビデオタイミング通知部及びオーディオタイミング通知部からの再生タイミングの通知に基づき前記オーディオデータの再生長さを調整するオーディオ再生時間調整部と、前記ビデオデコーダからのビデオデータを再生するビデオ再生部と、前記オーディオ再生時間調整部から再生長さを調整済みのオーディオデータを受け取り再生するオーディオデータ再生部とを有し、前記オーディオタイミング通知部は、前記情報ビットに基づきオーディオの再生タイミングを通知する、ことを特徴とする。
本発明に係る他の再生装置は、ビデオデータとオーディオデータとを同期して再生する再生装置であって、ビデオストリームを復号してビデオデータを生成するビデオデコーダと、オーディオストリームを復号してオーディオデータを生成するオーディオデコーダと、前記オーディオデータ再生タイミングを通知するオーディオタイミング通知部と、前記ビデオと前記オーディオの同期のための情報である情報ビットを前記オーディオデータに付加する情報ビット付加部と、前記オーディオタイミング通知部からの通知に基づきビデオの再生長さを調整するビデオ再生時間調整部と、前記ビデオ再生時間調整部から再生長さを調整済みのビデオデータを受け取り再生するビデオ再生部と、前記情報ビット付加部からのオーディオデータを再生するオーディオ再生部とを有し、前記オーディオタイミング通知部は、前記情報ビットに基づきオーディオの再生タイミングを通知する、ことを特徴とする。
本発明においては、オーディオデータにビデオとオーディオを同期させるための情報を付加するため、オーディオデータと共に当該同期のための情報を受信することができる。これを使用してビデオとオーディオを同期させることができるため、従来のようにコマンドで同期タイミングを通知する必要がない。
本発明に係るによれば、ビデオとオーディオデータとを正確に同期させることができる再生装置及び再生方法を提供することができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、圧縮されたオーディオデータとビデオデータをデコードし提示するシステムにおいて、オーディオデコーダとビデオデコーダが別々のチップで処理され、再生のためにオーディオとビデオの同期をとる必要がある再生装置に適用したものである。
第1の実施の形態.
本実施の形態においては、PCMデータを転送するシリアルインターフェースのフォーマットの1フレームの中で、空いていて通常破棄されるビットに、オーディオデータが開始されたことを示す情報とオーディオ時計を何サンプル分進めるかの情報を割りあてて送出することにより、PCMデータを受信する側でのオーディオ再生時間のカウントを容易にし、ビデオの画像提示との同期を容易とする。
図1は、本発明の第1の実施の形態にかかるビデオとオーディオの同期をとって提示するAV再生装置を示す図である。このAV再生装置は、ビデオにオーディオを合わせて提示する。図1に示すように、AV再生装置は、ビデオ処理チップ100と、オーディオ処理チップ101とを有する。ビデオ処理チップ100は、ビデオデコーダ112、ビデオ再生部としてのビデオ提示器113、ビデオタイミング通知部としてのビデオ時計114、オーディオタイミング通知部としてのオーディオ時計124、ずれ検出器130、オーディオ再生部としてのオーディオ選択器131、及び情報ビット検出器132を有する。オーディオ処理チップ101は、オーディオデコーダ122、オーディオデータ数補正器125、情報ビット付加器126、オーディオ提示器123を有する。ビデオ処理チップ100とオーディオ処理チップ101とは、コマンド転送用シリアルインターフェース141、オーディオ転送用専用シリアルインターフェース142を介して接続されている。なお、本実施の形態においては、オーディオ選択器131をビデオ処理チップに設けているが、オーディオPCMデータを取り扱うブロックがビデオ処理チップにあればよく、例えばオーディオ提示器123をオーディオ処理チップではなくビデオ処理チップに設け、オーディオ選択器を省略してもよい。その場合、オーディオ提示器がオーディオ再生部として機能する。
ビデオデコーダ112は圧縮されたビデオストリームを入力し伸張処理を行って、ビデオ提示器113にビデオデータを出力する。また、ビデオデコーダ112は、先頭のビデオデータのデコードの開始時に、ビデオ時計114の時計リセット信号を出力する。ビデオクロック発生器111はビデオ提示器113にビデオの提示動作のためのクロックを発生する。また、ビデオクロック発生器111はビデオ時計114へも時計のカウントのためのカウントクロックを供給する。ビデオ提示器113はビデオクロック発生器111から入力されるクロックをもとに、提示のための信号を生成し、入力されるビデオデータを混合する。提示の信号は、デジタルデータと仮定する。ビデオ時計114は、ビデオデコーダ112からのリセット信号の受信後からビデオクロック発生器111のカウントクロックをもとにカウントを開始し、ビデオの提示のタイミングを示す時間通知をずれ検出器130に通知する。
一方、オーディオデコーダ122は圧縮されたオーディオストリームを入力し伸張処理を行って、オーディオデータ数補正器125にオーディオデータを出力する。オーディオクロック発生器121はオーディオ提示器123にオーディオの提示動作のためのクロックを発生する。オーディオ提示器123はオーディオクロック発生器121から入力されるクロックをもとに、提示のための信号を生成し、入力されるオーディオを混合する。提示の信号は、デジタルデータと仮定する。オーディオ選択器131は、複数のオーディオデータの入力ソースから、提示するオーディオデータを選択する機能である。
ずれ検出器130は、ビデオ時計114から入力される時間通知とオーディオ時計124から入力される時間通知を比較し、ずれが生じている場合に、オーディオデータ数補正器125にオーディオデータの補正命令を出力する。オーディオデータ数補正器125は入力されるオーディオデータの補正命令に従って、オーディオデータのデータ数を、サンプリングレート変換を用いたり、又はオーディオデータの一部のデータの削除や一部のデータを挿入するなどして、データ数を多くしたり少なくしたりする。
ここで、図1に示す本実施の形態にかかるAV再生装置は、図20に示す従来の一般的なAV再生装置と異なり、情報ビット付加器126がオーディオ処理チップ101に付加されている。この情報ビット付加器126は、PCMサンプルデータを転送するオーディオ転送専用シリアルインターフェースのフォーマットの中に、ビデオとオーディオの提示の同期のための情報、すなわち図2に示す「オーディオデータが開始されたことを示すビット」及び「オーディオ時計を何サンプル分進めるかを示すビット群」を添付する動作を行う。
図2は、本実施の形態にかかるAV再生装置で用いられるオーディオデータ転送専用シリアルインターフェースの詳細なタイミング図である。図2において、情報ビットaの部分に「オーディオデータが開始されたことを示すビット」及び「オーディオ時計を何サンプル分進めるかを示すビット群」を割り当てる。図2の例では、「オーディオデータが開始されたことを示すビット」は1ビットで、「オーディオ時計を何サンプル分進めるかを示すビット群」には3ビットを割り当てているが、割り当てる位置及び割り当てるビット数はこの限りではない。また、図2において情報ビットbは空きビットになっているがこの部分に「オーディオデータが開始されたことを示すビット」及び「オーディオ時計を何サンプル分進めるかを示すビット群」を割り当てても良いし、情報ビットaに加えて、「オーディオ時計を何サンプル分進めるかを示すビット群」を拡張して割り当ててもよい。また、図2において、BCLKは1PCMサンプルデータあたり40ビット分あり、従って空いていて通常破棄される8ビットの中に情報ビットを割り当てた。BCLKが32ビットの場合には空きビットがないが、オーディオデータ転送専用シリアルインターフェースは40ビットまたは64ビットに拡張する機能を通常搭載しており、BCLKを40ビットまたは64ビットに拡張することは容易である。またBCLKが他のビット数で設計されたとしても、情報ビットを割り当てることができることは言うまでもない。更に、本実施の形態においては、各PCMデータにオーディオデータが開始されたことを示すビット」及び「オーディオ時計を何サンプル分進めるかを示すビット群」を付加するものとして説明するが、例えば10PCMデータに1つなどとしてもよいことは言うまでもない。
図2に示す「オーディオデータが開始されたことを示すビット」及び「オーディオ時計を何サンプル分進めるかを示すビット群」は、情報ビット付加器126により各ビットが0又は1に設定される。
「オーディオデータが開始されたことを示すビット」は、オーディオデコーダ122が先頭のオーディオデータのデコードが開始したときに、先頭のオーディオデータのPCMサンプルデータの「オーディオデータが開始されたことを示すビット」に対して、1にセットされる。以後は、0にセットされる。
「オーディオ時計を何サンプル分進めるかを示すビット群」は、通常は値1が設定される。オーディオデータ数補正器125によってオーディオデータが追加された場合には、追加されたPCMサンプルデータに対して0が設定される。また、オーディオデータ数補正器125によってオーディオデータが削除された場合には、削除されたPCMサンプルデータの直前の又は直後に続くPCMサンプルデータに対して、削除されたPCMサンプルデータの個数を加えた値が設定される。例えば、2個のPCMサンプルデータを削除した場合には、値3が設定される。
また、図1に示す本実施の形態にかかるAV再生装置は、図20に示す従来の一般的なAV再生装置と異なり、オーディオ時計124をビデオ処理チップ100に搭載し、さらにビデオ処理チップ100には情報ビット検出器132が付加されている。
情報ビット検出器132は、前記の情報ビット付加器126でオーディオ転送専用シリアルインターフェースのPCMサンプルデータの中に付加された「オーディオデータが開始されたことを示すビット」及び「オーディオ時計を何サンプル分進めるかを示すビット群」の値を検出する。「オーディオデータが開始されたことを示すビット」が1であれば、オーディオ時計124に時計リセット信号を出力する。また、「オーディオ時計を何サンプル分進めるかを示すビット群」に従って、オーディオ時計124にカウント制御信号を出力する。オーディオ選択器131、情報ビット検出器132、及びオーディオ時計124はいずれもビデオ処理チップ100内に存在するため、リセット信号などに遅延が生じることがない、又は遅延が小さい。
オーディオ時計124は、時計リセット信号によってカウントがリセットされ、以後、オーディオ転送専用シリアルインターフェースのLRCKによってカウントされる。音楽転送専用シリアルインターフェースのLRCKは1PCMサンプルの転送周期を示すクロックであるため、カウントクロックとして使用できる。ただし、オーディオ時計124の1回のカウント動作は、「オーディオ時計を何サンプル分進めるかを示すビット群」によって何カウントするかが決まる。すなわち、「オーディオ時計を何サンプル分進めるかを示すビット群」の値が0の場合には、カウントを行わない。「オーディオ時計を何サンプル分進めるかを示すビット群」の値が1の場合には、1回のカウント動作でプラス1カウントを行う。「オーディオ時計を何サンプル分進めるかを示すビット群」の値が2の場合には、1回のカウント動作でプラス2カウントを行う。それより大きい値でも同様に、1回のカウント動作で「オーディオ時計を何サンプル分進めるかを示すビット群」の値に従ってカウントを行う。
このような本実施の形態にかかるAV再生装置の動作について説明するオーディオデコーダ122は圧縮されたオーディオストリームを入力し伸張処理を行ってオーディオデータを出力する。オーディオデコーダ122は、1回のデコード動作で複数のサンプル(例えばAACの場合1024サンプルなど)を生成するが、この動作は図20で説明した動作と同じである。また、オーディオデコーダ122は、先頭のオーディオデータのデコードの開始時に、情報ビット付加器126に対して、「オーディオデータが開始されたことを示すビット」を先頭のオーディオデータのPCMサンプルデータに付加するように指示する。
オーディオデータ数補正器125は、最初はオーディオデータの補正命令は受信していないのでオーディオデータに対して何もしない。情報ビット付加器126は、オーディオデコーダ122からの指示によって「オーディオデータが開始されたことを示すビット」を付加し、さらにオーディオデータ数補正器125からの指示によって「オーディオ時計を何サンプル分進めるかを示すビット群」を設定するが、PCMサンプルデータの追加も削除も行っていないので、各PCMサンプルデータに1を設定する。このように加工されたオーディオデータであるPCMサンプルデータは、オーディオ提示器123にてオーディオ転送専用シリアルインターフェースのフォーマットに変換され、ビデオ処理チップ100に出力される。
ビデオ処理チップ100のオーディオ選択器131は入力されたオーディオデータを提示する。ここで、情報ビット検出器132は、入力されたオーディオデータであるPCMサンプルデータに添付されている「オーディオデータが開始されたことを示すビット」及び「オーディオ時計を何サンプル分進めるかを示すビット群」を検出する。先頭のオーディオデータでは「オーディオデータが開始されたことを示すビット」は1であるので、オーディオ時計124をリセットする。オーディオ時計124はリセットされた後、PCMサンプルデータの入力に従ってカウントを行う。
図3は、本実施の形態のオーディオデータが増加又は削除されていないときのオーディオ時計が出力する時間通知の出力タイミングを示すタイミング図である。通常は、図3に示すように、44100サンプルごとにオーディオ時計から時間通知が出力される。
図14(a)に示すように、オーディオデータの提示がビデオデータの提示より早い場合に、ずれ検出器130から、オーディオデータの補正命令がオーディオデータ数補正器125に対して出力される。オーディオデータ数補正器125は、入力されるオーディオデータの補正命令に従って、オーディオデータのデータ数を増加させる。増加したオーディオデータであるPCMサンプルデータの「オーディオ時計を何サンプル分進めるかを示すビット群」には0が設定される。このように加工されたオーディオデータであるPCMサンプルデータは、オーディオ提示器123を通って情報ビット検出器132で検出され、オーディオ時計124のカウントが行われる。
図4は、本実施の形態のオーディオデータが増加されているときのオーディオ時計が出力する時間通知の出力タイミングを示すタイミング図である。オーディオ時計124が、44099までカウントした後、「オーディオ時計を何サンプル分進めるかを示すビット群」が0のために44099を2個のPCMサンプルデータ分保ち、次のカウントで1になると同時に、時間通知を出力している。
図14(b)に示すように、オーディオデータの提示がビデオデータの提示より遅い場合に、ずれ検出器130から、オーディオデータの補正命令がオーディオデータ数補正器125に対して出力される。オーディオデータ数補正器125は、入力されるオーディオデータの補正命令に従って、オーディオデータのデータ数を減少させる。減少したオーディオデータであるPCMサンプルデータの「オーディオ時計を何サンプル分進めるかを示すビット群」には削除された個数分が加算された値が設定される。このように加工されたオーディオデータであるPCMサンプルデータは、オーディオ提示器123を通って情報ビット検出器132で検出され、オーディオ時計124のカウントが行われる。
図5は、本実施の形態のオーディオデータが減少されているときのオーディオ時計が出力する時間通知の出力タイミングを示すタイミング図である。オーディオ時計124が、44097までカウントした後、「オーディオ時計を何サンプル分進めるかを示すビット群」が3のために、次のカウントで1になると同時に、時間通知を出力している。
以上の動作によって、通常の場合に対してサンプルデータを追加したり削除した場合には、オーディオ時計から出力される時間通知が遅くなったり早くなったりし、オーディオの提示とビデオとの提示の時間とをあわせる動作を行うことができる。
また、以上の例でわかるとおり、「オーディオ時計を何サンプル分進めるかを示すビット群」が追加された理由としては、図13に示すように、オーディオ時計124は、オーディオデータ数補正器125によって追加された分や削除された分を考慮してカウントされなければならないためである。
このような本実施の形態にかかるAV再生装置が、従来の問題点を解決し、ビデオとオーディオを正確に同期させることができる理由について説明する。図20に示す従来の一般的なAV再生装置において、オーディオ時計524から出力される時間通知がコマンド送信器533を通してビデオ処理チップ500に転送されていたが、図1に示す本実施の形態にかかるAV再生装置では、PCMサンプルデータに添付される「オーディオデータが開始されたことを示すビット」によってオーディオ時計をリセットし「オーディオ時計を何サンプル分進めるかを示すビット群」によってオーディオ時計をカウントする。このため、オーディオ時計124をビデオ処理チップ100に存在させることができ、オーディオ時計から出力する時間通知をコマンド転送用シリアルインターフェース141で転送する必要がない。
従って、図26に示す、AV再生装置をビデオ処理チップとオーディオ処理チップに分けてビデオにオーディオを合わせる場合におけるオーディオ時計の時間通知が大きく遅延したり、全く遅延しなかったりしたときの動作を示すタイミング図におけるオーディオ時計124から出力される時間通知が遅延することがなく、図14で示すビデオにオーディオを合わせて提示する場合の提示が合う様を表したタイミング図の理想的な同期動作を行うことができる。
第2の実施の形態.
図6は、本発明の第2の実施の形態にかかるAV再生装置を示す図である。なお、図6及び後述する図7、図8において、図1と同一構成要素には、同一の符号を付しその詳細な説明は省略する。ビデオデコーダ112は圧縮されたビデオストリームを入力し伸張処理を行ってビデオデータを出力する。ビデオクロック発生器111はビデオ提示器113にビデオの提示動作のためのクロックを発生する。ビデオ提示器113はビデオクロック発生器111から入力されるクロックをもとに、提示のための信号を生成し、入力されるビデオを混合する。提示の信号は、デジタルデータと仮定する。
一方、オーディオデコーダ122は圧縮されたオーディオストリームを入力し伸張処理を行ってオーディオデータを出力する。オーディオクロック発生器121はオーディオ提示器123にオーディオの提示動作のためのクロックを発生する。オーディオ提示器123はオーディオクロック発生器121から入力されるクロックをもとに、提示のための信号を生成し、入力されるオーディオを混合する。提示の信号は、デジタルデータと仮定する。図6では、ビデオに音声を合わせることは行わないので、オーディオデータ数補正器125は搭載されていない。
オーディオ時計124、情報ビット検出器132の動作については、図6に示す第1の実施の形態に係るAV再生装置での説明と同じである。ただし、本実施の形態においては、オーディオデータの時間調整をするものではなく、ビデオ提示時間を調整してオーディオとビデオの再生タイミングを同期させる。このため、情報ビット付加器126は、第1の実施の形態で示した「オーディオ時計を何サンプル分進めるかを示すビット群」を設定する必要がない。なお、例えば常に1に設定しておいてもよい。その他の点は第1の実施の形態と同様である。
このような図6に示す本実施の形態にかかるAV再生装置のビデオデータとオーディオデータの提示を合わせる動作は、第1の実施の形態と同様に、まずオーディオ時計124がリセットされ、PCMサンプルデータの入力ごと、又は常に1に設定されている「オーディオ時計を何サンプル分進めるかを示すビット群」を参照してオーディオ時計124をカウントし、ビデオ提示時間調整器115に時間通知出力する。ビデオ提示時間調整器115は、入力されるオーディオのタイミングを示す時間通知を元に、ビデオの提示時間を調整し、ビデオ提示器113に出力する。
本実施の形態においても、第1の実施の形態と同様の効果を奏する。従って、図6のようなAV再生装置であっても、第1の実施の形態と同じように、PCMサンプルデータに添付される「オーディオデータが開始されたことを示すビット」によってオーディオ時計をリセットし「オーディオ時計を何サンプル分進めるかを示すビット群」によってオーディオ時計をカウントするので、オーディオ時計はビデオ処理チップ100に存在させることができ、オーディオ時計から出力する時間通知をコマンド転送用シリアルインターフェースで転送する必要がない。
従って、図27のように、AV再生装置をビデオ処理チップとオーディオ処理チップに分けてオーディオにビデオを合わせる場合におけるオーディオ時計423の時間通知が大きく遅延したりまったく遅延しなかったりすることがなく、ビデオデータとオーディオデータの提示をあわせることができる。
第3の実施の形態.
図7は、本発明の第3の実施の形態にかかるAV再生装置を示す図である。図7に示すAV再生装置では、デコード処理チップ102とAV提示用チップ103に分かれている。このAV再生装置は、ビデオにオーディオを合わせて提示する。図7において、ビデオデコーダ112、ビデオクロック発生器111、ビデオ提示器113、ビデオ時計114、オーディオデコーダ122、オーディオクロック発生器121、オーディオ提示器123、オーディオ選択器131、ずれ検出器103、オーディオデータ数補正器125は、図1に示す第1の実施の形態と同様である。
このような図7に示すAV再生装置のビデオデータとオーディオデータの提示を合わせる動作は、図22のAV再生装置と同様であるが、オーディオ時計124のリセット信号は、コマンドではなく、第1の実施の形態で説明したように、情報ビット付加器126で付加された「オーディオデータが開始されたことを示すビット」の値を検出して行う。
すなわち、図22の従来のAV再生装置におけるオーディオデコーダ122からの時計リセット信号をコマンド送信器133とコマンド転送用シリアルインターフェースを通してAV提示用チップ103に転送することを行わない。
従って、PCMサンプルデータに添付される「オーディオデータが開始されたことを示すビット」によってオーディオ時計124のリセット信号を伝達してオーディオ時計124のリセットが正確に行われる。このため、図28で示すように、オーディオ時計のリセット信号が遅延することがなく、ビデオデータとオーディオデータの提示を合わせることができる。
第4の実施の形態.
図8は、本発明の第4の実施の形態におけるAV再生装置を示す図である。図8のAV再生装置では、図7と同様に、デコード処理チップ102とAV提示用チップ103に分かれている。ただし、このAV再生装置は、オーディオにビデオを合わせて提示する。
図8において、ビデオデコーダ112、ビデオクロック発生器111、ビデオ提示器113、ビデオ提示時間調整器115、オーディオデコーダ122、オーディオクロック発生器121、オーディオ提示器123、オーディオ選択器131、ずれ検出器103の動作については、図1に示す第1の実施の形態と同様である。オーディオ時計124、情報ビット検出器132の動作についても、第1の実施の形態と同様である。情報ビット付加器126は、「オーディオ時計を何サンプル分進めるかを示すビット群」を設定しないこととすることができる。なお、例えば常に1に設定しておいてもよい。
オーディオ時計124のリセット信号は、第1の実施の形態と同様、情報ビット付加器126で付加された「オーディオデータが開始されたことを示すビット」の値を検出して行う。
従って、デコード処理チップとAV提示用チップに分かれていてオーディオにビデオを合わせて提示する場合でも、第3の実施の形態と同様、PCMサンプルデータに添付される「オーディオデータが開始されたことを示すビット」によってオーディオ時計124のリセット信号を伝達してオーディオ時計124のリセットが正確に行われるため、図29での説明と同様、オーディオ時計のリセット信号が遅延することがなく、ビデオデータとオーディオデータの提示をあわせることができる。
以上のように、本実施の形態においては、圧縮されたオーディオデータとビデオデータをデコードし提示するシステムにおいて、オーディオ処理とビデオ処理が別々のチップに存在した場合、又はデコード処理と提示処理が別々のチップに存在した場合で、提示のためのオーディオデータとビデオデータの同期をとる必要がある場合に、ビデオデータの提示タイミングとオーディオデータの提示タイミングを測定するための機能をひとつのチップ内に搭載でき、オーディオ再生時間のカウントを容易にかつ高精度に行うことができ、ビデオの画像提示との同期が容易となる。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。例えば、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
本発明の第1の実施の形態にかかるビデオとオーディオの同期をとって提示するAV再生装置を示す図である。 本発明の第1の実施の形態にかかるAV再生装置で用いられるオーディオデータ転送専用シリアルインターフェースの詳細なタイミング図である。 本発明の第1の実施の形態のオーディオデータが増加又は削除されていないときのオーディオ時計が出力する時間通知の出力タイミングを示すタイミング図である 本発明の第1の実施の形態のオーディオデータが増加されているときのオーディオ時計が出力する時間通知の出力タイミングを示すタイミング図である。」 本発明の第1の実施の形態のオーディオデータが減少されているときのオーディオ時計が出力する時間通知の出力タイミングを示すタイミング図である。 本発明の第2の実施の形態にかかるAV再生装置を示す図である。 本発明の第3の実施の形態にかかるAV再生装置を示す図である。 本発明の第4の実施の形態におけるAV再生装置を示す図である。 特許文献1に記載のビデオとオーディオの同期をとって提示するビデオオーディオ再生装置である。 特許文献2に記載のビデオとオーディオの同期をとって再生するAV再生装置である。 従来の技術によるビデオにオーディオを合わせて提示する一般的なAV再生装置を示す図である。 従来の技術によるオーディオにビデオを合わせて提示する一般的なAV再生装置を示す図である。 オーディオ時計が出力する時間通知の出力タイミングを示すタイミング図である。 ビデオにオーディオを合わせて提示する場合の提示が合う様を表したタイミング図である。 オーディオにビデオを合わせて提示する場合の提示が合う様を表したタイミング図である。 特許文献1におけるAV再生装置を複数のチップから構成した場合の例を示す図である 許文献1におけるAV再生装置を複数のチップから構成した場合の他の例を示す図である。 特許文献2におけるAV再生装置を複数のチップから構成した場合の例を示す図である。 特許文献2におけるAV再生装置を複数のチップから構成した場合の他の例を示す図である。 複数のチップ構成からなる一般的なAV再生装置である。 複数のチップ構成からなる一般的なAV再生装置を示す図である。 複数のチップ構成からなる一般的なAV再生装置の別の例である。 複数のチップ構成からなる一般的なAV再生装置の別の例である。 従来のAV再生装置で用いられるコマンドデータ転送用シリアルインターフェースの詳細な構成図及びタイミング図である。 従来のAV再生装置で用いられるオーディオデータ転送専用シリアルインターフェースの詳細な構成図及びタイミング図である。 AV再生装置をビデオ処理チップとオーディオ処理チップに分けてビデオにオーディオを合わせる場合の動作を示すタイミング図である。 AV再生装置をビデオ処理チップとオーディオ処理チップに分けてオーディオにビデオを合わせる場合の動作を示すタイミング図である。 AV再生装置をデコード処理チップとAV提示用チップに分けてビデオにオーディオを合わせる場合の動作を示すタイミング図である。 AV再生装置をデコード処理チップとAV提示用チップに分けてオーディオにビデオを合わせる場合の動作を示すタイミング図である。
符号の説明
101 オーディオ処理チップ
103 検出器
109 変換部
111 ビデオクロック発生器
112 ビデオデコーダ
113 ビデオ提示器
114 タイマ
114 ビデオ時計
115 ビデオ提示時間調整器
116 カウント部
121 オーディオクロック発生器
122 オーディオデコーダ
123 オーディオ提示器
124 オーディオ時計
125 オーディオデータ数補正器
126 情報ビット付加器
130 ずれ検出器
131 オーディオ選択器
132 情報ビット検出器
141 コマンド転送用シリアルインターフェース
142 オーディオ転送用専用シリアルインターフェース

Claims (22)

  1. ビデオデータとオーディオデータとを同期して再生する再生装置であって、
    ビデオストリームを復号してビデオデータを生成するビデオデコーダと、
    オーディオストリームを復号してオーディオデータを生成するオーディオデコーダと、
    前記ビデオ及びオーディオの再生タイミングを通知するそれぞれビデオタイミング通知部及びオーディオタイミング通知部と、
    前記ビデオと前記オーディオの同期のための情報である情報ビットを前記オーディオデータに付加する情報ビット付加部と、
    前記ビデオタイミング通知部及びオーディオタイミング通知部からの再生タイミングの通知に基づき前記オーディオデータの再生長さを調整するオーディオ再生時間調整部と、
    前記ビデオデコーダからのビデオデータを再生するビデオ再生部と、
    前記オーディオ再生時間調整部から再生長さを調整済みのオーディオデータを受け取り再生するオーディオデータ再生部とを有し、
    前記オーディオタイミング通知部は、前記情報ビットに基づきオーディオの再生タイミングを通知する、再生装置。
  2. 前記ビデオタイミング通知部及びオーディオタイミング通知部からの再生タイミングの通知に基づき両者のずれを検出するずれ検出部を有し、
    前記オーディオ再生時間調整部は、前記ずれ検出部が検出したずれ量に基づき前記オーディオデータの再生長さを調整する
    ことを特徴とする請求項1記載の再生装置。
  3. ビデオデータとオーディオデータとを同期して再生する再生装置であって、
    ビデオストリームを復号してビデオデータを生成するビデオデコーダと、
    オーディオストリームを復号してオーディオデータを生成するオーディオデコーダと、
    前記オーディオデータ再生タイミングを通知するオーディオタイミング通知部と、
    前記ビデオと前記オーディオの同期のための情報である情報ビットを前記オーディオデータに付加する情報ビット付加部と、
    前記オーディオタイミング通知部からの通知に基づきビデオの再生長さを調整するビデオ再生時間調整部と、
    前記ビデオ再生時間調整部から再生長さを調整済みのビデオデータを受け取り再生するビデオ再生部と、
    前記情報ビット付加部からのオーディオデータを再生するオーディオ再生部とを有し、
    前記オーディオタイミング通知部は、前記情報ビットに基づきオーディオの再生タイミングを通知する、再生装置。
  4. 前記情報ビットは、各データ又はデータ群におけるデコード開始位置を示すビットである開始ビットを含む
    ことを特徴とする請求項1乃至3のいずれか1項記載の再生装置。
  5. 前記ビデオデコーダが生成するオーディオデータは、複数のサンプルからなるサンプルデータであり、
    前記情報ビットは、1又は複数のサンプルの追加又は削除を示す調整ビットを含む
    ことを特徴とする請求項4記載の再生装置。
  6. 前記開始ビットに基づき前記オーディオタイミング通知部のカウントをリセットするリセット信号を出力する情報ビット検出部を有する
    ことを特徴とする請求項4又は5記載の再生装置。
  7. 前記情報ビット検出部は、前記調整ビットに基づき前記オーディオタイミング通知部にオーディオタイミング通知部を何サンプル分進めるかを示すカウント制御信号を出力する
    ことを特徴とする請求項4乃至6のいずれか1項記載の再生装置。
  8. 前記ビデオデコーダ、前記ビデオ再生部、オーディオタイミング通知部及びオーディオ再生部を含むビデオチップと、前記オーディオデコーダを含むオーディオチップとを有する
    ことを特徴とする請求項4乃至7のいずれか1項記載の再生装置。
  9. 前記ビデオデコーダ及び前記オーディオデコーダを含むデコードチップと、前記ビデオ再生部、オーディオ再生部及びオーディオタイミング通知部を含む再生チップとを有する
    ことを特徴とする請求項4乃至7のいずれか1項記載の再生装置。
  10. 前記ビデオチップとオーディオチップ又は前記デコードチップと前記再生チップとを接続するオーディオ転送用シリアルインターフェースを有し、
    前記情報ビット付加部は、前記シリアルインターフェースの1フレーム中の空きビットに前記情報ビットを割り当てる
    ことを特徴とする請求項8又は9記載の再生装置。
  11. 前記情報ビット付加部は、サンプルデータの増加をした場合は、前記調整ビットを0にする
    ことを特徴とする請求項10記載の再生装置。
  12. 前記情報ビット付加部は、サンプルデータの減少をした場合は、前記調整ビットを前記サンプルデータの減少分増加する
    ことを特徴とする請求項10又は11記載の再生装置。
  13. ビデオデータとオーディオデータとを同期して再生する再生装置の再生方法であって、
    ビデオ及びオーディオデータをそれぞれデコードし、
    前記ビデオと前記オーディオの同期のための情報である情報ビットを前記オーディオデータに付加し、
    前記情報ビットに基づき、前記オーディオの再生タイミングを通知するオーディオタイミング通知部をリセットし、
    前記ビデオの再生タイミングを通知するそれぞれビデオタイミング通知部及び前記オーディオタイミング通知部からの通知に基づきオーディオデータの再生長さを調整し、
    前記ビデオデコーダからのビデオデータをビデオ再生部により再生し、
    前記再生長さを調整済みのオーディオデータを受け取りオーディオ再生部により再生する、再生方法。
  14. 前記ビデオタイミング通知部及び前記オーディオタイミング通知部からの通知に基づき両者のずれを検出し、
    前記検出した結果に基づきオーディオデータの再生長さを調整する
    ことを特徴とする請求項13記載の再生方法。
  15. ビデオデータとオーディオデータとを同期して再生する再生装置の再生方法であって、
    ビデオデコーダ及びオーディオデコーダによりそれぞれビデオ及びオーディオデータをそれぞれデコードし、
    オーディオデータのデコード時に前記ビデオと前記オーディオの同期のための情報である情報ビットを付加し、
    前記情報ビットに基づき、前記オーディオの再生タイミングを通知するオーディオタイミング通知部をリセットし、
    前記オーディオタイミング通知部からの通知に基づき前記ビデオデータの再生長さを調整し、
    前記再生長さを調整済みのビデオデータを受け取りビデオ再生部により再生し、
    前記情報ビットが付加されたオーディオデータをオーディオ再生部により再生する、再生方法。
  16. 前記情報ビットは、各データ又はデータ群におけるデコード開始位置を示すビットである開始ビットを含む
    ことを特徴とする請求項13乃至15のいずれか1項記載の再生方法。
  17. デコードしたオーディオデータは、複数のサンプルからなるサンプルデータであり、
    前記情報ビットは、1又は複数のサンプルの追加又は削除を示す調整ビットを含む
    ことを特徴とする請求項16記載の再生方法。
  18. 前記開始ビットに基づき前記オーディオタイミング通知部のカウントをリセットするリセット信号を出力する
    ことを特徴とする請求項16又は17記載の再生方法。
  19. 前記調整ビットに基づき前記オーディオタイミング通知部にオーディオタイミング通知部を何サンプル分進めるかを示すカウント制御信号を出力する
    ことを特徴とする請求項16乃至18のいずれか1項記載の再生方法。
  20. 前記再生装置は、前記ビデオデコーダ、前記ビデオ再生部、オーディオタイミング通知部及びオーディオ再生部を含むビデオチップと、前記オーディオデコーダを含むオーディオチップとを有する
    ことを特徴とする請求項16乃至19のいずれか1項記載の再生方法。
  21. 前記再生装置は、前記ビデオデコーダ及び前記オーディオデコーダを含むデコードチップと、前記ビデオ再生部、オーディオ再生部及びオーディオタイミング通知部を含む再生チップとを有する
    ことを特徴とする請求項16乃至19のいずれか1項記載の再生方法。
  22. 前記ビデオチップとオーディオチップ又は前記デコードチップと前記再生チップとを接続するオーディオ転送用シリアルインターフェースの1フレーム中の空きビットに前記情報ビットを割り当てる
    ことを特徴とする請求項20又は21記載の再生方法。
JP2008107107A 2008-04-16 2008-04-16 再生装置及び再生方法 Pending JP2009259333A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008107107A JP2009259333A (ja) 2008-04-16 2008-04-16 再生装置及び再生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008107107A JP2009259333A (ja) 2008-04-16 2008-04-16 再生装置及び再生方法

Publications (1)

Publication Number Publication Date
JP2009259333A true JP2009259333A (ja) 2009-11-05

Family

ID=41386570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008107107A Pending JP2009259333A (ja) 2008-04-16 2008-04-16 再生装置及び再生方法

Country Status (1)

Country Link
JP (1) JP2009259333A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015156584A (ja) * 2014-02-20 2015-08-27 富士通株式会社 動画像音声同期装置、動画像音声同期方法及び動画像音声同期用コンピュータプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015156584A (ja) * 2014-02-20 2015-08-27 富士通株式会社 動画像音声同期装置、動画像音声同期方法及び動画像音声同期用コンピュータプログラム

Similar Documents

Publication Publication Date Title
JP4991129B2 (ja) 映像音声再生装置および映像音声再生方法
JP3925311B2 (ja) データ配信システム
US7812886B2 (en) AV synchronization system
CN100588261C (zh) 将视频数据及音频数据同步的方法及系统
JP2007124044A (ja) 基準クロック再生回路及びデータ受信装置
US8862256B2 (en) Electronic apparatus
KR101787424B1 (ko) 패킷화된 통신 네트워크를 통해 통신되는 스트리밍 콘텐츠를 위한 클럭 복원 메커니즘
US8897374B2 (en) Audio visual system and decoder therefor
US20050282580A1 (en) Video and audio synchronization
WO2017082059A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2009259333A (ja) 再生装置及び再生方法
JP5186094B2 (ja) 通信端末、マルチメディア再生制御方法、およびプログラム
JP4359024B2 (ja) 同期制御方法と装置およびそれを用いた同期再生装置およびテレビジョン受信装置
JP2001168883A (ja) タイムスタンプのオフセット調整方法及びそれを用いたパケット伝送装置
JP2002176643A (ja) 映像・音声復号処理における映像・音声の同期再生方式
JP4850041B2 (ja) 映像再生システム、映像再生の同期方法および映像再生端末
JP6684433B2 (ja) 送信装置、送信方法、並びに、プログラム
JP2005303816A (ja) 動画再生装置
JP5089225B2 (ja) 中継処理方法及び中継ノード装置
JP2007201797A (ja) 伝送システム及び映像出力方法
JP2020145585A (ja) 同期化装置、同期化方法及びプログラム
JP2005229168A (ja) メディア出力システムとその同期誤差制御方法およびプログラム
JP2007036539A (ja) デコード方法、デコード合成制御装置及び画像合成システム
JP2009111608A (ja) 再生装置および再生方法
JP2006246296A (ja) データ処理装置及びデータ処理方法