JP2004166116A - 動画像符号化装置 - Google Patents
動画像符号化装置 Download PDFInfo
- Publication number
- JP2004166116A JP2004166116A JP2002331900A JP2002331900A JP2004166116A JP 2004166116 A JP2004166116 A JP 2004166116A JP 2002331900 A JP2002331900 A JP 2002331900A JP 2002331900 A JP2002331900 A JP 2002331900A JP 2004166116 A JP2004166116 A JP 2004166116A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- encoded data
- data
- video signal
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】発生符号レートと、伝送路に出力される符号レートを調整するための、出力バッファのアンダーフローを防ぎつつ、伝送の運用規定を遵守する。
【解決手段】入力された映像信号を画面内で一定の領域のブロック毎に符号化する符号化処理手段と、前記符号化処理手段により符号化された少なくとも1画面分の符号化データを格納するための記憶手段と、前記記憶手段に符号化データを格納すると、所定充足量を超過するか否かを判定し、所定充足量を超過し、且つ時間的に連続する符号化データの間隔が所定の間隔以下になるように、所定の符号化方法で前記映像信号を再符号化する。
【選択図】 図1
【解決手段】入力された映像信号を画面内で一定の領域のブロック毎に符号化する符号化処理手段と、前記符号化処理手段により符号化された少なくとも1画面分の符号化データを格納するための記憶手段と、前記記憶手段に符号化データを格納すると、所定充足量を超過するか否かを判定し、所定充足量を超過し、且つ時間的に連続する符号化データの間隔が所定の間隔以下になるように、所定の符号化方法で前記映像信号を再符号化する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、動画像を効率良く圧縮する画像符号化方法とそれを正しく復号化する画像復号化方法に関する。
【0002】
【従来の技術】
近年、音声、画像、その他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア、つまり新聞、雑誌、テレビ、ラジオ、電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。
【0003】
ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトであるのに対し、音声の場合1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をディジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、64Kbit/s〜1.5Mbits/sの伝送速度を持つサービス総合ディジタル網(ISDN:Integrated Services Digital Network)によってすでに実用化されているが、テレビ・カメラの映像をそのままISDNで送ることは不可能である。
【0004】
そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、ITU−T(国際電気通信連合 電気通信標準化部門)で国際標準化されたH.261やH.263規格の動画圧縮技術が用いられている。また、MPEG−1規格の情報圧縮技術によると、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。
【0005】
ここで、MPEG(Moving Picture Experts Group)とは、動画像信号圧縮の国際規格であり、MPEG−1は、動画像信号を1.5Mbpsまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG−1規格を対象とする伝送速度が主として約1.5Mbpsに制限されていることから、さらなる高画質化の要求をみたすべく規格化されたMPEG−2では、動画像信号が2〜15Mbpsに圧縮される。さらに現状では、MPEG−1、MPEG−2と標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11)によって、MPEG−1、MPEG−2を上回る圧縮率を達成し、更に物体単位で符号化・復号化・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG−4が規格化された。MPEG−4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号化に拡張されている。
【0006】
現状MPEG−4はインターネットや、第3世代携帯端末などで用いられる、64kbps〜384kbpsといった低ビットレートでの実時間伝送用途が主となっている。
【0007】
伝送系においては、復号側で受信した符号化データが正しく復号できるように、標準復号器のバッファモデル(以下VBVバッファ:Video Buffering Verifier Buffer)というものを想定し、このバッファモデルを満たすように符号化制御を行う。復号側では受信した符号化データは一定時間VBVバッファに蓄えられ、復号時刻が来ると、1フレーム分のデータがVBVバッファから瞬時に引き出されるモデルが仮定されている。符号化装置は、このVBVバッファモデルのバッファが破綻しないようなストリームを出力する必要がある。
【0008】
その上、実時間伝送においては、それぞれの用途に応じた運用規定に基づき、伝送されるデータ、すなわち符号化データの伝送時間間隔などが厳密に規定されている。例えば復号する画像サイズ等の情報を記憶したCI(Configuration Information)データは、復号に必須の情報であるため、伝送データの途中からでも復号を行うために一定時間間隔で挿入されている。また、CIの次に挿入される符号化データは、既に復号した画像を参照して復号しない、画面内符号化モードで符号化されるのが一般的であるが、画面内符号化(I−VOP符号化)は、既に復号化した画像との差分を用いて符号化する画面間符号化(P−VOP)と比較して、発生符号量が多いため、バッファの占有量が大きく変動しやすい。
【0009】
実際のバッファ制御の一例を図11に示す。図11において、横軸1104は時刻を表わし、縦軸1100はバッファ占有量を示す。1102はバッファの最大値であり、1112はバッファの下限値である。1116は時刻T1からT2の時間間隔を意味し、1118は時刻T2からT4の時間間隔を意味する。1108、1120はそれぞれ時刻T1、T3における符号化データ発生量を意味する。
【0010】
伝送系においては、固定ビットレート制御が一般的に行われており、その場合は、図中の傾き1110によって、一定のビット数がバッファに蓄積される。蓄積された符号化データは、復号時刻T1、T2、T3…の時点でバッファから引き抜かれる。引き抜かれるタイミングでデータが足りないと、復号側での遅延が発生し、データが多すぎると伝送されるデータがバッファに書き込めないという不具合があるため、バッファ占有量1100は復号時刻において下限値1112と上限値1102の間で推移し、且つ復号時刻のデータが常にバッファに蓄積されていることが望ましい。さらに、システムの安定性の面から、下限値1112より大きい値をバッファ制御下限値1106とする場合もある。図示していないが、バッファ上限値についても同様で、バッファの最大値よりも小さい値をバッファ制御上限値とする場合がある。符号化制御において、入力画像を符号化することにより得られた符号化データが多い場合には、VBVバッファが下限値1102を下回ってしまう、すなわちアンダーフローしてしまうため、従来は画像のコマ落としを行うことで、ある程度のVBVバッファの破綻を許容したり、画面内で符号量を制御して、VBVバッファが破綻するのを回避している(例えば、非特許文献1参照)。
【0011】
【非特許文献1】
高橋健志、他4名、“低遅延MPEG−4通信システムにおける解像度変換の有効性”、[平成14年9月15日検索]、インターネット
<URL: www.tom.comm.waseda.ac.jp/ ̄take/web/ieiceJan2002.pdf>
【0012】
【発明が解決しようとする課題】
しかしながら、シーケンス最初のデータや、異なるシーケンスの切れ目においては、前記運用規定などで定められるデータ間隔を遵守するため、コマ落としができないという問題点がある。これについて図11を用いて説明する。
【0013】
図11では、符号化データは時刻に比例した一定の傾き1110で増加し、表示時刻T1、T2、T3において、1フレーム分のデータがバッファから引き出される。図11中において、時刻T3のように、符号化したデータが大きい場合には、VBVバッファの占有量がマイナスになる、つまりアンダーフローの状況が生じてしまう。このような場合は、T3に対応するフレームのデータを送信せず、スキップする、すなわち、点線1114の推移を行うことでアンダーフローを回避することが出来る。この場合、時刻T3において符号化データが送られないことになるため、時刻T2とT4の間隔は、T1とT2の間隔よりも広くなってしまう。仮に、運用規定上時刻T3のタイミングでCIを出力しなければならない場合は、図11の制御では実現できない。
【0014】
さらに、符号化する画像サイズやフレームレートといったパラメータ変更に伴い、シーケンスが切り替わるような場合についても同様の課題が生じている。以下図12を用いて説明する。図12において、1220はシーケンスが切り替わる前の符号化制御を意味し、1222はシーケンス切り替え後の符号化制御を意味している。シーケンスが切り替わった場合でも、バッファ制御は継続されるため、切れ目の部分でバッファの破綻が生じないように制御を行わなければならない。シーケンスの切れ目では、映像情報がまったく異なる場合は画面間符号化が使用できないため、画面内符号化された符号化データが挿入される。その場合、入力画像の性質によっては発生符号量が多くなり、時刻T3において、破線のようにバッファ占有量がバッファ下限値1106を下回るような場合がある。このような場合、T2、T3間の時間間隔が一定間隔を遵守できないため、前述した運用規定などで、時間間隔を固定に規定している場合には、従来の制御では規定を遵守出来ない。
【0015】
【課題を解決するための手段】
この課題を解決するために、第1の発明は、入力された映像信号を画面内で一定の領域のブロック毎に符号化する符号化処理手段と、前記符号化処理手段により符号化された少なくとも1画面分の符号化データを格納するための記憶手段と、前記記憶手段に符号化データを格納すると、所定充足量を超過するか否かを判定し、所定充足量を超過し、且つ時間的に連続する符号化データの間隔が所定の間隔以下になるように、所定の符号化方法で前記映像信号を再符号化するように前記符号化処理手段を制御するレート制御手段を備えたことを特徴とする動画像符号化装置である。
【0016】
第2の発明は、映像信号を符号化した圧縮符号化データであって、前記圧縮符号化データ内に含まれる、前記圧縮符号化データを復号するために必要なCI(Configuration Information)データが一定時間内に挿入されることを目的として、CIデータに続く符号化データは、所定の画面内圧縮符号化を行っていることを特徴とした、圧縮符号化データ構造である。
【0017】
【発明の実施の形態】
以下、本発明の実施の形態について、図1から図6を用いて説明する。
【0018】
(実施の形態1)
図1は本発明方法を実施する符号化装置の構成例を示すブロック図である。図1において、0102は符号化装置の入力、0104は符号化回路、0108は符号化回路の結果を保持する出力バッファメモリ、0112は符号化制御回路、0116は符号化装置の出力である。0106は符号化データ、0110はバッファ残量値である。このように構成される符号化装置の動作を以下説明する。輝度信号と色差信号で構成される映像信号信号は、符号化装置の入力0102から符号化回路0104に入力され、符号化制御回路0112から0114を介して入力される、符号化タイプ、量子化パラメータなどの符号化情報に基づいて符号化される。符号化回路0104の詳細については図2において後述する。符号化回路0104によって符号化された符号化データは、0106を介して、出力バッファメモリ0108に出力され、出力バッファメモリ0108のバッファ占有量は0110を介して符号化制御回路0112に入力される。符号化制御回路0112は、入力されたバッファ占有量を基に、バッファ占有量がアンダーフローしないように、次に符号化する際の符号化タイプ、量子化パラメータなどの符号化パラメータを0118経由で符号化制御回路0112に指示する。符号化制御回路0112の詳細については、図4において後述する。なお、符号化回路0104について今回詳解していないが、MPEG、H.261、H.263、H.264などのいずれの動画圧縮符号化でもよいものとする。
【0019】
図2は図1で説明した画像符号化装置内の符号化回路0104の内部図である。また、図3、図4は本発明の画像符号化像値によるバッファ制御の概念図を示す。なお、図3、図4中の各要素については、別図と同一のものについては同じ符号を付与し、その説明を省略する。以下、図2、図3、図4を用いて、符号化制御回路0112の動作について説明する。
【0020】
図3中の時刻T3において、画面内符号化により発生した符号化ビット数がXXXX分発生した場合、図2中の0110から入力されるバッファ占有量は、バッファ占有量の下限値1106を下回った値が入力される。この場合、符号量制御回路0202は、時刻T3が復号に必要なCIデータを出力するタイミングである場合は、コマ落としなどの方法が使用できないため、CIデータの後に、発生した符号化データの代わりに、通常とは別の特殊符号化モードを符号化タイプ制御回路0206に出力する。特殊符号化とは、符号化する映像信号を符号化する際の符号化単位がすべて一定値の画素信号で構成されると仮定し、符号化するモードである。
【0021】
一定値とは、黒レベル(輝度信号レベル0、色差信号レベル128、128もしくは、規格により定められた黒レベル:例 Recommendation ITU−R BT.601では輝度信号レベル16、色差信号レベル128、128を黒レベルと定義)の値であるものとし、符号化を行うものである。これにより情報量を削減することが可能となる。
【0022】
その他、入力画像をDCTなどの直交変換を施した結果に対して、直流成分のみを符号化する方法などを用いても良い。以上の特殊符号化を行うことによって、時刻T3の発生符号量を304に抑制し、バッファ占有量が下限値1106を下回らないように制御する。
【0023】
図4は、入力される映像データのフォーマットなどが変更されたなどの理由により、符号化データのまとまりの単位であるシーケンスが切り替わった場合のバッファ制御図である。図のバッファ占有グラフのうち、点線部1120が切り替え前のシーケンスを意味し、実線部1122が切り替え後のセッションを意味している。シーケンスが切り替わった場合でも、バッファ制御は継続されるため、切れ目の部分でバッファの破綻が生じないように制御を行わなければならない。シーケンスの切れ目では、画面間符号化ではなく、画面内符号化された符号化データが挿入されるため、入力画像の性質によっては発生符号量が多くなり、時刻T3において、0402の破線のようにバッファ占有量がバッファ下限値1106を下回るような場合がある。このような場合、T2、T3間の時間間隔が一定間隔を遵守できないため、図2の符号量制御回路では、CIデータの後に、前述の特殊符号化を行うように、特殊符号化モードを符号化タイプ制御回路に出力する。符号化タイプ制御回路では、0114を介して、符号化回路に特殊符号化モード選択信号を出力する。以上の制御を行うことによって、セッション間において、符号化データ間隔を遵守するような符号化制御を行うことが出来る。
【0024】
なお、アンダーフローが生じない場合は、符号量制御回路はバッファが破綻しないような量子化パラメータを符号化タイプ制御回路に出力する。
【0025】
図5は図1で説明した符号化器の内部構成を示すものである。図5において、図1の符号化制御回路からの出力0114を元に、符号化タイプに応じた0504、0506、0508に示すような符号化器を切り替えて、0102から入力された映像信号を一時的に保持している、少なくとも1以上のフレームメモリ内の映像信号を符号化する。なお、符号化制御信号からの出力信号によって、符号化する映像信号を切り替えることも可能である。なお、図2、3、4で説明した特殊符号化において、一定値の映像信号を符号化する符号化器については、あらかじめ符号化したデータをメモリ上に保持しておいて、モードが選択された場合にはメモリの内容を出力するような構成でも実現できる。
【0026】
(実施の形態2)
さらに、図1の符号化装置のような制御を行うことによって得られた、CI情報の直後に、前述の特殊符号化を行った符号化データが挿入されたデータ構造をもつ符号化データを実時間で送出することによって、運用規定で定められた符号化データ間隔を遵守しつつ、符号化バッファ制御を破綻しないシステムを構築できる。
【0027】
(実施の形態3)
さらに、上記各実施の形態で示した動画像符号化装置を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
【0028】
図6は、上記上記各実施の形態の動画像符号化装置を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
【0029】
図6(b)は、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示し、図6(a)は、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムが記録されている。
【0030】
また、図6(c)は、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。動画像符号化装置を実現する上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブを介して書き込む。また、フレキシブルディスク内のプログラムにより動画像符号化装置を実現する上記動画像符号化装置をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。
【0031】
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
【0032】
(実施の形態4)
さらにここで、上記実施の形態で示した動画像符号化装置の応用例とそれを用いたシステムを説明する。
【0033】
図7は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示すブロック図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex107〜ex110が設置されている。
【0034】
このコンテンツ供給システムex100は、例えば、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および基地局ex107〜ex110を介して、コンピュータex111、PDA(personal digital assistant)ex112、カメラex113、携帯電話ex114、カメラ付きの携帯電話ex115などの各機器が接続される。
【0035】
しかし、コンテンツ供給システムex100は図7のような組合せに限定されず、いずれかを組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex107〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。
【0036】
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器である。また、携帯電話は、PDC(Personal Digital Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband−Code Division Multiple Access)方式、若しくはGSM(Global System for Mobile Communications)方式の携帯電話機、またはPHS(Personal Handyphone System)等であり、いずれでも構わない。
【0037】
また、ストリーミングサーバex103は、カメラex113から基地局ex109、電話網ex104を通じて接続されており、カメラex113を用いてユーザが送信する符号化処理されたデータに基づいたライブ配信等が可能になる。撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするサーバ等で行ってもよい。また、カメラex116で撮影した動画データはコンピュータex111を介してストリーミングサーバex103に送信されてもよい。カメラex116はデジタルカメラ等の静止画、動画が撮影可能な機器である。この場合、動画データの符号化はカメラex116で行ってもコンピュータex111で行ってもどちらでもよい。また、符号化処理はコンピュータex111やカメラex116が有するLSIex117において処理することになる。なお、画像符号化・復号化用のソフトウェアをコンピュータex111等で読み取り可能な記録媒体である何らかの蓄積メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込んでもよい。さらに、カメラ付きの携帯電話ex115で動画データを送信してもよい。このときの動画データは携帯電話ex115が有するLSIで符号化処理されたデータである。
【0038】
このコンテンツ供給システムex100では、ユーザがカメラex113、カメラex116等で撮影しているコンテンツ(例えば、音楽ライブを撮影した映像等)を上記実施の形態同様に符号化処理してストリーミングサーバex103に送信する一方で、ストリーミングサーバex103は要求のあったクライアントに対して上記コンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号化することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等がある。このようにすることでコンテンツ供給システムex100は、符号化されたデータをクライアントにおいて受信して再生することができ、さらにクライアントにおいてリアルタイムで受信して復号化し、再生することにより、個人放送をも実現可能になるシステムである。
【0039】
このシステムを構成する各機器の符号化には上記各実施の形態で示した画像符号化装置を用いるようにすればよい。
【0040】
その一例として携帯電話について説明する。
【0041】
図8は、上記実施の形態で説明した動画像符号化装置を用いた携帯電話ex115を示す図である。携帯電話ex115は、基地局ex110との間で電波を送受信するためのアンテナex201、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex203、カメラ部ex203で撮影した映像、アンテナex201で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex202、操作キーex204群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex208、音声入力をするためのマイク等の音声入力部ex205、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号化されたデータを保存するための記録メディアex207、携帯電話ex115に記録メディアex207を装着可能とするためのスロット部ex206を有している。記録メディアex207はSDカード等のプラスチックケース内に電気的に書換えや消去が可能な不揮発性メモリであるEEPROM(Electrically Erasable and Programmable Read Only Memory)の一種であるフラッシュメモリ素子を格納したものである。
【0042】
さらに、携帯電話ex115について図9を用いて説明する。携帯電話ex115は表示部ex202及び操作キーex204を備えた本体部の各部を統括的に制御するようになされた主制御部ex311に対して、電源回路部ex310、操作入力制御部ex304、画像符号化部ex312、カメラインターフェース部ex303、LCD(Liquid Crystal Display)制御部ex302、画像復号化部ex309、多重分離部ex308、記録再生部ex307、変復調回路部ex306及び音声処理部ex305が同期バスex313を介して互いに接続されている。
【0043】
電源回路部ex310は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付ディジタル携帯電話ex115を動作可能な状態に起動する。
【0044】
携帯電話ex115は、CPU、ROM及びRAM等でなる主制御部ex311の制御に基づいて、音声通話モード時に音声入力部ex205で集音した音声信号を音声処理部ex305によってディジタル音声データに変換し、これを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して送信する。また携帯電話ex115は、音声通話モード時にアンテナex201で受信した受信信号を増幅して周波数変換処理及びアナログディジタル変換処理を施し、変復調回路部ex306でスペクトラム逆拡散処理し、音声処理部ex305によってアナログ音声信号に変換した後、これを音声出力部ex208を介して出力する。
【0045】
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex204の操作によって入力された電子メールのテキストデータは操作入力制御部ex304を介して主制御部ex311に送出される。主制御部ex311は、テキストデータを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して基地局ex110へ送信する。
【0046】
データ通信モード時に画像データを送信する場合、カメラ部ex203で撮像された画像データをカメラインターフェース部ex303を介して画像符号化部ex312に供給する。また、画像データを送信しない場合には、カメラ部ex203で撮像した画像データをカメラインターフェース部ex303及びLCD制御部ex302を介して表示部ex202に直接表示することも可能である。
【0047】
画像符号化部ex312は、本願発明で説明した画像符号化装置を備えた構成であり、カメラ部ex203から供給された画像データを上記実施の形態で示した画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex308に送出する。また、このとき同時に携帯電話ex115は、カメラ部ex203で撮像中に音声入力部ex205で集音した音声を音声処理部ex305を介してディジタルの音声データとして多重分離部ex308に送出する。
【0048】
多重分離部ex308は、画像符号化部ex312から供給された符号化画像データと音声処理部ex305から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して送信する。
【0049】
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex201を介して基地局ex110から受信した受信信号を変復調回路部ex306でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex308に送出する。
【0050】
また、アンテナex201を介して受信された多重化データを復号化するには、多重分離部ex308は、多重化データを分離することにより符号化画像データと音声データとに分け、同期バスex313を介して当該符号化画像データを画像復号化部ex309に供給すると共に当該音声データを音声処理部ex305に供給する。
【0051】
次に、画像復号化部ex309は、本願発明で説明した画像復号化装置を備えた構成であり、符号化画像データを上記実施の形態で示した符号化方法に対応した復号化方法で復号することにより再生動画像データを生成し、これをLCD制御部ex302を介して表示部ex202に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex305は、音声データをアナログ音声信号に変換した後、これを音声出力部ex208に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。
【0052】
なお、上記システムの例に限られず、最近は衛星、地上波によるディジタル放送が話題となっており、図10に示すようにディジタル放送用システムにも上記実施の形態の少なくとも画像符号化装置または画像復号化装置のいずれかを組み込むことができる。具体的には、放送局ex409では映像情報の符号化ビットストリームが電波を介して通信または放送衛星ex410に伝送される。これを受けた放送衛星ex410は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナex406で受信し、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置により符号化ビットストリームを復号化してこれを再生する。また、記録媒体である蓄積メディアex402に記録した符号化ビットストリームを読み取り、復号化する再生装置ex403にも上記実施の形態で示した画像復号化装置を実装することが可能である。この場合、再生された映像信号はモニタex404に表示される。また、ケーブルテレビ用のケーブルex405または衛星/地上波放送のアンテナex406に接続されたセットトップボックスex407内に画像復号化装置を実装し、これをテレビのモニタex408で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に画像符号化装置を組み込んでも良い。また、アンテナex411を有する車ex412で衛星ex410からまたは基地局ex107等から信号を受信し、車ex412が有するカーナビゲーションex413等の表示装置に動画を再生することも可能である。
【0053】
なお、カーナビゲーションex413の構成は例えば図9に示す構成のうち、カメラ部ex203とカメラインターフェース部ex303を除いた構成が考えられ、同様なことがコンピュータex111やテレビ(受信機)ex401等でも考えられる。また、上記携帯電話ex114等の端末は、符号化器・復号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、復号化器のみの受信端末の3通りの実装形式が考えられる。
【0054】
このように、上記実施の形態で示した動画像符号化装置を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
【0055】
【発明の効果】
以上の様に、本発明の符号化装置を用いることによって、伝送システムで定められた符号化データ間隔を遵守しつつ、VBVバッファの制御を破綻しない符号化を実現できるため、その実用的価値が高い。
【図面の簡単な説明】
【図1】本発明実施の形態1の符号化装置のブロック図
【図2】本発明実施の形態1の符号化装置を構成する符号化制御回路のブロック図
【図3】本発明実施の形態1の符号化制御回路を用いたバッファ制御の模式図
【図4】本発明実施の形態1の符号化制御回路を用いたバッファ制御の模式図
【図5】本発明実施の形態1の符号化装置を構成する符号化回路のブロック図
【図6】実施の形態3における上記各実施の形態の動画像符号化装置をコンピュータシステムにより実現するためのプログラムを格納するための記録媒体についての説明図
【図7】実施の形態4のコンテンツ供給システムの全体構成を示すブロック図
【図8】実施の形態4動画像符号化装置を用いた携帯電話の例を示す図
【図9】実施の形態4の携帯電話のブロック図
【図10】実施の形態4のディジタル放送用システムの例を示す図
【図11】従来の符号化装置における、バッファ制御の一例を示す図
【図12】従来の符号化装置における、バッファ制御の一例を示す図
【符号の説明】
0102 符号化装置の入力
0104 符号化回路
0108 出力バッファメモリ
0112 符号化制御回路
0116 符号化装置の出力
0106 符号化データ
0110 バッファ残量値
0118 符号化パラメータ
【発明の属する技術分野】
本発明は、動画像を効率良く圧縮する画像符号化方法とそれを正しく復号化する画像復号化方法に関する。
【0002】
【従来の技術】
近年、音声、画像、その他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア、つまり新聞、雑誌、テレビ、ラジオ、電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。
【0003】
ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトであるのに対し、音声の場合1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をディジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、64Kbit/s〜1.5Mbits/sの伝送速度を持つサービス総合ディジタル網(ISDN:Integrated Services Digital Network)によってすでに実用化されているが、テレビ・カメラの映像をそのままISDNで送ることは不可能である。
【0004】
そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、ITU−T(国際電気通信連合 電気通信標準化部門)で国際標準化されたH.261やH.263規格の動画圧縮技術が用いられている。また、MPEG−1規格の情報圧縮技術によると、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。
【0005】
ここで、MPEG(Moving Picture Experts Group)とは、動画像信号圧縮の国際規格であり、MPEG−1は、動画像信号を1.5Mbpsまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG−1規格を対象とする伝送速度が主として約1.5Mbpsに制限されていることから、さらなる高画質化の要求をみたすべく規格化されたMPEG−2では、動画像信号が2〜15Mbpsに圧縮される。さらに現状では、MPEG−1、MPEG−2と標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11)によって、MPEG−1、MPEG−2を上回る圧縮率を達成し、更に物体単位で符号化・復号化・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG−4が規格化された。MPEG−4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号化に拡張されている。
【0006】
現状MPEG−4はインターネットや、第3世代携帯端末などで用いられる、64kbps〜384kbpsといった低ビットレートでの実時間伝送用途が主となっている。
【0007】
伝送系においては、復号側で受信した符号化データが正しく復号できるように、標準復号器のバッファモデル(以下VBVバッファ:Video Buffering Verifier Buffer)というものを想定し、このバッファモデルを満たすように符号化制御を行う。復号側では受信した符号化データは一定時間VBVバッファに蓄えられ、復号時刻が来ると、1フレーム分のデータがVBVバッファから瞬時に引き出されるモデルが仮定されている。符号化装置は、このVBVバッファモデルのバッファが破綻しないようなストリームを出力する必要がある。
【0008】
その上、実時間伝送においては、それぞれの用途に応じた運用規定に基づき、伝送されるデータ、すなわち符号化データの伝送時間間隔などが厳密に規定されている。例えば復号する画像サイズ等の情報を記憶したCI(Configuration Information)データは、復号に必須の情報であるため、伝送データの途中からでも復号を行うために一定時間間隔で挿入されている。また、CIの次に挿入される符号化データは、既に復号した画像を参照して復号しない、画面内符号化モードで符号化されるのが一般的であるが、画面内符号化(I−VOP符号化)は、既に復号化した画像との差分を用いて符号化する画面間符号化(P−VOP)と比較して、発生符号量が多いため、バッファの占有量が大きく変動しやすい。
【0009】
実際のバッファ制御の一例を図11に示す。図11において、横軸1104は時刻を表わし、縦軸1100はバッファ占有量を示す。1102はバッファの最大値であり、1112はバッファの下限値である。1116は時刻T1からT2の時間間隔を意味し、1118は時刻T2からT4の時間間隔を意味する。1108、1120はそれぞれ時刻T1、T3における符号化データ発生量を意味する。
【0010】
伝送系においては、固定ビットレート制御が一般的に行われており、その場合は、図中の傾き1110によって、一定のビット数がバッファに蓄積される。蓄積された符号化データは、復号時刻T1、T2、T3…の時点でバッファから引き抜かれる。引き抜かれるタイミングでデータが足りないと、復号側での遅延が発生し、データが多すぎると伝送されるデータがバッファに書き込めないという不具合があるため、バッファ占有量1100は復号時刻において下限値1112と上限値1102の間で推移し、且つ復号時刻のデータが常にバッファに蓄積されていることが望ましい。さらに、システムの安定性の面から、下限値1112より大きい値をバッファ制御下限値1106とする場合もある。図示していないが、バッファ上限値についても同様で、バッファの最大値よりも小さい値をバッファ制御上限値とする場合がある。符号化制御において、入力画像を符号化することにより得られた符号化データが多い場合には、VBVバッファが下限値1102を下回ってしまう、すなわちアンダーフローしてしまうため、従来は画像のコマ落としを行うことで、ある程度のVBVバッファの破綻を許容したり、画面内で符号量を制御して、VBVバッファが破綻するのを回避している(例えば、非特許文献1参照)。
【0011】
【非特許文献1】
高橋健志、他4名、“低遅延MPEG−4通信システムにおける解像度変換の有効性”、[平成14年9月15日検索]、インターネット
<URL: www.tom.comm.waseda.ac.jp/ ̄take/web/ieiceJan2002.pdf>
【0012】
【発明が解決しようとする課題】
しかしながら、シーケンス最初のデータや、異なるシーケンスの切れ目においては、前記運用規定などで定められるデータ間隔を遵守するため、コマ落としができないという問題点がある。これについて図11を用いて説明する。
【0013】
図11では、符号化データは時刻に比例した一定の傾き1110で増加し、表示時刻T1、T2、T3において、1フレーム分のデータがバッファから引き出される。図11中において、時刻T3のように、符号化したデータが大きい場合には、VBVバッファの占有量がマイナスになる、つまりアンダーフローの状況が生じてしまう。このような場合は、T3に対応するフレームのデータを送信せず、スキップする、すなわち、点線1114の推移を行うことでアンダーフローを回避することが出来る。この場合、時刻T3において符号化データが送られないことになるため、時刻T2とT4の間隔は、T1とT2の間隔よりも広くなってしまう。仮に、運用規定上時刻T3のタイミングでCIを出力しなければならない場合は、図11の制御では実現できない。
【0014】
さらに、符号化する画像サイズやフレームレートといったパラメータ変更に伴い、シーケンスが切り替わるような場合についても同様の課題が生じている。以下図12を用いて説明する。図12において、1220はシーケンスが切り替わる前の符号化制御を意味し、1222はシーケンス切り替え後の符号化制御を意味している。シーケンスが切り替わった場合でも、バッファ制御は継続されるため、切れ目の部分でバッファの破綻が生じないように制御を行わなければならない。シーケンスの切れ目では、映像情報がまったく異なる場合は画面間符号化が使用できないため、画面内符号化された符号化データが挿入される。その場合、入力画像の性質によっては発生符号量が多くなり、時刻T3において、破線のようにバッファ占有量がバッファ下限値1106を下回るような場合がある。このような場合、T2、T3間の時間間隔が一定間隔を遵守できないため、前述した運用規定などで、時間間隔を固定に規定している場合には、従来の制御では規定を遵守出来ない。
【0015】
【課題を解決するための手段】
この課題を解決するために、第1の発明は、入力された映像信号を画面内で一定の領域のブロック毎に符号化する符号化処理手段と、前記符号化処理手段により符号化された少なくとも1画面分の符号化データを格納するための記憶手段と、前記記憶手段に符号化データを格納すると、所定充足量を超過するか否かを判定し、所定充足量を超過し、且つ時間的に連続する符号化データの間隔が所定の間隔以下になるように、所定の符号化方法で前記映像信号を再符号化するように前記符号化処理手段を制御するレート制御手段を備えたことを特徴とする動画像符号化装置である。
【0016】
第2の発明は、映像信号を符号化した圧縮符号化データであって、前記圧縮符号化データ内に含まれる、前記圧縮符号化データを復号するために必要なCI(Configuration Information)データが一定時間内に挿入されることを目的として、CIデータに続く符号化データは、所定の画面内圧縮符号化を行っていることを特徴とした、圧縮符号化データ構造である。
【0017】
【発明の実施の形態】
以下、本発明の実施の形態について、図1から図6を用いて説明する。
【0018】
(実施の形態1)
図1は本発明方法を実施する符号化装置の構成例を示すブロック図である。図1において、0102は符号化装置の入力、0104は符号化回路、0108は符号化回路の結果を保持する出力バッファメモリ、0112は符号化制御回路、0116は符号化装置の出力である。0106は符号化データ、0110はバッファ残量値である。このように構成される符号化装置の動作を以下説明する。輝度信号と色差信号で構成される映像信号信号は、符号化装置の入力0102から符号化回路0104に入力され、符号化制御回路0112から0114を介して入力される、符号化タイプ、量子化パラメータなどの符号化情報に基づいて符号化される。符号化回路0104の詳細については図2において後述する。符号化回路0104によって符号化された符号化データは、0106を介して、出力バッファメモリ0108に出力され、出力バッファメモリ0108のバッファ占有量は0110を介して符号化制御回路0112に入力される。符号化制御回路0112は、入力されたバッファ占有量を基に、バッファ占有量がアンダーフローしないように、次に符号化する際の符号化タイプ、量子化パラメータなどの符号化パラメータを0118経由で符号化制御回路0112に指示する。符号化制御回路0112の詳細については、図4において後述する。なお、符号化回路0104について今回詳解していないが、MPEG、H.261、H.263、H.264などのいずれの動画圧縮符号化でもよいものとする。
【0019】
図2は図1で説明した画像符号化装置内の符号化回路0104の内部図である。また、図3、図4は本発明の画像符号化像値によるバッファ制御の概念図を示す。なお、図3、図4中の各要素については、別図と同一のものについては同じ符号を付与し、その説明を省略する。以下、図2、図3、図4を用いて、符号化制御回路0112の動作について説明する。
【0020】
図3中の時刻T3において、画面内符号化により発生した符号化ビット数がXXXX分発生した場合、図2中の0110から入力されるバッファ占有量は、バッファ占有量の下限値1106を下回った値が入力される。この場合、符号量制御回路0202は、時刻T3が復号に必要なCIデータを出力するタイミングである場合は、コマ落としなどの方法が使用できないため、CIデータの後に、発生した符号化データの代わりに、通常とは別の特殊符号化モードを符号化タイプ制御回路0206に出力する。特殊符号化とは、符号化する映像信号を符号化する際の符号化単位がすべて一定値の画素信号で構成されると仮定し、符号化するモードである。
【0021】
一定値とは、黒レベル(輝度信号レベル0、色差信号レベル128、128もしくは、規格により定められた黒レベル:例 Recommendation ITU−R BT.601では輝度信号レベル16、色差信号レベル128、128を黒レベルと定義)の値であるものとし、符号化を行うものである。これにより情報量を削減することが可能となる。
【0022】
その他、入力画像をDCTなどの直交変換を施した結果に対して、直流成分のみを符号化する方法などを用いても良い。以上の特殊符号化を行うことによって、時刻T3の発生符号量を304に抑制し、バッファ占有量が下限値1106を下回らないように制御する。
【0023】
図4は、入力される映像データのフォーマットなどが変更されたなどの理由により、符号化データのまとまりの単位であるシーケンスが切り替わった場合のバッファ制御図である。図のバッファ占有グラフのうち、点線部1120が切り替え前のシーケンスを意味し、実線部1122が切り替え後のセッションを意味している。シーケンスが切り替わった場合でも、バッファ制御は継続されるため、切れ目の部分でバッファの破綻が生じないように制御を行わなければならない。シーケンスの切れ目では、画面間符号化ではなく、画面内符号化された符号化データが挿入されるため、入力画像の性質によっては発生符号量が多くなり、時刻T3において、0402の破線のようにバッファ占有量がバッファ下限値1106を下回るような場合がある。このような場合、T2、T3間の時間間隔が一定間隔を遵守できないため、図2の符号量制御回路では、CIデータの後に、前述の特殊符号化を行うように、特殊符号化モードを符号化タイプ制御回路に出力する。符号化タイプ制御回路では、0114を介して、符号化回路に特殊符号化モード選択信号を出力する。以上の制御を行うことによって、セッション間において、符号化データ間隔を遵守するような符号化制御を行うことが出来る。
【0024】
なお、アンダーフローが生じない場合は、符号量制御回路はバッファが破綻しないような量子化パラメータを符号化タイプ制御回路に出力する。
【0025】
図5は図1で説明した符号化器の内部構成を示すものである。図5において、図1の符号化制御回路からの出力0114を元に、符号化タイプに応じた0504、0506、0508に示すような符号化器を切り替えて、0102から入力された映像信号を一時的に保持している、少なくとも1以上のフレームメモリ内の映像信号を符号化する。なお、符号化制御信号からの出力信号によって、符号化する映像信号を切り替えることも可能である。なお、図2、3、4で説明した特殊符号化において、一定値の映像信号を符号化する符号化器については、あらかじめ符号化したデータをメモリ上に保持しておいて、モードが選択された場合にはメモリの内容を出力するような構成でも実現できる。
【0026】
(実施の形態2)
さらに、図1の符号化装置のような制御を行うことによって得られた、CI情報の直後に、前述の特殊符号化を行った符号化データが挿入されたデータ構造をもつ符号化データを実時間で送出することによって、運用規定で定められた符号化データ間隔を遵守しつつ、符号化バッファ制御を破綻しないシステムを構築できる。
【0027】
(実施の形態3)
さらに、上記各実施の形態で示した動画像符号化装置を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
【0028】
図6は、上記上記各実施の形態の動画像符号化装置を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
【0029】
図6(b)は、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示し、図6(a)は、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムが記録されている。
【0030】
また、図6(c)は、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。動画像符号化装置を実現する上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブを介して書き込む。また、フレキシブルディスク内のプログラムにより動画像符号化装置を実現する上記動画像符号化装置をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。
【0031】
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
【0032】
(実施の形態4)
さらにここで、上記実施の形態で示した動画像符号化装置の応用例とそれを用いたシステムを説明する。
【0033】
図7は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示すブロック図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex107〜ex110が設置されている。
【0034】
このコンテンツ供給システムex100は、例えば、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および基地局ex107〜ex110を介して、コンピュータex111、PDA(personal digital assistant)ex112、カメラex113、携帯電話ex114、カメラ付きの携帯電話ex115などの各機器が接続される。
【0035】
しかし、コンテンツ供給システムex100は図7のような組合せに限定されず、いずれかを組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex107〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。
【0036】
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器である。また、携帯電話は、PDC(Personal Digital Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband−Code Division Multiple Access)方式、若しくはGSM(Global System for Mobile Communications)方式の携帯電話機、またはPHS(Personal Handyphone System)等であり、いずれでも構わない。
【0037】
また、ストリーミングサーバex103は、カメラex113から基地局ex109、電話網ex104を通じて接続されており、カメラex113を用いてユーザが送信する符号化処理されたデータに基づいたライブ配信等が可能になる。撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするサーバ等で行ってもよい。また、カメラex116で撮影した動画データはコンピュータex111を介してストリーミングサーバex103に送信されてもよい。カメラex116はデジタルカメラ等の静止画、動画が撮影可能な機器である。この場合、動画データの符号化はカメラex116で行ってもコンピュータex111で行ってもどちらでもよい。また、符号化処理はコンピュータex111やカメラex116が有するLSIex117において処理することになる。なお、画像符号化・復号化用のソフトウェアをコンピュータex111等で読み取り可能な記録媒体である何らかの蓄積メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込んでもよい。さらに、カメラ付きの携帯電話ex115で動画データを送信してもよい。このときの動画データは携帯電話ex115が有するLSIで符号化処理されたデータである。
【0038】
このコンテンツ供給システムex100では、ユーザがカメラex113、カメラex116等で撮影しているコンテンツ(例えば、音楽ライブを撮影した映像等)を上記実施の形態同様に符号化処理してストリーミングサーバex103に送信する一方で、ストリーミングサーバex103は要求のあったクライアントに対して上記コンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号化することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等がある。このようにすることでコンテンツ供給システムex100は、符号化されたデータをクライアントにおいて受信して再生することができ、さらにクライアントにおいてリアルタイムで受信して復号化し、再生することにより、個人放送をも実現可能になるシステムである。
【0039】
このシステムを構成する各機器の符号化には上記各実施の形態で示した画像符号化装置を用いるようにすればよい。
【0040】
その一例として携帯電話について説明する。
【0041】
図8は、上記実施の形態で説明した動画像符号化装置を用いた携帯電話ex115を示す図である。携帯電話ex115は、基地局ex110との間で電波を送受信するためのアンテナex201、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex203、カメラ部ex203で撮影した映像、アンテナex201で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex202、操作キーex204群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex208、音声入力をするためのマイク等の音声入力部ex205、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号化されたデータを保存するための記録メディアex207、携帯電話ex115に記録メディアex207を装着可能とするためのスロット部ex206を有している。記録メディアex207はSDカード等のプラスチックケース内に電気的に書換えや消去が可能な不揮発性メモリであるEEPROM(Electrically Erasable and Programmable Read Only Memory)の一種であるフラッシュメモリ素子を格納したものである。
【0042】
さらに、携帯電話ex115について図9を用いて説明する。携帯電話ex115は表示部ex202及び操作キーex204を備えた本体部の各部を統括的に制御するようになされた主制御部ex311に対して、電源回路部ex310、操作入力制御部ex304、画像符号化部ex312、カメラインターフェース部ex303、LCD(Liquid Crystal Display)制御部ex302、画像復号化部ex309、多重分離部ex308、記録再生部ex307、変復調回路部ex306及び音声処理部ex305が同期バスex313を介して互いに接続されている。
【0043】
電源回路部ex310は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付ディジタル携帯電話ex115を動作可能な状態に起動する。
【0044】
携帯電話ex115は、CPU、ROM及びRAM等でなる主制御部ex311の制御に基づいて、音声通話モード時に音声入力部ex205で集音した音声信号を音声処理部ex305によってディジタル音声データに変換し、これを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して送信する。また携帯電話ex115は、音声通話モード時にアンテナex201で受信した受信信号を増幅して周波数変換処理及びアナログディジタル変換処理を施し、変復調回路部ex306でスペクトラム逆拡散処理し、音声処理部ex305によってアナログ音声信号に変換した後、これを音声出力部ex208を介して出力する。
【0045】
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex204の操作によって入力された電子メールのテキストデータは操作入力制御部ex304を介して主制御部ex311に送出される。主制御部ex311は、テキストデータを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して基地局ex110へ送信する。
【0046】
データ通信モード時に画像データを送信する場合、カメラ部ex203で撮像された画像データをカメラインターフェース部ex303を介して画像符号化部ex312に供給する。また、画像データを送信しない場合には、カメラ部ex203で撮像した画像データをカメラインターフェース部ex303及びLCD制御部ex302を介して表示部ex202に直接表示することも可能である。
【0047】
画像符号化部ex312は、本願発明で説明した画像符号化装置を備えた構成であり、カメラ部ex203から供給された画像データを上記実施の形態で示した画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex308に送出する。また、このとき同時に携帯電話ex115は、カメラ部ex203で撮像中に音声入力部ex205で集音した音声を音声処理部ex305を介してディジタルの音声データとして多重分離部ex308に送出する。
【0048】
多重分離部ex308は、画像符号化部ex312から供給された符号化画像データと音声処理部ex305から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して送信する。
【0049】
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex201を介して基地局ex110から受信した受信信号を変復調回路部ex306でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex308に送出する。
【0050】
また、アンテナex201を介して受信された多重化データを復号化するには、多重分離部ex308は、多重化データを分離することにより符号化画像データと音声データとに分け、同期バスex313を介して当該符号化画像データを画像復号化部ex309に供給すると共に当該音声データを音声処理部ex305に供給する。
【0051】
次に、画像復号化部ex309は、本願発明で説明した画像復号化装置を備えた構成であり、符号化画像データを上記実施の形態で示した符号化方法に対応した復号化方法で復号することにより再生動画像データを生成し、これをLCD制御部ex302を介して表示部ex202に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex305は、音声データをアナログ音声信号に変換した後、これを音声出力部ex208に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。
【0052】
なお、上記システムの例に限られず、最近は衛星、地上波によるディジタル放送が話題となっており、図10に示すようにディジタル放送用システムにも上記実施の形態の少なくとも画像符号化装置または画像復号化装置のいずれかを組み込むことができる。具体的には、放送局ex409では映像情報の符号化ビットストリームが電波を介して通信または放送衛星ex410に伝送される。これを受けた放送衛星ex410は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナex406で受信し、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置により符号化ビットストリームを復号化してこれを再生する。また、記録媒体である蓄積メディアex402に記録した符号化ビットストリームを読み取り、復号化する再生装置ex403にも上記実施の形態で示した画像復号化装置を実装することが可能である。この場合、再生された映像信号はモニタex404に表示される。また、ケーブルテレビ用のケーブルex405または衛星/地上波放送のアンテナex406に接続されたセットトップボックスex407内に画像復号化装置を実装し、これをテレビのモニタex408で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に画像符号化装置を組み込んでも良い。また、アンテナex411を有する車ex412で衛星ex410からまたは基地局ex107等から信号を受信し、車ex412が有するカーナビゲーションex413等の表示装置に動画を再生することも可能である。
【0053】
なお、カーナビゲーションex413の構成は例えば図9に示す構成のうち、カメラ部ex203とカメラインターフェース部ex303を除いた構成が考えられ、同様なことがコンピュータex111やテレビ(受信機)ex401等でも考えられる。また、上記携帯電話ex114等の端末は、符号化器・復号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、復号化器のみの受信端末の3通りの実装形式が考えられる。
【0054】
このように、上記実施の形態で示した動画像符号化装置を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
【0055】
【発明の効果】
以上の様に、本発明の符号化装置を用いることによって、伝送システムで定められた符号化データ間隔を遵守しつつ、VBVバッファの制御を破綻しない符号化を実現できるため、その実用的価値が高い。
【図面の簡単な説明】
【図1】本発明実施の形態1の符号化装置のブロック図
【図2】本発明実施の形態1の符号化装置を構成する符号化制御回路のブロック図
【図3】本発明実施の形態1の符号化制御回路を用いたバッファ制御の模式図
【図4】本発明実施の形態1の符号化制御回路を用いたバッファ制御の模式図
【図5】本発明実施の形態1の符号化装置を構成する符号化回路のブロック図
【図6】実施の形態3における上記各実施の形態の動画像符号化装置をコンピュータシステムにより実現するためのプログラムを格納するための記録媒体についての説明図
【図7】実施の形態4のコンテンツ供給システムの全体構成を示すブロック図
【図8】実施の形態4動画像符号化装置を用いた携帯電話の例を示す図
【図9】実施の形態4の携帯電話のブロック図
【図10】実施の形態4のディジタル放送用システムの例を示す図
【図11】従来の符号化装置における、バッファ制御の一例を示す図
【図12】従来の符号化装置における、バッファ制御の一例を示す図
【符号の説明】
0102 符号化装置の入力
0104 符号化回路
0108 出力バッファメモリ
0112 符号化制御回路
0116 符号化装置の出力
0106 符号化データ
0110 バッファ残量値
0118 符号化パラメータ
Claims (8)
- 入力された映像信号を画面内で一定の領域のブロック毎に符号化する符号化処理手段と、前記符号化処理手段により符号化された少なくとも1画面分の符号化データを格納するための記憶手段と、前記記憶手段に符号化データを格納すると、所定充足量を超過するか否かを判定し、所定充足量を超過し、且つ時間的に連続する符号化データの間隔が所定の間隔以下になるように、所定の符号化方法で前記映像信号を再符号化するように前記符号化処理手段を制御するレート制御手段を備えたことを特徴とする動画像符号化装置。
- 請求項1記載の動画像符号化装置において、前記レート制御手段は、前記ブロックを直交変換した際の直流成分のみを符号化するように、前記符号化手段を制御することを特徴とした動画像符号化装置。
- 請求項1記載の動画像符号化装置において、前記レート制御手段は、一定レベルの輝度信号、色差信号から構成される画像信号を符号化するように前記符号化処理手段を制御することを特徴とした動画像符号化装置。
- 映像信号を符号化した圧縮符号化データであって、前記圧縮符号化データ内に含まれる、前記圧縮符号化データを復号するために必要なCI(Configuration Information)データが一定時間内に挿入されることを目的として、CIデータに続く符号化データは、所定の画面内圧縮符号化を行っていることを特徴とした、圧縮符号化データ構造。
- 請求項4記載の圧縮符号化データ構造において、前記所定の画面内圧縮符号化は、入力された前記映像信号を周波数変換した際の、直流成分のみを符号化していることを特徴とした、圧縮符号化データ構造。
- 請求項4記載の圧縮符号化データ構造において、前記所定の画面内圧縮符号化は、所定の固定値で構成される映像信号を画面内圧縮符号化していることを特徴とした圧縮符号化データ構造。
- コンピュータにより、請求項1記載の動画像符号化装置を実現するためのプログラムであって、
上記プログラムはコンピュータに、
入力された映像信号を画面内で一定の領域のブロック毎に符号化する符号化処理手段と、前記符号化処理手段により符号化された少なくとも1画面分の符号化データを格納するための記憶手段と、前記記憶手段に符号化データを格納すると、所定充足量を超過するか否かを判定し、所定充足量を超過し、且つ時間的に連続する符号化データの間隔が所定の間隔以下になるように、所定の符号化方法で前記映像信号を再符号化するように前記符号化処理手段を制御するレート制御手段を備えたことを特徴とする動画像符号化装置
を、行わせるものであることを特徴とするプログラム。 - コンピュータにより、請求項1〜3のいずれかに記載の動画像符号化装置を実現するためのプログラムであって、
上記プログラムはコンピュータに、
映像信号を符号化した圧縮符号化データであって、前記圧縮符号化データ内に含まれる、前記圧縮データを復号するために必要なCI(Configuration Information)データが一定時間内に挿入されることを目的として、CIデータに続く符号化データは、所定の画面内圧縮符号化を行っていることを特徴とした、圧縮符号化データ構造
を、行わせるものであることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002331900A JP2004166116A (ja) | 2002-11-15 | 2002-11-15 | 動画像符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002331900A JP2004166116A (ja) | 2002-11-15 | 2002-11-15 | 動画像符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004166116A true JP2004166116A (ja) | 2004-06-10 |
Family
ID=32809135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002331900A Pending JP2004166116A (ja) | 2002-11-15 | 2002-11-15 | 動画像符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004166116A (ja) |
-
2002
- 2002-11-15 JP JP2002331900A patent/JP2004166116A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5102344B2 (ja) | 動画像符号化方法、動画像符号化装置、プログラムおよび記録媒体 | |
JP5355807B2 (ja) | 符号化データ配信方法および配信システム | |
JP4763663B2 (ja) | 動画像符号化方法 | |
KR101004208B1 (ko) | 픽처 코딩 방법 및 디코딩 방법 | |
JP2004166116A (ja) | 動画像符号化装置 | |
JP2004120138A (ja) | 動画像符号化方法および動画像復号化方法 |