WO2004095844A1

WO2004095844A1 - 画像符号化装置および画像符号化方法

Info

Publication number: WO2004095844A1
Application number: PCT/JP2003/005311
Authority: WO
Inventors: Koichi Suzuki
Original assignee: Fujitsu Limited
Priority date: 2003-04-24
Filing date: 2003-04-24
Publication date: 2004-11-04
Also published as: JPWO2004095844A1; AU2003231503A1; JP3923498B2; CN1689331A; CN100364335C

Abstract

　符号化した動画像データにシーンチェンジ情報等のフレームに固有なフレーム情報を正確な位置に付加する。符号化処理部（１）は、入力された動画像データを圧縮符号化し、第１のカウンタ（２）は、符号化処理部（１）によって生成されたピクチャの枚数をカウントする。フレーム情報保持部（４）は、入力された動画像データ中のフレームに固有な情報を示すフレーム情報を、第１のカウンタ（２）によるカウント数に対応づけて保持する。ヘッダ情報挿入部（６）は、符号化処理部（１）によって生成されたピクチャに対して所定のヘッダ情報を挿入し、第２のカウンタ（７）は、ヘッダ情報挿入部（６）が受け取ったピクチャの枚数をカウントする。ヘッダ情報挿入部（６）は、ヘッダ情報が挿入される際にフレーム情報保持部（４）を参照して、第１および第２のカウンタ（２）および（７）による各カウント数が一致したときのピクチャに対応するフレーム情報を、当該ピクチャの先頭データに対応するヘッダ情報内に書き込む。

Description

明細書画像符号化装置および画像符号化方法技術分野

本発明は、動画像を符号化するための画像符号化装置および画像符号化方法に関し、特に、符号化されたデータにシーンチェンジ情報を示す情報等のフレームに固有な情報を付加することが可能な画像符号化装置および画像符号化方法に関する。背景技術

近年、 M P E G (Moving Picture Expert Group) 等の圧縮符号化方式を用いて、動画像をデジタルデータとして取り扱うことが一般的となっている。このような動画像デ一夕は、各種の記録媒体に記録されたり、あるいはネットワークを通じて送受信されることで利用されている。また、動画像データに対して、画像記録の開始時や場面の転換時を示すシーンチェンジ情報を付加することが行われている。シーンチェンジ情報は、例えば、動画像データの再生時において、場面転換時のサーチやこのときのサムネール画像の生成等に利用される。

動画像デ一夕からシーンチェンジを検出し、このデータ中にシーンチェンジ情報を付加することが可能な従来の画像記録装置としては、直前に入力された 2フレーム分のデータを常にバッファメモリに記憶しておき、シ一ンチェンジ検出回路により、現在のフレームと直前の 2フレームとからシーンチェンジの有無を検出し、シーンチェンジが検出された場合に、シーンチェンジ付加回路によってシステム情報中にシーンチェンジを示す情報を付加し、さらに切り替えスィッチによって、シーンチェンジを示す情報が付加されたデータと付加されていないデー夕とをシーンチェンジの有無に応じて選択出力する画像記録装置があった（例えば、特許文献 1参照）。

特許文献 1

特開 2 0 0 0— 1 1 5 6 6 5号公報（段落番号〔0 0 1 4〕〜〔0 0 3 2〕、第 1図）

また、最近では、例えばアンテナから受信したテレビ画像や外部から入力された画像信号を圧縮符号化して、光ディスク等の記録媒体に記録する装置の普及が進んでおり、このような装置においてもシーンチェンジ情報を付加することが考えられている。例えば、 MP E G方式を用いて圧縮符号化する装置では、入力画像信号は一旦フレームメモリに蓄積され、符号化部によって 1フレームまたは 1 フィ一ルドごとに順次読み出されて圧縮符号化される。これにより生成されたビデォストリームは、さらに多重化部においてオーディオストリーム等と多重化され、 M P E Gストリームとして記録媒体に記録される。

このような M P E Gストリームの生成時にシーンチェンジ情報を付加する場合、符号化部の前段のフレ一ムメモリに記憶されたデ一夕を基にシーンチェンジの有無を検出し、多重化部において、シーンチェンジを示す情報をヘッダ内のォプション領域等に記録する方法が考えられる。

しかし、 M P E G方式では可変長符号化方式を採っているため、ビデオストリームの単位時間当たりのデータ量は一定とならない場合が多く、さらに多重化部における多重化処理の夕イミングもフレームごとに一定時間間隔とはならない。このため、上記の方法では、シーンチェンジの検出からシーンチェンジ情報の書き込みまでに要する時間が不規則に変動し、シーンチェンジが発生した目的のフレームの先頭データを含むバケツトのヘッダに、シーンチェンジ情報を正確に書き込むことが困難であった。発明の開示

本発明はこのような課題に鑑みてなされたものであり、符号化した動画像デー夕にシーンチェンジ情報等のフレームに固有なフレーム情報を正確な位置に付加することが可能な画像符号化装置を提供することを目的とする。

また、本発明の他の目的は、符号化した動画像デ一夕にシーンチェンジ情報等のフレームに固有なフレーム情報を正確な位置に付加することが可能な画像符号化方法を提供することである。

本発明では上記課題を解決するために、図 1に示すような画像符号化装置が提供される。この画像符号化装置は、動画像を符号化するためのものであり、入力された動画像データを圧縮符号化する符号化処理部 1と、前記符号化処理部 1によって生成されたピクチャの枚数をカウントする第 1のカウンタ 2と、入力された前記動画像データ中のフレームに固有な情報を示すフレーム情報を、前記第 1 のカウンタ 2によるカウント数に対応づけて保持するフレーム情報保持部 4と、前記符号化処理部 1によって生成されたピクチャを受け取つて所定のへッダ情報を挿入するヘッダ情報挿入部 6と、前記ヘッダ情報揷入部 6'が受け取ったピクチャの枚数をカウントする第 2のカウンタ 7とを有し、前記ヘッダ情報揷入部 6は、前記フレーム情報保持部 4を参照して、前記第 1のカウン夕 2および第 2のカウン夕 7による各カウント数が一致したときのピクチャに対応する前記フレーム情報を、当該ピクチャの先頭データに対応する前記ヘッダ情報内に書き込むことを特徴とする。

このような画像符号化装置では、符号化処理部 1によって、入力された動画像データが圧縮符号化され、第 1のカウンタ 2により、符号化処理部 1によって生成されたピクチャの枚数がカウントされる。このとき、フレーム情報保持部 4により、入力された動画像デ一タ中のフレームに固有な情報を示すフレーム情報が、第 1のカウンタ 2によるカウント数に対応づけて保持される。また、ヘッダ情報挿入部 6では、符号化処理部 1によって生成されたピクチャに対して所定のへッダ情報が挿入され、ヘッダ情報挿入部 6が受け取ったピクチャの枚数が、第 2のカウン夕 7によってカウントされる。ここで、ヘッダ情報揷入部 6では、ヘッダ情報が揷入される際にフレーム情報保持部 4が参照されて、第 1のカウンタ 2および第 2のカウン夕 7による各カウント数が一致したときのピクチャに対応するフレーム情報が、当該ピクチャの先頭データに対応するヘッダ情報内に書き込まれるので、生成されたピクチャに対応するフレーム情報が確実に取得され、正しい位置に書き込まれる。

また、本発明では、動画像を符号化するための画像符号化方法において、入力された動画像データを圧縮符号化するとともに、前記圧縮符号化処理によつて生成されたピクチャの枚数を第 1のピクチャ枚数としてカウン卜し、入力された前記動画像データ中のフレームに固有な情報を示すフレーム情報を、前記第 1のピクチャ枚数に対応づけて保持し、前記圧縮符号化処理によって生成されたピクチャを受け取つて所定のへッダ情報を挿入する際に、受け取つたピクチャの枚数を第 2のピクチャ枚数としてカウン卜し、前記第 1および第 2のピクチャ枚数が一致したときのピクチャに対応する前記フレーム情報を、当該ピクチャの先頭デー夕に対応する前記へッダ情報内に書き込むことを特徴とする画像符号化方法が提供される。

このような画像符号化方法では、入力された動画像データを圧縮符号化するとともに、この圧縮符号化処理によつて生成されたピクチャの枚数を第 1のピクチャ枚数としてカウントする。また、入力された動画像データ中のフレームに固有な情報を示すフレーム情報を、第 1のピクチャ枚数に対応づけて保持しておく。そして、圧縮符号化処理によって生成されたピクチャを受け取って所定のヘッダ情報を挿入する際に、受け取ったピクチャの枚数を第 2のピクチャ枚数として力ゥントし、第 1および第 2のピクチャ枚数が一致したときのピクチャに対応するフレーム情報を、当該ピクチャの先頭データに対応するヘッダ情報内に書き込む。従って、ヘッダ情報を揷入する際に、生成されたピクチャに対応するフレーム情報が確実に取得され、正しい位置に書き込まれる。

本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。図面の簡単な説明

図 1は、本発明の原理を説明するための原理図である。

図 2は、本発明の実施の形態に係る M P E G符号化装置の構成を示すプロック図である。

図 3は、ビデオェンコ一ド部における処理の流れを示すフロ一チヤ一トである。図 4は、多重化部における処理の流れを示すフローチャートである。

図 5は、シーンチェンジ情報が挿入されるへッダ領域のフォーマツト例を示す図である。発明を実施するための最良の形態以下、本発明の実施の形態を図面を参照して説明する。

図 1は、本発明の原理を説明するための原理図である。

以下の図 1の説明では、入力された動画像デ一夕を符号化して動画像ストリ一ムを生成するとともに、この動画像ストリームに例として音声ス卜リ一ムを多重化して出力することが可能な画像符号化装置に本発明を適用した場合について説明する。この図 1に示す画像符号化装置は、符号化処理部 1、第 1のカウンタ 2、フレーム情報検出部 3、フレーム情報保持部 4および多重化処理部 5を具備している。また、多重化処理部 5には、ヘッダ情報挿入部 6および第 2のカウン夕 7 が設けられている。

符号化処理部 1は、入力された動画像データを所定の符号化方式で圧縮符号化し、動画像ストリ一ムを生成する。動画像ストリームでは、 1フレームまたは 1 フィールドごとに圧縮符号化されたデータがピクチャとして生成される。

第 1のカウンタ 2は、符号化処理部 1において生成されたピクチャの枚数を力ゥントする。このときのカウント数は、フレーム情報保持部 4に出力される。フレーム情報検出部 3は、入力された動画像データからフレーム情報を検出する。ここで、フレーム情報とは、動画像データ中のフレームに固有な情報を示す。例えば、対象とするフレームにおいてシーンチェンジが発生していることを示す情報や、垂直ブランキング期間（V B I ： Vertical Blanking Interval) に格納された V B I情報等を含めることができる。このフレーム情報は、例えば、符号化処理部 1の入力段に、入力された動画像データが一時的に記憶されるフレームメモリが設けられている場合には、このフレームメモリに記憶されたデ一夕を用いて検出することができる。

フレーム情報保持部 4には、第 1のカウンタ 2からのカウント値に、このときにフレーム情報検出部 3において検出されたフレーム情報を関連付けて保持する。多重化処理部 5は、符号化処理部 1で符号化された動画像ス卜リームと、音声データを符号化した音声ス卜リームとを多重化して、多重化ス卜リームを生成する。この多重化処理部 5において、ヘッダ情報揷入部 6は、符号化処理部 1から受け取った動画像ストリームに、所定のヘッダ情報を挿入する。

第 2のカウンタ 7は、へッダ情報挿入部 6が受け取つた動画像ストリ一ム中のピクチャの枚数をカウントし、へッダ情報挿入部 6に出力する。

ここで、ヘッダ情報揷入部 6は、ヘッダ情報の挿入を行う際に、フレーム情報保持部 4を参照して、第 2のカウン夕 7のカウント値と同一のカウント値に対応づけられたフレーム情報を取得する。そして、このフレーム情報をこのとき受け取ったピクチャの先頭データに対応するヘッダ情報内に書き込む。例えば、この先頭デ一タを含むバケツトのバケツトヘッダに書き込む。

このような画像符号化装置では、入力された動画像データが、符号化処理部 1 において圧縮符号化され、動画像ストリームとして多重化処理部 5に供給される。多重化処理部 5では、ヘッダ情報揷入部 6においてヘッダ情報が挿入され、さらに音声ストリームと多重化されて、多重化ストリームとして出力される。

また、符号化処理部 1に入力される動画像デ一夕からは、フレーム情報検出部

3によってフレーム情報が検出され、このフレーム情報は、フレーム情報保持部

4において、第 1のカウンタ 2によるカウント値に対応づけて保持される。これにより、フレーム情報と、その検出元となったフレームに対応するピクチャとが対応づけられる。

ここで、第 1のカウン夕 2は、符号化処理部 1で生成されたピクチャの枚数をカウントし、第 2のカウンタ 7は、ヘッダ情報挿入部 6が受け取ったピクチャの枚数をカウントしているので、第 1のカウン夕 2および第 2のカウンタ 7が同一カウント数のときには、カウント対象とされたピクチャは同一のものとなる。従つて、ヘッダ情報挿入部 6がピクチャを受け取ったときに、このときの第 2の力ゥンタ 7によるカウント値と同一の第 1のカウン夕 2によるカウント値に対応づけられたフレーム情報を取得することで、受け取つたピクチャに対応するフレーム情報を確実に取得することができる。

ヘッダ情報揷入部 6では、例えば、符号化処理部 1からのピクチャの受信時に、ピクチャの先頭部を識別して、このとき第 2のカウン夕 7をインクリメントさせ、このカウント値を用いてフレーム情報を取得することにより、ピクチャの先頭デ一夕に対応するヘッダ情報に、取得したフレーム情報を容易に書き込むことができる。従って、多重化ストリーム内において、フレーム情報とこれに対応するピクチャのデータとの各書き込み位置を正確に一致させることができ、この多重化ストリームの再生時において、再生画像に同期した正確なタイミングでフレーム情報を抽出し、利用することが可能となる。

次に、本発明の実施の形態例について、具体的に説明する。以下の説明では、入力されたビデオ信号を M P E G— 2方式で符号化する装置に対して本発明を適用した場合を想定する。また、フレーム情報として、シーンチェンジの発生を示す情報を付加するものとする。

図 2に示す M P E G符号化装置は、入力されたビデオデ一夕およびオーディォデータを M P E G— 2方式で圧縮符号化して、 M P E Gストリームを生成する装置である。この M P E G符号化装置は、フレームメモリ 1 0、シーンチェンジ検出回路 2 0、ビデオエンコード部 3 0、オーディオエンコーダ 4 0および多重化部 5 0を具備する。

この M P E G符号化装置に入力されるビデオおよびオーディォ信号は、例えばテレビチューナ等の外部機器からアナログ信号として入力される。ビデオ信号は例えばコンポジット信号として入力され、図示しない YZ C分離器において輝度信号および色差信号に分離された後、さらに図示しない N T S C (National Television System Committee) デコーダで A Z D変換およびクロマエンコ一ド処理されて、デジタルデータとしてフレームメモリ 1 0に入力される。

フレームメモリ 1 0は、複数フレーム分の容量を有する F I F O (First In First Out) 方式のバッファメモリであり、入力されたビデオデ一夕を順次、一時的に記憶する。そして、記憶されたデータは、ビデオエンコーダ 3 1およびシ —ンチェンジ検出回路 2 0により読み出される。

シーンチェンジ検出回路 2 0は、ビデオエンコーダ 3 1によってフレームメモリ 1 0から 1フレーム分のビデオデータが読み出されると、読み出し対象となつたフレームと、その 1つ前にフレームメモリ 1 0に記憶されたフレームとを読み出して、シーンチェンジの検出を行う。シ一ンチェンジの検出には、例えば、 2 つのフレームに含まれる画素値を統計処理して、フレーム間の差分をとる手法や、フレーム間の相関係数をとる手法等を用いることができる。これらの検出では、例えば、画素値として輝度信号のみ、あるいは色差信号のみを用いればよい。また、シーンチェンジ検出回路 2 0は、レジス夕 2 1を具備しており、検出結果に基づき、シーンチェンジの発生の有無を示す情報をレジスタ 2 1に格納する。ビデオエンコード部 3 0には、ビデオエンコーダ 3 1，カウンタ 3 2およびシ —ンチェンジ情報処理回路 3 3が設けられている。ビデオエンコーダ 3 1は、フレームメモリ 1 0に記憶されたビデオデータを 1フレームずつ読み出し、 M P E G - 2方式で圧縮符号化してピクチャを生成し、ビデオ E S (Elementary Stream) として多重化部 5 0に出力する。また、ビデオエンコーダ 3 1は、 1 枚のピクチャを生成するごとに、カウンタ 3 2のカウント値をインクリメントさせるとともに、ピクチャの生成をシーンチェンジ情報処理回路 3 3に対して通知する。

カウンタ 3 2は、ビデオエンコーダ 3 1において生成されたピクチャの枚数をカウン卜し、カウント値をシーンチェンジ情報処理回路 3 3に出力する。シーンチェンジ情報処理回路 3 3は、ビデオエンコーダ 3 1からピクチャの生成の通知を受けると、インクリメントされたカウンタ 3 2のカウント値を取得するとともに、シーンチェンジ検出回路 2 0のレジスタ 2 1を参照してシーンチェンジの有無を判断し、シーンチェンジの有無を示す情報を、取得したカウント値とともにメモリ 3 4に記憶する。メモリ 3 4では、例えばシーンチェンジの有無をカウント値と対応づけたテ一ブルが記憶される。あるいは、シーンチェンジが発生していたときのカウント値のみが順次記憶されてもよい。

一方、入力されたアナログのオーディオ信号は、図示しない A/D変換器によつてデジタルデータに変換された後、オーディオエンコーダ 4 0に入力される。オーディオエンコーダ 4 0は、入力されたオーディオデータを M P E Gオーディォ方式等で圧縮符号化し、オーディオ E Sとして多重化部 5 0に出力する。多重化部 5 0には、ビデオ E Sバッファ 5 1、オーディォ E Sバッファ 5 2、 MUX (Multiplexer) 5 3、カウンタ 5 4および照合処理回路 5 5が設けられている。

ビデオ E Sバッファ 5 1およびオーディォ E Sバッファ 5 2は、それぞれビデォエンコーダ 3 1からのビデオ E Sおよびオーディオエンコーダ 4 0からのォ一ディォ E Sを順次記憶して、 MUX 5 3に対して出力する F I F O方式のバッファメモリである。

MU X 5 3は、ビデオ E Sバッファ 5 1およびオーディオ E Sバッファ 5 2から順次データを読み出し、所定のシステム情報をヘッダ領域に書き込みながら多重化して、 M P E Gストリームを生成する。また、 MUX 5 3は、ビデオ E Sバッファ 5 1からピクチヤの先頭部が読み出されると、カウン夕 5 4をインクリメン卜するとともに、ピクチャの読み出しを照合処理回路 5 5に通知する。そして、このピクチャにおいてシーンチェンジが発生しているか否かの判断結果を照合処理回路 5 5から受け取り、ピクチャの先頭データを格納するパケットのヘッダ内に、判断結果に応じたシーンチェンジ情報を書き込む。

カウンタ 5 4は、 MU X 5 3がビデオ E Sバッファ 5 1から読み出したピクチャの枚数をカウントし、カウン卜値を照合処理回路 5 5に出力する。照合処理回路 5 5は、 MUX 5 3からピクチャの読み出しを通知する制御信号を受信すると、カウン夕 5 4のカウント値を用いてメモリ 3 4を参照し、同一カウント値についてシーンチェンジが発生しているか否かを判定して、その判定結果を MUX 5 3 に通知する。

この M P E G符号化装置における基本的な動作は、以下のようになる。入力されたビデオデータは、フレームメモリ 1 0に順次格納される。フレームメモリ 1 0では、格納されたビデオデ一夕の各フレームに対してピクチャタイプが割り当てられ、各フレームのデ一夕がピクチャタイプに応じた符号ィヒ処理順にビデオェンコ一ダ 3 1によって読み出される。ビデオエンコーダ 3 1は、読み出した 1フレーム分のデータをエンコードしてピクチャを生成し、ピクチャのデ一夕をパケットに格納してビデオ E Sとして順次出力する。

生成されたビデオ E Sはビデオ E Sバッファ 5 1に一旦格納され、 MU X 5 3 から順次読み出される。また、オーディオエンコーダ 4 0において生成されたォ一ディォ E Sもオーディオ E Sバッファ 5 2に一旦格納され、 MUX 5 3から順次読み出される。 MUX 5 3は、読み出したビデオ E Sおよびオーディオ E Sに、必要なシステム情報を挿入しながら多重化し、 M P E Gストリームを生成して出力する。このとき、ビデオパケットのヘッダのオプション領域に、照合処理回路 5 5による判定結果に基づくシーンチェンジ情報が付加される。

次に、 M P E Gストリーム中にシーンチェンジ情報を挿入するための処理について説明する。

まず、シーンチェンジの発生は、フレームメモリ 1 0に格納されたビデオデ一夕を基にして、シーンチェンジ検出回路 2 0によって検出される。上述したように、フレームメモリ 1 0からは、各フレームのデ一夕が符号化処理順にビデオェンコーダ 3 1から読み出される。シーンチェンジ検出回路 2 0は、ビデオェンコーダ 3 1から 1フレーム分のデータが読み出されるごとに、そのフレームのデー夕とその 1つ前のフレームのデ一夕とからシ一ンチェンジの有無を検出し、検出結果をレジスタ 2 1に格納する。

ビデオエンコード部 3 0では、ビデオエンコーダ 3 1がフレームメモリから 1 フレーム分のデ一夕を読み出して 1つのピクチャを生成するごとに、カウン夕 3 2のカウント値がィンクリメン卜されるとともに、シーンチェンジ情報処理回路 3 3がレジス夕 2 1を参照してシーンチェンジの有無を判定し、メモリ 3 4に書き込みを行う。

図 3は、ビデオエンコード部 3 0における処理の流れを示すフローチヤ一トである。以下、このフローチヤ一トを用いて、ビデオエンコード部 3 0における処理をステツプ番号に沿つて説明する。

ステップ S 3 0 1において、ビデオエンコーダ 3 1は、フレームメモリ 1 0から 1フレーム分のビデオデータを読み出す。そして、ステップ S 3 0 2において、読み出したデータを M P E G— 2方式に従つて圧縮符号化処理し、 1つのピクチャを生成する。なお、生成されたピクチャのデータは図示しない出力バッファに一旦記憶された後、多重化部 5 0のビデオ E Sバッファ 5 1に出力される。

ステップ S 3 0 3において、ビデオエンコーダ 3 1からの制御信号に従って、カウンタ 3 2のカウント値がインクリメントされる。これとともに、ステップ S 3 0 4において、シーンチェンジ情報処理回路 3 3はレジスタ 2 1を参照して、シーンチェンジの有無を判定する。ステップ S 3 0 5において、シーンチェンジ情報処理回路 3 3は、判定結果をカウン夕 3 2のカウント値に対応づけて、メモリ 3 4に格納する。ステップ S 3 0 6において、処理を終了するか否かを判定し、続行する場合はステップ S 3 0 1に戻って、次のフレームのビデオデ一夕を読み出し、圧縮符号化を行う。

以上の処理により、メモリ 3 4には、ビデオエンコーダ 3 1によって生成された各ピクチャに割り当てられたカウント数と、各ピクチャでシーンチェンジが発生したか否かを示す情報とが保持される。一方、多重化部 5 0では、 MU X 5 3 がビデオ E Sバッファ 5 1から読み出したピクチャの枚数をカウンタ 5 4でカウン卜し、そのカウント数をメモリ 3 4に保持されたカウント数と照合することで、読み出したピクチャにおいてシーンチェンジが発生しているか否かを容易に認識することができる。

図 4は、多重化部 5 0における処理の流れを示すフローチャートである。以下、このフローチャートを用いて、多重化部 5 0の処理をステップ番号に沿って説明する。

ステップ S 4 0 1において、 MUX 5 3は、ビデオ E Sバッファ 5 1に記憶されたデータを読み出す。このとき、例えば P E S (Packetized Elementary

Stream) パケット単位分のデータが読み出される。ステップ S 4 0 2において、 MUX 5 3は、読み出したデータにピクチャの先頭部が含まれるか否かを判定する。この判定は、ピクチャレイヤのヘッダに記述されるピクチャ開始コード (Picture Start Code) を読み出すことで行われる。先頭部が含まれる場合はステツプ S 4 0 3に進み、含まれない場合はステップ S 4 0 6に進む。

ステップ S 4 0 3において、 MUX 5 3からの制御信号に従って、カウンタ 5 4がインクリメントされる。ステップ S 4 0 4において、照合処理回路 5 5は、メモリ 3 4の記憶データを参照して、インクリメントされたカウンタ 5 4のカウント値と同じ数値に対応づけられた情報を読み取り、シーンチェンジの有無を判定して MU X 5 3に通知する。ステップ S 4 0 5において、 MUX 5 3は、照合処理回路 5 5による判定結果に基づいて、シーンチェンジ情報を P E Sバケツトのヘッダ内のオプション領域に挿入する。なお、シーンチェンジ情報の挿入位置については、後の図 5において説明する。 .

ステップ S 4 0 6において、 MUX 5 3は、オーディオ E Sバッファ 5 2から読み出したデータを用いてオーディオパケットを生成し、出力信号に多重化する。ステップ S 4 0 7において、 MUX 5 3は、その他の必要なシステム情報を所定のヘッダ領域に挿入したビデオバケツトを生成し、出力信号に多重化する。

ステップ S 4 0 8において、処理を終了するか否かを判定し、続行する場合はステップ S 4 0 1に戻って、ビデオ E Sバッファ 5 1から読み出されたデータが MUX 5 3において処理される。以上の処理によって、 MU X 5 3からは、シ一ンチェンジ情報が付加された M P E G 2方式のシステムストリームが順次出力される。

図 5は、シーンチェンジ情報が揷入されるヘッダ領域のフォーマツト例を示す図である。

MUX 5 3における多重化処理により、ビデオ E Sバッファ 5 1から読み出されたデータは P E Sパケットに格納される。また、フレームの先頭デ一夕がペイロード内に含まれる P E Sバケツトではヘッダ領域が拡張され、この拡張領域には、タイムスタンプ等の格納領域とともに、 P E Sプライベートデータと呼ばれる 1 6パイト分のオプション領域が設けられている。従って、このオプション領域にシーンチェンジ情報を揷入することにより、再生時においてピクチャの再生タイミングに同期してシーンチェンジ情報を正確に取り出すことが可能となる。本実施の形態では、この P E Sプライベートデータ領域に、シーンチェンジの有無とともに、カウン夕 5 4によってカウントされたピクチャの枚数が記録される。例えば、 1バイト目に、シーンチェンジの有無についての情報が記録される。この領域には、シ一ンチェンジが発生している場合は " 1 " 、発生していない場合は " 0 " を書き込む。続いて、 2バイト目〜 5バイト目の領域には、そのピクチヤが符号化の開始時から何枚目となるのかを示す情報が、 3 2ビットのデ一夕で記録される。これらの値は、カウンタ 5 4のカウント数が用いられる。

以上の M P E G符号化装置では、ビデオエンコーダ 3 1で生成された各ピクチャについて、シーンチェンジの有無を示す情報が対応づけられてメモリ 3 4に格納される。そして、多重化部 5 0では、多重化処理時にピクチャの枚数をカウン卜し、メモリ 3 4を参照してカウント値を照合することによって、そのピクチャにおけるシーンチェンジの有無が判定されて、判定結果に応じたシーンチェンジ情報が多重化ストリーム中に挿入される。

このように、ピクチャの枚数を単位としてシーンチェンジの有無が認識されることにより、 MUX 5 3では、ピクチャのデ一夕の多重化処理に同期して正確にシーンチェンジ情報を挿入することができ、その挿入位置がピクチャの先頭位置からずれることがなくなる。また、その挿入位置を P E Sプライべ一卜データ領域としたことで、ピクチャとシーンチェンジ情報との同期を容易に正確に確保することができる。従って、生成された M P E Gストリームの再生時にシーンチェンジの発生タイミングを正確に抽出することができ、例えば場面ごとの頭出しやサムネールの生成等が、再生画像に正確に同期して行われる。

なお、上記の実施の形態では、ビデオデータをフレームごとに符号化する場合について説明したが、フィールドごとに符号化する場合にも適用することが可能である。この場合、シーンチェンジ検出回路は、ビデオエンコーダによってフレ —ムメモリから読み出されたフィールドと、その 2つ前にフレームメモリに記憶されたフィールドとからシ一ンチェンジを検出してもよい。

また、上記では、ピクチャの枚数を単位としてシーンチェンジの有無を識別していたが、この識別を G O P (Group Of Picture) 単位で行ってもよい。この場合、ビデオエンコーダでは、 G O Pの先頭ピクチャを生成するごとにカウン卜を行い、そのカウント数とシ一ンチェンジの有無を示す情報をメモリに書き込む。そして、多重化部でも同様に、 G O Pの先頭ピクチャを多重化する際に、上記のメモリを参照してシ一ンチェンジの有無を判定する。また、シーンチェンジ情報は G O Pヘッダを含む P E Sパケット内に挿入される。このような場合には、シ —ンチェンジ情報の書き込み位置は、実際にシーンチェンジが発生した位置から数フレーム分だけ遅延する場合があるが、 M P E G— 2方式の再生装置に通常設けられている頭出し機能を流用して、シーンチェンジの発生位置を特定することができる。

また、ユーザによって録画の開始/停止動作が繰り返されたり、あるいは複数の番組がタイマー録画された場合等に、録画の開始時にシーンチェンジ情報を揷入することで、新たに録画が開始されたタイミングを再生データから抽出することが可能となる。このような用途で使用される場合には、シ一ンチェンジ情報を 2003/005311

14 例えばシーケンスへッダ直後のユーザデータ領域に挿入すればよい。

また、 M P E G— 1方式で符号化を行う符号化装置の場合には、例えば、フレームの先頭デ一夕を多重化する位置の直前に、シーンチェンジ情報を格納したプライペートバケツトを揷入することで、再生時にシーンチェンジの発生位置を正確に抽出することができる。

以上説明したように、本発明の画像符号化装置によれば、符号化されたデータにヘッダ情報が揷入される際に、フレーム情報保持部を参照することで、生成されたピクチャに対応するフレーム情報を取得することができる。従って、フレーム情報をこのピクチャの先頭データに対応するへッダ情報内に確実に書き込むことができ、書き込み位置のずれの発生が防止される。

また、本発明の画像符号化方法によれば、フレーム情報を第 1のピクチャ枚数に対応づけて保持しておき、符号化されたデータにヘッダ情報を挿入する際に、受け取ったピクチャをカウントした第 2のピクチャ枚数と照合することで、生成されたピクチャに対応するフレ一ム情報を取得することができる。従って、フレーム情報をこのピクチャの先頭デ一夕に対応するヘッダ情報内に確実に書き込むことができ、書き込み位置のずれの発生が防止される。

上記については単に本発明の原理を示すものである。さらに、多数の変形、変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応するすべての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。

Claims

請求の範囲

1 . 動画像を符号化する画像符号化装置において、

入力された動画像データを圧縮符号化する符号化処理部と、

前記符号化処理部によつて生成されたピクチャの枚数をカウン卜する第 1の力ゥン夕と、

入力された前記動画像データ中のフレームに固有な情報を示すフレーム情報を、前記第 1のカウンタによるカウント数に対応づけて保持するフレーム情報保持部と、

前記符号化処理部によって生成されたピクチャを受け取って所定のヘッダ情報を挿入するへッダ情報挿入部と、

前記へッダ情報挿入部が受け取ったピクチャの枚数をカウントする第 2のカウン夕と、

を有し、前記ヘッダ情報揷入部は、前記フレーム情報保持部を参照して、前記第 1および第 2のカウン夕による各カウント数が一致したときのピクチャに対応する前記フレ一ム情報を、当該ピクチャの先頭データに対応する前記ヘッダ情報内に書き込むことを特徴とする画像符号化装置。

2 . 入力された前記動画像データから前記フレーム情報を検出するフレーム情報検出部をさらに有し、前記フレーム情報保持部は前記フレーム情報検出部から前記フレーム情報を取得することを特徴とする請求の範囲第 1項記載の画像符号化装置。

3 . 前記ヘッダ情報揷入部は、前記符号化処理部によって生成された前記ピクチヤを含む動画像ストリームを他のデータストリームと多重化する多重化処理部に設けられたことを特徴とする請求の範囲第 1項記載の画像符号化装置。

4 . 前記フレ一ム情報は、対応するフレームにおいてシーンチェンジが発生したことを示す情報を含むことを特徴とする請求の範囲第 1項記載の画像符号化装置。

5 . 入力された前記動画像データを一時的に記憶するメモリと、

前記メモリに記憶されたフレームまたはフィールドのデータとそれ以前のフレームまたはフィ一ルドのデ一夕とから前記シーンチェンジの有無を検出するシーンチェンジ検出部と、 '

をさらに有し、

前記フレーム情報保持部は前記シーンチェンジ検出部からの検出信号に基づいて前記シーンチェンジが発生したことを認識することを特徴とする請求の範囲第 4項記載の画像符号化装置。

6 . 前記符号化処理部は、前記メモリからフレ一ムまたはフィ一ルドのデ一夕を読み出すごとに圧縮符号化処理を行って前記ピクチャを生成し、

前記シ一ンチェンジ検出部は、前記符号化処理部によって前記圧縮符号化処理対象のフレームまたはフィールドのデータが前記メモリから読み出されると、当該フレームまたは当該フィールドについて前記シーンチェンジの検出を行うことを特徴とする請求の範囲第 5項記載の画像符号化装置。

7 . 前記フレーム情報は、入力された前記動画像デ一夕中の各フレームの垂直プランキング期間に記録された情報を含むことを特徴とする請求の範囲第 1項記載の画像符号化装置。

8 . 動画像を符号化する画像符号化装置において、

入力された動画像デー夕を圧縮符号化する符号化処理部と、

前記符号化処理部によって生成されたピクチャについて、複数のピクチャをグル一プ化したダル一プ単位で力ゥントする第 1のカウンタと、

前記符号化処理部によって生成された前記ピクチャを受け取って所定のヘッダ情報を挿入するへッダ情報揷入部と、

前記へッダ情報揷入部が受け取つたピクチャについて前記グループ単位で力ゥントする第 2のカウンタと、

を有し、前記ヘッダ情報揷入部は、前記フレーム情報保持部を参照して、前記第 1および第 2のカウンタによる各カウント数が一致する前記グループに対応する前記フレーム情報を、当該グループの先頭データに対応する前記ヘッダ情報内に書き込むことを特徴とする画像符号化装置。

9 . 動画像を符号化するための画像符号化方法において、

入力された動画像データを圧縮符号化するとともに、前記圧縮符号化処理によつて生成されたピクチャの枚数を第 1のピクチャ枚数としてカウントし、

入力された前記動画像データ中のフレームに固有な情報を示すフレーム情報を、前記第 1のピクチャ枚数に対応づけて保持し、

前記圧縮符号化処理によって生成されたピクチャを受け取って所定のへッダ情報を挿入する際に、受け取ったピクチャの枚数を第 2のピクチャ枚数としてカウントし、前記第 1および第 2のピクチャ枚数が一致したときのピクチャに対応する前記フレーム情報を、当該ピクチャの先頭データに対応する前記ヘッダ情報内に書き込む、

ことを特徴とする画像符号化方法。