JP3423834B2

JP3423834B2 - 予測符号化画像データ管理方法及び装置

Info

Publication number: JP3423834B2
Application number: JP10650796A
Authority: JP
Inventors: 明人阿久津; 洋浜田; 行信谷口; 康巨新倉
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1996-04-26
Filing date: 1996-04-26
Publication date: 2003-07-07
Anticipated expiration: 2016-04-26
Also published as: JPH09294277A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ビデオを蓄積、管
理する技術に関するものであり、特にビデオの管理方法
および装置に関する。

【０００２】

【従来の技術】コンピュータの高性能化、ハードディス
クの大容量化とこれらの低価格化に伴い、コンピュータ
の一般家庭への普及が進んでいる。画像符号化の分野で
もＨ２６１、ＭＰＥＧ１の標準化の勧告に始まりＭＰＥ
Ｇ２の標準化も勧告の段階である。高性能コンピュー
タ、大容量ハードディスクの普及、圧縮技術の確立によ
り映像のデジタル化が身近なものとなってきている。ま
た、コンピュータがネットワークに接続され、デジタル
映像の流通が可能となるインフラが整備されつつある。
このような時代背景のもと、映像の蓄積、流通、鑑賞の
スタイルも変革することへの要請が強くなってきた。従
来の映像に対してユーザは与えられるままに見るだけで
あったが、このような時代においてユーザは、自分なり
の見方、例えば、好きな場面だけを見る、要約してみ
る。この場面は子どもに見せたくない等、映像に対して
多彩なアクセス方法への要求が潜在的に存在する。当然
このようなアクセスに関する要求に答えるためには、映
像それ自身のデジタル表現、管理方法等背後に隠れた技
術が新しいユーザインタフェースに加えて必要である。

【０００３】この必要性から従来、幾つかの報告がなさ
れてきた。従来の報告は、映像の構造化を目指したもの
であり、構造化された映像をユーザにとって扱い易いよ
うに表現するユーザインタフェースの構築を目指したも
のである。

【０００４】映像の構造化を目指した報告として、柴田
〔“映像の内容記述モデルとその映像構造化への応
用”、信学論、Ｖｏｌ．７８−Ｄ−ＩＩ、Ｎｏ．５，ｐ
ｐ．７５４−７６４（１９９５）〕は、放送用の映像を
対象にスクリプタが付けたアノテーションを人手で入力
し、映像に特徴量を付加することを提案し、便宜的に特
徴量空間をユークリット空間と考え、その中で距離を定
義して類似度を計算することでショットのクラスタリン
グを行っている。ショットをクラスタリングすることで
階層構造を定義し、映像の構造化を行っている。

【０００５】また、上田他〔“ＩＭＰＡＣＴ：ＡｎＩ
ｎｔｅｒａｃｔｉｖｅＮａｔｕｒａｌ−Ｍｏｔｉｏｎ
−ＰｉｃｔｕｒｅＤｅｄｉｃａｔｅｄＭｕｌｔｉｍ
ｅｄｉａＡｕｔｈｏｒｉｎｇＳｙｓｔｅｍ”、Ｐｒ
ｏｃｅｅｄｉｎｇｏｆＣＨＩ’９１、ｐｐ．３４３
−３５０（１９９１）〕は、映像を計算機で自動処理し
得られる物理的特徴を抽出し、抽出された特徴を場合に
よっては内容知識と照合すると共に特徴あるいは知識を
映像ヘインデクシング、構造化を行っている。

【０００６】映像への新しいユーザインタフェースとし
て、Ｍ．Ｍｉｌｌ他の〔“ＡＭａｇｎｉｆｉｅｒＴ
ｏｏｌｆｏｒＶｉｄｅｏＤａｔａ”、Ｐｒｏｃｅ
ｅｄｉｎｇｏｆＣＨＩ’９２、ｐｐ．９３−９８
（１９９２）〕は、映像のフレームを時間解像度レベル
に応じて空間に配置し、粗い時間解像度から細かい時間
解像度へと時間への新しいアクセススタイルを可能にし
た報告をしている。

【０００７】また、今まで圧縮されていない映像を扱
い、上記報告等の高度な映像ハンドリングを目指した研
究がなされてきたが、近年、画像符号データから複号せ
ずに計算コストの軽減を目的としてカット点、カメラ操
作等の情報を抽出する技術が報告されている〔“カット
点検出装置”、特開平７−２８４０１７号〕。

【０００８】

【発明が解決しようとする課題】しかしながら、上記従
来の技術における報告等では、解決していない課題が存
在する。

【０００９】柴田の報告では、放送局の映像を対象と
し、映像の使われ方等の制限を付け仮定し、人手を介し
て、映像に意味的な特徴量を付加することを行い構造化
している。今後ますます増大するであろう一般家庭等の
映像を与えた場合、柴田の仮定は成り立たず、人手を介
して特徴量を付けることもナンセンスである。まず、課
題として、自動化による一般性のある特徴量の付加と構
造化の実現が課題である。

【００１０】上田他の報告では、映像の持つ特徴として
物理的な特徴量を自動抽出し構造化することを提案して
いるが、上田他の報告で目指す構造化は、放送、映画、
フィルムの業界で用いられてきた映像の構造を基とする
ものである。ここで、業界で用いられてきた映像の構造
に関してＧ．Ｄａｖｅｎｐｏｒｔ他〔“Ｃｉｎｅｍａｔ
ｃＰｒｉｍｉｔｉｖｅｓｆｏｒｍｕｌｔｉｍｅｄ
ｉａ”、ＩＥＥＥＣｏｍｐｕｔｅｒＧｒａｐｈｉｃ
ｓ＆Ａｐｐｌｉｃａｔｉｏｎｓ、Ｖｏｌ．１１、Ｎ
ｏ．４、ｐｐ６７−７５（１９９１）〕が報告してい
る。映像の最小単位をショットとし、複数のショットか
らなる映像をシーンと考え、複数のシーンからストーリ
ーは構成されるという考えである。深く映像の意味に立
ち入らないでこの概念で構造化を行おうとすると階層が
たかだか数階層であり、多彩なアクセスを可能にする構
造を実現していないことが問題である。

【００１１】また、Ｍ．Ｍｉｌｌ他の報告では、映像の
時間解像度に着目し、時間の連続による映像の階層構造
を利用してユーザインタフェースを構築している。深さ
のある連続な階層を実現しているが、物理的な特徴（時
間解像度）のみを用いた構造化であるために映像のコン
テントについて何も考慮されておらず、映像のコンテン
トに対して直感的にアクセスする事は困難である。

【００１２】また、近年報告されている符号化データか
らのインデクシングに関する報告は、基本的に上田等の
報告で目指す構造化であり、上記した問題を解決するも
のではない、ただ、計算コスト軽減に関しては、有効な
アプローチである。

【００１３】上記で述べたように今後の社会的要請に応
じて映像をデジタル化し、管理、アクセスする場合、映
像の構造化処理の自動化及び高速化、一般性を有しコン
テントを反映した特徴量による深い階層をもつ構造化、
及び多彩なユーザの目的に適うユーザインタフェース技
術の必要性がある。

【００１４】従来報告されている映像の管理およびアク
セスに関する報告は、上記の必要性に答えるものではな
い。すなわち上記従来の技術には問題がある。

【００１５】本発明の目的は、映像を一般性を有しコン
テントを反映した特徴量による深い階層構造に自動的し
かも高速に構造化する技術と、多彩なユーザの目的に適
う多彩なアクセススタイルを持つユーザインタフェース
構築を可能とする予測符号化画像データ管理方法及び装
置を提供することにある。

【００１６】

【課題を解決するための手段】上記の目的を達成するた
め、本発明の予測符号化画像データ管理装置は、予測符
号化画像データを蓄積管理する装置であって、予測符号
化画像データを読み込み、データ列を保存する画像デー
タ列メモリ部と、該画像データ列メモリ部からデータ列
を読み出しデータ構造が持つ階層に応じて階層に分離す
る階層分離部と、該分離された階層から画像データの持
つ物理的な特徴を抽出する特徴抽出部と、該抽出された
物理的特徴から各々の画像を特徴付ける特徴ベクトルを
生成する特徴ベクトル生成部と、該特徴ベクトル間での
距離を算出し、距離が近い特徴ベクトルを統合する分割
・統合部と、該統合された特徴ベクトルの代表特徴ベク
トルを求め、該代表特徴ベクトルを階層的に管理する特
徴ベクトル管理部とを備えること、前記階層分離部で
は、予測符号化画像データをシーケンス層、ＧＯＰ層、
ピクチャ層、スライス層、マクロブロック層、ブロック
層に分離すること、前記特徴抽出部は、ブロック層から
各ブロックの輝度の直流成分を算出する直流成分算出部
と、輝度の交流成分を算出する交流成分算出部と、マク
ロブロック層から各ブロックの色差の直流成分を算出す
る直流成分算出部と、色差の交流成分を算出する交流成
分算出部と、動きベクトルを算出する動きベクトル算出
部と、ブロック毎に該算出された直流成分からヒストグ
ラムを作成するブロックヒストグラム作成部と、ブロッ
ク毎に該算出された交流成分からテクスチャ特徴量を算
出するブロックテクスチャ特徴量算出部とを新たに備え
ること、前記分割・統合部は、該特徴ベクトルの類似度
を算出する際の条件を与える類似距離条件部と、該条件
に基づいて該特徴ベクトルの類似度を測定し、類似距離
行列の算出を行う類似距離行列算出部と、距離が最小な
クラスタ対を決定し、最小距離クラスタ対を結合する最
小距離結合部と、予め与えたクラスタの個数と結合され
たクラスタの個数とを比較・判断する結合対判断部とを
新たに備えること、前記特徴ベクトル管理部は、クラス
タリングされた特徴ベクトルを代表する代表特徴ベクト
ルを算出する代表特徴ベクトル算出部と、該代表特徴ベ
クトルに符号を付与する符号化部と、代表特徴ベクトル
と符号との対応を表わす表を作成する符号帳作成部とを
新たに備えることを特徴とする。

【００１７】また、上記の目的を達成するため、本発明
の予測符号化画像データ管理方法は、予測符号化画像デ
ータを蓄積管理する方法であって、予測符号化画像デー
タを読み込み、データ列を画像データ列メモリ部に保存
し、該メモリ部からデータ列を読み出してデータ構造が
持つ階層に応じて各階層に分離し、該分離された階層か
ら画像データの持つ物理的な特徴を抽出し、該抽出され
た物理的特徴から各々の画像を特徴付ける特徴ベクトル
を生成し、該特徴ベクトル間での距離を算出し、距離が
近い特徴ベクトルを統合し、該統合された該特徴ベクト
ルの代表特徴ベクトルを求め、該代表特徴ベクトルを階
層的に管理すること、前記データ構造を階層に分離する
際に、予測符号化画像データをシーケンス層、ＧＯＰ
層、ピクチャ層、スライス層、マクロブロック層、ブロ
ック層に分離すること、前記画像データの持つ物理的な
特徴を抽出する際に、ブロック層から各ブロックの輝度
の直流成分を算出し、輝度の交流成分を算出し、マクロ
ブロック層からは各ブロックの色差の直流成分を算出
し、色差の交流成分を算出して動きベクトルを算出し、
ブロック毎に該算出された直流成分からヒストグラムを
作成して、ブロック毎に該算出された交流成分からテク
スチャ特徴量を算出すること、前記特徴ベクトルを統合
する際に、該特徴ベクトルの類似度を算出する際の条件
を与え、該条件に基づいて該特徴ベクトルの類似度を測
定して類似距離行列の算出を行い、距離が最小なクラス
タ対を決定して最小距離クラスタ対を結合し、予め与え
たクラスタの個数と結合されたクラスタの個数とを比較
・判断すること、前記特徴ベクトルを管理する際に、ク
ラスタリングされた特徴ベクトルを代表する代表特徴ベ
クトルを算出し、該代表特徴ベクトルに符号を付与し、
代表特徴ベクトルと符号との対応を表わす表を作成する
ことを特徴とする。

【００１８】本発明では、上記のように、予測符号化画
像データを用いて、そのデータ構造が持つ階層に応じて
階層に分離し、分離された階層から画像データの持つ物
理的な特徴、すなわち一般性を有しコンテントを反映し
た特徴を抽出して、各々の画像を特徴付ける特徴ベクト
ルを生成し、その特徴ベクトル間での距離を算出して特
徴ベクトルを分割・統合することによって、自動的でし
かも高速に映像を深い階層構造で構造化し、これを蓄
積、管理することにより、ユーザのそれぞれの多彩な目
的に応じたアクセススタイルのモードを変化させること
が出来るユーザインタフェース構築を可能とし、従来の
アクセススタイルに捕らわれない新しい映像のとの関わ
り合いや効率の良い映像のハンドリングを実現可能とす
る。

【００１９】

【発明の実施の形態】以下、本発明の実施形態例を、図
面を参照して詳細に説明する。

【００２０】図１に本発明装置の構成図を示す。以下、
構成図に沿って各構成部及び手法を説明する。図１の１
０１の画像データ列メモリ部に予測符号化画像データ列
を蓄積する。蓄積されたデータ列を１０２の階層分離部
でシーケンス層、ＧＯＰ層、ピクチャ層、スライス層、
マクロブロック層、ブロック層に分離する。この層は、
ＭＰＥＧ２の圧縮方式で符号化されたデータの持つ構造
である。厳密に言うと、ＭＰＥＧ方式では、画面内符号
化画像、画面間順方向予測符号化画像、画面間双方向予
測符号化画像といわれる方式を組み合わせている。ここ
では、ＭＰＥＧ方式を予測符号化画像データとして考え
る。

【００２１】ここで、ＭＰＥＧ方式、特にＭＰＥＧ２方
式で圧縮されたデータの階層構成を図２を用いて説明す
る。一番上の層がシーケンス層であり、２０１のシーケ
ンスヘッダーと、２０２のピクチャー群から構成され
る。次のＧＯＰ層は、２０３のフレーム内符号化画像、
２０４のフレーム間順方向予測符号化画像、２０５の双
方向予測符号化画像から構成される。２０６のピクチャ
ー層は、スライス群であり、スライス層は、２０７のマ
クロブロックから構成される。また、マクロブロック
は、輝度情報の４つのブロック（２０８）と２つの色差
情報に関するブロック（２０９，２１０）の計６つから
構成される。以上説明した各層へデータ列を１０２の階
層分離部において分離する。実質的には、上記の構造情
報のみが分離されることになる。

【００２２】次に１０３の画像特徴抽出部において画像
の特徴量の抽出を行う。以下、図３を参照して説明す
る。まずブロック層の各ブロック（８×８ピクセル）か
ら直流成分（ＤＣ成分）と交流成分（ＡＣ成分）を、直
流成分算出部１０３ａと交流成分算出部１０３ｂで算出
する。ここで、各成分を算出する画像は、２０３のフレ
ーム内符号化画像とする。Ｐ，Ｂは、フレーム間予測さ
れた画像であり、基本的に復号化が伴うため、計算コス
トの軽減から避けることとする。輝度に関しては４つの
ブロック毎（３０１）に１０３ｃのヒストグラム生成部
においてヒストグラム（３０４）を算出する。また、色
差に関しては、各ブロック毎（３０２，３０３）にヒス
トグラム（３０５，３０６）を算出する。これは、輝度
ブロック４に対しての色差ブロックはそれぞれ１である
ことによる。

【００２３】次に、算出されるＡＣ成分からテクスチャ
特徴生成部１０３ｄにおいてテクスチャー特徴を算出す
る。８×８ピクセルのブロックはＤＣＴ変換が施されて
いる。このＤＣＴ計数は、図４の４０１に示した様にジ
グザグスチャンされ表現されている。４０１の１が直流
成分（ＤＣ成分）であり、２〜６４が交流成分（ＡＣ成
分）である。２〜６４で表現されたＤＣＴ計数は、この
ブロックのテクスチャーを良く表現するものであり、本
説明では、この計数列をテクスチャー特徴と考える。

【００２４】次に動きベクトルの算出を図５を参照して
説明する。動きベクトルは、動きベクトル算出部１０３
ｅにおいてＰ，Ｂピクチャーから算出する。Ｐは、順方
向予測符号化であり過去のフレーム（５０１）から未来
のフレーム（５０２）を予測する動きベクトルが情報と
して含まれている。また、Ｂは、５０１と５０２のフレ
ーム間に挿入されるフレームであり、５０１のフレーム
からの順方向を予測する動きベクトルと５０２のフレー
ムからの逆方向を予測する動きベクトルが情報として含
まれている。しかしながら、予測誤差が大きい場合、動
きベクトルを用いないで符号化されているブロックが存
在する。本発明では、動きベクトルが存在するブロック
から動きベクトルを算出し、存在しないブロックに対し
ては、存在するブロックで内挿することを行う。内挿方
法として、線形内挿法、メディア内挿法等を用いる。

【００２５】次に、図１の１０４の特徴ベクトル生成部
において、１０３の画像特徴抽出部で算出した特徴量か
ら特徴ベクトルの生成を行う。この様子を図６に示す。

【００２６】１０３の画像特徴抽出部で算出された特徴
量（ヒストグラム）から特徴ベクトルを構成する要素を
生成する。３０７のヒストグラムを例に生成の様子を説
明する。予め与えた個数（図６（ａ）の場合では４）で
ヒストグラムを分割する（６０１）。分割された範囲で
値の平均値を計算し、その範囲の値とする。それぞれの
範囲で計算された値を図６（ａ）の６０２で示した様に
配置し、ベクトルを作成する。ベクトル６０２をＨＩＳ
Ｔ_y，_ij（ｋ）、ｋ＝０〜３で表す。色相のヒストグラ
ムと同様の方法で、彩度、明度に関してそれぞれベクト
ルを算出する。彩度のベクトルをＨＩＳＴ_Cr，
_ij（ｋ）、ｋ＝０〜３、明度のベクトルをＨＩＳＴ_Cb，
_ij（ｋ）、ｋ＝０〜３で表す。

【００２７】また、図４に示した、テクスチャーに関す
る特徴量についてもベクトル化を行う。４０１の空間周
波数分布を図６（ｂ）の６０３に示す様に分割化を行
う。６０３の場合、４分割である。分割された領域毎に
平均値、又は最大値、分散等の値を算出し、その領域の
値とする。それぞれの値を、図１の物理的特徴統合配置
部１０４ａにおいて、図６（ｂ）の６０４の様に配置し
ベクトルとする。テクスチャーに関するベクトルは、６
０３で示したように８×８ピクセルの４つのブロック毎
に算出する。色差ブロックについては４つのブロックの
各領域の値を並べて配置するが、輝度ブロックでは、１
つの色差ブロックに対応する４つの輝度ブロックの各計
数の平均値を１つのブロックの値としてベクトルを算出
する。算出するベクトルをＦＲＥＱ_y，_ij（ｌ）、ＦＲ
ＥＱ_Cr，_ij（ｌ）、ＦＲＥＱ_Cb，_ij（ｌ）とそれぞれ表
す。また、動き情報は、各ブロック毎に動き変化量
（ｕ，ｖ）_i，_jが算出されている。これらのベクトルか
ら特徴ベクトル｛ＨＩＳＴ_y，_ij（ｋ）、ＨＩＳＴ_Cr，
_ij（ｋ）、ＨＩＳＴ_Cb，_ij（ｋ）、ＦＲＥＱ_y，
_ij（ｌ）、ＦＲＥＱ_Cr，_ij（ｌ）、ＦＲＥＱ_Cb，
_ij（ｌ）、ｕ，ｖ｝を算出する。

【００２８】次に、図１の１０５の分割・統合部におい
て、特徴ベクトルのクラスタリングを行う。この処理の
流れを図７に示す。図中、７０１〜７０７はステップを
表す。特徴ベクトルクラスタリングの様子を流れに沿っ
て説明する。７０１においてまず、類似距離条件分離部
１０５ａから類似距離の条件を入力する。ここで与える
条件は、画像の類似度算出する際に、類似度に大きく寄
与する特徴を決定する。画像の特徴として、色、テクス
チャ、構図、動き等があるがこれらの類似度算出におけ
る寄与度を７０１で入力する。例えば、色：テクスチ
ャ：構図：動き：時間＝１０：５：３：１：６の様に入
力する。構図に関しては、特徴ベクトルの値によらずそ
の構成が等しいときに構造は等しいとする。例えば、特
徴ベクトル｛３，３，４，４｝と特徴ベクトル｛１０，
１０，１，１｝は構図は等しいが、色等は異なるとす
る。時間は、対象としている画像はビデオのフレームで
あり、時間的にシーケンシャルなものである。時間的に
連続する画像は、それ自身類似している。この拘束条件
をコントロールすることを目的として類似度の時間寄与
度を導入する。時間の寄与度が小さい場合、隣接する画
像フレームの拘束は無く、一枚一枚の静止画像の集まり
として考える。次に、７０２において最終的なクラスタ
の数を入力していく。以下、７０３において、類似距離
行列算出部１０５ｂで類似距離を算出し、７０４におい
て、最小距離結合部１０５ｃで最小距離のクラスタ対を
発見し、７０５において、同じく最小距離結合部１０５
ｃでそれらを融合し、７０６において、再び類似距離行
列算出部１０５ｂで融合後の新しい類似距離を算出す
る。算出後、クラスタ数が、７０２で与えた最終クラス
タ数と一致するかどうかを結合対判断部１０５ｄで判断
し、一致すればクラスタリング処理を完了し、そうでな
ければ、７０４へ戻り処理を繰り返す。

【００２９】以上の一連のクラスタリングの各階段での
類似距離の計算では、最初に全ての特徴ベクトル間の類
似距離を算出しておけば、後のクラスタと特徴ベクトル
間、及びクラスタ間の類似距離は漸化式によって計算で
きる。これをここで説明する。クラスタｉ（特徴ベクト
ル数ｎ_i）とクラスタｊ（特徴ベクトル数ｎ_j）を融合し
て新クラスタｋ（特徴ベクトル数ｎ_k）を作ったとす
る。

【００３０】ｎ_k＝ｎ_i＋ｎ_j、このときクラスタｋに含まれない特徴ベクトルあるいは
クラスタをｈとして、融合前の各クラスタ間の距離をそ
れぞれｄ_hi，ｄ_hj，ｄ_ijとすれば、ｋとｈの距離ｄ_hkは
次式で与えられる。

【００３１】ｄ_hk＝α_iｄ_hi＋α_jｄ_hj＋βｄ_ji＋γ｜ｄ_hi−ｄ_hj｜、あるいは、ｄ² _hk＝α_iｄ² _hi＋α_jｄ² _hj＋βｄ² _ji＋γ｜ｄ² _hi−ｄ²
_hj｜、ここでα_i，α_j，β，γは類似距離の定義によって決ま
る定数であり、前記した寄与度から算出するものであ
る。従来報告されている距離も本発明で用いることは可
能である。ここで幾つか従来報告されている距離を説明
する。

【００３２】１）最短距離法クラスタｋとｈに含まれる最短距離にある特徴ベクトル
間の距離ｄ_hkと定義する方法がある。

【００３３】α_i＝α_j＝１／２，β＝０，γ＝−１／
２，ｄ_hk＝ｍａｘ［ｄ_hi，ｄ_hj］２）最長距離法クラスタｋとｈに含まれる最長距離にある特徴ベクトル
間の距離ｄ_hkと定義する方法である。

【００３４】α_i＝α_j＝１／２，β＝０，γ＝１／２，
ｄ_hk＝ｍａｘ［ｄ_hi，ｄ_hj］３）メディアン法ｄ_hkをｄ_hiとｄ_hjの中間値に設定する方法である。

【００３５】α_i＝α_j＝１／２，β＝−１／４，γ＝
０，ｄ_hk＝ｍａｘ［ｄ_hi，ｄ_hj］４）重心法クラスタ間の距離をクラスタの重心間距離で定義するも
のである。

【００３６】α_i＝ｎ_i／ｎ_k，α_j＝ｎ_j／ｎ_k，β＝−ｎ
_iｎ_j／ｎ² _k，γ＝０，ｄ_hk＝ｍａｘ［ｄ_hi，ｄ_hj］５）群平均法クラスタ間の距離をその２つのクラスタに含まれる全て
の特徴ベクトル間の距離の２乗平均で定義するものであ
る。

【００３７】α_i＝ｎ_i／ｎ_k，α_j＝ｎ_j／ｎ_k，β＝０，
γ＝０，ｄ_hk＝ｍａｘ［ｄ_hi，ｄ_hj］上記説明した距離も類似距離として用い、特徴ベクトル
のクラスタリングを上記説明した一連の流れによって行
う。

【００３８】次に、図１の１０６の特徴ベクトル管理部
において、クラスタリングされた特徴ベクトルの代表特
徴ベクトルを代表特徴ベクトル算出部１０６ａで算出
し、算出された各々の代表特徴ベクトルを構造的に管理
する。クラスタリングされた各クラスタの重心、平均、
最長、最短等を算出し、代表特徴ベクトルとする。代表
特徴ベクトルを管理する構造の作成を図８を用いて説明
する。クラスタリング前を８０１とする。８０１を２つ
にクラスタリング（８０２と８０３）し代表特徴ベクト
ルをＨ₀，Ｈ₁とする。同様にクラスタリングされたクラ
スタに対して２つに分割し、それぞれ代表特徴ベクトル
を算出する。分割されたクラスタは、図８に示すように
階層構造を有し、それぞれの階層に置いて代表特徴ベク
トルが算出されている。１０６ｂの符号部においてＨ₀
等の符号が代表特徴ベクトルに対して付けされ、符号と
代表特徴ベクトルの対応表を符号帳作成部１０６ｃにお
いて作成する。上記の説明は、クラスタを分割する方向
で階層を作成するアプローチであるが、逆にクラスタを
統合する方向で階層を作成するアプローチも可能であ
る。

【００３９】次に、本発明の予測符号化画像データ管理
方法の実施形態例を示す。図９は、それを示すフローチ
ャートである。図中、９０１〜９１３はステップを表
す。まず、９０１において、予測符号化画像データを読
み込み、画像データ列メモリ部に保存してあるデータ列
を読み出して入力する。次に、９０２において、データ
構造が持つ階層に応じてデータの階層分離を行う。次
に、９０３において、ブロック層から各ブロックの輝度
の直流成分を算出して、９０４において、ブロック毎に
該算出された直流成分からヒストグラムを作成する。ま
た、９０５において、輝度の交流成分を算出し、マクロ
ブロック層からは各ブロックの色差の直流成分を算出
し、色差の交流成分を算出して動きベクトルを算出す
る。さらに、９０６において、ブロック毎に交流成分を
算出して、９０７において、テクスチャ特徴量を算出す
る。以上で物理的な特徴を抽出する。次に、９０８にお
いて、抽出された該物理的特徴から各々の画像を特徴付
ける特徴ベクトルを生成する。次に、９０９において、
特徴ベクトル間での距離を算出して特徴ベクトルを分割
・統合する。次に、９１０において、前記の分割・統合
された特徴ベクトルを管理する。次に、９１１におい
て、前記で管理された特徴ベクトルに基づいて画像を表
示する。次に、９１２において、終了判断を行い、継続
であれば９１３においてユーザのイベント入力を受け付
けて前記で管理された特徴ベクトルに基づいて、ユーザ
の多様なアクセススタイルでの画像の表示を行う。

【００４０】以上、本発明の実施形態例に基づき具体的
に説明したが、本発明は、前記実施形態例に限定される
ものではなく、その要旨を逸脱しない範囲において種々
の変更が可能であることは言うまでもない。

【００４１】

【発明の効果】以上の説明のとおり、本発明によれば、
自動的でしかも高速に映像を構造化し、蓄積することが
でき、ユーザのそれぞれの多彩な目的に応じたアクセス
スタイルのモードを変化させることが出来るユーザイン
タフェース構築が可能となり、従来のアクセススタイル
に捕らわれない新しい映像のとの関わり合いや効率の良
い映像のハンドリングが実現可能となる。

【図面の簡単な説明】

【図１】本発明の予測符号化画像データ管理システムの
一実施形態例を示す構成図

【図２】上記実施形態例におけるＭＰＥＧ符号化画像デ
ータの階層構成図

【図３】上記実施形態例におけるＤＣ成分からのヒスト
グラム算出を説明する図

【図４】上記実施形態例におけるＡＣ成分からのテクス
チャー特徴算出を説明する図

【図５】上記実施形態例における順、双方向予測を説明
する図

【図６】（ａ），（ｂ）は、上記実施形態例における特
徴のベクトル化を説明する図

【図７】上記実施形態例における分割・統合部における
処理の流れを示すフローチャート

【図８】上記実施形態例における代表特徴ベクトルの階
層構造化の様子を示す図

【図９】本発明の予測符号化画像データ管理方法の一実
施形態例を示すフローチャート

【符号の説明】

１０１…画像データ列メモリ部１０２…階層分離部１０３…画像特徴抽出部１０４…特徴ベクトル生成部１０５…分割・統合部１０６…特徴ベクトル管理部

フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩ // Ｇ０６Ｆ 15/18 ５６０Ｈ０４Ｎ 7/137 Ｚ (72)発明者新倉康巨東京都新宿区西新宿３丁目19番２号日本電信電話株式会社内 (56)参考文献特開平７−271987（ＪＰ，Ａ) 特開平６−319108（ＪＰ，Ａ) 特開平６−153155（ＪＰ，Ａ) 特開平４−307668（ＪＰ，Ａ) 特開平７−38842（ＪＰ，Ａ) 特開平６−195396（ＪＰ，Ａ) 特開平５−108730（ＪＰ，Ａ) 特開平３−252780（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H04N 11/00 - 11/22 H04N 7/00 - 7/68 G06F 17/30

Claims

(57)【特許請求の範囲】

【請求項１】予測符号化画像データを蓄積管理する装
置であって、予測符号化画像データを読み込み、データ列を保存する
画像データ列メモリ部と、該画像データ列メモリ部からデータ列を読み出しデータ
構造が持つ階層に応じて階層に分離する階層分離部と、該分離された階層から画像データの持つ物理的な特徴を
抽出する特徴抽出部と、該抽出された物理的特徴から各々の画像を特徴付ける特
徴ベクトルを生成する特徴ベクトル生成部と、該特徴ベクトル間での距離を算出し、距離が近い特徴ベ
クトルを統合する分割・統合部と、該統合された特徴ベクトルの代表特徴ベクトルを求め、
該代表特徴ベクトルを階層的に管理する特徴ベクトル管
理部とを備えることを特徴とする予測符号化画像データ
管理装置。
【請求項２】前記階層分離部では、予測符号化画像データをシーケンス層、ＧＯＰ層、ピク
チャ層、スライス層、マクロブロック層、ブロック層に
分離することを特徴とする請求項１に記載の予測符号化
画像データ管理装置。
【請求項３】前記特徴抽出部は、ブロック層から各ブロックの輝度の直流成分を算出する
直流成分算出部と、輝度の交流成分を算出する交流成分算出部と、マクロブロック層から各ブロックの色差の直流成分を算
出する直流成分算出部と、色差の交流成分を算出する交流成分算出部と、動きベクトルを算出する動きベクトル算出部と、ブロック毎に該算出された直流成分からヒストグラムを
作成するブロックヒストグラム作成部と、ブロック毎に該算出された交流成分からテクスチャ特徴
量を算出するブロックテクスチャ特徴量算出部とを新た
に備えることを特徴とする請求項１または請求項２に記
載の予測符号化画像データ管理装置。
【請求項４】前記分割・統合部は、該特徴ベクトルの類似度を算出する際の条件を与える類
似距離条件部と、該条件に基づいて該特徴ベクトルの類似度を測定し、類
似距離行列の算出を行う類似距離行列算出部と、距離が最小なクラスタ対を決定し、最小距離クラスタ対
を結合する最小距離結合部と、予め与えたクラスタの個数と結合されたクラスタの個数
とを比較・判断する結合対判断部とを新たに備えること
を特徴とする請求項１、請求項２、請求項３のいずれか
に記載の予測符号化画像データ管理装置。
【請求項５】前記特徴ベクトル管理部は、クラスタリングされた特徴ベクトルを代表する代表特徴
ベクトルを算出する代表特徴ベクトル算出部と、該代表特徴ベクトルに符号を付与する符号化部と、代表特徴ベクトルと符号との対応を表わす表を作成する
符号帳作成部とを新たに備えることを特徴とする請求項
１、請求項２、請求項３、請求項４のいずれかに記載の
予測符号化画像データ管理装置。
【請求項６】予測符号化画像データを蓄積管理する方
法であって、予測符号化画像データを読み込み、データ列を画像デー
タ列メモリ部に保存し、該メモリ部からデータ列を読み出してデータ構造が持つ
階層に応じて各階層に分離し、該分離された階層から画像データの持つ物理的な特徴を
抽出し、該抽出された物理的特徴から各々の画像を特徴付ける特
徴ベクトルを生成し、該特徴ベクトル間での距離を算出し、距離が近い特徴ベ
クトルを統合し、該統合された該特徴ベクトルの代表特徴ベクトルを求
め、該代表特徴ベクトルを階層的に管理することを特徴
とする予測符号化画像データ管理方法。
【請求項７】前記データ構造を階層に分離する際に、予測符号化画像データをシーケンス層、ＧＯＰ層、ピク
チャ層、スライス層、マクロブロック層、ブロック層に
分離することを特徴とする請求項６に記載の予測符号化
画像データ管理方法。
【請求項８】前記画像データの持つ物理的な特徴を抽
出する際に、ブロック層から各ブロックの輝度の直流成分を算出し、
輝度の交流成分を算出し、マクロブロック層からは各ブロックの色差の直流成分を
算出し、色差の交流成分を算出して動きベクトルを算出し、ブロック毎に該算出された直流成分からヒストグラムを
作成して、ブロック毎に該算出された交流成分からテク
スチャ特徴量を算出することを特徴とする請求項６また
は請求項７に記載の予測符号化画像データ管理方法。
【請求項９】前記特徴ベクトルを統合する際に、該特徴ベクトルの類似度を算出する際の条件を与え、該条件に基づいて該特徴ベクトルの類似度を測定して類
似距離行列の算出を行い、距離が最小なクラスタ対を決定して最小距離クラスタ対
を結合し、予め与えたクラスタの個数と結合されたクラスタの個数
とを比較・判断することを特徴とする請求項６、請求項
７、請求項８のいずれかに記載の予測符号化画像データ
管理方法。
【請求項１０】前記特徴ベクトルを管理する際に、クラスタリングされた特徴ベクトルを代表する代表特徴
ベクトルを算出し、該代表特徴ベクトルに符号を付与し、代表特徴ベクトルと符号との対応を表わす表を作成する
ことを特徴とする請求項６、請求項７、請求項８、請求
項９のいずれかに記載の予測符号化画像データ管理方
法。