JP3423834B2 - 予測符号化画像データ管理方法及び装置 - Google Patents

予測符号化画像データ管理方法及び装置

Info

Publication number
JP3423834B2
JP3423834B2 JP10650796A JP10650796A JP3423834B2 JP 3423834 B2 JP3423834 B2 JP 3423834B2 JP 10650796 A JP10650796 A JP 10650796A JP 10650796 A JP10650796 A JP 10650796A JP 3423834 B2 JP3423834 B2 JP 3423834B2
Authority
JP
Japan
Prior art keywords
image data
feature vector
component
unit
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10650796A
Other languages
English (en)
Other versions
JPH09294277A (ja
Inventor
明人 阿久津
洋 浜田
行信 谷口
康巨 新倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10650796A priority Critical patent/JP3423834B2/ja
Publication of JPH09294277A publication Critical patent/JPH09294277A/ja
Application granted granted Critical
Publication of JP3423834B2 publication Critical patent/JP3423834B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/004Predictors, e.g. intraframe, interframe coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Color Television Systems (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ビデオを蓄積、管
理する技術に関するものであり、特にビデオの管理方法
および装置に関する。
【0002】
【従来の技術】コンピュータの高性能化、ハードディス
クの大容量化とこれらの低価格化に伴い、コンピュータ
の一般家庭への普及が進んでいる。画像符号化の分野で
もH261、MPEG1の標準化の勧告に始まりMPE
G2の標準化も勧告の段階である。高性能コンピュー
タ、大容量ハードディスクの普及、圧縮技術の確立によ
り映像のデジタル化が身近なものとなってきている。ま
た、コンピュータがネットワークに接続され、デジタル
映像の流通が可能となるインフラが整備されつつある。
このような時代背景のもと、映像の蓄積、流通、鑑賞の
スタイルも変革することへの要請が強くなってきた。従
来の映像に対してユーザは与えられるままに見るだけで
あったが、このような時代においてユーザは、自分なり
の見方、例えば、好きな場面だけを見る、要約してみ
る。この場面は子どもに見せたくない等、映像に対して
多彩なアクセス方法への要求が潜在的に存在する。当然
このようなアクセスに関する要求に答えるためには、映
像それ自身のデジタル表現、管理方法等背後に隠れた技
術が新しいユーザインタフェースに加えて必要である。
【0003】この必要性から従来、幾つかの報告がなさ
れてきた。従来の報告は、映像の構造化を目指したもの
であり、構造化された映像をユーザにとって扱い易いよ
うに表現するユーザインタフェースの構築を目指したも
のである。
【0004】映像の構造化を目指した報告として、柴田
〔“映像の内容記述モデルとその映像構造化への応
用”、信学論、Vol.78−D−II、No.5,p
p.754−764(1995)〕は、放送用の映像を
対象にスクリプタが付けたアノテーションを人手で入力
し、映像に特徴量を付加することを提案し、便宜的に特
徴量空間をユークリット空間と考え、その中で距離を定
義して類似度を計算することでショットのクラスタリン
グを行っている。ショットをクラスタリングすることで
階層構造を定義し、映像の構造化を行っている。
【0005】また、上田他〔“IMPACT:An I
nteractive Natural−Motion
−Picture Dedicated Multim
edia Authoring System”、Pr
oceeding of CHI’91、pp.343
−350(1991)〕は、映像を計算機で自動処理し
得られる物理的特徴を抽出し、抽出された特徴を場合に
よっては内容知識と照合すると共に特徴あるいは知識を
映像ヘインデクシング、構造化を行っている。
【0006】映像への新しいユーザインタフェースとし
て、M.Mill他の〔“A Magnifier T
ool for Video Data”、Proce
eding of CHI’92、pp.93−98
(1992)〕は、映像のフレームを時間解像度レベル
に応じて空間に配置し、粗い時間解像度から細かい時間
解像度へと時間への新しいアクセススタイルを可能にし
た報告をしている。
【0007】また、今まで圧縮されていない映像を扱
い、上記報告等の高度な映像ハンドリングを目指した研
究がなされてきたが、近年、画像符号データから複号せ
ずに計算コストの軽減を目的としてカット点、カメラ操
作等の情報を抽出する技術が報告されている〔“カット
点検出装置”、特開平7−284017号〕。
【0008】
【発明が解決しようとする課題】しかしながら、上記従
来の技術における報告等では、解決していない課題が存
在する。
【0009】柴田の報告では、放送局の映像を対象と
し、映像の使われ方等の制限を付け仮定し、人手を介し
て、映像に意味的な特徴量を付加することを行い構造化
している。今後ますます増大するであろう一般家庭等の
映像を与えた場合、柴田の仮定は成り立たず、人手を介
して特徴量を付けることもナンセンスである。まず、課
題として、自動化による一般性のある特徴量の付加と構
造化の実現が課題である。
【0010】上田他の報告では、映像の持つ特徴として
物理的な特徴量を自動抽出し構造化することを提案して
いるが、上田他の報告で目指す構造化は、放送、映画、
フィルムの業界で用いられてきた映像の構造を基とする
ものである。ここで、業界で用いられてきた映像の構造
に関してG.Davenport他〔“Cinemat
c Primitives for multimed
ia”、IEEE Computer Graphic
s & Applications、Vol.11、N
o.4、pp67−75(1991)〕が報告してい
る。映像の最小単位をショットとし、複数のショットか
らなる映像をシーンと考え、複数のシーンからストーリ
ーは構成されるという考えである。深く映像の意味に立
ち入らないでこの概念で構造化を行おうとすると階層が
たかだか数階層であり、多彩なアクセスを可能にする構
造を実現していないことが問題である。
【0011】また、M.Mill他の報告では、映像の
時間解像度に着目し、時間の連続による映像の階層構造
を利用してユーザインタフェースを構築している。深さ
のある連続な階層を実現しているが、物理的な特徴(時
間解像度)のみを用いた構造化であるために映像のコン
テントについて何も考慮されておらず、映像のコンテン
トに対して直感的にアクセスする事は困難である。
【0012】また、近年報告されている符号化データか
らのインデクシングに関する報告は、基本的に上田等の
報告で目指す構造化であり、上記した問題を解決するも
のではない、ただ、計算コスト軽減に関しては、有効な
アプローチである。
【0013】上記で述べたように今後の社会的要請に応
じて映像をデジタル化し、管理、アクセスする場合、映
像の構造化処理の自動化及び高速化、一般性を有しコン
テントを反映した特徴量による深い階層をもつ構造化、
及び多彩なユーザの目的に適うユーザインタフェース技
術の必要性がある。
【0014】従来報告されている映像の管理およびアク
セスに関する報告は、上記の必要性に答えるものではな
い。すなわち上記従来の技術には問題がある。
【0015】本発明の目的は、映像を一般性を有しコン
テントを反映した特徴量による深い階層構造に自動的し
かも高速に構造化する技術と、多彩なユーザの目的に適
う多彩なアクセススタイルを持つユーザインタフェース
構築を可能とする予測符号化画像データ管理方法及び装
置を提供することにある。
【0016】
【課題を解決するための手段】上記の目的を達成するた
め、本発明の予測符号化画像データ管理装置は、予測符
号化画像データを蓄積管理する装置であって、予測符号
化画像データを読み込み、データ列を保存する画像デー
タ列メモリ部と、該画像データ列メモリ部からデータ列
を読み出しデータ構造が持つ階層に応じて階層に分離す
る階層分離部と、該分離された階層から画像データの持
つ物理的な特徴を抽出する特徴抽出部と、該抽出された
物理的特徴から各々の画像を特徴付ける特徴ベクトルを
生成する特徴ベクトル生成部と、該特徴ベクトル間での
距離を算出し、距離が近い特徴ベクトルを統合する分割
・統合部と、該統された特徴ベクトルの代表特徴ベク
トルを求め、該代表特徴ベクトルを階層的に管理する特
徴ベクトル管理部とを備えること、前記階層分離部で
は、予測符号化画像データをシーケンス層、GOP層、
ピクチャ層、スライス層、マクロブロック層、ブロック
層に分離すること、前記特徴抽出部は、ブロック層から
各ブロックの輝度の直流成分を算出する直流成分算出部
と、輝度の交流成分を算出する交流成分算出部と、マク
ロブロック層から各ブロックの色差の直流成分を算出す
る直流成分算出部と、色差の交流成分を算出する交流成
分算出部と、動きベクトルを算出する動きベクトル算出
部と、ブロック毎に該算出された直流成分からヒストグ
ラムを作成するブロックヒストグラム作成部と、ブロッ
ク毎に該算出された交流成分からテクスチャ特徴量を算
出するブロックテクスチャ特徴量算出部とを新たに備え
ること前記分割・統合部は、該特徴ベクトルの類似度
を算出する際の条件を与える類似距離条件部と、該条件
に基づいて該特徴ベクトルの類似度を測定し、類似距離
行列の算出を行う類似距離行列算出部と、距離が最小な
クラスタ対を決定し、最小距離クラスタ対を結合する最
小距離結合部と、予め与えたクラスタの個数と結合され
たクラスタの個数とを比較・判断する結合対判断部とを
新たに備えること、前記特徴ベクトル管理部は、クラス
タリングされた特徴ベクトルを代表する代表特徴ベクト
ルを算出する代表特徴ベクトル算出部と、該代表特徴ベ
クトルに符号を付与する符号化部と、代表特徴ベクトル
と符号との対応を表わす表を作成する符号帳作成部とを
新たに備えることを特徴とする。
【0017】また、上記の目的を達成するため、本発明
の予測符号化画像データ管理方法は、予測符号化画像デ
ータを蓄積管理する方法であって、予測符号化画像デー
タを読み込み、データ列を画像データ列メモリ部に保存
し、該メモリからデータ列を読み出してデータ構造が
持つ階層に応じて各階層に分離し、該分離された階層か
ら画像データの持つ物理的な特徴を抽出し、該抽出され
た物理的特徴から各々の画像を特徴付ける特徴ベクトル
を生成し、該特徴ベクトル間での距離を算出し、距離が
近い特徴ベクトルを統合し、該統合された該特徴ベクト
の代表特徴ベクトルを求め、該代表特徴ベクトルを階
層的に管理すること、前記データ構造を階層に分離する
際に、予測符号化画像データをシーケンス層、GOP
層、ピクチャ層、スライス層、マクロブロック層、ブロ
ック層に分離すること、前記画像データの持つ物理的な
特徴を抽出する際に、ブロック層から各ブロックの輝度
の直流成分を算出し、輝度の交流成分を算出し、マクロ
ブロック層からは各ブロックの色差の直流成分を算出
し、色差の交流成分を算出して動きベクトルを算出し、
ブロック毎に該算出された直流成分からヒストグラムを
作成して、ブロック毎に該算出された交流成分からテク
スチャ特徴量を算出すること前記特徴ベクトルを統
する際に、該特徴ベクトルの類似度を算出する際の条件
を与え、該条件に基づいて該特徴ベクトルの類似度を測
定して類似距離行列の算出を行い、距離が最小なクラス
タ対を決定して最小距離クラスタ対を結合し、予め与え
たクラスタの個数と結合されたクラスタの個数とを比較
・判断すること、前記特徴ベクトルを管理する際に、ク
ラスタリングされた特徴ベクトルを代表する代表特徴ベ
クトルを算出し、該代表特徴ベクトルに符号を付与し、
代表特徴ベクトルと符号との対応を表わす表を作成する
ことを特徴とする。
【0018】本発明では、上記のように、予測符号化画
像データを用いて、そのデータ構造が持つ階層に応じて
階層に分離し、分離された階層から画像データの持つ物
理的な特徴、すなわち一般性を有しコンテントを反映し
た特徴を抽出して、各々の画像を特徴付ける特徴ベクト
ルを生成し、その特徴ベクトル間での距離を算出して特
徴ベクトルを分割・統合することによって、自動的でし
かも高速に映像を深い階層構造で構造化し、これを蓄
積、管理することにより、ユーザのそれぞれの多彩な目
的に応じたアクセススタイルのモードを変化させること
が出来るユーザインタフェース構築を可能とし、従来の
アクセススタイルに捕らわれない新しい映像のとの関わ
り合いや効率の良い映像のハンドリングを実現可能とす
る。
【0019】
【発明の実施の形態】以下、本発明の実施形態例を、図
面を参照して詳細に説明する。
【0020】図1に本発明装置の構成図を示す。以下、
構成図に沿って各構成部及び手法を説明する。図1の1
01の画像データ列メモリ部に予測符号化画像データ列
を蓄積する。蓄積されたデータ列を102の階層分離部
でシーケンス層、GOP層、ピクチャ層、スライス層、
マクロブロック層、ブロック層に分離する。この層は、
MPEG2の圧縮方式で符号化されたデータの持つ構造
である。厳密に言うと、MPEG方式では、画面内符号
化画像、画面間順方向予測符号化画像、画面間双方向予
測符号化画像といわれる方式を組み合わせている。ここ
では、MPEG方式を予測符号化画像データとして考え
る。
【0021】ここで、MPEG方式、特にMPEG2方
式で圧縮されたデータの階層構成を図2を用いて説明す
る。一番上の層がシーケンス層であり、201のシーケ
ンスヘッダーと、202のピクチャー群から構成され
る。次のGOP層は、203のフレーム内符号化画像、
204のフレーム間順方向予測符号化画像、205の双
方向予測符号化画像から構成される。206のピクチャ
ー層は、スライス群であり、スライス層は、207のマ
クロブロックから構成される。また、マクロブロック
は、輝度情報の4つのブロック(208)と2つの色差
情報に関するブロック(209,210)の計6つから
構成される。以上説明した各層へデータ列を102の階
層分離部において分離する。実質的には、上記の構造情
報のみが分離されることになる。
【0022】次に103の画像特徴抽出部において画像
の特徴量の抽出を行う。以下、図3を参照して説明す
る。まずブロック層の各ブロック(8×8ピクセル)か
ら直流成分(DC成分)と交流成分(AC成分)を、直
流成分算出部103aと交流成分算出部103bで算出
する。ここで、各成分を算出する画像は、203のフレ
ーム内符号化画像とする。P,Bは、フレーム間予測さ
れた画像であり、基本的に復号化が伴うため、計算コス
トの軽減から避けることとする。輝度に関しては4つの
ブロック毎(301)に103cのヒストグラム生成部
においてヒストグラム(304)を算出する。また、色
差に関しては、各ブロック毎(302,303)にヒス
トグラム(305,306)を算出する。これは、輝度
ブロック4に対しての色差ブロックはそれぞれ1である
ことによる。
【0023】次に、算出されるAC成分からテクスチャ
特徴生成部103dにおいてテクスチャー特徴を算出す
る。8×8ピクセルのブロックはDCT変換が施されて
いる。このDCT計数は、図4の401に示した様にジ
グザグスチャンされ表現されている。401の1が直流
成分(DC成分)であり、2〜64が交流成分(AC成
分)である。2〜64で表現されたDCT計数は、この
ブロックのテクスチャーを良く表現するものであり、本
説明では、この計数列をテクスチャー特徴と考える。
【0024】次に動きベクトルの算出を図5を参照して
説明する。動きベクトルは、動きベクトル算出部103
eにおいてP,Bピクチャーから算出する。Pは、順方
向予測符号化であり過去のフレーム(501)から未来
のフレーム(502)を予測する動きベクトルが情報と
して含まれている。また、Bは、501と502のフレ
ーム間に挿入されるフレームであり、501のフレーム
からの順方向を予測する動きベクトルと502のフレー
ムからの逆方向を予測する動きベクトルが情報として含
まれている。しかしながら、予測誤差が大きい場合、動
きベクトルを用いないで符号化されているブロックが存
在する。本発明では、動きベクトルが存在するブロック
から動きベクトルを算出し、存在しないブロックに対し
ては、存在するブロックで内挿することを行う。内挿方
法として、線形内挿法、メディア内挿法等を用いる。
【0025】次に、図1の104の特徴ベクトル生成部
において、103の画像特徴抽出部で算出した特徴量か
ら特徴ベクトルの生成を行う。この様子を図6に示す。
【0026】103の画像特徴抽出部で算出された特徴
量(ヒストグラム)から特徴ベクトルを構成する要素を
生成する。307のヒストグラムを例に生成の様子を説
明する。予め与えた個数(図6(a)の場合では4)で
ヒストグラムを分割する(601)。分割された範囲で
値の平均値を計算し、その範囲の値とする。それぞれの
範囲で計算された値を図6(a)の602で示した様に
配置し、ベクトルを作成する。ベクトル602をHIS
yij(k)、k=0〜3で表す。色相のヒストグラ
ムと同様の方法で、彩度、明度に関してそれぞれベクト
ルを算出する。彩度のベクトルをHISTCr
ij(k)、k=0〜3、明度のベクトルをHISTCb
ij(k)、k=0〜3で表す。
【0027】また、図4に示した、テクスチャーに関す
る特徴量についてもベクトル化を行う。401の空間周
波数分布を図6(b)の603に示す様に分割化を行
う。603の場合、4分割である。分割された領域毎に
平均値、又は最大値、分散等の値を算出し、その領域の
値とする。それぞれの値を、図1の物理的特徴統合配置
部104aにおいて、図6(b)の604の様に配置し
ベクトルとする。テクスチャーに関するベクトルは、6
03で示したように8×8ピクセルの4つのブロック毎
に算出する。色差ブロックについては4つのブロックの
各領域の値を並べて配置するが、輝度ブロックでは、1
つの色差ブロックに対応する4つの輝度ブロックの各計
数の平均値を1つのブロックの値としてベクトルを算出
する。算出するベクトルをFREQyij(l)、FR
EQCrij(l)、FREQCbij(l)とそれぞれ表
す。また、動き情報は、各ブロック毎に動き変化量
(u,v)ijが算出されている。これらのベクトルか
ら特徴ベクトル{HISTyij(k)、HISTCr
ij(k)、HISTCbij(k)、FREQy
ij(l)、FREQCrij(l)、FREQCb
ij(l)、u,v}を算出する。
【0028】次に、図1の105の分割・統合部におい
て、特徴ベクトルのクラスタリングを行う。この処理の
流れを図7に示す。図中、701〜707はステップを
表す。特徴ベクトルクラスタリングの様子を流れに沿っ
て説明する。701においてまず、類似距離条件分離部
105aから類似距離の条件を入力する。ここで与える
条件は、画像の類似度算出する際に、類似度に大きく寄
与する特徴を決定する。画像の特徴として、色、テクス
チャ、構図、動き等があるがこれらの類似度算出におけ
る寄与度を701で入力する。例えば、色:テクスチ
ャ:構図:動き:時間=10:5:3:1:6の様に入
力する。構図に関しては、特徴ベクトルの値によらずそ
の構成が等しいときに構造は等しいとする。例えば、特
徴ベクトル{3,3,4,4}と特徴ベクトル{10,
10,1,1}は構図は等しいが、色等は異なるとす
る。時間は、対象としている画像はビデオのフレームで
あり、時間的にシーケンシャルなものである。時間的に
連続する画像は、それ自身類似している。この拘束条件
をコントロールすることを目的として類似度の時間寄与
度を導入する。時間の寄与度が小さい場合、隣接する画
像フレームの拘束は無く、一枚一枚の静止画像の集まり
として考える。次に、702において最終的なクラスタ
の数を入力していく。以下、703において、類似距離
行列算出部105bで類似距離を算出し、704におい
て、最小距離結合部105cで最小距離のクラスタ対を
発見し、705において、同じく最小距離結合部105
cでそれらを融合し、706において、再び類似距離行
列算出部105bで融合後の新しい類似距離を算出す
る。算出後、クラスタ数が、702で与えた最終クラス
タ数と一致するかどうかを結合対判断部105dで判断
し、一致すればクラスタリング処理を完了し、そうでな
ければ、704へ戻り処理を繰り返す。
【0029】以上の一連のクラスタリングの各階段での
類似距離の計算では、最初に全ての特徴ベクトル間の類
似距離を算出しておけば、後のクラスタと特徴ベクトル
間、及びクラスタ間の類似距離は漸化式によって計算で
きる。これをここで説明する。クラスタi(特徴ベクト
ル数ni)とクラスタj(特徴ベクトル数nj)を融合し
て新クラスタk(特徴ベクトル数nk)を作ったとす
る。
【0030】nk=ni+nj、 このときクラスタkに含まれない特徴ベクトルあるいは
クラスタをhとして、融合前の各クラスタ間の距離をそ
れぞれdhi,dhj,dijとすれば、kとhの距離dhk
次式で与えられる。
【0031】 dhk=αihi+αjhj+βdji+γ|dhi−dhj|、 あるいは、 d2 hk=αi2 hi+αj2 hj+βd2 ji+γ|d2 hi−d2
hj|、 ここでαi,αj,β,γは類似距離の定義によって決ま
る定数であり、前記した寄与度から算出するものであ
る。従来報告されている距離も本発明で用いることは可
能である。ここで幾つか従来報告されている距離を説明
する。
【0032】1)最短距離法 クラスタkとhに含まれる最短距離にある特徴ベクトル
間の距離dhkと定義する方法がある。
【0033】αi=αj=1/2,β=0,γ=−1/
2,dhk=max[dhi,dhj] 2)最長距離法 クラスタkとhに含まれる最長距離にある特徴ベクトル
間の距離dhkと定義する方法である。
【0034】αi=αj=1/2,β=0,γ=1/2,
hk=max[dhi,dhj] 3)メディアン法 dhkをdhiとdhjの中間値に設定する方法である。
【0035】αi=αj=1/2,β=−1/4,γ=
0,dhk=max[dhi,dhj] 4)重心法 クラスタ間の距離をクラスタの重心間距離で定義するも
のである。
【0036】αi=ni/nk,αj=nj/nk,β=−n
ij/n2 k,γ=0,dhk=max[dhi,dhj] 5)群平均法 クラスタ間の距離をその2つのクラスタに含まれる全て
の特徴ベクトル間の距離の2乗平均で定義するものであ
る。
【0037】αi=ni/nk,αj=nj/nk,β=0,
γ=0,dhk=max[dhi,dhj] 上記説明した距離も類似距離として用い、特徴ベクトル
のクラスタリングを上記説明した一連の流れによって行
う。
【0038】次に、図1の106の特徴ベクトル管理部
において、クラスタリングされた特徴ベクトルの代表特
徴ベクトルを代表特徴ベクトル算出部106aで算出
し、算出された各々の代表特徴ベクトルを構造的に管理
する。クラスタリングされた各クラスタの重心、平均、
最長、最短等を算出し、代表特徴ベクトルとする。代表
特徴ベクトルを管理する構造の作成を図8を用いて説明
する。クラスタリング前を801とする。801を2つ
にクラスタリング(802と803)し代表特徴ベクト
ルをH0,H1とする。同様にクラスタリングされたクラ
スタに対して2つに分割し、それぞれ代表特徴ベクトル
を算出する。分割されたクラスタは、図8に示すように
階層構造を有し、それぞれの階層に置いて代表特徴ベク
トルが算出されている。106bの符号部においてH0
等の符号が代表特徴ベクトルに対して付けされ、符号と
代表特徴ベクトルの対応表を符号帳作成部106cにお
いて作成する。上記の説明は、クラスタを分割する方向
で階層を作成するアプローチであるが、逆にクラスタを
統合する方向で階層を作成するアプローチも可能であ
る。
【0039】次に、本発明の予測符号化画像データ管理
方法の実施形態例を示す。図9は、それを示すフローチ
ャートである。図中、901〜913はステップを表
す。まず、901において、予測符号化画像データを読
み込み、画像データ列メモリ部に保存してあるデータ列
を読み出して入力する。次に、902において、データ
構造が持つ階層に応じてデータの階層分離を行う。次
に、903において、ブロック層から各ブロックの輝度
の直流成分を算出して、904において、ブロック毎に
該算出された直流成分からヒストグラムを作成する。ま
た、905において、輝度の交流成分を算出し、マクロ
ブロック層からは各ブロックの色差の直流成分を算出
し、色差の交流成分を算出して動きベクトルを算出す
る。さらに、906において、ブロック毎に交流成分を
算出して、907において、テクスチャ特徴量を算出す
る。以上で物理的な特徴を抽出する。次に、908にお
いて、抽出された該物理的特徴から各々の画像を特徴付
ける特徴ベクトルを生成する。次に、909において、
特徴ベクトル間での距離を算出して特徴ベクトルを分割
・統合する。次に、910において、前記の分割・統合
された特徴ベクトルを管理する。次に、911におい
て、前記で管理された特徴ベクトルに基づいて画像を表
示する。次に、912において、終了判断を行い、継続
であれば913においてユーザのイベント入力を受け付
けて前記で管理された特徴ベクトルに基づいて、ユーザ
の多様なアクセススタイルでの画像の表示を行う。
【0040】以上、本発明の実施形態例に基づき具体的
に説明したが、本発明は、前記実施形態例に限定される
ものではなく、その要旨を逸脱しない範囲において種々
の変更が可能であることは言うまでもない。
【0041】
【発明の効果】以上の説明のとおり、本発明によれば、
自動的でしかも高速に映像を構造化し、蓄積することが
でき、ユーザのそれぞれの多彩な目的に応じたアクセス
スタイルのモードを変化させることが出来るユーザイン
タフェース構築が可能となり、従来のアクセススタイル
に捕らわれない新しい映像のとの関わり合いや効率の良
い映像のハンドリングが実現可能となる。
【図面の簡単な説明】
【図1】本発明の予測符号化画像データ管理システムの
一実施形態例を示す構成図
【図2】上記実施形態例におけるMPEG符号化画像デ
ータの階層構成図
【図3】上記実施形態例におけるDC成分からのヒスト
グラム算出を説明する図
【図4】上記実施形態例におけるAC成分からのテクス
チャー特徴算出を説明する図
【図5】上記実施形態例における順、双方向予測を説明
する図
【図6】(a),(b)は、上記実施形態例における特
徴のベクトル化を説明する図
【図7】上記実施形態例における分割・統合部における
処理の流れを示すフローチャート
【図8】上記実施形態例における代表特徴ベクトルの階
層構造化の様子を示す図
【図9】本発明の予測符号化画像データ管理方法の一実
施形態例を示すフローチャート
【符号の説明】
101…画像データ列メモリ部 102…階層分離部 103…画像特徴抽出部 104…特徴ベクトル生成部 105…分割・統合部 106…特徴ベクトル管理部
フロントページの続き (51)Int.Cl.7 識別記号 FI // G06F 15/18 560 H04N 7/137 Z (72)発明者 新倉 康巨 東京都新宿区西新宿3丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 平7−271987(JP,A) 特開 平6−319108(JP,A) 特開 平6−153155(JP,A) 特開 平4−307668(JP,A) 特開 平7−38842(JP,A) 特開 平6−195396(JP,A) 特開 平5−108730(JP,A) 特開 平3−252780(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04N 11/00 - 11/22 H04N 7/00 - 7/68 G06F 17/30

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】 予測符号化画像データを蓄積管理する装
    置であって、 予測符号化画像データを読み込み、データ列を保存する
    画像データ列メモリ部と、 該画像データ列メモリ部からデータ列を読み出しデータ
    構造が持つ階層に応じて階層に分離する階層分離部と、 該分離された階層から画像データの持つ物理的な特徴を
    抽出する特徴抽出部と、 該抽出された物理的特徴から各々の画像を特徴付ける特
    徴ベクトルを生成する特徴ベクトル生成部と、 該特徴ベクトル間での距離を算出し、距離が近い特徴ベ
    クトルを統合する分割・統合部と、該統された特徴ベクトルの代表特徴ベクトルを求め、
    該代表特徴ベクトルを階層的に管理する特徴ベクトル管
    理部とを備えることを特徴とする予測符号化画像データ
    管理装置。
  2. 【請求項2】 前記階層分離部では、 予測符号化画像データをシーケンス層、GOP層、ピク
    チャ層、スライス層、マクロブロック層、ブロック層に
    分離することを特徴とする請求項1に記載の予測符号化
    画像データ管理装置。
  3. 【請求項3】 前記特徴抽出部は、 ブロック層から各ブロックの輝度の直流成分を算出する
    直流成分算出部と、 輝度の交流成分を算出する交流成分算出部と、 マクロブロック層から各ブロックの色差の直流成分を算
    出する直流成分算出部と、 色差の交流成分を算出する交流成分算出部と、 動きベクトルを算出する動きベクトル算出部と、 ブロック毎に該算出された直流成分からヒストグラムを
    作成するブロックヒストグラム作成部と、 ブロック毎に該算出された交流成分からテクスチャ特徴
    量を算出するブロックテクスチャ特徴量算出部とを新た
    に備えることを特徴とする請求項1または請求項2に記
    載の予測符号化画像データ管理装置。
  4. 【請求項4】 前記分割・統合部は、 該特徴ベクトルの類似度を算出する際の条件を与える類
    似距離条件部と、 該条件に基づいて該特徴ベクトルの類似度を測定し、類
    似距離行列の算出を行う類似距離行列算出部と、 距離が最小なクラスタ対を決定し、最小距離クラスタ対
    を結合する最小距離結合部と、 予め与えたクラスタの個数と結合されたクラスタの個数
    とを比較・判断する結合対判断部とを新たに備えること
    を特徴とする請求項1、請求項2、請求項3のいずれか
    に記載の予測符号化画像データ管理装置。
  5. 【請求項5】 前記特徴ベクトル管理部は、 クラスタリングされた特徴ベクトルを代表する代表特徴
    ベクトルを算出する代表特徴ベクトル算出部と、 該代表特徴ベクトルに符号を付与する符号化部と、 代表特徴ベクトルと符号との対応を表わす表を作成する
    符号帳作成部とを新たに備えることを特徴とする請求項
    1、請求項2、請求項3、請求項4のいずれかに記載の
    予測符号化画像データ管理装置。
  6. 【請求項6】 予測符号化画像データを蓄積管理する方
    法であって、 予測符号化画像データを読み込み、データ列を画像デー
    タ列メモリ部に保存し、 該メモリからデータ列を読み出してデータ構造が持つ
    階層に応じて各階層に分離し、 該分離された階層から画像データの持つ物理的な特徴を
    抽出し、 該抽出された物理的特徴から各々の画像を特徴付ける特
    徴ベクトルを生成し、 該特徴ベクトル間での距離を算出し、距離が近い特徴ベ
    クトルを統合し、該統 合された該特徴ベクトルの代表特徴ベクトルを求
    め、該代表特徴ベクトル を階層的に管理することを特徴
    とする予測符号化画像データ管理方法。
  7. 【請求項7】 前記データ構造を階層に分離する際に、 予測符号化画像データをシーケンス層、GOP層、ピク
    チャ層、スライス層、マクロブロック層、ブロック層に
    分離することを特徴とする請求項に記載の予測符号化
    画像データ管理方法。
  8. 【請求項8】 前記画像データの持つ物理的な特徴を抽
    出する際に、 ブロック層から各ブロックの輝度の直流成分を算出し、
    輝度の交流成分を算出し、 マクロブロック層からは各ブロックの色差の直流成分を
    算出し、 色差の交流成分を算出して動きベクトルを算出し、 ブロック毎に該算出された直流成分からヒストグラムを
    作成して、ブロック毎に該算出された交流成分からテク
    スチャ特徴量を算出することを特徴とする請求項6また
    は請求項7に記載の予測符号化画像データ管理方法。
  9. 【請求項9】 前記特徴ベクトルを統合する際に、 該特徴ベクトルの類似度を算出する際の条件を与え、 該条件に基づいて該特徴ベクトルの類似度を測定して類
    似距離行列の算出を行い、 距離が最小なクラスタ対を決定して最小距離クラスタ対
    を結合し、 予め与えたクラスタの個数と結合されたクラスタの個数
    とを比較・判断することを特徴とする請求項6、請求項
    7、請求項8のいずれかに記載の予測符号化画像データ
    管理方法。
  10. 【請求項10】 前記特徴ベクトルを管理する際に、 クラスタリングされた特徴ベクトルを代表する代表特徴
    ベクトルを算出し、 該代表特徴ベクトルに符号を付与し、 代表特徴ベクトルと符号との対応を表わす表を作成する
    ことを特徴とする請求項6、請求項7、請求項8、請求
    9のいずれかに記載の予測符号化画像データ管理方
    法。
JP10650796A 1996-04-26 1996-04-26 予測符号化画像データ管理方法及び装置 Expired - Fee Related JP3423834B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10650796A JP3423834B2 (ja) 1996-04-26 1996-04-26 予測符号化画像データ管理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10650796A JP3423834B2 (ja) 1996-04-26 1996-04-26 予測符号化画像データ管理方法及び装置

Publications (2)

Publication Number Publication Date
JPH09294277A JPH09294277A (ja) 1997-11-11
JP3423834B2 true JP3423834B2 (ja) 2003-07-07

Family

ID=14435350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10650796A Expired - Fee Related JP3423834B2 (ja) 1996-04-26 1996-04-26 予測符号化画像データ管理方法及び装置

Country Status (1)

Country Link
JP (1) JP3423834B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09293139A (ja) * 1996-04-26 1997-11-11 Nippon Telegr & Teleph Corp <Ntt> ビデオ管理方法及び装置
US6072542A (en) * 1997-11-25 2000-06-06 Fuji Xerox Co., Ltd. Automatic video segmentation using hidden markov model
US6625389B1 (en) * 1999-09-30 2003-09-23 Koninklijke Philips Electronics N.V. Video tape hierarchical indexing system
JP2001333389A (ja) * 2000-05-17 2001-11-30 Mitsubishi Electric Research Laboratories Inc ビデオ再生システムおよびビデオ信号処理方法
WO2006028156A1 (ja) 2004-09-10 2006-03-16 Pioneer Corporation 画像処理装置、画像処理方法、および画像処理プログラム
US8139877B2 (en) 2006-03-09 2012-03-20 Pioneer Corporation Image processing apparatus, image processing method, and computer-readable recording medium including shot generation
JP5590915B2 (ja) * 2010-02-25 2014-09-17 三菱電機株式会社 戸開閉検出装置及び戸開閉検出方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2961174B2 (ja) * 1990-03-02 1999-10-12 日本電信電話株式会社 特徴量抽出方法
JP2754937B2 (ja) * 1991-04-05 1998-05-20 日本電気株式会社 概略画像作成方法および装置
JPH06101018B2 (ja) * 1991-08-29 1994-12-12 インターナショナル・ビジネス・マシーンズ・コーポレイション 動画像データベースの検索
JP2581380B2 (ja) * 1992-09-25 1997-02-12 日本電気株式会社 画像の構造情報に基づく画像クラスタリング方法及び装置
JP3157928B2 (ja) * 1992-11-09 2001-04-23 松下電器産業株式会社 動画像の拾い見装置
JPH06319108A (ja) * 1993-05-06 1994-11-15 Matsushita Electric Ind Co Ltd シーン変化検出装置
JPH0738842A (ja) * 1993-06-29 1995-02-07 Toshiba Corp 動画編集装置
JP3163216B2 (ja) * 1994-03-31 2001-05-08 シャープ株式会社 代表特徴量抽出方法及び代表特徴量抽出装置

Also Published As

Publication number Publication date
JPH09294277A (ja) 1997-11-11

Similar Documents

Publication Publication Date Title
US7013051B2 (en) Method of image feature coding and method of image search
US6738424B1 (en) Scene model generation from video for use in video processing
EP1624675B1 (en) A system and process for compressing and decompressing multiple, layered, video streams employing spatial and temporal encoding
JP4666784B2 (ja) ビデオシーケンスのキーフレーム抽出方法及びビデオシーケンスのキーフレーム抽出装置
US7469010B2 (en) Extracting key frames from a video sequence
CN109257604A (zh) 一种基于tmc3点云编码器的颜色属性编码方法
CN101454990A (zh) 视频压缩方法
CN101990761A (zh) 运动图像编码设备和运动图像编码方法
US20040218675A1 (en) Method and apparatus for determining reference picture and block mode for fast motion estimation
JPH10257436A (ja) 動画像の自動階層構造化方法及びこれを用いたブラウジング方法
US6973257B1 (en) Method for indexing and searching moving picture using motion activity description method
JPWO2006035883A1 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP3423834B2 (ja) 予測符号化画像データ管理方法及び装置
Irani et al. Mosaic-based video compression
Porikli et al. Compressed domain video object segmentation
Song et al. Spatially reduced image extraction from MPEG-2 video: fast algorithms and applications
CN100499811C (zh) 压缩包括交替镜头的视频序列的数字数据的方法
JP4534106B2 (ja) 動画像符号化システム及び方法
CN105847822A (zh) 一种视频解码方法及装置
Bashir et al. Multimedia systems: content-based indexing and retrieval
Yi et al. A motion based scene tree for browsing and retrieval of compressed videos
WO2001049028A1 (en) Scene model generation from video for use in video processing
JP4349542B2 (ja) 動画像内のテロップ領域検出装置
Gu Scene analysis of video sequences in the MPEG domain
Tong et al. Region-of-interest based rate control for low-bit-rate video conferencing

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100425

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100425

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130425

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees