JP2007306559A - 画像特徴符号化方法及び画像検索方法 - Google Patents
画像特徴符号化方法及び画像検索方法 Download PDFInfo
- Publication number
- JP2007306559A JP2007306559A JP2007121649A JP2007121649A JP2007306559A JP 2007306559 A JP2007306559 A JP 2007306559A JP 2007121649 A JP2007121649 A JP 2007121649A JP 2007121649 A JP2007121649 A JP 2007121649A JP 2007306559 A JP2007306559 A JP 2007306559A
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature
- segment
- key frame
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【解決手段】キーフレーム内の矩形セグメントと上記キーフレーム以外の画像フレームであって、キーフレームと時系列で離間した画像フレーム内におけるキーフレーム内の矩形セグメントに対応する矩形セグメントとの間の動きを示す動き特徴量を、矩形セグメントの特徴が記述される階層に符号化する符号化工程を備える。
【選択図】図5
Description
静止画像201が前処理部91に入力されると、領域分割部93は静止画像201を各セグメントに領域分割する。概念キーワード抽出部94は、色情報に対してあらかじめ割り当てられている概念キーワードを用いて、分割された各セグメントの色及び特徴量から、概念キーワード203を抽出する。また、シーン記述キーワード記述部95は、分割された各セグメントの画像特徴量について、ユーザ96からの述語記述202により、シーン記述キーワード204を記述する。
この実施の形態1では、ビデオシーケンス中に含まれる被写体に着目し、各フレームに含まれる被写体領域を囲む矩形領域をセグメントと定義し、ビデオ信号の各フレーム中からセグメントを抽出して、その特徴量を求めて特徴ストリームを生成する処理を行う装置について説明する。
図2に示されるシステムは、ビデオコンテンツ記憶部3に保持される各々のビデオコンテンツ111に対応づけられた特徴ストリーム103に基づいて、ユーザが所望のビデオコンテンツ111を検索・ブラウズ(拾い読み)するシステムである。ここでは便宜上、サーバ・クライアントモデルを用い、検索システムをクライアント1、コンテンツ記憶・送出システムをサーバ2とみなして説明する。
図3はビデオコンテンツ111と特徴ストリーム103の対応を説明する図である。図において、VCはビデオコンテンツ(Video Content)111を示し、FSは特徴ストリーム(Feature Stream)103を示している。VC及びFSそれぞれに、対応する番号を付しており、FSnは、ビデオコンテンツVCnの特徴量を記述した特徴ストリームである。VCnとFSnは、各ポインタ110により対応づけられている。
特徴ストリーム103の生成処理は、ビデオコンテンツ(VCn)111に対応する特徴ストリーム(FSn)103を生成し、特徴ストリーム記憶部7に格納する処理に相当する。この処理を行うのは、復号処理部4,特徴符号化部5,ユーザI/F6である。復号処理部4は、ビデオコンテンツ(VCn)111がデジタル圧縮されたビットストリーム101の形式で記憶されている場合にのみ必要で、ビデオ信号102を出力する。ビデオコンテンツ(VCn)111が直接表示可能な画像データである場合には、復号処理部4は不要である。
検索処理はクライアント1によって行われる。クライアント1は、ユーザが、ビデオコンテンツ記憶部3に記憶されているビデオコンテンツ111の中から、所望のコンテンツ111を検索するための処理部である。ユーザは、ユーザ指示・設定105により、クライアント1のユーザI/F8を介して、特徴ストリーム103として符号化されている特徴量に対応する値を求めるために、検索制御信号106を検索処理部9に与える。
同システムにおいては、特徴符号化部5がビデオ信号102から特徴ストリーム103を生成する際に、ユーザ指示・設定104により、ユーザI/F6を介して、ビデオコンテンツ(VCn)111に含まれるセグメントを定義するための各種の条件設定や、セグメントの追加・削除、あるいはセグメントを定義するフレーム位置設定など、ユーザが任意に特徴ストリーム103の生成処理を制御できる。
特徴ストリーム(FSn)103は、対応するビデオコンテンツ(VCn)111へのポインタ112を持つ限り、ビデオコンテンツ111と共に、サーバ2に格納しておく必要はなく、どこに存在していてもよい。例えば、特徴ストリーム103だけが含まれるCD−ROMがあり、クライアント1において、当該CD−ROMを読むことにより、特徴ストリーム103に対応するビデオコンテンツ111の場所を特定することもできる。この場合、例えば特徴ストリーム103がビデオコンテンツのURL(Uniform Resource Locator)などを保持していればよい。
特徴ストリーム103の生成処理は、上述したように、主に特徴符号化部5において行われる。図4は実施の形態1による特徴符号化部5の内部構成を示すブロック図である。図において、21は、ビデオ信号102を入力して、キーフレーム設定指示121に基づきキーフレームを決定し、キーフレーム番号122とキーフレーム画像123を出力するキーフレーム決定部、22は、キーフレーム決定部21からのビデオ信号102をモニタするモニタ部である。
図5は実施の形態1による特徴符号化部5の動作を示すフローチャートである。
(A)キーフレームの決定
まず、キーフレーム決定部21において、ビデオコンテンツ111中のキーとなるフレーム画像であるキーフレームを決定する(ステップST1)。キーフレームは、ビデオコンテンツ111中の意味内容の変化点(シーンチェンジ)となるフレームや、ユーザが特に検索時の特徴点としたいフレームと定義する。
キーフレーム画像123が選択されると、図4におけるセグメント抽出部23が、キーフレーム画像123の中に含まれるセグメントを抽出する。ここで、セグメントとは「キーフレーム上の指定領域、又は、ビデオコンテンツ111中に現れる被写体などの物体(=オブジェクト)に対応したキーフレーム中の領域」と定義する。
図4において、セグメント抽出部23で得られた特徴量(代表色125,セグメント番号126,サイズ127など)は、セグメント符号化部24に入力され、多重化部27により特徴ストリーム103の形式に符号化される(ステップST6)。
図4において、縮小画像生成部25,縮小画像符号化部26は、キーフレームの概要画像(以下、サムネイル又はサムネイル画像と呼ぶ)を、キーフレームの特徴量として特徴ストリーム103に添付する目的で備えられる。キーフレームにアイコン的なサムネイル画像が用意されていれば、ユーザはデジタル圧縮されたコンテンツを直接復号して再生する必要がなくなるので、ブラウズの効率を向上できる。
図14はこの発明の実施の形態2によるセグメント抽出部23の内部構成を示すブロック図である。図において、61は、キーフレーム画像123よりセグメントデータ161を抽出するセグメント抽出処理部、62は、参照画像メモリ63に記憶されている過去のキーフレーム画像123とマッチング処理を行いセグメントを同定するセグメント同定処理部である。
図16は実施の形態3によるセグメント抽出部23の内部構成を示すブロック図である。図において、71は、キーフレーム画像123を入力し、参照画像メモリ63を参照して、セグメント番号126,セグメント内画像サンプル値151,セグメントの水平・垂直サイズ152を出力すると共に、動き情報171を出力するセグメント追跡処理部である。代表色割当部52,サイズ算出部53は図14と同一である。
この実施の形態では、図2のクライアント1によるビデオコンテンツ111の検索処理について説明する。ユーザは、クライアント1のユーザI/F8を用いて、ユーザ指示・設定105により、検索したいビデオコンテンツ111の大まかなパラメータの入力操作を行う。入力方法としては、クライアント1が、あらかじめ用意する複数のパラメータ(キーワード)の中から選択を行ったり、ユーザI/F8を用いて概要の入力を行ったりすることで実現できる。
図2において、クライアント1が、上記の特徴同定部11において評価されたマッチングの度合いの情報を検索処理部9に入力して(図示せず)、表示する候補画像に対して、画像の順番や表示の大きさに重み付けを行うことにより、操作性を向上させることが可能である。図19は優先度付き検索候補提示の例を示す図であり、特徴同定部11におけるマッチングの度合いに対応して、検索された候補コンテンツを、優先度をつけてユーザに提示している様子を示している。
この実施の形態では、ユーザI/F8を介した他の検索条件入力方法について説明する。ユーザI/F8を用いて、概要の入力を行う方法としては、マウス等のポインターデバイスを用いて、直接形状を書き込んだり、色を塗ったりして、おおまかなスケッチを描くような方法が考えられる。
実施の形態3で述べたセグメントの動き情報171が抽出されている場合には、検索キー108として、動き情報171を用いることが可能である。ユーザI/F8は、選択できるパラメータとして、「左から右へ」、「上から下へ」、「ズームイン」といった動き情報171を用意しておく。また、映像信号の時間的変化が抽出されている場合には、色の変化や明るさの変化のパラメータを用意しておき、ユーザが選択できるようにする。
Claims (6)
- 画像フレーム群によって構成されるビデオシーケンスの特徴が記述される階層、上記ビデオシーケンス内で特定された画像フレームであるキーフレームの特徴が記述される階層及び上記キーフレーム内の所定の画像領域である矩形セグメントの特徴が記述される階層からなる階層構造を有する特徴ストリームを生成する画像特徴符号化方法において、
上記キーフレーム内の矩形セグメントと上記キーフレーム以外の画像フレームであって、上記キーフレームと時系列で離間した画像フレーム内における上記キーフレーム内の矩形セグメントに対応する矩形セグメントとの間の動きを示す動き特徴量を、上記矩形セグメントの特徴が記述される階層に符号化する符号化工程を備えたことを特徴とする画像特徴符号化方法。 - 画像フレーム群によって構成されるビデオシーケンスの特徴が記述される階層、上記ビデオシーケンス内で特定された画像フレームであるキーフレームの特徴が記述される階層及び上記キーフレーム内の所定の画像領域である矩形セグメントの特徴が記述される階層からなる階層構造を有し、上記キーフレーム内の矩形セグメントと上記キーフレーム以外の画像フレームであって、上記キーフレームと時系列で離間した画像フレーム内における上記キーフレーム内の矩形セグメントに対応する矩形セグメントとの間の動きを示す動き特徴量を上記矩形セグメントの特徴が記述される階層に符号化することによって生成される特徴ストリームを復号し復号特徴量を得る復号工程と、
上記復号工程によって得られた復号特徴量と入力された検索条件とに基づいて上記画像フレーム群から所望の画像フレームを検索する検索工程とを備えたことを特徴とする画像検索方法。 - 画像フレーム群によって構成されるビデオシーケンスの特徴が記述される階層、上記ビデオシーケンス内で特定された画像フレームであるキーフレームの特徴が記述される階層及び上記キーフレーム内の所定の画像領域である矩形セグメントの特徴が記述される階層からなる階層構造を有する特徴ストリームを生成する画像特徴符号化方法において、
上記キーフレーム内の矩形セグメントと上記キーフレーム以外の画像フレーム内における上記キーフレーム内の矩形セグメントに対応する矩形セグメントとの間の動きを示す動き特徴量を、上記キーフレームを検索するための特徴量として上記矩形セグメントの特徴が記述される階層に符号化する符号化工程を備えたことを特徴とする画像特徴符号化方法。 - 画像フレーム群によって構成されるビデオシーケンスの特徴が記述される階層、上記ビデオシーケンス内で特定された画像フレームであるキーフレームの特徴が記述される階層及び上記キーフレーム内の所定の画像領域である矩形セグメントの特徴が記述される階層からなる階層構造を有し、上記キーフレーム内の矩形セグメントと上記キーフレーム以外の画像フレーム内における上記キーフレーム内の矩形セグメントに対応する矩形セグメントとの間の動きを示す動き特徴量を、上記キーフレームを検索するための特徴量として上記矩形セグメントの特徴が記述される階層に符号化することによって生成される特徴ストリームを復号し復号特徴量を得る復号工程と、
上記復号工程によって得られた復号特徴量と入力された検索条件とに基づいて上記画像フレーム群から所望の画像フレームを検索する検索工程とを備えたことを特徴とする画像検索方法。 - 画像フレーム群によって構成されるビデオシーケンスの特徴が記述される階層、上記ビデオシーケンス内で特定された画像フレームであるキーフレームの特徴が記述される階層及び上記キーフレーム内の所定の画像領域である矩形セグメントの特徴が記述される階層からなる階層構造を有する特徴ストリームを生成する画像特徴符号化方法において、
上記キーフレーム内の矩形セグメントと上記キーフレーム以外の画像フレーム内における上記キーフレーム内の矩形セグメントに対応する矩形セグメントとの間の動きを示す動き特徴量と、上記キーフレーム内の矩形セグメント内の色の統計量に関する特徴量とを上記矩形セグメントの特徴が記述される階層に符号化する符号化工程を備えたことを特徴とする画像特徴符号化方法。 - 画像フレーム群によって構成されるビデオシーケンスの特徴が記述される階層、上記ビデオシーケンス内で特定された画像フレームであるキーフレームの特徴が記述される階層及び上記キーフレーム内の所定の画像領域である矩形セグメントの特徴が記述される階層からなる階層構造を有し、上記キーフレーム内の矩形セグメントと上記キーフレーム以外の画像フレーム内における上記キーフレーム内の矩形セグメントに対応する矩形セグメントとの間の動きを示す動き特徴量と、上記キーフレーム内の矩形セグメント内の色の統計量に関する特徴量とを上記矩形セグメントの特徴が記述される階層に符号化することによって生成される特徴ストリームを復号し復号特徴量を得る復号工程と、
上記復号工程によって得られた復号特徴量と入力された検索条件とに基づいて上記画像フレーム群から所望の画像フレームを検索する検索工程とを備えたことを特徴とする画像検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007121649A JP2007306559A (ja) | 2007-05-02 | 2007-05-02 | 画像特徴符号化方法及び画像検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007121649A JP2007306559A (ja) | 2007-05-02 | 2007-05-02 | 画像特徴符号化方法及び画像検索方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000596738A Division JP4536261B2 (ja) | 1999-01-29 | 1999-01-29 | 画像特徴符号化方法及び画像検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007306559A true JP2007306559A (ja) | 2007-11-22 |
Family
ID=38840071
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007121649A Pending JP2007306559A (ja) | 2007-05-02 | 2007-05-02 | 画像特徴符号化方法及び画像検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007306559A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010263327A (ja) * | 2009-04-30 | 2010-11-18 | Kddi Corp | 特徴量算出装置およびプログラム |
JP2013506342A (ja) * | 2009-09-29 | 2013-02-21 | インテル・コーポレーション | 異種のコンテンツソースの関連付け |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10234035A (ja) * | 1997-02-20 | 1998-09-02 | Tsushin Hoso Kiko | 画像符号化復号化方法および装置 |
JPH10320400A (ja) * | 1997-05-16 | 1998-12-04 | Hitachi Ltd | 映像の検索方法および装置 |
JP2000112975A (ja) * | 1998-10-05 | 2000-04-21 | Matsushita Electric Ind Co Ltd | マルチメディア・コンテンツ検索方法 |
JP2000222584A (ja) * | 1999-01-29 | 2000-08-11 | Toshiba Corp | 映像情報記述方法、映像検索方法及び映像検索装置 |
-
2007
- 2007-05-02 JP JP2007121649A patent/JP2007306559A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10234035A (ja) * | 1997-02-20 | 1998-09-02 | Tsushin Hoso Kiko | 画像符号化復号化方法および装置 |
JPH10320400A (ja) * | 1997-05-16 | 1998-12-04 | Hitachi Ltd | 映像の検索方法および装置 |
JP2000112975A (ja) * | 1998-10-05 | 2000-04-21 | Matsushita Electric Ind Co Ltd | マルチメディア・コンテンツ検索方法 |
JP2000222584A (ja) * | 1999-01-29 | 2000-08-11 | Toshiba Corp | 映像情報記述方法、映像検索方法及び映像検索装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010263327A (ja) * | 2009-04-30 | 2010-11-18 | Kddi Corp | 特徴量算出装置およびプログラム |
JP2013506342A (ja) * | 2009-09-29 | 2013-02-21 | インテル・コーポレーション | 異種のコンテンツソースの関連付け |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4536261B2 (ja) | 画像特徴符号化方法及び画像検索方法 | |
KR100492437B1 (ko) | 화상 검색 시스템 및 화상 검색 방법 | |
US8515933B2 (en) | Video search method, video search system, and method thereof for establishing video database | |
CN100501742C (zh) | 表示图像组的方法和装置 | |
US20090077034A1 (en) | Personal ordered multimedia data service method and apparatuses thereof | |
KR20150056381A (ko) | 영상 처리 장치 및 방법 | |
US5838830A (en) | Vertex-based hierarchical shape representation and coding method and apparatus | |
TWI443535B (zh) | 視訊搜尋方法、系統及建立視訊資料庫的方法 | |
US20090079840A1 (en) | Method for intelligently creating, consuming, and sharing video content on mobile devices | |
KR100547370B1 (ko) | 객체 형상 정보를 이용한 요약영상 추출 장치 및 그방법과 그를 이용한 동영상 요약 및 색인 시스템 | |
TW200921454A (en) | Method and apparatus for video digest generation | |
Wang et al. | A surveillance video analysis and storage scheme for scalable synopsis browsing | |
KR20090045288A (ko) | 적응형 비디오 표현을 위한 방법 및 디바이스 | |
JP2020528680A (ja) | デジタルビデオコンテンツの修正 | |
CA3057924A1 (en) | System and method to optimize the size of a video recording or video transmission by identifying and recording a region of interest in a higher definition than the rest of the image that is saved or transmitted in a lower definition format | |
CN103984778A (zh) | 一种视频检索方法及系统 | |
US7020192B1 (en) | Method of retrieving video picture and apparatus therefor | |
JP2002513487A (ja) | オブジェクト指向コンテンツに基づくビデオ・サーチ用のアルゴリズム及びシステム | |
JP4770875B2 (ja) | 画像特徴データ生成装置、画像特徴判定装置および画像検索システム | |
JP2007306559A (ja) | 画像特徴符号化方法及び画像検索方法 | |
KR20050111801A (ko) | 화상 검색 방법, 화상 특징량 부호화 방법 및 화상 특징량복호 방법 | |
JPH09294277A (ja) | 予測符号化画像データ管理方法及び装置 | |
CN112446819A (zh) | 合成影像生成方法、服务器以及记录介质 | |
JP2006018831A (ja) | 画像検索システムおよび画像検索方法 | |
Meessen et al. | Content browsing and semantic context viewing through JPEG 2000-based scalable video summary |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070910 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080612 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100608 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100804 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100921 |