JP5553152B2 - 画像処理装置および方法、並びにプログラム - Google Patents
画像処理装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JP5553152B2 JP5553152B2 JP2010090609A JP2010090609A JP5553152B2 JP 5553152 B2 JP5553152 B2 JP 5553152B2 JP 2010090609 A JP2010090609 A JP 2010090609A JP 2010090609 A JP2010090609 A JP 2010090609A JP 5553152 B2 JP5553152 B2 JP 5553152B2
- Authority
- JP
- Japan
- Prior art keywords
- summary data
- moving image
- image content
- distance
- hierarchy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/56—Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Television Signal Processing For Recording (AREA)
Description
図1は、本発明を適用した画像処理装置のハードウェアの一実施の形態の構成例を示している。図1の画像処理装置11は、動画像コンテンツを蓄積すると共に、必要に応じて検索して抽出するものである。
次に、図1の画像処理装置11における動画像コンテンツ蓄積処理について説明する。
ここで、図3のフローチャートを参照して、第1階層要約データ生成処理について説明する。
ここで、図5のフローチャートを参照し、クラスタリング処理について説明する。
ここで、図6のフローチャートを参照して、第2階層要約データ生成処理について説明する。
さらに、以上においては、既に記憶部24に登録されている動画像コンテンツファイル111は、いずれもクラスタリングされていることが前提となる処理であった。しかしながら、クラスタリングされることなく動画像コンテンツファイル111が記憶部24に登録されている場合、初期クラスタリング処理が必要となる。そこで、次に、図7のフローチャートを参照して、初期クラスタリング処理について説明する。尚、第1階層要約データ生成処理により、全ての動画像コンテンツについての第1階層要約データが、第1階層要約データDB101に登録済みであることを前提とする。このため、図2のフローチャートにおけるステップS13の処理を除くステップS11,S12,S14,S15の処理によりクラスタリングされていない状態で記憶部24に動画像コンテンツが記憶されているものとする。
次に、図10のフローチャートを参照して、検索抽出処理について説明する。
以上においてはサンプルデータである1部の動画像コンテンツを入力するだけで、容易で、かつ、迅速に目的とする動画像コンテンツを検索される例について説明してきたが、同一のシーンを含んだ、個別に異なる動画像コンテンツが大量に検索されてしまう場合がある。この場合、重複するシーンを含む動画像コンテンツが大量に記憶部24に蓄積されていることとなる。そこで、重複しているシーンについては削除した上で、必要なシーンだけ繋ぎ合わせて必要最小限の動画像コンテンツファイルとすることで、動画像コンテンツファイルを圧縮し、記憶部24の記憶容量を節約するようにしてもよい。
Claims (6)
- 動画像コンテンツを構成する画像のうち、第1の頻度で抽出される画像より第1のサイズの第1階層要約データを登録するデータベースと、
前記データベースに登録されている前記第1階層要約データの構成要素からなるベクトル間の距離に基づいて、前記第1階層要約データ間の距離を計算する距離計算手段と、
前記距離計算手段により求められた前記第1階層要約データ間の距離が所定の距離内の前記第1階層要約データを同一のクラスに分類し、前記第1階層要約データが分類されたクラスに基づいて、動画像コンテンツを複数のクラスに分類するクラス分類手段と、
前記クラス毎に前記第1階層要約データの構成要素からなるベクトルの重心ベクトルを計算する重心ベクトル計算手段と、
入力された動画像コンテンツの前記第1階層要約データを、前記第1階層要約データの構成要素からなるベクトルと、前記データベースの前記重心ベクトルとの間の距離として前記距離計算手段により計算される、重心距離が最小となるクラスに登録するデータベース登録手段と、
前記動画像コンテンツを構成する画像のうち、前記第1の頻度よりも高い第2の頻度で抽出される画像より、前記第1のサイズよりも小さな第2のサイズの第2階層要約データを生成する第2階層要約データ生成手段と、
前記動画像コンテンツと対応して、前記第2階層要約データを格納する格納手段と、
前記第1階層要約データ生成手段により生成された前記第1階層要約データに基づいて、前記データベースのうち、前記重心距離が所定の距離よりも近いクラスの、対応する動画像コンテンツを検索する第1の検索手段と、
前記第1の検索手段により検索された動画像コンテンツのうち、前記第2階層要約データ生成手段により生成された前記第2階層要約データに基づいて、対応する動画像コンテンツを検索する第2の検索手段と
を含む画像処理装置。 - 前記第1階層要約データは、前記動画像コンテンツを構成する画像のうち、前記第1の頻度で抽出される画像が複数の分割領域に分割された、前記分割領域毎の画素値、輝度値、アクティビティ、音声ボリューム、および所定の音声周波数帯域の振幅の平均値のいずれか、または組み合わせから構成され、前記第1のサイズであり、
前記第2階層要約データは、前記動画像コンテンツを構成する画像のうち、前記第1の頻度よりも高い第2の頻度で抽出される画像が複数の分割領域に分割された、前記分割領域毎の画素値、輝度値、アクティビティ、音声ボリューム、または所定の音声周波数帯域の振幅の平均値の少なくともいずれかまた組み合わせから構成され、前記第1のサイズより小さな第2のサイズである
請求項1に記載の画像処理装置。 - 前記第1の頻度、および前記第2の頻度は、前記動画像コンテンツのうち、周期的、または非周期的に抽出される画像の頻度である
請求項1に記載の画像処理装置。 - 前記周期的とは、所定のフレーム数毎であり、前記非周期的とは、前記動画像コンテンツにおけるシーンチェンジにおけるタイミング毎、または音声データの無音部分から無音部分でなくなるタイミング毎である
請求項3に記載の画像処理装置。 - 動画像コンテンツを構成する画像のうち、第1の頻度で抽出される画像より第1のサイズの第1階層要約データを登録するデータベースと、
前記データベースに登録されている前記第1階層要約データの構成要素からなるベクトル間の距離に基づいて、前記第1階層要約データ間の距離を計算する距離計算手段と、
前記距離計算手段により求められた前記第1階層要約データ間の距離が所定の距離内の前記第1階層要約データを同一のクラスに分類し、前記第1階層要約データが分類されたクラスに基づいて、動画像コンテンツを複数のクラスに分類するクラス分類手段と、
前記クラス毎に前記第1階層要約データの構成要素からなるベクトルの重心ベクトルを計算する重心ベクトル計算手段と、
入力された動画像コンテンツの前記第1階層要約データを、前記第1階層要約データの構成要素からなるベクトルと、前記データベースの前記重心ベクトルとの間の距離として前記距離計算手段により計算される、重心距離が最小となるクラスに登録するデータベース登録手段と、
前記動画像コンテンツを構成する画像のうち、前記第1の頻度よりも高い第2の頻度で抽出される画像より、前記第1のサイズよりも小さな第2のサイズの第2階層要約データを生成する第2階層要約データ生成手段と、
前記動画像コンテンツと対応して、前記第2階層要約データを格納する格納手段と、
前記第1階層要約データ生成手段により生成された前記第1階層要約データに基づいて、前記データベースのうち、前記重心距離が所定の距離よりも近いクラスの、対応する動画像コンテンツを検索する第1の検索手段と、
前記第1の検索手段により検索された動画像コンテンツのうち、前記第2階層要約データ生成手段により生成された前記第2階層要約データに基づいて、対応する動画像コンテンツを検索する第2の検索手段とを含む画像処理装置の画像処理方法であって、
前記距離計算手段における、前記データベースに登録されている前記第1階層要約データの構成要素からなるベクトル間の距離に基づいて、前記第1階層要約データ間の距離を計算する距離計算ステップと、
前記クラス分類手段における、前記距離計算ステップの処理により求められた前記第1階層要約データ間の距離が所定の距離内の前記第1階層要約データを同一のクラスに分類し、前記第1階層要約データが分類されたクラスに基づいて、動画像コンテンツを複数のクラスに分類するクラス分類ステップと、
前記重心ベクトル計算手段における、前記クラス毎に前記第1階層要約データの構成要素からなるベクトルの重心ベクトルを計算する重心ベクトル計算ステップと、
前記データベース登録手段における、前記入力された動画像コンテンツの前記第1階層要約データを、前記第1階層要約データの構成要素からなるベクトルと、前記データベースの前記重心ベクトルとの間の距離として前記距離計算ステップの処理により計算される、前記重心距離が最小となるクラスに登録するデータベース登録ステップと、
前記第2階層要約データ生成手段における、前記動画像コンテンツを構成する画像のうち、前記第1の頻度よりも高い第2の頻度で抽出される画像より、前記第1のサイズよりも小さな第2のサイズの第2階層要約データを生成する第2階層要約データ生成ステップと、
前記格納手段における、前記動画像コンテンツと対応して、前記第2階層要約データを格納する格納ステップと、
前記第1の検索手段における、前記第1階層要約データ生成ステップの処理により生成された前記第1階層要約データに基づいて、前記データベースのうち、前記重心距離が所定の距離よりも近いクラスの、対応する動画像コンテンツを検索する第1の検索ステップと、
前記第2の検索手段における、前記第1の検索ステップの処理により検索された動画像コンテンツのうち、前記第2階層要約データ生成ステップの処理により生成された前記第2階層要約データに基づいて、対応する動画像コンテンツを検索する第2の検索ステップと
を含む画像処理方法。 - 動画像コンテンツを構成する画像のうち、第1の頻度で抽出される画像より第1のサイズの第1階層要約データを登録するデータベースと、
前記データベースに登録されている前記第1階層要約データの構成要素からなるベクトル間の距離に基づいて、前記第1階層要約データ間の距離を計算する距離計算手段と、
前記距離計算手段により求められた前記第1階層要約データ間の距離が所定の距離内の前記第1階層要約データを同一のクラスに分類し、前記第1階層要約データが分類されたクラスに基づいて、動画像コンテンツを複数のクラスに分類するクラス分類手段と、
前記クラス毎に前記第1階層要約データの構成要素からなるベクトルの重心ベクトルを計算する重心ベクトル計算手段と、
入力された動画像コンテンツの前記第1階層要約データを、前記第1階層要約データの構成要素からなるベクトルと、前記データベースの前記重心ベクトルとの間の距離として前記距離計算手段により計算される、重心距離が最小となるクラスに登録するデータベース登録手段と、
前記動画像コンテンツを構成する画像のうち、前記第1の頻度よりも高い第2の頻度で抽出される画像より、前記第1のサイズよりも小さな第2のサイズの第2階層要約データを生成する第2階層要約データ生成手段と、
前記動画像コンテンツと対応して、前記第2階層要約データを格納する格納手段と、
前記第1階層要約データ生成手段により生成された前記第1階層要約データに基づいて、前記データベースのうち、前記重心距離が所定の距離よりも近いクラスの、対応する動画像コンテンツを検索する第1の検索手段と、
前記第1の検索手段により検索された動画像コンテンツのうち、前記第2階層要約データ生成手段により生成された前記第2階層要約データに基づいて、対応する動画像コンテンツを検索する第2の検索手段とを含む画像処理装置を制御するコンピュータに、
前記距離計算手段における、前記データベースに登録されている前記第1階層要約データの構成要素からなるベクトル間の距離に基づいて、前記第1階層要約データ間の距離を計算する距離計算ステップと、
前記クラス分類手段における、前記距離計算ステップの処理により求められた前記第1階層要約データ間の距離が所定の距離内の前記第1階層要約データを同一のクラスに分類し、前記第1階層要約データが分類されたクラスに基づいて、動画像コンテンツを複数のクラスに分類するクラス分類ステップと、
前記重心ベクトル計算手段における、前記クラス毎に前記第1階層要約データの構成要素からなるベクトルの重心ベクトルを計算する重心ベクトル計算ステップと、
前記データベース登録手段における、前記入力された動画像コンテンツの前記第1階層要約データを、前記第1階層要約データの構成要素からなるベクトルと、前記データベースの前記重心ベクトルとの間の距離として前記距離計算ステップの処理により計算される、前記重心距離が最小となるクラスに登録するデータベース登録ステップと、
前記第2階層要約データ生成手段における、前記動画像コンテンツを構成する画像のうち、前記第1の頻度よりも高い第2の頻度で抽出される画像より、前記第1のサイズよりも小さな第2のサイズの第2階層要約データを生成する第2階層要約データ生成ステップと、
前記格納手段における、前記動画像コンテンツと対応して、前記第2階層要約データを格納する格納ステップと、
前記第1の検索手段における、前記第1階層要約データ生成ステップの処理により生成された前記第1階層要約データに基づいて、前記データベースのうち、前記重心距離が所定の距離よりも近いクラスの、対応する動画像コンテンツを検索する第1の検索ステップと、
前記第2の検索手段における、前記第1の検索ステップの処理により検索された動画像コンテンツのうち、前記第2階層要約データ生成ステップの処理により生成された前記第2階層要約データに基づいて、対応する動画像コンテンツを検索する第2の検索ステップとを含む処理を実行させる
プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010090609A JP5553152B2 (ja) | 2010-04-09 | 2010-04-09 | 画像処理装置および方法、並びにプログラム |
EP20110154803 EP2375349A1 (en) | 2010-04-09 | 2011-02-17 | Image processing apparatus, image processing method, and program |
CN2011100858790A CN102214195A (zh) | 2010-04-09 | 2011-04-02 | 图像处理设备、图像处理方法及程序 |
US13/079,347 US8620971B2 (en) | 2010-04-09 | 2011-04-04 | Image processing apparatus, image processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010090609A JP5553152B2 (ja) | 2010-04-09 | 2010-04-09 | 画像処理装置および方法、並びにプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011221807A JP2011221807A (ja) | 2011-11-04 |
JP2011221807A5 JP2011221807A5 (ja) | 2013-05-16 |
JP5553152B2 true JP5553152B2 (ja) | 2014-07-16 |
Family
ID=43977976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010090609A Expired - Fee Related JP5553152B2 (ja) | 2010-04-09 | 2010-04-09 | 画像処理装置および方法、並びにプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8620971B2 (ja) |
EP (1) | EP2375349A1 (ja) |
JP (1) | JP5553152B2 (ja) |
CN (1) | CN102214195A (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104205807B (zh) * | 2012-03-30 | 2017-06-06 | 索尼公司 | 图像处理设备、方法以及程序 |
CN104679779B (zh) * | 2013-11-29 | 2019-02-01 | 华为技术有限公司 | 视频分类的方法和装置 |
JP6062474B2 (ja) * | 2015-03-20 | 2017-01-18 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
US10002284B2 (en) * | 2016-08-11 | 2018-06-19 | Ncku Research And Development Foundation | Iterative matching method and system for partial fingerprint verification |
US11347816B2 (en) | 2017-12-01 | 2022-05-31 | At&T Intellectual Property I, L.P. | Adaptive clustering of media content from multiple different domains |
KR102618732B1 (ko) * | 2019-08-27 | 2023-12-27 | 엘지전자 주식회사 | 얼굴 인식 활용 단말기 및 얼굴 인식 활용 방법 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3475317B2 (ja) * | 1996-12-20 | 2003-12-08 | 日本電信電話株式会社 | 映像分類方法および装置 |
JPH10257436A (ja) * | 1997-03-10 | 1998-09-25 | Atsushi Matsushita | 動画像の自動階層構造化方法及びこれを用いたブラウジング方法 |
JP3821558B2 (ja) * | 1997-10-27 | 2006-09-13 | 日本電信電話株式会社 | 映像情報一斉付加方法およびその方法を記録した記録媒体 |
JP3307613B2 (ja) * | 1998-09-03 | 2002-07-24 | 株式会社次世代情報放送システム研究所 | 映像検索システム |
JP2001134589A (ja) | 1999-11-05 | 2001-05-18 | Nippon Hoso Kyokai <Nhk> | 動画像検索装置 |
US7016540B1 (en) * | 1999-11-24 | 2006-03-21 | Nec Corporation | Method and system for segmentation, classification, and summarization of video images |
JP3408800B2 (ja) * | 2000-04-27 | 2003-05-19 | 日本電信電話株式会社 | 信号検出方法、装置及びそのプログラム、記録媒体 |
JP4587151B2 (ja) * | 2000-12-27 | 2010-11-24 | キヤノン株式会社 | インターネットdtvシステム、並びに、コマーシャルサーバ及びその制御方法 |
JP2005277531A (ja) * | 2004-03-23 | 2005-10-06 | Seiko Epson Corp | 動画像処理装置 |
TW200627362A (en) * | 2004-11-01 | 2006-08-01 | Seiko Epson Corp | Signal processing for reducing blur of moving image |
US8699806B2 (en) * | 2006-04-12 | 2014-04-15 | Google Inc. | Method and apparatus for automatically summarizing video |
US8055079B2 (en) * | 2007-03-06 | 2011-11-08 | Sharp Kabushiki Kaisha | Image processing method, image processing apparatus, and image forming apparatus |
JP4420085B2 (ja) * | 2007-08-20 | 2010-02-24 | ソニー株式会社 | データ処理装置、データ処理方法、プログラムおよび記録媒体 |
JP5116017B2 (ja) * | 2007-08-31 | 2013-01-09 | Kddi株式会社 | 動画検索方法およびシステム |
US8064695B2 (en) * | 2007-09-27 | 2011-11-22 | Behavioral Recognition Systems, Inc. | Dark scene compensation in a background-foreground module of a video analysis system |
JP2010090609A (ja) | 2008-10-08 | 2010-04-22 | Fukui Prefecture | 橋梁の洗浄装置 |
JP5178662B2 (ja) * | 2009-07-31 | 2013-04-10 | 富士フイルム株式会社 | 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム |
-
2010
- 2010-04-09 JP JP2010090609A patent/JP5553152B2/ja not_active Expired - Fee Related
-
2011
- 2011-02-17 EP EP20110154803 patent/EP2375349A1/en not_active Withdrawn
- 2011-04-02 CN CN2011100858790A patent/CN102214195A/zh active Pending
- 2011-04-04 US US13/079,347 patent/US8620971B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011221807A (ja) | 2011-11-04 |
EP2375349A1 (en) | 2011-10-12 |
US20110252035A1 (en) | 2011-10-13 |
US8620971B2 (en) | 2013-12-31 |
CN102214195A (zh) | 2011-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5553152B2 (ja) | 画像処理装置および方法、並びにプログラム | |
JP4201454B2 (ja) | 動画要約生成方法及び動画要約生成装置 | |
US10997459B2 (en) | Video content indexing and searching | |
EP2530605A1 (en) | Data processing device | |
EP1816575A1 (en) | System, apparatus, method, program and recording medium for processing image | |
US20090164489A1 (en) | Information processing apparatus and information processing method | |
WO2017114211A1 (zh) | 用于对视频场景切换进行检测的方法和装置 | |
Priya et al. | Shot based keyframe extraction for ecological video indexing and retrieval | |
JP5510012B2 (ja) | 画像処理装置および方法、並びにプログラム | |
WO2000048397A1 (fr) | Procede de traitement de signal et dispositif de traitement video/audio | |
JP2007206919A (ja) | 表示制御装置および方法、プログラム、並びに記録媒体 | |
JP2007206920A (ja) | 画像処理装置および方法、検索装置および方法、プログラム、並びに記録媒体 | |
Gitte et al. | Content based video retrieval system | |
CN106557545A (zh) | 视频检索方法和装置 | |
CN109902198A (zh) | 一种以图搜图的方法、装置及应用系统 | |
JP2008282407A (ja) | 情報処理装置 | |
CN108966042B (zh) | 一种基于最短路径的视频摘要生成方法及装置 | |
CN105117735A (zh) | 一种大数据环境下的图像检测方法 | |
Widiarto et al. | Video summarization using a key frame selection based on shot segmentation | |
Besiris et al. | Combining graph connectivity & dominant set clustering for video summarization | |
JP2003316819A (ja) | オブジェクト分類検索装置及びそれを実行するためのプログラム | |
Iparraguirre et al. | Speeded-up video summarization based on local features | |
JP3529036B2 (ja) | 文書付き画像の分類方法 | |
JPH0944639A (ja) | 映像ブロック分類方法及び装置 | |
JP3916813B2 (ja) | データ系列検索装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130328 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140501 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140514 |
|
LAPS | Cancellation because of no payment of annual fees |