JP5527511B2 - 動画サムネイル作成装置、方法及びプログラム - Google Patents

動画サムネイル作成装置、方法及びプログラム Download PDF

Info

Publication number
JP5527511B2
JP5527511B2 JP2009212914A JP2009212914A JP5527511B2 JP 5527511 B2 JP5527511 B2 JP 5527511B2 JP 2009212914 A JP2009212914 A JP 2009212914A JP 2009212914 A JP2009212914 A JP 2009212914A JP 5527511 B2 JP5527511 B2 JP 5527511B2
Authority
JP
Japan
Prior art keywords
image
frame images
frame
thumbnail
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009212914A
Other languages
English (en)
Other versions
JP2011066483A (ja
JP2011066483A5 (ja
Inventor
純一 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2009212914A priority Critical patent/JP5527511B2/ja
Publication of JP2011066483A publication Critical patent/JP2011066483A/ja
Publication of JP2011066483A5 publication Critical patent/JP2011066483A5/ja
Application granted granted Critical
Publication of JP5527511B2 publication Critical patent/JP5527511B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)

Description

本発明は、動画サムネイルを作成する装置、方法及びプログラムに関する。
近年、映像機器の高性能化、パーソナルコンピュータ(以下PC)の普及及び高性能化、ハードディスクなどのストレージデバイスの低価格化により、映像処理環境を低価格で容易に整えることが可能となった。また、ブロードバンド化によりネットワークを介しWeb上での公開や送信への敷居が下がり、You Tubeやニコニコ動画(登録商標)などに代表される動画配信サイトのアクセス数やコンテンツ数は増加傾向にある。
このような動画配信サイトでは動画サムネイルが使用されている。動画サムネイルとは、動画から抽出された動画の内容を表す静止画であり、一般的に複数の動画の一覧を表示する際に、動画のタイトルとともに表示される。
動画は複数のフレーム画像(静止画)の集合体であり、動画のどの部分から抽出するかは様々な手段が考えられている(特許文献1、2参照)。
しかしながら、従来の動画サムネイルは動画から抽出した1枚のフレーム画像により構成されているため、情報量が少ないという問題がある。
本発明は、このような問題を解決するためになされたものであり、その目的は、動画サムネイルの情報量を増やすことである。
本発明の動画サムネイル作成装置は、動画を構成する複数のフレーム画像である第1の複数のフレーム画像のそれぞれから特徴量を算出する画像処理部と、前記画像処理部でそれぞれの前記第1の複数のフレーム画像から算出された特徴量の隣接フレーム間の差分が閾値以上であるか否かを基に、前記動画のシーンのカット点を複数検出するカット点検出部と、前記カット点検出部により検出されたカット点に挟まれたシーン毎に、シーンを構成する1以上のフレーム画像から1のフレーム画像を抽出することで、前記第1の複数のフレーム画像から第2の複数のフレーム画像を抽出する画像選択部と、前記画像選択部で抽出された第2の複数のフレーム画像の枚数が所定の閾値以上か否か判定する手段と、前記判定する手段により所定の閾値以上と判定された場合、前記抽出された第2の複数のフレーム画像それぞれの特徴量を用いて、前記抽出された第2の複数のフレーム画像から目の細かくない順にフレーム画像を前記閾値未満の枚数だけ選択する手段と、前記閾値未満の枚数の前記第2の複数のフレーム画像を縮小し合成して、1枚のサムネイルを生成する画像生成部と、を有することを特徴とする動画サムネイル作成装置である。
本発明の動画サムネイル作成方法は、動画サムネイル作成装置により実行される動画サムネイル作成方法であって、動画を構成する複数のフレーム画像である第1の複数のフレーム画像のそれぞれから特徴量を算出する画像処理工程と、前記画像処理工程でそれぞれの前記第1の複数のフレーム画像から算出された特徴量の隣接フレーム間の差分が閾値以上であるか否かを基に、前記動画のシーンのカット点を複数検出するカット点検出工程と、前記カット点検出工程により検出されたカット点に挟まれたシーン毎に、シーンを構成する1以上のフレーム画像から1のフレーム画像を抽出することで、前記第1の複数のフレーム画像から第2の複数のフレーム画像を抽出する画像選択工程と、前記画像選択工程で抽出された第2の複数のフレーム画像の枚数が所定の閾値以上か否か判定する工程と、前記判定する工程により所定の閾値以上と判定された場合、前記抽出された第2の複数のフレーム画像それぞれの特徴量を用いて、前記抽出された第2の複数のフレーム画像から目の細かくない順にフレーム画像を前記閾値未満の枚数だけ選択する工程と、前記閾値未満の枚数の前記第2の複数のフレーム画像を縮小し合成して、1枚のサムネイルを生成する画像生成工程と、を有することを特徴とする動画サムネイル作成方法である。
本発明の動画サムネイル作成プログラムは、コンピュータを、本発明の動画サムネイル作成装置として機能させるためのプログラムである。
本発明によれば、動画サムネイルを複数のフレームの画像で構成することにより、1フレームの画像で構成する場合と比べ、動画サムネイルの情報量を増やすことができる。また、複数のフレーム画像を目の細かくない順に所定の閾値未満の枚数だけ選択することにより、動画サムネイルの視認性を向上させることができる。
本発明の第1の実施形態の動画サムネイル作成装置のハードウェアブロック図である。 本発明の第1の実施形態の動画サムネイル作成装置の機能ブロック図である。 図2における画像選択部の動作を示す図である。 図2における画像生成部の動作を示す図である。 図2における各部の処理を示すフローチャートである。 本発明の第2の実施形態の動画サムネイル作成装置の機能ブロック図である。 輝度ヒストグラムを示す図である。 図6における各部の処理を示すフローチャートである。 本発明の第3の実施形態の動画サムネイル作成装置の機能ブロック図である。 図9における各部の処理を示すフローチャートである。 本発明の第4の実施形態の動画サムネイル作成装置の画像生成部の動作を示す図である。 本発明の第5の実施形態の動画サムネイル作成装置の画像生成部の動作を示す図である。
以下、本発明の実施形態について、図面を用いて詳細に説明する。
[第1の実施形態]
図1は、本発明の第1の実施形態の動画サムネイル作成装置のハードウェアブロック図である。
この動画サムネイル作成装置は一般的なPCに動画サムネイル作成プログラムをインストールすることにより構成したものであり、ハードウェアとして、バス1と、それぞれがバス1に接続されたCPU(Central Processing Unit)2、メモリ3、外部記憶装置4、入力装置5、表示装置6、及びI/F(インタフェース)7からなる。
CPU2は、この動画サムネイル作成装置の動作制御を行うものである。メモリ3は、CPU2が起動時に実行するプログラムや必要なデータ等を記憶するためのROM(Read Only Memory)、CPU2のワークエリア等を構成するためのRAM(Random Access Memory)などからなる。外部記憶装置4は、HDD(Hard Disk Drive)からなり、動画サムネイル作成プログラムを含む種々のアプリケーションプログラム、ワークデータ、及びファイルデータなどを記憶する。
入力装置5は、キーボードやマウスなどからなり、この動画サムネイル作成装置に対する種々のキー操作や指示を行うためのものである。表示装置6は、液晶ディスプレイなどからなり、この動画サムネイル作成装置を操作するための画面や動作状態を表示する。
I/F7は、この動画サムネイル作成装置をLAN(ローカルエリアネットワーク)やインターネット等のネットワーク(図示せず)に接続するためのネットワークI/Fや、ビデオカメラを接続するためのDVI(デジタルビデオインタフェース)などである。
本実施形態の動画サムネイル作成装置は、図2に示すように、入力される動画VDから所定の間隔で複数のフレーム画像を抽出する画像選択部11と、画像選択部11で抽出された複数のフレーム画像を合成して、1枚のサムネイルVDを生成し出力する画像生成部12とからなる。ここで、画像選択部11及び画像生成部12は、図1のCPU2が動画サムネイル作成プログラムを実行することにより実現される機能ブロックである。
動画VDとしては、例えばWindows(登録商標) Media、RealMedia、MPEG(Moving Picture Experts Group)−1,2,4形式、QuickTime形式など、現在普及している動画形式や、DV(Digital Video)カメラやWebカメラなどで生成された映像ストリームがある。これらの動画は音声情報を伴うが、ここでは音声を無視し、画像のみを取り扱う。一般的には動画は複数の画像(静止画)が連なったものであり、各静止画をフレームと呼び、1秒あたりのフレーム数をfps(frame per second)という単位で表す。
図3に示すように、画像選択部11は全長21フレームの動画VDから5フレームを抽出する。21フレームを5等分する4.2フレームとなるが、フレームはこれ以上分割できない単位であるため端数は無視し、4フレーム毎に画像を抽出する。
このように等間隔で抽出するメリットとして、動画VDに対して特に画像処理を施すことなくフレーム画像を抽出できるため高速抽出が可能となることが挙げられる。また、計算量が少ないためパフォーマンスの低いCPUでも動作可能である。反面、画像処理による判断がないため、適切なフレーム画像を抽出できる可能性は低い。
図4に、画像生成部12における画像合成の例を示す。ここで、図4Aは5フレームを合成する例であり、図4Bは3フレームを合成する例である。これらの図において、VDに添付された数字(1〜5)は動画VDの時系列順と対応している。
図4Aの場合、真っ先に目に触れる画面中央に先頭のフレーム画像VDを配置することで、動画VDの内容と比べて時系列的に自然な感じを視聴者に与える。ここで、全てのフレーム画像は縦横比(アスペクト比)を保持したまま縮小される。また、合成されるフレーム画像の数によりそれらの配置は変化し、3枚以下の場合は、図4Bに示すように空白部が発生する。一方、6枚以上の場合は、1枚のフレーム画像のサイズが小さくなるため、抽出画像を間引いた方が良好な合成画像となる場合がある。
図5に、図2の画像選択部11及び画像生成部12の処理のフローチャートを示す。図示のように、画像選択部11において、予め設定された抽出数を基に、動画から等間隔でフレーム画像を抽出する(ステップS1)。そのため、予めユーザが入力装置5を用いて抽出数を設定し、メモリ3に記憶しておく。抽出数を設定する際、動画の全体長が必要であるため、ストリーミングデータなどの全体長が不明な動画に対しては不向きである。ここでは、図3に示したように、全長21フレームの動画から5フレームを抽出している。なお、全体長が不明な動画については、等間隔ではなく任意の間隔で抽出することで対応する。
画像選択部11は抽出した複数のフレーム画像を画像生成部12へ送る。画像生成部12は、複数のフレーム画像を縮小・合成して、サムネイルVDを生成し出力する(ステップ2)。
本実施形態の動画サムネイル作成装置によれば、複数のフレーム画像を1枚のサムネイルとするので、従来の1つのフレーム画像のみからなるサムネイルと比べ、より多くの情報を含むサムネイルを作成することができる。また、入力画像VDに対して特に画像処理を施すことなくフレーム画像を抽出できるため高速抽出が可能となり、パフォーマンスの低い装置でも実現できる。
[第2の実施形態]
図6は、本発明の第2の実施形態の動画サムネイル作成装置の機能ブロック図である。本実施形態の動画サムネイル作成装置のハードウェアは第1の実施形態(図1)と同じである。
図6に示すように、本実施形態の動画サムネイル作成装置は、画像処理部21と、画像選択部22と、画像生成部23とからなる。画像処理部21は、入力される動画VDの特徴量を算出する。画像選択部22は、画像処理部21の算出結果を用いて、動画VDから複数のフレーム画像を抽出する。画像生成部23は、画像選択部23で抽出された複数のフレーム画像を縮小・合成して1枚のサムネイルVDを生成する。ただし、抽出画像数が所定数以上の場合は、合成対象のフレーム画像を所定の基準を基に絞り込む。各部の動作の詳細については後述する。
画像処理部21では、動画VDを解析し、各フレーム画像の特徴量を算出する。特徴量としては、RGB又は輝度(Y)のヒストグラム分布、二次元フーリエ変換、ウェーブレット変換など多数の種類がある。
輝度ヒストグラム分布は、画像内のピクセル(画像)毎に輝度値を算出し、輝度階調毎のピクセル数をグラフ化したものであり、図7にその一例を示す。このグラフの横軸は輝度値であり、縦軸はピクセル数である。
輝度とはアナログカラーテレビ信号等で使用されているYCC色空間におけるYであり、RGB色空間とは下記の式[1]〜[3]の関係にある。
Y=0.299R+0.587G+0.114B …式[1]
Cr=R−Y …式[2]
Cb=B−Y …式[3]
RGBヒストグラムは色毎にヒストグラム分布を求めたものである。どの色のヒストグラム分布を使用しても良いが、輝度は色の変化に左右されず安定した値を取るため、本実施形態では輝度ヒストグラム分布を用いた。
また、画像処理部21では、画像の特徴量として、輝度ヒストグラム分布に加えて、アクティビティを算出する。高周波成分を多く含む空間解像度の高い画像を一般的にアクティビティが高い画像と言う。網目や市松模様などの目の細かい画像はアクティビティが高い。詳細について後述するように、画像生成部23では、動画サムネイル作成の際、必要に応じて画像選択部22で抽出されたフレーム画像を削減するために、アクティビティを用いる。目の細かい、即ちアクティビティの高い画像は、縮小すると細部が潰れてしまい認識困難となるため、サムネイルに不向きである。そこで、画像選択部22で抽出されたフレーム画像をアクティビティの低い順に選択することで、アクティビティの高い画像を除く。
アクティビティは画像圧縮において一般的に使用されているDCT(Discrete Cosine Transform:離散コサイン変換)を用いることで算出することができる。DCTでは、画像を周波数変換し、高周波成分に関しては視覚的認識度が低いという視覚特性に基づき、符号量削減のため高周波成分の除去を行うなどにより高圧縮率を獲得する。この高周波成分の計測値の二乗の総和をアクティビティとすればよい。
アクティビティに代えて、符号量を算出してもよい。I/F7から入力される画像が圧縮されている画像の場合は、その符号量(係数)を用いることで、算出処理を省略することができる。ただし、画像を復号してから画像選択部22へ入力することが必要となる。
図8に、図6の画像処理部21、画像選択部22及び画像生成部23の処理のフローチャートを示す。
画像処理部21では、動画VDiの各フレーム画像の特徴量として輝度ヒストグラム分布、及びアクティビティ或いは符号量を算出する(ステップS11)。この算出された特徴量は画像選択部22へ送られる。
画像選択部22では、まず画像処理部21で算出された輝度ヒストグラム分布の隣接フレーム間の差分を求め、差分が所定の閾値以上となるフレームをカット点とする(ステップS12)。
輝度ヒストグラム分布の隣接フレーム間の差分は、個度毎に差分をとり、それらの絶対値の和を求めることで得る。得られた差分を他の隣接フレーム間の差分と比べたとき、値が大きいフレームがあると、それをカット点とする。カット点とは動画のシーンが切り替わるところである。シーン中のフレーム画像は連続的に変化していくため隣接フレーム間の差分は小さいが、シーンが切り替わる場合は全く別の画像に変わるため差分が大きくなる。従って、隣接フレーム間の差分が他と比べて大きいフレームはカット点である可能性が高い。そこで、隣接フレーム間の差分が予め定めておいた閾値以上ならばカット点とする。なお、この閾値は事前に設定しても良いが、動的に変化させることで、カット点の数を意図的に操作可能とし、フレーム画像の抽出数を固定値にすることができる。
次いで、画像選択部22では、隣接するカット点で区切られた複数のフレーム画像を一つのシーンとし、シーン毎に先頭のフレーム画像を抽出する(ステップS13)。一般的にシーンの先頭のフレーム画像はそのシーンの代表的な画像である可能性が高く、容易に抽出可能であるため、ビデオ編集ソフトなどでよく用いられている。
画像生成部23は、画像選択部22で抽出された各シーンの先頭フレーム画像の数が6枚以上か否か判定する(ステップS14)。判定の結果、6枚未満であった場合は(S14:No)、図5(第1の実施形態)のステップS2と同様に、それらの画像を縮小・合成し、1枚のサムネイルを生成する(ステップS15)。
一方、判定の結果、6枚以上であった場合は(S14:Yes)、アクティビティの低い順、或いは符号量の少ない順に5枚のフレーム画像を選択し(ステップS16)、その5つのフレーム画像を縮小・合成し、1枚のサムネイルを生成する(ステップS17)。
第1の実施形態において、図4に関連して説明したとおり、6枚以上の画像を用いてサムネイルを生成すると、1枚あたりの抽出画像のサイズが小さくなり望ましくない。ぞこで、本実施形態では、抽出画像をアクティビティの低い順、或いは符号量の少ない順に5枚に絞り込むことで、動画サムネイルの視認性の向上を図っている。
本実施形態の動画サムネイル作成装置によれば、複数のフレーム画像を1枚のサムネイルとするので、従来の1つのフレーム画像のみからなるサムネイルと比べ、より多くの情報を含むサムネイルを作成することができる。また、シーンの先頭のフレーム画像を自動的に抽出することで、第1の実施形態よりも適切なフレーム画像を抽出することができる。
なお、本実施形態において、入力される動画がMPEG形式の場合、特徴量として色差値の符号量を用いることができる。MPEG形式の画像の場合、輝度値と色差値とを4:2:2或いは4:2:0の割合で圧縮する。色差値には2種類あるが、輝度値4ピクセルに対し、色差値2或いは1ピクセルに削減することで圧縮率を高めている。一般的には色差値の符号量が多いほど高周波成分は増え、アクティビティも高くなるため、画像生成部23において抽出画像数を5枚以下に絞り込む際に、この色差値の符号量を特徴量として利用することができる。
[第3の実施形態]
図9は、本発明の第3の実施形態の動画サムネイル作成装置の機能ブロック図である。本実施形態の動画サムネイル作成装置のハードウェアは第1の実施形態(図1)と同じである。
図9に示すように、本実施形態の動画サムネイル作成装置は、画像処理部31と、画像選択部32と、画像生成部33とからなる。画像処理部31の機能は第2の実施形態における画像処理部21と同じであり、画像生成部33の機能は第2の実施形態における画像生成部23と同じである。一方、画像選択部32の機能は、画像処理部31で算出された画像の特徴量を基にカット点を検出することは第2の実施形態と同じであるが、各シーンの特徴的なフレーム画像を抽出することが第2の実施形態と異なる。
図10に、図9の画像処理部31、画像選択部32及び画像生成部33の処理のフローチャートを示す。
画像処理部31では、第2の実施形態(図8)のステップS11と同様に、動画VDiの各フレーム画像の特徴量として輝度ヒストグラム分布、及びアクティビティ或いは符号量を算出する(ステップS21)。この算出された特徴量は画像選択部32へ送られる。
画像選択部32では、まず第2の実施形態(図8)のステップS12と同様に、画像処理部31で算出された輝度ヒストグラム分布の隣接フレーム間の差分を求め、差分が所定の閾値以上となるフレームをカット点とする(ステップS22)。
次いで、画像選択部32では、隣接するカット点で区切られた複数のフレーム画像を一つのシーンとし、各シーン内の各フレーム画像の輝度ヒストグラム分布の中央値の平均値を算出し、さらにその平均値に最も近い中央値を持つフレーム画像を抽出する(ステップS23)。
このステップS23の処理が第2の実施形態との違いである。第2の実施形態のように、各シーンの先頭のフレーム画像を抽出しても、高い確率で各シーンの特徴的なフレーム画像を抽出することができる。ただし、例えば先頭のフレーム画像が単一色の画像の場合は意味の無いフレーム画像が抽出され、徐々に明るくなるようなトランジェントの場合は暗くて認識しづらいフレーム画像が抽出されてしまう。これに対して、本実施形態では、先頭のフレーム画像がこのような入力画像の場合でも、平均的な輝度ヒストグラム分布を持つフレーム画像が抽出される。
なお、動画VDの情報量が大きく、ステップS23の処理に時間がかかる場合は、輝度ヒストグラム分布の中央値をシーン内の全フレームについて計算せず、複数フレームおきに計算してもよい。この場合、ある程度情報を失うことになるが、個人差はあれ人間の目は0.1秒程度の変化に対応しきれないので、例えば30fpsの入力画像の場合は0.1秒おきにフレーム画像の特徴量(ここでは輝度ヒストグラム分布の中央値)を計算することで3倍の処理速度向上につながる。
ステップS23で抽出されたフレーム画像は画像生成部33に送られる。画像生成部33の処理であるステップS24〜S27は、第2の実施形態(図8)におけるステップS14〜S17と同じである。
本実施形態の動画サムネイル作成装置によれば、複数のフレーム画像を1枚のサムネイルとするので、従来の1つのフレーム画像のみからなるサムネイルと比べ、より多くの情報を含むサムネイルを作成することができる。また、各シーンから特徴的なフレーム画像を抽出するので、無意味がフレーム画像や認識しづらいフレーム画像の抽出を防止することができる。
[第4の実施形態]
図11は、本発明の第4の実施形態の動画サムネイル作成装置の画像生成部の動作を示す図である。本実施形態の動画サムネイル作成装置のハードウェアは第1の実施形態(図1)と同じであり、機能ブロックは第2の実施形態(図6)又は第3の実施形態(図9)と同じである。
本実施形態の特徴は、画像生成部で複数のフレーム画像を縮小・合成するときに、各フレー画像の面積比をそれらのフレーム画像の特徴量に応じて定めることである。下記の表1を用いて具体的に説明する。
Figure 0005527511
この表に示すように、選択されたフレーム画像(合成される5枚のフレーム画像)VDa〜VDeの輝度ヒストグラム分布の中央値がそれぞれ80、90、100、110、120であったとする。まず、これらの平均値を算出すると100になるので、それぞれと100との差分を取り、その絶対値を求める。VDa、VDb、VDc、VDd、VDeの差分の絶対値は、それぞれ20、10、0、10、20となる。
次に差分の絶対値を正規化する。ここでは、面積比に最大2倍まで差をつけて変える。この場合、正規化した値が0の場合を1倍とし、1の場合を2倍とすることで実現できる。よって、VDa、VDb、VDc、VDd、VDeの正規化した値はそれぞれ1.0、0.5、0、0.5、1.0となる。
一般的に、輝度ヒストグラム分布の中央値が高い程明るい画像であり、低い程暗い画像であるから、上記の正規化値を用いて面積比を変えた場合、明るければ明るい程、或いは暗ければ暗い程面積が広くなる。その逆に、明るければ明るい程、或いは暗ければ暗い程面積を狭くしたい場合は、正規化した値を反転した値を用いればよい。表1の場合、VDa、VDb、VDc、VDd、VDeの正規化した値を反転すると、それぞれ0、0.5、1.0、0.5、0となる。
図11Aは4枚のフレーム画像VD〜VDを等倍で配置し、合成する例を示している。一方、図11B、図11Cは面積比を変えて合成したものである。面積比を変えた場合は必ず覆いかぶさる部分ができるので、どの順番で配置するかにより、どのフレーム画像が強調されるかが決まる。この順番も輝度ヒストグラムの中央値を利用して決めることが好適である。正規化した値、或いは反転した値のどちらを採用するかにより異なるが、中央値の平均値からの差分の大きさを基にその順番を決めると、面積比の大小を決める規則に沿ったものとなる。
また、特徴量としてアクティビティ或いは符号量を用いることで、視認性の向上が可能となる。一般的に、アクティビティの高い画像は前述の通り縮小に不向きである。よって、広い面積を割り当てることで、縮小劣化による視認性の低下を避ける。逆にアクティビティの低い画像については割り当て面積を狭め、他の選択フレーム画像に割り当てる。面積の配分に関しては、上記輝度値のヒストグラム分布を用いた場合と同様であり、使用する特徴量をアクティビティ或いは符号量に置き換えればよい。これらの操作により、限られた面積の中で、効率的かつ効果的に視認性の向上を図ることができる。
本実施形態の動画サムネイル作成装置によれば、複数のフレーム画像を1枚のサムネイルとするので、従来の1つのフレーム画像のみからなるサムネイルと比べ、より多くの情報を含むサムネイルを作成することができる。また、合成するフレーム画像の特徴量に応じて、それらのフレーム画像の面積比を変えるので、フレーム画像の特徴量を反映させたサムネイルを生成することができる。
[第5の実施形態]
図12は、本発明の第5の実施形態の動画サムネイル作成装置の画像生成部の動作を示す図である。本実施形態の動画サムネイル作成装置のハードウェアは第1の実施形態(図1)と同じであり、機能ブロックは第1〜第4の実施形態と同じである。
第1〜第4の実施形態の画像生成部では、選択されたフレーム画像の全体を縮小して合成している。本実施形態では、選択されたフレーム画像の一部を抜き出して合成することが第1〜第4の実施形態と異なる。
現在、一般的な画像サイズは320×240から640×480ほどである。画像の縦、横をそれぞれ同等に大きくすると、画像サイズ(面積)は二乗的に大きくなるため、品質と可搬性を考慮して選択された結果である。
しかし、技術の進歩とともに画像サイズは大きくなり、ハイビジョン画像では1920×1080といった従来の7倍近いサイズとなる。このような大きなサイズの画像の動画から動画サムネイルを作成するには処理に時間がかかる。そこで、フレーム画像の一部を抜き出してサムネイル化することで、処理時間の短縮を図る。従来の画像サイズにも勿論適用できるが、抜き出すサイズによってはサムネイルの品質が劣化するおそれがあるため、ハイビジョン画像のような高解像度の画像に適用することが好適である。
図12では、4枚の選択されたフレーム画像VD〜VDのうち、VD〜VDについては全体を縮小し、VDについては縮小せずに部分画像VD41を抜き出している。部分画像VD41については、顔認識、動体認識などを用いて認識した領域とする。顔認識技術には様々な方法があり、一般的な方法としては、予め顔パターンを登録しておき、それらをサンプルデータの統計的性質を利用し、特定する方法がある。
顔認識を行った場合、部分画像VD41のサイズは認識された顔の範囲により異なるが、縦横比を元画像と等しくしなければならないので、顔の範囲よりも若干広くなる場合がある。また、合成する際に拡大処理が入るとサムネイルの画像品質が劣化するため、そうならないように、抜き出す領域のサイズの下限値を拡大処理が入らない値に調整しておく。
このように抜き出された部分画像VD41を画像VDの代わりに用いて、以後の合成処理を継続し、1枚の動画サムネイルを生成する。
なお、図12では、4枚のフレーム画像のうち、1枚のみに対し抜き出しを行っているが、2枚、3枚、或いは4枚のフレーム画像に対して抜き出しを行ってもよい。また、本実施形態を第4の実施形態と組み合わせ、第4の実施形態において、フレーム画像の縦横比を保持しつつ面積比を変える際に画像全体の縮小では対応できない場合に、画像の一部を抜き出すことで対応可能である。
本実施形態の動画サムネイル作成装置によれば、複数のフレーム画像を1枚のサムネイルとするので、従来の1つのフレーム画像のみからなるサムネイルと比べ、より多くの情報を含むサムネイルを作成することができる。また、選択されたフレーム画像の一部を抜き出し、サムネイル画像を生成するので、フレーム画像内の重要な部分のみを使用し、サムネイルの限られた大きさを有効活用することができる。さらに、サムネイルの生成時間を短縮することができる。また、高解像度動画から動画サムネイルを作成することができる。
11,22,32・・・画像選択部、12,23,33・・・画像生成部、21・・・画像処理部。
特開2004−147204号公報 特開2004−274171号公報

Claims (8)

  1. 動画を構成する複数のフレーム画像である第1の複数のフレーム画像のそれぞれから特徴量を算出する画像処理部と、
    前記画像処理部でそれぞれの前記第1の複数のフレーム画像から算出された特徴量の隣接フレーム間の差分が閾値以上であるか否かを基に、前記動画のシーンのカット点を複数検出するカット点検出部と、
    前記カット点検出部により検出されたカット点に挟まれたシーン毎に、シーンを構成する1以上のフレーム画像から1のフレーム画像を抽出することで、前記第1の複数のフレーム画像から第2の複数のフレーム画像を抽出する画像選択部と、
    前記画像選択部で抽出された第2の複数のフレーム画像の枚数が所定の閾値以上か否か判定する手段と、
    前記判定する手段により所定の閾値以上と判定された場合、前記抽出された第2の複数のフレーム画像それぞれの特徴量を用いて、前記抽出された第2の複数のフレーム画像から目の細かくない順にフレーム画像を前記閾値未満の枚数だけ選択する手段と、
    前記閾値未満の枚数の前記第2の複数のフレーム画像を縮小し合成して、1枚のサムネイルを生成する画像生成部と、
    を有することを特徴とする動画サムネイル作成装置。
  2. 請求項1に記載された動画サムネイル作成装置において、
    前記画像選択部は、前記カット点検出部により検出されたカット点に挟まれたシーン毎の先頭フレーム画像を抽出することで前記第2の複数のフレーム画像を抽出する
    ことを特徴とする動画サムネイル作成装置。
  3. 請求項1に記載された動画サムネイル作成装置において、
    前記画像選択部は、前記カット点検出部により検出されたカット点に挟まれたシーン毎に、シーンを構成する1以上のフレーム画像のそれぞれの前記特徴量に基づいて、平均的な輝度ヒストグラム分布を持つ特徴的なフレーム画像を抽出することで前記第2の複数のフレーム画像を抽出する
    ことを特徴とする動画サムネイル作成装置。
  4. 請求項1〜3のいずれか1項に記載された動画サムネイル作成装置において、
    前記画像生成部は、前記閾値未満の枚数の前記第2の複数のフレーム画像に対して、特徴量である輝度ヒストグラム分布に基づき、該第2の複数のフレーム画像の輝度ヒストグラムの平均と該各フレーム画像の輝度ヒストグラムとの差分に応じて、前記閾値未満の枚数の前記第2の複数のフレーム画像の面積比を変えて合成する
    ことを特徴とする動画サムネイル作成装置。
  5. 請求項1〜のいずれか1項に記載された動画サムネイル作成装置において、
    前記画像生成部は、前記閾値未満の枚数の前記第2の複数のフレーム画像に対して、各フレーム画像の特徴量に基づき、該各フレーム画像の目の細かさに応じて、前記閾値未満の枚数の前記第2の複数のフレーム画像の面積比を変えて合成す
    ことを特徴とする動画サムネイル作成装置。
  6. 請求項1〜のいずれか1項に記載された動画サムネイル作成装置において、
    前記画像生成部は、前記画像選択部で抽出されたフレーム画像の少なくとも1枚については、その一部分を抜き出した部分画像を合成に用いることを特徴とする動画サムネイル作成装置。
  7. 動画サムネイル作成装置により実行される動画サムネイル作成方法であって、
    動画を構成する複数のフレーム画像である第1の複数のフレーム画像のそれぞれから特徴量を算出する画像処理工程と、
    前記画像処理工程でそれぞれの前記第1の複数のフレーム画像から算出された特徴量の隣接フレーム間の差分が閾値以上であるか否かを基に、前記動画のシーンのカット点を複数検出するカット点検出工程と、
    前記カット点検出工程により検出されたカット点に挟まれたシーン毎に、シーンを構成する1以上のフレーム画像から1のフレーム画像を抽出することで、前記第1の複数のフレーム画像から第2の複数のフレーム画像を抽出する画像選択工程と、
    前記画像選択工程で抽出された第2の複数のフレーム画像の枚数が所定の閾値以上か否か判定する工程と、
    前記判定する工程により所定の閾値以上と判定された場合、前記抽出された第2の複数のフレーム画像それぞれの特徴量を用いて、前記抽出された第2の複数のフレーム画像から目の細かくない順にフレーム画像を前記閾値未満の枚数だけ選択する工程と、
    前記閾値未満の枚数の前記第2の複数のフレーム画像を縮小し合成して、1枚のサムネイルを生成する画像生成工程と、
    を有することを特徴とする動画サムネイル作成方法。
  8. コンピュータを、請求項1〜6のいずれか1項に記載された動画サムネイル作成装置として機能させるためのプログラム。
JP2009212914A 2009-09-15 2009-09-15 動画サムネイル作成装置、方法及びプログラム Expired - Fee Related JP5527511B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009212914A JP5527511B2 (ja) 2009-09-15 2009-09-15 動画サムネイル作成装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009212914A JP5527511B2 (ja) 2009-09-15 2009-09-15 動画サムネイル作成装置、方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2011066483A JP2011066483A (ja) 2011-03-31
JP2011066483A5 JP2011066483A5 (ja) 2012-10-04
JP5527511B2 true JP5527511B2 (ja) 2014-06-18

Family

ID=43952304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009212914A Expired - Fee Related JP5527511B2 (ja) 2009-09-15 2009-09-15 動画サムネイル作成装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5527511B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6354206B2 (ja) * 2014-02-27 2018-07-11 ブラザー工業株式会社 情報処理プログラムおよび情報処理装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148771A (ja) * 1998-11-06 2000-05-30 Sony Corp 画像処理装置および方法、並びに提供媒体
JP2004112132A (ja) * 2002-09-17 2004-04-08 Ricoh Co Ltd 撮像方法及び撮像装置
JP2004147204A (ja) * 2002-10-25 2004-05-20 Sharp Corp コンテンツ記録再生装置
JP4066454B2 (ja) * 2003-03-05 2008-03-26 日本電気株式会社 オーサリング機能付き信号処理装置及びオーサリングを含む信号処理方法
JP4536402B2 (ja) * 2004-03-05 2010-09-01 ソニー株式会社 映像再生装置、映像再生方法及びその方法をコンピュータに実行させるためのプログラム
JP4325459B2 (ja) * 2004-03-30 2009-09-02 カシオ計算機株式会社 動画再生装置、及びそのプログラム
JP4373888B2 (ja) * 2004-10-01 2009-11-25 株式会社リコー 画像処理装置、サムネイル表示方法、サムネイル表示プログラム、サムネイル表示プログラムを記録した記録媒体
JP2007267356A (ja) * 2006-03-02 2007-10-11 Sony Corp ファイル管理プログラム、サムネイル画像表示方法および動画再生装置
JP4851839B2 (ja) * 2006-05-09 2012-01-11 シャープ株式会社 記録再生装置、番組表の表示方法
JP2008109305A (ja) * 2006-10-24 2008-05-08 Ricoh Co Ltd 画像処理装置および画像処理装置の制御方法
JP2008199330A (ja) * 2007-02-14 2008-08-28 Canon Inc 動画像管理装置
JP4539884B2 (ja) * 2007-08-06 2010-09-08 Necアクセステクニカ株式会社 再生装置、プログラム及び電子画面を構築する方法
JP5121367B2 (ja) * 2007-09-25 2013-01-16 株式会社東芝 映像を出力する装置、方法およびシステム
JP5067308B2 (ja) * 2007-10-03 2012-11-07 ソニー株式会社 表示制御装置、表示制御方法及び表示制御プログラム

Also Published As

Publication number Publication date
JP2011066483A (ja) 2011-03-31

Similar Documents

Publication Publication Date Title
US8416332B2 (en) Information processing apparatus, information processing method, and program
US8274527B2 (en) Method and apparatus for converting color spaces and multi-color display apparatus using the color space conversion apparatus
Alakuijala et al. JPEG XL next-generation image compression architecture and coding tools
US7085420B2 (en) Text detection in continuous tone image segments
JP4774816B2 (ja) 画像処理装置,画像処理方法,およびコンピュータプログラム。
JP3966691B2 (ja) 連続階調圧縮装置及び方法、データ処理装置及びデバイス、並びに前記方法を実行するプログラムを記録した記録媒体
KR101366596B1 (ko) 이차원 정지 화상에 대해 몰입감을 생성하는 방법 및시스템 그리고 상기 몰입감 생성을 위한 팩터 조절 방법,이미지 콘텐트 분석 방법 및 스케일링 파라미터 예측 방법
JP5525201B2 (ja) 画像合成装置、画像符号化装置、コンピュータプログラム、記録媒体
US7773816B2 (en) Systems and methods for decoding large images
US20120293537A1 (en) Data-generating device, data-generating method, data-generating program and recording medium
JP2000187477A (ja) 画像処理装置及び画像処理方法
US20080198247A1 (en) Image capturing apparatus, image capturing method, and computer program product
JP2004172671A (ja) 動画像加工方法及び装置
JP4078085B2 (ja) 変倍画像生成装置、方法、及びそのコンピュータプログラムとコンピュータ読み取り可能な記憶媒体
JP5527511B2 (ja) 動画サムネイル作成装置、方法及びプログラム
JP4633595B2 (ja) 動画生成装置、動画生成方法、及びプログラム
JP4240098B2 (ja) 画像処理装置及び画像処理方法
WO2011052678A1 (ja) 画像処理装置、画像処理方法、および、画像処理プログラム
JPH08205144A (ja) 画像符号化装置
US8194188B2 (en) Displaying image frames in combination with a subpicture frame
JP2005287006A (ja) 画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体及び画像処理装置
WO2018016434A1 (ja) ダイジェスト映像取得装置、ダイジェスト映像取得方法、および記録媒体
JP2007158703A (ja) 動画生成装置、動画生成方法、及びプログラム
JP2010057080A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5690163B2 (ja) 画像縮小装置、画像拡大装置、画像縮小プログラム、及び画像拡大プログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120817

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120817

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140401

R151 Written notification of patent or utility model registration

Ref document number: 5527511

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees