JP2014170979A - 情報処理装置、情報処理方法および情報処理プログラム - Google Patents

情報処理装置、情報処理方法および情報処理プログラム Download PDF

Info

Publication number
JP2014170979A
JP2014170979A JP2011107103A JP2011107103A JP2014170979A JP 2014170979 A JP2014170979 A JP 2014170979A JP 2011107103 A JP2011107103 A JP 2011107103A JP 2011107103 A JP2011107103 A JP 2011107103A JP 2014170979 A JP2014170979 A JP 2014170979A
Authority
JP
Japan
Prior art keywords
still image
still
relationship
image pair
relevance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011107103A
Other languages
English (en)
Inventor
Masumi Ishikawa
真澄 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011107103A priority Critical patent/JP2014170979A/ja
Priority to PCT/JP2012/061788 priority patent/WO2012153744A1/ja
Publication of JP2014170979A publication Critical patent/JP2014170979A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/802D [Two Dimensional] animation, e.g. using sprites
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00129Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a display device, e.g. CRT or LCD monitor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00458Sequential viewing of a plurality of images, e.g. browsing or scrolling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2104Intermediate information storage for one or a few pictures
    • H04N1/2112Intermediate information storage for one or a few pictures using still video cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2101/00Still video cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0084Digital still camera

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】静止画像間の関連性の変化に応じて静止画像を提示すること。
【解決手段】少なくとも3つの静止画像を含む静止画像群において、静止画像群に含まれる第1静止画像対の静止画像同士の第1関連性と第2静止画像対の静止画像同士の第2関連性とを比較する比較手段と、第1関連性から第2関連性への変化に基づいて、第1静止画像対の提示方法を特定する第1情報から、第2静止画像対の提示方法を特定する第2情報を決定する決定手段と、決定手段で決定した提示方法に基づいて、第1静止画像対および第2静止画像対を含むスライドショーを生成する生成手段と、を備えたことを特徴とする。
【選択図】 図1

Description

本発明は、静止画像の提示方法を決定する技術に関する。
上記の技術分野において、特許文献1に記載の技術が知られている。この技術は、各静止画像の内容に応じた提示時間を実現するスライドショー生成技術である。具体的には、静止画像に含まれる顔の個数によって、その静止画像の提示時間を制御しようとするものである。
また、特許文献2の技術では、スライドショー生成にあたり、静止画像の撮影時刻によって提示時間を制御する。特許文献2では、スライドショーの中で連続する静止画像の提示時間を、静止画像の撮影時刻の差によって決定する。
また、特許文献3の技術では、画像間の関連度を抽出して、この関連度に基づいて視覚効果を与えながらスライドショーの再生を行う(段落0024)。比較すべき2枚の画像を取得し、各画像ごとの関連度を抽出する(段落0063)。関連度が弱い場合には関連度の弱い画像用の、関連度が強い場合には関連度の強い画像用の、視覚効果を付与する(段落0074)。
特許第4593314号公報 特開2006-41586号公報 特開2006-140559号公報
特許文献1、2、3の技術では、少なくとも1つの静止画像の情報を用いて、静止画像の提示方法を決定している。したがって、2つの連続する静止画像の内容の変化を、提示方法の変化によって表している。しかし、連続する2つの静止画像の関連性が変わらない場合は、提示方法を変化させることはなかった。
本発明の目的は、上述の課題を解決する技術を提供することにある。
上記目的を達成するため、本発明に係る装置は、
少なくとも3つの静止画像を含む静止画像群において、前記静止画像群に含まれる第1静止画像対の静止画像同士の第1関連性と第2静止画像対の静止画像同士の第2関連性とを比較する比較手段と、
前記第1関連性から第2関連性への変化に基づいて、前記第1静止画像対の提示方法を特定する第1情報から、前記第2静止画像対の提示方法を特定する第2情報を決定する決定手段と、
前記決定手段で決定した提示方法に基づいて、前記第1静止画像対および前記第2静止画像対を含むスライドショーを生成する生成手段と、
を備えたことを特徴とする。
上記目的を達成するため、本発明に係る方法は、
少なくとも3つの静止画像を含む静止画像群において、前記静止画像群に含まれる第1静止画像対の静止画像同士の第1関連性と第2静止画像対の静止画像同士の第2関連性とを比較する比較ステップと、
前記第1関連性から第2関連性への変化に基づいて、前記第1静止画像対の提示方法を特定する第1情報から、前記第2静止画像対の提示方法を特定する第2情報を決定する決定ステップと、
前記決定ステップで決定した提示方法に基づいて、前記第1静止画像対および前記第2静止画像対を含むスライドショーを生成する生成ステップと、
を含むことを特徴とする。
上記目的を達成するため、本発明に係るプログラムは、
少なくとも3つの静止画像を含む静止画像群において、前記静止画像群に含まれる第1静止画像対の静止画像同士の第1関連性と第2静止画像対の静止画像同士の第2関連性とを比較する比較ステップと、
前記第1関連性から第2関連性への変化に基づいて、前記第1静止画像対の提示方法を特定する第1情報から、前記第2静止画像対の提示方法を特定する第2情報を決定する決定ステップと、
前記決定ステップで決定した提示方法に基づいて、前記第1静止画像対および前記第2静止画像対を含むスライドショーを生成する生成ステップと、
をコンピュータに実行させることを特徴とする。
本発明によれば、静止画像間の関連性の変化に応じて静止画像を提示することができる。
本発明の第1実施形態に係る情報処理装置の構成を示すブロック図である。 本発明の第2実施形態に係る情報処理装置の構成を示すブロック図である。 本発明の第2実施形態に係る情報処理装置のスライドショー生成を説明する図である。 本発明の第2実施形態に係る情報処理装置の処理の流れを示すフローチャートである。 本発明の第2実施形態に係る情報処理装置のスライドショー生成を説明する図である。 本発明の第2実施形態に係る情報処理装置のスライドショー生成を説明する図である。 本発明の第3実施形態に係る情報処理装置のスライドショー生成を説明する図である。 本発明の第3実施形態に係る情報処理装置のスライドショー生成を説明する図である。 本発明の第3実施形態に係る情報処理装置のスライドショー生成を説明する図である。 本発明の第4実施形態に係る情報処理装置の処理の流れを示すフローチャートである。 本発明の第4実施形態に係る情報処理装置のスライドショー生成を説明する図である。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
[第1実施形態]
本発明の第1実施形態としての情報処理装置100について、図1を用いて説明する。情報処理装置100は、少なくとも3つの静止画像を含むスライドショーを生成する装置である。
情報処理装置100は、関連性比較部101と提示方法決定部102とスライドショー生成部103とを含む。
関連性比較部101は、少なくとも3つの静止画像を含む静止画像群において、前記静止画像群に含まれる第1静止画像対の静止画像同士の第1関連性と第2静止画像対の静止画像同士の第2関連性とを比較する。
提示方法決定部102は、第1関連性から第2関連性への変化に基づいて、第1静止画像対の提示方法を特定する第1情報から、第2静止画像対の提示方法を特定する第2情報を決定する。
スライドショー生成部103は、提示方法決定部102で決定した提示方法に基づいて、第1静止画像対および第2静止画像対を含むスライドショーを生成する。
以上の構成によれば、静止画像間の関連性の変化に応じて静止画像を提示するスライドショーを生成することができる。
[第2実施形態]
次に本発明の第2実施形態に係る情報処理装置200について、図2を用いて説明する。図2は、本実施形態に係る情報処理装置200の構成を説明するためのブロック図である。
(構成)
情報処理装置200は、デジタルカメラやデジタルビデオカメラなどの撮像装置250から画像情報を入力する画像入力部210と、入力した画像の関連性を比較する関連性比較部201と関連性を決定する関連性決定部204とを含む。また、情報処理装置200は、スライドショーに含まれる各画像の表示長さ、画像切替時のエフェクト、表示中のBGM(背景音楽)、切替時のジングルなどを決定する提示方法決定部202を含む。さらに情報処理装置200は、提示方法決定部202が決定した提示方法によって入力した静止画を組み合わせてスライドショーを生成するスライドショー生成部203を含む。情報処理装置200は、また、静止したスライドショーを表示するためのディスプレイ260に接続されている。
画像入力部210が入力する画像情報は、静止画像を識別する画像ID、スライドショー内での提示順位、静止画像の画素情報を含む。また、画像情報は、静止画像内に映っている被写体、撮影場所、撮影時刻を記述したメタ情報や、GPS等のセンサ情報を含んでもよい。
関連性決定部204は、第1関連性を、第1静止画像対に含まれる2つの静止画像に表わされた対象の共通性によって決定し、第2関連性を、第2静止画像対に含まれる2つの静止画像に表わされた対象の共通性によって決定する。第1静止画像対および第2静止画像対は、それぞれ連続する静止画像の対である。
関連性決定部204は、画像関連性情報として、静止画像の画像IDと関連性フラグを関連性比較部201に入力する。画像関連性情報として、上記に加えて画素情報を入力してもよい。関連性フラグとは、あらかじめ規定された関連性種別のうち、現在の静止画像とその後に提示される静止画像との間に存在する関連性種別、あるいはいずれの関連性種別も存在しない(関連性が無い)ことを示すデータである。関連性フラグは、ある静止画像とその後の静止画像との間に存在する全関連性種別にフラグ1を設定し、存在しない関連種別にフラグ0を設定する。あるいは、関連性種別に応じて意味を持つ任意の数値を設定してもよい。
関連性比較部201は、静止画像群に含まれる第1静止画像対の静止画像同士の第1関連性と第2静止画像対の静止画像同士の第2関連性とを比較する。具体的には、スライドショー内で連続する静止画像対の間の関連性を判定する。より具体的には、静止画像群は連続する第1、第2、第3静止画像を含み、第1静止画像対は、第1静止画像と第2静止画像の対であり、第2静止画像対は、第2静止画像と第3静止画像の対である。
提示方法決定部202は、関連性比較部201から入力された画像関連性情報と、画像入力部210から入力される画像情報と、あらかじめ登録された提示ルールをもとに、各静止画像の提示方法を決定し、提示方法情報をスライドショー生成部203に入力する。
スライドショー生成部203は、決定された提示方法に基づいて、静止画像を組み合わせてスライドショーを生成する。
(関連性決定方法)
以下に、関連性決定部204における関連性の決定方法について説明する。関連性種別としては様々なものが考えられるが、本実施形態では、一例として、下記の対象の同一性について説明する。
関連性1.対象の同一性
関連性決定部204は、関連性を、静止画像対に含まれる2つの静止画像に表わされた対象の共通性(同一性)によって決定する。このように決定された関連性を関連性1と称する。同一性は、静止画像群に含まれる複数の静止画像から導き出される特徴量の共通性によって判断できる。
すなわち、関連性1は、スライドショー内で連続する静止画像対に映っている対象が同一であることを示す関連性である。関連性1についての関連性フラグには、同一の場合に1を、同一でない場合には0を設定する。対象の同一性は、静止画像から検出された対象領域画像の類似性をもとに判定できる。対象領域は、木や建物のような静止物体、あるいは、人間や動物のような動物体のように、ある画像的なパターンを持った対象の静止画像上での領域であり、静止画像中の部分領域であってもよいし、静止画像全体であってもよい。
関連性決定部204は、スライドショー内で連続する静止画像対から対象領域を検出し、対象領域の類似性で対象の同一性を判定する。あるいは、スライドショーに含まれる全静止画像から検出した対象領域の間の類似性をもとに判定してもよい。この場合、検出された全対象領域を類似性に基づいてグループ化し、隣接する静止画像対から検出された対象領域が同じグループに属する場合には同一の対象と判定する。
対象領域の検出手法は、あらかじめ登録された特定対象を検出する場合と、登録されていない一般対象を検出する場合とに分けられる。特定対象を検出する場合は、登録された各対象の画像データをテンプレートとし、様々な解像度に変換したテンプレートで入力画像を走査し、テンプレートと同じ位置の画素値の差分が小さい領域を対応する対象領域として検出してもよい。
あるいは、入力画像の各部分領域から色・テクスチャ・形状を表現する画像特徴量を抽出し、登録された各対象の画像特徴量と類似した画像特徴量をもつ部分領域を対応する対象領域としてもよい。また、特定対象が人物の場合には、顔全体から得られる情報を利用する手法がある。例えば様々な顔の映っている画像をテンプレートとして記憶し、入力画像とテンプレートの差分がある閾値以下のとき顔が入力画像中に存在すると判定する手法が挙げられる。また、肌色などの色情報や、エッジの方向や密度を組み合わせたモデルをあらかじめ記憶しておき、入力フレームからモデルに類似した領域が検出された場合に顔が存在すると判定する手法が考えられる。また、顔(頭部)の輪郭を楕円、目や口を細長の形状をしていることを利用して作成したテンプレートを用いて顔検出を行う手法もある。さらに、頬や額の部分は輝度が高く、目や口の部分の輝度は低いという輝度分布の特性を利用して顔検出手法や、顔の対称性や肌色領域と位置を利用して顔検出を行う手法などの手法が挙げられる。
また、大量の人物顔と非顔の学習サンプルから得られた特徴量分布を統計的に学習し、入力画像から得られる特徴量が顔と非顔のどちらの分布に属するかを判定する手法として、ニューラルネットやサポートベクターマシン、AdaBoost法などを利用した手法が挙げられる。また一般対象を検出する場合は、例えばNormalized Cutや、Saliency Mapや、Depth of Field(DoF)などを用いてもよい。Normalized Cutは、画像を複数の領域に分割する手法である。詳しくは、Jianbo Shi and Jitendra Malik, “Normalized Cuts and Image Segmentation”, IEEETransactions on Pattern Analysis and Machine Intelligence, vol.22, No.8, August2000に開示がある。Normalized Cutにより分割された領域のうち、画面中央に位置する領域を対象領域として検出してもよい。
また、Saliency Mapは画像中の物体領域を視覚注意から算出する方法である。Saliency Mapについては、L.Itti, C.Koch and E.Niebur,“ A Model of Saliency-based Visual Attention for Rapid Scene Analysis, ”IEEE Trans. Pattern Analysis and Machine Intelligence, Vol.20, No.11, pp.1254-1259, 1998に開示がある。Saliency Mapにより高い重要度が算出された領域を対象領域として検出してもよい。また、Dofは、被写界深度内に存在する対象のエッジにはボケがなく、被写界深度外のエッジにボケが発生する特性に基づく手法である。詳しくは、3Du-Ming Tsai, Hu-Jong Wang, “Segmenting focused objects in complex visual images”, Pattern Recognition Letters, Vol.19, pp.929 940, 1998.に開示がある。エッジの太さをもとにボケ量を算出し、ボケの少ないエッジを結合し、焦点が合っている領域を対象領域として検出してもよい。
静止画像中の位置または視認性の高さ(照明条件、向き、角度、画面上での位置、他の対象による隠れ、ボケ、(人物の場合には)表情、等に基づく映りの良さを示す評価値)または複数画像での出現頻度をもとに静止画像につき1つの対象領域を検出してもよい。また、検出された複数の対象領域を組み合わせて1つの対象領域としてもよい。対象領域間の類似度は、画像特徴量を抽出し、画像特徴量の差が小さいほど高い値を算出する尺度をもとに算出してもよい。画像特徴量は、対象領域から検出された色、エッジ、テクスチャ等の画像情報をもとに算出できる。あるいは、各対象の画像領域からSIFT等の局所特徴点を検出し、画像領域間で特徴点を対応づけ、対応づけられた特徴点の個数が多い、もしくは、対応づけられた特徴点の位置関係が画像間で似ているほど高い値を算出する尺度を用いてもよい。
(提示方法)
提示方法決定部202は、関連性の変化が無い場合、第1静止画像対における提示方法の変化と同様に、第2静止画像対における提示方法が変化するように第1提示方法情報から第2提示方法情報を決定する。例えば、関連性変化が無い場合、第1静止画像対における提示時間の変化と同様に、第2静止画像対において提示時間が変化するように、提示方法情報を決定する。
提示方法情報とは、各静止画像の提示方法を示すデータであり、画像IDと提示時間を含むものとする。提示方法情報として、上記に加えてエフェクト、BGM、音響ジングル、映像ジングルを保持してもよい。提示ルールとは、関連性種別に応じた静止画像の提示方法を規定するルールである。提示ルールとして、連続する静止画像対の各提示時間を規定するパラメータを保持するものとする。また、提示時間に加えて、静止画像の間に挿入するエフェクトやBGM、ジングル(短い映像や音楽、効果音)に関する制御パラメータを保持してもよい。また、連続する静止画像対にいずれの関連性種別も存在しない場合の提示方法を規定してもよい。
本実施形態では、連続する静止画像対に含まれる対象の同一性をもとに、静止画像対の提示時間を決定する。
例えば、連続する静止画像対に含まれる対象が同一の場合には、はじめに提示される静止画像の提示時間を初期値Tsとし、Tsを基準に後続の静止画像の提示時間を決定する。連続する静止画像対に含まれる対象が同一でない場合には、前の静止画像の提示時間と独立に後続の提示時間を決定する。後続の提示時間としては、例えば、初期値Tsに設定してもよいし、規定範囲内のランダムな値に設定してもよい。
なお、同一の対象を撮影した静止画像群のうち、視認性の高い静止画像の提示時間をTpとし、Tpを基準に後続の静止画像の提示時間を決定してもよい。また、同一の対象を撮影した静止画像群のうち、静止画像の提示時間がTq以下になった次の静止画像の提示時間を初期値Tsとし、Tsを基準に後続の静止画像の提示時間を決定してもよい。また、同一の対象を撮影した静止画像群のうち、最後に提示される静止画像の提示時間を初期値Tsに設定してもよい。Ts,Tpの値は、あらかじめ設定されたスライドショー全体の提示時間を考慮して、提示する画像数に応じて算出してもよい。
図3を用いて、様々な向きの人物Aを撮影した静止画像群を再生させる場合について説明する。ある静止画像の提示時間に対するパラメータaの乗算によって、後続の静止画像の提示時間を算出する。このとき、始めの静止画像301の提示時間を初期値Tsとすると、後続の静止画像302〜305の提示時間は以下の式(1)で表わされる。
Figure 2014170979
さらに、正面を向いた静止画像303で視認性の評価値が閾値以上の場合、静止画像303の提示時間はTp、後続の静止画像の提示時間は以下の式(2)で表わされる。
Figure 2014170979
パラメータaを0から1の間に設定すると、人物Aを含む静止画像のうち初めに提示された静止画像301と人物Aの映りがよい静止画像303は長く提示され、その他のAを含む静止画像302、303から遠ざかるに従って徐々に短く提示される。これにより、利用者は、対象が初めて登場した瞬間や映りのよい静止画像の内容を理解し、その他の画像は理解した内容とほぼ同様の内容が映っていると理解することができるという効果がある。また、同じ対象を含む画像であっても連続する画像の提示時間が変化する映像を生成できるため、視聴者を飽きさせないテンポ感あるスライドショーが生成できるという効果がある。
提示方法決定部202は、また、連続する静止画像対に含まれる対象の同一性をもとに、静止画像対の間に挿入するエフェクト・BGM・ジングルを決定する。例えば、連続する静止画像対に含まれる対象が同一の場合には、静止画像の切り替え時に視覚的な変化の少ないエフェクトとしてあらかじめ登録された特殊効果(ディゾルブやフェード等)を挿入する。同一でない場合には、静止画像の切り替え時に視覚的な変化の大きいエフェクトとしてあらかじめ登録された特殊効果(ページめくり、ワイプ等のDVE)を挿入する。エフェクト・ジングルの長さを徐々に短く(長く)する。BGMの音量を徐々に小さく(大きく)する。
また例えば、連続する静止画像対に含まれる対象が同一の場合には、静止画像対の提示中同じBGMを流し、同一でない場合には、静止画像の切り替え時にBGMを止めるもしくは異なるBGMに切り替える。また、同一性が存在しない画像間に、ジングルを挿入してもよい。これにより、同一の対象を撮影した静止画像群は、画像や音響的な変化がなく滑らかに接続される。そのため、視聴者は、静止画像が互いに変化がなくほぼ同じ内容であることを容易に理解できる。また、同一の対象でない場合には、画像や音響的な変化が大きく変化するために、視聴者は内容に変化があったことに気づきスライドショーの内容理解に集中することができる。
(動作)
次に、図4のフローチャートを参照して、本実施の形態の動作について詳細に説明する。ここでは一例として図5に示す静止画像501〜513を昇順に再生するスライドショーを生成する場合を考える。このスライドショーは、建物の中にある温室で、花と人物とを撮影した出来事を伝えるものである。関連性決定部204によって各静止画像から検出される対象領域を図5に矩形で示す。
また、提示ルールとして、対象領域が同一である静止画像対については大小関係もしくは部分関係に基づくルールを用い、対象領域が同一でない静止画像対については同種性に基づくルールを用いて提示方法を制御する。なお、大小関係、部分関係、同種性に基づくルールについては、第3実施形態以降に詳しく説明する。
まず、画像入力部210は、静止画像501の画像情報を関連性決定部204に入力してステップS403に進む。入力した静止画像が開始画像であれば、ステップS403からステップS401に戻り、画像入力部210は、関連性決定部204に2枚目の静止画像502の画像情報を入力する(ステップS403)。
次にステップS405において、関連性決定部204は、静止画像501、502から対象領域を検出する。関連性決定部204には、対象としてあらかじめ建造物・草花・人が登録されており、それぞれのモデルが学習されているものとする。そして、静止画像501、502からそれぞれ、建造物の対象領域として実線矩形で囲まれた箇所を検出する。
関連性決定部204は、対象領域0および対象領域1の画素情報から画像特徴量を抽出し、領域間の類似性をもとに同一性・大小関係・部分関係・同種性を判定する。対象領域0と1は、建造物の種別として検出されているため、同種性ありとなる。また、静止画像501上の破線矩形の領域が、対象領域1と対象領域0の共通領域として検出され、対象領域1と0は大小関係にあることが分かる。また共通領域以外の領域が対象領域0上には存在しないため、部分関係の関係性はないと判定される。よって、静止画像501における静止画像502との間の関連性フラグは、同一性・大小関係・部分関係・同種性の順に1、−1、0、1となる(ステップS407)。
提示方法決定部202は、画像関連性情報として、画像IDと関連性フラグをもとに提示方法を決定する。静止画像501と静止画像502の対象領域は同一のため、大小関係もしくは部分関係に基づくルールを適用する。開始画像である静止画像501の提示時間は初期値Ts、静止画像501、502の大小関係が小・大の関係であるため、静止画像502の提示時間は、a*Tsとする。また、静止画像501、502に大小関係があることから、静止画像501、502の切り替わりのエフェクトとして視覚的変化の少ないディゾルブを挿入する(ステップS409)。
スライドショー生成部203は、決定した提示時間・エフェクトで、静止画像501、502を用いてスライドショーを生成する(ステップS411)。上記のステップをすべての静止画像について行う(ステップS413)。
静止画像から検出される対象領域の種別601、各関連性種別に対する関連性フラグ602、提示方法決定部202によって決定される提示時間長603およびエフェクト604を図6に示す。
以上、本実施形態によれば、連続する静止画像の提示方法を、互いの関連性に応じて制御するため、連続する静止画像が異なる個数の顔画像を含む場合であっても、互いに内容的な意味に関連性がある場合には、関連性があることを視聴者に提示できる。
また、連続する静止画像が同じ個数の顔画像を含む場合であっても、互いに内容的な意味に関連性がない場合には、関連性がないことを視聴者に提示できる。
さらに、様々な時間間隔で撮影された静止画像群についても、静止画像の間に関連性がある場合には、関連性があることを視聴者が理解しやすい方法で提示できる。
一定の時間間隔で撮影された静止画像群についても、互いに内容的な意味に関連性がない場合には、関連性がないことを視聴者が理解しやすい方法で提示できる。
[第3実施形態]
第2実施形態に開示した関連性に代えて、あるいは加えて以下の関連性のいずれか1つの変化に応じて提示方法を変更し、以下の提示ルールのいずれか1つを採用してもよい。
(関連性2. 対象の大小関係)
関連性決定部204は、関連性を、静止画像対に含まれる2つの静止画像に表わされた対象の大小関係によって決定してもよい。つまり、静止画像対に含まれる2つの静止画像において、あらかじめ登録された特定対象が含まれている領域の大きさの変化によって関連性を決定してもよい。このように決定された関連性を関連性2と称する。
「対象の大小関係にある」とは、スライドショー内で連続する静止画像対に含まれる対象が同一であり、かつ対象領域の面積に規定値以上の差があることである。例えば、対象の周囲を含んだ画像と、対象のみを撮影した画像を組み合わせてスライドショーを生成することで、対象を紹介するケースがある。
対象の大小関係は、同一と判定された対象領域に共通する部分領域の面積、または共通する部分領域に含まれる特徴点間の距離によって判定できる。例えば、特徴点間の距離が大であるほど対象が大きく撮影されていると判定できる。スライドショー内で連続する静止画像対の間で同一と判定された対象領域の間で判定してもよい。この場合、関連性2についての関連性フラグには、ある静止画像中の対象領域の面積よりもその次の静止画像中の対象領域の面積の方が大きい場合には1を、小さい場合には−1を、大小関係が存在しない場合には0を設定する。あるいは、スライドショーに含まれる全静止画像から検出された対象領域のうち同一と判定された対象領域に共通する部分領域の面積もしくは特徴点間距離を比較して決定してもよい。例えば、同一と判定された対象領域に共通する部分領域の最大面積Smaxと最小面積Sminをもとに、(Smax+2Smin)/3よりも小さい同一の対象領域を小、(Smax+2Smin)/3 よりも大きく(2Smax+Smin)/3より小さい同一の対象領域を中、(2Smax+Smin)/3よりも大きい同一の対象領域を大とする。この場合、関連性フラグには、ある静止画像中の対象領域とその次の静止画像中の対象領域とが、小と中もしくは中と大の関係であれば1を、小と大の関係であれば2を、大と中もしくは中と小の関係であれば−1を、大と小の関係であれば−2を、大小関係が存在しない場合に0を設定する。
大から小への対象の変化が連続した場合には、関連性の変化は無いものとして、同様の提示方法の変更を行なう。例えば、同じ時間間隔で徐々に提示時間を短くしていく。詳しくは以下のルールに基づいて提示方法を制御する。
〔対象の大小関係に応じたルール〕
(2−1)提示時間に関するルール
連続する静止画像対に含まれる対象の大小関係をもとに、静止画像対の提示時間を決定する。例えば、対象の大小関係にある静止画像群のうち、はじめに提示される静止画像の提示時間を初期値Tsとし、Tsを基準として後続の静止画像の提示時間を決定する。また、対象の大小関係にある静止画像群のうち、視認性の高い静止画像の提示時間をTpとし、Tpを基準に後続の静止画像の提示時間を決定してもよい。また、大小関係にある静止画像群のうち、静止画像の提示時間がTq以下になった次の静止画像の提示時間を初期値Tsとし、Tsを基準に後続の静止画像の提示時間を決定してもよい。また、大小関係にある静止画像群のうち最後に提示される静止画像の提示時間をTsに設定してもよい。Ts,Tpの値は、あらかじめスライドショー全体の提示時間を設定しておき、提示する画像数に応じて算出してもよい。また、連続する静止画像対に含まれる対象に大小関係がない場合には、前の静止画像の提示時間と独立に後続の提示時間を決定する。例えば、初期値Tsに設定してもよいし、規定範囲内のランダムな値に設定してもよい。
図7を用いて様々な大きさの対象Bを撮影した静止画像を再生させる場合について説明する。連続する静止画像間の大小関係は、スライドショーに含まれる全静止画像から検出された対象領域のうち同一と判定された対象領域の間の面積を比較して決定したとする。また、ある静止画像の提示時間に対し、関連性フラグ分パラメータaを乗算させることで、次の静止画像の提示時間を算出するとする。このとき、始めの静止画像701の提示時間を初期値Ts、静止画像701、702は小と中の関係、静止画像702、703は中と大の関係、静止画像703、704は大と小の関係とする。このとき、静止画像701、702の関連性フラグが1のため、静止画像702の提示時間はaTsとなる(aの乗算)。さらに静止画像703の関連性フラグが1のため、静止画像703の提示時間はa×a×Tsとなる(aの乗算)。静止画像703、704の関連性フラグは−2のため、704の提示時間はTsとなる(a×aの除算)。パラメータaを0から1の間に設定すると、対象Bが小さく撮影された静止画像(ロングショット)が長く、対象Bがより大きく撮影された静止画像(ミドルショット、タイトショット)は短く提示される。
これにより、利用者は、対象B以外の情景が映りこんだ情報量の多い静止画像について内容を理解し、以降の内容が前の静止画像の一部分であることを直感的に理解することができる。また、同じ対象を含む画像であっても、連続する画像の提示時間が変化する映像を生成することができるため、視聴者を飽きさせないテンポ感あるスライドショーが生成できるという効果がある。
(2−2)エフェクト・BGM・ジングルに関するルール
連続する静止画像対に含まれる対象の大小関係をもとに、静止画像対の間に挿入するエフェクト・BGM・ジングルを決定する。例えば、連続する静止画像対に含まれる対象が大小関係にある場合には、静止画像の切り替え時に視覚的な変化の少ないエフェクトとしてあらかじめ登録された特殊効果(ディゾルブやフェード等)を挿入する。大小関係にない場合には、静止画像の切り替え時に視覚的な変化の大きいエフェクトとしてあらかじめ登録された特殊効果(ページめくり、ワイプ等のDVE)を挿入する。また例えば、連続する静止画像対に含まれる対象が大小関係にある場合には、静止画像対の提示中同じBGMを流し、同一でない場合には、静止画像の切り替え時にBGMを止めるもしくは異なるBGMに切り替える。
また、大小関係が存在しない画像間に、ジングルを挿入してもよい。これにより、大小関係の対象を撮影した静止画像群は、画像や音響的な変化がなく滑らかに接続される。そのため、視聴者は、静止画像が互いに変化がなくほぼ同じ内容であることを容易に理解できる。また、大小関係に無い場合には、画像や音響的な変化が大きく変化するために、視聴者は内容に変化があったことに気づきスライドショーの内容理解に集中することができる。
(関連性3. 対象の部分関係)
関連性決定部204は、関連性を、静止画像対に含まれる2つの静止画像に表わされた対象の部分関係によって決定してもよい。つまり、静止画像対に含まれる2つの静止画像に表わされた対象が全体と部分との関係にあるかによって決定してもよい。このように決定された関連性を関連性3と称する。
「対象の部分関係にある」とは、対象スライドショー内で連続する静止画像対に映っている対象が同一であり、かつ互いに異なる対象の部分を撮影した画像となっている関係を示す。例えば、広い景色や、大きな対象や、長い対象を撮影したい場合に、対象の一部を撮影した静止画像を組み合わせてスライドショー再生することで全体を表現するケースがこれにあたる。
関連性3についての関連性フラグには、ある静止画像中の対象領域とその次の静止画像中の対象領域とが対象の部分関係にある場合には1を、対象の部分関係でない場合には0を設定する。対象の部分関係は、スライドショー内で連続する静止画像中の同一と判定された対象領域に共通する部分領域(共通領域)をもとに判定できる。例えば、対象領域の一方をテンプレートとし、もう一方の対象領域を走査して差分の少ない位置を検出し重なった領域を共通領域とする。各対象領域の共通領域以外の領域がどちらも規定面積以上の場合に、対象の部分関係と判定する。あるいは、スライドショーに含まれる全静止画像から同一と判定された対象領域の相対的な位置をもとに判定してもよい。
全体から部分への対象の変化が連続した場合には、関連性の変化は無いものとして、例えば、同じ時間間隔で徐々に提示時間を短くしていく。詳しくは以下のルールに基づいて提示方法を制御する。
〔対象の部分関係に応じたルール〕
(3−1)提示時間に関するルール
連続する静止画像対に含まれる対象の部分関係をもとに、静止画像対の提示時間を決定する。例えば、対象の部分関係にある静止画像群のうち、はじめに提示される静止画像の提示時間を初期値Tsとし、Tsを基準として後続の静止画像の提示時間を決定する。また、対象の部分関係にある静止画像群のうち、視認性の高い静止画像の提示時間をTpとし、Tpを基準に後続の静止画像の提示時間を決定してもよい。また、部分関係にある静止画像群のうち、静止画像の提示時間がTq以下になった次の静止画像の提示時間を初期値Tsとし、Tsを基準に後続の静止画像の提示時間を決定してもよい。また、部分関係にある静止画像群のうち、最後に提示される画像の提示時間をTsに設定してもよい。Ts,Tpの値は、あらかじめスライドショー全体の提示時間を設定しておき、提示する画像数に応じて算出してもよい。連続する静止画像対に含まれる対象に部分関係がない場合には、前の静止画像の提示時間と独立に後続の提示時間を決定する。例えば、初期値Tsに設定してもよいし、規定範囲内のランダムな値に設定してもよい。
図8を用いて、風景を撮影した静止画像を再生した静止画像を再生させる場合について説明する。連続する静止画像間の部分関係は、スライドショーに含まれる全静止画像から検出された対象領域のうち同一と判定された対象領域の間で共通する部分領域と、対象領域との位置関係をもとに判定したとする。また、ある静止画像の提示時間に対して規定パラメータを乗算させることで、次の静止画像の提示時間を算出するとする。
始めの静止画像801の提示時間を初期値Tsとする。静止画像801と802、802と803は部分関係があり、静止画像803と804とは部分関係がない。このとき、始めの静止画像801の提示時間を初期値Tsとすると、静止画像801、802の関連性フラグが1のため、静止画像802の提示時間はa×Tsとなる。さらに静止画像802、803の関連性フラグがまたも1のため、静止画像803の提示時間はa2Tsとなる。静止画像803と804の関連性フラグは0のため、静止画像804の提示時間を初期値にもどしてTsとする。
パラメータaは、0から1の間で、かつ、静止画像間で一致する部分領域の面積が大であるほど小さい値を設定すると、風景について初めて提示される静止画像801が長く提示され、その他の部分は前に提示された画像との重複する情報量に応じた提示時間で提示される。これにより、利用者は、風景について始めに提示された静止画像について内容を理解し、以降の内容が始めの静止画像とほぼ同等の内容であることを理解することができる。また、同じ対象を含む画像であっても、連続する画像の提示時間が変化する映像を生成することができるため、視聴者を飽きさせないテンポ感あるスライドショーが生成できるという効果がある。
(3−2) エフェクト・BGM・ジングルに関するルール
連続する静止画像対に含まれる対象の部分関係をもとに、静止画像対の間に挿入するエフェクト・BGM・ジングルを決定する。例えば、連続する静止画像対に含まれる対象が部分関係にある場合には、静止画像の切り替え時に視覚的な変化の少ないエフェクトとしてあらかじめ登録された特殊効果(ディゾルブやフェード等)を挿入する。部分関係にない場合には、静止画像の切り替え時に視覚的な変化の大きいエフェクトとしてあらかじめ登録された特殊効果(ページめくり、ワイプ等のDVE)を挿入する。また例えば、連続する静止画像対が対象の部分関係にある場合には、静止画像対の提示中同じBGMを流し、同一でない場合には、静止画像の切り替え時にBGMを止めるもしくは異なるBGMに切り替える。また、大小関係が存在しない画像間に、ジングルを挿入してもよい。これにより、連続する静止画像対が対象の部分関係にある場合、画像や音響的な変化がなく滑らかに接続される。そのため、視聴者は、静止画像が互いに変化がなくほぼ同じ内容であることを容易に理解できる。また、部分関係にない場合には、画像や音響的な変化が大きく変化するために、視聴者は内容に変化があったことに気づきスライドショーの内容理解に集中することができる。
(関連性4. 対象の同種性)
関連性決定部204は、関連性を、静止画像対に含まれる2つの静止画像に表わされた対象が同種か否かによって決定してもよい。このように決定された関連性を関連性4と称する。
「対象が同種である」とは、スライドショー内で連続する静止画像対に映っている主要な対象が、互いに同じ種別の対象であることとする。関連性4についての関連性フラグには、ある静止画像中の対象領域とその次の静止画像中の対象領域とが同種の関係にある場合には1を、異種の場合には0を設定する。対象の同種性は、同種性を判別したい各種別に属する対象の画像データ(登録データ)をもとに、機械学習に基づく方法で実現できる。まず登録データから各種別に属する対象の画像特徴量を抽出する。画像特徴量として、色ヒストグラムやエッジヒストグラム等の大域特徴を用いてもよいし、HoGやSIFT等の局所特徴量を用いてもよい。大域特徴を用いてSVMやニューラルネットワークやGMM等で学習を行う、あるいは、局所特徴量からBoW(Bag of Words)のように特徴量空間の変換を行った上で学習を行ってもよい。スライドショーに含まれる各静止画像中の対象領域について同種性を判別する際は、各対象領域の画像特徴量と、学習の結果得られた各種別のモデルとの間でそれぞれ類似性を求め、対象領域を規定値以上の類似度を得た最も近いモデルの種別と判定する。同じ種別と判定された対象領域を同種と判定する。同種性は、上記以外の方法で判定しても構わない。
同種の対象を含む画像が3つ連続した場合には、関連性の変化は無いものとして、例えば、同じ時間間隔で徐々に提示時間を短くしていく。詳しくは以下のルールに基づいて提示方法を制御する。
〔対象の同種性に応じたルール〕
(4−1)提示時間に関するルール
連続する静止画像対に含まれる対象の同種性をもとに、静止画像対の提示時間を決定する。例えば、同種の対象を含む静止画像群のうち、はじめに提示される静止画像の提示時間を初期値Tsとし、Tsを基準として後続の静止画像の提示時間を決定する。また、同種の対象を含む静止画像群のうち、視認性の高い静止画像の提示時間をTpとし、Tpを基準に後続の静止画像の提示時間を決定してもよい。また、同種の対象を含む静止画像群のうち、静止画像の提示時間がTq以下になった次の静止画像の提示時間を初期値Tsとし、Tsを基準に後続の静止画像の提示時間を決定してもよい。また、同種の対象を含む静止画像群のうち、最後に提示される画像の提示時間をTsに設定してもよい。Ts,Tpの値は、あらかじめスライドショー全体の提示時間を設定しておき、提示する画像数に応じて算出してもよい。連続する静止画像対に含まれる対象が同種でない場合には、前の静止画像の提示時間と独立に後続の提示時間を決定する。例えば、初期値Tsに設定してもよいし、規定範囲内のランダムな値に設定してもよい。
図9を用いて、花を撮影した静止画像を再生した静止画像を再生させる場合について説明する。連続する静止画像間の同種性は、機械学習に基づく方法で判定したとする。また、ある静止画像の提示時間に対して、関連性フラグ分のパラメータを乗算させることで、次の静止画像の提示時間を算出する。始めの静止画像901の提示時間を初期値Tsとする。静止画像901、902、静止画像902、903は同種、静止画像903、904は異種の関係である。このとき、始めの静止画像901、902の関連性フラグが1のため、静止画像902の提示時間はa×Tsとなる。さらに静止画像902、903の関連性フラグが1のため、静止画像903の提示時間はa2Tsとなる。静止画像903、904の関連性フラグは0のため、静止画像904の提示時間を初期値にもどしてTsとする。パラメータaを0から1の間に設定すると、植物を含む静止画像のうち初めてに提示された静止画像901が長く提示され、後続の静止画像は901から離れるほど短い提示時間で提示される。これにより、利用者は、始めに提示された静止画像から画像内容が植物であることを理解し、以降の静止画像の内容がほぼ同等であることを理解することができる。
また、同じ対象を含む画像であっても、連続する画像の提示時間が変化する映像を生成することができるため、視聴者を飽きさせないテンポ感あるスライドショーが生成できるという効果がある(花畑で撮影した複数の花の画像を、同種の被写体を順に再生することでこの種の被写体が沢山存在したことを表現できる)。
(4−2)エフェクト・BGM・ジングルに関するルール
連続する静止画像対に含まれる対象の同種性をもとに、静止画像対の間に挿入するエフェクト・BGM・ジングルを決定する。例えば、連続する静止画像対に含まれる対象が同種の場合には、静止画像の切り替え時に視覚的な変化の少ないエフェクトとしてあらかじめ登録された特殊効果(ディゾルブやフェード等)を挿入する。異種の場合には、静止画像の切り替え時に視覚的な変化の大きいエフェクトとしてあらかじめ登録された特殊効果(ページめくり、ワイプ等のDVE)を挿入する。また例えば、連続する静止画像対が同種の場合には、静止画像対の提示中同じBGMを流し、異種の場合には、静止画像の切り替え時にBGMを止めるもしくは異なるBGMに切り替える。また、異種の静止画像間に、ジングルを挿入してもよい。これにより、連続する静止画像対に含まれる対象が同種の場合、画像や音響的な変化がなく滑らかに接続される。そのため、視聴者は、静止画像が互いに変化がなくほぼ同じ内容であることを容易に理解できる。また、異種の場合には、画像や音響的な変化が大きく変化するために、視聴者は内容に変化があったことに気づきスライドショーの内容理解に集中することができる。
(関連性5. 撮影場所の同一性)
関連性決定部204は、関連性を、静止画像対に含まれる2つの静止画像の撮影場所の共通性によって決定してもよい。このように決定された関連性を関連性5と称する。
「撮影場所が同一である」とは、スライドショー内で連続する静止画像対を撮影した場所が同一であることとする。関連性5についての関連性フラグには、ある静止画像とその次の静止画像とが同じ撮影場所である場合には1を、異なる撮影場所である場合には0を設定する。撮影場所の同一性は、静止画像中の対象領域以外の領域(背景領域)の類似度をもとに判定できる。例えば、静止画像から対象領域と背景領域を分離し、背景領域から抽出した画像特徴量が類似する場合に、同一の撮影場所と判定してもよい。撮影場所の同一性は、上記以外の方法で判定しても構わない。撮影場所の同一性は、スライドショー内で連続する静止画像の間で背景の類似性を判定してもよい。あるいは、スライドショーに含まれる全静止画像中の背景領域の同一性をもとに判定してもよい。画像情報に加えて、メタ情報である撮影場所やセンサ情報であるGPSを組み合わせて判定してもよい。
同じ撮影場所で撮影された画像が3つ連続した場合には、関連性の変化は無いものとして、例えば、同じ時間間隔で徐々に提示時間を短くしていく。詳しくは以下のルールに基づいて提示方法を制御する。
〔撮影場所の同一性に応じたルール〕
(5−1)提示時間に関するルール
連続する静止画像対の撮影場所の同一性をもとに、静止画像対の提示時間を決定する。例えば、同一の場所で撮影された静止画像群のうち、はじめに提示される静止画像の提示時間を初期値Tsとし、Tsを基準として後続の静止画像の提示時間を決定する。また、同一の場所で撮影された静止画像群のうち、視認性の高い静止画像の提示時間をTpとし、Tpを基準に後続の静止画像の提示時間を決定してもよい。また、同一の場所で撮影された静止画像群のうち、静止画像の提示時間がTq以下になった次の静止画像の提示時間を初期値Tsとし、Tsを基準に後続の静止画像の提示時間を決定してもよい。また、同一の場所で撮影された静止画像群のうち、最後に提示される画像の提示時間をTsに設定してもよい。Ts,Tpの値は、あらかじめスライドショー全体の提示時間を設定しておき、提示する画像数に応じて算出してもよい。連続する静止画像対が異なる場所で撮影された場合には、前の静止画像の提示時間と独立に後続の提示時間を決定する。例えば、初期値Tsに設定してもよいし、規定範囲内のランダムな値に設定してもよい。
(5−2)エフェクト・BGM・ジングルに関するルール
連続する静止画像対の撮影場所の同一性をもとに、静止画像対の間に挿入するエフェクト・BGM・ジングルを決定する。例えば、連続する静止画像対が同じ場所で撮影された場合には、静止画像の切り替え時に視覚的な変化の少ないエフェクトとしてあらかじめ登録された特殊効果(ディゾルブやフェード等)を挿入する。異なる場所で撮影された場合には、静止画像の切り替え時に視覚的な変化の大きいエフェクトとしてあらかじめ登録された特殊効果(ページめくり、ワイプ等のDVE)を挿入する。また例えば、連続する静止画像対が同じ場所で撮影された場合には、静止画像対の提示中同じBGMを流し、異なる場所で撮影された場合には、静止画像の切り替え時にBGMを止めるもしくは異なるBGMに切り替える。また、異なる場所で撮影された静止画像間に、ジングルを挿入してもよい。これにより、連続する静止画像対が同じ場所で撮影された場合、画像や音響的な変化がなく滑らかに接続される。そのため、視聴者は、静止画像が互いに変化がなくほぼ同じ内容であることを容易に理解できる。また、異なる場所で撮影された場合には、画像や音響的な変化が大きく変化するため、視聴者は内容に変化があることに気づきスライドショーの内容理解に集中することができる。
(関連性6. 撮影時間帯の同一性)
関連性決定部204は、関連性を、静止画像対に含まれる2つの静止画像の撮影時間帯の共通性によって決定してもよい。このように決定された関連性を関連性6と称する。
「撮影時間帯が同一である」とは、スライドショー内で連続する静止画像対を撮影した時間帯が同一であることとする。関連性6についての関連性フラグには、ある静止画像とその次の静止画像中とが同じ撮影時間帯である場合には1を、異なる撮影場所である場合には0を設定する。撮影時間帯の同一性は、静止画像中の背景領域の色情報をもとに判定できる。例えば、1日を複数の時間帯に分割し、各時間帯における太陽光の色ヒストグラムの統計量を保持し、静止画像の背景領域中にいずれかの時間帯の統計量と近い部分領域が含まれるときに、その時間帯に撮影された静止画像と判定する。各静止画像の撮影時間帯を推定し、推定時間が同じ場合に撮影時間帯が同一と判定する。撮影時間帯の同一性は、上記以外の方法で判定しても構わない。撮影時間帯の同一性は、スライドショー内で連続する静止画像の間で撮影時間帯の類似性を判定してもよい。あるいは、スライドショーに含まれる全静止画像中の撮影時間帯の同一性をもとに判定してもよい。画像情報に加えて、メタ情報である撮影時刻と組み合わせて判定してもよい。
同じ撮影時間帯に撮影された画像が3つ連続した場合には、関連性の変化は無いものとして、例えば、同じ時間間隔で徐々に提示時間を短くしていく。詳しくは以下のルールに基づいて提示方法を制御する。
〔撮影時間帯の同一性に応じたルール〕
(6−1)提示時間に関するルール
連続する静止画像対の撮影時間帯の同一性をもとに、静止画像対の提示時間を決定する。例えば、同一の時間帯に撮影された静止画像群のうち、はじめに提示される静止画像の提示時間を初期値Tsとし、Tsを基準として後続の静止画像の提示時間を決定する。また、同一の時間帯に撮影された静止画像群のうち、視認性の高い静止画像の提示時間をTpとし、Tpを基準に後続の静止画像の提示時間を決定してもよい。また、同一の時間帯に撮影された静止画像群のうち、静止画像の提示時間がTq以下になった次の静止画像の提示時間を初期値Tsとし、Tsを基準に後続の静止画像の提示時間を決定してもよい。また、同一の時間帯に撮影された静止画像群のうち、最後に提示される画像の提示時間をTsに設定してもよい。Ts,Tpの値は、あらかじめスライドショー全体の提示時間を設定しておき、提示する画像数に応じて算出してもよい。連続する静止画像対が異なる時間帯に撮影された場合には、前の静止画像の提示時間と独立に後続の提示時間を決定する。例えば、初期値Tsに設定してもよいし、規定範囲内のランダムな値に設定してもよい。
(6−2)エフェクト・BGM・ジングルに関するルール
連続する静止画像対の撮影時間帯の同一性をもとに、静止画像対の間に挿入するエフェクト・BGM・ジングルを決定する。例えば、連続する静止画像対が同一の時間帯に撮影された場合には、静止画像の切り替え時に視覚的な変化の少ないエフェクトとしてあらかじめ登録された特殊効果(ディゾルブやフェード等)を挿入する。異なる時間帯に撮影された場合には、静止画像の切り替え時に視覚的な変化の大きいエフェクトとしてあらかじめ登録された特殊効果(ページめくり、ワイプ等のDVE)を挿入する。また例えば、連続する静止画像対が同一の時間帯に撮影された場合には、静止画像対の提示中同じBGMを流し、異なる時間帯に撮影された場合には、静止画像の切り替え時にBGMを止めるもしくは異なるBGMに切り替える。また、異なる時間帯の静止画像間に、ジングルを挿入してもよい。これにより、連続する静止画像対が同一の時間帯に撮影された場合、画像や音響的な変化がなく滑らかに接続される。そのため、視聴者は、静止画像が互いに変化がなくほぼ同じ内容であることを容易に理解できる。また、異なる時間帯に撮影された場合には、画像や音響的な変化が大きく変化するために、視聴者は内容に変化があったことに気づきスライドショーの内容理解に集中することができる。提示ルールは、上記のいずれか1つのルールを適用してもよいし、複数のルールを組み合わせて用いてもよい。スライドショー生成部203は、提示方法決定部202から入力された提示方法情報と、画像入力部210から入力された画像情報をもとに、スライドショーを生成する。
[第4実施形態]
第2実施形態に示したように、関連性決定部204は、スライドショーに含まれる全静止画像から検出した全対象領域を類似性に基づいてグループ化し、隣接する静止画像対から検出された対象領域が同じグループに属する場合には同一の対象と判定してもよい。
本実施形態では、上述のように関連性決定部204が静止画像をグループ化する場合の処理の流れについて説明する。
対象領域の検出手法は、あらかじめ登録された特定対象を検出する場合と、登録されていない一般対象を検出する場合とに分けられる。特定対象を検出する場合は、登録された各対象の画像データをテンプレートとし、様々な解像度に変換したテンプレートで入力画像を走査し、テンプレートと同じ位置の画素値の差分が小さい領域を対応する対象領域として検出してもよい。
図10のフローチャートを参照して、本実施の形態の動作について詳細に説明する。本実施の形態でも、図5に示す静止画像をスライドショー再生させる場合を例に説明する。関連性種別として、同一性・大小関係・部分関係を判定する。提示ルールの決定方法は、第1実施の形態と同様とする。
まず、画像入力部210は、関連性決定部204に、すべての静止画像の画像情報を入力する(ステップS1001)。
関連性決定部204は、全静止画像から画像特徴量を抽出し、画像特徴量の類似性をもとに同一対象を撮影した静止画像をまとめるようにグループ化すると、静止画像501,502,503,504がグループA,静止画像505,506,507,508,509,510がグループB,511,512,513がグループCに分類される(ステップS1003)。
同一のグループに属する静止画像間で、大小関係と部分関係を判定する(S1005)。グループAについては、全静止画像からSIFT等の局所特徴点を抽出して互いに対応点を取ると、静止画像502,503,504が静止画像501に包含されており、静止画像502,503,504は互いに共通領域が小さいことが分かる。よって、静止画像501と静止画像502の間に大小関係あり、静止画像502と静止画像503、静止画像503と静止画像504に部分関係を判定できる。
グループBについては、同様に局所特徴量の比較を行うことで、静止画像506,507,508,509,510は505に内包され、静止画像506,507は静止画像513に内包されることがわかる。よって、静止画像505が大、静止画像511,512,513は中、静止画像506,507,は小と判定できる。また、静止画像506、507は、互いに同一対象の一部分、静止画像511,512,513は互いに同一対象の一部になる。グループCについては、いずれも共有領域が画面全体を占めるため、大小関係・部分関係はいずれもなしと判定される。上記の結果、提示方法決定部202は、提示時間長1101およびエフェクト1102を図11のように決定する(S1007)。最後に、決定した提示方法を用いてスライドショーを生成する(S1009)
本実施形態によれば、第2実施形態に加えて、グループ同士の関係性を明瞭にスライドショーに表わすことが可能となる。
[他の実施形態]
以上、本発明の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。

Claims (17)

  1. 少なくとも3つの静止画像を含む静止画像群において、前記静止画像群に含まれる第1静止画像対の静止画像同士の第1関連性と第2静止画像対の静止画像同士の第2関連性とを比較する比較手段と、
    前記第1関連性から第2関連性への変化に基づいて、前記第1静止画像対の提示方法を特定する第1情報から、前記第2静止画像対の提示方法を特定する第2情報を決定する決定手段と、
    前記第1情報により特定された提示方法及び前記第2情報により特定された提示方法に基づいて、前記第1静止画像対および前記第2静止画像対を含むスライドショーを生成する生成手段と、
    を備えたことを特徴とする情報処理装置。
  2. 前記第1静止画像対および前記第2静止画像対は、それぞれ連続する静止画像の対であることを特徴とする請求項1に記載の情報処理装置。
  3. 前記静止画像群は連続する第1、第2、第3静止画像を含み、前記第1静止画像対は、前記第1静止画像と前記第2静止画像の対であり、前記第2静止画像対は、前記第2静止画像と前記第3静止画像の対であることを特徴とする請求項2に記載の情報処理装置。
  4. 前記第1関連性を、
    前記第1静止画像対に含まれる2つの静止画像に表わされた対象の共通性によって決定し、
    前記第2関連性を、
    前記第2静止画像対に含まれる2つの静止画像に表わされた対象の共通性によって決定する関連性決定手段をさらにすることを特徴とする請求項1、2または3に記載の情報処理装置。
  5. 前記第1関連性を、
    前記第1静止画像対に含まれる2つの静止画像に表わされた対象が同一か否かによって決定し、
    前記第2関連性を、
    前記第2静止画像対に含まれる2つの静止画像に表わされた対象が同一か否かによって決定する関連性決定手段をさらにすることを特徴とする請求項4に記載の情報処理装置。
  6. 前記第1関連性を、
    前記第1静止画像対に含まれる2つの静止画像に表わされた対象が同種か否かによって決定し、
    前記第2関連性を、
    前記第2静止画像対に含まれる2つの静止画像に表わされた対象が同種か否かによって決定する関連性決定手段をさらにすることを特徴とする請求項4に記載の情報処理装置。
  7. 前記第1関連性を、
    前記第1静止画像対に含まれる2つの静止画像に表わされた対象が全体と部分との関係にあるかによって決定し、
    前記第2関連性を、
    前記第2静止画像対に含まれる2つの静止画像に表わされた対象が全体と部分との関係にあるかによって決定する関連性決定手段をさらにすることを特徴とする請求項4に記載の情報処理装置。
  8. 前記第1関連性を、
    前記第1静止画像対に含まれる2つの静止画像の撮影場所または撮影時間の共通性によって決定し、
    前記第2関連性を、
    前記第2静止画像対に含まれる2つの静止画像の撮影場所または撮影時間の共通性によって決定する関連性決定手段をさらにすることを特徴とする請求項4乃至7のいずれか1項に記載の情報処理装置。
  9. 前記第1関連性および前記第2関連性を、
    前記静止画像群に含まれる複数の静止画像から導き出される特徴量の共通性によって決定する関連性決定手段をさらにすることを特徴とする請求項4乃至7のいずれか1項に記載の情報処理装置。
  10. 前記関連性決定手段は、
    前記第1関連性を、
    前記第1静止画像対に含まれる2つの静止画像の画像特徴量の共通性によって決定し、
    前記第2関連性を、
    前記第2静止画像対に含まれる2つの静止画像の画像特徴量の共通性によって決定することを特徴とする請求項9に記載の情報処理装置。
  11. 前記関連性決定手段は、
    前記第1関連性を、
    前記第1静止画像対に含まれる2つの静止画像において、あらかじめ登録された特定対象が含まれている領域の共通性によって決定し、
    前記第2関連性を、
    前記第2静止画像対に含まれる2つの静止画像において、あらかじめ登録された特定対象が含まれている領域の共通性によって決定することを特徴とする請求項9に記載の情報処理装置。
  12. 前記関連性決定手段は、
    前記第1関連性を、
    前記第1静止画像対に含まれる2つの静止画像において、あらかじめ登録された特定対象が含まれている領域の大きさの変化によって決定し、
    前記第2関連性を、
    前記第2静止画像対に含まれる2つの静止画像において、あらかじめ登録された特定対象が含まれている領域の大きさの変化によって決定することを特徴とする請求項9に記載の情報処理装置。
  13. 前記決定手段は、前記第2情報として、
    前記第2静止画像対に含まれる2つの静止画像の提示時間の差分、それら静止画像の切り替え時のエフェクトまたはジングル、それらの静止画像を提示する際の背景音楽を決定することを特徴とする請求項1乃至12のいずれか1項に記載の情報処理装置。
  14. 前記決定手段は、
    前記第1関連性と第2関連性との間に変化が無い場合、前記第1静止画像対における提示方法の変化と同様に、前記第2静止画像対における提示方法が変化するように前記第1情報から前記第2情報を決定することを特徴とする請求項1乃至13のいずれか1項に記載の情報処理装置。
  15. 前記決定手段は、
    前記第1関連性と第2関連性との間に変化が無い場合、前記第1静止画像対における提示時間の変化と同様に、前記第2静止画像対において提示時間が変化するように、前記第1情報から前記第2情報を決定することを特徴とする請求項1乃至14のいずれか1項に記載の情報処理装置。
  16. 少なくとも3つの静止画像を含む静止画像群において、前記静止画像群に含まれる第1静止画像対の静止画像同士の第1関連性と第2静止画像対の静止画像同士の第2関連性とを比較する比較ステップと、
    前記第1関連性から第2関連性への変化に基づいて、前記第1静止画像対の提示方法を特定する第1情報から、前記第2静止画像対の提示方法を特定する第2情報を決定する決定ステップと、
    前記第1情報及び前記第2情報により特定された提示方法に基づいて、前記第1静止画像対および前記第2静止画像対を含むスライドショーを生成する生成ステップと、
    を含むことを特徴とする情報処理方法。
  17. 少なくとも3つの静止画像を含む静止画像群において、前記静止画像群に含まれる第1静止画像対の静止画像同士の第1関連性と第2静止画像対の静止画像同士の第2関連性とを比較する比較ステップと、
    前記第1関連性から第2関連性への変化に基づいて、前記第1静止画像対の提示方法を特定する第1情報から、前記第2静止画像対の提示方法を特定する第2情報を決定する決定ステップと、
    前記第1情報及び前記第2情報により特定された提示方法に基づいて、前記第1静止画像対および前記第2静止画像対を含むスライドショーを生成する生成ステップと、
    をコンピュータに実行させることを特徴とする情報処理プログラム。
JP2011107103A 2011-05-12 2011-05-12 情報処理装置、情報処理方法および情報処理プログラム Withdrawn JP2014170979A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011107103A JP2014170979A (ja) 2011-05-12 2011-05-12 情報処理装置、情報処理方法および情報処理プログラム
PCT/JP2012/061788 WO2012153744A1 (ja) 2011-05-12 2012-04-27 情報処理装置、情報処理方法および情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011107103A JP2014170979A (ja) 2011-05-12 2011-05-12 情報処理装置、情報処理方法および情報処理プログラム

Publications (1)

Publication Number Publication Date
JP2014170979A true JP2014170979A (ja) 2014-09-18

Family

ID=47139222

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011107103A Withdrawn JP2014170979A (ja) 2011-05-12 2011-05-12 情報処理装置、情報処理方法および情報処理プログラム

Country Status (2)

Country Link
JP (1) JP2014170979A (ja)
WO (1) WO2012153744A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016213723A (ja) * 2015-05-12 2016-12-15 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US11341378B2 (en) 2016-02-26 2022-05-24 Nec Corporation Information processing apparatus, suspect information generation method and program

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6236973B2 (ja) * 2013-08-09 2017-11-29 株式会社リコー 表示システム、情報端末、表示装置、再生制御プログラム、再生プログラム及び再生制御方法
CN111083361A (zh) * 2019-12-11 2020-04-28 维沃移动通信有限公司 图像获取方法及电子设备
CN114886417B (zh) * 2022-05-10 2023-09-22 南京布尔特医疗技术发展有限公司 一种智能化安全护理监控系统及方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005348371A (ja) * 2004-06-07 2005-12-15 Fuji Photo Film Co Ltd 電子アルバム表示システム、電子アルバム表示方法、及び電子アルバム表示プログラム
JP4581924B2 (ja) * 2004-09-29 2010-11-17 株式会社ニコン 画像再生装置、および画像再生プログラム
JP4366486B2 (ja) * 2005-03-16 2009-11-18 カシオ計算機株式会社 画像再生装置
JP2008061032A (ja) * 2006-08-31 2008-03-13 Sony Corp 画像再生装置及び画像再生方法、並びにコンピュータ・プログラム
WO2008133046A1 (ja) * 2007-04-13 2008-11-06 Nec Corporation 写真グループ化装置、写真グループ化方法、および写真グループ化用プログラム
JP2010021819A (ja) * 2008-07-11 2010-01-28 Casio Comput Co Ltd 画像表示装置、画像表示方法、及び、プログラム
JP5249090B2 (ja) * 2009-03-03 2013-07-31 オリンパスイメージング株式会社 表示装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016213723A (ja) * 2015-05-12 2016-12-15 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US11341378B2 (en) 2016-02-26 2022-05-24 Nec Corporation Information processing apparatus, suspect information generation method and program
US11776660B2 (en) 2016-02-26 2023-10-03 Nec Corporation Information processing apparatus, suspect information generation method and program

Also Published As

Publication number Publication date
WO2012153744A1 (ja) 2012-11-15

Similar Documents

Publication Publication Date Title
US11321385B2 (en) Visualization of image themes based on image content
KR101605983B1 (ko) 얼굴 검출을 이용한 이미지 재구성
US8548249B2 (en) Information processing apparatus, information processing method, and program
US11094131B2 (en) Augmented reality apparatus and method
WO2019174458A1 (en) An intelligent video interaction method
JP5435382B2 (ja) モーフィングアニメーションを生成するための方法および装置
US8532347B2 (en) Generation and usage of attractiveness scores
US20170337692A1 (en) Method, system and computer program product for automatically altering a video stream
WO2016018728A2 (en) Computerized prominent character recognition in videos
CN111638784B (zh) 人脸表情互动方法、互动装置以及计算机存储介质
WO2012153744A1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
CN113709545A (zh) 视频的处理方法、装置、计算机设备和存储介质
JP5776471B2 (ja) 画像表示システム
JP2013195725A (ja) 画像表示システム
JP5850188B2 (ja) 画像表示システム
JP2018206292A (ja) 要約映像生成装置及びプログラム
WO2012153868A1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
WO2012153747A1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP5962383B2 (ja) 画像表示システムおよび画像処理装置
CN115988262A (zh) 用于视频处理的方法、装置、设备和介质
Koçberber et al. Video retargeting: video saliency and optical flow based hybrid approach
KR101573482B1 (ko) 프레임 클러스터링을 이용한 광고 삽입 장치 및 방법
Shankar et al. A novel semantics and feature preserving perspective for content aware image retargeting
Souza et al. Generating an Album with the Best Media Using Computer Vision

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20141007