JP2017098638A - 画像処理装置、画像選択方法及びプログラム - Google Patents

画像処理装置、画像選択方法及びプログラム Download PDF

Info

Publication number
JP2017098638A
JP2017098638A JP2015226133A JP2015226133A JP2017098638A JP 2017098638 A JP2017098638 A JP 2017098638A JP 2015226133 A JP2015226133 A JP 2015226133A JP 2015226133 A JP2015226133 A JP 2015226133A JP 2017098638 A JP2017098638 A JP 2017098638A
Authority
JP
Japan
Prior art keywords
image
images
processing apparatus
image processing
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015226133A
Other languages
English (en)
Other versions
JP2017098638A5 (ja
JP6418136B2 (ja
Inventor
将 小野澤
Susumu Onozawa
将 小野澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2015226133A priority Critical patent/JP6418136B2/ja
Priority to KR1020160134903A priority patent/KR102646124B1/ko
Priority to CN201610974411.XA priority patent/CN107018348B/zh
Priority to US15/347,517 priority patent/US10658006B2/en
Priority to EP16198117.0A priority patent/EP3171365A1/en
Publication of JP2017098638A publication Critical patent/JP2017098638A/ja
Publication of JP2017098638A5 publication Critical patent/JP2017098638A5/ja
Application granted granted Critical
Publication of JP6418136B2 publication Critical patent/JP6418136B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/64Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】内容が単調でない動画生成のための画像選択を可能にすること。
【解決手段】撮像装置1は、画像取得部52と、特徴量算出部53と、動画再生時間設定部54と、画像再生時間設定部55と、画像選択部58と、を備える。画像取得部52は、複数の画像を取得する。動画再生時間設定部54は、複数の画像からなるデータの再生総時間を設定する。画像再生時間設定部55は、複数の画像の夫々に異なる個別再生時間を設定する。画像選択部58は、複数の画像の個別再生時間に基づいて、複数の画像から再生総時間に応じた所定数の画像を選択する。したがって、撮像装置1においては、内容が単調でない動画生成のための画像選択を可能にすることができる。
【選択図】図10

Description

本発明は、画像処理装置、画像選択方法及びプログラムに関する。
従来、複数種の画像を合成することにより、スライドショーのような動画像を生成する技術がある(特許文献1参照)。
特開2010−177731号公報
しかしながら、上述した特許文献1に記載された技術では、スライドショーに表示される1枚当たりの画像の再生時間を固定値で選択対象の画像全てに一括で設定して画像を選択するため、各画像の表示時間が等間隔になる単調な動画像になってしまう虞があった。
本発明は、このような状況に鑑みてなされたものであり、内容が単調でない動画生成のための画像選択を可能にすることを目的とする。
上記目的を達成するため、本発明の一態様の画像処理装置は、
複数の画像を取得する画像取得手段と、
複数の画像からなるデータの再生総時間を設定する再生総時間設定手段と、
前記複数の画像の夫々に異なる個別再生時間を設定する個別再生時間設定手段と、
前記複数の画像の前記個別再生時間に基づいて、前記複数の画像から前記再生総時間に応じた所定数の画像を選択する選択手段と、
を備えることを特徴とする。
本発明によれば、内容が単調でない動画生成のための画像選択を可能にすることができる。
本発明の一実施形態に係る撮像装置のハードウェアの構成を示すブロック図である。 スコア別最適化の具体例を示す模式図である。 冗長性を排除したスコア別最適化の具体例を示す模式図である。 キーポイント同期最適化を行った場合の画像の再生位置を説明するための模式図である。 キーポイント同期最適化の具体例を示す模式図である。 高ランク画像のキーポイント優先設定におけるキーポイント同期最適化を行った場合の画像の再生位置を説明するための模式図である。 高ランク画像のキーポイント優先設定におけるキーポイント同期最適化の具体例を説明するための模式図である。 キーポイント同期最適化を行って短時間再生画像が存在していた場合の画像の再生位置を説明するための模式図である。 キーポイント同期最適化を行って短時間再生画像が存在していた場合の再生時間調整の具体例を説明するための模式図である。 図1の撮像装置の機能的構成のうち、ハイライト動画生成処理を実行するための機能的構成を示す機能ブロック図である。 図10の機能的構成を有する図1の撮像装置が実行するハイライト動画生成処理の流れを説明するフローチャートである。
以下、本発明の実施形態について、図面を用いて説明する。
図1は、本発明の第1実施形態に係る撮像装置1のハードウェアの構成を示すブロック図である。
撮像装置1は、例えば、デジタルカメラとして構成される。
撮像装置1は、図1に示すように、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、撮像部16と、センサ部17と、入力部18と、出力部19と、記憶部20と、通信部21と、ドライブ22と、を備えている。
CPU11は、ROM12に記録されているプログラム、又は、記憶部20からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、撮像部16、センサ部17、入力部18、出力部19、記憶部20、通信部21及びドライブ22が接続されている。
撮像部16は、図示はしないが、光学レンズ部と、イメージセンサと、を備えている。
光学レンズ部は、被写体を撮影するために、光を集光するレンズ、例えばフォーカスレンズやズームレンズ等で構成される。
フォーカスレンズは、イメージセンサの受光面に被写体像を結像させるレンズである。ズームレンズは、焦点距離を一定の範囲で自在に変化させるレンズである。
光学レンズ部にはまた、必要に応じて、焦点、露出、ホワイトバランス等の設定パラメータを調整する周辺回路が設けられる。
イメージセンサは、光電変換素子や、AFE(Analog Front End)等から構成される。
光電変換素子は、例えばCMOS(Complementary Metal Oxide Semiconductor)型の光電変換素子等から構成される。光電変換素子には、光学レンズ部から被写体像が入射される。そこで、光電変換素子は、被写体像を光電変換(撮像)して画像信号を一定時間蓄積し、蓄積した画像信号をアナログ信号としてAFEに順次供給する。
AFEは、このアナログの画像信号に対して、A/D(Analog/Digital)変換処理等の各種信号処理を実行する。各種信号処理によって、ディジタル信号が生成され、撮像部16の出力信号として出力される。
このような撮像部16の出力信号を、以下、「撮像画像のデータ」と呼ぶ。撮像画像のデータは、CPU11や図示しない画像処理部等に適宜供給される。
センサ部17は、加速度や角速度の情報を取得する加速度センサやジャイロセンサといった各種センサにより構成される。
本実施形態においては、撮像部16において撮影が行われた場合には、撮影時のセンサ情報を取得して、撮影した画像に対応付けて記憶しておく。
入力部18は、各種釦等で構成され、ユーザの指示操作に応じて各種情報を入力する。
出力部19は、ディスプレイやスピーカ等で構成され、画像や音声を出力する。
記憶部20は、ハードディスク或いはDRAM(Dynamic Random Access Memory)等で構成され、各種画像のデータを記憶する。
通信部21は、インターネットを含むネットワークを介して他の装置(図示せず)との間で行う通信を制御する。
ドライブ22には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア31が適宜装着される。ドライブ22によってリムーバブルメディア31から読み出されたプログラムは、必要に応じて記憶部20にインストールされる。また、リムーバブルメディア31は、記憶部20に記憶されている画像のデータ等の各種データも、記憶部20と同様に記憶することができる。
このように構成される撮像装置1では、記憶している複数の画像を閲覧しようとする場合、全てを閲覧するには膨大な時間を要してしまうため、特徴的な画像だけを選択して、ユーザの閲覧に供する機能を有する。本実施形態の撮像装置1では、選択した画像をフレーム画像として動画化して、特徴的なシーンのみを集めた要約動画(以下、「ハイライト動画」ともいう。)を生成して、ユーザの閲覧に供する。
[画像の組み合わせの選択手法(スコア別最適化)の基本的な流れ]
本実施形態においては、撮像装置1では、画像の撮影時のセンサ情報(加速度情報や角速度情報)、画像解析結果(顔等の特定の被写体の有無等)、及び使用状況に関する情報(再生回数やSNSへのアップロード情報等)といった属性情報に基づいて、ハイライト動画の生成対象の候補となる画像(以下、「候補画像」ともいう。)の特徴量を算出する。
そして、算出した特徴量に基づいて、画像の価値としてスコア(以下、「画像スコア」という。)を設定する。なお、画像スコアは、人の主観に基づいて特徴量算出に用いた項目に応じて一義的に設定してもよいし、主観的な評価結果を教師データとして機械学習に基づいて特徴量の項目のそれぞれに重み付けをして、重み付けに応じて、総合的に設定してもよい。
また、撮像装置1では、画像スコアに基づいて、ランク付けを行う。ランクは、生成するハイライト動画での画像の個別再生時間を決定するために用いる。なお、ランクは、ユーザが任意に付してもよいし、画像に対して設定された画像スコアに応じて付してもよい。
また、撮像装置1では、ハイライト動画の最大再生時間を上限として、個別再生時間の合計(合計再生時間)が最大再生時間内に収まる画像の組み合わせにおいて、各画像の画像スコアを積算したスコア(以下、「積算スコア」という。)が最大の組み合わせとなる経路を画像の撮像順に沿って探索する。ここで、本実施形態においては、動画の最大再生時間の制約下において、積算スコアの最大の経路を選択することを「スコア別最適化」という。
図2は、スコア別最適化の具体例を示す模式図である。本例では、ハイライト動画の最大再生時間は、6secに設定されている。
なお、図2においては、起点ノードからの経路として、個別再生時間の組み合わせや画像スコア等の観点から適切な経路とならない経路を「淘汰パス」、設定可能な経路を「親パス」、積算スコアが最も高くなる経路を最適パスとして示している。
具体的には、本実施形態においては、個別再生時間と撮影順の画像とのマトリクスに、撮影順に画像を組み合わせた経路を設定する。各経路の組み合わせのうち、経路にある画像の画像スコアを積算した積算スコアが最大となる経路の組み合わせを、ハイライト動画を構成する画像群として選択する。
「撮影順に画像が組み合わされた経路」とは、本実施形態においては画像の撮影順に沿って最初の画像から最後の画像に向かって順番に経路探索を行うことで算出される経路のことである。
図2(a)の例では、撮影順に画像A乃至画像Dを、ハイライト画像を構成するフレーム画像の候補の画像としている。
画像A乃至画像Dでは、画像の特徴量に基づいて算出された画像スコアが設定されており、画像A[Score:8]、画像B[Score:5]、画像C[Score:10]、画像D[Score:6]となっている。また、画像の個別再生時間が設定されており、画像A[Time:2sec]、画像B[Time:3sec]、画像C[Time:1sec]、画像D[Time:2sec]が設定される。なお、個別再生時間は、画像スコア等に対応して設定するように構成してもよい。具体的には、例えば、画像スコアの高い画像は個別再生時間を長く、画像スコアの低い画像は個別再生時間を短く設定するように構成してもよい。
このように画像スコアと個別再生時間が設定された画像群において、図2(b)に示すように、縦軸が画像の撮影順で、横軸が動画の再生時間のマトリクスにおいて、設定された動画の最大再生時間内に納まるように、撮影順に画像が組み合わされた経路を設定する。
設定した経路において、経路を構成する全ての画像の積算スコアを算出して、最大の積算スコアの経路の組み合わせを選択する。
本例では各経路のうち、積算スコア[24]となる経路が、積算スコアが最大となる経路となる。この経路は、画像Aを起点ノードとして、画像Cと、画像Dの組み合わせからなる。即ち、画像A→画像C→画像Dの経路が最適パスとなる。
なお、本例では、積算スコアのみを考慮したスコア別最適化を行ったが、合計再生時間を長くすることを考慮するスコア別最適化を行うように構成してもよい。
その場合、合計再生時間も最大の6secとなり、積算スコアも[23]と比較的高くなる画像Aを起点ノードとする画像Bと、画像Cの組み合わせの経路を選択する。
その後、撮像装置1では、選択された経路における再生順で、各画像の個別再生時間を合計した合計再生時間からなるハイライト動画を作成する。
[非類似性の向上(冗長性の排除)]
上述したようなスコア別最適化を行った場合、特徴量とスコアが関連しているために選択される組み合わせにおいて類似した画像が含まれてしまうことがある。本手法では、画像間の非類似度を算出して、画像間の類似度をペナルティとして換算して画像スコアに与え、近接する画像との類似度が高い画像の画像スコアを下げるように補正することで、結果として画像スコアの合計である積算スコアが低くなるために、類似した画像の組み合わせの経路が選択されにくくなる。
また、本実施形態では、類似度に応じた画像スコアの補正に対しては、画像間で類似度が高い画像の画像スコアを下げるように補正しているが、画像間で類似度の低い画像に対して、画像スコアを上げるように補正するよう構成してもよい。
本例では、まず、経路の1つ上流の画像(1世代前の経路の画像[親])と、非類似度を判定する画像(以下、「注目画像」ともいう。)において、類似していない度合いである非類似度を算出する[式(1)]。
Figure 2017098638
なお、「Dissimilarity」は非類似度であり、「I」は画像pであり、「I」は画像qであり、「Feat/Feat」は画像(p)の特徴量であり、「Feat/Feat」は画像qのi特徴量であり、「FeatVar」はi特徴量の偏差であり、「W」はi特徴量の荷重係数である。
そして、非類似度に応じたペナルティ量を算出する[式(2)]。なお、ペナルティは、隣接した画像の順列だけではなく離れた画像に対しても考慮する。本実施形態では世代が離れるほどペナルティが小さくなるようにペナルティ量を算出する。
Figure 2017098638
なお、「Dissimilarity」は非類似度であり、「I」は画像pであり、「I」は画像qであり、「G」は世代間距離の荷重関数であり、「Dist」は世代間距離である。
本実施形態における「世代間距離」とは、経路において注目画像からみた他の画像との組み合わせでの距離であり、例えば、注目画像の前後の隣接画像を1世代、その次の先の画像を2世代としており、画像pと画像qとの間の画像数によって一意に決まるものである。
上流の世代から注目画像とのペナルティ量を算出していき、最小となるペナルティ量を注目画像の画像スコアにかけることで、ペナルティを与えた画像選択時に用いる画像スコアとして決定する[式(3)]。
Figure 2017098638
なお、「Score」は画像pの最終的なスコアであり、「q」は親ノード画像であり、「R」は冗長性を考慮する領域であり、「Penapq」は画像pと画像q間の冗長性ペナルティ量である。
また、画像スコアの決定式は、算出したペナルティを上流の世代から累積させて、注目画像の画像スコアにかけることで、ペナルティを与えた画像スコアとして決定する以下の式(3−1)を用いても良い。
Figure 2017098638
なお、「Score」は画像pの最終的なスコアであり、「ImgScore」は特徴量から算出された画像pのスコアであり、「q」は親ノード画像であり、「R」は冗長性を考慮する領域であり、「Penapq」は画像pと画像q間の冗長性ペナルティ量である。
上述したように組み合わせの経路それぞれにおいて画像間の類似度に応じて各画像の画像スコアにペナルティを与えて、積算スコアを算出する。その後、最も積算スコアが高い組み合わせの経路を最適経路として選択する。
図3は、冗長性を排除したスコア別最適化の具体例を示す模式図である。なお、本例では、ハイライト動画の最大再生時間は、6secに設定されている。また、本例では、考慮する世代Rを1世代前(隣接)のみとし、abs(F−F)をペナルティとしている。
各画像pにおける画像スコアSと個別再生時間τは、図3(a)の例では、画像Aの画像スコアは[Score:8]となり、個別再生時間は[Time:2]となり、画像の特徴量[Feat:1]となっている。また、画像Bの画像スコアは[Score:5]となり、個別再生時間は[Time:3]となり、画像の特徴量(Feat:3)となっている。また、画像Cの画像スコアは[Score:10]となり、個別再生時間は[Time:1]となり、画像の特徴量[Feat:2]となっている。また、画像Dの画像スコアは[Score:6]となり、個別再生時間は[Time:2]となり、画像の特徴量[Feat:2]となっている。なお、本実施形態においては、特徴量Featの値が近い程、画像同士が類似しており、類似度が高いものとする。
上述した画像A乃至Dにおいて冗長性を考慮しない場合には、図3(b)に示すように、画像Aを起点ノードとして、画像C、画像Dの組み合わせを選択することで、積算スコアが最大の[24]となる。即ち、画像A→画像C→画像Dの経路が最適パスとなる。
これに対して、上述したような冗長性を排除する手法を用いた場合には、図3(c)に示すように、画像Aを起点ノードとして、画像B、画像Cの組み合わせを選択することで、積算スコアが最大の[28]となる。即ち、画像A→画像B→画像Cの経路が最適パスとなる。
ここで、上述の手法を用いない場合には、[Feat:1]の画像Aと、特徴量の差が小さい[Feat:2]の画像C、及び画像Dの経路の組み合わせが積算スコアの最大となる経路の組み合わせであったが、本手法を用いることで、起点ノードである画像Aとの特徴量の差が大きな[Feat:3]の画像B、画像Cの経路の組み合わせが積算スコアの最大となる経路の組み合わせとなる。なお、画像Bを起点ノードとし次いで画像Cを組み合わせた場合には、積算スコアは最大とならない。
したがって、本手法を用いることで、画像間の類似度に応じたペナルティを画像スコアに与えることで、冗長性を排除しながら非類似性を向上させ、例えば、時間や枚数等の制約内で積算スコアがなるべく最大となるような経路の組み合わせを高速に選択することができる。
[音声同期再生:キーポイント同期最適化]
本実施形態の撮像装置1では、生成したハイライト動画の再生中にBGMを再生するように構成してもよい。
この際、ハイライト動画と、BGMがリンクするように、ハイライト動画の画像の切り替わりと、BGMの拍子やフレーズといった切り替わり箇所とを一致させる。具体的には、ハイライト動画の作成時に、BGMの内容(例えば、拍子のタイミングや拍子が変化した地点、フレーズの開始/終了地点、変調地点等)を考慮して、画像の選択順・選択数や画像の個別再生時間の調整を行う。
このようにハイライト動画の場面の切り替わり(異なる種類のフレーム画像への切り替わり)と、音楽の切り替わりを一致させることで映像と音楽との協調性がある好適な動画の表示を行うことができる。
動画と共に再生する音楽については、画像が切り替わって欲しい位置(以下、「キーポイント」という。)を音楽の再生時間内に設定する。
キーポイントは、例えば、音圧の極値、リズムの変化点等の音楽内の一定の変化が見受けられるポイントに自動的に設定してもよいし、ユーザにより任意の位置に設定してもよい。
予め生成されたハイライト動画の各画像の切り替わり位置を、該ハイライト動画とともに再生する音楽のキーポイントに一致するように該ハイライト動画内の画像の個別再生時間・再生タイミング等を調整することも可能である。
この場合は、キーポイントが画像の切り替わりのポイントになるように、キーポイントをまたぐ画像の表示開始/終了タイミングを前後の時点にスライドさせて変更する。
また、予め設定されたキーポイントに対応するように画像を選択して、ハイライト動画を生成するように構成してもよい。
図4は、ハイライト動画に対して、キーポイント同期最適化を行った場合の画像の再生位置を説明するための模式図である。
なお、本例では、図4(a)に示すように、ハイライト動画の最大再生時間は、8.0secに設定されている。また、音楽のキーポイントは、例えば、音楽を構成する音声情報において一定の変化が見られる位置に自動設定され、各キーポイントは、キーポイント1:1.3sec、キーポイント2:2.6sec、キーポイント3:3.2sec、キーポイント4:5.4sec、キーポイント5:6.7sec、キーポイント6:7.1secに設定される。
キーポイント同期最適化を行わずに、積算スコアが最も高くなるような最適な組み合わせの探索を行った場合には、図4(b)に示すように、画像A:2.0sec、画像B:3.0sec、画像C:1.0sec、画像D:1.0sec、画像E:1.0secとなる。キーポイントが考慮されていないために、選択された画像の再生開始/終了の位置と、キーポイントの位置は一致してない。
これに対して、キーポイントを考慮して画像の再生開始/終了の位置の同期の最適化(以下、「キーポイント同期最適化」という。)をした画像の組み合わせを選択した場合(キーポイント同期最適化)には、図4(c)に示すように、画像Aは個別再生時間:2.0secに設定されているが、設定された個別再生時間としてしまうとキーポイント1が到来してしまうために、キーポイント1の経過時間:1.3secで表示を終了し、次に画像Bの再生が始まるように再生タイミングが調整される。
また、画像Bは個別再生時間:3.0secに設定されているが、設定された個別再生時間としてしまうと次のキーポイントが到来してしまうために、キーポイント1からキーポイント2の経過時間:2.6secで終了するように、個別再生時間が1.3secに調整される。
また、画像Cは個別再生時間:1.0secに設定されているが、設定された個別再生時間としてしまうと次のキーポイントが到来してしまうために、キーポイント2からキーポイント3の経過時間:3.2secで終了するように、個別再生時間が0.6secに調整される。
また、画像Dは個別再生時間:1.0secに設定されており、次のキーポイントが到来しないために、キーポイント3から1.0secの間表示される。(経過時間:4.2sec)
また、画像Eは個別再生時間:1.0secに設定されており、次のキーポイントが到来しないために、画像Dの再生終了後から1.0secの間表示される。(経過時間:5.2sec)
キーポイント同期最適化を行う場合は、キーポイント同期最適化を行わない場合に比べ、画像の切替箇所が増えるため、選択すべき画像数が増える。そのため、キーポイント同期最適化を行う場合には、切替箇所の増加により足りなくなった分の画像を選択する必要があるため、画像Eが表示された以降、動画の終了時間の8.0secまで、キーポイントを考慮して、さらに画像が選択される。なお、本例では以降選択される画像F以降の画像は個別再生時間を2.0secとする。
選択された画像Fは個別再生時間2.0secに設定されているが、次のキーポイントが到来してしまうために、画像Eの再生終了後からキーポイント4の経過時間:5.4で終了するように、個別再生時間が0.2secに調整される。
また、画像Gは個別再生時間:2.0secに設定されているが、次のキーポイントが到来してしまうために、画像Fの再生終了後からキーポイント5の経過時間:6.7で終了するように、個別再生時間が1.3secに調整される。
また、画像Hは個別再生時間:1.0secに設定されているが、次のキーポイントが到来してしまうために、画像Gの再生終了後からキーポイント6の経過時間:7.1で終了するように、個別再生時間が0.4secに調整される。
最後に、画像Iは個別再生時間:1.0secに設定されているが、動画の最大再生時間が到来してしまうために、画像Hの再生終了後から動画の最大再生時間の経過時間:8.0secで終了するように、個別再生時間が0.9secに調整される。
図5は、キーポイント同期最適化の具体例を示す模式図である。なお、本例では、最大再生時間を6secとし、キーポイントが動画の再生時間:4sec経過の時点に設定されている。
各画像pにおける画像スコアsと個別再生時間τは、図5(a)の例に示すように、画像Aでは画像スコア:8、個別再生時間:2secに設定される。また、画像Bでは画像スコア:5、個別再生時間:3secに設定される。また、画像Cでは画像スコア:10、個別再生時間:1secに設定される。また、画像Dでは画像スコア:6、個別再生時間:2secに設定される。また、画像Eでは画像スコア:7、個別再生時間:2secに設定される。
このような画像の個別再生時間/画像スコアで、キーポイントを考慮せず、スコア別最適化を行った場合には、図5(b)に示すように、起点ノードとなる画像A:2secから、画像C:3sec、画像E:5secとなる経路の組み合わせを選択することで、積算スコアが最大の[25]となる。即ち、スコア別最適化を行った場合には、画像A→画像C→画像Eの経路が最適パスとなる。
これに対して、キーポイント同期最適化を行った場合、選択された画像の個別再生時間内にキーポイントがあるときには、キーポイントでの画像の切り替えを行うために当該画像の個別再生時間を短く調整する。
当該画像の個別再生時間を事前に設定された個別再生時間[τ]とするのではなく、画像Aの表示終了時点[t]からキーポイントK[t‘]でクリップした(K[t’]−t)secとする。図5(c)を用いて説明すると、画像A:t=2を起点ノードとした場合に、t=2の時点において画像Bを選択しようとすると画像Bの個別再生時間がキーポイントK(t=4)を跨いでしまう。そのため、キーポイントで確実に画像を切り替えるように画像Aの表示が終わるt=2の時点からキーポイントK(t=4)までの間、画像Bが表示されるように画像Bの個別再生時間を2secに調整する。
これによって、キーポイントを跨いで画像が再生されることを排除し、結果的にキーポイント上にて必ず画像の切り替わりが発生するようになる。
即ち、図5(c)の例では、画像Dの個別再生時間が削られて、画像Eへの切り替わりがキーポイント上で行われているため、起点ノードとなる画像Aから、画像C、画像D、画像Eの経路の組み合わせを選択することで、最大再生時間の条件下で積算スコアが最大の[31]となる。即ち、キーポイント同期最適化を行った場合には、画像A→画像C→画像D→画像Eの経路が最適パスとなる。
したがって、本手法を用いることにより、価値をもとにスコア化された画像群に対し、画像の個別再生時間をキーポイントの時刻にてクリップすることで、BGMのリズムに同期して画像が切り替わりながら、例えば、時間や枚数等の制約内で積算スコアがなるべく最大となるような経路を選択することができる。このため、BGMのリズムに同期して、ある制約内でのスコア最大な画像の組み合わせを高速に実現することができる。
[キーポイント同期最適化:高ランク画像のキーポイント優先]
また、楽曲におけるサビ部分への切り替わりのような重要な時点のキーポイントで切り替わるフレーム画像は、高いランクのものになるように調整するように構成しても良い。高いランクのフレーム画像は、ユーザにとって印象深い画像である可能性が高いため、動画の中で重要な時点でのキーポイントで切り替わることで、よりユーザにとって好適な動画の再生を行うことができる。
図6は、高ランク画像のキーポイント優先設定におけるキーポイント同期最適化を行った場合の画像の再生位置を説明するための模式図である。
なお、本例では、図6(a)に示すように、ハイライト動画の最大再生時間は、6.0secに設定されている。また、音楽のキーポイントは、例えば、音楽を構成する音声情報において一定の変化が見られる位置に自動設定され、優先度の高いキーポイント1は4.0secに設定されている。
スコア別最適化を行った場合には、図6(b)の例に示すように、画像A:2.0sec、画像C:1.0sec、画像E:3.0secとなる。最大再生時間に足りない1.0secだけ画像Eの個別再生時間を伸張している。また、図6(b)ではキーポイントが考慮されていないために、決定した画像の再生開始/終了の位置と、キーポイントの位置は一致していない。
キーポイント同期最適化を行った場合には、図6(c)の例に示すように、画像A:2.0sec、画像C:1.0sec、画像D:1.0sec、画像E:2.0secとなる。キーポイントの優先度は考慮されていないために、優先度の高いキーポイントでスコアの高い画像に切り替わるようになっていない。
これに対して、高ランク画像のキーポイント優先設定においてキーポイント同期最適化を行った場合には、図6(d)の例に示すように、画像A:2.0sec、画像B:2.0sec、画像C:2.0secの組み合わせが最適となる。最大再生時間に足りない1.0secだけ画像Cの個別再生時間を伸張している。
さらに、優先度の高いキーポイントでスコアの高い画像に切り替わるように画像が選択されるため、図6(d)では図6(c)とは異なる経路が最適な経路として選択される。
図6(d)において最初に選択された画像Aは個別再生時間:2.0secに設定されおり、個別再生時間内にキーポイント1が到来しないため、2.0sec再生され、画像Bに切り替わる。
画像Bは個別再生時間:3.0secに設定されているが、決定した個別再生時間内にキーポイントが到来してしまうために、キーポイントの位置に対応する経過時間:4.0secで終了するように、個別再生時間が2.0secに調整される。
また、画像Cは個別再生時間:1.0secに設定されているが、他の画像に比べ、画像スコアも高いため、キーポイントで切り替わるように選択され、且つ、経過時間:6.0secで終了するように、個別再生時間が2.0secに調整される。
図7は、高ランク画像のキーポイント優先設定におけるキーポイント同期最適化の具体例を説明するための模式図である。なお、本例では、最大再生時間が6secに設定され、図7(c)及び(d)においてキーポイントが再生経過時間:4secに設定されている。図7(d)ではキーポイントに優先度情報が設定されている。
各画像pにおける画像スコアSと個別再生時間τは、図7(a)の例に示すように、画像Aではスコア:8、ランク:3、個別再生時間:2secに設定される。また、画像Bではスコア:5、ランク:2、個別再生時間:3secに設定される。また、画像Cではスコア:10、ランク:5、個別再生時間:1secに設定される。また、画像Dではスコア:6、ランク:2、個別再生時間:2secに設定される。また、画像Eではスコア:7、ランク:3、個別再生時間:2secに設定される。
このように設定された画像の個別再生時間/画像スコアで、最大再生時間に収まるようにスコア別最適化を行った場合には、図7(b)に示すように、起点ノードとなる画像A:2secから、画像C:3sec、画像E:5secとなる経路の組み合わせを選択することで、積算スコアが最大の[25]となる。即ち、スコア別最適化を行った場合には、画像A→画像C→画像Eの経路が最適パスとなる。
また、キーポイントで画像を切り替えるように、スコア別最適化を行った場合には、図7(c)に示すように、起点ノードとなる画像A:2secから、画像C:3sec、画像D:4sec、画像E:6secとなる経路の組み合わせが選択される。
この時、画像Dはキーポイントを跨ぐため、個別再生時間が3secから1secになるよう調整される。選択された経路における積算スコアが最大の[31]となる。即ち、キーポイントを考慮しスコア別最適化を行った場合には、画像A→画像C→画像D→画像Eの経路が最適パスとなる。
これに対して、キーポイントにおける高ランク画像の優先設定の最適化を行った場合、もし親がキーポイント時刻上にあるときには、次に選択される画像が高いランクであれば、予め設定されたスコアではなく、当該スコアにランクに応じたボーナス(乗数Bonus)をかけることにする。
これによって、そのノードを通過するパスのスコアは相対的に高くなるため、結果的により高いランクの画像がキーポイント上で切り替わるようになる。
即ち、図7(d)の例では、高いランクの画像Cに対して5倍のボーナスを与えているために、キーポイントから開始される画像として選択されることとなり、起点ノードとなる画像A:2secから、画像B:4sec、画像C:5secの経路の組み合わせを選択することで、積算スコアが最大の[53]となる。即ち、キーポイントにおける高ランク画像の優先設定の最適化を行った場合には、画像A→画像B→画像Cの経路が最適パスとなる。
したがって、本手法を用いることにより、画像夫々の価値をもとにスコア化された画像群に対し、親ノードが音声キーポイント上にある場合には、そこからの追加ノードの画像ランクが高い時にボーナスを与えることで、より高いランクの画像がキーポイント上で切り替わりながら、ある制約(時間・枚数)内で積算スコアがなるべく最大となるような経路を選択することができる。このため、BGMのリズムに同期して、例えば、時間や枚数等の制約内でのスコア最大な画像組み合わせを高速に実現することができる。
[キーポイント同期最適化:短時間再生画像存在時の個別再生時間調整]
また、あまりに短い個別再生時間で画像を表示しても効果的でないため、1枚当たりの画像の再生時間の最短の長さの閾値となる最低個別再生時間を設定することができる。本例では、0.5secを最低個別再生時間として設定する。即ち、再生時間が0.5sec未満となるようなフレーム画像を経路探索の選択肢から外すように抑止(以下、「短時間再生抑止」という。)する。
図8は、キーポイント同期最適化を行って短時間再生画像が存在していた場合の画像の再生位置を説明するための模式図である。
なお、本例では、図8(a)に示すように、ハイライト動画の最大再生時間は、8.0secに設定されている。また、音楽のキーポイントは、例えば、音楽を構成する音声情報において一定の変化が見られる位置に自動設定され、各キーポイントは、キーポイント1:1.3sec、キーポイント2:2.6sec、キーポイント3:3.2sec、キーポイント4:5.4sec、キーポイント5:6.7sec、キーポイント6:7.1secに設定される。
キーポイント同期最適化を行った場合には、図8(b)に示すようになり、個別再生時間が0.5sec未満となる画像F:0.2sec、画像H:0.4secが存在する。そのため、再生時間が短いフレーム画像が存在してしまうため、画像の切り替わりの早いユーザにとって好適でない動画像になってしまっている。
本例では、図8(c)に示すように、個別再生時間が0.2secとなってしまう画像Fの区間に相当する部分を画像Fの1つ前の画像Eの個別再生時間を延長することで個別再生時間が最低個別再生時間を下回らないように構成する。即ち、画像Eの個別再生時間が1.3secとなる。それ以降は、キーポイントを考慮して再設定する。
画像Fは個別再生時間:2.0secに設定されているが、次のキーポイントが到来してしまうために、画像Eの再生終了後からキーポイント5の経過時間:6.7secで終了するように、個別再生時間が1.3secに調整される。
また、画像Gは個別再生時間:2.0secに設定されているが、次のキーポイントが到来してしまうが、次のキーポイントまで、0.5sec未満の0.4secであるため、キーポイントを考慮せず、画像Gの再生終了後から動画の最大再生時間の経過時間:8.0secで終了するように、個別再生時間が1.3secに調整される。
図9は、キーポイント同期最適化を行って短時間再生画像が存在する場合の個別再生時間調整の具体例を説明するための模式図である。
なお、各画像pにおける画像スコアSと個別再生時間τは、図9(a)の例に示すように、画像Aではスコア:4、個別再生時間:1secに設定される。また、画像Bではスコア:10、個別再生時間:2secに設定される。また、画像Cではスコア:5、個別再生時間:3secに設定される。また、画像Dではスコア:6、個別再生時間:2secに設定される。また、画像Eではスコア:7、個別再生時間:2secに設定される。
このような画像の個別再生時間/スコアで、キーポイント同期最適化を行った場合には、図9(b)の例に示すように、起点ノードなる画像A:1secから、画像B:3sec、画像D:2sec、画像E:2secの経路の組み合わせを選択することで、積算スコアが最大の[27]となる。この場合、画像Bの再生時間にキーポイントが存在することになり、画像Bの再生時間は3secから1secに短縮される。
即ち、キーポイント同期最適化を行った場合には、画像A→画像B→画像C→画像Eの経路が最適パスとなる。
しかしながら、例えば、個別再生時間が1secのような短時間で切り替わる画像は、画像内容によってはハイライト動画の閲覧者には内容を認識できない場合も考えられる。
そこで、本例では、図9(c)の例に示すように、キーポイント時刻1sec前のt=3にノードが発生する場合、画像の切り替わりの影響により、そこからの個別再生時間は短時間となることが予想されるため、その前の親画像の個別再生時間をその分延長してしまうことで対応する。
例えば、画像Aを選択した後に画像Bを追加するパスでは、画像Bの個別再生時間は2sec間なので本来はt=3となるはずであるがt=4へと移動させる。つまりこれは、画像Bの再生を3secへと延長させることで、次の画像がキーポイントクリップにより1sec再生となることを抑止していることになる。
図9(b)の例では、最適パスとして画像A→画像B→画像C→画像Eの経路が選択されていたが、結果的に図9(c)ではキーポイントの前のノード時点で短時間再生が生じる場合、上述の延長処理が行われたうえで経路探索が行われるため、画像Aを選択するパスは回避され、短時間再生を含まず、積算スコアの最も高い経路である画像B→画像D→画像Eの経路が選択されることになる。
なお、ハイライト動画を構成するフレーム画像が動画である場合には、クリップおよび伸張処理を行うことで、画像や動画のスコアを再生時間比率などで変化させてもよい。例えば、再生時間がクリップによってα倍(1>α≧0)に減少されてしまった場合、そのノードに与えるスコアもα倍に減少させることで、最適パスがそのノードを通過しづらくすることができる。これによって、なるべく本来の個別再生時間を維持している経路が選択されやくなる。また、そもそも伸張処理を行わずに、短時間再生が発生する可能性のあるパスに対して大きなペナルティを与えることで、最適パスがそのノードを通過しづらくするだけでもよい。
したがって、キーポイント時刻より、ある閾値内の手前にノードが発生する場合には、親のノードの再生時間をキーポイント時刻まで延長することよって、短時間再生を抑圧することができる。また、クリップおよび伸張処理による再生時間変化を画像スコアへも影響を与えることで、最適パスのノードへの回避および誘導を制御する。よって、短時間再生を抑圧しつつBGMのリズムに同期して、動画の再生時間の制約内での画像スコアが最大となる画像の組み合わせを高速に実現することができる。
図10は、図1の撮像装置1の機能的構成のうち、ハイライト動画生成処理を実行するための機能的構成を示す機能ブロック図である。
ハイライト動画生成処理とは、複数の候補画像の中から、選択した画像スコアの高い組み合わせとなる候補画像からなるハイライト動画を生成する一連の処理をいう。
ハイライト動画生成処理を実行する場合には、図10に示すように、CPU11において、モード設定部51と、画像取得部52と、特徴量算出部53と、動画再生時間設定部54と、画像再生時間設定部55と、経路設定部56と、スコア補正部57と、画像選択部58と、動画生成部59と、が機能する。
また、記憶部20の一領域には、動画記憶部71が設定される。
動画記憶部71には、撮影時に取得したセンサ情報と対応付けられた画像のデータが記憶される。
モード設定部51は、例えば、ユーザにより入力部18を介してモードを設定する。
本実施形態では、「ノーマルモード」と、「非類似性向上モード」と、「キーポイント切替モード」のモードが設定可能となる。
「ノーマルモード」は、設定された動画の最大再生時間内に納まる時間で、最も高いスコアとなる組み合わせの経路を選択して、選択された経路を構成する画像をフレーム画像として選択するモードである。「ノーマルモード」では、上述した[スコア別最適化]の手法を用いて、画像の組み合わせの経路選択を行う。
「非類似性向上モード」は、類似度が高い画像同士が選択されることを避けることで冗長性を排除し、非類似性を向上させるモードである。「非類似性向上モード」では、上述した[非類似性の向上(冗長性の排除)]の手法を用いて、画像の組み合わせの経路選択を行う。
「キーポイント切替モード」は、動画の再生時にBGMが同時に再生されるものであり、BGMのキーポイントで画像を切り替えるモードであり、ランクの高い画像がキーポイントで切り替わるようにしたり、キーポイントで画像を切り替えることで画像の切り替わりが短時間となることを抑制したりするモードである。「キーポイント切替モード」では、[音声同期再生:キーポイント同期最適化]・[キーポイント同期最適化:高ランク画像のキーポイント優先]・[キーポイント同期最適化:短時間再生画像存在時の再生時間調整]の手法を用いて、画像の組み合わせの経路選択を行う。
画像取得部52は、ハイライト動画の対象となる複数の候補画像を動画記憶部71から取得する。
特徴量算出部53は、取得した候補画像毎に特徴量を算出する。本実施形態において特徴量は、候補画像を画像解析して、解析した画像内における特徴点等に基づいて算出する。また、特徴量に基づいて、候補画像のスコアを算出し、スコアに応じて候補画像のランク付けを行う。即ち、スコアとランクが候補画像に付される。
動画再生時間設定部54は、ユーザにより入力部18を介してハイライト動画の最大再生時間(例えば、6sec)を設定する。
画像再生時間設定部55は、スコアに基づいて決定される候補画像のランクに応じて、動画内における候補画像の個別再生時間を設定する。なお、候補画像の個別再生時間は、スコアやランクにかかわらず、ユーザによって設定可能に構成してもよい。
経路設定部56は、画像の撮影順と設定された候補画像の個別再生時間に基づいて、ハイライト動画の個別再生時間と候補画像によって構成されるマトリクスに可能な経路の組み合わせ(配列)を設定する。
スコア補正部57は、設定されたモードに応じてスコアを補正する。
なお、「非類似性向上モード」の場合には、類似度が高いフレーム画像が連続する場合には、ペナルティをかけたスコアに補正する。また、「キーポイント切替モード」の場合には、キーポイントでクリッピングした場合には、クリッピング後に選択される可能性のある画像のうちランクの高いものに、ランクに応じたボーナスを加算してスコアを補正する。
画像選択部58は、積算スコアが最も高くなる経路を選択して、経路を構成する候補画像を選択する。なお、「キーポイント切替モード」の場合には、クリッピングしてキーポイントに合わせた後の余った時間に応じて、候補画像を選択する。ただし、補正後の積算スコアを用いて経路を選択する。また、例えば、個別再生時間が0.5sec未満のように短くなってしまう候補画像がある場合には、経路の上流にある候補画像の親(1つ前の候補画像)の再生時間を延長して、子(次の候補画像)がキーポイントで切り替わるようにする。
動画生成部59は、画像選択部58によって選択された経路の候補画像を設定された最大再生時間に収まるように構成したハイライト動画を生成する。
図11は、図10の機能的構成を有する図1の撮像装置1が実行するハイライト動画生成処理の流れを説明するフローチャートである。
ハイライト動画生成処理は、ユーザによる入力部18へのハイライト動画生成処理開始の操作により開始される。
ステップS1において、モード設定部51は、例えば、ユーザにより入力部18を介してモードを設定する。
本実施形態では、「ノーマルモード」と、「非類似性向上モード」と、「キーポイント切替モード」のモードが設定可能となる。
「ノーマルモード」は、設定された動画の最大再生時間内に納まる時間で、最も高いスコアとなる組み合わせの経路を選択して、選択された経路を構成する画像をフレーム画像として選択するモードである。
「非類似性向上モード」は、類似度が高い画像同士が選択されることを避けることで冗長性を排除し、非類似性を向上させるモードである。
「キーポイント切替モード」は、動画の再生時にBGMが同時に再生されるものであり、BGMのキーポイントで画像を切り替えるモードであり、ランクの高い画像がキーポイントで切り替わるようにしたり、キーポイントで画像を切り替えることで画像の再生時間が短時間となることを抑制したりするモードである。
ステップS2において、画像取得部52は、ハイライト動画の対象となる複数の候補画像を動画記憶部71から取得する。
ステップS3において、特徴量算出部53は、取得した候補画像毎に特徴量を算出する。本実施形態において特徴量は、候補画像を画像解析して、解析した画像内における特徴点等に基づいて算出する。その後、特徴量に基づいて、候補画像のスコアを算出し、スコアに応じて候補画像のランク付けを行う。即ち、スコアとランクが候補画像に付される。
ステップS4において、動画再生時間設定部54は、ユーザにより入力部18を介してハイライト動画の最大再生時間(例えば、6sec)を設定する。
ステップS5において、画像再生時間設定部55は、スコアに基づいて決定される候補画像のランクに応じて、動画内における候補画像の個別再生時間を設定する。なお、候補画像の再生時間は、スコアやランクにかかわらず、ユーザによって設定可能に構成してもよい。
ステップS6において、経路設定部56は、画像の撮影順と設定された候補画像の個別再生時間に基づいて、ハイライト動画の最大再生時間と候補画像によって構成されるマトリクスに可能な経路の組み合わせ(配列)を設定する。
ステップS7において、スコア補正部57は、設定されたモードに応じてスコアを補正する。
「非類似性向上モード」の場合には、類似度が高いフレーム画像が連続する場合には、ペナルティをかけたスコアに補正する。
「キーポイント切替モード」の場合には、キーポイントでクリッピングした場合には、クリッピング後に選択される可能性のある画像のうちランクの高いものに、ランクに応じたボーナスを加算してスコアを補正する。
ステップS8において、画像選択部58は、積算スコアが最も高くなる経路を選択して、経路を構成する候補画像を選択する。
「キーポイント切替モード」の場合には、クリッピングしてキーポイントに合わせた後の余った再生時間に応じて、候補画像を選択する。この場合、補正後の積算スコアを用いて経路を選択する。また、例えば、個別再生時間が0.5sec未満の短い再生時間になってしまう候補画像がある場合には、経路の上流にある候補画像の親(1つ前の候補画像)の個別再生時間を延長して、子(次の候補画像)がキーポイントで切り替わるようにする。
ステップS9において、動画生成部59は、画像選択部58によって選択された経路の候補画像を設定された最大再生時間に収まるように構成したハイライト動画を生成する。
その後、ハイライト動画生成処理は終了する。
以上のように構成される撮像装置1は、画像取得部52と、動画再生時間設定部54と、画像再生時間設定部55と、画像選択部58と、を備える。
画像取得部52は、複数の画像を取得する。
特徴量算出部53は、画像取得部52によって取得された複数の画像を評価する。
動画再生時間設定部54は、複数の画像からなるデータの再生総時間を設定する。
画像再生時間設定部55は、複数の画像の夫々に個別再生時間を設定する。
画像選択部58は、複数の画像の評価結果と個別再生時間に基づいて、複数の画像から再生総時間に応じた所定数の画像を選択する。
したがって、撮像装置1においては、内容が単調でない動画生成のための画像選択を可能にすることができる。
また、撮像装置1は、画像取得部52によって取得された複数の画像を評価する特徴量算出部53を更に備える。
画像選択部58は、複数の画像の特徴量算出部53による評価結果と個別再生時間に基づいて、複数の画像から再生総時間に応じた所定数の画像を選択する。
したがって、撮像装置1においては、より内容が単調でない動画生成のための画像選択を可能にすることができる。
画像再生時間設定部55は、特徴量算出部53による評価結果に基づいて個別再生時間を設定する。
したがって、撮像装置1においては、評価結果に関係のある個別再生時間とすることができる。
特徴量算出部53は、画像の内容に関連する情報、又は撮影のタイミングに関連する情報に基づいて画像を評価する。
したがって、撮像装置1においては、画像の内容に関連する情報、又は撮影のタイミングに関連する情報に関係する評価を行うことができる。
画像選択部58は、選択される画像の評価結果が高く、かつ、選択される複数の画像の個別再生時間の合計時間が再生総時間を超えない範囲となるように、所定数の画像を選択する。
したがって、撮像装置1においては、設定した時間内となるように画像を選択することができる。
画像における類似度を判定するスコア補正部57を更に備える。
画像選択部58は、スコア補正部57による判定結果に基づいて、画像を選択する。
したがって、撮像装置1においては、類似度に応じて、動画生成のための画像選択を可能にすることができる。
スコア補正部57は、画像の内容に関連する情報、又は撮影のタイミングに関連する情報に基づいて、類似度を判定する。
したがって、撮像装置1においては、画像の内容に関連する情報、又は撮影のタイミングに関連する情報に関係する画像の類似度を判定することができる。
スコア補正部57は、類似度を判定する対象の画像において画像選択部58により選択される順番が近い前後の画像を比較対象とする。
したがって、撮像装置1においては、選択される順番が近い画像の類似度を判定することができる。
特徴量算出部53は、複数種の異なる観点から画像を評価する。
したがって、撮像装置1においては、複数種の異なる観点から画像を総合的に評価することができる。
画像選択部58は、撮影される画像の撮影タイミングに関する情報が分散するように所定数の画像を選択する。
したがって、撮像装置1においては、選択対象となる画像を分散した動画生成のための画像選択を可能にすることができる。
また、撮像装置1は、再生開始タイミングを設定するモード設定部51を備える。
画像選択部58は、モード設定部51によって設定された再生開始タイミングを考慮して、所定数の画像を選択する。
したがって、撮像装置1においては、設定された再生開始タイミングに合うように動画生成のための画像選択を可能にすることができる。
モード設定部51は、楽音に対応するように再生開始タイミングを設定する。
したがって、撮像装置1においては、楽音に合うように動画生成のための画像選択を可能にすることができる。なお、複数の楽音によって有機的に構成されたものが楽曲となる。
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
上述の実施形態では、ハイライト動画の制約として動画の最大再生時間としたが、これに限られず、例えば、動画を構成するフレーム画像の最大枚数を制約条件とするようにしても良い。
また、上述の実施形態では、複数の静止画を候補画像として取得して、取得した候補画像から画像を選択してハイライト動画を生成するように構成したが、例えば、1つ又は複数の動画において、動画を構成するフレーム画像を候補画像としてもよい。
また、ハイライト動画に代えて、複数の静止画が一枚の画像となっているような画像を生成するように構成してもよい。
また、上述の実施形態では、選択する画像の個別再生時間を合計した場合に、合計した合計再生時間が設定した最大再生時間を超えない最大の再生時間となるように構成したがこれに限られない。例えば、設定した再生時間(再生総時間)付近において最大のスコアとなるような画像を選択するように構成してもよい。
また、上述した実施形態では、類似度が高い画像を連続して選択しないように構成したがこれに限られず、類似度が高い画像を積極的に選択するように構成してもよい。
また、類似度は、例えば、画像における構図、画角、色又は等の画像の内容や、撮影時間、撮影時のセンサ情報等の撮影時の情報に基づいて決定することができる。
また、画像の評価においても、例えば、画像における構図、画角、色又は等の画像の内容や、撮影時間、撮影時のセンサ情報等の撮影時の情報に基づいて行うことができる。また、画像の評価は、画像単体において行ってもよいが、他の画像との比較において行うように構成してもよい。例えば、画像の内容からして画像単体としては高い評価となるが、同時期に同じような画像が集中した場合には、他の画像との関係から同時期に最も評価の高い画像を除いて評価を下げるように構成してもよい。
また、上述した実施形態では、切り替えポイントは、楽曲の内容に基づいて設定されるように構成したがこれに限られない。切り替えポイントは、例えば、楽曲の内容から複数の候補が挙げられ、当該候補のそれぞれに対して、重要度を割り当てる。切り替えポイントは、割り当てられた重要度のうち、所定の重要度以上の候補を、切り替えポイントとして設定する。また、設定された切り替えポイントに対して、割り当てられた重要度に応じて、切り替えるか否かを判断して画像を選択するように構成してもよい。
また、上述した実施形態では、最大再生時間はユーザが任意に設定するように構成していたが、これに限られず、BGMとして使用する楽曲の長さを最大再生時間として設定するように構成することができる。
また、上述した実施形態では、動画と共に再生する楽曲の内容に基づいて切り替えポイントが設定されるように構成したが、例えば、選択される画像の枚数に応じて、切り替えポイントを設定するように構成してもよい。この場合、楽曲の内容に基づいて切り替えポイントの数が選択される画像よりも多い場合には、例えば、内容の変化の少ないポイントを切り替えポイントから外すようにしたり、楽曲の内容に基づいて切り替えポイントの数が選択される画像よりも少ない場合には、内容の変化が次に多いポイントを切り替えポイントとして設定したりするように構成することができる。また、切り替えポイントは、前半・中盤・後半と再生時期に応じて数を増減させてもよい。
また、上述の実施形態では、本発明が適用される撮像装置1は、デジタルカメラを例として説明したが、特にこれに限定されない。
例えば、本発明は、ハイライト動画生成処理機能を有する電子機器一般に適用することができる。具体的には、例えば、本発明は、ノート型のパーソナルコンピュータ、プリンタ、テレビジョン受像機、ビデオカメラ、携帯型ナビゲーション装置、携帯電話機、スマートフォン、ポータブルゲーム機等に適用可能である。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
換言すると、図10の機能的構成は例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が撮像装置1に備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは特に図10の例に限定されない。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図1のリムーバブルメディア31により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディア31は、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk−Read Only Memory),DVD(Digital Versatile Disk),Blu−ray(登録商標) Disc(ブルーレイディスク)等により構成される。光磁気ディスクは、MD(Mini−Disk)等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図1のROM12や、図1の記憶部20に含まれるハードディスク等で構成される。
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
以上、本発明のいくつかの実施形態について説明したが、これらの実施形態は、例示に過ぎず、本発明の技術的範囲を限定するものではない。本発明はその他の様々な実施形態を取ることが可能であり、さらに、本発明の要旨を逸脱しない範囲で、省略や置換等種々の変更を行うことができる。これら実施形態やその変形は、本明細書等に記載された発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
以下に、本願の出願当初の特許請求の範囲に記載された発明を付記する。
[付記1]
複数の画像を取得する画像取得手段と、
複数の画像からなるデータの再生総時間を設定する再生総時間設定手段と、
前記複数の画像の夫々に異なる個別再生時間を設定する個別再生時間設定手段と、
前記複数の画像の前記個別再生時間に基づいて、前記複数の画像から前記再生総時間に応じた所定数の画像を選択する選択手段と、
を備えることを特徴とする画像処理装置。
[付記2]
前記画像取得手段によって取得された前記複数の画像を評価する評価手段を更に備え、
前記選択手段は、前記複数の画像の前記評価手段による評価結果と前記個別再生時間に基づいて、前記複数の画像から前記再生総時間に応じた所定数の画像を選択する、
ことを特徴とする付記1に記載の画像処理装置。
[付記3]
前記個別再生時間設定手段は、前記評価手段による評価結果に基づいて前記個別再生時間を設定する、
ことを特徴とする付記2に記載の画像処理装置。
[付記4]
前記評価手段は、画像の内容に関連する情報、又は撮影のタイミングに関連する情報に基づいて前記画像を評価する、
ことを特徴とする付記2又は3に記載の画像処理装置。
[付記5]
前記選択手段は、選択される前記画像の評価結果が高く、かつ、選択される前記複数の画像の前記個別再生時間の合計時間が前記再生総時間を超えない範囲となるように、前記所定数の画像を選択する、
ことを特徴とする付記2乃至4の何れか1つに記載の画像処理装置。
[付記6]
画像における類似度を判定する類似度判定手段を更に備え、
前記選択手段は、前記類似度判定手段による判定結果に基づいて、前記画像を選択する、
ことを特徴とする付記1乃至5の何れか1つに記載の画像処理装置。
[付記7]
前記類似度判定手段は、画像の内容に関連する情報、又は撮影のタイミングに関連する情報の情報に基づいて、前記類似度を判定する、
ことを特徴とする付記6に記載の画像処理装置。
[付記8]
前記類似度判定手段は、類似度を判定する対象の画像において前記選択手段により選択される順番が近い前後の画像を比較対象とする、
ことを特徴とする付記6又は7に記載の画像処理装置。
[付記9]
前記選択手段は、撮影される画像の撮影タイミングに関連する情報が分散するように前記所定数の画像を選択する、
ことを特徴とする付記1乃至8の何れか1つに記載の画像処理装置。
[付記10]
再生開始タイミングを設定するタイミング設定手段と、
前記選択手段は、前記タイミング設定手段によって設定された前記再生開始タイミングを考慮して、前記所定数の画像を選択する、
ことを特徴とする付記1乃至9の何れか1つに記載の画像処理装置。
[付記11]
前記タイミング設定手段は、楽音に対応するように前記再生開始タイミングを設定する、
ことを特徴とする付記10に記載の画像処理装置。
[付記12]
複数の画像を取得する画像取得ステップと、
複数の画像からなるデータの再生総時間を設定する再生総時間設定ステップと、
前記複数の画像の夫々に異なる個別再生時間を設定する個別再生時間設定ステップと、
前記複数の画像の前記個別再生時間に基づいて、前記複数の画像から前記再生総時間に応じた所定数の画像を選択する選択ステップと、
を含むことを特徴とする画像選択方法。
[付記13]
画像処理装置を制御するコンピュータを、
複数の画像を取得する画像取得手段、
複数の画像からなるデータの再生総時間を設定する再生総時間設定手段、
前記複数の画像の夫々に異なる個別再生時間を設定する個別再生時間設定手段、
前記複数の画像の前記個別再生時間に基づいて、前記複数の画像から前記再生総時間に応じた所定数の画像を選択する選択手段、
として機能させることを特徴とするプログラム。
1・・・撮像装置,11・・・CPU,12・・・ROM,13・・・RAM,14・・・バス,15・・・入出力インターフェース,16・・・撮像部,17・・・センサ部,18・・・入力部,19・・・出力部,20・・・記憶部,21・・・通信部,22・・・ドライブ,31・・・リムーバブルメディア,51・・・モード設定部,52・・・画像取得部,53・・・特徴量算出部,54・・・動画再生時間設定部,55・・・画像再生時間設定部,56・・・経路設定部,57・・・スコア補正部,58・・・画像選択部,59・・・動画生成部,71・・・画像記憶部

Claims (13)

  1. 複数の画像を取得する画像取得手段と、
    複数の画像からなるデータの再生総時間を設定する再生総時間設定手段と、
    前記複数の画像の夫々に異なる個別再生時間を設定する個別再生時間設定手段と、
    前記複数の画像の前記個別再生時間に基づいて、前記複数の画像から前記再生総時間に応じた所定数の画像を選択する選択手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記画像取得手段によって取得された前記複数の画像を評価する評価手段を更に備え、
    前記選択手段は、前記複数の画像の前記評価手段による評価結果と前記個別再生時間に基づいて、前記複数の画像から前記再生総時間に応じた所定数の画像を選択する、
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記個別再生時間設定手段は、前記評価手段による評価結果に基づいて前記個別再生時間を設定する、
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記評価手段は、画像の内容に関連する情報、又は撮影のタイミングに関連する情報に基づいて前記画像を評価する、
    ことを特徴とする請求項2又は3に記載の画像処理装置。
  5. 前記選択手段は、選択される前記画像の評価結果が高く、かつ、選択される前記複数の画像の前記個別再生時間の合計時間が前記再生総時間を超えない範囲となるように、前記所定数の画像を選択する、
    ことを特徴とする請求項2乃至4の何れか1項に記載の画像処理装置。
  6. 画像における類似度を判定する類似度判定手段を更に備え、
    前記選択手段は、前記類似度判定手段による判定結果に基づいて、前記画像を選択する、
    ことを特徴とする請求項1乃至5の何れか1項に記載の画像処理装置。
  7. 前記類似度判定手段は、画像の内容に関連する情報、又は撮影のタイミングに関連する情報の情報に基づいて、前記類似度を判定する、
    ことを特徴とする請求項6に記載の画像処理装置。
  8. 前記類似度判定手段は、類似度を判定する対象の画像において前記選択手段により選択される順番が近い前後の画像を比較対象とする、
    ことを特徴とする請求項6又は7に記載の画像処理装置。
  9. 前記選択手段は、撮影される画像の撮影タイミングに関連する情報が分散するように前記所定数の画像を選択する、
    ことを特徴とする請求項1乃至8の何れか1項に記載の画像処理装置。
  10. 再生開始タイミングを設定するタイミング設定手段と、
    前記選択手段は、前記タイミング設定手段によって設定された前記再生開始タイミングを考慮して、前記所定数の画像を選択する、
    ことを特徴とする請求項1乃至9の何れか1項に記載の画像処理装置。
  11. 前記タイミング設定手段は、楽音に対応するように前記再生開始タイミングを設定する、
    ことを特徴とする請求項10に記載の画像処理装置。
  12. 複数の画像を取得する画像取得ステップと、
    複数の画像からなるデータの再生総時間を設定する再生総時間設定ステップと、
    前記複数の画像の夫々に異なる個別再生時間を設定する個別再生時間設定ステップと、
    前記複数の画像の前記個別再生時間に基づいて、前記複数の画像から前記再生総時間に応じた所定数の画像を選択する選択ステップと、
    を含むことを特徴とする画像選択方法。
  13. 画像処理装置を制御するコンピュータを、
    複数の画像を取得する画像取得手段、
    複数の画像からなるデータの再生総時間を設定する再生総時間設定手段、
    前記複数の画像の夫々に異なる個別再生時間を設定する個別再生時間設定手段、
    前記複数の画像の前記個別再生時間に基づいて、前記複数の画像から前記再生総時間に応じた所定数の画像を選択する選択手段、
    として機能させることを特徴とするプログラム。
JP2015226133A 2015-11-18 2015-11-18 画像処理装置、画像選択方法及びプログラム Active JP6418136B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2015226133A JP6418136B2 (ja) 2015-11-18 2015-11-18 画像処理装置、画像選択方法及びプログラム
KR1020160134903A KR102646124B1 (ko) 2015-11-18 2016-10-18 화상 처리 장치, 화상 선택 방법 및 매체에 기록된 프로그램
CN201610974411.XA CN107018348B (zh) 2015-11-18 2016-11-04 图像处理装置、图像选择方法以及记录介质
US15/347,517 US10658006B2 (en) 2015-11-18 2016-11-09 Image processing apparatus that selects images according to total playback time of image data, image selection method, and computer-readable medium
EP16198117.0A EP3171365A1 (en) 2015-11-18 2016-11-10 Image processing apparatus that selects images according to total playback time of image data, image selection method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015226133A JP6418136B2 (ja) 2015-11-18 2015-11-18 画像処理装置、画像選択方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2017098638A true JP2017098638A (ja) 2017-06-01
JP2017098638A5 JP2017098638A5 (ja) 2018-03-01
JP6418136B2 JP6418136B2 (ja) 2018-11-07

Family

ID=58817429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015226133A Active JP6418136B2 (ja) 2015-11-18 2015-11-18 画像処理装置、画像選択方法及びプログラム

Country Status (3)

Country Link
JP (1) JP6418136B2 (ja)
KR (1) KR102646124B1 (ja)
CN (1) CN107018348B (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005033554A (ja) * 2003-07-14 2005-02-03 Seiko Epson Corp 画像再生システム及び画像再生プログラム、並びに画像再生方法
JP2010177731A (ja) * 2009-01-27 2010-08-12 Nikon Corp 画像再生装置及び撮像装置
JP2011009976A (ja) * 2009-06-25 2011-01-13 Hitachi Ltd 画像再生装置
JP2011082915A (ja) * 2009-10-09 2011-04-21 Sony Corp 情報処理装置、画像抽出方法及び画像抽出プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8547114B2 (en) * 2006-11-14 2013-10-01 Cypress Semiconductor Corporation Capacitance to code converter with sigma-delta modulator
JP4811433B2 (ja) * 2007-09-05 2011-11-09 ソニー株式会社 画像選択装置、画像選択方法、およびプログラム
US8502879B2 (en) * 2010-05-26 2013-08-06 Sony Corporation Camera system and method for taking photographs that correspond to user preferences
JP6012405B2 (ja) * 2012-10-31 2016-10-25 株式会社三共 スロットマシン
CN104408687B (zh) * 2014-10-31 2018-07-27 酷派软件技术(深圳)有限公司 一种图片播放的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005033554A (ja) * 2003-07-14 2005-02-03 Seiko Epson Corp 画像再生システム及び画像再生プログラム、並びに画像再生方法
JP2010177731A (ja) * 2009-01-27 2010-08-12 Nikon Corp 画像再生装置及び撮像装置
JP2011009976A (ja) * 2009-06-25 2011-01-13 Hitachi Ltd 画像再生装置
JP2011082915A (ja) * 2009-10-09 2011-04-21 Sony Corp 情報処理装置、画像抽出方法及び画像抽出プログラム

Also Published As

Publication number Publication date
KR20170058266A (ko) 2017-05-26
JP6418136B2 (ja) 2018-11-07
CN107018348A (zh) 2017-08-04
CN107018348B (zh) 2020-02-07
KR102646124B1 (ko) 2024-03-12

Similar Documents

Publication Publication Date Title
JP5028225B2 (ja) 画像合成装置、画像合成方法、およびプログラム
JP2014096757A (ja) 画像処理装置および画像処理方法、並びにプログラム
CN103327234B (zh) 图像处理装置、以及图像处理方法
JP5794215B2 (ja) 画像処理装置、画像処理方法及びプログラム
US20150379748A1 (en) Image generating apparatus, image generating method and computer readable recording medium for recording program for generating new image by synthesizing a plurality of images
JP6341184B2 (ja) 画像処理装置、画像処理方法及びプログラム
US10658006B2 (en) Image processing apparatus that selects images according to total playback time of image data, image selection method, and computer-readable medium
JP2014187551A (ja) 画像取得装置、画像取得方法及びプログラム
JP6614198B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6418136B2 (ja) 画像処理装置、画像選択方法及びプログラム
JP2016066343A (ja) 画像生成装置、画像生成方法及びプログラム
JP2017098639A (ja) 画像処理装置、画像選択方法及びプログラム
WO2021240644A1 (ja) 情報出力プログラム、装置、及び方法
JP6720509B2 (ja) 画像評価装置、画像評価方法及びプログラム
JP2010193026A (ja) 画像再生装置、画像再生方法およびプログラム
JP6372176B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6512208B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2007221498A (ja) カメラ、音楽画像装置、音楽画像再生方法、プログラム
JP2014217030A (ja) 映像再生装置及び映像再生プログラム
JP2018166314A (ja) 画像処理装置、画像処理方法及びプログラム
JP5560744B2 (ja) 撮像装置、動画撮像方法、及び、プログラム
JP6424620B2 (ja) 画像生成装置、画像生成方法及びプログラム
JP6064404B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5726642B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2012235481A (ja) 画像処理装置、画像処理方法および画像処理プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180117

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180117

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180123

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180924

R150 Certificate of patent or registration of utility model

Ref document number: 6418136

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150