JP6866142B2 - プログラム、画像処理装置、および画像処理方法 - Google Patents

プログラム、画像処理装置、および画像処理方法 Download PDF

Info

Publication number
JP6866142B2
JP6866142B2 JP2016239740A JP2016239740A JP6866142B2 JP 6866142 B2 JP6866142 B2 JP 6866142B2 JP 2016239740 A JP2016239740 A JP 2016239740A JP 2016239740 A JP2016239740 A JP 2016239740A JP 6866142 B2 JP6866142 B2 JP 6866142B2
Authority
JP
Japan
Prior art keywords
frame
analysis
feature amount
predetermined condition
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016239740A
Other languages
English (en)
Other versions
JP2018098579A (ja
Inventor
茂樹 弘岡
茂樹 弘岡
悟 間宮
悟 間宮
チャン サミー
チャン サミー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2016239740A priority Critical patent/JP6866142B2/ja
Priority to US15/832,492 priority patent/US10536625B2/en
Publication of JP2018098579A publication Critical patent/JP2018098579A/ja
Application granted granted Critical
Publication of JP6866142B2 publication Critical patent/JP6866142B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/59Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
    • G06V20/597Recognising the driver's state or behaviour, e.g. attention or drowsiness
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/681Motion detection
    • H04N23/6811Motion detection based on the image signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/193Preprocessing; Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、動画像から出力対象の候補のフレームを選択するプログラム、画像処理装置、および画像処理方法に関する。
従来、動画像データに含まれる複数のフレームから特定のフレームを選択し、そのフレームの静止画像データを生成する技術がある。例えば、動画像から観賞に適した数枚の静止画像を自動的に生成する。この場合、例えば画質に基づいてフレームの評価を行い、評価の高いフレームの選択が行われる。この際、動画像データに含まれる多数のフレームについて解析や評価を行うと処理負荷が大きいため、サンプリングなどにより一部のフレームのみを復号、解析することにより処理時間の抑制が行われることがある。
しかし、一部のフレームのみについて解析や評価を行う場合、解析されたフレームの中では評価が高かったフレームだとしても、そのフレームが観賞のための静止画像として適切であるとは限らない。
特許文献1に記載の技術では、解析されたフレームに含まれる顔の表情が満足であるか否かが判定される。そして、表情が満足であると判定されなかった場合には該フレームが保存されずに、動画像において該フレームから遅延させたフレームが保存される。
特表2009―527983号公報
しかしながら、特許文献1に記載のように、解析が行われた元のフレームから遅延させたフレームの方が、上記元のフレームよりも適切でないことがある。即ち、上記の元のフレームではなく、元のフレームから遅延させたフレームを選択することで、かえって適切でないフレームを選択してしまうことがある。
本発明は上記問題を鑑み、動画像から出力対象の候補のフレームを選択する場合に、解析対象のフレームの数を抑えた上で、より適切なフレームを選択することができる技術を提供することを目的とする。
上記目的を達成するために、本発明におけるプログラムは、動画像から出力対象の候補のフレームを選択するためのプログラムであって、前記動画像に含まれているフレームを解析する解析手段と、記解析手段による解析の結果に基づいて、前記出力対象の候補としての候補フレームを選択する選択手段としてコンピュータを機能させ、前記動画像に含まれているフレームのうち、フレーム間予測を用いずに符号化されるフレームである第1のフレームが所定の特徴量に関する所定の条件を満たす場合、前記解析手段は、前記動画像に含まれ且つ前記フレーム間予測を用いて符号化されるフレームである第2のフレームを解析し、前記選択手段は、前記第1のフレームの前記解析手段による解析の結果と、前記第2のフレームの前記解析手段による解析の結果とに基づき、前記第1のフレームと前記第2のフレームから前記候補フレームを選択し、前記第1のフレームが前記所定の条件を満たさない場合、前記解析手段は、前記第2のフレームを解析せず、前記選択手段は、前記第1のフレームを前記候補フレームとして選択することを特徴とする。
本発明によれば、動画像から出力対象の候補のフレームを選択する場合に、解析対象のフレームの数を抑えた上で、より適切なフレームを選択することができる
実施形態1の画像処理装置のハードウェア構成の一例を示したブロック図である。 実施形態1の画像処理装置の機能構成の一例を示したブロック図である。 実施形態1の画像処理装置に記憶されるテーブルの一例を示す図である。 実施形態1における静止画像の選択処理の一例を示すフローチャートである。 選択候補決定処理の一例を示すフローチャートである。 実施形態1における、追加解析画像までのオフセットを決定するオフセット決定処理を示すフローチャートである。 実施形態2におけるオフセット決定処理の一例を示すフローチャートである。 実施形態2において画像処理装置に記憶されるテーブルの一例を示す図である。 実施形態3におけるオフセット決定処理の一例を示すフローチャートである。 実施形態4におけるオフセット決定処理の一例を示すフローチャートである。
以下、添付の図面を参照して、本発明の実施形態に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
<実施形態1>
図1は、本実施形態において、動画像から出力対象のフレームを選択する画像処理装置のハードウェア構成の一例を示したブロック図である。
図1において、100は画像処理装置のハードウェア全体である。102は中央演算処理装置(以下、CPU)である。CPU102は、後述する各種処理のための演算および論理判断を行ない、データや命令をやり取りするためのシステムバス101に接続された各構成要素を制御する。105は本実施形態における動画像データや該動画像データから抽出された静止画像データ、プログラムを記憶しておくためのハードディスク等の記憶装置である。106はユーザが情報の入力あるいは操作を行なうためのマウス、キーボード、タブレット等の入力部である。107はグラフィックコントローラ等の出力のための回路を含むディスプレイ等の出力部である。
また画像処理装置100には、プログラムメモリとデータメモリが搭載されている。プログラムメモリには、後述するフローチャートで示す各処理を実行するためのプログラムを格納されている。CPU102がプログラムメモリに格納されているプログラムをデータメモリ上で実行することで、後述する各フローチャートで示す処理が実行される。該プログラムメモリはROM103であっても良いし、記憶装置105であっても良い。
図2は、本実施形態における画像処理装置100の機能構成の一例を示すブロック図である。CPU102が、プログラムメモリ内のプログラムを実行することで、図2に示す各機能構成として動作する。
201は動画像データを入力するための動画像入力部である。202は、動画像入力部201により入力された動画像データのうち、指定されたフレームを復号して静止画像データを生成するための動画像復号部である。203は、動画像復号部202により生成された静止画像データおよび該静止画データの特徴量を管理する静止画像データ管理部である。静止画像データ管理部203は、図3(a)、図3(b)で後述する2つのテーブルを管理する。なお、該2つのテーブルは、例えばRAM104に記憶され、RAM104において管理される。
204は、動画像復号部202により生成された静止画像データ(フレーム)の各種の特徴量について解析し、その静止画像データ(フレーム)の評価を行うための静止画像解析部である。205は、静止画像解析部204による評価に応じて、出力対象の候補の静止画像データ(フレーム)を選択する静止画像選択部である。206は、静止画像解析部204による静止画像データ(フレーム)の解析結果、評価を元に、追加解析を行う静止画像データ(フレーム)を決定する追加画像決定部である。
本実施形態では、例えば第1フレームについての静止画像解析部204による解析、評価の結果、追加画像決定部206により新たな第2フレームが決定された場合、静止画像解析部204は、該第2フレームについても解析、評価を行う。そして、静止画像データ管理部203は、第1フレームと第2フレームのうち、評価値の高い方のフレームを出力対象の候補として選択する。そのため、仮に上記の第1フレームの方が第2フレームよりも評価が高い場合には、第1フレームが出力対象の候補として選択される。本実施形態の静止画像データ(フレーム)の選択処理の詳細については後述する。
図3は、画像処理装置100に記憶されるテーブルの一例を表す図である。図3に示すテーブルは、例えばCPU102によりRAM104に記憶される。
図3(a)は、動画像復号部202により復号され、静止画像解析部204により解析、評価された静止画像の一覧を示すテーブルである。図3(a)の例では、動画像復号部202は、動画像入力部201に入力された動画像に含まれている複数のフレームについて、30フレーム毎に復号するものとする。図3(a)に示すテーブルにおいて、各行は、復号された1枚の静止画像を表している。図3(a)に示すテーブル中の1つの静止画像データにおいて、最も左の列は動画像の対応するフレームのフレーム番号、左から2つ目の列は静止画像の評価スコアを示す。左から3つ目以降の列は、静止画像を解析した結果の各特徴量を表しており、各特徴量は、解析時に最小値0、最大値1に正規化されている。図3(a)において、「目瞑り特徴量」は、画像に含まれている人物が目を瞑っている程度を示し、目を瞑っている程度が高い場合、目瞑り特徴量が多くなる。また「ボケ・ブレ特徴量」は、画像のボケまたはブレの程度を示し、ボケやブレが大きいほど、「ボケ・ブレ特徴量」が多くなる。目瞑りの程度やボケやブレの程度については、公知である種々の方法により算出することができる。
なお、図3(a)では、特徴量として「目瞑り特徴量」、「ボケ・ブレ特徴量」を示しているが、例えば静止画像の露出、彩度などの画質および被写体の種類、位置、大きさ、表情などの特徴量も算出、正規化され、図3(a)が示すテーブルに含まれる。ただし、図3(a)では、これらその他の特徴量については、具体的な値が省略されている。
図3(a)に示す「評価スコア」は、静止画像解析部204により各行に対応する静止画像の各特徴量に基づいて算出された評価を示す。そして、「目瞑り特徴量」、「ボケ・ブレ特徴量」が大きいほど、「評価スコア」は低くなる。即ち、ある静止画像が出力対象として適切でない場合に、該静止画像に特徴量としてより大きな値が与えられる。また、「目瞑り特徴量」、「ボケ・ブレ特徴量」以外のその他の特徴量についても、出力対象として適切でない場合に、特徴量としてより大きな値が与えられる。なお、「評価スコア」の算出方法としては各種の方法を用いることができる。 図3(b)は、出力対象の候補としての静止画像(候補フレーム)の一覧を示すテーブルであり、静止画像選択部205は、図3(b)のテーブルが示す静止画像から、出力対象の静止画像を選択する。該テーブルにおいて、各行は復号された1枚の静止画像を表している。テーブル中の1つの静止画像データにおいて、左の列は動画像の対応するフレームのフレーム番号、右の列は静止画像の評価スコアである。即ち、図3(a)に示したテーブルにおける左の2列の情報が、図3(b)に示すテーブルとなる。
ただし、後述するように、図3(a)に示すテーブルが対応する複数のフレームのうち、「目瞑り特徴量」または「ボケ・ブレ特徴量」が高いフレーム(元フレーム)については、追加画像決定部206により新たな解析対象としてのフレームが決定される。そして、静止画像解析部204は、追加画像決定部206により決定された新たなフレームについて各種の特徴量の解析、評価を行う。静止画像データ管理部203は、上記の元フレームと、上記の新たなフレームのうち、より評価スコアの高いフレームを、図3(b)に示すテーブルに、選択候補として含ませる。例えば図3(b)では、図3(a)が示すフレーム番号が「1」のフレームではなく、該フレームよりも評価スコアの高い、フレーム番号が「4」のフレームが選択候補としてテーブルに含まれている。
図4は、本実施形態における画像処理装置100が静止画像を選択する処理の一例を示すフローチャートである。図4に示すフローチャートが示す各処理は、CPU102がプログラムメモリに格納されているプログラムをデータメモリ上で実行し、図2に示す各要素として機能することで実現される。以下の説明では、図2に示す各要素が、図4に示すフローチャートが示す上記の各処理を実行するものとして説明する。
動画像入力部201は、画像処理装置100の外部の装置やメモリ、または記憶装置105等の内部のメモリから、出力対象の静止画像が選択される動画像を取得する(S401)。S401において入力される動画像のフォーマットは、MPEG形式である。また該動画像には、フレーム間予測により符号化されているPフレーム(Predicted Frame)、Bフレーム(Bi−directed Predicted Frame)が含まれている。さらに、フレーム間予測を用いずに、静止画像として圧縮されているIフレーム(Intra Frame)が含まれる。
動画像復号部202は、S401において取得された動画像のPフレームとBフレームは復号せずに、Iフレームを特定して復号することで静止画像を生成し、生成された静止画像を記憶装置105に保存する(S402)。Iフレームの符号化にはフレーム間予測が使用されていないため、Iフレームの復号処理には、Pフレーム、Bフレームの復号処理のように、他のフレームの復号が必要でない。そのため、Iフレームの復号処理はPフレーム、Bフレームに比べて復号にかかる処理量が少なく、処理の高速化が期待できる。さらに、Iフレームの場合、フレーム間予測が用いられないため、Pフレーム、Bフレームよりも画質が良い可能性が高い。そのため、動画像復号部202は、出力対象の選択候補として、Iフレームを復号する。またS402では、Pフレーム、Bフレームが復号されないため、全てのフレームが復号される場合に比べて、フレームの復号のための処理時間が短縮される。
なお、S402において動画像復号部202は、復号された静止画像に動画像のファイル名およびフレーム番号に応じたファイル名を付与して記憶装置105に保存し、それにより、該静止画像を識別可能である。
次に、静止画像データ管理部203は、S402で生成された複数の静止画像(複数のIフレーム)のうち、S401で入力された動画像において時系列的に最初のものを、現在着目している静止画像IcとしてRAM104に読み込む(S403)。そして、静止画像データ管理部203は、図5を用いて後述する選択候補決定処理により、図3(b)に示したテーブルに保持する静止画像を決定する(S404)。
次に、静止画像データ管理部203は、S402で保存され、S404において選択候補決定処理が実行されていない静止画像が記憶装置105に記憶されているか否かを判定する(S405)。S405において上述の静止画像が記憶装置105に記憶されていると判定された場合に、静止画像データ管理部203は、それらの静止画像のうち時系列的に最初のものを現在着目している静止画像IcとしてRAM104に読み込む(S407)。そして、静止画像データ管理部203は、S407において読み込まれた静止画像について、S404において選択候補決定処理を実行する。一方、S405において上述の静止画像が記憶装置105に記憶されていないと判定された場合に、処理がS406に進む。静止画像選択部205は、選択候補決定処理で決定され、図3(b)に示すテーブルが含む出力対象の候補である候補フレームから、出力対象のフレームを選択する(S406)。具体的には、S406において静止画像選択部205は、評価スコアが上位である静止画像を予め決められた枚数選択する。
図5は本実施形態における選択候補決定処理の一例を示すフローチャートであり、図4のS404の詳細を示す。
静止画像データ管理部203は、現在着目している静止画像Icに対応するフレームから追加で復号するフレームまでのフレーム数を示すオフセットを0で初期化する(S501)。次に、静止画像解析部204が、静止画像Icの各特徴量を抽出し(S502)、該特徴量を元に静止画像Icの評価スコアScを算出する(S503)。さらに静止画像データ管理部203は、図3(a)に示したテーブルに、S502で抽出された特徴量と、S503で算出された評価スコアScを、静止画像Icのフレーム番号に対応付けて記憶する。評価スコアは、テーブル(3a)に記載の目瞑り特徴量、ボケ・ブレ特徴量に加えて、静止画像の露出、彩度などの画質および被写体の種類、位置、大きさ、表情などの特徴量に適切な重みをかけたものを積算して算出するものとする。本実施形態で取り上げた目瞑り特徴量、ボケ・ブレ特徴量のように静止画像の評価に対して負の影響を与える特徴量の場合には、重みは負の値となる。
そして、追加画像決定部206は、図6で詳細を後述する追加解析画像を示すオフセットを決定するオフセット決定処理を行う(S504)。S504におけるオフセット決定処理により、追加画像決定部206は、S401で入力された動画像において、静止画像Icから追加で解析する静止画像に対応するフレームまでのフレーム数であるオフセット値を決定する。
次に静止画像データ管理部203は、S504において決定されたオフセットが0より大きいか否か、すなわち追加で静止画像を復号、解析する必要があるか否かを判断する(S505)。S505の判断の結果、オフセットが0より大きくない場合には、追加で静止画像を復号、解析する必要なないとして、S511に処理が移る。
S505の判断の結果、オフセットが0より大きい場合には、S506に処理が進む。動画像復号部202は、S401で入力された動画像において、現在の静止画像Icに対応するフレームのフレーム番号にオフセットを加えた番号のフレームを特定し、特定されたフレームを追加で復号する(S506)。なお、S506において復号されるフレームは、あくまで特定されたフレーム番号のフレームであり、Iフレームに限らず、PフレームまたはBフレームでもよい。静止画像解析部204は、S506における追加の復号によって生成された追加静止画像Iaの特徴量を抽出する(S507)。それから、追加静止画像Iaの評価スコアSaをS503における処理と同様の処理により算出する(S508)。
静止画像データ管理部203は、追加静止画像Iaの評価スコアSaが静止画像Icの評価スコアScより大きいか否かを判断する(S509)。該判断の結果、SaがScより大きい場合には、処理がS510に進む。静止画像データ管理部203は、追加静止画像Iaに対応するフレーム番号と評価スコアSaを、図3(b)が示す、選択候補の静止画像一覧を示すテーブルに追加して(S510)、処理を終了する。S510における処理により、静止画像Iaに対応するフレームが、出力対象の候補である候補フレームとして選択される。一方、S509の判断の結果、SaがScより大きくない場合には、静止画像Icに対応するフレーム番号と評価スコアScを、図3(b)が示す、選択候補の静止画像一覧を示すテーブルに追加して(S511)、処理を終了する。S511における処理により、静止画像Icに対応するフレームが、出力対象の候補である候補フレームとして選択される。
図6は、実施形態1における、追加解析画像までのオフセットを決定するオフセット決定処理を示すフローチャートであり、図5のS504の詳細を示す。
追加画像決定部206は、図3(a)が示すテーブルにおいて、現在着目している静止画像Icの所定の特徴量として目瞑り特徴量Fbcを特定し、特定された目瞑り特徴量Fbcが目瞑り特徴量用の閾値Tbを超えているか否かを判断する(S601)。S601の判断の結果、目瞑り特徴量Fbcが閾値Tbを越えていない場合には、処理がS602に進む。目瞑り特徴量Fbcが閾値Tbを越えている場合には、静止画像Icが、目瞑り特徴量に関して、他のフレームを追加で解析・評価する必要がある所定の条件を満たす静止画像であるとして、処理がS603に進む。
追加画像決定部206は、図3(a)が示すテーブルにおいて、静止画像Icのボケ・ブレ特徴量Fscを所定の特徴量として特定し、特定されたボケ・ブレ特徴量Fscがボケ・ブレ特徴量用の閾値Tsを超えているか否かを判断する(S602)。ボケ・ブレ特徴量Fscが閾値Tsを越えていなければ、図6に示す処理が終了する。ボケ・ブレ特徴量Fscが閾値Tsを越えていれば、静止画像Icが、ボケ・ブレ特徴量に関して、他のフレームを追加で解析・評価する必要がある所定の条件を満たす静止画像であるとして、処理がS603に進む。
追加画像決定部206は、S603において、追加で解析される対象となるフレームを特定するためのオフセットを3に決定してする。即ち、図6に示す処理によれば、目瞑り特徴量Fbcが閾値Tbを越えているという条件と、ボケ・ブレ特徴量Fscが閾値Tsを越えている等条件のいずれかが満たされれば、オフセットが0から3に更新される。即ち、S506〜S508の処理により、追加でフレームの復号、解析、評価が行われ、S509において現在着目の静止画像Ic(Iフレーム)との評価スコアの比較が行われる。
図6に示した処理について、図3(a)に示すテーブルを用いて具体的に説明する。例えば、ボケ・ブレ特徴量のための閾値Tsが「0.5」である場合、フレーム番号1に対応する静止画像Ic(Iフレーム)は、S602において、ボケ・ブレ特徴量FscがTsを超えていると判断される。そのため、S603の処理において、オフセットが3に設定される。その結果、図5のS505においてオフセットが0より大きいと判断される。そのため、S506において、動画像に含まれる複数フレームのうち、フレーム番号の1にオフセットの3を加えた4番目のフレームが追加で復号され、静止画像が生成・保存される。そして、S507で該静止画像の特徴量が抽出され、S508で評価スコアSaが算出される。例えば評価スコアSaが0.86であったものとすると、S509における比較の結果、評価スコアSaが評価スコアScより高いため、図3(b)に示す選択候補の静止画像一覧を示すテーブルに、フレーム番号4とその評価値0.86が記憶される。
同様に、図3(a)のテーブルが示すフレーム番号61に対応する静止画像Ic(Iフレーム)は、目瞑り特徴量FbcがTb(例えば0.6)よりも高いために、S603において、オフセットが3に設定される。その結果、S505において、オフセットが0より大きいと判断され、フレーム番号の61にオフセットの3を加えた64番目のフレームがS506において追加で復号され、静止画像が生成・保存される。そして、S507において該静止画像の特徴量が抽出され、S508において評価スコアSaが算出される。ここで、評価スコアSaが0.68であったものとする。すると、S509の比較の結果、評価スコアSaよりも評価スコアSc(0.72)の方が高いため、図3(b)に示す選択候補の静止画像一覧を示すテーブルには、フレーム番号61とその評価値0.72が記憶される。
図3(a)のテーブルが示すフレーム番号31、91に対応する静止画像については、目瞑り特徴量、ボケ・ブレ特徴量が共に小さく、図6のS601、S602のいずれでも「No」と判定される。そのため、図3(b)に示す選択候補の静止画像一覧を示すテーブルには、フレーム番号31、91と、それぞれのフレーム番号に対応する静止画像の評価スコアが記憶される。
その結果、図4のS406において静止画像選択部205は、図3(b)に示す選択候補の静止画像一覧を示すテーブルから、上位の評価スコアの静止画像を選択する。例えば2枚の静止画像が選択されるとすると、フレーム番号4と91の静止画像が選択される。
以上の実施形態の画像処理装置100によれば、動画像に含まれている複数のフレームの一部のフレームを復号・解析する。具体的には、Iフレームが復号・解析される。そして、その解析の結果、目瞑りやブレ・ボケが発生している場合に、追加の解析が行われ、目瞑りやブレ・ボケが発生していない場合には、追加の解析が行われない。そのため、Iフレームについて目瞑りやブレ・ボケが発生しており、他のフレームについても参照した方が良い場合に、追加でフレームの解析が行われる。よって、全てのフレームを解析する場合に比べて、フレーム解析の負荷を抑えた上で、より適切なフレームを選択することができる。
また、追加でフレームの解析が行われたとしても、現在着目している静止画像Ic(Iフレーム)の方が追加で解析されたフレームの静止画像Iaよりも評価スコアが高い場合、静止画像Icが選択候補となる。そのため、静止画像Icよりも評価の低い静止画像Iaが選択候補となることを防ぐことができる。
なお、以上の実施形態では、特徴量の値が閾値に満たない場合に追加で復号および解析するフレームは1枚であったが、予め決められた複数枚のフレームを追加復号および解析して、評価するように構成しても良い。
また以上の実施形態において画像処理装置100は、出力対象の候補として静止画像を種々の目的で選択してもよい。例えば、画像処理装置100が、静止画像をテンプレートに自動的に配置することで電子アルバムを作成し、出力装置に出力しても良い。例えば画像処理装置100が、出力装置としての表示装置または印刷装置に電子アルバムのデータを出力し、表示または印刷を行わせても良い。その際に、画像処理装置100が、テンプレートへ配置されて電子アルバムとして表示または印刷される静止画像を動画像から自動的に選択するために、以上の実施形態が用いられてもよい。その場合、例えば動画像から自動的に選択された多くの静止画像が、元から静止画像として撮影された画像とともに、テンプレートへの配置候補となる。そして、画像の画質、構図等により、配置候補の画像からテンプレートへ配置される画像がさらに絞り込まれ、その絞り込まれた画像を、画像処理装置100がテンプレートに配置してもよい。
また例えば、テンプレートにおけるスロット(静止画像が配置される領域)の数や、電子アルバムのページ数に応じて、S406において選択される静止画像(フレーム)の数が異なっていても良い。例えば、スロットの数や電子アルバムのページ数が多い場合、テンプレートへ配置される静止画像が多くなるため、配置候補の静止画像も多い方が望ましい。よって、例えば電子アルバムの複数ページにおけるスロットの合計数が閾値より多い場合、S406において、該合計数が該閾値以下の場合に比べて多くの静止画像が選択されてもよい。
また図4に示した処理では、まず動画からIフレームが抽出されるが、追加で解析されるフレームは、PフレームまたはBフレームとなる。PフレームまたはBフレームの場合、フレーム間予測により符号化されているため、Iフレームに比較して画質が落ちることが多い。仮に静止画像解析部204の解析において、フレーム間予測による画質低下が解析に反映されていない場合、追加で解析されたPフレームまたはBフレームについて、スコアが落ちるよう、評価スコアが調整されてもよい。
また、以上の実施形態では現在着目している静止画像Icの評価スコアScと追加で復号された静止画像Iaの評価スコアSaを比較して、評価が良い方の静止画像が選択される。しかしこれに限らず、上記の比較をせずに、静止画像Icと静止画像Iaの両方が出力対象の候補として、図3(b)に示すテーブルに追加されてもよい。
さらに以上の実施形態では、追加で解析を行うか否かを判断するための処理(S504、図6)と、追加で解析が行われた場合に、出力対象の候補である候補フレームを選択する処理(S509〜S511)が共通の特徴量に基づいて実行されていた。つまり、上記2つの処理のいずれにも、目瞑り特徴量とボケ・ブレ特徴量が考慮されていた。しかしこれに限らず、個別の特徴量により上記2つの処理が実行されてもよい。例えば、出力対象の候補である候補フレームを選択する処理(S509〜S511)では、目瞑り特徴量とボケ・ブレ特徴量とは異なる特徴量が解析された結果のみを用いて得られた評価により、候補フレームが選択されてもよい。目瞑り特徴量とボケ・ブレ特徴量とは異なる特徴量としては、例えば画像における人物の顔の大きさ、顔の位置、顔の数等の種々の特徴量を用いることができる。
また、追加で解析を行うか否かを判断するための処理のために、S503で算出された静止画像Icの評価スコアScが、出力対象の候補である候補フレームを選択する処理(S509)でも用いられた。しかしこれに限らず、出力対象の候補である候補フレームを選択する処理(S509)では、S503とは別の評価基準により改めて静止画像Icの評価が行われても良い。ただし、図5に示したように、S503において算出された評価スコアScをS509でも用いることで、処理を簡略化することができる。
さらに、図6に示した処理では、静止画像Icが所定の特徴量に関する所定の条件を満たすか否かに応じて、追加画像決定部206が追加で解析されるフレームを決定するか否かが変更されていた。しかしこれに限らず、追加画像決定部206が、静止画像Icが所定の特徴量に関する所定の条件を満たすか否かに関わらず、追加で解析されるフレームを決定してもよい。その上で、そのフレームが静止画像解析部204により解析されるか否かが、上記所定の条件が満たされるか否かで変更されてもよい。
<実施形態2>
実施形態1では、追加で復号および解析を行うフレームのフレーム番号を特定するためのオフセット値は、特徴量の種類(図6では「目瞑り特徴量」と「ボケ・ブレ特徴量」)によらず一定(図6では「3」)であった。ところが、特徴量の値が所定の閾値を超えており、出力対象の静止画像として好ましくないフレームについて、その特徴量が閾値を下回るまでに要する時間(フレーム数)は必ずしも一定ではない。例えば、被写体の人物が瞬きにより目を瞑っていた状態から目が開いた状態に戻るまでの時間と、オートフォーカスによりピントが合っていない状態(ボケ・ブレ特徴量)からピントが合った状態になるまでの時間は必ずしも同じではない。そこで実施形態2においては、複数種類の特徴量のうちの、所定の閾値を越えた特徴量の種類に応じて、オフセットの値を異ならせる処理について説明する。なお、実施形態2において、追加解析画像のフレーム番号を特定するためのオフセットを決定するオフセット決定処理以外の処理は、実施形態1と同様である。
図7は実施形態2におけるオフセット決定処理の一例を示すフローチャートである。実施形態2では、図5のS504において、図7のフローチャートが示す処理が実行される。
追加画像決定部206は、現在着目している静止画像Icの目瞑り特徴量Fbcが上述の閾値Tbを超えているか否かを判断する(S701)。S701の判断の結果、目瞑り特徴量Fbcが上述の閾値Tbを超えている場合には、追加画像決定部206は、オフセットを7に設定する(S702)。次に追加画像決定部206は、静止画像Icのボケ・ブレ特徴量Fscが上述の閾値Tsを超えているか否かを判断し(S703)、ボケ・ブレ特徴量Fscが閾値Tsを越えていなければ図7の処理を終了する。
一方、S703において、ボケ・ブレ特徴量Fscが上述の閾値Tsを超えていると判断された場合には、現在のオフセットが3よりも小さいかどうかを判断する(S704)。S704でオフセットが3よりも小さいと判断された場合は、追加画像決定部206は、オフセットを3に設定する(S705)。S704において3よりも大きいと判断されば、追加画像決定部206はオフセットの更新は行わずに図7の処理を終了する。即ち、静止画像Icにおいて被写体の人物の目瞑りの程度が大きく、S702においてオフセットが7に設定された場合、そのオフセットが更新されずに図7の処理が終了する。
図7に示す処理は、例えば目瞑りが解消されるのに必要な時間(即ち人物が瞬きの際に目を開ける時間)の方が、ボケやブレが解消されるのに必要な時間より長いと考えられる場合の処理である。即ち、静止画像Icにボケやブレが発生した場合に比べて、目瞑りが発生した場合に、静止画像Icからのフレーム間隔がより広いフレームが追加の解析対象として特定される。そのため、例えば追加の解析対象として特定されたフレームと、静止画像Icとのフレーム間隔(時間)が短いため目瞑りが解消されていないという可能性を低減することができる。
なお、図7では目瞑り特徴量と、ボケ・ブレ特徴量のみを判定したが、特徴量の種類はこれらに限定されない。例えば、目瞑り特徴量、ボケ・ブレ特徴量に加えて判定を行う必要がある特徴量があってもよい。そして、その特徴量が閾値以上の場合に、目瞑り特徴量やボケ・ブレ特徴量が閾値以上の場合とは異なる所定の値がオフセットとして設定されるとする。この場合、図7における「処理終了」の前に、S703〜S705に相当する処理が追加される。なお、S704、S705に相当する処理では、オフセット値として「3」ではなく、上記の所定の値が用いられる。以上のように処理が追加されることで、判定対象の特徴量として種々の特徴量が追加された場合でも、図7の処理により設定される最終的なオフセット値としては、閾値以上の特徴量に対応するオフセット値のうちの最大の値が設定される。
図8は、実施形態2において画像処理装置に記憶されるテーブルの一例を示す図であり、該テーブルは、選択候補の静止画像一覧を示す。図8に示すテーブルは、図3(b)で示したテーブルと同様の内容を示し、例えばCPU102によりRAM104に記憶される。
図8に示すテーブルにおいて、各行は動画像から復号された1枚の静止画像を表している。テーブル中の1つの静止画像データにおいて、左の列は該動画像において対応するフレームのフレーム番号、右の列は静止画像の評価スコアである。
実施形態2において、図3(a)の1行目に記憶されているフレーム番号1に対応する静止画像は、S701の判断においてボケ・ブレ特徴量FbcはTb(例えば0.6)よりも低いため、オフセットは0のままである。一方、S703の判断において目瞑り特徴量FscはTs(例えば0.5)よりも高いために、S704の判断が行われる。このときオフセット値は0であるために、S704の判断の結果S705に処理が進み、S705においてオフセットが3に設定される。その結果、S505の判断でオフセットが0より大きいため、フレーム番号の1にオフセットの3を加えたフレーム番号が4番のフレームがS506において追加で復号され、静止画像Iaが生成・保存される。それから、S507で静止画像Iaの特徴量が抽出され、S508で評価スコアSaが算出される。ここで、Saが0.86であったものとする。すると、S509の比較の結果、評価スコアSc(0.66)より評価スコアSa(0.86)の方が高いため、図8が示すテーブルに、フレーム番号4とその評価値0.86が記憶される。
同様に、図3(a)の3行目に記憶されているフレーム番号61に対応する静止画像は、S701の判断において目瞑り特徴量FbcがTb(0.6)を超えているため、S702でオフセットが7に設定される。その後S703の判断においてブレ・ボケ特徴量FscはTs(0.5)よりも低いため、オフセットは7のままである。その結果、S505の判断の際にはオフセットが0より大きいため、S506では、フレーム番号の61にオフセットの7を加えたフレーム番号が68番のフレームが追加で復号され、静止画像Iaが生成・保存される。そして、S507で静止画像Iaの特徴量が抽出され、S508で評価スコアSaが算出される。ここで、評価スコアSaが0.97であったものとする。次に、S509で評価スコアSaと評価スコアScが比較される。該比較の結果、評価スコアSaの方が評価スコアScより高いため、S510において静止画像Iaが図8に示すテーブルに追加される。その結果、出力対象の候補として選択される静止画像の枚数が2枚であるとすると、S406では、図8に示すテーブルにおいて上位の評価スコアの2枚の静止画像であるフレーム番号4と68の静止画像が選択される。
以上の実施形態によれば、動画内のフレームの所定の特徴量が静止画像データとしての水準を満たしていない場合に、該特徴量の種類に応じたフレーム数(時間)だけ間隔を開けた時間的に後のフレームが追加で解析される。そのため、特徴量の種類により、その特徴量に関する要因(目瞑り、ボケ・ブレ等)が解消されるのに要する時間が異なる場合、適切なフレーム間隔をあけて、追加解析の対象であるフレームを特定することができる。
なお、以上の実施形態では、あるフレームについて、所定の水準を満たしていない(閾値以上の)すべての特徴量に対応するオフセットのうち、最大のオフセットだけ該フレームからフレーム間隔をあけた1枚のフレームのみが追加で復号、解析された。しかし、所定の水準を満たしていない(閾値以上の)すべての特徴量のそれぞれに対応するオフセットだけ離れた、複数のフレームを追加で復号して解析するようにしてもよい。例えば図7においてS701と、S703で共にYesと判定される状況において、静止画像Icからオフセット3、オフセット7だけフレーム間隔をあけた時間的に後の2枚のフレームが追加で解析されてもよい。
また以上の実施形態では、特徴量の値が閾値に満たない場合には、追加で復号および解析されるフレームまでのオフセットを特徴量の種類に応じて決定した。しかしこれに限らず、追加で復号および解析されるフレームの枚数、またはオフセットとフレームの枚数の両方が、特徴量の種類に応じて決定されるように構成しても良い。また、以上の実施形態では現在着目している静止画像Icの評価スコアScと追加で復号された静止画像Iaの評価スコアSaを比較して、良い方を選択するようになっているが、比較をせずに必ずIaを選択するように構成しても良い。
<実施形態3>
実施形態1では、特定のフレームの特徴量の値が所定の閾値を超えている場合には、動画像において一定のフレーム間隔をあけた時間的に後のフレームが必ず追加で復号・解析された。ところが、該一定のフレーム間隔をあけたフレームにおいて、必ず該特徴量の値が閾値を下回るとは限らない。例えば、あるフレームにおいて被写体の人物が目を瞑っている場合に、それが瞬きであれば、少し後のフレームにおいて目を開いている可能性は高い。しかし、該人物が意図的に目を瞑っている場合にはその限りではない。その場合、追加の復号および解析が無駄な処理となってしまう恐れがある。そこで実施形態3においては、特定のフレームの特徴量の値が所定の閾値を超えている場合には、既に復号済みの次のフレームにおいて該特徴量の値が閾値を下回っているかを事前に確認する例について説明する。なお、実施形態3において、追加で解析する画像のオフセット決定処理以外の処理は実施形態1と同様である。
図9は、実施形態3におけるオフセット決定処理の一例を示すフローチャートである。
追加画像決定部206は、図3(a)が示す、復号された静止画像(Iフレーム)の一覧において、現在着目している静止画像Icの目瞑り特徴量FbcがTb(例えば0.6)を超えているか否かを判断する(S901)。該判断の結果、目瞑り特徴量FbcがTbを越えていない場合には、S905に処理が移る。S901の判断の結果、目瞑り特徴量FbcがTbを越えている場合には、追加画像決定部206は、図4のS402において復号済みの、静止画像Icの次の復号済み静止画像InをRAM104に読み込む(S902)。S402において動画像復号部202は、動画像において30フレーム毎にIフレームを復号していた。そのため、S902では、該動画像において静止画像Icから30フレームの間隔をあけた時間的に後のIフレームが、復号済み静止画像Inとして読み込まれる。
次に追加画像決定部206は、静止画像Inの目瞑り特徴量Fbnを抽出し(S903)、目瞑り特徴量Fbnが閾値Tbを超えているか否かを判断する(S904)。目瞑り特徴量Fbnが閾値Tbを超えていない場合には、追加画像決定部206は、オフセットを3に設定し(S909)、処理を終了する。S904の判断の結果、目瞑り特徴量FbnがTbを超えている場合には、追加画像決定部206は、現在着目の静止画像Icのボケ・ブレ特徴量FscがTs(例えば0.5)を超えているか否かを判断する(S905)。S905の判断の結果、ボケ・ブレ特徴量FscがTsを超えていなければ、追加画像決定部206は、図9に示す処理を終了する。S905の判断の結果、ボケ・ブレ特徴量FscがTsを超えている場合には、追加画像決定部206は、上記の復号済み静止画像InをRAM104に読み込む(S906)。そして、追加画像決定部206は、静止画像Inのボケ・ブレ特徴量Fsnを抽出する(S907)。そして、追加画像決定部206は、ボケ・ブレ特徴量FsnがTsを超えているか否かを判断し(S908)、ボケ・ブレ特徴量FsnがTsを超えていない場合には、オフセットを3に設定し(S909)、図9に示す処理を終了する。S908の判断の結果、ボケ・ブレ特徴量FsnがTsを超えている場合には、追加画像決定部206は、図9に示す処理を終了する。
即ち、図9における処理によれば、現在着目の静止画像Icに目瞑りが発生している場合(S901でYes)、S904において、復号済みの次の静止画像Inにおいても目瞑りが発生しているか判定される。そして、復号済みの次の静止画像Inにおいても目瞑りが発生している場合(S904でYes)、S905においてNoと判定されれば、オフセットが3に設定されず、0のままである。即ち、図5のS505でNoと判定されるため、動画像において静止画像Icと静止画像Inの2つのフレームの間では、追加でフレームの解析は行われない。例えば、動画像の被写体の人物が意図的に目を瞑っており、該動画像における静止画像Icと静止画像Inの間の全フレームにおいても目を瞑っている場合がある。図9に示す処理によれば、静止画像Icと静止画像Inの間のフレームが追加で解析されることはないため、目瞑りが解消されないにもかかわらず無駄に追加でフレームの解析してしまうことを防ぐことができる。
同様に、図9における処理によれば、現在着目の静止画像Icにボケ・ブレが発生している場合(S905でYes)、S908において、復号済みの次の静止画像Inにおいてもボケ・ブレが発生しているか判定される。そして、復号済みの次の静止画像Inにおいてもボケ・ブレが発生している場合(S908でYes)、オフセットが3に設定されず、0のままである。即ち、図5のS505でNoと判定されるため、追加でフレームの解析は行われない。例えば、動画像撮影時の撮影条件の設定ミス等により、該動画像における静止画像Icと静止画像Inの間の全フレームにおいてもボケ・ブレが発生している場合がある。図9に示す処理によれば、静止画像Icと静止画像Inの間のフレームが追加で解析されることはないため、ボケ・ブレが解消されないにもかかわらず無駄に追加でフレームの解析してしまうことを防ぐことができる。
<実施形態4>
実施形態1では、動画像内の特定のフレームの特徴量の値が所定の閾値を超えている場合には、該動画像において一定のフレーム間隔をあけた時間的に後のフレームが必ず追加で復号および解析されていた。ところが、該特徴量の値が良くなるまでに必要なオフセット量(時間)が必ず一定とは限らず、該特徴量の値が良くなるまでには一般的に十分なオフセット量(時間)よりも多くオフセットが必要な場合もあり得る。そこで実施形態4においては、予め決められたオフセット後のフレームにおいても特徴量の値が閾値を超えている場合には、特徴量の値が閾値を下回るまで繰り返しオフセットを加える例について説明する。実施形態4において、追加で解析する静止画像を特定するオフセットを決定するオフセット決定処理以外の処理は実施形態1と同様である。
図10は、実施形態4におけるオフセット決定処理の一例を示すフローチャートである。
追加画像決定部206は、図3(a)のテーブルが示す、復号された静止画像の一覧に含まれる現在着目している静止画像Icの目瞑り特徴量Fbcが、Tb(例えば0.6)を超えているか否かを判断する(S1001)。S1001の判断の結果、目瞑り特徴量FbcがTbを越えていない場合には、追加画像決定部206は、静止画像Icのボケ・ブレ特徴量FscがTs(例えば0.5)を超えているか否かを判断する(S1002)。ボケ・ブレ特徴量FscがTsを越えていなければ、追加画像決定部206は、図10に示す処理を終了する。S1001またはS1002のいずれかの判断において特徴量が閾値を越えると判断された場合(静止画像Icにおいて目瞑りまたはボケ・ブレが発生している場合)には、追加画像決定部206は、現在のオフセットに3を加える(S1003)。そして、追加画像決定部206は、現在着目の静止画像Icに対応するフレーム番号にオフセットを加えたフレーム番号のフレームを追加で復号する(S1004)。そして、追加で復号することによって生成された静止画像Iaが、追加評価の候補となる。そして追加画像決定部206は、静止画像Iaの目瞑り特徴量Fbaを抽出し(S1005)、目瞑り特徴量FbaがTbを超えているか否かを判断する(S1006)。S1006の判断の結果、目瞑り特徴量Fbaが閾値Tbを超えていない場合には、追加画像決定部206は、静止画像Iaのボケ・ブレ特徴量Fsaを抽出する(S1007)。そして追加画像決定部206は、ボケ・ブレ特徴量FsaがTs(例えば0.5)を超えているか否かを判断し(S1008)、ボケ・ブレ特徴量FsaがTsを超えていなければ図10に示す処理を終了する。S1006またはS1008の判断において特徴量が閾値を超えている場合には、S1003の処理が戻る。そして、現在の追加評価の候補である静止画像Iaよりも3フレーム後のフレームが新たな追加評価の候補となる。
図10に示した処理によれば、現在着目の静止画像Icの目瞑り特徴量、ボケ・ブレ特徴量のいずれかが閾値を越える場合(S1001、S1002のいずれかでYes)、S1003の処理が実行される。そして、目瞑り特徴量とボケ・ブレ特徴量がいずれも閾値を越えないフレームが追加評価の候補として特定されるまで(S1006、S1008のいずれでもNo)、追加評価の候補のフレームが特定される。よって、目瞑りの程度やボケ・ブレの程度が低い、良好な静止画像を追加評価の候補として確実に特定することができる。
なお、S1003で増加されるオフセット値に制限を設けてもよい。そして、その制限までオフセットを増加させたとしても、目瞑り特徴量とボケ・ブレ特徴量がいずれも閾値を越えないフレームが特定されない場合、追加画像決定部206は、オフセットを0として、図10の処理を終了してもよい。例えば、オフセット値が30となると、S402で復号済みの次のフレームとなるため、オフセット値の制限として、「30未満」という制限が設けられても良い。
なお、以上の実施形態では動画像におけるIフレームのみを復号するものとしたが、Iフレームであるか否かに関わらず、一定時間毎にフレームを復号するようにしても良い。また、当初復号の際には静止画像を縮小して保存し、最終的に選択された静止画像のみ最後に元の大きさの静止画像を再度復号するように構成しても良い。また図4では、図4に示した処理が実行されるたびに、動画像のフレームが復号され、解析される例について説明したが、これに限らない。例えばすべてのフレーム、もしくはIフレームのみが図4のS402に示す処理が実行される前に事前に復号されている場合、候補フレームの決定処理では、事前に復号したフレームについては復号処理が行われなくてもよい。この場合、事前に復号したフレームについては解析のみが行われるよう構成しても良い。また、以上の実施形態では目瞑り特徴量とボケ・ブレ特徴量について記載したが、特徴量の種類と数をこれに限定するものではない。
さらに、以上の実施形態では、動画像から複数のフレーム(例えば複数のIフレーム)が復号される例について説明した。しかしこれに限らず、例えばユーザが指定した1枚のフレームについて、他のフレームを追加で解析する必要があるか判定され、追加で解析されたフレームと元のフレームから、出力対象の候補の候補フレームが選択されてもよい。
<その他の実施形態>
なお、本実施形態の機能は以下の構成によっても実現することができる。つまり、本実施形態の処理を行うためのプログラムコードをシステムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)がプログラムコードを実行することによっても達成される。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することとなり、またそのプログラムコードを記憶した記憶媒体も本実施形態の機能を実現することになる。
また、本実施形態の機能を実現するためのプログラムコードを、1つのコンピュータ(CPU、MPU)で実行する場合であってもよいし、複数のコンピュータが協働することによって実行する場合であってもよい。さらに、プログラムコードをコンピュータが実行する場合であってもよいし、プログラムコードの機能を実現するための回路等のハードウェアを設けてもよい。またはプログラムコードの一部をハードウェアで実現し、残りの部分をコンピュータが実行する場合であってもよい。
102 CPU
103 ROM
104 RAM

Claims (14)

  1. 動画像から出力対象の候補のフレームを選択するためのプログラムであって、
    前記動画像に含まれているフレームを解析する解析手段と、
    記解析手段による解析の結果に基づいて、前記出力対象の候補としての候補フレームを選択する選択手段と、
    としてコンピュータを機能させ、
    前記動画像に含まれているフレームのうち、フレーム間予測を用いずに符号化されるフレームである第1のフレームが所定の特徴量に関する所定の条件を満たす場合、前記解析手段は、前記動画像に含まれ且つ前記フレーム間予測を用いて符号化されるフレームである第2のフレームを解析し、前記選択手段は、前記第1のフレームの前記解析手段による解析の結果と、前記第2のフレームの前記解析手段による解析の結果とに基づき、前記第1のフレームと前記第2のフレームから前記候補フレームを選択し、
    前記第1のフレームが前記所定の条件を満たさない場合、前記解析手段は、前記第2のフレームを解析せず、前記選択手段は、前記第1のフレームを前記候補フレームとして選択することを特徴とするプログラム。
  2. 前記動画像において、複数の前記第1のフレームを特定する特定手段をさらに前記コンピュータに実行させ、
    前記解析手段は、前記特定手段により特定された複数の第1のフレームのそれぞれを解析し、さらに、前記複数の第1のフレームのうちの前記所定の条件を満たす一部の第1のフレームに対して前記第2のフレームを解析し、
    前記選択手段は、前記一部の第1のフレームと前記第2のフレームから、前記候補フレームを選択することを特徴とする請求項1に記載のプログラム。
  3. 前記複数の前記第1のフレームのうちの前記所定の条件を満たさない一部の第1のフレームと、前記選択手段により選択された前記候補フレームとから、前記解析手段による解析の結果に基づいて出力対象のフレームを選択し、前記選択された出力対象のフレームを出力する出力手段として前記コンピュータをさらに機能させるための請求項に記載のプログラム。
  4. 前記出力手段は、前記出力対象のフレームに対応する静止画像がテンプレートに配置されたアルバムを表示装置に出力し、前記アルバムを前記表示装置に表示させることを特徴とする請求項に記載のプログラム。
  5. 前記出力手段は、前記出力対象のフレームに対応する静止画像がテンプレートに配置されたアルバムを印刷装置に出力し、前記アルバムを前記印刷装置に印刷させることを特徴とする請求項に記載のプログラム。
  6. 前記解析手段は、
    前記特定手段により特定された2つの前記第1のフレームの両方が前記所定の条件を満たす場合、前記動画像において前記2つの前記第1のフレームの間に対応するフレームを追加で解析せず、
    前記2つの前記第1のフレームのうち、前記動画像において先のフレームのみが前記所定の条件を満たす場合、前記動画像において前記2つの前記第1のフレームの間において前記第2のフレームを解析することを特徴とする請求項2乃至5のいずれか1項に記載のプログラム。
  7. 前記動画像に含まれているフレームが前記所定の条件を満たすか判断する判断手段として前記コンピュータを機能させ、
    前記解析手段は、前記判断手段により前記第1のフレームが前記所定の条件を満たすと判断された場合、前記第2のフレームを解析し、前記判断手段により前記第1のフレームが前記所定の条件を満たさないと判断された場合、前記第2のフレームを解析しないことを特徴とする請求項1乃至のいずれか1項に記載のプログラム。
  8. 前記判断手段は、前記第1のフレームの前記解析手段による解析の結果に基づいて、前記第1のフレームが前記所定の特徴量に関する前記所定の条件を満たすか判断することを特徴とする請求項に記載のプログラム。
  9. 前記判断手段は、前記第1のフレームの前記所定の特徴量としての複数種類の特徴量のそれぞれについて所定の条件を満たすか判断し、
    記判断手段により前記複数種類の特徴量のいずれかが前記所定の条件を満たすと判断された場合に、前記所定の条件を満たした特徴量の種類に応じて異なるフレームが、前記第2のフレームとして決定されることを特徴とする請求項7または8に記載のプログラム。
  10. 前記判断手段は、前記第2のフレームが前記解析手段により解析された結果に基づいて、前記第2のフレームが前記所定の条件を満たすか判断し、
    記判断手段により前記第2のフレームが前記所定の条件を満たすと判断されない場合、新たな第2のフレーム決定され
    前記選択手段は、前記第1のフレームと、前記決定された複数の第2のフレームのうちの前記判断手段により前記所定の条件を満たすと判断された第2のフレームとから、前記候補フレームを選択することを特徴とする請求項7または8に記載のプログラム。
  11. 前記第1のフレームが前記所定の条件を満たさない場合、前記第2のフレーム決定されないことを特徴とする請求項1乃至10のいずれか1項に記載のプログラム。
  12. 前記所定の特徴量は、フレームに含まれている人物の目瞑りに関する特徴量または前記フレームにおけるボケまたはブレに関する特徴量であることを特徴とする請求項1乃至11のいずれか1項に記載のプログラム。
  13. 動画像から出力対象の候補のフレームを選択する画像処理装置であって、
    前記動画像に含まれているフレームを解析する解析手段と、
    記解析手段による解析の結果に基づいて、前記出力対象の候補としての候補フレームを選択する選択手段と、
    を有し、
    前記動画像に含まれているフレームのうち、フレーム間予測を用いずに符号化されるフレームである第1のフレームが所定の特徴量に関する所定の条件を満たす場合、前記解析手段は、前記動画像に含まれ且つ前記フレーム間予測を用いて符号化されるフレームである第2のフレームを解析し、前記選択手段は、前記第1のフレームの前記解析手段による解析の結果と、前記第2のフレームの前記解析手段による解析の結果とに基づき、前記第1のフレームと前記第2のフレームから前記候補フレームを選択し、
    前記第1のフレームが前記所定の条件を満たさない場合、前記解析手段は、前記第2のフレームを解析せず、前記選択手段は、前記第1のフレームを前記候補フレームとして選択することを特徴とする画像処理装置。
  14. 動画像から出力対象の候補のフレームを選択する画像処理方法であって、
    前記動画像に含まれているフレームのうち、フレーム間予測を用いずに符号化されるフレームである第1のフレームを解析する第1の解析工程と、
    記第1のフレームが所定の特徴量に関する所定の条件を満たす場合、前記動画像に含まれ且つ前記フレーム間予測を用いて符号化されるフレームである第2のフレームを解析し、前記第1のフレームが前記所定の条件を満たさない場合、前記第2のフレームを解析しない第2の解析工程と、
    前記第1のフレームが所定の特徴量に関する所定の条件を満たす場合、前記第1のフレームの前記第1の解析工程における解析の結果と、前記第2のフレームの前記第2の解析工程における解析の結果とに基づき、前記第1のフレームと前記第2のフレームから出力対象の候補として候補フレームを選択し、前記第1のフレームが前記所定の条件を満たさない場合、前記第1のフレームを前記候補フレームとして選択する選択工程と、
    を有することを特徴とする画像処理方法。
JP2016239740A 2016-12-09 2016-12-09 プログラム、画像処理装置、および画像処理方法 Active JP6866142B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016239740A JP6866142B2 (ja) 2016-12-09 2016-12-09 プログラム、画像処理装置、および画像処理方法
US15/832,492 US10536625B2 (en) 2016-12-09 2017-12-05 Image processing apparatus, image processing method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016239740A JP6866142B2 (ja) 2016-12-09 2016-12-09 プログラム、画像処理装置、および画像処理方法

Publications (2)

Publication Number Publication Date
JP2018098579A JP2018098579A (ja) 2018-06-21
JP6866142B2 true JP6866142B2 (ja) 2021-04-28

Family

ID=62489768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016239740A Active JP6866142B2 (ja) 2016-12-09 2016-12-09 プログラム、画像処理装置、および画像処理方法

Country Status (2)

Country Link
US (1) US10536625B2 (ja)
JP (1) JP6866142B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7792335B2 (en) 2006-02-24 2010-09-07 Fotonation Vision Limited Method and apparatus for selective disqualification of digital images
US8660175B2 (en) * 2007-12-10 2014-02-25 Qualcomm Incorporated Selective display of interpolated or extrapolated video units
US10664687B2 (en) * 2014-06-12 2020-05-26 Microsoft Technology Licensing, Llc Rule-based video importance analysis

Also Published As

Publication number Publication date
JP2018098579A (ja) 2018-06-21
US20180167552A1 (en) 2018-06-14
US10536625B2 (en) 2020-01-14

Similar Documents

Publication Publication Date Title
CN111031346B (zh) 一种增强视频画质的方法和装置
CN108259939B (zh) 新视频推送控制方法、装置及服务器
JP2020510892A5 (ja)
CN112866799B (zh) 一种视频抽帧处理方法、装置、设备及介质
US11101818B2 (en) Method and device for storing time series data with adaptive length encoding
CN106027893A (zh) 控制Live Photo生成的方法、装置及电子设备
Chen et al. Model order selection in reversible image watermarking
CN111310744A (zh) 图像识别方法、视频播放方法、相关设备及介质
CN113194320A (zh) 参数预测模型的训练方法及装置和参数预测方法及装置
CN109361927A (zh) 图像处理方法及装置
CN105898373A (zh) 视频切片方法和装置
JP5029543B2 (ja) 符号化装置および符号化プログラム
CN107203764A (zh) 长微博图片识别方法和装置
CN110166770B (zh) 视频编码方法、装置、计算机设备和存储介质
JP6866142B2 (ja) プログラム、画像処理装置、および画像処理方法
JP2009077112A (ja) 画像再生装置、画像再生装置の制御方法および制御プログラム
US10339427B2 (en) Subject evaluation system, subject evaluation method and recording medium storing subject evaluation program
JPWO2020185429A5 (ja)
JP6626319B2 (ja) 符号化装置、撮像装置、符号化方法、及びプログラム
CN113747159B (zh) 一种生成可变帧率视频媒体文件的方法、装置及相关组件
JP2010204892A (ja) 映像解析装置,映像解析方法および映像解析プログラム
Murashko Using machine learning to select and optimise multiple objectives in media compression
CN109829378B (zh) 道路抛撒行为的识别方法、装置及电子设备
JP2012044390A (ja) 映像要約装置および映像要約プログラム
JP2012022413A (ja) 画像処理装置、画像処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210309

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210407

R151 Written notification of patent or utility model registration

Ref document number: 6866142

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151