JP2016189507A - 画像処理装置、画像処理方法、プログラムおよび記録媒体 - Google Patents

画像処理装置、画像処理方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2016189507A
JP2016189507A JP2015067863A JP2015067863A JP2016189507A JP 2016189507 A JP2016189507 A JP 2016189507A JP 2015067863 A JP2015067863 A JP 2015067863A JP 2015067863 A JP2015067863 A JP 2015067863A JP 2016189507 A JP2016189507 A JP 2016189507A
Authority
JP
Japan
Prior art keywords
image
unit
association information
still
composite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015067863A
Other languages
English (en)
Inventor
陽平 桃木
Yohei Momoki
陽平 桃木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2015067863A priority Critical patent/JP2016189507A/ja
Priority to US15/045,654 priority patent/US20160295036A1/en
Publication of JP2016189507A publication Critical patent/JP2016189507A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00185Image output
    • H04N1/00196Creation of a photo-montage, e.g. photoalbum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/17Image acquisition using hand-held instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00137Transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00161Viewing or previewing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00167Processing or editing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00281Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal
    • H04N1/00307Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a telecommunication apparatus, e.g. a switched network of teleprinters for the distribution of text-based information, a selective call terminal with a mobile telephone apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32106Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3261Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal
    • H04N2201/3267Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal of motion picture signals, e.g. video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3273Display

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Television Signal Processing For Recording (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】撮影画像に対応する動画像の検索時間を短縮し、かつ、検索精度を向上させることができる画像処理装置等を提供する。【解決手段】外郭識別部が、合成画像の出力画像を撮影して取得された撮影画像に含まれるそれぞれの静止画像の外郭を識別する。レイアウト構造解析部が、それぞれの外郭の情報に基づいて、撮影画像に含まれる複数の静止画像のレイアウト構造を解析する。動画像特定部が、記憶部に記憶された複数の合成画像の関連付け情報の中から、撮影画像に含まれる複数の静止画像のレイアウト構造に対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、第1関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を特定する。【選択図】図2

Description

本発明は、AR(Augmented Reality, 拡張現実)技術により、複数の静止画像を含む合成画像の出力画像(プリント物)に関連付けられた動画像を再生表示する画像処理装置、画像処理方法、プログラムおよび記録媒体に関するものである。
昨今、スマートフォンやタブレット端末等の携帯端末の普及が急速に進んでおり、携帯端末で撮影される静止画像(写真)の枚数が増えているが、それと同時に動画像が撮影される機会も多くなっている。現在では、動画像を利用したサービスとして、非特許文献1に示すように、写真等のプリント物を携帯端末で撮影(キャプチャ)すると、プリント物に関連付けられた動画像を、AR技術を使って、携帯端末の画面上に再生(AR再生)するシステムが提供されている。
このシステムでは、以下の(1)〜(6)のステップで、プリントに関連付けられた動画像のAR再生が行われる。
(1)ユーザにより、携帯端末上で動作する専用のアプリケーションを使用して、複数の動画像の中からプリントに使用したい動画像が選択されると、選択された動画像がサーバへアップロードされる。
(2)サーバにおいて、携帯端末からアップロードされた動画像から代表シーンのフレーム画像が抽出される。
(3)サーバで抽出された代表シーンのフレーム画像が携帯端末へダウンロードされる。
(4)ユーザにより、携帯端末の画面に一覧表示された代表シーンのフレーム画像の中からプリントしたいフレーム画像が選択され、プリントの注文が行われる。
(5)サーバにおいて、ユーザにより注文された代表シーンのフレーム画像のプリントが生成され、このフレーム画像に関連付けられた動画像がAR再生用に画像処理される。
(6)ユーザにより、配達されたプリントが携帯端末で撮影(キャプチャ)されると、このプリントに関連付けられたAR再生用の動画像がサーバからダウンロードされ、AR技術により、携帯端末の画面にAR再生される。
このシステムでは、上記のステップ(6)において、プリントが携帯端末で撮影(キャプチャ)された場合に、プリントを撮影して取得された撮影画像と、サーバに記憶された、動画像から抽出されたフレーム画像との間で類似判定が行われる。そして、撮影画像に対応するフレーム画像が検出された場合に、この撮影画像に対応するフレーム画像に関連付けられた動画像がサーバからダウンロードされ、AR技術により、携帯端末の画面にAR再生される。
しかし、サーバに記憶されているフレーム画像の枚数が多くなると、フレーム画像の枚数に応じて類似判定に要する時間、つまり、撮影画像に対応する動画像を検索するための検索時間が長くなるという問題があった。
また、このシステムでは、撮影画像とフレーム画像との類似判定の結果、撮影画像と関係のない動画像が再生されることを防ぐために、例えば、数字やアルファベットを含む文字列からなるアクセスキーをユーザが入力することにより、ユーザを一意に識別し、各々のユーザが所有する動画像から抽出されたフレーム画像の中から、撮影画像に対応するフレーム画像が検出される。
これにより、撮影画像と関係のない動画像が再生されることを防止することはできるが、AR再生を行うたびに、ユーザがアクセスキーを入力する手間がかかるという問題があった。
ここで、本発明に関連性のある先行技術文献としては、複数の画像を所定の出力ページに所定の順序で配置するコマ割り方法等に関する特許文献1、ウェブサーバに記憶してある動画データを携帯通信端末に配信する動画配信サーバに関する特許文献2、複数の静止画、動画の中から、所望の画像を検索する画像処理技術に関する特許文献3、動画像情報の検索を効率的に行う動画像検索手法等に関する特許文献4、画像出力装置から画像を出力する際の画質調整機能を実行する画質調整方法等に関する特許文献5がある。
特許第5073612号公報 特開2008−193197号公報 特開2005−173897号公報 特開2003−216954号公報 特開2006−234869号公報
"動画フォト!サービス"、[online]、富士フイルム株式会社、[平成27年2月9日検索]、インターネット<URL: http://fujifilm.jp/personal/print/photo/dogaphoto/>
本発明の目的は、上記従来技術の問題点を解消し、撮影画像に対応する動画像の検索時間を短縮し、かつ、検索精度を向上させることができる画像処理装置、画像処理方法、プログラムおよび記録媒体を提供することにある。
上記目的を達成するために、本発明は、複数の静止画像を含む合成画像の出力画像を撮影して取得された撮影画像に含まれるそれぞれの静止画像の外郭を識別する外郭識別部と、
外郭識別部により識別されたそれぞれの外郭の情報に基づいて、撮影画像に含まれる複数の静止画像のレイアウト構造を解析するレイアウト構造解析部と、
合成画像に含まれる複数の静止画像のレイアウト構造、および、合成画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像の情報を含む関連付け情報を合成画像に対応して記憶する記憶部と、
記憶部に記憶された複数の合成画像の関連付け情報の中から、レイアウト構造解析部により解析された、撮影画像に含まれる複数の静止画像のレイアウト構造に対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、第1関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を特定する動画像特定部とを備えることを特徴とする画像処理装置を提供するものである。
さらに、外郭識別部により識別されたそれぞれの外郭に対応する、撮影画像に含まれるそれぞれの静止画像の画像特徴量を抽出する画像特徴量抽出部を備え、
記憶部は、さらに、合成画像に含まれるそれぞれの静止画像の画像特徴量の情報を含む関連付け情報を合成画像に対応して記憶するものであり、
動画像特定部は、さらに、第1関連付け情報の中から、画像特徴量抽出部により抽出された画像特徴量に対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出し、第2関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を特定するものであることが好ましい。
また、画像特徴量抽出部は、撮影画像に含まれるそれぞれの静止画像を2以上の分割領域に分割し、それぞれの分割領域の画像特徴量を抽出するものであり、
記憶部は、合成画像に含まれるそれぞれの静止画像のそれぞれの分割領域の画像特徴量の情報を含む関連付け情報を合成画像に対応して記憶するものであり、
動画像特定部は、第1関連付け情報の中から、画像特徴量抽出部により抽出されたそれぞれの分割領域の画像特徴量に対応するそれぞれの分割領域の画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出するものであることが好ましい。
また、撮影画像が、合成画像の出力画像に含まれる複数の静止画像のうちの一部の静止画像のみを含む場合、動画像特定部は、記憶部に記憶された複数の合成画像の関連付け情報の中から、レイアウト構造解析部により解析された一部の静止画像のみのレイアウト構造に部分対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、第1関連付け情報の中から、画像特徴量抽出部により抽出された一部の静止画像のみの画像特徴量に部分対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出するものであることが好ましい。
さらに、動画像から複数のフレーム画像を抽出するフレーム画像抽出部と、
フレーム画像抽出部により抽出された複数のフレーム画像の中から選択された1枚以上のフレーム画像を含む2枚以上の画像を用いて合成画像を生成する合成画像生成部と、
合成画像生成部により生成された合成画像をプリントして出力画像を出力する出力部とを備えることが好ましい。
さらに、合成画像生成部により合成画像が生成された場合に、合成画像に含まれる複数の静止画像のレイアウト構造、および、合成画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像の情報を含む関連付け情報を生成する関連付け情報生成部を備え、
記憶部は、関連付け情報生成部により生成された関連付け情報を合成画像に対応して記憶するものであることが好ましい。
また、画像特徴量抽出部は、画像特徴量として、それぞれの静止画像の主色相、輝度、ボケ、エッジ、被写体人物のうちの少なくとも1つを抽出するものであることが好ましい。
また、外郭識別部は、外郭の数、それぞれの外郭の配置位置、大きさ、縦横比を含む、外郭の特徴を識別するものであることが好ましい。
また、レイアウト構造解析部は、合成画像および撮影画像に含まれる複数の静止画像を二分木で順次分割して木構造を作成することにより、レイアウト構造を解析するものであることが好ましい。
さらに、合成画像の出力画像を撮影して撮影画像を取得する画像撮影部と、
画像撮影部により出力画像が撮影された場合に、出力画像を表示する表示部と、
画像撮影部により出力画像が撮影された場合に、表示部に表示された出力画像に含まれるそれぞれの静止画像の外郭内に、動画像特定部により特定された、撮影画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像が再生されるように制御する制御部とを備えることが好ましい。
また、制御部は、画像撮影部により出力画像が撮影された場合に、出力画像を表示部に表示し、表示部に表示された出力画像に含まれるそれぞれの静止画像の外郭内に、動画像特定部により特定された、それぞれの静止画像に関連付けられたそれぞれの動画像を同時に再生するように制御するものであることが好ましい。
また、制御部は、画像撮影部により出力画像が撮影された場合に、出力画像を表示部に表示し、表示部に表示された出力画像に含まれるそれぞれの静止画像の外郭内に、動画像特定部により特定された、それぞれの静止画像に関連付けられたそれぞれの動画像を、あらかじめ設定された順序で1つずつ再生するように制御するものであることが好ましい。
また、制御部は、画像撮影部により出力画像が撮影された場合に、出力画像を表示部に表示し、表示部に表示された出力画像に含まれるそれぞれの静止画像の外郭内に、動画像特定部により特定された、それぞれの静止画像に関連付けられたそれぞれの動画像のうち、ユーザにより指定された動画像を再生するように制御するものであることが好ましい。
また、本発明は、外郭識別部が、複数の静止画像を含む合成画像の出力画像を撮影して取得された撮影画像に含まれるそれぞれの静止画像の外郭を識別するステップと、
レイアウト構造解析部が、外郭識別部により識別されたそれぞれの外郭の情報に基づいて、撮影画像に含まれる複数の静止画像のレイアウト構造を解析するステップと、
動画像特定部が、合成画像に含まれる複数の静止画像のレイアウト構造、および、合成画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像の情報を含む関連付け情報を合成画像に対応して記憶する記憶部に記憶された複数の合成画像の関連付け情報の中から、レイアウト構造解析部により解析された、撮影画像に含まれる複数の静止画像のレイアウト構造に対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、第1関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を特定するステップとを含むことを特徴とする画像処理方法を提供する。
さらに、画像特徴量抽出部が、外郭識別部により識別されたそれぞれの外郭に対応する、撮影画像に含まれるそれぞれの静止画像の画像特徴量を抽出するステップを含み、
記憶部は、さらに、合成画像に含まれるそれぞれの静止画像の画像特徴量の情報を含む関連付け情報を合成画像に対応して記憶するものであり、
動画像特定部は、さらに、第1関連付け情報の中から、画像特徴量抽出部により抽出された画像特徴量に対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出し、第2関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を特定することが好ましい。
また、画像特徴量抽出部は、撮影画像に含まれるそれぞれの静止画像を2以上の分割領域に分割し、それぞれの分割領域の画像特徴量を抽出し、
記憶部は、合成画像に含まれるそれぞれの静止画像のそれぞれの分割領域の画像特徴量の情報を含む関連付け情報を合成画像に対応して記憶するものであり、
動画像特定部は、第1関連付け情報の中から、画像特徴量抽出部により抽出されたそれぞれの分割領域の画像特徴量に対応するそれぞれの分割領域の画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出することが好ましい。
また、撮影画像が、合成画像に含まれる複数の静止画像のうちの一部の静止画像のみを含む場合、動画像特定部は、記憶部に記憶された複数の合成画像の関連付け情報の中から、レイアウト構造解析部により解析された一部の静止画像のみのレイアウト構造に部分対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、第1関連付け情報の中から、画像特徴量抽出部により抽出された一部の静止画像のみの画像特徴量に部分対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出することが好ましい。
また、本発明は、上記に記載の画像処理方法の各々のステップをコンピュータに実行させるためのプログラムを提供する。
また、本発明は、上記に記載の画像処理方法の各々のステップをコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体を提供する。
本発明では、合成画像の出力画像に含まれる複数の静止画像のレイアウト構造、さらには、それぞれの静止画像の画像特徴量を用いて関連付け情報を検索することにより、それぞれの静止画像に対応する動画像を特定することができる。そのため、本発明によれば、従来の画像処理装置のように、1枚ずつ静止画像の類似判定を行って、静止画像に対応する動画像を特定する場合よりも、対応する動画像を特定するまでの時間を大幅に短縮することができる。
また、本発明では、レイアウト構造、さらには、画像特徴量を用いて関連付け情報を検索することにより、従来の画像処理装置のように、1枚ずつ静止画像に対応する動画像を特定する場合よりも、対応する動画像を特定するための検索精度を向上させることができる。そのため、本発明によれば、アクセスキーを入力する手間を省くことができ、利便性を向上させることができる。また、検索精度が向上されるため、それぞれの静止画像から抽出する画像特徴量は、従来よりも簡単なものでもよいというメリットもある。
本発明の画像処理装置の構成を表す一実施形態のブロック図である。 図1に示すサーバの構成を表す一実施形態のブロック図である。 合成画像および撮影画像に含まれる複数の静止画像を二分木で順次分割して木構造を作成する様子を表す一例の概念図である。 動画像特性部が、複数の関連付け情報の中から、撮影画像に対応する関連付け情報を検索する様子を表す一例の概念図である。 図1に示す携帯端末の内部構成を表す一実施形態のブロック図である。 合成画像および関連付け情報を生成し、合成画像の出力画像を出力する場合の画像処理装置の動作を表す一例のフローチャートである。 携帯端末からサーバへ動画像を送信する場合の様子を表す一例の概念図である。 動画像からフレーム画像を抽出する場合の様子を表す一例の概念図である。 複数のフレーム画像の中から2枚以上の画像を選択する場合の様子を表す一例の概念図である。 選択画像を用いて合成画像を作成する場合の様子を表す一例の概念図である。 合成画像に含まれる複数の静止画像のレイアウト構造、それぞれの静止画像の画像特徴量、および、それぞれの静止画像に関連付けられた動画像を表す一例の概念図である。 合成画像の出力画像がユーザにより撮影(キャプチャ)された場合に、出力画像に対応するAR再生用の動画像を再生表示する場合の画像処理装置の動作を表す一例のフローチャートである。 携帯端末で合成画像の出力画像を撮影(キャプチャ)する様子を表す一例の概念図である。 複数の合成画像の関連付け情報の中から、撮影画像に対応する関連付け情報を検索する様子を表す一例の概念図である。 携帯端末の表示部に表示された、合成画像の出力画像に含まれる静止画像の外郭内に、静止画像に対応する動画像が再生される様子を表す一例の概念図である。 (A)は、撮影画像が、合成画像の出力画像に含まれる複数の静止画像のうちの一部の静止画像のみを含む様子を表す一例の概念図、(B)は、撮影画像に含まれる一部の静止画像に部分対応する関連付け情報を検索する様子を表す一例の概念図である。
以下に、添付の図面に示す好適実施形態に基づいて、本発明の画像処理装置、画像処理方法、プログラムおよび記録媒体を詳細に説明する。
図1は、本発明の画像処理装置の構成を表す一実施形態のブロック図である。同図に示す画像処理装置10は、複数の静止画像を含む合成画像の出力画像(プリント物)が撮影(キャプチャ)された場合に、出力画像に関連付けられた動画像を再生表示するものであり、サーバ12と、携帯端末14と、プリンタ16とを備えている。サーバ12、携帯端末14およびプリンタ16は、インターネット等のネットワーク18を介して互いに接続されている。
図2は、図1に示すサーバの構成を表す一実施形態のブロック図である。図2に示すサーバ12は、フレーム画像抽出部20と、合成画像生成部22と、外郭識別部24と、レイアウト構造解析部26と、画像特徴量抽出部28と、関連付け情報生成部30と、記憶部32と、動画像特定部34と、動画像処理部36と、第1転送部38とを備えている。
フレーム画像抽出部20は、動画像から複数のフレーム画像(動画を構成する一コマの画像)を抽出するものである。また、フレーム画像抽出部20は、抽出されたフレーム画像からサムネイル画像を生成する。
ここで、動画像からフレーム画像を抽出する方法は限定されない。例えば、動画像からユーザが手動で所望のフレーム画像を抽出してもよいし、動画像から一定の時間間隔でフレーム画像を抽出してもよい。
あるいは、KFE(Key Frame Extraction)技術を利用して、シーンの変わり目などのキーとなるフレーム画像を抽出してもよい。KFEでは、例えば、動画像の各々のフレーム画像を解析し、フレーム画像の色味、明るさ、ボケやブレ等を検出し、色味や明るさが大きく変わる前後のフレーム画像や、適正露出によりボケやブレがないフレーム画像が抽出される。
また、動画像において人物の顔の大きさや向き、顔の表情(笑顔、泣き顔等)を検出し、それらに基づいてフレーム画像を抽出してもよい。さらに、動画像に音声が含まれる場合には、音声が大きくなった時刻(タイムコード)の前後の動画像からフレーム画像を抽出してもよい。上述の方法で動画像からフレーム画像を抽出することで、動画像の代表的なシーンをフレーム画像として抽出することができる。
合成画像生成部22は、フレーム画像抽出部20により抽出された複数のフレーム画像の中から携帯端末14のユーザにより選択された1枚以上のフレーム画像を含む2枚以上の画像(選択画像)を用いて、フォトブックやコラージュプリント等の合成画像を生成するものである。
ここで、フォトブックは、ユーザが所有する複数の静止画像から選択された一定数の静止画像を、写真アルバムのように、一定のレイアウトで一定数のページに配置した合成画像である。また、コラージュプリントは、ユーザが所有する複数の静止画像から選択された一定数の静止画像を、一定のレイアウトで1枚のプリントに配置した合成画像である。また、合成画像は、複数の静止画像を含むものであれば何でもよいし、フォトブックのように、複数の合成画像を含むものであってもよい。
外郭識別部24は、合成画像の出力画像(プリント物)がユーザにより撮影され、撮影画像が取得された場合に、撮影画像に含まれるそれぞれの静止画像の外郭(outline)を識別するものである。
外郭識別部24により識別される外郭の情報は、外郭の特徴を表すものであれば何ら限定されず、各種の外郭の特徴を識別することができる。例えば、外郭識別部24は、外郭の特徴として、外郭の数、それぞれの外郭の配置位置、大きさ、縦横比等を識別することができる。
また、外郭の形状は通常四角形であるが、丸形や星形などのように、四角形でなくてもよい。外郭がフェードしている場合も、撮影画像の画素値変化を微分して、微分値が変化し始めた箇所をもって外郭とすることにより外郭を検出することができる。外郭は、合成画像の紙面(台紙)に対して傾斜していてもよいし、傾斜していなくてもよい。また、静止画像に額縁がある場合は、外郭に額縁を含めるかどうかを事前に決めておけばよい。
レイアウト構造解析部26は、撮影画像が取得された場合に、外郭識別部24により識別されたそれぞれの外郭の情報に基づいて、撮影画像に含まれる複数の静止画像のレイアウト構造を解析するものである。
レイアウト構造解析部26は、例えば、合成画像および撮影画像に含まれる複数の静止画像を二分木で順次分割して木構造(論理構造)を作成することにより、レイアウト構造を解析することができる。
図3左側に示すように、合成画像が7枚の静止画像f1〜f7を含む場合、レイアウト構造解析部26は、7枚の静止画像f1〜f7を、1つのグループに含まれる静止画像の数が2枚以下となるように、順次、2つのグループに分割する。
例えば、7枚の静止画像f1〜f7を、2つのグループに分割することができる最も長い直線で、3枚の静止画像f1〜f3のグループと、4枚の静止画像f4〜f7のグループに分割する。
続いて、3枚の静止画像f1〜f3を、同様に、1枚の静止画像f1のグループと、2枚の静止画像f2,f3のグループに分割する。
また、4枚の静止画像f4〜f7のグループを、まず、1枚の静止画像f4と、3枚の静止画像f5〜f7のグループに分割する。続いて、3枚の静止画像f5〜f7を、1枚の静止画像f5と、2枚の静止画像f6,f7のグループに分割する。なお、この例のように、同じ大きさ、同じ縦横比の4枚の静止画像f4〜f7が横一列に配置されている場合、あるいは、縦一列に配置されている場合、どのような順序でどのように分割するかは適宜決定することができる。
その結果、図3右側に示すように、7枚の静止画像f1〜f7の木構造を作成することができる。また、この木構造は、((f1+(f2+f3))+(f4+(f5+(f6+f7))))という論理構造で表される。
画像特徴量抽出部28は、撮影画像が取得された場合に、撮影画像の画像解析を行って、外郭識別部24により識別されたそれぞれの外郭に対応する、撮影画像に含まれるそれぞれの静止画像の画像特徴量を抽出するものである。
また、画像特徴量抽出部28は、合成画像生成部22により合成画像が生成された場合に、合成画像に含まれるそれぞれの静止画像の画像特徴量を抽出する。
静止画像の画像特徴量は、静止画像の特徴を表すものであれば何ら限定されず、各種の画像特徴量を利用することができる。例えば、画像特徴量抽出部28は、画像特徴量として、それぞれの静止画像の主色相、輝度、ボケ、エッジ、被写体人物のうちの少なくとも1つを抽出することができる。画像特徴量として、例えば、主色相を抽出する場合、静止画像に含まれる色のヒストグラムを作成し、最も出現頻度が高い色を主色相に決定することができる。
関連付け情報生成部30は、合成画像生成部22により合成画像が生成された場合に、合成画像に含まれる複数の静止画像のレイアウト構造、画像特徴量抽出部28により抽出された、合成画像に含まれるそれぞれの静止画像の画像特徴量、および、合成画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像の情報を含む関連付け情報を生成するものである。
記憶部32は、各種のデータを記憶するものである。記憶部32には、例えば、携帯端末14から送信されてきた動画像等の他、合成画像生成部22により生成された合成画像が記憶され、関連付け情報生成部30により生成された関連付け情報等が、合成画像に対応して記憶される。
動画像特定部34は、記憶部32に記憶された複数の合成画像の関連付け情報の中から、レイアウト構造解析部26により解析された、撮影画像に含まれる複数の静止画像のレイアウト構造に対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、第1関連付け情報の中から、画像特徴量抽出部28により抽出された画像特徴量に対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出し、第2関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を特定するものである。
図4に示すように、例えば、レイアウト構造が、((f1+(f2+f3))+(f4+(f5+(f6+f7))))という論理構造で表され、かつ、撮影画像に含まれるそれぞれの静止画像の画像特徴量として、主色相が、静止画像f1,f2は緑、静止画像f3〜5,f7は青、静止画像f6は赤である場合、動画像特定部34は、レイアウト構造として、同じ((f1+(f2+f3))+(f4+(f5+(f6+f7)))))という論理構造を含む関連付け情報を検索して第1関連付け情報として検出し、画像特徴量として、同じ静止画像f1,f2は緑、静止画像f3〜5,f7は青、静止画像f6は赤という主色相を含む第1関連付け情報を検索して第2関連付け情報として検出する。
その結果、この例では、例えば、撮影画像に含まれる静止画像f1に関連付けられた動画像は、動画ファイルAの30s(秒)の地点のフレームから開始される動画像であることが特定される。他の静止画像f2〜f7についても同様である。
動画像処理部36は、動画像特定部34により特定されたそれぞれの動画像、つまり、撮影画像に含まれるそれぞれの静止画像に対応するそれぞれの動画像から、AR再生用の動画像を生成するものである。
動画像処理部36は、動画像のファイルサイズを小さくするために、例えば、動画像の解像度やビットレートを下げることにより、ファイルサイズが小さいAR再生用の動画像を生成する。
第1転送部38は、サーバ12と携帯端末14との間で、動画像、撮影画像などを含む、各種のデータを転送するものである。
続いて、図5は、図1に示す携帯端末の内部構成を表す一実施形態のブロック図である。携帯端末14は、ユーザが使用するスマートフォン、タブレット端末などであり、図5に示すように、画像撮影部40と、入力部42と、表示部44と、制御部46と、第2転送部48とを備えている。
画像撮影部40は、合成画像の出力画像(ARプリント)などを撮影(キャプチャ)して撮影画像を取得するものである。
入力部42は、ユーザにより入力される各種の指示を入力するためのものである。
表示部44は、画像撮影部40により合成画像の出力画像が撮影された場合に、撮影された合成画像の出力画像を表示し、かつ、表示された合成画像の出力画像に含まれるそれぞれの静止画像の外郭内に、動画像特定部34により特定された、撮影画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を再生して表示するものである。本実施形態では、タッチパネル50が、入力部42および表示部44を構成するものとする。
制御部46は、画像撮影部40により合成画像の出力画像が撮影(キャプチャ)された場合に、撮影画像に対応するAR再生用の動画像が表示部44に再生して表示されるように制御するものである。
例えば、制御部46は、表示部44に表示された合成画像の出力画像に含まれるそれぞれの静止画像の外郭内に、動画像特定部34により特定された、撮影画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像から生成されたそれぞれのAR再生用の動画像が再生されるように制御する。
この場合、制御部46は、撮影画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像から生成されたAR再生用の動画像を同時に再生するように制御してもよいし、あるいは、それぞれの動画像から生成されたAR再生用の動画像を、あらかじめ設定された順序で1つずつ再生するように制御したり、それぞれの動画像から生成されたAR再生用の動画像のうち、ユーザにより指定されたAR再生用の動画像を再生するように制御したりすることができる。
また、制御部46は、動画像を表示部44に再生させる場合、AR技術を使用して再生(AR再生)させてもよいし、AR技術を使用せず再生(通常再生)させてもよい。制御部46は、動画像をAR再生させる場合、撮影された出力画像を表示部44に表示し、表示部44に表示された出力画像の表示部分において動画像が再生されるように制御する。また、制御部46は、動画像を通常再生させる場合、表示部44の全面ないし任意のサイズのウィンドウ内において動画像が再生されるように制御する。
第2転送部48は、携帯端末14とサーバ12との間で、動画像、撮影画像などを含む、各種のデータを転送するものである。
プリンタ16は、合成画像生成部22により生成された合成画像をプリントしてその出力画像(プリント物)を出力する本発明の出力部の一例となるものである。
次に、図6に示すフローチャートを参照しながら、合成画像および関連付け情報を生成し、合成画像の出力画像を出力する場合の画像処理装置10の動作を説明する。
まず、ユーザにより、携帯端末14のタッチパネル50(入力部42)を操作して、合成画像を作成するための動画像(動画像データ)が選択され、選択された動画像の送信指示が入力される(ステップS1)。
図7に示すように、ユーザにより、例えば、動画像a、b、cの送信指示が入力される。
送信が指示された動画像は、第2転送部48により、携帯端末14からネットワーク18を介してサーバ12へ送信される。サーバ12では、第1転送部38により、携帯端末14から送信されてきた動画像が受信され、記憶部32に記憶される。
図7に示すように、動画像a、b、cが携帯端末14からサーバ12へ送信(アップロード)され、記憶部32に記憶される。
続いて、フレーム画像抽出部20により、記憶部32に記憶された動画像からフレーム画像(画像データ)が抽出され、抽出されたフレーム画像のサムネイル画像(画像データ)が生成される(ステップS2)。
図8に示すように、例えば、動画像aから、フレーム画像a1〜a5が、動画像bから、フレーム画像b1〜b4が、動画像cから、フレーム画像c1〜c9が抽出される。
生成されたサムネイル画像は、サーバ12から携帯端末14へ送信される。携帯端末14では、受信されたサムネイル画像が、タッチパネル50(表示部44)に一覧表示される。
続いて、ユーザにより、タッチパネル50(入力部42)を操作して、タッチパネル50(表示部44)に一覧表示されたサムネイル画像、および、ユーザが所有する静止画像の中から、1枚以上のサムネイル画像を含む2枚以上の画像が選択される(ステップS3)。
図9に示すように、例えば、フレーム画像a1〜a5のサムネイル画像からフレーム画像a1,a2,a5のサムネイル画像が、フレーム画像b1〜b4のサムネイル画像からフレーム画像b1〜b4のサムネイル画像が、フレーム画像c1〜c9のサムネイル画像からフレーム画像c3〜c6,c9のサムネイル画像が選択される。
選択されたサムネイル画像を含む画像の情報は、携帯端末14からサーバ12へ送信される。サーバ12では、合成画像生成部22により、フレーム画像抽出部20により動画像から抽出されたフレーム画像の中から、受信された1枚以上のサムネイル画像の情報に対応するフレーム画像が選択され、選択された1枚以上のフレーム画像を含む2枚以上の画像が選択画像として選択される。なお、サムネイル画像の代わりに、動画像から抽出されたフレーム画像を使用してもよい。
続いて、選択画像(画像データ)が、サーバ12から携帯端末14へ送信される。携帯端末14では、受信された選択画像が、携帯端末14のタッチパネル50(表示部44)に表示される。
続いて、ユーザにより、タッチパネル50(入力部42)を操作して、選択画像を用いて、合成画像を作成するためのレイアウト構造が決定され、フォトブックやコラージュプリント等の合成画像が作成される。
合成画像がフォトブックの場合、ページ数の選択、フォトブックで使用するテンプレートの選択(レイアウト構造の決定)が行われ(ステップS4)、さらに、画像の配置位置の選択、画像補正、トリミング、画像の拡大・縮小、回転等の画像処理等を含む、レイアウトの編集が行われる。続いて、決定されたレイアウト構造を用いて、図10に示すように、例えば、フォトブックの見開きの1ページ目および2ページ目の合成画像が作成される。
なお、合成画像を生成するために使用するレイアウト構造は、合成画像生成部22が、選択画像数および選択画像の縦横比(アスペクト比)などから自動で生成してもよいし、あるいは、あらかじめ用意された複数のレイアウト構造の中から、選択画像数と同じ外郭数を持つレイアウト構造をユーザが選択してもよい。つまり、合成画像のレイアウト構造および外郭の情報は既知である。
図11に示すように、例えば、フォトブックの見開きの1ページ目の合成画像のレイアウト構造は、((a1+(a2+a3))+(b1+(b2+(b3+b4))))という論理構造であり、見開きの2ページ目のレイアウト構造は、((c3+c4)+((c5+c6)+c9))という論理構造である。
続いて、作成された合成画像の情報が、携帯端末14からサーバ12へ送信される。サーバ12では、合成画像生成部22により、受信された合成画像の情報に基づいて合成画像が生成される(ステップS5)。合成画像生成部22により生成された合成画像は記憶部32に記憶される。
続いて、画像特徴量抽出部28により、合成画像に含まれるそれぞれの静止画像の画像特徴量が抽出される(ステップS6)。
例えば、フォトブックの見開きの1ページ目の合成画像に含まれる静止画像a1,a2の主色相は緑、静止画像a3の主色相は水色、静止画像b1,b2,b4の主色相は青、静止画像b3の主色相は赤であり、見開きの2ページ目に含まれる静止画像c3,c9の主色相は濃いオレンジ色、静止画像c4,c4の主色相は薄いオレンジ色、静止画像c6の主色相は黄色である。
続いて、関連付け情報生成部30により、合成画像に含まれる複数の静止画像のレイアウト構造、画像特徴量抽出部28により抽出された、合成画像に含まれるそれぞれの静止画像の画像特徴量、および、合成画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像の情報を含む関連付け情報が生成される(ステップS7)。関連付け情報生成部30により生成された関連付け情報は、記憶部32に記憶される。
図11に示すように、例えば、フォトブックの見開きの1ページ目に含まれる静止画像a1に関連付けられた動画像は、動画ファイルaの時刻t_a1の地点のフレームから開始される。その他の動画像についても同様である。
続いて、ユーザにより、タッチパネル50(入力部42)を操作して、プリントサイズやプリント枚数等が設定され、合成画像のプリント出力の指示が入力される。
プリント出力の指示は、携帯端末14からサーバ12へ送信される。受信されたプリント出力の指示に対応する合成画像がサーバ12からプリンタ16へ送信され、プリンタ16により、合成画像の出力画像(プリント物)が出力される(ステップS8)。
合成画像の出力画像は、ユーザに配達される。
以上のようにして、合成画像および関連付け情報が生成されるとともに、合成画像の出力画像が出力される。
次に、図12に示すフローチャートを参照しながら、合成画像の出力画像がユーザにより撮影(キャプチャ)された場合に、出力画像に対応するAR再生用の動画像を再生表示する場合の画像処理装置10の動作を説明する。
まず、画像撮影部40により、合成画像の出力画像(プリント物)が撮影(キャプチャ)され、撮影画像(画像データ)が取得される(ステップS9)。撮影された合成画像の出力画像は、携帯端末14のタッチパネル50(表示部44)に表示される。
図13に示すように、例えば、フォトブックの見開きの1ページ目の合成画像の出力画像がユーザの携帯端末14により撮影される。
取得された撮影画像は、第2転送部48により、携帯端末14からネットワーク18を介してサーバ12へ送信される。サーバ12では、第1転送部38により、携帯端末14から送信されてきた撮影画像が受信される。
撮影画像が受信されると、外郭識別部24により、撮影画像に含まれるそれぞれの静止画像の外郭が識別される(ステップS10)。
図13に示すように、例えば、7枚の静止画像f1〜f7が撮影画像に含まれていることが分かる。そして、外郭識別部24により、それぞれの静止画像f1〜f7の配置位置、大きさ、縦横比等が識別される。
続いて、外郭識別部24により識別されたそれぞれの外郭の情報に基づいて、撮影画像に含まれる複数の静止画像のレイアウト構造が、レイアウト構造解析部26により解析される(ステップS11)。
図13に示すように、例えば、フォトブックの見開きの1ページ目の合成画像の出力画像の撮影画像のレイアウト構造は、((f1+(f2+f3))+(f1+(f2+(f3+f4))))という論理構造であることが分かる。
また、外郭識別部24により識別されたそれぞれの外郭に対応する、撮影画像に含まれるそれぞれの静止画像の画像特徴量が、画像特徴量抽出部28により抽出される(ステップS12)。
例えば、フォトブックの見開きの1ページ目の合成画像の出力画像の撮影画像に含まれる静止画像f1,f2の主色相は緑、静止画像f3の主色相は水色、静止画像f4,f5,f7の主色相は青、静止画像f6の主色相は赤であることが分かる。
続いて、動画像特定部34により、まず、記憶部32に記憶された複数の合成画像の関連付け情報の中から、レイアウト構造解析部26により解析された、撮影画像に含まれる複数の静止画像のレイアウト構造に対応するレイアウト構造を含む関連付け情報が検索されて第1関連付け情報として検出される(ステップS13)。
続いて、動画像特定部34により、第1関連付け情報の中から、画像特徴量抽出部28により抽出された画像特徴量に対応する画像特徴量を含む第1関連付け情報が検索されて第2関連付け情報として検出され(ステップS14)、第2関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像が特定される(ステップS15)。
図14に示すように、記憶部32に記憶された複数の合成画像の関連付け情報の中から、レイアウト構造として、((f1+(f2+f3))+(f1+(f2+(f3+f4))))という論理構造に対応する論理構造を含む関連付け情報が検索されて第1関連付け情報として検出され、第1関連付け情報の中から、画像特徴量として、静止画像f1,f2の主色相が緑、静止画像f3の主色相が水色、静止画像f4,f5,f7の主色相が青、静止画像f6の主色相が赤に対応する主色相を含む第1関連付け情報が検索されて第2関連付け情報として検出される。
続いて、動画像処理部36により、動画像特定部34により特定された、撮影画像に含まれるそれぞれの静止画像に対応するそれぞれの動画像から、AR再生用の動画像が生成される。
図15に示すように、例えば、静止画像f1に対応する静止画像a1に関連付けられた動画像から、動画ファイルaの時刻t_a1の地点のフレームから開始されるAR再生用の動画像が生成される。その他の動画像についても同様である。
続いて、動画像処理部36により生成されたAR再生用の動画像は、サーバ12から携帯端末14へ送信される。携帯端末14では、サーバ12から送信されてきたAR再生用の動画像が受信される。
AR再生用の動画像が受信されると、制御部46の制御により、撮影画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像から生成されたそれぞれのAR再生用の動画像が、携帯端末14のタッチパネル50(表示部44)に表示された、合成画像の出力画像に含まれるそれぞれの静止画像の外郭内に再生して表示される(ステップS16)。
図15に示すように、例えば、ユーザにより静止画像f1が指定されると、静止画像f1に対応する静止画像a1に関連付けられた動画像から生成されたAR再生用の動画像がサーバ12から携帯端末14に送信され、静止画像f1の外郭に再生して表示される。
以上のようにして、合成画像の出力画像が撮影されると、撮影画像に含まれるそれぞれの静止画像に対応するそれぞれの動画像が特定され、それぞれの動画像から生成されたAR再生用の動画像が携帯端末14で再生表示される。
画像処理装置10では、合成画像の出力画像に含まれる複数の静止画像のレイアウト構造、さらには、それぞれの静止画像の画像特徴量を用いて関連付け情報を検索することにより、それぞれの静止画像に対応する動画像を特定することができる。そのため、従来の画像処理装置のように、1枚ずつ静止画像の類似判定を行って、静止画像に対応する動画像を特定する場合よりも、対応する動画像を特定するまでの時間を大幅に短縮することができる。
また、画像処理装置10では、レイアウト構造、さらには、画像特徴量を用いて関連付け情報を検索することにより、従来の画像処理装置のように、1枚ずつ静止画像に対応する動画像を特定する場合よりも、対応する動画像を特定するための検索精度を向上させることができる。そのため、アクセスキーを入力する手間を省くことができ、利便性を向上させることができる。また、検索精度が向上されるため、それぞれの静止画像から抽出する画像特徴量は、従来よりも簡単なものでもよいというメリットもある。
なお、携帯端末14を使用することに限定されず、画像撮影部40、入力部42、表示部44、制御部46、第2転送部48等を備えるパーソナルコンピュータ等の制御装置を使用することもできる。
また、動画像処理部36により、動画像からAR再生用の動画像を生成することは必須ではなく、撮影画像に含まれるそれぞれの静止画像に対応するそれぞれの動画像をそのまま使用してもよい。
また、画像処理装置10が、サーバ12と、携帯端末14とを備える例を挙げて説明したが、本発明はこれに限定されず、両者が一体となって構成されていてもよい。あるいは、サーバ12が備える少なくとも一部の構成要素を携帯端末14が備えていてもよいし、逆に、携帯端末14が備える少なくとも一部の構成要素をサーバ12が備えていてもよい。
また、画像特徴量抽出部28は、撮影画像に含まれるそれぞれの静止画像を2以上の分割領域に分割し、それぞれの分割領域の画像特徴量を抽出してもよい。
この場合、記憶部32には、合成画像に含まれるそれぞれの静止画像のそれぞれの分割領域の画像特徴量の情報を含む関連付け情報が、合成画像に対応して記憶され、動画像特定部34により、第1関連付け情報の中から、画像特徴量抽出部28により抽出されたそれぞれの分割領域の画像特徴量に対応するそれぞれの分割領域の画像特徴量を含む第1関連付け情報が検索されて第2関連付け情報として検出される。
また、図16(A)に示すように、撮影画像が、合成画像の出力画像に含まれる複数の静止画像のうちの一部の静止画像のみを含む場合、撮影画像に含まれる一部の静止画像のみの画像特徴量に基づいて動画像を特定してもよい。
この場合、動画像特定部34は、記憶部32に記憶された複数の合成画像の関連付け情報の中から、レイアウト構造解析部26により解析された一部の静止画像のみのレイアウト構造に部分対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、第1関連付け情報の中から、画像特徴量抽出部28により抽出された一部の静止画像のみの画像特徴量に部分対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出する。
例えば、図16(A)に示すように、合成画像の出力画像には7枚の静止画像f1〜f7が含まれているのに対して、撮影画像には、3枚の静止画像f1〜f3のみが撮影されている場合、動画像特定部34は、図16(B)に示すように、3枚の静止画像f1〜f3を含むレイアウト構造に部分対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、3枚の静止画像f1〜f3の画像特徴量に部分対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出する。
なお、グレアなどで合成画像の出力画像に含まれる複数の静止画像のうちの一部の静止画像が見えない場合等でも、見ることができる残りの静止画像のみの画像特徴量に基づいて同様に動画像を特定することができる。
また、動画像特定部34は、レイアウト構造および画像特徴量の両方を使用して動画像を特定しているが、これも限定されず、例えば、レイアウト構造のみ、あるいは、複数の静止画像の画像特徴量のみを使用して動画像を特定することもできる。
例えば、レイアウト構造のみを使用して動画像を特定する場合、記憶部32には、合成画像に含まれる複数の静止画像のレイアウト構造、および、合成画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像の情報を含む関連付け情報が、合成画像に対応して記憶され、動画像特定部34により、記憶部32に記憶された複数の合成画像の関連付け情報の中から、レイアウト構造解析部26により解析された、撮影画像に含まれる複数の静止画像のレイアウト構造に対応するレイアウト構造を含む関連付け情報が検索されて第1関連付け情報として検出され、第1関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像が特定される。
本発明の装置は、装置が備える各々の構成要素を専用のハードウェアで構成してもよいし、各々の構成要素をプログラムされたコンピュータで構成してもよい。
本発明の方法は、例えば、その各々のステップをコンピュータに実行させるためのプログラムにより実施することができる。また、このプログラムが記録されたコンピュータ読み取り可能な記録媒体を提供することもできる。
以上、本発明について詳細に説明したが、本発明は上記実施形態に限定されず、本発明の主旨を逸脱しない範囲において、種々の改良や変更をしてもよいのはもちろんである。
10 画像処理装置
12 サーバ
14 携帯端末
16 プリンタ
18 ネットワーク
20 フレーム画像抽出部
22 合成画像生成部
24 外郭識別部
26 レイアウト構造解析部
28 画像特徴量抽出部
30 関連付け情報生成部
32 記憶部
34 動画像特定部
36 動画像処理部
38 第1転送部
40 画像撮影部
42 入力部
44 表示部
46 制御部
48 第2転送部
50 タッチパネル

Claims (23)

  1. 複数の静止画像を含む合成画像の出力画像を撮影して取得された撮影画像に含まれるそれぞれの静止画像の外郭を識別する外郭識別部と、
    前記外郭識別部により識別されたそれぞれの外郭の情報に基づいて、前記撮影画像に含まれる複数の静止画像のレイアウト構造を解析するレイアウト構造解析部と、
    前記合成画像に含まれる複数の静止画像のレイアウト構造、および、前記合成画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像の情報を含む関連付け情報を前記合成画像に対応して記憶する記憶部と、
    前記記憶部に記憶された複数の合成画像の関連付け情報の中から、前記レイアウト構造解析部により解析された、前記撮影画像に含まれる複数の静止画像のレイアウト構造に対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、前記第1関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を特定する動画像特定部とを備えることを特徴とする画像処理装置。
  2. さらに、前記外郭識別部により識別されたそれぞれの外郭に対応する、前記撮影画像に含まれるそれぞれの静止画像の画像特徴量を抽出する画像特徴量抽出部を備え、
    前記記憶部は、さらに、前記合成画像に含まれるそれぞれの静止画像の画像特徴量の情報を含む関連付け情報を前記合成画像に対応して記憶するものであり、
    前記動画像特定部は、さらに、前記第1関連付け情報の中から、前記画像特徴量抽出部により抽出された画像特徴量に対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出し、前記第2関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を特定するものである請求項1に記載の画像処理装置。
  3. 前記画像特徴量抽出部は、前記撮影画像に含まれるそれぞれの静止画像を2以上の分割領域に分割し、それぞれの前記分割領域の画像特徴量を抽出するものであり、
    前記記憶部は、前記合成画像に含まれるそれぞれの静止画像のそれぞれの分割領域の画像特徴量の情報を含む関連付け情報を前記合成画像に対応して記憶するものであり、
    前記動画像特定部は、前記第1関連付け情報の中から、前記画像特徴量抽出部により抽出されたそれぞれの分割領域の画像特徴量に対応するそれぞれの分割領域の画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出するものである請求項2に記載の画像処理装置。
  4. 前記撮影画像が、前記合成画像の出力画像に含まれる複数の静止画像のうちの一部の静止画像のみを含む場合、前記動画像特定部は、前記記憶部に記憶された複数の合成画像の関連付け情報の中から、前記レイアウト構造解析部により解析された前記一部の静止画像のみのレイアウト構造に部分対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出するものである請求項1に記載の画像処理装置。
  5. 前記撮影画像が、前記合成画像の出力画像に含まれる複数の静止画像のうちの一部の静止画像のみを含む場合、前記動画像特定部は、前記記憶部に記憶された複数の合成画像の関連付け情報の中から、前記レイアウト構造解析部により解析された前記一部の静止画像のみのレイアウト構造に部分対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、前記第1関連付け情報の中から、前記画像特徴量抽出部により抽出された前記一部の静止画像のみの画像特徴量に部分対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出するものである請求項2または3に記載の画像処理装置。
  6. さらに、動画像から複数のフレーム画像を抽出するフレーム画像抽出部と、
    前記フレーム画像抽出部により抽出された複数のフレーム画像の中から選択された1枚以上のフレーム画像を含む2枚以上の画像を用いて前記合成画像を生成する合成画像生成部と、
    前記合成画像生成部により生成された合成画像をプリントして出力画像を出力する出力部とを備える請求項1または4に記載の画像処理装置。
  7. さらに、前記合成画像生成部により前記合成画像が生成された場合に、前記合成画像に含まれる複数の静止画像のレイアウト構造、および、前記合成画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像の情報を含む前記関連付け情報を生成する関連付け情報生成部を備え、
    前記記憶部は、前記関連付け情報生成部により生成された関連付け情報を前記合成画像に対応して記憶するものである請求項6に記載の画像処理装置。
  8. さらに、動画像から複数のフレーム画像を抽出するフレーム画像抽出部と、
    前記フレーム画像抽出部により抽出された複数のフレーム画像の中から選択された1枚以上のフレーム画像を含む2枚以上の画像を用いて前記合成画像を生成する合成画像生成部と、
    前記合成画像生成部により生成された合成画像をプリントして出力画像を出力する出力部とを備える請求項2,3および5のいずれか1項に記載の画像処理装置。
  9. 前記画像特徴量抽出部は、さらに、前記合成画像生成部により前記合成画像が生成された場合に、前記合成画像に含まれるそれぞれの静止画像の画像特徴量を抽出するものであり、
    さらに、前記合成画像生成部により前記合成画像が生成された場合に、前記合成画像に含まれる複数の静止画像のレイアウト構造、前記画像特徴量抽出部により抽出された、前記合成画像に含まれるそれぞれの静止画像の画像特徴量、および、前記合成画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像の情報を含む前記関連付け情報を生成する関連付け情報生成部を備え、
    前記記憶部は、前記関連付け情報生成部により生成された関連付け情報を前記合成画像に対応して記憶するものである請求項8に記載の画像処理装置。
  10. 前記画像特徴量抽出部は、前記画像特徴量として、前記それぞれの静止画像の主色相、輝度、ボケ、エッジ、被写体人物のうちの少なくとも1つを抽出するものである請求項2,3,5,8および9のいずれか1項に記載の画像処理装置。
  11. 前記外郭識別部は、前記外郭の数、前記それぞれの外郭の配置位置、大きさ、縦横比を含む、前記外郭の特徴を識別するものである請求項1〜10のいずれか1項に記載の画像処理装置。
  12. 前記レイアウト構造解析部は、前記合成画像および前記撮影画像に含まれる複数の静止画像を二分木で順次分割して木構造を作成することにより、前記レイアウト構造を解析するものである請求項1〜11のいずれか1項に記載の画像処理装置。
  13. さらに、前記合成画像の出力画像を撮影して前記撮影画像を取得する画像撮影部と、
    前記画像撮影部により前記出力画像が撮影された場合に、前記出力画像を表示する表示部と、
    前記画像撮影部により前記出力画像が撮影された場合に、前記表示部に表示された出力画像に含まれるそれぞれの静止画像の外郭内に、前記動画像特定部により特定された、前記撮影画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像が再生されるように制御する制御部とを備える請求項1〜12のいずれか1項に記載の画像処理装置。
  14. 前記制御部は、前記画像撮影部により前記出力画像が撮影された場合に、前記出力画像を前記表示部に表示し、前記表示部に表示された出力画像に含まれるそれぞれの静止画像の外郭内に、前記動画像特定部により特定された、前記それぞれの静止画像に関連付けられたそれぞれの動画像を同時に再生するように制御するものである請求項13に記載の画像処理装置。
  15. 前記制御部は、前記画像撮影部により前記出力画像が撮影された場合に、前記出力画像を前記表示部に表示し、前記表示部に表示された出力画像に含まれるそれぞれの静止画像の外郭内に、前記動画像特定部により特定された、前記それぞれの静止画像に関連付けられたそれぞれの動画像を、あらかじめ設定された順序で1つずつ再生するように制御するものである請求項13に記載の画像処理装置。
  16. 前記制御部は、前記画像撮影部により前記出力画像が撮影された場合に、前記出力画像を前記表示部に表示し、前記表示部に表示された出力画像に含まれるそれぞれの静止画像の外郭内に、前記動画像特定部により特定された、前記それぞれの静止画像に関連付けられたそれぞれの動画像のうち、ユーザにより指定された動画像を再生するように制御するものである請求項13に記載の画像処理装置。
  17. 外郭識別部が、複数の静止画像を含む合成画像の出力画像を撮影して取得された撮影画像に含まれるそれぞれの静止画像の外郭を識別するステップと、
    レイアウト構造解析部が、前記外郭識別部により識別されたそれぞれの外郭の情報に基づいて、前記撮影画像に含まれる複数の静止画像のレイアウト構造を解析するステップと、
    動画像特定部が、前記合成画像に含まれる複数の静止画像のレイアウト構造、および、前記合成画像に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像の情報を含む関連付け情報を前記合成画像に対応して記憶する記憶部に記憶された複数の合成画像の関連付け情報の中から、前記レイアウト構造解析部により解析された、前記撮影画像に含まれる複数の静止画像のレイアウト構造に対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、前記第1関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を特定するステップとを含むことを特徴とする画像処理方法。
  18. さらに、画像特徴量抽出部が、前記外郭識別部により識別されたそれぞれの外郭に対応する、前記撮影画像に含まれるそれぞれの静止画像の画像特徴量を抽出するステップを含み、
    前記記憶部は、さらに、前記合成画像に含まれるそれぞれの静止画像の画像特徴量の情報を含む関連付け情報を前記合成画像に対応して記憶するものであり、
    前記動画像特定部は、さらに、前記第1関連付け情報の中から、前記画像特徴量抽出部により抽出された画像特徴量に対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出し、前記第2関連付け情報に含まれるそれぞれの静止画像に関連付けられたそれぞれの動画像を特定する請求項17に記載の画像処理方法。
  19. 前記画像特徴量抽出部は、前記撮影画像に含まれるそれぞれの静止画像を2以上の分割領域に分割し、それぞれの前記分割領域の画像特徴量を抽出し、
    前記記憶部は、前記合成画像に含まれるそれぞれの静止画像のそれぞれの分割領域の画像特徴量の情報を含む関連付け情報を前記合成画像に対応して記憶するものであり、
    前記動画像特定部は、前記第1関連付け情報の中から、前記画像特徴量抽出部により抽出されたそれぞれの分割領域の画像特徴量に対応するそれぞれの分割領域の画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出する請求項18に記載の画像処理方法。
  20. 前記撮影画像が、前記合成画像に含まれる複数の静止画像のうちの一部の静止画像のみを含む場合、前記動画像特定部は、前記記憶部に記憶された複数の合成画像の関連付け情報の中から、前記レイアウト構造解析部により解析された前記一部の静止画像のみのレイアウト構造に部分対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出する請求項17に記載の画像処理方法。
  21. 前記撮影画像が、前記合成画像に含まれる複数の静止画像のうちの一部の静止画像のみを含む場合、前記動画像特定部は、前記記憶部に記憶された複数の合成画像の関連付け情報の中から、前記レイアウト構造解析部により解析された前記一部の静止画像のみのレイアウト構造に部分対応するレイアウト構造を含む関連付け情報を検索して第1関連付け情報として検出し、前記第1関連付け情報の中から、前記画像特徴量抽出部により抽出された前記一部の静止画像のみの画像特徴量に部分対応する画像特徴量を含む第1関連付け情報を検索して第2関連付け情報として検出する請求項18または19に記載の画像処理方法。
  22. 請求項17〜21のいずれか1項に記載の画像処理方法の各々のステップをコンピュータに実行させるためのプログラム。
  23. 請求項17〜21のいずれか1項に記載の画像処理方法の各々のステップをコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
JP2015067863A 2015-03-30 2015-03-30 画像処理装置、画像処理方法、プログラムおよび記録媒体 Pending JP2016189507A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015067863A JP2016189507A (ja) 2015-03-30 2015-03-30 画像処理装置、画像処理方法、プログラムおよび記録媒体
US15/045,654 US20160295036A1 (en) 2015-03-30 2016-02-17 Image processing device, image processing method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015067863A JP2016189507A (ja) 2015-03-30 2015-03-30 画像処理装置、画像処理方法、プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2016189507A true JP2016189507A (ja) 2016-11-04

Family

ID=57017891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015067863A Pending JP2016189507A (ja) 2015-03-30 2015-03-30 画像処理装置、画像処理方法、プログラムおよび記録媒体

Country Status (2)

Country Link
US (1) US20160295036A1 (ja)
JP (1) JP2016189507A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016185557A1 (ja) * 2015-05-19 2016-11-24 楽天株式会社 情報処理装置、情報処理方法、プログラム
JP6885896B2 (ja) * 2017-04-10 2021-06-16 富士フイルム株式会社 自動レイアウト装置および自動レイアウト方法並びに自動レイアウトプログラム
JP6958395B2 (ja) * 2018-01-31 2021-11-02 富士通株式会社 記憶制御プログラム、記憶制御方法および記憶制御装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6535639B1 (en) * 1999-03-12 2003-03-18 Fuji Xerox Co., Ltd. Automatic video summarization using a measure of shot importance and a frame-packing method
JP4546291B2 (ja) * 2005-03-01 2010-09-15 キヤノン株式会社 画像処理装置およびその制御方法
JP2010130510A (ja) * 2008-11-28 2010-06-10 Brother Ind Ltd 印刷装置及びプログラム
US8522144B2 (en) * 2009-04-30 2013-08-27 Apple Inc. Media editing application with candidate clip management
JP5506324B2 (ja) * 2009-10-22 2014-05-28 株式会社日立国際電気 類似画像検索システム、および、類似画像検索方法
JP5526193B2 (ja) * 2011-06-20 2014-06-18 富士フイルム株式会社 画像処理装置、画像処理方法および画像処理プログラム
US9165187B2 (en) * 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US8799756B2 (en) * 2012-09-28 2014-08-05 Interactive Memories, Inc. Systems and methods for generating autoflow of content based on image and user analysis as well as use case data for a media-based printable product

Also Published As

Publication number Publication date
US20160295036A1 (en) 2016-10-06

Similar Documents

Publication Publication Date Title
US9311961B2 (en) Image extracting device, image extracting method, and recording medium
US9015579B2 (en) Apparatus and program for efficiently generating electronic albums using templates selected based on image evaluation values
JP4576427B2 (ja) 注釈付画像生成方法及びカメラ
US8849065B2 (en) Continuation of multi-element image templates
JP5389724B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP6340347B2 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2016181808A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US20080152226A1 (en) Apparatus, Method and Program for Information Processing
US8169652B2 (en) Album creating system, album creating method and creating program with image layout characteristics
JP2016189507A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP6043753B2 (ja) コンテンツ再生システム、サーバ、携帯端末、コンテンツ再生方法、プログラムおよび記録媒体
JP4630749B2 (ja) 画像出力装置及びその制御方法
JP2005210369A (ja) 画像処理装置及び画像処理方法
JP5366522B2 (ja) 画像表示装置及び画像表示装置を有するデジタルカメラ
JP4932802B2 (ja) 画像処理装置、方法およびプログラム
JP2016189522A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2004030118A (ja) 画像合成装置
JP2010279047A (ja) データ表示装置および方法並びにプログラム
JP2006005766A (ja) 画像処理方法及び装置
JP2005157027A (ja) 画像表示方法
JP2006027228A (ja) アルバムプリント方法及び装置
WO2015146237A1 (ja) 静止画の関連情報検出装置,検出方法,検出プログラムならびにそのプログラムを格納した記録媒体
JP2008228117A (ja) 記録装置及び記録方法
JP2005077904A (ja) 画像表示システム、方法及びプログラム
JP2010074340A (ja) スライドショー再生装置