JP2010268163A - 映像処理装置及びその制御方法、プログラム - Google Patents

映像処理装置及びその制御方法、プログラム Download PDF

Info

Publication number
JP2010268163A
JP2010268163A JP2009117045A JP2009117045A JP2010268163A JP 2010268163 A JP2010268163 A JP 2010268163A JP 2009117045 A JP2009117045 A JP 2009117045A JP 2009117045 A JP2009117045 A JP 2009117045A JP 2010268163 A JP2010268163 A JP 2010268163A
Authority
JP
Japan
Prior art keywords
image
processing apparatus
clipping
predetermined value
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009117045A
Other languages
English (en)
Other versions
JP2010268163A5 (ja
JP5377067B2 (ja
Inventor
Masato Fujiwara
真人 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009117045A priority Critical patent/JP5377067B2/ja
Priority to US12/757,496 priority patent/US8717453B2/en
Publication of JP2010268163A publication Critical patent/JP2010268163A/ja
Publication of JP2010268163A5 publication Critical patent/JP2010268163A5/ja
Application granted granted Critical
Publication of JP5377067B2 publication Critical patent/JP5377067B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/04Changes in size, position or resolution of an image
    • G09G2340/0407Resolution change, inclusive of the use of different resolutions for different screen areas
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/04Changes in size, position or resolution of an image
    • G09G2340/0442Handling or displaying different aspect ratios, or changing the aspect ratio

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Studio Circuits (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)

Abstract

【課題】 処理対象の映像から部分画像を切り出して、映像の性質に合わせて適切な仮想カメラワークを実現するための技術を提供する。
【解決手段】 画像から複数の部分画像を切り出して出力する画像処理装置は、オブジェクトを含む処理対象の画像を記憶手段から読み出す読出手段と、前記処理対象の画像から前記オブジェクトのオブジェクト領域を取得する取得手段と、前記取得したオブジェクト領域の分布状況を分析する分析手段と、前記オブジェクト領域の分布状況に基づいて、前記処理対象の画像から部分画像を切り出すための切り出し手法を決定する決定手段と、前記決定した切り出し手法を用いて、前記処理対象の画像から部分画像を切り出す切出手段と、を備える。
【選択図】 図1

Description

本発明は映像処理技術に関し、特に映像に仮想カメラワークを自動で付与する技術に関する。
近年、デジタルスティルカメラやデジタルビデオカムコーダの普及により、静止画像や映像の撮影が頻繁に行われている。さらに、記憶容量の大容量化に伴い、そのコンテンツ数は急激に増大している。一方、これらのコンテンツを視聴するには、スライドショーや映像の再生によりディスプレイ装置に全画面表示することが行われてきた。
コンテンツ数の増大に伴い、自動で出力映像の編集を行い、視聴する環境が強く求められている。このため、最近、一部のスライドショーにおいて、画像の一部を複数切り出して、切り出した順に映像として表示させることで、静止画ながら動きのある動画のように視聴する表示効果が用いられるようになった。
しかしながら、その表示効果は画一的なものが多く、視聴者の多くを満足するには至っていない。また、動画の編集には特殊な技能や多大な時間を要する。動画のフレーム毎に切り出し領域を自動で決定して、より劇的な映像効果を奏する映像再生を行う編集装置も知られているが、実際には視聴者が望むような編集が行えていない。特に、映像にあまり変化のない区間に対しては編集に使用するための手がかりとなる情報がなく、視聴者は退屈な視聴を強いられてしまう。
例えば、特許文献1の構成では、蓄積された映像の空間領域を切り出して仮想カメラワークを付与する編集において、フレームアウトしない、所定解像度以上、切り出し領域の移動が所定の速度以内などの制限を設けて、切り出し領域を決定している。切り出し領域の決定は画像特徴量、音声特徴量、その他の映像再生や映像配信に係るメタデータを用いて行っている。特に、画像特徴量はオブジェクトの存在する領域を用いている。
また、特許文献2では、静止画スライドショーにおいて、被写体人数および顔サイズを特定し、被写体人数が閾値をよりも多い場合、任意の人数以下になるように複数の領域を切り出して出力する構成が記載されている。
特許第03793142号公報 特開2006−309661号公報
しかしながら、特許文献1の構成では、映像の内容によって、特に被写体の動きがほぼ静止している場合などは、切り出す空間領域が一定となってしまい抑揚のない映像再生が強いられる。また、特許文献2では、ズーミング、パンニング、チルティングのような自然なカメラワークにならないだけでなく、画像の連続性が損なわれてしまう。例えば、被写体が整列している画像に特許文献2の表示手法を適用すると、被写体の順序関係が表示画像から把握しづらくなってしまう。
本発明は上記課題に鑑みなされたものであり、処理対象の映像から部分画像を切り出して、映像の性質に合わせて適切な仮想カメラワークを実現するための技術を提供することを目的とする。
上記目的を達成するため、本発明による画像処理装置は以下の構成を備える。即ち、
画像から複数の部分画像を切り出して出力する画像処理装置であって、
オブジェクトを含む処理対象の画像を記憶手段から読み出す読出手段と、
前記処理対象の画像から前記オブジェクトのオブジェクト領域を取得する取得手段と、
前記取得したオブジェクト領域の分布状況を分析する分析手段と、
前記オブジェクト領域の分布状況に基づいて、前記処理対象の画像から部分画像を切り出すための切り出し手法を決定する決定手段と、
前記決定した切り出し手法を用いて、前記処理対象の画像から部分画像を切り出す切出手段と、
を備える。
本発明によれば、処理対象の映像から部分画像を切り出して、映像の性質に合わせて適切な仮想カメラワークを実現するための技術を提供することができる。
映像処理装置の機能構成例を示すブロック図。 映像処理装置が実行する処理の手順例を示す処理フロー図。 映像処理装置が実行する処理の手順例を示す処理フロー図。 オブジェクトの分散の度合いを分析する処理の例を示す模式図。 仮想カメラワークの一例を示す模式図。 仮想カメラワークの一例を示す模式図。 仮想カメラワークの一例を示す模式図。 映像処理装置の機能構成例を示すブロック図。 仮想カメラワークの一例を示す模式図。 映像処理装置が実行する処理の手順例を示す処理フロー図。 映像処理装置の機能構成例を示すブロック図。 映像処理装置が実行する処理の手順例を示す処理フロー図。 映像処理装置が実行する処理の手順例を示す処理フロー図。 映像処理装置のハードウェア構成例を示すブロック図。
<<第1の実施形態>>
(映像処理装置のハードウェア構成)
まず、本実施形態に係る映像処理装置(画像処理装置)のハードウェア構成について、映像処理装置のハードウェア構成例を示す図14を参照して説明する。尚、本実施形態に係る映像処理装置は、例えば、パーソナルコンピュータ(PC)やワークステーション(WS)、携帯情報端末(PDA)等で実現される。
図14において、990はCPUである。CPU990は、後述するハードディスク装置995に格納されているアプリケーションプログラム、オペレーティングシステム(OS)や制御プログラム等を実行し、RAM992にプログラムの実行に必要な情報、ファイル等を一時的に格納する制御を行う。
991はROMであり、内部には基本I/Oプログラム等のプログラム、基本処理において使用するフォントデータ、テンプレート用データ等の各種データを記憶する。992は各種データを一時記憶するためのRAMであり、CPU990の主メモリ、ワークエリア等として機能する。
993は記録媒体へのアクセスを実現するための外部記憶ドライブであり、メディア(記録媒体)994に記憶されたプログラム等を本コンピュータシステムにロードすることができる。尚、メディア994には、例えば、フレキシブルディスク(FD)、CD−ROM、DVD、USBメモリ、MO、フラッシュメモリ等が含まれる。
995は外部記憶装置であり、本実施形態では大容量メモリとして機能するハードディスク装置(以下、HDと呼ぶ)を用いている。HD995には、アプリケーションプログラム、OS、制御プログラム、関連プログラム等が格納される。
996は指示入力装置であり、キーボードやポインティングデバイス(マウス等)、タッチパネル等がこれに相当する。指示入力装置996を用いて、ユーザは、本実施形態に係る映像処理装置に対して、装置を制御するコマンド等を入力指示する。997はディスプレイであり、指示入力装置996から入力されたコマンドや、それに対する映像処理装置の応答出力等を表示したりするものである。
999はシステムバスであり、映像処理装置内のデータの流れを司るものである。998はインターフェイス(以下、I/Fという)であり、このI/F998を介して外部装置とのデータのやり取りを行う。
尚、以上の各装置と同等の機能を実現するソフトウェアにより、ハードウェア装置の代替として構成することもできる。後述する各動作は、ROM991等のコンピュータ読み取り可能な記憶媒体に格納されたプログラムをCPU990が実行することにより実行される。
(映像処理装置の機能構成)
本実施形態の構成では、処理対象の画像からオブジェクト領域を取得して、オブジェクト領域の分布状況を分析し、この分布状況に基づいて、処理対象の画像から部分画像を切り出すための切り出し手法を決定する。このため、画像の性質に合わせて仮想フレームワークを適切に実現することができる。
図1は、本実施形態に係る映像処理装置の機能構成例を示す図である。図1において、101は、オブジェクトを含む処理対象の画像(画像データ)が蓄積された記憶部である。本実施形態は、便宜上、記憶部を映像処理装置の機能構成とし、この記憶部から画像データを読み出す読出処理を行うが、ファイルサーバ等の他の装置内に記憶された画像データを通信回線を介して取得しても構わない。
102は、画像内のオブジェクトのオブジェクト領域、例えば、オブジェクトの位置および大きさを取得する物体領域取得部である。オブジェクトとは例えば顔や自動車などの物体のことであり、例えば、一般的に顔検知やオブジェクト検知等のモジュールによって画像内のオブジェクトの位置や大きさを解析することが可能である。本実施形態では、一連の処理の中でオブジェクトの位置および大きさを解析して取得する。ただし、オブジェクトの位置・大きさの取得法はこれに限られず、例えば、予め生成されたメタ情報を読み出して取得してもよい。
105は画像内に存在する全てのオブジェクトの位置と大きさからオブジェクト領域の分布状況を分析し、オブジェクトの分布情報を取得する物体分布情報取得部である。分布情報は、例えば、画像を格子状に分割し、各領域にオブジェクトが存在するか否かによりオブジェクトの分散の度合い(ばらつきの大きさ)を演算した結果に代表される情報である。後述するように、本実施形態では、分布情報は、オブジェクト領域の分布を近似する直線と前記オブジェクト領域との距離の分布を示す統計量で与えられる。ただし、後述する後段の処理のために画像内の全てのオブジェクトの位置および大きさを管理した情報であってもよい。
本実施形態では、103〜106の各機能要素によって、オブジェクト領域の分布状況に基づいて、処理対象の画像から部分画像を切り出すための切り出し手法(切り出し方法)を決定する。このため、オブジェクト領域の分布状況に合わせて適切な切り出し手法を自動的に選別して、部分画像を切り出す切出処理を行うことができる。以下、これらの各機能要素について説明する。
103は、オブジェクトの分布情報からオブジェクトの分布を直線に近似する近似部である。直線の近似方法は、例えば、最小二乗法により直線を求めることが一般的に広く知られている。さらに、最小二乗法を応用してオブジェクトの大きさも加味した加重平均で直線を求めることも有効である。いずれにしても、直線への近似方法はこれらに限定されない。
104は、直線とオブジェクトの位置との偏差からオブジェクトの分散の度合い(大きさ)を計算する計算部である。偏差を求める方法には、直線とオブジェクトの中心位置の乖離している距離で求める方法や、オブジェクト毎の最も直線に近い領域で求める方法などがあるが、その方法は問わない。分散の度合いを求める方法にも、画像内のオブジェクトの中で最も直線から離れているオブジェクトまでの距離を用いる方法や、直線と全てのオブジェクトの距離を用いて標準偏差を求める方法などがあるが、その方法は問わない。
図4は、これまで説明した画像内のオブジェクトとオブジェクトの分布を近似した直線、および直線とオブジェクトまでの距離の関係を例示した模式図である。410(図4(a))、420(図4(b))、430(図4(c))は同一の画像であり、便宜上、それぞれの関係を示すために分けて図示した。411〜415、421〜425、431〜435は、それぞれ画像内に存在するオブジェクトであり、下一桁が同じものは同一のオブジェクトを示している。図から分かるとおり、画像内に5個のオブジェクトが存在している。420および430上に示した破線直線426および436は、最小二乗法で求めたオブジェクトの分布を近似した直線であり、画像表示上では視認できない。430上に示した両方向矢印431−1〜435−1は、直線からオブジェクトの中心までの距離を示しており、この距離の値を用いて分散の度合い(大きさ)を計算することができる。
図1の説明に戻る。106は、オブジェクトの分散の度合いに応じて、境域を切り出す方法を選択する切り出し方法選択部である。例えば、舞台でのコーラスの発表を撮影したデジタルフォトのように、顔が一列又は複数列に帯状に並ぶようなオブジェクトの分散の度合いが小さい場合、各オブジェクトを順に仮想的なカメラでパンニングするような領域切り出し方法が選択される。
図5は、上記の仮想カメラワークの具体例を説明する図である。500(図5(a))は画像全体であり、仮想カメラワークを説明するために、500と同一の画像を511〜519(図5(b)〜図5(j))にも示した。501〜505は画像500および511〜519に存在するオブジェクトである。破線直線で示した506は、オブジェクト501〜505の分布を近似した直線であり、画像データに存在するものではなく、便宜上、示したものである。501−1〜505−1はオブジェクトの分散の度合いを求めるために用いるオブジェクト501〜505と直線506までの距離をそれぞれ示したものである。このような分散の度合いが少ない場合、オブジェクト501〜505をパンニングしながらそれぞれを大きく表示するような切り出し方法に決定される。
図1の説明に戻る。107は、切り出し方法選択部106において選択された切り出し方法を用いて、オブジェクトの位置および大きさを用いて複数の切り出し領域を決定する切り出し領域決定部である。領域の切り出し方法は、複数の切り出す領域における各々の中心点を決定するために用いる。また、オブジェクトの位置および大きさは切り出し領域内にオブジェクトが収まるように切り出し領域を決定するために用いる。
図5を用いて具体的に説明する。511(図5(b))上に示した破線直線507は、パンニングによる仮想カメラワークのカメラアングルの中心点の軌跡、すなわち、複数の切り出し領域の中心点を線で繋いだものである。明示していないが512〜519(図5(b)〜図5(j))上の破線直線も同一のものである。これは分布を近似した直線506と同一のものでも構わないし、オブジェクトの大きさ等による重み付けを行った別の直線でも構わない。
511〜519上に示した511−2〜519−2はそれぞれ切り出し領域を示している。この中で511−2が最初に出力される仮想カメラワークの始点である。始点の決定は特定の方法で行う必要はないが、便宜上、本実施形態では画像内の最も左にあるオブジェクトを含む領域を始点とした。511−2から順に519−2まで破線直線507に沿って切り出し領域が決定される。
切り出し領域の大きさは、オブジェクトとカメラアングルの中心点が最も近付いた際にオブジェクトが切り出し領域内に含まれるように設定することが望ましい。また、切り出す領域の数により切り出し領域毎の中心点の変位が変わるが、切り出す領域の数は仮想カメラワークを施す時間や出力する際のフレームレートによって決定される。さらには、仮想カメラワークが加減速するようなパンニング速度が非線形に変化する場合はこれも加味する必要がある。また、パンニングの始点の切り出し領域までは、オブジェクト全体を含む切り出し領域からズームインする仮想カメラワークのように複数の領域を切り出し、逆に終点からはズームアウトする仮想カメラワークのように複数の領域を順次切り出してもよい。
図1の説明に戻る。108は、決定した切り出し領域を画像から切り出す切り出し部である。109は、切り出した領域を表示画面や動画データとして出力する画像出力部である。108および109は一連の処理の中で時間的に連続する必要はなく、決定した切り出し領域の情報を中間ファイルとして保存し、この中間ファイルを用いて、後に処理しても構わない。さらには、中間ファイルを用いて別の装置で領域の切り出し処理および領域の出力処理を行ってもよいことは言うまでもないが、便宜上、本実施形態の機能構成とした。
(映像処理)
図2は、本実施形態に係る映像処理装置が実行する映像処理の開始から終了までの処理の一例を示すフロー図である。まず、画像内のオブジェクトの位置および大きさを取得する(S201)。取得にあたっては、前述のとおり、オブジェクト解析を用いても、既に解析された位置および大きさのメタ情報を読み出しても構わない。次に、取得したオブジェクトの位置および大きさからオブジェクトの分布情報を取得する(S202)。次に、取得した分布情報に応じて画像から複数の領域を切り出す方法を選択する(S203)。次に、選択された領域を切り出す方法に従ってオブジェクトの位置および大きさから切り出し領域を決定する(S204)。次に、決定した切り出し領域を順次切り出す(S205)。次に、複数の切り出した領域を順次出力して(S206)、処理を終了する。
図3は、図2におけるS203、S204の詳細な処理の一例を示す処理フロー図である。S301〜S304、S314の処理がS203に対応し、S305、S306、S315、S316の処理がS204に対応する。
まず、分布情報からオブジェクトの分布を直線で近似する(S301)。次に、近似したオブジェクトの分布を示す直線とオブジェクトの距離からオブジェクトの分散の度合い(ばらつき大きさ)を計算する(S302)。計算した分散の度合いが所定の値(予め定めた値)よりも小さいか否かを判定して、以下の処理を選択する(S303)。分散の度合いが所定の値より小さい場合(S303でYES)はS304に進み、分散の度合いが所定の値以上の場合(S303でNO)はS314に進む。このように、本実施形態では、処理が複雑でないオブジェクト領域の分布のばらつきの大きさに基づいて部分画像の切り出し手法を決定するため、実装が容易である。
S304では、パンニングのような仮想カメラワークになるように切り出し方法を選択する。次に、パンニングの際のカメラアングルの中心点の軌道および移動速度を決定する(S305)。次に、決定したカメラアングルの中心点とオブジェクトの位置および大きさを用いて切り出し領域を決定する(S306)。パンニングのような仮想カメラワークになる切り出しの例は図5を参照して前述している。そして、図3の処理を終了する。
一方、分散の度合いが所定の値以上の場合のS314では、各オブジェクトにズームインして、オブジェクト全体を含むようにズームアウトするような仮想カメラワークを繰り返すような切り出し方法に決定する。本実施形態では、このような切り出し手法を各オブジェクトに対してカメラチェンジするための切り出し手法と呼ぶ。。次に、ズームするオブジェクトの順序を決定する(S315)。次に、複数の切り出し領域各々の大きさを決定する(S316)。そして、図3の処理を終了する。
●分散が大きい場合の動作例1
既に分散の度合い(大きさ)が小さい場合(パンニングする場合)の切り出し領域については、(映像処理装置の機能構成)で図5を参照して説明した。同様に、図6を用いて分散の度合いが所定の値より大きい場合の切り出し領域に関して補足する。図6は分散の度合いが所定の値より大きい場合の切り出し領域の一例を示した図である。
600(図6(a))は画像領域全体である。611〜625(図6(b)〜図6(p))は600に示した同一の画像領域全体であるが切り出し領域の説明にあたり、便宜上、複数示した。601〜605は画像上に存在するオブジェクトである。600上に示した破線直線606は、オブジェクトの分布を近似した直線であり、画像データには含まれないが便宜上明示した。601−1〜605−1は、オブジェクト601〜605とオブジェクト分布を近似した直線606との距離である。
図6のように、オブジェクトの分布を近似した直線とオブジェクトの位置との偏差が大きく、分散の度合い(大きさ)が大きな場合、パンニングのような仮想カメラワークではカメラアングルの軌跡が複雑な曲線を描くため、視聴するに耐えない。そこで、各オブジェクトに対してカメラチェンジするような仮想カメラワークを繰り返すように切り出し方法が決定される。
まず、カメラチェンジするオブジェクトの順番を決定する。図6の例では左に位置するオブジェクトから順番にカメラチェンジするように決定しているが、これに限られない。例えば、オブジェクトの大きい順、オブジェクトが中心から近い順、オブジェクトが鮮明な順などとしてもよい。611−2〜625−2は切り出し領域であり、番号の順に領域の切り出しおよび出力を行っていく。611−2〜613−2は最も左に存在するオブジェクト601にカメラチェンジする様子を模式的に描いている。同様に、614−2〜616−2は左から二番目、617−2〜619−2は左から三番目、620−2〜622−2は左から四番目、623−2〜625−2は左から五番目、即ち最も右のオブジェクト605にカメラチェンジしている。図を簡略化するためにカメラチェンジする際の切り出し領域のみを示したが、例えば、613−2〜614−2の間にズームアウトするような複数の領域の切り出しを行ってもよい。
●分散が大きい場合の動作例2
図3および図6で説明したオブジェクトの分散の度合いが大きい場合に関して、異なる切り出し方法についても補足する。図7は分散の度合いが所定の値より大きい場合の切り出し領域の例を示した図である。
700(図7(a))は、図6の600と同様に画像領域全体である。また、700上に示された701〜706および701−1〜705−1は図6の600上に示された601〜606および601−1〜605−1と同様のものである。このようにオブジェクトの分散の度合いが大きい場合、それぞれのオブジェクトがアップで出力されるように切り出し方法を選択することも可能である。例えば、711−2〜713−2は最も左のオブジェクト701を所定時間、大きく出力するように同一の領域を複数切り出している様子を示している。同様に714−2〜716−2は左から二番目、717−2〜719−2は左から三番目、720−2〜722−2は左から四番目、723−2〜725−2は左から五番目すなわち最も右のオブジェクト705を中心として同一領域を複数切り出している。
以上のように構成することで、スライドショーのように静止画を視聴する際に、視聴者が退屈せずに、より見やすい映像を自動で生成することができる。
<<第2の実施形態>>
以下、本発明における第2の実施形態を図面に基づいて説明する。なお、上記の第1の実施形態に準ずる個所(例えば、映像処理装置のハードウェア構成)については、説明を割愛する。図8は、本発明の第2の実施形態に係る映像処理装置の機能構成例を示す図である。
本実施形態では、複数のオブジェクトのオブジェクト間距離をさらに分析する。そして、オブジェクト領域のばらつきの大きさが所定値よりも小さい場合であっても、オブジェクト間距離が所定値以上であるときは、画像に含まれる各オブジェクトをズームインするための切り出し手法を決定する。そこで、本実施形態では、図8のように、計算部104(図8では804)の後段にオブジェクト間の距離を取得する距離取得部810を有している。なお、計算部804は、前述のように、オブジェクトの分布を近似した直線とオブジェクトの位置との距離から分散の度合い(大きさ)を計算する機能要素である。本実施形態に加えた機能構成により生ずる効果を、図面を用いて具体的に説明する。なお、801〜809の各機能要素は、第1の実施形態で説明した図1の101〜109と同様であるため、説明を省略する。
図9は、分散の度合いが所定の値より小さく、さらに、オブジェクト間の距離が所定の値より大きい場合の切り出し領域の例を示した図である。900(図9(a))は、画像領域全体である。901および902は画像領域900上に存在するオブジェクトである。906はオブジェクトの分布を近似した直線であり、分散の度合いが小さいことは自明である。908はオブジェクト901と902の距離を示している。
第1の実施形態では、分散の度合い(大きさ)が小さい場合、パンニングのような仮想カメラワークを行う切り出し方法に決定していた。しかしながら、オブジェクト間の距離908が大きい場合は、パンニングのような仮想カメラワークの途中、オブジェクトが存在しない領域を切り出して出力することになる。そこで、このような場合はそれぞれのオブジェクトに順次ズームインするような仮想カメラワークを行う切り出し方法に決定することで、視聴者の不快感をさらに低減することができる。
なお、図9において、911〜918(図9(a)〜図9(i))は900と同じ画像領域であり、911−2〜918−2は複数の切り出し領域を示している。また、第1の実施形態の図7に示した各々のオブジェクトがアップで出力されるように切り出し方法を選択してもよいことは言うまでもない。
図10は、本実施形態における図2のS203、S204の詳細な処理の一例を示す処理フロー図である。まず、第1の実施形態と同様に計算した分散の度合い(大きさ)が所定値よりも小さいか否かを判定する(S1001)。分散の度合いが所定値よりも小さい場合(S1001でYES)はS1002へ進み、所定値以上の場合(S1001でNO)はS1012へ進む。
S1012では、既に第1の実施形態で説明した各オブジェクトにカメラチェンジする処理を行う。S1012で行う処理は図3のS314〜S316の処理に相当し、第1の実施形態で「分散が大きい場合の動作例」1、2として例示した処理と同様である。S1012を終えると、処理を終了する。
一方、S1002では、オブジェクト間の距離を計算する。なお、本実施形態では、前記した近似直線に沿ってオブジェクト間距離を分析する。画像領域全体に3つ以上のオブジェクトが存在する場合は、例えば、近似直線に沿って隣接するオブジェクト間の距離の平均値を計算することができる。次に、S1003において、オブジェクト間が所定の値よりも小さいか否かを判定する。
以下、オブジェクト間の距離により処理が分かれる(S1003)。まず、オブジェクト間の距離が所定の値より小さい場合は既に第1の実施形態に示した(S1003〜S1006)。オブジェクト間の距離が大きい場合、各々のオブジェクトにズームインおよび全てのオブジェクトを含む領域にズームアウトを繰り返すような仮想カメラワークを行うように切り出し方法を選択する(S1024)。次に、ズームするオブジェクトの順序を決定する(S1025)。図9では便宜上、左のオブジェクトから順にズームインする例を示したが、順序の決定方法は言及しない。次に、複数の切り出し領域の大きさを順次決定する。
このように構成することで、スライドショーのように静止画を視聴する際に、視聴者が不快感を感じない映像を自動で生成することができる。
<<第3の実施形態>>
以下、本発明における第3の実施形態を図面に基づいて説明する。本実施形態では、処理対象の画像が複数のフレームから構成される動画像で、動画像を構成するフレーム画像から領域を切り出す処理を行う構成を説明する。なお、上記の第1の実施形態および第2の実施形態に準ずる個所(例えば、映像処理装置のハードウェア構成)については、説明を割愛する。
(映像処理装置の機能構成)
図11は、本発明の第3の実施形態に係る映像処理装置の機能構成例を示す図である。図11において、第1の実施形態で参照した図1と異なる点は、動画からフレーム画像を取り出す取り出し部1110と、フレーム間のオブジェクト位置および大きさの差異を演算する演算部1111を有していることである。本実施形態では、フレーム間におけるオブジェクト領域の変動の大きさを演算し、オブジェクト領域の分布状況と変動の大きさとに基づいて、フレームから部分画像を切り出すための切り出し手法を決定する。これにより、オブジェクトを含む部分画像を動画像から適切に切り出して、高品質の仮想カメラワークを実現することができる。1101〜1109の各機能要素は、第1の実施形態で説明した図1の101〜109と同様であるため、説明を省略する。
(映像処理)
図12は、本実施形態に係る映像処理の一例を示す処理フロー図である。まず、動画データから複数のフレーム画像を取得し(S1201)、取得したフレームの各々からオブジェクトの位置及び大きさをそれぞれ取得する(S1202)。次にフレーム間のオブジェクトの位置および大きさの差異を演算し(S1203)、任意のフレームのオブジェクトの位置および大きさからオブジェクトの分布情報を取得する(S1204)。ここで、分布情報の取得の具体的な手順は第1の実施形態に記載したため、説明を割愛する。また、任意のフレームは複数のフレームを用いて、オブジェクトの位置や大きさの平均を演算するなどしても構わない。
次に、取得した分布情報を用いて各フレームから領域を切り出す方法を選択する(S1205)。決定の方法は第1の実施形態および第2の実施形態に記載したため、説明を割愛する。次に、決定した領域を切り出す方法およびオブジェクトの位置および大きさを用いて、各フレームから切り出す領域を決定する(S1206)。最後に、決定した切り出し領域を各フレームから切り出し(S1207)、切り出した領域をフレームの順序に従って順次出力する(S1208)。
ここで、動画の場合、一般的にオブジェクトに動きがあるため、切り出し手法の決定は静止画の場合と異なる手順で行う必要がある。以下、切り出す方法を選択する処理(切り出し方法選択処理)の手順を説明する。
●切り出し方法選択処理
図13は、領域を切り出す方法を選択する処理の一例を示す処理フローを示した図である。まず、図12で説明したように、フレーム間のオブジェクト位置および大きさの差異を演算し(S1301)、この差異が所定値より小さいか否かを判定して、処理を分岐させる(S1302)。
所定値より小さくない場合(S1302でNO)、即ちオブジェクトの動きが大きい場合、切り出す方法を、オブジェクト領域の変位、例えばオブジェクトの位置および大きさの変位に合わせて順次変更する方法に決定する(S1323)。例えば、オブジェクト全体が右方向に移動していくような動画の区間であれば、仮想カメラワークとして右方向にパンニングするように切り出す方法に決定する。また、一部のオブジェクトが右方向に移動して、切り出し領域からフレームアウトするような場合は、仮想カメラワークとしてズームアウトしてオブジェクト全体がフレーム内に収まるように切り出す方法に決定する。さらには、オブジェクト全体が任意の領域に集合していくような場合は、仮想カメラワークとしてオブジェクト全体が収まるようにズームインするように切り出す方法に決定する。ここではいくつかの例を挙げたが、この限りではない。
次に、フレーム間の差異が所定値より小さい場合(S1302でYES)について説明する。まず、差異が小さい動画区間の継続時間を演算し(S1303)、この継続時間が所定値(所定期間)より大きいか否かを判定して処理を分岐させる(S1304)。継続時間が所定期間以下の場合(S1304でYES)、すなわち、すぐにオブジェクトが動き出す場合は、S1314へ進む。
S1314では、前述S1323の切り出し方法に備えて切り出し領域を変更しないように切り出す、すなわち、複数のフレームの各々の固定領域から部分画像を切り出す方法に決定する。ここで、オブジェクトが動き出く方向や、動き出した後の切り出す方法に備えて事前に切り出し領域を変更するための切り出し方法に決定しても構わない。
一方、継続時間が所定値より大きい場合(S1304でNO)、すなわち、一定期間以上にわたりオブジェクトに動きがない場合はS1305へ進む。S1305では、第1の実施形態および第2の実施形態を含めたこれまで説明した方法、すなわち、処理対象の画像に含まれる各オブジェクトを順に大写しするための切り出し手法に決定することにより、仮想カメラワークを実現する。ここで、仮想カメラワークは次の仮想カメラワークに備えて、上記演算した継続時間内で完了することが望ましい。
以上のように構成することで、動画への仮想カメラワークにも適用でき、視聴者が退屈せずに、より見やすい映像を自動で生成することができる。
上記の各実施形態の構成によれば、映像の空間領域を切り出して仮想カメラワークを付与する編集において、視聴者が退屈しない映像表示を行うための仮想カメラワークの付与を自動で行うことができる。

Claims (12)

  1. 画像から複数の部分画像を切り出して出力する画像処理装置であって、
    オブジェクトを含む処理対象の画像を記憶手段から読み出す読出手段と、
    前記処理対象の画像から前記オブジェクトのオブジェクト領域を取得する取得手段と、
    前記取得したオブジェクト領域の分布状況を分析する分析手段と、
    前記オブジェクト領域の分布状況に基づいて、前記処理対象の画像から部分画像を切り出すための切り出し手法を決定する決定手段と、
    前記決定した切り出し手法を用いて、前記処理対象の画像から部分画像を切り出す切出手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記処理対象の画像は複数のオブジェクトを含み、
    前記分析手段は、前記オブジェクト領域の分布のばらつきの大きさを分析し、
    前記決定手段は、前記ばらつきの大きさが予め定めた値よりも小さい場合に、前記処理対象の画像に含まれる各オブジェクトを順にパンニングするための切り出し手法を決定する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記決定手段は、前記ばらつきの大きさが前記予め定めた値以上である場合に、前記処理対象の画像に含まれる各オブジェクトに対してカメラチェンジするための切り出し手法を決定する
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記分析手段は、前記複数のオブジェクトのオブジェクト間距離をさらに分析し、
    前記決定手段は、前記ばらつきの大きさが前記予め定めた値よりも小さい場合であっても、前記オブジェクト間距離が所定値以上であるときは、前記処理対象の画像に含まれる各オブジェクトをズームインするための切り出し手法を決定する
    ことを特徴とする請求項3に記載の画像処理装置。
  5. 前記分析手段は、前記オブジェクト領域の分布を直線で近似し、当該直線と前記オブジェクト領域との距離の分布を示す統計量を前記ばらつきの大きさとして分析する
    ことを特徴とする請求項4に記載の画像処理装置。
  6. 前記分析手段は、前記直線に沿って前記オブジェクト間距離を分析する
    ことを特徴とする請求項5に記載の画像処理装置。
  7. 前記処理対象の画像は複数のフレームから構成される動画像であり、
    前記フレーム間における前記オブジェクト領域の変動の大きさを演算する演算手段をさらに備え、
    前記決定手段は、前記分布状況と前記変動の大きさとに基づいて、前記フレームから部分画像を切り出すための切り出し手法を決定する
    ことを特徴とする請求項1に記載の画像処理装置。
  8. 前記決定手段は、前記変動の大きさが予め定めた値以上である場合に、前記オブジェクト領域の変位に合わせて前記部分画像の切り出し領域を変更していくための切り出し手法を決定する
    ことを特徴とする請求項7に記載の画像処理装置。
  9. 前記決定手段は、前記変動の大きさが前記予め定めた値より小さく、かつ、前記変動の大きさが前記予め定めた値より小さい期間が所定期間よりも長く継続した場合は、前記処理対象の画像に含まれる各オブジェクトを順に大写しするための切り出し手法を決定する
    ことを特徴とする請求項8に記載の画像処理装置。
  10. 前記決定手段は、前記変動の大きさが前記予め定めた値より小さく、かつ、前記変動の大きさが前記予め定めた値より小さい期間の継続が所定期間以下である場合は、前記複数のフレームの各々の固定領域から部分画像を切り出すための切り出し手法を決定する
    ことを特徴とする請求項8に記載の画像処理装置。
  11. 画像から複数の部分画像を切り出して出力する画像処理装置の制御方法であって、
    読出手段が、オブジェクトを含む処理対象の画像を記憶手段から読み出す読出工程と、
    取得手段が、前記処理対象の画像から前記オブジェクトのオブジェクト領域を取得する取得工程と、
    分析手段が、前記取得したオブジェクト領域の分布状況を分析する分析工程と、
    決定手段が、前記オブジェクト領域の分布状況に基づいて、前記処理対象の画像から部分画像を切り出すための切り出し手法を決定する決定工程と、
    切出手段が、前記決定した切り出し手法を用いて、前記処理対象の画像から部分画像を切り出す切出工程と、
    を備えることを特徴とする画像処理装置の制御方法。
  12. コンピュータを請求項1から10のいずれか1項に記載の画像処理装置が備える各手段として機能させるためのプログラム。
JP2009117045A 2009-05-13 2009-05-13 画像処理装置、画像処理装置の制御方法、およびプログラム Expired - Fee Related JP5377067B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009117045A JP5377067B2 (ja) 2009-05-13 2009-05-13 画像処理装置、画像処理装置の制御方法、およびプログラム
US12/757,496 US8717453B2 (en) 2009-05-13 2010-04-09 Video processing apparatus, and control method and program therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009117045A JP5377067B2 (ja) 2009-05-13 2009-05-13 画像処理装置、画像処理装置の制御方法、およびプログラム

Publications (3)

Publication Number Publication Date
JP2010268163A true JP2010268163A (ja) 2010-11-25
JP2010268163A5 JP2010268163A5 (ja) 2012-06-07
JP5377067B2 JP5377067B2 (ja) 2013-12-25

Family

ID=43068193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009117045A Expired - Fee Related JP5377067B2 (ja) 2009-05-13 2009-05-13 画像処理装置、画像処理装置の制御方法、およびプログラム

Country Status (2)

Country Link
US (1) US8717453B2 (ja)
JP (1) JP5377067B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014212458A (ja) * 2013-04-19 2014-11-13 日本放送協会 接写映像生成装置及びそのプログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8856656B2 (en) * 2010-03-17 2014-10-07 Cyberlink Corp. Systems and methods for customizing photo presentations
US11039109B2 (en) 2011-08-05 2021-06-15 Fox Sports Productions, Llc System and method for adjusting an image for a vehicle mounted camera
US10939140B2 (en) * 2011-08-05 2021-03-02 Fox Sports Productions, Llc Selective capture and presentation of native image portions
US8773543B2 (en) 2012-01-27 2014-07-08 Nokia Corporation Method and apparatus for image data transfer in digital photographing
US9279983B1 (en) * 2012-10-30 2016-03-08 Google Inc. Image cropping
US11159854B2 (en) 2014-12-13 2021-10-26 Fox Sports Productions, Llc Systems and methods for tracking and tagging objects within a broadcast
US11758238B2 (en) 2014-12-13 2023-09-12 Fox Sports Productions, Llc Systems and methods for displaying wind characteristics and effects within a broadcast
US9288545B2 (en) 2014-12-13 2016-03-15 Fox Sports Productions, Inc. Systems and methods for tracking and tagging objects within a broadcast
US10244175B2 (en) * 2015-03-09 2019-03-26 Apple Inc. Automatic cropping of video content
CN110223306B (zh) * 2019-06-14 2021-06-15 北京奇艺世纪科技有限公司 一种图像的裁剪方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309661A (ja) * 2005-05-02 2006-11-09 Fuji Photo Film Co Ltd 画像再生装置及び画像再生プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6144755A (en) * 1996-10-11 2000-11-07 Mitsubishi Electric Information Technology Center America, Inc. (Ita) Method and apparatus for determining poses
JP2001346031A (ja) * 2000-06-05 2001-12-14 Fuji Photo Film Co Ltd 画像合成方法及び装置
US7034848B2 (en) * 2001-01-05 2006-04-25 Hewlett-Packard Development Company, L.P. System and method for automatically cropping graphical images
JP3793142B2 (ja) 2002-11-15 2006-07-05 株式会社東芝 動画像加工方法及び装置
US20110044512A1 (en) * 2009-03-31 2011-02-24 Myspace Inc. Automatic Image Tagging

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309661A (ja) * 2005-05-02 2006-11-09 Fuji Photo Film Co Ltd 画像再生装置及び画像再生プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014212458A (ja) * 2013-04-19 2014-11-13 日本放送協会 接写映像生成装置及びそのプログラム

Also Published As

Publication number Publication date
US20100289913A1 (en) 2010-11-18
US8717453B2 (en) 2014-05-06
JP5377067B2 (ja) 2013-12-25

Similar Documents

Publication Publication Date Title
JP5377067B2 (ja) 画像処理装置、画像処理装置の制御方法、およびプログラム
US11756587B2 (en) Masking in video stream
US9959903B2 (en) Video playback method
US7725830B2 (en) Assembling verbal narration for digital display images
CN109643218B (zh) 用户界面元素的动画
US11438510B2 (en) System and method for editing video contents automatically technical field
JP5634111B2 (ja) 映像編集装置、映像編集方法及びプログラム
US9436358B2 (en) Systems and methods for editing three-dimensional video
KR20160149141A (ko) 복수의 이미지를 디스플레이하는 전자 장치 및 이의 이미지 처리 방법
US20170237936A1 (en) Information processing apparatus, method for controlling the information processing apparatus, and recording medium
JP2003303333A (ja) 画像表示制御装置
JP4741808B2 (ja) 情報処理装置、プログラム
JP2007243411A (ja) 画像処理装置、方法およびプログラム
JP2005136485A (ja) 編集装置
JP2008020944A (ja) 画像処理方法、プログラムおよび装置
JP2008263657A (ja) 画像処理装置、サムネイル動画作成方法及びサムネイル動画作成プログラム
JP5419783B2 (ja) 画像再生装置及び画像再生装置の制御方法
CN110662104B (zh) 视频拖动条生成方法、装置、电子设备及存储介质
JP6979738B1 (ja) サーバおよびアニメーション推薦システム、アニメーション推薦方法、プログラム
KR102466718B1 (ko) 프레젠테이션 문서를 구성하는 슬라이드에 녹화 영상의 삽입을 가능하게 하는 전자 단말 장치 및 그 동작 방법
KR100683349B1 (ko) 정지영상 내의 관심영역 지정기반 선택보기 방법과 장치
KR101722681B1 (ko) 동영상 처리 장치, 및 방법
KR101759297B1 (ko) 동영상 처리 장치, 및 방법
KR20240098977A (ko) 다시점 영상을 위한 디스플레이 장치 및 그 동작 방법
JP2008300981A (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120419

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130826

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130924

R151 Written notification of patent or utility model registration

Ref document number: 5377067

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees