JP6907274B2 - 撮像装置及び撮像方法 - Google Patents

撮像装置及び撮像方法 Download PDF

Info

Publication number
JP6907274B2
JP6907274B2 JP2019142458A JP2019142458A JP6907274B2 JP 6907274 B2 JP6907274 B2 JP 6907274B2 JP 2019142458 A JP2019142458 A JP 2019142458A JP 2019142458 A JP2019142458 A JP 2019142458A JP 6907274 B2 JP6907274 B2 JP 6907274B2
Authority
JP
Japan
Prior art keywords
image
score
imaging
corrected
captured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019142458A
Other languages
English (en)
Other versions
JP2020188448A (ja
Inventor
攀 胡
攀 胡
文 鄒
文 鄒
子晟 曹
子晟 曹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SZ DJI Technology Co Ltd
Original Assignee
SZ DJI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SZ DJI Technology Co Ltd filed Critical SZ DJI Technology Co Ltd
Publication of JP2020188448A publication Critical patent/JP2020188448A/ja
Application granted granted Critical
Publication of JP6907274B2 publication Critical patent/JP6907274B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • G06T3/608Rotation of whole images or parts thereof by skew deformation, e.g. two-pass or three-pass rotation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/80Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/681Motion detection
    • H04N23/6812Motion detection based on additional sensors, e.g. acceleration sensors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/682Vibration or motion blur correction
    • H04N23/683Vibration or motion blur correction performed by a processor, e.g. controlling the readout of an image memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/68Circuits for processing colour signals for controlling the amplitude of colour signals, e.g. automatic chroma control circuits
    • H04N9/69Circuits for processing colour signals for controlling the amplitude of colour signals, e.g. automatic chroma control circuits for modifying the colour signals by gamma correction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Studio Devices (AREA)
  • Exposure Control For Cameras (AREA)
  • Image Processing (AREA)

Description

本開示は、撮影技術に関し、特に、撮像装置及び撮像方法に関する。
アクションカメラは、一般に、コンパクトさ、携帯性、および校正に関して高い要求を有する。アクションカメラの携帯性の要件のために、アクションカメラは一般に、小さい画面と、ユーザが対話するためのいくつかのボタンとを有する。このように、ユーザは、プロのカメラまたは携帯電話のように画像のフレーミングおよび合成を完成させるためにアクションカメラで一連の操作を容易かつ手軽に行うことができず、したがってユーザはアクションカメラを用いて手動で画像を撮影することがあまりない。
しかしながら、市場に出回っているカメラは一般に、高度な自動トリガおよび自動合成(自動フレーミングとも呼ばれる)機能を欠いている。オートトリガ機能は、タイム撮影またはタイムラプス撮影に限られる。カメラには、センサやプロセッサなどの高度な検出および識別コンポーネントは含まれていない。ライブビュービデオ画面上の3点線や横線、あるいは顔の位置枠や色ヒストグラム、シーン、焦点などの下位の画像情報に従って、構図や撮影を実現するためには、ユーザはより多くの操作を行う必要がある。そのため、自動合成の効果が得られない。
そのため、ユーザによる操作を必要とせずに、より高画質の画像を取得するためには、オートトリガ、オートコンポジションなどを有するモーションカメラが必要となる。
本発明のある態様は、撮像装置である。当該撮像装置は、所定の条件が満たされたときに画像撮影装置の撮像動作をトリガする撮影選択部と、前記画像撮影装によって得られた撮影画像を合成して補正画像を生成する画像合成部と、前記補正画像を出力する画像出力部と、を備える。なお、本明細書において、「撮像動作」とは、メモリなど記録媒体に格納される画像データを取得するために画像撮影装置を動作させることを意味し、「撮像動作」をトリガする前に画像撮影装置を用いて、現在のシーンの画像を一時的または仮に取得してもよい。
本発明の他の態様は、撮像方法である。当該撮像方法は、所定の条件が満たされたときに画像撮影装置の撮像動作をトリガするステップと、前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成するステップと、前記補正画像を出力するステップと、を備える。
図1A−1Cは、本開示の実施形態による撮影装置の適用シナリオを概略的に示す図である。 図2は、本開示の実施形態に係る撮影装置の概略図である。 図3は、図2の撮影装置によって実行される回転補正処理のフローチャートである。 図4は、図2の撮影装置によって実行される画像処理のフローチャートである。 図5A−5Dは、図2の撮影装置によって実行される処理のフローチャートを示す。 図6は、本開示の実施形態による別の撮影装置の概略図である。 図7は、本開示の実施形態による別の撮影装置の概略図である。 図8は、本開示の実施形態による別の撮影装置の概略図である。 図9は、本開示の実施形態に係る撮影方法のフローチャートである。 図10は、本開示の実施形態による別の撮影方法のフローチャートである。 図11は、本開示の実施形態による別の撮影方法のフローチャートである。 図12は、本開示の実施形態による別の撮影方法のフローチャートである。 図13は、本開示の実施形態による別の撮影方法のフローチャートである。
以下、本開示と一致する実施形態を図面を参照しながら説明するが、これらの図面は例示目的のための単なる例であり、本開示の範囲を限定することを意図するものではない。可能な限り、同じまたは類似の部分を指すために図面全体を通して同じ参照番号が使用される。
本開示は、自動トリガ、自動回転補正、自動構図、および/または自動画像選択機能を有する撮影装置を提供することにより、少ないユーザ操作で自動撮影を実現する。図1A−図1Cは、本開示と整合性のある撮影装置の例示的な適用シナリオを概略的に示す図である。図1Aに示すように、ユーザは自分の体または腕に直接またはリストバンドなどの他の付属品を介して間接的に自分の体または腕に撮影装置を装着することができる。例えば、ユーザが外出して撮影装置を装着している場合、旅行中に撮影装置が自動的に美的に楽しい画像を撮影することができる。ツアー終了後、ユーザは、撮影装置によって自動的に撮影された画像を見て、美的に楽しい画像を得ることができる。いくつかの実施形態では、撮影装置は、自動撮影のために移動可能な物体(図1Bに示す自転車または自動車など)に取り付けることができ、それによってシーンの広範囲の変化または特別な撮影のニーズを満たすことができる。いくつかの他の実施形態では、図1Cに示すように、撮影装置は、壁、テーブルなどの静止物に配置されるか、または固定的に取り付けられることができる。このシナリオでは、撮影装置は動いていないが、撮影装置はシーン内で変化する内容の画像を撮影し、人生の瞬間を捉えることができる。
図2は、本開示と整合性のある例示的な撮像装置200の概略図である。図2に示すように、撮像装置200は、画像撮影装置(カメラ)201と、画像撮影装置201に接続された撮影選択回路202と、画像撮影装置201に接続された画像回転補正回路203と、画像回転補正回路203に接続された画像合成回路204と、画像合成回路204と画像撮影装置201とを接続する画像選択回路205と、画像合成回路204と画像撮影装置201とを接続する画像表示回路206とを含む。
画像撮影装置201は、カメラ、カムコーダ、光センサなどとすることができる。画像撮影装置201は、カメラレンズ、画像センサ、画像処理チップ、メモリ、スクリーン、インターフェースなどを含むことができる。いくつかの実施形態では、カメラレンズは、例えば120度を超える視野(FOV)を有する広角レンズを含むことができる。いくつかの他の実施形態では、カメラレンズは複数のレンズを含むことができる。画像センサは、例えば、電荷結合素子(CCD)センサまたは相補型金属酸化膜半導体(CMOS)センサを含むことができる。画像処理チップは画像センサに結合することができる。画像撮影装置201は、カメラレンズと撮像素子を介して撮像し、撮像素子を介して撮像画像を画像処理チップに入力することができる。画像処理チップは、例えば、画像に対してノイズ低減、色補正、フォーマット変換(例えば、RGBからYUVへ)、スケーリングなどを実行することによって画像を処理することができる。画像処理チップは、カメラレンズおよび/または画像センサを制御する、例えば3Aパラメータ、すなわち自動露出(AE)、自動ホワイトバランス(AWB)、オートフォーカス(AF)を調整するように構成することもできる。画像処理チップは、例えば、デジタル信号処理(DSP)チップとすることができる。メモリは、取り込まれた画像データを一時的または恒久的に格納するように構成することができる。インターフェースは、画像伝送用のユニバーサルシリアルバス(USB)インターフェース、米国電気電子技術者協会1394(IEEE 1394)インターフェースなどのような任意の種類の電気的インターフェースを含むことができる。
撮影選択回路202は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、特定用途向け集積回路(ASIC)、またはASICの一部を含むことができ、画像撮影装置201の撮像動作を自動的にトリガし、ソフトウェアとハードウェアの組み合わせを使用して現在のシーンの画像を撮影するように構成することができる。いくつかの実施形態では、撮影選択回路202は、現在のシーンにおいて特定の意味を有するオブジェクトが検出されると、撮像動作をトリガすることができる。特定の意味は、例えば、人々、動物、顔、または笑顔を含み得るが、これらに限定されない。例えば、現在のシーンにおいて顔が検出されると、撮影選択回路202は自動的に画像撮影装置201の撮像動作をトリガすることができる。現在のシーン内のオブジェクトを検出するために任意のオブジェクト認識アルゴリズム、例えば、本明細書で限定されない顔認識アルゴリズムを使用することができる。
いくつかの実施形態では、撮影選択回路202は、現在のシーンの奥行き(depth)の変化に応答して撮像動作をトリガすることができる。現在のシーンの奥行きは、例えば、画像撮影装置201が現在のシーンに面しているときのカメラ201の焦点距離を指すことができる。これは、例えば、画像撮影装置201から現在のシーン内のオブジェクトまでの距離とすることができる。いくつかの実施形態では、現在のシーンの奥行きは、奥行きセンサ、例えば飛行時間(ToF)センサを介して取得することができる。現在のシーンの奥行きの変化は、現在のシーンの奥行きが前のシーンの奥行きと異なることを指すことができる。
いくつかの実施形態では、撮影選択回路202は、現在のシーンの焦点の変化に応答して撮像動作をトリガすることができる。現在のシーンの焦点は、画像撮影装置201が現在のシーン内のオブジェクトに焦点を合わせるときの、画像撮影装置201の焦点位置を指すことができる。いくつかの実施形態では、現在のシーンの焦点は焦点センサを介して得ることができる。現在のシーンの焦点の変化は、現在のシーンの焦点が前のシーンの焦点とは異なることを指すことができる。
いくつかの実施形態では、撮影選択回路202は音声コマンドを介して撮像動作をトリガすることができる。例えば、撮影選択回路202は音声-ユーザインタフェース(VUI)を含むことができる。ユーザは音声コマンドを話すことができ、VUIは音声コマンドを撮影するためにユーザの音声を検出することができ、例えば、音声選択アルゴリズムを使用して音声コマンドをテキストに変換し、撮影選択回路202が変換されたテキストに従って撮像操作をトリガすることができる。VUIは、例えば、ユーザの音声を検出するように構成されたマイクロフォン、および音声コマンドを変換するように構成されたプロセッサ(マイクロプロセッサまたは特定用途向け集積回路(ASIC)など)を含むことができる。
いくつかの実施形態では、撮影選択回路202は、制御プロセスを通して撮像動作をトリガすることができる。制御処理としては、タイマー撮影、タイムラプス撮影等が挙げられる。例えば、撮影選択回路202は、タイマー撮影を用いて予め設定された時間に撮像動作をトリガすることができる。他の例として、撮影選択回路202は、タイムラプス撮影を用いて、予め設定された時間間隔、例えば5秒ごとに撮像動作をトリガすることができる。
いくつかの実施形態では、撮影選択回路202は、上記の異なる基準の任意の組み合わせに従って撮像動作をトリガすることができる。例えば、撮影選択回路202は、特定の意味を有するオブジェクトがプリセット時間に検出された場合、タイマー撮影を使用してプリセット時間に撮像動作をトリガすることができる。別の例として、撮影選択回路202は、特定の意味を有するオブジェクトが事前設定された期間に検出された場合、タイムラプス撮影を使用して事前設定された期間に撮像動作をトリガすることができる。
画像回転補正回路203は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像撮影装置201から撮影画像を受信して自動的に実行するように構成することができる。撮影画像の回転補正いくつかの実施形態では、画像回転補正回路203は、慣性測定ユニット(IMU)などの、画像撮影装置201に取り付けられた、またはそれに結合された1つまたは複数の姿勢センサを通して画像撮影装置201の姿勢情報を得ることができる。姿勢情報は、画像撮影装置201のヨー軸情報、ピッチ軸情報、および/またはロール軸情報を含むことができる。例えば、1つ以上の姿勢センサ、例えばIMUは、画像撮影装置201の画像センサの裏側に配置され、画像撮影装置201の姿勢情報を取得することができる。画像撮影装置201が目標姿勢にあるときに画像が取り込まれたかのように、画像撮影装置201の姿勢情報と目標姿勢との差(このような差を「姿勢差」ともいう)に応じて撮像画像を回転させることで、回転画像の姿勢を調整することができる。画像撮影装置201の姿勢情報と目標姿勢との差を算出するのに適した任意の方法を採用することができる。
図3は、例えば撮像装置200により実現可能な回転補正処理の一例を示すフローチャートである。例えば、図10に示す回転補正処理は、CPU101により実行される。撮像装置200の画像回転補正回路203により、図3に示すような画像回転補正回路203を実現することができる。図3に示すように、画像撮影装置201のイメージセンサ等のイメージセンサ312により、ベイヤー形式の撮像画像の生データ310と、各撮像画像に同期したVSYNC(垂直同期)信号311とが出力される。IMU314のジャイロデータ313およびVSYNC信号311は、IMU314のドライバ回路によって取得することができる。IMU314の各ジャイロデータ313は、各撮影画像に対応するVSYNC信号311のシーケンス番号でラベル付けされている。メッシュ計算器316によって画像撮影装置201のパラメータ(図3においてカメラ情報315として示される)およびジャイロデータ313が得られた後、ジャイロデータ313と目標姿勢(例えば、0度ヨー角、0度ロール角、および0度ピッチ角を有する姿勢)との差に従って、メッシュ計算器316によってメッシュテーブル317を計算することができる。メッシュテーブル317は、デワープ(Dewarp)エンジン318によって目標姿勢を有する回転画像を生成するために取り込まれた画像をそれに従って回転させることができる回転行列を含むことができる。メッシュ計算器316は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができる。いくつかの実施形態では、生データ310は、デワープエンジン318に送信する前に処理することができる。処理された画像データは、Src_imgデータ319として示され、これは、取り込まれた画像の生データ310とは異なる。理解されるように、デワープエンジン318に送信される画像データ(例えば、Src_imgデータ319)に対応するVSYNC信号311のシーケンス番号は、メッシュテーブル内のVSYNC信号311のシーケンス番号と一致する。目標姿勢を有する回転画像を生成するために画像を回転させることができる。回転された画像の画像データは、図3の修正Src_imgデータ320によって示される。すなわち、Src_imgデータ319がデワープエンジンに送られる時点t2は、撮像画像を正しく回転させて目標姿勢の回転画像を生成できるようにメッシュテーブルを生成する時点t1よりも早い。いくつかの実施形態では、回転範囲は、回転された画像の視野(FOV)をFOV閾値より小さくないように設定することができる。回転範囲とは、画像を回転させることができる最大角度のことである。FOV閾値は実際の要求に従って決定することができる。回転範囲は、ヨー方向の回転範囲、ピッチ方向の回転範囲、および/またはロール方向の回転範囲を含むことができる。画像撮影装置201の姿勢情報と目標姿勢との差が回転範囲より大きければ、回転範囲に応じて撮像画像を回転させたり、回転させずに撮像画像を維持したりすることができる。例えば、画像撮影装置201の姿勢情報と目標姿勢との差が、撮像画像をロール方向に20°回転させても、ロール方向の回転範囲が15°しかない場合には、撮像画像を撮像する。画像はロール方向に15°回転させることも、回転させないこともできる。
いくつかの他の実施形態では、水平方向の線または垂直方向の線などの既知の傾斜角を有する線をロール方向の傾斜角を得るために撮影画像内で検出し、傾斜角に応じて、撮影画像をロール方向に回転させることができる。水平線または垂直線を検出するのに適した任意の方法を使用することができる。例えば、撮像画像における空と地面との色やコントラストなどの差を満たす複数の直線を得ることができる。撮影画像内の水平線を得るために、これらの直線のそれぞれに対して曲線当てはめを実行することができる。いくつかの実施形態では、傾斜角は、撮像画像内で検出された水平線と画像撮影装置201の幅方向に平行な直線との間の角度を計算することによって得ることができる。いくつかの他の実施形態では、傾斜角は、撮像画像内で検出された垂直線と画像撮影装置201の長さ方向に平行な直線との間の角度を計算することによって得ることができる。場合によっては、ロールの方向への撮影された画像の傾斜は、ユーザの意図的な振る舞いから生じる可能性があり、したがって、ロールの方向への撮影された画像の回転は必要とされない。いくつかの実施形態では、ロール方向の傾斜閾値が設定されてもよく、ロール方向の傾斜閾値以上であるロール方向の傾斜角は、ユーザが意図的に画像撮影装置201を傾けて画像を撮影したことを示し得る。従って、取り込まれた画像は回転することなく維持され得る。
いくつかの実施形態では、ピッチ方向の傾斜角は、角度センサなどの、画像撮影装置201に取り付けられたまたはそれに結合された1つまたは複数のセンサを介して取得することができる。例えば、1つ以上のセンサ、例えば角度センサは、画像撮影装置201の画像センサの裏側に配置され、ピッチ方向における画像撮影装置201の傾斜角を得ることができる。時々、ピッチ方向への撮影された画像の傾斜は、ユーザの意図的な行動に起因し得、したがって、撮影された画像をピッチ方向に回転させることは必要とされない。いくつかの実施形態では、ピッチ方向の傾斜閾値が設定されてもよく、ピッチ方向の傾斜閾値以上であるピッチ方向の傾斜角は、ユーザが意図的に画像撮影装置201を傾斜させて画像を撮像したことを示してもよい。アクションカメラは一般にユーザによって装着されているか、または移動装置に配置されているため、撮影プロセス中にユーザが構図に積極的に参加していない場合、カメラの姿勢の傾きは変化する。例えば、カメラは、撮影画像がヨー方向、ピッチ方向、ロール方向に投影変形している場合に発生する。そのため、撮影画像に対して回転補正を行い、姿勢の傾きを補正する必要がある。しかしながら、現在市販されているほとんどのカメラは、撮影プロセス中の姿勢の修正を実現するためにジンバルなどの補助装置を使用する必要があり、そのためユーザは撮影を完了するために追加の装置を携帯しなければならず、アクションカメラの携帯性の利点が奪われる。したがって、自動回転補正機能を有する撮像装置200は、補助装置を必要とせずに撮影中の姿勢補正を実現することができ、携帯性の利点を実現することができる。
いくつかの実施形態では、撮像装置200は、画像回転補正回路203および/または画像撮影装置201に結合された画像歪み補正回路(図2には図示せず)をさらに含み得る。画像歪み補正回路は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、撮影画像を回転させる前または後に歪み補正を実行するように構成することができる。歪み補正の方法は、歪みの種類に応じて選択することができ、任意の適切な方法が採用され得る。例えば、広いFOVを有する画像には樽型の歪みが存在する可能性がある。樽型歪みの補正方法としては、偶数次多項式モデル、多項式モデル、無パラメータモデル、除算モデルなどを用いることができる。
実施形態によっては、撮像装置200は、画像歪み補正回路および画像回転補正回路203の代わりに画像補正回路を備えていてもよい。画像補正回路は、撮像画像に対して歪み補正と回転補正の両方を行うように構成することができる。
アクションカメラで使用されている超広角レンズは、動いているシーンで広いFOVを有する画像を撮影することを可能にする。しかし、超広角レンズによる光学歪みのために、撮影画像の端部にはひずみと圧縮が激しい。歪み補正を使用することによって、ある範囲の歪みを補正することができるが、歪み補正後の画像の視覚効果は依然として受け入れられない。そのため、歪み補正機能を有する撮像装置200は、より視覚効果の高い画像を得ることができる。画像合成回路204は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができる。そして、回転画像を画像回転補正回路203から受け取り、回転画像を自動的に合成して補正画像を生成するように構成することができる。いくつかの実施形態では、画像合成回路204は、顕著性検出および合成規則に基づいて回転画像を合成するように構成することができる。合成規則は、中央合成規則、トライアド合成規則、水平線合成規則、対称合成規則、および対角線合成規則などを含むことができる。
例えば、画像合成回路204は、回転画像内の顕著な物体を検出することができる。回転画像における顕著な物体の位置およびサイズ情報を得ることができる。回転された画像は、合成規則および顕著なオブジェクトの位置およびサイズの情報に従って、合成画像を得るために切り取ることができる。例えば、合成規則が中心合成規則である場合、回転オブジェクトを切り取って、顕著オブジェクトの位置およびサイズ情報に従って、顕著オブジェクトを合成画像の中心または中心付近に配置することができる。いくつかの実施形態では、合成画像を補正画像として出力することができる。いくつかの他の実施形態では、合成画像は、例えば、画像撮影装置201のスクリーンまたは画像撮影装置201の外部のディスプレイのアスペクト比に従って、補正画像を得るためにスケーリングまたはさらにトリミングすることができる。補正画像のアスペクト比は、画像撮影装置201の画面またはディスプレイのアスペクト比と一致し得る。顕著オブジェクトを検出するのに適した任意の方法、例えば、ディープラーニングに基づく方法(例えば、階層的ディープネットワーク、マルチスケール、マルチコンテキストディープラーニングフレームワーク、対称ネットワークなど)、周波数領域分析、スパース表現、セルオートマトン、ランダムウォーク、低ランク回復、ベイズ理論などが実行されうる。
いくつかの実施形態では、回転画像において複数の顕著な物体を得ることができる。画像内の顕著なオブジェクトの分布を示す顕著性マップは、複数の顕著なオブジェクトの位置およびサイズ情報に従って計算することができる。顕著な物体の分布は、画像内の顕著な物体の空間分布を指すことがある。画像合成回路204は、顕著性マップおよび合成規則に基づいて回転画像を合成することができる。例えば、合成規則が対称的合成規則である場合、回転された画像を切り取って、顕著なオブジェクトの分布を合成画像内で対称またはほぼ対称にすることができる。
いくつかの他の実施形態では、画像合成回路204は、ネットワークモデルまたは木構造を介して回転画像を構成するように構成することができる。いくつかの実施形態において、ネットワークモデルは、最小モデル誤差に収束するために損失関数を必要とする最適化プロセスを使用して複数のサンプルに基づいてトレーニングすることによって得ることができる。損失関数は、例えば、クロスエントロピー、二乗平均誤差などを含み得るが、これらに限定されない。ネットワークモデルを訓練するのに適した任意の方法を採用することができる。複数のサンプルは複数の画像サンプルを含むことができる。画像サンプルは、例えば、画像撮影装置201によって取得される、インターネットからダウンロードされる、画像ライブラリから取得される、および/または同様のものとすることができる。回転された画像は、ネットワークモデルまたはツリー構造に入力され、クロッピング座標および/または倍率を得るためにネットワークモデルまたはツリー構造に従って処理されることができる。すなわち、ネットワークモデルまたはツリー構造の入力は回転画像であり、ネットワークモデルまたはツリー構造の出力は回転画像のクロッピング座標および/または倍率である。回転された画像は、クロッピング座標に従って合成画像を得るためにクロッピングすることができ、補正画像は、スケーリングファクタに従って合成画像をスケーリングすることによって得ることができる。
図4は、例えば撮像装置200により実現可能な画像処理の一例を示すフローチャートである。図4に示すように、411において、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像4102を取り込むために、画像撮影装置201の撮像動作を取り込み選択回路202によってトリガすることができる。例えば、撮影画像4102は、(W_src、H_src)、例えば(4000,3000)の解像度を有するNV16フォーマットの画像であり得る。NV16フォーマットは、YUV 422とも呼ばれる。
413で、IMUによって取得されたジャイロデータ4100に従って、画像回転補正回路203によって回転補正を撮影画像4102に対して実行して、回転画像4104を生成することができる。図4において、画像4152は回転画像4104の一例である。回転画像4104のフォーマットおよび解像度は、撮影画像4102のフォーマットおよび解像度と同じである。撮影画像4102を取得するために撮像動作がトリガされたときに同期してジャイロデータ4100を取得することができる。回転補正処理は、図10の処理と同様である。その詳細な説明は省略する。
415で、回転画像4104が画像合成回路204によって合成される。いくつかの実施形態では、重心補間(UV補間とも呼ばれる)を実施して、NV16フォーマットの回転画像4104をYUV444フォーマットの回転画像4106に変換することができる。フォーマットYUV444は一般に画像データの4つのYサンプルごとに4つのU値および4つのV値を有し、フォーマットNV16は一般に4つのYサンプルごとに2つのU値および2つのV値を有する。したがって、4つのYサンプルごとに2つの値のUおよびVにUおよびVを補間することによって、4つのYサンプルごとに2つの値のUおよびVを4つのYサンプルごとに4つの値に変換することができる。いくつかの実施形態では、回転画像4104は補間される前に拡大縮小することができる。例えば、回転画像4104は、顕著性の処理効率を向上させるために、解像度を(W_src、H_src)から(W1、H1)へ、例えば(4000,3000)から(480,360)へ変換するようにスケーリングすることができる。回転画像の検出そのため、YUV444フォーマットの回転画像4106の解像度は、NV16フォーマットの回転画像4104の解像度よりも小さい。
いくつかの実施形態において、YUV色空間における回転画像4106は、CIE L * a * b色空間における回転画像4108にさらに変換され得る。例えば、回転画像4106の色空間は、任意の適切な変換式に従って、YUV色空間からRGB(赤-緑-青)色空間に変換することができる。いくつかの実施形態では、回転画像4106の全体の明るさを制御するために、RGB色空間において回転画像4106に対してガンマ補正を実行することができる。ガンマ補正のガンマ値は実際の要求に従って決定することができる。ガンマ補正後の回転画像4106の色空間は、任意の適切な変換式に従って、RGB色空間からCIE L * a * b色空間に変換することができる。変換式は、例えば、画像撮影装置201の撮像素子の仕様等に応じて決定することができる。いくつかの実施形態では、色温度調整は、ガンマ補正後の回転画像4106または回転画像4108に対しても実行することができる。
4151において、回転画像4108に対して顕著性検出が行われ、回転画像4108の顕著性マップ4110が得られる。顕著性マップ4110を取得するために、任意の適切な顕著性検出方法を使用することができる。例えば、回転画像4108の特徴を抽出することができる。特徴は、色、強度、および/または向きを含むことができるが、それらに限定されない。回転画像4108の各画素の色は、例えば、CIE L * a * b色空間において得ることができる。回転画像4108の各画素の強度は、例えば回転画像4108をグレースケールに変換することによって得ることができる。回転画像4108の各画素の向きは、例えば、4つの角度に関してガボールフィルタを使用して得ることができる。上述したこれらの処理された画像の全ては、特徴マップを生成するためにガウスピラミッドを作成するために使用することができる。特徴マップは3つの特徴のそれぞれに関して生成することができ、顕著性マップ4110は3つの特徴マップの平均である。図4において、画像4156は顕著性マップ4110の一例である。回転画像4108内の顕著なオブジェクト(例えば、画像4152内の家)の位置およびサイズ情報は、顕著性マップ4110に従って取得することができる。
4153で、回転画像4104を顕著性マップ4110に従って合成して、合成画像4112を得ることができる。例えば、回転画像4104内の顕著オブジェクト(例えば、画像4152内の家)の位置及びサイズ情報は、回転画像4108内の顕著オブジェクトの位置及びサイズ情報に従って得ることができる。中心構図規則を選択することができ、したがって回転された画像4180を切り取って、顕著なオブジェクト(例えば、画像4152内の家)を合成画像4112の中心に配置することができる。そのため、合成画像4112の解像度は、回転画像4104の解像度よりも小さい。図4において、画像の中央に家がある画像4154が合成画像4112の一例である。
人間の目の最大可視範囲は約170度であるが、人間の目の鮮明な撮像範囲は約60度に過ぎず、そのため、超広視野角を有する画像は人間の目の視覚的快適性要件を満たさない。人間の目は一般に画像の中心に焦点を合わせているので、画像の端のシーンは冗長である。したがって、合成画像を得るために回転画像を切り取ることは、人間の目の視覚的快適さの要求に対してより適している。
417では、画像選択回路205により合成画像4112に対して選択処理が行われ、詳細な説明は後述する。
419および421では、選択処理の判定結果に応じて合成画像4112を画像表示回路206に格納して表示させることができる。詳細は後述する。
いくつかの実施形態では、画像撮影装置201は、画像回転補正回路203を迂回して、撮影した画像を直接合成のために画像合成回路204に送ることができる。いくつかの他の実施形態では、画像回転補正回路203を全く省略することができる。これらの実施形態(画像回転補正回路203を迂回するかまたは全く省略するかのいずれか)では、画像合成回路204を画像撮影装置201に結合することができ、補正画像を得るために自動的に撮影画像を合成することができる。
いくつかの実施形態では、画像回転補正回路203は、画像合成回路204を迂回して回転画像を画像選択回路205に直接送ることができる。いくつかの他の実施形態では、画像合成回路204は全く省略することができる。これらの実施形態(画像合成回路204を迂回するかまたは全く省略するかのいずれか)では、回転画像を補正画像と見なすことができ、画像選択回路205を画像回転補正回路203に結合することができる。
いくつかの実施形態では、画像撮影装置201は、画像回転補正回路203および画像合成回路204を迂回して、撮影した画像を画像選択回路205に直接送ることができる。他の実施形態では、画像回転補正回路203と画像合成回路204の両方を全く省略することができる。これらの実施形態(画像回転補正回路203および画像合成回路204のいずれかがバイパスされるかまたは全く省略される)において、画像選択回路205は画像撮影装置201に結合することができる。
画像選択回路205は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像合成回路204または画像回転補正から補正画像を受け取るように構成することができる。そして、補正後の画像に対して選択処理を行う。例えば、画像選択回路205は、補正画像に対して選択処理を行って、補正画像を画像撮影装置201のメモリに格納するか、画像撮影装置201の画面に表示するか、あるいは、画像撮影装置201のディスプレイの外部に表示するかを決定することができる。
いくつかの実施形態では、画像選択回路205は審美的規則に従って補正画像のスコアを決定することができる。得点は審美的得点とも呼ぶことができる。いくつかの実施形態では、審美的規則は、信号対雑音比(SNR)、コントラスト、ヒストグラム分布、画像飽和度、情報エントロピー、AE値、AF値、AWB値、または人物、笑顔、日の出、ペットなどの候補画像の高得点オブジェクトのうちの少なくとも1つに従って決定できる。いくつかの他の実施形態では、審美的規則は訓練されたモデルに従って決定することができる。訓練されたモデルは、事前評価されたスコアのデータセットを使用して訓練することによって取得できる。例えば、事前評価スコアは、異なる人によって事前評価された画像の審美的な満足スコアであり得る。訓練されたモデルは、任意の適切な機械学習アルゴリズムを使用して訓練することによって得ることができる。
いくつかの実施形態では、スコアが事前設定された閾値より低い場合、画像選択回路205は補正画像を破棄または削除すると決定することができる。スコアが予め設定された閾値以上である場合、画像選択回路205は、補正された画像を現在のアルバムに格納すること、および/または補正された画像を画像表示回路206に送信することを決定することができる。例えば、現在のアルバムを画像撮影装置201のメモリに設定することができる。
いくつかの他の実施形態では、画像選択回路205はまた、補正画像と現在のアルバム内の画像との間の類似性を判定するために、補正画像から少なくとも1つの画像特徴を抽出することができる。少なくとも1つの画像特徴は、ヒストグラム、シフト特徴、画像モーメント、または画像の指紋のうちの少なくとも1つを含むことができる。画像の指紋は、知覚的特徴または画像の簡単な要約、例えば知覚過酷(pHash)などである。いくつかの実施形態では、画像選択回路205は、抽出された少なくとも1つの画像特徴に従って、修正画像に類似する現在のアルバム内の1つまたは複数の類似画像を決定することができる。補正画像のスコアが1つまたは複数の類似画像の最低スコアよりも低い場合、画像選択回路205は補正画像を破棄することを決定することができる。補正画像のスコアが1つまたは複数の類似画像の最低スコア以上である場合、画像選択回路205は、補正画像を現在のアルバムに格納すると決定することができる。いくつかの実施形態では、補正された画像のスコアよりも低いスコアを有する1つまたは複数の類似の画像を現在のアルバムから削除することができる。
いくつかの他の実施形態では、補正画像のスコアが1つまたは複数の類似画像の最高スコアより低い場合、画像選択回路205は補正画像を破棄することを決定することができる。補正画像のスコアが1つまたは複数の類似画像の最高スコア以上である場合、画像選択回路205は、補正画像を現在のアルバムに格納することを決定することができ、1つまたは複数の類似画像を現在のアルバムから削除することができる。
画像表示回路206は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、補正画像を出力するように構成することができる。いくつかの実施形態では、現在のアルバム内の画像は、それらの画像のスコアに従ってキュー内に配置することができる。画像表示回路206は、画像選択回路205から補正画像を受け取り、補正画像のスコアに応じて現在のアルバムのキューに挿入することができる。ここでは、補正後の画像を現在のアルバムの候補画像とも呼ぶことができる。
画像表示回路206は、現在のアルバムのキューを画像撮影装置201の画面に表示するように構成することができる。いくつかの実施形態では、現在のアルバムのキューを順番に表示することができ、その結果、ユーザは、より優れた美的満足感スコアを有する画像を最初に見ることができる。いくつかの他の実施形態では、現在のアルバムの待ち行列は、ユーザが画像をバッチとして見ることができるように、9つの正方グリッドに表示することができる。
図5A−図5Dは、例えば撮像装置200によって実現され得る処理の一例のフローチャートを示す。図5Aを参照すると、510において、自動モードがオンにされる。例えば、撮像装置200は、ユーザインタフェース(UI)から自動モードオンの指示を受けた場合に、自動モードをオンにすることができる。511で、初期化プロセスが開始される。撮像装置200は、オートモードをオンにした後に初期化を開始することができる。図5Cを参照すると、512において、撮像装置200に格納されているフィンガープリントデータベースが初期化される。513において、撮像装置200に格納されている審美性データベースが初期化される。514において、撮像装置200に格納されている画像名データベースを初期化する。画像指紋データベース、審美性データベース、および画像名データベースは、例えば、画像撮影装置201のメモリに格納することができる。図5Dを参照すると、515で、初期化プロセスが終了する。いくつかの実施形態では、516において、新しい画像アルバムを画像撮影装置201のメモリ内に作成することができる。新しいイメージアルバムを現在のアルバムとして使用できる。
図5Aに戻り、517において、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を取り込むために、画像撮影装置201の撮像動作が撮影選択回路202によって自動的にトリガされる。518では、画像回転補正回路203により、撮像画像に対して回転補正が自動的に行われる。519において、画像選択回路205による回転画像に対する選択処理が実行される。
図5Bを参照すると、520で、回転された画像が現在のアルバムの最初の画像であるかどうかが判定される。回転画像が第1の画像である場合(520:Yes)、521において、画像合成回路204によって回転画像に対して顕著性の検出を実行することができる。回転された画像が最初の画像ではない場合(520:No)、522において、現在のアルバム内に回転された画像に類似する1つまたは複数の類似の画像があるかどうかを判定することができる。522において、1つまたは複数の類似画像の数が所定の閾値以上であるかどうかを判定することができる。1つ以上の類似画像の数が所定の閾値以上である場合(522:Yes)、523において、回転画像の審美性スコアと1つ以上の類似画像の審美性スコアとが比較される。さらに、524で、取り込まれた画像(すなわち、最も新しい取り込まれた画像)を削除(または破棄)するかどうかが決定される。回転画像の審美性スコアが1つ以上の類似画像の最高審美性スコアまたは最低審美性よりも高い場合、画像選択回路205は、取り込まれた画像を削除しないと決定することができ(524:No)、その後521で例えば、画像合成回路204により回転画像に対して顕著性検出を行うことができる。回転画像の審美性スコアが1つ以上の類似画像の最高審美性スコアまたは最低審美性よりも小さい場合、画像選択回路205は、取り込まれた画像を削除すると決定することができる(524:Yes)。
1つ以上の類似画像の数が所定の閾値未満である場合(522:No)、次に525で、現在のアルバム内の画像の数が最大数以上であるかどうかが判定される。現在のアルバム内の画像の数が最大数以上である場合(525:No)、521で、画像合成回路204によって回転画像に対して顕著性検出を実行することができる。現在のアルバム内の画像の数が最大数を超える場合(525:Yes)、次に526で、回転された画像の審美性スコアと現在のアルバム内のすべての画像の審美性スコアとが比較され、比較が行われる。524で結果を使用して、取り込まれた画像を削除するかどうかを決定することができる。例えば、回転画像の審美性スコアが現在のアルバム内の画像の最低審美性よりも小さい場合、画像選択回路205は、取り込まれた画像を削除すると決定することができる(524:Yes)。回転画像の審美性スコアが現在のアルバム内の画像の最低審美性以上である場合、画像選択回路205は、取り込まれた画像を削除しないと決定することができ(524:No)、次に521で、顕著性検出は可能である。画像合成回路204によって回転された画像に対して実行される。
527で、回転画像を合成することができるかどうかが判定される。いくつかの実施形態では、回転画像を合成することができるかどうかは、顕著性マップに従って決定することができる。例えば、顕著性マップの分布が散在しすぎる場合、画像合成回路204は、回転画像を合成することができないと決定することができる。別の例として、回転画像内に顕著オブジェクトが検出されない場合、画像合成回路204は回転画像を合成することができないと決定することができる。回転画像が合成可能であると判断された場合(527:Yes)、528(図5Cに示す)において、回転画像は補正画像を得るために画像合成回路204によって合成される。
図5Cを参照すると、529で、補正された画像の指紋がフィンガープリントデータベースに入れられる。補正画像の指紋を補正画像から抽出することができ、補正画像の指紋をフィンガープリントデータベースの待ち行列に追加することができる。530において、補正された画像の審美性スコアが審美性データベースに入れられる。補正画像の審美性スコアは、審美性データベースの待ち行列に追加することができる。例えば、審美性データベースの待ち行列は、審美性スコアの順序に従って配置することができる。531において、補正された画像の画像名が画像名データベースのキューに入れられる。補正画像の画像名は、数字、文字、単語などを含むことができるが、これらに限定されない。いくつかの実施形態では、フィンガープリントデータベースのキューおよび画像名データベースのキューは、審美的なキューと同じ順序で配置することができ、これはデータ検索に便利である。
取り込まれた画像が最初の画像である場合(520:Yes)、または1つまたは複数の類似画像の数が所定の閾値未満であり(522:No)、現在のアルバム内の画像の数が最大数を超えない。番号(525:No)の場合、次に532(図5Dに示す)で補正画像を出力し、補正画像を一時記憶するためのメモリ内のバッファを切り取ることができる。いくつかの実施形態では、図5Dを参照すると、533において、出力された補正画像は、画像撮影装置201のメモリ、例えば、セキュアデジタル(SD)カードに格納される。いくつかの実施形態では、533において、補正された画像も格納の前後に符号化される。
撮影画像が最初の画像ではない場合(520:No)、1以上の類似画像の数が所定の閾値以上である場合(522:Yes)または1以上の類似画像の数が所定の閾値(522:No)であるが現在のアルバム内の画像の数が最大数以上である場合(525:Yes)、次に534で(図5Dに示すように)補正された画像が画像撮影装置201のメモリに記憶される。いくつかの実施形態では、534において、補正画像が出力され、補正画像のスコアよりも低いスコアを有する1つまたは複数の類似画像の名前が出力され、補正画像を一時記憶するためのメモリ内のバッファが切り取られうる。図5Dを参照すると、いくつかの実施形態では、535で、出力された補正画像が画像撮影装置201のメモリ、例えばセキュアデジタル(SD)カードに格納される。いくつかの実施形態では、535において、補正画像は格納の前後に符号化される。いくつかの実施形態では、535において、補正画像のスコアより低いスコアを有する1つまたは複数の類似の画像が、画像撮影装置201のメモリから削除される。
撮影画像が削除可能であると判断された場合(524:Yes)または作成できないと判断された場合(527:No)、撮影画像を削除する(536)。図5Dを参照すると、537でプロセスは終了する。
図5Aを参照すると、538で、自動モードがオフにされる。例えば、撮像装置200は、UIから自動モード解除の指示を受けた場合に、自動モードを解除することができる。脱初期化プロセスが開始される(539)。例えば、フィンガープリントデータベース、審美性データベース、および画像名データベースに対して脱初期化プロセスを実行することができる。初期化解除プロセスは、初期化プロセスの逆のプロセスである。図5Dを参照すると、540で、脱初期化プロセスが終了する。
本開示によれば、ユーザは、撮像装置200を着用したり、撮像装置200を固定した場所に配置したりすることができ、ユーザの参加を必要とせずに撮像装置200の作業時間中に自動的に画像を撮影できる。取り込まれた画像は、画像の任意の角度でゼロチルトを確実にするために自動的に回転させることができ、回転された画像は、シーンの内容に従って自動的に合成され、より良いFOVおよび妥当なレイアウトを有する画像を得ることができる。さらに、歪み補正を自動的に行うことで歪みの影響を弱めることができる。また、心地よい美観を有する画像を得ることができる。さらに、画像を自動的に選択することによって、多くの重複または類似の画像および無意味なショットを削除することができ、その結果、ユーザは、より良い品質を有する特定の数の画像だけを得て、見やすい方法で画像を見ることができる。
図6は、本開示と一致する他の例示的な撮像装置300の概略図である。図6に示すように、撮像装置300は、画像撮影装置301と、画像撮影装置301に接続された撮影選択回路302と、画像撮影装置301と撮影選択回路302とに接続された画像選択回路303と、画像回転補正回路304とを備える。304は画像撮影装置301に接続され、画像合成回路305は画像回転補正回路304および画像撮影装置301に接続され、画像表示回路306は画像合成回路305および画像撮影装置301に接続されている。画像撮影装置301は、画像撮影装置201と同様であり、詳細な説明は省略する。
画像選択回路303は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、ライブビュー画像内のライブビュー画像に対して選択処理を実行するように構成することができる。画像撮影装置301はリアルタイムで動作する。例えば、画像選択回路303は、ライブビュー中のライブビュー画像に対して選択処理を行い、ライブビュー画像を撮像するか否かを判定することができる。ライブビュー画像とは、画像撮影装置301のライブビューにおける現在のシーンの画像をいう。ここで、ライブビュー画像と現在のシーンは互換的に使用することができる。
いくつかの実施形態では、画像選択回路303は、審美的規則に基づいてライブビュー内のライブビュー画像をリアルタイムでスコア付けして、ライブビュー画像のスコアを決定することができる。審美的規則を決定する方法は、画像選択回路205が使用する方法と同様であり、その詳細な説明はここでは省略する。いくつかの実施形態では、スコアが事前設定された閾値より低い場合、画像選択回路303は、画像撮影装置301のライブビュー内のライブビュー画像を撮影しないと決定することができる。スコアが予め設定された閾値以上である場合、画像選択回路303は、画像撮影装置301のライブビュー内のライブビュー画像を撮影すると決定することができる。
いくつかの他の実施形態では、画像選択回路303はまた、ライブビュー画像と画像撮影装置301の現在のアルバム内の画像との間の類似性を判定するために、ライブビュー画像から少なくとも1つの画像特徴を抽出することができる。少なくとも1つの画像特徴は、ヒストグラム、シフト特徴、画像モーメント、または画像の指紋のうちの少なくとも1つを含むことができる。ライブビュー画像のスコアが、ライブビュー画像に類似する1つまたは複数の類似画像の最低スコアより低い場合、画像選択回路303は、ライブビュー画像を撮影しないと決定することができる。ライブビュー画像のスコアが1つまたは複数の類似画像の最低スコア以上である場合、画像選択回路303はライブビュー画像を撮影すると決定することができる。いくつかの実施形態では、ライブビュー画像のスコアよりも低いスコアを有する1つまたは複数の類似の画像を現在のアルバムから削除することができる。
いくつかの他の実施形態では、ライブビュー画像のスコアが1つまたは複数の類似の画像の最高スコアよりも低い場合、画像選択回路303はライブビュー画像を撮影しないと決定することができる。ライブビュー画像のスコアが1つまたは複数の類似画像の最高スコア以上である場合、画像選択回路303は、ライブビュー内のライブビュー画像を取り込むと決定することができ、1つまたは複数の類似画像は、現在のアルバムから削除される。
いくつかの実施形態では、画像選択回路303は、ライブビュー画像のスコアが閾値以上であるかどうかを示す判定結果を撮影選択回路302に送信することができ、撮影選択回路302は自動的にカメラの撮像動作をトリガすることができる。画像選択回路303の判定結果に応じて、画像撮影装置301を制御する。いくつかの実施形態では、画像選択回路303は撮影選択回路302を迂回することができる。いくつかの他の実施形態では、撮影選択回路302は全く省略することができる。これらの実施形態(撮影選択回路302がバイパスされるか省略されるかのいずれか)では、画像選択回路303は、画像撮影装置301に結合され、画像選択回路303の判断結果に従って画像撮影装置301の撮像動作を直接トリガすることができる。
撮影選択回路302は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含み、画像撮影装置301の撮像動作を自動的にトリガしてライブビューのライブ画像を撮影するように構成することができる。いくつかの実施形態では、撮影選択回路302は、ライブビュー画像のスコアと1つまたは複数の他の基準との組み合わせに従って撮像動作をトリガすることができる。いくつかの実施形態では、撮影選択回路302は、特定の意味を有するオブジェクトが現在のシーンで検出され、ライブビュー画像のスコアが閾値以上であるときに撮像動作をトリガすることができる。特定の意味は、例えば、人々、動物、顔、または笑顔を含み得るが、これらに限定されない。いくつかの実施形態では、撮影選択回路302は、現在のシーンの奥行きの変化が検出され、ライブビュー画像のスコアが閾値以上であるときに撮像動作をトリガすることができる。いくつかの実施形態では、撮影選択回路302は、現在のシーンの焦点の変化が検出され、ライブビュー画像のスコアが閾値以上であるときに撮像動作をトリガすることができる。いくつかの実施形態では、撮影選択回路302は、音声コマンドが受信され、ライブビュー画像のスコアが閾値以上であるときに撮像動作をトリガすることができる。いくつかの実施形態では、撮影選択回路302は、制御プロセスとライブビュー画像のスコアとの組み合わせに基づいて撮像動作をトリガすることができる。制御処理としては、タイマー撮影、タイムラプス撮影等が挙げられる。例えば、撮影選択回路302は、プリセット時間におけるライブビュー画像のスコアが閾値以上である場合、タイマー撮影を使用してプリセット時間に撮像動作をトリガすることができる。別の例として、撮影選択回路202は、設定された期間におけるライブビュー画像のスコアが閾値以上である場合、タイムラプス撮影を使用して設定された期間で撮像動作をトリガすることができる。
画像回転補正回路304は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像撮影装置301から撮影画像を受信して自動的に実行するように構成することができる。撮影画像の回転補正画像回転補正回路304は、画像回転補正回路203と同様であるため、詳細な説明は省略する。
画像合成回路305は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像回転補正回路203から回転された画像を受け取り、自動的に回転画像を合成し、補正画像を生成することができる。回転画像の合成方法は、画像合成回路204の方法と同様であるため、詳細な説明は省略する。
いくつかの実施形態では、画像合成回路305は、回転画像を構成する前に回転画像に対して選択プロセスを実行するように構成することもできる。いくつかの実施形態では、画像合成回路305は、顕著性検出に基づいて選択プロセスを実行することができる。例えば、回転画像において顕著な物体が検出されない場合、画像合成回路305は回転画像を破棄することができる。回転画像において少なくとも1つの顕著なオブジェクトが検出された場合、画像合成回路305は、回転画像における少なくとも1つの顕著なオブジェクトの位置およびサイズ情報に基づいて回転画像を構成することができる。別の例として、回転画像内で複数の顕著な物体が検出されたが画像内の顕著な物体の分布が好ましいものではない場合、画像合成回路305は回転画像を破棄することができる。回転画像は、回転画像内の複数の顕著な対象の分布に基づいている。例えば、画像内の顕著なオブジェクトの分布が好ましいかどうかは、分布が集中または分散する傾向に従って決定することができ、これは本明細書では限定されない。
いくつかの実施形態では、画像撮影装置301は、画像回転補正回路304および画像合成回路305を迂回することができる。他の実施形態では、画像回転補正回路304および画像合成回路305を全く省略することができる。これらの実施形態(画像回転補正回路304および画像合成回路305を迂回するか省略することができる)において、画像表示回路306は画像撮影装置301に結合することができ、撮影した画像を画像撮影装置301の現在のアルバムに直接記憶するように構成できる。
いくつかの実施形態では、画像撮影装置301は、画像回転補正回路304を迂回して、撮影した画像を画像合成回路305に直接送ることができる。いくつかの他の実施形態では、画像回転補正回路304を省略することができる。これらの実施形態(画像回転補正回路304をバイパスするか省略するかのいずれか)では、画像合成回路305を画像撮影装置301に結合することができ、補正画像を得るために取込画像を自動的に構成することができる。
いくつかの実施形態において、画像回転補正回路304は、画像合成回路305を迂回し、回転された画像を画像表示回路306に直接送ることができる。いくつかの他の実施形態では、画像合成回路305を全く省略することができる。これらの実施形態(画像合成回路305をバイパスするか省略するかのいずれか)では、回転画像を補正画像と見なすことができ、画像表示回路306は回転画像を直接、画像撮影装置301の現在のアルバムに格納することができる。
いくつかの実施形態では、撮像装置300は、画像回転補正回路304および/または画像撮影装置301に結合された画像歪み補正回路(図6には図示せず)をさらに含み得る。画像歪み補正回路は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、撮影画像を回転させる前または後に歪み補正を実行するように構成することができる。歪みの補正方法は、歪みの種類に応じて選択することができ、任意の適切な方法が採用され得る。
撮像装置300は、画像歪み補正回路および画像回転補正回路304の代わりに画像補正回路を備えてもよい。画像補正回路は、撮像画像に対して歪み補正と回転補正の両方を行うように構成することができる。
画像表示回路306は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、補正画像を出力するように構成することができる。例えば、画像表示回路306は、画像選択回路305から補正画像を受け取り、補正画像のスコアに応じて補正画像を現在のアルバムのキューに挿入し、現在のアルバムのキューを9つの正方グリッド中に表示することができる。画像表示回路306は、画像表示回路206と同様であるため、詳細な説明は省略する。
本開示と一致して、ユーザの参加を必要とせずに、撮像装置200の作業時間中に心地よい美観を有する画像を自動的に撮影するようにトリガすることができる。撮影された画像は、より良いFOVと妥当なレイアウトを有する画像が得られるように自動的に回転され合成されることができる。さらに、画像を自動的に選択することによって、多くの重複または類似の画像および無意味なショットを削除することができ、その結果、ユーザは、より良い品質を有する特定の数の画像のみを得て、見やすい方法で画像を見ることができる。
図7は、本開示と一貫した他の例示的な撮像装置400の概略図である。図7に示すように、撮像装置400は、画像撮影装置401と、画像撮影装置401に接続された撮影選択回路402と、画像撮影装置401に接続された画像回転補正回路403と、画像回転補正回路403に接続された画像選択回路404と、画像選択回路404および画像撮影装置401に接続された画像合成回路405、ならびに画像合成回路405および画像撮影装置401に接続された画像表示回路406とを含む。
画像撮影装置401は、画像撮影装置201と同様であり、詳細な説明は省略する。撮影選択回路402は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像撮影装置401の撮像動作を自動的にトリガして、ソフトウェアとハードウェアの組み合わせを使用して現在のシーンの画像を撮影するように構成することができる。撮影選択回路402は、撮影選択回路202と同様であり、詳細な説明は省略する。画像回転補正回路403は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像撮影装置401から撮影画像を受信して自動的に実行するように構成することができる。撮影画像の回転補正画像回転補正回路403は、画像回転補正回路203と同様であるため、詳細な説明は省略する。
画像選択回路404は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、画像回転補正回路203から回転画像を受け取り、回転画像に選択処理を実行するように構成することができる。いくつかの実施形態では、画像選択回路404は審美的規則に従って回転画像のスコアを決定することができる。審美的規則を決定する方法は、画像選択回路205が使用する方法と同様であり、その詳細な説明はここでは省略する。いくつかの実施形態では、スコアが予め設定された閾値より低い場合、画像選択回路404は回転された画像を破棄することを決定することができる。スコアが予め設定された閾値以上である場合、画像選択回路404は、合成のために回転画像を画像合成回路405に送ることを決定することができる。
いくつかの他の実施形態では、画像選択回路404はまた、回転画像と画像撮影装置401の現在のアルバム内の画像との間の類似性を判断するために、回転画像から少なくとも1つの画像特徴を抽出することができる。少なくとも1つの画像特徴は、ヒストグラム、シフト特徴、画像モーメント、または画像の指紋のうちの少なくとも1つを含むことができる。回転画像のスコアが、回転画像に類似する1つまたは複数の類似画像の最低スコアよりも低い場合、画像選択回路404は、回転画像を破棄することを決定することができる。回転画像のスコアが1つまたは複数の類似画像の最低スコア以上である場合、画像選択回路404は、合成のために回転画像を画像合成回路405に送ることを決定することができる。いくつかの実施形態では、回転された画像のスコアより低いスコアを有する1つまたは複数の類似の画像を現在のアルバムから削除することができる。
いくつかの他の実施形態では、回転画像のスコアが1つまたは複数の類似画像の最高スコアより低い場合、画像選択回路404は回転画像を破棄することを決定することができる。ライブビュー画像のスコアが1つまたは複数の類似画像の最高スコア以上である場合、画像選択回路404は、回転画像を合成のために画像合成回路405に送ることを決定することができ、1つまたは複数の類似画像が現在のアルバムから削除されうる。
画像合成回路405は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、回転画像を自動的に構成して正しい画像を生成するように構成することができる。回転画像の合成方法は、画像合成回路204の方法と同様であるため、詳細な説明は省略する。
いくつかの実施形態では、回転画像は現在のアルバム内に類似画像を有さず、回転画像を合成した後の補正画像は現在アルバム内に1つまたは複数の類似画像を有することができることを考慮し、合成回路405によって類似性判定が実施される。例えば、画像合成回路405は、補正画像と画像撮影装置401の現在のアルバム内の画像との間の類似性を判定するために、補正画像から少なくとも1つの画像特徴を抽出するように構成することができる。類似判定による選択処理は、画像選択回路205による選択処理と同様であるため、詳細な説明は省略する。
いくつかの実施形態では、画像撮影装置401は、画像回転補正回路403を迂回して、撮影した画像を画像選択回路404に直接送ることができる。いくつかの他の実施形態では、画像回転補正回路403を全く省略することができる。これらの実施形態では(画像回転補正回路403をバイパスするかまたは全く省くかのいずれかである)、画像選択回路404を画像撮影装置401に結合することができる。
いくつかの実施形態では、画像選択回路404は、画像合成回路405を迂回して回転画像を画像表示回路406に送ることができる。いくつかの他の実施形態では、画像合成回路405はまったく省略することができる。これらの実施形態(画像合成回路405がバイパスされるかまたは全く省略される)において、画像選択回路404は画像表示回路406に結合され得る。
いくつかの実施形態では、撮像装置400は、画像回転補正回路403および/または画像撮影装置401に結合された画像歪み補正回路(図7には図示せず)をさらに含み得る。画像歪み補正回路は、例えば、マイクロプロセッサ、マイクロプロセッサの一部、ASIC、またはASICの一部を含むことができ、撮影画像を回転させる前または後に歪み補正を実行するように構成することができる。歪みの補正方法は、歪みの種類に応じて選択することができ、任意の適切な方法が採用され得る。
撮像装置400は、画像歪み補正回路および画像回転補正回路403の代わりに画像補正回路を備えてもよい。画像補正回路は、撮像画像に対して歪み補正と回転補正の両方を行うように構成することができる。
画像表示回路406は、補正画像を出力するように構成することができる。例えば、画像表示回路406は、画像合成回路405または画像選択回路404から補正画像を受け取り、補正画像のスコアに応じて現在のアルバムのキューに補正画像を挿入し、9つの正方グリッド内に現在のアルバムのキューを表示することができる。画像表示回路406は、画像表示回路206と同様であるため、詳細な説明は省略する。
そのため、図2〜図4に示すように、撮影装置は、カメラのアルバムが存在しないことが保証されていれば、画像保存前、ライブビュー画像の撮影前、または回転画像の合成前に、画像選択回路による選択処理を実行できる。画像を複製し、アルバムに格納された画像は、ユーザの興味を満たすために高い審美的価値を有することができる。
図8は、本開示と一致する他の例示的な画像撮影装置500の概略図である。図8に示すように、撮像装置500は、画像撮影装置501と、画像撮影装置501に接続されたプロセッサ502と、プロセッサ502に接続されたメモリ503とを備える。画像撮影装置501は、画像撮影装置201と同様であり、詳細な説明は省略する。プロセッサ502およびメモリ503は一緒に、本開示と整合性のある画像処理装置を形成することができる。
プロセッサ502は、画像プロセッサ、画像処理エンジン、画像処理チップ、グラフィックプロセッサ(GPU)、マイクロプロセッサ、マイクロコントローラ、中央処理装置(CPU)、ネットワークプロセッサ(NP)、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または他のプログラマブルロジックデバイス、ディスクリートゲートまたはトランジスタロジックデバイス、ディスクリートハードウェア成分などの任意の適切なハードウェアプロセッサであり得る。メモリ503は、ランダムアクセスメモリ(RAM)、読み取り専用メモリ、フラッシュメモリ、揮発性メモリ、ハードディスク記憶装置、または光媒体などの非一時的コンピュータ可読記憶媒体を含むことができる。メモリ503は、コンピュータプログラム命令、画像撮影装置501によって撮影された画像、プロセッサ502によって処理された画像などを記憶することができる。
いくつかの実施形態では、プロセッサ502は、メモリ503に格納されたコンピュータプログラム命令を実行して、撮影選択回路202、画像回転補正回路203、画像合成回路204、画像選択回路205の機能を実現するように構成できる。また、撮影選択回路302、画像選択回路303、画像回転補正回路304、画像合成回路305、および/または撮像装置200の画像表示回路206の機能を実現する。撮像装置300の画像表示回路306、または撮影選択回路402、画像回転補正回路403、画像選択回路404、画像合成回路405、および/または撮像装置400の画像表示回路406の機能を実現する。
いくつかの実施形態では、プロセッサ502は、メモリ503に格納されたコンピュータプログラム命令を実行して、後述の例示的な写真撮影方法のうちの1つなどの本開示と一致する写真撮影方法を実行するように構成できる。
例えば、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して画像を撮影するために画像撮影装置501の撮像動作をトリガし、撮影された画像を修正して修正画像を生成し、修正された画像を出力するためのコンピュータプログラム命令を実行するように構成され得る。
別の例として、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を撮影するために画像撮影装置501の撮像動作をトリガし、撮影された画像に対して回転補正を実行し、回転画像を合成して補正画像を生成し、補正画像に対して選択処理を行い、補正画像を出力するためのコンピュータプログラム命令を実行するように構成され得る。
別の例として、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を撮影し、撮影されたオブジェクトに対して選択プロセスを実行し、撮影した画像を出力するためにコンピュータプログラム命令を実行して画像撮影装置501の撮像動作をトリガするように構成され得る。
別の例として、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を撮影し、回転画像に対して選択処理を行い、回転画像を出力するために画像撮影装置501の撮像動作をトリガし、撮影された画像に対して回転補正を実行するためのコンピュータプログラム命令を実行するように構成され得る。
別の例として、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を撮影し、補正画像に対して選択処理を行い、補正画像を出力するために画像撮影装置501の撮像動作をトリガし、撮影された画像を合成して画像を生成するようにコンピュータプログラム命令を実行するように構成され得る。
別の例として、プロセッサ502は、リアルタイムで画像撮影装置501のライブビュー内のライブビュー画像に対して選択処理を実行し、画像の撮像動作をトリガしてライブビュー画像のスコアに従ってライブビュー内のライブビュー画像を撮像し、撮像画像に対して回転補正を行い、回転画像を合成して補正画像を生成し、補正画像を出力するようにコンピュータプログラム命令を実行するように構成することができる。
別の例として、プロセッサ502は、コンピュータプログラム命令を実行して、リアルタイムで画像撮影装置501のライブビュー内のライブビュー画像に対して選択処理を実行し、画像の撮像動作をトリガして、ライブビュー画像のスコアに従ってライブビュー内のライブビュー画像を撮影し、撮影された画像を合成して補正画像を生成し、補正画像を出力するように構成することができる。
別の例として、プロセッサ502は、リアルタイムで画像撮影装置501のライブビュー内のライブビュー画像に対して選択処理を実行し、画像の撮像動作をトリガしてライブビュー画像のスコアに従ってライブビュー画像内のライブビュー画像を撮影し、撮影された画像に対して回転補正を実行し、回転された画像を出力するようにコンピュータプログラム命令を実行するように構成することができる。
例えば、プロセッサ502は、リアルタイムで画像撮影装置501のライブビュー内のライブビュー画像に対して選択プロセスを実行し、撮像の撮像動作をトリガしてライブビュー画像のスコアに従ってライブビュー画像内のライブビュー画像を撮影し、撮影した画像を出力するようにコンピュータプログラム命令を実行するように構成することができる。
別の例として、プロセッサ502は、ソフトウェアおよびハードウェアの組み合わせを使用して現在のシーンの画像を撮影するために画像撮影装置501の撮像動作をトリガし、撮影された画像に対して回転補正を実行するためのコンピュータプログラム命令を実行するように構成され得る。そして、回転画像に対して選択処理を行い、回転画像を合成して補正画像を生成し、出力する。
いくつかの実施形態において、プロセッサ502およびメモリ503は、画像撮影装置501に統合することができる。すなわち、プロセッサ502を画像撮影装置501の画像処理チップとし、メモリ503を画像撮影装置501のメモリとすることができる。
本開示と一致する例示的な撮影方法を、以下でさらに詳細に説明する。本開示に係る撮影方法は、上述した撮像装置200、撮像装置300、撮像装置400、または撮像装置500などの本開示に係る撮影装置において実施することができる。
図9は、本開示と整合性のある例示的な撮影方法600のフローチャートである。撮影方法600は、上述した撮像装置200または撮像装置500において実施することができる。
図9を参照すると、601で、ソフトウェアとハードウェアの組み合わせを使用してカメラの撮像動作が自動的にトリガされて画像を取り込む。いくつかの実施形態では、カメラの撮像動作は、特定の意味を有するオブジェクトが現在のシーンで検出されたときにトリガすることができる。特定の意味は、例えば、人々、動物、顔、または笑顔を含み得るが、これらに限定されない。いくつかの実施形態では、現在のシーンの奥行きの変化に応答してカメラの撮像動作をトリガすることができる。いくつかの実施形態では、カメラの撮像動作は、現在のシーンの焦点の変化に応答してトリガされ得る。いくつかの実施形態では、カメラの撮像動作は音声コマンドを介してトリガすることができる。いくつかの実施形態では、カメラの撮像動作は制御プロセスを介してトリガすることができる。制御処理としては、タイマー撮影、タイムラプス撮影等が挙げられる。いくつかの実施形態では、カメラの撮像動作は、上述した異なる基準の任意の組み合わせに従って起動することができる。
601の処理は、上述した撮像装置200の撮影選択回路202または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
602において、取り込まれた画像は自動的に回転される。いくつかの実施形態では、カメラの姿勢情報は、例えば、IMUなどの、カメラに取り付けられたまたはカメラに結合された1つまたは複数の姿勢センサを介して取得することができる。姿勢情報は、カメラのヨー軸情報、ピッチ軸情報、またはロール軸情報のうちの少なくとも1つを含み得る。カメラの姿勢情報に応じて、撮影画像を回転させることができる。例えば、カメラの姿勢情報と目標姿勢との差に応じて撮影画像を回転させることができる。いくつかの他の実施形態では、取り込まれた画像内の水平線または垂直線を検出して、ロール方向の傾斜角を得ることができる。傾斜角が閾値より小さいとき、撮影画像は傾斜角に従ってロール方向に回転することができる。
いくつかの実施形態では、歪み補正は、取り込まれた画像を回転させる前または後に実行することができる。
602の処理は、上述した撮像装置200の画像回転補正回路203または撮像装置500のプロセッサ502において実現可能であるため、ここでの詳細な説明は省略する。
603で、回転画像は自動的に合成されて補正画像が生成される。いくつかの実施形態では、回転された画像は、顕著性検出および合成規則に基づいて合成することができる。1つまたは複数の顕著な物体は、取り込まれた画像内で検出することができる。回転された画像における1つ以上の顕著な物体の位置およびサイズ情報、または1つ以上の顕著な物体の分布が得られ得る。回転された画像は、回転された画像内の1つまたは複数の顕著なオブジェクトの位置およびサイズ情報または分布規則および合成規則に従って、切り取られて合成画像を得ることができる。合成規則は、中央合成規則、トライアド合成規則、水平線合成規則、対称合成規則、対角線合成規則などを含むことができるが、これらに限定されない。合成画像は、例えば、カメラの画面またはカメラの外部のディスプレイのアスペクト比に従って、補正された画像を得るために拡大縮小またはさらにトリミングすることができる。
いくつかの他の実施形態では、回転画像はネットワークモデルまたはツリー構造を介して合成することができる。ネットワークモデルは、複数のサンプルに基づくトレーニングによって得ることができる。回転画像は、ネットワークモデルまたは木構造に入力することができる。回転された画像は、クロッピング座標および倍率を得るために、ネットワークモデルまたは木構造に従って処理することができる。回転された画像は、クロッピング座標に従って合成画像を得るためにクロッピングすることができ、スケーリング係数に従って補正画像を得るために合成画像をスケーリングすることができる。
603の処理は、上述した撮像装置200の画像合成回路204または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
604において、選択プロセスは補正画像に対して実行され得る。選択プロセスは、補正された画像を記憶するか表示するかを決定するように構成することができる。いくつかの実施形態では、補正画像のスコアは審美的規則に従って決定することができる。スコアが予め設定された閾値より低い場合、補正された画像は破棄されることができ、そしてスコアが予め設定された閾値以上である場合、補正された画像は記憶されることができる。いくつかの実施形態では、審美的規則は、信号対雑音比(SNR)、コントラスト、ヒストグラム分布、画像飽和度、情報エントロピー、AE値、AF値、AWB値、または人物、笑顔、日の出、ペットなどの候補画像の高得点オブジェクトのうちの少なくとも1つに従って決定できる。いくつかの他の実施形態では、審美的規則は訓練されたモデルに従って決定することができる。訓練されたモデルは、事前評価されたスコアのデータセットを使用して訓練することによって取得できる。
いくつかの実施形態では、少なくとも1つの画像特徴に従って、補正された画像に類似する1つまたは複数の類似の画像を現在のアルバム内で決定することができる。いくつかの実施形態では、補正画像のスコアが1つまたは複数の類似画像の最低スコアよりも低い場合、補正画像を破棄することができる。補正画像のスコアが1つ以上の類似画像の最低スコア以上である場合、補正画像を記憶することができる。いくつかの実施形態では、補正された画像のスコアよりも低いスコアを有する1つまたは複数の類似の画像を現在のアルバムから削除することができる。いくつかの他の実施形態では、補正画像のスコアが1つまたは複数の類似画像の最高スコアよりも低い場合、補正画像を破棄することができる。補正画像のスコアが1つ以上の類似画像の最高スコア以上である場合、補正画像を記憶することができる。いくつかの実施形態では、1つまたは複数の類似の画像を現在のアルバムから削除することができる。
604の処理は、上述した撮像装置200の画像選択回路205または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
605において、補正画像が出力される。いくつかの実施形態では、補正画像のスコアに従って、補正画像を現在のアルバムのキューに挿入することができる。現在のアルバムのキューは、順番に表示することも、9つの正方グリッドに表示することもできる。
605の処理は、上述した撮像装置200の画像表示回路206または撮像装置500のプロセッサ502において実現可能であるため、ここでの詳細な説明は省略する。
いくつかの実施形態では、602および/または603のプロセスは省略することができる。例えば、602の処理を省略した場合は、撮像画像を直接合成することができる。他の例として、603の処理を省略した場合は、回転画像に対して直接選択処理を行うことができる。他の例として、602、603の処理を省略した場合は、撮像画像に対して直接選択処理を行うことができる。
図10は、本開示と一貫した他の例示的な撮影方法700のフローチャートである。撮影方法700は、上述した撮像装置300または撮像装置500において実施することができる。
図10を参照すると、701で、審美的規則に基づいてライブビュー内のライブビュー画像に対して選択プロセスがリアルタイムで実行され、ライブビュー画像のスコアが決定される。審美的規則は、信号対雑音比(SNR)、コントラスト、ヒストグラム分布、画像飽和度、情報エントロピー、自動露出値、オートフォーカス値、オートホワイトバランス値、オートホワイトバランス値またはライブビュー画像の高得点オブジェクトの少なくとも1つに従って決定することができる。
702で、ライブビュー画像のスコアが閾値以上である場合、撮像動作が自動的にトリガされる。例えば、スコアが予め設定された閾値より低い場合、ライブビュー画像を撮影するための撮像動作はトリガされない。スコアが予め設定された閾値以上である場合、ライブビュー画像を撮影するために撮像動作が自動的にトリガされ得る。いくつかの実施形態では、ライブビュー画像とカメラの現在のアルバム内の画像との間の類似性を判定するために、少なくとも1つの画像特徴をライブビュー画像からさらに抽出することができる。ライブビュー画像のスコアが、現在のアルバム内のライブビュー画像に類似する1つまたは複数の類似の画像の最低スコアまたは最高スコア以上である場合、撮像動作は自動的にトリガされ得る。
701および702の処理は、上述した撮像装置300の画像選択回路303または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
703で、取り込まれた画像は自動的に回転される。いくつかの実施形態では、カメラの姿勢情報は、例えば、IMUなどの、カメラに取り付けられたまたはカメラに結合された1つまたは複数の姿勢センサを介して取得することができる。姿勢情報は、カメラのヨー軸情報、ピッチ軸情報、またはロール軸情報のうちの少なくとも1つを含み得る。カメラの姿勢情報に応じて、撮影画像を回転させることができる。例えば、カメラの姿勢情報と目標姿勢との差に応じて撮影画像を回転させることで、回転画像の姿勢を目標姿勢に合わせることができる。いくつかの他の実施形態では、取り込まれた画像内の水平線または垂直線を検出して、ロール方向の傾斜角を得ることができる。傾斜角が閾値より小さいとき、撮影画像は傾斜角に従ってロール方向に回転することができる。
いくつかの実施形態では、歪み補正は、取り込まれた画像を回転させる前または後に実行することができる。
703の処理は、上述した撮像装置300の画像回転補正回路304または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
704で、回転画像は自動的に合成されて補正画像が生成される。いくつかの実施形態では、回転された画像は、顕著性検出および合成規則に基づいて合成することができる。1つまたは複数の顕著な物体は、取り込まれた画像内で検出することができる。回転された画像における1つ以上の顕著な物体の位置およびサイズ情報、または1つ以上の顕著な物体の分布が得られ得る。回転された画像は、回転された画像内の1つまたは複数の顕著なオブジェクトの位置およびサイズ情報または分布規則および合成規則に従って、切り取られて合成画像を得ることができる。合成規則は、中央合成規則、トライアド合成規則、水平線合成規則、対称合成規則、対角線合成規則などを含むことができるが、これらに限定されない。合成画像は、例えば、カメラの画面またはカメラの外部のディスプレイのアスペクト比に従って、補正された画像を得るために拡大縮小またはさらにトリミングすることができる。
いくつかの他の実施形態では、回転画像はネットワークモデルまたはツリー構造を介して合成することができる。ネットワークモデルは、複数のサンプルに基づくトレーニングによって得ることができる。回転画像は、ネットワークモデルまたは木構造に入力することができる。回転された画像は、クロッピング座標および倍率を得るために、ネットワークモデルまたは木構造に従って処理することができる。回転された画像は、クロッピング座標に従って合成画像を得るためにクロッピングすることができ、スケーリング係数に従って補正画像を得るために合成画像をスケーリングすることができる。
704の処理は、上述した撮像装置300の画像合成回路305または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
705において、補正画像が出力される。いくつかの実施形態では、補正画像のスコアに従って、補正画像を現在のアルバムのキューに挿入することができる。現在のアルバムのキューは、順番に表示することも、9つの正方グリッドに表示に表示することもできる。
705の処理は、上述した撮像装置300の画像表示回路306または撮像装置500のプロセッサ502において実現可能であるため、ここでの詳細な説明は省略する。
いくつかの実施形態では、703および/または704のプロセスは省略することができる。例えば、703の処理を省略した場合は、撮像画像を直接合成することができる。他の例として、704の処理を省略した場合は、回転画像をそのまま出力することができる。他の例として、703、704の処理を省略した場合は、撮像画像を直接出力することができる。
図11は、本開示と一貫した他の例示的な撮影方法800のフローチャートである。撮影方法800は、上述した撮像装置300または撮像装置500において実施することができる。
図11を参照すると、801で、審美的規則に基づいて、ライブビュー内のライブビュー画像に対して選択プロセスがリアルタイムで実行され、ライブビュー画像のスコアが決定される。801の処理は、上述した撮像装置300の画像選択回路303または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
802で、ライブビュー画像のスコアと1つまたは複数の他の基準との組み合わせに従って、撮像動作が自動的にトリガされる。いくつかの実施形態では、特定の意味を有するオブジェクトが現在のシーンで検出され、ライブビュー画像のスコアが閾値以上であるときに、撮像動作を自動的にトリガすることができる。特定の意味は、例えば、人々、動物、顔、または笑顔を含み得るが、これらに限定されない。いくつかの実施形態では、現在のシーンの奥行きの変化が検出され、ライブビュー画像のスコアが閾値以上であるときに、撮像動作を自動的にトリガすることができる。いくつかの実施形態では、現在のシーンの焦点の変化が検出され、ライブビュー画像のスコアが閾値以上であるときに、撮像動作を自動的にトリガすることができる。いくつかの実施形態では、音声コマンドが受信され、ライブビュー画像のスコアが閾値以上であるときに、撮像動作を自動的にトリガすることができる。いくつかの実施形態では、制御プロセスとライブビュー画像のスコアとの組み合わせに基づいて、撮像動作を自動的にトリガすることができる。制御処理としては、タイマー撮影、タイムラプス撮影等が挙げられる。
802の処理は、上述した撮像装置300の撮影選択回路302または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
803で、取り込まれた画像は自動的に回転される。803の処理は703の処理と同様であるため、詳細な説明は省略する。803の処理は、上述した撮像装置300の画像回転補正回路304または撮像装置500のプロセッサ502において実現することができる。
804で、回転画像は自動的に合成されて補正画像が生成される。804の処理は704の処理と同様であるため、詳細な説明は省略する。804の処理は、上述した撮像装置300の画像合成回路305または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
805において、補正画像が出力される。805の処理は705の処理と同様であるため、詳細な説明は省略する。805の処理は、上述した撮像装置300の画像表示回路306または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
いくつかの実施形態では、803および/または804のプロセスは省略することができる。例えば、803の処理を省略した場合は、撮像画像を直接合成することができる。他の例として、804の処理を省略した場合は、回転画像をそのまま出力することができる。他の例として、803、804の処理を省略した場合は、撮像画像を直接出力することができる。
図12は、本開示と一貫した他の例示的な撮影方法900のフローチャートである。撮影方法900は、上述した撮像装置400または撮像装置500において実施することができる。
図12に示すように、901で、ソフトウェアとハードウェアの組み合わせを使用してカメラの撮像動作が自動的にトリガされて画像を取り込む。901の処理は、601の処理と同様であり、詳細な説明は省略する。901の処理は、上述した撮像装置400の撮影選択回路402または撮像装置500のプロセッサ502において実現することができる。
902において、取り込まれた画像は自動的に回転される。902の処理は、602の処理と同様であり、詳細な説明は省略する。902の処理は、上述した撮像装置400の画像回転補正回路403または撮像装置500のプロセッサ502において実現することができる。
903で、回転処理された画像に対して選択プロセスが実行される。いくつかの実施形態では、回転された画像のスコアは審美的規則に従って決定することができる。スコアが事前設定されたしきい値より低い場合、回転した画像は破棄される可能性がある。スコアが予め設定された閾値以上である場合、回転された画像はさらなる処理のために保持され得る。いくつかの他の実施形態では、回転画像とカメラの現在のアルバム内の画像との間の類似性を判断するために、回転画像から少なくとも1つの画像特徴を抽出することができる。回転画像のスコアが、回転画像に類似する1つまたは複数の類似画像の最低スコアまたは最高スコアよりも低い場合、回転画像は破棄することができる。回転画像のスコアが1つ以上の類似画像の最低スコアまたは最高スコア以上である場合、回転画像はさらなる処理のために保持され得る。いくつかの実施形態では、回転された画像のスコアより低いスコアを有する1つまたは複数の類似の画像を現在のアルバムから削除することができる。
903の処理は、上述した撮像装置400の画像選択回路404または撮像装置500のプロセッサ502において実現可能であるため、ここでの詳細な説明は省略する。
904で、回転画像は自動的に合成されて補正画像が生成される。904の処理は、603の処理と同様であり、詳細な説明は省略する。904の処理は、上述した撮像装置400の画像合成回路405または撮像装置500のプロセッサ502において実現することができる。
905において、補正画像が出力される。905の処理は、605の処理と同様であるため、詳細な説明は省略する。905の処理は、上述した撮像装置400の画像表示回路406または撮像装置500のプロセッサ502において実現可能であるため、詳細な説明は省略する。
図13は、本開示と整合する別の例示的な撮影方法1000のフローチャートである。撮影方法1000は、例えば上述した撮像装置500において実施することができる。
図13を参照すると、1001において、ソフトウェアとハードウェアの組み合わせを使用してカメラの撮像動作が自動的にトリガされて画像を取り込む。1001の処理は、601の処理と同様であるため、詳細な説明は省略する。1001の処理は、上述した撮像装置500のプロセッサ502内で実施することができる。
1002で、撮影画像を補正して補正画像を生成する。いくつかの実施形態では、選択プロセスは撮影画像に対して実行することができ、選択後の撮影画像は補正画像とすることができる。選択処理は、604の処理で説明した選択処理と同様であり、詳細な説明は省略する。いくつかの実施形態では、撮影画像を回転させて補正画像(すなわち回転画像)を生成することができる。回転補正方法は、602の処理で説明した回転補正方法と同様であり、詳細な説明は省略する。いくつかの実施形態では、取り込まれた画像を回転させて回転画像を生成することができ、回転画像を合成して補正画像を生成することができる。合成方法は、603の処理で説明した合成方法と同様であり、詳細な説明は省略する。いくつかの実施形態では、取り込まれた画像は、補正画像を生成するように構成することができる。いくつかの他の実施形態では、歪み補正は、取り込まれた画像または回転された画像に対して実行することができる。
1003において、補正画像が出力される。1003の処理は605の処理と同様であるため、詳細な説明は省略する。1003の処理は、上述した撮像装置500のプロセッサ502内で実施することができるので、詳細な説明は省略する。
簡略化の目的で、例示的な方法のプロセスの詳細な説明は省略されることがあり、例示的な装置の説明を参照することができる。
開示された装置および方法は、本明細書に記載されていない他の方法で実施されてもよい。例えば、上述の装置は単なる例示である。例えば、ユニットの分割は論理的な機能分割のみであり得、ユニットを分割する他の方法があり得る。例えば、複数のユニットまたは構成要素を組み合わせてもよく、または別のシステムに統合してもよく、あるいはいくつかの特徴を無視してもよく、または実行しなくてもよい。
別々の構成要素として説明されているユニットは、物理的に分離されていてもいなくてもよく、ユニットとして示されている構成要素は物理的ユニットであってもなくてもよい。すなわち、ユニットは一箇所に配置されていてもよいし、複数のネットワーク要素にわたって分散されていてもよい。本開示の目的を達成するために実際の必要性に応じて構成要素のいくつかまたはすべてを選択することができる。
さらに、本開示の様々な実施形態における機能ユニットは、1つの処理ユニットに統合されてもよく、または各ユニットは個々の物理的ユニットであってもよく、あるいは2つ以上のユニットが1つのユニットに統合されてもよい。
本開示の他の実施形態は、本明細書の考察および本明細書に開示された実施形態の実施から当業者には明らかであろう。明細書および実施例は例示としてのみ考慮されるべきであり、本開示の範囲を限定するものではなく、本発明の真の範囲および精神は特許請求の範囲によって示されることが意図される。

Claims (27)

  1. 所定の条件が満たされたときに画像撮影装置の撮像動作をトリガする撮影選択部と、
    前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成する画像合成部と、
    前記補正画像を出力する画像出力部と、
    を備え、
    前記撮影選択部は、少なくとも、特定の意味を有する、人、動物、顔、または笑顔のうちの少なくとも1つを含むオブジェクトが検出されたとき、及び現在のシーンの奥行きまたは焦点に変化が生じたときに前記撮像動作をトリガし、
    前記画像出力部は、審美的規則に従って決定される前記補正画像のスコアに従って、前記補正画像を現在のアルバムのキューに挿入し、現在のアルバムのキューを表示する撮像装置。
  2. 前記撮影選択部は、音声コマンドが受信されたときに前記撮像動作をトリガする請求項1に記載の撮像装置。
  3. 前記撮影選択部は、タイマー撮影またはタイムラプス撮影を含む制御処理が実行されたときに前記撮像動作をトリガする請求項1または2に記載の撮像装置。
  4. 前記撮影選択部は、審美的規則に基づいてライブビュー画像をリアルタイムで採点することによって得られたスコアが閾値以上である場合に、前記撮像動作をトリガする請求項1から3のいずれか一項に記載の撮像装置。
  5. 前記審美的規則は、信号対雑音比(SNR)、コントラスト、ヒストグラム分布、画像飽和度、情報エントロピー、自動露出値、オートフォーカス値、オートホワイトバランス値、またはライブビュー画像の高得点オブジェクトのうちの少なくとも1つに従って定められる請求項1からのいずれか一項に記載の撮像装置。
  6. 前記画像合成部は、前記撮影画像内の特徴的なオブジェクトを検出し、前記特徴的なオブジェクトの位置およびサイズ情報を取得し、合成規則と、前記特徴的なオブジェクトの位置およびサイズ情報とに従って合成画像を取得し、前記合成画像を拡大縮小して補正画像を取得する請求項1からのいずれか一項に記載の撮像装置。
  7. 前記合成規則は、中央合成規則、トライアド合成規則、水平線合成規則、対称合成規則、または対角合成規則のうちの少なくとも1つを含む、請求項に記載の撮像装置。
  8. 前記画像合成部は、ネットワークモデルまたはツリー構造を取得し、前記ネットワークモデルまたは前記ツリー構造に従って前記撮影画像を処理して、クロッピング座標および倍率を取得し、前記クロッピング座標に従って取り込まれた画像をトリミングして合成画像を取得し、前記倍率に従って前記合成画像をスケーリングして補正画像を得る請求項1から7のいずれか一項に記載の撮像装置。
  9. 所定の条件が満たされたときに画像撮影装置の撮像動作をトリガする撮影選択部と、
    前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成する画像合成部と、
    前記補正画像を出力する画像出力部と、
    を備え、
    前記撮影選択部は、少なくとも、特定の意味を有する、人、動物、顔、または笑顔のうちの少なくとも1つを含むオブジェクトが検出されたとき、及び現在のシーンの奥行きまたは焦点に変化が生じたときに前記撮像動作をトリガし、
    前記画像合成部は、ネットワークモデルまたはツリー構造を取得し、前記ネットワークモデルまたは前記ツリー構造に従って前記撮影画像を処理して、クロッピング座標および倍率を取得し、前記クロッピング座標に従って取り込まれた画像をトリミングして合成画像を取得し、前記倍率に従って前記合成画像をスケーリングして補正画像を得る撮像装置。
  10. 前記ネットワークモデルは、複数のサンプルに基づいて訓練することによって得られる請求項8または9に記載の撮像装置。
  11. 前記画像合成部は、前記撮影画像を合成する前に前記撮影画像を回転させる、請求項1から10のいずれか一項に記載の撮像装置。
  12. 記画像合成部は、ヨー軸情報、ピッチ軸情報、またはロール軸情報のうちの少なくとも1つを含む、前記画像撮影装置の姿勢情報に従って撮影画像を回転させる、請求項11に記載の撮像装置。
  13. 記画像合成部は、前記撮影画像内の水平線を検出して、ロール方向の傾斜角を取得し、前記傾斜角が閾値よりも小さい場合に、前記傾斜角に従って前記撮影画像をロール方向に回転させる、請求項12に記載の撮像装置。
  14. 記画像合成部は、前記撮影画像を回転させる前または後に、前記撮影画像に対して歪み補正を実行する請求項13に記載の撮像装置。
  15. 得られた前記撮影画像または前記補正画像である候補画像に対して選択処理を行う画像選択部をさらに備える、請求項1から14のいずれか一項に記載の撮像装置。
  16. 前記画像選択部は、審美的規則に従って前記候補画像のスコアを決定する、請求項15に記載の撮像装置。
  17. 前記画像選択部は、前記スコアが予め設定された閾値より低い場合、前記候補画像を破棄し、前記スコアが予め設定された閾値以上である場合、候補画像を保存する請求項16に記載の撮像装置。
  18. 前記画像選択部は、少なくとも1つの画像特徴に従って、前記候補画像に類似する現在のアルバム内の1つ以上の類似画像を決定し、
    前記候補画像のスコアが1つまたは複数の類似画像の最低スコアよりも低い場合、前記候補画像を破棄し、
    候補画像のスコアが1つまたは複数の類似画像の最低スコア以上である場合、前記候補画像を記憶する請求項16または17に記載の撮像装置。
  19. 所定の条件が満たされたときに画像撮影装置の撮像動作をトリガする撮影選択部と、
    前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成する画像合成部と、
    前記補正画像を出力する画像出力部と、
    を備え、
    前記撮影選択部は、少なくとも、特定の意味を有する、人、動物、顔、または笑顔のうちの少なくとも1つを含むオブジェクトが検出されたとき、及び現在のシーンの奥行きまたは焦点に変化が生じたときに前記撮像動作をトリガし、
    得られた前記撮影画像または前記補正画像である候補画像に対して選択処理を行う画像選択部をさらに備え
    前記画像選択部は、審美的規則に従って前記候補画像のスコアを決定し、
    少なくとも1つの画像特徴に従って、前記候補画像に類似する現在のアルバム内の1つ以上の類似画像を決定し、
    前記候補画像のスコアが1つまたは複数の類似画像の最低スコアよりも低い場合、前記候補画像を破棄し、
    候補画像のスコアが1つまたは複数の類似画像の最低スコア以上である場合、前記候補画像を記憶する撮像装置。
  20. 前記画像選択部は、少なくとも1つの画像特徴に従って、前記候補画像に類似する現在のアルバム内の1つ以上の類似画像を決定し、
    前記候補画像のスコアが1つ以上の類似画像の最高スコアよりも低い場合、前記候補画像を破棄し、
    前記候補画像のスコアが1つまたは複数の類似画像の最高スコア以上である場合、前記候補画像を記憶する請求項16から19のいずれか一項に記載の撮像装置。
  21. 所定の条件が満たされたときに画像撮影装置の撮像動作をトリガする撮影選択部と、
    前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成する画像合成部と、
    前記補正画像を出力する画像出力部と、
    を備え、
    前記撮影選択部は、少なくとも、特定の意味を有する、人、動物、顔、または笑顔のうちの少なくとも1つを含むオブジェクトが検出されたとき、及び現在のシーンの奥行きまたは焦点に変化が生じたときに前記撮像動作をトリガし、
    得られた前記撮影画像または前記補正画像である候補画像に対して選択処理を行う画像選択部をさらに備え
    前記画像選択部は、審美的規則に従って前記候補画像のスコアを決定し、
    少なくとも1つの画像特徴に従って、前記候補画像に類似する現在のアルバム内の1つ以上の類似画像を決定し、
    前記候補画像のスコアが1つ以上の類似画像の最高スコアよりも低い場合、前記候補画像を破棄し、
    前記候補画像のスコアが1つまたは複数の類似画像の最高スコア以上である場合、前記候補画像を記憶する撮像装置。
  22. 前記少なくとも1つの画像特徴は、ヒストグラム、シフト特徴、画像モーメント、または画像の指紋のうちの少なくとも1つを含む、請求項18から21のいずれか一項に記載の撮像装置。
  23. 前記審美的規則は、信号対雑音比(SNR)、コントラスト、ヒストグラム分布、画像飽和度、情報エントロピー、自動露出値、オートフォーカス値、オートホワイトバランス値、または候補画像の高得点オブジェクトのうちの少なくとも1つに従って決定される、請求項16から22のいずれか一項に記載の撮像装置。
  24. 前記候補画像の前記スコアは、事前評価済みスコアのデータセットに基づくトレーニング済みモデルに従って決定される請求項16から23のいずれか一項に記載の撮像装置。
  25. 前記画像出力部は、審美的規則に従って決定される前記補正画像のスコアに従って、前記補正画像を現在のアルバムのキューに挿入し、現在のアルバムのキューを表示する請求項1を引用しない請求項9から24のいずれか一項に記載の撮像装置。
  26. 前記画像出力部は、9つの正方グリッドに前記現在のアルバムのキューを表示する、請求項1から8及び25のいずれか一項に記載の撮像装置。
  27. 請求項1から26のいずれか一項に記載の撮像装置による撮像方法であって、
    所定の条件が満たされたときに画像撮影装置の撮像動作をトリガするステップと、
    前記画像撮影装置によって得られた撮影画像を合成して補正画像を生成するステップと、
    前記補正画像を出力するステップと、
    を備える撮像方法。
JP2019142458A 2019-05-14 2019-08-01 撮像装置及び撮像方法 Active JP6907274B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
PCT/CN2019/086914 WO2020227945A1 (en) 2019-05-14 2019-05-14 Photographing method and apparatus
CNPCT/CN2019/086914 2019-05-14

Publications (2)

Publication Number Publication Date
JP2020188448A JP2020188448A (ja) 2020-11-19
JP6907274B2 true JP6907274B2 (ja) 2021-07-21

Family

ID=68126379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019142458A Active JP6907274B2 (ja) 2019-05-14 2019-08-01 撮像装置及び撮像方法

Country Status (5)

Country Link
US (1) US20200364832A1 (ja)
EP (1) EP3756340A1 (ja)
JP (1) JP6907274B2 (ja)
CN (1) CN110326287A (ja)
WO (1) WO2020227945A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200132569A (ko) 2019-05-17 2020-11-25 삼성전자주식회사 특정 순간에 관한 사진 또는 동영상을 자동으로 촬영하는 디바이스 및 그 동작 방법
CN111107267A (zh) * 2019-12-30 2020-05-05 广州华多网络科技有限公司 图像处理方法、装置、设备及存储介质
CN112955711A (zh) * 2020-02-28 2021-06-11 深圳市大疆创新科技有限公司 位置信息确定方法、设备及存储介质

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4810850B2 (ja) * 2005-03-28 2011-11-09 カシオ計算機株式会社 撮像装置及びプログラム
ATE501594T1 (de) * 2007-06-27 2011-03-15 Panasonic Corp Bildgebungsgerät, verfahren, systemintegrierte schaltung und programm
JP4458131B2 (ja) * 2007-08-23 2010-04-28 ソニー株式会社 画像撮像装置、撮像方法
JP2010041255A (ja) * 2008-08-01 2010-02-18 Sony Corp 撮像装置、撮像方法およびプログラム
JP4720880B2 (ja) * 2008-09-04 2011-07-13 ソニー株式会社 画像処理装置、撮像装置、画像処理方法およびプログラム
US20110199511A1 (en) * 2008-10-20 2011-08-18 Camelot Co., Ltd. Image photographing system and image photographing method
JP5379449B2 (ja) * 2008-10-31 2013-12-25 キヤノン株式会社 撮像装置及びその制御方法
JP4852592B2 (ja) * 2008-11-28 2012-01-11 アキュートロジック株式会社 文字画像補正装置及び文字画像補正方法
US8406515B2 (en) * 2009-06-24 2013-03-26 Hewlett-Packard Development Company, L.P. Method for automatically cropping digital images
US20120134595A1 (en) * 2009-08-11 2012-05-31 Koninklijke Philips Electronics N.V. Method and apparatus for providing an image for display
US8687070B2 (en) * 2009-12-22 2014-04-01 Apple Inc. Image capture device having tilt and/or perspective correction
JP2011139282A (ja) * 2009-12-28 2011-07-14 Sony Corp 画像処理装置、撮像装置、画像処理方法およびプログラム
US8743219B1 (en) 2010-07-13 2014-06-03 Marvell International Ltd. Image rotation correction and restoration using gyroscope and accelerometer
US8660351B2 (en) 2011-10-24 2014-02-25 Hewlett-Packard Development Company, L.P. Auto-cropping images using saliency maps
TWI519840B (zh) * 2012-11-22 2016-02-01 原相科技股份有限公司 能夠即時對特定可移動物件進行自動對焦的方法、具有自動對焦功能的攝影裝置、以及儲存用來執行即時對特定可移動物件進行自動對焦之電腦程式的電腦可讀式儲存媒體
JP2014131257A (ja) * 2012-11-27 2014-07-10 Ricoh Co Ltd 画像補正システム、画像補正方法及びプログラム
CN103108127A (zh) * 2013-02-17 2013-05-15 华为终端有限公司 利用便携式设备进行拍照的方法及便携式设备
CN103139480A (zh) * 2013-02-28 2013-06-05 华为终端有限公司 一种图像采集方法及装置
JP2014164288A (ja) * 2013-02-28 2014-09-08 Nikon Corp 撮像装置
CN103354611A (zh) * 2013-06-22 2013-10-16 太仓博天网络科技有限公司 一种可基于zoran芯片的智能数码相机系统
US8860818B1 (en) * 2013-07-31 2014-10-14 Apple Inc. Method for dynamically calibrating rotation offset in a camera system
JP5790724B2 (ja) * 2013-09-13 2015-10-07 カシオ計算機株式会社 撮像装置、撮影方法及びプログラム
CN103793884B (zh) * 2013-12-31 2015-10-21 华中科技大学 一种知识约束的桥梁目标图像气动光学效应校正方法
CN106708070B (zh) * 2015-08-17 2021-05-11 深圳市道通智能航空技术股份有限公司 一种航拍控制方法和装置
US9955126B2 (en) * 2015-08-19 2018-04-24 Rapsodo Pte. Ltd. Systems and methods of analyzing moving objects
US11012631B2 (en) * 2016-06-01 2021-05-18 Sharp Kabushiki Kaisha Image capturing and processing device, electronic instrument, image capturing and processing method, and recording medium
CN110506292A (zh) * 2017-04-13 2019-11-26 夏普株式会社 图像处理装置、摄像装置、终端装置、图像校正方法及图像处理程序
CN108234870B (zh) * 2017-12-27 2019-10-11 Oppo广东移动通信有限公司 图像处理方法、装置、终端及存储介质
CN108307118B (zh) * 2018-02-10 2020-07-07 北京理工大学 一种基于惯导参数流形优化的低延时视频稳像方法
CN108595145A (zh) * 2018-04-26 2018-09-28 广东小天才科技有限公司 可穿戴设备的语音播放控制方法、装置及可穿戴设备

Also Published As

Publication number Publication date
US20200364832A1 (en) 2020-11-19
CN110326287A (zh) 2019-10-11
EP3756340A4 (en) 2020-12-30
JP2020188448A (ja) 2020-11-19
EP3756340A1 (en) 2020-12-30
WO2020227945A1 (en) 2020-11-19

Similar Documents

Publication Publication Date Title
US9692964B2 (en) Modification of post-viewing parameters for digital images using image region or feature information
US9712743B2 (en) Digital image processing using face detection and skin tone information
US9129381B2 (en) Modification of post-viewing parameters for digital images using image region or feature information
JP6961797B2 (ja) プレビュー写真をぼかすための方法および装置ならびにストレージ媒体
US8675991B2 (en) Modification of post-viewing parameters for digital images using region or feature information
CN103581561B (zh) 基于旋转摄像头拍摄的人景图像合成方法和系统
US7574016B2 (en) Digital image processing using face detection information
US8498452B2 (en) Digital image processing using face detection information
JP4861952B2 (ja) 画像処理装置及び撮像装置
JP6907274B2 (ja) 撮像装置及び撮像方法
CN108605087B (zh) 终端的拍照方法、拍照装置和终端
JP6401324B2 (ja) ダイナミックフォトの撮影方法及び装置
CN108259770B (zh) 图像处理方法、装置、存储介质及电子设备
WO2007142621A1 (en) Modification of post-viewing parameters for digital images using image region or feature information
US10645278B2 (en) Imaging control apparatus and control method therefor
JP4624947B2 (ja) 画像のトリミング方法および装置並びにプログラム
JP4802884B2 (ja) 撮像装置、撮像画像記録方法、及び、プログラム
CN108259768B (zh) 图像的选取方法、装置、存储介质及电子设备
US20200412928A1 (en) Imaging device, imaging system, and imaging method
JP6668646B2 (ja) 画像処理装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210630

R150 Certificate of patent or registration of utility model

Ref document number: 6907274

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150