JP2017041857A - 画像処理装置、その制御方法、プログラム及び撮像装置 - Google Patents
画像処理装置、その制御方法、プログラム及び撮像装置 Download PDFInfo
- Publication number
- JP2017041857A JP2017041857A JP2015164178A JP2015164178A JP2017041857A JP 2017041857 A JP2017041857 A JP 2017041857A JP 2015164178 A JP2015164178 A JP 2015164178A JP 2015164178 A JP2015164178 A JP 2015164178A JP 2017041857 A JP2017041857 A JP 2017041857A
- Authority
- JP
- Japan
- Prior art keywords
- image
- data
- moving image
- processing apparatus
- focus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Studio Devices (AREA)
- Focusing (AREA)
- Automatic Focus Adjustment (AREA)
Abstract
Description
以下、本発明の例示的な実施形態について、図面を参照して詳細に説明する。なお、以下では画像処理装置の一例として、撮像素子の受光面における光の強度とその光の進行方向の情報を持った画像信号(LFデータという)を入力可能な任意のパーソナルコンピュータに本発明を適用した例を説明する。しかし、本発明は、パーソナルコンピュータに限らず、LFデータを入力することが可能な任意の電子機器にも適用可能である。これらの電子機器には、例えばデジタルカメラ、携帯電話機、ゲーム機、タブレット端末、時計型や眼鏡型の情報端末などが含まれてよい。
図1は、本実施形態の画像処理装置の一例としてパーソナルコンピュータ100の機能構成例を示すブロック図である。なお、図1に示す機能ブロックの1つ以上は、ASICやプログラマブルロジックアレイ(PLA)などのハードウェアによって実現されてもよいし、CPUやMPU等のプログラマブルプロセッサがソフトウェアを実行することによって実現されてもよい。また、ソフトウェアとハードウェアの組み合わせによって実現されてもよい。従って、以下の説明において、異なる機能ブロックが動作主体として記載されている場合であっても、同じハードウェアが主体として実現されうる。
次に、図9を参照して、本実施形態のLF動画の再生処理に係る一連の動作を説明する。なお、LF動画の再生処理は、操作部101に対してユーザによる再生指示が行われた場合に開始され、制御部102が記憶部107に記憶されたプログラムを実行することにより各部を制御する。操作部101は、ユーザ操作によりLF動画の再生開始が指示されたことを検出する。操作部101は、検出したLF動画の再生開始の指示を制御部102に送信すると、制御部102は各部のレジスタを設定してLF動画の再生処理を制御する。
S901において、制御部102は、音声・LFデータ入力部103が入力した音声データ及びLFデータを、記憶部107の音声データ領域、LFデータ領域にそれぞれ記憶させる。LFデータは、例えば、撮像レンズとマイクロレンズアレイ、撮像素子を有する撮像装置により取得され、音声・LFデータ入力部103が、例えばメモリスティック等の着脱可能な記録媒体を介して入力するものとして説明する。
S902において、制御部102は、被写界深度設定部105及びリフォーカス処理部106を制御してLF動画データ生成処理を行い、LF動画データを生成する。
S903において、制御部102は、話者検出部104を制御して話者認識及び話者特定の処理を行う。まず、話者検出部104は、第1動画データ領域から読み出したLF動画データを読み出し、当該LF動画データに含まれる音声データを用いた話者認識処理を行う。話者認識処理については、様々な方法が知られており、公知の技術(例えば特開昭58−11192号公報等参照)を用いて実現することができる。そのため、詳細な説明は省略して一例としての概要を説明する。本実施形態では、発話者の固有の音声スペクトル概形を予め記憶部107のプロファイル領域に記憶しておき、各話者の発話が開始されると記憶されている音声スペクトル概形とマッチングを行って発話者を特定する。
S904において、話者検出部104は、第1動画データ領域から読み出したLF動画データに基づいて、当該LF動画データに含まれるLF画像データを用いた話者特定処理を行う。本実施形態では、上述した音声スペクトル概形と関連付けられた顔画像(関連特徴情報という)を記憶部107のプロファイル領域に記憶しておき、話者が認識されたことに応じて、顔画像を参照して話者の画面内座標を決定する。
S905において、制御部102は、被写界深度設定部105を制御して、第2被写界深度を設定する。第2被写界深度は、リフォーカス処理部106においてリフォーカス係数αnを算出するために用いられる被写界深度であり、特定された一人の話者に対して合焦させる場合に用いる浅い深度の被写界深度である。被写界深度設定部105は、第2被写界深度を設定すると、記憶部107の被写界深度設定領域に記憶させる。なお、第2被写界深度は、続くリフォーカス処理部106にて合焦評価が可能な画像を生成できる程度の被写界深度であればどんなものでもよい。
S906において、制御部102は、リフォーカス処理部106を制御してリフォーカス係数を算出する。具体的には、リフォーカス処理部106は、まず、話者座標データ領域に記憶されている話者の画面内座標(xn、yn)と、被写界深度設定領域に記憶されている第2被写界深度の設定と、LFデータ領域に記憶されているLFデータとをそれぞれ読み出す。次に、これらを用いてリフォーカス画像を生成すると共に、生成したリフォーカス画像の合焦評価を行って、画面内座標(xn、yn)に対してリフォーカスを行うためのリフォーカス係数αnを算出する。例えば、リフォーカス処理部106は、複数のリフォーカス係数に基づいてそれぞれのリフォーカス画像を生成し、各リフォーカス画像に対する合焦評価を行い、リフォーカス係数を算出する。リフォーカス画像の合焦評価は、別途後述するように、一般的なデジタルスチルカメラにおけるコントラストAFで用いられるような画像のエッジ検出と同様の公知の方法を用いて実現することができる。リフォーカス処理部106は、記憶部107の話者フォーカス距離領域に算出したリフォーカス係数αnを記憶させる。
S907において、制御部102は、被写界深度設定部105を制御して、生成されるリフォーカス画像が有する被写界深度(第3被写界深度)を設定する。被写界深度設定部105は、話者フォーカス距離領域に記憶されているリフォーカス係数αnと、話者座標データ領域に記憶されている話者座標データ(xn、yn)を読み込む。そして、これらを用いて、LFデータからリフォーカス画像を生成するために必要となる第3被写界深度の設定を行う。なお、より詳細な第3被写界深度の設定については後述する。被写界深度設定部105は、複数の話者がいる場合、複数のリフォーカス係数αnのうち最小のリフォーカス係数αn_minと最大のリフォーカス係数αn_maxとから第3被写界深度を設定する。話者座標データ領域に記憶されている話者座標データが不定座標(x∞、y∞)である場合は、第3被写界深度を最も深い設定とする。その後、被写界深度設定部105は、算出した第3被写界深度を被写界深度設定領域に記憶させる。
リフォーカス係数αnが話者フォーカス距離領域に、第3被写界深度が被写界深度設定領域にそれぞれ記憶された段階で、先読み込み処理が完了となり、該当するフレームの画像が再生可能となる。本リフォーカス処理のステップでは、リフォーカス係数や被写界深度等の、先読み込み処理によって生成されたフォーカス処理の演算過程のデータを利用して、演算量を低減して遅延を低減したリフォーカス画像の生成・提示を行う。
上述した、被写界深度設定部105による被写界深度の設定処理、及びリフォーカス処理部106によるリフォーカス画像の生成処理について、図4及び図5を参照して更に説明する。なお、これらの処理は「Light Field Photography」ともいわれる処理である。
次に実施形態2について説明する。実施形態2では、実施形態1の構成を主レンズ、マイクロレンズ及び撮像素子を含む撮像部を有する撮像装置に適用する。即ち、本実施形態の撮像装置は、実施形態1と異なりLFデータ及び音声をそれぞれ取得する構成を有し、また、生成されたリフォーカス画像を表示する構成を有する。しかし、その他の構成は実施形態1と同一である。このため、同一の構成又は同様のステップについては同一の符号を付して重複する説明は省略し、相違点について重点的に説明する。
次に、撮影時における主レンズ601、マイクロレンズ602、撮像素子603、LFデータ入力部604を用いた動作について、図7及び図8を参照して説明する。
次に、図10を参照して、本実施形態のLF動画の撮影処理に係る一連の動作を説明する。なお、LF動画の撮影処理は、操作部101に対してユーザによる撮影指示が行われた場合に開始され、制御部102が記憶部107に記憶されたプログラムを実行することにより各部を制御する。
S1001において、制御部102は、撮像素子603を制御してLFデータを生成する。より具体的には、主レンズ601は前面から被写体の光線を集光して、マイクロレンズ602の面に結像させる。上述したように、マイクロレンズ602は、主レンズ601によって集光された光線を入射角度に応じて分光し、撮像素子603に出射する。
S1002において、制御部102は、メディアI/F607を制御して、記憶部107に格納されている各データを記録メディア608に書き込ませる。より具体的には、メディアI/F607は、記憶部107に記憶されているリフォーカス係数αnと、第3被写界深度と、LFデータと、音声データとを読み出して、記録メディアに書き込む。なお、本実施形態では、リフォーカス係数や第3被写界深度等のリフォーカス処理の演算過程のデータを付加情報(メタデータ)として記録するため、同時に記録されたLF動画データを再生する際に高速にリフォーカス画像を再生することができる。
次に、図11を参照して、LF動画の再生処理に係る一連の動作について説明する。なお、本実施形態に係るLF動画の再生処理は、操作部101に対してユーザによる再生指示が行われた場合に開始され、制御部102が記憶部107に記憶されたプログラムを実行することにより各部を制御する。
S1101において、制御部102は、メディアI/F607を制御して記録メディア608からLF動画データを読み出して、記憶部107の各領域に記憶させる。具体的には、メディアI/F607は、記録メディア608からリフォーカス係数αnと、第3被写界深度と、LFデータと、音声データとを読み出す。そして、読み出したデータ、即ちリフォーカス係数αnを記憶部107の話者フォーカス距離領域に、第3被写界深度を被写界深度領域に、LFデータをLFデータ領域に、音声データを音声データ領域にそれぞれ記憶させる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (11)
- 撮像面における光線の強度とその光線の進行方向の情報を含んだ画像信号を各フレームに含んだ動画データと、該動画データに対応する音声データとを入力する入力手段と、
前記入力された音声データと前記入力された動画データから得られる画像信号とに基づいて、音声を発する被写体の画像内の位置を特定する特定手段と、
前記入力された動画データから得られる画像信号を用いて、前記特定された前記被写体の画像内の位置が合焦する合焦位置を決定する決定手段と、
を有することを特徴とする画像処理装置。 - 前記特定手段は、音声データから認識される被写体の特徴に、画像信号に基づいて得られる被写体の特徴を関連付けた関連特徴情報を用いて、前記音声を発する被写体の画像内の位置を特定する、
ことを特徴とする請求項1に記載の画像処理装置。 - 前記特定手段は、予め記録されている前記関連特徴情報を用いて、前記音声を発する被写体の画像内の位置を特定する、
ことを特徴とする請求項2に記載の画像処理装置。 - 前記決定された合焦位置を用いて、前記特定された前記被写体の画像内の位置が合焦する画像を生成する生成手段を更に有する、
ことを特徴とする請求項1から3のいずれか1項に記載の画像処理装置。 - 前記生成手段は、前記特定手段により複数の前記画像内の位置が特定された場合、それぞれの前記画像内の位置が合焦する画像を生成する、
ことを特徴とする請求項4に記載の画像処理装置。 - 前記決定された合焦位置を記憶する記憶手段を更に有し、
前記生成手段は、前記記憶手段に記憶された前記決定された合焦位置を用いて、前記特定された前記被写体の画像内の位置が合焦する画像を生成する、
ことを特徴とする請求項4又は5に記載の画像処理装置。 - 前記決定された合焦位置、前記入力された音声データ、及び前記入力された動画データを記憶する記憶手段を更に有し、
前記入力手段は、前記記憶手段に記憶されている前記入力された音声データと前記入力された動画データとを入力し、
前記生成手段は、前記記憶手段に記憶された前記決定された合焦位置を用いて、前記入力された音声データを基準にした所定のタイミングで表示されるように、前記特定された前記被写体の画像内の位置が合焦する画像を生成する、
ことを特徴とする請求項4又は5に記載の画像処理装置。 - 撮像面における光線の強度とその光線の進行方向の情報を含んだ画像信号を各フレームに含んだ動画データを撮像する撮像手段と、
前記動画データと該動画データに対応する音声データを取得する音声入力手段と、
請求項1から7のいずれか1項に記載の画像処理装置と、を有し、
前記入力手段は、前記撮像手段により撮像された前記動画データと前記音声入力手段により取得された前記音声データを入力する、
ことを特徴とする撮像装置。 - 前記撮像手段は、2次元状に配置された複数のマイクロレンズのそれぞれが撮像素子の複数の画素と対応するように構成される、
ことを特徴とする請求項8に記載の撮像装置。 - 入力手段が、撮像面における光線の強度とその光線の進行方向の情報を含んだ画像信号を各フレームに含んだ動画データと、該動画データに対応する音声データとを入力する入力工程と、
特定手段が、前記入力された音声データと前記入力された動画データから得られる画像信号とに基づいて、音声を発する被写体の画像内の位置を特定する特定工程と、
決定手段が、前記入力された動画データから得られる画像信号を用いて、前記特定された前記被写体の画像内の位置が合焦する合焦位置を決定する決定工程と、
を有することを特徴とする画像処理装置の制御方法。 - コンピュータに、請求項10に記載の画像処理装置の各工程を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015164178A JP6761230B2 (ja) | 2015-08-21 | 2015-08-21 | 画像処理装置、その制御方法、プログラム及び撮像装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015164178A JP6761230B2 (ja) | 2015-08-21 | 2015-08-21 | 画像処理装置、その制御方法、プログラム及び撮像装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017041857A true JP2017041857A (ja) | 2017-02-23 |
JP2017041857A5 JP2017041857A5 (ja) | 2018-08-30 |
JP6761230B2 JP6761230B2 (ja) | 2020-09-23 |
Family
ID=58203771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015164178A Active JP6761230B2 (ja) | 2015-08-21 | 2015-08-21 | 画像処理装置、その制御方法、プログラム及び撮像装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6761230B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111656275A (zh) * | 2018-12-11 | 2020-09-11 | 华为技术有限公司 | 一种确定图像对焦区域的方法及装置 |
CN113542611A (zh) * | 2021-07-30 | 2021-10-22 | 西安中诺通讯有限公司 | 一种基于语音控制启动拍照的方法 |
JP7500844B2 (ja) | 2018-12-07 | 2024-06-17 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05122689A (ja) * | 1991-10-25 | 1993-05-18 | Seiko Epson Corp | テレビ会議システム |
JP2002534009A (ja) * | 1998-12-22 | 2002-10-08 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | テレビ会議における参加者のプリセット位置の自動設定方法 |
JP2012027408A (ja) * | 2010-07-27 | 2012-02-09 | Sanyo Electric Co Ltd | 電子機器 |
US20140176663A1 (en) * | 2012-12-20 | 2014-06-26 | Microsoft Corporation | Privacy camera |
-
2015
- 2015-08-21 JP JP2015164178A patent/JP6761230B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05122689A (ja) * | 1991-10-25 | 1993-05-18 | Seiko Epson Corp | テレビ会議システム |
JP2002534009A (ja) * | 1998-12-22 | 2002-10-08 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | テレビ会議における参加者のプリセット位置の自動設定方法 |
JP2012027408A (ja) * | 2010-07-27 | 2012-02-09 | Sanyo Electric Co Ltd | 電子機器 |
US20140176663A1 (en) * | 2012-12-20 | 2014-06-26 | Microsoft Corporation | Privacy camera |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7500844B2 (ja) | 2018-12-07 | 2024-06-17 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
CN111656275A (zh) * | 2018-12-11 | 2020-09-11 | 华为技术有限公司 | 一种确定图像对焦区域的方法及装置 |
CN111656275B (zh) * | 2018-12-11 | 2021-07-20 | 华为技术有限公司 | 一种确定图像对焦区域的方法及装置 |
CN113542611A (zh) * | 2021-07-30 | 2021-10-22 | 西安中诺通讯有限公司 | 一种基于语音控制启动拍照的方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6761230B2 (ja) | 2020-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5623915B2 (ja) | 撮像装置 | |
JP6159097B2 (ja) | 画像処理装置、撮像装置、制御方法、及びプログラム | |
JP5947548B2 (ja) | 撮像装置、その制御方法、画像処理装置、画像生成方法、プログラム | |
JP2012044564A (ja) | 撮像装置 | |
JP6634298B2 (ja) | 撮像装置および撮像方法 | |
KR20150141059A (ko) | 동영상의 썸네일 영상을 제공하는 장치 및 방법 | |
JP6761230B2 (ja) | 画像処理装置、その制御方法、プログラム及び撮像装置 | |
JP2016127431A (ja) | 撮像装置、撮像制御方法及びプログラム | |
KR101665175B1 (ko) | 화상 취득 장치, 화상 취득 방법 및 기록매체 | |
JP2010148132A (ja) | 撮像装置、画像検出装置及びプログラム | |
JP2016184956A (ja) | 画像処理装置及び画像処理方法 | |
JP6087719B2 (ja) | 画像処理装置及び画像処理方法 | |
US9066010B2 (en) | Photographing apparatus, photographing method and medium recording photographing control program | |
JP6757245B2 (ja) | 動画再生装置、撮像装置、動画再生方法及びプログラム | |
JP6272099B2 (ja) | 画像処理装置、制御方法およびプログラム | |
JP2015082721A (ja) | 撮像装置、その制御方法およびプログラム | |
US20150381899A1 (en) | Image processing apparatus and image processing method for synthesizing plurality of images | |
JP6372176B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP6087617B2 (ja) | 撮像装置及びその制御方法 | |
JP6995582B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
KR101660838B1 (ko) | 촬상장치 및 그 제어방법 | |
JP2024065384A (ja) | 撮像装置、画像処理装置、画像処理方法、および画像処理プログラム | |
JP2017184144A (ja) | 画像処理装置、撮像装置、および画像処理プログラム | |
JP2020036347A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2015111777A (ja) | 撮像装置及び撮像装置の制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180713 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180713 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190507 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200807 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200904 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6761230 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |