JP6866142B2 - プログラム、画像処理装置、および画像処理方法 - Google Patents
プログラム、画像処理装置、および画像処理方法 Download PDFInfo
- Publication number
- JP6866142B2 JP6866142B2 JP2016239740A JP2016239740A JP6866142B2 JP 6866142 B2 JP6866142 B2 JP 6866142B2 JP 2016239740 A JP2016239740 A JP 2016239740A JP 2016239740 A JP2016239740 A JP 2016239740A JP 6866142 B2 JP6866142 B2 JP 6866142B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- analysis
- feature amount
- predetermined condition
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/993—Evaluation of the quality of the acquired pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/59—Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
- G06V20/597—Recognising the driver's state or behaviour, e.g. attention or drowsiness
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/68—Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
- H04N23/681—Motion detection
- H04N23/6811—Motion detection based on the image signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
- H04N5/77—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
- H04N5/772—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
- G06V40/193—Preprocessing; Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
- Television Signal Processing For Recording (AREA)
Description
図1は、本実施形態において、動画像から出力対象のフレームを選択する画像処理装置のハードウェア構成の一例を示したブロック図である。
実施形態1では、追加で復号および解析を行うフレームのフレーム番号を特定するためのオフセット値は、特徴量の種類(図6では「目瞑り特徴量」と「ボケ・ブレ特徴量」)によらず一定(図6では「3」)であった。ところが、特徴量の値が所定の閾値を超えており、出力対象の静止画像として好ましくないフレームについて、その特徴量が閾値を下回るまでに要する時間(フレーム数)は必ずしも一定ではない。例えば、被写体の人物が瞬きにより目を瞑っていた状態から目が開いた状態に戻るまでの時間と、オートフォーカスによりピントが合っていない状態(ボケ・ブレ特徴量)からピントが合った状態になるまでの時間は必ずしも同じではない。そこで実施形態2においては、複数種類の特徴量のうちの、所定の閾値を越えた特徴量の種類に応じて、オフセットの値を異ならせる処理について説明する。なお、実施形態2において、追加解析画像のフレーム番号を特定するためのオフセットを決定するオフセット決定処理以外の処理は、実施形態1と同様である。
実施形態1では、特定のフレームの特徴量の値が所定の閾値を超えている場合には、動画像において一定のフレーム間隔をあけた時間的に後のフレームが必ず追加で復号・解析された。ところが、該一定のフレーム間隔をあけたフレームにおいて、必ず該特徴量の値が閾値を下回るとは限らない。例えば、あるフレームにおいて被写体の人物が目を瞑っている場合に、それが瞬きであれば、少し後のフレームにおいて目を開いている可能性は高い。しかし、該人物が意図的に目を瞑っている場合にはその限りではない。その場合、追加の復号および解析が無駄な処理となってしまう恐れがある。そこで実施形態3においては、特定のフレームの特徴量の値が所定の閾値を超えている場合には、既に復号済みの次のフレームにおいて該特徴量の値が閾値を下回っているかを事前に確認する例について説明する。なお、実施形態3において、追加で解析する画像のオフセット決定処理以外の処理は実施形態1と同様である。
実施形態1では、動画像内の特定のフレームの特徴量の値が所定の閾値を超えている場合には、該動画像において一定のフレーム間隔をあけた時間的に後のフレームが必ず追加で復号および解析されていた。ところが、該特徴量の値が良くなるまでに必要なオフセット量(時間)が必ず一定とは限らず、該特徴量の値が良くなるまでには一般的に十分なオフセット量(時間)よりも多くオフセットが必要な場合もあり得る。そこで実施形態4においては、予め決められたオフセット後のフレームにおいても特徴量の値が閾値を超えている場合には、特徴量の値が閾値を下回るまで繰り返しオフセットを加える例について説明する。実施形態4において、追加で解析する静止画像を特定するオフセットを決定するオフセット決定処理以外の処理は実施形態1と同様である。
なお、本実施形態の機能は以下の構成によっても実現することができる。つまり、本実施形態の処理を行うためのプログラムコードをシステムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)がプログラムコードを実行することによっても達成される。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することとなり、またそのプログラムコードを記憶した記憶媒体も本実施形態の機能を実現することになる。
103 ROM
104 RAM
Claims (14)
- 動画像から出力対象の候補のフレームを選択するためのプログラムであって、
前記動画像に含まれているフレームを解析する解析手段と、
前記解析手段による解析の結果に基づいて、前記出力対象の候補としての候補フレームを選択する選択手段と、
としてコンピュータを機能させ、
前記動画像に含まれているフレームのうち、フレーム間予測を用いずに符号化されるフレームである第1のフレームが所定の特徴量に関する所定の条件を満たす場合、前記解析手段は、前記動画像に含まれ且つ前記フレーム間予測を用いて符号化されるフレームである第2のフレームを解析し、前記選択手段は、前記第1のフレームの前記解析手段による解析の結果と、前記第2のフレームの前記解析手段による解析の結果とに基づき、前記第1のフレームと前記第2のフレームから前記候補フレームを選択し、
前記第1のフレームが前記所定の条件を満たさない場合、前記解析手段は、前記第2のフレームを解析せず、前記選択手段は、前記第1のフレームを前記候補フレームとして選択することを特徴とするプログラム。 - 前記動画像において、複数の前記第1のフレームを特定する特定手段をさらに前記コンピュータに実行させ、
前記解析手段は、前記特定手段により特定された複数の第1のフレームのそれぞれを解析し、さらに、前記複数の第1のフレームのうちの前記所定の条件を満たす一部の第1のフレームに対して前記第2のフレームを解析し、
前記選択手段は、前記一部の第1のフレームと前記第2のフレームから、前記候補フレームを選択することを特徴とする請求項1に記載のプログラム。 - 前記複数の前記第1のフレームのうちの前記所定の条件を満たさない一部の第1のフレームと、前記選択手段により選択された前記候補フレームとから、前記解析手段による解析の結果に基づいて出力対象のフレームを選択し、前記選択された出力対象のフレームを出力する出力手段として前記コンピュータをさらに機能させるための請求項2に記載のプログラム。
- 前記出力手段は、前記出力対象のフレームに対応する静止画像がテンプレートに配置されたアルバムを表示装置に出力し、前記アルバムを前記表示装置に表示させることを特徴とする請求項3に記載のプログラム。
- 前記出力手段は、前記出力対象のフレームに対応する静止画像がテンプレートに配置されたアルバムを印刷装置に出力し、前記アルバムを前記印刷装置に印刷させることを特徴とする請求項3に記載のプログラム。
- 前記解析手段は、
前記特定手段により特定された2つの前記第1のフレームの両方が前記所定の条件を満たす場合、前記動画像において前記2つの前記第1のフレームの間に対応するフレームを追加で解析せず、
前記2つの前記第1のフレームのうち、前記動画像において先のフレームのみが前記所定の条件を満たす場合、前記動画像において前記2つの前記第1のフレームの間において前記第2のフレームを解析することを特徴とする請求項2乃至5のいずれか1項に記載のプログラム。 - 前記動画像に含まれているフレームが前記所定の条件を満たすか判断する判断手段として前記コンピュータを機能させ、
前記解析手段は、前記判断手段により前記第1のフレームが前記所定の条件を満たすと判断された場合、前記第2のフレームを解析し、前記判断手段により前記第1のフレームが前記所定の条件を満たさないと判断された場合、前記第2のフレームを解析しないことを特徴とする請求項1乃至6のいずれか1項に記載のプログラム。 - 前記判断手段は、前記第1のフレームの前記解析手段による解析の結果に基づいて、前記第1のフレームが前記所定の特徴量に関する前記所定の条件を満たすか判断することを特徴とする請求項7に記載のプログラム。
- 前記判断手段は、前記第1のフレームの前記所定の特徴量としての複数種類の特徴量のそれぞれについて所定の条件を満たすか判断し、
前記判断手段により前記複数種類の特徴量のいずれかが前記所定の条件を満たすと判断された場合に、前記所定の条件を満たした特徴量の種類に応じて異なるフレームが、前記第2のフレームとして決定されることを特徴とする請求項7または8に記載のプログラム。 - 前記判断手段は、前記第2のフレームが前記解析手段により解析された結果に基づいて、前記第2のフレームが前記所定の条件を満たすか判断し、
前記判断手段により前記第2のフレームが前記所定の条件を満たすと判断されない場合、新たな第2のフレームが決定され、
前記選択手段は、前記第1のフレームと、前記決定された複数の第2のフレームのうちの前記判断手段により前記所定の条件を満たすと判断された第2のフレームとから、前記候補フレームを選択することを特徴とする請求項7または8に記載のプログラム。 - 前記第1のフレームが前記所定の条件を満たさない場合、前記第2のフレームは決定されないことを特徴とする請求項1乃至10のいずれか1項に記載のプログラム。
- 前記所定の特徴量は、フレームに含まれている人物の目瞑りに関する特徴量または前記フレームにおけるボケまたはブレに関する特徴量であることを特徴とする請求項1乃至11のいずれか1項に記載のプログラム。
- 動画像から出力対象の候補のフレームを選択する画像処理装置であって、
前記動画像に含まれているフレームを解析する解析手段と、
前記解析手段による解析の結果に基づいて、前記出力対象の候補としての候補フレームを選択する選択手段と、
を有し、
前記動画像に含まれているフレームのうち、フレーム間予測を用いずに符号化されるフレームである第1のフレームが所定の特徴量に関する所定の条件を満たす場合、前記解析手段は、前記動画像に含まれ且つ前記フレーム間予測を用いて符号化されるフレームである第2のフレームを解析し、前記選択手段は、前記第1のフレームの前記解析手段による解析の結果と、前記第2のフレームの前記解析手段による解析の結果とに基づき、前記第1のフレームと前記第2のフレームから前記候補フレームを選択し、
前記第1のフレームが前記所定の条件を満たさない場合、前記解析手段は、前記第2のフレームを解析せず、前記選択手段は、前記第1のフレームを前記候補フレームとして選択することを特徴とする画像処理装置。 - 動画像から出力対象の候補のフレームを選択する画像処理方法であって、
前記動画像に含まれているフレームのうち、フレーム間予測を用いずに符号化されるフレームである第1のフレームを解析する第1の解析工程と、
前記第1のフレームが所定の特徴量に関する所定の条件を満たす場合、前記動画像に含まれ且つ前記フレーム間予測を用いて符号化されるフレームである第2のフレームを解析し、前記第1のフレームが前記所定の条件を満たさない場合、前記第2のフレームを解析しない第2の解析工程と、
前記第1のフレームが所定の特徴量に関する所定の条件を満たす場合、前記第1のフレームの前記第1の解析工程における解析の結果と、前記第2のフレームの前記第2の解析工程における解析の結果とに基づき、前記第1のフレームと前記第2のフレームから出力対象の候補として候補フレームを選択し、前記第1のフレームが前記所定の条件を満たさない場合、前記第1のフレームを前記候補フレームとして選択する選択工程と、
を有することを特徴とする画像処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016239740A JP6866142B2 (ja) | 2016-12-09 | 2016-12-09 | プログラム、画像処理装置、および画像処理方法 |
US15/832,492 US10536625B2 (en) | 2016-12-09 | 2017-12-05 | Image processing apparatus, image processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016239740A JP6866142B2 (ja) | 2016-12-09 | 2016-12-09 | プログラム、画像処理装置、および画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018098579A JP2018098579A (ja) | 2018-06-21 |
JP6866142B2 true JP6866142B2 (ja) | 2021-04-28 |
Family
ID=62489768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016239740A Active JP6866142B2 (ja) | 2016-12-09 | 2016-12-09 | プログラム、画像処理装置、および画像処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10536625B2 (ja) |
JP (1) | JP6866142B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7792335B2 (en) | 2006-02-24 | 2010-09-07 | Fotonation Vision Limited | Method and apparatus for selective disqualification of digital images |
US8660175B2 (en) * | 2007-12-10 | 2014-02-25 | Qualcomm Incorporated | Selective display of interpolated or extrapolated video units |
US10664687B2 (en) * | 2014-06-12 | 2020-05-26 | Microsoft Technology Licensing, Llc | Rule-based video importance analysis |
-
2016
- 2016-12-09 JP JP2016239740A patent/JP6866142B2/ja active Active
-
2017
- 2017-12-05 US US15/832,492 patent/US10536625B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018098579A (ja) | 2018-06-21 |
US20180167552A1 (en) | 2018-06-14 |
US10536625B2 (en) | 2020-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111031346B (zh) | 一种增强视频画质的方法和装置 | |
CN108259939B (zh) | 新视频推送控制方法、装置及服务器 | |
JP2020510892A5 (ja) | ||
CN112866799B (zh) | 一种视频抽帧处理方法、装置、设备及介质 | |
US11101818B2 (en) | Method and device for storing time series data with adaptive length encoding | |
CN106027893A (zh) | 控制Live Photo生成的方法、装置及电子设备 | |
Chen et al. | Model order selection in reversible image watermarking | |
CN111310744A (zh) | 图像识别方法、视频播放方法、相关设备及介质 | |
CN113194320A (zh) | 参数预测模型的训练方法及装置和参数预测方法及装置 | |
CN109361927A (zh) | 图像处理方法及装置 | |
CN105898373A (zh) | 视频切片方法和装置 | |
JP5029543B2 (ja) | 符号化装置および符号化プログラム | |
CN107203764A (zh) | 长微博图片识别方法和装置 | |
CN110166770B (zh) | 视频编码方法、装置、计算机设备和存储介质 | |
JP6866142B2 (ja) | プログラム、画像処理装置、および画像処理方法 | |
JP2009077112A (ja) | 画像再生装置、画像再生装置の制御方法および制御プログラム | |
US10339427B2 (en) | Subject evaluation system, subject evaluation method and recording medium storing subject evaluation program | |
JPWO2020185429A5 (ja) | ||
JP6626319B2 (ja) | 符号化装置、撮像装置、符号化方法、及びプログラム | |
CN113747159B (zh) | 一种生成可变帧率视频媒体文件的方法、装置及相关组件 | |
JP2010204892A (ja) | 映像解析装置,映像解析方法および映像解析プログラム | |
Murashko | Using machine learning to select and optimise multiple objectives in media compression | |
CN109829378B (zh) | 道路抛撒行为的识别方法、装置及电子设备 | |
JP2012044390A (ja) | 映像要約装置および映像要約プログラム | |
JP2012022413A (ja) | 画像処理装置、画像処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201029 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210309 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210407 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6866142 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |