JP4664432B2 - ショットサイズ識別装置及び方法、電子機器、並びにコンピュータプログラム - Google Patents

ショットサイズ識別装置及び方法、電子機器、並びにコンピュータプログラム Download PDF

Info

Publication number
JP4664432B2
JP4664432B2 JP2009510680A JP2009510680A JP4664432B2 JP 4664432 B2 JP4664432 B2 JP 4664432B2 JP 2009510680 A JP2009510680 A JP 2009510680A JP 2009510680 A JP2009510680 A JP 2009510680A JP 4664432 B2 JP4664432 B2 JP 4664432B2
Authority
JP
Japan
Prior art keywords
shot
edge
shot size
frame
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009510680A
Other languages
English (en)
Other versions
JPWO2008129643A1 (ja
Inventor
宏 岩村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corp filed Critical Pioneer Corp
Publication of JPWO2008129643A1 publication Critical patent/JPWO2008129643A1/ja
Application granted granted Critical
Publication of JP4664432B2 publication Critical patent/JP4664432B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/42Analysis of texture based on statistical description of texture using transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20056Discrete and fast Fourier transform, [DFT, FFT]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)
  • Electron Beam Exposure (AREA)

Description

本発明は、例えば、ビデオ等の動画におけるショットサイズを識別するショットサイズ識別装置及び方法、電子機器、並びにコンピュータプログラムに関する。
この種の装置における識別方法では、例えば被写体の遠方からの撮影により、被写体全体が撮影されているショット或いはフレーム画像を、映像中におけるロングショットとして識別する。又、例えば被写体の近くからの撮影により、被写体の一部がアップに撮影されているショット或いはフレーム画像を、映像中におけるアップショットとして識別する。そして、ロングショット及びアップショットの中間をミドルショットとして識別する。このようなショットサイズの識別を自動的に行うことによって、映像編集作業の効率化が図られる。例えば、非特許文献1には、カメラワーク検出及びアクティブ探索法を適用して、ショットの包含関係を判定して、該判定された包含関係に基づいて、ショットサイズを付与する技術が記載されている。
「映像編集支援システムのためのショットサイズ自動付与」電子情報通信学会論文誌、Vol.J85−D−I, No.7, pp.592−602, 2002
しかしながら、上述の背景技術によれば、アクティブ探索法によってズーム比率を検出しているため、情報処理の量が多くなると共に、異なるショットの前後で同一被写体が、同じようなアングルで写っていなければならないという技術的問題点がある。また、同一ショット内において、カメラと被写体との距離が変化すると対応できないという技術的問題点がある。更に、カメラワーク検出によって包含関係を判定しているため、誤検出が伝播する可能性があるという技術的問題点がある。
本発明は、例えば上記問題点に鑑みてなされたものであり、簡便且つ迅速にショットサイズを識別することができるショットサイズ識別装置及び方法、電子機器、並びにコンピュータプログラムを提供することを課題とする。
本発明の第1のショットサイズ識別装置は、上記課題を解決するために、映像を構成するフレーム内に存在するエッジを検出するエッジ検出手段と、前記検出されたエッジが連結してなる連結エッジ領域を検出する連結エッジ領域検出手段と、前記検出された連結エッジ領域の総数であるエッジ領域数を前記フレーム毎に計数するエッジ領域計数手段と、前記計数されたエッジ領域数が第1エッジ領域数閾値より大きい場合に、前記フレームをロングショットとして特定するショットサイズ特定手段とを備える。
本発明の第1のショットサイズ識別装置によれば、動作時には、先ず、例えばプロセッサ、メモリ等を備えてなる、エッジ検出手段によって、フレームのエッジが、フレーム毎に検出される。ここに「フレーム」とは、フレーム周波数で差し替えられることで一連の映像情報を構成する複数のフレーム画像の一つ一つを意味し、フレームは、通常一枚の静止画をなす。「エッジ」とは、各フレーム内において該各フレームを複数の領域に分けてみた際に、任意の一つの領域における画像データの値がこれに隣接又は近接する一又は複数の領域における画素データと比べて、予め設定された基準に照らして大きく変化する箇所を意味する。エッジは、典型的には、各フレーム内において、画素データの一つとしての輝度が大きく変化する箇所を意味する。このエッジは、例えば、一枚のフレームを構成する複数の画素のうち、注目している画素の輝度値と該注目している画素に隣接する画素の輝度値との差分値をとり、該差分値が所定閾値より大きいか否かによって検出すればよい。この際、輝度に代えて又は加えて彩度や色相が変化する箇所をエッジとして扱ってもよい。
尚、エッジの検出は、画素毎で行うことに限らず、例えば、複数の隣接画素からなる区画(例えば、横4画素×縦4画素)毎に行っても良い。区画毎に行う場合は、該区画に含まれる画素の輝度値のうちの最大値を区画の輝度値としてもよいし、平均値を区画の輝度値としてもよい。
続いて、例えばプロセッサ、メモリ等を備えてなる、連結エッジ領域検出手段によって、検出されたエッジが連結してなる連結エッジ領域が検出される。これにより、フレーム内に写っている人物や構造物等の輪郭を検出することができる。
続いて、例えばプロセッサ、メモリ等を備えてなるエッジ領域計数手段によって、検出された連結エッジ領域のエッジ領域数が計数される。
続いて、例えばプロセッサ、メモリ等を備えてなる、ショットサイズ特定手段によって、フレーム毎に計数されたエッジ領域数が第1エッジ領域数閾値より大きい場合に、フレームがロングショットとして特定される。逆に、計数されたエッジ領域数が第1エッジ領域数閾値より小さい場合には、フレームがロングショットとして特定されることはない。ここに「第1エッジ領域数閾値」とは、ロングショットであるか否かを決定する値であり、予め固定値として、又は何らかのパラメータに係る可変値として設定されている。この第1エッジ領域数閾値は、例えば60であり、確実にロングショットであると推定可能な値として設定されている。尚、本発明に係る「ロングショット」とは、予め設定される基準に照らして、被写体を遠方から、被写体全体が撮影されているフレームを意味する。即ち、ロングショットは、ミドルショットやアップショットと区別される相対的なものであり、どの程度離れて或いは近くから撮影されているショットをロングショットの範疇に含めるかについては、当該ショットサイズ認識の用途や仕様に応じて適宜設定される性質のものである。
本願発明者の研究によれば、一般に、ロングショットは、ミドルショットやアップショットに比べ、フレームに写っている人物や構造物の数が多いので、計数されるエッジ領域数が多いことが判明している。従って、第1エッジ領域数閾値は、アップショットは勿論、ミドルショットの際に計数されるエッジ領域数と比べて、ある程度大きく設定することが好ましい。これにより、誤った特定又は識別の可能性を低減することができる。
本発明の第1のショットサイズ識別装置では、エッジ検出を利用した統計処理の結果に従って、複数のフレーム間相互の関係を明らかにすることなく、フレームの単位で、ロングショットに係るものであるか否かを特定している。即ち、本発明では、フレームの単位でロングショットであるか否かを特定することに特化した処理を実行する。言い換えれば、複数のフレーム間相互の関係を明らかにするための、カメラワーク検出或いはアクティブ探索法等の複雑高度な処理等を実行することを要しない。本発明は、フレームの単位でロングショットであるか否かを特定するという目的を達成するための過程で、付加的或いは余分な情報が生成されることを極力排除することで、最低限或いはそれに近いデータ処理を経てこの本来の目的を達成していると言える。従って、一連の処理にかかる時間を短縮することができる。
以上の結果、本発明の第1のショットサイズ識別装置によれば、簡便且つ迅速にショットサイズを識別することができる。
本発明の第1のショットサイズ識別装置の一態様では、前記ショットサイズ特定手段は、前記計数されたエッジ領域数が、第1エッジ領域数閾値より大きいか否かを判定する判定手段と、前記第1エッジ領域数閾値より大きいと判定された場合に、前記フレームをロングショットとして識別するショットサイズ識別手段とを有する。
この態様では、ショットサイズ特定手段において、先ず、例えばプロセッサ、メモリ等を備えてなる、判定手段によって、計数されたエッジ領域数が、第1エッジ領域数閾値より大きいか否かが判定される。続いて、第1エッジ領域数閾値より大きいと判定された場合、例えばプロセッサ、メモリ等を備えてなる、ショットサイズ識別手段により、フレームがロングショットとして識別される。よって、計数されたエッジ領域数に基づいて、ショットサイズを極めて効率的に特定できる。
本発明の第1のショットサイズ識別装置の他の態様では、前記第1エッジ領域数閾値は、前記フレームに係るパラメータに基づいて決定される。
この態様によれば、第1エッジ領域数閾値は、例えば、フレームの解像度等のパラメータに基づいて決定されているので、例えば、ビデオカメラ等の撮影設定の影響を受けることなくショットサイズを識別することができ、実用上非常に有利である。
本発明の第1のショットサイズ識別装置の他の態様では、前記第1エッジ領域数閾値は、前記映像に係る所定統計値を示すパラメータに応じて可変である。
この態様によれば、第1エッジ領域数閾値は、例えば、映像を構成する複数のフレーム全てについての、或いは、現在までにショットサイズ識別に係る処理を行ったフレームについてのエッジ領域数の平均値及び標準偏差の和として、又は該和に応じた値として設定されている。例えば、映像の種類や属性が、今回の識別の対象とされている映像と同一又は類似である、過去における映像に統計値を採用すれば、最初からより適切な第1エッジ領域数閾値を設定可能となる。或いは、今回の識別の対象とされている映像自身の過去における統計値を採用すれば、将来的にはより適切な第1エッジ領域数閾値を設定可能となる。
本発明の第1のショットサイズ識別装置の他の態様では、前記ショットサイズ特定手段は、前記計数されたエッジ領域数が第2エッジ領域数閾値より小さい場合に、前記フレームをミドルショットとして特定する。
この態様によれば、ショットサイズ特定手段によって、計数されたエッジ領域数が第2エッジ領域数閾値より小さい場合に、フレームがミドルショットとして特定される。ここに、「第2エッジ領域数閾値」は、ミドルショットであるか否かを決定する値であり、予め固定値として、又は何らかのパラメータに応じた可変値として設定されている。この第2エッジ領域数閾値は、例えば20であり、ロングショットではないと推定可能な値として設定されている。
この態様では、前記第2エッジ領域数閾値は、前記第1エッジ領域数閾値より小さくてもよい。
このように構成すれば、確実にロングショットではないフレームを識別することができ、識別結果の信頼性を向上させることが可能となる。
本発明の第1のショットサイズ識別装置の他の態様では、前記フレームのノイズを除去するノイズ除去手段を更に備える。
この態様によれば、フレーム上に存在するノイズによって、エッジ領域の数が変動する可能性を低減することができ、識別結果の信頼性を向上させることが可能となる。
本発明の第2のショットサイズ識別装置は、上記課題を解決するために、映像を構成するフレーム内における平坦の程度を示す指標値を、前記フレームを構成する一画素又は複数の隣接画素からなる所定単位毎に演算する平坦演算手段と、前記演算された指標値を二値化する二値化手段と、前記二値化された指標値が同じである前記所定単位が連結してなる連結平坦領域のうち、前記所定単位の総数が所定閾値以上であるものを、大平坦領域として特定する大平坦領域特定手段と、前記特定された大平坦領域について、予め設定された複数の評価項目のうち少なくとも一つが所定の条件を満たす場合に、前記特定された大平坦領域を有する前記フレームをロングショットとして特定するショットサイズ特定手段とを備える。
本発明の第2のショットサイズ識別装置によれば、動作時には、先ず、例えばプロセッサ、メモリ等を備えてなる、平坦演算手段によって、映像を構成するフレーム画像の平坦の程度を示す指標値が、所定単位毎に演算される。ここに、本発明に係る「所定単位」とは、一枚のフレーム或いはフレーム画像を構成する一画素であってもよいし、複数の画素からなる区画(例えば、縦16画素×横16画素)であってもよい。
尚、本発明に係る「平坦」とは、注目している所定単位における、例えば濃度値や輝度値等の、パラメータと、注目している所定単位に隣接している、或いは、所定範囲内に存在する他の所定単位におけるパラメータとの差が小さいことを意味する。この平坦は、前述のエッジと対比される性質を持つ概念である。
また、本発明に係る「指標値」とは、平坦の程度を定量的に示す値であり、例えば濃度値や輝度値等の、一又は複数のパラメータを用いて、所定の演算式に従って求められる値である。この指標値は、具体的には例えば、注目している所定単位の所定パラメータの値と、該注目している所定単位に隣接している複数の所定単位の所定パラメータの値夫々との差分値の絶対値をとり、該絶対値の平均値として求めればよい。
続いて、例えばプロセッサ、メモリ等を備えてなる、二値化手段によって、演算された指標値が二値化される。二値化する際における閾値は、ある程度小さく設定することが好ましい。これにより、誤検出の可能性を低減することができる。尚、平坦なほど指標値が小さくなるので、二値化する際は、閾値より小さい場合を1とし、閾値より大きい場合を0とすればよい。
続いて、例えばプロセッサ、メモリ等を備えてなる、大平坦領域特定手段によって、二値化された指標値が同じである(典型的には、二値化後の値が1である)複数の所定単位が連結してなる連結平坦領域のうち、所定単位の総数が、所定閾値としての、予め設定された単位数閾値以上であるものが、大平坦領域として特定される。尚、連結平坦領域の検出又は特定は、例えば、ラベリング処理等により行われる。また、「単位数閾値」とは、大平坦領域か否かを決定する値であり、典型的には、予め固定値として設定されているが、何らかのパラメータに応じた可変値として設定されていてもよい。或いは、ユーザーがロングショットを定義して、手動で設定してもよい。この単位数閾値は、所定単位にもよるが、例えば、映像の解像度が縦480画素×横720画素、所定単位が、縦16画素×横16画素の区画である場合には、200区画程度であり、ロングショット候補であると推定可能な値として設定されている。
続いて、例えばプロセッサ、メモリ等を備えてなる、ショットサイズ特定手段によって、上記特定された大平坦領域について、予め設定された複数の評価項目のうち少なくとも一つが所定の条件を満たす場合に、上記特定された大平坦領域を有するフレームが、ロングショットとして特定される。逆に、上記特定された大平坦領域について、予め設定された複数の評価項目のうちいずれもが所定の条件を満たさない場合には、上記特定された大平坦領域を有するフレームが、ロングショットとして特定されることはない。ここに「評価項目」は、例えば、大平坦領域の形状やフレーム上の位置などである。また「所定の条件」とは、ロングショットであるか否かを決定する条件であり、確実にロングショットであると推定可能な条件として設定されている。
尚、特定された大平坦領域が複数存在する場合には、例えば、最も面積の大きい大平坦領域についての評価項目のうち少なくとも一つが所定の条件を満たす場合に、その大平坦領域を有するフレームが、ロングショットとして特定されるようにしてもよいし、複数領域を評価し、その複数領域の内少なくとも一つが評価項目のうち少なくとも一つの所定の条件を満たす場合に、その大平坦領域を有するフレームが、ロングショットとして特定されるようにしてもよい。
本発明の第2のショットサイズ識別装置では、二値化を利用した統計処理の結果に従って、複数のフレーム間相互の関係を明らかにすることなく、フレームの単位で、ロングショットに係るものであるか否かを特定している。従って、上述した本発明の第1のショットサイズ識別装置と同様に、一連の処理にかかる時間を短縮することができる。
以上の結果、本発明の第2のショットサイズ識別装置によれば、簡便且つ迅速にショットサイズを識別することができる。
本発明の第2のショットサイズ識別装置の一態様では、前記大平坦領域特定手段は、前記連結平坦領域を検出する連結平坦領域検出手段と、前記検出された連結平坦領域のうち、前記所定単位の数が前記単位数閾値以上であるものを大平坦領域として抽出する大平坦領域抽出手段とを有する。
この態様では、大平坦領域特定手段において、先ず、例えばプロセッサ、メモリ等を備えてなる、連結平坦領域検出手段によって、二値化された指標値が同じである所定単位が抽出され、該抽出された所定単位が連結してなる領域が検出される。続いて、例えばプロセッサ、メモリ等を備えてなる、大平坦領域抽出手段によって、検出された領域に含まれる所定単位の数が単位数閾値以上である領域が大領域として抽出される。よって、二値化された指標値に基づいて、大平坦領域を極めて効率的に特定できる。
本発明の第2のショットサイズ識別装置の他の態様では、前記ショットサイズ特定手段は、前記抽出された大平坦領域が、前記少なくとも一つが前記所定の条件を満たすか否かを判定する判定手段と、前記所定の条件を満たすと判定された場合に、前記抽出された大平坦領域を有するフレームを前記ロングショットとして識別するショットサイズ識別手段とを有する。
この態様では、ショットサイズ特定手段において、先ず、例えばプロセッサ、メモリ等を備えてなる、評価手段によって、抽出された大平坦領域に対し、複数の評価項目に夫々対応する複数の評価値が付与される。評価値は、例えば、形状である場合は、大領域に外接する矩形の横幅等である。或いは、フレーム上の位置である場合は、大平坦領域の重心のフレーム上における座標や、大平坦領域に外接する矩形の、一又は複数の頂点のフレーム上における座標等である。続いて、例えばプロセッサ、メモリ等を備えてなる、判定手段によって、付与された複数の評価値のうち少なくとも一つの評価値が、該評価値に対応する所定の条件を満たすか否かが判定される。続いて、所定の条件を満たすと判定された場合、例えばプロセッサ、メモリ等を備えてなる、ショットサイズ識別手段により、抽出された大平坦領域を有するフレームがロングショットとして識別される。よって、特定された大平坦領域に基づいて、ショットサイズを極めて効率的に特定できる。
本発明の第2のショットサイズ識別装置の他の態様では、前記複数の評価項目は、前記抽出された大平坦領域の面積と前記抽出された大平坦領域に外接する矩形の面積との面積比を含み、前記所定の条件は、前記面積比が面積比閾値以上である。
この態様によれば、複数の評価項目には、抽出された大領域の面積と該抽出された大領域に外接する矩形の面積との面積比が含まれている。この場合には、例えば評価手段は評価値として、面積比を付与する。
「面積比閾値」とは、ロングショットであるか否かを決定する値であり、典型的には、予め固定値として設定されているが、何らかのパラメータに応じた可変値として設定されていてもよい。この面積比閾値は、例えば0.4であり、確実にロングショットであると推定可能な値として設定されている。尚、「面積比」及び「面積比閾値」は、比に限らず、百分率や割合であってもよい。
本発明の第2のショットサイズ識別装置の他の態様では、前記複数の評価項目は、前記抽出された大平坦領域に外接する矩形の横幅を含み、前記所定の条件は、前記横幅が横幅閾値以上である。
この態様によれば、複数の評価項目には、抽出された大平坦領域に外接する矩形の横幅が含まれている。この場合には、例えば評価手段は評価値として、横幅を付与する。
「横幅閾値」とは、ロングショットであるか否かを決定する値であり、典型的には、予め固定値として設定されているが、何らかのパラメータに応じた可変値として設定されていてもよい。この横幅閾値は、例えば、映像の解像度が縦480画素×横720画素、所定単位が、縦16画素×横16画素の区画である場合には30ブロックであり、確実にロングショットであると推定可能な値として設定されている。尚、「横幅」及び「横幅閾値」は、絶対値であってもよいし、何らかのパラメータに対する比、割合、又は百分率であってもよい。
本発明の第2のショットサイズ識別装置の他の態様では、前記複数の評価項目は、前記抽出された大平坦領域の重心位置を含み、前記所定の条件は、前記重心位置が、所定範囲である。
この態様によれば、複数の評価項目には、抽出された大平坦領域の重心位置が含まれている。この場合には、例えば評価手段は評価値として、重心位置を付与する。尚、「重心位置」は、典型的には、フレームにおける座標値で表されている。「座標値」は、絶対値でもよいし、何らかのパラメータに対する、比、割合、又は百分率であってもよい。
「所定範囲」とは、ロングショットであるか否かを決定する範囲であり、典型的には、予め固定値として設定されているが、何らかのパラメータに応じた可変値として設定されていてもよい。この所定範囲は、例えば、フレームの上部3分の1以内、又は下部3分の1以内であり、確実にロングショットであると推定可能な範囲として設定されている。
本発明の第2のショットサイズ識別装置の他の態様では、前記平坦演算手段は、前記所定単位の各々に対し、周波数解析を行い、前記指標値を演算する。
この態様によれば、平坦演算手段は、フレームの所定単位における濃度値や輝度値を示す画像信号に対し周波数解析を行い、該行った周波数解析の結果に基づいて、低域周波数成分と該低域周波数成分を除いた高域周波数成分との比を求めて指標値とする。
この態様では、前記周波数解析は、二次元離散コサイン変換又は離散フーリエ変換を含んでいてもよい。
このように構成すれば、比較的効率良く精度の良い指標値を演算することができる。
本発明の第2のショットサイズ識別装置の他の態様では、前記検出された連結平坦領域の平坦領域数を計数する平坦領域数計数手段を更に備え、前記ショットサイズ特定手段は、前記少なくとも一つが前記所定の条件を満たす場合に、前記計数された平坦領域数が平坦領域数閾値以下であることを条件に、前記抽出された大平坦領域を有するフレームをロングショットとして特定する。
この態様によれば、例えばプロセッサ、メモリ等を備えてなる、平坦領域数計数手段は、検出された平坦領域の平坦領域数を計数する。本願発明者の研究によれば、例えば夜等の暗い場所で撮影された、或いは、例えば海岸等の比較的見晴らしの良い場所で撮影されたロングショットのフレームでは、比較的大きな領域を占める平坦領域が少数個検出されることが判明している。従って、検出された平坦領域の平坦領域数を計数することによって、ロングショットであるか否かを確実に判定することができ、特定結果の信頼性を向上させることが可能となる。
尚、「平坦領域数閾値」とは、ロングショットであるか否かを決定する値であり、典型的には、予め固定値として設定されているが、何らかのパラメータに応じた可変値として設定されていてもよい。この平坦領域数閾値は、確実にロングショットであると推定可能な値として設定されている。
本発明の第2のショットサイズ識別装置の他の態様では、前記フレームのエッジを検出するエッジ検出手段と、前記検出されたエッジが連結してなる連結エッジ領域を検出する連結エッジ領域検出手段と、前記検出された連結エッジ領域のエッジ領域数を計数するエッジ領域計数手段とを更に備え、前記ショットサイズ特定手段は、前記計数されたエッジ領域数が第1エッジ領域数閾値より大きい、又は前記特定された大平坦領域について、予め設定された複数の評価項目のうち少なくとも一つが所定の条件を満たす場合に、前記フレームをロングショットとして特定する。
この態様によれば、大平坦領域に基づくショットサイズの特定に加えて、連結エッジ領域に基づくショットサイズの特定も行っているため、ロングショットのフレームを取りこぼす可能性を低減することができ、実用上非常に有利である。
この態様では、前記ショットサイズ特定手段は、前記計数されたエッジ領域数が第2エッジ領域数閾値より小さく、且つ前記特定された大平坦領域についた、予め設定された複数の評価項目のうち少なくとも一つが所定の条件を満たす場合に、前記フレームをロングショットとして特定してもよい。
このように構成すれば、例えば夜等の暗い場所で撮影されたロングショットのフレームのようなエッジが検出されにくいフレームであっても、誤った特定又は識別、或いは、取りこぼしの可能性を低減することができ、実用上非常に有利である。
本発明の電子機器は、上記課題を解決するために、上述したショットサイズ識別装置(但し、その各種態様を含む)と、前記ショットサイズ特定手段による特定結果に応じて前記映像の再生、記録及び編集のうち少なくとも一つに関する所定種類の処理を、前記映像に対して施す処理手段とを備える。
本発明の電子機器によれば、上述した本発明に係るショットサイズ識別装置を具備してなるので、簡便且つ迅速にショットサイズを識別することができる。この結果、効率的な映像編集作業を可能とする、編集機能・撮影補助機能付ビデオカメラ、動画再生装置、ビデオ編集機、ビデオサーバ、ビデオストレージ機器等の各種電子機器を実現することができる。
本発明の第1のショットサイズ識別方法は、上記課題を解決するために、映像を構成するフレーム内に存在するエッジを検出するエッジ検出工程と、前記検出されたエッジが連結してなる連結エッジ領域を検出する連結エッジ領域検出工程と、前記検出された連結エッジ領域の総数であるエッジ領域数を前記フレーム毎に計数するエッジ領域計数工程と、前記計数されたエッジ領域数が第1エッジ領域数閾値より大きい場合に、前記フレームをロングショットとして特定するショットサイズ特定工程とを備える。
本発明の第1のショットサイズ識別方法によれば、上述した本発明の第1のショットサイズ識別装置と同様に、簡便且つ迅速にショットサイズを識別することができる。
尚、本発明の第1のショットサイズ識別方法においても、上述した本発明の第1のショットサイズ識別装置における各種態様と同様の各種態様を採ることが可能である。
本発明の第2のショットサイズ識別方法は、上記課題を解決するために、映像を構成するフレーム内における平坦の程度を示す指標値を、前記フレームを構成する一画素又は複数の隣接画素からなる所定単位毎に演算する平坦演算工程と、前記演算された指標値を二値化する二値化工程と、前記二値化された指標値が同じである前記所定単位が連結してなる連結平坦領域のうち、前記所定単位の総数が所定閾値以上であるものを、大平坦領域として特定する大平坦領域特定工程と、前記特定された大平坦領域について、予め設定された複数の評価項目のうち少なくとも一つが所定の条件を満たす場合に、前記特定された大平坦領域を有する前記フレームをロングショットとして特定するショットサイズ特定工程とを備える。
本発明の第2のショットサイズ識別方法によれば、上述した本発明の第2のショットサイズ識別装置と同様に、簡便且つ迅速にショットサイズを識別することができる。
尚、本発明の第2のショットサイズ識別方法においても、上述した本発明の第2のショットサイズ識別装置における各種態様と同様の各種態様を採ることが可能である。
本発明のコンピュータプログラムは、上記課題を解決するために、コンピュータを、上述した本発明のショットサイズ識別装置(但し、その各種態様を含む)として機能させる。
本実施形態のコンピュータプログラムによれば、当該コンピュータプログラムを格納するCD−ROM(Compact Disc Read Only Memory)、DVD−ROM(Digital Versatile Disc Read Only Memory)等の記録媒体から、当該コンピュータプログラムを、計測システムに備えられたコンピュータに読み込んで実行させれば、或いは、当該コンピュータプログラムを通信手段を介してダウンロードさせた後に実行させれば、上述した本発明のショットサイズ識別装置を比較的容易にして実現できる。これにより、上述した本発明のショットサイズ識別装置の場合と同様に、簡便且つ迅速にショットサイズを識別することができる。
本発明の作用及び他の利得は次に説明する実施するための最良の形態から明らかにされよう。
実施形態に係るビデオカメラの構成を示すブロック図である。 実施形態に係るフレーム画像における、ブロックの一例を図式的に示す概念図である。 実施形態に係る大平坦領域の評価項目の一例を示す概念図である。 実施形態に係るショットサイズ識別表の一例を示す概念図である。 実施形態に係るショットサイズ識別装置におけるエッジ領域ロングショット検出処理を示すフローチャートである。 実施形態に係るショットサイズ識別装置における平坦領域ロングショット検出処理を示すフローチャートである。 実施形態に係るショットサイズ識別装置におけるアップショット検出処理を示すフローチャートである。 実施形態に係るショットサイズ識別装置におけるショットサイズ識別処理を示すフローチャートである。
符号の説明
1 ビデオカメラ
10 ショットサイズ識別装置
20 撮影装置
30 制御部
40 記憶装置
50 表示装置
60 操作パネル
以下、本発明のショットサイズ識別装置を備える電子機器の一例としてのビデオカメラに係る実施形態を、図1乃至図8を参照して説明する。
先ず、図1を参照して本実施形態に係るビデオカメラの構成について説明する。図1は、本実施形態に係るビデオカメラの構成を示すブロック図である。
図1において、ビデオカメラ1は、ショットサイズ識別装置10、撮影装置20、制御部30、記憶装置40、表示装置50、及び操作パネル60を備えて構成されている。
ショットサイズ識別装置10は、ノイズ除去部101、エッジ検出部102、エッジ連結部103、エッジ数検出部104、平坦演算部105、二値化部106、平坦領域検出部107、大領域抽出部108、評価部109、判定部110、領域数計数部111、アップショット検出部112、及びショットサイズ識別部113を備えて構成されている。
ここに、本実施形態に係る「ノイズ除去部101」、「エッジ検出部102」、「エッジ連結部103」、「エッジ数検出部104」、「平坦演算部105」、「二値化部106」、「平坦領域検出部107」、「大領域抽出部108」、「判定部110」、「領域数計数部111」、及び「ショットサイズ識別部113」は、夫々、本発明に係る「ノイズ除去手段」、「エッジ検出手段」、「連結エッジ検出手段」、「エッジ領域数計数手段」、「平坦演算手段」、「二値化手段」、「連結平坦領域検出手段」、「大平坦領域抽出手段」、「判定手段」、「平坦領域数計数手段」、及び「ショットサイズ識別手段」の一例である。
撮影装置20は、例えば、レンズやCCD(Charge Coupled Device)を含んで構成されており、動画や、連続写真を撮影し、時間軸上で所定間隔或いは一定間隔で並ぶ複数の、本発明に係る「フレーム」の一例としてのフレーム画像を生成するように構成されている。記憶装置40は、例えば、HDD(Hard Disk Drive)や不揮発性のメモリであり、撮影装置20によって生成された動画等を逐次蓄える。
制御部30は、操作ボタン60によって受け付けられたユーザーからの指示に応じて、撮影装置20を制御したり、該撮影装置20によって撮影された動画等を、例えば、LCD(Liquid Crystal Display)等である、表示装置50に表示したり、或いは、撮影された動画等のショットサイズを識別するようにショットサイズ識別装置10を制御したりする。
操作ボタン60によって、ショットサイズ識別の要求が受け付けられた際に、制御部30は、記憶装置40に蓄えられている、動画(又は、連続写真)を読み込むようにショットサイズ識別装置10を制御する。
(エッジ領域ロングショット検出処理)
ノイズ除去部101は、ショットサイズ識別装置10の入力端子P1を介して読み込まれた動画のフレーム画像のノイズを、周知のノイズ除去法によって除去する。続いて、エッジ検出部102は、ノイズが除去されたフレーム画像に対し、周知のエッジ検出を行いエッジを検出する。
次に、エッジ連結部103は、検出されたエッジのうち、互いに連結しているエッジを一つの連結エッジ領域として検出する。続いて、エッジ数計数部104は、例えば、ラベリング処理を行う等して、検出された連結エッジ領域のエッジ領域数を計数する。
判定部110は、計数されたエッジ領域数が、第1エッジ領域数閾値より大きいか否かを判定する。第1エッジ領域数閾値より大きいと判定された場合、フレーム画像はロングショット候補であると判定される。尚、第1エッジ領域数閾値は、例えば、過去5フレーム程度のフレーム画像、又は全フレーム画像におけるエッジ領域数の平均値及び標準偏差の和であることが望ましいが、例えば、フレーム画像の解像度に基づいて決定される値であってもよい。
第1エッジ領域数閾値より小さいと判定された場合、判定部110は、続いて、計数されたエッジ領域数が、第1エッジ領域数閾値より小さい、第2エッジ領域数閾値より小さいか否かを判定する。第2エッジ領域数閾値より小さいと判定された場合、フレーム画像はミドルショット候補であると判定される。尚、第2エッジ領域数閾値も、第1エッジ領域数閾値と同様にして設定される。
第2エッジ領域数閾値より大きいと判定された場合、フレーム画像は、少なくともロングショットではないと判定される。
(平坦領域ロングショット検出処理)
平坦演算部105は、ショットサイズ識別装置10の入力端子P1を介して読み込まれた動画のフレーム画像の、本発明に係る「指標値」の一例としての平坦度を、本発明に係る「所定単位」の一例としてのブロック毎に演算する。
ここで、図2を参照して、ブロックについて説明を加える。ここに、図2は、本実施形態に係るフレーム画像における、ブロックの一例を図式的に示す概念図である。
図2(a)において、フレーム画像200は、複数のブロック201に区画されている。ブロック201は、図2(b)に示すように、フレーム画像200を構成している複数の画素201pを所定数(ここでは、縦16画素×横16画素)含んで構成されている。
尚、平坦演算部105は、典型的には、フレーム画像200を複数のブロック201に区画した際に、該ブロック201に含まれている複数の画素201p夫々の、濃度値や輝度値等の平均値を演算して各ブロックの濃度値や輝度値等としている。
このフレーム画像200上にある各ブロック201についての平坦度は、例えば、ブロック201aに注目すると、先ず、該ブロック201aの濃度値や輝度値等のうち一又は複数の所定パラメータの値と、隣接するブロック201bの所定パラメータの値との差分値の絶対値を求める。同様の処理をブロック201aに隣接するブロックについて行う。次に、求めた複数の差分値の絶対値の平均値を求めて、ブロック201aの平坦度とする。
尚、差分値を求める際、平坦演算部105は、各ブロック201の濃度値や輝度値等を示す映像信号に対し、二次元コサイン変換又は離散フーリエ変換等の周波数解析を行い、隣接するブロック間の低域周波数成分のパワーと、該低域周波数成分を除いた高域周波数成分のパワーとの比を求めて差分値としている。
再び、図1に戻り、二値化部106は、演算された平坦度を二値化する。平坦領域検出部107は、二値化された平坦度が同じであるブロックを抽出して、該抽出されたブロックが連結してなる連結平坦領域を検出する。具体的には、二値化されたフレーム画像200に対して、ラベリング処理を施して、平坦領域を検出している。
次に、大領域抽出部108は、検出された連結平坦領域に含まれるブロックの数が、本発明に係る「単位数閾値」の一例としてのブロック数閾値(例えば、200ブロック)以上である領域を大平坦領域として抽出する。
次に、評価部109は、抽出された大平坦領域に対し、複数の評価項目に夫々対応する複数の評価値を付与する。
ここで、図3を参照して、複数の評価項目について説明を加える。ここに、図3は、本実施形態に係る大平坦領域の評価項目の一例を示す概念図である。
評価部105は、フレーム画像200上の大平坦領域301に対し、該大平坦領域301の面積と該大平坦領域301に外接する外接矩形302の面積との面積比、外接矩形302の横幅302x、大平坦領域301の重心301gの重心位置等に対応する評価値を付与する。
再び、図1に戻り、領域数計数部111は、平坦領域検出部107によって検出された連結平坦領域の数を計数する。
判定部106は、大平坦領域301に対して付与された複数の評価値のうち少なくとも一つの評価値が、該評価値に対応する所定の条件を満たすか否かを判定する。ここで、所定の条件は、評価値が面積比である場合には、面積比閾値(例えば、0.4)以上である、横幅302xである場合には、横幅閾値(例えば、30ブロック)以上である、或いは、重心301gの重心位置である場合には、フレーム画像200の所定範囲内(例えば、重心301gがフレーム画像200の上部1/3又は下部1/3に存在している)である。
判定部106は、更に、領域数計数部111によって計数された平坦領域数が平坦領域数閾値(例えば、10)以下であるか否かを判定する。
少なくとも一つの評価値が所定の条件を満たすと判定され、且つ計数された平坦領域数が平坦領域数閾値以下であると判定された場合、大平坦領域301を有するフレーム画像200はロングショット候補であると判定される。一方、評価値が所定の条件を満たさない、又は係数された平坦領域数が平坦領域数閾値より大きいと判定された場合、フレーム画像200は、少なくともロングショットではないと判定される。
(アップショット検出処理)
アップショット検出部112は、ショットサイズ識別装置10の入力端子P1を介して読み込まれた動画のフレーム画像に対して、所定のアップショット検出を行い、アップショットを検出する。具体的には例えば、フレーム画像上の肌色領域を検出し、該肌色領域の面積・形状・位置等が夫々に対応する条件を満たすか否かを判定して、満たしていると判定された場合に、アップショットとして検出する。或いは、複数のフレーム画像の差分値から動物体を検出し、該動物体の面積・形状・位置等が夫々に対応する条件を満たすか否かを判定して、満たしていると判定された場合に、アップショット候補として検出する。
一方、満たしていないと判定された場合は、少なくともアップショットではないと判定される。
(ショットサイズ識別処理)
ショットサイズ識別部113は、上述したエッジ領域ロングショット検出処理、平坦領域ロングショット検出処理及びアップショット検出処理夫々の結果に基づいて、単純には、例えばショットサイズ識別部113の図示しないメモリに格納されている、図4に示すようなショットサイズ識別表を参照して、フレーム画像のショットサイズを識別する。
ここに、図4は、本実施形態に係るショットサイズ識別表の一例を示す概念図である。図4において、A、B及びCは、夫々、エッジ領域ロングショット検出処理、平坦領域ロングショット検出処理及びアップショット検出処理夫々の判定結果を示している。また、L、M及びUは、夫々、判定結果が「ロングショット候補」、「ミドルショット候補」及び「アップショット候補」であることを示している。また、×は、判定結果が「少なくともロングショットではない」又は「少なくともアップショットではない」であることを示している。
具体的には、ショットサイズ識別部113は、平坦領域ロングショット検出処理の結果が「ロングショット候補」であり、且つアップショット検出処理の結果が「少なくともアップショットではない」であるフレーム画像を、或いは、エッジ領域ロングショット検出処理の結果が「ロングショット候補」であり、且つ平坦領域ロングショット検出処理の結果が「少なくともロングショットではない」であり、且つアップショット検出処理の結果が「少なくともアップショットではない」であるフレーム画像をロングショットとして識別する。ショットサイズ識別部113は、出力端子P2を介して、結果を出力する。該出力された結果は、制御部30によって、表示装置50に表示され、或いは、記憶装置40に格納される。
エッジ領域ロングショット検出処理の結果が「ロングショット候補」であり、且つアップショット検出処理の結果が「アップショット候補」であるフレーム画像を「ロング/アップショット」として識別する。尚、この場合(即ち、図4において“◎”で示す場合)、フレーム画像を「ミドルショット」と識別してもよいし、ショットサイズ識別処理の対象から除外してもよい。
エッジ領域ロングショット検出処理の結果が「ミドルショット候補」であり、且つ平坦領域ロングショット検出処理の結果が「少なくともロングショットではない」であり、且つアップショット検出処理の結果が「少なくともアップショットではない」であるフレーム画像をミドルショットとして識別する。
エッジ領域ロングショット検出処理の結果が「ミドルショット候補」又は「少なくともロングショットではない」であり、且つアップショット検出処理の結果が「アップショット候補」であるフレーム画像をアップショットとして識別する。
エッジ領域ロングショット検出処理の結果及び平坦領域ロングショット検出処理の結果が「少なくともロングショットではない」であり、且つアップショット検出処理の結果が「少なくともアップショットではない」であるフレーム画像をミドルショットとして識別する。尚、この場合(即ち、図4において“▲”で示す場合)、フレーム画像をショットサイズ識別処理の対象から除外してもよい。
尚、図4に示すようなショットサイズ識別表に加えて又は代えて、エッジ領域ロングショット検出処理、平坦領域ロングショット検出処理及びアップショット検出処理夫々において検出又は計数された領域の面積や領域数等に応じて、フレーム画像のショットサイズを識別してもよい。
また、上記のようなフレーム画像毎のショットサイズ識別に加えて又は代えて、エッジ領域ロングショット検出処理、平坦領域ロングショット検出処理及びアップショット検出処理夫々の結果をあるショット区間で総合的に判断し、そのショット区間でのショットサイズとしても良い。具体的には、あるショット区間で最も多かったショットサイズ検出結果をそのショット区間でのショットサイズとして採用する。
或いは、例えばエッジ領域ロングショット検出処理の結果が「ロングショット候補」である場合を−5、平坦領域ロングショット検出処理の結果が「ロングショット候補」である場合を−4、エッジ領域ロングショット検出処理の結果が「ミドルショット候補」である場合を0、アップショット検出処理の結果が「アップショット候補」である場合を+4等とする。そして、各検出パラメータとショットサイズの関連度に応じて重みを付け、あるショット区間における重み付け平均値が−(マイナス)の数値であれば、そのショット区間をロングショットとして、±0であればミドルショットとして、+(プラス)の数値であればアップショットとして採用する等すればよい。またその平均値の絶対値を、検出結果の信頼度として扱っても良い。
尚、「ショット区間」とは、典型的には、ショットサイズが一定の区間を意味する。このショット区間の境界では、通常、カメラワークの切り替えが発生するため、周知のカメラワーク検出やシーンチェンジ検出等を用いて境界を検出してショット区間を検出すればよい。
以上の結果、本実施形態によれば、簡便且つ迅速にショットサイズを識別することができる。従って、映像編集作業を効率的に行うことができるビデオカメラ1を提供することが可能となる。
尚、図1を参照して説明した電子機器の他にも、動画再生装置、ビデオ編集機、ビデオサーバ、ビデオストレージ機器等が挙げられる。そして、これらの各種電子機器に適用可能なのは言うまでもない。
次に、以上のように構成されたビデオカメラ1が備えるショットサイズ識別装置10の動作について、図5乃至図8のフローチャートを参照して説明を加える。ここに、図5は、本実施形態に係るショットサイズ識別装置におけるエッジ領域ロングショット検出処理を示すフローチャートであり、図6は、平坦領域ロングショット検出処理を示すフローチャートであり、図7は、アップショット検出処理を示すフローチャートであり、図8は、ショットサイズ識別処理を示すフローチャートである。
図5において、先ず、ノイズ除去部101によって、読み込まれた動画を構成するフレーム画像のノイズが除去される(ステップS101)。次に、エッジ検出部102によって、エッジが検出される(ステップS102)。次に、エッジ連結部103によって、検出されたエッジのうち、互いに連結しているエッジを一つの連結エッジ領域として検出される(ステップS103)。
次に、エッジ数計数部104によって、検出された連結エッジ領域のエッジ領域数が計数される(ステップS104)。続いて、判定部110によって、計数されたエッジ領域数が第1エッジ領域数閾値より大きいか否かが判定される(ステップS105)。第1エッジ領域数閾値より大きいと判定された場合(ステップS105:Yes)、フレーム画像は「ロングショット候補」であると判定される(ステップS106)。
第1エッジ領域数閾値より小さいと判定された場合(ステップS105:No)、続いて、判定部110は、第2エッジ領域数閾値より小さいか否かを判定する(ステップS107)。第2エッジ領域数閾値より小さいと判定された場合(ステップS107:Yes)、フレーム画像は「ミドルショット候補」であると判定される(ステップS108)。
第2エッジ領域数閾値より大きいと判定された場合(ステップS107:No)、フレーム画像は、「少なくともロングショットではない」と判定される。
図6において、平坦演算部105は、読み込まれた動画を構成するフレーム画像の平坦度を、ブロック毎に演算する(ステップS201)。次に、二値化部106によって、演算された平坦度が二値化される(ステップS202)。次に、平坦領域検出部107によって、二値化された平坦度が同じであるブロックが抽出され、該抽出されたブロックが連結してなる連結平坦領域が検出される(ステップS203)。
次に、領域数計数部111によって、検出された連結平坦領域の平坦領域数が計数される(ステップS204)。平坦領域数の計数と相前後して、大平坦領域抽出部108によって、検出された連結平坦領域に含まれるブロックの数がブロック数閾値以上である連結平坦領域が大平坦領域として抽出される(ステップS205)。
次に、評価部109によって、抽出された大平坦領域に対して、複数の評価項目に夫々対応する複数の評価値が付与される(ステップS206)。続いて、判定部110によって、付与された評価値が所定の条件を満たしているか否かが判定される(ステップS207)。満たしていないと判定された場合(ステップS207:No)、フレーム画像は「少なくともロングショットではない」と判定される(ステップS210)。
満たしていると判定された場合(ステップS207:Yes)、続いて、判定部106によって、計数された平坦領域数が平坦領域数閾値以下であるか否かが判定される(ステップS208)。平坦領域数閾値より多いと判定された場合(ステップS208:No)、フレーム画像は「少なくともロングショットではない」と判定される(ステップS210)。
平坦領域数閾値以下であると判定された場合(ステップS208:Yes)、フレーム画像は「ロングショット候補」であると判定される(ステップS209)。尚、ステップS207及びS208の各処理は、相前後して行われてもよい。
図7において、アップショット検出部112によって、読み込まれた動画を構成するフレーム画像に対し、所定のアップショット検出処理が施される(ステップS301)。次に、アップショットを検出したか否かが判定され(ステップS302)、検出したと判定された場合(ステップS302:Yes)、フレーム画像を「アップショット候補」と判定する(ステップS303)。検出していないと判定された場合(ステップS302:No)、フレーム画像は「少なくともアップショットではない」と判定される(ステップS304)。
ショットサイズ識別部113は、エッジ領域ロングショット検出処理、平坦領域ロングショット検出処理及びアップショット検出処理夫々の結果に基づいて、以下に説明する処理を行い、フレーム画像のショットサイズを識別する。
図8において、先ず、平坦領域ロングショット検出処理の結果が、「ロングショット候補」であるか否かを判定される(ステップS401)。「ロングショット候補」であると判定された場合(ステップS401:Yes)、続いて、アップショット検出処理の結果が、「アップショット候補」であるか否かが判定される(ステップS402)。
アップショット検出処理の結果が、「アップショット候補」でないと判定された場合(ステップS402:No)、フレーム画像をロングショットとして識別して(ステップS409)、結果を出力すると共に、他のフレーム画像に対して処理を行う。
アップショット検出処理の結果が、「アップショット候補」であると判定された場合(ステップS402:Yes)、続いて、エッジ領域ロングショット検出処理の結果が、「ロングショット候補」であるか否かが判定される(ステップS403)。「ロングショット候補」であると判定された場合(ステップS403:Yes)、フレーム画像をロング/アップショットとして識別して(ステップS407)、結果を出力すると共に、他のフレーム画像に対して処理を行う。
一方、エッジ領域ロングショット検出処理の結果が、「ロングショット候補」でないと判定された場合、即ち、エッジ領域ロングショット検出処理の結果が「ミドルショット候補」又は「少なくともロングショットではない」である場合(ステップS403:No)、フレーム画像をアップショットとして識別して(ステップS408)、結果を出力すると共に、他のフレーム画像に対して処理を行う。
平坦領域検出処理の結果が、「ロングショット候補」でないと判定された場合(ステップS401:No)、続いて、エッジ領域ロングショット検出処理の結果が、「ロングショット候補」であるか否かが判定される(ステップS404)。「ロングショット候補」であると判定された場合(ステップS404:Yes)、続いて、アップショット検出処理の結果が「アップショット候補」であるか否かが判定される(ステップS405)。
アップショット検出処理の結果が、「アップショット候補」であると判定された場合(ステップS405:Yes)、フレーム画像をロング/アップショットとして識別して(ステップS407)、結果を出力すると共に、他のフレーム画像に対して処理を行う。一方、「アップショット候補」でないと判定された場合(ステップS405:No)、フレーム画像をロングショットとして識別して(ステップS409)、結果を出力すると共に、他のフレーム画像に対して処理を行う。
エッジ領域検出処理の結果が、「ロングショット候補」でないと判定された場合(ステップS404:No)、続いて、アップショット検出処理の結果が「アップショット候補」であるか否かが判定される(ステップS406)。「アップショット候補」であると判定された場合(ステップS406:Yes)、フレーム画像をアップショットとして識別して(ステップS408)、結果を出力すると共に、他のフレーム画像に対して処理を行う。
一方、アップショット検出処理の結果が、「アップショット候補」でないと判定された場合(ステップS406:No)、フレーム画像をミドルショットとして識別して(ステップS410)、結果を出力すると共に、他のフレーム画像に対して処理を行う。
尚、本発明は、上述した実施形態に限られるものではなく、請求の範囲及び明細書全体から読み取れる発明の要旨、或いは思想に反しない範囲で適宜変更可能であり、そのような変更を伴うショットサイズ識別装置及び方法、電子機器、並びにコンピュータプログラムもまた、本発明の技術的範囲に含まれるものである。

Claims (22)

  1. 映像を構成するフレーム内に存在するエッジを検出するエッジ検出手段と、
    前記検出されたエッジが連結してなる連結エッジ領域を検出する連結エッジ領域検出手段と、
    前記検出された連結エッジ領域の総数であるエッジ領域数を前記フレーム毎に計数するエッジ領域計数手段と、
    前記計数されたエッジ領域数が第1エッジ領域数閾値より大きい場合に、前記フレームをロングショットとして特定するショットサイズ特定手段と
    を備えることを特徴とするショットサイズ識別装置。
  2. 前記ショットサイズ特定手段は、
    前記計数されたエッジ領域数が、第1エッジ領域数閾値より大きいか否かを判定する判定手段と、
    前記第1エッジ領域数閾値より大きいと判定された場合に、前記フレームをロングショットとして識別するショットサイズ識別手段と
    を有することを特徴とする請求の範囲第1項に記載のショットサイズ識別装置。
  3. 前記第1エッジ領域数閾値は、前記フレームに係るパラメータに基づいて決定されることを特徴とする請求の範囲第1項に記載のショットサイズ識別装置。
  4. 前記第1エッジ領域数閾値は、前記映像に係る所定統計値を示すパラメータに応じて可変であることを特徴とする請求の範囲第1項に記載のショットサイズ識別装置。
  5. 前記ショットサイズ特定手段は、前記計数されたエッジ領域数が第2エッジ領域数閾値より小さい場合に、前記フレームをミドルショットとして特定することを特徴とする請求の範囲第1項に記載のショットサイズ識別装置。
  6. 前記第2エッジ領域数閾値は、前記第1エッジ領域数閾値より小さいことを特徴とする請求の範囲第5項に記載のショットサイズ識別装置。
  7. 前記フレームのノイズを除去するノイズ除去手段を更に備えることを特徴とする請求の範囲第1項に記載のショットサイズ識別装置。
  8. 映像を構成するフレーム内における平坦の程度を示す指標値を、前記フレームを構成する一画素又は複数の隣接画素からなる所定単位毎に演算する平坦演算手段と、
    前記演算された指標値を二値化する二値化手段と、
    前記二値化された指標値が同じである前記所定単位が連結してなる連結平坦領域のうち、前記所定単位の総数が所定閾値以上であるものを、大平坦領域として特定する大平坦領域特定手段と、
    前記特定された大平坦領域について、予め設定された複数の評価項目のうち少なくとも一つが所定の条件を満たす場合に、前記特定された大平坦領域を有する前記フレームをロングショットとして特定するショットサイズ特定手段と
    を備えることを特徴とするショットサイズ識別装置。
  9. 前記大平坦領域特定手段は、
    前記連結平坦領域を検出する連結平坦領域検出手段と、
    前記検出された連結平坦領域のうち、前記所定単位の数が前記単位数閾値以上であるものを大平坦領域として抽出する大平坦領域抽出手段と
    を有することを特徴とする請求の範囲第8項に記載のショットサイズ識別装置。
  10. 前記ショットサイズ特定手段は、
    前記抽出された大平坦領域が、前記少なくとも一つが前記所定の条件を満たすか否かを判定する判定手段と、
    前記所定の条件を満たすと判定された場合に、前記抽出された大平坦領域を有するフレームを前記ロングショットとして識別するショットサイズ識別手段と
    を有することを特徴とする請求の範囲第8項に記載のショットサイズ識別装置。
  11. 前記複数の評価項目は、前記抽出された大平坦領域の面積と該抽出された大平坦領域に外接する矩形の面積との面積比を含み、
    前記所定の条件は、前記面積比が面積比閾値以上である
    ことを特徴とする請求の範囲第8項に記載のショットサイズ識別装置。
  12. 前記複数の評価項目は、前記抽出された大平坦領域に外接する矩形の横幅を含み、
    前記所定の条件は、前記横幅が横幅閾値以上である
    ことを特徴とする請求の範囲第8項に記載のショットサイズ識別装置。
  13. 前記複数の評価項目は、前記抽出された大平坦領域の重心位置を含み、
    前記所定の条件は、前記重心位置が、所定範囲である
    ことを特徴とする請求の範囲第8項に記載のショットサイズ識別装置。
  14. 前記平坦演算手段は、前記所定単位の各々に対し、周波数解析を行い、前記指標値を演算することを特徴とする請求の範囲第8項に記載のショットサイズ識別装置。
  15. 前記周波数解析は、二次元離散コサイン変換又は離散フーリエ変換を含んでいることを特徴とする請求の範囲第14項に記載のショットサイズ識別装置。
  16. 前記検出された連結平坦領域の平坦領域数を計数する平坦領域数計数手段を更に備え、
    前記ショットサイズ特定手段は、前記少なくとも一つが前記所定の条件を満たす場合に、前記計数された平坦領域数が平坦領域数閾値以下であることを条件に、前記抽出された大平坦領域を有するフレームをロングショットとして特定する
    ことを特徴とする請求の範囲第8に記載のショットサイズ識別装置。
  17. 前記フレームのエッジを検出するエッジ検出手段と、
    前記検出されたエッジが連結してなる連結エッジ領域を検出する連結エッジ領域検出手段と、
    前記検出された連結エッジ領域のエッジ領域数を計数するエッジ領域計数手段と
    を更に備え、
    前記ショットサイズ特定手段は、前記計数されたエッジ領域数が第1エッジ領域数閾値より大きい、又は前記特定された大平坦領域について、予め設定された複数の評価項目のうち少なくとも一つが所定の条件を満たす場合に、前記フレームをロングショットとして特定する
    ことを特徴とする請求の範囲第8項に記載のショットサイズ識別装置。
  18. 前記ショットサイズ特定手段は、前記計数されたエッジ領域数が第2エッジ領域数閾値より小さく、且つ前記特定された大平坦領域についた、予め設定された複数の評価項目のうち少なくとも一つが所定の条件を満たす場合に、前記フレームをロングショットとして特定することを特徴とする請求の範囲第17項に記載のショットサイズ識別装置。
  19. 請求項1乃至18のいずれか一項に記載のショットサイズ識別装置と、
    前記ショットサイズ特定手段による特定結果に応じて前記映像の再生、記録及び編集のうち少なくとも一つに関する所定種類の処理を、前記映像に対して施す処理手段と
    を備えることを特徴とする電子機器。
  20. 映像を構成するフレーム内におけるエッジを検出するエッジ検出工程と、
    前記検出されたエッジが連結してなる連結エッジ領域の総数であるエッジ領域数を前記フレーム毎に計数するエッジ領域計数工程と、
    前記計数されたエッジ領域数が第1エッジ領域数閾値より大きい場合に、前記フレームをロングショットとして特定するショットサイズ特定工程と
    を備えることを特徴とするショットサイズ識別方法。
  21. 映像を構成するフレーム内における平坦の程度を示す指標値を、前記フレームを構成する一画素又は複数の隣接画素からなる所定単位毎に演算する平坦演算工程と、
    前記演算された指標値を二値化する二値化工程と、
    前記二値化された指標値が同じである前記所定単位が連結してなる連結平坦領域のうち、前記所定単位の総数が所定閾値以上であるものを、大平坦領域として特定する大平坦領域特定工程と、
    前記特定された大平坦領域について、予め設定された複数の評価項目のうち少なくとも一つが所定の条件を満たす場合に、前記特定された大平坦領域を有する前記フレームをロングショットとして特定するショットサイズ特定工程と
    を備えることを特徴とするショットサイズ識別方法。
  22. コンピュータを、請求項1乃至18のいずれか一項に記載のショットサイズ識別装置として機能させることを特徴とするコンピュータプログラム。
JP2009510680A 2007-04-13 2007-04-13 ショットサイズ識別装置及び方法、電子機器、並びにコンピュータプログラム Expired - Fee Related JP4664432B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2007/058158 WO2008129643A1 (ja) 2007-04-13 2007-04-13 ショットサイズ識別装置及び方法、電子機器、並びにコンピュータプログラム

Publications (2)

Publication Number Publication Date
JPWO2008129643A1 JPWO2008129643A1 (ja) 2010-07-22
JP4664432B2 true JP4664432B2 (ja) 2011-04-06

Family

ID=39875191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009510680A Expired - Fee Related JP4664432B2 (ja) 2007-04-13 2007-04-13 ショットサイズ識別装置及び方法、電子機器、並びにコンピュータプログラム

Country Status (3)

Country Link
US (1) US20100201880A1 (ja)
JP (1) JP4664432B2 (ja)
WO (1) WO2008129643A1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4858609B2 (ja) * 2007-02-27 2012-01-18 日本電気株式会社 ノイズ低減装置、ノイズ低減方法、及びノイズ低減プログラム
TW201316761A (zh) * 2011-10-14 2013-04-16 Novatek Microelectronics Corp 影像畫面的黑邊偵測方法與影像處理裝置
CN103079028A (zh) * 2011-10-25 2013-05-01 联咏科技股份有限公司 图像画面的黑边检测方法与图像处理装置
US9070019B2 (en) 2012-01-17 2015-06-30 Leap Motion, Inc. Systems and methods for capturing motion in three-dimensional space
US8638989B2 (en) 2012-01-17 2014-01-28 Leap Motion, Inc. Systems and methods for capturing motion in three-dimensional space
US9501152B2 (en) 2013-01-15 2016-11-22 Leap Motion, Inc. Free-space user interface and control using virtual constructs
US8693731B2 (en) 2012-01-17 2014-04-08 Leap Motion, Inc. Enhanced contrast for object detection and characterization by optical imaging
US10691219B2 (en) 2012-01-17 2020-06-23 Ultrahaptics IP Two Limited Systems and methods for machine control
US11493998B2 (en) 2012-01-17 2022-11-08 Ultrahaptics IP Two Limited Systems and methods for machine control
US9679215B2 (en) 2012-01-17 2017-06-13 Leap Motion, Inc. Systems and methods for machine control
JP5323222B2 (ja) * 2012-03-09 2013-10-23 株式会社東芝 画像処理装置、画像処理方法および画像処理プログラム
US9285893B2 (en) 2012-11-08 2016-03-15 Leap Motion, Inc. Object detection and tracking with variable-field illumination devices
US10609285B2 (en) 2013-01-07 2020-03-31 Ultrahaptics IP Two Limited Power consumption in motion-capture systems
US9465461B2 (en) 2013-01-08 2016-10-11 Leap Motion, Inc. Object detection and tracking with audio and optical signals
US9696867B2 (en) 2013-01-15 2017-07-04 Leap Motion, Inc. Dynamic user interactions for display control and identifying dominant gestures
US9459697B2 (en) 2013-01-15 2016-10-04 Leap Motion, Inc. Dynamic, free-space user interactions for machine control
US9702977B2 (en) 2013-03-15 2017-07-11 Leap Motion, Inc. Determining positional information of an object in space
US10620709B2 (en) 2013-04-05 2020-04-14 Ultrahaptics IP Two Limited Customized gesture interpretation
US9916009B2 (en) 2013-04-26 2018-03-13 Leap Motion, Inc. Non-tactile interface systems and methods
US9747696B2 (en) 2013-05-17 2017-08-29 Leap Motion, Inc. Systems and methods for providing normalized parameters of motions of objects in three-dimensional space
US10281987B1 (en) 2013-08-09 2019-05-07 Leap Motion, Inc. Systems and methods of free-space gestural interaction
US9721383B1 (en) 2013-08-29 2017-08-01 Leap Motion, Inc. Predictive information for free space gesture control and communication
US9632572B2 (en) 2013-10-03 2017-04-25 Leap Motion, Inc. Enhanced field of view to augment three-dimensional (3D) sensory space for free-space gesture interpretation
US9996638B1 (en) 2013-10-31 2018-06-12 Leap Motion, Inc. Predictive information for free space gesture control and communication
US9613262B2 (en) 2014-01-15 2017-04-04 Leap Motion, Inc. Object detection and tracking for providing a virtual device experience
JP6339811B2 (ja) * 2014-01-27 2018-06-06 株式会社メガチップス ノイズ判定装置、ノイズ判定方法
CN204480228U (zh) 2014-08-08 2015-07-15 厉动公司 运动感测和成像设备
US10429923B1 (en) 2015-02-13 2019-10-01 Ultrahaptics IP Two Limited Interaction engine for creating a realistic experience in virtual reality/augmented reality environments
US9696795B2 (en) 2015-02-13 2017-07-04 Leap Motion, Inc. Systems and methods of creating a realistic grab experience in virtual reality/augmented reality environments
CN105573747B (zh) * 2015-12-10 2018-11-06 小米科技有限责任公司 用户界面的测试方法及装置
CN108172199B (zh) * 2017-12-29 2019-09-17 Oppo广东移动通信有限公司 显示方法、显示装置、电子设备和计算机可读存储介质
US11875012B2 (en) 2018-05-25 2024-01-16 Ultrahaptics IP Two Limited Throwable interface for augmented reality and virtual reality environments
CN109741357A (zh) * 2018-12-19 2019-05-10 浙江大学 一种基于图像处理的油菜花序计数方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004064504A (ja) * 2002-07-30 2004-02-26 Ricoh Co Ltd 撮像装置
JP2006251885A (ja) * 2005-03-08 2006-09-21 Kddi Corp スポーツ映像の分類装置およびログ生成装置
JP2007013478A (ja) * 2005-06-29 2007-01-18 Matsushita Electric Ind Co Ltd 情報処理装置、方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963676A (en) * 1997-02-07 1999-10-05 Siemens Corporate Research, Inc. Multiscale adaptive system for enhancement of an image in X-ray angiography
WO1999057683A1 (en) * 1998-05-04 1999-11-11 The Johns Hopkins University Method and apparatus for segmenting small structures in images
EP2302595A3 (en) * 1998-11-25 2011-04-06 Wake Forest University Health Sciences Virtual endoscopy with improved image segmentation and lesion detection
JP3555607B2 (ja) * 2001-11-29 2004-08-18 ミノルタ株式会社 オートフォーカス装置
US7039232B2 (en) * 2001-12-20 2006-05-02 Xerox Corporation Block level analysis of segmentation tags
US7343032B2 (en) * 2005-09-01 2008-03-11 Fujifilm Corporation Method and apparatus for automatic and dynamic vessel detection
WO2007036823A2 (en) * 2005-09-29 2007-04-05 Koninklijke Philips Electronics N.V. Method and apparatus for determining the shot type of an image
WO2007049381A1 (ja) * 2005-10-27 2007-05-03 Mitsubishi Electric Corporation 映像要約装置
KR100785952B1 (ko) * 2006-03-30 2007-12-14 한국정보통신대학교 산학협력단 멀티미디어 이동형 단말을 위한 운동경기 비디오의 지능적디스플레이 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004064504A (ja) * 2002-07-30 2004-02-26 Ricoh Co Ltd 撮像装置
JP2006251885A (ja) * 2005-03-08 2006-09-21 Kddi Corp スポーツ映像の分類装置およびログ生成装置
JP2007013478A (ja) * 2005-06-29 2007-01-18 Matsushita Electric Ind Co Ltd 情報処理装置、方法

Also Published As

Publication number Publication date
WO2008129643A1 (ja) 2008-10-30
JPWO2008129643A1 (ja) 2010-07-22
US20100201880A1 (en) 2010-08-12

Similar Documents

Publication Publication Date Title
JP4664432B2 (ja) ショットサイズ識別装置及び方法、電子機器、並びにコンピュータプログラム
US8335350B2 (en) Extracting motion information from digital video sequences
CN109949347B (zh) 人体跟踪方法、装置、系统、电子设备和存储介质
US8384787B2 (en) Method for providing a stabilized video sequence
US9311533B2 (en) Device and method for detecting the presence of a logo in a picture
JP4489120B2 (ja) デジタル映像のアーティファクト削減
US20080260288A1 (en) Creating a Depth Map
CN111695540B (zh) 视频边框识别方法及裁剪方法、装置、电子设备及介质
WO2014044158A1 (zh) 一种图像中的目标物体识别方法及装置
JP2008527525A (ja) グラフィカルなオブジェクトを検出するための方法及び電子装置
JP2012038318A (ja) ターゲット検出方法及び装置
US10817744B2 (en) Systems and methods for identifying salient images
JP6720845B2 (ja) 画像処理装置、画像処理方法及びプログラム
US9094617B2 (en) Methods and systems for real-time image-capture feedback
US8218823B2 (en) Determining main objects using range information
WO2018058573A1 (zh) 对象检测方法、对象检测装置以及电子设备
JP5983749B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP6221283B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JPH07249128A (ja) 車両用画像処理装置
JP4960442B2 (ja) アップショット検出装置及び方法、電子機器、並びにコンピュータプログラム
CN112991419B (zh) 视差数据生成方法、装置、计算机设备及存储介质
JP6348020B2 (ja) 画像処理装置、画像処理方法およびそれを用いた検査方法。
EP2570962A1 (en) Video analysis
WO2024197514A1 (zh) 一种视频脏点检测的方法、设备及电子设备
US20130223729A1 (en) Identifying points of interest in an image

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110106

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140114

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees