JP4915860B2 - 動画像分類装置 - Google Patents

動画像分類装置 Download PDF

Info

Publication number
JP4915860B2
JP4915860B2 JP2007084710A JP2007084710A JP4915860B2 JP 4915860 B2 JP4915860 B2 JP 4915860B2 JP 2007084710 A JP2007084710 A JP 2007084710A JP 2007084710 A JP2007084710 A JP 2007084710A JP 4915860 B2 JP4915860 B2 JP 4915860B2
Authority
JP
Japan
Prior art keywords
moving image
input
absence
amateur
taken
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007084710A
Other languages
English (en)
Other versions
JP2008245040A (ja
Inventor
勝 菅野
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2007084710A priority Critical patent/JP4915860B2/ja
Priority to US12/053,779 priority patent/US20080240580A1/en
Publication of JP2008245040A publication Critical patent/JP2008245040A/ja
Application granted granted Critical
Publication of JP4915860B2 publication Critical patent/JP4915860B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Studio Devices (AREA)

Description

本発明は、動画像分類装置に関し、特に、プロカメラマンが撮影した動画像かアマチュアが撮影した動画像かを推定して分類する動画像分類装置に関する。
プロカメラマンが撮影し、テレビ番組で放送された動画像が動画像投稿サイトなどに無断で投稿されることが問題になっている。このような動画像の投稿は、著作権侵害が分かった段階で、早急に削除されるのが望ましく、それを補助するために、プロカメラマンが撮影した動画像かアマチュアが撮影した動画像かを推定して分類する動画像分類装置が望まれる。
非特許文献1には、静止画像(写真)を対象としてプロカメラマンが撮影した写真かアマチュアが撮影した写真かを推定して分類する技術が開示されている。ここでは、写真におけるエッジ部分の空間的な分布、色の分布、色調の数、ボケ、コントラスト及び明るさをベイズ識別器を用いて判定し、この判定結果に基づいて、プロカメラマンが撮影した写真かアマチュアが撮影した写真かを推定して分類する。
画像を露出条件、コントラスト、ボケ、ブレ具合の観点から評価することも知られている。例えば、特許文献1には、デジタルカメラなどの画像撮影装置において、記録媒体の残り容量が低いときに、既に記録済みの画像を露出条件、コントラスト、ボケ、ブレ具合の観点から評価し、この評価結果に基づいて記録媒体から削除する画像の候補を決定することが記載されている。
特開2006−50497号公報 The Design of High-Level Features for photo Quality Assessment」,IEEE International Conference on Computer Vision and Pattern Recognition 2006.
非特許文献1に開示された技術は、静止画像のみを対象としたものであり、これをそのまま動画像の分類に適用した場合、プロカメラマンとアマチュアとの差異として生じる動画像の特徴を何ら利用しないので、分類精度上の問題がある。
特許文献1に開示された技術は、デジタルカメラの記録媒体に記録された画像の中からの不要な画像の消去を意図するものであり、プロカメラマンが撮影したものかアマチュアが撮影したものかを推定し、分類することを意図しない。
動画像を対象とし、プロカメラマンとアマチュアとの差異として生じる動画像の特徴を利用して、プロカメラマンが撮影したものかアマチュアが撮影したものかを推定し、分類する技術は知られていない。
本発明の目的は、プロカメラマンにより撮影された動画像かアマチュアにより撮影された動画像かを精度良く推定して分類する動画像分類装置を提供することにある。
上記目的を達成するため、本発明は、入力動画像の特徴を解析する動画像解析手段と、前記動画像解析手段による解析結果を基に、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかを推定して分類する動画像分類手段を具備し、前記動画像解析手段は、入力動画像における画面切り替わりを検出し、検出された画面切り替わりの単位時間当たりの頻度を解析結果として前記動画像分類装置に送出する画面切り替わり頻度測定手段を備え、前記動画像分類手段は、前記画面切り替わり頻度測定手段から解析結果として送出された画面切り替わりの単位時間当たりの頻度が所定閾値以上であるか否かを判定し、画面切り替わりの単位時間当たりの頻度が所定閾値以上と判定した場合に、当該入力画像はプロカメラマンにより撮影されたものであると推定して分類し、それ以外の場合には、当該入力画像はアマチュアにより撮影されたものであると推定して分類する点に第1の特徴がある。
また、本発明は、前記動画像解析手段が、さらに、所定フレーム数に亘って手ブレの有無を判定し、その判定結果を解析結果として前記動画像分類装置に送出する手ブレ有無判定手段を備え、
前記動画像解析手段は、さらに手ブレ有無判定手段からの所定フレーム数に亘って手ブレが無いという解析結果を条件として、当該入力動画像はプロカメラマンにより撮影されたものであると推定して分類し、それ以外の場合には、当該入力画像はアマチュアにより撮影されたものであると推定して分類する点に第2の特徴がある。
また、本発明は、前記動画像解析手段が、さらに、画面のボケの有無を判定し、その判定結果を解析結果として前記動画像分類手段に送出するボケ有無判定手段とコントラストを測定し、その測定結果を解析結果として前記動画像分類手段に送出するコントラスト測定手段の少なくとも一方を備え、前記動画像解析手段が前記ボケ有無判定手段と前記コントラスト測定手段のうちのボケ有無判定手段だけを備える場合、前記動画像分類手段は、さらに前記ボケ有無判定手段からのボケが無いという解析結果を条件として、当該入力画像はプロカメラマンにより撮影されたものであると推定して分類し、それ以外の場合には、当該入力画像はアマチュアにより撮影されたものであると推定して分類し、前記動画像解析手段が前記ボケ有無判定手段と前記コントラスト測定手段のうちの前記コントラスト測定手段だけを備える場合、前記動画像分類手段は、さらに前記コントラスト測定手段から送出される解析結果としてのコントラストが所定閾値以上か否かを判定し、コントラストが所定閾値以上と判定したことを条件として、当該入力画像はプロカメラマンにより撮影されたものであると推定して分類し、それ以外の場合には、当該入力画像はアマチュアにより撮影されたものであると推定して分類し、前記動画像解析手段が前記ボケ有無判定手段と前記コントラスト測定手段の双方を備える場合、前記動画像分類手段は、さらに前記ボケ有無判定手段からのボケが無いという解析結果、および前記コントラスト測定手段から送出される解析結果として送出されるコントラストが所定閾値以上と判定したことを条件として、当該入力画像はプロカメラマンにより撮影されたものであると推定して分類し、それ以外の場合には、当該入力画像はアマチュアにより撮影されたものであると推定して分類する点に第の特徴がある。
また、本発明は、前記手ブレ有無判定手段が、入力フレームと該入力フレームより時間的に前のフレームとの間での動き方向および動き量を評価し、動き方向の分散が予め設定された第1の閾値より小さいという条件を満たし、かつ動き量の平均が予め設定された第2の閾値より小さいか動き量の分散が予め設定された第3の閾値より小さいかの少なくとも一方の条件を満たすフレームが、予め設定された第4の閾値のフレーム数だけ観測された場合に、手ブレが有ると判定する点に第4の特徴がある。
また、本発明は、前記動画像解析手段が、ボケ有無判定手段を備え、前記ボケ有無判定手段は、画面を複数に分割して得られるブロックごとの画像に2次元周波数変換を施し、予め設定された高周波数帯域のエネルギが所定値以下のブロック数が全ブロックに対して占める割合が予め設定された第5の閾値より大きい場合に、ボケが有ると判定する点に第5の特徴がある。
また、本発明は、さらに、入力動画像に付随する音響の特徴を解析する音響解析手段を具備し、前記動画像分類手段は、前記動画像解析手段による解析結果に加えて前記音響解析手段による解析結果を用いて、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかを推定して分類する点に第の特徴がある。
また、本発明は、前記音響解析手段が、有音か無音かを判定する有音無音判定手段と、雑音の有無を判定する雑音有無判定手段と、背景音楽の有無を判定する背景音楽有無判定手段のうちの少なくとも1つを備え、前記有音無音判定手段による判定結果と前記雑音有無判定手段による判定結果と前記背景音楽有無判定手段の判定結果のうちの少なくとも1つを前記音響解析手段による解析結果として前記動画像分類手段に送出する点に第の特徴がある。
また、本発明は、前記音響解析手段が、前記雑音有無判定手段を備え、前記雑音有無判定手段は、有音を検出し、該有音を雑音と分類した場合に、雑音が有ると判定する点に第の特徴がある。
また、本発明は、前記音響解析手段が、前記背景音楽有無判定手段を備え、前記背景音楽有無判定手段は、有音を検出し、該有音を背景音楽と分類した場合に、背景音楽が有ると判定する点に第の特徴がある。
また、本発明は、前記音響解析手段が、前記有音無音判定手段を備え、前記動画像分類手段は、前記有音無音判定手段により入力動画像に付随する音響が予め規定された時間区間において無音であると判断された場合に、入力動画像はアマチュアにより撮影されたものであると推定して分類する点に第10の特徴がある。
また、本発明は、前記動画像分類手段が、前記雑音有無判定手段手段により入力動画像に付随する音響が雑音を含むと判断された場合に、入力動画像はアマチュアにより撮影されたものであると推定して分類する点に第11の特徴がある。
また、本発明は、前記動画像分類手段が、前記背景音楽有無判定手段により入力動画像に付随する音響が背景音楽を含むと判断された場合に、入力動画像はプロカメラマンの撮影したものであると推定して分類する点に第12の特徴がある。
また、本発明は、前記動画像分類手段が、入力動画像をプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかに分類するための動画像特徴の分類基準が予め学習により設定される機械学習器である点に第13の特徴がある。
さらに、本発明は、前記動画像分類手段が、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかに分類するための動画像特徴および音響特徴の分類基準が予め学習により設定される機械学習器である点に第14の特徴がある。
本発明では、動画像に特有な特徴、さらには動画像に付随する音響の特徴を解析して、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかを推定して分類するので、テレビ放送向けや映画向けなど業務用カメラを使ってプロカメラマンが撮影した動画像と、例えばハンディカメラや携帯電話のカメラを使ってアマチュアが撮影した動画像を精度良く分類することができる。
通常、プロカメラマンが撮影した動画像には著作権が付随していることが多いので、例えば、動画像の投稿サイトなどにおいて、プロカメラマンが撮影した動画像が利用者によって無断で投稿された場合でも、それを直ちに発見し、著作権の保護を求めることができる。
以下、図面を参照して本発明を説明する。図1は、本発明に係る動画像分類装置の第1実施形態を示す機能ブロック図である。第1実施形態の動画像分類装置は、動画像解析部1および動画像分類部2を備える。なお、これらの部分は、ハードウエアでもソフトウエアでも実現できる。
動画像解析部1は、任意の入力動画像に含まれる特徴を解析する。ここで解析する特徴については後述する。動画像分類部2は、動画像解析部1による解析結果に基づいて、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかを推定して分類する。
動画像解析部1は、画面切り替わり頻度測定部11、手ブレ有無判定部12、ボケ有無判定部13およびコントラスト測定部14を備え、入力動画像の主に信号的な特徴を解析する。ここで、画面切り替わり頻度と手ブレは、動画像がプロカメラマンが撮影したものかアマチュアが撮影したものかを推定するのに特に有効な特徴であるが、本発明では、動画像解析部1、画面切り替わり頻度測定部11を備えることを必須とし、手ブレ有無判定部12ボケ有無判定部13コントラスト測定部14は、必要に応じて適宜追加されるもちろん、動画像解析部1で解析する特徴の要素を増やせば精度の向上が期待できる。
以下、動画像解析部1の各部について詳細に説明する。画面切り替わり頻度測定部11は、動画像における画面の切り替わり点を検出すると共に単位時間における画面の切り替わり回数を測定する。すなわち画面切り替わり頻度を測定する。なお、画面の切り替わり点の検出には、特開平10−224741号公報に記載されている技術を利用できる。画面の切り替わり回数を測定する単位時間は、例えば60秒などに設定することができる。
図2は、プロカメラマンとアマチュアの撮影による動画像における画面切り替わりの様子を示す具体例を示す図である。同図(a)は、プロカメラマンの撮影による動画像における画面切り替わり点を示し、同図(b)は、アマチュアの撮影による動画像における画面切り替わり点を示している。
画面の切り替わり点は、一般的には、カメラのオン/オフによって生じるが、プロカメラマンにより撮影された動画像では、撮影中に被写体を写すカメラの切り替えで挿入されたり、撮影後の編集によって挿入されたりすることも多い。したがって、画面の切り替わりが頻繁に発生している動画像は、プロカメラマンにより撮影された動画像である可能性が高い。これに対して、アマチュアにより撮影された動画像では、一般的に、画面の切り替わり点は、カメラのオン/オフによって生じるのみである。したがって、単位時間における画面の切り替わり回数は、プロカメラマンにより撮影された動画像かアマチュアにより撮影された動画像かの推定に有効な情報となる。
手ブレ有無判定部12は、動画像における撮影時の手ブレの有無を判定する。手ブレは、撮影者の手がブレることによって生じるため、手ブレが含まれる動画像はアマチュアにより撮影された動画像である可能性が高い。したがって、手ブレの有無も、プロカメラマンにより撮影された動画像かアマチュアにより撮影された動画像かの推定に有効な情報である。
図3は、手ブレ有無判定処理の例を示すフローチャートである。フレーム数csを0に初期設定(S30)した後、動画像のフレームnを入力し(S31)、その画面をN×M個のブロックに分割する(S32)。次に、フレームnに対して時間的にXフレーム前(Xは任意数)のフレーム(n-X)の間で該当ブロック間での動き方向と動き量を測定する(S33)。この動き方向と動き量は、例えば、該当ブロック間での動きベクトルを求めることによって測定できる。なお、フレーム(n-X)の画面も既にN×M個のブロックに分割されているものとする。
次に、以上のようにして求めた画面内での動き方向の分散が、第1の閾値Th1より小さいという条件を満たし、かつ動き量に関する条件(すなわち、動き量の平均が第2の閾値より小さい、または動き量の分散が第3の閾値より小さい、の少なくとも一方)を満たすか否かを判定する(S34)。
S34で、動き方向の分散が条件を満たすと判定された場合、csを1だけインクリメント(cs=cs+1)する(S35)。その後、csが第4の閾値Th4を超えたか否かを判定し(S36)、超えていないと判定された場合は、フレームを(n+X)とし(S37)、S31に戻って処理を繰り返す。
S34で、動き方向の分散が条件を満たさないと判定された場合には、フレーム数csを0に設定し、さらにフレームを(n+X)とし(S38)、S31に戻って処理を繰り返す。
また、S36で、csが第4の閾値Th4を超えたと判定された場合は、フレームnからcsが第4の閾値Th4を超えるまでの観測区間で手ブレが存在したと判定する(S39)。
図3に示すフローチャートでは、画面内での動き方向の分散が、第1の閾値Th1より小さいという条件を満たし、かつ動き量に関する条件を満たすフレーム数が第4の閾値Th4を超えて観測された場合に、この観測区間で手ブレが存在したと判定している。これを動画像における手ブレ有無の判定結果とする。
手ブレの有無の判定手法は、図3や他の特定手法に限定されるものではなく、特開2006−129074号に開示されている技術などを利用することもできる。
ボケ有無判定部13は、動画像における撮影時のボケの有無を判定する。動画像における撮影時のボケは、被写体に焦点が合っていない場合などに生じる。ボケが含まれる動画像はアマチュアにより撮影された動画像である可能性が高い。したがって、ボケの有無も、プロカメラマンにより撮影された動画像かアマチュアにより撮影された動画像かの推定に利用できる。
動画像における撮影時のボケの有無は、画面内の周波数特性を評価することにより判定できる。例えば、画像に、MPEGなどの動画像符号化で用いられている離散コサイン変換などの2次元周波数変換を施す。そして、比較的高い周波数帯域までエネルギが存在すれば、精細なテクスチャやエッジが表現されていることになり、画面内にボケが含まれていないと推定できる。一方、比較的低い周波数帯域にしかエネルギが存在しない場合、テクスチャやエッジがぼやけていると推定できる。
図4は、ボケ有無判定の概念を示す図である。入力フレームをN×Mブロックに分割し、各ブロックごとに2次元周波数変換を施す。各ブロックを2次元周波数変換した後、画面全体を考慮して高周波数帯域までエネルギが存在すれば、ボケなしとしてプロカメラマンにより撮影された動画像と推定とし、低周波数帯域にしかエネルギが存在しなければ、ボケありとしてアマチュアにより撮影された動画像と推定する。
図5は、ボケ有無判定処理の例を示すフローチャートである。まず、フレームnを入力し(S50)、その画面をN×M個のブロックに分割し(S51)、分割された各ブロックを2次元周波数変換する(S52)。
次に、ブロック数cb、ブロック番号mをそれぞれ0に初期設定(S53)した後、m番目のブロックを入力し(S54)、このブロックの高周波数帯域にエネルギが存在するか否かを判定する(S55)。なお、ここで判定する高周波数帯域は、ボケの有無の境界を定めるものとして予め設定しておく。これを可変できるようにしておくことも好ましい。S55で、ブロックの高周波数帯域のエネルギが所定値以下と判定された場合、cbを1だけインクリメント(cb=cb+1)する(S56)。
S55で、ブロックの高周波数帯域のエネルギが所定値超と判定された場合およびS56の処理が済んだ後には、mがN×Mに達したか否かを判定する(S57)。
S57で、mがN×Mに達していないと判定された場合、まだ画面内に未判定ブロックが残っているので、mを1だけインクリメント(m=m+1)し(S58)、S54に戻って処理を繰り返す。
S57で、mがN×Mに達したと判定された場合、画面内の全てのブロックの判定が済んだので、画面内の全ブロック数に対する高周波数帯域のエネルギが所定値以下のブロック数の割合(cb/(N×M))を求め、これが第5の閾値Th5より大きいか否かを判定する(S59)。第5の閾値Th5は、例えば0.75(75%)とすることができる。
S59で、cb/(N×M)>Th5と判定された場合、フレームnをボケ画像と判定し(S60)、そう判定されない場合は、フレームnをボケ画像と判定しない。
コントラスト測定部14は、動画像における画面のコントラストを測定する。画面のコントラストは、業務用などの高性能なカメラで被写体を撮影したり、補助光を用いて撮影したりすると高くなるので、画面のコントラストが高い動画像は、プロカメラマンにより撮影された動画像である可能性が高い。したがって、画面のコントラストも、プロカメラマンにより撮影された動画像かアマチュアにより撮影された動画像かの推定に利用できる。
画面のコントラストの測定には、特表2005−533424号公報に記載されている技術などを利用できる。
動画像分類部2は、画面切り替わり頻度測定部11、手ブレ有無判定部12、ボケ有無判定部13およびコントラスト測定部14により得られた解析結果に基づいて、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかを推定して分類する。画面切り替わり頻度や手ブレ有無は、動画像の判定で特に有効なものであるので、画面切り替わり頻度測定部11と手ブレ有無判定部12の解析結果の少なくとも一方は必須とする。
例えば、(1)画面切り替わり頻度測定部11により測定された画面の切り替わり頻度が一定値以下である、の条件が満たされ、さらに追加的に(2)手ブレ有無判定部12により手ブレが有ると判定された(3)ボケ有無判定部13によりボケが有ると判定された、(4)コントラスト測定部14により測定された画面内コントラストが一定値以下の値である、という条件が満たされた場合、動画像分類部2は、入力動画像がアマチュアによって撮影されたものであると推定して分類する。
図6は、本発明に係る動画像分類装置の第2実施形態を示す機能ブロック図である。第2実施形態の動画像分類装置は、第1実施形態における動画像解析部1に加えて音響解析部3を具備させることにより、プロカメラマンにより撮影された動画像かアマチュアにより撮影された動画像かを推定するための判断材料を増やすことにより、分類の精度をより高めることを可能としたものである。
動画像解析部1は、第1実施形態と構成および動作が同じであるので、説明を省略する。音響解析部3は、入力動画像に付随している音響の特徴を解析する。動画像分類部2は、動画像解析部1と音響解析部3の両者の解析結果に基づいて、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかを推定して分類する。なお、入力動画像に音響が付随していない場合には、第1実施形態と同様に、動画像解析部1のみの解析結果に基づいて入力動画像を分類できるようにしておくのが好ましい。
音響解析部3は、有音無音判定部31、雑音有無判定部32および背景音楽有無判定部33を備える。以下、各部について詳細に説明する。
有音無音判定部31は、動画像に付随する音響が有音であるか無音であるかを判定する。映画やテレビ番組など、プロカメラマンにより撮影された動画像は、意図的に無音にする場合を除き、通常は有音であることが殆どである。これに対し、アマチュアにより撮影された動画像では、意図せずとも無音になることがあり得る。したがって、無音である動画像は、アマチュアにより撮影された動画像である可能性が高く、動画像に付随する音響が有音か無音かは、プロカメラマンにより撮影された動画像かアマチュアにより撮影された動画像かの推定に利用できる。なお、有音無音の判定には、特許3607450号に開示されている技術などを利用することができる。
雑音有無判定部32は、動画像に付随する音響が雑音であるかどうかを判定する。雑音は、動画像を撮影する際に被写体とは無関係の環境音や音声が意図せず録音されてしまった場合や、性能の低いマイクを使って録音した場合に生じるので、雑音が付随している動画像はアマチュアにより撮影された動画像である可能性が高い。したがって、動画像に付随する音響が雑音であるかどうかも、プロカメラマンにより撮影された動画像かアマチュアにより撮影された動画像かの推定に利用できる。なお、雑音の有無の判定には、特開平5−297896号に開示されている技術などを利用することができる。
背景音楽判定部33は、動画像に付随する音響が背景音楽であるかどうかを判定する。背景音楽は、撮影後の編集によって挿入される場合が多いので、背景音楽が付随している動画像はプロカメラマンにより撮影された動画像である可能性が高い。したがって、動画像に付随する音響が背景音楽であるかどうかも、プロカメラマンにより撮影された動画像かアマチュアにより撮影された動画像かの推定に利用できる。なお、背景音楽の有無の判定には、特許3607450号に開示されている技術などを利用することができる。
動画像分類部2は、動画像解析部1による解析結果に加えて、音響解析部3の有音無音判定部31、雑音有無判定部32および背景音楽有無判定部33により得られた解析結果を用いて、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかを推定して分類する。
例えば、動画像解析部1による解析結果に加えて、(5)音響が無音である、(6)音響に雑音が観測される、(7)音響に背景音楽が含まれてない、の条件が満たされた場合に、入力動画像がアマチュアによって撮影された動画像であると推定して分類することができる。
図6は、本発明に係る動画像分類装置の第3実施形態を示す機能ブロック図である。第3実施形態の動画像分類装置は、Z段(Z:2以上の整数)の動画像解析部を直列に接続したものである。各動画像解析部は、入力動画像の異なる特徴を解析する。各動画像解析部での解析結果から入力動画像がアマチュアによって撮影されたものであるかどうかを推定し、アマチュアによって撮影されたものであると推定されれば、その段階で入力動画像をアマチュアによって撮影されたものとして分類する。
図6では、画面切り替わり頻度測定部11を備えた動画像解析部1、ボケ有無判定部13を備えた動画像解析部1′、コントラスト測定部14を備えた動画像解析部1″を直列に接続している(Z=3)。動画像分類部2、2′、2″はそれぞれ、動画像解析部1、1′、1″での解析結果から入力動画像がアマチュアによって撮影されたものであるかどうかを推定し、アマチュアによって撮影されたものであると推定されれば、該入力動画像をアマチュアによって撮影されたものとして分類する。動画像分類部2″は、アマチュアによって撮影されたものと分類されなかった入力動画像をプロカメラマンによって撮影されたものとして分類する。
第3実施形態では、プロカメラマンにより撮影されたと推定される動画像を段階を追って絞り込むので、後段での処理対象の動画像が徐々に少なくなっていく。これにより、処理負担の低減が期待できる。
以上実施形態について説明したが、本発明は、上記実施形態に限定されず、種々に変形可能である。例えば、第3実施形態の動画像分類部2、2′、2″を、プロカメラマンによって撮影された動画像を推定して分類するものとし、動画像分類部2″では、それまでに分類されなかった動画像をアマチュアによって撮影されたものとして分類するようにすることもできる。
また、プロカメラマンにより撮影された動画像の特徴とアマチュアにより撮影された動画像の特徴を予め学習し、その学習に基づいて設定された分類基準を用いて、入力動画像がプロカメラマンによって撮影されたものかアマチュアにより撮影されたものであるかの分類基準を設定することもできる。すなわち、プロカメラマンにより撮影された動画像における画面切り替わり頻度、手ブレ有無、ボケ有無、コントラストの振る舞いと、アマチュアにより撮影された動画像におけるそれらの振る舞いを予め学習させておいた機械学習器を動画像分類部2(2′、2″)として用いることもできる。機械学習器としては、サポートベクターマシンなどを利用することができる。
さらに、この機械学習器には、プロカメラマンにより撮影された動画像における有音無音、雑音有無、背景音楽有無の振る舞いと、アマチュアにより撮影された動画像におけるそれらの振る舞いを予め学習させておくこともできる。
本発明に係る動画像分類装置の第1実施形態を示す機能ブロック図である。 プロカメラマンとアマチュアの撮影による動画像における画面切り替わりの様子を示す具体例を示す図である。 手ブレ有無判定処理の例を示すフローチャートである。 ボケ有無判定の概念を示す図である。 ボケ有無判定処理の例を示すフローチャートである。 本発明に係る動画像分類装置の第2実施形態を示す機能ブロック図である。 本発明に係る動画像分類装置の第3実施形態を示す機能ブロック図である。
符号の説明
1、1′、1″・・・動画像解析部、2、2′、2″・・・動画像分類部、3・・・音響解析部、11・・・画面切り替わり頻度測定部、12・・・手ブレ有無判定部、13・・・ボケ有無判定部、14・・・コントラスト測定部、31・・・有音無音判定部、32・・・雑音有無判定部、33・・・背景音楽有無判定部

Claims (14)

  1. 入力動画像の特徴を解析する動画像解析手段と、
    前記動画像解析手段による解析結果を基に、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかを推定して分類する動画像分類手段を具備し、
    前記動画像解析手段は、入力動画像における画面切り替わりを検出し、検出された画面切り替わりの単位時間当たりの頻度を解析結果として前記動画像分類装置に送出する画面切り替わり頻度測定手段を備え
    前記動画像分類手段は、前記画面切り替わり頻度測定手段から解析結果として送出された画面切り替わりの単位時間当たりの頻度が所定閾値以上であるか否かを判定し、画面切り替わりの単位時間当たりの頻度が所定閾値以上と判定した場合に、当該入力画像はプロカメラマンにより撮影されたものであると推定して分類し、それ以外の場合には、当該入力画像はアマチュアにより撮影されたものであると推定して分類することを特徴とする動画像分類装置。
  2. 前記動画像解析手段は、さらに、所定フレーム数に亘って手ブレの有無を判定し、その判定結果を解析結果として前記動画像分類装置に送出する手ブレ有無判定手段を備え、
    前記動画像解析手段は、さらに手ブレ有無判定手段からの所定フレーム数に亘って手ブレが無いという解析結果を条件として、当該入力動画像はプロカメラマンにより撮影されたものであると推定して分類し、それ以外の場合には、当該入力画像はアマチュアにより撮影されたものであると推定して分類することを特徴とする請求項1に記載の動画像分類装置。
  3. 前記動画像解析手段は、さらに、画面のボケの有無を判定し、その判定結果を解析結果として前記動画像分類手段に送出するボケ有無判定手段とコントラストを測定し、その測定結果を解析結果として前記動画像分類手段に送出するコントラスト測定手段の少なくとも一方を備え
    前記動画像解析手段が前記ボケ有無判定手段と前記コントラスト測定手段のうちのボケ有無判定手段だけを備える場合、前記動画像分類手段は、さらに前記ボケ有無判定手段からのボケが無いという解析結果を条件として、当該入力画像はプロカメラマンにより撮影されたものであると推定して分類し、それ以外の場合には、当該入力画像はアマチュアにより撮影されたものであると推定して分類し、前記動画像解析手段が前記ボケ有無判定手段と前記コントラスト測定手段のうちの前記コントラスト測定手段だけを備える場合、前記動画像分類手段は、さらに前記コントラスト測定手段から送出される解析結果としてのコントラストが所定閾値以上か否かを判定し、コントラストが所定閾値以上と判定したことを条件として、当該入力画像はプロカメラマンにより撮影されたものであると推定して分類し、それ以外の場合には、当該入力画像はアマチュアにより撮影されたものであると推定して分類し、前記動画像解析手段が前記ボケ有無判定手段と前記コントラスト測定手段の双方を備える場合、前記動画像分類手段は、さらに前記ボケ有無判定手段からのボケが無いという解析結果、および前記コントラスト測定手段から送出される解析結果として送出されるコントラストが所定閾値以上と判定したことを条件として、当該入力画像はプロカメラマンにより撮影されたものであると推定して分類し、それ以外の場合には、当該入力画像はアマチュアにより撮影されたものであると推定して分類することを特徴とする請求項1または2に記載の動画像分類装置。
  4. 記手ブレ有無判定手段は、入力フレームと該入力フレームより時間的に前のフレームとの間での動き方向および動き量を評価し、動き方向の分散が予め設定された第1の閾値より小さいという条件を満たし、かつ動き量の平均が予め設定された第2の閾値より小さいか動き量の分散が予め設定された第3の閾値より小さいかの少なくとも一方の条件を満たすフレームが、予め設定された第4の閾値のフレーム数だけ観測された場合に、手ブレが有ると判定することを特徴とする請求項2に記載の動画像分類装置。
  5. 前記動画像解析手段は、前記ボケ有無判定手段を備え、前記ボケ有無判定手段は、画面を複数に分割して得られるブロックごとの画像に2次元周波数変換を施し、予め設定された高周波数帯域のエネルギが所定値以下のブロック数が全ブロックに対して占める割合が予め設定された第5の閾値より大きい場合に、ボケが有ると判定することを特徴とする請求項3に記載の動画像分類装置。
  6. さらに、入力動画像に付随する音響の特徴を解析する音響解析手段を具備し、前記動画像分類手段は、前記動画像解析手段による解析結果に加えて前記音響解析手段による解析結果を用いて、入力動画像がプロカメラマンにより撮影されたものかアマチュアにより撮影されたものであるかを推定して分類することを特徴とする請求項1ないし5のいずれか1つに記載の動画像分類装置。
  7. 前記音響解析手段は、有音か無音かを判定する有音無音判定手段と、雑音の有無を判定する雑音有無判定手段と、背景音楽の有無を判定する背景音楽有無判定手段のうちの少なくとも1つを備え、前記有音無音判定手段による判定結果と前記雑音有無判定手段による判定結果と前記背景音楽有無判定手段の判定結果のうちの少なくとも1つを前記音響解析手段による解析結果として前記動画像分類手段に送出することを特徴とする請求項6に記載の動画像分類装置。
  8. 前記音響解析手段は、前記雑音有無判定手段を備え、前記雑音有無判定手段は、有音を検出し、該有音を雑音と分類した場合に、雑音が有ると判定することを特徴とする請求項7に記載の動画像分類装置。
  9. 前記音響解析手段は、前記背景音楽有無判定手段を備え、前記背景音楽有無判定手段は、有音を検出し、該有音を背景音楽と分類した場合に、背景音楽が有ると判定することを特徴とする請求項7に記載の動画像分類装置。
  10. 前記音響解析手段は、前記有音無音判定手段を備え、前記動画像分類手段は、前記有音無音判定手段により入力動画像に付随する音響が予め規定された時間区間において無音であると判断された場合に、入力動画像はアマチュアにより撮影されたものであると推定して分類することを特徴とする請求項7に記載の動画像分類装置。
  11. 前記動画像分類手段は、前記雑音有無判定手段手段により入力動画像に付随する音響が雑音を含むと判断された場合に、入力動画像はアマチュアにより撮影されたものであると推定して分類することを特徴とする請求項8に記載の動画像分類装置。
  12. 前記動画像分類手段は、前記背景音楽有無判定手段により入力動画像に付随する音響が背景音楽を含むと判断された場合に、入力動画像はプロカメラマンの撮影したものであると推定して分類することを特徴とする請求項9に記載の動画像分類装置。
  13. 前記動画像分類手段は、入力動画像をプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかに分類するための動画像特徴の分類基準が予め学習により設定される機械学習器であることを特徴とする請求項1ないし12のいずれか1つに記載の動画像分類装置。
  14. 前記動画像分類手段は、入力動画像をプロカメラマンにより撮影されたものかアマチュアにより撮影されたものかに分類するための動画像特徴および音響特徴の分類基準が予め学習により設定される機械学習器であることを特徴とする請求項6ないし12のいずれか1つに記載の動画像分類装置。
JP2007084710A 2007-03-28 2007-03-28 動画像分類装置 Expired - Fee Related JP4915860B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007084710A JP4915860B2 (ja) 2007-03-28 2007-03-28 動画像分類装置
US12/053,779 US20080240580A1 (en) 2007-03-28 2008-03-24 Video classifying device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007084710A JP4915860B2 (ja) 2007-03-28 2007-03-28 動画像分類装置

Publications (2)

Publication Number Publication Date
JP2008245040A JP2008245040A (ja) 2008-10-09
JP4915860B2 true JP4915860B2 (ja) 2012-04-11

Family

ID=39794481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007084710A Expired - Fee Related JP4915860B2 (ja) 2007-03-28 2007-03-28 動画像分類装置

Country Status (2)

Country Link
US (1) US20080240580A1 (ja)
JP (1) JP4915860B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4998630B2 (ja) * 2010-03-30 2012-08-15 株式会社ニコン 画像処理装置、および画像評価プログラム
US10380486B2 (en) * 2015-01-20 2019-08-13 International Business Machines Corporation Classifying entities by behavior

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3218681B2 (ja) * 1992-04-15 2001-10-15 ソニー株式会社 背景雑音検出方法及び高能率符号化方法
JPH08289333A (ja) * 1995-04-14 1996-11-01 Nippon Telegr & Teleph Corp <Ntt> 音声映像総合品質推定方法
JP3607450B2 (ja) * 1997-03-05 2005-01-05 Kddi株式会社 オーディオ情報分類装置
JPH1139325A (ja) * 1997-07-22 1999-02-12 Matsushita Electric Ind Co Ltd 類似検索方法及び類似検索システム
JP3469122B2 (ja) * 1999-03-10 2003-11-25 日本電信電話株式会社 編集用映像区間分類方法及び装置、並びにこの方法を記録した記録媒体
JP2003167970A (ja) * 2001-12-04 2003-06-13 Canon Inc 情報管理装置、情報処理装置、情報管理システム、著作権管理方法、記録媒体及びプログラム
US7119837B2 (en) * 2002-06-28 2006-10-10 Microsoft Corporation Video processing system and method for automatic enhancement of digital video
US7038710B2 (en) * 2002-07-17 2006-05-02 Koninklijke Philips Electronics, N.V. Method and apparatus for measuring the quality of video data
JP4539318B2 (ja) * 2004-12-13 2010-09-08 セイコーエプソン株式会社 画像情報の評価方法、画像情報の評価プログラム及び画像情報評価装置
JP4380523B2 (ja) * 2004-12-17 2009-12-09 カシオ計算機株式会社 画像処理装置及び画像処理方法、カメラ装置
US8379154B2 (en) * 2006-05-12 2013-02-19 Tong Zhang Key-frame extraction from video

Also Published As

Publication number Publication date
JP2008245040A (ja) 2008-10-09
US20080240580A1 (en) 2008-10-02

Similar Documents

Publication Publication Date Title
JP4415188B2 (ja) 画像撮影装置
Niu et al. What makes a professional video? A computational aesthetics approach
US8379102B2 (en) Image processing apparatus and image processing method for generating high dynamic range images
US20100188511A1 (en) Imaging apparatus, subject tracking method and storage medium
US20140078320A1 (en) Image sharpness classification system
US20090046160A1 (en) Camera shake correcting device
US20090141937A1 (en) Subject Extracting Method, Subject Tracking Method, Image Synthesizing Method, Computer Program for Extracting Subject, Computer Program for Tracking Subject, Computer Program for Synthesizing Images, Subject Extracting Device, Subject Tracking Device, and Image Synthesizing Device
JP5987306B2 (ja) 画像処理装置、画像処理方法、プログラム
WO2012106314A2 (en) Estimating subject motion between image frames
JP4210954B2 (ja) 画像処理方法、画像処理方法のプログラム、画像処理方法のプログラムを記録した記録媒体及び画像処理装置
WO2016011877A1 (zh) 拍摄光绘视频的方法和移动终端、存储介质
US20170345131A1 (en) Method and device for image noise estimation and image capture apparatus
US8830359B2 (en) Image processing apparatus, imaging apparatus, and computer readable medium
JP2012105205A (ja) キーフレーム抽出装置、キーフレーム抽出プログラム、キーフレーム抽出方法、撮像装置、およびサーバ装置
US8306358B2 (en) Image processing apparatus, image processing method, and imaging apparatus for slicing an image
JP2013110484A (ja) 画像処理装置、画像処理方法、および記録媒体
JP2005332381A (ja) 画像処理方法および装置並びにプログラム
JP4639043B2 (ja) 動画像編集装置及び動画像編集方法
JP4915860B2 (ja) 動画像分類装置
JP2006049949A (ja) 画像処理装置、画像処理方法およびプログラム
JP5095263B2 (ja) 画像評価装置、および画像評価プログラム
US10230955B2 (en) Method and system to detect and utilize attributes of frames in video sequences
JP2006180078A (ja) 電子カメラ、画像処理装置および画像処理プログラム
KR20100118811A (ko) 감시 카메라 시스템의 관리를 위한 장면 전환 검출 방법과 장면 전환 검출 신뢰도 산출 방법 및 소프트웨어
EP3855350A1 (en) Detection of action frames of a video stream

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees