JP2011055204A - 動画像の圧縮方法及び圧縮装置 - Google Patents

動画像の圧縮方法及び圧縮装置 Download PDF

Info

Publication number
JP2011055204A
JP2011055204A JP2009201608A JP2009201608A JP2011055204A JP 2011055204 A JP2011055204 A JP 2011055204A JP 2009201608 A JP2009201608 A JP 2009201608A JP 2009201608 A JP2009201608 A JP 2009201608A JP 2011055204 A JP2011055204 A JP 2011055204A
Authority
JP
Japan
Prior art keywords
compression
importance
moving image
frame rate
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009201608A
Other languages
English (en)
Other versions
JP5190968B2 (ja
Inventor
Masahiro Murakawa
正宏 村川
Takumi Kobayashi
匠 小林
Fumio Sakabe
史生 坂部
Tetsuya Higuchi
哲也 樋口
Nobuyuki Otsu
展之 大津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2009201608A priority Critical patent/JP5190968B2/ja
Publication of JP2011055204A publication Critical patent/JP2011055204A/ja
Application granted granted Critical
Publication of JP5190968B2 publication Critical patent/JP5190968B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】映像監視や、長時間の映像の記録再生において、映像シーンの分析を客観的に行い、正常な動きと異常な動きを判断して、重要度の高い映像を取りこぼし無く、かつデータ量を削減して圧縮することを目的とする。
【解決手段】映像上で頻繁に起こる行動を立体高次局所自己相関により学習し、そこからの逸脱の度合いを重要度として算出して、シーンの重要度に応じて圧縮率を漸次変化させる。例えば、重要度が低いほどフレームレートを低くすることにより、データ量の削減効果を向上させる。
【選択図】図1

Description

本発明は、映像シーンを分析して重要度の高いシーンを取りこぼしなくかつデータ量を大きく削減して圧縮する動画像の圧縮方法及び圧縮装置に関する。
現在、動画像情報は様々な場面で活用されており、特に映像監視分野においては、これらの情報を記憶媒体等に保存している。例えば、街中や建物内の防犯対策に利用されている防犯カメラでは、設置場所付近の状況を長時間撮影して記憶媒体に保存している。また、常に稼動し続ける防犯カメラを複数台連携させた安全管理システムが導入され、保存すべきデータ量は、さらに膨大になっている。現存の記憶媒体を有効活用するためにも、より効率的な動画像圧縮技術が必要とされる。
映像監視分野の従来技術として、特許文献1のように、監視映像において、画面内の動き量を算出し、その動き量がある閾値を越えたときのみ「異常」として動画像を出力し、それ以外の正常時には静止画を出力するデータ圧縮方法が知られている。また、特許文献2のように、人感センサと連動させ、人の存在が検知されたときのみ映像を出力することで保存データ量を圧縮する方法が知られている。従来技術では、画面内に動きがあったときのみにデータを保存し、動きがないときのデータを削除することでデータ量の削減を図っている。しかしながら、画面内に動きがないときにはフレーム間の冗長性が高く、既存の動画像圧縮手法(MPEGなど)により、すでにデータ量が少なくなった状態であるので、その部分を削除しても大きなデータ圧縮効果は得られない。また、動き量に閾値を設けて保存をするかしないかを判断する場合は、閾値の設定に圧縮結果が敏感となって、保存すべき重要なシーンを保存しそこねるリスクがある。
本発明者らは、高次局所自己相関特徴を拡張し、時間方向の相関も加えた特徴である、立体高次局所自己相関(Cubic Higher−order Local Auto−Correlation。以下、CHLACとも記す)特徴を用いて動作認識を行う技術を開発してきた(特許文献3〜5参照)。
また、本発明者らは、立体高次局所自己相関(CHLAC)特徴を用いた動作認識技術を、コンテキストの重要度評価に応用した動画像圧縮法を非特許文献1において提案した。動画像のシーン内容にまで踏み込んだ圧縮処理であり、利便性の向上や動画像のデータ量削減の効果があった。
特開平7−121789号公報 特開平8−277080号公報 特開2005−92346号公報 特開2006−79272号公報 特開2009−140247号公報
坂部史生、村川正宏他、"学習型シーン分析を用いた動画像圧縮保存法の検討"、映像情報メディア学会冬季大会12−3,(2008)
従来の映像監視技術のように、画面内に動きがあったときにのみデータを保存してデータ量の削減を図るようにする場合、既に指摘した問題点の他に、動きのある映像がすべて異常と判断されてしまいデータ量が多くなってしまう問題がある。また、人感センサを用いて異常を判断する場合は、感知エリアにセンサを設置する必要があり、また人が多い場所であるとデータ量が多くなってしまう問題がある。映像監視には、映像のシーン内容にまで踏み込んで異常を判断する必要がある。また、防犯カメラなどの監視映像のみに限らず、長時間に亘る膨大な映像データを記録再生するにあたり重要なシーンをもれなく高画質で保存し且つデータ量を少なくする必要がある。例えば、医療現場で手術内容の映像記録等がある。このように、映像シーンの分析技術として、正常な動きと異常な動きを判断して映像データ量を削減する手法が必要である。
本発明者らが非特許文献1で提案した手法においては、動画像の圧縮時に、重要ではないシーンに対して低フレームレートを採用することで、動画像全体のデータ量削減をねらった。図12は、動画像と圧縮後のデータ量を横軸の長さとして示した比較図である。図12の最上段Aは、無圧縮の動画像のデータ量、中段Bは、既存圧縮法(MPEG、DivX等)を用いて圧縮した圧縮動画像のデータ量、下段Cは、さらに重要でないシーンに対して低フレームレート採用した圧縮動画像のデータ量を示す。図中の星印部分は、利用者にとって重要なシーンを示している。下段Cの星印のない部分は、利用者側にとって重要ではないシーンが低フレームレートに圧縮されていることを示している。非特許文献1では、重要ではないシーンと重要なシーンとの切り替わり部分に、チャプターを入れて保存することで、視聴時の利便性を向上させることを行っていた。また、重要なシーンと重要ではないシーンの判別には、CHLAC特徴による異常判別手法(特許文献4参照)を用いてシーン分析を行っていた。この手法では、監視の観点から、防犯カメラの設置場所において、異常行動が映っているシーンは重要であり、通常行動が映っているシーンは重要でないとしている。具体的には、重要ではないシーンのフレームレートを1/10にしてデータ量を削減していた。
しかしながら、上記手法について研究を重ねた結果、本発明者らは次のような問題が生じていることに気がついた。上記手法のような方法では、重要度を「質的」に、つまり、重要か重要ではないかの二値として扱っている。図13は、二値で判別する場合の具体的な例を示す図である。図13の横軸は動画像のフレーム番号、縦軸は重要度を表す。図13のように、動画像のフレームについて重要度を算出し、閾値を設定して、閾値を超えるフレーム番号を重要なシーン、閾値以下のフレーム番号を重要ではないシーンと判別して、重要ではないシーンに対して、大きな圧縮率で圧縮する。そうすると、重要度を「質的」に扱うこの手法には、閾値の決定が必要であり、この閾値によっては重要なシーンを取りこぼす可能性があるという問題がある。これは、閾値前後の重要度において極端な圧縮率の差が生じるためである。
本発明は、これらの問題を解決しようとするものであり、映像監視や、映像の記録再生、映像情報伝達等において、映像シーンの分析を行い、正常な動きと異常な動きを判断して重要度の高い映像を取りこぼし無くかつデータ量を削減して圧縮することを目的とするものである。
本発明は、上記目的を達成するために、以下の特徴を有するものである。
本発明の方法は、動画像を圧縮する方法であって、動画像上で頻繁に起こる行動からの逸脱の度合いを重要度とし、該重要度を立体高次局所自己相関特徴を用いて算出することを特徴とする。また、本発明の方法は、該重要度が高いシーンほど圧縮率を小さくし、重要度が低いシーンほど圧縮率を高くするように、重要度の値に応じて圧縮率を漸次変化させることを特徴とする。具体的には、前記圧縮率は、フレームレート、フレームサイズ、画質制御パラメータのいずれか1つ以上を変化させることにより、漸次変化させる。前記圧縮率を、フレームレートを変化させることにより漸次変化させ、前記重要度が高いシーンほど高フレームレートを採用し、前記重要度が低いシーンほど低フレームレートを採用することが好ましい。また、前記フレームレートの最大フレームレートを割り当てる重要度の下限ポイントを、可変にすることがより好ましい。さらに、前記下限ポイントを、目標とするデータ量に応じて自動調整するようにすると利便性が増す。
本発明の装置は、動画像を圧縮する装置であって、動画像上で頻繁に起こる行動からの逸脱の度合いを重要度とし、該重要度を立体高次局所自己相関特徴を用いて算出する重要度算出部を備えることを特徴とする。また、本発明の装置は、該重要度が高いシーンほど圧縮率を小さくし、重要度が低いシーンほど圧縮率を高くするように、重要度の値に応じて圧縮率を漸次変化させる圧縮処理部を備えることを特徴とする。具体的には、前記圧縮処理部は、フレームレート、フレームサイズ、画質制御パラメータのいずれか1つ以上を変化させることにより、圧縮率を漸次変化させる。前記圧縮処理部は、フレームレートを変化させることにより圧縮率を漸次変化させ、前記重要度が高いシーンほど高フレームレートを採用し、前記重要度が低いシーンほど低フレームレートを採用することが好ましい。また、前記圧縮処理部は、前記フレームレートの最大フレームレートを割り当てる重要度の下限ポイントが可変であるとより好ましい。さらに、前記圧縮処理部は、前記下限ポイントを、目標とするデータ量に応じて自動調整してもよい。なお、前記算出部や圧縮処理部は、算出処理や圧縮処理がプログラムにより実行される演算処理部を含む。
本発明では、動きの大小で保存の有無を判断するのではなく、動画像の内容にまで踏み込んでシーンの重要度を判断し、それに応じて圧縮率を変化させるので、重要ではないシーンには、低いフレームレートやフレームサイズを適用することができ、データ量を大きく削減できる。また、本発明では、重要度は、映像上で頻繁に起こる行動を立体高次局所自己相関により学習し、そこからの逸脱の度合いを重要度とするので、映像監視や手術シーン等において、異常な動きと正常な動きを的確に判断でき、重要度の高いシーを取りこぼしなく高画質で保存できる。
また、重要度に閾値を設けて重要か重要でないかの質的な判断をするのではなく、重要度を量的に扱い、重要度が高いほど圧縮率を小さくし、重要度が低いほど圧縮率を高くするように漸次変化させるので、重要度のわずかな差で圧縮率が大きく変わることがなくなり、重要なシーンの取りこぼしの問題を軽減する。具体的に、本発明では、圧縮率を変化させる際に、フレームレートを漸次変化させ、重要ではないシーンほど低フレームレートを採用することで、重要なシーンを取りこぼすことなく動画像全体のデータ量を削減できた。また、本発明のように、最大フレームレートを割り当てる重要度の下限ポイントを可変にした場合、最大60%のデータ量削減効果が可能となった。また、最大フレームレートを割り当てる重要度の下限ポイントに応じて、割り当てられるフレームレートが変化し、圧縮後の動画像データ量が変化するので、下限ポイントを自動調整することにより、圧縮後の動画像データ量を、ユーザーが指定するデータ量に近づけることができる。よって、目標とするデータ量に応じたかつ重要シーンの取りこぼしがない圧縮ができる。
本発明の第1の実施の形態を説明する図。 本発明の第1の実施の形態の例の動画像の重要度を示す図。 本発明の第1の実施の形態の重要度に応じたフレームレートの対応付けを表す図。 本発明の第2の実施の形態の最大フレームレートを割り当てる下限ポイントを可変にすることを示す図。 本発明の第2の実施の形態の下限ポイントの設定例を示す図。 本発明の第2の実施の形態のフレームレートの割り当て方の例を示す図。 本発明の第2の実施の形態の例の代表重要度を示す図。 本発明の第2の実施の形態の例の代表重要度を示す図。 本発明の第2の実施の形態の例において割り当てられたフレームレートを示す図。 本発明の第2の実施の形態の例において割り当てられたフレームレートを示す図。 本発明のデータ量圧縮効果を示す図。 従来の圧縮法のデータ量を説明する図。 従来の圧縮法を説明する図。
本発明では、動画像の内容にまで踏み込んでシーンの重要度を判断し、それに応じて圧縮率を変化させる。特に重要度を量的に扱い、重要度が高いほど圧縮率を小さくし、重要度が低いほど圧縮率を高くするように、重要度の度合いに応じて反比例関係又は多段階的に、圧縮率を漸次変化させる。本発明では、映像上で頻繁に起こる行動を通常行動とし、それをCHLACと統計的手法を組み合わせることにより学習し、そこからの逸脱の度合いを重要度として算出する。
重要度の低い通常行動シーンは、異常行動シーンと比べると高画質保存を求められていない。本発明は、「量的」に算出される重要度に応じて動画像を圧縮するための適応型動画像圧縮方法である。図1は、圧縮率の割り当て方について、本発明の特徴を従来手法と対比して説明する図である。図1の横軸は重要度、縦軸は圧縮率を示す。従来の閾値を用いる手法では、「質的」と記載して点線に示すように、重要度の閾値以下の映像に対して圧縮率を大きくしていた。これに対して、本発明では、「量的」として実線で示すように、重要度が高いほど圧縮率を小さく高画質に残し、重要度が低いほど圧縮率を高くするので、動画像全体のデータ量を削減できる。図1の重要度と圧縮率の関係は、「反比例」の関係である。また、重要度と圧縮率の関係は、図1に限らず、広義の単調減少の関係であればよく、二値でなくおよそ漸次変化する関係であればよい。具体的な圧縮率は保存データ量等に応じて適宜算出することができる。また、本発明では、「量的」に算出される重要度をそのまま扱うことで、重要度のわずかな差で圧縮率が大きく変わることが無くなり、重要なシーンの取りこぼしの問題が軽減される。
(第1の実施の形態)
第1の実施の形態について、図2〜3を参照しながら説明する。動画像には様々なシーンが含まれており、ユーザーにとってシーンの重要さの度合が違う。ここで防犯カメラを例にすると、重要ではないシーンとしては、正常行動、つまり防犯カメラの設置場所において、頻繁に見受けられる通常行動が映っているシーンがあげられる。一方、重要なシーンとは、異常行動が映っているシーンとなる。本発明では、動画像に含まれる各行動に、頻度に応じて重要度を付加する。即ち、防犯カメラの設置場所において、頻繁に見受けられる頻度の高い通常行動シーンは、重要度が低く、一方、頻度の低いシーンは、異常行動(通常ではない行動)シーンであるとみて、重要度が高くなると仮定している。
(シーン分析について)
まず、本実施の形態において、動画像に含まれるシーンの重要度判断をするためのシーン分析技術について説明する。頻度に応じて重要度を量的に算出するには、統計的な定義に基づく手法をシーン分析に適用する。この統計的な定義により、主観によらない客観的なシーン分析が可能となる。例えば、「歩く」という行動は、一般的には重要なシーン(通常ではない行動)であるとは考えにくい。しかし、「走る」行動が常な環境下においては、「歩く」行動が重要なシーン(異常行動)になる可能性がある。このように、ユーザーが前もって異常行動を想定し、列挙する必要がないため、主観的な思い込みに起因する問題を避け、さらにユーザーの負担が軽減される。
具体的には、学習用動画像から特徴量を抽出し、この特徴量に統計的手法である主成分分析を用いることで、学習用の動画像に含まれる頻繁に起こる行動の特徴空間内での分布を学習する。次に、この分布に基づき圧縮対象動画像の特徴量を評価し、シーンの重要度を検出する。なお、学習用動画像を用いる例を説明したが、学習用動画像は、わざわざ学習用動画像を準備する代わりに、主に通常行動を撮影している動画像を学習用として利用してもよい。
本実施の形態では、動画像から抽出する特徴量に、立体高次局所自己相関(CHLAC)特徴を用いる。CHLAC特徴(251次元のベクトル)は、物の形と動き情報を表現できる特徴があり、形や動きを認識したい対象(例えば動画像に写っている人間や車など)の切り出し作業が不要で、かつモデルを用意する必要がなく、計算量が少ないという利点を持つ。この特徴を用いることにより、大規模な計算機を利用せずともシーン分析が行えるので、既存の防犯カメラシステムへ組み込むことができる。
本実施の形態におけるシーンの重要度の算出に関して、まず、通常部分空間の形成について説明する。動画像に含まれる正常行動は頻繁に起こるある種の行動であるため、抽出される特徴ベクトルは251次元の特徴空間内で、ある限定された領域に集中して分布することになる。ここでは、そのような分布を部分空間により近似し、正常(通常)部分空間を形成する。そのため、主成分分析により主成分ベクトルを求める。主成分ベクトルU(下記(数1))は、自己相関行列Rを用いて、下記(数2)の固有値問題より求まる。
Figure 2011055204
Figure 2011055204
固有値行列Λ=diag(λ,・・・,λ251)に基づいて、累積寄与率η(0以上1以下)は、下記(数3)と表され、累積寄与率ηがC(例えばC=0.99)となる次元までの固有ベクトルu,・・・uにより張られる空間を、頻繁に起こる行動の部分空間(以下、通常部分空間と呼ぶ)として採用する。
Figure 2011055204
このようにして得られた直交基底U=[u,・・・u]によって張られる部分空間への射影子は、P=U として表され、それに対する直交補空間への射影子は、I251を単位行列として、P=I251−Pとなる。この時、入力Xの通常部分空間への垂直距離dは、直交補空間への射影成分で表され、下記(数4)と表すことができる。
Figure 2011055204
本実施の形態では、この垂直距離dを、頻繁に起こる行動かどうかの指標として、重要度と呼ぶ。この重要度が大きいほど、そのシーンの頻度が低いことを意味し、重要なシーンと判断できる。
(重要度に応じた可変圧縮について)
本実施の形態では、上述した方法で算出される重要度を用いて、動画像の圧縮率を適応的に変化させる。実際に、学習用動画像として、建物内で複数人が歩いている動画像を用いて、通常部分空間を構成した後、圧縮対象動画像として、同じ場所で別の時間に撮影した動画像のフレームごとの重要度dを検出した場合の例を、図2に示す。例えば、全ての人が歩く行動を取っている場合のフレームは、頻度が高い行動のため、低い重要度となる。一方、例えば、人が走る行動が含まれているフレームの場合は、頻度が低い行動のため、高い重要度が検出される。
本実施の形態では、重要度に応じて圧縮率を漸次変化させるために、重要度と圧縮率を「反比例」の関係とする。即ち、重要なシーンほど低い圧縮率、重要ではないシーンほど高い圧縮率を採用する。図3は、重要度に応じたフレームレートの対応付けを表す図である。例えば図3のように、検出される重要度の最大値には、最大フレームレート(30fps)を採用し、重要度の最大値の半値には、最大フレームレートの半値(15fps)を採用する。重要度に応じて圧縮率を変化させるために、フレームレートを重要度と比例関係にする。
本実施の形態の例として、重要度とフレームレートとの関係として図3の例を示したが、図3のように直線である必要はなく、重要度に対応してフレームレートが単調増加する関係であれば最適なデータ量になるよう適宜設定できる。
(第2の実施の形態)
第2の実施の形態は、第1の実施の形態において、重要度に応じたフレームレートの対応づけを変化させるものである。第2の実施の形態について、図4〜11を参照して説明する。第1の実施の形態の図3のように、検出される重要度の最大値を最大フレームレートに固定すると、ユーザーの意図に反し、圧縮の掛け過ぎや掛けなさすぎが発生する可能性がある。例えば、突出して高い重要度が1ヶ所検出された場合や、すべて同じような低い重要度が検出された場合である。そこで、本実施の形態では、図4に示すように、最大フレームレートを割り当てる重要度の下限ポイントを可変にした。図4において、横軸は重要度、縦軸はフレームレートを示している。図4に左右の矢印で示されるように、下限ポイントを可変にして、実線から点線のように、重要度とフレームレートの対応付けを可変にする。これにより、閾値の決定なしに、フレームレートを重要度に対応づけることができ、なおかつ、ある程度の選択性をユーザーに与えることが可能となる。
実際に、2種類の屋外の道路で撮影したサンプル動画像(屋外動画像1、2)を用意して、本発明の有効性を検証した。学習用動画像には、頻度が高いと考えられる、人の歩行や、車の走行など日常風景が含まれている動画像を用いた。それに対し圧縮対象動画像には、頻度が低いと考えられる、柵の乗り越えや、人の転倒などが含まれている動画像を用いた。これらのサンプル動画像には既存圧縮法(MPEG4)が施されており、フレームレートは30fps、フレームサイズは320×240である。シーン分析では、累積寄与率の上限Cを0.9999とした。下限ポイントの設定には図5のような3種類(小、中、大)を用意した。図5は、下限ポイント大(最大フレームレート30fpsを割り当てる重要度の下限ポイントを、重要度の最大値に設定)、下限ポイント中(同じく下限ポイントを、重要度の最大値の3/4に設定)、下限ポイント小(同じく下限ポイントを、重要度の半値に設定)の場合の設定例である。図6は、下限ポイント大の場合の、重要度とフレームレートの例である。なお、実験プログラムの仕様上、割り当てられるフレームレートは、図6に示すように、元動画像のフレームレートの約数(整数)のみとなったが、適宜設定できる。
重要度に応じたフレームレートを動画像に施す具体的な処理としては、検出される重要度から1秒ごとの代表重要度として、1秒区間内の重要度の最大値を検出し、この代表重要度と前述したフレームレートの割り当て方により、1秒ごとにフレームレートを変化させた。屋外動画像1、2のシーン分析の結果から代表重要度を算出した結果をそれぞれ図7及び8に示す。そして、屋外動画像1、2の該代表重要度を用いてフレームレートを割り当てた結果をそれぞれ図9及び10に示す。図9と図10では、下限ポイント小の場合を実線、中の場合を破線、大の場合を点線で表す。この結果から、代表重要度に応じて割り当てられるフレームレートが変化していることが確認できる。また、下限ポイントに応じて、割り当てられるフレームレートが変化していることも確認できる。図9及び10の結果をもとに動画像のデータ量を、元動画を基準にして図11に示す。元動画とは、本実施の形態を施さず、その他の条件は同一にして再圧縮した動画像(既存の圧縮手法を施した動画像)のことである。図11に示した割合は、元動画に対する、本実施の形態を施した屋外動画像1と2のデータ量の割合である。下限ポイントの設定を小にした場合は、元動画の51%(屋外動画像1の場合)と68%(屋外動画像2の場合)、下限ポイントの設定を中にした場合は、元動画の44%(屋外動画像1の場合)と55%(屋外動画像2の場合)、下限ポイントの設定を大にした場合は、元動画の40%(屋外動画像1の場合)と44%(屋外動画像2の場合)であった。このことから、下限ポイントの設定に応じて圧縮効果が変化したことが確認できる。屋外動画像1、2共に、下限ポイントが「大」の場合に最大のデータ量削減効果を得ることができ、屋外動画像1においては、60%の削減効果が確認できた。
(比較例)
重要度を「質的」に扱う二値による従来の圧縮法を屋外動画像1に施したところ、データ量削減効果は約42%であった。ここで、重要か重要でないかを判別するための閾値は、図5に示す下限ポイント「小」の位置(検出される重要度の最大値の半値)に設定し、重要なシーンを30fps、重要ではないシーンを、視認性の観点から現実的であると考えられる5fpsとした。一方、重要度を「量的」に扱う本実施の形態を屋外動画像1に施したものは、上述のようにデータ量が51%でありデータ量削減効果は約49%(下限ポイント「小」の場合)である。このことから、重要度を「量的」に扱う本実施の形態1又は2の圧縮方法の方が、データ量削減効果が高いことが確認できた。
(第3の実施の形態)
第1及び2の実施の形態では、フレームレートを可変にして圧縮率を変化させたが、第3の実施の形態では、重要度に対応して、既存の圧縮手法において圧縮率を変化させることが可能な他のパラメータを可変にする。例えば、1枚の画像のピクセル数(解像度)に対応するフレームサイズを可変にすることにより、圧縮率を変える。または、各動画像の画質を可変にすることにより圧縮率を変えることができる。例えば量子化ビット数等の、既存圧縮手法における画質を制御する制御パラメータを変化させるとよい。さらには、フレームレート、フレームサイズ、画質を可変にする等の手法の組み合わせによって、重要度に対応して圧縮率を変化させ、重要なシーンほど低い圧縮率、重要ではないシーンほど高い圧縮率を採用することができる。
(第4の実施の形態)
第2の実施の形態では、最大フレームレートを割り当てる下限ポイントを選択性にしたが、第4の実施の形態では、最小フレームレートを割り当てる上限ポイントを選択性にする。また、第2の実施の形態の最大フレームレートを割り当てる下限ポイントを選択性にし、かつ、最小フレームレートを割り当てる上限ポイントを選択性にすることができる。
(第5の実施の形態)
映像の記録のための媒体容量や、保存可能なデータ量は限られるので、第5の実施の形態では、圧縮後の動画像のデータ量が所定の値に制限される場合の実施の形態を示す。図11の結果から、下限ポイントが小さくなるほどデータ量は大きくなり、下限ポイントが大きくなるほどデータ量は小さくなることがいえる。そこで、本実施の形態では、圧縮後の目標データ量を指定して、最大フレームレート30fpsを割り当てる重要度の下限ポイントを自動調整し、指定データ量に近づける。
具体的な工程を以下説明する。圧縮後の目標データ量を指定して、最大フレームレート30fpsを割り当てる重要度の下限ポイントを探索し、探索された下限ポイントの位置で実際に動画像に圧縮をかける工程を1パス目とする。
まず1パス目を次のように行う。動画像をシーン分析し、フレームごとの重要度を算出する。圧縮後に残す総フレーム数と圧縮後のデータ量が比例の関係にあると仮定すれば、下限ポイントをある値に設定した場合の圧縮後データ量の予想値が求まる。例えば、シーン分析の結果、ある下限ポイントの設定値で、圧縮後の総フレーム数が、元動画の半分になったとすると、圧縮後のデータ量は、元動画の半分のデータ量になると予想できる。仮に、この予想値がユーザーの指定した目標データ量よりも大きな値であれば、より圧縮率を上げるために、下限ポイントの設定を上方修正する必要がある。逆に予想値が目標データ量よりも小さな値であれば、圧縮率を下げるために、下限ポイントの設定を下方修正する必要がある。そこでこの予想値が、ユーザーの指定した目標データ量にほぼ一致するように、最適な下限ポイントの位置を探索する。探索には、予想値と目標値との誤差を評価関数として、例えば2分法などの既存の探索手法を用いれば圧縮後のデータ量の計算回数(予想回数)が少なくてすむ。仮にこの探索時に圧縮後のデータ量の予想値ではなく、実際に圧縮をかけた際のデータ量を用いた場合は、探索点の移動毎に圧縮処理を伴うため非常に時間がかかることになるが、本実施の形態の方法によれば予想値を用いて探索を行うので、探索にかかる時間を大幅に短縮できる。次に最適な下限ポイントの位置(予想値を用いた探索なので実際には最適ではない)が探索により発見された後、発見された下限ポイントの位置で、実際に上記第1の実施の形態のように圧縮をかける。ここで、最適な下限ポイントの位置(ユーザーの指定した目標データ量を満たすと予想される下限ポイントの位置)が前記探索によって発見されない場合はユーザーに警告するとよい。
続いて2パス目を次のように行う。実際には「フレーム数とデータ量」は正確には比例の関係にはないことから、ユーザーの指定したデータ量から乖離する。そこで、圧縮後のデータ量の予想値と実際に圧縮処理の結果得られたデータ量との誤差を補正する。1パス目で得られたデータ量が予想値のA倍(つまりはユーザーの指定したデータ量のA倍)であったとすれば、2パス目のデータ量の目標値をA分の1とすることで再度探索を行う。1パス目と同様に再探索の際には、予想値のみを用いて圧縮処理は行わない。再探索の結果得られた新たな下限ポイントで再度圧縮をかけて終了する。2パス目の圧縮後でもユーザーの指定値からはずれている可能性があるが、1パス目で終了するよりも高い精度が得られる。また、さらに同様の下限ポイント位置探索及び圧縮を繰り返すことにより高精度が得られる。
圧縮率を可変にする方法として、フレームレートを可変にする場合で説明したが、フレームレート以外のフレームサイズや画質を可変にする等の制御パラメータを可変にする場合、解像度(ピクセル数)とデータ量が比例の関係にあるとの仮定や、画質の制御パラメータとデータ量が数式で表せるような単純な関係にあるとの仮定をおいて同様に実施できる。本実施の形態のように、下限ポイントをユーザーの要求するデータ量に応じて自動で調整するようにすれば、利便性が向上する。また自動調整するパラメータを最大フレームレートを割り当てる下限ポイントとして説明したが、第4の実施の形態で述べたように最小フレームレートを割り当てる上限ポイントを自動調整してもよく、さらに、下限ポイントと上限ポイントの二つを同時に自動調整してもよい。
上記実施の形態で示した例は、発明を理解しやすくするために記載したものであり、この形態に限定されるものではない。
本発明によれば、監視映像データの保存容量が大幅に削減可能となり、算出された重要度をインデックスとしてユーザーに提供することで、映像データ検証時の作業効率も向上させられる。これにより大規模の監視カメラシステム(100台規模)においては特に大きな付加価値を与えられる。また監視映像保存の仕組みをネットワーク上(クラウドなど)で長期保存するサービスにおいても有用である。

Claims (10)

  1. 動画像を圧縮する方法であって、
    動画像上で頻繁に起こる行動からの逸脱の度合いを重要度とし、該重要度を立体高次局所自己相関特徴を用いて算出し、
    該重要度が高いシーンほど圧縮率を小さくし、重要度が低いシーンほど圧縮率を高くするように、重要度の値に応じて圧縮率を漸次変化させることを特徴とする動画像圧縮方法。
  2. 前記圧縮率は、フレームレート、フレームサイズ、画質制御パラメータのいずれか1つ以上を変化させることにより、漸次変化させることを特徴とする請求項1記載の動画像圧縮方法。
  3. 前記圧縮率を、フレームレートを変化させることにより漸次変化させ、前記重要度が高いシーンほど高フレームレートを採用し、前記重要度が低いシーンほど低フレームレートを採用することを特徴とする請求項2記載の動画像圧縮方法。
  4. 前記フレームレートの最大フレームレートを割り当てる重要度の下限ポイントを、可変にすることを特徴とする請求項3記載の動画像圧縮方法。
  5. 前記下限ポイントを、目標とするデータ量に応じて自動調整することを特徴とする請求項4記載の動画像圧縮方法。
  6. 動画像を圧縮する装置であって、
    動画像上で頻繁に起こる行動からの逸脱の度合いを重要度とし、該重要度を立体高次局所自己相関特徴を用いて算出する重要度算出部と、
    該重要度が高いシーンほど圧縮率を小さくし、重要度が低いシーンほど圧縮率を高くするように、重要度の値に応じて圧縮率を漸次変化させる圧縮処理部と、
    を備えることを特徴とする動画像圧縮装置。
  7. 前記圧縮処理部は、フレームレート、フレームサイズ、画質制御パラメータのいずれか1つ以上を変化させることにより、圧縮率を漸次変化させることを特徴とする請求項6記載の動画像圧縮装置。
  8. 前記圧縮処理部は、フレームレートを変化させることにより圧縮率を漸次変化させ、前記重要度が高いシーンほど高フレームレートを採用し、前記重要度が低いシーンほど低フレームレートを採用することを特徴とする請求項7記載の動画像圧縮装置。
  9. 前記圧縮処理部は、前記フレームレートの最大フレームレートを割り当てる重要度の下限ポイントが可変であることを特徴とする請求項8記載の動画像圧縮装置。
  10. 前記圧縮処理部は、前記下限ポイントを、目標とするデータ量に応じて自動調整することを特徴とする請求項9記載の動画像圧縮装置。
JP2009201608A 2009-09-01 2009-09-01 動画像の圧縮方法及び圧縮装置 Expired - Fee Related JP5190968B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009201608A JP5190968B2 (ja) 2009-09-01 2009-09-01 動画像の圧縮方法及び圧縮装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009201608A JP5190968B2 (ja) 2009-09-01 2009-09-01 動画像の圧縮方法及び圧縮装置

Publications (2)

Publication Number Publication Date
JP2011055204A true JP2011055204A (ja) 2011-03-17
JP5190968B2 JP5190968B2 (ja) 2013-04-24

Family

ID=43943769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009201608A Expired - Fee Related JP5190968B2 (ja) 2009-09-01 2009-09-01 動画像の圧縮方法及び圧縮装置

Country Status (1)

Country Link
JP (1) JP5190968B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014179830A (ja) * 2013-03-15 2014-09-25 Panasonic Corp 画像符号化装置、撮影システム、撮影記録システム、画質符号化方法、及び画像符号化制御プログラム
JP2016149605A (ja) * 2015-02-10 2016-08-18 日本電信電話株式会社 映像符号化ストリーム生成方法、映像符号化ストリーム生成装置及び映像符号化ストリーム生成プログラム
CN109036441A (zh) * 2014-03-24 2018-12-18 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
WO2021019950A1 (ja) * 2019-07-29 2021-02-04 コベルコ建機株式会社 建設機械のデータ処理システム
CN114630120A (zh) * 2020-12-14 2022-06-14 瑞昱半导体股份有限公司 基于自适应压缩率的视频压缩方法与电路系统
CN116208863A (zh) * 2022-12-30 2023-06-02 浙江中尊检测技术有限公司 一种图像数据压缩上传方法、装置及电子设备
WO2023145447A1 (ja) * 2022-01-27 2023-08-03 ソニーグループ株式会社 情報処理方法、情報処理システム、およびプログラム
WO2023243398A1 (ja) * 2022-06-13 2023-12-21 コニカミノルタ株式会社 例外行動判別方法、例外行動判別プログラムおよび例外行動判別装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0630402A (ja) * 1992-07-13 1994-02-04 Canon Inc 画像符号化装置
JP2003153007A (ja) * 2001-07-23 2003-05-23 Eastman Kodak Co 画像重要度に基づく画像圧縮制御システム及び方法
JP2006079272A (ja) * 2004-09-08 2006-03-23 National Institute Of Advanced Industrial & Technology 異常動作検出装置および異常動作検出方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0630402A (ja) * 1992-07-13 1994-02-04 Canon Inc 画像符号化装置
JP2003153007A (ja) * 2001-07-23 2003-05-23 Eastman Kodak Co 画像重要度に基づく画像圧縮制御システム及び方法
JP2006079272A (ja) * 2004-09-08 2006-03-23 National Institute Of Advanced Industrial & Technology 異常動作検出装置および異常動作検出方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6011064007; 坂部史生(外5名): '" 学習型シーン分析を用いた動画像圧縮保存法の検討"' 映像情報メディア学会冬季大会講演予稿集(CD-ROM) VOL.2008年, 20081120, p.9-17, (社) 映像情報メディア学会 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014179830A (ja) * 2013-03-15 2014-09-25 Panasonic Corp 画像符号化装置、撮影システム、撮影記録システム、画質符号化方法、及び画像符号化制御プログラム
CN109087654B (zh) * 2014-03-24 2023-04-21 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN109036441A (zh) * 2014-03-24 2018-12-18 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN109087654A (zh) * 2014-03-24 2018-12-25 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN109036441B (zh) * 2014-03-24 2023-06-06 杜比国际公司 对高阶高保真立体声信号应用动态范围压缩的方法和设备
US11838738B2 (en) 2014-03-24 2023-12-05 Dolby Laboratories Licensing Corporation Method and device for applying Dynamic Range Compression to a Higher Order Ambisonics signal
JP2016149605A (ja) * 2015-02-10 2016-08-18 日本電信電話株式会社 映像符号化ストリーム生成方法、映像符号化ストリーム生成装置及び映像符号化ストリーム生成プログラム
WO2021019950A1 (ja) * 2019-07-29 2021-02-04 コベルコ建機株式会社 建設機械のデータ処理システム
CN114630120A (zh) * 2020-12-14 2022-06-14 瑞昱半导体股份有限公司 基于自适应压缩率的视频压缩方法与电路系统
CN114630120B (zh) * 2020-12-14 2024-03-29 瑞昱半导体股份有限公司 基于自适应压缩率的视频压缩方法与电路系统
WO2023145447A1 (ja) * 2022-01-27 2023-08-03 ソニーグループ株式会社 情報処理方法、情報処理システム、およびプログラム
WO2023243398A1 (ja) * 2022-06-13 2023-12-21 コニカミノルタ株式会社 例外行動判別方法、例外行動判別プログラムおよび例外行動判別装置
CN116208863A (zh) * 2022-12-30 2023-06-02 浙江中尊检测技术有限公司 一种图像数据压缩上传方法、装置及电子设备

Also Published As

Publication number Publication date
JP5190968B2 (ja) 2013-04-24

Similar Documents

Publication Publication Date Title
JP5190968B2 (ja) 動画像の圧縮方法及び圧縮装置
JP6016332B2 (ja) 画像処理装置、画像処理方法
JP5478047B2 (ja) 映像データ圧縮前処理方法およびこれを用いた映像データ圧縮方法と映像データ圧縮システム
US20190205654A1 (en) Methods, systems, and media for generating a summarized video with video thumbnails
RU2607774C2 (ru) Способ управления в системе захвата изображения, устройство управления и машиночитаемый носитель данных
US9224211B2 (en) Method and system for motion detection in an image
CN111401177A (zh) 基于自适应时空注意力机制的端到端行为识别方法及系统
US11558549B2 (en) Methods and devices for capturing high-speed and high-definition videos
TWI511529B (zh) 基於圖框相似性及視覺品質及興趣之圖框編碼選擇
EP2309454A2 (en) Apparatus and method for detecting motion
EP2950529B1 (en) Video image storage method and apparatus
KR20130091441A (ko) 물체 추적 장치 및 그 제어 방법
JP5801614B2 (ja) 画像処理装置、画像処理方法
JP5119740B2 (ja) 映像信号処理装置、映像信号処理方法、映像信号処理方法のプログラム及び映像信号処理方法のプログラムを記録した記録媒体
US20150288973A1 (en) Method and device for searching for image
KR102574353B1 (ko) 모바일 단말에서 유해 동영상 차단을 위한 단말 자원 기반의 적응적 프레임 추출 및 스트리밍 제어 시스템 및 방법
JP2020149604A (ja) 路面状態検出装置
CN105631419B (zh) 人脸识别方法及装置
CN110505480B (zh) 一种面向监控场景的快速感知视频编码方法
CN113038129A (zh) 一种用于机器学习的数据样本获取的方法及设备
KR101358576B1 (ko) 주관적/객관적 동영상 비교를 통해 사용자가 인식하는 화질 저하를 최소화 하는 동영상 트랜스코딩 최적화 방법
CN113630600A (zh) 人类视觉系统自适应视频编码
US12022096B2 (en) Human visual system adaptive video coding
Beniwal et al. Assessing the impact of video compression on background subtraction
KR101362654B1 (ko) 컬러 및 명암 분석 기술을 활용한 동영상 트랜스코딩 최적화 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120127

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121217

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130124

R150 Certificate of patent or registration of utility model

Ref document number: 5190968

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160208

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees