JP2019068248A - 画像処理装置、画像処理方法、及びプログラム - Google Patents

画像処理装置、画像処理方法、及びプログラム Download PDF

Info

Publication number
JP2019068248A
JP2019068248A JP2017191759A JP2017191759A JP2019068248A JP 2019068248 A JP2019068248 A JP 2019068248A JP 2017191759 A JP2017191759 A JP 2017191759A JP 2017191759 A JP2017191759 A JP 2017191759A JP 2019068248 A JP2019068248 A JP 2019068248A
Authority
JP
Japan
Prior art keywords
image
encoding
frame
image frame
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017191759A
Other languages
English (en)
Other versions
JP2019068248A5 (ja
JP6961443B2 (ja
Inventor
恵子 米沢
Keiko Yonezawa
恵子 米沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017191759A priority Critical patent/JP6961443B2/ja
Priority to US16/138,836 priority patent/US11095899B2/en
Priority to CN201811138852.1A priority patent/CN109587480B/zh
Publication of JP2019068248A publication Critical patent/JP2019068248A/ja
Publication of JP2019068248A5 publication Critical patent/JP2019068248A5/ja
Application granted granted Critical
Publication of JP6961443B2 publication Critical patent/JP6961443B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 圧縮符号化を行う際に、画像内で他の領域よりも著しく画質が劣化する領域が発生する可能性を低減することができる技術を提供する。【解決手段】 画像取得手段は、撮像手段によって撮像された動画の画像フレームを取得する。動体検出手段は、取得手段によって取得された画像フレームから動体を検出する動体検出処理を行う。符号化手段は、動体検出手段による動体検出処理の結果に基づいて、取得手段によって取得された画像フレームを符号化する。符号化手段は、符号化対象の画像フレームよりも前の画像フレームにおける動体検出結果に基づく動体領域が、符号化対象の画像フレームにおいて非動体領域となった変化領域を、他の非動体領域と異なる符号化制御又は符号化パラメータを用いて符号化する。【選択図】 図2

Description

本発明は、画像処理技術に関するものである。
近年、スマートフォンやデジタルビデオカメラ等の普及に伴い、撮像を行って画像データを生成する機会が増えている。その一方、データを記録しておくストレージの容量や、データを送受信する際の通信帯域には限りがある。そのため、画像データを効率的に圧縮する技術が求められている。画像圧縮の方法としては、H.264/AVCという標準規格が知られている。また、H.265/HEVCという標準規格も普及し始めている。
画像の圧縮符号化技術において、画質を調整するために、量子化パラメータ(Quantization Parameter)等のパラメータが規定されている。これらのパラメータを用いて、画質の劣化を防ぎつつ、データ量をできるだけ少なくすることが求められている。
特許文献1では、マクロブロックごとに動きベクトルを算出して、動きベクトルの値をもとに動き領域と静止領域の間の、動き境界領域を検出して、動き境界領域の量子化パラメータを設定する方法が開示されている。さらに、特許文献2では、マクロブロックの動き特徴と平坦さの特徴などに基づき、符号化モードを設定する方法が開示されている。
特開2010−130558号公報 特開2008−219147号公報
しかしながら特許文献1の方法では、動きベクトルが量子化の残差を小さくする場所を選択するもので必ずしも動きと一致するものではないことから、適切に、画質の劣化を防ぐことができない場合がある。特許文献1では、動きのスピードが小さい場合に、閾値による検出が難しくなる。また、特許文献2は、主観品質を考慮して符号化モードの設定を行っている。これらの従来技術では、画像によって、部分的に著しく画質が劣化してしまうことがある。
そこで、本発明の目的は、圧縮符号化を行う際に、画像内で他の領域よりも著しく画質が劣化する領域が発生する可能性を低減することができる技術を提供することである。
上記課題を解決するために、本発明の画像処理装置は以下の構成を備える。すなわち、撮像手段によって撮像された動画の画像フレームを取得する画像取得手段と、前記取得手段によって取得された画像フレームから動体を検出する動体検出処理を行う動体検出手段と、前記動体検出手段による前記動体検出処理の結果に基づいて、前記取得手段によって取得された画像フレームを符号化する符号化手段とを有し、前記符号化手段は、符号化対象の画像フレームよりも前の画像フレームにおける前記動体検出処理の結果に基づく動体領域が、前記符号化対象の画像フレームにおいて非動体領域となった変化領域を、他の非動体領域と異なる符号化制御又は符号化パラメータを用いて符号化する。
本発明によれば、圧縮符号化を行う際に、画像内で他の領域よりも著しく画質が劣化する領域が発生する可能性を低減することができる。
各実施形態に係る撮像装置の構成を含むネットワーク構成図である。 第1実施形態に係る撮像装置の構成を示すブロック図である。 第1実施形態に係る、画質劣化が生じている画像を模式的に示す図である。 H.264やH.265でIフレームとPフレームにおけるサイズの変動を模式的に示す図である。 第1実施形態の画像処理方法を示すフローチャートである。 第2実施形態に係る撮像装置の構成を示すブロック図である。 第2実施形態の画像処理方法を示すフローチャートである。 第2実施形態に係る背景画像を模式的に示す図である。 第2実施形態に係る背景画像において複雑度の高い領域と低い領域を模式的に示す図である。 各実施形態に係る撮像装置のハードウェア構成を示す図である。
以下、本発明の実施の形態を、添付の図面に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例であり、本発明は以下の実施形態で説明する構成に限定されるものではない。また、各実施形態は、監視目的の撮像を例に説明するが、各実施形態は、放送目的等、種々の目的の撮像技術に適用することも可能である。また、以下の説明において、ネットワークに接続して他の装置と通信可能な撮像装置(ネットワークカメラ)を例に説明するが、ネットワークに接続できない撮像装置にも適用可能である。また、撮像装置が画像処理装置としての機能を有している例について説明するが、撮像装置と画像処理装置とは別体にすることも可能である。
<第1実施形態>
本実施形態では、画像(フレーム)内で他の領域よりも著しく画質劣化が生じる可能性が高い領域を特定し、特定された領域に対して他の領域とは異なる符号化制御を行う。以下、本実施形態の撮像装置について説明する。なお、以下の説明において、動画の画像を例にして説明する。
図1は、撮像装置(画像処理装置)100を含むシステム構成図である。クライアント装置200は、撮像装置100の外部の機器である。撮像装置100とクライアント装置200は、ネットワーク300を介して相互に通信可能な状態に接続されている。
クライアント装置200は、撮像装置100に対して、映像(画像)ストリームの配信を要求する配信要求コマンドや、圧縮符号化に関するパラメータを設定するための設定コマンドを送信する。また、撮像装置100は、配信要求コマンドに応じて、映像ストリームをクライアント装置200に配信する。なお、クライアント装置200は、パーソナルコンピュータやタブレット端末、スマートフォンなどのコンピュータにプログラムをインストールすることで実現することもできる。
図2は、第1実施形態に係る撮像装置100を示すブロック図である。撮像装置100は、撮像部210、制御部220、記憶部230、圧縮符号化部240、通信部250、動体検出部260、及び領域特定部270を有している。
撮像部210は、レンズを通して結像した光を撮像素子において受光して、その受光した光を電荷に変換して、動画の画像データを生成する。撮像素子には、例えば、CMOSイメージセンサ(Complementary Metal Oxide SemicONductor Image Sensor)を用いることができる。また、撮像素子にはCCDイメージセンサ(Charge Coupled Device Image Sensor)を用いてもよい。また、撮像部210は、制御部220を通じて設定されるパラメータに応じて、ホワイトバランスや露出等を適宜、調整した画像データを生成(取得)するようにしてもよい。このように撮像部210が、画像取得部としても機能する例について説明する。ただし、画像取得部としての機能のみであれば、外部から動画の画像データを取得するようにしてもよい。
制御部220は、撮像装置100における各部の動作を制御したり、各種の処理を行ったりする。例えば、ホワイトバランスや露出等のカメラパラメータを撮像部210に設定したり、圧縮符号化に係る符号化パラメータを圧縮符号化部240に設定したりする。
動体検出部260は、撮像部210によって生成された画像データの各フレーム(画像フレーム)において、動体領域を検出する。例えば、動体検出部260は、フレーム間差分法や背景差分法を用いて、動体領域を検出する。これらの方法は、検出対象のフレームの画素値と、他の画像(例えば背景画像)の画素値との差分値に基づく検出方法である。
また、動体領域であるか否かの判定は、フレームを分割した所定のブロック毎に行ってもよい。その場合、例えば、ブロック内の半分以上の画素において、差分値が閾値を超える場合に、そのブロックを動体領域であると判定してもよい。また、動体領域であるか否かの判定を行うブロックは、圧縮符号化における、量子化パラメータを割り当てる単位(ブロック)であってもよい。例えば、H.264/AVCを用いる場合は、マクロブロックであってもよい。また、H.265/HEVCの場合は、CU、又は、複数のCUからなる単位であってもよい。
領域特定部270は、現フレームに対して行われた動体検出の結果と、現フレームよりも前のフレームに対して行われた動体検出の結果を比較して、画像(フレーム)内で他の領域よりも画質劣化が生じる可能性が高い領域を特定する。領域特定部270における処理の詳細については後述する。
圧縮符号化部240は、領域特定部270によって特定された領域の位置に基づき、現フレームの圧縮符号化を行う。圧縮符号化部240における処理の詳細についても後述する。
記憶部230は、制御部220が処理を行う際に必要なプログラムや、各種の情報等を記憶する。例えば、撮像部210で取得した画像データに対するホワイトバランスや露出等のカメラパラメータに関する情報や、圧縮符号化に関するパラメータ等を記憶する。これらの情報は、適宜、他の各部によって読み取られて、利用される。
通信部250は、圧縮符号化部240によって符号化された画像データを、例えば、ストリーム形式で、ネットワーク300を通じてクライアント200に送信する。
ここで、各実施形態で低減しようとしている画質劣化について説明する。
最初に、各実施形態で低減しようとしている画質劣化を更に目立たせる原因となり得る圧縮技術について説明する。監視目的で設置される撮像装置では、通常のビデオカメラと比べて取得される画像に動きが少ない場合や注目すべきターゲットが限定される場合が多い。そこで、これらの特徴に適した圧縮技術が用いられることがあるが、これらの圧縮技術によって、部分的に著しい画質劣化が生じてしまう可能性がある。
例えば、動的GOP技術という、動的にGOP(Group of Pictures)を変更する技術がある。
ここで、動的GOP技術について説明する。H.264/AVCやH.265/HEVCでは、Iフレームと呼ばれるフレームと、Pフレームと呼ばれるフレームがある。また、Bフレームと呼ばれるフレームも存在する。
ここで、Iフレームは、当該圧縮対象のIフレーム内の各領域において、他のフレームの画像を用いた予測を行うフレーム間予測(インター予測)を用いずに符号化を行うフレームである。つまり、Iフレームでは予測符号化を行う場合は、基本的にフレーム内予測(イントラ予測)が用いられる。また、PフレームやBフレームは、当該圧縮対象のフレーム内のいずれかの領域を圧縮符号化する場合に、フレーム間予測を用いて符号化を行うフレームである。
動的GOP技術とは、このIフレームとPフレームの割合を動的に制御する技術である。一般的に、IフレームはPフレームに比べて符号量(データ量)が大きくなる。GOP制御を行わない場合にはIフレームとPフレームの割合は一定だが、動的GOP制御では、画像の内容等に応じてIフレームをPフレームで置き換えることで全体の符号量を小さくする技術である。言い換えると、この技術は、Iフレームを挿入する間隔を、状況に合わせて動的に変更する技術である。
ここで、IフレームとP/Bフレームについて、更に詳細に説明する。
例えば、フレームの画像サイズが3840×2160画素、フレームレートは30fpsで、一秒間に30枚の撮像を行う場合について説明する。圧縮の画質を決めるqP(Quantization Parameter)値は例えば、32とすることができる。動的GOP技術を用いない場合のデフォルトのGOP長は1秒とする。このとき、フレームレートが30fpsなので、動的GOP制御を行わない場合には、30枚に1枚Iフレームが生成され、残りの29枚はPもしくはBフレームとなる。
図4は、Iフレーム410、PもしくはBフレーム420、GOP長430の関係を模式的に示している。ここで模式図の縦軸はフレームのサイズ(符号量の大きさ)を表し、横軸は時間軸を示している。また、符号量の大きなIフレーム410の後に、符号量の小さいPフレーム420が29枚作成されていることが示されている。このように、一般的に、IフレームがPやBフレームに比べて符号量が大きくなる。
なお、本実施形態ではBフレームは想定せず、Pフレームのみを用いる場合について説明するが、各実施形態において、Bフレームも用いるようにしてもよい。
以上のように、動的GOP技術によって、GOP長(Iフレームが発生してから次のIフレームまでの間隔)を長くすると、適宜、Iフレームの数を減らすことができるため、データ量の削減に効果的である。しかし、P/Bフレームでは、他のフレームの画像を用いて、符号化するため、他のフレームにおける画質劣化の影響を受け易い。つまり、Iフレームで符号化するまで、同じ場所に画質劣化が継続して発生することがある。
また、動的GOP技術のほかに、動的ROI技術という、動的にROI(Region of Interest)の位置を変更する技術がある。ROIとは、ユーザが注目すべき領域であり、ユーザによって設定されたり、撮像装置によって画像を解析して自動的に設定されたりする領域である。
動的ROIとは、画像中の動体が検出された位置等に応じて、動的にROIを設定する位置を変更して、部分的に高画質化する技術である。言い換えると、画像中の画質を高めるべき領域の位置を、状況に合わせて動的に変更する技術である。
ここで、圧縮符号化では、画像中の各領域を、それぞれ異なる量子化パラメータを用いて量子化して、符号化することが可能である。ここで、大きい量子化パラメータ値(以下qP値と称する)で圧縮するほど、画質は低下する。これは、量子化パラメータ値が大きくなるほど、量子化ステップが大きくなるからである。
よって、動的ROI技術によって、重要な領域のみ画質を向上させた場合、例えば、ROI以外の領域で、何らかの要因で画質劣化が生じていると、その劣化をさらに目立たせる可能性がある。
以上のように、本実施形態は、監視目的の撮像装置以外にも適用可能ではあるが、上述した画質劣化が目立つ可能性が高い技術と併用した場合により効果的である。
図3は、各実施形態で低減しようとしている画質劣化を模式的に示す図である。
図3は、一例として、IDカードの確認等に用いられるフラップゲートを動体である人320が通過するシーンを表している。オフィスビルなどでよくみられるように、背景となる壁領域310は、比較的、平坦である。そこにフラップゲートを通過する人320が通行しているが、その後方に画像の劣化330が生じている。図3に示したように、壁領域310が、比較的、単調な(平坦な)白っぽい色であるのに対して、通行人320の頭部が濃い色(黒色等)となる等、コントラストの差が大きい場合に、これらの画質劣化330が目立ちやすくなる。このような画質劣化の原因は、コントラストの差や、フレーム間予測における予測精度(動きベクトル探索精度)の低下が原因であると考えられる。いずれにしても、非動体領域(動体領域以外の領域)において、動体が通過した後に、画質劣化が発生することがある。つまり、動体がいなくなっても、動体の影響で壁等の非動体領域に画質劣化が残ってしまうことがある。
次に、図5のフローチャートを用いて、第1実施形態に係る撮像装置100による処理について説明する。
S510において、制御部230は、画像データに関する設定(情報)を記憶部250から取得して、撮像部210に設定する。ここで、画像データに関する情報とは、例えば、生成する画像のフレームレートや画像サイズ(解像度)である。例えば、本実施形態において、画像サイズは3840×2160画素、フレームレートは30fpsとする。
また、S510において、制御部230は、圧縮符号化に関する設定(情報)を記憶部250から取得して、圧縮符号化部260に設定する。本実施形態では、一例として、H.264に準拠した符号化で、動的ROIを実行する場合を想定する。また、qP値はROI内では32、非ROI(ROI以外の領域)では47とする。また本実施形態では動的GOPは行わずGOP長は10秒で固定とした場合を例として説明するが、固定GOPである場合に限定されるものではなく、動的GOPも併用してもよい。
次に、S520において、撮像部210は、設定された情報に従って、画像データを生成する。そして生成した画像データを、動体検出部260と圧縮符号化部240に出力する。
S530において、動体検出部260は、S520で生成された画像データの各フレームに対して動体検出処理を行う。画像データの全てのフレームに対して動体検出処理を行ってもよいし、数フレーム間隔で動体検出処理を行ってもよい。ここで動体検出の方法は複数の方法が知られている。一般的にはフレーム間の差分から動き領域を検出するフレーム間差分法や、背景画像を生成しておき、その差分から背景に対する前景として動き領域を検出する背景差分法がある。
フレーム間差分法を用いる場合は、動体検出部260は、動体検出対象のフレーム(現在のフレーム)の画素値と、そのフレームとは異なるタイミングに撮像されたフレーム(例えば1つ前のフレーム)の画素値との差分値を算出する。そして、その差分値が所定の閾値以上である領域を動体領域とする。
また、背景差分法を用いる場合は、例えば、動体がいないと想定される時に撮像されたフレームを背景画像とする。そして、その背景画像の画素値と、現在のフレームの画素値との差分値を算出する。そして、その差分値が所定の閾値以上である領域を動体領域とする。
なお、所定の閾値を超える画素の位置に基づいて、差分値が閾値よりも小さい画素を動体領域としてもよい。例えば、差分値が閾値よりも小さい画素の周りが、差分値が閾値以上の画素によって囲まれている場合は、その差分値が閾値よりも小さい画素も動体領域としてもよい。
背景差分法を用いる場合は、次のようにしてもよい。つまり、動体検出部260は、取得したフレームを複数の領域(ブロック)に分割して特徴量を抽出し、領域ごとに背景画像における特徴量との比較を行うことで、背景か前景(動体領域)かを判定する。ここでの領域は、ここではH.264のマクロブロックの単位である16×16ピクセルとするが、領域のサイズは画像サイズ等によって変更することが可能である。ここで用いた特徴量としては、領域内のピクセル輝度値をDCT(離散コサイン変換)変換した場合の、低周波数側の変換係数などを用いることができる。また、色情報なども用いてもよい。また、背景画像として、複数のフレームの平均値等を用いてもよい。
なお、背景画像の特徴量は、領域ごとに用意することができる。この領域ごとの特徴量は、画像が時間的に変化することに伴って、徐々に更新される。更新の方法としては、背景画像として参照される頻度が少なくなったものを新しい背景画像で置き換える方法を用いることができる。また、参照された際に現フレームの領域の特徴量が反映されるよう更新する方法も用いることができる。前者は背景自体がかわった場合に対応することができ、後者は日照の変化などで背景が徐々に変化していく場合に対応することができる。
動体検出部260は、こうして領域ごとに、保持されている複数の背景の特徴量と比較をすることで、背景(非動体領域)であるか、前景(動体領域)であるかを判断する。そして、孤立点除去(前景と判断された画素に囲まれた背景を前景とする処理)等の後処理を施して、最終的な動体領域を決定する。こうして取得した動体領域の位置を示す情報を、記憶部230に記憶させる。また、動体検出部260は、動体領域の位置を示す情報を領域特定部270に出力する。領域の位置を示す情報は、例えば、フレームの左上を原点とする、画素位置に基づく座標で表してもよいし、領域の位置が固定であれば、領域の番号であってもよい。
S540において、領域特定部270は、S530で取得した現フレームの動体領域の位置と、それより前のフレームで特定された動体領域の位置とを用いて、画質劣化が生じる可能性の高い領域である劣化可能性領域を特定する。
具体的には、領域特定部270は、記憶部230に記憶されている前フレームの動体領域の位置を示す情報を取得し、現フレームの動体領域の位置と比較して、現フレームでは非動体領域であるが、前フレームでは動体領域であった領域を特定する。
また、領域特定部270は、現フレームでの動体領域をROIとする。また、現フレームにおいて非動体領域で、かつ、前フレームでも非動体領域である領域は非ROIとする。また、上述したように、現フレームにおいて非動体領域で、かつ、前フレームで動体領域だった変化領域を、画質劣化が発生する可能性がある劣化可能性領域とする。そして、これらの特定結果を圧縮符号化部240に出力する。このように、劣化可能性領域は、動体領域から非動体領域へと変化した変化領域である。
次に、S550において、圧縮符号化部240は、S540で特定された各領域に応じた圧縮符号化の内容を決定する。例えば、予測方法やパラメータ(例えばqP値)を決定する。
例えば、ROIについては画質を高くするため、qP値を32とする。また、非ROIについては、ROIよりも15大きいqP値とする。つまり、qP値を47とする。また、劣化可能性領域については、非ROI領域であるが、qP値を32とする。このように、劣化可能性領域については、少なくとも他の非動体領域(ここでは非ROI)よりもqP値を小さくする。このようにすることで、画質劣化が発生するような状況であっても、それを低減することができる。なお、前述したように、qP値が小さい方が、大きいときよりも画質が高くなる。なお、ここでは、劣化可能性領域のqP値をROIと同じqP値とした。しかし、ROIのqP値として、より大きい値(たとえばqP値が36程度)が設定されている場合には、画質劣化による劣化を抑えるためにqP値をROIよりも小さく(画質を高く)してもよい。
また、劣化可能性領域は、数フレームに渡って、qP値を小さく(画質を高く)してもよいが、1フレームだけ、qP値を小さくするだけでも効果的である。
劣化可能性領域は、次のフレームで非ROIとなる可能性が高く、その場合には、qP値が大きな値となる。つまり、本実施形態の処理を実行せずに、画質劣化が生じてしまった場合、非ROIの状態が続いてしまう。そうすると、Iフレームが発生するまで、それ以降のフレームでも画質劣化した状態が続いてしまう。そのような劣化を抑えるために、一時的に符号量は大きくなるがqP値を小さく(画質を高く)して画質劣化の痕跡をなくしておくことで、それ以降のフレームでqP値を大きくする場合でも、小さい符号量で画質劣化の少ないフレームを生成できることになる。
また、劣化可能性領域に対する処理として、qP値を変えるのではなく、次のようにしてもよい。つまり、劣化可能性領域を、強制的にフレーム内予測を用いて符号化するようにしてもよい。言い換えると、フレーム間予測を用いないよう制限してもよい。なお、Pフレームであっても、部分的にはフレーム内予測を用いて符号化することができる。一般的に、前フレームで前景(動体領域)と判定され、現フレームで背景(非動体領域)となる領域は、予測残差が大きくなるためにフレーム間予測よりもフレーム内予測を用いて符号化される可能性が高くなる。ただし、当該領域の一部に前景が残っている場合などは、予測残差があまり大きくならずにフレーム内予測が選択されない場合がある。このような場合に、当該領域内の予測残差が大きい数ピクセル分の劣化が解消されずに残ってしまうことがある。そのため、劣化可能性領域を、フレーム内予測を用いて符号化することで、画質劣化を解消することができる。他にも、劣化可能性領域を、強制的に、I−PCMモードや変換量子化バイパスモードなどを用いて符号化するようにしてもよい。
また、劣化可能性領域に対する処理として、次のようにしてもよい。
H.265では最初にフレームを64×64のCTU(Coding Tree Unit)に分割する。そして、画像の複雑さなどに応じてCTUを更にCU(Coding Unit)に分割する。大きな単位でインター予測やイントラ予測を行った際の予測残差を評価すると、一部に残った予測残差の影響が小さくなりフレーム内予測が選択されにくくなることがある。そのため、劣化可能性領域に対して、より小さいCUにブロック分割(領域分割)されやすくするようにしてもよい。つまり、ブロック分割され易い条件を用いて、ブロック分割を判断するようにしてもよい。例えば、ブロックの複雑度が高い場合に分割を行うという条件の場合は、その判断条件の閾値を下げればよい。より小さいCUにした方が、より細かく予測方法やパラメータを設定して符号化できるため、画質を良くすることができる。
また、GOP長が長いほど、一度生じた画質劣化が画像中に長く残存する。そのため、設定されているGOP長に応じて劣化可能性領域の符号化制御を変えてもよい。設定されているGOP長が長い場合には、より強い画質劣化を抑制する処理を行う。ここでより強い画質劣化抑制処理とは、qP値を小さくする場合や、数フレームに渡ってフレーム内予測を用いる場合等が考えられる。
図5のフローチャートに戻り、S560において、圧縮符号化部240は、S550にて、決定した圧縮符号化の方法やパラメータに従って、現在のフレームを圧縮符号化する。そして圧縮符号化された画像データは、通信部250によって、外部の装置に送信される。なお、画像データは、送信せずに、図示を省略するストレージに記録するようにしてもよい。
S570において、制御部220は、圧縮符号化すべき画像データがあるか否かを判断する。圧縮符号化すべき画像データがあれば、S520に戻って、次の画像データの処理を継続する。圧縮符号化すべき画像データがなければ、処理を終了する。
なお、GOP長とビットレートの関係は、図4に示すように、動きのある図3のようなシーンであっても、PフレームはIフレームの10分の1程度の大きさとなる。そして、より動きの少ないシーンではその比率はさらに小さくなる。よってGOP間隔を長くすると、その分ビットレートは小さくなる。
具体的には、30fpsでIフレームに対するPフレームのデータ量の比が0.1程度のときは次のようになる。つまり、GOP長が2秒の場合は、GOP長が1秒の場合と比べてビットレートは約88%に削減される。また、GOP長が5秒の場合は、GOP長が1秒の場合と比べて、ビットレートが81%になる。そして、GOP長が20秒の場合は、GOP長が1秒の場合と比べて、ビットレートが78%程度に削減される。
また、より動きが少なくなり、Iフレームに対するPフレームのデータ量の比が0.01程度のときは次のようになる。つまり、GOP長が2秒の場合は、GOP長が1秒の場合と比べてビットレートが約61%に削減される。GOP長が5秒の場合は、GOP長が1秒の場合と比べてビットレートが39%に削減される。そして、GOP長が30秒の場合は、GOP長が1秒の場合と比べてビットレートが26%程度にまで削減される。よって、動きが少ないシーンでGOP長を長くすると、ビットレート削減の効果はより顕著になる。
GOP長と画質の関係については、一般的にGOP長が長くなると主観的な画質は劣化がひどくなっていることが多い。しかし、MSE(平均二乗誤差)やPSNR(ピーク信号対雑音比)SSIM(構造的類似性)など画質評価に一般的に用いられる指標では、その劣化の状態を定量的に検出するのは難しい。具体的には、図3で示したような動きのある画像の場合でも、最初の5フレームでPSNRが3.8%程度、15フレームで4.8%程度下がる。しかし、30フレームでも5%程度であり、それ以降ほとんど変わらなくなる。
また、同じ位置において画質劣化が継続する時間は、GOP長に依存することが多い。図3の画像では、左右から現れた人がフラップゲートを通過して見えなくなるまでに約10秒かかっているとする。また。たまにしか人が通らない場合を想定し、GOP長が30秒であるとする。また、30秒のうち10秒間においてIフレームに対するPフレームのデータ量の比0.1であるとする。また、残りの20秒間においてをIフレームに対するPフレームのデータ量の比が0.01であるとする。そうすると、GOP長が30秒である場合は、GOP長が1秒の場合と比べてビットレートを約57%とすることができる。しかし、人が通過した後に最大で20秒間、画質劣化が画像の広い範囲に残ることになる。
これに対して、本実施形態の処理を行った場合には、たとえば劣化可能性領域のqP値をROIと同じ値とした場合でも、GOP長が1秒の場合と比べて約63%のビットレートとなる。つまり、本実施形態の処理を行わずにGOP長を30秒とした場合と比較して、ビットレートは訳10%上昇するが、この程度の上昇で、画質劣化の目立たない動画の画像データを生成することができる。
また、本実施形態で説明した動体領域の検出を用いて劣化可能性領域を特定する方法は、動きベクトル探索に基づいて画質を制御する方法と比較して、次のメリットがある。
動きベクトル探索を用いると、フレームレートに対して相対的にスピードが遅い動きに対しては検出精度が悪くなることがある。具体的には、たとえば人が受付に来て手続きをするシーンなどにおいて、受付まで歩いてくるフレームでは正しく検出できるが、受付に留まっているフレームでは、前フレームとの動きの差がわずかであるために正しく動きベクトルを検出できないことがある。動きとして正しく検出されなければ、動き領域と非動き領域との境界領域の検出も困難になる。これに対して本実施形態で示した方法(特に背景差分法)では、背景には受付で手続きをする人は存在しないために、たとえその動きがわずかであっても、手続きをする人を前景として検出できる。このため、小さな動きや遅い動きであっても正しく検出できるために、「劣化可能性領域」を特定する精度も高くなる。
また、動きベクトル探索では動体が大きく、かつ、動体内で画像特徴に差が小さい可能性がある。具体的には、トラックなどが通過する際に、荷台の領域内は画像特徴がほとんど同じとなる。その場合、前フレームでは荷台の前方、現フレームでは荷台の後方となる領域における動きベクトルは検出できない場合がある。このような場合に、荷台の前方と後方にそれぞれ、動き領域と静止領域のペアが生じ、本来検出したい境界ではない荷台の中間部分に境界領域が設定される可能性がある。これに対して本実施形態で示した方法(特に背景差分法)では、背景は道路でトラックは存在しないために、正しくトラック全体を検出することができる。これによりトラックの荷台はすべてROIとされ、トラックが通過した後の領域である、トラックの後方に精度良く劣化可能性領域を設定することが可能となる。
以上説明したように、第1実施形態に係る撮像装置100では、圧縮符号化対象とする現在のフレームと、その前のフレームの動体検出結果に基づき、現フレームにおいて、画質が劣化する可能性の高い劣化可能性領域を特定する。そして、その領域について、他の非動体領域とは異なる符号化方法又は符号化パラメータを用いて圧縮符号化を行うことで、画質劣化する可能性を低減することができる。なお、ここでいう前のフレームとは、直前のフレームでもよいし、数フレーム前のフレームでもよい。また、本実施形態のように画質劣化の可能性を低減することで、結果として、動的GOP技術を用いるなどして、GOP長を長くしても、画質の劣化が目立ちにくくすることができる。
<第2実施形態>
次に、第2実施形態について説明する。なお、第1実施形態と同様な部分については、適宜、説明を省略する。
第1実施形態では、現フレームと前フレームの動体検出結果に基づいて、現フレームでは非動体領域であるが、前フレームでは動体領域であった領域を劣化可能性領域として特定した。本実施形態では、画質劣化があまり目立たない複雑度の高い領域を考慮した制御を行う。つまり、本実施形態においては、背景画像の複雑度を領域ごとに算出して記憶しておき、複雑度の大きさに応じて劣化可能性領域の圧縮符号化を変える実施形態について説明する。
図6は、第2実施形態に係る撮像装置100を示すブロック図である。但し、図8に示すブロック図は、複雑度算出部280以外は、図2に示す第1実施形態の撮像装置100とほぼ同様であるため、適宜、その説明は省略する。
複雑度算出部280は、動体検出部260によって取得された背景画像の複雑度を、背景画像内の領域ごとに算出する。なお、背景差分法を用いずにフレーム間差分法を用いる場合は、現在のフレームの各領域の複雑度を算出するようにしてもよい。
次に、図7のフローチャートを用いて、第2実施形態に係る撮像装置100による処理について説明する。ただし、S710、S720、S720、及び、S750以外は、図5に示す各ステップと同様であるため説明は省略する。
S710において、撮像部210は、背景画像を生成するための複数の画像(フレーム)を生成する。そして、それを記憶部230に記憶させる。
ステップ720において、複雑度算出部280は、S710で取得した背景画像生成用の画像を用いて、下記のように背景画像を生成する。
まず、動体検出部260は、記憶部230に記憶させた各フレームをそれぞれ所定の領域に分割する。例えば、16×16画素の領域に分割する。例えば、解像度が4K(3840×2176画素)の場合には、32640個の領域に分割することとなる。
そして、動体検出部260は、各領域の色情報や周波数成分等を特徴量として、各フレームにおけるそれぞれ対応する位置(同一の位置)にある各領域を、特徴の似ている領域が同じグループになるようにクラスタリング(分類)する。そして、最も大きなクラスタに含まれる領域のみを積算したものを背景画像に用いる領域とする。各フレームの画素値の平均値や中央値を算出し、それを背景画像に用いる領域の画像とする。このようにすることで、動体が存在する可能性がある画像の領域を除外することができる。そして、各領域において、同様な処理を行い、それらの領域をつなげたものを背景画像とする。
なお、背景画像の生成法は様々な方法が知られている。領域ごとに複数の背景を候補領域として保持する方法でもよし、時間変化につれて背景画像を変化させる方法を用いてもよい。例えば、背景画像の生成法は、第1実施形態のS530で示したように、一定時間の画像から小領域ごとに背景を抽出してつなぎ合わせても生成してもよいし、もしくは動きのないフレームを選択して背景画像とすることも可能である。図8に、図3で示したフラップゲートシーンの画像から生成した背景画像の例を示す。図8のように、可能な限り動体が存在しない背景画像を生成する。
また、背景画像を生成するために事前に各フレームの画像を取得しておく場合を想定している。しかし、背景画像の生成は、実施形態1で示したように、画像の圧縮・配信を行いながら生成・更新を行うことも可能である、ここで説明する場合に限定されるものではない。
次に、S730において、複雑度算出部280は、S720で生成した背景画像の複雑度を領域ごとに算出する。ここでいう領域とは、背景画像を生成するときに分割した各領域である。
複雑度算出部280は、例えば、カーネルサイズ13×13のフィルタによるフィルタリング処理を用いて各領域の複雑度を算出する。このフィルタは、垂直方向にはローパスフィルタ、水平方向にはバンドパスフィルタとなるカーネルと、その垂直成分と水平成分を交換したカーネルを用いることで、縦方向と横方向のエッジを抽出する。そして、ピクセルごとに算出したエッジの大きさを小領域ごとに積算することで、各小領域に対する複雑度を算出することができる。
図9に、図8で取得した背景画像に対して複雑度を算出した結果から、設定した閾値に基づき複雑度の高い領域と低い領域に分類した例の模式図を示す。図9では、所定の閾値よりも複雑度の小さい領域910と、所定の閾値以上の複雑度である領域920とが示されている。図8では、床部分に模様があるため、複雑度が高くなっている。なお、複雑度は2段階に分けなくてもよく、更に多数の段階に分類してもよいし、単に、複雑度合いを示す値そのものを用いてもよい。
S750において、圧縮符号化部240は、S540で取得した領域分割の結果と、S730で取得した背景画像の各領域の複雑度に基づいて符号化の制御を行う。
具体的には、S550と同様に、動体領域(ROI)のqP値を32、非ROIのqP値を47とする。そして、劣化可能性領域に対しては、複雑度が高い領域であれば非ROIと同じqP値47を、複雑度の低い領域であればROI内と同じqP値32を設定する。このように、劣化可能性領域であっても、その領域に対応する背景画像の複雑度に応じてqP値を変えている。
ここで、複雑度に応じた劣化可能性領域の符号化制御には、様々な方法を用いることが可能である。具体的には、劣化可能性領域のqP値を、背景の複雑度の値に応じて、ROI内外の値に連続的に変化させることが可能である。つまり、複雑度が高いほど、非ROIのqP値を47に近づき、複雑度が低い、ROIのqP値を47に近づくように、劣化可能性領域のqP値を決定してもよい。
また、劣化可能性領域の複雑度が閾値より低ければ、その領域の符号化モードをフレーム内予測モード(イントラ予測モード)とするようにしてもよい。
つまり、複雑度の高い領域は、qP値を下げたり符号化モードをイントラとしたりする場合の符号量の上昇が大きい。そのために、コスト対効果を考えると、複雑度の低い領域のみを対象として画質劣化対策を行う方が、ビットレートが上昇し過ぎないようにしながら、画質劣化を抑えることが可能となる。
以上説明したように、第2実施形態に係る撮像装置100では、現フレームと前フレームとの動体検出結果の比較に加えて、背景の複雑度も考慮してqP値等の符号化パラメータや符号化モード(イントラ予測やインター予測)を決定している。そのため、主観的な画質に影響の少ない領域を高画質化してビットレートの上昇を招くことを抑制し、主観的な画質への影響の大きい領域のみを対象とした画質劣化の抑制を行うことが可能となる。
<第3実施形態>
第2実施形態では、背景画像を生成し、背景画像に対する複雑度を算出することで、劣化可能性領域の符号化制御を、該領域の背景の複雑度に応じて変化させる方法について説明した。第3実施形態においては、画質劣化が目立つ劣化可能性領域を抽出するために、背景画像と前景(動体領域)とのコントラスト差が大きい領域を、画質劣化が目立つ領域であると判断する。
具体的には、第2実施形態において、S730で背景画像の複雑度を算出した後に、背景画像の領域ごとの色情報を取得しておく。ここで色情報とは、領域ごとのRGBの各平均値などが考えられる。
そして、S750で劣化可能性領域の符号化制御を行う際に、当該劣化可能性領域の色情報と、対応する背景画像の領域の色情報を比較し、差異が大きい場合(コントラストが大きい場合)により強い画質劣化抑制処理を行う。例えば、色情報の差分の平均値が所定の閾値以上の場合に差異が大きいと判断し、複雑度が低い領域と同様な処理を行う。ここでより強い画質劣化抑制処理とは、qP値を小さくする場合や、符号化モードをイントラにすることが考えられる。
(その他の実施形態)
次に、図10を用いて、各実施形態の各機能を実現するためのハードウェア構成を説明する。なお、撮像装置100におけるレンズや機構部分等以外は、図10に示すハードウェア構成により実現可能である。
RAM(Random Access Memory)451は、CPU(Central Processing Unit)450が実行するコンピュータプログラムを一時的に記憶する。また、RAM451は、通信インターフェイス453を介して外部から取得したデータ(コマンドや画像データ)などを一時的に記憶する。また、RAM451は、CPU450が各種の処理を実行する際に用いるワークエリアを提供する。また、RAM451は、例えば、フレームメモリとして機能したり、バッファメモリとして機能したりする。
CPU450は、RAM451に格納されるコンピュータプログラムを実行する。CPU以外にも、DSP(Digital Signal Processor)等のプロセッサやASIC(Application Specific Integrated Circuit)を用いてもよい。
HDD(Hard Disk Drive)452は、オペレーティングシステムのプログラムや画像データを記憶する。
HDD452に保存されているコンピュータプログラムやデータは、CPU450による制御に従って、適宜、RAM452にロードされ、CPU221によって実行される。HDD以外にもフラッシュメモリ等の他の記憶媒体を用いてもよい。バス454は、各ハードウェアを接続する。バス454を介して各ハードウェアがデータをやり取りする。以上が各実施形態におけるハードウェア構成である。
なお、本発明は、上述の実施形態の1以上の機能を実現するプログラムを1つ以上のプロセッサが読出して実行する処理でも実現可能である。プログラムは、ネットワーク又は記憶媒体を介して、プロセッサを有するシステム又は装置に供給するようにしてもよい。また、本発明は、上述の実施形態の1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
また、撮像装置の各部は、図10に示すハードウェアにより実現してもよいし、ソフトウェアにより実現することもできる。
また、本発明は以上説明した各実施形態に限定されることはなく、本発明の要旨を逸脱しない範囲において種々変更が可能である。例えば、各実施形態を組み合わせたものも本明細書の開示内容に含まれる。
210 撮像部
220 制御部
230 記憶部
240 圧縮符号化部
250 通信部
260 動体検出部
270 領域特定部
280 複雑度算出部

Claims (9)

  1. 撮像手段によって撮像された動画の画像フレームを取得する画像取得手段と、
    前記取得手段によって取得された画像フレームから動体を検出する動体検出処理を行う動体検出手段と、
    前記動体検出手段による前記動体検出処理の結果に基づいて、前記取得手段によって取得された画像フレームを符号化する符号化手段と
    を有し、
    前記符号化手段は、符号化対象の画像フレームよりも前の画像フレームにおける前記動体検出処理の結果に基づく動体領域が、前記符号化対象の画像フレームにおいて非動体領域となった変化領域を、他の非動体領域と異なる符号化制御又は符号化パラメータを用いて符号化する
    ことを特徴とする画像処理装置。
  2. 前記前の画像フレームは、前記符号化対象の画像フレームの直前の画像フレームである
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記符号化手段は、前記変化領域を、前記他の非動体領域よりも、量子化ステップが小さくなる量子化パラメータを用いて符号化する
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記符号化手段は、前記変化領域に対して、フレーム間予測を用いないよう制限した符号化制御を用いて、前記符号化対象の画像フレームを符号化する
    ことを特徴とする請求項1〜3のいずれか1項に記載の画像処理装置。
  5. 前記符号化手段は、前記変化領域を、GOP長に応じた量子化パラメータの値を用いて符号化する
    ことを特徴とする請求項1〜4のいずれか1項に記載の画像処理装置。
  6. 前記符号化手段は、前記変化領域に対して、前記他の非動体領域よりもブロック分割がされ易い条件の符号化制御を用いて、前記符号化対象の画像フレームを符号化する
    ことを特徴とする請求項1〜5のいずれか1項に記載の画像処理装置。
  7. 前記取得手段によって取得された画像フレームから背景画像を生成する背景画像生成手段と、
    前記背景画像における各領域の複雑度を算出する複雑度算出手段と
    を有し、
    前記符号化手段は、前記複雑度に更に基づいて、前記変化領域の前記符号化制御又は符号化パラメータを決定する
    ことを特徴とする請求項1〜6のいずれか1項に記載の画像処理装置。
  8. 撮像手段によって撮像された動画の画像フレームを取得する画像取得工程と、
    前記取得工程によって取得された画像フレームから動体を検出する動体検出処理を行う動体検出工程と、
    前記動体検出工程における前記動体検出処理の結果に基づいて、前記取得工程によって取得された画像フレームを符号化する符号化工程と
    を有し、
    前記符号化工程において、符号化対象の画像フレームよりも前の画像フレームにおける前記動体検出処理の結果に基づく動体領域が、前記符号化対象の画像フレームにおいて非動体領域となった変化領域を、他の非動体領域と異なる符号化制御又は符号化パラメータを用いて符号化する
    ことを特徴とする画像処理方法。
  9. 請求項1〜7のいずれか1項に記載の画像処理装置の各手段としてコンピュータを機能させることを特徴とするプログラム。
JP2017191759A 2017-09-29 2017-09-29 画像処理装置、画像処理方法、及びプログラム Active JP6961443B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017191759A JP6961443B2 (ja) 2017-09-29 2017-09-29 画像処理装置、画像処理方法、及びプログラム
US16/138,836 US11095899B2 (en) 2017-09-29 2018-09-21 Image processing apparatus, image processing method, and storage medium
CN201811138852.1A CN109587480B (zh) 2017-09-29 2018-09-28 图像处理设备、图像处理方法和记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017191759A JP6961443B2 (ja) 2017-09-29 2017-09-29 画像処理装置、画像処理方法、及びプログラム

Publications (3)

Publication Number Publication Date
JP2019068248A true JP2019068248A (ja) 2019-04-25
JP2019068248A5 JP2019068248A5 (ja) 2020-10-22
JP6961443B2 JP6961443B2 (ja) 2021-11-05

Family

ID=65897482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017191759A Active JP6961443B2 (ja) 2017-09-29 2017-09-29 画像処理装置、画像処理方法、及びプログラム

Country Status (3)

Country Link
US (1) US11095899B2 (ja)
JP (1) JP6961443B2 (ja)
CN (1) CN109587480B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021017505A (ja) * 2019-07-22 2021-02-15 積水化学工業株式会社 樹脂材料及び多層プリント配線板
JP2021022810A (ja) * 2019-07-26 2021-02-18 サイレックス・テクノロジー株式会社 符号化装置、再生装置、作成装置、再生システム、符号化方法、再生方法、作成方法、および、プログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201817780D0 (en) * 2018-10-31 2018-12-19 V Nova Int Ltd Methods,apparatuses, computer programs and computer-readable media for processing configuration data
CN111200734B (zh) * 2018-11-19 2022-03-11 浙江宇视科技有限公司 视频编码方法及装置
CN114521327A (zh) * 2019-07-05 2022-05-20 威诺瓦国际有限公司 视频译码中的残差的量化
CN110324708A (zh) * 2019-07-16 2019-10-11 浙江大华技术股份有限公司 视频处理方法、终端设备及计算机存储介质
US11188756B2 (en) * 2019-10-16 2021-11-30 Realtek Singapore Private Limited Object localization and classification system and method thereof
CN112929663B (zh) * 2021-04-08 2022-07-15 中国科学技术大学 一种基于知识蒸馏的图像压缩质量增强方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003523654A (ja) * 1999-12-07 2003-08-05 ソニー エレクトロニクス インク 時間的に前方及び後方の動きを分類する方法及び装置
JP2009268089A (ja) * 2008-04-04 2009-11-12 Fujifilm Corp 画像処理システム、画像処理方法、およびプログラム
JP2010130558A (ja) * 2008-11-28 2010-06-10 Toshiba Corp 動画像符号化装置および動画像符号化方法
JP2013187769A (ja) * 2012-03-08 2013-09-19 Panasonic Corp 符号化装置
JP2016111694A (ja) * 2014-12-03 2016-06-20 アクシス アーベー フレームのシーケンスをビデオ符号化するための方法及びエンコーダ

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6879723B1 (en) * 1999-11-12 2005-04-12 8X8, Inc. Method and apparatus for encoding frames of image data at a varying quality level
KR100803611B1 (ko) * 2006-11-28 2008-02-15 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
JP4748603B2 (ja) 2007-02-28 2011-08-17 株式会社Kddi研究所 動画像符号化装置
CN102325257A (zh) * 2007-07-20 2012-01-18 富士胶片株式会社 图像处理设备和图像处理方法
CN101494718B (zh) * 2009-01-23 2011-02-09 逐点半导体(上海)有限公司 图像编码方法和装置
CN101882316A (zh) * 2010-06-07 2010-11-10 深圳市融创天下科技发展有限公司 一种图像区域划分/编码方法、装置及系统
KR101840008B1 (ko) * 2011-06-24 2018-05-04 에스케이플래닛 주식회사 고화질 비디오 스트리밍 서비스 방법 및 시스템
JPWO2015005331A1 (ja) * 2013-07-10 2017-03-02 シャープ株式会社 画像復号装置および画像符号化装置
US9589363B2 (en) * 2014-03-25 2017-03-07 Intel Corporation Object tracking in encoded video streams
GB201417536D0 (en) * 2014-10-03 2014-11-19 Microsoft Corp Adapting quantization
JP6024999B2 (ja) * 2014-11-26 2016-11-16 パナソニックIpマネジメント株式会社 撮像装置、録画装置および映像出力制御装置
CN108780596B (zh) * 2016-02-29 2022-01-25 路标株式会社 信息处理系统
US10165310B2 (en) * 2016-06-10 2018-12-25 Affirmed Networks, Inc. Transcoding using time stamps
US10873763B2 (en) * 2017-06-02 2020-12-22 Apple Inc. Video compression techniques for high dynamic range data
US10582196B2 (en) * 2017-06-30 2020-03-03 Intel Corporation Generating heat maps using dynamic vision sensor events

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003523654A (ja) * 1999-12-07 2003-08-05 ソニー エレクトロニクス インク 時間的に前方及び後方の動きを分類する方法及び装置
JP2009268089A (ja) * 2008-04-04 2009-11-12 Fujifilm Corp 画像処理システム、画像処理方法、およびプログラム
JP2010130558A (ja) * 2008-11-28 2010-06-10 Toshiba Corp 動画像符号化装置および動画像符号化方法
JP2013187769A (ja) * 2012-03-08 2013-09-19 Panasonic Corp 符号化装置
JP2016111694A (ja) * 2014-12-03 2016-06-20 アクシス アーベー フレームのシーケンスをビデオ符号化するための方法及びエンコーダ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021017505A (ja) * 2019-07-22 2021-02-15 積水化学工業株式会社 樹脂材料及び多層プリント配線板
JP2021022810A (ja) * 2019-07-26 2021-02-18 サイレックス・テクノロジー株式会社 符号化装置、再生装置、作成装置、再生システム、符号化方法、再生方法、作成方法、および、プログラム

Also Published As

Publication number Publication date
CN109587480B (zh) 2023-03-24
US20190104314A1 (en) 2019-04-04
US11095899B2 (en) 2021-08-17
JP6961443B2 (ja) 2021-11-05
CN109587480A (zh) 2019-04-05

Similar Documents

Publication Publication Date Title
CN109587480B (zh) 图像处理设备、图像处理方法和记录介质
US11743471B2 (en) Method and system to improve the performance of a video encoder
US20220312021A1 (en) Analytics-modulated coding of surveillance video
US8139883B2 (en) System and method for image and video encoding artifacts reduction and quality improvement
CN105472205B (zh) 编码过程中的实时视频降噪方法和装置
US20130027581A1 (en) Adaptive auto exposure adjustment
WO2020103384A1 (zh) 视频编码方法、装置、电子设备及计算机可读存储介质
US8873869B2 (en) Image processing apparatus and control method for the same
US10735724B2 (en) Method and device for compressing image on basis of photography information
CN111010495A (zh) 一种视频降噪处理方法及装置
KR101585022B1 (ko) 영상 감시 시스템에 있어서 움직임 감지를 위한 스트리밍 정보 분석 시스템 및 움직임 감지를 위한 스트리밍 정보 분석 방법
US11281927B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable recording medium
US20150062371A1 (en) Encoding apparatus and method
US10917648B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
US10531001B2 (en) Controller, video camera, and method for controlling a video camera
US8488892B2 (en) Image encoder and camera system
US9654775B2 (en) Video encoder with weighted prediction and methods for use therewith
JP2021013146A (ja) 画像処理装置、画像処理方法
US10516896B2 (en) Encoding device, encoding method, and storage medium
WO2017104011A1 (ja) 画像符号化装置
EP3989587A1 (en) Image processing device and method of pre-processing images of a video stream before encoding
JP6624106B2 (ja) 画像読取装置、画像形成システム、画像読取方法及び画像読取プログラム
KR20170050120A (ko) 영상 신호의 노이즈 제거 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200909

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200909

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210914

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211013

R151 Written notification of patent or utility model registration

Ref document number: 6961443

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151