JP2020072395A - 画像処理装置、撮像装置、画像処理方法 - Google Patents

画像処理装置、撮像装置、画像処理方法 Download PDF

Info

Publication number
JP2020072395A
JP2020072395A JP2018205713A JP2018205713A JP2020072395A JP 2020072395 A JP2020072395 A JP 2020072395A JP 2018205713 A JP2018205713 A JP 2018205713A JP 2018205713 A JP2018205713 A JP 2018205713A JP 2020072395 A JP2020072395 A JP 2020072395A
Authority
JP
Japan
Prior art keywords
code amount
image
unit
information
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018205713A
Other languages
English (en)
Other versions
JP7299687B2 (ja
JP2020072395A5 (ja
Inventor
卓矢 豊田
Takuya Toyoda
卓矢 豊田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018205713A priority Critical patent/JP7299687B2/ja
Priority to US16/667,339 priority patent/US11645763B2/en
Publication of JP2020072395A publication Critical patent/JP2020072395A/ja
Publication of JP2020072395A5 publication Critical patent/JP2020072395A5/ja
Application granted granted Critical
Publication of JP7299687B2 publication Critical patent/JP7299687B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Closed-Circuit Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】画像中で互いに重なり合っている物体の視認性を考慮した画像符号化技術を提供する。【解決手段】動的ROI(Region Of Interest)装置は、現フレームの物体情報と、記録されている過去のフレームの物体情報とを用いて、物体間の前後関係を判断する比較部A1006と、前面情報が付加されている物体情報があるか否かを判定する判定部A1008と、互いに重なり合っている物体のうち前面の物体に対する符号量を設定する符号量設定部A1013と、前面の物体の領域を、物体について符号量設定部A1013が設定した符号量で符号化する符号化部A1014とを備える。【選択図】図1

Description

本発明は、画像の符号化技術に関するものである。
ユーザが注目している物体の画質を維持しつつ、映像を転送する際のビットレートを低減させる技術として動的ROI(Region Of Interest)が知られている。この技術では、検出した物体に対して領域を設定する。そして、ユーザが注目する物体が存在する領域(注目領域)には多くの符号量を設定して画質を上げ、ユーザが注目しない物体が存在する領域(非注目領域)には少ない符号量を設定して画質を下げてデータ量を削減することでビットレート低減を実現している。
しかしROIの設定によっては注目物体の視認性が低下する場合がある。特許文献1には、注目領域と背景領域との画質の差によって視認性が低下する問題に対し、注目領域と背景領域との間の境界領域にも異なる符号量を設定することによって視認性の低下を防ぐ方法が開示されている。また、非ROIの符号化頻度がROIより少ないときにROIに動きがあるとゴーストが生じてしまうという問題に対し、特許文献2には、次のような技術が開示されている。つまり、特許文献2には、前回フレームのROIのうち現フレームのROIと重なっていない領域を非ROIと同じ符号量で符号化してゴーストを防ぐことで視認性の低下を防ぐ方法が開示されている。
特開2009-27457号公報 特開2013-187769号公報
特許文献1及び特許文献2に記載の手法では、異なる符号量が設定されたROI同士が重なり合った場合の視認性の低下が考慮されていない。これは動的ROIで抽出した物体の特徴量を元に検出した物体に対して領域を設定するため、物体同士が重なり合って背後の物体の特徴量が減ることでその物体を検出できず、領域の設定ができなくなる。これによって、背後の物体が前面の物体と同じ領域で同じ符号量の設定となることで背後の物体の視認性が低下する。例えば低符号量が設定された木の領域の背後を高符号量が設定された人の領域が通過する際に、木の枝や幹、葉の隙間から人を視認できるにも関わらず、人のROI設定は木のROI設定と同様になってしまうことで視認性が低下してしまう。本発明では、画像中で互いに重なり合っている物体の視認性を考慮した画像符号化技術を提供する。
本発明の一様態は、画像中で互いに重なり合っている物体の属性に基づき、該互いに重なり合っている物体のうち前面の物体に対する符号量を設定する設定手段と、前記前面の物体の領域を、該物体について前記設定手段が設定した符号量で符号化する符号化手段とを備えることを特徴とする。
本発明の構成によれば、画像中で互いに重なり合っている物体の視認性を考慮した画像符号化技術を提供することができる。
動的ROIシステムの機能構成例を示すブロック図。 動的ROI装置A1002が行う処理のフローチャート。 画像D1を示す図。 画像D101を示す図。 画像D201を示す図。 画像D301を示す図。 画像D401を示す図。 画像D401中の物体領域を示す図。 コンピュータ装置のハードウェア構成例を示すブロック図。 動的ROI装置A1002が行う処理のフローチャート。 画像D601を示す図。 画像D701を示す図。
以下、添付図面を参照し、本発明の実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載した構成の具体的な実施形態の1つである。
[第1の実施形態]
先ず、本実施形態に係る動的ROIシステムの機能構成例について、図1のブロック図を用いて説明する。図1に示す如く、本実施形態に係る動的ROIシステムA1000は、映像を取得する映像取得装置A1001、該映像の各フレームの画像を符号化して出力する動的ROI装置A1002、符号化された各フレームの画像を復号して表示する表示装置A1003、を有する。
映像取得装置A1001と動的ROI装置A1002との間は、無線および/又は有線のネットワークを介して接続されている。また、動的ROI装置A1002と表示装置A1003との間は、無線および/又は有線のネットワークを介して接続されている。
先ず、映像取得装置A1001について説明する。映像取得装置A1001は、映像(動画像)を取得し、該映像を構成する各フレームの画像を動的ROI装置A1002に供給する装置である。映像取得装置A1001による映像の取得形態、供給形態については特定の取得形態、供給形態に限らない。
例えば映像取得装置A1001は、自身若しくは外部が保持する映像を取得し、該取得した映像における各フレームの画像を順次、動的ROI装置A1002に供給するようにしても良い。また映像取得装置A1001は、映像を撮像し、該撮像した映像における各フレームの画像を取得して順次、動的ROI装置A1002に供給するようにしても良い。
次に、動的ROI装置A1002(画像処理装置)について説明する。動的ROI装置A1002は、映像取得装置A1001から供給された各フレームの画像を符号化するが、その際、該画像中の各物体の領域を適切な符号量で符号化する。そして動的ROI装置A1002は、符号化した各フレームの画像を表示装置A1003に対して出力する。
映像取得部A1004は、映像取得装置A1001から供給される各フレームの画像を取得する。
領域分割部A1005は、映像取得部A1004が取得した画像に対して領域分割を行って、該画像中の物体の領域(物体領域)を検出し、該領域内の物体の属性(物体の種類など)を特定する。領域分割には、領域splitやSuper-parsing、DeepLearningによるfully CNN(Convolutional Neural Network)などの様々な手法が知られている。本実施形態では、高精度に領域分割できることからfully CNNを用いることを想定しているが、どの手法を用いてもよい。領域splitやSuper-parsing、fully CNNなどは公知の技術であることから、これらの領域分割技術に係る説明は省略する。そして領域分割部A1005は、画像から検出した物体領域ごとに、該画像における該物体領域を特定するための情報(例えば物体領域の左上隅および右下隅の座標位置)と、該物体領域内の物体の属性と、を含む物体情報を生成する。
比較部A1006は、領域分割部A1005が現フレームの画像について生成した物体情報と、記録部A1007に記録されている「過去のフレームの物体情報」と、を用いて、現フレームの画像上で重なり合っている物体間の前後関係や隠蔽関係を判断する。そして比較部A1006は、領域分割部A1005が現フレームの画像について生成した物体情報を出力するが、現フレームの画像上で互いに重なり合っている物体の物体情報は、物体間の前後関係や隠蔽関係を表す情報を付加してから出力する。
比較部A1006の動作について、具体例を挙げて説明する。図3に示す画像D1は、(f−2)フレーム目(fは3以上の整数)の画像であり、該画像D1からは人の物体領域P2と建物の物体領域P1とが検出されている。人の物体領域P2については、該物体領域P2内の物体の属性「人」と、画像D1における該物体領域P2を特定するための情報(例えば物体領域P2の左上隅および右下隅の座標位置)と、を含む物体情報が生成される。同様に、建物の物体領域P1については、該物体領域P1内の物体の属性「建物」と、画像D1における該物体領域P1を特定するための情報(例えば物体領域P1の左上隅および右下隅の座標位置)と、を含む物体情報が生成される。図3に示す如く、画像D1では、人および建物のうち一方が他方に重なる状況は発生していない。
図4に示す画像D101は、(f−1)フレーム目の画像(図3の画像D1より1フレーム後の画像)であり、該画像D101からは人の物体領域P102と建物の物体領域P101とが検出されている。人の物体領域P102については、該物体領域P102内の物体の属性「人」と、画像D101における該物体領域P102を特定するための情報(例えば物体領域P102の左上隅および右下隅の座標位置)と、を含む物体情報が生成される。同様に、建物の物体領域P101については、該物体領域P101内の物体の属性「建物」と、画像D101における該物体領域P101を特定するための情報(例えば物体領域P101の左上隅および右下隅の座標位置)と、を含む物体情報が生成される。図4に示す如く、画像D101では、画像D1から人が建物の背後に移動して、人の一部が建物に重なっている。
比較部A1006は、画像D101における人および建物の物体情報を領域分割部A1005から取得した場合、画像D101における人および建物の物体情報と、記録部A1007に記録されている「画像D1における人および建物の物体情報」と、を用いて、人と建物との前後関係や隠蔽関係を判断する。図3,4に示す如く、画像D101における人の物体領域P102は、建物の物体領域P101と隣接した状態で、その前のフレームにおける人の物体領域P2よりもサイズが小さくなっている。これは、人が建物の背後に移動したことで該人の一部が建物と重なっている(人は背面の物体、建物は前面の物体)ことを意味する。よって比較部A1006は、人の物体領域P102が建物の物体領域P101と隣接した状態で、その前のフレームにおける人の物体領域P2よりサイズが小さくなった場合、「人は建物と重なっている(人は背面の物体、建物は前面の物体)」と判断する。そして比較部A1006は、人の物体情報に「建物の背後に位置している」ことを表す情報(背面情報)を付加し、建物の物体情報に「人の前面に位置している」ことを表す情報(前面情報)を付加する。
図5に示す画像D201は、fフレーム目の画像(図4の画像D101より1フレーム後の画像)である。画像D201では、人が建物に隠蔽されていることから(建物に隠蔽されている人を点線で示している)、建物の物体領域P201は検出されるものの、人の物体領域は検出されない。また、人が建物に完全に隠蔽されてはないが、画像から人として検出されなかった場合(若しくは検出精度が閾値未満である場合)も同様に、人の物体領域は検出されない。よって、人の物体情報は生成されず、建物の物体領域P201については、該物体領域P201内の物体の属性「建物」と、画像D201における該物体領域P201を特定するための情報(例えば物体領域P201の左上隅および右下隅の座標位置)と、を含む物体情報が生成される。
比較部A1006は、画像D101で建物と重なっている(建物の背後に位置している)と判断していた人の物体領域が、画像D201から検出できなかった場合には、「人は建物に隠蔽された(人は背面の物体、建物は前面の物体である)」と判断する。そして比較部A1006は、「人は建物に隠蔽された(人は背面の物体、建物は前面の物体である)」と判断した場合、建物の物体情報に「人の前面に位置している(背後に人が位置している)」ことを表す前面情報を付加する。
このように比較部A1006は、一方の物体の物体領域が他方の物体領域と隣接している状態から、時間の経過と共に一方の物体の物体領域のサイズが小さくなっている間は、一方の物体の物体情報に「他方の物体の背後に位置している」ことを表す背面情報を付加し、他方の物体の物体情報に「一方の物体の前面に位置している」ことを表す前面情報を付加する。そしてその後、時間の経過と共にサイズが小さくなっていく一方の物体の物体領域が直前のフレームまでは検出されていたものの現フレームの画像からは検出されなくなった場合には、比較部A1006は、一方の物体は他方の物体に隠蔽されている状態であると判断し、他方の物体の物体情報に「一方の物体の前面に位置している」ことを表す前面情報を付加する。
なお、現フレームの画像上で重なっている物体間の前後関係および隠蔽関係を判断するための方法は上記の方法に限らず、様々な方法を適用することができる。また、重なっている物体や隠蔽関係にある物体を表す情報やその管理形態については上記の例に限らない。
記録部A1007は、過去の各フレームの画像中の物体の物体情報を記録する。
判定部A1008は、現フレームにおけるそれぞれの物体の物体情報を比較部A1006から取得する。そして判定部A1008は、比較部A1006から取得した物体情報のうち、前面情報が付加されている物体情報があるか否かを判定する(現フレームの画像で重なっている物体が存在するか否かを判定する)。以下では、前面情報が付加されている物体情報を、前面物体情報と称する。
判定部A1009は、現フレームの画像において重なっている物体のうち、重なってからの経過時間が規定時間を超える物体があるか否かを判断する。例えば判定部A1009は、前面物体情報に対応する物体(前面となる物体)を対象物体とする。そして判定部A1009は、該対象物体の物体情報に最初に前面情報が付加されてからの経過時間が規定時間以下であるのか否かを判断する。図3〜5の例では、人が建物と重なってからの経過時間が規定時間以下であるのか否かを判断する。この判断の結果、経過時間が規定時間を超えた場合には、判定部A1009は、前面物体情報から前面情報を削除する。経過時間の計時は判定部A1009が行う。
比較部A1010は、現フレームにおけるそれぞれの物体の物体情報と、物体の属性ごとに設定符号量が登録されている符号量テーブルA1012と、を用いて、重なり合っているそれぞれの物体(前面の物体と背面の物体)の設定符号量を比較する。符号量テーブルA1012には、物体の属性ごとに、該属性を有する物体の領域の符号量として予め設定された設定符号量が登録されている。
比較部A1010は、前面物体情報に含まれている「物体の属性」に対応する設定符号量を、「前面物体に対する設定符号量」として符号量テーブルA1012から取得する。また比較部A1010は、前面物体情報に付加されている前面情報が「物体Bの前面に位置している」ことを表す場合、物体Bの物体情報に含まれている属性に対応する設定符号量を「背面物体に対する設定符号量」として符号量テーブルA1012から取得する。そして比較部A1010は、「前面物体に対する設定符号量」と「背面物体に対する設定符号量」との大小比較を行う。そしてこの大小比較の結果、「前面物体に対する設定符号量」>「背面物体に対する設定符号量」の場合には、比較部A1010は、前面物体情報に付加されている前面情報を削除する。一方、この大小比較の結果、「前面物体に対する設定符号量」<「背面物体に対する設定符号量」の場合には、比較部A1010は、前面物体情報を後段の符号量変更部A1011に対して送出する。
比較部A1010の動作について、具体例を挙げて説明する。図6に示す画像D301には、木の物体領域P301、バスの物体領域P302、人の物体領域P303,P304が含まれている。符号量テーブルA1012には図6の場合、物体の属性「木」、「バス」、「人」、のそれぞれに対する設定符号量が登録されている。ここで、符号量テーブルA1012に登録されている木の設定符号量、人の設定符号量、バスの設定符号量、の大小関係は、木の設定符号量<人の設定符号量<バスの設定符号量であるものとする。
なお、より大きい符号量が設定されている物体領域は、より高画質で符号化され、より小さい符号量が設定されている物体領域は、より低画質で符号化される。「より高画質で符号化する」とは、「復号後の画質がより高画質となるように符号化する」ことであり、例えば、符号化に使用する量子化ステップをより小さくする。一方、「より低画質で符号化する」とは、「復号後の画質がより低画質となるように符号化する」ことであり、例えば、符号化に使用する量子化ステップをより大きくする。
本実施形態では、画像中のそれぞれの物体領域には、該物体領域中の物体の属性に対応する設定符号量が設定されるが、重なり合っている物体の物体領域の符号量については、該重なり合っている物体の属性に応じて変更する。図6の画像D301では、木、バス、人の何れも互いに重なり合っていないので、それぞれの物体の物体領域には、該物体の属性に対応する設定符号量が設定される。
図7に示す画像D401は、画像D301から数フレーム後の画像であり、画像D301から人が移動したことによって、人P403は木P401の背面に隠れており、人P404はバスP402の背面に隠れている。画像D401からは木P401は検出されたものの人P403は検出されず、その結果、木P401の物体領域として図8の物体領域P501が検出されたものとする。また、画像D401からはバスP402は検出されたものの人P404は検出されず、その結果、バスP402の物体領域として図8の物体領域P502が検出されたものとする。このような物体領域P501,P502のそれぞれの符号量は、次のようにして設定する。
比較部A1010は、バスP402の背後に位置する物体(人P404)を、バスP402の物体情報に付加されている前面情報から特定する。そして比較部A1010は、バスP402について符号量テーブルA1012に登録されている設定符号量と、人P404について符号量テーブルA1012に登録されている設定符号量と、の大小比較を行う。この大小比較の結果、前面の物体であるバスP402の設定符号量>背面の物体である人P404の設定符号量、であるので、比較部A1010は、前面の物体であるバスP402の物体情報に付加されている前面情報を削除する。
また、比較部A1010は、木P401の背後に位置する物体(人P403)を、木P401の物体情報に付加されている前面情報から取得する。そして比較部A1010は、木P401について符号量テーブルA1012に登録されている設定符号量と、人P403について符号量テーブルA1012に登録されている設定符号量と、の大小比較を行う。この大小比較の結果、前面の物体である木P401の設定符号量<背面の物体である人P403の設定符号量、であるので、比較部A1010は、前面の物体である木P401の物体情報を符号量変更部A1011に対して送出する。
符号量変更部A1011は、比較部A1010から受けた前面物体情報に付加されている前面情報が「物体Bの前面に位置している」ことを表す場合、物体Bの物体情報に含まれている属性に対応する設定符号量を符号量テーブルA1012から取得する。そして符号量変更部A1011は、該取得した設定符号量を、前面物体情報に対応する物体領域の符号量として設定する。つまり符号量変更部A1011は、互いに重なり合っている物体のうち背面の物体の設定符号量が前面の物体に対する設定符号量よりも大きい場合には、背面の物体の設定符号量を前面の物体に対する符号量として設定する。
図8の例では、木P401の物体領域P501の符号量として、木P401の背後に位置している人P403に対応する設定符号量が設定される。また、バスP402の物体領域P502の符号量は変わらない。物体領域P501では木P401の符号量を設定すると人P403の視認性が低下してしまうため、背後にいる人P403に対応する符号量を設定することで人の視認性を向上させる。また、物体領域P502ではバスP402の符号量を設定しても人P404の視認性は低下しないため、符号量の設定を変更しない。
符号量設定部A1013は、未だ符号量が設定されていない物体領域の物体情報中の属性に対応する設定符号量を符号量テーブルA1012から取得し、該取得した設定符号量を該物体領域の符号量として設定する。また符号量設定部A1013は、領域分割部A1005、比較部A1006、判定部A1008、判定部A1009、比較部A1010を経て得られる現フレームの物体情報を、記録部A1007に記録する。
符号化部A1014は、現フレームの画像を符号化するのであるが、該画像における物体領域については、該物体領域に対して上記の処理にて設定された符号量でもって符号化する。
映像出力部A1015は、符号化部A1014によって符号化された画像(符号化画像)を表示装置A1003に対して出力する。なお、符号化画像の出力先は表示装置A1003に限らず、動的ROI装置A1002の内部若しくは外部のメモリ装置を出力先としても良いし、動的ROI装置A1002と通信可能な外部装置を出力先としても良い。
次に、表示装置A1003について説明する。表示装置A1003は、映像出力部A1015から出力された符号化画像を復号して表示する。表示装置A1003は、復号した画像を液晶画面やタッチパネル画面に表示しても良いし、投影面に投影させても良い。図1では、表示装置A1003は動的ROI装置A1002とは別個の装置としているが、動的ROI装置A1002と表示装置A1003とを一体化させて1つの装置としても良い。
次に、動的ROI装置A1002が1フレーム分の画像を符号化して出力するために行う処理について、同処理のフローチャートを示す図2を用いて説明する。動的ROI装置A1002は、図2のフローチャートに従った処理を、映像取得装置A1001から取得する各フレームの画像について行う。また、図2のフローチャートに従った処理の終了条件は特定の条件に限らず、例えば、「ユーザが動的ROI装置A1002の不図示の電源スイッチをOFFにした」であっても良い。
ステップS201では、映像取得部A1004は、映像取得装置A1001から供給された画像を取得する。ステップS202では、領域分割部A1005は、ステップS201で取得した画像中の各物体の物体領域を検出し、物体領域ごとに物体情報を生成する。
ステップS203では、比較部A1006は、ステップS201で取得した画像上で互いに重なっている物体があるか否かを判断する。この判断の結果、ステップS201で取得した画像上で互いに重なっている物体がある場合には、処理はステップS204に進み、ステップS201で取得した画像上で互いに重なっている物体が無い場合には、処理はステップS210に進む。
比較部A1006は、一方の物体の物体領域が他方の物体の物体領域と隣接した状態で、その前のフレームにおける一方の物体領域よりサイズが小さくなった場合には、ステップS201で取得した画像上で互いに重なっている物体があると判断する。このときステップS204では比較部A1006は、一方の物体情報に「他方の物体の背後に位置している」ことを表す背面情報を付加し、他方の物体情報に「一方の物体の前面に位置している」ことを表す前面情報を付加する。
また比較部A1006は、直前のフレームまでは一方の物体と重なっていると判断していた他方の物体の物体領域が、ステップS201で取得した画像から検出できなかった場合、ステップS201で取得した画像上で互いに重なっている物体があると判断する。このときステップS204では比較部A1006は、一方の物体の物体情報に「他方の物体の前面に位置している」ことを表す前面情報を付加する。
ステップS205では、判定部A1008は、前面物体情報に対応する物体を対象物体とし、判定部A1009は、該対象物体の物体情報に最初に前面情報が付加されてからの経過時間Tが規定時間θ以下であるのか否かを判断する。
この判断の結果、経過時間Tが規定時間θ以下であれば、処理はステップS207に進み、経過時間Tが規定時間θを超えている場合には、処理はステップS206に進む。ステップS206では、判定部A1009は、前面物体情報から前面情報を削除する。
ステップS207では、比較部A1010は、「前面物体に対する設定符号量」と「背面物体に対する設定符号量」との大小比較を行う。そしてこの大小比較の結果、「前面物体に対する設定符号量」>「背面物体に対する設定符号量」の場合には、処理はステップS206に進む。一方、この大小比較の結果、「前面物体に対する設定符号量」<「背面物体に対する設定符号量」の場合には、処理はステップS208に進む。
ステップS208では、比較部A1010は、前面物体情報を後段の符号量変更部A1011に対して送出する。符号量変更部A1011は、該前面物体情報に付加されている前面情報が「物体Bの前面に位置している」ことを表す場合、物体Bの属性に対応する設定符号量を、前面物体情報に対応する物体領域の符号量として設定する。上記のステップS204〜S208の処理は、互いに重なっていると判断された物体ごとに行われる。
ステップS209では、符号量設定部A1013は、未だ符号量が設定されていない物体領域の物体情報中の属性に対応する設定符号量を符号量テーブルA1012から取得し、該取得した設定符号量を該物体領域の符号量として設定する。また符号量設定部A1013は、ステップS208の時点における現フレームの物体情報を、記録部A1007に記録する。
ステップS210では、符号化部A1014は、現フレームの画像を符号化するのであるが、該画像における物体領域については、該物体領域に対して上記の処理にて設定された符号量でもって符号化する。ステップS211では、映像出力部A1015は、ステップS210で符号化部A1014によって符号化された符号化画像を、表示装置A1003に対して出力する。
このように、本実施形態によれば、低い符号量が設定された物体の背後に高い符号量が設定された物体が位置する場合には、前面の物体の符号量を背面の物体に設定される符号量と同様にすることによって、背面の物体の視認性を向上させることができる。
なお、必要に応じてステップS205,S206は削除しても良く、その場合、重なってからの経過時間が規定時間を超える物体であっても、ステップS207以降の処理の対象とする。
また、「前面物体に対する設定符号量」と「背面物体に対する設定符号量」との大小比較の結果だけでなく、これらの差の大きさをも参酌して、設定する符号量を変更するようにしても良い。例えば、「前面物体に対する設定符号量」<「背面物体に対する設定符号量」の場合には、これらの設定符号量の差が大きいほどより大きい符号量を前面の物体に対して設定する。
[第2の実施形態]
本実施形態を含む以下の各実施形態では、第1の実施形態との差分について説明し、以下で特に触れない限りは第1の実施形態と同様であるものとする。本実施形態では、比較部A1010は、前面物体情報に含まれている「物体の属性」が、「該物体の背後に位置する物体の一部若しくは全部が視認可能な物体の属性」(視認属性)であるのか否かを判断する。そして比較部A1010は、前面物体情報に含まれている「物体の属性」が視認属性であれば、前面物体情報を後段の符号量変更部A1011に対して送出する。一方、比較部A1010は、前面物体情報に含まれている「物体の属性」が視認属性でなければ、前面物体情報に付加されている前面情報を削除する。
本実施形態に係る比較部A1010の動作について、具体例を挙げて説明する。図11に示す画像D601には、建物の物体領域P601、木の物体領域P602、人の物体領域P603,P604が含まれている。建物の物体領域P601、木の物体領域P602、人の物体領域P603,P604のそれぞれには設定符号量が設定済みであるものとする。
図12に示す画像D701は、画像D601から数フレーム後の画像であり、画像D601から人が移動したことによって、人P703は建物P701の背面に隠れており、人P704は木P702の背面に隠れている。ここで、建物P701の背後に位置する物体を建物P701を介して視認することはできないが、木P702は、その背後に隠れている物体を木の葉や枝の隙間を通して視認することができる。よって、この場合、符号量テーブルA1012の代わりに、物体の属性ごとに、該属性が視認属性であるのか否かが登録された視認属性テーブルを利用する。図11,12の場合、視認属性テーブルには、建物P701の属性は視認属性として登録されておらず、木P702の属性は視認属性として登録されていることになる。
よって本実施形態の場合、比較部A1010は、視認属性テーブルを参照して、前面物体情報に含まれている物体の属性が視認属性として視認属性テーブルに登録されているか否かを判断する。この判断の結果、前面物体情報に含まれている物体の属性が視認属性として視認属性テーブルに登録されている場合には、比較部A1010は、前面物体情報を後段の符号量変更部A1011に対して送出する。一方、この判断の結果、前面物体情報に含まれている物体の属性が視認属性として視認属性テーブルに登録されていない場合には、比較部A1010は、前面物体情報に付加されている前面情報を削除する。
次に、本実施形態に係る動的ROI装置A1002が1フレーム分の画像を符号化して出力するために行う処理について、同処理のフローチャートを示す図10を用いて説明する。動的ROI装置A1002は、図10のフローチャートに従った処理を、映像取得部A1004から取得する各フレームの画像について行う。また、図10のフローチャートに従った処理の終了条件については特定の条件に限らず、例えば、「ユーザが動的ROI装置A1002の不図示の電源スイッチをOFFにした」であっても良い。
ステップS1001では、比較部A1010は、視認属性テーブルを参照し、前面物体情報に含まれている物体の属性が視認属性として視認属性テーブルに登録されているか否かを判断する。この判断の結果、前面物体情報に含まれている物体の属性が視認属性として視認属性テーブルに登録されている場合には、処理はステップS208に進む。一方、この判断の結果、前面物体情報に含まれている物体の属性が視認属性として視認属性テーブルに登録されていない場合には、処理はステップS206に進む。
このように、本実施形態によれば、物体同士が重なっても、前面の物体を通して背後の物体を視認できる場合には、前面の物体の符号量を背面の物体に対応する符号量と同様にすることによって、背面の物体の視認性を向上させることができる。
[第3の実施形態]
図1に示した各機能部はハードウェアで実装しても良いが、一部をソフトウェアで実装しても良い。例えば、記録部A1007をメモリで実装し、符号量テーブルA1012や視認属性テーブルをデータとして実装し、それ以外の機能部をコンピュータプログラムで実装しても良い。この場合、記録部A1007としてのメモリを有し、符号量テーブルA1012や視認属性テーブルをデータとして有し、それ以外の機能部として実装したコンピュータプログラムを実行可能なコンピュータ装置は、動的ROI装置A1002に適用可能である。
動的ROI装置A1002に適用可能なコンピュータ装置のハードウェア構成例について、図9のブロック図を用いて説明する。このようなコンピュータ装置には、PC(パーソナルコンピュータ)、タブレット型端末装置、スマートフォン、などの装置が適用可能である。
CPU901は、RAM902やROM903に格納されているコンピュータプログラムやデータを用いて各種の処理を実行する。これによりCPU901は、コンピュータ装置全体の動作制御を行うと共に、動的ROI装置A1002が行うものとして上述した各処理を実行若しくは制御する。
RAM902は、ROM903や外部記憶装置906からロードされたコンピュータプログラムやデータを格納するためのエリアを有する。さらにRAM902は、I/F(インターフェース)907を介して外部から受信したデータ(例えば、映像取得装置A1001から受信した各フレームの画像)を格納するためのエリアを有する。またRAM902は、CPU901が各種の処理を実行する際に用いるワークエリアを有する。このようにRAM902は、各種のエリアを適宜提供することができる。ROM903には、コンピュータ装置の設定データや起動プログラムなどが格納されている。
操作部904は、キーボード、マウス、タッチパネルなどのユーザインターフェースにより構成されており、ユーザが操作することで、各種の指示をCPU901に対して入力することができる。
表示部905は、液晶画面やタッチパネルなどにより構成されており、CPU901による処理結果を画像や文字などでもって表示することができる。なお、表示部905は、画像や文字を投影するプロジェクタなどの投影装置であっても良い。
外部記憶装置906は、ハードディスクドライブ装置に代表される大容量情報記憶装置である。外部記憶装置906には、OS(オペレーティングシステム)、図1において記録部A1007、符号量テーブルA1012や視認属性テーブルを除く各機能部の機能をCPU901に実現させるためのコンピュータプログラムが保存されている。また、外部記憶装置906には、符号量テーブルA1012や視認属性テーブルのデータ、上記の説明で既知の情報としたもの(規定時間など)、が保存されている。外部記憶装置906に保存されているコンピュータプログラムやデータは、CPU901による制御に従って適宜RAM902にロードされ、CPU901による処理対象となる。
I/F907は、外部の機器との間のデータ通信を行うためのインターフェースとして機能するものであり、例えば、このI/F907には、上記の映像取得装置A1001や表示装置A1003を接続することができる。
CPU901、RAM902、ROM903、操作部904、表示部905、外部記憶装置906、I/F907は、バス908に接続されている。なお、動的ROI装置A1002に適用可能なコンピュータ装置のハードウェア構成は図9に示した構成に限らない。
また、上記の各実施形態では、映像取得装置A1001、動的ROI装置A1002、表示装置A1003のそれぞれは別個の装置としたが、このうち2つ以上を1つの装置に統合させても良い。例えば、上記の動的ROI装置A1002をカメラとしての映像取得装置A1001に組み込んでも良い。この場合、映像取得装置A1001は、自身が撮像した画像における各物体領域の符号量を設定し、該物体領域を該符号量に従って符号化してから出力する撮像装置として機能することになる。
以上説明した各実施形態やその変形例の一部若しくは全部を適宜組み合わせても構わない。また、以上説明した各実施形態やその変形例の一部若しくは全部を選択的に使用しても構わない。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
A1004:映像取得部 A1005:領域分割部 A1006:比較部 A1007:記録部 A1008:判定部 A1009:判定部 A1010:比較部 A1011:符号量変更部 A1012:符号量テーブル A1013:符号量設定部 A1014:符号化部 A1015:映像出力部

Claims (9)

  1. 画像中で互いに重なり合っている物体の属性に基づき、該互いに重なり合っている物体のうち前面の物体に対する符号量を設定する設定手段と、
    前記前面の物体の領域を、該物体について前記設定手段が設定した符号量で符号化する符号化手段と
    を備えることを特徴とする画像処理装置。
  2. 前記設定手段は、前記画像中で互いに重なり合っている物体のうち背面の物体の属性に対して予め設定されている設定符号量が、前記前面の物体の属性に対して予め設定されている設定符号量よりも大きい場合には、前記背面の物体に対して予め設定されている設定符号量を、前記前面の物体に対する符号量として設定することを特徴とする請求項1に記載の画像処理装置。
  3. 前記設定手段は、前記前面の物体の属性が、背面を視認が可能な物体の属性として予め設定されている属性であれば、前記背面の物体に対して予め設定されている設定符号量を、前記前面の物体に対する符号量として設定することを特徴とする請求項1に記載の画像処理装置。
  4. 前記設定手段は、前記画像中で互いに重なり合っていない物体、前記画像中で互いに重なり合っている物体のうち背面の物体、のそれぞれに対し、該物体の属性に対して予め設定されている設定符号量を設定することを特徴とする請求項1乃至3の何れか1項に記載の画像処理装置。
  5. 更に、
    前記画像中で互いに重なり合っている物体を検出する手段を備えることを特徴とする請求項1乃至4の何れか1項に記載の画像処理装置。
  6. 更に、
    前記符号化手段によって符号化された画像を出力する手段を備えることを特徴とする請求項1乃至5の何れか1項に記載の画像処理装置。
  7. 前記画像を取得する手段と、
    請求項1乃至6の何れか1項に記載の画像処理装置と
    を備えることを特徴とする撮像装置。
  8. 画像処理装置が行う画像処理方法であって、
    前記画像処理装置の設定手段が、画像中で互いに重なり合っている物体の属性に基づき、該互いに重なり合っている物体のうち前面の物体に対する符号量を設定する設定工程と、
    前記画像処理装置の符号化手段が、前記前面の物体の領域を、該物体について前記設定工程で設定した符号量で符号化する符号化工程と
    を備えることを特徴とする画像処理方法。
  9. コンピュータを、請求項1乃至7の何れか1項に記載の画像処理装置の各手段として機能させるためのコンピュータプログラム。
JP2018205713A 2018-10-31 2018-10-31 画像処理装置、撮像装置、画像処理方法 Active JP7299687B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018205713A JP7299687B2 (ja) 2018-10-31 2018-10-31 画像処理装置、撮像装置、画像処理方法
US16/667,339 US11645763B2 (en) 2018-10-31 2019-10-29 Image processing apparatus, image processing method, and non-transitory computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018205713A JP7299687B2 (ja) 2018-10-31 2018-10-31 画像処理装置、撮像装置、画像処理方法

Publications (3)

Publication Number Publication Date
JP2020072395A true JP2020072395A (ja) 2020-05-07
JP2020072395A5 JP2020072395A5 (ja) 2021-11-25
JP7299687B2 JP7299687B2 (ja) 2023-06-28

Family

ID=70548150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018205713A Active JP7299687B2 (ja) 2018-10-31 2018-10-31 画像処理装置、撮像装置、画像処理方法

Country Status (1)

Country Link
JP (1) JP7299687B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001177827A (ja) * 1999-12-21 2001-06-29 Canon Inc 画像処理装置及び方法並びに記憶媒体
JP2002016911A (ja) * 2000-06-29 2002-01-18 Toshiba Corp オブジェクト映像符号化装置
JP2009027457A (ja) * 2007-07-19 2009-02-05 Fujifilm Corp 画像処理装置、画像処理方法、及びプログラム
JP2009089354A (ja) * 2007-09-10 2009-04-23 Fujifilm Corp 画像処理装置、画像処理方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001177827A (ja) * 1999-12-21 2001-06-29 Canon Inc 画像処理装置及び方法並びに記憶媒体
JP2002016911A (ja) * 2000-06-29 2002-01-18 Toshiba Corp オブジェクト映像符号化装置
JP2009027457A (ja) * 2007-07-19 2009-02-05 Fujifilm Corp 画像処理装置、画像処理方法、及びプログラム
JP2009089354A (ja) * 2007-09-10 2009-04-23 Fujifilm Corp 画像処理装置、画像処理方法、およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
THANG, TRUONG CONG ET AL.: "Improvements of Scalability Information SEI Message", JVT-Q075, JPN6023019722, 11 October 2005 (2005-10-11), pages 1 - 9, ISSN: 0005061947 *

Also Published As

Publication number Publication date
JP7299687B2 (ja) 2023-06-28

Similar Documents

Publication Publication Date Title
US11756305B2 (en) Control apparatus, control method, and storage medium
EP3171596B1 (en) Image compression with adaptive quantization of regions of interest (roi)
CN109767453B (zh) 信息处理装置、背景图像更新方法和非暂态计算机可读存储介质
US20170213110A1 (en) Multi-stage image classification
JP6211715B2 (ja) ビデオのブラウジング方法、その装置、プログラム及び記録媒体
TWI606420B (zh) 用以產生動畫化影像之方法、裝置及電腦程式產品
US9971411B2 (en) Method, interactive device, and computer readable medium storing corresponding instructions for recognizing user behavior without user touching on input portion of display screen
JPWO2015029588A1 (ja) 画像処理システム、画像処理方法及びプログラム
US20220222831A1 (en) Method for processing images and electronic device therefor
WO2023160617A1 (zh) 视频插帧处理方法、视频插帧处理装置和可读存储介质
US9407835B2 (en) Image obtaining method and electronic device
US10965858B2 (en) Image processing apparatus, control method thereof, and non-transitory computer-readable storage medium for detecting moving object in captured image
US9942448B2 (en) Display control apparatus and method for controlling the same
JP2019180080A (ja) 映像処理装置、通信端末、テレビ会議システム、映像処理方法、およびプログラム
JP2020072395A (ja) 画像処理装置、撮像装置、画像処理方法
US11645763B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2017532925A (ja) サブジェクト指向圧縮システムおよび方法
US20200134840A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2013182450A (ja) 所在管理プログラム及び所在管理装置
US20220036093A1 (en) Information processing apparatus, information processing method, and storage medium
US10742937B2 (en) Watching apparatus, watching method, and recording medium
US20230177705A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2021013145A (ja) 動画像伝送装置、動画像伝送方法
JP2021056899A (ja) 画像処理装置、画像処理方法およびプログラム
JP2009266169A (ja) 情報処理装置及び方法、並びにプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211018

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230616

R151 Written notification of patent or utility model registration

Ref document number: 7299687

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151