JP2022028978A - 映像処理装置、表示装置、および映像処理方法 - Google Patents

映像処理装置、表示装置、および映像処理方法 Download PDF

Info

Publication number
JP2022028978A
JP2022028978A JP2018188379A JP2018188379A JP2022028978A JP 2022028978 A JP2022028978 A JP 2022028978A JP 2018188379 A JP2018188379 A JP 2018188379A JP 2018188379 A JP2018188379 A JP 2018188379A JP 2022028978 A JP2022028978 A JP 2022028978A
Authority
JP
Japan
Prior art keywords
image
video
input
detection
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018188379A
Other languages
English (en)
Inventor
龍昇 中村
Tatsunori Nakamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2018188379A priority Critical patent/JP2022028978A/ja
Priority to PCT/JP2019/039053 priority patent/WO2020071467A1/ja
Publication of JP2022028978A publication Critical patent/JP2022028978A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/66Transforming electric information into light information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)

Abstract

【課題】高解像度の入力映像において物体の像を検出する場合に、処理時間の長大化を抑制する。【解決手段】映像処理装置(1A)は、検出対象を含む物体の像を検出する検出回路(3)と、検出回路(3)の検出性能よりも高い解像度を有する入力映像(In1)からデータ容量が軽減された軽減画像を生成する軽減画像生成回路(122)と、を備える。検出回路(3)は、軽減画像を用いて物体の像が存在する第1領域を検出する。【選択図】図3

Description

以下の開示は、入力映像から物体の像を検出する映像処理装置、該映像処理装置を備えた表示装置、および映像処理方法に関する。
従来、入力映像から検出対象となる物体(例えば顔等)の像を検出した後、検出位置に基づいて該物体の像を含む映像を切り出す処理を行う技術が知られている(例えば、特許文献1、2参照)。
特開2013-17141号公報 特開2010-165052号公報
近年、高解像度の映像(例えば8K、4K等)が入力映像として用いられることがある。この場合、従来の技術では、入力映像から物体の像を検出する処理に長時間を要する。
本開示の一態様は、高解像度の入力映像において物体の像を検出する場合に、処理時間の長大化を抑制することができる映像処理装置、表示装置、および映像処理方法を提供することを目的とする。
上記の課題を解決するために、本開示の一態様における映像処理装置は、検出回路の検出性能よりも高い解像度を有する入力映像における検出対象を検出する映像処理装置であって、前記入力映像は、複数の入力画像から構成されており、前記検出対象を含む物体の像を検出する検出回路と、前記入力画像のデータ容量が軽減された第1画像を生成する第1画像生成回路と、を備え、前記検出回路は、前記第1画像を用いて、前記物体の像が存在する第1領域を検出する。
本開示の一態様における映像処理方法は、検出回路の検出性能よりも高い解像度を有する入力映像における検出対象を検出する映像処理方法であって、前記入力映像を構成する入力画像のデータ容量が軽減された第1画像を生成し、前記検出回路を用いて、前記第1画像における前記検出対象を含む物体の像が存在する第1領域を検出し、前記第1領域の検出結果に基づいて、前記第1領域を含む画像を前記入力画像から切り出して第2画像を生成し、前記第2画像を用いて、前記検出対象が存在する第2領域を検出する。
本開示の一態様によれば、高解像度の入力映像において物体の像を検出する場合に、処理時間の長大化を抑制することができる映像処理装置、表示装置、および映像処理方法を提供することができる。
本開示の実施形態1における映像処理装置の概要を示すブロック図である。 (a)は本開示の実施形態1における映像処理装置に入力される入力映像の一例を示す図であり、(b)は上記映像処理装置から出力される出力映像の一例を示す図である。 上記映像処理装置の要部構成を示すブロック図である。 上記映像処理装置による映像処理の一例について説明するためのタイムチャートである。 (a)は軽減画像に基づく物体の検出処理および切り出し画像の切り出し位置を決定する処理の一例について説明するための図であり、(b)は詳細検出用画像に基づく物体の検出処理および詳細切り出し画像の切り出し位置を決定する処理の一例について説明するための図である。 入力映像から出力映像を生成する処理の一例について説明するための図である。 本開示の実施形態1における映像処理方法について説明するフローチャートであり、(a)は初期化処理、(b)は検出準備を開始する処理、(c)は検出結果の情報を読み出す処理、(d)は映像出力処理についてそれぞれ示す図である。 上記映像処理装置の一変形例における合成処理回路が行う処理について説明するための図である。 (a)は一変形例の映像処理装置による映像処理の一例について説明するための図であり、(b)は上記映像処理装置から出力される出力映像の一例を示す図である。 (a)は本開示の実施形態2における映像処理装置に入力される入力映像の一例を示す図であり、(b)は上記入力映像を分割した様子を示す図である。 本開示の実施形態2における映像処理方法について説明するフローチャートである。 本開示の実施形態3における映像処理装置に入力される入力映像を分割した様子を示す図である。 (a)は本開示の実施形態4における映像処理装置の概要を示すブロック図であり、(b)は上記映像処理装置に入力される4系統の入力映像の一例を示す図であり、(c)は上記映像処理装置から出力される出力映像の一例を示す図である。 本開示の実施形態5における映像処理装置の概要を示すブロック図である。 (a)は上記映像処理装置に入力される入力映像の一例を示す図であり、(b)は上記映像処理装置から出力される出力映像の一例を示す図であり、(c)は上記映像処理装置から出力される他の出力映像の一例を示す図であり、(d)は上記映像処理装置から出力されるリスト表示有の出力映像の一例を示す図である。 (a)は本開示の実施形態6における映像処理装置による映像処理の一例について説明するための図であり、(b)は上記映像処理装置から出力される出力映像の一例を示す図である。 本開示の映像処理装置の適用例について示す図であり、(a)はカメラおよび録画装置と接続された場合、(b)は再生装置および録画装置と接続された場合、(c)は入力映像を処理して表示装置に出力する場合、についてそれぞれ示している。
以下、本開示の実施の形態について説明する。なお、本出願における各図面に記載した構成の形状および寸法(長さ、奥行き、幅等)は、実際の形状および寸法を反映させたものではなく、図面の明瞭化と簡略化とのために適宜変更している。図中同一または相当部分には同一符号を付してその説明は繰返さない。以下の特定の実施形態で説明する構成以外の構成については、必要に応じて説明を省略する場合があるが、他の実施形態で説明されている場合は、その構成と同じである。
〔実施形態1〕
本開示の一実施形態について、図1~7に基づいて説明すれば、以下のとおりである。
先ず、本実施形態における映像処理装置1Aの全体構成および映像処理について、図1および図2を用いて概略的に説明する。
<本開示の一態様における映像処理の概略的な説明>
図1は、本実施形態における映像処理装置1Aの概要を示すブロック図である。図2の(a)は、映像処理装置1Aに入力される入力映像In1の一例を示す図である。図2の(b)は、映像処理装置1Aから出力される出力映像Out1の一例を示す図である。
図1に示すように、本実施形態における映像処理装置1Aは、映像処理回路10A、フレームメモリ2、検出回路3、制御部4、およびシステムバス9を備えている。これらの各部の詳細については後述する。
図1および図2を参照して、本実施形態における映像処理装置1Aは、入力映像In1に基づいて検出対象(例えば人物の顔H1)を検出し、該検出対象を含む映像を入力映像In1から切り出すことにより出力映像Out1を生成する処理を行う。
ここで、近年、映像の高画質化について要望が高まっており、例えば4K、8K映像のような高い解像度の映像が用いられることが多くなりつつある。高画質化が進展している映像の一例としては、カメラ等を用いて撮像した映像、テレビ等に入力されるテレビ放送の映像、ブルーレイディスク等の記録メディアに記録された映像、等が挙げられる。
4K、8K映像等の高い解像度の映像に対して各種の映像処理を実行する場合、膨大な量のデータを処理することが必要となる。この場合、高い解像度の映像から物体の検出を行う検出回路は、高性能なデータ処理能力が求められる。しかし、そのような高い解像度の映像に対応可能な検出回路は、概して高価であり、かつ電力消費が大きい。そのため、映像処理装置に搭載する検出回路の性能を高くすることを制限される場合がある。
検出回路が対応する解像度(検出性能)よりも高い解像度の映像について検出処理を行う場合、従来の映像処理においては以下のような問題があった。すなわち、(i)入力映像における対象となる物体の像の探索範囲が広いため、該物体の像を検出する処理の時間が長大化する。(ii)探索範囲を縮小すると、物体の像を検出することが困難となる場合がある。(iii)処理時間を短縮するために並列処理を行うようにすると、コストが嵩む。
本実施形態における映像処理装置1Aは、概略的には以下のような映像処理を行う。すなわち、入力映像In1が高解像度な映像である場合、入力映像In1の縮小処理および切り出し処理のうち少なくともいずれかを行うことにより、入力映像In1を構成する入力画像のデータ容量を軽減した軽減画像を生成する。そして、映像処理装置1Aの検出回路3は、上記軽減画像を用いて、検出の対象物を含む物体の像が存在する領域を検出する。これにより、検出回路3による検出処理に要する時間の長大化を抑制することができる。
さらに、映像処理装置1Aは、上記検出処理により検出した領域を含む画像を入力映像In1から切り出した画像を生成する。検出回路3は、該画像に基づいて、検出対象が存在する領域を検出する。そして、映像処理装置1Aは、検出処理の結果に基づいて、入力映像In1から検出対象が存在する画像を切り出すことにより、出力画像を逐次生成していく。これにより、検出対象が存在する出力映像Out1を生成する。映像処理装置1Aは、このような映像処理を行う映像処理システムであるともいえる。
図2に示す例では、出力映像Out1は、入力映像In1と同じ画面サイズにて表示した場合、入力映像In1よりも低画質となり得る。しかし、本開示の一態様における映像処理装置の出力映像の画質は、このような例に限定されず、出力側の機器(パネル、モニタ等)および映像処理装置が含む映像処理回路の仕様、等により決定され得る。そのため、出力映像の画質が入力映像よりも低くなるとは限らない。
なお、本開示の一態様における映像処理装置の出力映像は、上記のような出力映像Out1と他の映像とを合成して生成されてもよい。
<用語の定義>
本明細書において、映像は1つまたは複数の画像データから構成されており、映像(画像)の「解像度」とは、映像の1フレームである画像データにおいて、該画像データを構成する複数の画素(picture element)の総数を意味する。例えば、4Kの解像度の映像とは、例えば3840×2160の画素からなる画像データを1フレームとする映像(以下、4K×2K映像と称することがある)である。例えば、8Kの解像度の映像とは、例えば7680×4320の画素からなる画像データを1フレームとする映像(以下、8K×4K映像と称することがある)である。なお、4Kの解像度および8Kの解像度の具体的な値は、上記の値に限定されない。また、本明細書において、画像データにおける横(幅)方向の画素の数を「幅解像度」、縦(高さ)方向の画素の数を「高さ解像度」と称することがある。この場合、上記解像度は、幅解像度×高さ解像度で表される。
或るサイズの画面に映像を表示させる場合、上記解像度は映像の細かさに関わり、表示装置の性能が対応していれば上記解像度が大きいほど映像は高精細になり得る。
また、本明細書において、或るサイズの画面に画像を表示した場合における画面上の画素密度のことを「画面解像度」と称する。本明細書において、「解像度」と「画面解像度」とは上記のように明確に区別して用いる。
そして、本明細書において、「高解像度映像」とは、映像処理装置に搭載されている検出回路3が対応する解像度よりも高い解像度の映像を意味する。つまり、或る映像が高解像度映像に該当するか否かは、検出回路3の性能に応じて相対的に決定される。例えば、検出回路3がVGA(解像度640×480)映像に対応する性能である場合、検出回路3が対応する解像度よりも高い解像度のFull HD(解像度1920×1080)映像は高解像度映像に該当する。また、検出回路3がFull HD(解像度1920×1080)映像に対応する性能である場合、検出回路3が対応する解像度よりも高い解像度の4K×2K映像および8K×4K映像は高解像度映像に該当する。或る映像が「高解像度映像」に該当するか否かは上記のように判定され、当該映像の解像度の具体的な値は限定されない。
本明細書において、「軽減画像」とは、或る映像を構成する画像についてデータ容量を軽減する処理を行った後の画像を意味している。軽減画像は、例えば、或る画像についてデータ容量を軽減するように、リサイズ若しくはダウンコンバージョンする、分割する、切り出し(例えばトリミング)する、等の処理を行うことにより生成した画像である。
なお、例えば、データ圧縮処理またはファイル形式の変換処理といった処理によってデータ容量を軽減する場合、エンコード処理またはデコード処理を要するため処理時間が長大化し得る。そのため、本開示の一態様における映像処理装置が実行するデータ容量を軽減する処理は、データ圧縮処理またはファイル形式の変換処理を含まないことが好ましい。これにより、映像処理装置が実行する処理の時間を効果的に短縮化することができる。
また、本明細書において、検出回路3が対応する解像度のことを、「検出回路3の検出性能」と称することがある。
なお、ここでは説明しないその他の用語について、以下の説明において適宜定義されることがある。
<映像処理装置>
本実施形態における映像処理装置1Aについて、図3~図7を用いて以下に説明する。図3は、本実施形態における映像処理装置1Aの要部構成を示すブロック図である。映像処理装置1Aの概要構成は、図1を用いて前述したとおりである。
図3に示すように、本実施形態における映像処理装置1Aに含まれる映像処理回路10Aは、画像抽出回路12および合成処理回路13を備えている。画像抽出回路12は、切り出し画像生成回路(第2画像生成回路)121と軽減画像生成回路(第1画像生成回路)122とを含む。
また、映像処理装置1Aに含まれる検出回路3は、被写体判定回路31、判定制御回路32、および情報記録回路33を備えている。
以下、映像処理回路10Aに高解像度映像である入力映像In1が入力される場合について説明する。
本実施形態における検出回路3は、4K×2K映像に対応する処理能力を有する回路であり、入力映像In1は、4K×2K映像よりも高解像度の映像であるとする。本実施形態では、入力映像In1は8K×4K映像である。
本実施形態における映像処理装置1Aは、前述のフレームメモリ2(図1参照)の具体的構成の一例としてフレームメモリ2aおよびフレームメモリ2bを備えている。フレームメモリ2aは合成処理回路13に通信可能に接続され、フレームメモリ2bは画像抽出回路12に通信可能に接続されている。なお、映像処理装置1Aは、画像抽出回路12および合成処理回路13が1つのフレームメモリ2を共用するようになっていてもよく、この場合、フレームメモリ2に画像抽出回路12用のフレーム領域と合成処理回路13用のフレーム領域とが設けられる。
映像処理装置1Aの制御部4は、映像処理装置1Aの動作を統括的に制御する。
本実施形態の映像処理装置1Aにおける画像抽出回路12、合成処理回路13、および検出回路3について、それらが実行する処理の具体例を、図4~図6を用いて以下に説明する。図4は、本実施形態の映像処理装置1Aによる映像処理の一例について説明するためのタイムチャートである。図4において、紙面の左右方向は時間軸であり、紙面の左から右に向かうにつれて時間が進行する。入力映像In1は、複数の入力画像から構成されており、ここでは、入力映像In1を構成する複数の画像のうち連続した5フレーム分の画像(入力画像In1-0、入力画像In1-1、・・・入力画像In1-4)について示している。また、入力映像In1の例として、1人の男性と1人の女性とが存在する映像を示している。ここでは、この入力映像In1に基づいて、女性の顔を検出対象として映像処理を行い、女性の顔を含む映像を出力する処理を行う場合を例示して説明する。また、以下、図3を適宜参照して説明する。
(軽減画像生成および検出処理)
図3および図4に示すように、先ず、画像抽出回路12は、切り出し画像生成回路121における処理は行わず、軽減画像生成回路122を用いて入力画像In1-0の解像度を所定の比率(縮小率α0)にて縮小する処理を行う。本実施形態における画像抽出回路12は、入力画像In1-0を縮小率α0にて縮小することによりデータ容量が軽減された内部出力画像Out0-0(軽減画像)を生成し、該内部出力画像Out0-0を検出回路3に出力する。本明細書において、上記軽減画像を第1画像と称することがある。
なお、本明細書において、「内部出力画像」とは、本開示の一態様における映像処理装置内部にて、画像抽出回路12から検出回路3に出力される画像データのことを意味している。
また、本明細書において、「縮小率」とは、或る縮小処理の前後における画像の幅解像度または高さ解像度の変化の比率にて規定される。縮小率は、縮小処理後の画像における解像度の幅および高さの両方が、検出回路3の検出性能に収まるような値となるように設定される。
或る縮小処理における幅の縮小率と高さの縮小率とは同じであることが好ましい。これは、縮小処理後の映像について、物体の検出パターンを変更することなく検出回路3による検出処理を行うことができるためである。幅の縮小率と高さの縮小率とが同じである場合、単に縮小率αと称し、例えば、或る規格の8K×4K映像を、同規格の4K×2K映像の解像度となるように縮小する場合の縮小率αは1/2(=0.5)である。
なお、或る縮小処理において、幅の縮小率と高さの縮小率とが異なる場合があってもよい。例えば、Full HD(解像度1920×1080)の映像をVGA(解像度640×480)の映像に縮小する場合、幅の縮小率は1/3であり、高さの縮小率は4/9である。この場合、後述する検出処理において、幅の縮小率と高さの縮小率との比に応じて物体の検出パターンを変更することを要する。
軽減画像生成回路122が実行する処理における上記縮小率α0は、内部出力画像Out0-0の解像度が、検出回路3の検出性能以下となるような比率であればよく、具体的な値は限定されない。例えば、入力画像の解像度をW×H、検出回路3の検出性能をwidth_able×height_ableとし、(width_able/W)<(height_able/H)であれば、上記縮小率α0は、α0≦width_able/Wとすることができる。
なお、内部出力画像Out0-0の解像度が低いほど、検出回路3による物体の像の検出処理に要する時間が短縮され得る。ただし、縮小率α0の値が小さすぎると、内部出力画像Out0-0の画質が悪くなりすぎることから、検出回路3による物体の像の検出処理が困難となり得る。
上記縮小率α0は、画像抽出回路12に初期設定されていてもよく、入力映像In1の解像度に応じて制御部4によって設定されてもよい。
内部出力画像Out0-0は、被写体判定回路31に入力される。被写体判定回路31は、内部出力画像Out0-0を用いて、パターンマッチング処理等を行うことにより女性の顔(被写体)を検出する。被写体判定回路31は、女性の顔を検出するために、女性の顔の検出パターンを使用する。画像に基づいて被写体(物体)を高速に検出する方法としては、公知の手法を用いることができる(例えば、参考文献:Paul Viola, Michael Jones, “Rapid Object Detection using a Boosted Cascade of Simple”, COMPUTER VISION AND PATTERN RECOGNITION 2001)。
判定制御回路32は、例えば、パターンマッチング処理のパターン等を変更することにより、被写体判定回路31を制御する。情報記録回路33には、パターンマッチング処理のパターン等が格納されている。また、情報記録回路33には、被写体判定回路31によって特定された被写体(女性の顔)の位置、及び大きさ等の情報が格納される。
なお、内部出力画像Out0-0が低画質であると、被写体判定回路31によって女性の顔を特定することができない場合がある。この場合、判定制御回路32は、例えば女性の体を検出パターンとするように被写体判定回路31を制御する。
そして、この被写体判定回路31による検出結果に基づいて、制御部4は、入力画像In1-2における切り出し画像の切り出し位置、および、入力画像In1-2からの切り出し画像を縮小して内部出力画像Out0-2を生成するための縮小率α2を演算により決定する。この処理について図5の(a)を参照して説明する。図5の(a)は、軽減画像に基づく物体の検出処理および切り出し画像の切り出し位置を決定する処理の一例について説明するための図である。
図5の(a)に示すように、被写体判定回路31は、内部出力画像Out0-0における女性の体(物体の像)が存在する位置(x_detect_out0,y_detect_out0)およびその大きさ(size_detect_out0)を検出する。
縮小画像(軽減画像)である内部出力画像Out0-0における、例えば女性の体のような物体の像が存在する領域を第1領域と称する。第1領域についての情報は、情報記録回路33に格納される。
制御部4は、情報記録回路33から上記第1領域についての情報を読み出し、当該情報に基づいて、入力画像In1-2における上記第1領域に対応する範囲A2を特定する。ここで、画像における或る範囲は、以下のように特定することができる。すなわち、画像を構成する複数の画素のそれぞれについて座標を規定する。具体的には、入力画像における左上の隅を起点として、左右方向にx軸(右方向が正)を、上下方向にy軸(下方向が正)を規定する。これにより、入力画像を構成する各画素の位置は(x,y)で表される(xの範囲は0≦x<W、yの範囲は0≦y<Hとなる)。
入力画像In1-2における上記範囲A2は、左上の点P1_in2(xs_in2,ys_in2)と右下の点P2_in2(xe_in2,ye_in2)とによって規定される方形の領域である。
制御部4は、内部出力画像Out0-0における上記第1領域についての情報を、入力画像In1-2における領域に変換するように、例えば上記縮小率α0を用いた座標変換処理を行う。以下に処理の具体的な一例を示す。
制御部4は、内部出力画像Out0-0における物体の位置(x_detect_out0,y_detect_out0)およびその大きさ(size_detect_out0)から、入力画像In1-2における物体の位置(x_detect_in2,y_detect_in2)及び大きさ(size_detect_in2)を以下のように求める。
x_detect_in2=〔x_detect_out0〕/α0
y_detect_in2=〔y_detect_out0〕/α0
size_detect_in2=〔size_detect_out0〕/α0。
そして、図5の(a)中の点P1_in2(xs_in2、ys_in2)および点P2_in2(xe_in2、ye_in2)を、以下のように算出する。
xs_in2=〔x_detect_in2〕-〔Dw2〕/2
ys_in2=〔y_detect_in2〕-〔Dh2〕/2
xe_in2=〔x_detect_in2〕+〔Dw2〕/2
ye_in2=〔y_detect_in2〕+〔Dh2〕/2
ここで、〔Dw2〕および〔Dh2〕はそれぞれ、入力画像In1-2における切り出し範囲A2の幅解像度および高さ解像度である。切り出し範囲の解像度の縦横比と検出回路が対応する解像度の縦横比とを一致させるために、〔Dw2〕:〔Dh2〕=〔width_able〕:〔height_able〕とする。
上記〔Dw2〕および〔Dh2〕は、入力画像In1-2から、物体の像の大きさと同じか、物体の像よりも大きい範囲を切り出すため、〔Dw2〕≧〔size_detect_in2〕、〔Dh2〕≧〔size_detect_in2〕とする。
切り出し範囲A2の幅解像度Dw2が、検出回路3の検出性能における幅解像度width_ableよりも大きい場合、または、切り出し範囲A2の高さ解像度Dh2が検出回路3の検出性能における高さ解像度height_ableよりも大きい場合、切り出し処理後の画像に縮小処理を行うことを要する。この場合、制御部4は縮小率α2を演算により求める。縮小率α2は、例えば以下のように算出することができる。
すなわち、縮小率α2は、width_able/〔Dw2〕またはheight_able/〔Dh2〕にて求められる。幅の縮小率と高さの縮小率とが異なる場合は、小さい値となる縮小率を選択する。これは、切り出した部分を全て検出対象とするためである。また、縮小する前と後で、横縦比を同じにする。これは、横縦比が変わると、検出パターンを合わせる必要があるためである。
上記の縮小率の選択について、より具体的に説明すれば、下記(i)~(iii)のとおりである。
(i)好適な例:小さい値となる縮小率(上記の例では高さの縮小率)を選択した場合、切り出した部分を全て検出対象とすることができる。この場合、後述する図5の(b)にて黒塗り部が存在する画像として示すように、内部出力画像Out0-2は、検出回路3の検出性能よりも小さい解像度の画像となる。
(ii)大きい値となる縮小率(上記の例では幅の縮小率)を選択した場合、縮小後の画像は、検出回路3の検出性能よりも高さ方向の解像度が大きくなる。そのため、切り出し画像の一部について、検出回路3による検出処理が適用されず、物体の検出に支障が生じる。
(iii)処理後の画像の解像度の縦横比と検出回路が対応する解像度の縦横比とを一致させるように、互いに異なる幅の縮小率と高さの縮小率とを用いて縮小処理を行った場合、縮小処理後の画像における検出対象は、検出パターンと対応しなくなり得る(例えば、物体の像が歪むことになる)。そのため、検出パターンの縦横比を変更する処理を行う必要があり、検出回路3による検出処理に要する時間が増大し得る。
再び図4を参照して、切り出し画像生成回路(第2画像生成回路)121は、制御部4によって決定された切り出し位置(範囲A2)に基づいて、入力画像In1-2に対して切り出し処理を実行する。そして、軽減画像生成回路122は、制御部4によって決定された縮小率α2に基づいて、上記切り出し処理により得られた切り出し画像について縮小処理を行い、内部出力画像Out0-2(詳細検出用画像)を生成する。内部出力画像Out0-2の解像度は、検出回路3が対応する解像度と同じまたはそれよりも小さい。なお、軽減画像生成回路122による縮小処理を行う必要が無い場合、上記切り出し画像がそのまま上記詳細検出用画像として用いられてよい。本明細書において、上記切り出し画像または上記詳細検出用画像を第2画像と称することがある。
内部出力画像Out0-2は、被写体判定回路31に入力される。被写体判定回路31は、内部出力画像Out0-2を用いて、パターンマッチング処理等を行うことにより女性の顔を検出する。判定制御回路32は、例えば、パターンマッチング処理のパターン等を変更することにより、被写体判定回路31を制御する。被写体判定回路31によって特定された被写体(女性の顔)の位置、及び大きさ等の情報は情報記録回路33に格納される。
内部出力画像Out0-2についての被写体判定回路31による検出結果に基づいて、制御部4は、入力画像In1-4から切り出す画像の切り出し位置、および、入力画像In1-4から切り出した画像を縮小して内部出力画像Out0-4を生成するための縮小率α4を演算により決定する。この処理について図5の(b)を参照して説明する。図5の(b)は、内部出力画像Out0-2に基づく物体の検出処理および詳細切り出し画像の切り出し位置を決定する処理の一例について説明するための図である。詳細切り出し画像とは、通常、前述の範囲A2よりも狭い範囲A4にて切り出した画像である。
図5の(b)に示すように、被写体判定回路31は、内部出力画像Out0-2における女性の顔(検出対象)が存在する位置(x_detect_out2,y_detect_out2)およびその大きさ(size_detect_out2)を検出する。
内部出力画像Out0-2における、検出対象が存在する領域を第2領域と称する。第2領域についての情報は、情報記録回路33に格納される。
制御部4は、情報記録回路33から上記第2領域についての情報を読み出し、当該情報に基づいて、入力画像In1-4における、上記第2領域に対応する範囲A4を特定する。上記範囲A4は、左上の点P1_in4(xs_in4,ys_in4)と右下の点P2_in4(xe_in4,ye_in4)とによって規定される方形の領域である。
再び図4を参照して、切り出し画像生成回路121は、制御部4によって決定された切り出し位置(範囲A4)に基づいて、入力画像In1-4に対して切り出し処理を実行する。そして、軽減画像生成回路122は、入力画像In1-4に対して切り出し処理を実行した詳細切り出し画像の解像度が検出回路3の検出性能を超えていた場合、制御部4によって決定された縮小率α4に基づいて縮小処理を行い、内部出力画像Out0-4(検出対象特定画像)を生成する。なお、軽減画像生成回路122による縮小処理を行う必要が無い場合、上記詳細切り出し画像がそのまま上記検出対象特定画像として用いられてよい。本明細書において、上記詳細切り出し画像または上記検出対象特定画像を第3画像と称することがある。
制御部4は、内部出力画像Out0-2における物体(検出対象)の位置(x_detect_out2,y_detect_out2)およびその大きさ(size_detect_out2)から、入力画像In1-4における物体(検出対象)の位置(x_detect_in4,y_detect_in4)及び大きさ(size_detect_in4)を以下のように求める。
x_detect_in4=〔x_detect_out2〕/α2+xs_in2
y_detect_in4=〔y_detect_out2〕/α2+ys_in2
size_detect_in4=〔size_detect_out2〕/α2。
そして、図5の(b)中のP1_in4(xs_in4、ys_in4)及びP2_in4(xe_in4、ye_in4)を、以下のように算出する。
xs_in4=〔x_detect_in4〕-〔Dw4〕/2
ys_in4=〔y_detect_in4〕-〔Dh4〕/2
xe_in4=〔x_detect_in4〕+〔Dw4〕/2
ye_in4=〔y_detect_in4〕+〔Dh4〕/2
ここで、〔Dw4〕および〔Dh4〕はそれぞれ、入力画像In1-4における切り出し範囲A4の幅解像度および高さ解像度である。切り出し範囲の解像度の縦横比と検出回路が対応する解像度の縦横比とを一致させるために、〔Dw4〕:〔Dh4〕=〔width_able〕:〔height_able〕とする。
入力画像In1-4から、検出対象の大きさと同じか、検出対象よりも大きい範囲を切り出すため、〔Dw4〕≧〔size_detect_in4〕、〔Dh4〕≧〔size_detect_in4〕とする。
図4では図示を省略しているが、入力画像In1-4よりも後の処理としては、以下のように行う。検出回路3は、内部出力画像Out0-4(検出対象特定画像)における物体(検出対象)の位置及び大きさを検出し、入力画像In1-6(図示せず)における切り出し範囲を決める。
以上のような処理を、フレーム毎に逐次行う。すなわち、内部出力画像における物体の位置及び大きさを検出し、入力画像における切り出し範囲を決めるという処理を入力映像In1に対して継続して行う。
そして、映像処理回路10Aの合成処理回路13は、検出回路3による検出結果(すなわち逐次生成される検出対象特定画像の情報)に基づいて、入力映像In1から出力映像Out1を生成する。具体的には、合成処理回路13は、入力映像In1における検出対象の位置および大きさに基づいて、適切な映像となるように合成処理を行うことにより出力画像を生成する。映像処理回路10Aは、例えば、検出対象である女性の顔およびその周辺を示す映像を入力映像In1から抜き出すことにより出力映像Out1を生成して出力する。検出対象を含む映像(画像)は、ハイライト映像(画像)、または抜粋映像(画像)と称することもできる。
なお、本実施形態では、入力画像の切り出し位置について、2フレーム前の検出結果のみを用いた例について示したが、これに限定されない。複数フレームの検出結果を用い、物体の動きを予想して、入力画像の切り出し位置を求めてもよい。
以上のように、本実施形態の映像処理装置1Aは、画像抽出回路12と検出回路3とが連携することにより、画像抽出回路12にて映像の縮小および切り出しを動的に行うことができる。高解像度の入力映像In1において物体の像を検出する場合に、検出回路3が対応する解像度の内部出力画像を用いて検出処理を行うことができ、検出回路3による処理時間の長大化を抑制することができる。そして、合成処理回路13にて検出対象が存在する画像を切り出して、出力映像Out1を出力することができる。
また、本実施形態の映像処理装置1Aは、始めの処理において、上記軽減画像(第1画像)に基づいて上記第1領域を特定するとともに、特定した上記第1領域に対応する範囲にて入力画像を切り出して、必要に応じて縮小処理を行うことにより詳細検出用画像(第2画像)を生成する。そして、映像処理装置1Aは、次いで、上記詳細検出用画像に基づいて上記第2領域を特定し、特定した上記第2領域に対応する範囲にて入力画像を切り出して、必要に応じて縮小処理を行うことにより検出対象特定画像(第3画像)を生成する。映像処理装置1Aは、その後の処理において、上記検出対象特定画像に基づいて上記第2領域を特定し、特定した上記第2領域に対応する範囲にて入力画像を切り出して、必要に応じて縮小処理を行うことにより検出対象特定画像を生成する、という一連の処理を継続して行う。これにより、入力映像における検出対象の位置および大きさの変化に追随して、検出対象が存在する上記検出対象特定画像を逐次生成することができる。そのため、映像処理装置1Aは、(i)検出回路3による処理時間の長大化を抑制することができるとともに、(ii)出力映像を、入力映像の変化に対応して逐次生成することができ、かつ高精度に検出対象が存在するように生成することができる。
また、一般に、様々な場面において、高画質な映像を記録することによりデータ記録媒体の記録容量が不足し易いという問題がある。ここで、或る映像の中で重要度の低い部分については、記録することを要しない場合がある。本実施形態の映像処理装置1Aを用いることによって、予め設定した条件に基づいて、入力映像In1よりも解像度を縮小した(入力映像In1から切り出した)出力映像Out1を自動的(機械的)に生成することができる。出力映像Out1は、入力映像In1のうち重要度の高い部分の映像とすることができる。出力映像Out1をデータ記録媒体に記録することによって、重要度が比較的高い部分の映像を保存することができるとともに、入力映像In1をそのまま記録する場合よりも記録容量を低減することができる。
(検出処理の変形例1:1段階の切り出しによる出力映像の生成)
本実施形態における映像処理装置1Aの一変形例では、縮小画像に対して被写体判定回路31が検出対象(例えば女性の顔)の検出処理を行い、その検出結果に基づいて制御部4が切り出し範囲を特定することにより出力映像を生成してもよい。つまり、1段階の切り出しによって出力映像を生成してもよい。このような処理の一例について、図6を用いて説明する。図6は、入力映像In2から出力映像Out2を生成する処理の一例について説明するための図である。
図6に示すように、入力映像In2が映像処理装置1Aに入力されるとする。上述したことと同様に、軽減画像生成回路122は、入力映像In2の解像度を縮小した縮小画像(データ容量を軽減した軽減画像)を生成する。被写体判定回路31は、該軽減画像を用いて、女性の顔obj1の位置および大きさを検出し、検出した情報を情報記録回路33に格納する。
制御部4は、情報記録回路33から情報を読み出し、上記軽減画像における検出した情報を入力映像In2における位置および大きさに座標変換する。そして、入力映像In2における女性の顔が存在する画像の切り出し位置を求める。例えば、入力映像In2における女性の顔の位置を(xo,yo)及び大きさをloとし、切り出し部分の縦の大きさを2×lo、切り出し部分の横の大きさを2×lo×W/Hとすると、切り出す左上の点P11の座標(xs1,ys1)、右下の点P12の座標(xe1,ye1)は、以下のようになる。
xs1=xo-lo×W/H
ys1=yo-lo
xe1=xo+lo×W/H
ye1=yo+lo。
ここでは、検出した女性の顔の大きさの2倍の範囲を切り出す例について説明したが、制御部4は、入力映像In2における状況またはユーザの好み等に応じて切り出し範囲を変えるように画像抽出回路12を制御してもよい。
合成処理回路13は、入力映像In2において左上の点P11と右下の点P12とによって規定される方形の領域を入力映像In2から切り出すことにより出力映像Out2を生成して、出力する。
(映像処理方法)
以上に説明した映像処理装置1Aが実行する映像処理方法について、図7を用いて以下に説明する。図7の(a)は、初期化処理のフローチャートである。図7の(b)は、検出準備を開始する処理のフローチャートである。図7の(c)は、検出結果の情報を読み出す処理のフローチャートである。図7の(d)は、映像出力処理のフローチャートである。
図7の(a)~(d)に示すように、制御部4は、先ず、映像処理回路10Aおよび検出回路3を初期化する処理を行う(ステップ1;以下S1のように略記する)。
次いで、制御部4は、画像抽出回路12の設定を行う(S6)。例えば、入力映像の全体を探索しようとする場合、映像の全体が探索対象となるように入力映像を縮小する。この場合、制御部4は、画像抽出回路12に縮小率を設定する。
また、制御部4は、入力映像から任意の部分を切り出すように画像抽出回路12を設定して、切り出した画像について検出回路3が探索処理をおこなうようにしてもよい。このような処理の説明について、詳しくは実施形態2として後述する。この場合、制御部4は画像抽出回路12に、切り出す部分の左上の座標及び右下の座標を設定する。そして、制御部4は、検出開始の命令を検出回路3に送信する(S7)。
その後、検出回路3による検出処理が完了すると、制御部4は検出回路3から検出対象の情報として、検出対象物の数、並びに検出対象物のそれぞれの位置(座標)及び大きさを読み出す(S11)。なお、検出回路3による検出処理が完了したか否かについて、検出回路3から制御部4へ検出完了の割り込み信号を送信することにより判定するようになっていてもよく、または、制御部4が定期的に検出回路3の状態を確認することにより判定してもよい。
次いで、制御部4は、合成処理回路13に対して、出力映像を生成するための拡大率、縮小率、表示座標等を設定する(S16)。合成処理回路13は、設定された値に基づいて、出力映像を生成する。
換言すれば、映像処理装置1Aが実行する映像処理方法は、概略的には以下のステップを含む。
(i)画像抽出回路12は、入力映像を構成する入力画像を用いて第1の内部出力画像(軽減画像)を生成する。
(ii)検出回路3は、軽減画像における検出対象を含む物体の像が存在する第1領域を検出する。
(iii)制御部4は、検出結果に基づいて、上記第1領域を入力画像における領域に換算し、画像を切り出す位置(および縮小率)を算出する。
(iv)切り出し画像生成回路121は、算出結果に基づいて切り出し画像を生成し、軽減画像生成回路122は、該切り出し画像について必要に応じて縮小処理を行い、第2の内部出力画像(詳細検出用画像)を生成する。
(v)検出回路3は、第2の内部出力画像を用いて検出処理を行い、検出対象が存在する第2領域を検出する。
(vi)制御部4は、検出結果に基づいて、上記第2領域を入力画像における領域に換算し、画像を切り出す位置(および縮小率)を算出する。
その後、画像抽出回路12、検出回路3、および制御部4は上記(iv)~(vi)の処理を繰り返すとともに、合成処理回路13は、検出回路3による検出結果に基づいて合成処理を行い、出力画像を生成する。これにより、映像処理装置1Aは、入力映像から出力映像を生成する。
なお、画像抽出回路12はフレームメモリ2bを用いて、合成処理回路13はフレームメモリ2aを用いて上記のような処理を行っている。画像抽出回路12が行う処理(拡大処理、縮小処理、切り出し処理)は、合成処理回路13も行うことが可能であり、合成処理回路13は画像抽出回路12の機能を包含している。そのため、画像抽出回路12および合成処理回路13の具体的な回路構成例は同じであってもよい。このようなフレームメモリを用いた処理は公知の技術であるので、詳細な説明については省略するが、概略的には以下に示す説明を参照して理解することができる。
(検出処理の変形例2:入力映像が複数の場合)
本実施形態における映像処理装置1Aの一変形例では、複数の入力映像が入力され、それらの入力映像から1つの出力映像を生成する処理を行ってもよい。このような処理を行う場合の一例について、図8および図9を用いて説明する。図8は、映像処理装置1Aの一変形例における画像抽出回路12が行う処理について説明するための図である。図9の(a)は、一変形例の映像処理装置1A1による映像処理の一例について説明するための図である。図9の(b)は、映像処理装置1A1から出力される出力映像の一例を示す図である。
図8に示すように、一例では、本開示の一態様における映像処理装置に4つ(4種)の入力映像In10~In13が入力される。この場合、合成処理回路13に4つの入力映像In10~In13が入力される。この場合、図8に示すように、合成処理回路13は、縮小処理部111a~111d、ライトバッファ112a~112d、アービター113・114、リードバッファ115a~115d、および拡大処理部116a~116dを備えている。
合成処理回路13は、複数種の入力映像に対して、拡大処理、縮小処理、切り出し処理、及び合成処理を行うことができる。合成処理回路13は、縮小処理部111a~111dを用いて映像の縮小処理を行うとともに、アービター113を用いて複数の非同期の入力映像の同期タイミングを合わせる処理を行って、フレームメモリ2へ書き込み(ライト)する。なお、複数の入力映像は、縮小処理を行うことなく同期化されてフレームメモリ2に格納されてもよい。
そして、合成処理回路13は、フレームメモリ2から映像を読み出し(リード)、アービター114を用いて映像の同期化を行う。また、合成処理回路13は、拡大処理部116a~116dによって、フレームメモリ2から読み出した複数の映像について、拡大処理を行うことができる。そして、合成処理回路13は、検出回路3による検出結果に基づいて、拡大処理、切り出し処理等を行った後、複数の映像を重ね合わせる処理を行うことによって出力映像Out10を生成して出力する。
合成処理回路13によって切り出し画像を生成する方法について以下に説明する。ライトバッファ112a~112dは、入力映像のうち必要な部分をフレームメモリ2に書き込む。また、リードバッファ115a~115dは、フレームメモリ2に格納されたデータ(映像)の一部(切り出す部分)をフレームメモリ2から読み出す。合成処理回路13は、このような処理により、切り出し画像を生成することができる。
映像の縮小率または拡大率を変更する場合、制御部4は、縮小処理部111a~111dまたは拡大処理部116a~116dのパラメータを設定(変更)する。映像の切り出し位置を変更する場合、制御部4は、ライトバッファ112a~112d及びリードバッファ115a~115dのパラメータを設定(変更)する。
なお、合成処理回路13は、フレームメモリ2から読み出した映像に処理を行わずに重ね合わせ処理を行ってもよい。また、合成処理回路13は、複数の入力映像から出力したい映像を選択し、出力映像として複数画面の合成映像を生成してもよい。例えば、検出回路3による処理の対象となった入力映像と、それ以外の入力映像とを合成して出力画像を生成してもよい。
図9の(a)に示すように、例えば、高解像度映像である2つの入力映像In16および入力映像In17、並びにOn Screen Dispay(OSD)が映像処理装置1A1に入力されるとする。なお、OSDは映像処理装置1A1の外部から入力されなくともよく、例えば、映像処理装置1A1内に記録されたOSDのデータを読み出して用いてもよい。
この例では、入力映像In16は画像抽出回路12及び合成処理回路13に入力される。画像抽出回路12および検出回路3は、入力映像In16を構成する入力画像について前述したような処理を行う。検出処理により、入力映像In16に存在する人物の顔を検出したとすると、検出した顔の位置及び大きさ等が情報記録回路33に格納される。
制御部4は、情報記録回路33の情報を使用して、入力映像In16における切り出し位置を合成処理回路13に設定する。一方、入力映像In17については、検出処理を行わないため、物体の切り出し等の処理を行わずに拡大処理または縮小処理を行うように合成処理回路13に設定する。また、制御部4は、入力映像In16における処理後の映像と、入力映像In17における処理後の映像と、OSDとを合成するために、拡大率および表示位置等を設定する。
そして、合成処理回路13は、入力映像In16に基づいて生成した出力映像Out16、入力映像In17に基づいて生成した出力映像Out17、およびOSDを合成して、図9の(b)に示すような出力映像Out18を生成する。
なお、OSDには、例えば、入力映像In16および入力映像In17に基づいた画像であることが分かるように、入力映像In16に対応する「Input1」、入力映像In17に対応する「Input2」といった文字が表示される。また、入力映像について切り出し処理を行っているとともに拡大処理を行っていることを明示するように「zoom」等の文字を表示させてもよい。
(その他の変形例)
(a)本開示の一変形例における映像処理装置では、合成処理回路13に画像抽出回路12が含まれる構成であってもよい。これは、上述の図8を用いて説明したように、合成処理回路13が有する機能は、画像抽出回路12の機能を包含するためである。合成処理回路13の内部構成を拡張することにより、合成処理回路13の切り出し機能及び縮小機能を使用して、検出回路3への内部出力画像を生成することができる。例えば、図8に示した例において、リードバッファおよび拡大処理部をさらに1つ多く備え、該拡大処理部から出力した画像を検出回路3に送信すればよい。
(b)また、一変形例では、上記軽減画像は、切り出し画像生成回路121を用いて生成されてもよい。例えば、入力画像における物体の像の位置が予め概ね特定されている場合、画像抽出回路12は、切り出し画像生成回路121を用いて入力画像を切り出すことによりデータ容量を軽減した画像を上記軽減画像として用いることができる。また、画像抽出回路12は、切り出し画像生成回路121および軽減画像生成回路122の両方を用いて上記軽減画像を生成してもよい。
〔実施形態2〕
本開示の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
前記実施形態1の映像処理装置1Aでは、軽減画像生成回路122が入力画像について縮小処理を行うことにより、解像度を縮小した縮小画像(軽減画像)を生成していた。これに対して、本実施形態における映像処理装置1Bでは、映像処理装置1Aと同様の構成において、軽減画像生成回路122が入力画像を分割することによって解像度を縮小した縮小画像(第1画像)を生成する点が異なっている。
本実施形態における映像処理装置1Bについて、図10および図11を用いて以下に説明する。図10の(a)は本実施形態における映像処理装置1Bに入力される入力映像の一例を示す図であり、(b)は上記入力映像を分割した様子を示す図である。図11は、本実施形態における映像処理方法について説明するフローチャートである。
図10の(a)および(b)に示すように、本実施形態における映像処理装置1Bは、高解像度映像である入力映像In21が入力された場合、軽減画像生成回路122によって入力映像In21を均等に分割することにより縮小映像を生成し、該縮小映像を検出回路3に出力する。入力映像In21を4分割することにより、入力映像In21a~21dが生成する。入力映像In21a~21dをそれぞれ検出回路3に複数回に分けて出力することにより、入力映像In21の全てについて、検出対象とすることができる。
なお、軽減画像生成回路122は、入力映像In21の一部を切り出した縮小映像を検出回路3に出力するようになっていてもよい。例えば、予め入力映像In21における物体の像が存在する可能性が高い領域を把握している場合、そのような領域を切り出して縮小映像を生成する。この場合、入力映像In21の全てについて検出対象とすることがないため、処理時間を短縮化し得る。
ここで、入力映像In21を分割して得られる分割画像を用いて検出回路3が処理を行うためには、分割画像の解像度が、検出回路3が対応する解像度以下となることを要する。
以下に、入力映像In21を分割して検出回路3へ出力する場合の計算方法について説明する。
検出回路3が対応する解像度を、width_able×height_ableとし、入力映像In21の解像度を、width_in×height_inとする。そして、軽減画像生成回路122が切り出す範囲を[(sxi,syj)~(exi,eyj)]とする(0≦i、0≦jの整数)。分割画像のそれぞれについて、範囲における左上の点(sxi,syj)と右下の点(exi,eyj)とを求めればよい。
sx0=0、sy0=0、ex0=width_able、ey0=height_ableであり、
sxi=width_able×i、syj=height_able×j、
exi=sxi+width_able、eyj=syj+height_able、
ただし、i<(width_in/width_able)、j<(height_in/height_able)となる。
そして、iの最大値をimax、jの最大値をjmaxとすると、
eximax=width_in、eyjmax=height_inとなる。
本実施形態では、
入力映像In21a:[(sx0,sy0)~(ex0,ey0)]
入力映像In21b:[(sx1,sy0)~(ex1,ey0)]
入力映像In21c:[(sx0,sy1)~(ex0,ey1)]
入力映像In21d:[(sx1,sy1)~(ex1,ey1)]である。
例えば、(width_able、height_able)=(1920,1080)、
(width_in、height_in)=(3840、2160)とすると、
入力映像In21a:[(0,0)~(1920,1080)]
入力映像In21b:[(1920,0)~(3840,1080)]
入力映像In21c:[(0,1080)~(1920,3840)]
入力映像In21d:[(1920,1080)~(3840,2160)]
となる。
以上のような映像処理を行う場合、前記実施形態1の映像処理方法における検出準備を開始する処理(図7の(b)参照)の代わりに、以下に示すような処理を行う。
図11に示すように、本実施形態における映像処理方法では、先ず、制御部4は、映像処理回路10Aおよび検出回路3を初期化する処理を行う(図7の(a)参照)とともに、制御部4は、映像処理における状態(STATUS)を初期(START)に設定する(S21)。
そして、制御部4は、検出回路3による検出準備を開始する。制御部4は、状態が初期であることから、軽減画像生成回路122によって入力映像In21を4分の1に分割した左上の画像(入力映像In21a)を抽出するように画像抽出回路12を設定するとともに、映像処理における状態を右上抽出(TOP_RIGHT)に設定する(S22)。
次いで、検出回路3による検出処理が完了すると、制御部4は、検出回路3からの情報の読み出しを開始する(S23)。そして、制御部4は、検出回路3による次の検出準備を開始する。制御部4は、状態が右上抽出であることから、入力映像In21を4分の1に分割した右上の画像(入力映像In21b)を抽出するように画像抽出回路12を設定するとともに、映像処理における状態を左下抽出(BOTTOM_LEFT)に設定する(S24)。
次いで、検出回路3による検出処理が完了すると、制御部4は、検出回路3からの情報の読み出しを開始する(S25)。そして、制御部4は、検出回路3による次の検出準備を開始する。制御部4は、状態が左下抽出であることから、入力映像In21を4分の1に分割した左下の画像(入力映像In21c)を抽出するように画像抽出回路12を設定するとともに、映像処理における状態を右下抽出(BOTTOM_RIGHT)に設定する(S26)。
次いで、検出回路3による検出処理が完了すると、制御部4は、検出回路3からの情報の読み出しを開始する(S27)。そして、制御部4は、検出回路3による次の検出準備を開始する。制御部4は、状態が右下抽出であることから、入力映像In21を4分の1に分割した右下の画像(入力映像In21d)を抽出するように画像抽出回路12を設定するとともに、映像処理における状態を終了(END)に設定する(S28)。
次いで、検出回路3による検出処理が完了すると、制御部4は、検出回路3からの情報の読み出しを開始する(S29)。そして、制御部4は、状態が終了であることから、制御を終了する(S30)。
このように、検出回路3は、複数の分割画像(入力映像In21a~In21d)のうち、物体の像が存在する分割画像を特定する。そして、検出回路3は、特定された分割画像を用いて、検出対象が存在する領域を検出する処理を行う。
〔実施形態3〕
本開示の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
前記実施形態2の映像処理装置1Bでは、入力画像を均等に分割することによって解像度を縮小した縮小画像を生成していた。この場合、入力映像における分割の境界付近の物体の像を検出し難いことがある。そのため、本実施形態の映像処理装置1Cでは、入力画像を分割する場合に、重畳領域(のり代)を設けて分割するようになっている点が異なっている。
本実施形態における映像処理装置1Cについて、図12を用いて以下に説明する。図12は本実施形態における映像処理装置1Cに入力される入力映像を分割した様子を示す図である。映像処理装置1Cに、前記実施形態2と同様の入力映像In21が入力されることとし、前記実施形態2にて説明したことと同様のことについては、説明を繰り返さない。
横方向の重畳領域長さをwidth_overlap、縦方向の重畳領域長さをheight_overlapとする。軽減画像生成回路122が切り出す範囲を[(sxi,syj)~(exi,eyj)]とする(0≦i、0≦jの整数)。
sx0=0、sy0=0、ex0=width_able、ey0=height_ableであり、
sxi=(width_able-width_overlap)×i、
syj=(height_able-height_overlap)×j、
exi=sxi+width_able、eyj=syj+height_able
ただし、i<width_in/(width_able-width_overlap)、
j<height_in/(height_able-height_overlap)となる。
iの最大値をimax、jの最大値をjmaxとすると、
eximax=width_in、eyjmax=height_inとなる。
例えば、
(width_able,height_able)=(1920,1080)、
(width_in,height_in)=(3840,2160)、
width_overlap=480、height_overlap=270とすると、分割画像は、以下のとおりとなる。
入力映像In200(i=0、j=0):[(0,0)~(1920,1080)]
入力映像In210(i=1、j=0):[(1440,0)~(3360,1080)]
入力映像In220(i=2、j=0):[(2880,0)~(3840,1080)]
入力映像In201(i=0、j=1):[(0,810)~(1920,1890)]
入力映像In211(i=1、j=1):[(1440,810)~(3360,1890)]
入力映像In221(i=2、j=1):[(2880,810)~(3840,1890)]
入力映像In202(i=0、j=2):[(0,1620)~(1920,2160)]
入力映像In212(i=1、j=2):[(1440,1620)~(3360,2160)]
入力映像In222(i=2、j=2):[(2880,1620)~(3840,2160)]。
本実施形態では、入力映像In200~入力映像In222のそれぞれについて、重畳領域OAが設けられている。換言すれば、複数の分割画像は、それぞれが隣接する分割画像の一部に重畳する。これにより、各映像から物体の像を検出する処理をより高い精度にて行うことができる。
〔実施形態4〕
本開示の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
図13の(a)は、本実施形態における映像処理装置1Dの概要を示すブロック図である。図13の(b)は、映像処理装置1Dに入力される4系統の入力映像In30~In33の一例を示す図である。図13の(c)は、映像処理装置1Dから出力される出力映像Out30の一例を示す図である。
一般に、8K×4K等の高解像度映像は、複数の入力系統に分かれて入力されることがある。本実施形態では、8K×4K映像を、4系統の4K×2K映像で入力した場合について説明する。
図13の(a)に示すように、本実施形態における映像処理装置1Dは、複数の入力映像から1つの映像を選択するための映像選択回路6を備えている点が前記実施形態1~3と異なっている。また、映像処理装置1Dは、映像処理回路10Dの外部に画像抽出回路12を備えている。なお、画像抽出回路12は映像処理回路10Dの内部に設けられていてもよい。また、映像選択回路6は、映像処理回路10Dの内部に設けられていてもよい。
本実施形態では、映像処理装置1Dに4系統の入力映像In30~In33(図13の(b))が入力され、1つの出力映像Out30(図13の(c))が出力される。
映像選択回路6は、検出対象とする映像を選択し、選択した映像を画像抽出回路12に出力する。制御部4は、4系統の入力映像In30~In33を順次、画像抽出回路12に出力するように映像選択回路6を制御する。
本実施形態の映像処理装置1Dによれば、高解像度映像が複数の入力系統に分かれた映像が入力された場合においても、物体の像の検出処理を行うことができる。そして、出力映像Out30を出力することができる。
〔実施形態5〕
本開示の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
図14は、本実施形態における映像処理装置1Eの概要を示すブロック図である。図15の(a)は、映像処理装置1Dに入力される入力映像In40の一例を示す図である。図15の(b)は、映像処理装置1Eから出力される出力映像Out40の一例を示す図である。図15の(c)は、映像処理装置1Eから出力される出力映像Out41の一例を示す図である。図15の(d)は、映像処理装置1Eから出力される出力映像Out40-1の一例を示す図である。
入力映像において検出対象が複数存在する場合、どの検出対象物について切り出して出力映像を生成するかということが問題となる。そこで、本実施形態における映像処理装置1Eでは、検出対象物のリストを画面に表示し、リスト中の対象物を選択可能となっている。
図14に示すように、本実施形態における映像処理装置1Eは、制御部4と通信可能に接続された検出対象選択部7を備えている。検出対象選択部7は、例えば、リモコンであってよく、その他の選択ボタンのついた装置であってよい。
図15の(a)に示すような入力映像In40が入力された場合、入力映像In40には男性と女性とが存在する。ここで、ユーザは、図15の(b)に示すような出力映像Out40を期待しているとする。
本実施形態における映像処理装置1Eは、図15の(c)に示すような出力映像Out41を生成し、ユーザに提示する。出力映像Out41は、検出対象をリスト表示した画像である。入力映像In40において、検出対象となる候補は図中A及びBの2つである。
例えば、ユーザが検出対象Bを表示したい場合、ユーザは、検出対象選択部7を用いて検出対象Bを選択することができる。検出対象選択部7は、ユーザが選択した検出対象Bの情報を、制御部4に送信する。制御部4は、出力映像Out40として検出対象Bを切り出して表示するように、合成処理回路13を制御する。
また、本実施形態における映像処理装置1Eは、図15の(d)に示すように、出力映像Out40-1として、ユーザが期待する表示と検出対象のリストとを同時に表示するようになっていてもよい。この場合、ユーザは、リストを参照して検出対象を変更し易くすることができる。
なお、図示を省略したが、本実施形態における映像処理装置1Eにおいても、前述の図9に示したようなOSDが出力映像に表示される。
〔実施形態6〕
本開示の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
図16の(a)は、本開示の実施形態6における映像処理装置1Fによる映像処理の一例について説明するための図である。図16の(b)は、上記映像処理装置から出力される出力映像の一例を示す図である。
本実施形態では、1つの入力映像In50とOSDとが映像処理装置1Fに入力される。画像抽出回路12および検出回路3は、入力映像In50を構成する入力画像について、前述したような処理を行う。検出処理により、入力映像In50に存在する男性の顔および女性の顔(2つの物体)を検出したとすると、男性の顔および女性の顔のそれぞれについて、検出した顔の位置及び大きさ等が情報記録回路33に格納される。
制御部4は、情報記録回路33の情報を使用して、男性の顔および女性の顔のそれぞれについて、入力映像In50における切り出し位置を合成処理回路13に設定する。また、制御部4は、入力映像In50における処理後の映像とOSDとを合成するために、拡大率および表示位置等を設定する。
そして、合成処理回路13は、入力映像In50における女性の顔に基づいて生成した出力映像Out51、および、入力映像In50における弾性の顔に基づいて生成した出力映像Out52、およびOSDを合成して、図16の(b)に示すような出力映像Out50を生成する。
これにより、入力映像に複数の検出対象が存在する場合であっても、複数の検出対象のそれぞれについて、切り出しおよび拡大処理を行った複数の画像を生成し、生成した複数画像を合成した合成画像を出力することができる。そのため、入力映像において重要な映像が複数箇所含まれている場合であっても、それらの重要な映像を抽出した出力映像を生成して出力することができる。
〔実施形態7〕
本開示の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
本実施形態における映像処理装置1Gの適用例について、図17を用いて以下に説明する。映像処理装置1Gは、前述した実施形態1~5における映像処理装置1A~1Eのいずれであっても構わない。図17の(a)は、映像処理装置1Gがカメラ51および録画装置52と接続された場合、(b)は映像処理装置1Gが再生装置53および録画装置52と接続された場合、(c)は映像処理装置1Gが入力映像を処理して表示装置54に出力映像を出力する場合、についてそれぞれ示している。
例えば、高解像度なカメラ51の映像を録画する場合、録画メディアの容量が問題となり得る。図17の(a)に示すように、映像処理装置1Gは、カメラ51にて撮像した入力映像のうち、必要な撮影物体を切り出して録画装置52に録画することができる。これにより、データ量を減らすことが可能となり、録画メディアの容量の問題が発生することを低減することができる。映像処理装置1Gは、例えば、業務用カメラ、民生用カメラ、監視カメラ等に接続して使用することが考えられる。
また、図17の(b)に示すように、映像処理装置1Gは、映像の編集作業において、高解像度で記録された映像から必要な物体を切り出して録画することができる。映像処理装置1Gは、例えば、ブルーレイディスクレコーダ等に接続して使用することが考えられる。
そして、図17の(c)に示すように、映像処理装置1Gは、高解像度な入力映像において、視聴者が興味を持つ部分を切り出して、表示することができる。映像処理装置1Gは、例えばテレビ等に内蔵して使用することが考えられる。
なお、図17の(c)に示す例において、表示装置54が表示部となっていてもよい。映像処理装置1Gと表示部とを備える表示装置も本開示の範疇に含まれる。
〔ソフトウェアによる実現例〕
映像処理装置1A~1Gの制御ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
後者の場合、映像処理装置1A~1Gは、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも1つのプロセッサ(制御装置)を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも1つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本開示の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本開示の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
本開示は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本開示の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
1A、1A1、1B、1C、1D、1E、1F、1G 映像処理装置
3 検出回路
4 制御部
6 映像選択回路
7 検出対象選択部
10A、10D、10E 映像処理回路
12 画像抽出回路
13 合成処理回路
121 切り出し画像生成回路(第2画像生成回路)
122 軽減画像生成回路(第1画像生成回路)

Claims (9)

  1. 検出回路の検出性能よりも高い解像度を有する入力映像における検出対象を検出する映像処理装置であって、
    前記入力映像は、複数の入力画像から構成されており、
    前記検出対象を含む物体の像を検出する検出回路と、
    前記入力画像のデータ容量が軽減された第1画像を生成する第1画像生成回路と、を備え、
    前記検出回路は、前記第1画像を用いて、前記物体の像が存在する第1領域を検出することを特徴とする、映像処理装置。
  2. 前記第1領域の検出結果に基づいて、前記入力画像より前記第1領域を含む画像を切り出して第2画像を生成する第2画像生成回路をさらに備え、
    前記検出回路は、前記第2画像を用いて、前記検出対象が存在する第2領域を検出することを特徴とする、請求項1に記載の映像処理装置。
  3. 前記入力映像は、複数存在し、
    前記検出回路による処理の対象となった入力映像と、それ以外の入力映像とを合成して出力画像を生成する合成処理回路をさらに備えることを特徴とする、請求項2に記載の映像処理装置。
  4. 前記検出回路の検出結果に基づいて、前記第2画像の位置と、前記出力画像を生成する処理と、を制御する制御部を備えることを特徴とする、請求項3に記載の映像処理装置。
  5. 前記第1画像生成回路は、前記入力画像を分割することにより、前記第1画像として複数の分割画像を生成し、
    前記検出回路は、前記分割画像を用いて前記第1領域を検出することを特徴とする、請求項1に記載の映像処理装置。
  6. 複数の前記分割画像は、それぞれが隣接する分割画像の一部に重畳することを特徴とする、請求項5に記載の映像処理装置。
  7. 前記検出回路は、複数の前記分割画像のうち、前記物体の像が存在する分割画像を特定し、特定された前記分割画像を用いて検出対象が存在する領域を検出することを特徴とする、請求項5又は6に記載の映像処理装置。
  8. 請求項1から7のいずれか一項に記載の映像処理装置と、表示部とを備えることを特徴とする、表示装置。
  9. 検出回路の検出性能よりも高い解像度を有する入力映像における検出対象を検出する映像処理方法であって、
    前記入力映像を構成する入力画像のデータ容量が軽減された第1画像を生成し、
    前記検出回路を用いて、前記第1画像における前記検出対象を含む物体の像が存在する第1領域を検出し、
    前記第1領域の検出結果に基づいて、前記第1領域を含む画像を前記入力画像から切り出して第2画像を生成し、
    前記第2画像を用いて、前記検出対象が存在する第2領域を検出することを特徴とする映像処理方法。
JP2018188379A 2018-10-03 2018-10-03 映像処理装置、表示装置、および映像処理方法 Pending JP2022028978A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018188379A JP2022028978A (ja) 2018-10-03 2018-10-03 映像処理装置、表示装置、および映像処理方法
PCT/JP2019/039053 WO2020071467A1 (ja) 2018-10-03 2019-10-03 映像処理装置、表示装置、および映像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018188379A JP2022028978A (ja) 2018-10-03 2018-10-03 映像処理装置、表示装置、および映像処理方法

Publications (1)

Publication Number Publication Date
JP2022028978A true JP2022028978A (ja) 2022-02-17

Family

ID=70054816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018188379A Pending JP2022028978A (ja) 2018-10-03 2018-10-03 映像処理装置、表示装置、および映像処理方法

Country Status (2)

Country Link
JP (1) JP2022028978A (ja)
WO (1) WO2020071467A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7460061B1 (ja) 2023-05-02 2024-04-02 株式会社ビバリー 画像認識システム及び画像認識プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4959535B2 (ja) * 2007-12-13 2012-06-27 株式会社日立製作所 撮像装置
JP2010165052A (ja) * 2009-01-13 2010-07-29 Canon Inc 画像処理装置及び画像処理方法
JP5924977B2 (ja) * 2011-03-18 2016-05-25 キヤノン株式会社 画像処理装置および画像処理方法
JP5887067B2 (ja) * 2011-05-20 2016-03-16 東芝テリー株式会社 全方位監視画像処理システム
JP5906028B2 (ja) * 2011-06-22 2016-04-20 キヤノン株式会社 画像処理装置、画像処理方法
JP6808424B2 (ja) * 2016-04-12 2021-01-06 キヤノン株式会社 画像記録装置およびその制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7460061B1 (ja) 2023-05-02 2024-04-02 株式会社ビバリー 画像認識システム及び画像認識プログラム

Also Published As

Publication number Publication date
WO2020071467A1 (ja) 2020-04-09

Similar Documents

Publication Publication Date Title
US8004542B2 (en) Video composition apparatus, video composition method and video composition program
US9830880B1 (en) Method and system for adjusting the refresh rate of a display device based on a video content rate
EP2161687B1 (en) Video signal processing device, video signal processing method, and video signal processing program
US20170344330A1 (en) Multi-display device
WO2014013673A1 (ja) 動画像生成装置および動画像生成方法
JP2014077993A (ja) 表示装置
US9111363B2 (en) Video playback apparatus and video playback method
US9519959B2 (en) Image processing apparatus, imaging apparatus, and method for processing image
US8885939B2 (en) Image processing apparatus configured to perform image processing for plural images and control method thereof
US20060203002A1 (en) Display controller enabling superposed display
US20120098930A1 (en) Image processing device, image processing method, and program
WO2020071467A1 (ja) 映像処理装置、表示装置、および映像処理方法
US8493512B2 (en) Digital broadcast receiver apparatus and image display method
JP4380740B2 (ja) 画像処理装置
JP7523625B2 (ja) 映像処理装置、映像処理方法、及び制御プログラム
US20110304770A1 (en) Digital broadcast receiver apparatus and image display method
US11196974B2 (en) Display control apparatus and display control method
JP4380741B2 (ja) 画像処理装置
JP4540191B2 (ja) 画像処理装置
US7671925B2 (en) Circuits, methods, and computer program products for reducing cross-color artifacts in video data
JP5836789B2 (ja) 画像処理装置およびその制御方法、およびプログラム
JP2008263657A (ja) 画像処理装置、サムネイル動画作成方法及びサムネイル動画作成プログラム
JP6327869B2 (ja) 画像処理装置、撮像装置、制御方法、及びプログラム
JP3321402B2 (ja) 動画データ編集方法および装置
US20230245411A1 (en) Information processing apparatus, information processing method, and medium