WO2022074726A1

WO2022074726A1 - 映像処理装置、映像処理方法及び映像監視システム

Info

Publication number: WO2022074726A1
Application number: PCT/JP2020/037820
Authority: WO
Inventors: 智孝田中
Original assignee: 三菱電機株式会社
Priority date: 2020-10-06
Filing date: 2020-10-06
Publication date: 2022-04-14

Abstract

カメラ（１）により撮影された監視エリアの映像を示す映像データを受信する映像データ受信部（２１）と、映像データ受信部（２１）により受信された映像データが示す映像に含まれている監視対象体を検出する監視対象体検出部（２３）と、監視対象体検出部（２３）により検出された監視対象体を模擬した監視対象体モデルを生成するモデル生成部（２４）と、監視エリアに監視対象体が含まれていないときの監視エリアの映像である背景映像に、モデル生成部（２４）により生成された監視対象体モデルを合成するモデル合成部（２５）と、モデル合成部（２５）による監視対象体モデル合成後の映像を出力する映像出力部（２７）とを備えるように、映像処理装置（３）を構成した。

Description

映像処理装置、映像処理方法及び映像監視システム

　本開示は、映像処理装置、映像処理方法及び映像監視システムに関するものである。

　監視エリアの映像を処理する映像処理装置の中には、映像に含まれている監視対象体をマスク処理するマスク処理部を備える映像処理装置がある（例えば、特許文献１を参照）。当該マスク処理部によって、マスク処理が行われることで、監視対象体の映像がぼけた映像になり、監視対象体のプライバシーが保護される。

特開２０１９－１８６７７７号公報

　従来の映像処理装置では、監視対象体のプライバシーを保護するために、マスク処理部が、監視対象体の顔の判別が困難になるように、映像のぼけ具合いを高めると、監視対象体の映像だけでなく、監視対象体の周囲の映像まで、ぼけた映像になることがある。監視対象体の映像だけでなく、監視対象体の周囲の映像まで、ぼけた映像になると、監視対象体が、どのような所に存在しているのかが分かり難くなってしまうことがあるという課題があった。

　本開示は、上記のような課題を解決するためになされたもので、監視対象体の周囲の映像のぼけを招くことなく、監視対象体のプライバシーを保護することができる映像処理装置及び映像処理方法を得ることを目的とする。

　本開示に係る映像処理装置は、カメラにより撮影された監視エリアの映像を示す映像データを受信する映像データ受信部と、映像データ受信部により受信された映像データが示す映像に含まれている監視対象体を検出する監視対象体検出部と、監視対象体検出部により検出された監視対象体を模擬した監視対象体モデルを生成するモデル生成部と、監視エリアに監視対象体が含まれていないときの監視エリアの映像である背景映像に、モデル生成部により生成された監視対象体モデルを合成するモデル合成部と、モデル合成部による監視対象体モデル合成後の映像を出力する映像出力部とを備えるようにしたものである。

　本開示によれば、監視対象体の周囲の映像のぼけを招くことなく、監視対象体のプライバシーを保護することができる。

実施の形態１に係る映像処理装置３を含む映像監視システムを示す構成図である。カメラ１－１～１－Ｎを示す構成図である。実施の形態１に係る映像処理装置３を示す構成図である。実施の形態１に係る映像処理装置３のハードウェアを示すハードウェア構成図である。映像処理装置３が、ソフトウェア又はファームウェア等によって実現される場合のコンピュータのハードウェア構成図である。実施の形態１に係る映像処理装置３の処理手順である映像処理方法を示すフローチャートである。背景映像の一例を示す説明図である。通常映像の一例を示す説明図である。モデル合成映像の一例を示す説明図である。モデル生成部２４による監視対象体モデルの生成処理を示すフローチャートである。実施の形態２に係る映像監視システムのカメラ１－１～１－Ｎを示す構成図である。実施の形態２に係る映像処理装置３を示す構成図である。

　以下、本開示をより詳細に説明するために、本開示を実施するための形態について、添付の図面に従って説明する。

実施の形態１．
　図１は、実施の形態１に係る映像処理装置３を含む映像監視システムを示す構成図である。
　図２は、実施の形態１に係る映像監視システムのカメラ１－１～１－Ｎを示す構成図である。
　図３は、実施の形態１に係る映像処理装置３を示す構成図である。
　図４は、実施の形態１に係る映像処理装置３のハードウェアを示すハードウェア構成図である。

　カメラ１－１～１－Ｎは、ネットワーク２を介して、映像処理装置３と接続されている。Ｎは、２以上の整数である。
　カメラ１－ｎ（ｎ＝１，・・・，Ｎ）は、映像撮像部１１、エンコード部１２及び映像データ送信部１３を備えている。
　カメラ１－ｎは、監視エリアを撮影し、ネットワーク２を介して、監視エリアの映像を示す映像データを映像処理装置３に送信する。

　映像撮像部１１は、監視エリアを撮影し、監視エリアの映像をエンコード部１２に出力する。
　エンコード部１２は、映像撮像部１１から出力された映像を、Ｈ．２６４、又は、ＭＰＥＧ４等の圧縮形式によって符号化し、符号化後の映像を示す映像データを映像データ送信部１３に出力する。
　映像データ送信部１３は、ネットワーク２を介して、映像データを映像処理装置３に送信する。
　図１に示す映像監視システムでは、Ｎ台のカメラ１－１～１－Ｎが設けられている。しかし、これは一例に過ぎず、１台以上のカメラ１が設けられていればよい。以下、カメラ１－１～１－Ｎを区別しない場合、「カメラ１」のように表記する。

　ネットワーク２は、インターネット、又は、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）等の伝送経路であり、カメラ１から送信された映像データを映像処理装置３まで伝搬させる。
　映像処理装置３は、映像データ受信部２１、映像データ記録部２２、監視対象体検出部２３、モデル生成部２４、モデル合成部２５、操作受付部２６及び映像出力部２７を備えている。
　インタフェース部４は、例えば、キーボード、マウス、又は、タッチパネルによって実現されているマンマシンインタフェースである。
　モニタ５は、例えば、液晶ディスプレイによって実現される。
　モニタ５は、映像処理装置３から出力された映像を表示する。

　映像データ受信部２１は、例えば、図４に示す映像データ受信回路３１によって実現される。
　映像データ受信部２１は、ネットワーク２と接続されている。
　映像データ受信部２１は、カメラ１から送信された映像データを受信し、映像データを映像データ記録部２２に出力する。

　映像データ記録部２２は、例えば、図４に示す映像データ記録回路３２によって実現される。
　映像データ記録部２２は、映像データ受信部２１から出力された映像データのほか、監視エリアに監視対象体が含まれていないときの監視エリアの映像である背景映像を示す映像データを記録する。監視対象体としては、「人間」、「動物」、「自動車」、又は、「自転車」等が考えられる。
　背景映像を示す映像データは、カメラ１から送信されたものであってもよいし、カメラ１以外から与えられたものであってもよい。
　図１に示す映像監視システムでは、映像処理装置３が、映像データ記録部２２を備えている。しかし、これは一例に過ぎず、映像データ記録部２２が、映像処理装置３の外部に設けられていてもよい。

　監視対象体検出部２３は、例えば、図４に示す監視対象体検出回路３３によって実現される。
　監視対象体検出部２３は、映像データ記録部２２から、カメラ１により撮影された監視エリアの映像である通常映像を示す映像データと、背景映像を示す映像データとを取得する。
　監視対象体検出部２３は、通常映像を示す映像データに対するデコード処理を実施することによって、通常映像を復元する。
　監視対象体検出部２３は、背景映像を示す映像データに対するデコード処理を実施することによって、背景映像を復元する。
　監視対象体検出部２３は、復元した通常映像と復元した背景映像とを比較することによって、通常映像に含まれている監視対象体を検出する。
　監視対象体検出部２３は、監視対象体の映像をモデル生成部２４に出力し、背景映像をモデル合成部２５に出力し、通常映像を映像出力部２７に出力する。

　モデル生成部２４は、例えば、図４に示すモデル生成回路３４によって実現される。
　モデル生成部２４は、監視対象体検出部２３により検出された監視対象体を模擬した監視対象体モデルを生成する。
　モデル生成部２４は、監視対象体モデルをモデル合成部２５に出力する。

　モデル合成部２５は、例えば、図４に示すモデル合成回路３５によって実現される。
　モデル合成部２５は、監視対象体検出部２３から、背景映像を取得し、モデル生成部２４から、監視対象体モデルを取得する。
　モデル合成部２５は、背景映像に、モデル生成部２４により生成された監視対象体モデルを合成する。
　モデル合成部２５は、監視対象体モデル合成後の背景映像（以下「モデル合成映像」という）を映像出力部２７に出力する。

　操作受付部２６は、例えば、図４に示す操作受付回路３６によって実現される。
　操作受付部２６は、監視対象体の監視者が、監視対象体の監視を開始する前に、インタフェース部４を操作することによって、例えば、監視者に割り当てられているＩＤの入力操作を行うと、ＩＤの入力操作を受け付ける。
　操作受付部２６は、監視者に割り当てられているＩＤに基づいて、監視者の権限レベルを確認する。
　操作受付部２６は、監視者の権限レベルを示す権限レベル情報を映像出力部２７に出力する。

　映像出力部２７は、例えば、図４に示す映像出力回路３７によって実現される。
　映像出力部２７は、操作受付部２６から出力された権限レベル情報を取得し、権限レベル情報から、監視者が有している権限を確認する。
　映像出力部２７は、監視者が、モデル合成映像のみを閲覧する権限を有していれば、モデル合成部２５から、モデル合成映像を取得し、モデル合成映像をモニタ５に出力する。
　映像出力部２７は、監視者が、モデル合成映像の閲覧だけでなく、通常映像についても閲覧する権限を有していれば、モデル合成部２５から、モデル合成映像を取得し、監視対象体検出部２３から、通常映像を取得する。
　映像出力部２７は、通常映像及びモデル合成映像のうち、１つ以上の映像をモニタ５に出力する。

　図３では、映像処理装置３の構成要素である映像データ受信部２１、映像データ記録部２２、監視対象体検出部２３、モデル生成部２４、モデル合成部２５、操作受付部２６及び映像出力部２７のそれぞれが、図４に示すような専用のハードウェアによって実現されるものを想定している。即ち、映像処理装置３が、映像データ受信回路３１、映像データ記録回路３２、監視対象体検出回路３３、モデル生成回路３４、モデル合成回路３５、操作受付回路３６及び映像出力回路３７によって実現されるものを想定している。

　ここで、映像データ記録回路３２は、例えば、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、フラッシュメモリ、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＥＥＰＲＯＭ（Ｅｌｅｃｔｒｉｃａｌｌｙ　Ｅｒａｓａｂｌｅ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）等の不揮発性又は揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、あるいは、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）が該当する。

　映像データ受信回路３１、監視対象体検出回路３３、モデル生成回路３４、モデル合成回路３５、操作受付回路３６及び映像出力回路３７のそれぞれは、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、又は、これらを組み合わせたものが該当する。

　映像処理装置３の構成要素は、専用のハードウェアによって実現されるものに限るものではなく、映像処理装置３が、ソフトウェア、ファームウェア、又は、ソフトウェアとファームウェアとの組み合わせによって実現されるものであってもよい。
　ソフトウェア又はファームウェアは、プログラムとして、コンピュータのメモリに格納される。コンピュータは、プログラムを実行するハードウェアを意味し、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサ、あるいは、ＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）が該当する。
　図５は、映像処理装置３が、ソフトウェア又はファームウェア等によって実現される場合のコンピュータのハードウェア構成図である。
　映像処理装置３が、ソフトウェア又はファームウェア等によって実現される場合、映像データ記録部２２がコンピュータのメモリ４１上に構成される。映像データ受信部２１、監視対象体検出部２３、モデル生成部２４、モデル合成部２５、操作受付部２６及び映像出力部２７におけるそれぞれの処理手順をコンピュータに実行させるためのプログラムがメモリ４１に格納される。そして、コンピュータのプロセッサ４２がメモリ４１に格納されているプログラムを実行する。

　また、図４では、映像処理装置３の構成要素のそれぞれが専用のハードウェアによって実現される例を示し、図５では、映像処理装置３がソフトウェア又はファームウェア等によって実現される例を示している。しかし、これは一例に過ぎず、映像処理装置３における一部の構成要素が専用のハードウェアによって実現され、残りの構成要素がソフトウェア又はファームウェア等によって実現されるものであってもよい。

　次に、図１に示す映像監視システムの動作について説明する。
　図６は、実施の形態１に係る映像処理装置３の処理手順である映像処理方法を示すフローチャートである。
　監視対象体の監視者が、監視対象体の監視を開始する前に、監視エリアに監視対象体が含まれていないときに、カメラ１を操作することによって、カメラ１に監視エリアを撮影させる。
　カメラ１は、ネットワーク２を介して、監視エリアに監視対象体が含まれていないときの監視エリアの映像である背景映像を示す映像データを映像処理装置３に送信する。
　図７は、背景映像の一例を示す説明図である。
　なお、カメラ１が、監視対象体が含まれていないときの監視エリアを定期的に撮影することによって、背景映像を更新するようにしてもよい。

　映像処理装置３の映像データ受信部２１は、カメラ１から送信された背景映像を示す映像データを受信する。
　映像データ受信部２１は、背景映像を示す映像データを映像データ記録部２２に出力する。
　映像データ記録部２２は、背景映像を示す映像データを記録する。

　監視対象体の監視者が、監視対象体の監視を開始する前に、インタフェース部４を操作することによって、例えば、監視者に割り当てられているＩＤの入力操作を行うと、操作受付部２６は、ＩＤの入力操作を受け付ける。
　操作受付部２６は、監視者に割り当てられているＩＤに基づいて、監視対象体の監視者の権限レベルを確認する。
　図１に示す映像監視システムでは、監視者の権限レベルが、例えば、権限レベルＬ０、権限レベルＬ１及び権限レベルＬ２の３つに分類されているものとする。
　権限レベルＬ０は、監視者が、モデル合成映像及び通常映像の全てを閲覧する権限を有しないレベルである。
　権限レベルＬ１は、監視者が、モデル合成映像のみの閲覧が可能であり、通常映像を閲覧する権限を有しないレベルである。
　権限レベルＬ２は、監視者が、モデル合成映像の閲覧だけでなく、通常映像についても閲覧する権限を有するレベルである。
　操作受付部２６は、監視者の権限レベルを示す権限レベル情報を映像出力部２７に出力する。

　カメラ１は、監視中に、監視エリアを撮影する。
　カメラ１は、ネットワーク２を介して、監視エリアの映像である通常映像を示す映像データを映像処理装置３に送信する。
　図８は、通常映像の一例を示す説明図である。
　図８の例では、監視対象体として、人間及び自動車のそれぞれが、通常映像に含まれている。

　映像処理装置３の映像データ受信部２１は、カメラ１から送信された通常映像を示す映像データを受信する（図６のステップＳＴ１）。
　映像データ受信部２１は、通常映像を示す映像データを映像データ記録部２２に出力する。
　映像データ記録部２２は、通常映像を示す映像データを記録する。

　監視対象体検出部２３は、映像データ記録部２２から、背景映像を示す映像データと、通常映像を示す映像データとを取得する。
　監視対象体検出部２３は、背景映像を示す映像データに対するデコード処理を実施することによって、背景映像を復元する。
　監視対象体検出部２３は、通常映像を示す映像データに対するデコード処理を実施することによって、通常映像を復元する。
　監視対象体検出部２３は、復元した背景映像と、復元した通常映像とを比較することによって、通常映像に含まれている監視対象体を検出する（図６のステップＳＴ２）。通常映像に含まれている監視対象体は、背景映像と、通常映像との差分である。
　監視対象体検出部２３は、検出した監視対象体の映像をモデル生成部２４に出力し、復元した通常映像を映像出力部２７に出力する。
　また、監視対象体検出部２３は、復元した背景映像をモデル合成部２５に出力する。
　図１に示す映像監視システムでは、監視対象体検出部２３が、背景映像と通常映像とを比較することによって、監視対象体を検出している。しかし、これは一例に過ぎず、監視対象体検出部２３が、“ＯｐｅｎＣＶ”又は“Ｔｅｎｓｏｒｆｌｏｗ”等の公知の画像解析処理を実施することによって、通常映像から監視対象体を検出するようにしてもよい。

　モデル生成部２４は、監視対象体検出部２３から、監視対象体の映像を取得する。
　モデル生成部２４は、監視対象体を模擬した監視対象体モデルを生成する（図６のステップＳＴ３）。監視対象体モデルは、２Ｄ（Ｄｉｍｅｎｓｉｏｎｓ）のモデルでもよいし、３Ｄのモデルでもよい。
　モデル生成部２４は、監視対象体モデルをモデル合成部２５に出力する。
　以下、モデル生成部２４による監視対象体モデルの生成処理を具体的に説明する。
　図１０は、モデル生成部２４による監視対象体モデルの生成処理を示すフローチャートである。

　モデル生成部２４は、“ＯｐｅｎＣＶ”又は“Ｔｅｎｓｏｒｆｌｏｗ”等の公知の画像解析処理を実施することによって、監視対象体の種類を識別する（図１０のステップＳＴ１１）。
　即ち、モデル生成部２４は、監視対象体が、例えば、「人間」、「動物」、「自動車」、又は、「自転車」であるのかを識別する。

　モデル生成部２４の内部メモリには、例えば、人間を模擬した監視対象体モデルの基本モデル、動物を模擬した監視対象体モデルの基本モデル、自動車を模擬した監視対象体モデルの基本モデル、自転車を模擬した監視対象体モデルの基本モデルが記憶されている。
　モデル生成部２４は、監視対象体の種類の識別結果に基づいて、内部メモリに記憶されている複数の基本モデルの中から、監視対象体の種類に対応する基本モデルを選択する（図１０のステップＳＴ１２）。
　即ち、モデル生成部２４は、例えば、監視対象体が「人間」であると識別すれば、人間を模擬した監視対象体モデルの基本モデルを選択し、例えば、監視対象体が「自動車」であると識別すれば、自動車を模擬した監視対象体モデルの基本モデルを選択する。

　モデル生成部２４は、公知の画像解析処理を実施することによって、監視対象体の特徴を抽出する（図１０のステップＳＴ１３）。
　即ち、モデル生成部２４は、例えば、監視対象体が「人間」であると識別すれば、監視対象体の特徴として、人間の身長、体格、服装の種類、又は、服装の色等を抽出する。服装の種類としては、ズボン、スカート、又は、和服等が考えられる。また、モデル生成部２４は、監視対象体の特徴として、人間の位置を抽出する。人間の位置は、監視エリアの映像において、人間が映っている領域の座標である。
　モデル生成部２４は、例えば、監視対象体が「自動車」であると識別すれば、監視対象体の特徴として、自動車の全長、車幅、車高、又は、色等を抽出する。また、モデル生成部２４は、監視対象体の特徴として、自動車の位置を抽出する。自動車の位置は、監視エリアの映像において、自動車が映っている領域の座標である。

　モデル生成部２４は、監視対象体の特徴に応じて、選択した基本モデルをカスタマイズする（図１０のステップＳＴ１４）。
　即ち、モデル生成部２４は、例えば、監視対象体が「人間」であると識別すれば、抽出した人間の身長及び体格に応じて、基本モデルの大きさを調整する。また、モデル生成部２４は、抽出した服装の種類に応じて、基本モデルが身に着けている服装を変更し、抽出した服装の色に応じて、基本モデルが身に着けている服装の色を変更する。
　モデル生成部２４は、例えば、監視対象体が「自動車」であると識別すれば、抽出した自動車の全長、車幅及び車高に応じて、基本モデルの大きさを調整する。また、モデル生成部２４は、抽出した自動車の色に応じて、基本モデルの色を変更する。
　モデル生成部２４は、監視対象体モデルとして、カスタマイズ後の基本モデルをモデル合成部２５に出力する。
　また、モデル生成部２４は、監視対象体の位置を示す位置情報をモデル合成部２５に出力する。

　図１に示す映像監視システムでは、モデル生成部２４が、監視対象体の種類を識別することによって、監視対象体モデルの基本モデルを選択し、監視対象体の特徴に応じて、選択した基本モデルをカスタマイズしている。
　しかし、これは一例に過ぎず、モデル生成部２４が、監視対象体の特徴から、監視対象体の形状を推定し、推定した形状を有する監視対象体モデルを生成するようにしてもよい。
　監視対象体に対する監視対象体モデルの再現度についての設定内容は、例えば、操作受付部２６が、受け付けるようにしてもよい。この場合、モデル生成部２４は、設定内容に応じた再現度で監視対象体モデルを生成する。
　また、監視対象体が「人間」であり、モデル生成部２４が、監視対象体の特徴として、監視対象体の性別を抽出することができれば、モデル生成部２４が、監視対象体の性別に応じて、監視対象体モデルを色分けするようにしてもよい。

　モデル合成部２５は、監視対象体検出部２３から、背景映像を取得する。
　モデル合成部２５は、モデル生成部２４から、監視対象体モデル及び監視対象体の位置情報のそれぞれを取得する。
　モデル合成部２５は、監視対象体の位置情報に基づいて、監視エリアの映像に含まれている監視対象体の位置を特定する。
　モデル合成部２５は、背景映像の中の特定した位置に監視対象体モデルを合成する（図６のステップＳＴ４）。背景映像に監視対象体モデルを合成する処理自体は、公知の技術であるため詳細な説明を省略する。
　モデル合成部２５は、監視対象体モデル合成後の背景映像であるモデル合成映像を映像出力部２７に出力する。

　図９は、モデル合成映像の一例を示す説明図である。
　図９の例では、モデル合成映像として、人間を模擬した監視対象体モデルと、自動車を模擬した監視対象体モデルとを含む映像が表されている。図９の例では、自動車を模擬した監視対象体モデルの再現度が、人間を模擬した監視対象体モデルの再現度よりも高くなっている。
　即ち、自動車を模擬した監視対象体モデルと監視対象体である自動車との類似度が、人間を模擬した監視対象体モデルと監視対象体である人間との類似度よりも高くなっている。
　モデル合成部２５によって、監視対象体モデルが背景映像に合成される場合、監視対象体がマスク処理される場合と異なり、監視対象体モデルの周囲の映像がぼけることがない。したがって、監視対象体が、どのような所に存在しているのかが分かり難くなってしまうことがない。
　監視対象体が、どのような所に存在しているのかが分からなくなると、監視者は、監視対象体が不審な行動をしていても、不審な行動をしているか否かを判別することができない。しかし、監視対象体が、どのような所に存在しているのかが分かれば、監視者は、監視対象体が不審な行動をしているか否かを判別できることがある。

　映像出力部２７は、操作受付部２６から、監視者の権限レベルを示す権限レベル情報を取得する。
　映像出力部２７は、監視者の権限レベルが、権限レベルＬ０であれば（図６のステップＳＴ５：ＹＥＳの場合）、モデル合成映像及び通常映像の全てを閲覧できないと判断し、モデル合成映像及び通常映像の双方をモニタ５に出力しない。
　映像出力部２７は、監視者の権限レベルが、権限レベルＬ１であれば（図６のステップＳＴ５：ＮＯ、かつ、ステップＳＴ６：ＹＥＳの場合）、モデル合成映像のみの閲覧が可能であると判断し、モデル合成部２５から、モデル合成映像を取得する。
　映像出力部２７は、モデル合成映像をモニタ５に出力する（図６のステップＳＴ７）。
　モニタ５は、映像出力部２７から出力されたモデル合成映像を表示する。

　映像出力部２７は、監視者の権限レベルが、権限レベルＬ２であれば（図６のステップＳＴ６：ＮＯの場合）、モデル合成映像の閲覧だけでなく、通常映像についても閲覧が可能であると判断する。
　そして、映像出力部２７は、モデル合成部２５から、モデル合成映像を取得し、監視対象体検出部２３から、通常映像を取得する。
　映像出力部２７は、表示対象の映像の設定内容に従って、通常映像及びモデル合成映像のうち、１つ以上の映像をモニタ５に出力する（図６のステップＳＴ８）。
　具体的には、映像出力部２７は、表示対象の映像が、通常映像に設定されていれば、通常映像をモニタ５に出力し、表示対象の映像が、モデル合成映像に設定されていれば、モデル合成映像をモニタ５に出力する。
　また、映像出力部２７は、表示対象の映像が、通常映像及びモデル合成映像の双方であれば、通常映像及びモデル合成映像の双方をモニタ５に出力する。なお、監視者がインタフェース部４を操作することで、表示対象の映像を設定することができ、表示対象の映像の設定内容は、操作受付部２６によって受け付けられる。
　モニタ５は、映像出力部２７から出力された表示対象の映像、即ち、通常映像及びモデル合成映像のうち、１つ以上の映像を表示する。
　表示対象の映像に通常映像が含まれている場合、監視対象体のプライバシーが保護されなくなる。したがって、通常は、表示対象の映像に通常映像が含まれないように設定される運用が想定される。しかし、監視対象体のプライバシーを保護するよりも、監視対象体を特定する必要がある場合、表示対象の映像に通常映像が含まれるように設定されることがある。

　以上の実施の形態１では、カメラ１により撮影された監視エリアの映像を示す映像データを受信する映像データ受信部２１と、映像データ受信部２１により受信された映像データが示す映像に含まれている監視対象体を検出する監視対象体検出部２３と、監視対象体検出部２３により検出された監視対象体を模擬した監視対象体モデルを生成するモデル生成部２４と、監視エリアに監視対象体が含まれていないときの監視エリアの映像である背景映像に、モデル生成部２４により生成された監視対象体モデルを合成するモデル合成部２５と、モデル合成部２５による監視対象体モデル合成後の映像を出力する映像出力部２７とを備えるように、映像処理装置３を構成した。したがって、映像処理装置３は、監視対象体の周囲の映像のぼけを招くことなく、監視対象体のプライバシーを保護することができる。

　図１に示す映像監視システムでは、映像出力部２７が、監視者の権限レベルに基づいて、閲覧が可能な映像がモデル合成映像のみであるのか、モデル合成映像及び通常映像の双方であるのかを判断している。そして、映像出力部２７が、当該判断に基づいて、いずれかの映像をモニタ５に出力している。
　しかし、これは一例に過ぎず、例えば、表示対象の映像がモデル合成映像に設定されていれば、映像出力部２７が、モデル合成映像をモニタ５に出力し、表示対象の映像が通常映像に設定されていれば、映像出力部２７が、通常映像をモニタ５に出力するようにしてもよい。表示対象の映像の設定は、操作受付部２６が受け付けることができる。

　図１に示す映像監視システムでは、監視者の権限レベルが、権限レベルＬ２であり、表示対象の映像に通常映像が含まれていれば、映像出力部２７が、映像データ記録部２２に記録されている映像データから復元された通常映像をモニタ５に出力している。しかし、これは一例に過ぎず、映像出力部２７が、映像データ受信部２１により受信された映像データから、リアルタイムの映像として、通常映像を復元し、当該通常映像をモニタ５に出力するようにしてもよい。

　図１に示す映像監視システムでは、監視対象体検出部２３が、映像データ記録部２２に記録されている映像データから復元した通常映像に含まれている監視対象体を検出している。しかし、これは一例に過ぎず、監視対象体検出部２３が、映像データ受信部２１により受信された映像データから、リアルタイムの映像を復元し、リアルタイムの映像に含まれている監視対象体を検出するようにしてもよい。

　図１に示す映像監視システムでは、モデル合成部２５が、モデル合成映像を映像出力部２７に出力するようにしている。しかし、これは一例に過ぎず、モデル合成部２５が、モデル合成映像を映像データ記録部２２に出力して、映像データ記録部２２が、モデル合成映像を記録し、映像出力部２７が、映像データ記録部２２により記録されているモデル合成映像をモニタ５に出力するようにしてもよい。

実施の形態２．
　実施の形態２では、カメラ１が、監視対象体検出部２３、モデル生成部２４及びモデル合成部２５を含んでいる映像監視システムについて説明する。

　実施の形態２に係る映像監視システムの構成は、実施の形態１に係る映像監視システムの構成と同様であり、実施の形態２に係る映像監視システムを示す構成図は、図１である。
　図１１は、実施の形態２に係る映像監視システムのカメラ１－１～１－Ｎを示す構成図である。
　図１１に示すカメラ１は、映像撮像部１１、エンコード部１２及び映像データ送信部１３のほかに、監視対象体検出部２３、モデル生成部２４及びモデル合成部２５を備えている。
　図１２は、実施の形態２に係る映像処理装置３を示す構成図である。
　図１２に示す映像処理装置３は、映像データ受信部２１、映像データ記録部２２、操作受付部２６及び映像出力部２７を備えている。

　次に、実施の形態２に係る映像監視システムの動作について説明する。
　カメラ１の映像撮像部１１は、監視エリアに監視対象体が含まれていないときに、監視エリアを撮影する。
　映像撮像部１１は、監視エリアに監視対象体が含まれていないときの監視エリアの映像である背景映像を監視対象体検出部２３に出力する。
　また、映像撮像部１１は、監視中に、監視エリアを撮影し、監視エリアの映像である通常映像を監視対象体検出部２３及びエンコード部１２のそれぞれに出力する。

　カメラ１の監視対象体検出部２３は、図３に示す監視対象体検出部２３と概ね同様の処理を実施する。
　即ち、カメラ１の監視対象体検出部２３は、映像撮像部１１から出力された背景映像と通常映像とを比較することによって、監視エリアの映像に含まれている監視対象体を検出する。
　カメラ１の監視対象体検出部２３は、検出した監視対象体の映像をモデル生成部２４に出力し、背景映像をモデル合成部２５に出力する。

　カメラ１のモデル生成部２４は、図３に示すモデル生成部２４と概ね同様の処理を実施する。
　即ち、カメラ１のモデル生成部２４は、監視対象体検出部２３から、監視対象体の映像を取得する。
　カメラ１のモデル生成部２４は、監視対象体を模擬した監視対象体モデルを生成し、監視対象体モデルをモデル合成部２５に出力する。
　また、カメラ１のモデル生成部２４は、監視対象体の位置を示す位置情報をモデル合成部２５に出力する。

　カメラ１のモデル合成部２５は、図３に示すモデル合成部２５と概ね同様の処理を実施する。
　即ち、カメラ１のモデル合成部２５は、監視対象体検出部２３から、背景映像を取得する。
　カメラ１のモデル合成部２５は、モデル生成部２４から、監視対象体モデル及び監視対象体の位置情報のそれぞれを取得する。
　カメラ１のモデル合成部２５は、監視対象体の位置情報に基づいて、監視エリアの映像に含まれている監視対象体の位置を特定する。
　カメラ１のモデル合成部２５は、背景映像の中の特定した位置に監視対象体モデルを合成する。
　モデル合成部２５は、監視対象体モデル合成後の背景映像であるモデル合成映像をエンコード部１２に出力する。

　カメラ１のエンコード部１２は、映像撮像部１１から出力された通常映像と、モデル合成部２５から出力されたモデル合成映像とを取得する。
　カメラ１のエンコード部１２は、通常映像を、Ｈ．２６４、又は、ＭＰＥＧ４等の圧縮形式によって符号化し、符号化後の通常映像を示す映像データを映像データ送信部１３に出力する。
　カメラ１のエンコード部１２は、モデル合成映像を、Ｈ．２６４、又は、ＭＰＥＧ４等の圧縮形式によって符号化し、符号化後のモデル合成映像を示す映像データを映像データ送信部１３に出力する。

　カメラ１の映像データ送信部１３は、ネットワーク２を介して、符号化後の通常映像を示す映像データを映像処理装置３に送信する。
　また、カメラ１の映像データ送信部１３は、ネットワーク２を介して、符号化後のモデル合成映像を示す映像データを映像処理装置３に送信する。

　映像処理装置３の映像データ受信部２１は、カメラ１から送信された通常映像を示す映像データを受信し、受信した映像データを映像データ記録部２２に出力する。
　また、映像処理装置３の映像データ受信部２１は、カメラ１から送信されたモデル合成映像を示す映像データを受信し、受信した映像データを映像データ記録部２２に出力する。
　映像処理装置３の映像データ記録部２２は、通常映像を示す映像データを記録し、モデル合成映像を示す映像データを記録する。

　映像処理装置３の映像出力部２７は、操作受付部２６から、監視者の権限レベルを示す権限レベル情報を取得する。
　映像出力部２７は、監視者の権限レベルが、権限レベルＬ１であれば、モデル合成映像のみの閲覧が可能であると判断し、映像データ記録部２２から、モデル合成映像を示す映像データを取得する。
　映像出力部２７は、モデル合成映像を示す映像データに対するデコード処理を実施することによって、モデル合成映像を復元する。
　映像出力部２７は、モデル合成映像をモニタ５に出力する。
　モニタ５は、映像出力部２７から出力されたモデル合成映像を表示する。

　映像出力部２７は、監視者の権限レベルが、権限レベルＬ２であれば、モデル合成映像の閲覧だけでなく、通常映像についても閲覧が可能であると判断する。
　そして、映像出力部２７は、映像データ記録部２２から、モデル合成映像を示す映像データと、通常映像を示す映像データとを取得する。
　映像出力部２７は、表示対象の映像の設定内容に従って、通常映像を示す映像データ及びモデル合成映像を示す映像データのうち、１つ以上の映像データに対するデコード処理を実施することによって、通常映像及びモデル合成映像のうち、１つ以上の映像を復元する。
　映像出力部２７は、表示対象の映像の設定内容に従って、通常映像及びモデル合成映像のうち、１つ以上の映像をモニタ５に出力する
　モニタ５は、映像出力部２７から出力された表示対象の映像、即ち、通常映像及びモデル合成映像のうち、１つ以上の映像を表示する。

　以上より、カメラ１が、監視対象体検出部２３、モデル生成部２４及びモデル合成部２５を含んでいる映像監視システムでも、図３に示す映像処理装置３と同様に、監視対象体の周囲の映像のぼけを招くことなく、監視対象体のプライバシーを保護することができる。

　なお、本開示は、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。

　本開示は、映像処理装置、映像処理方法及び映像監視システムに適している。

　１，１－１～１－Ｎ　カメラ、２　ネットワーク、３　映像処理装置、４　インタフェース部、５　モニタ、１１　映像撮像部、１２　エンコード部、１３　映像データ送信部、２１　映像データ受信部、２２　映像データ記録部、２３　監視対象体検出部、２４　モデル生成部、２５　モデル合成部、２６　操作受付部、２７　映像出力部、３１　映像データ受信回路、３２　映像データ記録回路、３３　監視対象体検出回路、３４　モデル生成回路、３５　モデル合成回路、３６　操作受付回路、３７　映像出力回路、４１　メモリ、４２　プロセッサ。

Claims

　カメラにより撮影された監視エリアの映像を示す映像データを受信する映像データ受信部と、
　前記映像データ受信部により受信された映像データが示す映像に含まれている監視対象体を検出する監視対象体検出部と、
　前記監視対象体検出部により検出された監視対象体を模擬した監視対象体モデルを生成するモデル生成部と、
　前記監視エリアに前記監視対象体が含まれていないときの前記監視エリアの映像である背景映像に、前記モデル生成部により生成された監視対象体モデルを合成するモデル合成部と、
　前記モデル合成部による監視対象体モデル合成後の映像を出力する映像出力部と
　を備えた映像処理装置。
　前記モデル生成部は、
　前記監視対象体検出部により検出された監視対象体の種類を識別し、前記監視対象体の種類の識別結果に基づいて、互いに異なる複数の監視対象体モデルにおけるそれぞれの基本モデルの中から、前記監視対象体を模擬した基本モデルを選択し、
　前記監視対象体の特徴を抽出し、前記監視対象体の特徴に基づいて、選択した基本モデルをカスタマイズし、前記監視対象体を模擬した監視対象体モデルとして、カスタマイズ後の基本モデルを前記モデル合成部に出力することを特徴とする請求項１記載の映像処理装置。
　前記映像出力部は、前記監視対象体の監視者が、前記モデル合成部による監視対象体モデル合成後の映像であるモデル合成映像を閲覧する権限を有している場合に限り、前記モデル合成映像を出力することを特徴とする請求項１記載の映像処理装置。
　映像データ受信部が、カメラにより撮影された監視エリアの映像を示す映像データを受信し、
　監視対象体検出部が、前記映像データ受信部により受信された映像データが示す映像に含まれている監視対象体を検出し、
　モデル生成部が、前記監視対象体検出部により検出された監視対象体を模擬した監視対象体モデルを生成し、
　モデル合成部が、前記監視エリアに前記監視対象体が含まれていないときの前記監視エリアの映像である背景映像に、前記モデル生成部により生成された監視対象体モデルを合成し、
　映像出力部が、前記モデル合成部による監視対象体モデル合成後の映像を出力する
　映像処理方法。
　監視エリアを撮影し、前記監視エリアの映像を示す映像データを送信するカメラと、
　前記カメラから送信された映像データを受信する映像データ受信部と、
　前記映像データ受信部により受信された映像データが示す映像に含まれている監視対象体を検出する監視対象体検出部と、
　前記監視対象体検出部により検出された監視対象体を模擬した監視対象体モデルを生成するモデル生成部と、
　前記監視エリアに前記監視対象体が含まれていないときの前記監視エリアの映像である背景映像に、前記モデル生成部により生成された監視対象体モデルを合成するモデル合成部と、
　前記モデル合成部による監視対象体モデル合成後の映像を出力する映像出力部と、
　前記映像出力部から出力された監視対象体モデル合成後の映像を表示するモニタと
　を備えた映像監視システム。
　前記カメラは、前記監視対象体検出部、前記モデル生成部及び前記モデル合成部を含んでおり、前記監視エリアの映像を示す映像データのほかに、前記モデル合成部による監視対象体モデル合成後の映像を示す映像データを送信し、
　前記映像データ受信部は、前記カメラから送信された前記監視エリアの映像を示す映像データを受信して、当該映像データが示す前記監視エリアの映像を前記映像出力部に出力し、前記カメラから送信された監視対象体モデル合成後の映像を示す映像データを受信して、当該映像データが示す監視対象体モデル合成後の映像を前記映像出力部に出力することを特徴とする請求項５記載の映像監視システム。