以下、図面を参照して、本発明の実施形態を詳細に説明する。
図1は、本発明のシステムの一例を示した構成図である。
概略としては、まず、公共交通機関100内の映像を監視カメラ130で搭乗者140を含む内部映像を撮影する。そして、撮影された映像は通信ネットワーク150を通じて情報処理装置120に送信し、情報処理端末110で監視映像を見ることができる仕組みである。なお、本実施例における「映像」とは、監視映像、画像と言い換えてもよく、また静止画と動画の両方を含む表現である。
公共交通機関100は、不特定多数の人物(搭乗者140)を乗せて移動する移動手段であり、例えば、電車、バス、船、飛行機等が含まれる。ただし、不特定多数の人物が互いに手を伸ばせば触れることのできる距離で、一定の時間移動せずに留まっている空間、すなわち、痴漢犯罪の発生しうる状況の空間であれば、本発明を実施することができる。したがって、このような空間も、公共交通機関100の概念に含んでよいものとする。具体的には例えば、人が大勢押し寄せるイベント会場や、テーマパークの人気アトラクションの行列ができる場所などが考えられる。
監視カメラ130は、搭乗者140の映像(複数の被写体を含む静止画又は動画である第1の映像,同じ被写体を挟んで同じ時期に撮影される2点のアングルの映像)を得るための撮像装置である。特に、天井側から床側に向かって搭乗者140を撮影した映像(ハイアングル映像)を撮影するカメラを、特にハイアングルカメラ131と呼ぶ。また床側から天井側に向かって搭乗者140を撮影した映像であって、ハイアングル映像に対応するアングルの画像(ローアングル映像)を撮影するカメラを、特にローアングルカメラ132と呼ぶ。
ハイアングルカメラ131及びローアングルカメラ132は、それぞれ複数設置されていてもよい。これは、例えば、特開2008−118466号公報に示されるような、隣接する複数の監視カメラの映像から、真上から俯瞰した俯瞰画像(俯瞰映像)を合成する、といった技術があるからである。具体的には、例えば図3と図4に示すように、複数のカメラ(図3ではα、β、γ、σ)から得た映像、(図4の(a)、(b)、(c)、(d))から、仮想画像視点300から地面を見下ろしたハイアングル映像(図4(e))を合成して得ることができる。同じように、床に複数のカメラを設置すれば、それらの映像から、ローアングル映像を合成して得ることも可能である。このような従来技術があるので、被写体を挟んで向かい合う視点の2つの映像が得られる仕組みがあればよく、必ずしも図1のように床面に対して垂直な対称位置に配置されている構成でなくともよい。
情報処理装置120は、監視カメラ130で撮影された映像を、通信ネットワーク150経由で受付けて処理・管理・保管するための装置である。
情報処理装置120は、例えば以下のような処理を行うことができる。
1.複数の監視カメラ130で撮影された映像に基づくハイアングル映像、ローアングル映像の生成
2.サーモグラフィー「風」の画像の生成(色空間を変換するなど)
3.左右を反転させた映像(反転映像)の生成
4.ハイアングル映像とローアングル映像とに基づいて、両者を対応関係が分かりやすく一つの映像として見るための映像(表示映像)の生成
4.各種映像や映像に関連する情報の記憶・管理
5.映像内に映り込んだ搭乗者140の性別や年齢の推定、搭乗者140同士の距離や対応関係(知人か他人か)の推定
なお、上記の機能の一部または全部は、情報処理端末110が供えることもでき、そのような形態であっても、本発明は実施できる。
情報処理端末110は、ユーザから本発明のシステムの設定変更の指示を受付けたり、情報処理装置120で管理されている映像を表示したりするための端末である。設定変更するものには、映像の中で画質の良い領域とそうでない領域を決定するための各種条件(例えば、搭乗者140同士の距離や組み合わせなど)が含まれる。詳細は図7にて後述する。
搭乗者140は、公共交通機関100に乗っている人物である。搭乗者140は、本実施例では更に男性搭乗者141と女性搭乗者142とに分類される。
通信ネットワーク150は、情報処理端末110、情報処理装置120、監視カメラ130を相互に通信可能に接続するネットワークである。通信方法には既存の様々な技術を用いることができる。有線であっても無線であってもよく、WAN(Wide Area Network)であってもLAN(Local Area Network)であってもよい。
図2は、本発明のハードウエアの構成の一例を示した構成図である。ハードウエアは、具体的には情報処理端末110、情報処理装置120が含まれる。また、監視カメラ130が、情報処理装置120の構成・機能を含んでいても良い。
201はCPUで、ROM202のプログラム用ROMや外部メモリ211に記憶されたプログラムをRAM203にロードして実行することによりシステムバス204に接続された各デバイスを制御する。また、このROM202のフォント用ROMにはフォントデータ等を記憶し、ROM202のデータ用ROMには各種データを記憶する。203はRAMで、CPU201の主メモリ、ワークエリア等として機能する。202はキーボードコントローラ(入力コントローラ)で、209や図示しないポインティングデバイス、例えばタッチパッドからの入力を制御する。
入力コントローラ205は入力デバイス209を制御する。なお入力デバイス209には、タッチパネルも含まれ、その場合は、入力デバイス209が表示部210(画像を表示する表示画面を映すための表示装置)を兼ねているケースもある。206はビデオカード(VC)で、表示部210の表示を制御する。
207はメモリコントローラで、外部メモリ211(ハードディスク等)とのアクセスを制御する。208はネットワークインターフェースカード(NIC)で、通信ネットワーク150上の通信を制御する。
図3及び図4では、複数の監視カメラの映像を合成してハイアングル映像を得るための仕組みの一例を示す。図3は、ハイアングル映像を得るための監視カメラ130の構成の一例を示した構成図である。図4は、図3のそれぞれの監視カメラ130で撮影された映像と、それらを合成した映像の一例を示した構成図である。
本発明の実施例で取り上げている、情報処理装置120は、図3の4つの監視カメラ130(α、β、γ、σ)で撮影された画像(図4(a)乃至(d))から、図4(e)に示されるようなハイアングル画像(仮想画像視点300か0063ら床方向を見下ろした画像)を生成することができる。また、この仕組みを応用すれば、床面から天井方向を撮影する複数のカメラを配置し、そこから得られた映像に基づいて、ローアングル映像を生成することもできる(不図示)。
図5は、本発明の情報処理フローの一例について示した構成図である。
ステップS501では、監視カメラ130は、公共交通機関100内の映像を撮影する。
ステップS502では、監視カメラ130は、情報処理装置120に撮影した映像を、送信する。
ステップS503では、情報処理装置120は、ステップS502で送信された映像を、受信する。
ステップS504では、情報処理装置120は、ステップS503で受信した映像の処理を行う。フローの詳細は図6で述べるが、情報処理端末110の表示部210で表示(ステップS507)するために必要となる一連の処理である。
ステップS505では、情報処理装置120は、情報処理端末110に、ステップS504の処理に関連する情報であって、情報処理端末110の表示部210で表示(ステップS507)するために必要となる一連の情報を、送信する。
ここで、ステップS504とステップS505とについて補足する。ステップS504の一連の処理は、ステップS1001で行うことも可能である。そして、その場合、ステップS505ではステップS503で受付けた映像と共に、ステップS1001の処理に必要な情報を、情報処理端末110に送信することになる。
ステップS506では、情報処理端末110は、ステップS505で情報処理装置120から送信された情報を受信する。
ステップS507では、情報処理端末110は、映像を表示部210で表示する処理を行う。詳細については図9にて述べる。
ステップS508では、情報処理端末110は、フローを終了するための指示を、受付ける。終了する指示をどのように受け付けるかは、実施形態に合わせればよい。例えば、ユーザから受付ける形態をとってもよいし、他のハードウエアのフローの終了に合わせて行う形態であってもよい。
ステップS509では、情報処理端末110は、ステップS508でフローを終了する指示を受付けたか否かを判定する。そして、終了すると判定した場合には、処理を終了する。一方、終了しないと判定した場合には、ステップS506へ遷移する。
ステップS510では、監視カメラ130は、フローを終了するための指示を、受付ける。終了する指示をどのように受け付けるかは、実施形態に合わせればよい。例えば、ユーザから受付ける形態をとってもよいし、他のハードウエアのフローの終了に合わせて行う形態であってもよい。
ステップS511では、監視カメラ130は、ステップS510でフローを終了する指示を受付けたか否かを判定する。そして、終了すると判定した場合には、処理を終了する。一方、終了しないと判定した場合には、ステップS501へ遷移する。
ステップS512では、情報処理装置120は、ステップS503で受け付けた映像、ステップS504の映像の処理を通じて生成された各種映像や情報を、記録する。
ステップS513では、情報処理装置120は、フローを終了するための指示を、受付ける。終了する指示をどのように受け付けるかは、実施形態に合わせればよい。例えば、ユーザから受付ける形態をとってもよいし、他のハードウエアのフローの終了に合わせて行う形態であってもよい。
ステップS514では、情報処理装置120は、監視カメラ130は、ステップS512でフローを終了する指示を受付けたか否かを判定する。そして、終了すると判定した場合には、処理を終了する。一方、終了しないと判定した場合には、ステップS503へ遷移する。
図6は、ステップS504または、ステップS1001で行われる情報処理フロー一例を示した構成図である。ステップS504で処理をする場合、処理主体が情報処理装置120となり、ステップS1001で処理をする場合、処理主体が情報処理端末110となる。ここでは説明を簡便にするために、情報処理装置120を処理主体としたステップS504で処理をするケースについて記載する。ステップS1001で処理をする場合は、処理主体を情報処理端末110に読み替えればよい。
ステップS600では、情報処理装置120は、図3、図4で説明したように、ステップS501で監視カメラ130にて撮影された映像に基づいて、ハイアングル映像とローアングル映像とを生成する。ただし、撮影された映像自体がハイアングル映像、ローアングル映像であった場合には、このフローはなくとも良い。具体的には、ハイアングル映像は、搭乗者140を、挟んで天井側から床面に向かって撮影された映像である。また、ローアングル映像は、ハイアングル映像の撮影方向に相対する位置で、床側から天井側に向かって、ハイアングル映像を撮影するタイミングと同じタイミングで撮影された映像である。
ステップS601では、情報処理装置120は、映像に映り込んだ搭乗者140を検出し解析する。解析を通じて得られる(推定される)情報には、具体的には次のものが含まれ、解析結果は、図8(b)や図8(b´)にて管理される。
1.搭乗者140の推定年齢
2.搭乗者140の推定される性別(被写体の種別を推定する種別推定手段)
3.公共交通機関100内の搭乗者140同士の距離や位置関係
4.搭乗者140の他の被写体との対応関係(知人か他人か)の有無について
5.搭乗者が要注意人物(例えば、前科のある人間か否か)であるか
上記「1.」や「2.」の年齢や性別については、映像に映り込んだ搭乗者140を解析して推定する既存の技術が用いられる。また、「3.」については、搭乗者140同士の距離(位置関係)が分かれば良く、特段方法は限定しない。具体的な実現方法の一例としては、予め公共交通機関100内のどこかに基準となる座標の原点を定めておき、検出した被写体(搭乗者140)ごとのXY座標から距離や位置関係を詳らかにする方法が考えられる。「4.」については、映像や音声から様々な解析を行って、被写体同士の対応関係の有無を判定する。具体的な実現方法の一例として、以下のような判定方法が含まれる。
イ.会話が交わされているか否か(例えば、映像を解析し、一定時間以上、搭乗者140の顔が互いに向き合った状態で、口が開閉している状態や会話と思われる音声が識別できたら「対応関係あり」)
ロ.搭乗者140同士が手をつないでいる、腕を組んでいるか否か(そのような状態であれば、「対応関係あり」)
また、上記「5.」については、前科のある人間の映像を予めデータベース(例えば図8(d))で持っておき、そこに登録されている人物画像・映像との突き合せを行うことによって判定することができる。
ステップS602では、情報処理装置120は、ステップS601で要注意人物を検出(推定)したか否かの判定を行う。そして、検出したと判定された場合にはステップS602へ遷移する。一方、検出しなかったと判定された場合にはステップS603へ遷移する。
ステップS603では、情報処理装置120は、要注意人物として検出された搭乗者140に基づいて、搭乗者140の近傍周囲に図12(b)のような画質優先領域1103を設定する。画質優先領域1103は、図11(a)に示されるように、基本的には、被写体同士の距離に応じて(被写体同士が所定の距離…人物が歩を進めず手の届く範囲にいる場合に)、被写体の周囲近傍を「画質が優先する領域」として、設定されるものである。
しかし、このステップでは被写体同士の距離に関わらず画質優先領域1103を設定する処理を行っている。これは、要注意人物は、そうでない人物と比べて、問題を起こす可能性が高く、画質を上げて優先的に監視するべき被写体として扱うための処理である。
本実施例における、「画質優先領域1103」とは、映像の表示や記録の際に、領域の外周と比べて相対的に画質を優先させる領域である。具体的には、例えば、ハイビジョン画質で撮影した映像を、画質優先領域1103では維持し、その近傍周囲はスタンダード画質に落として表示・記録するといったケースが考えられる。つまり、画質優先領域1103だけ解像度を高い状態で記録することが、領域内の「画質を優先させる」ことになる。このほかにも、例えば、画質優先領域1103をそれ以外の領域よりも、色の諧調を高くする、圧縮率を低くするといった「画質を優先させる」方法も考えられる。
この「画質優先領域1103(画質が優先する領域)」を設定することは、裏を返せば、画質優先領域1103以外の領域は、画質よりもデータ容量を優先させた「データ量の軽減が優先する領域」になるともいえる。本実施例では画質優先領域1103を設定する旨の説明を中心に行っているが、この設定に対応して画質優先領域1103でない領域を「データ量の軽減が優先する領域」と設定する処理も、行なわれている。
また、画質優先領域1103の設定の仕方の一つの方法として、「要注意人物が映像に含まれる場合は、映像全体の画質を下げない」というやりかたも、考えられる。
ステップS604乃至608では、搭乗者140の組み合わせの数だけループ処理を行う。例えば、図11(a)のようにA,B,Cの3名の搭乗者がいた場合であれば、3通りの組合せが成立するので、3回ループすることになる。同様に、A,B,C,D,Eの5名の搭乗者140がいた場合は、10通りの組合せが成立するので、10回ループすることになる。ループ処理の結果は、図8の(c)や図8(c´)のようなデータテーブルにて管理される。また、ステップS604乃至ステップS607の判定は、図8(a)で管理されている条件に基づいて行われる。
ステップS604では、情報処理装置120は、搭乗者140の推定年齢が、それぞれ所定の年齢であるか否かを判定する。そして、それぞれの搭乗者140の推定年齢が、所定の年齢であると判定した場合には、ステップS605へ遷移する。一方、搭乗者140の推定年齢が、それぞれ所定の年齢ではない(少なくともいずれか一方の年齢が所定の年齢ではない)と判定した場合には、判定対象の搭乗者の組み合わせのループ処理を終了し、次の組合せのループ処理へ移る。例えば、図8(a)の条件に基づけば、搭乗者140の推定年齢が、男性なら10歳以上、女性なら10〜50歳の条件に両者が合致する場合に、ステップS605に遷移する。
ステップS605では、情報処理装置120は、搭乗者140同士の距離が所定内であるか否かを判定する。そして、搭乗者140同士の距離が所定内であると判定した場合には、ステップS606へ遷移する。一方、搭乗者140同士の距離が所定内ではないと判定した場合には、判定対象の搭乗者の組み合わせのループ処理を終了し、次の組合せのループ処理へ移る。例えば、本実施例では、図8(a)の条件から導かれる図7の画質優先領域1103の定義に基づけば、搭乗者140の肩を中心とした半径100cm(腕の長さ70cm+リーチ加算30cm)で描かれる円の中にもう一方の搭乗者がいるか否かで、判定される。なお、何を以て搭乗者140同士の距離が所定内であるかの判定基準については、上記の方法には限定されない。例えば、図14(b)のように、所定の固定値を予め定めておいてもよいし、搭乗者140同士の中心距離が画質優先エリア最大幅702−4の直径240cm以内か否か等で判定しても良い。
ステップS606では、情報処理装置120は、搭乗者140同士の組合せが所定の組合せであるか否かを判定する。そして、搭乗者140同士の組合せが所定の組合せであると判定した場合には、ステップS607へ遷移する。一方、搭乗者140同士の組合せが所定の組合せではないと判定した場合には、判定対象の搭乗者の組み合わせのループ処理を終了し、次の組合せのループ処理へ移る。ここで、何を以て所定の組合せとするかは、この発明を活用するシチュエーションに応じて、定めることができる。例えば、図8(a)の条件に従えば、搭乗者同士が、男性と女性の組合せである場合だけ、ステップS607に遷移する。また、図14のケースでは、自動車と自転車の組合せとしている。
ステップS607では、情報処理装置120は、搭乗者140同士が対応関係にある組合せであるか否かを判定する。そして、搭乗者140同士が対応関係にある組合せであると判定した場合には判定対象の搭乗者の組み合わせのループ処理を終了し、次の組合せのループ処理へ移る。何を以て「対応あり(搭乗者140同士が、知人である、関係性がある)」とするかは、この発明を活用するシチュエーションに応じて、定めることができる。例えば、図8(a)と図12(a)とに基づくならば、搭乗者140同士の間に、会話、手つなぎ、腕組などが映像や音声の解析から推定できなかった場合に、「対応関係なし」として、ステップS608へ遷移する。
ステップS608では、情報処理装置120は、搭乗者140同士の間の位置と向きに応じて、画質優先領域1103を設定する。領域の設定の仕方は、状況に応じて、様々な設定の仕方があってよい。例えば図11(a)では、図7で受け付けた図8(a)の条件に基づいて、左側の女性(♀(28))の右肩を中心とした円と、中央の男性(♂(25))の左肩中心とした円とがカバーする領域を、画質優先領域1103として設定している。
また、これの変形例として、撮影時のシチュエーションに応じて、さらに細かく条件を設けてもよい。例えば、図12(c)に示されるように、「つり革を持つ側の手であったら、そうでない場合よりも画質優先領域1103を小さく設定する」「電車の混雑度合いによって変える」といった具合である。このように設けることで、必要なタイミングで必要な領域の画質を確保しつつ、そうでない領域の画質をおさえてデータ容量をより効率的に低減できる仕組みを実現することができる。
以上、ステップS604乃至608では、搭乗者140の組み合わせの数だけループ処理が行われ、ループ処理の完了後、ステップS609に遷移する。
ステップS609では、情報処理装置120は、ローアングル画像を基に、サーモグラフィー風のローアングル映像(例えば図9(c)のような)を生成する。ただし、必ずしも「サーモグラフィー風」でなかればならないわけではない。生成されるローアングル映像は、「搭乗者140の挙動(特に手の動き)や身体のシルエットは識別しやすいが、衣類や肌の色や輪郭がハッキリとは分からりづらい」ものであればよく、その目的を果たせるものであれば、映像の種類や、生成方法は限定されない。例えば、輝度値を反転させた画像などであっても良い。つまり、所定のパターンに色相を変換した映像を生成することができればよいのである(色相変更映像生成手段)。
このようなローアングル映像の加工・生成が必要な理由は、2つある。
第1の理由は、犯罪行為を検証できる程度の挙動が識別でき点である。ローアングル映像は、犯罪行為が本当にあったかどうかを正しく検証するために、詳細に搭乗者140(特に容疑者)の身体(特に手など)のシルエットや挙動が、ある程度精彩に分かるものでなければならない。この点で、サーモグラフィー映像や、輝度値を反転さえた映像などが、好適と言える。
第2の理由は、プライバシーへの配慮である。上記の検証にあたって搭乗者140(特に被害者)の、スカートの中などの下着や肌感が、あまりハッキリと識別できるものであると、プライバシーを傷つける。そのため、この点においても、サーモグラフィー映像や、輝度値を反転さえた映像などが、好適と言える。
以上の点から、サーモグラフィー風の映像は、被害者のプライバシーに配慮しつつ、容疑者の犯罪の有無の検証を行うことのできる好適な映像である。無論、ローアングル画像をサーモグラフカメラ(サーモカメラ)で直接得ても良い。ただし、サーモカメラは可視光を撮影するカメラに比べ、かなり高価であるため、コスト的に考えても、可視光を撮影する安価なカメラで撮影した映像を、サーモグラフィー風の映像や、輝度を反転させた画像などに変換するほうが、好適であると言える。
また、サーモグラフィー風の映像を得るための方法は特段とわないが、比較的簡易に行うための方法として、以下のような方法が考えられる(いずれも既知の技術なので、詳細の説明は省く)。
1.色相環へのシグモイド関数の適用をし、サーモグラフィー風の色の変化を再現する
2・RGB映像をHSV色空間へ変換する演算処理を行う
以上のようなプロセスを経ることで、図9(b)ローアングル映像(例えばRGB映像)は、図9(c)ローアングル映像(サーモグラフィー風)に変換される。
ステップS610では、情報処理装置120は、ステップS609で生成した映像の左右方向を反転させた映像である、「反転映像(鏡映像、鏡画像)」を生成する。また、ハイアングル映像の反転映像も、生成する。(反転映像生成手段)
このような反転映像が必要なのは、ハイアングル映像とローアングル映像とが、カメラの撮影方向が被写体(搭乗者140)を挟んで正対している位置にあるためである。
例えば、図9(a)と図9(b)とは、「搭乗者A」「搭乗者B」「搭乗者C」のハイアングル映像とローアングル映像の一例を示した構成図である。図9に示される通り、図9(a)のハイアングル映像では3人の搭乗者は、左から「A、B、C」の並び順である。これに対し、図9(b)のローアングル映像では3人の搭乗者は、左から「C、B、A」と逆になっている。つまり、ハイアングル映像の一部分を指定して、そこに対応するローアングル映像をそのまま当てはめようと、あるいは、重ね合わせようしても、綺麗に重ねることができない。これを綺麗に重ね合わせて表示するために、左右を反転させた映像が必要となるのである。そして、このようなプロセスを経ることで、図9(c)のようなローアングル映像(サーモグラフィー風)から、図9(d)のような反転ローアングル映像(サーモグラフィー風)を得ることができる。このように、図9(a)と図9(d)とを組みあわせることで、図11の(b)のような映像を生成することができる。
同じように、図9(c)をメインの画像として、その一部にハイアングル画像を重ねた映像を生成する場合には、図9(a)を左右反転させたハイアングル画像を用いればよい。
ステップS611では、情報処理装置120は、情報処理端末110の表示部210で図11に示されるような画面表示を行うために必要となる情報である表示情報を生成する。
つまり、被写体(搭乗者140)同士の距離(あるいは距離と組合せ)に応じ、画質が優先する領域(画質優先領域1103)とデータ量の軽減が優先する領域(画質優先領域1103以外の領域)とのうちいずれか一方または両方を含む表示情報(第2の映像)を生成する(第2の映像生成手段)ことができる。
また、同じ被写体を挟んだ2点のアングルの映像(ハイ・ローアングル映像)に基づいて、ハイアングル映像の一部に切換表示領域1104を設け、対応するローアングル映像の一部と合わせて、切替え可能に表示できる表示映像を生成する(表示映像生成手段)。
なお、このステップに至るまでのプロセスで、必要な情報が揃っている場合には、表示画面を生成する処理や、ステップS505で送信する情報を準備する処理であっても良い。図11に示される表示画面は、ハイアングル映像と反転ローアングル映像とを組み合わせて構成されるか、ローアングル映像と反転ハイアングル映像とを組み合わせて構成される。また、特にローアングル映像は、サーモグラフ調に見える処理が施されたものが用いられる。
また、このステップで、生成する「表示情報」には、少なくとも2つのパターンが考えられる。1つ目は、情報処理端末110の表示部210で表示するための表示画面をこのステップで生成し、これをステップ505で「表示情報」として情報処理端末110に送信し、表示部210で表示させる方法である。2つ目は、情報処理端末110の表示部210で表示するための表示画面は、情報処理端末110で生成させるよう設けておき、このステップでは表示画面を生成するために必要な情報を生成(あるいは準備)するに留め、これらの取りまとめた情報を、「表示情報」として、ステップ505で情報処理端末110に送信する方法である。
前者のメリットは、情報処理端末110に表示画面を生成するための情報処理の負担をかけないことと、送信するデータ量を抑えられることである。
後者のメリットは、情報処理装置120に表示画面を生成するための情報処理の負担をかけないことと、情報処理端末110でユーザの希望する画面構成の指示を受付けて、その指示に対応した表示画面を生成できることである。
ステップS612では、情報処理装置120は、表示映像に付加するための様々な付加情報を対応させる(このステップはステップS611に含めてしまってもよい)。
付加情報の一例としては、図8(b)に示されるような、搭乗者140の推定年齢、推定性別、位置、対応関係のほか、図8(d)に対応する人物であるか否か、といった情報が含まれる。また、図8(a)及び図8(c)に示されるような、どんな条件に従って、どの搭乗者の組合せで、どの程度の画質優先領域1103や切換表示領域1104を設定すればよいか、といった情報も含まれる。表示情報と付加情報とは、別個の情報として取り扱っても良い。また、付加情報を「表示情報」の一部として、「表示情報」の概念の中に含めてしまっても良い。
図7は、表示映像の生成にあたり、どのような条件で画質優先領域1103や切換表示領域1104を設定するかを、ユーザから受付けるための画面の一例を示した構成図である。また、図7の画面は、情報処理端末110の表示部210で表示される(情報処理装置120の表示部210でもよい)。
画質優先対象推定年齢受付ボックス701は、画質優先領域1103や切換表示領域1104を設定する搭乗者140の推定年齢に関する条件を、ユーザから受付けるための領域である。このように設けることで、ユーザが被害者となる可能性があるとは考えづらい搭乗者140(例えば乳幼児など)を除外でき、映像処理の軽減や、映像データの容量軽減に貢献できる。対象年齢の設定については、図7にある通り、より細かく処理条件が設定できるよう、性別ごとに入力を受付けられるよう設けておいてもよい。
画質優先領域イラスト702は、搭乗者140に対応する画質優先領域1103や切換表示領域1104を識別可能に表示するオブジェクトである。画質優先領域イラスト702に関する高解像度の領域は、702−1乃至3で受け付ける各パラメータに基づいて決定される。
身長(リーチ)受付ボックス702−1は、搭乗者140の腕の長さ(≒身長)を受け付けるボックスである。図7では、日本人成人男性の平均身長171cmに9cmを加えた、180cmを基準として定めているが、任意に定められる。
腕の長さ受付ボックス702−2は、搭乗者140の肩から指先までの長さを受け付けるボックスである。図7では、一例として70cmを基準として定めている。
リーチ加算受付ボックス702−3は、腕の長さにプラスしてどこまでを「手の届く距離」とするかをユーザから受け付けるためのボックスである。一般的には腕の長さに30cmプラスした程度の距離が動かず自然に手が届く範囲であるので、そのように設定している。
画質優先エリア最大幅702−4は、搭乗者140を基準に、その近傍周囲に高解像度領域を設定した際の、最大幅である。本実施例では、「リーチ180cm+リーチ加算30cm×2=240cm」と計算している。
画質優先領域1103は、搭乗者140を基準に、その近傍周囲に設定される他の領域よりも解像度の高い領域である。具体的には例えば、元の映像がハイビジョンであった場合に、この点線の中はハイビジョン画質で、外はスタンダード画質の映像とする、といった具合である。このように、所定の範囲(搭乗者の手の届く範囲=事案の発生する範囲)だけを高画質で、それ以外の領域の画質を低減することで、必要な場所の画質が確保されつつ、全体の情報量を抑えた映像を、残しておくことができる。
図7の画質優先領域1103は、要注意人物が検出された際に設定される領域が表示されており、搭乗者140の両肩を中心として描かれる半径100cmの2つの円に含まれる領域が画質優先領域1103として設定されている。一方、図11では、搭乗者140同士の組合せと距離とで画質優先領域1103が決定されており、搭乗者140同士の互いに近い側の肩を中心として描かれる2つの2つの円に含まれる領域が画質優先領域1103として設定されている。
この実施例では、この円の半径100cmは、腕の長さ70cm+リーチ加算30cmで計算しているが、どのように定めるかは、上記実施例にかかわらず様々な計算方法があってよい。しかし、犯罪の有無の検証を行うという目的の都合上、好適には、成人男性の腕の長さ+α程度は搭乗者140の近傍周囲が解像度の高い状態で記録・表示されることが望ましい。上記の計算は、これを踏まえて行った一例であり、100cmは、腕を伸ばせば足を動かさずに手の届くリーチ(=画質優先領域)として想定しやすい距離であると言える。
画質優先組合せ受付ボックス703は、画質優先領域1103や切換表示領域1104を設定する搭乗者140同士の組合せに関する条件を、ユーザから受付けるための領域である。
統計的な電車内のトラブルの組合せを見てみると、九割九分以上が、男性と女性に偏っている。そのため、公共交通機関内に限定するならば、高解像度の組合せは異性の組合せのみに絞り込んでおくことが効率的であるように思われる。しかしながら、どのような組み合わせが条件として好適であるかは、用途や時代の変化、シチュエーション等によって異なる場合もあり得る。そのため、ユーザが任意の組みあわせを指定できるよう設けている。例えば、「暴力の絡む電車内トラブルは、特定年齢の男性の組合せが多い」といった傾向があったとしたならば、男性同士の組合せを条件に入れる、といった具合である。
スキップ対応関係受付ボックス704は、画質優先領域1103や切換表示領域1104を設定しない(スキップする)搭乗者140同士の組合せに関する条件を、ユーザから受付けるための領域である。具体的な一例を挙げると、図12(a)に示されるような、ずっと手をつないでいる、搭乗者140同士が向きあって会話を交わしているなど映像解析で、搭乗者140同士が知人やカップルであると推定されるようなケースである。
このような組み合わせの場合には、犯罪が成立する可能性は、まずほとんどないと考えられるので、画質優先領域1103や切換表示領域1104を設定しないように設定できるように設けておくことで、データ容量の軽減を図ることができる。
また、図12(c)に示されるように、「つり革を持つ側の手だけ、画質優先領域1103を小さく設定する」といったような、制御を行う選択肢があっても良い。
特別画質優先条件受付ボックス705は、諸条件に関係なく、特定の条件で搭乗者140の近傍周囲に画質優先領域1103や切換表示領域1104を設定するための条件の指定をユーザから受付けるためのボックスである。具体的な一例としては、過去に前科のある人物の映像情報をデータベースに予めっ登録しておき、そのような搭乗者140が認められた場合に、設定するような構成とすればよい。このような条件に基づいて、例えば、図12(b)のような形で、画質優先領域1103が設けられる。
送信ボタン706は、図7の画面でユーザから受付けた様々な条件を、表示映像を生成するハードウエア(情報処理端末110や情報処理装置120)に送信するためのボタンである。
切換表示領域自動設定受付ボックス707は、切換表示領域1104を自動設定するか否かの指示をユーザから受付けるチェックボックスである。
図8は、情報処理装置120で管理されるデータテーブルの一例を示した構成図である。表示映像を生成するハードウエアが情報処理端末110である場合には、情報処理端末110でも用いられる。
図8(a)は、表示映像の生成に関する諸条件を管理するデータテーブルの一例を示した構成図である。801では、画質優先対象推定年齢受付ボックス701で受付けた条件を管理する。
802−1では、身長(リーチ)受付ボックス702−1で受けつけた値を管理する。
802−2では、腕の長さ受付ボックス702−2で受けつけた値を管理する。
802−3では、リーチ加算受付ボックス702−3で受けつけた値を管理する。
802−4では、画質優先エリア最大幅の値を管理する。
803では、画質優先組合せ受付ボックス703で受付けた条件を管理する。
804では、スキップ対応関係受付ボックス704で受付けた条件を管理する。
805では、特別画質優先条件受付ボックス705で受付けた条件を管理する。
807では、切換表示領域自動設定受付ボックス707で受付けた条件を管理する。
図8(a)で管理される条件は、図7の画面と対応するものであり、図7および図8(a)で一例として挙げた条件以外にも、様々な条件を設定することができる。
図8(b)はステップS601にて映像から抽出された情報を管理するデータテーブルの一例を示した構成図である。図8(b)においては、811では搭乗者140を、812では推定年齢を、813では推定性別を、814では推定位置を、815では映像から推定される他の搭乗者との対応関係の有無の結果を、それぞれ管理している。図8(b)で管理される内容は、S601の映像解析の結果と対応するものであり、図8(b)で一例として挙げた解析結果以外にも、様々な映像解析を実施し、その結果を管理することができる(「例えば要注意人物」である、と推定されたなど)。図8(b´)は、図12(a)のような、画質優先領域1103や切換表示領域1104を設定するべき条件の距離と組合せではあるが、関係性のある搭乗者140(人物DとE)を加えた場合の一例を示している。図に示されるような「D×E」といった形で対応関係が示されている。
図8(c)は、ステップS604乃至608の搭乗者140同士の組合せのうち、どの組合せを基準にして画質優先領域1103や切換表示領域1104を設定するかをの条件を管理するデータテーブルの一例である。このデータテーブルの行と列は、搭乗者140の人数と対象年齢とに基づいて組合せ数が決定される。一番上と左側は搭乗者140をあらわしており、図8(b)で管理されている条件に基づいて、解像度を高く設定するべき組合せのますに「○」印がついている。図8(c´)は、図8(b´)のシチュエーションにおける組合せ表の一例を示している。この組合せ表では、人物DとEは対応関係にあるので「対」と記されて管理され、所定の距離、組合せであっても、画質優先領域1103を設けない制御がなされるよう、設けられている。
図8(d)は、要注意人物のリストである。人物名とその映像データとが紐づけられており、映像解析の際に、このリストに該当する人物がいるか否かの判定がなされる。映像は、映像の解析ができるものであれば良く、ファイル形式は特に問わない。映像の中に、このリストに対応する人物が識別された場合には、図12(b)に示されるように、搭乗者同士の距離と組合せに関わらず、画質優先領域1103が設定される。
図9は、監視カメラ130から得られた映像の一例と、その映像を基に生成された映像の一例とを示した構成図である。
図9(a)は、ハイアングル映像の一例を示した構成図である。図9(a)には、「イ」「ロ」「ハ」3名の搭乗者140が搭乗している。図9(b)は、図9(a)のシチュエーションにおけるローアングル映像の一例を示した構成図である。図9(a)と図9(b)とは搭乗者140を挟んで互いに向かい合わせになるカメラアングルの映像であるが、監視カメラ130から得られた実画像であっても良いし、図3で説明したように、複数の監視カメラの映像を合成した映像であっても良い。
図9(c)は、図9(b)のローアングル映像を、サーモグラフィー風に加工した映像ある。ローアングルカメラ132がサーモカメラであった場合には、撮影画像を用いても良い。おなじように、図9(a)のようなハイアングル映像も、サーモグラフィー風に加工した映像を生成することができる(不図示)。
図9(d)は、図9(c)を左右反転させた画像(反転ローアングル画像)の一例を示した構成図である。反転画像は、図13(c)に示されるように、サーモグラフィー風にしなくとも、生成することができる。
図10は、ステップS507の表示処理に関するサブフローの一例を示した構成図である。
ステップS1001では、情報処理端末110は、ステップS506で受信した「映像表示のための情報(表示情報と付加情報)」に基づいて映像の処理を行い、表示部210で表示するための表示画面を生成する。この場合には、ステップS611の処理が表示画面の生成となる。
また、ステップS504で既に表示画面の生成が済んでいて、ステップS506で受信した「映像表示のための情報(表示情報と付加情報)」が表示画面であった場合には、このステップは飛ばしても良い。
ステップS1002では、情報処理端末110は、ステップS504またはステップS1001で生成された表示映像を、表示部210に表示する。この際、対応付けられている付加情報も、共に表示する。
ステップS1003では、情報処理端末110は、切換表示領域1104が自動設定であるか否かの判定を行う。そして、自動設定である場合には、ステップS1004に遷移する。一方、自動設定ではない場合には、ステップS1005に遷移する。
ステップS1004では、情報処理端末110は、画質優先領域1103と重なる位置に切換表示領域1104を設定する。
ステップS1005では、情報処理端末110は、表示部210を介してユーザから切換表示領域1104の指定を、受付ける。(所定の領域(切換表示領域1104)をユーザより受付ける範囲受付手段)
ステップS1006では、情報処理端末110は、ステップS1005で切換領域の指定を、受付けたか否かの判定を行う。そして、受付けたと判定した場合には、ステップS1007に遷移する。一方、受付けていないと判定した場合には、ステップS1008に遷移する。
ステップS1007では、情報処理端末110は、ステップS1005にてユーザから受付けた指示に基づいて切換表示領域1104を設定するとともに、ユーザがその範囲を識別できるよう、映像に重ね合わせて表示部210に表示する。
ステップS1008では、情報処理端末110は、切換表示領域1104におけるハイアングル画像と反転ローアングル画像(サーモグラフ風)との切換え指示を、ユーザから受付ける(ローアングル映像と、反転ハイアングル映像であってもよい)。
ステップS1009では、情報処理端末110は、ステップS1008でユーザから切換表示領域1104の切換え指示を受付けたか否かの判定を行う。そして、切換え指示を受付けたと判定した場合には、ステップS1010に遷移する。一方、切換え指示を受付けていないと判定した場合には、ステップS1011遷移する。
ステップS1010では、情報処理端末110は、ステップS1008のユーザの指示に従って、切換表示領域1104のハイアングル映像とローアングル映像との切り替え処理を行う。切り替え画像のうちいずれか一方は、反転画像である。また、ローアングル映像は、サーモグラフィー風の処理が施された映像である。
ステップS1011では、情報処理端末110は、ユーザから本フローを終了させる旨の指示を、受付ける。
ステップS1012では、情報処理端末110は、ステップS1010で指示を受付けたか否かの判定を行う。そして、指示を受付けたと判定した場合には、本フローを終了する。一方、指示を受付けていないと判定した場合には、ステップS1001に遷移する。
図11は、情報処理端末110の表示部210に表示する、表示映像の一例を示した構成図である。
映像表示領域1101は、ハイアングル映像やローアングル映像を含む映像を表示する領域である。
切替えタグ1102は、映像表示領域1101に表示するのメインの映像を、ハイアングル映像とローアングル映像の、いずれにするかをユーザの選択を受付けて切替えるタグである。図9(a)では、ハイアングル画像がメインの画像(メイン画像)として表示されている。
画質優先領域1103は、図7の表示画面を通じてユーザから受付けた諸条件に従って、他の領域よりも画質を優先させた映像が表示あるいは記録される領域である。この領域の境界は、図に示されるように、領域の境界を線で囲うなどしておくことが好ましい。そうすることで、ユーザが「画質を優先する領域」と「データ量を軽減した領域」とを識別可能に表示することができるからである。このような識別可能な表示の考え方は、後述の切換表示領域1104についても同様である。
切換表示領域1104は、ユーザからの切換え指示を受付けると、領域内の対応するハイアングル映像と、ローアングル映像とを切替える領域である。切替えられる映像の一方は、左右の反転した映像(反転映像)である。
ここで、画質優先領域1103と切換表示領域1104とについて説明する。図11では、図11の(b)と(c)に示されるように、両者のうち切換表示領域1104がドラッグ操作(スワイプ操作)にて移動できるように設けられている。ただし、このような動作を実現させるためには、表示情報に、ハイアングル映像とローアングル映像の両方を持っていなければならず、その分データ量は増える。そのかわり、切換表示領域1104をユーザが任意に拡大・縮小したり、移動させたりすることができる。反対に、切換表示領域1104を画質優先領域1103と共に、固定で設定してしまえば、データ量は押さえることができる。これは、切換表示領域1104に対応する図11(a)のハイアングル映像と、図11(b)の切換表示領域1104に表示するための反転ローアングル映像(サーモグラフィー風)の部分的な映像とに用いて、表示画像を生成すればよいからである。
また、ハイ・ロー両方のアングルの高解像度の画像を準備・保存できるような環境であれば、画質優先領域1103がユーザの動くように設けられていても良い。そして、画質優先領域1103と切換表示領域1104とが常に一体のものとして動かせるように設けられていてもよい。
マウスカーソル/ユーザの指1105は、表示部210の映像表示領域1101でクリック操作(タッチ操作)、ドラッグ操作(スワイプ操作)等の動き通じて様々な指示をするためのものである。
切換表示領域設定ボタン1106は、切換表示領域1104を任意に設定するモードに切替える指示を、ユーザから受付けるためのボタンである。このボタンの選択を受付けてから映像表示領域1101の中の範囲指定を受付ける(切換表示領域1104をユーザより受け付ける範囲受付手段)と、受付けた範囲に基づいて切換表示領域1104が設定される。
再生状況表示バー1107は、映像表示領域1101で表示される映像の再生・停止・送りの指示をユーザから受付けるためのオブジェクトである。
搭乗者情報1108は、ステップS601の解析で得られた搭乗者140に関する情報を表示するオブジェクトである。ステップS612にて、付加情報として映像に対応付けられるこの情報は図8(a)で管理されているものである。
図12は、映像内の搭乗者140と、画質の設定についての関連の一例を示した構成図である。
図12(a)は、ステップS601の映像の解析で、搭乗者140同士に対応関係があると識別された搭乗者140の様子の一例を示した構成図である。図12(a)のように、搭乗者同士が手をつないだり、顔を向き合って会話を交わしていたりすることが映像解析から明らかになった場合は、知人である、つまり事案・犯罪が起きる可能性は高くない(無視してよい)と判断できる。このため、搭乗者140同士の距離やの組合せにかかわらず、画質優先領域1103に設定しない組合せとして扱うことができる。
図12(b)は、ステップS601の映像の解析で、要注意人物として抽出された搭乗者140の近傍周囲を、画質優先領域1103として設定した一例を示した構成図である。
本願発明の情報処理装置120や情報処理端末110は、映像に映り込んだこのような被写体(搭乗者140)のうち、特定の被写体(要注意人物)を識別することができる(特定被写体識別手段)。
このような人物は、そうでない搭乗者140と比較して問題を起こす可能性があると考えられる。したがって、このような搭乗者140の場合には、搭乗者140同士の距離に関わらず近傍周囲に画質優先領域1103を設定することが好適と言える。
図12(c)は、搭乗者140がつり革をつかんでいるシーンの一例を示した構成図である。本願発明の情報処理装置120や情報処理端末110は、映像に映り込んだこのような被写体(搭乗者140)の所作のうち、特定の被写体の所作を識別することができるよう設けられている(特定所作識別手段)。
つり革につかまっている間は手が塞がる。このため、つり革をつかんでいる間は、手・腕の周囲は、犯罪の発生する可能性は極めて低いと考えることができる。そこで、つり革をつかんでいる側の周囲の画質優先領域1103は、データ容量の節約のために、小さく設定するのである。これを応用して、例えば本や携帯通信機器を手にしているような場合でも、同様の処理を行っても良い。
以上が、公共交通機関100を想定した本願発明の実施例であるが、画像解析と組み合わせて、画質優先領域1103の設定条件は、他にも様々に設けられるようにしておいてもよい。例えば、特定の時間帯(例えば平日の通院時間帯)や所定以上の乗車率(例えば花火大会後など)の際には、画質優先領域1103を全領域に拡大する、といった設定が考えられる。また、座席シートのような事案の発生しづらい・ローアングル画像が撮影できないような特定の場所は、画質優先領域1103から外すといったことも考えられる。反対に、ドア横などの事案の発生しやすい特定の場所は、ピンポイントで画質優先領域1103にする、といった設定も好適である。
図13は、図11の変形応用例の一例を示した構成図である。
図13(a)は、投球の瞬間の投手の様子を、前方から撮影した映像(前方映像)の一例であり、図13(b)は、同じシーンを後方から撮影した映像(後方映像)の一例である。
図13(c)は、図13(b)から生成した左右を反転させた映像(反転後方映像)である。
図13(d)は、図11(a)のように、図13(a)と図13(c)とに基づいて生成した表示画像である。図13(a)では、右手が頭で隠れてしまって見えない。そこで、その周囲を切換表示領域1104とし、その領域に対応する図13(c)の映像が重ねあわされて(あるいは入れ替えられて)表示されている。
このように表示したことで、頭の後ろに隠れてしまった後方の手の様子を、前方から撮った映像に重ね合わせて確認できるようになっている。
上記に挙げたように、本実施例で取り上げた一方の画像の一部の領域に対応させて、もう一方の反転映像・画像を重ね合わせる表示映像を生成する方法は、ハイアングルとローアングルの組合せに限らず応用することが可能である。つまり、前後、上下、左右いずれの方向であっても、被写体を挟んで向かい合わせとなる映像であれば、適用することができる。
1301は、切替えタグ1102と同じ役割を果たすタグで、前方映像がメイン映像である表示画面と、後方映像がメイン映像である場合の表示画面とを切り替えることができる。
図14は、図11の変形応用例の一例を示した構成図である。
自動車1401は、車道を走る自動車である。
自転車1402は、車道を走る自転車である。
距離条件1403は、画質優先領域1103を設定するための、被写体同士の距離に関する条件である。
図14(a)は、自動車A,自動車B、自転車A,自転車Bが、並走しているシーンを監視カメラが上方から撮影した映像である。このシーンにおいて、画質優先領域1103を設定する条件は下記の2つである。
被写体の組合せの条件:自動車と自転車の組合せである
被写体の距離の条件 :互いの距離が距離条件1403のX未満(図14(b))
このような条件は、自動車同士よりも、自動車と自転車の接触によるトラフィックアクシデントが起こりやすく、被害も大きいため、そのようなシーンを特に優先して撮影する必要があることから、設定されたものである。
図14(a)では、上記を満たす組合せは、自動車Bと自転車Aの組合せであり、両者の間に、画質優先領域1103(面π。図14(c)参照)が設けられている。なお、図14(a)では、画質優先領域1103は、被写体同士の中間地点と、自転車の中心部分とに基づいて、設定される。
このように、被写体同士の組合せと互いの距離とで、所定の領域の解像度(画質)を制御するアイディアは、図11のようなシーンだけでなく図14のシーンのように、様々な応用が可能である。
以上説明したように、本発明は、同じ被写体を異なる視点で撮影した2つの映像を、被写体の対応関係が分かりやすく表示するための仕組みを提供することができる。
また、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記憶した記録媒体は本発明を構成することになる。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク、ソリッドステートドライブ等を用いることができる。
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。