WO2021131024A1

WO2021131024A1 - 処理装置、処理方法及びプログラム

Info

Publication number: WO2021131024A1
Application number: PCT/JP2019/051452
Authority: WO
Inventors: 大輝山崎; 龍司若草
Original assignee: 日本電気株式会社
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2021-07-01
Also published as: US11869244B2; JPWO2021131024A1; US20220358766A1; US20240087326A1; JP7355120B2

Abstract

本発明は、通報装置が操作されたことを検出する検出部（１１）と、通報装置が操作されたことが検出されると、カメラが生成した画像、及び、マイクが集音した音声の少なくとも一方を取得する取得部（１２）と、画像及び音声の少なくとも一方が通報条件を満たすか判断する判断部（１３）と、通報条件を満たすと判断された場合、通報装置が操作された旨を示す通報情報を出力する出力部（１４）と、を有する処理装置（１０）を提供する。

Description

処理装置、処理方法及びプログラム

　本発明は、処理装置、処理方法及びプログラムに関する。

　ボタンを押下されるとその旨を警察に通報する通報装置が路上や街頭等に設置される場合がある。

　特許文献１は、事件、事故などの緊急事態が発生したときに、通報者が押すことによって、インターフォンで警察と通話ができる自立型の防犯灯を開示している。また、特許文献１は、いたずらや誤操作によって通報装置が押下されることを防止するために、防犯灯の近辺にいる人に音声のメッセージを発信することを開示している。

特開２００７－７２５４１号

　特許文献１に開示の技術は、音声でいたずらや誤操作に関する警告を行うだけである。いたずらや誤操作で通報装置が押下された場合には、警察との通話処理が行われてしまう。いたずらや誤操作による通報への対応は、対応者（警察）にとって大きな負担となる。

　本発明は、いたずらや誤操作による通報の頻度を軽減することを課題とする。

　本発明によれば、
　通報装置が操作されたことを検出する検出手段と、
　前記通報装置が操作されたことが検出されると、カメラが生成した画像、及び、マイクが集音した音声の少なくとも一方を取得する取得手段と、
　前記画像及び前記音声の少なくとも一方が通報条件を満たすか判断する判断手段と、
　前記通報条件を満たすと判断された場合、前記通報装置が操作された旨を示す通報情報を出力する出力手段と、
を有する処理装置が提供される。

　また、本発明によれば、
　コンピュータが、
　　通報装置が操作されたことを検出し、
　　前記通報装置が操作されたことが検出されると、カメラが生成した画像、及び、マイクが集音した音声の少なくとも一方を取得し、
　　前記画像及び前記音声の少なくとも一方が通報条件を満たすか判断し、
　　前記通報条件を満たすと判断された場合、前記通報装置が操作された旨を示す通報情報を出力する処理方法が提供される。

　また、本発明によれば、
　コンピュータを、
　　通報装置が操作されたことを検出する検出手段、
　　前記通報装置が操作されたことが検出されると、カメラが生成した画像、及び、マイクが集音した音声の少なくとも一方を取得する取得手段、
　　前記画像及び前記音声の少なくとも一方が通報条件を満たすか判断する判断手段、
　　前記通報条件を満たすと判断された場合、前記通報装置が操作された旨を示す通報情報を出力する出力手段、
として機能させるプログラムが提供される。

　本発明によれば、いたずらや誤操作による通報の頻度が軽減される。

　上述した目的、および、その他の目的、特徴および利点は、以下に述べる好適な実施の形態、および、それに付随する以下の図面によって、さらに明らかになる。

本実施形態の処理装置の概要を説明するための図である。本実施形態の処理装置のハードウエア構成の一例を示す図である。本実施形態の処理装置の機能ブロック図の一例である。本実施形態の処理装置の処理の流れの一例を示すフローチャートである。本実施形態の処理装置の処理の流れの一例を示すフローチャートである。本実施形態の処理装置の処理の流れの一例を示すフローチャートである。本実施形態の処理装置の処理の流れの一例を示すフローチャートである。本実施形態の処理装置の処理の流れの一例を示すフローチャートである。本実施形態の処理装置の処理の流れの一例を示すフローチャートである。

＜第１の実施形態＞
　まず、図１を用いて本実施形態の処理装置１０の概要を説明する。図示するように、路上、街頭、公共施設等の任意の位置に通報装置１が設置される。そして、通報装置１の周辺にカメラ及びマイクの少なくとも一方を備えるデータ収集装置２が設置される。カメラは、通報装置１の周辺を撮影するように設置される。マイクは、通報装置１の周辺の音声を集音するように設置される。通報装置１と処理装置１０とは、有線及び／又は無線で互いに通信可能に接続される。また、データ収集装置２と処理装置１０とは、有線及び／又は無線で互いに通信可能に接続される。

　処理装置１０は、通報装置１からの信号に基づき通報装置１が操作されたことを検出すると、データ収集装置２が生成したデータ（画像データ及び音声データの少なくとも一方）が所定の通報条件を満たすか判断する。そして、処理装置１０は、通報条件を満たすと判断した場合、通報装置１が操作された旨を示す通報情報を通報先装置３に送信する。通報先装置３と処理装置１０とは、有線及び／又は無線で互いに通信可能に接続される。通報先装置３は、例えば警察の装置であってもよいし、警備会社の装置であってもよいし、その他の者が管理する装置であってもよい。

　このように、処理装置１０は、通報装置１が操作された場合、データ収集装置２が生成したデータに基づき通報の要否、すなわちいたずらや誤操作でないか等を判断し、通報が必要と判断した場合に通報を行うことができる。このような処理装置１０によれば、いたずらや誤操作による通報の頻度が軽減される。

　次に、処理装置１０の構成を詳細に説明する。まず、処理装置１０のハードウエア構成の一例を説明する。

　処理装置１０の各機能部は、任意のコンピュータのＣＰＵ（Central Processing Unit）、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット（あらかじめ装置を出荷する段階から格納されているプログラムのほか、ＣＤ（Compact Disc）等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納できる）、ネットワーク接続用インターフェイスを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。

　図２は、処理装置１０のハードウエア構成を例示するブロック図である。図２に示すように、処理装置１０は、プロセッサ１Ａ、メモリ２Ａ、入出力インターフェイス３Ａ、周辺回路４Ａ、バス５Ａを有する。周辺回路４Ａには、様々なモジュールが含まれる。処理装置１０は周辺回路４Ａを有さなくてもよい。なお、処理装置１０は物理的及び／又は論理的に分かれた複数の装置で構成されてもよいし、物理的及び／又は論理的に一体となった１つの装置で構成されてもよい。処理装置１０が物理的及び／又は論理的に分かれた複数の装置で構成される場合、複数の装置各々が上記ハードウエア構成を備えることができる。

　バス５Ａは、プロセッサ１Ａ、メモリ２Ａ、周辺回路４Ａ及び入出力インターフェイス３Ａが相互にデータを送受信するためのデータ伝送路である。プロセッサ１Ａは、例えばＣＰＵ、ＧＰＵ（Graphics Processing Unit）などの演算処理装置である。メモリ２Ａは、例えばＲＡＭ（Random Access Memory）やＲＯＭ（Read Only Memory）などのメモリである。入出力インターフェイス３Ａは、入力装置、外部装置、外部サーバ、外部センサー、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。入力装置は、例えばキーボード、マウス、マイク、物理ボタン、タッチパネル等である。出力装置は、例えばディスプレイ、スピーカ、プリンター、メーラ等である。プロセッサ１Ａは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。

　図３に、処理装置１０の機能ブロック図の一例を示す。図示するように、処理装置１０は、検出部１１と、取得部１２と、判断部１３と、出力部１４とを有する。

　検出部１１は、通報装置１が操作されたことを検出する。通報装置１は、路上、街頭、公共施設等の任意の位置に設置される。緊急時に通報装置１を操作すると、その旨が警察等に通報される。例えば、通報装置１はボタンを備えてもよい。そして、緊急時に行う操作は、当該ボタンの押下であってもよい。その他、通報装置１はタッチパネル、マウス、キーボード等のその他の入力装置を備えてもよい。そして、緊急時に行う操作は、これらの入力装置を介した所定の入力操作であってもよい。しかし、緊急時に行われる操作は、ボタンの押下のように、シンプルで容易なものが好ましい。

　通報装置１は、所定の操作（例：ボタンの押下等）を受け付けると、その旨を処理装置１０に送信する。検出部１１は、通報装置１から受信した信号に基づき、通報装置１が操作されたことを検出する。

　なお、通報装置１と処理装置１０とは多対１の関係であってもよいし、１対１の関係であってもよい。

　取得部１２は、通報装置１が操作されたことが検出されると、データ収集装置２が生成したデータを取得する。データ収集装置２は、カメラ及びマイクの少なくとも一方を備える。このようなデータ収集装置２が生成したデータは、画像及び音声の少なくとも一方を含む。

　カメラは、通報装置１の周辺を撮影するように設置される。例えば、カメラは、通報装置１を操作する人、通報装置１を操作する人の周辺にいる人等を撮影できるような位置及び向きで設置される。マイクは、通報装置１の周辺の音声を集音するように設置される。例えば、マイクは、通報装置１を操作する人の発言内容や、通報装置１を操作する人の周辺にいる人の発言内容や、これらの人の行動等により生じた音声等を集音できる位置及び向きで設置される。

　データ収集装置２が生成したデータは、データ収集装置２内の記憶装置、処理装置１０内の記憶装置、及び、データ収集装置２と通信可能に構成されたその他の装置内の記憶装置の中の少なくとも１つに蓄積されていく。そして、取得部１２は、通報装置１が操作されたことが検出されると、上述のように蓄積されているデータの中から所定の一部のデータを取得する。

　例えば、取得部１２は、通報装置１が操作された操作タイミングより前の開始タイミングから、操作タイミングより後の終了タイミングまでの間にデータ収集装置２が生成したデータを取得する。すなわち、取得部１２は、操作タイミングの前後のデータを取得する。開始タイミングは、操作タイミングよりもｔ１秒前である。終了タイミングは、操作タイミングよりもｔ２秒後である。なお、ｔ１とｔ２は同じ値であってもよいし、異なる値であってもよい。

　その他、取得部１２は、通報装置１が操作された操作タイミングから、操作タイミングより後の終了タイミングまでの間にデータ収集装置２が生成したデータを取得してもよい。すなわち、取得部１２は、操作タイミングより後のデータを取得してもよい。終了タイミングは、操作タイミングよりもｔ２秒後である。

　その他、取得部１２は、通報装置１が操作された操作タイミングより前の開始タイミングから、操作タイミングまでの間にデータ収集装置２が生成したデータを取得してもよい。すなわち、取得部１２は、操作タイミングより前のデータを取得してもよい。開始タイミングは、操作タイミングよりもｔ１秒前である。

　なお、本明細書において、「取得」とは、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置が他の装置や記憶媒体に格納されているデータを取りに行くこと（能動的な取得）」、たとえば、他の装置にリクエストまたは問い合わせして受信すること、他の装置や記憶媒体にアクセスして読み出すこと等を含んでもよい。また、「取得」とは、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置に他の装置から出力されるデータを入力すること（受動的な取得）」、たとえば、配信（または、送信、プッシュ通知等）されるデータを受信すること等を含んでもよい。また、「取得」とは、受信したデータまたは情報の中から選択して取得すること、及び、「データを編集（テキスト化、データの並び替え、一部データの抽出、ファイル形式の変更等）などして新たなデータを生成し、当該新たなデータを取得すること」を含んでもよい。

　判断部１３は、取得部１２が取得したデータ（画像及び音声の少なくとも一方）が通報条件を満たすか判断する。

　最初に、画像に基づき通報条件を満たすか判断する処理の一例を説明する。まず、判断部１３は、取得部１２が取得した画像の中から通報装置１を操作した人物及び通報装置１を操作した人物の周辺にいる人物の少なくとも一方を、解析対象として抽出する。例えば、判断部１３は、通報装置１が操作されたタイミングで通報装置１と接触した人物（手で触れた人物等）を、通報装置１を操作した人物として抽出してもよい。そして、判断部１３は、「通報装置１を操作した人物から所定の距離以内にいる人物」、「通報装置１から所定の距離以内にいるその他の人物」又は「画像の中のその他の人物」を、通報装置１を操作した人物の周辺にいる人物として抽出してもよい。「その他の人物」は通報装置１を操作した人物以外の人物である。画像内から人物を抽出する手段や、画像の中の２点間の実際の距離を推定する手段は広く知られているので、ここでの説明は省略する。

　そして、判断部１３は、解析対象として抽出した人物の挙動及び表情の少なくとも一方に基づき、通報条件を満たすか判断する。本実施形態では、判断部１３は、解析対象として抽出した人物の挙動及び表情の少なくとも一方が、予め定義された通報必要な挙動及び表情に該当する場合、通報条件を満たすと判断する。

　例えば、通報装置１を操作した人物の通報必要な挙動は、「周囲の様子を気にする」、「落ち着きがない」等が例示される。周囲の様子を気にする挙動の検出は、例えば、顔の動きに基づき検出してもよい。一例として、所定時間以上静止することなく、常に顔の向きが上下左右に変化している場合、周囲の様子を気にしていると判断してもよい。また、落ち着きがない挙動の検出は、例えば、身体の動きに基づき検出してもよい。一例として、所定時間以上静止することなく常に身体の一部が動いており、その変化のスピード（動いている部分の所定時間内における移動距離に基づき算出等）が基準レベル以上である場合、落ち着きがないと判断してもよい。

　また、通報装置１を操作した人物の通報必要な表情は、恐怖等である。

　また、通報装置１を操作した人物の周辺にいる人物の通報必要な挙動及び表情は、通報装置１を操作した人物の通報必要な挙動及び表情と同じであってもよい。これは、通報装置１を操作した人物の周辺にいる人物は、通報装置１を操作した人物の仲間であり、通報装置１を操作した人物と同様に、何らかのトラブルに巻き込まれている状況を想定したものである。

　なお、通報装置１を操作した人物の周辺にいる人物は、通報装置１を操作した人物に危害を加えようとしている可能性もある。そこで、通報装置１を操作した人物の周辺にいる人物の通報必要な挙動及び表情は、このような人物がとりがちな挙動及び表情であってもよい。

　例えば、通報装置１を操作した人物の周辺にいる人物の通報必要な挙動は、「視線を逸らすことなく通報装置１を操作した人物をじっと見る」、「周辺の物を叩いたり蹴ったりする」、「口を大きく開けて何かを発言し威嚇する」等が例示される。視線を逸らすことなく通報装置１を操作した人物をじっと見る挙動の検出は、例えば、顔の動きに基づき検出してもよい。一例として、所定時間以上の間、常に顔の向きが通報装置１を操作した人物の方に向いている場合、視線を逸らすことなく通報装置１を操作した人物をじっと見ていると判断してもよい。また、周辺の物を叩いたり蹴ったりする挙動は、例えば、身体の動きに基づき検出してもよい。一例として、身体の一部（腕や足）が動いて周辺の物と接触し、その身体の一部のスピード（動いている部分の所定時間内における移動距離に基づき算出等）が基準レベル以上である場合、周辺の物を叩いたり蹴ったりしたと判断してもよい。口を大きく開けて何かを発言し威嚇する挙動の検出は、例えば、顔の向きや口の動きに基づき検出してもよい。一例として、通報装置１を操作した人物の方に顔が向いている状態で口が動き、その動きの間に口が基準レベル以上大きく開く瞬間がある場合、口を大きく開けて何かを発言し威嚇していると判断してもよい。

　また、通報装置１を操作した人物の周辺にいる人物の通報必要な表情は、怒り等である。

　なお、上述した通報必要な挙動及びその検出方法はあくまで一例であり、これに限定されない。また、画像解析で表情を判定する手段は広く知られているので、ここでの説明は省略する。

　その他の例として、判断部１３は、通報装置１を操作した人物の周辺にいる人物が予め用意された危険人物のブラックリストに載っている場合、通報条件を満たすと判断してもよい。ブラックリストには、危険人物の外観の特徴量（顔の特徴量等）が登録されていてもよい。そして、判断部１３は、当該特徴量に基づき、通報装置１を操作した人物の周辺にいる人物がブラックリストに載っている人物か否かを判断してもよい。

　次に、音声に基づき通報条件を満たすか判断する処理の一例を説明する。判断部１３は、音声の中に予め定義された通報必要な音声が含まれる場合、通報条件を満たすと判断する。通報必要な音声は、悲鳴、怒鳴り声等であってもよいし、所定の発言内容であってもよい。所定の発言内容は、「やめて」、「許して」等、被害者側が発言する可能性のあるものであってもよいし、「待て」、「許さない」等、加害者側が発言する可能性のあるものであってもよい。音声の中から悲鳴や怒鳴り声等を検出する手段や、音声に含まれる発言内容を特定する手段は広く知られているので、ここでの説明は省略する。

　その他、通報必要な音声は、予め用意された危険人物のブラックリストに載っている人物の声であってもよい。すなわち、判断部１３は、音声の中に、危険人物のブラックリストに載っている人物の声が含まれる場合、通報条件を満たすと判断してもよい。ブラックリストには、危険人物の声の声紋が登録されていてもよい。そして、判断部１３は、当該声紋に基づき、音声の中にブラックリストに載っている人物の声が含まれるか否かを判断してもよい。

　出力部１４は、通報条件を満たすと判断された場合、通報装置１が操作された旨を示す通報情報を出力する。具体的には、出力部１４は、通報情報を所定の通報先装置３に送信する。通報先装置３は、例えば警察の装置であってもよいし、警備会社の装置であってもよいし、その他の者が管理する装置であってもよい。なお、出力部１４は、通報情報の中に、取得部１２が取得したデータ（画像及び音声の少なくとも一方）や、操作された通報装置１の設置位置を示す情報等を含めてもよい。

　次に、図４乃至図７のフローチャートを用いて、処理装置１０の処理の流れの一例を説明する。

　図４のフローチャートは、通報装置１の操作検出から通報情報の出力までの全体の流れを示す。

　検出部１１が通報装置１からの信号に基づき通報装置１が操作されたことを検出すると（Ｓ１０のＹｅｓ）、取得部１２は、データ収集装置２が生成したデータ（画像及び音声の少なくとも一方）を取得する（Ｓ１１）。例えば、取得部１２は、通報装置１が操作された操作タイミングより前の開始タイミングから、操作タイミングより後の終了タイミングまでの間にデータ収集装置２が生成したデータ、すなわち操作タイミングの前後のデータを取得する。

　その後、判断部１３は、Ｓ１１で取得部１２が取得したデータが所定の通報条件を満たすか判断する（Ｓ１２）。そして、通報条件を満たすと判断された場合（Ｓ１３のＹｅｓ）、出力部１４は、通報装置１が操作された旨を示す通報情報を通報先装置３に送信する（Ｓ１４）。一方、通報条件を満たすと判断されなかった場合（Ｓ１３のＮｏ）、出力部１４は、通報情報を通報先装置３に送信しない。出力部１４は、通報情報の中に、取得部１２が取得したデータ（画像及び音声の少なくとも一方）や、操作された通報装置１の設置位置を示す情報等を含めてもよい。

　なお、図示しないが、通報情報を受信した通報先装置３は、操作された通報装置１の近くにいる者（警察官、警備員等）の端末に、操作された通報装置１を示す情報及びそこに駆け付けるリクエストを送信してもよい。なお、このリクエストの中に、操作された通報装置１の周辺を撮影した画像、及び、操作された通報装置１の周辺で集音された音声の少なくとも一方が含まれてもよい。そして、通報先装置３は、操作された通報装置１に駆け付けることが可能か否かの回答を端末から受信してもよい。この場合、通報先装置３は、複数の者（警察官、警備員等）各々の端末の位置情報を管理しておき、当該管理情報に基づき、操作された通報装置１の近くにいる者を特定することができる。

　図５は、図４のＳ１２の処理の流れの一例を示す。当該例では、取得部１２はＳ１１で画像及び音声の両方を取得し、判断部１３は画像及び音声の両方に基づき通報条件を満たすか判断する。

　判断部１３は、画像が通報条件を満たす場合（Ｓ２０のＹｅｓ）、通報条件を満たすと判断する（Ｓ２２）。

　また、判断部１３は、画像が通報条件を満たさないが（Ｓ２０のＮｏ）、音声が通報条件を満たす場合（Ｓ２１のＹｅｓ）、通報条件を満たすと判断する（Ｓ２２）。

　そして、判断部１３は、画像が通報条件を満たさず（Ｓ２０のＮｏ）、かつ、音声も通報条件を満たさない場合（Ｓ２１のＮｏ）、通報条件を満たさないと判断する（Ｓ２３）。

　図６は、画像に基づき通報条件を満たすか判断する処理の流れの一例を示す。当該例では、判断部１３は、解析対象の人物の挙動及び表情の両方に基づき通報条件を満たすか判断する。

　判断部１３は、画像の中から通報装置１を操作した人物、及び、通報装置１を操作した人物の周辺の人物の少なくとも一方を解析対象として抽出する（Ｓ３０）。解析対象の人物の挙動及び表情の少なくとも一方が、予め定義された通報必要な挙動及び表情に該当する場合（Ｓ３１のＹｅｓ）、判断部１３は、通報条件を満たすと判断する（Ｓ３２）。一方、解析対象の人物の挙動及び表情のいずれもが、予め定義された通報必要な挙動及び表情に該当しない場合（Ｓ３１のＮｏ）、判断部１３は、通報条件を満たさないと判断する（Ｓ３３）。

　図７は、音声に基づき通報条件を満たすか判断する処理の流れの一例を示す。判断部１３は、音声の中に、予め定義された通報必要な音声が含まれる場合（Ｓ４０のＹｅｓ）、通報条件を満たすと判断する（Ｓ４１）。一方、音声の中に、予め定義された通報必要な音声が含まれない場合（Ｓ４０のＮｏ）、通報条件を満たさないと判断する（Ｓ４２）。

　以上説明した本実施形態の処理装置１０は、通報装置１が操作された場合、データ収集装置２が生成したデータに基づき通報の要否、すなわちいたずらや誤操作でないか等を判断し、必要と判断した場合に通報を行うことができる。このような処理装置１０によれば、いたずらや誤操作による通報の頻度が軽減される。

　また、処理装置１０は、通報装置１を操作した人物、及び、その周辺の人物の少なくとも一方の挙動や表情等に基づき、いたずらや誤操作でないか判断することができる。具体的には、処理装置１０は、それらの人物の挙動や表情が、通報必要なものであるか否かに基づき、いたずらや誤操作でないか判断することができる。このような処理装置１０によれば、いたずらや誤操作を高精度に検出することができる。

　また、処理装置１０は、通報装置１を操作した人物、及び、その周辺の人物の少なくとも一方による発言内容や、それらの人の行動により生じた音声等に基づき、いたずらや誤操作でないか判断することができる。具体的には、処理装置１０は、音声の中に通報必要な音声が含まれるか否かに基づき、いたずらや誤操作でないか判断することができる。このような処理装置１０によれば、いたずらや誤操作を高精度に検出することができる。

　また、処理装置１０は、通報装置１が操作された操作タイミングより後の画像や音声のみならず、操作タイミングより前の画像や音声に基づき、いたずらや誤操作でないか判断することができる。このような処理装置１０によれば、いたずらや誤操作を高精度に検出することができる。

＜第２の実施形態＞
　本実施形態の判断部１３は、解析対象として抽出した人物の挙動及び表情の少なくとも一方が、予め定義された通報不要な挙動及び表情に該当するか否かに基づき、通報条件を満たすか判断する。判断部１３は、通報不要な挙動及び表情に該当する場合、通報条件を満たさないと判断する。

　例えば、通報装置１を操作した人物の通報不要な挙動は、「笑っている」、「笑顔である」、「あくびをしている」、「周囲の様子を気にしてない」、「落ち着きがある」等が例示される。

　また、通報装置１を操作した人物の通報不要な表情は、笑顔、喜び、安らか、冷静等である。

　また、通報装置１を操作した人物の周辺にいる人物の通報不要な挙動及び表情は、通報装置１を操作した人物の通報不要な挙動及び表情と同じである。これは、通報装置１を操作した人物の周辺にいる人物は、通報装置１を操作した人物の仲間であり、通報装置１を操作した人物と一緒にいたずら等をしている状況を想定したものである。

　その他の例として、判断部１３は、通報装置１を操作した人物、及び、その周辺にいる人物の中のいずれかが、予め用意されたいたずら常習犯のブラックリストに載っている場合、通報条件を満たさないと判断してもよい。ブラックリストには、いたずら常習犯の外観の特徴量（顔の特徴量等）が登録されていてもよい。そして、判断部１３は、当該特徴量に基づき、通報装置１を操作した人物、及び、その周辺にいる人物がブラックリストに載っている人物か否かを判断してもよい。

　また、判断部１３は、音声の中に予め定義された通報不要な音声が含まれる場合、通報条件を満たさないと判断することができる。通報不要な音声は、笑い声等であってもよいし、所定の発言内容であってもよい。所定の発言内容は、「やめとけよ」、「知らないぞ」、「早くやれよ」等、いたずらをしている者が発言する可能性のあるものであってもよいし、「間違えた」、「しまった」、「どうしよう」等、誤操作をした者が発言する可能性のあるものであってもよい。

　その他、通報不要な音声は、予め用意されたいたずら常習犯のブラックリストに載っている人物の声であってもよい。すなわち、判断部１３は、音声の中に、いたずら常習犯のブラックリストに載っている人物の声が含まれる場合、通報条件を満たさないと判断してもよい。ブラックリストには、いたずら常習犯の声の声紋が登録されていてもよい。そして、判断部１３は、当該声紋に基づき、音声の中にブラックリストに載っている人物の声が含まれるか否かを判断してもよい。

　次に、処理装置１０の処理の流れの一例を説明する。図８は、画像に基づき通報条件を満たすか判断する処理の流れの一例を示す。当該例では、判断部１３は、解析対象の人物の挙動及び表情の両方に基づき通報条件を満たすか判断する。

　判断部１３は、画像の中から通報装置１を操作した人物、及び、通報装置１を操作した人物の周辺の人物の少なくとも一方を解析対象として抽出する（Ｓ５０）。解析対象の人物の挙動及び表情の少なくとも一方が、予め定義された通報不要な挙動及び表情に該当する場合（Ｓ５１のＹｅｓ）、判断部１３は、通報条件を満たさないと判断する（Ｓ５３）。一方、解析対象の人物の挙動及び表情のいずれもが、予め定義された通報不要な挙動及び表情に該当しない場合（Ｓ５１のＮｏ）、判断部１３は、通報条件を満たすと判断する（Ｓ５２）。

　図９は、音声に基づき通報条件を満たすか判断する処理の流れの一例を示す。判断部１３は、音声の中に、予め定義された通報必要な音声が含まれる場合（Ｓ６０のＹｅｓ）、通報条件を満たさないと判断する（Ｓ６２）。一方、音声の中に、予め定義された通報不要な音声が含まれない場合（Ｓ６０のＮｏ）、通報条件を満たすと判断する（Ｓ６１）。

　処理装置１０のその他の構成は、第１の実施形態と同様である。

　本実施形態の処理装置１０によれば、第１の実施形態と同様の作用効果が実現される。また、処理装置１０は、通報装置１を操作した人物、及び、その周辺の人物の少なくとも一方の挙動や表情が、通報不要なものであるか否かに基づき、いたずらや誤操作でないか判断することができる。このような処理装置１０によれば、いたずらや誤操作を高精度に検出することができる。

　また、処理装置１０は、通報装置１を操作した人物、及び、その周辺の人物の少なくとも一方による発言内容や、それらの人の行動により生じた音声の中に通報不要な音声が含まれるか否かに基づき、いたずらや誤操作でないか判断することができる。このような処理装置１０によれば、いたずらや誤操作を高精度に検出することができる。

＜変形例＞
　ここで、第１及び第２の実施形態に適用可能な処理装置１０の変形例を説明する。第１及び第２の実施形態の処理装置１０は、通報装置１の操作に応じて通報情報を通報先装置３に送信した。変形例として、処理装置１０は、通報装置１の操作なしで通報情報を通報先装置３に送信する機能を備えてもよい。具体的には、処理装置１０は、データ収集装置２が生成したデータを常時監視し、異常を検出する処理を行ってもよい。そして、処理装置１０は、データ収集装置２が生成したデータの中で異常を検出した場合、通報情報を通報先装置３に送信してもよい。

　処理装置１０が異常として検出する内容は、例えば、人が通報装置１の方に向かって走ってくることであってもよい。これは、画像に基づき検出することができる。その他、処理装置１０は、音声の中から、悲鳴、怒鳴り声等を異常として検出してもよい。その他、処理装置１０は、殴る、蹴る等の暴力行為を、画像に基づき検出してもよい。

　例えば、通報装置１を操作するために通報装置１のそばまで来たが、邪魔をされ、通報装置１を操作できないという状況に陥る人が発生し得る。通報装置１の周辺の様子に基づき、通報装置１への操作なしで通報できる処理装置１０によれば、このような状況に陥った人等の救済が実現される。

　以上、実施形態（及び実施例）を参照して本願発明を説明したが、本願発明は上記実施形態（及び実施例）に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限定されない。
１．　通報装置が操作されたことを検出する検出手段と、
　前記通報装置が操作されたことが検出されると、カメラが生成した画像、及び、マイクが集音した音声の少なくとも一方を取得する取得手段と、
　前記画像及び前記音声の少なくとも一方が通報条件を満たすか判断する判断手段と、
　前記通報条件を満たすと判断された場合、前記通報装置が操作された旨を示す通報情報を出力する出力手段と、
を有する処理装置。
２．　前記取得手段は、前記通報装置が操作された操作タイミングより前の開始タイミングから前記操作タイミングより後の終了タイミングまでの間に前記カメラが生成した画像、及び、前記マイクが集音した音声の少なくとも一方を取得する１に記載の処理装置。
３．　前記カメラは前記通報装置の周辺を撮影し、前記マイクは前記通報装置の周辺の音声を集音する１又は２に記載の処理装置。
４．　前記判断手段は、
　　前記画像の中から前記通報装置を操作した人物を解析対象として抽出し、
　　前記解析対象として抽出した人物の挙動に基づき、前記通報条件を満たすか判断する１から３のいずれかに記載の処理装置。
５．　前記判断手段は、
　　前記画像の中から前記通報装置を操作した人物の周辺にいる人物を解析対象として抽出し、
　　前記解析対象として抽出した人物の挙動及び表情の少なくとも一方に基づき、前記通報条件を満たすか判断する１から４のいずれかに記載の処理装置。
６．　前記判断手段は、前記解析対象として抽出した人物の挙動及び表情の少なくとも一方が、予め定義された通報必要な挙動及び表情に該当する場合、前記通報条件を満たすと判断する４又は５に記載の処理装置。
７．　前記判断手段は、前記解析対象として抽出した人物の挙動及び表情の少なくとも一方が、予め定義された通報不要な挙動及び表情に該当する場合、前記通報条件を満たさないと判断する４又は５に記載の処理装置。
８．　前記判断手段は、
　　前記音声の中に予め定義された通報必要な音声が含まれる場合、前記通報条件を満たすと判断する１から７のいずれかに記載の処理装置。
９．　前記判断手段は、
　　前記音声の中に予め定義された通報不要な音声が含まれる場合、前記通報条件を満たさないと判断する１から７のいずれかに記載の処理装置。
１０．　コンピュータが、
　　通報装置が操作されたことを検出し、
　　前記通報装置が操作されたことが検出されると、カメラが生成した画像、及び、マイクが集音した音声の少なくとも一方を取得し、
　　前記画像及び前記音声の少なくとも一方が通報条件を満たすか判断し、
　　前記通報条件を満たすと判断された場合、前記通報装置が操作された旨を示す通報情報を出力する処理方法。
１１．　コンピュータを、
　　通報装置が操作されたことを検出する検出手段、
　　前記通報装置が操作されたことが検出されると、カメラが生成した画像、及び、マイクが集音した音声の少なくとも一方を取得する取得手段、
　　前記画像及び前記音声の少なくとも一方が通報条件を満たすか判断する判断手段、
　　前記通報条件を満たすと判断された場合、前記通報装置が操作された旨を示す通報情報を出力する出力手段、
として機能させるプログラム。

Claims

　通報装置が操作されたことを検出する検出手段と、
　前記通報装置が操作されたことが検出されると、カメラが生成した画像、及び、マイクが集音した音声の少なくとも一方を取得する取得手段と、
　前記画像及び前記音声の少なくとも一方が通報条件を満たすか判断する判断手段と、
　前記通報条件を満たすと判断された場合、前記通報装置が操作された旨を示す通報情報を出力する出力手段と、
を有する処理装置。
　前記取得手段は、前記通報装置が操作された操作タイミングより前の開始タイミングから前記操作タイミングより後の終了タイミングまでの間に前記カメラが生成した画像、及び、前記マイクが集音した音声の少なくとも一方を取得する請求項１に記載の処理装置。
　前記カメラは前記通報装置の周辺を撮影し、前記マイクは前記通報装置の周辺の音声を集音する請求項１又は２に記載の処理装置。
　前記判断手段は、
　　前記画像の中から前記通報装置を操作した人物を解析対象として抽出し、
　　前記解析対象として抽出した人物の挙動に基づき、前記通報条件を満たすか判断する請求項１から３のいずれか１項に記載の処理装置。
　前記判断手段は、
　　前記画像の中から前記通報装置を操作した人物の周辺にいる人物を解析対象として抽出し、
　　前記解析対象として抽出した人物の挙動及び表情の少なくとも一方に基づき、前記通報条件を満たすか判断する請求項１から４のいずれか１項に記載の処理装置。
　前記判断手段は、前記解析対象として抽出した人物の挙動及び表情の少なくとも一方が、予め定義された通報必要な挙動及び表情に該当する場合、前記通報条件を満たすと判断する請求項４又は５に記載の処理装置。
　前記判断手段は、前記解析対象として抽出した人物の挙動及び表情の少なくとも一方が、予め定義された通報不要な挙動及び表情に該当する場合、前記通報条件を満たさないと判断する請求項４又は５に記載の処理装置。
　前記判断手段は、
　　前記音声の中に予め定義された通報必要な音声が含まれる場合、前記通報条件を満たすと判断する請求項１から７のいずれか１項に記載の処理装置。
　コンピュータが、
　　通報装置が操作されたことを検出し、
　　前記通報装置が操作されたことが検出されると、カメラが生成した画像、及び、マイクが集音した音声の少なくとも一方を取得し、
　　前記画像及び前記音声の少なくとも一方が通報条件を満たすか判断し、
　　前記通報条件を満たすと判断された場合、前記通報装置が操作された旨を示す通報情報を出力する処理方法。
　コンピュータを、
　　通報装置が操作されたことを検出する検出手段、
　　前記通報装置が操作されたことが検出されると、カメラが生成した画像、及び、マイクが集音した音声の少なくとも一方を取得する取得手段、
　　前記画像及び前記音声の少なくとも一方が通報条件を満たすか判断する判断手段、
　　前記通報条件を満たすと判断された場合、前記通報装置が操作された旨を示す通報情報を出力する出力手段、
として機能させるプログラム。