WO2020240772A1

WO2020240772A1 - 映像記録装置、遠隔監視システム、遠隔監視方法、及びプログラム

Info

Publication number: WO2020240772A1
Application number: PCT/JP2019/021535
Authority: WO
Inventors: 邦博太田; 庸一朗原; 耕大中村
Original assignee: 株式会社Ｍｏｒｙ
Priority date: 2019-05-30
Filing date: 2019-05-30
Publication date: 2020-12-03
Also published as: JPWO2020240772A1

Abstract

一実施形態に係る映像記録装置は、周囲を撮影した映像信号を出力する撮像手段と、映像信号により示されるフレーム画像を一時的に記憶する一時記憶手段と、一時記憶手段に記憶されているフレーム画像に対し顔認識処理を行う顔認識手段と、フレーム画像のうち顔認識手段により顔と判断された部分を別の画像へ置換をする置換手段と、置換手段により処理されたフレーム画像を圧縮して映像データを生成する生成手段と、生成手段により生成された映像データを永続的に記憶する永続記憶手段とを有する。

Description

映像記録装置、遠隔監視システム、遠隔監視方法、及びプログラム

　本発明は、プライバシーを保護しつつ映像を記録する技術に関する。

　映像を記録する技術がある。例えば、特許文献１には、イベントが発生したときにイベントに関連する他車両と人物の少なくとも一方を画像において特定することができるドライブレコーダにおいて、他車両がうちされた領域及び人物が写された領域の少なくとも一方にプライバシー保護のための画像処理を施すことが記載されている。

特開２０１８－１２４８２４号公報

　特許文献１に記載の技術においては、イベントの発生前及び発生後の少なくとも一方において、他車両及び人物の少なくとも一方を特定可能な画像が記録される。この場合、他の装置からこのデータを読み出せば、プライバシーが破られてしまうという問題があった。

　これに対し本発明は、プライバシーをより強固に保護しつつ映像を記録する技術を提供する。

　本発明の一態様は、周囲を撮影した映像信号を出力する撮像手段と、前記映像信号により示されるフレーム画像を一時的に記憶する一時記憶手段と、前記一時記憶手段に記憶されているフレーム画像に対し顔認識処理を行う顔認識手段と、前記フレーム画像のうち前記顔認識手段により顔と判断された部分を別の画像へ置換をする置換手段と、前記置換手段により処理されたフレーム画像を圧縮して映像データを生成する生成手段と、前記生成手段により生成された映像データを永続的に記憶する永続記憶手段とを有する映像記録装置を提供する。

　前記別の画像は、可逆処理により元の画像に変換可能な画像であってもよい。

　前記映像記録装置は、前記映像記録装置の動作モードを、通常モード及び緊急モードの複数の動作モードのうち一の動作モードから別の動作モードに切り替える切り替え手段と、前記動作モードが前記緊急モードの場合、所定の外部装置に前記映像データを送信し、当該動作モードが前記通常モードの場合、当該外部装置に当該映像データを送信しない送信手段とを有してもよい。

　前記映像記録装置は、前記一時記憶手段に記憶された前記フレーム画像を用いて、前記映像記録装置周辺の状況を解析する解析手段を有し、前記切り替え手段は、前記解析手段による解析結果に応じて前記動作モードを切り替えてもよい。

　前記映像記録装置は、前記周囲から集音した音信号を出力する集音手段、又は前記映像記録装置のモーションを示すモーション信号を出力するモーション検知手段を有し、前記解析手段は、前記フレーム画像及び前記音信号又は前記モーション信号を用いて、前記映像記録装置周辺の状況を解析してもよい。

　前記切り替え手段は、災害の発生を示す情報を取得したことに応じて、前記動作モードを前記通常モードから前記緊急モードに移行してもよい。

　前記映像記録装置は、前記フレーム画像のうち前記顔認識手段により顔と判断された部分から所定の距離離れた部分のデータ量を低減する処理を行う処理手段を有し、前記生成手段は、前記処理手段及び前記置換手段により前記処理及び前記置換をされたフレーム画像を圧縮して映像データを生成してもよい。

　前記映像記録装置は、前記一時記憶手段に記憶された前記フレーム画像を用いて、前記映像記録装置周辺の状況を解析する解析手段と、前記解析手段により解析された状況を示す付加情報を前記映像データに付加する付加手段とを有してもよい。

　前記映像記録装置は、前記一時記憶手段に記憶された前記フレーム画像を用いて、前記映像記録装置周辺の状況を解析する解析手段と、前記解析手段により解析された状況を示す付加情報を前記映像データに付加する付加手段とを更に有し、前記状況が特定の条件を満たす場合、前記送信手段は、前記動作モードが前記緊急モードに切り替えられる前の時点まで遡って前記映像データを送信してもよい。

　前記映像記録装置は、前記映像データを再生した映像を表示する表示手段を有さなくてもよい。

　本発明の別の態様は、サーバと、映像記録装置とを有し、前記映像記録装置は、周囲を撮影した映像信号を出力する撮像手段と、前記映像信号により示されるフレーム画像を一時的に記憶する一時記憶手段と、前記一時記憶手段に記憶されているフレーム画像に対し顔認識処理を行う顔認識手段と、前記フレーム画像のうち前記顔認識手段により顔と判断された部分を別の画像へ置換をする置換手段と、前記置換手段により処理されたフレーム画像を圧縮して映像データを生成する生成手段と、前記生成手段により生成された映像データを永続的に記憶する永続記憶手段と、前記映像記録装置の動作モードを、通常モード及び緊急モードの複数の動作モードのうち一の動作モードから別の動作モードに切り替える切り替え手段と、前記動作モードが前記緊急モードの場合、前記サーバに前記映像データを送信し、当該動作モードが前記通常モードの場合、当該サーバに当該映像データを送信しない送信手段とを有し、前記サーバは、前記映像記録装置に対応する映像再生装置を識別する情報を記憶する記憶手段と、前記映像記録装置から前記映像データを受信する受信手段と、前記受信手段により受信された映像データを、前記映像記録装置に対応する前記映像再生装置に送信する送信手段とを有する遠隔監視システムを提供する。

　前記映像記録装置は、前記一時記憶手段に記憶された前記フレーム画像を用いて、前記映像記録装置周辺の状況を解析する解析手段と、前記映像記録装置の位置情報を取得する取得手段と、前記解析手段により解析された状況を示す付加情報及び前記位置情報を前記映像データに付加する付加手段とを有し、前記サーバは、前記付加情報により示される状況を、前記位置情報を用いて地図上にマッピングするマッピング手段を有し、前記送信手段は、前記状況がマッピングされた地図を前記映像再生装置に送信してもよい。

　前記映像記録装置において、前記送信手段は、前記位置情報を定期的に前記サーバに送信し、前記サーバにおいて、前記送信手段は、前記位置情報により前記映像記録装置が、特定の前記情報がマッピングされた領域と所定の位置関係に入ったことが示された場合、前記動作モードを前記緊急モードに切り替えるための制御信号を送信し、前記映像記録装置において、前記切り替え手段は、前記制御信号に応じて前記動作モードを前記緊急モードに切り替えてもよい。

　また、本発明のさらに別の態様は、映像記録装置と通信するサーバが、当該映像記録装置に対応する映像再生装置を識別する識別情報を記憶するステップと、前記映像記録装置が、周囲を撮影した映像信号により示されるフレーム画像を一時記憶手段に一時的に記憶するステップと、前記映像記録装置が、前記一時記憶手段に記憶されているフレーム画像に対し顔認識処理を行うステップと、前記映像記録装置が、前記フレーム画像のうち前記顔と判断された部分を別の画像へ置換をするステップと、前記映像記録装置が、前記置換されたフレーム画像を圧縮して映像データを生成するステップと、前記映像記録装置が、前記生成された映像データを永続的に記憶するステップと、前記映像記録装置が、前記映像記録装置の動作モードを、通常モード及び緊急モードの複数の動作モードのうち一の動作モードから別の動作モードに切り替えるステップと、前記映像記録装置が、前記動作モードが前記緊急モードの場合、前記サーバに前記映像データを送信し、当該動作モードが前記通常モードの場合、当該サーバに当該映像データを送信しないステップと、前記サーバが、前記映像記録装置から前記映像データを受信するステップと、前記サーバが、前記受信された映像データを、前記映像記録装置に対応する前記映像再生装置に送信するステップとを有する遠隔監視方法を提供する。

　また、本発明のさらに別の態様は、コンピュータに、周囲を撮影した映像信号により示されるフレーム画像を一時記憶手段に一時的に記憶するステップと、前記一時記憶手段に記憶されているフレーム画像に対し顔認識処理を行うステップと、前記フレーム画像のうち前記顔と判断された部分を別の画像へ置換をするステップと、前記置換されたフレーム画像を圧縮して映像データを生成するステップと、前記生成された映像データを永続的に記憶するステップと、を実行させるためのプログラムを提供する。

　本発明によれば、プライバシーをより強固に保護しつつ映像を記録することができる。

一実施形態に係る遠隔監視システム１の構成を例示する図。遠隔監視システム１の機能構成を例示するブロック図。映像記録装置１０のハードウェア構成を例示するブロック図。サーバ３０のハードウェア構成を例示するブロック図。遠隔監視システム１の動作を例示するシーケンスチャート。映像記録装置１０の動作を例示するシーケンスチャート。遠隔監視システム１の動作を例示するシーケンスチャート。ストリーミング画面を例示する図。遠隔監視システム１Ｂの機能構成を例示するブロック図。遠隔監視システム１Ｃの機能構成を例示するブロック図。遠隔監視システム１Ｄの機能構成を例示するブロック図。遠隔監視システム１Ｄの動作を例示するシーケンスチャート。映像再生装置２０に表示される画面を例示する図。遠隔監視システム１Ｅの構成を例示する図。遠隔監視システム１Ｅの動作を例示するシーケンスチャート。被災マップを例示した図。

１・１Ｂ・１Ｃ・１Ｄ…遠隔監視システム、２…通信回線、１０・１０Ａ・１０Ｂ…映像記録装置、１１…撮像手段、１２…一時記憶手段、１３…顔認識手段、１４…置換手段、１５…生成手段、１６…永続記憶手段、１７…切り替え手段、１８…送信手段、２０…映像再生装置、３０…サーバ、３１…記憶手段、３２…受信手段、３３…送信手段、３４…マッピング手段、３５…送信手段、５１…集音手段、５２…モーション検知手段、５３…解析手段、５５…処理手段、５６…取得手段、５７…付加手段、５８…受信手段、１０１…制御装置、１０２…カメラ、１０３…フレームメモリ、１０４…画像処理回路、１０５…エンコーダ、１０６…記憶装置、１０７…通信ＩＦ、１０８…ボタン、１０９…モーションセンサ、１１０…ＧＰＳ受信部、１１１…マイク、１５３…顔認識部、３０１…プロセッサ、３０２…メモリ、３０３…記憶装置、３０４…通信ＩＦ。

１．構成
　図１は、一実施形態に係る遠隔監視システム１の構成を例示する図である。遠隔監視システム１は、子供、女性、及び高齢者等の見守りサービスを提供するシステムである。遠隔監視システム１は、映像記録装置１０、映像再生装置２０、及びサーバ３０を有する。映像記録装置１０は、見守りの対象とされる被保護者（例えば子供）が携帯する装置である。映像再生装置２０は、保護者（例えば子供の親）により使用される装置であり、例えば、スマートフォン、タブレット端末、又はラップトップ型コンピュータ等の汎用コンピュータである。サーバ３０はいわゆるクラウドサーバである。映像記録装置１０及び映像再生装置２０は通信回線２によりサーバ３０に接続されている。通信回線２は、例えば、インターネット、移動体通信網、電話回線、又はＬＡＮ（Local Area Network）を含む。

　映像記録装置１０は、被保護者に携帯される装置（すなわち、いわゆるウェアラブルデバイス）である。映像記録装置１０は、例えば、被保護者の所持品（例えば、ランドセル、手提げカバン、名札、携帯電話、ネームプレート）、又は衣服等に、取付部材（ストラップ、取付用金具、面ファスナー、安全ピン等）によって取り付けられて用いられる。他の例として、映像記録装置１０は、ネックストラップが取り付けられて被保護者の首からぶら下げられて携帯されてもよい。また、映像記録装置１０にベルトが取り付けられ、被保護者の手首、足首、又は腰等に装着されて用いられてもよい。

　映像記録装置１０は、カメラ１０２及びボタン１０８を備える。カメラ１０２は周囲を撮影した映像信号を出力する。撮影された映像を表す映像データは映像記録装置１０の記憶装置に蓄積（又は記憶）される。ボタン１０８はユーザ（すなわち被保護者）により操作される操作子であり、映像記録装置の動作モードを通常モードから緊急モードに切り替えるための操作子である。通常モードとは、カメラ１０２で撮影された映像が記憶装置１０６に記録される動作モードをいう。緊急モードとは、カメラ１０２により撮影された画像データがサーバ３０を介して映像再生装置２０にストリーミング配信される動作モードをいう。被保護者は、例えば危険を感じて助けを求めたい場合等、所定の条件下でボタン１０８を押下する。ボタン１０８が押下されると、映像記録装置１０の動作モードが通常モードから緊急モードに切り替えられる。保護者は、ストリーミング配信される映像を確認し、警察に通報する等の対処をする。

　図１の例では、図面が煩雑になるのを防ぐため、映像記録装置１０及び映像再生装置２０をそれぞれ１台ずつ図示しているが、複数の映像記録装置１０及び複数の映像再生装置２０が遠隔監視システム１に含まれてもよい。

　図２は、遠隔監視システム１の機能構成を例示するブロック図である。図において、映像記録装置１０は、撮像手段１１、一時記憶手段１２、顔認識手段１３、置換手段１４、生成手段１５、永続記憶手段１６、切り替え手段１７、及び送信手段１８を有する。サーバ３０は、記憶手段３１、受信手段３２、及び送信手段３３を有する。

　撮像手段１１は、周囲を撮影した映像信号を出力する。一時記憶手段１２は、映像信号により示されるフレーム画像を一時的に記憶する。ここで、「一時的に記憶する」とは、記憶容量がフレーム画像１枚分の数倍程度しかなくデータが頻繁に書き換えられ、かつ電源をオフにするとデータが消失することをいう。顔認識手段１３は、一時記憶手段１２に記憶されているフレーム画像に対し顔認識処理を行う。置換手段１４は、フレーム画像のうち顔認識手段１３により顔と判断された部分を別の画像へ置換をする。生成手段１５は、置換手段１４により処理されたフレーム画像を圧縮して映像データを生成する。永続記憶手段１６は、生成手段１５により生成された映像データを永続的に記憶する。ここで、「永続的に記憶する」とは、数十分から数時間の動画を記憶する容量があり、かつ電源をオフにしてもデータが消失しない（不揮発性である）ことをいう。ただし、永続記憶手段１６の記憶容量にも限りがあるので、記憶容量を超えた場合はデータが上書きされる。例えば、永続記憶手段１６が動画６０分ぶんの記憶容量を有する場合において、６０分を超える動画を撮影したときは、データは古いものから順に上書きされ、常に最新の６０分ぶんのデータが永続記憶手段１６に記憶される。

　切り替え手段１７は、映像記録装置１０の動作モードを、通常モード及び緊急モードを含む複数の動作モードのうち一の動作モードから別の動作モードに切り替える。送信手段１８は、動作モードが緊急モードの場合、所定の外部装置（この例ではサーバ３０）に映像データを送信し、動作モードが通常モードの場合、外部装置に映像データを送信しない。

　記憶手段３１は、映像記録装置１０に対応する映像再生装置２０を識別する情報を記憶する。１台の映像記録装置１０に対して、複数台の映像再生装置２０が対応付けられてもよい。受信手段３２は、映像記録装置１０から映像データを受信する。送信手段３３は、受信手段３２により受信された映像データを、映像記録装置１０に対応する映像再生装置２０に送信する。

　図３は、映像記録装置１０のハードウェア構成を例示するブロック図である。制御装置１０１は、映像記録装置１０の他の要素を制御するプロセッサ及びこのプロセッサがプログラムを実行するためのワークエリアとして機能するメモリを含む。記憶装置１０６は各種のプログラム及びデータを記憶する記憶装置であり、例えば、ＳＳＤ（Solid State Drive）又はＨＤＤ（Hard Disk Drive）を含む。通信ＩＦ１０７は、予め定められた無線又は有線の通信規格に従って他の装置と通信を行う。この例において、通信ＩＦ１０７は、サーバ３０とネットワークを介した通信をするための移動体通信（例えばＬＴＥ（Long Term Evolution、登録商標））、及び保護者の端末装置（映像再生装置２０等）と直接通信をするための近距離無線通信（Ｗｉ－Ｆｉ（登録商標）又はＢｌｕｅｔｏｏｔｈ（登録商標）等）の、２つの規格に従った通信をすることができる。移動体通信を行うため、映像記録装置１０にはＳＩＭ（Subscriber Identification Module）が装着される。

　カメラ１０２は周囲を撮影した映像信号を出力する。カメラ１０２は例えば、映像記録装置１０が被保護者の胸元に装着された状態において、被保護者と相対する位置に居る人及び／又は人の顔が撮影される向きで設けられている。マイク１１１は、周囲から集音した音信号を出力する。フレームメモリ１０３は、カメラ１０２から出力される映像信号から得られるフレーム画像を記憶する一時メモリであり、例えば１フレームぶんの記憶容量を有する。画像処理回路１０４は、フレームメモリ１０３に記憶されているフレーム画像のデータに対し所定の画像処理を施す。画像処理されたフレーム画像のデータは、例えば前後のフレーム画像との関係を用いて映像データ化される。この映像データは、マイク１１１から出力される音信号を音声トラックに含んでもよい。この映像データは記憶装置１０６に記憶される。

　ボタン１０８は映像記録装置１０の動作モード（通常モード及び緊急モード）をユーザが切り替えるための操作子である。モーションセンサ１０９は、例えば加速度センサ、ジャイロセンサ、速度センサ等のセンサを備え、映像記録装置１０のモーションを示すモーション信号を出力する。ＧＰＳ受信部１１０はＧＰＳ（Global Positioning System）衛星からＧＰＳ信号を受信し、受信したＧＰＳ信号から計算される位置情報を出力する。なお、この実施形態では、図示のように、映像記録装置１０は、映像データを再生した映像を表示する表示手段を有さない。

　映像記録装置１０は二次電池（図示略）を内蔵しており、各構成要素は二次電池から供給される電力により動作する。また、映像記録装置１０は電源ボタン（図示略）を有しており、電源ボタンの操作により装置のオン／オフが切り替えられる。電源が投入されると記憶装置１０６に記憶されたプログラムが自動的に起動し、映像記録装置１０は通常モードでの動作を開始する。

　この例において、カメラ１０２が撮像手段１１の一例である。フレームメモリ１０３が一時記憶手段１２の一例である。画像処理回路１０４が顔認識手段１３及び置換手段１４の一例である。エンコーダ１０５が生成手段１５の一例である。記憶装置１０６が永続記憶手段１６の一例である。制御装置１０１が切り替え手段１７の一例である。通信ＩＦ１０７が送信手段１８の一例である。

　図４は、サーバ３０のハードウェア構成を例示するブロック図である。プロセッサ３０１は、サーバ３０の他の要素を制御するプロセッサである。メモリ３０２は、プロセッサ３０１がプログラムを実行するためのワークエリアとして機能する記憶装置であり、例えばＲＡＭ（Random Access Memory）を含む。記憶装置３０３は各種のプログラム及びデータを記憶する記憶装置であり、例えば、ＳＳＤ（Solid State Drive）又はＨＤＤ（Hard Disk Drive）を含む。通信ＩＦ３０４は、予め定められた無線又は有線の通信規格（例えば、イーサネット（登録商標））に従って他の装置と通信を行う。

　プロセッサ３０１が記憶装置３０３に記憶されたプログラム（以下「サーバプログラム」という）を実行することにより、図２に示される機能が実装される。サーバプログラムを実行しているプロセッサ３０１及び／又は通信ＩＦ３０４は、受信手段３２及び送信手段３３の一例である。記憶装置３０３は、記憶手段３１の一例である。

　サーバ３０の記憶装置３０３には、映像記録装置１０に対して、対応する１以上の映像再生装置２０（例えば、母親のスマートフォンと父親のスマートフォン）の識別情報が登録されている。

　詳細な説明は省略するが、映像再生装置２０は、汎用のコンピュータ装置（例えばスマートフォン）である。この映像再生装置２０には、コンピュータ装置を遠隔監視システム１における映像再生装置２０として機能させるためのプログラム（以下「クライアントプログラム」という）がインストールされている。このクライアントプログラムにより、サーバ３０から映像のストリーミング配信を受ける機能、及び関係機関に通報する機能（いずれも後述）が実装される。

２．動作
２－１．登録
　図５は、遠隔監視システム１の初期登録動作を例示するシーケンスチャートである。図５に示される処理により、映像記録装置１０と映像再生装置２０との紐付けが行われる。映像再生装置２０には、遠隔監視システム１が提供するサービスを利用するためのアプリケーションが予めインストールされている。映像再生装置２０のユーザは、ＵＩ部を操作してアプリケーションを起動し、映像記録装置１０と自装置とを紐付けるための操作を行う。まず、映像再生装置２０のプロセッサは、映像記録装置１０から識別情報を読み取る。識別情報は、映像記録装置１０の本体外部に視覚的な情報（例えば文字列又はＱＲコード（登録商標）等の画像コード）として記載されている。あるいは、識別情報は、本体に内蔵されている不揮発性メモリ又はＲＦＩＤタグにデータとして電子的に記録されてもよい。映像再生装置２０は、識別情報の記録方式に適合した方法で（例えば、視覚的な情報ならカメラで、ＲＦＩＤタグに記録されているデータならＲＦＩＤリーダーで）その識別情報を読み取る。

　ステップＳ５０１において、映像再生装置２０は、ユーザの操作に応じて、映像記録装置１０の識別情報及び映像再生装置２０を識別する識別情報をサーバ３０に送信する。ステップＳ５０２において、サーバ３０は、映像記録装置１０を識別する識別情報と映像再生装置２０を識別する識別情報とを対応付けて記憶装置３０３等に記憶されたデータベースに記憶（登録）する。なお、映像記録装置１０と映像再生装置２０との紐付けは、１対１で行われてもよく、また、複数対複数で行われてもよい。また、識別情報の登録を行う端末は映像再生装置２０に限られず、他の端末により登録が行われてもよい。

２－２．撮影
　映像記録装置１０は、被保護者に携帯される。電源がオンになっている間、カメラ１０２は継続的に映像記録装置１０の周囲を撮影する。撮影された動画は、記憶装置１０６に記憶される。

　図６は、映像記録装置１０における処理の流れを例示するシーケンスチャートである。ここでは、映像のある１枚のフレーム画像の映像信号又は画像データに対する処理の流れを示す。カメラ１０２は、周囲を撮影した映像信号を出力する（ステップＳ１０１）。フレームメモリ１０３は、例えば直近の２フレームぶんのフレーム画像の画像データを記憶する（ステップＳ１０２）。フレームメモリ１０３に記憶されるデータはラスタデータであり、画素毎の階調値を示す。画像処理回路１０４は、フレームメモリ１０３に記憶されている最新のフレーム画像に対し、顔認識処理を行う（ステップＳ１０３）。顔認識処理は例えば、フレーム画像から抽出される特徴を予め定められた照合パターンと照合し、照合結果が予め定められた条件を満たす部分（領域）を抽出することにより行われる。画像処理回路１０４は、フレームメモリ１０３に記憶されている最新のフレーム画像のうち、顔と認識された部分を別の画像へ置換する置換処理を行う（ステップＳ１０４）。この実施形態において置換処理とは、顔と判断された部分の画像が持つ情報を秘匿する処理、例えば、元の画像を別の画像に差し替えたり、元の画像を判別できない態様に加工したりする画像処理をいう。別の画像とは、例えば、元の画像に対しモザイク処理又はぼかし処理を施した画像である。また、この画像処理は可逆処理であって、処理後のデータに対し所定の処理を施すことにより元のデータが再現可能である。このように映像記録装置１０においては、カメラ１０２から出力される映像信号により示される映像に対しては必ず顔認識処理及び置換処理が施される。

　エンコーダ１０５は、フレームメモリ１０３に記憶されている画像データから、映像データを生成する（ステップＳ１０５）。ここでいう映像データは、所定のデータフォーマット（例えばｍｐ４形式）に従って圧縮されたデータである。エンコーダ１０５は、例えばフレームメモリ１０３に記憶されている連続する２つのフレーム画像を参照して映像データを生成する。エンコーダ１０５は、生成した映像データを記憶装置１０６に出力する。記憶装置１０６は、エンコーダ１０５から出力される映像データを記憶する。記憶装置１０６の記憶容量は有限であるので、空き領域がなくなった場合、記憶装置１０６は、古い映像データから順に、新たな映像データで上書きする。すなわち、記憶装置１０６には常に、最近の一定期間ぶんの映像データが保存される。

　映像記録装置１０の動作モードが緊急モードである場合、エンコーダ１０５から出力される映像データは、通信ＩＦ１０７にも供給される（ステップＳ１０８）。通信ＩＦ１０７は、エンコーダ１０５から出力される映像データをサーバ３０に送信する（ステップＳ１０９）なお、動作モードが通常モードである場合、通信ＩＦ１０７への映像データの供給は行われず、サーバ３０への映像データの送信は行われない。

２－３．動作モード切替
　映像記録装置１０は、所定のイベントを契機として動作モードを切り替える。この実施形態では、動作モードは、ユーザ（被保護者）がボタン１０８を押下したことを契機として切り替えられる。具体的には、映像記録装置１０は、ボタン１０８が押下されると動作モードを緊急モードに切り替える。

２－４．緊急モード
　図７は、遠隔監視システム１の緊急モードにおける動作を例示するシーケンスチャートである。ステップＳ２０１において、映像記録装置１０はサーバ３０へ映像データを送信する。サーバ３０は映像記録装置１０から映像データを受信する。送信される映像データには、送信元である映像記録装置１０を識別する識別情報が付されている。ステップＳ２０２において、サーバ３０は、受信された映像データに付された識別情報を、映像記録装置１０を識別する識別情報と映像再生装置２０を識別する識別情報とが互いに紐付けられて記憶されたデータベースから検索し、送信元である映像記録装置１０に対応する映像再生装置２０を特定する。この処理により、例えば、映像記録装置１０を携帯している児童の母親のスマートフォンと父親のスマートフォンとが映像再生装置２０として特定される

　ステップＳ２０３において、サーバ３０は、映像データを特定された映像再生装置２０に送信（すなわちストリーミング配信）する。映像再生装置２０は、サーバ３０から映像データを受信し、受信した映像データの表す映像を自装置のＵＩ部に表示する。

　図８は映像再生装置２０において表示されるストリーミング画面ＳＣ１を例示する図である。図８の例では、映像記録装置１０のカメラ１０２に撮影された映像において顔認識部１５３により顔と判断された部分がモザイク処理（図では黒単色の楕円画像で表す）されている。このストリーミング画面においては、顔の部分の領域が置換処理され、それ以外の領域は加工されていない。この実施形態では、通行人等のプライバシーを保護しつつ、被保護者の周囲の状況を保護者が容易に把握することができる。

　このストリーミング画面は、ウインドウＷ１、領域Ａ１、ボタンＢ１、及びボタンＢ２を含む。ウインドウＷ１は、ストリーミング配信される映像を表示するための領域である。領域Ａ１は、被保護者の現在位置を表示するための領域である。この例においては、被保護者の現在位置は地番を用いて表される。ボタンＢ１は、関係機関に通報を行うためのＵＩオブジェクトである。ここでいう関係機関は、警察等の捜査機関、民間警備会社、消防、及び病院の少なくとも１つを含む。通報先である関係機関の連絡先は、例えば、保護者により事前に設定される。この例において、ボタンＢ１が選択されると、映像再生装置２０において通話アプリケーションが起動し、あらかじめ登録された関係機関に自動的に電話をかける。

　あるいは、関係機関の通報システムと遠隔監視システム１とが接続されている又は連携している場合、サーバ３０は、関係機関の通報システムに対し直接、通報を行ってもよい。この通報は、例えば、被保護者の現在位置を示す位置情報、被保護者の属性情報（被保護者の写真及び氏名等）、通報した保護者の属性情報（氏名及び連絡先等）を含む。サーバ３０は、この関係機関の通報システムに対し、映像記録装置１０から送信される映像をストリーミング配信してもよい。

　ボタンＢ２は、緊急モードを終了するよう指示するためのＵＩオブジェクトである。ボタンＢ２が選択されると、映像再生装置２０は、サーバ３０に対して緊急モードを終了するよう指示する。映像再生装置２０から指示を受信すると、サーバ３０は動作モードの変更を指示する制御信号を映像記録装置１０へ送信する。サーバ３０から制御信号を受信すると、映像記録装置１０は、動作モードを緊急モードから通常モードに変更する。動作モードが通常モードに変更されると、映像データのストリーミング配信は停止される。なお、記憶装置１０６への映像データの蓄積は続行される。

　映像記録装置１０は、緊急モードにおいても、通常モードと同様に映像データを記憶装置１０６に蓄積する。記憶装置１０６に蓄積された映像データは、他の装置（例えば、サーバ３０又は映像再生装置２０）からの要求に応じて、その装置に送信（出力）される。あるいは、サーバ３０が、ストリーミング配信をする映像データを蓄積してもよい。記憶装置１０６又はサーバ３０に蓄積された映像データには顔部分に置換処理が施されているが、映像記録装置１０により施された置換処理は可逆的な処理（元に戻すことが可能な処理）である。サーバ３０は、この逆処理に用いられるデータ（例えば、暗号鍵及びアルゴリズム）を記憶しており、このデータを用いて逆処理を行う。逆処理を行うと、映像において顔に相当する部分はモザイクが除去され、元の映像が得られる。こうして、撮影された映像に映っている人物を特定する等が可能である。犯罪行為、犯罪未遂、又はこれらの準ずる行為があった場合において、例えば捜査機関から要請があったときは、このように緊急モード時の映像を証拠として捜査機関に提出することができる。

　映像記録装置１０に蓄積される映像データは、全て人物の顔の部分が他の画像に置換処理されたデータである。したがって、仮に悪意ある者がこの映像データを映像記録装置１０から取り出したとしても、人物の顔の部分は他の画像に置換されているので、そこに写っている者のプライバシーは保護される。このように、映像記録装置１０によれば、プライバシーを保護しつつ、被保護者周辺の映像を記録することができる。

　また、上述したように、被保護者により携帯される映像記録装置１０にはカメラ１０２が設けられている。他者が見れば「撮影されているな」ということが分かるため被保護者が映像記録装置１０を携帯するだけで、一種の犯罪抑止効果が得られることが期待される。

３．変形例
　本発明は上述の実施形態に限定されるものではなく、種々の変形実施が可能である。以下、変形例をいくつか説明する。以下の変形例のうち２つ以上のものが組み合わせて用いられてもよい。

３－１．変形例１（緊急モードへの切り替えの契機）
　上述の実施形態では、ユーザがボタン１０８を押下したことを契機として、動作モードが通常モードから緊急モードに切り替えられた。緊急モードへの切り替えの契機となる所定のイベントは、上述した実施形態で示したものに限られない。例えば、映像記録装置１０は、映像、音声、及びモーションの少なくともいずれか１つの解析結果、映像記録装置１０の位置を示す位置情報、及び／又は、映像再生装置２０等の他の装置から受信される情報（例えば切替要求）、に従って緊急モードへの切り替えを行ってもよい。

　具体的には、緊急モードへの切り替えの契機となる所定のイベントは、例えば以下の（a）～（ｈ）の少なくとも１つに示すものであってもよい。
（ａ）映像記録装置１０のユーザ（被保護者）に大人が話しかけてきたとき。
（ｂ）映像記録装置１０のユーザ（被保護者）に大人が話しかけてきたときであって、その大人が知り合いでないとき。
（ｃ）「助けて」等、特定のキーワードが検知されたとき。
（ｄ）映像記録装置１０のユーザ（被保護者）が倒れた（転んだ）場合であって、モーションセンサ１０９により特定された倒れ方のパターンから判定される症状が特定症状であるとき。
（ｅ）映像再生装置２０のユーザ（保護者）から強制的に緊急モードの起動が指示されたとき。
（ｆ）映像再生装置２０が、予め設定された安全エリアの外に出たとき。
（ｇ）撮影している画像を解析したＡＩ（artificial intelligence）が危険であると判断したとき。
（ｈ）災害が発生したとき。

　上記（ａ）～（ｈ）の例について、以下に図面を参照しつつ説明する。

　図９は、この変形例に係る遠隔監視システム１Ｂの機能構成を例示するブロック図である。遠隔監視システム１Ｂにおいて、映像記録装置１０は、動作モードの切り替えを周辺の状況、及び／又は、他の端末（映像再生装置２０等）からの指示に応じて自動的に（又は自発的に）行う。この例において、被保護者周辺の状況は、映像、音声、及びモーションの少なくとも１つを用いて判断される。

　図９の遠隔監視システム１Ｂが図２の遠隔監視システム１と異なる点は、映像記録装置１０が解析手段５３、集音手段５１、モーション検知手段５２、受信手段５４、及び取得手段５６を有する点である。解析手段５３は、一時記憶手段１２に記憶されたフレーム画像を用いて、映像記録装置１０周辺の状況を解析する。集音手段５１は、周囲から集音した音信号を出力する。モーション検知手段５２は、映像記録装置１０のモーションを示すモーション信号を出力する。受信手段５４は、他の装置（映像再生装置２０又はサーバ３０等）から情報を受信する。受信される情報は例えば、緊急モードへの切り替え指示、又は、安全なエリアを示す情報、である。取得手段５６は、ＧＰＳ受信部１１０により受信されたＧＰＳ信号から特定される、映像記録装置１０の位置情報を取得する。

　映像記録装置１０の制御装置１０１が記憶装置１０６に記憶されたプログラムを実行することにより、解析手段５３及び取得手段５６が実装される。プログラムを実行している制御装置１０１は解析手段５３及び取得手段５６の一例である。マイク１１１は集音手段５１の一例である。モーションセンサ１０９はモーション検知手段５２の一例である。通信ＩＦ１０７は受信手段５４の一例である。

　遠隔監視システム１Ｂにおいて、解析手段５３は、一時記憶手段１２に記憶されたフレーム画像、集音手段５１から出力される音信号、及び／又はモーション検知手段５２から出力されるモーション信号を用いて、映像記録装置１０周辺の状況を解析する。具体的には、解析手段５３は、取得される映像、音声、及び／又はモーションから、動作モードを緊急モードに切り替えるべき、危険が迫った（又はその可能性がある）状況であるか判断する。切り替え手段１７は、解析手段５３による解析結果に応じて動作モードを切り替える。例えば、カメラ１０２により撮影された映像、マイク１１１により集音された音声、及び／又はモーションセンサ１０９による検知結果が予め定められた条件を満たす場合に、解析手段５３は緊急モードへの切り替えを切り替え手段１７に指示する。緊急モードへ切り替えるか否かの判定は、例えば学習モデルを用いたディープラーニング等のＡＩの手法が用いられてもよい。ＡＩで用いられる機械学習のアルゴリズムは、教師あり学習のアルゴリズムに限らず、教師なし学習、半教師あり学習、強化学習、表現学習等の他の機械学習用のアルゴリズムであってもよい。また、機械学習のアルゴリズムが用いられるのに限らず、ルールベースのアルゴリズムを用いた判定が行われてもよい。例えば、映像の特徴、音声の特徴、モーションの検知結果が予め定められた照合パターンと照合されることにより、上記判定が行われてもよい。

　例えば、撮影された映像の特徴及び／又は集音された音声の特徴がＡＩに入力として与えられる。解析手段５３は、ディープラーニング等のＡＩ技術を用いて、ユーザ（被保護者）に話しかけてきた相手が大人であるかを推定する。話しかけてきた相手が大人であると推定される場合、切り替え手段１７は、動作モードを緊急モードに切り替える（上記（ａ）の例）。一方、話しかけてきた相手が子供である場合、切り替え手段１７は動作モードを通常モードのまま切り替えない。

　話しかけてきた相手が大人であるか否かの判定は、ディープラーニング等のＡＩ技術以外の手法が用いられてもよい。例えば、上記判定は、映像の特徴及び／又は音声の特徴を予め定められた照合パターンと照合することにより行われてもよい。この場合、解析手段５３は、映像の特徴及び／又は音声の特徴を予め定められた照合パターンと照合し、その類似度が予め定められた条件を満たす場合に、切り替え手段１７に緊急モードへの切り替えを指示する。照合パターンは例えば、大人の顔の特徴量を示すパターン、及び子供の顔の特徴量を示すパターン、大人の声の特徴量を示すパターン、及び子供の声の特徴量を示すパターンである。この場合、解析手段５３は、カメラ１０２により撮影された映像が、大人に対応する照合パターンと子供に対応する照合パターンとのどちらに近いか（類似度が高いか）を判定するとともに、マイク１１１により集音された音声が大人に対応する照合パターンと子供に対応する照合パターンとのどちらに近いか（類似度が高いか）を判定し、それらの類似度を用いて、話しかけてきた人物が大人であるか子供であるかを推定する。

　また、この場合において、映像記録装置１０は、話しかけてきた大人が知り合いでない場合にのみ、緊急モードに切り替える制御を行ってもよい（上記（ｂ）の例）。この場合、ユーザ（被保護者）の知り合いである人物の顔画像の特徴及び／又は声の特徴（例えば顔写真又は音声データ）が事前に映像記録装置１０に登録され、映像記録装置１０は、話しかけてきた大人が知り合いであるか否か、この情報に基づいて判断する。事前登録は、映像記録装置１０により行われてもよいし、また、他の端末（例えば映像再生装置２０）が用いられて行われてもよい。映像記録装置１０が用いられる場合、ユーザにより所定の操作が行われると、カメラ１０２が撮影し、撮影された画像に対し顔認識手段１３が顔認識処理を行い、解析手段５３が撮影された顔画像の特徴を表す照合用データを生成し、生成した照合用データを記憶装置１０６に記憶する。所定の操作とは例えば、ボタン１０８の長押し、又はボタン１０８の所定回数（例えば２回）連続押し、である。映像再生装置２０等の他の端末により事前登録が行われる場合、映像記録装置１０は、他の端末から事前登録要求を受信すると、受信された事前登録要求に含まれる画像データを解析して照合用データを生成し、生成した照合用データを記憶装置１０６に記憶する。

　事前登録がなされている場合、解析手段５３は、ユーザ（被保護者）に大人が話しかけてきたと推定された場合に、カメラ１０２により撮影された顔画像の特徴を記憶装置１０６に記憶された照合用データと照合し、話しかけてきた相手が知り合いであるかを判定する。知り合いでない場合、切り替え手段１７は、動作モードを緊急モードに切り替える（上記（ｂ）の例）。一方、話しかけてきた相手が知り合いである場合、切り替え手段１７は動作モードを通常モードのまま切り替えない。

　また、解析手段５３がマイク１１１により集音された音声を解析して音声の特徴を抽出し、抽出された特徴がＡＩに入力として与えられ、ディープラーニング等のＡＩ技術を用いて、特定のキーワード（「助けて」等）がユーザにより発せられたか否かが判定されてもよい。特定のキーワードは、悲鳴を表す音声の特徴を表すものであってもよい。この場合、ユーザが特定のキーワード（「助けて」等）を発した場合、又はユーザが悲鳴をあげた場合、解析手段５３がその旨を検知し、切り替え手段１７に緊急モードへの切り替えを指示する（上記（ｃ）の例）。

　特定のキーワードが発せられたか否かの判定は、ディープラーニング等のＡＩの手法が用いられるものに限られない。例えば、上記判定は、音声の特徴を予め定められた照合パターンと照合することにより行われてもよい。この場合、解析手段５３は、抽出された特徴と予め定められた照合パターンとの照合結果が予め定められた条件を満たす場合に、切り替え手段１７に緊急モードへの切り替えを指示する。照合パターンは例えば、「助けて」等の特定のキーワードの音声の特徴を表すデータである。また、照合パターンは例えば、悲鳴を表す音声の特徴を表すデータであってもよい。解析手段５３は、マイク１１１により集音された音声の特徴を照合パターンと照合し、両者の一致度が所定の閾値を上回る場合に、切り替え手段１７に緊急モードへの切り替えを指示する。

　また、モーションセンサ１０９の検知結果により特定される映像記録装置１０のモーションの特徴量を用いて緊急モードへの切り替えが行われてもよい。例えば、モーションセンサ１０９の検知結果がＡＩに入力として与えられ、ディープラーニング等のＡＩ技術を用いて、ユーザ（被保護者）が倒れた（転んだ）と推定される場合に、解析手段５３が緊急モードへの切り替えを切り替え手段１７に指示する。

　また、他の例として、ユーザ（被保護者）が倒れた（転んだ）と推定される場合において、解析手段５３が倒れ方のパターンから症状を特定し、特定の症状の場合に緊急モードへの切り替えが行われてもよい。症状の特定は、例えば、モーションセンサ１０９からの出力がＡＩに入力として与えられ、学習モデルを用いたディープラーニング等のＡＩの手法が用いられることにより行われる。特定の症状であると推定された場合、解析手段５３は緊急モードへの切り替えを切り替え手段１７に指示する（上記（ｄ）の例）。

　また、モーションセンサ１０９の検知結果を用いた緊急モードへの切り替え制御として、例えば、モーションセンサ１０９からの出力により特定される映像記録装置１０の移動速度が予め設定された閾値以上である場合に、緊急モードへの切り替えが行われてもよい。この態様によれば、例えば車等の乗り物にのせられることにより子供の歩行速度よりもはるかに速い速度で映像記録装置１０が移動している場合、緊急モードへの切り替えが自動的に行われる。

　また、他の例として、モーションセンサ１０９の検知結果がＡＩに入力として与えられ、機械学習等のＡＩ技術を用いて、映像記録装置１０が捨てられたり落ちたりしたと推定される場合、又は、映像記録装置１０が小刻みに振動している場合（例えば、映像記録装置１０を装着したユーザ（又は映像記録装置１０を把持しているユーザの手）が震えている場合）に緊急モードへの切り替えが行われてもよい。映像記録装置１０が捨てられたり落ちたりした場合とは、例えば、モーションセンサ１０９の検知結果により、映像記録装置１０が所定時間以上の期間にわたって等加速度運動を行った（落下した）後、物体（地面など）に衝突した場合が検知された場合である。この態様によれば、例えば子供が危険な状態であるにも関わらずボタン１０８を押下できない（押下することを忘れている）ような場合であっても、緊急モードへの切り替えが自動的に行われる。

　また、映像記録装置１０は、他の装置（例えば映像再生装置２０、又はサーバ３０）から緊急モードへの切り替え要求を受信した場合に緊急モードへの切り替えを行ってもよい。例えば、約束をした時刻になっても被保護者が帰ってこない場合等、映像再生装置２０のユーザ（保護者）は、映像再生装置２０を用いて映像記録装置１０を緊急モードにするための操作を行う。映像再生装置２０はユーザの操作に従い、緊急モードへの切り替え要求を映像記録装置１０に送信する。映像記録装置１０の受信手段５４により切り替え要求が受信されると、切り替え手段１７は、動作モードを緊急モードに切り替える制御を行う（上記（ｅ）の例）。この機能により、被保護者が子供である場合だけでなく、例えば老人の徘徊等にも対応し易い。

　また、映像記録装置１０は、災害の発生を示す情報が受信された場合に緊急モードへの切り替えを行ってもよい。災害の発生を示す情報は、サーバ３０等の他の装置から受信される。受信手段５４により災害の発生を示す情報が受信されると、切り替え手段１７は、動作モードを緊急モードに切り替える制御を行う（上記（ｈ）の例）。この場合、被災地に位置している映像記録装置１０は全て緊急モードに切り替わる。この例によれば、所定の基準以上の災害（例えば震度４以上の地震）が発生した地域に自分の家族（例えば子供又は親）がいた場合、自動的にストリーミングが開始され、その家族の安否を容易に確認することができる。災害の発生を示す情報は、例えば、災害に関する情報を提供するＡＰＩ（Application Programming Interface）を利用して取得することができる。災害に関する情報は、映像記録装置１０自身がＡＰＩを利用して外部サービスから直接、取得してもよい。あるいは、サーバ３０が外部サービスから災害に関する情報を取得し、映像記録装置１０に対して緊急モードの起動を指示してもよい。災害時にサーバ３０から緊急モード起動の指示を受けることは、映像記録装置１０が災害の発生を示す情報を間接的に取得することに相当する。なお、災害発生時には通信の輻輳が発生することが予想されるため、災害以外の場合における緊急モードよりもデータ量を少なくする処理（例えば、フレームレートを下げる、解像度を下げる、又は色数を下げる等）を映像記録装置１０又はサーバ３０において行ってもよい。

　また、映像記録装置１０は、自装置の位置が事前に設定された安全エリアの外に出た場合に緊急モードへの切り替えを行ってもよい。安全エリアの設定は例えば、遠隔監視システムを運営する事業者により行われる。また、安全エリアの設定は映像再生装置２０のユーザにより行われてもよい。この場合、映像再生装置２０は自装置のＵＩ部に地図を表示し、ユーザは、表示された地図上の位置を指定する等の操作を行うことにより、安全エリアの設定を行う。なお、ユーザが安全エリアを設定するのに代えて、ユーザが安全でないエリアを設定してもよい。この場合、ユーザにより指定されたエリア以外のエリアが安全なエリアとして特定される。

　ユーザにより安全エリアが設定されると、映像再生装置２０は設定された安全エリアを示す情報を映像記録装置１０に送信する。映像記録装置１０は受信された情報を記憶装置１０６に記憶する。映像記録装置１０が通常モードで動作している期間において、解析手段５３は、取得手段５６により取得される位置情報と記憶装置１０６に記憶された情報とから、自装置が安全なエリア内にあるかを判定する。自装置が安全なエリアの外に出たと判定された場合、解析手段５３は、緊急モードへの切り替えを切り替え手段１７に指示する（上記（ｆ）の例）。この機能により、被保護者が子供である場合だけでなく、例えば老人の徘徊等にも対応し易い。

　また、カメラ１０２により撮影されている画像からＡＩにより危険の有無が判定され、危険であると判定された場合に動作モードが緊急モードに切り替えられてもよい。この場合、カメラ１０２により撮影された映像の特徴がＡＩに入力として与えられる。解析手段５３は、ディープラーニング等のＡＩ技術を用いて、映像記録装置１０の周辺における危険の有無を判定する。危険があると判定された場合、解析手段５３は、緊急モードへの切り替えを切り替え手段１７に指示する（上記（ｇ）の例）。

　このように、上述した複数の情報の各々から、又はいくつかの情報の組み合わせから、映像記録装置１０の周辺の状況を解析することができる。映像記録装置１０周辺の状況には、被保護者本人の状況、被保護者の周辺にいる他者の状況、及び被保護者周辺の環境の状況が含まれる。被保護者本人の状況は、例えば、非保護者が悲鳴を上げた、被保護者が倒れた、又は被保護者が走っている、という状況である。他者の状況は、例えば、他者が怒声を上げた、他者が叫びながら近づいてきた、又は他者が走りながら近づいてきた、という状況である。周辺環境の状況は、例えば、交通量の多い道路脇の歩道、街灯の少ない道、又は人通りの少ない道、という状況である。この態様によれば、被保護者に危険が迫った状況にいる可能性がある場合に、被保護者によりボタン１０８が押下されていない場合であっても、映像記録装置１０は自動的に（又は自発的に）緊急モードに移行する。

　また、他の例として、例えば、サーバ３０は、現在時刻を考慮して状況を判断してもよい。この場合、サーバ３０は、時間帯と照合パターンとが対応付けて記録されたテーブルを記憶する。サーバ３０は、このテーブル及び現在時刻を参照し、緊急モードへの切り替えを行うか否か判断する。例えば、人通りの少ない道を歩いている場合、昼間は緊急モードに自動的に移行せず、夜間は緊急モードに自動的に移行してもよい。なお、このテーブルが、機械学習等により自動的に、又は映像再生装置２０のユーザにより手動で、編集又は更新されてもよい。また、この例において、パターン照合に代えて機械学習の手法が用いられてもよい。用いられる機械学習のアルゴリズムは、教師あり学習のアルゴリズムであってもよく、また、教師なし学習、半教師あり学習、強化学習、表現学習等の他の機械学習用のアルゴリズムであってもよい。

３－２．変形例２
　図１０は、この変形例に係る遠隔監視システム１Ｃの機能構成を例示するブロック図である。遠隔監視システム１Ｂにおいて、映像記録装置１０は、サーバ３０に送信する映像データのデータ量を削減するための処理を行う。この例において、映像記録装置１０は、顔から所定の距離、離れた部分についてデータ量を削減する処理を行う。

　図１０の遠隔監視システム１Ｃが図２の遠隔監視システム１と異なる点は、処理手段５５を有する点である。処理手段５５は、フレーム画像のうち顔認識手段１３により顔と判断された部分から所定の距離離れた部分のデータ量を低減する処理を行う。データ量を低減する処理は例えば、解像度を落とす処理、階調数又は色数を落とす処理である。専用の画像処理回路（図示略）又はこの処理を行うプログラムを実行している制御装置１０１が処理手段５５の一例である。

　遠隔監視システム１Ｃにおいて、生成手段１５は、処理手段５５及び置換手段１４により処理及び置換をされたフレーム画像を圧縮して映像データを生成する。この態様によれば、ストリーミング配信の際のデータ量が削減される。なお、処理手段５５及び置換手段１４の処理の順序はどちらが先でもよい。なお、この態様において、送信手段１８から外部装置に送信される映像データに対してのみ処理手段５５による処理が行われるように構成し、永続記憶手段１６は、処理手段５５により処理されていない映像データを記憶してもよい。

３－３．変形例３
　図１１は、この変形例に係る遠隔監視システム１Ｄの機能構成を例示するブロック図である。遠隔監視システム１Ｄにおいて、映像記録装置１０は、映像信号に対し周辺の状況を示す付加情報（又はアノテーション）を付加する。

　図１１の遠隔監視システム１Ｄが図２の遠隔監視システム１と異なる点は、解析手段５３、付加手段５７、取得手段５６、受信手段５８、マッピング手段３４、及び送信手段３５を有する点である。プログラムを実行している制御装置１０１が、解析手段５３、及び付加手段５７の一例である。プログラムを実行しているプロセッサ３０１が、マッピング手段３４の一例である。

　映像記録装置１０において、解析手段５３は、一時記憶手段１２に記憶されたフレーム画像を用いて、映像記録装置１０周辺の状況を解析する。周辺の状況は例えば、不審者が出現した、ひったくりが出現した、人通りが少ない、暗い道、等である。付加手段５７は、解析手段５３により解析された状況を示す付加情報を映像データに付加する。取得手段５６は、ＧＰＳ受信部１１０により受信された映像記録装置１０の位置情報を取得する。送信手段１８は、付加情報が付加された映像データを、サーバ３０に送信する。また、送信手段１８は、映像データの送信と共に、又は映像データの送信とは独立して定期的に、位置情報をサーバ３０に送信する。

　サーバ３０において、マッピング手段３４は、付加情報により示される状況を、位置情報を用いて地図上にマッピングする。サーバ３０は、複数の映像記録装置１０の各々から、付加情報を受信する。地図には、複数の映像記録装置１０から得られた付加情報がマッピングされる。サーバ３０は、記憶手段３１にこれら複数の付加情報を、対応する位置情報とともに記憶する。マップ上において所定の領域（例えば、不審者の出現が所定数以上記録されている領域）に位置する映像記録装置に対して、送信手段３３は、動作モードを緊急モードに移行させる指示を送信する。映像記録装置１０において、受信手段５８がこの指示を受信する。切り替え手段１７は、この指示に従って動作モードを緊急モードに移行する。

　図１２は、遠隔監視システム１Ｄの動作を例示するシーケンスチャートである。ここでは、それぞれ異なる被保護者（それぞれ対応する保護者は異なる）に携帯される２台の映像記録装置１０Ａ及び映像記録装置１０Ｂを考える。図１２のフローの開始前の時点において、映像記録装置１０Ａは緊急モードで動作しており、映像記録装置１０Ｂは通常モードで動作している。

　ステップＳ３０１において、映像記録装置１０Ａの解析手段５３は、一時記憶手段１２に記憶されたフレーム画像を用いて映像記録装置１０周辺の状況を解析する。ステップＳ３０２において、取得手段５６は、ＧＰＳ受信部１１０により受信される映像記録装置１０の位置情報を取得する。ステップＳ３０３において、付加手段５７は、解析手段５３により解析された状況を示す付加情報及び位置情報を映像データに付加する。付加情報及び位置情報が付加された映像データは、ステップＳ２０１において、映像記録装置１０からサーバ３０に送信される。映像記録装置１０から送信された映像データはサーバ３０により受信される。サーバ３０は、複数の映像記録装置１０から、付加情報及び位置情報が付加された映像データを受信する。

　ステップＳ３０４において、マッピング手段３４は、付加情報により示される状況を、位置情報を用いて地図上にマッピングする。このマッピング処理には、１台の映像記録装置１０から受信された映像データに付されていた位置情報と付加情報だけでなく、他の複数の映像記録装置１０から受信された映像データに付された位置情報及び付加情報も用いられる。マッピングにより、例えば本日午前９時００分から午前９時１０分の間において、東京都ｘｘ区ｙｙ丁目付近において複数の映像記録装置１０によって不審者の出現が検知されている、といった情報がサーバ３０に蓄積される。この情報に基づき、サーバ３０は、地図上において危険地域を定義することができる。サーバ３０は、危険地域を規定する情報を記憶手段３１に記憶する。

　なお、映像記録装置１０Ａは緊急モードで動作しているので、サーバ３０に送信される映像データは対応する映像再生装置２０にストリーミング配信されるが、この点は図１２においては図示を省略する。

　映像記録装置１０Ｂは、映像記録装置１０Ａとは独立して自身の位置情報を例えば定期的にサーバ３０に送信する（ステップＳ３０５）。映像記録装置１０Ｂから位置情報を受信すると、サーバ３０は、映像記録装置１０Ｂの現在位置が、記憶手段３１に記憶されている情報により規定される危険地域と所定の位置関係（例えば、危険地域内又は危険地域までの距離がしきい値以下）であるか判断する（ステップＳ３０６）。映像記録装置１０Ｂの現在位置が危険地域と所定の位置関係にあると判断された場合、送信手段３３は、動作モードを緊急モードに移行する指示を映像記録装置１０Ｂに送信する（ステップＳ３０７）。

　映像記録装置１０Ｂにおいて、受信手段５８がサーバ３０からの指示を受信する。この指示を受信すると、切り替え手段１７は、動作モードを通常モードから緊急モードに移行する（ステップＳ３０８）。緊急モード時の処理は既に説明したとおりである。なおこの場合において、対応する映像再生装置２０の画面上において、「この地域で不審者目撃情報多数あり」等、危険地域に関連する情報を表示してもよい。この情報は、ストリーミング配信される映像データと共に映像再生装置２０に送信される。

　さらにこの場合において、サーバ３０は、映像記録装置１０Ｂに対応する映像再生装置２０に映像をストリーミング配信する際に、映像記録装置１０Ｂの現在位置周辺に関連する付加情報を送信してもよい。この付加情報を受信すると、映像再生装置２０は、マップ上にこの付加情報を表示する。

　映像再生装置２０は、サーバ３０から地図データ（及び映像データ）を受信し、受信した地図データの表す地図を自装置のＵＩ部に表示する。映像データがストリーミング配信されている場合、映像データの表す映像及び／又は地図データの表す地図がＵＩ部に表示される。

　図１３は、映像再生装置２０のＵＩ部に表示される画面ＳＣ２を例示する図である。画面ＳＣ２には、被保護者が携帯している映像記録装置１０の周辺を表す地図が表示されるとともに、地図上における映像記録装置１０の位置を示すアイコンＩ１１が表示される。更に、サーバ３０によりマッピングされた付加情報を用いて規定される危険地域が地図上に表示される。図１３の例ではハッチングされた領域Ｚ１が危険地域である。映像再生装置２０のユーザは、ＵＩ部に表示される画面を確認することで、被保護者の周囲の状況を容易に把握することができる。

３－４．変形例４
　実施形態において、通常モードから緊急モードに切り替えられたとき、その時点（すなわち緊急モードに切り替えられた時点）からの映像データをサーバ３０に送信する例を説明した。しかし、被保護者の周辺の状況が所定の条件を満たすときには、映像記録装置１０は、緊急モードに切り替えられる前の時点に遡って映像データを送信してもよい。所定の条件を満たすときとは、解析手段５３により解析された状況が、特定の犯罪行為が発生したと推測される状況であるときをいう。例えば、被保護者の前からバイクに乗ってきた犯人に、被保護者が所持するカバンをひったくられた状況を考える。この場合、解析手段５３が、例えば被保護者が発した「あっ、ひったくり！」という声を検知したことを契機として、映像記録装置１０が緊急モードに切り替わったとすると、そこから映像データをサーバ３０に送信したのでは既に犯人が去った後で、事件の証拠としては不十分である。そこで、ひったくり事件が発生したと解析手段５３が判断した場合、送信手段１８は、所定の時間遡って（例えば、１分前から）映像データをサーバ３０に送信する。この例によれば、より有用な情報をサーバ３０に送信することができる。

　なお緊急モードに切り替えられる前の時点に遡って映像データを送信するのは、解析手段５３により解析された状況が、特定の犯罪行為が発生したと推測される状況に限定されない。例えば、ボタン１０８を介して緊急モードへの切り替えが指示された場合はその時点から映像データを送信し、解析手段５３による解析を契機として（すなわち被保護者の操作によらず映像記録装置１０が自発的に）緊急モードへの切り替えをした場合は、切り替えの前に遡って映像データを送信してもよい。あるいは逆に、映像記録装置１０は、ボタン１０８を介して緊急モードへの切り替えが指示された場合はその時点より前に遡って映像データを送信し、解析手段５３による解析を契機として緊急モードへの切り替えをした場合はその時点から映像データを送信してもよい。

３－５．変形例５（災害関連）
　映像記録装置１０は、災害等の特別な事象が発生した場合において、通常モードの場合と異なる処理を実行してもよい。例えば、災害時に臨時で用いられるサーバを別途用意しておき、そのサーバが災害対策に関するサービスを提供してもよい。

　図１４は、この変形例に係る遠隔監視システム１Ｅの構成を例示する図である。遠隔監視システム１Ｅは、映像記録装置１０、映像再生装置２０、及びサーバ３０に加えて、臨時サーバ４０を備える。臨時サーバ４０は、災害等の特別な事象が発生した場合に用いられるサーバである。また、この変形例において、映像記録装置１０は、音声を出力するスピーカ（図示略）を備える。

　図１５は、遠隔監視システム１Ｅの動作を例示するシーケンスチャートである。災害等の特別な事象が発生した場合、映像記録装置１０は、臨時サーバ４０等の他の装置から災害等の発生を示す情報（以下「緊急情報」という）を受信する（ステップＳ４０１）。緊急情報を受信した場合、映像記録装置１０は動作モードを緊急モードに切り替える制御を行う（ステップＳ４０２）。これにより、被災地に位置している映像記録装置１０は全て緊急モードに切り替わる。

　災害等の発生時においては、映像記録装置１０は、映像再生装置２０ではなく臨時サーバ４０に、カメラ１０２により撮影された映像を表す映像データを送信する（ステップＳ４０３）。臨時サーバ４０は映像記録装置１０から映像データを受信し、記憶装置に蓄積する（ステップＳ４０４）。これにより、臨時サーバ４０には、被災地に位置している複数の映像記録装置１０からの映像データが蓄積される。

　ステップＳ４０５において、臨時サーバ４０は、複数の映像記録装置１０から受信した映像データをもとに被災マップを作成する。被災マップとは、災害に関する情報が地図上にマッピングされたものである。災害に関する情報とは例えば、避難所を示す情報、災害により通行できなくなっている道路を示す情報、通行できるものの落下物などの危険がある場所の情報、給水所の位置を示す情報、津波により浸水の虞がある場所を示す情報、及び避難経路を示す情報、である。

　この例で、臨時サーバ４０は、学習モデルを用いたディープラーニング等のＡＩ技術を用いて、映像データの表す映像を解析して災害に関する情報を生成し、生成した情報を地図上にマッピングすることにより被災マップを生成する。また、臨時サーバ４０は、生成した被災マップに基づき避難経路を特定する。避難経路の特定は、道路、通行できなくなっている箇所、及び避難所の位置を示す情報を用いて行われる。

　臨時サーバ４０は、映像記録装置１０及び映像再生装置２０によりアクセスされる。また、臨時サーバ４０は、映像記録装置１０及び映像再生装置２０以外の他の端末からもアクセス可能である。他の端末は例えば、レスキュー隊が所有している通信端末、又は被災エリアに居る他の被災者のスマートフォンである。臨時サーバ４０は、臨時サーバ４０にアクセスしてきた端末に対し、生成した被災マップに基づく避難経路を示すデータを送信する（ステップＳ４０６）。

　映像記録装置１０及び映像再生装置２０等の端末は、臨時サーバ４０からデータを受信すると、受信したデータの表す情報を出力することにより、ユーザに避難経路の案内を行う（ステップＳ４０７）。データを受信した端末が表示部（ＵＩ部）を備えた端末（映像再生装置２０等）である場合、避難経路を示す画面が表示部に表示される。

　図１６は、表示される被災マップを例示した図である。図において、被災マップｍ１は、ユーザが携帯している映像再生装置２０の周辺を示す地図に、災害に関する情報がマッピングされたものである。図１６の例では、地図上における映像再生装置２０の位置を示すアイコンＩ３１が表示されるとともに、通行できなくなっている位置にアイコンＩ２１が表示される。また、被災マップｍ１には、避難所の位置を示すアイコンＩ２２が表示されるとともに、避難経路を示す矢印Ｉ２３が表示される。映像再生装置２０等の端末のユーザは、表示部に表示される画面を確認することで、避難経路を容易に把握することができる。

　また、映像記録装置１０は、臨時サーバ４０から避難経路を示す情報を受信すると、受信した避難経路を示す情報を出力することにより、ユーザに避難経路の案内を行う。情報の出力は例えば、映像記録装置１０のスピーカから音声が出力されることにより行われる。具体的には、音声で「○○通りを右に進んで△△小学校に避難してください」、といった音声が出力される。あるいは、よりリアルタイムに、映像記録装置１０の位置情報に基づいて「次の角を右に」と案内が出力されてもよい。この場合、映像記録装置１０は、自装置の位置情報と臨時サーバ４０から受信した避難経路を示す情報とから、避難経路を具体的に示す情報を生成し、リアルタイムで音声出力する。映像記録装置１０のユーザは、出力される音声を聴くことで、避難経路を容易に把握することができる。

３－６．他の変形例
　実施形態において、顔と認識された部分に置換される別の画像は、元の画像（すなわち顔の画像）から可逆処理により得られる例を説明した。すなわち、置換後の画像は、置換前の画像を用いて、可逆処理により得られるものであった。しかし、置換後の画像は、置換前の画像を用いて、非可逆処理により得られるものであった。すなわち、置換後の画像から置換前の画像を復元できなくてもよい。例えば、顔以外の情報（音声、服装、持ち物、及び体型等）が鮮明に記録されていれば、捜査期間に提出する証拠としては十分な場合がある。

　映像記録装置１０の動作モードは、通常モード及び緊急モードの２つに限定されない。例えば、映像を間欠的に撮影及び蓄積する省電力モード等、これら２つ以外の動作モードを有していてもよい。

　映像記録装置１０の機能構成は図２で例示したものに限定されない。図２に示した機能の一部が省略されてもよく、また、図示されていない機能が追加されてもよい。また、遠隔監視システム１を構成する装置における機能の分担は、実施形態において例示したものに限定されない。例えば、映像記録装置１０に実装された機能が複数の装置（例えば、映像記録装置１０とサーバ３０）により分担されて提供されてもよい。例えば、上述の実施形態において映像記録装置１０が行っていた顔認識処理をサーバ３０が行ってもよい。また、上述の実施形態において映像記録装置１０の解析手段５３が行っていた解析処理をサーバ３０が行ってもよい。

　また、顔認識手段１３及び置換手段１４は省略されてもよい。この場合、映像記録装置１０が解決すべき課題はプライバシーの保護ではなく、使用者の状況を容易に確認する、ということになる。これは例えば、使用状況が限られる用途（例えば、特定の会社の従業員のみが入れる作業現場での使用）において有用である。

　また、上述の実施形態及び変形例において解析手段５３が行う機械学習のアルゴリズムは、教師あり学習のアルゴリズムに限らず、教師なし学習、半教師あり学習、強化学習、表現学習等の機械学習用のアルゴリズムであってもよい。また、機械学習用のアルゴリズムは、データマイニングやディープラーニング等のアルゴリズムを含んでもよい。また、これらの学習用のアルゴリズムは、例えばニューラルネットワーク、クラスタリング、ベイジアンネットワーク等の各種の技術を用いたものが含まれてもよい。要するに、機械学習用のアルゴリズムは、解析手段５３により取得される何らかのデータとともに処理されて、その処理の結果、ユーザが得たい情報を出力するものであればよい。

　遠隔監視システム１において行われる処理のステップは、上述した実施形態において説明された例に限定されない。処理のステップは、矛盾のない限り、入れ替えられてもよい。また、本発明は、遠隔監視システム１において行われる遠隔監視方法として提供されてもよい。

　映像記録装置１０のハードウェア構成、及びサーバ３０のハードウェア構成は、図３及び図４に例示されたものに限定されない。要求される機能を実現できるものであれば、映像記録装置１０及びサーバ３０は、どのようなハードウェア構成を有していてもよい。特に映像記録装置１０については、実施形態においては専用のハードウェア要素を有する本システム専用の装置である例を説明したが、映像記録装置１０が汎用のコンピュータ装置（例えばスマートフォン）であり、専用のハードウェア要素（画像処理回路１０４）を用いる代わりにソフトウェア処理により所望の機能を実装してもよい。映像記録装置１０には、汎用のコンピュータ装置を映像記録装置１０として機能させるためのプログラムがインストールされる。

　映像記録装置１０において実行されるプログラム及びサーバ３０において実行されるプログラムは、光ディスク、磁気ディスク、半導体メモリなどの記憶媒体により提供されてもよいし、インターネット等の通信回線を介してダウンロードされてもよい。

Claims

　周囲を撮影した映像信号を出力する撮像手段と、
　前記映像信号により示されるフレーム画像を一時的に記憶する一時記憶手段と、
　前記一時記憶手段に記憶されているフレーム画像に対し顔認識処理を行う顔認識手段と、
　前記フレーム画像のうち前記顔認識手段により顔と判断された部分を別の画像へ置換をする置換手段と、
　前記置換手段により処理されたフレーム画像を圧縮して映像データを生成する生成手段と、
　前記生成手段により生成された映像データを永続的に記憶する永続記憶手段と
　を有する映像記録装置。
　前記別の画像は、可逆処理により元の画像に変換可能な画像である
　請求項１に記載の映像記録装置。
　前記映像記録装置の動作モードを、通常モード及び緊急モードを含む複数の動作モードのうち一の動作モードから別の動作モードに切り替える切り替え手段と、
　前記動作モードが前記緊急モードの場合、所定の外部装置に前記映像データを送信し、当該動作モードが前記通常モードの場合、当該外部装置に当該映像データを送信しない送信手段と
　を有する請求項１又は２に記載の映像記録装置。
　前記一時記憶手段に記憶された前記フレーム画像を用いて、前記映像記録装置周辺の状況を解析する解析手段を有し、
　前記切り替え手段は、前記解析手段による解析結果に応じて前記動作モードを切り替える
　請求項３に記載の映像記録装置。
　前記周囲から集音した音信号を出力する集音手段、又は前記映像記録装置のモーションを示すモーション信号を出力するモーション検知手段を有し、
　前記解析手段は、前記フレーム画像及び前記音信号又は前記モーション信号を用いて、前記映像記録装置周辺の状況を解析する
　請求項４に記載の映像記録装置。
　前記切り替え手段は、災害の発生を示す情報を取得したことに応じて、前記動作モードを前記通常モードから前記緊急モードに移行する
　請求項３に記載の映像記録装置。
　前記フレーム画像のうち前記顔認識手段により顔と判断された部分から所定の距離離れた部分のデータ量を低減する処理を行う処理手段を有し、
　前記生成手段は、前記処理手段及び前記置換手段により前記処理及び前記置換をされたフレーム画像を圧縮して映像データを生成する
　請求項１乃至６のいずれか一項に記載の映像記録装置。
　前記一時記憶手段に記憶された前記フレーム画像を用いて、前記映像記録装置周辺の状況を解析する解析手段と、
　前記解析手段により解析された状況を示す付加情報を前記映像データに付加する付加手段と
　を有する請求項１乃至３のいずれか一項に記載の映像記録装置。
　前記一時記憶手段に記憶された前記フレーム画像を用いて、前記映像記録装置周辺の状況を解析する解析手段と、
　前記解析手段により解析された状況を示す付加情報を前記映像データに付加する付加手段と
　を更に有し、
　前記状況が特定の条件を満たす場合、前記送信手段は、前記動作モードが前記緊急モードに切り替えられる前の時点まで遡って前記映像データを送信する
　請求項３に記載の映像記録装置。
　前記映像データを再生した映像を表示する表示手段を有さない
　請求項１乃至９のいずれか一項に記載の映像記録装置。
　サーバと、
　映像記録装置と
　を有し、
　前記映像記録装置は、
　　周囲を撮影した映像信号を出力する撮像手段と、
　　前記映像信号により示されるフレーム画像を一時的に記憶する一時記憶手段と、
　　前記一時記憶手段に記憶されているフレーム画像に対し顔認識処理を行う顔認識手段と、
　　前記フレーム画像のうち前記顔認識手段により顔と判断された部分を別の画像へ置換をする置換手段と、
　　前記置換手段により処理されたフレーム画像を圧縮して映像データを生成する生成手段と、
　　前記生成手段により生成された映像データを永続的に記憶する永続記憶手段と、
　　前記映像記録装置の動作モードを、通常モード及び緊急モードの複数の動作モードのうち一の動作モードから別の動作モードに切り替える切り替え手段と、
　　前記動作モードが前記緊急モードの場合、前記サーバに前記映像データを送信し、当該動作モードが前記通常モードの場合、当該サーバに当該映像データを送信しない送信手段と
　を有し、
　前記サーバは、
　　前記映像記録装置に対応する映像再生装置を識別する情報を記憶する記憶手段と、
　　前記映像記録装置から前記映像データを受信する受信手段と、
　　前記受信手段により受信された映像データを、前記映像記録装置に対応する前記映像再生装置に送信する送信手段と
　を有する
　遠隔監視システム。
　前記映像記録装置は、
　　前記一時記憶手段に記憶された前記フレーム画像を用いて、前記映像記録装置周辺の状況を解析する解析手段と、
　　前記映像記録装置の位置情報を取得する取得手段と、
　　前記解析手段により解析された状況を示す付加情報及び前記位置情報を前記映像データに付加する付加手段と
　を有し、
　前記サーバは、
　　前記付加情報により示される状況を、前記位置情報を用いて地図上にマッピングするマッピング手段を有し、
　　前記送信手段は、前記状況がマッピングされた地図を前記映像再生装置に送信する
　請求項１１に記載の遠隔監視システム。
　前記映像記録装置において、前記送信手段は、前記位置情報を定期的に前記サーバに送信し、
　前記サーバにおいて、前記送信手段は、前記位置情報により前記映像記録装置が、特定の前記情報がマッピングされた領域と所定の位置関係に入ったことが示された場合、前記動作モードを前記緊急モードに切り替えるための制御信号を送信し、
　前記映像記録装置において、前記切り替え手段は、前記制御信号に応じて前記動作モードを前記緊急モードに切り替える
　請求項１２に記載の遠隔監視システム。
　映像記録装置と通信するサーバが、当該映像記録装置に対応する映像再生装置を識別する識別情報を記憶するステップと、
　前記映像記録装置が、周囲を撮影した映像信号により示されるフレーム画像を一時記憶手段に一時的に記憶するステップと、
　前記映像記録装置が、前記一時記憶手段に記憶されているフレーム画像に対し顔認識処理を行うステップと、
　前記映像記録装置が、前記フレーム画像のうち前記顔と判断された部分を別の画像へ置換をするステップと、
　前記映像記録装置が、前記置換されたフレーム画像を圧縮して映像データを生成するステップと、
　前記映像記録装置が、前記生成された映像データを永続的に記憶するステップと、
　前記映像記録装置が、前記映像記録装置の動作モードを、通常モード及び緊急モードの複数の動作モードのうち一の動作モードから別の動作モードに切り替えるステップと、
　前記映像記録装置が、前記動作モードが前記緊急モードの場合、前記サーバに前記映像データを送信し、当該動作モードが前記通常モードの場合、当該サーバに当該映像データを送信しないステップと、
　前記サーバが、前記映像記録装置から前記映像データを受信するステップと、
　前記サーバが、前記受信された映像データを、前記映像記録装置に対応する前記映像再生装置に送信するステップと
　を有する遠隔監視方法。
　コンピュータに、
　周囲を撮影した映像信号により示されるフレーム画像を一時記憶手段に一時的に記憶するステップと、
　前記一時記憶手段に記憶されているフレーム画像に対し顔認識処理を行うステップと、
　前記フレーム画像のうち前記顔と判断された部分を別の画像へ置換をするステップと、
　前記置換されたフレーム画像を圧縮して映像データを生成するステップと、
　前記生成された映像データを永続的に記憶するステップと、
　を実行させるためのプログラム。