JP6411373B2 - 認識データ伝送装置、認識データ記録装置及び認識データ記録方法 - Google Patents

認識データ伝送装置、認識データ記録装置及び認識データ記録方法 Download PDF

Info

Publication number
JP6411373B2
JP6411373B2 JP2015553487A JP2015553487A JP6411373B2 JP 6411373 B2 JP6411373 B2 JP 6411373B2 JP 2015553487 A JP2015553487 A JP 2015553487A JP 2015553487 A JP2015553487 A JP 2015553487A JP 6411373 B2 JP6411373 B2 JP 6411373B2
Authority
JP
Japan
Prior art keywords
information
person
action
recognition
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015553487A
Other languages
English (en)
Other versions
JPWO2015093330A1 (ja
Inventor
紫村 智哉
智哉 紫村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPWO2015093330A1 publication Critical patent/JPWO2015093330A1/ja
Application granted granted Critical
Publication of JP6411373B2 publication Critical patent/JP6411373B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B13/00Burglar, theft or intruder alarms
    • G08B13/18Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
    • G08B13/189Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
    • G08B13/194Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
    • G08B13/196Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
    • G08B13/19602Image analysis to detect motion of the intruder, e.g. by frame subtraction
    • G08B13/19613Recognition of a predetermined image pattern or behaviour pattern indicating theft or intrusion
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B13/00Burglar, theft or intruder alarms
    • G08B13/18Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
    • G08B13/189Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
    • G08B13/194Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
    • G08B13/196Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
    • G08B13/19663Surveillance related processing done local to the camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/188Capturing isolated or intermittent images triggered by the occurrence of a predetermined event, e.g. an object reaching a predetermined position

Description

本発明は、認識データ伝送技術に関する。
人物の存室状況や室内への入退出管理、遠隔地からの見守り等、各種センサを用いた人物等の行動を認識する機器や手法が提案されている。
カメラで撮影した宅内の画像を電話回線及びインターネットを介してサーバ装置に送信し、そのサーバ装置から携帯端末にその画像やカメラ撮影動作を含む制御命令を受信して制御をおこなうことにより、設置が容易で安価な遠隔見守りシステムが提案されている(下記特許文献1参照)。
また、映像コンテンツに含まれる顔を検出し、顔に関する特徴量をコンテンツ管理ファイルに記録して、特定顔に関する特徴量と該コンテンツ管理ファイルに記録されている特徴量を比較して特定顔を含むコンテンツを迅速に利用する画像処理装置が提案されている(下記特許文献2参照)。
特開2005−318445号公報 特開2010−39724号公報
しかしながら、特許文献1に記載の人物検出システムは、人体センサにより人物を検出した場合に人物の撮影を開始し、映像を送信先に伝送する。一方、見守りを行う側は、人物の行動を常に見守ることはできるが、人物が危険な行動をとっているか、または安全に過ごしているかなどを見守り者自身が判断する必要がある。そのため、見守る側は伝送されてくる映像の人物を常に視聴している必要があるという課題があった。また、伝送データは映像データであるため、カメラによって撮影される人物のプライバシーが守られないという課題があった。さらに、転送するデータ量が膨大となり、データの伝送帯域を大きくする必要があった。
特許文献2は、映像コンテンツから検出した顔やその特徴量を記録し、検索することはできるが、映像中の人物の行動を検出し、その情報を記録することはできなかった。さらに、映像コンテンツから検出された人物やその特徴データは、一定間隔毎に作成される代表サムネイル毎に記録されるため、同一人物の検出データが重複して記録され、検出情報が増大するという課題があった。また、検出された人物の1つの行動時間内に複数の代表サムネイルが記録される場合があるため、記録された検出情報間の関連性が不明であり、人物の行動を結びつけることができなかった。
本発明は、このような問題を鑑みてなされたもので、映像から検出された人物およびその行動を検知し、人物の行動単位でその情報を伝送することで、見守る側の利便性向上と伝送データの削減を両立する認識データ伝送装置を提供することにある。
本発明の一観点によれば、少なくとも1つの撮像部と、前記撮像部が撮像した映像から人物の特徴量を検出し、検出した前記特徴量から前記映像中の人物を特定する人物検出部と、前記人物検出部が検出した人物に関する特徴量から人物の身体的特徴を表すユーザ情報を検出するユーザ情報検出部と、前記ユーザ情報検出部が出力する前記ユーザ情報と、前記撮像部で撮像した映像と、からユーザのモーション(動きまたは身振り手振り)を検出するモーション検出部と、前記モーション検出部が出力するモーション情報と、前記ユーザ情報とから、人物の動きを含む行動を認識する行動認識部と、前記行動認識部が出力する認識情報を人の行動毎に時間軸上で分割し、分割したブロックデータを生成するデータ変換部と、前記データ変換部が出力する前記ブロックデータを、認識データとしてブロック毎に外部に伝送する制御を行う伝送制御部と、を有することを特徴とする認識データ伝送装置が提供される。
例えば、ユーザ情報は、人物の特徴量として予め登録してある情報DBのデータと比較して検出する。また、行動は、モーション情報として予め登録してある情報DBのデータと比較して、人物の行動を検出する。
本発明によれば、映像から検出された人物およびその行動を検知し、人物の行動単位でその情報を伝送することで、見守る側の利便性向上と伝送データの削減を両立させることができる。
本明細書は本願の優先権の基礎である日本国特許出願2013−260425号の明細書および/または図面に記載される内容を包含する。
本発明によれば、映像から検出された人物およびその行動を検知し、人物の行動単位でその情報を伝送することで、見守る側の利便性向上と伝送データの削減を両立することができる。
本発明の第1の実施の形態による認識データ伝送技術を用いた監視システム(見守りシステム)の外観構成例を示す図である。 本発明の第1の実施の形態による認識データ伝送技術に用いる行動情報の伝送例を示す図である。 本発明の第1の実施の形態による認識データ伝送装置の一構成例を示す機能ブロック図である。 認識データ伝送装置に含まれる映像解析部の一構成例を示す機能ブロック図である。 ブロックで伝送する行動情報の一例を示す図である。 行動情報に含まれる行動IDおよびフレームレートIDの一例を示す図である。 行動情報伝送処理の流れを示すフローチャート図である。 本発明の第2の実施の形態による認識データ伝送装置における異常時の行動情報の伝送例を示す図である。 本発明の第2の実施の形態による認識データ伝送装置における異常時の行動情報伝送処理の流れを示すフローチャート図である。 本発明の第3の実施の形態による認識データ伝送装置における異常時の行動情報に対応する映像データの伝送例を示す図である。 本発明の第3の実施の形態による認識データ伝送装置における異常時の行動情報に対応する映像データを示す情報の一例を示す図である。 本発明の第3の実施の形態による認識データ伝送装置におけるブロックで伝送する映像データ構造例を示す図である。 本発明の第3の実施の形態による認識データ伝送装置におけるコーデックの種類を示す図である。 本発明の第3の実施の形態による異常時の行動情報に対応する映像データ伝送処理の流れを示すフローチャート図である。
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
(第1の実施形態)
本実施の形態は、宅内における人の位置や行動を認識するセンサを用い、そのセンサが取得した情報を遠隔地にいる人に知らせる見守りや子守り、侵入者の監視、防犯、安心安全などのセキュリティへの利用、または宅内の家電機器制御に利用するための画像処理装置、撮像装置、画像処理方法およびプログラムに関するものである。例えば、行動記録装置、行動再生装置、行動検出撮像装置などが該当する。
〔見守りシステム〕
図1は、本発明の第1の実施形態に係る認識データ伝送装置を用いた見守りシステムの概念図である。
図1に示すように、認識データ伝送装置1は、撮像装置10と撮影映像から検出した入室者7の特徴データや行動情報を検出し、その行動情報を外部に伝送する。図1では、撮像装置10を含む認識データ伝送装置1の設置位置の一例として、テレビ3の上部に設置している例を示す。テレビ3は、部屋の角に設置し、認識データの撮像装置10から室内5全体を撮影できるようにしている。また、ドア6から入室する入室者7を確実に撮影できるように、ドア6の反対側の角に設置している。
認識データ伝送装置1は、入室者7を撮影し、撮影映像から人物の検出と、その人物がだれであるか、どのような行動をしているかに関する情報(以下、「行動情報」と称する。)を検出する。
なお、認識データ伝送装置1の設置位置は、室内5の全体が見渡せ、入室者7が確実に撮影映像画角内に入る位置ならばどこの位置であってもよく設置位置が限定されるものではない。例えば、天井や照明内部、室内壁面に設置したエアコン内部などでも良い。
次いで、認識データ伝送装置1が検出した行動情報をWi−FiやEthernet(登録商標)、Bluetooth(登録商標)等のローカルネットワーク(LAN)手段を用いて、室内5と同一の建物の別室にある情報表示端末2に表示する。表示する情報は検出した行動情報を文字やイラストで表示することや、情報表示端末で音声データに変換して、音声データとして出力してもよい。また、異常時等の緊急を要する行動情報の場合は、フラッシュや警告音、バイブレーション等とともに情報表示端末2にその行動情報を出力し、見守り者側に知らせてもよい。ここで、情報表示端末2に伝送するデータは行動情報としているが、認識データ伝送装置1の撮像装置10で撮影した映像を伝送してもよい。特に、異常時等の緊急を要する場合は、行動情報とともに映像データを伝送することにより、見守り者は瞬時に入室者7の容態や安否を確認することができる。
同様に、認識データ伝送装置1で検出した行動データまたは撮影映像を光回線やADSL、携帯電話向け無線通信システム(第3・4世代移動通信システム)を使用してインターネットに接続し、遠隔地にある情報表示端末4に伝送してもよい。これにより、情報表示端末2に出力した見守り情報を遠隔地にいる見守り者に知らせることが可能となる。
なお、認識データ伝送装置1の映像を、情報表示端末2または4に表示させ、これら情報表示端末2または4に内蔵されたカメラの映像を認識データ伝送装置1経由でテレビ3に表示させることで、TV電話を実現することも可能である。ここでは、認識データ伝送装置1の映像を、テレビ3に表示する一例を挙げたが、これに限定されず、室内にある表示装置(例えば、スマートフォンやタブレット端末、PCなど)に表示させるようにしてもよい。
〔行動情報伝送〕
図2は、認識データ伝送装置1が検知した行動情報の伝送例を示す図である。行動を検知される人物がA、B2人の場合について図示している。図2の左から右に向けて時間の経過を表している。最初に人物Aが「入室した」行動を行い、「入室した」行動が終了した後、一定時間経過後に「立った」行動を行ったことを表している。ここで、図面上の左右方向の矢印は対応する行動に要した経過時間を表している。このように、図2においては、人物A、Bの行動について経過時間とともに、時系列に示している。
人物の行動は、ある瞬間にのみ起こるということは少なく、一般的には行動開始から終了までに経過時間が存在する。見守りを行う場合は、映像の最小単位であるフレーム毎にその行動情報が通知される必要はなく、行動毎に行動情報が通知されればよい。従って、例えば「立った」という行動に関する行動情報は、いつ行動が開始され、その経過時間がどれくらいであったかを伝送すればよい。また、フレーム単位で行動情報を伝送すると、フレーム間で検出された行動情報の関連性が不明であるため、関連を保持する情報を付加する必要があり、伝送データが増大してしまう。
そこで、本実施形態では、1つの行動について、行動開始から終了までを行動情報の最小単位として伝送することを特徴とする。また、行動情報とともに、その映像を伝送する場合は、行動情報と映像データは行動の開始時間と終了時間とで参照すればよく、これにより、行動に対応する映像を検索することができる。
前述の行動情報の最小単位をブロックと呼ぶことにする。図2では、最初に人物Aが「入室した」行動を開始し、「入室した」行動の間に、人物Bが「座った」行動を開始したことを示している。行動情報の伝送順番は、最初に行った人物Aの「入室した」行動に関する行動情報をブロック0に格納して伝送を行う。次に、人物Bが行った「座った」という行動情報をブロック1としてブロック0の次に伝送を行う。このように、検出した人物の行動を1つの行動毎に1つの行動情報として検出し、それを1つのブロックとして、行動が発生した順番で伝送する。1つの行動を1つの行動情報としてブロック単位で伝送することにより、映像のフレーム毎に検出した顔などの情報を伝送する場合に比べて、大幅に伝送データを削減することができる。
前述のように、人物の行動は、1つの行動に対して経過時間が発生するため、ある行動が行われている間に別の人物による別の行動が行われる場合がある。例えば、図2の人物Bが「泣いた」を始めた後に、人物Aが「立った」を始め、人物Bの「泣いた」が終わる前に人物Aの「立った」の行動が終了するような場合である。この場合、人物Bの「泣いた」の行動を開始した時点で行動情報の伝送を開始すると、「泣いた」の行動が終了するまで人物Aの「立った」の行動情報を伝送できなくなってしまう。そのため、本実施の形態では、行動が終了した時点を基準にしてその行動の検知が終了したと認識し、検知した順番に行動情報を伝送する。このような伝送順とすることで、人物Bの「泣いた」と人物Aの「立った」の行動では、人物Aの「立った」の行動の方が先に終了するため、ブロック2として人物Bの「泣いた」の行動情報のブロック3より先に伝送している。
また、人物Aの「笑った」の行動と人物Bの「居なくなった」の行動のように同時刻に終了する場合は、どちらを先に伝送してもよい。図2では先に行動が開始された人物Bの「居なくなった」の行動情報をブロックnとして人物Aの「笑った」の行動情報(ブロックn+1)より先に伝送する例を示している。
このように、同一時刻に終了した行動の行動情報がある場合の一例として、行動開始時刻が早い順に行動情報の優先度を高く設定し、優先度の高い順に行動情報を伝送するよう
にしてもよい。もし、同一時刻に終了した行動の行動情報があり、行動開始時刻も同じ行動情報があった場合は、予め優先度の高い人物を設定しておき、優先度の高い人物の行動には、より高い優先度を設定し、優先度の高い順に行動情報を伝送してもよい。図2では、人物Bより人物Aの方が優先度が高いと設定しており、人物Aの「泣いた」と人物Bの「起きた」は同一の開始時刻と終了時刻となっているため、優先度の高い人物Aの「泣いた」をブロック6として、人物Bの「起きた」のブロック7より先に伝送している例を示している。
以上説明した行動情報は、人物の行動を表す情報としてブロック単位で伝送する例を説明したが、伝送するデータとして行動情報だけでなく、対応する映像や静止画を伝送してもよい。また、伝送データ量を削減するため、行動情報だけを伝送してもよい。
〔認識データ伝送装置〕
図3を参照して本実施の形態による認識データ伝送装置の構成例について説明する。
認識データ伝送装置1は、撮像装置10で撮影した映像を表す映像信号を生成し、生成した映像信号を映像データとして映像解析部11に送る。撮像装置10は1つ以上の撮像部(101〜n)から構成されていてもよい。図3では、n個の撮像部があるとして図示している。1つ以上の撮像部とすることで、各撮像部が撮影する室内の領域を分担して撮影することが可能となるため、より広い領域を撮影できることや、家具などの物の影となる領域(オクルージョン領域)を削減することが可能となる。撮像部101からnまでは、例えば、被写体から入射された光を焦点に集光するレンズを備えた光学系と、集光された光を電気信号に変換する撮像素子を備えるカメラである。撮像部101〜nが備える撮像素子は、例えば、CCD(Charge Coupled Device)素子、CMOS(Complementary Metal Oxide Semiconductor)素子である。なお、撮像装置10が撮影する映像の出力は、有線であっても無線であってもよく、どのような伝送方式を用いて映像解析部11に入力させるようにしてもよい。
映像解析部11は、撮像装置10から入力された映像を解析し、顔や人物の検出、または識別、人物がとった行動を検知する。情報DB(メモリ)12は、顔や人物の検出、または識別するために必要な顔や物体のテンプレート、行動を検出するのに必要なモーション情報のテンプレートなどの学習情報等を記憶する。また、映像解析を行うための中間データを一時的に記憶する。さらに、予め特定の人物を識別できるようにするため、顔や人物の特徴量データを記憶する。
あるいは、映像解析部11が検出した認識情報に応じて、人物の行動に対するアクションをネットワーク先の見守り側の情報表示端末に表示するための情報等が記憶されている。
映像解析部11は、撮像装置10の入力映像と情報DB12の学習データを用いて、映像内の人物の行動を検知し、認識情報として出力する。その際、行動の検知に使用した映像データ(撮像装置10が撮影した撮影映像を含む)についても、対応する認識情報とともに出力してもよい。
データ変換部13は、映像解析部11から出力された認識情報や撮影映像を前述のブロック単位に変換する処理を行う。そしてブロック単位に変換された認識情報や映像データを行動情報として伝送制御部14に送り、伝送制御部14は前述のWi−Fiなどの伝送手段を使って外部に伝送する。なお、伝送制御部14はネットワークに伝送するだけでなく、光学ディスクや半導体メモリ、HDDなどの記録媒体16に記録してもよい。伝送制御部14が外部に伝送する行動情報は、認識情報のみで構成されていてもよいし、映像データのみで構成されていてもよいし、または認識情報および映像データの両方で構成されていてもよい。
また、映像解析部11に入力する映像は、撮像装置10からの撮影映像だけでなく記録媒体16に記録された映像データベースの映像であってもよい。さらに映像データベースは、インターネット上に接続されたサーバが記憶している映像であってもよい。
映像解析部11に入力する映像データは、映像データだけでなく赤外線センサや測距センサ、加速度センサ、ジャイロセンサ、電子コンパスなどの各種センサからの検出結果でもよく、これらセンサの検出結果を用いて認識情報を生成してもよい。
〔映像解析部〕
図4を用いて映像解析部11の一構成例について詳細に説明する。
映像解析部11は、撮像装置10から入力された映像信号に基づき人物の顔の検出と、複数の撮影時間が異なる映像データの違いから算出する動き情報を組合せ、顔と検出した映像上の領域から、動いたもの(画像データに変化があった領域)を人物であると判定し、人物がいるかどうか、および人物の追跡検出を行い、その結果を認識情報として出力する。また、映像解析部11は、撮像装置10から入力された映像信号に基づき人物のいる位置や動き量の検出、人物の性別や年齢、人物がだれであるかの識別、顔の向いている方向や表情等、検出した人物がどのような行動をしているかを検出し、その結果を検出情報として出力する。さらに、検出する行動には、ジェスチャ等の人のモーションを表す情報を検出し、出力する。
〔動きベクトル検出部〕
動きベクトル検出部110は、撮像装置10から入力される複数の映像から映像内の動いた領域を検出する。1つの撮像部の映像を時間方向に1フレーム以上ためておき、現在のフレーム画素値と対応する同座標の過去のフレームの画素値の差分値が予め定めた閾値より大きい領域が、動いた領域として検出する。動きベクトル検出部110は、検出した動いた領域とその重心座標、移動量と移動方向(ベクトル)を追跡情報(動きベクトル情報)として、人物検出部111およびモーション検出部113に入力し、同時に検出情報として出力する。
また、動きベクトル検出部110は、撮像装置10から入力される複数の映像に加え、後述の人物検出部111が出力する人物情報を入力して映像内の動いた領域を検出してもよい(図示はなし)。動きベクトル検出部110が検出した動いた領域が、人物検出部111が出力する人物情報に含まれる位置情報を基準に予め定めた閾値の範囲(領域)内にある場合に、人物が動いたと判定し、検出した動いた領域とその重心座標、移動量と移動方向(ベクトル)を人物の追跡情報(動きベクトル情報)として、モーション検出部113に入力し、同時に検出情報として出力してもよい。このように、検出した動いた領域情報と人物情報を組み合わせることで、物などの人物以外の動きベクトル情報を検出することを避けることができ、見守り対象の人物の動きベクトル情報を抽出して、出力することが可能となる。
なお、動きベクトル検出部110の動き情報検出方法はこの方法に限定されるわけではなく、縦と横の画素数が8×8や16×16などの領域(マクロブロック)の単位で現在のフレームのマクロブロックに一致する領域が過去フレームのどこにあるかを探索し、見つかった場合にその座標の移動量を動き量にする方法など、どのような方法であってもよい。
〔人物検出部〕
人物検出部111は、撮像装置10から入力される複数の映像と、動きベクトル検出部110から入力される動きベクトル情報とから顔面の画像を表す領域を検出する。人物検出部111は、検出した顔面の領域における代表点(例えば、重心点)の2次元座標や、その領域の上端、下端、左端、右端の2次元座標を表す2次元顔面領域情報を生成する。人物検出部111は、複数の撮像部が撮影した複数の画像から生成した前述の2次元座標を組合せ、室内の3次元空間座標系の3次元座標に変換して、3次元の顔位置情報を生成する。ここで顔を検出できた場合に、人物が室内に入室したと判定する。
顔面の領域を検出するために、人物検出部111は、例えば予め設定した顔面の色彩(例えば、肌色)を表す色信号値の範囲にある画素を、入力された画像信号から抽出する。
なお、人物検出部111は、予め人間の顔面を表す濃淡(モノクロ)画像信号を記憶した記憶部を備えるようにしてもよい。そこで、人物検出部111は、記憶部から読み出した濃淡画像信号と入力された画像信号との相関値を複数の画素を含む画像ブロック毎に算出し、算出した相関値が予め定めた閾値よりも大きい画像ブロックを顔面の領域と検出する。
その他、人物検出部111は、入力された画像信号に基づいて特徴量(例えば、Haar−Like特徴量)を算出し、算出した特徴量に基づいて予め定めた処理(例えば、Adaboostアルゴリズム)を行って顔面の領域を検出してもよい。人物検出部111が顔面の領域を検出する方法は、上述の方法に限られず、入力された画像信号から顔面の領域を検出する方法であれば、いかなる方法を用いてもよい。
また、映像中に人物がいる場合でも、必ずしも顔が撮影されるとは限らないため、動きベクトル検出部110から入力される動きベクトル情報を用いて、動いた領域に人物がいると判定してもよい。さらに、顔面の領域情報と動きベクトルを組み合わせて人物を検出してもよい。動きベクトル情報と顔面の領域情報とを照合しながら、検出した人物を追跡することで、次のフレームでの顔検出範囲を特定することができるため、人物検出精度の向上と、計算量の削減が可能となる。
以上までの説明では、画像上の顔を検出する方法について説明したが、その他の顔に関する情報、例えば、顔の性別、年齢、顔の向いている向き、笑っているや怒っている、泣いている等の顔の表情など、これら画像から特徴量を抽出し、登録することにより、画像上の顔を検出する。また、同様に上や下、横などの様々な方向を向いた顔画像から特徴量を抽出し、登録することにより、顔の向いている向きを検出する。さらに、人物検出部111は、予め特定の人物の顔画像から特徴量を抽出し、その特徴量を登録しておき、入力された顔画像と登録した特徴量を前記アルゴリズムにて照合することによって、入力された顔画像が登録者のだれであるかを識別するようにしてもよい。
人物検出部111が検出したこれら顔に関する情報は、人物情報として、ユーザ情報検出部112およびモーション検出部113、行動認識部114に入力され、同時に検出情報として出力される。
さらに、人物検出部111は、前記検出した人物情報に加え、撮像装置10で撮影された撮影映像、または前記撮影映像から検出された人物情報に対応する顔領域や人物領域などを切り出した切出映像や、撮像装置10が撮像した撮影映像のうち、人物情報に対応する撮影映像をユーザ情報検出部112およびモーション検出部113、行動認識部114に出力してもよい。
〔ユーザ情報検出部〕
次に、ユーザ情報検出部112の構成について説明する。人物検出部111で検出した人物情報に基づき、人物の特徴量として予め登録してある情報DBのデータと比較して、属性推定部1120は検出した人物情報の年齢や性別を推定する。また、表情推定部1121は人物の笑うや泣く、怒りなどの表情を推定する。人物識別部1122は、予め情報DBに登録してある人物の顔器官の特徴量と比較し、登録者のだれと一致するかの照合を行い、映像データ内にいる人物を識別する。登録者と一致した場合は、その人物の名前を、だれとも一致しない場合は、未知の人として識別結果を出力する。位置検出部1123は、人物の映像上の位置を出力する。人体部位検出部1124は、検出した人物の頭、腕、手、足、胴体といった人体の部位を検出し、その映像中の位置情報や大きさを出力する。
〔モーション検出部〕
モーション検出部113は、撮像装置10から入力される複数の映像と、人物検出部111から入力される人物情報と、動きベクトル検出部110から入力される追跡情報(動きベクトル情報)から、検出した人の動きや行動などのモーションを検出する。人物検出部111から入力される顔の3次元空間座標系の座標位置が、予め定めた閾値より高い位置にある場合に、立っていると判断する。さらに、予め情報DBに登録した人の識別情報と一緒に、身長情報を登録しておき、人物検出部111から出力される識別情報と身長情報から、立っていると判断する顔の3次元座標の範囲を設定しておけば、より高精度に立っていると判断できる。次に、同様に顔の3次元座標が床より予め定めた閾値より床側にあるときに寝ている(もしくは倒れている)と判断する。ベッドなどが設置されている場合は、その高さを前述の閾値に含めることにより、同様に寝ているかを判断する。これら、立っているもしくは寝ている以外の状態を座っていると判断する。モーション検出部113は、これら判定結果をモーション情報として出力する。
また、モーション検出部113は、人物検出部111からの人物情報と、動きベクトル検出部110の追跡情報と、位置検出部1123の人物位置情報と、人体部位検出部1124の人体部位情報とから、人が室内に存在し、かつ動いていることを検出すると、検出した人が起きていると判断する。さらに、起きている人が、突然、寝た状態になった、もしくは、寝た状態からしばらく動かない場合は、体調の急変が予測されるため、倒れているという情報をモーション情報として出力する。
また、モーション検出部113は、人物検出部111からの人物情報と、動きベクトル検出部110の追跡情報と、位置検出部1123の人物位置情報と、人体部位検出部1124の人体部位情報とから、人の手や足の動き、顔の3次元座標の変動からジャンプ等を検出し、予め定めた身体の形や動きなどのジェスチャを検出する。そして、検出したジェスチャ情報をモーション情報として出力する。
なお、以上までに説明した人の行動検出は、これに限定されるものではなく、これら単体での検出に加え、いくつかを組み合わせて人の行動またはモーションを検出してもよい。
〔行動認識部〕
行動認識部114は、ユーザ情報検出部112から入力される検出情報である室内の人の有無の検出および追跡結果や、入室者が誰であるかの識別結果、在室人のモーション検出結果と、情報DB12の情報から、入室者の行動を検出し、情報DB12に記録する。検出される行動には、入室者が立っているか、座っているか、寝ているか、部屋のどこに位置し、どちらの方向を向いているか等を検出する。また、入室者のいる位置と人の向いている方向を検出することにより、例えば、テレビを見ている、調理をしている、食事をしているなどを検出することができる。
さらに、検出した行動の情報を情報DB12に記録するだけでなく、例えば、テレビなどの表示ディスプレイにその検出結果を表示してもよい。それは、現在の検出情報をリアルタイムに表示しても良いし、過去のデータを表示してもよい。
また、行動認識部114は、ネットワークを通じて、検出した行動情報を、見守りを行う側に送信してもよい。送信する行動情報は、見守りを行う側の表示ディスプレイ(テレビや、携帯電話、携帯端末、専用表示ディスプレイなど)に送信・表示や記録してもよい。また、ネットワーク上に存在するサーバに検出した行動情報を一旦記録し、見守りを行う側が必要な時に読みだし、前記表示ディスプレイに表示してもよい。
さらに、行動認識部114は、部屋に入室した人の検出情報から、例えば、子供の場合は浴室や洗濯機設置部屋への入室の検出による閉じ込め防止や溺れ事故を防ぐことができる。あるいはキッチンでのコンロやストーブのいたずらによる火災を未然に防ぐことができ、室内のセキュリティの監視にも使用することができる。また、情報DB12に登録されていない人物の入室を検出することにより、窃盗犯等の検出を行うことが可能となる。
行動認識部114はこれら制御に追加し、例えば、予め決められたジェスチャや、予め決められた人の行動を自動認識し、対応する機器1〜mの操作を行う。ユーザ情報検出部112から入力された検出情報と情報DB12の情報を照合し、予め決められた機器の指定と、指定した機器の制御コマンドを検索し、対応する機器に制御コマンドを送信する。
行動認識部114は、人物検出部111およびユーザ情報検出部112、モーション検出部113から入力される、撮像装置10で撮影された撮影映像、または前記撮影映像から検出された人物情報に対応する顔領域や人物領域などを切り出した切出映像や、撮像装置10が撮像した撮影映像のうち、人物情報に対応する撮影映像を、前記行動情報を含む認識情報とともに、撮影映像としてデータ変換部13や情報DB12に出力してもよい。
〔行動情報〕
図5を参照しながら、ブロックで伝送する行動情報の詳細な例について説明する。
図5は、1つのブロックの先頭から格納するデータの順番や内容について説明した図である。ブロックに格納するデータは、図5の形式にしたがったバイナリ形式のデータである。ブロックに格納する各情報(以下、フィールド)は、先頭から順にブロックID、ブロック優先度、行動ID、開始時間、行動時間、フレームレートID、付加情報サイズ、付加情報の順に記録される。以下に説明を行う。
(ブロックID)
1つ目のフィールドのブロックIDは、ブロック毎に付加される固有のIDであり、伝送するブロックに対して0から順番に格納する。ブロックIDの記録領域は3Byteの固定長であり、0から0xFFFFFFの値を格納する。例えば、図2のAの最初の行動である「入室した」の行動情報を格納するブロック0のブロックIDには、「0」を格納する。
(ブロック優先度)
2つ目のフィールドのブロック優先度は、検出した行動情報の優先度を格納する。優先度が高ければ高いほど、先に(早い時間に)行われた(終了した)行動であり、「倒れた」などの緊急を要する重要な行動情報であることを示す。ブロック優先度の記録領域は1Byteの固定長であり、1から0xFFの値を格納する。値1は優先度が一番低く、値が増加するにつれ、優先度が高くなることを示す。また、0xFFで緊急データ(最優先)であることを示す。
(行動ID)
3つ目のフィールドの行動IDは、検出した行動の内容を表すIDである。行動IDの記録領域は1Byteの固定長であり、図6(a)の行動IDに示すように、行動の種類に対応するIDを格納する。映像解析部11で認識した行動情報に対応する行動の種類のIDを格納する。例えば、図2のAの最初の行動である「入室した」の場合は、ID2を格納する。
撮像部101の撮影映像内に人がいないか、またいる場合でも、特に目立った行動をしていない場合は、ID0の「行動情報なし」を格納する。目立った行動がないにも関わらず、「行動情報なし」を格納し、伝送する場合には、撮像部101の撮影映像内に人が検出され、その人がだれであるか、また検出した顔や行動の信頼度等の付加情報を伝送したい場合等である。行動IDは、図6(a)に示す0〜15の行動に加え、後で追加定義できるようにしてもよい。そのため、行動ID16から254までをReserved領域として確保している。行動情報を後で追加する場合に行動ID16から254を使用し、新たに行動の種類を定義する。
また、行動IDとして値255を格納すると「拡張フラグ」を示す。「拡張フラグ」は、行動の種類として行動ID0から254を使い果してしまった場合の拡張用であり、行動IDに255が格納されると、後述する付加情報のReserved領域に、追加の行動の種類を定義できるようにするためである。
(開始時間)
4つ目のフィールドの開始時間は、行動IDで示した行動を開始した時間を示す情報を格納する。開始時間の記録領域は4Byteの固定長であり、撮像部101で撮影した映像データと、映像データから認識した行動情報を伝送する場合、撮影開始からのフレーム番号を格納する。見守りを開始してからの撮影映像に対応するフレーム番号を格納することにより、認識した行動に対応する映像をすぐに検索することが可能となる。
また、伝送のデータ量を削減するためや、映像データが不要なシステムの場合など、行動情報を伝送する場合は、時刻(時間)情報を格納してもよい。
(行動時間)
5つ目のフィールドの行動時間は、行動IDで示した行動に費やした経過時間を示す情報を格納する。行動時間の記録領域は4Byteの固定長であり、撮像部101で撮影した映像データと、映像データから認識した行動情報を伝送する場合、行動開始(開始時間フィールドが示すフレーム番号)からのフレーム数を格納する。見守りを開始してからの撮影映像に対応するフレーム数を格納することにより、認識した行動の経過時間(行動期間)に対応する映像をすぐに検索することが可能となる。
また、伝送のデータ量を削減するためや、映像データが不要なシステムの場合など、行動情報を伝送する場合は、行動に費やした経過時間を格納してもよい。
行動の経過時間情報を格納する説明を行ったが、行動が終了した時点でのフレーム番号、または時刻(時間)情報を格納してもよい。この場合、前述の開始時間と格納した行動終了時間の差で、行動の経過時間を算出することが可能となる。
(フレームレートID)
6つ目のフィールドのフレームレートIDは、撮像部101で撮影した映像データのフレームレートを表す情報を格納する。フレームレートIDの記録領域は1Byteの固定長であり、図6(b)に示すフレームレートの種類に対応したIDを格納する。例えば、映像データが1秒間に60フレームの場合は、IDの値8を格納する。図6(b)では、0から13のフレームレートの種類を示しているが、これだけのフレームレートの種類に関わらず他のフレームレートがあってもよい。そのため、フレームレートが後で追加できるように、ID14から255までReserved領域として確保する。フレームレートの追加が発生した場合は、ID14から255に追加で定義すれば良い。
フレームレートIDは、開始時間や行動時間で示した情報が対応する映像のフレーム番号やフレーム数を格納した場合に、フレーム番号やフレーム数から行動開始時刻(時間)や行動の経過時間を算出するために用いる。例えば、フレームレートIDが8(1秒間に60フレームの映像)の場合に、開始時間が600(フレーム)であったとすると、撮影開始から10秒後に開始された行動であることを示す。また、行動時間が3600(フレーム)であったとすると、行動が開始されてから60秒その行動が行われたことを示す。
また、フレームレートIDが値0(フレームレート情報なし)の場合は、フレームレート情報がないことを示す。これは、認識した行動情報を伝送し、対応する映像データを伝送しない場合等に使用する。この場合、開始時間や行動時間にフレーム番号やフレーム数を格納しても、時刻(時間)情報に変換できないため、開始時間や行動時間フィールドには、時刻(時間)情報を格納することになる。したがって、フレームレートIDの値が0の場合は、開始時間や行動時間に格納された情報が時刻(時間)情報であると判定するフラグ情報として使用することができる。
(付加情報)
7つ目のフィールドの付加情報サイズ、および8つ目のフィールドの付加情報は、映像解析部11が出力する認識情報を決定するのに用いる各検出情報を格納する。付加情報の記録領域は0から65535Byteの可変長であり、伝送する付加情報のサイズを付加情報サイズに格納する。付加情報サイズの記録領域は2Byteの固定長であり、付加情報サイズの大きさをByte単位で格納する。
付加情報は、先頭から行動信頼度、顔識別ID、顔識別信頼度、テキスト情報サイズ、テキスト情報を格納する。
(行動信頼度)
付加情報の1つ目のフィールドである行動信頼度は、映像解析部11が認識した行動に対する信頼度(認識情報の確からしさ)を格納する。行動信頼度の記録領域は2Byteの固定長であり、0から65535の値を格納する。値が大きいほど、信頼度が高いことを示す。
(顔識別ID)
付加情報の2つ目のフィールドである顔識別IDは、映像解析部11で認識した行動を行った人を識別するIDを格納する。顔識別IDの記録領域は2Byteの固定長であり、0から65535の値を格納する。値0は識別情報なし(識別者なし)を表し、値1から人の識別情報を表す。識別情報は、予め識別したい人の顔を撮影し、映像解析部11の人物識別部1122にて、撮影した人の特徴を顔情報として抽出し、識別IDに割り当てることで、識別したい人を登録する。そして、見守り開始からの撮影映像から同様に人物識別部1122にて撮影した人の特徴を顔情報として抽出し、予め登録した識別IDのどのIDと一致するかを識別し、一致する識別IDが存在した場合は、そのIDを顔識別IDに格納する。一致する識別IDが存在しない(予め登録してある人と別の人)の場合は、顔識別IDに0を格納する。
(顔識別信頼度)
付加情報の3つ目のフィールドである顔識別信頼度は、映像解析部11の人物識別部1122で識別した人の識別IDに対する信頼度(認識情報の確からしさ)を格納する。顔識別信頼度の記録領域は2Byteの固定長であり、0から65535の値を格納する。値が大きいほど、信頼度が高いことを示す。
(テキスト情報)
付加情報の4つ目のフィールドのテキスト情報サイズ、および5つ目のフィールドのテキスト情報は、伝送ブロックに関する説明や、顔識別者の名前、認識した行動に対する注意や警告に対応する通知内容等の文字情報を格納する。テキスト情報の記録領域は0から255Byteの可変長であり、伝送するテキスト情報のサイズをテキスト情報サイズに格納する。テキスト情報サイズの記録領域は1Byteの固定長であり、テキストサイズの大きさをByte単位(1文字単位)で格納する。
テキスト情報の終了は、Null文字を付加することで行う。テキスト情報が奇数の文字数の場合や、テキスト情報の次のフィールドの先頭が4の倍数のアドレス(4ByteのAlignment)値とならない場合に、テキスト情報サイズで4Byte Alignmentなされるサイズを格納してテキスト情報サイズを調整し、実際に格納された文字数は、テキスト情報の先頭からNull文字を検索することで行ってもよい。
また、付加情報に格納する情報はこれらに関わらず他の検出や認識した情報を格納してもよい。そのため、追加の情報が後で追加できるように、Reserved領域を可変長領域として確保する。Reserved領域には、前述の図6(a)の行動の種類が256個以上となった場合、ID255の拡張フラグを使用し、行動の種類等の情報を格納する。Reserved領域は可変長サイズとなるが、付加情報全体のサイズは、付加情報サイズに格納されているため、Reserved領域の終端位置を検出することが可能である。
さらに、付加情報を伝送しない場合は、付加情報サイズに0を格納し、付加情報を伝送しないことも可能である。この場合、1つのブロックのデータサイズは、ブロックIDから付加情報サイズの合計16Byteとなり、行動情報を最小限のデータ量で伝送することが可能となる。
〔処理フロー〕
次に、本実施の形態に係る認識データ伝送処理について説明する。
図7は、本実施形態に係る認識データ伝送処理の流れを示すフローチャート図である。(ステップS100)
映像解析部11が、撮像装置10から映像データを取得する。次に、ステップS101に進む。
(ステップS101)
動きベクトル検出部110が、撮像装置10で撮像された映像データに基づいて、撮影時間が異なる複数のフレーム映像を保持しておき、映像上で画素値が変化した領域を動いた領域として検出し、その移動量を出力する。検出した移動量や移動座標、移動ベクトルを動きベクトル情報として出力する。次のフレーム映像の動き量を検出するため、現在のフレーム映像を情報DB(メモリ)12に保存する。次に、ステップS102に進む。
(ステップS102)
人物検出部111が、撮像装置10で撮像された映像データと、ステップS101で検出した動きベクトルを使って、映像データ内の人物を検出する。映像データ内から前述の方法により顔を検出し、顔が存在した場合は、人物が存在したと判定する。また、映像中に人物がいる場合でも、必ずしも顔が撮影されるとは限らないため、算出した動きベクトルを用いて、動いた領域に人物がいると判定してもよい。さらに、顔検出情報と動きベクトルを組み合わせて人物を検出してもよい。ステップS101で出力された動きベクトルとステップS102で検出した人物情報とを照合しながら、検出した人物を追跡することで、次のフレームでの顔検出範囲を特定することができるため、人物検出精度の向上と、計算量の削減が可能となる。映像中の人物の有無、映像内の人物の位置、顔の大きさ、顔の向き、顔器官の特徴量、人物の追跡結果といった人物情報を出力し、ステップS103に進む。
尚、ステップS101とステップS102の処理は、上述のように、処理の前後を入れ替えても良い(ステップS102からステップS101でも良い)。
(ステップS103)
ユーザ情報検出部112が、ステップS102で算出した人物情報に基づき、人物の特徴量として予め登録してある情報DBのデータと比較して、属性推定部1120は検出した人物情報の年齢や性別を推定する。また、表情推定部1121は人物の笑いや泣く、怒りなどの表情を推定する。人物識別部1122は、予め情報DBに登録してある人物の顔器官の特徴量と比較し、登録者のだれと一致するかの照合を行い、映像データ内にいる人物を識別する。登録者と一致した場合は、その人物の名前を、だれとも一致しない場合は、未知の人として識別結果を出力する。位置検出部1123は、人物の映像上の位置を出力する。人体部位検出部1124は、検出した人物の頭、腕、手、足、胴体といった人体の部位を検出し、その映像中の位置情報や大きさを出力する。ステップ103では、これら検出したユーザ情報を出力し、ステップS104に進む。
(ステップS104)
モーション検出部113が、撮影時間の異なる複数のフレーム映像から検出した人物の位置情報と人体部位情報、動きベクトル情報、人物追跡情報とから、人物の動きや身振り手振りを含むモーション情報を検出する。そして、ステップS105に進む。
(ステップS105)
行動認識部114が、撮像装置10で撮像した映像データと、検出した人物情報、ユーザ情報、モーション情報に基づいて、人の立っている、座っている、寝ている、倒れているなどの人物の行動に関する情報(行動情報)を認識し、認識情報として出力する。その後、ステップS106に進む。
(ステップS106)
ステップS105の行動認識処理から出力された認識情報を情報DB(メモリ)に保存する。これは、複数のフレーム間で認識を行う動き情報や追跡情報、モーション情報の検出を行うために使用され、現在の映像データから検出した認識情報を保存する。その後、ステップS107に進む。
(ステップS107)
ステップS106から出力される認識情報を伝送するため、人物の行動毎に認識情報を分割し、1つの行動に対する認識情報を1つのブロックデータとして生成する。1つのブロックデータは、前述の行動開始、終了時間や行動に対応する行動IDなどである。そして、ステップS108に進む。
(ステップS108)
入力された映像データで検出された行動について、本映像データ内で行動が終了したことを検出した、すなわち、同一時刻で終了した行動の行動情報が他にあるかを判定する。同一時刻に行動が終了した行動情報がある場合(ステップS108 Yes)、ステップS109に進む。同一時刻に行動が終了した行動情報が他にない場合(ステップS108
No)、行動情報を格納するブロックのブロック優先度フィールドに0x80(通常データ)を格納し、ステップS110に進む。
(ステップS109)
同一時刻に終了した行動の行動情報がある場合、その中で行動開始時刻が早い順に、行動情報を格納するブロックのブロック優先度フィールドに優先度の高い値を格納する。例えば、同一時刻に終了した行動の行動情報の中で行動開始時刻が一番遅かった行動情報に対しては、ブロック優先度に0x80(通常データ)を格納する。前記行動情報の次に行動開始時刻が早かった行動情報に対しては、ブロック優先度に0x81を格納するというように、行動開始時刻が早い行動情報の方がより高い優先度の値をブロック優先度に格納する。また、同一時刻に終了した行動の行動情報の中で、もし行動開始時刻が同じ行動情報があった場合は、予め優先度の高い人物を設定しておき、優先度の高い人物の行動には、より高い優先度の値をブロック優先度に格納するようにする。ブロック優先度の値を格納し終えたら、ステップS110に進む。
(ステップS110)
映像データから検出された行動情報をブロック単位で伝送する。伝送する順番は、ブロック内に格納されたブロック優先度の値が高い順に伝送する。全てのブロックの行動情報を伝送し終えたら、ステップS111に進む。
(ステップS111)
電源OFFや見守り終了など、認識データ伝送処理を終了させるか否かを判断する。認識データ伝送処理を引き続き継続すると判断された場合(ステップS111 NO)、ステップS100に進み、次の撮影映像を取得する。認識データ伝送処理が終了したと判断された場合(ステップS111 YES)、処理を終了する。
以上により、撮像装置10で撮像した映像データから、人物の行動を認識し、行動毎に認識した行動情報をブロック単位で伝送することで、見守る情報として最小限のデータを伝送することができるため、転送データ量を削減できる。さらに、従来は見守る側は映像データを常に視聴して安否の確認をする必要があったが、予め定めた行動情報のみ通知する、または伝送された行動情報から選択することにより、緊急を要する行動または安全に生活しているといった安否情報を必要な場合に通知することができるため、利便性が大幅に向上する。
尚、本実施の形態では、認識したデータを伝送する認識データ伝送装置について説明したが、認識したデータを記録する認識データ記録装置も同様に実現できることは言うまでもない。
(第2の実施形態)
〔異常時の伝送〕
次に、図2に記載の行動情報に追加して、異常時の行動情報を伝送する場合の1例について図8を参照しながら説明する。
人物の行動には、図2で説明した「立つ」や「笑う」など普段の生活を表すものに加え、倒れた(転んだ)や居なくなった等の異常時を表す行動も存在する。一般的に異常時の行動への対応は緊急を要する場合が多いため、通常の行動情報より早くその情報を見守り側に通知する必要がある。そのため、図8では人物Bが先に「歩いた」行動を開始し、「歩いた」が継続している間に、人物Aが「倒れた」行動を開始している。その後、人物Bの「歩いた」行動が終了した後に、人物Aの「倒れた」行動が終了している。第1の実施の形態の伝送順のルール(図2)によれば、行動が終了した順番で行動情報を伝送するため、人物Bの「歩いた」行動情報の方が、人物Aの「倒れた」行動情報より先に伝送されることになる。しかしながら、人物Aの「倒れた」の行動は緊急を要する異常時の行動であるため、図8中の人物Aの「倒れた」の行動情報をブロック4(太枠で示す。)として、人物Bの「歩いた」の行動情報(ブロック5)より先に伝送するようにする。このように、予め定めた異常時等の行動を検知した場合は、それ以外の行動情報より先に伝送することにより、見守り側に緊急情報を素早く通知することが可能となる。
なお、ここでいう「倒れた」の行動開始から終了までは、人物Aが倒れはじめ、床や地面に横たわり、ある一定時間動かなかった時点を以て「倒れた」の行動が終了したとしている。そのため、倒れる行動を検知するまでに時間を要することになり、場合によっては、人物Bの「歩いた」の行動終了より、人物Aの「倒れた」の検出時間が遅くなってしまう状況が発生し、この場合には、人物Bの「歩いた」の行動情報が先に伝送される。そこで、異常時の行動検出がなされた場合には、できるだけ早い段階で見守り側に伝送する必要があるため、人物Aが倒れはじめた段階で倒れると予見できる場合には、倒れる行動の検出終了前の予見できた段階でその行動情報を伝送するようにしてもよい。
〔行動情報〕
次に、本実施の形態において伝送されるブロックに格納する行動情報について説明する。
人物Bの「歩いた」の行動時間中に、人物Aの「倒れた」を検出できた場合は、図5の行動IDに、ID8(図6(a)、倒れた)を格納し、ブロック優先度に0xFF(緊急データ)を格納する。そして、ブロックIDとして値4と、前述と同様にその他情報を格納し、人物Bの「歩いた」の行動情報より先に、ブロック4として人物Aの「倒れた」の行動情報を伝送する。
その後、人物Bの「歩いた」の行動終了後に、図5の行動IDに、ID3(図6(a)、歩いた)を格納し、ブロック優先度に0x80(通常データ)を格納する。そして、ブロックIDとして値5と、前述と同様にその他情報を格納し、人物Bの「歩いた」の行動情報をブロック5として伝送する。
これら異常時の行動データに対して、ブロック優先度フィールドに優先度が高いことを表す情報を格納し、他のブロックデータより先に異常時の行動情報を伝送することで、見守り側に異常時の行動情報を素早く通知することができる。
〔処理フロー〕
次に、本実施の形態に係る異常時の認識データ伝送処理について説明する。
図9は、本実施の形態に係る異常時の認識データ伝送処理の流れを表すフローチャートである。
ステップS100からS111は前述と同様であるため、説明を省略する。
(ステップS120)
撮像装置10の映像データから認識した認識情報が予め登録してある「倒れた」や「居なくなった」などの異常時の行動情報であったか否かを判定する。異常時の行動情報は緊急を要する場合が多いため、ブロックの伝送順番を変更する。行動情報が緊急時のデータであった場合(ステップS120でYes)、ステップS121に進む。行動情報が緊急時のデータでなかった場合(ステップS120でNo)、ステップS108に進む。
(ステップS121)
認識した行動情報が緊急時である場合は、ブロック内ブロック優先度フィールドに緊急データであることを示す0xFFの値を格納する。これで検出した行動情報が緊急データであることを示すため、ステップS110で最も先に伝送されるブロックとなる。
以上により、認識した行動情報が緊急を要する異常時であった場合に、他の人物の行動情報より先に伝送することが可能となる。そのため、見守る側は、予め登録しておいた異常時の行動をいち早く知ることが可能となる。
(第3の実施形態)
〔静止画の伝送〕
次に図8の異常時の行動を認識した場合の行動情報に追加して、対応する静止画を伝送する場合の例について、図10を参照しながら説明する。
本実施の形態では、図8の異常時の行動情報の伝送について、見守り側に異常を通知するだけでなく、その状況を映像によって知らせるようにするため、行動情報と併せて静止画を伝送する。人物Aの「倒れた」行動を検知した段階でブロック4としてその行動情報を伝送するが、ブロック4伝送の後にブロック4に対応する「倒れた」状況を撮影した静止画像をブロック5として伝送する。その後、人物Bの「歩いた」の行動情報(ブロック6)を伝送する。このように行動情報と静止画像とを伝送することにより、見守り側の情報表示端末に異常時の行動とその状況を表す静止画像を素早く通知することができる。異常時の場合に、対応する静止画像を伝送することで、現在行われている映像伝送を主体とした見守りサービスや監視カメラと比較し、必要な情報(静止画像を含む)を最小限に伝送すればよく、伝送データ量を大幅に削減できる。さらに、見守りを行う場合、一日の行動情報を全て受け取ると、膨大なデータ量となる。映像データのみ伝送する場合は、一日中、映像を視聴する必要があり、非常に不便である。そのため、通常の行動ではその行動を表す行動情報を伝送し、異常が発生した場合は、その行動情報とともに対応する映像を伝送することで、見守る側の利便性の向上と、データ転送量の削減、延いては消費電力の削減が可能となる。静止画像はサムネイル画像でも良い。
〔ブロック4:行動情報伝送〕
次に、本実施形態で伝送するブロックに格納する行動情報について説明する。
人物Bの「歩いた」の行動時間中に、人物Aの「倒れた」を検出できた場合は、図11の行動IDに、ID8(倒れた)を格納し、ブロック優先度に0xFF(緊急データ)を格納する。そして、人物Aの「倒れた」状況を撮影した映像(静止画像)を後述する形式
で記録し、ブロック5として映像(静止画像)データを伝送する。伝送した映像データであるブロック5のIDを図11の付加情報領域に格納する。
(映像ブロック情報)
付加情報領域内のテキスト情報の後に、6つ目のフィールドの映像数、および7つ目のフィールドの映像ブロックIDを格納する。映像ブロックIDは、検出した行動情報に対応する映像データ(静止画像)が格納されたブロックのブロックIDを格納する。1つの映像ブロックIDを格納する記録領域は、3Byteの固定長であり、これらを順に複数個格納することができる。したがって、映像ブロックID領域は、可変長サイズとなる。格納した映像ブロックIDの数を映像数フィールドに格納する。映像数フィールドの記録領域は、1Byteであり、1から255までの映像ブロックIDを格納することができる。映像数フィールドが値0の場合は、映像ブロックIDが存在しないことを表し、映像ブロックID領域にデータが格納されず、行動情報に対応する映像データが存在しないことを示す。
ここでは、ブロック4に対応する映像データが格納されたブロック5のIDである値5を映像のブロックID1のフィールドに格納し、映像数に記録した映像データ数である値1を格納する。本実施形態では、1つの行動情報に対応する映像データとして、ブロック5を伝送する例を示したが、これに関わらず、1つの行動情報に対して、2つ以上の映像データを伝送してもよい。その場合、伝送する映像データの数だけ対応するブロックIDを映像ブロックIDフィールドに格納し、そのデータ数を映像数フィールドに格納する。このように、対応する映像データ数を複数個格納する例として、1つの行動情報に対し、違った角度で撮影した映像(静止画または動画)や異なる時間の映像を2つ以上伝送する
場合などが挙げられる。その他にも映像データが動画の場合に、1つの映像データを複数のブロックに分割して伝送する場合や、静止画と動画の両方を伝送する場合等に用いることができる。
そして、ブロックIDとして値4と、前述と同様にその他情報を格納し、人物Bの「歩いた」の行動情報より先に、ブロック4として人物Aの「倒れた」の行動情報を伝送する。
〔ブロック5:映像データ伝送〕
次に、映像データを伝送するブロックのデータ構造について、図12を参照して説明する。
図12は、映像データを伝送するブロックの先頭から格納するデータの順番や内容について説明した図である。ブロックへ格納するデータは、図12の形式にしたがったバイナリ形式のデータである。ブロックに格納する各情報は、先頭から順にブロックID、映像データフラグ、対応ID、コーデックID、データサイズ、映像データの順である。
(ブロックID)
1つ目フィールドのブロックIDは、ブロック毎に付加される固有のIDであり、伝送するブロックに対して0から順番に格納される。ブロックIDの記録領域は3Byteの固定長であり、0から0xFFFFFFの値を格納する。ここでは、ブロック4に対応する映像データとしてブロック5を伝送するため、ブロックIDには、「5」を格納する。(映像データフラグ)
2つ目フィールドの映像データフラグは、伝送するブロックが映像データであるか、行動情報であるかを示す情報を格納する。映像データフラグの記録領域は1Byteの固定長であり、映像データを格納したブロックの場合は、値0を格納する。映像データフラグに対応する行動情報を格納するブロックのフィールドは、ブロック優先度になるが、ブロック優先度は1以上の値を格納するため、これらフィールド情報が格納されているブロックの先頭から3Byte読み飛ばした先頭からの1Byte領域の値が0かそれ以外であるかを判定することによって、映像データのブロックであるか行動情報のブロックであるかの判定をすることができる。また、映像データの優先度を取得する場合は、後述する対応IDフィールドが示すブロックIDのブロック優先度を参照することにより可能となる。
(対応ID)
3つ目のフィールドの対応IDは、映像データブロックを参照している行動情報のブロックIDを格納する。対応IDの記録領域は3Byte固定長であり、映像データブロックを参照した行動情報のブロックID0から0xFFFFFFの値を格納する。ここでは、映像データを格納したブロック5を参照している行動情報のブロック4のIDである「4」を格納する。
(コーデックID)
4つ目のフィールドのコーデックIDは、格納した映像データのコーデック情報を格納する。コーデックIDの記録領域は1Byteの固定長であり、図13に示すコーデックの種類を表すIDを格納する。例えば、伝送する映像データが静止画像の場合でBitmapデータの場合は、コーデックIDとして値1を格納する。伝送する映像データが動画の場合でMPEGの場合は、コーデックIDとして値8を格納する。ここでの説明では、コーデック情報として符号化方式を表すIDを用いて説明したが、映像データを格納するコンテナのフォーマット形式を格納してもよい。例えば、H.264のコーデックで生成された映像データを格納しているMP4フォーマットの場合は、コーデックIDとして値12を格納する。この場合、コーデック情報を取得するには、コーデックID12を解釈し、MP4フォーマットと認識した上で、映像データに格納されたMP4データのメタデータを解釈することで、コーデック情報を取得することが可能となる。ここでは、ブロック4の行動情報に対応する映像データの静止画として、例えばJPEGデータを用いるとすると、コーデックIDとして「3」を格納する。
なお、コーデックID0は、コーデック情報なしを示し、映像データブロックに映像データを格納せずにブロックを伝送する場合や、コーデックの種類に定義されていない未知のコーデックの映像データを伝送する場合、映像データ以外のデータを伝送する場合に使用してもよい。
また、コーデックIDは、図13に示す0〜13のコーデックの種類に加え、後で追加定義できるようにしてもよい。そのため、コーデックID14から255までをReserved領域として確保している。コーデック情報を後で追加する場合にコーデックID14から255を使用し、新たにコーデックの種類を定義する。
(データサイズ)
5つ目のフィールドのデータサイズは、格納した映像データのデータサイズを格納する。データサイズの記録領域は4Byteの固定長であり、Byte単位のサイズ情報を格納する。格納できるデータサイズは、最大4GByteである。もし、映像データサイズが4GByteを超えるような大きいサイズのデータを伝送する場合は、前述のように、複数のブロックに分割して伝送すればよい。
(映像データ)
6つ目のフィールドの映像データには、映像データを格納する。映像データの記録領域は、0から4GByteの可変長であり、映像データフィールドの先頭から映像データを格納する。映像データを格納しないブロックを伝送する場合は、データサイズフィールドに値0を格納し、映像データフィールドには、何も格納しない。この場合、ブロック全体のデータサイズは、ブロックIDからデータサイズの記録領域を合計した12Byteである。
そして、映像データを格納したブロック5について、ブロック4の後にブロック5として人物Aの「倒れた」に関する映像データを伝送する。
〔ブロック6:行動情報伝送〕
次に、人物Bの「歩いた」の行動終了後に、図11の行動IDに、ID3(歩いた)を格納し、ブロック優先度に0x80(通常データ)を格納する。そして、ブロックIDとして値6と、前述と同様にその他情報を格納し、人物Bの「歩いた」の行動情報をブロック6として、ブロック4および5の後に伝送する。
これら異常時の行動データに対して、ブロック優先度フィールドに優先度が高いことを表す情報を格納し、他のブロックデータより先に異常時の行動情報を伝送する仕組みを設けることで、見守り側に異常時の行動情報を素早く通知することができる。
なお、異常時の行動に対応する映像として静止画像を伝送する説明をしたが、その行動に対応する(期間の)動画をブロックデータとして伝送してもよい。行動に対応する動画を映像データとして図12の映像データフィールドに格納し、そのコーデック情報としてコーデックIDに格納(例えば、コーデックIDが値8のMPEGなど)する。見守り側は受信した行動情報とその付加情報を解析し、コーデックがMPEGのような動画の場合は、映像データフィールドに格納された映像データをデコーダーに送り、コーデックIDが示すコーデックを用いて動画データを再生してもよい。
また、伝送する静止画や動画は異常時の行動のみならず、笑うなどの通常の行動に対応づけて伝送してもよい。笑顔の画像を伝送することで、安否確認を映像とともに行えるため、見守る側の安心感を向上させることが可能となる。見守り側の要求に合わせて、予め行動毎に伝送する映像を設定できるようにし、行動に合わせてその映像を伝送するようにしてもよい。ここでいう設定とは、行動に合わせて映像を伝送するか否か、映像を伝送する場合は静止画とするか動画とするかといった情報である。
以上の説明では、映像データを格納したブロック5をブロック4の直後に伝送する例であったが、ブロック5をブロック6の行動情報を伝送した後に送ってもよい。データ転送の効率やシステム設計に合わせ、ブロック5をブロック4の前や後に伝送しても、ブロック4と別のブロックの間に伝送してもよい。見守り側に問題が発生しない状態であれば、行動情報や映像データのブロックは、どのような順番で伝送してもよい。これは、行動情報からは映像ブロックIDフィールドによって対応する映像データのブロックを参照可能であり、反対に映像データからは、対応IDフィールドによって映像データを参照している行動情報のブロックIDを参照可能なため、ブロックの伝送順序に関係なく、対応する互いのブロックを参照することが可能となる。
〔処理フロー〕
次に、本実施の形態に係る異常時の認識データ伝送処理について説明する。
図14は、本実施形態に係る異常時の認識データ伝送処理を表すフローチャートである。
ステップS100からS111、S120からS121は前述と同様であるため、説明を省略する。
(ステップS131)
緊急時の行動情報を検出した場合に、それがどのような状況かを見守り側に知らせるには、その映像データを伝送することが一番良い方法である。そのため、緊急時の行動を検出した画像を前述の映像データブロックに格納し、伝送する。緊急時の行動情報を検出し、映像データを伝送する場合(ステップS131でYes)、ステップS132に進む。緊急時の行動情報を伝送し、映像データを伝送しない場合(ステップ131でNo)、ステップS110に進む。
(ステップS132)
緊急時の映像データを伝送する場合は、その行動情報を格納したブロックを伝送した後に、対応する映像データを格納したブロックを伝送する。伝送する映像データは複数ある場合があるため、行動情報のブロックを伝送した後に、映像データブロックを、行動情報に格納した映像ブロックIDの順番に伝送する。全ての行動情報のブロックと映像データのブロックを伝送し終えたら、ステップS110に進む。
以上により、緊急を要する異常時の行動情報を検出した場合に、その行動情報だけでなく、その映像データも素早く伝送することが可能となる。従って、見守る側が緊急を要する行動情報の通知を受けた場合でも、その程度や重要度が分かりにくいが、その映像を伝送することで、適切な対応をいち早く行うことが可能となる。また、緊急時の映像データだけでなく、普段の生活の起きた時の画像や、楽しんでいる画像を伝送することで、見守る側に安心感を与えることが可能となる。
以上の説明のように、本実施形態の方法により人物の行動を認識して、その行動単位で行動情報を伝送すれば、データ量の削減と見守る側の利便性を向上させることができる。さらに、「倒れた」等の異常時の行動を認識した場合は、その行動情報をその他の情報より優先度を上げた情報として格納し、先に伝送することで、異常時の行動を見守り側に素早く通知することが可能となる。また、異常時の行動では、その映像を付加することで、見守り側にその安否を確認する手段を素早く提供するとともに、伝送データ量を削減し、効率的な伝送量で、見守りを行うことができる。
これら少なくとも1つの撮像装置の撮影映像から、人の顔や動き、モーションを検出し、子供やお年寄りの見守りや、不審者の侵入の検出、家電機器の操作など、様々なアプリケーションに利用することが可能となる。
本発明の各実施の形態によれば、映像から検出した人物の特徴データやその行動データを見守り側に伝送することで、見守る側は常に伝送映像を視聴せずとも、例えば朝起きたTVを視聴している等の安全に生活しているといった情報や、倒れたなどの異常が発生したといった情報の通知を受けることが可能となる。また、映像から検出した人物の特徴データや行動データを人物が行動した単位で伝送することにより、伝送データ量を削減することができる。
さらに、見守られる側の映像データは伝送せず、行動データなどの検出情報を伝送することで、見守られる側のプライバシーに配慮した見守りシステムを実現することが可能となる。
尚、上記では人物の監視を行う例について説明したが、動物などを監視対象としても良い。
また、上述した実施形態における認識データ伝送装置の一部、例えば、動きベクトル検出部110、人物検出部111、ユーザ情報検出部112、モーション検出部113、行動認識部114、情報DB12、データ変換部13、伝送制御部14をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、認識データ伝送装置に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
また、上述した実施形態における認識データ伝送装置の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。認識データ伝送装置の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
また、本発明の各構成要素は、任意に取捨選択することができ、取捨選択した構成を具備する発明も本発明に含まれるものである。
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
本発明は、以下の開示を含む。
(付記)
(1)
少なくとも1つの撮像部と、
前記撮像部が撮像した映像から人物の特徴量を検出し、検出した前記特徴量から前記映像中の人物を特定する人物検出部と、
前記人物検出部が検出した人物に関する特徴量から
人物の動きや人物に関わる情報を含む人物の行動を認識する行動認識部と、
前記行動認識部が出力する認識情報を人の行動毎に時間軸上で分割し、分割したブロックデータを生成するデータ変換部と、
前記データ変換部が出力する前記ブロックデータを、認識データとしてブロック毎に外部に伝送する制御を行う伝送制御部と
を有することを特徴とする認識データ伝送装置。
本発明によれば、映像から検出された人物およびその行動を検知し、人物の行動単位でその情報を伝送することで、見守る側の利便性向上と伝送データの削減を両立させることができる。
(2)
少なくとも1つの撮像部と、
前記撮像部が撮像した映像から人物(の身体の一部、または全部)の特徴量を検出し、検出した前記特徴量から前記映像中の人物を特定する人物検出部と、
前記人物検出部が検出した人物に関する特徴量から人物の身体的特徴を表すユーザ情報を検出するユーザ情報検出部と、
前記ユーザ情報検出部が出力する前記ユーザ情報と、前記撮像部で撮像した映像と、からユーザのモーション(動きまたは身振り手振り)を検出するモーション検出部と、
前記モーション検出部が出力するモーション情報と、前記ユーザ情報とから、人物の動きを含む行動を認識する行動認識部と、
前記行動認識部が出力する認識情報を人の行動毎に時間軸上で分割し、分割したブロックデータを生成するデータ変換部と、
前記データ変換部が出力する前記ブロックデータを、認識データとしてブロック毎に外部に伝送する制御を行う伝送制御部と
を有することを特徴とする認識データ伝送装置。
本発明によれば、映像から検出された人物およびその行動を検知し、人物の行動単位でその情報を伝送することで、見守る側の利便性向上と伝送データの削減を両立させることができる。
(3)
さらに、前記行動認識部が出力する認識情報だけを出力し、外部に伝送することを特徴とする(1)または(2)に記載の認識データ伝送装置。
見守られる側を撮影した映像データは伝送せず、認識情報だけを外部に伝送することで、見守られる側のプライバシーが守られる(個人情報の秘匿性が向上する)ことと、伝送データの削減を両立することができる。
(4)
前記伝送制御部は、
前記行動が終了した時点を基準にしてその行動の検知が終了したと認識し、検知が終了した順番に行動情報を伝送することを特徴とする(1)から(3)までのいずれか1に記載の認識データ伝送装置。
1つの行動について、行動開始から終了までを行動情報の最小単位として伝送することを特徴とする。また、行動情報とともに、その映像を伝送する場合は、行動情報と映像データは行動の開始時間と終了時間とで参照すればよく、これにより、行動に対応する映像を検索することができる。
(5)
前記伝送制御部は、
前記行動が終了した時点が同じ場合には、行動開始時刻が早い順に行動情報の優先度を高く設定し、優先度の高い順に行動情報を伝送することを特徴とする(4)に記載の認識データ伝送装置。
その行動が認識できたものから伝送していくことで、効率良くデータ伝送を行うことができる。
また、同一時刻に終了した行動の行動情報があり、行動開始時刻も同じ行動情報があった場合は、予め優先度の高い人物を設定しておき、優先度の高い人物の行動には、より高い優先度を設定し、優先度の高い順に行動情報を伝送してもよい。
(6)
前記行動認識部が出力する前記認識情報のうち、(人物が居なくなっている、倒れて動けなくなっている、を含む)緊急を要する行動情報を検知したときは、前記人の行動毎に分割したブロックデータに緊急であることを示す緊急情報を格納し、
前記伝送制御部は、
前記緊急情報を有するブロックデータを、その他のブロックデータより先に伝送するように制御することを特徴とする(1)から(5)までのいずれか1に記載の認識データ伝送装置。
(7)
前記行動認識部は、前記緊急を要する行動情報を検知したときに、その行動情報に対応する前記撮像部が撮像した映像データを出力し、
前記伝送制御部は、前記緊急を要する行動情報を格納したブロックデータを除くその他のブロックデータより先に、前記緊急を要する行動情報と対応する映像データを伝送することを特徴とする(6)に記載の認識データ伝送装置。
(8)
前記データ変換部は、前記緊急を要する行動情報と、対応する映像データを互いに参照可能とする情報を格納することを特徴とする(7)に記載の認識データ伝送装置。
(9)
前記ユーザ情報検出部が出力する前記ユーザ情報は、人物の特徴情報(人物の顔の位置、顔の向き、性別、年齢、表情、人体部位を含む情報)であることを特徴とする(2)から(8)までのいずれか1に記載の認識データ伝送装置。
(10)
前記行動認識部が出力する前記認識情報は、(人物が立っている、座っている、寝ている、倒れている、居なくなっている、を含む)行動を示す情報であることを特徴とする(1)から(9)までのいずれか1に記載の認識データ伝送装置。
(11)
少なくとも1つの撮像部と、
前記撮像部が撮像した映像から人物(の身体の一部、または全部)の特徴量を検出し、検出した前記特徴量から前記映像中の人物を特定する人物検出部と、
前記人物検出部が検出した人物に関する特徴量から
人物の動きや人物に関わる情報を含む人物の行動を認識する行動認識部と、
前記行動認識部が出力する認識情報を人の行動毎に時間軸上で分割し、分割したブロックデータを生成するデータ変換部と、
前記データ変換部が出力する前記ブロックデータを、認識データとして記録部に記録させる記録制御部と
を有することを特徴とする認識データ記録装置。
本発明によれば、映像から検出された人物およびその行動を検知し、人物の行動単位でその情報を記録することで、見守る側の利便性向上と記憶データ量の削減を両立させることができる。
(12)
少なくとも1つの撮像部と、
前記撮像部が撮像した映像から人物(の身体の一部、または全部)の特徴量を検出し、検出した前記特徴量から前記映像中の人物を特定する人物検出部と、
前記人物検出部が検出した人物に関する特徴量から人物の身体的特徴を表すユーザ情報を検出するユーザ情報検出部と、
前記ユーザ情報検出部が出力する前記ユーザ情報と、前記撮像部で撮像した映像と、からユーザのモーション(動きまたは身振り手振り)を検出するモーション検出部と、
前記モーション検出部が出力するモーション情報と、前記ユーザ情報とから、人物の動きを含む行動を認識する行動認識部と、
前記行動認識部が出力する認識情報を人の行動毎に時間軸上で分割し、分割したブロックデータを生成するデータ変換部と、
前記データ変換部が出力する前記ブロックデータを、認識データとして記録部に記録させる記録制御部と
を有することを特徴とする認識データ記録装置。
本発明によれば、映像から検出された人物およびその行動を検知し、人物の行動単位でその情報を記録することで、見守る側の利便性向上と記憶データ量の削減を両立させることができる。
(13)
少なくとも1つの撮像部が撮像した映像から人物の特徴量を検出し、検出した前記特徴量から前記映像中の人物を特定する人物検出ステップと、
前記人物検出ステップで出力される人物に関する特徴量から人物の動きや人物に関わる情報を含む人物の行動を認識する行動認識ステップと、
前記行動認識ステップで出力される認識情報を人の行動毎に時間軸上で分割し、分割したブロックデータを生成するデータ変換ステップと、
前記データ変換ステップが出力する前記ブロックデータを、認識データとしてブロック毎に外部に伝送する制御を行う伝送制御ステップと
を有することを特徴とする認識データ伝送方法。
(14)
少なくとも1つの撮像部が撮像した映像から人物の特徴量を検出し、検出した前記特徴量から前記映像中の人物を特定する人物検出ステップと、
前記人物検出ステップにおいて検出した人物に関する特徴量から人物の身体的特徴を表すユーザ情報を検出するユーザ情報検出ステップと、
前記ユーザ情報検出ステップにおいて出力する前記ユーザ情報と、前記撮像部で撮像した映像と、からユーザのモーション(動きまたは身振り手振り)を検出するモーション検出ステップと、
前記モーション検出ステップで出力されるモーション情報と、前記ユーザ情報とから、人物の動きを含む行動を認識する行動認識ステップと、
前記行動認識ステップで出力される認識情報を人の行動毎に時間軸上で分割し、分割したブロックデータを生成するデータ変換ステップと、
前記データ変換ステップが出力する前記ブロックデータを、認識データとしてブロック毎に外部に伝送する制御を行う伝送制御ステップと
を有することを特徴とする認識データ伝送方法。
(15)
上記(13)または(14)に記載の認識データ伝送方法をコンピュータに実行させるためのプログラム。
(16)
上記(15)のプログラムを格納するコンピュータ読み取り可能な記録媒体。
(17)
少なくとも1つの撮像部が撮像した映像から人物(の身体の一部、または全部)の特徴量を検出し、検出した前記特徴量から前記映像中の人物を特定する人物検出ステップと、
前記人物検出ステップにおいて出力された人物に関する特徴量から人物の動きや人物に関わる情報を含む人物の行動を認識する行動認識ステップと、
前記行動認識ステップで出力された認識情報を人の行動毎に時間軸上で分割し、分割したブロックデータを生成するデータ変換ステップと、
前記データ変換ステップが出力する前記ブロックデータを、認識データとして記録部に記録させる記録制御ステップと
を有することを特徴とする認識データ記録方法。
(18)
少なくとも1つの撮像部が撮像した映像から人物(の身体の一部、または全部)の特徴量を検出し、検出した前記特徴量から前記映像中の人物を特定する人物検出ステップと、
前記人物検出ステップで検出された人物に関する特徴量から人物の身体的特徴を表すユーザ情報を検出するユーザ情報検出ステップと、
前記ユーザ情報検出ステップで出力された前記ユーザ情報と、前記撮像部で撮像した映像と、からユーザのモーション(動きまたは身振り手振り)を検出するモーション検出ステップと、
前記モーション検出ステップにおいて出力されたモーション情報と、前記ユーザ情報とから、人物の動きを含む行動を認識する行動認識ステップと、
前記行動認識ステップで出力された認識情報を人の行動毎に時間軸上で分割し、分割したブロックデータを生成するデータ変換ステップと、
前記データ変換ステップが出力する前記ブロックデータを、認識データとして記録部に記録させる記録制御ステップと
を有することを特徴とする認識データ記録方法。
(19)
上記(17)または(18)に記載の認識データ記録方法をコンピュータに実行させるためのプログラム。
(20)
上記(19)のプログラムを格納するコンピュータ読み取り可能な記録媒体。
本発明は、認識データ伝送装置として利用可能である。
10…撮像装置、101、102〜n…撮像部、11…映像解析部、12…情報DB、13…データ変換部、14…伝送制御部、110…動きベクトル検出部、111…人物検出部、112…ユーザ情報検出部、1120…属性推定部、1121…表情推定部、1122…人物識別部、1123…位置検出部、1124…人体部位検出部、113…モーション検出部、114…行動認識部。
本明細書で引用した全ての刊行物、特許および特許出願をそのまま参考として本明細書にとり入れるものとする。

Claims (9)

  1. 少なくとも1つの撮像部と、
    前記撮像部が撮像した映像から人又は動物の特徴量を検出し、検出した前記特徴量から前記映像中の人又は動物を特定する人物検出部と、
    前記人物検出部が検出した人又は動物に関する特徴量から人又は動物の動きや人又は動物に関わる情報を含む人又は動物の行動を認識する行動認識部と、
    前記行動認識部が出力する前記人又は動物の行動情報を含む認識情報を人又は動物の行動毎に時間軸上で分割し、分割した前記認識情報または前記認識情報に対応する映像のうちの少なくともいずれか一方を格納したブロックデータを、人又は動物の行動毎に生成するデータ変換部と、
    前記データ変換部が出力する前記ブロックデータを、認識データとしてブロック毎に外部に伝送する制御を行う伝送制御部と
    を有し、
    前記伝送制御部は、
    前記行動が終了した時点を基準にしてその行動の検知が終了したと認識し、検知が終了した順番に前記ブロックデータを伝送することを特徴とする認識データ伝送装置。
  2. 前記伝送制御部は、
    前記行動が終了した時点が同じ場合には、行動開始時刻が早い順に行動情報の優先度を高く設定し、優先度の高い順に前記ブロックデータを伝送することを特徴とする請求項に記載の認識データ伝送装置。
  3. 前記行動認識部が出力する前記認識情報のうち、緊急を要する行動情報を検知したときは、前記人又は動物の行動毎に生成したブロックデータに緊急であることを示す緊急情報を格納し、
    前記伝送制御部は、
    前記緊急情報を有するブロックデータを、その他のブロックデータより先に伝送するように制御することを特徴とする請求項1又は2に記載の認識データ伝送装置。
  4. 前記行動認識部は、前記緊急を要する行動情報を検知したときに、その行動情報に対応する前記撮像部が撮像した映像データを出力し、
    前記伝送制御部は、前記緊急を要する行動情報を格納したブロックデータを除くその他のブロックデータより先に、前記緊急を要する行動情報と対応する映像データを格納したブロックデータを伝送することを特徴とする請求項に記載の認識データ伝送装置。
  5. 前記データ変換部は、前記緊急を要する行動情報と対応する映像データについて、相手側を参照可能とする情報を、前記行動情報を格納したブロックデータと前記映像データを格納したブロックデータの少なくとも一方に格納することを特徴とする請求項に記載の認識データ伝送装置。
  6. 前記行動認識部が認識する認識情報のみを出力し、外部に伝送することを特徴とする請求項1に記載の認識データ伝送装置。
  7. 少なくとも1つの撮像部と、
    前記撮像部が撮像した映像から人又は動物の特徴量を検出し、検出した前記特徴量から前記映像中の人又は動物を特定する人物検出部と、
    前記人物検出部が検出した人又は動物に関する特徴量から人又は動物の動きや人又は動物に関わる情報を含む人又は動物の行動を認識する行動認識部と、
    前記行動認識部が出力する前記人又は動物の行動情報を含む認識情報を人又は動物の行動毎に時間軸上で分割し、分割した前記認識情報または前記認識情報に対応する映像のうちの少なくともいずれか一方を格納したブロックデータを、人又は動物の行動毎に生成するデータ変換部と、
    前記データ変換部が出力する前記ブロックデータを、認識データとして記録部に記録させる記録制御部と
    を有し、
    前記記録制御部は、
    前記行動が終了した時点を基準にしてその行動の検知が終了したと認識し、検知が終了した順番に前記ブロックデータを記録することを特徴とする認識データ記録装置。
  8. 少なくとも1つの撮像部が撮像した映像から人又は動物の特徴量を検出し、検出した前記特徴量から前記映像中の人又は動物を特定する人物検出ステップと、
    前記人物検出ステップで出力される人又は動物に関する特徴量から人又は動物の動きや人又は動物に関わる情報を含む人又は動物の行動を認識する行動認識ステップと、
    前記行動認識ステップで出力される前記人又は動物の行動情報を含む認識情報を人又は動物の行動毎に時間軸上で分割し、分割した前記認識情報または前記認識情報に対応する映像のうちの少なくともいずれか一方を格納したブロックデータを、人又は動物の行動毎に生成するデータ変換ステップと、
    前記データ変換ステップが出力する前記ブロックデータを、認識データとしてブロック毎に外部に伝送する制御を行う伝送制御ステップと
    を有し、
    前記伝送制御ステップは、
    前記行動が終了した時点を基準にしてその行動の検知が終了したと認識し、検知が終了した順番に前記ブロックデータを伝送することを特徴とする認識データ伝送方法。
  9. 少なくとも1つの撮像部が撮像した映像から人又は動物の特徴量を検出し、検出した前記特徴量から前記映像中の人又は動物を特定する人物検出ステップと、
    前記人物検出ステップで出力される人又は動物に関する特徴量から人又は動物の動きや人又は動物に関わる情報を含む人又は動物の行動を認識する行動認識ステップと、
    前記行動認識ステップで出力された前記人又は動物の行動情報を含む認識情報を人又は動物の行動毎に時間軸上で分割し、分割した前記認識情報または前記認識情報に対応する映像のうちの少なくともいずれか一方を格納したブロックデータを、人又は動物の行動毎に生成するデータ変換ステップと、
    前記データ変換ステップが出力する前記ブロックデータを、認識データとして記録部に記録させる記録制御ステップと
    を有し、
    前記記録制御ステップは、
    前記行動が終了した時点を基準にしてその行動の検知が終了したと認識し、検知が終了した順番に前記ブロックデータを記録することを特徴とする認識データ記録方法。
JP2015553487A 2013-12-17 2014-12-08 認識データ伝送装置、認識データ記録装置及び認識データ記録方法 Active JP6411373B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013260425 2013-12-17
JP2013260425 2013-12-17
PCT/JP2014/082371 WO2015093330A1 (ja) 2013-12-17 2014-12-08 認識データ伝送装置

Publications (2)

Publication Number Publication Date
JPWO2015093330A1 JPWO2015093330A1 (ja) 2017-03-16
JP6411373B2 true JP6411373B2 (ja) 2018-10-24

Family

ID=53402679

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015553487A Active JP6411373B2 (ja) 2013-12-17 2014-12-08 認識データ伝送装置、認識データ記録装置及び認識データ記録方法

Country Status (4)

Country Link
US (1) US10699541B2 (ja)
JP (1) JP6411373B2 (ja)
CN (1) CN105794191B (ja)
WO (1) WO2015093330A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102213859B1 (ko) * 2019-08-23 2021-02-08 ㈜ 한국공학기술연구원 이동식 감시 장치를 이용한 모니터링 시스템
KR102391575B1 (ko) * 2021-12-29 2022-04-28 주식회사 쉐카이나 비전카메라를 이용한 크레인 안전관리 시스템
RU2801088C1 (ru) * 2022-05-25 2023-08-01 Евгения Александровна Ахременко Устройство и способ дешифровки паттернов поведения животных в длительном актографическом эксперименте

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6669064B2 (ja) * 2014-06-19 2020-03-18 日本電気株式会社 情報提示装置、情報提示システム、情報提示方法、および、プログラム
JP6669948B2 (ja) * 2014-09-08 2020-03-18 日本電産株式会社 移動体制御装置及び移動体
JP6494466B2 (ja) * 2015-08-06 2019-04-03 三菱電機株式会社 機器制御装置、機器制御システム、機器制御方法及び機器制御プログラム
US9474042B1 (en) 2015-09-16 2016-10-18 Ivani, LLC Detecting location within a network
US11533584B2 (en) 2015-09-16 2022-12-20 Ivani, LLC Blockchain systems and methods for confirming presence
US10455357B2 (en) 2015-09-16 2019-10-22 Ivani, LLC Detecting location within a network
US10665284B2 (en) 2015-09-16 2020-05-26 Ivani, LLC Detecting location within a network
US11350238B2 (en) 2015-09-16 2022-05-31 Ivani, LLC Systems and methods for detecting the presence of a user at a computer
US10321270B2 (en) 2015-09-16 2019-06-11 Ivani, LLC Reverse-beacon indoor positioning system using existing detection fields
US10325641B2 (en) 2017-08-10 2019-06-18 Ivani, LLC Detecting location within a network
US10382893B1 (en) 2015-09-16 2019-08-13 Ivani, LLC Building system control utilizing building occupancy
US10277836B2 (en) * 2016-03-07 2019-04-30 Ricoh Company, Ltd. Communication terminal, image management apparatus, image processing system, method for controlling display, and computer program product
US10957171B2 (en) 2016-07-11 2021-03-23 Google Llc Methods and systems for providing event alerts
US10380429B2 (en) 2016-07-11 2019-08-13 Google Llc Methods and systems for person detection in a video feed
EP3340104B1 (en) * 2016-12-21 2023-11-29 Axis AB A method for generating alerts in a video surveillance system
JP6842964B2 (ja) * 2017-03-24 2021-03-17 セコム株式会社 ウェアラブル端末、安否確認システム、安否確認方法およびプログラム
JP2018173763A (ja) * 2017-03-31 2018-11-08 積水化学工業株式会社 行動支援システム、行動支援方法
WO2018201121A1 (en) * 2017-04-28 2018-11-01 Cherry Labs, Inc. Computer vision based monitoring system and method
US10599950B2 (en) 2017-05-30 2020-03-24 Google Llc Systems and methods for person recognition data management
US11783010B2 (en) 2017-05-30 2023-10-10 Google Llc Systems and methods of person recognition in video streams
EP3410413B1 (en) 2017-06-02 2021-07-21 Netatmo Improved generation of alert events based on a detection of objects from camera images
US11134227B2 (en) 2017-09-20 2021-09-28 Google Llc Systems and methods of presenting appropriate actions for responding to a visitor to a smart home environment
US10664688B2 (en) 2017-09-20 2020-05-26 Google Llc Systems and methods of detecting and responding to a visitor to a smart home environment
CN108082478B (zh) * 2017-12-16 2021-11-16 深圳市翼飞鸿天无人机科技有限公司 一种预警型无人机监视侦查系统
JP6828713B2 (ja) * 2018-03-30 2021-02-10 ダイキン工業株式会社 心身状態認識システム
JP7104563B2 (ja) * 2018-06-08 2022-07-21 シャープ株式会社 動物識別装置、動物識別装置の制御方法およびプログラム
CN108921098B (zh) * 2018-07-03 2020-08-18 百度在线网络技术(北京)有限公司 人体运动分析方法、装置、设备及存储介质
WO2020058570A1 (en) 2018-09-20 2020-03-26 Nokia Technologies Oy An apparatus and a method for artificial intelligence
CN110263743B (zh) * 2019-06-26 2023-10-13 北京字节跳动网络技术有限公司 用于识别图像的方法和装置
US11893795B2 (en) 2019-12-09 2024-02-06 Google Llc Interacting with visitors of a connected home environment
CN113037311A (zh) * 2021-02-24 2021-06-25 重庆工程职业技术学院 一种用于室内定位导航的手环
JP2022133547A (ja) * 2021-03-02 2022-09-14 株式会社日立製作所 映像解析システム、及び映像解析方法
CN112949512B (zh) * 2021-03-08 2022-07-08 豪威芯仑传感器(上海)有限公司 一种动态手势识别方法、手势交互方法及交互系统
CN113645504B (zh) * 2021-07-30 2022-08-02 深圳市悦道科技有限公司 一种tv应用软件管理系统及方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6049281A (en) * 1998-09-29 2000-04-11 Osterweil; Josef Method and apparatus for monitoring movements of an individual
JP4736171B2 (ja) 2000-10-20 2011-07-27 日本ビクター株式会社 監視用信号の通信方法、及び監視用信号通信装置
US6678413B1 (en) * 2000-11-24 2004-01-13 Yiqing Liang System and method for object identification and behavior characterization using video analysis
JP2005318445A (ja) 2004-04-30 2005-11-10 Funai Electric Co Ltd 遠隔見守りシステムの宅内装置
JP2006260524A (ja) * 2005-02-16 2006-09-28 Nonomura Denshi Giken:Kk 介護通報装置
US8704668B1 (en) * 2005-04-20 2014-04-22 Trevor Darrell System for monitoring and alerting based on animal behavior in designated environments
JP2007243342A (ja) * 2006-03-06 2007-09-20 Yokogawa Electric Corp 画像監視装置及び画像監視システム
US7642035B2 (en) * 2006-04-13 2010-01-05 Industrial Technology Research Institute Sensitized photochemical switching for cholesteric liquid crystal displays
JP4389971B2 (ja) * 2007-06-19 2009-12-24 ミツミ電機株式会社 指紋画像形成装置及びこれに用いる指移動量推定方法
JP2009009413A (ja) * 2007-06-28 2009-01-15 Sanyo Electric Co Ltd 動作検知装置及び動作検知プログラム、並びに動作基本モデル生成装置及び動作基本モデル生成プログラム
US7557759B2 (en) * 2007-07-02 2009-07-07 Cheng Uei Precision Industry Co., Ltd. Integrated multi-band antenna
JP2009033564A (ja) * 2007-07-27 2009-02-12 Sanyo Electric Co Ltd 表示装置及び表示プログラム
US20090033564A1 (en) * 2007-08-02 2009-02-05 Nigel Power, Llc Deployable Antennas for Wireless Power
JP5227046B2 (ja) * 2008-02-25 2013-07-03 綜合警備保障株式会社 動作検出装置および動作検出方法
JP4716139B2 (ja) * 2008-05-14 2011-07-06 アイシン精機株式会社 周辺監視装置
JP4636135B2 (ja) 2008-08-04 2011-02-23 ソニー株式会社 画像処理装置、撮像装置、画像処理方法およびプログラム
JP5293270B2 (ja) * 2009-02-27 2013-09-18 オムロン株式会社 撮影対象選択装置、撮影対象選択装置の制御方法、撮影対象選択装置制御プログラムおよび該プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2012004720A (ja) * 2010-06-15 2012-01-05 Hitachi Ltd 監視装置、及び監視システム
WO2013183738A1 (ja) 2012-06-08 2013-12-12 ソニー株式会社 情報処理装置、情報処理方法、プログラムおよび監視カメラシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102213859B1 (ko) * 2019-08-23 2021-02-08 ㈜ 한국공학기술연구원 이동식 감시 장치를 이용한 모니터링 시스템
KR102391575B1 (ko) * 2021-12-29 2022-04-28 주식회사 쉐카이나 비전카메라를 이용한 크레인 안전관리 시스템
WO2023128015A1 (ko) * 2021-12-29 2023-07-06 주식회사 쉐카이나 비전카메라를 이용한 크레인 안전관리 시스템
RU2801088C1 (ru) * 2022-05-25 2023-08-01 Евгения Александровна Ахременко Устройство и способ дешифровки паттернов поведения животных в длительном актографическом эксперименте

Also Published As

Publication number Publication date
US20160335861A1 (en) 2016-11-17
US10699541B2 (en) 2020-06-30
CN105794191A (zh) 2016-07-20
CN105794191B (zh) 2019-04-09
WO2015093330A1 (ja) 2015-06-25
JPWO2015093330A1 (ja) 2017-03-16

Similar Documents

Publication Publication Date Title
JP6411373B2 (ja) 認識データ伝送装置、認識データ記録装置及び認識データ記録方法
US11120559B2 (en) Computer vision based monitoring system and method
US10083599B2 (en) Remote user interface and display for events for a monitored location
CN108027874B (zh) 使用深度摄像头的基于计算机视觉的安全系统
JP2018120644A (ja) 識別装置、識別方法およびプログラム
JP6339445B2 (ja) 人物識別装置
JP5674406B2 (ja) 自律移動体を用いた監視システム、監視装置、自律移動体、監視方法、及び監視プログラム
JP5390322B2 (ja) 画像処理装置、及び画像処理方法
CN106162073A (zh) 通信设备
US8644614B2 (en) Image processing apparatus, image processing method, and storage medium
JP4622301B2 (ja) 監視システム、および監視カメラ
WO2013069565A1 (ja) 撮影記録装置
CN108351965B (zh) 视频摘要的用户界面
JP6941950B2 (ja) 画像提供システム、画像提供方法、および画像提供プログラム
EP3616095A1 (en) Computer vision based monitoring system and method
JP2008541650A (ja) モニタリング方法および装置
JP6461511B2 (ja) 監視装置及びプログラム
JP7243725B2 (ja) 対象物体検出プログラム、および対象物体検出装置
JP2016021716A (ja) 追尾装置及びその制御方法
WO2022249635A1 (ja) 行動検知システムおよび行動検知プログラム
JP7465644B2 (ja) 監視システム、及び監視方法
KR20220077639A (ko) 실내형 촬영디바이스 시스템 및 실내형 촬영디바이스 시스템의 동작 방법
CN116824663A (zh) 人脸识别方法、装置、分体式设备、电子设备及存储介质
WO2019056245A1 (zh) 家庭安防方法和终端
JP2017045423A (ja) 映像処理装置、映像処理方法、映像処理システム、およびプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170620

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180926

R150 Certificate of patent or registration of utility model

Ref document number: 6411373

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150