JP6572535B2 - 画像認識システム、サーバ装置及び画像認識方法 - Google Patents

画像認識システム、サーバ装置及び画像認識方法 Download PDF

Info

Publication number
JP6572535B2
JP6572535B2 JP2014250080A JP2014250080A JP6572535B2 JP 6572535 B2 JP6572535 B2 JP 6572535B2 JP 2014250080 A JP2014250080 A JP 2014250080A JP 2014250080 A JP2014250080 A JP 2014250080A JP 6572535 B2 JP6572535 B2 JP 6572535B2
Authority
JP
Japan
Prior art keywords
image
camera
captured
learning
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014250080A
Other languages
English (en)
Other versions
JP2016110578A (ja
Inventor
亮介 笠原
亮介 笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2014250080A priority Critical patent/JP6572535B2/ja
Priority to US14/958,271 priority patent/US20160171310A1/en
Priority to EP15197926.7A priority patent/EP3032376A1/en
Publication of JP2016110578A publication Critical patent/JP2016110578A/ja
Application granted granted Critical
Publication of JP6572535B2 publication Critical patent/JP6572535B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources

Description

本発明は画像認識システム、サーバ装置及び画像認識方法に関する。
通信環境の発達に伴い、クラウドコンピューティングサービス又は単にクラウドサービスと呼ばれるサービス事業が一般的になってきている。クラウドサービスはユーザがインターネットの向こう側からサービスを受け、サービス料金を支払う形態のサービスである。また近年、画像に写っている人物を識別したり、写っている物体の一般的な名称を認識したりする画像認識の処理アルゴリズムの開発が進んでいる。
特許文献1には、画像認識処理を利用して、画像データに関連する広告情報を取得する広告管理システムの発明が開示されている。特許文献2には、実際の商品陳列棚に陳列されている商品を、複数のカメラで撮像および画像認識して棚卸管理する方法と画像認識による棚卸システムの発明が開示されている。特許文献3には、様々なネットワークにおいて、画像情報を多目的に活用できるオープンなビジネスプラットホームを提供するビデオサーバシステムの発明が開示されている。
しかしながら従来の技術では、様々な画像認識処理を利用したサービスを提供するためには、サービス毎にシステムを構築する必要があった。
本発明は、上記に鑑みてなされたものであって、様々な画像認識処理を利用したサービスをより簡易に提供することができる画像認識システム、サーバ装置及び画像認識方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、少なくとも1つのカメラと、サーバ装置と、を含む画像認識システムであって、前記カメラは、撮影画像を取得する撮影部と、前記撮影画像を前記サーバ装置に送信する第1通信部と、前記撮影画像を記憶する第1記憶部と、を備え、前記サーバ装置は、前記カメラを識別する第1識別情報と、画像認識処理を識別する第2識別情報と、を含む画像認識要求を受信すると、前記第1識別情報により識別される前記カメラに画像撮影要求を送信することにより、前記第1識別情報により識別される前記カメラから前記撮影画像を受信する第2通信部と、受信された前記撮影画像に、前記第2識別情報により識別される画像認識処理を行う認識部と、複数の前記撮影画像を含む学習画像を使用して、前記撮影画像が正常画像であることを特定する学習結果情報を取得する学習部と、を備え、前記認識部は、前記学習結果情報と、前記撮影画像と、を比較することにより、前記撮影画像が異常画像であるか否かを認識し、前記第2通信部は、前記第2識別情報により識別される画像認識処理の結果を示す情報を、指定された装置に送信し、前記認識部が前記異常画像を認識したときに、前記異常画像として検出された前記撮影画像を撮影したカメラに画像記憶要求を送信し、前記異常画像として検出された前記撮影画像を撮影したカメラは、前記第1通信部が前記画像記憶要求を受信すると、前記撮影画像を前記第1記憶部に記憶する
本発明によれば、様々な画像認識処理を利用したサービスをより簡易に提供することができるという効果を奏する。
図1は実施形態の画像認識システムの構成の例を示す図である。 図2は実施形態のカメラの構成の例を示す図である。 図3は実施形態の画像認識サーバ装置の構成の例を示す図である。 図4Aは学習画像の例を示す図である。 図4Bは学習画像の例を示す図である。 図4Cは学習画像の例を示す図である。 図5Aは正常画像の例を示す図である。 図5Bは異常画像の例を示す図である。 図5Cは異常画像の例を示す図である。 図6は異常画像の例を示す図である。 図7は実施形態の画像認識サーバ装置の画像認識方法の例を示すフローチャートである。 図8は実施形態のカメラの撮影画像の撮影方法の例を示すフローチャートである。 図9は実施形態の画像認識サーバ装置の画像学習方法の例を示すフローチャートである。 図10は実施形態のカメラの学習画像の撮影方法の例を示すフローチャートである。 図11は実施形態の画像認識サーバ装置の画像認識方法の例を示すフローチャートである。 図12は実施形態のカメラの撮影画像の記憶方法の例を示すフローチャートである。 図13は実施形態のカメラのハードウェア構成の例を示す図である。 図14は実施形態の画像認識サーバ装置のハードウェア構成の例を示す図である。
以下に添付図面を参照して、画像認識システム及び画像認識方法の実施形態を詳細に説明する。
図1は実施形態の画像認識システム100の構成の例を示す図である。実施形態の画像認識システム100は、カメラ10−1、カメラ10−2、・・・、カメラ10−N(Nは1以上の整数)、画像認識サーバ装置20、サービス提供サーバ装置30、データサーバ装置40及び情報処理装置50を備える。
カメラ10−1、カメラ10−2、・・・、及びカメラ10−Nは、画像認識サーバ装置20と互いに通信できるように接続されている。以下、カメラ10−1、カメラ10−2、・・・、及びカメラ10−Nを区別しない場合は単にカメラ10という。カメラ10の数は任意でよい。また画像認識サーバ装置20、サービス提供サーバ装置30及びデータサーバ装置40は、互いに通信できるように接続されている。またサービス提供サーバ装置30、データサーバ装置40及び情報処理装置50は、互いに通信できるように接続されている。
なおカメラ10−1、カメラ10−2、・・・、カメラ10−N、画像認識サーバ装置20、サービス提供サーバ装置30、データサーバ装置40及び情報処理装置50を、同一のネットワークに接続することにより、互いに通信できるようにしてもよい。また通信方式は、無線方式でも有線方式でもよく、また無線方式及び有線方式を組み合わせてもよい。
カメラ10は、カメラ10が設置された場所の周囲を撮影することにより、撮影画像を取得する。なおカメラ10の撮影方式は任意でよい。カメラ10は、例えばカラーの撮影画像を取得するカメラ、モノクロの撮影画像を取得するカメラ、分光撮影画像を取得するカメラ、偏光撮影画像を取得するカメラ、距離情報を取得するステレオカメラ、又は、TOF(Time of Flight)を計測するカメラ等である。カメラ10の構成の詳細については後述する。
画像認識サーバ装置20は、サービス提供サーバ装置30から画像認識要求を受信すると、当該画像認識要求に応じて撮影画像に画像認識処理を行う。画像認識処理は、撮影画像から情報を認識する処理である。画像認識処理は、例えば撮影画像に写っている車両の数を認識する処理、及び、撮影画像に写っている人の顔の数を認識する処理等である。画像認識サーバ装置20は、画像認識処理の結果を示す情報を、サービス提供サーバ装置30又はデータサーバ装置40等の指定された装置に送信する。画像認識サーバ装置20の構成の詳細については後述する。
サービス提供サーバ装置30は、情報処理装置50のユーザにサービスを提供する。サービス提供サーバ装置30により提供されるサービスは任意でよい。サービスは、例えば道路を走る車両の交通量を調査するサービス、及び、周囲に人がいるか否かを認識するサービス等である。
データサーバ装置40は、画像認識サーバ装置20による画像認識処理の結果を記憶する。
情報処理装置50は、サービス提供サーバ装置30又はデータサーバ装置40から、画像認識サーバ装置20による画像認識処理の結果を示す情報を取得する。
まずカメラ10の構成について具体的に説明する。
図2は実施形態のカメラ10の構成の例を示す図である。実施形態のカメラ10は、第1通信部11、撮影部12、生成部13及び第1記憶部14を備える。
<画像撮影要求を受信した場合の動作>
第1通信部11は、画像認識サーバ装置20から画像撮影要求を受信すると、当該画像撮影要求を撮影部12に入力する。画像撮影要求は、画像認識処理を識別する認識処理ID(第2識別情報)、及び、撮影画像を撮影するタイミングを示すタイミング情報を含む。
タイミング情報は、撮影指定時刻及び撮影周期等を含み、撮影画像を動画として撮影する場合は撮影時間等も含む。撮影周期は、例えば10秒等である。撮影時間は、例えば30分等である。なお画像撮影要求にタイミング情報を含めずに、撮影画像を撮影するタイミングで、その都度、画像認識サーバ装置20から画像撮影要求を受信してもよい。
撮影部12は、第1通信部11から画像撮影要求を受け付けると、画像撮影要求に含まれるタイミング情報により示されるタイミングで撮影を行うことにより、撮影画像を取得する。このとき撮影部12は、画像撮影要求に含まれる認識処理IDに応じて撮影方式を決定する。撮影部12は、例えば認識処理IDに応じて撮影画像を動画又は静止画として撮影する。撮影部12は、画像撮影要求に含まれる認識処理IDとともに、撮影画像を生成部13に入力する。
生成部13は、撮影部12から認識処理ID及び撮影画像を受け付けると、認識処理IDに応じて撮影画像のデータ形式を変更、又は、撮影画像から特徴量を抽出することにより、撮影画像に基づく情報を生成する。なお生成部13は、認識処理IDに応じて、撮影画像のデータ形式の変更と、特徴量の抽出の両方を行うことにより、撮影画像に基づく情報を生成してもよい。また撮影画像に基づく情報は、撮影画像そのものであってもよい。
まず認識処理IDに応じて撮影画像のデータ形式を変更することにより、撮影画像に基づく情報を生成する場合について説明する。
具体的には、生成部13は、送信対象とする撮影画像の領域、撮影画像の諧調、撮影画像の解像度、撮影画像のフレーム数、及び、撮影画像の圧縮率(bmp形式(非圧縮)、tif形式(可逆圧縮)及びjpeg形式(非可逆圧縮)等の撮影画像のファイルフォーマット)等を認識処理IDに応じて変更することにより、撮影画像に基づく情報を生成する。これにより画像認識処理に応じて適切に、撮影画像に係る情報の圧縮又は削減を行うことができる。
なお撮影画像に係る情報の圧縮又は削減を行わない撮影画像を、カメラ10から画像認識サーバ装置20に送信する場合、撮影画像に含まれる全ての情報を失わないため、どのような認識処理にも対応することが可能である。しかしながらカメラ10から画像認識サーバ装置20に送信される撮影画像のデータ量が多いため、画像認識サーバ装置20がサービス提供サーバ装置30から画像認識要求を受信してから返答するまでのレイテンシが大きくなる。また通信回線を通るデータ量が多くなり、通信コストが上がる。そのため撮影画像を送信する前に、当該撮影画像に係る情報の圧縮又は削減を行うことが望ましい。
例えば認識処理IDにより示される画像認識処理が、撮影画像に含まれる人を認識する認識処理である場合、生成部13は、撮影画像のデータ形式を、撮影画像の諧調が2値又はグレースケールで表されたモノクロの撮影画像に変更することにより、撮影画像に基づく情報を生成する。
また例えば認識処理IDにより示される画像認識処理が、撮影画像に含まれる物体の名称を認識する一般物体認識処理である場合、生成部13は、撮影画像の諧調は、カラーの撮影画像のまま情報を削減せずに、撮影画像に基づく情報を生成する。
また例えば認識処理IDにより示される画像認識処理が、常に同じ場所(方向)を撮影することにより得られる撮影画像の認識処理である場合、生成部13は、撮影画像から撮影画像の一部の領域を切り出すことにより、撮影画像に基づく情報を生成する。撮影画像の一部の領域は、例えば背景等のほぼ変化がない領域を除いた領域、又は、認識処理に使用される予め定められた領域等である。
また例えば認識処理IDにより示される画像認識処理が、高い解像度の情報が必要ない認識処理である場合、生成部13は、撮影画像の圧縮率を高めたり、撮影画像の解像度を低くしたりすることにより、撮影画像に基づく情報を生成する。
また例えば認識処理IDにより示される画像認識処理が、人が手を振る動作を認識する認識処理である場合、生成部13は、撮影画像のデータ形式を、動画又は複数の静止画とし、当該動画又は複数の静止画に適切な圧縮処理を行うことにより、撮影画像に基づく情報を生成する。
次に認識処理IDに応じて撮影画像の特徴量を抽出することにより、撮影画像に基づく情報を生成する場合について説明する。
具体的には、生成部13は、認識処理IDに応じて、撮影画像からSIFT(Scale−Invariant Feature Transform)特徴量、Surf(Speeded Up Robust Features)特徴量、Haar−like特徴量又はHOG(Histograms of Oriented Gradients)特徴量等を抽出する。
例えば認識処理IDにより示される画像認識処理が、撮影画像に含まれる人を認識する認識処理である場合、生成部13は、撮影画像からHOG特徴量を抽出することにより、撮影画像に基づく情報を生成する。
生成部13は、撮影画像に基づく情報を第1通信部11に入力する。第1通信部11は、生成部13から撮影画像に基づく情報を受け付けると、当該撮影画像に基づく情報を暗号化して画像認識サーバ装置20に送信する。
<学習画像撮影要求を受信した場合の動作>
第1通信部11は、画像認識サーバ装置20から学習画像撮影要求を受信すると、当該学習画像撮影要求を撮影部12に入力する。学習画像撮影要求は、画像認識処理を識別する認識処理ID(第2識別情報)、及び、学習画像を撮影するタイミングを示すタイミング情報を含む。
撮影部12は、第1通信部11から学習画像撮影要求を受け付けると、学習画像撮影要求に含まれるタイミング情報により示されるタイミングで撮影を行うことにより、学習画像を取得する。撮影部12は、例えば10秒間隔で60分間撮影することにより、複数の撮影画像を、学習画像として撮影する。撮影部12は、画像撮影要求に含まれる認識処理IDとともに、学習画像を生成部13に入力する。
生成部13は、撮影部12から認識処理ID及び学習画像を受け付けると、認識処理IDに応じて学習画像のデータ形式を変更、又は、学習画像から特徴量を抽出することにより、学習画像に基づく情報を生成する。なお生成部13は、認識処理IDに応じて、学習画像のデータ形式の変更と、特徴量の抽出の両方を行うことにより、学習画像に基づく情報を生成してもよい。データ形式の変更、及び、特徴量の抽出は、学習画像に含まれる複数の撮影画像のそれぞれについて行う。なお学習画像に基づく情報は、学習画像そのもの(複数の撮影画像)でもよい。
生成部13は、学習画像に基づく情報を第1通信部11に入力する。第1通信部11は、生成部13から学習画像に基づく情報を受け付けると、当該学習画像に基づく情報を暗号化して画像認識サーバ装置20に送信する。
<画像記憶要求を受信した場合の動作>
第1通信部11は、画像認識サーバ装置20から画像記憶要求を受信すると、当該画像記憶要求を撮影部12に入力する。画像記憶要求は、撮影画像を撮影するタイミングを示すタイミング情報、及び、撮影画像のフレームレート等を含む。
撮影部12は、第1通信部11から画像記憶要求を受け付けると、画像記憶要求に含まれるタイミング情報により示されるタイミングで撮影を行うことにより、撮影画像を取得する。タイミング情報により示されるタイミングは、撮影指定時刻から30分間等である。撮影部12は、撮影画像を第1記憶部14に記憶する。
第1記憶部14は、第1通信部11が画像認識サーバ装置20から画像記憶要求を受信すると、撮影部12により取得された撮影画像を記憶する。
次に画像認識サーバ装置20の構成について具体的に説明する。
図3は実施形態の画像認識サーバ装置20の構成の例を示す図である。実施形態の画像認識サーバ装置20は、第2通信部21、認識部22、学習部23及び第2記憶部24を備える。
<画像認識要求を受信した場合の動作>
第2通信部21は、カメラ10を識別するカメラID(第1識別情報)と、画像認識処理を識別する認識処理ID(第2識別情報)と、を含む画像認識要求を、サービス提供サーバ装置30から受信する。具体的には、画像認識要求は、サービス提供サーバ装置30から、画像認識サーバ装置20のWebAPIの呼び出し(実行)により実現される。ここで画像認識要求のWebAPIの例について説明する。
例えば第2通信部21が、サービス提供サーバ装置30から「http://xxx.yyy.com/mysite/cgi−bin/camera1−face.cgi」を受け付けた場合、camera1は、カメラIDが1であることを示し、faceは、撮影画像から顔の数を認識する画像認識処理を示す。camera1−face.cgiは、撮影画像から顔の数を認識する画像認識処理を実行するCGI(Common Gateway Interface)プログラムであり、当該画像認識処理に使用されるパラメータ等の情報を含む。
また例えば第2通信部21が、サービス提供サーバ装置30から「http://xxx.yyy.com/mysite/cgi−bin/camera2−human.cgi」を受け付けた場合、camera2は、カメラIDが2であることを示し、humanは、撮影画像から人の数を認識する画像認識処理を示す。camera2−human.cgiは、撮影画像から人の数を認識する画像認識処理を実行するCGIプログラムであり、当該画像認識処理に使用されるパラメータ等の情報を含む。
また例えば第2通信部21が、サービス提供サーバ装置30から「http://xxx.yyy.com/mysite/cgi−bin/camera3−god.cgi」を受け付けた場合、camera3は、カメラIDが3であることを示し、godは、撮影画像に含まれる物体の名称を認識する画像認識処理を示す。camera3−god.cgiは、撮影画像に含まれる物体の名称を認識する画像認識処理を実行するCGIプログラムであり、当該画像認識処理に使用されるパラメータ等の情報を含む。
第2通信部21は、サービス提供サーバ装置30から画像認識要求(WebAPIの呼び出し)を受信すると、当該画像認識要求に含まれるカメラIDにより識別されるカメラ10に上述の画像撮影要求を送信する。このとき第2通信部21は、カメラ10が撮影画像を取得するときの設定情報、及び、撮影画像を取得する上述のタイミング情報等を撮影画像要求に含めてもよい。設定情報は、例えばカメラ10が暗い場所を撮影するカメラである場合、カメラ10に備えられているライトを、撮影画像を取得するときに点灯させることを示す情報等である。これにより撮影画像を取得するとき以外は、カメラ10のライトを消灯させることができるので、カメラ10の消費電力を削減することができる。またタイミング情報は、画像認識要求のWebAPIに応じて画像撮影要求に設定されてもよいし、所定のタイミング情報が画像撮影要求に設定されてもよい。
第2通信部21は、画像撮影要求の応答として、カメラ10から暗号化された上述の撮影画像に基づく情報を受信すると、暗号化された撮影画像に基づく情報を復号し、当該撮影画像に基づく情報を、カメラID及び認識処理IDとともに認識部22に入力する。
認識部22は、第2通信部21から撮影画像に基づく情報と、カメラIDと、認識処理IDと、を受け付けると、当該認識処理IDにより識別される画像認識処理を行う。このとき認識部22は、カメラ10の撮影方式に応じて最適な画像認識処理を行う。具体的には、認識部22は、例えばカメラIDとカメラの撮影方式とが関連付けられた撮影方式情報と、カメラの撮影方式とパラメータとが関連付けられたパラメータ情報と、を保持する。これにより認識部22は、撮影方式情報と、第2通信部21から受け付けたカメラIDとから、カメラ10の撮影方式を特定する。そして認識部22は、パラメータ情報と、特定されたカメラ10の撮影方式とから、当該カメラ10により撮影された撮影画像の画像認識処理に使用される最適なパラメータを決定することにより、カメラ10の撮影方式に応じて最適な画像認識処理を行う。
認識部22は、画像認識処理の結果を示す情報を第2通信部21に入力する。このとき認識部22は、認識処理の結果を示す情報に、撮影画像に含まれる個人情報を特定できる情報を含めないようにする。例えば認識部22は、画像認識処理の結果として撮影画像に含まれる人の数が得られた場合、当該撮影画像は画像認識処理の結果に含めずに、人の数を示すテキスト情報のみを画像認識処理の結果に含める。これにより撮影画像に含まれる人のプライバシーの侵害を防ぐことができる。
第2通信部21は、認識部22から画像認識処理の結果を示す情報を受け付けると、当該画像認識処理の結果を示す情報を、サービス提供サーバ装置30又はデータサーバ装置40等の指定された装置に送信する。具体的には、第2通信部21は画像認識処理の結果を示す情報をWebAPIにより、サービス提供サーバ装置30又はデータサーバ装置40等の指定された装置に送信する。
なお画像認識処理の結果の送信先となる装置は、画像認識サービスの種類、又は、サービスの提供を受けるユーザ等に応じて任意に定めてよい。また画像認識処理の結果を示す情報を送信するWebAPIのフォーマットは任意でよい。画像認識処理の結果を示す情報を送信するWebAPIのフォーマットは、例えばxml形式、JSON形式又はCSV形式等である。サービス提供サーバ装置30は、画像認識サーバ装置20から画像認識処理の結果を示す情報を受信すると、画像認識処理の結果を示す情報に応じた処理を行う。画像認識処理の結果を示す情報に応じた処理は任意でよい。画像認識処理の結果を示す情報に応じた処理は、例えばユーザにより予め登録されたメールアドレスにメールを送信する処理、及び、ドアの鍵を解錠するようにメカを駆動する処理等である。
<学習要求を受信した場合の動作>
また第2通信部21は、カメラ10を識別するカメラID(第1識別情報)と、学習画像を取得するタイミングを示すタイミング情報と、学習結果情報を識別する学習結果識別IDと、を含む学習要求を、サービス提供サーバ装置30から受信する。具体的には、学習要求はサービス提供サーバ装置30から、画像認識サーバ装置20のWebAPIの呼び出し(実行)により実現される。ここで学習要求のWebAPIの例について説明する。
例えば第2通信部21が、サービス提供サーバ装置30から「http://xxx.yyy.com/mysite/cgi−bin/learning?camera=1&time=1&timewid=600&result=1」を受け付けた場合について説明する。camera=1はカメラIDが1であることを示す。time=1は撮影周期が1秒であることを示す。timewid=600は学習画像を取得する時間が600分間であることを示す。result=1は学習結果情報を識別する学習結果識別IDが1であることを示す。学習結果識別IDを、後述の環境情報と関連付けることにより、カメラ10の周囲の環境に応じて学習画像を使い分けることが可能になる。
第2通信部21は、サービス提供サーバ装置30から学習要求(WebAPIの呼び出し)を受信すると、カメラIDにより識別されるカメラ10に上述の学習画像撮影要求を送信する。そして第2通信部21は、カメラ10から暗号化された上述の学習画像に基づく情報を受信すると、暗号化された学習画像に基づく情報を復号し、当該学習画像に基づく情報を学習部23に入力する。
学習部23は、第2通信部21から学習画像に基づく情報を受け付けると、当該学習画像に基づく情報を使用して、撮影画像が正常な画像であることを示す正常画像を特定する学習結果情報を取得する。ここで学習結果情報の例として、学習画像に基づく情報が、学習画像そのもの(複数の撮影画像)である場合について説明する。
まず学習部23は、学習画像に含まれる複数の撮影画像の1枚を取得し、当該撮影画像を64x64ピクセルのメッシュに分割する。次に学習部23は、メッシュ毎にRGBの輝度ヒストグラムを算出する。次に学習部23は、学習画像に含まれる全ての撮影画像について、メッシュ毎にRGBの輝度ヒストグラムを積算する。学習部23は、メッシュ毎に積算されたRGBの輝度ヒストグラムを、学習結果情報とする。
なお学習部23は、認識部22による画像認識が、学習に使用された学習画像のみに過適応しないように、学習画像として使用される複数の撮影画像に、所定のノイズを付加してから、撮影画像が正常な画像であることを示す正常画像の学習を行ってもよい。
次に学習画像の例について説明する。
図4A乃至図4Cは学習画像の例を示す図である。図4A乃至図4Cの例は、複数(例えば50枚)の撮影画像を含む学習画像のうち、3枚の撮影画像を例示した場合の例である。撮影画像に含まれる扇風機は、首を左右に振る状態で動作している。学習部23は、複数の撮影画像を含む学習画像により、この状態を正常画像として学習する。
図3に戻り、学習部23は、学習結果情報を識別する学習結果識別IDと、正常画像を特定する学習結果情報と、複数の撮影画像を含む学習画像と、学習画像が取得されたときのカメラ10の周囲の環境を示す環境情報と、を関連付けて、第2記憶部24に記憶する。環境情報は、例えば学習画像が取得された撮影時刻、時間帯及び季節等である。時間帯は、例えば昼、夜、午前又は午後等である。カメラ10により撮影された撮影画像は、撮影時刻及び季節により周囲の環境が異なるため、学習部23は学習画像及び学習結果情報を環境情報に関連付けて第2記憶部24に記憶する。
次に学習画像を使用した画像認識処理について説明する。
<学習画像を使用した画像認識処理>
第2通信部21は、カメラ10を識別するカメラID(第1識別情報)と、画像認識処理を識別する認識処理ID(第2識別情報)と、学習結果情報を識別する学習結果識別IDと、を含む画像認識要求を、サービス提供サーバ装置30から受信する。ここで学習画像を使用した画像認識要求のWebAPIの例について説明する。
例えば第2通信部21が、サービス提供サーバ装置30から「http://xxx.yyy.com/mysite/cgi−bin/anomaly_detect?camera=1&result=1」を受け付けた場合、anomaly_detectは、学習画像を使用した画像認識処理を示し、camera=1は、カメラIDが1であることを示し、result=1は、上述の学習結果識別IDが1である学習結果情報を使用することを示す。
また例えば第2通信部21が、サービス提供サーバ装置30から「http://xxx.yyy.com/mysite/cgi−bin/anomaly_detect?camera=2&result=3&time=10」を受け付けた場合、anomaly_detectは、学習画像を使用した画像認識処理を示し、camera=2は、カメラIDが2であることを示し、result=3は、上述の学習結果識別IDが3である学習結果情報を使用することを示す。time=10は、10秒毎に学習画像を使用した画像認識処理を行うことを示す。
上述のような画像認識要求(WebAPI)が用いられることにより、カメラ10を任意の場所に設置するだけで、様々な外乱等を含む環境に対応した異常検出サービスを、より簡易に実現できる。
第2通信部21は、サービス提供サーバ装置30から上述の画像認識要求(WebAPIの呼び出し)を受信すると、当該画像認識要求に含まれるカメラIDにより識別されるカメラ10に上述の画像撮影要求を送信する。
第2通信部21は、画像撮影要求の応答として、カメラ10から暗号化された上述の撮影画像に基づく情報を受信すると、暗号化された撮影画像に基づく情報を復号し、当該撮影画像に基づく情報を、カメラID及び認識処理IDとともに認識部22に入力する。
認識部22は、認識処理IDにより識別される画像認識処理が、撮影画像が異常な画像であることを示す異常画像の認識処理である場合、正常画像を示す学習結果情報と、撮影画像に基づく情報と、を比較することにより、撮影画像に基づく情報が異常画像であるか否かを認識する。
ここで異常画像であるか否かを認識する方法の例について、撮影画像に基づく情報が撮影画像そのものである場合を例にして具体的に説明する。
まず認識部22は、撮影画像の1枚を取得し、当該撮影画像を64x64ピクセルのメッシュに分割する。次に認識部22は、メッシュ毎にRGBの輝度ヒストグラムを算出する。次に認識部22は、画像認識要求に含まれる学習結果識別IDにより識別される上述の学習結果情報を第2記憶部24から取得する。次に認識部22は、撮影画像から算出されたRGBの輝度ヒストグラムと、学習結果情報に含まれるRGBの輝度ヒストグラムとを用いてLOF(Local Outlier Factor)値を算出する。次に認識部22は、撮影画像のメッシュのうち、LOF値が所定の閾値以上の値が算出されたメッシュがある場合、当該撮影画像が異常画像であると認識する。
このとき認識部22が、画像認識対象の撮影画像の撮影時期又は季節等に応じた環境情報に関連付けられた上述の学習結果識別IDにより識別される学習結果情報を使用することにより、最適な画像認識処理を行うことができる。例えば撮影画像が屋外画像等である場合に、カメラ10の周囲の環境に合わせた最適な画像認識処理を行うことができる。
なお上述の例では、認識部22は、異常画像を認識する方法として、半教師あり異常検出のアルゴリズムであるLOFを用いた。LOFは識別するサンプルの周辺に、既知のサンプルの密度がどのくらいあるかにより異常値(はずれ値)を検出する方法である。単に最近傍のサンプルまでの距離を用いる方法と比較して、はずれ値をうまく検出できることが知られている。
認識部22は、LOF以外の任意の方法で異常画像を認識してもよい。認識部22は、例えば1 class SVM(Support Vector Machine)を使用してもよい。1 class SVMは識別器としてよく知られているSVMの評価関数を変更し、半教師あり異常検知を用いた識別器として使えるようにしたものである。うまく学習を行うことができれば、サポートベクターのみで識別が可能であるため、LOFと比べて高速に識別が可能である。
また認識部22は、異常画像も学習結果情報として扱うようにして、SVM等の教師あり学習アルゴリズムを異常画像を認識する方法に用いてもよい。
ここで異常画像の認識処理について、図4A乃至図4Cにより示される学習画像を使用する場合を例にして具体的に説明する。
図5Aは正常画像の例を示す図である。図5Aは、扇風機が首を左右に振る動作をしている状態で撮影された撮影画像であるが、図4A乃至図3Cにより示される学習画像により、この状態は学習されているため、認識部22は図5Aの撮影画像を正常画像として認識する。
図5B及び図5Cは異常画像の例を示す図である。図5B及び図5Cは、人が撮影範囲にいる状態で撮影された撮影画像であるが、この状態は学習されていないため、認識部22は図5B及び図5Cの撮影画像を異常画像として認識する。具体的には、認識部22は、図5Bのメッシュ領域101により示されるブロック、及び、図5Cのメッシュ領域102により示されるブロックで異常を検出することにより、当該撮影画像を異常画像として認識する。
図6は異常画像の例を示す図である。図6は、扇風機の位置を左にずらした状態で撮影された撮影画像であるが、この状態は学習されていないため、認識部22は図6の撮影画像を異常画像として認識する。具体的には、認識部22は、図6のメッシュ領域103により示されるブロックで異常を検出することにより、当該撮影画像を異常画像として認識する。
一般に、図5A乃至図6のように扇風機が動いている場合では、前フレームの撮影画像と比較して動きがある場合に異常と判定する方法は使用することはできず、扇風機の領域を対象除外として異常の判定が行われることが多い。しかしながら、その場合には事前に除外する領域を設定する必要がある上、図6の例のように、扇風機自体の位置が動いた場合には、異常の検出が不可能である。
また前フレームの撮影画像と比較して動きがあるときに異常と判定する場合、屋外で太陽が雲に隠れた場合、屋外の樹木の風によるゆれ、及び、屋内で照明を消した瞬間等も前フレームの撮影画像との差分が大きいので、異常画像として誤検出されてしまう。しかしながら学習部23が、これらのシーンが撮影された撮影画像を含む学習画像を学習することにより、画像認識処理のパラメータの設定等を行うことなく、撮影環境に応じた最適な画像認識を行うことができる。なお上述の説明では扇風機が動いている情報を例にして説明したが、実際の例では、例えばサービス提供サーバ装置30がセキュリティーサービス及びアラートサービス等を提供する場合に、上述の学習画像を使用した画像認識処理が行われる。
具体的には、セキュリティーサービスの場合、学習部23は、屋外のカメラ10により人がいない状態で平常時に撮影された学習画像(複数の撮影画像)を使用して正常画像を学習する。そして、例えば当該カメラ10により夜間に撮影された撮影画像から人が認識された場合、認識部22は当該撮影画像を異常画像として認識する。またアラートサービスの場合、学習部23は、屋内のカメラ10によりロボットアームの動きを撮影することにより得られた学習画像(複数の撮影画像)を使用して正常画像を学習する。そして、例えば当該カメラ10により撮影された撮影画像から、ロボットアームの近くに人がいることが認識された場合、認識部22は当該撮影画像を異常画像として認識する。
第2通信部21は、撮影画像が異常画像であることが、認識部22による画像認識処理により認識された場合、当該画像認識処理の結果を示す情報を、サービス提供サーバ装置30又はデータサーバ装置40等の指定された装置に送信するとともに、当該撮影画像を撮影したカメラ10に上述の画像記憶要求を送信する。
これにより認識部22により異常画像が認識された場合に、例えば異常画像が認識されてから一定時間の高フレームレートの動画として、撮影画像をカメラ10に記憶することができる。例えば不審者が現れた後の撮影画像を細かい時系列で記憶できるため、ユーザが後ほど時間をかけて解析を行うことができる。
次に実施形態の画像認識方法について説明する。
図7は実施形態の画像認識サーバ装置20の画像認識方法の例を示すフローチャートである。はじめに、第2通信部21が、カメラ10を識別するカメラID(第1識別情報)と、画像認識処理を識別する認識処理ID(第2識別情報)と、を含む画像認識要求を、上述のWebAPIによりサービス提供サーバ装置30から受信する(ステップS1)。
次に、第2通信部21が、画像認識要求に含まれるカメラIDにより識別されるカメラ10に、画像認識要求に含まれる認識処理ID(第2識別情報)、及び、撮影画像を撮影するタイミングを示すタイミング情報を含む画像撮影要求を送信する(ステップS2)。タイミング情報は、画像認識要求のWebAPIに応じて第2通信部21により画像撮影要求に設定されてもよいし、所定のタイミング情報が第2通信部21により画像撮影要求に設定されてもよい。また画像撮影要求にタイミング情報を含めずに、撮影画像を撮影するタイミングで、その都度、画像認識サーバ装置20から画像撮影要求を受信してもよい。
次に、第2通信部21が、画像撮影要求の応答として、カメラ10から暗号化された上述の撮影画像に基づく情報を受信する(ステップS3)。第2通信部21は、暗号化された撮影画像に基づく情報を復号し、当該撮影画像に基づく情報を、カメラID及び認識処理IDとともに認識部22に入力する。
次に、認識部22が、第2通信部21から撮影画像に基づく情報と、カメラIDと、認識処理IDと、を受け付けると、当該認識処理IDにより識別される画像認識処理を行う(ステップS4)。このとき認識部22は、カメラIDからカメラ10の撮影方式に応じた最適な画像認識処理を特定し、当該撮影画像に基づく情報に最適な画像認識処理を行う。
次に、第2通信部21が、画像認識処理の結果を示す情報を、サービス提供サーバ装置30又はデータサーバ装置40等の指定された装置に送信する(ステップS5)。
図8は実施形態のカメラ10の撮影画像の撮影方法の例を示すフローチャートである。はじめに、第1通信部11は、画像認識サーバ装置20から画像撮影要求を受信する(ステップS11)。画像撮影要求は、認識処理ID(第2識別情報)、及び、撮影画像を撮影するタイミングを示すタイミング情報を含む。
次に、撮影部12が、第1通信部11から画像撮影要求を受け付けると、画像撮影要求に含まれるタイミング情報により示されるタイミングで撮影を行うことにより、撮影画像を取得する(ステップS12)。次に、生成部13が、撮影部12から認識処理ID及び撮影画像を受け付けると、認識処理IDに応じて撮影画像のデータ形式を変更、又は、撮影画像から特徴量を抽出することにより、撮影画像に基づく情報を生成する(ステップS13)。次に、第1通信部11が、生成部13から撮影画像に基づく情報を受け付けると、当該撮影画像に基づく情報を暗号化して画像認識サーバ装置20に送信する(ステップS14)。
図9は実施形態の画像認識サーバ装置20の画像学習方法の例を示すフローチャートである。はじめに、第2通信部21が、カメラ10を識別するカメラID(第1識別情報)と、学習画像を取得するタイミングを示すタイミング情報と、学習結果情報を識別する学習結果識別IDと、を含む学習要求を、上述のWebAPIによりサービス提供サーバ装置30から受信する(ステップS21)。
次に、第2通信部21が、学習要求に含まれるカメラIDにより識別されるカメラ10に、画像認識処理を識別する認識処理ID(第2識別情報)、及び、学習画像を撮影するタイミングを示すタイミング情報を含む学習画像撮影要求を送信する(ステップS22)。
次に、第2通信部21が、カメラ10から暗号化された上述の学習画像に基づく情報を受信する(ステップS23)。第2通信部21は、暗号化された学習画像に基づく情報を復号し、当該学習画像に基づく情報を学習部23に入力する。
次に、学習部23が、第2通信部21から学習画像に基づく情報を受け付けると、当該学習画像に基づく情報を使用して学習処理を実行することにより、撮影画像が正常な画像であることを示す正常画像を特定する学習結果情報を取得する(ステップS24)。
次に、学習部23が、学習結果情報を識別する学習結果識別IDと、正常画像を特定する学習結果情報と、複数の撮影画像を含む学習画像と、学習画像が取得されたときのカメラ10の周囲の環境を示す環境情報と、を関連付けて、第2記憶部24に記憶する(ステップS25)。
図10は実施形態のカメラ10の学習画像の撮影方法の例を示すフローチャートである。はじめに、第1通信部11が、画像認識サーバ装置20から学習画像撮影要求を受信する(ステップS31)。学習画像撮影要求は、画像認識処理を識別する認識処理ID(第2識別情報)、及び、学習画像を撮影するタイミングを示すタイミング情報を含む。
次に、撮影部12が、第1通信部11から学習画像撮影要求を受け付けると、学習画像撮影要求に含まれるタイミング情報により示されるタイミングで撮影を行うことにより、学習画像を取得する(ステップS32)。次に、生成部13が、撮影部12から認識処理ID及び学習画像を受け付けると、認識処理IDに応じて学習画像のデータ形式を変更、又は、学習画像から特徴量を抽出することにより、学習画像に基づく情報を生成する(ステップS33)。次に、第1通信部11が、生成部13から学習画像に基づく情報を受け付けると、当該学習画像に基づく情報を暗号化して画像認識サーバ装置20に送信する(ステップS34)。
図11は実施形態の画像認識サーバ装置20の画像認識方法の例を示すフローチャートである。はじめに、第2通信部21が、カメラ10を識別するカメラID(第1識別情報)と、画像認識処理を識別する認識処理ID(第2識別情報)と、学習結果情報を識別する学習結果識別IDと、を含む画像認識要求を、上述のWebAPIによりサービス提供サーバ装置30から受信する(ステップS41)。
次に、第2通信部21が、画像認識要求に含まれるカメラIDにより識別されるカメラ10に、画像認識要求に含まれる認識処理ID(第2識別情報)、及び、撮影画像を撮影するタイミングを示すタイミング情報を含む画像撮影要求を送信する(ステップS42)。タイミング情報は、画像認識要求のWebAPIに応じて第2通信部21により画像撮影要求に設定されてもよいし、所定のタイミング情報が第2通信部21により画像撮影要求に設定されてもよい。
次に、第2通信部21が、画像撮影要求の応答として、カメラ10から暗号化された上述の撮影画像に基づく情報を受信する(ステップS43)。次に、ステップS41で受信した画像認識要求に含まれる学習結果識別IDにより識別される学習結果情報を、第2記憶部24から読み出す(ステップS44)。
次に、認識部22が、正常画像を示す学習結果情報と、撮影画像と、を比較することにより、撮影画像が異常画像であるか否かを認識する(ステップS45)。
撮影画像に基づく情報が異常画像である場合(ステップS46、Yes)、第2通信部21が、当該撮影画像に基づく情報を送信したカメラ10に、撮影画像を撮影するタイミングを示すタイミング情報、及び、撮影画像のフレームレート等を含む画像記憶要求を送信するとともに(ステップS47)、当該画像認識処理の結果を示す情報を、サービス提供サーバ装置30又はデータサーバ装置40等の指定された装置に送信する(ステップS48)。
撮影画像に基づく情報が異常画像でない場合(ステップS46、No)、当該画像認識処理の結果を示す情報を、サービス提供サーバ装置30又はデータサーバ装置40等の指定された装置に送信する(ステップS48)。
図12は実施形態のカメラ10の撮影画像の記憶方法の例を示すフローチャートである。はじめに、第1通信部11が、画像認識サーバ装置20から画像記憶要求を受信する(ステップS51)。画像記憶要求は、撮影画像を撮影するタイミングを示すタイミング情報、及び、撮影画像のフレームレート等を含む。次に、撮影部12が、第1通信部11から画像記憶要求を受け付けると、画像記憶要求に含まれるタイミング情報により示されるタイミングで撮影を行うことにより、撮影画像を取得する(ステップS52)。次に、第1記憶部14が、撮影部12により取得された撮影画像を記憶する(ステップS53)。
最後に、実施形態のカメラ10及び画像認識サーバ装置20のハードウェア構成の例について説明する。
図13は実施形態のカメラ10のハードウェア構成の例を示す図である。実施形態のカメラ10は、撮影光学系201、メカシャッタ202、モータドライバ203、CCD(Charge Coupled Device)204、CDS(Correlated Double Sampling:相関2重サンプリング)回路205、A/D変換器206、タイミング信号発生器207、画像処理回路208、LCD(Liquid Crystal Display)209、CPU(Central Processing Unit)210、RAM(Random Access Memory)211、ROM(Read Only Memory)212、SDRAM(Synchronous Dynamic Random Access Memory)213、圧縮伸張回路214、メモリ215、操作部216及び通信回路217を備える。
画像処理回路208、CPU210、RAM211、ROM212、SDRAM213、圧縮伸張回路214、メモリ215、操作部216及び通信回路217はバス220を介して接続されている。
撮影光学系201は被写体が反射した光を集光する。メカシャッタ202は所定の時間、開くことにより、撮影光学系201により集光された光をCCD204に入射させる。モータドライバ203は撮影光学系201及びメカシャッタ202を駆動する。
CCD204は、メカシャッタ202を介して入射した光を被写体の像として結像し、当該被写体の像を示すアナログの画像データをCDS回路205に入力する。CDS回路205はCCD204からアナログの画像データを受け付けると、当該画像データのノイズ成分を除去し、ノイズ成分が除去されたアナログの画像データをA/D変換器206に入力する。A/D変換器206はCDS回路205からアナログの画像データを受け付けると、当該アナログの画像データをデジタルの画像データに変換する。A/D変換器206はデジタルの画像データを画像処理回路208に入力する。タイミング信号発生器207はCPU210からの制御信号に応じて、CCD204、CDS回路205及びA/D変換器206にタイミング信号を送信することにより、CCD204、CDS回路205及びA/D変換器206が動作するタイミングを制御する。
画像処理回路208はA/D変換器206からデジタルの画像データを受け付けると、
SDRAM213を使用して、当該デジタルの画像データの画像処理を行う。画像処理は、例えばCrCb変換処理、ホワイトバランス制御処理、コントラスト補正処理、エッジ強調処理及び色変換処理等である。ホワイトバランス制御処理は、画像データの色の濃さを調整する画像処理である。コントラスト補正処理は、画像データのコントラストを調整する画像処理である。エッジ強調処理は、画像データのシャープネスを調整する処理である。色変換処理は、画像データの色合いを調整する画像処理である。
画像処理回路208は上述の画像処理が行われた画像データをLCD209、又は、圧縮伸張回路214に入力する。LCD209は画像処理回路208から受け付けた画像データを表示する液晶ディスプレイである。
CPU210はプログラムを実行することによりカメラ10の動作を制御する。RAM211はCPU210がプログラムを実行するときのワーク領域、及び、各種データの記憶等に使用される読取及び書込が可能な記憶領域である。ROM212はCPU210により実行されるプログラム等を記憶する読取専用の記憶領域である。
SDRAM213は画像処理回路208が画像処理を行うときに、画像処理対象の画像データを一時的に記憶する記憶領域である。
圧縮伸張回路214は画像処理回路208から画像データを受け付けると、当該画像データを圧縮する。圧縮伸張回路214は圧縮された画像データをメモリ215に記憶する。また圧縮伸張回路214はメモリ215から画像データを受け付けると、当該画像データを伸張する。圧縮伸張回路214は伸張された画像データをSDRAM213に一時的に記憶する。メモリ215は圧縮された画像データを記憶する。
操作部216はカメラ10のユーザからの操作を受け付ける。通信回路217は、カメラ10から上述の撮影画像に基づく情報、及び、上述の学習画像に基づく情報等を画像認識サーバ装置20に送信する。
上述の図2の第1通信部11は、通信回路217に対応する。また上述の生成部13は、画像処理回路208及び圧縮伸張回路214に対応する。なお第1通信部11の一部の機能(ハードウェアとして実現しなければならない通信IFを除く)、及び、生成部13の両方又は一方をプログラムにより実現してもよい。
実施形態のカメラ10(CPU210)で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、メモリカード、CD−R及びDVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記憶媒体に記録されてコンピュータ・プログラム・プロダクトとして提供される。
なお実施形態のカメラ10で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また実施形態のカメラ10で実行されるプログラムをダウンロードさせずにインターネット等のネットワーク経由で提供するように構成してもよい。
また実施形態のカメラ10のプログラムを、ROM212等に予め組み込んで提供するように構成してもよい。
なお実施形態のカメラ10で実行されるプログラムにより、第1通信部11及び生成部13を実現する場合、第1通信部11及び生成部13は、CPU210がROM212又は上記記憶媒体等からプログラムを読み出して実行することによりRAM211に実現される。
次に実施形態の画像認識サーバ装置20、サービス提供サーバ装置30、データサーバ装置40及び情報処理装置50のハードウェア構成の例について説明する。画像認識サーバ装置20、サービス提供サーバ装置30、データサーバ装置40及び情報処理装置50のハードウェア構成は同様なので、画像認識サーバ装置20の場合を例にして説明する。
図14は実施形態の画像認識サーバ装置20のハードウェア構成の例を示す図である。実施形態の画像認識サーバ装置20は、制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306を備える。制御装置301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306は、バス310を介して互いに接続されている。
制御装置301は補助記憶装置303から主記憶装置302に読み出されたプログラムを実行する。主記憶装置302はROM及びRAM等のメモリである。補助記憶装置303はHDD(Hard Disk Drive)や光学ドライブ等である。
表示装置304は画像認識サーバ装置20の状態等を表示する。表示装置304は、例えば、液晶ディスプレイである。入力装置305は画像認識サーバ装置20を操作するためのインタフェースである。入力装置305は、例えばキーボードやマウス等である。通信装置306はネットワークに接続するためのインタフェースである。
実施形態の画像認識サーバ装置20で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、メモリカード、CD−R及びDVD等のコンピュータで読み取り可能な記憶媒体に記録されてコンピュータ・プログラム・プロダクトとして提供される。
また実施形態の画像認識サーバ装置20で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また実施形態の画像認識サーバ装置20で実行されるプログラムをダウンロードさせずにインターネット等のネットワーク経由で提供するように構成してもよい。
また実施形態の画像認識サーバ装置20のプログラムを、主記憶装置302のROM等に予め組み込んで提供するように構成してもよい。
実施形態の画像認識サーバ装置20で実行されるプログラムは、上述した図3の第2通信部21、認識部22及び学習部23を含むモジュール構成となっている。第2通信部21、認識部22及び学習部23は、制御装置301が上記記憶媒体からプログラムを読み出して実行することにより、主記憶装置302上にロードされる。すなわち第2通信部21、認識部22及び学習部23は主記憶装置302上に生成される。なお上述した図3の第2通信部21、認識部22及び学習部23の一部又は全部をソフトウェアにより実現せずに、IC等のハードウェアにより実現してもよい。
以上説明したように、実施形態の画像認識システム100では、画像認識サーバ装置20の第2通信部21が、カメラ10を識別するカメラID(第1識別情報)と、画像認識処理を識別する認識処理ID(第2識別情報)と、を含む画像認識要求(WebAPIの呼び出し)を受信すると、当該カメラIDにより識別されるカメラ10に画像撮影要求を送信することにより、当該カメラIDにより識別されるカメラ10から撮影画像を受信する。そして認識部22が、受信された撮影画像に、当該認識処理IDにより識別される画像認識処理を行うと、第2通信部21が、当該認識処理IDにより識別される画像認識処理の結果を示す情報を、指定された装置に送信する。
これにより実施形態の画像認識システム100によれば、様々な画像認識処理を利用したサービスをより簡易に提供することができる。
例えば交通量を調査するサービスを提供する場合、従来技術では車両の検出等が可能な専用の認識処理を行う高価なカメラ等を用いてシステムを構成する必要があった。このような高価なカメラは、毎回、場所を変えて行う交通量調査には盗難のリスク等から使用することができなかった。
しかしながら実施形態の画像認識システム100を適用すれば、標準化した安価な通信機能を有するカメラ10を交通量の計測地点に置くことにより、交通量を調査するサービスを提供することができる。すなわちサービス提供サーバ装置30から、当該カメラIDと、車両を認識する画像認識処理を識別する認識処理IDと、を含む画像認識要求(WebAPIの呼び出し)を画像認識サーバ装置20に送信することにより車両の台数をより簡易に計測できる。
例えばサービス提供サーバ装置30から、5秒おきに当該画像認識要求(WebAPIの呼び出し)を送信するように設定し、当該画像認識処理の結果を示す情報をデータサーバ装置40に送信するように設定すれば、交通量を調査する統計アプリケーション(統計サービス)を容易に実現できる。また画像認識要求に含まれる認識処理IDを変えることにより、計測地点に設置されたカメラ10を、容易に別のサービスに利用することもできる。
なお上述の説明では、第2記憶部24が学習結果情報を環境情報に関連付けて記憶し、認識部22が、撮影時刻及び季節等を示す環境情報を特定する学習結果識別ID(特定情報)に応じて学習結果情報を読み出す場合について説明した。しかしながら撮影時刻及び季節等を示す環境情報を、学習結果情報の特徴量の次元として含ませることにより、認識部22が同一の学習結果情報を用いて画像認識処理を行ってもよい。
10 カメラ
11 第1通信部
12 撮影部
13 生成部
14 第1記憶部
20 画像認識サーバ装置
21 第2通信部
22 認識部
23 学習部
24 第2記憶部
30 サービス提供サーバ装置
40 データサーバ装置
50 情報処理装置
100 画像認識システム
特開2011−90348号公報 特開2001−88912号公報 特許第4061821号公報

Claims (12)

  1. 少なくとも1つのカメラと、サーバ装置と、を含む画像認識システムであって、
    前記カメラは、
    撮影画像を取得する撮影部と、
    前記撮影画像を前記サーバ装置に送信する第1通信部と、
    前記撮影画像を記憶する第1記憶部と、を備え、
    前記サーバ装置は、
    前記カメラを識別する第1識別情報と、画像認識処理を識別する第2識別情報と、を含む画像認識要求を受信すると、前記第1識別情報により識別される前記カメラに画像撮影要求を送信することにより、前記第1識別情報により識別される前記カメラから前記撮影画像を受信する第2通信部と、
    受信された前記撮影画像に、前記第2識別情報により識別される画像認識処理を行う認識部と、
    複数の前記撮影画像を含む学習画像を使用して、前記撮影画像が正常画像であることを特定する学習結果情報を取得する学習部と、を備え、
    前記認識部は、前記学習結果情報と、前記撮影画像と、を比較することにより、前記撮影画像が異常画像であるか否かを認識し、
    前記第2通信部は、前記第2識別情報により識別される画像認識処理の結果を示す情報を、指定された装置に送信し、前記認識部が前記異常画像を認識したときに、前記異常画像として検出された前記撮影画像を撮影したカメラに画像記憶要求を送信し、
    前記異常画像として検出された前記撮影画像を撮影したカメラは、前記第1通信部が前記画像記憶要求を受信すると、前記撮影画像を前記第1記憶部に記憶する、
    画像認識システム。
  2. 前記画像撮影要求は、前記第2識別情報を含み、
    前記カメラは、前記第2識別情報に応じて前記撮影画像のデータ形式を変更することにより、前記撮影画像に基づく情報を生成する生成部を更に備え、
    前記第1通信部は、前記撮影画像に基づく情報を前記サーバ装置に送信し、
    前記認識部は、受信された前記撮影画像に基づく情報に、前記第2識別情報により識別される画像認識処理を行う、
    請求項1に記載の画像認識システム。
  3. 前記生成部は、送信対象とする前記撮影画像の領域、前記撮影画像の諧調、前記撮影画像の解像度、前記撮影画像のフレーム数、及び、前記撮影画像の圧縮率のうち、少なくともいずれか1つを前記第2識別情報に応じて変更することにより、前記撮影画像に基づく情報を生成する、
    請求項2に記載の画像認識システム。
  4. 前記生成部は、前記撮影画像から前記第2識別情報に応じた特徴量を抽出することにより、前記撮影画像に基づく情報を生成する、
    請求項2又は3に記載の画像認識システム。
  5. 前記画像認識処理の結果を示す情報は、前記撮影画像に含まれる個人情報を特定できる情報を含まない、
    請求項1乃至4のいずれか1項に記載の画像認識システム。
  6. 前記画像認識要求は、前記撮影画像を撮影するタイミングを示すタイミング情報を更に含み、
    前記撮影部は、前記タイミング情報により示されるタイミングで、前記撮影画像を取得する、
    請求項1乃至5のいずれか1項に記載の画像認識システム。
  7. 前記第2通信部は、前記第1識別情報を含む学習要求を受信すると、前記第1識別情報により識別される前記カメラに学習画像撮影要求を送信し、
    前記第1識別情報により識別されるカメラの前記撮影部は、前記第1通信部が前記学習画像撮影要求を受信したときに、複数の前記撮影画像を撮影し、
    前記第1識別情報により識別されるカメラの前記第1通信部は、撮影された前記複数の撮影画像を、前記学習画像として前記サーバ装置に送信する、
    請求項に記載の画像認識システム。
  8. 前記サーバ装置は、
    前記学習画像が取得されたときの前記カメラの周囲の環境を示す環境情報と、前記学習画像と、前記学習結果情報と、を関連付けて記憶する第2記憶部を更に備え、
    前記画像認識要求は、前記環境情報を特定する特定情報を更に含み、
    前記認識部は、前記画像認識要求に含まれる前記特定情報により特定される前記環境情報に関連付けられた前記学習結果情報と、前記撮影画像と、を比較することにより、前記撮影画像が異常画像であるか否かを認識する、
    請求項1又は7に記載の画像認識システム。
  9. 前記学習部は、前記学習画像として使用される複数の前記撮影画像に、所定のノイズを付加してから、前記正常画像の学習を行う、
    請求項1、7又は8に記載の画像認識システム。
  10. 前記認識部は、前記学習結果情報の輝度のヒストグラムと、前記撮影画像の輝度のヒストグラムと、を比較することにより、前記撮影画像が異常画像であるか否かを認識する、
    請求項1、又は7乃至のいずれか1項に記載の画像認識システム。
  11. 少なくとも1つのカメラと接続されたサーバ装置であって、
    前記カメラを識別する第1識別情報と、画像認識処理を識別する第2識別情報と、を含む画像認識要求を受信すると、前記第1識別情報により識別される前記カメラに画像撮影要求を送信することにより、前記第1識別情報により識別される前記カメラから撮影画像を受信する通信部と、
    受信された前記撮影画像に、前記第2識別情報により識別される画像認識処理を行う認識部と、
    複数の前記撮影画像を含む学習画像を使用して、前記撮影画像が正常画像であることを特定する学習結果情報を取得する学習部と、を備え、
    前記認識部は、前記学習結果情報と、前記撮影画像と、を比較することにより、前記撮影画像が異常画像であるか否かを認識し、
    前記通信部は、前記第2識別情報により識別される画像認識処理の結果を示す情報を、指定された装置に送信し、前記認識部が前記異常画像を認識したときに、前記異常画像として検出された前記撮影画像を撮影したカメラに画像記憶要求を送信する、
    サーバ装置。
  12. 少なくとも1つのカメラと、サーバ装置と、を含む画像認識システムの画像認識方法であって、
    サーバ装置が、前記カメラを識別する第1識別情報と、画像認識処理を識別する第2識別情報と、を含む画像認識要求を受信するステップと、
    サーバ装置が、前記第1識別情報により識別される前記カメラに画像撮影要求を送信するステップと、
    サーバ装置が、前記第1識別情報により識別される前記カメラから撮影画像を受信するステップと、
    サーバ装置が、受信された前記撮影画像に、前記第2識別情報により識別される画像認識処理を行うステップと、
    サーバ装置が、複数の前記撮影画像を含む学習画像を使用して、前記撮影画像が正常画像であることを特定する学習結果情報を取得するステップと、
    サーバ装置が、前記学習結果情報と、前記撮影画像と、を比較することにより、前記撮影画像が異常画像であるか否かを認識するステップと、
    サーバ装置が、前記第2識別情報により識別される画像認識処理の結果を示す情報を、指定された装置に送信するステップと、
    サーバ装置が、前記異常画像を認識したときに、前記異常画像として検出された前記撮影画像を撮影したカメラに画像記憶要求を送信するステップと、
    前記異常画像として検出された前記撮影画像を撮影したカメラが、前記画像記憶要求を受信すると、前記撮影画像を記憶するステップと、
    を含む画像認識方法。
JP2014250080A 2014-12-10 2014-12-10 画像認識システム、サーバ装置及び画像認識方法 Expired - Fee Related JP6572535B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014250080A JP6572535B2 (ja) 2014-12-10 2014-12-10 画像認識システム、サーバ装置及び画像認識方法
US14/958,271 US20160171310A1 (en) 2014-12-10 2015-12-03 Image recognition system, server apparatus, and image recognition method
EP15197926.7A EP3032376A1 (en) 2014-12-10 2015-12-04 Image recognition system, server apparatus, and image recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014250080A JP6572535B2 (ja) 2014-12-10 2014-12-10 画像認識システム、サーバ装置及び画像認識方法

Publications (2)

Publication Number Publication Date
JP2016110578A JP2016110578A (ja) 2016-06-20
JP6572535B2 true JP6572535B2 (ja) 2019-09-11

Family

ID=54843667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014250080A Expired - Fee Related JP6572535B2 (ja) 2014-12-10 2014-12-10 画像認識システム、サーバ装置及び画像認識方法

Country Status (3)

Country Link
US (1) US20160171310A1 (ja)
EP (1) EP3032376A1 (ja)
JP (1) JP6572535B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6707920B2 (ja) 2016-03-14 2020-06-10 株式会社リコー 画像処理装置、画像処理方法、およびプログラム
JP6809114B2 (ja) * 2016-10-12 2021-01-06 株式会社リコー 情報処理装置、画像処理システム、プログラム
RU2640296C1 (ru) 2016-12-06 2017-12-27 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr) на сервере
RU2632427C1 (ru) * 2016-12-09 2017-10-04 Общество с ограниченной ответственностью "Аби Девелопмент" Оптимизация обмена данными между клиентским устройством и сервером
JP6942649B2 (ja) * 2018-01-30 2021-09-29 株式会社日立製作所 画像処理装置及び画像処理方法
JP7352890B2 (ja) * 2018-11-26 2023-09-29 パナソニックIpマネジメント株式会社 事故画像取得システム及び事故画像取得電子ミラーカメラシステム
JPWO2020217909A1 (ja) * 2019-04-23 2020-10-29
JP7259732B2 (ja) * 2019-12-23 2023-04-18 横河電機株式会社 配信サーバ、方法およびプログラム
JP6792112B1 (ja) * 2020-06-23 2020-11-25 善郎 水野 画像解析通信装置
US11620900B2 (en) * 2020-06-26 2023-04-04 Intel Corporation Object tracking technology based on cognitive representation of a location in space
KR102297232B1 (ko) 2020-11-18 2021-09-03 주식회사 파인브이티 형태학적 영상처리를 활용한 이상 탐지 방법
US11694585B2 (en) 2020-12-28 2023-07-04 Ricoh Company, Ltd. Display apparatus, display system, display control method, and non-transitory recording medium

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6311543A (ja) 1986-06-30 1988-01-19 Hoya Corp 低膨張ガラス
JP2972479B2 (ja) * 1993-03-18 1999-11-08 株式会社日立製作所 道路交通異常検出方法および道路交通異常監視システム
JP2001088912A (ja) 1999-09-20 2001-04-03 Fujitsu General Ltd 画像認識による棚卸管理方法及び棚卸システム
US6829391B2 (en) * 2000-09-08 2004-12-07 Siemens Corporate Research, Inc. Adaptive resolution system and method for providing efficient low bit rate transmission of image data for distributed applications
JP3686333B2 (ja) * 2000-12-22 2005-08-24 三菱重工業株式会社 動画像処理カメラ及びこれを用いた画像処理システム
JP2003046999A (ja) * 2001-07-30 2003-02-14 Toshiba Corp 画像監視システムおよび画像監視システムの監視画像配信方法およびネットワーク利用画像監視システムのカメラ装置
JP3999561B2 (ja) * 2002-05-07 2007-10-31 松下電器産業株式会社 監視システムと監視カメラ
US20040184643A1 (en) * 2003-03-21 2004-09-23 Stantchev Gueorgui H. Methods and apparatus for imaging
US20060007308A1 (en) * 2004-07-12 2006-01-12 Ide Curtis E Environmentally aware, intelligent surveillance device
JP2008021034A (ja) * 2006-07-11 2008-01-31 Fujitsu Ten Ltd 画像認識装置、画像認識方法、歩行者認識装置および車両制御装置
JP2008257361A (ja) * 2007-04-02 2008-10-23 Olympus Corp プロファイル作成システム
TWI346499B (en) * 2007-09-19 2011-08-01 Asustek Comp Inc A method for dynamically adjusting the images of a web camera
JP2011090348A (ja) 2007-12-25 2011-05-06 J Magic Kk 広告管理システム、広告管理サーバ、広告管理方法、プログラム、および閲覧クライアント
US8929877B2 (en) * 2008-09-12 2015-01-06 Digimarc Corporation Methods and systems for content processing
US8244402B2 (en) * 2009-09-22 2012-08-14 GM Global Technology Operations LLC Visual perception system and method for a humanoid robot
US8121618B2 (en) * 2009-10-28 2012-02-21 Digimarc Corporation Intuitive computing methods and systems
JP5404453B2 (ja) * 2010-01-28 2014-01-29 株式会社日立製作所 車両監視装置
US8503539B2 (en) * 2010-02-26 2013-08-06 Bao Tran High definition personal computer (PC) cam
WO2012082127A1 (en) * 2010-12-16 2012-06-21 Massachusetts Institute Of Technology Imaging system for immersive surveillance
JP2013066016A (ja) * 2011-09-16 2013-04-11 Univ Of Electro-Communications 輪郭抽出システム、輪郭抽出装置及び輪郭抽出プログラム
JP5768647B2 (ja) * 2011-10-11 2015-08-26 富士通株式会社 画像認識システムおよび画像認識方法
JP6265602B2 (ja) * 2013-01-29 2018-01-24 株式会社日立国際電気 監視カメラシステム、撮像装置及び撮像方法

Also Published As

Publication number Publication date
JP2016110578A (ja) 2016-06-20
US20160171310A1 (en) 2016-06-16
EP3032376A1 (en) 2016-06-15

Similar Documents

Publication Publication Date Title
JP6572535B2 (ja) 画像認識システム、サーバ装置及び画像認識方法
US8922674B2 (en) Method and system for facilitating color balance synchronization between a plurality of video cameras and for obtaining object tracking between two or more video cameras
US10872434B2 (en) Image processing apparatus and method
JP5959923B2 (ja) 検出装置、その制御方法、および制御プログラム、並びに撮像装置および表示装置
EP3425590B1 (en) Image processing apparatus, image processing method, and storage medium
JP2012530994A (ja) 半顔面検出のための方法および装置
JP2011165008A (ja) 画像認識装置および方法
CN108141568B (zh) Osd信息生成摄像机、合成终端设备及共享系统
US8798369B2 (en) Apparatus and method for estimating the number of objects included in an image
JP5802146B2 (ja) 静止カメラの色補正のための方法、装置、プログラム(静止カメラのための色補正)
JP2007148988A (ja) 顔認証装置、顔認証方法および入退場管理装置
CN108810400A (zh) 控制设备、控制方法和记录介质
JP2004219277A (ja) 人体検知方法およびシステム、プログラム、記録媒体
US11302045B2 (en) Image processing apparatus, image providing apparatus,control methods thereof, and medium
US20140068514A1 (en) Display controlling apparatus and display controlling method
WO2013114803A1 (ja) 画像処理装置及びその画像処理方法、並びにコンピュータ・プログラム、および画像処理システム
JP2001119683A (ja) 画像センサ装置
US20200057943A1 (en) Method and system for low-power visual sensor
JP5539565B2 (ja) 撮像装置及び被写体追跡方法
US11575841B2 (en) Information processing apparatus, imaging apparatus, method, and storage medium
JP2019215661A (ja) 画質調整システムおよび画質調整方法
JP2015233202A (ja) 画像処理装置および画像処理方法、並びにプログラム
Mariappan et al. A design methodology of an embedded motion-detecting video surveillance system
JP6664078B2 (ja) 3次元侵入検知システムおよび3次元侵入検知方法
WO2013114802A1 (ja) 画像処理装置及びその画像処理方法、並びにコンピュータ・プログラム、および画像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190729

R151 Written notification of patent or utility model registration

Ref document number: 6572535

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees