WO2017183280A1

WO2017183280A1 - 画像認識装置及びプログラム

Info

Publication number: WO2017183280A1
Application number: PCT/JP2017/006415
Authority: WO
Inventors: 田中　伸治
Original assignee: シャープ株式会社
Priority date: 2016-04-21
Filing date: 2017-02-21
Publication date: 2017-10-26

Abstract

入力された画像から、予測処理に基づいて対象物を認識する対象物認識手段を備えた画像認識装置において、入力された画像から動きが検知された場合には、前記予測処理の変更が必要か否かを判定する予測処理変更判定手段と、前記予測処理の変更が必要と判定された場合には、前記予測処理と異なる予測処理に変更をする予測処理変更手段と、を備える。これにより、対象物を認識・予測する場合に、認識・予測方法を容易に切り替えることを可能とすることができる画像認識装置等を提供することとなる。

Description

画像認識装置及びプログラム

　本発明は、入力された画像から、予測処理に基づいて対象物を認識する対象物認識手段を備えた画像認識装置等に関する。

　近年、撮影又は入力された画像に写っている対象物がどのような物かを予測して、表示するような画像認識装置が知られている。例えば、特許文献１では、対象物として植物を認識し、野草の種類や植物辞典に掲載されているような情報を表示することが可能な発明が開示されている。

　また、特許文献２には、表示手段に表示されているものの中から指定した特定の対象物についての情報を、その対象物の表示画面上での状態に対応して、異なる表示形式で情報表示手段に表示させる情報表示システム、およびその情報表示システムを採用した携帯情報端末が開示されている。

特開２００２－２０３２４２号公報特開２００９－３０１４８５号公報

　上述したように、対象物が何かを認識・予測し、対象物の名称を表示させたりすることは開示されているが、認識において本来の対象物の名称とは異なる名称が得られる場合がある。対象物の認識が間違えている場合、利用者が何度認識させても、同じ名称しか返ってこないという問題点があった。

　ここで、予測処理を変更することが考えられるが、この場合、利用者が操作により変更を行う必要があり、操作が煩わしくなってしまうという問題点が生じていた。

　上述した課題に鑑み、本発明が目的とするのは、対象物を認識・予測する場合に、認識・予測方法を容易に、大きなソフトウェアの変更を伴わずに、切り替えることを可能とすることができる画像認識装置等を提供することを目的とする。

　上述した課題を解決するために、本発明の画像認識装置は、
　入力された画像から、予測処理に基づいて対象物を認識する対象物認識手段を備えた画像認識装置において、
　入力された画像から動きが検知された場合には、前記予測処理の変更が必要か否かを判定する予測処理変更判定手段と、
　前記予測処理の変更が必要と判定された場合には、前記予測処理と異なる予測処理に変更をする予測処理変更手段と、
　を備えることを特徴とする。

　本発明のプログラムは、
入力された画像から、予測処理に基づいて対象物を認識する対象物認識機能を実行可能なコンピュータに、
　入力された画像から動きが検知された場合には、前記予測処理の変更が必要か否かを判定する予測処理変更判定機能と、
　前記予測処理の変更が必要と判定された場合には、前記予測処理と異なる予測処理に変更をする予測処理変更機能と、
　を実現させることを特徴とする。

　本発明によれば、入力された画像から、予測処理に基づいて対象物を認識する対象物認識手段を備えた画像認識装置において、入力された画像から動きが検知され、前記予測処理の変更が必要と判定された場合には、現在の予測処理と異なる予測処理に変更をし、再度画像認識を行うことになる。これにより、例えばカメラを動かすことによって、対象物を含む画像の動きが検出されると、異なる予測処理方法を用いて対象物を予測・認識することになる。これにより、利用者は容易な動作で、予測処理を切り替えるといったことが可能となる。

第１実施形態における全体を説明するための図である。第１実施形態における端末装置の機能構成を説明するための図である。ニューラルネットワークの説明をするための図である。第１実施形態における処理の流れを説明するためのフローチャートである。第１実施形態における動作の一例を説明するための図である。第１実施形態における動作の一例を説明するための図である。第１実施形態における動作の一例を説明するための図である。第４実施形態における動作の一例を説明するための図である。第５実施形態における物体認識画像処理部の一例を示した図である。第５実施形態における動作の一例を説明するための図である。第６実施形態における分類処理部の一例を示した図である。

　以下に、本発明の実施の形態について、図を参照しながら詳細に説明する。本実施形態では、本発明の画像認識装置を、通話可能な携帯型の端末装置（例えば、携帯電話やスマートフォン、タブレット等）に適用した場合について説明する。すなわち、画像認識プログラムを、端末装置で実行することにより、画像認識機能が実現され画像認識装置として実現されることとなる。

　なお、端末装置としては、他の装置であってもよいことは勿論である。例えば、上述した携帯電話・スマートフォンや、タブレット端末、電子辞書や電子書籍端末といった端末装置であったり、車載用カメラ、コンピュータ等の端末装置であったりしてもよい。

　［１．第１実施形態］
　［１．１　システム構成］
　第１実施形態について説明する。まず、図１は本実施形態におけるシステム全体を説明するための図である。図１のシステム１では、端末装置１０が、ネットワークＮＷを介してサーバ２０に接続可能に構成されている。

　端末装置１０と、ネットワークＮＷは、無線通信で接続されている。例えば、ＩＥＥＥ８０２．１１ａ／ｂ／ｇ／ｎといったＷＬＡＮであったり、３ＧやＬＴＥに代表される移動通信網であったりしてもよい。また、他の装置や、アクセスポイントといった接続装置に近距離無線通信で接続し、ネットワークＮＷに接続されることとしてもよい。また、有線のＬＡＮで接続されてもよいことは勿論である。

　サーバ２０は、例えば画像の認識処理や、予測処理を実現することができる装置である。すなわち、本実施形態における画像認識処理は、端末装置１０で行ってもよいし、サーバ２０で行ってもよい。なお、端末装置１０で処理が完結する場合は、サーバ２０を必要としない。本実施形態では、説明の都合上、端末装置１０で行うこととして説明するが、必要に応じた処理をサーバで行えばよいこととなる。

　詳細は後述するが、端末装置１０には、背面や前面にカメラ（不図示）が設けられており、対象物Ｐを撮影することが可能となっている。すなわち、カメラで撮影された画像に、対象物Ｐが含まれていると、この対象物Ｐを認識（例えば、対象物Ｐの名称を認識）することができる。

　例えば、端末装置１０の表示画面Ｗ１０を示すと、表示画面Ｗ１０には、対象物Ｐが領域Ｒ２０に表示されており、この対象物Ｐの名称が領域Ｒ１０に表示される。これにより、利用者は現在撮影されている対象物が何であるかを認識することが可能となる。

　なお、図１では、対象物Ｐの名称が表示されているが、必ずしもその必要は無い。例えば、単純に対象物の名称を認識することにより、音声で名称を利用者に伝えたり、画像にタグ付けができたり、表示されている対象物から検索処理を行ったりすることが可能である。

　また、認識という場合には、上述したように撮影された対象物を認識する場合と、予め対象物のパターンが決められており、撮影された対象物が当該パターンに該当するか否かといった認識をする場合がある。例えば、車載用カメラの場合において、自動車や、自転車、歩行者といったパターンに一致するか否かで、対象物を認識すると言ったことも含まれる。

　［１．２　機能構成］
　続いて、端末装置１０の機能構成について図２を用いて説明する。図２に示すように、端末装置１０は、制御部１００と、画像入力部１１０と、予測処理部１２０と、処理変更判定部１２５と、通信部１３０と、記憶部１４０と、表示部１５０と、操作入力部１６０と、電話機能部１７０とを備えて構成されている。

　制御部１００は、端末装置１０の全体を制御するための機能部である。制御部１００は、記憶部１４０に記憶されている各種プログラムを読み出して実行することにより各種機能を実現しており、例えばＣＰＵ（Central Process Unit）等により構成されている。

　画像入力部１１０は、画像を撮影し、撮影された画像から画像データとして端末装置１０に入力するための機能部である。例えば、カメラ等により構成されており、撮像素子等によって画像を外部から入力し、入力された画像データは後述する予測処理部１２０に出力される。

　なお、画像入力部１１０は、カメラではなく、他の装置から入力された画像であってもよい。例えば、端末装置１０と、カメラ装置とが接続され、カメラ装置において撮影された画像データを利用してもよい。

　予測処理部１２０は、入力された画像データに含まれている（写っている）対象物の名称や属性を予測するための機能部である。ここで、予測をする処理としては、最近はディープラーニング（ディープニューラルネットワーク）が高い精度を出しており、本実施形態でも一例として当該方法を利用する。このディープラーニングにおける処理について、図３を用いて簡単に説明する。

　まず、予測処理部１２０は、入力された画像データ（信号）を、複数の層と、各層に含まれるニューロンによって構成されるニューラルネットワークに入力する。各ニューロンは別の複数のニューロンから信号を受け取り、演算を施した信号を別の複数のニューロンへ出力する。ニューラルネットワークが多層構造の場合、信号が流れる順に、入力層、中間層（隠れ層）、出力層と呼ばれる。

　ニューラルネットワークの中間層が複数の層からなっているものはディープニューラルネットワークと呼ばれ、これを用いた機械学習の手法をディープラーニングと呼ぶ。なお、画像認識で高い精度を出しているのは、畳み込み演算を持つConvolutional Neural Network（畳み込みニューラルネットワーク）である。

　画像データはニューラルネットワークの各層のニューロンを各種演算（畳み込み演算、プーリング演算、正規化演算、行列演算等）をされ、形を変えながら流れ、出力層から複数の信号が出力される。

　ニューラルネットワークからの複数の出力値は、それぞれ、名称に紐づいていて、値が最も大きい出力値に紐づく名称を対象物の名称と予測する、というような処理を行う。または、直接名称に紐づかずに、複数の出力値を分類器に通して、分類器の出力から名称やタグを予測するということも行われる。

　ニューラルネットワークの各種演算に用いる係数であるパラメータは、事前にニューラルネットワークへ数多くの画像と、当該画像に写っている対象物が何かを示すラベルを入力し、出力値と正解値との誤差を、誤差逆伝播法（バックプロパゲーション）により、ニューラルネットワークを逆方向に伝搬し、各層のニューロンのパラメータを何度も更新することによって決まる。パラメータを更新し、決める工程を学習と呼ぶ。

　ここで、ニューラルネットワークの構造や、個々の演算については、書籍や論文で解説された公知技術であり、その何れかの技術を利用すれば良い。

　処理変更判定部１２５は、入力されている画像から、処理変更が必要か否かを判定するための機能部である。例えば、利用者がカメラで画像を撮影しているとき、カメラの向きを変えることによって撮影範囲を対象物から外し、再び対象物を写したとき、その動きをニューラルネットワークの出力値から判定し、処理変更が必要か否かの判定を行う。既存の処理の出力値を用いることで、大きなソフトウェアの変更を伴わずに判定を行うことが可能である。

　ここで、予測処理部１２０及び処理変更判定部１２５は、プログラムで提供されてもよいし、ハードウェアとして提供されてもよい。特に、畳み込みニューラルネットワークは、数多くの畳み込み演算や行列演算等を実行するため、ＧＰＵ（Graphics Processing Unit）等のハードウェアがあると処理を高速化することができる。プログラムとして提供される場合には、予測処理プログラムと、処理変更判定プログラムが記憶部１４０に記憶されており、制御部１００が読み出して実行することにより、同一の機能を実現する。

　また、予測処理部１２０及び処理変更判定部１２５の各処理は、サーバ２０で実現されてもよい。この場合は、端末装置１０から画像データをサーバ２０に送信し、当該処理結果を受信すればよい。

　通信部１３０は、ネットワークＮＷに接続する機能を提供する機能部である。例えば、ＷＬＡＮに接続するための通信モジュールであったり、ＬＴＥ通信網に接続するための通信モジュールであったりする。

　記憶部１４０は、端末装置１０の動作に必要な各種プログラムや、各種データが記憶されている機能部である。記憶部１４０は、例えば、半導体メモリや、ＨＤＤ（Hard Disk Drive）等により構成されている。

　表示部１５０は、各種情報や画像データを表示する為の機能部である。例えば、液晶ディスプレイ（ＬＣＤ）や、有機ＥＬパネルにより構成されている。なお、表示部１５０は、無線やＨＤＭＩ等の有線により接続される外部の表示装置であってもよい。

　操作入力部１６０は、利用者が端末装置１０に対して操作指示を入力するための機能部である。例えば、タッチパネルを利用したソフトウェアキーや、ハードウェアキーで構成されている。表示部１５０と一体に形成されていてもよい。

　電話機能部１７０は、端末装置１０が電話として機能する場合に利用する機能部である。この電話機能部には、例えば、音声入出力部等が含まれている。なお、電話機能は従来からあるものであるため、説明を省略する。なお、一部のタブレット等の電話機能がない端末の場合は、電話機能部１７０をもたなくともよい。

　これらの機能構成は一例であり、必ずしも端末装置１０が有していなくてもよい。例えば、操作入力部１６０を有していなくとも、例えば他の入出力装置（ＵＳＢやＢｌｕｅｔｏｏｔｈ接続されたマウス等）によって実現されてもよい。また、画像入力部１１０も、例えばスマートウォッチに内蔵されたカメラからの画像が転送されたりしてもよい。

　［１．３　処理の流れ］
　続いて、本実施形態における処理の流れについて、図４のフローチャートを用いて説明する。まず、対象物が撮影され（ステップS１０２）、画像データが記憶部１４０に記憶される。この画像データは、記憶部１４０に、画像ファイルとして記憶されてもよいし、一時的に記憶されてもよい。

　続いて、画像データに基づいて、予測処理部１２０により対象物予測処理が実行される（ステップＳ１０４）。これにより、画像データに含まれている対象物の名称が予測される。

　続いて、変化が検出されたか否かを判定する（ステップＳ１０６）。ここで、本実施形態における変化を検出する動作について、図５及び図６を用いて説明する。まず、図５（ａ）に示すように、端末装置１０は、対象物Ｐ２を撮影している。このとき、撮影範囲Ｒ１００に対象物Ｐ２が含まれており、端末装置１０の表示部にプレビュー表示可能な状態となっている。

　ここで、図５（ｂ）に示すように、端末装置１０のカメラの向きや、位置を変えることにより、対象物Ｐ２を一度撮影範囲Ｒ１００から外す。そして、図５（ｃ）に示すように、再度対象物Ｐ２が撮影範囲Ｒ１００に含まれるように端末装置１０を動かす。

　画像入力部１１０（カメラ）で写す対象が変わると、ニューラルネットワークへ入力される画像データが変わる。これにより、ニューラルネットワークから出力される値も変化することになる。

　例えば、図６は、対象物Ａと、異なる対象物Ｂを写した場合の出力値を模式的に示した図である。対象物Ａを写した場合は、ｎ次元の出力値のうち、出力ｉが最も大きくなっているが、対象物Ｂを写した場合は、出力ｊが最も大きくなっている。このように、ニューラルネットワークの出力値を比較することにより、カメラで写した対象・範囲が変わり、変化があったことを検出することが可能となる。

　なお、これらの変化を検出するには、カメラの向きや位置を動かすだけでなく、対象物を動かして撮影範囲から外し再び撮影範囲に入れたり、対象物とカメラの間に物体を入れて遮断し、物体を外したりするといったことをしてもよい。

　ここで、対象物が決定（例えば、対象物の名称はこれで良いと利用者が決定処理を行う）されると、対象物が認識されたことになり、本処理を終了する（ステップＳ１０６；Ｎｏ→ステップＳ１２０；Ｙｅｓ）。対象物が決定されるまでは、例えば上述した処理が繰り返し実行される（ステップＳ１０６；Ｎｏ→ステップＳ１２０；Ｎｏ→ステップＳ１０２）。

　また、変化が検出された場合、つまり、カメラの撮影画像の変化を検知した場合には、予測処理変更判定処理が実行される（ステップＳ１０８）。ここで、本実施形態における予測処理変更判定処理としては、第１判定方法が用いられる。

　ここで、第１判定方法について説明する。第１判定方法は、ニューラルネットワークのｎ次元の出力値のうち、出力ｉの値が最も大きい状態から、閾値を通過して変化し、その後再び出力ｉの値が閾値を逆から通過して大きくなったとき、予測処理の変更が必要と判定する方法である。閾値は、例えば、各出力の値が、それぞれ紐づく名称の信頼度を表現するような出力とした場合、信頼度５０％を閾値としたい場合は、最大値と最小値の中間値を閾値とすればよい。

　例えば、図７（ａ）の最も大きい出力ｉを見ると、現在は閾値Ｓを超えた状態となっている。ここで、異なる対象物を写した（図７（ａ）で写していた対象物を撮影対象から外した）のが図７（ｂ）である。出力ｉは、閾値Ｓ以下に変化した。

　そして、再び対象物を写したのが図７（ｃ）である。図７（ｂ）から図７（ｃ）に変化すると、出力ｉは、再び閾値Ｓを超えた状態となる。この場合、予測処理の変更が必要と判断することとなる。

　なお、閾値は下がる方向の閾値と、上がる方向の閾値が異なっていてもよい。下がりと上がりとで異なった閾値を用いることで、意図せずカメラが動いてしまった場合の誤判定を抑制することができる。また、閾値は絶対値でもよいし、各出力値の最大値や平均値等からの相対値であってもよい。

　続いて、予測処理変更判定処理において、予測処理の変更が必要無いと判定された場合には、ステップＳ１０２から繰り返し処理を実行する（ステップＳ１１０；Ｎｏ→ステップＳ１０２）。

　それに対して、予測処理の変更が必要だと判定された場合には、予測変更処理が実行される（ステップＳ１１０；Ｙｅｓ→ステップＳ１１２）。これにより、予測処理の方法が変更されることとなる。

　ここで、本実施形態における予測変更処理における変更方法としては、第１変更方法が用いられる。

　具体的には、ニューラルネットワークの各ニューロンのパラメータを変更する。パラメータとは、ニューラルネットワークの中で行われる各演算の係数である。パラメータはWeight（重み）や、Bias等とも呼ばれている。

　これらのパラメータは、事前に学習され獲得されるが、学習時に入力する画像の種類や数、順番及び学習時に指定する各種設定（パラメータの初期値、定数値、学習率、学習回数、Dropout率等）によって変化する。ここで、Dropoutとは、ニューロンの出力をある割合で無効化にする処理である。これを利用することにより、予測の汎化性能（未学習の画像等広く画像を見分ける能力）を向上させる効果がある。

　ここで、予測処理の方法が変更された場合には、変更されたことを表示したり、音やバイブといった、報知手段を用いて報知したりすることとしてもよい。

　以上の処理により、予測された対象物の名称が間違えている場合や、変更したい場合に、撮影時の自然な動きにより、また予測処理から出力される数値を用いることで、予測に関する処理の変更が必要か否か判定し、処理の変更を行うことが可能となる。

　利用者は、対象物の適切な名称を得ることによって、その名称を検索エンジンで検索したり、名称に関する詳細な情報を取得したりする際に、名称入力の省略が可能となる。

　例えば、最初に認識された対象物の名称が違う場合や異なる名称を得たい場合、一度対象物を撮影対象範囲から外し、再度撮影対象とする。このとき、対象物を予測する方法が変更されることで、異なる名称が表示されることになる。したがって、最初と異なる名称が表示されることで、適切な名称を得られる可能性がある。なお、他の方法として、予測処理には手を加えず、該当する名称を予測処理の結果から単純に除外する方法もある。この場合、通常、２番目の予測が繰り上がって最上位の予測となる。

　［２．第２実施形態］
　続いて、第２実施形態について説明する。第２実施形態は、第１実施形態で説明した第１判定方法の代わりに、第２判定方法を利用して判定を行う場合について説明する。

　第２判定方法は、ｎ次元の出力値の順位をみて判定する。例えば、出力ｉの値が最も大きく１位の状態から、ｘ位未満へ落ち、再びｘ位になったときに、予測処理の変更が必要と判断する。

　なお、当該順位の閾値は、下がる場合の順位の閾値と、上がる場合の順位の閾値とが異なってもよい。

　［３．第３実施形態］
　続いて、第３実施形態について説明する。第３実施形態は、第１実施形態で説明した第１判定方法の代わりに、第３判定方法を利用して判定を行う場合について説明する。

　ｎ次元の出力値の全体の差を見て判断する。例えば、逐次、各出力値を記憶しておき（記憶した時間をｔ０とする）、その後のｔ１時間の各出力値とｔ０時間の各出力値の差（Ｌ１誤差、Ｌ２誤差、交差エントロピー誤差など）が閾値以上に変化し、その後のｔ２時間の各出力値とｔ０時間の各出力値の差が閾値未満になったときに、予測処理の変更が必要と判定する。差の一例として、Ｌ１誤差とは、異なる時間の各出力値について、同一位置にある出力値の差をとり、それらの絶対値の総和である。

　なお、差が大きくなる場合と、小さくなる場合の閾値が異なっていてもよい。

　［４．第４実施形態］
　続いて、第４実施形態について説明する。第４実施形態は、第１実施形態で説明した第１変更方法の代わりに、第２変更方法を利用して変更を行う場合について説明する。

　第２変更方法は、ニューラルネットワークのネットワーク（グラフ）を変更する。ネットワークの変更によって、パラメータも一緒に変更されることとなる。

　例えば、変更前のニューラルネットワークが、図８の構成をしていたときに、ネットワークの一部又は全部を変更する。ここで、図８において、「ｃｏｎｖ」は、畳み込み（Convolution）、「ｐｏｏｌ」はプーリング（Pooling）、「ｎｏｒｍ」は正規化（Normalization）、「ｆｃ」はフル結合（Full connection）を示している。

　変更方法は、畳み込み層の数を変更したり、新たな層を追加したり、ネットワークの途中の信号の次元を変更したり、多種多様な変更が考えられる。

　［５．第５実施形態］
　続いて、第５実施形態について説明する。第５実施形態は、第１実施形態で説明した第１変更方法の代わりに、第３変更方法を利用して変更を行う場合について説明する。

　第３変更方法は、ニューラルネットワークへ入る前の画像処理を変更する方法である。例えば、図９に示すように、ニューラルネットワークへ画像を入力する前に、物体認識画像処理部２００を設ける。

　物体認識画像処理部２００において、物体認識を行い、個々の認識された範囲をニューラルネットワークへ入力して予測を行う。このとき、物体認識のアルゴリズムやパラメータを変更する。

　物体認識のアルゴリズムとしては、Selective Search、Objectness等がある。物体認識のアルゴリズムやパラメータを変更することにより、ニューラルネットワークへ入力する範囲が変わるため、予測される名称に違いが生まれる。

　物体認識画像処理部２００において、画像データ内の物体認識された領域が切り出され、それぞれ個別に予測処理が実行される（図１０）。物体認識により、対象物の名称の予測精度が高まり、また、複数の対象物の名称を予測できるといった効果が得られる。

　また、物体認識とは別の画像処理として、ニューラルネットワークへ画像を入力する前に、画像データを拡大／縮小する処理を追加、変更したり、画像データのコントラストや明るさを変えたりといった、様々な変更が考えられる。

　［６．第６実施形態］
　続いて、第６実施形態について説明する。第６実施形態は、第１実施形態で説明した第１変更方法の代わりに、第４変更方法を利用して変更を行う場合について説明する。

　第４変更方法は、ニューラルネットワークの後の処理を変更する方法である。図１１に示すようにニューラルネットワークの後に、分類処理部４００（分類器）を設けることとする。

　これにより、ニューラルネットワークの出力値から予測する名称を決めず、出力値を分類処理部４００にかけて、分類されたクラスに紐づく名称を予測とするといった処理が行われる。このとき、分類処理部４００のアルゴリズムやパラメータを変更する。例えば、これらのアルゴリズムとしては、SVM（サポートベクターマシン）、ランダムフォレスト等がある。

　［７．第７実施形態］
　本実施形態では、過去に行われた予測処理変更の実績を記憶しておき、実績が高い予測処理へ変更する。

　例えば、過去に行われた予測処理について、予測処理変更判定処理にて変更が必要と判定された場合は、変更前の予測処理のスコアをマイナスし、画像認識が決定された場合は、そのときの予測処理のスコアをプラスしておく。このスコアを用い、予測処理の変更が必要な場合、スコアの高い予測処理へ優先的に変更する。

　これにより、成功実績の多い予測処理が選ばれるため、適正な対象物の名称を得るまでの時間を短縮することができる。

　［８．変形例］
　本発明は上述した各実施の形態に限定されるものではなく、種々の変更が可能である。すなわち、本発明の要旨を逸脱しない範囲内において適宜変更した技術的手段を組み合わせて得られる実施の形態についても本発明の技術的範囲に含まれる。

　また、各実施形態の判定方法、変更方法は組み合わせてもよいことは勿論である。例えば、第２判定方法と、第４変更方法とを組み合わせてもよいし、第３判定方法と、第２変更方法とを組み合わせてもよい。

　また、判定方法、変更方法を重畳的に適用してもよい。例えば、第１判定方法、第２判定方法との両方を用いてもよいし、全ての方法を一つの処理として適用してもよい。

　すなわち、判定方法、変更方法は、実施形態に関わらず整合性がとれる範囲で自由に組み合わせて実施可能である。

１　システム
１０　端末装置
　１００　制御部
　１１０　画像入力部
　１２０　予測処理部
　１２５　処理変更判定部
　１３０　通信部
　１４０　記憶部
　１５０　表示部
　１６０　操作入力部
　１７０　電話機能部
２０　サーバ

Claims

　入力された画像から、予測処理に基づいて対象物を認識する対象物認識手段を備えた画像認識装置において、
　入力された画像から動きが検知された場合には、前記予測処理の変更が必要か否かを判定する予測処理変更判定手段と、
　前記予測処理の変更が必要と判定された場合には、前記予測処理と異なる予測処理に変更をする予測処理変更手段と、
　を備えることを特徴とする画像認識装置。
　前記予測処理変更判定手段は、前記対象物が前記画像に含まれているか否かで動きを検知することを特徴とする請求項１に記載の画像認識装置。
　前記予測処理変更判定手段は、
　前記画像をニューラルネットワークに入力して、当該ニューラルネットワークの出力値の変化に基づいて、動きを検知することを特徴とする請求項１又は２に記載の画像認識装置。
　前記予測処理変更手段は、前記ニューラルネットワークを変更することを特徴とする請求項３に記載の画像認識装置。
　入力された画像から、予測処理に基づいて対象物を認識する対象物認識機能を実行可能なコンピュータに、
　入力された画像から動きが検知された場合には、前記予測処理の変更が必要か否かを判定する予測処理変更判定機能と、
　前記予測処理の変更が必要と判定された場合には、前記予測処理と異なる予測処理に変更をする予測処理変更機能と、
　を実現させるためのプログラム。