JP6874827B2

JP6874827B2 - 画像処理装置、画像処理方法及び記録媒体

Info

Publication number: JP6874827B2
Application number: JP2019507542A
Authority: JP
Inventors: 皓中山
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2017-03-21
Filing date: 2018-03-09
Publication date: 2021-05-19
Anticipated expiration: 2038-03-09
Also published as: WO2018173800A1; US11068751B2; JPWO2018173800A1; US20200012899A1; CN110447038A

Description

本発明は、画像処理装置、画像処理方法及び記録媒体に関する。

画像内の特定の対象物を自動認識する画像認識技術が広く利用されている。例えば、特許文献１には、スライディングウィンドウ方式によって複数の画像データを抽出し、対象物を探索する手法が記載されている。スライディングウィンドウ方式とは、予め決められたウィンドウサイズの領域を、原画像の全域において所定のスライド幅でスライドさせることにより、対象物を探索する方式である。

特開２００４−２６０６６８号公報

機械学習システムにスライディングウィンドウを用いた場合、機械学習の精度を高めるにはスライド幅を小さくし、多数の画像データを学習データとして用いることが好ましい。しかしながら、この場合には、学習データが膨大となり、機械学習に要する時間が増大してしまう可能性がある。

本発明は、上述の課題に鑑みてなされたものであって、スライディングウィンドウを用いた機械学習において、機械学習の精度を高めながら機械学習の時間を削減可能な画像処理装置を提供することを目的とする。

本発明の一観点によれば、原画像において所定のスライディングウィンドウを用いて画像データを抽出する抽出部と、前記画像データを含む学習データにおいて、前記画像データの分類を表す教師信号を用いて機械学習を行うことにより、予測モデルを生成する学習部とを備えた画像処理装置であって、前記画像データとは異なる他の画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記他の画像データを選択し、前記学習データに追加する選択部をさらに備え、前記学習部は、前記他の画像データが追加された前記学習データにおいて前記機械学習を繰り返すことにより、前記予測モデルを更新し、前記画像データは、第１のスライド幅で前記スライディングウィンドウを移動させることにより抽出され、前記他の画像データは、前記第１のスライド幅よりも小さな第２のスライド幅で前記スライディングウィンドウを移動させることにより抽出されることを特徴とする画像処理装置が提供される。

本発明の他の観点によれば、原画像において所定のスライディングウィンドウを用いて画像データを抽出するステップと、前記画像データを含む学習データにおいて、前記画像データの分類を表す教師信号を用いて機械学習を行うことにより、予測モデルを生成するステップとを備えた画像処理方法であって、前記画像データとは異なる他の画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記他の画像データを選択し、前記学習データに追加するステップと、前記他の画像データが追加された前記学習データにおいて前記機械学習を繰り返すことにより、前記予測モデルを更新するステップとをさらに備え、前記画像データは、第１のスライド幅で前記スライディングウィンドウを移動させることにより抽出され、前記他の画像データは、前記第１のスライド幅よりも小さな第２のスライド幅で前記スライディングウィンドウを移動させることにより抽出されることを特徴とする画像処理方法が提供される。

本発明の更に他の観点によれば、原画像において所定のスライディングウィンドウを用いて画像データを抽出するステップと、前記画像データを含む学習データにおいて、前記画像データの分類を表す教師信号を用いて機械学習を行うことにより、予測モデルを生成するステップとをコンピュータに実行させるプログラムが記録された記録媒体であって、前記画像データとは異なる他の画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記他の画像データを選択し、前記学習データに追加するステップと、前記他の画像データが追加された前記学習データにおいて前記機械学習を繰り返すことにより、前記予測モデルを更新するステップとをさらに備え、前記画像データは、第１のスライド幅で前記スライディングウィンドウを移動させることにより抽出され、前記他の画像データは、前記第１のスライド幅よりも小さな第２のスライド幅で前記スライディングウィンドウを移動させることにより抽出されることを特徴とする記録媒体が提供される。

本発明によれば、機械学習の精度を高めながら、機械学習の時間を削減可能な画像処理装置を提供することができる。

本発明の第１実施形態における画像処理装置の概略構成を示すブロック図である。本発明の第１実施形態における画像処理装置のハードウェアブロック図である。本発明の第１実施形態におけるスライディングウィンドウの一例を示す図である。本発明の第１実施形態におけるスライディングウィンドウの一例を示す図である。本発明の第１実施形態における原画像及び画像データの一例を示す図である。本発明の第１実施形態における画像処理装置の動作を表すフローチャートである。本発明の第１実施形態における機械学習の概要を表す図である。本発明の第４実施形態における画像処理装置のブロック図である。

［第１実施形態］
図１は、第１実施形態に係る画像処理装置の概略構成を示すブロック図である。本実施形態に係る画像処理装置は、原画像に含まれる検出対象（オブジェクト）を検出するための学習を自動で行うための学習データを生成し、学習データを用いて機械学習を行う。画像処理装置は、学習データ抽出部１０、画像取得部１１、画像記憶部１２、学習データ記憶部１３、学習部１４、予測モデル記憶部１５を備える。学習データ抽出部１０は、切出部１０１、ラベル付与部１０２、確信度算出部１０３、選択部１０４を備える。

本実施形態に係る画像処理装置は、学習結果を用いて原画像から検出対象を検出する画像認識機能を更に備えることにより、画像認識システムとして機能し得る。また、学習データの生成を単独の装置で行うことにより、学習データの生成機能と、学習データを用いた学習機能とが別の装置として構成されていてもよい。

画像記憶部１２は、機械学習に用いられる１以上の原画像を記憶する。原画像は静止画、動画のいずれであっても良く、例えば衛星写真、監視カメラによる画像など、その種類を問わない。画像取得部１１は、画像記憶部１２から原画像を取得し、学習データ抽出部１０に送出する。画像取得部１１は、原画像に対して輝度ヒストグラムの補正、ノイズリダクションなどの画像処理を行っても良い。切出部１０１は、原画像においてスライディングウィンドウを所定のスライド幅でスライドさせながら、複数の画像データを切り出す。本実施形態において、スライド幅は可変であって、第１回の学習データの生成においては、スライド幅は最大値、例えばスライディングウィンドウの幅と等しい値、若しくはそれ以上の値に設定される。第２回以降の学習データの生成においては、スライド幅は順次、小さな値に設定される。ラベル付与部１０２は切り出された画像データを分類するためのラベルを付与する。例えば、画像データに船舶がオブジェクトとして含まれている場合には、ラベル付与部１０２は画像データに「ｓｈｉｐ」、「ｎｏ＿ｓｈｉｐ」などのラベルを付与する。ラベルが付与された画像データは学習データとして学習データ記憶部１３に保存される。

学習部１４は学習データ記憶部１３に保存された学習データにおいて機械学習を行う。上述したように学習データには画像データとラベルとが含まれていることから、学習部１４はラベルを教師信号として用い、いわゆる教師ありの機械学習を実行する。教師信号はラベルの分類を表す２値のデータ、あるいは分類の種別を表す３値以上の離散データであり得る。学習部１４は教師信号と画像信号とを用いて分類の基準を構築する。学習部１４において行われる機械学習に用いられるアルゴリズムは、例えば、ディープラーニング、ＳＶＭ（Support Vector Machine）等であり得る。学習部１４による学習結果は予測モデルとして予測モデル記憶部１５に保存される。

確信度算出部１０３は機械学習中の予測モデルを用いて、画像データのそれぞれの分類の確信度を算出する。ここで、確信度とは、予測モデルによる分類結果に対する信頼度である。一般に、教師あり機械学習においては、データを分類するスコア値（０〜１）が出力され、最も大きい出力値が分類の確信度となる。選択部１０４は、第２回以降の機械学習において、小さなスライド幅を用いて切り出された複数の画像データのなかから、分類の確信度が低い画像データを選択する。すなわち、選択部１０４は、予測モデルに基づく出力値と教師信号などの期待値との誤差が所定の閾値よりも大きい画像データを選択し、学習データに追加する。このように、確信度が低い画像データ、すなわち、分類の誤差が大きな画像データは、予測モデルの精度向上に資するものである。一方、確信度が高い画像データは、予測モデルの精度向上に大きな影響を与えないため、学習データに追加する必要性は少ない。従って、第２回以降の機械学習においては、選択部１０４は分類の誤差が所定の閾値よりも大きな画像データを学習データに加え、学習部１４は予測モデルを更新している。学習データ抽出部１０、学習部１４は、誤差が十分にゼロに近づくまで上述の処理を繰り返し実行する。

図２は、本実施形態における画像処理装置のハードウェアブロック図である。図１に示された画像処理装置は図２のコンピュータシステムによって構成され得る。画像処理装置は、ＣＰＵ（Central Processing Unit）２０１、ＲＡＭ（Random Access Memory）２０２、ＲＯＭ（Read Only Memory）２０３、記憶媒体２０４、入力装置２０５、表示装置２０６及びネットワークインターフェース２０７を備える。

ＣＰＵ２０１は、ＲＯＭ２０３、記憶媒体２０４等に記憶されたプログラムに従って所定の動作を行うとともに、画像処理装置の各部を制御する機能をも有する。また、ＣＰＵ２０１は、学習データ抽出部１０、画像取得部１１、画像記憶部１２、学習データ記憶部１３、学習部１４、予測モデル記憶部１５の各部の機能を実現するプログラムを実行する。

ＲＡＭ２０２は、ＣＰＵ２０１の動作に必要な一時的なメモリ領域を提供する。ＲＯＭ２０３は、不揮発性メモリから構成され、コンピュータの動作に用いられるプログラム等の必要な情報を記憶する。記憶媒体２０４は、ハードディスクなどの大容量記憶装置である。ＲＡＭ２０２又は記憶媒体２０４は、画像記憶部１２、学習データ記憶部１３、予測モデル記憶部１５の各部の機能を実現する記憶領域を提供する。

入力装置２０５は、キーボード、マウス、タッチパネル等であって、ユーザがコンピュータを操作するために用いられる。表示装置２０６は、液晶表示装置等であって、画像、文字等の表示に用いられる。ネットワークインターフェース２０７は、イーサネット（登録商標）、Ｗｉ−Ｆｉ（登録商標）等の規格に基づく通信インターフェースであり、他の装置との通信を行うためのモジュールである。

なお、図２に示されているハードウェア構成は例示であり、これら以外の装置が追加されていてもよく、一部の装置が設けられていなくてもよい。例えば、一部の機能がネットワークを介して他の装置により提供されてもよく、本実施形態を構成する機能が複数の装置に分散されて実現されるものであってもよい。

図３、図４は本実施形態におけるスライディングウィンドウの一例を示している。原画像３０は例えば衛星写真、航空写真などのように高解像度のデータであり得る。切出部１０１は原画像３０において矩形のスライディングウィンドウ３１０を所定のスライド幅で移動させながら、スライディングウィンドウ３１０内の画像データを切り出す。切り出された画像データはラベルとともに、学習データとして保存される。本実施形態においては、第１回の機械学習、第２回以降の機械学習において、異なるスライド幅が設定される。スライド幅は原画像３０において直交する二軸、すなわちＸ方向、Ｙ方向のそれぞれにおいて設定可能である。第１回の機械学習においては、第１のスライド幅は例えば隣接するスライディングウィンドウ３１０、３１０ａ、３１０ｂが重複しないように、設定され得る（図３参照）。

第２回の機械学習において、第２のスライド幅は第１のスライド幅よりも小さい値に設定される（図４参照）。さらに、第３回以降の機械学習においては、スライド幅は順次小さい値に設定される。このように、スライド幅を次第に小さくしながら画像データを切り抜き、新たな画像データを学習データに追加することで、機械学習の精度を向上させることが可能となる。本実施形態においては、後述するように、第２回以降の機械学習においては、機械学習の精度の向上に資する画像データを学習データに追加することで、機械学習の精度を向上させながら機械学習の時間を削減することが可能となる。

図５は本実施形態における原画像及び画像データの一例を示している。原画像３０の一部には船舶のオブジェクト３０１、３０２が含まれている。切出部１０１は原画像３０においてスライディングウィンドウを所定のスライド幅で移動させながら、スライディングウィンドウ内の画像データを切り抜く。例えば、スライディングウィンドウ３１１、３１２がオブジェクト３０１、３０２を包囲するように位置する場合、切り抜かれた画像データにはラベル付与部１０２によって「ｓｈｉｐ」のラベルが付与される。一方、切り抜かれた画像データにオブジェクトが含まれていない場合には、画像データにはラベル付与部１０２によって「ｎｏ＿ｓｈｉｐ」のラベルが付与される。このようにして、ラベルが付与された画像データは学習データとして学習データ記憶部１３に保存され、学習データにおける教師ありの機械学習が学習部１４によってなされる。

続いて、図６、図７を参照しながら本実施形態における画像処理装置の動作を説明する。図６は本実施形態における画像処理装置の動作を表すフローチャートであり、図７は本実施形態における機械学習のアルゴリズムを表す図である。

先ず、画像取得部１１は画像記憶部１２から原画像を読み出し、学習データ抽出部１０に送出する。学習データ抽出部１０は学習回数を表す変数ｎを「１」に設定する（ステップＳ１）。さらに、学習データ抽出部１０はスライディングウィンドウのサイズ、スライド幅Ｓｎをそれぞれ初期値に設定する（ステップＳ２）。上述したように、スライド幅ＳｎはＸ方向、Ｙ方向のそれぞれについて設定可能であって、スライディングウィンドウのＸ方向長さ、Ｙ方向長さに応じて設定され得る。スライディングウィンドウのサイズは一定の値に設定され得る。切出部１０１は、設定されたスライド幅Ｓｎ毎にスライディングウィンドウを移動させながら、原画像から画像データを順次切り出す（ステップＳ３）。ラベル付与部１０２は切り出された画像データのオブジェクトの有無または種類に応じて画像データを分類し、ラベルを画像データに付与する。学習データ記憶部１３はラベルが付与された画像データを学習データ５４として保存する。学習部１４は学習データ５４においてラベルを参照しながら教師ありの機械学習を実行し、予測モデルＭｎを生成する（ステップＳ４）。予測モデルＭｎにおける平均誤差が十分に下がった後、学習部１４は予測モデルＭｎを予測モデル記憶部１５に保存する。

続いて、学習データ抽出部１０は変数ｎに「１」を付加し、学習回数を「２」に設定する（ステップＳ５）。学習データ抽出部１０は、スライド幅ＳｎをＳｎ＝２×Ｓ（ｎ−１）／３とする（ステップＳ６）。すなわち、第２回のスライド幅Ｓ２は第１回のスライド幅Ｓ１の７５％に設定される。切出部１０１はスライド幅Ｓ２毎にスライディングウィンドウを移動させ、画像データ５０を切り出す（ステップＳ７）。ラベル付与部１０２は第２回の画像データ５０にラベルを付与する。

確信度算出部１０３は第２回の画像データ５０を第１回の予測モデルＭｎ、すなわち予測モデルＭ１を用いて分類し、確信度を算出する（ステップＳ８）。選択部１０４は画像データ５０のそれぞれについて確信度と期待値との誤差を算出し、誤差が所定の閾値を超えるか否かを判断する（ステップＳ９）。選択部１０４は複数の画像データ５０のうち、誤差が所定の閾値を超える画像データ５３を選択し（ステップＳ９でＹＥＳ）、第１回の学習データ５４に追加する（ステップＳ１０）。一方、誤差が所定の閾値以下の画像データ５２は精度向上に与える影響が少ないため、学習データ５４に追加されずに破棄される。このようにして、選択された第２回の画像データ５３は第１回の学習データ５４に追加され、第２回の学習データ５５が学習データ記憶部１３に保存される。学習部１４は第２回の学習データ５５において機械学習を実行し、第２回の予測モデルＭ２を作成する（ステップＳ１１）。続いて、画像処理装置はステップＳ５に戻り、第３回の機械学習を行う。すなわち、学習データ抽出部１０は第３回のスライド幅Ｓ３を第２回のスライド幅Ｓ２の７５％に設定し（ステップＳ６）、切出部１０１はさらに細かく画像データを切り出す（ステップＳ７）。確信度算出部１０３は第３回の画像データを第２回の予測モデルＭ２を用いて分類し、確信度を算出する（ステップＳ８）。このようにして、画像データを学習データに追加することで、予測モデルＭｎの誤差が閾値以下となると（ステップＳ９でＮＯ）、画像処理装置は機械学習を終了する。

本実施形態によれば、スライド幅を次第に小さくしながら画像データを切り出し、他の画像データを学習データに追加することで、機械学習の精度を向上させることが可能となる。また、第２回以降の学習においては、学習精度の向上に資する画像データを学習データに追加することで、学習時間を削減することが可能となる。

［第２実施形態］
第１実施形態においては、原画像の全体に亘ってスライディングウィンドウを移動させながら画像データを切り出していた。本実施形態においては、指定された領域においてスライド幅を細かく設定することで、機械学習をさらに高速化させることが可能となる。例えば、オブジェクトの一部を含む画像データは分類における誤差が比較的大きくなり易い。このような画像データは予測モデルの精度向上に資するものである。従って、スライディングウィンドウ内にオブジェクトの境界が含まれる場合、スライド幅を小さくすることで、誤差が大きくなる、より多くの画像データを学習データに加えることが好ましい。

本実施形態によれば、さらに機械学習の時間を削減しながら機械学習の精度を向上させることが可能となる。

［第３実施形態］
第１実施形態においては、スライディングウィンドウによって切り出されたすべての画像データを第１回の機械学習に用いていた。本実施形態においては、第２回以降の機械学習と同様に、第１回の学習においても誤差が高くなる画像データのみを学習データとして用いても良い。これにより、機械学習の時間をさらに削減することが可能となる。すなわち、予測モデルの精度向上に資する画像データのみを学習データとして用いることにより、効率良く機械学習を行うことができる。

［第４実施形態］
図８は本実施形態における画像処理装置のブロック図である。本実施形態における画像処理装置８は抽出部８１、学習部８２、選択部８３を含む。抽出部８１は、原画像において所定のスライディングウィンドウを用いて画像データを抽出する。学習部８２は、画像データを含む学習データにおいて、画像データの分類を表す教師信号を用いて機械学習を行うことにより、予測モデルを生成する。選択部８３は、画像データとは異なる他の画像データのなかから、予測モデルに基づく分類の誤差が所定の閾値よりも大きい他の画像データを選択し、学習データに追加する。さらに、学習部８２は、他の画像データが追加された学習データにおいて機械学習を繰り返すことにより、予測モデルを更新する。

本実施形態によれば、機械学習の精度向上に資する他の画像データを学習データに追加しながら機械学習を繰り返すことにより、機械学習の精度を高めながら、機械学習間を削減可能な画像処理装置を提供することができる。

［変形実施形態］
本発明は、上述の実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲において適宜変更可能である。

また、上述の実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記憶媒体に記録させ、記憶媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記憶媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記憶媒体だけでなく、そのプログラム自体も各実施形態に含まれる。また、上述の実施形態に含まれる１又は２以上の構成要素は、各構成要素の機能を実現するように構成されたＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）等の回路であってもよい。

該記憶媒体としては例えばフロッピー（登録商標）ディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ（Compact Disk）−ＲＯＭ、磁気テープ、不揮発性メモリカード、ＲＯＭを用いることができる。また該記憶媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、ＯＳ（Operating System）上で動作して処理を実行するものも各実施形態の範疇に含まれる。

なお、上述の実施形態は、いずれも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。

上述の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

（付記１）
原画像において所定のスライディングウィンドウを用いて画像データを抽出する抽出部と、
前記画像データを含む学習データにおいて、前記画像データの分類を表す教師信号を用いて機械学習を行うことにより、予測モデルを生成する学習部とを備えた画像処理装置であって、
前記画像データとは異なる他の画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記他の画像データを選択し、前記学習データに追加する選択部をさらに備え、
前記学習部は、前記他の画像データが追加された前記学習データにおいて前記機械学習を繰り返すことにより、前記予測モデルを更新することを特徴とする画像処理装置。

（付記２）
前記画像データは、第１のスライド幅で前記スライディングウィンドウを移動させることにより抽出され、
前記他の画像データは、前記第１のスライド幅よりも小さな第２のスライド幅で前記スライディングウィンドウを移動させることにより抽出されることを特徴とする付記１に記載の画像処理装置。

（付記３）
前記選択部は、前記画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記画像データを選択し、前記学習データに追加することを特徴とする付記１または２に記載の画像処理装置。

（付記４）
前記学習部は、前記学習データにおける平均の誤差が所定値以下となるまで、前記機械学習を繰り返すことを特徴とする付記１乃至３のいずれか１項に記載の画像処理装置。

（付記５）
前記抽出部は、前記原画像におけるオブジェクトの一部を含む前記画像データを抽出することを特徴とする付記１乃至３のいずれか１項に記載の画像処理装置。

（付記６）
前記スライディングウィンドウは矩形であることを特徴とする付記１乃至５のいずれか１項に記載の画像処理装置。

（付記７）
前記第１及び前記第２のスライド幅は前記原画像において直交する２軸のそれぞれに対して設定可能であることを特徴とする付記２に記載の画像処理装置。

（付記８）
前記教師信号は、前記画像データに付与されたラベルに基づく信号であることを特徴とする付記１乃至６のいずれか１項に記載の画像処理装置。

（付記９）
原画像において所定のスライディングウィンドウを用いて画像データを抽出するステップと、
前記画像データを含む学習データにおいて、前記画像データの分類を表す教師信号を用いて機械学習を行うことにより、予測モデルを生成するステップとを備えた画像処理方法であって、
前記画像データとは異なる他の画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記他の画像データを選択し、前記学習データに追加するステップと、
前記他の画像データが追加された前記学習データにおいて前記機械学習を繰り返すことにより、前記予測モデルを更新するステップとをさらに備えることを特徴とする画像処理方法。

（付記１０）
原画像において所定のスライディングウィンドウを用いて画像データを抽出するステップと、
前記画像データを含む学習データにおいて、前記画像データの分類を表す教師信号を用いて機械学習を行うことにより、予測モデルを生成するステップとをコンピュータに実行させるプログラムが記録された記録媒体であって、
前記画像データとは異なる他の画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記他の画像データを選択し、前記学習データに追加するステップと、
前記他の画像データが追加された前記学習データにおいて前記機械学習を繰り返すことにより、前記予測モデルを更新するステップとをさらに備えることを特徴とする記録媒体。

この出願は、２０１７年３月２１日に出願された日本出願特願２０１７−０５４１４０を基礎とする優先権を主張し、その開示のすべてをここに取り込む。

Claims

原画像において所定のスライディングウィンドウを用いて画像データを抽出する抽出部と、
前記画像データを含む学習データにおいて、前記画像データの分類を表す教師信号を用いて機械学習を行うことにより、予測モデルを生成する学習部とを備えた画像処理装置であって、
前記画像データとは異なる他の画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記他の画像データを選択し、前記学習データに追加する選択部をさらに備え、
前記学習部は、前記他の画像データが追加された前記学習データにおいて前記機械学習を繰り返すことにより、前記予測モデルを更新し、
前記画像データは、第１のスライド幅で前記スライディングウィンドウを移動させることにより抽出され、
前記他の画像データは、前記第１のスライド幅よりも小さな第２のスライド幅で前記スライディングウィンドウを移動させることにより抽出されることを特徴とする画像処理装置。
前記選択部は、前記画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記画像データを選択し、前記学習データに追加することを特徴とする請求項１に記載の画像処理装置。
前記学習部は、前記学習データにおける平均の誤差が所定値以下となるまで、前記機械学習を繰り返すことを特徴とする請求項１または２に記載の画像処理装置。
前記抽出部は、前記原画像におけるオブジェクトの一部を含む前記画像データを抽出することを特徴とする請求項１または２に記載の画像処理装置。
前記スライディングウィンドウは矩形であることを特徴とする請求項１乃至４のいずれか１項に記載の画像処理装置。
前記第１及び前記第２のスライド幅は前記原画像において直交する２軸のそれぞれに対して設定可能であることを特徴とする請求項１に記載の画像処理装置。
前記教師信号は、前記画像データに付与されたラベルに基づく信号であることを特徴とする請求項１乃至５のいずれか１項に記載の画像処理装置。
原画像において所定のスライディングウィンドウを用いて画像データを抽出するステップと、
前記画像データを含む学習データにおいて、前記画像データの分類を表す教師信号を用いて機械学習を行うことにより、予測モデルを生成するステップとを備えた画像処理方法であって、
前記画像データとは異なる他の画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記他の画像データを選択し、前記学習データに追加するステップと、
前記他の画像データが追加された前記学習データにおいて前記機械学習を繰り返すことにより、前記予測モデルを更新するステップとをさらに備え、
前記画像データは、第１のスライド幅で前記スライディングウィンドウを移動させることにより抽出され、
前記他の画像データは、前記第１のスライド幅よりも小さな第２のスライド幅で前記スライディングウィンドウを移動させることにより抽出されることを特徴とする画像処理方法。
原画像において所定のスライディングウィンドウを用いて画像データを抽出するステップと、
前記画像データを含む学習データにおいて、前記画像データの分類を表す教師信号を用いて機械学習を行うことにより、予測モデルを生成するステップとをコンピュータに実行させるプログラムが記録された記録媒体であって、
前記画像データとは異なる他の画像データのなかから、前記予測モデルに基づく分類の誤差が所定の閾値よりも大きい前記他の画像データを選択し、前記学習データに追加するステップと、
前記他の画像データが追加された前記学習データにおいて前記機械学習を繰り返すことにより、前記予測モデルを更新するステップとをさらに備え、
前記画像データは、第１のスライド幅で前記スライディングウィンドウを移動させることにより抽出され、
前記他の画像データは、前記第１のスライド幅よりも小さな第２のスライド幅で前記スライディングウィンドウを移動させることにより抽出されることを特徴とする記録媒体。