JP2015032308A

JP2015032308A - 畳み込みニューラルネットワークの分類器、及びその分類方法、訓練方法

Info

Publication number: JP2015032308A
Application number: JP2014152783A
Authority: JP
Inventors: ウ・チュヌポン; Chunpeng Wu; ファヌ・ウエイ; Wei Fan; 源何; Yuan He; 俊孫; Shun Son
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2013-07-31
Filing date: 2014-07-28
Publication date: 2015-02-16
Also published as: US20150036920A1; EP2833295A2; EP2833295A3; US9697444B2; CN104346622A

Abstract

【課題】充分な柔軟性を有する畳み込みニューラルネットワークの分類器、該畳み込みニューラルネットワークの分類器を用いる方法及び該畳み込みニューラルネットワークの分類器の訓練方法を提供する。
【解決手段】畳み込みニューラルネットワークの分類器は、少なくとも１つの特徴図の層の少なくとも１つの特徴図が複数の領域に区分された複数の特徴図の層と、複数の領域にそれぞれ対応し、対応する領域におけるニューロンの応答値を取得する複数の緩い畳み込みテンプレートとを含む。
【選択図】図２

Description

本発明は、画像認識分野に関し、具体的に、畳み込みニューラルネットワークの分類器、畳み込みニューラルネットワークの分類器を用いる分類方法、及び畳み込みニューラルネットワークの分類器の訓練方法に関する。

畳み込みニューラルネットワーク（CNN：Convolutional Neural Network）の分類器は、常に画像認識に用いられる。図１は、従来の畳み込みニューラルネットワークの分類器を示し、図４乃至図７は、従来の畳み込みニューラルネットワークの分類器によりニューロンの応答値を算出するプロセスを示している。該従来の畳み込みニューラルネットワークの分類器により認識を行うプロセスでは、手書きの数字を例として、１つの画像を入力して、畳み込み、空間最大サンプリング及び全連結の処理を複数回繰り返した後で、畳み込みニューラルネットワーク分類器が各数字についての信頼度を出力し、信頼度の最も高い出力が認識の結果である。図１、図４乃至図７における各ブロック、例えばＦ１、Ｆ２及びＦ３は特徴図であり、入力画像も特徴図と見なされてもよい。

上記の方法では、畳み込み操作の機能は、前の層の特徴図から特徴を抽出することである。しかし、従来の畳み込みニューラルネットワークの分類器の畳み込み操作は、抽出された特徴の数がある程度限定されているため、畳み込みニューラルネットワークの分類器の構成が十分な柔軟性を有していない。

よって、上記課題を解決できる技術が望ましい。

以下、本発明の主旨を理解させるため、本発明を簡単に説明する。なお、これらの説明は、本発明を限定するものではない。以下の説明は、本発明の肝心又は重要な部分を決定するものではなく、本発明の範囲を限定することではない。その目的は、その後の詳しい説明の前文として、ある概念を簡単に説明するものに過ぎない。

本発明は、畳み込みニューラルネットワークの分類器、畳み込みニューラルネットワークの分類器を用いる分類方法、及び畳み込みニューラルネットワークの分類器の訓練方法を提供することを１つの主な目的とする。

本発明の一の実施例では、少なくとも１つの特徴図の層の少なくとも１つの特徴図が複数の領域に区分された複数の特徴図の層と、前記複数の領域にそれぞれ対応し、対応する領域におけるニューロンの応答値を取得する複数の畳み込みテンプレートと、を含む、畳み込みニューラルネットワークの分類器を提供する。

本発明の他の実施例では、畳み込みニューラルネットワークの分類器を用いる分類方法であって、前記畳み込みニューラルネットワークの分類器は、複数の特徴図の層を含み、前記分類方法は、前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップと、分類対象を前記畳み込みニューラルネットワークの分類器に送り込んで前方伝播を行い、出力結果を取得するステップであって、前方伝播を行う際に、前記複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得する、ステップと、前記出力結果に基づいて前記分類対象を分類するステップと、を含む、分類方法を提供する。

本発明の他の実施例では、畳み込みニューラルネットワークの分類器の訓練方法であって、前記畳み込みニューラルネットワークの分類器は、複数の特徴図の層を含み、前記訓練方法は、前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップと、既知の標識を有する訓練サンプルを前記畳み込みニューラルネットワークの分類器に送り込んで前方伝播を行い、出力結果を取得するステップであって、前方伝播を行う際に、前記複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得する、ステップと、前記出力結果と前記既知の標識との差に基づいて逆方向伝播を行い、前記畳み込みテンプレートにおける加重値を含む前記畳み込みニューラルネットワークの分類器のパラメータを補正するステップと、所定の条件が満たされるまで、上記のステップを繰り返すステップと、を含む、訓練方法を提供する。

また、本発明の実施例は、上記の方法を実施するコンピュータプログラムをさらに提供する。

また、本発明の実施例は、上記の方法を実施するコンピュータプログラムを記録する、少なくともコンピュータ読み取り可能な媒体の形式のコンピュータプログラムプロダクトをさらに提供する。

図面による本発明に対する以下の説明を参照すると、本発明の上記及び他利点がより明らかになるであろう。

下記図面の詳細の説明を通じて、本発明の実施例の上記の目的、他の目的、特徴及び利点はより明確になる。図面におけるユニットは、単なる本発明の原理を示すものである。図面において、同一又は類似する技術的特徴又はユニットは、同一又は類似する記号で示されている。
従来の畳み込みニューラルネットワークの分類器を示す図である。本発明の実施例に係る畳み込みニューラルネットワークの分類器を示す図である。図１又は図２から選択された局所を示す図である。従来の畳み込みニューラルネットワークの分類器を用いてニューロンの応答値を計算するプロセスを示す図である。従来の畳み込みニューラルネットワークの分類器を用いてニューロンの応答値を計算するプロセスを示す図である。従来の畳み込みニューラルネットワークの分類器を用いてニューロンの応答値を計算するプロセスを示す図である。従来の畳み込みニューラルネットワークの分類器を用いてニューロンの応答値を計算するプロセスを示す図である。本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いてニューロンの応答値を計算するプロセスを示す図である。本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いてニューロンの応答値を計算するプロセスを示す図である。本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いてニューロンの応答値を計算するプロセスを示す図である。本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いてニューロンの応答値を計算するプロセスを示す図である。本発明の実施例に係る畳み込みニューラルネットワークの分類器の特徴図の区分方式を示す図である。本発明の実施例に係る畳み込みニューラルネットワークの分類器の訓練方法のフローチャートである。本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いる分類方法のフローチャートである。本発明に係る畳み込みニューラルネットワークの分類器を用いる分類方法及び畳み込みニューラルネットワークの分類器の訓練方法の実施に適用できる計算機器の例の構成を示す図である。

以下、図面を参照しながら本発明の例示的な実施例を詳細に説明する。本発明のある図面またはある実施形態に記載の要素と技術的特徴は、１つまたは複数の他の図面または実施形態における要素と技術的特徴と組み合せることができる。また、注意すべきなのは、明瞭に説明するために、図面および明細書には本発明に関係のない、当業者が既知の要素と処理の表示と記載が省略されている。

図２は、本発明の実施例に係る畳み込みニューラルネットワークの分類器を示す図であり、図３は、図１又は図２から選択された局所を示す図であり、図８乃至図１１は、本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いてニューロンの応答値を計算するプロセスを示す図である。

図２、図３、及び図８乃至図１１に示すように、本発明の実施例に係る畳み込みニューラルネットワークの分類器は、複数の特徴図の層を含み、複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図は、複数の領域に区分されている。本発明の実施例に係る畳み込みニューラルネットワークの分類器は、複数の畳み込みテンプレートをさらに含み、これらの畳み込みテンプレートは、区分された複数の領域にそれぞれ対応し、各畳み込みテンプレートは、対応する領域におけるニューロンの応答値を取得するために用いられる。

具体的には、図２に示す畳み込みニューラルネットワークの分類器は、図１に示す従来の畳み込みニューラルネットワークの分類器に比べて、図２における緩い畳み込み操作１’及び２’それぞれが図１における畳み込み操作１及び２に取って代わる。また、図１に比べて、図２では、全連結操作の前にもう１つの緩い畳み込み操作３’を追加している。図２における緩い畳み込み操作は、上述した複数の畳み込みテンプレートを用いて畳み込みを行う操作である。

本文における「緩い畳み込み操作」という用語は、同一特徴図におけるニューロンの応答値を算出する際に異なる畳み込みテンプレートを用いることを意味し、該特徴図が位置する層を「緩い畳み込み層」と称する。

他の実施例では、畳み込みニューラルネットワークの分類器のネットワーク構造を適切に調整してもよく、例えば、「緩い畳み込み−空間最大サンプリング」の操作セットの数を増加或いは減少させてもよいし、全連結操作の数を増加或いは減少させてもよいし、個別に現れる緩い畳み込み操作の数を増加或いは減少させてもよいし、空間最大サンプリング操作の代わりに空間サブサンプリング操作を行ってもよい。

緩い畳み込み操作をより具体的に説明するため、図２における特徴図Ｆ１、Ｆ２及びＦ３の局所を例として選択して説明する。図２から選択された局所は、図３に示されている。図３に示すように、隣接する２つの層、Ｌ層とＬ＋１層が選択された。以下は、図３を参照しながら、従来の畳み込みニューラルネットワークの分類器と本発明に係る畳み込みニューラルネットワークの分類器とを比較する。

図４乃至図７は、従来の畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ１、Ｔ２、Ｔ３及びＴ４の応答値（それに応じて、応答値もＴ１、Ｔ２、Ｔ３及びＴ４と標記する）を算出するプロセスを示している。図８乃至図１１は、本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ１、Ｔ２、Ｔ３及びＴ４の応答値（それに応じて、応答値もＴ１、Ｔ２、Ｔ３及びＴ４と標記する）を算出するプロセスを示している。以下は、比較しながら本発明の実施例に係る畳み込みニューラルネットワークの分類器を説明する。

先ず、理解させるために、図４乃至図１１について以下の５点を説明する。

（１）図４乃至図１１における丸のそれぞれは、１つのニューロンを表す。

（２）図４乃至図１１におけるｗ値は、全て畳み込みテンプレート値であり、ニューラルネットワーク訓練では、後方伝播により全てのｗ値を学習する。

（３）図４乃至図１１における全ての畳み込みテンプレートのサイズは２×２であるが、実際に用いる場合は、畳み込みテンプレートのサイズは任意の値であってもよい。

（４）図８乃至図１１におけるＬ＋１層の特徴図Ｆ３の破線は、特徴図Ｆ３の全てのニューロンが２つの種類に区分されていることを表し、各ニューロンは同じテンプレートを用いる、即ちＴ１及びＴ２は１組の畳み込みテンプレートを用い、Ｔ３及びＴ４はもう１組の畳み込みテンプレートを用いる。なお、１つの特徴図におけるニューロンが区分された数は任意に指定されてもよく、区分の方式は具体的なタスクに応じて決定されてもよい。例えば、手書き文字認識について、字画の画素の密度分布に基づいて区分されてもよい。各種の区分方式は後述する。

図４乃至図１１の下方には、ニューロンＴ１、Ｔ２、Ｔ３及びＴ４の応答値を算出するための具体的な式が示されている。Ｌ＋１層のニューロンの応答値の算出プロセスは、Ｌ層に移動ウィンドウを設定し、Ｌ層の移動ウィンドウにおけるニューロンの応答値に対応する畳み込みテンプレート値を乗算する。式におけるｂ、ｂ１、ｂ２はオフセット（ニューラルネットワークの訓練プロセスにおいて後方伝播により学習される）を表す。式における関数Ｆｕｎｃ（）は非線形的変換関数を表し、従来方法は双曲線正接関数をよく用い、本発明の実施例は、収束速度を速くするため、非線形的切り捨て関数（truncation function）を用いもよいが、詳細は後述する。

先ず、図４乃至図７を参照しながら、従来の畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ１、Ｔ２、Ｔ３及びＴ４の応答値（それに応じて、応答値もＴ１、Ｔ２、Ｔ３及びＴ４と標記する）を算出するプロセスを説明する。

図４は、従来の畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ１の応答値を算出するプロセスを示している。図４に示すように、従来の畳み込みニューラルネットワークの分類器では、Ｌ層の特徴図Ｆ１のニューロンＳ１、Ｓ２、Ｓ４、Ｓ５（即ち特徴図Ｆ１の左上の４つのニューロン）の応答値（それに応じて、応答値もＳ１、Ｓ２、Ｓ４及びＳ５と標記する）と特徴図Ｆ２のニューロンＳ１０、Ｓ１１、Ｓ１３、Ｓ１４（即ち特徴図Ｆ２の左上の４つのニューロン）の応答値（それに応じて、応答値もＳ１０、Ｓ１１、Ｓ１３及びＳ１４と標記する）、並びに加重値ｗ１、ｗ２、ｗ３及びｗ４により構成されたテンプレートと加重値ｗ５、ｗ６、ｗ７、ｗ８により構成されたテンプレートに基づいて、特徴図Ｆ３のニューロンＴ１の応答値を取得する。従って、応答値Ｔ１は以下のとおりである。

T1=Func(w1*S1+w2*S2+w3*S4+w4*S5+w5*S10+w6*S11+w7*S13+w8*S14)+b （１）
図５は、従来の畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ２の応答値を算出するプロセスを示している。図５に示すように、従来の畳み込みニューラルネットワークの分類器では、Ｌ層の特徴図Ｆ１のニューロンＳ２、Ｓ３、Ｓ５、Ｓ６（即ち特徴図Ｆ１の右上の４つのニューロン）の応答値（それに応じて、応答値もＳ２、Ｓ３、Ｓ５及びＳ６と標記する）と特徴図Ｆ２のニューロンＳ１１、Ｓ１２、Ｓ１４、Ｓ１５（即ち特徴図Ｆ２の右上の４つのニューロン）の応答値（それに応じて、応答値もＳ１１、Ｓ１２、Ｓ１４及びＳ１５と標記する）、並びに加重値ｗ１、ｗ２、ｗ３及びｗ４により構成されたテンプレートと加重値ｗ５、ｗ６、ｗ７、ｗ８により構成されたテンプレートに基づいて、特徴図Ｆ３のニューロンＴ２の応答値を取得する。従って、応答値Ｔ２は以下のとおりである。

T2=Func(w1*S2+w2*S3+w3*S5+w4*S6+w5*S11+w6*S12+w7*S14+w8*S15)+b （２）
図６は、従来の畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ３の応答値を算出するプロセスを示している。図６に示すように、従来の畳み込みニューラルネットワークの分類器では、Ｌ層の特徴図Ｆ１のニューロンＳ４、Ｓ５、Ｓ７、Ｓ８（即ち特徴図Ｆ１の左下の４つのニューロン）の応答値（それに応じて、応答値もＳ４、Ｓ５、Ｓ７及びＳ８と標記する）と特徴図Ｆ２のニューロンＳ１３、Ｓ１４、Ｓ１６、Ｓ１７（即ち特徴図Ｆ２の左下の４つのニューロン）の応答値（それに応じて、応答値もＳ１３、Ｓ１４、Ｓ１６及びＳ１７と標記する）、並びに加重値ｗ１、ｗ２、ｗ３及びｗ４により構成されたテンプレートと加重値ｗ５、ｗ６、ｗ７、ｗ８により構成されたテンプレートに基づいて、特徴図Ｆ３のニューロンＴ３の応答値を取得する。従って、応答値Ｔ３は以下のとおりである。

T3=Func(w1*S4+w2*S5+w3*S7+w4*S8+w5*S13+w6*S14+w7*S16+w8*S17)+b （３）
図７は、従来の畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ４の応答値を算出するプロセスを示している。図７に示すように、従来の畳み込みニューラルネットワークの分類器では、Ｌ層の特徴図Ｆ１のニューロンＳ５、Ｓ６、Ｓ８、Ｓ９（即ち特徴図Ｆ１の右下の４つのニューロン）の応答値（それに応じて、応答値もＳ５、Ｓ６、Ｓ８及びＳ９と標記する）と特徴図Ｆ２のニューロンＳ１４、Ｓ１５、Ｓ１７、Ｓ１８（即ち特徴図Ｆ２の右下の４つのニューロン）の応答値（それに応じて、応答値もＳ１４、Ｓ１５、Ｓ１７及びＳ１８と標記する）、並びに加重値ｗ１、ｗ２、ｗ３及びｗ４により構成されたテンプレートと加重値ｗ５、ｗ６、ｗ７、ｗ８により構成されたテンプレートに基づいて、特徴図Ｆ３のニューロンＴ４の応答値を取得する。従って、応答値Ｔ４は以下のとおりである。

T4=Func(w1*S5+w2*S6+w3*S8+w4*S9+w5*S14+w6*S15+w7*S17+w8*S18)+b （４）
図４乃至図７から、従来の畳み込み方式によりＬ＋１層の特徴図Ｆ３の任意のニューロンの応答値を算出する際に、Ｌ層の特徴図Ｆ１はずっと同じ畳み込みテンプレート（ｗ１、ｗ２、ｗ３、ｗ４）を用い、Ｌ層の特徴図Ｆ２はずっと同じ畳み込みテンプレート（ｗ５、ｗ６、ｗ７、ｗ８）を用いることがわかった。

続いて、図８乃至図１１を参照しながら、本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ１、Ｔ２、Ｔ３及びＴ４の応答値を算出するプロセスを説明する。

図８乃至図１１に示すように、特徴図Ｆ３は上下２つの領域に区分され、上方領域の２つのニューロンＴ１、Ｔ２の応答値は１組のテンプレートにより算出され、下方領域の２つのニューロンＴ３、Ｔ４の応答値はもう１組のテンプレートにより算出される。

図８は、本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ１の応答値を算出するプロセスを示している。図８に示すように、本発明の実施例に係る畳み込みニューラルネットワークの分類器では、Ｌ層の特徴図Ｆ１のニューロンＳ１、Ｓ２、Ｓ４、Ｓ５（即ち特徴図Ｆ１の左上の４つのニューロン）の応答値（それに応じて、応答値もＳ１、Ｓ２、Ｓ４及びＳ５と標記する）と特徴図Ｆ２のニューロンＳ１０、Ｓ１１、Ｓ１３、Ｓ１４（即ち特徴図Ｆ２の左上の４つのニューロン）の応答値（それに応じて、応答値もＳ１０、Ｓ１１、Ｓ１３及びＳ１４と標記する）、並びに加重値ｗ１、ｗ２、ｗ３及びｗ４により構成されたテンプレートと加重値ｗ５、ｗ６、ｗ７、ｗ８により構成されたテンプレートに基づいて、特徴図Ｆ３のニューロンＴ１の応答値を取得する。従って、応答値Ｔ１は以下のとおりである。

T1=Func(w1*S1+w2*S2+w3*S4+w4*S5+w5*S10+w6*S11+w7*S13+w8*S14)+b1 （５）
図９は、本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ２の応答値を算出するプロセスを示している。図９に示すように、本発明の実施例に係る畳み込みニューラルネットワークの分類器では、Ｌ層の特徴図Ｆ１のニューロンＳ２、Ｓ３、Ｓ５、Ｓ６（即ち特徴図Ｆ１の右上の４つのニューロン）の応答値（それに応じて、応答値もＳ２、Ｓ３、Ｓ５及びＳ６と標記する）と特徴図Ｆ２のニューロンＳ１１、Ｓ１２、Ｓ１４、Ｓ１５（即ち特徴図Ｆ２の右上の４つのニューロン）の応答値（それに応じて、応答値もＳ１１、Ｓ１２、Ｓ１４及びＳ１５と標記する）、並びに加重値ｗ１、ｗ２、ｗ３及びｗ４により構成されたテンプレートと加重値ｗ５、ｗ６、ｗ７、ｗ８により構成されたテンプレートに基づいて、特徴図Ｆ３のニューロンＴ２の応答値を取得する。従って、応答値Ｔ２は以下のとおりである。

T2=Func(w1*S2+w2*S3+w3*S5+w4*S6+w5*S11+w6*S12+w7*S14+w8*S15)+b1 （６）
以上から、特徴図Ｆ３の上方領域におけるニューロンＴ１及びＴ２の応答値を算出する際に同じ組のテンプレートを用いることがわかった。

図１０は、本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ３の応答値を算出するプロセスを示している。図１０に示すように、本発明の実施例に係る畳み込みニューラルネットワークの分類器では、Ｌ層の特徴図Ｆ１のニューロンＳ４、Ｓ５、Ｓ７、Ｓ８（即ち特徴図Ｆ１の左下の４つのニューロン）の応答値（それに応じて、応答値もＳ４、Ｓ５、Ｓ７及びＳ８と標記する）と特徴図Ｆ２のニューロンＳ１３、Ｓ１４、Ｓ１６、Ｓ１７（即ち特徴図Ｆ２の左下の４つのニューロン）の応答値（それに応じて、応答値もＳ１３、Ｓ１４、Ｓ１６及びＳ１７と標記する）、並びに加重値ｗ９、ｗ１０、ｗ１１及びｗ１２により構成されたテンプレートと加重値ｗ１３、ｗ１４、ｗ１５、ｗ１６により構成されたテンプレートに基づいて、特徴図Ｆ３のニューロンＴ３の応答値を取得する。従って、応答値Ｔ３は以下のとおりである。

T3=Func(w9*S4+w10*S5+w11*S7+w12*S8+w13*S13+w14*S14+w15*S16+w16*S17)+b2 （７）
図１１は、本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いて図３におけるＬ＋１層の特徴図Ｆ３のニューロンＴ４の応答値を算出するプロセスを示している。図１１に示すように、本発明の実施例に係る畳み込みニューラルネットワークの分類器では、Ｌ層の特徴図Ｆ１のニューロンＳ５、Ｓ６、Ｓ８、Ｓ９（即ち特徴図Ｆ１の右下の４つのニューロン）の応答値（それに応じて、応答値もＳ５、Ｓ６、Ｓ８及びＳ９と標記する）と特徴図Ｆ２のニューロンＳ１４、Ｓ１５、Ｓ１７、Ｓ１８（即ち特徴図Ｆ２の右下の４つのニューロン）の応答値（それに応じて、応答値もＳ１４、Ｓ１５、Ｓ１７及びＳ１８と標記する）、並びに加重値ｗ９、ｗ１０、ｗ１１及びｗ１２により構成されたテンプレートと加重値ｗ１３、ｗ１４、ｗ１５、ｗ１６により構成されたテンプレートに基づいて、特徴図Ｆ３のニューロンＴ４の応答値を取得する。従って、応答値Ｔ４は以下のとおりである。

T4=Func(w9*S5+w10*S6+w11*S8+w12*S9+w13*S14+w14*S15+w15*S17+w16*S18)+b2 （８）
図８乃至図１１（特にその計算式）から、緩い畳み込み操作について、Ｌ＋１層の特徴図Ｆ３の任意のニューロン応答値を算出する際に、同一種類のニューロンＴ１及びＴ２について、Ｌ層の特徴図Ｆ１が同じ畳み込みテンプレート（ｗ１、ｗ２、ｗ３、ｗ４）を用い、Ｌ層の特徴図Ｆ２が同じ畳み込みテンプレート（ｗ５、ｗ６、ｗ７、ｗ８）を用いる。他の種類のニューロンＴ３及びＴ４について、Ｌ層の特徴図Ｆ１が同じ畳み込みテンプレート（ｗ９、ｗ１０、ｗ１１、ｗ１２）を用い、Ｌ層の特徴図Ｆ２が同じ畳み込みテンプレート（ｗ１３、ｗ１４、ｗ１５、ｗ１６）を用いる。緩い畳み込み操作について、同一特徴図における各ニューロンの応答値を算出する際に、同一種類に属するニューロンは同じ畳み込みテンプレートを用いる。

上記の実施例では、緩い畳み込み操作により２つの特徴図に対して複数の畳み込みテンプレートを用いて畳み込みを行う（例えばＦ３が複数のテンプレートを用いてＦ１との畳み込みを行う）ことで、より多くの特徴を抽出できる。モード認識理論によれば、統計分類器の認識効果は主にサンプルから抽出された特徴の数及び有効性を頼りにする。複数のテンプレートと単一のテンプレートの特徴抽出の基本的な操作が同じである（いずれも畳み込みである）ため、複数のテンプレートによりより多くの特徴を抽出できるから、複数のテンプレートを用いる方法は、単一テンプレートを用いる方法に比べて、分類の正確率の向上について好適である。

また、収束速度を速くするため、本発明の実施例では、応答値を算出する際に用いられる活性化関数は、正の応答値を取得するように設定されてもよい。

図８乃至図１１の非線形的変換関数Ｆｕｎｃ（）（活性化関数とも称する）は、負の畳み込み結果を正の小さな値に変換するように設定されている。畳み込み結果は、関数Ｆｕｎｃ（）の括弧における内容を指す。例えば、下記の式（９）に示すように、各ニューロンの応答値を算出する際に、非線形的切り捨て関数（truncation function）を図８乃至図１１の非線形的変換関数Ｆｕｎｃ（）として用いる。

ここで、ｘは畳み込み結果を表す。例えば、式（５）において、ｘは、w1*S1+w2*S2+w3*S4+w4*S5+w5*S10+w6*S11+w7*S13+w8*S14を表す。

上記式（９）は、全ての０以下のｘ値を０よりもわずかに大きい小さな値εと切り捨て、０よりも大きいｘ値をそのままにすることを意味する。ここで、一例として、小さな値は０〜１０^−６の範囲内に設定されてもよいが、実際な要求に応じて、他の範囲内の値であってもよい。

本発明の他の実施例では、下記の式（１０）に示すように、図８乃至図１１の非線形的変換関数Ｆｕｎｃ（）は、負の畳み込み結果の絶対値を求めるように設定されている非線形的切り捨て関数であってもよい。

Func(x)=｜ｘ｜（１０）
なお、上記の式（９）及び（１０）は単なる一例であり、該関数が正の応答値を取得できるものであれば、要求に応じて他の非線形的変換関数を用いてもよい。

新たな活性化関数、即ち正の応答値を取得する活性化関数を用いることで、収束速度を速くすることができる。緩い畳み込みにより抽出された特徴の数を増加させるため、畳み込みニューラルネットワーク全体のパラメータの数の合計が大幅に増加し、訓練サンプルの数がそのままである場合はネットワーク訓練の時の収束速度が降下し、訓練時間が延長してしまう。これに対して、正の応答値を取得する活性化関数を用いることで収束速度を加速できるため、好適である。

以下は、本発明の実施例に係る畳み込みニューラルネットワークの分類器における特徴図の区分方式を説明する。

本発明の実施例に係る畳み込みニューラルネットワークの分類器は、訓練段階において、特徴図の区分方式を予め決定する必要がある。１つの実施例では、図２に示される畳み込みニューラルネットワークの分類器は、まず左から１番目の緩い畳み込み層における全ての特徴図のニューロンの区分方式を決定し、そして他の緩い畳み込み層における特徴図のニューロンの区分方式を決定する。

まずは、区分方式を決定するための物理的基礎を説明する。

区分方式の物理的基礎は、具体的なタスクに関連してもよい。例えば、１つの実施例では、特徴図の複数の領域（各領域は一定の数のニューロンを含む）の区分は、画像の画素の分布に基づいて行われる。以下は、手書き文字認識を一例として、字画の画像の分布に基づく区分方式を説明し、該方式の基本的思想は、区分領域間の字画の画素分布の差を小さくすることができる区分方式を見つけることである。説明の便宜上、図２に示される畳み込みニューラルネットワークの分類器の左から１番目の緩い畳み込み層における全ての特徴図のニューロンの区分方式のみを説明し、他の特徴図は同様な区分方式を用いてもよい。

仮に全てＮ個の訓練サンプルが有するとする。訓練用の全ての文字サンプルimage_k(k=1,…,N)を常用の方法で二値化して、同じサイズ（高さがＨであり、幅がＷである）に正規化する。そして、全ての文字サンプルをポイントごとに加えて、字画画素まとめ図StrokeMapを取得する。

二値化処理を実行したため、文字サンプルが１の領域は字画画素を有するものであり、０の領域は字画画素を有しないものである。字画画素まとめ図StrokeMapにおける各画素の値は、該画素位置において全ての訓練画素が有する字画画素の回数の平均値である。

字画画素まとめ図StrokeMapにおける全ての画素をスキャンし、下記の処理を行う。

（１）字画画素まとめ図StrokeMapから現在点（i,j）を決定する。

（２）字画画素まとめ図StrokeMapは、この点を通る水平線及び垂直線により所定数の領域、例えば４つの領域に区分され、各領域における字画画素の回数の平均値の和（即ち全ての画素値の和）を算出する。

（３）４つの領域は、２組の２つ領域に分割され、合計６種類（Ｃ^２ _４＝６）の組に区分できる。各組における２つの領域の字画画素の回数の平均値の和の差を算出する。６つの組の差の合計を算出して、記憶する。

字画画素まとめ図StrokeMapから、記憶された６組の差の合計値が最も小さい点を見つける。この点を通る水平線及び垂直線により、字画画素まとめ図StrokeMapは４つの領域に区分され、この区分方式を特徴図のニューロンの区分方式とする、即ち特徴図の全てのニューロンもそれに応じて４種類に分けられ、各種類のニューロンは同じテンプレートを用いる。

上記の例では、特徴図の複数の領域の区分は、画像の画素分布に基づいて行われ、具体的には、画像の二値画像の前景画素の数量分布に基づいて行われる。なお、画像の二値画像の前景画素の密度分布に基づいて、複数の領域の区分を行ってもよい。例えば、区分された各領域の密度を同じにしてもよい。

また、１つの実施例では、複数の領域の区分は、画像の構造に基づいて行われてもよい。文字画像を例とすると、例えば、区分される画像は手書き文字「化」である。「化」は左右構造の文字であり、部首に基づいて「化」を左右２つの領域、即ち「イ」を含む画像領域と「ヒ」を含む画像領域に区分してもよい。例えば、区分される画像は手書き文字「６」である場合、「６」を上下２つの部分、即ち大体「ｏ」を含む画像領域と上方の円弧部分を含む画像領域と区分してもよい。なお、人それぞれの手書きの習慣が異なるため、実際の区分プロセスでは、区分するための割合を固定せず、一定の割合に基づいて変動するものであってもよい。

ここでは、手書き文字を例として画像の構造又は画像の二値画像の画素分布に基づいて領域を区分することを説明しているが、対象となる画像は手書きの文字に限定されず、任意の画像、例えば細胞分裂画像、地図画像であってもよい。

以上、区分方式を決定するための物理的な基礎を説明した。次に、複数の緩い畳み込み層間及び複数の特徴図間の区分方式が同じであるか否かに応じて区分方式を説明する。ここで、２種類の区分方式があり、１つは、各サンプルに対応する特徴図の全てが同一の区分方式を用いるか否かの区分方式であり、もう１つは、サンプル間は同一の区分方式を用いるか否かの区分方式である。それに応じて、１つの畳み込みニューラルネットワークの分類器における全ての特徴図について、下記４つの区分方式を採用できる。

（１）全てのサンプルが同一の区分方式を用い、各サンプルに対応する全ての特徴図が同一の区分方式を用いる。ここで、「全ての特徴図」は、緩い畳み込み層における全ての特徴図を指す。

（２）全てのサンプルが同一の区分方式を用い、各サンプルに対応する全ての特徴図が異なる区分方式を用いる。ここで、「全ての特徴図」は、緩い畳み込み層における全ての特徴図を指す。全ての特徴図が異なる区分方式を用いることは、（ａ）各層における特徴図が同一の区分方式を用いるが、異なる層が異なる区分方式を用いること、及び（ｂ）各層における全ての特徴図が異なる区分方式を用いること、を含む。

（３）全てのサンプルが異なる区分方式を用い、各サンプルに対応する全ての特徴図が同一の区分方式を用いる。ここで、「全ての特徴図」は、緩い畳み込み層における全ての特徴図を指す。

（４）全てのサンプルが異なる区分方式を用い、各サンプルに対応する全ての特徴図が異なる区分方式を用いる。ここで、「全ての特徴図」は、緩い畳み込み層における全ての特徴図を指す。全ての特徴図が異なる区分方式を用いることは、（ａ）各層における特徴図が同一の区分方式を用いるが、異なる層が異なる区分方式を用いること、及び（ｂ）各層における全ての特徴図が異なる区分方式を用いること、を含む。

以下は、上記（４）の区分方式の一例を説明する。図１２は、入力サンプル「６」の３つの区分方式を３つの緩い畳み込み層にそれぞれ適用するプロセスを示している。全てのサンプルが異なる区分方式を用い、各層における全ての特徴図が同一の区分方式を用いるが、異なる層が異なる区分方式を用いる。

以上、複数の緩い畳み込み層間及び複数の特徴図間の区分方式が同じであるか否かに応じて区分方式を説明した。以下は、複数の異なるサンプルの区分方式が固定的なものであるか否かに応じて、区分方式を説明する。

１つの実施例では、固定的な方式により、サンプルとなる画像を複数の画像領域に区分してもよく、区分された複数の画像領域は、緩い畳み込み層における特徴図の複数の領域にそれぞれ対応する。ここで、例えば、訓練サンプルの総体的な特徴に基づいて固定的な方式を決定してもよい。言い換えれば、訓練サンプルの総体的な特徴に基づいて１つの固定的な方式を決定して、該固定的な方式に基づいて各訓練サンプルを区分する。具体的な固定的な方式は、上記方式のうちいずれか１つであってもよい。

もう１つの実施例では、畳み込みニューラルネットワークの分類器は、サンプルである画像を複数の画像領域に区分する画像分割手段をさらに含み、区分された複数の画像領域は、緩い畳み込み層における複数の領域にそれぞれ対応する。ここで、訓練サンプルの個体特徴に基づいて動的な方式を決定してもよい。言い換えれば、１つの訓練サンプルともう１つの訓練サンプルとは個体特徴が異なる場合があるため、異なる訓練サンプルの区分方式が異なる場合はある。この場合は、画像分割手段は、訓練サンプルの個体特徴に基づいて、個別に、サンプルである画像を複数の画像領域に区分してもよい。具体的な区分方式は、上記方式のうちいずれか１つであってもよい。

以下は、図１３を参照しながら、本発明の実施例に係る畳み込みニューラルネットワークの分類器の訓練方法１３００を説明する。

図１３に示すように、ステップＳ１３０２において、畳み込みニューラルネットワークの分類器に含まれている複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分する。

例えば、上記の区分方式のいずれかを用いて、少なくとも１つの特徴図の層における少なくとも１つの特徴図を複数の領域に区分してもよい。

また、本発明の実施例に係る畳み込みニューラルネットワークの分類器の配置、例えばネットワーク層の数、各層の操作（緩い畳み込み、空間最大サンプリング、全連結）、各層における特徴図の数及び特徴図の大きさは予め設定されている。ここで、出力層の特徴図の数は、具体的なタスクの種別の数に一致する。例えば、数字認識タスクについて、出力層の特徴図の数は１０であり、大文字アルファベット認識タスクについて、出力層の特徴図の数は２６である。

ステップ１３０４において、既知の標識を有する訓練サンプルを畳み込みニューラルネットワークの分類器に送り込んで前方伝播を行い、出力結果を取得する。前方伝播を行う際に、複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得する。好適には、正の応答値を取得するように設定されている活性化関数により応答値を算出してもよい。例えば、該活性化関数は、負の畳み込み結果の絶対値を求める、或いは負の畳み込み結果を正の小さな値に変換するように設定されてもよい。

例えば、ネットワークにおける全てのテンプレートの加重値は、０〜１の分布によりランダムの初期化を行ってもよい。そして、全ての訓練サンプルを本発明の実施例に係る畳み込みニューラルネットワークの分類器に順次に送り込んで、訓練を行う。各訓練サンプルについて、前方伝播を行って出力結果、即ち出力層の値を取得する。

ステップＳ１３０６において、出力結果と既知の標識との差に基づいて逆方向伝播を行い、畳み込みテンプレートにおける加重値を含む畳み込みニューラルネットワークの分類器のパラメータを補正する。即ち、畳み込みニューラルネットワークの分類器のパラメータは、畳み込みテンプレートにおける加重値だけではなく、他のパラメータを含む。

ステップＳ１３０８において、所定の条件が満たされたか否かを判断する。例えば、畳み込みニューラルネットワークの分類器のパラメータの訓練集についての錯誤率が所定値に達した、或いは所定値より低くなったかを判断する。なお、所定の条件は、他の条件、例えば所定の回数又は他の収束条件などであってもよい。

ステップＳ１３０８において、所定の条件が満たされた場合は、処理が終了し、そうでない場合は、ステップＳ１３０２に戻る。

以下は、図１４を参照しながら、本発明の実施例に係る畳み込みニューラルネットワークの分類器を用いる分類方法１４００を説明する。

図１４に示すように、ステップＳ１４０２において、畳み込みニューラルネットワークの分類器に含まれている複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分する。ここで、訓練時と同じ区分方式を用いて特徴図を区分する。

ステップＳ１４０４において、分類対象を畳み込みニューラルネットワークの分類器に送り込んで前方伝播を行い、出力結果を取得する。前方伝播を行う際に、複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得する。好適には、正の応答値を取得するように設定されている活性化関数を用いて、応答値を算出してもよい。例えば、該活性化関数は、負の畳み込み結果の絶対値を求める、或いは負の畳み込み結果を正の小さな値に変換するように設定されている活性化関数であってもよい。

本発明の実施例によれば、畳み込み操作の代わりに、緩い畳み込み操作を用いることで、畳み込みニューラルネットワークの分類器の柔軟性を向上でき、より多くの特徴を抽出して認識の正確率を向上できる。また、従来の活性化関数の代わりに、正の応答値を取得する活性化関数を用いることで、収束速度を加速できる。

以上、具体的な実施例を用いて本発明の基本原理について説明したが、強調すべきなのは、本発明の方法と装置の全て又はいずれのステップ又は構成要素が、任意の計算装置（プロセッサや記憶媒体等を含む）または計算装置のネットワークにおいて、ハードウェア、ファームウェア、ソフトウェアまたはそれらの組合せにより実現できることは、当業者にとって理解されるところである。また、これは当業者が本発明の明細書を読んだ上で彼らの基本的なプログラミングスキルを利用して実現できるものである。

従って、本発明の目的は、任意の計算装置において１つ又は１組のプログラムを実行することにより実現することができる。前記計算装置は従来の汎用装置であってもよい。また、本発明の目的は、前記方法又は装置を実現するプログラムコードを含むプログラム製品を提供するだけで実現される。即ち、このようなプログラム製品も本発明を構成するものであり、且つこのようなプログラム製品を格納した記憶媒体も本発明を構成するものである。もとろん、前記記憶媒体は、任意の従来の記憶媒体又は将来開発される任意の記憶媒体であってもよい。

ソフトウェアおよび/またはファームウェアを通じて本発明の実施例を実現する場合、記憶媒体またはネットワークを通じて専用ハードウェア構造を有するコンピュータ、例えば、図１５に示されたような汎用コンピュータ１５００に当該ソフトウェアを構成するプログラムをインストールし、当該コンピュータは、各種類のプログラムがインストールされたときに、各種の機能等を実行することができる。

図１５では、セントラル・プロセッシング・ユニット(ＣＰＵ)１５０１は、読み取り専用メモリ（ＲＯＭ)１５０２に格納されたプログラムまたは記憶部１５０８からランダム・アクセス・メモリ(ＲＡＭ)１５０３にアップロードされたプログラムにより各種の処理を実行する。ＲＡＭ１５０３には、必要に応じてＣＰＵ１５０１が各種の処理を実行するときに必要なデータを記憶する。ＣＰＵ１５０１、ＲＯＭ１５０２とＲＡＭ１５０３はバス１５０４を介して互いに連結する。入力/出力インターフェース１５０５もバス１５０４に接続される。

以下の要素も入力/出力インターフェース１５０５に接続される：キーボードやマウス等を含む入力部１５０６；例えばブラウン管（ＣＲＴ）や液晶ディスプレイ（ＬＣＤ）等のモニタやスピーカー等を含む出力部１５０７；ハードディスク等を含む記録部１５０８；例えばLANカード等のネットワークインタフェースカードやモデム等を含む通信部１５０９。また、通信部１５０９はネットワーク、例えばインターネットを介して通信処理を行う。必要に応じて、ドライブ部１５１０も入力/出力インターフェース１５０５に接続される。取り外し可能な媒体１５１１、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体記憶装置等を、必要に応じてドライブ部１５１０に挿入し、その中から読み出されたコンピュータプログラムは必要に応じて記録部１５０８にインストールされる。

ソフトウェアを通じて前記一連の処理を実現する場合、ネットワーク、例えばインターネット、または記憶媒体、例えば取り外し可能な媒体１５１１からソフトウェアを構成するプログラムをインストールする。

当業者が理解されるように、ここでの記録媒体は、図１５に示されたような、中にプログラムが記録され、設備と分離して配布しユーザにプログラムを提供する取り外し可能な媒体１５１１には限らない。取り外し可能な媒体１５１１の例として、磁気ディスク(フロッピー(登録商標)ディスクを含む)、光ディスク(コンパクトディスク（ＣＤ）による読み出し専用メモリー(ＣＤ−ＲＯＭ)とデジタル多用途ディスク(ＤＶＤ)を含む)、光磁気ディスク（ミニディスク(ＭＤ)(登録商標)を含む)と半導体記憶装置などを含む。また、記録媒体は、ＲＯＭ１５０２や記録部１５０８に含まれるハードディスクであっても良い。その中にプログラムが記録され、且つそれを記録する設備と一緒にユーザに配布される。

本発明は、機械読み取り可能な命令コードを格納したプログラム製品を提供する。命令コードが機械に読み取りされ且つ実行されるときに、前記本発明の実施例の方法を実行することができる。

また、前記機械読み取り可能な命令コードを格納したプログラム製品の記憶媒体も本発明の開示に含まれる。記憶媒体はフロッピーディスク、磁気ディスク、光ディスク、メモリカード、メモリスティック等を含む。

ここでの実施例は例示的なものであり、本発明はこれらの実施例に限定されないことは、当業者に理解されるところである。

本明細書にある「第一」、「第二」及び「第Ｎ」等の記載は、関連特徴を文字上区別し、本発明をより明瞭に記載するためである。従って、限定的な意味合いは有しない。

例として、前記方法の各ステップおよび前記設備の各構成モジュールおよび/またはユニットは、ソフトウェア、ファームウェア、ハードウェアまたはその組合せによって実現でき、且つその設備の中の一部となる。前記設備の各構成モジュールやユニットがソフトウェア、ファームウェア、ハードウェアまたはその組合せにより結合されるときに使用可能な手段または方式は、当業者に熟知されているため、ここでは、その説明を省略した。

例として、ソフトウェアまたはファームウェアを通じて本発明を実現する場合、記憶媒体またはネットワークから専用ハードウェア構造を有するコンピュータ（例えば、図１５に示された汎用コンピュータ１５００）に当該ソフトウェアを構成するプログラムをインストールすることができる。当該コンピュータは、各種のプログラムがインストールされたときに、各種の機能を実現できる。

１つの実施形態について記載および/または図示した特徴は同一または類似の方法で１つまたは複数の他の実施形態で使用することができ、また、その他の実施形態の中の特徴と組合せ、または他の実施形態の特徴を代替することもできる。

強調すべきなのは、用語「含む/備える」は、本明細書において特徴、要素、ステップまたはモジュールの存在を表し、１つまたは複数の他の特徴、要素、ステップまたはモジュールの存在または付加を排除しない。

また、本発明の方法は、明細書に説明された時間順で行なわれることに限らず、他の時間順で、又は並行して、又は単独で実行することもできる。従って、本発明の技術的範囲は、明細書に記載の方法の実行順番に限定されない。

本発明は、添付の請求の範囲の要旨と範囲内に本発明に対する様々な変更、改善又は均等物を設計することができるものと認めるべきである。且つ、本発明の範囲は明細書に記載の過程、設備、手段、方法とステップの具体的な実施例に限定されない。当業者は、本発明に開示された内容から本発明の実施例に基本的に同じ機能を有し、基本的に同じ効果を奏する既存の、または将来開発される過程、設備、手段、方法またはステップを使用又は実行することができる。従って、添付の請求の範囲の要旨は、このような過程、設備、手段、方法またはステップを含む。

また、上述の各実施例を含む実施形態に関し、更に以下の付記を開示する。

（付記１）
少なくとも１つの特徴図の層の少なくとも１つの特徴図が複数の領域に区分された複数の特徴図の層と、
前記複数の領域にそれぞれ対応し、対応する領域におけるニューロンの応答値を取得する複数の畳み込みテンプレートと、を含む、畳み込みニューラルネットワークの分類器。

（付記２）
前記畳み込みニューラルネットワークの分類器は、画像を分類するために用いられ、
前記画像は、固定的な方式により複数の画像領域に区分され、
前記複数の画像領域は前記複数の領域にそれぞれ対応する、付記１に記載の畳み込みニューラルネットワークの分類器。

（付記３）
前記畳み込みニューラルネットワークの分類器は、画像を分類するために用いられ、
前記畳み込みニューラルネットワークの分類器は、前記画像を複数の画像領域に区分する画像分割手段をさらに含み、
前記複数の画像領域は前記複数の領域にそれぞれ対応する、付記１に記載の畳み込みニューラルネットワークの分類器。

（付記４）
前記複数の領域は、前記画像の画素の分布に基づいて区分されたものである、付記３に記載の畳み込みニューラルネットワークの分類器。

（付記５）
前記複数の領域は、前記画像の二値画像の前景画素の数量分布又は前景画素の密度分布に基づいて区分されたものである、付記４に記載の畳み込みニューラルネットワークの分類器。

（付記６）
前記複数の領域は、前記画像の構造に基づいて区分されたものである、付記３に記載の畳み込みニューラルネットワークの分類器。

（付記７）
同一の特徴図の層における異なる特徴図、又は異なる特徴図の層における特徴図は、異なる方式により前記複数の領域に区分される、付記１乃至６のいずれかに記載の畳み込みニューラルネットワークの分類器。

（付記８）
前記応答値を算出する際に用いられる活性化関数は、正の応答値を取得するように設定されている、付記１乃至６のいずれかに記載の畳み込みニューラルネットワークの分類器。

（付記９）
前記活性化関数は、負の畳み込み結果の絶対値を求める、或いは負の畳み込み結果を正の小さな値に変換するように設定されている、付記８に記載の畳み込みニューラルネットワークの分類器。

（付記１０）
畳み込みニューラルネットワークの分類器を用いる分類方法であって、
前記畳み込みニューラルネットワークの分類器は、複数の特徴図の層を含み、
前記分類方法は、
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップと、
分類対象を前記畳み込みニューラルネットワークの分類器に送り込んで前方伝播を行い、出力結果を取得するステップであって、前方伝播を行う際に、前記複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得する、ステップと、
前記出力結果に基づいて前記分類対象を分類するステップと、を含む、分類方法。

（付記１１）
前記分類対象は、画像であり、
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、前記画像を複数の画像領域に区分するステップを含み、
前記複数の画像領域は、前記複数の領域にそれぞれ対応する、付記１０に記載の分類方法。

（付記１２）
前記分類対象は、画像であり、
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、固定的な方式により前記画像を複数の画像領域に区分するステップを含み、
前記複数の画像領域は前記複数の領域にそれぞれ対応する、付記１１に記載の分類方法。

（付記１３）
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、前記画像の画素の分布に基づいて前記少なくとも１つの特徴図を前記複数の領域に区分するステップを含む、付記１１に記載の分類方法。

（付記１４）
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、前記画像の二値画像の前景画素の数量分布又は前景画素の密度分布に基づいて前記少なくとも１つの特徴図を前記複数の領域に区分するステップを含む、付記１３に記載の分類方法。

（付記１５）
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、前記画像の構造に基づいて前記少なくとも１つの特徴図を前記複数の領域に区分するステップを含む、付記１１に記載の分類方法。

（付記１６）
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、異なる方式により、同一の特徴図の層における異なる特徴図、又は異なる特徴図の層における特徴図を前記複数の領域に区分するステップを含む、付記１０乃至１５のいずれかに記載の分類方法。

（付記１７）
前記複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得するステップは、正の応答値を取得するように設定されている活性化関数を用いて前記応答値を算出するステップを含む、付記１０乃至１５のいずれかに記載の分類方法。

（付記１８）
前記複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得するステップは、負の畳み込み結果の絶対値を求める、或いは負の畳み込み結果を正の小さな値に変換するように設定されている前記活性化関数を用いて前記応答値を算出するステップを含む、付記１７に記載の分類方法。

（付記１９）
畳み込みニューラルネットワークの分類器の訓練方法であって、
前記畳み込みニューラルネットワークの分類器は、複数の特徴図の層を含み、
前記訓練方法は、
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップと、
既知の標識を有する訓練サンプルを前記畳み込みニューラルネットワークの分類器に送り込んで前方伝播を行い、出力結果を取得するステップであって、前方伝播を行う際に、前記複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得する、ステップと、
前記出力結果と前記既知の標識との差に基づいて逆方向伝播を行い、前記畳み込みテンプレートにおける加重値を含む前記畳み込みニューラルネットワークの分類器のパラメータを補正するステップと、
所定の条件が満たされるまで、上記のステップを繰り返すステップと、を含む、訓練方法。

（付記２０）
前記訓練サンプルは、画像であり、
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、固定的な方式により前記画像を複数の画像領域に区分するステップを含み、
前記複数の画像領域は、前記複数の領域にそれぞれ対応し、
前記固定的な方式は、前記訓練サンプルの総体的な特徴に基づいて決定される、付記１９に記載の訓練方法。

（付記２１）
前記訓練サンプルは、画像であり、
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、前記画像それぞれの個体特徴に基づいて各画像を複数の画像領域に区分するステップを含み、
前記複数の画像領域は、前記複数の領域にそれぞれ対応する、付記１９に記載の訓練方法。

（付記２２）
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、前記画像の画素の分布に基づいて前記少なくとも１つの特徴図を前記複数の領域に区分するステップを含む、付記２１に記載の訓練方法。

（付記２３）
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、前記画像の二値画像の前景画素の数量分布又は前景画素の密度分布に基づいて前記少なくとも１つの特徴図を前記複数の領域に区分するステップを含む、付記２２に記載の訓練方法。

（付記２４）
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、前記画像の構造に基づいて前記少なくとも１つの特徴図を前記複数の領域に区分するステップを含む、付記２１に記載の訓練方法。

（付記２５）
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップは、異なる方式により、同一の特徴図の層における異なる特徴図、又は異なる特徴図の層における特徴図を前記複数の領域に区分するステップを含む、付記１９乃至２４のいずれかに記載の訓練方法。

（付記２６）
前記複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得するステップは、正の応答値を取得するように設定されている活性化関数を用いて前記応答値を算出するステップを含む、付記１９乃至２５のいずれかに記載の訓練方法。

（付記２７）
前記複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得するステップは、負の畳み込み結果の絶対値を求める、或いは負の畳み込み結果を正の小さな値に変換するように設定されている前記活性化関数を用いて前記応答値を算出するステップを含む、付記２６に記載の訓練方法。

Claims

少なくとも１つの特徴図の層の少なくとも１つの特徴図が複数の領域に区分された複数の特徴図の層と、
前記複数の領域にそれぞれ対応し、対応する領域におけるニューロンの応答値を取得する複数の畳み込みテンプレートと、を含む、畳み込みニューラルネットワークの分類器。
前記畳み込みニューラルネットワークの分類器は、画像を分類するために用いられ、
前記画像は、固定的な方式により複数の画像領域に区分され、
前記複数の画像領域は前記複数の領域にそれぞれ対応する、請求項１に記載の畳み込みニューラルネットワークの分類器。
前記畳み込みニューラルネットワークの分類器は、画像を分類するために用いられ、
前記畳み込みニューラルネットワークの分類器は、前記画像を複数の画像領域に区分する画像分割手段をさらに含み、
前記複数の画像領域は前記複数の領域にそれぞれ対応する、請求項１に記載の畳み込みニューラルネットワークの分類器。
前記複数の領域は、前記画像の画素の分布に基づいて区分されたものである、請求項３に記載の畳み込みニューラルネットワークの分類器。
前記複数の領域は、前記画像の二値画像の前景画素の数量分布又は前景画素の密度分布に基づいて区分されたものである、請求項４に記載の畳み込みニューラルネットワークの分類器。
前記複数の領域は、前記画像の構造に基づいて区分されたものである、請求項３に記載の畳み込みニューラルネットワークの分類器。
同一の特徴図の層における異なる特徴図、又は異なる特徴図の層における特徴図は、異なる方式により前記複数の領域に区分される、請求項１乃至６のいずれかに記載の畳み込みニューラルネットワークの分類器。
前記応答値を算出する際に用いられる活性化関数は、正の応答値を取得するように設定されている、請求項１乃至６のいずれかに記載の畳み込みニューラルネットワークの分類器。
畳み込みニューラルネットワークの分類器を用いる分類方法であって、
前記畳み込みニューラルネットワークの分類器は、複数の特徴図の層を含み、
前記分類方法は、
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップと、
分類対象を前記畳み込みニューラルネットワークの分類器に送り込んで前方伝播を行い、出力結果を取得するステップであって、前方伝播を行う際に、前記複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得する、ステップと、
前記出力結果に基づいて前記分類対象を分類するステップと、を含む、分類方法。
畳み込みニューラルネットワークの分類器の訓練方法であって、
前記畳み込みニューラルネットワークの分類器は、複数の特徴図の層を含み、
前記訓練方法は、
前記複数の特徴図の層の少なくとも１つの特徴図の層の少なくとも１つの特徴図を複数の領域に区分するステップと、
既知の標識を有する訓練サンプルを前記畳み込みニューラルネットワークの分類器に送り込んで前方伝播を行い、出力結果を取得するステップであって、前方伝播を行う際に、前記複数の領域にそれぞれ対応する複数の畳み込みテンプレートの各テンプレートを用いて対応する領域におけるニューロンの応答値を取得する、ステップと、
前記出力結果と前記既知の標識との差に基づいて逆方向伝播を行い、前記畳み込みテンプレートにおける加重値を含む前記畳み込みニューラルネットワークの分類器のパラメータを補正するステップと、
所定の条件が満たされるまで、上記のステップを繰り返すステップと、を含む、訓練方法。