JP2017084320A

JP2017084320A - 学習方法およびプログラム

Info

Publication number: JP2017084320A
Application number: JP2016034784A
Authority: JP
Inventors: 令子羽川; Reiko Hagawa; 宗太郎築澤; Sotaro Tsukizawa; 育規石井; Yasunori Ishii
Original assignee: Panasonic Intellectual Property Management Co Ltd
Current assignee: Panasonic Intellectual Property Management Co Ltd
Priority date: 2015-03-06
Filing date: 2016-02-25
Publication date: 2017-05-18
Anticipated expiration: 2036-02-25
Also published as: CN105938558B; CN105938558A; JP6671028B2; US20160260014A1; EP3065090A2; EP3065090A3; EP3065090B1; US9779354B2

Abstract

【課題】画像認識を高精度に行いつつ画像認識の処理速度を向上することができる分類器の学習方法等を提供する。
【解決手段】第１ニューラルネットワークで構成される粗クラス分類器に、それぞれの詳細クラスを示すラベルが付与された画像群を、複数の詳細クラスを包含する複数の粗クラスに分類させて当該複数の粗クラス毎の共通の特徴である第１特徴を学習させる第１ステップ（Ｓ１）と、第１ステップにおいて学習させた第１ニューラルネットワークの最終層以外同一で当該最終層のみが異なる第２ニューラルネットワークで構成される詳細クラス分類器に、画像群を詳細クラスに分類させて当該詳細クラス毎の共通の特徴である第２特徴を学習させることで、分類器の学習を行う第２ステップ（Ｓ２）とを含む。
【選択図】図５

Description

本開示は、学習方法およびプログラムに関し、特にニューラルネットワークで構成され、画像を分類するための分類器の学習方法およびそのプログラムに関する。

近年、画像中のどこに何が写っているかを認識するための技術である画像認識技術を用いて、多様な物体を、高速かつ高精度に認識することが求められている。例えば非特許文献１では、複数の畳み込みニューラルネットワーク分類器（以下、分類器と記載）を利用することで、高精度に画像認識を行うことができる画像認識技術が開示されている。

Z. Yan, V.Jagadeesh, D.DeCoste, W. Di and R.Piramuthu,"HD-CNN: Hierarchical Deep Convolutional Neural Network for Image Classification", Under review as a conference paper at ICLR 2015, URL: http://arxiv.org/pdf/1410.0736v2.pdf , Dec. 2014

しかしながら、上記従来技術は、粗クラス分類器の後に複数の詳細クラス分類器を接続する構成であることから、画像認識の処理速度が遅いという課題がある。また、上記従来技術では、粗クラス分類器で誤った分類された場合には分類結果の正解率が落ちてしまうという課題もある。

本開示は、上記課題を解決するためになされたもので、画像認識の精度および画像認識の処理速度を向上することができる分類器の学習方法およびプログラムを提供することを目的とする。

上記課題を解決するために、本開示の一形態に係る分類器の学習方法は、画像を分類するための分類器の学習方法であって、第１ニューラルネットワークで構成される粗クラス分類器に、それぞれの詳細クラスを示すラベルが付与された複数の画像である画像群を、複数の詳細クラスを包含する複数の粗クラスに分類させて当該複数の粗クラス毎の共通の特徴である第１特徴を学習させる第１ステップと、前記第１ステップにおいて学習させた前記第１ニューラルネットワークの最終層以外同一で当該最終層のみが異なる第２ニューラルネットワークで構成される詳細クラス分類器に、前記画像群を詳細クラスに分類させて当該詳細クラス毎の共通の特徴である第２特徴を学習させることで、前記分類器の学習を行う第２ステップとを含む。

なお、これらの全般的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータで読み取り可能なＣＤ−ＲＯＭなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

本開示によれば、画像認識を高精度に行いつつ画像認識の処理速度を向上することができる分類器の学習方法等を実現できる。

図１は、実施の形態１の学習システムの構成の一例を示すブロック図である。図２Ａは、実施の形態１の学習システムが行う学習処理に用いる粗クラス分類器の構成を説明するための図である。図２Ｂは、実施の形態１の学習システムが行う学習処理に用いる詳細クラス分類器の構成を説明するための図である。図３Ａは、図２Ａに示す粗クラス分類器を構成する第１ニューラルネットワークの一例を示す図である。図３Ｂは、図２Ｂに示す詳細クラス分類器を構成する第２ニューラルネットワークの一例を示す図である。図４は、実施の形態１の分類器が認識処理を行う際の構成を説明するための図である。図５は、実施の形態１における学習処理を示すフローチャートである。図６Ａは、実施の形態１における粗クラス学習の結果の一例を示す図である。図６Ｂは、実施の形態１における詳細クラス学習の結果の一例を示す図である。図７は、図５に示すステップＳ１の詳細処理の一例を示すフローチャートである。図８は、図５に示すステップＳ２の詳細処理の一例を示すフローチャートである。図９Ａは、変形例１における学習システムの構成の一例を示すブロック図である。図９Ｂは、図９Ａに示す粗クラス作成部の詳細構成の一例を示すブロック図である。図１０Ａは、変形例１における粗クラス学習の詳細処理の一例を示すフローチャートである。図１０Ｂは、図１０Ａに示すステップＳ１０のおける詳細処理の一例を示すフローチャートである。図１１は、変形例２における第３ニューラルネットワークの一例を示す図である。図１２Ａは、変形例２における粗クラス分類器を構成する第１ニューラルネットワークの一例を示す図である。図１２Ｂは、変形例２における詳細クラス分類器を構成する第２ニューラルネットワークの一例を示す図である。図１３は、実施の形態２における学習システムの構成の一例を示すブロック図である。図１４は、実施の形態２における学習システムが行う学習処理に用いる詳細クラス分類器の構成を説明するための図である。図１５は、実施の形態２における詳細クラス学習の詳細処理の一例を示すフローチャートである。図１６は、従来の分類器の構成および学習方法を説明するための図である。

（発明の基礎となった知見）
画像認識技術は、一般的に、１）画像から特徴量を抽出する抽出処理と、２）特徴量から物体を判別する判別処理の２段階に分かれる。例えば、抽出処理では、画像中の認識対象物体から、輝度の分布や輝度の差分（エッジ）など認識に利用する特徴量を抽出する。また、例えば判別処理では、抽出した特徴量から、ＢｏｏｓｔｉｎｇやＳＶＭ（ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ）などの統計的機械学習手法によって認識対象であるか否かを判別する。

従来、抽出処理に用いる特徴量抽出フィルタは、人の手によって設計されていた。近年、撮影環境の整備やインターネットを介した大量の学習データ収集が現実的になったこと、および、ＧＰＵ等の大規模計算機環境のインフラが整ったことから、自動で特徴量抽出フィルタの設計を行う方式の検討が進められている。このような手法の１つがＤｅｅｐＬｅａｒｎｉｎｇと呼ばれている。特に、画像認識の分野では、特徴量抽出フィルタを２次元画像に対する畳み込みフィルタ処理とみなした畳み込みニューラルネットワークが検討されている。この畳み込みニューラルネットワークは、ＤｅｅｐＬｅａｒｎｉｎｇ技術の中でも画像認識と相性が良いという特徴がある。

非特許文献１では、ＤｅｅｐＬｅａｒｎｉｎｇを用いた分類器の構成および学習方法が開示されている。以下、図１６を用いて、非特許文献１の分類器について説明する。図１６は、従来の分類器の構成および学習方法を説明するための図である。

図１６に示す分類器は、粗クラス分類器９００と、詳細クラス分類器９０１，９０２，９０３とを備える。粗クラス分類器９００は、犬や猫といった大まかな分類を行う分類器である。詳細クラス分類器９０１，９０２，９０３は、柴犬やコーギー、三毛猫などの細かな分類を行う分類器である。詳細クラス分類器９０１，９０２，９０３では、ある特定のクラスの分類に強くなるように学習をさせることで、上記のような細かな分類を行うことができるようになる。

このように、図１６に示す分類器では、犬や猫といった大まかな分類を行う粗クラス分類器９００の後に、柴犬やコーギー、三毛猫などの細かな分類を行う詳細クラス分類器９０１，９０２，９０３が接続される。図１６に示す分類器に例えば入力画像としてコーギー(犬)の画像を与えた場合、粗クラス分類器９００で犬と判別された後、犬クラスの分類に強い例えば詳細クラス分類器９０１へ振り分けられ、詳細クラス分類器９０１でコーギーと判別される。

以上のように、非特許文献１では、大まかな分類を行う分類器の後に、細かな分類を行う分類器を接続する構成を備える。これにより、粗クラス分類器、詳細クラス分類器それぞれが解く問題を簡易化し、それらを組み合わせることで、高精度に画像認識を行うことができ、より高精度に画像を分類することができる。

しかしながら、非特許文献１の分類器は、粗クラス分類器の後に複数の詳細クラス分類器を接続する構成であり、ニューラルネットワークのサイズ（ニューロン数や結合の数）が大きい。そのため、画像認識時にはより多くの計算処理が必要となり、画像認識の処理速度が遅くなるという課題が発生する。また、非特許文献１の分類器では、粗クラス分類器で分類を誤ると、誤った粗クラスの分類に対応する詳細クラス分類器でさらに細かな分類が行われてしまうため、分類結果の正解率が落ちてしまうという課題もある。

このような課題を解決するために、本開示の一形態に係る分類器の学習方法は、画像を分類するための分類器の学習方法であって、第１ニューラルネットワークで構成される粗クラス分類器に、それぞれの詳細クラスを示すラベルが付与された複数の画像である画像群を、複数の詳細クラスを包含する複数の粗クラスに分類させて当該複数の粗クラス毎の共通の特徴である第１特徴を学習させる第１ステップと、前記第１ステップにおいて学習させた前記第１ニューラルネットワークの最終層以外同一で当該最終層のみが異なる第２ニューラルネットワークで構成される詳細クラス分類器に、前記画像群を詳細クラスに分類させて当該詳細クラス毎の共通の特徴である第２特徴を学習させることで、前記分類器の学習を行う第２ステップとを含む。

これにより、ニューラルネットワーク構造のサイズを維持できるため、従来技術と比べて、画像認識（分類）の処理速度を低下させることなく画像認識（分類）を高精度に行うことができる。

また、例えば、前記第１ステップは、前記第１ニューラルネットワークの最終層のニューロンを、前記詳細クラスを示すラベルの内容に基づき作成された前記粗クラスの数と同一数のニューロンで設計する第１設計ステップと、設計された前記第１ニューラルネットワークで構成された前記粗クラス分類器に前記画像群を取得させ、前記第１特徴を学習させる第１学習ステップとを含み、前記第２ステップでは、前記第１ステップにおいて学習させた前記第１ニューラルネットワークの最終層のニューロンを、前記詳細クラスの数と同一数のニューロンに変更することにより、前記第２ニューラルネットワークを設計する第２設計ステップと、設計された前記第２ニューラルネットワークで構成される前記詳細クラス分類器に前記画像群を取得させ、前記第２特徴を学習させることで、前記分類器の学習を行う第２学習ステップと、を含むとしてもよい。

また、例えば、前記第２設計ステップでは、前記第１学習ステップにおいて学習させた前記第１ニューラルネットワークの最終層のニューロンを、前記詳細クラスの数と同一のニューロンに置き換えることにより、前記第２ニューラルネットワークを設計するとしてもよい。

また、例えば、前記詳細クラス分類器と前記粗クラス分類器とは第３ニューラルネットワークを使用して構成され、前記学習方法では、さらに、前記第１ステップの前に、前記第３ニューラルネットワークの最終層のニューロンを、前記粗クラスの数と前記詳細クラスの数とを加えた数と同一数以上のニューロンで設計する第３設計ステップを含み、前記第１設計ステップでは、前記第３ニューラルネットワークの最終層のニューロンのうち、前記粗クラスの数と同一数のニューロンを使用する前記第３ニューラルネットワークを前記第１ニューラルネットワークとして設計することで、前記第１ニューラルネットワークの最終層のニューロンを、前記詳細クラスを示すラベルの内容に基づき作成された前記粗クラスの数と同一数のニューロンに設計し、前記第２設計ステップでは、前記第３ニューラルネットワークの最終層のニューロンのうち、前記第１ニューラルネットワークの最終層のニューロンと異なり、かつ、前記詳細クラスの数と同一数のニューロンを使用する前記第３ニューラルネットワークを前記第２ニューラルネットワークとして設計することで、前記第１ステップにおいて学習させた前記第１ニューラルネットワークの最終層のニューロンを、前記詳細クラスの数と同一数のニューロンに変更して、前記第２ニューラルネットワークとして設計するとしてもよい。

また、例えば、前記第２設計ステップでは、さらに、前記第２ニューラルネットワークの最終層と当該最終層の１つ前の層との結合効率を示す前記第２ニューラルネットワークの最終層の重みをランダム値に設定するステップを含むとしてもよい。

また、例えば、前記第２設計ステップでは、さらに、前記第１学習ステップで学習した際に得た前記第１ニューラルネットワークの最終層と当該最終層の１つ前の層との結合効率を示す前記第１ニューラルネットワークの最終層の第１重みを、前記複数の粗クラスおよび当該複数の粗クラスに包含される複数の詳細クラスの関係性に基づき案分した値を用いて、前記第２ニューラルネットワークの最終層と当該最終層の１つ前の層との結合効率を示す前記第２ニューラルネットワークの最終層の第２重みを設定するステップを含むとしてもよい。

また、例えば、前記学習方法では、さらに、前記第２ステップにおいて前記第２特徴を学習させた前記詳細クラス分類器を前記分類器として保存するステップを含むとしてもよい。

また、例えば、前記第１ステップでは、さらに、前記複数の画像それぞれに付与された前記詳細クラスを示すラベルの内容に基づいて、前記複数の粗クラスを作成するステップを含むとしてもよい。

また、例えば、前記第１ステップでは、さらに、前記複数の画像それぞれの画像の類似度に基づき、前記複数の粗クラスを作成するステップを含むとしてもよい。

また、例えば、前記学習方法は、さらに、第３ニューラルネットワークで構成される第３粗クラス分類器に、前記画像群を、複数の詳細クラスを包含する複数の第３粗クラスに分類させて当該複数の第３粗クラス毎の共通の特徴である第３特徴を学習させる第３ステップを含み、前記第１ステップでは、前記第３ステップにおいて学習させた前記第３ニューラルネットワークの最終層以外同一で当該最終層のみが異なる前記第１ニューラルネットワークで構成される前記詳細クラス分類器に、前記画像群を、前記粗クラスに分類させて当該詳細クラス毎の前記第１特徴を学習させる学習ステップとを含み、前記複数の粗クラスはそれぞれ、複数の第３粗クラスを包含することで、当該複数の第３粗クラスに包含される複数の詳細クラスを包含するとしてもよい。

また、例えば、前記第１ステップおよび前記第２ステップのうちの少なくとも１つは、プロセッサーにより行われてもよい。

以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また全ての実施の形態において、各々の内容を組み合わせることもできる。

（実施の形態１）
以下では、図面を参照しながら、実施の形態１の分類器１０の学習方法等の説明を行う。

［学習システム１の構成］
図１は、実施の形態１の学習システム１の構成の一例を示すブロック図である。図２Ａは、実施の形態１の学習システム１が行う学習処理に用いる粗クラス分類器１０ａの構成を説明するための図である。図２Ｂは、実施の形態１の学習システム１が行う学習処理に用いる詳細クラス分類器１０ｂの構成を説明するための図である。図３Ａは、図２Ａに示す粗クラス分類器１０ａを構成する第１ニューラルネットワークの一例を示す図である。図３Ｂは、図２Ｂに示す詳細クラス分類器１０ｂを構成する第２ニューラルネットワークの一例を示す図である。

図１に示す学習システム１は、情報取得部２と、分類器設計部３と、分類器学習部４と、保存部５とを備え、画像を分類するための分類器１０の学習を行うためのシステムである。

情報取得部２は、予め用意された複数の画像（画像群）のデータセットすなわち詳細クラスを示すラベルが付与された画像群を取得する。また、情報取得部２は、保存部５に保存されている粗クラス分類器１０ａ、すなわち、保存部５に保存されている粗クラス分類器１０ａを構成する第１ニューラルネットワーク（構造や閾値、重み、結合状態などを示すパラメータ）を取得する。

分類器学習部４は、画像認識におけるcoarse to fineの考え方に基づき、図２Ａに示す粗クラス分類器１０ａの学習処理（粗クラス学習）と、図２Ｂに示す詳細クラス分類器１０ｂの学習処理（詳細クラス学習）とを行うことにより、分類器１０の学習を行う。

より具体的には、分類器学習部４は、分類器設計部３で設計された第１ニューラルネットワークで構成された粗クラス分類器１０ａにそれぞれの詳細クラスを示すラベルが付与された画像群を取得させる。そして、分類器学習部４は、粗クラス分類器１０ａに、当該画像群を、複数の詳細クラスを包含する複数の粗クラスに分類させて当該複数の粗クラス毎の共通の特徴である第１特徴を学習させる粗クラス学習を行う。なお、分類器学習部４は、粗クラス学習させた粗クラス分類器１０ａ、すなわち、粗クラス分類器１０ａを構成する第１ニューラルネットワーク（構造や閾値、重み、結合状態などを示すパラメータ）を保存部５に保存してもよい。

また、分類器学習部４は、分類器設計部３で設計された、粗クラス学習された第１ニューラルネットワークの最終層以外同一で当該最終層のみが異なる第２ニューラルネットワークで構成される詳細クラス分類器１０ｂに当該画像群を取得させる。そして、分類器学習部４は、当該画像群を詳細クラスに分類させて当該詳細クラス毎の共通の特徴である第２特徴を学習させる詳細クラス学習を行う。そして、分類器学習部４は、詳細クラス学習させた詳細クラス分類器１０ｂ、すなわち、詳細クラス分類器１０ｂを構成する第２ニューラルネットワーク（構造や閾値、重み、結合状態などを示すパラメータ）を、分類器１０として保存部５に保存する。

このように、分類器学習部４は、分類器１０を多段階（本実施の形態では２段階）で学習させる。

分類器設計部３は、詳細クラスの数または作成した粗クラスの数を分類器の出力数（ニューロンの数）として決定し、粗クラス分類器１０ａまたは詳細クラス分類器１０ｂの構成およびパラメータを設計する。

より具体的には、分類器設計部３は、粗クラス分類器１０ａを構成する第１ニューラルネットワークの最終層のニューロンを、上記の詳細クラスを示すラベルの内容に基づき作成された粗クラスの数と同一数のニューロンに設計する。本実施の形態では、分類器設計部３は、例えば図３Ａに示すような入力層と中間層と最終層とからなる第１ニューラルネットワークを設計して、図２Ａに示す粗クラス分類器１０ａとする。ここで、第１ニューラルネットワークの最終層のニューロンは、粗クラスの数と同一数のニューロンに設定される。

また、分類器設計部３は、粗クラス学習させた粗クラス分類器１０ａの第１ニューラルネットワークの最終層のニューロンを、詳細クラスの数と同一数のニューロンに変更することにより、第２ニューラルネットワークを設計する。分類器設計部３は、例えば、粗クラス学習させた第１ニューラルネットワークの最終層のニューロンを、詳細クラスの数と同一数のニューロンに置き換えることにより、第２ニューラルネットワークを設計する。ここで、分類器設計部３は、第２ニューラルネットワークの最終層と当該最終層の１つ前の層との結合効率を示す重みをランダム値に設定してもよい。

本実施の形態では、分類器設計部３は、例えば図３Ｂに示すような入力層と中間層と最終層とからなる第２ニューラルネットワークを設計し、例えば図２Ｂに示す詳細クラス分類器１０ｂとする。ここで、第２ニューラルネットワークは、粗クラス学習が行われた第１ニューラルネットワークの最終層以外同一であり、当該最終層のみが異なるように、最終層を置き換えて（入れ替えて）設計される。そして、第２ニューラルネットワークの最終層のニューロンは、詳細クラスの数と同一数のニューロンに設定される。第２ニューラルネットワークの最終層と当該最終層の１つ前の層との結合効率を示す重みは、詳細クラス学習時に学習（追学習）されるので、どのような値を設定してもよく例えばランダム値で設定する。

保存部５は、粗クラス学習された分類器１０（粗クラス分類器１０ａ）、すなわち、粗クラス分類器１０ａを構成する第１ニューラルネットワーク（構造や閾値、重み、結合状態などを示すパラメータ）を保存する。また、保存部５は、詳細クラス学習された分類器１０（詳細クラス分類器１０ｂ）、すなわち、詳細クラス分類器１０ｂを構成する第２ニューラルネットワーク（構造や閾値、重み、結合状態などを示すパラメータ）を、分類器１０として保存する。

図４は、実施の形態１の分類器１０が認識処理を行う際の構成を説明するための図である。

分類器１０は、画像を分類するための分類器であって、分類対象物（入力画像）が入力されたときに、認識処理および分類処理を実行し、その結果（分類結果）を出力する。分類器１０は、図４に示すような構成すなわち詳細クラス学習された詳細クラス分類器１０ｂと同一である。

このように、分類器１０は、サイズ（ニューロン数や結合の数）の小さいニューラルネットワークで構成される一方で、画像認識におけるcoarse to fineの考え方に基づき学習システム１により多段階学習されるので、画像認識を高精度に行いつつ画像認識（分類）の処理速度を向上することができる。

［学習システム１の学習処理］
次に、以上のように構成された学習システム１の学習処理について、図を用いて説明する。

図５は、実施の形態１における学習処理を示すフローチャートである。図５には、多段階の学習処理の一例として、２段階学習処理が示されている。図６Ａは、実施の形態１における粗クラス学習の結果の一例を示す図である。図６Ｂは、実施の形態１における詳細クラス学習の結果の一例を示す図である。

まず、ステップＳ１において、学習システム１は、粗クラス分類器１０ａの学習処理（粗クラス学習）を行う。

より具体的には、学習システム１は、第１ニューラルネットワークで構成される粗クラス分類器１０ａに、それぞれの詳細クラスを示すラベルが付与された画像群を、複数の詳細クラスを包含する複数の粗クラスに分類させて当該複数の粗クラス毎の共通の特徴である第１特徴を学習させる。例えば図６Ａに示すように、学習システム１は、粗クラス分類器１０ａに、画像データセットである画像群を、ｄｏｇ、ｂｉｒｄ、ｍａｃｈｉｎｅなどの複数の粗クラスに分類させて（境界線を引かせて）、同じ粗クラスに分類された詳細クラスを示すラベルが付された画像間で共通する特徴（第１特徴）を抽出させる。そして、学習システム１は、粗クラス分類器１０ａに、抽出した第１特徴を認識するように学習（粗クラス学習）させる。

次に、ステップＳ２において、学習システム１は、詳細クラス分類器１０ｂの学習処理（詳細クラス学習）を行う。

より具体的には、ステップＳ１において学習させた第１ニューラルネットワークの最終層以外同一で当該最終層のみが異なる第２ニューラルネットワークで構成される詳細クラス分類器１０ｂに、当該画像群を詳細クラスに分類させて当該詳細クラス毎の共通の特徴である第２特徴を学習させることで、分類器１０の学習を行う。学習システム１は、例えば図６Ｂに示すように、詳細クラス分類器１０ｂに、同一の画像データセットである上記画像群を、ステップＳ１で分類した（境界線を引いた）dog、bird、machineなどの複数の粗クラスを初期値にする。学習システム１は、corgi、rottweiler、golden retriever、radio、printer、computer、white stork、albatross、ruddy turnstoneなど、さらに詳細クラスに分類させて（境界線を引かせて）、分類された詳細クラス毎の共通の特徴（第２特徴）を抽出させる。そして、学習システム１は、詳細クラス分類器１０ｂに、抽出させた第２特徴を認識するように追学習（詳細クラス学習）させる。

これにより、従来の分類器と比較して、ニューラルネットワーク構造のサイズを小さく維持したままで局所解や過学習を抑制できるので、画像認識（分類）の処理速度を低下させることなく画像認識を高精度に行うことができる。

以下、ステップＳ１（粗クラス学習）およびステップＳ２（詳細クラス学習）の詳細処理について説明する。

図７は、図５に示すステップＳ１の詳細処理の一例を示すフローチャートである。

ステップＳ１において、まず、学習システム１は、粗クラス分類器１０ａを構成する第１ニューラルネットワークの最終層のニューロンを、詳細クラスを示すラベルの内容に基づき作成された粗クラスの数と同一数のニューロンに設計する（Ｓ１１）。つまり、学習システム１は、粗クラス分類器１０ａを構成する第１ニューラルネットワークを設計する。

次に、学習システム１は、詳細クラスを示すラベルが付与された画像群を外部より取得する（Ｓ１２）。

次に、学習システム１は、設計された第１ニューラルネットワークで構成された粗クラス分類器１０ａに当該画像群を取得させ、第１特徴を学習させる（Ｓ１３）。具体的には、粗クラス分類器１０ａは、第１特徴を認識するように学習（粗クラス学習）することで、第１特徴を認識するための第１ニューラルネットワークの閾値や、重み、結合状態などを示すパラメータを学習する。

次に、学習システム１は、ステップＳ１３で第１特徴を学習させた粗クラス分類器１０ａ、すなわち、粗クラス分類器１０ａを構成する第１ニューラルネットワークを保存部５に保存する（Ｓ１４）。

図８は、図５に示すステップＳ２の詳細処理の一例を示すフローチャートである。

ステップ２において、まず、学習システム１は、ステップＳ１において学習させた粗クラス分類器１０ａを構成する第１ニューラルネットワークの最終層のニューロンを、詳細クラスの数と同一数のニューロンに変更することにより、詳細クラス分類器１０ｂを構成する第２ニューラルネットワークを設計する（Ｓ２１）。

つまり、学習システム１は、ステップＳ１で学習させた粗クラス分類器１０ａを構成する第１ニューラルネットワーク（構造や閾値、重み、結合状態などを示すパラメータ）を最終層以外そのまま利用した第２ニューラルネットワークを詳細クラス分類器１０ｂとして設計する。そして、第２ニューラルネットワークの最終層のニューロンを、詳細クラスの数と同一数になるように変更する。本実施の形態では、学習システム１は、第１ニューラルネットワークの最終層のニューロンを、詳細クラスの数と同一数のニューロンに置き換えることで、第２ニューラルネットワークを設計する。

次に、学習システム１は、詳細クラスを示すラベルが付与された画像群を外部より取得する（Ｓ２２）。ここで、学習システム１は、ステップＳ１２で取得した画像群と同一の画像群を取得する。

次に、学習システム１は、設計された第２ニューラルネットワークで構成された詳細クラス分類器１０ｂに当該画像群を取得させ、第２特徴を学習させる（Ｓ２３）。具体的には、詳細クラス分類器１０ｂは、第２特徴を認識するように学習（詳細クラス学習）することで、第２特徴を認識するための第２ニューラルネットワークの閾値や、重み、結合状態などを示すパラメータを学習する。

次に、学習システム１は、ステップＳ２３で第２特徴を学習させた詳細クラス分類器１０ｂ、すなわち、詳細クラス分類器１０ｂを構成する第２ニューラルネットワーク（構造や閾値、重み、結合状態などを示すパラメータ）を、分類器１０として保存部５に保存する（Ｓ１４）。

［効果等］
以上のように、本実施の形態１によれば、従来技術と比べ、画像認識の処理速度を低下させることなく、画像認識を高精度に行うことができる分類器の学習方法等を実現できる。具体的には、実施の形態１の学習方法によれば、詳細クラス分類器１０ｂと最終層以外同一のニューラルネットワークで構成される粗クラス分類器１０ａに行った粗クラス学習の結果を初期値として、詳細クラス分類器１０ｂに詳細クラス学習させる（多段階学習させる）。つまり、粗クラス学習と詳細クラス学習とで、出力数（最終層のニューロンの数）のみが入れ替えられるニューラルネットワークで構成される分類器１０（粗クラス分類器１０ａ、詳細クラス分類器１０ｂ）が使用される。さらに、詳細クラス学習では、最終層以外の層では粗クラス学習で得たパラメータが設定されたニューラルネットワークで構成される詳細クラス分類器１０ｂ）を使用する。このように、分類器１０のニューラルネットワークの最終層以外の構造を変えず（サイズを維持したまま）、多段階学習させる。それにより、誤った詳細クラスで分類されるといったことが抑制できるので画像認識の精度を向上できるだけでなく、ニューラルネットワークのサイズも小さくできるので従来と比較して４倍程度に画像認識の処理速度を向上することができる。

なお、実施の形態１では、分類器１０を２段階学習させる場合について説明したがそれに限らない。３段階以上の多段階学習をさせてもよい。

例えば、３段階学習させる場合には、学習システム１は、さらに、第３ニューラルネットワークで構成される第３粗クラス分類器に、上記画像群を、複数の詳細クラスを包含する複数の第３粗クラスに分類させて当該複数の第３粗クラス毎の共通の特徴である第３特徴を学習させる。そして、当該第３特徴を学習させた第３ニューラルネットワークの最終層以外同一で当該最終層のみが異なる上述した第１ニューラルネットワークで構成される詳細クラス分類器１０ｂに、上記画像群を、上記粗クラスに分類させて当該詳細クラス毎の第１特徴を学習させる。ここで、上述した複数の粗クラスはそれぞれ、複数の第３粗クラスを包含することで、当該複数の第３粗クラスに包含される複数の詳細クラスを包含すればよい。

このように、上述した粗クラス分類を２段階以上で行うことで、分類器１０を３段階以上の多段階学習をさせればよい。詳細クラスを示すラベルが付与された画像群を構成する画像が多数の場合で一段階の粗クラス分類では出力数（最終層のニューロン数）が多くなってしまう場合に特に有効である。

（変形例１）
実施の形態１では、学習システム１は、詳細クラスを示すラベルの内容に基づき作成された粗クラスを用いて、粗クラス分類器１０ａを設計する場合について説明したがそれに限らない。学習システム１が詳細クラスを示すラベルの内容に基づき粗クラスを作成してもよい。以下、この場合の一例を変形例１として説明する。

［学習システム１Ａの構成］
図９Ａは、変形例１における学習システム１Ａの構成の一例を示すブロック図である。図９Ｂは、図９Ａに示す粗クラス作成部６の詳細構成の一例を示すブロック図である。図１と同様の要素には同一の符号を付しており、詳細な説明は省略する。

図９Ａに示す学習システム１Ａは、図１に示す学習システム１に対して、粗クラス作成部６が追加されている点で構成が異なる。

粗クラス作成部６は、上記画像群を構成する複数の画像それぞれに付与された詳細クラスを示すラベルの内容に基づいて、複数の粗クラスを作成する。なお、粗クラス作成部６は、上記画像群を構成する複数の画像それぞれの画像の類似度に基づき、複数の粗クラスを作成するとしてもよい。

［粗クラス作成部６の構成］
本変形例では、粗クラス作成部６は、図９Ｂに示すように、例えば粗クラス作成処理部６１と、粗クラスラベル付加部６２とを備える。

粗クラス作成処理部６１は、例えば教師無しクラスタリングを行うことにより、画像群を構成する複数の画像を、複数の粗クラスに分類して、複数の粗クラスを作成することができる。例えば、粗クラス作成処理部６１は、画像群を構成する複数の画像それぞれに付与された詳細クラスを示すラベルの内容または上記画像群を構成する複数の画像それぞれの画像の類似度に基づき、画像群を構成する複数の画像を、複数の粗クラスに分類する。そして、分類した複数の粗クラスを一意に識別できる名称等を作成する。このようにして、粗クラス作成処理部は、上述した複数の粗クラスを作成することができる。

粗クラスラベル付加部６２は、画像群を構成する複数の画像であってそれぞれの詳細クラスを示すラベルが付与された複数の画像それぞれに、粗クラス作成処理部６１において分類された粗クラスを示すラベルを付与する。

［学習システム１Ａの学習処理］
次に、以上のように構成された学習システム１Ａの学習処理について、図を用いて説明する。学習システム１Ａの２段階学習処理については、図５に示した通りであり、詳細クラス学習（ステップＳ２）の詳細処理については、図８に示した通りであるので、説明を省略する。以下、実施の形態１とは異なる部分を中心に説明する。

図１０Ａは、変形例１における粗クラス学習（ステップＳ１）の詳細処理の一例を示すフローチャートである。図１０Ｂは、図１０Ａに示すステップＳ１０の詳細処理の一例を示すフローチャートである。図７と同様の要素には同一の符号を付しており、説明を省略する。

図１０Ａに示す粗クラス学習の詳細処理は、図７に示す粗クラス学習の詳細処理と比較して、ステップＳ１０の処理が追加されている点で異なる。

ステップＳ１０では、学習システム１Ａは、粗クラス作成部６に、上記画像群を構成する複数の画像それぞれに付与された詳細クラスを示すラベルの内容に基づいて、複数の粗クラスを作成させる。なお、学習システム１Ａは、粗クラス作成部６に、上記画像群を構成する複数の画像それぞれの画像の類似度に基づき、複数の粗クラスを作成させてもよい。

より具体的には、図１０Ｂに示すように、ステップＳ１０において、まず、学習システム１Ａは、粗クラス作成処理を行う（Ｓ１０１）。本変形例では、学習システム１Ａは、粗クラス作成処理部６１に、詳細クラスを示すラベルが付与された画像群を外部より取得させる。そして、学習システム１Ａは、粗クラス作成処理部６１に、取得させた画像群を構成する複数の画像を、複数の粗クラスに分類させて、複数の粗クラスを作成させる。

次に、学習システム１Ａは、粗クラスラベル付加処理を行う（Ｓ１０２）。本変形例では、学習システム１Ａは、粗クラスラベル付加部６２に、ステップＳ１０１にて行った分類結果に基づいて、当該画像群を構成する複数の画像であってそれぞれの詳細クラスを示すラベルが付与された複数の画像それぞれに、ステップＳ１０１で分類された粗クラスを示すラベルを付与する。

（変形例２）
実施の形態１では、第１ニューラルネットワークの最終層を入れ替える（置き換える）ことにより、第２ニューラルネットワークの最終層を設計する場合の例について説明したがそれに限らない。同一の第３ニューラルネットワークの最終層を構成するニューロンうち使用するニューロンを第１ニューラルネットワークと第２ニューラルネットワークとで変更するとしてもよい。以下、この場合の例について変形例２として説明する。

［構成］
図１１は、変形例２における第３ニューラルネットワークの一例を示す図である。図１２Ａは、変形例２における粗クラス分類器を構成する第１ニューラルネットワーク１０ｃの一例を示す図である。図１２Ｂは、変形例２における詳細クラス分類器を構成する第２ニューラルネットワーク１０ｄの一例を示す図である。なお、図２Ａおよび図２Ｂと同様の要素には同一の符号を付しており、詳細な説明は省略する。

学習システム１が分類器１０の多段階学習を行う際、粗クラス分類器１０ｃを用いて粗クラス学習を行い、詳細クラス分類器１０ｄを用いて詳細クラス学習を行う。

本変形例では、粗クラス分類器１０ｃと詳細クラス分類器１０ｄとは、例えば図１１に示す第３ニューラルネットワークを使用して構成される。ここで、第３ニューラルネットワークの最終層のニューロンは、粗クラスの数と詳細クラスの数とを加えた数と同一数以上のニューロンで構成されている。

粗クラス分類器１０ｃを構成する第１ニューラルネットワークは、図１２Ａに示すように、図１１に示す第３ニューラルネットワークの最終層以外と、当該最終層の一部を使用して構成される。具体的には、粗クラス分類器１０ｃを構成する第１ニューラルネットワークは、第３ニューラルネットワークの最終層のニューロンのうち、粗クラスの数と同一数のニューロンを使用する第３ニューラルネットワークで構成される。

詳細クラス分類器１０ｄを構成する第２ニューラルネットワークは、図１２Ｂに示すように、図１１に示す第３ニューラルネットワークの最終層以外と、当該最終層の他部を使用して構成される。具体的には、詳細クラス分類器１０ｄを構成する第２ニューラルネットワークは、第３ニューラルネットワークの最終層のニューロンのうち、第１ニューラルネットワークの最終層のニューロンと異なり、かつ、詳細クラスの数と同一数のニューロンを使用する第３ニューラルネットワークで構成される。

［学習システム１の学習処理］
本変形例では、学習システム１は、以上のように構成された粗クラス分類器１０ｃと詳細クラス分類器１０ｄとを用いて例えば図５で説明したような学習処理を行う。

より具体的には、本変形例の学習処理では、さらに、ステップＳ１の粗クラス分類器１０ｃの学習処理の前に、例えば図１１に示す第３ニューラルネットワークの最終層のニューロンを、粗クラスの数と詳細クラスの数とを加えた数と同一数以上のニューロンで設計する。

そのため、変形例の学習システム１は、ステップＳ１において、第３ニューラルネットワークの最終層のニューロンのうち、粗クラスの数と同一数のニューロンを使用する第３ニューラルネットワークを、粗クラス分類器１０ｃを構成する第１ニューラルネットワークとして設計することで、第１ニューラルネットワークの最終層のニューロンを、詳細クラスを示すラベルの内容に基づき作成された粗クラスの数と同一数のニューロンに設計する。

さらに、変形例の学習システム１は、ステップＳ２において、第３ニューラルネットワークの最終層のニューロンのうち、第１ニューラルネットワークの最終層のニューロンと異なり、かつ、詳細クラスの数と同一数のニューロンを使用する第３ニューラルネットワークを、詳細クラス分類器１０ｄを構成する第２ニューラルネットワークとして設計することで、ステップＳ１において学習させた第１ニューラルネットワークの最終層のニューロンを、詳細クラスの数と同一数のニューロンに変更して、第２ニューラルネットワークとして設計する。

（実施の形態２）
実施の形態１では、第２ニューラルネットワークの最終層の重みをランダム値に設定する場合を例に挙げて説明したが、それに限らない。粗クラス学習させた第１ニューラルネットワークの最終層の重みと、詳細クラスおよび粗クラスの関係性とに基づいて、第２ニューラルネットワークの最終層の重みを設定してもよい。以下、この場合について、実施の形態１と異なる部分について説明する。

［学習システム１Ｂの構成］
図１３は、実施の形態２における学習システム１Ｂの構成の一例を示すブロック図である。図１４は、実施の形態２における学習システム１Ｂが行う学習処理に用いる詳細クラス分類器１０ｅの構成を説明するための図である。図１４におけるａ、ｂ、ｋ、ａ１〜ａｌ、ｂ１〜ｂｍ、ｋ１〜ｋｎは正の整数である。なお、図１等と同様の要素には同一の符号を付しており、詳細な説明は省略する。

図１３に示す学習システム１Ｂは、情報取得部２と、分類器設計部３と、分類器学習部４と、保存部５と、重み設定部７とを備える。図１３に示す学習システム１Ｂは、図１に示す学習システム１に対して、重み設定部７を備える点で構成が異なる。

重み設定部７は、粗クラス学習させた粗クラス分類器１０ａより取得した第１ニューラルネットワークの最終層の重み、および、包含関係など詳細クラスと粗クラスとの関係性に基づいて、新たな最終層の重みすなわち第２ニューラルネットワークの最終層の重みを算出して設定する。より具体的には、重み設定部７は、粗クラス学習されることにより得た粗クラス分類器１０ａの第１ニューラルネットワークの最終層と当該最終層の１つ前の層との結合効率を示す第１ニューラルネットワークの最終層の第１重みを、複数の粗クラスおよび当該複数の粗クラスに包含される複数の詳細クラスの関係性に基づき案分された値を算出する。そして、重み設定部７は、算出した値を用いて、第２ニューラルネットワークの最終層と当該最終層の１つ前の層との結合効率を示す第２ニューラルネットワークの最終層の第２重みを設定する。

例えば、図１４には、Wa、Wb、・・・、Wkなどの第１重みと、Wa１〜Waｌ、Wb１〜Wbｍ、・・・、Wk１〜Wkｎなどの第２重みとが示されている。また、図１４には、第１ニューラルネットワークの最終層のニューロンが出力する複数の粗クラス(粗クラスａ、粗クラスｂ、・・・粗クラスｋ）と、第２ニューラルネットワークの最終層のニューロンが出力する複数の詳細クラス(詳細クラスａ１〜詳細クラスａｌ、詳細クラスｂ１〜詳細クラスｂｍ、・・・、詳細クラスｋ１〜詳細クラスＫｎ）と、が示されている。

つまり、重み設定部７は、粗クラス学習で第１ニューラルネットワークが学習されることにより、第１ニューラルネットワークの最終層の第１重みとして、粗クラスａ、粗クラスｂ、・・・、粗クラスｋを出力する最終層のニューロンの第１重みWa、Wb、・・・、Wkを取得することができる。そして、詳細クラス分類器１０ｅでは、複数の粗クラス(粗クラスａ、粗クラスｂ、・・・粗クラスｋ）が複数の粗クラス(粗クラスａ、粗クラスｂ、・・・粗クラスｋ）に包含される複数の詳細クラス(詳細クラスａ１〜詳細クラスａｌ、詳細クラスｂ１〜詳細クラスｂｍ、・・・、詳細クラスｋ１〜詳細クラスＫｎに置き換えられる。その際、重み設定部７は、複数の粗クラス(粗クラスａ、粗クラスｂ、・・・粗クラスｋ）に包含される複数の詳細クラス(詳細クラスａ１〜詳細クラスａｌ、詳細クラスｂ１〜詳細クラスｂｍ、・・・、詳細クラスｋ１〜詳細クラスＫｎ）の関係性に基づいて、取得した第１重みWa、Wb、・・・、Wkを、対応する粗クラスが包含する詳細クラスの数（ｌ個、ｍ個、・・・、ｎ個）で案分する値（Wa１〜Waｌ、Wb１〜Wbｍ、・・・、Wk１〜Wkｎ）を、第２重みとして算出する。

［学習システム１Bの学習処理］
次に、以上のように構成された学習システム１Ｂの学習処理について説明する。学習システム１Ｂの２段階学習処理については、図５に示した通りであり、粗クラス学習（ステップＳ１）の詳細処理については、図７に示した通りであるので、説明を省略する。以下では、実施の形態１とは異なる部分を中心に説明する。

図１５は、実施の形態２における詳細クラス学習（ステップＳ２）の詳細処理の一例を示すフローチャートである。なお、図１５のステップＳ３２、ステップＳ３４〜ステップＳ３６は、図８で説明したステップＳ２１〜ステップＳ２４と同様のであるので、ここでの説明は省略する。

まず、ステップＳ３１において、学習システム１Ｂは、重み設定部７に、ステップＳ１０において粗クラス分類器１０ａに粗クラス学習させた際に得た粗クラス分類器１０ａを構成する第１ニューラルネットワークの最終層の第１重みを取得させる。

また、ステップＳ３３において、学習システム１Ｂは、重み設定部７に、取得させた第１重みを、詳細クラスと粗クラスとの関係性に基づき案分した値を用いて、詳細クラス分類器１０ｂを構成する第２ニューラルネットワークの最終層の第２重みを設定する。ここで、詳細クラスと粗クラスとの関係性は、複数の粗クラスおよび当該複数の粗クラスに包含される複数の詳細クラスの関係性であり、上述した例では、粗クラスに包含される複数の詳細クラスの数である。

［効果等］
以上のように、本実施の形態によれば、従来技術に比べ、画像認識の処理速度を低下させることなく、画像認識を高精度に行うことができる分類器の学習方法等を実現できる。

なお、上述したように、実施の形態２の学習方法では、実施の形態１の学習方法に加え、粗クラス分類処理により学習させた際に取得した粗クラス分類器１０ａの最終層の重みに基づいて、詳細クラス分類処理で用いる詳細クラス分類器１０ｂの最終層の重みを設定する。これにより、分類器１０の画像認識の精度および画像認識の処理速度を向上することができる。

以上、実施の形態１、変形例１、変形例２および実施の形態２にて本開示の学習方法について説明したが、各処理が実施される主体や装置に関しては特に限定しない。ローカルに配置された特定の装置内に組み込まれたプロセッサーなど（以下に説明）によって処理されてもよい。またローカルの装置と異なる場所に配置されているクラウドサーバなどによって処理されてもよい。

なお、本開示は、さらに、以下のような場合も含まれる。

（１）上記の装置は、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭ、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記ＲＡＭまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。

（２）上記の装置を構成する構成要素の一部または全部は、１個のシステムＬＳＩ（Large Scale Integration：大規模集積回路）から構成されているとしてもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどを含んで構成されるコンピュータシステムである。前記ＲＡＭには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムＬＳＩは、その機能を達成する。

（３）上記の装置を構成する構成要素の一部または全部は、各装置に脱着可能なＩＣカードまたは単体のモジュールから構成されているとしてもよい。前記ＩＣカードまたは前記モジュールは、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどから構成されるコンピュータシステムである。前記ＩＣカードまたは前記モジュールは、上記の超多機能ＬＳＩを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ＩＣカードまたは前記モジュールは、その機能を達成する。このＩＣカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。

（４）本開示は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。

（５）また、本開示は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータで読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、ＣＤ−ＲＯＭ、ＭＯ、ＤＶＤ、ＤＶＤ−ＲＯＭ、ＤＶＤ−ＲＡＭ、ＢＤ（Ｂｌｕ−ｒａｙ（登録商標）Ｄｉｓｃ）、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。

また、本開示は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。

また、本開示は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。

また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を、前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。

（６）上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。

本開示は、画像を分類するための分類器の学習方法およびそのプログラム等に利用でき、特に、画像から、画像中に含まれる物体が何であるかを精度良く認識することができる物体認識方法及びシステムを備えるデジタルカメラ、ムービー、監視カメラ、車載カメラ、ウェアラブルカメラなどの撮像装置に利用することができる。

１、１Ａ、１Ｂ学習システム
２情報取得部
３分類器設計部
４分類器学習部
５保存部
６粗クラス作成部
７重み設定部
１０分類器
１０ａ、１０ｃ粗クラス分類器
１０ｂ、１０ｄ、１０ｅ詳細クラス分類器
６１粗クラス作成処理部
６２粗クラスラベル付加部

Claims

画像を分類するための分類器の学習方法であって、
第１ニューラルネットワークで構成される粗クラス分類器に、それぞれの詳細クラスを示すラベルが付与された複数の画像である画像群を、複数の詳細クラスを包含する複数の粗クラスに分類させて当該複数の粗クラス毎の共通の特徴である第１特徴を学習させる第１ステップと、
前記第１ステップにおいて学習させた前記第１ニューラルネットワークの最終層以外同一で当該最終層のみが異なる第２ニューラルネットワークで構成される詳細クラス分類器に、前記画像群を詳細クラスに分類させて当該詳細クラス毎の共通の特徴である第２特徴を学習させることで、前記分類器の学習を行う第２ステップとを含む、
学習方法。
前記第１ステップは、
前記第１ニューラルネットワークの最終層のニューロンを、前記詳細クラスを示すラベルの内容に基づき作成された前記粗クラスの数と同一数のニューロンで設計する第１設計ステップと、
設計された前記第１ニューラルネットワークで構成された前記粗クラス分類器に前記画像群を取得させ、前記第１特徴を学習させる第１学習ステップとを含み、
前記第２ステップでは、
前記第１ステップにおいて学習させた前記第１ニューラルネットワークの最終層のニューロンを、前記詳細クラスの数と同一数のニューロンに変更することにより、前記第２ニューラルネットワークを設計する第２設計ステップと、
設計された前記第２ニューラルネットワークで構成される前記詳細クラス分類器に前記画像群を取得させ、前記第２特徴を学習させることで、前記分類器の学習を行う第２学習ステップと、を含む、
請求項１に記載の学習方法。
前記第２設計ステップでは、
前記第１学習ステップにおいて学習させた前記第１ニューラルネットワークの最終層のニューロンを、前記詳細クラスの数と同一のニューロンに置き換えることにより、前記第２ニューラルネットワークを設計する、
請求項２に記載の学習方法。
前記詳細クラス分類器と前記粗クラス分類器とは第３ニューラルネットワークを使用して構成され、
前記学習方法では、
さらに、前記第１ステップの前に、前記第３ニューラルネットワークの最終層のニューロンを、前記粗クラスの数と前記詳細クラスの数とを加えた数と同一数以上のニューロンで設計する第３設計ステップを含み、
前記第１設計ステップでは、
前記第３ニューラルネットワークの最終層のニューロンのうち、前記粗クラスの数と同一数のニューロンを使用する前記第３ニューラルネットワークを前記第１ニューラルネットワークとして設計することで、前記第１ニューラルネットワークの最終層のニューロンを、前記詳細クラスを示すラベルの内容に基づき作成された前記粗クラスの数と同一数のニューロンに設計し、
前記第２設計ステップでは、
前記第３ニューラルネットワークの最終層のニューロンのうち、前記第１ニューラルネットワークの最終層のニューロンと異なり、かつ、前記詳細クラスの数と同一数のニューロンを使用する前記第３ニューラルネットワークを前記第２ニューラルネットワークとして設計することで、前記第１ステップにおいて学習させた前記第１ニューラルネットワークの最終層のニューロンを、前記詳細クラスの数と同一数のニューロンに変更して、前記第２ニューラルネットワークとして設計する、
請求項２に記載の学習方法。
前記第２設計ステップでは、
さらに、
前記第２ニューラルネットワークの最終層と当該最終層の１つ前の層との結合効率を示す前記第２ニューラルネットワークの最終層の重みをランダム値に設定するステップを含む、
請求項２〜４のいずれか１項に記載の学習方法。
前記第２設計ステップでは、
さらに、
前記第１学習ステップで学習した際に得た前記第１ニューラルネットワークの最終層と当該最終層の１つ前の層との結合効率を示す前記第１ニューラルネットワークの最終層の第１重みを、前記複数の粗クラスおよび当該複数の粗クラスに包含される複数の詳細クラスの関係性に基づき案分した値を用いて、
前記第２ニューラルネットワークの最終層と当該最終層の１つ前の層との結合効率を示す前記第２ニューラルネットワークの最終層の第２重みを設定するステップを含む、
請求項２〜４のいずれか１項に記載の学習方法。
前記学習方法では、
さらに、前記第２ステップにおいて前記第２特徴を学習させた前記詳細クラス分類器を前記分類器として保存するステップを含む、
請求項１〜６のいずれか１項に記載の学習方法。
前記第１ステップでは、さらに、
前記複数の画像それぞれに付与された前記詳細クラスを示すラベルの内容に基づいて、
前記複数の粗クラスを作成するステップを含む、
請求項１〜７のいずれか１項に記載の学習方法。
前記第１ステップでは、さらに、
前記複数の画像それぞれの画像の類似度に基づき、
前記複数の粗クラスを作成するステップを含む、
請求項１〜７のいずれか１項に記載の学習方法。
前記学習方法は、さらに、
第３ニューラルネットワークで構成される第３粗クラス分類器に、前記画像群を、複数の詳細クラスを包含する複数の第３粗クラスに分類させて当該複数の第３粗クラス毎の共通の特徴である第３特徴を学習させる第３ステップを含み、
前記第１ステップでは、
前記第３ステップにおいて学習させた前記第３ニューラルネットワークの最終層以外同一で当該最終層のみが異なる前記第１ニューラルネットワークで構成される前記詳細クラス分類器に、前記画像群を、前記粗クラスに分類させて当該詳細クラス毎の前記第１特徴を学習させる学習ステップとを含み、
前記複数の粗クラスはそれぞれ、複数の第３粗クラスを包含することで、当該複数の第３粗クラスに包含される複数の詳細クラスを包含する、
請求項１に記載の学習方法。
前記第１ステップおよび前記第２ステップのうちの少なくとも１つは、プロセッサーにより行われる、
請求項１に記載の学習方法。
画像を分類するための分類器を学習させるためのプログラムであって、
前記プログラムは、コンピュータに
第１ニューラルネットワークで構成される粗クラス分類器に、それぞれの詳細クラスを示すラベルが付与された複数の画像である画像群を、複数の詳細クラスを包含する複数の粗クラスに分類させて当該複数の粗クラス毎の共通の特徴である第１特徴を学習させる第１ステップと、
前記第１ステップにおいて学習させた前記第１ニューラルネットワークの最終層以外同一で当該最終層のみが異なる第２ニューラルネットワークで構成される詳細クラス分類器に、前記画像群を詳細クラスに分類させて当該詳細クラス毎の共通の特徴である第２特徴を学習させることで、前記分類器の学習を行う第２ステップとを含む、処理を実行させる
プログラム。