WO2021241173A1

WO2021241173A1 - 学習装置、学習方法及び学習プログラム、認識装置、認識方法及び認識プログラム並びに学習認識装置

Info

Publication number: WO2021241173A1
Application number: PCT/JP2021/017619
Authority: WO
Inventors: 望仲尾
Original assignee: コニカミノルタ株式会社
Priority date: 2020-05-27
Filing date: 2021-05-10
Publication date: 2021-12-02
Also published as: JPWO2021241173A1

Abstract

ラベル毎の特性に偏りがある場合においても、一定の認識性能を維持することができるように、学習することができる学習認識装置を提供する。　教師データ及び対応する複数の教師ラベルを取得する訓練データ入力部１３１、教師データに対して、教師ラベル毎に推論誤差を算出するようにニューラルネットワークを制御する制御部１３０、教師ラベル毎に算出された推論誤差を、教師ラベル毎に、当該教師ラベルの学習特性に基づいて設定された加重値により補正して補正推論誤差を算出する加重値付与部を備える。制御部１３０は、教師ラベル毎の補正推論誤差が小さくなっていくように、ニューラルネットワークに繰り返し作用させる。

Description

学習装置、学習方法及び学習プログラム、認識装置、認識方法及び認識プログラム並びに学習認識装置

　本開示は、ニューラルネットワークに学習をさせる技術及びニューラルネットワークにより認識を行う技術に関し、特に、一つの教師データに複数の教師ラベルが対応する場合における学習技術及び一つの教師データに複数の教師ラベルが対応する場合における認識技術に関する。

　ニューラルネットワークに学習をさせる際、教師ラベルが付された教師データを用いることが一般的である。例えば、車が写った写真などの画像データ（教師データ）と、その画像データに写っている車の車種（教師ラベル）とを含む訓練データを用いて、あらかじめ学習を行い、学習結果を用いて新たな写真からラベルを認識する。

　特許文献１によると、学習装置は、適合ラベル及び非適合ラベルの各データ項目を有する入力データから生成される特徴量を入力して第１の推定結果を出力する第１の教師有学習器に対し、第１の推定結果と前記適合ラベルとが一致するように学習させる。学習装置は、特徴量を入力して第２の推定結果を出力する第２の教師有学習器に対し、第２の推定結果と前記非適合ラベルとが一致するように学習させる。学習装置は、入力データから特徴量を生成する特徴抽出器に対し、適合ラベルの認識を促進させ、かつ、非適合ラベルの認識を抑制する学習を実行させる。

　また、特許文献２によると、排他的なラベルが付与された学習データによる学習を実行することを課題とし、学習装置は、学習対象のデータそれぞれに対して、１又は複数のラベルを要素とするラベルベクトルを設定する。例えば、学習装置は、学習対象のデータそれぞれに設定する対象であるラベル間の相関に基づき、ラベルベクトルを生成する。そして、学習装置は、学習対象のデータと、学習対象のデータそれぞれに設定されたラベルベクトルを用いて、ニューラルネットワークを含む学習モデルに対する学習を行わせる。

　上記のように、特許文献１及び２には、一つの教師データに複数の教師ラベルが対応付けられる場合における学習技術について、開示されている。

特開２０１９－１５９８２４号公報特開２０１９－１５９６１２号公報

　しかし、ラベル毎にバランスよく、教師データを揃えることは困難である。例えば、教師として、車両のカタログデータを用いると、車種や色のバリエーションを増やすことができるが、カタログデータには、車両の走行シーンの画像が少ないと予想される。一方、教師としての車両の走行シーンを写した画像では、車種や色のバリエーションが少ないと予想される。

　ラベル毎の教師データの量のバランスが悪いと、ラベル毎の習熟度のバランスが悪くなり、その結果、認識装置において、認識性能が低下する。

　また、ラベル毎の教師データの量のバランス以外にも、ラベル毎の教師データの出現確率のバランスが悪い場合、ラベル毎の認識の難易度のバランスが悪い場合、また、ラベル毎の学習の習熟度のバランスが悪い場合にも、同様に、その結果、認識装置において、認識性能が低下する。

　本開示の態様は、このような問題を解決し、上記のように、ラベル毎の学習特性に偏りがある場合においても、一定の認識性能を維持することができるように、学習することができる学習装置、学習方法及び学習プログラム、及び、一定の認識性能を維持することができる認識装置、認識方法及び認識プログラム、並びに学習認識装置を提供することを目的とする。

　上記目的を達成するため、本開示の一態様は、ニューラルネットワークに学習をさせる学習装置であって、教師データ及び対応する複数の教師ラベルを取得する取得手段と、前記教師データについて、前記教師ラベル毎に推論誤差を算出するように前記ニューラルネットワークを制御する制御手段と、教師ラベル毎に算出された前記推論誤差を、前記教師ラベル毎に、当該教師ラベルの学習特性に基づいて設定された加重値により補正して補正推論誤差を算出する補正手段とを備え、前記制御手段は、前記教師ラベル毎の補正推論誤差が小さくなっていくように、前記ニューラルネットワークに繰り返し作用させる。

　また、本開示の別の一態様は、ニューラルネットワークを用いて行う認識により、認識対象であるデータから複数のラベルを取得する認識装置であって、前記データを取得する取得手段と、前記データに対して、前記ラベル毎に推論結果を算出するように前記ニューラルネットワークを制御する制御手段と、前記ラベル毎の推論閾値に基づいて推論結果を出力するか否かを判断する判断手段とを備える。

　上記の態様によると、上記のように、ラベル毎の学習特性に偏りがある場合においても、一定の認識性能を維持することができるように、学習することができ、また、一定の認識性能を維持することができる、という優れた効果を奏する。

実施の形態としての学習認識装置１０の構成を示すブロック図である。典型的なニューラルネットワーク５０の構成を示すブロック図である。（ａ）ニューラルネットワーク５０の一つのニューロンＵを示す模式図である。（ｂ）ニューラルネットワーク５０に設定される各ニューロン加重値及びニューロン閾値を含むニューロン設定テーブル４９０である。ニューラルネットワーク５０における事前学習（訓練）の際のデータの伝搬モデルを模式的に示す図である。ニューラルネットワーク５０における実地推論の際のデータの伝搬モデルを模式的に示す図である。画像データ２０１の特性を示す複数のカテゴリーの例を示す。訓練データＤＢ１５１に記憶されている訓練用の画像データの例を示す。訓練データＤＢ１５１に記憶されている訓練データテーブル２３０のデータ構造を示す。パラメーターＤＢ１５２に記憶されている頻度テーブル２５０のデータ構造を示す。パラメーターＤＢ１５２に記憶されている難易度テーブル２６０のデータ構造を示す。パラメーターＤＢ１５２に記憶されている習熟度テーブル２７０のデータ構造を示す。パラメーターＤＢ１５２に記憶されている欠落情報テーブル２９０のデータ構造を示す。カテゴリー内の各ラベルについて算出されるラベル加重値ＬＷの例を示す。カテゴリー内の各ラベルについて算出される推論閾値Ｔの例を示す。訓練認識処理部１２４及び実地認識処理部１２５の構成を示すブロック図である。特徴学習部１３３の構成を示すブロック図である。推論結果２８０のデータ構造を示す。推論誤差ｄにラベル加重値ＬＷを乗じて補正推論誤差ｄ’を得るプロセスを示す。推論部１４３の構成を示すブロック図である。推論結果Ｒから、推論閾値に基づいて推論誤差Ｒ’を得るプロセスを示す。一例としての最終認識結果４４０を示す。訓練認識処理部１２４における動作を示すフローチャートである。実地認識処理部１２５における動作を示すフローチャートである。各推論対象物について設定されるべきカテゴリーのパターンを示す。

　１　実施の形態
　本開示に係る一の実施の形態としての学習認識装置１０について図面を参照しながら説明する。

　１．１　学習認識装置１０
　学習認識装置１０は、図１に示すように、バスＢ１に接続されたＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１０１、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１０２、ＲＡＭ（Ｒａｎｄｏｍ　ａｃｃｅｓｓ　ｍｅｍｏｒｙ）１０３、記憶部１０４及びネットワーク通信回路１１１と、バスＢ２に接続されたＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１０５、ＲＯＭ１０６、ＲＡＭ１０７と、バスＢ３に接続されたＧＰＵ１０８、ＲＯＭ１０９、ＲＡＭ１１０とから構成されている。バスＢ１とバスＢ２は、相互に接続され、バスＢ１とバスＢ３も、相互に接続されている。

　（ＣＰＵ１０１、ＲＯＭ１０２、ＲＡＭ１０３）
　ＲＡＭ１０３は、不揮発性の半導体メモリから構成されており、ＣＰＵ１０１によるプログラム実行時のワークエリアを提供する。

　ＲＯＭ１０２には、学習認識装置１０における処理を実行させるためのコンピュータープログラムである制御プログラム等が格納されている。

　ＣＰＵ１０１は、ＲＯＭ１０２に記憶されている制御プログラムに従って動作する。

　ＣＰＵ１０１が、ＲＡＭ１０３をワークエリアとして用いて、ＲＯＭ１０２に記憶されている制御プログラムに従って動作することにより、ＣＰＵ１０１、ＲＯＭ１０２及びＲＡＭ１０３は、主制御部１２１を構成する。

　主制御部１２１は、統括制御部１２２、パラメーター取得部１２３及び推論結果出力部１２６を含む。

　統括制御部１２２は、学習認識装置１０全体を統括的に制御する。

　パラメーター取得部１２３及び推論結果出力部１２６については、後述する。

　（ネットワーク通信回路１１１）
　ネットワーク通信回路１１１は、ネットワークを介して、外部の情報端末に接続されている。ネットワーク通信回路１１１は、ネットワークを介して、外部の情報端末との間で、情報の送受信を中継する。

　（ＧＰＵ１０５、ＲＯＭ１０６、ＲＡＭ１０７）
　ＲＡＭ１０７は、不揮発性の半導体メモリから構成されており、ＧＰＵ１０５によるプログラム実行時のワークエリアを提供する。

　ＲＯＭ１０６には、後述する訓練認識処理部１２４における処理を実行させるためのコンピュータープログラムである制御プログラム等が格納されている。この制御プログラムの一部は、学習プログラムを構成している。

　ＧＰＵ１０５は、ＲＯＭ１０６に記憶されている制御プログラムに従って動作する。

　ＧＰＵ１０５が、ＲＡＭ１０７をワークエリアとして用いて、ＲＯＭ１０６に記憶されている制御プログラムに従って動作することにより、ＧＰＵ１０５、ＲＯＭ１０６及びＲＡＭ１０７は、訓練認識処理部１２４を構成する。

　訓練認識処理部１２４には、ニューラルネットワークが組み込まれている。

　訓練認識処理部１２４に組み込まれているニューラルネットワークは、ＧＰＵ１０５が、ＲＯＭ１０６に記憶されている制御プログラムに従って動作することにより、その機能を果たす。

　（ＧＰＵ１０８、ＲＯＭ１０９、ＲＡＭ１１０）
　ＲＡＭ１１０は、不揮発性の半導体メモリから構成されており、ＧＰＵ１０８によるプログラム実行時のワークエリアを提供する。

　ＲＯＭ１０９には、後述する実地認識処理部１２５における処理を実行させるためのコンピュータープログラムである制御プログラム等が格納されている。この制御プログラムの一部は、認識プログラムを構成している。

　ＧＰＵ１０８は、ＲＯＭ１０９に記憶されている制御プログラムに従って動作する。

　ＧＰＵ１０８が、ＲＡＭ１１０をワークエリアとして用いて、ＲＯＭ１０９に記憶されている制御プログラムに従って動作することにより、ＧＰＵ１０８、ＲＯＭ１０９及びＲＡＭ１１０は、実地認識処理部１２５を構成する。

　実地認識処理部１２５には、ニューラルネットワークが組み込まれている。

　実地認識処理部１２５に組み込まれているニューラルネットワークは、ＧＰＵ１０８が、ＲＯＭ１０９に記憶されている制御プログラムに従って動作することにより、その機能を果たす。

　（記憶部１０４）
　記憶部１０４は、一例として、ハードディスクから構成されている。もちろん、記憶部１０４は、不揮発性の半導体メモリから構成されている、としてもよい。

　記憶部１０４は、図１に示すように、訓練データＤＢ１５１、パラメーターＤＢ１５２、学習結果ＤＢ１５３及び実地データＤＢ１５４を有している。

　訓練データＤＢ１５１、パラメーターＤＢ１５２、学習結果ＤＢ１５３及び実地データＤＢ１５４については、後述する。

　ここで、主制御部１２１、記憶部１０４、訓練認識処理部１２４及びネットワーク通信回路１１１は、学習装置を構成している。また、主制御部１２１、記憶部１０４、実地認識処理部１２５及びネットワーク通信回路１１１は、認識装置を構成している。

　１．２　典型的なニューラルネットワーク
　典型的なニューラルネットワークの一例として、図２に示すニューラルネットワーク５０について、説明する。

　（１）ニューラルネットワーク５０の構造
　ニューラルネットワーク５０は、この図に示すように、入力層５０ａ、特徴抽出層５０ｂ及び認識層５０ｃを有する階層型のニューラルネットワークである。

　ここで、ニューラルネットワークとは、人間の神経ネットワークを模倣した情報処理システムのことである。ニューラルネットワーク５０において、神経細胞に相当する工学的なニューロンのモデルを、ここではニューロンＵと呼ぶ。入力層５０ａ、特徴抽出層５０ｂ及び認識層５０ｃは、それぞれ複数のニューロンＵを有して構成されている。

　入力層５０ａは、通常、１層からなる。入力層５０ａの各ニューロンＵは、例えば１枚の画像を構成する各画素の画素値をそれぞれ受信する。受信した画像値は、入力層５０ａの各ニューロンＵから特徴抽出層５０ｂにそのまま出力される。

　特徴抽出層５０ｂは、入力層５０ａから受信したデータ（１枚の画像を構成する全ての画素値）から特徴を抽出して認識層５０ｃに出力する。この特徴抽出層５０ｂは、各ニューロンＵでの演算により、例えば、受信した画像から車両が映っている領域を抽出する。

　認識層５０ｃは、特徴抽出層５０ｂにより抽出された特徴を用いて識別を行う。認識層５０ｃは、各ニューロンＵでの演算により、例えば、特徴抽出層５０ｂにおいて抽出された車両の領域から、その車両の車種、メーカー名、色等のラベルを識別する。

　ニューロンＵとして、通常、図３（ａ）に示すように、多入力１出力の素子が用いられる。信号は一方向にだけ伝わり、入力された信号ｘｉ（ｉ＝１、２、・・・、ｎ）に、あるニューロン加重値（ＳＵｗｉ）が乗じられて、ニューロンＵに入力される。このニューロン加重値によって、階層的に並ぶニューロンＵ－ニューロンＵ間の結合の強さが表される。ニューロン加重値は、学習によって変化させることができる。ニューロンＵからは、ニューロン加重値ＳＵｗｉが乗じられたそれぞれの入力値（ＳＵｗｉ×ｘｉ）の総和からニューロン閾値θＵを引いた値Ｘが応答関数ｆ（Ｘ）による変形を受けた後、出力される。つまり、ニューロンＵの出力値ｙは、以下の数式で表される。

　ｙ＝ｆ（Ｘ）
　ここで、
Ｘ＝Σ（ＳＵｗｉ×ｘｉ）－θＵ
である。また、Σは、ｉ＝１、２、３、・・・、ｎについての総和を示す。なお、応答関数としては、例えば、シグモイド関数を用いることができる。

　入力層５０ａの各ニューロンＵは、通常、シグモイド特性やニューロン閾値をもたない。それゆえ、入力値がそのまま出力に表れる。一方、認識層５０ｃの最終層（出力層）の各ニューロンＵは、認識層５０ｃでの識別結果（識別されたラベルに対応するデータ）を出力することになる。

　ニューラルネットワーク５０の学習アルゴリズムとしては、例えば、正解を示す値（データ）と認識層５０ｃからの出力値（データ）との２乗誤差が最小となるように、最急降下法を用いて認識層５０ｃのニューロン加重値等及び特徴抽出層５０ｂのニューロン加重値等を順次変化させていく誤差逆伝播法（バックプロパゲーション）が用いられる。

　（２）訓練工程
　ニューラルネットワーク５０における訓練工程について説明する。

　訓練工程は、ニューラルネットワーク５０の事前学習を行う工程である。訓練工程では、事前に入手した正解付き（教師あり、アノテーションあり）の画像データを用いて、ニューラルネットワーク５０の事前学習を行う。

　図４に、事前学習の際のデータの伝播モデルを模式的に示している。

　画像データは、画像１枚毎に、ニューラルネットワーク５０の入力層５０ａに入力され、入力層５０ａから特徴抽出層５０ｂに出力される。特徴抽出層５０ｂの各ニューロンＵでは、入力データに対してニューロン加重値付きの演算が行われる。この演算により、特徴抽出層５０ｂでは、入力データから特徴（例えば、車両の領域）が抽出されるとともに、抽出した特徴を示すデータが、認識層５０ｃに出力される（ステップＳ５１）。

　認識層５０ｃの各ニューロンＵでは、入力データに対するニューロン加重値付きの演算が行われる（ステップＳ５２）。これによって、上記特徴に基づく識別（例えば、車種の識別）が行われる。識別結果を示すデータは、認識層５０ｃから出力される。

　認識層５０ｃの出力値（データ）は、正解を示す値と比較され、これらの誤差（ロス）が算出される（ステップＳ５３）。この誤差が小さくなるように、認識層５０ｃのニューロン加重値等及び特徴抽出層５０ｂのニューロン加重値等を順次変化させる（バックプロパゲーション）（ステップＳ５４）。これにより、認識層５０ｃ及び特徴抽出層５０ｂを学習させる。

　（３）実地認識工程
　ニューラルネットワーク５０における実地認識工程について説明する。

　図５は、上記の訓練工程によって学習されたニューラルネットワーク５０を用い、現場で得られたデータを入力として実際に認識（例えば、車両の車種の認識）を行う場合のデータの伝播モデルを示している。

　ニューラルネットワーク５０における実地認識工程においては、学習された特徴抽出層５０ｂと、学習された認識層５０ｃとを用いて、特徴抽出及び認識が行われる（ステップＳ５５）。

　１．３　認識対象の画像データ及びそのカテゴリーの例示
　図６に、一例として、学習認識装置１０において扱う認識対象である画像データ２０１を示す。画像データ２０１は、一枚の画像を表し、その画像は、複数の画素が行列状に配されて構成されている。画像データ２０１が表す画像には、一例として、車両のオブジェクト及びその背景のオブジェクトが含まれている。なお、背景のオブジェクトについては、図示を省略している。

　画像データ２０１から認識されるラベルは、この図に示すように、カテゴリー２１１、２１２、２１３、・・・、２１８に分類される。カテゴリー２１１、２１２、２１３、・・・、２１８は、それぞれ、「車種」、「メーカー」、「色」、・・・、「安定走行」である。

　ここで、「車種」のカテゴリー２１１には、ラベル２１１ａ、２１１ｂ、２１１ｃ、２１１ｄが属し、ラベル２１１ａ、２１１ｂ、２１１ｃ、２１１ｄは、それぞれ、「乗用車」、「トラック」、「バス」、「二輪車」である。

　また、「メーカー」のカテゴリー２１２には、ラベル２１２ａ、２１２ｂ、２１２ｃ、２１２ｄが属し、ラベル２１２ａ、２１２ｂ、２１２ｃ、２１２ｄは、それぞれ、「Ａ社」、「Ｂ社」、「Ｃ社」、「Ｄ社」である。

　その他、カテゴリー２１３、２１４、・・・、２１８のそれぞれにも、複数のラベルが属する。

　本実施の形態においては、画像には、車両のオブジェクトが含まれており、図６のカテゴリーに分類され、各カテゴリーには、同図のラベルが属するものとする。

　１．４　訓練データＤＢ１５１
　訓練データＤＢ１５１は、訓練データテーブル２３０及び複数の画像データ２２１、２２２、２２３、・・・を保持している。

　（画像データ２２１、２２２、２２３、・・・）
　画像データ２２１、２２２、２２３、・・・は、それぞれ、訓練データ（教師データ）としての画像データである。

　図７に示すように、画像データ２２１、２２２、２２３、・・・には、それぞれ、例えば、車両のオブジェクト及び背景のオブジェクトが含まれている。なお、背景のオブジェクトについては、図示を省略している。具体的には、画像データ２２１には、乗用車のオブジェクト等が含まれ、画像データ２２２には、トラックのオブジェクト等が含まれ、画像データ２２３には、乗用車のオブジェクト等が含まれ、画像データ２２４には、バスのオブジェクト等が含まれている。

　また、画像データ２２１、２２２、２２３、・・・は、それぞれ、画像データ識別子により識別される。例えば、画像データ２２１の識別子は、「Ａ００１．ｊｐｇ」であり、画像データ２２２の識別子は、「Ａ００２．ｊｐｇ」であり、画像データ２２３の識別子は、「Ａ００３．ｊｐｇ」である。

　（訓練データテーブル２３０）
　訓練データテーブル２３０は、訓練データＤＢ１５１に保持されている画像データ２２１、２２２、２２３、・・・について、予め設定された訓練ラベル（教師ラベル）を示すためのデータテーブルである。

　訓練データテーブル２３０は、図８に示すように、複数の訓練データ２３１を含んでいる。各訓練データ２３１は、訓練データＤＢ１５１に保持されている画像データと、一対一に対応している。

　各訓練データ２３１は、画像データ識別子２３２及び訓練ラベル２３３、２３４、・・・、２３９を含む。

　画像データ識別子２３２は、訓練データ２３１に対応する画像データを識別する識別子である。

　訓練ラベル２３３、２３４、・・・、２３９は、それぞれ、訓練データ２３１に対応する画像データにより表される画像内に含まれる車両のオブジェクトについてのラベルである。訓練ラベル２３３、２３４、・・・、２３９の中には、ラベルが設定されていないもの（「－」で示す）も存在する。

　訓練ラベル２３３は、車両に対するカテゴリーの一つである「車種」についてのラベルを示す。「車種」である訓練ラベル２３３には、例えば、「乗用車」、「トラック」、「バス」、「二輪車」等が含まれる。

　訓練ラベル２３４は、車両に対するカテゴリーの一つである「メーカー」についてのラベルを示す。「メーカー」である訓練ラベル２３４には、例えば、「Ａ社」、「Ｂ社」、「Ｃ社」、「Ｄ社」等が含まれる。

　訓練ラベル２３５は、車両に対するカテゴリーの一つである車体の「色」についてのラベルを示す。「色」である訓練ラベル２３５には、例えば、「白」、「黒」、「青」、「赤」等が含まれる。

　訓練ラベル２３６は、車両に対するカテゴリーの一つである「乗車人数」についてのラベルを示す。「乗車人数」である訓練ラベル２３６には、例えば、「一人」、「複数人」が含まれる。

　訓練ラベル２３７は、車両に対するカテゴリーの一つである「積載荷物量」についてのラベルを示す。「積載荷物量」である訓練ラベル２３７には、例えば、「なし」、「積み荷小」、「積み荷大」等が含まれる。

　訓練ラベル２３８は、車両に対するカテゴリーの一つである「他車との車間距離」についてのラベルを示す。「他車との車間距離」である訓練ラベル２３８には、例えば、「狭い傾向」、「適切」等が含まれる。

　訓練ラベル２３９は、車両に対するカテゴリーの一つである「走行スピード」についてのラベルを示す。「走行スピード」である訓練ラベル２３９には、例えば、「遅すぎる」、「法定速度内」、「速すぎる」等が含まれる。

　１．５　パラメーターＤＢ１５２
　パラメーターＤＢ１５２は、頻度テーブル２５０、難易度テーブル２６０、習熟度テーブル２７０及び欠落情報テーブル２９０を保持している。

　（１）頻度テーブル２５０
　頻度テーブル２５０は、図６に示すカテゴリーとラベル毎に、訓練データＤＢ１５１に保持されている訓練データの頻度（保持数）を記憶するためのデータテーブルである。

　頻度テーブル２５０は、図９に示すように、複数の頻度情報２５１を含んでいる。

　各頻度情報２５１は、図６に示すカテゴリーと、そのカテゴリーに属するラベルに対応している。各頻度情報２５１は、カテゴリー２５２、ラベル２５３及び頻度２５４を含んでいる。

　カテゴリー２５２は、図６に示す一つのカテゴリーに対応している。

　ラベル２５３は、カテゴリー２５２に属する一つのラベルに対応している。

　頻度２５４は、カテゴリー２５２及びラベル２５３の組合せの、訓練データテーブル２３０内における出現頻度である。

　（２）難易度テーブル２６０
　難易度テーブル２６０は、図６に示すカテゴリーとラベル毎に、訓練データＤＢ１５１に保持されている訓練データの難易度を記憶するためのデータテーブルである。

　難易度テーブル２６０は、図１０に示すように、複数の難易度情報２６１を含んでいる。

　各難易度情報２６１は、図６に示すカテゴリーと、そのカテゴリーに属するラベルに対応している。各難易度情報２６１は、カテゴリー２６２、ラベル２６３及び難易度２６４を含んでいる。

　カテゴリー２６２は、図６に示す一つのカテゴリーに対応している。

　ラベル２６３は、カテゴリー２６２に属する一つのラベルに対応している。

　難易度２６４は、カテゴリー２６２及びラベル２６３の組合せに対する認識の難易度である。

　例えば、カテゴリー「車種」については、画像内の車両の形状により、認識が可能であるので、難易度は、概して、低いと言える。

　また、カテゴリー「メーカー」については、例えば、画像内の車両に付されたエンブレムの形状を明確に認識できれば、その「メーカー」を認識することも可能である。しかし、例えば、走行中の車両を、遠方から撮影した場合、車両の上方から撮影した場合、悪天候の中で撮影した場合又は夜間に撮影した場合等においては、エンブレムの形状の認識は、困難となることが多い。このため、カテゴリー「メーカー」については、難易度は、中程度であるとしてもよい。

　また、カテゴリー「色」についても、画像内の車両の色により、認識が可能であるので、難易度は、概して、低いと言える。

　一方、カテゴリー「安定走行」のラベル「フラツキ多」については、画像により車両のフラツキを認識するので、難易度は、概して、高いと言える。また、カテゴリー「安定走行」のラベル「車線内走行」については、画像により車両が車線内を走行しているかを認識することにより得られるので、難易度は、中程度であると言える。

　このように、難易度は、ラベルにより、様々である。ここでは、一例として、難易度を「低」、「中」、「高」の３段階に分類し、「低」、「中」、「高」のそれぞれについて、難易度を、「３」、「２」、「１」に設定している。

　ここで、カテゴリー２６２及びラベル２６３の組合せ毎の難易度２６４は、例えば、学習認識装置１０の使用者により設定されたものである、としてもよい。

　（３）習熟度テーブル２７０
　習熟度テーブル２７０は、図６に示すカテゴリーとラベル毎に、訓練データＤＢ１５１に保持されている訓練データの習熟度を記憶するためのデータテーブルである。

　習熟度テーブル２７０は、図１１に示すように、複数の習熟度情報２７１を含んでいる。

　各習熟度情報２７１は、図６に示すカテゴリーと、そのカテゴリーに属するラベルに対応している。各習熟度情報２７１は、カテゴリー２７２、ラベル２７３及び習熟度２７４を含んでいる。

　カテゴリー２７２は、図６に示す一つのカテゴリーに対応している。

　ラベル２７３は、カテゴリー２７２に属する一つのラベルに対応している。

　習熟度２７４は、カテゴリー２７２及びラベル２７３の組合せについての学習の習熟度である。

　習熟度は、ラベルにより、様々である。ここでは、一例として、習熟度を「低」、「中」、「高」の３段階に分類し、「低」、「中」、「高」のそれぞれについて、習熟度を、「１」、「２」、「３」に設定している。

　ここで、カテゴリー２７２及びラベル２７３の組合せ毎の習熟度２７４は、例えば、学習認識装置１０の使用者により設定されたものである、としてもよい。

　（４）欠落情報テーブル２９０
　訓練データＤＢ１５１に保持されている画像データの中には、図６に示す複数のカテゴリーのうち、いずれかのカテゴリーを推論するための画像が含まれないものもある。

　例えば、静止した車両の外観を写した画像の場合、この画像を分析すると、その車種や色を推論することはできても、走行スピードに関する情報や、安定走行に関する情報を得ることができない。

　また、走行中の車両の速度計を写した画像の場合、その車種や色を推論することはできないけれども、走行スピードに関する情報を得ることができる。

　このように、訓練データＤＢ１５１に保持されている画像データの中には、図６に示す複数のカテゴリーのうちのいずれかのカテゴリーであることを推論することが、不可能な画像データが含まれ得る。

　欠落情報テーブル２９０は、このように、訓練データＤＢ１５１に保持されている画像データのうち、図６に示す複数のカテゴリーのうちのいずれかのカテゴリーであることを推論することが、不可能な画像データについて、その推論不可能なカテゴリーを示す。

　欠落情報テーブル２９０は、図１２に示すように、複数の欠落情報２９１を含んでいる。

　各欠落情報は、上述したように、訓練データＤＢ１５１に保持されている画像データのうち、図６に示す複数のカテゴリーのうちのいずれかのカテゴリーであることを推論することが、不可能な画像データに対応している。

　各欠落情報２９１は、画像データ識別子２９２及び複数のカテゴリー２９３、２９４、２９５、・・・を含む。

　画像データ識別子２９２は、訓練データＤＢ１５１に保持されている画像データのうち、図６に示す複数のカテゴリーのうちのいずれかのカテゴリーであることを推論することが、不可能な画像データを識別する識別子である。

　カテゴリー２９３、２９４、２９５、・・・は、図６に示す複数のカテゴリーのうちのいずれかのカテゴリーであることを推論することが、不可能な画像データについて、当該推論が不可能なカテゴリーを示す。各欠落情報２９１には、一つ又は複数のカテゴリーが含まれる。

　上記のように、欠落情報テーブル２９０は、カテゴリー単位で、欠落情報を含んでいる。しかし、これには、限定されない。欠落情報テーブル２９０は、カテゴリー内のラベル単位で、欠落情報を含むとしてもよい。

　例えば、カテゴリー「安定走行」のうち、ラベル「車線内走行」について、画像データからそのラベルを推論することが可能であるが、ラベル「フラツキ多」について、画像データからそのラベルを推論することが不可能である場合、欠落情報テーブル２９０は、カテゴリー「安定走行」のうち、ラベル「フラツキ多」を含む、としてもよい。

　ここで、欠落情報テーブル２９０の各欠落情報は、例えば、学習認識装置１０の使用者により設定されたものである、としてもよい。

　１．６　実地データＤＢ１５４
　実地データＤＢ１５４は、図１に示すように、画像データ２８９を保持している。

　画像データ２８９は、学習認識装置１０において、認識処理の対象となる画像データである。

　１．７　学習結果ＤＢ１５３
　学習結果ＤＢ１５３は、図１に示すように、ニューロン設定テーブル４９０を保持している。

　ニューロン設定テーブル４９０は、図３（ｂ）に示すように、複数のニューロン情報４９１から構成されている。各ニューロン情報４９１は、訓練認識処理部１２４の後述する特徴抽出部１３２（図１５）及び後述する特徴学習部１３３のラベル推論部１３４（図１６）の各ニューロンＵに対応する。

　各ニューロン情報４９１は、ニューロン番号４９２、ニューロン加重値４９３及びニューロン閾値４９４を含んでいる。

　ニューロン番号４９２は、特徴抽出部１３２及びラベル推論部１３４の各ニューロンＵを識別する番号である。

　ニューロン加重値４９３及びニューロン閾値４９４は、それぞれ、上記の「１．２　ニューラルネット」において説明したニューロン加重値及びニューロン閾値である。

　１．８　パラメーター取得部１２３
　パラメーター取得部１２３は、図６に示す全てのカテゴリー内の全てのラベルのそれぞれについて、頻度テーブル２５０から頻度情報を読み出し、難易度テーブル２６０から難易度情報を読み出し、習熟度テーブル２７０から習熟度情報を読み出す。

　また、パラメーター取得部１２３は、欠落情報テーブル２９０から欠落情報（欠落ラベル）を読み出す。

　（ラベル加重値ＬＷの算出）
　パラメーター取得部１２３（算出手段）は、読み出した頻度情報、難易度情報及び習熟度情報を用いて、つまり、教師ラベルの学習特性に基づいて、各カテゴリー内の各ラベルについて、ラベル加重値ＬＷを算出する。

　例えば、パラメーター取得部１２３は、頻度が高ければ、より低いラベル加重値ＬＷを算出し、頻度が低ければ、より高いラベル加重値ＬＷを算出してもよい。また、パラメーター取得部１２３は、難易度が低ければ、より低いラベル加重値ＬＷを算出し、難易度が高ければ、より高いラベル加重値ＬＷを算出してもよい。さらに、パラメーター取得部１２３は、習熟度が高ければ、より低いラベル加重値ＬＷを算出し、習熟度が低ければ、より高いラベル加重値ＬＷを算出してもよい。

　また、例えば、パラメーター取得部１２３は、次の式により、ラベル加重値ＬＷを算出してもよい。

　ラベル加重値ＬＷ＝Ｇ（α×（頻度）＋β×（難易度）＋γ×（習熟度））
　ここで、Ｇ（ｘ）は、例えば、Ｇ（ｘ）＝１／ｘであり、α、β及びγは、それぞれ、頻度、難易度及び習熟度に応じて、設定された係数である。α、β及びγは、０＜ラベル加重値ＬＷ＜１となるように、設定される。

　図１３に、各カテゴリー及び各ラベルについて算出されたラベル加重値ＬＷの例を示す。

　この図に示すように、カテゴリー３０１「車種」内のラベル３１１「乗用車」、ラベル３１２「トラック」、ラベル３１３「バス」、・・・、ラベル３１４「二輪車」について、ラベル加重値ＬＷ３１１ａ、３１２ａ、３１３ａ、・・・、３１４ａが算出される。

　また、カテゴリー３２１「色」内のラベル３３１「黒」、ラベル３３２「白」、ラベル３３３「青」、・・・、ラベル３３４「ピンク」について、ラベル加重値ＬＷ３３１ａ、３３２ａ、３３３ａ、・・・、３３４ａが算出される。

　なお、パラメーター取得部１２３は、ラベル加重値ＬＷの算出において、頻度情報のみを用いてもよいし、難易度情報のみを用いてもよいし、習熟度情報のみを用いてもよい。また、パラメーター取得部１２３は、ラベル加重値ＬＷの算出において、頻度情報、難易度情報及び習熟度情報のうちのいずれか二つの組合せを用いてよい。

　パラメーター取得部１２３は、各カテゴリー及び各ラベルについて算出したラベル加重値ＬＷを、訓練認識処理部１２４の後述する特徴学習部１３３に対して、出力する。

　（推論閾値の算出）
　パラメーター取得部１２３（閾値取得出手段）は、読み出した頻度情報、難易度情報及び習熟度情報を用いて、つまり、教師ラベルの学習特性に基づいて、各カテゴリー内の各ラベルについて、推論閾値Ｔを算出する。

　例えば、パラメーター取得部１２３は、頻度が高ければ、より低い推論閾値Ｔを算出し、頻度が低ければ、より高い推論閾値Ｔを算出してもよい。また、パラメーター取得部１２３は、難易度が低ければ、より低い推論閾値Ｔを算出し、難易度が高ければ、より高い推論閾値Ｔを算出してもよい。さらに、パラメーター取得部１２３は、習熟度が高ければ、低い推論閾値Ｔを算出し、習熟度が低ければ、より高い推論閾値Ｔを算出してもよい。

　また、例えば、パラメーター取得部１２３は、次の式により、推論閾値Ｔを算出してもよい。

　推論閾値Ｔ＝Ｇ（δ×（頻度）＋ε×（難易度）＋ζ×（習熟度））
　ここで、Ｇ（ｘ）は、上記の通り、例えば、Ｇ（ｘ）＝１／ｘであり、δ、ε及びζは、それぞれ、頻度、難易度及び習熟度に応じて、設定された係数である。δ、ε及びζは、０＜推論閾値Ｔ＜１となるように、設定される。

　図１４に、各カテゴリー及び各ラベルについて算出された推論閾値Ｔの例を示す。

　この図に示すように、カテゴリー３６１「車種」内のラベル３７１「乗用車」、ラベル３７２「トラック」、ラベル３７３「バス」、・・・、ラベル３７４「二輪車」について、推論閾値Ｔ３７１ａ、３７２ａ、３７３ａ、・・・、３７４ａが算出される。

　また、カテゴリー３８１「色」内のラベル３９１「黒」、ラベル３９２「白」、ラベル３９３「青」、・・・、ラベル３９４「ピンク」について、推論閾値Ｔ３９１ａ、３９２ａ、３９３ａ、・・・、３９４ａが算出される。

　図１４のカテゴリー３６１に示すように、カテゴリー３６１内のラベル毎に、推論閾値Ｔが異なっていてもよい。また、カテゴリー内の全てのラベルについて、推論閾値Ｔが同一であってもよい。さらに、同一カテゴリー内においては、全てのラベルについて、推論閾値Ｔが同一であり、カテゴリー毎に、推論閾値Ｔが異なっていてもよい。

　パラメーター取得部１２３は、各カテゴリー及び各ラベルについて算出した推論閾値Ｔを、実地認識処理部１２５の後述する推論部１４３に対して、出力する。

　１．９　訓練認識処理部１２４
　訓練認識処理部１２４は、図１５に示すように、制御部１３０、訓練データ入力部１３１、特徴抽出部１３２及び特徴学習部１３３から構成されている。

　（１）訓練データ入力部１３１
　訓練データ入力部１３１（取得手段）は、図２に示すニューラルネットワーク５０の入力層５０ａに相当する。訓練データ入力部１３１は、訓練データＤＢ１５１に記憶されている一つの画像データを読み出す。また、読み出した画像データに対応する訓練データを、訓練データテーブル２３０から読み出す。

　訓練データ入力部１３１は、読み出した画像データを、特徴抽出部１３２に対して、出力する。また、訓練データ入力部１３１は、読み出した訓練データを、特徴学習部１３３に対して、出力する。

　（２）特徴抽出部１３２
　特徴抽出部１３２は、図２に示すニューラルネットワーク５０の特徴抽出層５０ｂに相当する。特徴抽出部１３２は、訓練データ入力部１３１から、画像データを受け取る。特徴抽出部１３２は、受け取った画像データから特徴を抽出する。例えば、特徴抽出部１３２は、受け取った画像データを構成する画像内から、オブジェクトとして、車両が映っている領域を抽出する。特徴抽出部１３２は、抽出した特徴を特徴学習部１３３に対して、出力する。例えば、特徴抽出部１３２は、車両が映っている領域を特徴学習部１３３に対して、出力する。

　（３）特徴学習部１３３
　特徴学習部１３３は、図１６に示すように、ラベル推論部１３４、加重値付与部１３５及び推論誤差転送部１３６から構成されている。

　（ａ）ラベル推論部１３４
　ラベル推論部１３４は、図２に示すニューラルネットワーク５０の認識層５０ｃに相当する機能を含んでいる。ラベル推論部１３４は、特徴抽出部１３２から、例えば、車両が映っている領域を受信する。車両が映っている領域を受信すると、ラベル推論部１３４は、車両が映っている領域から、推論結果として、図６に示す全てのカテゴリー及びラベルについて、出現確率を算出する。

　図１７に、ラベル推論部１３４により生成される推論結果の一例として、推論結果２８０を示す。この図に示すように、推論結果２８０は、複数の推論結果情報２８１を含む。各推論結果情報２８１は、図６に示すカテゴリーに対応している。各推論結果情報２８１は、カテゴリー２８２及び一つ又は複数のラベル情報２８３を含む。

　ここで、カテゴリー２８２は、図６に示すカテゴリーである。

　各推論結果情報２８１に含まれるラベル情報２８３は、図６に示す一つのカテゴリーに属するラベルに対応している。ラベル情報２８３は、ラベル２８４及び出現確率２８５を含む。ラベル２８４は、一つのカテゴリーに属するラベルであり、出現確率２８５は、ラベル２８４について推論された出現確率である。

　次に、ラベル推論部１３４は、訓練データ入力部１３１から、訓練データを受信し、全てのカテゴリー及びラベルについて、算出した出現確率と、訓練データに含まれるラベルとの推論誤差ｄを算出する。ラベル推論部１３４は、算出した推論誤差ｄを加重値付与部１３５に対して、出力する。

　（ｂ）加重値付与部１３５
　加重値付与部１３５（補正手段）は、ラベル推論部１３４から、推論誤差ｄを受信する。また、加重値付与部１３５は、パラメーター取得部１２３から、ラベル加重値ＬＷを受信する。

　次に、加重値付与部１３５は、推論誤差ｄにラベル加重値ＬＷを乗じて、補正推論誤差ｄ’を算出する。

　補正推論誤差ｄ’＝推論誤差ｄ×ラベル加重値ＬＷ
　このように、加重値付与部１３５は、教師ラベル毎に算出された推論誤差を、ラベル加重値により補正して、補正推論誤差を算出する。

　上述したように、パラメーター取得部１２３は、例えば、頻度が高ければ、より低いラベル加重値ＬＷを算出し、頻度が低ければ、より高いラベル加重値ＬＷを算出する。また、パラメーター取得部１２３は、難易度が低ければ、より低いラベル加重値ＬＷを算出し、難易度が高ければ、より高いラベル加重値ＬＷを算出する。さらに、パラメーター取得部１２３は、習熟度が高ければ、より低いラベル加重値ＬＷを算出し、習熟度が低ければ、より高いラベル加重値ＬＷを算出する。

　このため、加重値付与部１３５は、例えば、頻度が高ければ、より小さい補正推論誤差を算出し、頻度が低ければ、より大きい補正推論誤差を算出する。従って、頻度が高い場合、より少ない回数のバックプロパゲーションの繰り返しにより、補正推論誤差が収束する。一方、頻度が低い場合、より多い回数のバックプロパゲーションの繰り返しにより、補正推論誤差が収束する。こうして、ラベルの頻度に応じて、ニューラルネットワークにおける学習度合を一定に維持し、その結果、認識性能を一定に維持することができる。

　また、加重値付与部１３５は、例えば、難易度が低ければ、より小さい補正推論誤差を算出し、難易度が高ければ、より大きい補正推論誤差を算出する。さらに、加重値付与部１３５は、例えば、習熟度が高ければ、より小さい補正推論誤差を算出し、習熟度が低ければ、より大きい補正推論誤差を算出する。これらの場合においても、ラベルの頻度の場合と同様、ラベルの難易度又は習熟度に応じて、ニューラルネットワークにおける学習度合を一定に維持し、その結果、認識性能を一定に維持することができる。

　このように、ラベルの特性（頻度、難易度、習熟度等）に応じて、推論誤差を補正することにより、ラベル毎の特性に偏りがある場合においても、一定の認識性能を維持することができるように、学習することができる。

　ここで、図１８に示すように、一つのラベル３５１ｄについて、推論誤差ｄ（３５１ａ）にラベル加重値ＬＷ（３５１ｂ）を乗じて、補正推論誤差ｄ’（３５１ｃ）が得られる。また、他のラベル３５２ｄ、３５３ｄ、・・・、３５４ｄについても、同様に、推論誤差ｄにラベル加重値ＬＷを乗じて、それぞれ、補正推論誤差ｄ’（３５２ｃ）、（３５３ｃ）、・・・、（３５４ｃ）が得られる。

　次に、加重値付与部１３５は、カテゴリー毎、ラベル毎に算出された補正推論誤差ｄ’を推論誤差転送部１３６に対して、出力する。

　（ｃ）推論誤差転送部１３６
　推論誤差転送部１３６は、加重値付与部１３５から、補正推論誤差ｄ’を受信する。

　推論誤差転送部１３６は、受信した補正推論誤差ｄ’を、特徴抽出部１３２及びラベル推論部１３４に対して、出力する。

　推論誤差転送部１３６は、受信する補正推論誤差ｄ’が、所定の収束閾値よりも小さくなるまで、受信した補正推論誤差ｄ’の、特徴抽出部１３２及びラベル推論部１３４に対する出力を、繰り返す。

　（ｄ）ニューロン加重値等の補正及び推論の繰返し
　上記のように、推論誤差及び補正推論誤差が、ラベル毎に計算され、全てのラベルについて、補正推論誤差が所定の収束閾値よりも小さくなるまで、ニューロン加重値及びニューロン閾値が補正され、推論が繰り返される。所定の収束閾値は、小さい値であり、望ましくは、ゼロである。つまり、補正推論誤差がゼロになるまで、ニューロン加重値及びニューロン閾値が補正され、推論が繰り返される。さらに、言い換えると、補正推論誤差が小さくなっていくように、ニューロン加重値及びニューロン閾値が補正され、推論が繰り返される。

　特徴学習部１３３は、ラベル毎に、補正推論誤差ｄ’と所定の収束閾値とを比較し、補正推論誤差ｄ’が所定の収束閾値より大きいか否かを判断する。

　補正推論誤差ｄ’が所定の収束閾値より大きいと判断される場合、ラベル推論部１３４は、ニューロン加重値及びニューロン閾値を補正する。次に、特徴学習部１３３は、ラベルの推論及びラベル加重値の付与の処理を繰り返す。

　一方、補正推論誤差ｄ’が所定の収束閾値より大きくないと判断される場合、特徴学習部１３３は、処理を終了する。

　例えば、図６に示すように、８個のカテゴリーのそれぞれに複数のラベルがあり、合計で４０ラベルあるとする。この場合、４０ラベルの全てにおいて、補正推論誤差ｄ’が小さくなるように学習を繰り返す。

　学習の収束の速度は、ラベル毎に異なる。例えば、カテゴリー「車種」の中に、「乗用車」、「トラック」、「バス」及び「二輪車」の４ラベルがあると仮定し、正解のラベルが「乗用車」であるとする。図１７に示す推論結果によると、正解である「乗用車」の出現確率は、「０．８」であるので、推論誤差は、１－０．８＝０．２となる。一方、「二輪車」は、不正解であるので、推論誤差は、０－０．０５＝－０．０５となる。どのラベルについても、推論誤差がゼロとなるように（限りなくゼロに近くなるように）、学習が繰り返される。

　（４）制御部１３０
　制御部１３０（制御手段）は、訓練データ入力部１３１、特徴抽出部１３２及び特徴学習部１３３を統一的に制御する。また、制御部１３０は、訓練データ入力部１３１、特徴抽出部１３２及び特徴学習部１３３を、それぞれ制御する。

　また、制御部１３０は、ニューラルネットワークの一部である特徴学習部１３３を制御して、教師ラベル毎に推論誤差を算出させる。

　また、制御部１３０は、教師ラベル毎の補正推論誤差が所定閾値より小さくなるように、ニューラルネットワークに繰り返し作用させる。

　また、制御部１３０は、複数の教師ラベルのうちのいずれかが、欠落情報テーブル２９０から読み出された欠落情報（欠落ラベル）と一致するか否かを判断する。一致すると判断する場合、制御部１３０は、ニューラルネットワークに対する繰り返し作用を抑制する。

　１．１０　欠落情報の処理
　図１２に示す欠落情報テーブル２９０に含まれる欠落情報についての処理について、説明する。

　欠落情報テーブル２９０に含まれる欠落情報のうち、例えば、画像データ識別子が「Ａ００１．ｊｐｇ」である場合、欠落しているカテゴリーには、「安定走行」が含まれる。一方、カテゴリー「車種」、カテゴリー「メーカー」は、含まれていない。

　上述した通り、ラベル毎に推論誤差（補正推論誤差）が計算されるので、カテゴリー「車種」の４つのラベル「乗用車」、「トラック」、「バス」、「二輪車」において、推論誤差が計算される。また、カテゴリー「メーカー」の４つのラベル「Ａ社」、「Ｂ社」、「Ｃ社」及び「Ｄ社」においても、推論誤差が計算される。

　一方、カテゴリー「安定走行」に、２つのラベル「フラツキ多」及び「車線内走行中」が存在し、これらの２つのラベルが欠落情報である場合、特徴学習部１３３は、この２つのラベルについて、推論誤差の伝搬を停止し、伝播させない。

　このように、カテゴリー「安定走行」中、２つのラベル「フラツキ多」及び「車線内走行中」について、欠落情報である場合、結果的には、カテゴリー「安定走行」が欠落情報となる。

　また、訓練データの量のバランスが悪い場合、ラベル毎に、欠落の処理の加重値を付けることもできる。例えば、訓練データの中に、カテゴリー「色」についてのラベル「白」が多く存在する場合、車両の色が「白」である車体が写っている複数の画像データのうち、例えば、１０個の画像データのうち、１個の画像データについて、推論誤差の伝搬を停止し、伝播させない、としてもよい。

　１．１１　実地認識処理部１２５
　実地認識処理部１２５は、図１５に示すように、制御部１４０、実地データ入力部１４１、特徴抽出部１４２及び推論部１４３から構成されている。

　（１）実地データ入力部１４１
　実地データ入力部１４１（取得手段）は、図２に示すニューラルネットワーク５０の入力層５０ａに相当する。実地データ入力部１４１は、実地データＤＢ１５４に記憶されている画像データ２８９を読み出す。実地データ入力部１４１は、読み出した画像データ２８９を、特徴抽出部１４２に対して、出力する。

　（２）特徴抽出部１４２
　特徴抽出部１４２は、図２に示すニューラルネットワーク５０の特徴抽出層５０ｂに相当する。特徴抽出部１４２は、特徴の抽出に先立って、学習結果ＤＢ１５３に保持されているニューロン設定テーブル４９０から、特徴抽出部１４２に相応するニューロン加重値及びニューロン閾値を取得し、取得したニューロン加重値及びニューロン閾値を内部に設定する。

　また、特徴抽出部１４２は、実地データ入力部１４１から、画像データを受け取る。特徴抽出部１４２は、受け取った画像データから特徴を抽出する。例えば、特徴抽出部１４２は、受け取った画像データを構成する画像内から、オブジェクトとして、車両が映っている領域を抽出する。特徴抽出部１４２は、抽出した特徴を推論部１４３に対して、出力する。例えば、特徴抽出部１４２は、車両が映っている領域を推論部１４３に対して、出力する。

　（３）推論部１４３
　推論部１４３は、図１９に示すように、ラベル推論部１４４、推論結果調整部１４５及び推論結果転送部１４６から構成されている。

　（ａ）ラベル推論部１４４
　ラベル推論部１４４は、図２に示すニューラルネットワーク５０の認識層５０ｃに相当する機能を含んでいる。

　ラベル推論部１４４は、ラベルの推論に先立って、学習結果ＤＢ１５３に保持されているニューロン設定テーブル４９０から、ラベル推論部１４４に相応するニューロン加重値及びニューロン閾値を取得し、取得したニューロン加重値及びニューロン閾値を内部に設定する。

　また、ラベル推論部１４４は、特徴抽出部１４２から、例えば、車両が映っている領域を受信する。車両が映っている領域を受信すると、ラベル推論部１４４は、車両が映っている領域から、推論結果Ｒとして、全てのカテゴリー及びラベルについて、出現確率を算出する。

　推論結果Ｒの例を図２０に示す。この図に示すように、推論結果Ｒは、カテゴリー４０１内の全てのラベル４０２、４０３、４０４、・・・について、それぞれ、出現確率４０２ａ、４０３ａ、４０４ａ、・・・を含み、カテゴリー４１１内の全てのラベル４１２、４１３、４１４、・・・について、それぞれ、出現確率４１２ａ、４１３ａ、４１４ａ、・・・を含み、・・・、カテゴリー４２１内の全てのラベル４２２、・・・について、出現確率４２２ａ、・・・を含む。

　ラベル推論部１４４は、推論結果Ｒを推論結果調整部１４５に対して、出力する。

　（ｂ）推論結果調整部１４５
　推論結果調整部１４５は、ラベル推論部１４４から、推論結果Ｒを受信する。また、推論結果調整部１４５は、パラメーター取得部１２３から、全てのカテゴリー内の全てのラベルについて、推論閾値Ｔを受信する。

　推論結果調整部１４５（判断手段）は、各カテゴリーの各ラベルについて、推論結果Ｒ内の出現確率と推論閾値Ｔとを比較する。

　出現確率が推論閾値Ｔより小さい場合、推論結果調整部１４５は、この出現確率を棄却する。例えば、図２０において、カテゴリー４０１のラベル４０２について、出現確率４０２ａは、推論閾値Ｔａ４０５より小さいので、棄却される。また、カテゴリー４０１のラベル４０４について、出現確率４０４ａは、推論閾値Ｔｂ４１５より小さいので、棄却される。

　一方、出現確率が推論閾値Ｔと等しいか、又は、出現確率が推論閾値Ｔより大きい場合、推論結果調整部１４５は、この出現確率を採用する。例えば、図２０において、カテゴリー４０１のラベル４０３について、出現確率４０３ａは、推論閾値Ｔａ４０５より大きいので、採用される。

　上記の通り、パラメーター取得部１２３は、例えば、ラベルの頻度が高ければ、より低い推論閾値Ｔを算出し、頻度が低ければ、より高い推論閾値Ｔを算出する。このため、頻度が高いラベルについては、より低く算出された推論閾値と比較した場合であっても、出現確率が採用される可能性が高くなる。一方、頻度が低いラベルについては、より低く算出された推論閾値と比較した場合、出現確率が棄却される可能性が高くなる。

　また、パラメーター取得部１２３は、難易度が低ければ、より低い推論閾値Ｔを算出し、難易度が高ければ、より高い推論閾値Ｔを算出する。さらに、パラメーター取得部１２３は、習熟度が高ければ、低い推論閾値Ｔを算出し、習熟度が低ければ、より高い推論閾値Ｔを算出する。これらの場合においても、頻度と同様である。

　このように、推論結果調整部１４５は、カテゴリー毎に、採用する出現確率と棄却する出現確率を決定し、採用する出現確率に対応するラベルを採用する。

　こうして、ラベルの特性（頻度、難易度、習熟度等）に応じて、推論閾値を補正することにより、ラベル毎の特性に偏りがある場合においても、一定の認識性能を維持することができる。

　また、推論結果調整部１４５は、カテゴリー内の全ての出現確率を棄却する場合、そのカテゴリーについて、認識不可能と決定する。例えば、図２０において、カテゴリー４１１の全てのラベルについて、出現確率４１２ａ、４１３ａ、４１４ａ、・・・は、推論閾値Ｔｂ４１５より小さいので、棄却される。

　ここで、推論結果調整部１４５は、カテゴリー毎に、採用する出現確率が複数、存在する場合、最も高い出現確率を採用し、その他の出現確率を棄却する。こうして、推論結果調整部１４５は、最も高い出現確率に対応するラベルを採用する。

　最終的に、推論結果調整部１４５は、全てのカテゴリーの各々について、一つのラベルを決定し、又は、当該カテゴリーについて認識不可能と決定する。例えば、図２０において、カテゴリー４０１のラベル４０３について、出現確率４０３ａが採用される。また、カテゴリー４１１について、認識不可能（ラベル不明）４１６と決定される。また、カテゴリー４２１のラベル４２２について、出現確率４２２ａが採用される。

　このようにして、推論結果調整部１４５は、全てのカテゴリーの各々について、決定された一つのラベル、又は、当該カテゴリーについて認識不可能を示す情報を含む推論結果Ｒ’を生成する。

　推論結果調整部１４５により生成される最終認識結果４４０（推論結果Ｒ’）を図２１に示す。この図に示すように、最終認識結果４４０は、複数の認識情報４４１を含み、各認識情報４４１は、カテゴリー４４２及びラベル４４３から構成される。

　複数の認識情報４４１に含まれる複数のカテゴリーは、それぞれ、図６に示す複数のカテゴリーに対応している。また、複数の認識情報４４１に含まれる複数のラベルは、それぞれ、図６に示す各カテゴリー内のラベルに一致し、又は、不明（認識不可能）を示す情報４４４を含む。

　推論結果調整部１４５は、このようにして生成した推論結果Ｒ’を推論結果転送部１４６に対して、出力する。

　（ｃ）推論結果転送部１４６
　推論結果転送部１４６は、推論結果調整部１４５から、推論結果Ｒ’を受信する。推論結果Ｒ’を受信すると、推論結果転送部１４６は、受信した推論結果Ｒ’を推論結果出力部１２６に対して、出力する。

　（４）推論結果出力部１２６
　推論結果出力部１２６は、推論結果転送部１４６から、推論結果Ｒ’を受信する。推論結果Ｒ’を受信すると、推論結果出力部１２６は、受信した推論結果Ｒ’を、ネットワーク通信回路１１１を介して、外部の情報端末に対して、送信する。

　（５）制御部１４０
　制御部１４０（制御手段）は、実地データ入力部１４１、特徴抽出部１４２及び推論部１４３を統一的に制御する。また、制御部１４０は、実地データ入力部１４１、特徴抽出部１４２及び推論部１４３をそれぞれ制御する。

　また、制御部１４０は、実地データ入力部１４１により読み出した画像データに対して、ラベル毎に推論結果を算出するように、ニューラルネットワークを制御する。

　１．１２　学習認識装置１０における動作
　（１）訓練認識処理部１２４における動作
　訓練認識処理部１２４における動作について、図２２に示すフローチャートを用いて説明する。

　なお、通常、フローチャートは、時系列に沿った手順を説明するものであるが、ニューラルネットワークの性質上、以下に示すフローチャートの手順は、必ずしも、時系列に沿った手順ではない場合がある。特に、以下のステップＳ１０４からＳ１１３における訓練ラベル毎の繰り返しの処理については、訓練ラベル毎の処理が、それぞれ行われることを機能的に表しているのであって、時系列に沿って、処理が進むとは限らないので、注意を要する。図２３に示すフローチャートについても、同様である。

　制御部１４０は、訓練データＤＢ１５１内に保持されている画像データ毎に、ステップＳ１０２～Ｓ１１３を繰り返す（ステップＳ１０１～Ｓ１１４）。

　次に、ステップＳ１０２～Ｓ１１３の各々について、説明する。

　訓練データ入力部１３１は、訓練データＤＢ１５１から、一つの画像データを読み出す（ステップＳ１０２）。

　特徴抽出部１３２は、画像データから特徴を抽出する（ステップＳ１０３）。

　特徴学習部１３３は、訓練データテーブル２３０内の、当該画像データに対応する訓練データに含まれる訓練ラベル毎に、ステップＳ１０５～Ｓ１１１を繰り返す（ステップＳ１０４～Ｓ１１３）。

　次に、ステップＳ１０５～Ｓ１１１の各々について、説明する。

　ラベル推論部１３４は、ラベルを推論する（ステップＳ１０５）。

　次に、ラベル推論部１３４は、推論誤差ｄを算出する（ステップＳ１０６）。

　次に、パラメーター取得部１２３は、訓練ラベル毎にラベル加重値ＬＷを算出する（ステップＳ１０７）。

　補正推論誤差ｄ’＝推論誤差ｄ×ラベル加重値ＬＷ　　（ステップＳ１０８）
　特徴学習部１３３は、欠落情報テーブル２９０を参照し（ステップＳ１０９）、当該ラベルが欠落情報か否かを判断する（ステップＳ１１０）。欠落情報であると判断される場合（ステップＳ１１０で「ＹＥＳ」）、特徴学習部１３３は、ステップＳ１１３に制御を移す。

　一方、欠落情報でないと判断される場合（ステップＳ１１０で「ＮＯ」）、特徴学習部１３３は、補正推論誤差ｄ’と所定の収束閾値とを比較し、補正推論誤差ｄ’が所定の収束閾値より大きいか否かを判断する（ステップＳ１１１）。

　補正推論誤差ｄ’が所定の収束閾値より大きいと判断される場合（ステップＳ１１１で「＞」）、ラベル推論部１３４は、ニューロン加重値及びニューロン閾値を補正する（ステップＳ１１２）。次に、特徴学習部１３３は、ステップＳ１０５に制御を移し、処理を繰り返す。

　一方、補正推論誤差ｄ’が所定の収束閾値より大きくないと判断される場合（ステップＳ１１１で「≦」）、特徴学習部１３３は、ステップＳ１１３に制御を移す。

　このように、推論誤差及び補正推論誤差は、ラベル毎に計算され、全てのラベルについて、補正推論誤差が所定の収束閾値より小さくなるように、ニューロン加重値及びニューロン閾値が補正され、推論が繰り返される。

　（２）実地認識処理部１２５における動作
　実地認識処理部１２５における動作について、図２３に示すフローチャートを用いて説明する。

　実地データ入力部１４１は、実地データＤＢ１５４に記憶されている画像データ２８９を読み出す。特徴抽出部１４２は、読み出した画像データから特徴量を抽出する（ステップＳ１３１）。

　制御部１４０は、図６に示す全てのカテゴリーについて、カテゴリー毎に、ステップＳ１３３～Ｓ１４０を繰り返す（ステップＳ１３２～Ｓ１４１）。

　次に、ステップＳ１３３～Ｓ１４０の各々について、説明する。

　ラベル推論部１４４は、カテゴリー内で、ラベルを推論する（ステップＳ１３３）。

　推論部１４３は、ラベル毎に、ステップＳ１３５～Ｓ１３８を繰り返す（ステップＳ１３４～Ｓ１３９）。

　次に、ステップＳ１３５～Ｓ１３８の各々について、説明する。

　パラメーター取得部１２３は、推論閾値Ｔを算出する（ステップＳ１３５）。

　推論結果調整部１４５は、各カテゴリーの各ラベルについて、推論結果Ｒ内の出現確率と推論閾値Ｔとを比較する（ステップＳ１３６）。

　推論結果が推論閾値Ｔと等しい又は推論結果が推論閾値Ｔより大きい場合（ステップＳ１３６で「≧」）、推論結果調整部１４５は、当該カテゴリーのラベルとして、推論結果の出現確率を採用する（ステップＳ１３７）。

　一方、推論結果が推論閾値Ｔより小さい場合（ステップＳ１３６で「＜」）、推論結果調整部１４５は、推論結果の出現確率を棄却する（ステップＳ１３８）。

　ラベル毎の繰り返しが終了すると（ステップＳ１３９）、推論結果調整部１４５は、一つのカテゴリーについて、一つのラベルを決定し、又は、当該カテゴリーについて認識不可能と決定する（ステップＳ１４０）。

　カテゴリー毎の繰り返しが終了すると（ステップＳ１４１）、推論結果出力部１２６は、推論結果Ｒ’を出力する（ステップＳ１４２）。

　１．１３　各推論対象物について設定されるべきカテゴリーのパターン
　上記においては、学習認識装置１０における推論の対象物として、画像内の「車両」オブジェクトを用いて説明している。

　学習認識装置１０における推論の対象物は、画像内の「車両」には、限らない。図２４に示すように、例えば、「食品」、「工業製品」、「植物」、「水産物」、「動物」、「人」等であってもよい。

　また、「食品」についてのラベルは、例えば、「種類」、「色」、「大きさ」、「品質レベル」、「鮮度」等のカテゴリーに分類できる。「工業製品」についてのラベルは、例えば、「種類」、「色」、「形」、「傷有無」、「生産工程の段階」等のカテゴリーに分類できる。その他、「植物」、「水産物」、「動物」、「人」等についてのラベルは、図２４に示すカテゴリーに分類できる。

　このように、学習認識装置１０における学習及び認識は、これらの対象物に対しても実施可能である。

　１．１４　まとめ
　訓練認識処理部１２４によると、ラベル毎の学習特性に偏りがある場合においても、一定の認識性能を維持できるように、学習させることができる。

　また、実地認識処理部１２５によると、ラベル毎の学習特性に偏りがある場合においても、一定の認識性能を維持できる。

　２．その他の変形例
　本発明について、上記の実施の形態に基づいて説明しているが、上記の実施の形態に限定されない。以下に示すようにしてもよい。

　（１）上記の実施の形態によると、学習認識装置１０は、訓練認識処理部１２４及び実地認識処理部１２５を備えた一台の装置から構成されている。

　しかし、この態様には、限定されない。

　本開示の一つの態様は、一台の学習認識装置１０ではなく、訓練認識処理部１２４を備える学習装置と、実地認識処理部１２５を備える認識装置とから構成される学習認識システムであるとしてもよい。学習装置と認識装置とは、ネットワークを介して、接続されている。

　具体的には、学習装置は、図１に示すバスＢ１に接続されたＣＰＵ１０１、ＲＯＭ１０２、ＲＡＭ１０３、記憶部１０４及びネットワーク通信回路１１１と、バスＢ２に接続されたＧＰＵ１０５、ＲＯＭ１０６、ＲＡＭ１０７とから構成されている。バスＢ１とバスＢ２は、相互に接続されている。

　また、認識装置は、図１に示すバスＢ１に接続されたＣＰＵ１０１、ＲＯＭ１０２、ＲＡＭ１０３、記憶部１０４及びネットワーク通信回路１１１と、バスＢ３に接続されたＧＰＵ１０８、ＲＯＭ１０９、ＲＡＭ１１０とから構成されている。バスＢ１とバスＢ３は、相互に接続されている。

　学習装置は、学習結果ＤＢの内容を、ネットワークを介して、認識装置に対して送信する。認識装置は、学習結果ＤＢの内容を受信し、受信した内容により、実地認識処理部を学習させる。

　（２）上記の実施の形態の学習認識装置１０における学習及び認識の対象は、画像データである。

　しかし、この態様には、限定されない。

　（ａ）学習認識装置１０における学習及び認識の対象は、音声データであるとしてもよい。この場合、カテゴリーの例は、「音楽」、「人の声」、「自然の音」等であるとしてもよい。

　また、カテゴリー「音楽」についてのラベルの例は、「クラシック音楽」、「民族音楽」、「ポップス」、「ラテン音楽」等である。また、カテゴリー「人の声」についてのラベルの例は、「ニュース音声」、「講演会の音声」、「会話の音声」等である。また、カテゴリー「自然の音」についてのラベルの例は、「鳥の鳴き声」、「風の音」、「川の流れの音」等である。

　また、音声データは、介護記録、看護記録等であるとしてもよい。音声データは、例えば、患者が自身の症状について話す自身の音声からなる。音声データの具体例は、「朝から鼻水と咳が止まらなくて、食欲は、まあまあ、あるけど、便は出ていません。検温はしていないけど、熱はないと思う。」である。音声データからカテゴリー「症状」、「食欲」、「排泄」等が推論される。カテゴリー「症状」についてのラベルの例は、「発熱」、「咳」、「のどの痛み」等である。カテゴリー「食欲」についてのラベルの例は、「ある」、「中程度」、「ない」等である。カテゴリー「排泄」についてのラベルの例は、「ある」、「中程度」、「ない」等である。

　（ｂ）学習認識装置１０における学習及び認識の対象は、自然言語処理における文字データであるとしてもよい。この場合、カテゴリーの例は、「会話」、「文学」、「新聞」、「論文」等であるとしてもよい。また、カテゴリー「会話」についてのラベルの例は、「日本語」、「英語」、「イタリア語」等である。また、カテゴリー「文学」についてのラベルの例は、「日本の現代文学」、「日本の近代文学」、「日本の中世文学」、「日本の古代文学」等である。また、カテゴリー「新聞」についてのラベルの例は、「政治ニュース」、「経済ニュース」、「科学ニュース」等である。

　また、文字データは、介護記録、看護記録等の文字データであるとしてもよい。文字データは、例えば、看護師が患者の症状について、文字により記録したものである。文字データの具体例は、「朝から鼻水と咳が止まらない。食欲は、まあまあ、ある。便は出ていない。検温はしていないが、熱はない。」である。文字データからカテゴリー「症状」、「食欲」、「排泄」等が推論される。各カテゴリーについてのラベルの例は、上記の通りである。

　（３）実施の形態においては、パラメーター取得部１２３は、頻度情報、難易度情報及び習熟度情報を用いて、つまり、教師ラベルの学習特性に基づいて、各カテゴリー内の各ラベルについて、ラベル加重値を算出している。

　しかし、これには限定されない。頻度情報、難易度情報及び習熟度情報を用いて、人が、各カテゴリー内の各ラベルについて、ラベル加重値を決定してもよい。例えば、情報処理装置（具体的には、パーソナルコンピューター等）は、その利用者から、各カテゴリー内の各ラベルについて、ラベル加重値の入力を受け付ける。情報処理装置は、入力を受け付けたラベル加重値を、学習認識装置１０に対して、送信する。学習認識装置１０のパラメーター取得部１２３は、ラベル加重値を受信し、受信したラベル加重値を特徴学習部１３３の加重値付与部１３５に対して出力する。

　（４）実施の形態においては、パラメーター取得部１２３は、頻度情報、難易度情報及び習熟度情報を用いて、つまり、教師ラベルの学習特性に基づいて、各カテゴリー内の各ラベルについて、推論閾値を算出している。

　しかし、これには限定されない。頻度情報、難易度情報及び習熟度情報を用いて、人が、各カテゴリー内の各ラベルについて、推論閾値を決定してもよい。例えば、情報処理装置（具体的には、パーソナルコンピューター等）は、その利用者から、各カテゴリー内の各ラベルについて、推論閾値の入力を受け付ける。情報処理装置は、入力を受け付けた推論閾値を、学習認識装置１０に対して、送信する。学習認識装置１０のパラメーター取得部１２３（閾値取得手段）は、推論閾値を受信（取得）し、受信した推論閾値を実地認識処理部１２５の推論部１４３に対して出力する。

　また、推論閾値は、学習特性に基づいて算出される形態だけでなく、上記のように、事前の情報に基づいて手動により、設定してもよいし、また、パラメーター取得部１２３（閾値取得手段）は、次に示すように、何らかの変動している外部要因に基づいて動的に推論閾値を生成（算出）して設定してもよい。

　学習認識装置１０の運用、つまり、実地認識処理部１２５の運用を開始した後、推論閾値を生成するパターンとして、次のような場合がある。

　ここでは、例えば、野球場等の公共施設に複数のカメラが設置されているとする。複数のカメラは、それぞれ、グラウンド、観客席、野球場の入口、野球場の周囲等を撮影して、画像（静止画、又は、動画）を表した画像データを得る。こうして、得られた多数の画像データは、学習認識装置１０の実地データＤＢ１５４に格納される。学習認識装置１０の実地認識処理部１２５は、実地データＤＢ１５４に格納された多数の画像データに対して、認識処理を行う。なお、公共施設は、野球場には限定されない。その他のスポーツが行われる競技場、演劇が行われる劇場、映画が上映される映画館等において、適用してもよい。

　ここで、実地認識処理部１２５は、例えば、実地データＤＢ１５４に格納された多数の画像データを用いて、画像データに写った観客の画像により、図２４に示すように、群衆としてカテゴリー「密集人数」、「年齢層分布」、「関係性」等を認識し、また、カテゴリー毎にラベルを認識する。

　この場合、パラメーター取得部１２３は、例えば、推論閾値を次のようにして、動的に生成してもよい。

　（ａ）同じ野球場に設置されている複数のカメラのうち、特定のカメラから送信されたチューニング情報を用いて、パラメーター取得部１２３は、推論閾値を生成する。具体的には、複数のカメラのうち、野球場に入場する観客の顔が、精度よく写る、入口付近に設置されたカメラ（特定のカメラ）から得られた画像データを用いて、一人一人の観客の年齢を認識し、年齢層毎に（つまり、１０代、２０代、３０代等）に、その頻度を集計する。パラメーター取得部１２３は、こうして集計した頻度に応じて、年齢層毎（つまり、ラベル毎）の推論閾値を生成してもよい。

　（ｂ）同じ野球場に設置されている複数のカメラのうち、西日、雨滴等の外乱を受ける場所に設置されているカメラから得られる画像データについては、天候、季節、時刻等によって、明暗が変わることによるチューニング情報を用いて、パラメーター取得部１２３は、推論閾値を生成してもよい。例えば、パラメーター取得部１２３は、天候、季節、時刻（ラベル）等に応じて明暗情報により色判断の推論閾値を生成してもよい。

　（ｃ）例えば、パラメーター取得部１２３は、野球場への入場者数、野球場の観客席における混雑度等のチューニングする情報を用いて、推論閾値を生成してもよい。一例として、パラメーター取得部１２３は、野球場の観客席が混んでいるときは、オクリュージョンが多数発生（ラベル）と判断し、画像の中で、観客席の下段に着席している観客の上半身やその座席の背もたれ等により、その上段に着席している観客の下半身は隠され、上段の観客の下半身の画像について認識することは、苦手と判断して、推論閾値を生成してもよい。

　（ｄ）例えば、野球場に設置されたカメラから得られた画像データにより、学習認識装置１０の訓練認識処理部１２４は、現場学習を実施し、得られた現場学習により、フィードバックするチューニング情報を用いて、パラメーター取得部１２３は、推論閾値を生成してもよい。つまり、現場に依存するような認識性能から推論閾値を生成してもよい。

　具体的には、訓練認識処理部１２４は、複数のカメラのうち、野球場に入場する観客の顔が、精度よく写る、入口付近に設置されたカメラ（特定のカメラ）から得られた画像データを用いて、一人一人の観客の年齢及びその性別を認識して学習する。パラメーター取得部１２３は、この学習結果に応じて、カテゴリー「観客の関係性」（そのラベルは、「家族」、「カップル」、「友人」、「仕事関係」）についての、ラベル毎の推論閾値を生成してもよい。次に、実地認識処理部１２５は、観客席を写すカメラから得られた画像データを用いて、生成された推論閾値に従って、「観客の関係性」を認識する。

　（５）実施の形態においては、推論誤差及び補正推論誤差が、ラベル毎に計算され、全てのラベルについて、補正推論誤差がゼロになるまで、ニューロン加重値及びニューロン閾値が補正され、推論が繰り返される。

　なお、補正推論誤差が収束してくると、所定の繰り返し回数に達した場合に、推論の繰り返しを停止してもよい。また、補正推論誤差が所定の収束閾値に達した場合に、推論の繰り返しを停止してもよい。

　（６）上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。

　（７）本開示の一態様は、ニューラルネットワークに学習をさせる学習装置であって、教師データ及び対応する複数の教師ラベルを取得する取得手段と、前記教師データについて、前記教師ラベル毎に推論誤差を算出するように前記ニューラルネットワークを制御する制御手段と、教師ラベル毎に算出された前記推論誤差を、前記教師ラベル毎に、当該教師ラベルの学習特性に基づいて設定された加重値により補正して補正推論誤差を算出する補正手段とを備え、前記制御手段は、前記教師ラベル毎の補正推論誤差が小さくなっていくように、前記ニューラルネットワークに繰り返し作用させる。

　ここで、さらに、前記教師ラベル毎に、当該教師ラベルの学習特性に基づいて、前記加重値を算出する算出手段を備える、としてもよい。

　ここで、前記学習装置において、複数の教師データについて、学習がなされ、前記複数の教師データの各々には、複数の教師ラベルが対応付けられており、前記取得手段は、さらに、教師ラベル毎に、その出現頻度を示す頻度情報を取得し、前記算出手段は、取得した頻度情報に基づいて、前記加重値を算出してもよい。

　ここで、前記複数の教師ラベルの各々について、認識の難易度が異なり、前記取得手段は、さらに、教師ラベル毎に、その難易度を示す難易度情報を取得し、前記算出手段は、取得した難易度情報に基づいて、前記加重値を算出してもよい。

　ここで、前記複数の教師ラベルの各々について、前記ニューラルネットワークにおける習熟度が異なり、前記取得手段は、さらに、教師ラベル毎に、その習熟度を示す習熟度情報を取得し、前記算出手段は、取得した習熟度情報に基づいて、前記加重値を算出してもよい。

　ここで、前記教師データには、複数のカテゴリーが設定されており、前記複数の教師ラベルのうち、一部の教師ラベルは、複数のカテゴリーのうちの一つのカテゴリーに属する、としてもよい。

　ここで、前記取得手段は、さらに、前記ニューラルネットワークにおいて、前記教師データから認識できない欠落ラベルを取得し、前記制御手段は、さらに、前記複数の教師ラベルのうちのいずれかが、前記欠落ラベルと一致するか否かを判断し、一致すると判断する場合、前記欠落ラベルについて、前記ニューラルネットワークに対する繰り返し作用を抑制してもよい。

　また、本開示の別の一態様は、ニューラルネットワークに学習をさせる学習装置において用いられる学習方法であって、教師データ及び対応する複数の教師ラベルを取得する取得ステップと、前記教師データについて、前記教師ラベル毎に推論誤差を算出するように前記ニューラルネットワークを制御する制御ステップと、教師ラベル毎に算出された前記推論誤差を、前記教師ラベル毎に、当該教師ラベルの学習特性に基づいて設定された加重値により補正して補正推論誤差を算出する補正ステップとを含み、前記制御ステップは、前記教師ラベル毎の補正推論誤差が小さくなっていくように、前記ニューラルネットワークに繰り返し作用させる。

　また、本開示の別の一態様は、ニューラルネットワークに学習をさせる学習装置において用いられ、コンピューター読み取り可能な記憶媒体に記憶されている学習プログラムであって、前記コンピューターである前記学習装置に、教師データ及び対応する複数の教師ラベルを取得する取得ステップと、前記教師データについて、前記教師ラベル毎に推論誤差を算出するように前記ニューラルネットワークを制御する制御ステップと、教師ラベル毎に算出された前記推論誤差を、前記教師ラベル毎に、当該教師ラベルの学習特性に基づいて設定された加重値により補正して補正推論誤差を算出する補正ステップとを実行させ、前記制御ステップは、前記教師ラベル毎の補正推論誤差が小さくなっていくように、前記ニューラルネットワークに繰り返し作用させる。

　また、本開示の別の態様は、ニューラルネットワークを用いて行う認識により、認識対象であるデータから複数のラベルを取得する認識装置であって、前記データを取得する取得手段と、前記データに対して、前記ラベル毎に推論結果を算出するように前記ニューラルネットワークを制御する制御手段と、前記ラベル毎の推論閾値に基づいて推論結果を出力するか否かを判断する判断手段とを備える。

　ここで、さらに、前記ラベル毎に、推論閾値を取得する閾値取得手段を備え、前記判断手段は、前記ラベル毎に算出された推論結果が、前記推論閾値より小さい場合、前記推論結果を棄却し、前記ラベル毎に算出された推論結果が、前記推論閾値と等しい場合又は前記推論閾値より大きい場合、推論結果を出力してもよい。

　ここで、前記閾値取得手段は、当該ラベルの学習特性に基づいて、前記推論閾値を算出してもよい。

　ここで、前記ニューラルネットワークにおいて、複数の教師データについて、学習がなされ、前記複数の教師データの各々には、複数の教師ラベルが対応付けられており、前記取得手段は、さらに、前記教師ラベル毎に、その頻度を示す頻度情報を取得し、前記閾値取得手段は、取得した頻度情報に基づいて、前記推論閾値を算出してもよい。

　ここで、前記複数のラベルの各々について、認識の難易度が異なり、前記取得手段は、さらに、ラベル毎に、その難易度を示す難易度情報を取得し、前記閾値取得手段は、取得した難易度情報に基づいて、前記推論閾値を算出してもよい。

　ここで、前記複数のラベルの各々について、前記ニューラルネットワークにおける習熟度が異なり、前記取得手段は、さらに、ラベル毎に、その習熟度を示す習熟度情報を取得し、前記閾値取得手段は、取得した習熟度情報に基づいて、前記推論閾値を算出してもよい。

　ここで、前記閾値取得手段は、動的に、前記推論閾値を算出してもよい。

　ここで、前記閾値取得手段は、変動している外部要因に基づいて、前記推論閾値を算出してもよい。

　ここで、前記閾値取得手段は、利用者により入力された前記推論閾値を取得してもよい。

　ここで、前記データには、複数のカテゴリーが設定されており、前記複数のラベルのうち、一部のラベルは、複数のカテゴリーのうちの一つのカテゴリーに属する、としてもよい。

　また、本開示の別の一態様は、ニューラルネットワークを用いて行う認識により、認識対象であるデータから複数のラベルを取得する認識装置において用いられる認識方法であって、前記データを取得する取得ステップと、前記データに対して、前記ラベル毎に推論結果を算出するように前記ニューラルネットワークを制御する制御ステップと、前記ラベル毎の推論閾値に基づいて推論結果を出力するか否かを判断する判断ステップとを含む。

　また、本開示の別の一態様は、ニューラルネットワークを用いて行う認識により、認識対象であるデータから複数のラベルを取得する認識装置において用いられ、コンピューター読み取り可能な記憶媒体に記憶されている認識プログラムであって、コンピューターである前記認識装置に、前記データを取得する取得ステップと、前記データに対して、前記ラベル毎に推論結果を算出するように前記ニューラルネットワークを制御する制御ステップと、前記ラベル毎の推論閾値に基づいて推論結果を出力するか否かを判断する判断ステップとを実行させる。

　また、本開示の別の一態様は、前記学習装置と前記認識装置とから構成される学習認識装置である。

　本開示に係る学習装置は、ラベル毎の学習特性に偏りがある場合においても、一定の認識性能を維持することができるように、学習することができる、という優れた効果を奏し、ニューラルネットワークに学習をさせる技術、特に、一つの教師データに複数の教師ラベルが対応する場合における学習技術として有用である。また、本開示に係る認識装置は、ラベル毎の特性に学習偏りがある場合においても、一定の認識性能を維持することができる、という優れた効果を奏し、ニューラルネットワークにより認識を行う技術、特に、一つの教師データに複数の教師ラベルが対応する場合における認識技術として有用である。

　　　１０　　学習認識装置
　　　５０　　ニューラルネットワーク
　　　５０ａ　入力層
　　　５０ｂ　特徴抽出層
　　　５０ｃ　認識層
　　１０１　　ＣＰＵ
　　１０２　　ＲＯＭ
　　１０３　　ＲＡＭ
　　１０４　　記憶部
　　１０５　　ＧＰＵ
　　１０６　　ＲＯＭ
　　１０７　　ＲＡＭ
　　１０８　　ＧＰＵ
　　１０９　　ＲＯＭ
　　１１０　　ＲＡＭ
　　１１１　　ネットワーク通信回路
　　１２１　　主制御部
　　１２２　　統括制御部
　　１２３　　パラメーター取得部
　　１２４　　訓練認識処理部
　　１２５　　実地認識処理部
　　１２６　　推論結果出力部
　　１３０　　制御部
　　１３１　　訓練データ入力部
　　１３２　　特徴抽出部
　　１３３　　特徴学習部
　　１３４　　ラベル推論部
　　１３５　　加重値付与部
　　１３６　　推論誤差転送部
　　１４０　　制御部
　　１４１　　実地データ入力部
　　１４２　　特徴抽出部
　　１４３　　推論部
　　１４４　　ラベル推論部
　　１４５　　推論結果調整部
　　１４６　　推論結果転送部

Claims

　ニューラルネットワークに学習をさせる学習装置であって、
　教師データ及び対応する複数の教師ラベルを取得する取得手段と、
　前記教師データについて、前記教師ラベル毎に推論誤差を算出するように前記ニューラルネットワークを制御する制御手段と、
　教師ラベル毎に算出された前記推論誤差を、前記教師ラベル毎に、当該教師ラベルの学習特性に基づいて設定された加重値により補正して補正推論誤差を算出する補正手段とを備え、
　前記制御手段は、前記教師ラベル毎の補正推論誤差が小さくなっていくように、前記ニューラルネットワークに繰り返し作用させる
　学習装置。
　さらに、
　前記教師ラベル毎に、当該教師ラベルの学習特性に基づいて、前記加重値を算出する算出手段を備える請求項１に記載の学習装置。
　前記学習装置において、複数の教師データについて、学習がなされ、
　前記複数の教師データの各々には、複数の教師ラベルが対応付けられており、
　前記取得手段は、さらに、教師ラベル毎に、その出現頻度を示す頻度情報を取得し、
　前記算出手段は、取得した頻度情報に基づいて、前記加重値を算出する
　請求項２に記載の学習装置。
　前記複数の教師ラベルの各々について、認識の難易度が異なり、
　前記取得手段は、さらに、教師ラベル毎に、その難易度を示す難易度情報を取得し、
　前記算出手段は、取得した難易度情報に基づいて、前記加重値を算出する
　請求項２に記載の学習装置。
　前記複数の教師ラベルの各々について、前記ニューラルネットワークにおける習熟度が異なり、
　前記取得手段は、さらに、教師ラベル毎に、その習熟度を示す習熟度情報を取得し、
　前記算出手段は、取得した習熟度情報に基づいて、前記加重値を算出する
　請求項２に記載の学習装置。
　前記教師データには、複数のカテゴリーが設定されており、
　前記複数の教師ラベルのうち、一部の教師ラベルは、複数のカテゴリーのうちの一つのカテゴリーに属する
　請求項１に記載の学習装置。
　前記取得手段は、さらに、前記ニューラルネットワークにおいて、前記教師データから認識できない欠落ラベルを取得し、
　前記制御手段は、さらに、前記複数の教師ラベルのうちのいずれかが、前記欠落ラベルと一致するか否かを判断し、一致すると判断する場合、前記欠落ラベルについて、前記ニューラルネットワークに対する繰り返し作用を抑制する
　請求項１に記載の学習装置。
　ニューラルネットワークに学習をさせる学習装置において用いられる学習方法であって、
　教師データ及び対応する複数の教師ラベルを取得する取得ステップと、
　前記教師データについて、前記教師ラベル毎に推論誤差を算出するように前記ニューラルネットワークを制御する制御ステップと、
　教師ラベル毎に算出された前記推論誤差を、前記教師ラベル毎に、当該教師ラベルの学習特性に基づいて設定された加重値により補正して補正推論誤差を算出する補正ステップとを含み、
　前記制御ステップは、前記教師ラベル毎の補正推論誤差が小さくなっていくように、前記ニューラルネットワークに繰り返し作用させる
　学習方法。
　ニューラルネットワークに学習をさせる学習装置において用いられ、コンピューター読み取り可能な記憶媒体に記憶されている学習プログラムであって、
　前記コンピューターである前記学習装置に、
　教師データ及び対応する複数の教師ラベルを取得する取得ステップと、
　前記教師データについて、前記教師ラベル毎に推論誤差を算出するように前記ニューラルネットワークを制御する制御ステップと、
　教師ラベル毎に算出された前記推論誤差を、前記教師ラベル毎に、当該教師ラベルの学習特性に基づいて設定された加重値により補正して補正推論誤差を算出する補正ステップとを実行させ、
　前記制御ステップは、前記教師ラベル毎の補正推論誤差が小さくなっていくように、前記ニューラルネットワークに繰り返し作用させる
　学習プログラム。
　ニューラルネットワークを用いて行う認識により、認識対象であるデータから複数のラベルを取得する認識装置であって、
　前記データを取得する取得手段と、
　前記データに対して、前記ラベル毎に推論結果を算出するように前記ニューラルネットワークを制御する制御手段と、
　前記ラベル毎の推論閾値に基づいて推論結果を出力するか否かを判断する判断手段と
　を備える認識装置。
　さらに、
　前記ラベル毎に、推論閾値を取得する閾値取得手段を備え、
　前記判断手段は、前記ラベル毎に算出された推論結果が、前記推論閾値より小さい場合、前記推論結果を棄却し、前記ラベル毎に算出された推論結果が、前記推論閾値と等しい場合又は前記推論閾値より大きい場合、推論結果を出力する
　請求項１０に記載の認識装置。
　前記閾値取得手段は、当該ラベルの学習特性に基づいて、前記推論閾値を算出する
　請求項１１に記載の認識装置。
　前記ニューラルネットワークにおいて、複数の教師データについて、学習がなされ、
　前記複数の教師データの各々には、複数の教師ラベルが対応付けられており、
　前記取得手段は、さらに、前記教師ラベル毎に、その頻度を示す頻度情報を取得し、
　前記閾値取得手段は、取得した頻度情報に基づいて、前記推論閾値を算出する
　請求項１２に記載の認識装置。
　前記複数のラベルの各々について、認識の難易度が異なり、
　前記取得手段は、さらに、ラベル毎に、その難易度を示す難易度情報を取得し、
　前記閾値取得手段は、取得した難易度情報に基づいて、前記推論閾値を算出する
　請求項１２に記載の認識装置。
　前記複数のラベルの各々について、前記ニューラルネットワークにおける習熟度が異なり、
　前記取得手段は、さらに、ラベル毎に、その習熟度を示す習熟度情報を取得し、
　前記閾値取得手段は、取得した習熟度情報に基づいて、前記推論閾値を算出する
　請求項１２に記載の認識装置。
　前記閾値取得手段は、動的に、前記推論閾値を算出する
　請求項１１に記載の認識装置。
　前記閾値取得手段は、変動している外部要因に基づいて、前記推論閾値を算出する
　請求項１６に記載の認識装置。
　前記閾値取得手段は、利用者により入力された前記推論閾値を取得する
　請求項１１に記載の認識装置。
　前記データには、複数のカテゴリーが設定されており、
　前記複数のラベルのうち、一部のラベルは、複数のカテゴリーのうちの一つのカテゴリーに属する
　請求項１０に記載の認識装置。
　ニューラルネットワークを用いて行う認識により、認識対象であるデータから複数のラベルを取得する認識装置において用いられる認識方法であって、
　前記データを取得する取得ステップと、
　前記データに対して、前記ラベル毎に推論結果を算出するように前記ニューラルネットワークを制御する制御ステップと、
　前記ラベル毎の推論閾値に基づいて推論結果を出力するか否かを判断する判断ステップとを含む認識方法。
　ニューラルネットワークを用いて行う認識により、認識対象であるデータから複数のラベルを取得する認識装置において用いられ、コンピューター読み取り可能な記憶媒体に記憶されている認識プログラムであって、
　コンピューターである前記認識装置に、
　前記データを取得する取得ステップと、
　前記データに対して、前記ラベル毎に推論結果を算出するように前記ニューラルネットワークを制御する制御ステップと、
　前記ラベル毎の推論閾値に基づいて推論結果を出力するか否かを判断する判断ステップとを実行させるための認識プログラム。
　請求項１に記載の学習装置と請求項１０に記載の認識装置とから構成される
　学習認識装置。