JP6209879B2 - 畳み込みニューラルネットワーク分類器システム、その訓練方法、分類方法および用途 - Google Patents

畳み込みニューラルネットワーク分類器システム、その訓練方法、分類方法および用途 Download PDF

Info

Publication number
JP6209879B2
JP6209879B2 JP2013139882A JP2013139882A JP6209879B2 JP 6209879 B2 JP6209879 B2 JP 6209879B2 JP 2013139882 A JP2013139882 A JP 2013139882A JP 2013139882 A JP2013139882 A JP 2013139882A JP 6209879 B2 JP6209879 B2 JP 6209879B2
Authority
JP
Japan
Prior art keywords
neural network
convolutional neural
network classifier
level
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013139882A
Other languages
English (en)
Other versions
JP2014049118A (ja
Inventor
ウ・チュヌポン
ファヌ・ウエイ
源 何
源 何
俊 孫
俊 孫
直井 聡
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2014049118A publication Critical patent/JP2014049118A/ja
Application granted granted Critical
Publication of JP6209879B2 publication Critical patent/JP6209879B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、分類器に関し、具体的には、畳み込みニューラルネットワーク(Convolutional Neural network、以下、CNNと略称する)分類器システム、その用途、畳み込みニューラルネットワーク分類器システムの訓練方法、及び畳み込みニューラルネットワーク分類器システムを利用して対象物を分類する方法およびその用途に関する。
これまでのところ、オフライン手書き文字の認識は難しい課題である。近年、畳み込みニューラルネットワークに基づく識別方法は、現在の技術の発展を実現した。しかし、今の識別方法の認識率には限りがある。
この技術課題を解決するには、認識率が高く、効率のよい識別方法または分類方法が必要とされている。
本発明の主な目的の1つは、畳み込みニューラルネットワーク分類器システムとその用途、畳み込みニューラルネットワーク分類器システムの訓練方法、および畳み込みニューラルネットワーク分類器システムを利用して対象物を分類する方法とその用途を提供することにある。
以下に、本発明を簡単に説明して本発明の基本的な理解を提供する。この簡単な説明は、本発明に対する網羅的なものではない。また、本発明の肝心部分又は重要部分を決定する意図がなく、本発明の範囲を限定する意図もなく、簡単な形式で幾つかの概念を提供して後述のより詳しい説明の先行説明とすることに過ぎないことは、理解されるところである。
本発明の一観点によれば、畳み込みニューラルネットワーク分類器システムが提供される。当該システムは、互いに異種であるM種類の畳み込みニューラルネットワーク分類器を有し、Mは1より大きい整数である;このうち、各種類の畳み込みニューラルネットワーク分類器は、複数の互いに同種の畳み込みニューラルネットワーク分類器を含む。
本発明の他の一観点によれば、前記畳み込みニューラルネットワーク分類器システムを訓練する方法が提供される。当該方法は、訓練サンプルを利用してカスケード構造中の全てのレベルの畳み込みニューラルネットワーク分類器を訓練し、また、各レベルの畳み込みニューラルネットワーク分類器の中の複数の畳み込みニューラルネットワーク分類器に対して、それぞれのオリジナル訓練サンプルをランダムに変形させることと;第一レベルの畳み込みニューラルネットワーク分類器を利用してオリジナル訓練サンプルを分類することと;第一レベルの畳み込みニューラルネットワーク分類器で分類しにくい訓練サンプルを、第二レベルの畳み込みニューラルネットワーク分類器全体の訓練サンプルとして、第二レベルの畳み込みニューラルネットワーク分類器を訓練することと;第二レベルの畳み込みニューラルネットワーク分類器から第Mレベルの畳み込みニューラルネットワーク分類器までの任意の隣接する2つのレベルについて順次に前記のステップを繰り返すことと、を含む。
本発明の他の一観点によれば、前記畳み込みニューラルネットワーク分類器システムを利用して対象物を分類する方法が提供される。この方法は、第一レベルの畳み込みニューラルネットワーク分類器を利用して対象物を分類することと;第二レベルの畳み込みニューラルネットワーク分類器を利用して第一レベルの畳み込みニューラルネットワーク分類器にとって分類しにくい対象物を分類することと;第二レベルの畳み込みニューラルネットワーク分類器から第Mレベルの畳み込みニューラルネットワーク分類器までの全ての隣接する2つのレベルについて順次に前記のステップを繰り返すことと、を含む。
また、本発明の他の一観点によれば、前記畳み込みニューラルネットワーク分類器システムを識別数字に用いる用途が提供される。
本発明の他の一観点によれば、前記分類方法を識別数字に用いる用途が提供される。
また、本発明の他の一観点によれば、前記方法を実現する的コンピュータプログラムが提供される。
本発明の他の一観点によれば、少なくともコンピュータ読み取り可能な媒体形式のコンピュータプログラム製品が提供され、その中に前記方法を実現させるコンピュータプログラムコードが格納されている。
図面による本発明に対する以下の説明を参照すると、本発明の上記及び他利点がより明らかになるであろう。
図面による本発明に対する以下の説明を参照すると、本発明の上記及び他の目的、特徴、利点がより明らかになるであろう。図面における構成要素は単に本発明の原理を示すものである。図面において、同一又は対応する技術的特徴又は構成要素について同一又は対応する符号で示す。
本発明の一実施例の畳み込みニューラルネットワーク分類器システム100を示すブロック図である。 本発明のもう1つの実施例の畳み込みニューラルネットワーク分類器システム200を示すブロック図である。 空間線形サンプリング型畳み込みニューラルネットワーク分類器を示す概略図; 線形サンプリングの操作方法を示す図である。 ランダムに一部の層の間の連結を省略した空間線形サンプリング型畳み込みニューラルネットワーク分類器を示す概略図である。 空間非線形サンプリング型畳み込みニューラルネットワーク分類器を示す概略図である。 空間非線形サンプリングの操作過程を示す概略図である。 ランダムに一部の層の間の連結を省略した空間線形サンプリング型畳み込みニューラルネットワーク分類器を示す概略図である。 空間サンプリング層のない畳み込みニューラルネットワーク分類器を示す概略図である。 ランダムに一部の層の間の連結を省略し、空間サンプリング層のない畳み込みニューラルネットワーク分類器を示す概略図である。 畳み込みニューラルネットワーク分類器システムの訓練方法1100を示す的フローチャートである。 畳み込みニューラルネットワーク分類器システムを利用して対象物を分類する方法1200を示すフローチャートである。 本発明の実施に用いることのできる計算設備の例のブロック構成図である。
以下、図面を参照しながら、本発明の実施例について説明を行う。本発明のある図面またはある実施形態に記載の要素と技術的特徴は、1つまたは複数の他の図面または実施形態における要素と技術的特徴と組み合せることができる。また、注意すべきなのは、明瞭に説明するために、図面および明細書には本発明に関係のない、当業者が既知の要素と処理の表示と記載が省略されている。
図1は、本発明の実施例の畳み込みニューラルネットワーク分類器システム100を示すブロック図である。
図1に示されたように、畳み込みニューラルネットワーク分類器システム100は、互いに異種であるM種類の畳み込みニューラルネットワーク分類器、即ち、第一種類の畳み込みニューラルネットワーク分類器T1から第M種類の畳み込みニューラルネットワーク分類器TMを有する。ここで、Mは1より大きい整数である。
各種類の畳み込みニューラルネットワーク分類器は、複数の互いに同種類の畳み込みニューラルネットワーク分類器を有する。図1に示されたように、第一種類の畳み込みニューラルネットワーク分類器T1は、3つの畳み込みニューラルネットワーク分類器CNN-1を、第二種類の畳み込みニューラルネットワーク分類器T2は、3つの畳み込みニューラルネットワーク分類器CNN-2を,第M種類の畳み込みニューラルネットワーク分類器TMは、3つの畳み込みニューラルネットワーク分類器CNN-Mをそれぞれ有する。
ここでは、例示的に各種類の畳み込みニューラルネットワーク分類器が3つの互いに同種類の畳み込みニューラルネットワーク分類器を有することを示しているが、実際に各種類の畳み込みニューラルネットワーク分類器が有する畳み込みニューラルネットワーク分類器の数は3つに限らず、任意の数であってもよい、且つそれぞれ異なる数を有することができる。
図2は、本発明の実施例の畳み込みニューラルネットワーク分類器システム200を示すブロック図である。
図2に示されたように、畳み込みニューラルネットワーク分類器システム200は、三種類の畳み込みニューラルネットワーク分類器を有し、それぞれ第一種類の畳み込みニューラルネットワーク分類器T1、第二種類の畳み込みニューラルネットワーク分類器T2および第三種類の畳み込みニューラルネットワーク分類器T3である。この3種類の畳み込みニューラルネットワーク分類器は、互いに異種であり、且つ3つのレベルのカスケード構造を有する。
図2に示されたように、第一レベルの畳み込みニューラルネットワーク分類器T1は、分類対象の対象物を分類することができる。第二レベルの畳み込みニューラルネットワーク分類器T2は、第一レベルの畳み込みニューラルネットワーク分類器T1にとって分類しにくい対象物を分類することができる。第三レベルの畳み込みニューラルネットワーク分類器T3は、第二レベルの畳み込みニューラルネットワーク分類器T2にとって分類しにくい対象物を分類することができる。全てのレベルの畳み込みニューラルネットワーク分類器を利用して、全てのレベルの畳み込みニューラルネットワーク分類器にとって分類しにくい対象物(ここでは、第三レベルの畳み込みニューラルネットワーク分類器にとって分類しにくい対象物)に投票を行い、対象物の類別を決定する。例えば、本明細書でいう「分類しにくい」とは、分類対象の対象物に対する誤分類又は誤識別を表し、或いは、分類対象の対象物に対する分類又は識別は正しいが、信頼度が低いことを表すことができる。
各レベルの畳み込みニューラルネットワーク分類器は、複数の互いに同種類の畳み込みニューラルネットワーク分類器を有することができる。例えば、各レベルの畳み込みニューラルネットワーク分類器内の複数の互いに同種類の畳み込みニューラルネットワーク分類器が投票を通じて、対象物を分類することができる。
また、図2には3つのレベルのカスケード構造を示しているが、これは単に例示的なものである。実際に、畳み込みニューラルネットワーク分類器システム200は、2つのレベル以上の任意のカスケード構造であってもよい。仮に、畳み込みニューラルネットワーク分類器システム200がMレベルのカスケード構造であれば、対象物を分類するときに、第一レベルの畳み込みニューラルネットワーク分類器から第Mレベルの畳み込みニューラルネットワーク分類器までの全ての隣接する2つのレベルに対して、順次に前記操作を行い、即ち、現在のレベルの畳み込みニューラルネットワーク分類器は、分類対象の対象物を分類し、次のレベルの畳み込みニューラルネットワーク分類器は、現在のレベルで分類しにくい対象物をさらに分類する。
また、互いに異種である第一種類の畳み込みニューラルネットワーク分類器T1、第二種類の畳み込みニューラルネットワーク分類器T2および第三種類の畳み込みニューラルネットワーク分類器T3を十分に活用して対象物を効率よく正確に分類するために、種類の異なる畳み込みニューラルネットワーク分類器の属性に基づいてカスケード構造を構築することができる。例えば、以下の方式でカスケード構造の各レベルの畳み込みニューラルネットワーク分類器を構築することができる:各種類のサンプルに対する効果にばらつきのない畳み込みニューラルネットワーク分類器をカスケード構造中の前レベルに配置し、特定の種類のサンプルに突出した効果を有する畳み込みニューラルネットワーク分類器をカスケード構造中の中間レベルに配置する。また、スパース連続型の広義の畳み込みニューラルネットワーク分類器をカスケード構造中の後ろのレベルに配置することができる。
本発明のカスケード構造中の各レベルの畳み込みニューラルネットワーク分類器は、以下分類器から選ぶことができ、且つこれらの分類器には限定されない:a) 空間線形サンプリング型畳み込みニューラルネットワーク分類器;b) ランダムに一部の層の間の連結を省略した空間線形サンプリング型畳み込みニューラルネットワーク分類器;c) 空間非線形サンプリング型畳み込みニューラルネットワーク分類器;d) ランダムに一部の層の間の連結を省略した非空間線形サンプリング型畳み込みニューラルネットワーク分類器;e) 空間サンプリング層のない畳み込みニューラルネットワーク分類器;およびf) ランダムに一部の層の間の連結を省略した、空間サンプリング層のない畳み込みニューラルネットワーク分類器。
以下、図3から図10を参照しながら、前記6種類の互いに異種である畳み込みニューラルネットワーク分類器について説明する。
図3は、空間線形サンプリング型畳み込みニューラルネットワーク分類器を示す概略図である。図4は、線形サンプリングの操作方法を示す図である。
図3に示されたように、空間線形サンプリング型畳み込みニューラルネットワーク分類器の典型的な構造(“FM”は特徴図である)は、入力層、交互に配置される畳み込み層と線形サンプリング層、最後に出力層を含む。ここで、畳み込み層と線形サンプリング層が交互に配置する回数は無制限である。
線形サンプリングの操作方法とは、図4に示されたように、1つの2x2のブロックの各成分と、それと同じ大きさの1つの線形窓関数の各成分との積和を求める(実際に大きさは2x2に限らない)。図3には、連結線両端にある特徴図については、連結線の右側の特徴図は、連結線の左側の特徴図を畳み込み又は線形サンプリングして得られたものである。
以下、畳み込み操作を説明する。例えば、図3において入力画像と特徴図FM11との間に連結線があり、且つこの連結線が畳み込み操作を表す場合、この連結線自身は1つのテンプレートとなり、FM11の計算式は、
FM11 = 入力画像 * 連結線上のテンプレートである。
ここで、「*」は畳み込み操作を表す。
また、例えば、図3において、FM31はFM21とFM22との間にそれぞれ連結線があり、且つ、この2本連結線が畳み込み操作を表す場合、この2本の連結線自身はそれぞれ1つのテンプレートに対応し、FM32の計算式は、
FM31 = FM21 * 連結線上のテンプレート + FM22 * 連結線上のテンプレートとなる。
ここで、「*」は畳み込み操作を表す。
以下、線形サンプリング操作について説明する。線形サンプリングの操作方法は、図4に示されたように、図4にあるFM31、FM41は、図3にあるFM31、FM41に対応する。特徴図FM31にある1つの2x2の画素ブロックの各成分と、同じ大きさの1つの線形窓関数の各成分との積和を求め、その結果を特徴図FM41の対応する画素に与える。計算式は、
Si=Pi・Wi ( i=1,2,3,4)となる。
実際に使用するときに、画素ブロックの大きさと線形窓関数は2x2に限らず、線形窓関数は、任意に設定することができる。
図5は、ランダムに一部の層の間の連結を省略した空間線形サンプリング型畳み込みニューラルネットワーク分類器を示す概略図である。
図3に示された空間線形サンプリング型畳み込みニューラルネットワーク分類器と比べると、図5に示された畳み込みニューラルネットワーク分類器の構造には一部の特徴図の間の連結(例えばFM21とFM31の間の連結)がランダムに取り除かれた。即ち、空間線形サンプリング型畳み込みニューラルネットワーク分類器 + スパースランダム連結。
図6は、空間非線形サンプリング型畳み込みニューラルネットワーク分類器を示す概略図である。
図3に示された空間線形サンプリング型畳み込みニューラルネットワーク分類器と比べ、図6に示された空間非線形サンプリング型畳み込みニューラルネットワーク分類器は、非線形サンプリングの操作方法を採用した。図7は、非線形サンプリングの操作過程を示す概略図である。
空間非線形サンプリングの操作方法は、図7に示されたように、図7のFM31、FM41は図6のFM31、FM41に対応する。特徴図FM31における1つの2x2の画素ブロックを1つの非線形窓関数に入れ、その結果を特徴図FM41の対応する画素に与える。実際に使用するときに、画素ブロックの大きさと線形窓関数は2x2に限らず、非線形窓関数の設定も任意である。比較的に良くみられる非線形窓関数として、最大値を取る、最小値を取る、或いは中間値を取るなどのものを含む。
図8は、一部の層の間の連結をランダムに省略した空間非線形サンプリング型畳み込みニューラルネットワーク分類器(即ち、空間非線形サンプリング型畳み込みニューラルネットワーク分類器 + スパースランダム連結)を示す概略図である。
図5の空間非線形サンプリング型畳み込みニューラルネットワーク分類器と比べ、図8に示された、一部の層の間の連結をランダムに省略した空間非線形サンプリング型畳み込みニューラルネットワーク分類器の一部の特徴図の間の連結、例えばFM21とFM31との間の連結がランダムに取り除かれた。
図9は、空間サンプリング層のない畳み込みニューラルネットワーク分類器を示す概略図である。
前の4種類の畳み込みニューラルネットワーク分類器と比べ、図9に示された空間サンプリング層のない畳み込みニューラルネットワーク分類器は、空間線形サンプリング層と非空間線形サンプリング層を有しない。
図10は、一部の層の間の連結をランダムに省略した、空間サンプリング層のない畳み込みニューラルネットワーク分類器(即ち,空間サンプリング層のない畳み込みニューラルネットワーク分類器 + スパースランダム連結)を示す概略図である。
図9に示された空間サンプリング層のない畳み込みニューラルネットワーク分類器と比べると、図10に示された空間サンプリング層のない畳み込みニューラルネットワーク分類器 + スパースランダム連結の典型的な構造は、一部の特徴図の間の連結、例えばFM31とFM51との間の連結がランダムに取り除かれた。
本発明の一実施例においては、畳み込みニューラルネットワーク分類器システム100または200は、当該畳み込みニューラルネットワーク分類器が対象物を分類するときに信頼度を計算する信頼度計算分類器(図1と図2には図示せず)をさらに有することができる。
実際に畳み込みニューラルネットワーク分類器を使用するときに、識別対象サンプルが与えられ、畳み込みニューラルネットワーク分類器は、予測した数字と対応する信頼度を出力する必要がある。カスケード構造中の各レベルの各畳み込みニューラルネットワーク分類器について、当該畳み込みニューラルネットワーク分類器を使ってその訓練サンプルを分類し、各訓練サンプルについて当該畳み込みニューラルネットワーク分類器から各層の少なくとも一部のノードの応答値を抽出し、応答値に基づいて信頼度計算分類器を訓練する。このようにして、特定のある層の情報だけではなく、畳み込みニューラルネットワーク分類器の各層の情報を十分に活用することができる。
具体的に言うと、畳み込みニューラルネットワーク分類器について、信頼度計算分類器を訓練する過程は以下の通りである:訓練サンプルを与え、それを畳み込みニューラルネットワーク分類器に送り込み前方伝播を行い、各層の少なくとも一部のニューロンノードの応答値を抽出し、応答値を利用して信頼度計算分類器を訓練する。実際に識別する過程では、現在の識別対象物を畳み込みニューラルネットワーク分類器に送り込み、且つ前方伝播を行い、当該畳み込みニューラルネットワーク分類器の分類結果を獲得する。同時に、前記少なくとも一部のニューロンノードの応答値を抽出し、当該応答値に基づいて訓練済みの信頼度計算分類器を利用して信頼度を計算する。
以下、信頼度計算分類器をサポートベクターマシンとする例について説明する。
訓練サンプルを与え、それを畳み込みニューラルネットワーク分類器に送り込み、前方伝播を行い、各層の少なくとも一部のニューロンノードの応答値を抽出し固有ベクトル(且つサンプル類別を記録する)を構成する。即ち、各訓練サンプルが1つの固有ベクトルを構成する。全ての固有ベクトルをサポートベクターマシン(Support Vector Machine, SVM)に送り込んで訓練し、各類別のサポートベクターを獲得する。これらのサポートベクターを信頼度の計算に用いる。具体的には、実際の識別の過程において、現在の識別対象のサンプルを畳み込みニューラルネットワーク分類器に送り込んで前方伝播を行った後、当該畳み込みニューラルネットワーク分類器の分類結果を獲得する。同時に、選択したニューロンノード応答値を抽出し固有ベクトルを構成し、この固有ベクトルの予測した数字の類別サポートベクターへの距離を計算し、この距離の逆数を信頼度とする。
以上、当該信頼度計算分類器がサポートベクターマシンであるケースを説明してきたが、ここでの信頼度計算分類器は、適当な任意の種類の分類器であってもよく、サポートベクターマシンに限らないことは、理解されるところである。
図11は、畳み込みニューラルネットワーク分類器システムの訓練方法1100のフローチャートである。
図11に示されたように、ステップS1102において、訓練サンプルを利用してカスケード構造中の全てのレベルの畳み込みニューラルネットワーク分類器を訓練する。ここで、各レベルの畳み込みニューラルネットワーク分類器の中の複数の畳み込みニューラルネットワーク分類器に対し、それぞれオリジナル訓練サンプルについてランダムに変形させる。ランダムに変形させることにより訓練サンプルを豊かにすることができる。このようにして、変形後のオリジナル訓練サンプルを利用して全ての畳み込みニューラルネットワーク分類器を訓練することにより、これらの畳み込みニューラルネットワーク分類器に一定の分類性能を持たせ、その後のレベル別の訓練に有利である。
ステップS1104において、ループ制御変数Nの初期値を1とすることができる。
ステップS1106において、第Nレベルの畳み込みニューラルネットワーク分類器を利用してオリジナル訓練サンプルを分類することができる。
ステップS1108において、第Nレベルの畳み込みニューラルネットワーク分類器が分類しにくい訓練サンプルを、第N+1レベルの畳み込みニューラルネットワーク分類器を訓練する全ての訓練サンプルとし、第N+1レベルの畳み込みニューラルネットワーク分類器を訓練する。ここで、信頼度および/または各訓練サンプル自身の既知のマークに基づいて各畳み込みニューラルネットワーク分類器が訓練サンプルを分類しにくいか否かを判断する。
ステップS1110において、ループ制御変数Nの値を1増加させる。
ステップS1112において、ループ制御変数NがM以上であるか否かを判断する。Mはカスケード構造のレベルであり、M ≧ 2である。
ステップS1112での判断結果、NがMより小さい場合には、ステップS1116に戻り、NがM以上である場合には、プロセスを終了する。
また、カスケード構造を構築する前に、幾つかの畳み込みニューラルネットワーク分類器を訓練することができる。また、各畳み込みニューラルネットワーク分類器は前記6種類の異種構造の1つである。訓練方法は、直接典型的な確率的勾配降下法を採用する。各畳み込みニューラルネットワーク分類器について複数回の訓練を行い、各回に複数のサンプルを使用する。訓練過程において、各サンプルが畳み込みニューラルネットワーク分類器に送り込まれる過程は以下の通りである:1つのサンプルを与え、当該サンプルにランダムに変形させた(ランダムに回転又は移動させる)後に、変形後のサンプルを畳み込みニューラルネットワーク分類器に送り込み、前方伝播を行い、それから確率的勾配降下法により後方伝播を行い、後方伝播の中で畳み込みニューラルネットワーク分類器の各層のパラメーターを修正する。
続いて、一定のルールに基づいて訓練済みの一部の畳み込みニューラルネットワーク分類器を選択してカスケード分類器を形成する。
また、各訓練済みの畳み込みニューラルネットワーク分類器について、全ての訓練サンプルを用いて、現在の畳み込みニューラルネットワーク分類器の各種類のサンプルにおける誤り率と、現在の畳み込みニューラルネットワーク分類器の全てのサンプルにおける平均誤り率を算出し、それから算出された数値に基づいて全ての訓練済みの畳み込みニューラルネットワーク分類器を以下の三種類に分類する:(1)、スパース連続型畳み込みニューラルネットワーク分類器;(2)、前記(1)を除き、平均誤り率の低い畳み込みニューラルネットワーク分類器;および(3)、ある種類のサンプルにおいて低い誤り率を有する畳み込みニューラルネットワーク分類器。それから、前記各種類の畳み込みニューラルネットワーク分類器からそれぞれ一部の畳み込みニューラルネットワーク分類器を選出して、カスケード構造に用いる。好ましくは、以下の方式でカスケード構造を構築する。即ち、第(2)類の畳み込みニューラルネットワーク分類器をカスケード構造の前寄りのレベルに配置し、第(3)類の畳み込みニューラルネットワーク分類器をカスケード構造の中間レベルに配置し、第(1)類をカスケード構造の後寄りのレベルに配置する。
また、信頼度計算分類器を利用して信頼度を算出することができる。まず、信頼度計算分類器を訓練する。具体的に言うと、カスケード構造中の各レベルの各畳み込みニューラルネットワーク分類器について、当該畳み込みニューラルネットワーク分類器を用いてサンプル分類の訓練を行い、各訓練サンプルについて当該畳み込みニューラルネットワーク分類器から各層の少なくとも一部のノードの応答値を抽出し、且つ応答値を利用して信頼度計算分類器を訓練する。それから、当該畳み込みニューラルネットワーク分類器が対象物を分類するときに、信頼度を利用して分類器計算信頼度を算出する。好ましくは、前記各層の少なくとも一部のノードは、後ろから第二層の少なくとも一部のノードを含む。
図12は、畳み込みニューラルネットワーク分類器システムを利用して対象物を分類する方法1200のフローチャートである。
図12に示されたように、ステップS1202では、ループ制御変数Nの初期値を1とする。
ステップS1204では、第Nレベルの畳み込みニューラルネットワーク分類器を利用して対象物を分類する。
ステップS1206では、第N+1レベルの畳み込みニューラルネットワーク分類器を利用して第Nレベルの畳み込みニューラルネットワーク分類器が分類しにくい対象物を分類する。
ステップS1208では、ループ制御変数Nの値を1増加させる。
ステップS1210では、NがM以上であるか否かを判断する。ここで、Mはカスケード構造のレベル数であり、且つM ≧ 2である。
ステップS1210での判断結果、NがMより小さい場合には、ステップS1204に戻り、NがM以上である場合には、プロセスを終了する。
また、信頼度計算分類器を利用して信頼度を算出することができる。各分類対象物についてカスケード構造中の各レベルの各畳み込みニューラルネットワーク分類器が各訓練サンプルを分類するときの相応ノードの応答値を抽出する;応答値に基づいて、信頼度計算分類器を利用して信頼度を計算する。前記所定のノードは後ろから第二層の少なくとも一部のノードを含む。
信頼度に基づいて各レベルの中の各畳み込みニューラルネットワーク分類器が対象物を分類しにくいか否かを判断する。
本発明の畳み込みニューラルネットワーク分類器システムは数字の識別に用いられることができる。畳み込みニューラルネットワーク分類器システムを利用する分類方法も数字の識別に用いられることができる。
以下、3つのレベルのカスケード構造の畳み込みニューラルネットワーク分類器システムを用いて手書き文字の識別を行う過程を説明する。ここでは信頼度も使用される。
まず、1つの識別対象物を与え、それを第一レベルの畳み込みニューラルネットワーク分類器に送り込む。当該レベルの畳み込みニューラルネットワーク分類器は、予測した数字と対応する信頼度という2つの値を出力する。信頼度が所定の閾値より大きい場合には、識別の結果が信頼でき、識別の結果を直接出力し、その後のステップを行わない。そうでなければ、当該識別対象物を第二レベルの畳み込みニューラルネットワーク分類器に送り込み、第一レベルの畳み込みニューラルネットワーク分類器のときのプロセスを繰り返す。信頼度が所定の閾値より小さい場合には、当該識別対象物を第三レベルの畳み込みニューラルネットワーク分類器に送り込み、第一レベルの畳み込みニューラルネットワーク分類器のときのプロセスを繰り返す。もし第三レベルの畳み込みニューラルネットワーク分類器を経た後にも信頼度がまだ所定の閾値より小さい場合には、全てのレベルの畳み込みニューラルネットワーク分類器の投票により当該識別対象物の識別結果を獲得する。
ここで注意すべきなのは、ここの各レベルの畳み込みニューラルネットワーク分類器は複数の互いに同種類の畳み込みニューラルネットワーク分類器を含むことができる。このとき、各レベルの出力は、当該レベル内の全ての畳み込みニューラルネットワーク分類器の投票によって決定され、信頼度は、当該レベル内の全ての畳み込みニューラルネットワーク分類器の信頼度によるものである。例えば、当該レベル内の全ての畳み込みニューラルネットワーク分類器が出力する信頼度の平均値を取ることができる。
本発明の技術による、国際標準手書き数字データベースMNISTに対する識別正確度は、一部の国際的に有名な方法、特に単一種類の畳み込みニューラルネットワーク分類器による方法より高い。以下、本発明の技術がよい技術効果をもたらす理由について説明する。
まず、本発明の技術は、多種類の異種畳み込みニューラルネットワーク分類器間の非関連性を利用したため、識別の正確度をあげるときの投票の役割を高めた。複数の分類器による投票は、より高い識別率を実現することができる。但し、より高い識別率を実現する前提条件として、これらの分類器が非関連的であり、例えば、異種である必要がある。大量の同一種類の分類器による投票は、必ずしも識別率を大幅に上げることができない。本発明の技術は、多種類の異種畳み込みニューラルネットワーク分類器によって投票を行うため、この前提要件を満たしている。
次に、本発明の技術は、一部従来の方法より畳み込みニューラルネットワーク分類器が提供するパターン情報を十分に利用することができる。本発明の技術では、畳み込みニューラルネットワーク分類器の各層から抽出した一部の特徴図を利用して固有ベクトルを形成し、これにより畳み込みニューラルネットワーク分類器の識別結果の信頼度をはかるため、畳み込みニューラルネットワーク分類器の最後の一層の情報だけに頼ることなく、畳み込みニューラルネットワーク分類器の各層が提供する情報を充分に活用することができる。パターン認識理論から見ると、畳み込みニューラルネットワーク分類器の中の各層のニューロンノードが一定のパターン情報を提供しているので、もし最後の一層の情報だけを利用すると、中間各層が提供するパターン情報が失われてしまうことになる。
また、畳み込みニューラルネットワーク分類器によらない既存の手書き数字識別方法と比較すると、本発明の技術に採用される畳み込みニューラルネットワーク分類器の構造は、大量の有用且つ事前に知られていない特徴を、入力されたサンプルから自動的に学習することができることに対し、既存の方法は、抽出すべき特徴を事前に手動で設定する必要がある。従って、既存の方法で抽出できる特徴の数が限られており、且つ特徴設定の段階では人手を要する。
以上、具体的な実施例を用いて本発明の基本原理について説明したが、強調すべきなのは、本発明の方法と装置の全て又はいずれのステップ又は構成要素が、任意の計算装置(プロセッサや記憶媒体等を含む)または計算装置のネットワークにおいて、ハードウェア、ファームウェア、ソフトウェアまたはそれらの組合せにより実現できることは、当業者にとって理解されるところである。また、これは当業者が本発明の明細書を読んだ上で彼らの基本的なプログラミングスキルを利用して実現できるものである。
従って、本発明の目的は、任意の計算装置において1つ又は1組のプログラムを実行することにより実現することができる。前記計算装置は従来の汎用装置であってもよい。また、本発明の目的は、前記方法又は装置を実現するプログラムコードを含むプログラム製品を提供するだけで実現される。即ち、このようなプログラム製品も本発明を構成するものであり、且つこのようなプログラム製品を格納した記憶媒体も本発明を構成するものである。もとろん、前記記憶媒体は、任意の従来の記憶媒体又は将来開発される任意の記憶媒体であってもよい。
ソフトウェアおよび/またはファームウェアを通じて本発明の実施例を実現する場合、記憶媒体またはネットワークを通じて専用ハードウェア構造を有するコンピュータ、例えば、図13に示されたような汎用コンピュータ1300に当該ソフトウェアを構成するプログラムをインストールし、当該コンピュータは、各種類のプログラムがインストールされたときに、各種の機能等を実行することができる。
図13では、セントラル・プロセッシング・ユニット(CPU)1301は、読み取り専用メモリ(ROM)1302に格納されたプログラムまたは記憶部1308からランダム・アクセス・メモリ(RAM)1303にアップロードされたプログラムにより各種の処理を実行する。RAM1303には、必要に応じてCPU1301が各種の処理を実行するときに必要なデータを記憶する。CPU1301、ROM1302とRAM1303はバス1304を介して互いに連結する。入力/出力インターフェース1305もバス1304に接続される。
以下の要素も入力/出力インターフェース1305に接続される:キーボードやマウス等を含む入力部1306;例えばブラウン管(CRT)や液晶ディスプレイ(LCD)等のモニタやスピーカー等を含む出力部1307;ハードディスク等を含む記録部1308;例えばLANカード等のネットワークインタフェースカードやモデム等を含む通信部1309。また、通信部1309はネットワーク、例えばインターネットを介して通信処理を行う。必要に応じて、ドライブ1310も入力/出力インターフェース1305に接続される。取り外し可能な媒体1311、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体記憶装置等を、必要に応じてドライブ1310に挿入し、その中から読み出されたコンピュータプログラムは必要に応じて記録部1308にインストールされる。
ソフトウェアを通じて前記一連の処理を実現する場合、ネットワーク、例えばインターネット、または記憶媒体、例えば取り外し可能な媒体1311からソフトウェアを構成するプログラムをインストールする。
当業者が理解されるように、ここでの記録媒体は、図13に示されたような、中にプログラムが記録され、設備と分離して配布しユーザにプログラムを提供する取り外し可能な媒体1311には限らない。取り外し可能な媒体711の例として、磁気ディスク(フロッピーディスク(登録商標)を含む)、光ディスク(コンパクトディスク(CD)による読み出し専用メモリー(CD-ROM)とデジタル多用途ディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標)を含む)と半導体記憶装置などを含む。また、記録媒体は、ROM1302や記録部1308に含まれるハードディスクであっても良い。その中にプログラムが記録され、且つそれを記録する設備と一緒にユーザに配布される。
本発明は、機械読み取り可能な命令コードを格納したプログラム製品を提供する。命令コードが機械に読み取りされ且つ実行されるときに、前記本発明の実施例の方法を実行することができる。
また、前記機械読み取り可能な命令コードを格納したプログラム製品の記憶媒体も本発明の開示に含まれる。記憶媒体はフロッピーディスク、磁気ディスク、光ディスク、メモリカード、メモリスティック等を含む。
ここでの実施例は例示的なものであり、本発明はこれらの実施例に限定されないことは、当業者に理解されるところである。
本明細書にある「第一」、「第二」及び「第N」等の記載は、関連特徴を文字上区別し、本発明をより明瞭に記載するためである。従って、限定的な意味合いは有しない。
例として、前記方法の各ステップおよび前記設備の各構成モジュールおよび/またはユニットは、ソフトウェア、ファームウェア、ハードウェアまたはその組合せによって実現でき、且つその設備の中の一部となる。前記設備の各構成モジュールやユニットがソフトウェア、ファームウェア、ハードウェアまたはその組合せにより結合されるときに使用可能な手段または方式は、当業者に熟知されているため、ここでは、その説明を省略した。
例として、ソフトウェアまたはファームウェアを通じて本発明を実現する場合、記憶媒体またはネットワークから専用ハードウェア構造を有するコンピュータ(例えば、図13に示された汎用コンピュータ1300)に当該ソフトウェアを構成するプログラムをインストールすることができる。当該コンピュータは、各種のプログラムがインストールされたときに、各種の機能を実現できる。
1つの実施形態について記載および/または図示した特徴は同一または類似の方法で1つまたは複数の他の実施形態で使用することができ、また、その他の実施形態の中の特徴と組合せ、または他の実施形態の特徴を代替することもできる。
強調すべきなのは、用語「含む/備える」は、本明細書において特徴、要素、ステップまたはモジュールの存在を表し、1つまたは複数の他の特徴、要素、ステップまたはモジュールの存在または付加を排除しない。
また、本発明の方法は、明細書に説明された時間順で行なわれることに限らず、他の時間順で、又は並行して、又は単独で実行することもできる。従って、本発明の技術的範囲は、明細書に記載の方法の実行順番に限定されない。
本発明は、添付の請求の範囲の要旨と範囲内に本発明に対する様々な変更、改善又は均等物を設計することができるものと認めるべきである。且つ、本発明の範囲は明細書に記載の過程、設備、手段、方法とステップの具体的な実施例に限定されない。当業者は、本発明に開示された内容から本発明の実施例に基本的に同じ機能を有し、基本的に同じ効果を奏する既存の、または将来開発される過程、設備、手段、方法またはステップを使用又は実行することができる。従って、添付の請求の範囲の要旨は、このような過程、設備、手段、方法またはステップを含む。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
畳み込みニューラルネットワーク分類器システムであって、
互いに異種であるM種類の畳み込みニューラルネットワーク分類器を備え、前記Mは1より大きい整数であり、
各種類の前記畳み込みニューラルネットワーク分類器は、複数の互いに同種類の畳み込みニューラルネットワーク分類器を備える、
ことを特徴とする畳み込みニューラルネットワーク分類器システム。
(付記2)
前記互いに異種であるM種類の畳み込みニューラルネットワーク分類器をMレベルのカスケード構造に配置する付記1に記載の畳み込みニューラルネットワーク分類器システム。
(付記3)
第一レベルの畳み込みニューラルネットワーク分類器は、対象物の分類に用いられ、
第二レベルの畳み込みニューラルネットワーク分類器は、前記第一レベルの畳み込みニューラルネットワーク分類器にとって分類しにくい対象物の分類に用いられ、
前記第二レベルの畳み込みニューラルネットワーク分類器から第Mレベルの畳み込みニューラルネットワーク分類器までの全ての隣接する2つのレベルについて順次に前記操作を繰り返す、
付記2に記載の畳み込みニューラルネットワーク分類器システム。
(付記4)
各レベルの前記畳み込みニューラルネットワーク分類器内の前記複数の互いに同種類の畳み込みニューラルネットワーク分類器は、投票を通じて前記対象物を分類する、
付記2に記載の畳み込みニューラルネットワーク分類器システム。
(付記5)
各種類のサンプルに対する効果にばらつきのない畳み込みニューラルネットワーク分類器は、前記カスケード構造中の前寄りのレベルに配置され、
特定の種類のサンプルに突出した効果がある畳み込みニューラルネットワーク分類器布置は、前記カスケード構造中の中間レベルに配置されるように、
前記カスケード構造中の各レベルの畳み込みニューラルネットワーク分類器を配置する、
付記2乃至4の何れかに記載の畳み込みニューラルネットワーク分類器システム。
(付記6)
スパース連続型の広義の畳み込みニューラルネットワーク分類器を前記カスケード構造中の後ろ寄りのレベルに配置する、
付記5に記載の畳み込みニューラルネットワーク分類器システム。
(付記7)
前記カスケード構造中の各レベルの畳み込みニューラルネットワーク分類器は、
a)空間線形サンプリング型畳み込みニューラルネットワーク分類器と、
b)一部の層の間の連結がランダムに省略された空間線形サンプリング型畳み込みニューラルネットワーク分類器と、
c)空間非線形サンプリング型畳み込みニューラルネットワーク分類器と、
d)一部の層の間の連結がランダムに省略された空間非線形サンプリング型畳み込みニューラルネットワーク分類器と、
e)空間サンプリング層のない畳み込みニューラルネットワーク分類器と、
f)一部の層の間の連結がランダムに省略され空間サンプリング層のない畳み込みニューラルネットワーク分類器、
から選ばれる付記1乃至6の何れかに記載の畳み込みニューラルネットワーク分類器システム。
(付記8)
前記畳み込みニューラルネットワーク分類器が前記対象物を分類するときに、信頼度を算出する信頼度計算分類器をさらに備え、
前記カスケード構造中の各レベルの中の各畳み込みニューラルネットワーク分類器について、当該畳み込みニューラルネットワーク分類器を用いてそのサンプル分類の訓練を行い、各訓練サンプルに対して前記畳み込みニューラルネットワーク分類器の各層から少なくとも一部のノードの応答値を抽出し、
前記応答値に基づいて前記信頼度計算分類器を訓練する
付記1乃至7の何れかに記載の畳み込みニューラルネットワーク分類器システム。
(付記9)
全てのレベルの畳み込みニューラルネットワーク分類器を用いて全てのレベルの畳み込みニューラルネットワーク分類器が分類しにくい対象物に対して投票を行うことにより、前記対象物の類別を決定する
付記3乃至8の何れかに記載の畳み込みニューラルネットワーク分類器システム。
(付記10)
付記2乃至9の何れかに記載の畳み込みニューラルネットワーク分類器システムを用いて訓練を行う方法であって、
訓練サンプルを利用して前記カスケード構造中の全てのレベルの畳み込みニューラルネットワーク分類器を訓練し、各レベルの畳み込みニューラルネットワーク分類器の中の複数の畳み込みニューラルネットワーク分類器に対してそれぞれオリジナル訓練サンプルをランダムに変形させ、
前記第一レベルの畳み込みニューラルネットワーク分類器を利用して前記オリジナル訓練サンプルを分類し、
前記第一レベルの畳み込みニューラルネットワーク分類器にとって分類しにくい訓練サンプルを、第二レベルの畳み込みニューラルネットワーク分類器を訓練するための全ての訓練サンプルとし、前記第二レベルの畳み込みニューラルネットワーク分類器を訓練し、
前記第二レベルの畳み込みニューラルネットワーク分類器から前記第Mレベルの畳み込みニューラルネットワーク分類器までの任意の隣接する2つのレベルについて順次に前記のステップを繰り返す、
ことを含む方法。
(付記11)
前記カスケード構造中の各レベルの中の各畳み込みニューラルネットワーク分類器について、当該畳み込みニューラルネットワーク分類器を用いてそのサンプル分類の訓練を行い、各訓練サンプルについて当該畳み込みニューラルネットワーク分類器から各層の少なくとも一部のノードの応答値を抽出し、
前記応答値を利用して信頼度計算分類器を訓練し、前記信頼度計算分類器は、当該畳み込みニューラルネットワーク分類器が前記対象物を分類するときの信頼度を計算する
付記10に記載の方法。
(付記12)
各層の少なくとも一部のノードは、後ろから第二層の少なくとも一部のノードを含む
付記11に前記の方法。
(付記13)
信頼度および/または各訓練サンプル自身の既知のマークに基づいて各畳み込みニューラルネットワーク分類器が前記訓練サンプルを分類しにくいか否か判断する
付記10乃至12の何れかに記載の方法。
(付記14)
付記1乃至9の何れかに記載の畳み込みニューラルネットワーク分類器システムを利用して対象物を分類する方法であって、
前記第一レベルの畳み込みニューラルネットワーク分類器を利用して前記対象物を分類し、
第二レベルの畳み込みニューラルネットワーク分類器を利用して前記第一レベルの畳み込みニューラルネットワーク分類器にとって分類しにくい前記対象物を分類し、
前記第二レベルの畳み込みニューラルネットワーク分類器から第Mレベルの畳み込みニューラルネットワーク分類器までの全ての隣接する2つのレベルについて順次に前記のステップを繰り返す
ことを含む方法。
(付記15)
全てのレベルの畳み込みニューラルネットワーク分類器を利用して全てのレベルの畳み込みニューラルネットワーク分類器が分類しにくい対象物について投票を行うことにより前記対象物の類別を決定する、
付記14に記載の方法。
(付記16)
各分類対象物について、前記カスケード構造中の各レベルの各畳み込みニューラルネットワーク分類器が各訓練サンプルを分類するときの相応ノードの応答値を抽出し、
前記応答値に基づいて、前記信頼度計算分類器を利用して信頼度を計算する、
付記14に記載の方法。
(付記17)
前記所定のノードは、後ろから第二層の少なくとも一部のノードを含む
付記16に記載の方法。
(付記18)
信頼度に基づいて各レベルの中の各畳み込みニューラルネットワーク分類器が前記対象物を分類しにくいか否かを判断する
付記10乃至17の何れかに記載の方法。
(付記19)
付記1乃至9の何れかに記載の畳み込みニューラルネットワーク分類器システムを利用して数字を識別する用途。
(付記20)
付記14乃至18の何れかに記載の方法を利用して数字を識別する用途。

Claims (7)

  1. 畳み込みニューラルネットワーク分類器システムであって、
    互いに異種であるM種類の畳み込みニューラルネットワーク分類器を備え、前記Mは1より大きい整数であり、
    各種類の前記畳み込みニューラルネットワーク分類器は、複数の互いに同種類の畳み込みニューラルネットワーク分類器を備え
    前記互いに異種であるM種類の畳み込みニューラルネットワーク分類器をMレベルのカスケード構造に配置し、
    各種類のサンプルに対する効果にばらつきのない畳み込みニューラルネットワーク分類器は、前記カスケード構造中の前寄りのレベルに配置され、
    特定の種類のサンプルに突出した効果がある畳み込みニューラルネットワーク分類器は、前記カスケード構造中の中間レベルに配置されるように、前記カスケード構造中の各レベルの畳み込みニューラルネットワーク分類器を配置する、畳み込みニューラルネットワーク分類器システム。
  2. 第一レベルの畳み込みニューラルネットワーク分類器は、対象物の分類のための第一分類操作に用いられ、
    第二レベルの畳み込みニューラルネットワーク分類器は、前記第一レベルの畳み込みニューラルネットワーク分類器にとって分類しにくい対象物の分類のための第二分類操作に用いられ、
    前記第二レベルの畳み込みニューラルネットワーク分類器から第Mレベルの畳み込みニューラルネットワーク分類器までの全ての隣接する2つのレベルについて順次に前記第一分類操作及び前記第二分類操作を繰り返す、請求項に記載の畳み込みニューラルネットワーク分類器システム。
  3. 前記畳み込みニューラルネットワーク分類器が前記対象物を分類するときに、信頼度を算出する信頼度計算分類器をさらに備え、
    前記カスケード構造中の各レベルの中の各畳み込みニューラルネットワーク分類器について、当該畳み込みニューラルネットワーク分類器を用いてその訓練サンプルの分類を行い、各訓練サンプルについて前記畳み込みニューラルネットワーク分類器の各層から少なくとも一部のノードの応答値を抽出し、
    前記応答値に基づいて前記信頼度計算分類器を訓練する、請求項に記載の畳み込みニューラルネットワーク分類器システム。
  4. 請求項2又は3に記載の畳み込みニューラルネットワーク分類器システムを用いて訓練を行う方法であって、
    訓練サンプルを利用して前記カスケード構造中の全てのレベルの畳み込みニューラルネットワーク分類器を訓練し、そのうち、各レベルの畳み込みニューラルネットワーク分類器の中の複数の畳み込みニューラルネットワーク分類器についてそれぞれオリジナル訓練サンプルをランダムに変形させ、
    前記第一レベルの畳み込みニューラルネットワーク分類器を利用して前記オリジナル訓練サンプルを分類し、
    前記第一レベルの畳み込みニューラルネットワーク分類器にとって分類しにくい訓練サンプルを、前記第二レベルの畳み込みニューラルネットワーク分類器を訓練するための全ての訓練サンプルとし、前記第二レベルの畳み込みニューラルネットワーク分類器を訓練し、
    前記第二レベルの畳み込みニューラルネットワーク分類器から前記第Mレベルの畳み込みニューラルネットワーク分類器までの任意の隣接する2つのレベルについて順次に前記のステップを繰り返す、ことを含む方法。
  5. 前記カスケード構造中の各レベルの中の各畳み込みニューラルネットワーク分類器について、当該畳み込みニューラルネットワーク分類器を用いてその訓練サンプルの分類を行い、各訓練サンプルについて当該畳み込みニューラルネットワーク分類器から各層の少なくとも一部のノードの応答値を抽出し、
    前記応答値を利用して信頼度計算分類器を訓練し、前記信頼度計算分類器は、当該畳み込みニューラルネットワーク分類器が前記対象物を分類するときの信頼度を計算する、請求項に記載の方法。
  6. 請求項2又は3に記載の畳み込みニューラルネットワーク分類器システムを利用して対象物を分類する方法であって、
    前記第一レベルの畳み込みニューラルネットワーク分類器を利用して前記対象物を分類し、
    前記第二レベルの畳み込みニューラルネットワーク分類器を利用して前記第一レベルの畳み込みニューラルネットワーク分類器にとって分類しにくい前記対象物を分類し、
    前記第二レベルの畳み込みニューラルネットワーク分類器から前記第Mレベルの畳み込みニューラルネットワーク分類器までの全ての隣接する2つのレベルについて順次に前記のステップを繰り返す、ことを含む方法。
  7. 数字を識別する、請求項1乃至3の何れかに記載の畳み込みニューラルネットワーク分類器システム。
JP2013139882A 2012-08-31 2013-07-03 畳み込みニューラルネットワーク分類器システム、その訓練方法、分類方法および用途 Active JP6209879B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210320318.9 2012-08-31
CN201210320318.9A CN103679185B (zh) 2012-08-31 2012-08-31 卷积神经网络分类器系统、其训练方法、分类方法和用途

Publications (2)

Publication Number Publication Date
JP2014049118A JP2014049118A (ja) 2014-03-17
JP6209879B2 true JP6209879B2 (ja) 2017-10-11

Family

ID=50316674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013139882A Active JP6209879B2 (ja) 2012-08-31 2013-07-03 畳み込みニューラルネットワーク分類器システム、その訓練方法、分類方法および用途

Country Status (2)

Country Link
JP (1) JP6209879B2 (ja)
CN (1) CN103679185B (ja)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3129896B1 (en) * 2014-04-09 2024-02-14 Entrupy Inc. Authenticating physical objects using machine learning from microscopic variations
CN105095833B (zh) * 2014-05-08 2019-03-15 中国科学院声学研究所 用于人脸识别的网络构建方法、识别方法及系统
US20150324689A1 (en) * 2014-05-12 2015-11-12 Qualcomm Incorporated Customized classifier over common features
CN105447566B (zh) * 2014-05-30 2018-07-20 富士通株式会社 训练装置、训练方法以及检测装置
CN104036323B (zh) * 2014-06-26 2016-11-09 叶茂 一种基于卷积神经网络的车辆检测方法
CN104063719B (zh) * 2014-06-27 2018-01-26 深圳市赛为智能股份有限公司 基于深度卷积网络的行人检测方法及装置
CN104182735A (zh) * 2014-08-18 2014-12-03 厦门美图之家科技有限公司 训练优化的基于卷积神经网络的色情图像或视频检测方法
CN104244113B (zh) * 2014-10-08 2017-09-22 中国科学院自动化研究所 一种基于深度学习技术的视频摘要生成方法
US10650508B2 (en) * 2014-12-03 2020-05-12 Kla-Tencor Corporation Automatic defect classification without sampling and feature selection
CN107004138A (zh) * 2014-12-17 2017-08-01 诺基亚技术有限公司 利用神经网络的对象检测
CN105989375A (zh) * 2015-01-30 2016-10-05 富士通株式会社 对手写字符图像进行分类的分类器、分类装置和分类方法
CN105989368A (zh) * 2015-02-13 2016-10-05 展讯通信(天津)有限公司 一种目标检测方法及装置以及移动终端
JP6706788B2 (ja) 2015-03-06 2020-06-10 パナソニックIpマネジメント株式会社 画像認識方法、画像認識装置およびプログラム
CN104850890B (zh) * 2015-04-14 2017-09-26 西安电子科技大学 基于实例学习和Sadowsky分布的卷积神经网络参数调整方法
CN104850858B (zh) * 2015-05-15 2016-09-07 华中科技大学 一种注塑制品缺陷检测识别方法
CN104899610A (zh) * 2015-06-26 2015-09-09 小米科技有限责任公司 图片分类方法及装置
WO2017004803A1 (en) * 2015-07-08 2017-01-12 Xiaoou Tang An apparatus and a method for semantic image labeling
WO2017011702A1 (en) 2015-07-15 2017-01-19 Cylance Inc. Malware detection
CN105139033B (zh) * 2015-08-24 2018-11-06 小米科技有限责任公司 分类器构建方法及装置和图片处理方法及装置
KR101824600B1 (ko) * 2015-09-08 2018-03-14 에스케이플래닛 주식회사 단말장치를 이용한 신용카드 번호 및 유효기간 인식 시스템 및 방법
CN105426860B (zh) * 2015-12-01 2019-09-27 北京眼神智能科技有限公司 人脸识别的方法和装置
CN105550748A (zh) * 2015-12-09 2016-05-04 四川长虹电器股份有限公司 基于双曲正切函数的新型神经网络的构造方法
CN105550747A (zh) * 2015-12-09 2016-05-04 四川长虹电器股份有限公司 一种新型卷积神经网络的样本训练方法
CN105868689B (zh) * 2016-02-16 2019-03-29 杭州景联文科技有限公司 一种基于级联卷积神经网络的人脸遮挡检测方法
CN107220641B (zh) * 2016-03-22 2020-06-26 华南理工大学 一种基于深度学习的多语言文本分类方法
US10395356B2 (en) * 2016-05-25 2019-08-27 Kla-Tencor Corp. Generating simulated images from input images for semiconductor applications
US9589374B1 (en) * 2016-08-01 2017-03-07 12 Sigma Technologies Computer-aided diagnosis system for medical images using deep convolutional neural networks
US10599977B2 (en) 2016-08-23 2020-03-24 International Business Machines Corporation Cascaded neural networks using test ouput from the first neural network to train the second neural network
CN107784315A (zh) * 2016-08-26 2018-03-09 深圳光启合众科技有限公司 目标对象的识别方法和装置,及机器人
JP6490311B2 (ja) 2016-09-06 2019-03-27 三菱電機株式会社 学習装置、信号処理装置および学習方法
US10083171B1 (en) * 2017-08-03 2018-09-25 Gyrfalcon Technology Inc. Natural language processing using a CNN based integrated circuit
CN106488313A (zh) * 2016-10-31 2017-03-08 Tcl集团股份有限公司 一种台标识别方法及系统
CN108171103A (zh) * 2016-12-07 2018-06-15 北京三星通信技术研究有限公司 目标检测方法及装置
CN106777011A (zh) * 2016-12-07 2017-05-31 中山大学 一种基于深度多任务学习的文本分类方法
KR101944536B1 (ko) * 2016-12-11 2019-02-01 주식회사 딥바이오 뉴럴 네트워크를 이용한 질병의 진단 시스템 및 그 방법
KR101893679B1 (ko) * 2017-02-09 2018-08-30 한국기술교육대학교 산학협력단 딥 러닝을 이용한 카드번호 인식방법
KR101926392B1 (ko) 2017-02-22 2018-12-10 하트미디어(주) 병 회수 장치 및 방법
US11354577B2 (en) 2017-03-15 2022-06-07 Samsung Electronics Co., Ltd System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions
US10803378B2 (en) * 2017-03-15 2020-10-13 Samsung Electronics Co., Ltd System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions
WO2018216379A1 (ja) 2017-05-26 2018-11-29 株式会社日立国際電気 機械学習モデル不正検知システム及び不正検知方法
US11138724B2 (en) 2017-06-01 2021-10-05 International Business Machines Corporation Neural network classification
US10713783B2 (en) 2017-06-01 2020-07-14 International Business Machines Corporation Neural network classification
CN107247703A (zh) * 2017-06-08 2017-10-13 天津大学 基于卷积神经网络和集成学习的微博情感分析方法
CN109389136A (zh) * 2017-08-08 2019-02-26 上海为森车载传感技术有限公司 分类器训练方法
CN113627458A (zh) 2017-10-16 2021-11-09 因美纳有限公司 基于循环神经网络的变体致病性分类器
US11861491B2 (en) 2017-10-16 2024-01-02 Illumina, Inc. Deep learning-based pathogenicity classifier for promoter single nucleotide variants (pSNVs)
CN107944367B (zh) * 2017-11-16 2021-06-01 北京小米移动软件有限公司 人脸关键点检测方法及装置
CN109815971B (zh) * 2017-11-20 2023-03-10 富士通株式会社 信息处理方法和信息处理装置
CN108875901B (zh) * 2017-11-20 2021-03-23 北京旷视科技有限公司 神经网络训练方法以及通用物体检测方法、装置和系统
CN108280516B (zh) * 2018-03-05 2021-05-11 山东领能电子科技有限公司 一种多组卷积神经网络之间互博智能进化的优化方法
US10657425B2 (en) 2018-03-09 2020-05-19 Ricoh Company, Ltd. Deep learning architectures for the classification of objects captured with a light-field camera
CN108647310A (zh) * 2018-05-09 2018-10-12 四川高原之宝牦牛网络技术有限公司 识别模型建立方法及装置、文字识别方法及装置
CN108548976A (zh) * 2018-05-25 2018-09-18 杭州拓深科技有限公司 基于卷积神经网络的非入侵式家用用电设备类型检测方法
CN108830182B (zh) * 2018-05-28 2020-08-07 浙江工商大学 一种基于级联卷积神经网络的道线检测方法
CN109543816B (zh) * 2018-09-20 2022-12-06 中国科学院计算技术研究所 一种基于权重捏合的卷积神经网络计算方法和系统
CN110956190A (zh) * 2018-09-27 2020-04-03 深圳云天励飞技术有限公司 图像识别方法及装置、计算机装置和计算机可读存储介质
CN109583501B (zh) * 2018-11-30 2021-05-07 广州市百果园信息技术有限公司 图片分类、分类识别模型的生成方法、装置、设备及介质
CN111310516B (zh) * 2018-12-11 2023-08-29 杭州海康威视数字技术股份有限公司 一种行为识别方法和装置
CN109726761B (zh) * 2018-12-29 2023-03-31 青岛海洋科学与技术国家实验室发展中心 Cnn进化方法、基于cnn的auv集群工作方法、装置及存储介质
CN110472730A (zh) * 2019-08-07 2019-11-19 交叉信息核心技术研究院(西安)有限公司 一种卷积神经网络的自蒸馏训练方法和可伸缩动态预测方法
JP7453767B2 (ja) 2019-09-25 2024-03-21 キヤノン株式会社 情報処理装置、情報処理方法
JP7434829B2 (ja) 2019-11-21 2024-02-21 オムロン株式会社 モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム
JP2021082154A (ja) 2019-11-21 2021-05-27 オムロン株式会社 モデル生成装置、推定装置、モデル生成方法、及びモデル生成プログラム
US11790489B2 (en) 2020-04-07 2023-10-17 Samsung Electronics Co., Ltd. Systems and method of training networks for real-world super resolution with unknown degradations
US20230298753A1 (en) * 2020-07-23 2023-09-21 Deep Bio Inc. Method for annotating pathogenic site of disease by means of semi- supervised learning, and diagnosis system for performing same
CN112308058B (zh) * 2020-10-25 2023-10-24 北京信息科技大学 一种手写字符的识别方法
WO2022146250A1 (en) * 2020-12-30 2022-07-07 Ozyegin Universitesi A system and method for the management of neural network models
CN113109666B (zh) * 2021-04-09 2024-03-15 河南省博海大数据科技有限公司 一种基于深度卷积神经网络的轨道电路故障诊断方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100202425B1 (ko) * 1992-08-27 1999-06-15 정호선 가전제품의 리모콘 명령어를 인식하기 위한 음성 인식 시스템
US5822741A (en) * 1996-02-05 1998-10-13 Lockheed Martin Corporation Neural network/conceptual clustering fraud detection architecture
US6805668B1 (en) * 2001-06-26 2004-10-19 Cadwell Industries, Inc. System and method for processing patient polysomnograph data utilizing multiple neural network processing
US7016885B1 (en) * 2001-08-28 2006-03-21 University Of Central Florida Research Foundation, Inc. Self-designing intelligent signal processing system capable of evolutional learning for classification/recognition of one and multidimensional signals
CN100426314C (zh) * 2005-08-02 2008-10-15 中国科学院计算技术研究所 一种基于特征分组的多分类器组合人脸识别方法
CN101630367A (zh) * 2009-07-31 2010-01-20 北京科技大学 基于多分类器的手写体字符识别拒识方法
TWI415011B (zh) * 2009-12-17 2013-11-11 Ind Tech Res Inst 人臉辨識方法及應用此方法之系統

Also Published As

Publication number Publication date
CN103679185B (zh) 2017-06-16
JP2014049118A (ja) 2014-03-17
CN103679185A (zh) 2014-03-26

Similar Documents

Publication Publication Date Title
JP6209879B2 (ja) 畳み込みニューラルネットワーク分類器システム、その訓練方法、分類方法および用途
Zhao et al. Temporal action detection with structured segment networks
Gao et al. Deep label distribution learning with label ambiguity
US11093789B2 (en) Method and apparatus for object re-identification
US9002101B2 (en) Recognition device, recognition method, and computer program product
CN111611847B (zh) 基于尺度注意力空洞卷积网络的视频动作检测方法
CN111582009B (zh) 训练分类模型的装置和方法及利用分类模型分类的装置
CN108537119B (zh) 一种小样本视频识别方法
CN108399435B (zh) 一种基于动静特征的视频分类方法
US11514319B2 (en) Action prediction
US11138441B2 (en) Video action segmentation by mixed temporal domain adaption
CN109145766A (zh) 模型训练方法、装置、识别方法、电子设备及存储介质
JP2004054956A (ja) 顔/類似顔映像で学習されたパターン分類器を利用した顔検出方法及びシステム
JP2011198268A (ja) 情報処理装置および方法、並びにプログラム
CN110188827B (zh) 一种基于卷积神经网络和递归自动编码器模型的场景识别方法
CN110781818B (zh) 视频分类方法、模型训练方法、装置及设备
CN111160225B (zh) 基于深度学习的人体解析方法和装置
CN110909868A (zh) 基于图神经网络模型的节点表示方法和装置
CN110245227B (zh) 文本分类的融合分类器的训练方法及设备
CN114510939A (zh) 实体关系抽取方法、装置、电子设备及存储介质
CN114863091A (zh) 一种基于伪标签的目标检测训练方法
JP7427011B2 (ja) センサ入力信号からのコグニティブ・クエリへの応答
CN113312445B (zh) 数据处理方法、模型构建方法、分类方法及计算设备
CN112309375B (zh) 语音识别模型的训练测试方法、装置、设备及存储介质
Zhang et al. Recognition of emotions in user-generated videos through frame-level adaptation and emotion intensity learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170815

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170828

R150 Certificate of patent or registration of utility model

Ref document number: 6209879

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150