WO2020129235A1

WO2020129235A1 - 画像認識装置及び方法

Info

Publication number: WO2020129235A1
Application number: PCT/JP2018/047224
Authority: WO
Inventors: 竜弓場; 康隆豊田; 新藤　博之
Original assignee: 株式会社日立ハイテク
Priority date: 2018-12-21
Filing date: 2018-12-21
Publication date: 2020-06-25
Also published as: US12014530B2; KR102654003B1; US20210374403A1; TWI731459B; KR20210082222A; TW202029013A

Abstract

機械学習を用いた輪郭線抽出において、推論時の画像に最適な学習モデルを正解値あるいは確信度を必要とすることなく選択する。複数の特徴抽出用の学習モデルを格納する特徴抽出用学習モデル群と、特徴抽出用の学習モデルと対になった想起用の学習モデルを格納する想起用学習モデル群と、特徴抽出用の学習モデルを参照して入力データから特徴量を抽出する特徴量抽出部と、想起用の学習モデルを参照して特徴量の次元圧縮を伴う想起結果を出力するデータ間想起部と、特徴量と想起結果の差分が最小になることを条件に特徴抽出用学習モデル群の中から特徴抽出用の学習モデルを選択する学習モデル選択部を備えることを特徴とする。

Description

画像認識装置及び方法

　本発明は、例えば半導体パターンの検査における画像認識装置及び方法に関する。

　深層学習をはじめとした機械学習を用いたパターン認識は、様々な画像から種種のパターンを高精度に抽出することが可能であり、半導体パターン中から輪郭線を抽出する用途でも効果が期待できる。半導体パターン中から抽出された輪郭線は、半導体パターンの設計図との比較による形状評価等に用いられる。

　輪郭抽出において複数の種類の画像を推論対象として運用する場合、例えば半導体製造工程におけるリゾグラフィーやエッチング等の複数の製造工程の画像を推論対象として運用する場合等において、画像の種類毎に画像の見え方の差異が大きなときにおいて機械学習を用いた輪郭線抽出が一層高い性能を発揮するためには、学習モデルを分割することが望まれる。

　学習モデルとは、深層学習のネットワーク構造体の係数等のパラメータであって、画像と教師データ（学習の目標となる推論結果）の組からなる学習サンプルから、事前に学習モデルに応じた所定の学習演算を用いて計算されたものである。機械学習の性質上、画像から良好な輪郭線を抽出するためには、学習演算に用いる学習サンプルの中に、推論対象とする画像の画像特徴を備えた画像、すなわち推論対象と類似した画像が含まれている必要がある。輪郭線抽出がより高い性能を発揮するには、推論対象とする画像と類似しない画像が学習サンプル中に含まれないことが望まれる。これは学習演算によって、推論対象とする画像からの輪郭抽出に特化した学習モデルが得られるためである。

　一方で、複数の学習モデルを用意したときには、複数の学習モデルの中から最適な学習モデルを選択する方法が必要となってしまう。最適な学習サンプルとは、運用時に与えられる画像に対して、その画像から最も良好な輪郭線抽出ができる学習モデルを指す。

　特許文献１には、複数の学習モデルの中から、予測誤差が最も小さくなることを条件に最適な学習モデルを選択する方法が示されている。予測誤差とは、学習モデルを使って推論したときの予測値と正解値の間の誤差である。

　特許文献２には、確信度と呼ばれる指標を用いた選択方法によって、複数の学習モデルの中から最適な学習モデルを選択する方法が開示されている。確信度とは、学習モデルを用いて推論結果を出すまでの中間処理結果から計算される指標であり、推論結果の確からしさ（正解であることの期待値）の目安となる。

特開２００１－２３６３３７号公報特開２００１－３３９２６５号公報

　上記した特許文献１、特許文献２に記載の手法は、半導体パターンの検査における画像認識装置及び方法に適用して有用である。

　然しながら、この特許文献１の手法には、学習モデルの選択に正解値を必要とするという第１の課題がある。輪郭線抽出の正解値とは、画像中のあらゆる箇所において正確に抽出された輪郭線の推論結果である。正確に抽出された輪郭線は、例えば人手で画像中の各画素に輪郭線抽出の正解値を割り振ることで入手可能であるが、これを推論対象とする画像毎に用意するのは、運用開始までに作業時間と作業工数を要してしまう。

　また、特許文献２において着目する確信度は学習モデルの種類（機械学習の数理モデルや深層学習のネットワーク構造等）によって尺度が異なるために、複数の種類の学習モデルが選択の対象となる場合には適用できないという第２の課題がある。

　以上のことから本発明の目的とするところは、機械学習を用いた輪郭線抽出において、推論時の画像に最適な学習モデルを正解値あるいは確信度を必要とすることなく選択することができる画像認識装置及び方法を提供することである。

　以上のことから本発明においては「複数の特徴抽出用の学習モデルを格納する特徴抽出用学習モデル群と、特徴抽出用の学習モデルと対になった想起用の学習モデルを格納する想起用学習モデル群と、特徴抽出用の学習モデルを参照して入力データから特徴量を抽出する特徴量抽出部と、想起用の学習モデルを参照して特徴量の次元圧縮を伴う想起結果を出力するデータ間想起部と、特徴量と想起結果の差分が最小になることを条件に特徴抽出用学習モデル群の中から特徴抽出用の学習モデルを選択する学習モデル選択部を備えることを特徴とする画像認識装置」としたものである。

　また本発明においては「複数の特徴抽出用の学習モデルを格納する特徴抽出用学習モデル群と、特徴抽出用の学習モデルを参照して入力データから特徴量を抽出する特徴量抽出部と、特徴量抽出部が特徴量を抽出するときのスコアから複数種類の学習モデル間で比較が可能な共通尺度を計算し、特徴抽出用学習モデル群の中から共通尺度を用いて特徴抽出用の学習モデルを選択する学習モデル選択部を備えることを特徴とする画像認識装置」としたものである。

　また本発明においては「複数の特徴抽出用の学習モデルと、特徴抽出用の学習モデルと対になった複数の想起用の学習モデルとを備え、特徴抽出用の学習モデルを参照して入力データから特徴量を抽出し、想起用の学習モデルを参照して特徴量の次元圧縮を伴う想起結果を得、特徴量と想起結果の差分が最小になることを条件に特徴抽出用学習モデル群の中から特徴抽出用の学習モデルを選択することを特徴とする画像認識方法」としたものである。

　また本発明においては「複数の特徴抽出用の学習モデルを備え、特徴抽出用の学習モデルを参照して入力データから特徴量を抽出し、特徴量を抽出するときのスコアから複数種類の学習モデル間で比較が可能な共通尺度を計算し、複数の特徴抽出用の学習モデルの中から共通尺度を用いて特徴抽出用の学習モデルを選択することを特徴とする画像認識方法」としたものである。

　本発明を適用することにより、入力データを画像として特徴量を輪郭線とした際に、推論対象とする画像から特徴量を抽出し、また特徴量の想起結果を取得し、特徴量と想起結果の差分が最小となることを条件として特徴量抽出用の学習モデルを選択することが可能となる。

本発明の実施例１に係る画像認識装置の機能構成の一例を示す図。特徴量抽出部１の入出力を説明する図。典型的な一つの入力データ３０と、一つの入力データ３０に対してセマンティックセグメンテーションを用いて求めた一つの特徴量４０の例を示す図。データ間想起部３の入出力を説明する図。典型的な一つの特徴量４０と、一つの早期結果５０の例を示す図。データ間想起部３における次元圧縮を説明する図。データ間想起部３における次元圧縮の他の形態。特徴抽出用学習モデル群Ｍ２および想起用学習モデル群Ｍ４を収納するデータベースにおけるデータ格納手法を示す図。学習モデル選択部５の信号処理フローを示す図。図８のデータベースＤＢに収納された特徴抽出用の学習モデルｍ２ａ（左）とこれに対応する想起用学習モデルｍ４ａ（右）の具体的な構成事例を示す図。図８のデータベースＤＢに収納された特徴抽出用の学習モデルｍ２ｂ（左）とこれに対応する想起用学習モデルｍ４ｂ（右）の具体的な構成事例を示す図。特徴量抽出部１が特徴抽出用の学習モデルｍ２ａ、ｍ２ｂを使って出力した特徴量４０ａ、４０ｂの例を示す図。データ間想起部３が想起用の学習モデルｍ４ａならびにｍ４ｂを参照して、特徴量４０ａならびに４０ｂから出力した想起結果５０ａならびに５０ｂを示す図。学習モデル選択部の画面表示の例を示す図。本発明の実施例２に係る画像認識装置の機能構成の一例を示す図。本発明の実施例３に係る画像認識装置の機能構成の一例を示す図。教師データ作成支援部２０８における表示画面例を示す図。本発明の実施例４に係る画像認識装置の機能構成の一例を示す図。図１７の学習モデル選択部５Ａの信号処理フローを示す図。処理ステップＳ３０３における共通尺度の求め方の例を説明する図。処理ステップＳ３０３における共通尺度の求め方の他例を説明する図。実施例４の変形実施例１に係る画像認識装置７Ａの機能構成例を示す図。実施例４の変形実施例２に係る画像認識装置７Ａの機能構成例を示す図。

　以下、本発明の具体的な実施例について、図面を参照しながら説明する。

　計算機装置を用いて実現される本発明の実施例１に係る画像認識装置の機能構成の一例を図１に示す。

　まず図１の機能構成の概要を述べると、計算機装置７は、ＣＰＵなどの演算機能により実現される処理である特徴量抽出部１とデータ間想起部３と学習モデル選択部５と、一般にはデータベースにより実現される特徴抽出用学習モデル群Ｍ２と想起用学習モデル群Ｍ４により構成されている。計算機装置７には、半導体パターンの検査における輪郭抽出の対象となる画像の運用時におけるサンプルである入力サンプル１０がとりこまれる。

　特徴抽出用学習モデル群Ｍ２は、２つ以上の特徴抽出用の学習モデルｍ２をデータベース内に格納している。想起用学習モデル群Ｍ４は、２つ以上の想起用の学習モデルｍ４をデータベース内に格納している。特徴抽出用学習モデル群Ｍ２および想起用学習モデル群Ｍ４は、特徴抽出用および想起用の学習モデルｍ２、ｍ４の振り当てた記号を共有し、同じ記号の特徴抽出用および想起用の学習モデルｍ２、ｍ４は同一の学習サンプルから学習された対である。

　特徴量抽出部１は、特徴抽出用の学習モデルｍ２を参照して入力サンプル１０中の画像から輪郭線（以下、特徴量抽出部１が抽出する輪郭線を特徴量と記す）を抽出する機能を備え、特徴抽出用学習モデル群Ｍ２中の特徴抽出用の学習モデルｍ２毎に、入力サンプル１０中の画像から特徴量を抽出する。

　データ間想起部３は、想起用の学習モデルｍ４を参照して特徴量から特徴量を想起する機能を備え、特徴量抽出部１が出力した特徴量それぞれから特徴量を想起する。以降、データ間想起部３が想起した特徴量を想起結果と標記する。

　学習モデル選択部５は、特徴量抽出部１が出力した特徴量とデータ間想起部３が出力した特徴量の差分が最小となる学習モデルｍ２を選択し、学習モデルｍ２に割り振られた記号を出力する。以上述べた図１中の各機能は、任煮の計算機上の信号処理で実現できる。

　以下、図１中の各構成機能の詳細を述べる。入力サンプル１０は、運用時において特徴量の抽出対象となる画像の少数のサンプルである。少数のサンプルは、運用時に撮影される画像をランダムに選択すること等で取得される。入力サンプル１０は限られた種類の製造工程等から収集されたものであって、少数のサンプル中には、ひとつもしくは少数の種類の画像から構成される。

　図２は、特徴量抽出部１の入出力を説明する図である。図２を用いて特徴量抽出部１の単体の機能について説明する。特徴量抽出部１は、特徴抽出用学習モデル群Ｍ２中の一つの特徴抽出用の学習モデルｍ２に着目して、これを参照したとき、入力サンプル１０中の一つの入力データ３０から、セマンティックセグメンテーションを用いて一つの特徴量４０をデータ間想起部３に出力する。

　図３は、典型的な一つの入力データ３０と、一つの入力データ３０に対してセマンティックセグメンテーションを用いて求めた一つの特徴量４０の例を示している。まず入力データ３０は、図３の左に例を示す様に輪郭線の抽出対象となる画像であり、画像中の各画素は例えば２５６×２５６ビットのデータである。

　ここでセマンティックセグメンテーションとは、画像中の各画素のカテゴリを判別する機械学習の一手法である。特徴抽出用の学習モデルｍ２は、セマンティックセグメンテーションにおいて参照する荷重係数や閾値等のパラメータである。

　特徴量抽出部１において、セマンティックセグメンテーションを用いて求めた一つの特徴量４０は図３の右に例を示すように、入力データ３０内の構成要素（画素）を輪郭線４１、閉領域４２（輪郭線４１に囲まれた領域）、背景４３の様なカテゴリに判別したもの（輪郭線の抽出結果）である。

　図３により特徴量抽出部１の入力（一つの入力データ３０）と出力（一つの特徴量４０）の関係を、一例をあげて説明したが、この抽出は、特徴抽出用の学習モデルｍ２を用いて実現されているので、次に特徴抽出用の学習モデルｍ２側について説明する。

　特徴抽出用の学習モデルｍ２は、入力データ３０と教師データの組の、ひとつ以上から構成される学習サンプルから所定の学習演算により計算される。ここで教師データとは、図３の左に例示した特徴量４０と同じフォーマットの画像であって、画像中の各画素のカテゴリは適切に割振られている。この学習演算では、学習サンプルに含まれる入力データ３０から特徴量抽出部１が出力する特徴量と、学習サンプル中の教師データとの差分が最小になる様に最適化される。

　この学習演算によって、特徴量抽出部１は特徴抽出用の学習モデルｍ２を参照したときに、学習サンプルと類似した入力データ３０が与えられたときには、入力データ３０中の各画素のカテゴリが精度良く判別された特徴量４０を出力することができる様になる。一方で、特徴量抽出部１は学習モデルｍ２を参照したときに、学習サンプルと乖離した入力データ３０が与えられたときには、最適化の範囲外であるため、特徴量４０中の画素には誤判別が含まれるようになる。誤判別は、特に入力データ３０中で学習サンプルと画像の見かけが乖離した場所で現れやすくなる。

　図１の構成図において特徴量抽出部１は、入力サンプル１０中の入力データ３０（ひとつ以上）、および特徴抽出用学習モデル群Ｍ２に含まれる特徴抽出用の学習モデルｍ２（２つ以上）の組み合わせそれぞれに対して、特徴量４０を抽出する。

　図４は、データ間想起部３の入出力を説明する図である。次に図４を用いてデータ間想起部３の単体の機能について説明する。データ間想起部３は、想起用学習モデル群Ｍ４中の一つの想起用の学習モデルｍ４を参照したとき、一つの特徴量４０から一つの想起結果５０を、次元圧縮を用いて学習モデル選択部５に出力する。

　図５は、典型的な一つの特徴量４０と、一つの早期結果５０の例を示している。まず図５右側の想起結果５０は、図５の左に示す特徴量４０（輪郭線４１、閉領域４２、背景４３のカテゴリから構成）と構成要素を同じくしたカテゴリである、輪郭線５１、閉領域５２、背景５３から構成されている。図１の構成図においてデータ間想起部４は、特徴量抽出部１が出力する特徴量４０、および想起用学習モデル群Ｍ４に含まれる想起用の学習モデル１４の組み合わせそれぞれに対して、想起結果５０を出力する。

　図５の図示によれば、特徴量４０と想起結果５０の差異は必ずしも明確ではないが、想起結果５０は特徴量４０を次元圧縮した情報である。データ間想起部３における次元圧縮について図６を用いて説明する。次元圧縮とは、特徴量４０および想起結果５０を構成要素（画素）からなる高次元データ（画素数の次元のデータ）と捕らえたとき、特徴量４０を特徴量４０よりも次元が低い次元圧縮データ７０に写像（圧縮）した後に、再び想起結果５０の次元に再び写像（復元）する演算を指す。

　この次元圧縮は、特徴量４０が次元圧縮データ７０に応じた高次元空間中の所定範囲にあれば、特徴量４０から次元圧縮データ７０に圧縮される過程でほとんど情報が失われることがなく、想起結果５０と特徴量４０の差分は小さくなるという性質がある。次元圧縮には反対に、特徴量４０が高次元空間中の所定範囲内から逸脱している場合、特徴量４０から次元圧縮データ７０に圧縮される過程で情報が失われてしまい、想起結果５０と特徴量４０の差分は大きくなるという性質もある。この次元圧縮は、主成分分析や、深層学習のオートエンコーダ等の一般的なアルゴリズムを適用することで実現できる。

　図７は、データ間想起部３における次元圧縮の他の形態を説明する図である。図７に示すように、次元圧縮では、特徴量４０と次元圧縮データ７０の間もしくは次元圧縮データ７０と想起結果５０の間にデータを写像する中間データ７１および７２を含んでも良い。この場合も、以上述べた性質は変わらない。

　図４によりデータ間想起部３の入力（一つの特徴量４０）と出力（一つの早期結果５０）の関係を、一例をあげて説明したが、この次元圧縮は、想起用の学習モデルｍ４を用いて実現されているので、次に想起用の学習モデルｍ４側について説明する。

　想起用の学習モデルｍ４は、次元圧縮において参照する荷重係数や閾値等のパラメータである。学習演算において、想起用の学習モデルｍ４は、一つ以上の特徴量４０からなる学習サンプルから、学習サンプル内の特徴量４０とその想起結果５０の差分が小さくなるように求められる。この学習演算によって、学習サンプル内の特徴量４０が低次元データ７０に圧縮されても極力情報をほぼ失うことが無い様になる。（学習サンプル内の特徴量４０の分布の複雑さが想起用の学習モデルｍ４の許容範囲にあれば、学習サンプル内の特徴量４０が低次元データ７０に圧縮されても情報はほぼ全く失われない。）
　この結果、学習サンプルと類似した特徴量４０がデータ間想起部３に与えられたときには、低次元データ７０に圧縮されても失われる情報が小さい（もしくほぼ全く無い）ため、想起結果５０と特徴量４０の差分は小さくなる。一方で、学習サンプルと乖離した特徴量４０がデータ間想起部３に与えられたときには、低次元データ７０に圧縮される過程で多くの情報が失われるため、想起結果５０と特徴量４０の差分は大きくなる。

　図８は、特徴抽出用学習モデル群Ｍ２および想起用学習モデル群Ｍ４を収納するデータベースＤＢにおけるデータ格納手法を示す図である。特徴抽出用学習モデル群Ｍ２および想起用学習モデル群Ｍ４において、格納された２つ以上の特徴抽出用の学習モデルｍ２および想起用の学習モデルｍ４は、図８に示すようにａ、ｂの様な同じ記号２０が割り振られて例えばデータベースＤＢ中に管理される。ここで記号２０はシリアル番号等、任意の記号を割り振って良い。同一の記号が割り振られた特徴抽出用の学習モデルｍ２および想起用の学習モデルｍ４は、同じ学習サンプルから計算された対である。

　図９のフローを用いて学習モデル選択部５の信号処理の概要について説明する。なおこのフローにおいて、処理ステップＳ１と処理ステップＳ６の組み合わせは、学習モデルごとにこれらの間の処理を繰り返し実行することを意味している。またこのフローにおいて、処理ステップＳ２と処理ステップＳ４の組み合わせは、特徴量ごとにこれらの間の処理を繰り返し実行することを意味している。

　図９のフローによれば、まず、特徴抽出用学習モデル群Ｍ２中の特徴抽出用の学習モデルｍ２のそれぞれで（処理ステップＳ１から処理ステップＳ６）、特徴量抽出部１が出力した特徴量４０の各々について（処理ステップＳ２から処理ステップＳ４）、特徴量４０と想起結果５０の差分を求める（処理ステップＳ３）。そして、特徴量４０の各々から求めた処理ステップＳ３の差分から、複数の特徴量４０に渡る差分の統計量を計算する（処理ステップＳ５）。

　以上の繰り返し処理がすべての学習モデル、および特徴量４０に対して実行されたのちに、処理ステップＳ７の処理に入る。処理ステップＳ７では、複数の特徴抽出用の学習モデルｍ２の中から、処理ステップＳ５で求めた差分の統計量の最小値を求める。そして処理ステップＳ８では、処理ステップＳ３の差分が処理ステップＳ７の最小値をとるときの特徴抽出用の学習モデルｍ２の記号２０（図８参照）を選択する。処理ステップＳ８で選択した記号２０からは、データベースＤＢを参照することで特徴抽出用の学習モデルｍ２ならびに想起用の学習モデルｍ４が一意に特定できる。

　以下、図９の処理ステップＳ３の詳細を、図１０ａ、図１０ｂ、図１１、図１２の例を使って説明する。

　まず図１０ａは、図８のデータベースＤＢに収納された特徴抽出用の学習モデルｍ２ａ（左）とこれに対応する想起用学習モデルｍ４ａ（右）の具体的な構成事例を示している。また、図１０ｂは、図８のデータベースＤＢに収納された特徴抽出用の学習モデルｍ２ｂ（左）とこれに対応する想起用学習モデルｍ４ｂ（右）の具体的な構成事例を示している。

　なお、処理ステップＳ３の処理を行うにあたり、図８のデータベースＤＢに格納された各種のデータは、予め、以下のように準備されているものとする。

　まず、図８のデータベースＤＢに格納された特徴抽出用の学習モデルｍ２ａは図１０ａに示すように、入力データ３０ａと教師データ６０ａ、ならびに入力データ３０ａに類似した入力データ３０とその教師データを学習サンプルとして学習されている。また、特徴抽出用の学習モデルｍ２ｂは図１０ｂに示すように、入力データ３０ｂと教師データ６０ｂ、ならびに入力データ３０ｂに類似した入力データ３０と教師データを学習サンプルとして学習されている。

　さらに図１０ａ、図１０ｂに示すように教師データ６０ａならびに６０ｂには、入力データ３０ａならびに３０ｂの各画素から理想的に特徴量４０が抽出された場合の輪郭線６１ａならびに６１ｂ、閉領域６２ａならびに６２ｂ、背景６３ａならびに６３ｂのカテゴリが割り振られている。

　ここで図１０ａの教師データ６０ａでは中央部６４ａにおいて左右の閉領域６２ａは離れている一方、図１０ｂの教師データ６０ｂでは中央部６４ｂにおいて左右の閉領域６２ａが連結しているという差異がある。また、想起用の学習モデルｍ４ａは、教師データ６０ａ、および入力データ３０ａに類似した画像とその教師データから事前に学習されている。想起用の学習モデルｍ４ｂは、教師データ６０ａｂおよび入力データ３０ｂに類似した画像とその教師データから学習されている。

　以下、入力データ３０ａとほぼ同じ画像１枚が入力サンプル１０として与えられた場合を例に挙げて説明する。図１１は、特徴量抽出部１が特徴抽出用の学習モデルｍ２ａ、ｍ２ｂを使って出力した特徴量４０ａ、４０ｂの例を示す図である。

　このとき図１１の左に示す様に、特徴量抽出部１が特徴抽出用の学習モデルｍ２ａを使って出力した特徴量４０ａでは、入力サンプル１０と類似した図１０ａの入力データ３０ａが学習サンプル中に含まれるために、中央部４４ａを含むあらゆる場所において輪郭線４１ａ、閉領域４２ａ、背景４３ａのカテゴリが正確に判別されている。

　一方で、図１１の右に示す様に、特徴抽出用の学習モデルｍ２ｂを使って出力された特徴量４０ｂには、その学習サンプルの入力データ３０ｂ（図１０ｂ参照）およびそれに類似した入力データ３０は入力サンプル１０と類似しないため、特徴量４０ｂ中において輪郭線４１ｂ、閉領域４２ｂ、背景４３ｂのカテゴリには誤判別が含まれる。また、この誤判別は、入力データ３０ａと入力データ３０ｂの間で、画像の見た目の差異が大きな中央部４４ｂに集中する。

　図１２は、データ間想起部３が想起用の学習モデルｍ４ａならびにｍ４ｂを参照して、特徴量４０ａならびに４０ｂから出力した想起結果５０ａならびに５０ｂを示している。

　図１２左の想起結果５０ａは、想起用の学習モデルｍ４ａを学習した際の学習サンプル中には、特徴量４０ａと類似した教師データ６０ａが含まれるため、中央部５４ａを含めた画像全体において特徴量４０ａと想起結果５０ａの間には差分がほとんど生じていない。一方で、図１２右の想起結果５０ｂは、想起用の学習モデルｍ４ｂを学習した際の学習サンプル中には、特徴量４０ｂの様に中央部４４ｂに誤判別を含む特徴量４０が含まれないため、中央部５４ｂにおいて特徴量４０ｂとの間に大きな差分が現れている。

　図１０ａ、図１０ｂ、図１１、図１２の例を踏まえたうえで、図９の処理ステップＳ３での処理における差分導出は、特徴量４０および想起結果５０を高次元ベクトルとしたときの、ベクトル間の距離で計算する。

　例えば、特徴量４０および想起結果５０における各画素の輪郭線４１および５１、閉領域４２および５２、背景４３および５３を順に第１、第２、第３要素とした要素ベクトルを、特徴量４０および想起結果５０の画素数だけベクトル結合した特徴量ベクトル（画素数がＮ個ならば３Ｎ次元）間のユークリッド距離で、ベクトル間の距離は計算できる。ただし、ユークリッド距離意外にも、２つの特徴量ベクトル間の距離が計測できる尺度ならば、任意の尺度でベクトル間の距離は計算できる。

　なお、次元圧縮では、輪郭線５１、閉領域５２、背景５３のデータの形態は、輪郭線４１、閉領域４２、背景４３のデータの形態と異なっていても、ベクトル間の距離が計算できる尺度があれば問題とならない。例えば、前者のデータの形態が連続値、後者のデータの形態が離散値としても、ユークリッド距離は計算できるので問題とならない。

　図９に戻り、処理ステップＳ５の具体的な処理内容について説明する。処理ステップＳ５では、入力サンプル１０中の入力データ３０それぞれについて求めた処理ステップＳ３の差分の統計量を計算する。

　差分の統計量は、複数の特徴量ベクトルの距離の相加平均で計算できる。ただし、相加平均に限らず調和平均や中央値など、複数の特徴量ベクトルから代表値を可能なものならば、任意の統計量を適用できる。差分の統計量は、例えば入力サンプル１０中の入力データ３０が主に入力データ３０ａに類するものから構成される場合、想起用の学習モデルｍ４ａを参照して求めた差分の統計量は小さくなる一方で、想起用の学習モデルｍ４ｂを参照して求めた差分の統計量は大きくなる。

　図９の処理ステップＳ７では、処理ステップＳ５の差分の統計量の最小値を計算する。処理ステップＳ８では、処理ステップＳ５の差分の統計量が最小値をとるときの特徴抽出用の学習モデルｍ２に割り振られた記号２０を出力する。例えば入力サンプル１０中の入力データ３０が入力データ３０ａに類似する場合、図８のデータベース中において想起用の学習モデルｍ４ａに割り振られた記号ａが出力される。なお、学習モデル選択部５は記号２０以外にも、記号２０が指定する特徴抽出用の学習モデルｍ２のファイルの実態やファイル名等、特徴抽出用の学習モデルｍ２が一意に定まる情報を出力するようにしても良い。

　図１３は、学習モデル選択部５の画面表示の例を示す図である。学習モデル選択部５は、図１３の画面８０中の様な画面表示を用いて、実施例１の実行制御等を行う作業者が選択結果を目視確認できるようにしても良い。選択結果８１には図８のデータベース中の記号２０のうち、学習モデル選択部５に選択されたもの（図中の例ａ）を示している。画面８０中には作業者が学習モデル選択の詳細を把握できるように、８２のように選択した学習モデルの差分の数値（処理ステップＳ５の差分の統計量）や、８３のように学習モデル選択の対象とした記号２０の選択範囲を表示しても良い。

　本発明の実施例１では、以上述べた方法によって特徴量抽出部１が出力した特徴量４０とデータ間想起部３が出力した想起結果５０の差分を求め、差分が最小となる条件で記号２０を選択することによって、特徴量抽出用学習モデル群の中から入力サンプル１０に対して最適な特徴抽出用の学習モデルｍ２を選択することが可能になる。この際に差分を求めるために、特許文献１と異なり正解値は不要であり、特許文献２と異なり確信度は不要である。

　実施例１においては、学習モデルが適切に構成されていることを前提として画像認識装置を構成しているが、実施例２においては学習モデルが適切に構成されていないことも考慮した画像認識装置を提案している。

　本発明の実施例２に係る画像認識装置７の機能構成例を図１４に示す。なお図１４の画像認識装置７が図１の構成と相違している点は、学習モデル適否判定部１０６を追加し、図１の学習モデル選択部５を学習モデル再選択部１０７のように構成した点である。

　図１４において、まずｍ２およびｍ４は、実施例１によって選択された特徴抽出用の学習モデルおよび想起用の学習モデルである。ここでは、この学習モデルに割り振られた記号をｘとしている。

　入力サンプル１０は、輪郭抽出の長期運用時において所定のタイミングで抽出された入力データ３０の少数のサンプルである。長期運用時とは、実施例１の方法で学習モデルを選択した後に、所定以上の期間、輪郭抽出を運用し続けたタイミングを指す。

　特徴量抽出部１は、特徴抽出用の学習モデルｍ２を参照して入力サンプル１０中の入力データ３０から特徴量４０を抽出する。データ間想起部１０３は、想起用の学習モデルｍ４を参照して、特徴量抽出部１が出力した特徴量４０から想起結果５０を出力する。

　実施例２において追加された学習モデル適否判定部１０６は、特徴量抽出部１ならびにデータ間想起部３が出力した特徴量４０ならびに想起結果５０から、図９の処理ステップＳ５と同様の手順で差分の統計量を計算する。そして、この差分の統計量が事前に定められた所定閾値よりも大きくなると、入力サンプル１０をサンプリングした長期運用時における入力データ３０に対し、記号ｘの学習モデルが非適合と判定する。この判定の結果は、学習モデル再選択部１０７（図１の学習モデル選択部５に相当）が出力する画面８０の表示等で出力する。あるいは、ファイルに出力するか、外部の計算機にネットワークを通じて通知しても良い。

　学習モデル適否判定部１０６の後段には、さらに学習モデル再選択部１０７を設けても良い。学習モデル再選択部１０７は、学習モデル適否判定部１０６が非適合と判定したときに、入力サンプル１０を入力として（旧入力サンプル１０を新入力サンプル１０に置き換えて）、実施例１の手順で特徴量抽出用の学習モデル１２を選択する。

　本発明の実施例１では、以上述べた方法によって、長期運用の過程で入力データ３０の性質が変化し、実施例１の方法で選択した輪郭抽出用の学習モデル１２が非適合となったことが検出できる。またさらに、入力サンプル１１０に最適な輪郭抽出用の学習モデル１２の再選択も可能となる。

　なお図１４に示した実施例２の構成は、図１に示す実施例１の構成において、データ間想起部３と学習モデル選択部５の間に学習モデル適否判定部１０６を設置したものということができ、画像認識装置７における作動当初には学習モデル適否判定部１０６を経由せず、その後の運転経験を踏まえて学習モデル適否判定部１０６が機能し、学習モデル選択部５において再選択を行うものということができる。

　実施例３においては、実施例１、実施例２に記載の画像認識装置７を実運用する前提として、画像認識装置７の設計、準備段階において必要な教師データを簡便に入手し、学習モデルを学習することについて説明する。従って、実施例３の学習結果としての学習モデルが実施例１、実施例２に反映されていくものである。

　本発明の実施例３に係る画像認識装置の機能構成の一例を図１５に示す。なお図１５の画像認識装置７が図１の構成と相違している点は、教師データ作成支援部２０８と学習モデル学習部２０９を追加した点である。

　なおここで図１５には、図１における学習モデル選択部５あるいは図１４における学習モデル適否判定部１０６が記述されていないが、これらの機能は記述がないだけで、実運用に際しては実施例１、実施例２のように構成されるものである。

　ｍ２およびｍ４は、実施例１によって選択された特徴抽出用の学習モデルおよび想起用の学習モデルである。入力サンプル１０は、任意の入力データ３０の集合であって、例えば実施例１、２で述べた入力サンプル１０でもよい。特徴量抽出部１は、特徴抽出用の学習モデルｍ２を参照して入力サンプル１０中の入力データ３０から特徴量４０を抽出する。データ間想起部３は、想起用の学習モデルｍ４を参照して、特徴量抽出部２０１が出力した特徴量４０から想起結果５０を出力する。

　実施例３で追加された教師データ作成支援部２０８は、特徴量抽出部１およびデータ間想起部３が出力した特徴量４０および想起結果５０の差分を、図９の処理ステップＳ３の手順で求め、この差分が多い場所に入力箇所を絞った教師付けのためのユーザインタフェースを含んで構成したものである。

　図１６中の画面９０は、教師データ作成支援部２０８のユーザインタフェースの一例であり、入力画面９１、入力選択９２、入力ペン９３から構成される。入力画面９１では、入力データ３０を下絵にして、輪郭線６１、閉領域６２、背景６３のカテゴリを割り振る作業を作業者が行うことを可能にする。入力画面９１のラベルの割り振りは、作業者が入力選択９２のラジオボタンの中から輪郭線６１、閉領域６２、背景６３のカテゴリを選択し、入力ペン９３を操作することで行われる。このように、学習サンプル作成支援部２０８におけるユーザインタフェースにおいて、入力データを下絵にして特徴量のカテゴリを描画し、さらに特徴量のカテゴリを入力できる機能を有するのがよい。

　教師データ作成支援部２０８は入力画面９１において、処理ステップＳ３の差分が少ない場所と多い場所を判別する。この少ない場所と多い場所は、入力画面９１中の入力データ３０をブロック等に少領域分割したときの処理ステップＳ３の差分の密度が閾値よりも高ければ差分が多い、低ければ少ないとする。そして、処理ステップＳ３の差分が少ない場所のラベルを特徴量４０と同じになるようにして表示する。すなわち、特徴量４０中の輪郭線４１、閉領域４２、背景４３を順に、入力画面９１中の輪郭線６１、閉領域６２、背景６３に割り当てる。そして、処理ステップＳ３の差分が多い領域に絞って、作業者に入力画面９１への入力を促す。

　例えば、入力画面９１の下絵が入力データ３０ａ、特徴抽出用の学習モデルｍ２および想起用の学習モデルｍ４がそれぞれｍ２ｂおよびｍ４ｂのときは、前記処理ステップＳ３の差分がある場所は、（入力データ３０ａから抽出された特徴量４０ｂと、特徴量４０ｂから抽出された想起結果５０ｂとの間で差分が多い）中央部４４ｂとなる。

　ここで教師データ作成支援部２０８は、（特徴抽出用の学習モデルｍ２および想起用の学習モデルｍ４を、複数対の特徴抽出用の学習モデルｍ２および想起用の学習モデルｍ４から構成されるようにして、）複数の特徴量４０および想起結果５０から、画面９１中のカテゴリ（輪郭線６１、閉領域６２、背景６３）を生成することで、前記画面９１中のカテゴリの精度改善を図っても良い。例えば、複数の特徴量４０および想起結果５０の差分の最頻値等の統計量から前記処理ステップＳ３の差分がある場所を求め、画面９１中のカテゴリを生成してよい。あるいは、画面９０上に図示しないボタンの操作により、複数の特徴量４０および想起結果５０の中から、画面９１中のカテゴリの生成に使うのに適切なものを作業者が切り替えられるようにしても良い。このように、学習サンプル作成支援部２０８が複数の特徴量と想起結果を用いて入力箇所を求めるか、あるいは入力箇所を切り替えることの少なくとも一方を行うこととするのがよい。

　また実施例３により追加された学習モデル学習部２０９は、入力サンプル１０中の入力データ３０および画面９０の入力結果を、教師データを組とした学習サンプルを用いて、特徴抽出用の学習モデルｍ２を学習する。学習モデル学習部２０９の学習では、学習モデルを参照した際の特徴量４０の推論結果が優れる様に、前記学習サンプル以外に任意の学習サンプルを加えても良い。

　学習モデル学習部２０９における学習では、実施例２で述べた長期運用時における学習モデルの再選択に備えて、特徴抽出用の学習モデルｍ２に加えて想起用の学習モデルｍ４を学習し、新たな記号２０を割り振って図８のデータベースＤＢに追加しても良い。

　このようにして、学習モデル学習部がさらに前記想起用の学習モデルを学習し、学習モデル学習部が学習した特徴量の学習モデルを特徴抽出用学習モデル群に、学習モデル学習部が学習した想起用の学習モデルを特徴抽出用学習モデル群に追加することになる。

　本発明の実施例３では、以上述べた方法によって、入力サンプル１０をサンプリングした母集団に対して最適な特徴抽出用の学習モデルｍ２を、教師データ作成支援部２０８によって作業者が入力する箇所を絞った教師データを用いて学習できる。この作業者が入力する箇所を絞ることにより、入力サンプル１０中の入力データ３０の全画素に教師データを割り振るよりも、教師データの作成の工数を低減できる。

　実施例４においては、最適な学習モデルを簡便に入手することについて説明する。

　本発明の実施例４に係る画像認識装置７Ａの機能構成の一例を図１７に示す。図１７の構成は、図１の構成においてデータ間想起部３の構成を除外したものであるが、特徴抽出用学習モデル群Ｍ２、特徴量抽出部１、学習モデル選択部５については、一部その取り扱いデータ、内部構成あるいは処理内容などが相違していることから、これらを夫々図１７においては特徴抽出用学習モデル群Ｍ２Ａ、特徴量抽出部１Ａ、学習モデル選択部５Ａとして表記している。

　まず特徴抽出用学習モデル群Ｍ２Ａは、特徴抽出用の学習モデルｍ２の中でも特に、特徴量４０を抽出する際にカテゴリ毎のスコアを出力することが可能な種類の特徴抽出用の学習モデルｍ２Ａの集合である。

　特徴量抽出部１Ａは、特徴抽出用学習モデル群Ｍ２Ａ中の特徴抽出用の学習モデルｍ２Ａ各々を参照して、入力サンプル１０中の入力データ３０それぞれから特徴量４０ならびに前記スコアを出力する。

　学習モデル選択部５Ａは、前記スコアから複数種類の特徴抽出用の学習モデルｍ２Ａ間でカテゴリの判別結果の信頼度を比較可能な共通尺度を計算し、この共通尺度が最小となることを条件として最適な特徴抽出用の学習モデルｍ２Ａを選択する。

　図１８は、図１７の学習モデル選択部５Ａの信号処理フローを示す図である。なおこのフローにおいて、処理ステップＳ３０１と処理ステップＳ３０６の組み合わせは、学習モデルごとにこれらの間の処理を繰り返し実行することを意味している。またこのフローにおいて、処理ステップＳ３０２と処理ステップＳ３０４の組み合わせは、入力データ３０ごとにこれらの間の処理を繰り返し実行することを意味している。

　図１８のフローによれば、まず、特徴抽出用学習モデル群Ｍ２Ａ中の特徴抽出用の学習モデルｍ２Ａそれぞれで（処理ステップＳ３０１から処理ステップＳ３０６）、入力サンプル１０中の入力データ３０各々について（処理ステップＳ３０２から処理ステップＳ３０４）、処理ステップＳ３０３においてスコアから共通尺度を計算する。

　そして、入力データ３０各々から求めた処理ステップＳ３０３の共通尺度から、処理ステップＳ３０５において各入力データ３０中の各画素における共通尺度の平均値や中央値等から共通尺度の統計量を計算する。

　以上の繰り返し処理がすべての学習モデル、および入力データ３０に対して実行されたのちに、処理ステップＳ３０７の処理に入る。処理ステップＳ３０７では、処理ステップＳ３０５で求めた共通尺度の統計量の最大値を求める。そして処理ステップＳ３０８では、共通尺度が最大値をとるときの特徴抽出用の学習モデルｍ２Ａの記号２０を選択する。

　図１９に、図１８の処理ステップＳ３０３の共通尺度の例を示す。グラフ３１１およびグラフ３１２は、種類の異なる特徴量抽出用の学習モデルｍ２Ａから求められたカテゴリ毎のスコアを示す。前記種類とは、特徴量抽出用の学習モデルｍ２Ａにおける機械学習の数理モデルや深層学習のネットワーク構造等が異なることを指す。グラフ３１１およびグラフ３１２中のカテゴリとは、特徴量４０を構成する輪郭線４１、閉領域４２、背景４３に割り振られたラベルを指す。グラフ３１１およびグラフ３１２中の２つの前記スコアを見ると、グラフ３１２中のほうがグラフ３１１よりも値が大きいが、前記種類が異なるために尺度が異なるため大小を比較できない。

　ここで、一般に特徴量抽出用の学習モデルｍ２Ａは、前記スコアが最大のカテゴリに判別する。この際に、前記スコアの最大値と他の値に差があるほど、カテゴリの判別は信頼できる。例えば、グラフ３１２の前記スコアはカテゴリ３が最も高いものの、カテゴリ１とカテゴリ２の前記スコアの差は小さい。このため、グラフ３１２からカテゴリ３と判別することは、僅かな外乱で前記スコアの変動があるとカテゴリの判別結果は変わってしまう信頼度が低いものと考えられる。反対に、グラフ３１２の前記スコアは、もっとも値が大きなカテゴリ３と、他のカテゴリ１、２の間で大きな差がある。このため、グラフ３１１からカテゴリ３と判別することは、多少の外乱があってもカテゴリの判別結果は変わらない信頼度が高いものと考えられる。

　そこで処理ステップＳ３０３では、前記スコアのばらつきを共通尺度とする。前記ばらつきとは、前記スコアの標準偏差やエントロピー等のばらつきの程度を表す統計量であり、大きな値をとるほどグラフ３１１のようにカテゴリ間の前記スコアに差があることを示す。あるいは、処理ステップＳ３０３では、前記スコアの突出度を共通尺度としても良い。前記突出度とは、前記スコアの最大値が他の前記スコアと比べてどの程度突出して大きいかを示す指標であり、例えばグラフ３１１における前記スコアの最大値と前記スコアの平均値の差や、前記スコアの最大値と前記スコアの２番目に大きな値の差で計算できる。

　図２０を使って、処理ステップＳ３０３における共通尺度の他の例を述べる。グラフ３２１における確信度１は、グラフ３１１中における前記スコアの最大値である。このように前記スコアの最大値を確信度とすることは、機械学習を用いたカテゴリ判別のアルゴリズムにおいて一般的である。グラフ３２２における確信度２は、グラフ３２１中における前記スコアの最大値である。グラフ３２１およびグラフ３２２における正解率とは、確信度１および確信度２が所定値をとったときのカテゴリの判別結果を母集団としたときに、どの確率で正解であったかを示す正解率の期待値となる指標である。なお前記母集団には、特徴抽出用の学習モデル１２を学習したときの学習サンプルを適用できるが、これに限らず任意の入力データ３０とその教師データとの組を適用できる。

　図１８の処理ステップＳ３０３では、前記正解率を共通尺度とすることができる。例えば、グラフ３１１およびグラフ３１２から計算される確信度がｋ１およびｋ２のとき、グラフ３２１中およびグラフ３２２中の正解率はｙ１およびｙ２であり、ｙ１のほうがｙ２よりも高いために、グラフ３１１から求めたカテゴリの判別結果のほうが正解率が高いことから、信頼度が高いと考えられる。よって、処理ステップＳ３０３では、確信度１や確信度２の様な確信度を正解率に換算することで共通指標とできる。

　図１８の処理ステップＳ３０３では、複数の種類の特徴抽出用の学習モデルｍ２Ａにおいて、前記ばらつきや前記突出度の大きさが大きく異なる場合には、図２０の説明で述べたのと同様の手順で正解率に換算してから、共通尺度としても良い。あるいは、複数の種類の特徴抽出用の学習モデルｍ２Ａ間で大きさのばらつきを抑えるために、前記母集団における前記ばらつきや前記突出度の平均値等の統計量をもとめ、この統計量で除算して正規化しても良い。

　本発明の実施例４では、以上述べた方法によって、特徴抽出用の学習モデルｍ２Ａにおいて特徴量４０を抽出する際に前記スコアを出力することが可能な種類のものに限定すれば、複数の特徴抽出用の学習モデルｍ２Ａの中から入力サンプル１０に最適なものを選択することが可能になる。また、特許文献２と異なり、特徴抽出用学習モデル群Ｍ２Ａ中の特徴抽出用の学習モデルｍ２Ａの確信度がそれぞれ異なる指標であっても、特徴抽出用の学習モデルｍ２Ａを選択することが可能になる。

　図２１は、実施例４の変形実施例１に係る画像認識装置７Ａの機能構成例を示している。図２１の画像認識装置７Ａの上部分は、図１７の構成を採用し、下半分は図１４の一部攻勢を組み合わせたものである。

　本発明の実施例４の変形実施例１では、図２１に示す様に、実施例２と同様に長期運用時において、入力サンプル１１０を構成する入力データ３０から処理ステップＳ３０５と同様の手順で求めた共通尺度の統計量を用いて、入力サンプル１０に対して学習モデル選択部５Ａが選択した特徴抽出用の学習モデルｍ２の適否を判定する学習モデル適否判定部３０６を設けても良い。学習モデル適否判定部３０６は前記処理ステップＳ３０５と同様の手順で求めた共通尺度の統計量が事前に定めた閾値よりも小さければ、信頼度が低く適合しないと判定する。さらに学習モデル適否判定部３０６が適合しないと判断した場合に、入力サンプル１０に対して適切な特徴抽出用の学習モデルｍ２を特徴抽出用学習モデル群Ｍ２の中から選択する学習モデル再選択部３０７（特徴量抽出部３０１と学習モデル選択部３０６の機能を内包する）を設けても良い。

　図２２は、実施例４の変形実施例２に係る画像認識装置７Ａの機能構成例を示している。図２２の画像認識装置７Ａの上部分は、図１７の構成を採用し、下半分は図１５の一部攻勢を組み合わせたものである。

　本発明の実施例４の変形実施例２に係る画像認識装置７Ａでは、入力サンプル１０中から図１８の処理ステップＳ３０５の共通尺度を求め、教師データ作成支援部２０８における教師データの入力箇所を前記処理ステップＳ３０５の共通尺度の小さな箇所（特徴量４０のカテゴリ判別の信頼度が低い箇所）に絞ったユーザインタフェースを備えた教師データ作成支援部３０８、および教師データ作成支援部３０８で作成した教師データを用いて特徴量抽出用の学習モデルｍ２を学習する学習モデル学習部３０９を備えても良い。

　これにより実施例３と同様に、入力サンプル２１０をサンプリングした母集団に対して最適な特徴抽出用の学習モデルｍ２を、作業者が入力する箇所を絞った教師データを用いて学習できるようになる。また学習モデル学習部３０９は学習した特徴量抽出用の学習モデルｍ２を、学習モデル再選択部３０７で選択できるように特徴抽出用学習モデル群Ｍ２に加えても良い。

　以上述べた本発明の実施例１から実施例４においては、その本質を逸脱しない範囲において構成要素を以下のように変更することが可能である。

　特徴量４０を構成するカテゴリは、輪郭線４１、閉領域４２、背景４３以外に限らない。例えば輪郭線のコーナー点等のカテゴリを加えても良い。また輪郭線４１、閉領域４２、背景４３の中からカテゴリ省いても良い。これに応じて、想起結果５０や６０ａ等の教師データのカテゴリの構成要素も変化する。

　特徴量４０は以上述べた輪郭線以外にも、入力データ３０（すなわち画像）から抽出できる任意の特徴量にすることができる。例えば、入力データ３０の設計図や、入力データ３０中の欠陥を特徴量４０としても良い。これに応じて、想起結果５０や６０ａ等の教師データを構成するカテゴリも変化する。前記任意の特徴量は、想起結果５０が取得可能なものであれば、各画素のカテゴリに限らない。例えば、前記任意の特徴量は、各画素の明度とすることができる。

　特徴量抽出部１は、以上述べた機械学習を用いて特徴量４０を抽出する手法以外にも、入力サンプル１０に応じて適正なパラメータが異なる画像処理であってよい。この場合、特徴抽出用の学習モデルｍ２は、前記パラメータとなる。前記画像処理は例えば、入力データ３０中の各画素において明度勾配と明度を求め、前記パラメータ中の所定の閾値と比較して、入力データ３０中の各画素を、輪郭線４１と背景４３にカテゴリ判別するものでも良い。あるいは、特徴量抽出部１は、機械学習と前記画像処理を混在させてもよい。この場合、特徴量抽出部１は、特徴抽出用学習モデル群Ｍ２中の特徴抽出用の学習モデルｍ２に応じて、機械学習と前記画像処理を切り替えても良い。

　入力データ３０は以上述べた画像以外にも、実施例１から実施例３においてはデータ間想起部３が次元圧縮を伴う想起結果を出力可能な任意のデータにすることができる。これに応じて、想起結果５０や６０ａ等の教師データを構成するカテゴリも変化する。例えば、入力データ３０を発話音声とし、特徴量４０をアルファベットとしてもよい。

　本発明の学習モデル選択は輪郭線抽出用の学習モデルの選択以外にも、特徴量から次元圧縮を伴う想起が可能な特徴量を扱う任意の機械学習を用いたシステム全般に適用できる。

１：特徴量抽出部、２：特徴抽出用学習モデル群、３：データ間想起部、４：想起用学習モデル群、５：学習モデル選択部、１０：入力サンプル

Claims

　複数の特徴抽出用の学習モデルを格納する特徴抽出用学習モデル群と、前記特徴抽出用の学習モデルと対になった想起用の学習モデルを格納する想起用学習モデル群と、前記特徴抽出用の学習モデルを参照して入力データから特徴量を抽出する特徴量抽出部と、前記想起用の学習モデルを参照して前記特徴量の次元圧縮を伴う想起結果を出力するデータ間想起部と、前記特徴量と前記想起結果の差分が最小になることを条件に特徴抽出用学習モデル群の中から前記特徴抽出用の学習モデルを選択する学習モデル選択部を備えることを特徴とする画像認識装置。
　請求項１に記載の画像認識装置であって、
　前記特徴量と前記想起結果の差分から前記入力データのサンプルをサンプリングした母集団に対して選択された前記特徴抽出用の学習モデルが適合するかを判定する学習モデル適否判定部を備えることを特徴とする画像認識装置。
　請求項２に記載の画像認識装置であって、
　前記学習モデル適否判定部が適合しないと判定した場合に、前記入力データのサンプルを用いて前記特徴抽出用の学習モデルを再選択することを特徴とする画像認識装置。
　請求項１に記載の画像認識装置であって、
　前記入力データのサンプルにおいて前記特徴量と前記想起結果の差分が多いところに入力箇所を絞った教師付けのユーザインタフェースを設ける教師データ作成支援部と、教師データ作成支援部で作成した教師データを用いて前記特徴抽出用の学習モデルを学習する学習モデル学習部を備えることを特徴とする画像認識装置。
　請求項４に記載の画像認識装置であって、
　前記教師データ作成支援部における前記ユーザインタフェースにおいて、前記入力データを下絵にして前記特徴量のカテゴリを描画し、さらに前記特徴量のカテゴリを入力できる機能を有すことを特徴とする画像認識装置。
　請求項４に記載の画像認識装置であって、
　前記教師データ作成支援部が複数の前記特徴量と前記想起結果を用いて前記入力箇所を求めるか、あるいは前記入力箇所を切り替えることの少なくとも一方を行うことを特徴とする画像認識装置。
　請求項４に記載の画像認識装置であって、
　前記学習モデル学習部がさらに前記想起用の学習モデルを学習し、前記学習モデル学習部が学習した前記特徴量の学習モデルを前記特徴抽出用学習モデル群に、前記学習モデル学習部が学習した前記想起用の学習モデルを特徴抽出用学習モデル群に追加することを特徴とする画像認識装置。
　請求項１から請求項７のいずれか１項に記載の画像認識装置であって、
　前記特徴量が前記入力データ中の要素のカテゴリであることを特徴とする画像認識装置。
　請求項１から請求項８のいずれか１項に記載の画像認識装置であって、
　前記入力データが画像であって、前記特徴量が輪郭線もしくは設計図であることを特徴とする画像認識装置。
　請求項１から請求項９のいずれか１項に記載の画像認識装置であって、
　前記次元圧縮が主成分分析あるいはオートエンコーダを用いて行われることを特徴とする画像認識装置。
　請求項１から請求項１０のいずれか１項に記載の画像認識装置であって、
　前記特徴量抽出部の中に機械学習以外の手法を用いた特徴量抽出部がひとつ以上含まれることを特徴とする画像認識装置。
　請求項１から請求項１１のいずれか１項に記載の画像認識装置であって、
　前記学習モデル選択部が前記特徴抽出用の学習モデルの選択結果、前記差分、前記特徴抽出用の学習モデルの選択の範囲のうちひとつ以上を画面表示することを特徴とする画像認識装置。
　複数の特徴抽出用の学習モデルを格納する特徴抽出用学習モデル群と、前記特徴抽出用の学習モデルを参照して入力データから特徴量を抽出する特徴量抽出部と、前記特徴量抽出部が前記特徴量を抽出するときのスコアから複数種類の学習モデル間で比較が可能な共通尺度を計算し、特徴抽出用学習モデル群の中から前記共通尺度を用いて前記特徴抽出用の学習モデルを選択する学習モデル選択部を備えることを特徴とする画像認識装置。
　請求項１３に記載の画像認識装置であって、
　前記共通尺度から選択された前記特徴抽出用の学習モデルが適合するかを判定する学習モデル適否判定部を備えることを特徴とする画像認識装置。
　請求項１４に記載の画像認識装置であって、
　前記学習モデル適否判定部が適合しないと判定した場合に、前記入力データのサンプルを用いて前記特徴抽出用の学習モデルを再選択する学習モデル再選択部を備えることを特徴とする画像認識装置。
　請求項１３に記載の画像認識装置であって、
　入力データのサンプルにおいて前記共通尺度が小さいところに入力箇所を絞った教師付けのユーザインタフェースを設ける教師データ作成支援部と、教師データ作成支援部で作成した教師データを用いて前記特徴抽出用の学習モデルを学習する学習モデル学習部を備えることを特徴とする画像認識装置。
　請求項１６に記載の画像認識装置であって、
　前記教師データ作成支援部における前記ユーザインタフェースは、前記入力データを下絵にして前記特徴量のカテゴリを描画し、前記特徴量のカテゴリを入力できる機能を有することを特徴とする画像認識装置。
　請求項１６に記載の画像認識装置であって、
　前記学習モデル学習部が学習した前記特徴量の学習モデルを特徴抽出用学習モデル群に追加することを特徴とする画像認識装置。
　請求項１３から請求項１８のいずれか１項に記載の画像認識装置であって、
　前記特徴量が前記入力データ中の要素のカテゴリであることを特徴とする画像認識装置。
　請求項１３から請求項１９のいずれか１項に記載の画像認識装置であって、
　前記入力データが画像であって、前記特徴量が輪郭線もしくは設計図であることを特徴とする画像認識装置。
　請求項１３から請求項２０のいずれか１項に記載の画像認識装置であって、
　前記共通尺度が前記スコアのばらつきの程度を表す統計量あるいは前記スコアの突出の程度を表す統計量であることを特徴とする画像認識装置。
　請求項１３から請求項２１のいずれか１項に記載の画像認識装置であって、
　記共通尺度が前記スコアから換算した正解率であることを特徴とする画像認識装置。
　請求項１３から請求項２２のいずれか１項に記載の画像認識装置であって、
　前記特徴量抽出部の中に機械学習以外の手法を用いた特徴量抽出部がひとつ以上含まれることを特徴とする画像認識装置。
　請求項１３から請求項２３のいずれか１項に記載の画像認識装置であって、
　前記学習モデル選択部が前記特徴抽出用の学習モデルの選択結果、差分、前記特徴抽出用の学習モデルの選択の範囲のうちひとつ以上を画面表示することを特徴とする画像認識装置。
　複数の特徴抽出用の学習モデルと、前記特徴抽出用の学習モデルと対になった複数の想起用の学習モデルとを備え、前記特徴抽出用の学習モデルを参照して入力データから特徴量を抽出し、前記想起用の学習モデルを参照して前記特徴量の次元圧縮を伴う想起結果を得、前記特徴量と前記想起結果の差分が最小になることを条件に特徴抽出用学習モデル群の中から前記特徴抽出用の学習モデルを選択することを特徴とする画像認識方法。
　複数の特徴抽出用の学習モデルを備え、前記特徴抽出用の学習モデルを参照して入力データから特徴量を抽出し、前記特徴量を抽出するときのスコアから複数種類の学習モデル間で比較が可能な共通尺度を計算し、複数の特徴抽出用の学習モデルの中から前記共通尺度を用いて前記特徴抽出用の学習モデルを選択することを特徴とする画像認識方法。